Исследования благополучия с помощью передовых методов обработки естественного языка (NLP): перспективы и ограничения

 
Аудио генерируется искусственным интеллектом
 23 мин. чтения

Резюме

Контекст и актуальность. Исследования благополучия столкнулись с противоречиями и ограничениями, проистекающими из ограничений метода психометрических самоотчетных шкал. Данные методы критикуются за низкую экологическую валидность, ограниченную информативность и трудности в операционализации комплексного конструкта благополучия. В то же время, стремительное развитие технологий обработки естественного языка (natural language processing, NLP) открывает новые возможности для преодоления этих ограничений. Цель. Провести обзор перспектив и ограничений применения NLP на основе архитектуры трансформеров (bidirectional encoder representations from transformers, BERT) для преодоления ограничений в исследованиях благополучия. Методы и материалы. В статье представлен аналитический обзор современных публикаций, посвященных применению NLP в исследованиях благополучия. Дано краткое описание технологий NLP на основе BERT. Особое внимание уделено сравнению информативности текстовых данных и шкал, а также вопросам методологической рефлексии. Результаты. Среди преимуществ данных методов отмечается высокое разрешение и насыщенность информации, доступной в языковых данных, более высокая экологическая валидность по сравнению со шкалами, а также экономичность ресурсов. Выделенные ограничения касаются в первую очередь методологической рефлексии новых инструментов, отстающей от стремительного развития технологии. Выводы. Применение NLP в исследованиях благополучия обладает значительным потенциалом, но требует предварительной методологической работы. Для успешной интеграции этих методов необходимо: 1) разработать собственные фреймворки оценки валидности и надежности; 2) обеспечить методологическую и эпистемологическую рефлексию применения этих методов.

Общая информация

Ключевые слова: благополучие, психологическое благополучие, позитивная психология, NLP, LLM, BERT, психометрика

Рубрика издания: Общая психология

Тип материала: обзорная статья

DOI: https://doi.org/10.17759/jmfp.2025140314

Финансирование. Публикация подготовлена в ходе проведения исследования № 24-00-046 «Доказательный подход к развитию личности: возможности и ограничения» в рамках Программы «Научный фонд Национального исследовательского университета «Высшая школа экономики» (НИУ ВШЭ)».

Поступила в редакцию 02.10.2024

Поступила после рецензирования 01.10.2025

Принята к публикации

Опубликована

Для цитаты: Воеводина, Е.Ю. (2025). Исследования благополучия с помощью передовых методов обработки естественного языка (NLP): перспективы и ограничения. Современная зарубежная психология, 14(3), 172–181. https://doi.org/10.17759/jmfp.2025140314

© Воеводина Е.Ю., 2025

Лицензия: CC BY-NC 4.0

Полный текст

Введение

Исследования благополучия, за более чем 40 лет своего существования, стали зрелой отраслью исследований (Ryff, Boylan, Kirsch, 2021a; VanderWeele, Trudel-Fitzgerald, Kubzansky, 2021). Некоторые авторы отмечают, что исследования благополучия и позитивной психологии стоят на пороге преобразования в общую трансдисциплинарную науку о благополучии (Lomas et al., 2021; Wissing, 2022). Предметом этой науки должно стать благополучие как комплексный, принципиально не сводимый к одному измерению феномен, но при этом доступный измерению с помощью спектра подходов, поддержанных и обоснованных тщательной методологической и теоретической рефлексией (Fowers et al., 2023; Lomas et al., 2021; Ryff, Boylan, Kirsch, 2021b; Wissing, 2022).
Однако, переход в новый статус объединенной науки о благополучии может быть совершен только через разрешение существующих в исследованиях благополучия концептуальных и методологических противоречий. В концептуальном и теоретическом плане были отмечены слабая структурированность концептуального поля субъективного благополучия и счастья (Леонтьев, 2020), а также внутренние противоречия конструкта качества жизни (Лебедева, Леонтьев, 2022).
На данный момент в исследованиях благополучия доминирует психометрическая парадигма измерений (Michell, 2021). В условиях психометрической парадигмы концептуальные и методические противоречия оказываются неразрывно связанными (Uher, 2021): метод предполагает концептуализацию (представление о «латентном конструкте»), а концептуализация валидизируется проверкой статистических гипотез на данных, полученных с помощью метода. Основным методом в ней являются самоотчетные шкалы в форме опросников с закрытым перечнем ответов. Шкалы получили широкое распространение и признание за эффективное снижение размерности данных, простоту применения, универсальность (например, одинаково применяемая шкала Ликерта), соотношение эффективности и экономичности, а также устоявшиеся стандарты апробации.
В то же время, описанные преимущества шкал оказываются их фундаментальным изъяном при работе с комплексным предметом исследования (Uher, 2023, p. 19). В условиях текущих конвенций, операционализовать новое представление о благополучии можно только с применением объемных анкет с множеством опросников и шкал. Размерность и разрешение информации, получаемой с помощью шкал, не позволяет создать такое психометрическое решение, которое, с одной стороны, способно операционализировать новое комплексное и теоретически обоснованное понимание благополучия (Ryff, Boylan, Kirsch, 2021a, 2021b), а с другой стороны, учесть доступные исследователям ресурсы (Alexandrova, Singh, 2022; VanderWeele, Trudel-Fitzgerald, Kubzansky, 2021). Реалии изучения благополучия в крупных панелях масштаба регионов, стран и международных исследований таковы, что исследователи могут добавить в него в лучшем случае несколько вопросов, но не целый опросник на благополучие. Также сложности с применением большого количества опросников возникают на выборках людей с ограниченными возможностями здоровья, пожилых людей, людей без навыка чтения[1]. Критические высказывания о шкалах как доминирующем и, порой, единственном способе разработки и валидации конструктов звучат и среди исследователей благополучия. Фоуверс, один из самых опытных и ключевых авторов по теме эвдемонического благополучия и процветания, отмечает чрезмерную опору на психометрическую валидацию конструктов как одно из препятствий развитию области исследований, использующих концепт процветания (eng. flourishing) (Fowers et al., 2023).
Параллельно с исследованиями благополучия стремительно развивалась отрасль обработки естественного языка (eng. natural language processing, NLP). Психологов уже призвали обратить внимание на эту технологию для исследовательских целей (Eichstaedt et al., 2021). Кроме того, психологи давно и хорошо знакомы с другими методами NLP и компьютерной лингвистики, а также тесно связаны со становлением этой дисциплины (Кузьмина, Лифшиц, Костенко 2022). Однако, предыдущие технологии не давали значимой прибавки к информативности и предсказательной силе относительно классических шкал и опросников (Sikström et al., 2023), а также обладали ограниченной способностью различать нюансы смысла слов, используемых респондентами, что критически важно для исследований благополучия и психологического здоровья (Kjell, Kjell, Schwartz, 2024). В то время как новые методы на основе трансформеров (см. ниже) некоторые авторы наделяют потенциалом не только модернизации, но даже революции в области психодиагностических и психометрических методов (Kjell, Kjell, Schwartz, 2024).
Цель данной статьи — дать краткий обзор перспектив и ограничений применения новых методов на основе передовых технологий NLP для разрешения противоречий между предметом, методом и ресурсами в исследованиях благополучия. В начале мы познакомим читателя с технологией трансформеров и LLM. Далее мы дадим обзор аргументов сторонников ее применения в исследованиях благополучия и психологического здоровья, а также успешные примеры проведенных исследований и имеющиеся готовые решения по применению этого метода. После этого мы обозначим ограничения и риски этого подхода применительно к поставленной проблеме. В заключении мы раскроем потенциал данного метода для преодоления сложившегося в исследованиях благополучия конфликта.

Краткое описание технологии трансформеров и LLM

В данной статье под NLP понимается междисциплинарное поле, которое объединяет лингвистику, компьютерные науки и технологии искусственного интеллекта (Laricheva et al., 2024, с. 1). При этом мы будем говорить только о современном состоянии этой отрасли, где с 2018 года наиболее эффективные решения включают LLM.
С 2016 года новое поколение методов создания векторных репрезентаций слов — контекстуальных векторных репрезентаций (eng. contextual vector embeddings, далее — эмбеддинги[2]) — внесло свой вклад в трансформацию NLP (Pennebaker, 2022). Существовавшие до этого методы, особенно широко распространенные подходы «top-down» с закрытыми словарями, были не способны учитывать контекстуальную динамику значений слов. Адекватная репрезентация таких лингвистических явлений, как, например, сарказм, была им недоступна (Kennedy et al., 2022, p. 7).
Современные и наиболее передовые языковые модели[3] работают на базе трансформеров (eng. transformer) — архитектуры глубоких нейронных сетей (Vaswani et al., 2017). Трансформеры представляют собой семейство предварительно обученных моделей для выполнения задач в текстовой и других модальностях (например, компьютерное зрение и звук). Они применяются для задач классификации текста, извлечения информации, генерации текста и ответов на вопросы, обобщения, перевода текста и др.. На основе этой технологии работают все популярные поисковые системы (включая Google, Яндекс, Bing). Именно эта архитектура позволяет поиску «понимать», что на запрос «первый фильм про мальчика-волшебника в круглых очках и со шрамом на лбу» надо показать сайты про «Гарри Поттер и философский камень». Скачок качества перевода сервисом Google Translate в 2016 году связан с внедрением в него архитектуры трансформеров.
Текстовые данные представлены трансформерам в виде токенов. Токены могут состоять из последовательности букв, отдельных слов (чаще всего) или словосочетаний. Трансформеры обрабатывают токены параллельно и независимо друг от друга, что позволяет им быстрее и точнее отражать значения слов. С помощью механизма «внимания» (eng. attention, self-attention) трансформеры могут избирательно придавать больший вес тем или другим частям контекста токена (слова) для определения его цифровой репрезентации — эмбеддинга.
Нейросеть на основе трансформеров состоит из двух многослойных блоков — энкодера и декодера. Энкодер извлекает информацию из входящих в него текстовых данных и преобразует ее в эмбеддинги. Эмбеддинги содержат в себе информацию о положении каждого анализируемого токена в обрабатываемом массиве текста. Таким образом, энкодер формирует семантическое пространство текста. С помощью упомянутого механизма внимания и параллельной обработки энкодер получает скрытые векторные представления для всех контекстов одновременно. Так, словосочетание «бить ключом» получит разные значения, выраженные в эмбеддингах, в контекстах «жизнь в нем бьет ключом» и «он бьет ключом по стеклу». При этом модель сохраняет «понимание» отдельных слов «бить», «ключ», «жизнь» и т. д. Успех и популярность данной технологии обусловлена в первую очередь этим обновленным механизмом контекстуальной репрезентации значений слов (Kjell, Kjell, Schwartz, 2024). Декодер использует извлеченную энкодером информацию для генерации элементов последовательности (например, для текста на другом языке или для ответа чат-бота).
В 2018 году компания Google разработала большую языковую модель BERT (eng. (Bidirectional Encoder Representations from Transformers) (Devlin et al., 2019). BERT — это одна из первых «базовых моделей» (eng. foundational models). К ним же относятся модели DALL-E, LLaMA и широко известная GPT в основе ChatGPT. В данной статье мы будем говорить о BERT, так как она и ее модификации (например, мультиязычная и русскоязычные версии) являются самыми популярными среди исследователей. BERT состоит только из энкодера. Полученные векторные представления слов обычно не интерпретируемы сами по себе. Далее их обрабатывают с помощью статистических методов или методов машинного обучения (например, многомерной линейной регрессии), чтобы получить интерпретируемые результаты. Однако, с каждым годом предлагается все больше решений для получения интерпретируемых результатов прямо, путем использования LLM (Bao, 2024; Debelak et al., 2024; Kjell, Giorgi, Schwartz, 2023).

Преимущества передовых NLP-методов в психологических исследованиях

Насыщенность информацией

Данные естественного языка предоставляют больше информации, чем шкалы. Согласно теории информации К. Шеннона (цит. по: Kjell, Kjell, Schwartz, 2024, с. 3), собственная информация (eng. self-information)[4] может быть оценена как количество разнообразия, доступное для отражения в данных. Это ключевая метрика в машинном обучении, которая показывает количество информации, доступное для обучения модели. Чем больше собственной информации, тем выше ожидаемая способность модели предсказывать целевые переменные из данного набора данных. Например, пункт опросника с ответами «да» или «нет», на который респонденты отвечают в половине случаев «да», а в половине «нет», даст больше информации, чем аналогичный пункт, на который респонденты в 90% случаев отвечают «да», потому что первый позволяет лучше дифференцировать респондентов, чем второй. В таком случае данные из ответов на пункты опросника приносят больше информации, только если респонденты отвечают на них с таким разбросом ответов, который не может быть запечатлен или не был уже запечатлен другими пунктами опросника (Kjell, Kjell, Schwartz, 2024, с. 3). То есть большее количество пунктов в опроснике не гарантирует его большую информативность. Данное свойство информации ставит под вопрос эффективность рекомендации использовать два (и более) разных опросника на один и тот же конструкт в целях повышения качества данных (VanderWeele et al., 2021).
Аналогичное свойство верно и для данных естественного языка: сами по себе они не гарантируют большую насыщенность информацией. Решающую роль играют дизайн метода получения данных (например, правильная постановка вопроса) и методы их обработки. Было показано, что текстовые ответы на открытые вопросы, обработанные вручную методами качественного анализа, не прибавляли информации и предсказательной способности к данным шкал из опросников психологического здоровья (Sikström et al., 2023). В то же время, свободные текстовые ответы респондентов (n = 100) на вопрос «Как вы себя чувствуете?» (eng. «How are you feeling?») дали в 4,8 раз больше информации, оцененной с помощью индекса разнообразия (eng. diversity index, DI)[5], чем шкалы опросника PANAS[6] (DIшкала позитивного аффекта = 43, DIшкала негативного аффекта = 34, DIобе шкалы= 77, DIтекстовые ответы = 366). Авторы заключают, что текстовые ответы прямой речью сообщают нам больше информации и дают больше возможностей дифференцировать респондентов по проявлению целевого признака, чем PANAS — самая распространенная шкала оценки эмоционального аспекта субъективного благополучия (там же).
В то же время объем текстового ответа не является обязательным условием его информативности. Текстовые ответы с лимитом в 10 описательных слов (средняя длина ответа = 9,8 слов), данные респондентами о гармонии в своей жизни, предоставили больше информации, чем аналогичные текстовые ответы без ограничений по составу и объему слов (средняя длина ответов = 69 слов) (Kjell, Kjell, Schwartz, 2024).

Диапазон, разрешение, размерность и открытость

Благоприятными свойствами языковых данных для исследования комплексных феноменов являются их широкий диапазон, размерность, высокое разрешение и открытость (Kjell, Kjell, Schwartz, 2024). Широкий диапазон позволяет фиксировать в языковых данных крайние спектры феномена, не задавая их искусственно закрытым перечнем ответом и формулировками ответов опросника. Вместе с этим внутри диапазона языковые данные предоставляют большее разрешение данных. Вместо нескольких неравномерных скачков на порядковой шкале можно рассматривать плавный градиент выраженности изучаемого феномена. При этом, степень разрешения можно варьировать в зависимости от целей и предмета исследования. Под размерностью (от eng. dimensionality) понимается большее количество измерений (векторов или плоскостей многомерного пространства), доступное в языковых данных. Предполагается, что многомерность позволяет без потери и искажения информации передать благополучие как комплексный предмет исследования, при этом используя минимум стимульного материала и собирая меньший объем данных в сравнении со шкалами. Также предполагается, что некоторые психологические феномены возможно операционализировать только в естественном языке, в силу их дискурсивной природы (Бусыгина, 2010; Boyd, Markowitz, 2024; Pennebaker, 2022). Открытость языковых данных, в противовес закрытому перечню ответов в опросниках, дает респондентам возможность творчески и персонализировано давать описания своего психологического состояния. Это снимает часть проблем кросс-культурной и социодемографической адаптации и экологической валидности. Человек сам подберет подходящие слова, например, «обожаю» и «презираю», а не «люблю» и «ненавижу», или даст такое описание своего состояния, которое разработчики опросника не могли заложить в инструмент.

Экологическая валидность

Отмечается, что языковые данные обладают высокой экологической валидностью (Kjell, Kjell, Schwartz, 2024; Sikström et al., 2024b). В отличие от опросников, собирая языковые данные, мы делаем замер на основе повседневного и естественного способа коммуникации людей — на основе речи (Kjell, Kjell, Schwartz, 2024). Утверждается, что, используя методы на основе естественного языка, мы избегаем создания квази-лабораторных условий, как при использовании шкал и опросников (Pennebaker, 2022). Респондент говорит с нами из своего жизненного мира и, следуя подходу социального конструкционизма, наиболее непосредственным образом предъявляет нам свою психологическую и личностную реальность, обладающую дискурсивной и социальной природой (Бусыгина, 2010; Выготский, 1982).
В недавнем исследовании (Sikström et al., 2023) было показано, что респонденты (n = 304) предпочитают отвечать о степени своих депрессивных симптомов свободным текстовым описанием, так как это дает им возможность ответить более точно и содержательно. Кроме того, респонденты отмечали, что имеют больше шансов быть услышанными и правильно понятыми через текстовые ответы, а не через шкалы опросников (Sikström et al., 2024b, с. 8). Кроме того отмечено, что открытые вопросы со свободным текстовым ответом могут в меньшей степени провоцировать социально желательные или «фреймированные» ответы, а также менее вероятно дают подсказки о связи вопроса и диагностируемого феномена или симптома  (Sikström et al., 2024b, p. 8). Примечательно, что полученные результаты расходятся с тем, что клиницисты (n = 40) думали о предпочтениях пациентов в плане описания симптоматики. Однако респонденты также были склонны считать, что проходить опросники быстрее и проще. Это подтверждается меньшим временем, которое они затратили на прохождение опросника PANAS (tmean = 68,6 секунд, SD = 70,2), чем на ответ на вопрос «Как вы себя чувствуете?» (tmean = 154,3 секунды, SD = 154,8).

Экономия ресурсов

Ларичева и соавторы (Laricheva et al., 2024, p. 2) отмечают, что данные методы обработки текстовых данных значительно более экономичны к ресурсам, по сравнению с качественными методами. Особенно выигрышным это является для исследований психологического здоровья и психотерапии. В этих исследованиях часто приходится иметь дело с объемными текстовым данными, такими как протоколы сессий или приемов у врача, заметки клиницистов, клиентов или пациентов. Из всех этих данных необходимо выделить и проанализировать только релевантную для исследователей информацию. Как отмечают авторы, методы на основе трансформеров уже позволяют делать это не менее валидно, чем при ручном кодировании (там же).

Доступность передовых NLP технологий для психологов исследователей

На данный момент, как передовые методы NLP, так и возможности их применения в психометрике, остаются мало известны психологам исследователям (Kjell, Kjell, Schwartz,, 2024). В предыдущие годы это могло быть обосновано компетентностным разрывом и необходимостью привлекать к исследованиям дорогостоящие услуги специалистов компьютерных наук. К 2024 году в открытом доступе представлено несколько исследовательских инструментов с использованием LLM, требующих лишь базовое владение языком программирования R (Bao, 2024; Kjell, Giorgi, Schwartz, 2023; Varadarajan et al., 2024). На основании публикационной динамики и темпа сближения NLP с психологическими и социальными науками, можно предполагать, что число готовых и доступных решений продолжит расти.

Примеры исследований благополучия с применением LLM и трансформеров

Среди сообщества исследователей благополучия и позитивной психологии уже звучал призыв обратить внимание на передовые NLP-технологии (Hou et al., 2024). Популярность этих методов растет ускоряющимся темпом, как в психологии, так и в социальных науках (Boyd, Markowitz, 2024). С 2020 года нейронные сети и технологии глубокого обучения стали самым популярным NLP-алгоритмом в исследованиях психологического и психического здоровья, по сравнению с иными методами автоматизированного анализа текстов (Laricheva et al., 2024, p. 13).
Модель на основе BERT была использован для предсказания оценок благополучия, операционализированных шкалой гармонии в жизни (Kjell et al., 2022). Была получена конвергенция оценок на основе открытых текстовых ответов и указанных шкал, достигшая верхнего теоретического предела (корреляция Пирсона r = 0,85, p  <  0,001, N = 608).
Также другое решение на основе BERT лучше предсказало оценки качества жизни по шкале HRQOL[7], физическому и ментальному компоненту опросника SF-12[8], а также средние показатели шкалы THYCA-QoL[9] на основе обработки интервью с респондентами, чем решения на основе LIWC[10] и других вариантов машинного обучения (Lian et al., 2023).
Было показано, что оценка автобиографических текстов с помощью описательных слов c помощью BERT и ML-алгоритмов (мультиноминальные логистические регрессия) дает более верные оценки выраженности в тексте респондентов депрессии, тревоги, удовлетворенности жизнью и гармонии, чем оценка такими классическими шкалами, как PHQ-9, GAD-7 и SWLS[11] (64% точность для NLP и 44% точность для шкал) (Sikström et al., 2024b). Аналогичные результаты были получены при оценке текстов, написанных людьми с диагностированной алекситимией (Sikström et al., 2024a).
В.Р. Хоббс и А.Д. Онг (Hobbs, Ong, 2023) в эмпирическом исследовании обратились к критике выводов исследований на основе опросников, связанной с искажениями вносимыми в результаты при корреляции данных, полученных одним и тем же методом — опросниками. Утверждается, что более сильные корреляции субъективного благополучия и, например, черт Большой пятерки и более слабые корреляции с объективными поведенческими и социально-экономическими данными объясняются методом, а не объективно имеющимися закономерностями. Авторы исследования проверили гипотезу, отличается ли картина при использовании текстовых ответов на открытые вопросы. На основе данных MIDUS[12] было показано, что по сравнению с открытыми текстовыми ответами, проанализированными как с помощью передовых методов NLP (модель BART, дообученная на MultiNLI датасете), так и методами качественного анализа, показатели самоотчетных шкал благополучия склонны преуменьшать корреляции с данными о здоровье, социально-экономических обстоятельствах и с поведенческими данными.

Методологические ограничения и риски методов на основе LLM и трансформеров

Ограничения и риски, отмеченные в англоязычной литературе

В англоязычной литературе в качестве основных ограничений и рисков новых методов на основе LLM выделяются сохраняющиеся искажения в сторону WEIRD выборок, отсутствие принятой методологии оценки надежности, валидности и интерпретации результатов таких моделей, а также непрозрачное устройство самих LLM и технологии трансформеров (Abdurahman et al., 2024; Laricheva et al., 2024). Ни ученые, ни инженеры языковых моделей на данный момент не понимают досконально, каким образом языковые модели выдают именно такие эмбеддинги и не могут контролировать процесс так же всеобъемлюще, как это доступно при использовании шкал. Продвижение в объяснении результатов и механизмов работы BERT и подобных моделей постепенно происходит, но преждевременно утверждать, что исследователи достигли в этом ясности, управляемости и предсказуемости на уровне психометрических шкал и опросников. Также поднята тема этических рисков, связанные с отсутствием устоявшихся правил сбора, хранения, использования и передачи текстовых данных.
Более осторожно настроенные авторы единогласно предлагают не торопиться с широким распространением LLM в исследовательской практике, а больше сосредоточиться на проработке этического, организационного и методического сопровождения этого метода. Также отмечается острая и срочная необходимость интеграции стремительно развивающихся технологий NLP с накопленным в психологических науках научным знанием, теориями и методологией (Boyd, Markowitz, 2024). На данный момент методологическая рефлексия и оформление инструмента в полноценный метод не поспевает за скоростью распространения этой технологии. Поэтому применение данных методов на текущий момент остается в области риска и эксперимента.

Дополнительно выделенные методологические ограничения и риски

Помимо выделенных в англоязычной литературе, мы дополняем перечень несколькими методологическими ограничениями, обнаруженными при изучении текущих разработок новых методов на основе NLP, а также в дискурсе исследований благополучия. Выделенные нами ограничения не являются всеохватывающими и окончательными и носят предварительный характер.
Оценка валидности нового метода только через сравнение со шкалами и опросниками
Ключевой идеей в аргументации преимуществ исследовательских инструментов на основе NLP выступает их противопоставление шкалам и опросникам. Утверждается, что новые методы должны преодолеть ограничения шкал, а также стать самодостаточным методом с качественно новыми возможностями на других методологических и эпистемологических основаниях. Однако, основным критерием валидизации данных методов в рассмотренных нами исследованиях является способность моделей предсказывать баллы по психометрическим шкалам или же выносить такие оценки, которые будут коррелировать с баллами по шкалам. Таким образом, нельзя говорить о качественном отличии результатов данного метода от результатов шкал. Необходимо продолжение методологической работы по оснащению данного инструмента собственным методическим и методологическим аппаратом, критериями валидности, надежности и интерпретации результатов. Такая работа уже начата — область взрослеет и вырабатывает во внутренних критических дискуссиях собственные фреймворки оценки надежности и валидности исследовательских моделей, а также интерпретации результатов (Debelak et al., 2024; Kjell, Giorgi, Schwartz, 2023; Riezler, Hagmann, 2024)).
Дополнительно отметим, что исследователей благополучия призывают быть внимательными и не спутать разработку метода оценки валидности метода (адекватен ли этот метод предмету исследования?) и процедуру сравнения одних цифр с другими  (Alexandrova, Singh, 2022, с. 198). При этом исследователям важно помнить о риторической и прагматической значимости чисел и данных в современной практике управленческих, социальных и политических решений (там же). К вопросу выбора данных, в сравнении с которыми будут валидизироваться новый метод и интерпретироваться его результаты необходимо подходить с максимальной ответственностью и профессионализмом.
Недостаточная эпистемологическая и методологическая рефлексия
Следующим методологическим ограничением, обнаруженным нами во всех исследованиях благополучия с применением архитектуры трансформеров, кроме одного (Bao, 2024), является почти полное отсутствие эпистемологической рефлексии. Опора на теории и модели, а также выбор самой технологии NLP носит скорее произвольный, чем обоснованный характер. Крайне редко встречается дискуссия и обоснование дизайна исследования в русле психолингвистики, когнитивной психологии, психологии развития, а также исследований благополучия. Так, в большинстве случаев исследователи без рефлексии опираются на эпистемологическую предпосылку слов как «жестких десигнаторов» (Бусыгина, 2010), ассоцианизм и эссенциализм. Благополучие, счастье, психологическое благополучие всегда представляются как некие «сущности», обнаруживаемые в самой речи или проецируемые в речи респондентом-носителем этих сущностей. Данное методологическое ограничение касается всей отрасли исследований благополучия, что было не раз отмечено в литературе (Eytan, 2024).
Невнимательность к качественной разнице «природы» текстовых данных
Ограничением, проистекающим из предыдущих, является невнимательность исследователей к «природе» данных, на которых модель обучается и которые далее подвергаются анализу. В англоязычной литературе основное внимание уделено рискам кросс-культурного и социально-экономического искажения данных. Однако, никто не обращает внимание на возможную качественную разницу данных устной и письменной речи; данных из социальных сетей и данных, полученных в разговоре с терапевтом; данных экспрессивного неструктурированного письма и ответов, полученных на структурированный перечень открытых вопросов. Все эти варианты данных рассматриваются как носители «одной и той же» информации или как отражающие одни и те же психологические процессы и феномены. Не являясь экспертами в этих областях, мы отмечаем лишь, что уже в работах Л.С. Выготского была отмечена принципиальная разница устной и письменной речи (Выготский, 1982). Необходимо привлечение специалистов из психологии мышления, когнитивных наук, психолингвистики для профессиональной рефлексии данных и теоретических ожиданий от них.
Заключение
На основании проделанного обзора перспектив, преимуществ, ограничений и рисков использования передовых технологий NLP в исследованиях благополучия, мы утверждаем, что данные технологии действительно могут поспособствовать разрешению конфликтов в данной исследовательской области. Однако, возможен и обратный сценарий развития событий. В случае, если использование передовых методов NLP станет самоцелью, подменяя ценностные ориентиры и практико-ориентированность исследований благополучия, внутренние конфликты данной отрасли могут лишь усугубиться. Вероятно, исследования благополучия уйдут на повторный круг и через несколько лет технологически выдающихся исследований с модной технологией придут к структурно и функционально аналогичному конфликту в развитии своей научной дисциплины, но уже с более технологически утонченными инструментами в распоряжении исследователей.
Важно отметить, что распространение методов на основе нейросетей и глубокого обучения не перечеркивает использование ранее зарекомендовавших себя методов (Pennebaker, 2022). Мы предлагаем относиться к данной технологии как к инструменту, с помощью которого можно достигнуть исследовательской или прикладной цели. Используемые методы должны быть адекватны цели, а также доступным ресурсам: в тех случаях, когда достаточно использовать знакомые и хорошо зарекомендовавшие себя шкалы, нет смысла обращаться к технологически комплексным решениям. При этом, в условиях чрезвычайно быстрого роста популярности данных технологий и реализации в этом процессе интересов разных сторон, необходимо особенно методологически тщательно анализировать предоставляемые решения на предмет того, действительно ли они являются методами измерения, а не технологически сложными процедурами генерации чисел, лишь в качестве маркетинга представленных как «методы измерения» (Michell, 2021).
 
[1] Если в России это не составляет проблемы, так как 99% взрослого населения умеют читать, то для других стран это одна из ключевых проблем. Например, в Афганистане только 38% взрослого населения способны читать и писать на уровне повседневных текстов (Roser & Ortiz-Ospina, 2024).
[2] Здесь и далее термины «векторная репрезентация», «эмбеддинг», «контекстуальный эмбеддинг» используются синонимично.
[3] На момент написания статьи.
[4] В данной статье используется синонимично с «информацией».
[5] Индекс разнообразия (DI) — это безразмерный показатель разнообразия или энтропии в наборе числовых значений или вероятностных событий, который равен 2энтропия, где энтропия вычисляется как энтропия Шеннона.
[6] Positive and Negative Affect Schedule.
[7] Health-Related Quality of Life.
[8] 12-item Short Form Health Survey.
[9] Thyroid Disease‐Specific Quality of Life Questionnaire.
[10] Linguistic Inquiry and Word Count.
[11] Satisfaction with Life Scale.
[12] Midlife in the United States.
 

Литература

  1. Бусыгина, Н.П. (2010). «Дискурсивный поворот» в психологических исследованиях сознания. Консультативная психология и психотерапия, 18(1), 55—82. URL: https://psyjournals.ru/en/journals/cpp/archive/2010_n1/27707 (дата обращения: 04.08.2025).
    Busygina, N.P. (2010). The «Discursive turn» in the psychological studies of consciousness. Counseling Psychology and Psychotherapy, 18(1), 55—82. (In Russ.). URL: https://psyjournals.ru/en/journals/cpp/archive/2010_n1/27707 (viewed: 04.08.2025).
  2. Выготский, Л.С. (1982). Собрание сочинений: В 6 т.: Том 2. Проблемы общей психологии: Мышление и речь (с. 5—361). М.: Педагогика.
    Vygotsky, L.S. (1982). Collected Works: In 6 vols.: Vol. 2 Problems of General Psychology: Thinking and Speech (pp. 5—361). Moscow: Pedagogika. (In Russ.).
  3. Кузьмина, А.А., Лифшиц, М.А., Костенко, В.Ю. (2022). Методы компьютерной лингвистики и обработки естественного языка: Возможности и ограничения для задач психологии личности. Современная зарубежная психология, 11(1), 104—115. https://doi.org/10.17759/jmfp.2022110110
    Kuzmina, A.A., Lifshits, M.A., Kostenko, V.Y. (2022). Methods of computational linguistics and natural language processing: Opportunities and limitations for personality psychology tasks. Journal of Modern Foreign Psychology, 11(1), 104—115. (In Russ.). https://doi.org/10.17759/jmfp.2022110110
  4. Лебедева, А.А., Леонтьев, Д.А. (2022). Современные подходы к изучению качества жизни: От объективных контекстов к субъективным. Социальная психология и общество, 13(4), 142—162. https://doi.org/10.17759/sps.2022130409
    Lebedeva, A.A., Leontiev, D.A. (2022). Contemporary approaches to the quality of life: From objective contexts to subjective ones. Social Psychology and Society, 13(4), 142—162. (In Russ.). https://doi.org/10.17759/sps.2022130409
  5. Леонтьев Д.А. (2020). Счастье и субъективное благополучие: К конструированию понятийного поля. Мониторинг общественного мнения: Экономические и социальные перемены, 1(155), 14—37. https://doi.org/10.14515/monitoring.2020.1.02
    Leontiev, D.A. (2020). Happiness and well-being: Toward the construction of the conceptual field. Monitoring of Public Opinion: Economic and Social Changes, 1(155), 14—37. (In Russ.). https://doi.org/10.14515/monitoring.2020.1.02
  6. Abdurahman, S., Atari, M., Karimi-Malekabadi, F., Xue, M.J., Trager, J., Park, P.S., Golazizian, P., Omrani, A., Dehghani, M. (2024). Perils and opportunities in using large language models in psychological research. PNAS Nexus, 3(7), Article pgae245. https://doi.org/10.1093/pnasnexus/pgae245
  7. Alexandrova, A., Singh, R. (2022). When well-being becomes a number. In: C. Newfield, A. Alexandrova, S. John (Eds.), Limits of the Numerical: The Abuses and Uses of Quantification (pp. 181—200). London: University of Chicago Press. https://doi.org/10.7208/chicago/9780226817163.001.0001
  8. Bao, H.W.S. (2024). The Fill-Mask Association Test (FMAT): Measuring propositions in natural language. Journal of Personality and Social Psychology, 127(3), 537—561. https://doi.org/10.1037/pspa0000396
  9. Boyd, R.L., Markowitz, D.M. (2024). Verbal behavior and the future of social science. American Psychologist, 80(3), 411—433. https://doi.org/10.1037/amp0001319
  10. Debelak, R., Koch, T.K., Aßenmacher, M., Stachl, C. (2024). From embeddings to explainability: A tutorial on transformer-based text analysis for social and behavioral scientist. Preprint. https://doi.org/10.31234/osf.io/bc56a
  11. Devlin, J., Chang, M.-W., Lee, K., Toutanova, K. (2019). BERT: Pre-training of deep bidirectional transformers for language understanding. In: Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, 1 (pp. 4171—4186). Minneapolis: Association for Computational Linguisticsh. ttps://doi.org/10.48550/arXiv.1810.04805
  12. Eichstaedt, J.C., Kern, M.L., Yaden, D.B., Schwartz, H.A., Giorgi, S., Park, G., Hagan, C.A., Tobolsky, V.A., Smith, L.K., Buffone, A., Iwry, J., Seligman, M.E.P., Ungar, L.H. (2021). Closed-and open-vocabulary approaches to text analysis: A review, quantitative comparison, and recommendations. Psychological Methods, 26(4), 398—427. https://doi.org/10.1037/met0000349
  13. Eytan, Y. (2024). A constructive critique of the dialectical aspect of positive psychology’s second wave. Journal of Theoretical and Philosophical Psychology, Preprint. https://doi.org/10.1037/teo0000276
  14. Fowers, B.J., Novak, L.F., Kiknadze, N.C., Calder, A.J. (2023). Questioning contemporary universalist approaches to human flourishing. Review of General Psychology, 27(2), 121—134. https://doi.org/10.1177/10892680221138230
  15. Hobbs, W.R., Ong, A.D. (2023). For living well, behaviors and circumstances matter just as much as psychological traits. Proceedings of the National Academy of Sciences, 120(12), Article e2212867120. https://doi.org/10.1073/pnas.2212867120
  16. Hou, H., Liu, I., Kong, F., Ni, S. (2024). Computational positive psychology: Advancing the science of wellbeing in the digital era. The Journal of Positive Psychology, 20(1), 1—14. https://doi.org/10.1080/17439760.2024.2362443
  17. Kennedy, B., Ashokkumar, A., Boyd, R.L., Dehghani, M. (2022). Text analysis for psychology: Methods, principles, and practices. In: M. Dehghani, R.L. Boyd (Eds.), Handbook of Language Analysis in Psychology (pp. 3—62). New York: The Guilford Press.
  18. Kjell, O., Giorgi, S., Schwartz, H.A. (2023). The text-package: An R-package for analyzing and visualizing human language using natural language processing and transformers. Psychological Methods, 28(6), 1478—1498. https://doi.org/10.1037/met0000542
  19. Kjell, O.N.E., Kjell, K., Schwartz, H.A. (2024). Beyond rating scales: With targeted evaluation, large language models are poised for psychological assessment. Psychiatry Research, 333, Article 115667. https://doi.org/10.1016/j.psychres.2023.115667
  20. Kjell, O.N.E., Sikström, S., Kjell, K., Schwartz, H.A. (2022). Natural language analyzed with Al-based transformers predict traditional subjective well-being measures approaching the theoretical upper limits in accuracy. Scientific Reports, 12, Article 3918. https://doi.org/10.1038/s41598-022-07520-w
  21. Laricheva, M., Liu, Y., Shi, E., Wu, A. (2024). Scoping review on natural language processing applications in counselling and psychotherapy. British Journal of Psychology, Preprint. https://doi.org/10.1111/bjop.12721
  22. Lian, R., Hsiao, V., Hwang, J., Ou, Y., Robbins, S.E., Connor, N.P., Macdonald, C.L., Sippel, R.S., Sethares, W.A., Schneider, D.F. (2023). Predicting health-related quality of life change using natural language processing in thyroid cancer. Intelligence-Based Medicine, 7, Article 100097. https://doi.org/10.1016/j.ibmed.2023.100097
  23. Lomas, T., Waters, L., Williams, P., Oades, L.G., Kern, M.L. (2021). Third wave positive psychology: Broadening towards complexity. The Journal of Positive Psychology, 16(5), 660—674. https://doi.org/10.1080/17439760.2020.1805501
  24. Michell, J. (2021). «The art of imposing measurement upon the mind»: Sir Francis Galton and the genesis of the psychometric paradigm. Theory & Psychology, 32(3), 375—400. https://doi.org/10.1177/09593543211017671
  25. Pennebaker, J.W. (2022). Computer based language analysis as a paradigm shift. In: M. Dehghani, R.L. Boyd (Eds.), Handbook of Language Analysis in Psychology (pp. 576—587). New York: The Guilford Press.
  26. Riezler, S., Hagmann, M. (2024). Validity, reliability, and significance: Empirical methods for NLP and data science. Cham: Springer Nature. https://doi.org/10.1007/978-3-031-57065-0
  27. Roser, M., Ortiz-Ospina, E. (2024). Literacy. Our World in Data. https://ourworldindata.org/literacy (viewed: 07.08.2025).
  28. Ryff, C.D., Boylan, J.M., Kirsch, J.A. (2021a). Advancing the science of well-being: A dissenting view on measurement recommendations. In: M.T. Lee, L.D. Kubzansky, T.J. VanderWeele (Eds.), Measuring Well-Being: Interdisciplinary Perspectives from the Social Sciences and the Humanities (pp. 521—535). New York: Oxford University Press. https://doi.org/10.1093/oso/9780197512531.003.0019
  29. Ryff, C.D., Boylan, J.M., Kirsch, J.A. (2021b). Response to response: Growing the field of well-being. In: M.T. Lee, L.D. Kubzansky, T.J. VanderWeele (Eds.), Measuring Well-Being: Interdisciplinary Perspectives from the Social Sciences and the Humanities (pp. 546—554). New York: Oxford University Press. https://doi.org/10.1093/oso/9780197512531.003.0021
  30. Sikström, S., Nicolai, M., Ahrendt, J., Nevanlinna, S., Stille, L. (2024a). Language or rating scales based classifications of emotions: Computational analysis of language and alexithymia. Npj Mental Health Research, 3, Article 37. https://doi.org/10.1038/s44184-024-00080-z
  31. Sikström, S., Pålsson Höök, A., Kjell, O. (2023). Precise language responses versus easy rating scales — Comparing respondents’ views with clinicians’ belief of the respondent’s views. Plos one, 18(2), Article e0267995. https://doi.org/10.1371/journal.pone.0267995
  32. Sikström, S., Valavičiūtė, I., Kuusela, I., Evors, N. (2024b). Question-based computational language approach outperforms rating scales in quantifying emotional states. Communications Psychology, 2(1), Article 45. https://doi.org/10.1038/s44271-024-00097-2
  33. Uher, J. (2021). Psychometrics is not measurement: Unraveling a fundamental misconception in quantitative psychology and the complex network of its underlying fallacies. Journal of Theoretical and Philosophical Psychology, 41(1), 58—84. https://doi.org/10.1037/teo0000176
  34. Uher, J. (2023). What’s wrong with rating scales? Psychology’s replication and confidence crisis cannot be solved without transparency in data generation. Social and Personality Psychology Compass, 17(5), Article e12740. https://doi.org/10.1111/spc3.12740
  35. VanderWeele, T.J., Trudel-Fitzgerald, C., Allin, P.V., Farrelly, C., Fletcher, G., Frederick, D. E., Hall, J., Helliwell, J.F., Kim, E.S., Lauinger, W.A., Lee, M.T., Lyubomirsky, S., Margolis, S., McNeely, E., Messer, N.G., Tay, L., Viswanath, K.V., Węziak-Białowolska, D., Kubzansky, L.D. (2021). Current recommendations on the selection of the measures for well-being. In: M.T. Lee, L.D. Kubzansky, T.J. VanderWeele (Eds.), Measuring well-being: Interdisciplinary perspectives from the social sciences and the humanities (pp. 501—520). New York: Oxford University Press. https://doi.org/10.1093/oso/9780197512531.003.0018
  36. VanderWeele, T.J., Trudel-Fitzgerald, C., Kubzansky, L.D. (2021). Response to «advancing the science of well-being: A dissenting view on measurement recommendations». In: M.T. Lee, L.D. Kubzansky, T.J. VanderWeele (Eds.), Measuring Well-Being: Interdisciplinary Perspectives from the Social Sciences and the Humanities (pp. 536—545). New York: Oxford University Press. https://doi.org/10.1093/oso/9780197512531.003.0020
  37. Varadarajan, V., Sikström, S., Kjell, O., Schwartz, H. (2024). ALBA: Adaptive Language-Based Assessments for Mental Health. In: Proceedings of the 2024 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (pp. 2466—2478). Mexico: Association for Computational Linguistics. https://doi.org/10.18653/v1/2024.naacl-long.136
  38. Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A.N., Kaiser, L., Polosukhin, I. (2017). Attention is all you need. In: NIPS'17: Proceedings of the 31st International Conference on Neural Information Processing Systems (pp. 6000—6010). New York: Curran Associates Inc. https://doi.org/10.48550/arXiv.1706.03762
  39. Wissing, M.P. (2022). Beyond the «third wave of positive psychology»: Challenges and opportunities for future research. Frontiers in Psychology, 12, Article 795067. https://doi.org/10.3389/fpsyg.2021.795067

Информация об авторах

Елена Юрьевна Воеводина, аспирант, младший научный сотрудник, преподаватель департамента психологии, факультет социальных наук, Национальный исследовательский университет «Высшая школа экономики» (ФГАОУ ВО «НИУ ВШЭ»), Москва, Российская Федерация, ORCID: https://orcid.org/0000-0002-3743-502X, e-mail: evoevodina@hse.ru

Вклад авторов

Воеводина Е.Ю. — идеи исследования; проведение литературного обзора, результаты и выводы, аннотирование, написание и оформление рукописи.

Конфликт интересов

Автор заявляет об отсутствии конфликта интересов.

Метрики

 Просмотров web

За все время: 173
В прошлом месяце: 70
В текущем месяце: 12

 Скачиваний PDF

За все время: 52
В прошлом месяце: 13
В текущем месяце: 4

 Всего

За все время: 225
В прошлом месяце: 83
В текущем месяце: 16