Автоматизированные системы кодирования психотерапевтического дискурса

В.В. Латынов; А.С. Власова

doi:10.17759/jmfp.2026150204

Современная зарубежная психология
2026. Том 15. № 2. С. 37–46
doi:10.17759/jmfp.2026150204
ISSN: 2304-4977 (online)

Автоматизированные системы кодирования психотерапевтического дискурса

Резюме

Контекст и актуальность. В настоящее время развитие технологий машинного обучения и обработки естественного языка позволило существенно продвинуться в плане анализа интенциональной, психологической структуры текстов. Актуальной является оценка возможностей и ограничений этих технологий при решении подобных задач. Достижения в данной научной области мы рассмотрим на примере автоматизированных систем кодирования психотерапевтического дискурса. Цель. Проанализировать современные зарубежные статьи, касающиеся разработки и применения автоматизированных систем кодирования психотерапевтического дискурса, выделить основные подходы к автоматизации кодирования, охарактеризовать спектр решаемых с помощью технологий машинного обучения задач. Гипотеза. Автоматизированные системы кодирования психотерапевтического дискурса используются для решения широкого круга исследовательских и прикладных задач. Методы и материалы. Для поиска статей использовались системы arxiv.org, APA PsycNet, frontiers, ResearchGate, ACL Anthology, Taylor & Francis online, Nature, Semantic Scholar, Science Direct, Wiley Online Library. Поиск осуществлялся по ключевым словам: «psychotherapy», «discourse», «сonversation», «behavioral coding», «deep learning», «large language models». Основное внимание уделялось публикациям за 2020—2025 гг. Результаты. В настоящее время реализуются три основных подхода к автоматизации систем кодирования психотерапевтического дискурса: традиционный (с экспертным отбором признаков для категорий дискурса), LLM-промптинг (использование больших языковых моделей посредством специальных инструкций — промптов), файнтюнинг (дообучение моделей на специализированных данных). Автоматизированные системы кодирования используются для решения широкого круга задач: изучения структуры и динамики психотерапевтического процесса; оценки квалификации; обучения и поддержки психотерапевтов; анализа влияния особенностей дискурса на психотерапевтический альянс и результат психотерапии. Выводы. Анализ публикаций показал, что современные технологии искусственного интеллекта способны на сопоставимом с человеком уровне осуществлять кодирование психотерапевтического дискурса. Это существенно расширяет возможности использования автоматизированных систем при решении исследовательских и прикладных (обучение и поддержка психотерапевтов) задач.

Общая информация

Ключевые слова: психотерапевтический дискурс, системы кодирования дискурса, большие языковые модели, машинное обучение, автоматизированные системы анализа текстов

Рубрика издания: Медицинская психология

Тип материала: обзорная статья

DOI: https://doi.org/10.17759/jmfp.2026150204

Поступила в редакцию 13.08.2025

Поступила после рецензирования 18.03.2026

Принята к публикации 20.05.2026

Опубликована 30.06.2026

Для цитаты: Латынов, В.В., Власова, А.С. (2026). Автоматизированные системы кодирования психотерапевтического дискурса. Современная зарубежная психология, 15(2), 37–46. https://doi.org/10.17759/jmfp.2026150204

Лицензия: CC BY-NC 4.0

Подкаст

Полный текст

Введение

Современные технологии машинного обучения и обработки естественного языка (NLP) позволяют решать широкий спектр задач, связанных с анализом текста (Laricheva et al., 2026; Malgaroli et al., 2023). Одним из направлений их применения является автоматическое кодирование текстов психотерапевтических сессий с помощью специальных формализованных методик — систем кодирования психотерапевтического дискурса (СКПД) (Chiu et al., 2024; Hoang, Rogers, Ross, 2024; Jiang et al., 2024; Na et al., 2025). Эти системы направлены на объективизацию структуры и содержания психотерапии посредством количественного описания паттернов речевого взаимодействия психотерапевта и клиента. С их помощью решаются самые разные задачи: оценка компетентности и обучение психотерапевтов, исследование структуры и динамики процесса психотерапии, сопоставление характеристик психотерапевтического дискурса с исходами психотерапии, сравнение различных видов психотерапии, разработка «помощников» психотерапевта.

Кодирование психотерапевтического дискурса (т. е. отнесение высказываний психотерапевта или клиента к определенным категориям) традиционно проводилось экспертами вручную. Это очень трудоемко, требует значительных временных и финансовых ресурсов, а качество кодирования сильно зависит от квалификации экспертов-кодировщиков (Gumz et al., 2015). «Ручное» кодирование существенно ограничивает возможности исследования психотерапевтического дискурса. Например, проведенный в 2019 г. метаанализ, направленный на оценку влияния речевого поведения психотерапевта на исход психотерапии, включал всего 10 работ с общим количеством участников равным 162 (Kadur, Lüdemann, Andreas, 2020).

Автоматизация кодирования, делая процесс дешевым, быстрым и воспроизводимым, может существенно расширить объем выборок. Работы последних лет подтверждают перспективность применения технологий машинного обучения и обработки естественного языка в данной области: в ряде исследований удалось добиться точности кодирования, сопоставимой с той, что достигается экспертами-людьми (Ahmadi et al., 2021; Ewbank et al., 2021; Pellemans et al. 2024). В данной статье мы, рассмотрев современные зарубежные публикации, составим представление о системах кодирования психотерапевтического дискурса; выделим основные подходы к их автоматизации; охарактеризуем спектр задач, решаемых с помощью автоматизированных системах кодирования психотерапевтического дискурса.

Материалы и методы

Для поиска литературы использовались системы arxiv.org, APA PsycNet, frontiers, ResearchGate, ACL Anthology, Taylor & Francis online, Nature, Semantic Scholar, Science Direct, Wiley Online Library. Поиск осуществлялся по ключевым словам: «psychotherapy», «discourse», «сonversation», «behavioral coding», «deep learning», «large language models». Основное внимание уделялось публикациям за 2020—2025 гг.

Результаты

Системы кодирования психотерапевтического дискурса

Системы кодирования психотерапевтического дискурса (СКПД) — это формализованные методики, предназначенные для описания и анализа вербального взаимодействия между психотерапевтом и клиентом (Alonso-Vega, Pereira, Froxán-Parga, 2022; Gumz et al., 2015; Velasco et al., 2023). С их помощью текст психотерапевтической сессии разбивается на дискретные единицы (речевые высказывания), которым присваиваются заранее определенные категории, называемые в разных системах по-разному: интенциями, речевыми актами, психотерапевтическими вмешательствами и др. Следует отметить, что, несмотря на разнообразие используемых терминов, речь идет примерно об одном и том же — о локальных целях, которые психотерапевт и клиент пытаются достичь при помощи того или иного высказывания (запрос информации, сообщение информации, запрос интерпретации и др.) (Alonso-Vega, Pereira, Froxán-Parga, 2022; Cao et al., 2019; Chiu et al., 2024; Li et al., 2023; Zainal et al., 2025).

Приведем несколько примеров категорий и соответствующих им высказываний. Так, многие системы кодирования включают такую категорию психотерапевта, как Рефлексия (Chiu et al., 2024; Li et al., 2023; Sun et al., 2024). К ней относятся высказывания, в которых психотерапевт сообщает о механизмах и закономерностях, касающихся поведения клиента и окружающих его лиц: «Моя гипотеза состоит в том, что эти убеждения могут усиливать твою тревожность в таких ситуациях»; «Я считаю, что Вы переносите Ваши отношения с мамой в детстве на Ваши отношения с ребенком». Примером категории клиента может служить Информирование, включающее высказывания клиента о событиях его жизни, реакциях на них, отношениях с другими людьми, эмоциях, представлениях, желаниях: «Я рано вышла замуж», «Я вообще тревожный человек» (Li et al., 2023).

В настоящее время насчитываются десятки систем, различающихся между собой по многим параметрам (числу категорий, их содержательному наполнению, общей структуре и др.) (Gumz et al., 2015; Velasco et al., 2023). Количество категорий в системе может сильно варьироваться: от нескольких единиц до нескольких десятков: (Mayer et al., 2024; Sun et al., 2024; Talia, Miller-Bottome, Daniel, 2017).

Некоторые из систем содержат отдельные наборы категорий для обоих участников (психотерапевта и клиента) (De Jonge, Schippers, Schaap, 2005; Rodríguez-Morejón et al., 2018). Например, Система кодирования навыков проведения мотивационного интервью (MISC, Motivational Interviewing Skills Code), используемая для анализа мотивационного интервью — метода психологического консультирования, направленного на осознание человеком необходимости перемен в своей жизни и поиск внутренней мотивации для изменения поведения, включает 22 категории психотерапевта (Одобрение, Подчеркивание контроля, Предоставление информации, Сложная рефлексия и др.) и 4 категории клиента (Готовность к изменениям, Сопротивление и др.) (De Jonge, Schippers, Schaap, 2005). Наряду с универсальными существуют и системы, ориентированные только на одного участника взаимодействия. Так, Система кодирования психотерапевтических вмешательств (PICS, Psychotherapist Interventions Coding System) предназначена для анализа высказываний психотерапевта и содержит четыре категории: Дискурсивный контракт, Улучшение психотерапевтических отношений, Стимуляторы речи клиента и Освобождение от ограничений (Herrero et al., 2019).

Следует выделять одномерные и многомерные системы. В случае одномерных каждое высказывание может быть отнесено только к одной категории (Chiu et al., 2024; Mayer et al., 2024; Sun et al., 2024). Многомерные системы предполагают более сложную процедуру кодирования: каждому высказыванию ставится в соответствие несколько наборов категорий. Например, в SICOLENTE имеется три таких набора, или три «измерения»: тип коммуникативного акта, психотерапевтическая тема, психологическое содержание (Rodríguez-Morejón et al., 2018).

Различаются системы также наличием или отсутствием иерархической структуры. Система, предложенная А. Ли с коллегами, имеет две «макрокатегории» психотерапевта: Поддержка (включает такие категории, как Переформулирование, Рефлексия чувств, Самораскрытие, Запрос субъективной информации, Запрос объективной информации, Утверждение и заверение, Минимальное поощрение, Ответ) и Вызов (состоит из категорий: Интерпретация, Конфронтация, Приглашение к исследованию нового действия, Приглашение к принятию новой перспективы) (Li et al., 2023). Иерархия категорий в системах устанавливается не всегда. Примером может служить система из работы Т. Майера с коллегами, имеющая «плоскую» структуру: каждая категория существует сама по себе, без установления между ними иерархических отношений (разделяются только «категории психотерапевта» и «категории клиента») (Mayer et al., 2024).

Разработка системы кодирования обычно включает несколько этапов (Gumz et al., 2015; Rodríguez-Morejón et al., 2018; Velasco et al., 2023). Вначале на основе теоретических концепций психотерапии или предварительного анализа речевых данных определяется предварительный набор категорий. Затем составляется детальная (включающая определение каждой категории и примеры относящихся к ней высказываний) инструкция, на основании которой эксперты-кодировщики проходят обучение. После этого они размечают (т. е. ставят в соответствие каждому высказыванию определенную категорию) тексты психотерапевтических сеансов. Качество разметки (согласованность кодировок экспертов) оценивается с помощью специальных статистик (коэффициента Каппа, процента совпадений, коэффициента внутриклассовой корреляции и т. д.). Чем выше значения статистик, тем более надежной считается система.

Помимо надежности системы в отдельных случаях проводится оценка ее валидности. Например, при разработке SICOLENTE были выдвинуты 24 гипотезы о связях тех или иных категорий с особенностями психотерапевтического дискурса, и 19 из них подтвердились эмпирически (Rodríguez-Morejón et al., 2018). Отметим, что проверка валидности проводится разработчиками систем кодирования далеко не всегда, поскольку считается, что основной и наиболее важной их характеристикой является надежность (Gumz et al., 2015; Velasco et al., 2023).

Автоматизация систем кодирования психотерапевтического дискурса

Развитие технологий машинного обучения и обработки естественного языка открывает широкие возможности для автоматической разметки речи психотерапевтов и клиентов. Не вдаваясь в тонкости компьютерной лингвистики, можно выделить три основных подхода к автоматизации кодирования психотерапевтического дискурса: традиционный (машинные алгоритмы обучаются на заранее подготовленных признаках категорий, выделенных экспертами), LLM-промптинг (использование больших языковых моделей посредством специальных инструкций — промптов) и файнтюнинг (дообучение моделей на специализированных данных) (Ahmadi et al., 2021; Cohen et al., 2024; Pellemans et al., 2024; Sun et al., 2024).

Традиционный подход основан на классических алгоритмах машинного обучения (SVM, логистическая регрессия, Random Forest, бустинг и др.) (Hasan et al., 2019; Tanana et al. 2016; Welivita, Pu, 2023). При его использовании сначала собирают размеченную выборку (высказывания с проставленными для них категориями) и определяют признаки, применяемые для различения категорий: n-граммы, синтаксические зависимости, тематические и семантические признаки, частотные словари, психологические лексиконы (например, LIWC) и т. д. Так, М. Пеллеманс с коллегами выделили 5850 признаков (темы, грамматика, сентимент и т. д.), характеризующих каждое сообщение (Pellemans et al., 2024). На следующем этапе обучают выбранный алгоритм на отдельной подвыборке, а на валидационной и тестовой подвыборках проверяют качество его работы.

Затем сравнивают результаты разметки одних и тех же текстов автоматическими алгоритмами и людьми-экспертами. Для оценки качества работы (согласованности оценок) алгоритмов используют стандартные метрики классификации, такие, например, как точность, полнота, F1, коэффициент Каппа. Автоматизированные при помощи традиционного подхода СКПД в состоянии с достаточной точностью выявлять категории в текстах психотерапии (Tanana et al. 2016; Welivita, Pu, 2023). Так, в исследовании М. Эвбанка с коллегами была достигнута соответствующая человеку точность кодирования для трех из пяти категорий клиента (Ewbank et al., 2021).

Преимуществом традиционного подхода к автоматизации систем кодирования является относительная легкость воспроизводства на небольших объемах данных. Он хорошо работает при умеренном количестве категорий и наличии хорошо подобранных признаков. К его недостаткам относят необходимость ручного отбора признаков и слабую способность к обобщению неординарных формулировок высказываний или редко встречающихся категорий. Кроме того, если категорий очень много, точность работы алгоритмов снижается, а обучение усложняется.

Активное развитие больших языковых моделей (LLM), наличие у них способности решать широкий круг задач, связанных с языком и текстом, обусловило их применение для автоматизации СКПД. Одним из вариантов использования этих моделей является так называемый LLM-промптинг (Chiu et al., 2024; Han et al., 2024; Sun et al., 2024). В отличие от традиционного подхода в случае LLM-промптинга, большие языковые модели (GPT, Claude, Llama и др.) используются без обучения: задачу обнаружения категорий в тексте перед ними ставят посредством специальной инструкции (промпта). В запросе к модели указывают определение категорий и несколько примеров соответствующих им речевых высказываний, а также контекст (например, текст предыдущих и последующих реплик) и просят проставить для каждого высказывания подходящую категорию. Точность обнаружения категорий в значительной степени зависит от качества и полноты инструкции (Chiu et al., 2024; Dauphin, Siefert, 2025).

Преимуществом подхода на основе LLM-промптинга является отсутствие локального обучения и необходимости задействования больших вычислительных ресурсов — все задачи выполняются через API «в облаке». Большие языковые модели уже содержат богатую языковую информацию, что облегчает понимание тонких нюансов психотерапевтического дискурса. Зависимость от качества инструкции является одним из недостатков LLM-промптинга: небольшая перестановка слов в ней может сильно изменить качество работы модели. Кроме того, модели могут «галлюцинировать» (давать безосновательные ошибочные ответы) и плохо обнаруживать редкие, специфические категории, для которых имеется мало примеров утверждений.

Другим вариантом автоматизации систем кодирования является подход на основе файнтюнинга (Aghakhani et al., 2025; Li et al., 2023; Pellemans et al., 2024). При использовании файнтюнинга модели (RNN, BERT, GPT, Llama и др.) проходят дообучение на размеченных данных психотерапевтического дискурса и сами находят в текстах разнообразные признаки, на основании которых выявляют категории (в этом отличие файнтюнинга от традиционного подхода, при котором признаки категорий задает человек). Файнтюнинг требует значительного объема размеченных текстовых данных: чем больше примеров кодированных высказываний получает модель, тем выше качество ее работы (точность обнаружения категорий). Файнтюнинг, как правило, обеспечивает высокую точность кодирования (Pellemans et al., 2024; Saiyed et al., 2022).

Независимо от реализуемого подхода при автоматизации систем кодирования необходимо достигать баланса между количеством категорий и желаемой точностью их выявления: меньшее число крупных, обобщенных категорий легче автоматически выявлять по сравнению с множеством детализированных. Также важно, чтобы при разметке выборки достигалась высокая согласованность оценок экспертов, поскольку обучение машинных алгоритмов на данных со слабой согласованностью приводит к низкой точности их работы (Tanana et al. 2016).

Как правило, обнаруживаются различия (порой весьма существенные) в точности автоматического выявления категорий (Cao et al., 2019; Chiu et al., 2024; Flemotomos et al., 2022). Например, в работе Ц. Сао с коллегами точность прогноза для категорий клиента по системе MISC составила по метрике F1 от 0,23 (Сопротивление) до 0,85 (Нейтральные/формальные высказывания) (Cao et al., 2019). Кросс-культурные исследования показали, что существуют некоторые универсальные закономерности в данном отношении. Так, вне зависимости от языка (английский, испанский, голландский, современный иврит), такая категория психотерапевта, как Вопросы, предсказывалась автоматизированными СКПД легче, чем категория Рефлексия (Gunal et al., 2025; Mayer et al., 2024; Sun et al., 2024). Различия в точности выявления категорий во многом связаны с объективными различиями в трудности обнаружения категорий экспертами-людьми: чем сложнее решать эту задачу человеку, тем хуже справляются с ней и автоматизированные системы (Meyer, Elsweiler, 2022; Tanana et al. 2016).

Применение алгоритмов машинного обучения для кодирования психотерапевтического дискурса открывает новые перспективы в его изучении, но на точность их работы влияет множество факторов: мощность и версия модели, особенности промптов, размер и состав базы текстовых данных, количество, обобщенность и сложность категорий.

Задачи, решаемые с помощью автоматизированных СКПД

Автоматизированные СКПД находят применение как в научных исследованиях психотерапии, так и при решении прикладных задач. Наиболее часто с их помощью осуществляется изучение структуры и динамики психотерапевтического процесса (Han et al., 2024; Li et al., 2023; Peretz et al., 2023). Последовательный анализ закодированных речевых высказываний позволяет выявлять паттерны взаимодействия психотерапевта и клиента и оценивать их изменения с течением времени, что способствует лучшему пониманию механизмов психотерапевтической работы.

Например, Т. Майер с коллегами анализировали взаимосвязи психотерапевтических вмешательств и эмоциональных откликов клиента внутри сессии. Выяснилось, что использование психотерапевтом таких категорий, как Конфронтация, Уточнение и Поддержка, приводило к более высокому уровню немедленного эмоционального отклика у клиента по сравнению с использованием таких категорий, как Вопросы, Самораскрытие и Предоставление информации. Наибольший эмоциональный отклик клиента вызывали конфронтационные вмешательства, направленные на эмоциональные переживания клиента и его защитные механизмы (Mayer et al., 2024).

В. Хоанг, Е. Роджерс, Р. Росс, изучая структуру психотерапевтических диалогов, обнаружили различные варианты сочетания реплик психотерапевта и клиента (Hoang, Rogers, Ross, 2024). Так, если клиент был настроен на сохранение проблемного поведения, то в речи психотерапевта часто фиксировалась категория «Рефлексия», если же клиент демонстрировал желание изменить подобное поведение, то психотерапевт чаще спрашивал и давал рекомендации.

В. Нгуен с коллегами показали, что контроль клиента над направлением диалога, как правило, усиливался по мере развития их отношений (Nguyen et al., 2024). Оказалось также, что ощущение контроля было связано с отношением к психотерапии в целом: клиенты, которые в меньшей степени контролировали ситуацию в первые несколько сеансов, значительно чаще в конечном итоге выражали недовольство своим психотерапевтом и прекращали психотерапию. С. Чжан с коллегами анализировали вариативность использования психотерапевтом трех категорий высказываний (Эмпатии, Рефлексии, Открытых вопросов) (Zhang et al., 2023). Были выявлены существенные различия в использовании этих категорий у разных психотерапевтов, а также по отношению к разным клиентам для одного психотерапевта. Наибольшая вариативность отмечалась для категории «Эмпатия».

Автоматизированные СКПД все чаще используются для оценки квалификации и обучения психотерапевтов (Flemotomos et al., 2022; Imel et al., 2019; Zainal et al., 2025). Анализ кодированных сессий позволяет объективно оценивать соблюдение обучающимися психотерапевтических методов и стандартов. При использовании автоматического кодирования для оценки навыков психотерапевта нет необходимости в привлечении дополнительной информации о квалификации психотерапевта: при таком подходе сам текст сессий оказывается достаточным.

Автоматизация оценки профессиональных компетенций позволяет психотерапевтам быстро получать обратную связь об их работе (Hsu et al., 2025). По мнению большинства специалистов, полученные таким образом оценки уровня навыков полностью или частично совпадают с их собственными представлениями, а также являются удобными для использования на практике (Imel et al., 2019). В работе М. Пеллеманса с коллегами автоматизированная СКПД точно различала конгруэнтное и неконгруэнтное поведение психотерапевта, использование им положительных подкреплений, а также верно классифицировала высказывания клиента, касающиеся его отношения к собственному проблемному поведению (Pellemans et al., 2024). Авторы статьи считают, что полученные данные могут быть использованы для организации обратной связи для психотерапевта в части оценки степени его приверженности принципам мотивационного интервью, способствуя тем самым ускорению процесса выработки профессиональных навыков.

Н. Флемотомос с коллегами разработали систему, которая позволяла выгружать аудиозапись психотерапевтической сессии и кодировать ее на уровне отдельных высказываний и сессии в целом, тем самым давая психотерапевту обратную связь о его навыках проведения мотивационного интервью (Flemotomos et al., 2022). Подобные автоматизированные «наблюдатели» могут отслеживать качество психотерапии, давая обратную связь и направляя как опытных, так и начинающих специалистов.

Новым направлением применения автоматизированных СКПД является анализ поведения ИИ-психотерапевтов, созданных на основе больших языковых моделей, и его сравнение с поведением психотерапевтов-людей (Chiu et al., 2024; Gabriel et al., 2024; Mahmood et al., 2025; Nguyen et al., 2025). Примером может служить исследование Ю. Чиу с коллегами, в котором автоматическое кодирование текстов сессий «искусственных» и реальных (опытных и неопытных) психотерапевтов позволило оценить сильные и слабые стороны использования искусственного интеллекта в роли психотерапевта (Chiu et al., 2024). Оказалось, что ИИ-психотерапевт нередко вел себя как неопытный психотерапевт. В частности, он давал клиенту чрезмерно много готовых решений его проблем, обнаруживал высокие показатели нормализации чувств и психообразования, редко спрашивал об опыте клиента и его эмоциях. Особенности динамики сеансов психотерапии и степень адаптируемости ИИ-психотерапевта к поведению клиентов также больше соответствовали поведению психотерапевта с низким уровнем развития психотерапевтических навыков. Авторы приходят к выводу о том, что, несмотря на способность ИИ-психотерапевтов в ряде случаев реагировать как опытные психотерапевты (использование рефлексивного слушания, помогающего клиентам глубже понять свои чувства и переживания и улучшающего психотерапевтические отношения между психотерапевтом и клиентом за счет усиления эмпатии), в целом их поведение еще не в полной мере соответствует стандартам оказания высококачественной медицинской помощи.

Интересно отметить, что, по данным другого исследования, дизайн которого не подразумевал использование СКПД, эксперты-психотерапевты не смогли отличить сессии, проводимые искусственным интеллектом, от сессий традиционных психотерапевтов: точность распознавания составила лишь 53,9%, что соответствовало величине случайного угадывания (Kuhail et al., 2025). Более того, сессии ИИ-психотерапевтов оценивались как более качественные. Возможно, что различие результатов этих работ связано с тем, что М. Кухайл с коллегами использовали для экспертной оценки квалификации ИИ-психотерапевтов ограниченное количество вопросов, большинство из которых затрагивало именно те навыки, что в исследовании Ю. Чиу с соавторами были отмечены как сильные стороны ИИ-психотерапевтов (Chiu et al., 2024; Kuhail et al., 2025).

С помощью автоматизированных СКПД проводится анализ влияния особенностей психотерапевтического дискурса на психотерапевтический альянс и результат психотерапии. Путем обнаружения взаимосвязей определенных категорий с тем или иным критерием успешности психотерапии (улучшением симптоматики, удовлетворенностью клиента и др.) выявляют, какие особенности вербального взаимодействия связаны с успехом психотерапии (Bar et al., 2026). В работе М. Бар с коллегами конгруэнтность высказываний психотерапевта и клиента оказалась предиктором успешности психотерапии (в качестве критерия выступало уменьшение депрессивной симптоматики) (Bar et al., 2021). Использование автоматического анализа категорий психотерапевта способствовало повышению точности прогнозирования эффектов психотерапевтических сессией (Lee, Goldwasser, Schwab Reese, 2024). Автоматический анализ эмоций на уровне высказываний клиента позволил предсказывать его самооценку эмоционального состояния после каждой сессии (Mayer et al., 2024).

М. Эвбанк с коллегами исследовали, какие техники когнитивно-поведенческой психотерапии являются эффективными при лечении генерализованного тревожного расстройства (Ewbank et al., 2020). Оказалось, что частота таких категорий, как составление плана сеанса, проверка домашнего задания, коррекция мышления и поведения, обсуждение прогресса психотерапии, планирование будущего и похвала, оказались положительно связаны с уменьшением негативной симптоматики клиента; а приветствие, прощание, простраивание переходов в речи, оценка риска, психотерапевтическая эмпатия и несвязанный с психотерапией контент — отрицательно. Было обнаружено, что одни и те же категории имели разный характер (как положительный, так и отрицательный) связи с различными критериями эффективности психотерапии (уменьшением симптоматики и вовлеченностью (настроем на продолжение психотерапии) клиента).

Заключение

Современные технологии искусственного интеллекта способны на сопоставимом с человеком уровне осуществлять кодирование психотерапевтического дискурса. Это существенно расширяет возможности использования автоматизированных систем при решении исследовательских и прикладных задач. Выбор подхода к автоматизации СКПД зависит от задачи и доступных ресурсов. Если есть обширный размеченный корпус текстов, то лучше всего обращаться к файнтюнингу, который обеспечивает наибольшую точность при наличии больших массивов данных, однако платит за это высокими требованиями к ресурсам и риском переобучения. Возможно также использование в данном случае и традиционного подхода, относительно простого в реализации и дающего хорошо интерпретируемые результаты, но имеющего ограничения в плане ручной подготовки признаков. Если же размеченных данных мало или необходимы быстрые результаты, имеет смысл применять LLM-промптинг (особенно с экспертно разработанными запросами-инструкциями).

Автоматизированные СКПД используются для решения широкого круга задач: изучения структуры и динамики психотерапевтического процесса, оценки квалификации, обучения и поддержки психотерапевтов, анализа влияния особенностей дискурса на психотерапевтический альянс и результат психотерапии. Они находят применение при создании «помощников психотерапевта», в реальном времени кодирующих высказывания психотерапевта и клиента, прогнозирующих оптимальную реакцию психотерапевта и предупреждающих его о важных сигналах в речи клиента. Эти системы являются полезным инструментом психотерапевтических исследований и практики, обеспечивающим систематичность и объективность анализа речевой составляющей психотерапии. Автоматизированные СКПД позволяют сконцентрироваться на конкретных элементах взаимодействия психотерапевта и клиента, сравнивать различные сессии и подходы, а также подкреплять качественные наблюдения количественными данными, повышая надежность выводов о том, какие речевые паттерны связаны с эффективностью психотерапии и ростом компетентности специалистов.

Несмотря на впечатляющий прогресс в области разработки автоматизированных СКПД, перед исследователями стоит ряд задач, требующих специального внимания. Прежде всего речь идет о повышение точности выявления отдельных категорий (например, негативного оценивания) психотерапевтического дискурса. Перспективным в данном отношении представляется выход за рамки анализа только вербального содержания речи и использование данных о ее просодических характеристиках (тоне голоса, интонациях и др.). Кроме того, оправданным выглядит и углубленное изучение проблемы «галлюцинаций» больших языковых моделей, которые могут приписывать высказываниям несуществующие интенции, что негативно сказывается на точности кодирования. Актуальной также является проблема обобщаемости моделей: результаты, полученные в рамках одного терапевтического подхода или культурного контекста, могут показывать низкую эффективность в других условиях. В этой связи необходимы специальные кросс-культурные исследования, направленные на оценку универсальности структуры категорий СКПД и выявленных с их помощью закономерностей функционирования психотерапевтического дискурса.

Литература

Aghakhani, E., Wang, L., Washington, K.T., Demiris, G., Huh-Yoo, J., Rezapour, R. (2025). From conversation to automation: Leveraging LLMs for problem-solving therapy analysis. In: Findings of the Association for Computational Linguistics: ACL 2025 (pp. 25189—25207). Kerrville: Association for Computational Linguistics. https://doi.org/10.18653/v1/2025.findings-acl.1292
Ahmadi, A., Noetel, M., Schellekens, M., Parker, P., Antczak, D., Beauchamp, M., Dicke, Th., Diezmann, C., Maeder, A., Ntoumanis, N., Yeung, A., Lonsdale, C. (2021). A systematic review of machine learning for assessment and feedback of treatment fidelity. Psychosocial Intervention, 30(3), 139—153. https://doi.org/10.5093/pi2021a4
Alonso-Vega, J., Pereira, G.-L., Froxán-Parga, M.X. (2022). Functional coding system for verbal interaction in clinical contexts. arXiv, Preprint ytpq5_v1. https://doi.org/10.31234/osf.io/ytpq5
Bar, M., Saad, A., Slonim-Atzil, D., Tuval-Mashiach, R., Gour, T., Baron, N., Mendlovic, S. (2021). Patient—therapist congruent exchanges engaged with the potential-to-experience is associated with better outcome of psychotherapy. Psychology and Psychotherapy: Theory, Research and Practice, 94(S2), 304—320. https://doi.org/10.1111/papt.12274
Bar, M., Saad, A., Weiss, N., Mendlovic, S. (2026). Maintaining relevance in psychodynamic psychotherapy: A novel approach to discerning between effective vs. ineffective discourse correlated with better session outcomes. Psychotherapy Research, 36(1), 177—191. https://doi.org/10.1080/10503307.2025.2455466
Cao, J., Tanana, M., Imel, Z.E., Poitras, E., Atkins, D.C., Srikumar, V. (2019). Observing dialogue in therapy: Categorizing and forecasting behavioral codes. In: Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics (pp. 5599—5611). Kerrville: Association for Computational Linguistics. https://doi.org/10.18653/v1/P19-1563
Chiu, Y.Y., Sharma, A., Lin, I.W., Althoff, T. (2024). A computational framework for behavioral assessment of LLM therapists. arXiv, Preprint arXiv:2401.00820. https://doi.org/10.48550/arXiv.2401.00820
Cohen, B., Zisquit, M., Yosef, S., Friedman, D., Bar, K. (2024). Motivational interviewing transcripts annotated with global scores. In: Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024) (pp. 11642—11657). Torino: ELRA and ICCL. URL: https://aclanthology.org/2024.lrec-main.1017 (viewed: 22.05.2025).
Dauphin, B., Siefert, C. (2025). From Llama to language: Prompt engineering allows general purpose artificial intelligence to rate narratives like expert psychologists. Frontiers in Artificial Intelligence, 8, Article 1398885. https://doi.org/10.3389/frai.2025.1398885
De Jonge, J.M., Schippers, G.M., Schaap, C.P.D.R. (2005). The motivational interviewing skill code: Reliability and a critical appraisal. Behavioural and Cognitive Psychotherapy, 33(3), 285—298. https://doi.org/10.1017/S1352465804001948
Ewbank, M.P., Cummins, R., Tablan, V., Bateup, S., Catarino, A., Martin, A.J., Blackwell, A.D. (2020). Quantifying the association between psychotherapy content and clinical outcomes using deep learning. JAMA psychiatry, 77(1), 35—43. https://doi.org/10.1001/jamapsychiatry.2019.2664
Ewbank, M.P., Cummins, R., Tablan, V., Catarino, A., Buchholz, S., Blackwell, A.D. (2021). Understanding the relationship between patient language and outcomes in internet-enabled cognitive behavioural therapy: A deep learning approach to automatic coding of session transcripts. Psychotherapy Research, 31(3), 300—312. https://doi.org/10.1080/10503307.2020.1788740
Flemotomos, N., Martinez, V.R., Chen, Z., Singla, K., Ardulov, V., Peri, R., Caperton, D.D., Gibson, J., Tanana, M.J., Georgiou, P., Van Epps, J., Lord, S.P., Hirsch, T., Imel, Z.E., Atkins, D.C., Narayanan, S. (2022). Automated evaluation of psychotherapy skills using speech and language technologies. Behavior Research Methods, 54(2), 690—711. https://doi.org/10.3758/s13428-021-01623-4
Gabriel, S., Puri, I., Xu, X., Malgaroli, M., Ghassemi, M. (2024). Can Al relate: Testing large language model response for mental health support. In: Findings of the Association for Computational Linguistics: EMNLP 2024 (pp. 2206—2221). Kerrville: Association for Computational Linguistics. https://doi.org/10.18653/v1/2024.findings-emnlp.120
Gumz, A., Treese, B., Marx, C., Strauss, B., Wendt, H. (2015). Measuring verbal psychotherapeutic techniques — a systematic review of intervention characteristics and measures. Frontiers in Psychology, 6, Article 1705. https://doi.org/10.3389/fpsyg.2015.01705
Gunal, A., Yi, B., Piette, J., Mihalcea, R., Pérez-Rosas, V. (2025). Examining Spanish counseling with MIDAS: A motivational interviewing dataset in Spanish. In: Proceedings of the 2025 Conference of the Nations of the Americas Chapter of the Association for Computational Linguistics: Human Language Technologies (pp. 866—872). Kerrville: Association for Computational Linguistics. https://doi.org/10.18653/v1/2025.naacl-short.73
Han, G., Liu, W., Huang, X., Borsari, B. (2024). Chain of interaction: Enhancing large language models for psychiatric behavior understanding by dyadic contexts. In: 2024 IEEE 12th International Conference on Healthcare Informatics (ICHI) (pp. 392—401). Piscataway: IEEE. https://doi.org/10.1109/ICHI61247.2024.00057
Hasan, M., Carcone, A.I., Naar, S., Eggly, S., Alexander, G.L., Hartlieb, K.E.B., Kotov, A. (2019). Identifying effective motivational interviewing communication sequences using automated pattern analysis. Journal of healthcare informatics research, 3, 86—106. https://doi.org/10.1007/s41666-018-0037-6
Herrero, O., Aulet, A., Alves, D., Rosa, C., Botella, L. (2019). Psychotherapist Interventions Coding System (PICS): A systematic analysis of rhetoric mechanisms in psychotherapy. Narrative Inquiry, 29(1), 157—184. https://doi.org/10.1075/ni.18035.her
Hoang, E., Rogers, E., Ross, R. (2024). How can client motivational language inform psychotherapy agents? In: Proceedings of the 9th Workshop on Computational Linguistics and Clinical Psychology (pp. 23—40). Kerrville: Association for Computational Linguistics. https://doi.org/10.18653/v1/2024.clpsych-1.3
Hsu, S.L., Shah, R.S., Senthil, P., Ashktorab, Z., Dugan, C., Geyer, W., Yang, D. (2025). Helping the helper: Supporting peer counselors via ai-empowered practice and feedback. In: Proceedings of the ACM on Human-Computer Interaction, 9(2), (pp. 1—45). New York: Association for Computing Machinery. https://doi.org/10.1145/3710993
Imel, Z.E., Pace, B.T., Soma, C.S., Tanana, M., Hirsch, T., Gibson, J., Georgiou, P., Narayanan, S.S., Atkins, D.C. (2019). Design feasibility of an automated, machine-learning based feedback system for motivational interviewing. Psychotherapy, 56(2), 318—328. https://doi.org/10.1037/pst0000221
Jiang, M., Zhao, Q., Li, J., Wang, F., He, T., Cheng, X., Yang, B.X., Ho, G.W.K., Fu, G. (2024). A generic review of integrating artificial intelligence in cognitive behavioral therapy. arXiv, Preprint arXiv:2407.19422. https://doi.org/10.48550/arXiv.2407.19422
Kadur, J., Lüdemann, J., Andreas, S. (2020). Effects of the therapist's statements on the patient's outcome and the therapeutic alliance: A systematic review. Clinical Psychology & Psychotherapy, 27(2), 168—178. https://doi.org/10.1002/cpp.2416
Kuhail, M.A., Alturki, N., Thomas, J., Alkhalifa, A.K., Alshardan, A. (2025). Human-human vs human-al therapy: An empirical study. International Journal of Human-Computer Interaction, 41(11), 6841—6852. https://doi.org/10.1080/10447318.2024.2385001
Laricheva, M., Liu, Y., Shi, E., Wu, A. (2026). Scoping review on natural language processing applications in counselling and psychotherapy. British Journal of Psychology, 117(2), 677—701. https://doi.org/10.1111/bjop.12721
Lee, D., Goldwasser, D., Schwab Reese, L. (2024). Towards understanding counseling conversations: Domain knowledge and large language models. In: Findings of the Association for Computational Linguistics: EACL 2024 (pp. 2032—2047). Kerrville: Association for Computational Linguistics. https://doi.org/10.18653/v1/2024.findings-eacl.137
Li, A., Ma, L., Mei, Y., He, H., Zhang, S., Qiu, H., Lan, Z. (2023). Understanding Client Reactions in Online Mental Health Counseling. In: Proceedings of the 61st Annual Meeting of the Association for Computational Linguistics (pp. 10358—10376). Kerrville: Association for Computational Linguistics. https://doi.org/10.18653/v1/2023.acl-long.577
Mahmood, Z., Ali, S., Zhu, J., Abdelwahab, M., Collins, M.Y., Chen, S., Zhao, Y.C., Wolff, J., Melamed, O.C., Minian, N., Maslej, M., Cooper, C., Ratto, M., Selby, P., Rose, J. (2025). A Fully Generative Motivational Interviewing Counsellor Chatbot for Moving Smokers Towards the Decision to Quit. In: Findings of the Association for Computational Linguistics: ACL 2025 (pp. 25008—25043). Kerrville: Association for Computational Linguistics. https://doi.org/10.18653/v1/2025.findings-acl.1283
Malgaroli, M., Hull, T.D., Zech, J.M., Althoff, T. (2023). Natural language processing for mental health interventions: A systematic review and research framework. Translational Psychiatry, 13(1), Article 309. https://doi.org/10.1038/s41398-023-02592-2
Mayer, T., Warikoo, N., Eliassaf, A., Atzil-Slonim, D., Gurevych, I. (2024). Predicting client emotions and therapist interventions in psychotherapy dialogues. In: Proceedings of the 18th Conference of the European Chapter of the Association for Computational Linguistics (pp. 1463—1477). Kerrville: Association for Computational Linguistics. https://doi.org/10.18653/v1/2024.eacl-long.88
Meyer, S., Elsweiler, D. (2022). GLoHBCD: A naturalistic German dataset for language of health behaviour change on online support forums. In: Proceedings of the Thirteenth Language Resources and Evaluation Conference (pp. 2226—2235). Paris: European Language Resources Association. URL: https://aclanthology.org/2022.lrec-1.239/ (viewed: 22.05.2026).
Na, H., Hua, Y., Wang, Z., Shen, T., Yu, B., Wang, L., Torous, J., Chen, L. (2025). A survey of large language models in psychotherapy: Current landscape and future directions. In: Findings of the Association for Computational Linguistics: ACL 2025 (pp. 7362—7376). Kerrville: Association for Computational Linguistics. https://doi.org/10.18653/v1/2025.findings-acl.385
Nguyen, V., Jung, S.M., Lee, L., Hull, T.D., Danescu-Niculescu-Mizil, C. (2024). Taking a turn for the better: Conversation redirection throughout the course of mental-health therapy. In: Findings of the Association for Computational Linguistics: EMNLP 2024 (pp. 9507—9521). Kerrville: Association for Computational Linguistics. https://doi.org/10.18653/v1/2024.findings-emnlp.555
Nguyen, V.C., Taher, M., Hong, D., Possobom, V.K., Gopalakrishnan, V.T., Raj, E., Li, Z., Soled, H.J., Birnbaum, M.L., Kumar, S., De Choudhury, M. (2025). Do large language models align with core mental health counseling competencies? In: Findings of the Association for Computational Linguistics: NAACL 2025 (pp. 7503—7526). Kerrville: Association for Computational Linguistics. https://doi.org/10.18653/v1/2025.findings-naacl.418
Pellemans, M., Salmi, S., Mérelle, S., Janssen, W., van der Mei, R. (2024). Automated behavioral coding to enhance the effectiveness of motivational interviewing in a chat-based suicide prevention helpline: Secondary analysis of a clinical trial. Journal of medical internet research, 26, Article e53562. https://doi.org/10.2196/53562
Peretz, G., Taylor, C.B., Ruzek, J.I., Jefroykin, S., Sadeh-Sharvit, S. (2023). Machine learning model to predict assignment of therapy homework in behavioral treatments: Algorithm development and validation. JMIR Formative Research, 7, Article e45156. https://doi.org/10.2196/45156
Rodríguez-Morejón, A., Zamanillo, A., Iglesias, G., Moreno-Gámez, A., Navas-Campaña, D., Moreno-Peral, P., Rodríguez-Arias, J.L. (2018). Development of the therapeutic language coding system (SICOLENTE): Reliability and construct validity. Plos One, 13(12), Article e0209751. https://doi.org/10.1371/journal.pone.0209751
Saiyed, A., Layton, J., Borsari, B., Cheng, J., Kanzaveli, T., Tsvetovat, M., Satterfield, J. (2022). Technology-assisted motivational interviewing: Developing a scalable framework for promoting engagement with tobacco cessation using NLP and machine learning. Procedia Computer Science, 206, 121—131. https://doi.org/10.1016/j.procs.2022.09.091
Sun, X., Pei, J., de Wit, J., Aliannejadi, M., Krahmer, E., Dobber, J.T., Bosch, J.A. (2024). Eliciting motivational interviewing skill codes in psychotherapy with LLMs: A bilingual dataset and analytical study. In: Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (pp. 5609—5621). Paris: ELRA and ICCL. URL: https://aclanthology.org/2024.lrec-main.498/ (viewed: 22.05.2026).
Talia, A., Miller-Bottome, M., Daniel, S.I.F. (2017). Assessing attachment in psychotherapy: Validation of the Patient Attachment Coding System (PACS). Clinical Psychology & Psychotherapy, 24(1), 149—161. https://doi.org/10.1002/cpp.1990
Tanana, M., Hallgren, K.A., Imel, Z.E., Atkins, D.C., Srikumar, V. (2016). A comparison of natural language processing methods for automated coding of motivational interviewing. Journal of Substance Abuse Treatment, 65, 43—50. https://doi.org/10.1016/j.jsat.2016.01.006
Velasco, E.R., Pedersen, H.S., Laursen, D.H., Skinner, T. (2023). A meta-narrative review of coding tools for healthcare interactions and their applicability to written communication. PEC Innovation, 3, Article 100211. https://doi.org/10.1016/j.pecinn.2023.100211
Welivita, A., Pu, P. (2023). Boosting distress support dialogue responses with motivational interviewing strategy. In: Findings of the Association for Computational Linguistics: ACL 2023 (pp. 5411—5432). Kerrville: Association for Computational Linguistics. https://doi.org/10.18653/v1/2023.findings-acl.334
Zainal, N.H., Eckhardt, R., Rackoff, G.N., Fitzsimmons-Craft, E.E., Rojas-Ashe, E., Taylor, C.B., Funk, C., Eisenberg, B., Wilfley, D., Newman, M.G. (2025). Capitalizing on natural language processing (NLP) to automate the evaluation of coach implementation fidelity in guided digital cognitive-behavioral therapy (GdCBT). Psychological Medicine, 55, Article e106. https://doi.org/10.1017/S0033291725000340
Zhang, X., Tanana, M., Weitzman, L., Narayanan, S., Atkins, D., Imel, Z. (2023). You never know what you are going to get: Large-scale assessment of therapists' supportive counseling skill use. Psychotherapy, 60(2), 149—158. https://doi.org/10.1037/pst0000460

Информация об авторах

Владислав Викторович Латынов, кандидат психологических наук, ведущий научный сотрудник, лаборатория технологий искусственного интеллекта в психологии, лаборатория психологии речи и психолингвистики, Институт психологии Российской академии наук (ФГБОУ ИП РАН), Москва, Российская Федерация, ORCID: https://orcid.org/0000-0002-9584-2950, e-mail: latynovvv@ipran.ru

Арина Сергеевна Власова, младший научный сотрудник, лаборатория технологий искусственного интеллекта в психологии, Институт психологии Российской академии наук (ФГБОУ ИП РАН), студентка, кафедра общей психологии, Московский государственный универститет имени М.В. Ломоносова (ФГБОУ ВО «МГУ имени М.В. Ломоносова»), Москва, Российская Федерация, ORCID: https://orcid.org/0009-0007-5523-8592, e-mail: arina.vlasova@student.msu.ru

Конфликт интересов

Автор заявляет об отсутствии конфликта интересов.

Декларация об этике

Исследование представляет собой теоретический анализ и не требует этического согласования.

Метрики

Просмотров web

За все время: 3
В прошлом месяце: 0
В текущем месяце: 3

Скачиваний PDF

За все время: 1
В прошлом месяце: 0
В текущем месяце: 1

Всего

За все время: 4
В прошлом месяце: 0
В текущем месяце: 4

PlumX

Метрики публикации