Введение
Вряд ли можно спорить с тем, что биологическая роль движений чрезвычайно велика, а информация о движении имеет для выживания видов решающее значение. По тому, как двигается человек, можно определить его пол, возраст, род занятий, социальное положение и многое другое [Gibson, 1979; Gibson, 1966]. Чтобы приспособиться к среде, необходимо уметь выделять и дифференцировать разнообразные виды моторной активности, нередко при низкой освещенности, различного рода окклюзиях, маскировке и изменении ориентации в пространстве. Это касается и распознавания эмоций — состояний людей, определяемых по выражениям лица. Длительное время данная тематика разрабатывалась на материале статических изображений человека: фотографий, портретов, рисунков и схем, а основное внимание уделялось содержательной стороне социальной перцепции, связанной с пространственными характеристиками эмоциональных экспрессий. К восприятию выражений подвижного, или «живого», лица, его изменениям в реальном времени обратились сравнительно недавно. В отличие от статичных изображений, видимые изменения мимики, перемещений глаз, движения губ и челюстей при артикуляции, наклоны головы и др. как бы оживляют неподвижные картины, наделяя их анимическими качествами. Предметом восприятия становятся не столько пространственная организация мгновенных срезов лица, сколько структура их отношений: возникновение, развитие, переходы в иную модальность. Выражения лица описываются в терминах действия — активности человека как целого, которая конституирует межличностную ситуацию и регулирует потоки субъект-субъектного взаимодействия.
Интерес к динамике выражений лица инициировали пионерские работы по распознаванию биологического движения [Johansson, 1973; Johansson, 1980], показавшие, что кинематические паттерны, сопровождающие естественное поведение, способны в отсутствие структурированных поверхностей нести уникальную информацию о содержании воспринимаемого объекта. В частности, в темноте движение 10—12 светящихся точек, установленных на основных сочленениях тела натурщика, вызывает впечатление локомоций человека, позволяет определить их тип (прогулка, бег, прыжки) и гендерную стилистику. При остановке движения впечатление исчезает, а с его началом — проявляется через 100 мс [Cutting, 1977; Runeson, 1983]. Использование метода световых точек при изучении восприятия мимики показало, что во время их движения наблюдатели точно определяют модальность экспрессии невидимого натурщика, но идентифицировать неподвижный набор точек в качестве лица, переживающего эмоции, не в состоянии [Bassili, 1978]. При перемещении световых точек существует высокая вероятность идентифицировать личность известных наблюдателю людей и определить их пол [Bruce, 1988]. Особую роль изменений лица в восприятии состояний и характеристик личности подтвердили и когнитивные исследования [Bruce, 1998; Ekman, 2005; Russell, 1997]. В ходе этих и подобных работ была продемонстрирована самостоятельная роль динамики в восприятии лицевых экспрессий и поставлена проблема соотношения различных модусов лица — статики и динамики — при категоризации его выражений.
На сегодняшний день динамический аспект восприятия эмоциональных проявлений превращается в одно из перспективных течений, охватывающее не только общую, но и социальную психологию, психофизиологию, нейронауки, а также смежные с ними области знаний. Ведущиеся исследования сориентированы на достижение высокого уровня экологической и социальной валидности, системный поиск закономерностей категоризации экспрессий в естественных ситуациях, дифференциацию и углубление представлений о природе невербальной коммуникации, расширение методической базы исследований межличностного восприятия.
Целью статьи является обзор современных исследований восприятия подвижного («живого») лица, его экспрессий и других особенностей, которые опосредуют межличностную коммуникацию. Необходимость подобной работы вызвана значительным ростом экспериментально-психологических исследований восприятия лица в динамике, произошедшим в последнее время. Актуальными становятся систематизация накапливающихся эмпирических данных и определение наиболее перспективных направлений научно-исследовательской деятельности.
Аналитический обзор проводится по четырем взаимосвязанным направлениям, охватывающим значительное число исследований восприятия меняющегося лица: 1) статика и динамика лица в распознавании эмоциональных выражений, 2) специфика восприятия экспрессий подвижного лица, 3) мультимодальная интеграция эмоциональных проявлений, 4) порождение и восприятие экспрессий лица в процессах общения. Их совокупность позволяет представить многомерную картину современного состояния проблемы. Уделяя особое внимание различиям в оценках динамики по сравнению со статикой, попытаемся очертить круг закономерностей восприятия «живого» лица, дальнейшая разработка которых представляется перспективной.
Статика и динамика лица в распознавании экспрессий
Согласно выполненным исследованиям, восприятие подвижного лица по сравнению с фотографиями или схемами имеет ряд существенных отличий. Общая тенденция состоит в том, что эмоция в динамике распознается более эффективно, чем в статике [Alves, 2013; Krumhuber, 2013; Xiao, 2016]. Эффект динамики возникает у новорожденных младенцев [Addabbo, 2018] и сохраняется в течение всей жизни, усиливаясь в пожилом возрасте [Grainger, 2017; Richoz A.-R, 2018]. Данное преимущество выражено тем больше, чем более затруднены условия восприятия. Это отчетливо проявляется при слабой выраженности эмоции [Bould, 2008а; Calvo, 2016]; сверхкоротких экспозициях [Barabanschikov, 2015]; расфокусированно- сти лица [Barabanschikov, 2015а]; его схематизации [Cunningham, 2009а]; исключении информации о текстуре и контуре [Wallraven, 2008]. Так, по сравнению с неподвижным изображением динамическая экспозиция лица с низким пространственным разрешением, а также анимационные и контурные изображения ведут к более точным оценкам эмоций; различия наиболее заметны при использовании метода световых точек [Cunningham, 2009]. С потерей информации о текстуре или строении лица точность оценок компьютерно сгенерированных статических экспрессий резко снижается, тогда как при значительной потере информации и «смазывании» изображений динамических экспрессий адекватность ответов сохраняется [Wallraven, 2008]. Понижая уровень детализации (количество опорных точек) либо уменьшая размер изображений анимированных экспрессий, можно добиться большего эффекта динамики по сравнению со статикой, независимо от наличия текстуры [Cunningham, 2009; Cunningham, 2009а]. Подобное явление имеет место и в условиях кажущегося (стробоскопического) движения. В частности, со снижением четкости изображения лица относительная точность категоризации микроэкспрессий возрастает [Barabanschikov, 2015а; Barabanschikov, 2018]. Преимущество динамики подтверждается результатами нейровизуализации: по сравнению с фотоизображениями динамические экспрессии лица увеличивают активацию в зонах мозга, связанных с социальным познанием и анализом эмоций [Fox, 2009; Pitcher, 2011; Sato, 2019].
С усилением экологической валидности условий восприятия, в том числе при экспозиции естественных изображений лица, эффект движения уменьшается либо не проявляется вовсе [Cunningham, 2009; Fiorentini, 2012; Fiorentini, 2011; Kätsyri, 2008], а в условиях ограниченного времени ответа точность распознавания статичных экспрессий может возрастать [Jiang, 2014]. Демонстрация динамических последовательностей, полученных путем покадрового компьютерного морфинга пар видеофрагментов «нейтральное лицо — сильно выраженная экспрессия», систематических различий в категоризации статических либо динамических переходных экспрессий не обнаруживает [Fiorentini, 2011]. Уменьшение угловых размеров видеоизображений экспрессий до 2° также не приводит к значимым различиям [Cunningham, 2004]. При сопоставлении результатов распознавания базовых динамических экспрессий лица актера и его компьютерной реконструкции высокой степени детализации и реалистичности имеют место сходные уровни точности идентификации [Cunningham, 2004; Wallraven, 2008]. Однако при сравнении оценок динамических экспрессий, выраженных натурщиком, и компьютерной анимации более низкого качества, которая не полностью передает детали реального лица и затрудняет распознавание статических экспрессий, динамика обеспечивает более высокую эффективность [Kätsyri, 2008].
Таким образом, статика и динамика выражения лица не столько противостоят, сколько взаимодополняют друг друга, а их роль в восприятии эмоций зависит от конкретных условий экспозиции. Чем выше качество требуемой информации о воспринимаемой эмоции, тем менее заметно влияние подвижной составляющей и выше значение статичного «среза» выражения лица. Верно и обратное: при невозможности извлечь необходимую диагностическую информацию исключительно из статичного изображения ее поиск осуществляется с опорой на динамику экспрессии. Выявленная закономерность объясняет обратную зависимость эффективности восприятия динамических экспрессий от их интенсивности: влияние сильных эмоций менее заметно, чем влияние слабых [Bould, 2008а].
Специфика восприятия экспрессий подвижного лица
В отличие от статики распознавание динамических экспрессий опирается на более широкую информационную основу, обусловленную временной организацией выражения лица. Это открывает возможность наблюдать развитие эмоций «здесь и сейчас», в ходе межличностной коммуникации. Источником динамической информации выступает процесс порождения и развития экспрессий и его характеристики: длительность и плавность изменений, их направление, траектория, темп, интенсивность; гетерохронность проявления диагностических признаков и фазность выражения лица в целом. Необходимым условием адекватного восприятия динамических экспрессий являются событийные сценарии — функциональные образования опыта, отражающие в обобщенной форме типичные способы переживания и реализации эмоциональных состояний [Nelson, 1986].
Самое наличие плавного последовательного движения предоставляет информацию, функционально отличную от набора либо суммирования статических изображений [Ambadar, 2005]. Более эффективному распознаванию экспрессии содействует увеличение кадров динамически меняющихся последовательностей изображений между нейтральным проявлением лица и ярко выраженной эмоцией [Bould, 2008]. Важнейшую роль в подобной ситуации играет направление изменений выражения лица [Ambadar, 2005]. Если кадры динамической экспрессии демонстрируются в произвольном или реверсивном порядке, нарушая привычную последовательность, точность оценок значительно снижается [Cunningham, 2009а]. От траектории, или характера изменений выражения лица, зависит соответствие воспринимаемой экспрессии действительному состоянию коммуниканта. Например, компьютерная анимация, при которой изменения лица происходят по кратчайшей прямой, приводит к замедленному и менее точному распознаванию эмоций, а также к более низким оценкам интенсивности, искренности и типичности по сравнению с действительным развертыванием экспрессии [Cosker, 2010; Wallraven, 2008]. В силу нелинейности и асинхронии активности мимических мышц при переживании эмоции [Krumhuber, 2016], естественные динамические экспрессии и переходы между ними воспринимаются иначе, чем искусственные динамические последовательности, созданные путем линейного морфинга [Korolkova, 2018а], и приводят к различиям в волновой активности головного мозга [Perdikis, 2017]. Точность категоризации снижается при инверсии естественных видеофрагментов во времени [Korolkova, 2018а; Reinl, 2015]. При увеличении или снижении скорости движения лица наблюдатели по-разному оценивают модальность и естественность выражения [Bould, 2008а; Hill, 2005; Sato, 2004]. Оптимальная эффективность распознавания экспрессии каждой модальности достигается при определенной скорости изменений лица [Kamachi, 2001; Recio, 2013].
Влияние динамики не только затрагивает точность распознавания эмоций и впечатления об их качестве, но и привносит дополнительное содержание [Biele, 2006; Cunningham, 2009; Weyers, 2006]. Например, последнее изображение экспрессии в динамическом ряду воспринимается как проявление более сильной эмоции, чем это имеет место в действительности. По мере возрастания скорости изменения лица переоценка интенсивности эмоции возрастает [Sato, 2007]. В зависимости от того, какая экспрессия предшествовала экспозиции нейтрального лица в динамическом переходе, его восприятие может существенно меняться [Jellema, 2011; Marian, 2013; Yoshikawa, 2008]. Так или иначе, динамика лицевых изменений включается в регуляцию восприятия эмоций сторонним наблюдателем. За пределами экологически валидного диапазона скоростей и способов движения лица воспринимаемые экспрессии теряют плавность и выглядят навязанными, искусственными. Например, в условиях «прямоугольной» стробоскопической экспозиции смена изображений динамических экспрессий вызывает впечатление резкого движения, оформляющегося в лицевые жесты (повороты головы, приближение либо удаление лица, его покачивания из стороны в сторону и др.). Складывается особая ситуация, в которой адекватность оценок кажущегося изменения по сравнению со статикой не возрастает, а снижается. Но даже в этих случаях с падением качества изображений лица относительная точность опознания микроэкспрессий увеличивается [Barabanschikov, 2017; Barabanschikov, 2018].
Наблюдатели способны тонко дифференцировать информацию о подлинности экспрессии — о том, что в действительности должно происходить при реальном переживании. Оказалось, что на начальных стадиях возникновения улыбки меньшая продолжительность и менее упорядоченные лицевые акты говорят скорее о вежливости, чем о веселье, а также о меньшей искренности и непосредственности [Ambadar, 2009; Hess, 1994; Krumhuber, 2005]. Зарегистрировано влияние стадий развертывания экспрессий на оценку личности натурщика [Krumhuber, 2006]. Например, в ответ на улыбку с большей продолжительностью начальной фазы наблюдатель чаще принимает решение о сотрудничестве, устанавливается более позитивный контакт с воспринимающим [Bugental, 1986; Krumhuber, 2009; Krumhuber, 2007]. В зависимости от содержания и логики развития коммуникативной ситуации источники динамической информации по-разному используются как по отдельности, так и в различных сочетаниях друг с другом, образующих динамические паттерны выражений лица.
В отличие от статических изображений признаки эмоций, условия их проявления, интеграции и реализации в рамках «живого» лица получают дополнительный функционал. Так, благодаря временной развертке наряду с размером, формой, межзрачковым расстоянием и цветом глаз, значимыми становятся направленность взора (окуломоторная активность) коммуниканта и его оценка наблюдателем. В зависимости от ориентации лица, его геометрических особенностей, а также распределений яркости одна и та же конфигурация области глаз оценивается по-разному и оказывает разное влияние на восприятие эмоций [Adams, 2003; Bindemann, 2008; Langton, 2011]. Особую роль начинает играть зрительный контакт — обмен взглядами, благодаря которому открывается уникальный информационный канал, связывающий участников общения и позволяющий каждому из них как бы непосредственно проникать во внутренний мир партнера. Не просто взаимное рассматривание (фиксации) области глаз, а стоящие за ним интерес и внимание друг к другу оказываются необходимыми условиями социального взаимодействия и личностной поддержки [Argyle, 1976; Binetti, 2015; Kleinke, 1986]. Включаясь в выражение эмоций, взгляд регулирует процесс коммуникации, обеспечивает обратную связь, участвует в формировании межличностных отношений. Неслучайно в реальной жизненной ситуации глаза коммуникантов фиксируются значительно чаще, чем голова, туловище, одежда или предметы интерьера [Birmingham, 2007]; при распознавании лица его верхняя часть оказывается наиболее информативной [Yuschenkova, 2010] и требует наименьшего времени экспозиции [Barabanschikov, 2012].
Выстраивание зрительного поведения расширяет функционал и других динамических признаков эмоций, особенно в области бровей и рта, которые инициируют и контролируют взаимное внимание и реализуют когнитивно-комммуникативные функции участников. Во время разговора движения губ, языка, нижней челюсти, проглядывания зубов обеспечивают предпосылки адекватного восприятия речи партнера [Bruce, 1998; McGurk, 1976], но одновременно трансформируют эмоциональные экспрессии. Совокупная динамика лица и его элементов образует внутренний контекст восприятия эмоций, при исключении которого остановленное изображение (отдельный кадр) выглядит очень многозначным и чаще описывается в терминах не состояний, а действий [Fernandez-Dols, 1997; Moskowitz, 2005].
Динамика внимания и перемещение взора по поверхности лица натурщика обеспечиваются окуломоторной активностью наблюдателя. При распознавании эмоций свыше двух третей зрительных фиксаций распределяется в зонах глаз, рта и носа. Их соотношение зависит от содержания решаемой задачи, модальности, полноты и выраженности экспрессий, опыта наблюдателя и его индивидуально-психологических особенностей. Особый интерес наблюдателя к состоянию глаз и рта натурщика находит отражение в паттернах (маршрутах) фиксаций, которые носят циклический характер [Barabanschikov, 2012; Yarbus, 1967].
В диадических ситуациях (беседы, интервью и др.) эмоциональные экспрессии слабой либо средней интенсивности проявляются в течение короткого времени (от нескольких десятков миллисекунд до 3—5 секунд), вызывая небольшие (угловые минуты) отклонения лица и расположения его элементов. Для оперативного распознавания эмоций наблюдателю достаточно одной—двух зрительных фиксаций (300—600 мс); в ходе выполнения саккад (30—60 мс) этот процесс не прерывается [Barabanschikov, 2019]. Указанные значения сближают условия восприятия статики и динамики лица. При категоризации динамических экспрессий распределение и продолжительность фиксаций сходны с теми, которые регистрируются на фотоизображениях: область глаз и бровей является наиболее информативной зоной для распознавания экспрессий гнева и печали; область рта — для радости; средняя часть лица (нос/щеки) — для отвращения; области глаз/бровей и рта — для страха и удивления [Calvo, 2018]. С сокращением времени экспозиции динамических экспрессий возникает тенденция преимущественной фиксации взора в центральной части лица [Blais, 2017].
Анализ окуломоторной активности наблюдателя во время рассматривания фото и видеоизображений лица, переживающего эмоцию, обнаруживает ряд различий. В ходе живого общения «лицом к лицу» внимание прежде всего приковано к области глаз собеседника, смещаясь на область рта при восприятии его речи [Hessels, 2020; Hessels, 2017]. При экспозиции видеофрагментов наибольшее время рассматривания связано с зоной глаз, значительно возрастает вклад повторных фиксаций одной и той же зоны интереса, увеличивается средняя продолжительность и скорость плавного компонента динамических фиксаций, расширяется вариативность маршрутов движений глаз, но уменьшается амплитуда саккад. Полученные данные указывают на более емкий арсенал средств поиска, приема и обработки информации о состоянии партнера, заключенном в динамических паттернах выражений лица [Barabanschikov, 2017а].
Перцептогенез восприятия статических и коротких динамических экспрессий совершается в три этапа: сначала порождается образ эмоции в целом, который уточняется, ретушируется и вписывается в более широкий жизненный контекст. На ранних стадиях проявления эмоции воспринимаются в наиболее общей форме — лица как такового. Экспрессия выделяется на последующих стадиях: сначала как спокойное состояние натурщика, затем — как эмоция той или иной модальности. На более поздних стадиях информационная основа выражения лица достраивается либо перестраивается. Смена стадий восприятия и его темп зависят от модальности и последовательности переживаемых эмоций, а траектория содержательного развития далека от прямолинейной. В то время как экспрессии радости и печали могут быть распознаны уже на ранних стадиях, для различения страха и удивления, а также отвращения и гнева необходима большая продолжительность экспозиции динамического лица [Jack, 2014]. Нисходящая ветвь перцептогенеза совершается в направлении все более обобщенного и менее дифференцированного восприятия эмоций, завершаясь впечатлением спокойного выражения либо обобщенного лица (эффект перцептивной редукции) [Barabanschikov, 2016; Barabanschikov, 2016а]. Описанная динамика сохраняется в условиях, затрудняющих процесс категоризации, в частности, при изменениях эгоцентрической ориентации лица [Barabanschikov, 2010] или экспозиции экспрессий на фоне шума [Barabanschikov, 2007]. В отличие от восприятия статики, перцептогенез подвижного выражения лица наряду с собственной логикой подчиняется временной структуре актуализируемой экспрессии, более пролонгирован и объемен, предполагает взаимодействие с другими проявлениями эмоционального состояния и переходы от одной модальности к другой. На начальной стадии перцептогенеза идентификация лица и выраженное в нем эмоциональное состояние образуют единое целое; сепарация траекторий и связанная с ней константность восприятия различных сторон межличностного восприятия происходят на последующих стадиях [Calder, 2011; Levy, 2008].
Структура категориальных оценок динамических переходных экспрессий более дифференцирована, чем структура искусственных изображений-морфов. В частности, в переход между гневом и страхом включаются впечатления отвращения и удивления, a переход между печалью и отвращением может не иметь четко выраженной границы. Взаимосвязи между категориями базовых эмоций более сложны и устойчивы. Возрастает влияние избирательной адаптации к контексту, который еще бо.льше дифференцирует структуру категориального поля [Barabanschikov, 2016а; Korolkova, 2014; Schiano, 2004]. При восприятии видеофрагментов переходных экспрессий наблюдатели преимущественно категоризуют выражения лица в соответствии с той эмоцией, по направлению к которой совершается переход, однако при этом учитывается и исходная эмоция натурщика[81 ].
При экспозиции динамических экспрессий отмечаются сильные и частые непроизвольные изменения лица наблюдателя, имитирующие демонстрируемые эмоции — эмоциональная мимикрия [Sato, 2008; Sato, 2007а; Weyers, 2006]. Наблюдателям, которым запрещалось имитировать видимые переживания, требовалось больше времени, чтобы определить момент смены модальности экспрессий на противоположную (например, в паре «радость—грусть»), по сравнению с ситуацией, когда имитация разрешалась [Niedenthal, 2001]. При блокировке подражаний подлинность экспрессий и искренность улыбок по их динамическим качествам не определяются [Maringer, 2011]. Уподобление выражения лица наблюдателя выражению лица коммуниканта является одним из механизмов, связывающих функциональные состояния коммуникантов во время прямого зрительного контакта (глаза в глаза). При восприятии статичного выражения лица эмоциональная мимикрия проявляется не столь явно [Barabanschikov, 2016].
Описанные результаты приводят к убеждению, что динамика экспрессий лица несет уникальную информацию не только о модальности и интенсивности эмоции партнера по общению, но и об отношении натурщика к переживаемому содержанию и способам его выражения (метакогнитивный план). Ключевые особенности, наблюдаемые при восприятии лица в динамике, связаны как с характеристиками самого движения (скорость, плавность, последовательность и нелинейность развертывания экспрессии во времени, соответствующие возможностям мимических мышц), так и с особенностями перцептивной системы наблюдателя (эффекты «инерции», приводящие к переоценке интенсивности динамической эмоции). В отличие от статики, динамика выражения лица непосредственно вк.лючена в регуляцию поведения наблюдателя и организацию его восприятия. Открывается возможность визуального поведения участников общения, прямого проникновения во внутренний план каждого из коммуникантов, их понимания друг другом, безмолвный обмен информацией. Благодаря динамике, диагностические признаки эмоций приобретают дополнительные значения и функции; складывается внутренний контекст выражения и восприятия эмоций. Формируется многомерный динамический контекст восприятия коммуниканта. Динамические выражения лица воспринимаются с разных позиций и многократно перестраиваются. Описанные закономерности говорят о высокой чувствительности перцептивной системы к мельчайшим проявлениям естественной динамики эмоциональных выражений лица.
Мультимодальная интеграция эмоциональных проявлений
В повседневной жизни лицо человека редко воспринимается изолированно. Мы судим о состоянии коммуникантов, основываясь не только на выражении их лица, но и на других невербальных признаках переживаемых эмоций: направлении взора, интонации голоса, позе, походке, положении тела, жестах. Когда различные модальности дополняют друг друга, «считывание» эмоций происходит более эффективно, а при рассогласовании эмоциональных сигналов поведение человека воспринимается как неестественное, неискреннее.
В отличие от исследований восприятия экспрессий лица и просодической (интонационной) информации в голосе человека по отдельности, интеграция мультимодальных проявлений эмоций стала предметом изучения сравнительно недавно [Campanella, 2007]. Основываясь на соотношении экспонируемых экспрессий и структуре стимульной ситуации, получаемые в исследованиях эффекты мультимодальной интеграции можно разделить на следующие основные группы.
При одновременной экспозиции конгруэнтных (согласованных по эмоциональному содержанию) экспрессий проявляется эффект кроссмодальной фасилитации. В частности, при категоризации конгруэнтных аудиовизуальных стимулов — комбинаций лица и голоса, выражающих одну и ту же эмоцию — время ответа снижается, а точность возрастает, по сравнению с унимодальными лицами либо голосами [Gelder, 2000; Massaro, 1996]. Эффекты фасилитации наиболее заметны, когда суждение об эмоции на основании одной модальности затруднено — например, в случаях слабо выраженной экспрессии [Dolan, 2001] или высокого уровня шума в одной из модальностей [Collignon, 2008]. В оптимальных условиях экспозиции эффекты фасилитации нивелируются и точность категоризации аудиовизуальных стимулов не отличается от унимодальных [Kokinous, 2015].
При экспозиции амбивалентных (переходных) экспрессий в одной из модальностей наблюдается эффект перцептивного сдвига: одновременная экспозиция базовой экспрессии в другой модальности смещает границу между эмоциональными категориями. В частности, оценки экспрессий в голосе, переходных между базовыми эмоциями радости и печали, сдвигаются в направлении базовой эмоции на изображении лица [Gelder, 1998], а переходные между страхом и радостью экспрессии лица в присутствии речи, произнесенной с интонацией страха, воспринимаются как более негативные по сравнению с унимодально предъявленными лицами [Ethofer, 2006]. Экспрессии лица или голоса, переходные между радостью и страхом, воспринимаются как более радостные, если поза тела также выражает радость [Stock, 2007]. Наконец, позы, амбивалентные между гневом и радостью, воспринимаются как более сходные с эмоцией гнева, выраженной в голосе [Watson, 2019].
При одновременной экспозиции неконгруэнтных по эмоциональному содержанию экспрессий разных модальностей одна из них может получить преимущество при распознавании. Так, в оптимальных условиях экспозиции неконгруэнтных аудиовизуальных стимулов наблюдается доминирование эмоции, выраженной на лице [Collignon, 2008; Takagi, 2015], однако если экспрессия в зрительной модальности зашумлена, суждения наблюдателей могут в большей степени основываться на экспрессии в голосе. Данный феномен сохраняется, даже если инструкция предполагает направленность внимания только на одну из модальностей [Collignon, 2008]. Вместе с тем доминирование той или иной модальности может зависеть от категории эмоции [Paulmann, 2011] и по- разному проявляться в зависимости от особенностей культуры: известно, что при категоризации неконгруэнтных аудиовизуальных экспрессий с инструкцией обращать внимание только на одну из модальностей японские участники, по сравнению с голландскими, демонстрируют большее влияние эмоции в голосе на оценки экспрессии лица и меньшее влияние эмоции на лице на оценки тона голоса [Tanaka, 2010]. На японской выборке также было показано, что при категоризации неконгруэнтных аудиовизуальных стимулов доминирует экспрессия лица, если оно выражает радость, удивление или отвращение, а в случае страха наблюдается менее выраженный эффект доминантности экспрессии голоса; для гнева и печали преимущество какой-либо из модальностей не выявлено [Takagi, 2015]. Инструкция направлять внимание только на одну из модальностей не меняла паттерн ответов, за исключением экспрессии гнева, где проявилась доминантность лица при инструкции игнорировать экспрессию голоса.
По сравнению с унимодальными или конгруэнтными мультимодальными эмоциями, при экспозиции неконгруэнтных снижается эффективность и точность их оценки (эффект конгруэнтности). Если эмоция, выраженная в позе, неконгруэнтна экспрессии лица, последняя оценивается менее точно [Meeren, 2005]. Эффект конгруэнтности зависит от степени перцептивного сходства между категориями эмоций: чем ближе две категории находятся в перцептивном пространстве эмоций, тем сильнее экспрессия тела влияет на категоризацию выражения лица. Например, лицо, выражающее отвращение, будет в большинстве случаев оцениваться как гнев, если поза тела при этом выражает гнев, но если поза выражает страх или печаль — категории эмоций, менее сходные с отвращением, — она будет меньше влиять на оценки лица [Aviezer, 2011; Aviezer, 2008].
При последовательном предъявлении изображений лица и звуков голоса могут наблюдаться как эффекты кроссмодальной фасилитации, так и эффекты кроссмодальной адаптации. Предположительно, возникновение того или иного феномена связано с перекалибровкой перцептивного образа и уменьшением рассогласованности между модальностями [Baart, 2018]. Так, в случаях однозначной принадлежности адаптора к определенной эмоциональной категории проявляется кроссмодальная адаптация, или восприятие амбивалентного эмоционального тест-объекта по контрасту с предварительно экспонируемым адаптором. Например, после продолжительной экспозиции конгруэнтного аудиовизуального стимула, имеющего признаки одной и той же базовой эмоции и на лице, и в голосе, оценки последующих амбивалентных звуков голоса смещаются в направлении, противоположном адаптору [Baart, 2018]. Подобные результаты демонстрируются и при адаптации в рамках одной модальности — как для экспрессии лица [Korolkova, 2017; Korolkova, 2015], так и для голоса [Skuk, 2013] и позы тела [Watson, 2019].
Если информация об эмоции, содержащаяся в аудиовизуальном адапторе, рассогласована, имеют место эффекты фасилитации [Baart, 2018] — так же, как и при унимодальной адаптации к динамическому лицу, демонстрирующему переход между базовыми экспрессиями [Korolkova, 2018]. Результаты, полученные в исследованиях кроссмодального переноса эмоциональной информации, на сегодняшний день не позволяют сделать однозначного вывода о проявлении адаптации либо фасилитации. Так, в ряде исследований какие-либо эффекты полностью отсутствуют [Fox, 2007; Korolkova, 2018], тогда как в других удалось продемонстрировать кроссмодальную адаптацию, проявляющуюся в зависимости от пола натурщиков и наблюдателей [Skuk, 2013; Wang, 2017]. При наличии эффекта кроссмодальной адаптации он выражен слабее, чем унимодальный, и проявляется только в случае динамического, но не статического, адаптора [Pye, 2015].
Независимо от способа экспозиции, результаты исследований кроссмодальной интеграции эмоций позволяют предположить, что этот процесс в значительной мере автоматизирован, не зависит от представленности всех предъявляемых модальностей в сознании и практически не зависит от особенностей инструкции и задачи [Vroomen, 2001]. В частности, выраженная в тоне голоса эмоция, неконгруэнтная оцениваемой позе, снижает точность оценок даже при сверхкороткой экспозиции изображения тела и его маскировке [Stienen, 2011], а поза тела в равной степени влияет на суждения об экспрессии лица независимо от инструкции игнорировать нерелевантную модальность и наличия либо отсутствия дополнительной задачи [Aviezer, 2011].
Рассмотренные исследования позволяют заключить, что воспринимаемая экспрессия лица как часть целостного мультимодального проявления эмоции получает дополнительное содержание и глубину. Зрительная, аудиальная и другие модальности, содержащие признаки одной и той же эмоции, создают впечатление искренности коммуниканта, его открытости общению, позволяют точнее оценивать его состояние. Если признаки эмоции, получаемые по разным каналам, противоречат друг другу, интегральный образ экспрессии трансформируется с учетом всей доступной информации и приобретает новое качество. Независимо от модальности проявления, предшествующие эмоциональные состояния оказывают влияние на формирование перцептивного образа, образуя временной контекст восприятия.
Порождение и восприятие экспрессии лица в процессе общения
Восприятие лица по своей природе является актом межличностной коммуникации, в котором собеседник может быть представлен как реальный партнер по общению (коммуникация лицом к лицу) либо как его замещающее изображение (викарное общение). Выделяют три основные формы взаимной подстройки поведенческих актов в процессе общения: взаимная синхронизация позы, интонации, экспрессии, движений коммуникантов во времени; имитация, или мимикрия, когда действие одного из собеседников неосознаваемо «копируется» другим; а также целенаправленная координация действий, направленная на совместное решение определенной задачи [Louwerse, 2012]. Синхронизация и координация совместных действий всегда локализованы в определенном временном интервале, тогда как имитация в ряде случаев может быть отложена во времени, не требуя при этом присутствия партнера. В отличие от имитации и синхронизации, скоординированные движения не столько копируют, сколько дополняют друг друга. Синхронизация может включать одновременно несколько различных невербальных каналов, в частности, экспрессии лица и движения головы, которые преимущественно воспроизводятся партнером в интервале нескольких секунд после того, как были продемонстрированы первым участником. Степень синхронизации увеличивается при усложнении совместной задачи, предположительно обеспечивая более эффективное ее решение. Синхронизация, таким образом, представляется неотъемлемой частью процесса коммуникации и выполняет в нем регулятивные и аффилиативные функции.
Интерактивный характер восприятия эмоций в процессе общения в полной мере раскрывается в явлении эмоциональной мимикрии, при которой в ответ на экспрессию одного коммуниканта аналогичная экспрессия возникает и у второго участника общения. Представляется, что в основе эмоциональной мимикрии лежит не столько моторное подражание, сколько взаимная настройка эмоций коммуникантов [Hess, 2013]. В частности, релевантный мимический ответ возникает даже при частичной окклюзии лица, когда конфигурация определенных мимических мышц недоступна для непосредственного восприятия [Fischer, 2012а]. При мимикрии задействованы как моторные, так и эмоциональные структуры мозга [Rymarczyk, 2018], включая зеркальную систему, обеспечивающую понимание действий и эмоций окружающих [Rizzolatti, 2008], а также механизмы гормональной регуляции [Kraaijenvanger, 2017].
Экспрессии, совпадающие по валентности с демонстрируемым изображением лица, появляются в онтогенезе уже в течение первого года жизни, когда младенцы начинают усваивать социальное значение эмоций [Hashiya, 2019; Isomura, 2016; Soussignan, 2018]. Во взрослом возрасте конгруэнтные мимические реакции в значительной степени автоматизированы и наблюдаются даже в отсутствие осознаваемого восприятия экспрессии [Dimberg, 2000; Kaiser, 2016]. Вместе с тем проявления мимикрии не являются полностью автоматическими и опосредуются рядом факторов, в числе которых направленность эмоции коммуниканта, особенности эмоциональной сферы наблюдателя и характер отношений между участниками общения.
Направленность эмоций коммуниканта в условиях лабораторного эксперимента может быть смоделирована через направление его взора. Если взор натурщика и его эмоция обращены на наблюдателя, регистрируется релевантный мимический ответ на экспрессию радости, а если взор отведен в сторону — предположительно, на общего «врага», — наблюдается мимикрия экспрессии гнева [Deng, 2017; Soussignan, 2013]. Особенности эмоциональной сферы наблюдателя, влияющие на интенсивность мимического ответа, включают его актуальное эмоциональное состояние и эмпатию как личностную черту [Rymarczyk, 2019; Wied, 2006]. Характер социальных отношений между коммуникантами также определяет наличие конгруэнтной мимической реакции: она преимущественно возникает в ответ на экспрессии представителей «своей» социальной группы. Так, в реальной ситуации общения происходит мимикрия улыбок знакомого человека, но не его экспрессий отвращения. При этом экспрессии незнакомцев такого ответа не вызывают [Fischer, 2012]. Различное положение натурщика и наблюдателя в социальной иерархии обусловливает разные паттерны экспрессивных ответов: наблюдатель, у которого индуцировано более низкое положение в социальной иерархии, отвечает улыбкой независимо от экспрессии натурщика, а при индукции более высокого положения копируется улыбка более низко расположенных натурщиков [Carr, 2014]. Необходимость кооперации усиливает мимический ответ, тогда как в ситуации соперничества либо при оценке действий партнера как нечестных он не формируется [Lanzetta, 1989; Likowski, 2011; Scopa, 2016; Seibt, 2013; Weyers, 2009].
Экспрессии, порождаемые в коммуникативной ситуации, становятся, таким образом, не только сигналами о состояниях собеседников, но и способом регуляции процесса общения и синхронизации поведенческих актов. В них находят отражение личностные особенности коммуникантов, их социальный статус и характер отношений. Разворачиваясь «здесь и сейчас», они обеспечивают непрерывную подстройку реакций коммуникантов в зависимости от действий, невербальных проявлений и намерений участников общения, создавая общий коммуникативный контекст.
Заключение
Проведенный обзор подтверждает, что динамические характеристики выражения лица играют в восприятии состояния человека существенную роль. Экспериментально доказано конструктивное влияние динамической информации на точность распознавания модальности эмоций, наиболее яркое при низком качестве экспонируемых экспрессий. Важными источниками динамической информации являются направление, траектория и скорость изменения выражений лица; экспрессии, сохранившие оригинальную последовательность развертывания, воспринимаются более точно и полно. Динамические изображения меняют впечатления об интенсивности эмоций и влияют на представления об их искренности или искусственности. Адекватности восприятия меняющегося состояния содействуют зрительный контакт коммуниканта и эмоциональная мимикрия лица наблюдателя. Эффекты динамики носят избирательный характер, зависят от модальности эмоции и условий ее экспозиции. В отличие от статики, динамика выражения лица непосредственно включена в регуляцию текущего поведения наблюдателя и организацию его восприятия. Благодаря динамике диагностические признаки эмоций приобретают дополнительные значения и функции, складывается многомерный динамический контекст восприятия коммуниканта.
Экспрессии лица не существуют изолированно; они включены в широкий контекст мультимодальных проявлений эмоциональных состояний, что делает рассмотрение целостных динамических актов невербального поведения перспективным направлением исследований. Многомерность эмоций, их ключевая роль в регуляции коммуникативных процессов, совместной деятельности и социальных отношений, выходят на первый план в науке о лице, дополняя и развивая представления о механизмах межличностного познания.
Совокупность рассмотренных работ указывает на формирование новой экспериментальной парадигмы изучения восприятия лица. Место «замороженных» прототипических изображений эмоций занимают естественные лицевые акты, включенные в процессы межличностной коммуникации. Определяющими становятся факторы времени и контекста. Возникает необходимость радикального пересмотра используемых в экспериментах и на практике статических баз данных [Krumhuber, 2013].
Выполненный анализ показывает, что закономерности восприятия подвижного лица не принижают роли статики, пространственных отношений, эмоциональных экспрессий. Статика и динамика «живого» лица характеризуют разные стороны одной и той же реальности, взаимосвязаны, дополняют и поддерживают друг друга.