Распознавание отдельных черт лица как основа узнания целого лица

Ющенкова Д.В.; Мещеряков Б.Г.

Экспериментальная психология
2010. Том 3. № 3. С. 84–92
ISSN: 2072-7593 / 2311-7036 (online)

Распознавание отдельных черт лица как основа узнания целого лица

1453

Аннотация

Сообщается об экспериментальном исследовании точности и скорости узнавания фотографического изображения лица по предъявлению одной из его частей (глаз, носа, рта). Результаты подтверждают гипотезу о том, что наибольшей выразительностью и информативностью с точки зрения точности и скорости опознания лиц обладает область глаз. При этом научение не уменьшает предпочтительности данной области в процессе распознавания; существенное влияние научения на скорость опознания лиц было обнаружено только в первых двух из пяти проведенных опытов.

Общая информация

Ключевые слова: человеческое лицо, часть лица, опознание, точность и скорость опознания, научение

Рубрика издания: Психология восприятия

Тип материала: научная статья

Для цитаты: Ющенкова Д.В., Мещеряков Б.Г. Распознавание отдельных черт лица как основа узнания целого лица // Экспериментальная психология. 2010. Том 3. № 3. С. 84–92.

Полный текст

Совершенно обычные для человека способности к распознаванию, различению, узнаванию лиц в научной литературе нередко характеризуются как феноменальные и удивительные. Например, способность различать лица описывается как высшая точка (акме) человеческого визуального восприятия (Ellis, 1981); мы можем опознать выражение лица (например, улыбку) даже в том случае, если оно мелькнуло лишь на мгновение – на 20 мс (Simpson, Crandаll, 1972), и узнать своих одноклассников (даже если забыли их имя) с точностью 90% спустя 35 лет после окончания школы (Bahrick et al., 1975). Эти способности получают самые восторженные оценки и с точки зрения потенциального количества воспринимаемых и запоминаемых лиц, и с точки зрения разнообразия получаемой информации о самом лице и его обладателе, и с точки зрения скорости ее обработки и прочности запоминания, и, наконец, с точки зрения важности этой информации для обеспечения самосохранения и социального благополучия. Примечательно, что в последнее время возрос интерес к малоразработанной проблеме адекватности восприятия индивидуальнопсихологических особенностей и экспрессивных состояний человека по выражению лица, в том числе на основе его фотоизображения (Барабанщиков, 2009).

Таким образом, исследования процессов и механизмов узнавания изображения лиц приобрели статус особых (special) «стимулов»; они признаются «особыми» для восприятия объектами не только с точки зрения их значения для общения и жизни в обществе и особенно для общения между людьми, но и с точки зрения своеобразных механизмов их восприятия и дальнейшего сохранения в памяти. И хотя существование особых механизмов обработки информации о лицах находит оправдание на основе аргументации об их длительной эволюционной истории и большой коммуникативной практики, это нисколько не снимает, а, напротив, повышает значимость вопроса о реальном, конкретном содержании и функции этих механизмов.

Большое внимание в литературе по опознанию лиц уделялось вопросам о механизмах, способах и стратегиях их опознания. Этот вопрос имеет не только теоретическое, но и разнообразное прикладное значение: например, с точки зрения организации процедур опознания личности в ходе розыскной работы правоохранительных органов, в том числе при составлении и использовании портретов разыскиваемых лиц; разработки алгоритмов и систем автоматического опознания лиц (подробнее см.: Zhao et al., 2003); оценки качества косметических лицевых операций; диагностики и понимания ряда нарушений психического развития (аутизм, синдром Уильямса и др.) и т.д.

Среди множества аспектов исследований опознания лиц традиционно вызывает большой интерес вопрос о том, какие характеристики (элементы, части) лиц являются более или менее важными. Этот вопрос изучается с применением разнообразных методических подходов. Один из самых популярных подходов к изучению информативности (или perceptual saliency) частей лиц основан на данных о распределении фиксаций глаз при наблюдении лиц взрослыми и детьми (например, Ярбус, 1965; Janik et al., 1978; Corenblum, Meissner, 2006).

Другим способом анализа рассматриваемого вопроса о важности разных частей лиц для узнавания являются эксперименты по узнаванию фотороботных лиц в зависимости от дозированных изменений тех или иных деталей лиц (например, Davies et al., 1977).

Тем не менее этот вопрос требует дополнительных исследований, поскольку лишь в небольшом количестве исследований собственно опознания1 применялись достаточно строгие методики, позволяющие одновременно получать данные о точности и времени ответов. И наоборот, в ряде исследований с использованием хронометрических методик испытуемые решали не вполне экологически валидные задачи. Например, в исследовании Я. Фрэйзера и Д. Паркера (Fraser, Parker, 1986) в быстрой последовательности предъявлялись части схематических линейных рисунков лиц, а испытуемые должны были как можно быстрее определить, было ли лицо полным или в нем отсутствовала определенная часть.

Поэтому исследования дифференциального вклада внутренних деталей лиц в процессы опознания с использованием фотографий реальных людей и с совместной регистрацией показателей точности и скорости опознания сохраняют свою актуальность и новизну.

В настоящем исследовании применялась новая методика, в которой задача испытуемого состояла в определении, какому из ряда одновременно предъявляемых лиц принадлежит предварительно демонстрируемая на ограниченное время (1 с) часть лица (глаза, нос или рот). Эту задачу (и методику) можно было бы назвать «задачей (методикой) опознания целого лица по его части». Методика позволяет оценивать как точность, так и скорость опознания, поскольку вместе с выбором лица регистрируется время реакции выбора. Кроме того, нас интересовало влияние на характеристики опознания процесса научения (т.е. изменения характеристик решения данной задачи на протяжении пяти опытов).

В качестве основной гипотезы было предположение, что наиболее эффективной частью лиц в отношении их опознания является область глаз. Эта гипотеза вполне оправдана, учитывая многочисленные предшествующие исследования узнавания, собственно опознания и глазодвигательного поведения при рассматривании лиц, в общем подтверждавшие тезис о наибольшей важности именно области глаз (см., например, обзоры: Мещеряков, 2006; Ellis, 1975, 1981; Zhao et al., 2003).

1 Термин «опознание» (recognition) в отечественной и зарубежной литературе часто используется в широком смысле, включающем как процедуры узнавания (бинарная классификация с категориями «новый – старый»), так и процедуры множественной идентификации (отнесение стимула к одному из множества классов эквивалентности, как это принято в случае реакции выбора.) Под собственно опознанием мы понимаем именно процедуры идентификации. Это различение важно, поскольку по интересующему нас вопросу преобладают исследования узнавания.

Метод

Испытуемые.

Выборка состояла из 20 испытуемых: 10 мужчин и 10 женщин (средний возраст – 23,2 лет, диапазон – 18–56 лет). Большинство испытуемых были студенты Международного университета природы, общества и человека «Дубна», остальные – люди с разным предшествующим образованием, занятые в различных сферах деятельности и имеющие различные социальные статусы. Испытуемые имели нормальную или скорректированную до нормальной остроту зрения. Кроме одного испытуемого, все были правшами.

Оборудование и материалы.

Для демонстрации фотографий использовался персональный компьютер с дисплеем, а для регистрации ответов испытуемых применялось стандартное устройство ввода типа «мышь».

Предъявление фотографий на экране управлялось с помощью компьютерной программы², которая позволяла варьировать длительность предъявления изображений и интервалы между ними, а также регистрировать варианты ответов и время реакции.

Испытуемым предъявлялось восемь черно-белых полутоновых фотографий лиц (4 фотографии мужских лиц и 4 фотографии женских лиц) по частям (фрагментарно) и в целом, с нейтральным выражением лица, без явных эмоциональных признаков. Фотографирование мужских и женских лиц осуществлялось в одних и тех же условиях, приблизительно в одно и то же время суток, с помощью одного и того же фотоаппарата. Размеры предъявляемых частей лиц были примерно уравнены, при этом важно отметить, что область глаз не включала верхнюю часть головы (прическу), а область рта не включала подбородок (см. рис 1).

Рис. 1. Примеры предъявляемых частей лиц (фотография экрана дисплея)

В каждой пробе сначала предъявлялась отдельная часть лица (область глаз, область носа или область рта), затем – восемь фотографий лиц, среди которых было одно лицо, которому принадлежала предъявленная часть лица. Эти восемь фотографий предъявлялись по кругу на дисплее, в центре которого предъявлялась часть одного из этих лиц (рис. 2).

При среднем расстоянии от глаз испытуемого до экрана дисплея 50 см, угловые размеры фрагментов лиц составляли 6 угл. град. по горизонтали и 1 угл. град. по вертикали, а размеры фотографий лиц в целом 4 угл. град. по горизонтали и 1 угл. град. по вертикали. Расстояние от точки фиксации до середины каждого лица составляло примерно 5 угл. град.

² Написана сотрудником лаборатории экспериментальной психологии университета «Дубна» Р. В. Соколовым. Автор выражает ему за это глубокую признательность.

Рис. 2. Расположение на дисплее компьютера восьми черно-белых полутоновых фотографий лиц

Задача испытуемого и инструкция.

В каждом опыте задача испытуемого состояла в том, чтобы правильно и быстро определить принадлежность предъявленной части лица одному из восьми лиц, предъявленных в целом. Длительность предъявления каждой части лица была фиксированной и равной 1 с. По прошествии этого времени часть лица исчезала, и на экране немедленно появлялся набор из 8 полных лиц до момента осуществления реакции выбора нужного лица.

Инструкция формулировалась следующим образом: «Смотрите на фиксационную точку в центре экрана. В каждой пробе сначала в центре экрана на короткое время будет предъявлен тот или иной фрагмент лица (область глаз, область носа и область рта). Сразу после его исчезновения на дисплее по кругу появятся восемь фотографий лиц в целом. Ваша задача заключается в том, чтобы как можно быстрее и правильно определить, какому из этих лиц принадлежит ранее предъявленный фрагмент лица. Для этого необходимо «мышкой» навести курсор на фотографию лица, которому, по Вашему мнению, принадлежит фрагмент лица».

Время реакции испытуемого от момента предъявления набора полных лиц до клика мышью автоматически регистрировалось в памяти компьютерной программы. После осуществления реакции выбора лица исчезали с экрана и через случайно варьируемый интервал между пробами (3 с) предъявлялась следующая часть лица.

План эксперимента.

С каждым испытуемым проведено пять опытов с интервалами от одних до пяти суток между последовательными опытами (средний интервал – три дня).
В отдельном опыте в качестве независимой переменной выступал фрагмент лица (3 уровня), предъявляемый 64 раза в квазислучайной последовательности, обеспечивающей равное количество предъявлений из набора восьми разных лиц. Дополнительно в качестве независимой переменной рассматривался пол испытуемых.

Таким образом, основными независимыми переменными были «фрагмент лица», «номер опыта» и «пол». Зависимыми переменными были процент правильных опознаний и время реакции.

Процедура опыта.

О целях исследования испытуемым сообщалось только то, что оно направлено на выяснение вопроса: «Какие признаки наиболее существенны в опознании человеческих лиц».

Перед каждым опытом экспериментатор показывал испытуемому бумажные фотографии тех же лиц, которые затем использовались в опыте. Испытуемого не ограничивали во времени для ознакомления с лицами, но, как правило, на это уходило не более 2–3 минут. Далее испытуемому зачитывалась инструкция, и начинался сам опыт. В среднем длительность одного опыта составляла примерно 35 минут.

Расположение на дисплее фотографий лиц в целом после каждого предъявления отдельной части лица было случайным от пробы к пробе. Каждая часть одного и того же лица предъявлялась по восемь раз. В итоге количество оцениваемых в одном опыте стимулов (и проб) составляло 192 (3 части лица х 8 лиц х 8 повторов для каждой части лица). Порядок предъявления стимулов для каждого испытуемого был случайным.

Результаты и их обсуждение

Анализ данных по точности опознания лиц.

Для оценки того, насколько точность правильного опознания лиц отличается от случайного угадывания (однородное распределение вероятностей), мы воспользовались критерием .2. Процедура вычисления основывалась на сравнении эмпирических и теоретических частот распределения ответов в матрицах смешения 8 х 8 для каждой части лица как в целом по всей выборке испытуемых, так и отдельно для мужчин и женщин. В табл. представлены полученные значения критерия .2.

Таблица. Точность опознания мужских и женских лиц в целом по частям лиц для всей выборки и подвыборок (d.f. = 49)

Примеч.: все значения критерия .2 являются высокозначимыми (p < 0,001).

Хотя все вычисленные значения .2 имеют высокий уровень значимости, но, безусловно, по этому показателю лидирует с подавляющим превосходством область глаз как для всей выборки, так и для подвыборок мужчин и женщин. Различия между областями носа и рта являются значительно меньшими по сравнению с их отличием от области глаз.

Следующий интересный факт касается половых различий. Для всех областей лиц значения .2 у женщин выше, чем у мужчин: для области глаз на 8,7, для области носа – на 5,7 и для области рта – на 34,1%. Эти данные показывают превосходство женщин в способности опознания лиц в данных условиях. Кроме того, можно заметить, что у мужчин и женщин соотношение величин .2 для носа и рта являются противоположными: мужчины несколько лучше опознают лица на основе носа, а женщины – на основе рта.

Эти предварительные выводы могут быть проверены и дополнены более традиционным статистическим анализом данных о процентах правильных ответов. Для этого проводился трехфакторный дисперсионный анализ с одной межсубъектной переменной «пол» и двумя внутрисубъектными переменными «часть лица» и «опыт» (5 уровней). Неуправляемая переменная «возраст» рассматривалась как ковариата.

Значимые эффекты были обнаружены для фактора «часть лица» (F = 11,421, d.f. = 2, p < 0,001) и фактора «опыт» (F = 13,095, d.f. = 4, p < 0,001). Различий в точности опознания лиц между испытуемыми мужского и женского пола обнаружено не было. Влияние ковариаты «возраст» на точность опознания не является существенным.
Проверка значимости различий между частями лиц с помощью критерия множественных сравнений Бонферрони обнаружила существенные различия между областью глаз и областью носа (p < 0,001), областью глаз и областью рта (p < 0,001). Различия между областью носа и областью рта не являются значимыми.

Таким образом, результаты дисперсионного анализа подтверждают основную гипотезу, свидетельствуя о том, что опознание лиц по области глаз существенно лучше (правильнее) по сравнению с опознанием лиц по другим частям лица.

Насколько значимым оказалось влияние научения на точность опознания (см. рис. 3)? Парные сравнения между разными парами последовательных опытов показали существенные различия для всех 10 пар опытов (в восьми случаях при p < 0,001, в одном случае при p < 0,01 и в одном случае при p < 0,05). В целом по трем частям лица зависимость между точностью опознания и номером опыта является скорее линейной (F = 27,862, d.f. = 1, p < 0,001), чем нелинейной.

Из всех возможных взаимодействий факторов значимым является лишь взаимодействие факторов «часть лица» и «опыт» (F = 3,605, d.f. = 8, p < 0,001). На рис. 3 представлены зависимости процента правильных опознаний от номера опыта для трех частей лица.

Глядя на рисунок зависимости процента правильных ответов от номера опыта (рис. 3), можно увидеть большое отличие этой зависимости для области глаз по сравнению с изменением точности опознания лиц для области носа и области рта, которые практически одинаковы. Для уточнения этих выводов проводилось два дополнительных дисперсионных анализа: один для области глаз, другой для области носа и области рта.

Рис. 3. Зависимость точности опознания лиц от номера опыта для трех частей лица

Однофакторный дисперсионный анализ точности опознания для области глаз показал, что фактор «опыт» в целом не является значимым, хотя анализ парных различий выявил более сложную картину: 1) процент правильных опознаний в первом опыте был существенно ниже, чем в последующих опытах; 2) во втором и третьем опытах точность опознания хуже только по отношению к пятому опыту; 3) не обнаружено различий в точности опознания между вторым, третьим и четвертым опытами.

Двухфакторный дисперсионный анализ, проведенный для области носа и области рта, показал незначимость фактора «часть лица» и большую значимость фактора «опыт» (F = 11,981, d.f. = 4, p < 0,001), а также незначимость взаимодействия фактора «часть лица» и фактора «опыт». Парные сравнения между опытами выявили существенные различия между всеми опытами (в большинстве случаев p < 0,001 и в одном случае p < 0,01). Для зависимости точности опознания от номера опыта наиболее существенной оказалась линейная функция (F = 21,247, d.f. = 1, p < 0,001).

Таким образом, хотя от опыта к опыту происходило более заметное улучшение опознания для наименее существенных частей лиц (рот и нос), но их отставание от области глаз не исчезло и было статистически значимым после пяти последовательных опытов. К сожалению, мы не нашли в литературе сравнимых данных по научению в задачах опознания лиц, но в одном из часто цитируемых исследований было показано, что интенсивная тренировка в таких задачах оказывается малоэффективной (Woodhead et al., 1979; см. также: Bond, McConkey, 1995). Вероятно, способность людей использовать информацию из области глаз для опознания лиц действительно находится вблизи максимально возможного («потолочного») уровня.

Анализ данных по времени реакции.

Для статистического анализа времени реакции использовался трехфакторный дисперсионный анализ, в котором внутрисубъектными факторами были «часть лица» и «опыт», а межсубъектным фактором – фактор «пол». Фактор «возраст» выступал как ковариата.

Зависимая переменная – время реакции (мс) – определялась как среднее значение, определяемое на основе медиан по времени реакции всех правильных ответов каждого испытуемого в каждом опыте (использование медиан необходимо для устранения влияния случайных экстремальных значений).

Оба внутрисубъектных фактора оказывают значимое влияние. Фактор «часть лица» оказался более значимым (F = 12,166, d.f. = 2, p < 0,001), чем фактор «опыт» (F = 5,025,
d.f. = 4, p < 0,01). Опять-таки половые различия не были обнаружены. И ни одно из взаимодействий (двойных и тройных) не было значимым.

На рис. 4 представлены зависимости времени реакции от номера опыта для трех частей лица. В целом эта зависимость оценивается как линейная (F = 6,958, d.f. = 1, p = 0,017) и как квадратическая (F = 4,852, d.f. = 1, p = 0,042).

На рис. 4 видно, что время реакции для каждой части лица уменьшается от опыта к опыту. Парные сравнения (с помощью критерия Бонферрони) между уровнями фактора «опыт» обнаруживают существенные различия первого опыта от всех остальных опытов и второго опыта от всех остальных опытов, в то время как третий, четвертый и пятый опыты существенно не отличались друг от друга по времени реакции.

Парные сравнения между частями лиц показывают существенно более быстрые ответы для области глаз (p < 0,001) и практически одинаковое время реакции для области носа и области рта.

Следовательно, данные по времени реакции убедительно свидетельствуют о том, что опознание лица на основе области глаз происходит быстрее (среднее время 2,19 с), чем на основе области носа (среднее время 2,77 с) и области рта (среднее время 2,76 с), т. е. опознание лиц по области глаз происходит почти на 600 мс быстрее. Важно также отметить, что это преимущество для области глаз сохраняется с первого по пятый опыт у всех испытуемых независимо от пола. Следовательно, по хронометрическим данным мы вообще не видим уменьшения преимущества области глаз по сравнению с другими частями лиц по ходу процесса научения.

Таким образом, на основании полученных результатов можно сделать следующие выводы:

Разные части лица вносят неодинаковый вклад в процесс опознания лиц. Из трех сравнивавшихся частей лица наибольший вклад в процесс его опознания вносит область глаз.
Опознание лиц на основе области глаз происходит значительно быстрее, чем на основе других частей лица.
В процессе научения преимущество области глаз по сравнению с другими частями лиц не устраняется.
Заметное влияние научения на скорость опознания на основе разных частей лиц обнаруживается только в первых двух опытах.

Литература

Барабанщиков В. А. Восприятие выражений лица. М.: Институт психологии РАН. 2009. 448 с.
Мещеряков Б. Г. Фейс-символы как психологические орудия // Культурно-историческая психология. 2006. № 1. С. 11–17.
Ярбус А. Л. Роль движений глаз в процессе зрения. М.: Наука, 1965. 166 с.
Bahrick H. P., Bahrick P. O., Wittlinger R. P. Fifty years of memory for names and faces: A cross-sectional approach // Journal of Experimental Psychology: General. 1975. Vol. 104(1). Р. 54–75.
Bond N. W., McConkey K. M. Information Retrieval: Reconstructing Faces // Psychology and Policing / Eds. N. Brewer, С. Wilson. Hillsdale, New Jersey: Lawrence Erlbaum Associates, 1995. P. 101–117.
Corenblum B., Meissner C. Recognition of faces of ingroup and outgroup children and adults er // Journal of Experimental Child Psychology. 2006. Vol. 93. P. 187.
Davies G., Ellis H., Shepherd J. Cue saliency in faces as assessed by the «Photofit» technique // Perception. 1977. Vol. 6(3). P. 263–269.
Ellis H. D. Recognizing faces // British Journal of Psychology. 1975. Vol. 66(4). P. 409–426.
Ellis H. D. Theoretical aspects of face recognition // Perceiving and Remembering Faces / Eds. G. Davies, H. Ellis and J. Shepherd. London: Academic Press, 1981. P. 171–198.
Fraser I., Parker D. Reaction time measures of feature saliency in a perceptual integration task // Fraser I., Parker D. Aspects of face processing / Eds. H. D. Ellis. New York: Springer Science & Business. 1986. P. 105–120.
Janik S. W., Rodney A. W., Goldberg M. L., Dell'Osso L. F. Eyes as the center of focus in the visual examination of human faces // Perceptual and Motor Skills. 1978. Vol. 47(3. Pt. 1). P. 857–858.
Simpson W. E., Crandall S. J. The perception of smiles // Psychonomic Science. 1972. Vol. 29(4-A). P. 197–200.
Woodhead M. M., Baddeley A. D., Simmonds D. C. V. On Training People to Recognize Faces // Ergonomics. 1979. V. 22(3). P. 333–343.
Zhao W., Chellappa R., Phillips P. J., Rosenfeld A. Face Recognition: A Literature Survey // ACM Computing Surveys. 2003. Vol. 35(4). P. 399–458.

Информация об авторах

Ющенкова Дарья Викторовна, кандидат психологических наук, доцент кафедры психологии, государственный университет «Дубна», Дубна, Россия, e-mail: dashulya-psy@mail.ru

Мещеряков Борис Гурьевич, доктор психологических наук, профессор кафедры психологии ФСГН, Государственный университет «Дубна» (ГБОУ ВО МО «Университет “Дубна”»), Заместитель главного редактора международного научного журнала «Культурно-историческая психология», Дубна, Россия, ORCID: https://orcid.org/0000-0001-6252-2822, e-mail: borlogic1@gmail.com

Метрики

Просмотров

Всего: 4146
В прошлом месяце: 14
В текущем месяце: 17

Скачиваний

Всего: 1453
В прошлом месяце: 4
В текущем месяце: 5