Экспериментальная психология
2020. Том 13. № 2. С. 72–89
doi:10.17759/exppsy.2020130206
ISSN: 2072-7593 / 2311-7036 (online)
Порядок поступления в кратковременную память информации, обработанной в зрительных путях с разной пространственно-частотной настройкой
Аннотация
Общая информация
Ключевые слова: лицо, пространственная частота, последовательность, кратковременная память
Рубрика издания: Когнитивная психология
Тип материала: научная статья
DOI: https://doi.org/10.17759/exppsy.2020130206
Финансирование. Исследование выполнено при финансовой поддержке Министерства науки и высшего образования РФ (задание № 25.3336.2017/ПЧ).
Для цитаты: Алексеева Д.С., Бабенко В.В., Явна Д.В. Порядок поступления в кратковременную память информации, обработанной в зрительных путях с разной пространственно-частотной настройкой // Экспериментальная психология. 2020. Том 13. № 2. С. 72–89. DOI: 10.17759/exppsy.2020130206
Полный текст
Введение
Решение проблемы взаимодействия механизмов восприятия и памяти является важным шагом в понимании фундаментальных вопросов организации когнитивных процессов, лежащих в основе формирования категориальной системы и создания ментальной модели мира.
Связь между перцепцией и когнитивными функциями более высокого порядка обеспечивается кратковременной памятью (КП), которая является частью рабочей памяти. В этой связи особую актуальность приобретает вопрос о закономерностях перевода информации из перцептивной репрезентации в КП.
Что касается накопления информации в самой перцептивной репрезентации, то здесь большинство фактов указывают на последовательность обработки «от грубого к тонкому» [24; 31; 32]. Такая последовательность позволяет сначала получить общую информацию о зрительной сцене, затем выделить отдельные объекты, после чего перейти к их обработке.
В работе Gao, Bentin [16] впервые был прямо поставлен вопрос о том, в какой последовательности информация разной пространственной частоты сохраняется в КП. В качестве зрительных стимулов они использовали лица. Авторы пришли к выводу, что перевод перцептивной репрезентации в КП организован по конвейерному принципу: информация, которая первой обрабатывается на перцептивном уровне, первой же и заносится в КП.
Вместе с тем, большинство авторов сходятся в том, что наиболее эффективными в задаче идентификации лиц являются средние, а не низкие частоты [28; 35]. Налицо очевидное противоречие: для идентификации лиц более важными являются средние частоты, но формирование репрезентаций в КП, по мнению Gao & Bentin [16], тем не менее, начинается с низких. Идентификация лиц — жизненно важная операция. Зачем же тратить время на опережающее запоминание низких частот, если более полезны средние? Опережающее восприятие низких частот на перцептивном уровне целесообразно с точки зрения быстрой сегментации сцены, в частности выделения на ней лиц. Но сохраняемая в памяти репрезентация конкретного лица «требует» средних пространственных частот, поскольку информация именно из этого диапазона частот используется при формировании репрезентаций лиц в долговременной памяти [18; 25].
Анализ данной статьи [16] привел нас к выводу, что поставленный авторами вопрос едва ли можно считать окончательно решенным. Чтобы оценить роль различных пространственных частот в изучаемом процессе, следовало использовать узкополосные стимулы. Однако авторы применяли отфильтрованные изображения лишь двух типов: одни лица содержали все пространственные частоты из нижней половины спектра, другие — все частоты из верхней половины. При этом большая часть так называемого эффективного диапазона частот (для распознавания лиц) попала в «низкочастотные» стимулы.
Цель нашего исследования — определить закономерность поступления в кратковременную память зрительной информации разной пространственной частоты.
Для решения поставленной задачи мы воспользовались стандартной экспериментальной процедурой: исходные лица предварительно фильтруются с разной частотой, выраженной в циклах на ширину лица (цикл./л.) а затем полученные узкополосные «копии» сопоставляются с неотфильтрованными лицами. Оценивается доля правильных сопоставлений для каждого из частотных диапазонов. Чтобы облегчить сопоставление наших результатов с данными Gao & Bentin [16], мы в качестве стимулов использовали изображения лиц.
Для достижения поставленных целей нам следовало выполнить несколько методических условий:
1. Каждое исходное изображение должно быть предварительно отфильтровано в шести частотных диапазонах (по числу зрительных путей) [42]. В последующие годы шестиканальная модель Вильсона была неоднократно подтверждена [26; 38] и стала общепризнанной [4]. Характеристики используемых фильтров должны соответствовать пространственно-частотным настройкам стриарных нейронов.
2. Самая низкая частота фильтрации должна быть гарантированно ниже нижней границы частотного диапазона, который рассматривается в качестве полезного для идентификации лиц. По данным большинства авторов речь идет о частоте менее 4 цикл./л. [17; 29].
3. Перекрытие спектров всех отфильтрованных изображений с неотфильтрованными должно быть одинаковым. Для этого одинаковой должна быть полоса пропускания всех используемых фильтров.
4. Поскольку нас интересовал процесс формирования репрезентации в КП, следовало использовать незнакомые лица, чтобы исключить возможность решения задачи с помощью долговременной памяти.
5. Принимая во внимание, что внешние признаки вносят важный вклад в соотнесение незнакомых лиц [7; 22; 37], мы посчитали целесообразным использовать реальные фотографии, включающие как внутренние, так и внешние детали лица.
6. Мы не выравнивали отфильтрованные изображения по энергетическим характеристикам (не повышали контраст изображений, отфильтрованных по высокой частоте), чтобы не исказить естественный ход зрительной обработки [23].
На этапе планирования эксперимента было проведено пилотное исследование, которое позволило определить вероятную величину эффекта. Анализ мощности многофакторного ANOVA с повторными измерениями для величины эффекта ц2=0,6, выполненный в программе G*Power, показал, что размер выборки n=4 достаточен для достижения мощности 0,8. Поскольку анализ экспериментальных данных предполагалось проводить по двум факторам повторных измерений, ожидаемая мощность должна была быть заведомо выше. Следует отметить, что ограниченность выборки (2—5 участников) является принятой в аналогичных исследованиях [3; 9; 11; 21].
Методика
Стимулы. Были отобраны 184 полутоновые оцифрованные фотографии анфас мужчин и женщин в возрасте 18-20 лет. Все они были преобразованы кпиксельномуразмеру 683 по высоте и 512 по ширине. Изображения были выровнены по средней яркости и контрасту и окружены серым фоном той же яркости (20 кд/м2). Фотографии подвергались пространственно-частотной фильтрации с шагом 1 октава. Для этого мы использовали программную реализацию изотропных полосовых пространственно-частотных фильтров, предложенную для Matlab в 2007 г. K.S. Sasaki и I. Ohzawa. Пиковыми были частоты фильтрации (ЧФ) 3.5, 7, 14, 28, 56 и 112 цикл/л. Эта операция имитировала фильтрацию входного изображения зрительными путями человека, настроенными соответственно на пространственную частоту (ПЧ) 0,5, 1, 2, 4, 8 и 16 циклов на градус (цикл./град.) (при ширине лица 7 угловых градусов). Полоса пропускания фильтров была сужена до 1 октавы, чтобы избежать перекрытия спектров отфильтрованных изображений на уровне 50% спектральной мощности (рис. 1).
Рис. 1. Радиально усредненные спектры отфильтрованных гамма-скорректированных изображений, отнесенные к усредненному спектру исходных изображений. На оси абсцисс — пространственная частота (цикл./град.), на оси ординат — проценты
Пример фильтрации одного из исходных изображений показан на рис. 2. Общее количество подготовленных изображений составило 1288 (1 неотфильтрованное + 6 отфильтрованных х 184).
Рис. 2. Примеры стимулов. Вверху показано исходное изображение.
Цифрами обозначены частоты фильтрации (в цикл./л.)
Порядок предъявления стимулов. Каждое предъявление начиналось с демонстрации целевого лица. Этот стимул имел переменную длительность и ограничивался маской. Затем показывались 4 сравниваемых (тестовых) изображения, экспозиция которых не ограничивалась. Целевые и тестовые стимулы отличались полосой пространственных частот. Когда целевые стимулы были широкополосными (неотфильтрованными), тестовые стимулы были узкополосными (отфильтрованными), и наоборот (рис. 3). Результаты сопоставления неотфильтрованных целевых стимулов с неотфильтрованными тестовыми стимулами использовались в качестве контрольных.
Рис. 3. Примеры изображений, использованных в экспериментах 1(А) и 2(Б): А — частота фильтрации тестовых стимулов 7 цикл./л., Б — частота фильтрации целевого стимула 56 цикл./л.
Дизайн эксперимента. Анализ дисперсий повторных измерений (ANOVA) проводился с использованием дизайна 7 х 5. Факторами были: (а) пространственная ЧАСТОТА изображения (полный спектр, 0,5, 1, 2, 4, 8 и 16 цикл./град.), (б) ВРЕМЯ экспозиции целевого стимула (2, 4, 6, 8 и 10 кадровых разверток). Оба фактора были внутрисубъектными. Зависимой переменной является точность решения задачи (в процентах правильных ответов).
Процедура. Перед экспериментом испытуемые инструктировались и проходили тренинг, а экспериментатор убеждался в том, что задача понята правильно.
Испытуемый располагался таким образом, чтобы расстояние от глаз до экранов составляло 115 см. Фоновая освещенность в экспериментальном помещении составляла 160 люкс.
Предъявление каждого очередного целевого стимула запускалось самим испытуемым нажатием клавиши «пробел» на клавиатуре. Стимул появлялся в центре левого монитора. Экспозиция варьировала случайным образом в диапазоне от 2 до 10 кадровых разверток с шагом 2 кадровые развертки (1 кадровая развертка — 13,33 мс). Последовательность целевых стимулов была также случайной. Целевой стимул сменялся маской. Время предъявления маски было постоянным и составляло 15 кадровых разверток. Маска каждый раз выбиралась случайным образом из набора лиц (117 изображений), которые не использовались в качестве стимулов. После исчезновения маски через 1 с появлялись 4 тестовых изображения (по 2 на каждый монитор). Они выбирались случайно из набора изображений, имеющих определенный частотный спектр, а также пол, совпадающий с полом целевого лица. Одно из этих изображений обязательно соответствовало целевому лицу, три остальные были лицами других людей. Среди тестовых изображений испытуемый должен был выбрать то лицо, которое предъявлялось перед маской. Решение сообщалось с помощью нажатия одной из клавиш с цифрами от 1 до 4 в зависимости от порядкового номера выбранного лица слева направо. В случае ошибочного решения подавался короткий звуковой сигнал. Следующее испытание запускалось также самим испытуемым.
Результаты каждого испытуемого накапливались в течение нескольких дней. Длительность одного сеанса не превышала 20 минут. Сеансы проводились в одно и то же время при отсутствии жалоб испытуемого на утомление и состояние здоровья. Для каждого сочетания ВРЕМЕНИ (5 проб) и ЧАСТОТЫ (7 проб) было сделано по 60 проб. Таким образом, общий объем эксперимента для каждого испытуемого составлял 2100 проб (35*60). При этом каждый испытуемый принял участие в двух экспериментах.
Испытуемые. В общей сложности в исследовании на добровольной основе приняли участие 8 человек — 4 человека (3 женщины) — в экспериментах 1 и 2, и 4 человека (3 женщины) — в экспериментах 3 и 4. Все испытуемые имели нормальное или скорректированное до нормы зрение. Участники исследования были информированы о цели эксперимента и убеждались в безопасности процедуры. Исследование проводилось с соблюдением этических норм, в полном соответствии c Хельсинским соглашением, и было одобрено местной комиссией по этике.
Обработка данных. Сначала для каждого испытуемого определялись зависимости между процентом правильных сопоставлений целевого и тестового стимула и временем предъявления целевого стимулов для каждой используемой частоты фильтрации. Результаты, полученные для каждого из 4 испытуемых, анализировались совместно посредством двухфакторного ANOVA с повторными измерениями.
Перед использованием ANOVA проводилось тестирование полученных нами распределений на их нормальность и равенство дисперсий. Метод Шапиро—Уилка не дал оснований для отвержения гипотезы о нормальности. В то же время, поскольку гипотеза о сферичности, предполагающая равенство дисперсий при повторных измерениях, во всех случаях была отвергнута, нами был использован метод Хюнха—Фельдта для коррекции р-уровней.
По результатам дисперсионного анализа определялись величина и статистическая значимость главных эффектов (ЧАСТОТА и ВРЕМЯ) и эффекта взаимодействия. Затем путем апостериорного анализа, выполняемого методом Тьюки, попарно сравнивались все полученные зависимости.
Результаты
Эксперимент 1
В данном эксперименте определялась зависимость процента правильных сопоставлений от экспозиции целевых лиц в условиях запоминания в КП широкополосного лица. Кривые были получены для каждой ПЧ тестовых изображений и контроля. Все испытуемые продемонстрировали сходную динамику показателей. Усредненные результаты эксперимента 1 показаны на рис. 4А.
Как и следовало ожидать, увеличение экспозиции приводит к росту процента правильных решений. При этом рост показателей примерно одинаков для тестовых стимулов с ПЧ 1, 2, 4 и 8 цикл./град. и незначительно отличается от контрольных измерений. В то же время эффективность сопоставления для лиц с ПЧ 0,5 и 16 цикл./град. была заметно ниже контрольной.
Анализ данных с использованием дисперсионного анализа (F=1.194, p=0,2772) показал, что у большинства полученных зависимостей наклон одинаков (эффект взаимодействия факторов ЧАСТОТА и ВРЕМЯ статистически незначим).
Рис. 4. Результаты экспериментов 1(А) и 2(Б), усредненные по четырем испытуемым. Здесь и на следующем рисунке: на оси абсцисс — длительность стимула в кадровых развертках, на оси ординат — процент правильных сопоставлений; обозначения кривых: цифрами обозначены пространственные частоты отфильтрованных лиц (цикл./град.), К — контрольное измерение (сравнение широкополосных изображений). Вертикальными линиями показана стандартная ошибка среднего
В табл. 1 (как и в последующих таблицах) приведены результаты апостериорного сравнения полученных зависимостей точности решения задачи от времени экспозиции целевого стимула. Семь зависимостей, полученных в эксперименте 1, сравниваются каждая с каждой. Указанные в таблице значения являются р-уровнями критерия Тьюки. Жирным шрифтом выделены статистически значимые различия.
Апостериорный анализ указывает на то, что полученные кривые разбиваются на 2 группы. В одну группу входят контрольные данные и 4 зависимости, полученные при сопоставлении целевых стимулов с лицами, имеющими частоту 1,2 , 4 и 8 цикл./ град. В другую — кривые, полученные для тестовых стимулов с ПЧ 0,5 и 16 цикл./ град. При этом в каждой из групп полученные значения статистически не различаются. Вместе с тем, значимые различия отсутствуют и между показателями, полученными для ПЧ 1 и 16 цикл./град. Это связано с тем, что кривая для 1 цикл./град , располагается ниже остальных в первой группе, а кривая для 16 цикл./град. — верхняя во второй группе.
Таблица 1
Апостериорная обработка результатов эксперимента 1 методом Тьюки
ПЧ тестовых изображений (в цикл./град) |
широко-полосные |
0,5 |
1 |
2 |
4 |
8 |
0,5 |
0,0002 |
|
||||
1 |
0,0623 |
0,0002 |
|
|||
2 |
0,3726 |
0,0002 |
0,9338 |
|
||
4 |
0,8357 |
0,0002 |
0,5190 |
0,9793 |
|
|
8 |
0,2800 |
0,0002 |
0,9749 |
0,1000 |
0,9425 |
|
16 |
0,0003 |
0,0548 |
0,0852 |
0,0103 |
0,0019 |
0,0155 |
Результаты свидетельствуют о том, что зависимости, полученные для ПЧ 1, 2, 4 и 8 цикл./град. не отличаются как между собой, так и от контрольных значений. В то же время эффективность решения задачи при использовании крайних частот (0,5 и 16 цикл./ град.) оказалась ощутимо ниже.
Эксперимент 2
В этом эксперименте мы изменили порядок стимулов: теперь целевыми изображениями были отфильтрованные лица, а тестовыми — неотфильтрованные. Таким образом, отличие этого эксперимента от предыдущего состояло лишь в том, что теперь в КП должно было запоминаться не широкополосное, а узкополосное лицо. Однако полученный результат поменялся кардинально (рис. 4Б).
В целом произошедшие изменения можно охарактеризовать достаточно кратко: показатели относительно контрольных значений существенно снизились. Более того, зависимости, полученные для разных ПЧ, расположились на графике в определенной последовательности. Ближе к контрольным значениям находятся кривые, полученные для ПЧ 4 и 2 цикл./град. Под ними располагаются еще две кривые — для стимулов с ПЧ 8 и 1 цикл./ град. Ниже всех, чуть выше уровня случайных решений, находятся зависимости для ПЧ 0,5 и 16 цикл./град.
Обнаружено значимое взаимодействие между главными эффектами (F=9.9656, p=0,0000). Дисперсионный анализ указывает на то, что наклон функций для разных ПЧ, в отличие от эксперимента 1, стал различным.
Попарное сравнение зависимостей (табл. 2) демонстрирует, что наблюдаемое ухудшение идентификации отфильтрованных лиц по сравнению с контролем статистически значимо для всех ПЧ, но выражено в разной степени. В большей мере это коснулось ПЧ 1 и 8 цикл./град., в меньшей степени — 2 и 4 цикл./град. В то же время внутри этих пар различия отсутствуют. Значения, полученные для ПЧ 0,5 и 16 цикл./град., не включены в апостериорный анализ по причине очевидности результата.
Таблица 2
Апостериорная обработка результатов эксперимента 2 методом Тьюки
ПЧ тестовых изображений (в цикл./град) |
широко-полосные |
1 |
2 |
4 |
1 |
0,0002 |
|
||
2 |
0,0431 |
0,0211 |
|
|
4 |
0,0298 |
0,0306 |
1,0000 |
|
8 |
0,0002 |
1,0000 |
0,0230 |
0,0334 |
Таким образом, когда в КП сохраняется узкополосное лицо, его сопоставление с широкополосными лицами дает более низкий процент правильных решений по сравнению с обратной ситуацией. Кроме того, показатели для разных ПЧ становятся различными.
Сравнивая в двух экспериментах стимулы с одними и те же частотными характеристиками, мы получили совершенно различный результат в зависимости от того, ка - кое изображение (широкополосное или узкополосное) сохраняется в кратковременной памяти. Очевидно, что точность сопоставления лиц зависит от того, какое количество совпадающей информации содержится в сравниваемых (реальном и отфильтрованном) изображениях. Это количество остается неизменным в неограниченных по времени тестовых стимулах, но меняется в целевых изображениях. При этом лимитирующими факторами являются количество информации, переданной в КП за время экспозиции, и количество информации, сохраненной в КП до момента принятия решения о совпадении изображений.
Общее ухудшение результата в эксперименте 2 говорит о том, что в узкополосных изображениях сохраняется меньше полезной для сопоставления информации, чем в широкополосных. Поскольку широкополосное лицо исходно содержит больше информации, чем узкополосное, то и разрушаться эта информация будет дольше [10; 36].
Вопрос о том, почему ухудшение результата оказалось разным для разных ПЧ, является более сложным. Скорее всего его нельзя объяснить разной скоростью разрушения в КП информации разной пространственной частоты, поскольку это противоречит имеющимся данным [15]. Скорее, это может быть связано с разным количеством полезной информации, передаваемой в КП из разных диапазонов пространственных частот в единицу времени. Если исходить из данного предположения, то полученный результат объясняется следующим образом. Быстрее всего в КП накапливается полезная информация из диапазона средних частот, обрабатываемых путями с настройкой на 2 и 4 цикл./град. Несколько медленнее идет накопление информации, передаваемой путями с настройкой на 1 и 8 цикл./ град. Пути, настроенные на самую низкую и самую высокую частоту (0,5 и 16 цикл./град.), полезную информацию практически не выделяют.
Таким образом, полученные результаты свидетельствуют об опережающем накоплении в КП информации из диапазона средних пространственных частот. Но в данном случае речь идет о запоминании и сопоставлении именно лиц. Считается, что процесс идентификации лиц отличается от распознавания объектов и опирается главным образом на целостное описание лица [1; 5; 15; 27; 39; 40]. Объекты же оцениваются на основе отдельных признаков. Меняется ли при этом порядок поступления в КП информации из разных пространственно-частотных путей? Чтобы ответить на этот вопрос, мы инвертировали лица. Конечно, изображения при этом не перестают быть лицами, но характер их описания меняется с целостного на признаковый [8, 19]. Особенно важно, что такая манипуляция не меняет физические характеристики стимулов, использованных в предыдущих экспериментах.
Эксперимент 3
Этот эксперимент повторял эксперимент 1 за одним исключением: все изображения были инвертированы. Как и в эксперименте 1, большинство зависимостей, полученных в эксперименте 3, также имеют сходный наклон (F=1.446, p=0,1175).
Чтобы сравнить результаты экспериментов 1 и 3, мы вновь использовали ANOVA, введя при этом дополнительный межсубъектный фактор (ОРИЕНТАЦИЯ лица). Главный эффект был значим (F=37,012, p=0,0009). Это свидетельствует о том, что показатели в эксперименте 1 в целом выше, чем в эксперименте 3. Однако взаимодействие факторов ЧАСТОТА — ВРЕМЯ — ОРИЕНТАЦИЯ оказалось слабым (F=0,8911, p=0,06136), что не позволяет сделать вывод о каких-либо существенных различиях в распределении экспериментальных кривых.
Итак, на фоне общего снижения показателей, вызванного инверсией лиц, результат в значительной степени повторил тот, что был получен в эксперименте 1 (рис. 5А). Это согласуется с данными других авторов о том, что и при целостной и при признаковой обработке используются одни и те же ПЧ [12, 34]. При этом, как и при использовании нормально ориентированных лиц, полученные кривые разбиваются на 2 группы (табл. 3).
Отличие состоит в том, что данные для ПЧ 16 цикл./град. теперь занимают как бы промежуточное положение: они значимо не отличаются ни от контроля, ни от показателей для ПЧ 0,5 цикл./град., которые значимо ниже контрольных. Это изменение связано, по- видимому, с тем, что при признаковом описании изображения большее информационное значение приобретают более высокие пространственные частоты, что согласуется с имеющимися результатами [14; 20; 30; 33]. Тем не менее, как и в эксперименте с нормально ориентированными лицами, после инверсии крайние частоты (0,5 и 16 цикл./град.) продолжают уступать другим ПЧ в информативности.
Рис. 5. Результаты экспериментов 3(А) и 4(Б), усредненные по четырем испытуемым. Обозначения те же, что и на рис. 4
Таблица 3
Апостериорная обработка результатов эксперимента 3 методом Тьюки
ПЧ тестовых изображений (в цикл./град) |
широко-полосные |
0,5 |
1 |
2 |
4 |
8 |
0,5 |
0,0011 |
|
||||
1 |
0,6641 |
0,0292 |
|
|||
2 |
1,0000 |
0,0017 |
0,8021 |
|
||
4 |
0,9919 |
0,0041 |
0,9589 |
0,9993 |
|
|
8 |
0,8237 |
0,0161 |
1,0000 |
0,9219 |
0,9935 |
|
16 |
0,1164 |
0,2750 |
0,8752 |
0,1800 |
0,3553 |
0,7318 |
Эксперимент 4
Данный эксперимент был повторением эксперимента 2, но с использованием инвертированных лиц. Как и в эксперименте 2, в эксперименте 4 наклон зависимостей для разных ПЧ был разным (F=3.741, p=0,0002).
Проведя сравнение результатов, полученных в экспериментах 2 и 4, с использованием межсубъектного фактора ОРИЕНТАЦИЯ лиц, мы обнаружили, что как этот главный эффект (F=2,7119, p=0,1507), так и эффект взаимодействия ЧАСТОТА — ВРЕМЯ — ОРИЕНТАЦИЯ (F=1,1289, p=0,3202), оказались незначимыми.
Таким образом, результаты эксперимента 4 также в значительной степени повторили результаты эксперимента 2 (рис. 5Б). Их попарное сравнение (табл. 4) вновь продемонстрировало значимое преимущество контрольных показателей. Зависимости, полученные для разных ПЧ, снова выстроились в той же последовательности, хотя различия между ними уменьшились. Если при использовании нормально ориентированных лиц кривые группируются попарно (2+4 и 1+8 цикл./град.), то при инверсии стимулов эти пары сближаются. И связано это, в первую очередь, с улучшением показателей для ПЧ 8 цикл./град.
Таблица 4
Апостериорная обработка результатов эксперимента 4 методом Тьюки
ПЧ тестовых изображений (в цикл./град) |
широко-полосные |
1 |
2 |
4 |
1 |
0,0003 |
|
||
2 |
0,0363 |
0,0258 |
|
|
4 |
0,0127 |
0,0730 |
0,9701 |
|
8 |
0,0005 |
0,9397 |
0,0917 |
0,2394 |
Такой результат вновь может объясняться повышением информационной значимости более высоких частот. Несмотря на некоторые изменения, очередность полученных зависимостей в порядке убывания эффективности решения задачи повторяет ту, что мы получили в эксперименте с нормально ориентированными лицами. Быстрее эффективность растет для ПЧ 2 и 4 цикл./град., медленнее — для 8 и 1 цикл./град.
Таким образом, инверсия лиц не повлияла на очередность считывания информации разной пространственной частоты в КП. Это говорит о том, что обнаруженная последовательность перевода информации из перцептивной репрезентации в КП скорее всего не зависит от того, какое описание, целостное или признаковое, используется при опознании. В любом случае приоритет имеют средние пространственные частоты.
Обсуждение результатов
В проведенном исследовании мы ставили цель определить последовательность поступления в КП информации о лице из зрительных путей с разной пространственно-частотной настройкой. Получить ответ на этот вопрос удалось сравнив результаты экспериментов 1 и 2. Эксперимент 1 показал, что все частоты, кроме самой низкой (0,5 цикл./град.) и самой высокой (16 цикл./град.), содержат информацию, полезную для решения задачи сопоставления незнакомых лиц. В то время как эксперимент 2 позволил выявить разную скорость накопления в КП полезной информации из разных диапазонов пространственных частот. В результате оказалось, что 4 зрительных пути из 6 способны выделять из входного изображения информацию, полезную для идентификации лиц. При этом в КП с некоторым опережением передается информация из диапазона средних частот (2 и 4 цикл./град.), а затем накапливается более низкочастотная (1 цикл./град.) и более высокочастотная (8 цикл./ град.) информация.
Полученные нами результаты не согласуются с данными Gao и Bentin [16], которые пришли к выводу о приоритетном поступлении в КП низкочастотной информации. Объясняется это расхождение, по всей видимости, тем, что в наших экспериментах мы использовали более дробное деление пространственно-частотного диапазона. Gao и Bentin в своих экспериментах разделили частотный диапазон лишь на 2 половины. При этом в низкочастотную половину спектра попала большая часть частотного диапазона (8—16 цикл./л.), эффективного в задаче распознавания лиц [13, 41]. В наших экспериментах этот диапазон пришелся на пути со средней пространственно-частотной настройкой, и полученный нами результат выглядит вполне логично с точки зрения целесообразности опережающего запоминания более важной информации. Последовательность «от грубого к тонкому», реализуемая на перцептивном уровне, целесообразна с точки зрения последовательного анализа зрительной сцены: сначала ее грубой сегментации, затем выделения отдельных объектов, и лишь после этого — их обработки. Но нет смысла заносить в память информацию обо всей окружающей обстановке, если нужно запомнить конкретный объект. Именно на интересующий нас объект направляется внимание испытуемого, и именно эта информация поступает в КП. Оказалось также, что установленная последовательность передачи информации в КП фактически не зависит от того, используется целостное или признаковое описание входного изображения. Этот результат подтверждает мнение о том, что информация из диапазона средних пространственных частот более важна при восприятии любых изображений [2; 6; 13; 41].
Заключение
Полученные нами результаты позволяют прийти к следующим выводам.
Несмотря на то, что обработка на перцептивном уровне начинается с низких пространственных частот, при запоминании лиц первоочередной доступ к КП получают информация из диапазона средних пространственных частот.
Приоритет средних частот сохраняется и после инверсии лиц, а значит не зависит от алгоритма обработки (целостное или признаковое описание входного изображения).
Литература
- Барабанщиков В.А., Жегалло А.В., Иванова Л.А. Распознавание экспрессий перевернутого изображения лица // Экспериментальная психология. 2010. Т. 3. № 3. С. 66—83.
- Шелепин Ю.Е. Введение в нейроиконику. СПб.: Троицкий мост, 2017. 352 с.
- Arsenault E., Yoonessi A., Baker C. Higher order texture statistics impair contrast boundary segmentation // J Vis. 2011. Vol. 11. № 10. P. 14. doi:10,1167/11.10,14
- Ashby F.G. Multidimensional models of perception and cognition. Psychology Press, 2014. 544 p.
- Behrmann M., Richler J.J., Avidan G., et al. Holistic face perception // Oxford handbook of perceptual organization. 2015. P. 758—774.
- Boulkenafet Z., Komulainen J., Hadid A. Face Spoofing Detection Using Colour Texture Analysis // IEEE Transactions on Information Forensics and Security. 2016. Vol. 11. № 8. P. 1818—1830, doi:10,1109/ TIFS.2016.2555286
- Brown C., Portch E., Skelton F.C., et al. The impact of external facial features on the construction of facial composites // Ergonomics. 2019. P. 1—18. doi:10,1080/00140139.2018.1556816
- Carbon C.-C., Leder H. When feature information comes first! Early processing of inverted faces. // Perception. 2005. Vol. 34. № 9. P. 1117—1134. doi:10,1068/p5192
- Carrasco M., Penpeci-Talgar C., Eckstein M. Spatial covert attention increases contrast sensitivity across the CSF: support for signal enhancement // Vision Res. 2000. Vol. 40. № 10—12. P. 1203—1215.
- Chaudhuri R., Fiete I. Computational principles of memory // Nat. Neurosci. 2016. Vol. 19, № 3. P. 394— 403. doi:10,1038/nn.4237
- Cohen E.H., Schnitzer B.S., Gersch T.M., et al. The relationship between spatial pooling and attention in saccadic and perceptual tasks // Vision Res. 2007. Vol. 47. № 14. P. 1907—1923. doi:10,1016/j. visres.2007.03.018
- Collin C.A., Rainville S., Watier N., et al. Configural and featural discriminations use the same spatial frequencies: a model observer versus human observer analysis // Perception. 2014. Vol. 43. № 6. P. 509— 526. doi:10,1068/p7531
- Collin C.A., Therrien M., Martin C., et al. Spatial frequency thresholds for face recognition when comparison faces are filtered and unfiltered // Percept Psychophys. 2006. Vol. 68. № 6. P. 879—889.
- Dimitriou D., Leonard H.C., Karmiloff-Smith A., et al. Atypical development of configural face recognition in children with autism, Down syndrome and Williams syndrome // J Intellect Disabil Res. 2015. Vol. 59, № 5. P. 422—438. doi:10,1111/jir.12141
- Finzi R.D., Susilo T., Barton J.J.S., et al. The role of holistic face processing in acquired prosopagnosia: evidence from the composite face effect // Visual Cognition. 2016. Vol. 24. № 4. P. 304—320, doi:10,1080/ 13506285.2016.1261976
- Gao Z., Bentin S. Coarse-to-fine encoding of spatial frequency information into visual short-term memory for faces but impartial decay. // J Exp Psychol Hum Percept Perform. 2011. Vol. 37. № 4. P. 1051—1064. doi:10,1037/a0023091
- Gaspar C., Sekuler A.B., Bennett P.J. Spatial frequency tuning of upright and inverted face identification. // Vision Res. 2008. Vol. 48, № 28. P. 2817—2826. doi:10,1016/j.visres.2008.09.015
- Gold J., Bennett P.J., Sekuler A.B. Identification of band-pass filtered letters and faces by human and ideal observers. // Vision Res. 1999. Vol. 39. № 21. P. 3537—3560, doi:10,1016/S0042-6989(99)00080-2
- Hayward W.G., Crookes K., Chu M.H., et al. Holistic processing of face configurations and components // J Exp Psychol Hum Percept Perform. 2016. Vol. 42. № 10, P. 1482—1489. doi:10,1037/xhp0000246.
- Jennings B.J., Yu Y., Kingdom F.A.A. The role of spatial frequency in emotional face classification // Atten Percept Psychophys. 2017. Vol. 79. № 6. P. 1573—1577. doi:10,3758/s13414-017-1377-7
- Johnson A.P., Prins N., Kingdom F.A.A., et al. Ecologically valid combinations of first- and second-order surface markings facilitate texture discrimination // Vision Res. 2007. Vol. 47. № 17. P. 2281—2290, doi:10,1016/j.visres.2007.05.003
- Kamps F.S., Morris E.J., Dilks D.D. A face is more than just the eyes, nose, and mouth: fMRI evidence that face-selective cortex represents external features // Neuroimage. 2019. Vol. 184. P. 90—100, doi:10,1016/j. neuroimage.2018.09.027
- Kauffmann L., Chauvin A., Guyader N., et al. Rapid scene categorization: role of spatial frequency order, accumulation mode and luminance contrast. // Vision Res. 2015. Vol. 107. P. 49—57. doi:10,1016/j. visres.2014.11.013
- Musel B., Kauffmann L., Ramanoël S., et al. Coarse-to-fine categorization of visual scenes in scene-selective cortex // J Cogn Neurosci. 2014. Vol. 26. № 10, P. 2287—2297. doi:10,1162/jocn_a_00643
- Näsänen R. Spatial frequency bandwidth used in the recognition of facial images // Vision Research. 1999. Vol. 39. № 23. P. 3824—3833. doi:10,1016/S0042-6989(99)00096-6
- Olzak L.A., Thomas J.P. Neural recoding in human pattern vision: model and mechanisms // Vision Res. 1999. Vol. 39. № 2. P. 231—256.
- Ouyang S., Hospedales T.M., Song Y.-Z., et al. ForgetMe№t: Memory-Aware Forensic Facial Sketch Matching // The IEEE Conference on Computer Vision and Pattern Recognition (CVPR). 2016. P. 5571— 5579.
- Parker D.M., Costen N.P. One extreme or the other or perhaps the golden mean? Issues of spatial resolution in face processing // Current Psychology. 1999. Vol. 18. № 1. P. 118—127. doi:10,1007/s12144-999-1021-3
- Peli E., Lee E., Trempe C.L., et al. Image enhancement for the visually impaired: the effects of enhancement on face recognition. // J Opt Soc Am A Opt Image Sci Vis. 1994. Vol. 11. № 7. P. 1929—1939.
- Peters J.C., Vlamings P., Kemner C. Neural processing of high and low spatial frequency information in faces changes across development: qualitative changes in face processing during adolescence // Eur. J. Neurosci. 2013. Vol. 37. № 9. P. 1448—1457. doi:10,1111/ejn.12172
- Petras K., Ten Oever S., Jacobs C., et al. Coarse-to-fine information integration in human vision // Neuroimage. 2019. Vol. 186. P. 103—112. doi:10,1016/j.neuroimage.2018.10,086
- Ramon M., Vizioli L., Liu-Shuang J., et al. Neural microgenesis of personally familiar face recognition // Proc. Natl. Acad. Sci. U.S.A. 2015. Vol. 112. № 35. P. E4835-4844. doi:10,1073/pnas.1414929112
- Rohr M., Tröger J., Michely N., et al. Recognition memory for low- and high-frequency-filtered emotional faces: Low spatial frequencies drive emotional memory enhancement, whereas high spatial frequencies drive the emotion-induced recognition bias // Mem Cognit. 2017. Vol. 45. № 5. P. 699—715. doi:10,3758/s13421- 017-0695-2
- Royer J., Willenbockel V., Blais C., et al. The influence of natural contour and face size on the spatial frequency tuning for identifying upright and inverted faces // Psychol Res. 2017. Vol. 81. № 1. P. 13—23. doi:10,1007/s00426-015-0740-3
- Ruiz-Soler M., Beltran F.S. Face perception: an integrative review of the role of spatial frequencies // Psychol Res. 2006. Vol. 70, № 4. P. 273—292. doi:10,1007/s00426-005-0215-z
- Sakai K., Inui T. A feature-segmentation model of short-term visual memory. // Perception. 2002. Vol. 31. № 5. P. 579—589. doi:10,1068/p3320
- Tanaka J.W., Sung A. The «Eye Avoidance» Hypothesis of Autism Face Processing // J Autism Dev Disord. 2016. Vol. 46. № 5. P. 1538—1552. doi:10,1007/s10803-013-1976-7
- Thomas S.R., Barsalou N. Applying Human Spatial Vision Models to Real-World Target Detection and Identification: A Test of the Wilson Model // Vision Models For Target Detection And Recognition: In Memory of Arthur Menendez. World Scientific, 1995. P. 219—244.
- Tobin A., Favelle S., Palermo R. Dynamic facial expressions are processed holistically, but not more holistically than static facial expressions // Cogn Emot. 2016. Vol. 30. № 6. P. 1208—1221. doi:10,1080/02 699931.2015.1049936
- Van Rheenen T.E., Joshua N., Castle D.J., et al. Configural and Featural Face Processing Influences on Emotion Recognition in Schizophrenia and Bipolar Disorder // J Int Neuropsychol Soc. 2017. Vol. 23. № 3. P. 287—291. doi:10,1017/S1355617716001211
- Williams N.R., Willenbockel V., Gauthier I. Sensitivity to spatial frequency and orientation content is not specific to face perception. // Vision Res. 2009. Vol. 49. № 19. P. 2353—2362. doi:10,1016/j. visres.2009.06.019
- Wilson H.R., Gelb D.J. Modified line-element theory for spatial-frequency and width discrimination. // J Opt Soc Am A. 1984. Vol. 1. № 1. P. 124—131.
Информация об авторах
Метрики
Просмотров
Всего: 599
В прошлом месяце: 4
В текущем месяце: 18
Скачиваний
Всего: 249
В прошлом месяце: 3
В текущем месяце: 2