Влияние признака в зрительной рабочей памяти на быструю зрительную категоризацию множества объектов

Д.А. Кох; Д.В. Люсин

doi:10.17759/exppsy.2026190104

Введение

Зрительная сцена состоит из множества признаков, которые преобразуются в объекты, группы и категории. Количество признаков и объектов в зрительной сцене превышает пропускную способность нашего избирательного внимания и рабочей памяти (Luck, Vogel, 2013; Rosenholtz, 2017). Тем не менее мы обрабатываем значительное количество информации с целью снижения неопределенности в процессе зрительного поиска (Морозов, Спиридонов, 2019; Ungerleider, Bell, 2011; Wolfe, 2020). Данная «избыточная» информация формируется в компактную репрезентацию статистических свойств множества, или ансамбль (Фаликман, Уточкин, 2016; Яковлев, Тюрина, Уточкин, 2020; Corbett, Utochkin, Hochstein, 2024; Whitney, Leib, 2018). Репрезентация сводной статистики ансамбля возможна как для низкоуровневых признаков, так и для высокоуровневых. К числу низкоуровневых признаков относятся размер (Ariely, 2001), угол наклона (Attarha, Moore, 2015), скорость (Watamaniuk, Duchon, 1992), цвет (Chetverikov, Campana, Kristjánsson, 2017; Maule, Witzel, Franklin, 2014). Высокоуровневые признаки могут включать среднюю интенсивность эмоции (Dandan et al., 2022) и даже среднюю экономическую ценность множества объектов (Leib, Kosovicheva, Whitney, 2016). Благодаря репрезентации ансамбля мы способны формировать общее впечатление о зрительной сцене (Brady, Shafer-Skelton, Alvarez, 2017) и оценивать вариативность признака (Chetverikov, Kristjánsson, 2024). Это упрощает обработку зрительной информации, позволяя быстро оценивать и принимать решения на основе обобщенной картины (Тюрина, Уточкин, 2014; Cohen, Dennett, Kanwisher, 2016; Cui, Liu, 2021).

Репрезентация сводной статистики ансамбля играет важную роль в процессе быстрой зрительной категоризации (Utochkin, 2015). Быстрая зрительная категоризация позволяет оперативно оценивать и классифицировать визуальную информацию в зрительной сцене, что способствует разделению большого количества объектов на группы. Исследования показывают, что данный процесс основывается на параллельной и прямой обработке зрительных стимулов, что позволяет зрительной системе практически мгновенно категоризировать объекты и сцены, не требуя избирательного внимания к отдельным деталям. Вероятно, такая высокая скорость категоризации обусловлена обработкой информации по магноцеллюлярному пути, который характеризуется грубой обработкой зрительной информации (Fabre-Thorpe, 2011).

В контексте исследования процесса быстрой зрительной категоризации с точки зрения восприятия сводной статистики ансамбля, можно охарактеризовать механизм формирования перцептивных категорий для множества объектов. Так, репрезентация ансамбля формируется на основе распределения признаков внутри группы объектов, обладающих определенной вариативностью этих признаков. Середина такого распределения будет представлять собой среднее для всей группы объектов. Если же вариативность признака будет слишком большой, то объекты, у которых значение признака существенно отклоняется от среднего, могут восприниматься либо как выбросы в распределении, не учитываемые в нем (Epstein et al., 2020), либо приводить к образованию нескольких подгрупп в множестве в результате формирования двух различных распределений. Пик или середина распределения признака, которое обычно соответствует нормальному распределению, далее представляет собой наиболее типичный признак в группе объектов. Иными словами, чем ближе объекты в распределении признака, тем лучше они «объединяются» в единую категорию (Карпинская, Владыкина, Шилов, 2015; Ester, Sprague, Serences, 2020). С другой стороны, для двух достаточно удаленных друг от друга распределений происходит четкое формирование двух подгрупп в множестве объектов. Тем не менее перцептивная категоризация чаще представляет собой «плохо» определяемую категориальную границу из-за отсутствия эксплицитных правил для такой категоризации. Таким образом, количество пиков распределений и их удаленность друг от друга будут определять количество подгрупп в множестве объектов (Im, Tiurina, Utochkin, 2021). Исследования быстрой зрительной категоризации продемонстрировали, что для категоризации используются не только количество пиков и их удаленность, но и среднее значение в группе. Так, среднее значение может являться категориальной границей для определения принадлежности объектов к той или иной подгруппе (к примеру, к группе больших или малых кругов) внутри всего ансамбля, т. е. всех предъявляемых объектов (Im, Tiurina, Utochkin, 2021) (рис. 1).

Рис. 1. Пример репрезентации ансамбля с различной категоризацией: (А) множество индивидуальных объектов с распределением какого-либо признака; (Б) формирование ансамбля или нескольких ансамблей; красная линия указывает на удаленность пиков распределений друг от друга; (В) множество объектов, которые по одному признаку репрезентируются в ансамбль (ориентация), тогда как по другому признаку (цвет) — в две подгруппы

Fig. 1. An example of ensemble representation with different categorizations: (A) a set of individual objects with the distribution of some feature; (Б) formation of an ensemble or several ensembles; the red line indicates the distance between distribution peaks; (В) a set of objects that are represented as an ensemble by one feature (orientation), whereas another feature (color) into two subgroups

Прямых исследований, посвященных влиянию когнитивных процессов на быструю зрительную категоризацию, не проводилось. Однако косвенные выводы о влиянии зрительной рабочей памяти (зРП) на восприятие ансамбля можно сделать на основе работы Williams с соавторами (Williams et al., 2021). В данном исследовании участники эксперимента должны были определить средний угол наклона ансамбля линий, который был разделен на две подгруппы по цвету. Дополнительной задачей для участников было запомнить цвет фигуры, представленной в начале каждой экспериментальной пробы. Результаты предыдущих экспериментов свидетельствуют о том, что совпадение или отсутствие совпадения цвета фигуры с подгруппой в ансамбле оказывало влияние на смещение среднего значения в сторону данной подгруппы (Williams et al., 2021). Объяснение данного результата основывается на эффекте преувеличения (Kanaya, Hayashi, Whitney, 2018), при котором определенные объекты из ансамбля оказывают более значительное влияние на формирование его репрезентации.

Несмотря на большое количество исследований в области быстрой зрительной категоризации, влияние признака в зРП на формирование категориальной границы остается неизвестным, именно поэтому наше исследование сосредоточено на анализе влияния признаков в зРП на быструю зрительную категоризацию множества объектов. Данный процесс важен как для социального взаимодействия, так и для первичных перцептивных процессов, которые, в свою очередь, служат основой для принятия решений (Freedman, Assad, 2011). Большая неопределенность, возникающая в процессе быстрой зрительной категоризации, может приводить к тому, что когнитивная система стремится снизить уровень неопределенности в процессе категоризации, используя нерелевантную для задачи информацию, которая присутствует в перцептивных признаках множества объектов. Основываясь на результатах вышеупомянутых исследований, мы предполагаем, что категориальная граница, которая является средним признаком в группе, смещается в сторону подгруппы, совпадающей признаком с признаком в зРП. Несмотря на первоначальную схожесть идеи Williams и соавторов (Williams et al., 2021) с нашей работой, работа коллег была направлена на исследование влияния удержания признака в зРП на перцептивное усреднение, тогда как наш эксперимент акцентирован на процессе быстрой зрительной категоризации, а именно на изменении категориальной границы. Мы предполагаем, что с увеличением неопределенности относительно категоризируемого тестового стимула возрастает влияние зРП на процесс быстрой зрительной категоризации — таким образом, наибольший эффект будет именно в условии с тестовым стимулом, совпадающим углом наклона со средним всего ансамбля.

Материалы и методы

Выборка. В эксперименте приняло участие 33 человека в возрасте от 21 до 47 лет (M = 26,4, SD = 10,7), из них 89% женщины. Ввиду нашей основной манипуляции, направленной на исследование влияния признака в зРП, мы исключили из дальнейшего анализа испытуемых с менее чем 70-процентной точностью ответов. Конечный анализ происходил по данным 31 человека в возрасте от 23 до 47 лет (M = 27,6, SD = 8,1), из них 86% женщины. Все участники имели нормальное или скорректированное зрение, также у них отсутствовали психоневрологические заболевания. Общее время прохождения эксперимента составляло от 70 до 90 минут.

Инструментарий. Эксперимент проводился с использованием программы PsychoPy 2022.2.4 на ноутбуке HP Pavilion Gaming Laptop 17 с разрешением экрана 1920 × 1080 140 Hz. Каждый участник выполнял эксперимент в затемненной комнате. Всего участники эксперимента прошли 596 проб, где 36 были тренировочными, после каждых 140 экспериментальных проб участник мог отдохнуть. Каждая экспериментальная проба состояла из двух задач на зрительную рабочую память и на быструю зрительную категоризацию. В начале каждой пробы в центре экрана участнику предъявлялся на 1000 мс фиксационный крест, на котором нужно было фиксировать взгляд. Далее предъявлялся на 500 мс цветной квадрат размером 2.3° × 2.3° зрительного угла для запоминания. После предъявлялись две подгруппы треугольников в невидимой матрице 6 × 6, где каждый треугольник был размером 0.68° × 1.35° зрительного угла. Каждая подгруппа состояла из 18 треугольников, расположенных таким образом, что местоположение каждого треугольника из одной подгруппы не повторяло местоположение треугольников из другой подгруппы. Время предъявления каждой подгруппы составляло 500 мс. За этим следовал отчет в задаче быстрой зрительной категоризации, где участникам нужно было определить, к какой подгруппе треугольников принадлежит тестовый треугольник (клавиша влево — первая подгруппа, клавиша вправо — вторая подгруппа). Угол наклона тестового треугольника варьировался от среднего всего предъявляемого ансамбля, т. е. к среднему всего ансамбля добавлялось ± 0, 7, 15 и 34 градуса. Наибольший эффект смещения категориальной границы ожидался в условии предъявления тестового треугольника с углом наклона, соответствующего среднему углу наклона всего ансамбля и совпадения цвета с какой-либо подгруппой. Время на ответ ограничивалось 7 секундами. В конце пробы участнику предъявлялся тестовый цветной квадрат, относительно которого нужно было ответить о совпадении или несовпадении цвета с цветным квадратом в начале пробы (клавиши вверх при совпадении, клавиша вниз при несовпадении). Схему полной экспериментальной пробы можно увидеть на рис. 2.

Рис. 2. Схематическое изображение одной экспериментальной пробы с полным прохождением задачи на быструю зрительную категоризацию и зрительную рабочую память

Fig. 2. Schematic image of one experimental trial with full completion of the rapid visual categorization and visual working memory tasks

Результаты

В данной работе исследовалось, как удержание признака в зРП влияет на формирование категориальной границы, когда одна из подгрупп имеет схожий перцептивный признак с удерживаемым в зРП. Доля правильных ответов составила 88,3%, доля неправильных — 11,7%, поэтому мы можем утверждать, что признак в зРП действительно удерживался и респонденты не отвечали случайным образом. Для ответа на вопрос о смещении категориальной границы нами были построены модель порядковой логистической регрессии (ответ участника ~ условие отклонение угла наклона (7) * условие группы (2)) и график психометрической функции, который показывает изменение категориальной границы двух подгрупп в различных условиях выполнения задачи (рис. 3).

Исходя из рис. 3 можно заключить, что в условиях отсутствия совпадения признака респонденты определяли категориальную границу со смещением в сторону второй подгруппы. При совпадении признака с первой подгруппой категориальная граница определялась без смещения в ту или иную сторону. При совпадении признака со второй подгруппой категориальная граница определялась со смещением в сторону второй подгруппы. Результаты построения модели ординарной логистической регрессии представлены в табл. 1 и 2.

Таблица 1 / Table 1

Модель ординарной логистической регрессии

Ordinal logistic regression model

Модель /

Model

Отклонение /

Deviance

АИК /

AIC

Степени свободы /

df

X²

p

McFadden R²

H0

19966

16897

14408

0

1

0

H1

16855

13756

14397

1961,841

<0,001

0,196

Исходя из значений, полученных в ходе построения ординарной логистической регрессии, можно зафиксировать, что в представленной модели имеется статистически значимая связь между предикторами и зависимой переменной (X² = 1961,841, p < 0,001). Модель объясняет 19% дисперсии зависимой переменной (McFadden R² = 0,196). Значение АИК модели H1 (13756) меньше, чем в модели H0 (16897), это подтверждает эффективность модели H1 по сравнению с моделью H0. Следовательно, это позволяет осуществлять дальнейшую работу с моделью.

Таблица 2 / Table 2

Коэффициенты порядковой логистической регрессии

Ordinal logistic regression coefficients

Переменная / Variable	ОШ OR	ДИ (95%) CI (95%)	z-оценка z-value	p
Отклонение угла наклона –15 / Tilt deviation –15	1,6	1,43; 1,79	7,816	<0,001
Отклонение угла наклона –7 / Tilt deviation –7	2,36	2,09; 2,61	14,086	<0,001
Отклонение угла наклона 0 / Tilt deviation 0	2,94	2,63; 3,29	17,831	<0,001
Отклонение угла наклона 7 / Tilt deviation 7	3,42	3,06; 3,82	20,512	<0,001
Отклонение угла наклона 15 / Tilt deviation 15	4,57	4,08; 5,11	25,579	<0,001
Отклонение угла наклона 34 / Tilt deviation 34	7,12	6,32; 8,02	30,488	<0,001
Отклонение –7, совпадение цвета со 2-й подгруппой / Tilt –7, color match with 2nd subgroup	0,8	0,67; 1,01	–1,669	0,05
Отклонение 0, совпадение цвета со 2-й подгруппой / Tilt 0, color match with 2nd subgroup	0,8	0,68; 1,03	0,128	0,08
Отклонение –7, совпадение цвета с 1-й подгруппой / Tilt –7, color match with 1st subgroup	0,83	0,69; 1,01	–1,88	0,06

Примечание: в таблице отсутствуют значения p > 0,1. ОШ — отношение шансов, ДИ — доверительные интервалы.

Note: values with p > 0.1 are omitted. OR — odds ratio, CI — confidence intervals.

Проведение порядковой логистической регрессии позволило зафиксировать, что статистически значимый коэффициент влияния признака был обнаружен при: условии отклонения угла наклона -15 (z = 8,16, p < 0,001), условии отклонения угла наклона -7 (z = 15,09, p < 0,001), условии отклонения угла наклона 0 (z = 19,15, p < 0,001), условии отклонения угла наклона 7 (z = 21,67, p < 0,001), условии отклонения угла наклона 15 (z = 26,62, p < 0,001), условии отклонения угла наклона 34 (z = 32,31, p < 0,001). Была обнаружена связь на границе статистической значимости в случае, если признак в зрительной рабочей памяти был в условии минус 7 градусов от среднего с совпадением цвета со второй подгруппой (z = -1,669, p = 0,05), нулевым отклонением от среднего (z = 0,128, p = 0,08) и отклонением минус 7 градусов с совпадением цвета с первой подгруппой (z = -1,88, p = 0,06). Остальные варианты условия не достигли уровня статистической значимости.

Исходя из вышеприведенных результатов мы предполагаем, что при определении подгруппы участники формируют репрезентацию ансамбля, руководствуясь углом наклона. Если бы участники не формировали репрезентацию ансамбля, то, во-первых, точность ответов была бы на уровне случайного угадывания (примерно 50%). Во-вторых, результаты регрессии не показали бы увеличения вероятности ответа в сторону одной из групп относительно предъявляемых тестовых треугольников. Главная же экспериментальная манипуляция с поддержанием признака в зРП указала на то, что, при условии совпадения признака в зРП с подгруппой в ансамбле, участник с большей вероятностью отвечал в сторону данной подгруппы, когда тестовый стимул был максимально приближен к среднему всего ансамбля, либо в условии минимального отклонения (-7 градусов). Данные результаты можно интерпретировать как сдвиг в категориальной границе при восприятии множества объектов. Однако мы не получили статистически значимых результатов в условии совпадения признака в зРП с первой подгруппой, когда тестовый стимул совпадал со средним углом наклона ансамбля.

Обсуждение результатов

Целью данного исследования было изучение влияния признака в зрительной рабочей памяти на процесс быстрой зрительной категоризации множества объектов. В ходе эксперимента мы манипулировали цветом стимула в задаче зРП для того, чтобы рассмотреть влияние удержания признака на процесс быстрой зрительной категоризации. Мы предполагали, что это приведет к смещению категориальной границы в задаче быстрой зрительной категоризации. Новизна нашего исследования заключается в анализе того, будет ли категориальная граница изменяться под воздействием хранящегося в зРП признака, нерелевантного для задачи быстрой зрительной категоризации.

Результаты показали, что репрезентация среднего из ансамбля используется как категориальная граница для определения принадлежности к той или иной подгруппе (Im, Tiurina, Utochkin, 2021), т. е. угол наклона самого тестового стимула был первичным признаком для определения категориальной принадлежности (табл. 2). Основная манипуляция с удержанием признака в зРП оказывала влияние на определение категориальной границы, когда тестовый стимул был наиболее близок к среднему всего ансамбля или максимально близок к этому среднему. Хотя мы не получили статистически значимых различий в условии тестового стимула со средним углом наклона всего ансамбля в сторону первой подгруппы, небольшое отклонение тестового стимула в сторону этой подгруппы и совпадение признака уже влияло на ответ в быстрой зрительной категоризации. Вероятно, что преимущество второй подгруппы связано с эффектом последовательности предъявления, т. е. репрезентация последней предъявляемой подгруппы была менее зашумлена для участников, поэтому они отвечали чаще в пользу этой подгруппы. В ходе эксперимента мы старались нивелировать этот эффект случайной последовательностью предъявлений для участника, однако данный эффект полностью убрать не удалось. Такое преимущество второй подгруппы может быть связано скорее с кратковременной памятью, чем с быстрой категоризацией множества объектов как таковой. Таким образом, результаты могут интерпретироваться как результат перцептивного научения, когда люди начинают отвечать в сторону той или иной подгруппы, тем самым частично нивелируя эффект неопределенности в этом условии (Wolfe, 2020).

С другой стороны, удержание признака в зРП при высоком уровне неопределенности, а именно наиболее близком угле наклона тестового стимула к углу наклона всего ансамбля, приводило к большей вероятности ответа в сторону совпадающей признаком подгруппы зРП, создавая паттерн сдвига на уровне статистической тенденции. Это указывает на то, что продолжающаяся дискуссия в области исследований категоризации между теориями прототипа и экземпляра должна быть дополнена влиянием сторонних процессов, как зРП (Smith, 2014).

С точки зрения классических теорий категоризации на основе прототипа и экземпляра, результаты нашей манипуляции должны были проявиться на разных стадиях эксперимента. Согласно теории экземпляра (Ashby, Rosedahl, 2017), обучение в процессе решения задачи категоризации должно было способствовать успешному выполнению этой задачи. При этом нерелевантные для категоризации признаки, удерживаемые в зрительной рабочей памяти, не должны оказывать влияния на ответы в задаче категоризации. Результаты указывают, скорее, на малое влияние признака в зРП, когда можно было полагаться в ответе лишь на угол наклона тестового стимула, но не в условии наиболее близкого угла наклона к всему ансамблю. С другой стороны, прототип представляет собой высокоуровневую абстракцию среднего значения группы, что соответствует некоторым предположениям о механизмах формирования ансамбля (Utochkin, 2015). Поэтому участники должны были выбирать наиболее типичный объект для подгруппы, не опираясь на перцептивную схожесть группы и признаков в зРП. Это, в свою очередь, сводило на нет влияние зРП в любом варианте представления стимула. Гибридная модель, дополненная исследованиями из области восприятия ансамблей, позволит расширить рассмотрение процесса категоризации вне теорий прототипа или экземпляра, но дополнительно укажет, как другие когнитивные процессы влияют или ограничивают процесс категоризации (Fabre-Thorpe, 2011).

Недостаточно сильное влияние манипуляции в контексте быстрой зрительной категоризации может быть обусловлено ограничениями нашего исследования, связанными с числом участников, что, в свою очередь, привело к возможной недостаточной мощности анализа. Мы не получили полноценного подтверждения нашей гипотезы, однако паттерн полученных результатов соответствует ей на уровне статистической тенденции. Данное смещение могло возникнуть в результате различий в формировании распределения признака, обусловленных механизмом избирательного внимания, который приоритизировал одну из подгрупп с наибольшей перцептивной схожестью с информацией, находящейся в зРП (Sun et al., 2015). Такой частичный отбор наиболее релевантной подгруппы аналогичен механизму сэмплинга при усреднении, когда лишь часть объектов в группе участвуют в перцептивном усреднении (Myczek, Simons, 2008).

Влияние распределенного и избирательного внимания на формирование репрезентации ансамбля является предметом активной дискуссии (Baek, Chong, 2020а; Chong, Evans, 2011). К примеру, некоторые исследования указывают на то, что распределенное внимание способствует извлечению сводной статистики, которая, на основе теории быстрой зрительной категоризации (Im, Tiurina, Utochkin, 2021; Utochkin, 2015), используется для формирования категориальной границы. Теория сэмплинга основывается на избирательном внимании и неспособности нашей когнитивной системы обрабатывать большое количество объектов одновременно, тем самым предполагая важность избирательного внимания в механизме усреднения (Baek, Chong, 2020б; Whitney, Leib, 2018). Исследования влияния распределенного и избирательного внимания на быструю зрительную категоризацию показали сравнительно схожие результаты для простых признаков (Brand, Johnson, 2018), оставляя открытым вопрос важности внимания в быстрой зрительной категоризации.

Помимо результатов поведенческих экспериментов, исследования, проведенные с использованием нейровизуализационных методов, продемонстрировали, что внимание, направленное на признак (feature-based attention), может изменять модуляцию как первичных областей зрительной коры (Yoo et al., 2022), так и высокоуровневых областей (Jackson et al., 2017). Вероятно, применение аналогичного подхода для изучения изменений категориальных границ, вызванных удержанием признаков в рабочей памяти, позволит углубить понимание нейронных механизмов, лежащих в основе быстрой зрительной категоризации и восприятия ансамблей.

Развитие представленной идеи о влиянии признака в зрительной рабочей памяти на изменение категориальной границы может основываться на манипуляциях с количеством объектов в подгруппах (Kim, Chong, 2020; Levari et al., 2018). В нашем исследовании, как и в классических экспериментах, обычно используются эквивалентные по количеству объектов подгруппы. Однако в реальных условиях равное количество объектов чаще всего является результатом скорее маловероятным, нежели естественным. В подтверждение этого Levari с коллегами (Levari et al., 2018) провели эксперимент, в котором изменение количества цветных точек определенного оттенка влияло на ответы участников относительно принадлежности тестового стимула. Мы предполагаем, что неравномерное количество стимулов в группах будет оказывать влияние на формирование категориальной границы. Результаты такого исследования могут подтвердить выводы Chong и Kim (Kim, Chong, 2020), согласно которым подравнивание двух ансамблей происходило значительно легче и точнее, когда они были равны по признакам и количеству объектов.

Заключение

Таким образом, по результатам проведенного исследования мы можем сделать следующие выводы:

Категориальная граница в задаче категоризации определяется как середина распределения признака.
Совпадение признака в зрительной рабочей памяти и ансамбле способствует более быстрому реагированию в задачах, связанных со зрительной рабочей памятью, однако замедляет скорость ответа в задачах быстрой зрительной категоризации.

Ограничения. Недостаточно сильное влияние манипуляции в контексте быстрой зрительной категоризации может быть обусловлено ограничениями нашего исследования, связанными с числом участников, что, в свою очередь, привело к возможной недостаточной мощности анализа.

Limitations. The insufficiently strong effect of the manipulation in the context of rapid visual categorization may be due to limitations of our study related to the number of participants, which in turn may have led to insufficient statistical power.

Влияние признака в зрительной рабочей памяти на быструю зрительную категоризацию множества объектов

Резюме

Общая информация

Полный текст

Введение

Материалы и методы

Результаты

Обсуждение результатов

Заключение

Литература

Информация об авторах

Вклад авторов

Конфликт интересов

Декларация об этике

Метрики

Просмотров web

Скачиваний PDF

Всего