Экспериментальная психология
2015. Том 8. № 2. С. 5–20
doi:10.17759/exppsy.2015080202
ISSN: 2072-7593 / 2311-7036 (online)
Исследование краудинг-эффекта для стимулов низкого контраста и большого размера в центре поля зрения
Аннотация
Общая информация
Ключевые слова: опознание, краудинг-эффект, кольцо Ландольта, критическое расстояние, интеграция признаков, внимание
Рубрика издания: Психология восприятия
Тип материала: научная статья
DOI: https://doi.org/10.17759/exppsy.2015080202
Для цитаты: Бондарко В.М., Данилова М.В., Солнушкин С.Д., Чихман В.Н. Исследование краудинг-эффекта для стимулов низкого контраста и большого размера в центре поля зрения // Экспериментальная психология. 2015. Том 8. № 2. С. 5–20. DOI: 10.17759/exppsy.2015080202
Полный текст
В 30-е гг. прошлого века вышел в свет цикл работ Вудроу, посвященный изучению восприятия стимулов, состоящих из двух или четырех букв, различным образом расположенных в поле зрения и предъявляемых на 0,1 с. Изменялось расстояние между буквами, их взаимное расположение и группировка. Была обнаружена достоверная разница в ответах на двух- и четырехбуквенные слова, и автор предположил, что эту разницу можно объяснить конфигурацией самого паттерна. На основании полученных результатов был сформулирован следующий вывод - выявленный феномен зависит от: 1) распределения внимания, 2) смешиваемости или «торможения узнавания», являющегося результатом пространственной близости букв, и 3) степени видимости букв (Woodrow, 1938). Этот вывод формулирует основные факторы, которые вносят вклад в работу механизма краудинг-эффекта.
Наиболее изучен краудинг-эффект на пределе разрешения зрительной системы. В основополагающей работе Флома и его коллег (Flom, Weymouth, Kahneman, 1963) изучалось влияние четырех симметрично расположенных полос на определение ориентации кольца Ландольта. Варьировали расстояние между полосами и кольцом. Было показано, что при расстояниях, меньших размера минимально видимого кольца, наблюдается ухудшение зрительного восприятия. При больших расстояниях окружающие полосы не влияют на опознание центрального стимула. Зоны взаимодействия, измеряемые в угловых минутах, различаются у разных наблюдателей, но их размер одинаков, если выражать расстояние между тестом и дистракторами в относительных единицах размера теста. Такая закономерность справедлива для восприятия и распознавания объектов любым наблюдателем с любой остротой зрения, и для наблюдателей с нормальной остротой размер зоны взаимодействия составляет 2-4 угловые минуты. Ухудшение невозможно объяснить только оптическим фактором или влиянием тормозных взаимодействий на уровне сетчатки, поскольку предъявление тестового стимула одному глазу, а окружения - другому также приводит к ухудшению восприятия стимула на тех же расстояниях (Flom, Heath, Takahashi, 1963). По мнению Флома и соавторов, в основе этого явления должна лежать работа нейрофизиологического механизма, которая осуществляется на уровне не ниже стриарной коры, поскольку только на этом уровне происходит объединение зрительных сигналов, приходящих от обоих глаз.
В дальнейших исследованиях было показано, что что в центре поля зрения для стимулов больших размеров краудинг-эффект не наблюдается при использовании высококонтрастных цифр (Strasburger, Harvey, Rentchler, 1991), но выявляется при измерении контрастных порогов обнаружения и распознавания (Ehrt, Hess, 2005), а также в случае распознавания таких стимулов, как отфильтрованные буквы (Chung, Levi, Legge, 2001; Levi, Klein, Hariharan, 2002). При измерении контрастных порогов свойства краудинг-эффекта различаются для стимулов больших и малых размеров: окружение оказывает аналогичное воздействие на обнаружение и различение колец Ландольта большого размера в отличие от случая малых и средних размеров изображений, когда на обнаружение стимула окружение действует слабее, чем на различение (Ehrt, Hess, 2005).
Несмотря на большое количество исследований, до сих пор не существует удовлетворительного объяснения феномена краудинг-эффекта (обзоры: Atkinson,1991; Flom, 1991, Levi, 2008; Pelli, Palomares, Majaj, 2004; Strasburger, Rentschler, Juttner, 2011). Возможно, это связано с тем, что различия в изображениях и условиях их предъявления обусловливают различия в механизмах, задействованных в распознавании объектов. В своем обзоре Флом (Flom, 1991) подчеркивает, что взаимодействие между контурами представляет собой более простое явление, которое, скорее всего, наблюдается в случае попадания окружения и стимула в одни и те же рецептивные поля нейронов первичной зрительной коры. Краудинг-эффект - более сложный феномен, в возникновение которого вносят вклад как факторы взаимодействия между контурами изображений, так и факторы направленности внимания при распознавании более сложных объектов.
Краудинг-эффект характеризуют изменения двух параметров: 1) критическое расстояние - расстояние между тестовыми и окружающими изображениями (дистракторами), в пределах которого дополнительные изображения достоверно ухудшают распознавание теста; 2) амплитуда - степень ухудшения распознавания теста, предъявляемого с дистрактором, по сравнению с распознаванием изолированного теста. Пелли и Тиллман (Pelli, Tillman, 2008) высказали предположение, что критическое расстояние и амплитуда краудинг-эффекта, скорее всего, взаимосвязаны: чем больше амплитуда, тем больше критическое расстояние.
Как сказано выше, в фовеа на пределе разрешения критическое расстояние мало, пропорционально остроте зрения наблюдателя и составляет величину в пределах диаметра тестового кольца Ландольта (Flom, Weymouth, Kahneman, 1963). Если рассматривать критическое расстояние как расстояние между краями предъявляемых изображений, то на пределе разрешения при нормальной остроте зрения для высококонтрастных стимулов оно составляет в угловых единицах величину 2-4 угл. мин, что было подтверждено последующими исследованиями (Бондарко, Данилова, 1996; Danilova, Bondarko, 2007; Hess, Jacobs, 1979). В случае, когда тестами являлись прямоугольные решетки, критическое расстояние удваивалось, если окружающие дополнительные решетки имели случайную ориентацию, в отличие от случая предъявления дополнительных решеток с фиксированной ориентацией (Данилова, Бондарко, 2002; Danilova, Bondarko, 2007). Даже незначительное увеличение размера высококонтрастного тестового стимула от величины предела разрешения приводит к уменьшению критического расстояния до 1 угловой минуты, что соответствует ширине оптической функции рассеяния (Danilova, Bondarko, 2007). В подобных условиях предъявления стимулов экспериментаторы (Strasburger, Harvey, Rentchler, 1991) не обнаружили краудинг-эффекта для высококонтрастных дистракторов при использовании в качестве тестовых изображений цифр размером 3,8 угл. мин и больше. Но следует отметить, что они не использовали достаточно малое расстояние между тестом и дистрактором. При использовании в качестве тестов отфильтрованных изображений букв при измерении контрастных порогов опознания исследователи обнаружили, что величина критического расстояния пропорциональна размеру теста (Levi, Klein, Hariharan, 2002), и сделали вывод, что в этом случае фовеальный краудинг-эффект является латеральной маскировкой. Также результаты многочисленных исследований свидетельствуют о том, что критическое расстояние зависит от контраста окружения: низкий контраст окружения приводит к уменьшению критического расстояния (Chung, Levi, Legge, 2001). Таким образом, при предъявлении тестовых объектов в центре поля зрения отмечается большая вариабельность значений критического расстояния в зависимости от условий проведения экспериментов и используемых стимулов.
При изучении краудинг-эффекта на периферии Коои и др. (Kooi et al., 1994), Бернард и Чанг (Bernard, Chung, 2011) показали, что ухудшение распознавания зависит от формы дистракторов: отличающиеся от теста по форме дистракторы, предъявляемые на одном и том же расстоянии между изображениями, обусловливают меньший краудинг-эффект. Исследования с использованием различных дистракторов в центре поля зрения были проведены только на пределе разрешения зрительной системы при предъявлении высококонтрастных изображений. Их результаты оказались неоднозначными (Бондарко, Данилова, 2002; Данилова, Бондарко, 2002; Danilova, Bondarko, 2007). Для тестовых колец Ландольта существенных различий в амплитуде и критических расстояниях, зависящих от формы используемых дистракторов (кольца Ландольта, полосы и прямоугольные решетки) не было выявлено. В случае распознавания таких стимульных объектов, как тестовые прямоугольные решетки, критические расстояния оказались большими при окружении их решетками той же пространственной частоты. Аналогичные исследования специфики распознавания тестовых изображений больших размеров, предъявляемых в центре поля зрения, не проводились. Между тем их результаты могли бы помочь исследователям оценить все имеющиеся гипотезы, объясняющие возникновение краудинг-эффекта, и отдать предпочтение какой-либо из них.
В своей предыдущей работе (Бондарко и др., 2014) при изучении краудинг-эффекта на периферии мы показали достоверное ухудшение восприятия на всех используемых нами в экспериментах расстояниях от тестов до дистракторов. Максимальное расстояние до дополнительных изображений было равно эксцентриситету стимула. В этом случае дополнительное изображение появлялось в центре экрана, а тестовое - справа или слева от центра на расстоянии, равном 13,2 угл. град. Таким образом, критическое расстояние оказалось большим или равным эксцентриситету, что значительно превосходит общепризнанное расстояние: согласно правилу Боума (Bouma, 1970), взаимодействие между тестом и окружением на периферии проявляется на расстоянии, равном половине эксцентриситета. В отличие от ранее проведенных исследований мы использовали тесты и дистракторы большого размера, но с пороговыми контрастами для каждого эксцентриситета. Мы полагали, что одинаковая плохая видимость изображений усложнит задачу наблюдателей, что может привести к увеличению критических расстояний. Мы предъявляли низкоконтрастные стимулы с размерами, намного превышающими предел разрешения для данного эксцентриситета.
В настоящей работе мы продолжили эти исследования. Стимулы, а также их характеристики, такие как размер и контраст, были аналогичны стимулам и их характеристикам, предъявляемым на периферию зрительного поля (Бондарко и др., 2014). Аналогичным был метод предъявления тестового стимула - стимул был либо одиночный, либо с одним дис-трактором. Мы полагали, что в таких условиях полученные критические расстояния могут оказаться намного больше, чем были получены ранее. В отличие от исследования специфики распознавания объекта, предъявляемого на периферию зрительного поля в настоящей работе мы проанализировали отдельно данные для разных по форме дистракторов, поскольку такие работы, по нашим сведениям, никем ранее не проводились. Для изучения взаимосвязи критического расстояния, амплитуды краудинг-эффекта и формы дистракто-ров в центре поля зрения мы использовали в качестве тестов низкоконтрастные неотфильтрованные кольца Ландольта больших размеров, а в качестве дистракторов - аналогичные кольца Ландольта и сплошные кольца без разрыва такого же размера.
Таким образом, цель настоящей работы заключалась в исследовании влияния различных по форме дистракторов на распознавание предъявляемых в центре поля зрения тестовых изображений, по размеру значительно превосходящих предел разрешения. В результате мы обнаружили, что распознавание тестов при использовании аналогичных по форме дистракторов ухудшается при большем расстоянии между тестом и дополнительным изображением, чем то расстояние, величина которого была зафиксирована другими исследователями. Отличающиеся по форме дистракторы ухудшили распознавание только при соприкосновении с тестом, как было показано ранее Эртом и Хессом (Ehrt, Hess, 2005).
Методика
Аппаратура. Стимулы были синтезированы на компьютере в цифровом виде с помощью специально разработанной программы и предъявлялись наблюдателям на мониторе Mitsubishi Diamond Plus 230SB с размером диагонали 22” при разрешении экрана 1024*768 пикселей и частотой вертикальной развертки 100 Гц. Калибровка монитора выполнялась с помощью спектрорадиометра JETI. Яркость экрана составила 40 кд/м2.
Стимулы. Тестовые изображения представляли собой низкоконтрастные кольца Ландольта со стандартными пропорциями, т. е. размер разрыва и ширина кольца составляли 1/5 диаметра кольца. В разных экспериментальных сессиях мы использовали размеры тестовых колец с диаметром 1,1; 1,5 и 2,2 угл. град. В качестве дистракторов использовали либо идентичные по форме кольца Ландольта, либо сплошные кольца без разрыва такого же размера. Ориентация у тестовых колец Ландольта и дистракторов менялась независимо друг от друга. На рис. 1 представлены примеры этих изображений. Тестовое кольцо имело более низкий контраст, чем дистракторы, у которых контраст был шкалирован и менялся в зависимости от расстояния до тестового кольца Ландольта.
Рис. 1. Примеры изображений, использованных в исследовании.
Вверху - тестовые кольца Ландольта с точкой фиксации в центре. Дистракторы (дополнительные изображения) в виде кольца без разрыва или кольца Ландольта отличаются большим контрастом изображения. Внизу - временная последовательность предъявления изображений на экране
Процедура. Исследование состояло из двух этапов. На первом этапе в предварительных экспериментах методом «лестницы 3-1» были определены контрастные пороги различения ориентации колец Ландольта в зависимости от эксцентриситета. Метод лестницы заключался в том, что при трех правильных ответах контраст изображения уменьшался в 1,26 раз (на 0,1 логарифмической единицы), а при одном неправильном ответе контраст увеличивался на ту же величину. Для нахождения порога определяли средние значения контраста изображения в точках перегиба. Значения пороговых контрастов были определены при накоплении 40 перегибов для каждого наблюдателя в разные экспериментальные дни (Бондарко и др., 2014). Полученные таким образом контрастные пороги соответствуют 79,4 % правильных ответов на психометрической кривой (Wetherill, Levitt, 1965). Время предъявления колец Ландольта составляло 40 мс. При большем времени наблюдатели распознавали изображения большого размера в центре практически без ошибок даже при минимальных контрастах. Для каждого наблюдателя отдельно были измерены контрастные пороги для стимулов двух размеров.
Вторая часть исследования состояла их двух серий, основные отличия между которыми состояли в размерах предъявляемых стимулов. Предъявляли или только тестовые, или тестовые изображения с дистракторами. Все изображения были шкалированы по уровню контраста относительно пороговых значений. С увеличением расстояния до теста контраст изображений дистракторов возрастал согласно определенным ранее порогам. Стимулы предъявлялись бинокулярно с расстояния 57 см до экрана.
Каждое предъявление начиналось с появления точки фиксации размером 0,2 угл. град. и контрастом 0,1 в центре экрана, сопровождавшегося звуковым сигналом. Наблюдатель получал инструкцию смотреть на точку фиксации, которая оставалась на экране до конца предъявления теста. Через 100 мс в центре экрана появлялось либо тестовое кольцо Ландольта меньшего контраста без дистрактора, либо тестовое кольцо с одиночным дис-трактором. Длительность стимула составляла 40 мс. Наблюдатель должен был ответить, какую ориентацию имеет тестовое кольцо. После ответа наблюдателя точка фиксации появлялась на экране через 1 с (рис. 1).
Дистрактор появлялся слева или справа от точки фиксации случайным образом на расстоянии от одного до двух диаметров тестового кольца между центрами изображений. Расстояние между тестом и дистрактором менялось с шагом, равным 0,2 диаметра тестового кольца. При минимальном расстоянии тестовое кольцо и дистрактор соприкасались, при максимальном - расстояние между краями составляло диаметр кольца.
Использовали процедуру четырехальтернативного вынужденного выбора: наблюдатель для идентификации ориентации предъявляемого кольца Ландольта нажимал одну из клавиш со стрелками на клавиатуре компьютера. Для случаев одновременного со стимулом предъявления дистрактора в половине случаев это было аналогичное кольцо Ландольта, а в половине - кольцо без разрыва. В данной экспериментальной сессии изолированное кольцо Ландольта предъявлялось такое же число раз, как в предыдущей.
Эксперименты с разным размером тестового стимула проводились в один день в случайном порядке. Всего было проведено по 20 повторений каждого эксперимента каждым испытуемым в разные экспериментальные дни. Для каждого расстояния между тестом и дис-трактором тестовое изображение предъявлялось в четырех ориентациях, дистрактор в виде аналогичного кольца также предъявлялся независимо в 4-х ориентациях; их комбинация составила 16 предъявлений. Столько же раз тест предъявлялся в присутствии дополнительного сплошного кольца без разрыва. Таким образом, в каждом эксперименте было получено 32 ответа на стимул в присутствии дистрактора на каждом расстоянии или на изолированный стимул, а после проведения 20 повторений одного и того же эксперимента - 640 ответов.
Анализ данных. На первом этапе анализа данных в каждом эксперименте подсчитывались вероятности правильных ответов определения ориентации тестового кольца Ландольта на каждом расстоянии до дистракторов и ориентации изолированного стимула, затем эти вероятности были усреднены по всем 20 экспериментам. Критическое расстояние определяли путем попарного сравнения вероятностей правильных ответов на предъявление стимулов в виде изолированного тестового кольца Ландольта и тестового кольца в присутствии дистрактора. Использовали i-критерий Стьюдента для сравнения вероятностей в каждом эксперименте и критерий Хи-квадрат для усредненных вероятностей по всем экспериментам. За критическое расстояние принималось максимальное расстояние между тестом и дистрактором, при котором вероятности распознавания ориентации достоверно отличались на уровне значимости 5 %.
Наблюдатели. В экспериментах приняли участие четыре наблюдателя с нормальной или скорректированной остротой зрения. Все наблюдатели имели значительный опыт участия в психофизических экспериментах, но не были осведомлены о целях данного исследования. Наблюдателю S3 предъявлялись кольца Ландольта с диаметром 1,5 и 2,2 угл. град., а наблюдателям S1, S2 и S4 - с диаметром 1,1 и 1,5 угл. град.
Исследование было одобрено Этическим комитетом СПбГУ.
Результаты
Критическое расстояние. На рис. 2 показана вероятность правильных ответов распознавания ориентации центрального кольца Ландольта в зависимости от расстояния между центрами теста и дистрактора.
Рис. 2. Вероятность распознавания тестовых объектов в зависимости от расстояния до дистракторов.
Приведены данные наблюдателей S1, S2, S3 и S4. Кривые 1, 2 соответствуют предъявлению тестового стимула меньшего и большего размеров. Изолированные точки слева - вероятности правильного различения тестового стимула без дополнительного изображения
Данные приведены отдельно для каждого наблюдателя и каждого размера теста, но результаты усреднены для всех случаев, когда предъявлялся дистрактор - слева или справа от тестового стимула. Полученные нами кривые похожи на классические кривые, приведенные Фломом (Flom, 1991) для краудинг-эффекта в фовеальном поле зрения на пределе разрешения: минимальный процент правильных ответов обнаружен при минимальном расстоянии дистрактора от тестового стимула. С увеличением расстояния распознавание улучшается, но в нашем случае не достигает уровня, который был продемонстрирован испытуемыми при распознавании стимулов в виде изолированного кольца Ландольта в той же экспериментальной сессии.
Использование критерия Хи-квадрат для определения критического расстояния позволило рассчитать значения критических расстояний между объектом и дистрактором: а) наблюдатель S1 - критическое расстояние величиной 1,4 и 1,2 от размера тестового кольца; б) наблюдатель S2 - 1,8 и 1,4; в) наблюдатель S3 - 1,6 для обоих размеров колец, и, наконец, г) наблюдатель S4 - 1,2 также для обоих размеров тестовых изображений. Таким образом, среднее значение критического расстояния равно величине 1,475 от тестового стимула до дистрактора. При применении критерия Стьюдента было получено схожее среднее критическое расстояние 1,375. Данная величина не является такой малой, какие были получены другими исследователями (Ehrt, Hess, 2005; Levi, Klein, Hariharan, 2002), она сравнима с величиной 1,5, полученной Чанг и др. (Chung, Levi, Legge, 2001) при исследовании особенностей распознавания и оценки отфильтрованных букв.
Схожесть теста и дистрактора. На рис. 3 представлены результаты анализа вероятности правильных ответов при распознавания ориентации тестового стимула относительно дистрактора в зависимости от расстояния между ними (отдельно для каждого вида дис-тракторов). Кривые, описывающие результаты распознавания и оценки тестового стимула в случае присутствия в качестве дополнительного изображения аналогичного кольца Ландольта, расположены на графике ниже кривых, описывающих результаты распознавания и оценки тестового стимула в случае предъявления его с дистрактором в виде сплошного кольца без разрыва. Такого рода данные свидетельствует о том, что в случае предъявления тестового стимула с дистракторами одной с тестовым стимулом формы амплитуда краудинг-эффекта больше, чем в случае, когда формы тестового стимула и дистрактора различаются. Критическое расстояние также увеличивается в случае схожего с тестом дис-трактора. Результаты распознавания и оценки стимулов наблюдателем S3, полученные методом анализа Хи-квадрат, указывают на достоверные различия между ответами на изолированный тест и на тест в присутствии дополнительного кольца Ландольта при любом расстоянии между тестовым стимулом и дистрактором и любом размере тестового стимула. Аналогичный результат был получен при анализе данных распознавания и оценки стимулов наблюдателями S2 и S4 при размере теста 1,5 угл. град. В этих случаях за величину критического расстояния было принято значение наибольшего расстояния между тестовым стимулом и дистрактором, т. е. значение, равное двойному размеру тестового стимула.
Рис. 3. Вероятность распознавания тестовых объектов в зависимости от типа дистрактора и расстояния до дистрактора
Приведены данные наблюдателей S1, S2, S3 и S4. Кривые 1, 3 соответствуют предъявлению тестового стимула с дистрактором в виде кольца Ландольта, кривые 2, 4 - с дистрактором в виде сплошного кольца. Кривые 1, 2 соответствуют предъявлению тестового стимула меньшего размера, кривые 3, 4 - большего размера
Итак, при анализе результатов распознавания стимулов испытуемыми получены следующие величины критических расстояний: а) наблюдатель S1 - критическое расстояние составляет 1,6 для размера теста 1,1 угл. град. и 1,8 - для размера 1,5 угл. град.; б) наблюдатель S2 - критическое расстояние составляет 1,8 для размера тестового стимула 1,1 угл. град; в) наблюдатель S4 - при размере тестового стимула 1,1 угл. град. критическое расстояние составляет 1,4 единицы. Среднее значение критического расстояния (по всем наблюдателям и при двух размерах теста) составило 1,825 от размера кольца Ландольта. Однако если в качестве дистрактора предъявлялось кольцо без разрыва, ухудшение распознавания происходило только в том случае, когда расстояние между тестовым стимулом и дистрак-тором было наименьшим, т. е. когда тестовый стимул и дистрактор соприкасались. Таким образом, фовеальное зрение чувствительно к отличиям по форме дистрактора от тестового стимула, о чем говорит изменение амплитуды краудинг-эффекта и величины критического расстояния.
Ошибки смешивания. На рис. 4 представлена вероятность тех ошибок, когда в качестве ориентации тестового стимула наблюдатель указывал ориентацию дистрактора.
Рис. 4. Вероятность ошибок распознавания в случае, когда в качестве ориентации теста наблюдатель указывал ориентацию дистрактора.
Пунктирной линией показан уровень вероятности для случайного ответа (1/3). Сплошной линией отмечен уровень 5 % по критерию Хи-квадрат, выше которого ошибки не случайны для каждого наблюдателя. Остальные обозначения те же, что и на рис. 2.
Ошибки вычислялись относительно всех неправильных ответов каждого наблюдателя, только когда в качестве дистрактора использовалось кольцо Ландольта. Во всех случаях ошибки достоверно отличаются от случайного уровня, который равен 1/3 (в случае четырех возможных ориентаций кольца Ландольта). На рисунке пунктирными линиями показан уровень случайных ошибок (1/3) и уровень, выше которого ошибки достоверно отличаются от случайных (р=0,05 по методу Хи-квадрат).
Следует заметить, что уровень таких ошибок практически не зависит от расстояния между тестовым стимулом и дистрактором. Ошибки не случайны и свидетельствуют, что ответы наблюдателя подвержены влиянию ориентации дистрактора.
Обсуждение
Данная работа посвящена исследованию явления краудинг-эффекта. Краудинг-эффект, как сформулировал Вудроу (Woodrow, 1938), представляет собой сложный феномен, происхождение и действие которого определяется работой нескольких механизмов зрительного восприятия. Разнообразие данных и выводов, сформулированных исследователями, объясняется различиями в условиях проведения экспериментов, запускающих действие того или иного механизма.
В настоящее время рассматриваются несколько основных гипотез для объяснения краудинг-эффекта (Levi, 2008; Pelli, Tillman, 2008; Strasburger, Rentschler, Juttner, 2011). Одна из гипотез предполагает объяснение размеров зон взаимодействия длиной связей на уровне зрительной области V1 (Pelli, 2008). Другая гипотеза (Pelli, Palomares, Majaj, 2004) предполагает двухэтапную восходящую обработку сигналов (bottom-up ‘pooling of signals’). Согласно этой гипотезе, на первом этапе выделяются простые признаки изображений, и информация о них оказывается доступной для последующей обработки, как было показано Паркес и соавторами (Parkes et al., 2001) в исследовании процесса различения ориентации элементов Габора. Задача второго этапа заключается в объединении выделенных признаков для распознавания зрительного объекта. При возникновении краудинг-эффекта такое объединение осуществляется воспринимающим субъектом не всегда правильно: происходит смешивание признаков тестового стимула и дистрактора в случае их нахождения на близком расстоянии друг от друга. Именно из-за такого смешивания распознавание тестового стимула затруднено, а схожие дистракторы могут быть приняты за тестовый стимул.
Противопоставляемая первой вторая гипотеза предполагает наличие нисходящей обратной связи, и краудинг-эффект объясняется, главным образом, функционированием избирательного внимания (top-down ‘attentional crowding’). Хе и шавторы (He, Cavanagh, Intriligator, 1996) вводят в анализ такое понятие, как разрешение внимания, и предполагают, что при каждом эксцентриситете существуют области определенного размера, которые может одновременно охватывать избирательное внимание. Краудинг-эффект является результатом невозможности направить внимание на тестовый объект в присутствии дистракторов в пределах области взаимодействия. Кроме того, рассматриваются также гипотезы о пространственном усреднении выделенных признаков (Parkes et al., 2001) и о пространственном замещении теста дистрактором (Strasburger, Rentschler, Juttner, 2011; Hanus, Vul, 2013).
При использовании дистракторов, отличающихся по форме от тестовых колец Ландольта (сплошные кольца без разрыва), мы получили результаты, свидетельствующие об ухудшении распознавания только для случаев соприкосновении тестового стимула и дистрактора. Аналогичный результат был получен также Эртом и Хессом (Ehrt, Hess, 2005) в исследовании особенностей восприятия стимульного объекта на материале распознавания колец Ландольта в окружении полосами большого размера. Однако при использовании дистракторов, идентичных тествому стимулу, мы получили данные, отличающиеся от ранее известных. Ухудшение различения ориентации тестового кольца Ландольта наблюдалось на расстояниях, которые превышают величину критического расстояния, которая была получена другими исследователями (Levi, Klein, Hariharan, 2002). Мы определяли критическое расстояние как максимальное расстояние между центрами воспринимаемых объектов, при котором правильное распознавание ориентации тестового стимула, предъявляемого с дистрактором, достоверно ниже, чем в случае предъявления изолированного стимульного объекта. В наших экспериментальных условиях критическое расстояние составило величину более 1,825 от размера тестового стимула для дистракторов, идентичных по форме тестовому кольцу Ландольта. Мы полагаем, что различия в полученных нами и другими исследователями данных обусловлены различиями в экспериментальной процедуре: 1) использование идентичных по форме или очень похожих тестовых стимулов и дистракторов; 2) короткая длительность предъявления стимулов; 3) использование стимульных изображений с низким околопороговым контрастом, уровень которого шкалировался в зависимости от эксцентриситета в соответствии с индивидуальной контрастной чувствительностью каждого наблюдателя; 4) несимметричность предъявления дистрактора по отношению к тесту. Рассмотрим влияние каждого из этих условий на результаты нашего исследования.
Схожесть теста и дистрактора. Мы использовали два дистрактора подобной формы - кольцо Ландольта и сплошное кольцо без разрыва такого же размера. Даже при этом небольшом различии в форме предъявленных объектов происходит изменение амплитуды и критических расстояний краудинг-эффекта. Этот результат подтверждает предположение Пэлли и Тиллман (Pelli, Tillman, 2008) о том, что критическое расстояние и амплитуда краудинга взаимосвязаны: различие формы тестового стимула и дистрактора приводят к уменьшению как амплитуды, так и критического расстояния. Наш результат является косвенным подтверждением гипотезы о неправильном объединении первичных признаков, так как точному распознаванию тестового стимула препятствует нахождение в зрительном поле дистрактора одной с ним формы.
Короткая длительность стимулов. При проведении экспериментов по изучению краудинг-эффекта для предъявления изображений обычно используют длительности, большие 100 мс. Ухудшение распознавания букв также наблюдается и при неограниченном времени предъявления (Townsend et al., 1971). В нашем исследовании длительность предъявления стимула составляла 40 мс. В недавно проведенном исследовании Трипати и соавторов (Tripathy, Cavanagh, Bedell, 2014) при периферийном предъявлении стимулов показано, что при изменении длительности предъявления стимульных объектов от 26,7 до 426,8 мс размеры зон взаимодействия постепенно уменьшаются. Поэтому, возможно, краткое по длительности предъявление стимулов стало причиной увеличения критического расстояния, о чем свидетельствуют результаты проведенного нами исследования.
Низкий контраст стимулов. В фовеа для высококонтрастного тестового стимула на пределе разрешения зрительной системы критическое расстояние не превышает размера тестового стимула. Но даже незначительное увеличение его размера приводит к значительному уменьшению критического расстояния до ширины оптической функции рассеяния (Danilova, Bondarko, 2007). Мы полагаем, что пороговые условия (предел разрешения, низкий контраст, малое время предъявления) приводят к возрастанию величины критического расстояния, которое может, в свою очередь, сокращаться даже при незначительном отклонении от пороговых условий. Аналогичное мнение высказывают Трипати и соавторы (Tripathy, Cavanagh, Bedell, 2014). Мы предполагаем, что околопороговый контраст тестового стимула и небольшая длительность его предъявления могут затруднять выделение первичных признаков объектов. Краткостью предъявления стимульных объектов можно также объяснить и затруднения в работе избирательного внимания.
Несимметричность предъявления дистракторов. Возможно, что увеличение критического расстояния связано и с тем, что несимметрично предъявляемый дистрактор большего контраста, чем тестовый стимул, невольно отвлекал внимание наблюдателя от распознавания последнего. Наблюдатели точно знали, где находится тестовое изображение, тем не менее, допускали неслучайные ошибки, указывая ориентацию дистрактора вместо ориентации тестового стимула. Этот результат скорее подтверждает гипотезу о значении работы внимания: дополнительный объект в зоне внимания отвлекает от основного.
При анализе ошибок смешивания в первую очередь рассматривают действие механизмов пространственного замещения (Strasburger, Rentschler, Juttner, 2011) и неправильной интеграции признаков изображений (Pelli, Palomares, Majaj, 2004). Пространственное замещение предполагает ошибку восприятия и распознавания наблюдателем пространственного расположения тестового стимула и дистрактора. Неверная интеграция признаков означает существование расширенного поля интеграции, внутри которого простые признаки комбинируются неподходящим образом, приводящим к смешиванию признаков тестового стимула и дистрактора. Подобное заключение было сделано и другими исследователями (Hanus, Vul, 2013), которые провели несколько экспериментов с вариацией расстояния между тестовым стимулом и дистрактором, сложности задачи распознавания, длительности предъявления стимулов. Никаких доказательств, которые могли бы подтвердить преимущество того или иного механизма, при анализе ошибок и моделирования/прогнозирования различий в восприятии и распознавании тестового стимула и дистрактора, не было получено. Фриманом и соавторами была предложена комбинированная модель (Freeman, Chakravarthi, Pelli, 2012), которая учитывала наличие в краудинг-эффекте как интеграции признаков воспринимаемых объектов, так и их замещения. В проведенных нами экспериментах наблюдатели имели представление о локальном положении тестового кольца Ландольта по причине нахождения внутри него точки фиксации, но, тем не менее, делали неслучайные ошибки при распознавании объектов. В этом случае допущение о действии механизма пространственного замещения кажется маловероятным, здесь, скорее, речь идет о несовершенной интеграции признаков изображений.
Таким образом, полученные нами данные не могут быть объяснены с помощью какой-либо одной из рассмотренных выше гипотез. Мы считаем, что, как и было упомянуто в начале Обсуждения, краудинг-эффект объясняется работой нескольких механизмов восприятия и распознавания объектов, поэтому рассмотренные выше гипотезы должны не противопоставляться, а дополнять друг друга.
Заключение
В созданных нами экспериментальных условиях предъявления изображений больших размеров были впервые получены данные, свидетельствующие об ухудшении распознавания ориентации колец Ландольта в ситуации изменения формы дистракторов. В нашем исследовании тестовый стимул и дистрактор располагались на большем расстоянии друг от друга, чем расстояние, на котором они предъявлялись в такого же рода экспериментах. Возможно, что на результат распознавания предъявленных объектов оказал влияние фактор внимания. Неслучайные ошибки смешивания отражают, на наш взгляд, несовершенство механизма интеграции признаков в условиях низкого контраста изображения и дефицита времени.
Литература
- Бондарко В. М., Данилова М. В. Краудинг-эффект при различном окружении и расстоянии между стимулами // Сенсорные системы. 1996. Т. 10. № 1. С. 132–140.
- Бондарко В. М., Данилова М. В. Связь краудинг-эффекта с функционированием высокочастотных пространственных элементов // Сенсорные системы. 2002. Т. 16. № 2. С. 89–99.
- Бондарко В. М., Данилова М. В., Солнушкин С. Д., Чихман В. Н. Оценка размера зоны краудинг-эффекта при периферийном предъявлении стимулов // Физиология человека. 2014. Т. 40. № 3. С. 13–21.
- Данилова М. В., Бондарко В. М. Влияние контекста на выполнение задачи различения ориентации прямоугольных решеток на пределе разрешения зрительной системы // Сенсорные системы. 2002. Т. 16. № 2. С. 100–109.
- Atkinson J. Review of human visual development: crowding and dyslexia // Vision and visual dyslexia.
- London, 1991. Р. 44–57.
- Bernard J. B., Chung S. T. L. The dependence of crowding on flanker complexity and target–flanker similarity [Электронный ресурс] // Journal of Vision. 2011. Vol. 11. P. 1–16. URL: http://www.journalofvision.org/ content/11/8/1, doi:10.1167/11.8.1 (дата обращения: 15.06.2015).
- Bouma H. Interaction effects in parafoveal letter recognition // Nature. 1970. Vol. 226. № 5241. P. 177–178. doi:10.1038/226177a0.
- Chung S. T. L., Levi D. M., Legge G. E. Spatial-frequency and contrast properties of crowding // Vision Res.
- 2001. Vol. 41. P. 1833–1850. doi:10.1016/S0042-6989(01)00071-2.
- Danilova M. V., Bondarko V. M. Foveal contour interactions and crowding effects [Электронный ресурс] // Journal of Vision. 2007. Vol. 7. P. 1–18. URL: http://journalofvision.org/17/12/25/, doi:10.1167/1167.1162.1125 (дата обращения: 15. 06. 2015).
- Ehlers H. Clinical testing of visual acuity //AMA Archives of Ophthalmology. 1953. Vol. 49. №. 4. P. 431–434. doi:10.1001/archopht.1953.00920020441007.
- Ehrt O., Hess R. Foveal contour interaction: detection and discrimination // Journal of the Optical Society of America. A. 2005. Vol. 22. P. 209–216. doi:10.1364/JOSAA.22.000209.
- Flom M. C. Contour interaction and the crowding effect // Problems in Optometry. 1991. Vol. 3. P. 237–257.
- Flom M. C., Heath G. G., Takahashi E. Contour interaction and visual resolution: contralateral effects // Science. 1963. Vol. 142. P. 979–980. doi:10.1126/science.142.3594.979.
- Flom M. C., Weymouth F. W., Kahneman D. Visual resolution and contour interaction // Journal of the Optical Society of America. 1963. Vol. 53. № 9 . P. 1026-1032. doi:10.1364/JOSA.53.001026.
- Freeman J., Chakravarthi R., Pelli D. G. Substitution and pooling in crowding // Atten. Percept. Psychophys. 2012. Vol. 74. P. 379–396. doi:10.3758/s13414-011-0229-0.
- Hanus D., Vul E. Quantifying error distributions in crowding // Journal of Vision. 2013. Vol. 13. № 4. P. 1–27. doi:10.1167/13.4.17.
- He S., Cavanagh P., Intriligator J. Attentional resolution and the locus of visual awareness // Nat ure. 1996. Vol. 383. P. 334–336. doi:10.1038/383334a0.
- Hess R. F., Jacobs R. J. A preliminary report of acuity and contour interactions across the amblyope’s visual field / / Vision Research. 1979. Vol. 19. P. 1403–1408. doi:10.1016/0042-6989(79)90214-1.
- Kooi F. L., Toet A., Tripathy S. P., Levi D. M. The effect of similarity and duration on spatial interaction in peripheral vision // Spatial Vision. 1994. Vol. 8. № 2. P. 255-279. doi:10.1163/156856894X00350.
- Levi D. M. Crowding–An essential bottleneck for object recognition: A mini-review // Vision Res. 2008. Vol. 48. P. 635–654. doi:10.1016/j.visres .2007.12.009.
- Levi D. M., Klein S. A., Hariharan S. Suppressive and facilitatory spatial interactions in foveal vision: foveal crowding is simple contrast masking // Journal of Visio n. 2002. Vol. 2. P. 140–166. doi:10.1167/2.2.3.
- Parkes L., Lund J., Angelucci A., Solomon J., Morgan M. Compulsory averaging of crowded orientation signals in human vision // Nature Neuroscience. 2001. Vol. 4. № 7. P. 739–744. doi:10.1038/89532.
- Pelli D. G., Tillman K. A. The uncrowd ed window of object recognition // Nature neuroscience. 2008. Vol. 11. №. 10. P. 1129–1135. doi:10.1038/nn1208-1463b.
- Pelli D. G. Crowding: A cortical constraint on object recognition // Curr ent opinion in neurobiology. 2008. Vol. 18. № 4. P. 445–451. doi:10.1016/j.conb.2008.09.008.
- Pelli D. G., Palomares M., Majaj N. J. Crowding is unlike ordinary masking: distinguishing feature detection and integration // Journal of Vision. 2004. Vol. 4. P. 1136–1169. doi:10.1167/4.12.12.
- Strasburger H., Harvey L. O., Rentschler I. Contrast thresholds for identification of numeric characters in direct and eccentric view // Perception & Psychophysics. 1991. V ol. 49. №. 6. P. 495–508. doi:10.3758/BF03212183.
- Strasburger H., Rentschler I., Juttner M. Peripheral vision and pattern recognition: A review // Journal of Vision. 2011. Vol. 11. № 5. doi:10.1167/ 11.5.1.
- Townsend J. T., Taylor S. G., Brown D. R. Lateral masking for letters with unlimited viewing time // Perception and Psychophysics. 1971. Vol. 10. № 5. P. 375–378. doi:10.3758/BF03207464.
- Tripathy S. P., Ca vanagh P., Bedell H. E. Large crowding zones in peripheral vision for briefly presented stimuli // Journal of Vision. 2014. Vol. 14. № 6. doi:10.1167/14.6.11.
- Wetherill G. B., Levitt H. Sequential estimation of points on a psychometric function // British Journal of Mathematical and Statistical Psychology. 1965. Vol. 18. P. 1–10. doi:10.1111/j.2044-8317.1965.tb00689.x.
- Woodrow H. The effect of pattern upon simultaneous letter-span // Journal of the Optical Society of America. 1938. Vol. 51. P. 83–96. doi:10.2307/1416417.
Информация об авторах
Метрики
Просмотров
Всего: 3701
В прошлом месяце: 28
В текущем месяце: 16
Скачиваний
Всего: 915
В прошлом месяце: 5
В текущем месяце: 1