Экспериментальная психология
2021. Том 14. № 3. С. 79–90
doi:10.17759/exppsy.2021140306
ISSN: 2072-7593 / 2311-7036 (online)
Восприятие виртуальных стереообъектов: особенности взаимодействия зрительных механизмов и пространственные перцептивные эффекты
Аннотация
Общая информация
Ключевые слова: стереотехнологии, стереообраз, зрительные механизмы, перцептивные эффекты, виртуальная реальность, зрительное восприятие
Рубрика издания: Психология восприятия
Тип материала: научная статья
DOI: https://doi.org/10.17759/exppsy.2021140306
Благодарности. Авторы благодарят за обсуждение работы и техническую помощь старшего научного сотрудника ИППИ РАН М.А. Грачеву.
Для цитаты: Васильева Н.Н., Рожкова Г.И. Восприятие виртуальных стереообъектов: особенности взаимодействия зрительных механизмов и пространственные перцептивные эффекты // Экспериментальная психология. 2021. Том 14. № 3. С. 79–90. DOI: 10.17759/exppsy.2021140306
Полный текст
Введение
Развитие стереокинематографа и технологий виртуальной реальности (VR) инициировало проведение теоретических и экспериментальных исследований, направленных на изучение взаимодействия человека с современными устройствами 3D-визуализации, выявление особенностей зрительного восприятия пространства при использовании VR-шлемов, 3D-телевизоров, мониторов, тренажеров. Данные технологии получили широкое применение не только в области иммерсивного киноискусства, спорта, досуга, но и в образовательном процессе при формировании у обучающихся профессиональных навыков, в психологической и медицинской практике для коррекции психических процессов и состояний, оптимизации функционирования зрительной системы и лечения расстройств бинокулярного зрения, а также при разработке различных тренинговых и коррекционно-развивающих программ. В связи с этим у пользователей естественно возникают вопросы, касающиеся обеспечения безопасного и эффективного обращения с разнообразными информационными средствами создания виртуального окружения.
Применение технологий виртуальной и дополненной реальности в образовательном процессе и коррекционно-развивающей работе способствует значительному улучшению когнитивного функционирования: образной кратковременной памяти, наблюдательности, устойчивости и концентрации внимания, успешности и скорости решения задач, требующих сложного пространственного анализа при поиске, идентификации и классификации объектов. Положительное влияние данных технологий на различные психические и психофизиологические функции авторы объясняют преимуществами трехмерного изображения объектов по сравнению с плоскостным, возможностью визуализации абстрактных моделей, эффектом присутствия, созданием трехмерного впечатления, максимально приближенного к реальному восприятию, возможностью быстрой содержательной модификации этих сред и др. [4; 6; 9; 13; 14; 15; 23].
На фоне возрастающего интереса к инновационным технологиям, решения общих задач научно обоснованной адаптации соответствующих устройств к нуждам образовательной, психологической и клинической практики, изучения психологических аспектов восприятия в условиях виртуальной и дополненной реальности актуальными становятся вопросы исследования принципов работы различных механизмов восприятия зрительной информации в искусственно создаваемых средах.
В естественной среде формирование пространственных зрительных образов происходит в процессе активного взаимодействия различных механизмов зрительной сенсорной, аккомодационной и глазодвигательной систем. Эти механизмы вносят разный вклад в формирование видимых образов и располагаются на разных уровнях — от сенсорного до когнитивного. В различных режимах наблюдения (естественные сцены, плоский экран, стереоскопическое изображение) зрительная система, проводя обработку входящих сигналов, должна выбирать наиболее адекватный вариант образа, используя динамическую перестройку функциональных систем, реализующих процесс зрительного восприятия в конкретных условиях.
Стереокинематограф и ряд современных устройств виртуальной реальности используют бинокулярные стереотехнологии, основанные на способности человека более точно оценивать рельефность, объемную форму, свойства поверхностей и пространственное расположение объектов, сопоставляя сигналы, поступающие в мозг от одной и той же сцены через оба глаза. В этих случаях наблюдателю предъявляются совмещенные на экране изображения стереопары. Их сепарированное рассматривание при помощи разделительных очков, стереоскопа или шлема позволяет воспринимать стереоизображение — виртуальную объемно-пространственную картину. Базовым механизмом, определяющим преимущества бинокулярного пространственного восприятия по сравнению с монокулярным зрением, является фузия — способность зрительной системы объединять информацию, поступающую в мозг из обоих глаз, в единый видимый образ, повышая при этом качество анализа оптического потока за счет учета небольших различий двух сетчаточных изображений [3; 7; 12; 16; 20; 22]. Благодаря созданию и использованию в фундаментальных исследованиях случайно-точечных стереограмм (СТС) было доказано, что монокулярное узнавание объектов не является обязательным начальным этапом стереосинтеза и формирование объемных образов может осуществляться чисто бинокулярными подсистемами обработки информации. Объекты, закодированные в СТС, можно увидеть только в условиях бинокулярного восприятия, поэтому такие объекты получили название чисто бинокулярных, или циклопических, объектов [8; 16; 17].
В свете современных данных об участии разных модулей зрительной сенсорной, аккомодационной и глазодвигательной систем в зрительном процессе научный и практический интерес приобретают исследования особенностей восприятия виртуальных стереообъектов в зависимости от функциональной зрелости соответствующих механизмов у человека, режимов наблюдения, условий жизнедеятельности и опыта восприятия стереопродукции.
Цель настоящего исследования состояла в выявлении индивидуальных особенностей взаимодействия зрительных сенсорных, аккомодационных и глазодвигательных механизмов у индивидов с нормальным стереоскопическим зрением при восприятии виртуальных стереообъектов.
Материалы и методы
Участники исследования
В исследовании приняли участие 100 человек в возрасте от 17 до 79 лет (40 мужчин, 60 женщин, средний возраст 32,9 лет) с нормальной или скорректированной до нормы остротой зрения. Испытуемые участвовали в исследовании добровольно, от совершеннолетних было получено информированное согласие на проведение процедуры измерений. Родители (законные представители) несовершеннолетних были проинформированы о проводившемся исследовании и подписали письменное согласие на участие в нем детей.
Условием участия в исследовании явилось наличие нормально функционирующих механизмов бинокулярного стереопсиса и способности к формированию полноценных стереообразов на основе бинокулярной диспаратности. Отбор испытуемых был проведен по результатам успешности восприятия тестовых СТС из классической монографии [17].
Аппаратура и зрительные стимулы
Экспериментальная установка включала 3D-телевизор фирмы LG для предъявления тестовых стимулов (модель 32LF620U, диагональ 32», ширина экрана 70 см, размер пикселя 0,51 мм, противоположная круговая поляризация четных и нечетных строк), поляризационные очки и подставку-подбородник для фиксации головы испытуемого.
В экспериментах была использована интерактивная компьютерная программа «Фузия», разработанная в ИППИ РАН [2]. Программа генерировала динамические стереопары, имитирующие выход стереообъекта из экрана и движение по направлению к наблюдателю. В качестве тестовых зрительных стимулов использовали СТС, содержащие закодированные диспаратностью стереообъекты — циклопические метки. СТС имели размеры 90x90 мм. Размер отдельных «точек» — элементов СТС — составлял 5x5 пикселей. Генерацию зрительных стимулов для левого и правого глаза осуществляли на четных и нечетных строках экрана на основе круговой поляризационной сепарации левого и правого изображений. Для их раздельного восприятия применяли поляризационные очки.
Процедура исследования
Перед началом эксперимента испытуемый надевал поляризационные очки и располагался на расстоянии 50 см от экрана телевизора на стуле регулируемой высоты. Голову испытуемого фиксировали на подставке-подбороднике таким образом, чтобы глаза находились на уровне центра экрана.
Этапы экспериментальной процедуры и пример виртуального стереообъекта представлены на рис. 1. В начале измерений в центре экрана появлялась стереопара (рис. 1, а-1), при фузировании которой испытуемый видел квадрат со случайно-точечной текстурой и циклопической меткой, отделяющейся от фона (рис. 1, б). Затем испытуемого знакомили с полным набором меток, использованных в эксперименте (рис. 1, а-2). Когда испытуемый сообщал о своей готовности, экспериментатор запускал программу медленного движения левого и правого стимулов в противоположных направлениях от центра: правый стимул двигался влево, а левый — вправо (рис. 1, а-3). Усилия испытуемого фиксировать каждым глазом центр «своего» стимула вызывали постепенное увеличение угла конвергенции. Скорость движения стимулов по экрану составляла 90 мм/мин, максимальное общее время одного испытания — 2 мин. В процессе движения квадратов циклопические метки на них сменялись в случайном порядке.
Случайно-точечные квадраты служили основным фузионным стимулом, в их восприятии участвовали как монокулярные, так и бинокулярные зрительные механизмы. Восприятие виртуальных циклопических стереообъектов, выполняющих роль метки, обеспечивалось механизмами бинокулярной фузии. Использование циклопических меток позволяло в процессе эксперимента осуществлять контроль сохранения способности к формированию полноценных стереообразов на всем протяжении эксперимента до момента распада сфузированного образа при достижении критических углов конвергенции. В клинической практике конвергентную нагрузку при сведении зрительных осей от исходного угла конвергенции до критического, приводящего к потере фузии, принимают за меру конвергентных фузионных резервов.
Процедура исследования была основана на стандартных принципах измерения фузионных резервов: движение стимулов по экрану в противоположных направлениях вызывало конвергентные движения глаз и приводило к нарастающему рассогласованию аккомодации и конвергенции; при этом испытуемый должен был как можно дольше удерживать состояние фузии, следя за сменой виртуальных стереообъектов. В конечном итоге увеличение рассогласования приводило к нарушению фузии, исчезновению циклопической метки и диплопии, после чего движение стимулов по экрану останавливали и выводили на экран изображения меток (рис. 1, а-4). Испытуемый должен был указать последнюю воспринятую им метку. Таким образом, в эксперименте была реализована возможность объективно контролировать субъективные показания испытуемых от возникновения виртуального стереообраза до момента его распада без наблюдения за движениями глаз.
Задача испытуемого состояла в наблюдении за динамично сменяющимися стереообъектами и описании возникающих виртуальных зрительных стереообразов: оценки величины стереообъектов, их позиции по глубине и характера движения.
Статистическая обработка данных включала оценку репрезентативности выборочной совокупности и вычисление доверительных границ для относительной величины. Сравнение результатов исследования в группах мужчин и женщин осуществляли при помощи х2-критерия для оценки однородности двух и более независимых выборок [5].
Результаты и их обсуждение
В зависимости от длительности процедуры, связанной с индивидуальными значениями фузионных резервов, каждый испытуемый в процессе эксперимента наблюдал сфузированный образ, на котором сменялось от 8 до 30 циклопических меток. Использование меток позволяло убедиться в том, что испытуемый в течение всего эксперимента фузировал тестовую стереопару, на которой происходила смена виртуальных стереообъектов.
Качественный анализ ответов испытуемых позволил выделить 4 типа визуализации виртуальных стереообъектов в условиях эксперимента:
тип I — стереообраз приближается к наблюдателю и уменьшается в размерах;
тип II — стереообраз сохраняет позицию в центре экрана либо вблизи экрана и не меняет своих размеров;
тип III — стереообраз удаляется за экран;
тип IV (неустойчивое восприятие) — имеют место сложные трансформации воспринимаемого образа: сначала стереообъект выступает из экрана и начинает движение по направлению к наблюдателю, а затем перемещается в противоположную сторону, т. е. назад по направлению к экрану.
Первые три типа схематически представлены на рис. 2, иллюстрацию четвертого типа затрудняет сложная динамика стереообразов.
Количественные данные о соотношении описанных типов восприятия представлены на рис. 3. Видно, что в исследуемой группе только 35 человек воспринимали виртуальные стереообъекты в соответствии с традиционными представлениями и правилами стереографии — как движущиеся от экрана к наблюдателю и меняющие свои размеры (тип I). У 47 испытуемых субъективные отчеты о величине и позиции наблюдаемого стереообъекта свидетельствовали о том, что их стереообразы сохраняли первоначальные размеры и позицию вблизи экрана либо непосредственно на экране (тип II). У 10 человек было выявлено движение стереообъекта в заэкранное пространство (тип III). У 8 человек на начальном этапе восприятия стереообъект выходил из экрана и приближался к наблюдателю, а затем движение либо прекращалось, либо меняло направление (тип IV).
Полученные в ряде работ данные о половых различиях в показателях восприятия при взаимодействии с искусственными средами [11; 18; 19] ориентируют на анализ наблюдаемых перцептивных эффектов в группах мужчин и женщин. На рис. 4 видно, что в исследованной выборке распределения показателей восприятия виртуальных стереообъектов у мужчин и женщин по типам восприятия являются примерно одинаковым по своему характеру. С учетом погрешности оценок, определяемых числом испытуемых, показатели восприятия стереообъектов у мужчин и женщин статистически значимо не различались.
Таким образом, у индивидов, обладающих полноценными механизмами бинокулярного стереопсиса, в одинаковых режимах наблюдения стереопар, кодирующих объекты, которые выступают из экрана и движутся по направлению к наблюдателю, возникают виртуальные стереообразы, принципиально различающиеся по позиции, величине и характеру движения.
В созданных нами экспериментальных условиях восприятия, в точности имитирующих кадры стереокино для случая приближающегося и уменьшающегося объекта, аккомодационный стимул соответствовал позиции экрана, а вергенция управлялась положением сопряженных точек на экране. В процессе движения стереопар точка пересечения зрительных осей, каждая из которых была направлена на центр «своего изображения», перемещалась от плоскости экрана по направлению к наблюдателю. Согласно правилам стереографии, при наблюдении движущихся по экрану частей стереопары (правый стимул движется влево, а левый — вправо) постепенное увеличение угла конвергенции должно было сопровождаться изменениями субъективного восприятия расположения стереообъекта по глубине в предэранном пространстве. Однако такая картина наблюдалась далеко не у всех участников эксперимента. Для обеспечения бинокулярной фузии и сохранения целостного стереообраза в ходе движения стимулов и динамической смены стереометок испытуемые должны были постоянно преодолевать противоречие между состоянием аккомодации и вергенции: аккомодация должна соответствовать расстоянию до экрана, а вергенция должна определяться расстоянием до воспринимаемого виртуального стереообъекта, который может смещаться относительно экрана по глубине. Успешное создание стереообразов зависело от взаимодействия окуломоторного и сенсорного компонентов фузии. Окуломоторный компонент (глазодвигательный рефлекс) создавал условия для фовеации — удерживания изображения объекта на центральных участках сетчаток благодаря отслеживанию движением глаз его постепенного перемещения. Сенсорный компонент (собственно фузия) обеспечивал процесс слияния двух монокулярных изображений и создание единого образа.
Если при формировании стереообраза мозговые механизмы учитывают движения зрительных осей, то положение стереообраза будет совпадать с точкой пересечения линий взора и по мере приближения к наблюдателю его величина будет уменьшаться (тип I). Если информация о движении зрительных осей не принимается во внимание (игнорируется мозгом), формируемый виртуальный стереообраз будет интерпретироваться как сохраняющий свои позицию и исходные размеры (тип II). Если в функциональной системе будут доминировать влияния со стороны монокулярных зрительных подсистем, передающих информацию об увеличении расстояния до наблюдаемого виртуального стереообъекта, а информация о движении зрительных осей будет игнорироваться, стереообраз будет казаться удаляющимся за экран (тип III). При отсутствии явного доминирования одного из механизмов можно ожидать проявлений динамической конкуренции в виде смены интерпретации входных сигналов и трансформации формирующихся стереообразов (тип IV).
В условиях проводимого эксперимента в разные мозговые подсистемы анализа зрительной информации поступают весьма противоречивые сигналы о величине и позиции тест-объекта, которые трудно согласовать между собой, исходя из простых гипотез о виде и движении наблюдаемого объекта. Поступающие сигналы обрабатываются параллельно функционирующими монокулярными и бинокулярными механизмами, которые могут вносить разный вклад в формируемый видимый образ. Например, очевидно, что в каждом монокулярном канале поступающая информация свидетельствует об увеличении расстояния от глаза до объекта, а в чисто бинокулярном канале — об уменьшении расстояния до объекта. Но при этом испытуемый знает, что изображение «привязано» к экрану. Однозначное решение в таких условиях найти невозможно, поэтому возникают разные варианты визуализации наблюдаемой сцены.
Зрительная система учитывает сходство и различие левого и правого сетчаточных изображений, состояние аккомодационно-конвергентного аппарата глаз, а также результаты процессов когнитивной обработки и обобщения в высших мозговых центрах накопленного зрительного опыта. Существование принципиальных различий между наблюдателями в отношении характера формируемых образов свидетельствует о возможности неоднозначной интерпретации сетчаточных изображений в этих условиях и возможном доминировании у разных наблюдателей различных механизмов, вносящих вклад в эту интерпретацию. В условиях естественных зрительных сцен механизмы, осуществляющие аккомодационн-вергенционную связь, настраивают мышцы, управляющие аккомодацией и вергенцией на одно и то же расстояние наблюдения. В искусственно создаваемых средах при рассматривании динамической стереопары в их работе может происходить рассогласование, обусловленное тем, что при восприятии стереоизображения аккомодация должна соответствовать расстоянию до экрана, а вергенция должна определяться расстоянием до воспринимаемого виртуального стереообъекта, который может смещаться относительно экрана по глубине.
Естественно предполагать, что на формирование видимого образа виртуального объекта в условиях стереоскопического восприятия влияет не только зрелость различных механизмов и степень их востребованности/тренированности в профессиональной или повседневной жизни при решении зрительных задач, но и необходимость адаптации, динамической перестройки функциональных взаимоотношений в зрительной системе при переходе от естественных условий восприятия к деятельности в искусственной среде. Неизбежная неоднозначность сигналов, поступающих в зрительную сенсорную, аккомодационную и окуломоторную системы в условиях наблюдения виртуальной реальности, и их отличия от сигналов, поступающих при наблюдении естественных сцен, обусловливают специфические трудности формирования образов виртуальных объектов и необходимость выбора гипотез, наиболее правдоподобных с точки зрения индивидуального опыта. Полученные в наших экспериментах результаты являются отражением динамической саморегуляции, координации и интеграции механизмов анализа множества входящих сигналов и согласуются с представлениями об избирательной реорганизации зрительного процесса как основы адаптивного поведения человека [1; 10; 21].
Выводы
1.В одних и тех же условиях зрительной стимуляции, имитирующих движение виртуальных стереообъектов от экрана к наблюдателю, обнаружена межиндивидуальная вариабельность в особенностях восприятия. Наблюдаемые пространственные эффекты можно подразделить на 4 типа: тип I — стереообраз приближается к наблюдателю и уменьшается в размерах; тип II — стереообраз сохраняет позицию в центре экрана либо вблизи экрана и не меняет своих размеров; тип III — стереообраз удаляется за экран; тип ^(неустойчивое восприятие) — стереообраз подвергается сложным трансформациям.
2.Разные типы перцептивных пространственных стереоскопических эффектов являются результатом различий в координированной совместной деятельности различных модулей зрительной сенсорной, аккомодационной и глазодвигательной систем, направленной на адаптацию к искусственно создаваемой среде, которая протекает схожим образом, как у наблюдателей мужского, так и у наблюдателей женского пола.
3.Сложная гетерархическая организация зрительной системы и совместная работа целого комплекса зрительных механизмов обусловливает индивидуальную вариабельность формирования операционального компонента функциональной системы, реализующей психофизиологический процесс восприятия виртуальных стереообъектов.
4.Описанные феномены поднимают вопросы персонифицированности применяемых методов и подходов, основанных на технологиях виртуальной реальности. Индивидуальные особенности стереовосприятия в искусственно создаваемой среде ориентируют на разработку обучающих и тренировочных программ, которые будут обеспечивать оптимальное использование различных средств стереовизуализации.
Литература
- Барабанщиков В.А. Общая психология: психология восприятия. М.: Юрайт, 2020. 184 с.
- Большаков А.С., Рожкова Г.И. Интерактивная тестовая программа для оценки состояния и тренировки фузионных механизмов бинокулярного зрения ФУЗИЯ. Свидетельство о государственной регистрации программы для ЭВМ № 2013610975 от 09.01.2013.
- Бонч-Осмоловский А.М., Петров А.П. Модели и алгоритмы стереосинтеза. М.: Ин-т атом. энергии имени И.В. Курчатова, 1983. 76 с.
- Величковский Б.Б. и др. Когнитивный контроль и чувство присутствия в виртуальных средах // Экспериментальная психология. 2016. Том 9. № 1. С. 5—20. DOI:10.17759/exppsy.2016090102
- Ермолаев О.Ю. Математическая статистика для психологов. М.: ФЛИНТА, 2019. 336 с.
- Ковязина М.С. и др. Инновационные инструментальные технологии в системе клинико- психологической диагностики и реабилитации // Вестник РФФИ. 2019. № 4(104). С. 2—30. DOI: 10.22204/2410-4639-2019-104-04-23-30
- Рожкова Г.И. Бинокулярное зрение // Физиология зрения / Под ред. А.Л. Бызова. М.: Наука, 1992. С. 586—664.
- Рожкова Г.И. Случайно-точечные стереограммы: уникальные инструменты для изучения, оценки и тренировки бинокулярных механизмов восприятия глубины // Мир техники кино. 2016. 4(10). С. 7—13.
- Селиванов В.В., Побокин П.А., Бабиева Н.С. Влияние образовательных и тренинговых программ в виртуальной реальности на личностные характеристики испытуемых // Психология обучения. 2019. № 1. С. 18—28
- Судаков К.В. Системная организация психической деятельности // Психологический журнал. 2013. Том 34. № 6. С. 72—81.
- Astur R.S. et al. Sex differences and correlations in a virtual Morris water task, a virtual radial arm maze, and mental rotation // Behavioural brain research. 2004. Vol. 151. Iss. 1—2. Р. 103—115. DOI:10.1016/j.bbr.2003.08.024
- Blake R., Fox R. The psychophysical inquiry into binocular summation // Jbid. 1973. Vol. 14. Р. 161—185.
- Banks M.S. et al. 3D Displays // Annual review of vision science. 2016. Vol. 2. P. 397—435.
- Hands P., Smulders T.V., Read J. Stereoscopic 3-D content appears relatively veridical when viewed from an oblique angle // J. Vis. 2015. Vol. 15(5): 6. P. 1—21.
- Hibbard P.B., Haines A.E., Hornsey R.L. Magnitude, precision, and realism of depth perception in stereoscopic vision // Cogn. research. 2017. Vol. 2. № 25. DOI:10.1186/s41235-017-0062-7
- Howard I.P., Rogers B.J. Perceiving in depth. Vol. 2. Stereoscopic vision. Oxford: Oxford University Press, 2012. 635 p.
- Julesz B. Foundations of cyclopean perception. Chicago: Univ. Chicago Press,1971. 406 p.
- Menshikova G.Ya. et al. Gender differences in interactions with avatars of diverse ethnic appearances // Psychology in Russia: State of the Art. 2018. Vol. 11. Iss. 4. DOI: 10.11621/pir.2018.0414
- Nori R. et al. The virtual reality Walking Corsi Test // Computers in human behavior. 2015. Vol. 48. P. 72—77. DOI:10.1016/j.chb.2015.01.035
- Rogers B. Perception: a very short introduction. OUP Oxford University press, 2017. 162 p.
- Tyler C.W. An accelerated cue combination principle accounts for multi-cue depth perception // Journal of perceptual imaging. Society for imaging science and technology. 2020. 3(1): 010501-1—010501-9. DOI: 10.2352/J.Percept.Imaging.2020.3.1.010501
- Uji M. et al. Identifying cortical substrates underlying the phenomenology of stereopsis and realness: A pilot fMRI study // Front. Neurosci. 2019. 13:646. DOI: 10.3389/fnins.2019.00646
- Westheimer G. Three-dimensional displays and stereo vision // Proc. R. Soc. B. 2011. 278. P. 2241— 2248. DOI: 10.1098/rspb.2010.2777
Информация об авторах
Метрики
Просмотров
Всего: 519
В прошлом месяце: 18
В текущем месяце: 9
Скачиваний
Всего: 212
В прошлом месяце: 4
В текущем месяце: 4