Введение
Развитие стереокинематографа и технологий виртуальной реальности (VR) инициировало проведение теоретических и экспериментальных исследований, направленных на изучение взаимодействия человека с современными устройствами 3D-визуализации, выявление особенностей зрительного восприятия пространства при использовании VR-шлемов, 3D-телевизоров, мониторов, тренажеров. Данные технологии получили широкое применение не только в области иммерсивного киноискусства, спорта, досуга, но и в образовательном процессе при формировании у обучающихся профессиональных навыков, в психологической и медицинской практике для коррекции психических процессов и состояний, оптимизации функционирования зрительной системы и лечения расстройств бинокулярного зрения, а также при разработке различных тренинговых и коррекционно-развивающих программ. В связи с этим у пользователей естественно возникают вопросы, касающиеся обеспечения безопасного и эффективного обращения с разнообразными информационными средствами создания виртуального окружения.
Применение технологий виртуальной и дополненной реальности в образовательном процессе и коррекционно-развивающей работе способствует значительному улучшению когнитивного функционирования: образной кратковременной памяти, наблюдательности, устойчивости и концентрации внимания, успешности и скорости решения задач, требующих сложного пространственного анализа при поиске, идентификации и классификации объектов. Положительное влияние данных технологий на различные психические и психофизиологические функции авторы объясняют преимуществами трехмерного изображения объектов по сравнению с плоскостным, возможностью визуализации абстрактных моделей, эффектом присутствия, созданием трехмерного впечатления, максимально приближенного к реальному восприятию, возможностью быстрой содержательной модификации этих сред и др. [Величковский, 2016; Ковязина, 2019; Селиванов, 2019; Banks, 2016; Hands, 2015; Hibbard, 2017; Westheimer, 2011].
На фоне возрастающего интереса к инновационным технологиям, решения общих задач научно обоснованной адаптации соответствующих устройств к нуждам образовательной, психологической и клинической практики, изучения психологических аспектов восприятия в условиях виртуальной и дополненной реальности актуальными становятся вопросы исследования принципов работы различных механизмов восприятия зрительной информации в искусственно создаваемых средах.
В естественной среде формирование пространственных зрительных образов происходит в процессе активного взаимодействия различных механизмов зрительной сенсорной, аккомодационной и глазодвигательной систем. Эти механизмы вносят разный вклад в формирование видимых образов и располагаются на разных уровнях — от сенсорного до когнитивного. В различных режимах наблюдения (естественные сцены, плоский экран, стереоскопическое изображение) зрительная система, проводя обработку входящих сигналов, должна выбирать наиболее адекватный вариант образа, используя динамическую перестройку функциональных систем, реализующих процесс зрительного восприятия в конкретных условиях.
Стереокинематограф и ряд современных устройств виртуальной реальности используют бинокулярные стереотехнологии, основанные на способности человека более точно оценивать рельефность, объемную форму, свойства поверхностей и пространственное расположение объектов, сопоставляя сигналы, поступающие в мозг от одной и той же сцены через оба глаза. В этих случаях наблюдателю предъявляются совмещенные на экране изображения стереопары. Их сепарированное рассматривание при помощи разделительных очков, стереоскопа или шлема позволяет воспринимать стереоизображение — виртуальную объемно-пространственную картину. Базовым механизмом, определяющим преимущества бинокулярного пространственного восприятия по сравнению с монокулярным зрением, является фузия — способность зрительной системы объединять информацию, поступающую в мозг из обоих глаз, в единый видимый образ, повышая при этом качество анализа оптического потока за счет учета небольших различий двух сетчаточных изображений [Бонч-Осмоловский, 1983; Рожкова, 1992; Blake, 1973; Howard, 2012; Rogers, 2017; Uji, 2019]. Благодаря созданию и использованию в фундаментальных исследованиях случайно-точечных стереограмм (СТС) было доказано, что монокулярное узнавание объектов не является обязательным начальным этапом стереосинтеза и формирование объемных образов может осуществляться чисто бинокулярными подсистемами обработки информации. Объекты, закодированные в СТС, можно увидеть только в условиях бинокулярного восприятия, поэтому такие объекты получили название чисто бинокулярных, или циклопических, объектов [Рожкова, 2016; Howard, 2012; Julesz].
В свете современных данных об участии разных модулей зрительной сенсорной, аккомодационной и глазодвигательной систем в зрительном процессе научный и практический интерес приобретают исследования особенностей восприятия виртуальных стереообъектов в зависимости от функциональной зрелости соответствующих механизмов у человека, режимов наблюдения, условий жизнедеятельности и опыта восприятия стереопродукции.
Цель настоящего исследования состояла в выявлении индивидуальных особенностей взаимодействия зрительных сенсорных, аккомодационных и глазодвигательных механизмов у индивидов с нормальным стереоскопическим зрением при восприятии виртуальных стереообъектов.
Материалы и методы
Участники исследования
В исследовании приняли участие 100 человек в возрасте от 17 до 79 лет (40 мужчин, 60 женщин, средний возраст 32,9 лет) с нормальной или скорректированной до нормы остротой зрения. Испытуемые участвовали в исследовании добровольно, от совершеннолетних было получено информированное согласие на проведение процедуры измерений. Родители (законные представители) несовершеннолетних были проинформированы о проводившемся исследовании и подписали письменное согласие на участие в нем детей.
Условием участия в исследовании явилось наличие нормально функционирующих механизмов бинокулярного стереопсиса и способности к формированию полноценных стереообразов на основе бинокулярной диспаратности. Отбор испытуемых был проведен по результатам успешности восприятия тестовых СТС из классической монографии [Julesz].
Аппаратура и зрительные стимулы
Экспериментальная установка включала 3D-телевизор фирмы LG для предъявления тестовых стимулов (модель 32LF620U, диагональ 32», ширина экрана 70 см, размер пикселя 0,51 мм, противоположная круговая поляризация четных и нечетных строк), поляризационные очки и подставку-подбородник для фиксации головы испытуемого.
В экспериментах была использована интерактивная компьютерная программа «Фузия», разработанная в ИППИ РАН [Большаков]. Программа генерировала динамические стереопары, имитирующие выход стереообъекта из экрана и движение по направлению к наблюдателю. В качестве тестовых зрительных стимулов использовали СТС, содержащие закодированные диспаратностью стереообъекты — циклопические метки. СТС имели размеры 90x90 мм. Размер отдельных «точек» — элементов СТС — составлял 5x5 пикселей. Генерацию зрительных стимулов для левого и правого глаза осуществляли на четных и нечетных строках экрана на основе круговой поляризационной сепарации левого и правого изображений. Для их раздельного восприятия применяли поляризационные очки.
Процедура исследования
Перед началом эксперимента испытуемый надевал поляризационные очки и располагался на расстоянии 50 см от экрана телевизора на стуле регулируемой высоты. Голову испытуемого фиксировали на подставке-подбороднике таким образом, чтобы глаза находились на уровне центра экрана.
Этапы экспериментальной процедуры и пример виртуального стереообъекта представлены на рис. 1. В начале измерений в центре экрана появлялась стереопара (рис. 1, а-1), при фузировании которой испытуемый видел квадрат со случайно-точечной текстурой и циклопической меткой, отделяющейся от фона (рис. 1, б). Затем испытуемого знакомили с полным набором меток, использованных в эксперименте (рис. 1, а-2). Когда испытуемый сообщал о своей готовности, экспериментатор запускал программу медленного движения левого и правого стимулов в противоположных направлениях от центра: правый стимул двигался влево, а левый — вправо (рис. 1, а-3). Усилия испытуемого фиксировать каждым глазом центр «своего» стимула вызывали постепенное увеличение угла конвергенции. Скорость движения стимулов по экрану составляла 90 мм/мин, максимальное общее время одного испытания — 2 мин. В процессе движения квадратов циклопические метки на них сменялись в случайном порядке.
Случайно-точечные квадраты служили основным фузионным стимулом, в их восприятии участвовали как монокулярные, так и бинокулярные зрительные механизмы. Восприятие виртуальных циклопических стереообъектов, выполняющих роль метки, обеспечивалось механизмами бинокулярной фузии. Использование циклопических меток позволяло в процессе эксперимента осуществлять контроль сохранения способности к формированию полноценных стереообразов на всем протяжении эксперимента до момента распада сфузированного образа при достижении критических углов конвергенции. В клинической практике конвергентную нагрузку при сведении зрительных осей от исходного угла конвергенции до критического, приводящего к потере фузии, принимают за меру конвергентных фузионных резервов.
Процедура исследования была основана на стандартных принципах измерения фузионных резервов: движение стимулов по экрану в противоположных направлениях вызывало конвергентные движения глаз и приводило к нарастающему рассогласованию аккомодации и конвергенции; при этом испытуемый должен был как можно дольше удерживать состояние фузии, следя за сменой виртуальных стереообъектов. В конечном итоге увеличение рассогласования приводило к нарушению фузии, исчезновению циклопической метки и диплопии, после чего движение стимулов по экрану останавливали и выводили на экран изображения меток (рис. 1, а-4). Испытуемый должен был указать последнюю воспринятую им метку. Таким образом, в эксперименте была реализована возможность объективно контролировать субъективные показания испытуемых от возникновения виртуального стереообраза до момента его распада без наблюдения за движениями глаз.
Задача испытуемого состояла в наблюдении за динамично сменяющимися стереообъектами и описании возникающих виртуальных зрительных стереообразов: оценки величины стереообъектов, их позиции по глубине и характера движения.
Статистическая обработка данных включала оценку репрезентативности выборочной совокупности и вычисление доверительных границ для относительной величины. Сравнение результатов исследования в группах мужчин и женщин осуществляли при помощи х2-критерия для оценки однородности двух и более независимых выборок [Ермолаев, 2019].
Результаты и их обсуждение
В зависимости от длительности процедуры, связанной с индивидуальными значениями фузионных резервов, каждый испытуемый в процессе эксперимента наблюдал сфузированный образ, на котором сменялось от 8 до 30 циклопических меток. Использование меток позволяло убедиться в том, что испытуемый в течение всего эксперимента фузировал тестовую стереопару, на которой происходила смена виртуальных стереообъектов.

Качественный анализ ответов испытуемых позволил выделить 4 типа визуализации виртуальных стереообъектов в условиях эксперимента:
тип I — стереообраз приближается к наблюдателю и уменьшается в размерах;
тип II — стереообраз сохраняет позицию в центре экрана либо вблизи экрана и не меняет своих размеров;
тип III — стереообраз удаляется за экран;
тип IV (неустойчивое восприятие) — имеют место сложные трансформации воспринимаемого образа: сначала стереообъект выступает из экрана и начинает движение по направлению к наблюдателю, а затем перемещается в противоположную сторону, т. е. назад по направлению к экрану.
Первые три типа схематически представлены на рис. 2, иллюстрацию четвертого типа затрудняет сложная динамика стереообразов.
Количественные данные о соотношении описанных типов восприятия представлены на рис. 3. Видно, что в исследуемой группе только 35 человек воспринимали виртуальные стереообъекты в соответствии с традиционными представлениями и правилами стереографии — как движущиеся от экрана к наблюдателю и меняющие свои размеры (тип I). У 47 испытуемых субъективные отчеты о величине и позиции наблюдаемого стереообъекта свидетельствовали о том, что их стереообразы сохраняли первоначальные размеры и позицию вблизи экрана либо непосредственно на экране (тип II). У 10 человек было выявлено движение стереообъекта в заэкранное пространство (тип III). У 8 человек на начальном этапе восприятия стереообъект выходил из экрана и приближался к наблюдателю, а затем движение либо прекращалось, либо меняло направление (тип IV).


Полученные в ряде работ данные о половых различиях в показателях восприятия при взаимодействии с искусственными средами [Astur, 2004; Menshikova, 2018; Nori, 2015] ориентируют на анализ наблюдаемых перцептивных эффектов в группах мужчин и женщин. На рис. 4 видно, что в исследованной выборке распределения показателей восприятия виртуальных стереообъектов у мужчин и женщин по типам восприятия являются примерно одинаковым по своему характеру. С учетом погрешности оценок, определяемых числом испытуемых, показатели восприятия стереообъектов у мужчин и женщин статистически значимо не различались.
Таким образом, у индивидов, обладающих полноценными механизмами бинокулярного стереопсиса, в одинаковых режимах наблюдения стереопар, кодирующих объекты, которые выступают из экрана и движутся по направлению к наблюдателю, возникают виртуальные стереообразы, принципиально различающиеся по позиции, величине и характеру движения.

В созданных нами экспериментальных условиях восприятия, в точности имитирующих кадры стереокино для случая приближающегося и уменьшающегося объекта, аккомодационный стимул соответствовал позиции экрана, а вергенция управлялась положением сопряженных точек на экране. В процессе движения стереопар точка пересечения зрительных осей, каждая из которых была направлена на центр «своего изображения», перемещалась от плоскости экрана по направлению к наблюдателю. Согласно правилам стереографии, при наблюдении движущихся по экрану частей стереопары (правый стимул движется влево, а левый — вправо) постепенное увеличение угла конвергенции должно было сопровождаться изменениями субъективного восприятия расположения стереообъекта по глубине в предэранном пространстве. Однако такая картина наблюдалась далеко не у всех участников эксперимента. Для обеспечения бинокулярной фузии и сохранения целостного стереообраза в ходе движения стимулов и динамической смены стереометок испытуемые должны были постоянно преодолевать противоречие между состоянием аккомодации и вергенции: аккомодация должна соответствовать расстоянию до экрана, а вергенция должна определяться расстоянием до воспринимаемого виртуального стереообъекта, который может смещаться относительно экрана по глубине. Успешное создание стереообразов зависело от взаимодействия окуломоторного и сенсорного компонентов фузии. Окуломоторный компонент (глазодвигательный рефлекс) создавал условия для фовеации — удерживания изображения объекта на центральных участках сетчаток благодаря отслеживанию движением глаз его постепенного перемещения. Сенсорный компонент (собственно фузия) обеспечивал процесс слияния двух монокулярных изображений и создание единого образа.
Если при формировании стереообраза мозговые механизмы учитывают движения зрительных осей, то положение стереообраза будет совпадать с точкой пересечения линий взора и по мере приближения к наблюдателю его величина будет уменьшаться (тип I). Если информация о движении зрительных осей не принимается во внимание (игнорируется мозгом), формируемый виртуальный стереообраз будет интерпретироваться как сохраняющий свои позицию и исходные размеры (тип II). Если в функциональной системе будут доминировать влияния со стороны монокулярных зрительных подсистем, передающих информацию об увеличении расстояния до наблюдаемого виртуального стереообъекта, а информация о движении зрительных осей будет игнорироваться, стереообраз будет казаться удаляющимся за экран (тип III). При отсутствии явного доминирования одного из механизмов можно ожидать проявлений динамической конкуренции в виде смены интерпретации входных сигналов и трансформации формирующихся стереообразов (тип IV).
В условиях проводимого эксперимента в разные мозговые подсистемы анализа зрительной информации поступают весьма противоречивые сигналы о величине и позиции тест-объекта, которые трудно согласовать между собой, исходя из простых гипотез о виде и движении наблюдаемого объекта. Поступающие сигналы обрабатываются параллельно функционирующими монокулярными и бинокулярными механизмами, которые могут вносить разный вклад в формируемый видимый образ. Например, очевидно, что в каждом монокулярном канале поступающая информация свидетельствует об увеличении расстояния от глаза до объекта, а в чисто бинокулярном канале — об уменьшении расстояния до объекта. Но при этом испытуемый знает, что изображение «привязано» к экрану. Однозначное решение в таких условиях найти невозможно, поэтому возникают разные варианты визуализации наблюдаемой сцены.
Зрительная система учитывает сходство и различие левого и правого сетчаточных изображений, состояние аккомодационно-конвергентного аппарата глаз, а также результаты процессов когнитивной обработки и обобщения в высших мозговых центрах накопленного зрительного опыта. Существование принципиальных различий между наблюдателями в отношении характера формируемых образов свидетельствует о возможности неоднозначной интерпретации сетчаточных изображений в этих условиях и возможном доминировании у разных наблюдателей различных механизмов, вносящих вклад в эту интерпретацию. В условиях естественных зрительных сцен механизмы, осуществляющие аккомодационн-вергенционную связь, настраивают мышцы, управляющие аккомодацией и вергенцией на одно и то же расстояние наблюдения. В искусственно создаваемых средах при рассматривании динамической стереопары в их работе может происходить рассогласование, обусловленное тем, что при восприятии стереоизображения аккомодация должна соответствовать расстоянию до экрана, а вергенция должна определяться расстоянием до воспринимаемого виртуального стереообъекта, который может смещаться относительно экрана по глубине.
Естественно предполагать, что на формирование видимого образа виртуального объекта в условиях стереоскопического восприятия влияет не только зрелость различных механизмов и степень их востребованности/тренированности в профессиональной или повседневной жизни при решении зрительных задач, но и необходимость адаптации, динамической перестройки функциональных взаимоотношений в зрительной системе при переходе от естественных условий восприятия к деятельности в искусственной среде. Неизбежная неоднозначность сигналов, поступающих в зрительную сенсорную, аккомодационную и окуломоторную системы в условиях наблюдения виртуальной реальности, и их отличия от сигналов, поступающих при наблюдении естественных сцен, обусловливают специфические трудности формирования образов виртуальных объектов и необходимость выбора гипотез, наиболее правдоподобных с точки зрения индивидуального опыта. Полученные в наших экспериментах результаты являются отражением динамической саморегуляции, координации и интеграции механизмов анализа множества входящих сигналов и согласуются с представлениями об избирательной реорганизации зрительного процесса как основы адаптивного поведения человека [Барабанщиков, 2020; Судаков, 2013; Tyler, 2020].
Выводы
1.В одних и тех же условиях зрительной стимуляции, имитирующих движение виртуальных стереообъектов от экрана к наблюдателю, обнаружена межиндивидуальная вариабельность в особенностях восприятия. Наблюдаемые пространственные эффекты можно подразделить на 4 типа: тип I — стереообраз приближается к наблюдателю и уменьшается в размерах; тип II — стереообраз сохраняет позицию в центре экрана либо вблизи экрана и не меняет своих размеров; тип III — стереообраз удаляется за экран; тип ^(неустойчивое восприятие) — стереообраз подвергается сложным трансформациям.
2.Разные типы перцептивных пространственных стереоскопических эффектов являются результатом различий в координированной совместной деятельности различных модулей зрительной сенсорной, аккомодационной и глазодвигательной систем, направленной на адаптацию к искусственно создаваемой среде, которая протекает схожим образом, как у наблюдателей мужского, так и у наблюдателей женского пола.
3.Сложная гетерархическая организация зрительной системы и совместная работа целого комплекса зрительных механизмов обусловливает индивидуальную вариабельность формирования операционального компонента функциональной системы, реализующей психофизиологический процесс восприятия виртуальных стереообъектов.
4.Описанные феномены поднимают вопросы персонифицированности применяемых методов и подходов, основанных на технологиях виртуальной реальности. Индивидуальные особенности стереовосприятия в искусственно создаваемой среде ориентируют на разработку обучающих и тренировочных программ, которые будут обеспечивать оптимальное использование различных средств стереовизуализации.