Введение
Слуховые интерфейсы (или слуховые человек-машинные интерфейсы, auditory human-machine interfaces) определяются как системы, позволяющие человеку и компьютерной системе обмениваться информацией (Peres et al., 2008). В широком смысле они включают как речевые (распознавание человеческой речи, синтез речевых сообщений, вербальные оповещения), так и невербальные компоненты (оповещения и постоянные звуки с разными характеристиками). Для создания последних может использоваться сонификация — перекодирование данных в характеристики звука (Walker, 2023).
Хотя недавний метаанализ разных типов оповещений показал превосходство речевых оповещений и спирконов (spearcons, сжатых во времени речевых сообщений) над предметными и абстрактными музыкальными звуками по объективным показателям деятельности и субъективным оценкам предпочтения (Nees, Liebman, 2024), использование речи целесообразно не во всех ситуациях. Речь, не относящаяся к задаче, существенно нарушает когнитивные процессы, в том числе визуальную рабочую память (Baldwin, 2004) и вербальную рабочую память (Gisselgård et al., 2004); при этом речь мало влияет на восприятие свойств звуков (тембр, высота тона) (Baldwin, 2004).
Однако в области неречевых слуховых интерфейсов также возникает много вопросов. Так, систематический обзор интерфейсов, разрабатывавшихся для управления устройствами в пространстве, выявил отсутствие исследований, в которых сравнивались бы типы интерфейсов друг с другом (Разваляева, 2024б). Вследствие этого было проведено экспериментальное исследование, в котором сравнивались пространственный и параметрический/непространственный интерфейсы в задачах разного типа. Результаты количественного анализа эффективности выполнения этих задач были описаны в другой работе (Разваляева, 2026, в печати). В данной статье представлены результаты анализа субъективных оценок слуховых интерфейсов.
Методологический подход, на котором основано исследование, — анализ воспринимаемого качества событий (Носуленко, 2007) и метод референтного общения как способ получения вербального материала (Носуленко, Самойленко, 2020). Подход развивает представления Б.Ф. Ломова о взаимосвязи познания и общения. Метод референтного общения (двух участников исследования друг с другом или с экспериментатором), в частности процедура парных сравнений объектов, побуждает участника исследования эксплицировать наиболее важные свойства описываемого им объекта (Носуленко, Самойленко, 2020). Индуктивный характер анализа вербальной продукции, отсутствие заранее заданных содержательных категорий, позволяет гибко выделять свойства, на основании которых можно построить вербальный портрет — «совокупность семантических групп, описывающих событие» (Носуленко, 2007, с. 158), в которых «отражена иерархия наиболее значимых качеств объекта, с точки зрения воспринимающего субъекта» (Носуленко, Самойленко, 2020, с. 26).
Дополнительно были проверены связи музыкального опыта с эффективностью выполнения задач со слуховыми интерфейсами. Одно из направлений критики сонификации заключается в том, что использующиеся в ней музыкальные шкалы слишком сложны для восприятия непрофессионалами (Neuhoff, 2019). Поэтому для успешного создания слуховых интерфейсов следует определить стратегии сонификации, при которых эта закономерность будет нивелирована, или разрабатывать системы тренировки.
Цели исследования:
- проверить связи субъективных характеристик слуховых интерфейсов с показателями эффективности выполнения задания, предпочитаемой модальностью восприятия и яркостью образной сферы;
- на основе вербальных описаний экспериментальных задач составить вербальные портреты слуховых интерфейсов;
- проверить связи эффективности выполнения задания, яркости слуховых образов и субъективных характеристик слуховых интерфейсов с опытом обучения музыке.
Материалы и методы
Выборка. В исследовании приняли участие студенты и преподаватели (N = 52, 39 женщин, средний возраст — 26,33 ± 12,16 года).
Процедура и методики. Исследование начиналось с чтения информированного согласия. Затем участники заполняли анкету, опросники самоотчета (Плимутский опросник сенсорных образов, Andrade et al., 2014; Разваляева, 2024а; Опросник на полимодальность восприятия, Бандурка, 2004) и проходили компьютеризированную экспериментальную задачу со слуховыми интерфейсами.
Опросники были направлены на измерение характеристик, связанных с разными модальностями восприятия, — предпочтения модальности для получения информации и яркости образов-представлений. Показатели внутренней надежности для шкал опросников на текущей выборке являются достаточно высокими, чтобы проводить с ними дальнейший статистический анализ (Разваляева, 2026, в печати).
Экспериментальная методика содержала задачу управления «космической станцией» с использованием нескольких типов слуховых интерфейсов. Методика включала 4 условия, которые различались по параметру подзадачи (пространственной/непространственной) и слухового интерфейса (пространственного / параметрического, или непространственного). В пространственном слуховом интерфейсе использовались 5 звуков шума с разными настройками панорамы (баланса громкости в левом и правом наушнике). В непространственном интерфейсе использовались 5 сгенерированных тонов разной частоты. Было выделено 4 блока с разной комбинацией этих условий: A (пространственная задача озвучивается пространственными шумами), B (непространственная задача озвучивается пространственными шумами), C (пространственная задача озвучивается непространственными тонами), D (непространственная задача озвучивается непространственными тонами).
Условия предъявлялись интраиндивидуально, эффекты последовательности контролировались с помощью схемы сбалансированного латинского квадрата (4 серии с разным порядком экспериментальных блоков). Подробное описание экспериментальной методики и анализ факторов, вносящих вклад в точность выполнения задачи, содержится в других работах (Разваляева, 2024в; Разваляева, 2026, в печати).
Остановимся подробнее на процедуре получения оценок для анализа воспринимаемого качества события. После второго, третьего или последнего экспериментального блока (в зависимости от серии эксперимента) респонденту предъявлялись 3 шкалы для сравнения предыдущих двух заданий, которые он выполнял: 7-балльная шкала сходства/различия (1 — максимально похожи, 7 — максимально различаются), шкала легкости и шкала предпочтения (дихотомические шкалы с выбором одного из двух блоков). После совершения этих оценок респонденту предлагалось сравнить между собой задания и выделить между ними сходства и различия. В качестве подсказок (чтобы избежать ошибок и перепутываний с более ранними заданиями) предъявлялись краткие описания задач, сравнения между которыми нужно было осуществлять.
Респондент получал следующую инструкцию: «Запишите внизу, чем схожи Задания 1 и 2 и в чем между ними различия. Если Вы упоминаете какую-то характеристику, не забывайте указывать, относится ли она к Заданию 1 или 2. Постарайтесь выделить не менее трех характеристик».
Было выделено 6 серий, включавших разные пары заданий для сравнения. Сериям соответствовали следующие сравнения:
- Серия 1 — сравнение экспериментальных блоков A и B — различаются задачи, одинаковый пространственный слуховой интерфейс;
- Серия 2 — блоки C и D — различаются задачи, одинаковый непространственный слуховой интерфейс;
- Серия 3 — блоки A и С — одинаковые пространственные задачи, различаются слуховыми интерфейсами;
- Серия 4 — блоки B и D — одинаковые непространственные задачи, различаются слуховыми интерфейсами;
- Серия 5 (В и С) и 6 (A и D) — различаются и тип задачи, и тип слухового интерфейса.
Серии 1, 2, 3 и 5 прошли по 9 респондентов, серии 4 и 6 — по 8.
Анализ качественных данных. При анализе вербальных данных, полученных при сравнении заданий, мы опирались на метод анализа воспринимаемого качества события (Носуленко, 2007; Носуленко, 2023; Носуленко и др., 2024). Согласно этому подходу из вербальных данных выделяются вербальные единицы — «более или менее развернутые вербальные высказывания, отражающие отдельные аспекты или целостные сущности воспринимаемых объектов» (Носуленко, 2023, с. 46). Далее вербальные единицы проходят последовательность шагов, на каждом из которых они классифицируются по следующим основаниям:
- сходство (sim) или различие (dif);
- обобщенное описание (gen) или выделение конкретного критерия (con);
- для различий с конкретным критерием — классификационное различие (con), при котором основания для классификации двух стимулов различаются, или градуальное (gra), в котором различие проводится по единому основанию;
- целое/часть (с уточнением, какая часть описывалась);
- дескриптор, связанный с восприятием стимула (например, тип звука, громкость) / дескриптор, связанный с субъективными переживаниями (например, эмоции, трудность/легкость, когнитивная нагрузка и т. д.);
- конкретизация дескрипторов;
- отношение характеристики к описываемому стимулу — да/нет — и приписывание ей веса (0,5 — выражена в слабой степени, 1 — обычный уровень выраженности, 1,5 — выражена в сильной степени).
Разметка выделенных вербальных единиц осуществлялась в программе, написанной на языке Python 3.13.2 с использованием пакетов PyQt6, sqlite3 и csv. После первичной обработки выделенные списки дескрипторов подвергались сокращению с помощью анализа семантической близости. Для каждого дескриптора подсчитывался индекс его представленности в наборе данных, относящихся к данному событию (в данном случае — экспериментальному блоку), по формуле (Носуленко и др., 2024):
где kp — вес единицы, подсчитывающийся по формуле:
Данный индекс позволяет определить непротиворечивость использования выделенного признака, степень согласия разных участников исследования, проводящих сравнение, в том, как он соотносится с описываемым ими объектом.
Анализ количественных данных проводился с помощью языка R 4.4.2 (R Core Team, 2024). Проводился анализ групповых различий (критерий Краскела-Уоллиса) и анализ связей (хи-квадрат Пирсона, rho Спирмена).
Результаты
Оценки заданий по шкалам. Оценки различий между блоками имели бимодальное распределение (рис. 1) и не показали значимых различий в группах, выделенных в зависимости от предпочтения блока, оценки его легкости и пары сравнивавшихся блоков (критерий Краскела-Уоллиса).
Оценки легкости и предпочтения блоков были значимо связаны: блок D (непространственная задача с непространственным слуховым интерфейсом) реже всего оценивался как легкий или предпочтительный. Даже когда блок D оценивался как легкий, в 3 из 7 случаев участники исследования не выбрали его как предпочитаемый. Чаще всего в качестве предпочтительного и легкого выбирался блок C (пространственный слуховой интерфейс и непространственная задача).
Таблица 1 / Table 1
Соотношение оценок легкости и предпочтения блоков в экспериментальной задаче
The relationship between ratings of ease and preference in the experimental task
|
Легкий блок / Ease rating |
Предпочитаемый блок / Preference rating |
χ2 Пирсона / Pearson’s chi-squared |
||||
|
A |
B |
C |
D |
Сумма/Sum |
||
|
А |
13 |
0 |
0 |
0 |
13 |
χ2 = 90, df = 9, p < 0,001 |
|
B |
3 |
10 |
0 |
1 |
14 |
|
|
C |
0 |
0 |
18 |
0 |
18 |
|
|
D |
0 |
2 |
1 |
4 |
7 |
|
|
Сумма/Sum |
16 |
12 |
19 |
5 |
- |
|
Рис. 1. Распределение оценок различий между блоками по шкале
Fig. 1. Distribution of differences between blocks
Связь оценок по шкалам с параметрами восприятия слуховой информации и эффективностью выполнения задания. Корреляционный анализ показал, что оценки различия между блоками не были связаны с предпочитаемыми модальностями для получения информации, яркостью слуховых образов, точностью выполнения экспериментального задания и временем реакции.
В анализе групповых различий было выявлено, что точность выполнения экспериментального задания имела значимые различия в зависимости от блока, выделенного как легкий (χ2 Краскела-Уоллиса — 10,86, df = 3, p = 0,01). Тест Данна (с поправкой Бенджамини-Хохберга) показал, что различия были между блоками A и D (p = 0,03) и C и D (p = 0,004); если блок D оценивался как легкий, среднее число ответов было выше (M = 89,7 ± 4,15), чем при оценке блоков A (M = 73,2 ± 14,0) и C (M = 67,3 ± 16,0). Для других переменных (времени реакции и показателей опросников) групповых различий в зависимости от оценки легкости блока обнаружено не было.
Развернутые вербальные описания: характеристики вербальных единиц. Из 52 описаний сходств и различий между заданиями были выделены 308 вербальных единиц. Были удалены данные 1 респондента, который не принял задачу. При анализе часть единиц дублировалась (оценки sim, dif/gen и dif/con/gra), поэтому выборка для анализа составила 408 классифицированных высказываний. Количество высказываний на участника исследования варьировало от 2 до 19 (M = 7,75 ± 3,43). Количество высказываний в зависимости от описываемой ситуации представлено в табл. 2.
Таблица 2 / Table 2
Количество высказываний участников исследования в зависимости от сравниваемого задания
The quantity of the verbalizations in relation to different tasks
|
Блок/Block |
Всего единиц / Count |
Min |
Max |
M |
SD |
Med |
|
A |
100 |
1 |
10 |
3,85 |
2,03 |
3 |
|
B |
91 |
2 |
7 |
3,79 |
1,32 |
3,5 |
|
C |
104 |
1 |
10 |
4,00 |
1,90 |
4 |
|
D |
100 |
1 |
9 |
4,00 |
2,02 |
4 |
Примечание: Min — минимум; Max — максимум; M — среднее значение; Med — медиана; SD — стандартное отклонение.
Note: Min — minimum; Max — maximum; M — mean; Med — median; SD — standard deviation.
Примеры выделенных вербальных единиц разного типа:
- сходства — sim: «оба задания были сложными» (sim/gen), «задания были похожи, потому что в них использовался один и тот же набор звуков» (sim/con);
- различия — dif: «эти задания отличаются по типу звука» (dif/gen); «задание 1 довольно простое» (dif/con/cla); «звуки в первом задании сложнее отличить, чем во втором» (dif/con/gra).
В целом было выделено больше вербальных единиц о различиях, чем о сходстве (261 dif, 134 sim), больше конкретных, чем обобщенных (259 con, 136 gen), и классификационных больше, чем градуальных (195 cla, 34 gra). 298 высказываний были о частях, которые выделялись в задании: 1) звуки в целом (n = 229, еще 18 было о каком-то конкретном звуке в интерфейсе); 2) интерактивные элементы графического интерфейса (28 + 4 о конкретном элементе — кнопке или стрелке); 3) тренировка перед заданием (n = 11); 4) значения, приписываемые элементам задания (n = 6).
Связи характеристик вербальных единиц с оценками различий по шкале. Были выделены 2 группы по шкальной оценке различий между блоками: в группу, указавшую сходство между заданиями, вошли респонденты с оценками 1—4 (n = 22), в группу, указавшую их различие, — с оценками 5—7 (29). Были получены значимые связи этих групп с разными характеристиками вербальных единиц — с типами sim и dif (χ2 Пирсона — 8,64; df = 1; p = 0,003), и типами cla и gra (χ2 = 7,99; df = 1; p = 0,005). Респонденты, выделяющие различия между блоками по шкале, в дальнейшем делают больше высказываний о различиях (170 vs 66); те же, кто отметил сходство между блоками по шкале, делают примерно равное количество высказываний о сходствах (68) и различиях (91). Классификационные вербальные единицы преобладали в обеих группах (120 при оценках различия, 75 при оценках сходства), но респонденты, которые отмечали различие по шкале, чаще использовали градуальные сравнения (30 vs 4).
Характеристики вербальных единиц у респондентов с разной эффективностью выполнения экспериментальной задачи и обработкой слуховой информации. Выборка была разбита на группы по медиане по следующим переменным: сумма правильных ответов в задаче, яркость слуховых образов и предпочтение слуховой модальности. Связь с типом вербальных единиц проводилась с помощью χ2 Пирсона. Значимых связей получено не было.
Вербальные портреты заданий: дескрипторы, связанные с восприятием задачи. Дескрипторы, описывающие отдельные признаки задачи, были выделены в 291 вербальной единице у 48 респондентов. Однако в анализ вошли только те из них, которые были в конкретных высказываниях (con), так как они были информативными и привязанными к конкретному заданию из пары, которое описывал участник исследования (189 вербальных единиц).
В табл. 3 приведены дескрипторы, наиболее часто и непротиворечиво упоминавшиеся в связи с разными заданиями в экспериментальной задаче, веса которых составили более 5% от общей суммы весов для соответствующего задания.
Таблица 3 / Table 3
Вербальные портреты экспериментальных блоков: дескрипторы, связанные с их восприятием
Verbal portraits of experimental blocks: descriptors of their perception
|
Блок / Block |
Дескриптор / Descriptor |
Часть / Part |
n |
F |
% |
|
A |
Положение в пространстве / Localization |
Звуки / Sounds |
13 |
13 |
32,88 |
|
Шум (тип звука) / Noise (sound type) |
Звуки / Sounds |
6 |
6 |
15,18 |
|
|
Большее количество / Quantity |
Кнопки / Buttons |
3 |
3 |
7,59 |
|
|
Стрелки / Arrows |
Кнопки / Buttons |
3 |
3 |
7,59 |
|
|
Громкость / Volume |
Звуки / Sounds |
2 |
2 |
5,06 |
|
|
B |
Высота звука / Pitch |
Звуки / Sounds |
7 |
7 |
17,80 |
|
Положение в пространстве / Localization |
Звуки / Sounds |
7 |
7 |
17,80 |
|
|
Шум (тип звука) / Noise (sound type) |
Звуки / Sounds |
6 |
6 |
15,25 |
|
|
Большее количество / Quantity |
Кнопки / Buttons |
4 |
-4 |
10,17 |
|
|
Соответствие каждого звука одной кнопке / Each sound corresponds to a single button |
Звуки / Sounds |
4 |
-4 |
10,17 |
|
|
Предметное значение / Object-relatedness |
Тренировка / Training |
2 |
-2 |
5,08 |
|
|
Громкость / Volume |
Звуки / Sounds |
2 |
2 |
5,08 |
|
|
C |
Высота звука |
Звуки / Sounds |
13 |
13 |
33,51 |
|
Стерео (звучит в обоих наушниках) / Stereo sound (in both headphones) |
Звуки / Sounds |
3 |
3 |
7,73 |
|
|
Соответствие каждого звука одной кнопке / Each sound corresponds to a single button |
Звуки / Sounds |
3 |
3 |
7,73 |
|
|
Предметное значение |
Тренировка / Training |
2 |
2 |
5,15 |
|
|
Стрелки / Arrows |
Кнопки / Buttons |
2 |
2 |
5,15 |
|
|
Повторы / Repetitions |
Звуки / Sounds |
2 |
2 |
5,15 |
|
|
Писк (тип звука) / Squeak (sound type) |
Звуки / Sounds |
2 |
2 |
5,15 |
|
|
D |
Высота звука / Pitch |
Звуки / Sounds |
13 |
9,31 |
23,09 |
|
Соответствие каждого звука одной кнопке / Each sound corresponds to a single button |
Звуки / Sounds |
5 |
-5 |
12,40 |
|
|
Стерео (звучит в обоих наушниках) / Stereo sound (in both headphones) |
Звуки / Sounds |
4 |
4 |
9,92 |
|
|
Большее количество / Quantity |
Звуки / Sounds |
4 |
4 |
9,92 |
|
|
Тон (тип звука) / Tone (sound type) |
Звуки / Sounds |
3 |
3 |
7,44 |
Примечание: n — количество вербальных единиц с данным дескриптором; F — вес дескриптора.
Note: n — quantity of verbalizations with the descriptor; F — weight of the descriptor.
Вербальные портреты заданий: субъективные переживания при прохождении заданий. Дескрипторы, связанные с субъективными переживаниями, были менее распространены, по сравнению с теми, в которых выделялись перцептивные признаки задания (n = 104); все они вошли в анализ, так как даже в общих вербальных единицах можно было выделить их направление (связь с первой или второй задачей из пары). Представленность данных дескрипторов в разных экспериментальных задачах отражена в табл. 4. Дескрипторы, которые упоминались только 1 раз, были исключены из таблицы.
Таблица 4 / Table 4
Вербальные портреты экспериментальных блоков: дескрипторы, связанные с субъективными переживаниями
Verbal portraits of experimental blocks: descriptors of subjective experiences
|
Блок / Block |
Дескриптор / Desctiptor |
Часть / Part |
n |
F |
% |
|
A |
Запоминающийся* / Memorable* |
Звуки / Sounds |
2 |
-1 |
13,89 |
|
Различимый / Distinguishable |
Звуки / Sounds |
6 |
0,2 |
2,78 |
|
|
Легкий / Easy |
Все задание / All task |
5 |
0 |
0 |
|
|
B |
Легкий* / Easy* |
Все задание / All task |
6 |
4 |
26,67 |
|
C |
Ресурсоемкий* / Resource-intensive* |
Все задание / All task |
3 |
2 |
15 |
|
Неприятный* / Unpleasant* |
Звуки / Sounds |
2 |
2 |
15 |
|
|
Различимый* / Distinguishable* |
Звуки / Sounds |
2 |
-1 |
7,5 |
|
|
Легкий* / Easy* |
Все задание / All task |
5 |
-1 |
7,5 |
|
|
Вызывающий предметные метафоры / Invoking object metaphors |
Звуки / Sounds |
3 |
-0,33 |
2,5 |
|
|
D |
Различимый*/ Distinguishable* |
Звуки / Sounds |
5 |
5 |
33,33 |
|
Запоминающийся*/ Memorable* |
Звуки / Sounds |
4 |
2 |
13,33 |
|
|
Легкий* / Easy* |
Все задание / All task |
4 |
1 |
6,67 |
|
|
Ресурсоемкий / Resource-intensive |
Все задание / All task |
3 |
0 |
0 |
|
|
Понятный / Comprehensible |
Звуки / Sounds |
2 |
0 |
0 |
Примечание: n — количество вербальных единиц с данным дескриптором; F — вес дескриптора; (*) — дескриптор составил больше 5% от общей суммы весов (F) по заданию.
Note: n — quantity of verbalizations with the descriptor; F — weight of the descriptor; (*) — the descriptor’s weight (F) is larger than 5% of the sum of the weights.
Опыт обучения музыке: связи с эффективностью выполнения задания, субъективными оценками и восприятием слуховой информации. Проводилось сравнение респондентов, указавших опыт обучения в музыкальной школе (n = 16) и не указавших. Анализ групповых различий показал, что экспериментальное задание лучше выполнялось теми, кто обучался в музыкальной школе (U-критерий Манна-Уитни — 196, p = 0,044; M = 81,5 ± 14,5), чем теми, кто не обучался музыке (M = 71 ± 16,6). Для точности выполнения заданий в условии пространственного интерфейса этот эффект отсутствовал (p = 0,336), однако он сохранялся для непространственного интерфейса (U = 134,5; p = 0,002; M = 35,5 ± 9,10 у тех, кто не обучался музыке; M = 42,8 ± 5,69 у тех, кто обучался).
Различий по времени реакции, яркости слуховых образов и предпочтению слуховой модальности между участниками с опытом музыкального образования и без него обнаружено не было. Субъективные шкалы — оценки различий между блоками, легкости и предпочтения блоков — также не были связаны с музыкальным образованием.
Обсуждение результатов
Характеристики субъективных оценок экспериментальных заданий по шкалам. Анализ сравнения блоков по шкалам сходства-различия, легкости и предпочтения показал, что участники исследования делились на 2 примерно равные группы — те, кто оценивал предложенные задания как схожие, и те, кто оценивал их как различные. Оценки сходства-различия были связаны только с показателями вербальных единиц — сходством/различием и классификационным/градуальным содержанием. Эти результаты частично согласовывались с данными, полученными при вербальных оценках тембров звука, где также было показано, что при разных оценках сходства и различия по шкале содержание высказываний по сходству и различию соответствовало этим оценкам (Носуленко, 2007).
Оценка блоков по легкости и предпочтительности расширяет результаты количественного анализа эффективности выполнения задания (Разваляева, 2026, в печати). Там было показано, что конгруэнтность слухового интерфейса типу задачи вносит значимый вклад в вероятность правильного ответа (блоки A и D). Однако при этом блок D реже всего оценивался как легкий и предпочтительный; блок A был на 3-м месте по легкости и на 2-м по предпочтительности после блока C. Возможно, именно благодаря относительной субъективной сложности блока D респонденты, отмечавшие его как легкий, лучше справлялись с заданием в целом.
Дескрипторы, связанные с восприятием задачи и с субъективными переживаниями. Большая часть дескрипторов, связанных с восприятием заданий, полностью согласована среди респондентов. Выделенные характеристики достаточно точно описывают разные условия экспериментальной задачи.
Для пространственных слуховых интерфейсов (блоки A и B) выделены дескрипторы звука: «шум», «положение в пространстве», и «громкость». Возможно, несмотря на процедуру подстройки субъективной громкости звуков перед началом исследования, участники эксперимента с течением времени начинали воспринимать шум как более громкий. Результаты эмпирических исследований сгенерированных и повседневных шумов показывают, что шум связан с эффектом раздражения, особенно при высокой интенсивности (Lee et al., 2017; Rimskaya-Korsakova et al., 2022). Также вероятно, что громкость выделялась, потому что различия в интенсивности шума, подаваемого на разные уши, выступали механизмом формирования локализации звука (данные единицы вошли в категорию «положение в пространстве»).
Стоит также отметить, что в блоке B появился дескриптор «высота звука»; можно предположить, что в непространственной форме задания участники исследования начинали пытаться выделить непространственные характеристики звука, так как ориентировка на положение звука в левом или правом ухе не согласовывалась с положением кнопок на дисплее («крайним точкам» на звуковой шкале соответствовали расположенные рядом кнопки).
Для непространственных слуховых интерфейсов (блоки C и D) были выделены следующие дескрипторы звука: высота звука, тип звука (который обозначался как тон или писк), стереозвук (отмечалось, что звук подается на оба наушника). При том, что количество звуков во всех заданиях было одинаковым, для блока D оно воспринималось как большее (F = 4). Этот эффект возникал за счет противопоставлений с пространственными слуховыми интерфейсами, где звук шума воспринимался как один звук с разными положениями в пространстве. В блоке C в двух вербальных единицах возникала тема повторов, паттернов, которые участники исследования начинали выделять в последовательности звуков (хотя на самом деле порядок звуков в каждом блоке был рандомизирован).
Дескрипторы для элементов интерфейса и тренировки были гораздо меньше в целом представлены в данных, однако некоторые из них были направлены в одну сторону и поэтому вошли в вербальные портреты экспериментальных ситуаций. Так, для кнопок выделился дескриптор «большее количество» для блока A (5 кнопок); с отрицательным знаком этот предиктор был представлен в блоке B (3 кнопки). В блоках А и C с пространственным заданием ответ давался с помощью стрелок, что тоже было отмечено. Тренировка описывалась дескриптором «предметное значение» — т. е. выделялись элементы «легенды», на которые происходила ориентировка во время тренировки. Эти элементы чаще упоминались в пространственном задании C (астероид, появлявшийся за бортом космической станции), в противопоставление заданию B (в нем были только индикаторы, указывающие необходимость нажатия на кнопку).
Дескрипторы субъективных переживаний при прохождении экспериментального задания были более разнообразны, и в своем большинстве или не согласованы, или представлены единственной вербальной единицей. Так, наибольшее рассогласование наблюдалось в блоке A, где самые частотные дескрипторы — различимые звуки и легкое задание — вызвали наибольшее противоречие среди респондентов (соответствующие значения весов F — 0,2 и 0). Единственный согласованный дескриптор для блока A — незапоминающиеся звуки. Задание из блока B оценивалось, скорее, как более легкое.
Блоки C и D c непространственными интерфейсами имели больше согласованных оценок. Звуки из блока С оценивались как неприятные и трудно различимые, звуки из задания D — как различимые и запоминающиеся. Оценки согласованности по дескриптору «легкий» для описания всего задания были низкими, но блок D оценивался как скорее легкий (n = 4, F = 1), а блок C — как скорее сложный (n = 5, F = -1) и ресурсоемкий (F = 2), т. е. требующий усилий (внимания, памяти, скорости реакции).
Субъективные оценки легкости, выделенные из вербальных описаний, противоречили как оценкам по шкалам, так и результатам количественного анализа (Разваляева, 2026, в печати). Возможно, это связано с разной оценкой звуков в зависимости от типа задания. Так, одни и те же тоны, использовавшиеся в непространственном интерфейсе (C и D), воспринимались участниками исследования как трудноразличимые в условии, где было 5 вариантов ответа, и как более различимые там, где присутствовали 3 варианта ответа и достаточно было ориентировки на самый низко- и высокочастотный звуки.
Опыт обучения музыке. Связь опыта обучения в музыкальной школе с выполнением заданий с непространственным интерфейсом может объясняться лучшей способностью к распознаванию высоты тонов, которая развивается при обучении музыке. Так, у взрослых, имевших опыт как минимум пятилетнего обучения музыке, были значимо лучшие результаты по задачам, связанным с дифференциацией тонов (Psarris et al., 2024). Музыкальное образование, в частности обучение сольфеджио, в совокупности с другими генетическими и культурными факторами, также вносят вклад в формирование абсолютного слуха — способности к идентификации тона без сравнения с другими тонами (Herceg, Szabó, 2023). В будущих исследованиях слуховых интерфейсов с использованием тональных звуков следует учесть возможное влияние со стороны этой характеристики. Также представляется перспективной проверка применимости звуков естественной акустической среды в слуховых интерфейсах как гипотетически более доступных для людей с разным уровнем музыкальных способностей.
Выводы
- Субъективные оценки легкости слуховых интерфейсов в экспериментальной задаче были связаны с оценками их предпочтения и точностью выполнения задания.
- Выделенные из вербальных описаний дескрипторы, связанные с восприятием, достаточно точно описывали характеристики звука, элементов интерфейса и тренировки. Дескрипторы, связанные с субъективными переживаниями, описывали задание в целом и звуки и имели больший разброс и неоднородность.
- Точность выполнения задания с использованием непространственного интерфейса была связана с опытом музыкального образования.