Введение
Известно, что люди с расстройствами аутистического спектра (РАС) обладают повышенной чувствительностью к окружающим шумам
[O’Connor, 2012], в особенности, когда они слушают обращенную к ним речь
[James, 2022]. Им труднее, чем обычным людям, воспринимать речь в толпе, в учебном классе, в транспорте — в любой шумной обстановке. При этом в тихой и спокойной обстановке те же люди слышат отчетливую речь не хуже «нейротипичных» людей. Низкая помехоустойчивость слухоречевого восприятия особенно негативно сказывается на детях с РАС, которые, будучи не в состоянии воспринимать речь в шуме классной комнаты, оказываются в неблагоприятном положении по сравнению со своими сверстниками. Повышенная чувствительность к шуму может также тормозить развитие языковой компетентности и использование языка в социальном контексте.
Восприятие речи в шуме у людей с РАС может ухудшаться в силу нескольких причин. Во-первых, это повышенная чувствительность к так называемой энергетической маскировке, т.е. к шуму, спектр которого перекрывается со спектром целевой речи
[Bhatara, 2013; Foxe, 2013; Schelinski, 2019]. Во-вторых, это сниженная способность использовать для восприятия речи перерывы в шуме. Окружающие нас звуки флуктуируют во времени, благодаря чему обрывки речи могут восприниматься слушателями во время промежутков относительной тишины и интегрироваться (или достраиваться) в слова и предложения. Сниженная способность пользоваться перерывами в шуме может значительно осложнять у людей с РАС выделение целевого речевого сигнала из потока звуков окружающей среды
[Alcantara, 2004; Dunlop, 2016; Groen, 2009]. В-третьих, людям с РАС особенно трудно выделять целевую речь и следить за беседой при наличии нескольких, одновременно говорящих людей. При такой информационной маскировке элементы речи конкурирующего говорящего могут ошибочно приниматься за элементы целевой речи
[Simpson, 2005]. В данной работе мы остановимся на роли двух первых факторов — энергетической маркировки и способности интегрировать отрывочные элементы речи.
У людей с РАС и нормальным уровнем слуха повышение чувствительности к энергетической маскировке может быть обусловлено общими нарушениями обработки слуховой информации. K. Plaisted и соавторы
[Plaisted, 2003] обнаружили у нормально слышащих взрослых с аутизмом наличие более широких, чем в норме, слуховых фильтров. Они предположили, что частотная избирательность слуха при аутизме снижена уже на уровне улитки. Однако исследования на животных моделях аутизма показывают, что слуховые нарушения возникают прежде всего из-за дефицита центральной обработки и наблюдаются на всем протяжении слуховой системы: ствола мозга, промежуточного мозга и слуховой коры
[Castro, 2022]. Действительно, при РАС функциональные и структурные нарушения наблюдаются в разных звеньях слухового пути: в стволе мозга, таламусе, слуховой коре
[Kulesza, 2011; Nair, 2015; Plaisted, 2003; Russo, 2009; Schelinski, 2022]. Возможно, что нарушения восприятия речи в шуме при РАС могут быть следствием более общих структурно-функциональных аномалий на различных уровнях слухового анализатора.
Еще одной причиной сниженной помехоустойчивости могут быть проблемы с вниманием. При типичном развитии улучшение выделения сигнала на фоне шума с возрастом идет параллельно с улучшением контроля внимания и коррелирует с ним
[Jones, 2015; Thompson, 2017]. Внимание оптимизирует кодирование речи, настраивая фильтры на уровне слуховой коры
[Ahveninen, 2011] и подкорковых структур
[Price, 2021], а также усиливая передачу сигнала в первичных слуховых путях как в прямом восходящем, так и в обратном нисходящем направлениях
[Price, 2021]. Поскольку синдром дефицита внимания часто сопутствует РАС
[Antshel, 2016], он также может вносить вклад в дефицит восприятия речи на фоне шума. Нельзя также исключить и роль снижения мотивации к восприятию слышимой речи при РАС, что может приводить к снижению обработки в затрудненных условиях.
Помимо перечисленных общих факторов, потенциально снижающих помехоустойчивость слухоречевого восприятия при РАС, исследователи рассматривают также причины, специфичные именно для обработки слухоречевых сигналов. К их числу относят сниженную способность мозга людей с РАС интегрировать слухоречевую информацию во времени и достраивать ее до целостных словоформ (т.н. гипотеза «слабой центральной когерентности»
[Frith, 2003]). Поскольку шумы окружающей акустической среды, как правило, непостоянны, врéменные снижения интенсивности шума помогают улучшить распознавание речи. Наш мозг улавливает элементы речи в промежутках относительной тишины и интегрирует их в целостные образы на основе шаблонных семантических структур и/или социальных ожиданий. Было показано, что наличие кратких интервалов в шуме (т.н. амплитудно-модулированный, или флуктуирующий шум) в меньшей степени помогало людям с РАС распознавать зашумленную речь, чем нейротипичным испытуемым
[Alcantara, 2004; Dunlop, 2016; Groen, 2009].
Несмотря на то, что большинство исследований указывают на ухудшение восприятия речи в шуме у людей с РАС, результаты таких исследований расходятся в деталях. Так, обнаружив у испытуемых с РАС ухудшенное по сравнению с типично развивающимися детьми восприятие речи на фоне флуктуирующего по интенсивности шума, некоторые исследователи не нашли у них нарушения восприятия на фоне стационарного (т.е. непрерывного) шума
[Alcantara, 2004; Dunlop, 2016; Groen, 2009; Irwin, 2011; Smith, 2007], тогда как другие показали, что стационарный шум ухудшает восприятие речи у людей с РАС в большей степени, чем у контрольных испытуемых
[Bhatara, 2013; Foxe, 2013; Schelinski, 2019].
Причинами таких различий могут являться гетерогенность нарушений у испытуемых с РАС, включенных в разные исследования, а также различия в методах оценки слухоречевого восприятия. Примечательно, что все до сих пор опубликованные исследования восприятия речи в шуме при РАС либо включали участников с нормальным интеллектом
[Alcantara, 2004; Bhatara, 2013; Dunlop, 2016; Foxe, 2013; Groen, 2009; Schelinski, 2019; Smith, 2007], либо не сообщали данных об их IQ
[Irwin, 2011].
С одной стороны, включение в исследование только высокофункциональных участников является попыткой уравнять влияние на выполнение задачи таких факторов, как внимание, мотивация, способность следовать инструкциям. С другой — такой подход исключает охват значительного числа случаев, поскольку около 50% детей с РАС имеют либо легкую степень умственной отсталости (IQ≤70), либо относятся к пограничному диапазону (IQ=71–85)
[Morbidity and Mortality, 2018]. В то же время для коррекционной работы с такими детьми важно понимать, является ли нарушение восприятия речи в шуме обособленным дефицитом слухоречевого восприятия, либо оно связано с общим снижением интеллекта.
В данной работе мы задались
целью выяснить, как шум влияет на восприятие речи у детей с РАС с широким диапазоном когнитивных способностей. Поскольку у детей с РАС снижение интеллекта коррелирует как с общей степенью нейрофизиологических нарушений
[Manyukhina, 2022; Viscidi, 2013], так и с выраженностью нарушений в слуховой системе
[Hashimoto, 1992; Williams, 2021],
мы предположили, что дети с РАС и сниженным интеллектом будут испытывать бóльшие трудности при восприятии речи на фоне шума.
Мы также проверяли вклад двух типов факторов в ухудшение восприятия речи на фоне шума у детей с РАС. Такое ухудшение может быть как простым следствием низкой помехоустойчивости, так и возникать, как предполагает гипотеза слабой центральной когерентности [Frith, 2003], из-за трудностей интеграции ясно слышимых отдельных фрагментов слова в единое целое. Для оценки вклада этих факторов мы исследовали у детей с РАС и контрольной группы типично развивающихся детей влияние на восприятие слов непрерывного и амплитудно-модулированного шумов, а также специфический эффект амплитудной модуляции.
В нашем исследовании мы использовали экспериментальную парадигму, ранее предложенную W.B. Groen и коллегами
[Groen, 2009], в которой слова подавались на фоне стационарного либо модулированного по амплитуде шумов разного уровня громкости. Мы модифицировали эту парадигму таким образом, что выполнение задания стало доступным детям с ограниченными когнитивными способностями. Для того чтобы убедиться, что участники нашего исследования обладали достаточной речевой компетентностью и следовали инструкции, мы включили в исследование только тех детей, которые были способны повторить все использованные в эксперименте слова, если они предъявлялись без шума.
Материалы и методы
Выборка. Участников с РАС рекрутировали в исследование из числа учащихся Федерального ресурсного центра ФГБОУ ВО МГППУ, либо через объявления в СМИ. Общими критериями включения в выборку были возраст от 7 до 12 лет включительно и способность следовать инструкциям при тестировании. Все дети с РАС были диагностированы психолого-медико-педагогической комиссией в соответствии с критериями, установленными МКБ-10 (F84.0, F84.1, F84.5) [WHO. The ICD-10, 1993], либо независимым психиатром в соответствии с критериями, установленными DSM-V [APA. Diagnostic and, 2013]. Типично развивающиеся дети были приглашены через объявления в СМИ. В контрольную группу были включены только типично развивающиеся дети без неврологических и психиатрических нарушений, посещающие общеобразовательные школы.
Изначально мы протестировали 50 детей с РАС и 38 типично развивающихся детей. Семь детей с РАС не были включены в данную выборку из-за неспособности следовать инструкциям. Один ребенок с РАС был исключен из-за подозрения на снижение чувствительности слуха. Конечную выборку составили 38 типично развивающихся детей (ТР; 8 девочек; M=10,01 лет, SD=1,59 лет, Mе=10,00 лет, возрастной диапазон — 7,00–12,83 лет) и 42 ребенка с РАС (РАС; 5 девочек; M=10,62 лет, SD=1,39 лет, Me=10,83 лет, возрастной диапазон — 7,40–12,83), способных следовать инструкциям при выполнении психофизического теста. Группы были уравнены по возрасту (U=983,50, z=1,78, p=0,075). Половой состав в группах значимо не различался (z=1,11, p=0,280). Все участники исследования были монолингвальными носителями русского языка.
Этапы и методы исследования. Исследование было разделено на два сеанса, проводившихся в отдельные дни. Аудиометрия и психофизическое тестирование проводились в один день и занимали около 10 и 40 минут соответственно. Оценку уровня интеллекта (1-2 часа — в зависимости от особенностей испытуемого) проводили в отдельные дни — до или после психометрического тестирования.
Уровень интеллекта оценивался с помощью Батареи тестов Кауфмана для детей (KABC-II) [Kaufman, 2004]. Батарея рекомендована для тестирования интеллекта у детей с аутизмом [Klin, 2005], поскольку она в меньшей степени чем, например, широко распространенный тест Векслера, опирается на вербальные способности и приобретенные знания; ее стимулы просты и визуально привлекательны, а шкалы тесно связаны с нейрофизиологическими процессами. Включенное в процедуру стандартизации положение позволяет тестирующему обучать и демонстрировать ребенку начальные стимулы в каждом субтесте. Это дает возможность проверить способность ребенка к обучению с использованием имитации по модели и иногда позволяет тестирующему преодолеть первоначальную неспособность ребенка понять инструкции.
С позиций модели А.Р. Лурии [Luria, 1980] шкалы KABC-II оценивают способность к обучению, к последовательной и одновременной обработке информации и к планированию. С точки зрения модели Кеттелла–Хорна–Кэрролла [McGrew, 2005] KABC-II измеряет долгосрочное хранение и извлечение данных, кратковременную память, визуальную обработку, подвижный и кристаллизованный интеллект. Названия шкал KABC-II отражают как конструкты, описанные в модели А.Р. Лурии, так и составляющие модели Кеттелла–Хорна–Кэрролла:
- Шкала «Запоминание новой информации» (Learning Scale Index) оценивает способность ребенка хранить и эффективно извлекать новую или ранее изученную информацию;
- Шкала «Последовательная обработка информации» (Sequential Scale Index) оценивает способность запоминать и воспроизводить линейно или временно связанные единицы информации в последовательном порядке.
- Шкала «Целостная обработка информации» (Simultaneous Scale Index) необходима для оценки способности ребенка к интеграции одновременно воспринимаемой информации, в первую очередь зрительной, и умения анализировать пространственные отношения между объектами.
- Шкала «Логика» (Planning Scale Index) измеряет способности ребенка к установлению логических закономерностей, навыки принятия решения при выборе наиболее подходящего варианта из нескольких альтернатив.
Индекс общего интеллекта (Mental Processing Index, MPI), использованный в нашем исследовании, опирается на эти четыре шкалы.
Интеллект был оценен у 40 из 42 детей с РАС и варьировал в диапазоне от 53 до 119 баллов (M=83,50, SD=16,29, Me=80,00). В случае группы ТР детей оценки интеллекта имелись для 21 из 38 детей (M=114,29, SD=13,12, Me=112,00, диапазон 85–138 баллов). У остальных детей интеллект не был оценен по организационным причинам.
Состояние слуха участников определяли с помощью тональной пороговой аудиометрии. Аудиометрия проводилась специалистом соответствующей квалификации на оборудовании «Аудиометр АА-02» (Биомедилен). Слуховая чувствительность тестировалась на частотах 125, 250, 500, 1000, 2000, 4000, 6000 и 8000 Гц, а пороговые значения регистрировались в децибелах уровня слышимости (дБ) относительно нормальной слуховой чувствительности [ИСО 8253-1:2010]. Среднее пороговое значение было рассчитано с использованием порогов на наиболее важных для восприятия речи частотах 500, 1000, 2000 и 4000 Гц в каждом ухе. Все участники, включенные в настоящее исследование, имели нормальный слух (пороги уровня слуха ≤25 дБ для этих частот).
Исследование было проведено в соответствии с Хельсинкской декларацией и одобрено этическим комитетом ФГБОУ ВО МГППУ. Участники были проинформированы, что они могут отказаться от участия в исследовании на любом его этапе и без объяснения причин. Информированное согласие было получено от родителей или законных представителей всех детей.
Стимульный материал: слова. Для этого исследования нами был разработан психофизический тест «Слова в шуме», который включает 160 двусложных лемматизированных существительных русского языка, обладающих высокой образностью (способностью пробуждать невербальные образы). Слова были подобраны из числа часто встречающихся, согласно частотному списку имен существительных
[Ляшевская, 2009] либо списку 300 часто употребляемых в быту и речи слов
[Семенович, 2015]. Все слова соответствовали возрастной норме для детей от 6 лет.
Слова были произнесены женщиной 35 лет с нейтральной, безэмоциональной интонацией и записаны на оборудовании звукозаписывающей студии. Далее слова были приведены к среднему уровню звукового давления 60 дБ с помощью функции spl стороннего пакета программного обеспечения (ПО) для MATLAB R2020a
[Sound Pressure Level]. Средняя продолжительность речевого стимула составила 694 мс (SD=77 мс).
Стимульный материал: маскировочный шум. В качестве маскировки использовался розовый шум. Розовый шум — это шум, спектральная плотность мощности которого обратно пропорциональна частоте (1/f), то есть это шум, равномерно убывающий в логарифмической шкале частот. Спектральная плотность такого шума затухает на 3 дБ на каждую октаву. В отношении маскировки речи розовый шум более эффективен, чем белый шум, ввиду того, что его частотный спектр более близок к частотному спектру речи. Также розовый шум имеет низкую энергию на высоких частотах, что делает его субъективно менее неприятным, чем белый шум. Шум был двух типов: непрерывный (стационарный, СТ) и амплитудно-модулированный (АМ). СТ и АМ шумы были синтезированы на ПО MATLAB R2020a (MathWorks, Inc.) с помощью встроенных функций pinknoise и ammod. Амплитудно-модулированный шум получали путем модуляции СТ шума по амплитуде с помощью синусоидальной функции частотой 10 Гц (т.е. розовый шум прерывался 10 раз в секунду); модуляция начиналась с фазы 0°. Подъем / спад интенсивности были сглажены на отрезке 1 мс.
Слова предъявлялись с уровнем звукового давления приблизительно 60 дБ (SPL), при 4 уровнях и двух типах маскировки. При маскировке СТ шумом его уровень составлял 60, 63, 66 и 69 дБ звукового давления. АМ шум достигал этих значений на пике волны. Далее эти отношения сигнал–шум (ОСШ) будут обозначены как СТ-0, СТ-3, СТ-6, СТ-9, АМ-0, АМ-3, АМ-6 и АМ-9 соответственно (табл. 1).
Таблица 1
Обозначения условий, используемые в статье
|
|
Отношение сигнал/шум (ОСШ)*
|
|
Тип шума
|
0
|
-3
|
-6
|
-9
|
|
Стационарный (СТ)
|
СТ-0
|
СТ-3
|
СТ-6
|
СТ-9
|
|
Амплитудно-модулированный (АМ)
|
АМ-0
|
АМ-3
|
АМ-6
|
АМ-9
|
Примечания: * — дано в децибелах над уровнем звукового давления целевого сигнала (в среднем 60 дБ). То есть ОСШ 0 дБ означает, что уровень звукового давления шума равен уровню звукового давления целевого сигнала (в среднем — для СТ шума и на пике — для АМ шума). Отрицательные значения означают превышение уровня шума над уровнем сигнала.
Маскирующий шум начинался за 75 мс до начала речевого стимула, так что в случае АМ шума начало первой фонемы всегда попадало в интервал сниженной интенсивности шума (рис. 1). Длительность шумовой маскировки составляла 1 секунду. Таким образом, шум перекрывался со словом и длился несколько дольше, чем слово.

Рис. 1. Пример речевого стимула и маскировочных шумов. А — слово «шапка»; Б — стационарный шум; В — шум с амплитудной модуляцией 10 Гц.
Процедура тестирования. Для предъявления стимульного материала использовались наушники Sony WH-XB900N, которые были откалиброваны с помощью шумомера CEM DT-815. В качестве референтного значения был взят стационарный шум 60 дБ.
Экспериментальная сессия начиналась с тренировки, во время которой в случайном порядке предъявлялись 10 слов на фоне СТ или АМ шума (от -3 до 3 дБ ОСШ). Участнику предлагали назвать услышанное слово после каждого предъявления. Время ответа не было ограниченно, в качестве правильного ответа принималось только точное повторение слова. Тренировка длилась до тех пор, пока ребенок не усваивал инструкцию, но не дольше, чем 10 минут. В случае успешного усвоения инструкции мы переходили к основной части тестирования.
Основная часть состояла из четырех блоков в последовательности 0, -3, -6 и -9 дБ ОСШ, где блок 0 дБ был наиболее простым для распознавания, а -9 дБ — наиболее сложным. Каждый блок содержал 40 слов — по 20 слов для каждого типа шума (СТ и АМ). Речевые стимулы предъявлялись в случайном порядке: для каждого ребенка и условия предъявляемое слово выбиралось случайным образом из списка 160 слов и не повторялось. Тип шумовой маскировки варьировался внутри блока в псевдослучайном порядке (не более трех предъявлений одного типа шума подряд). Для каждого из 8 условий было подсчитано количество правильно распознанных слов. После предъявления каждого слова ребенку давалось неограниченное время для ответа. Ответ считался правильным только при точном воспроизведении слова. В конце основной части эксперимента, те слова, которые участник не смог распознать, предъявлялись ему без шума, чтобы убедиться, что он знал и мог повторить их. Все включенные в данное исследование дети смогли повторить все слова, предъявленные им без шума.
Пилотное тестирование экспериментальной парадигмы. Ввиду разного фонетического состава слов сложность их распознавания на фоне шума различалась. Поэтому перед проведением исследования на детях было проведено пилотное исследование на выборке из 13 взрослых, в ходе которого в исходном наборе из 182 слов были выявлены 22 слова, которые большинство испытуемых безошибочно распознали при самом высоком уровне стационарного фонового шума или не распознали при наименьшем его уровне. Такие слова были исключены из эксперимента. Соответственно, в итоговый тест были включены 160 слов.
Статистический анализ. Для статистического анализа мы использовали пакеты ПО rstatix и car для R и SciPy для Python 3. Эффекты считались значимыми при пороговом уровне вероятности p<0,05. Критерии значимости были двусторонними. Отличие распределений данных от нормального тестировали с помощью W-критерия Шапиро–Уилка. Парные сравнения проводились с помощью парного t-критерия Стьюдента. Поскольку распределение данных в группах в ряде случаев отличались от нормального, групповые сравнения проводили с помощью U-критерия Манна–Уитни. Корреляции результатов психофизического теста с IQ и возрастом оценивались с помощью коэффициента корреляции Спирмена. Для оценки однородности дисперсий использовался критерий Левена. Чтобы оценить, насколько амплитудная модуляции шума улучшает распознавание слов, мы применили ковариационный анализ (ANCOVA), в котором ковариантами были возраст и число правильно названных слов в условиях СТ шума, а зависимой переменной — разница между числом слов, верно названных в условиях АМ и СТ шума.
Результаты
Распознавание слов детьми с РАС и ТР детьми при разных типах и уровнях маскировки. На рисунке 2 показано среднее число правильно распознанных слов для разных уровней и типов шума у детей с РАС и ТР детей. Во всех случаях дети с РАС распознали меньше слов (U-тесты, все условия p<0,05, кроме условий СТ-9 и АМ-9; p=0,206 и p=0,464 соответственно; см. Приложение № 1). Таким образом, дети с РАС в целом хуже распознавали речь на фоне шума независимо от его уровня или наличия/отсутствия амплитудной модуляции.
Рис. 2. Различия между детьми с РАС и ТР детьми в количестве правильно распознанных слов при их маскировке стационарным и амплитудно-модулированным шумом
Примечания: приведены среднее по группе и стандартное отклонение. Звездочками отмечены значимые различия, измеренные с помощью U-критерия Манна–Уитни. *** — p<0,001, ** — p<0,01, * — p<0,05.
Попарное сравнение условий АМ и СТ для каждого из четырех уровней шума (рис. 3) показало, что в обеих группах детей и на всех четырех уровнях маскировки распознавание речи в шуме улучшилось благодаря амплитудной модуляции шума (для всех U-тестов p<0,05; см. Приложение № 2).

Рис. 3. Сравнение числа правильно распознанных слов при их маскировке стационарным и амплитудно-модулированным шумом у детей РАС и ТР детей
Примечания: приведены среднее по группе и стандартное отклонение. Звездочками отмечены значимые различия, измеренные с помощью U-критерия Манна–Уитни. *** — p<0,001, ** — p<0,01, * — p<0,05.
Многие дети (21 ребенок) смогли распознать все 20 слов при самом легком условии (АМ-0), а некоторые дети (три ребенка) не смогли распознать ни одного слова при самом трудном условии (СТ-9). Такие эффекты «потолка» и «пола» затрудняют оценку способности распознавать слова и могут искажать групповые различия. Поэтому в дальнейшем мы исключили условия СТ-0, СТ-9, АМ-0, и АМ-9 из анализа и рассчитали суммарное число опознанных в условиях СТ и АМ слов как сумму слов, названных при интенсивностях маскировки -3 и -6 дБ (т.е. СТ-3+СТ-6 и АМ-3+АМ-6 соответственно). При таком расчете распределения не отличались от нормального ни в одной из групп (критерий Шапиро–Уилка, все p>0,108).
Связь распознавания слов в шуме с возрастом и интеллектом. Уровень общего интеллекта у детей с РАС варьировал в широких пределах. Так 8 детей с РАС были классифицированы как имеющие показатели IQ в диапазоне умственной отсталости (IQ<70), 14 — в пограничном диапазоне (IQ=70–85), и 18 детей имели нормальный интеллект (IQ>85). Чтобы оценить влияние уровня интеллекта на выполнение задания у детей с РАС, были рассчитаны корреляции суммарного числа названных слов отдельно для условий СТ шума (СТ-3,-6) и АМ шума (АМ-3,-6) с IQ. Ни для условия СТ, ни для условия АМ не было обнаружено значимых корреляций между успешностью распознавания слов и интеллектом (рис. 4).
На рисунке 4А показана зависимость между успешностью распознавания слов и возрастом. У ТР детей общее число распознанных слов значимо увеличивалось с возрастом как для условия СТ-3,-6 (r(38)=0,36, p=0,026), так и для условия АМ-3,-6 (r(38)=0,54, p<0,001). У детей с РАС корреляции с возрастом не были значимы (СТ-3,-6: r(42)=0,01, p=0,964; АМ-3,-6: r(42)=0,18, p=0,237). Однако ни для одного из условий коэффициенты корреляций значимо не различались между группами ТР детей и детей с РАС (все p>0,05). Корреляций с IQ у детей с РАС не было обнаружено ни в одном из двух условий (СТ-3,-6: r(40)=0,10, p=0,508; АМ-3,-6: r(40)=0,02, p=0,869).

Рис. 4. Зависимость числа правильно распознанных слов в условиях стационарного и амплитудно-модулированного шума от возраста (А) и IQ (Б) у ТР детей и детей с РАС
Примечание: r — коэффициент ранговой корреляции Спирмена.
Поскольку дети с РАС могли повторить все ранее не расслышанные слова при предъявлении в отсутствии шума, их более низкие показатели по сравнению с группой ТР детей нельзя объяснить непониманием инструкции. Плохое распознавание слов в СТ шуме может быть связано с пониженной помехоустойчивостью слухового анализатора и/или внимания к энергетической маскировке. В случае АМ шума успех распознавания слов зависит также и от способности использовать для восприятия слов перерывы в шуме. Ниже мы сравним влияние этого фактора, специфичного для условия АМ, на восприятие речи у детей с РАС и ТР детей.
Влияние интервалов тишины в шуме на распознавание слов у детей с РАС. Мы использовали маскировку АМ шумом, чтобы оценить способность детей с РАС восстанавливать слова из частей, услышанных в интервалах со сниженной интенсивностью шумовой маскировки. Однако успешность восприятия речи на фоне АМ шума может быть обусловлена не только способностью к временной интеграции, но и способностью выделять целевой сигнал на фоне шума, как это происходит при стационарном шуме. Чтобы разделить влияние этих факторов, мы использовали метод попарных сравнений и ковариационный анализ.
Попарные сравнения. Мы составили пары детей с РАС и ТР детей, в которых оба ребенка опознали сходное (±1) число слов в стационарном шуме (СТ-3,-6). При наличии нескольких вариантов составления таких пар, выбирались дети максимально близкие по возрасту. Поскольку ТР дети выполняли задание в целом лучше, чем дети с РАС, не всем участникам удалось подобрать пару, и в число таких пар вошло только около половины выборки (n=22). При таком составлении пар ТР дети оказались старше, чем дети с РАС (ТР: M=9,79 лет, SD=1,50 лет, РАС: M=10,58 лет, SD=1,54 лет; парный t-критерий Стьюдента, t
(22)=-2,72, p=0,013, d Коэна=0,50). Значения СТ-3,-6 в этих парах представлены на вставке к рисунку 5. Несмотря на то что ТР дети и дети с РАС были уравнены по числу слов, распознанных в условиях стационарного шума, последние распознали значительно меньше слов в условиях АМ-3,-6 шума (парный t-критерий Стьюдента, t
(22)=3,15, p=0,005, d Коэна=0,78), что может указывать на снижение у них облегчающего эффекта амплитудной модуляции шума.

Рис. 5. Различие в распознавании слов в амплитудно-модулированном шуме в парах детей с РАС и ТР детей, схожим образом выполнявших тест в условиях стационарного шума
Примечания: вставка в рисунок демонстрирует, что дети в этих парах (n=22) распознавали сходное число слов (±1 слово) в условиях маскировки стационарным шумом. Жирная черная линия — среднее по группе. Несмотря на это, в условиях амплитудно-модулированной маскировки те же дети с РАС выполняли тест хуже ТР детей: * — p<0,05.
Дисперсионный анализ. Несмотря на наглядность, недостатком анализа парных сравнений является исключение значительной части детей, что может исказить результаты. Поэтому мы также провели дисперсионный анализ полных данных. Для каждого ребенка мы нашли разницу между числом слов, опознанных в условиях АМ и СТ шума: АМ-3,-6 – СТ-3,-6. Этот показатель отражает то, насколько наличие амплитудной модуляции шума улучшает распознавание по сравнению с условием непрерывного шума. Как у ТР детей, так и у детей с РАС, разница между АМ-3,-6 и СТ-3,-6 значимо коррелировала с успешностью выполнения в условиях стационарного шума — СТ-3,-6 (ТР: r
(38)=-0,51, p<0,001; РАС: r
(42)=-0,48, p=0,010). То есть дети, которые хуже распознавали слова в СТ шуме, в большей степени улучшали распознавание в условиях АМ шума. Далее мы использовали разницу АМ-3,-6 – СТ-3,-6 в качестве зависимой переменной, а число слов, опознанных в стационарном шуме СТ-3,-6, — как коварианту. Фактор принадлежности к группе (ТР или РАС) был включен в анализ как категориальная переменная. Анализ ковариации дает возможность оценить истинную взаимосвязь между абсолютным изменением параметра (в нашем случае АМ-3,-6 – СТ-3,-6) и его начальным значением (в нашем случае СТ-3,-6) и рекомендуется как универсальный способ коррекции на начальное значение при сравнении групп, в которых это начальное значение различается
[Curran-Everett, 2015]. Таким образом, с помощью ковариационного анализа мы отделили ту часть дисперсии разности АМ-3,-6 – СТ-3,-6, которая объясняется способностью использовать интервалы в шуме, от дисперсии, объясняемой способностью выделять сигнал на фоне шума. Для того, чтобы выяснить, насколько эффект амплитудной модуляции меняется с возрастом в каждой из групп, мы включили в модель фактор «Возраст» и его взаимодействие с фактором «Группа». Проверка допущения о равенстве дисперсий переменных (АМ-3,-6 – СТ-3,-6; СТ-3,-6; Возраст) в группах (РАС, ТР) тестом Левена не выявила его нарушения (все p>0,087).
Дисперсионный анализ (табл. 2) выявил значимый эффект фактора Группы (F
(1, 75)=18,57, p<0,001, generalized η
2=0,20, что, согласно C. Fritz и др.
[Fritz, 2012], считается большим эффектом): относительное улучшение распознавания слов в условии АМ шума было бóльшим у ТР детей, чем у детей с РАС. Таким образом, ковариационный анализ подтвердил результаты, полученные методом парных сравнений: дети с РАС в меньшей степени, чем ТР дети, улучшали распознавание речи благодаря коротким паузам тишины в шуме.
Наблюдался также значимый эффект фактора Возраста (F
(1, 75)=12,08, p<0,001, размер эффекта: η
2=0,14, что, согласно C. Fritz и др.
[Fritz, 2012], считается большим эффектом), который не зависел от группы (Возраста*Группа: F
(1, 75)=0,24, p=0,622). С возрастом дети обеих групп в большей мере использовали преимущество условия АМ шума для распознавания слов.
Таблица 2
Зависимость успешности распознавания слов в условиях амплитудно-модулированной маскировки от успешности в условиях маскировки стационарным шумом, а также от возраста и наличия/отсутствия РАС
|
Предиктор
|
F
|
df
|
p
|
η2
|
|
СТ-3,-6
|
34,51
|
1, 75
|
<0,001
|
0,315
|
|
Возраст
|
12,08
|
1, 75
|
<0,001
|
0,139
|
|
Группа
|
18,57
|
1, 75
|
<0,001
|
0,198
|
|
Возраст*Группа
|
0,24
|
1, 75
|
0,622
|
0,003
|
Примечания: зависимая переменная — разница между числом слов, названных в условиях маскировки амплитудно-модулированным (АМ-3,-6) и стационарным (СТ-3,-6) шумом: АМ-3,-6 – СТ-3,-6. Независимые переменные — факторы «Группа» (ТР или РАС), «Возраст» и число слов, названных в условиях маскировки СТ шумом (СТ-3,-6).
Чтобы проверить, связан ли облегчающий эффект амплитудной модуляции у детей с РАС с уровнем их интеллекта, мы рассчитали корреляцию значений АМ-3,-6 – СТ-3,-6, скорректированных на возраст и «начальное значение» (СТ-3,-6), с IQ. Значения разности АМ-3,-6 – СТ-3,-6 (при контроле возраста и СТ-3,-6,) являются мерой того, насколько ребенок улучшает распознавание слов за счет наличия кратких интервалов снижения интенсивности шума с поправкой на возраст и общую чувствительность к энергетической маскировке, т.е. отражают облегчающий эффект амплитудной модуляции. Значимой корреляции между облегчающим эффектом амплитудной модуляции и IQ не наблюдалось (r(40)=-0,01, p=0,934) — см. рисунок 6.
Рис. 6. Отсутствие влияние интеллекта на облегчающий эффект амплитудной модуляции шума у детей с РАС
Примечание: эффект амплитудной модуляции оценивался как различие в числе слов, распознанных в условиях амплитудно-модулированного и стационарного шумов (АМ-3,-6 – СТ-3,-6), при контроле возраста и числа слов, распознанных на фоне стационарного шума.
Обсуждение
В данной работе мы исследовали, как шум влияет на слухоречевое восприятие у детей с РАС, владеющих функциональной речью. Мы также оценили, насколько чувствительность слухоречевого восприятия к шуму у детей с РАС зависит от уровня их когнитивных способностей. Детям предлагали повторять простые слова, предъявляемые на фоне шума двух типов: непрерывного и амплитудно-модулированного. Восприятие слов на фоне амплитудно-модулированного шума требует временнóй интеграции обрывков слов, расслышанных в интервалах с низкой интенсивностью шума, и затрагивает более сложные процессы слухоречевой обработки, чем постоянный шум. Дети с РАС в целом хуже, чем типично развивающиеся сверстники, распознавали слова на фоне шума и в меньшей степени использовали для улучшения распознавания интервалы относительной тишины в амплитудно-модулированном шуме. Неожиданно, мы не обнаружили связи между уровнем интеллекта детей с РАС и их способностью распознавать зашумленные слова. Ниже мы рассмотрим, какие факторы могли привести к ухудшению восприятия речи в шуме у детей с РАС.
В нашем исследовании дети с РАС хуже, чем ТР сверстники, распознавали речь в условиях энергетической маскировки стационарным шумом (рис. 2, левая панель), тогда как в ряде предыдущих исследований такого ухудшения у детей и подростков с РАС выявлено не было [Alcantara, 2004; Frith, 2003]. Такие различия в результатах могут обусловливаться как особенностями методики, так и различием выборок. В описанных выше исследованиях выборку участников с РАС составляли люди с нормальным интеллектом, тогда как в настоящем исследовании средний уровень интеллекта наших участников с РАС составил 83 балла, а 55% (n=22) детей имели легкую степень умственной отсталости либо находились в пограничном диапазоне (IQ<85). Несмотря на то, что мы не наблюдали у детей с РАС связи между IQ и успешностью выполнения задания, такая связь могла обнаруживаться в зависимости от тяжести симптомов аутизма, нарушений внимания или степени речевых нарушений — факторов, которые не контролировались в нашем исследовании.
В отличии от текущего исследования, J.J. Foxe и соавторы [Foxe, 2013] обнаружили у детей с РАС положительную корреляцию между IQ и способностью распознавать слова на фоне стационарного шума. Такое различие в результатах может объясняться особенностями выборок и/или методами тестирования. В их исследовании дети с и без РАС повторили в среднем только около 90% слов, предъявленных без шума, что, вероятно, является следствием утомления в результате длительного эксперимента. Так, исследователи предъявляли детям 300 слов, тогда как в нашем исследовании использовалось 160 слов. Кроме того, эти авторы исследовали зрительные стимулы и регистрировали глазодвигательную активность, что требовало фиксации головы и доставляло дополнительные неудобства испытуемым. Возможно, в исследовании J.J. Foxe и коллег [Foxe, 2013] дети с высоким IQ, имевшие также более высокий уровень речевой компетентности (синдром Аспергера), меньше утомлялись и лучше удерживали внимание, что и привело к корреляции между IQ и успешностью распознавания слов. В нашем исследовании дети повторили 100% нерасслышанных слов, когда их предъявляли в конце эксперимента без шума, что говорит о меньшей роли утомления при выполнении задания. С другой стороны, дети с высоким IQ в нашей выборке были представлены в гораздо меньшей степени.
Как отмечалось ранее, нарушение восприятия речи на фоне шума может объясняться сниженной помехоустойчивостью к шуму в результате дефицита базовых механизмов фонематического кодирования речевых сигналов и/или проблем с контролем внимания. Снижение помехоустойчивости должно вносить вклад в ухудшение восприятия как на фоне стационарного, так и амплитудно-модулированного шума. Но когда мы нивелировали фактор помехоустойчивости, подобрав пары детей с РАС и «нейротипичным» развитием (22 пары), в которых оба ребенка с одинаковой успешностью выполняли тест на фоне стационарного шума (рис. 5), то облегчающий эффект амплитудной модуляции у детей с РАС оказался снижен по сравнению с ТР детьми. Тот же эффект мы получили и на полной выборке испытуемых, когда скорректировали «облегчающий эффект» амплитудной модуляции шума на успешность выполнения задания в стационарном шуме (рис. 6Б). С одной стороны, эти результаты согласуются с результатами предыдущих исследований, которые показали, что люди с РАС хуже распознают слова на фоне модулированного по амплитуде шума
[Alcantara, 2004; Groen, 2009]. С другой — наши результаты дополняют результаты этих предыдущих исследований, поскольку убедительно свидетельствуют о том, что сниженная помехоустойчивость и дефицит возможности использовать для восприятия речи краткие перерывы в шуме вносят независимый вклад в ухудшение способности детей с РАС воспринимать слышимую речь. Более того, наши данные указывают на то, что дефицит в интеграции фонем у детей с РАС не связан с низкоуровневыми нарушениями в проведении слухового сигнала в подкорковых звеньях слухового анализатора, иначе он был бы неотличим от низкой помехоустойчивости.
Мы заметили, что дети с РАС часто давали в качестве ответа бессмысленный набор фонем, не достраивая его до целого слова (например, “есяц” вместо “месяц”, что не зачитывалось как правильный ответ). Синтез и достраивание изолированных сегментов речи в осмысленное слово требуют наличия его устойчивого образа, а также лексического доступа — сличения с этим устойчивым образом. Снижение облегчающего эффекта амплитудной модуляции шума связано, по-видимому, с нарушением этих достаточно высокоуровневых механизмов, задействующих ассоциативные области коры. Так, дефицит интеграции фонем может являться результатом нарушения обработки слухоречевой информации в областях височной коры, специализирующихся на детекции и декодировании звуков речи
[Belin, 2004] и/или обеспечивающих сличение слуховой словоформы и временной последовательности фонем с хранящимся в памяти эталоном
[Binder, 2017]. У детей с РАС, недостаток речевого опыта
[Tager-Flusberg, 2013] может затруднять формирование устойчивых образов-эталонов слов, а структурно-функциональные нарушения связности речевых областей коры
[Mamashli, 2017; Moseley, 2016] — осложнять лексический доступ. Интересно, что между детьми с РАС наблюдались значительные различия в том, насколько они улучшали распознавание слов за счет амплитудной модуляции шума (рис. 6Б). В последующих исследованиях будет интересно проверить, связан ли такой облегчающий эффект амплитудной модуляции с уровнем развития речи ребенка.
Заключение
Результаты исследования указывают на то, что трудности с распознаванием зашумленной речи у детей РАС являются обособленным дефицитом и не связаны напрямую с когнитивными нарушениями или общим снижением слуха. Они также свидетельствуют о том, что трудности с восприятием речи в шуме у детей с РАС обусловлены двумя группами факторов: сниженной помехоустойчивостью слухоречевого восприятия и проблемами интеграции фонем в целостное слово. Хотя нарушение способности к интеграции и может быть связано с пониженной помехоустойчивостью фонетического слуха, оно не объясняется полностью этим фактором. В то же время наличие такого специфического дефицита интеграции при РАС соответствует гипотезе «слабой центральной когерентности» и может объясняться нарушением автоматических, «досознательных» механизмов сборки слуховых фонем в единое целое. В перспективе использованный в нашем исследовании подход может оказаться полезным в коррекционно-педагогической практике для оценки особенностей нарушений слухоречевого восприятия у детей с РАС, имеющих широкий диапазон когнитивных способностей.
Небольшой размер выборки является существенным ограничением исследования. Кроме того, хотя использованные в тесте слова являлись высокочастотными и знакомыми детям младшего школьного возраста, владеющим функциональной речью, различия их фонетического состава и семантического значения могли влиять на сложность распознавания на фоне шума. Случайное сочетание слова и типа и/или уровня шума в нашем эксперименте элиминировали систематическое влияние данного фактора, но также вносили «шум» в получаемые результаты. Впоследствии мы планируем использовать полученную в данном исследовании информацию о «трудноразличимости» слов для дальнейшего усовершенствования теста.
В практическом отношении наше исследование призвано привлечь внимание педагогов и родителей к проблеме сниженной толерантности к шуму у детей с РАС. Такие дети вне зависимости от уровня их когнитивных способностей значительно более чувствительны к маскировке речи шумом, чем их типично развивающиеся сверстники. Шум негативно сказывается на возможности ребенка с РАС воспринимать речь педагога в классной комнате, особенно в ситуации инклюзивного образования, когда ребенок помещен в обычный класс общеобразовательной школы. Наиболее простым техническим решением, облегчающим восприятие речи в шумной обстановке, могут стать специальные устройства, повышающие соотношение сигнал–шум, такие, например, как небольшие наушные усилители звука, доносящие речь непосредственно до ушей ребенка [Schafer, 2014]. При этом удаленный микрофон находится близко ко рту говорящего (педагога), тогда как наушный усилитель обеспечивает прямой аудиовход, который поддерживает постоянный высокий уровень входного сигнала, преодолевая негативные эффекты расстояния до говорящего, окружающего шума и реверберации. Использование подобных средств детьми с РАС значительно облегчает распознавание речи [Feldman, 2022; Rance, 2014; Schafer, 2019; Schafer, 2013], снижает стресс [Rance, 2017] и в целом улучшает поведение при прослушивании и выполнении заданий у детей с нарушениями слухового восприятия [Schafer, 2014]. Подход к тестированию восприятия речи в шуме, использованный в нашем исследовании, может помочь выделить детей, которым такие технические средства оптимизации отношения сигнал–шум могут оказаться особенно полезны, а также использоваться для объективной оценки коррекционного эффекта продолжительного применения таких средств [Keith, 2014].