Сравнение звучания музыкальных фрагментов, различающихся способом кодирования записи

857

Аннотация

В экспериментальном исследовании сравнивались особенности восприятия и оценки человеком цифрового звука двух форматов: WAV и mр3. Цифровой обработке были подвергнуты девять музыкальных фрагментов, отличающихся типом записанных музыкальных инструментов и наличием или отсутствием в записи человеческого голоса. Проведено три серии экспериментов с использованием процедуры парных сравнений. В каждой паре предъявлялся один и тот же музыкальный фрагмент, но записанный в разном формате. В первой серии испытуемые должны были выбрать в паре тот звук, который «больше нравится». Во второй серии они выбирали звук, воспринимаемый как «более естественный». В третьей серии испытуемые описывали вслух особенности воспринимаемого различия звуков в паре. Дополнительно во всех трех сериях испытуемых просили оценить различие между звучаниями разных форматов по 8-балльной шкале. Результаты показали влияние типа музыкального фрагмента и уровня музыкального образования слушателя на выбор предпочтения способа кодирования и на величину субъективной оценки различия сравниваемых звучаний. В целом звучание типа WAV предпочиталось чаще, чем mр3. У испытуемых с музыкальным образованием эта тенденция значимо более выражена, чем у не имеющих такого образования. Выделилась группа испытуемых, для которых звуки, записанные в формате WAV, воспринимались как «более понравившиеся», а те же звуки, записанные в формате mр3, воспринимались как «более естественные». Анализ вербальных описаний показал существование различных критериев выбора звучаний в разных ситуациях сравнения.

Общая информация

Ключевые слова: слуховое восприятие, воспринимаемое качество, сравнение, вербализация, кодирование звука, акустическая среда

Рубрика издания: Психология восприятия

Для цитаты: Носуленко В.Н., Старикова И.В. Сравнение звучания музыкальных фрагментов, различающихся способом кодирования записи // Экспериментальная психология. 2009. Том 2. № 3. С. 19–34.

Фрагмент статьи

Задача изучения особенностей восприятия звуков современной акустической среды  определила возникновение новой области психофизики, названной «экологическая психоакустика» (Носуленко, 1988, 1991; Nosulenko, 1990). К исследованиям в этой области может  быть отнесено большое количество экспериментальных работ, направленных на анализ восприятия экологически валидных звуковых событий (Ballas, 1993; Gaver, 1993; Gygi, Kidd,  Watson, 2007; Li, Logan, Pastore, 1991; Ventijrino, Gagnon, 1992 и др.). В нашем представлении  экологически валидными звуковыми событиями являются сложные (в физическом смысле)  звучания, имеющие определенное предметное содержание для воспринимающего субъекта. Из многих работ следует, что с таким содержанием связано распознавание источника  звука и его общего контекста (Ballas, Mullins, 1991; Bartlett, 1977; Bregman, 1978; Lawrence,  1979; McAdams, 1984).

Звучания, отсутствующие в опыте взаимодействия субъекта с внешним миром, характеризуются «размытостью» их предметной отнесенности, неопределенностью формирующихся слуховых эталонов (Даниленко, 1988; McAdams, Cunibile, 1992;  Samoylenko, McAdams, Nosulenkо, 1996; Risset, 1994; Wessel, 1978). Именно к таким исходно  отсутствующим в опыте слушателя звукам относятся и звуки, созданные или обработанные  современными информационными системами. Однако в психоакустических исследованиях  практически не представлены  работы по анализу особенностей восприятия таких звуков и  влияния технологий их создания на состав формирующихся у человека слуховых эталонов.

Наше исследование представляет собой один из этапов реализации научной программы, направленной на изучение особенностей восприятия в технологически насыщенной среде. В данном случае речь идет о восприятии звучаний, характеризующихся разным способом  цифрового кодирования звука. Анализировались особенности выбора слушателями предпочтений, критерии этого выбора и субъективные оценки различия при сравнении звучаний,  отличающихся способом кодирования. Главная цель такого анализа – выявить особенности сравнения и предпочтения таких звучаний в зависимости от их типа, опыта их прослушивания людьми, а также от характера выполняемой испытуемыми задачи.

Данное исследование  рассматривалось как пилотажное: требовалось оценить возможности его технического обеспечения и сохранения экологической валидности. Предполагалось также наметить основные  линии дальнейшего систематического изучения. Этим определялся выбор относительно большого числа переменных в одном эксперименте.

В эксперименте изменялись способ кодирования звука и тип воспроизводимого музыкального фрагмента. Менялась также задача на выбор  предпочтения, которая задавалась испытуемым инструкцией: выбор звука, который «больше  нравится» или который «более естественный». Испытуемые различались уровнем музыкального образования и опытом прослушивания звуков, воспроизводимых с помощью современных технологий. Регистрируемыми показателями были предпочтения, субъективные оценки  воспринимаемого различия и вербальные описания различий. Соответственно проверяемые в  эксперименте гипотезы предполагали существование влияния выбранных переменных на эти  регистрируемые показатели.

Полный текст

За последние десятилетия мир звуков существенно изменился. Человек создал себе  новое звуковое окружение, качественно отличающееся от того, в котором жили наши предки. Конец прошлого века характеризуется тем, что более 70 % любителей музыки слушали  ее с использованием электроакустических каналов, а не в натуральных условиях (Моль,  1973; Моль, Фукс, Касслер, 1975). Современные бытовые системы записи и передачи звука  используют новейшие разработки в области цифровой обработки и кодирования аудиоинформации. Появляются новые технологии синтеза звука, применение которых увеличивает  в окружении человека долю «искусственных» звучаний, не ассоциирующихся с существующими в природе источниками звука. Особо следует отметить не только сам факт появления новых технологий звука, но ту скорость, с которой эти технологии проникают в окружение каждого человека. Достаточно сказать, что в течение трех последних десятилетий  (т. е. в течение жизни одного поколения) сменилось несколько стандартов звукозаписи, а  появление цифрового звука является подлинной качественной революцией в этой области. Среди производителей звуковой аппаратуры отчетливо наметилась тенденция поиска  таких способов обработки звука, которые позволили бы поместить максимальное количество звуковой информации на широкодоступных носителях (мобильный телефон, портативный звуковой плейер и т. п.). Это увеличивает пропасть между исходным звуком и тем  продуктом, который в конечном счете получает потребитель. Происходящие изменения в  акустическом окружении человека направляются прежде всего достижениями в сфере технологий, а систематический анализ их влияния на слуховое восприятие практически отсутствует (Носуленко, 1988, 1989). И это несмотря на то, что сами разработчики звуковой  техники и технологий записи звука констатируют многие необратимые изменения (см., например, Киви, 2008).

Следует отметить, что субъективная экспертиза качества звучания является обязательным этапом оценки звукозаписывающих и звуковоспроизводящих систем. Ее процедура регламентируется многочисленными национальными и международными стандартами,  которые направлены прежде всего на сравнение качества различных акустических трактов.  Оценка качества осуществляется специально подготовленными экспертами, а особенности  восприятия звучания реальными потребителями эти стандарты никак не учитывают. В результате изменения, вносимые в восприятие новыми средствами оцифровывания и сжатия  звука, практически не анализируются. Все это требует новых подходов к исследованию восприятия качеств акустической среды, возникающих с внедрением современных технологий  в повседневную жизнь человека и тем самым определяющих состав его естественного окружения.

Задача изучения особенностей восприятия звуков современной акустической среды  определила возникновение новой области психофизики, названной «экологическая психоакустика» (Носуленко, 1988, 1991; Nosulenko, 1990). К исследованиям в этой области может  быть отнесено большое количество экспериментальных работ, направленных на анализ восприятия экологически валидных звуковых событий (Ballas, 1993; Gaver, 1993; Gygi, Kidd,  Watson, 2007; Li, Logan, Pastore, 1991; Ventijrino, Gagnon, 1992 и др.). В нашем представлении  экологически валидными звуковыми событиями являются сложные (в физическом смысле)  звучания, имеющие определенное предметное содержание для воспринимающего субъекта. Из многих работ следует, что с таким содержанием связано распознавание источника  звука и его общего контекста (Ballas, Mullins, 1991; Bartlett, 1977; Bregman, 1978; Lawrence,  1979; McAdams, 1984). Звучания, отсутствующие в опыте взаимодействия субъекта с внешним миром, характеризуются «размытостью» их предметной отнесенности, неопределенностью формирующихся слуховых эталонов (Даниленко, 1988; McAdams, Cunibile, 1992;  Samoylenko, McAdams, Nosulenkо, 1996; Risset, 1994; Wessel, 1978). Именно к таким исходно  отсутствующим в опыте слушателя звукам относятся и звуки, созданные или обработанные  современными информационными системами. Однако в психоакустических исследованиях  практически не представлены  работы по анализу особенностей восприятия таких звуков и  влияния технологий их создания на состав формирующихся у человека слуховых эталонов.

Наше исследование представляет собой один из этапов реализации научной программы, направленной на изучение особенностей восприятия в технологически насыщенной среде. В данном случае речь идет о восприятии звучаний, характеризующихся разным способом  цифрового кодирования звука. Анализировались особенности выбора слушателями предпочтений, критерии этого выбора и субъективные оценки различия при сравнении звучаний,  отличающихся способом кодирования. Главная цель такого анализа – выявить особенности сравнения и предпочтения таких звучаний в зависимости от их типа, опыта их прослушивания людьми, а также от характера выполняемой испытуемыми задачи. Данное исследование  рассматривалось как пилотажное: требовалось оценить возможности его технического обеспечения и сохранения экологической валидности. Предполагалось также наметить основные  линии дальнейшего систематического изучения. Этим определялся выбор относительно большого числа переменных в одном эксперименте. В эксперименте изменялись способ кодирования звука и тип воспроизводимого музыкального фрагмента. Менялась также задача на выбор  предпочтения, которая задавалась испытуемым инструкцией: выбор звука, который «больше  нравится» или который «более естественный». Испытуемые различались уровнем музыкального образования и опытом прослушивания звуков, воспроизводимых с помощью современных технологий. Регистрируемыми показателями были предпочтения, субъективные оценки  воспринимаемого различия и вербальные описания различий. Соответственно проверяемые в  эксперименте гипотезы предполагали существование влияния выбранных переменных на эти  регистрируемые показатели.

При организации исследования мы опирались на перцептивно-коммуникативный  подход и идею о воспринимаемом качестве объектов и событий окружающей среды (Носуленко, 2007).

В основе перцептивно-коммуникативного подхода лежит положение о роли общения  в формировании перцептивного образа (Ломов, 1980, 1984), а также вывод о том, что ключевые характеристики образа проявляются в вербальных суждениях человека (Носуленко, Самойленко, 1995; Самойленко, 1986; Nosulenko, Samoylenko, 1997, 2001). Определены  условия, при которых вербализации становятся индикаторами особенностей перцептивного образа и могут рассматриваться как репрезентативные данные для его изучения (Самойленко, 1986, 1987, 1988). Ситуация вербального сравнения воспринимаемых событий или  их составляющих является одним из таких условий. Это определило экспериментальную  процедуру: испытуемые описывали сходство и различие сравниваемых звучаний.

Воспринимаемое качество характеризует систему субъективно значимых свойств события, образующих ядро перцептивного опыта. Имеется в виду та сторона анализа предметного образа, которая связана с опосредованностью восприятия практической деятельностью человека (Ананьев, 1960; Рубинштейн, 1957, 1959). Отношение субъекта к явлениям  действительности формируется для каждого человека индивидуально в процессе всей его  жизни. При этом «динамика осознания человеком различных сторон и явлений действительности тесно связана с изменением их значимости для человека» (Рубинштейн, 1959,  с. 159). Эта значимость выводит на передний план те или иные свойства действительности,  те или иные ее стороны, которые «осознаются прежде всего в их жизненно, общественно  существенных свойствах, закрепленных практикой» (Рубинштейн, 1959, с. 158). Эти существенные для субъекта свойства или стороны действительности составляют ядро воспринимаемого качества и тормозят осознание незначимых (в данной ситуации, для данного  субъекта и т. д.) характеристик, создавая «своеобразный рельеф того, что нами в каждый  данный момент осознается, с выступлением на передний план одного и стушевыванием,  схождением на нет другого, с фокусированием сознания на одном или ограниченном числе  объектов» (Рубинштейн, 1957, с. 272).

Такое представление о воспринимаемом качестве дает основание предположить, что  содержание воспринимаемого качества современной акустической среды будет связано с  опытом прослушивания людьми звучаний и, в частности, с особенностями образования (прежде всего – музыкального) слушателя. Эта связь должна проявляться как в особенностях выбора предпочтений звучаний, обработанных разными способами, так и в субъективных оценках их различия. Учитывая относительную «новизну» сформированных при помощи современных технологий звуков, интерес представляет анализ выбора предпочтений  по параметру воспринимаемой «искусственности»–«естественности» звучания.

Метод 

В экспериментах испытуемые прослушивали музыкальные фрагменты, каждый из  которых был закодирован двумя наиболее распространенными в настоящее время способами: WAV и mp3. Выбор этих двух способов записи тестовых звуков обусловлен тем, что  стандарт mp3 был создан как более экономичная альтернатива формату WAV. Создатели  стандарта mp3 использовали психоакустический эффект маскировки (см., например,  Гельфанд, 1984) для изъятия из звукового файла информации, заключенной внутри полосы маскировки и, как предполагается, не воспринимаемой слушателем. Тем самым удалось  существенно сократить объем файлов при сохранении, по мнению разработчиков, качества  звучания, аналогичного качеству компакт-диска. Это обусловило удобство записи музыки  на мобильных носителях и, как следствие, лавинообразное распространение звучаний mp3 среди огромной массы потребителей, особенно среди молодежи.

Отметим, что в основе стандарта mp3 лежит психоакустическая модель ощущения,  проверенная только в лабораторных условиях с использованием упрощенных (тональных  или шумовых) звуковых стимулов. Практически отсутствуют систематические исследования восприятия сложных, в частности, музыкальных звучаний, обработанных в соответствии с такой моделью. Именно поэтому нами поставлена задача сравнения двух способов  записи звука.

В качестве исходного источника звука использовались лицензированные компактдиски. Эталонный файл так называемого «CD-качества» обрабатывался с помощью программы WAV mp3 Editor v11.9x для получения mp3 файлов с битрейтом 64 kbps. Эти параметры компрессии были выбраны по результатам предварительной оценки различимости  звучаний форматов WAV и mp3 с различной степенью сжатия. Результаты оценки показали,  что в условиях используемой аппаратуры звучания mp3, записанные с битрейтом 128 kbps, значимо не различаются испытуемыми от звучаний WAV. Заметное различие наступает  только при увеличении компрессии до 64 kbps.

Таким образом, были сформированы пары звуков, в каждой из которых можно было  сравнить звучания разного типа кодирования.

Исследование состояло из трех экспериментальных серий.

В первой серии задачей испытуемого было выбрать из двух прослушанных звучаний  то, которое ему «больше нравится» (ответы: «первое», «второе» и «все равно»). Кроме того,  испытуемый должен был оценить степень различия между двумя звучаниями по 8-балльной шкале.

Вторая серия эксперимента была организована аналогично первой, но в ней была изменена основная задача испытуемому. Его просили выбрать из двух прослушанных звучаний то, которое является «более естественным». Так же как и в первой серии, испытуемые  оценивали степень различия между двумя звучаниями по заданной шкале.

В третьей серии испытуемый прослушивал те же пары звучаний, но главной его задачей было подробно описать вслух, чем эти звучания различаются, в чем особенность каждого из звучаний в паре, какое из них больше ему нравится и почему. Так же как и в первых  двух сериях, испытуемого просили оценить степень различия между двумя звучаниями.  Для этой серии экспериментов была организована экспериментальная ситуация, характерная для ситуаций референтного общения (Самойленко, 1986). Ее особенность определяется  задачей описать воспринимаемые объекты так, чтобы другой человек смог составить представление об их специфике. Такая задача формулировалась инструкцией, которая предъявлялась испытуемому перед началом эксперимента. 

Для эксперимента использовался набор из девяти музыкальных фрагментов,  условно разделенных на «натуральные» и «искусственные» звучания. При предварительной экспертизе фрагментов использовался опыт подбора звуков, описанный в работе (Ломов, Беляева, Носуленко, 1986). Отобранные звуки различались как типом  записанных музыкальных инструментов, так и наличием или отсутствием в звучании  человеческого голоса. Среди «натуральных» звучаний были записи живых музыкальных инструментов (№ 1 – гитара; № 8 – симфонический оркестр; № 9 – рояль) и человеческого голоса (№ 2 – женский голос в сопровождении симфонического оркестра;  № 3 – мужской голос в сопровождении инструментального квартета, № 4 – мужской  голос в сопровождении симфонического оркестра). «Искусственные» музыкальные звучания включали 3 фрагмента, представляющих записи искусственно синтезированных  инструментальных партий (№ 5 – несколько синтезированных инструментов и ритмическая группа, № 6 и № 7 – без ритмической группы). Длительность каждого фрагмента  составляла 8–10 секунд.

Пары звуковых фрагментов записывались двумя способами, отличающимися порядком следования звучания WAV и звучания mp3. Это позволило составить экспериментальную программу, исключающую влияние порядка предъявления тестовых звуков.

В первых двух сериях эксперимента участвовали 28 испытуемых: 15 мужчин и  13 женщин в возрасте от 17 до 61 года. Каждого испытуемого просили заполнить специальную анкету, позволяющую выявить уровень его музыкального образования и опыт слушания музыки при помощи акустических средств. Интервал времени между участием в двух  экспериментах составлял от 2 до 8 месяцев. В третьей серии эксперимента участвовали  11 человек, случайно выбранных из общей группы испытуемых.

Общая группа испытуемых была разделена на группы по трем критериям: «музыканты» (4 человека) и «не музыканты» (24 человека); с опытом слушания «меньше или  равно 15 часов в неделю» (11 человек) и с опытом слушания «больше 15 часов в неделю»  (17 человек); «моложе или равно 22 годам» (15 человек) и «старше 22 лет» (13 человек).  Ввиду малочисленности выборки на третьем этапе эксперимента не проводилось разделения испытуемых по индивидуальным показателям.

Экспериментальная программа первой и второй серий эксперимента содержала  90 пар звучаний. Пары каждого из 9 музыкальных фрагментов предъявлялись 10 раз. В третьей экспериментальной серии количество предъявлений каждой пары фрагментов было  уменьшено до двух (всего – 18 предъявлений).

Во всех трех сериях пары звучаний воспроизводились компьютером Vaio PCG- K415S (звуковая карта REALTEC AC97) с помощью наушников (Sennheiser НD 280pro).  Использование наушников связано с желанием создать условия прослушивания, максимально приближенные к тем, которые чаще всего используются представителями нашей выборки.

В первых двух сериях предъявлением звуков управлял сам испытуемый на компьютере при помощи специальной программы. В третьей серии это управление осуществлял экспериментатор. Полученные в третьей серии вербализации записывались на цифровой магнитофон, а затем переводились в текстовый файл и подвергались анализу с помощью процедуры, описанной в работах (Носуленко, 2007; Носуленко, Самойленко, 1995; Самойленко, 1986).

При анализе данных предпочтений для каждого испытуемого рассчитывались относительные частоты выбора предпочтения следующим образом:

 где Ni – количество ответов с предпочтением звучания i, N – общее количество пар, в которых присутствовало звучание i.

При анализе данных оценок различия для каждого испытуемого рассчитывались средние оценки для разных типов сравниваемых звучаний.

Обработка полученных данных осуществлялась стандартными статистическими методами: рассматривались различия между измеряемыми показателями (предпочтения и различия), получаемыми при сравнении звучаний разных типов, а также выявлялись межгрупповые различия. Сравнение средних относительных частот выбора предпочтений и оценок различия осуществлялось с использованием непараметрического критерия (Mann-Whitney Rank Sum Test). Для статистического анализа использовался статистический пакет SigmaStat 3.0 (модуль пакета SPSS).

Полученные в эксперименте вербализации подвергались анализу с помощью процедуры, описанной в работах (Носуленко, 2007;  Носуленко, Самойленко, 1995; Самойленко, 1986; Nosulenko, Samoylenko, 1997, 2001).

Напомним, что эта процедура состоит из нескольких этапов. Первый этап анализа текста – выделение вербальных единиц. В качестве таких единиц можно рассматривать характеристики, независимым образом отражающие отдельные признаки объекта или его сложный образ. Обязательным условием для этой процедуры является учет контекста. На  втором этапе устанавливается связь вербальных единиц с другими видами исходной информации – индексирование вербальных единиц.

Дальнейший анализ заключается в кодировании вербальных единиц. Выделенные вербальные единицы рассматриваются с точки зрения трех отношений: (1) логического, (2) предметного и (3) семантического. Для каждого типа отношений разрабатываются соответствующие правила кодирования вербальных единиц. Кодирование вербальных единиц осуществлялось независимо двумя экспертами в соответствии с предварительно выработанными правилами (Носуленко, Самойленко, 1995). Использовалась программа поддержки кодирования, которая автоматизировала ряд операций и облегчала процесс формирования новых вербальных категорий (Носуленко, 2007).

Завершающей стадией анализа является построение так называемых «вербальных портретов» сравниваемых звучаний, в которых количественно представлены значимые характеристики, определяющие оценку и предпочтение в суждениях людей. Вербальные портреты показывают относительную иерархию характеристик, используемых для описания воспринимаемого события, и позволяют количественно сопоставлять совокупность воспринимаемых характеристик разных событий. Для построения вербальных портретов производилось укрупнение полученных в процессе кодирования вербальных категорий. В качестве критериев укрупнения использовались прежде всего данные о частоте встречаемости конкретной вербальной единицы, а также корреляции  между рассчитанной представленностью разных вербальных единиц в описаниях звучаний.

Результаты и обсуждение

Полученные в первой экспериментальной серии результаты позволяют с уверенностью говорить о том, что в группе из 28 испытуемых звучание типа WAV предпочитается значимо чаще, чем mp3 (рис. 1). Эта тенденция отчетливо проявляется на большинстве типов звучаний и особенно ярко при прослушивании фрагментов, представляющих собой запись симфонического оркестра (звучание № 2 и № 8). Исключением стали лишь три звучания. Первые два из них являются синтезированными (№ 5 и № 7), и только одно из них относится к типу «естественных» (№ 9 – запись рояля). Однако о явном предпочтении того или иного способа записи этого последнего звучания не позволяет говорить высокий процент безразличных ответов. 

Сравнение частот предпочтений различных групп испытуемых показало статистически значимое (p < 0,05) отличие результатов, рассчитанных по данным испытуемых с музыкальным образованием, от результатов группы «не   музыкантов» (рис. 2).

Как следует из рис. 2, частота предпочтений звучания типа WAV почти всех музыкальных фрагментов у «музыкантов» выше, а частота предпочтения нейтральных ответов и звучаний типа mp3 ниже, чем у «не музыкантов». Исключением стал один синтезированный отрывок (№ 7), при прослушивании которого никто из испытуемых не смог отдать предпочтение одному из форматов звучания.

Интересно также то, что, несмотря на относительно низкую частоту предпочтения звучаний типа mp3 «не музыкантами», уровень значимости (p<0,05) отличия частоты предпочтения звучаний типа WAV от частоты предпочтения звучаний mp3 перешли только  данные, полученные на натуральных музыкальных фрагментах.

При анализе оценок различия между  звучаниями WAV и mp3 значимо выделились два музыкальных фрагмента: № 7 (отдельный синтезированный инструмент) и № 9 (запись звучания рояля). При их прослушивании оценка различия между звучаниями  двух форматов существенно ниже, чем для всех других фрагментов. Отметим, что на этих фрагментах не выявлено также и явно выраженного предпочтения одного из форматов звучания.

Анализ данных испытуемых, сгруппированных по опыту слушания музыки с использованием акустических средств звуковоспроизведения, не показал значимых различий как в характере выбора наиболее понравившегося звучания, так и в значениях субъективной оценки различия звучаний двух форматов. В результате сравнения оценок групп испытуемых, объединенных по возрасту, выделилась только оценка различия: для «молодых» испытуемых (возраст меньше или равен 22 годам) средняя оценка различия сравниваемых звучаний оказалась выше (р<0,001), чем для испытуемых более старшего возраста. В то же время характер предпочтения у этих двух групп статистически не отличался.

Во второй серии эксперимента испытуемых просили сравнивать звуки разных форматов по параметру «искусственности» – «естественности» звучания. Это позволило сопоставить две ситуации предпочтения: выбор «наиболее естественного» и выбор «наиболее понравившегося» звучания.

Различие между двумя ситуациями проявилось в общей тенденции выбора предпочитаемого звука – во второй серии формат WAV предпочитается реже, чем в первой. По сравнению с первой серией увеличилась доля выбора формата mp3 (с 0,27 до 0,35) и снизилась доля ответов «все равно» (с 0,19 до 0,12). Как следствие, во второй серии, в отличие от первой, показатели выбора предпочтения оказались незначимыми для   дифференциации звучаний разных форматов. Этот результат можно считать, по нашему мнению, подтверждением влияния смены задачи на выбор предпочтений. В противном случае следовало ожидать повышения стабильности полученных в первой серии данных за счет эффекта тренировки.

Сравнивая средние оценки воспринимаемого различия между двумя форматами звучания, можно отметить, что характер распределения оценок во второй серии практически не изменился по сравнению с первой (коэффициент корреляции r2=0,98). Нет также значимых различий и между величинами оценок.

Влияние задачи на характер предпочтений   подтверждает также тот факт, что во второй серии эксперимента выделилась группа из семи испытуемых, у которых резко изменилась направленность предпочтения. В первой серии эти испытуемые отдавали предпочтение преимущественно звукам WAV, тогда как в задаче выбора наиболее естественного звучания их выбор сместился в сторону формата mp3 (рис. 3).

По данным 70 измерений, различие между показателями двух серий существенно для большинства типов звучаний (для звучаний № 1, 2, 3, 4 и 8 p<0,0001; для звучания № 5  p=0,0195, для звучания № 6 p=0,0035). Незначимое различие снова отмечается только для звучаний № 7 и 9.

Таким образом, полученные результаты показали, что ситуации выбора звучания, которое «больше нравится», и выбора «более естественного» звука оказались для ряда испытуемых принципиально различными.

Третья серия экспериментов направлена на анализ критериев выбора предпочтений при сравнении звучаний, закодированных разным способом.

По результатам обработки вербализаций всех испытуемых были выделены 18 групп вербальных единиц, которые оказались значимыми для дифференциации изучаемых звучаний с точки зрения их воспринимаемого качества. 

На рис. 4 представлены данные о средней частоте употребления вербальных единиц
различных категорий, а также выделены категории, входящие в группу наиболее часто  встречающихся (> 75 %). Данный тип представления результатов показывает среднее число вербальных единиц независимо от направленности суждения. Так, например, в категорию «четкость» входят вербальные единицы, характеризующие звучание как «четкое», и вербальные единицы, отражающие восприятие звучания как «нечеткое».

Из рисунка видно, что 10 категорий вербальных единиц объединяют более 75 % описаний. Однако это не значит, что оставшиеся 8 категорий представлены незначительно. Частота использования разных вербальных категорий для описания музыкальных фрагментов связана как с типом самого фрагмента, так и со способом кодирования записанного звука. В разных звучаниях происходит перераспределение использованных категорий, и многие категории, не вошедшие в число наиболее часто употребляемых, могут оказаться в группе значимых для отдельного типа звучания. Так, например, категория «громкость» (отсутствующая среди наиболее распространенных в общем распределении) входит в группу ведущих для описания звучаний № 4, 5 и 7. Аналогично категория «качественность» характеризует звучание № 3. Категория «вживую» выделяет звучания № 1 и 8, а категория «динамичность» чаще всего использована в описаниях звучания № 6. Для звучаний № 1 и 2 оказывается распространенной категория «эхо».

Обнаружено также, что самыми распространенными вербальными единицами, выделенными из описаний звучания № 1 (гитара), оказываются вербальные категории «звонкость» и «высота». При этом категории «обработанность» и «разнесенность» ни разу не использовались для описания этого звучания. Категория «обработанность» не используется и при описании фрагмента № 7. В то же время именно эта характеристика оказывается важной в описаниях звучания № 8, а категория «разнесенность» входит в 75 % описаний звука № 9.

Ниже показано распределение частот использования вербальных категорий для описания звучаний формата WAV (рис. 5) и формата mp3 (рис. 6). Эти данные усреднены по группе испытуемых и по типам звучания.

Как видно из рисунков, распределение вербальных категорий также различается и для описаний звуков разного формата кодирования.

Специфика обнаруживается и при сравнении ситуаций, в которых предпочитаются звучания формата WAV, с ситуациями предпочтения mp3. Особенно выражен этот результат в вербальных портретах звучаний, характеризующих представленность значимых признаков сравниваемых звуков. В вербальных портретах показывается не только частотность представленности той или иной категории вербальных описаний, но и направленность конкретного суждения. Так, например, если при сравнении двух звучаний не выявлено какой-либо значимой тенденции (одинаковое число оценок «звонкий» и «глухой»), представленность данной категории стремится к нулю и, как следствие, не входит в состав вербального портрета. На рис. 7 показан пример вербальных портретов.

Рисунок демонстрирует вербальные портреты звучания № 4 (мужской голос в сопровождении симфонического оркестра), записанного в формате WAV, для двух ситуаций описания: когда испытуемым это звучание «нравится» и когда предпочтение отдавалось, наоборот, звучанию mp3 (WAV «не нравится»). Можно видеть, что состав воспринимаемого качества в этих двух ситуациях принципиально различается. Это различие касается как количества используемых для описания вербальных категорий, так и их содержания. Испытуемые, которым это звучание «не нравится» по отношению к тому, с которым оно сравнивается, описывают его как «неестественное» и «неприятное». В то же время в случае предпочтения данного звучания, кроме того что оно «естественное» и «приятное», появляется целый набор характеристик,
позволяющих определить критерии выбора. К ним относятся такие, например, как «насыщеное», «детализированное», «четкое» и «качественное». Интересно, что категория «объемное» присутствует в двух случаях, но в одном эта характеристика входит в совокупность критериев, определяющих предпочтение звучания WAV, в другом – его непредпочтение.

Показанный пример дает представление о возможностях обработки вербальных данных. Построение вербального портрета является процедурой «измерения» характеристик перцептивного образа сравниваемых событий (Носуленко, 2007). В нашем исследовании такой тип  анализа позволил обнаружить различия между звучаниями разных форматов в конкретном составе и в относительной иерархии значимых признаков для каждого из прослушиваемых фрагментов. Так же как и в предыдущем случае, состав вербальных категорий, которые испытуемые используют в своих описаниях, оказался связан с тем, какой формат записи предпочитает испытуемый. Результат анализа подтвердил, что для выбора предпочтения звучаний разного типа кодирования испытуемые используют разные критерии оценивания.

Заключение

Полученные результаты показали, что на выбор предпочтения определенного способа кодирования влияет тип музыкального фрагмента, уровень музыкального образования слушателя, а также характер решаемой испытуемым задачи на выбор предпочтения. Обнаружено влияние типа музыкального фрагмента и на величину субъективной оценки различия при сравнении звучаний разного формата. Вместе с тем не получило достаточных оснований предположение о влиянии индивидуального опыта прослушивания конкретного типа звуков на выбор предпочтения воспринимаемого различия. Мы допускам, что это связано с недостаточно однородной выборкой испытуемых в группах с разным опытом прослушивания.

Наиболее выраженные различия между звучаниями разных форматов проявились в случае музыкальных фрагментов, представляющих собой записи большого состава «живых» музыкальных инструментов (симфонический оркестр). Меньше всего заметна разница в звучаниях отдельных синтезированных инструментов. Можно сделать вывод, что показатель «искусственности»–«естественности» звучания является одним из существенных факторов, определяющих влияние на восприятие типа музыкального фрагмента.

Анализ данных предпочтений у испытуемых, имеющих музыкальное образование, показал, что эти испытуемые значимо чаще, чем не имеющие такого образования, предпочитают звучания формата WAV.

Наряду с общими тенденциями, которые в целом подтверждают выдвинутые нами гипотезы, обнаружены особенности восприятия, связанные с интерпретацией испытуемыми задачи на предпочтение. Так, для ряда испытуемых ситуации выбора предпочтения по приятности звука (задача: «какой из звуков больше нравится?») и по естественности звучания (задача: «какой из звуков звучит естественнее?») оказались в корне различными. В первом случае предпочтение однозначно отдавалось звучаниям формата WAV, тогда как во второй серии эксперимента более естественным воспринимался звук mp3.

В результате анализа данных третьей серии экспериментов обнаружена существенная зависимость вербализаций от типа звучания даже на уровне анализа общего речевого продукта: существуют различия в составе вербальных признаков, которые участники эксперимента используют для интерпретации своих восприятий. При этом особенности прослушанного фрагмента отражаются как в самом наборе используемых для описания звучания вербальных категорий, так и в частоте их употребления. В вербальных портретах разные форматы воспринимаемых звучаний дифференцируются конкретным составом и относительной иерархией значимых  признаков сравниваемых звуков. Обнаружено также, что в зависимости от того, какой формат звучания предпочитается, испытуемые используют разные наборы вербальных категорий в описаниях воспринимаемых звучаний. Таким образом, вербальный анализ позволил определить критерии выбора предпочтений.

Проведенное пилотажное исследование подтвердило эффективность применения выработанной экспериментальной процедуры. Несмотря на большой набор используемых  в эксперименте переменных и некоторую неоднородность группы испытуемых, получены статистически значимые данные для проверки выдвигаемых гипотез.

Вместе с тем исследование выявило ряд организационно-технических проблем обеспечения эксперимента, связанных прежде всего с обеспечением качества оборудования. В частности, существует проблема выбора первичного источника звука для формирования экспериментальных программ. Использование CD-дисков само по себе означает компрессию первичного источника. Остаются вопросы качества применяемых звуковых карт и оконечных устройств – усилителей и наушников. Все это вносит дополнительные неконтролируемые переменные. Для устранения их возможного влияния на следующих этапах исследования предполагается перейти на качественно более высокий уровень технического обеспечения.

 

Литература

  1. Ананьев Б. Г. Психология чувственного познания. М.: АПН РСФСР, 1960.
  2. Гельфанд С. А. Слух. Введение в психологическую и физиологическую акустику. М., 1984.
  3. Даниленко И. А. Особенности пространственной локализации кажущихся источников звука: Дисс. …  канд.  психол. наук. М.: ИП АН СССР, 1988.
  4. Киви Б. Война без победителей. О странных тенденциях в звукозаписи, которые губят музыку //  Компьютерра. 2008. № 39. С. 40–43.
  5. Ломов Б. Ф., Беляева А. В., Носуленко В. Н. Вербальное кодирование в познавательных процессах. М.:  Наука, 1986.
  6. Моль А. Социодинамика культуры. М.: Изд-во иностр. лит., 1973.
  7. Моль А., Фукс В., Касслер М. Искусство и ЭВМ. М., 1975.
  8. Носуленко В. Н. Психофизика восприятия естественной среды. Проблема воспринимаемого качества. М.: ИП РАН, 2007.
  9. Носуленко В. Н. Психология слухового восприятия. М.: Наука, 1988.
  10. Носуленко В. Н. (отв. ред.). Человек – техника – акустическая среда (сб. научных трудов). М.: ИПАН, 1989.
  11. Носуленко В. Н. «Экологизация» психоакустического исследования: основные направления // Проблемы экологической психоакустики. М.: ИПАН, 1991. С. 8–27.
  12. Носуленко В. Н., Самойленко Е. С. Вербальный метод в изучении восприятия изменений в окружающей среде // Психология и окружающая среда. М.: ИП РАН, 1995. С.11–50.
  13. Самойленко Е. С. Операция сравнения при решении когнитивно-коммуникативных задач. Дисс. ... канд. психол. наук. М.: ИПАН, 1986.
  14. Рубинштейн С. Л. Бытие и сознание. М.: АН СССР, 1957.
  15. Рубинштейн С. Л. Принципы и пути развития психологии. М.: Изд-во АН СССР, 1959.
  16. Ballas J. A. Common Factors in the Identification of an Assortment of Brief Everyday Sounds // Journal of Experimental Psychology: Human Perception and Performance. 1993. Vol. 19. N 2. P. 250–267.
  17. Ballas J. A., Mullins T. Effects of Context on the Identification of Everyday Sounds // Human performance. 1991. Vol. 4. N 3. P. 199–219.
  18. Bartlett J.-C. Remembering environmental sounds: the role of verbalization at input // Memory and Cognition. 1977. Vol. 5. № 4. P. 404—414.
  19. Bregman A. S. Auditory streaming: competition among alternative organizations // Perception and Psychophysics. 1978. Vol. 101. № 23. P. 391–398.
  20. Gaver W. W. What in the World Do We Hear?: An Ecological Approach to Auditory Event Prception // Ecological Psychology. 1993. Vol. 5. № 1. P. 1–29.
  21. Gygi B., Kidd G. R., Watson C. S. Similarity and categorization of environmental sounds // Perception and Psychophysics. 2007. Vol. 69. № 6. P. 839–855.
  22. Lawrence D. M. Role of verbal representations in testing recognition of naturalistic sounds // Percept. and Mot. Skills. 1979. Vol. 48. № 2. P. 443–446.
  23. Li X., Logan R. J., Pastore R. E. Perception of acoustic source characteristics: Walking sounds // J. Acoust. Soc. Am. 1991. Vol. 90. № 6. P. 3036–3049.
  24. McAdams S.  The auditory image: A metaphor for musical and psychological research of auditory organization // Cognitive processes in the perception of art. Amsterdam: Elsevier, 1984. P. 289–324.
  25. McAdams S., Cunibile J.-C. Perception of timbre analogies // Philosophical Transactions of the Royal Society. London, B. 1992. № 336. P. 383–389.
  26. Nosulenko V. Problems of ecological psychoacoustics // Proceedings of the Sixth Annual Meeting of the International Society for Psychophysics. Wursburg, 1990. P. 135–139.
  27. Nosulenko V., Samoylenko E. Approche systémique de l’analyse des verbalisations dans le cadre de l’etude des processus perceptifs et cognitifs // Informations sur les Sciences Sociales. 1997. Vol. 36. № 2. P. 223–261.
  28. Nosulenko V.,  Samoylenko E. Evaluation de la qualité  perçue des produits et services: approche interdisciplinaire // International Journal of Design and Innovation Research. 2001. Vol. 2. № 2. P. 35–60.
  29. Risset J.-C. Quelques aspects du timbre dans la musique contemporaine // Psychologie de la musique. Paris: P.U.F., 1994. P. 87–114.
  30. Samoylenko E., McAdams S., Nosulenko V.  Systematic analysis of verbalizations produced in comparing musical timbres // International Journal of Psychology. Vol. 31. P. 255–278.
  31. Ventijrino M., Gagnon D. A. Information tradeoffs in complex stimulus structure: Local and global levels in naturalistic scenes // Perception & Psychophysics. 1992. Vol. 52. № 4. P. 425–436.
  32. Wessel D. L. Low dimensional Control of Musical timbre // Rapp. IRCAM. 1978. № 12.

Информация об авторах

Носуленко Валерий Николаевич, доктор психологических наук, главный научный сотрудник, лаборатория познавательных процессов и математической психологии, Институт психологии Российской академии наук (ФГБУН ИП РАН), главный научный сотрудник, Институт экспериментальной психологии, Московский государственный психолого-педагогический университет, Москва, Россия, ORCID: https://orcid.org/0000-0003-0591-2335, e-mail: nosulenkovn@ipran.ru

Старикова Ирина Валерьевна, лаборант, Центр экспериментальной психологии, ФГБОУ ВО МГППУ, Москва, Россия, e-mail: irina.starikova@psyexp.ru

Метрики

Просмотров

Всего: 3814
В прошлом месяце: 14
В текущем месяце: 3

Скачиваний

Всего: 857
В прошлом месяце: 1
В текущем месяце: 0