Психометрия латентных характеристик: инструменты, проблемы обработки ранговой информации, решения

В.Г. Митихин

doi:10.17759/psyedu.2024160204

Введение

В психологии, психиатрии, неврологии, педагогике и социологии психометрические ранговые инструменты используются для измерения и оценки уровня выраженности латентных характеристик человека (пациента). К таким характеристикам относятся: интеллектуальные способности, нейрокогнитивные функции, агрессия, депрессия, тревога, стигма, межличностные отношения и другие свойства личности.

В настоящее время можно выделить два основных направления использования психометрических инструментов, на которые мы опираемся для иллюстрации и решения поставленных задач в рамках данной работы.

Традиционное направление

Информация, полученная на основе ранговых психометрических шкал, тестов и опросников, рассматривается (без всяких дополнительных условий и соображений, в частности, вероятностного характера) как числовая информация, которую можно обрабатывать любыми математическими средствами.

В рамках такого числового подхода к ранговой информации исследователи в своих работах оперируют такими недопустимыми характеристиками, как сумма баллов и средние баллы по пунктам диагностических шкал и субшкал, дисперсия и стандартные отклонения, ошибки средних величин и т.д. Такие примеры можно обнаружить при просмотре статей, в практически любых журналах, в области психосоциальных исследований, использующих ранговые шкалы. Здесь можно назвать множество ссылок из работы [Bech, 2012], а в качестве свежих примеров [Золотарева, 2023; Кукшина, 2023; Шалагинова, 2023; Kopylov, 2023].

Недопустимость использования классических математических операций в рамках ранговой (порядковой) шкалы известна уже более 50 лет, начиная с основополагающих работ J. Pfanzagl [Pfanzagl, 1971]. Этот факт описан в зарубежных и отечественных руководствах и учебных пособиях по теории шкал и методам математической обработки данных (см., например, [Купцов, 2017; Орлов, 2006; Хайтун, 2014; Michell, 1999]).

Современное направление

1) В рамках этого направления исследователи, зная о недопустимости обработки ранговой информации классическими математическими методами, предлагают использовать метрические измерительные системы. К таким системам относятся, в частности, метод анализа иерархий (МАИ или в англоязычной нотации – Analytic Hierarchy Process (AHP)), включающий средства измерений и алгоритмы принятия решений [2; 5; 10-13; 15; 22; 28-30], а также метрическая система Раша (МСР) [Аванесов, 2010; Ассанович, 2017; Ассанович, 2021; Bond, 2015; Rasch, 1960; Rasch, 1980]. Отметим, что в нашей работе обсуждается классический вариант МСР, так как именно с этой моделью связана современная критика психометрических инструментов, представленная в статье [Тюменева, 2022]. Также классический вариант МСР некорректно используется в рамках российской экзаменационной системы ЕГЭ (см., например, [Малинецкий, 2011]), что является одной из причин возникновения критики психометрических инструментов.

2) В последние годы появились работы, в которых обсуждаются доводы критического характера по отношению к психометрии. Основной посыл этих доводов заключается в том, что психометрия вообще не может рассматриваться в качестве инструмента измерения латентных характеристик человека (например, [Тюменева, 2022; Uher, 2020]).

Утверждается, что идея психометрии как средства, позволяющего получать оценки психосоциальных характеристик человека, основана на нечетких значениях базовых терминов, которые часто путают, а также на ошибочных предположениях о том, как измерения могут быть реализованы при исследовании психики.

Проблема исследования

Таким образом, существует проблема оценки корректности и адекватности применения психометрических инструментов в психосоциальных исследованиях. В настоящей работе основное внимание уделено возможностям и перспективам использования МАИ при обработке ранговой информации, полученной с помощью надежных психометрических инструментов. Сравнение возможностей методов МАИ и МСР требует отдельного исследования, но некоторые замечания об особенностях использования МСР, а также по вопросу критики психометрических инструментов будут сделаны после изложения возможностей применения МАИ для решения проблем психометрии.

Материал и методы

В работе используются материалы российских и зарубежных научных публикаций, а также результаты собственных исследований, посвященных использованию и обработке разнородных данных, представленных в разных шкалах от категориальных до шкал отношений.

Методы анализа данных: статистический, ранговые методы, метод МАИ. Все расчеты на основе предлагаемых алгоритмов выполнялись в среде MS Excel.

Результаты и обсуждение

Некорректность числового подхода к обработке ранговых данных психометрии

Причина продолжающейся практики числового подхода к обработке ранговой информации лежит в области абстрактности используемых методов теории измерений и шкал при доказательстве, например, недопустимости использования в ранговых шкалах таких операций, как суммирование и вычисление среднего арифметического. Но на качественном уровне понимания ранговой информации ясно, что сумма знаний двоечника (2 балла) и троечника (3 балла) не равна уровню знаний отличника (5 баллов).

Основная причина подобных фактов в психосоциальных исследованиях заключается в неравномерности меток порядковых (ранговых) шкал, для которых можно использовать только операции упорядочивания: равенство, больше, меньше или монотонного преобразования без нарушения исходного порядка (например, [Орлов, 2006; Хайтун, 2014]).

Рассмотрим простой пример, моделирующий ситуацию экспертного консилиума и демонстрирующий недопустимые противоречия, возникающие при «числовом» подходе к обработке ранговой информации. В табл. 1 приводятся результаты экспертного оценивания состояния двух пациентов Р1 и Р2, полученные от 11-ти специалистов равной квалификации, которые использовали 7-балльную ранговую шкалу (уровни этой шкалы: от 1 до 7, упорядочены по возрастанию тяжести признака-симптома).

Таблица 1. Экспертные оценки состояния пациентов Р1, Р2 в 7-балльной шкале

Число экспертов	P1 (оценки)	Число экспертов	P2 (оценки)
8	6	9	5
3	3	2	6

А. Очевидно, что на основе принципа абсолютного большинства оценка состояния пациента Р1 – 6 баллов, а для пациента Р2, соответственно, 5 баллов. Это принцип, который в теории принятия решений позволяет избежать парадоксов, существующих в различных системах выбора. Дополнительным аргументом являются оценки из описательной статистики: медиана и мода, которые совпадают и для P1 (6 баллов), и для Р2 (5 баллов).

В. Если исходить из «числового» подхода к ранговым данным табл. 1, то для средних оценок (С1 и С2) состояния Р1 и Р2 получаем (c точностью до 0,01):

С1 = (8*6 + 3*3) / 11 = 5,18; С2 = (9*5 + 2*6) / 11 = 5,18

С учетом стандартной ошибки вычисления среднего получаем:

С1 = 5,18 ± 0,42; С2 = 5,18 ± 0,12

Полученный результат приводит в лучшем случае к неопределенной ситуации, а в худшем – к противоположному выводу по сравнению с пунктом А. Логичным выходом из этой ситуации является признание факта, что ранговые данные из табл. 1 не допускают вычисление среднего арифметического.

Дополнительным подтверждением такого вывода являются результаты обширного клинического исследования [Ассанович, 2017], в котором было выявлено, что критерии оценки тяжести депрессии в шкале Гамильтона (HRSD, Hamilton), разработанные на основе ранговых данных в рамках «числового» подхода, не согласуются с клиническими данными.

Комментарий к примеру.

Некорректная («числовая») обработка ранговой информации, как следует из приведенного примера, ведет к неопределенным ситуациям или ошибкам при оценке выраженности (тяжести) расстройств, а это, очевидно, негативно отражается на эффективности соответствующих психосоциальных исследований и вмешательств.

Приведенный простой пример далее использован для демонстрации корректных алгоритмов МАИ в обработке ранговой информации.

Обработка ранговых данных психометрии на основе метода анализа иерархий

2.1 Основные сведения о методе анализа иерархий

В современной теории принятия решений для многокритериальных, слабо структурированных проблем (очевидно, что к таким проблемам относятся основные психосоциальные проблемы) наиболее естественным и эффективным методом обработки разнородной информации является МАИ. Автором метода, которому более 50 лет, считается американский математик Т. Саати (T.L. Saaty), но нужно отметить, что отечественными авторами (Б.Н. Брук и В.Н. Бурков, [Брук, 1972]) был предложен метод обработки ранговой информации (раньше работ T.L. Saaty), который фактически является математической основой аппарата МАИ.

С 1988 г. (раз в 2 года) проводятся мировые симпозиумы по проблемам приложений и развития МАИ (International Symposium on Analytic Hierarchy Process, ISAHP), последний (17-й по счету) состоялся в декабре 2022 г. (виртуальный формат). Количество работ теоретического и прикладного характера на основе МАИ практически во всех областях (наука, бизнес, промышленность, здравоохранение, образование и т.д.) измеряется тысячами (см., например, обзоры работ с использованием МАИ [Андрейчиков, 2021; Kim, 2022; Schmidt, 2015]).

МАИ представляет собой системный метод принятия решений, основанный: 1) на иерархическом представлении проблемы (в нашем случае иерархия описания процедуры измерения латентных характеристик); 2) на сборе экспертной информации (количественной и качественной), собранной в рамках этой иерархии с помощью парных сравнений объектов иерархии; 3) на фиксации результатов парных сравнений с помощью фундаментальной шкалы МАИ (шкалы отношений), которая является базовым элементом аппарата МАИ; 4) на получении количественных оценок (в шкале отношений) латентных характеристик с помощью аппарата МАИ.

МАИ не опирается на вероятностные подходы, т.е. не является статистической процедурой. МАИ используется как для индивидуальных решений (естественно, эксперт должен разбираться в поставленной проблеме и владеть аппаратом МАИ), так и для групповых (коллективных) решений (на практике такой коллектив составляет до 10-20 экспертов).

Отсюда следует, что МАИ и классический вариант МСР (а также семейство моделей, разработанных для усовершенствования МСР) – совершенно разные модели, имеющие свои области применения. На практике МАИ обычно используется для оценки до 10 латентных характеристик, у одного или нескольких испытуемых.

К достоинствам МАИ относится наличие простого математического аппарата (линейная алгебра и матричный анализ), а также стандартные вычислительные процедуры на основе MS Excel.

К основным достижениям T.L. Saaty и его сотрудников (психологи, психофизиологи, математики, статистики) относится, прежде всего, разработка и использование шкалы отношений (фундаментальная шкала МАИ) для измерения предпочтений экспертов в процедурах попарного сравнения и оценки объектов любой природы [Андрейчиков, 2021; Митихин, 2015; Саати, 2008; Saaty, 1980; Saaty, 2013].

Эта числовая шкала была получена на основе соотношений процесса нервного возбуждения, которые приводят к известному в психофизиологии закону «стимул-реакция», и показала свою эффективность в многочисленных разнообразных приложениях и исследованиях.

Шкала является бесконечным интервалом (0; ∞), а к основным значениям шкалы, которые удобно использовать в большинстве приложений, относятся числа из интервала (0; 9). Эта шкала не включает нуль, т.к. в противном случае будут допускаться к рассмотрению объекты с нулевой весомостью, т.е. несущественные для рассматриваемой проблемы.

Для удобства и облегчения работы эксперта при парных сравнениях объектов основные числа шкалы МАИ имеют лингвистическое описание: 1 – равная важность; 3 – слабое предпочтение; 5 – значимое предпочтение; 7 – сильное предпочтение; 9 – абсолютное предпочтение; 2, 4, 6, 8 – для промежуточных случаев. В шкалу входят и соответствующие обратные значения (результаты обратных сравнений). При этом коллективом T.L. Saaty учтены психофизические особенности человека при обработке информации.

2.2 Основные этапы решения задач обработки информации в рамках МАИ

Проблему оценивания состояний пациента (в рамках примера) можно представить в виде иерархии (сверху-вниз): 1-ый уровень – итоговая оценка состояния; 2-ой уровень – специалисты-эксперты; 3-ий уровень – это критерии оценивания (в нашем примере использован один критерий, а в общем случае их может быть несколько), измеряемые в соответствующих психометрических шкалах; 4-ый уровень – пациенты.

Для решения рассматриваемого примера обработки ранговой информации следует использовать нормативный подход МАИ [2; 10-12; 15]. Подход основан на использовании экспертных парных сравнений оценок ранговой шкалы (с помощью фундаментальной шкалы МАИ) для формирования числовой шкалы интенсивностей соответствующих оценок ранговой шкалы.

Рассмотрим матрицу (табл. 2) экспертных оценок парных сравнений уровней 7-балльной шкалы («1», …, «7»), используя для фиксации результатов парных сравнений основные значения фундаментальной шкалы МАИ. Напомним, что ранговая 7-балльная шкала используется в рассматриваемом примере (табл. 1). Уровни ранговой шкалы от минимального («1») до максимального («7») упорядочены по тяжести выраженности симптома.

Таблица 2. Матрица результатов парных сравнений отметок («1», …, «7») ранговой шкалы на основе соглашения экспертов (Э)

Э	«7»	«6»	«5»	«4»	«3»	«2»	«1»
«7»	1	2	3	5	6	7	9
«6»	1/2	1	3	5	6	7	9
«5»	1/3	1/3	1	2	3	5	7
«4»	1/5	1/5	1/2	1	3	5	7
«3»	1/6	1/6	1/3	1/3	1	3	5
«2»	1/7	1/7	1/5	1/5	1/3	1	3
«1»	1/9	1/9	1/7	1/7	1/5	1/3	1

Элементы матрицы из табл. 2 представляют собой числа фундаментальной шкалы МАИ, представляющие собой результаты парных экспертных сравнений уровней 7-балльной шкалы. Например, по главной диагонали такой матрицы всегда стоит значение 1 (в матрице выделено жирным курсивом), т.к. результат сравнения любого уровня ранговой шкалы с этим же уровнем имеет равную важность, которая выражается числом 1.

Алгоритм заполнения матрицы удобно рассмотреть на примере первой строки, элементы которой фиксируют степень предпочтения (по тяжести выраженности симптома) уровня «7» над следующими уровнями («6», «5», ..., «1»). Результат предпочтения оценки «7» над оценкой «6» эксперты оценили числом 2, которое означает промежуточное значение между равной важностью (1) и слабым предпочтением (3). Далее, результат предпочтения оценки «7» над оценкой «5» эксперты оценили числом 3, которое означает слабое предпочтение. Наконец, результат последнего сравнения: предпочтение оценки «7» над оценкой «1» эксперты оценили числом 9, которое означает абсолютное предпочтение.

Аналогично заполняются элементы следующих строк верхней треугольной части матрицы (над главной диагональю матрицы), которые всегда будут иметь значения больше 1, т.к. сравниваемые ранги упорядочены по тяжести симптома. Нижняя часть матрицы (под главной диагональю) симметрично заполняется обратными значениями (меньше 1), т.к. они соответствуют результатам обратных сравнений. Поэтому матрицы парных сравнений в МАИ называют обратно-симметричными, у которых элементы, симметричные относительно главной диагонали, удовлетворяют соотношению:

a(i, j) = 1 / a(j, i),

где a(i, j) – элемент матрицы парных сравнений A (табл. 2) с индексами i и j.

Приведем основные теоретические соотношения МАИ для нахождения характеристик весомости оценок ранговой шкалы [2; 10-12; 15; 28; 29]. Обозначим через w(i) числовые нормированные веса i–ой ранговой оценки, где i = 1, ..., 7 (нормированность весов означает выполнение условия: ∑ w(i) = 1).

Тогда шкала числовых интенсивностей (Int) оценок ранговой шкалы получается на основе значений w(i) по формуле:

Int (i) = w(i) / w(7), (1)

Если обозначить через W = (w(7), w(6),…, w(1))T вектор-столбец нормированных весов оценок ранговой шкалы (T – обозначение матричной операции «Транспонирование», которая строку переводит в столбец), то имеет место основное уравнение МАИ:

A*W = λmax*W, (2),

где A – матрица парных сравнений (табл. 2), а λmax – важный числовой параметр теории МАИ, который, как и вектор-столбец W, требуется найти из нелинейного матричного уравнения (2). Точное решение (т.е. значения λmax и W) нелинейного уравнения (2) с учетом нормировки весов w(i) можно получить с помощью надстройки MS Excel «Поиск решения», что требует определенного уровня владения этим инструментом.

Точное решение уравнения (2) мы приведем ниже, а сейчас укажем один из простых алгоритмов на основе элементарных алгебраических операций, позволяющий найти приближенное значение (с точностью 0,01) элементов вектора W, опираясь на значения элементов матрицы A (см., например, [Митихин; Митихин, 2022; Саати, 2008; Saaty, 1980]).

Алгоритм состоит из 4-х этапов:

1) находим строчные произведения (p) элементов матрицы А (например, для первой строки А из табл. 2 получаем: p (1) = 11340, для второй строки p (2) = 2835 и т.д.);

2) из каждого полученного произведения извлекаем корень 7-ой степени (показатель корня совпадает с размером матрицы А). В результате получаем для первой строки q (1) = 3,795; для второй q (2) = 3,113 и т.д.;

3) находим сумму полученных корней S = q (1)+q (2)+…+q (7). Получаем S = 10,796;

4) находим веса w(i) по формуле: w(i) = q(i) / S.

В табл. 3 приводятся полученные с помощью указанного алгоритма приближенные значения весов w(i) и соответствующих интенсивностей Int(i) для 7-балльной шкалы.

Таблица 3. Приближенные значения весов и соответствующих интенсивностей для уровней 7-балльной шкалы

w	w(7)	w(6)	w(5)	w(4)	w(3)	w(2)	w(1)
Значения	0,351	0,288	0,145	0,103	0,060	0,033	0,020
Int	Int(7)	Int(6)	Int(5)	Int(4)	Int(3)	Int(2)	Int(1)
Значения	1,000	0,820	0,412	0,293	0,170	0,095	0,054

В табл. 4 приводятся точные значения весов w(i), полученные при решении уравнения (2) с помощью MS Excel и соответствующие интенсивности Int(i) для уровней 7-балльной шкалы.

Таблица 4. Точные значения весов и соответствующих интенсивностей для уровней 7-балльной шкалы

w(i)	w(7)	w(6)	w(5)	w(4)	w(3)	w(2)	w(1)
Значения	0,352	0,290	0,139	0,105	0,060	0,033	0,020
Int(i)	Int(7)	Int(6)	Int(5)	Int(4)	Int(3)	Int(2)	Int(1)
Значения	1,000	0,824	0,395	0,298	0,169	0,095	0,056

Как видно из приведенных результатов в табл. 3, 4, приближенные и точные значения практически совпадают (разница значений не больше 3-4%). Такой результат объясняется хорошей согласованностью экспертной информации, которая представлена матрицей парных сравнений A (табл. 2).

В рамках МАИ согласованность экспертных данных, представленных в матрице A, определяется через параметр λmax на основе значений величины ОС (Отношение Согласованности) по формуле:

ОС = ИС / СИ

В этой формуле: ИС = (λmax – n) / (n – 1) – Индекс Согласованности (n – размер матрицы А), а СИ – Случайный Индекс, который берется из соответствующей таблицы случайных индексов, в частности, СИ = 1,35 для случая n = 7 (см., например, [Андрейчиков, 2021; Саати, 2008; Saaty, 2013]).

Для случая ОС = 0 – матрица A идеально согласована. Для случаев 0 < ОС ≤ 0,1 – принято считать, что матрица хорошо согласована (т.е. в этом случае ИС лишь в малой мере совпадает со случайным СИ – не более, чем на 10%).

Для рассматриваемого примера (табл. 2) значение λmax = 7,50 и соответствующее значение ОС = 0,06 (что означает хорошую согласованность матрицы А).

В практических исследованиях на первом этапе после формирования матрицы A следует найти значение λmax (приближенное или точное) и оценить соответствующее значение ОС.

Если экспертная матрица A не обладает хорошей согласованностью, то следует устранить причины несогласованности экспертных предпочтений и добиться хорошей согласованности матрицы А. Это можно делать различными средствами, добиваясь консенсуса в работе экспертов или путем привлечения более опытных экспертов (см., например, [Саати, 2008]). Кроме этого, существуют модификации МАИ, позволяющие сокращать в разы объем экспертной работы и при этом получать идеально согласованные матрицы парных сравнений, для которых вычисление точных элементов вектора W требует использования только элементарных алгебраических операций, как в приведенном выше алгоритме [Митихин, 2022; Ногин, 2004].

Приведем теперь решение исходного примера (табл. 1), опираясь на числовые значения интенсивностей для оценок 7-балльной ранговой шкалы (табл. 4).

Обозначая среднее арифметическое значений интенсивностей для оценок пациента P1 через S1, а для P2, соответственно, через S2 и используя значения интенсивностей ранговых уровней из табл. 4, получаем с точностью до 0,01:

S1 = (8 * Int(6) + 3 * Int(4)) / 11 = 0,68; S2 = (8 * Int(5) + 3 * Int(6)) / 11 = 0,51

С учетом стандартной ошибки вычисления среднего получаем:

S1 = 0,68 ± 0,07; S2 = 0,51 ± 0,06

Таким образом, численное решение рассматриваемого примера, как и корректное ранговое решение, дают совпадающий клинический результат, а именно: состояние пациента P1 следует считать более тяжелым.

Замечания о метрической системе Раша и о критике психометрических инструментов

В качестве альтернативы психометрическим подходам, которые практикуют «числовой» взгляд на ранговые данные, а также используют процедуры преобразований на основе нормального распределения, Г. Раш (G. Rasch, [Rasch, 1960; Rasch, 1980]) разработал вероятностный метрический подход к измерению латентных психосоциальных свойств. Английское название этого подхода Rasch Measurement, а в отечественной литературе (см., например, [Аванесов, 2010]) принято использовать название метрическая система Раша (МСР).

Классическая модель МСР была разработана для заданий с дихотомическими пунктами, равномерно возрастающей трудности, позволяющая оценить структуру теста и измерить уровень выраженности латентного свойства у респондентов.

МСР может использоваться в исследованиях практически любого свойства личности при условии его статистической устойчивости и клинически значимой наблюдаемости с помощью системы психосоциальных индикаторов. МСР включает технологию разработки тестов, а также математическое и программное обеспечение для оценки меры трудности заданий и уровня подготовленности испытуемых.

3.1. Трудности использования МСР

Практическая реализация МСР связана с достаточно большими выборками (сотни респондентов) и соответствующими объемами статистической информации, обработка которой требует специализированного математического и программного обеспечения.
Статистическое моделирование на основе МСР использует агрегированные данные, которые представляют информацию о характеристиках личности на уровне популяции. Но результаты обработки статистических данных трудно поддаются интерпретации на индивидуальном уровне, который является основным для психосоциальных приложений.

Возникающие проблемы при разработке и оценке характеристик тестов на основе МСР (например, известный парадокс Раша в рамках классической модели МСР – риск удаления из теста самых лучших его заданий) требуют для своего решения использования итерационных экспертных процедур.

3.2. О критике МСР

Так как часть критики психометрических инструментов (например, в работе [Тюменева, 2022]) была направлена на МСР, то сначала рассмотрим важный пример практического использования классической МСР, в качестве модели причин возникновения критики психометрических инструментов.

Разработчики известной экзаменационной системы ЕГЭ (Единый государственный экзамен) используют алгоритмы МСР (см., например, [Малинецкий, 2011]) для пересчета «сырых» баллов в тестовые баллы и соответствующей оценки знаний испытуемых. При этом используется классическая модель МСР, в которой успех при решении заданий теста зависит только от двух переменных: уровня знаний испытуемого и трудности задания, которые подлежат оценке по результатам экзамена.

Но известно, что успешность любой деятельности человека существенно зависит еще и от его мотивации. Современные оценки результатов обучения и соответствующих когнитивных процессов показывают, что мотивация в несколько раз сильнее влияет на успешность деятельности, чем индивидуальные способности человека (например, [Солодова, 2016]).

Далее, тест ЕГЭ (например, по математике, как в базовом, так и в профильных вариантах) включает и простые задания (арифметические, планиметрические), и более сложные (задачи на производную, умение строить математические модели, стереометрия). Отсюда на практике (и для базового, и для профильного вариантов) наблюдаются следующие стратегии поведения учеников (которых можно разделить на примерно равные численно группы): 1) первой группе математика нужна для продолжения инженерно-технического и математического образования, поэтому у них стратегия на получение максимального количества баллов; 2) вторая группа нацелена на получение аттестата и на гуманитарное образование и у них, соответственно, стратегия-минимум.

Кроме этого, организаторы ЕГЭ за счет результатов экзамена по всей стране (концепция статистического моделирования) пытаются статистически компенсировать указанные нарушения. Но, очевидно, учесть разные региональные, социально-экономические условия, влияющие на характеристики неравномерной подготовки учеников, при существующей форме проведения ЕГЭ невозможно. Очевидно, это также приводит к нарушению области применимости МСР, а также к валу критических замечаний по отношению к результатам ЕГЭ.

Рассмотренный пример показывает, что для оценки конкретного психометрического инструмента необходимо учитывать базовые концепции метода, определяющие область его применимости, а также правильно понимать основные математико-статистические процедуры, используемые для представления и обработки данных в рамках метода.

В этой связи приведем конкретные, существенные ошибки, допущенные при критике МСР в работе [Тюменева, 2022].

1) На стр. 5 этой работы можно прочитать (прямая цитата): «…Логистическое преобразование нужно, чтобы приблизить распределение баллов к нормальному, так как в модели Раша предполагается, что изучаемая латентная характеристика (черта, свойство) нормально распределена в популяции». Эта цитата показывает, что ее автор не понимает основные положения МСР и условия их реализации.

Действительно, сначала нужно заметить, что логистическое преобразование (функция) в МСР относится к функциональному соотношению между вероятностью правильного ответа на тестовое задание, подготовкой тестируемого и трудностью задания и никак не связано с каким-то нормальным распределением баллов в популяции. Более того, Г. Раш в своих работах [Rasch, 1960; Rasch, 1980] выступал против использования нормального распределения Гаусса для данных, связанных с деятельностью человека, что в настоящее время получило веские подтверждения (см., например, [Хайтун, 2014]).

Что касается самого логистического преобразования, то Г. Раш [Rasch, 1960; Rasch, 1980], исходя из общих свойств модели для оценки вероятности ответа i-го испытуемого на j-ое задание теста (P(i, j)), предложил функциональное соотношение в виде логистической функции:

P(i, j) = exp(bi – tj) / (1+ exp(bi – tj)), (3),

где: bi – уровень знаний i-го испытуемого, tj – уровень трудности j-го задания. Никакого отношения к нормальному распределению баллов в популяции логистическая функция (3) не имеет.

2) Обращаясь опять к работе [Тюменева, 2022], на стр. 6 находим элементарную ошибку при использовании логарифмической функции:

Ln (m1 / m2) = Ln (m2 – m1)

То есть автор «изобретает» новую алгебраическую формулу, считая, что логарифм отношения равен логарифму разности (причем еще и переставляя аргументы в разности!), вместо правильной формулы: логарифм отношения равен разности логарифмов.

Эту ошибку можно было бы списать на пропущенную опечатку, но через 3 строчки на этой же странице ошибка повторяется:

Ln (b1 / b2) = Ln (b2 – b1)

Используя такую формулу при b1 = b2, можно получить, что Ln (1) = Ln (0) или 0 = - ∞ !

Такие ошибки (концептуальная на стр. 5 и элементарные алгебраические на стр. 6) вызывают обоснованное сомнение в понимании автором [Тюменева, 2022] не только концепций МСР, но и элементарных алгебраических операций, составляющих аппарат МСР, поэтому критику МСР, представленную в указанной работе, следует признать несостоятельной.

3.3. О критике МАИ

В литературе существуют критические замечания, касающиеся концепций МАИ и аппарата МАИ. Подробно такие замечания, а иногда и «контрпримеры» логического и аналитического характера, доказывающие якобы несостоятельность концепций и аппарата МАИ, рассматриваются в работах [Митихин, 2015; Саати, 2008; Saaty, 2013]. В этих работах показано, что авторы критических замечаний очень поверхностно толкуют концепции МАИ (в частности, не понимают принципиальной разницы между дескриптивным и нормативным подходами МАИ и условиями их применения), а также делают элементарные ошибки при использовании аппарата МАИ. Самые распространенные ошибки не только в статьях, но и в учебных пособиях по МАИ описаны в работе [Митихин, 2015].

Выводы

Решающим преимуществом метода МАИ в проблеме измерения и оценивания латентных характеристик является ясное представление структуры многофакторной проблемы, элементов проблемы и взаимозависимостей между ними на основе иерархической модели, а также числовое выражение суждений экспертов на основе фундаментальной шкалы МАИ.
Способы получения информации от эксперта в рамках МАИ соответствуют психологически комфортным условиям, отвечающим психофизическим возможностям человека перерабатывать информацию. Очень важным элементом аппарата МАИ является возможность оценки согласованности суждений экспертов с помощью индексов согласованности (ИС и ОС), которые позволяют судить о качестве экспертной информации. При этом обработка данных на основе алгоритмов МАИ не требует специализированных математических и программных средств, достаточно стандартных средств MS Excel.
Использование таких психометрических инструментов, как МАИ и МСР, позволяет получать корректные числовые оценки латентных характеристик человека. Критика этих инструментов связана с поверхностным пониманием основных концепций психометрических измерений и области их применений, а также с элементарными ошибками при использовании аппарата психометрических инструментов.

Психометрия латентных характеристик: инструменты, проблемы обработки ранговой информации, решения

Резюме

Общая информация

Полный текст

Введение

Проблема исследования

Материал и методы

Результаты и обсуждение

Выводы

Литература

Информация об авторах

Метрики

Просмотров web

Скачиваний PDF

Всего