Введение
Современные исследования подтверждают, что у работодателей существует запрос на специалистов, обладающих универсальными, т. е. не ограниченными какой-либо сферой деятельности, навыками и компетенциями XXI века [Bandyopadhyay, 2019; The relation between, 2017].
Критическое мышление является одной из компетенций, которую потенциальные работодатели ожидают от выпускников, а также отмечают как наиболее важную для построения успешной карьеры [Soft Skills Integration, 2021; Penkauskienė, 2019].
Необходимость развития КМ в образовательной среде зафиксирована в федеральных государственных образовательных стандартах высшего образования в виде одной из универсальных компетенций, как для бакалавриата, так и для магистратуры [Портал федеральных государственных, 2022].
Эта ситуация не является специфически российской. Совокупный анализ образовательных стандартов демонстрирует значимость данной компетенции как образовательного результата и за рубежом [Универсальные компетентности и, 2020]. Однако, согласно исследованиям, значительное число студентов университетов демонстрируют недостаточно высокий уровень КМ [Корешникова, 2021; Assessment of critical, 2019]. Такой дефицит провоцирует повышенный спрос на рынке дополнительного профессионального образования на программы повышения квалификации в области развития сложных когнитивных навыков.
На сегодняшний день в России реализуется несколько образовательных программ и курсов по развитию КМ. На открытом рынке существуют как очные программы (Школа критического мышления, тренинг Академии PWC), так и онлайн-курсы на таких платформах как «Открытое образование», «Нетология», «Синхронизация», «Викиум», «Stepik» и др. Ряд программ ДПО по КМ реализуют университеты и институты повышения квалификации.
Разработка отдельных образовательных продуктов по КМ для взрослых согласуется с существующими исследованиями. Исследователи отмечают, что КМ у взрослых поддается развитию [Ab Kadir, 2017; Dwyer, 2020; Mehmet Ş.A, 2018]. Кроме того, есть данные, свидетельствующие о преимуществах отдельных стратегий обучения. Так, свою эффективность показывает прямое обучение, когда обучающиеся целенаправленно проходят отдельный курс по развитию КМ [Enhancing Critical Thinking, 2022].
В связи с ростом популярности таких курсов на рынке образовательных продуктов возникает закономерный спрос на инструменты измерения. Однако на русском языке крайне мало валидизированных и надежных психометрических инструментов измерения [Волков, 2015]. Опубликованные данные о психометрических показателях были обнаружены только для следующих тестов на русском языке: «4К» [Угланова, 2020], направленного на оценку уровня КМ у школьников, HEIghten Critical Thinking Assessment [Thinking critically about, 2020] для студентов. Использование зарубежных инструментов не представляется целесообразным, поскольку прямой перевод заданий, разработанных для англоязычной аудитории, может приводить к снижению психометрических показателей. В то же время адаптация зарубежных инструментов может быть не менее сложной, чем разработка нового инструмента, а также требует разрешения правообладателей и платы за использование.
Таким образом, сегодня исследователи сталкиваются с необходимостью разработки системы измерения, пригодной для установления уровня критического мышления у взрослых слушателей учебного курса. Для построения такой системы необходимо выполнить ряд задач, которые связаны с разработкой содержательного определения конструкта, выявлением его компонентов, разработкой инструмента измерения и исследованием качества инструмента.
В данной статье описаны особенности разработки инструмента измерения в рамках методологии доказательной аргументации ECD (Evidence-centered Design, ECD) [Mislevy, 2014] с использованием аутентичных заданий, в которых респонденту следует выполнить действия (performance tasks). Также приведены доказательства валидности результатов, полученных с помощью инструмента.
Критическое мышление: определение и составляющие
Описываемый инструмент разработан для оценки уровня КМ слушателей учебного курса «Критическое мышление» платформы «Яндекс.Практикум»[Волков, 2015]. Образовательные результаты данного курса были сформированы с опорой на теоретическую рамку «Универсальные компетентности и новая грамотность» [Универсальные компетентности и, 2020], согласно которой КМ понимается как компетентность, т. е. совокупность знаний, навыков и диспозиций, позволяющих эффективно решать повседневные и профессиональные задачи в различных контекстах. Таким образом, КМ было определено как совокупность знаний, навыков и диспозиций, позволяющая рационально анализировать и оценивать информацию для аргументированного принятия решений. Составляющие конструкта КМ, на развитие которых направлен курс (образовательные результаты), был определен на основе анализа актуальной литературы [Hitchcock, 2022; Studies in Critical, 2019], матрицы образовательных результатов учебного курса «Критическое мышление» платформы «Яндекс.Практикум», а также экспертного интервью с руководителем группы разработчиков данного учебного курса.
Проведенный анализ позволил представить критическое мышление как совокупность групп составляющих, таких как: (а) работа с информацией, (б) логичность рассуждений и выводов, (в) аргументация.
Работа с информацией включает в себя умение выделить релевантную задаче информацию, отличать факты от мнения, а также понимание того, какая информация заслуживает доверия, а какая требует проверки.
Под логичностью рассуждений и выводов понимается умение рассуждать логически, а также умение отличать обоснованные идеи от тех, для обоснования которых недостаточно данных.
Аргументация включает в себя понимание, какой аргумент, с точки зрения структуры и свойств, является убедительным, умение отличать убедительные аргументы, а также находить уловки в аргументации.
Диспозиции, связанные с КМ, не были включены в данную теоретическую рамку, поскольку временные ограничения на прохождение теста не позволяли качественно их оценить. Оценка диспозиций КМ является направлением для дальнейших исследований.
Таблица 1
Теоретическая рамка теста
|
Работа с информацией |
Логичность рассуждений и выводов |
Аргументация
|
|||
|
знания |
навыки |
знания |
навыки |
знания |
навыки |
|
Оценка источников |
Обнаружение ошибок мышления |
Оценка и создание аргументов |
|||
|
Знает критерии достоверности источников |
Оценивает степень достоверности источников информации |
Знает виды когнитивных искажений |
Распознает когнитивные искажения |
Знает критерии убедительных аргументов |
Находит убедительные аргументы для подкрепления позиции |
|
Анализ информации |
Знает типы логических ошибок в дедуктивных, индуктивных и вероятностных рассуждениях |
|
|
Находит контраргументы для опровержения позиции |
|
|
Определяет недостаточность информации для вывода |
Оценка рассуждений |
Находит в тексте тезис, аргументы, иллюстрации |
|||
|
|
Отличает факт от фейка
|
Знает признаки правильных и убедительных рассуждений
|
Отличает логически корректные дедуктивные, правдоподобные, вероятностные рассуждения |
|
Формулирует собственную позицию в виде ясного тезиса |
|
|
Различает факт и мнение |
|
Верно устанавливает причинно-следственные связи |
|
Находит факты, подкрепляющие позицию |
|
|
Анализирует графическую информацию |
Формулирование выводов |
|
Находит подкрепляющие аргументы иллюстрации |
|
|
|
|
|
Корректно использует дедуктивные, правдоподобные, вероятностные рассуждения |
Знает способы противостояния психологическим и логическим уловкам (при аргументации) |
Распознает психологические и логические уловки |
Методология Evidence-Centered Design
При формировании теоретической рамки критическое мышление рассматривалось как композитный латентный конструкт, что в последующем определило методологию создания инструмента — Evidence Centered Design (ECD) — метода доказательной аргументации [Mislevy, 2014]. Данный метод позволяет определить какие данные возможно получить из поведения испытуемого, которые, в свою очередь, являлись бы свидетельством того, что он (или она) обладает компетенцией, которую мы измеряем, а также в последующем смоделировать задание таким образом, чтобы испытуемый мог ее проявить [Oliveri, 2019]. Важным преимуществом выбранной методологии выступает высокая конструктная валидность, которая достигается благодаря особенностям поэтапного создания теста.
На этапах анализа области компетенций (domain analysis) и моделирования области компетенций (domain modeling) была получена и конкретизирована информация об измеряемом конструкте. Далее на этапе создания концептуальной рамки инструмента (conceptual assessment framework) выбраны элементы области компетенций, которые поддаются измерению в рамках компьютерного тестирования и соответствуют цели оценивания (табл. 1), определены свидетельства проявления КМ, подобраны аутентичные ситуации, в которых можно спровоцировать проявление конструкта, а также определено, какая математическая модель лучше всего подходит для анализа получаемых данных [Mislevy, 2018]. Свидетельства, помещенные в контекст заданий, превращаются в индикаторы. Индикаторы — это конкретные наблюдаемые действия, совершенные респондентом в процессе взаимодействия с заданием и потенциально отражающие конструкт. На последующих этапах (assembly model, delivery model) было проведено качественное исследование с целью проверки реализации заложенных в концептуальную рамку инструмента характеристик и описаны формальные требования к проведению тестирования и его администрированию.
Таким образом, данная методология дает возможность построения измерения явно ненаблюдаемых конструктов, благодаря непрерывной связи наблюдаемого поведения испытуемого во время выполнения заданий и измеряемого конструкта, что обеспечивает свидетельства валидности.
Разработка тестовых заданий
На начальном этапе был определен набор поведенческих проявлений, которые могут свидетельствовать о выраженности критического мышления у целевой аудитории онлайн-курса и теста соответственно — людей в возрасте 20—50 лет, с высшим образованием, уверенных интернет-пользователей, относящихся к двум основным категориям:
• представители из сферы бизнеса, посещающие курс для развития критического мышления с целью применения полученных знаний и навыков в работе;
• люди, преимущественно молодого возраста, занимающиеся саморазвитием, которые любят учиться.
Затем были отобраны темы, отвечающие строгим критериям (не должны быть четко привязаны к какой-то конкретной профессии или сфере; должны быть дискуссионными и давать возможность для отражения разных подходов, взглядов, фактов и мнений), позволяющим выстроить измерение, а также потенциально интересные и актуальные для слушателей учебного курса, чтобы в последующем испытуемые были мотивированы и вовлечены в процесс выполнения заданий.
Ограничением выступал временной фактор — длительность теста должна быть не более 60 минут, что обусловило выбор формата заданий.
В результате был разработан инструмент, который состоит из трех блоков. Первый блок представляет собой стимульный материал и 6 вопросов к нему. Стимульный материал представлен в виде списка из 12 утверждений на тему «Женщины-руководители», каждое из которых выполняет функцию варианта ответа. Утверждения подобраны таким образом, чтобы все они были задействованы при выполнении заданий в блоке — в роли правильных ответов для одних заданий или дистракторов для других.
Второй блок аналогичен по структуре, но состоит из 15 утверждений на тему «Четырехдневная рабочая неделя» и 8 вопросов.
Первые два блока представляют собой задания, в которых респонденту следует выполнить действия (performance tasks), свидетельствующие о проявлении КМ, чем отличаются от классического формата заданий с множественным выбором, который обычно используется в инструментах измерения критического мышления. Кроме того, задания были разработаны таким образом, чтобы все вопросы были представлены в определенной последовательности, исходя из особенностей применения КМ в реальных ситуациях. Например, первыми представлены задания на анализ информации, а в конце - задания на получение выводов. Такая последовательность комфортна для восприятия и дает возможность приблизить поставленную перед тестируемым задачу к ситуации реального применения КМ, когда для ответа на вопрос необходимо проанализировать некоторый объем информации, а затем сделать выводы.
В третьем блоке содержатся 5 заданий классического формата, с выбором одного или нескольких вариантов ответа, а также задания на соотнесение. В качестве стимульного материала в основном используются фрагменты текста, но при этом присутствует и задание, содержащее графики, отражающие статистические данные, направленное на оценку навыка анализа графической информации. Таким образом, задания третьего блока разрабатывались с учетом возможности измерения тех свидетельств КМ, которые не удалось органично интегрировать в первый и второй блоки. Это позволило обеспечить более полный охват рамки.
Следуя выбранной методологии разработки инструмента, с целью проверки соответствия наблюдаемого поведения заложенным в концептуальную рамку инструмента характеристикам, было проведено качественное исследование — когнитивная лаборатория (интервью с представителем целевой группы для выявления проблемных зон) [Leighton, 2017], а также пилотное исследование (N =104 человека).
В результате были выявлены неточности в формулировках заданий и инструкций, которые были устранены к началу проведения основного количественного исследования. Доработка заключалась в экспертной проверке правильности выбранных ответов в измененных заданиях, однозначности формулировок заданий и инструкций. После проведения необходимой корректировки заданий было проведено исследование, результаты которого представлены ниже.
Эмпирическое исследование валидности
Выборка и процедура сбора данных
Выборку исследования (версии теста, доработанной на основе когнитивных лабораторий и апробации) составили 117 человек: 67% женщин (n = 78) и 33% мужчин (n = 39), в возрасте от 18 лет до 71 года.
Средний возраст участников: 38 лет (SD — 12). Выборка была собрана путем интернет-рассылки методом «снежного кома». Для составления опроса использовался инструмент Alchemer. Уровень образования участников варьировался. Большинство участников имеют высшее образование (67%, n = 78) и не проходили ранее курсы по развитию КМ (96%, n = 112). Также в выборку вошли 18% (n = 21) участников, которые окончили аспирантуру, 11% (n = 13) — с неоконченным высшим образованием и 4% (n = 5) — со средним профессиональным образованием.
От каждого участника в онлайн-режиме было получено согласие на участие и обработку данных с помощью информационной страницы, на которой были указаны детали исследования, ориентировочное время тестирования, а также информация о конфиденциальности полученных данных.
Испытуемым перед выполнением заданий теста предлагалось заполнить анонимную анкету, которая включала вопросы о поле, возрасте, уровне образования, опыте обучения на курсах по развитию КМ и логики, вопросы, касающиеся самооценки составляющих КМ.
После выполнения заданий теста участники заполняли анкету негативных жизненных событий, опросник на склонность к конспирологическим убеждениям, а также отвечали на вопрос о самооценке КМ. Кроме того, у участников было поле для ввода обратной связи, вопросов и предложений по тесту.
Выгруженные из системы Alchemer данные теста и валидизационных опросников перекодировались при помощи программы Microsoft Excel, обрабатывались и анализировались при помощи программ Winsteps версии 4.1.0, SPSS и статистических пакетов RStudio.
Методология анализа данных
В данном исследовании, с опорой на рамку валидности, определенную стандартами разработки теста (The Standards for Educational and Psychological Testing, APA [Standards for Educational, 2014]), рассматривались свидетельства конструктной, критериальной, конвергентной и содержательной валидности инструмента.
Для сбора свидетельств конструктной валидности был проведен анализ размерности, проанализированы психометрические характеристики теста в современной теории тестирования (IRT - Item Response Theory). Для получения свидетельств критериальной валидности проверена статистическая связь баллов разработанного теста с другими переменными, в качестве которых выступали итоговые баллы по опроснику конспирологических убеждений и шкале негативных жизненных событий. Для оценки свидетельств конвергентной валидности была рассмотрена связь баллов за тест КМ и переменной, связанной с рассматриваемым конструктом - самооценкой уровня КМ. Также были собраны свидетельства содержательной валидности через получение от специалистов по КМ экспертной оценки о качестве теста.
Результаты анализа
Разработанный тест состоит из 20 заданий (6 заданий в первом блоке, 8 заданий во втором и 6 - в третьем), 13 из них дихотомические, а 7 - политомические.
Анализ размерности
В программе Winsteps методом главных компонент была проанализирована размерность инструмента измерения.
Собственное значение самого крупного контраста (1st contrast) составляет 1,8, что не превышает рекомендуемый показатель для одномерных тестов, равный 2 [Smith Jr, 2002].
Также у контрастов однородная зависимость - на первый и второй контраст приходится близкое количество необъясненной дисперсии и их собственные значения близки. Эти данные указывают, что тест можно анализировать как существенно одномерный.
Психометрический анализ
В данном исследовании тест был проанализирован в рамках современной теории тестирования (IRT), модели частичного оценивания — Partial Credit Model [Masters, 1982]. Эта модель представляет собой расширение модели Раша на случай, когда в тесте есть задания, оцениваемые политомически, и в отличие от тестов, которым с большей вероятностью подойдет Rating Scale Model, в данном тесте у заданий разные ответные категории.
Таблица 2
Общие статистики по заданиям
|
|
Оценка трудности |
Ошибка измерения |
Статистики согласия |
|||
|
INFIT |
OUTFIT |
|||||
|
MNSQ |
ZSTQ |
MNSQ |
ZSTD |
|||
|
Среднее значение |
0,00 |
0,19 |
0,99 |
0,00 |
1,04 |
0,30 |
|
Стандартное отклонение |
0,73 |
0,04 |
0,07 |
0,70 |
0,18 |
1,10 |
|
Максимальное значение |
1,22 |
0,29 |
1,11 |
1,40 |
1,50 |
3,00 |
|
Минимальное значение |
-1,85 |
0,13 |
0,86 |
-1,20 |
0,74 |
-1,10 |
Среднее значение ошибок измерения всех заданий — 0,19. Среднее значение INFIT ZSTD (взвешенной статистики согласия) составляет 0,00; OUTFIT ZSTD (невзвешенной статистики согласия) — 0,03. Значения близки к 0, что говорит о том, что в среднем задания соответствуют модели. Максимальное значение INTFIT ZSTD — 1,41, следовательно, по этому показателю все задания в хорошем согласии с данной моделью. Максимальное значение OUTFIT ZSTD — 3,00 (табл. 2), означает, что есть хотя бы 1 задание с показателями выше рекомендованных (>2,00), которые показывают, что в задании присутствуют экстремально неожиданные ответы. Надежность в IRT (Person separation reliability) — 0,76, что отражает отношение «истинной» дисперсии к наблюдаемой.
Значение SEPARATION указывает на то, что данную выборку можно разделить примерно на 3 группы по уровню способностей (или страт, то есть число статистически различных уровней мер испытуемых).
Анализ заданий. Согласие с моделью
Большинство заданий функционирует корректно (табл. 3). Наиболее простое задание в тесте — №9 (Блок 2 №3). Показатель его трудности равен (-1,85) логита. Самым сложным заданием является №20 (Блок 3 №6), его трудность составляет 1,22 логита. Взвешенные статистики согласия у заданий С5 и С6 выше рекомендуемых — это означает, что вопрос не в полной мере согласуется с ответами респондентов на краях распределения, в данных больше «шума», чем предсказывала модель. Однако надо заметить, что некоторые исследователи указывают, что критическим интервалом можно считать статистики от (-3) до 3 [Linacre, 2002].
Таблица 3
Показатели заданий
|
Номер задания |
Тип задания |
Оценка трудности |
Ошибка измерения |
Статистики согласия (ZSTQ) |
|
|
INFIT |
OUTFIT |
||||
|
1 |
А1 |
0,37 |
0,13 |
-0,6 |
-0,2 |
|
2 |
А2 |
-0,06 |
0,13 |
0,3 |
0,0 |
|
3 |
А3 |
0,37 |
0,20 |
0,2 |
0,1 |
|
4 |
А4 |
0,21 |
0,20 |
-0,6 |
0,4 |
|
5 |
А5 |
-1,17 |
0,24 |
-0,4 |
-0,4 |
|
6 |
А6 |
-0,14 |
0,15 |
-0,5 |
-0,7 |
|
7 |
В1 |
0,53 |
0,13 |
1,1 |
1,1 |
|
8 |
В2 |
-0,47 |
0,21 |
-0,1 |
0,4 |
|
9 |
В3 |
-1,85 |
0,29 |
-0,7 |
-0,8 |
|
10 |
В4 |
1,12 |
0,21 |
0,2 |
0,4 |
|
11 |
В5 |
0,12 |
0,20 |
0,5 |
-0,2 |
|
12 |
В6 |
0,73 |
0,20 |
1,4 |
0,5 |
|
13 |
В7 |
-0,70 |
0,22 |
-0,1 |
0,3 |
|
14 |
В8 |
-0,12 |
0,20 |
-0,1 |
-0,3 |
|
15 |
С1 |
-0,33 |
0,21 |
-1,2 |
-1,1 |
|
16 |
С2 |
0,12 |
0,13 |
-0,7 |
-1,1 |
|
17 |
С3 |
0,86 |
0,21 |
-0,8 |
0,7 |
|
18 |
С4 |
-0,31 |
0,14 |
0,8 |
1,1 |
|
19 |
С5 |
-0,51 |
0,21 |
-0,2 |
3,0 |
|
20 |
С6 |
1,22 |
0,22 |
0,9 |
2,9 |
Проанализировав данные, мы можем сделать вывод, что большинство заданий имеют хорошие психометрические характеристики. Тест можно рассматривать как качественный и надежный инструмент измерения с точки зрения психометрических показателей в модели Partial Credit Model.
При разработке теоретической рамки предполагалась сильная связь выделенных компонентов КМ, что и подтвердилось при анализе размерности. Подобной одномерной факторной структурой обладают и другие инструменты измерения КМ, например, российская версия теста HEIghten Critical Thinking Assessment [Thinking critically about, 2020].
Конвергентная валидность
В качестве инструмента, измеряющего самооценку КМ, были выбраны:
● Самооценка КМ
● Опросник КМ [Корешникова, 2020]
Опросник на основании полученных данных подтвердил высокий уровень надежности (Альфа 0,91), надежность, указанная авторами опросника 0,92. Так же как и вопрос про самооценку уровня КМ, он показал значимую (р<0,01) положительную умеренную корреляцию с баллами по разработанному тесту (табл. 4) [Akoglu, 2018].
Таблица 4
Корреляционный анализ (Спирмен)
|
|
Опросник КМ |
Самооценка КМ |
|
Тест КМ |
0,333** |
0,384** |
Примечание: «**» - р <0,01
Мы оценили свидетельства конвергентной валидности, рассмотрев связи между баллами по тесту и переменными, связанными с конструктом, такими как академические результаты, самооценка уровня КМ. Как показали результаты, только самооценка и опросник КМ значимо (р <0,01) коррелируют с баллами по данному тесту КМ.
Исследования стилей мышления и необоснованных убеждений показали, что рациональные, аналитические стили мышления отрицательно коррелируют с конспирологическими убеждениями [West, 2008]. Учитывая теоретическую положительную связь между критическим и аналитическим мышлением, мы предполагали отрицательную связь между КМ и конспирологическими убеждениями.
В качестве инструмента измерения конспирологических убеждений был выбран опросник, выявляющий склонность к ним, — GCBS [Kay, 2022].
В табл. 5 представлены значения корреляционного анализа, из которых мы можем сделать вывод о том, что значения коэффициента корреляции статистически значимы и отрицательны, что выступает свидетельством критериальной валидности.
Таблица 5
Корреляционный анализ
|
|
Негативные события |
Конспирологические убеждения |
|
Тест КМ |
-0,17* |
-0,4** |
Примечание: «**» - р< 0,01; «*» - p<0,05.
В роли критерия использовалась шкала негативных жизненных событий, разработанная в 2007 г. [Bruine de Bruin, 2007]. Она нацелена на измерение распространенности негативных жизненных событий. Проходя его, респонденты указывают, происходило ли с ними указанное негативное событие за последние полгода.
С помощью данного опросника проходила валидизация инструмента оценки КМ Halpern (HCTA) [Butler, 2012]. В ходе исследования были сделаны выводы о том, что у респондентов с высокими баллами КМ было меньше негативных событий (r = - 0,38).
Шкала не была адаптирована для использования на русском языке. Используя метод обратного перевода для обеспечения лингвистической эквивалентности, а также корректируя некоторые утверждения для обеспечения культурной валидации, был осуществлен перевод шкалы.
Как видно из табл. 5, коэффициент корреляции — значимый (p <0,05; р < 0,01) и отрицательный. Однако связь со шкалой негативных событий крайне слабая, тогда как связь с конспирологическими убеждениями умеренная.
Содержательная валидность
Для подтверждения содержательной валидности задания разработанного теста были отправлены на проверку пяти экспертам по КМ: кандидатам философских наук, доцентам, преподавателям курсов по развитию КМ на различных платформах, а также авторам научных публикаций по теме КМ. Стоит отметить, что в России тема развития КМ стала популярна только несколько лет назад, и на сегодняшний день есть ограниченное количество специалистов, которые занимаются изучением этой темы.
Экспертам были предоставлены все материалы теста — инструкции, задания с индикаторами и ключи. Каждому эксперту необходимо было оценить вопросы теста по следующим критериям: понятность задания, правильность ответа, соответствие задания заложенному индикатору, направленность задания на оценку КМ. Они отметили, что все вопросы теста и варианты ответа понятны, задания верно подобраны к индикаторам, ошибок в ключах к тесту зафиксировано не было. В ходе экспертизы заданий все эксперты подтвердили, что задания направлены на измерение КМ.
Заключение
В статье раскрыты результаты исследования измерения критического мышления для слушателей онлайн-курса. В соответствующих разделах представлены определение измеряемого конструкта, его модель; описаны основные этапы разработки инструмента измерения с использованием методологии ECD и performance tasks, а также приведены эмпирические доказательства валидности полученных результатов.
Результаты статистического и психометрического IRT-анализа доказывают правомерность использования данного теста для заявленной целевой аудитории. Анализ размерности инструмента измерения показал, что тест можно рассматривать как существенно одномерный. С точки зрения критериальной валидности теста подтвердились гипотезы об отрицательной связи внешними переменными с такими как вера в конспирологические убеждения, и шкалой негативных жизненных событий. Экспертная проверка показала, что задания направлены на измерение КМ. При этом следует отметить, что в исследовании была использована шкала негативных жизненных событий, которая требует процедуры адаптации с английского на русский язык с соблюдением стандартов. Стоит отметить, что в рамках первичной оценки качества инструмента измерения с применением IRT анализа размер используемой выборки респондентов можно считать достаточным. Однако планируется провести исследование на большем количестве испытуемых [Is Rasch model, 2014].
Таким образом, можно сделать вывод о том, что разработанный инструмент функционирует согласно поставленной цели, имеет хорошие психометрические характеристики, однако в будущем желательно провести дополнительные исследования валидности.
Несмотря на преимущества performance tasks по сравнению с классическими заданиями с выбором единственного правильного ответа, более точно оценить критическое мышление можно в заданиях открытого типа со свободным изложением ответа. Разработка и включение в инструмент подобных заданий может быть направлением для дальнейших исследований.
В рамках развития данного инструмента предполагается также создание блока вопросов, направленных на оценку диспозиционной составляющей КМ [Calma, 2021; Critical thinking education, 2022].
Такое усовершенствование инструмента позволит делать более обоснованные выводы об уровне КМ для обозначенной целевой аудитории, а также стать основой построения измерения для других целевых групп.
[Волков, 2015] Яндекс.Практикум. Навыки критического мышления для менеджеров: анализ информации, аргументация и принятие решений [Электронный ресурс]. URL: https://practicum.yandex.ru/thinking/ (дата обращения: 24.06.2022).