Тестирование в психологии

Наряду со статистикой, психологическое тестирование является важным средством дифференциальной психологии. Мы уже говорили, что первоначальные тесты, содержавшиеся в новаторских работах Френсиса Гальтона, были простыми сенсомоторными опытами. Следующий этап в развитии психологического тестирования связан с именем американца Джеймса Маккина Кэттелла.

В своих работах Кэттелл объединил два параллельно развивавшихся течения: экспериментальную психологию и психологию, основанную на измерении индивидуальных различий. У Вундта в лейпцигской докторантуре Кэттелл написал диссертацию о проявлении индивидуальных различий времени наступления реакции. После этого он читал лекции в Англии, где его интерес к индивидуальным различиям получил развитие в процессе общения с Гальтоном. Возвратившись в Америку, Кэттелл организовал лаборатории для занятий экспериментальной психологией, активно распространял методики психологического тестирования.

'Для более детального изучения вопросов, связанных как с возникновением тестирования, так и с самим психологическим тестированием мы рекомендуем студенту ознакомиться с последними работами в этой области, такими как, например, исследования Анастази.

Первые тесты на интеллект. Понятие «интеллектуальный тест» впервые появилось в статье Кэттелла, написанной им в 1890 году. В этой статье описывались серии тестов, проводившиеся ежегодно на студентах колледжа с целью определения их интеллектуального уровня. Тесты, которые предлагались в индивидуальном порядке, включали измерение мускульной силы, веса, скорости передвижения, чувствительности к боли, остроты зрения и слуха, времени реакции, памяти и т. п. Своим выбором тестов Кэттелл поддержал точку зрения Гальтона, согласно которой измерение интеллектуальных функций должно осуществляться через тестирование сенсорной избирательности и времени реакции. Кэттелл предпочитал эти тесты еще и потому, что считал простые функции доступными для точных измерений в отличие от более сложных функций, измерение же сложных функций он считал делом почти безнадежным.

Тесты Кэгтелла были обычными для последнего десятилетия девятнадцатого века. Попытки измерения более сложных психологических функций, тем не менее, можно было обнаружить в тестах на чтение, вербальные ассоциации, память и элементарную арифметику. Такие тесты предлагались ученикам школ, студентам колледжей и взрослым людям. На Колумбийской выставке, проводившейся в Чикаго в 1893 году, Йастроу приглашал всех желающих испытать свои чувства, моторику, простые перцептивные процессы и сравнить полученные значения с нормативными. Несколько попыток оценить эти первоначальные тесты дали обескураживающие результаты. Индивидуальные показатели были нестабильны, они слабо коррелировали или не коррелировали вовсе с независимыми оценками интеллектуального уровня, такими как школьные оценки или академические степени.

Интеллектуальные тесты. В 1904 году французский министр народного образования создал комиссию для изучения проблемы отставания в учебе среди школьников. Специально для этой комиссии Бине и Симоном была разработана первая интеллектуальная шкала для вычисления общего коэффициента индивидуального уровня интеллектуального развития. В 1908 году Бине доработал эту шкалу, при использовании которой тесты группировались по возрастному признаку и подвергались тщательной эмпирической проверке. Например, для трехлетнего возраста отбирались тесты, которые в состоянии был пройти ребенок трех лет, для четырехлетнего возраста — тесты, доступные для ребенка четырех лет, и так далее, до тринадцатилетнего возраста. Полученные результаты у детей, прошедших тестирование по данной шкале, были затем объявлены нормами, присущими соответствующему «интеллектуальному возрасту», то есть возможностями нормальных детей определенного возраста, определенными Бине.

Последующее развитие. После окончания первой мировой войны происходило бурное развитие множества доступных для использования тестов, разработка все новых методов и их применение к самым разным аспектам поведения. Групповые интеллектуальные шкалы создавались для всех возрастов и типов испытуемых, начиная с тех, кто ходит в детский сад, и до студентов старших курсов. Вскоре к ним добавились дополнительные тесты для выявления специальных способностей, например, к музыке или механике. Еще позже появились многофакторные системы исследования. Эти тесты возникли в результате разностороннего изучения человеческих качеств. Важным является то, что вместо единственных, общих для всех результирующих значений, таких как IQ, многофакторные системы позволяют получать данные по целому комплексу основных способностей.

Тестовые понятия. Как и в статистике, в психологических тестах существуют определенные базовые понятия, которые должны быть известны студенту, изучающему дифференциальную психологию. Одним из них является понятие нормы. Никакие результирующие значения психологических тестов не имеют смысла до тех пор, пока они не сравниваются с тестовыми нормами. Эти нормы возникают в процессе стандартизации нового теста, при прохождении через него большого количества испытуемых, представляющих ту популяцию, для которой данный тест был разработан. Затем полученные данные используются как стандарт для оценки показателей индивидов. Нормы могут выражаться по-разному, например: как интеллектуальный возраст, как проценты или как стандартные значения, — но все они позволяют исследователю, сравнивая результаты испытуемого с результатами стандартизированной выборки, определить его «положение». Соответствуют ли его результаты средним по группе? Являются ли они более высокими или более низкими по сравнению со средними значениями, и если да, то насколько?

Другим важным понятием является надежность теста. Она подразумевает, насколько стабильные результаты он способен давать. Если индивид проходит повторное исследование в другой день или проходит то же самое тестирование в другой форме, то насколько может измениться результат? Надежность обычно определяется корреляцией результатов, полученных в двух случаях одним и тем же индивидом. Необходимо отметить, что надежность теста зависит от одного из типов случайных отклонений, описанных нами прежде. На надежность теста, естественно, не могут не влиять случайные отклонения относительных результатов тестирования конкретного индивида. Влияние же подобных отклонений на групповые результаты не имеет отношения к надежности теста.

Одним из самых главных вопросов, который возникает при психологическом тестировании, является вопрос о валидности теста, то есть о том, насколько он действительно измеряет то, что должен измерять. Валидность можно установить, сравнивая результаты данного теста с многочисленными данными, полученными другими способами, — со школьными оценками, индексом трудовой успешности, или лидерскими рейтингами.

Данные по нормам, по надежности и валидности теста должны быть собраны в то время, когда тест проходит испытания, то есть до того как он может быть передан для всеобщего использования. Доступным тестам не хватает желаемой конкретности и полноты получаемых данных. Чтобы систематизировать проблемы и улучшить положение дел, Американская психологическая ассоциация выпустила в 1954 году сборник «Технические рекомендации по разработке психологических тестов и диагностических процедур («Technical Recommendations for Psychological Tests and Diagnostic Techniques»). В нем обсуждались различные типы норм, способы измерения надежности и валидности, а также другие проблемы, связанные с оценкой тестов. Читателю, желающему более подробно изучить современные исследования психологических тестов, необходимо обратиться к данной публикации.

Источник: 
Анна Анастази, Дифференциальная психология
Темы: