Математико-статистическая обработка данных психологического исследования (эксперимента) и форма представления результатов

Методы и способы математико-статистической обработки у студентов гуманитарных факультетов, в том числе и психологических, вызывают значительные затруднения и, как следствие, боязнь и предубеждение в возможности ими овладения. Однако, как показывает практика, это ложные заблуждения. Следует понять, что в современной психологии, в практической деятельности психолога любого уровня, без использования аппарата математической статистики все выводы могут восприниматься как не более чем умозрительные, с известной долей субъективности. Вместе с тем по мере накопления практического опыта, освоения базы данных эмпирических исследований неизбежно возникает задача их обобщения, выявления тенденций, динамики, характерных черт, особенностей, которые невозможно обоснованно интерпретировать, не используя математические методы количественного анализа.

Анализ первичных статистик
Для определения способов математико-статистической обработки прежде всего необходимо оценить характер распределения данных по всем используемым параметрам (признакам). Для параметров (признаков), имеющих нормальное распределение или близкое к нормальному, можно использовать методы параметрической статистики, которые во многих случаях являются более мощными, чем методы непараметрической статистики. Достоинством последних является то, что они позволяют проверять статистические гипотезы независимо от формы распределения.

Одним из важнейших в математической статистике является понятие нормального распределения.

Нормальное распределение - модель варьирования некоторой случайной величины, значения которой определяются множеством одновременно действующих независимых факторов. Количество таких факторов велико, а эффект влияния каждого из них в отдельности очень мал. Такой характер взаимовлияний весьма характерен для психических явлений, поэтому исследователь в области психологии чаще всего выявляет нормальное распределение. Однако так бывает не всегда, поэтому в каждом случае форма распределения должна быть проверена.

Характер распределения выявляется главным образом для того, чтобы определиться в методах математико-статистической обработки данных.

Если характер распределения показателей психологического признака является нормальным или близким к нормальной форме распределения признака, описываемой кривой Гаусса, то можно использовать параметрические методы математической статистики как наиболее простые, надежные и достоверные: сравнительный анализ, расчет достоверности отличий признака между выборками (по критерию Стьюдента, F-критерию Фишера, коэффициенту корреляции Пирсона и др).

Если кривая распределения показателей психологического признака далека от нормальной, то используют методы непараметрической статистики: расчет достоверности отличий по критерию Q Розенбаума (для малых выборок), по критерию U Манна-Уитни, коэффициенту ранговой корреляции Спирмена, по факторному, многофакторному, кластерному и другим методам анализа.

Помимо этого, по характеру распределения можно составить общее представление об общей характеристике выборки испытуемых по данному признаку и тому, насколько данная методика соответствует (т. е. «работает», валидна) данной выборке.

Важнейшими первичными статистиками, характеризующими распределение исследуемого признака, являются:
- средняя арифметическая - это величина, сумма отрицательных и положительных отклонений от которой равна нулю. В статистике ее обозначают буквой «М» или «X». Чтобы ее подсчитать, надо суммировать все значения ряда и разделить сумму на количество суммированных значений;
- среднее квадратичное отклонение (обозначаемое греческой буквой а (сигма) и называемое также основным, или стандартным отклонением) - мера разнообразия входящих в группу объектов; она показывает, насколько в среднем отклоняется каждая варианта (конкретное значение оцениваемого параметра) от средней арифметической. Чем сильнее разбросаны варианты относительно средней, тем большим оказывается и среднее квадратичное отклонение. Разброс значений характеризует и размах, т.е. разность между наибольшим и наименьшим значением в ряду. Однако сигма полнее характеризует разброс значений относительно средней арифметической;
- коэффициент вариации - частное, полученное отделения сигмы на среднюю арифметическую, умноженное на 100%:
CV=q/Mx 100%,
где q - стандартное отклонение; CV - коэффициент вариации; М - среднее арифметическое.

Следует иметь в виду, что сигма (q) - величина именованная и зависит не только от степени варьирования, но и от единиц измерения. Поэтому по сигме можно сравнивать изменчивость лишь одних и тех же показателей, а сопоставлять сигмы разных признаков по абсолютной величине нельзя. Для того чтобы сравнить по уровню изменчивости признаки любой размерности (выраженные в различных единицах измерения) и избежать влияния масштаба измерений средней арифметической на величину сигмы, применяют коэффициент вариации, который представляет собой по существу приведение к одинаковому масштабу величины q.

Для нормального распределения используются точные количественные зависимости частот и значений, позволяющие прогнозировать появление новых вариант.

Таким образом, ориентируясь на характеристики нормального распределения, можно оценить степень близости к нему рассматриваемого распределения психологического признака.

Следующими по важности характеристиками распределения показателей признака являются такие первичные статистики, как коэффециент асимметрии и эксцесс.

Коэффициент асимметрии - показатель отклонения распределения в левую или правую сторону по оси абсцисс. Если правая ветвь кривой длиннее левой, говорят о правосторонней (положительной) fccbvtnhbb, если левая ветвь длиннее правой, говорят о левосторонней (отрицательной) асимметрии.

Эти параметры позволяют составить первое приближенное представление о характере распределения:
- у нормального распределения редко можно обнаружить коэффициент асимметрии, близкий к единице и более единицы (-1 и +1);
- эксцесс у признаков с нормальным распределением обычно имеет величину в диапазоне 2-4. Вычислить показатели ассиметрии и эксцесса эмпирического распределения можно, используя функцию «Описательная статистика» в программе Excel.

Следующий момент, на который следует обратить особое внимание, относится к интерпретации психологического значения, выявляемого данным характером распределения. Что же выявляет кривая Гаусса в характеристике психологических явлений? Какой психологический смысл выявляет кривая распределения данных, оценок тестовых баллов исследуемого психологического признака?

Следует иметь в виду, что кривая распределения тестовых баллов (оценок, результатов выполнения заданий и т. д.), с одной стороны, отражает свойства пунктов, из которых составлен тест (задание) а с другой - характеризует состав выборки испытуемых, т. е. насколько успешно они справляются с заданием, насколько данный тест (задание) дифференцирует выборку по соответствующему качеству, признаку.

Если кривая имеет правостороннюю асимметрию, то это значит что в тесте преобладают трудные задания (для данной выборки); если кривая имеет левостороннюю асимметрию,
то значит, большинство пунктов в тесте легкие (слабые).

Таким образом, имеются два варианта объяснения:
1) тест (задание) плохо дифференцирует испытуемых с низким уровнем развития способностей (свойств, качеств, характеристик): большинство испытуемых получают примерно одинаковый - низкий балл;
2) тест хуже дифференцирует испытуемых с высоким развитием способностей (свойств, качеств, характеристик): большинство испытуемых получают достаточно высокий балл.

Анализ эксцесса кривой распределения позволяет сделать следующие выводы в зависимости от формы распределения показателей (данных, вариант) психологического признака:
В случае, когда возникает значительный положительный эксцесс (эксцессивная кривая) и вся масса баллов скучивается вблизи среднего значения, возможны следующие объяснения:
- ключ составлен неверно: объединены при подсчете отрицательно связанные признаки, которые взаимоуничтожают баллы. Но в практике психолога, который работает с валидными и надежными методиками, такие случаи исключаются (кроме собственной невнимательности и безответственности);
- испытуемые применяют, разгадав направленность теста (опросника), специальную тактику «медианного балла» - искусственно балансируя ответы «за» и «против» одного из полюсов измеряемого психологического признака;
- если подбираются пункты, тесно положительно коррелирующие между собой (т. е. испытания не являются статистически независимыми), то в распределении баллов возникает отрицательный эксцесс, принимающий форму плато;
- максимальных величин отрицательный эксцесс достигает по мере возрастания вогнутости вершины распределения - до образования двух вершин, двух мод (с «провалом» между ними). Такая бимодальная конфигурация распределения баллов указывает на то. что выборка испытуемых разделилась на две категории, подгруппы (с плавным переходом между ними): одни справились с большинством заданий (согласились с большинством вопросов), другие - не справились (не согласились). Такое распределение свидетельствует, что в основе заданий (пунктов) имеется какой-то один общий им всем признак, соответствующий определенному свойству испытуемых: если у испытуемых есть это свойство (способность, знание, умение), то они справляются с большинством пунктов заданий, если нет этого свойства, то не справляются.

Начать с анализа первичных статистик надо еще и по той причине, что они весьма чувствительны к наличию выпадающих вариант. Большие величины эксцесса и асимметрии часто являются индикаторами ошибок при подсчетах вручную или ошибок при вве-агпни данных через клавиатуру при компьютерной обработке. Грубые промахи при введении данных для обработки можно обнаружить, если сравнить величины сигм у аналогичных параметров. Выделяющаяся величиной сигма может указывать на ошибки.

Существует правило, согласно которому все расчеты вручную должны выполняться дважды (особо ответственные - трижды), желательно, -разными способами с вариацией последовательности обращения к числовому массиву.

Иной причиной больших показателей эксцесса и асимметрии может оказаться недостаточная надежность и валидность методик, используемых для данной популяции.

В научных исследованиях по части (отдельной выборке) никогда не удается полностью охарактеризовать целое (генеральную совокупность, популяцию): всегда остается вероятность того, что оценка генеральной совокупности на основе выборочных данных недостаточно точна, имеет некоторые, большие или меньшие, ошибки. Такие ошибки, при обобщении, экстраполяции результатов, полученных при изучении отдельной выборки, на всю генеральную совокупность, называются ошибками репрезентативности.

Статистические ошибки репрезентативности показывают, в каких пределах могут отклоняться от параметров генеральной совокупности (от математического ожидания или истинных значений) частные определения, полученные на основе конкретных выборок. Очевидно, величина ошибки тем больше, чем больше варьирование признака и чем меньше выборка. Это и отражено в формулах для вычисления статистических ошибок, характеризующих варьирование выборочных показателей относительно их генеральных параметров.

Поэтому в число первичных статистик обязательно входит статистическая ошибка средней арифметической. Формула для ее вычисления такова:
mM = +(-) q/n,
где: mn - ошибка средней арифметической; q - сигма, стандарта отклонение; n - число значений признака.

Перечисленные основные первичные статистики позволяют оценить характер распределения данных в экспериментальном массиве и использовать основные методы параметрической и непараметрической статистики для обоснования результатов эмпирического психологического исследования.

Комментарии
Аватар пользователя Даша
Даша (Анонимно)

Скажите, пожалуйста, возможно кто-либо из читающих проводил методику Векслера на интеллект? Как посчитать коэффициент ущерба (DQ):

DQ = ТНР-ТПР/ТНР*100%

где ТНР – шкальные показатели по субтестам с практически неизменными результатами;

ТПР – показатели результатов с переменными результатами.
Какие цифры нужно подставлять в ТНР И ТПР?

Аватар пользователя anna29.10.76@mail.ru
anna29.10.76@mail.ru (Анонимно)

mM = +(-) q/n,
где: mn - ошибка средней арифметической; q - сигма, стандарта отклонение; n - число значений признака.
Ошибка в написании формулы? Надо mn = +(-) q/n?