Корреляционные исследования в клинической психологии

Цель корреляционных исследований состоит в изучении связи между двумя переменными или более. У каждого испытуемого изучается несколько параметров, чтобы в дальнейшем выявить наличие ассоциации между этими параметрами. Корреляционный дизайн не обязательно предполагает, что в качестве меры ассоциации изучаемых признаков будет выступать коэффициент корреляции, хотя чаще всего так и происходит. Коэффициент корреляции как мера ассоциации имеет недостаток — позволяет изучить лишь один тип ассоциации между переменными — линейную связь. Однако связь между рассматриваемыми переменными может иметь и иной характер, при этом с методологической точки зрения попытка выявить такую связь также будет относиться к корреляционному исследованию. Вот почему некоторые исследователи предлагают подобные дизайны исследований обозначать не как корреляционные , а как реляционные (relational designs) (Aveline M., Shapiro D., 1995).

Пример
Выявлялась ассоциация между расстройствами сна и выраженностью эмоциональной реактивности у детей 5 лет (Kelmanson I. A., 2013a). На первом этапе было проведено кросс-секционное обследование 150 детей, посещавших детские сады, отобранных по принципу многостадийного (2 стадии) формирования выборки. Провели анкетирование детей с помощью стандартизованного опросника с целью выявить отдельные варианты расстройств сна. Одновременно проводилось анкетирование воспитателей детских садов при помощи опросника Ахенбаха, предназначенного для выявления симптомов эмоциональных нарушений и отклонений поведения детей. Исследование выявило:

  • статистически достоверную положительную корреляцию между уровнем эмоциональной реактивности ребенка и общей выраженностью нарушений сна (r = 0,20; P = 0,016);
  • ассоциацию между отдельными симптомами нарушений сна и выраженностью эмоциональной реактивности ребенка (рис. 15).


Очевидно, корреляционное исследование может стать естественным продолжением исследования популяционных срезов, когда задачи исследования не ограничиваются изучением распространенности тех или иных признаков, а предполагают их совокупный анализ. Изучаемые параметры анализируются в один и тот же момент времени. Также корреляционный дизайн может стать естественным продолжением панельного (лонгитюдного) исследования популяционного среза, когда изучение параметров проводится на двух различных временных этапах и более.

Мерой ассоциации между показателем распространенности заболевания (патологического состояния или иного изучаемого феномена) и исследуемой характеристикой в корреляционных исследованиях чаще всего выступает коэффициент корреляции. В случаях линейной зависимости параметров используется коэффициент корреляции Пирсона г. Данный показатель отражает выраженность линейной связи между объясняющей переменной и зависимой переменной — изучаемым заболеванием, т. е. говорит о том, в какой мере изменение объясняющей переменной на 1 единицу приводит к пропорциональному увеличению или уменьшению частоты заболевания (патологического состояния). Корреляция может быть положительной или отрицательной, а значение коэффициента корреляций варьирует в диапазоне от -1 до +1. Когда связь между независимой и зависимой переменными носит нелинейный характер, в качестве меры ассоциации может использоваться коэффициент ранговой корреляции Спирмена р («ро») или Кендалла т («тау»). Подробное описание методики расчета этих показателей приводится в специальных руководствах (Howell D. C., 2013; Peat J. K., Barton B., 2014). Корреляционные исследования могут использовать и иные статистические меры выявления ассоциации, например критерий %2. Допустимы многофакторные методы анализа, например множественная регрессия, факторный анализ .

Экологические, или агрегированные, корреляционные исследования сфокусированы не на изучении отдельных индивидуумов, а на обследовании групп в целом. Их предпосылкой является отсутствие данных о совместном распределении минимум двух, а иногда и всех показателей на уровне индивидуальных субъектов. В ходе экологического исследования параметры измеряются на уровне отдельных групп, организаций или географических территорий.

Показатели, используемые в экологических корреляционных исследованиях:

  • агрегированные показатели (aggregate measures) для какой-то группы индивидуумов (средние значения или пропорции), например распространенность курящих в популяции, средний доход семей и т. п.;
  • показатели, отражающие характеристики окружения (environmental measures), т. е. некоторые характеристики того места, где находятся представители изучаемой группы (например, загрязненность воздуха, число солнечных дней в году и т. п.). Каждый такой показатель может быть изучен у конкретного индивидуума, и поэтому индивидуальная подверженность испытуемого такому фактору может варьировать;
  • показатели, отражающие глобальные характеристики (global measures), являющиеся атрибутами групп, организаций, отдельных территорий, для которых отсутствуют аналоги на индивидуальном уровне (например, плотность населения, рождаемость, смертность, тип системы здравоохранения и т. п.) (Rothman K. J. [et al.], 2008).

Уровни анализа, в экологических корреляционных исследованиях:

  • Индивидуальный уровень анализа (individual-level analysis). Величина каждой переменной присваивается каждому отдельному испытуемому. Например, средний уровень загрязненности воздуха в соответствующем регионе может «присваиваться» каждому участнику исследования, проживающему на данной территории, и рассматриваться в качестве возможного предиктора развития патологии.
  • Полностью экологический уровень анализа (completely ecologic analysis). Все переменные (предполагаемое воздействие, его эффект и дополнительные влияющие факторы) рассматриваются как экологические показатели, единицей анализа выступает не отдельный индивид, а группа (например, страна, регион, школа, медицинское учреждение, демографическая страта или временной промежуток). Таким образом, распределение показателей у каждого отдельного индивида не учитывается. Параметры, характеризующие популяцию в целом, используются для описания распространенности заболевания (патологического состояния, исследуемого феномена).

Пример
Примером может служить изучение заболеваемости в зависимости от года, сезона, дней недели, возраста обследуемых, характеристик уровня медицинской помощи, особенностей пищевого рациона, распространенности отдельных вредных привычек и т. п. Так, было проведено исследование распространенности курения среди подростков в США и ее сопоставление с частотой демонстрации эпизодов курения в 25 наиболее кассовых фильмах, находящихся в кинопрокате (Sargent J. D., Heatherton T. F., 2009). Выявлено, что между частотой демонстрации эпизодов курения в кинофильмах и распространенностью курения среди подростков существуют зависимость, и по мере снижения демонстрации курения в кинофильмах отмечается распространенность этой вредной привычки среди подростков. Подобные наблюдения позволили высказать предположение, что демонстрация табачной продукции в кинофильмах является барометром социального одобрения курения, и необходимо направить усилия на ограничение такого воздействия на подростков (Sargent J. D., Heatherton T. F., 2009) (рис. 16).


Достоинства корреляционных исследований:

  • Исследования достаточно легко осуществимы.
  • Необходимая информация, как правило, уже имеется в наличии и доступна. Однако такого рода исследования имеют и ряд недостатков.

Недостатки корреляционных исследований:

  • Корреляционные исследования не позволяют проанализировать связь между предполагаемым патогенным воздействием и развитием заболевания (патологического состояния) у конкретного индивидуума.
  • Корреляционные исследования часто не позволяют учесть влияние иных факторов, которые также могут быть связаны с риском возникновения заболевания.
  • Выявленная корреляция не означает непосредственной причинно-следственной (каузальной) связи между рассматриваемым заболеванием и изучаемым показателем, выступающим в качестве независимой переменной.
  • Данные, полученные в экологических корреляционных исследованиях, представляют сведения о среднем уровне того или иного патогенного воздействия в популяции, а не о реальном уровне данного воздействия на каждого отдельно взятого обследуемого. Поэтому наличие в целом положительной или отрицательной корреляции (ассоциации), выявляемой по данным корреляционных исследований, еще не позволяет судить о возможном существовании более сложной взаимосвязи между уровнем патогенного воздействия и риском развития заболевания.

 

Пример
Изучалась связь распространенности курения среди мужчин со стоимостью табачной продукции. Проанализировав данные Всемирной организации здравоохранения о том и другом показателе в различных регионах мира, автор исследования выявил наличие статистически достоверной отрицательной корреляции: по мере роста стоимости пачки сигарет снижался процент курящих мужчин (Townsend J., 2015) (рис. 17). Выявленную ассоциацию можно объяснить тем, что рост стоимости табачной продукции снижает ее доступность и наоборот. И таким образом отражается на распространенности в популяции этой вредной привычки. Однако нет оснований с уверенностью утверждать, что низкая стоимость табачной продукции является непосредственной причиной высокой частоты курения в популяции: возможно, низкая стоимость и доступность табачной продукции являются маркером присутствия иных, ассоциированных с ней и неучтенных факторов, которые, в свою очередь, действительно влияют на распространенность курения в популяции. В частности, доступность табачной продукции может в целом отражать более низкий социально-экономический уровень региона, негативно отражающийся на психологическом состоянии населения, что провоцирует аддиктивное поведение. Кроме того, относительная доступность табачной продукции может свидетельствовать о более низком уровне санитарного просвещения, что также способствует росту распространенности курения. Возможны и иные объяснения. Ответить на вопрос, какое из предложенных объяснений наиболее правдоподобно, не представляется возможным, опираясь только на данные корреляционного исследования.


Для попытки ответа на подобные вопросы возможно применение более сложных подходов к анализу данных, в частности каузальное моделирование, или структурное моделирование уравнений

(Kline R. B., 2011). Смысл этого подхода состоит в оценке того, насколько хорошо модель, предполагающая определенные причинноследственные связи, разработанная на основе имеющихся предшествующих результатов исследований или теоретических предпосылок, соответствует фактическим данным. Структурное моделирование является инструментом для осуществления попытки концептуально осмыслить результаты корреляционного анализа.

В ходе проведения экологических корреляционных исследований элементом анализа часто является изучение наличия или отсутствия тренда и его отграничения от флюктуаций (случайных колебаний частоты). Наличие статистически достоверного тренда может быть связано с влиянием ряда факторов, к важнейшим из которых можно отнести:

  • улучшение качества диагностики, что приводит к увеличению числа распознаваемых случаев заболевания даже при отсутствии истинного возрастания заболеваемости;
  • появление более строгих подходов к формированию популяции, для которой характерен риск развития данного заболевания, что приводит к изменению показателей, хотя также не означает истинного изменения частоты заболевания;
  • изменения возрастного состава населения, что может приводить к изменениям показателей даже в тех случаях, когда частота, специфичная для отдельных возрастных категорий, остается прежней;
  • изменения выживаемости пациентов, связанные с улучшением качества лечения или более ранней диагностикой;
  • истинные изменения частоты новых случаев заболевания, что может быть связано с изменениями внешних факторов и образа жизни (Кельмансон И. А., 2002).

Чаще всего оценка статистической достоверности наличия или отсутствия линейного тренда основана на использовании корреляционного и регрессионного анализа: уравнения линейной регрессии, где в качестве независимой переменной выступает год наблюдения, или критерия Манна — Кендалла, в основе которого лежит непараметрический критерий корреляции Кендалла (Hollander M. [et al.], 2014).

Пример
Данные о динамике зарегистрированных случаев суицида в США с 1986 по 2000 г. (Американский фонд по профилактике суицида, www.afsp.org/ understanding-suicide/facts-and-figures) (рис. 18) показывают тенденцию к снижению частоты случаев суицида: со 130 до 104 на 1 млн населения. Расчеты позволяют говорить о наличии статистически достоверного тренда, причем в уравнении линейной регрессии год выступает в качестве независимой переменной, а регистрируемая частота — в качестве зависимой: частота = 3542,16 - 1,72 х (год). Коэффициенту линейной регрессии (-1,72) соответствует значение Р < 0,0001 (высокий уровень статистической достоверности). Сходным образом использование критерия Манна — Кендалла также свидетельствует о наличии статистически достоверного тренда (т = -0,961; Р < 0,002).


Большая часть статистических программ позволяет выполнить необходимые расчеты. Имеются и специализированные бесплатные компьютерные программы, ориентированные на эпидемиологический анализ, позволяющие выполнять указанные расчеты. В частности, можно отметить программы WINPEPI (http://www.brixtonhealth. com) (Abramson J. H., 2011) и Joinpoint (http:// surveillance.cancer.gov/ joinpoint) (Statistical Research and Applications Branch, National Cancer Institute, 2015).

Joinpoint выявляет наличие достоверного тренда и анализирует наличие возможных «точек излома» (join points), отражающих изменение тренда (Kim H. J. [et al.], 2000).

Пример
Анализ статистических данных, отражающих динамику случаев суицида в США за 1986—2000 гг., позволил выявить наличие одной «точки излома», учет которой позволяет оптимальным образом описать динамику показателей (рис. 19). Данная модель позволяет выявить наличие двух сегментов:
—    первый (1986-1995 гг.) описывается уравнением регрессии:
Число случаев суицида на 1 млн = 2564,33 — 1,23 х (год),
где статистическая достоверность коэффициента регрессии Р = 0,000046;
—    второй сегмент (1995—2000 гг.) характеризуется еще более крутым снижением частоты случаев суицида:
Число случаев суицида на 1 млн = 5793,97 — 2,85 х (год), где статистическая достоверность коэффициента регрессии Р = 0,000073.


Пример
Анализируется динамика рождаемости в России с 1990 по 2008 г. (данные Федеральной службы государственной статистики: http://www.gks.ru/scripts/ db_inet/dbinet.cgi?pl=2401002) (рис. 20). В целом можно отметить снижение рождаемости, однако детальный анализ позволяет выявить две точки излома, которые оптимальным образом характеризуют динамику показателей:
— первый сегмент (1990—1993 гг.) показывает резкое снижение рождаемости с наличием статистически достоверного тренда, показатели рождаемости описываются уравнением линейной регрессии:
Число родившихся живыми = 389350184,27 - 194654,86 х (год);
Р = 0,000059;

—    второй сегмент (1993—1999 гг.) отмечен снижением рождаемости, но не столь резким, как на первом этапе, и уравнение регрессии выглядит следующим образом:
Число родившихся живыми = 59072541,40 - 28936,02 х (год);
Р = 0,061.
Как видно из значения Р, тренд на этом сегменте не достигает уровня статистической достоверности.

—    третий сегмент (1999—2008 гг.) позволяет констатировать статистически достоверный тренд в сторону роста рождаемости:
Число родившихся живыми = -94064460,12 + 47670,78 х (год);
Р = 0,000004.


Нередко корреляционные исследования используются для выявления сезонности динамики тех или иных показателей, что также может иметь большое значение для понимания изучаемых процессов. Большинство статистических программ позволяет выполнить подобные расчеты, в частности упомянутая выше программа WINPEPI.

Для выявления статистической достоверности различий показателей Т, наблюдаемых в отдельные месяцы, может быть использован критерий х2 (хи-квадрат), сопоставляющий фактическое распределение с теоретически ожидаемым. Рассчитываемый показатель будет выглядеть следующим образом:


где Oi — фактическое значение наблюдений в i-й месяц; E. — ожидаемое значение в i-й месяц; k — число месяцев (k = 12). Теоретически ожидаемое значение E. рассчитывается исходя из нулевой гипотезы, т. е. из предположения о равномерном распределении показателей в течение года (ежемесячное значение составляет: 100 %/12 = 8,3 %, если не принимать во внимание различную продолжительность отдельных месяцев).

Сходные оценки дает использование критерия Фридмана (Freedman’s test), близкого по смыслу к критерию Колмогорова — Смирнова.

Достоверность наличия периодических колебаний показателей (с периодом 4, 5 и 6 мес.) может быть оценена при помощи критериев Эдвардса и Хьюитта (Edwards’s test, Hewitt test). Критерий Хьюитта используется, когда анализируется ранговое распределение помесячных показателей. Месяцу с максимальным числом наблюдений присваивается ранг, равный 12, месяцу с наименьшим показателем — ранг, равный 1. Для каждого анализируемого периода времени (4, 5 и 6 мес.) рассчитываются все возможные суммы рангов месяцев, следующих друг за другом. Так, для анализируемой шестимесячной периодичности анализируется сумма рангов месяцев с января по июнь, с февраля по июль, с марта по август и т. д. Группа из 6 мес. с максимальной полученной суммой рангов рассматривается как пик, а статистическая достоверность оценивается на основании величины этой суммы рангов. Подробно методика расчета этих критериев изложена в специальных руководствах (Helsel D. R., Hirsch R. M., 1992; Rau R., 2007).

Пример
Анализ данных о помесячном распределении зарегистрированных случаев суицида в Чили с 1979 по 1994 г. (Retamal C. P., Humphreys D., 1998) (рис. 21) свидетельствует об отсутствии статистически достоверного отклонения помесячных показателей от теоретически ожидаемого равномерного распределения (Р > 0,1 по критерию Фридмана). В то же время можно говорить о наличии четырехмесячного пика с октября по январь (Р = 0,024 по критерию Хьюитта), пятимесячного пика с сентября по январь (Р = 0,015) и шестимесячного пика с сентября по февраль (Р = 0,013).


Ключевые слова: Исследования, Клиника
Источник: Методология исследования в клинической психологии : учеб. пособие. Кельмансон И. А. — Санкт-Петербург : СпецЛит, 2017. — 328 с.
Материалы по теме
Интервьюирование в клинической психологии
Методология исследования в клинической психологии : учеб. пособие. Кельмансон И. А. — Санкт-...
Наблюдение в клинической психологии
Методология исследования в клинической психологии : учеб. пособие. Кельмансон И. А. — Санкт-...
Надежность измерения исследования в клинической психологии
Методология исследования в клинической психологии : учеб. пособие. Кельмансон И. А. — Санкт-...
Валидность измерения исследования в клинической психологии
Методология исследования в клинической психологии : учеб. пособие. Кельмансон И. А. — Санкт-...
Ассоциации и причинно-следственные связи исследования в клинической психологии
Методология исследования в клинической психологии : учеб. пособие. Кельмансон И. А. — Санкт-...
Описательные исследования в клинической психологии
Методология исследования в клинической психологии : учеб. пособие. Кельмансон И. А. — Санкт-...
Систематическая ошибка исследования в клинической психологии
Методология исследования в клинической психологии : учеб. пособие. Кельмансон И. А. — Санкт-...
Исследование популяционных срезов в клинической психологии
Методология исследования в клинической психологии : учеб. пособие. Кельмансон И. А. — Санкт-...
Оставить комментарий