Исследование популяционных срезов в клинической психологии

21.03.2020

Исследование популяционного среза (cross-sectional design, survey) предполагает участие в исследовании в качестве субъектов всех членов популяции на время проведения исследования или представительную выборку этих членов популяции без учета их статуса по отношению к изучаемому воздействию и наличию или отсутствию изучаемого заболевания.

Исследование популяционного среза, направленное на изучение распространенности того или иного состояния (т. е. показателя преваленса), именуется превалентным исследованием. Обычно наличие или отсутствие интересующего исследователя патогенного воздействия оценивается одновременно с наличием или отсутствием заболевания (патологического состояния), и различные субпопуляции, сформированные в зависимости от наличия воздействия, сопоставляются между собой по показателю распространенности заболевания в них. В подобных исследованиях не ставятся задачи выявления этиологии.

Популяционные срезы изучаются в четко обозначенной целевой популяции (targetpopulation),соответствующей цели и задачам исследования. Прежде всего, такое исследование направлено на изучение распространенности того или иного заболевания (состояния, признака, феномена) в целевой популяции. При этом не исключается наличие или отсутствие у обследованных тех или иных факторов, способствующих, по мнению исследователя, повышению или снижению риска возникновения изучаемого заболевания.

Поскольку в исследованиях популяционных срезов наличие потенциального патогенного воздействия и наличие заболевания оцениваются одновременно, не возможно с уверенностью сказать, действительно ли анализируемое воздействие, рассматриваемое в качестве причинного фактора, предшествовало развитию заболевания и способствовало его развитию, или, наоборот, повышенная частота этого фактора явилась следствием уже развившегося заболевания.

Необходимо четко определить временной промежуток, в течение которого проводится исследование популяционных срезов (например, календарный год). Возможна ориентация на какое-то определенное событие, связанное с естественным течением заболевания или естественным развитием процесса. При этом у отдельных обследованных лиц это событие может быть приурочено к разным моментам реального времени (например, к выписке ребенка из родильного дома, к медицинскому осмотру ребенка при поступлении в школу и т. п.). Результаты исследования во многом будут зависеть от этой выбранной временной точки отсчета. Сказанное можно проиллюстрировать следующим гипотетическим примером (рис. 5). Предположим, что проводится исследование с целью изучить ассоциацию между назначением детям витаминных препаратов и частотой аллергических реакций у них. Исходно 100 детей получали витаминные препараты, другие 100 детей — нет.

естественного хода событий появление аллергических реакций у детей приведет к отказу родителей от назначения детям витаминных препаратов. Предположим, что 30 из 40 детей, имевших симптомы аллергии на фоне приема витаминных препаратов, откажутся от них в дальнейшем. Тогда при обследовании популяционного среза в момент времени Б аллергические реакции будут определяться у 10 из 70 детей (14,3 %), получающих в это время витаминные препараты, и у 35 из 130 детей (26,9 %), которым витаминов не дают. При неверной интерпретации этих данных можно сделать вывод о меньшей частоте симптомов аллергии среди детей, получающих витаминные препараты. На самом же деле снижение частоты приема витаминов будет следствием более частых аллергических реакций, а не причиной более редких аллергических реакций.

В целом в исследованиях популяционных срезов проблема причинно-следственных связей всегда является предметом дискуссий.

Исследования популяционных срезов всегда опираются на показатели распространенности изучаемого состояния (превалентные показатели), а не на частоту вновь регистрируемых случаев (инцидентные показатели). Значит, данные таких исследований будут отражать не только этиологические характеристики, определяющие возникновение новых случаев заболеваний, но и тенденцию к их хронизации, показатели выздоровления и выживаемости пациентов. Так, сопоставление распространенности в популяции (преваленса) детей-инва-лидов в различных регионах мира будет отражать не только частоту возникновения инвалидизирующих заболеваний среди детского населения, но и выживаемость этих хронически больных детей: не представляется возможным судить о том, какая из двух тенденций будет ведущей, только по данным изучения популяционных срезов. Для изучения популяционных срезов можно использовать элементы аналитического исследования, т. е. предполагать выявление ассоциации между потенциальным патогенным воздействием и связанным с ним эффектом. Однако такой анализ может быть адекватным лишь в тех случаях, когда фактор, рассматриваемый в качестве потенциального патогенного воздействия, не претерпевает изменений в популяции с течением времени. В таком случае можно с уверенностью утверждать, что значения этого фактора, определяемые на момент обследования популяции, имели место и в начале развития заболевания. К числу таких факторов можно отнести лишь те, которые существуют в неизменном виде с момента рождения: цвет глаз, группу крови, антигены главного комплекса гистосовместимости и т. п. Чаще в ходе изучения популяционных срезов приходится иметь дело с факторами, потенциально меняющимися по мере развития заболевания, а иногда и непосредственно в связи с его естественным течением.

Большое значение имеет подход к определению обследуемого контингента. Целевая популяция (target population)— это та популяция, информацию о которой исследователю хотелось бы получить. Для ее определения исследователю необходимо ответить на ряд вопросов (Franklin S., Walker C., 2010):

Что представляют собой те единицы наблюдения, из которых состоит популяция, и какие характеристики определяют эти единицы наблюдения (кто или что?)?
Каково географическое расположение единиц наблюдения, формирующих популяцию (где?)?
Каков референтный (временной) период наблюдения (когда?)?

Целевая популяция — это своего рода идеальная популяция,

желательная для изучения, хотя этот идеал не всегда достижим. Определение целевой популяции может основываться на определенных концептуальных принципах даже при отсутствии списочного состава потенциальных участников исследования, например: все школьники младших классов. При этом нужно четко определить, что такое «младшие классы»? Будут ли относиться к числу потенциальных участников исследования дети, обучающиеся на дому, или речь идет только о тех, кто посещает школу?

Обследуемая популяция (survey population) — это популяция, которая фактически охвачена исследованием, и только на нее можно распространять результаты исследования. В идеале обследуемая популяция и целевая популяция должны быть очень похожи, хотя по разным причинам могут отличаться. Например, обследование целевой популяции может предполагать участие объектов, расположенных в отдаленных регионах, и их приходится исключить из последующего обследования.

После определения вопроса о целевой популяции нужно определить рамки популяции (survey frame) или рамки выборки (sampling frame), если проводится обследование выборки, которые позволяют идентифицировать единицы обследования, входящие в целевую популяцию, и обеспечить контакт с ними. Существуют два вида рамок: списочные и географические, если они не подошли, используются множественные рамки.

Списочные рамки представляют собой концептуальный или фактический список всех единиц, входящих в обследуемую популяцию. Например, концептуальным является список всех возможных пациентов, госпитализированных в определенный стационар, за определенный период времени, фактическим — реальный перечень потенциальных единиц обследования, почерпнутый из различных источников, например из медицинских регистров, адресных регистров и т. п.

Географические рамки — это список, в котором единицами наблюдения выступают географические территории.

Рамочная популяция (frame population) — обследуемая популяция, ограниченная рамками (списочными или географическими).

Популяция респондентов (respondent population) — те участники рамочной популяции , которые потенциально согласились бы принять участие в исследовании, если бы им было предложено. Члены рамочной популяции, которые могут быть отобраны для участия в исследовании, могут принять в нем участие, но могут и отказаться от участия в нем.

Соотношения указанных концептов представлено на рис. 6.

Важнейшие подходы к исследованию популяционных срезов представлены на рис. 7. Перепись — самый эффективный способ проведения исследования, так как он предполагает обследование всей целевой популяции. Такой подход возможен лишь в ограниченных ситуациях (когда целевая популяция немногочисленна и ее члены доступны для обследования).

Выборка из целевой популяции чаще используется для исследования. Можно выделить два принципиальных подхода к формированию такой выборки.

Нерандомизированный (невероятностный) подход основан на отборе испытуемых, исходя из субъективных подходов исследователя. Это быстрый, относительно легкий и экономичный способ проведения исследования, который не предполагает установления рамок исследования. Основная проблема состоит в том, что нет уверенности, в какой степени можно обобщать результаты, полученные в ходе такого исследования, применительно к целевой популяции в целом. Следовательно, невероятностный подход к отбору обследуемых индивидуумов может приводить к большим систематическим ошибкам. Исследователь может с большой вероятностью отбирать наиболее доступных для него членов популяции, дружески расположенных к нему, и существенная часть членов целевой популяции просто не имеют шансов попасть в исследование, и эта часть популяции будет систематически отличаться от тех, кто был отобран для участия в исследовании. Такая ситуация может не только внести систематическое искажение в результаты исследования, но и сложно уменьшить кажущуюся вариацию популяции, поскольку отбираются лишь наиболее характерные индивидуумы и искусственно устраняются «экстремальные» наблюдения.

Вследствие наличия ошибки отбора испытуемых и (обычно) отсутствия обозначенных популяционных рамок, вероятность попадания отдельных индивидуумов в число обследованных не может быть рассчитана. Как аксиома принимается допущение, что обследуемая выборка является репрезентативной применительно к целевой популяции. При этом также предполагается, что характеристики обследованных лиц удовлетворяют какой-то определенной модели или равномерно или случайно распределены среди всех членов целевой популяции. Указанные допущения довольно рискованны, так как нет эффективных средств проверить их обоснованность.

Нерандомизированные подходы можно использовать:

для выдвижения определенной идеи;
в качестве предварительного шага к разработке последующего исследования, основанного на рандомизированном подходе;
в качестве последующего шага, который должен помочь лучше понять результаты исследования, ранее проводившегося на основе рандомизации (Franklin S., Walker C., 2010).

Так, нерандомизированное кросс-секционное исследование может использоваться для получения ценной информации относительно предпочтений, мотивации, особенностей поведения людей. Иногда такие нерандомизированные подходы могут быть единственным возможным вариантом, когда предполагается обследование именно волонтеров. Нерандомизированные исследования часто используются для формирования фокус-групп и подробного интервьюирования, например в ходе переписных исследований для выяснения того, насколько понятны сформулированные вопросы; если вопросы понятны членам отдельных специально отобранных фокус-групп, то можно рассчитывать, что они будут понятны всем членам популяции.

Достоинства нерандомизированного подхода

Исследование можно провести быстро, а его выполнение технически удобно.
Исследование не требует больших затрат. Интервьюер может в течение нескольких часов осуществить опрос обследуемых; кроме того, при нерандомизированном подходе обследуемые лица обычно широко не разбросаны географически, что уменьшает и транспортные расходы.
Не требуется формирование рамок исследования.
Такой подход может быть полезным при эксплоративном исследовании и дальнейшей разработке полномасштабного кросс-сек-ционного исследования (Franklin S., Walker C., 2010).

Недостатки нерандомизированных исследований:

Требуются очень сильные допущения относительно репрезентативности обследуемой выборки.
Невозможно определить вероятность, с которой тот или иной индивидуум оказался в числе обследуемых лиц (Franklin S., Walker C., 2010).

Рассмотрим отдельные варианты нерандомизированных подходов.

Метод формирования выборки «наудачу» (стихийно) (haphazard sampling). Единицы наблюдений отбираются без какой-то заранее заданной цели и плана, например интервьюирование «первого встречного» человека на улице. Предполагается, что вся популяция однородна (гомогенна), а следовательно, все члены популяции похожи друг на друга, поэтому случайным образом могут быть отобраны в качестве единиц исследования.

Метод формирования выборки из числа волонтеров (volunteer sampling). Респондентами становятся волонтеры. Обычно их необходимо предварительно проверить на предмет соответствия цели исследования (например, наличие определенного заболевания, которое подвергается изучению). Такой метод сопряжен с высоким риском ошибки отбора, однако в ряде случаев он является необходимым. Например, по этическим соображениям пациентам с определенными заболеваниями может быть оказана медицинская и психологическая помощь. Обследование выборки из числа волонтеров может выступать в качестве предварительного этапа для формирования фокус-группы, которую в дальнейшем изучат более подробно. Следует избегать попыток обобщения полученных результатов в отношении популяции в целом.

Формирование выборки по суждению исследователя (judgement sampling). Выборка формируется на основе ранее сформированных представлений исследователя о составе популяции и поведении обследуемых. Эксперт решает, что собой представляет репрезентативная выборка и кто из членов популяции может стать участником исследования и войти в выборку. Формирование выборки по суждению исследователя сопряжено с высокой вероятностью ошибки исследователя, а результаты такого исследования могут оказаться еще более искаженными, чем при формировании выборки «наудачу». В то же время такое исследование может быть полезным при постановке эксплоративных вопросов, например при формировании фокус-группы для испытания опросника.

Формирование выборки методом квотирования (quota sampling). Набор испытуемых проводится до тех пор, пока не будет достигнуто запланированное число единиц наблюдений (квот) различных субпопуляций. Формирование выборки методом квотирования позволяет набрать нужное число наблюдений различных субпопуляций. Квоты могут быть основаны на пропорциональном принципе. Например, если в целевой популяции имеется 100 мужчин и 100 женщин, а в выборку предполагается включить 20 человек, то квотирование) предполагает обследование 10 мужчин и 10 женщин. Этот метод наиболее распространен и более предпочтителен по сравнению с другими нерандомизированными методами формирования выборки, так как предполагает активное включение членов различных субпопуляций в исследование. Метод квотирования напоминает метод стратифицированного формирования выборки, поскольку сходные по каким-то признакам единицы наблюдения сводятся в одну группу. Если при вероятностном (рандомизированном) подходе такие единицы наблюдений отбираются по принципу рандомизации, то при квотировании решение вопроса о том, кого включить в исследование, остается за самим исследователем. Испытуемые, которые отказываются от участия в исследовании, часто просто замещаются другими участниками, и в результате общее необходимое число участников будет обеспечено. По сути, это приводит к игнорированию ошибки, связанной с отказом от участия в исследовании (non-response bias). Формирование выборки методом квотирования обычно требует меньше ресурсов, чем стратифицированное исследование, и его легче осуществить. Однако такой дизайн сопряжен с высоким риском ошибки отбора (selection bias) и, как в случае иных нерандомизированных подходов, требует значительного допущения: отобранные участники исследования сходны с теми, кто не вошел в исследование. Такие допущения редко соответствуют истине.

Вероятностный (рандомизированный) подход направлен на устранение систематической ошибки, которая описана выше. Формирование выборки является методологически более строгим. Преимущество состоит в том, что результаты, полученные при обследовании выборки, позволяют делать суждения в отношении популяции в целом. Вероятностный принцип формирования выборки позволяет избежать ошибки отбора за счет случайного (рандомизированного) отбора единиц обследования из популяции (при помощи компьютера или таблицы случайных чисел). В данном термине слово «случайный» не означает «произвольный». «Рандомизированное» означает, что отбор испытуемых свободен от систематической ошибки, — он основан на случае. Отбор испытуемых никогда не отдается «на откуп» интервьюеру, который субъективно решает, кого включить в выборку. При вероятностном подходе к формированию выборки, во-первых, все единицы обследования случайно (рандоми-зированно) отобраны для участия в исследовании; во-вторых, все члены популяции имеют ненулевую вероятность быть включенными в выборку, и эти вероятности могут быть рассчитаны. Не обязательно, чтобы все единицы обследования имели равную вероятность быть включенными в выборку, и в сложных исследованиях такая вероятность варьирует у отдельных единиц.

Существуют различные варианты вероятностного дизайна.

Метод простой случайной выборки (simple random sampling) можно назвать базовым подходом. Он оптимален, если цель исследования состоит в оценке общепопуляционных характеристик, а стратификация невозможна или неприемлема.

Кластерное формирование выборки часто используется, если позволяют ресурсы.

Стратифицированное формирование выборки обычно применяется, если желательно изучение показателей в субпопуляциях (например, в отдельных регионах, возрастных группах, социальных стратах и т. п.).

Остальные варианты формирования выборки являются еще более сложными и обычно используют дополнительную информацию для обозначения рамок исследования.

Основное достоинство вероятностного подхода к формированию выборки: поскольку каждая единица обследования отбирается рандомизированно и вероятность включения в исследование каждой такой единицы может быть просчитана, то можно вычислить и надежные измеряемые показатели, а также величину ошибки этих показателей. Таким образом, можно судить о популяции в целом. Фактически можно делать выводы, касающиеся популяции в целом, исходя из сведений, полученных на относительно небольшой выборке .

Основным недостатком является относительная сложность дизайна, его реализация требует большего времени, а само исследование обходится дороже. Исследования с применением вероятностного подхода обычно предполагают и более широкий географический охват, существенно большую численность целевой популяции, что также создает трудности в реализации исследования.

Простая случайная выборка (simple random sampling, SRS) представляет собой метод одношагового отбора, обеспечивающий ситуацию, при которой имеется равная вероятность формирования любой выборки численностью n. Как следствие, каждая единица наблюдения, включенная в выборку, имеет равную вероятность п попадания в нее:
п = n/N.

Единицы наблюдения отбираются с замещением или без замещения. Отбор с замещением предполагает, что единица наблюдения может отбираться в выборку более одного раза. Отбор без замещения означает, что единица наблюдения отбирается только один раз. Простая случайная выборка с замещением (simple random sampling with replacement, SRSWR) и простая случайная выборка без замещения (simple random sampling without replacement, SRSWOR) практически идентичны, если численность выборки — очень малая доля общей популяции. В этом случае вероятность повторного выпадения одной и той же единицы наблюдения весьма мала. В целом формирование выборки без замещения дает более точные результаты и более удобно с практической точки зрения, поэтому именно такой вариант и будет рассматриваться в ходе дальнейшего изложения.

Представим, что популяция состоит из 5 единиц (5 пациентов), из которых нужно выбрать 3 на основании процедуры формирования простой случайной выборки без замещения. Всем пациентам присваиваются индивидуальные номера от 1 до 5, и популяция рассматривается как множество: {1, 2, 3, 4, 5}. Можно сформировать 10 различных вариантов подмножеств (выборок) численностью 3 человека: {1, 2, 3}, {1, 2, 4}, {1, 2, 5}, {1, 3, 4}, {1, 3, 5}, {1, 4, 5}, {2, 3, 4}, {2, 3, 5}, {2, 4, 5}, {3, 4, 5}. Каждая выборка имеет равную вероятность быть сформированной, и у каждого индивида существует вероятность попасть в 6 из 10 возможных выборок и вероятность отбора п = n/N = 3/5.

Для формирования простой случайной выборки следует обозначить полные рамки исследования. Все единицы наблюдений, входящие в списочные рамки, получают номера от 1 до N. Затем из этого списочного состава на основе случайного отбора отбирают заранее определенное число наблюдений n, которые и должны сформировать выборку. Для этого используют либо таблицу случайных чисел, либо генерацию случайных чисел на компьютере (большая часть прикладных статистических программ позволяет сгенерировать такую последовательность случайных чисел). Первые n наблюдений , имеющие соответствующие номера, и составят выборку.

Пример
Планируется обследование студентов института. Имеется возможность составить список этих студентов (списочные рамки) на основе имеющихся источников. Список включает в себя N = 1530 студентов, а для проведения исследования требуется n = 90 студентов (выборка), которых необходимо отобрать методом простого случайного отбора. Такой отбор можно осуществить при помощи таблицы случайных чисел. На первом этапе нужно выбрать четырехзначное число (поскольку у нас 1530 студентов — тоже четырехзначное число). Его можно выбрать в любом месте таблицы (первые четыре разряда числа, приведенного в ней), а затем следует перемещаться по таблице в любом направлении. При этом нужно фиксировать те первые 90 четырехзначных числа, которые встретились по ходу перемещения и значения которых не превышали 1530. Предположим, что мы начали с ряда 01 и колонки 85—89 (табл. 2). Двигаясь вниз по колонке, мы выделим числа: 189, 256, 984, 744, 1441, 617 и т. д. Такой отбор чисел нужно продолжать до тех пор, пока не будут отобраны 90 различных чисел. В результате мы получим номера тех 90 студентов, которые должны будут войти в исследование и сформируют выборку. Поскольку речь идет о процедуре без замещения, то в тех случаях, когда одно и то же число при продвижении по таблице встречается повторно, его пропускают. По сходному алгоритму выполняется компьютерное генерирование случайных чисел.

Преимущества простой случайной выборки:

метод самый простой из всех вероятностных методов;
метод достаточно хорошо разработан теоретически, существуют принятые подходы к расчету численности выборки, оценки изучаемых показателей и их вариации;
для формирования выборки не требуется дополнительной информации, касающейся рамок обследуемой популяции, достаточно полного списка всех членов обследуемой популяции и их контактных данных;
метод не требует применения специальных технических средств (Franklin S., Walker C., 2010).

Недостатки простой случайной выборки:

Метод не предполагает использования дополнительной информации, даже если она доступна и может быть использована. Как следствие, полученные оценки оказываются статистически менее эффективными по сравнению с теми, которые могут быть достигнуты при использовании других подходов к формированию выборки.
Метод чреват большой трудоемкостью исследования и большими материальными затратами, поскольку члены сформированной выборки могут быть достаточно широко разбросаны географически.
Не исключена возможность формирование «неудачной» выборки. Поскольку все выборки численностью n наблюдений имеют равные шансы быть сформированными, есть вероятность отбора таких участников целевой популяции, которые недостаточно сильно отличаются друг от друга (в том числе и отдалены географически) и, как следствие, могут недостаточно хорошо представлять популяцию в целом (Franklin S., Walker C., 2010).

Схематически подход к формированию простой случайной выборки представлен на рис. 8.

Систематический отбор выборки (systematic sampling, SYS). Единицы наблюдения отбираются в регулярных интервалах в популяции (рис. 9). К систематической выборке нередко прибегают тогда, когда хотелось бы использовать простую случайную выборку, но отсутствует списочный состав членов популяции или такой список имеется, но он уже исходно составлен в случайном порядке, и при этом легче организовать отбор систематической выборки , а не простой случайной. В случае систематической выборки необходимо определить интервал отбора единиц наблюдения и начальную случайно выбранную точку «старта». Если используется списочный состав членов популяции и число членов популяции равно N, число необходимых членов выборки равно n, и при этом отбирается каждый k-й объект, то k = N/n. Случайно выбранная точка «старта» r представляет собой число в диапазоне от 1 до k включительно. Выбранные единицы наблюдения будут следующими: r, r + k, r + 2k, ... r + (n — 1)k. Каждый объект наблюдения имеет вероятность попадания в выборку п, равную n/N. Однако, в отличие от простой случайной выборки, не каждая комбинация из n единиц имеет равные шансы быть отобранными: возможен только отбор единиц наблюдения, отделенных друг от друга значением k.

Пример
Популяция состоит из 54 единиц наблюдения, и требуется формирование выборки численностью n = 9 единиц. Интервал для отбора k будет составлять 54/9 = 6. Далее требуется выбор случайного числа в диапазоне от 1 до k = 6. Предположим, что таким числом оказалось 2. Тогда выбранными единицами наблюдения будут: 2, 8, 14, 20, 26, 32, 38, 44, 50. При интервале отбора 6 и размере популяции 54 единицы возможно формирование лишь 6 вариантов выборок.

Достоинства систематического формирования выборки:

Метод является аналогом простой случайной выборки в тех случаях, когда нет четких рамок целевой популяции.
Метод не требует дополнительной информации о рамках популяции.
Метод может обеспечить формирование выборки с лучшей дисперсией, чем простая случайная выборка (в зависимости от интервала формирования выборки и того, как отсортирован список).
Метод основан на разработанных теоретических предпосылках, как и метод формирования простой случайной выборки, поэтому параметры такой выборки могут быть легко рассчитаны.
Метод проще, чем метод простой случайной выборки, так как требуется лишь одно случайное число.

Недостатки систематического формирования выборки:

Метод может привести к формированию неудачной выборки, если выбранный интервал соответствует какой-то определенной собственной периодичности, существующей в популяции.
Метод не использует какой-то дополнительной доступной информации относительно рамок популяции и поэтому может приводить к неэффективной стратегии формирования выборки.
Окончательный размер выборки заранее не известен, если исследователь ориентируется лишь на предполагаемые рамки изучаемой популяции.

Кластерное формирование выборки (cluster sampling) представляет собой процесс рандомизированного отбора целых групп единиц наблюдений (кластеров) в рамках изучаемой популяции (рис. 10). Обычно это менее эффективный подход к формированию выборки по сравнению с простой случайной выборкой. Формирование выборки методом кластеров снижает расходы на сбор информации, особенно если популяция широко разбросана и предполагается персональное интервьюирование членов выборки. Индивидуальный отбор испытуемых в популяции, не всегда практически оправдан. Иногда значительно проще формировать кластерные группы обследуемых (например, отдельных больниц, домов и т. п.). Наконец, такой подход позволяет дать оценку самим кластерам. Кластерный метод формирования выборки осуществляется в два этапа:

популяция группируется в кластеры (это могут быть естественные кластеры, например: отдельные больницы, родильные дома, школы и т. п.);
выполняются отбор кластеров и обследование всех единиц наблюдений, входящих в кластеры.

Для обеспечения эффективности кластерного метода формирования выборки нужно быть уверенным в том, что сами по себе единицы наблюдений, входящие в кластеры, максимально разнообразны. Если единицы наблюдений в пределах кластера однотипны, они все дают однотипную информацию, а значит, достаточно обследования одного участника кластера. К сожалению, единицы наблюдений в пределах кластеров часто имеют сходные характеристики и потому более гомогенны, чем случайно отобранные из общей популяции.

Достоинства кластерного формирования выборки:

Метод может существенно уменьшить материальные затраты, особенно при широком разбросе членов популяции.
Метод легче применять при естественной кластеризации населения (например, в пределах домовладения, школы) или при исследовании концептуальной популяции, например лиц, госпитализируемых в стационар в течение определенного периода времени.
Метод позволяет оценить характеристики кластеров как таковых: например, при обследовании школьников можно одновременно изучить, каково общее число учителей в школе (если в качестве кластера выступают школы).
Метод может быть статистически более эффективным, чем метод формирования простой случайной выборки, если единицы наблюдений, входящие в кластеры, гетерогенны (различны) по отношению к изучаемым показателям, а сами кластеры гомогенны (сходны). Однако на практике эти условия редко выполняются (Franklin S., Walker C., 2010).

Недостатки кластерного формирования выборки:

Метод может быть менее эффективным статистически, чем метод простой случайной выборки, если единицы наблюдений в пределах кластеров гомогенны в отношении изучаемых показателей. Для того чтобы уменьшить влияние этого фактора, следует увеличить число кластеров.
Окончательный размер выборки часто точно не известен заранее, так как нельзя сказать, сколько единиц наблюдений находится в пределах кластера до окончания исследования.
Организация исследования может оказаться сложнее, чем в других методах.

Стратифицированное формирование выборки (stratified sampling, STR) предполагает, что популяция делится на гомогенные, взаимоисключающие группы, именуемые стратами, а затем в пределах каждой страты независимо отбираются объекты наблюдения (рис. 11). Формирование выборки в пределах страты проводится по одному из описанных принципов, в частности простой случайной выборки или систематической выборки, а также в соответствии с более сложными приемами, например: пропорциональной выборки, кластерного формирования выборки или многофазного подхода к формированию выборки.

Сочетание стратифицированного и кластерного формирования выборки реализуется в форме стратифицированного кластерного подхода. Например, при использовании кластерного метода формирования выборки часто на первом этапе проводят стратификацию, а затем в рамках каждой страты отбирают кластеры, которые обследуются в дальнейшем. Популяция может быть стратифицирована по любому признаку, который может быть учтен у всех единиц обследования в рамках целевой популяции еще до начала исследования. Например, таким признаком может быть просто домашний адрес (стратификация по географическому принципу: району, городу и т. п.) или сведения о доходе семьи (стратификация по уровню доходов). Чаще всего в качестве признаков для стратификации используются возраст, пол, географические характеристики, уровень доходов, жилищно-бытовые условия, образование и т. п.

Можно назвать основные доводы в пользу проведения стратификации:

Стратегия стратификации более эффективна, чем при простой случайной выборке или систематическом отборе выборки.
Стратификация позволяет обеспечить адекватную численность выборки в пределах тех специфических категорий, которые представляют интерес для исследователя.
Стратификация отчасти защищает от формирования неудачной выборки: при заданной численности выборки стратификация приводит к снижению ошибки отбора.

Статистическая эффективность стратификации возрастает тогда, когда имеется сильная гомогенность единиц наблюдения в пределах каждой страты, а сами страты максимально отличаются друг от друга по тому признаку, который интересует исследователя. Как правило, это условие выполняется, когда признаки, по которым осуществляется стратификация, коррелируют с теми признаками, которые изучаются в ходе исследования. Стратификация также весьма эффективна, когда распределение анализируемого показателя в популяции отклоняется от нормального распределения (имеет выраженную асимметрию). В таких ситуациях несколько единиц наблюдений, относящихся к крайним точкам распределения, могут сильно повлиять на полученные оценки. Для того чтобы такого не случилось, эти экстремальные наблюдения должны войти в отдельную страту. В частности, распределение уровня доходов семьи в популяции будет характеризоваться асимметрией: очевидно, что в популяции число семей с очень высокими доходами будет меньшим, чем число семей со средним и низким доходом. Если в простую случайную выборку попадут несколько таких семей с высокими доходами, то они могут сильно повлиять на полученные оценки, прежде всего в тех случаях, когда эти оценки прямо или косвенно связаны с уровнем дохода (например, при изучении организации быта ребенка, его обеспеченности игрушками и т. п.). Такую ошибку предотвращает стратификационный подход к формированию выборки (со стратификацией по уровню доходов). В то же время, если исследование направлено, например, на изучение темперамента ребенка, то проводить стратификацию по уровню доходов нет смысла. Иными словами, стратификация, эффективная при изучении одного показателя, может оказаться неэффективной при изучении другого. Таким образом, признаки, по которым осуществляется стратификация, следует выбирать так, чтобы они коррелировали с наиболее важными показателями, изучаемыми в ходе исследования.

Важным соображением, которое учитывается при осуществлении стратификации, является обеспечение адекватной численности выборок в пределах известных доменов интереса (domains of interest). Кросс-секционное исследование проводится с общей целью — получение каких-то обобщенных характеристик. Однако в дополнение к общей характеристике исследователь может быть заинтересован изучить данный показатель в пределах определенной подгруппы популяции, именуемой областью (доменом). Например, общая цель — узнать, какова распространенность высокого уровня тревоги у младших школьников. В пределах подгруппы цель — узнать распространенность высокого уровня тревоги отдельно среди младших школьников-мальчиков и девочек. Оценки показателей в подгруппах именуется оценкой домена. Если в ходе исследования предполагается оценка домена, то следует заранее предусмотреть, чтобы в пределах каждого домена имелось достаточное число наблюдений. Когда имеется информация о рамках популяции, простейшим способом обеспечить такое условие является строгое соответствие между стратами и доменами интереса.

Стратификация является защитой от формирования выборки с большим числом «экстремальных» представителей популяции. Формирование простой случайной выборки всецело зависит от случая. Если ее применяют к пациентам, то может оказаться, что в число обследованных вошли преимущественно мужчины или женщины; чтобы избежать такой крайности, следует провести стратифицированный отбор со стратификацией по полу. При этом предполагается, что в рамках целевой популяции имеется информация о поле пациентов.

Число единиц наблюдений, отбираемых для выборки в пределах каждой страты, может быть либо равным, либо пропорциональным численности каждой страты. В первом случае единицы наблюдения могут иметь различную вероятность попадания в обследуемую выборку. Рассмотрим в качестве примера популяцию численностью N = 1000 единиц, которую стратифицируют в две группы: одна страта включает в себя N1 = 250 единиц наблюдений, другая — N2 = 750 единиц. Предположим, что используется простая случайная выборка, чтобы случайно выбрать по 50 единиц наблюдений из первой и второй страт (n1 = n2 = 50). При этом общая численность выборки составит 100 наблюдений. Однако в первой страте вероятность попадания в обследуемую выборку составит: п1 = 50/250 = 0,2; во второй: п2 = 50/750 = 0,067.

Достоинства стратифицированного формирования выборки:

Метод позволяет повысить точность оценок, обеспечивая более эффективную стратегию формирования выборки. Как следствие, решение задач исследования может быть обеспечено при меньшей численности выборки.
Метод позволяет гарантировать, что важные подгруппы, если они определены как страты, будут достаточно представлены в выборке, что позволит дать статистически эффективные оценки доменов.
Метод позволяет более эффективно проводить исследование в оперативном и административном плане.
Метод позволяет избежать формирования «неудачной» выборки.
Метод позволяет использовать различные выборочные рамки (sampling frames) и применять разные процедуры формирования выборки в отношении отдельных страт (например, простая случайная выборка в одной страте и вероятностная выборка, пропорциональная объему в другой) (Franklin S., Walker C., 2010).

Недостатки стратифицированного формирования выборки:

Метод требует того, чтобы в рамки формирования выборки было включено много дополнительной и качественной информации, характеризующей все единицы наблюдений, ограниченные этими рамками. Это необходимо для осуществления стратификации.
Формирование рамок исследования требует максимальных затрат по сравнению с другими методами формирования выборки.
Стратегия формирования выборки может оказаться статистически менее эффективной, чем простая случайная выборка, если речь идет об изучении показателей, не коррелирующих с переменными, лежащими в основе стратификации.
Оценки при этом методе более сложные, чем в случае простой случайной выборки или систематического отбора выборки.

Многостадийное формирование выборки (multi-stage sampling) представляет собой процесс формирования выборки, проходящий две или более последовательные стадии. Единицы наблюдения, отбираемые на первой стадии, именуются первичными единицами выборки (primary sampling units, PSU), единицы, отбираемые на второй стадии, — единицами второй стадии (second stage units, SSU) и т. д. (рис. 12). На каждой стадии единицы наблюдения различаются по структуре и расположены в иерархическом порядке (например, город — район — квартал — отдельный дом — люди, проживающие в доме). При двустадийном формировании выборки единицами второй стадии чаще всего выступают отдельные члены популяции.

При многостадийном формировании выборки чаще всего применяется двустадийный кластерный подход. На первой стадии используются географические рамки для отбора отдельных территорий, которые войдут в исследование, — первичных единиц выборки), к которым будет применен систематический подход к формированию выборки для отбора отдельных домов в пределах этих территорий — единиц второй стадии. При двустадийном кластерном подходе исследование будет проводиться лишь в некоторых единицах наблюдения. Если соседние единицы наблюдения в пределах одного кластера потенциально похожи друг на друга, то с точки зрения статистики более разумно анализировать небольшое число единиц второй стадии, выбранных из многих первичных единиц выборки, а не наоборот. В случае одностадийного кластерного подхода каждая единица наблюдения, вошедшая в кластер, должна была быть объектом исследования.

Многостадийные наблюдения могут предполагать неограниченное число стадий формирования выборки. Однако сложность дизайна и оценки результатов возрастает по мере увеличения числа стадий, поэтому, как правило, число стадий ограничивают двумя или тремя. Следует отметить, что рамки первой стадии, как правило, достаточно стабильны. Например, если рамки имеют географическое выражение, то они редко меняются за короткий срок. Однако рамки второй и последующих стадий обычно менее стабильны (как правило, это списочные рамки, которые могут меняться с течением времени).

Принципиальным является то, что на каждой стадии многостадийного формирования выборки процесс осуществляется при помощи любого известного подхода, что делает многостадийный принцип весьма гибким.

Хотя географические рамки чаще всего используются на первой стадии многостадийного подхода к формированию выборки, соблюдение этого правила не является обязательным. Так, первичной единицей выборки может быть временной промежуток. Например, многостадийное исследование может предполагать изучение пациентов, госпитализированных в определенную многопрофильную больницу. В этом случае первичной единицей выборки может выступать определенный период времени (например, конкретные дни в течение месяца), а единицами второй стадии — отдельные пациенты, госпитализированные в эти дни и отобранные методом простой случайной выборки.

Достоинства многостадийного формирования выборки

Метод позволяет обеспечить статистически более эффективную стратегию формирования выборки по сравнению с простым кластерным методом в тех случаях, когда кластеры гомогенны.
Метод позволяет существенно уменьшить расходы на проведение исследования.
Нет необходимости иметь списочные рамки всей популяции. Рамки нужно формировать на каждой стадии отбора популяции (Franklin S., Walker C., 2010).

Недостатки многостадийного формирования выборки:

Метод не является столь же эффективным, сколь метод формирования простой случайной выборки.
Окончательный размер выборки заранее не известен в случае многостадийного подхода, поскольку нет информации, сколько единиц наблюдения находится в пределах каждого кластера (размер выборки можно контролировать тогда, когда из каждого кластера планируется отбирать на второй стадии заранее зафиксированное число единиц наблюдения).
Многостадийное обследование труднее организовать, чем простое одностадийное кластерное.
Расчеты эффекта и его вариации носят более сложный характер.

Многофазный подход к формированию выборки (multi-phase sampling). Выборка, формирующаяся в несколько фаз, ограничена одними и теми же рамками, а единицы исследования имеют одну и ту же структуру в каждой фазе. Собирается базисная информация о единицах наблюдений в большой выборке, а затем для части этих единиц наблюдения (подвыборки) собирается дополнительная информация (рис. 13). Чаще всего предполагается наличие двух фаз или двойное формирование выборки, хотя может быть 3 фазы и больше.

Многофазный подход оказывается полезным в тех случаях, когда рамки популяции не содержат в себе дополнительной информации, необходимой для стратификации или для детального обследования части популяции. Предположим, поставлена задача изучить психологические характеристики родителей, воспитывающих детей первого года жизни, проживающих совместно с бабушками и дедушками, но в распоряжении исследователя имеются списочные рамки, ограниченные информацией о семьях, в которых имеются дети такого возраста. В подобных условиях может быть проведено простое кросссекционное исследование с единственным вопросом: проживают ли родители и ребенок совместно с бабушками и дедушками? После того как в результате реализации этой первой фазы сформируется выборка из семей, проживающих совместно с бабушками и дедушками, можно будет сформировать из них меньшую по размеру выборку, в которой уже будет проведено углубленное исследование.

Многофазный подход может быть реализован тогда, когда затраты, связанные с получением информации на отдельных этапах исследования, сильно различаются. Например, исследование может быть направлено на изучение важнейших показателей, отражающих пищевое поведение и диетические предпочтения, курение, физическую активность, употребление алкоголя определенного контингента лиц. Кроме того, целесообразно проведение функциональных тестов (определение уровня артериального давления, проведение проб с физической нагрузкой), изучение биохимических показателей (уровня глюкозы и холестерина в сыворотке крови) и т. п. у части таких обследуемых лиц. Очевидно, что простое интервьюирование , направленное на изучение образа жизни, провести гораздо легче, чем реализовать ту часть исследования, которая предполагает использование медицинских манипуляций. В целом исследование может быть проведено в две фазы: базисные вопросы будут заданы испытуемым в первой фазе исследования, углубленное обследование охватит лишь небольшую выборку, сформированную в ходе второй фазы.

Достоинства многофазного подхода к формированию выборки:

Метод позволяет существенно повысить точность оценок (по сравнению с формированием простой случайной выборки).
Метод пригоден для получения дополнительной, исходно отсутствовавшей информации, касающейся популяционных рамок.
Метод используется в тех случаях, когда затраты на получение определенной информации весьма высоки или когда получение этой информации создает большие неудобства для респондента (Franklin S., Walker C., 2010).

Недостатки многофазного подхода к формированию выборки:

Реализация требует больше времени, чем для осуществления однофазного подхода, если результаты первой фазы необходимы для осуществления второй.
Метод будет более затратным по сравнению с однофазным подходом, так как требуется повторное обследование участников исследования.
Если популяция мобильна или интересующие исследователя характеристики часто и быстро меняются, то временные интервалы, возникающие между отдельными фазами исследования, могут создавать трудности для фиксации однотипных и сопоставимых показателей.
Практическая организация исследования может быть осложнена.
Расчеты результатов исследования могут быть достаточно сложными.

Реплицированное формирование выборки (replicated sampling) предполагает отбор не одной, а нескольких независимых выборок из популяции. Вместо одной последовательно создаются несколько репликатов — выборок меньшего размера, приблизительно равные по численности. Последние формируются независимо друг от друга на основе единого принципа (рис. 14). Реплицированное формирование выборки может использоваться в ситуациях, когда в короткие сроки требуются предварительные результаты на основе обследования и анализа одного репликата. Кроме того, реплицированное формирование выборки позволяет упростить расчет некоторых статистических показателей, прежде всего вариации признака, так как мерой такой вариации будут различия полученных показателей в отдельных репликатах.

В рамках исследований популяционных срезов возможны и специфические варианты дизайна.

Повторные исследования (repeated surveys) проводятся с целью изучить тренд или изменения интересующих исследователя характеристик с течением времени. Тренд — систематическая направленность в сторону повышения или понижения частоты изучаемого феномена с течением времени. Следует помнить о возможности снижения статистической силы исследования с течением времени. Например, исходно исследование проводилось по принципу стратифицированного формирования выборки со стратификацией по уровню дохода семьи, однако с течением времени доход мог существенно измениться, и исходные стратификационные рамки, таким образом, могут оказаться нарушенными. Следовательно, при организации повторных исследований такая возможность должна быть предусмотрена.

Панельные или лонгитюдные исследования популяционного среза (panel, longitudinal survey) — изучение одних и тех же единиц наблюдения в различные моменты времени. Такие исследования обычно направлены на изучение изменения в динамике интересующих исследователя показателей в заданной популяции и позволяют гораздо эффективнее справиться с этой задачей, чем при изучении серии независимых выборок аналогичной численности.

Панельное исследование популяционного среза может также использоваться для оценки надежности психодиагностического метода, поскольку одним из критериев надежности является сходство результатов, полученных при повторных тестированиях.

В панельном исследовании полезна фиксация относительно редко встречающихся событий.

Пример

В исследовании, посвященном изучению психологических последствий насилия, участники проходили первичное анкетирование, и в ходе анкетирования изучались признаки, отражающие нынешнее психологическое состояние испытуемых, а также задавался вопрос об имевшемся ранее насилии в отношении испытуемых. В дальнейшем участники проходили анкетирование каждую неделю, причем им задавали вопрос: проявлялось ли насилие по отношению к ним? Если таковое имелось, участники получали дополнительные опросники, направленные на изучение их психологических характеристик, причем эти опросники также предлагалось заполнять повторно: через неделю, две и т. п., что позволяло отслеживать как ближайшие, так и отдаленные последствия насилия (Leeuw E. D. [et al.], 2008).

Панельные исследования популяционных срезов по своему смыслу приближаются к когортным аналитическим исследованиям при определенной модификации. Если в качестве исходно учитываемого признака рассматривается наличие или отсутствие какого-то воздействия, то при динамическом наблюдении можно проследить, ассоциировалось ли данное воздействие с риском возникновения того или иного последствия (эффекта).

Для панельных исследований важнейшей проблемой является отказ респондентов от участия в исследовании, с течением времени таких лиц станет больше, в результате чего численность выборки существенно уменьшается. Также с течением времени может меняться и структура популяции, в результате чего могут добавляться новые единицы наблюдения и выбывать старые. Наконец, панельные исследования труднее реализовать технически, они требуют больших затрат по сравнению с одномоментными исследованиями популяционных срезов.

Формирование выборки по принципу «снежного кома» (snowballsampling) является весьма специфическим подходом к исследованию популяционных срезов. Его целесообразность несомненна, когда необходимо обследование лиц с каким-то редким состоянием (заболеванием) или когда единицы наблюдения, которых хотелось бы включить в исследования, не охвачены имеющимися списочными популяционными рамками (например, лица, пишущие стихи, увлекающиеся йогой и т. п.). Исследователь может знать о наличии таких пациентов и имеет возможность связаться с ними и обследовать их. Допустимо спросить этих участников исследования, знают ли они еще кого-нибудь, кто имеет то же заболевание (состояние и т. п.), и, если они таковых знают, можно попросить связаться с ними и предложить им принять участие в исследовании. Таким образом, выборка увеличивается как снежный ком. Принцип «снежного кома» — это не вероятностный подход к формированию выборки, так как не все потенциальные участники исследования имеют равные шансы отбора для участия в нем.

Ключевые слова: Исследования, Клиника

Источник: Методология исследования в клинической психологии : учеб. пособие. Кельмансон И. А. — Санкт-Петербург : СпецЛит, 2017. — 328 с.

Материалы по теме
Рандомизированный дизайн исследования в клинической психологии Методология исследования в клинической психологии : учеб. пособие. Кельмансон И. А. — Санкт-...
Открытое, слепое, двойное слепое исследование в клинической психологии Методология исследования в клинической психологии : учеб. пособие. Кельмансон И. А. — Санкт-...
Исследования в параллельных, связанных группах и перекрестный дизайн в клинической психологии Методология исследования в клинической психологии : учеб. пособие. Кельмансон И. А. — Санкт-...
Экспериментальный дизайн с одним испытуемым в клинической психологии Методология исследования в клинической психологии : учеб. пособие. Кельмансон И. А. — Санкт-...
Методы и методики измерения в клинической психологии Методология исследования в клинической психологии : учеб. пособие. Кельмансон И. А. — Санкт-...
Интервьюирование в клинической психологии Методология исследования в клинической психологии : учеб. пособие. Кельмансон И. А. — Санкт-...
Наблюдение в клинической психологии Методология исследования в клинической психологии : учеб. пособие. Кельмансон И. А. — Санкт-...
Надежность измерения исследования в клинической психологии Методология исследования в клинической психологии : учеб. пособие. Кельмансон И. А. — Санкт-...

Оставить комментарий

Вы здесь

Исследование популяционных срезов в клинической психологии