Затем были протестированы все учащиеся каждого уровня в каждой
социальной группе, и для каждого из этих уровней в каждой группе
были получены отдельные нормы. Фактически, общее количество
испытуемых было вычислено для сорока четырех социальных групп
США.
Должно быть очевидным, что эти процедуры формирования вы-
борки должны дать такую выборку, которая очень точно отражает
генеральную популяцию для каждой группы. Однако, должно быть в
равной степени очевидно, что для формирования выборки таким
способом необходимы огромные ресурсы. Исследование Лордж-Тор-
ндайка показывает, каким должен быть полный объем выборки, не-
обходимый для адекватной нормализации, и громадный объем адми-
нистративных расходов, требующихся для проведения такого обшир-
ного тестирования. Этот пример также ясно иллюстрирует, как дол-
жно выполняться полностью адекватное формирование выборки. Об-
ратите внимание на основу стратификации: для нее были взяты пе-
ременные, имеющие отношение к измеряемой переменной. При ус-
тановлении норм для измерения тревожности может вполне оказать-
ся, что выборка будет стратифицирована по другим переменным.
Заметьте также, что нормы получены не только для каждой возраст-
ной группы в целом, но и для подгрупп ("высокий", "низкий" уровень
и т.д.) по переменным для социальных групп. Это полезные и содер-
жательные сравнения.
На этом примере наглядно иллюстрируется полный набор требо-
ваний к процедуре формирования выборки, если необходима выбор-
ка из генеральной популяции - ее огромный объем и соответствую-
щаястратификация. Тотфакт, чтодажездесьприводятсяпоказатели
для подгрупп, говорит о том, что эти показатели могут использовать-
ся. Действительно, при рассмотрении индивидуального случая они
зачастую даже более полезны, чем общий групповой показатель.
Подбор испытуемых в рамках стратификационных групп должен
быть случайным.
ПРИМЕР 2. ВЫБОРКА ИЗ ГЕНЕРАЛЬНОЙ СОВОКУПНОСТИ
ДЛЯ ТЕСТА КЭТТЕЛЛА 16PF
Cattell, Eber и Tatsuoka (1970) также утверждают, что соответст-
вующим образом стратифицированная выборка более эффективна,
при том же объеме, чем случайная (рандомизированная) выборка.
Основания для стратификации . (а) Социальное положение ,
(б) географическая область, (в) возраст и (г) горожанин или сельский
житель. Стандартизационная выборка отражала пропорции этих ка-
тегорий во всем населении. Фактически, были выделены 8 регионов
США, восемь уровней по плотности населения, пять возрастных
групп и семь групп по уровню доходов.
216
Общий объем выборки: 977. Это относительно небольшая выбор-
ка, хотя она и была тщательно стратифицирована. Ее небольшой
объем отражает наличие проблемы, связанной с нежеланием взрос-
лых испытуемых, не являющихся студентами, военнослужащими
или заключенными, сотрудничать с исследователями. Хотя общий
объем выборки взрослых испытуемых - 977 - является, благодаря
его соответствующей стратификации, вероятно адекватным, некото-
рые из подгрупп представляются слишком маленькими, чтобы их
результаты могли быть использованы. Например, в выборке только
тридцать обитателей горной местности, что не может считаться удов-
летворительным. Аналогично, для различных возрастных групп, в
которых только девяносто четыре испытуемых моложе 25 лет, выбор-
ки также являются слишком маленькими.
Выводы . На этом примере показана необходимость, если общая
группадолжна разуваться на подгруппы, формирования очень боль-
ших выборок. Действительно, если подмножества общей выборки не
являются достаточно большими, чтобы обеспечить надежность пока-
зателей, то адекватность всей выборки может быть поставлена под
сомнение. Когда мы сравниваем тест 16PF (который, между прочим,
является одним из наилучших тестов личности в отношении наличия
нормативных данных) с тестом Лордж-Торндайка, видно, что ничто
не избавляет от необходимости формирования очень больших выбо-
рок объемом в несколько тысяч.
Правила для общих норм
Исходя из изложенного, могут быть сформулированы несколько
общих правил получения норм для генеральной популяции.
(1) Выборка должна быть стратифицирована. Обычно адекватной
является стратификация на четыре уровня. Важными стратификаци-
онными переменными обычно являются социальное положение, воз-
раст и пол.
(2) В каждой подгруппе должно быть количество испытуемых,
достаточное, чтобы сформировать адекватную выборку, то есть как
минимум около 300.
Это неизбежно означает, что, с учетом всех возможных классифи-
каций, необходимо очень большое количество испытуемых, напри-
мер: 1 (социальное положение) х 2 (пол) х 5 (возраст) дает 40 кате-
горий по 300 испытуемых в каждой, что дает общее количество 12000
испытуемых. Как указывает пример теста Лордж-Торндайка, очень
мало шансов избежать такого большого количества испытуемых (а
это всего лишь минимум). Следовательно, обеспечение адекватных
норм для генеральной популяции требует огромных затрат ресурсов.
217
Нормы, полученные в менее масштабных исследованиях, как в слу-
чае теста Кэттелла 16PF, также полезны, но должны использоваться
с осторожностью.
По приведенной выше причине, а именно из-за необходимости в
огромных ресурсах, многие разработчики тестов указывают более
специфические нормы для групп, специально соответствующих ха-
рактеру и практическому применению теста.
ПРИМЕР 3: НОРМЫ ДЛЯ СПЕЦИАЛЬНЫХ ГРУПП - ШКАЛА
КОНСЕРВАТИЗМА
Эта шкала (Wilson и Patterson, 1970) представляет собой попытку
измерения догматизма или ригидности, рассматриваемой как важная
социальная установка (аттитюд), влияющая на значительные облас-
ти разнообразного поведения в реальной жизни, что подробно обсуж-
далось у Rokeach ( 1960). При использовании такой шкалы интерес
будут представлять показатели любой отдельной группы. Таким об-
разом, было получено большое количество различных норм. Напри-
мер, нормы были определены для университетских студентов из че-
тырех стран, студентов педагогического колледжа, школьниц, спе-
циалистов из Новой Зеландии, высококвалифицированных рабочих,
а также для разнородной группы мужчин. Однако, изучение количе-
ства испытуемых в каждой из этих групп показывает, что эти цифры
мало значимы. Наибольшей выборкой является группа из 340 ново-
зеландских специалистов, и трудно согласиться, что она могла бы
адекватно отражать такую разнообразную категорию лиц. Обследо-
ваны только пятьдесят студентов университетов из Великобритании.
Поскольку в Англии более сорока университетов и, принимая во
внимание большое количество дисциплин, изучаемых в университе-
тах, эта выборка не может выступать в качестве нормативных дан-
ных.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96