(4) Если используется факторный анализ, убедитесь, что получе-
на простая структура.
(5) При обсуждении результатов четко объясняйте, какие корре-
ляции и нагрузки факторов можно ожидать. Это позволяет читателю
судить о психологическом значении этих результатов.
Исследования конкурентной валидности, удовлетворяющие этим
критериям, должны дать недвусмысленное свидетельство валиднос-
ти, которое не может быть методологически опровергнуто.
Прогностическая валидность
Здесь основной проблемой является выделение критерия предска-
зания. Хотя это представляет трудность всегда, все же степень труд-
ности изменяется в зависимости от типа теста. Обычно для тестов
способностей и интересов прогностическую валидность продемон-
стрировать легче, чем для личностных тестов. В общем, правила,
которым желательно следовать, подобны приведенным для конку-
рентной валидности.
(1) Что касается комплектования выборок испытуемых, то все
предыдущие замечания остаются в силе.
206
(2) Существенно важен размер выборки. Если используются мно-
жественные корреляции с акцентированием внимания на весовых
коэффициентах ft (индексе значимости данного теста в прогнозе по
данному критерию), то выборка должна быть расщеплена или под-
вергнута процедуре кросс-валидизации, так как значения весовых
коэффициентов/? могут изменяться от исследования к исследованию.
(3) При использовании факторного анализа должна быть получе-
на простая структура.
(4) Должна быть показана надежность используемого критерия.
Последняя процедура особенно важна, поскольку неудовлетвори-
тельная надежность измерений снижает корреляции.
УМЕНЬШЕНИЕ КОРРЕЛЯЦИЙ ВСЛЕДСТВИЕ НЕУДОВЛЕТ-
ВОРИТЕЛЬНОЙ НАДЕЖНОСТИ
Исходя из классической модели погрешностей измерений может
быть показано, что можно оценить, какой была бы корреляция между
двумя тестами, если бы для них было получено высокое значение
коэффициента надежности. Эта оценка может быть вычислена по
формуле (вывод этой формулы см. в Nunnally, 1978):
- - "а
V/-11 n.-i
где га - скорректированное значение коэффициента корреля-
ции, П1 - эмпирическое значение коэффициента корреляция, гц -
значение надежности для переменной 1, /-22 - значение надежности
для переменной 2.
Эта формула применяется для корректировки при неудовлетвори-
тельной надежности по обеим переменным. Если необходимо прове-
сти коррекцию только при неудовлетворительной надежности кри-
терия, то тогда в знаменатель подставляется только значение надеж-
ности для критерия.
ШАГИ ВЫЧИСЛЕНИЯ КОРРЕКЦИИ ПРИ НЕУДОВЛЕТВО-
РИТЕЛЬНОЙ НАДЕЖНОСТИ
Эта формула настолько проста, что, вероятно, нет необходимости
раскладывать ее на шаги. Коротко:
(1) Вычислите произведение коэффициентов надежности для
двух тестов.
(2) Возьмите квадратный корень: уГип
(3) Разделите полученную корреляцию валидизируемого теста и
критерия на результат, полученный на шаге (2).
207
ИСПОЛЬЗОВАНИЕ КОРРЕКЦИИ
С моей точки зрения, эта формула коррекции по целому ряду
причин должна использоваться с большой осторожностью. Во-пер-
вых, в практическом применении тестов валидизируемый тест и его
критерий имеют только одно данное значение надежности: такая
коррекция не изменяет этот факт, как бы это ни было неприятно.
Значительно лучше сразу получить надежные тест и критерий, чем
применять коррекцию вследствие неудовлетворительной надежнос-
ти.
Однако, в теоретических исследованиях, где основной интерес
представляет отношение между двумя переменными, скорректиро-
ванная оценка может оказаться более лучшим показателем, чем
значение, заниженное вследствие неудовлетворительной надежнос-
ти. Тем не менее, всегда есть вероятность того, что скорректирован-
ными оценками мы введем себя в заблуждение. По этой причине
скорректированных оценок корреляций следует избегать как тако-
вых. Иноща, однако, имеет смысл привести их рядом с исходными
показателями, в зависимости от цели и характера исследований.
Использование их без указания того, что они являются следствием
коррекции, и без предоставления исходных значений будет большой
ошибкой.
Содержательная валидность
Содержательная валидность, как указывалось в главе 1, представ-
ляет интерес в основном при конструировании тестов, когда должен
быть точно определен материал, используемый для тестирования.
Очевидными примерами может быть содержание тестов математиче-
ских, музыкальных способностей, словарного запаса и знаний грам-
матики. В терминах классической модели измерений проблема со-
держательной валидности возникает при формировании выборок за-
даний из генеральной совокупности заданий. На практике же случай-
ный выбор заданий для тестирования словарного запаса, вероятно,
вряд ли даст эффективный тест, поскольку не все слова в словаре
имеют одинаковую важность. Даже случайный подбор из множества
наиболее употребительных слов не будет адекватным, так как суще-
ствуют ограничения на слова, которые мы хотим использовать в
тестировании (в зависимости от цели теста). Так, тест словарного
запаса для зарубежных врачей будет значительно отличаться от тес-
та для, скажем, зарубежных педагогов.
На практике подтверждение содержательной валидности может
быть получено только следующим образом. Подбираются эксперты в
данной области, которые указывают, какой материал они считают
208
существенно важным; затем этот материал преобразуется в задания
теста, и затем опять направляется экспертам, чтобы посмотреть, не
обнаружат ли они каких-либо грубых упущений или заданий, дубли-
рующих друг друга.
В случае личностных тестов содержательная валидность имеет
меньшее значение, хотя автор настоящей книги при конструирова-
нии тестов оральных черт личности, OPQ и OOQ (Kline, 1979), попы-
тался продемонстрировать содержательную валидность при помощи
перечисления всех психоаналитических описаний "оральной лич-
ности" в сокращенной форме, например, "зависимый", "прилипу-
чий, как пиявка", а затем преобразования их в задания теста.
Cattel (напр. 1946), при конструировании теста 16 PF, также
попытался обеспечить содержательную валидность следующим обра-
зом: (1) просмотром словаря в поисках всех терминов, описывающих
поведение; (2) избавлением от тех терминов, которые эксперты со-
чли синонимами; (3) ранжированием испытуемых по остающимся
описаниям и выделением кластеров; (4) формулированием заданий,
предназначенных для выявления этих кластеров. Это был тщательно
разработанный метод исследования всей генеральной совокупности
переменных и попытки обеспечить содержательную валидность.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96