Существенно, что последовательность зада-
ний или групп заданий определяется их выполнением испытуемым. На-
пример, всем вначале дается набор заданий средней трудности. Те, кто
" См. работу Дж. Виггинса (J. S. Wiggins, 1973, р. 257-274), где приводится вымыш-
162 ПРИНЦИПЫ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ
с ними не справился, переводятся на более легкие задания; тем же, кто
показал хорошие результаты, даются более трудные задания. Такие
<разветвления> могут иметь место на нескольких этапах. Главный вы-
игрыш здесь в том, что каждый испытуемый получает только те задания,
которые отвечают его уровню, вместо того чтобы выполнять все зада-
ния. Модели последовательного тестирования будут рассмотрены далее
в гл. II, в связи с применением компьютеров в групповом тестировании.
Еще одним использованием этой стратегии, пригодным для диагно-
стики психических нарушений, является последовательное отнесение ис-
пытуемых к одной из двух категорий, причем дальнейшему тестирова-
нию подлежат только те, для кого очередная проба оказалась
положительной, что указывает на возможную патологию. Эта стратегия
уже упоминалась выше в связи с использованием тестов для диагностики
патологических состояний при весьма низком базовом уровне.
Следует отметить, что многие решения, связанные с приемом на ра-
боту, фактически осуществляются по последовательной схеме, хотя это
и не всегда осознается. Некомпетентные работники, принятые вследствие
ошибки прогноза, обычно могут быть уволены по истечении испытатель-
ного срока; отчисляются также на ряде этапов не справляющиеся
с учебными программами студенты. В таких ситуациях только отрица-
тельное решение оказывается окончательным. Конечно, ошибки отбора,
которые затем исправляются, могут дорого обходиться с точки зрения
той или иной системы ценностей. Но все-таки они часто сопряжены
с меньшими издержками, чем окончательное ошибочное решение.
Вторым условием, влияющим на эффективность психологического
теста, является использование альтернативных решений и возможностей
адаптивных методов при определении индивидуальных особенностей.
Примером может служить использование различных программ подго-
товки персонала в зависимости от уровня их способностей или введение
компенсирующих программ для учеников с определенными трудностями
в обучении. В этих условиях стратегия решения каждый раз должна
строиться с учетом имеющихся сведений о взаимодействии между перво-
начальным результатом irci и дифференцированным обучением. Адап-
тивные методы нередко позволяют повысить число справляющихся
с учебной программой. Поскольку выбор того или иного альтернативно-
го метода в принципе является проблемой классификации, а не отбора,
соответствующие методики будут рассмотрены позже, в разделе, посвя-
щенном классификационным решениям.
Приведенные примеры показывают, что концепции и принципы тео-
рии решений могут помочь в оценке пригодности психологических тес-
тов для конкретных целей тестирования. Теория решений позволяет вы-
делить комплекс факторов, определяющих выигрыш, который дает
использование того или иного теста в частной ситуации. Сам же по себе
коэффициент валидности-лишь один из факторов, подлежащих рассмо-
трению при оценке влияния теста на эффективность всего процесса выра-
ботки решений.
" Более полное обсуждение применения теории решений в тестировании см. в рабо-
те Дж. Виггинса (J.S. Wiggins, 1973, гл. 6), на более специальном уровне эти проблемы об-
163 ВАЛИДНОСТЬ. ИЗМЕРЕНИЕ И ИНТЕРПРЕТАЦИЯ
МОДЕРАТОРЫ
Зависимость валидности от особенностей подгрупп испы-
туемых. Валидность теста относительно данного критерия может зави-
сеть от индивидуальных особенностей испытуемого. Классическая психо-
метрическая модель предполагает, что ошибка прогноза является
характеристикой теста, а не испытуемого и что эти ошибки распростра-
няются на испытуемых случайным образом. Гибкость подхода, свой-
ственная теории решений, способствовала созданию прогностических мо-
делей, учитывающих взаимодействие между индивидом и тестом. Такое
взаимодействие означает, что один и тот же тест может для одних клас-
сов или подмножеств испытуемых обладать большей, а для других-
меньшей прогностической способностью. Например, данный тест может
лучше предсказывать критериальное выполнение для мужчин, чем для
женщин, или для поступающих на работу из более низких, чем из более
высоких социоэкономических уровней. В этих примерах пол и социоэко-
номический уровень играют роль модераторов-переменных, не позво-
ляющих повысить валидность теста (D.R. Saunders, 1956).
Нередко валидность теста для всей группы слишком мала, чтобы
его можно было использовать в прогностических целях. Но подсчет ва-
лидности для подгрупп, различающихся по некоторому легко распозна-
ваемому признаку, выявляет, что в одной подгруппе она велика, а в дру-
гой ничтожна. Следовательно, тест можно эффективно использовать для
принятия решений относительно членов первой, но не второй группы.
Возможно, для второй группы будет эффективным другой тест или иной
способ оценки.
Модератор представляет собой некоторую характеристику группы
лиц, указывающую на прогностическую эффективность теста примени-
тельно именно к данной группе. Это могут быть демографические пока-
затели (пол, возраст, уровень образования, социоэкономический статус)
или результаты другого теста. В роли модераторов часто выступают ин-
тересы и мотивация. Так, если поступающий на работу почти не заинте-
ресован в ней, то его выполнение своих обязанностей, вероятно, будет
неудовлетворительным, независимо от его результатов по соответствую-
щему тесту способностей. Для таких лиц корреляция между результата-
ми теста способностей и качеством выполнения работы будет низкой,
тогда как для заинтересованных и высоко мотивированных индивидов
такая корреляция может оказаться весьма значительной.
Эмпирические примеры модераторов. Данные о действии мо-
дераторов поступают из разных источников. Просмотрев несколько сот
коэффициентов корреляции между результатами теста способностей
и успеваемостью, Г. Сишор (H.G. Seashore, 1962) установил, что в значи-
тельном большинстве случаев коэффициенты корреляции выше у жен-
щин, чем у мужчин. Эта тенденция имела место как в школах, так и
в колледжах, и в последнем случае она была более выраженной. Данные
не содержали указаний на причину отмеченных различий валидности, но
было бы интересно порассуждать о них в свете других известных по-
ловых различий. Поскольку ученицы обычно более склонны к конфор-
мизму, к принятию ценностей и норм школьной жизни, их достижения
в учебе, по-видимому, более связаны с их способностями.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143
ний или групп заданий определяется их выполнением испытуемым. На-
пример, всем вначале дается набор заданий средней трудности. Те, кто
" См. работу Дж. Виггинса (J. S. Wiggins, 1973, р. 257-274), где приводится вымыш-
162 ПРИНЦИПЫ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ
с ними не справился, переводятся на более легкие задания; тем же, кто
показал хорошие результаты, даются более трудные задания. Такие
<разветвления> могут иметь место на нескольких этапах. Главный вы-
игрыш здесь в том, что каждый испытуемый получает только те задания,
которые отвечают его уровню, вместо того чтобы выполнять все зада-
ния. Модели последовательного тестирования будут рассмотрены далее
в гл. II, в связи с применением компьютеров в групповом тестировании.
Еще одним использованием этой стратегии, пригодным для диагно-
стики психических нарушений, является последовательное отнесение ис-
пытуемых к одной из двух категорий, причем дальнейшему тестирова-
нию подлежат только те, для кого очередная проба оказалась
положительной, что указывает на возможную патологию. Эта стратегия
уже упоминалась выше в связи с использованием тестов для диагностики
патологических состояний при весьма низком базовом уровне.
Следует отметить, что многие решения, связанные с приемом на ра-
боту, фактически осуществляются по последовательной схеме, хотя это
и не всегда осознается. Некомпетентные работники, принятые вследствие
ошибки прогноза, обычно могут быть уволены по истечении испытатель-
ного срока; отчисляются также на ряде этапов не справляющиеся
с учебными программами студенты. В таких ситуациях только отрица-
тельное решение оказывается окончательным. Конечно, ошибки отбора,
которые затем исправляются, могут дорого обходиться с точки зрения
той или иной системы ценностей. Но все-таки они часто сопряжены
с меньшими издержками, чем окончательное ошибочное решение.
Вторым условием, влияющим на эффективность психологического
теста, является использование альтернативных решений и возможностей
адаптивных методов при определении индивидуальных особенностей.
Примером может служить использование различных программ подго-
товки персонала в зависимости от уровня их способностей или введение
компенсирующих программ для учеников с определенными трудностями
в обучении. В этих условиях стратегия решения каждый раз должна
строиться с учетом имеющихся сведений о взаимодействии между перво-
начальным результатом irci и дифференцированным обучением. Адап-
тивные методы нередко позволяют повысить число справляющихся
с учебной программой. Поскольку выбор того или иного альтернативно-
го метода в принципе является проблемой классификации, а не отбора,
соответствующие методики будут рассмотрены позже, в разделе, посвя-
щенном классификационным решениям.
Приведенные примеры показывают, что концепции и принципы тео-
рии решений могут помочь в оценке пригодности психологических тес-
тов для конкретных целей тестирования. Теория решений позволяет вы-
делить комплекс факторов, определяющих выигрыш, который дает
использование того или иного теста в частной ситуации. Сам же по себе
коэффициент валидности-лишь один из факторов, подлежащих рассмо-
трению при оценке влияния теста на эффективность всего процесса выра-
ботки решений.
" Более полное обсуждение применения теории решений в тестировании см. в рабо-
те Дж. Виггинса (J.S. Wiggins, 1973, гл. 6), на более специальном уровне эти проблемы об-
163 ВАЛИДНОСТЬ. ИЗМЕРЕНИЕ И ИНТЕРПРЕТАЦИЯ
МОДЕРАТОРЫ
Зависимость валидности от особенностей подгрупп испы-
туемых. Валидность теста относительно данного критерия может зави-
сеть от индивидуальных особенностей испытуемого. Классическая психо-
метрическая модель предполагает, что ошибка прогноза является
характеристикой теста, а не испытуемого и что эти ошибки распростра-
няются на испытуемых случайным образом. Гибкость подхода, свой-
ственная теории решений, способствовала созданию прогностических мо-
делей, учитывающих взаимодействие между индивидом и тестом. Такое
взаимодействие означает, что один и тот же тест может для одних клас-
сов или подмножеств испытуемых обладать большей, а для других-
меньшей прогностической способностью. Например, данный тест может
лучше предсказывать критериальное выполнение для мужчин, чем для
женщин, или для поступающих на работу из более низких, чем из более
высоких социоэкономических уровней. В этих примерах пол и социоэко-
номический уровень играют роль модераторов-переменных, не позво-
ляющих повысить валидность теста (D.R. Saunders, 1956).
Нередко валидность теста для всей группы слишком мала, чтобы
его можно было использовать в прогностических целях. Но подсчет ва-
лидности для подгрупп, различающихся по некоторому легко распозна-
ваемому признаку, выявляет, что в одной подгруппе она велика, а в дру-
гой ничтожна. Следовательно, тест можно эффективно использовать для
принятия решений относительно членов первой, но не второй группы.
Возможно, для второй группы будет эффективным другой тест или иной
способ оценки.
Модератор представляет собой некоторую характеристику группы
лиц, указывающую на прогностическую эффективность теста примени-
тельно именно к данной группе. Это могут быть демографические пока-
затели (пол, возраст, уровень образования, социоэкономический статус)
или результаты другого теста. В роли модераторов часто выступают ин-
тересы и мотивация. Так, если поступающий на работу почти не заинте-
ресован в ней, то его выполнение своих обязанностей, вероятно, будет
неудовлетворительным, независимо от его результатов по соответствую-
щему тесту способностей. Для таких лиц корреляция между результата-
ми теста способностей и качеством выполнения работы будет низкой,
тогда как для заинтересованных и высоко мотивированных индивидов
такая корреляция может оказаться весьма значительной.
Эмпирические примеры модераторов. Данные о действии мо-
дераторов поступают из разных источников. Просмотрев несколько сот
коэффициентов корреляции между результатами теста способностей
и успеваемостью, Г. Сишор (H.G. Seashore, 1962) установил, что в значи-
тельном большинстве случаев коэффициенты корреляции выше у жен-
щин, чем у мужчин. Эта тенденция имела место как в школах, так и
в колледжах, и в последнем случае она была более выраженной. Данные
не содержали указаний на причину отмеченных различий валидности, но
было бы интересно порассуждать о них в свете других известных по-
ловых различий. Поскольку ученицы обычно более склонны к конфор-
мизму, к принятию ценностей и норм школьной жизни, их достижения
в учебе, по-видимому, более связаны с их способностями.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143