п., если взять для сравнения независимый критерий, применявшийся
раннее для текущей валидизации. Так, объективный показатель успешности
профессиональной деятельности к моменту отдаленного сопоставления может оказаться
слишком простым (напр.,
ВАЛ
если тест достижений при анализе его диагностической валидности сопоставляется с
успешностью выполнения самой простой сборочной операции, которая в момент
отдаленного сравнения хорошо усваивается практически всеми испытуемыми из выборки
валидизации). Более правильным будет сопоставление с новым уровнем независимого
критерия, комплексом более сложных навыков и операций, требующихся для успешной
профессиональной деятельности с учетом приобретенного работниками опыта.
Определение нового, более сложного независимого критерия может базироваться на
исследовании статистического распределения и разброса показателей критерия в выборке
лиц, относительно которой проверяется В.п. методики.
При использовании критериев деятельности, определяемых субъективными методами
(напр., экспертной оценкой), необходимо избегать возникновения явления контаминации
критерия.
В ряде случаев текущая валидность заменяет В. п. Часто практически невыгодно слишком
затягивать валидизацию, изучая отдаленные критериальные меры тестируемого свойства
в обследуемой выборке валидизации. В качестве компромиссного решения для ускорения
процедуры валидизации тест может быть проведен на группе, для которой уже имеются
критериальные данные. Напр., результаты обследования студентов могут сравниваться с
данными об их успеваемости, данные тестирования служащих - с их успешностью в
деятельности. В отдельных случаях для быстрого получения сведений о пред-
сказательных возможностях можно воспользоваться ретроспективной валидиза-Цией (см.
Валидность критериальная). Так, для проверки того, в какой мере хорошие результаты
теста способное гей соответствуют быстрому обучению в какой-либо области, можно
сопоставить критериальные оценки (успеваемость, ретроспективные экспертные
заключения и т. д.) за период обследования и в текущий момент у лиц с высокими и
низкими оценками по тесту.
Одним из наиболее надежных способов получения сведений о прогностических
возможностях результата теста является метод <когорт>. Предположим, следует
проверить, насколько результат теста, предназначенного для изучения некоторых аспектов
эмоциональных состояний у больных предсказателей в отношении вероятности
возникновения психосоматических заболеваний, позволяет ли определенный результат по
этому тесту судить о повышенном риске подвергнуться таким расстройствам. Учитывая
вероятный объем экстремальных (контрастных) групп, выборка должна быть достаточно
большой. На основании эпидемиологических данных, напр., можно предположить, что
определенной болезнью в течение трех лет заболевает 57 человек из 1000. Тогда
превентивной диагностикой должно быть охвачено около 2000 человек, чтобы получить
численность группы заболевших порядка 100. Прогностические возможности в таком
случае будут подтверждаться исходя из значимости количественных различий в
результатах теста, проведенного в момент набора <когорт> из числа заболевших и
здоровых (Практикум по психодиагностике, 1984). Определение В. п. обязательно для пра-
вильного использования и интерпретации результатов большинства тестов. Глубокое
изучение этих характеристик необходимо для формулирования прогноза в ди-
агностическом заключении на основании данных методики, выявления значения
измеряемых тестом показателей в динамике развития изучаемых свойств и способностей.
Естественно, наибольшее значение критерий В. п. имеет для методик, прямо или косвенно
направленных на предсказание развития того или иного психологического свойства или
вида дея-
45
ВАЛ ____________________
тельности. К их числу в первую очередь относятся тесты общих способностей,
профориентационные методики, тесты отбора и т. д.
Важность показателей В. п. при анализе тестовых процедур, направленных на
отбор,подчеркивается введением специального понятия валидности инкре-ментной. Этот
показатель В. п. дает информацию о том, насколько улучшается процедура отбора с
применением данного теста по сравнению с традиционной(основывающейся лишь на
формальных сведениях о предыдущей деятельности, анализе документов личного дела,
беседах).
ВАЛИДНОСТЬ СОДЕРЖАТЕЛЬНАЯ - один из основных типов валидности методики,
характеризующий степень репрезентативности содержания заданий теста измеряемой
области психических свойств.
Комплекс сведений В. с. традиционно имеет наибольшее значение для тестов,
исследующих деятельность, близкую или совпадающую с реальной (чаще всего учебной
или профессиональной). Изучаемая деятельность носит,как правило,синтетический
характер, складывается из многих, подчас разнородных факторов (проявления личностных
особенностей, комплекс необходимых знаний и навыков, специфические способности и т.
д.). Поэтому одной из важнейших задач создания адекватной модели тестируемой дея-
тельности является подбор таких заданий, которые будут охватывать главные аспекты
изучаемого феномена в правильной пропорции к реальной деятельности в целом.
Валидность по содержанию закладывается в тест уже при подборе заданий будущей
методики. Первым этапом вали-дизации является определение круга исследуемых свойств
и видов деятельности, расчленение сложной способности или
деятельности на элементы. На втором этапе разрабатывают собственно модель тестовой
деятельности на основе наиболее важных элементов реальной деятельности. Наконец, на
последнем этапе проводят анализ степени соответствия разработанной модели реальной
деятельности, проверку соответствия пропорций представленноеT элементов в заданиях
теста и в реальной деятельности. Так, для тестов достижений по отдельным предметам
разработке конкретного содержания тестовых задач предшествуют полная си-
стематическая проверка соответствующих учебников и учебных программ, а также
консультации со специалистами по данному предмету. На основе собранной таким путем
информации составляют спецификацию теста, где указывают тестируемые области
содержания (темы), задачи (процессы) обучения, а также относительное значение каждой
темы и процесса для достижения целей обучения на данном этапе. Конкретные задания
оцениваются экспертами по принципу их близости к реальным требованиям. Эксперты вы-
носят суждения о том, охватывает ли тест репрезентативную выборку конкретных навыков
и знаний исследуемой области обучения.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159
раннее для текущей валидизации. Так, объективный показатель успешности
профессиональной деятельности к моменту отдаленного сопоставления может оказаться
слишком простым (напр.,
ВАЛ
если тест достижений при анализе его диагностической валидности сопоставляется с
успешностью выполнения самой простой сборочной операции, которая в момент
отдаленного сравнения хорошо усваивается практически всеми испытуемыми из выборки
валидизации). Более правильным будет сопоставление с новым уровнем независимого
критерия, комплексом более сложных навыков и операций, требующихся для успешной
профессиональной деятельности с учетом приобретенного работниками опыта.
Определение нового, более сложного независимого критерия может базироваться на
исследовании статистического распределения и разброса показателей критерия в выборке
лиц, относительно которой проверяется В.п. методики.
При использовании критериев деятельности, определяемых субъективными методами
(напр., экспертной оценкой), необходимо избегать возникновения явления контаминации
критерия.
В ряде случаев текущая валидность заменяет В. п. Часто практически невыгодно слишком
затягивать валидизацию, изучая отдаленные критериальные меры тестируемого свойства
в обследуемой выборке валидизации. В качестве компромиссного решения для ускорения
процедуры валидизации тест может быть проведен на группе, для которой уже имеются
критериальные данные. Напр., результаты обследования студентов могут сравниваться с
данными об их успеваемости, данные тестирования служащих - с их успешностью в
деятельности. В отдельных случаях для быстрого получения сведений о пред-
сказательных возможностях можно воспользоваться ретроспективной валидиза-Цией (см.
Валидность критериальная). Так, для проверки того, в какой мере хорошие результаты
теста способное гей соответствуют быстрому обучению в какой-либо области, можно
сопоставить критериальные оценки (успеваемость, ретроспективные экспертные
заключения и т. д.) за период обследования и в текущий момент у лиц с высокими и
низкими оценками по тесту.
Одним из наиболее надежных способов получения сведений о прогностических
возможностях результата теста является метод <когорт>. Предположим, следует
проверить, насколько результат теста, предназначенного для изучения некоторых аспектов
эмоциональных состояний у больных предсказателей в отношении вероятности
возникновения психосоматических заболеваний, позволяет ли определенный результат по
этому тесту судить о повышенном риске подвергнуться таким расстройствам. Учитывая
вероятный объем экстремальных (контрастных) групп, выборка должна быть достаточно
большой. На основании эпидемиологических данных, напр., можно предположить, что
определенной болезнью в течение трех лет заболевает 57 человек из 1000. Тогда
превентивной диагностикой должно быть охвачено около 2000 человек, чтобы получить
численность группы заболевших порядка 100. Прогностические возможности в таком
случае будут подтверждаться исходя из значимости количественных различий в
результатах теста, проведенного в момент набора <когорт> из числа заболевших и
здоровых (Практикум по психодиагностике, 1984). Определение В. п. обязательно для пра-
вильного использования и интерпретации результатов большинства тестов. Глубокое
изучение этих характеристик необходимо для формулирования прогноза в ди-
агностическом заключении на основании данных методики, выявления значения
измеряемых тестом показателей в динамике развития изучаемых свойств и способностей.
Естественно, наибольшее значение критерий В. п. имеет для методик, прямо или косвенно
направленных на предсказание развития того или иного психологического свойства или
вида дея-
45
ВАЛ ____________________
тельности. К их числу в первую очередь относятся тесты общих способностей,
профориентационные методики, тесты отбора и т. д.
Важность показателей В. п. при анализе тестовых процедур, направленных на
отбор,подчеркивается введением специального понятия валидности инкре-ментной. Этот
показатель В. п. дает информацию о том, насколько улучшается процедура отбора с
применением данного теста по сравнению с традиционной(основывающейся лишь на
формальных сведениях о предыдущей деятельности, анализе документов личного дела,
беседах).
ВАЛИДНОСТЬ СОДЕРЖАТЕЛЬНАЯ - один из основных типов валидности методики,
характеризующий степень репрезентативности содержания заданий теста измеряемой
области психических свойств.
Комплекс сведений В. с. традиционно имеет наибольшее значение для тестов,
исследующих деятельность, близкую или совпадающую с реальной (чаще всего учебной
или профессиональной). Изучаемая деятельность носит,как правило,синтетический
характер, складывается из многих, подчас разнородных факторов (проявления личностных
особенностей, комплекс необходимых знаний и навыков, специфические способности и т.
д.). Поэтому одной из важнейших задач создания адекватной модели тестируемой дея-
тельности является подбор таких заданий, которые будут охватывать главные аспекты
изучаемого феномена в правильной пропорции к реальной деятельности в целом.
Валидность по содержанию закладывается в тест уже при подборе заданий будущей
методики. Первым этапом вали-дизации является определение круга исследуемых свойств
и видов деятельности, расчленение сложной способности или
деятельности на элементы. На втором этапе разрабатывают собственно модель тестовой
деятельности на основе наиболее важных элементов реальной деятельности. Наконец, на
последнем этапе проводят анализ степени соответствия разработанной модели реальной
деятельности, проверку соответствия пропорций представленноеT элементов в заданиях
теста и в реальной деятельности. Так, для тестов достижений по отдельным предметам
разработке конкретного содержания тестовых задач предшествуют полная си-
стематическая проверка соответствующих учебников и учебных программ, а также
консультации со специалистами по данному предмету. На основе собранной таким путем
информации составляют спецификацию теста, где указывают тестируемые области
содержания (темы), задачи (процессы) обучения, а также относительное значение каждой
темы и процесса для достижения целей обучения на данном этапе. Конкретные задания
оцениваются экспертами по принципу их близости к реальным требованиям. Эксперты вы-
носят суждения о том, охватывает ли тест репрезентативную выборку конкретных навыков
и знаний исследуемой области обучения.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159