Поскольку эти меры могут относиться к различным свойствам или
комбинациям свойств, не удивительно, что коэффициенты валидности
для одного и того же теста неодинаковы. Когда различные крите-
риальные меры получают на одних и тех же испытуемых, их взаимокор-
реляция весьма низка. Например, может оказаться, что между числом
несчастных случаев или количеством невыходов на работу и производи-
тельностью или частотой допускаемых ошибок не будет обнаружено
практически никакой связи (S. E. Seashore, В. P. Indik, В. S. Georgopoulos,
1960). Эти различия, конечно, отражаются на коэффициентах валидности
любого данного теста по отношению к различным критериальным ме-
рам. Так, результаты теста могут не коррелировать значимо с оценками
профессиональных навыков мастером и тем не менее оказаться валидны-
ми относительно более поздних данных ухода с работы или продвиже-
ния по службе (L.E. Albright, W..Т. Smith, J.R. Glennon, 1959).
Ввиду комплексности критерия валидация теста относительно слож-
ного критерия профессиональных навыков, академической успеваемости
и других аналогичных показателей часто представляет сомнительную
ценность и обладает лишь локальной значимостью. В случае относитель-
139 ВАЛИДНОСТЬ. ОСНОВНЫЕ понятия
ной независимости различных критериев более эффективна валидация те-
ста относительно того аспекта критерия, на который этот тест ориенти-
рован в первую очередь. Анализ этих более специфических соотношений
осмысляет тестовые показатели с точки зрения многомерности крите-
риального поведения (М. D. Dunnette, 1963; R. L. Ebel, 1961; S. R. Wallace,
1965). Например, один тест может хорошо прогнозировать скорость во-
сприятия клерка и точность выполнения мелкой работы, другой-гра-
мотность его письма, третий-способность сосредоточиться на выполня-
емой работе и т.д.
Возвращаясь к практическим вопросам оценки теста или комбина-
ции тестов как средства прогнозирования комплексного критерия (ска-
жем, успеха в работе), мы сталкиваемся с необходимостью проведения
конкретной валидации для каждой частной ситуации и повторения ее че-
рез короткие промежутки времени. Это считается желательным и часто
рекомендуется в руководствах к тестам. В большинстве случаев, однако,
следовать таким предписаниям не удается. Даже если мы располагаем
хорошо подготовленным персоналом, большинство валидационных ис-
следований, осуществляемых в условиях производства, часто оказывают-
ся неудовлетворительными минимум по трем причинам. Во-первых,
трудно получить надежные и достаточно полные критериальные данные.
Во-вторых, число работников, выполняющих одну и ту же или близкие
функции на одном предприятии, часто слишком мало для получения ста-
тистически значимых результатов. В-третьих, корреляция, как правило,
снижается ввиду ограниченного разброса показателей, что объясняется
предварительным отбором: фактически испытуемыми оказываются
лишь те, кто был принят на работу.
В силу перечисленных обстоятельств среди психологов, занимаю-
щихся проблемами кадров, проявляется растущий интерес к так называе-
мой синтетической валидности. Это понятие было введено Ч. X. Лоши
(С.Н. Lawshe, 1952) и определено М. Балмой как <установление валидно-
сти в конкретных условиях на основе систематического анализа элемен-
тов деятельности, определение по этим элементам валидности теста
и объединение составляющих валидностей в единый показатель>
(M.J.Balma, 1959, р. 395). Были разработаны методы сбора необхо-
димых эмпирических данных и получения из них значения синтетической
валидности для частного комплексного критерия (R.M. Guion, 1965;
С.Н. Lawshe, M.J. Balma, 1966, гл. 14; E.J. McCormick, 1959; E.S. Prirnoff,
1959; 1975). По сути дела весь процесс складывается из трех этапов: (1)
детальный анализ деятельности для выделения ее элементов и определе-
ния их относительных весов; (2) анализ и экспериментальное исследова-
ние каждого теста для выяснения того, в какой степени он измеряет на-
выки в выполнении каждого из выделенных элементов деятельности; (3)
определение валидности каждого теста путем синтеза весов отдельных
элементов в деятельности и в тесте.
В результате длительного исследования лиц, поступавших на работу
в Гражданскую службу США, Э.С. Примов (E.S. Prirnoff, 1975) вывел так
называемый J-коэффициент-показатель синтетической валидности. Про-
цедура его получения предусматривает, в частности, список элементов
деятельности, записанных на языке профессиональных действий, и оцен-
ку относительной важности этих элементов куратором работы или мето-
дистом. На выборках из всей совокупности подавших заявление (т. е. без
ттг>г>уг<-пцця птбопа) опоеделяются коэффициенты корреляции между
140 ПРИНЦИПЫ ПСИХО.ЮГИЧЕСКОГО ТЕСТИРОВАНИЯ
результатами тестов и самооценкой элементов деятельности. Приме-
няются различные меры для повышения стабильности корреляции и ве-
сов, вычисленных на основе самооценок, а также для обеспечения надле-
жащего учета критериев. С этой целью исследуются различные выборки
испытуемых. Окончательная оценка корреляции между тестом и выпол-
нением деятельности определяется на основе корреляции каждого эле-
мента с конкретной деятельностью и весов тех же самых элементов
в данном тестер Как выяснилось, J-коэффициент позволил повысить
шансы приема на работу представителей различных меньшинств и лиц
с низким образовательным цензом, поскольку он ориентирован на навы-
ки, существенные для выполнения работы (E.S. Prirnoff, 1975).
Иное использование синтетической валидности, особенно пригодное
для небольших фирм, в которых тот или иной вид работы выполняется
небольшим числом сотрудников, описано Р. М. Гюйоном (R. М. Guion,
1965). Исследование было проведено на предприятии со штатом из 48 со-
трудников, каждый из которых выполнял обязанности, отличные от обя-
занностей остальных. Детальный анализ этих обязанностей тем не менее
выявил 7 элементов, общих для многих видов работ. Каждому сотрудни-
ку давались оценки по всем элементам его деятельности, и эти оценки
сопоставлялись с его результатами по каждому тесту батареи профес-
сиональных качеств. На основе такого анализа для каждого вида работы
удалось синтезировать свою батарею, состоящую из двух тестов, наилуч-
ших с точки зрения их корреляции с элементами соответствующей дея-
тельности. Когда составленные таким путем батареи были проверены
при приеме 13 новых сотрудников, результаты оказались весьма обнаде-
живающими. Ввиду малого количества изученных случаев данные этого
исследования носят предварительный характер и лишь указывают на
возможность применения синтетической валидности.
Эти два примера синтетической валидности приведены единственно
с целью проиллюстрировать область применения данного метода.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143
комбинациям свойств, не удивительно, что коэффициенты валидности
для одного и того же теста неодинаковы. Когда различные крите-
риальные меры получают на одних и тех же испытуемых, их взаимокор-
реляция весьма низка. Например, может оказаться, что между числом
несчастных случаев или количеством невыходов на работу и производи-
тельностью или частотой допускаемых ошибок не будет обнаружено
практически никакой связи (S. E. Seashore, В. P. Indik, В. S. Georgopoulos,
1960). Эти различия, конечно, отражаются на коэффициентах валидности
любого данного теста по отношению к различным критериальным ме-
рам. Так, результаты теста могут не коррелировать значимо с оценками
профессиональных навыков мастером и тем не менее оказаться валидны-
ми относительно более поздних данных ухода с работы или продвиже-
ния по службе (L.E. Albright, W..Т. Smith, J.R. Glennon, 1959).
Ввиду комплексности критерия валидация теста относительно слож-
ного критерия профессиональных навыков, академической успеваемости
и других аналогичных показателей часто представляет сомнительную
ценность и обладает лишь локальной значимостью. В случае относитель-
139 ВАЛИДНОСТЬ. ОСНОВНЫЕ понятия
ной независимости различных критериев более эффективна валидация те-
ста относительно того аспекта критерия, на который этот тест ориенти-
рован в первую очередь. Анализ этих более специфических соотношений
осмысляет тестовые показатели с точки зрения многомерности крите-
риального поведения (М. D. Dunnette, 1963; R. L. Ebel, 1961; S. R. Wallace,
1965). Например, один тест может хорошо прогнозировать скорость во-
сприятия клерка и точность выполнения мелкой работы, другой-гра-
мотность его письма, третий-способность сосредоточиться на выполня-
емой работе и т.д.
Возвращаясь к практическим вопросам оценки теста или комбина-
ции тестов как средства прогнозирования комплексного критерия (ска-
жем, успеха в работе), мы сталкиваемся с необходимостью проведения
конкретной валидации для каждой частной ситуации и повторения ее че-
рез короткие промежутки времени. Это считается желательным и часто
рекомендуется в руководствах к тестам. В большинстве случаев, однако,
следовать таким предписаниям не удается. Даже если мы располагаем
хорошо подготовленным персоналом, большинство валидационных ис-
следований, осуществляемых в условиях производства, часто оказывают-
ся неудовлетворительными минимум по трем причинам. Во-первых,
трудно получить надежные и достаточно полные критериальные данные.
Во-вторых, число работников, выполняющих одну и ту же или близкие
функции на одном предприятии, часто слишком мало для получения ста-
тистически значимых результатов. В-третьих, корреляция, как правило,
снижается ввиду ограниченного разброса показателей, что объясняется
предварительным отбором: фактически испытуемыми оказываются
лишь те, кто был принят на работу.
В силу перечисленных обстоятельств среди психологов, занимаю-
щихся проблемами кадров, проявляется растущий интерес к так называе-
мой синтетической валидности. Это понятие было введено Ч. X. Лоши
(С.Н. Lawshe, 1952) и определено М. Балмой как <установление валидно-
сти в конкретных условиях на основе систематического анализа элемен-
тов деятельности, определение по этим элементам валидности теста
и объединение составляющих валидностей в единый показатель>
(M.J.Balma, 1959, р. 395). Были разработаны методы сбора необхо-
димых эмпирических данных и получения из них значения синтетической
валидности для частного комплексного критерия (R.M. Guion, 1965;
С.Н. Lawshe, M.J. Balma, 1966, гл. 14; E.J. McCormick, 1959; E.S. Prirnoff,
1959; 1975). По сути дела весь процесс складывается из трех этапов: (1)
детальный анализ деятельности для выделения ее элементов и определе-
ния их относительных весов; (2) анализ и экспериментальное исследова-
ние каждого теста для выяснения того, в какой степени он измеряет на-
выки в выполнении каждого из выделенных элементов деятельности; (3)
определение валидности каждого теста путем синтеза весов отдельных
элементов в деятельности и в тесте.
В результате длительного исследования лиц, поступавших на работу
в Гражданскую службу США, Э.С. Примов (E.S. Prirnoff, 1975) вывел так
называемый J-коэффициент-показатель синтетической валидности. Про-
цедура его получения предусматривает, в частности, список элементов
деятельности, записанных на языке профессиональных действий, и оцен-
ку относительной важности этих элементов куратором работы или мето-
дистом. На выборках из всей совокупности подавших заявление (т. е. без
ттг>г>уг<-пцця птбопа) опоеделяются коэффициенты корреляции между
140 ПРИНЦИПЫ ПСИХО.ЮГИЧЕСКОГО ТЕСТИРОВАНИЯ
результатами тестов и самооценкой элементов деятельности. Приме-
няются различные меры для повышения стабильности корреляции и ве-
сов, вычисленных на основе самооценок, а также для обеспечения надле-
жащего учета критериев. С этой целью исследуются различные выборки
испытуемых. Окончательная оценка корреляции между тестом и выпол-
нением деятельности определяется на основе корреляции каждого эле-
мента с конкретной деятельностью и весов тех же самых элементов
в данном тестер Как выяснилось, J-коэффициент позволил повысить
шансы приема на работу представителей различных меньшинств и лиц
с низким образовательным цензом, поскольку он ориентирован на навы-
ки, существенные для выполнения работы (E.S. Prirnoff, 1975).
Иное использование синтетической валидности, особенно пригодное
для небольших фирм, в которых тот или иной вид работы выполняется
небольшим числом сотрудников, описано Р. М. Гюйоном (R. М. Guion,
1965). Исследование было проведено на предприятии со штатом из 48 со-
трудников, каждый из которых выполнял обязанности, отличные от обя-
занностей остальных. Детальный анализ этих обязанностей тем не менее
выявил 7 элементов, общих для многих видов работ. Каждому сотрудни-
ку давались оценки по всем элементам его деятельности, и эти оценки
сопоставлялись с его результатами по каждому тесту батареи профес-
сиональных качеств. На основе такого анализа для каждого вида работы
удалось синтезировать свою батарею, состоящую из двух тестов, наилуч-
ших с точки зрения их корреляции с элементами соответствующей дея-
тельности. Когда составленные таким путем батареи были проверены
при приеме 13 новых сотрудников, результаты оказались весьма обнаде-
живающими. Ввиду малого количества изученных случаев данные этого
исследования носят предварительный характер и лишь указывают на
возможность применения синтетической валидности.
Эти два примера синтетической валидности приведены единственно
с целью проиллюстрировать область применения данного метода.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143