ТВОРЧЕСТВО

ПОЗНАНИЕ

А  Б  В  Г  Д  Е  Ж  З  И  Й  К  Л  М  Н  О  П  Р  С  Т  У  Ф  Х  Ц  Ч  Ш  Щ  Э  Ю  Я  AZ

 

Это достигается формулированием гипотез о резуль-
татах теста в свете всего того, что известно об этой переменной.
Таким образом, конструктная валидность включает в себя все подхо-
ды к определению валидности, перечисленные выше.
Понятие конструктной валидности можно, вероятно, лучше всего
пояснить на следующем примере. Ниже я формулирую гипотезы,
подлежащие проверке при установлении конструктной валидности
теста оральных черт личности - The Oral Pessimism Questionnaire
(OPQ), разработанного автором (Kline, 1978).
(1) OPQ будет коррелировать положительно, но умеренно (ввиду
их невысокой эффективности) с другими тестами, направленными на
выявление оральных черт личности.
(2) Из описания синдрома "орального пессимизма" должна на-
блюдаться умеренная корреляция с нейротизмом.
(3) Поскольку 16-факторный личностный опросник Кэттелла не
предназначен для измерения параметров, подобных данному синдро-
му, то с этим опросником не должно быть никаких корреляций.
(4) Поскольку OPQ является личностным тестом, не должно быть
значимых корреляций с переменными способностей или мотивов.
Отметим, что последняя гипотеза иллюстрирует необходимость
показывать, при исследовании конструктной валидности, чего тест
не измеряет, наряду с тем, что он измеряет.
Если все эти гипотезы получат подтверждение их истинности,
тогда все же может показаться спорным, что продемонстрирована
конструктная валидность теста OPQ как средства измерения сово-
купности личностных черт, определяемых как "оральный песси-
мизм" . Дальнейший, более непосредственный способ продемонстри-
ровать валидность теста может состоять в формулировании пятой
гипотезы, а именно, что испытуемые, имеющие высокую выражен-
ность измеряемых черт личности, покажут по OPQ более высокие
показатели, чем те, у которых она низкая.
29
Таким образом, конструктная валидность - это мощный метод
демонстрации валидности тестов, для которых установление единст-
венного критерия их обоснованности является затруднительным.
Вместо одного результата мы должны учитывать одновременно мно-
жество результатов.
С конструктной валидностью связана одна проблема, которую
следует упомянуть. Речь идет об элементах субъективности, вовле-
каемых в интерпретацию результатов по изучению конструктной
валидности. В этом случае (как это обычно и случается на практике),
когда эти результаты недостаточно однозначны, многое зависит от
мастерства, уровня развития интерпретативных навыков разработ-
чика тестов.
Заключение
Были описаны разнообразные способы установления валидности
тестов; некоторые из них коренным образом отличаются друг от
друга. Так, конструктная валидность тесно связана с нашим опреде-
лением валидного теста как теста, измеряющего то, для измерения
чего он предназначен. Это, вероятно, наиболее важный аспект валид-
ности, особенно, если тесты должны использоваться для расширения
области психологических знаний. С помощью дифференциальной
валидности устанавливается обоснованность теста для некоторых ча-
стных случаев. Это иное использование термина "валидность", кото-
рое отражает особенности его использования. Однако, в практиче-
ских приложениях тестов этот аспект валидности чрезвычайно ва-
жен.
Из обсуждения должно быть также понятно, что не может быть
какого-либо единственного показателя, демонстрирующего валид-
ность теста. Для полной ее проверки следует учитывать множество
получаемых показателей. Несмотря на это, для многих тестов (хотя
это лишь небольшая часть из общего их количества) была показана
высокая валидность и концептуальная, как в случае конструктной
валидности, и для практических целей. Более того, как это станет
ясно из дальнейшего изложения, валидность теста может фактически
гарантироваться логически обоснованными методами конструирова-
ния тестов.
Дискриминативность
Еще одной особенностью эффективных тестов является дискри-
минативность. Действительно, достижение удовлетворительного рас
пределения показателей является одной из целей разработчика тес-
та. Нет необходимости подчеркивать то, что является очевидным:
30
какова ценность психологического теста, по которому все испытуе-
мые показали одинаковые результаты? При помощи тщательного
конструирования теста можно обеспечить соответствующий уровень
дискриминативности, а это именно то, в чем тесты значительно вы-
игрывают по сравнению с другими формами испытаний. В общем,
было обнаружено, что в оценке может быть использовано около де-
вяти градаций (см. Vernon, 1950), а в опросах, вероятно, наиболее
эффективно использовать три градации: нижесреднего, средний уро-
вень и выше среднего. Подобно этому, шкалы ранжирования редко
содержат более девяти градаций. Это означает, что испытуемые раз-
биваются в лучшем случае на девять групп. Это проявляется как
недостаток по сравнению с психометрическим тестом, в котором по-
казатели могут иметь крайне широкий разброс и могут давать эффек-
тивно обрабатываемые значения стандартных показателей от 20 до
80, с крайними показателями некоторых испытуемых, выходящими
за эти пределы. Дискриминативность измеряется показателем дельта
Фергюсона и принимает максимальное значение при равномерном
(прямоугольном) распределении показателей ( Прежде, чем завершить обсуждение надежности, валидности и
дискриминативности, я кратко опишу модель измерения, в неявном
виде подразумевавшуюся во всей предыдущей дискуссии. Даже бег-
лое знакомство с этой моделью прольет свет на внутреннюю природу
конструирования тестов. Она также обеспечивает обоснованную ста-
тистическую базу для вычислений и процедур конструирования тес-
тов, рассматриваемых в данной книге.
Классическая теория погрешностей измерения
Замечание: Этот раздел о классической теории погрешностей из-
мерения - единственный в данной книге, который содержит матема-
тические формулы, а приведенные математические сведения содер-
жат лишь минимальный объем понятий, необходимый для изучения
предмета. Как я указывал, они приведены здесь, чтобы обеспечить
разумное объяснение статистических процедур конструирования те-
стов. Если они покажутся вам слишком утомительными, можно опу-
стить этот раздел или использовать его как справочный, когда воз-
никнет необходимость иметь дело с этими процедурами на практике.
Не очень настойчивые читатели могут перейти прямо к чтению главы
2.
Теория погрешностей измерения, которая здесь описана, названа
классической, поскольку она была разработана исходя из наиболее
простых предположений, которые делались создателями тестов с са-
мого начала использования тестирования.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96