А.АНАСТАЗИ

А Б В Г Д Е Ж З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Э Ю Я AZ

Полученные показатели по двум частям теста коррелируются обыч-
ным методом. Нужно иметь в виду, однако, что эта корреляция в дей-
ствительности отражает надежность лишь половины теста. Например,
--.-.. "". rnn- nnn-r.n,,rr т,о iru norroiilitt тп i-rTT109 НАДЕЖНОСТЬ
для двух серий результатов, каждая из которых содержит только 50 за-
даний. В отличие от надежности этого типа, в ретестовой надежности,
и надежности взаимозаменяемых форм каждый показатель вычисляется
на основе общего числа заданий теста.
При прочих равных условиях, чем больше заданий содержит тест,
тем выше его надежность. Вполне оправданно ожидать, что чем обшир-
нее выборка поведения, тем адекватнее и согласованнее получаемые еди-
ницы измерения. Влияние увеличения или же сокращения теста на его
коэффициент надежности можно оценить посредством формулы Спирма-
на - Брауна:
l+(n-l)rii
где rii-исходное значение коэффициента надежности, Гц-его значение
после расширения или сокращения теста, а п -отношение нового числа
заданий к первоначальному. Так, если число заданий теста возросло с 25
до 100, топ равно 4, а если оно сократилось с 60 до 30, топ равно 1/2.
Формула Спирмана-Брауна широко используется для пересчета надеж-
ности, определенной по методу расщепления, и во многих руководствах
к тестам приводится уже пересчитанное значение. Поскольку переход от
расщепленного теста к его полной форме всегда означает удвоение числа
заданий, то эта формула принимает вид:
21
"~Ti
П.Ж. Рюлон (P.J. Rulon, 1939) предложил другой способ определе-
ния надежности методом расщепления. Для расчетов требуется знать
только дисперсию разностей между результатами каждого испытуемого
по обеим половинам теста (ст) и дисперсию суммарных результатов (ст).
Значения этих величин подставляются в формулу, определяющую надеж-
ность теста в целом:
.--
Интересно отметить связь между этой формулой и определением
дисперсии ошибки. Любая разность между результатами испытуемого
по двум половинам теста представляет собой случайную ошибку. Дис-
персия таких разностей, поделенная на дисперсию результатов, дает
долю дисперсии ошибки. Вычитая долю дисперсии ошибки из единицы,
мы получаем долю <истинной> дисперсии, которая и равна коэффициен-
ту надежности.
Метод Кьюдера-Ричардсона. Четвертый метод определения
надежности, также основайный на однократном предъявлении единствен-
ной формы теста, использует согласованность ответов по всем заданиям
теста. На согласованность этого рода влияют два источника дисперсии
ошибки: (1) выборка содержания на надежность взаимозаменяемых
форм и расщепления и (2) неоднородность исследуемой области поведе-
ния. Чем однороднее эта область, тем выше согласованность результа-
Увеличение числа заданий теста не повлияет, однако, на его временную стабиль-
110 ПРИНЦИПЫ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ
тов заданий теста. Например, если в одном тесте приведены задания
только на умножение, а в другом представлено сложение, вычитание, ум-
ножение и деление, то в первом тесте согласованность выполнения от-
дельных заданий будет, вероятно, большей, чем во втором. Во втором
более разнородном тесте один испытуемый может лучше справиться
с вычитанием, чем с другими действиями, другой покажет относительно
высокий результат в делении, но хуже проявит себя в сложении, вычита-
нии и умножении и т.д. Более контрастным примером однородности
и разнородности мог бы служить тест, состоящий из 40 заданий на пони-
мание слов, и тест, содержащий 10 словарных заданий, 10 заданий на
пространственные отношения, 10 на арифметическое мышление и 10 на
скорость восприятия. В последнем тесте связь между индивидуальным
выполнением различных типов заданий может быть незначительной или
полностью отсутствовать.
Очевидно, что чем однороднее тест, тем однозначнее его резуль-
таты. Предположим, что в последнем из только что упомянутых тестов
Смит и Джонс получили по 20 очков. Можем ли мы заключить, что
с этим тестом они справились одинаково? Совсем нет. Смит мог пра-
вильно ответить на 10 словарных вопросов, получить по очку за каждое
из заданий на скорость восприятия и не выполнить ни одного задания на
арифметическое рассуждение и пространственные отношения. Напротив,
20 очков Джонса могли распределиться таким образом: 5 за скорость
восприятия, 5 за пространственные отношения, 10 за арифметическое
рассуждение и 0 за словарь.
Суммарный показатель в 20 очков мог бы, конечно, означать и мно-
жество других сочетаний в выполнении заданий. Вместе с тем в более
однородном словарном тесте показатель 20 будет, вероятно, означать,
что испытуемый правильно указал значение примерно 20 первых слов,
если слова расположены в порядке возрастания трудности. Он мог оши-
биться в отношении двух-трех сравнительно легких слов, дать пра-
вильный ответ по более трудным словам, расположенным под номера-
ми, большими 20, но такие индивидуальные колебания ничтожны по
сравнению с теми, которые присущи разнородному тесту.
Весьма существенным в этой связи является вопрос: насколько
однороден сам критерий, на предсказание которого направлен тест? Хо-
тя однородные тесты могут предпочитаться, поскольку их показатели
допускают довольно однозначную интерпретацию, но однородный тест
сам по себе, очевидно, непригоден для предсказания весьма неоднород-
ного критерия. Более того, при предсказании неоднородного критерия
разнородность заданий теста не обязательно означала бы дисперсию
ошибки. Хорошим примером разнородных тестов, предназначенных для
предсказания неоднородного критерия, являются традиционные тесты
интеллекта. В подобных случаях весьма желательно составить несколько
относительно однородных тестов, каждый из которых измерял бы раз-
личные фазы неоднородного критерия. Тем самым однозначная интер-
претация результатов теста могла бы сочетаться с адекватным охватом
критерия.
Самая распространенная процедура определения согласованности
выполнения заданий теста была разработана Г. Ф. Кьюдером и М. В. Ри-
чардсоном (G.F. Kuder, M.W. Richardson, 1937). Как и в методе расще-
Ill НАДЕЖНОСТЬ
двух половин теста для анализа используются данные о выполнении ис-
пытуемыми каждого задания. Из различных формул, приведенных в ука-
занной статье, широко применяется так называемая формула 20:
п(о} - ?то)
"=-т).г
В этой формуле Гц - коэффициент надежности всего теста, п -число
заданий, <-стандартное отклонение суммарных показателей теста.
Единственным новым элементом в этой формуле является сумма Е д, где
р и q -доля испытуемых, соответственно справившихся и не справивших-
ся с каждым заданием.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143

ПОИСК КНИГ
ТОП лучших авторов книг Либока

ТВОРЧЕСТВО

ПОЗНАНИЕ

А.АНАСТАЗИ