НАДЕЖНОСТЬ ЧАСТЕЙ ТЕСТА-
характеристика надежности психодиагностической методики,получаемая путем анализа
устойчивости результатов отдельных совокупностей тестовых задач или единичных
пунктов (заданий) теста.
Наиболее простым и распространенным способом определения Н.ч.т. является метод
расщепления, суть которого заключается в выполнении испытуемым заданий двух
равноценных частей теста. "основанием метода является вывод о м, что при
нормальном или близком к ""рмальному распределении оценок по полному тесту (см.
Нормальное распре-вление) выполнение любого случайного
набора из частей теста даст аналогичное распределение (при условии, что части
однородны по характеру заданий по отношению к тесту в целом).
Для оценки надежности методом расщепления выбирают две эквивалентные по характеру
и степени трудности группы задач (см. Внутренняя согласованность, Трудность заданий
теста). Разделение объема заданий теста на сопоставимые части достигается:
- распределением заданий на четные и нечетные (в том случае, если задания в тесте
строго ранжированы по степени субъективной трудности);
- распределением пунктов по принципу близости или равенства значений индексов
трудности и дискриминативно-сти (см. Дискриминативность заданий теста). Такой принцип
разделения пригоден для тестов достижений, в которых обязателен ответ испытуемых на
все пункты;
- распределением задач по времени решения каждой из частей (для тестов
скорости).
Для испытуемых в выборке определения надежности (раздельно для каждой из частей
теста) вычисляются оценки успешности решений, среднеквадратические отклонения
первого и второго рядов оценок и коэффициенты корреляции сравниваемых рядов.
Естественно, эти коэффициенты будут характеризовать надежность лишь половины теста.
Уравнение Спирмена-Брауна отражает влияние изменения количества заданий на
коэффициент надежности теста:
г, =
пг
1+(л-1)г/
где r - коэффициент надежности для полного объема заданий, г1, - его значение после
изменения числа заданий, п - отношение нового числа заданий к первоначальному (если
число заданий полного
201
НАД ------------------
теста - 100, а его части, полученной методом расщепления на половины, - 50, то п =
0,5). Отсюда для полного теста:
< -
2г;
1+г/
Приведенные формулы справедливы для случаев равных стандартных отклонений обеих
половин теста (ст; = ст)- Если СГ(1 отличается от сг, для определения коэффициента
надежности применяется формула Фланагана:
4ст.,су,,г/
Этот же показатель для малых выборок рассчитывается по формуле Кристофа:
г, =
2 п-3
п-\ п-\
При определении г; целого теста можно воспользоваться формулой Рюлона:
л-1
Ч ~1 ~Г
х где oi - дисперсия разностей между результатами каждого испытуемого по двум
половинам теста, <з\ - дисперсия суммарных результатов. В данном случае коэффициент
надежности рассчитывается как доля <истинной> дисперсии результатов теста (см.
Надежность, Ошибка измерения).
При расщеплении тестов скорости применяется особая процедура группировки заданий.
Определяется минимальное время (t) решения целого теста, затем отсчитываются
ло..ув1!ча и четвертая часть этого времени. Все испытуемые работают половину
минимального времени, после чего ставят отметку против задания, выполняемого в
момент подачи сигнала, и продолжают работать еще четверть минимального времени.
Коэффициент надежности в этом случае будет соответствовать степени корреляции между
числом задач, решенных до первого сигнала (0,5( . ) и решенных за время между первым и
вторым сигналами (0,25<).
Разделение заданий теста на равноценные половины является лишь частным случаем Н.
ч. т. Вполне возможно расщепление на три, четыре и более частей. В предельном случае
число частей равно числу пунктов. При этом для определения надежности применяют
анализ внутренней согласованности.
При разделении всего набора заданий теста на любое количество групп для правильного
определения Н. ч. т., как уже указывалось выше, должно соблюдаться требование
равноценности таких групп. Поэтому при вычислении коэффициента надежности методом
анализа внутренней согласованности отобранные задания теста должны быть в высокой
степени однородны по содержанию и трудности (гомогенны). При гетерогенных задачах
значения г, ниже истинных.
Наиболее распространенным методом оценки надежности отдельных заданий является
вычисление коэффициента Кью-дера-Ричардсона:
f -"
Р
Га2
2ст,
aJ-Spg 2о2 ,
где о - дисперсия первичных оценок теста, р - индекс трудности, выраженный
в виде доли - (см. Трудность заданий
i UU
теста), q = 1 - р, г- коэффициент дискриминации (см. Дискриминатив-ность заданий
теста).
В целях упрощения вычисления может быть применена формула Гуликсена:
1-
Это уравнение может быть упрощено следующим образом:
г, =
k-\[
1-
T,pq
При отсутствии коэффициента дискриминации применим вариант формулы Кьюдера-
Ричардсона:
г, =
k f-Spg
k-\[ (Т2 ,
Пример вычислений г< по методу Кьюдера-Ричардсона приведен в табл. 17.
Предложенные выше формулы для определения коэффициента надежности пригодны для
случаев, когда задания оцениваются в дихотомической шкале (см. Шкалы измерительные)
по принципу <выполнено-не выполнено>. Для случаев с более дифференцированной
оценкой применима формула коэффициента альфа:
_п(-)
(п-Н
где Ест. - сумма дисперсий результатов отдельных заданий.
В практике психологической диагностики считается, что тест надежен, если >0,6.
-----------------НАД
Коэффициент надежности обладает доверительным интервалом,определение которого
особенно важно в связи с большим количеством факторов, способных влиять на его
значение. Доверительный интервал для г; определяется как
Er=Z,
где Or - стандартная ошибка коэффициента надежности сг,,
,п-3
-(г)
преобразование Фишера -In +rt-2 l-r,
(определяется по статистическим таблицам). На практике применяется только нижняя
граница /< (Z", при у = 0,05 составляет 1,96, при а =0,01 -2,58).
Характеристика надежности по типу Н. ч. т. имеет серьезные преимущества по сравнению
с надежностью ретестовой и надежностью параллельных форм, главным образом
благодаря отсутствию необходимости в повторном обследовании. Таким образом,
снимается влияние многих посторонних факторов, в частности тренировки, запоминания
решений и т. д. Это обстоятельство определяет широкое распространение методов
характе-
Определение коэффициента надежности методом Кыодера-(п = 50; ст = 8,01; k = 16)
Таблица 17 -Ричардсона
Номе
р
Число лиц,
задач
и
решивших
задачу
Р
q
РЧ
Вычисление
1
48 0,96 0,04 0,04
2
43 0,86 0,14 0,12 =--х 1- =
3
33 0,66 0,34 0,22 k-\ \- ax
4
39 0,78 0,22 0,17
5
28 0,56 0,44 0,25 fi-2551=072
151, 8,01 J
где k - число заданий в тесте.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159