ТВОРЧЕСТВО

ПОЗНАНИЕ

А  Б  В  Г  Д  Е  Ж  З  И  Й  К  Л  М  Н  О  П  Р  С  Т  У  Ф  Х  Ц  Ч  Ш  Щ  Э  Ю  Я  AZ

 

е. равна 1. Но такая корреляция, однако, явно завышена и не
дает никакой информации о надежности теста.
Проверка процедур, используемых при определении надежности ме-
тодом расщепления и по формуле Кьюдера-Ричардсона, показала, что
обе они основаны на согласованности числа ошибок. Если же различия
индивидуальных тестовых результатов определяются не ошибками,
а скоростью, то и мера их надежности должна, очевидно, основываться
на согласованности заданий на скорость. Когда же выполнение теста за-
nwru-г пгтнпнпомйннп пт скоппсти и возможностей выполнения, то коэ(Ь-
116 ПРИНЦИПЫ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ
вления теста, окажутся ниже 1,00, но все еще будут завышенными. Такие
коэффициенты надежности не поддаются адекватной интерпретации, по-
скольку на индивидуальные различия в тестовых результатах заметное
влияние оказывает скорость выполнения заданий.
Какие же процедуры определения надежности пригодны для тестов
с выраженным скоростным компонентом? Такими процедурами могли
бы быть метод ретеста (если его удается применить) и метод взаимоза-
меняемых форм. Можно воспользоваться и методом расщепления при
условии, что задания теста расчленяются по временным характеристи-
кам, а не по порядковым номерам. Иными словами, сравниваемые ре-
зультаты должны быть получены временным разделением частей теста.
Одним из способов такого разделения является применение двух эквива-
лентных частей теста с разделенным временным ограничением. Напри-
мер, четные и нечетные задания распечатываются на разных листах, и по
каждому набору заданий устанавливается временной лимит, равный по-
ловине лимита для всего теста. Такая процедура равносильна проведе-
нию следующих друг за другом двух эквивалентных форм теста. Каждая
форма, однако, вдвое короче целого теста, тогда как результаты испы-
туемого определяются по всему тесту. Поэтому необходимо воспользо-
ваться формулой Спирмана-Брауна или какой-либо другой формулой
этого типа для определения надежности всего теста.
Если раздельное применение двух половин теста недопустимо, то
вместо него можно воспользоваться разделением полного времени теста
на четыре части с регистрацией результатов отдельно для каждой че-
тверти. Это легко осуществить, прося испытуемого по сигналу экспери-
ментатора отметить крестиком выполняемое в этот момент задание.
Число заданий, выполненных за первую и четвертую части полного вре-
менного лимита, составит результат по одной из сравниваемых половин
теста. Показатель другой половины теста будет равен числу заданий,
с которыми испытуемый справился за вторую и третью четверти. Такая
комбинация четвертей способствует нейтрализации кумулятивных эффек-
тов тренировки, утомления и других факторов. Этот метод лучше всего
подходит для тестов, задания которых не особенно отличаются друг от
друга по степени трудности.
В каких случаях временной компонент следует считать суще-
ственным? При каких условиях нужно соблюдать рассмотренные выше
меры предосторожности? Очевидно, само по себе использование лими-
тов времени еще не означает, что мы имеем дело с тестом на скорость.
Если все испытуемые укладываются в отведенное время, то скорость ра-
боты не сказывается на показателях. В качестве приблизительной меры
существенности скоростного компонента, казалось бы, можно взять про-
цент испытуемых, не успевающих закончить тест. Однако даже если ник-
то не укладывается в отведенные временные рамки, скорость выполне-
ния может оказаться тут ни при чем. Например, если все испытуемые
выполнят 40 заданий из 50, то индивидуальные различия в скорости от-
сутствуют, хотя никто не успевает выполнить весь тест.
Существенным здесь оказывается следующий вопрос: <В какой сте-
пени индивидуальные различия в тестовых результатах определяются
скоростью?> Или более специальным языком: <Какую долю в суммар-
ной дисперсии тестовых показателей составляет дисперсия скорости?>
Эту долю можно приблизительно оценить, определяя диспеосию числа
117
НАДЕЖНОСТЬ
Таблица II
Коэффициенты надежности четырех тестов элемен-
тарных умственных способностей для детей 11-17
лет (1-е издание) (A. Anastasi, J. Drake, 1954)
дисперсию тестовых результатов (ст/ст). Для только что приводившего-
ся примера, когда все испытуемые выполнили 40 заданий, числитель
этой дроби равен нулю, поскольку отсутствуют индивидуальные разли-
чия в числе выполненных заданий (с = 0). Таким образом, в тесте воз-
можностей данный индекс будет равен нулю. Напротив, если суммарная
дисперсия теста (of) определяется индивидуальными различиями в ско-
рости, то обе дисперсии будут равны и их отношение обратится в 1. Для
определения этого отношения разработано несколько более совер-
шенных процедур, но их детальное обсуждение выходит за рамки на-
стоящей книги (L.J.Cronbah, W.G.Warrington, 1951; H.Gulliksen,
1950a,b; L. Guttaman, 1955; G.C. Helmstadter, D.H. Ortmeyer, 1953).
Примером влияния скоростного компонента на коэффициент надеж-
ности, определенный при одноразовом предъявлении теста, могут слу-
жить данные исследования первого издания теста элементарных ум-
ственных способностей (A. Anastasi, J. Drake, 1954). В этой работе
надежность каждого теста сначала определялась по методу расщепления
теста на четные и нечетные задания. Полученные значения (см. первую
строку табл. II) оказались весьма близкими к приведенным в руковод-
стве к тексту. Затем коэффи-
циенты надежности были вы-
числены корреляцией показа-
телей, полученных разделе-
нием теста на два субтеста,
для которых были установле-
ны отдельные лимиты време-
ни. Эти коэффициенты соста-
вили вторую строку табл. II.
Вычисление <скоростных ин-
дексов> показало, что в тесте
на понимании слов преобла-
дает компонент возможнос-
тей, тогда как тест на рас-
суждение в большей мере
подвержен влиянию скорос-
ти. Из табл. II видно, что
при учете скоростного ком-
понента надежность теста на
пространственное восприя-
тие составила 0,75, т. е. оказалась значительно ниже значения 0,90, полу-
ченного методом обычного расщепления. Надежность теста на рассужде-
ние упала с 0,96 до 0,87, а числового теста-с 0,92 до 0,83. В то же время
надежность теста на понимание слов, содержавшего лишь минимальный
скоростной компонент, почти не отличалась для обоих методов расчета.
К соображениям самой А. Анастази следует добавить, что в этих случаях решение
о введении <скоростного фактора> принимается чисто эмпирически. Так, в детских тестах
Векслера (WISC, WISC-R) время выполнения вербальных субтестов не ограничивается,
в то время как для субтестов действия указаны временные лимиты.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143