Название метода связано с
тем, что сравниваются две альтернативные серии объектов X, имеющие условные
значения 0 или 1 по У.
Наиболее характерно применение коэффициентов К. б. в психологической диагностике при
анализе дискримина-тивности заданий теста, а также при определении валидности
критериальной путем коррелирования значений тестовых оценок с независимыми характе-
ристиками критерия, выраженными в дихотомической шкале (см. Шкалы измерительные).
Для описания связи между перечисленными видами переменных используется точечный
бисериальный коэффициент корреляции Пирсона:
где х, - среднее по Х объектов со значением единицы по У; XQ - среднее по Х
КОР
объектов со значением нуль по У: S - стандартное отклонение всех значений по X; га; -
число объектов, с единицей по У:
пу- число объектов с нулем по У, т. е. п = П) + n.Q. Уравнение для вычисления rpi,
представляет собой алгебраическое упрощение формулы коэффициента г (см.
Корреляционный анализ) для случая, когда У- дихотомическая переменная. Можно
привести ряд других эквивалентных выражений, удобных для практического применения:
ръ-
где х - общее среднее по X.
Значение г.д варьирует от -1 до +1. В том случае, когда переменные с единицей по У
имеют среднее по X, равное среднему переменных с нулем по У, г- обращается в нуль.
В качестве примера можно привести вычисление г при анализе дискримина-тивности
отдельных пунктов опросника личностного, т. е. корреляции между типичным ответом на
отдельный пункт (утверждение-отрицание) с общим результатом по тесту (табл. 10).
Вычисленное таким образом значение гt, показывает, что проверяемый пункт опросника
имеет среднюю диагностическую значимость и слабо коррелирует с общим результатом
теста.
Достоверность (а) связи, рассчитанной с помощью коэффициента г", может определяться
с помощью критерия У? для числа степеней свободы df = 2.
Другим распространенным методом расчета является определение бисериаль-ного
коэффициента корреляции (г;,;,), который применяется в тех случаях, когда
есть основания полагать, что дихотомическое распределение близко к нормальному:
.-0 "Л)
Элементы уравнения идентичны используемым при вычислении Гр;,, за исключением
величины U - ординаты
Таблица 10
Вычисление точечного бисериального коэффициента корреляции Пирсона
g. a
S
|
1|
" ё.
30
с
о-
р
11
й:Й
Вычисление
1 6
g< I
1||
S
с е з
Д,3-
о
1 1 16 ni=ll
2 0 12 лд=7
3 0 11 п=18
41 7 Л, = 12,36
51 15 XQ - 10,00
6 1 14 5,=2,55
z-l
7 0 10
с -1
л-1 /
8011
9 1 15 (7=0,3836
~Х\ - о / "1"о
10
р S, \fn-l)n 12,36-10 Гп
2,55 V 306
=0,46
11
1
13
12
0
7
13
13
14
1
11
15
0
10
16
1
11
17
10
18
1
11
Примечание: 1 - совпадение с "ключом>: 0 - несовпадение с <ключом>.
КОР
нормированного нормального распределения в точке, за которой лежит
- 100% площади под кривой (см. Нор-п
мальное распределение). Из данных
табл. 9 --=-=0,61; ордината нормиро-п 1о
ванного (единичного) нормального распределения (U), за которой лежит 61% площади под
кривой, равна 0,3836.
В отличие от других коэффициентов корреляции, /";," может принимать значения ниже -1 и
выше +1. В случае попадания значения в эти области делается вывод о некорректности
предположения о нормальном законе распределения Х или о распределении значений Х в
выборке с эксцессом значительно ниже нормального. Следует обратить внимание на то
обстоятельство, что при распределении переменных Х с эксцессом больше нормального
границы /"у, будут соответственно меньше пределов -1 и +1, что приведет к переоценке
степени связи. Это требует тщательной проверки свойств распределения при
использовании бисериального коэффициента корреляции.
При вычислении г и Гд" оперируют одинаковыми исходными данными, однако эти
коэффициенты не тождественны. Коэффициент Гр,, более строг при характеристике
степени связи между Х и У (bis> rpь Случаи, когда одна из переменных представлена в
дихотомической шкале, а другая - в порядковой, требуют применения коэффициента
рангово-бисе-риальной корреляции
=2-,
где Y, - средний ранг объектов, имеющих 1 по X; Уд - средний ранг объектов с 0 по X.
Пример вычислений приведен в табл. 11. Коэффициент г тесно связан с коэффициентом т
Кендалла. Особенно четко эта связь прослеживается при ана-
Таблица It Вычисление
рангово-бисериальной корреляции г д при сопоставлении результатов теста удевочек(1) и
мальчиков(О)
S я
\
g
X
1|
ё S
Вычисление
t-
Ё-
ад
Е;
а
Ё S-
S
sl
я
й>.
п.
S
1 0 1 =7,5; п=10
2 1 10 =4,2
30 2
2(7,5-4,2)
Ггь- 0,67
4 1 9
50 5
60 8
7 1 4
8 1 7
90 3
10 0 6
лизе корреляционной связи с помощью близкого к г коэффициента г" в случае
использования для его определения понятия совпадения и инверсии (см. Корреляция
ранговая):
г =p.-
рь П(,>1
где n.Q - число объектов с нулевой дихотомией; л; - число объектов с единичной
дихотомией; Р- сумма совпадений; Q - сумма инверсий.
При оценке значимости связи можно использовать критерий Стьюдента:
t=r
=2,5.
=0,67;
При количестве степеней свободы п = п - 2 = 8 tp = 2,306, при а = 0,05;
( > tp, следовательно, при а < 0,05 выявленная связь является статистически значимой.
КОР
КОРРЕЛЯЦИЯ КАЧЕСТВЕННЫХ ПРИЗНАКОВ - метод анализа связи переменных,
измеряемых в порядковых шкалах и шкалах наименований (см. Шкалы измерительные).
Наиболее часто такой корреляционный анализ проводят с помощью коэффициентов
корреляции ранговой, используемых в случаях, когда обе переменные измеряются в шка-
лах порядка или легко могут быть преобразованы в ранги. При измерении сравниваемых
переменных в шкалах наименований широко применяются коэффициенты сопряженности,
в которых в качестве промежуточной расчетной величины используется критерий согласия
Пирсона (см. Критерий X2). Наиболее часто в таких расчетах пользуются коэффициентом
сопряженности Пирсона:
Значение Р всегда положительно и измеряется от нуля до единицы. Особенностью
коэффициента сопряженности Пирсона является то, что максимальное его значение
всегда меньше +1 и в значительной степени зависит от количества наблюдений (размера
таблицы). В случае квадратной таблицы (k x k)
Так,в таблице размером (5 х 5) Р\ = = 0,894; в таблице (10 х 10) Р = 0,949. Поэтому
окончательной формой выражения связи между переменными с помощью коэффициента
Пирсона является его отношение к величине Рд для данного случая {Р/Р).
При расчете сопряженности находит применение также коэффициент Чупрова:
1-----у2-----
Т= , х
\n(t-\)(k-[)
где t - число столбцов таблицы, k - число строк таблицы.
В психологической диагностике описанные коэффициенты используются относительно
редко.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159
тем, что сравниваются две альтернативные серии объектов X, имеющие условные
значения 0 или 1 по У.
Наиболее характерно применение коэффициентов К. б. в психологической диагностике при
анализе дискримина-тивности заданий теста, а также при определении валидности
критериальной путем коррелирования значений тестовых оценок с независимыми характе-
ристиками критерия, выраженными в дихотомической шкале (см. Шкалы измерительные).
Для описания связи между перечисленными видами переменных используется точечный
бисериальный коэффициент корреляции Пирсона:
где х, - среднее по Х объектов со значением единицы по У; XQ - среднее по Х
КОР
объектов со значением нуль по У: S - стандартное отклонение всех значений по X; га; -
число объектов, с единицей по У:
пу- число объектов с нулем по У, т. е. п = П) + n.Q. Уравнение для вычисления rpi,
представляет собой алгебраическое упрощение формулы коэффициента г (см.
Корреляционный анализ) для случая, когда У- дихотомическая переменная. Можно
привести ряд других эквивалентных выражений, удобных для практического применения:
ръ-
где х - общее среднее по X.
Значение г.д варьирует от -1 до +1. В том случае, когда переменные с единицей по У
имеют среднее по X, равное среднему переменных с нулем по У, г- обращается в нуль.
В качестве примера можно привести вычисление г при анализе дискримина-тивности
отдельных пунктов опросника личностного, т. е. корреляции между типичным ответом на
отдельный пункт (утверждение-отрицание) с общим результатом по тесту (табл. 10).
Вычисленное таким образом значение гt, показывает, что проверяемый пункт опросника
имеет среднюю диагностическую значимость и слабо коррелирует с общим результатом
теста.
Достоверность (а) связи, рассчитанной с помощью коэффициента г", может определяться
с помощью критерия У? для числа степеней свободы df = 2.
Другим распространенным методом расчета является определение бисериаль-ного
коэффициента корреляции (г;,;,), который применяется в тех случаях, когда
есть основания полагать, что дихотомическое распределение близко к нормальному:
.-0 "Л)
Элементы уравнения идентичны используемым при вычислении Гр;,, за исключением
величины U - ординаты
Таблица 10
Вычисление точечного бисериального коэффициента корреляции Пирсона
g. a
S
|
1|
" ё.
30
с
о-
р
11
й:Й
Вычисление
1 6
g< I
1||
S
с е з
Д,3-
о
1 1 16 ni=ll
2 0 12 лд=7
3 0 11 п=18
41 7 Л, = 12,36
51 15 XQ - 10,00
6 1 14 5,=2,55
z-l
7 0 10
с -1
л-1 /
8011
9 1 15 (7=0,3836
~Х\ - о / "1"о
10
р S, \fn-l)n 12,36-10 Гп
2,55 V 306
=0,46
11
1
13
12
0
7
13
13
14
1
11
15
0
10
16
1
11
17
10
18
1
11
Примечание: 1 - совпадение с "ключом>: 0 - несовпадение с <ключом>.
КОР
нормированного нормального распределения в точке, за которой лежит
- 100% площади под кривой (см. Нор-п
мальное распределение). Из данных
табл. 9 --=-=0,61; ордината нормиро-п 1о
ванного (единичного) нормального распределения (U), за которой лежит 61% площади под
кривой, равна 0,3836.
В отличие от других коэффициентов корреляции, /";," может принимать значения ниже -1 и
выше +1. В случае попадания значения в эти области делается вывод о некорректности
предположения о нормальном законе распределения Х или о распределении значений Х в
выборке с эксцессом значительно ниже нормального. Следует обратить внимание на то
обстоятельство, что при распределении переменных Х с эксцессом больше нормального
границы /"у, будут соответственно меньше пределов -1 и +1, что приведет к переоценке
степени связи. Это требует тщательной проверки свойств распределения при
использовании бисериального коэффициента корреляции.
При вычислении г и Гд" оперируют одинаковыми исходными данными, однако эти
коэффициенты не тождественны. Коэффициент Гр,, более строг при характеристике
степени связи между Х и У (bis> rpь Случаи, когда одна из переменных представлена в
дихотомической шкале, а другая - в порядковой, требуют применения коэффициента
рангово-бисе-риальной корреляции
=2-,
где Y, - средний ранг объектов, имеющих 1 по X; Уд - средний ранг объектов с 0 по X.
Пример вычислений приведен в табл. 11. Коэффициент г тесно связан с коэффициентом т
Кендалла. Особенно четко эта связь прослеживается при ана-
Таблица It Вычисление
рангово-бисериальной корреляции г д при сопоставлении результатов теста удевочек(1) и
мальчиков(О)
S я
\
g
X
1|
ё S
Вычисление
t-
Ё-
ад
Е;
а
Ё S-
S
sl
я
й>.
п.
S
1 0 1 =7,5; п=10
2 1 10 =4,2
30 2
2(7,5-4,2)
Ггь- 0,67
4 1 9
50 5
60 8
7 1 4
8 1 7
90 3
10 0 6
лизе корреляционной связи с помощью близкого к г коэффициента г" в случае
использования для его определения понятия совпадения и инверсии (см. Корреляция
ранговая):
г =p.-
рь П(,>1
где n.Q - число объектов с нулевой дихотомией; л; - число объектов с единичной
дихотомией; Р- сумма совпадений; Q - сумма инверсий.
При оценке значимости связи можно использовать критерий Стьюдента:
t=r
=2,5.
=0,67;
При количестве степеней свободы п = п - 2 = 8 tp = 2,306, при а = 0,05;
( > tp, следовательно, при а < 0,05 выявленная связь является статистически значимой.
КОР
КОРРЕЛЯЦИЯ КАЧЕСТВЕННЫХ ПРИЗНАКОВ - метод анализа связи переменных,
измеряемых в порядковых шкалах и шкалах наименований (см. Шкалы измерительные).
Наиболее часто такой корреляционный анализ проводят с помощью коэффициентов
корреляции ранговой, используемых в случаях, когда обе переменные измеряются в шка-
лах порядка или легко могут быть преобразованы в ранги. При измерении сравниваемых
переменных в шкалах наименований широко применяются коэффициенты сопряженности,
в которых в качестве промежуточной расчетной величины используется критерий согласия
Пирсона (см. Критерий X2). Наиболее часто в таких расчетах пользуются коэффициентом
сопряженности Пирсона:
Значение Р всегда положительно и измеряется от нуля до единицы. Особенностью
коэффициента сопряженности Пирсона является то, что максимальное его значение
всегда меньше +1 и в значительной степени зависит от количества наблюдений (размера
таблицы). В случае квадратной таблицы (k x k)
Так,в таблице размером (5 х 5) Р\ = = 0,894; в таблице (10 х 10) Р = 0,949. Поэтому
окончательной формой выражения связи между переменными с помощью коэффициента
Пирсона является его отношение к величине Рд для данного случая {Р/Р).
При расчете сопряженности находит применение также коэффициент Чупрова:
1-----у2-----
Т= , х
\n(t-\)(k-[)
где t - число столбцов таблицы, k - число строк таблицы.
В психологической диагностике описанные коэффициенты используются относительно
редко.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159