ТВОРЧЕСТВО

ПОЗНАНИЕ

 

[8.1]
Фрайер также является соавтором статьи Объяснение причин разрыва в результатах тестов между белыми и черными в первых двух классах школы (Understanding the Black-White Test Score Gap in the First Two Years of School). При написании этой статьи использовались новые правительственные данные, благодаря которым можно с уверенностью говорить о наличии разрыва в знаниях между белыми и черными. Пожалуй, еще более интересен тот факт, что эти данные позволяют ответить на вопрос, волнующий каждого родителя, независимо от цвета его кожи. Ведь каждый из них, черный, белый или любой другой, хотят знать: какие факторы влияют на школьную успеваемость ребенка, а какие — нет?
В конце 1990-х Министерство образования США развернуло грандиозный проект под названием Продольное исследование раннего детства (Early Childhood Longitudinal Study, ECLS). Суть его была в том, чтобы измерить успехи в учебе более двадцати тысяч детей, начиная с первого и вплоть до пятого класса. Объекты для этого были отобраны по всей стране и включали представителей самых разных категорий американских школьников.
В рамках ECLS не только изучалась успеваемость мальчиков и девочек, но и собирались обычные для подобных исследований данные. Ученых интересовали раса и пол ребенка, состав и социоэкономический статус его семьи, уровень образования родителей и т.д. Однако ECLS вышло далеко за рамки простого анкетирования. Дело в том, что в него включили обсуждение с родителями (а также с учителями и дирекцией школ) ряда вопросов более личного характера. Например, родителей спрашивали, бьют ли они своих детей и если да, то как часто; водят ли они их в музеи или библиотеки. Кроме того, ученых интересовало, сколько времени тот или иной ребенок проводит перед телевизором.
В результате была получена очень ценная информация, которая при условии правильной обработки может рассказать много интересного.
Каким же образом необходимо организовать эти данные, чтобы они поведали достойную доверия историю? Это можно сделать при помощи любимой процедуры экономистов: регрессивного анализа. Нет-нет, регрессивный анализ вовсе не является забытой формой психиатрического лечения. Это весьма эффективный — в разумных пределах — инструмент, который использует методы статистики для определения трудноуловимых корреляций.
Корреляция является не более чем статистическим термином, указывающим на взаимосвязь двух переменных. К примеру, если на улице идет снег, там должно быть холодно. Эти два фактора несомненно позитивно коррелируют между собой. В то же время между солнцем и дождем существует негативная корреляция. Все это достаточно просто, но только до тех пор, пока в вашем распоряжении всего две переменные. Когда же их несколько сотен, дело значительно усложняется. Так вот, регрессивный анализ как раз и является инструментом, позволяющим экономистам рассортировать огромное количество данных. Делается это следующим образом: ученый искусственно сохраняет неизменными все переменные, кроме двух, на которых желает сосредоточиться. После этого он спокойно изучает, как эти две переменные соотносятся между собой.
В идеале экономисты могли бы провести эксперимент в контролируемых условиях, подобный опытам психологов или биологов. Для этого им нужно было бы взять два образца, наугад воздействовать на один из них, а затем измерить получившийся результат. К сожалению, такого рода чистый эксперимент является для них скорее роскошью, чем обычной практикой. (В этом отношении очень удобной была лотерея по выбору школы в Чикаго.) Обычно в распоряжении экономиста имеется просто огромный массив данных со множеством переменных, ни одна из которых не является случайной. При этом некоторые переменные зависят одна от другой, а другие никак между собой не связаны. И из этой путаницы ему приходится выбирать, какие именно факторы коррелируют, а какие нет.
В случае с данными ECLS регрессивный анализ можно использовать так: мысленно представить каждого из двадцати тысяч школьников в виде некой монтажной платы с одинаковым количеством разъемов. При этом каждый разъем будет представлять свою категорию данных о ребенке. Это может быть результат итогового теста по математике, чтению или другому предмету сначала за первый, а потом за третий класс. Важны также уровень образования матери, доходы отца, количество книг в доме, относительное влияние окружения и т.д.
Это позволит исследователю выудить из сложного и запутанного массива данных ту информацию, которая его интересует. Он сможет выстроить в один ряд детей, у которых много общих характеристик, и определить ту, что не является общей. Это все равно, что взять все монтажные платы, на которых имеются разъемы со штырьками, и отделить от них ту, где есть разъем с гнездами. Таким образом можно изолировать влияние одного разъема на подсоединение всей монтажной платы. Благодаря этой процедуре станет понятным влияние сначала одного особенного разъема, а потом и всех остальных.
Предположим, что мы хотим узнать из данных ECLS ответ на важный вопрос о родителях и образовании: способствует ли большое количество книг в доме успехам ребенка в школе? Регрессивный анализ не может дать на него исчерпывающий ответ, но вполне может ответить на вопрос, поставленный немного по-другому. Он звучит так: правда ли, что ребенок, у которого дома много книг, учится лучше ребенка, у которого книг нет совсем? Разница между этими вопросами представляет собой разницу между причинностью (первый вопрос) и корреляцией (второй вопрос). Регрессивный анализ может продемонстрировать наличие между явлениями корреляции, но не в силах доказать существование причинности. В конце концов, существует несколько вариантов, в которых две переменные могут находиться в той или иной связи между собой. Фактор X может быть причиной Y; Y может быть причиной X; точно так же может существовать и некий третий фактор, являющийся причиной как X, так и Y. Один регрессивный анализ не сможет сказать вам, идет ли снег, потому что холодно; холодно ли, потому что идет снег, или эти два явления просто совпали.
Данные ECLS лишь показывают, что если дома у ребенка много книг, то результаты школьных тестов у него, скорее всего, будут выше, чем у того, у которого книг дома нет. Так что эти два фактора взаимосвязаны, и хорошо, что мы об этом знаем. Однако высокие результаты тестов коррелируют также со многими другими факторами. Если вы просто возьмете детей с большим количеством книг и сопоставите их с детьми без книг, ответ не будет однозначным и исчерпывающим. Может быть и так, что большое количество книг дома у ребенка является всего лишь показателем достатка его родителей. Что нам действительно необходимо сделать, так это найти двух детей, похожих во всем, кроме одного — в данном случае это размер домашней библиотеки.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70