Как уже упоминалось, само эмоциональное состояние может иметь выраженный подкрепляющий характер.
Надо сказать, что некоторые ученые считают, что этот термин «отрицательное подкрепление» несколько неудачен, так как всякое подкрепление по определению должно способствовать выработке какой-то формы поведения, т. е. оказывать положительное действие. Видимо, правильнее было бы в обоих случаях говорить о подкреплении, но не о положительном и отрицательном, а о положительном и аверсивном (в зависимости от его значения для организма).
С точки зрения мотивированного поведения, подкреплением считается любое событие, увеличивающее, уменьшающее или исключающее вероятность удовлетворения наличной потребности. Событие, связанное с удовлетворением потребности, и сам факт удовлетворения потребности являются положительным подкреплением. Факт неудовлетворения потребности считается отрицательным подкреплением. Такой подход объясняет существование форм научения без выраженного подкрепления, например, импринтинга или латентного научения.
Событие, регулярно предшествующее факту подкрепления, начинает нести информацию о его наступлении и, по законам развития условного рефлекса, само становится подкреплением. Такое подкрепление называется условным. Различают положительное и отрицательное условное подкрепление (известные всем «ХОРОШО!» и «ФУ!»). Таким образом различают натуральное (первичное в оперантном научении) подкрепление, заключающееся в непосредственном воздействии на животное (кормление, поение, оглаживание, причинение боли или неприятных ощущений) и условное (вторичное в оперантном научении) подкрепление, образующееся по законам классических условных рефлексов.
По мере тренированности, свойства условного подкрепления могут приобретать команда, а при инструментальных рефлексах — действия животного или даже данные обстановочной афферентации — потому, что, чаще или реже, их результатом бывает подкрепление. Чтобы условное подкрепление не потеряло своего сигнального значения, время от времени его необходимо подтверждать непосредственным воздействием на животное, то есть натуральным подкреплением.
Особое значение имеет время подачи подкрепления. Следует отметить, что закрепляется только непосредственно предшествующее подкреплению поведение. В оперантном научении считается, что разрыв между нужной формой поведения и фактом подкрепления не должен составлять более 10 секунд. Если этот разрыв больше, научение может не произойти.
Школой И.П. Павлова были описаны так называемые «отставленные рефлексы», когда разрыв между действием условного раздражителя и подкрепления составлял минуты и десятки минут. Выработка «отставленных рефлексов» осуществима только в специфических условиях павловской «башни молчания», но и при этом была отмечена закономерность — чем дальше во времени оставляется подкрепление, тем медленней вырабатывается условнорефлекторная реакция. В реальных условиях избежать факта оставления подкрепления помогает использование условного подкрепления.
Оказалось, что частичное подкрепление условных сигналов (до 50% случаев, а по некоторым данным до 33—25%), не затрудняет выработку условного рефлекса, но значительно замедляет его угашение при последующей отмене подкрепления. Но при свободном выборе режима положительного подкрепления, животные выбирают режим с большей вероятностью его получения. Возможно общее число случаев подкрепления важно только для упрочения реакции до навыка. Однако вариационный (вариабельный) режим подкрепления значительно закрепляет отработанный навык.
Значимость подкрепления, то есть его способность оказывать влияние на модификацию поведения определяется, с одной стороны его величиной. Оказалось, что животные при условии свободы выбора величины подкрепления, выбирают те случаи, в которых величина положительного подкрепления больше. Учитывая закон сохранения (экономии) энергии, животное может прийти к выводу, что величина подкрепления не окупает энергитические затраты связанные с его достижением. С другой стороны, величина подкрепления должна быть такой, чтобы вызвать безусловную реакцию животного. Например, отрицательное подкрепление только тогда эффективно, когда способно вызывать оборонительную реакцию.
Следует всегда помнить об относительности биологической значимости подкрепления. Так для совершенно сытого животного вряд ли значимым будет пищевое подкрепление, как для некоторых собак ласковое слово или поглаживание хозяина бывает безразличным и, следовательно, не воспринимается подкреплением. Для одних животных игра является сильным подкрепляющим фактором, для других возможность свободы и физической активности, одни собаки воспринимают рывок поводком средней силы как значимое отрицательное подкрепление, другие не обращают внимание и продолжают тянуть.
Относительность подкрепления также связана с потребностью, испытываемой организмом. Если ваша собака очень хочет погнаться за кошкой, то ваш кусочек сыра вряд ли будет подкреплением команде подхода.
Но связь выбранного подкрепления с насущной потребностью гораздо глубже. Дело в том, что потребность и способы ее удовлетворения достаточно жестко наследуемы и возможности, например, пищевого подкрепления не всесильны. Мак-Фарленд в своей книге «Поведение животных» приводит случай произошедший с супругами Бреланд почитателями и последователями Скиннера. Бреланд были уверены, что с помощью метода Скиннера можно выработать и закрепить у животных совершенно необычные и несвойственные для них реакции и в доказательство этого выработали у нескольких видов животных — енотов-полоскунов, свиней, кур и др. — различные формы поведения с помощью оперантного обусловливания. Вначале работа шла легко. Еноты подбирали монетку и переносили ее в металлическую коробку. Свиньи рылом подталкивали деревянную монетку к большой копилке в виде поросенка. Куры дергали за резиновое кольцо и высвобождали таким образом капсулу, которую они клювом выталкивали из клетки. Разумеется, каждая такая поведенческая реакция сопровождалась подкреплением.
Однако по прошествии некоторого времени еноты уже не так охотно опускали свои монетки, а предпочитали оставлять их у себя, манипулируя ими, потирая их передними лапами, а если и опускали их в коробку, то затем снова вынимали обратно. Свиньи уже не так спешили подтолкнуть монету к кормушке, для того чтобы получить себе пищу, а по дороге подбрасывали ее в воздух или пытались зарыть в землю, а затем снова выкопать. Куры же стали поклевывать свои капсулы, вместо того чтобы выталкивать их из клетки.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
Надо сказать, что некоторые ученые считают, что этот термин «отрицательное подкрепление» несколько неудачен, так как всякое подкрепление по определению должно способствовать выработке какой-то формы поведения, т. е. оказывать положительное действие. Видимо, правильнее было бы в обоих случаях говорить о подкреплении, но не о положительном и отрицательном, а о положительном и аверсивном (в зависимости от его значения для организма).
С точки зрения мотивированного поведения, подкреплением считается любое событие, увеличивающее, уменьшающее или исключающее вероятность удовлетворения наличной потребности. Событие, связанное с удовлетворением потребности, и сам факт удовлетворения потребности являются положительным подкреплением. Факт неудовлетворения потребности считается отрицательным подкреплением. Такой подход объясняет существование форм научения без выраженного подкрепления, например, импринтинга или латентного научения.
Событие, регулярно предшествующее факту подкрепления, начинает нести информацию о его наступлении и, по законам развития условного рефлекса, само становится подкреплением. Такое подкрепление называется условным. Различают положительное и отрицательное условное подкрепление (известные всем «ХОРОШО!» и «ФУ!»). Таким образом различают натуральное (первичное в оперантном научении) подкрепление, заключающееся в непосредственном воздействии на животное (кормление, поение, оглаживание, причинение боли или неприятных ощущений) и условное (вторичное в оперантном научении) подкрепление, образующееся по законам классических условных рефлексов.
По мере тренированности, свойства условного подкрепления могут приобретать команда, а при инструментальных рефлексах — действия животного или даже данные обстановочной афферентации — потому, что, чаще или реже, их результатом бывает подкрепление. Чтобы условное подкрепление не потеряло своего сигнального значения, время от времени его необходимо подтверждать непосредственным воздействием на животное, то есть натуральным подкреплением.
Особое значение имеет время подачи подкрепления. Следует отметить, что закрепляется только непосредственно предшествующее подкреплению поведение. В оперантном научении считается, что разрыв между нужной формой поведения и фактом подкрепления не должен составлять более 10 секунд. Если этот разрыв больше, научение может не произойти.
Школой И.П. Павлова были описаны так называемые «отставленные рефлексы», когда разрыв между действием условного раздражителя и подкрепления составлял минуты и десятки минут. Выработка «отставленных рефлексов» осуществима только в специфических условиях павловской «башни молчания», но и при этом была отмечена закономерность — чем дальше во времени оставляется подкрепление, тем медленней вырабатывается условнорефлекторная реакция. В реальных условиях избежать факта оставления подкрепления помогает использование условного подкрепления.
Оказалось, что частичное подкрепление условных сигналов (до 50% случаев, а по некоторым данным до 33—25%), не затрудняет выработку условного рефлекса, но значительно замедляет его угашение при последующей отмене подкрепления. Но при свободном выборе режима положительного подкрепления, животные выбирают режим с большей вероятностью его получения. Возможно общее число случаев подкрепления важно только для упрочения реакции до навыка. Однако вариационный (вариабельный) режим подкрепления значительно закрепляет отработанный навык.
Значимость подкрепления, то есть его способность оказывать влияние на модификацию поведения определяется, с одной стороны его величиной. Оказалось, что животные при условии свободы выбора величины подкрепления, выбирают те случаи, в которых величина положительного подкрепления больше. Учитывая закон сохранения (экономии) энергии, животное может прийти к выводу, что величина подкрепления не окупает энергитические затраты связанные с его достижением. С другой стороны, величина подкрепления должна быть такой, чтобы вызвать безусловную реакцию животного. Например, отрицательное подкрепление только тогда эффективно, когда способно вызывать оборонительную реакцию.
Следует всегда помнить об относительности биологической значимости подкрепления. Так для совершенно сытого животного вряд ли значимым будет пищевое подкрепление, как для некоторых собак ласковое слово или поглаживание хозяина бывает безразличным и, следовательно, не воспринимается подкреплением. Для одних животных игра является сильным подкрепляющим фактором, для других возможность свободы и физической активности, одни собаки воспринимают рывок поводком средней силы как значимое отрицательное подкрепление, другие не обращают внимание и продолжают тянуть.
Относительность подкрепления также связана с потребностью, испытываемой организмом. Если ваша собака очень хочет погнаться за кошкой, то ваш кусочек сыра вряд ли будет подкреплением команде подхода.
Но связь выбранного подкрепления с насущной потребностью гораздо глубже. Дело в том, что потребность и способы ее удовлетворения достаточно жестко наследуемы и возможности, например, пищевого подкрепления не всесильны. Мак-Фарленд в своей книге «Поведение животных» приводит случай произошедший с супругами Бреланд почитателями и последователями Скиннера. Бреланд были уверены, что с помощью метода Скиннера можно выработать и закрепить у животных совершенно необычные и несвойственные для них реакции и в доказательство этого выработали у нескольких видов животных — енотов-полоскунов, свиней, кур и др. — различные формы поведения с помощью оперантного обусловливания. Вначале работа шла легко. Еноты подбирали монетку и переносили ее в металлическую коробку. Свиньи рылом подталкивали деревянную монетку к большой копилке в виде поросенка. Куры дергали за резиновое кольцо и высвобождали таким образом капсулу, которую они клювом выталкивали из клетки. Разумеется, каждая такая поведенческая реакция сопровождалась подкреплением.
Однако по прошествии некоторого времени еноты уже не так охотно опускали свои монетки, а предпочитали оставлять их у себя, манипулируя ими, потирая их передними лапами, а если и опускали их в коробку, то затем снова вынимали обратно. Свиньи уже не так спешили подтолкнуть монету к кормушке, для того чтобы получить себе пищу, а по дороге подбрасывали ее в воздух или пытались зарыть в землю, а затем снова выкопать. Куры же стали поклевывать свои капсулы, вместо того чтобы выталкивать их из клетки.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26