В терминах поведенческого акта: сравнение результата поведенческого акта с образом цели (акцептирование результата действия) обнаруживает их тождественность и вызывает положительную оценочную эмоцию. Положительная эмоция позволяет зафиксировать образ способа достижения цели в долговременной памяти. Образно выражаясь, эмоция — это резец, который, с каждым повторением удачного (подкреплённого дрессировщиком) действия, оставляет всё более глубокий след в памяти дрессируемой собаки, фиксируя вырабатываемый навык.
…Кандид наперед знал, какие эмоции возникнут у него в следующую секунду. У нас в деревне это называется «думать».
Улитка на склоне. А. и Б. Стругацкие.
Очень важно для дрессировщика осознать механизм акцептирования. Совпадение или несовпадение результата поведенческого акта с образом цели осознаётся животным через эмоции. Для управления собакой мы апеллируем к её эмоциям, и любое подкрепление следует понимать именно как обращение к эмоциям собаки. Собака стремится к получению положительных эмоций и пытается избежать отрицательных. Поведение, результатом которого явится получение удовольствия, радости имеет большие шансы проявляться снова и снова. Поведение, результатом которого явится боль, страх, растерянность, отвращение, вряд ли проявится снова.
Итак, настал момент, когда мы должны разобраться — что же такое «подкрепление»? К сожалению, в этом вопросе царит большая терминологическая путаница. Логично было бы предположить, что «подкрепить» какое либо поведение, значит то же самое, что и «поощрить» его. Эти слова в обыденной речи — синонимы. В обыденной речи, но, увы, не в теории модификации поведения. Здесь подкреплением называют действие дрессировщика, вызывающее у животного либо положительную, либо отрицательную эмоции и, тем самым, согласно второму закону научения — закону эффекта, либо закрепляющее то поведение, с которым совпадает по времени, либо (после многократных повторений) исключающее его из поведенческого репертуара животного. Далее, вслед за многими авторами, можно было бы назвать подкрепление, вызывающее положительную эмоцию, положительным, а вызывающее отрицательную эмоцию, отрицательным. Однако другой ряд авторов называет положительным подкреплением такое действие дрессировщика, которое ведёт к появлению у животного положительной эмоции или исчезновению отрицательной эмоции, а отрицательным подкреплением — действие, ведущее к исчезновению положительной эмоции или появлению отрицательной эмоции. Последний вариант, с точки зрения содержательности, предпочтительнее. Однако смущает тот факт, что на 4 различных явления приходится лишь 2 термина. Поэтому я предлагаю пойти на компромисс и принять, что подкрепление может выражаться в двух формах: поощрения и наказания. (Разумеется, я знаю, что понятие «наказание» с лёгкой руки Прайор считается нынче чуть ли ни неприличным. Но ведь это всего лишь вопрос терминологии). Итак, поощрение вызывает положительную эмоцию, а наказание — отрицательную. Нужно также учесть, что подкрепление — это действие, ограниченное во времени. С точки зрения собаки, начало поощрения — это, разумеется, хорошо, и поведение, с которым оно совпадёт по времени, становится для неё предпочтительным. И наоборот, окончание поощрения — плохо, и совпадающее с ним по времени поведение становится нежелательным. В свою очередь, начало наказания — плохо, действие угашается. Окончание наказания — хорошо, действие закрепляется. Итак, мы пришли к выводу, что существует четыре вида подкрепления: начало и продолжение поощрения (закрепляющее, положительная эмоция возникает и длится), окончание поощрения (угашающее, положительная эмоция исчезает), начало и продолжение наказания (угашающее, отрицательная эмоция возникает и длится), и окончание наказания (закрепляющее, отрицательная эмоция исчезает). Кстати, когда мы говорим о поощрении и наказании в обыденной речи, мы имеем в виду именно начало поощрения и начало наказания и совершенно упускаем из виду момент их окончания, оказывающий прямо противоположное действие.
Есть ещё вариант: нет ни наказания, ни поощрения — этот случай сам по себе эмоционально не окрашен, всё зависит от контекста. В одном случае бездействие дрессировщика воспринимается собакой как поощрение, в другом — как наказание. Например, собака, уже наученная идти «рядом», стремясь на прогулку, натягивает поводок. Дрессировщик не реагирует. Тем самым такое поведение закрепляется. Противоположный пример: собака лает, требуя у дрессировщика лакомство. Дрессировщик не реагирует. Такое поведение постепенно исчезает.
Обобщая, можно сказать: что бы ни делал дрессировщик во время дрессировки, его поведение можно описать одним из пяти вышеперечисленных вариантов. И все они для собаки эмоционально окрашены, все воздействуют на её поведение. Вывод о необходимости тщательного анализа и планирования выполнения дрессировочных приёмов предоставляю сделать читателю.
Длительность поощрения и наказания, их временная продолжительность могут вызвать проблемы во время дрессировки. Например: дрессировщик тренирует посадку собаки. В ответ на то или иное воздействие дрессировщика собака садится. Дрессировщик поощряет посадку лакомством. Но даже маленький кусочек сыра собака, как правило, не глотает целиком. Какое-то время, пусть непродолжительное, собака разжёвывает лакомство — и за это время успевает встать! Что, собственно говоря, поощрено в этом случае? Тот же пример — дрессировщик поощрил лакомством посадку собаки. Собака продолжает сидеть. Дрессировщик считает, что начало выработке навыка положено. Но через какое-то количество повторений приёма собака начинает вставать, после того как съест лакомство. Поведение «посадка» закреплялось началом поощрения — лакомства, и в то же время поведение «сидение на месте» угашалось окончанием поощрения — лакомства.
Как было бы хорошо, если бы существовало моментальное, не имеющее протяжённости во времени поощрение! Во-первых, точное совпадение во времени с подкрепляемым поведением перестало бы быть проблемой (а такая проблема, и очень серьёзная есть — это подтвердит любой дрессировщик). Во-вторых, не имея протяжённости во времени, такое поощрение имело бы только значение начала поощрения, то есть, значение, вызывающее положительную эмоцию, и не имело бы значения отмены поощрения, вызывающего отрицательную эмоцию.
В действительности все не так, как на самом деле.
Станислав Ежи Лец
Оказывается, такое поощрение существует. Это условное поощрение, — условный раздражитель, которому с помощью образования условного рефлекса, придано значение поощрения.
1 2 3 4 5 6 7 8 9 10
…Кандид наперед знал, какие эмоции возникнут у него в следующую секунду. У нас в деревне это называется «думать».
Улитка на склоне. А. и Б. Стругацкие.
Очень важно для дрессировщика осознать механизм акцептирования. Совпадение или несовпадение результата поведенческого акта с образом цели осознаётся животным через эмоции. Для управления собакой мы апеллируем к её эмоциям, и любое подкрепление следует понимать именно как обращение к эмоциям собаки. Собака стремится к получению положительных эмоций и пытается избежать отрицательных. Поведение, результатом которого явится получение удовольствия, радости имеет большие шансы проявляться снова и снова. Поведение, результатом которого явится боль, страх, растерянность, отвращение, вряд ли проявится снова.
Итак, настал момент, когда мы должны разобраться — что же такое «подкрепление»? К сожалению, в этом вопросе царит большая терминологическая путаница. Логично было бы предположить, что «подкрепить» какое либо поведение, значит то же самое, что и «поощрить» его. Эти слова в обыденной речи — синонимы. В обыденной речи, но, увы, не в теории модификации поведения. Здесь подкреплением называют действие дрессировщика, вызывающее у животного либо положительную, либо отрицательную эмоции и, тем самым, согласно второму закону научения — закону эффекта, либо закрепляющее то поведение, с которым совпадает по времени, либо (после многократных повторений) исключающее его из поведенческого репертуара животного. Далее, вслед за многими авторами, можно было бы назвать подкрепление, вызывающее положительную эмоцию, положительным, а вызывающее отрицательную эмоцию, отрицательным. Однако другой ряд авторов называет положительным подкреплением такое действие дрессировщика, которое ведёт к появлению у животного положительной эмоции или исчезновению отрицательной эмоции, а отрицательным подкреплением — действие, ведущее к исчезновению положительной эмоции или появлению отрицательной эмоции. Последний вариант, с точки зрения содержательности, предпочтительнее. Однако смущает тот факт, что на 4 различных явления приходится лишь 2 термина. Поэтому я предлагаю пойти на компромисс и принять, что подкрепление может выражаться в двух формах: поощрения и наказания. (Разумеется, я знаю, что понятие «наказание» с лёгкой руки Прайор считается нынче чуть ли ни неприличным. Но ведь это всего лишь вопрос терминологии). Итак, поощрение вызывает положительную эмоцию, а наказание — отрицательную. Нужно также учесть, что подкрепление — это действие, ограниченное во времени. С точки зрения собаки, начало поощрения — это, разумеется, хорошо, и поведение, с которым оно совпадёт по времени, становится для неё предпочтительным. И наоборот, окончание поощрения — плохо, и совпадающее с ним по времени поведение становится нежелательным. В свою очередь, начало наказания — плохо, действие угашается. Окончание наказания — хорошо, действие закрепляется. Итак, мы пришли к выводу, что существует четыре вида подкрепления: начало и продолжение поощрения (закрепляющее, положительная эмоция возникает и длится), окончание поощрения (угашающее, положительная эмоция исчезает), начало и продолжение наказания (угашающее, отрицательная эмоция возникает и длится), и окончание наказания (закрепляющее, отрицательная эмоция исчезает). Кстати, когда мы говорим о поощрении и наказании в обыденной речи, мы имеем в виду именно начало поощрения и начало наказания и совершенно упускаем из виду момент их окончания, оказывающий прямо противоположное действие.
Есть ещё вариант: нет ни наказания, ни поощрения — этот случай сам по себе эмоционально не окрашен, всё зависит от контекста. В одном случае бездействие дрессировщика воспринимается собакой как поощрение, в другом — как наказание. Например, собака, уже наученная идти «рядом», стремясь на прогулку, натягивает поводок. Дрессировщик не реагирует. Тем самым такое поведение закрепляется. Противоположный пример: собака лает, требуя у дрессировщика лакомство. Дрессировщик не реагирует. Такое поведение постепенно исчезает.
Обобщая, можно сказать: что бы ни делал дрессировщик во время дрессировки, его поведение можно описать одним из пяти вышеперечисленных вариантов. И все они для собаки эмоционально окрашены, все воздействуют на её поведение. Вывод о необходимости тщательного анализа и планирования выполнения дрессировочных приёмов предоставляю сделать читателю.
Длительность поощрения и наказания, их временная продолжительность могут вызвать проблемы во время дрессировки. Например: дрессировщик тренирует посадку собаки. В ответ на то или иное воздействие дрессировщика собака садится. Дрессировщик поощряет посадку лакомством. Но даже маленький кусочек сыра собака, как правило, не глотает целиком. Какое-то время, пусть непродолжительное, собака разжёвывает лакомство — и за это время успевает встать! Что, собственно говоря, поощрено в этом случае? Тот же пример — дрессировщик поощрил лакомством посадку собаки. Собака продолжает сидеть. Дрессировщик считает, что начало выработке навыка положено. Но через какое-то количество повторений приёма собака начинает вставать, после того как съест лакомство. Поведение «посадка» закреплялось началом поощрения — лакомства, и в то же время поведение «сидение на месте» угашалось окончанием поощрения — лакомства.
Как было бы хорошо, если бы существовало моментальное, не имеющее протяжённости во времени поощрение! Во-первых, точное совпадение во времени с подкрепляемым поведением перестало бы быть проблемой (а такая проблема, и очень серьёзная есть — это подтвердит любой дрессировщик). Во-вторых, не имея протяжённости во времени, такое поощрение имело бы только значение начала поощрения, то есть, значение, вызывающее положительную эмоцию, и не имело бы значения отмены поощрения, вызывающего отрицательную эмоцию.
В действительности все не так, как на самом деле.
Станислав Ежи Лец
Оказывается, такое поощрение существует. Это условное поощрение, — условный раздражитель, которому с помощью образования условного рефлекса, придано значение поощрения.
1 2 3 4 5 6 7 8 9 10