Преступление без наказания. Почему ваше наказание может не работать?

Опубликовано 23 февраля, 2019 в Дрессировка, Поведение, Теория обучения

Наказание в дрессировке – тема неоднозначная. Настолько неоднозначная, что вы можете встретить весь спектр взглядов, от “собаку необходимо регулярно бить, чтобы знала, кто главный” до “никакие наказания недопустимы”. Этот разброс мнений обусловлен в первую очередь неверным толкованием термина “наказание”. Разные люди могут подразумевать под ним совершенно разные вещи.

В теории научения (теория в психологии, объясняющая, как происходит обучение живых организмов) под “наказанием” подразумевается любое воздействие, делающее предшествовавшее ему поведение менее вероятным в будущем. Если вы неодобрительно посмотрели на ковыряющего в носу мужчину, и он прекратил это занятие, ваш строгий взгляд является наказанием для поведения ковыряния в носу. Если вы отвесили подзатыльник матерящемуся подростку, и он продолжил материться (скорее всего, уже на вас), подзатыльник не является наказанием для поведения сквернословия. Наказание определяется по его влиянию на предшествующее поведение: оно уменьшилось – это наказание; не уменьшилось – не наказание.

Давайте посмотрим правде в глаза: мы все регулярно используем наказания. Мы можем не считать это наказанием, но суть от этого не меняется. Наказание – эффективный способ научить животное что-то не делать. Достаточно один раз порезаться об нож, чтобы никогда больше не проводить по острию пальцем. Достаточно один раз получить удар током, чтобы не засовывать в розетку отвертку. Достаточно один раз получить укус, чтобы не тыкать собаке пальцем в глаз. Хотя некоторым не достаточно…

Это подводит нас к вопросу эффективности наказания. Почему некоторые наказания отбивают желание повторять это поведение на всю оставшуюся жизнь, а некоторые – всего лишь на несколько секунд?

Разобраться в этом нам поможет самое неэффективное из существующих наказание – штраф за нарушение скоростного режима. Если у вас есть машина, вы наверняка хотя бы один раз получали штраф за превышение скорости (или вам злобно сигналят в спину другие машины, потому что вы еле тащитесь). В Москве на улицах висят камеры, которые фиксируют нарушение, и потом вам по почте приходит “письмо счастья” со штрафом (или вы можете найти и оплатить его на сайте ГИБДД). На загородных трассах стоят притаившиеся радары и патрули ДПС, которые так же ловят нарушителей и выписывают штраф на месте. Штраф – это наказание. Получив штраф, вы начинаете соблюдать скоростной режим. Некоторое время. А потом снова прибавляете газ. Почему?

Наказание должно быть незамедлительным

Вы превышаете скорость – и получаете штраф через несколько минут, часов или даже дней, когда вас остановит и выпишет штраф патруль ДПС или придет “письмо счастья” по почте. В последнем случае типична реакция “а когда и где это вообще было?” – человек даже не помнит поведение, за которое его наказывают.

С собаками зачастую дела обстоят не лучше. Собака стащила со стола батон хлеба и уже его доела – и тут заходите на кухню вы и устраиваете ей выговор. Собака бегает от вас кругами, хрустя найденными косточками – через 5 минут вы ее отлавливаете и хлещете поводком. Или еще хуже: собака сгрызла ботинок и написала на ковер – и через 6 часов, придя домой с работы, вы на нее накричали и заперли в ванной.

Важно отметить, что действие законов обучения не зависит от нашего сознания. Чем дальше во времени находятся друг от друга два события, тем слабее между ними ассоциативная связь. Даже если умом вы понимаете истинную силу этой связи. Вы твердо знаете, что причина вашего похмелья – обильное алкогольное возлияние восьмью часами ранее. Но часть мозга, ответственная за обучение, считает иначе – и вот уже на следующий день (а то и в этот же) вы напиваетесь с друзьями в баре. Даже если вы понимаете, что получили штраф за то нарушение 3 дня назад, а собака понимает, что ее наказывают за сделанную 6 часов назад лужу на ковре (а она не понимает), отсроченное наказание все равно не будет эффективным.

Чтобы наказание было эффективным, оно должно следовать непосредственно за поведением (в течение 1-2 секунд). Вы проводите пальцем по острию ножа – и сразу чувствуете боль. Вы суете отвертку в розетку – и вас тут же бьет током. Это понятно, но как быть в ситуациях, когда наказание нельзя осуществить сразу? Невозможно материализовать в вашей руке штраф в момент превышения скорости или сразу отправить на тайм-аут собаку, грубо играющую с сородичем в 20 метрах от вас. Здесь на помощь вам придет маркер наказания. Это как кликер наоборот: предвещает не награду, а наказание. Через несколько спариваний этот маркер становится условным наказанием. Вуаля! Можно наказывать любого человека или собаку сквозь время и пространство.

Однажды в Гамбурге мы ехали на машине за продуктами и проезжали через зону с ограничением скорости 30 км/ч. Муж не придал знаку значения и по доброй российской традиции (превышение в пределах 20км/ч не штрафуется) продолжил ехать со скоростью 50 км/ч – и тут на столбе на обочине что-то ярко вспыхнуло. Посовещавшись, мы пришли к выводу, что это вспыхнула камера в момент фиксации нарушения. “Ну все, ждем штраф по почте”. Это наказание оказалось настолько эффективным, что вот уже несколько лет мы строго соблюдаем скоростной режим в Германии. А штраф по почте так и не пришел..

Наказание должно быть сильным

В Москве штраф за небольшое превышение скорости – 500 рублей, причем действует скидка 50% при оплате штрафа в первые 20 дней. Ну что такое 250 рублей по Московским меркам? Даже небогатый человек может легко позволить себе регулярно нарушать скоростной режим. Власти установили такой размер штрафа из “заботы” о бедных автомобилистах, чтобы не вызвать волну народного протеста.

Зачастую владельцы собак выбирают самое слабое из возможных наказаний, “заботясь” о своем питомце. Они считают необходимым наказать собаку, но при этом не хотят ее наказывать (“делать больно”). Например, выбирают окрик или выговор, при работе с ЭШО выставляют на нем минимальный режим (или даже вибрацию) и месяцами дергают собаку поводком в попытке научить ходить на провисшем.

Проблема такой “заботы” о собаке в том, что “то, что нас не убивает, делает нас сильней”. Через некоторое время собака попросту адаптируется к этому наказанию и перестает его замечать. Наказание перестает работать. Тогда владелец увеличивает силу наказания еще немного. А потом еще немного. В результате человек использует наказание куда большей силы, чем если бы он сразу использовал сильное. Если вы опустите руку в кастрюлю с холодной водой, которая нагревается на огне, вы выдержите в итоге куда большую температуру, чем если бы просто опустили в горячую воду руку.

Эффективное наказание сразу должно быть достаточно сильным для того, чтобы буквально через 3-5 повторов надолго устранить нежелательное поведение. Это должно быть очень сильное наказание, и у него будут сильные побочные эффекты. Если вы не готовы к этому и не хотите “делать собачке больно”, не используйте наказание вообще. Лучше никакого, чем постепенно растущее.

В Москве за неправильную парковку в дополнение к штрафу в 2500 рублей вашу машину увезет эвакуатор. Вызволение машины со штрафстоянки выльется в 4-6 часов потерянного времени (в лучшем случае), оплату самой эвакуации и нахождения на штрафстоянке, плюс некоторую сумму на оплату такси. Достаточно одного такого приключения, чтобы научиться не оставлять машину под запрещающим знаком.

Наказание должно быть последовательным

Получаете ли вы штраф каждый раз, как нарушили скоростной режим? Конечно нет! Вы получаете его только тогда, когда вас засекла камера или радар. Если превышать скорость, но сбрасывать ее перед камерой, штрафа не будет.

Получает ли собака наказание всякий раз, когда она осуществляет нежелательное поведение? Вы наказываете собаку за воровство со стола каждый раз или только когда вы ловите ее с поличным? Получает ли она наказание, когда ворует со стола в ваше отсутствие? Бросаете ли вы в собаку гремяшку каждый раз, как она подбирает с земли, или иногда она наслаждается яствами тайком за деревом или в кустах? Наказываете ли вы собаку игнором каждый раз, как она ставит на вас лапы при встрече, или, когда вы приехали из долгой командировки, ей это делать можно?

Чтобы наказание было эффективным, оно должно следовать за каждым эпизодом нежелательного поведения. Если иногда это поведение остается без наказания, то оно оказывается на вариабельном режиме подкрепления. Этот режим подкрепления делает поведение настолько надежным, что от него становится практически невозможно избавиться. Собака превращается в азартного игрока.

Нерегулярное наказание тесно связано с проблемой стимульного контроля. Животное довольно быстро выучивает, что, когда некоторый стимул присутствует, данное поведение может принести ей награду (или наказание). Если человека нет дома, он не сможет наказать за воровство со стола. Если к собаке не пристегнут поводок, человек не сможет ее им одернуть. Если у человека нет в руке пульта от ЭШО, она не получит удар током. Если не попасть на камеру, не придет штраф за нарушение скорости.

Наказание должно следовать за поведением каждый раз, в любых обстоятельствах. Иначе животное (и человек) выучит, что получение наказания связано с определенным стимулом в окружении, а не с самим поведением.

Наказание должно наталкивать на требуемое поведение

Оборотной стороной медали наказания является отрицательное подкрепление. Животное осуществляет некоторое поведение, прекращающее наказание, и это поведение становится более вероятным в будущем. В дальнейшем с помощью этого поведения животное сможет не только сразу прекращать наказание, но и предотвращать его возникновение. Эффективное наказание наталкивает животное на это поведение.

Коснувшись горячей кастрюли, вы отдергиваете руку – и боль сразу прекращается. Вы быстро выучиваете, что лучший способ не допустить боль – убирать руку подальше от горячей кастрюли. Если, когда собака выбегает вперед, вы возвращаете ее к себе рывком поводка, она выучит, что приближение к вам позволяет избежать рывка. Рывок сообщает ей, в каком направлении ей нужно двигаться, чтобы прекратить наказание.

Проблема штрафов в том, что они не наталкивают человека на снижение скорости, в отличие от “лежачих полицейских”, которые наказывают превышение скорости и побуждают ехать медленно. Шлепок газетой не подскажет щенку, что писать нужно на пеленке, а не на ковре – гораздо эффективнее будет быстро схватить его в охапку и перенести на пеленку. Окрик не сообщит щенку, что ему нужно прекратить прыгать и кусаться и успокоиться, а вот игнорирование или тайм-аут вполне.

Осуществляя то или иное наказание, подумайте, подсказывает ли оно щенку, в каком направлении ему нужно двигаться или какое действие осуществлять, чтобы его избежать, или просто временно прекращает нежелательное поведение.

Итак, чтобы наказание было эффективным, оно должно:

следовать непосредственно за нежелательным поведением,
быть достаточно сильным, чтобы устранить нежелательное поведение меньше, чем за 5 повторов,
следовать за каждым проявлением нежелательного поведения,
наталкивать собаку на желательное поведение.

Нет ничего плохого в использовании наказания для прекращения нежелательного поведения, когда другие меры не дали желаемого результата (в соответствии с принципом НИМА). Но это наказание должно быть эффективным. Если оно не эффективно, то это уже не наказание, а жестокое обращение: оно не справляется со своей задачей, а только приносит побочные эффекты. Если вы не можете осуществлять наказание эффективно, не используйте его. Сохраните свои нервы и хорошие отношения с собакой!

Преступление без наказания. Почему ваше наказание может не работать?

Поделиться ссылкой: