Методика позитивного підкріплення

5. Методика позитивного підкріплення

Метод позитивного підкріплення можна застосовувати при дресируванні будь-яких тварин, але особливо він підходить для собак. Це система, цілком спирається на спонукальний мотив (стимул) і відкидає фізичний вплив або силу в будь-яких їх проявах. Цим методом можуть користуватися навіть діти. Він не потребує будь-якого природного дарунка (таланту) дресирувальника. Він не пов'язаний з якимось особливим тоном, вибором відповідного часу, не грунтується на регулярній практиці і не спирається на будь-яку з традиційних теорій дресирування собак. Все, що потрібно - ваш розум і який-небудь ласий шматочок.

Як навчити собаку, щоб вона по команді лягала в якомусь певному куті кімнати? Для цього існує два способи:

1. Можна бити собаку батогом щоразу, коли вона піде в будь-якій іншій кут і взагалі бити до тих пір, поки вона не засвоїть, що вказане вами місце - єдине безпечне притулок.

2. Можна дати собаці особливо смачний шматочок в цьому куточку і повністю її ігнорувати, коли вона піде в якусь іншу частину кімнати.

Я абсолютно впевнений, що, прочитавши ці рядки ви сказали собі: «Ну, це міркування на рівні здорового глузду. Що тут такого нового? »Зрозуміло, це здоровий глузд. Кожен власник собаки щодня надходить подібним чином і вдома, і поза його стінами, не замислюючись про те, що і як він робить. Хоча чомусь, коли потрібно зробити деяке зусилля і чогось навчити свою собаку, ми стаємо в позу дресирувальника і згадуємо стародавній підхід: «Ти собака, я господар. Я наказую, ти підкоряєшся ».

Коли вдома ви кличе собаку, ви зазвичай мають намір погодувати її або взяти на поводок і повести на прогулянку, або показати, що ви упустили їду на підлогу в кухні і хочете, щоб вона все підчистила. Дійсно, вдома ми рідко кличемо собаку просто так, зазвичай це відбувається з якоїсь причини, і в більшості випадків виконання команди обіцяє собаці щось приємне. В результаті лише деякі люди скаржаться, що собака не йде на поклик будинку. А в найближчому парку справа йде зовсім інакше. Ви гуляєте, вона вільно бігає, граючи з іншими собаками, полює за білками, риється в сміттєвих урнах, в той час як ви занурилися в власні думки. Біля воріт парку ви кличете її, щоб вести додому. І тут вона, кинувши на вас погляд, направляється в протилежну сторону. (Таке все ми бачимо на вулиці мало не кожен день.) У цей момент ви говорите собі: «Я повинен нарешті видресирувати свою собаку». Ви її вже видресирували. Ви досягли успіху в тому, що навчили її не підходити до вас. Як? Дуже просто. Собака швидко засвоїла: якщо вона не підійде, то буде винагороджена більш тривалою прогулянкою. Якщо ж вона до вас підійде, то втратить задоволення: її відведуть додому.

Якби ви застосували ваші «домашні прийоми» дресирування команди «До мене!», Кличучи пса біля воріт, даючи ласощі і потім роблячи ще коло по парку, то незабаром, почувши поклик, він летів би до вас кулею. Підкуп? Я називаю це здоровим глуздом. Скільки разів вже мені доводилося ховати посмішку, коли до мене зверталися люди, які стикаються з проблемами небажаної поведінки своїх собак, і я у відповідь пропоную їм спробувати нагороджувати собаку за хорошу поведінку, замість того щоб думати, яким чином покарати її за небажану поведінку. Господарі дивуються: «Ви хочете сказати, що я повинен його підкуповувати?» По-моєму, це досить забавно: то, чого вчені, психологи і біхевіористи (фахівці з проблем поведінки) придумали хитромудрі назви на кшталт «модифікації поведінки», «реабілітаційна психотерапія» , «психологія поведінки» і так далі, широкою публікою все ще розцінюється як підкуп.

Втім, насправді важливо інше - при правильному застосуванні позитивне підкріплення вельми ефективно: воно змінює небажану поведінку. Існує ряд основних принципів, які визначають успіх застосування позитивного підкріплення як методу дресирування. Але перш ніж почати застосовувати ці принципи або закони за допомогою спеціальних навчальних вправ в процесі дресирування собак, необхідно розглянути окремо кожну стадію навчання, її мета і бажаний результат.

Як діє позитивне підкріплення

Перш за все ми взагалі повинні забути про вправи. Все, що нас цікавить для початку - це перший крок в потрібному напрямку. Уявімо собі, наприклад, що ми хочемо навчити касатку вистрибувати з води. Ми даємо свисток (команду) і чекаємо. Потім чекаємо ще трохи, а часто буває, що чекаємо ще й ще. Очевидно, спочатку косатка не має уявлення про те, що від неї вимагається, коли звучить свисток. Тому нам доводиться чекати, щоб вона для чогось висунула ніс з води. Точно в цю мить ми знову свистимо в свисток і даємо їй рибу. Коли вона пропливає внизу, ми знову свистимо і чекаємо. Процедура повторюється до тих пір, поки косатка не вийде на рівень «ага!»: «Ага! Коли я чую звук свистка, я отримую рибу ». Цей рівень розуміння - рівень «ага!» - не може вважатися закріпленим, до тих пір ви не досягнете, щоб відбувалося десять з десяти можливих негайних реакцій на свисток. Поки це не досягнуто, не слід переходити до наступного етапу дресирування.

На першому її етапі здається, що прогрес не дуже помітний, однак для успіху навчання вкрай важливо, щоб кожен етап закінчувався досягненням рівня повного розуміння. Якщо ви цього досягнете, то виявите, що, у міру переходу до кожного наступного етапу перетворення первісної реакції в розпізнавану ланцюжок рухів йде дуже швидко. Тепер ми підходимо до етапу дресирування, який називається «формування». Нам потрібно замінити вже сформовану ланцюжок: «свисток - поява носа - обов'язкова рибка», нової ланцюжком: «свисток - косатка вистрибує з води - рибка дається іноді». Досягається це в такий спосіб. Формування поведінки означає, що ми робимо один маленький крок в потрібному напрямку і просуваємося до кінцевої мети, підкріплюючи кожен зроблений крок. Так ми забезпечуємо безумовне виконання цієї частини ланцюжка, перш ніж рухатися далі.

Тут спостерігається цікаве явище: виконання певних дій, надійно затренірованное за допомогою винагороди, можна зробити ще більш чітким, якщо винагороду затримувати. Припустимо, затренірована така реакція касатки: на десять свистків вона десять разів негайно висовує ніс з води. На одинадцятий раз говоримо: «Недостатньо добре, риби ти не отримаєш». Можна припустити, що тепер косатка подумає: «Але я завжди отримую рибку. Напевно, хтось її поцупив раніше мене. Наступного разу треба жвавіше пошевеливаться ». І на дванадцятий раз ви отримаєте більш швидку і енергійну реакцію касатки: вона висуне з води всю голову цілком. За це безумовно покладається рибка, але тепер і в подальшому - тільки за це.

Далі будемо формувати ланцюжок: «свисток -поява з води всієї голови цілком - при негайної реакції рибка в нагороду в десяти випадках з десяти». Лише потім можна буде перейти до наступного етапу. Здається, що той, якого навчають з кожним етапом все швидше розуміє, що від нього вимагається і виникає ефект снігової кулі.

Я навмисно скористався прикладом касатки щоб наголосити на головному: весь процес навчання може здійснюватися без будь-якого фізичного впливу. Спочатку ми чекаємо вірного кроку в потрібному напрямку і винагороджуємо його, потім закріплюємо і надаємо закінчену форму.

Господар: «Яка різниця між усім цим і підкупом?» Я: «Підкуп - це використання нагороди як спокуси, для того щоб стимулювати рух. Підкріплення - це винагорода, що одержується за добровільне рух ». Господар: «Чи завжди давати нагороду?» Я: «Прийом діє краще, якщо ви даєте нагороду не завжди. Коли модель поведінки сформована, тільки найшвидша, яскраво виражена і сильна реакція винагороджується. Іноді учневі доведеться виконати відпрацьовану ланцюжок шість або сім разів, перш ніж піде винагороду ». Господар: «Чи обов'язково давати в нагороду щось їстівне?» Я: «Нагородою може бути щось інше, заради чого, з точки зору учня, варто виконувати певні дії. Було б безглуздо намагатися сформувати моя поведінка за допомогою тарілки капусти, якщо я терпіти не можу капусту!

Як застосовувати позитивне підкріплення

У розділі «Як вчаться собаки» я розповів про те, як навчив свою першу собаку шукати і приносити річ (відповідає команді «Аппорт!»). Тепер я розповім вам, як я навчив виконувати це завдання свою нинішню собаку. На навчання моєї першої собаки пішло кілька тижнів, і вона так і не навчилася виконувати команду по-справжньому добре. Це була німецька вівчарка - порода славиться гарною обучаемостью. Моя теперішня собака виконує те ж завдання з вогником в очах і неймовірною для собаки її розмірів швидкістю. Це - японська акіта, порода, відома своєю впертістю.

Я провів багато часу на дресирувальних майданчиках, протягом ряду тижнів навчаючи мою німецьку вівчарку. Протягом декількох днів, витрачаючи по кілька хвилин в день, я навчив акіта, жодного разу навіть не вставши з крісла. Використовуючи цей метод, я недавно допоміг провіднику поліцейської собаки досягти того ж результату при дресируванні німецької вівчарки. Фактично нам треба було менше звичайного часу, щоб довести зовсім ненавчені собаку до стандарту міністерства внутрішніх справ, причому досягнуті результати були набагато вищі за ті, яких домагаються, застосовуючи звичайні методи дресирування.

Кличка моєї собаки - Йоко. Зрозуміли? Джон Йоко. Їй було п'ятнадцять місяців, коли я виріши навчити її шукати і приносити кинутий предмет. Зараз у мене не залишається часу, щоб самому брати участь з моїми собаками в змаганнях, де собаки демонструють свої вміння, але я все ще суджу такі змагання. І ось одного разу один господар-учасник зронив мимохідь зауваження, яке спонукало мене вчити мою собаку шукати і приносити кинутий предмет. Хлопець сказав: «Ви ніколи не навчите акіта виконувати цю команду як слід». Коли мені кидають виклик, я займаюся.

Я сидів за письмовим столом у своїй приймальні, поруч на столі я поставив коробочку з ласощами. Простягаючи собаці гантель, я говорив: «Візьми!» Йоко нюхала поперечину, а я говорив: «Хороша дівчинка!» - і давав їй частування. Перше заняття тривало близько п'яти хвилин, і вона отримала винагороду відразу після швидкої реакції приблизно в 60% випадків. В інших випадках за правильні реакції іноді теж давалося винагороду, але тільки після того, як собака нюхала стіл, дерлися на мене, гавкала або робила ще що-небудь, намагаючись отримати винагороду. На наступному занятті в той же день був досягнутий рівень розуміння (рівень «ага!»). Йоко тикалася носом в гантель щоразу, коли я давав команду. На формування дії і перехід до наступної стадії потрібно трохи більше часу. Протягом чотирьох занять по п'ять хвилин кожне вона пробувала робити найрізноманітніші речі щоб отримати нагороду. Ставлення було: 15%; 25%; 70%; 100%. Тепер я вже вимагав, щоб вона не тикалася в гантель носом, а лизала її. Не давши їй частування, коли вона в черговий раз лизнула гантель, я потрапив в точку, що викликало ефект снігової кулі набагато раніше, ніж я сам того очікував. Вона рішуче вихопила гантель у мене з рук дивилася на мене, як ніби кажучи: «Дивись, дурненький, я її взяла. Давай їжу! »

Ніхто не може заздалегідь визначити модель формування поведінки при виконанні завдання. Ми можемо запланувати відому структуровану послідовність, але при навчанні нам доведеться керуватися темпом, який встановить сама тварина. Після того як ви винагородили собаку за певний рух, воно повинно стати єдиним рухом, за яке дається нагорода, поки воно не буде затреніровано. Йоко зробила більший крок вперед, ніж я очікував, і, оскільки я її з ентузіазмом нагородив, мені довелося чекати, щоб вона його повторила. Це забрало менше часу, ніж я очікував, але треба врахувати, що Йоко дуже ненажерлива собака.

Після такого величезного ривка вперед весь ланцюжок дій формувалася дуже легко. Минуло зовсім небагато часу, і я вже кидав гантель на кушетку в дальньому кінці приймальні, а Йоко приносила її по команді і сідала переді мною, тримаючи її в зубах, горда. У перший же раз, коли на свіжому повітрі я випробував дати одне з тих вправ, що пропонуються на змаганнях, вона отримала б у мене за їх виконання всі десять балів з десяти. Але здається, я кілька упереджений.

Візьмемо тепер два простих дії: виконання команд «Сидіти!» І «Лежати!». Спробуємо, використовуючи наш метод і не застосовуючи силу, навчити собаку чітко реагувати на дані команди. Щоб прискорити процес, необхідно вдатися до підкупу. Іншими словами, ми показуємо нагороду, щоб стимулювати рух. Як тільки досягається цей рівень розуміння, ми звертаємося до команди і подаємо її тільки голосом, потім чекаємо, щоб було зроблено вірне рух. Тоді ми надаємо цьому руху закінченого вигляду. Для відпрацювання команди «Сидіти!» Покажіть собаці ласощі, навіть доторкніться їм до кінчика її носа. Скажіть: «Сидіти!» - і повільно перемістіть ласощі вгору і назад, трохи далі лінії очей собаки. Додавання у собак таке, що якщо голова піднімається вгору і назад, то задня частина тулуба неодмінно опускається.

Для відпрацювання команди «Лежати!» Виберіть таку перешкоду, щоб для його подолання собаці потрібно було лягти на черево. Це буде залежати від розміру собаки. Наприклад, для німецької вівчарки підійшов би кавовий столик. Підведіть до нього собаку і запропонуйте їй ласощі, тримаючи його в руці під столиком, тобто під перешкодою. Коли собака потягнеться за ласощами, повільно відсуває його під перешкодою, спонукаючи собаку рухатися слідом і командуючи при цьому: «Лежати!» В той момент, коли її черево торкнеться підлоги, дайте винагороду.

Тепер, коли ми навчили свою собаку робити те, чого ми від неї домагаємося, залишається відучити її робити те, що нам не подобається. Для досягнення цієї мети використовуємо систему негативного підкріплення.

Методика позитивного підкріплення

5. Методика позитивного підкріплення

Як діє позитивне підкріплення

Як застосовувати позитивне підкріплення

Схожі статті