Собаки .ру - Управление с помощью стимулов.

» Дрессировка / Управление с помощью стимулов.

Дата публикации: 2009-07-10 10:45
Рейтинг статьи:

Взаимодействие без принуждения.

Все, что вызывает какую-либо поведенческую реакцию, называется стимулом. Некоторые стимулы способны вызывать реакции без какого-либо обучения или тренировки: мы вздрагиваем от громкого звука, моргаем от яркого света, нас тянет в кухню, когда до нас доносится аппетитный запах; животные поступают точно так же. Такие звуки, свет и запахи называются безусловными, или первичными, стимулами.

Другие стимулы заучиваются благодаря ассоциации. Сами по себе они могут ничего не значить, но становятся выделяемыми сигналами для поведения; сигналы светофора заставляют нас стоять или идти, мы вскакиваем, чтобы снять трубку зазвонившего телефона, на шумной улице оборачиваемся, услышав свое имя и т. д., и т. д. Ежедневно мы отвечаем на множество выученных сигналов. Они называются условными, или вторичными, стимулами.

При формальном тренинге львиная доля усилий приходится на образование условных сигналов. Сержант, занимающийся строевой подготовкой со взводом новобранцев, и хозяин собаки на дрессировочной площадке в равной мере стремятся сделать в основном так, чтобы обучающиеся повиновались командам, которые в действительности являются условными сигналами. Фокус не в том, что собака может сидеть, а человек останавливаться, фокус в том, что это делается четко и по команде. Вот что мы называем повиновением — не просто выполнение действия, но гарантия того, что оно будет выполнено по сигналу. Психологи называют это "поставить поведение под контроль стимулов". Это вырабатывается с трудом, выработка основывается на правилах, а правила нуждаются в проверке.

А что, если у вас нет в мыслях становиться хозяином собаки и вы не собираетесь тренировать спортивную команду?

Вам все равно может пригодиться понимание того, что такое стимульный контроль. Например, если ваши дети бездельничают и не вдут на ваш зов, вы плохо владеете стимульным контролем. Если вы руководите людьми и вам иногда приходится два или три раза повторять приказ или инструкцию, прежде чем они будут выполнены, то значит у вас проблемы со стимульным контролем. Разве не случается, что вы говорите: "Я тебе уже однажды сказала, я говорила тебе тысячу раз, не..." (Не хлопай дверью, или не клади мокрый купальник на кровать, или что-либо в этом роде.) Когда сказать один или тысячу раз недостаточно, поведение не управляется стимулами.
Иногда может казаться, что мы обладаем стимульным контролем когда в действительности этого нет. Мы предполагаем, что сигналу или команде должны подчиниться, а этого не происходит. Самой распространенной реакцией на это является усиление сигнала. Так, официант не понимает вашего французского? Говорите громче. Чаще всего это не помогает. Субъект должен распознавать сигнал, иначе безразлично, кричите ли вы что есть мочи или даже ревете с помощью усилительной аппаратуры рок-ансамбля, на вас будут смотреть невидящим взором.

Другой реакцией человека на игнорирование условного сигнала является бешенство, которое действует только в том случае, если субъект проявляет преднамеренное непослушание, не давая твердо заученного ответа на хорошо выученный сигнал. При этом иногда, показав характер, можно получить хорошее поведение.

Бывает, что субъект отвечает правильно, но с очень большой задержкой или через пень-колоду. Часто неуклюжие ответы на команды определяются тем, что субъект не обучен отвечать быстро. Без положительного подкрепления не только за правильный, но и за проворный ответ на сигнал у субъекта нет шансов усвоить, что успех приносит быстрое повиновение стимулам. При этом поведение в действительности не контролируется стимулами.

Реальная жизнь изобилует плохой организацией управления с помощью стимулов. Как только один человек пытается проявить власть, другой оказывается в опасности проявить "непослушание" В действительности проблема состоит в непонимании команд или сигналов, которым он поэтому не может повиноваться. Это примеры плохой коммуникации или нечеткого управления с помощью стимулов.

Правила управления с помощью стимулов.

Для того, чтобы управлять с помощью сигналов, надо сформировать нужное поведение, а затем, когда оно осуществляется, делать так, чтобы оно происходило во время или сразу после какого-либо определенного сигнала. Этот стимул затем становится ключом, или сигналом, поведения.
Например, предположим, что вы заставляете собаку садиться, надавливая на крестец и подтягивая за ошейник. Это безусловные стимулы, они действуют без обучения. Затем вы подкрепляете любое самостоятельное проявление собакой этой позы, формируя соответствующее поведение. Делая это, вы произносите команду "Сидеть!", которая первоначально ничего не значит для собаки (конечно, подойдет и любое другое слово на любом языке). Когда собака усвоит, что вам иногда надо, чтобы она села, она иногда станет выполнять это действие во время или после предъявления сигнала, или условного стимула, команды "Сидеть!". В конце концов она начнет выполнять действие точно в соответствии с тем, что ей приказывают.

Теперь поведение находится под контролем стимула, не так ли? Еще нет. Проделана только половина работы. Животное следует также обучить — и это специальная тренировочная задача — не садиться без команды. Установление управления поведением стимулами не является завершенным, пока оно совершается и в отсутствии условного сигнала.

Это, конечно, не означает, что собака должна целый день стоять, пока вы не скомандуете: "Сидеть!". Она может садиться сколько ей вздумается. Однако во время тренировок или работы, когда предполагается использование условных стимулов, "пуск" и "стоп" сигналы должны быть твердо установлены, чтобы выполнение команды было надежным.

Итак, полный контроль с помощью стимулов определяется четырьмя условиями, к каждому из которых следует относиться как к самостоятельному разделу тренировочной задачи, самостоятельному пункту программы выработки.
1 Поведение всегда осуществляется сразу после подачи условного стимула (собака садится, "когда ей приказывают).
2. Поведение никогда не возникает в отсутствие стимула
(во время занятий или работы собака никогда не садится спонтанно).
3. Поведение никогда не наблюдается в ответ на другие стимулы (если вы говорите: "Лежать!", собака не должна садиться).
4. Никакое другое поведение не возникает в ответ на данный стимул (когда вы говорите. "Сидеть!" собака не должна ложиться или скакать и лизать ваше лицо)
Только когда все четыре условия соблюдаются, собака действительно полностью и окончательно понимает команду "Сидеть!". Теперь вы действительно управляете ею с помощью стимула.

Где в реальной жизни мы используем или нуждаемся в таком полном управлении с помощью стимулов. Ну к примеру, в музыке. Дирижеры оркестра часто создают очень сложную систему сигнального управления, а на репетиции дирижер может встретиться с самыми разнообразными неправильными реакциями. Например, он может дать сигнал означающий одно, — скажем, "форте", усиление звучания и не получить его, может быть, вследствие того что еще недостаточно прочно установлено значение сигнала. Или он может и не давать сигнала усиления, а тем не менее получить слишком большую интенсивность звука. Особенно этим отличаются духовые инструменты классических оркестров, Рихард Штраус в юмористическом своде правил для начинающих дирижеров говорил: "Никогда не подбадривайте взглядом играющих на духовых инструментах" Дирижер может дать сигнал, требующий другого, — допустим, "престо" а вместо'
увеличения темпа получить усиление звучания солисты теноры проделывают это весьма часто Наконец, дирижер может требовать включения большего числа исполнителей, а вместо этого получить множество ошибок, так происходит с хористами-любителями. Каждый тип неправильного ответа на условный стимул должен быть исправлен с помощью тренировки, прежде чем дирижер будет уверен, что у него или у нее адекватное сигнальное управление.

Так же жизненно важно сигнальное управление в военном деле. Занятия по строевой подготовке с новобранцами — утомительное и трудоемкое дело, и им самим оно может казаться трудным и бессмысленным, но оно выполняет очень важную функцию. Строевая подготовка не только вырабатывает точные реакции на строевые команды, что даст возможность командирам с легкостью приводить в движение большие группы людей, но она также вырабатывает навык ответа на условный сигнал вообще: повиновение команде, которое в конце концов является не столько умственным актом, сколько выученным умением, являющимся решающим, а часто и жизненно важным для солдата. С тех пор как были придуманы армии, строевая подготовка являлась способом выработки этого навыка.

Что может быть сигналом?

Условным стимулом — выученным сигналом может быть все, абсолютно все, что может быть воспринято. Флаги, свет, слова, прикосновения, вибрация, хлопки пробок шампанского — короче говоря, безразлично, какой сигнал вы используете Коль скоро субъект может воспринимать его, сигнал может быть использован для вызова выученного поведения.
Дельфинов обычно тренируют с помощью воспринимаемых зрением сигналов, руки, но я знаю одного слепого дельфина, который выучил много разных типов поведения в ответ на различные прикосновения. Пастушьих собак обычно дрессируют с помощью сигналов, поданных рукой и голосом. Однако в Новой Зеландии с ее широкими просторами, где собака может находиться очень далеко, в качестве условного сигнала используют пронзительные свистки, которые слышны на большем расстоянии, чем голос. Когда новозеландский пастух продает такую собаку, покупателем может оказаться человек, живущий за много миль; так как свистки невозможно записать на бумаге, то старый хозяин обучает нового командам по телефону.

У рыб можно выработать условный рефлекс на звуки или свет — мы все знаем, как аквариумные рыбки устремляются к поверхности, если постучать по стеклу или включить свет. А человеческие существа могут выработать условные связи практически на все что угодно.

В тренировочной ситуации полезно, чтобы для всех субъектов были одни и те же ключи и сигналы, чтобы не только дрессировщик, но и другие люди могли вызывать данное поведение. Поэтому дрессировщики склонны строго следовать традициям в использовании условных стимулов. Во всем мире лошади под седлом начинают движение, когда вы толкаете их пятками в бока, и останавливаются, когда вы натягиваете поводья. Верблюды в зоопарке Бронц ложатся, когда слышат команду "Каш!", даже если рядом с ними никого нет, включая их дрессировщика, говорящего по-арабски; и любой человек знает, что надо сказать, чтобы верблюд лег.

И то, что живущих в Нью-Йорке верблюдов можно с тем же успехом обучить ложиться при словах "Спокойно, крошка!", не имеет ни малейшего значения.
Поэтому-то профессиональные дрессировщики не могут понять, что многие условные стимулы выбраны произвольно. Однажды в платной конюшне я работала с молодой лошадью на корде, обучая ее команде "Вперед!". Тренер конюшни смотрел на это с отвращением и наконец сказал: "Так ничего не выйдет — лошади не понимают "Вперед!", надо цокать". Потом взял веревку у меня из рук, сказал: "Тцо-тцо" и стеганул жеребенка по крупу свободным концов веревки, что естественно тотчас же вызвало движение вперед.
"Понятно?" — сказал он, считая свои слова доказанными.

Я поняла. С тех пор, воспитывая моих пони, я обучала их слушаться не только моих команд, но и любой возможной системы понуканий, окриков, применяемой другими дрессировщиками. Это избавило меня от неприятностей и заставило говорить обо мне как о подающем надежды дрессировщике-любителе. По крайней мере мне не приходилось переделывать моих сигналов!
Обучить пони двум системам команд не только возможно, но и легко. В то время, как на каждый отдельный сигнал вам надо получать только какое-либо одно поведение, вполне достижимо получение одного и того же поведения на несколько условных сигналов. Например, в переполненном людьми помещении оратор может потребовать тишины, воскликнув: "Тихо!", или встать и, подняв руку, жестом призвать к молчанию.

А если присутствующие шумят и при этом находятся в некотором подпитии и, следовательно, отличаются рассеянным вниманием, поможет позвякивание ложкой по стакану. Мы все обучены осуществлять данное поведение в ответ на любой из, по крайней мере, трех этих стимулов.

Введение второго условного стимула для выученного поведения называется переносом стимулов. Чтобы добиться переноса, вы предъявляете старый стимул — допустим, команду, поданную голосом, — как всегда, и новую команду — скажем, сигнал, поданный рукой, — и подкрепляете ответ; затем постепенно делаете старый стимул все менее и менее заметным и одновременно привлекаете внимание к новому, делая его очень выраженным, пока на новый стимул не будете получать столь же хороший ответ, даже тогда, когда старый стимул не предъявляется вовсе. Обычно этот процесс идет несколько быстрее, чем выработка ответа на первоначальный стимул; когда уже выработано "Выполняй это действие" и "Выполняй это действие по команде", то легче выработать "Выполняй это действие также по другой команде".
Интенсивность сигнала и стирание стимулов.

Не существует определенных требований к интенсивности и величине условного сигнала, вызывающего ответ. Первичные, или безусловные, стимулы, дают градуальный ответ в зависимости от интенсивности: реакция на резкий, колющий удар сильнее, чем на булавочный укол, и чем громче внезапный шум, тем сильнее мы вздрогнем. Однако условному стимулу достаточно быть узнаным, чтобы вызвать полный ответ. Вы видите красный свет и останавливаете машину; быстрее или медленнее вы это делаете не зависит от размера светофора. До тех пор, пока вы распознаете сигнал, вы знаете, что делать. Поэтому, как только стимул заучен, возможно не только получить его перенос, но также постепенно его уменьшать, пока он не станет едва различим, но по прежнему будет давать те же результаты. Возможен случай, когда вы можете получать результаты при таких слабых сигналах, которые не видны постороннему глазу. Это называется "стирание" стимулов.
Мы пользуемся стиранием постоянно: то, что поначалу должно быть очень массированным стимулом ("Дик, нельзя сыпать песок на головы другим детям", — говорим мы, вытаскивая Дика из песочниц), со временем превращается в чуть заметный сигнал (просто поднять брови иди погрозить пальцем). Дрессировщики животных иногда добиваются поразительных, просто волшебных результатов с помощью стертых стимулов. Один из самых забавных номеров, которые я видела, проделывал попугай в Парке диких животных в Сан-Диего. Он разражался истерическим хохотом в ответ на чуть заметное движение руки дрессировщика. Представьте себе возможности этого трюка: "Педро, что ты думаешь о шляпе этого человека?" — "Ха-ха-ха!". Поскольку публика не замечает сигнал, единственное выученное попугаем поведение кажется результатом разумного сардонически-язвительного ответа на вопрос; а на самом деле это был четкий ответ на очень ослабленный стимул, а сардонический ум, если и присутствовал, то принадлежал дрессировщику, а может быть, сценаристу.

Однако лучшие примеры обусловливания, стирания и переноса стимулов мне приходилось наблюдать не в мире дрессированных животных, а на репетициях симфонических оркестров. Будучи певцом-любителем, я занималась в нескольких оперных и симфонических хорах, которые часто управлялись заезжими дирижерами. В то время как многие из сигналов, которые подают дирижеры музыкантам, являются более или менее стандартизованными, у каждого из дирижеров есть свои собственные сигналы, и их значение должно быть усвоено в очень короткое время — время на репетицию часто лишь немногим превосходит время на выступление. Однажды на репетиции симфонии Малера "Воскрешение", как раз в тот момент, когда басы собирались вступить с обычной оглушительной силой, я увидела, как дирижер предъявил безусловный сигнал, предупреждавший: "Вступайте мягче", изобразив на лице страшную тревогу, пригнувшись к земле и заслонив лицо рукой, как бы защищаясь от удара. Все поняли смысл переданного сообщения, и в следующие несколько минут дирижер смог ослабить сигнал и уменьшить интенсивность звучания всех частей хора с помощью предостерегающего взгляда, легкого движения спины, имитирующего припадание к земле, или чуть заметного отголоска от прежнего жеста, и наконец, только вздрагивание плеч. Столь же часто дирижеры осуществляют перенос стимулов, сочетая какой-либо известный или самоочевидный жест — скажем, — поднятие ладони кверху для обозначения "Громче" — с незнакомым жестом, таким, как присущий только ему наклон головы или поворот тела — однажды, сидя слева от дирижера среди альтов, я наблюдала дирижерский жест, управляющий громкостью звучания альтов с помощью левой брови.

Одним из результатов введения управления с помощью стимулов является усиление внимания субъекта, необходимое, если он хочет получить подкрепление за правильный ответ, особенно, если стимулы подвергаются стиранию. Бывает, что субъект способен воспринять столь слабые сигналы, в которых не отдает себе отчета сам дрессировщик, подающий их. Классический пример этого — Умный Ганс, лошадь, живущая в Германии. Это было в начале века; ее считали гениальной. Ударами копыт она могла считать, производить арифметические действия, складывать из букв слова и даже извлекать квадратные корни; правильные ответы, конечно, подкреплялись лакомством. Хозяин, в прошлом школьный учитель, был совершенно уверен, что обучил лошадь читать, думать, заниматься математикой и вступать в общение. И действительно лошадь "отвечала" на вопросы даже в отсутствие хозяина. Многие ученые мужи приезжали в Берлин изучать Умного Ганса и убеждались в его гениальности. И лишь одному из психологов удалось показать, что лошадь ориентируется на какой-то сигнал, и, если никто из присутствующих не знает ответа, удары копыта носят неопределенный характер. Потребовалось длительное время и дальнейшее исследование, против которого восставали те, кто был убежден в гениальности лошади; чтобы показать, что сигналом к прекращению ударов копыта был легкий подъем головы хозяина или любого другого человека, задающего вопрос, когда достигалось правильное число, это движение, первоначально усиливаемое широкополой шляпой, которую носил учитель, теперь было столь малым, что его почти не было видно (никому, кроме Умного Ганса), но оно почти не поддавалось подавлению произвольным усилием. Вот поэтому лошадь могла ориентироваться, когда прекращать удары копытом, наблюдая за любым человеком, а не только за хозяином. Феномен Умного Ганса стал нарицательным для любого случая, когда внешне поразительное поведение, начиная от разума животного, кончая психическими явлениями, на самом деле управляется какими-либо мельчайшими или стертыми проявлениями поведения экспериментатора, ставшими условными стимулами для субъекта.

Условные стимулы, вызывающие отвращение.

Единственным случаем, где сила условного стимула, по-видимому, имеет значение, является обычно дрессировка домашних животных — рывок за поводья или привязь, легкий удар по бокам лошади — все это размытый вариант первоначального безусловного стимула, резкого рывка или толчка, сильного удара рукой, которые вызывают ответ, не требующий обучения. Поэтому, если слабый стимул не действует, создается впечатление, что ответ возрастает, если вы усилите стимул. Однако попытки осуществить это на практике встречают большие затруднения.

Выученные сигналы и первоначальные стимулы совершенно различны по своей природе, а новички обычно это не учитывают. Если они не получают ответа, скажем, на легкий рывок, они дергают чуть сильнее, затем еще немного сильнее, и все совершенно без пользы, так как лошадь или собака с той же возрастающей силой тянут в другую сторону.

Профессиональные дрессировщики имеют обыкновение работать над сигналом и применять силу раздельно; они дают условный стимул, и если животное ему не повинуется, они, минуя все градации, немедленно вызывают нужное поведение чрезвычайно сильным неприятным стимулом, способным "освежить память", как выражается один дрессировщик лошадей. Такую же функцию выполняет парфорс в дрессировке собак. При умении даже небольшой человек, используя такой ошейник, может добиться такого рывка, который будет достаточен, чтобы свалить с ног датского дога.

Имея в запасе эти первичные стимулы, можно быстро получить хороший ответ на очень слабые рывки, и, как замечает английская дрессировщица Барбара Вудхаус, это в конечном счете гораздо лучше, чем постоянно дергать и тянуть за шею бедное животное к каким-то промежуточным и бессмысленным целям.

Время отставления.

Чтобы добиться точности ответа на условный стимул, полезно применять прием ограничения времени отставления.

Допустим, ваш подопечный обучился совершать какое-либо действие в ответ на условный сигнал, но обычно имеется некоторый интервал времени между предъявлением стимула и ответом субъекта. Вы пригласили людей на ужин, и они немного запоздали, или ваш слон после сигнала к остановке постепенно замедляет ход и наконец останавливается.

Если вы хотите, то, используя ограничение времени отставания, можете в процессе тренировки так сократить этот интервал, что поведение будет возникать так быстро, как это только физически возможно.
Вы начинаете с того, что устанавливаете нормативный интервал, с которым обычно наблюдается поведение; затем вы подкрепляете только то поведение, которое совершается в течение этого интервала. Поскольку живые существа характеризуются вариабельностью, некоторые ответы будут выходить за пределы интервала и за них не будет даваться подкрепление. Например, если вы подаете ужин точно в назначенное в приглашении время, а не ждете опоздавших, то они рискуют получить все холодное или застать меньший выбор.
Когда вы подобным образом установите временной интервал и будете давать подкрепление только на его протяжении, то скоро вы обнаружите, что постепенно все ответы начинают наблюдаться в его пределах и ни один не выходит за него. Теперь вы снова можете подтянуть гайки. Достаточно ли пятнадцати минут, чтобы семья собралась? Начните подавать на стол через двенадцать минут после того, как всех позвали, или через десять. Как быстро вы будете закручивать гайки, должно быть точно определено; как и при каждом процессе выработки желательно находиться в тех пределах, в которых наиболее часто наблюдается данное поведение.
Животные и люди имеют очень развитое чувство времени и чрезвычайно четко реагируют на выработку времени отставания, но дрессировщик не должен полагаться на авось.

Пользуясь часами или даже секундомером, если хотите, чтобы выработка отставления работала на вас. Для поведения ближайших окружающих, включая себя, сократите время ответа, скажем, с пяти тактов до двух. И конечно, если вы работаете с людьми, не обсуждайте ваши действия; вы не получите ничего, кроме возражений. Просто делайте и смотрите, что получается.
В 1960 г. в океанариуме "Жизнь моря" одним из наиболее эффектных номеров, всегда привлекавших внимание, была группа из шести небольших дельфинов, выполнявших различные акробатические трюки в воздухе синхронно. Они совершали различные прыжки и повороты в ответ на подводные звуковые сигналы. Первоначально, когда сигналы только вводились, прыжки, вращения и все остальные действия, которые от них требовались, возникали спорадически с интервалами пятнадцать-двадцать секунд. Но использовав секундомер и установив фиксированное отставание, мы смогли снизить время реакции до двух с половиной секунд. Каждое животное знало, что получить рыбу можно только выскочив в воздух и совершив нужный прыжок или вращение в течение двух с половиной секунд после начала сигнала.

В результате дельфины располагались вокруг подводного источника звука навострив уши, и когда включался сигнал, поверхность бассейна просто взрывалась их телами, извергающимися в воздух; это было действительно зрелище. Однажды, сидя среди зрителей, я была поражена, услыхав, как какой-то человек профессорского вида, — по-видимому психолог, безапелляционно объяснял своим спутникам, что единственный способ, который мы могли применить, чтобы добиться такой реакции, является удар электрического тока.
В реальной жизни ограничение времени отставания является попросту тем временем, которое вы считаете нужным ждать, пока просьба или инструкция будут выполнены. Родителей, начальников, и учителей, которые проявляют последовательность в выработке определенного временного интервала реакции, обычно считают хорошими, заслуживающими того, чтобы с ними иметь дело, даже если отставание — временное "окно", в течение которого должно осуществляться поведение, которое будет подкреплено, — очень короткое.

Предвосхищение.

Наиболее частым недостатком в управляемом сигналами поведении является предвосхищение: как только сигнал усвоен, субъект так стремится продемонстрировать требуемое поведение, что совершает его раньше, чем подается сигнал.

Термин, описывающий это проявление, заимствован из опережающего поведения у людей при состязаниях в беге — опережая выстрел, фальстарт, ложная тревога. Люди, которые опережают указания и просьбы других, обычно считаются нетерпеливыми, выскочками или подобострастными; это очень раздражающая привычка, а вовсе не добродетель.

На соревнованиях по выучке с доберман-пинчерами часто бывают неприятности. Хотя эти собаки прекрасно поддаются дрессировке, они столь возбудимы, что предвосхищают команды по малейшим намекам и начинают работать прежде, чем им в действительности приказывают, теряя при этом баллы. Предвосхищение является обычной ошибкой лошадей, с которых бросают лассо на родео. Предполагается, что ковбой и лошадь должны ждать за барьером, пока не пустят бычка, но возбужденная лошадь перескакивает барьер раньше сигнала.
Ковбой иногда думает, что у него лошадь с высокими ходовыми качествами, но на самом деле это просто недостаточно выработанное управление с помощью сигналов.

Другой чрезвычайно распространенный случай предвосхищения — офсайт в американском футболе. Один из игроков так нетерпелив, что продвигается на территорию другой команды до того, как подан сигнал игры, за что команду наказывают.

С практической точки зрения ликвидировать предвосхищение можно, вводя тайм-ауты. Если субъект предвосхищает сигнал, и если это нежелательно, прекратите, всякую работу. Не давайте сигналов и ничего не делайте целую минутy. Каждый раз как субъект опередит выстрел, останавливайте часы. За нетерпение вы наказываете отставлением возможности работать. Это вызывает очень эффективное подавление опережения команды, в то время как выговоры, наказание или повторение могут оказаться вовсе недейственными.
Стимулы в качестве подкрепления: поведенческие цепи.

Как только стимул становится условным сигналом, происходит интересная вещь: он превращается в подкрепление. Вспомните звонок на перемену в школе. Звонок на перемену является сигналом, условным сигналом, означающим: "Вы свободны, идите и играйте". А кроме того, он воспринимается как подкрепление — дети рады, когда слышат его, и если бы они смогли сделать что-либо, чтоб заставить его прозвенеть скорее, они бы это сделали. Теперь представьте себе звонок на перемену, который не звонит, если в классе нет тишины. Ко времени перемены у вас будет очень тихий класс.

Условный стимул — предвестник подкрепления, и поэтому он становится желаемым событием. Желаемое событие — это само по себе уже подкрепление, а потому вы с успехом можете подкреплять поведение, давая условный стимул другого поведения. Например, я вознаграждаю кошку лакомством, когда она подходит ко мне по команде — она этому научается и выполняет это. Теперь, если я буду говорить: "Ко мне" и вознаграждать ее за реакцию всякий раз как увижу ее — на камине, то скоро окажется, что кошка, стремясь получить лакомство, будет забираться на камин. Как вы помните, с точки зрения кошки, она обучает меня давать ей лакомство. Для этого она нашла способ заставлять меня произносить: "Ко мне". Теперь допустим, что я обучаю ее вспрыгивать на камин, когда я жестом показываю на него, подкрепляя правильные ответы либо пищей, либо командой "Ко мне". Затем я буду жестом указывать на камин всякий раз, когда: а) я знаю, что кошка голодна и б) когда она случайно перевернется через спину...
Я выработала цепное поведение.
Поведенческие цепи — очень распространенное явление.
В реальной жизни мы часто производим серии связанных действий, состоящих из многих отдельных поведенческих актов. Не надо далеко ходить за примерами — работа плотника или уборка квартиры — неплохая иллюстрация. Мы ожидаем, что и наши питомцы будут вести себя так же: "Подойди", "Сядь", "Ляг", "Следуй за мной" и так далее без перерыва и без видимого подкрепления. Эти длительные рады действий являются цепным поведением. В противоположность другим длительным действиям эти могут выполняться часами, сотни раз без напряжения, без сбоев, без задержек, поскольку каждый акт в действительности подкрепляется возможностью выполнить следующее, действие цепочки, и так до заключительного подкрепления выполнением всего дела, всей цепи.

Однако поведенческие цепи рвутся и поведение рассыпается на элементы, если в цепочку вклинивается не выученный поведенческий акт, или действие, не находящееся под контролем стимулов. Вы не можете подкрепить субъекта сигналом, если он этот сигнал не распознает или не может выполнить то, что этот сигнал требует. Отсюда следует, что цепное поведение следует всегда вырабатывать с конца. Начинайте с последнего действия в цепи, удостоверьтесь, что оно усвоено и сигнал к его выполнению хорошо узнается, лишь потом переходите к разучиванию предпоследнего действия и т. д. Например, если при заучивании стихотворения, мелодии, текста речи, роли в пьесе вы разделите задания, скажем, на пять частей и начнете запоминать их в обратном порядке, с конца — вы всегда будете двигаться от того, что вы знаете слабее, к тому, что знаете более прочно, от материала, в котором вы не совсем уверены, к материалу, хорошо уже усвоенному, имеющему подкрепляющее действие. Запоминание материала в том порядке как он написан и должен воспроизводиться приводит к необходимости постоянно продираться от знакомой тропы в сторону более трудного и неизвестного, что — является не подкреплением. Подход к запоминанию материала как к цепному поведению не только убыстряет процесс запоминания, но и делает его более приятным.
Поведенческие цепи — это особое понятие. Я часто сама спотыкалась на них, чувствуя, что надо вернуться к концу ряда, так как я не могу заставить животное, ребенка или себя выполнить кажущуюся простой последовательность действий, пока я не понимала, что пыталась выработать цепное поведение не с того конца. Когда делают пирог, — то глазурью его украшают в последнюю очередь, но если вы хотите обучить ребенка получать удовольствие от приготовления пирога, начните с того, что попросите "помочь" украсить его глазурью.

Пример цепного поведения: обучение собаки игре в фризби (пчелку).
Один мой нью-йоркский знакомый каждый выходной ходил со своим золотистым спаниелем в Центральный парк, чтобы играть в "пчелку". Он рассказывает мне, что сплошь и рядом встречает людей, безуспешно пытающихся обучить своих собак этой игре. Это досадно, потому что игра в "пчелку" прекрасный способ тренировки собаки в городе. По сравнению с простым мячом "пчелка" летит медленнее и по неопределенной траектории, возможно, больше напоминает реальную дичь, заставляет собаку совершать прыжки в попытках поймать ее, что доставляет удовольствие и хозяину. И, наконец, игра в "пчелку" позволяет хозяину, оставаясь на одном месте, заставлять собаку бегать.

Люди жалуются, что, когда они бросают "пчелку", собака наблюдает за ее полетом, продолжая оставаться на месте, хотя если ее раззадорить, то она будет прыгать, пытаясь схватить "пчелку", когда та пролетает мимо. В этой игре два дрессировочных момента: первый состоит в том, чтобы обучить собаку, на какое расстояние она должна отбегать за "пчелкой". Второй состоит в том, что данная игра — цепное поведение: сначала собака гонится за "пчелкой", затем ловит "пчелку", наконец, несет ее назад хозяину, чтобы он снова кинул ее. Поэтому каждому элементу этого сложного поведения следует обучать отдельно, и последнее действие в цепи, принос, должно быть выработано первым.

Вы можете обучить приносу с очень маленьких расстояний даже в доме, используя предмет, который легко носить, скажем, старый носок. Большинство охотничьих собак приносят предметы сами, без обучения, собак некоторых пород, таких, как бульдоги, боксеры, необходимо обучать класть апорт около хозяина или отдавать его в руки, поскольку они предпочитают игры, в которых бы вещи у них отбирали.

Когда по команде собака будет приносить предметы, обучите ее ловить "пчелку". Сначала заставьте собаку как можно сильнее заинтересоваться "пчелкой", двигая ее у самой морды. Позвольте ей несколько раз взять игрушку в рот и добейтесь, чтобы она отдала вам ее обратно, при этом, конечно, бурно поощряйте ее за возврат. Затем подбросьте игрушку в воздух, позвольте собаке завладеть ею в прыжке и заставьте отдать обратно. Затем вы тут же снова подбрасываете игрушку в воздух и бурно радуетесь, когда собака ее поймает. И теперь вы на прямой дороге к получению великолепного игрока в "пчелку".

Расстояние бросков постепенно увеличивается, и собаке необходимо научиться следить за "пчелкой" и перемещаться так, чтобы поймать ее. Это требует тренировки, поэтому может понадобиться пара выходных, чтобы заставить собаку отходить на семь-восемь метров. Некоторым очень быстрым собакам удается оказываться точно на месте и ловить "пчелку" на таком большом расстоянии, на какое вы сможете ее забросить. Мне приходилось встречать необыкновенных собак, которые могли поймать "пчелку" на другом конце футбольного поля. Создавалось впечатление, что собаки получают удовольствие от точности своей оценки места падения.

Блестящий бег или фантастические захваты в прыжках с переворотом, которые вызывают восторг зрителей, — тоже доставляют собаке радость. Тем не менее, поймав "пчелку", собака несет ее вам, поскольку последнее звено цепи разучено первым и поскольку именно это действие приводит к подкреплению, будь то ваша похвала или другой бросок. Разумеется, если вы будете невнимательны и собака будет систематически не получать похвалы или следующего броска не будет, принос подвергнется затуханию. И еще, когда собака слишком устает и не хочет больше играть, она начинает все хуже и хуже приносить "пчелку", медлит с возвращением и бросает ее на полпути. Это означает, что пора остановиться — вы оба уже взяли от игры все.
Генерализованное управление с помощью стимулов.

С большинством животных приходится сначала немного повозиться, чтобы установить управление их поведением с помощью стимулов, но часто к тому времени, как берете под контроль сигналов третий или четвертый тип поведения, оказывается, что животное как бы обобщает, у него появляется нечто вроде понимания идеи. Выучив три-четыре условных поведенческих акта, большинство субъектов, по-видимому, начинают распознавать определенные события в качестве сигналов, каждый из которых означает свой тип поведения, и что получение подкрепления зависит от правильного распознавания и ответа на сигналы. С этого момента введение условных сигналов становится простым. У субъекта уже имеется общая картина, и все что ему надлежит сделать — это научиться классифицировать новые сигналы и ассоциировать их с правильным поведением. Если вы, как дрессировщик, поможете питомцу, сделав это понятным, последующее обучение может идти само собой много быстрее, чем трудные начальные шаги.

У людей обобщение происходит еще быстрее. Если вы вознаградили за ответ только на одну выученную команду, люди очень скоро начинают давать ответы и на другие команды, чтобы заслужить подкрепление. Мой друг Ли, учитель математики шестого класса школы в одном из непривилегированных районов Нью-Йорка, каждый учебный год начинает с того, что обучает школьников выбрасывать жевательную резинку, как только он попросит их об этом. Никакого принуждения. Просто: "Все, внимание, жевательную резинку изо рта. Хорошо! Стоп! Подождем, у Дорин она еще есть... великолепно! Она ее вынула. Молодец, Дорин!". Он говорит детям, что после урока они могут снова взять жевательную резинку (используя в качестве подкрепления слова "Класс свободен!"). Это может показаться фривольным и даже глупым (поскольку это стоит Ли вида жующих челюстей, чего он терпеть не может), но Ли установил, что этот первый опыт подготавливает его класс к тому, что выполнение его просьб создает возможность подкрепления. Конечно, подобно хорошему дрессировщику китов, он использует разнообразные подкрепления, помимо хороших отметок и собственной похвалы, включая игры, одобрение сверстников, более ранее окончание урока, даже раздачу жевательной резинки. И конечно, сначала он уделяет много времени жевательной резинке, вместо того, чтобы уделять его десятичным дробям, дети думают, что он помешан на резинке. Но дети так же придают значение его словам и считают, что имеет смысл делать то, что хочет Ли.

Другие учителя думают, что у Ли врожденное умение поддерживать тишину в классе, а директор считает его хорошим "дисциплинщиком". Что же касается Ли, то он считает детей достаточно сообразительными, чтобы обобщить свои реакции, и любит их за это. А жевательная резинка тут ни при чем.
Провалы преднаучения и вспышки раздражения.

Установление контроля над поведением с помощью стимулов часто порождает интересный феномен, который один из тренеров назвал "провалом преднаучения". Вы сформировали поведение и теперь пытаетесь сделать его управляемым с помощью стимулов. Но когда вам кажется, что субъект уже проявляет способность отвечать на стимулы, он внезапно перестает отвечать не только на стимулы, но и вообще давать нужные реакции. Он ведет себя так, будто никогда и не слышал о действиях, которые вы сформировали.
Этот момент полностью обескураживает тренера. Вот вы очень изобретательно научили цыпленка танцевать, а теперь хотите, чтобы он танцевал только, когда вы поднимаете правую руку. Цыпленок смотрит на вашу руку, но не танцует.

Или же он может стоять на месте, когда вы подаете сигналы, и начинать интенсивно отплясывать, когда никакого сигнала не было.
Если вы построите график этой последовательности, то увидите постоянно идущую кверху линию, отражающую увеличение процента правильных ответов (т. е. ответов на сигналы), которая затем резко снижается, ибо соответственно правильность ответов падет до нуля (когда вы имеете букет отсутствия ответов и неправильных ответов). Однако если вы продолжаете упорно работать, затем внезапно наступает озарение: вдруг, совершенно случайно, субъект скачком начинает отвечать на команды действительно идеально — вы поднимаете руку, цыпленок танцует. Поведение управляется стимулами.
На мой взгляд, происходит вот что: сначала субъект выучивает сигнал, не осознавая этого, дрессировщик видит только обнадеживающую тенденцию медленного нарастания правильного выполнения команд. Но затем субъект замечает (!) сигнал и осознает, что на него надо как-то отвечать, чтобы получить подкрепление. В этот период он уделяет большее внимание сигналу, чем проявляемому поведению. Конечно, при этом ответ отсутствует, так же как и подкрепление. Когда же, по случайному стечению обстоятельств, или в результате упорства тренера, субъект однажды осуществит реакцию при наличии сигнала и получит подкрепление, у него "возникнет картина". С этого момента он "знает", что означает сигнал, и отвечает на него правильно и уверенно.

Я понимаю, что говорю по этому поводу много таких слов, как "отдает себе отчет", "знает" в отношении того, что происходит в голове субъекта, которые большинство психологов считают неприменимыми к животным. Однако при дрессировке животных иногда так оно и есть, что уровень правильных ответов постепенно нарастает, хотя внешне ничего существенного не происходит; трудно сказать, с какого момента, если таковой вообще существует, животное начинает осмысленно отдавать себе отчет в том, что делает. Но наличие провала преднаучения, по моему мнению, является отражением осознания, вне зависимости от того, какие процессы в это вовлекаются. Я могла обнаружить ярко выраженное проявление провала преднаучения (а следовательно, и своего рода сдвиг осознания) в данных Мишеля Уолкера, исследователя из Гавайского университета, ставившего эксперименты по сенсорному различению у тунца, одного из наиболее разумного вида рыб, но в конце концов только рыбы.

Для субъекта провал преднаучения — время наибольших огорчений. Мы все знаем, как расстраивает борьба с тем, что понимаем только наполовину (общеизвестный пример — математические понятия), зная только то, что по-настоящему их не понимаем. Часто субъект бывает настолько расстроен, что проявляет гнев и агрессивность. Дети разражаются слезами и тычут в учебник математики карандашом. Дельфины многократно выпрыгивают из воды и шлепаются о ее поверхность со страшным шумом. Лошади размахивают хвостом и норовят лягнуть. Собаки рычат. Доктор Уолкер обнаружил, что если при выработке распознавания стимула он допускает, что его подопытные тунцы и совершают ошибки и не получают подкрепления более сорока пяти секунд, они настолько расстраиваются, что выпрыгивают из бассейна.

Я пришла к тому, что стала называть эти проявления преднаучения вспышками раздражения. Мне кажется, что вспышки раздражения возникают потому, что субъект, считавший себя всегда правым, вдруг обнаруживает, что он ошибается (раз за разом), а причина этого неясна... пока. У людей вспышки раздражения в период преднаучения, по-видимому, часто происходят в моменты, когда бросается вызов привычным представлениям, которых длительно придерживались, а где-то в глубине души субъект знает (!), что в новой информации кроется некая правда. Именно распознание того, что выученное ранее не совсем верно, по-видимому, и приводит к неистовым возражениям, чрезмерным ответам, которые намного превышают степень несогласия, спорам, скандалам, которые могут казаться по наитию наиболее подходящими и вероятными к случаю. Иногда, рассказывая о подкреплении в научных кругах, я вызывала, большую, чем предполагала, враждебность со стороны представителей других дисциплин, начиная от психологов, занимающихся познавательными процессами, кончая нейрологами и представителем высшего духовенства. Я часто подозреваю, что гневные слова являются симптомом преднаучения.

Я всегда сожалею, когда вижу приступы плохого настроения, связанного с преднаучением, даже у тунцов, потому что при определенных навыках можно провести субъекта по пути обучения, не вызывая столь большого раздражения. Однако я пришла к убеждению, что вспышки раздражения в период преднаучения являются четким индикатором того, что вот-вот произойдет истинное обучение. Если вы отойдете в сторонку и дадите ему отшуметь как ливню, то вслед за этим может появиться радуга.

Применение управления с помощью сигналов.

Никому не нужно постоянно управлять или быть управляемым с помощью условных стимулов или выученных сигналов, живые существа — это не машины. В действительности реакция на выученный сигнал представляет собой усилие, причем такое усилие, которое не только не должно, но и не может поддерживаться постоянно.

Большую часть времени у начальника нет надобности держать подчиненных радом. Если дети бездельничают, а вы не очень спешите, то вы можете сами расслабиться. Служащим, которые и так уже работают с полной отдачей, не нужны приказы и инструкции. Ни нас самих, ни других людей не должны опутывать ненужные правила и регламентации: они вызывают только сопротивление.

Совершенно очевидно, что управление с помощью стимулов используется, чтобы дети стали воспитанными, домашние животные слушались, персонал был надежным и т. д.

Очень своеобразное управление с помощью стимулов необходимо также для многих видов коллективной деятельности, таких, как марширующие колонны, танцевальные ансамбли, спортивные команды. Отвечать на выработанную систему выученных сигналов доставляет определенное удовольствие, даже животным, по-видимому, это нравится. Я думаю, это происходит оттого, что стимулы становятся подкреплениями, как в поведенческой цепи, так что, когда овладеваешь всеми типами поведения и сигналами, осуществление ответов имеет сильное подкрепляющее действие. Словом, это интересно.
Отсюда то удовольствие от участия в управляемой стимулами групповой деятельности, как, например, согласованный танец, игра в футбол, хоровое пение и игра в оркестре.

Когда мы видим какой-либо пример прекрасно управляемого сигналом поведения, начиная с фигур высшего пилотажа, исполняемых группой истребителей, до класса хорошо умеющих вести себя детей, то, желая похвалить их, используем понятие дисциплины. "Они поистине хорошо дисциплинированы" или "Этот учитель знает, как поддерживать дисциплину". Однако понятие о дисциплине включает применение наказания, которое, как мы видели, совершенно не нужно при установлении управления с помощью стимулов.
В обиходе сторонниками дисциплины считаются инструктор, родитель, тренер, которые требуют совершенного исполнения и наказывают за любое отклонение, а совсем не те, кто добивается совершенства, подкрепляя улучшения в его сторону. И именно поэтому люди, задавшиеся целью установить "дисциплину", часто пытаются управлять с помощью стимулов на основе: "Делай, что я скажу, иначе..." Поскольку субъект должен ошибиться или не послушаться, чтобы узнать, что значит "иначе", и поскольку тогда становится уже слишком поздно этого не совершать, то этот распространенный подход вовсе не так хорош.

Истинное, изящное управление сигналами, установленное с помощью подкрепления, может делать то, что мы считаем дисциплиной субъекта. Однако кто должен стать действительно дисциплинированным так это тренер.
Да, но с чего начать? Что, если вы живете и работаете среди людей, которые являются закоренелыми неслухами?
Вот система Карен Прайор эффективного воздействия в тяжелом случае.
Карен Прайор (видя мокрые плавки и полотенце Юного Гостя на кушетке в гостиной): Пожалуйста, снимите свои мокрые вещи с кушетки и повесьте на сушилку.
Юный Гость: 0'кей, минуточку.
К. П. (подходит к Ю. Г. и стоит рядом с ним молча).
Ю. Г. В чем дело?
К. П. Пожалуйста, снимите свой мокрый купальник с кушетки и повесьте на сушилку (NB: не прибавляя: "Сейчас же!", "Сию минуту!", "Я сказала" или что-нибудь в этом роде. Я обучаю этого человека выполнять просьбы с первого раза, а не ждать, когда сигнал будет усилен дальнейшими деталями ими угрозами.)
Ю. Г. Вот еще, если вы так спешите, то почему бы вам не сделать это самим?
К. П. (Любезная улыбка, но никакого ответа. Я жду момента подкрепить желаемое поведение. Препирательство со мной не является желаемым поведением, поэтому я пренебрегаю им.)
Ю. Г. Ладно, ладно (Встает, идет к кушетке, забирает вещи, бросает их в комнату, где стирают.)
К. П. В сушилку.
Ю. Г. (Ворчит, поднимает и вешает вещи на сушку.)
К. П. (Широкая улыбка, искренне, без издевки) Благодарю вас!
В следующий раз, когда мне будет нужно попросить юного гостя что-нибудь сделать, возможно, мне потребуется всего лишь взглянуть на него, чтобы вызвать действие. Мало-помалу он станет одним из тех домочадцев, которые быстро исполняют мои просьбы, а я со своей стороны — буду платить ему тем же, буду выполнять то, что он просит, если это выполнимо, и буду стараться не просить его делать более, чем он должен.
Знание того, как добиться управления с помощью стимулов, не прибегая к крику и принуждению, в равной мере облегчает жизнь всем — воспитателю и обучаемому. Когда моя дочь Гейл поступила в высшую школу, ей пришлось ставить учебную пьесу, ежегодно для этого выбирали кого-либо из студентов.

Обсудить статью на форуме

...