Переход на главную | ||||||||||||
Рубрика: психология
Прайор Карен - Нe рычите на собаку! ПРЕДИСЛОВИЕ АВТОРА Переход на страницу: [1] [2] [3] Страница: [1] О ДРЕССИРОВКЕ ЖИВОТНЫХ И ЛЮДЕЙ ИЗДАТЕЛЬСТВО "СЕЛЕНА+" - МОСКВА 1995 ПРЕДИСЛОВИЕ АВТОРА Эта книга о том, как обучать кого угодно: человека или животное, старого или молодого, самого себя или других -- и чему угодно. Как добиться, чтобы кот спрыгнул с кухонного стола, а бабушка перестала ворчать; как управлять поведением домашних животных, детей, начальства и друзей; как улучшить свои достижения в теннисе, гольфе, математике, развить память? Все это можно достичь, используя принципы обучения с подкреплением. Эти принципы являются такими же непреложными законами природы, как законы физики. Они лежат в основе всех ситуаций обучения, точно так же, как падение яблока основано на законах гравитации. При попытке изменить чье-либо поведение, будь то собственное или чужое, мы используем эти законы, независимо от того, знаем мы их или нет. Чаще всего мы их применяем неправильно. Мы запугиваем, спорим, принуждаем, лишаем чего-либо. Мы ругаем окружающих, когда дела идут плохо, и забываем похвалить, когда все хорошо. Мы грубы и нетерпеливы с детьми, друг с другом, даже сами с собой, и потом сожалеем об этой грубости. Зная лучшие способы управления поведением, мы достигли бы своей цели быстрее, к тому же без нервотрепки, но мы не представляем, как это сделать. Мы попросту не можем привести в соответствие те приемы, которыми современные дрессировщики достигают успеха, с законами положительного подкрепления. Какой бы ни была наша задача -- заставить ли четырехлетнего малыша вести себя тихо при посторонних, отучить ли щенка грызть дома все что попало, тренировать ли спортивную команду, выучить ли стихотворение -- она решается быстрее, легче, веселее, если вы знаете, как пользоваться положительным подкреплением. Законы подкрепления просты: их можно за десять минут записать на школьной доске и за час выучить. Применение их в основном зависит от ситуации, обучение с подкреплением подобно игре, в которой надо быстро соображать. Каждый может быть тренером, но некоторые от природы способны к этому больше, чем другие. Вам вовсе не обязательно отличаться каким-то особым терпением, быть сильной личностью, не требуется и особого подхода к детям и животным, можно не обладать и тем, что цирковой дрессировщик Франк Бук называет силой человеческого взгляда. Вам надо только знать, что вы делаете. Всегда были люди с интуитивным пониманием того, как применять законы дрессировки. Мы называем их талантливыми учителями, блестящими военачальниками, выдающимися тренерами, гениальными дрессировщиками. Мне приходилось наблюдать за некоторыми театральными режиссерами и многими дирижерами симфонических оркестров, которые очень умело использовали в своей работе подкрепление. Эти одаренные воспитатели не нуждаются в книге о том, как использовать законы, управляющие обучением. Однако для всех нас остальных -- простых смертных, -- кто вслепую пытается совладать с плохо управляемым питомцем, вступает в конфликт с ребенком или сослуживцем, знание законов подкрепления может сослужить хорошую службу. Обучение с подкреплением -- это вовсе не система наград и наказаний; современные тренеры даже не используют этих терминов. Награды и наказания приходят обычно после того, как действие совершено, часто спустя длительное время, как, например, в уголовном суде. Они могут повлиять, а могут и не повлиять на будущее поведение, но они, безусловно, не могут воздействовать на уже совершенное действие. Подкрепление -- будь то "положительное" , то, к чему надо стремиться, например, улыбка или ласка, или "отрицательное" -- то, чего надо избегать, подобно рывку поводка или нахмуренным бровям -- происходит именно во время поведения, на которое надо воздействовать. Подкрепление изменяет поведение только тогда, когда дается в правильно выбранный момент. Впервые я услышала об обучении с положительным подкреплением на Гавайях, куда в 1963 году я была приглашена старшим тренером дельфинария "Жизнь моря". Раньше я дрессировала собак и лошадей, пользуясь традиционными методами, но дельфины -- другое дело; на животное, которое просто уплывает от тебя, не воздействуешь поводком, уздечкой или даже кулаком. Положительное подкрепление -- в основном ведро с рыбой -- единственное, чем мы располагаем. Психологи в общих чертах познакомили меня с принципами обучения с подкреплением. Искусство применения этих принципов я постигла при работе с дельфинами. Имея биологическое образование и всю жизнь интересуясь поведением животных, я оказалась очарованной не столько дельфинами, сколько моим с ними взаимным общением во время дрессировки. То, чему я обучилась, работая с дельфинами, я стала применять и в дрессировке других животных. И я начала замечать, как эта система входит в мою повседневную жизнь. Например, я перестала кричать на своих детей, потому что заметила, что крик не помогает. Подмечать поведение, которое мне нужно, и сразу подкреплять его -- это гораздо более действенно, да к тому же еще и сохраняет мирные отношения в семье. Тот опыт, который я извлекла из дрессировки дельфинов, имеет солидное теоретическое обоснование. В этой книге я постаралась держаться подальше от теоретизирования, так как, насколько мне известно, правила по применению этих теорий обычно не описываются наукой и, с моей точки зрения, ученые часто неправильно ими пользуются. Но основные законы уже твердо установлены и должны приниматься во внимание при обучении. Основа этой теории по разным источникам известна как модификация поведения, теория подкрепления, оперантное обусловливание, бихевиоризм, психология поведения и т.д.; это тот раздел психологии, который принес мировую известность Б.Ф.Скиннеру, профессору Гарвардского университета. Я не знаю другой современной области науки, которую бы в такой степени поносили, не понимали, переиначивали, неправильно истолковывали и неверно использовали. Одно только имя Скиннера приводит в ярость тех, кто является поборником "свободной воли" в качестве характеристики, отделяющей человека от животного. Для тех, кто воспитан в гуманистических традициях, воздействие на поведение человека при помощи своего рода осознанной техники кажется непоправимо безнравственным, несмотря на тот очевидный факт, что все мы пытаемся влиять на поведение друг друга любыми попавшимися под руку средствами. Пока гуманисты нападали на бихевиоризм и самого Скиннера с таким же жаром, с каким когда-то правоверные обрушивались на еретиков, бихевиоризм превратился в громадный раздал психологии, которым занимаются целые факультеты в университетах, он широко применяется в клинике, бихевиористы издают специальные журналы и созывают международные конгрессы бихевиоризму обучают на специальных курсах, в нем возникает ряд доктрин и разных течений, ему посвящаются целые горы литературы. Это принесло определенную пользу обществу. Некоторые болезни -- например, аутизм -- оказались более чувствительны к формированию и подкреплению, чем к любым другим воздействиям. Многие врачи успешно разрешали эмоциональные проблемы своих пациентов, используя приемы бихевиоризма. Большая эффективность простого изменения поведения по сравнению со скорпулезным копанием в источниках его происхождения -- по крайней мере в некоторых обстоятельствах -- способствовала возникновению семейной терапии, в которой рассматривается поведение каждого "иена семьи, а не только того, чье страдание наиболее очевидно. Обучающие машины и программированные учебники, разработанные на основе Скиниероаской теории, были первыми попытками разбить обучение на этапы и поощрять обучающегося за правильные ответы. Эти ранние механизмы были неуклюжими, но именно они были предвестниками компьютерного обучения, которое оказалось не только высокоэффективным, благодаря совершенству выбора времени подкрепления компьютером, но и висело в процесс обучения веселые нотки в связи с забавным характером подкрепления (фейерверки, танцующие роботы). Программы подкрепления, использующие жетоны и талоны, которые можно накопить и обменять на конфеты, сигареты или какие-то льготы, были установлены в психиатрических лечебницах и некоторых других учреждениях. Нет недостатка в программах аутотренинга, позволяющих следить за весом и изменением других привычек в нужную сторону, и все они основаны на положительном подкреплении. Интересным применением подкрепления для тренировки физиологических реакций является биологическая обратная связь. Академические ученые изучили мельчайшие аспекты обуславливания. Например, одно исследование показывает, что если вы составляете таблицу, чтобы следить за своими успехами в выполнении какой-либо саморазвивающей программы, то вы скорее выработаете новые привычки, если будете ежедневно не ставить в клеточке соответствующей графы крестик, а сплошь ее зачеркивать. Обрастание деталями преследует конкретные психологические цели, но я не смогла извлечь из них большой пользы для обучения. Тренинг представляет собой петлю, двустороннюю связь, в которой события на одном конце изменяют события на другом, точно так же, как это происходит в кибернетической системе с обратной связью, хотя многие психологи рассматривают свою работу, как нечто, что они дела ют по отношению к субъекту, а не совместно с ним. Для настоящего тренера наиболее интересными и потенциально наиболее плодотворными событиями в процессе обучения являются идеосинкразические и неожиданные ответы, которые может дать каждый испытуемый, хотя почти во всех научных работах стремятся игнорировать и свести к минимуму индивидуальные реакции. Изобретение методов, которые Скиннер назвал "формирование" для последовательного изменения поведения и реализация этих методов -- процесс творческий. Несмотря на это, психологическая литература изобилует программами формирования, которые Настолько невообразимы, чтобы не сказать неуклюжи, что, с моей точки зрения, представляют собой жестокое и необычное наказание. Возьмем, например, приводимый в одном из последних научных журналов метод борьбы с ночным самопроизвольным мочеиспусканием, который включает не только установку специальных датчиков влажности в детской постели, но и присутствие врача, проводящего ночь рядом с ребенком! При этом авторы указывают, что этот способ дорого обходится семье. А какова же его цена для психики ребенка? Такой способ "поведенческого" решения вопроса подобен попытке бить мух лопатой. Прежде чем двигаться дальше, я должна извиниться перед всеми профессиональными бихевиористами, которые обеспокоены моим лихим использованием терминологии теории подкрепления. Словарь Скиннера имеет несколько элегантных определений, таких, как оперантное обучение, которое подчеркивает, что субъект является оператором, а не только пассивным участником, или последовательное приближение, предполагающее постепенный характер процедуры формирования навыков. Однако, обучая тренингу, я обнаружила, что люди спотыкаются об эту непривычную терминологию. Чтобы четко изложить предмет, вы должны обучить двум вещам; самой сущности работы и подходящему способу ее обсуждения. По мере распространения из университета в университет Скиннеровская терминология подверглась некоторой модификации; то, что одни называют условными стимулами, другие предпочитают именовать различительными стимулами, а третьи употребляют жаргонное выражение "S-дельта". Этот специфический словарь все время разрастается. Поэтому я пожертвовала научной точностью ради такой терминологии, которая, как мне кажется будет понятной. Шопенгауэр сказал однажды, что каждая оригинальная идея сначала осмеивается, потом на нее яростно нападают, и, наконец, она принимается как нечто само собой разумеющееся. Насколько мне известно, теория подкрепления не является исключением. Несколько лет назад Скиннера повсюду высмеивали за то, что он продемонстрировал формирование навыка, обучив пару голубей играть в пинг-понг. Теплая, комфортабельная, самоочищающаяся, полная забав комната, которую он оборудовал для своих маленьких дочерей, была высмеяна, как антигуманный, аморальный и еретический "ящик для ребенка", чуть ли не тюремная камера. До сих пор ходят слухи, что его дочери сошли с ума, хотя на самом деле они выросли прекрасными работниками и очень славными людьми. И, наконец, сейчас многие образованные люди относятся к теории подкрепления как к некому пустяку, который они понимают и знают вдоль и поперек. Фактически же большинство людей ее не понимает, иначе бы они не вели себя так скверно с окружающими. В течение многих лет, с тех пор, как я начала заниматься экспериментами по тренировке дельфинов, я читала лекции и писала о правилах подкрепления для научных и профессиональных кругов, а также для широкой публики. Я обучала этому виду тренинга в высшей школе и в колледжах, я работала с выпускниками университетов, домохозяйками и служителями зоопарков, с членами моей семьи и друзьями. Я наблюдала и изучала работу дрессировщиков всех возможных типов: от ковбоев до спортивных тренеров, -- и заметила, что принципы подкрепляемого обучения постепенно проникают повсюду. Голливудские дрессировщики животных называют использование метода позитивного подкрепления "аффективной тренировкой" и используют эту технику, чтобы вырабатывать такие типы поведения, которых нельзя добиться силой -- например, как в рекламном телеролике, где бык спокойно прогуливается по китайской лавке. Сегодня многие спортивные тренеры используют позитивное подкрепление и формирование, а не полагаются на старинный метод кнута, и при этом результаты их воспитанников значительно улучшаются. Однако нигде я не обнаружила правил теории подкрепления, описанных таким образом, чтобы ими можно было непосредственно пользоваться на практике. В этой книге я объясняю эти правила так, как я их понимаю, а также поясняю, где я считаю нужным их применять, а где, по-моему мнению, это невозможно и нецелесообразно. Тренировка с подкреплением не разрешает всех проблем -- она не увеличит ваш счет в банке, не спасет от неудачной женитьбы, не поможет в случаях тяжелых заболеваний психики. Некоторые ситуации, например, плач ребенка, не имеет отношения к проблеме тренировки и требуют других методов разрешения. Некоторые типы поведения человека и животных имеют генетические компоненты, которые трудно или невозможно изменить тренировкой. Ряд проблем просто не стоит того, чтобы тратить время на тренировку. Но во многих случаях, когда жизнь бросает человеку вызов, ставит задачи и посылает неприятности, правильное использование подкрепления может оказаться полезным. Практическое использование позитивного подкрепления в одной ситуации может побудить вас использовать его и в других. Как раздраженно сказал один исследователь дельфинов, с которым я работала: "Человеку нельзя разрешать заводить детей, прежде чем он не сумеет обучить цыпленка", подразумевая, что опыт достижения результатов в обучении существа, к которому невозможно применить силу, должен показать вам, что для воспитания ребенка вы так же не нуждаетесь в применении силы. Я заметила, что у большинства дельфиньих тренеров, использующих навыки позитивного подкрепления в своей ежедневной работе, чрезвычайно милые и приятные дети. Эта книга не обеспечит вам милых детей. И она не обещает дать вам какие-либо специфические результаты или навыки. Что она даст вам, так это фундаментальные принципы, лежащие в основе любого обучения, и некоторые основные установки творческого применения этих принципов в различных ситуациях. Другими словами она даст вам искусство тренировки. Она может помочь вам преодолеть те неприятности, которые беспокоили вас в течение многих лет, или достичь успехов в трудных для вас делах. Она, конечно, поможет вам, если вы того пожелаете, и обучить цыпленка. В теории подкрепления, по-видимому, существует естественный порядок, и в книге главы идут в той последовательности, в которой происходят процессы тренировки, от простого к сложному, как при реальном обучении, и это та самая последовательность, при которой наиболее легко овладеть профессией тренера. Книга построена таким образом, чтобы постепенно складывалось разумное понимание процесса тренировки при помощи позитивного подкрепления. Однако, так как эта теория широко применяется на практике, то в пяти главах книги в качестве примеров приводятся различные жизненные ситуации, в которых позитивное подкрепление играет положительную роль. I. ПОДКРЕПЛЕНИЕ: ЛУЧШЕ, ЧЕМ ВОЗНАГРАЖДЕНИЕ Что такое положительное подкрепление Положительное подкрепление -- это событие, совпадающее с каким-либо действием и ведущее к увеличению вероятности повторного совершения этого действия. Запомните это положение. В нем заложен секрет успешного обучения. Существуют два вида подкрепления: положительное и отрицательное. Положительное подкрепление -- это нечто, желаемое субъектом: пища, ласка или похвала. Негативное подкрепление -- это то, чего субъект хотел бы избежать: шлепок, нахмуривание бровей, неприятный звук (предупреждающий зуммер в машинах, который раздается, если вы забыли пристегнуть ремень безопасности, -- это отрицательное подкрепление). Поведение, которое уже встречается вне зависимости от того, насколько оно спорадично, всегда можно усилить с помощью положительного подкрепления. Если вы зовете щенка, и он подходит к вам, а вы его ласкаете, то в дальнейшем подход щенка на зов становится все более и более надежным даже безо всякого другого обучения. Предположим, что вы хотите, чтобы кто-то позвонил вам -- ваш отпрыск, родитель или любимый. Если он или она не звонит, то тогда уж ничего не поделаешь. Самое главное в обучении с подкреплением то, что вы не можете подкрепить поведение, которое не встречается. С другой стороны, если вы всегда проявляете радость, когда любимые вам звонят, то это значит что их поведение положительно подкрепляется, вероятность частоты их звонков, очевидно, увеличится. Конечно, если вы примените отрицательное подкрепление -- "Почему ты не позвонил, почему я должна тебе звонить, ты мне никогда не звонишь" и т.д., замечания, которые вызывают раздражение, -- вы создаете ситуацию, при которой звонящий избегает неприятностей тем, что не звонит; фактически вы обучаете их не звонить. Простое введение положительного подкрепления за поведение является наиболее элементарной частью этого вида обучения. В научной психологической литературе встречаются такие выражения: "Были использованы поведенческие методики" или "Проблема была решена с помощью поведенческого подхода". Обыкновенно это означает, что они отдают предпочтение положительному подкреплению перед другими использованными ими методами. Это совсем не означает, что они использовали весь арсенал приемов, описанных в этой книге; они могут и не знать о них. Однако введение положительного подкрепления часто является единственно необходимым мероприятием. Кстати, например, наиболее действенный способ приучить ребенка не мочиться в постель -- лично похвалить его и выразить свое удовольствие, если утром простынки оказались сухими. Положительное подкрепление можно применить и к себе. В Шекспировской студии, которую я в свое время посещала, я встретила юриста с Уолл-стрит, которому было под пятьдесят и который был страстным любителем игры в сквош (игра, в которую играют ракетками и мягким мячом в закрытых кортах). Однажды он услышал, как я рассказываю об обучении, и уходя заметил, что можно испробовать положительное подкрепление на его игре в сквош. Вместо того что бы как обычно сокрушаться об ошибках, он попробует воз награждать себя за хорошие удары. Через две недели я снова встретила его. "Как сквош?" -- спросила я. На его лице потаилось выражение заинтересованности и радости, что нечасто бывает с юристами с Уолл-стрит. "Сначала я чувствовал себя жутким дураком, -- ответил он, -- говоря: "Хорошо, Пит, молодец!" при каждом удачном ударе. Черт возьми, когда я тренировался один, я даже поглаживал себя по спине. Но затем моя игра начала улучшаться. И сейчас я на четыре ранга выше в клубной лестнице, чем был когда-либо раньше. Я побеждаю тех, у которых прежде не мог выиграть даже очко. И получаю гораздо больше удовольствия. С тех пор как я не ору на себя все время, я не кончаю игру злым и разочарованным. Если удар не получился, ничего страшного, следующие будут хорошими. И я обнаруживаю, что мне просто смешно, когда кто-нибудь другой делает ошибку, бесится, бросает ракетку -- я знаю, что это не улучшит его игру, я только улыбаюсь. Какой жестокий противник. И это сразу же как только перешел на положительное подкрепление. Подкрепление относительно, не абсолютно. Дождь является положительным подкреплением для уток, отрицательным для кошек, довольно безразличен, по крайней мере во влажную погоду, для коров. Пища не является положительным подкреплением, если вы сыты. Улыбки и похвалы могут быть непригодными в качестве подкрепления, если субъект хочет вывести вас из себя. В качестве подкрепления надо выбирать нечто желаемое субъектом. Для любой тренировочной ситуации полезно иметь набор подкреплений. В океанариумах "Жизнь моря" косаток подкрепляют множеством способов: рыбой (их пища), поглаживанием или почесыванием различных частей тела, вниманием окружающих, игрушками и т.д. Все представления -- это действия, при которых животное никогда не знает, какое поведение будет подкреплено в следующий раз и каким будет подкрепление; эти "сюрпризы" так интересны для животных, что представления могут идти почти без стандартных подкреплений рыбой; животные получают пищу в конце дня. Необходимость постоянного перехода от одного подкрепления к другому увлекательна и интересна и для тренеров. Положительное подкрепление приносит пользу и при взаимоотношениях между людьми. Оно лежит в основе искусства делать подарки: точно угадать, что будет иметь подкрепляющее действие (правильный выбор является подкреплением и для делающего подарок). У нас чаще всего принято доверять выбор подарков женщинам. Я даже знаю одну семью, в которой мать покупает рождественские подарки всем и ото всех. И очень забавно, когда рождественским утром братья и сестры говорят: "Смотрите, это Биллу от Энни", хотя все знают, что Энни тут ни при чем. Но это не совершенствует у детей навыка выбирать способы поощрения других. В нашем мире человек, выработавший в себе наблюдательность в отношении положительного подкрепления, имеет большие преимущества перед другими. Как мать, я сделала все, чтоб мои сыновья научились делать подарки. Например, однажды, когда они были еще маленькими -- семь и пять лет, я повела их в довольно фешенебельный магазин и предложила каждому выбрать по платью для их младшей сестренки. Им понравилось, развалясь в плюшевых креслах, одобрять или не одобрять платья, которые она примеряла, как нравится какому-нибудь миллионеру помогать своей подружке выбирать норковую шубку. Их маленькая сестренка тоже получила удовольствие. Так, благодаря этому и подобным упражнениям, урок был усвоен: как по-настоящему проникнуться интересом к тому, что хочет другой человек, как находить радость в поисках положительного подкрепления для тех, кого любишь. Отрицательное подкрепление Психологи спорят по поводу определения отрицательного подкрепления. Для наших целей отрицательное подкрепление можно определить как то, что субъект будет стараться избегать. Отрицательные подкрепления имеют градации от слегка неприятных стимулов -- едва заметный сквозняк от кондиционера в ресторане, который все-таки заставляет вас перейти за другой столик, -- до всевозможных крайностей, например удара электрическим током. Наказание происходит после поведения, на которое оно должно воздействовать. Таким образом, вы не можете избежать наказания, изменив взгляды или поступки, так как неправильное поведение уже осуществилось. Малыш, которого отшлепали за плохой табель успеваемости, может в дальнейшем учиться лучше или хуже, но уже не сможет изменить того табеля, который он уже принес. Напротив, отрицательное подкрепление можно остановить или избегнуть сиюминутным изменением поведения. Допустим, сидя в гостиной у тетушки, я случайно положила ноги на кофейный столик. Тетушка неодобрительно поднимает брови. Я ставлю ноги на пол. Ее лицо мягчеет. Я чувствую облегчение. И поскольку я смогла остановить сигнал нерасположенности, совершившееся поведение было подкреплено. Я усвоила: в тетушкином доме держи ноги по дальше от мебели. Поведение может быть полностью сформировано на основе отрицательного подкрепления, как в большинстве случаев традиционной дрессировки животных: лошадь учится поворачивать налево, когда тянут за левый повод, потому что поворот прекращает неприятное давление; лев вспрыгивает на тумбу, чтобы избежать назойливого хлыста или острой палки, которые держат около его морды. В общем, термин "подкрепление" в этой книге относится к положительному подкреплению; если я захочу обсудить отрицательное подкреняение, я оговорю это особо. Вообще же оба вида подкрепления подчиняются одинаковым правилам применения. Например, ошибка во времени подачи подкрепления не даст результатов (или результаты будут плохими) при использовании как одного, так и другого метода подкрепления. Время подачи подкрепления Как уже говорилось, подкрепление должно совершаться в связи с действием, которое предполагается видоизменить. Подкрепление -- это информация. Оно говорит субъекту, что именно вам нравится. Когда субъект пытается обучиться, информационное содержание подкрепления становится важнее самого подкрепления. В тренировке спортсменов или при обучении танцоров именно восклицания инструктора "Да!" или "Хорошо!", отмечающие нужное движение, а не разбор тренировки или репетиции в раздевалке дают требующуюся информацию. Запоздалое подкрепление является наибольшим недочетом начинающего дрессировщика. Собака садится, но к тому времени, когда хозяин говорит: "Хорошая собака", собака уже снова стоит. За что, думает животное, его хвалят? За то, что оно встает. Если у вас возникают трудности в дрессировке, первый вопрос, который надо себе задать, не запаздывает ли ваше подкрепление. Если вы при работе с животным вдруг застряли в самый разгар дела, то иногда полезно, чтоб кто-нибудь со стороны понаблюдал за запаздыванием подкреплений. Мы всегда слишком запаздываем подкрепляя друг друга. "Послушай, дорогая, вчера вечером ты выглядела замечательно", -- звучит совсем не так, как та же фраза, сказанная вовремя. Отсрочка подкрепления может даже оказать вреднее воздействие ("А что, разве я сейчас не выгляжу замечательно?"). Мы свято верим, что сила слов перекроет ошибки во времени подкрепления. Слишком раннее подкрепление тоже неэффективно. В зоопарке Бронкса служители замучились с гориллой. Им было нужно, чтобы она выходила в вольер, чтобы можно было почистить внутреннюю клетку, но она взяла манеру сидеть в дверном проеме, и, обладая недюжинной силой, не давала закрываться скользящей двери. Когда же служители клали пищу снаружи или подманивали ее бананами, горилла либо не обращала на них внимания, либо хватала пищу и бежала обратно к своей двери, прежде чем ту успевали закрыть. Дрессировщика, работавшего при зоопарке, попросили разобраться. Он объяснил служителям, что размахивание бананами и подбрасывание пищи было попыткой подкрепить действие, которое еще не совершилось. Это называется взяточничеством. Надо было не замечать животное, пока оно сидело в дверях, но подкреплять пищей, если оно выйдет оттуда самостоятельно. Проблема была решена. Мне кажется, что иногда и детей мы подкрепляем слишком рано, находясь под ложным впечатлением, будто мы их подбадриваем ("Молодец, хорошо, ты уже почти все сделала правильно"). Возможно, при этом мы подкрепляем попытки. Но существует разница между попыткой сделать что-то и выполнением этого. Причитания типа "я не могу" иногда отражают фактическое положение вещей, но они могут являться и признаками того, что часто подкреплялись просто попытки. Вообще, подкрепление поведения, которое еще не совершилось, -- подарками, обещаниями, комплиментами или чем-нибудь в этом роде -- ни капельки не подкрепляет это поведение. Если что-то и подкрепляется, так это поведение, совершающееся в данное время: вероятнее всего -- выпрашивание подкрепления. Соблюдение времени очень важно и при обучении с отрицательным подкреплением. Лошадь учится поворачивать налево, когда тянут за левый повод, но только если после поворота натяжение ослабевает. Прекращение натяжения является подкреплением. Вы садитесь на лошадь, пришпориваете ее, и она движется вперед -- тогда вам надо перестать ее пришпоривать (если, конечно, вы не хотите, чтобы она двигалась быстрее). Начинающие наездники часто тычут лошадь в бока непрерывно, как будто шпоры это своего рода педаль газа в автомобиле, необходимая для движения. Пришпоривание не прекращается и тем самым не несет никакой информации для лошади. Так в школах верховой езды появляются лошади с железными боками, которые передвигаются черепашьим шагом независимо от того, как часто их пришпоривают. То же происходит и с людьми, к которым постоянно придираются и бранят родители, начальство или учителя. Если отрицательное подкрепление не прекращается в момент достижения желаемых результатов, то оно не является подкреплением и не несет информации. Оно становится как буквально, так и в терминах теории информации "шумом". Когда я смотрю по телевизору футбол или бейсбол, я всегда поражаюсь замечательной своевременности подкреплений, вновь и вновь получаемых игроками. Как только забивают гол или бегун пересекает финишную линию, рев толпы сигнализирует полное одобрение; а только посмотрите на бешеный обмен взаимоподкреплений игроков в тот момент, когда счет открыт или игра выиграна. С артистами, особенно с киноактерами, дело обстоит совершенно иначе. Даже на сцене аплодисменты раздаются после того, как работа кончается. У артистов кино не существует своевременного подкрепления, за исключением редкого отзыва режиссера или оператора об их работе или рукопожатия; письма поклонников и положительные рецензии, приходящие спустя недели и месяцы, бледнеют в сравнении с неистовством американского стадиона в минуту успеха. Нет ничего удивительного, что некоторые звезды кино проявляют болезненную страсть к низкой лести, и сенсациям; работа может совершенно не удовлетворять, если подкрепления, даже самые блестящие, всегда опаздывают. Величина подкрепления Начинающие тренеры, использующие пищевое подкрепление при работе с животными, часто не знают, какова должна быть величина каждого подкрепления. Ответ таков: чем меньше, тем лучше. Чем меньше подкрепление, тем быстрее животное съест его. Это не только экономит время, но и позволяет дать большее количество подкреплений за один сеанс, прежде чем животное насытиться. В 1979 г. Национальный зоопарк в Вашингтоне, штат Колумбия, пригласил меня в качестве консультанта для обучения группы работников зоопарка технике положительного подкрепления. Одна из смотрительниц в моей группе жаловалась, что обучение панды продвигается у нее очень медленно. Мне показалось это странным, потому что интуитивно я чувствовала, что панды -- эти большие, прожорливые, активные животные -- должны легко поддаваться обучению с пищевым подкреплением. Я понаблюдала за ее занятиями и обнаружила, что, когда смотрительнице удавалось добиться какого-либо движения, она давала панде целую морковку. Панда долго смаковала каждую морковку, поэтому в течение пятнадцати минут отведенного ей драгоценного времени она зарабатывала только три подкрепления (а кроме того, морковь ей надоедала). Один ломтик моркови на подкрепление был бы лучше. Вообще, подкрепление величиной в один глоток животного вполне достаточно для поддержания его заинтересованности -- одно-два зернышка для цыпленка, кубик мяса в 6 мм для кошки, половина яблока для слона. Особо любимой пищи можно давать и еще меньше -- например чайную ложку зерна для лошади. Служители Национального зоопарка обучали белых медведей многим полезным вещам, таким, как переход по команде в другую клетку, используя изюминки. Основное правило дрессировщика заключается в том, что если вы собираетесь провести в день одно занятие, то можете рассчитывать на хорошую работу животного примерно за четверть его дневного рациона, остальное дается после окончания работы. Если же вам надо провести три или четыре занятия в день, то дневную порцию пищи надо разделить примерно на восемьдесят частей и за один сеанс давать двадцать или тридцать. Восемьдесят подкреплений, видимо, являются максимумом, способным заинтересовать субъекта в течение дня. (Может быть, поэтому слайдовая кассета содержит восемьдесят слайдов; по крайней мере, когда лектор просит демонстратора показать вторую кассету слайдов, я тяжело вздыхаю.) Размер подкрепления зависит также от сложности задачи. В океанариуме "Жизнь моря" мы сочли необходимым давать каждому [дельфину] по большой макрели за их олимпийские 6--7-метровые вертикальные прыжки. Они просто отказывались делать это за обычное вознаграждение в виде двух маленьких корюшек. У людей почти всегда более трудная работа вознаграждается лучше. А если этого нет, то как мы ненавидим тяжелую работу, если нам приходится ее делать. Большой куш Одним из наиболее полезных приемов пищевого или какого-либо другого подкрепления для человека и животных является получение куша. Это награда, которая во много, иногда в 10 раз больше обыкновенного подкрепления и являющаяся сюрпризом для субъекта. В рекламном агентстве, где я когда-то работала, бывали официальные вечера на Рождество, а также неофициальные праздники по поводу окончания большой работы или заполучения нового клиента. Но у председателя правления была еще привычка устраивать в год один-два абсолютно неожиданных вечера. Внезапно в середине дня он проносился по всем комнатам конторы, крича, чтоб все кончали работу. Коммутаторы выключались, появлялась процессия поставщиков провизии, музыканты, буфетчики, шампанское, копченая семга, и все это только для нас и безо всякой особенной причины. Это было неожиданным кушем для пятидесяти человек. Я думаю, что это очень способствовало поднятию духа коллектива. Куш можно использовать и для того, чтоб отметить внезапное озарение. Один мой знакомый наездник, когда лошадь впервые проделывает какой-нибудь сложный маневр, соскакивает с нее, освобождает от седла и уздечки и свободно выпускает на манеж -- куш полной свободы, который часто, по-видимому, может привести к образованию новой линии поведения. Как ни странно, получение всего одного куша может так же улучшить ответы непокорного, испуганного или сопротивляющегося субъекта, который вообще не проявлял нужного поведения. В океанариуме "Жизнь моря" мы проводи ли исследования по заданию ВМС США, в которых дельфин получал подкрепление за новые реакции, осуществляемые вместо старого, ранее выработанного поведения. Испытуемой была понятливая самочка по имени Хоу, которая редко давала новые ответы. Когда ей не стало удаваться получать подкрепления за свои действия, она стала неактивной, и в конце концов в течение одного занятия за двадцать минут не дала ни одного ответа. Наконец, тренер кинул ей пару рыбок "ни за что". Явно ошарашенная такой щедростью, Хоу снова стала активной и вскоре выполнила движение, которое можно было подкрепить, что привело к несомненному прогрессу на последующих занятиях. Я сама бывала в таком же положении, как этот дельфин. Когда мне было пятнадцать лет, самым большим удовольствием для меня были уроки верховой езды. Конюшни, где я занималась, продавали билеты, каждый на десять уроков; по своим деньгам я могла позволить себе один билет в месяц. В то время я жила с отцом, Филиппом Уили, и мачехой, Рики; и хотя они относились ко мне очень хорошо, я вступила в один из тех периодов юности, когда беспрерывно целыми днями бываешь невыносимо грубым и противным. Однажды вечером супруги Уйди, которые были любящими и изобретательными родителями, сказали, что они ужасно устали от моего поведения и поэтому решили меня наградить. И они презентовали мне ослепительно новый, дополнительный бесплатный билет на верховую езду. Один из них не поленился съездить на конюшни, чтобы купить его. Поразительно! Незаслуженный куш. Как мне помнится, я с ходу переменилась, и Рики Уйди подтвердила это много лет спустя, когда я писала эту книгу. Почему назаработанный куш может оказать такое внезапное и далеко идущее влияние, я не совсем понимаю. Может быть, со временем кто-нибудь напишет диссертацию по этому поводу и объяснит нам это. Я только знаю, что дополнительный билет на верховую езду мгновенно снял у меня сильные чувства угнетенности и обиды, и я подозреваю, что и дельфин чувствовал то же самое. Условное подкрепление Очень часто, особенно при работе с пищевым подкреплением, его невозможно дать в тот момент, когда субъект делает то, что хотели бы поощрить. Если я учу дельфина прыгать, то я никак не могу дать ему рыбку в тот момент, когда он находится в воздухе. Если за каждым прыжком следует брошенная рыбка (отставленное подкрепление), то у животного в конце концов образуется связь между прыжком и едой, и оно будет прыгать чаще. Однако это не несет информации о том, какой из аспектов прыжка мне нравится. На какую высоту? С каким прогибом? Может, надо войти обратно в воду со всплеском? Таким образом, потребуется очень много повторений, чтобы животное установило, какой именно прыжок я имела в виду. Чтобы обойти эту трудность, мы используем условное подкрепление. Условное подкрепление представляет собой какой-либо изначально ничего незначащий сигнал -- звук, свет, движение, -- который умышленно связывают с подачей подкрепления. Тренеры дельфинов остановили свой выбор на полицейском свистке: его хорошо слышно даже под водой и он не связывает руки, чтобы можно было давать сигналы и бросать рыбу. С другими животными я обычно использую "сверчка", десятицентовую игрушку, которая щелкает, когда на нее нажимаешь, или особые поощряющие слова, выбранные и приберегаемые для использования в качестве условного подкрепления: "хорошая собака", "хорошая лошадка". Школьные учителя часто прибегают к некоторым таким ритуальным и тщательно нормированным словам похвалы -- "замечательно" или "очень хорошо", -- за которые дети страстно работают и ждут их. Наша жизнь изобилует условными подкреплениями. Нам нравится слышать, как звонит телефон или видеть набитый почтовый ящик, даже если половина звонков неинтересна и большая часть корреспонденции -- утиль, потому что множество случаев научили нас связывать звонок или конверт с хорошим. Нам нравится рождественская музыка, и мы ненавидим запах зубного кабинета. Мы храним окружающие нас вещи -- картины, посуду, трофеи -- не потому, что они красивы или полезны, а потому, что они напоминают нам о временах, когда мы были счастливы, или о людях, которых мы любили. Они представляют собой условные подкрепления. Практически дрессировка животных с использованием положительного подкрепления почти всегда должна начинаться с выработки условного подкрепления. Прежде чем начать выработку поведения как такового, пока субъект еще ничего особенного и не делает, вы учите его понимать значимость условного подкрепления, сочетая его с пищей, поглаживанием иди другим истинным подкреплением. Иногда, по крайней мере при работе с животными, вы можете уловить, когда субъект начинает узнавать ваш сигнал, означающий "Хорошо!". Видно, как животное вздрагивает при действии условного подкрепления и начинает искать истинное подкрепление. После выработки условного подкрепления в ваших руках оказывается реальный способ сообщения животному, что в его поведении вас интересует. Чтобы разговаривать с животными, вам не обязательно быть доктором Дулиттлом, можно очень многое сказать таким выработанным подкреплением. Условные подкрепления приобретают чрезвычайную силу. Так как информация "Ты прав" сама по себе представляет ценность, она не обязательно должна сопровождаться первичным подкреплением. Фактически использование пищи, ласки или чего-нибудь в этом роде можно практически свести к нулю, а условное подкрепление будет приносить прекрасные результаты. Я видела, как морские млекопитающие долго работали после насыщения за условные подкрепления, а лошади и собаки работают по часу и более с маленьким или безо всякого безусловного подкрепления. Люди конечно же тоже могут бесконечно работать за деньги, являющиеся ничем иным как условным подкреплением, обозначением вещей, которые на них можно купить, особенно люди, которые уже заработали гораздо больше денег, чем они когда-либо смогут действительно потратить, и, следовательно, пристрастившиеся к условному подкреплению. Действие условного подкрепления можно усилить, сочетая его с несколькими безусловными подкреплениями. В данный момент субъект может не хотеть, скажем, есть, но если тот же подкрепляющий звук или слово были умышленно связаны еще и с водой или другими потребностями или приятными моментами, он сохраняет свое действие и в этом случае. Мои кошки слышат слова "хорошая киса!", когда получают ужин, когда их гладят, когда их впускают в дом и выпускают из дома, когда они проделывают маленькие трюки и получают за них вознаграждение. В результате я могу использовать эти слова для поощрения кошки, спрыгивающей с кухонного стола, и нет нужды сопровождать его каким-либо безусловным подкрепдением. Быть может, причина того, что деньги оказывают на нас такое подкрепляющее действие, кроется в том, "что они могут связываться практически с чем угодно. Это чрезвычайно обобщенное условное подкрепление. Как только вы выработали условное подкрепление, вы должны пользоваться им осторожно, не разбрасывать без толку, иначе его сила уменьшится. Дети, которые ездили на моих уэльских пони, очень скоро научились говорить: "Хорошая лошадка!" только когда хотели подкрепить поведение. Если им просто хотелось выразить свою привязанность, они могли болтать с пони, как угодно, не употребляя этих слов. Однажды девочка, которая только что присоединилась к их компании, начала гладить пони, приговаривая: "Ты хорошая лошадка!". Трое остальных тотчас же ополчились на нее: "Ты за что ему это говоришь? Он же ничего не сделал!". Подобным же образом можно и должно окружить заботой и вниманием детей, супруга, родителей, любимых и друзей безотносительно к какому-нибудь определенному поведению, но необходимо приберечь что-то специально в качестве условного подкрепления чего-либо определенного. Существует множество реальных событий, заслуживающих похвалы, подкрепления, которым щедро обмениваются в счастливых семьях. Однако фальшивая или незначимая награда вскоре вызывает негодование даже у маленьких детей и теряет всякую силу в качестве подкрепления. Можно выработать и условное отрицательное подкрепление, которое может быть очень полезным. Дети и многие животные часто моментально реагируют на резкое, громкое слово запрета, которое ничем не сопровождается. Возможно, оно является первичным или безусловным подкрепле нием. Но некоторые животные -- особенно этим славятся кошки -- игнорируют окрики и брань. Одна моя подруга со вершенно безуспешно пыталась отучить свою кошку царапать кушетку, используя в качестве отрицательного подкрепления возглас "Нет!". Однажды в кухне она уронила большой латунный поднос, случайно упавший почти рядом с кошкой, и, когда раздался громкий грохот подноса, воскликнула: "Нет!". Кошка была страшно напугана, подпрыгнула вверх, подняв шерсть дыбом. В следующий раз, когда кошка начала драть кушетку, хозяйка крикнула: "Нет!", у кошки сделался испуганный вид, и она тотчас же перестала. Двух-трех повторений ставшего условным слова оказалось достаточно, чтобы навсегда прекратить это поведение. Режимы подкрепления Бытует неправильный взгляд, что если вы начали вырабатывать поведение с помощью положительного подкрепления, то должны продолжать его применение на протяжении всей дельнейшей жизни субъекта, если этого не будет, то поведение исчезнет. Это неверно: постоянное под крепление необходимо только на стадиях обучения. Вы можете несколько раз вознаградить годовалого ребенка за пользование горшком, но как только поведение заучено, предмет обучения сам о себе позаботится. Мы даем или должны давать начинающему множество подкреплений -- обучение ребенка езде на велосипеде идет под настоящий поток: "Правильно, крепче держи руль, у тебя получилось, хорошо!" Но вы будете выглядеть довольно глупо (а ребенок решит, что вы сошли с ума), если вы будете продолжать хвалить его после того как навык установился. Для того чтобы поддерживать уже выученное поведение на определенном уровне надежности, не только не надо подкреплять его все время, а даже, наоборот, следует прекратить регулярные подкрепления и перейти на эпизодическое использование подкрепления, подаваемого в случайном и не предсказуемом порядке. Это и есть то, что психологи называют вариабельным режимом подкрепления. Вариабельный режим гораздо более эффективен для поддержания поведения, чем постоянный, предсказуемый. Один психолог объяснил это мне так: если у вас машина новая и всегда хорошо заводилась, а однажды, когда вы сели в нее, повернули ключ, она не завелась, то вы, может быть, и попробуете завести ее еще несколько раз, но скоро решите, что что-нибудь не в порядке, и позвоните в гараж. Поведение, состоящее в поворачивании ключа, при отсутствии ожидаемого немедленного подкрепления быстро угаснет. С другой стороны, если у вас вместо машины старая консервная банка, которая еще ни разу не заводилась с первой попытки, и каждый раз требуется целая вечность для того, чтобы привести ее в движение, вы можете продолжать попытки ее завести в течение получаса; ваше поведение по поворачиванию ключа происходит в низковероятностном режиме подкрепления и поэтому сильнейшим образом поддерживается. Если давать дельфину рыбку за каждый прыжок, то скоро прыжки станут невысокими, небрежными, лишь бы отделаться. Если теперь перестать давать рыбу, дельфин тут же перестает прыгать. Но, если после того как животное научилось прыгать за рыбку, начать подкреплять первый прыжок, затем третий и так далее наугад, поведение будет поддерживаться на более высоком уровне: не получив подкрепления, животное станет прыгать чаще, стараясь угадать счастливый номер, и прыжки могут даже усилиться. В свою очередь это позволит подкреплять выборочно наиболее сильные прыжки, - то есть посредством вариативного режима совершенствовать деятельность. Но даже некоторые профессиональные дрессировщики не могут правильно использовать вариативный режим положительного подкрепления; многим эта концепция представляется особенно трудной, не укладывающейся в голове. Нам понято, что нет нужды продолжать наказывать за неправильное поведение, если оно прекратилось, но почему бы не вознаграждать постоянно за правильное поведение. Мы не так уверены в этом только когда ставим целью добиться с помощью положительного подкрепления улучшения дисциплины. Действенность вариатавного подкрепления лежит в основе всех азартных игр. Если каждый раз, опустив в автомат 5 центов, будете получать десять, то скоро вы потеряете к этому интерес. Да, вы будете делать деньги, но какой это нудный способ! Людям нравится играть с автоматом именно потому, что невозможно предугадать заранее, то ли ничего не получишь, то ли какую-то мелочь, то ли сразу кучу денег, и когда именно будет это подкрепление (это может быть только один самый первый раз). Почему одни люди втягиваются в азартную игру, а другие могут поиграть и бросить, это уже другой вопрос, но для тех, кто попался на крючок, этим крючком стал вариативный режим положительного подкрепления. Чем длительнее интервалы между подкреплениями в вариативном режиме, тем сильнее он стимулирует поведение. Однако режимы с длительными интервалами работают против вас, когда вы пытаетесь угасить поведение. Если поведение не подкреплять совсем, то скоро появится тенденция к его угасанию; но если оно все-таки время от времени подкрепляется -- неважно сколь эпизодично -- одна сигарета, одна рюмка, одна поблажка ворчуну или нытику -- и поведение вместо того, чтобы угасаться, может быть значительно усилено режимом с длительными интервалами между подкреплениями. Всем встречались люди, которые непонятным образом привязаны к супругам или любовникам, которые с ними плохо обращаются. Мы привыкли думать, что так бывает только с женщинами -- она чувствует влечение к тому, кто груб, невнимателен, эгоистичен и даже жесток, она его все равно любит, -- но это случается и с мужчинами. Каждый знает людей, которые после развода или другого рода утраты одного негодяя находят другого, в точности похожего на предыдущего. Являются ли эти люди вечными жертвами по каким-либо глубоким психологическим причинам? Возможно. Но, может быть, они -- жертвы режима с длительными интервалами между подкреплениями? Если вы вступили в связь с очаровательным, обаятельным, интересным в сексуальном плане, веселым и внимательным человеком, а затем он становится все более несговорчивым, даже обидчивым, но все же время от времени проявляет свои хорошие качества, вы станете жить ради этих все более редких моментов, когда вы получаете это прекрасное подкрепление: полное очарования, обаяния, привлекательности и веселья внимание. И парадоксально с точки зрения здравого смысла, но закономерно с точки зрения теории обучения, что чем реже и непредсказуемей становятся такие моменты, тем сильнее становится их подкрепляющий эффект, и тем дольше ваша линия поведения будет сохраняться. Кроме того, легко понять, почему человек, однажды оказавшийся в таких отношениях, часто ищет их повторения: ему может казаться, что во взаимоотношениях с нормальным человеком, который сдержан и доброжелателен большую часть времени, не хватает остроты того редкого, страстно желаемого и потому вдвойне действенного подкрепления. Посмотрите на ситуацию с точки зрения человека, управляющего поведением: я могу держать ее (его) в безоговорочном подчинении, так, "Чтобы она (он) делала все, что я захочу, ради моего удобства и спокойствия, до тех пор пока я даю ей (ему) все, что она (он) хочет... изредка. Это один из способов, которыми сутенеры держат в повиновении своих девочек. Конечно, это крепкие путы, но однажды жертва осознает, что сила "очарования" по крайней мере отчасти зависит от режима подкрепления, и спокойно уйдет от этого типа отношений и поищет что-то другое. Исключения из правила вариативного подкрепления Лишь в одном случае не следует прибегать к вариативному режиму подкрепления, после того как поведение заучено, -- это когда оно направлено на решение своего рода головоломки или теста. При одном из видов дрессировки собака должна выбирать из нескольких разнородных предметов тот, который побывал в руках у хозяина и хранит его запах. При этом необходимо каждый раз говорить собаке, что она выбрала правильно, чтобы в следующий раз она знала, что надо делать. В тестах на различение, -- скажем, идентификация более высокого из двух звуков -- необходимо подкреплять каждый правильный ответ испытуемого, чтобы он был постоянно информирован о том, какую задачу он решает (подойдет, конечно, и условное подкрепление). Когда мы отгадываем Кроссворд или составляем картинку-загадку, мы получаем подкрепления за правильные догадки, так как только они являются "подходящими". Если бы при составлении картинки-загадки можно было вставить в одну ячейку несколько кусочков, то положительного подкрепления за правильный выбор, который является обязательной обратной связью в любой ситуации выбора, не получалось бы. Долговременные программы поведения В дополнение к вариативному режиму подкреплений можно ввести и закрепленный, при котором субъект знает, что он должен работать определенное время или выполнить определенный комплекс поведенческих реакций за каждое подкрепление. Например, подкрепляя каждый шестой прыжок, можно сделать так, что дельфин будет прыгать шесть раз подряд, и вскоре получим стабильные серии из шести прыжков. Трудность работы с фиксированным режимом подкрепления состоит в том, что первые ответы в сериях не подкрепляются и возникает тенденция к уменьшению затрачиваемых на них усилий. У прыгающего дельфина со временем все прыжки, кроме последнего, который действительно подкрепляется, уменьшаются. Это отрицательное влияние фиксированного режима подкреплений является важным фактором во многих видах человеческой деятельности -- например на заводском конвейере. Чтобы получить подкрепление, необходимо работать в течение определенного времени, но так как подкрепление дается в фиксированном режиме, независимо от качества выполнения, человек совершенно естественно стремится делать то наименьшее количество работы, которое позволяет не выпасть из игры, особенно низкая производительность может быть в начальный период работы. Зарплата по пятницам является фиксированным подкреплением, делающим понедельник тяжелым днем. У дельфинов поддержать поведение поможет случайное подкрепление первого или второго прыжка, помимо шестого. У людей могут быть эффективны различные виды прогрессивных оплат или других подкреплений (например, награды), тесно связанные с качеством и количеством продукции и выдаваемые неодновременно с обычным подкреплением. Применяя либо фиксированный, либо вариативный режимы подкрепления можно оттренировать чрезвычайно длинные цепи поведенческих реакций. Можно добиться того, что цыпленок будет клевать кнопку сто и более раз за каждое зернышко пшеницы. Для людей также можно привести много примеров отставленного вознаграждения. Один психолог шутит, что самым длительным режимом неподкрепляемого поведения в человеческой жизни является учеба в школе. При режимах подкрепления с чрезвычайно длительными интервалами иногда создаются ситуации, которые не приносят организму полезного результата. Для цыпленка это определяется обменными процессами: когда на клевание кнопки он начинает тратить больше энергии, чем может восстановить при получении пшеничного зерна, поведение начинает угасать -- цена работы падает так низко, что ее просто становится незачем делать. Конечно, так часто бывает и с людьми. Другое явление, встречающееся при очень длительных интервалах между подкреплениями, -- замедленный старт. Начав клевать, цыпленок совершает эти действия с постоянной частотой, так как каждый удар приближает его к подкреплению, но было отмечено, что по мере того, как увеличиваются интервалы между подкреплениями, он стремится "отложить" начало реакции на более длительный срок. Это и называется "отсроченное начало поведения с долговременной программой" и очень распространено в жизни людей. В любой долгосрочной задаче, начиная с уплаты подоходного налога и кончая уборкой гаража, можно придумать бесконечное количество причин для того, чтобы не начать дело безотлагательно. Написание чего-либо, иногда даже просто письма, тоже поведение с долгосрочной программой. Когда оно уже начато, все идет прекрасно. Но так трудно заставить себя сесть и начать! Джеймс ТУрбер находил, что начать статью настолько трудно, что иногда он обманывал свою жену (которая по понятным причинам была чрезвычайно заинтересована в том, чтобы он писал статьи, так как доход с них шел на оплату квартиры), лежа все утро на диване в кабинете и читая книгу, которую он держал в одной руке, а другой стучал по клавишам пишущей машинки. Феномен отстроченного начала перевешивал явное положительное подкрепление в виде денег, а симуляция печатанья на машинке, по крайней мере, предотвращала отрицательное подкрепление упреков жены. Один из способов преодоления феномена отсроченного начала заключается в том, чтобы вводить какое-либо подкрепление именно за старт, так же, как я эпизодически подкрепляю у своих дельфинов первый или второй прыжок в серии из шести. Я успешно применяла этот прием и в самовоспитании. В течение нескольких лет один или два раза в неделю я посещала вечерние занятия, что требовало много времени -- три часа занятий и по часу на дорогу в один конец. Каждый раз, когда приближалось 5 часов, появлялось сильнейшее искушение не ездить. Но потом я обнаружила, что, если я разобью поездку -- первую часть дела -- на пять этапов: путь до станции метро, посадка в поезд, пересадка на другой, автобус до университета и, наконец, восхождение по лестнице до аудитории, и подкреплю каждое из этих начальных поведений после его выполнения маленьким кусочком шоколада, который я очень люблю, но обычно не ем, я стала способна вытащить себя из дома, а через несколько недель была в состоянии проделать весь путь на занятия без шоколада и без внутренней борьбы. Суеверия: случайные подкрепления В реальной жизни подкрепления возникают на каждом шагу и часто представляют собой лишь случайное стечение обстоятельств. Один биолог, изучавший ястребов, заметил, что если ястреб поймал под каким-либо кустом мышь, то в течение недели, а иногда и больше, он будет ежедневно проверять этот куст; вероятность его полета именно над этим местом обусловлена силой подкрепления. Попробуйте пройти мимо мусорной корзины, тщательно к ней не приглядываясь, если накануне - нашли в ней пять долларов. Случайное подкрепление полезно для ястреба; вообще можно сказать, что поведение животных эволюционировало так, что каждый вид обладает возможностью извлекать пользу из любого подкрепления. Однако многие случайные подкрепления не сопровождаются полезным результатом, но тем не менее могут оказать сильное влияние на поведение. Когда поведение не связано с последующими событиями, но в мозгу субъекта связывается с ними в качестве необходимого условия их осуществления, говорят о суеверном поведении. Пример этого -- человек, грызущий карандаш. Если во время экзамена вам случится взять в рот карандаш и тут же вам придет в голову правильный ответ или хорошая мысль, то такое подкрепление может изменить ваше поведение: хорошие мысли пришли, когда грыз карандаш, таким образом, это действие подкрепляется. Когда я училась в колледже, у меня не было ни одного карандаша, не покрытого отметинами от зубов, -- на особенно трудных экзаменах я иногда перегрызла карандаш пополам. Я была уверена, что это помогало мне думать. В действительности же это было всего лишь случайно обусловленное поведение. То же самое можно сказать отношении определенной одежды или совершении некого ритуала перед тем как взяться за какое-либо дело. Я видела одного бейсболиста, который совершал девятичленную цепочку действий каждый раз, когда готовился подать мяч: дотрагивался до кепки, касался мячом перчатки, сдвигал кепку вперед, тер ухо, сдвигал кепку назад, шаркал ногой и т.д. В трудные моменты он мог повторить все девять действий дважды, никогда не нарушая их порядок: Эта последовательность действий совершалась очень быстро, комментаторы никогда не останавливались на ней -- но тем не менее она представляет собой сложное суеверное поведение. "Суеверия" часто возникают при дрессировке животных. Животное может руководствоваться в своих ответах такими критериями, которые вы и не собирались вводить, но которые часто случайно совпадали с подкреплениями и образовали условную связь. Например, животное может считать, что чтобы получить подкрепление, оно должно находиться в определенном месте, повернуться в какую-либо сторону или особым образом сидеть. Когда вы захотите, чтобы оно работало в новом месте или при другой ориентации, внезапно загадочным образом все поведение ломается, и пойди пойми почему это произошло. Поэтому гораздо лучше, как только поведение начинает формироваться, начинать разнообразить варианты условий, которые не представляются вам важными, чтобы не возникло какого-либо случайного обусловливания, которое впоследствии будет вам мешать. Более всего следите, чтобы не образовывались случайные временные связи. Как животное, так и люди очень хорошо чувствуют временные интервалы. Однажды я была совершенно уверена, что обучила двух морских свинок прыгать по команде (по сигналу моей руки), пока один из посетивших нас ученых не доказал мне с секундомером в руке, что они прыгают каждые двадцать девять секунд. Это у меня произошло случайное обусловливание подачи команды с очень большой регулярностью, а они воспользовались этим вместо той информации, которой они должны были пользоваться по моему предположению. Многие потомственные дрессировщики находятся просто в плену суеверного способа мышления и поведения. Среди них я встречала некоторых, которые говорили, что дельфины предпочитают людей, одетых в белое, что мулов необходимо бить, что медведи не любят женщин и т.д. Это относится и к тем, кто работает с людьми и считает, например, что на пятиклассников необходимо кричать и что наказание необходимо, чтобы добиться уважения. Такие воспитатели находятся во власти традиции, они вынуждены всегда работать одними и теми же способами, так как не могут разделить действенных методов от того, что является просто суеверием. Эта слабость, или смешение, обнаруживается у представителей многих профессий -- в образовании, технике, военном деле, но в большей мере, пожалуй, в медицине. Ужас сколько всего назначается пациенту не потому, что это обладает целебными свойствами, а просто потому, что так всегда делали или все сейчас делают. Каждый, кто хоть раз лежал в больнице, может вспомнить с полдюжины примеров ненужных действий, которые представляют собой не более как суеверное поведение. Интересно, что суеверное поведение не исчезает, если вы просто указываете на его неэффективность; будучи очень сильно заученным, оно соответственно сильно оберегается. Попробуйте поговорить с врачом о его привычке использовать неэффективное или даже вредное лечение, и вы полу чите отпор в соответствующих выражениях; я уверена, что и тот бейсболист с девятиступенчатым суеверным выражением нервного возбуждения будет яростно противиться всякому, кто предложит ему играть в мяч, скажем, без кепки, до которой он четырежды дотрагивается. Единственный способ избавиться от суеверного поведения -- это убедиться, что оно не связано с подкреплением. Мой сын Тэд очень любит фехтование. Два-три раза в неделю он ходит на тренировку, а по выходным часто ездит на соревнования. Однажды во время поединка с сильным партнером он почувствовал себя подавленным, потому что оставил дома свою любимую шпагу. Он проиграл матч. Потом он понял, что ощущение подавленности, очевидно, гораздо больше влияет на его действия, чем та шпага, которой он пользуется, а следовательно, иметь "любимую" шпагу-- суеверие. Тэд выявлял и боролся с любым суеверным поведением, которое могло бы связаться с фехтованием. Он обнаружил у себя много таких пунктиков, начиная с привязанности к некоторым предметам одежды до внутреннего убеждения, что на его бой может повлиять приснившийся сон, спор или даже отсутствие фруктового сока на соревнованиях. Систематически анализируя каждое из этих обстоятельств, он разорвал одну за другой свою зависимость от них, так как понял, что это суеверия. И в результате теперь он выходит на каждый бой спокойным и уверенным, если даже перед этим ему снился кошмар про опоздание на поезд, потерю снаряжения, баталии с таксистами, если даже он фехтует одолженной шпагой в тренировочном костюме и в разных носках. Чего можно добиться с помощью положительного подкрепления Вот несколько примеров того, чего добились мои знакомые с помощью положительного подкрепления: Джуди, дизайнер по профессии, чтобы оставаться в форме, поступила в вечерний рисовальный класс при соседнем университете, где занятия происходили раз в неделю; из двадцати человек в классе большинство тоже были дизайнерами, либо коммерческими художниками. Преподаватель на неделю задавал домашнюю работу, выполнением которой многие из этих занятых людей себя не утруждали. Преподаватель каждый раз по десяти, а то и более минут разглагольствовал о слабом выполнении домашних заданий. Устав от того, что их без конца бранили, Джуди предложила преподавателю подкреплять тех. Кто принес домашние работы, вместо того чтобы вправлять мозги тем, кто не сделал их. Так он и поступил, подкрепляя своих учеников публичной похвалой за каждое выполненное задание. К третьей неделе в классе не только улучшилось настроение, но и возросло число выполнивших домашнее задание с одной трети до трех четвертей класса. Шеннон, студентка колледжа, пришла в гости к одним знакомым и застала такую сцену. Четверо взрослых безуспешно и не без некоторого риска для себя пытались удержать немецкую овчарку и полечить ее больное ухо. Шеннон, которая не особенно любит собак, но изучает роль положительного подкрепления, достала из холодильника немного сыра и за пять минут научила собаку сидеть смирно, пока она без посторонней помощи обработала ей ухо. Молодая женщина вышла замуж за человека, который очень любил распоряжаться и командовать. Хуже того, и его отец, который жил с ними, тоже взялся помыкать невесткой. Эту историю рассказывала мне мать девушки. Она была в ужасе, когда впервые увидела, что приходится терпеть ее дочери. "Не беспокойся, мама, -- сказала дочь, -- поживем -- увидим". Дочь взяла за правило как можно меньше реагировать на команды и резкие реплики, и одновременно подкреплять послушанием и живостью реакции любое проявление вежливости и внимания со стороны мужчин. За год она превратила их в очень славных людей. Теперь, когда она приходит домой, они встречают ее улыбками, и оба с радостью соглашаются помочь с покупками. Одна восьмиклассница, жившая в городе, любила по выходным брать свою собаку на загородные прогулки, но собака часто убегала очень далеко и не возвращалась на зов, особенно когда наступала пора ехать домой. Однажды во время прогулки, когда, бегая туда-сюда, собака сама подходила к девочке, та начала очень живо на это реагировать -- хвалить, гладить, болтать, обнимать, возиться с собакой. Когда пришло время ехать домой, девочка позвала собаку, и та с радостью подошла к ней. Громадное радушие в качестве положительного подкрепления, очевидно, перевесило обычное продление собакой своей свободы. Больше на прогулках неприятностей с ней не было. Новый администратор одного грозного босса прикинул, что из его работы может являться подкреплением для босса -- например принесение бумаг на подпись, -- и старался как можно чаще приурочить это дело ко времени, когда босс не был в ярости. Босс стал спокойнее и, подписывая бумаги, стал даже отпускать шутки. Некоторые люди создают особые типы подкреплений, чтобы заслужить их, другие готовы многим пожертвовать. Аннет, неработающая женщина, имеющая взрослых детей и живущая за городом, была бы практически оторвана от мира, если бы не обилие друзей, которые звонят ей по телефону каждую неделю, а то и чаще, чтобы поделиться новостями. Это не только соседи или родственники, звонят и многие занятые работающие, женщины, живущие далеко. И я одна из них. Почему же мы все звоним Аннет? Если у вас плохие новости -- вы заболели гриппом, у вас грядет ревизия или няня вашего ребенка переехала в Кливленд, -- вы получите у Аннет сочувствие и совет; но так поступит и любой друг при хороших же новостях от Аннет получаешь необычайное подкрепление. Сообщите ей, что банк открыл вам кредит, она не просто скажет: "Колоссально!". Она точно расскажет чем вы это заработали и заслужили. "Вот видишь? -- откликнется Аннет. -- Вспомни, как ты много работала, чтобы обеспечить хорошую сумму кредита. Вспомни все неприятности, которые у тебя были с телефонной компанией и с получением билета на самолет. Это тебе награда; в тебе признали деловую женщину. Для этого надо было делать правильные шаги, и ты их делала. Я просто горжусь тобой!" Невероятно! Это больше, чем одобрение, это подкрепление за прошлые усилия, которые в данное время кажутся в основном неудачами. Аннет принимает хорошие новости не с точки зрения "удачи", а превращает их в подкрепление. Это конечно же подкрепляет вашу склонность звонить Аннет. Организованное подкрепление Собрания участвующих в распродаже, клубы организации рекламы, курсы Дейдла Карнеги, общество контроля за собственным весом, да и большинство организаций, в которых происходит групповое обучение самоусовершенствованию используют в основном влияние подкрепления индивидуума группой. Похвала, медали, церемонии награждения и другие формы группового признания являются мощными подкреплениями, используемыми иногда с большим воображением. Директор фирмы, занимающейся распродажей, желая вознаградить свою "команду" за удачный год, арендовал футбольный стадион, устроил большой праздник для служащих старших администраторов и членов их семей; он сделал так, что комиссионеры выбегали на поле через туннель для игроков, а на табло под аплодисменты всех присутствующих вспыхивали их имена. Несколько лет назад я посещала курсы хозяйствования Вернера Эрхарда, программа не лишена духа торгашества, но с точки зрения обучения это, как мне кажется остроумное, а часто даже блестящее применение формирования и подкрепления. Программа, называлась, и я думаю справедливо, тренировкой. Руководитель назывался тренером. Целью формирования было лучше познать самого себя, а основным подкреплением были не реплики тренера, а поведение всей группы, не имеющее словесного выражения. Чтобы групповое поведение стало подкреплением, 250 человек, составлявших группу, просили аплодировать каждому выступавшему независимо от того, понравилась ли им речь или нет. Таким образом, с самого начала застенчивые были ободрены, смелые вознаграждены, и все выступления, как проникновенные, так и бессодержательные получили признание группы. Поначалу аплодисменты были не более чем обязанностью. Но скоро они стали действительно коммуникативным средством, выражающим не степень удовольствия, как в театре, а оттенки чувств и значений. Например, в нашей группе, а я полагаю, что такое бывает в каждой подобной группе, был заядлый спорщик, который часто подвергал сомнению то, что говорил тренер. Когда это произошло в третий или четвертый раз, тренер вступил с ним в спор. Всем было ясно, что с точки зрения логики любитель споров на этот раз был в общем-то прав. Но поскольку спор тянулся и тянулся, всем остальным в аудитории было все равно, кто прав. Все 249 человек желали только одного: чтобы он замолчал и сел на место. Правила игры, то есть формирующие правила, не позволяли нам протестовать или сказать ему, чтобы он замолчал. Но постепенно всеобщее молчание дошло до его сознания. Мы видели, что он начинает понимать, что никому нет дела до того, что он прав. Может бьпъ, не всегда надо доказывать свою правоту. Мало-помалу он погрузился в молчание и сел. Группа немедленно разразилась целой бурей аплодисментов, выражавших сочувствие и понимание наряду с сердечным облегчением -- очень мощное положительное подкрепление озарения, которое пришло к спорщику. Случаи обучения такого типа, в которых важную роль играют поведенческие аспекты, а не словесное выражение, безумно трудно объяснить постороннему. Эрхард, подобно учителю дзен, часто прибегает к афоризмам; в случае описанного выше спорщика говорится так: "Когда ты прав, с тебя требуется только одно -- быть правым". Это значит, что не обязательно нравиться или вызывать другие приятные чувства: только быть правым. Если бы мне пришлось привести этот афоризм на вечеринке, на которой кто-нибудь распинается, человек, окончивший курсы, посмеялся бы, да и любой хороший современный тренер посмеялся бы, но большинство присутствующих решило бы, что я не в своем уме или пьяна. Озарение при тренировке не требует словесного выражения. Самоподкрепление Одним из наиболее полезных практических применений подкрепления является самоподкрепление. Мы им часто пренебрегаем, отчасти потому, что это не приходит нам в голову, отчасти, потому что склонны требовать от себя гораздо больше, чем от других. Как сказал один мой знакомый министр: "Немногие имеют столь низкие критерии, что по ним легко жить". В результате мы часто по нескольку дней не расслабляемся, переходя от одной задачи к другой, от нее к третьей, не замеченные и неотблагодаренные даже самими собой. Не говоря уже о подкреплении себя за изменение какой-либо привычки или приобретение нового навыка, какое-либо подкрепление необходимо и просто для будничной жизни; лишение себя подкреплений, мне кажется, -- один из факторов повышения нервозности и депрессий. Вы можете подкрепить себя здоровыми способами -- часом досуга, прогулкой, разговором с друзьями или хорошей книгой; или нездоровыми -- сигаретами, виски, пищей, от которой толстеют, наркотиками, сидением допоздна и т.д. Мне нравится высказывание актера Рута Гордона: "Актер должен получать комплименты. Если мне приходится долго обходиться без комплиментов, я хвалю себя сам, и это хорошо хотя бы потому, что при этом я уверен в искренности". II. ПРОЦЕСС ВЫРАБОТКИ: ФОРМИРОВАНИЕ ВЫСШИХ ФОРМ ПОВЕДЕНИЯ БЕЗ ПРИНУЖДЕНИЯ И БОЛИ Что такое процесс выработки Подкрепить поведение, которое уже имеется, чтобы оно возникало чаще, -- это понятно, но как обучающим заставить своих подопечных делать то, что случайно может ни когда и не возникнуть? Как заставить собаку сделать сальто назад или дельфина прыгнуть через обруч? Когда дело касается собак, делающих сальто, дельфинов, прыгающих через обруч, или людей, бросающих баскетбольный мяч в кольцо, то эти действия уже совершаются в процессе выработки. Выработка же состоит в том, чтобы использовать малейшую тенденцию изменений поведения в нужном направлении и шаг за шагом сдвигать ее к поставленной цели. На лабораторном жаргоне это называется последовательное приближение. Процесс выработки возможен потому, что поведение живых существ вариабельно. Что бы живое существо ни делало, в одних случаях оно выполняет это более энергично, чем обычно, а в других случаях -- наоборот. Неважно, сколь сложно и трудно то окончательное поведение, которое вы хотите выработать, вы всегда можете, установить ряд последовательных целей, найти какое-либо поведение, которое осуществляется уже сейчас, и использовать его как первый шаг. Например представим, что я решила обучить цыпленка "танцевать". Я могу начать с наблюдения за естественными движениями цыпленка и давать ему подкрепление всякий раз, как он повернется налево. Скоро первая цель будет достигнута: цыпленок начнет поворачиваться налево гораздо чаще, а вследствие вариабельности эти повороты будут то меньшими, то большими. Теперь я могу избирательно подкреплять только более выраженные движения налево -- например поворот на четверть круга. Когда эти движения станут преобладающими, естественная вариативность обусловит то, что некоторые повороты будут совершаться менее, чем на четверть круга, а некоторые будут приближаться к половине круга. Я могу повысить критерий, выдвинуть новую задачу и начать отбирать повороты на полкруга и более. Когда цыпленок обучится совершать несколько полных поворотов на большой скорости за одно подкрепление, я могу считать, что достигла своей конечной цели -- танцующего цыпленка. Мы все хорошо знакомы с выработкой поведения, являясь участниками или объектами этого процесса. - Попросту говоря, большая часть воспитания ребенка -- процесс выработки поведения. Обучение различным физическим навыкам -- от тенниса, до печатанья на машинке -- представляет из себя в основном выработку поведения. Мы находимся в процессе выработки или, по крайней мере, стараемся что- либо выработать всякий раз, когда упражняемся в чем-либо, начиная от публичного выступления, кончая игрой на фортепьяно. Мы находимся в процессе выработки и тогда, когда пытаемся изменить свое поведение -- бросить курить, быть менее застенчивым, лучше распоряжаться деньгами. Достигли или не достигли мы успеха в формировании 'ка кого-либо поведения у себя или кого-то другого, в конечном счета зависит не от нашего искусства, а от настойчивости. Музыкальный критик газеты "Нью-Йорк Таймс" писал об одном европейском дирижере, который не будучи великим музыкантом добивался необыкновенной музыки, заставляя свой оркестр репетировать каждый концерт в течение целого года. Большинство из нас может достичь определенного совершенства почти в любой деятельности, если потратить на это достаточно времени. Но это скучно. Разве мы не хотим всегда обучиться новому -- катанию на лыжах, игре на пианино, как и любой другой деятельности -- как можно быстрее? Конечно, хотим, и вот тут все дело в правильной выработке навыка. Далее, разве мы не предпочитаем избежать вообще или сократить до минимума повторения? Опять-таки, конечно же, но некоторые физические навыки требуют повторения, потому что мускулы "учатся" медленно, и требуется многократное повторение движений, прежде чем они станут совершаться с легкостью. Но даже в этом случае хорошо спланированная программа выработки может свести до минимума необходимую тренировку и сделать значимым каждый момент практических занятий тем самым чрезвычайно ускоряя совершенствование И наконец, в спорте, музыке и других творческих устремлениях вы можете захотеть развить не только стабильное выполнение навыка, но и выполнение на том наивысшем уровне, который доступен вам или тому, кого вы обучаете В этом случае правильное использование законов направленной выработки может быть решающим. Способы и приемы или закономерности Есть два аспекта выработки: первый способ и приемы, то есть последовательность шагов, необходимых для выработки типа поведения, и второй -- закономерности или правила, предписывающие, как, когда и почему эти типы поведения должны подкрепляться. Большинство тренеров, большинство книг о тренировке и большинство тех, кто обучает тренеров,- имеет дело пото[м] исключительно со способом или приемом. "Возьмите в руки клюшку для гольфа как показано на рисунке", "Подведите прицел винтовки под нужное место мишени", "Никогда не наклоняйтесь в горах", "Взбивайте яйца металлическим венчиком по часовой стрелке" Это прекрасно. Эти приемы обычно складываются годами при участии многих людей, путем проб и ошибок, и поэтому они оптимальны. В самом деле вы будете более уверенно сидеть на лошади, если пятки у вас опущены, а мяч для гольфа будет послан вами дальше, если вы хорошенько отклонитесь в сторону замаха. Если вы заинтересованы в том, чтобы овладеть каким-либо навыком, я могу вас уверить, что вы извлечете максимум возможного от устоявшихся приемов выполнения действий, которые включаются в данный навык, почерпнув это из книг, от преподавателей, инструкторов и наблюдая или изучая действия других людей. Другую сторону выработки составляют закономерности, которые регулируют сам процесс обучения: когда надо поднажать, когда подослабить обучение; как наиболее эффективно повышать критерии, что делать, если возникли затруднения, и, вероятно, самое главное -- когда остановиться. В этих вопросах обычно полагаются на интуицию и опыт тренеров или инструкторов, на случай или удачу. Между тем именно успешность применения этих закономерностей определяет разницу между просто хорошим и великим преподавателями, между радостным, быстрым и успешным обучением и обучением, приводящим к срывам, медленным, скучным и неприятным. Хороший процесс выработки, а не только хорошие приемы, делают обучение эффективным. Десять правил выработки С моей точки зрения существуют десять правил, управляющих процессом выработки. Некоторые -- по крайней мере четыре первых -- берут начало из психологических лабораторий и установлены экспериментально. Другие, насколько мне известно, даже не являлись предметом специального изучения, но рассматриваются всеми, кто имел дело с выработкой поведения, как неотъемлемая особенность: вы всегда знаете (обычно слишком поздно), когда вы нарушили одно из них. Я перечислю эти правила, а затем несколько подробнее остановлюсь на каждом из них: 1. Повышайте критерий небольшими градациями, чтобы у субъекта всегда была реальная возможность выполнить требуемое и получить подкрепление. 2. В конкретный промежуток времени отрабатывайте что-нибудь одно, не пытайтесь формировать поведение по двум критериям одновременно. 3. Прежде чем увеличивать или повышать критерий, пользуйтесь подкреплением текущего уровня ответа, т.е. подкрепляйте любое исполнение данного действия, имеющегося в данный момент. 4. Вводя новый критерий, временно ослабьте старые. 5. Будьте впереди того, кого вы обучаете: полностью планируйте свою программу выработки так, чтобы в случае внезапного успеха обучаемого, вы знали, что следует подкреплять далее. 6. Не меняйте тренеров на "середине реки"; у вас может быть несколько инструкторов на одного обучающегося, но придерживайтесь одной программы выработки на каждый из типов поведения. 7. Если одна процедура выработки не приносит успеха, найдите другую, существует столько же способов добиться нужного поведения, сколько инструкторов, способных их придумать. 8. Не кончайте тренировку, не дав положительного подкрепления, это соответствует наказанию. 9. Если навык ухудшается, "возвратитесь к детскому саду", быстро повторите весь процесс выработки с серией легких подкреплений. 10. Оканчивайте, по возможности, каждую тренировку на высокой ноте и в любом случае останавливайтесь, оставаясь впереди обучаемого. 1.Повышайте критерий небольшими градациями, чтобы у субъекта всегда была реальная возможность выполнить требуемое и получить подкрепление. Практически это означает, что, когда вы увеличиваете требования или повышаете критерий подкрепления, вы должны это делать в пределах, доступных в данный момент субъ екту. Если ваша лошадь берет барьер в два фута, иногда имея фуг в запасет вы можете увеличить барьер до двух с полови ной футов. Поднять его до трех футов, значит искать себе неприятностей: животное способно на это, но пока не в со стоянии обеспечить стабильности. А повысить барьер до трех с половиной футов означает накликать несчастье. То, насколько быстро вы можете увеличить критерий, не зависит от фактических возможностей субъекта, нынешних или будущих, никогда не исходите из того, что лошадь боль шое существо с сильными ногами, способное взять восьми футовое препятствие, или из того, что она обычно перепры гивает через четырехфутовый забор на пастбище. Быстрота увеличения критерия зависит от того, насколько хорошо ва ше взаимодействие в процессе выработки, каковы ваши пра вила подкрепления. Каждый раз, как вы увеличиваете критерий, вы меняете правила. Субъекту должна быть дана возможность обнаружить это; несмотря на изменение правил, при некотором увеличении усилий, субъект должен продолжать получать под крепление (но при этом в некоторых случаях выполнение действия на прежнем уровне становится неэффективным). Это может быть усвоено только в процессе ознакомления с подкреплением на новом уровне. Если вы повышаете критерий так сильно, что субъекту надо совершить усилия значительно большие, чем он ранее совершал для вас -- неважно делал или не делал он это для себя, -- вы сильно рискуете. Поведение может быть сорвано. У прыгуна могут появиться дурные привычки, такие, как останавливаться перед барьером или сбивать его. Привычки, подавление которых потребует много времени. Самый быстрый -- а иногда единственный -- способ сформировать поведение -- это увеличивать критерии такими ступенями, чтобы субъекту легко давалось постоянное улучшение поведения. Непрерывный прогресс, даже дюйм за дюймом, приведет вас к поставленной цели гораздо быстрее, чем попытки форсировать быстрый прогресс с риском потерять все выработанное поведение. Однажды мне пришлось встретиться с одним отцом, допустившим в этом серьезную ошибку. Так как сын-подросток очень плохо учился, он отобрал у него обожаемый всеми подростками мотоцикл до улучшения отметок. Мальчик стал заниматься лучше, его оценки улучшились, с F и D до D и С.-Однако вместо того, чтобы поощрить этот прогресс, отец сказал, что оценки еще недостаточно хорошие, и продолжал придерживаться своего запрета. Эта эскалация критерия была слишком резкой, мальчик совсем перестал заниматься. Более того, он стал очень недоверчивым. 2. В конкретный промежуток времени отрабатывайте что-нибудь одно, не пытайтесь формировать поведение по двум критериям одновременно. Под этим я не подразумеваю, что вы не можете работать над многими различными типами поведения в один и тот же период времени. Безусловно, вы можете это. Во время любого занятия мы можем сначала немного поработать над качеством, затем над скоростью --в теннисе над ударом слева, затем над ударом справа, затем над работой ног и т.д. Это избавляет от монотонности. Хорошие преподаватели все время меняют работу, оставляя данную задачу, как только в ней достигнут успех, и переходят к другой. Однако, когда вы работаете над данным типом поведения, вы должны пользоваться в каждый данный отрезок времени одним и только одним неизменным критерием. Допустим, что я обучаю дельфина делать фонтан брызг, и один раз не дам ему подкрепление, потому что фонтан недостаточно велик, а другой раз -- потому что он направлен не в ту сторону, в итоге у животного не будет ключа к расшифровке того, что я хочу от него. Одно подкрепление не может содержать двух типов информации: я должна сначала довести высоту фонтана до удовлетворяющей меня отметки, а затем формировать его направление вне зависимости от высоты, до тех пор, пока оно тоже не будет заучено; только когда оба критерия установлены, я могу-требовать соблюдения обоих. У этого правила множество практических применений. Если задачу можно расчленить на отдельные компоненты, которые затем формируются раздельно, обучение пойдет гораздо быстрее. Рассмотрим обучение удару в гольфе, отправляющему мяч в лунку. Попадет ли мяч в лунку зависит от правильности расстояния, на которое послан мяч, -- чтобы оно не было меньше, чем расстояние до лунки, и чтобы мяч не перелетел через нее ~ и от направления удара, чтоб мяч не уходил ни в одну, ни в другую сторону от лунки. Если я собираюсь обучиться удару, я буду практиковаться в этих навыках раздельно. Я бы положила на траву пучок шнура длиной в несколько футов и стала бы тренироваться, посылая мяч вдоль него сначала с расстояния двух, затем четырех, шести, десяти футов и т.д. Я могла бы сделать из шнура круг и стала тренироваться попадать в него с определенного расстояния, постепенно уменьшая размер круга, до тех пор, пока не смогла бы надежно попадать в очень маленькую цель. Только когда меня будут удовлетворять мои навыки удара по мячу как для посылки его на нужное расстояние, так и в заданном направлении, я их объединю и, сделав большую цель, начну менять расстояние, а затем стану уменьшать цель и, снова меняя расстояние, добьюсь попадания в маленькую цель с различных дистанций. Затем по мере улучшения навыка удара я могу добавлять новые критерии, по одному в каждый конкретный момент времени. Это поможет мне стать превосходным или по крайней мере очень хорошим игроком в гольф в зависимости от моей настойчивости и пределов зрительно-моторной координации. Это обеспечит мне, безусловно в пределах моих возможностей, надежность попадания мячом в лунку. Я утверждаю, что любой игрок в гольф, пользуясь такой однозадачной программой выработки, за несколько выходных достигнет большего, чем за целое лето бессистемной тренировки, волей-неволей надеясь достичь каждым ударом и правильности расстояния, и правильности направления. Часто нам не удается добиться прогресса в каком-либо навыке, хотя мы много упражняемся, потому, что мы пытаемся сразу улучшить две или более стороны деятельности. Нужно подумать: одно ли свойство характеризует данное поведение? Нельзя ли его расчленить и работать отдельно над различными критериями? Когда вы займетесь этими вопросами, большинство проблем решаться сами собой. 3. Прежде чем увеличивать или повышать критерий, пользуйтесь вариативной шкалой подкреплений имеющегося в данный момент уровня ответа. Вы помните о вариативной шкале подкреплений? Как только поведение усвоено, вы должны начать подкреплять его не каждый раз, чтобы поддерживать его на данном уровне. Это правило составляет суть процесса выработки. Когда вы можете позволить себе подкреплять данный уровень поведения случайным образом и сохранять уверенность в получении его, вы получаете свободу в использовании подкреплений только за лучшие проявления данного поведения. Такое селективное подкрепление "сдвинет" нормальное или среднее поведение в сторону того улучшения, которое вам желательно. Хорошая выработка представляет из себя серию чуть заметных переходов между непрерывным подкреплением - когда достигнут новый уровень выполнения - и вари ативным подкреплением - когда достижение закрепилось и создалась возможность избирательного подкрепления еще более хороших ответов. Иногда смена стабильных и вариативных шкал происходит очень быстро, составляя два-три подкрепления на каждом уровне. Вероятность этого особенно велика, если у субъекта внезапно наступает "озарение" - он начинает понимать конечную цель, и улучшение поведения становится спонтанным. В этом случае введение вариативной шкалы столь значимо для обучения, что это необходимо постоянно помнить и все время контролировать, не забуксовала ли, не перестала ли приносить успех ваша программа выработки. 4. Вводя новый критерий, временно ослабьте старые. Допустим, вы учитесь играть в сквош (что-то вроде тенниса) и успешно работаете над одной целью - послать мяч туда, куда вы хотите. Теперь вы хотите поработать над скоростью, но, когда вы усиливаете удар, мяч летит куда попало. Забудьте на некоторое время о точности и просто ударяйте по мячу. Когда вы научитесь управлять скоростью мяча, точность скоро восстановится. То, что раз выучено, не забывается, но под подавляющим воздействием нового критерия старое, хорошо выученное поведение иногда временно уходит в сторону. Однажды я видела дирижера, который пришел в состояние крайнего раздражения во время генеральной репетиции оперы, потому что певцы хора делали одну ошибку за другой, они как будто забыли всю свою твердо выученную вокальную партию. Причиной было то, что они в первый раз надели тяжелые костюмы, их поставили на подмостки и заставили двигаться во время пения: привыкание к новым условиям временно перекрыло выученное ранее поведение. К концу репетиции их музыкальное мастерство восстановилось без дополнительных репетиций. Дрессировщики дельфинов называют это "синдромом нового бассейна". Когда вы помещаете дельфина в новый бассейн, для вас не должно быть неожиданностью, что он "забудет" все, что знал, пока не привыкнет к новой обстановке. Следует помнить, что ругать себя или других за ошибки в выученном поведении, совершаемые при новых обстоятельствах, непедагогично. Ошибки обычно исправляются в скором времени сами по себе, а выговоры огорчают, а иногда фиксируют внимание на ошибках, которые становятся постоянными. 5. Ведите ученика за собой. Планируйте программу выработки так, что, если субъект совершит в обучении неожиданный скачок вперед, вы должны знать, что подкреплять далее. Однажды' я в течение двух дней обучала только что пойманного дельфина прыгать через препятствие, выступающее над водой на несколько дюймов. Когда поведение прочно установилось, я подняла барьер еще на несколько дюймов, животное тотчас же прыгнуло, и с такой легкостью, что я скоро снова подняла барьер уже на гораздо большую высоту; через пятнадцать минут этот новичок прыгал на восемь футов. Такого рода "рывок" выработки может произойти в любой момент. Этот феномен наблюдается как у людей, так и у многих видов разумных животных. Я считаю, что тут дело в инсайте (внезапное озарение): субъект внезапно осознает ваши цели, исходя из которых вы добиваетесь его действий (в данном случае - прыгнуть как можно выше), и делает это. Киты-касатки славятся своим предвосхищающим обучением. У их дрессировщиков в ходу одна и та же шутка: касатку не надо дрессировать, достаточно записать программу поведения на доске и вывесить ее в воде, и киты будут следовать этому предписанию. Дрессировщики могут встретиться с осложнениями только в том случае, если они оказываются неподготовленными к неожиданному улучшению. Если вы тренируете переход от стадии А к Б, а субъект внезапно чисто выполняет стадию В уже с двух подкреплений, вы должны предусмотреть подкрепление стадии Г и Д, иначе в дальнейшем вам нечего будет подкреплять. "Рывок" часто эмоционально очень значим для субъекта; даже животные, по-видимому, испытывают удовольствие от "ага!" познания, и часто впадает в состояние явно повышенного настроения. Таким образом, "рывок" - это блистательная возможность добиться значительного прогресса в кратчайшие сроки. Быть не готовым к нему и держать субъект на низком уровне обучения только потому, что вы не знаете, что делать дальше, -лучший способ потратить зря время, а в худшем случае может отбить охоту к обучению и вызывает отвращение у субъекта, который станет в будущем работать без особого желания. За очень редкими исключениями наша школьная система построена так, чтобы помешать детям обучаться в их собственном темпе - наказываются не только медленные ученики, у которых не хватает времени на обучение, но и слишком быстро обучающиеся, которые не получают дополнительного подкрепления, когда быстрая сообразительность продвигает их вперед. Если ты мгновенно понял, о чем толкует учитель математики, твоей наградой может стать мучение от скуки в течение часов или даже недель, пока все остальные мало-помалу постигнут это. Поэтому нет ничего удивительного в том, что улица более привлекательна как для наиболее быстрых, так и для медленных. 6. Не меняйте тренеров на полпути. В процессе выработки какого-либо поведения вы рискуете значительным регрессом, если перепоручаете своего ученика другому преподавателю. Не важно, сколь скрупулезно обсуждены критерии перед передачей дела, поскольку и индивидуальные установки, и время реакций, и прогноз успеха будут слегка отличаться, и в итоге субъект утрачивает подкрепления до тех пор, пока не привыкнет к этим отличиям. Конечно, у каждого обучающегося может быть много различных учителей - мы не испытываем затруднений от того, что один обучает нас французскому, другой - арифметике, третий - футболу. Но то конкретное поведение, которое должно быть разучено, требует только одного учителя в каждый конкретный момент времени. На тех стадиях выработки, когда навык образован наполовину, постоянное повышение критерия осуществляется лучше, если процесс формирования данного поведения находится в одних руках. Допустим, если у вас двое детей и одна собака, и оба хотят обучать собаку, то разрешите им это, но пусть каждый работает над различными, каждый над своими трюками, и тем избавьте бедную собаку от большой неразберихи. Те, кто хочет учиться, будут учиться при наихудших условиях. В Колумбийском университете был поставлен получивший в настоящее время широкую известность эксперимент по "языку обезьян", в котором шимпанзе обучали словарю американского знакового языка и другим кодам; в эксперименте принимал участие детеныш шимпанзе по имени Ним Шимрски. По бюджетным и другим соображениям, у бедняжки за трехлетний период было чуть ли не сто "учителей" знакового обозначения. Студенты и экспериментаторы были разочарованы, поскольку Ним не демонстрировал твердых доказательств использования реального "языка". А именно, он, по-видимому, никогда не строил предложений. Но он выучился распознавать и понимать более трехсот символов - существительных, глаголов и т.д., что при данных обстоятельствах, с моей точки зрения, является поразительным. То же самое происходит с некоторыми детьми, которые переходят из школы в школу, проходя через бесконечную смену учителей, приемов и методов обучения, и тем не менее обучаются. Но есть более хорошие способы. Единственный случай, когда вам следует подумать о смене преподавателя посредине процесса выработки, это, конечно, когда обучение зашло в тупик. Если обучение идет плохо или совсем не идет, то вам нечего терять от перемены. 7. Если одна процедура выработки не приводит к успеху, попробуйте другую. Поразительно, до чего люди бывают привержены к неэффективной системе, будучи убежденными, что повторение одного и того же даст результаты. Для выработки любого поведения существует столько же способов, сколько инструкторов, способных их придумать. Например, при обучении детей плаванию надо сделать так, чтоб они не боялись и чувствовали себя спокойно под водой. В качестве первого шага формирования этого навыка одни тренеры велят им выдувать в воду воздух, пуская пузыри, другие - быстро опускать в воду и поднимать обратно лицо, а третьи - прыгать в воде, пока они не отважатся просто присесть, чтобы вода закрыла их. Любой хороший тренер, видя, что ребенку скучно или его пугает этот метод, перейдет на другой; одни и те же методы выработки не равноценны для разных индивидуумов. Дрессировщики, передающие свое искусство от поколения к поколению, такие, например, как цирковые дрессировщики, часто не могут этого усвоить. Их методы дрессировки отточены несколькими поколениями и передаются от одного к другому - вот способ научить медведя кататься на велосипеде, а вот способ обучить льва издавать рык (если хотите знать - надо выдернуть несколько волосков из его гривы). Эти передаваемые из поколения в поколение "рецепты" считаются лучшими способами, а иногда таковыми и являются, но они часто рассматриваются и как единственные способы, что является причиной того, что цирковые представления чрезвычайно похожи друг на друга. Однажды один телевизионный деятель, который ставил шоу в океанариуме "Жизнь моря", пригласил меня посетить их ферму в Вирджинии и посмотреть, как тренируют лошадей. Эта знаменитость был превосходным наездником и тренером и у него было несколько прекрасно обученных лошадей. Мы наблюдали, как учили лошадь кланяться, или становиться на одно колено при помощи традиционного метода, включавшего двух людей и множество веревок и кнутов; при помощи этого метода лощадь многократно заставляли становиться на одно колено до тех пор, пока она не научилась опускаться на него сама. Я сказала, что необязательно делать это таким образом, и утверждала, что могу научить лошадь кланяться, даже не прикасаясь к животному (один из вариантов: нарисовать на стене красное пятно; использовать пищу в качестве условного подкрепления выработки у лошади касания коленом пятна, затем постепенно снижать пятно, приближая его к полу, чтобы лошади пришлось встать на колени, чтобы коснуться его и заработать подкрепление). Телевизионная звезда пришла в негодование от такого наглого заявления - что за мысль! Если бы существовал другой способ научить лошадь кланяться, он бы знал об этом - нам пришлось два или три раза обойти вокруг сарая, чтоб он немного поостыл. 8. Не кончайте урок без положительного подкрепления, это равносильно наказанию. Это не относится к той несистематической (хотя очень значимой и продуктивной) выработке, которая происходит в домашних условиях, - поощрение учения в школе, гостеприимство, подбадривание детей; здесь подкрепление происходит от случая к случаю, без особых правил. Однако в более официальной ситуации - скажем, на уроке или при выработке поведения у какого-либо животного - преподаватель должен уделять свое внимание ученику или классу до конца урока. Это более, чем просто хорошие манеры или хорошая самодисциплина; это - хорошее обучение. Когда субъект старается заработать подкрепление, он, так сказать, вступает в контакт с преподавателем. Если преподаватель начинает болтать с кем-либо из присутствующих, выходит, чтобы поговорить по телефону, иди просто мечтает, контакт нарушается. Подкрепление не поступает, хотя обучающийся и не сделал ошибки. Это приносит больше вреда, чем если бы преподаватель просто упустил хороший шанс для подкрепления. Это может плохо сказаться даже на хорошо отработанном поведении, которое осуществляется в это время. Конечно, если вы хотите упрекнуть ученика, перестать обращать на него внимание - лучший способ сделать это. Дрессировщики дельфинов называют это "тайм-аут" и используют для коррекции неправильного поведения. Забрать корзину с рыбой и уйти на минуту - один из способов сказать дельфину: "Нет!" или: "Неправильно!" Обычно это оказывается очень эффективным - не следует думать, что дельфины не могут огорчаться или раскаиваться, они это могут. Лишение внимания - мощный инструмент, поэтому не применяйте его без должной осторожности и несправедливо. 9. Если выученное поведение ухудшается, пересмотрите процедуру выработки. Иногда навык или поведение портятся, а иногда создается видимость их полной потери. Нам всем знакомо это чувство, когда пытаемся говорить на иностранном языке, вспомнить стихотворение или поехать на велосипеде после многолетнего перерыва: это очень выбивает из колеи. Иногда внешние обстоятельства временно полностью, уничтожают хорошо выученное поведение- например, в состоянии испуга невозможно произнести заученную речь, неудачное падение резко нарушает ваши навыки скалолазанья. Иногда на первоначальное обучение накладывается и мешает ему последующее обучение, создавая путаницу - вы стараетесь найти испанское слово, а всплывает немецкое. Самый быстрый способ исправить такое ухудшение - не биться об него головой, заставляя субъект делать это до тех пор, пока результат не покажется вам удовлетворительным или пока вы не дадите подкрепление, а вернуться к началу процесса выработки и "очень быстро снова пройти весь путь, давая подкрепление в новых условиях (спустя двадцать лет, на публике и т.д.) и применяя по одному-два подкрепления на каждом уровне. В океанариуме "Жизнь моря" мы называли это "вернуться в детский сад", и такой прием часто восстанавливал ухудшившееся поведение до нормального уровня за десять-пятнадцать минут. Конечно, так мы всегда и поступаем, когда повторяем материал перед экзаменом или освежаем память, заглянув в текст, прежде чем выходим на трибуну. Полезно помнить, что если вы в состоянии в большей или меньшей степени воспроизвести исходный процесс выработки, то такое повторение одинаково полезно и для физических, и для умственных навыков Оно действенно как у животных, так и у людей. 10. Прекращайте работу, оставляя за собой лидирующее положение. - Сколько должен продолжаться каждый сеанс выработки? Частично это зависит от промежутка времени, в течение которого субъект сохраняет внимание. Кошки часто начинают проявлять беспокойство после, примерно, двенадцати подкреплений, поэтому пяти минут может быть достаточно. Собаки и лошади могут работать дольше. У людей продолжительность различных уроков традиционно равна часу, а занятия футболом, научные семинары и разные другие мероприятия часто длятся целый день. Когда остановиться, не столь важно, как на чем остановиться. Вы должны всегда прекращать работу, сохраняя ведущее положение. Это относится и ко всему уроку, и к отдельным частям его, когда вы кончаете работать над одним типом поведения и переходите к другому. Вы должны совершать переход на высокой ноте - т.е. сразу как только достигнут успех. Последнее совершенное действие всегда закрепляется в сознании субъекта; вы должны быть уверены, что это хорошее, вознаграждаемое выполнение. А часто происходит так, что мы получаем три-четыре хороших ответа - собака прекрасно ищет и подает предмет, прыгун в воду впервые выполнил прыжок полтора оборота, певец правильно исполнил трудный пассаж - и мы так возбуждены, что хотим видеть или делать это скова и снова. И мы повторяем это или стараемся повторить, и очень скоро субъект устает, поведение ухудшается, неожиданно возникают ошибки, происходят коррекции и подбадривания, и урок идет насмарку. Наездники-любители поступают так всегда. Вот почему я терпеть не могу смотреть, как люди обучают своих лошадей прыгать; как часто они далеко заходят за черту, где следует остановиться, когда животное выполнило действие хорошо, и прежде, чем поведение не начало снова ухудшаться. Будучи тренером вы должны, если это необходимо, затавлять себя останавливаться на хорошем ответе. Иногда это требует выдержки. Но на следующем уровне вы можете обнаружить, что принос предмета, сальто при прыжке в воду или вокальное упражнение выполнены не только так же хорошо, как последнее на прошлом уроке, но значительно лучше. Психологи называют это "латентным обучением". В процессе тренировки возникает некоторый стресс, хотя бы от желания сделать лучше. Этот стресс может влиять на выполнение действия, маскируя реально имеющееся обучение. В начале следующего урока, прежде чем возникнет стресс, выполнение действия может в действительности быть на шаг впереди по сравнению с тем уровнем, на котором остановились, и тогда вы получаете то, что гораздо более достойно подкрепления. Формирование поведения таким способом, конечно, противоположно обучению при помощи муштры и повторений. Оно может обеспечить не только стабильный прогресс, но абсолютно безошибочное обучение, и оно может идти чрезвычайно быстро. Однажды я так приучила пони к уздечке за пятнадцать минут, двигаясь непрерывно взад-вперед, формируя пять задач (вперед, остановка, налево, направо и назад). При этом я подкрепляла успех в каждой из них. Как ни странно, возможность такого быстрого обучения зависит от вашей готовности отказаться от временных рамок и постановки специфической цели, цели быстрого прогресса. Вместо этого вы должны быть просто готовы остановиться, оставаясь впереди. Феномен Дзен. Иногда вы не можете кончать каждый урок на высокой ноте. Возможно, что слушатели оплатили час занятий, и они хотят использовать весь этот час, хотя наилучшее время для окончания урока было достигнуто раньше. А может, урок идет не слишком хорошо, чтобы обеспечить наивысший подъем, и вот-вот наступит усталость. В этом случае наиболее мудро окончить урок чем-нибудь легким, что гарантирует получение подкрепления, чтобы весь урок в целом запомнился как подкрепленный. Дрессировщики дельфинов часто оканчивают длительные, требующие напряжения занятия легкой игрой в мяч; обучающие верховой везде иногда используют разные игры, например салочки. Самым нецелесообразным приемом является введение новых задач или материала в конце занятий, вследствие чего оно заканчивается серией неадекватных и неподкрепляемых ответов. Когда я была ребенком, мои уроки музыки всегда кончались таким способом; это очень обескураживает, и я до сих пор не могу играть на пианино. Обучающие игры Даже если вы знаете и понимаете принципы выработки, вы не можете применять их, без предварительной практики. Выработка это не словесный процесс, это невербальный навык - развертывающийся во времени процесс взаимосвязанного поведения, наподобие танца, ухаживания или серфинга. Поэтому его нельзя до конца познать с помощью чтения, размышления или разговоров. Вы должны выполнять его. Одним из простых и завораживающих способов развить навыки выработки являются обучающие игры. Я использовала эти игры, обучая технике дрессировки. Многие тренеры играют в них из спортивного интереса; они интересны и для развлечения гостей. Для игры необходимо по крайней мере два человека: обучающийся и тренер. Оптимально количество шесть человек, потому что тогда каждый может побывать и испытуемым и тренером, прежде чем группа утомится; большая группа, например класс или лекционная аудитория, тоже возможна, потому что наблюдать за этим почти так же увлекательно, как участвовать. Вы отсылаете испытуемого из комнаты. Остальные выбирают тренера и поведение, которое должно быть сформулировано: например, написать свое имя на доске, попрыгать или взобраться на стул. Испытуемый приглашается в комнату, и его просят двигаться по комнате и производить любые движения; тренер свистком подкрепляет движения в направлении желаемого действия. Я предпочитаю, по крайней мере при первых нескольких подкреплениях, придерживаться правила, чтобы "подопытный" должен был возвращаться к дверям после каждого подкрепления начинать действия заново; это, по-видимому, препятствует развитию у некоторых испытуемых тенденции просто останавливаться в том месте, где было получено последнее подкрепление. И никаких разговоров. Смех, вздохи и другие проявления эмоций допускаются (разрешаются), но инструкции и обсуждения исключаются до тех пор, пока не достигнуто задуманное поведение. Обычно обучающие игры протекают довольно быстро. Вот пример: мы вшестером играем в комнате у одного из друзей. Руфь соглашается быть подопытной, очередь Анны быть тренером. Руфь выходит из комнаты. Мы решаем, что поведение должно состоять в том, чтобы включить лампу, стоящую на столике у кушетки. Руфь приглашается назад и начинает двигаться по комнате. Когда она поворачивается в сторону лампы, Анна свистит. Руфь возвращается на "старт" (дверь в комнату), затем целенаправленно движется к точке, где получила подкрепление, и останавливается. Свистка нет. Она делает попытку сдвинуться с места сначала в сторону от лампы. Попрежнему свистка не слышно, Руфь снова начинает ходить. Когда она снова направляется к лампе, Анна свистит. Руфь возвращается к двери, а затем снова к тому новому месту, где она только что слышала свисток, но на этот раз она продолжает двигаться вперед. Удача: свисток! Не возвращаясь к двери, она еще немного проходит вперед и слышит свисток, как раз когда проходит мимо конца стола. Она останавливается. Стучит по краю стола. Свистка нет. Разводит руками, свистка нет. Одна рука слегка касается абажура, Анна свистит. Руфь начинает ощупывать со всех сторон абажур - двигать, поворачивать, качать: свистка нет. Руфь опускает руку под абажур. Свисток. Руфь снова опускает руку под абажур и производит очень знакомое действие, имеющее какую-то цель, она осуществляет эту цель и включает лампу. Анна свистит, а мы все аплодируем. Но не всегда все идет так гладко, даже если поведение простое и знакомое. Если вернуться к только что проделанному эксперименту, то надо сказать, что Анна нашла хорошее решение при обучении, воздержавшись от поДкреПления, когда Руфь пошла в сторону от места, где получила подхрепление первый раз, двигаясь в неверном направлении. Однако, если бы Руфь снова пошла к тому месту и остановилась бы, у Анны могли бы возникнуть затруднения. Вот пример обучающей игры, в которой встречается больше затруднений. Я вела занятия по приемам дрессировки в старшем кЛассе школы. Леонард был подопытным, а Бет тренером. На этот раз поведение состояло в том, чтобы включить свет выключателем, расположенным на стене. Леонард пошел в комнату и начал по ней двигаться, а Бет быстро обучала его подходить к стене, на которой находился выключатель. Однако Леонард начал, свое движение, держа руки в карманах: после нескольких подкреплений за движение с руками в карманах, их там как будто приклеили. Он толкал стену, поворачивался и прислонялся к ней, он даже прислонился к выключателю, но казалось, что он не замечал выключателя и ни разу не вынул рук из карманов. Наблюдая это, я думала, что если бы была возможность заставить Леонарда ощупывать стену рукой, он заметил бы выключатель и зажег бы свет. Но как вынуть эти руки из карманов? Бет "подловила" с помощью свистка сгибание ног в коленях в то время, когда Леонард стоял спиной к стене, и скоро обучила его тереться спиной о стенку около выключателя. Остальные ученики начали хихикать, так как поняли, что, сдвинув эти движения в сторону, Бет может заставить Леонарда нажать выключатель спиной и тем самым достичь результата случайно, если уж не получается преднамеренно. Но это был медленный процесс, а мы стали замечать, что Леонард начинает расстраиваться и сердиться. "Можно я попробую?" - спросила Марта. Бет взглянула на меня вопросительно, я кивнула, класс согласился с видимой неохотой, и Марта вынула свой собственный свисток (подкрепление в виде владения свистком производилось в условиях очередности). Марта отправила Леонарда назад на стартовую позицию у двери, а затем поставила стул недалеко от выключателя на расстоянии примерно фута от стены, уселась на него сама и кивнула Леонарду, чтобы он начинал. Он тотчас же кинулся к стене, где его так часто подкрепляли, следуя мимо Марты и видимо игнорируя ее новое положение. Когда он проходил мимо нее, она быстро выставила ногу, дав ему подножку. Руки Леонарда вылетели из кармана и уперлись в стену, чтобы предотвратить падение; как только руки коснулись стены, раздался свисток. Леонард застыл. Он глядел на Марту. Она смотрела в пространство, чтобы не давать ему никакого намека. Он начал осторожно похлопывать по стене; она это действие подкрепила. Он снова похлопал по стене и на этот раз посмотрел на то, что делает; она снова это подкрепила. Затем мы все увидели, как Леонард внезапно посмотрел на выключатель. Все затаили дыхание. У него напряглась спина от внезапного осознания, и он включил свет. Бурные аплодисменты. Все участвующие в обучающей игре, будь то участники или зрители, получают урок почти при каждом подкреплении. Прежде всего тренер должен уяснить, что точность времени подачи подкрепления превыше всего. Предположим, испытуемый приближается к выключателю, но в этот момент, когда тренер дает свисток, поворачивается в сторону от него. Ладно, думает тренер, я подловлю его в следующий раз. А теперь, предположим, испытуемый возвращается на стартовую позицию, затем быстро направляется в сторону выключателя и поворачивается от него. Увы! Тренер сформировал этот поворот. И все, а не только тренер, видят, насколько критично дать свисток чуть раньше, пока желаемое поведение в действительности осуществляется. Испытуемый должен уяснить, что при этой форме обучения мозг - не помощник. Совершенно безразлично, что вы об этом думаете; если вы просто передвигаетесь, коллекционируя свистки, ваше тело поймет, что делать, без вашей помощи. Это поистине мучительный опыт для ярких интеллектуальных людей. У них имеется тенденция замирать, услышав свисток, и пытаться анализировать, что они делали. То, что они этого не знают, и то, что их незнание ничего не значит, их шокирует. Однажды мы с моей коллегой Шери Диш обучали психолога Рональда Шустермана ходить по комнате заложив руки за спину в течение примерно минуты - довольно длительный период без подкрепления, но он был очень прилежен до тех пор, пока собравшиеся не пришли к мнению о том, что мы полностью сформулировали поведение, и не разразились аплодисментами (что является подкреплением для тренера и почти всегда возникает спонтанно). Рон, который во время своих исследований много работал с обучением животных и который опрометчиво считал, что его самого нельзя "выдрессировать", не подозревал, что его сцепленные за спиной руки являются сформированным поведением, а не просто надпороговым выражением мышления. То, что при этом происходит, не является разновидностью макиавеллевского обучения с подкреплением, но случай привычной ошибки, когда считается, что словесная коммуникация наиболее важна и что обучение не может произойти без использования языка или по крайней мере некоего вербального осмысливания. Опыт невербального обучения особенно полезен для тех, кто использует массу словесных инструкций в своей профессиональной деятельности: учителей, терапевтов, инспекторов. Побывав "животным", вы сможете проникнуться симпатией, даже сочувствием к любому субъекту, который осуществляет формируемое вами поведение, но не отдает себе отчета, что от него ожидается, и поэтому легко впадает в ошибки. Вы сможете быть терпеливыми по отношению к животному (или ребенку, или больному), которое срывается и впадет в ярость, когда то, что он считал правильным действием, оказывается неподходящим, это непредвиденное осложнение у человеческих существ может вызвать слезы. И если вы однажды в эксперименте осуществили невербальное формирование поведения у взрослого человека, вы не будете с такой легкостью говорить при обучении и тренировке в реальной жизни, что субъект (неважно, животное или студент) "ненавидит меня", или "нарочно старается вывести меня из себя", или "глуп", или "должно быть, болен сегодня". Во время этого эксперимента, в котором каждый участвует с собственного согласия и по желанию, становится совершенно очевидно, что если что-то идет не так, то это зависит от процесса обучения, а не от того, кого обучают. Озарение, которое возникает от этой игры у профессионалов, тоже достаточно забавно (и все остальные в тот же момент, что и вы, чувствуют ваше озарение - вы его не можете скрыть, а с другой стороны, вас окружает забавное сочувствие). Очарование игры, используемой просто как времяпровождение, состоит в том, что в нее может играть любой человек без какой-либо предварительной подготовки. Некоторые люди обладают удивительными способностями к этому. Как показывает мой опыт, обладающие хорошей интуицией, творческие, чрезвычайно эмоциональные люди становятся большими дрессировщиками, а спокойные, наблюдательные люди - прекрасными подопытными - как раз наоборот, чем можно предположить. И,- наконец, достаточно только взглянуть на комнату, заполненную народом, поглощенным происходящим процессом формирования (действия), когда все, кроме подопытного, сидят не шелохнувшись, а тело и мозг тренера сконцентрированы на задаче, чтобы увидеть, что этот эксперимент достоин кисти художника или пера писателя: это творчество. За исключением театра, ощущение творчества редко является групповым. И уже только с одной этой точки зрения обучающая игра представляет ценность. Мы провели несколько запоминающихся раундов обучающей игры в океанариуме "Жизнь моря", особенно запомнилась одна, в которой философ Грегори Батесон, который будучи подопытным у нескольких дрессировщиков дельфинов убедительно доказал, что его невозможно обучить, и не потому, что он стоял без движения - думал, а потому, что предлагал такое бесконечное разнообразие ответов, что просто засыпал ими дрессировщика. Другой интересный для меня раунд этой игры состоялся однажды после завтрака, на котором присутствовали шесть деловых женщин, мало знакомых друг с другом и не связанных общностью работы. После двух часов игры, в которой психотерапевт оказалась превосходным "животным", а танцовщица диско - блестящим "тренером, мы расстались, узнав друг друга много лучше и к тому же питая друг к другу большую симпатию. В 1980 г. я вела курс экспериментальной дрессировки у группы студентов одного из колледжей в Нью-Йорке. Мы играли в обучающую игру в классе, а основное ядро, состоящее из полдюжины наделенных дьявольским воображением девиц, начали играть в обучающую игру дома междусобой, работая обычно парами и формируя экзотические формы поведения, такие, как подниматься по лестнице задом наперед. В колледже их научили, с моей точки зрения, успешно, аналитическому мышлению, и они все очень тщательно продумывали как до, так и после каждого эксперимента по формированию (поведения) и энергично взялись за формирование поведения со смаком, присущим шестнадцатилетним. Они тут же принялись дрессировать родителей, применять положительное подкрепление для учителей и превращать неприятные сборища в веселые компании, избирательно подкрепляя желательное поведение. Ни до, ни после я никогда не встречала группу, с такой быстротой усвоившую как саму технику, так и ее возможности. Ускорение процесса формирования: введение мишеней, подражание, моделирование Профессиональные дрессировщики используют ряд приемов, чтобы ускорить процесс формирования. Три из них, которые вам могут быть полезны, это введение мишеней, подражание и моделирование. При введении мишеней, которые часто используются - при дрессировке морских львов и других животных, участвующих в представлениях, вы обучаете животное толкать носом мишень -- скажем, кнопку на конце шеста или просто руку дрессировщика, сжатую в кулак. Затем, перемещая мишень и заставляя животное просто следовать за ней и толкать ее, вы можете получить все виды поведения, даже такие, как подъем на лестницу, прыжки или вертикальные стойки, следование за дрессировщиком, вход и выход из транспортировочной клетки и т.д. По сути дела мы используем мишень, когда хлопаем себя по бедру, подзывая собаку. Это движение, видимо, привлекает собак, а когда они приближаются, мы подкрепляем это поведение лаской. Похлопывание рукой по сидению, при приглашении кого-либо сесть рядом, тоже один из видов мишени. Группы японских туристов не теряют друг друга в толпе гораздо более высокорослых людей, следуя за флагом, который держит над толпой их гид -- снова мишень. Использование для этих целей штандартов и знамен в битвах является традиционным. Подражание в природе свойственно некоторым животным и птицам, а также людям. Молодые особи всех видов учатся большинству из того, что они должны знать, наблюдая, а затем копируя поведение старших. В то время как психологи часто считают "обучение при помощи наблюдения" признаком разумности животного -- у приматов оно хорошо выражено, у некоторых других животных плохо, -- я думаю, что наличие или отсутствие этой способности у того или иного вида зависит от его экологии, т.е. ее роли в естественных условиях жизни, а не разума как такового. У некоторых птиц способность подражать поведению выражена чрезвычайно сильно. В Англии синицы выучились открывать оставляемые у дверей молочные бутылки, доставать из них сливки, этот навык с помощью подражания с такой быстротой распространился, что крышки молочных бутылок пришлось переделывать. Собаки мало способны к обучению при наблюдении; когда они делают то же, что и другие собаки, то обычно это потому, что отвечают на одни и те же стимулы, а не потому, что подражают. С другой стороны, кошки, которые, согласно мнению зоопсихологов, имеют более низкий уровень умственных способностей, прекрасные подражатели. Выражение "сорусаt" неслучайно. Если вы обучаете какому-либо трюку -- скажем, звонить в колокольчик, чтобы пустили в дом, одну из кошек в доме, то и другие кошки вполне могут этому научиться без вашего обучения. Кошки могут даже подражать другим видам. Однажды вечером моя дочь в течение часа обучала своего пуделя сидеть на детском кресле-качалке и раскачиваться, используя в качестве подкрепления мелко нарезанную ветчину. Одна из кошек за этим наблюдала. Когда урок окончился, кошка по собственному почину вскочила на кресло и стала его раскачивать по всем правилам, поглядывая на нас в ожидании своей доли ветчины, которая конечно же была честно заработана. Я думаю, что эта сильно выраженная тенденция к подражанию объясняет, почему кошки не могут спускаться с деревьев. Лазанье вверх происходит более или менее автоматически: оно, как говорят биологи, является поведением с "жесткими связями". Когти при этом выпускаются, и кошка взбегает по дереву. Однако, чтобы спуститься вниз, кошке следует двигаться хвостом вперед, при этом загнутые вниз - когти тоже могут сослужить службу, но это, вероятно, навык, требующий обучения, или поведение с "гибкими связями" Я могу утверждать, потому что мне лично (посреди ночи, стоя на верхушке приставной лестницы) пришлось обучать кошку спускаться с дерева хвостом вперед. Я сделала это, чтобы в будущем избавить себя от горестных воплей застрявшей на дереве кошки, и действительно сформированное поведение сохранилось -- она никогда больше не застревала на деревьях (хотя продолжала на них взбираться). Я думаю, что в природе кошки учатся тому, как поворачиваться и спускаться хвостом вперед, от своих матерей, лазая вместе с ними по деревьям, но поскольку мы их отнимаем от матерей в таком нежном возрасте -- шесть-восемь недель, -- эта возможность обучения через копирование утрачивается. Дельфины обладают выраженной тенденцией подражать друг другу, что облегчает процесс дрессировки. Чтобы получить выполнение одного и того же действия несколькими дельфинами, вы можете сформировать поведение у одного из них, а затем давать подкрепление другим за каждую попытку подражать. В неволе детеныши дельфинов часто разучивают трюки взрослых задолго до того как сами дорастут до подкрепления рыбой, и во многих океанариумах накопился опыт обучения "дублеров" -- животных, непосредственно не задействованных, но наблюдающих за другими, участвующими в представлении. Было доказано, что они выучивали типы поведения, требуемые для представления, даже не получая за их выполнение подкрепления. Очевидно, для диких дельфинов возможность подражать своим сородичам-дельфинам должна быть важна для выживания. Мы можем и должны использовать подражание, когда для этого представляется возможность, при обучении людей физическим навыкам -- танцам, катанию на лыжах, теннису и т.д. Человеку, показывающему действия, лучше стоять рядом или спиной к обучаемым, так, чтобы они могли следовать за его движениями, не выполняя каких-либо умственных преобразований. Чем меньше требуется разъяснений и чем меньше используется словесных описаний, тем лучше пойдет подражание. В некоторых случаях, если вы хотите обучить навыку, выполняемому правой рукой (скажем, вязанию) левшу, вы должны сесть к нему или к ней лицом и таким способом добиться, чтобы, подражая вам, обучающийся выполнял движения, являющиеся зеркальным отражением ваших. Конечно, большая часть сформированного поведения наших детей обязана своим происхождением подражанию. Они видели, что и как мы делаем, то и делают сами, как в хорошем, так и в плохом. Не так давно утром на почте трое маленьких детей устроили такую свалку, что с трудом можно было слышать что-либо кроме этого шума. Их мать, стоявшая в очереди, несколько раз громко кричала, прежде чем ей удалось усмирить их и призвать к тишине. "А как бы вы заставили детей вести себя тихо?" -- спросила она работницу почты. "Постарайтесь сами говорить тише", -- справедливо ответила почтальон. Обозреватель Юдифь Мартин ("Мисс Манеры") считает, что когда обучаешь хорошим манерам детей, то в течение всего периода обучения -- "от рождения до свадьбы" -- все в доме должны есть аккуратно, разговаривать вежливо и по крайней мере проявлять хотя бы видимость интереса к делам и словам других. Третий прием ускорения формирования -- моделирование -- (лепка) состоит в том, чтобы заставить обучающегося выполнять пассивно (двигать им как марионеткой) действие, которое должно быть разучено. Игроки в гольф проделывают это, когда обхватывают рукой новичка сзади, берутся за клюшку и делают клюшкой, находящейся в руке обучаемого, нужный замах. Некоторые из исследователей, которые обучали обезьян знаковому языку, применяли моделирование очень широко. Обучающий держит руки молодого шимпанзе и кладет их нужным образом или делает нужное движение; в конце концов обезьяна запоминает их и будет выполнять спонтанно. Моделирование составляло секрет "живых статуй" -- циркового представления, очень популярного на грани нынешнего и прошлого веков, в которой люди и лошади принимали позы знаменитых произведений живописи и скульптуры, -- на публику производила впечатление эта неподвижность. Когда загорался свет, возникали картины типа войск Наполеона при Ватерлоо, застывшие в своем движении, причем не только люди, но и лошади с шеями, изогнутыми дугой, с передними ногами, поднятыми в воздух, как будто окаменевшие. Мне говорили, что это достигалось с помощью массирования лошадей в течение нескольких часов, пока они совершенно не расслаблялись, и тогда, как глине, им придавали нужные позы, подкрепляя удержание этих поз.
|
|