Лекции по зоопсихологии. Часть 1 — Теория оперантного научения Ф.Скиннера

Теория оперантного научения Ф.Скиннера

Американский психолог Скиннер создал экспериментальное устройство, которое известно как “ящик Скиннера”. Отличительной особенностью этого ящика было то, что животное, помещенное в него, не воспринимало предмета удовлетворения свой потребности. Например, голодная крыса (излюбленный объект бихевиористов) не видела пищи. Другими словами, эта ситуация, в какой-то мере, моделировала естественные условия поиска корма. Внутри ящика находилось устройство, благодаря воздействию на которое, например, крыса могла получить кусочек пищи, автоматически подававшийся в особую кормушку, встроенную в одну из стенок клетки. Поведение крысы в такой экспериментальной ситуации было практически таким же, как у кошки в проблемной клетке Э.Торндайка. После серии случайных успехов голодное животное научалось сразу же нажимать на педаль, как только его помещали в эту ситуацию. Решающее движение (нажатие на педаль) Скиннер назвал операцией. На основании этих экспериментов ученый создал известную теорию оперантного научения, которая оказала очень большое влияние на психологию ХХ века. Можно выделить следующие положения этой теории.

Первое положение. Оперантное научение — это такое научение, которое происходит на основе подкрепления реакций, относящихся к типу оперантов.

Скиннер выделил в репертуаре животных и человека два типа движений — респонденты и операнты. Респондентами он назвал реакции, которые сразу же вызываются самыми обычными раздражителями. К ним можно отнести, например, коленный рефлекс в ответ на удар по чашечке, рефлекс слюноотделения на появление пищи во рту и т.д. Подобного рода движения лежат в основе реактивного поведения, то есть, поведения, совершаемого в ответ на определенный стимул. Оперантами Скиннер назвал такие реакции животных организмов, которые не связаны жестко с каким-либо раздражителем. Но эти движения могут связаться с определенным стимулом после периода научения. Например, нажатие крысой на педаль относится к оперантам, так как до научения эта реакция не проявлялась при виде педали. После научения восприятие животным этого стимула приводит к появлению соответствующего движения. Таким образом, под оперантным поведением надо понимать спонтанные действия животного в ответ на незнакомую (проблемную) ситуацию. Скиннер предположил, что на основе реакций типа респондентов вырабатываются классические условные рефлексы, а на основе оперантов — инструментальные рефлексы.

Отличия между инструментальным и условно-рефлекторным научением.

Между условными и инструментальными рефлексами существуют и другие существенные различия, благодаря которым их выделяют в особые группы научения. Можно выделить следующие важные отличия. Условный рефлекс вырабатывается путем образования ассоциации между специфическим стимулом (безусловным раздражителем) и индифферентным (нейтральным), а инструментальный рефлекс — путем образования ассоциации между определенным поведением и его последствиями. То есть, в инструментальном рефлексе связаны реакция животного и подкрепляющий стимул, а в условном рефлексе — два стимула, условный и безусловный. Животное при выработке условного рефлекса, как было уже сказано, выступает в качестве достаточно пассивного участника событий, а при инструментальном научении оно находится в состоянии целенаправленной деятельности. Другими словами, животное в обоих случаях отличается по степени активности. Имеются также отличия в угасании. Инструментальные рефлексы не угасают, если во время их выработки подкрепление в ряде случаев не дается; классические рефлексы такой стойкости не обнаруживают. Если одни исследователи акцентировали внимание на различии этих двух форм научения, то другие утверждали, что эти различия незначительны по сравнению с их общими особенностями. В обоих случаях происходит выработка условной реакции в результате специфической ассоциации, и в обоих случаях эта реакция угасает при отсутствии подкрепления. Более того, существует мнение, что инструментальные и условные рефлексы — это не разные виды научения, а разные аспекты одного и того же процесса приобретения опыта, который только и встречается в естественных условиях. Даже в лаборатории при выработке реакции одного типа трудно создать условия, которые исключали бы возможность выработки реакций другого типа. Так, например, образование слюноотделительного условного рефлекса на звук может сопровождаться определенными двигательными реакциями (собака навостряет уши, поворачивается к источнику звука, начинает облизываться). Такая двигательная активность в ответ на звук может стать условной инструментальной реакцией. С субъективной точки зрения собака может “думать”, что именно совершение этих движений приводит к появлению пищи. Если она не будет их делать в ответ на появление звука, то она и не получит корма. В данном случае в результате научения образуется такая цепочка событий. Условный стимул (звук) приводит к появлению инструментального рефлекса (набор двигательных реакций, связанных с ожиданием пищи), вслед за этим безусловный стимул (пища) приводит к появлению условной реакции (слюноотделения). Идея о том, что инструментальный и условный рефлекс составляют нечто целое при ассоциативном научении, подтверждается тем фактом, что, если при выработке условного рефлекса реакции скелетных мышц отсутствуют (например, искусственно заблокированы), то выработка этого рефлекса сильно затрудняется. Другими словами, разделение рефлексов на условные и инструментальные является искусственным (правда, удобным для научного анализа), а в природе они составляют единый механизм ассоциативного приспособления к изменениям во внешней среде. То есть, это детали единого механизма, который при изъятии одной из составляющих начинает работать не эффективно или вообще прекращает функционировать. Правда, можно сделать предположение, что этот механизм у низкоорганизованных и малоактивных животных обладает в большей степени условно-рефлекторной природой, чем у высокоорганизованных. “Инструментальная надстройка”, вероятно, появилась в эволюции позже. Показано, что способность к выработке инструментальных рефлексов в ряду беспозвоночных животных появляется у кольчатых червей, а у позвоночных — у костистых рыб. Тогда как, классические условные рефлексы могут вырабатывать уже плоские черви и низшие позвоночные.

Второе положение. Любое научение возможно только при наличии подкрепления.

Скиннер определил подкрепление, исходя из закона эффекта Э.Торндайка. Но, как истинный представитель бихевиоризма, он убрал из него субъективное понятие, связанное с состоянием удовлетворения. Под подкреплением Скиннер понимал любое событие, которое, сочетаясь с каким-либо видом поведения, будет делать его более частым. Например, для голодной крысы в скиннеровском ящике подкреплением будет подача пищи. При этом не важно, что субъективно испытывает в этот момент животное. В качестве подкрепления могут выступать не только биологические, но и социальные факторы, например, признание общества, похвала, слава и т.д.

Как будет показано дальше, подкрепление не является обязательным условием любого научения. Например, этот компонент отсутствует в латентном научении, а также в импринтинге. В этом отношении крайняя позиция в понимании Скиннером роли подкрепления является ошибочной.

Третье положение. Подкреплением можно создать любое поведение.

Скиннер, опираясь на это положение своей теории, разработал способ формирования поведения путем последовательных приближений, который эффективно используется в дрессировке животных. Этот способ состоит в том, что весь путь от исходного поведения до конечной реакции, который исследователь стремится выработать у животного, разбивается на несколько этапов. После этого нужно последовательно и систематически подкреплять каждый из этих этапов, постепенно приближаясь к нужной форме поведения. Например, посмотрим, как с помощью этого способа можно научить голубя клевать маленький кружок на стенке ящика Скиннера. Сначала голубю дают зернышко только тогда, когда он заходит в ту половину клетки, где находится кружок. Далее его начинают вознаграждать в том случае, если он не только зайдет в нужную половину, но и повернет голову по направлению к кружку. На третьем этапе ему дают корм тогда, когда он не только совершает действия, выученные на первых двух этапах, но и прикасается к кружку на стенке ящика. Таким образом, при таком методе обучения к очередному этапу переходят лишь тогда, когда уже сформировалась поведенческая реакция, необходимая на предыдущем этапе. Скиннер, считал, что таким способом можно сформировать любое поведение. Он научал голубя описывать круги по ящику, ложиться на спину, становится обеими лапками на развернутое крыло или повисать в воздухе на высоте 5 см и т.д. Более того, он научал голубей разным играм. Так он описывает, как “голубя тренировали пускать деревянный шар по миниатюрному желобу в направлении расставленных игрушечных кеглей, толкая его резким боковым движением клюва. Результат поразил нас… Это зрелище произвело такое впечатление на Бреленда, что он отказался от многообещающей карьеры в области психологии и стал платным дрессировщиком”.

Это положение теории Скиннера также оказалось далеким от действительности. В дальнейшем было установлено, что животных можно научить не всему. Способность к научению у разных видов животных строго соответствует экологическим ограничениям, типичным для образа жизни данного вида. Так некоторые виды ассоциаций создаются у одних видов животных легче, чем у других. Например, крысы лучше ассоциируют звуки, запахи и тактильные ощущения, птицы же исследуют мир, пользуясь глазами и клювом. Другими словами, животное можно научить только тому, на что оно в принципе способно. Все формы поведения, которые не совпадают с биологической природой организма, очень трудно поддаются дрессировке или вообще не вырабатываются. Так примата никогда не научить говорить человеческим языком по той простой причине, что их голосовой аппарат не способен к воспроизведению членораздельных звуков. Более подробно влияние биологических факторов на научение будет рассмотрено ниже.

Четвертое положение. Поведение животного всецело зависит от внешней среды, от системы внешних подкрепляющих факторов.

В одной из своих философских работ, которая называется “По ту сторону свободы и достоинства”, Скиннер выдвинул положение о том, что свобода — это иллюзия. Человек, как и животное, полностью зависит от окружающей среды, влияющей на его поведение через совокупность подкрепляющих факторов. Человек думает, что он свободен в выборе своего поведения, что он сам решает свою судьбу. Но, на самом деле, в этом отношении он похож на крысу в ящике Скиннера. Крыса тоже думает, что она самостоятельно добивается пищи, что она свободна в своем выборе поведения. На самом деле она делает только то, чего хочет от нее экспериментатор (внешняя среда для человека), который может подкреплять или не подкреплять ту или иную реакцию. Также человеческое общество подкрепляет одни, выгодные для него, формы поведения индивида и не подкрепляет другие, которые могут это общество разрушить. То есть, наше поведение такое, каким хочет его видеть внешний мир, тот социум, в котором живет человек. Скиннер говорил, что путем разумного подкрепления можно создать гармоничных и оптимально развитых для общества людей. Он даже попытался создать особые “коммуны”, в которых, так называемые, “планификаторы” путем системы подкрепления отбирали и культивировали только те формы поведения подопытных людей, которые, с точки зрения Скиннера, обеспечивают выживание и развитие человеческого общества. В конце концов, эти коммуны распались, чем развеяли философские следствия скиннеровской теории научения. Есть в человеке нечто, что заставляет идти его за свои идеи на костер, создавать шедевры музыки, архитектуры… Ведь, наверное, не только ради хлеба создавал Бетховен свои гениальные произведения. Вероятно, у него была какая-то внутренняя страсть, стремление выразить себя через божественные звуки музыкальной гармонии. Что это? Неужели только общество заставляло его так поступать, доводя до само истощения?

Вы здесь: Главная Психология Подбор лекций по психологии Лекции по зоопсихологии. Часть 1