Оперантное научение. Бихевиоризм Скиннера: определение теории оперантного обусловливания и основы поведенческой психологии Кто создал концепцию оперантного научения

17.03.2024 | Химия

Продолжает и развивает идеи Уотсона Беррес Ф. Скиннер (1904-1990), который разработал теорию оперантного научения. Он является лидером современной формы бихевиоризма (или необихевиоризма).

Скиннер считал теории психоаналитические умозрительными, т.е. основанными на предположении. Они предполагают существование интрапсихических факторов (влечения, бессознательное), которые нельзя эмпирически проверить. Скиннер считал, что поведение человека надо изучать с позиции того, что его формируют обстоятельства окружения (окружающая среда и люди). Все действия человека и его поведение объясняются влиянием окружения.

Скиннер утверждал, что человеческий организм - это «черный ящик». Его содержимое (эмоции, мотивы, интрапсихические конфликты, влечения) нельзя объективно измерить, поэтому их следует исключить из сферы эмпирического наблюдения.

Поведение человека можно и нужно надежно и объективно измерить. И таким образом теория Скиннера из разряда умозрительных переходит в разряд эмпирических (научно-обоснованных). Он ставил науку о поведении в разряд естественных наук, т.е. наук: основанных на фактах (1) и цель которых предсказать и проконтролировать изучаемое явление (2).

Скиннер предложил в качестве метода исследования поведения - функциональный анализ поведения. Он указывал, что поведение лучше всего изучать, обращаясь к тому, как оно соотносится с предшествующими событиями. Он полагает, что поведение можно изучить и контролировать посредством манипулирования средой, в которую включен организм. При этом нет необходимости рассматривать механизмы, действующие внутри организма.

Так, функциональный анализ дает возможность установить точные и обусловленные взаимоотношения между открытым поведением (реакцией) и условиями окружающей среды (стимулами), которые контролируют поведение. Функциональный анализ дает возможность установить причинно-следственные отношения между поведением и окружающей средой. Манипулируя переменными окружающей среды (независимыми переменными - теми, которыми манипулирует экспериментатор), можно предсказывать и измерять поведение человека (зависимую переменную - ту, которая изменяется в результате манипуляции).

Скиннер не принял идею о личности или самости, которая направляет или стимулирует поведение. Он считает, что необходимо отказаться от мысли, что поведение порождается силами, находящимися внутри индивида (чертами, потребностями, мыслями, чувствами), в пользу более научных представлений о силах, лежащих вне человека. Он полагает, что поведение человека регулируется не изнутри, а снаружи - окружающей средой. Изучение личности по Скиннеру -это нахождение своеобразного характера взаимоотношений между поведением организма и результатами этого поведения, которые и подкрепляют его в последствии. Этот подход фокусируется на прогнозировании и контроле наблюдаемого поведения.

Как и Уотсон Скиннер огромное внимание уделял научению, но в отличие от Уотсона главным его интересом было не классическое, а так называемое оперантное научение. При классическом научении организм ассоциирует разные стимулы, при оперантном научении организм ассоциирует свое поведение с последующим результатом. Оперантное научение подчиняется закону эффекта, который был открыт американским психологом Эдвардом Торндаком в конце 19 века. В своих опытах Торндайк использовал так называемые проблемные клетки, в которые он помещал голодных кошек. Что бы выйти из такой проблемной клетки кошке нужно было потянуть за веревку или приподнять крючок. Наблюдая за животными, Торндайк заметил, что, помещенная в проблемную клетку кошка беспорядочно металась по клетке и, в конце концов, случайно задевала веревку или крючок. Однако с каждой следующей попыткой активность животных все больше сосредоточивались вокруг веревки или крючка и после многократных проб кошка научалась выходить из клетки. Такое научение также называется научением методом проб и ошибок. Это научение подчиняется закону эффекта, согласно которому если поведение приводит к желаемому результату (вознаграждается), вероятность его повторения увеличивается.

Для своего подхода к пониманию личности в свою теорию Скиннер добавляет положения о двух видах поведения: респондентное и оперантное поведение.

Респондентное поведение - подразумевает реакцию, вызываемую стимулом. Стимул всегда предшествует реакции.

Выделяют два вида респондентного поведения:

условно рефлекторное
безусловно рефлекторное.

Введение

Актуальность темы исследования. В начале 21 века психология бихевиоризма получает все более и более широкое распространение в России. Ситуация перехода от советской системы к западному пути развития вызвала у большинства людей огромные социальные и идеологические потрясения, связанные с лишением чувства принадлежности к могучему государству, потерей консолидирующей и возвышающей общественной идеи, девальвацией нравственных ценностей и т. д.

Круг внимания бихевиоризма как раз и составляет проблематика человека, поставленного перед необходимостью самостоятельно, в смятении и сомнениях, определять свою идентичность и ценности, ради которых он живет. Развитие собственной индивидуальности становится одновременно и задачей, и способом справиться с новой социальной реальностью.

Общая ситуация в психологии, характеризующаяся движением от естественнонаучной парадигмы к гуманитарной, от объясняющего подхода к понимающему, от изучения человека, как изолированного объекта к рассмотрению неразрывной связи человека и мира также способствует развитию и распространению бихевиоризма и стремлению к активному обмену идеями с ней со стороны других психологических направлений.

Цель данной работы заключается в обосновании вопроса об особенностях бихевиористической концепции научения.

Бихевиористическая концепция научения

Теория оперантного обусловливания Б. Скиннера

В переводе с английского бихевиоризм означает «поведение». Именно оно стало центральным предметом внимания этого направления.

Бихевиоризм признавал наличие сложного поведения, которое объяснял комбинациями цепочек стимулов и реакций. Собственно их изучение также входило в главные задачи течения.

Научение (обучение,учение) - процесс приобретения субъектом новых способов осуществления поведения и деятельности, их фиксации и/или модификации. Столяренко Л.Д. Основы психологии. - Ростов-на-Дону: Феникс,2006. - С. 68-72. Изменение психологических структур, которое происходит в результате этого процесса, обеспечивает возможность дальнейшего совершенствования деятельности.

Впервые закономерности научения, установленные экспериментальными методами, были установлены в рамках бихевиоризма. Теория, разработанная Б.Ф. Скиннером(1904-1990),носит название теории оперантого обусловливания.

Скиннер ставил перед собой цель объяснить механизмы научения у человека и животных (крыс и голубей) на основе ограниченного набора базовых принципов. Основная идея состояла в том, чтобы управлять средой, контролировать ее, получая при этом упорядоченные изменения. Он говорил: « Проконтролируйте условия, среду, и вам откроется порядок» Скиннер Б. Оперантное поведение //История зарубежной психологии:Тексты.М: АсТ,2006.С.60-82 4.

Процедура обучения получила название - «оперантное обусловливание».

Она заключалась в стремлении экспериментатора установить связь между стимулом (S) и реакцией (R) посредством подкрепления - поощрения или наказания. В схеме стимул-реакции (S-R) ключевой для Скиннера была именно реакция. Реакции рассматривались с точки зрения простоты-сложности. Простая -слюноотделение, отдергивание руки; сложная - решение математической задачи, агрессивное поведение.

Оперантное обусловливание - это процесс, посредством которого характеристики реакции детерминируются последствиями этой реакции. Осуществление оперантного поведения заложено в биологической природе организма. Научение рассматривалось Скиннером как процесс.

Подкрепление является одним из принципом обусловливания. Уже с младенческого возраста, Согласно Скиннеру, поведение людей можно регулировать с помощью подкрепляющих стимулов Скиннер Б. Оперантное поведение// История зарубежной психологии:Тексты.М.АсТ,2006. С,60-82 5. Существуют два разных вида подкрепления. Некоторые,например, еда или устранение боли, называются первичными подкреплениями, т.к. они обладают естественной подкрепляющей силой. Другие подкрепляющие стимулы (улыбка, внимание взрослого,одобрение,похвала) являются обусловленными подкрелениями. Они становятся таковыми в результате частого сочетания с первичными подкреплениями.

Оперантное обусловливание опирается в основном на положительное подкрепление, т.е. на такие последствия реакций, которые их поддерживают или усиливают,например,пища, денежное вознаграждение,похвала. Тем не менее, Скиннер подчеркивает важность негативного подкрепления,которое приводит к угасанию реакции. Такими подкрепляющими стимулами могут быть физическое наказание, моральное воздействие,психологическое давление.

Кроме подкрепления, принципом обусловливания является его незамедлительность. Было обнаружено, что в начальной стадии эксперимента можно довести реакцию до наивысшего уровня только в том случае,если подкреплять ее немедленно. Иначе, реакция, начавшая было формироваться, быстро угаснет.

При оперантном, также как и при респондентном обусловливании, наблюдается генерализация стимулов. Генерализация - это возникшая в процессе обусловливания ассоциативная связь реакции со стимулами, похожая на первоначальную выработку условного рефлекса. Примерами генерализации являются - страх перед всеми собаками, который сформировался вследствие нападения какой- то одной собаки, положительная реакция ребенка (улыбка, произнесение слов « папа» при контакте с мужчинами похожих на его отца, движение на встречу и проч.)

Формирование реакции представляет собой очень сложный процесс. Реакция не возникает сразу и вдруг, она оформляется постепенно, по мере осуществления ряда подкреплений. Последовательное подкрепление - это выработка сложных действий с помощью подкрепления действий, которые постепенно все больше становятся похожими на ту окончательную форму поведения, которую предполагалось сформировать. Сплошное поведение формируется в процессе подкрепления отдельных элементов поведения, которые в совокупности складываются в сложные действия.

Были выделены такие режимы подкрепления: непрерывное подкрепление - предъявление подкрепления каждый раз, когда субъект дает желаемую реакцию; прерывистое или частичное подкрепление. Для более строгой классификации режимов подкрепления было выделено два параметра - временное подкрепление и пропорциональное подкрепление. В первом случае подкрепляют только тогда, когда истек срок, в течение которого необходимо выполнить соответствующую деятельность, во втором: подкрепляют за объем той работы (количества действий), которая должна быть произведена.

На основе двух параметров были описаны четыре режима подкрепления: Уотстон Дж. Поведение как предмет психологии (бихевиоризм и необихевиоризм)// хрестоматия по истории психологии / Под ред. П.Я.Гальперина, А. Н. Ждан.- М.:Изд-во МГУ,1980.-С.34-44. 6

Режим подкрепления с постоянным соотношением. Подкрепление осуществляется в соответствии с установленным объемом реакций. Примером такого режима может быть оплата труда за определенный, постоянный объем работ.

Режим подкрепления с постоянным интервалом. Подкрепление производится только тогда, когда твердо установленный, фиксированный временной интервал истек. Например, ежемесячная, понедельная, почасовая оплата, отдых после жестко установленного времени физической или умственной работы.

Режим подкрепления с вариативным соотношением. В этом режиме организм подкрепляется на основе какого - то в среднем предопределенного числа реакций.

Режим подкрепления с вариативным интервалом. Индивид получает подкрепление после того, как проходит неопределенный интервал.

Скиннер говорил об индивидуальности подкреплений, о вариативности развития того или иного навыка у разных людей, а также у разных животных. Более того само подкрепление носит уникальный характер, т.к. уверенно нельзя сказать, что у данного человека или животного оно может выступать в качестве подкрепления.

По мере того, как ребенок развивается, его реакции усваиваются и остаются под контролем подкрепляющих воздействий со стороны окружающей среды. В виде подкрепляющих воздействий выступают - пища, похвала, эмоциональная поддержка и др. он считает, что овладение речью происходит по общим законам оперантного обусловливания. Ребенок получает подкрепление при произнесении определенных звуков. Подкреплением служит не пища и вода, а одобрение и поддержка взрослых.

С точки зрения психологии научения нет необходимости искать объяснение симптомов болезни в скрытых глубинных причинах. Патология, согласно бихевиоризму, не недуг, а либо (1) результат неусвоенной реакции, либо (2) усвоенная неадаптивная реакция.

Изменение поведения также построено на принципах оперантного обусловливания, на системе модификации поведения и сопряженных с ним подкреплений.

Изменения поведения может происходить вследствие самоконтроля. Самоконтроль включает в себя две взаимозависимые реакции: Уфимцева О.В. Бихевиоризм. - М.:Наука,2008. С.178 7

Контролирующая реакция, которая воздействует на среду, изменяя вероятность возникновения вторичных реакций(«уход» чтобы не выразить «гнев»; удаление пищи, чтобы отвыкнуть от переедания).

Контролирующая реакция, направленная на наличие в ситуации стимулов, которые могут сделать желательное поведение более вероятным (наличие стола для осуществления учебного процесса).

Изменение поведения может происходить и вследствие осуществления поведенческого консультирования. Во многом этот тип консультирования базируется на принципах научения.

Достоинства:

Стремление к строгой проверке гипотез, эксперименту, контролю дополнительных переменных.

Признание роли ситуативных переменных, параметров среды и их систематическое изучение.

Прагматический подход к терапии, позволил создать важные процедуры для изменения поведения.

Недостатки:

Редукционизм - сведение принципов поведения, полученных на животных к анализу поведения человека.

Низкая внешняя валидность вызвана поведением экспериментов в лабораторных условиях, результаты которых трудно перенести в естественные условия.

Игнорирование когнитивных процессов при анализе S-R связей.

Большой разрыв между теорией и практикой.

Поведенческая теория не дает стабильных результатов.

Психологические понятия - научение, обучение, учение описывают широкий круг явлений, связанных с приобретением опыта, знаний, навыков, умений в процессе активного взаимоотношения субъекта с предметным и социальным миром - в поведении, деятельности, общении.

Когда речь идет о научении, то исследователь имеет в виду такие аспекты этого процесса как:

Постепенность изменения;

Роль упражнения;

Специфику научения по сравнению с врожденными особенностями индивида.

Обычно термины обучение и учение обозначают процесс приобретения индивидуального опыта, а термин "научение" описывает и сам процесс, и его результат.
Итак, научение (обучение, учение) - процесс приобретения субъектом новых способов осуществления поведения и деятельности, их фиксации и/или модификации. Изменение психологических структур, которое происходит в результате этого процесса, обеспечивает возможность дальнейшего совершенствования деятельности.
Известны классические концепции научения. Это, например, учение И.П. Павлова (1849-1936) об образовании условных рефлексов. В результате одного или нескольких предъявлений индифферентного разграничителя (условного стимула) и следующего за ним безусловного стимула (пищи), который вызывает безусловную, врожденную реакцию (слюноотделение), индифферентный раздражитель сам начинает вызывать реакцию. В процессе установления временной связи безусловный стимул выполняет функцию подкрепления, условный - сигнальное значение, а рефлекс способствует адаптации организма к меняющимся условиям среды.
Впервые закономерности научения, установленные экспериментальными методами, были установлены в рамках бихевиоризма. Эти закономерности, или "законы обучения", сформулированы Э. Торндайком и дополнены, а также модифицированы К. Халлом, Э. Толменом и Э. Газри.

Ими являются:

Закон готовности: чем сильнее потребность, тем успешнее научение. Закон выводится на основе установления связи между потребностью и научением.

Закон эффекта: поведение, которое приводит к полезному действию, вызывает снижение потребности и поэтому будет повторяться.

Закон упражнения: при прочих равных условиях повторение определенного действия облегчает совершение поведения и приводит к более быстрому выполнению и снижению вероятности ошибок. Позже Торндайк показал, что не всегда упражнение, повторение способствует упрощению навыка, хотя при моторном научении это фактор является очень важным, способствуя модификации поведения.

Закон недавности: лучше заучивается тот материал, который предъявляется в конце серии. Этот закон противоречит эффекту первичности - тенденции к лучшему заучиванию материала, который предъявляется в начале процесса научения. Противоречие устраняется при формулировке закона "эффект края". U-образная зависимость степени заученности материала от его места в процессе научения отражает этот эффект и называется "позиционной кривой".

Закон соответствия: существует пропорциональное отношение между вероятностью ответа и вероятностью подкрепления.

Теперь обратимся к теориям научения в психологии личности.
Теории исходят из двух положений:

1. Всякое поведение усваивается в процессе научения.

2. В целях соблюдения научной строгости при проверке гипотез необходимо соблюдать принцип объективности данных. В качестве переменных, которыми можно манипулировать, выбираются внешние причины (пищевое вознаграждение), в отличие от "внутренних" переменных в психодинамическом направлении (инстинкты, защитные механизмы, Я-концепция), которыми манипулировать нельзя.

В теориях научения (И.П. Павлов) приспособление рассматривается как аналог развития человека. Оно может осуществляется разными путями, например посредством классического обусловливания по Павлову.

При этом были исследованы важные феномены:

Генерализация - условная реакция на первоначально нейтральный стимул распространяется и на другие стимулы, похожие на условный раздражитель (страх, возникший на конкретную собаку, затем распространяется на всех собак).

Дифференцировка - специфичная реакция на похожие стимулы, которые различаются по степени подкрепления (например, дифференцировка реакций на круг и эллипс).

Угашение - разрушение связи между условным стимулом и реакцией, если он не сопровождается подкреплением.

Типичный эксперимент заключался в том, что собаку закрепляли ремнями, ограничивая ее движение, затем включали свет. Через 30 секунд, после того как зажигался свет, в рот собаки клали немного пищи, что вызывало слюноотделение. Сочетание включения света и пищи повторяли несколько раз. Через какое-то время свет, изначально выступавший индифферентным раздражителем, сам по себе начинал вызывать реакцию слюноотделения.
Аналогичным образом можно выработать условные оборонительные реакции на первоначально нейтральные стимулы. В первых исследованиях по оборонительному обусловливанию на собаку надевали специальную упряжь, чтобы удерживать ее в станке, а к лапе прикрепляли электроды. Подача электрического тока (безусловный раздражитель) на лапу вызывала отдергивание лапы (безусловный рефлекс), которое было рефлекторной реакцией животного. Если непосредственно перед ударом током несколько раз звонил звонок, то постепенно звук сам по себе был способен вызывать оборонительный рефлекс отдергивания лапы.
По терминологии И.П. Павлова, пища (или удар током) были безусловными раздражителями, а свет (или звук) - условным. Слюноотделение (или отдергивание лапы) при появлении пищи (или ударе током) были названо безусловным рефлексом, а слюноотделение на включение света (или отдергивание лапы на звук) - условным. Реакции, которые изучал Павлов, стали называть ответными, или респондентными, поскольку они автоматически возникали вслед за известными стимулами (пищей, ударом тока). Ведущим в модели И.П. Павлова является стимул, манипуляция которым приводит к возникновению новых форм поведения.
Итак, классическое обусловливание - это процесс, открытый И.П. Павловым, благодаря которому первоначально нейтральный стимул начинает вызывать реакцию из-за своей ассоциативной связи со стимулом, автоматически порождающим ту же самую или похожую реакцию.
Теория, разработанная Б.Ф. Скиннером (1904-1990), носит название теории оперантного обусловливания. Он говорил, что ученый, как и всякий другой организм, является продуктом уникальной истории. Поприще, которое он выберет для себя в качестве предпочтительного, частично будет зависеть от его личной биографии.
Интерес к формированию и модификации поведения возник у Скиннера после знакомства с работой И.П. Павлова "Условные рефлексы" и статьей (критической по своей направленности) Бертрана Рассела. Статьи последнего не только не оттолкнули от павловских идей, но, наоборот, усилили их влияние.
Скиннер ставил перед собой цель объяснить механизмы научения у человека и животных (крыс и голубей) на основе ограниченного набора базовых принципов. Основная идея состояла в том, чтобы управлять средой, контролировать ее, получая при этом упорядоченные изменения. Он говорил: "Проконтролируйте условия (среду), и вам откроется порядок".

Определение оперантного обусловливания

Процедура обучения получила название - "оперантное обусловливание". Она заключалась в стремлении экспериментатора установить связь между стимулом (S) и реакцией (R) посредством подкрепления - поощрения или наказания. В схеме стимул-реакция (S-R) ключевой для Скиннера была именно реакция. Реакции рассматривались с точки зрения простоты-сложности. Простая - слюноотделение, отдергивание руки; сложная - решение математической задачи, агрессивное поведение.
Оперантное обусловливание - это процесс, посредством которого характеристики реакции детерминируются последствиями этой реакции.
Далее, Скиннер различал (1) реакции, которые вызываются определенными стимулами (отдергивание руки от горячего предмета) - в этом случае связь стимула и реакции безусловна; и (2) реакции, которые непосредственно не связаны со стимулом. Последние реакции продуцируются самим организмом и называются оперантами. Скиннер считал, что сами по себе стимулы не принуждают индивида реагировать на них. Исходная причина лежит в самом организме. В любом случае поведение происходит без воздействия какого-то специального побуждающего стимула. Осуществление оперантного поведения заложено в биологической природе организма. Научение рассматривалось Скиннером как процесс. Ни один (особенно сложный) оперант не возникает сразу. Процесс представляет собой поощрение оперантного поведения животного. Поощрение или наказание - это подкрепление, или стимул, который следует за реакцией и увеличивает вероятность ее появления. Когда голубь тычет клювом в диск (или крыса нажимает лапой на рычаг) - это оперантное поведение, при котором, если оно сопровождается подкреплением, увеличивается вероятность его повторения. "Оперантное обусловливание формирует поведение так же, как скульптор лепит фигуру из глины. Хотя в какой-то момент скульптор, казалось бы, создает совершенно новый объект, мы всегда можем вернуться назад, в начало процесса, к первоначальной недифференцированной болванке и выделить сколь угодно маленькие шаги, или последовательные этапы, следуя которым можно дойти до нужной кондиции. Ни в какой отдельно взятый момент не может появиться ничего такого, что очень сильно отличалось бы от того, что ему предшествовало… Оперант - это не то, что появляется в поведении уже полностью в готовом виде. Это результат непрерывного процесса формирования" (цит. по: Первин Л., Джон О. Психология личности. Теория и исследования. М., 2000. С.350).

Принципы оперантного обусловливания

Подкрепление является одним из принципов обусловливания. Уже с младенческого возраста, согласно Скиннеру, поведение людей можно регулировать с помощью подкрепляющих стимулов. Существуют два разных вида подкрепления. Некоторые, например еда или устранение боли, называются первичными подкреплениями, т.к. они обладают естественной подкрепляющей силой. Другие подкрепляющие стимулы (улыбка, внимание взрослого, одобрение, похвала) являются обусловленными подкреплениями. Они становятся таковыми в результате частого сочетания с первичными подкреплениями.
Оперантное обусловливание опирается в основном на положительное подкрепление, т.е. на такие последствия реакций, которые их поддерживают или усиливают, например, пища, денежное вознаграждение, похвала. Тем не менее Скиннер подчеркивает важность негативного подкрепления, которое приводит к угасанию реакции. Такими подкрепляющими стимулами могут быть физическое наказание, моральное воздействие, психологическое давление. При наказании неприятный стимул следует за реакцией, уменьшая вероятность того, что реакция появится вновь. Скиннер с сожалением замечал, что наказание - "это самая распространенная техника контроля над поведением, применяемая в современном мире. Схема всем известна: если мужчина ведет себя не так, как вам нравится, ударьте его кулаком, если ребенок плохо себя ведет, отшлепайте его, если люди в другой стране плохо себя ведут, сбросьте на них бомбу" (цит. по: Крэйн У. Секреты формирования личности. СПб.: Прайм-Еврознак, 2002. С. 241).
Кроме подкрепления, принципом обусловливания является его незамедлительность. Было обнаружено, что в начальной стадии эксперимента можно довести реакцию до наивысшего уровня только в том случае, если подкреплять ее немедленно. Иначе реакция, начавшая было формироваться, быстро угаснет.
При оперантном, так же как и при респондентном, обусловливании наблюдается генерализация стимулов. Генерализация - это возникшая в процессе обусловливания ассоциативная связь реакции со стимулами, похожими на те, на которые первоначально был выработан условный рефлекс. Примерами генерализации являются - страх перед всеми собаками, который сформировался вследствие нападения какой-то одной собаки, положительная реакция ребенка (улыбка, произнесение слова "папа", движение на встречу и проч.) на всех мужчин, похожих на его отца.
Формирование реакции представляет собой процесс. Реакция не возникает сразу и вдруг, она оформляется постепенно, по мере осуществления ряда подкреплений. Последовательное подкрепление - это выработка сложных действий с помощью подкрепления действий, которые постепенно все больше становятся похожими на ту окончательную форму поведения, которую предполагалось сформировать. Сплошное поведение формируется в процессе подкрепления отдельных элементов поведения, которые в совокупности складываются в сложные действия. Т.е. серия первоначально усвоенных действий в конечной форме воспринимается как целостное поведение.
Сам процесс поддерживается так называемым режимом подкрепления. Режим подкрепления - процент и интервал подкрепления реакций. Для исследования режимов подкреплений Скиннер изобрел ящик Скиннера (Skinner box), благодаря которому он наблюдал за поведением животных. Схематически это выглядит так:
S1 - R - S2,
где S1 - рычаг;
R - нажатие на рычаг;
S2 - пища (подкрепление).
Поведение контролируется при помощи изменения условий среды (или подкрепления). Их, например, можно давать (1) через определенный промежуток времени, независимо от числа реакций; (2) через определенное число реакций (нажатие на рычаг) и др.

Режимы подкрепления

Были выделены такие режимы подкрепления: непрерывное подкрепление - предъявление подкрепления каждый раз, когда субъект дает желаемую реакцию; прерывистое, или частичное, подкрепление.
Для более строгой классификации режимов подкрепления было выделено два параметра - временное подкрепление и пропорциональное подкрепление. В первом случае подкрепляют только тогда, когда истек срок, в течение которого необходимо было выполнить соответствующую деятельность, во втором подкрепляют за объем той работы (количество действий), которая должна была быть произведена.

На основе двух параметров были описаны четыре режима подкрепления:

1. Режим подкрепления с постоянным соотношением. Подкрепление осуществляется в соответствии с установленным количеством (объемом) реакций. Примером такого режима может быть оплата труда за определенный, постоянный объем работ. Например, оплата труда переводчику за количество переведенных знаков, или машинистке за количество напечатанного материала.

2. Режим подкрепления с постоянным интервалом. Подкрепление производится только тогда, когда твердо установленный, фиксированный временной интервал истек. Например, ежемесячная, понедельная, почасовая оплата, отдых после жестко установленного времени физической или умственной работы.

3. Режим подкрепления с вариативным соотношением. В этом режиме организм подкрепляется на основе какого-то в среднем предопределенного числа реакций. Так, покупка лотерейных билетов может быть примером работы такого режима подкрепления. В данном случае покупка билета означает, что с какой-то вероятностью может выпасть выигрыш. Вероятность возрастает, если покупается не один, а несколько билетов. Однако результат в принципе мало предсказуем и непостоянен, и человеку редко удается вернуть вложенные в покупку билетов деньги. Тем не менее неопределенность результата и ожидание большого выигрыша приводят к очень медленному затуханию реакции и угасанию поведения.

4. Режим подкрепления с вариативным интервалом. Индивид получает подкрепление после того, как проходит неопределенный интервал. Подобно режиму подкрепления с постоянным интервалом, в этом случае подкрепление зависит от времени. Интервал времени произволен. Короткие интервалы, как правило, порождают высокую скорость реагирования, а длинные - низкую. Такой режим применяется в учебном процессе, когда оценка уровня достижений производится нерегулярно.

Скиннер говорил об индивидуальности подкреплений, о вариативности развития того или иного навыка у разных людей, а также у разных животных. Более того, само подкрепление носит уникальный характер, т.к. уверенно нельзя сказать, что у данного человека или животного может выступать в качестве подкрепления.

Рост и развитие личности

По мере того, как ребенок развивается, его реакции усваиваются и остаются под контролем подкрепляющих воздействий со стороны окружающей среды. В виде подкрепляющих воздействий выступают - пища, похвала, эмоциональная поддержка и др. Эта же идея излагается Скиннером в книге "Вербальное поведение" (1957). Он считает, что овладение речью происходит по общим законам оперантного обусловливания. Ребенок получает подкрепление при произнесении определенных звуков. Подкреплением служит не пища или вода, а одобрение и поддержка взрослых.
С критическими замечаниями в адрес концепции Скиннера выступил в 1959 г. известный американский лингвист Н. Хомский. Он отрицал особую роль подкрепления в ходе овладения речью и критиковал Скиннера за пренебрежение синтаксическими правилами, которые играют роль в осознании человеком языковых конструкций. Он считал, что обучение правилам не требует особого учебного процесса, а совершается благодаря врожденному, специфическому речевому механизму, который называется "механизмом овладения речью". Таким образом, овладение речью происходит не в результате научения, а посредством естественного развития.

Психопатология

(1) Неусвоенная реакция или поведенческий дефицит возникает в результате отсутствия подкрепления при формировании необходимых навыков и умений. Депрессия также рассматривается как результат отсутствия подкрепления для формирования или даже поддержания необходимых реакций.

(2) Неадаптивная реакция - результат усвоения действия, неприемлемого для общества, не соответствующего нормам поведения. Такое поведение возникает как следствие подкрепления нежелательной реакции, либо в результате случайного совпадения реакции и подкрепления.

Изменение поведения также построено на принципах оперантного обусловливания, на системе модификации поведения и сопряженных с ним подкреплений.
А. Изменение поведения может происходить вследствие самоконтроля.

Самоконтроль включает в себя две взаимозависимые реакции:

1. Контролирующая реакция, которая воздействует на среду, изменяя вероятность возникновения вторичных реакций ("уход" чтобы не выразить "гнев"; удаление пищи, чтобы отвыкнуть от переедания).

2. Контролирующая реакция, направленная на наличие в ситуации стимулов, которые могут сделать желательное поведение более вероятным (наличие стола для осуществления учебного процесса).

Б. Изменение поведения может происходить и вследствие осуществления поведенческого консультирования. Во многом этот тип консультирования базируется на принципах научения.
Вольпе (Wolpe) определяет терапию поведения как терапию обусловливания, подразумевающую использование сформулированных в процессе экспериментирования принципов научения с целью изменения неадекватного поведения. Неадекватные привычки ослабляются и устраняются; адаптивные привычки, напротив, вводятся и усиливаются.

Цели консультирования:

1) Изменение неадекватного поведения.

2) Научение принятию решения.

3) Предотвращение проблем путем антиципации результатов поведения.

4) Устранение дефицита в поведенческом репертуаре.

Этапы консультирования:

1) Поведенческая оценка, сбор информации о приобретенных действиях.

2) Процедуры релаксации (мышечная, вербальная и т.д.).

3) Систематическая десенсибилизация - связь расслабления с образом, вызывающим тревогу.

4) Тренинг ассертивности

5) Процедуры подкрепления.

Достоинства и недостатки теорий научения

Достоинства:

1. Стремление к строгой проверке гипотез, эксперименту, контролю дополнительных переменных.

2. Признание роли ситуативных переменных, параметров среды и их систематическое изучение.

3. Прагматический подход к терапии позволил создать важные процедуры для изменения поведения.

Недостатки:

1. Редукционизм - сведение принципов поведения, полученных на животных, к анализу поведения человека.

2. Низкая внешняя валидность вызвана проведением экспериментов в лабораторных условиях, результаты которых трудно перенести в естественные условия.

3. Игнорирование когнитивных процессов при анализе S-R связей.

4. Большой разрыв между теорией и практикой.

5. Поведенческая теория не дает стабильных результатов.

Термин оперантное обусловливание был предложен Б. Ф. Скиннером (1904- 1990) в 1938 году (Skinner, 1938; особенно см. Skinner, 1953). Он утверждал, что поведение животных происходит в окружающей их среде и повторяется или не повторяется в зависимости от его последствий. В соответствии с точкой зрения Торндайка эти последствия могут принимать различные формы, такие как получение вознаграждений за выполнение некоторых действий или осуществление некоторого поведения для избежания неприятностей. Многие виды стимулов могут выступать в роли вознаграждения (пища, похвала, социальные взаимодействия), а некоторые - в роли наказания (боль, дискомфорт). Выраженное в несколько резкой, крайней форме, но верное мнение Скиннера: все то, что мы делаем или не делаем, происходит из-за последствий.

Скиннер изучал оперантное обусловливание в лаборатории, главным образом в опытах с крысами и голубями. Например, несложно исследовать поведение крыс, нажимающих на рычаг или «педаль», что они с готовностью научаются делать для получения вознаграждения в виде пищи. Тогда можно манипулировать такими переменными, как режим и регулярность предоставления пищи (например, после каждого нажатия на рычаг, через определенное число нажатий), чтобы посмотреть, какие влияния окажут эти изменения на поведение крысы. Затем Скиннер сконцентрировался на характере нажатия на рычаг как функции непредвиденных обстоятельств различных типов, т. е. факторов, могущих заставить крысу нажимать рычаг быстрее, медленнее либо не нажимать вовсе.

В некотором смысле Скиннер повернул стрелки часов вспять, вернувшись к строгому бихевиоризму. На всем протяжении его почти шестидесятилетней и в высшей степени выдающейся научной карьеры он непреклонно отказывался использовать такие термины, как научение, мотивация, и какие-либо другие, обозначающие что-либо невидимое в объясняемом поведении. Он обосновывал это тем, что такие термины заставляют нас полагать, что мы понимаем что-то, чего на самом деле не понимаем. Его собственные слова звучали так:

Когда мы говорим, что человек ест, потому что он голоден... много курит, потому что он заядлый курильщик... или хорошо играет на пианино, потому что обладает музыкальными способностями, мы вроде бы имеем в виду причины поведения. Но подвергнутые анализу, эти фразы оказываются просто неправомерными (излишними) описаниями. Некий простой набор фактов описывается двумя утверждениями: «он ест» и «он голоден». Или, например: «он много курит» и «он заядлый курильщик». Или: «он хорошо играет на пианино» и «он обладает музыкальными способностями». Практика объяснения одного утверждения в терминах другого опасна, потому что она предполагает, будто мы нашли причину, а поэтому не нуждаемся в дальнейшем поиске (Skinner, 1953, р. 31).

Другими словами, такие утверждения образуют замкнутый круг. Как мы узнаем, что человек голоден? Потому что он ест. Почему он ест? Потому что он голоден. Однако многие исследователи указывали, что существуют пути выхода из этой ловушки, способы сохранить в научном обращении термины, описывающие внутренние, невидимые состояния или процессы. Мы уже отмечали один из них: использование представителями теории научения операциональных определений таких состояний, как голод. Тем не менее продолжаются дебаты относительно допустимой степени употребления подобных терминов.

Оперантное обусловливание Скиннера, с соответствующими ограничениями и оговорками (особенно в отношении людей), обсуждаемыми в главе 3 в контексте его анализа, стало считаться важнейшим способом, посредством которого окружающая среда влияет на наше развитие и поведение.

Американская психология – это психология научения.
Это направление в американской психологии, для которого понятие развития отождествляется с понятием научения, приобретения нового опыта. Большое влияние на разработку этой концепции оказали идеи И.П.Павлова. Американские психологи восприняли в учении И.П.Павлова идею о том, что приспособительная деятельность характерна для всего живого. Обычно подчеркивают, что в американской психологии был ассимилирован павловский принцип условного рефлекса, который послужил толчком для Дж.Уотсона к разработке новой концепции психологии. Это слишком общее представление. В американскую психологию вошла сама идея проведения строгого научного эксперимента, созданного И.П.Павловым еще для изучения пищеварительной системы. Первое описание И.П.Павловым такого эксперимента было в 1897 г., а первая публикация Дж.Уотсона – в 1913 г.
Разработка идей И.П.Павлова в американской психологии заняла несколько десятилетий, и каждый раз перед исследователями выступал один из аспектов этого простого, но вместе с тем еще не исчерпанного в американской психологии явления – феномена условного рефлекса.
В наиболее ранних исследованиях научения на передний план выступила идея сочетания стимула и реакции, условных и безусловных стимулов: был выделен временной параметр этой связи. Так возникла ассоцианистическая концепция научения (Дж.Уотсон, Э.Газри). Когда внимание исследователей привлекли функции безусловного стимула в установлении новой ассоциативной стимульно-реактивной связи, возникла концепция научения, в которой главный акцент был сделан на значении подкрепления. Это были концепции Э.Торндайка и Б.Скиннера. Поиски ответов на вопрос о том, зависит ли научение, то есть установление связи между стимулом и реакцией, от таких состояний испытуемого, как голод, жажда, боль, получивших в американской психологии название драйва, привели к более сложным теоретическим концепциям научения – концепциям Н.Миллера и К.Халла. Две последние концепции подняли американскую теорию научения до такой степени зрелости, что она готова была ассимилировать новые европейские идеи из области гештальт-психологии, теории поля и психоанализа. Именно здесь наметился поворот от строгого поведенческого эксперимента павловского типа к изучению мотивации и познавательного развития ребенка Бихевиористское направление также занималось проблемами возрастной психологии. Согласно бихевиористской теории, человек таков, каким он научился быть. Эта мысль дала повод ученым назвать бихевиоризм «теорией обучения». Многие из сторонников бихевиоризма полагают, что человек учится вести себя всю жизнь, но не выделяют каких-либо особых стадий, периодов, этапов. Вместо этого они предлагают 3 типа обучения: классическое обусловливание, оперантное обусловливание и обучение посредством наблюдения.
Классическое обусловливание – это простейший тип обучения, в процессе которого используются лишь непроизвольные (безусловные) рефлексы в поведении детей. Эти рефлексы у человека и животных являются врожденными. Ребенок (как и детеныш животных) в ходе обучения чисто автоматически реагирует на какие-либо внешние стимулы, а затем учится реагировать таким же образом на стимулы, несколько отличающиеся от первых (пример с 9-тимесячнымАльбертом, которого Райдер и Уотсон учили бояться белую мышь).
Оперантное обусловливание – это специфический тип обучения, который разработал Скиннер. Суть его заключается в тои, что человек контролирует свое поведение, ориентируясь на его вероятные последствия (положительные и отрицательные). (Скиннер с крысами). Дети перенимают у других различные формы поведения посредством методов обучения, особенно таких, как подкрепление и наказание.
Подкрепление – это любой стимул, увеличивающий вероятность повторения определенных реакций, форм поведения. Оно может быть позитивным негативным. Позитивным является подкрепление, приятное человеку, удовлетворяющее какую-то его потребность и способствующее повторению форм поведения, заслуживших поощрения. В опытах Скиннера позитивным подкреплением была пища. Негативным является такое подкрепление, которое заставляет повторять реакции неприятия, отторжения, неприятия чего-либо.
Сторонники бихевиористской теории установили, что наказание тоже является специфическим средством обучения. Наказание – это стимул, заставляющий отказаться от вызвавших его действий, форм поведения.
Понятия «наказание» и «негативное подкрепление» часто путают. Но при наказании человеку дается, предлагается, навязывается нечто неприятное или же у него отбирается нечто приятное, а в результате и то, и другое вынуждает его прекратить какие-то действия и поступки. При негативном же подкреплении убирается нечто неприятное с целью поощрения определенного поведения.
Обучение посредством наблюдения. Американский психолог Альберт Бандура, признавая важность обучения по типу классического и оперантного обусловливания, все же считает, что в жизни обучение происходит благодаря наблюдению. Ребенок наблюдает за тем, что делают, как ведут себя родители, другие люди в его социальном окружении и старается воспроизводить образцы их поведения.
Бандуру и его коллег, акцентирующих внимание на зависимости личностных характеристик человека от его способности учиться у окружающих, обычно называют теоретиками социального обучения.
Суть обучения посредством наблюдения состоит в том, что человек копирует чьи-то образцы поведения, не ожидая ни какого-либо поощрения или наказания за это. За годы детства ребенок накапливает огромную информацию о разлчных формах поведения, ъотя в своем поведении он может и не воспроизводить их.
Однако если он видит, что какие-то дела, поступки, поведенческие реакции других детей поощряют, то, скорее всего, он будет стараться копировать их. Кроме того, вполне вероятно, что он будет охотнее подражать тем людям, которыми он восхищается, которых любит, которые в его жизни значат больше, чем другие. Дети никогда не станут добровольно копировать образцы поведения тех, кто им не приятен, кто для них ничего не значит, тех, кого они боятся.
В опытах Э.Торндайка (исследование приобретенных форм поведения), в исследованиях И.П.Павлова (изучение физиологических механизмов научения) подчеркивалась возможность возникновения на инстинктивной основе новых форм поведения. Было показано, что под влиянием среды наследственные формы поведения обрастают приобретенными умениями и навыками.

В середине XX в. в итоге пересмотра ряда основополагающих идей ортодоксального бихевиоризма сформировался необихевиоризм (Э. Толмен – когнитивный бихевиоризм, К. Халл – гипотетико-дедуктивный бихевиоризм, Э. Газри, Б. Ф. Скиннер – оперантный бихевиоризм и др.). Серьезную критику со стороны оппонентов ортодоксального бихевиоризма вызывал его явный механицизм в понимании поведения. Поэтому некоторые необихевиористы сделали попытку введения в традиционную схему "стимул – реакция" ряда новых промежуточных переменных (познавательной когнитивной карты, матрицы ценностей, цели, мотивации, антиципации, управления поведением и др.). Это существенно изменило общее содержание бихевиоризма.

В то время как большая часть сторонников необихевиоризма смягчили свои позиции за счет введения понятий, не свойственных ортодоксальному бихевиоризму, известный американский психолог Б. Ф. Скиннер и ряд других исследователей встали на точку зрения "радикального бихевиоризма". Этот подход еще жестче, чем это было принято в ортодоксальном бихевиоризме, отвергал любые интерпретации, имеющие отношения к ментализму. Б. Ф. Скиннер осуждал отступления от ортодоксального бихевиоризма, считая их возвратом к ненаучной психологии. Материалом для научного анализа, по его мнению, могут служить лишь наблюдаемые и измеряемые аспекты среды, поведения организма и последствия этого поведения.

Необихевиоризм оказал существенное влияние на теорию обучения и образовательную практику середины XX в. во всем мире. На фундаменте идей необихевиористов в педагогической психологии и теории обучения сформировалось мощное научное направление, получившее наименование "программированного обучения". С середины 1950-х гг. программированное обучение получило широкое распространение в мире (Англия, Польша, СССР, США, Франция, Чехословакия и др.). В США были созданы специальные научно-исследовательские учреждения, занимающиеся вопросами разработки новой дидактической технологии. В СССР также был организован специальный научный совет по вопросам программированного обучения.

Бэррас Фредерик Скиннер (1904– 1990) родился п Саскэханне, штат Пенсильвания, получил степень магистра в 1930 г., а степень доктора философских наук – в 1931 г. в Гарварде. Юношеское желание стать писателем реализовано не было, и после ряда неудачных попыток поиска собственного пути, он отправился изучать психологию в Гарвард.

Б. Ф. Скиннер преподавая психологию в университете Миннесоты с 1936 по 1945 г. В это время он опубликовал одну из основных своих работ – "Поведение организмов". После трехлетней работы деканом факультета психологии в университете Индианы, в 1948 г. он вернулся в Гарвард, где жил и работая до своей кончины – в 1990 г.

Основные положения теории "оперантного научения" Б. Ф. Скиннера

Важной точкой отсчета для понимания теории Б. Ф. Скиннера является его классификация видов поведения. Он выделял "респондентное поведение" и "оперантное поведение". Респондентное поведение вызывается известным стимулом. Пример респондентного поведения – все безусловные реакции, они возникают в результате безусловного стимула. Оперантное поведение не вызывается стимулом, оно просто производится организмом. Поскольку оперантное поведение не связывается с известными стимулами, кажется, что оно происходит спонтанно. Проявления оперантного поведения многообразны, большую часть наших каждодневных действий можно квалифицировать как оперантное поведение.

Б. Ф. Скиннер не утверждал, что оперантное поведение возникает независимо от стимуляции, скорее наоборот. Просто стимул, вызывающий оперантное поведение, неизвестен и знать его причину необязательно. Респондентное поведение целиком зависит от предшествовавшего ему стимула. В отличие от него оперантное повеление контролируется его последствиями.

Наряду с двумя типами поведения, по Б. Ф. Скиннеру, существует два тина обусловливания: "респондентное обусловливание" и "оперантное обусловливание". Респондентное обусловливание идентично классическому обусловливанию И. П. Павлова, Б. Ф. Скиннер называл его еще обусловливанием типа "S ". Тем самым подчеркивая важность стимула, который и вызывает необходимую реакцию. Оперантное обусловливание Б. Ф. Скиннер обозначает буквой "R", подчеркивая в данном случае, что акцент делается на реакцию.

При обусловливании типа "R" о его силе судят по скорости реакции, а при обусловливании типа "S " сила обусловливания часто определяется по величине условной реакции. Несложно заметить, что обусловливание типа "/?" Б. Ф. Скиннера очень похоже на "инструментальное обусловливание" Э. Торндайка, а его обусловливание типа "S " – на "классическое обусловливание" И. П. Павлова. Основное внимание в собственных исследованиях Б. Ф. Скиннер уделял оперантному обусловливанию, или по его терминологии обусловливанию типа "R".

Б. Ф. Скиннером выделены два главных принципа оперантного обусловливания (обусловливания типа "R"):

1. Любая реакция, следующая за подкрепляющим стимулом, предрасположена к повторению.
2. Подкрепляющим стимулом может быть все, что увеличивает скорость появления оперантной реакции.

В качестве подкрепляющего стимула может выступать все, что увеличивает вероятность повторения реакции. Как легко заметить, принципы оперантного обусловливания могут применяться к разнообразным ситуациям. Для того чтобы изменить поведение, необходимо найти нечто, что будет служить подкреплением для организма. Затем следует подождать, пока желаемое поведение проявится, и после этого произвести подкрепление.

В увлекательной книге последовательницы Б. Ф. Скиннера, американского зоопсихолога и дрессировщицы Карен Прайор "Не рычите на собаку" описано множество примеров использования принципов оперантного научения при дрессировке морских животных. Участвовавшие в ее исследованиях дельфины не только научились выполнять команды человека, они с успехом решали даже творческие задачи.

После этого частота желаемой реакции возрастет. Когда желаемое поведение проявится вновь, оно снова подкрепляется, и скорость проявления ответной реакции еще больше возрастает. Подобное влияние можно оказывать на любое поведение организма.

Б. Ф. Скиннер рассматривал социально-культурную среду как совокупность возможностей подкрепления.

Благодаря различиям в социально-культурной среде подкрепляются различные паттерны поведения. Согласно Б. Ф. Скиннеру то, что именуется словом "личность", нс является ничем, кроме согласующихся паттернов поведения, которые являются итогом истории нашего подкрепления.