報酬(喜)や嫌悪刺激(罰)を適応して、自発的な行動を学習させる条件のこと。行動主義心理学(科学的に行動を誘導できるという心理学のアプローチ)の理論のひとつでもある。
1898年にEdward L. Thorndike氏によって実験が先に行われるが、1938年にアメリカ行動経済学の創始者と言われるBurrhus Frederic Skinner(BF スキナー)氏が、マウスやハトを用いて体系的な研究が行われた。
実験は、主にラットやハト、ネズミを対象に、ブザーが鳴った後にレバーを押す(=オペラント行動)と、餌が出てくる(=刺激する)実験装置(スキナー箱)に入れて観察した。ネズミは、これらの行動を繰り返すことで、ブザーが鳴るとレバーを押す行動(=オペラント行動)の頻度が高くなることが実証された。
行動のパターン化
オペラント条件付けには、自発的行動と結果(刺激)の関係性によって4つの学習パターンがある。
-
正の強化:刺激を与えられたこと(+)で行動が増える(+)
例)あるスマホゲームで休日にログインすると限定アイテムがもらえる(=刺激)
→休日にログインする回数が増える(=行動) -
正の罰:刺激を与えられたこと(+)で行動が減る(-)
例)フリマアプリで不正を行なったため、運営側からペナルティを受ける(=刺激)
→不正を行う回数が減る(=行動) -
負の強化:刺激を取り除かれたこと(-)で行動が増える(+)
例)冬にうがい薬を使うようになったら風邪を引きづらくなった(=刺激)
→うがい薬を買う回数が増える(=行動) -
負の罰:刺激を取り除かれたこと(-)で行動が減る(-)
例)ゲームをやりすぎて親にゲーム機を没収される(=刺激)
→ゲームをする時間が減る(=行動)
Facebookにおけるオペラント条件付けの応用
ユーザーは自分が興味を持った情報や面白かったことをFacebookのタイムラインに投稿する(=オペラント行動)。投稿を見た他のユーザーから「いいね」や「コメント」(=刺激)を貰うことで、ユーザーは投稿する(=オペラント行動)頻度が増えてエンゲージメントが上昇する。
古典的条件付けとの違い
関連する用語に、オペラント条件付けの約35年前に提唱された古典的条件付けがある。
両者の大きな違いは、条件付けに自発的な行動が伴うかどうかである。
オペラント条件付けでは、「ブザーが鳴った後にレバーを押すと、餌が出てくる」というスキナー実験に代表されるように「レバーを押す」という自発的な行動と行動に対するフィードバックの刺激によって条件付けされる。
古典的条件付けは、受動的で対象は無自覚に条件付けされ、自発的な行動は伴わない。古典的条件付けで引き起こされる条件反射は、生物が本来持っている反応で、自分の意思でコントロールできない不随意運動である。
オペラント条件付けが完了すると、自発的な行動によって反応頻度が増えるが、反応を引き起こすトリガーの数は変化しない。
古典的条件付けが完了すると、反応を引き起こすトリガーの数が増えるが、反応の頻度は変化しない。パブロフの犬を例にすると「よだれを垂らす」という特定の反応を引き起こすトリガーに「餌の匂い」「餌の視覚刺激」に加えて「ベルの音」が増える。
行動 | 反応を引き起こすトリガーの数 | 反応頻度 | |
---|---|---|---|
オペラント条件付け | ・能動的 ・自発的な行動で条件付けされる(随意) |
変化しない | 増える |
古典的条件付け | ・受動的 ・無自覚に条件付けされる(不随意) |
増える | 変化しない |