オペラント条件付け
operant conditioning

報酬や罰を組み合わせて、自発的な行動を行うように学習させること

報酬(喜)や嫌悪刺激(罰)を適応して、自発的な行動を学習させる条件のこと。行動主義心理学(科学的に行動を誘導できるという心理学のアプローチ)の理論のひとつでもある。

1898年にEdward L. Thorndikeエドワード・ソーンダイク氏によって実験が先に行われるが、1938年にアメリカ行動経済学の創始者と呼ばれるBurrhus Frederic Skinnerパラス・フレデリック・スキナー氏が、マウスやハトを用いて体系的な研究が行われた。

実験は、主にラットやハト、ネズミを対象に、ブザーが鳴った後にレバーを押す(=オペラント行動)と、餌が出てくる(=刺激する)実験装置(スキナー箱)に入れて観察した。ネズミは、これらの行動を繰り返すことで、ブザーが鳴るとレバーを押す行動(=オペラント行動)の頻度が高くなることが実証された。

行動のパターン化

オペラント条件付けには、自発的行動と結果(刺激)の関係性によって4つの学習パターンがある。

オペラント条件付けによる4つの学習パターン

オペラント条件付けによる4つの学習パターン

  1. 正の強化:刺激を与えられたこと(+)で行動が増える(+)

    例)あるスマホゲームで休日にログインすると限定アイテムがもらえる(=刺激)
    →休日にログインする回数が増える(=行動)
  2. 正の罰:刺激を与えられたこと(+)で行動が減る(-)

    例)フリマアプリで不正を行なったため、運営側からペナルティを受ける(=刺激)
    →不正を行う回数が減る(=行動)
  3. 負の強化:刺激を取り除かれたこと(-)で行動が増える(+)

    例)冬にうがい薬を使うようになったら風邪を引きづらくなった(=刺激)
    →うがい薬を買う回数が増える(=行動)
  4. 負の罰:刺激を取り除かれたこと(-)で行動が減る(-)

    例)ゲームをやりすぎて親にゲーム機を没収される(=刺激)
    →ゲームをする時間が減る(=行動)

Facebookにおけるオペラント条件付けの応用

ユーザーは自分が興味を持った情報や面白かったことをFacebookのタイムラインに投稿する(=オペラント行動)。投稿を見た他のユーザーから「いいね」や「コメント」(=刺激)を貰うことで、ユーザーは投稿する(=オペラント行動)頻度が増えてエンゲージメントが上昇する。

古典的条件付けとの違い

関連する用語に、オペラント条件付けの約35年前に提唱された古典的条件付けがある。

両者の大きな違いは、条件付けに自発的な行動が伴うかどうかである。

オペラント条件付けでは、「ブザーが鳴った後にレバーを押すと、餌が出てくる」というスキナー実験に代表されるように「レバーを押す」という自発的な行動と行動に対するフィードバックの刺激によって条件付けされる。

古典的条件付けは、受動的で対象は無自覚に条件付けされ、自発的な行動は伴わない。古典的条件付けで引き起こされる条件反射は、生物が本来持っている反応で、自分の意思でコントロールできない不随意運動である。

オペラント条件付けが完了すると、自発的な行動によって反応頻度が増えるが、反応を引き起こすトリガーの数は変化しない。

古典的条件付けが完了すると、反応を引き起こすトリガーの数が増えるが、反応の頻度は変化しない。パブロフの犬を例にすると「よだれを垂らす」という特定の反応を引き起こすトリガーに「餌の匂い」「餌の視覚刺激」に加えて「ベルの音」が増える。

行動 反応を引き起こすトリガーの数 反応頻度
オペラント条件付け ・能動的
・自発的な行動で条件付けされる(随意)
変化しない 増える
古典的条件付け ・受動的
・無自覚に条件付けされる(不随意)
増える 変化しない

関連用語

参考文献

大本 あかね

UX DAYS TOKYO オーガナイザ/デジタルマーケティングコンサルタント

著書
ノンデザイナーでもわかる UX+理論で作るWebデザイン
Google Search Consoleの教科書

毎年春に行われているUX DAYS TOKYOは私自身の学びの場にもなっています。学んだ知識を実践し勉強会やブログなどでフィードバックしています。
UXは奥が深いので、みなさん一緒に勉強していきましょう!

スローガンは「早く学ぶより深く学ぶ」「本質のUXを突き止める」です。