行動分析学の基礎:「連続強化と部分強化の違い」を理解する!

行動分析学・動物
スポンサーリンク

こんにちは!ケンさんです。

私たちの行動がどのように形成され、維持されるのかを理解する上で重要な「強化(Reinforcement)」という概念。

今回は強化子の与え方である「強化スケジュール」の中から、「連続強化」と「部分強化(間欠強化)」に焦点を当てて、その違いを見ていきましょう。

ケンさん(アニマルトレーナー)
アニマルトレーナー歴15年。
行動分析学を応用した近代トレーニングを実施しています。
「行動分析学は世界をより良くする」と信じ、日々発信しています。

スポンサーリンク
スポンサーリンク

強化ってなんだ?

まず、「強化」とは何でしょうか?

強化とは行動の生起頻度が増えることです。

このブログでは「正の強化」を中心に解説していきます。

正の強化とは、ある行動の後に特定の「強化子」(私たちにとって嬉しい結果)が与えられることで、その行動が将来的に起こる確率が高まる現象を指します。

たとえば…

  • 「ありがとう」と言ったら、相手が笑顔になった(→また「ありがとう」と言いたくなる)
  • テストで良い点を取ったら、親に褒められた(→次も勉強を頑張ろうと思う)
  • スイッチを押したら、電気がついた(→またスイッチを押す)

これらはすべて、何らかの行動が「強化」された例です。

私たちの日常生活は、この「強化」によって多くの行動が学習され、維持されています。

強化スケジュール:報酬の与え方には種類がある!

この強化子を「いつ」「どのように」与えるか、というルールを「強化スケジュール」と呼びます。

このスケジュールによって、行動の学習スピードや一度学習した行動がどれくらい続きやすいかが大きく変わってきます。

今回は、強化スケジュールの基本となる2つのタイプを見ていきましょう。

連続強化 (Continuous Reinforcement: CRF)

定義:行動したら「毎回」報酬ゲット!

連続強化とは、ターゲットとなる行動が起こるたびに、必ず強化子を与えるというシンプルな方法です。

例えば、あなたが新しいスマホゲームを始めたとします。

最初のステージでは、敵を倒すたびに必ずコインがもらえました。

これが連続強化です。

連続強化の特徴

素早い学習

新しい行動を覚えさせるのに最適です。

行動と報酬のつながりが非常に明確なので、「こうすれば良いんだ!」とすぐに理解できます。

初期学習に強い

犬に「お座り」を教える時、成功するたびにおやつをあげるのは典型的な連続強化ですね。

連続強化の弱点

飽きやすい?

毎回報酬がもらえることに慣れてしまうと、報酬がもらえなくなった時に「あれ?もらえないならもういいや」と行動が比較的早く消えてしまう(これを消去と言います)傾向があります。

先ほどのゲームで例えると、急にコインがもらえなくなったらそのゲームを続けるモチベーションはすぐに下がってしまうかもしれません。

\ケンさんおすすめの書籍はこちら/

部分強化 (Partial Reinforcement) / 間欠強化 (Intermittent Reinforcement)

定義:行動しても「たまに」しか報酬なし!

部分強化(間欠強化)は、ターゲットとなる行動が起こっても、毎回ではなく、不定期に強化子を与える方法です。

あなたがクレーンゲームをプレイするところを想像してみてください。

アームを操作して景品を狙っても、毎回景品が取れるわけではありませんよね?

何回かに1回、あるいはたまにしか景品は取れません。

しかし、私たちは「次は取れるかも!」という期待から何度もプレイしてしまいます。

これが部分強化の典型的な例です。

部分強化の特徴

行動が長続きする

連続強化と比べて、報酬がいつ来るか分からないため「次はもらえるかもしれない」という期待が行動を維持させます。
そのため、強化子がもらえなくなってもなかなか行動が消えにくい(消去抵抗が強い)という非常に重要な特徴があります。

多様な種類

部分強化には、報酬を与える条件によってさらに細かく分類されます。

回数で決めるタイプ (比率スケジュール)

定率強化スケジュール (Fixed Ratio: FR)
「3回行動したら報酬」のように、決まった回数の行動後に報酬を与える。

変率強化スケジュール (Variable Ratio: VR)
「平均して5回行動したら報酬」のように、報酬までの回数が毎回バラバラ。
カジノのギャンブルなど、最も消去されにくい行動を生み出すスケジュールとして知られています。

時間で決めるタイプ (間隔スケジュール)

定間隔強化スケジュール (Fixed Interval: FI)
「10分経ってからの最初の行動で報酬」のように、決まった時間間隔が経ってからの最初の行動に報酬を与える。

変間隔強化スケジュール (Variable Interval: VI)
「平均して10分経ってからの最初の行動で報酬」のように、報酬までの時間間隔が毎回バラバラ。
メールやSNSの通知チェックなどがこれに当たります。

部分強化の弱点

学習に時間がかかる

新しい行動を覚える初期段階では連続強化の方が効率的です。

部分強化は行動と報酬の結びつきが曖昧になりがちなので、行動が定着するまでに時間がかかります。

まとめ:「連続強化と部分強化の違い」を理解して使いこなそう!

スケジュール強化子の与え方行動の学習行動の維持(消去抵抗)典型的な使用場面
連続強化毎回与える速い弱い新しい行動の学習
部分強化たまに与える遅い強い行動の維持、習慣化

行動分析学では、この2つの強化スケジュールを状況に応じて使い分けることがとても重要だと考えられています。

たとえば…

新しいことを教える時は、まず連続強化で「これをすれば良いんだ!」ということを早く覚えてもらいます。

行動がしっかり身についたら、今度は部分強化に切り替えることで報酬がなくてもその行動が長く続くように維持していきます。

私たちの日常生活にも、これらの強化スケジュールがたくさん隠されています。

ぜひ、周りの人や自分自身の行動を観察してみてください。

「これはどの強化スケジュールで維持されているんだろう?」

と考えてみると行動分析学がもっと面白く感じられるはずです!

行動分析学は私たちの行動の「なぜ?」を解き明かすための強力なツールになります。

これからも一緒に学んでいきましょう!

\ケンさんおすすめの書籍はこちら/
スポンサーリンク
スポンサーリンク
行動分析学・動物
スポンサーリンク
ケンさんをフォローする

コメント

タイトルとURLをコピーしました