犬のアジリティやイルカ等の海獣トレーニングなどにおいて、動物がミスをした際どう対処していますか?
多くのトレーナーは流れを止めないために「呼び戻し(ボイスなど)」や「リコール(ベルなど)」といったリセットのための弁別刺激(SD)を出し、動物をスタートポジションに戻してからトレーニングを再開する方法を取るのではないでしょうか。
「ミスを無視(消去)なんてしていたら、セッションが成立しない!」
…これは実践における切実な声かと思います。
しかしこの呼び戻しやリコールなどのSDを使ってリセット行動を促し、その後の行動を強化することは、実は問題行動(ミス)を間接的に強化してしまうという理論上の大きなリスクを抱えています。
本記事ではこの理論と実践のギャップを埋め「問題行動の強化」という落とし穴を避けつつ、リセット行動を維持するための具体的な戦略をご紹介します。

ケンさん(アニマルトレーナー)
アニマルトレーナー歴15年。
行動分析学を応用した近代トレーニングを実施しています。
「行動分析学は世界をより良くする」と信じ、日々発信しています。
リセット行動の強化が問題行動を生むメカニズム
私たちが実践している「ミス → SD(呼び戻し、リコール) → 強化」という流れは、動物の学習の観点から見ると以下の三項随伴性の連鎖を確立しかねません。
問題行動(ミス)→SD(呼び戻し、リコール)→リセット行動→強化子
この連鎖が確立されると、動物は無意識のうちに以下の条件付けを学習します。
「ミスをすれば、トレーナーが注目してSDを出してくれる。それに従えば強化子にたどり着ける。」
問題行動(ミス)が強化子に到達するための最初のステップとなってしまい、結果としてミスが増えたり、わざと間違えたりする行動(強化を得るための行動)が生起するリスクが高まります。

実践と理論を両立させる:鍵は「強化の分化」
ではトレーニングの効率を落とさずリセット行動を維持し、かつ問題行動を強化しないようにするにはどうすれば良いでしょうか?
それは「強化の分化(Differential Reinforcement)」を徹底することです。
動物の頭の中で「ミス → 報酬」のルートを完全に遮断し「正解 → 最高の報酬」のルートを明確に際立たせることでリセット行動を維持しつつ、問題行動は減少させます。
呼び戻しやリコール(SD)は「情報」として確立する
「呼び戻し」や「リコール」といった修正のためのSDは「その行動をやめてポジションにつきなさい」という中立的な情報として動物に提示し、確立する必要があります。
- 感情を伴わせない
トレーナーはフラストレーションを見せず、あくまで淡々と提示します。 - ブリッジは避ける
ポジションに戻った行動に対して、「Yes!」や「ホイッスル」といった強化子を予告するシグナルは絶対に使用しません。これは、本命の目標行動のために温存します。
リセット行動は「弱い強化子」で維持する
リセット行動(ポジションに戻る)を完全に無強化にすると、その行動は消えてしまいます。
つまりポジションに戻って来なくなったり、戻りが遅くなったりします。
そこでリセット行動は必要最低限の弱い強化で維持します。
行動 | 強化の質と量 | 動物へのメッセージ |
リセット行動 | 低頻度・低品質の報酬 (例:いつもより少ない餌、軽い撫で、中立的な「Good」などの声かけ) | 「まぁまぁ、ちょっと戻っておいで」 |
目標行動(正解) | 高頻度・高品質の報酬 (例:大好物、大げさな遊び、熱狂的な褒め言葉) | 「よくやった!」 |
このように、報酬の質と量を極端に分化することで、動物は「なんか呼ばれたから一旦戻るか」「最初から正解を出すことが最短距離で報酬にたどり着けるな」と学習します。
これによりリセット行動は維持されつつも、問題行動の頻度は自然と減少していきます。

結論:エラーレス・ラーニングを究極の目標に
実践的なトレーニングであっても、最終的な目標はエラーレス・ラーニング…つまり動物がミスをしないように環境とSDを操作することです。
呼び戻しやリコールは便利なツールですが、使いすぎるとトレーニングが非効率になります。
ミスの頻度が高い場合は、修正キューを使う前に立ち止まり、指示が難しすぎないか、プロンプトが不十分でないかを再評価しましょう。
問題行動への対応は、動物を罰することではなく、動物がより効率よく報酬を得られるように、正しい条件付けを明確に提示することに尽きるのです。
コメント