強化学習のサイクルを回す

nakatomimoka2008-06-12

茂木健一郎さん。「ドーパミンの分泌量が多いほど、人間は大きな快感・喜びを感じることが分かっています。従って、人間の脳はドーパミンが分泌された時、どんな行動をとったか克明に記憶し、ことあるごとにその快感を再現しようとします。そして、もっと効率的にドーパミンを分泌させるため、つまり快感を得る為に、脳内では神経細胞ニューロン)が繋ぎ変わり、新しいシナプス(神経回路網)が生まれます。その為、快感を生み出す行動が次第に癖になり、二回、三回と繰り返し続けていく度に、その行動が上達していく。これが『学習』のメカニズムです。試行錯誤を経ることで脳内に強固なシナプスが形成され、やがて一つの行動に練達していきます。これを『強化学習』といいます。このサイクルを回すことが極意の第一です」学習で脳に快感を。