2.環境変化に対して汎化性を持つ行為概念の累増的獲得
人間-社会ロボットの有意味な持続的コミュニケーション実現のためにはロボット自身が相互作用を通じて行動多様性を持つ事が重要である.
私たちは上記の 対象・環境概念についての知覚シェマのみならず,行為概念である行為シェマを自律ロボットが適応的に獲得するための手法を提案した.
まず,行為シェマを強 化学習を通じて獲得する手法として双シェマモデルベースの強化学習を提案した.
獲得された行為シェマは環境変化に対して高い汎化性を示し,汎化行為概念と して作動する事が確かめられた.
次に,これを知覚シェマ同様に概念分化を通して累増的に獲得するための手法として強化学習シェマモデルを提案した.
自律ロ ボットは環境との相互作用に基づく学習の中で養育者(caregiver)の設計する報酬を通して評価を受けるが,この報酬が変化したとき通常の強化学習 ではそれらを渾然一体として認識するために新たな行為で古い行為概念は上書きされてしまう.本手法により,自律ロボットはその違いに自律的に気づくことが 出来,自律ロボットが行動多様性を獲得していくことが出来るようになる(図4).
本手法は,社会ロボットが人間との自然な相互作用を通して発達する為の一 つの基盤技術となるとともに,従来の学習理論が扱ってこなかった,生物の行為多様性を獲得する記憶システムについての計算論的モデルとなっていると考えら れる.本研究について,計測自動制御学会より学術奨励賞を授与された.
関係する論文
- 谷口 忠大, 椹木 哲夫:
“報酬設計を通した社会的相互作用による行為概念群の構築:シェマ理論に基づいた累増的強化学習 ”
知能と情報(日本知能情報ファジィ学会誌), Vol.18 (4), .(2006) - 谷口 忠大, 椹木 哲夫:
“汎化行為概念の適応的獲得 —双シェマモデルベースの強化学習—”
計測自動制御学会論文集, Vol.42 (3), .(2006)