0161 強くなるロボティック・ゲームプレイヤーの作り方 実践で学ぶ強化学習
2008-11-07 (fri)|カテゴリー:|
強くなるロボティック・ゲームプレイヤーの作り方 ~実践で学ぶ強化学習~
posted with amazlet at 08.11.07
八谷 大岳 杉山 将
毎日コミュニケーションズ
売り上げランキング: 88770
毎日コミュニケーションズ
売り上げランキング: 88770
強化学習の本はR.Suttonの書いた「強化学習」いわゆる青本しか,よい教科書がなく,また,その翻訳がイマイチの為に,
学生が勉強する良い教科書がないという状況があって,こまっていた.
本書は,理論的な積み重ねを逐一追う類の本では無いが,強化学習のここ20年のトピックから,センス良く,手法を選び紹介して,
さらにその適用事例までのせている.
驚いたのは,NAC(Natural Actor-Critic)まで紹介していた点.
NACは最近研究が盛んで僕も注目している手法だが,まだ,こんなポップな入門書に載せるというのはちょっとした勇気がいることかと思う.
しかし,載せるべきものといえば載せるべきものだ.
そのほかに,最小自乗法を用いたQ値推定や,カーネル法によるQ値の表現など,教科書としてはかなり野心的.
これも,筆頭著者がネット企業を立ち上げた後に,博士課程にはいった学生だということも大きいだろう.
若さの力だ.
強化学習を学ぶ人間にオススメの一冊である.



![ビブリオバトル[知的書評合戦]](img/bn_biblio.jpg)
