たにちゅーの思惑 « 谷口忠大HomePage (たにちゅーのＨＰ)

Ａ．まず大雑把に言えば，強化学習とニューロ動的計画法(Neuro-Dynamic Programming)は同義です．「強化学習」という名称は心理学から来ており(心理学者がこの用語そのものを使うことは稀ですが)，サイバネティクスの初期に遡ります．例えば， Marvin Minsky は彼の 1954 年の論文でこの語を用い，また Barto と Sutton は1980年代の初めにこれを甦らせました．「ニューロ動的計画法」の名称は，この分野をニューラルネットワークと動的計画法の組合せとしてとらえるために，1996 年に Bertsekas と Tsitsiklis によって作られました．

実際にはどちらもあまりこのテーマをよく表しているわけではなく，技術的に正確を期する場合にはどちらも使わないことをおすすめします．このような名前は研究の一般的な主部を参照する場合には便利ですが，概念を注意深く他の概念と区別するのには向きません．その意味では，これらの 2 つの名称が指すものを注意深く区別しようとするのは無駄なことです．

「強化学習」という用語が問題なのは，それが時代遅れだということです．強化学習のほとんど分野は学習には全く関わりはなく，単に問題に対する完全な知識(環境のモデル)からのプランニングに関わりがあるだけです．プランニングと学習に対してほとんど同じ方法が使われていて，この分野の名前で「学習」を強調しているのは的外れのように見えます．「強化」の語もまた，特に適切であるとは思えません．

「ニューロ動的計画法」の名前も同様に問題であるのは，ニューラルネットワークも動的計画法もこの分野にとって重要ではないという点です．モンテカルロ法やロールアウト法といった多くの方法は動的計画法とは全く関係なく，ニューラルネットワークは多くの関数近似方法のうちの一つの選択肢にすぎません．さらに，要素の名前である「ニューラルネットワーク」や「動的計画法」自体が，それぞれの方法をあまりよく表していないとも言えます．

source: http://nao.s164.xrea.com/RL-FAQ-j.html#Who%20invented%20RL
－－－－－－－－－－－－－

言わんとするところはよくわかるが

じゃあ，なんと呼べと・・・・

ポスター発表修了＠ICDL05

2006-06-02 (fri)｜カテゴリー：

TV・映画

｜コメント：3

初のポスター発表＠英語が終わりました．

多分冷静に聞けば，英語はぐちゃぐちゃだったとおもうけど，そこそこ話す事は

出来たと思う．

優良可で可やね

まあ，かなり「これでPhD（博士）とは片腹いたいわ！！」ってかんじですけど

リアルタイムでインタラクションすることの大切さを知らされました．

やっぱり，英会話は面と向かって数人で話す機会が無いとタフさは得られないなぁ．

英会話学校のセッティングされた”優しい”環境では鍛えられる能力に限界が・・・・．

強化学習の第一人者の一人

2006-06-02 (fri)｜カテゴリー：

日記

｜コメント：2

おお！学会会場でAndrew Barto発見！

これで興奮してくれる人が何人ブログをみていてくれるのだろう？

ちなみにCog projectのScasselati(綴りあってるかな？)とかKismetのBrazeelもいます．

実際問題，英語がききとれないんすね．

2006-06-01 (thu)｜カテゴリー：

日記

｜コメント：0

ヘギャ！

いきなり弱音ですんません．

でも，まあ，英会話学校（イーオン）とは違いますわ．

情け容赦ない早口に，滑舌の悪い人もいて，さらに単語と単語を繋げるの当たり前．

しかも状況はリアルタイムで動いているから，頭で日本語にしてたら間に合わない．

というわけで，慣れるのに数日かかりそうです．

日本と時差が１３時間（サマータイム含む）あるので，今早朝なんですが，

今日は初めての英語でのポスターセッションもあるので，どうにかこうにか頑張りたいと思います．

アメリカ入国！めんどくさい！

2006-05-31 (wed)｜カテゴリー：

日記

｜コメント：6

本日・・・つってもなんて長い一日・・・．

8時半にヤサカタクシーの関空行きのシャトルに迎えてもらって関空へ．

名神工事のため，奈良に迂回で到達．

飛行機にのってしゅっぱーつ．・・・・１３時間．

ぐへー

で，アメリカ入国！

テロ対策か，なんかしらんが，チェック厳しすぎ！！
そして，処理が遅すぎ！！！！

入国審査通のに４０分以上待たされる．
左右の指紋採られて顔写真取られて，めっちゃ引っかかる金属探知機みたいなんにとおらされて
荷物も再チェック．

うーん．そこまで安全に気を遣うなら，その前に銃所持を禁止してくれ．

そして，ぴょーんとインディアナポリスへ．

さらにシャトルバスに乗り換えて，どいなかBloomingtonに到着．

これは，他に遊びようの無い場所にきてしまった・・・・・・・．
英会話の武者修行だとおもってがんばってきますわ．

しかし，初日から日本人の知り合いと合流しまくってしまった為に・・．日本語に逃げてしまいそうな予感・・・

明日から旅立つのデツ

2006-05-29 (mon)｜カテゴリー：

日記

｜コメント：0

明日から，１０日ほど日本を離れ，アメリカの内陸，インディアナ州のBloomingtonという，
「地球の歩き方」にも載っていない街にカンファレンスで出張して参ります．

アメリカは大学二年の時に行って以来の気がする．

今回は英語でのポスター発表もあり，果たして英語が通じるのか不安ですが，
まあ，向こうでもネットがつながるらしいので，また，実況いたしますわ．

むふふふ～

結婚1周年記念日～

2006-05-28 (sun)｜カテゴリー：

日記

｜コメント：2

ちゅーわけです．

とりあえず，一年経って，子供も生まれて，引っ越しもして，学位も取って，
まあ，いろいろ有った一年でございました．

今は子供を数時間もほっとけない状況で，特段どっかにいける状況ではないんですが，
嫁さんのお母さんに子供をちょっと見ててもらって，ランチにだけ行ってきました．

ちょっと奮発気味のランチを食ってきたのです．

いやー，一年ってホントはやいもんですねぇ．

千客万来☆

2006-05-27 (sat)｜カテゴリー：

日記

｜コメント：2

今日は兄夫妻，某Yカップル，それと大学時代の研究室の友達夫妻といっぱいの
人がハル君を見にやってきてくれました．

ハル君は昼で「くて～」っとねてしまってましたが，みんなの視線を集めてました．

特に某Y氏はハルタカが名前を一文字頂いていることもあり，

「他人のようなきがしねぇ！」

と，興奮されてました．

いやー．なんて，スバラシイことであるかな．

ここをご覧の皆さん（知り合いに限る）も是非，また，遊びに来てくださいね．

マンションの管理組合の総会っつーもの

2006-05-26 (fri)｜カテゴリー：

日記

｜コメント：0

に，初めて出席した．

前住んでたところは完全に賃貸だったので，総会なんてなかったけど，今度の所は
基本分譲なので，総会があるのです．

５０世帯の内，出席していたのは10人くらいだったけど，管理会社の人相手に
喧々囂々！

共同生活って，なかなかハードみたいやねえ．

みんなの顔が見えたらもっと上手くできるのかもしれないけど，
マンションってお互いがかなり遮断されていて，それなのに利害を共有しないといけない
って・・・・．難しい・・・．

僕は初めての参加で，ただ座っていただけだったけど，いろいろお勉強になりました．
ちりーん

Page 97 of 113 « First ... « 95 96 97 98 99 » ... Last »

たにちゅーの思惑｜谷口忠大Home Page（たにちゅー・どっと・こむ）

たにちゅーの思惑｜谷口忠大Home Page（たにちゅー・どっと・こむ）

たにちゅーの思惑｜谷口忠大Home Page（たにちゅー・どっと・こむ）

たにちゅーの思惑｜谷口忠大Home Page（たにちゅー・どっと・こむ）

たにちゅーの思惑｜谷口忠大Home Page（たにちゅー・どっと・こむ）

たにちゅーの思惑｜谷口忠大Home Page（たにちゅー・どっと・こむ）

たにちゅーの思惑｜谷口忠大Home Page（たにちゅー・どっと・こむ）

たにちゅーの思惑｜谷口忠大Home Page（たにちゅー・どっと・こむ）

たにちゅーの思惑｜谷口忠大Home Page（たにちゅー・どっと・こむ）

たにちゅーの思惑｜谷口忠大Home Page（たにちゅー・どっと・こむ）

新着記事

最近のコメント

学会最終日

「強化学習」：Suttonがネーミングを滅多斬り

Ｑ．強化学習はニューロ動的計画法とどのように関係がありますか?

ポスター発表修了＠ICDL05

強化学習の第一人者の一人

実際問題，英語がききとれないんすね．

アメリカ入国！めんどくさい！

明日から旅立つのデツ

結婚1周年記念日～

千客万来☆

マンションの管理組合の総会っつーもの

たにちゅーの思惑｜谷口忠大Home Page（たにちゅー・どっと・こむ）

たにちゅーの思惑｜谷口忠大Home Page（たにちゅー・どっと・こむ）

たにちゅーの思惑｜谷口忠大Home Page（たにちゅー・どっと・こむ）

たにちゅーの思惑｜谷口忠大Home Page（たにちゅー・どっと・こむ）

たにちゅーの思惑｜谷口忠大Home Page（たにちゅー・どっと・こむ）

たにちゅーの思惑｜谷口忠大Home Page（たにちゅー・どっと・こむ）

たにちゅーの思惑｜谷口忠大Home Page（たにちゅー・どっと・こむ）

たにちゅーの思惑｜谷口忠大Home Page（たにちゅー・どっと・こむ）

たにちゅーの思惑｜谷口忠大Home Page（たにちゅー・どっと・こむ）

たにちゅーの思惑｜谷口忠大Home Page（たにちゅー・どっと・こむ）

新着記事

最近のコメント

Ｑ．強化学習 はニューロ動的計画法とどのように関係がありますか?

Ｑ．強化学習はニューロ動的計画法とどのように関係がありますか?