たにちゅーの思惑|谷口忠大Home Page(たにちゅー・どっと・こむ)

たにちゅーの思惑|谷口忠大Home Page(たにちゅー・どっと・こむ)

HOME  > たにちゅー思惑 > 日記

恋に落ちたら~

2005-06-09 (thu)|カテゴリー:コメント:3

草薙君ドラマです。

毎週見てます。

それにしても、急転直下な展開だこと・・・。



もともと、ホリエモン事件があるまえは、草薙君が冷酷な人間からスタートして

だんだん、やわらかくなっていくはずだったのが、



やわらかいところからスタートして金の亡者になって、そっから没落して

またやわらかくなって、挽回するという、ひじょうに面倒なながれになってしまったよう・・・。



へへへ。



ヒロインのカオリさんやくの女優さんが好きです。名前忘れたけど。

ASK.jpのCMにもでてるひと。

Q学習おそるるにたらず・・・・。

2005-06-09 (thu)|カテゴリー:コメント:0

珍しく研究ネタです。



今日、離散空間、いわゆるGrid空間でのQ学習をプログラムしてみた。

今書いてる論文の簡単な例題として使うつもりだったんだけど。



いままで、強化学習は連続空間でしかやったことがないという、変わり者の

ワタクシ。



ヨノナカでは一番、このGrid空間って奴がやられてるんですが、

実際、プログラムしてみると

「めっちゃ簡単。」



連続空間で問題になるような学習における汎化性の問題なんて、しったこっちゃない

って感じで計算が収束していく・・・。



一日で、まとまった結果が出せてしまいました。あーこりゃこりゃ。



近々Q学習の連続空間への拡張をやるんだけど、まあ、その前哨戦といったところでしょうか?



ちなみに、elgibility traceを導入すると、ほとんど報酬分配の効果のないQ(λ)以外では

Q学習の本質的利点である、方策非依存性が消えてしまうことが発覚。 あー、そらそうか・・・・。

その辺の証明はわかってないので、上手く与える方法があるかもしれないけど、

ちょっと勉強セナならんなあ・・・。

よくやった大黒!!

2005-06-09 (thu)|カテゴリー:コメント:2


日本対北朝鮮

前半は、ボールがとまりまくって、熟孝×パスまわし という、悪いときの
日本らしいサッカーでした。
「大黒だろ、大黒~」
いつもなら、中村・中田・小野あたりがクリエイティブにパスを裁いてチャンスを作るんでしょーが居ない。
稲本がその役をやる司令塔として動いてたんだけど、それがボールを止める止める~。

うぬー!フラストレーション。
北朝鮮が鉄壁だったのはわかるけど・・・。

とにかく前線で一対一とかでプレッシャーをかける必要があろう!
サントスがおったらサイドで一対一で穿り回したりするんだろうけど、それも出れないし。

ここは、ハングリーかつゴールに対する意識が強い大黒だすしかないでしょ、
前回の経験で北朝鮮もイヤだろうし!!

・・・と、おもったら後半から大黒投入~。
よーし!!

案の定、ぶっちょうずらで走り回る大黒。
早いし、冷静だし、しつこいし。サイコー。

一点目柳沢、二点目をラストで大黒。

途中、北朝鮮が攻めに転じてきたのに、日本が戻りが遅い時間帯が
ちょっとこわかったけど、ワールドカップ出場決定だーーー!

大黒かっこええわああ。
最近、代表一番のお気に入りかも。
あと、お気に入りは中沢です。んで、俊輔かな。

じゃ、そいうことで。
せっかくなら一位つうかしませう。

インフォメーション



tanichuの著作

copyright © Tadahiro Taniguchi All Right Reserved.