273 入門 独立成分分析
東京電機大学出版局
売り上げランキング: 170812
独立成分分析は,結構新しい信号処理の手法だ.
応用としては,音源分離,つまり, 録音した情報から Aさんの発言とBさんの発言を分離することが出来たりする.
複数の信号が重ね合わさっていたときに,その二つの信号が「独立」である とかんがえれば
分離した結果の 「独立でない」っぷりが最小化されるように 分離する為の関数を最適化すれば良いのだ.
独立性というのは 純粋に確率論的な概念で
p(a,b) = p(a)p(b)
として書ける.
つまり,a, b のサイコロを別々に振っても同時に振っても確率はかわらんということだ
一番ベーシックな独立成分分析の やりかたは
「独立でない」っぷり = p(a,b) と p(a)p(b) の間の距離
という訳で確率分布間の距離を測るときの スタンダード
KL擬距離 = カルバックライブラー・ダイバージェンス
を用いて I (p(a,b), p(a)p(b) )
を最小化する 変換 を求めるってはなしになる.
詳しくは本書で.
本書は入門とあるが,
もう一冊の
東京電機大学出版局
売り上げランキング: 194318
ICAの全容が分かる本
概説的位置づけにあるようだ.
こちらの本は非常に評価が高いが, なにぶん,分厚さが 二倍強あるので
骨が折れるかもしれない.
人によりけりだが,僕は赤い入門の方でも 大体のポイントは分かったので
こちらの入門も悪くないと思う.
むしろ,前提知識があるヒトは 赤本でも 大体わかって,
無い人は 青本で腰を据えろ ということになるのかも・・・・・・.
主成分分析(PCA)との絡みが 「なるほどなぁ」と思わされた.
個人的にシンプルな数学的仮定が好きな事もあって,
なんでも多次元正規分布を仮定する傾向がある.
しかし,じつは多次元正規分布という土俵で考えている以上,
ガウス分布の再生性というスバラシイものがあるので,
PCAで事足りてしまうように錯覚するんですね.
独立成分分析は「実際の信号は正規分布じゃねーよ」という実問題に
立脚しながら,だからこそ行うべき変換を提示するのだ.
概念として
無相関 ≠ 独立
という事が,主成分分析と独立成分分析の間のポイントとなるんでしょうか.
独立成分分析も いろんな応用が考えられる.
まだまだ,来るんじゃないかなぁ
・映像データ
・経済指標データ
・ゲノム情報
・ロボットの得るセンサデータ
などなど,経営的にもPOSデータとかに対して,上手く応用できたりしたら
消費者行動分析とかに利用出来るかもね.
もう,パッケージ,ライブラリは R とかでも出回っているので
試してみることも一日あれば出来ると思われ・・.
しかし,主成分分析は 固有値問題で一意にエイってとけるんだけど,
独立成分分析は勾配とかで求めないといけないのがな~.
なんか,エレガントな解法とか無いのかなぁ.
bigarrow 2009-12-07 (mon)
懐かしい…
4回生のころのラボが信号処理で教授がその筋の権威やったんで、ゼミではこればっかでした。テキストが英語だったのですが、むしろそのほうが理解しやすかったとおもいます。
こういう専門書は日本語で探すとなかなか相性がよくなかったりするとゲンナリですからね・・・
ちなみにそこの卒論は(同期のやつが)カクテルパーティ効果やってました。
たにちゅー 2009-12-09 (wed)
おおう.
そうだったのか・・・
と言うことは,おおやさんも
その筋の研究いけるってことね.
bigarrow 2010-01-05 (tue)
面白いとは思いましたが能力と努力<こっちの方が大きい;
が足りませんでした(汗
7年前のことなのにだいぶ忘れている自分が情けないっす