ノンパラメトリックな政治家とパラメトリックな専門家
情報の表現において,ちょっとおもいついたこと.
本コラムは,まったくの,僕の妄想であり,別に論証されたことではございませんので
ご注意ください.
なぜ,政治家は「誰々と酒を飲んで,話を聞いて共感した!」みたいな発話が多いのか?
その一因かもしれないことを機械学習屋さん(?)っぽく考えてみた結果.
データを予測したり説明したりするのに,パラメトリックな方法とノンパラメトリックな方法がある.
パラメトリックな方法では属性値(説明変数)を用いて説明する.
つまり,学問能力の例をいえば,各科目の得点という軸をとり
田中くんは
国語90点 算数30点 理科69点
といったような感じだ.
大体,有限個の軸をもって表現する.
田中くんを t とすると
t=(90,30,69)
というベクトルで表現するといってもいいだろう.
ノンパラメトリック とは,観測されたデータとの関係性で表現するアプローチ.
すべてのノンパラメトリックがそうではないが,例えば
田中君と鈴木君と山田君 が居た場合に 前田君は
「田中君 0.5 :鈴木君0.2 :山田君0.3 の割合で混ぜた感じ」
とでも言えば,ノンパラメトリックな表現と言えるだろう.
実際には,田中君 t ,鈴木君 s,山田君 yの得点をパラメトリックに表現した上で,
前田くん m = 0.5*t + 0.2*s + 0.3*y
とかければ,まぁ,この言明もあっているだろう.
さて,多くの人は,どうも属性値の方が「隠れた実在」だと考えてしまう,ことがあるが,
実際にはそうでもない.
各インスタンスである山田君たち と 科目の間には双対な関係がある.
田中くんは国語が得意な学生
ともいえるが
国語は田中くんが得意な科目
とも言える.
データとパラメータはお互いがお互いをrepresent する関係にあるのだ.
さて,ここで,与えられたデータ群で新しい事象を どう表現すべきかを考えよう.
サンプル数(学生の数)をNとする,また属性数(科目の数)をDとする.
このとき,
ざくっといえば
N>D なら パラメトリックに表現したほうが すっきり整理できる.
「100万人の学生の特性をそれぞれ 10科目の得点で説明できたら便利だよね!」
一方で 科目の方が学生より多いような場合
D>N
なら,新しいデータは
データの方をつかってノンパラメトリックに表現した方が情報表現としては
効率的で有利だ.
「100万人の学生のそれぞれ全員と,どれくらい似てるかを
新しい転校生の説明につかってたら,まったく時間が足りないよね!
10科目の得点で説明できたほうが便利!」
はてさて,
これは,僕らも脳の中で日常の経験を 効率的に情報表現する場合にも
やっていることだとおもう.
「誰々は,こういう特徴をもっている」
として情報整理を行うやり方と
「誰々と誰々は似ている」
という情報整理を行うやり方だろう.
で,政治の話なんですが,
日本の政治家は政策論を議論せずに,政局ばかりに明け暮れるとマスメディアさん はいう.
で,よく
「私は小沢さんの考え方には共感する!」
のような人名を用いた言説が多く,それが ある種 政策論的ではなく,政治家の人間関係
政局に根ざしたクレバーでない発言のようにとらえられていることがあるとおもう.
僕も,「なんで人間関係の話に落ちてしまうんだ.もっと具体的な政策論を語ろうよ」
ということを思ったりしていたのだが,
ノンパラメトリックな情報表現と パラメトリックな情報表現がこれに対するひとつの理解を
与えてくれるきがした.
一国の扱う実世界の政策に関わる情報は非常に多い.無限と言っていい(隠れた属性軸無限).
その一方で,有力な政治家の数は多くない.(観測データ有限)
となれば,政策についての言説で軸を作って情報表現するよりも,人物中心の軸で情報表現するほうが
効率的なのではないだろうか?
故に,ノンパラメトリックな表現として, 政治家の人名や,それに対して,支持する,共感するといった
立場の距離に関する言明が現れるように思う.
一方で専門家は自分の関心領域を限定する.
経済学者であれ,政治学者であれ,工学者であれ,語る内容は世界の断面であり限定的である.
だからこそ,隠れた属性軸を限定することが出来る.
故に,人名ベースの言説ではなく,専門用語及び,それらに該当する概念を軸にした言説が増えるようにおもう.
でも,それは議論する領域を限定しているからこそ可能なのではないだろうか?
こういう専門家が政治の世界に飛び込んで,専門用語を駆使しまくっても
うまく泳げるとは思えない.
というわけで,
日頃,政治家が人の名前ばかりだして政局の議論をするのは,実は
我々が脳内に情報表現する際に,ノンパラメトリックにしたほうが効率的か,パラメトリックにしたほうが効率的か
という認知科学的な,計算論的な事情によっているのではないか?
と考えて,納得した.
これなら,なんとなく,政局に明け暮れていると報道される政治家の皆様の行動に対して
変な怒りを覚えずにすむ.
むしろ,そこで現れる言説のパターンは,情報理論的に考えて,至って自然で効率的な結果なのである.
なお,おまけの考察として
学問分野でも,工学系などでは,議論する内容の可能性が非常に広く軸を作りにくい場合がある
こういう分野では「〇〇先生のような研究をしています」というような言説が通る場合がおおい.
実際,また先行研究を整理する場合でも.キーワードベースでやるよりも著者ベースでやったほうが
勉強の助けになる場合がある.これも,関係しているかと思う.
ちなみに,
ここで話している内容は.カーネル法の文脈で思いついた話です.
とりとめもなく,校正もなく,ポスト・・・
もちろん,これだけが理由ではないですがねー.