些細な統計の話 ~「天使と悪魔」の宣伝広告
読売新聞に「天使と悪魔」の一面広告がでていた.
いっとき話題になった ダ・ヴィンチコードの続編みたいなかんじ?
よんでないけど
そこのキャッチに些細なツッコミをいれたくなったので,
しょうもないことやけどかいとく.
ダヴィンチコードの750万人の読者が損をしているらしい.
理由は ダヴィンチコードを1000万人が読んで,天使と悪魔を読んだ人が250万人で
天使と悪魔を読んだ人のウチあっとうてき多数(右の円グラフで82%)が天使と悪魔の方がおもしろいと言っているかららしい.
ゆえに,「天使と悪魔」の方が面白いから,750万人の読んでない人が損しているらしい.
ん?なんかロジックがおかしいぞ.
サンプリング調査で250万人のウチ
82%が「天使と悪魔」の方が面白いといって,18%が「ダ・ヴィンチコード」の方が面白いのだといったのなら
750万人中でも期待値的には18%はダ・ヴィンチコードが面白いというはず.
よって,損をしているのは 750×0.82 で 615万人 となる.
というわけで
「ダ・ヴィンチ・コード」615万部の読者が損をしています.
というのが修正稿.
こまけー.
と,おもうかもしれまへんが,ウチの学生達には分かってほしい理屈である.
一般的にも統計はたしなんでおかないけど,数字を使ったエセ論理でいっくらでもだまされます,今の時代.
まあ,今回の話は,正直 どっちでもいい んやけど
通りすがり 2009-04-03 (fri)
細かい話ですけど、
「ダヴィンチコード」と「天使と悪魔」を両方読んだ人たちの平均的嗜好と
「ダヴィンチコード」だけを読んだ人たちの平均的嗜好
というのは違う(「ダヴィンチコード」だけを読んだ人は「天使と悪魔」を知ってるけど興味がないから買わなかったかもしれない)と考えるのが自然ではないでしょうか。
嗜好が違うとするならば
>750万人中でも期待値的には18%はダ・ヴィンチコードが面白いというはず.
という推測は嗜好の違いを考慮していないので正しい数字ではなくなります。
このように、集団ごとにその性質が違うにもかかわらず、同一の性質として扱うことで統計数字上のずるをされてしまうことがあるので、こういったことには注意しないといけないと思います。
と、すこし気になったのでコメントさせていただきました。
たにちゅー 2009-04-03 (fri)
おお,通りすがり様!
(だれかわからないけど)
ご指摘ありがとうございます.
やはり,そのレベルから気付かれる方はちゃんとおられるのですね.
パチパチパチ!
ご指摘ごもっともです.
そこの指摘をすると,流石に 読者層から考えて,ツッコミ過ぎかなーと思って避けました.
もちろん,心理学実験とかだとそこの考慮は必要ですよね~.
まぁ,それを消すために実験条件をいろいろいじるんですが・・・.
スバラシイ
通りすがり様の御意見を反映することで,よりちゃんとした統計数字にちかづくのでした.
僕の指摘はあくまで,両統計がランダムサンプリングされているという仮定の上で,さらにダヴィンチコードの感想と天使と悪魔 の感想が独立であるという仮定に基づきます.
一般にはこの仮定は可能ではないので,通りすがりさんの指摘を考慮する必要があります.
ただ,それらの情報が無情報である状況を考えると,近似的には上記推論は悪くはない範囲だという感じです.
もっと,いろいろな指摘があるとおもしろいなぁ.