選挙で開票率が0%、もしくは開票がはじまって間もないのに当確が出る理由は、統計的なデータを元に当確を算出しているためです。
各局は、出口調査により、選挙が終わり投票所から出てきた人に無作為でアンケートを取り、何人がどの候補者に投票を行ったのか?のデータのサンプルを収集します。
このサンプルを元に計算が行われ、その精度は多くの人が考えるものより高いものになります。
お味噌汁のたとえ~一口味見をすれば当確がわかる~
なぜ、選挙で開票率が0%なのに当確が出るのか?をわかりやすく説明するために、よく使わられる例えに「お味噌汁の味見」の話があります。
数学者の秋山仁先生に「開票5%で当確がでるのがおかしい」といったところ、秋山先生が「それが統計学ですよ。少ないサンプルで全体を見る。これが統計学です」とおっしゃる。
「でも先生、そんなこといっても5 %ですよ」
「じゃああなたね、大きな鍋一杯にみそ汁作って、味見するとき、どんぶりばち一杯に入れてぐーって全部飲む?」
「・・・小皿ですよね。」
「それが5 %よ。」
立川志の輔さんの落語のマクラということなのですが、ようは、一すくいの味噌汁からなべ全体の味が予想できるように、無作為に取り出したデータがあれば、すのサンプル数が全体のほんの一部でも、全体の姿を予測することができる、ということです。
実際には、地域ごとに強い政党の色があることや、支持組織の存在がある故に単純に出口調査をすれば良い、というものではないのですが、大枠の理論としてはこの考えが「なぜ、選挙で開票率が0%なのに当確が出るのか?」への答えになります。
選挙で開票率0%の状況で当確を算出するのに必要なデータ数
必要なサンプル数の考え方の詳細はこちらの記事で解説をしています。
数時感としては次の図表のようになります(白いエリアが必要なサンプル数)。
許容誤差5%、信頼度95%で設定するならば、約400のサンプルがあれば統計的には事足りることがわかります。
用語の意味は次の通りです。
許容誤差:母集団からどの位のズレがあるのかの可能性を示す指標
例えば、許容誤差5%の設定で、ある事象への好感度が70%だとした場合、その「ある事象への好感度」は「65%~75%」ということになります。
ようは、アンケートからえられた結果が「どれだけ実態からかけ離れているか」を示します。
アンケートの目的にもよるのですが、通常は許容誤差5%が設定されます。
信頼度:えられたサンプルが、どれくらいの確率で許容誤差内の結果におさまるのかを示す指標
例えば、信頼度95%の設定で、回答者数が100人、上記の許容誤差5%、ある事象への好感度が70%の場合、「100人中95人」は「ある事象への好感度が65%~75%」ということになります。
アンケートの目的にもよるのですが、通常は信頼度95%が設定されます。
なお、信頼度は許容誤差以上に、必要なサンプル数に与える影響度(感度)が大きいので、無理に高めようとする場合には、よく検討が必要です。
統計を親しんでいる人にすれば当たり前の話なのですが、多くの人にとって見ればわかりにくい考えでしょう。
お味噌汁のたとえなら、感覚的にこの統計の話が理解できるはずです。
なお、味噌が固まっていて十分に混ざっていない場合はどう考えるの?という話が、正に統計のだいご味で、「よくかき混ぜる」ステップが必要です。
一定の誤差も考慮した上で無作為にサンプルを抽出する、という部分ですね。
コメント