内閣支持率はウソの数字!? 統計学が教える「騙されないデータの読み方」
2020年11月05日 公開 2024年12月16日 更新
ビッグデータ、データサイエンス、データドリブン経営など、最近のビジネス界隈では、なにかにつけて「データ」という言葉がついてまわる。そのときしばしば一緒に姿を現すのが、「統計学」だ。
数学に苦手意識のある文系人間からすると難しく感じる統計学だが、理解できればビジネスで相当な武器になり疎ければダマされてしまう恐れもあると指摘するのが、『データ分析の先生!文系の私に超わかりやすく統計学を教えてください!』(かんき出版)の著者である高橋信氏だ。それはなぜか、また、ダマされないためにはどうするべきかを聞いた。
「内閣支持率」は嘘の数字!?
菅内閣の発足から1か月ほどが経過しました。パンケーキや携帯電話料金の値下げ、日本学術会議の任命についてなどいろいろありますが、ともかく、今後の内閣支持率の推移が気になるところです。
さて、ご存じでしたか。実は主要メディアが報道している内閣支持率の値って、嘘なのです。
たとえばNHKの調査による2020年10月分の内閣支持率は、55%でした。私は、この値が嘘だと断言できます。なぜならNHKは、内閣を支持するかどうか、有権者である私(47歳です)に聞いていないからです。おそらくNHKは、10月どころか人生で1度も、みなさんのうちの大多数にも聞いていないはずです。
というわけで、NHK による55%という値は、嘘です。ただし、嘘ではあるものの、決してデタラメではありません。
統計学では、調査対象者全員からなる集団を「母集団」と言います。内閣支持率の例で言うと、有権者全員です。もしNHKが真の内閣支持率を本気で知りたいなら、有権者全員に聞かなければいけません。
ですが、夥しい人数からなる有権者全員に「いまの内閣を支持しますか?」と質問して回答を得るのは、言うまでもなく、不可能です。ではNHKはどうしているかと言うと、母集団から何人かを選び出してきて、その人たちにおける内閣支持率を調べているのです。
この、選び出された人々からなる集団を、統計学では「標本」と言います。ちなみに統計学では、選び出すことを「選出」ではなく「抽出」と言います。
そもそも統計学とは?
ところで、そもそも統計学はどういう学問なのか。統計学とは、標本のデータから母集団の状況を推論する学問です。
つまり統計学では、母集団から偏りなく抽出された標本における内閣支持率が▲%であったなら、「母集団の内閣支持率も▲%くらいであろう」と推論するのです。
気をつけるべきは、「母集団の内閣支持率も▲%くらいであろう」という推論が成立するためには、母集団から標本が偏りなく抽出されていなければならないことです。
それはつまり、標本が「W新聞の読者だけ」とか「80歳以上の人だけ」とか「年収250万円未満の人だけ」とかからなるのは不適切であることを意味します。