1. PHPオンライン
  2. 仕事
  3. アクチュアリー・統計実務家の思考法「PPDAC」とは?

仕事

アクチュアリー・統計実務家の思考法「PPDAC」とは?

藤澤陽介(アクチュアリー)

2014年02月05日 公開 2018年06月26日 更新

不確実性を味方にする

 ここで、未成年者からどのようにして真のデータを引き出すのかという点について、補足したい。

 たとえば、調査員が高校に行って高校生から喫煙行動をヒアリングする形式でデータを集める場合を考える。ヒアリングを行なう際に、個々の高校生に対して、調査結果は高校の先生や両親には秘密にすると断ったうえでヒアリングを行なうものとする。喫煙を行なっている高校生は、この問いに本当に正直に答えるだろうか?

 単なるヒアリングでは、喫煙を行なっていないとウソをつく学生が出てくることが想像される。統計の世界では、このように一定の方向に情報が歪むことを「バイアス」と呼ぶ。いろんな要因でデータには「バイアス」が含まれることがある。この例で言うと、高校生は正直に答えるインセンティブがない。逆に、高校の先生や両親に秘密にするという約束が破られるリスクがある。このようにリスクとリターンを加味した賢明(?)な学生は、ヒアリングに対してウソをつくかもしれない。

 このような可能性を事前に想定し、対策を検討することもPlanのフェーズで求められる。たとえば、次のような不確実性を混ぜることで、データの「バイアス」を減らすことができる。

 調査員は、200個のくじを用意する。180個のくじには「あなたは喫煙をしていますか」(「真実のくじ」と呼ぶ)と書かれており、20個のくじには「喫煙をしていると答えてください」(「ウソのくじ」と呼ぶ)と書かれている。調査員は、高校生がどのくじを引いたのかは分からないものとする。したがって、調査員は、高校生が喫煙していると答えたとしても、「真実のくじ」を引いて言っているのか、「ウソのくじ」を引いて言っているのか分からないので、「真実のくじ」を引いた喫煙者も安心して正直に答えることができる。高校生にとってのリスクが減るので、リスクとリターンがニュートラルな状態でヒアリングを行なうことができる。これが、「バイアス」を減らすマジックだ。

 このような場合においても、喫煙者割合を計算することは可能だ。再び図表1-5を用いる。くじを導入した場合の喫煙行動を表すデータが図表1-5であったものとする。

 図表1-5の喫煙者は59人であるが、この中には、「喫煙をしていると答えてください」という「ウソのくじ」を引いた人も含まれる。数式で表すと次のように表現できる。

 「真実のくじ」を引いた人×喫煙者割合+「ウソのくじ」を引いた人=59

 ここで、「真実のくじ」を引いた人は180人、「ウソのくじ」を引いた人は20人なので、

 180人×喫煙者割合十20人=59

となり、喫煙者の割合は0.217となる。このようにして、個々の高校生のプライバシーを保護した状態で、知りたい情報を取り出すことができる。

 最後に、この場合のConclusion(結論)は、0.217±不確実性であるが、先ほどのサンプル・データは200人であったのに対し、くじを用いた場合のサンプル・データは180人と20人少ない。サンプルの数が少ないと、不確実性は大きくなる。したがって、Plan(計画)の段階で、このような影響も把握したうえで、サンプル数およびくじの数を考える必要がある。
 

<書籍紹介>

すべては統計にまかせなさい

藤澤陽介 著

不確実性に満ち溢れた世界。統計的思考を武器に、リスク社会に挑戦しよう。ライフネット生命に所属する年金数理人、渾身の一冊。

<著者紹介>

藤澤陽介(ふじさわ・ようすけ)
1977年、大分県生まれ。アクチュアリー。九州大学理学部数学科卒、ウォータールー大学数学部統計・アクチュアリー修士課程修了。日本アクチュアリー会正会員(理事長賞受賞)。年金数理人。Chartered Enterprise Risk Actuary(CERA)取得。住友信託銀行での企業年金に関する数理計算・制度設計業務などを経て、現在、ライフネット生命、リスク管理部部長。アクチュアリー受験生を支援するボランティア団体「アクチュアリー受験研究会」の会長として、学生・社会人向けの勉強会を企画。2012年より、大阪大学金融・保険教育研究センターの非常勤講師を務める。(所属、肩書きは執筆当時のものです)

関連記事

アクセスランキングRanking