こんにちは!
【中学の数学からはじめる統計検定2級講座】を執筆している,とけたろうです!
本書は,一般の人に向けて「因果推論とは何か」を数式を使わずに解説した読み物です。「因果推論なんて私には関係ない!」って思いますか? いやいや,めちゃくちゃ関係あります。それは断言できます。例えば,TwitterなどのSNS,新聞やテレビによる報道など,因果関係がないのに因果関係があるように表現することで,誤った考え方が拡散されるのは日常茶飯事です。また,自分でも無意識のうちに相関を因果だと思い込んで誤った主張をしてしまうリスクもあり,現代に生きる私たちにとって因果推論は必須のリテラシーです。その意味で,本書は「すべての大人が読むべき教科書」だと言って良いでしょう。
「因果推論なんて難しそう…」と思うことなかれ。数式もほとんど登場しないので,多くの人にとって読みやすいはずです。著者である中室牧子さんと津川友介さんは,本書を「因果推論の入門の入門」と位置づけており,因果推論に入門したことのない人に読んでみてほしい一冊です。興味がわいたら,ぜひ本書を手にとってみてください。
本書を読んでわかること
本書が書かれた目的は,「はじめに」の中の次の一節から読みとることができそうです。
大学の授業で「因果推論」を学ぶアメリカでは,ビジネスや政策の現場はもちろんのこと,日常会話の中でも因果関係を意識した発言をする人が多い。一方,日本では因果推論を体系的に学ぶ機会はほとんどない。
このように,ビジネスや政策における意思決定では因果推論を理解しているかどうかは死活問題とも言えますが,日本ではその教育が不十分なまま「雰囲気での意思決定」が行われがちです。また,個人レベルでも因果関係を正しく捉えられると,通説にだまされたりする危険が減り,思い込みから自由になれることを,本書を読んで納得できるはずです。
本書は,因果推論の一般論をやみくもに展開するのではなく,読者が興味を持てるように「世間で信じられがちな通説」をいくつも取り上げ,それらを軸に話を展開しているところに特徴があります。その1つが「偏差値の高い大学に行けば収入が上がる」という通説です。確かに,偏差値の高い大学の卒業者の平均年収が高いというデータはありますが,それだけでは「偏差値の高い大学に行ったから収入が高くなった」とは言えないのです。なぜなら,「将来の収入が高くなるような潜在能力の高い人ほど偏差値の高い大学に行っている」という可能性もあるからです。本書には,こういった通説が経済学の有力な研究によって否定されていることが書かれています。
これらの通説と関連づけながら,第2〜7章でランダム化比較試験や疑似実験といった因果推論の代表的な技法を学ぶことができます。これらは,もちろん統計学と関わりのあるものなので,統計学の勉強をしている人なら,興味を持てることでしょう。
また,本書中に引用されている論文タイトルが巻末にまとめられているのもありがたいですね。実際に行われた研究に興味がわけば,巻末の情報をもとにインターネットで検索して,さらに深く学んでいくことが可能です。
では,次のセクションから,本書の内容を章ごとに紹介していきます。(第8章は短いので割愛)
第1章 根拠のない通説にだまされないために
この章は,本書全体の概論になっています。まずは,「因果推論とは何か」ということが大事になりますが,2つの変数のあいだの相関関係は次の2つに分けられると書かれています。
片方が原因となって,もう片方が結果として生じた場合,この2つのあいだには「因果関係」があるという。一方,片方につられてもう片方も変化しているように見えるものの,原因と結果の関係にない場合は「疑似相関」という。
そして,2つの変数のあいだの関係が因果関係なのかどうかを明らかにするのが因果推論です。因果関係であるかを見分けるポイントとして,次の3つが挙げられています。
- まったくの偶然ではないか
- 第3の変数は存在していないか
- 逆の因果関係は存在していないか
これらの詳しい説明は第1章をご覧ください。
また,因果関係の証明のためには,反事実というものが重要な役割を果たします。「Aが起きたからBが起きた」という因果を証明するには,「Aが起きなかった場合にはこうなっていた」という事実に反するシナリオ,つまり反事実が必要になるのです。しかし,事実は変えられないので,因果推論では,反事実に相当するデータを得るために様々な工夫をします。第2章以降では,章ごとにこの工夫が紹介されています。
第2章 メタボ健診を受けていれば長生きできるのか
因果関係の有無を調べるために最も確実な方法は,この章で説明されているランダム化比較試験を行うことです。この実験のわかりやすい例としては,新薬に効果があるのかどうかを調べるために,新薬を投与したグループ(介入群)と投与しなかったグループ(対照群)にランダムに患者を割り付けるものですね。対照群の結果を反事実として利用できることになります。
ランダム化比較試験は非常に強力で,この実験によって国の政策に本当に狙った通りの効果があるのかどうかを事前に検証するということも可能になります。その例として挙げられているのが,タイトルにあるメタボ健診です。巨費を投じてメタボ健診を全国的に実施する前に,その予算の数%を使って,健診を実施することに効果があるかどうかを実験によって明らかにせよ,と著者は主張しています。
実は,デンマークでは,すでにこのようなランダム化比較試験が実施されています。介入群に割り付けられた人は,保健指導によって生活習慣の改善などに取り組むので,対照群に割り付けられた人よりも長生きできそうに思えますが,ランダム化比較試験の結果,2つの群の間で死亡率に統計的に有意な差は見られなかったということです。
この章で挙げられているもう1つのランダム化比較試験の例は,医療費の自己負担割合と健康の間に因果関係があるかを調べるものです。かつてアメリカの6つの市では,自己負担割合が25%,50%,95%の介入群と,0%の対照群にランダムに市民を割り付けて大規模な実験が行われました。当然のことながら,自己負担割合が0%の対照群では受診回数が増え,1人あたり医療費が最も高くなり,自己負担割合が高くなるにつれて,1人あたり医療費が下がったのですが,驚くべきことに,一部の層を除いて,医療費の自己負担割合と健康の間には因果関係はないことが明らかになったことが紹介されています。
第3章 男性医師は女性医師より優れているのか
この章のテーマは,自然実験です。第2章のようなランダム化比較試験は一般的にエビデンスレベルが高いとされていますが,コストや倫理的な問題などにより,実行することが困難な場合も少なくありません。自然実験は,手元にあるデータだけで次のように因果関係を見出します。
ランダム化比較試験を用いて収集したデータのことを「実験データ」と呼ぶのに対して,このように日常的な経済活動の結果得られたデータや,政府の統計調査などから得られたデータを「観察データ」と呼ぶ。(中略)
この章で学ぶ「自然実験」は,法律や制度の変更,自然災害,紛争など,誰にも予想できなかった変化によって,あたかもランダム化比較試験を行ったかのような状況を見出すことで,2つの変数の因果関係を明らかにしようとする方法だ。
このように,はからずとも介入群と対照群に分かれてしまったことを利用するのです。そのような例として,アメリカの病院に入院した100万人以上の患者に,男性医師と女性医師がランダムに割り付けられる自然実験と同じような状況を見出し,男性医師が女性医師より優れていると一般的に考えられているのは本当なのかを検証した研究が紹介されています。結論としては,女性医師が担当した場合のほうが男性医師の場合よりも死亡率が有意に低かったそうです。
自然実験の例として,もう1つ挙げられているのが,赤ちゃんの出生時の体重とその後の健康の間に因果関係があるのかを調べた研究です。双子の赤ちゃんは,お母さんのお腹の中での栄養状態の違いにより,一方が相対的に重く,他方が軽くなることを自然実験とみなして,大きくなった後の健康だけでなく,成績や収入にも違いが出ることを明らかにしています。
第4章 認可保育所を増やせば母親は就業するのか
この章で紹介されている差の差分析は,次のような疑似実験の一種です。
この章から先は「疑似実験」を学んでいこう。実験を「まねる」ことから「疑似」実験と呼ばれる。つまり観察データと統計的な手法を用いて,あたかもランダム化比較試験を実施しているような状態を作り出そうというわけである。
例えば,ある店で12月に広告をだしたところ,売上が前年の12月から400万円増えたとします。そのときの売上の増加は本当に広告の効果だと言えるのでしょうか。もしかしたら,この店の1か月の売上は1年で400万円くらい増えるトレンドがあるのかもしれませんし,あるいは前年の売上がたまたま低かっただけで,平均への回帰によって翌年の売上が上がっただけなのかもしれません。差の差分析は,こういった効果を考慮して,因果関係を明らかにする手法です。
このような差の差分析を使った研究が2つ紹介されています。1つは,「認可保育所を増やせば母親の就業率は上がるのか」を調べたものです。日本の県別の保育所定員率と母親の就業率のデータを分析し,それらの間に因果関係はないという結論を導いています。
もう1つは,最低賃金を上げると雇用が減るのかを調べた研究です。アメリカの2つの州の境界をまたいでとなり合う2つの郡に着目し,一方の郡だけが最低賃金を上げたことを利用し,最低賃金の上昇が雇用率に与える影響を分析したところ,その因果関係を否定する結論が出たことが紹介されています。
第5章 テレビを見せると子どもの学力は下がるのか
この章のテーマである操作変数法は次のような操作変数を利用します。
操作変数とは「結果には直接影響を与えないが,原因に影響を与えることで,間接的に結果に影響を与える」ような第3の変数のことを指す。
この操作変数を利用した例として紹介されているのが,「テレビの視聴」と「学力」の間に因果関係があるかを調べた研究です。アメリカではある時期にテレビ放送免許が凍結されたことを利用して,「この時期にテレビを所有していたかどうか」を操作変数としています。この研究が明らかにしたのは,「テレビの視聴は学力にも宿題にかける時間にも悪影響を与えない」というもので,特に一定の条件を満たす家庭では「学力を高める効果すら確認できた」という驚くべきものでした。
操作変数を用いたもう1つの研究として,コロンビア大学が行った「母親の学歴と子どもの健康のあいだに因果関係はあるのか」というものが紹介されており,高学歴の親の子どもは生まれたときの健康状態が良くなるという因果関係が示されています。
第6章 勉強ができる友人と付き合うと学力は上がるのか
この章では,回帰不連続デザインを用いた研究が紹介されています。1つ目の研究は,「友人の学力」と「自分の学力」の間に因果関係があるかを調べたもので,ボストンとニューヨークにあり,日本と似た形式の入試で合否を決める高校の合否のデータを利用しています。入試の合格ラインぎりぎりで合格した生徒を介入群,ぎりぎりで不合格になった生徒を対照群とすると,ほとんど同じ学力を持った生徒がある点数を境に介入群と対照群に振り分けられ,一方は学力の高い友人との付き合いが多くなり,他方は学力がそれほど高くない友人との付き合いが多くなります。このときの合格ラインとなる点数をカットオフ値として,もし因果関係があれば,不連続な結果が得られるという手法です。結果として,この研究ではその後の学力が不連続に変化した様子が観察されず,勉強のできる友人に囲まれて生活しても,当人の学力にあまり影響はないと結論づけています。
2つ目の研究は,「高齢者の医療費の自己負担割合」と「死亡率」との間に因果関係があるかを調べたものです。第2章でも同様の研究例が紹介されていましたが,ここで紹介されている研究は対象を高齢者にしぼり,70歳を超えると医療費の自己負担割合が3割から1割に下がる(当時の)日本の制度を利用したものです。この場合には,70歳がカットオフ値になり,69歳11か月の人と70歳0か月の人の健康状態や医療サービスの利用頻度を調べたのです。その結果,70歳を境にして,患者数は不連続に増加したものの,死亡率や健康状態は不連続には変化しなかったことが報告されています。
第7章 偏差値の高い大学に行けば収入は上がるのか
この章のテーマであるマッチング法は次のようなものです。
マッチング法とは,介入群によく似たペアを対照群の中から選び出すことによって,2つのグループを比較可能にする方法のことである。
つまり,介入したかどうか以外の属性がほとんど同一だと考えられる調査対象どうしを順次マッチングさせていく手法です。マッチング法を用いた研究として紹介されているのが,大学の偏差値と収入の間に因果関係があるかを調べたものです。アメリカの大学入試のデータを用いているので,正確には偏差値ではないのですが,偏差値と同じような物差しによる比較です。例えば,A大学とB大学に合格し,C大学には不合格になった人が2人いたとすると,合否の判断に使われた高校の成績や推薦状などの面で2人を同等だとみなします。一方がA大学に進学し,他方がB大学に進学したとし,A大学のほうが偏差値が高いとすると,偏差値の高い大学へ行くことにより後の収入に影響があるかどうかを調べることができるわけです。この研究の結論は,ある大学に合格して実際に進学した人(介入群)とその大学に合格したものの偏差値が低い大学に進学した人(対照群)について,卒業後の収入に統計的に有意な差は見られなかったというものです。大学の偏差値と収入に相関があるのは,偏差値の高い大学に行ったから収入が上がるということではなく,高い収入を得られるような素養を持つ人が偏差値の高い大学を選択しただけだということですね。
まとめ
「おわりに」の中で次のように書かれています。
すでに海外では定着している「エビデンスに基づく政策」だが,教育や医療といった分野では,特に通説と思い込みによる支配が強く,これを定着させていくことは簡単ではない。おそらく私たちが研究者人生をかけて,訴え続けていかなければならないことなのだろう。
著者のお一人の中室牧子さんは教育経済学がご専門で,もう一人の津川友介さんは医療政策がご専門なので,教育や医療分野でのエビデンスに基づく政策決定の重要性が本書全体を通して強調されています。こういったエビデンスベースの決定が日本に浸透するには,因果推論を学ぶことがあたり前という土壌が必要になるのではないでしょうか。因果推論の敷居を限界まで低くした本書には,まさにそのように日本が変わっていくきっかけを作りたいという気概を感じます。
ちなみに,紹介を省略した第8章には「因果関係の評価に適したデータが手元にない場合には,回帰分析の出番だ」ということで,「すべての交絡因子のデータが手元にあるならば,重回帰分析でもきちんと因果関係を証明することができる」といったことが書かれています。本書には索引がついていますので,「交絡因子って何だっけ?」と思う場合でも迷わずにすみますね。
また,巻末の「因果推論をもっと知りたい人のためのブックガイド」も参考になります。
本書をきっかけとして,情報が氾濫している現代における正しい情報との接し方を学んでみませんか。因果推論がわかってくると,きっと「世界の見え方」が変わります。
コメント