いまさら聞けない因果推論

偏差値と収入に因果関係はあるか。

2019年3月、アメリカの名門大学への大規模な裏口入学が発覚し、大きな話題となりました。当事者の多くは富裕層で、大企業の最高経営責任者や有名女優が含まれるとのことです。なお、入学先にはイェール大学・スタンフォード大学・ジョージタウン大学などが含まれますが、大学側の関与はないようです。

子どもを名門大学に入学させたい親の心理を考えると、ある問いが思い浮かびます。それは「偏差値の高い大学へ行けば収入は上がるのか」というものです。もっともこの事件においては、当事者の多くは富裕層であり、目的は収入ではなく名誉かもしれません。

この問いに対し、多くの人が「はい」と答えるのではないでしょうか。確かに富裕層には高学歴な人が多いように思います。しかしながら、経済学の有力な研究は、これを否定しています。それでも多くの人が「はい」と答えるのは、相関関係因果関係を混同しているからに他なりません。

相関関係(Correlation)とは、二つの事象に何らかの関係があることをいい、因果関係疑似相関に大別されます。二つの事象の片方が原因となって、もう片方が結果として生じた場合、事象間に因果関係(Causation)があるといいます。一方で、原因と結果の関係ではない場合は疑似相関(Spurious Correlation)と呼ばれます。

そして、二つの事象間に因果関係があるかどうかを明らかにするための考え方や手法を因果推論(Causal Inference)といいます。聞きなれない言葉なので「いまさら聞けない」というタイトルはやや不適切ですが、実はビジネスの現場でも、グロースハック(Growth Hack)1)いまさら聞けないグロースハックカイゼン(Kaizen)の領域で、A/Bテストという形で広く使われています。

第三の要因はないか。

事象Xが原因で、事象Yが結果であるという因果関係の存在を確認するためには、三つのチェックポイントがあります。

  1. 偶然の一致ではないか
  2. 逆の因果関係ではないか(事象Yが原因で、事象Xが結果ではないか)
  3. 第三の要因は存在しないか(第三の事象Zが、事象Xと事象Yの原因ではないか)

地球温暖化が進むと、海賊の数が減る」これはパロディ宗教である空飛ぶスパゲッティ・モンスター教が、相関関係と因果関係の混同を風刺するのに用いた例です。統計的な一致が見られたとしても、因果関係があるとは思えません。これは偶然の一致であり、見せかけの相関と呼ばれます。

警察官の多い地域では、犯罪も多い傾向にある」と言われています。しかしながら、警察官が多いことが原因で、犯罪発生件数が多いという結果を引き起こすとは考えづらいでしょう。むしろ犯罪が多い危険な地域であるがゆえに、警察官を多く配置していると考えるべきです。これは逆の因果関係と呼ばれます。

体力がある子どもは学力が高い」と言われています。では、子どもに運動させることが学力向上につながると考えてよいでしょうか。もちろん、体力がつくことで長時間の勉強に耐えられるなどの効果があるかもしれません。ただ、学力向上にはもっと効率的な手段があるでしょう。むしろ体力にも学力にも影響を及ぼしている第三の要因があるように思えます。例えば「親の教育熱心さ」などがそれです。これは交絡因子(Confounding Factor)と呼ばれます。

では冒頭の問い「偏差値の高い大学へ行けば収入は上がるのか」についてはどうでしょうか。まず何らかの関係があることは間違いないため、偶然の一致ではないでしょう。また多くの人は大学卒業後に働き始めるため、逆の因果関係があるとも思えません。では第三の要因はどうでしょうか。「潜在能力の高さ」が、偏差値の高い大学に行く力と、高い収入を得る力の両方を生み出しているとは考えられないでしょうか。

反事実との比較による証明。

二つの事象間に因果関係があることを証明する手法に、事実と反事実の比較があります。反事実(Counterfactual)とは、その事象が発生しなかった場合のことです。そして、原因の事象Xが発生したという事実における結果の事象Yと、原因の事象Xが発生しなかったという反事実における結果の事象Y’を比較し、有意差(Significantly Different)が見られる場合に因果関係があると結論づけます。この場合の有意差とは、事象Yと事象Y’の間の統計的に偶然とはいえない差のことで、それを因果効果(Causal Effect)といいます。また、事実と反事実の比較により因果関係を説明することを反事実モデル(Counterfactual Model)といいます。

反事実モデルの代表的な手法に、ランダム化比較実験(Randomized Controlled Trial:RCT)があります。たとえば新薬の臨床試験において、病気のネズミを無作為に二つのグループに分け、片方のグループにのみ投薬したとしましょう。そこで投薬したグループのほうが治癒率が高ければ、因果効果があると言えます。なお、投薬したグループを介入群(Intervention Group)、投薬しなかったグループを対照群(Control Group)といいます。またランダム化比較実験は、ビジネスの世界ではA/Bテストと呼ばれています。

ところで、二つのグループを無作為に分けたのはなぜでしょうか。それは比較する二つのグループの間に介入した事実以外の違いが存在すると、違いを生んだ原因がどちらであるかを説明できなくなるからです。

ランダム化比較実験には極めて高い証明力があるものの、実験ができない場合には適用できません。実験には時間やコストもかかります。実験対象となる人や企業を人為的に無作為に分けることは簡単ではありません。介入群と対照群に不公平があれば反発も起こるでしょう。前述の臨床試験には倫理的な問題もあります。

実験ができない場合は、すでにあるデータを用いる他ありません。なお、実験で獲得したデータを実験データ(Experimental Data)と呼ぶのに対し、日常の活動から獲得したデータを観察データ(Observational Data)といいます。すなわち、観察データを用いて反事実モデルを実施することになります。それには観察データ内に原因と考えられる事象の反事実が存在する必要があります。

たとえば、新商品の案内メールをすべての顧客に送信したはずが、メール配信システムの障害で一部の顧客に送信されていなかったとします。これは観察データ内に反事実が偶然発生している状態であり、送信された顧客と送信されなかった顧客の購買の結果を比較することで因果推論が可能です。この状態を自然実験(Natural Experiment)といいます。

しかしながら、自然実験の状態が都合よく発生するわけではなく、またそれを観察データから見つけることも容易ではありません。そこで、観察データと統計手法を用いて、あたかもランダム化比較実験を実施しているような状態を作り出す、疑似実験(Quasi Experiment)という考え方があります。統計手法には、差の差分析操作変数法回帰不連続デザインなどがありますが、ここではマッチング法による疑似実験のアプローチを紹介します。

マッチング法とは、介入群によく似たペアを対照群から選び出すことにより、介入した事実以外の違いを排除することで、二つのグループを比較可能にする手法です。そして冒頭の問い「偏差値の高い大学へ行けば収入は上がるのか」を、この手法で否定したのが、プリンストン大学のアラン・クルーガーらによる研究です。

クルーガーらは、それぞれの学生がどの大学に合格し、どの大学に不合格だったかのデータを用いてマッチング法を実施しました。たとえば、大学Aと大学Bには合格したが、大学Cには不合格だった二人がいたとすると、この二人はよく似たペアと言えます。そのうちの一人は偏差値の高い大学Aに、もう一人は立地のよい大学Bに進学した場合、この二人を比較すれば、偏差値の高い大学へ行くことによる将来の収入への因果効果を推定できることになります。

この研究の結果、偏差値の高い大学Aに進学した学生のグループ(介入群)と、偏差値の低い大学Bに進学した学生のグループ(対照群)の間で、大学卒業後の収入に有意差が見られないことがわかりました。多くの人が「偏差値の高い大学へ行けば収入は上がる」と信じていたことが否定されたわけです。

このように、因果推論を駆使すれば、二つの事象間の因果関係の有無を明らかにすることができ、相関関係との混同や思い込みから解放されます。

最後に、この記事を書くにあたり、中室牧子氏・津川友介氏による著書『「原因と結果」の経済学―データから真実を見抜く思考法』を参考にさせていただいたことをお伝えします。因果推論を詳しく知りたい方には大変お薦めです。

脚注   [ + ]