及川直彦のテキストのアーカイブ

及川直彦が書いたテキストと興味を持ったテキストのアーカイブ

「コライダーバイアス」についてのメモ

ジューディア・パール&ダナ・マッケンジー(2022)『因果推論の科学』文藝春秋 の中に登場する「コライダーバイアス」という概念が面白かったので以下メモ。 

  • 「コライダー(合流)」は、2つのリンクでつながる3ノードのネットワーク(以後「ジャンクション」)における三つの基本型のうちの一つで、A→B←C(BがAとCの2つの変数から影響を受けている)という関係のものである。たとえば、ハリウッドの俳優には「才能→名声←美貌」という関係が見られるが、これがコライダーの例である。才能と美貌はともにその俳優の名声に寄与するが、才能と美貌の間には何の関係もない
  • コライダーにおいては、Bを条件付ける(例: ある値のデータを対象とする)と、AとCがそもそも独立していたとしても、互いに従属関係に変わるというものである。たとえばハリウッドの俳優の「才能→名声←美貌」の場合、Bにおいて、有名な俳優(名声=1)だけを見ると、その俳優の美貌が劣っているほど、才能が優れているという信念が高まる、すなわち、才能と美貌の間には負の相関が生じる。しかしながら、才能と美貌の間には何の関係もない
  • なぜこのような負の相関が生じるのだろうか。俳優が有名になるためには、才能と美貌の両方は必要なく、どちらか一つがあれば良いとするならば、すでに名声を得た俳優Aに素晴らしい演技の才能がある場合、それだけで彼の成功をうまく説明できるため。彼が平均以上の美貌である必要はない。あるいは、既に名声を得ている俳優Bに演技の才能がなければ、彼の成功を説明できるのはその美貌ということになる。したがって、名声=1の場合、才能と美貌は反比例の関係になる。こういった、Bを条件付けた場合に独立したAとCの間に生じる相関関係は、コライダーバイアスと呼ばれる
  • 次のような実験について考えてみよう。2枚のコインを同時に投げることを100回繰り返して、どちらか一方、あるいは両方が表だった場合に、その結果を書き留める。するとおそらく、75回分程度は記録することになるはずだ。記録を見て気づくことはないだろうか。どうやら、2枚のコインの表裏は独立していないようなのだ。コイン1が裏だとコイン2は毎回表になっている。なぜこんなことが起きるのだろうか。2枚のコインは、何らかの手段で、光のような速度でコミュニケーションを取り合っているのだろうか。もちろん、そのようなことはあり得ない。このようなことが起こるのは、両方が表になった場合を記録しないことにより、コライダーが条件づけられているためである
  • 私たちには、何かパターンを見出すたび、私たちはそれに対して因果関係で説明を加えようとし、データの裏には必ず何か常に変わらない安定したメカニズムがはたらいていると思いたいという癖がある。たとえば「XはYの原因である」というように、両者の間に直接の因果関係があるという説明があると満足し、もしそれがないとするならば、「XとYに共通の原因がある」という説明である程度満足する。この癖を持つ私たちには、コライダーが存在するという説明は弱く感じられ、因果関係を求める願望は満足しない。その説明をされても、2枚のコインが協調して動いているように見える理由は十分にわかったとは思えないのだ。コインは互いにコミュニケーションをとってはいないし、はっきり目に見えている相関関係は、まさに文字通りの「幻想」だといった説明にはどうしても失望してしまう
  • しかも、この幻想は、実は、自分の行動によって生じた「妄想」ということになる。データセットがどの事象を含め、どの事象を無視するかを自ら選択したことによって、ありもしない相関関係が存在するように見えたというのである
  • ここで例にあげた2枚のコインを投げる実験の場合、選択は意識的なものだが、私たちは、こうした選択を意識的にしているとは限らない。無意識のうちに同様の選択をしていることは非常に多いし、知らないところであらかじめ選択がなされている場合も少なくない。それゆえ、私たちは、コライダーバイアスに簡単に騙される

これまでの統計学の中で、「XとYに共通の原因がある」=交絡因子も因果関係を解明する際によく知られた「手強い敵」なのですが、このコライダーバイアスは、私たちが無自覚な思考の癖が関わっていることもあり、交絡因子とは異なったタイプの手強さを感じますね。