What Structures Structure

Truth III − What Structures Structure
Keywords: causal model, language &writing, probability model, research hypothesis
確率モデルと因果モデルの補完関係
お父さん「ふむ、そこはひっかかるよね。今まで使ってきたロジスティック回帰のオッズ比や回帰係数は、Rubin因果モデルの因果効果と違うのか?当然の疑問かもしれない。結論から言うと”同じものとも言えるし、違うものとも言える”」
私「なんじゃそりゃ」
お父さん「ひとつの数字が二重、三重の意味を持っているっていったらいいかな。根っこをたどると、因果的な構造に従って生じた現象を測定したものがデータっていうことを押さえてほしい。逆に、データが発生する背後に因果モデルがあるといってもいいけどね。確率モデルと因果モデルは、この関係に対応している」
- 確率モデル: 観測されたデータがどう生じるかを記述する構造
- 因果モデル: 観測された世界と、観測されなかった世界の両方で、原因を変えたら結果はどうなっていたかを表す構造
私「わからんな。統計学ではデータはサンプル、確率分布は母集団って習ったが。違うのか」
お父さん「いや、違わない。それの延長線上の話。母集団=確率モデルでもいい。統計学の母集団は確かに抽象的なこともあるよ。でもサンプルを無限に集めるとデータは母集団に近づくという意味で、現実世界と結びついている。その一方でさ、ほら、さっきいったように潜在結果変数は観測できないでしょ」
私「うん」
お父さん「だからね、データは影みたいなものなんだ。見たいものは、その少し向こう側にいる」
私「そういわれると確かに因果関係の真実は、データの発生する前から存在するのかもね。実感はないけど理解はした。でも、それならどうして最初からロジスティック回帰じゃなくて因果モデルを教えなかったの?」
お父さん「ふむ。もう少し説明が必要だね。ロジスティック回帰や層別解析を使っちゃいけないわけじゃない。それは方法なんだ。ルービックキューブの解き方みたいなもの。ルービックキューブの構造とは別物」
私「べつもの」
お父さん「ほら、問題になっているのは回帰係数やオッズ比の計算方法じゃなくて解釈ってことだよ。これらの指標を、因果関係を考えるための証拠として扱うときは、因果モデルが必要だってこと」
私「お父さんは専門だからわかってないけど、私にとってはロジスティック回帰もRubin因果モデルも最近知ったばっかなんだよ。絶賛こんがらがり中だわ。Rubin因果モデルって、ある患者に別の方法で治療したら結果はどうなっていたかを分析すればいいんでしょ?それって解剖・病態生理・薬理に関する知識と臨床経験を組み合わせればできそうなことじゃない?」
お父さん「本来的にはその通り。でも、それはあくまで患者ひとりひとりにとっての原因と結果を分析するアプローチになっている。個々の事象に関する因果を単一因果(token causation)っていうんだけど、それと一般法則としての因果には、まだギャップがあるよね」
私「トークン?ぴんとこない言葉だけど」
お父さん「たとえば”あの患者さんが助かったのはこの薬のおかげか?“というレベルの話がtoken causationに近い」
私「ああ、そういうこと。有害事象と薬の因果関係を判定をする、みたいなことね。そういわれたら、個々の出来事と一般法則どっちも因果っていうね」
お父さん「臨床試験や調査は集団を対象にしているよね。集団を統計的に分析することで法則性を見出そうとしているんだ。そのための道具を用意するためのベースになっているのが、確率分布や回帰モデルだっていう話だったでしょ。確率モデルと因果モデルは役割が違う」
私「また、難しい話に戻ってきたね。コーヒーもう一杯くれる?」