What Could Have Happened

Truth II − What Could Have Happened
Keywords: causal model, language & writing, probability model, research hypothesis
原因を変えたら結果はどうなっていたか
お父さん「今から、“交絡調整”の意味を知るために必要な概念について話すね」
私「うん。コーヒーお代わり」
お父さん「これまでの例を思い出してごらん。胃がん手術の術式、ストーマ造設、コーヒー摂取、どれも知りたいのは別の選択をしていたら結果はどうなっていたかってことじゃない?別の術式だったら助かっていたか、とか」
私「そうだね、それはその通り」
お父さん「正直にいうと回帰分析のレールに乗ったままでは、その真実にはたどり着けない。出発点を変える。確率モデルではなく原因を変えたら結果はどうなっていたかという疑問からスタートすること。因果推論はその問いに答えるための方法論なんだ」
私「げ。別の方法で解析をやり直せっていいたいの?」
お父さん「ちがうちがう、今してるのは抽象的な話なんだ。たとえば実薬とプラセボを比較するランダム化臨床試験だったらどう?全員に実薬を投与した結果とプラセボを投与した結果の差が知りたいんじゃない?それがOSなら生存曲線の差になる。この差こそが因果効果なんだ」
私「うーん。そうか。JCOG9502だったら、胃がん手術で術式THを選ぶか、術式LTAを選ぶかを決めたいんだものね。標準治療が決まったら全員その術式になるはずだもの、その話は納得だわ。論文に出ていた生存曲線の差が因果効果にあたるわけか。確かに、そこに確率分布も回帰モデルも出てこないね」
お父さん「そう。でも、がんサバイバー調査は観察研究で、ランダム化されていない。JCOG9502と同じように考えたくても、“仮にストーマを造設しなかった場合のアウトカム”は実在しない。仮定の話だからね。だからこの観察研究では、観測できないアウトカムを、共変量や回帰モデルで予測するしかない。これはデータ上のアウトカムとは区別して、潜在結果変数(potential outcome)と呼ばれている。観測はできないけれど、医学的・論理的に定義できる”もうひとつの結果”というわけだね」
私「実在しないものを定義しても仕方ないじゃない」
お父さん「そうじゃない。どんな因果効果が知りたいかを定義して、それを推定するためにデータを集める」
私「そうじゃないのか」
お父さん「たとえるなら、6つあるルービックキューブの面の1つしか見えないようなもの。別の面に別の結果が描かれていたとしても観測できないんだ。でも同じ構造をもつルービックキューブをたくさん用意して、それぞれをランダムな向きで机の上に並べてごらん。どのキューブも一面しか見えないけれど、どんな絵が描かれているかを推し量ることはできる。ランダム化臨床試験がやっているのはこれに似ている」
私「ややこしい話になってきた。JCOG9502と私の調査のどこが違うんだろう」
お父さん「一番の違いはひとつ。ランダム化しているかどうか。そもそもランダム化臨床試験は、“介入したら結果はどうなるか”を調べるためにデザインされているからね。ターゲット集団も明確に定義されているし、介入もランダムに割付けられていてバイアスもない」
私「ふむ」
お父さん「がんサバイバー調査のような観察研究では、研究仮説やPECOをどんなに慎重に考えても、曖昧なところは残る。比較可能性だって、交絡因子のデータがバイアスを調整するためじゅうぶんかどうかわからない」
私「たしかにね。調査の場合、どんな集団が調査対象なのか、どんな群と比較することになるのか、調査結果が返ってこないと決まらない。想定してた研究仮説とずれるよね、そりゃ」
お父さん「話を戻そう。いい?ランダム化臨床試験と観察研究で別の因果モデルだとは言ってない。むしろ逆だ。Rubin因果モデルは、統計手法や交絡調整について考える前に、潜在結果変数を定義する。その差が因果効果だった。調査結果を回収するより前に研究仮説がないとおかしいのと同じで、推定方法より先に、なにを推定したいのかを決めておく」
私「わかるようでわからないな。じゃあさ、ロジスティック回帰やCox回帰の結果ってなんなの?オッズ比は因果効果とは違うの?」