Coffee and Research
  • Home
  • cifmodeling
  • A Conversation (EN)
    • Index
    • Study design
    • Frequentist Thinking
  • A Conversation (JP)
    • Index
    • Study Design
    • Frequentist Thinking
    • Frequentist Experiments
    • Effects and Time
  • 8 Elements (EN)
  • 8 Elements (JP)

On this page

  • Adjusting for Bias V − Understanding Confounding in Effect Measures: Marginal vs Stratified
    • ロジスティック回帰で「調整する」ってどういうこと?
    • Simpsonのパラドックスが起きる条件
    • 文献
    • This concludes the Adjusting for Bias series. If you’d like to keep reading over your next cup of coffee, the following episode is waiting:

Understanding Confounding in Effect Measures: Marginal vs Stratified

Published

December 8, 2025

Adjusting for Bias V − Understanding Confounding in Effect Measures: Marginal vs Stratified

Keywords: confounding & collapsibility, effect measure, observational study, R simulation


ロジスティック回帰で「調整する」ってどういうこと?

私「お父さん、ロジスティック回帰でわからないことがあるんだけど。観察研究では交絡因子(confounder)を調整しないといけないって前にいってたよね」

お父さん「ああ、そんな話もあったね」

私「でも統計学の本を読んでも、なにをどう調整するのか書いてないんだよ」

お父さん「いいよ。でも少し長くなる。コーヒーでも飲みながらでいい?」

私「賛成。いちご大福あるから、とってくる」

お父さん「疫学では有名な話なんだけどね。40年前に、“コーヒーを飲むと膵がんリスクが上がる”という論文が出たことがあった」

私「いかにもありそうな話だね」

お父さん「そうでしょ。でも、観察研究では、コーヒーを飲む習慣のある集団と、きちんと比較できるようなコントロールを選ぶことは難しい。だから疫学の教科書では、集団同士を比較するときには、第3の因子が隠れていないか注意せよと、必ず書いてある」

私「ふんふん」

お父さん「それでは問題です。このコーヒー論争で、実際に問題になった第3の因子はなんでしょう?」

私「え?えーっと」

お父さん「答えはこれ」

お父さんの答えは?

それは喫煙です。当時は今より喫煙率が高くて、ほとんどの方がコーヒーと一緒にたばこを吸っていたそうです。

私「へえ、そんな話があったんだ」

お父さん「じゃあさ、こういう第3の因子を無視して解析するとどうなる?」

私「それくらいわかるよ。バイアスが入るんでしょ」

お父さん「そういうこと。これが疫学でいう交絡因子。交絡調整がなにしているかは、数字をみるのが一番早い。Simpsonのパラドックスっていう現象を使って説明しよう」

Simpsonのパラドックス

コーヒーと膵がんの数値例を用いて、統計学でいう調整とはどういう操作のことなのか、一番シンプルな層別解析でみてみましょう。表1は、コーヒーと膵がんを想定した仮想データです。コーヒー摂取群とコーヒー非摂取群で、それぞれ膵がん発生ありとなしが調べられています。膵がんを発生したのはそれぞれの群で15人と12人、膵がんがなかったのは365人と868人です。オッズ比を計算してみましょう。コーヒー摂取群では膵がんリスクは3.9%で、コーヒーを摂取しない群の1.4%に比べて、(未調整の)オッズ比は3倍です。これは、コーヒーを摂取すると、膵がんリスクが高くなることを示唆しているようにみえます。

表2には、交絡因子(喫煙)によって対象者を層別した結果が示されています。ここから膵がんのオッズ比を求めるとどうなるでしょうか。層ごとの結果ではコーヒー摂取でも非摂取でもリスクは同じですよね。つまりオッズ比は1倍です。

このように、調整前後で、関連の程度が変わる現象を、Simpsonのパラドックスといいます(Simpson 1951)。

表1. 層別前の膵がんリスクとオッズ比

コーヒー摂取 コーヒー非摂取 オッズ比
合計
 膵がんあり 15 12
 膵がんなし 365 868
 リスク 3.9% 1.4% 3倍

表2. 層別後の膵がんリスクとオッズ比

コーヒー摂取 コーヒー非摂取 オッズ比
喫煙
 膵がんあり 14 4
 膵がんなし 266 76
 リスク 5.0% 5.0% 1倍
非喫煙
 膵がんあり 1 8
 膵がんなし 99 792
 リスク 1.0% 1.0% 1倍

私「単純な解析ではリスク因子だったのに、層別しただけで関連が消えた。でもこれは計算のトリックじゃないよね?以前こうやって雑談してたとき、オッズ比は層別すると数値が安定しないっていってたのは関係ある?」

お父さん「さすが、覚えていたね。でもここは区別しないといけない。確かにオッズ比はリスク比と違って、層別したら値が変わりやすい、併合可能ではない(non-collapsible)指標だよ。でもこれは指標の性質の話。ここで問題しているSimpsonのパラドックスは、“比較の土台”が壊れている話なんだ」

私「たしかに。この前はランダム化臨床試験、今回は観察研究だものね。コーヒー好きはコーヒーを飲まない人とは別の特徴を持っていて、単純に比較するのはバイアスってわけだ」

お父さん「そういうこと。ほとんどの観察研究で、交絡の影響は、効果の指標の違いよりずっと大きい。層別で関連が消える現象は、一般化線型モデルでも再現できるよ」

glm()を用いた膵がんデータの解析

交絡調整のための統計手法として、層別解析以外に一般化線型モデルもよく用いられます。オッズ比のモデルであるロジスティック回帰は、link="logit"を用いたglm()に、リスク比はlink="log"に対応していましたね。以下のコードでは調整前のオッズ比・リスク比はsmokeを入れないモデルで、調整後のオッズ比・リスク比はsmokeを入れたモデルで推定しています。

Rコードと結果はこちら
dat <- data.frame(
  cancer = c(1, 0, 1, 0,   1, 0, 1, 0),
  coffee = c(1, 1, 0, 0,   1, 1, 0, 0),
  smoke  = c(1, 1, 1, 1,   0, 0, 0, 0),
  n      = c(14, 266, 4, 76,  1, 99, 8, 792)
)
fit_logit1 <- glm(
  cancer ~ coffee,
  family  = binomial(link = "logit"),
  weights = n,
  data    = dat
)
odds_ratio1 <- exp(coef(fit_logit1)[["coffee"]])
print(odds_ratio1)
[1] 2.972603
fit_logit2 <- glm(
  cancer ~ coffee+smoke,
  family  = binomial(link = "logit"),
  weights = n,
  data    = dat
)
odds_ratio2 <- exp(coef(fit_logit2)[["coffee"]])
print(odds_ratio2)
[1] 1
fit_log1 <- glm(
  cancer ~ coffee,
  family  = binomial(link = "log"),
  weights = n,
  data    = dat
)
risk_ratio1 <- exp(coef(fit_log1)[["coffee"]])
print(risk_ratio1)
[1] 2.894737
fit_log2 <- glm(
  cancer ~ coffee+smoke,
  family  = binomial(link = "log"),
  weights = n,
  data    = dat
)
risk_ratio2 <- exp(coef(fit_log2)[["coffee"]])
print(risk_ratio2)
[1] 1

Simpsonのパラドックスが起きる条件

私「やっぱりトリックに見えちゃうな、何が起きてるのやら。とりあえず調整しとけっていいたいの?」

お父さん「えっとね、いちばん伝えたいことから話すね。研究の原則としてときどき使う”ceteris paribus”というラテン語があってね。“All other things being equal”くらいの意味なんだけど、比較する集団で条件をそろえたら、交絡によるバイアスは生じない。たとえばランダム化臨床試験とかね」

私「うん、その説明はわかりやすい」

お父さん「じゃあ、その次になにが起きたか整理しよう。まず前提になるのが、喫煙が膵がんのリスク因子だってこと。OK?」

私「うん」

お父さん「次に注目してほしいのが、喫煙とコーヒーの関連なんだ。喫煙状況ごとにコーヒー摂取割合を計算してみてよ」

私「コーヒー摂取割合ね。層別前は30%。喫煙者では78%、非喫煙者では11%だよ」

お父さん「喫煙群と非喫煙群でコーヒー摂取割合に大きな差があるでしょ。この現象が起きた理由は、コーヒー摂取と喫煙に強い関連があったため、ということ。これは、当時、たばこを吸いながらコーヒーを飲んでいたことを表している」

私「時代を感じるね、仕事の合間に一服したい気持ちはめっちゃわかる」

お父さん「Simpsonのパラドックスのポイントは、3つの変数の相関関係なんだ。2つの条件が揃うとSimpsonのパラドックスが起きやすい(厳密には十分条件で必要条件ではない)」

  • 第3の因子と曝露の間に相関がある
  • 第3の因子とアウトカムの間に相関がある

私「曝露とアウトカムと第3の変数の関係性ねえ。ちょっと確認させて。コーヒー摂取群とコーヒー非摂取群で、喫煙率が違う。さらに喫煙は膵がんリスクも上げる。そうすると層別したらオッズ比の値が変わった。ああ、もともとバイアスが入ってたんだから、調整して値が変わるのは当然か。確かにそうなる。交絡の話って、ややこしいね」

文献

  • Simpson EH. The interpretation of interaction in contingency tables. J Royal Stat Soc B 1951;13:238-41

This concludes the Adjusting for Bias series. If you’d like to keep reading over your next cup of coffee, the following episode is waiting:

  • What Data Cannot Tell Us