Who Is This Percentage About? Target Populations and Attributable Fractions

Effects and Time II − Who Is This Percentage About? Target Populations and Attributable Fractions
Keywords: effect measure, language & writing, observational study, research hypothesis
疾患リスクとターゲット集団
私「コーヒーおかわりいる?お父さん」
お父さん「ああ、ありがとう。ワクチンとは別の話題なんだけど、喫煙歴のあるがんの患者さんって、減ったと思う?」
私「そうね、昔よりは少なくなったんじゃない?」
お父さん「でも、日本のがんの統計上は、まだまだ喫煙は健康問題のひとつなんだ。がん罹患のリスク要因は、感染症、喫煙、飲酒の順に影響が大きいと推定されている」
私「喫煙率は下がってるのにちょっと意外だね。でもどのがん登録でも、喫煙情報は絶対調べるよね」
お父さん「感染症、喫煙、飲酒が、がん罹患に寄与する割合は、16%、15%、6%っていわれてる。この指標を、集団寄与割合っていうんだけど、これもただのパーセントじゃない」
私「それはそうだよね。喫煙者の15%ががんになる、なんて思わないもの。でも正確な意味はぱっとわかんないな」
お父さん「ほら、喫煙者のがん罹患を真っ先にイメージしちゃうでしょ。そこも誤解ポイント。集団寄与割合が想定している集団は、喫煙者じゃないんだ」
疫学研究では、一般集団を対象にして、環境物質や生活習慣といったリスク因子を調べることが多く、そのために寄与割合(attributable fraction/excess fraction)という指標も用いられます。寄与割合は、特定の集団におけるリスク因子への曝露が、どのくらい疾患発症に寄与するかを表す指標です。ただし、寄与割合には、歴史的に異なる定義のものが複数あり、どのような集団をターゲットとするかで計算方法も変わるので、じゅうぶん意味を確認する必要がある指標です。
あるリスク因子が国民全体の疾患発症にどの程度寄与するかを反映する指標は、集団寄与割合(population attributable fraction)と呼ばれています。ここで\(RR\)はリスク比、\(p\)は集団全体のうち群1が占める割合を意味しています。
- 集団寄与割合(population attributable fraction)
\[ PAF=\frac{p(RR-1)}{p(RR-1)+1} \]
私「ふーん。集団寄与割合はリスク比だけじゃなくて、リスク因子の割合がわからないと計算できないんだね。でも、まあ、これもワクチン有効率と同じパターンだね。パーセントっていわれるとただの割合と思っちゃう。集団寄与割合のパーセントって、よく考えるとなにを意味するのか謎」
お父さん「うん。でもね、問題はそこだけじゃない。集団寄与割合にすごく似た別の指標が説明なしに使われることが結構あるってこと。リスク因子の割合が不要な指標もあって、集団寄与割合と混同されていることもある。日本語では定訳があるわけではないけど、海外ではexcess fractionやpreventable fractionという専門用語が当てられているんだ。実はこの2つはワクチン有効率とほとんど同じ式だったりする」
集団寄与割合以外の寄与割合として、excess fraction(過剰寄与割合)とpreventable fraction(予防寄与割合)がよく用いられます。集団寄与割合との本質的な違いはターゲット集団にあります。このふたつの指標のターゲット集団は曝露集団です。
| 指標 | ターゲット集団 | 何を表す? |
|---|---|---|
| PAF(集団寄与割合) | 曝露+非曝露 | 集団全体の疾患のうち、どれだけがその曝露のため生じているか |
| EF(過剰寄与割合) | 曝露だけ | 曝露集団のうち、どれだけの割合が曝露のため疾患を生じたか |
| PF(予防寄与割合) | 曝露だけ | 曝露集団のうち、どれだけ予防的な曝露が疾患を防いだか |
Excess fractionは、曝露がリスク因子として働くときに用いられる指標として、多くの疫学の教科書で説明されており、以下のように定義されます。この指標では、群1が曝露あり、群2が曝露なしと考えています。そして、群1から曝露を取り除いたとき、どのくらい疾患が減るかを表しています。
- excess fraction(過剰寄与割合) \[ EF = \frac{\pi_1 - \pi_2}{\pi_1} = 1 - \frac{1}{RR} \]
その一方で、たとえば喫煙に対する禁煙のように、曝露が予防的に作用するとき、preventable fractionが用いられます。群1が曝露あり、群2が曝露なしという点は同じですが、ターゲットは群2です。なお、この式はワクチン有効率と同じです。
- preventable fraction(予防寄与割合) \[ PF=\frac{\pi_2-\pi_1}{\pi_2}=1-RR \] 集団全体ではなく、曝露集団をターゲットにする意義は、具体的な状況をイメージすると理解しやすくなります。環境疫学では、たとえば化学物質や放射線被ばくなど環境要因の健康影響を評価することが求められます。この場合では、集団全体ではなく、実際に環境要因に曝露した集団における被害を定量化する必要があるため、曝露集団をターゲットとしたexcess fractionがしばしば用いられます。同じような理由で、ワクチン・検診・運動などの予防法の新規導入が、個人のリスクをどれだけ下げたか知りたいときは、preventable fractionが好まれています。
私「余計にわかんない。使い分けもわかんないしパーセントがなにを意味するのか謎」
お父さん「まあコーヒーを飲んでゆっくり考えよう。まずは具体的な計算結果をみてみてよ」
リスクや効果の指標について数値例をみるとイメージしやすいと思います。この表は、 喫煙と膵がんリスクの関係を調べる仮想的なコホート研究から得られたデータを表しています。上の式を用いて、リスク差、リスク比、オッズ比、excess fractionを求めると、以下のような結果が得られます。ワクチン有効率と同じように、excess fractionもパーセントで示すことがあるため、要注意です。
| 喫煙あり | 喫煙なし | 効果の指標 | |
|---|---|---|---|
| 合計 | |||
| 膵がんあり | 15 | 12 | |
| 膵がんなし | 365 | 868 | |
| リスク | 3.9% | 1.4% | |
| リスク差 | 2.5% | ||
| リスク比 | 3倍 | ||
| オッズ比 | 3倍 | ||
| Excess fraction | 74% |
私「同じパーセントでも、リスク差の2.5%とexcess fractionの74%は印象がだいぶ違う。まあ、私が公衆衛生やっていないのもあるけど」
お父さん「でしょ。同じパーセントで言葉と認識にギャップがあるよね。まあ臨床試験のハザード比は”どの治療を選ぶか”、寄与割合は”社会に介入すると疾患がどれだけ減るか”だから、慣れの問題もあるかもだけど。効果の指標って、ただの計算だと思うとかえって理解しにくいところもある。たとえ話をさせてよ。60歳になってがん検診にきた人が4人いたとする。話をわかりやすくするために、4人の健康状態はまったく同じだとしよう。そのうち、最初の2人はがん検診が陽性で、根治切除できたとする。その後、71歳と79歳まで生きることができた。つまり、がん検診後の生存期間は11年と19年」
私「ふんふん」
お父さん「残りの2人は、本当はがんだったのに、検診では見つけられなかった。そのため、67歳と73歳で亡くなった。つまり、がん検診後の生存期間は7年と13年」
- 60歳がん検診で陽性になり根治手術、71歳まで生存
- 60歳がん検診で陽性になり根治手術、79歳まで生存
- 60歳がん検診で偽陰性、手術を受けず、67歳まで生存
- 60歳がん検診で偽陰性、手術を受けず、73歳まで生存
お父さん「仮にこの2人を60歳のとき根治切除できたとしたら、生存期間は何割長くなるだろう」
私「えっと、がん検診陽性の2人の生存期間は平均15年でしょ。がん検診陰性の2人の生存期間は平均10年。だから、(15-10)/10=0.5だから、50%の延長」
お父さん「じゃあ、別の質問をするよ。もし、がん検診陽性の2人を60歳のとき根治切除できなかったとしたら、生存期間はどれくらい失われる?」
私「(10-15)/15=-0.33だから、33%減っちゃうね」
お父さん「そう。つまり、陽性2人と陰性2人のどちらをターゲットにするかで、データは同じでも、根治切除の生存期間に寄与する割合が変わってくる。ここが寄与割合の複雑なところなんだ。この例では生存期間で説明したけど、疾患リスクでもターゲット集団に依存する点は同じ。Excess fractionは、この例でいうと根治切除できなかった2人をターゲットと考えている。Preventable fractionのターゲットは、根治切除できた2人に対応している」
私「なるほど、ターゲット集団を分母にとるのね。ターゲットがあるのが、リスク差とかリスク比とかとの違いってわけだ」
お父さん「そういうわけでもないんだ。効果の指標にはどれも、表に出ないだけでターゲット集団がある。たとえば術後の大腸がん患者を対象にランダム化臨床試験をして、補助化学療法をすると死亡リスク差が-5%になったとするでしょ。これって、術後の大腸がん患者全体に補助化学療法をすべきって解釈にならない?」
私「まあねえ」
お父さん「つまり臨床試験の集団全体がターゲット集団になる。因果リスク差とか、因果リスク比っていう言葉があるんだけど、これは集団全体に別の治療をしたときや、集団全体がリスク因子に曝露したとき、リスクがどう変化するかを表してるんだ」
私「ふーん。じゃあ効果の指標はどれも、単に数式が違うだけじゃなくて”どの集団について語っているか”という言語の問題が潜んでいるんだね。診療科で論文読むことがあるけど、まさか指標によって集団が変わるなんて認識してないんじゃないかな。この前のワクチン有効率はどうなの?」
お父さん「ワクチン有効率も臨床試験で推定するよね。だからそのワクチンのターゲット全体が、ワクチンを接種したとき、それがプラセボだったときに比べ、何割感染症が減るかっていう解釈になる。現場では、既存のワクチンが普及していることがほとんどでしょ。そこにワクチン有効率98%の新しいワクチンを投入しても、感染症が98%減ることにはならない」
治療や曝露とアウトカムの因果関係を扱うときには、どのような集団を考えているかをはっきりさせる必要があります。一例として、根治切除後の直腸がん患者におけるストーマ造設の有無と復職率との因果関係を考えてみましょう。このときストーマ保有者と非保有者を比較する因果リスク差は、「根治切除後の直腸がん患者全体」をターゲット集団としています。ストーマ保有者と非保有者という別の集団を比べているのに、患者全体がターゲットというのは奇妙にみえるかもしれません。しかし因果推論では、「患者全体がストーマを造設したとき」と「患者全体がストーマを造設しなかったとき」という仮想的な状況を対比することで、ストーマ造設が復職率を低下させたかがわかる、という反事実の考え方をするのです。
お父さん「もうひとつ気を付けないといけないのは、リスクには時間の概念が隠れていること。検診後10年時点の死亡確率を考えてみよう。陽性2人の死亡確率は0%、陰性2人の死亡確率50%だよね。このときのexcess fractionはわかる?」
私「うん。(0.5-0)/0.5=1でしょ」
お父さん「そう、つまり根治切除していれば、がん陰性の2人の死亡は100%防げたという意味になる。でもさ、がん検診後、12年経つとどうなる?」
私「(0.5-0.5)/0.5=0になるね」
お父さん「じゃあ、がん検診後、20年経つと?」
私「生存者はいなくなるね。(1-1)/1=0かな」
お父さん「そういうこと。寄与割合は、時間とともに変化することがあり得るんだ。時間が隠れているっていうのは、リスク比やオッズ比も同じだけどね」
私「なるほどね」
お父さん「まとめるとね、“何%減る”とか”何%に効く”というパーセントを見たら、どの集団のことなのか、どの時点のリスクかを意識しよう、ということだね」
今回みたように、寄与割合は、excess fractionやpreventable fraction以外に、曝露・非曝露を合わせた集団全体をターゲットにすることがあります(population attributable fraction)。先ほど用いたがん検診の例で考えましょう。仮にがん検診の精度が高くなって、感度を100%にできたとしましょう。先ほどの状況(感度50%)に比べて、検診後15年後に死亡している人数は、4人のうち、どのくらい減ると期待されるでしょうか。
- 0%
- 33%
- 50%
- 100%
- 正解は2です
この4人の生存期間は、11年、19年、7年、13年なので、15年後の死亡数は3人です。また、根治切除後の死亡率は50%なので、根治切除できなかった2人が、仮にがん検診でがんを見つけられて、根治切除できたとしたら、死亡率は50%と期待されます。この仮想的な状況における死亡数は、1+2×50%=2人です。つまり、検診後15年後に死亡している人数は33%減ったことになります。
この計算は、集団全体をターゲットとする寄与割合を求めていることに他なりません。集団全体における曝露割合を\(p\)で書くと、集団寄与割合は、以下の式で表されます。
\(PAF=\frac{p(RR-1)}{p(RR-1)+1}\)
がん検診の例では、\(p=0.5\)、15年死亡リスク比は\(RR=2\)なので、これを代入すると、\(PAF=0.5(2-1)/{0.5(2-1)+1}=0.33\)となり、上の正解と一致します。
次のエピソードとRスクリプト
このシリーズのエピソード
- Silent Confusions Hidden in Percentages
- Who Is This Percentage About? Target Populations and Attributable Fractions
- When Odds Ratios Approximate Risk Ratios—and When They Fail
- From Risk and Rate to Survival and Hazard
- A First Note on Cox Regression
- After Cox Regression: A Case Study and R Demonstration
過去のシリーズ
用語集