Silent Confusions Hidden in Percentages

Effects and Time I − Silent Confusions Hidden in Percentages
Keywords: effect measure, language & writing, observational study
はじめて研究に取り組む娘と統計家の父。父に研究仮説は”PICO”を”PECO”で整理するといいとアドバイスされ、医師である娘は、がんサバイバーにおけるストーマ造設と復職状況の関係を調査することに決める。それからというもの、父は娘に統計の話をふるチャンスをうかがっていた。
95%って聞いたら100人いたら95人に効くって思わない?
お父さん「あれ、お風呂あがったの。コーヒーでも淹れようか」
私「カフェラテ」
お父さん「いつものやつ?あれはカフェラテじゃなくて、ただのコーヒーミルクだよ」
私「いいのよ。そういえばこの前出たワクチンについてなんだけどね。外来で”有効率95%“って患者さんに聞かれたんだけど、こういう統計って私もちょっと混乱するんだよね」
お父さん「うん、あれは話題になったよね。ワクチン有効率(vaccine efficacy)って意外と計算が難しいんだよ。まず”率”って用語には要注意だね」
私「そう?罹患率とか死亡率とかよく使うけど」
お父さん「それとは別。うん、そこは日本語特有の言い回しだから間違えやすいよね。この場合の率は百分率の意味で使っているんだけど、疫学でいう率(rate)とは計算が違うんだ。ややこしいのはそこだけじゃない。この場合の95%は、プラセボに比べて発症リスクが5%に下がるって意味だから」
- ワクチン有効率は疫学一般で用いられる率ではない
- プラセボ効果との相対比較のための指標
私「ん?100人いたら95人に効くって意味じゃないの?」
お父さん「違う違う。プラセボの効果との相対比較。プラセボを打ったときに比べ、どのくらい感染を予防できるっていう意味のパーセントなんだ。論文ではともかく日常会話ではほとんど誤解されて伝わっちゃう。“リスク”までさかのぼらないと、わからないと思う。ちょっと、そこにある紙ナプキンとペンをとって。式で書いてあげるよ。いくつか疫学の指標を書くけど、“95%という数字はどのリスクとどのリスクをどう比べているのか”だけが、はっきりすればいい。そのために、こういう分割表で集計したデータを頭に浮かべよう」
医学では分野によってさまざまな指標が用いられており、特に割合を比較する指標にはわかりにくいものが少なくありません。割合を理解するための最初のステップは分割表です。
| 群1 | 群2 | |
|---|---|---|
| 発症あり | A人 | B人 |
| 発症なし | C人 | D人 |
| 発症リスク | \(\pi_1\) | \(\pi_2\) |
この表では人数や割合を、具体的な数字ではなく、A、B、C、Dや群1・群2の発症リスク\(\pi_1\)と\(\pi_2\)を使って表しています。2群ごとの割合\(\pi_1\)と\(\pi_2\)の比較では、以下のような指標が用いられます。
- リスク差(risk difference、絶対リスク減少)
\[ RD={\pi_1}-{\pi_2} \]
- リスク比(risk ratio)
\[ RR=\frac{\pi_1}{\pi_2} \]
- オッズ比(odds ratio)
\[ OR=\frac{\pi_1/(1-\pi_1)}{\pi_2/(1-\pi_2)} \]
これらの指標を使うときは、どちらの群を基準に比較しているかを意識することが大切です。上の式では群2を基準にとっています。
特に、2種類の治療のどちらが有効か調べるために比較するケースでは、以下の指標もよく用いられます。どちらの指標でも\(\pi_2>\pi_1\)と想定されています。ワクチン有効率では、群2はプラセボを受けていると考えてください。
- Number needed to treat(NNT)
\[ NNT=\frac{1}{\pi_2-\pi_1}=-\frac{1}{RD} \]
- ワクチン有効率(相対リスク減少)
\[ VE=\frac{\pi_2-\pi_1}{\pi_2}=1-RR \]
私「へー、ワクチン有効率はイメージしてたパーセントじゃないね。リスク比をちょっといじっただけの式じゃない。でも、“有効率”っていわれたり、パーセントが単位だと、いわゆる割合と思いがちだよね。お父さんって、頭の中にいつもこんな計算式があるの?いきなり式が出てくると違和感あるなあ。統計学と医学ってだいぶ雰囲気が違うね」
お父さん「もう慣れちゃったのかもね。でも、式で書かないと、ワクチン有効率がなんなのか、わからないでしょ。それにね、この数字には数式よりずっとリアルな意味がある」
私「なによ、持って回った言い方して、授業じゃないんだから」
お父さん「いや、聞けばすぐわかるよ。ワクチン有効率の数字は、臨床データから推定されたものでしょ。たくさんの参加者を対象に臨床試験を行って、実際に観察されたという経験が、ぎゅっと要約された結果が、この数字なんだ。でも、データ上でどんな結果が観察されたか、ワクチン有効率だけでは伝わらないでしょ。こういうのを”数字が独り歩きする”っていうんだ」
次の表は、ワクチンとプラセボを比較した仮想的な臨床試験のデータです。表の人数からワクチン有効率を計算すると以下のような結果が得られます。
| ワクチン群 | プラセボ群 | |
|---|---|---|
| 発症あり | 40 | 800 |
| 発症なし | 960 | 200 |
| 発症リスク | 4% | 80% |
\(\pi_1 = 40/1000 = 0.04\)
\(\pi_2 = 800/1000 = 0.8\)
\(VE=\frac{\pi_2-\pi_1}{\pi_2}=95 \%\)
私「確かにね。95%有効っていう数字だけみると、”ほぼ確実に救える”って意味に捉えがちだけど、よく考えたらワクチンにそこまでの効果はないよね。パーセントを使ったレトリックに騙されちゃいそう」
お父さん「解析結果はね。解釈するときに言語そのもの以外の情報が不可欠なんだ。70%だろうが80%だろうが、同じ数字でも奏効率とワクチン有効率は別の計算だからね。でも日常会話でそんなこと気にしてられないでしょ。だから間違って使われることが多い。パーセント表記が逆に誤解を生んでる疫学の指標は、他にもあるよ」
奏効率(response rate)とは、抗がん剤による治療を行った結果、何割の患者で腫瘍が縮小したか(完全奏効または部分奏効を達成したか)や血液から腫瘍細胞が消えたか(完全寛解)を表す指標です。この用語は広く用いられていますが、Japan Clinical Oncology Group(JCOG)という臨床試験グループでは奏効割合(response proportion)という表現を好んでいます(Japan Clinical Oncology Group 2025)。
さて、次の指標のうち、率(rate)に該当するのはどれでしょうか。
- 打率
- 男女比率
- 有病率
- 死亡率
- 正解は4です。
割合、率、比の3つの違いについて説明しましょう。比とは、ある量を別の量で割ったもののことです。たとえば、BMIは体重を身長で割ったものですから比の一種で、単位はkg/m2です。割合は、一部の数を全体の数で割ったもの(言い換えると、分母が分子を含んでいるもの)です。割合は、もちろん2値データや分類データを要約するために用いられる指標ですよね。この指標は、言葉の定義からいって、比の一種です。しかし、割合は、100%を超えることはなく、そして人数を人数で割っているためキャンセルして単位がない(無単位)という特徴があります。割合と区別してほしいのが率です。たとえば胃がんの発生率(incidence rate of gastric cancer)というと、一定時間に胃がんが発生するスピードで、人年法(胃がんの発生数/観察人年)で計算されます。人数を人数×年で割っているため、単位は1/年(より一般には1/時間)です。
「打率」は安打数÷打数であり、「割合」になります。
「男女比率」は男性の人数÷女性の人数であり、「比」になります。
「有病率」は疾患を有する人の人数÷全体の人数であり、「割合」になります。
「死亡率」は死亡件数÷観察人年であり、「率」になります。
文献
次のエピソードとRスクリプト
このシリーズのエピソード
- Silent Confusions Hidden in Percentages
- Who Is This Percentage About? Target Populations and Attributable Fractions
- When Odds Ratios Approximate Risk Ratios—and When They Fail
- From Risk and Rate to Survival and Hazard
- A First Note on Cox Regression
- After Cox Regression: A Case Study and R Demonstration
過去のシリーズ
用語集