Outcomes: The Bridge from Data Collection to Analysis

Study Design III − Outcomes: The Bridge from Data Collection to Analysis
Keywords: clinical trial, research hypothesis, survival & competing risks, language & writing
アウトカムってなに?
私「さっきのアウトカムについてなんだけどね。診療科内で臨床試験の論文を読むんだけど、そこで出てくる”DFS”とか”RFS”とかの略語もアウトカムだよね?実はよくわからないんだけど、当たり前のように使われているから質問しにくいんだ。DFSとRFS、どっちもがんの再発を調べてるみたいなんだけど。お父さん詳しい?」
お父さん「もちろん統計解析でDFSを扱うことはあるよ。一番よく出てくるOSは全生存期間(overall survival)だよね。DFSは無病生存期間(disease-free survival)、RFSは無再発生存期間(relapse-free survival)のこと」
私「無再発生存期間って再発までの日数のこと?」
お父さん「再発までの日数だったら無再発期間(relapse-free time)とかって言葉を選ぶかなあ。累積再発率(cumulative incidence of relapse)やCIRって呼ぶことの方が多いけど」
私「よけいにわからん。ぜんぶ同じじゃないの?」
お父さん「生存間解析ではね、細かいけど違うんだ。再発を経験せずに、死亡することもあるでしょ。無病生存期間のポイントは、再発・2次がん・死亡のうち、どれか最初のイベントまでの時間を扱うこと。だから、再発だけでなく、死亡したり別のがんを発症したりしたときも、イベントとして扱われるんだ」
私「イベント扱いって?」
お父さん「生存時間データは、一般に特定のイベントまでの経過時間なんだ。端的にいうとね、無病生存期間のデータから“3年無病生存確率”を計算するとするでしょ。それは“イベントが起こらない確率”に相当するんだけど、意味合いとしては3年時点で、再発も2次がんも経験せず、生存できる確率を求めることになる」
私「そういうことか」
お父さん「RFSでは、イベントは死亡と再発のするのが普通。つまり二次がんはイベントに含めない。無再発期間だったらイベントは再発だけ。図をみたら、イメージしやすくなるかな」

私「ふんふん。私はね、無病生存期間の結果が重要だと思うな。再発と2次がん、どっちも起きない方がいい。無再発期間はあまり解析する意味を感じないな。死亡は一番重要なイベントじゃない?なんで省いちゃうのよ」
お父さん「そうだね。でも、がんが再発した後に死亡した患者は、無再発期間だったとしてもイベント扱いになるよね」
私「確かにね。よく考えたら、再発前に亡くなるケースって、感染症とか、交通事故とかだね。がん治療や原病とは関係ないかもしれない」
お父さん「臨床試験で用いられるアウトカムは、”エンドポイント”とよばれることもあるよね。研究によって研究仮説が違うから、それにあわせて様々なエンドポイントが選ばれる。進行がんではがんの増悪に注目した無増悪生存期間、根治切除後の研究では無再発生存期間とかね。表に、がん臨床試験の主な生存時間エンドポイントを整理してあげるよ(Japan Clinical Oncology Group 2021)」
| エンドポイント | イベント1 | イベント2 | イベント3 | イベント4 | 打ち切り日 |
|---|---|---|---|---|---|
| 全生存期間 | 死亡 | 最終生存確認日 | |||
| 無増悪生存期間 | 死亡 | 増悪/再発 | 最終無増悪確認日 | ||
| 無再発生存期間 | 死亡 | 再発 | 最終生存確認日 | ||
| 無再発期間 | 再発 | 最終生存確認日 | |||
| 無病生存期間 | 死亡 | 再発 | 2次がん | 最終生存確認日 | |
| 無イベント生存期間 | 死亡 | 寛解導入失敗 | 再発 | 2次がん | 最終生存確認日 |
| 治療成功期間 | 死亡 | 治療中止(治療中の増悪/再発を含む) | プロトコール治療完了後の増悪/再発 | 最終治療継続確認日または最終無増悪確認日 |
私「でかした!」
お父さん「この表は、臨床試験グループが研究計画書を作るときのものなんだ。研究計画書は、医師や統計家がチームになって書くからね。定義を決めておかないと混乱する。このグループでは”one word one meaning”がモットーなんだ」
私「だよね、私もこんがらがり中だわ」
お父さん「OSは、生存時間の原点(time origin)から死亡するまでの期間のこと。DFSは、時間原点から再発、2次がん、死亡のうち、最初のイベントまでの期間のこと。でも、さっき言ったみたいに、3年OSとか3年DFSという言い方をすることもある。この場合は期間じゃなくて確率の意味になる。OSとDFSの違いは、再発と2次がんが含まれること。そうすると、3年OSより3年DFSの方が、確率は小さくなるよね」
私「時間原点ってはじめて聞いた。もう少し説明してよ」
お父さん「じゃあ、どの時点から生存時間をスタートするか、典型的な決め方をいくつか紹介しようか。まず、DFSは根治手術後の再発状況を調べるため用いられるアウトカムだよね。だから、”手術日”がこの場合の時間原点の候補になる。手術日のように治療の起点がはっきりしている状況だと決めやすいよね」
私「あーよくみるやつだわ」
お父さん「でしょ。一方で、もし”退院日”を時間原点にすると、手術直後の死亡が評価対象にならなくなっちゃうから、研究によってはそこを批判されるかもしれない。もうひとつ典型的な決め方を挙げると、臨床試験の登録日があるかな。ランダム化臨床試験だと、登録日に治療をランダムに割付けるから、それを原点にして生存曲線を描くのが自然だよね」
私「なるほどね、研究によって微妙に定義が違うもんね。実は今、調査票作っててね。お父さんがアウトカムにうるさいって周りに話したら、みんな意外とちゃんと区別してて。DFSとかOSを正確に知りたかったんだ。聞いてよかった、また相談するね」
OS、DFS、RFSは、特に術後補助化学療法の有効性を評価するときに用いられるアウトカム(エンドポイントともいいます)です。それでは両者は、どのような考え方で使い分けられているのでしょうか。指針の1つになっているのが、医薬品の承認審査の考え方です。たとえば抗悪性腫瘍薬の臨床評価方法に関するガイドライン(厚生労働省2021)では、抗がん剤を承認するためには、生存期間の延長などにもとづき、確実な有効性を示す必要があると述べています。そのため、具体的な指標として、OSが臨床エンドポイント(clinical endpoint)とみなされ、こちらが重視されています(Biomarkers Definitions Working Group 2001)。
その一方で、術後補助化学療法としての抗がん剤の有効性を評価する臨床試験では、代替エンドポイント(surrogate endpoint)として採用することがあります。代替エンドポイントとは、臨床エンドポイントの代わりになることが意図されたもので、臨床上の便益・害の有無を予測することが期待されるものと定義されます。DFSのような代替エンドポイントを用いる最大のメリットは、試験期間が短くなることです。ただし、過去の承認審査では、代替エンドポイントの利用が誤った医薬品評価につながったケースが数多く報告されています(Fleming and DeMets 1996)。たとえば、進行大腸がんにおける5FU+ロイコボリン併用療法は、臨床試験で腫瘍縮小がみられたにもかかわらず、臨床エンドポイントであるOSを評価すると、ほとんど延命効果がないことが明らかになりました(Fleming and DeMets 1996)。
がん臨床研究で用いられるアウトカムのひとつに無増悪生存期間(progression-free survival)があります。このアウトカムを測定するには、画像による腫瘍増悪の判定が必要になります。このとき、客観性を高めるため、第三者が画像をみて増悪を判定すると、主治医による増悪の判定と一致しないことがあり得ます。この問題は、中央判定と施設判定の不一致と呼ばれます。以下の選択肢のうち、対処法として適切でないものを選びなさい。
- 統計解析では、客観性が高い中央判定の結果を採用する
- 統計解析では、中央判定と施設判定のうち、先に起きたものを採用する
- 症例検討会を開き、中央判定と施設判定の結果が一致しない患者の扱いを医学的に決定する
- 中央判定を採用した解析と、施設判定を採用した解析の、2通りを行う
- 正解は2です
中央判定と施設判定のうち、先に起きたものを採用すると、無増悪生存期間が短くなる方向にバイアスが生じるため、適切ではありません。
ひとつだけ注意があります。施設判定ではなく中央判定を必ず採用すべき、というわけではありません。施設で増悪になった後、それが追跡状況や画像検査の頻度に影響したり、施設の担当医の治療方針が変化したりすることがあります。このような状況では、施設判定を用いることが適切かもしれません。
文献
Biomarkers Definitions Working Group. Biomarkers and surrogate endpoints: preferred definitions and conceptual framework. Clin Pharmacol Ther 2001;69(3):89-95
Fleming TR and DeMets DL. Surrogate end points in clinical trials: are we being misled? Ann Intern Med 1996;125(7):605-13
JCOGプロトコールマニュアル version 3.8 [Internet]. 東京: Japan Clinical Oncology Group; 2025
薬生薬審発0331第1号. 抗悪性腫瘍薬の臨床評価方法に関するガイドライン [Internet]. 東京: 厚生労働省医薬・生活衛生局医薬品審査管理課長; 2021
エピソード、用語集、Rスクリプト
- A Story of Coffee Chat and Research Hypothesis
- Data Have Types: A Coffee-Chat Guide to R Functions for Common Outcomes
- Outcomes: The Bridge from Data Collection to Analysis
- [A First Step into Survival and Competing Risks Analysis with R]
- [When Bias Creeps In: Selection, Information, and Confounding in Clinical Surveys]
- Statistical Terms in Plain Language
- study-design.R