A Story of Coffee Chat and Research Hypothesis

Study Design I − A Story of Coffee Chat and Research Hypothesis
Keywords: research hypothesis, observational study, study design, language & writing
はじめて研究に取り組む娘と統計家の父
私「お父さんってさ、大学で統計学を教えてるんでしょ」
お父さん「そうだよ」
私「診療科の上司に、そろそろ研究して学会発表でもしてみないかって言われてさ。その先生、2016年がん対策基本法が改正されてからずっと、がん患者さんの就労支援に興味があるの。要するに、私にその調査をやらせたいみたい。まあやってみたくなくはないけどね。これって統計じゃない?」
お父さん「まあね。なにか臨床的に知りたいことや仮説はあるの?」
私「ないよ」
お父さん「仮説がないと調査がデザインできないよ」
私「まじか。データをとってから考えればいいと思ってた。うーん、やっぱり仕事を続けにくいのはどんな患者さんなのかが知りたいかな」
お父さん「女性より男性の方が、復職率が高いとか?」
私「性別にも興味あるけど、やっぱり知りたいのはがんのステージとか合併症とかかな。私が勤めているのは消化管外科なんだけど、ストーマをつけている患者さんは、手術前と同じ仕事を続けられているのだろうか、とか。うん、調査票つくってみる。ありがとう!」
お父さん「待ちなさい。調査対象は決まってるの?」
私「ん?うちの病院で手術したがん患者さん」
お父さん「胃がんでストーマを造設することってあるの?」
私「ゼロじゃないけど、みたことない」
お父さん「でしょ。ストーマに興味があるなら、胃がんは外した方がいいんじゃない?」
私「そうかなあ」
お父さん「デザイン段階で、どのような対象に調査すべきか考えておくことは大切だよ。一般論だけど、対象集団を狭く限定した方が、質問項目を詳細にできるから。それに比較可能性(comparability)も高まる。ストーマ保有者と非保有者を比べるなら、がん種は統一したいよね」
私「比較可能性とかお硬い言い方するね。でも、患者さんの背景がばらけるとやりにくいよね。なるべく揃っている方が比較しやすい、ってことはわかるよ」
お父さん「比較可能性を高めるための統計手法やRパッケージもある。回帰調整のためのglm()やプロペンシティスコア調整のためのCBPS()とかね。一方で、対象集団は広い方が、一般化可能性(generalizability)が高い。がんサバイバーの復職率を推定したいんだったら、がん種を限定する必要はないし、できれば複数の施設で調査したいよね」
私「確かに、うちの病院だけだと実態調査っていいにくい気もしてきた。一般化可能性が高い研究をしなさいっていうのは、ほかの施設の参考になるデータをとれって意味だよね」
お父さん「うんうん。大学の授業だとね、こんな風に教えてるよ。
研究で調べたい疑問がはっきりしないなら、“PICO”と”PECO”という要素を使って 研究をデザインしなさい
研究の要素をひとつひとつ決めていく計画の立て方を、研究の構造化っていったりする」
私「構造化?実際怪しいな、そこ。いや、聞いたことはある」
お父さん「じゃあ軽く整理しよう。たとえばPICO/PECOのPは、患者(Patients)または集団(Population)の頭文字をとっている。どのような患者が対象かが、研究デザインの大切な1要素だってこと」
- どのような患者が対象か(Patients/Population)
- どのような要因に注目するか(Intervention/Exposure)
- それを何と比較するのか(Comparison)
- 患者にどのようなアウトカムが生じたのか(Outcome)
私「ExposureとComparisonははじめて聞いたけど、私の場合はストーマ保有者と非保有者ってことだよね。Outcomeってなに?」
お父さん「PICO/PECOのOはアウトカムっていって、治療結果や、転帰、予後のこと。統計解析ではアウトカムのデータがいちばん重要。だから、計画でここを固めるのがポイントになる」
私「データが集まる前に固められなくない?」
お父さん「いや、データが集まっちゃったら変更が効かないでしょ。調査票を確定する前には決めておきたいよね。ああ。そうだね、アウトカムのイメージがまだないんだ。アウトカムはね、どんなデータをどうやって解析するかに関わってくる。解析結果を左右するからきちんと考えておいた方がいいんだ。データが集まった後は、どの統計ソフトを使うつもり?」
私「R。診療科の先輩が使ってるから」
お父さん「Rは得意?」
私「学部の頃、授業あったけどもうわすれたな」
お父さん「じゃあRの使い方も身につけなきゃだね。どの関数を使うかも、アウトカムによって違うんだよ」
日常診療をしていると、さまざまな疑問や知りたいことが生じることがあります。診療現場から生まれたありのままの疑問のことを、臨床疑問(clinical question)といいます。臨床研究をスタートするとき、意識してほしいのは、臨床疑問を研究仮説(research hypothesis)として表現することです。研究仮説は、研究デザインに最低限必要な要素で構成されます。たとえば典型的な臨床研究では、以下のような要素が含まれることが多いでしょう。
- Patients/Population
- Intervention/Exposure
- Comparison
- Outcome
上の会話で出てきた”PICO”や”PECO”は、この頭文字をとったものです。I(Intervention=介入)かE(Exposure=曝露)かは、その研究が薬の臨床試験のような介入研究か、今回のがんサバイバー調査のような観察研究かによって変わります。観察研究には患者さん一人ひとりを追跡するコホート研究、ある時点からさかのぼって調査するケースコントロール研究、ある1時点における要因とアウトカムを調査する横断研究がありますが、いずれもPECOで構造化が可能です。
がんサバイバー調査を題材にして、研究仮説の例を3つ考えてみました。
P: 根治切除後の直腸がん患者
E: ストーマ造設あり
C: ストーマ造設なし
O: 手術後1年以内の復職の有無
ストーマ保有者と非保有者の復職率を比較する研究を想定してみました。この場合Cをどうするかは悩ましい問題ですが、復職率の数字が得られただけでは、それが高いかどうか判断が難しいので、なんらかの比較対照を設定した方がよいでしょう。なお、比較可能性とは、この場合EとCを正しく比べられるということを意味します。
P: 根治切除後のがん患者
E: 「仕事とがん治療の両立お役立ちノート」の配布あり
C: 「仕事とがん治療の両立お役立ちノート」の配布なし
O: 手術後1年以内の復職の有無
就労支援の一環として作成された「仕事とがん治療の両立お役立ちノート」の効果を調べようという研究です。患者Pは、直腸がんに限定せず、アウトカムOは、手術後の復職の有無としました。こうした方が、幅広い患者に当てはまる調査結果が得られますよね。これが一般化可能性の一例です。アウトカムについては、別の例として、患者満足度や患者の経済状態なども考えられるでしょう。
「性・年齢、ステージ、術後補助化学療法、パフォーマンスステータス、合併症、ストーマ、手術前の就労状況、家計収入額、がん保険、就労支援サービスの利用などの因子は、1年以内の復職率と関連するか」
PECOになりにくい研究仮説もあります。たとえば、疾患発生と関連のあるリスク因子を探す、いわゆる探索的研究では、EとCははっきり決まっていません。構造化といっても、臨床疑問をかならずPECOの形式にしなければならないわけではありません。研究デザインに最低限必要な要素を特定することが大切です。
私「なるほどね、オリジナル仮説を立てろっていわれたら困るけど、研究の要素を洗い出して、ひとつひとつ決めていく作業はきらいじゃないわ。いつかは必要なことだし」
お父さん「そうでしょ。それに研究者の思考を、早い段階で専門的な表現に置き換えておくと、コミュニケーションもうまくなる。疾患やアウトカムの定義、治療や曝露内容は、医師や施設によって微妙な違いがあるものだからね。言葉をおろそかにすると混乱の種になる」
研究計画を立てるとき、しばしば”ceteris paribus”というラテン語表現が登場します。この言葉の意味にいちばん近いのはどれでしょう。
- 因果関係があるなら必ず起こる
- 普遍的に一般化できる法則
- 他の条件が同じである
- じゅうぶん多くのデータを観察する
- 正解は3です
“ceteris paribus”という概念は、比較可能性(comparability)を保つための条件と考えて問題ありません。
エピソードとRスクリプト
Data Have Types: A Coffee-Chat Guide to R Functions for Common Outcomes
[A First Step into Survival and Competing Risks Analysis with R]
[When Bias Creeps In: Selection, Information, and Confounding in Clinical Surveys]