Statistical Terms in Plain Language

Glossary − Statistical Terms in Plain Language
Keywords: causal model, language & writing, probability model, survival & competing risks
統計学のことば
私「お父さん、いま診療科で輪読してる論文があるんだけど、言葉のニュアンスがつかめなくて。お父さんの話って、統計用語がいろいろ出てくるでしょ。正直いって実感がわかないのもあったんだ。よければ統計用語を日常用語で言い換えてみてくれないかな」
お父さん「今日は時間があるからいいよ、いくつかやってみようか。五十音順に並べるね」
Aalen-Johansen法 Aalen-Johansen method
競合リスク解析において、累積発生曲線を推定する方法
αエラー alpha error
治療が本当は効かないのに有効と考えたり、関連がないのにあると判断してしまったりする類の誤り。偽陽性といってもよい。p値などを用いて5%以下に抑えることが、医学研究の慣習になっている
一般化線型モデル generalized linear model
「回帰モデル」の一種で、回帰分析、分散分析、ロジスティック回帰などの統計手法の総称。統計ソフトウェアでは”GLM”という略称がよく用いられる
打ち切り censoring
生存時間データを測定するとき、ある特定の時点で観察が妨げられ、その時点以降に関心のあるイベントが発生したであろうことしかわからなくなること
回帰モデル regression model
ある変数が他の変数とどのような関連にあるのかを調べるための統計手法。回帰分析と同義だが、「分析」は統計手法を指すニュアンスがあるのに対して、「モデル」というとなんらかの数式や確率分布を意味することが多い。
確率モデル probability model
抽象的なデータの見方を「モデル」とこの作品では呼んでいる。確率モデルは、データがどのような確率分布から発生するかを仮定したモデルのこと。
片側p値 one-sided p-value
相関には、正の相関と負の相関があるが、そのうちのどちらかにしか関心がないとき用いられるp値のこと。片側ではなく両側p値を用いることが一般的
Kaplan-Meier法 Kaplan-Meier method
生存時間解析において、生存曲線を推定する方法
競合リスク competing risk
がんの原病死を追跡するときの事故死のように、それが起こると関心のあるイベントが観察されなくなる、競合するイベントのこと
寄与割合 attributable fraction
リスクや発生率の数値を変換して、特定の集団におけるリスク因子への曝露が、どのくらい疾患発症に寄与するかを割合で表したもの。いくつも定義がある
効果サイズ effect size
治療の効果の大きさや、治療を比較したときの差のこと。サンプルサイズ設計では、効果サイズの値を設定しなければならないが、そもそもそれを知りたいから研究をするのだから悩ましい。このジレンマを皮肉って、「サンプルサイズから逆算して出した集積可能な差のこと」といった人もいる
交絡 confounding
集団を比較するとき気をつけるべきバイアス
Cox回帰 Cox regression
1972年にCox教授が発明し、大流行した統計手法。回帰モデルの一種だが、一般化線型モデルではない。生存時間をアウトカムとして扱い、生存曲線の差をハザード比として要約したり、様々な因子が生存時間と関連があるかどうか検討するために利用される
サンプルサイズ設計 sample size calculation
対象者数などの研究の規模を決めること。たとえば、効果サイズ、αエラー、βエラー(または検出力)を設定することで、研究に必要な対象者数を計算できる
情報バイアス information bias
情報を集めるとき気をつけるべきバイアス
推定目標(エスティマンド) estimand
臨床試験で治療を始めた後に、有害事象が生じたり、治療を中止したりすると、その試験でどのような治療効果を調べたいのか曖昧になる。推定目標とは、その研究でなにを推定したいのかを意味する統計用語。臨床試験では、計画段階で推定目標を決めておくことが、ICH E9ガイドラインにより求められている
生物統計家 biostatistician
医学・生命科学における統計専門家のことだが、バイオインフォマティシャン、データサイエンティスト、疫学者とは、所属学会やコミュニティーが異なる。狭い意味では、臨床試験を専門とする統計プロフェッショナルのことを指し、そのための資格(試験統計家認定制度)もあるくらいだが、生物(bio)という接頭辞がついているためわかりにくい
生存曲線 survival curve
横軸に時間を、縦軸にその時点で生存している割合を図示したグラフのこと。がんや循環器疾患など多くの疾患領域で、研究結果が生存曲線として示されることが多い
選択バイアス selection bias
研究の対象となる集団を選ぶとき気をつけるべきバイアス
代替エンドポイント surrogate endpoint
治療が患者の予後に与える効果を調べるとき、臨床的に意味のある指標が得られないことがある。そのような状況で代わりに用いられるエンドポイントやアウトカムのこと。たとえばがん臨床試験では、奏効率が全生存期間の代替エンドポイントとして用いられてきたが、延命効果があるかどうかを必ずしも反映しないという批判も多い
DAG(有効非循環グラフ) directed acyclic graph
抽象的なデータの見方を「モデル」とこの作品では呼んでいる。DAGは、変数間の因果関係を矢印で表した構造的な因果モデルの一種。
デザイン design
統計学では昔から実験計画のことを”design”と呼んできたが、それが転じて、研究立案やその際に決めるべき要素を意味するようになった。ランダム化臨床試験、調査、コホート研究などは、デザインの一種
バイアス bias
一般的には偏った見方や行動を指す言葉だが、統計学では、推定値が真値(推定目標)からずれる傾向やその程度の意味で用いられる。データを集めた後にバイアスがあることがわかったとしても、対処は難しい
ハザード比 hazard ratio
Cox回帰から計算される指標で、生存曲線を比較するために用いられる
比 ratio
ある量を別の量で割ることで求められる指標。割合と率は比の一種
比例ハザード性 proportional hazards assumption
死亡や増悪のようなイベントが生じるスピードが、群の間で定数倍になっていて、その関係が時間を通じて変わらないという仮定のこと
p値 p-value
研究結果をみるとき、真っ先に見てしまいがちな数字。統計学的有意(statistical significance)、つまり誤差を越えた関連があるか見分けるときに用いられる
Fine-Grayモデル Fine-Gray model
1999年にFine教授が発明した、Cox回帰を拡張した統計手法。競合リスクを含む生存時間データがアウトカムのときの回帰モデルの一種
βエラー beta error
サンプルサイズ設計の鍵になる数字。せっかく臨床試験を行ったのに、真に効く治療を有効性がないと判断してしまう確率のこと。データをたくさん集めることができ、βエラーが低いことを、「検出力が高い」という
ランダム化 randomization
新規治療と標準治療のように、介入の効果を比べたいとき、どの介入を受けるかをランダム(無作為)に決める操作のこと。バイアスが生じないようにする工夫のひとつ
率 rate
一定時間に事象が生じるスピードを表す指標。疫学では、人年法(発生数/観察人年)で計算される。人数を人数×年で割っているため、単位は1/年(より一般には1/時間)
リスク risk
疾患が生じる確率のこと。ただし、どの集団を対象に推定したかによって疾患リスクは当然異なるから、リスクの数字だけを使うのはやめたほうがよい
両側p値 two-sided p-value
相関には、正の相関と負の相関があるが、両方に関心があるとき用いられるp値のこと。片側ではなく両側p値を用いることが一般的
Rubin因果モデル Rubin causal model
抽象的なデータの見方を「モデル」とこの作品では呼んでいる。Rubin因果モデルは、同じ解析単位において原因が別の値をとっていたとき、アウトカムがどうなっていたか(潜在結果変数)を用いて、因果効果を定義したモデルのこと。割付アルゴリズムや確率分布を含めた枠組みを指すこともあるが、因果効果の定義に関わる部分に焦点を当てるため、それらは明示的には扱わない。
ロジスティック回帰 logistic regression
ある事象が生じる確率と、他の変数との関連を調べるための統計手法。2値データがアウトカムのときの回帰モデルの一種。回帰係数の指数(exponential)をとることでオッズ比を計算できる
割合 proportion
全体に対してそれが占める分量を表す指標。2値データや分類データを要約するために用いられる。人数を人数で割っているため、単位がキャンセルして単位を持たない(無単位)
私「こうして一覧で見ると、論文ででてきた呪詛もちょっとは人間の言葉に見えてきたかも」
お父さん「そうそう。用語がわかると、あとは臨床やデータ自体の話に集中できるからね」
生存曲線は英語ではsurvival curveですが、同じまたは似た意味で用いられる用語は、survival function、survival rate、overall survival curve、Kaplan-Meier curveなど無数にあります。実はそれぞれ細かい意味が違うのです。
生存曲線(survival curve)とほぼ同義
Survival function
ほぼ同義だが、曲線というよりある時点の値を意図した用語
Survival rate, survival probability, survival proportion
生存曲線をどの統計手法で推定したのかを特定する用語
Kaplan-Meier curve, Kaplan-Meier estimator, Kaplan-Meier estimate, Kaplan-Meier method
エンドポイントの種類を特定する用語
Overall survival curve, disease-free survival curve, 5-year OS, 3-year DFS
統計学では、推定方法を推定量(estimator)、推定した結果を推定値(estimate)、推定しようとしている対象を推定目標(estimand)といいます。ここは論文を書くとき注意が必要なところで、MethodsではKaplan-Meier estimatorと書くのが自然ですし、ResultsではKaplan-Meier estimateを用いることが多いでしょう。「人名+estimator」の代わりに「人名+method」という表記もできて、Kaplan-Meier methodの方がより広い意味で用いることができます。
最後に注意してほしいのが、累積発生曲線(cumulative incidence curve)や累積発生関数(cumulative incidence function)です。論文の図の縦軸のラベルに用いられることが多い表現ですが、生存曲線と本質的に違いはないと思いがちですよね。しかしこれらは、競合リスクがあるときにだけ用いられる、統計家が意識して区別している用語です。専門的には、統計家の名前を用いてAalen-Johansen曲線とも呼びます。生存曲線の上下を反転したグラフを”cumulative”と呼ぶことがありますが、これは統計用語ではなく慣習的な表現です。累積発生曲線と区別しないと誤解が生じます。
以下の4つの単語は、正式な統計用語ではありませんが、しばしば臨床試験の文献で目にするものです。このうち、誤りとはいえないものはどれでしょう。
- サンプル数
- COX回帰
- OS曲線
- T検定
- 正解は3です。
サンプルサイズのことをサンプル数と表記している文献がありますが、サンプル数は臨床試験でいえば群の数に相当するので、用法として誤りです。Coxは人名なので、1文字目以外は大文字ではありません。OS曲線は、overall-survival curveの意味ととれなくはないので、誤りとはいえないでしょう。t検定のことをT検定と表記するケースも目にします。T検定は、t検定とは別の統計手法として存在するのですが、臨床試験では使われないため誤記でしょう。