
コーヒーを淹れて、言葉を交わす。湯気とともに時は流れ、統計の世界が少しずつ広がっていく。
このサイトは、統計家の父と医師の娘が交わす小さなコーヒーチャットから生まれました。研究で生じる疑問、論文でひっかかった数字、そしてときおり見える研究者たちの姿勢—大切なはずのことは、生活・臨床・因果・データ・認識・言語という複数のレイヤーにひっそりと散らばっています。コーヒーを交えた軽いやりとりは、そのいくつかを丁寧に拾っていきます。まるでその全体性(totality)を壊さぬよう、ふたりの研究の歩みをひとつの物語として紡ぐように。
生存曲線、p値の誤解から、因果と統計の階層的な関係まで。螺旋のように伏線を潜ませつつ、冬のマグカップのように温度のある言葉で語ります。数式や医療の話題も出てきますが、必要なところだけ拾ってくだされば大丈夫です。物語はRコードで再現可能。ふたりの対話とともに変化する世界観を、どうぞゆっくりと味わってください。
エピソード一覧
1. Study Design — 研究の出発点
研究は「どんな問いを立てるか」から始まります。PICO/PECO、アウトカムの選び方、バイアスの防ぎ方…。娘は父に研究の出発点について尋ねます。
- A Story of Coffee Chat and Research Hypothesis
- Data Have Types: A Coffee-Chat Guide to R Functions for Common Outcomes
- Outcomes: The Bridge from Data Collection to Analysis
- [A First Step into Survival and Competing Risks Analysis with R] 【12/15公開予定】
- [When Bias Creeps In: Selection, Information, and Confounding in Clinical Surveys] 【12/15公開予定】
このエピソードのRスクリプト一式は、こちらからダウンロードできます。R パッケージや、ここで紹介した解析手順をもう一度たどってみたい方はぜひ。
2. Glossary — 統計学のことば
3. Frequentist Thinking — 統計学の思考
がん臨床試験を題材に「仮想的に何度も研究を繰り返したときに、数字はどう振る舞うか?」という頻度論的なものの見方を父は語ります。
- [Reading a Paper over a Cup of Coffee]
- [P-Value Explanations That Seem Plausible at First Glance]
- [Beyond 0.05: Interpreting P-Values in a Clinical Trial]
これとこの次のエピソードのRスクリプト一式はこちらから。
4. Frequentist Experiments — 統計学の実証
頻度論が導く法則は、ただの抽象ではなくシミュレーション実験で確認することができます。Rに不慣れな方も、スクリプトを流すだけですので結果を再現してみてください。
- [R Demonstration of Bias in Kaplan-Meier Under Competing Risks]
- [Understanding Confidence Intervals via Hypothetical Replications in R]
- [Alpha, Beta, and Power: The Fundamental Probabilities Behind Sample Size]
これとこの次のエピソードのRスクリプト一式はこちらから。
5. Effects and Time — 効果は時間とともに
リスク差・リスク比・ハザード比、ワクチン有効率、寄与割合、そして時間とともに変化する効果を、生存曲線・累積発生曲線とともに紐解きます。因果推論に先立って立体的なデータの見方が静かに育ちます。
- [Silent Confusions Hidden in Percentages]
- [Who Is This Percentage About? Target Populations and Attributable Fractions]
- [Understanding Collapsibility of Effect Measures in Marginal and Stratified Analyses with R]
- [When Odds Ratios Approximate Risk Ratios—and When They Fail]
- [From Risk and Rate to Survival and Hazard]
- [Distinguishing Time-Point, Time-Constant, and Time-Varying Effects: An R Example]
このエピソードのRスクリプト一式はこちらから。
6. Adjusting for Bias — 回帰モデリングの風景
ロジスティック回帰の結果の見方、表の作り方から、使用上の落とし穴まで、父の手ほどきを受けるエピソード。そして…。
- [From Risk to Logistic Regression]
- [Logit: How a Transformation Shapes an Effect]
- [Where My Logistic Regression Went Wrong]
- [Why Logistic Regression Fails in Small Samples]
- [Simpson’s paradox]
このエピソードのRスクリプト一式はこちらから。
7. Truth — 真実
- [What Data Cannot Tell Us]
- [What Could Have Happened]
- [What Is It That You Want to Know?]
8. Causal Inference — 因果を見つけるために
有効非循環グラフ(DAG)、共通原因、合流点、中間媒介因子、バックドア基準。「もし〜だったら?」を統計的に考えるための因果の言葉を、確率に関する必要最小限の数式を交えて扱います。
- [Three-Variable DAGs: The Smallest Building Blocks of Causal Structure]
- [A Subtle Distinction between Common Causes and Confounders]
- [DAGs and Conditional Distributions: Two Languages for the Same Structure]
- [A Circle, an Equation, and a Cylinder]
- [Backdoor Paths, Block, and d-Separation: A Clue for Adjusting for Bias]
9. Publish a Paper — 研究のその先
研究結果をどう伝えるか、図表の作り方、推敲のコツ、査読の向き合い方。統計の“その先”を扱う、研究者の営み。
- [A Subtle Distinction Between Editors and Reviewers]
- [Three Tips for Writing a Paper]
- [Communicating with Care]
- [A Morning Just Before Submission]
読み方
まずは Study designシリーズを読めば、臨床研究の風景や「どんな問いを立てて、どんなデータを集めるか」という輪郭が見えてきます。そこから先は物語を追っても、興味の向くレイヤーを選んでも構いません。
- 論文を読む足場を整えたい: Frequentist Thinking
- 数字の意味や統計解析の実際をもう少し深く知りたい: Effects and Time / Adjusting for Bias
- 因果という見えない構造を整理したい: Causal Inference
- 研究を形にして届けるところまで見通したい: Publish a Paper
どのエピソードも独立して構成されていますが、全体を読むと、生活・臨床・因果・データ・認識・言語がひとつの流れとしてつながり、研究という営みの地図が、少しずつ頭の中にスケッチされていきます。お好みの飲み物を片手に、ふたりの会話の旅をどうぞお楽しみください。