A Conversation on Causality at Our Table (JP)

コーヒーを淹れて、言葉を交わす。湯気とともに時は流れ、統計の世界が少しずつ広がっていく。
このサイトは、医師の娘と統計家の父が交わす小さなコーヒーチャットから生まれました。研究で生じる疑問、論文でひっかかった数字、そしてときおり見える研究者たちの姿勢—大切なはずのことは、生活・臨床・因果・データ・認識・言語という複数のレイヤーにひっそりと散らばっています。コーヒーを交えた軽いやりとりは、そのいくつかを丁寧に拾っていきます。まるでその全体性(totality)を壊さぬよう、ふたりの研究の歩みをひとつの物語として紡ぐように。
冬のマグカップのように温度のある言葉で、螺旋のように伏線を潜ませつつ語ります。数式や医療の話題も出てきますが、必要なところだけ拾ってくだされば大丈夫です。物語はRコードで再現可能。研究が完成するその朝までの道程を辿ると、散らばっていた意味が、どこかでつながります。
はじめての方へ
この物語は、研究仮説→統計→因果→言語という順で、ある臨床研究を描いています。迷った方へのおすすめエピソードはこちら。
どのエピソードも独立しているので、興味の向くレイヤーを選んでも構いません。
エピソード一覧
1. Study Design — 研究はデータではなく問いで決まる
- A Story of Coffee Chat and Research Hypothesis
- Data Have Types: A Coffee-Chat Guide to R Functions for Common Outcomes
- Outcomes: The Bridge from Data Collection to Analysis
- A First Step into Survival and Competing Risks Analysis with R
- When Bias Creeps In: Selection, Information, and Confounding in Clinical Surveys
このエピソードのRスクリプト一式は、こちらからダウンロードできます。Rパッケージや、ここで紹介した解析手順をもう一度たどってみたい方はぜひ。
このエピソードで扱うこと
- A Story of Coffee Chat and Research Hypothesis 研究の最初のつまずきは、データではなく問いの立て方にあります。PICO/PECO、比較、一般化―「何を答えたいのか」を一度言葉にしてみます。
- Data Have Types: A Coffee-Chat Guide to R Functions for Common Outcomes 呪文に見えるR関数を「アウトカムの型」と「それにあった確率モデル」から整理します。
- Outcomes: The Bridge from Data Collection to Analysis OSかPFSか―オンコロジーで繰り返される論点を手がかりに、アウトカム定義によって研究がどう変わるかを眺めます。
- A First Step into Survival and Competing Risks Analysis with R 生存時間解析は“式”より先に、イベント定義とコーディングで事故が起きます。データ収集の注意点から、競合リスクの入口まで。
- When Bias Creeps In: Selection, Information, and Confounding in Clinical Surveys バイアスは解析で帳尻合わせできないことが多い。選択バイアス・情報バイアス・交絡を「どこで混入するか」という視点で点検します。
2. Glossary — ことばがわかると数字が落ち着く
3. Frequentist Thinking — 繰り返しの中で研究はどう揺れるのか
- Reading a Paper over a Cup of Coffee
- P-Value Explanations That Seem Plausible at First Glance
- Beyond 0.05: Interpreting P-Values in a Clinical Trial
このエピソードの内容 & Rスクリプト
- Reading a Paper over a Cup of Coffee はじめて論文を読んだとき、統計の用語が意味不明だと思いませんでしたか?同じ気持ちを抱いた娘は父に質問します。
- P-Value Explanations That Seem Plausible at First Glance 「繰り返したら数字はどう振る舞う?」という頻度論の視点を、臨床試験の状況で体に落とします。
- Beyond 0.05: Interpreting P-Values in a Clinical Trial p値は「数字」ではなく、Methodsの読み方に接続される。p値について統計家たちがだした声明を扱ったエピソード。
この回と次のエピソードのRスクリプト一式はこちらから。
4. Frequentist Experiments — 頻度論の抽象をシミュレーションで具体化する
- R Demonstration of Bias in Kaplan-Meier Under Competing Risks
- Understanding Confidence Intervals via Hypothetical Replications in R
- Alpha, Beta, and Power: The Fundamental Probabilities Behind Sample Size
このエピソードの内容 & Rスクリプト
- R Demonstration of Bias in Kaplan-Meier Under Competing Risks 頻度論が導く法則は、ただの抽象ではなくシミュレーションで確認することができます。Rに不慣れな方も、スクリプトを流すだけですので結果を再現してみてください。
- Understanding Confidence Intervals via Hypothetical Replications in R 95%信頼区間はどういう意味で95%なのでしょうか?娘はRを用いたシミュレーション実験で確かめます。
- Alpha, Beta, and Power: The Fundamental Probabilities Behind Sample Size 統計学では、p値とサンプルサイズ設計が対になってエラーをコントロールします。サンプルサイズ設計入門。
この回と前のエピソードのRスクリプト一式はこちらから。
5. Effects and Time — 数字の中に織り込まれた集団と時間を紐解く
- Silent Confusions Hidden in Percentages
- Who Is This Percentage About? Target Populations and Attributable Fractions
- When Odds Ratios Approximate Risk Ratios—and When They Fail
- From Risk and Rate to Survival and Hazard
- A First Note on Cox Regression
- After Cox Regression: A Case Study and R Demonstration
このエピソードの内容 & Rスクリプト
- Silent Confusions Hidden in Percentages パーセントは直感的な疫学指標ですが、それが数字が独り歩きする理由だったとは。言葉のずれを父は語ります。
- Who Is This Percentage About Target Populations and Attributable Fractions 数字が独り歩きするのは、計算が理解されていない事だけが理由ではありません。言葉の裏に潜む集団の違いについて。
- When Odds Ratios Approximate Risk Ratios and When They Fail 「オッズ比よりオッズ比の平方根の方がよい一面もあるんだ」父は疫学の常識を揺さぶります。
- From Risk and Rate to Survival and Hazard 「生存曲線やハザード比について納得感が足りないの」娘の視点で学ぶ生存時間解析の入門講義。
- A First Note on Cox Regression Cox回帰はハザード比のモデルと言い切れるのか?便利さの裏側にある前提に迫ります。
- After Cox Regression: A Case Study and R Demonstration リスク比、ハザード比、そして時間とともに変化する効果。因果推論に先立って立体的なデータの見方が静かに育ちます。
このエピソードのRスクリプト一式はこちらから。
6. Adjusting for Bias — ロジスティック回帰に関する父からの手ほどき
- [Understanding Collapsibility of Effect Measures: Marginal vs Stratified]
- [From Risk to Logistic Regression]
- [Logit: How a Transformation Shapes an Effect]
- [Where My Logistic Regression Went Wrong]
- [Why Logistic Regression Fails in Small Samples]
- [Understanding Confounding in Effect Measures: Marginal vs Stratified]
このエピソードの内容 & Rスクリプト
- Understanding Collapsibility of Effect Measures: Marginal vs Stratified 層別解析・ロジスティック回帰とSimpsonのパラドックスの関係は?がん臨床試験で用いられる層別Cox回帰にもつながるエピソード。
- From Risk to Logistic Regression 「教えられた通り、Rでロジスティック回帰をしてみたんだけど、なんだかブラックボックスみたい」父は娘の疑問に答えます。
- Logit: How a Transformation Shapes an Effect ロジスティック回帰を基本骨格であるロジット関数。なぜロジット関数が用いられるのか統計学の秘密を明かします。
- Where My Logistic Regression Went Wrong 結果の見方、表の作り方から、使用上の落とし穴まで、父から統計解析の手ほどきを受けるエピソード。
- Why Logistic Regression Fails in Small Samples 「どうして私のロジスティック回帰は発散しちゃったの?」娘は更なる疑問を父にぶつけます。
- Understanding Confounding in Effect Measures: Marginal vs Stratified いわゆるSimpsonのパラドックスと交絡の関係は?そしてロジスティック回帰を用いた調整になにが足りないのか?
このエピソードのRスクリプト一式はこちらから。
7. Truth — 真実
- [What Data Cannot Tell Us]
- [What Could Have Happened]
- [What Structures Structure]
- [What Is It That You Want to Know?]
8. Causal Inference — グラフと反事実と数式が映し出す因果の影
- [Three-Variable DAGs: The Smallest Building Blocks of Causal Structure]
- [A Subtle Distinction between Common Causes and Confounders]
- [DAGs and Conditional Distributions: Two Languages for the Same Structure]
- [A Circle, an Equation, and a Cylinder]
- [Backdoor Paths, Block, and d-Separation: A Clue for Adjusting for Bias]
- [Volatility, Uncertainty, Complexity, and Ambiguity in Causal Inference]
このエピソードで扱うこと
- Three-Variable DAGs: The Smallest Building Blocks of Causal Structure DAG、共通原因、合流点、中間因子―因果の語彙を、いちばん小さな図から覚えます。「もし…だったら?」を描くために。
- A Subtle Distinction between Common Causes and Confounders 「交絡因子」は言葉として便利すぎる。共通原因と交絡のズレを、図で丁寧に区別します。
- DAGs and Conditional Distributions: Two Languages for the Same Structure 図は直感、式は精密。DAGと条件付き確率が、同じものを別の言語で語る感覚をつかみます。
- A Circle, an Equation, and a Cylinder DAGと確率モデルとRubin因果モデルっていったいなに?娘の疑問への答え。
- Backdoor Paths, Block, and d-Separation: A Clue for Adjusting for Bias 「ブロックする」とは、どのような操作をDAGに加えることなのか。バイアスの源を探す手触りを、最小限の形式で確かめます。
- Volatility, Uncertainty, Complexity, and Ambiguity in Causal Inference 「DAGは何のためのだろう?」「複雑さを整理し曖昧さを減らす道具だよね」父の教えへの娘からの回答。
9. Publish a Paper — 研究結果を伝えるための研究者の営み
- [A Subtle Distinction Between Editors and Reviewers]
- [Three Tips for Writing a Paper]
- [Communicating with Care]
- [A Morning Just Before Submission]
No matching items
