序
傾向スコア分析(propensity score analysis)は、臨床研究や疫学研究に用いられる応用的な統計手法の一つである。本手法を用いた論文は激増しており、ここ17年間に100倍以上に膨れ上がっている。それほど傾向スコア分析は脚光を浴びている統計手法である。
傾向スコア分析は「観察データを用いて擬似ランダム化を行い、ランダム化比較試験に準じる結果を得られる」という点で画期的な手法である。トップクラスのジャーナルでは、観察研究で治療の効果比較を行う場合、この手法をやって当たり前、というほどに一般化しつつある。
本書を手に取っていただいた読者のなかには、傾向スコア分析という言葉を聞いたことはあるが、どんな方法かよくわからないという方も多いだろう。あるいは、傾向スコア分析を活用している論文を読んで、自分もやってみたくなったが、具体的にどうすればいいのかわからない、という方も少なくないだろう。
多くの研究者が傾向スコア分析を使いたいと考えているにもかかわらず、傾向スコア分析の基本的な理論や実践的な分析方法についてわかりやすく書かれた日本語の教科書はこれまで見当たらない。
筆者らは2018年6月現在、傾向スコア分析を用いた論文をすでに約70本出版してきた。また、多くの研究者から傾向スコア分析についての相談を受け、個別にサポートしてきた。その経験に基づいて、統計学の初心者でも理解できるように、傾向スコア分析の基礎理論と実践的なノウハウを本書にまとめ上げた。
前書の「できる!臨床研究 最短攻略50の鉄則」(金原出版、2017)では、1節を割いて傾向スコア分析の概略を記した。本書は傾向スコア分析に的を絞り、前書の内容を大幅に拡大して、傾向スコア分析に関する基礎理論のエッセンスと統計ソフトを用いた分析手順を、噛んで含めるようにわかりやすく解説している。本書があれば、統計の初学者であっても、傾向スコア分析を自由自在に操ることができるようになるだろう。
傾向スコア分析は、観察データを用いた治療効果の比較分析において大きな問題となる「適応による交絡(confounding by indication)」を調整する統計手法の一つである。適応による交絡とは、患者の背景因子や医療施設の要因が、治療効果だけでなく、治療の割り当てにも影響を与えるバイアスである。
適応による交絡を排除する最も良い方法が、ランダム化比較試験であることは言うまでもない。しかしランダム化比較試験は倫理的問題や巨額な費用がかかる点がネックとなり、多くの場合に実施困難である。次善の手段として、観察データを用いた傾向スコア分析を行うことにより、適応による交絡の影響をある程度まで克服できる。
しかし、傾向スコア分析にも限界がある。特に問題となるのが「未測定交絡因子(unmeasured confounders)」の影響である。ところが最近、その限界が十分に理解されないまま、傾向スコア分析が誤用されるケースも増えているようである。
傾向スコア分析の利用が広がるにつれて、臨床家の間では、傾向スコア分析に対する2種類の異なる「誤解」が広がっているように、筆者らは感じている。第1の誤解は、傾向スコア分析に対する過大な期待によるものである。ランダム化比較試験を行わなくても、傾向スコア分析によって代用できる、と考えられがちである。この種の誤解が、傾向スコア分析の誤用・乱用を生んでいる。
近年は、傾向スコア分析の誤用の増加に対する批判論文も現れている。そのため一部の臨床研究者たちによって、傾向スコア分析そのものに懐疑的な目を向けられてしまうことがある。これが傾向スコア分析に対する第2の誤解である。
傾向スコア分析は、正しく適用すれば、観察データにおける適応による交絡の影響を調整し、データから妥当な結論を導き出すことができる、強力な分析ツールである。しかし、しばしば傾向スコア分析を適用できない、あるいは適用する必要がないケースが存在する。
近年は、ジャーナルの編集者も査読者も目が肥えており、傾向スコア分析の質そのものを問われる時代になっている。本書は、上記の2つの誤解を解き、臨床家が傾向スコア分析を正しく適用することができるように、統計家ではなく臨床家にわかる言葉で書かれたものである。
本書の構成は「I 理論編」と「II 実践編」に分かれる。「I 理論編」では、傾向スコアの概念と傾向スコア分析の方法と注意点について概説している。「II 実践編」では、SPSS、Stata、Rという3種類の統計ソフトを用いた傾向スコア分析の実践的な手順について解説している。
SPSS、Stata、Rそれぞれの特徴や利点について、以下の表にまとめる。SPSSはGraphical User Interface(GUI)というインターフェースを採用しており、ほとんどの操作をクリックのみで実現可能である。その利便性ゆえに臨床家の間でも支持されており、最も汎用されるソフトである。しかし、他のソフトと比較したSPSSの長所は、それだけである。
傾向スコア分析についてはStataが最も優れている。Stataは、スクリプトを入力するCharacter User Interface(CUI)中心であるが、最新のバージョンではGUIも充実している。何よりHelp機能が充実しており、ユーザー・フレンドリーである点もSPSSに勝るとも劣らない。しかもSPSSよりもかなり低価格である。
Rはプログラム言語であり、初心者にはかなりとっつきにくいが、RStudioという補助ツールを用いればかなり楽に操作できる。Stataと同様、最新の応用統計にも対応できる。Rの最大の利点は、無料で利用できることである。
実践編はどの章から読み始めてもよいだろう。SPSSユーザーは第3章、Stataユーザーは第4章、Rユーザーは第5章から読み始めてもよい。
最後に、本書執筆中に常に細やかなご支援を頂いた金原出版編集者の山下眞人氏と須之内和也氏に厚く御礼を申し上げる。
2018年6月
康永 秀生・笹渕 裕介・道端 伸明・山名 隼人