メタアナリシスをするときにどの効果量を使って行うのがよいか、まとめました。
2値変数
2値変数を解析する時は、①Odds Ratio (OR) を用いて解析し、②解釈のためにControl Event RateとExperimental Event Rate (CER & EER) を計算して提示します。
比 (Risk Ratio [RR]やOR) の方が差 (Risk Difference [RD]) よりも異質性が低く、異なる集団の中でより一定であることが知られています。Engels, et al. 2000, Furukawa TA, et al. 2011. RRとORでは、RRの方が理解しやすいとの理由で推奨されることもありますがCochrane Handbook. updated 2023.、臨床家には効果が過大評価されがちであることがわかっています。Heimke F, et al. 2024. 解析をする時にはより一般性のあるORを用いて、Doi, et al. 2022 解釈をしやすくするために、CERを仮定してEERを計算し、CERとEERの両方を提示しましょう。ORは異なるCERの集団に適応できるので、本来であれば予後の良い集団・中程度の集団・悪い集団に対して提示するのがよいかと思いますが、紙面の都合で代表的なものだけにせざるを得なくなることが多いです。CERは臨床的感覚に基づいたきりの良い値でもよいはずですが、私の場合、人に説明する都合上、対照群の平均(単純でも重み付け平均でもどちらでも良いと思います)を用いることが多いです。
実際の文章例↓
Given the average response rate at 8 weeks among the placebo augmentation arm of 23% (274/1197), the rate of drop-out because of adverse events of 1% (16/1261) and the rate of drop-out for any reason of 9% (110/1197), aripiprazole augmentation with a maximum target dose of 4.0 mg (ED95) would translate into a response rate of 36% (95% CI 28–45%), a rate of drop-out because of adverse events of 4% (95% CI 1–12%) and a rate of drop-out for any reason of 10% (95% CI 5–17%). Furukawa Y, et al. 2022
We estimated the weighted average proportion of responders in placebo arms to be 16%. Applying the estimated odds ratios of the binary response NMA to this proportion, we estimated that 5-HT2A antagonists may lead to response in 64% (95% CI, 47%–78%) and beta-blockers in 39% (95% CI, 26%–53%) of the patients. Furukawa Y, et al. 2024
連続変数
連続変数を解析する時は、①共通の指標で計測されていてその単位が解釈しやすいものはMean Difference (MD)を用いて解析し、②異なる指標で計測されているものはStandardized Mean Difference (SMD) を用いて解析してCER & EERを提示するようにします。
体重増加 (kg) やプロラクチン血中濃度 (ng/mL) など、計測に用いられる単位が共通していて、かつ、解釈がしやすいものに関してはMDを用います。(例:Huhn M, et al. 2019)MDよりもSMDの方が一般化可能性が高い Takeshima N, et al. 2014 ものの、ここでは解釈可能性を優先しています。
SMDについては、Cohenによる0.8なら大きな効果、0.5なら中程度、0.2なら小さな効果という大まかな目安が知られていますが、臨床的意義とは無関係な、あくまでもざっくりとした目安に過ぎません。SMDも臨床家には誤解されやすい指標です Heimke F, et al. 2024 ので、SMDだけでなく、できる限り2値化してCER & EERを提示することが望ましいと考えています。平均とSDがあれば、2値化された値を概算することができます。Furukawa TA, et al. 2005
(統計家の方は2値化を好まないことが多い気がします。2値化によって情報量が落ちてしまうからです。ただ、臨床家としてはやはり解釈可能性も重要だと思います。また、ある程度の数があれば、連続変数で十分信頼区間が狭くなるのに2値変数だと広くなるというのはそこまでない気がします)
Protocol-drivenで
以上を踏まえて、プロトコルにどのような効果量を使うか明示しておきましょう。もしも既にプロトコルを登録している場合は、プロトコルを優先し、解釈のために+αとしてCER & EERを提示するのが良いかと思います。Don’t be data-driven!
名古屋市立大学医学部卒業後、南生協病院での初期研修を経て、東京大学医学部附属病院精神神経科、東京武蔵野病院で専攻研修。日本専門医機構認定精神科専門医、精神保健指定医。臨床と並行してメタアナリシス(用量反応メタアナリシス、要素ネットワークメタアナリシスなど)を中心とした臨床研究を主導。筆頭著者として、JAMA Psychiatry, British Journal of Psychiatry, Schizophrenia Bulletin, Psychiatry and Clinical Neuroscienceなどのトップジャーナルに論文を発表。不眠の認知行動療法 (CBT-I) などの心理療法や、精神科疾患の薬物療法について、臨床で抱いた疑問に取り組んでいる。
免責事項:当ウェブサイトは所属団体の意見を代表するものではありません。管理人は、細心の注意を払って当ウェブサイトに情報を作成していますが、情報の正確性および完全性を保証するものではありません。当ウェブサイトの情報もしくはリンク先の情報を利用したことで直接・間接的に生じた損失に関し、管理人は一切責任を負いません。