効果量として何を使うか

メタアナリシスをするときにどの効果量を使って行うのがよいか、まとめました。

2値変数

2値変数を解析する時は、①Odds Ratio (OR) を用いて解析し、②解釈のためにControl Event RateとExperimental Event Rate (CER & EER) を計算して提示します。

比 (Risk Ratio [RR]やOR) の方が差 (Risk Difference [RD]) よりも異質性が低く、異なる集団の中でより一定であることが知られています。Engels, et al. 2000, Furukawa TA, et al. 2011. RRとORでは、RRの方が理解しやすいとの理由で推奨されることもありますがCochrane Handbook. updated 2023.、臨床家には効果が過大評価されがちであることがわかっています。Heimke F, et al. 2024. 解析をする時にはより一般性のあるORを用いて、Doi, et al. 2022 解釈をしやすくするために、CERを仮定してEERを計算し、CERとEERの両方を提示しましょう。ORは異なるCERの集団に適応できるので、本来であれば予後の良い集団・中程度の集団・悪い集団に対して提示するのがよいかと思いますが、紙面の都合で代表的なものだけにせざるを得なくなることが多いです。CERは臨床的感覚に基づいたきりの良い値でもよいはずですが、私の場合、人に説明する都合上、対照群の平均(単純でも重み付け平均でもどちらでも良いと思います)を用いることが多いです。

実際の文章例↓

Given the average response rate at 8 weeks among the placebo augmentation arm of 23% (274/1197), the rate of drop-out because of adverse events of 1% (16/1261) and the rate of drop-out for any reason of 9% (110/1197), aripiprazole augmentation with a maximum target dose of 4.0 mg (ED95) would translate into a response rate of 36% (95% CI 28–45%), a rate of drop-out because of adverse events of 4% (95% CI 1–12%) and a rate of drop-out for any reason of 10% (95% CI 5–17%). Furukawa Y, et al. 2022

We estimated the weighted average proportion of responders in placebo arms to be 16%. Applying the estimated odds ratios of the binary response NMA to this proportion, we estimated that 5-HT2A antagonists may lead to response in 64% (95% CI, 47%–78%) and beta-blockers in 39% (95% CI, 26%–53%) of the patients. Furukawa Y, et al. 2024

連続変数

連続変数を解析する時は、①共通の指標で計測されていてその単位が解釈しやすいものはMean Difference (MD)を用いて解析し、②異なる指標で計測されているものはStandardized Mean Difference (SMD) を用いて解析してCER & EERを提示するようにします。

体重増加 (kg) やプロラクチン血中濃度 (ng/mL) など、計測に用いられる単位が共通していて、かつ、解釈がしやすいものに関してはMDを用います。(例:Huhn M, et al. 2019)MDよりもSMDの方が一般化可能性が高い Takeshima N, et al. 2014 ものの、ここでは解釈可能性を優先しています。

SMDについては、Cohenによる0.8なら大きな効果、0.5なら中程度、0.2なら小さな効果という大まかな目安が知られていますが、臨床的意義とは無関係な、あくまでもざっくりとした目安に過ぎません。SMDも臨床家には誤解されやすい指標です Heimke F, et al. 2024 ので、SMDだけでなく、できる限り2値化してCER & EERを提示することが望ましいと考えています。平均とSDがあれば、2値化された値を概算することができます。Furukawa TA, et al. 2005

(統計家の方は2値化を好まないことが多い気がします。2値化によって情報量が落ちてしまうからです。ただ、臨床家としてはやはり解釈可能性も重要だと思います。また、ある程度の数があれば、連続変数で十分信頼区間が狭くなるのに2値変数だと広くなるというのはそこまでない気がします)

Protocol-drivenで

以上を踏まえて、プロトコルにどのような効果量を使うか明示しておきましょう。もしも既にプロトコルを登録している場合は、プロトコルを優先し、解釈のために+αとしてCER & EERを提示するのが良いかと思います。Don’t be data-driven!


投稿日

最終更新日

投稿日カテゴリー:

投稿者:

タグ: