NNT計算
対照群イベント率(CER)と実験群イベント率(EER)を入力し、NNT・ARR・RRRを計算します。各群のサンプルサイズを追加すると、NNTの95%信頼区間も算出できます。
治療なし群でのイベント発生率(例:20%)
治療あり群でのイベント発生率(例:12%)
サンプル数を入力するとNNTの95%信頼区間を計算できます
治療必要数
結果は教育目的の推定値であり、臨床的判断や専門的な医療アドバイスの代替ではありません。
治療必要数(NNT):エビデンスに基づく臨床指標ガイド
治療必要数(NNT: Number Needed to Treat)は、エビデンスに基づく医療(EBM)において最も実用的な指標のひとつです。NNTは、一定の期間内に対照条件と比較して1人の患者が追加的に恩恵を受けるために、何人の患者に治療を施す必要があるかを表します。NNTが低いほど一般的に介入の有効性が高いことを示し、治療効果を抽象的な相対リスク比ではなく、具体的で直感的な数値として臨床医・研究者・患者が理解できるようにします。
NNTは1988年にLaupaciisらがNew England Journal of Medicineに発表した論文で提唱され、以来ランダム化比較試験・システマティックレビュー・コクランレビューの標準的な報告ツールとなっています。NNTはランダム化比較試験の結果を、意思決定の共有に役立つ単一の実用的な数値に変換します。
3つの基本指標:ARR・RRR・NNT
NNTの計算を支える3つの相互に関連する統計量があります。1つ目は対照群イベント率(CER)で、プラセボまたは標準治療を受けた対照群において、研究期間中に対象アウトカムを経験した患者の割合です。2つ目は実験群イベント率(EER)で、治療群において同じアウトカムを経験した患者の割合です。この2つの率から、絶対リスク減少(ARR)がCER − EERとして算出されます。
ARRは治療効果の絶対的な大きさを示します。CERが20%でEERが12%の場合、ARRは8パーセントポイントです。NNTはARRの逆数で、1 ÷ 0.08 = 12.5、約13に丸められます。これは、対照条件と比較して1人の患者がアウトカムを回避するために、平均して約13人の患者に実験的介入を施す必要があることを意味します。
相対リスク減少(RRR)はARRをCERで割ったものです。同じ例では、8% ÷ 20% = 40%となります。RRRはベースラインリスクに対する利益の大きさを表します。製薬マーケティングではRRRがARRよりも印象的に見えるため強調される傾向があります。40%の相対的減少は8パーセントポイントの絶対的減少よりもはるかに大きく聞こえます。両方の指標を併せて理解することで、より完全な全体像が得られます。
EERがCERを超える場合:害必要数(NNH)
実験群イベント率が対照群イベント率を上回る場合、つまり治療群が対照群よりも多くの有害事象を経験している場合、ARRは負の値になります。この状況では、介入は利益ではなく害に関連しており、絶対リスク差の逆数は害必要数(NNH: Number Needed to Harm)として再解釈されます。NNHは、1人の患者が追加の有害事象を経験するために何人の患者が介入を受ける必要があるかを表します。
NNHは臨床上の意思決定において同様に重要です。特定の患者集団における利益の可能性と害の可能性を比較するため、NNTとNNHを比較検討することは、治療の利益・リスクプロファイルが好ましいかどうかを評価する重要な要素です。NNTが10でNNHが100の治療は一般的に有益と見なされますが、NNTが50でNNHが5の治療は深刻な懸念を引き起こします。
NNTとNNHは異なる研究間で直接比較できない場合があることに注意が必要です。測定されるアウトカムが異なることが多いためです(例:心筋梗塞の予防と消化管出血の発生)。同一のよく設計された試験において、利益と害の両方のエンドポイントが事前に設定されている場合のNNTとNNHの組み合わせが、最も信頼性の高い比較を提供します。
NNTの95%信頼区間の計算
NNTの点推定値は有用ですが、適切な解釈には信頼区間が不可欠です。NNTはARRの逆数であるため、信頼区間はまずARRの信頼区間を計算し、その境界値を反転させることで導出されます。ARRの標準誤差はWald公式で近似できます:SE(ARR) = √[(CER × (1 − CER) / n対照) + (EER × (1 − EER) / n実験)]。ここでn対照とn実験は各群のサンプルサイズです。
ARRの95%信頼区間はARR ± 1.96 × SE(ARR)で、両境界値を反転させるとNNTの対応する信頼区間が得られます。狭い信頼区間は精度の高い推定を示し、広い信頼区間は真のNNTが点推定値から大きく異なる可能性を示唆します。ARRの信頼区間がゼロを跨ぐ場合、NNTの信頼区間は正の値(利益)から無限大を経て負の値(害)にまたがるため、慎重な解釈が必要です。
この計算ツールはWald近似を使用しており、中程度のサンプルサイズでイベント率が0%や100%から十分離れている場合に良好な性能を発揮します。非常に小さなサンプル、非常にまれなイベント、または境界値に近いイベント率の場合は、正確二項法やスコアベースの信頼区間などのより高度な方法が望ましい場合があります。
時間軸と文脈依存性
NNTは常に特定の期間(試験期間または追跡期間)にわたって計算されます。5年間の脳卒中予防に対するNNT 25は、10年間の同じアウトカム予防に対するNNT 25とは実際的に異なる意味を持ちます。研究間でNNT値を比較する際には、時間軸が同等であることを確認するか、追跡期間の差異を調整することが不可欠です。
ベースラインリスクもNNTに大きく影響します。RRRが30%の治療でも、対照群イベント率が2%の場合(NNT ≈ 167)と20%の場合(NNT ≈ 17)では大きく異なるNNTになります。高リスク患者は同じ相対リスク減少からより大きな絶対的利益を得ます。つまり、臨床試験から得られたNNT値を、試験集団とベースラインリスクが異なる個々の患者に適用する際には慎重な判断が必要です。
システマティックレビューと診療ガイドラインにおけるNNT
コクランレビューや診療ガイドラインでは、相対リスクやオッズ比といった従来の指標に加えて、NNTの報告が増えています。NNTの利点は直接的な臨床解釈が可能なことです。医師は患者に「この薬を1年間服用する20人に1人が追加的に心筋梗塞を回避できます」と説明でき、相対リスク0.85という数値では伝えにくい情報を伝えることができます。
GRADE(Grading of Recommendations Assessment, Development and Evaluation)フレームワークは、診療ガイドラインの策定に広く採用されており、透明性のある患者中心のエビデンス提示を支援するため、相対リスク指標と並んでNNTの基となる絶対リスク差の報告を推奨しています。英国のNICEや主要な循環器学会・腫瘍学会は、ガイドラインに定期的にNNTデータを掲載しています。
TheNNT.comなどのオンラインリソースは、多くの一般的な治療法や予防的介入について、エビデンスの質と測定されたアウトカムごとに分類された事前計算済みのNNT値を提供しています。これらのキュレーションされたリソースにより、臨床医は一次文献から再計算することなく、要約統計量に迅速にアクセスできます。
絶対リスクと相対リスク:両方が重要な理由
臨床試験結果の解釈で最もよく見られる誤りのひとつは、絶対リスク減少を無視して相対リスク減少にのみ着目することです。「薬Xは心筋梗塞リスクを50%削減」という見出しは説得力がありますが、ベースラインリスクが0.2%の場合、絶対的な減少はわずか0.1パーセントポイントでNNTは1,000になります。一方、20%のベースラインからの50%の相対的減少ではNNTは10となり、臨床的な意味合いは劇的に異なります。
RRRはベースラインリスクが異なる患者集団間でも比較的安定する傾向がありますが、ARRとNNTは基礎となるイベント率によって変動します。このため、システマティックレビューではRRRを主要な効果指標として報告し、対象集団のベースラインリスクにRRRを適用してNNTを導出することがよくあります。このアプローチにより、同じ試験エビデンスを異なるリスクプロファイルの患者に適応させることができます。
この関係を理解することは、最も恩恵を受ける可能性が高い患者の特定にも役立ちます。高リスク患者はベースラインイベント率が高いため、同じ治療からより低い(より好ましい)NNTが得られ、1人あたりの治療決定による絶対的利益が大きくなります。リスク層別化ツールや臨床リスクスコア(心血管疾患のフラミンガムスコアなど)と試験のRRRデータを組み合わせることで、個別化されたNNT値を推定できます。
NNTの限界
NNTの直感的な魅力にもかかわらず、いくつかの広く認識された限界があります。NNTは二値のアウトカム(イベントの有無)を前提としており、重症度・期間・生活の質への影響が異なるアウトカムを捉えることはできません。たとえば、「いかなる入院」をカウントするNNTでは、1日の入院と6か月の入院を同等のアウトカムとして扱いますが、これは臨床的または患者の優先事項を反映していない場合があります。
NNTはアウトカムの具体的な定義と研究対象集団のベースラインリスクに大きく依存します。臨床試験のNNTを、試験参加者とリスクプロファイルが異なる患者に適用する際には注意が必要です。試験集団の人口統計・併存疾患・治療アドヒアランス・競合リスクは、日常診療で遭遇する個々の患者とは大きく異なる場合があります。
最後に、前述のとおりNNTは時間依存的であり、追跡期間が異なる試験間での直接比較は調整なしには意味がありません。ハザード比とベースラインイベント率が既知の場合、年間NNTや標準時間軸に調整されたNNTを計算できることがありますが、この外挿には追加の不確実性が伴います。
この計算ツールの使い方
この計算ツールは、対照群イベント率(CER)と実験群イベント率(EER)をパーセンテージで入力し、ARR・RRR・NNTを算出します。EERがCERを超える場合はNNHが表示されます。各群のサンプルサイズを入力すると、Wald近似によるNNTの95%信頼区間も算出されます。
イベント率は、公表された臨床試験報告書・システマティックレビュー・メタアナリシスから取得できます。対照群イベント率はプラセボまたは標準治療を受けた群のアウトカム、実験群イベント率は評価対象の介入を受けた群のアウトカムを表します。すべての結果は、イベント率の出典となった研究の対象集団・追跡期間・アウトカム定義の文脈で解釈する必要があります。
これらの結果はエビデンスに基づく医療の概念理解を支援するための教育ツールとして提供されています。臨床判断・個別の患者評価・専門的な医療アドバイスの代替となるものではありません。
よくある質問
NNTとは何ですか?どのように計算しますか?
NNT(治療必要数)は、対照条件と比較して1人の患者が追加的に恩恵を受けるために、何人の患者に治療を施す必要があるかを表す数値です。NNT = 1 ÷ ARRで計算され、ARR(絶対リスク減少)= CER(対照群イベント率)− EER(実験群イベント率)です。たとえば、未治療患者の20%にイベントが発生し、治療群では12%の場合、ARR = 8% = 0.08、NNT = 1 ÷ 0.08 = 12.5となります。
ARRとRRRの違いは何ですか?
ARR(絶対リスク減少)は対照群と実験群のイベント率の単純な差:CER − EERです。RRR(相対リスク減少)はARRを対照群イベント率に対する割合で表したもの:ARR ÷ CERです。ARRは絶対的なリスクの低下幅を示し、RRRはベースラインリスクに対する割合としての低下を示します。マーケティングではRRRがより大きく見えるため強調されることが多く、40%のRRRは8%のARRよりも印象的に聞こえますが、同じ試験結果を表している場合があります。
NNHとは何ですか?
NNH(害必要数)は、介入がイベントの減少ではなく増加に関連している場合(EER > CER)に使用されます。1人の患者が追加の有害アウトカムを経験するために何人の患者が介入を受ける必要があるかを表します。NNH = 1 ÷ ARI(絶対リスク増加)で、ARI = EER − CERです。NNHが低いほど、治療患者あたりの害のリスクが高いことを示します。
NNTの95%信頼区間はどう解釈しますか?
NNTの95%信頼区間は、研究のサンプルサイズと観察されたイベント率に基づいて、真のNNTが95%の確率で含まれると推定される範囲を示します。狭い信頼区間は精度の高い推定を示し、広い信頼区間はより大きな不確実性を示します。信頼区間が正のNNT(利益)から無限大を経て負の値(NNHを示唆)にまたがる場合、ARRの信頼区間がゼロを跨いでおり、試験結果は5%水準で統計的に有意ではないことを意味します。
NNTが低ければ常に良いのですか?
NNTが低いほど、1人の追加的な恩恵を得るために必要な治療患者数が少なく、より効率的であることを一般的に示します。ただし、NNTはNNH・測定されたアウトカムの重症度と重要性・治療のコストと負担・時間軸と併せて解釈する必要があります。軽微なアウトカムに対するNNT 5は、死亡予防に対するNNT 50よりも臨床的価値が低い場合があり、文脈によって判断が異なります。
なぜNNTは患者集団によって異なるのですか?
NNTはベースラインイベント率(CER)に依存し、CERはリスクレベルの異なる集団間で変動します。同じ治療でも集団間で一貫した相対リスク減少(RRR)を示す場合がありますが、絶対リスク減少(ARR)、したがってNNTはベースラインリスクに応じて異なります。高リスク患者はベースラインイベント率が高いため、同じ治療からより低い(より好ましい)NNTが得られます。