検査陽性のとき罹患している確率
(全体の目次はこちら)
検査陽性のとき罹患している確率
- 検査精度98%の検査であっても -
「ある病気の検査で陽性だった人が
実際に罹患している可能性は?」
という問題は、
今回のコロナ禍とは関係なく
古くからある典型的な問題だが、
改めてこのネタで知人と話をしてみると
初めて聞く方には、
にわかには信じられない
結果になっているようだ。
どうして直感と大きくズレて
しまうのか?
簡単な計算ゆえ
一度丁寧に振り返っておきたい。
具体的な数字を入れた問題を提示します。
ちょっと考えてみて下さい。
人口の1%が罹患する病気がある。
検査方法は確立されていて
その精度は98%。
ここでの精度とは「正しく判定できる率」
つまり、
罹患者が検査すると、
98%が陽性となり2%が陰性となる。
非罹患者が検査すると、
98%が陰性となり2%が陽性となる。
誤判定2%ということだ。
さて、
この検査を受けて陽性だったとき
実際に罹患している率はどの程度か?
「え!?
精度が98%ということは
98%じゃないの?」
と思った方、
実はぜんぜん違うのだ。
問題文に説明用の記号を入れて
書き直してみる。
検査方法は確立されていて
その精度は98%(b)。
つまり、
罹患者が検査すると、
98%(f1)が陽性となり
2%(f2)が陰性となる。
非罹患者が検査すると、
98%(f3)が陰性となり
2%(f4)が陽性となる。
検査結果陽性者が、
実際に罹患している率(r)は?
図に示すとこんな感じだろうか。
実際の比率通りに書くと
わかりにくくなってしまうので、
あくまでも説明用に模式的に書いている。
100万人を対象にして計算してみよう。
罹患者は1%なので1万人。
つまり f1 + f2 = 1万人
f1 = 1万人x98% = 9800人
f2 = 1万人x 2% = 200人
非罹患者は99万人。
f3 = 99万人x98% = 97万200人
f4 = 99万人x 2% = 1万9800人
検査での陽性者はf1とf4。
でも実際に罹患している人はf1のみ。
r = f1 / (f1+f4) = 33%
つまり罹患率1%の環境下、
検査精度98%の検査で
陽性者が実際に罹患している率rは
33%にしかならない。
「検査精度98%」を聞いたとき
通常はf1:f2のことしか頭に浮かばず
f4がイメージしにくい。
今回の場合、
f1 約1万人に対して、
f4が約2万人もいる。
f4が実際にはかなり大きい。
そのことが、
直感とのギャップを生んでいるのであろう。
では、罹患率と検査精度を少し動かして
rの動きを見てみよう。
(E1) 検査精度を動かしてみる
罹患率1%のまま、検査精度を
99%から60%で動かすとこんな感じ。
検査精度70%程度の検査では
結果が陽性であっても
rは2%にしかならないため
事実上検査結果に意味はない、
ということになってしまう。
(E2) 罹患率を動かしてみる
検査精度98%のまま、罹患率を
0.1%から10%に動かすとこんな感じ。
これはかなり興味深い結果となっている。
罹患率10%、
つまり10人に一人が罹患しているような
そんな集団に対して検査をすれば
同じ検査精度98%の検査でも
rは84%にまで高くなる。
無作為に検査を実施しない。
患者がいる可能性が高い集団に対して
検査をする、
というのはこういう点で大きな意味がある。
(E3) 検査精度が70%だったら
(某P**検査のことを意識してではないが)
検査精度70%の場合について
試算してみたのがこの表。
数値を見ていただければわかる通り、
rの値はどの場合でも小さく、
罹患率10%という高い集団で検査をしても
rは21%までにしかならない。
r(検査陽性者が実際に罹患している率)を
あげる、つまり検査結果がある確率で
意味を持つようにするためには、
E2に書いたように、
検査集団を選ぶことがいかに有効かが
よく分かる。
ほかにrを上げる方法はないのだろうか?
実際には、検査の誤判定率は
罹患者の場合と非罹患者の場合で違う、
ということは一般的なようだ。
「罹患者なのに陰性」の間違いと
「非罹患者なのに陽性」の間違い
の率が違う、ということは
容易に想像がつく。
ウイルスが
「あるのにない」と
判定してしまう率よりも、
「ないのにある」としてしまう
誤判定の率の方が低い、
というような場合。
今、最初の問題の検査精度を
罹患者の誤判定率(2%)に対して、
非罹患者の場合はその1/10
つまり(0.2%)として図を書いてみる。
仮にこの比率を使って問題文を書き直すと
検査方法は確立されていて
その精度は罹患者に対しては98%(b)。
つまり、
罹患者が検査すると、
98%(f1)が陽性となり
2%(f2)が陰性となる。
2%が誤判定だが、
非罹患者に対しては
その率は1/10になるとする。
つまり
非罹患者が検査すると、
99.8%(f3)が陰性となり
0.2%(f4)が陽性となる。
検査結果陽性者が、
実際に罹患している率(r10)は?
となる。
最初の問題の正解rは33%だったが、
今回の条件で計算すると
f4が小さくなるため
その値r10はなんと83%になる。
結果の信頼性が大きく上がったではないか!
同様に、E1-E3のすべての場合について、
非罹患者に対する誤判定率を
罹患者に対するものの1/10として
再計算したのがこの表。
(rまたはr10が70%以上になったものは
青く塗っている)
一試算ではあるものの、この表を見ると、
(1)「検査対象において
罹患率何%の病気の検査なのか?」
(2)「検査精度(誤判定率)は、
対罹患者の場合と
対非罹患者の場合で違うのか」
(3)「違う場合、それぞれどの程度か」
これら3つの質問に対する回答によって
「検査結果が陽性だった」の意味が
大きく異なってくることがよくわかる。
逆に言えば、それらが不明なままで
「検査結果が陽性だった」
を論じても、あまり意味がないことは
表を見れば明らかだ。
単純な試算でも1%から98%までが
表に登場しているわけだから。
(全体の目次はこちら)
« 高校生が著した「タネの未来」 | トップページ | ヘンリ・ライクロフトの私記 »
「日記・コラム・つぶやき」カテゴリの記事
- 黒目川 (2) 遡行(2025.01.19)
- 黒目川 (1) 遡行(2025.01.12)
- 付箋を貼りながらの読書(2024.12.29)
- この話、この雑誌にぴったり(2024.11.10)
- 新東名高速道路 中津川橋 工事中(2024.10.27)
「科学」カテゴリの記事
- 生物を相手にする研究(2024.12.01)
- 「隠れた活動部位」こそ「心の実体」?(2024.11.24)
- 「こんにちは」と声をかけずに相手がわかるか(2024.11.17)
- 新東名高速道路 中津川橋 工事中(2024.10.27)
- 新東名高速道路 河内川橋 工事中(2024.10.20)
「社会」カテゴリの記事
- 接続はそれと直交する方向に切断を生む(2024.08.18)
- ついにこの日が来たか(2024.07.28)
- 「科学的介護」の落とし穴 (3)(2024.03.10)
- 読書を支える5つの健常性(2023.11.19)
- 迷子が知性を駆動する(2023.04.02)
コメント