« 高校生が著した「タネの未来」 | トップページ | ヘンリ・ライクロフトの私記 »

2020年10月 4日 (日)

検査陽性のとき罹患している確率

(全体の目次はこちら



検査陽性のとき罹患している確率

- 検査精度98%の検査であっても -

 

「ある病気の検査で陽性だった人が
 実際に罹患している可能性は?」

という問題は、
今回のコロナ禍とは関係なく
古くからある典型的な問題だが、
改めてこのネタで知人と話をしてみると
初めて聞く方には、
にわかには信じられない
結果になっているようだ。

どうして直感と大きくズレて
しまうのか?

簡単な計算ゆえ
一度丁寧に振り返っておきたい。

具体的な数字を入れた問題を提示します。
ちょっと考えてみて下さい。

【問題】

人口の1%が罹患する病気がある。
検査方法は確立されていて
その精度は98%

ここでの精度とは「正しく判定できる率」
つまり、
罹患者が検査すると、
 98%が陽性となり2%が陰性となる。
非罹患者が検査すると、
 98%が陰性となり2%が陽性となる。
誤判定2%ということだ。


さて、
この検査を受けて陽性だったとき
実際に罹患している率は
どの程度か?

 

「え!? 
 精度が98%ということは
 98%じゃないの?」
と思った方、
実はぜんぜん違うのだ。

問題文に説明用の記号を入れて
書き直してみる。

人口の1%(a)が罹患する病気がある。
検査方法は確立されていて
その精度は98%(b)
つまり、
罹患者が検査すると、
 98%(f1)が陽性となり
 2%(f2)が陰性となる。
非罹患者が検査すると、
 98%(f3)が陰性となり
 2%(f4)が陽性となる。

検査結果陽性者が、
実際に罹患している率(r)は?

図に示すとこんな感じだろうか。
実際の比率通りに書くと
わかりにくくなってしまうので、
あくまでも説明用に模式的に書いている。

Rikan1

100万人を対象にして計算してみよう。
罹患者は1%なので1万人。
つまり f1 + f2 = 1万人
 f1 = 1万人x98% = 9800人
 f2 = 1万人x 2% = 200人
非罹患者は99万人。
 f3 = 99万人x98% = 97万200人
 f4 = 99万人x 2% = 1万9800人

検査での陽性者はf1とf4。
でも実際に罹患している人はf1のみ。
 r = f1 / (f1+f4) = 33%

つまり罹患率1%の環境下、
検査精度98%の検査で
陽性者が実際に罹患している率rは
33%にしかならない


「検査精度98%」を聞いたとき
通常はf1:f2のことしか頭に浮かばず
f4がイメージしにくい。
今回の場合、
 f1 約1万人に対して、
 f4が約2万人もいる。
f4が実際にはかなり大きい。
そのことが、
直感とのギャップを生んでいるのであろう。

 

では、罹患率と検査精度を少し動かして
rの動きを見てみよう。

(E1) 検査精度を動かしてみる

Rikan3

罹患率1%のまま、検査精度を
99%から60%で動かすとこんな感じ。
検査精度70%程度の検査では
結果が陽性であっても
rは2%にしかならないため
事実上検査結果に意味はない、
ということになってしまう。

 

(E2) 罹患率を動かしてみる

Rikan4

検査精度98%のまま、罹患率を
0.1%から10%に動かすとこんな感じ。
これはかなり興味深い結果となっている。
罹患率10%、
つまり10人に一人が罹患しているような
そんな集団に対して検査をすれば
同じ検査精度98%の検査でも
rは84%にまで高くなる。

無作為に検査を実施しない。
患者がいる可能性が高い集団に対して
検査をする

というのはこういう点で大きな意味がある。

 

(E3) 検査精度が70%だったら

Rikan5

(某P**検査のことを意識してではないが)
検査精度70%の場合について
試算してみたのがこの表。
数値を見ていただければわかる通り、
rの値はどの場合でも小さく、
罹患率10%という高い集団で検査をしても
rは21%までにしかならない。

 

r(検査陽性者が実際に罹患している率)を
あげる、つまり検査結果がある確率で
意味を持つようにするためには、
E2に書いたように、
検査集団を選ぶことがいかに有効か

よく分かる。

ほかにrを上げる方法はないのだろうか?

実際には、検査の誤判定率は
罹患者の場合と非罹患者の場合で違う、
ということは一般的なようだ。

「罹患者なのに陰性」の間違いと
「非罹患者なのに陽性」の間違い
の率が違う、ということは
容易に想像がつく。

ウイルスが
 「あるのにない」と
  判定してしまう率よりも、
 「ないのにある」としてしまう
  誤判定の率の方が低い、
というような場合。

今、最初の問題の検査精度を
罹患者の誤判定率(2%)に対して、
非罹患者の場合はその1/10
つまり(0.2%)として図を書いてみる。

Rikan7

仮にこの比率を使って問題文を書き直すと

人口の1%(a)が罹患する病気がある。
検査方法は確立されていて
その精度は罹患者に対しては98%(b)
つまり、
罹患者が検査すると、
 98%(f1)が陽性となり
 2%(f2)が陰性となる。

2%が誤判定だが、
非罹患者に対しては
その率は1/10になるとする。
つまり
非罹患者が検査すると、
 99.8%(f3)が陰性となり
 0.2%(f4)が陽性となる。

検査結果陽性者が、
実際に罹患している率(r10)は?

となる。

最初の問題の正解rは33%だったが、
今回の条件で計算すると
f4が小さくなるため
その値r10はなんと83%になる

結果の信頼性が大きく上がったではないか!

同様に、E1-E3のすべての場合について、
非罹患者に対する誤判定率を
罹患者に対するものの1/10として
再計算したのがこの表。
(rまたはr10が70%以上になったものは
 青く塗っている)

Rikan6

一試算ではあるものの、この表を見ると、

(1)「検査対象において
  罹患率何%の病気の検査なのか?」

(2)「検査精度(誤判定率)は、
  対罹患者の場合と
  対非罹患者の場合で違うのか」

(3)「違う場合、それぞれどの程度か」

これら3つの質問に対する回答によって
「検査結果が陽性だった」の意味が
大きく異なってくることがよくわかる。

逆に言えば、それらが不明なままで
「検査結果が陽性だった」
を論じても、あまり意味がないことは
表を見れば明らかだ

単純な試算でも1%から98%までが
表に登場しているわけだから。

 

 

(全体の目次はこちら

 

 

 

 

 

« 高校生が著した「タネの未来」 | トップページ | ヘンリ・ライクロフトの私記 »

日記・コラム・つぶやき」カテゴリの記事

科学」カテゴリの記事

社会」カテゴリの記事

コメント

コメントを書く

(ウェブ上には掲載しません)

« 高校生が著した「タネの未来」 | トップページ | ヘンリ・ライクロフトの私記 »

最近のトラックバック

2025年1月
      1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31  
無料ブログはココログ