ベイズの定理と疾病検査の信頼性についてのよもやま話 [高校の統計]
ベイズの定理と疾病検査の信頼性についてのよもやま話
日本でも新型コロナウイルスが流行しているので、「疾病検査の信頼性」に関する問題を一つ。
問題
ある感染症に感染しているかどうか調べる検査法がある。この検査法では、感染者に対して95%が陽性の結果を受け、また、、非感染者の5%に陽性の結果が出る。国民の人口の0.5%が感染症に感染しているとするとき、この検査によって陽性判定を受けたヒトが真の感染者である確率を求めよ。
ベイズの定理を用いて解くこともできるけれど、条件付き確率などの説明をしないといけないので、ベイズの定理を用いない、泥臭い方法でこの問題を解くことにする。
【解答例】
1000人検査するとすると、1000人のうちの0.5%、つまり、
1000×0.005=5人
がこの感染症に罹っていて、残りの
1000−5=995人
が非感染者の人数。
感染者5人のうち、この検査で陽性判定の受ける人数は
5×0.95=4.75人
非感染者995人のうち、この検査で陽性判定を受けるヒトの数は
995×0.05=49.75人
したがって、この検査で陽性の結果になるヒトの数は
4.75+49.75=54.5人
陽性判定を受けた54.5人のうちで実際に感染症に罹っているヒトの数は4.75人だから、答えは
4.75÷54.5≒0.087=8.7%
(解答終)
【ベイズの定理を用いた解答】
感染者である事象をA、非感染者である事象をB、検査で陽性が出る事象をEとする。
問題の条件より、
よって、ベイズの定理より求めるべき確率は
(解答終)
この結果は衝撃的だろう。
なんたって、
検査で陽性判定を受けたヒトの中で本当に感染症に感染しているヒトの割合はたったの9%で、残りの91%は感染していないのに陽性判定を受けた偽陽性のヒトなんだから。
このパラドクス的な結果が起きた理由は、全人口に占める感染者の割合、確率が0,5%と低いからなんですがね。
テレビのワイドショーのコメンテータが「国民の不安を払拭するために、希望するヒトは誰でも新型コロナウイルスの検査を受けれるようにするべきだ」と声高に主張しているけれど、そんなことをしたら、新型コロナウイルスに感染していないのに陽性判定を受ける偽陽性のヒトが山のように出て、結果、医療崩壊してしまうにゃ。
新型コロナウイルスのPCR検査の感度(新型コロナウイルスに感染しているヒトが検査を受けて陽性の結果が出る確率)は70%程度って話があるようだにゃ。
チョット小耳に挟んだ話なのでこの話の真偽はわからないけれど、
この話が本当だとしたら、
希望するヒトは誰でもPCR検査を受けれるようにしたら、もっととんでもない結果が出るケロよ。
仮に、
この検査の特異度(感染していないヒトが検査で陰性になる確率)も同じように70%――非感染者の30%が検査によって陽性判定を受ける!!――とし、日本人の0.1%(日本人の12万人以上)が新型コロナウイルスに感染しているとすると、この検査で陽性判定を受けたヒトの中に占める感染者の割合は
感度、特異度がともに90%だとしても、
日本人の0.01%である約1万2千人のヒトが新型コロナウイルスに感染しているとし、感度、特異度がともに99%であったとしても、
となり、検査によって陽性判定を受けたヒトの中でウイルスに感染しているヒトの割合は1%に満たず、陽性判定を受ける約99%が新型コロナウイルスに感染していない偽陽性のヒトってことになる。そして、この条件だと、日本人すべてを検査したら、感染していないのに陽性判定を受ける偽陽性のヒトが間違いなく100万人を突破する!!のであった。
つ・ま・り、
この手の検査は、たとえその検査がどんなに優れたものであったとしても、感染が(強く)疑われるヒトを対象に行わないと、検査自体が無意味なものになってしまうってことを示している。
参考までに、感度、特異度が70%(0.7)のとき、検査対象となる集団の感染率を横軸に、この検査で陽性判定を受けたヒトの中に占める感染者の割合を縦軸にとり、この関係を示すにゃ。
この図を見ると、検査対象となる集団の感染率が10%(0.1)のとき、検査によって陽性判定を受けるヒトの中に占める感染者の割合は約20%(0.2)、感染率が20%(0.2)のとき37%(0.37)程度であることがわかる。
感度、特異度が90%(0.9)のときは次のようになる。
調査対象の10%(0.1)が感染しているときに、ようやく、陽性判定を受けたヒトの中に占める感染者の割合が50%(0.5)に到達する。そして、クルーズ船ダイアモンド・プリンセス号のように感染率が20%近くでも、陽性判定者に占める感染者の割合は70%程度。裏を返せば、陽性判定を受けたヒトの中で感染していない偽陽性の人の割合が30%(0.3)もあったてこと。
ひょっとしたら、ネムネコが小耳に挟んだ「新型コロナウイルス検査の精度は70%」という話はこのことを言っているのかもしれない。
さらに、感度、特異度が99%(0.99)の場合も示すにゃ。
テレビなどのマスメディア、特にワイドショー受けしないからかもしれないけれど、感染率と偽陽性の人の関係について言及する(感染症の)専門家って、ほとんど、テレビのワイドショーなんかに登場しないよね。
この手の話は、医師国家試験の問題として出題されるらしいから、感染症の専門家ならば誰しも知っている基礎的な知識のはずなのに、マスコミに忖度し、この手の話をしないのだろうか。
YouTubeで、この問題について触れているお医者さんの動画があったので、紹介するにゃ。
高校の数学だと、
条件付き確率は
で定義し、したがって、
そして、
であるとき、事象AとEは独立と習ったかもしれない。
という見慣れない記号が出てきているけれど、これは、高校数学で習った条件付き確率のことでにゃ。見慣れない記号に幻惑されてはいけない。
コメント 0