問題設定:「感染者問題」

Casscells, W., et al. (1978)の「感染者問題」は、かつてハーバード大学医学部の学生とスタッフを対象に実施された心理実験として知られている。

「罹患率が1/1000の病気を発見するための検査の偽陽性率が5%である場合、陽性の診断を受けた者が実際にその病気に罹患している確率はいくらか。その者の症状や兆候は何もわからないと仮定して答えよ。」

Casscells, W., Schoenberger, A., & Graboys, T. B. (1978). Interpretation by physicians of clinical laboratory results. New England Journal of Medicine, 299(18), 999-1001., p999.

問題解決策:ベイズの定理

単純に合理的に考えるだけなら、この「感染者問題」は「ベイズの定理(Bayes’ theorem
)」によって解くことができる。ベイズの定理は、「条件付き確率(Conditional Probability)」と確率の「乗法定理(Multiplication Theorem)」を組み合わせることで成立する定理だ。

条件付き確率とは、ある事象Aが起こったという条件の下で別の事象Bが起こる確率を意味する。記号としては、$$P(B \mid A)$$のように記す。

一方、確率の乗法定理とは、AとBが共起する際の「同時確率(Simultaneous Probability)」を単にAが起こる確率とAの下でBが起こる条件付き確率の乗法から求める定理である。数式として表すなら、下記のようになる。

$$P(A \cap B) = P(A) \times P(B \mid A)$$

ベイズの定理はこの乗法定理から導き出すことができる。上記のAとBの役割を入れ替えると、乗法定理は次のようになる。

$$P(B \cap A) = P(B) \times P(A \mid B)$$

ここで、同時確率となる$$P(A \cap B)$$と$$P(B \cap A)$$は同一の現象を意味している。そのため、上記の二つの乗法定理から、次の式を導ける。

$$P(A) \times P(B \mid A) = P(B) \times P(A \mid B)$$

$$P(B) \neq 0$$ と仮定して、$$P(A \mid B)$$について解くと、次の式が得られる。

$$P(A \mid B) = \frac{P(B \mid A) \times P(A)}{P(B)}$$

これは、BのもとでAが起こる条件付き確率は、AのもとでBが起こる条件付き確率をBが起こる確率で割った値に等しいということを説明している。言い換えれば、ベイズの定理はある条件付き確率からその「逆確率(Inverse Probability)」を求める定理だということになる。

「感染者問題」における「ベイズの定理」

以上のベイズの定理を用いて、「感染者問題」を定式化してみよう。

$$P(A), P(A’)$$

を、それぞれ罹患率と非罹患率とする。また、検査結果が陽性で、罹患している条件付き確率を$$P(B \mid A)$$とし、検査結果が陽性であるにも拘らず罹患していない条件付き確率を$$P(B \mid A’)$$とする。

上述した問題文から、各確率は次のように計算できる。

$$P(A) = \frac{1}{1000} = 0.001$$

$$P(A’) = 1 – P(A) = 0.999$$

$$P(B \mid A) = 0.95$$

$$P(B \mid A’) = 1- P(B \mid A) = 0.05$$

また、検査結果が陽性である確率は、罹患している者と罹患していない者のいずれかに対してのみ検査が実施されることから、次のようになる。

$$P(B) = P(B \mid A)P(A) + P(B \mid A’)P(A’)$$

ベイズの定理により、実際に罹患しており、検査結果が陽性となる条件付き確率は、次のようになる。

$$P(A \mid B) = \frac{P(B \mid A)P(A)}{P(B \mid A)P(A) + P(B \mid A’)P(A’)} $$

$$= \frac{0.95 \times 0.001}{(0.95 \times 0.001) + (0.05 \times 0.999)} ≒ 0.01866$$

したがって、上述した「感染者問題」の解答は約1.9%であるということになる。

派生問題:「ベイズの定理」からの違反

ところが、Casscells, W., et al. (1978)によると、この「感染者問題」の正答率は高くはなかった。曰く、回答者のおよそ半数が、罹患率は95%であると回答したという。

Kahneman, D., & Tversky, A. (1982)らが指摘するように、期待効用理論やゲーム理論をはじめとした規範的なアプローチの観点から分析すれば、人間は「ベイズの定理」に準拠した上で合理的に意思決定を実践していくと想定できる。

しかし実際のところ、人間はしばしば「ベイズの定理」から違反した意思決定を実践している。Casscells, W., et al. (1978)は特にこの違反を「基準率(base rate)」の無視と呼んでいる。こうした人間の振る舞いは文字通り「規範からの逸脱」であって、文字通り、規範的なアプローチの分析者の悩みの種となる。

しかも忘れてはならないのは、Casscells, W., et al. (1978)の心理実験の調査対象者となったのが、ハーバード大学医学部の学生とスタッフであるということだ。

「明らかに、高学歴の回答者でさえ、比較的単純な形式上の問題において、しばしば基準率の重要性を理解できないことがある。」

Casscells, W., Schoenberger, A., & Graboys, T. B. (1978). Interpretation by physicians of clinical laboratory results. New England Journal of Medicine, 299(18), 999-1001., p1000.

基準率の無視は、「ベイズの定理」をはじめとした専門知識の有無とは無関係に生じ得ると考えられる。「感染」と「陽性」の差異や「陽性」と「罹患」の差異を理解しているはずの専門家であっても、しばしば基準率を無視してしまう。「感染者問題」が物語っているのは、専門家の意思決定が、たとえその専門家自身が如何に合理性を標榜していようとも、規範的なアプローチによって想定される合理的な意思決定になるとは限らないということだ。

ベイズについての関連記事

「他責」志向の人間に統計学はできない

参考文献

  • Casscells, W., Schoenberger, A., & Graboys, T. B. (1978). Interpretation by physicians of clinical laboratory results. New England Journal of Medicine, 299(18), 999-1001., p999.
  • Kahneman, D., & Tversky, A. (1982). Evidential impact of base rates. Judgment under uncertainty: Heuristics and biases, 153-160.
  • Hoffrage, U., & Gigerenzer, G. (1996). The impact of information representation on Bayesian reasoning. In Proceedings of the eighteenth annual conference of the cognitive science society (pp. 126-130).
  • 「他責」志向の人間に統計学はできない