先给大家讲个书上的故事:现代技术检测 HIV 病毒的准确度已经到了惊人的程度。如果一个人真是 HIV 阳性,血液检测的手段有 99.9% 的准确率,也就是说有 99.9% 的可能性把他这个阳性给检查出来而不漏网。如果一个人不携带 HIV,那么检测手段的精度更高,达到99.99% ——也就是说有 99.99% 的可能性不会冤枉他。
现在假设我们随便在街头找一个人给他做检查,发现检测结果是 HIV 阳性,那么请问这个人真有 HIV 的可能性是多大呢?
在你回答之前,我要提供一点背景资料。德国马普研究所的心理学家曾经拿这道题考了好几百人,包括学生,数学家和医生。结果95%的大学生和40%的医生(这些医生实际上都受过这方面的专门训练)都给出了错误的答案。
这个例子来自长假期间我看的一本书,中文译名叫《隐藏的逻辑》。印象中大学的概率课本上有类似的例题。读到这个案例时我的答案也是错误的,真对不起大二时教我《数理统计与概率论》的李老师。
如果你真懂概率,你会想到要使用贝叶斯定理,然后你会发现这道题还缺少一个关键信息:那就是一般人感染 HIV 的概率。现在已知一般人感染 HIV 的概率是0.01%,也就是说一万个人中才有一个人感染这种病毒。根据以上信息,这位不幸被检测为 HIV 感染者的朋友真有 HIV 的可能性是多少呢?
正确答案是 50%。
你的答案呢?我先说贝叶斯定理的算法,然后再给一个更直观的解释。贝叶斯定理说的就是条件概率。如果我们用 A 表示 “真有 HIV”,B 表示 “检测出 HIV”,那么我们要计算的是 P(A|B)。 已知 P(A) = 0.01%, P(B|A)=99.9%。
P(B) 需要计算一下,它等于 0.01% x 99.9% [也就是有 HIV 而被查出来的]+ 99.99% x 0.01% [也就是没有 HIV 但被冤枉的]。
贝叶斯定理说,P(A|B) = P(B|A) x P(A) / P(B),计算结果等于 0.5.
直观的解释是这样的:假设我们随机地找一万个人来做实验,根据 HIV 病毒的分布,这一万人中应该只有一个人是真有 HIV 的。而由于我们的检测手段很强,这个人会被检测出来。但剩下的9999人都没有 HIV,可是我们对没有 HIV 的人的检测精度是 99.99%,也就是说有万分之一的可能性会冤枉好人。这样一来,我们的检测手段还会在9999人中冤枉一个人。
本来只有一人有 HIV,可是我们却检测出来两人。所以如果一个人被检测出 HIV 来,他真有 HIV 的可能性其实只有 50%。
呵呵,这就是概率。回到我遇到的问题上,为什么医生凭99%的准确率就敢判定家人有病?或者再把这个问题进一步引申:如果检测结果的正确性只是99%,即,如果家人得病,有1%的机会查不出来;如果家人没得病,也有1%的机会查不出来。这即有不确定存在。那么医生凭测试结果来判断一个人是否得病,他肯定会按一定的可能性犯下面的两个错误之一:
(1) 检测的结果是阳性。但是当事人确实没病。
(2) 检测的结果是阴性。但是当事人真的有病。
在(1)中, “没得病”为真,医生却按测试结果误真为假,给当事人打来极大的痛苦和精神压力;在(2)中, “没得病”为假,医生却按测试结果误假为真,耽误了当事人的及时治疗,甚至带来更遭的社会影响,比如某些疾病可能会向公众传播。
那么医生能不能不犯任何错误?比如说,医生能不能不凭测试结果来判断当事人的病呢?这真是个好问题。只是我现在还没有好的答案。继续讨论上面的问题,如果当事人没得病,检测结果的正确性是99%,如果大众人群里得病的概率为1%,请问:如果当事人查出阳性,那么他没病的概率是多少?如果当事人查出阴性,那么他“中彩”的概率又是多少?
这道题有显著的生活应用意义。在上面的例子中,医生对检测结果进行分析判断都可能会发生上面的两个错误之一,但是这两个错误的后果却大不相同。如果医生把没病误判成有病,那么我们肯定会找另一个医生看看。独立事件的概率好算,另一个医生也犯错误的概率很低。退一万步说,这个误判也会提示当事人以后要多关心自己的身体状况,还不至于引起太多的负面效应。如果医生犯了另一个错误,有病当没病,完了,不但害了当事人,更有可能造成严重的社会影响……
各种统计测试是无法同时兼具克服两个错误的。降低这个错误发生的机会,就会增加另一个错误发生的概率,反之亦然。既然错误肯定要犯,那么就定一条犯错误的原则吧。在设计测试时,通用的犯错误原则是,尽可能的降低那个后果严重的错误发生的概率。因此医生或者医院就会尽可能的谨慎,为了尽可能的检测出真正的患者,就会有点“宁可错杀一千,不可放过一个”的意思,结果呢?有病的更会被查出来,但是更多的没病的会被当成有病。
在社会问题里面,关于这两个错误的犯错原则被广泛的应用着。比如说,它有意无意的在指导人们的交友原则。交友这个问题同样会有两个错误:误交损友和错过好友。大多数人奉行风险回避,对他们而言误交损友的错误后果更严重一些,那么这些人在和陌生人交往时就会比较保守和被动。另外一些热爱交友的人则更愿意采取积极主动的态度,不放过每一个交友的机会。因为对这些人来说,错过一个好友的后果更严重。把交友两字换成“恋爱”,又变成一个应用。很多单身的女生不是经常对人说,她找男朋友的态度是“宁缺勿滥”嘛。
再回到我遇到的问题上,后来我陪家人去专治肝病的东湖医院再次做检测,结果为阴性。医生再三向我们确认没有输血史后表示不必担心,只要没有传染源,得丙肝的可能性微乎其微,比感染乙肝的可能性低多了。看来人的直觉真是一个强大的武器,有时不需要精密的计算就可帮我们做出正确的判断。这个亲身经历的案例也告诉朋友们,如果一个疾病比较罕见,那么你就不应该对阳性诊断特别担心。我愿意善意的相信,那个判定我的家人有丙肝的医生其出发点是好的,但这就是概率。哪怕你的初衷再好,你也会犯错!谨以此文怀念教我概率论的李老师,精通概率的他在生活中一定是个很有智慧的人吧。
BTW,概率确实很有用,熟悉概率不但可以更深刻的理解抖动测量,同时还能解释生活中有很多很有趣的问题,欢迎有兴趣的朋友们和我一起交流探讨。本周与大家一起分享的是力科近期的一系列发布新闻——力科发布第一个PCIE 3.0协议分析仪,第一个支持8GT/s数据速率的PCIE协议分析仪;力科针对Inter-Chip和移动器件开发发布新的测试夹具;力科发布SuperSpeed USB一致性套件 。
用户377235 2012-10-30 10:59
用户1584993 2009-10-22 13:50