If you're seeing this message, it means we're having trouble loading external resources on our website.

如果你被网页过滤器挡住,请确保域名*.kastatic.org*.kasandbox.org 没有被阻止.

主要内容

条件概率树状图例子

用一个树状图来解出一个条件概率问题. 如果有人未通过药检, 他们实际确实吸毒的概率是多少?

想加入讨论吗?

尚无帖子。
你会英语吗?单击此处查看更多可汗学院英文版的讨论.

视频字幕

一家公司在招聘流程的一个环节中 需要筛选掉 违法使用药品的申请人。 他们使用的特定的测试有有2%的几率给出假阳性, 有1%的几率给出假阴性。 假如实际上所有申请人中 有5%的人在违法用药, 如果我们随机的选一个申请人, 而且这个人的测试是阳性, 那么这个人真的在非法用药的几率有多大? 让我们来一起解决这个问题。 那么首先我们要清楚的明白 他们告诉了我们什么。 有一个工作申请人需要参加的用药测试, 这个测试假阳性的概率是2%。 这是什么意思? 这是说,所有受测人中,会有2%的人是下面这种情况: 一个人即使没有用药, 他的检测应该是阴性, 但是测试结果却是阳性。 这就是一个假阳性。 测试结果应当是阴性,但是实际报告结果却是阳性。 另一种思考的方式是, 如果一个没有非法用药的人参加了这个测试, 有 2%的几率 测试结果会显示他确实用了药。 他们还说有1%的几率会测出 假阴性。 这是什么意思? 这是说在所有受测人中,1%的人会是下面这种情况: 他们确实非法使用了药物, 但是测试结果却说他们没有用药。 当测试结果应该是阳性时, 测试却错误的报告说是阴性。 接着他们说在申请人中 5%实际上确实在非法用药。 我们有好几种可以思考这个问题的方式。 一种最简单的思考这个概念的放式是, 我们随便像一个很大的总申请人数。 我会用一个让计算过程 很简单的数字。 假设我们一开始有10000个申请人。 我在这里会讨论绝对数字, 而这个数字是我刚刚编的。 它可以是1000,可以是100000。 但是我使用这个数,因为这样算术会很简单, 比9785个人容易得多。 这也是100%的申请人数。 现在他们给了我们一些非常重要的信息。 他们告诉我们5%的申请人 确实在非法用药。 所以我们可以立即把这个10000个人的小组 分成一组正在非法用药的人 和一组没有用药的人。 所以5%的人确实在用药。 95%的人不在用药。 所以10000的5%是多少? 那会是500人。 所以有500个人在非法用药。 再说一次,这是初始总人群中的5%。 那么多少人不在非法用药呢? 9500个人不在非法用药。 再强调一次,这是总申请人中的95%。 那么让我们现在来进行测试。 如果我们测试那些正在用药的人, 会发生什么? 测试在理想状态下会给 所有人一个阳性报告。 但是我们知道这不是一个完美的测试。 测试会给出一些阴性报告; 它会错误的给出一些阴性报告。 我们知道会是这样,因为测试有 1%的几率给出假阴性结果。 500个人中,99%的人会得到正确的结果, 也就是得到阳性报告。 所以500的99%是多少? 让我们看看,那会是495。 495个人会得到阳性报告。 我会在这里写一个阳性的记号。 接着我们会有1%的人 也就是5个人,会得到阴性报告。 他们会得到一个假阴性报告。 这是得到假阴性的概率。 如果我们说,我们的初始申请人中 百分之多少是在非法用药并测出阳性的? 那会是10000人中的495个人, 这也就是4.95%。 原始的总申请人中 百分之多少是在非法用药却测出了阴性? 测试说他们没有非法用药。 这会是10000人中的5个人, 也就是0.05%. 另一种计算的方式是, 如果你用5%乘上1%, 你会得到0.05%。 百分之一的0.05。 如果你用5%乘上99%, 你会得到4.95%。 让我们继续下去。 现在让我们看看那些没有非法用药的人。 这就是假阳性会 出现影响的情况。 我们有2%的几率出现假阳性。 所以这群人中2%的人会测出假阳性。 9500的2%等于多少? 等于190,190个人会测出阳性, 尽管他们并没有非法用药。 这就是假阳性概率。 所以他们测出了阳性, 而其他98%的人会正确的得到阴性报告。 另外98%,也就是9500减去190, 就是9310个人会正确的得到阴性报告。 现在,9310个人是总申请人群的百分之多少? 190是1.9%。 我们可以计算出190除以10000 或者米可以说95%的2%是1.9%。 再次强调,在分叉处用乘法。 9310是百分之多少? 这将会是93.10%。 你可以说这是9310除以10000 或者你可以在我们的 树状图上使用乘法。 95%乘上98%等于93.10%。 但是现在,我认为我们可以回答这个问题了。 已知一个申请人测试结果是阳性, 他实际上确实在非法用药的几率有多大? 所以让我们看看第一部分。 已知申请人测试结果为阳性, 所以哪些申请人测出来了阳性? 在这里495人 正确的测出了阳性, 然后这里还有190个人 错误的测出了阳性。 但是他们确实是测出了阳性。 所以一共多少人测出了阳性? 我们有495加上190个人测出阳性。 这是测出阳性的总人数。 接着,实际上有多少人确实在用药? 所有测出阳性的人力 495个人确实在用药。 我们用495除以 495加190 等于0.7226。 所以我们可以说大约72%。 大约72%。 现在,这很有趣。 如果测试人测出阳性, 那么他确实在用药的几率有多大? 当你看到这些假阳性 和假阴性的结果时,他们看上去很低。 但是现在当你实际计算了之后, 申请人确实在用药的几率 较高,但是不是非常高。 并不是说,如果一个人测出了阳性, 你就可以说他们肯定就是在用药。 你也可以用百分比数字 直接得到这个结果。 比如说,你可以想想 百分之多少的原始申请人群 最后测出阳性? 那会是4.95%加上1.9%。 4.95加1.95,我们直接用百分数计算, 这些人中,百分之多少确实在用药? 那会是4.95%。 你可以注意到这给你完全一样的结果。 现在,这是一个有趣的点。 因为这就是再说, 在测出阳性的人群中, 有72%的人确实在用药。 你可以从另一个方向想一下。 在测试出阳性的人中, 495加190,百分之多少的人不再用药? 那会是190人, 结果大约是28%的人。 100%减去72%。 如果我们在法庭上, 让我们假设检察官, 让我们假设我测出了用药阳性, 而检察官说, 看这个测试的质量非常好, 它的假阳性概率只有2%, 而小明测出了阳性,那他很有可能是在用药。 一个不太明白这个情况的陪审团 或者一个不想麻烦的计算的陪审团可能会说, 确实,小明很可能是用了药。 但是当我们仔细看时, 即使我测出了阳性, 依然有28%的几率我并没有在用药。 我只是测出了假阳性。 这个数字有点太大了 的原因是 当我们看到一开始的版本时 用药的人和不用药的人中, 大部分都不会非法用药。 这个较大的人群, 这个没有非法用药的人群的2%, 跟正在非法用药并测出阳性的人群 相比较,实际上是一个 挺大的数字。 所以我会在这里结束。 这一点非常奇特;不仅这个特例是这样, 在数据分析中这个现象也经常出现。 当我们看到一个特定的药物是否有效, 或者一个特定的治疗是否有效, 做一下这个分析非常的重要。