If you're seeing this message, it means we're having trouble loading external resources on our website.

如果你被网页过滤器挡住,请确保域名*.kastatic.org*.kasandbox.org 没有被阻止.

主要内容

显著性检验中检出力的概念介绍

显著性检验中检出力的概念介绍.

想加入讨论吗?

尚无帖子。
你会英语吗?单击此处查看更多可汗学院英文版的讨论.

视频字幕

这个视频里我们要 讨论统计功效在 显著性测试里的意义 功效是一个可能会 在第一年的统计学课上遇到的内容 这是很难算的 但有趣的是能知道这是什么意思和 知道增加功效 或减少功效在一个显著性测试中的可能性 开门见山地说,统计功效是一种概率 可以看作是 做正确的事的概率 当零假设不成立的时候 正确的事是你应该拒绝零假设 如果它不正确 这是拒绝的概率 拒绝零假设 当零假设是错误的 可以看作是条件概率 但也有其他的概念 可以把它归类到第二类错误 比如,可以说这等于 1减去不拒绝的概率 1减去不拒绝的概率 不拒绝零假设 给定零假设是错误的 这是我刚描述的 不拒绝零假设 给定零假设是错误的 这是第二类错误的定义 所以你可以看作是 不犯第二类错误的概率 或1减去犯第二类错误的概率 希望这不会令你困扰 让我用另外一种办法来写 可以说这是 不犯第二类错误的概率 所以什么会影响功效呢 为了更好的理解 我画两个样本分布 一个假设零假设正确 另一个假设零假设不成立 然后真实的总量参数和 零假设说的是不一样的 比如,我们有零假设 说总数的均值等于 μ1,备择假设 H下标a,说 总量的均值不等于μ1 所以如果你假设一个零假设成立的世界 我用蓝色 如果假设零假设成立 那么样本分布是什么? 记住,显著性测试里我们 有一些总量 让我画出来 这里有一个总量 我们的假设是关于 总量里的一个参数 为了检验它,我们找到一个特定大小的样本 计算数据,这个情况下 是样本的均值 如果假设零假设成立 得到样本的统计的概率是多少? 如果小于阙值 是我们称作的显著性水平 我们拒绝零假设 这是我们生活的世界 一种来考虑的方式 在一个假设所有零假设为真的世界 你可能有样本的分布 看起来像这样 如果零假设是真的 然后样本分布的中心 在μ1这里 给你了样本的大小 你可以得到一个确定的样本分布 对于这样的样本 如果样本的大小增加了,这将会更窄 如果减少了,这将会变宽 你设定一个显著性水平,就是 你拒绝零假设的概率 即便它是正确的 甚至可以看作是,我们说过的 可以看作是你的显著性水平 犯第一类型错误的概率 所以你的显著性水平是一个区域 是这个阴影的区域 用橘黄色画的 这将是你的显著性水平 如果你在这里取样本 并计算了样本的均值 刚好落在这个区域, 或这里的这个区域,那么你 拒绝零假设 现在如果零假设实际上是对的 你将会犯第一类型的错误 但却不自知 对于功效来说,我们考虑的是第二类型的错误 在这里,是我们的零假设是错误的 一个条件概率 让我们建造另一个样本分布 在这个情况里零假设是错误的 继续这条线 像这样 想象一个世界零假设是错误的 实际上是均值等于μ2的时候 μ2在这里 在现实中,样本分布 看起来像这样 再一次,这是对于给定的样本大小 越大的样本大小 越窄的钟形图 所以这看起来是这样的 在任意的情况下,在这个世界 我们要拒绝零假设 但在我们应该,却没拒绝零假设的 情况下的样本是什么? 我们不会拒绝零假设 如果得到了样本,在这里得到样本 或这里, 一个如果你假设零假设 成立的样本,那么这样的概率并非不可能 所以犯第二类错误的概率 当我们需要拒绝零假设但没有的时候 实际上是这片区域 那么功效——也就是当 零假设是错误的时候拒绝它—— 给定是错误的,将是这个红色的分布 将是这里剩余的区域 我们该怎么提高功效? 一种方法是提高 α 提高显著性水平 如果我们提高显著性水平 显著性水平是一个区域 如果我们想变高,如果我们增加区域 看起来是这样的 如果扩展了显著区域 那么功效也增加了,因为现在黄色的区域 变大了 我们往左边推动这个边界 现在你可能说,好了 如果我们想增加功效, 功效听起来是一个好的事情 为什么不一直增加α 问题是如果增加α 让我写下来,如果用α 也就是显著水平,然后增加了它 这会增加功效 会增加功效 这也将增加 第一类错误的概率,记住 这是理解α的一种方法 理解显著水平是什么 是第一类型错误的概率 增加功效的其他方法是什么? 如果增加样本大小 这些分布将 这些样本的分布会变窄 如果样本的分布 如果这些样本的分布都变窄了 后面这种情况,也就是你不拒绝 零假设即便你应该这么做 将变成一个很小的区域 这将是,一种考虑的方法是 重叠将会变小 在这两个样本分布之间 让我写下来 另外一个方法,如果增加n,你的样本大小 将增加功效 通常这是一件好事情 如果你可以这样做 另外一件可能在或不在你的控制 范围内的事情是,数据的可变性越小, 也将使样本的分布变的狭窄 也会增加功效 更小的可变性——你可以通过 方差或标准差来测量 你的数据集——可以提高你的功效 另外一种这将提高功效的方法是 如果真实的参数比 零假设说的更远 如果你说真实的参数 比零假设远 这也会增加功效 这两个通常不在你的控制下 但样本大小和显著性水平在 显著性水平,有一个权衡 如果通过这样来增加功效, 你也会增加第一类错误的可能性 对于很多研究者,他们可能说 如果第二类错误更不好 我会做这个权衡 我会增加显著性水平 但如果第一类错误是我担心的 我不会用这样的杠杆 在任何的情况下,增加样本的大小 如果你可以这么做,是一件好的事