If you're seeing this message, it means we're having trouble loading external resources on our website.

如果你被网页过滤器挡住,请确保域名*.kastatic.org*.kasandbox.org 没有被阻止.

主要内容

根据置信度和误差幅度确定样本大小

根据置信度和误差幅度确定样本大小.

想加入讨论吗?

尚无帖子。
你会英语吗?单击此处查看更多可汗学院英文版的讨论.

视频字幕

- [讲师]我们被告知Della想做 一个单样本Z区间来估计 她的社区成员中有多少比例赞成增加税收 使地方学校获得更多资金。 她希望她的误差范围在95%置信度时 不超过 正负2%。 为了保持在所希望的误差范围内, 最小的样本量是多少? 让我们回顾一下,置信区间是 什么样子的,其中哪一部分是 误差范围? 然后我们就可以想一想她需要的样本 量是多少。 她想估计赞成加税的 真实总体比例。 她不知道这个比例是多少。 所以她要取一个大小为n的样本量。 事实上,这个问题是关于 她需要多大的n,才能保持在 所希望的误差范围内。 那么,无论她采取什么样本, 她都要计算出一个样本比例。 然后,她要构建的置信区间是 该样本比例 加上或减去临界值, 而这个临界值是基于置信度的。 我们稍后会讨论这个问题。 什么样的Z*,什么样的临界值会对应 95%的置信度。 乘以,然后你需要乘以她统计量的 标准误。 在这种情况下,它就是一个平方根 是她的样本比例的标准误, 也就是样本比例乘以1减去 样本比例,所有这些再除以她的样本量。 现在她希望误差范围不超过2%。 误差范围就是这里的这部分。 这里的这部分 她希望这不超过2%, 必须小于或等于2%。 这个绿色有点太亮了, 看着有点不舒服。 这部分小于或等于2%。 那么,我们怎么算出来呢? 首先,我们要确保我们考虑到了 95%的置信度。 我们可以看一下Z表。 记住是95%的置信度, 这意味着如果我们在这里有一个正态分布, 如果我们在这里有一个正态分布, 95%的置信度意味着 我们需要高于或少于标准差的数量 是这里这块面积 使它等于95%。 因此,这是2.5%,这块在头部没有阴影的地方 然后这也是2.5% 这里。 我们可以在一个Z表中查看 如果你在Z表中查看, 你不会去找95%。 你想查找的是 在头部2.5%没有阴影的百分比。 所以你实际上会查找97.5%。 但是,一般来说,95%的 置信度, 你所看到的临界值会是1.96。 记住这个对应值会很实用。 当然,我们可以在Z表上查到它。 这就是1.96。 这里这个就是1.96。 但是p帽呢? 我们不知道p帽是什么,除非我们 抽取了样本,但我们要解决的问题就是: 我们应该抽取多大的样本? 请记住,我们要的是这里的东西 我现在把它圈起来, 用一个不太明亮的颜色,用这种蓝色框起来。 我们希望这个部分要小于或等于2%。 这是我们的误差范围。 所以我们可以做的是我们可以选择 一个样本比例。 我们不知道它是否会 使这里的数值最大化。 但是如果我们把这个最大化, 我们就能知道,我们是在算 这个部分最大可能是多少, 然后我们就能根据题目条件确认n的大小。 P帽,最大的P帽 如果你想把p帽乘以1减去p帽的结果最大化, 你可以在这里做一些尝试和比较。 这是一个相当简单的二次方程。 得到的p帽实际上 是0.5,我想,我想强调我们并不知道样本比例。 她甚至还没有进行抽样。 她甚至没有采取随机抽样 并计算出样本比例。 但我们想弄清楚该取的n是多少, 所以为了达成目的,她说好吧, 什么样的样本比例可以使 我的误差范围最大化? 所以让我假设p帽, 然后让我计算n。 让我在这里设置一个不等式。 我们有1.96,这是我们的临界值, 乘以 我们假设0.5为我们的样本比例, 当然,我们还不知道它是什么, 除非我们真正取样。 所以这就是我们的样本比例。 然后是1减去我们的样本比例。 所有这些除以n,然后开平方需要小于或等于2%。 我们不希望我们的误差范围大于2%。 让我把这个写成小数,0.02。 现在我们只需要做一点代数 来计算这个就可以了。 所以让我们看看我们可以如何计算。 这个不等式可以改写为: 我们可以把两边都除以1.96,1.96。 1除以1.96。 这等于 在左边,我们有所有这些的 平方根 0.5乘以0.5的平方根 也就是0.5 再除以n的平方根 需要小于或等于 让我这样写 这与2除以100是一回事。 2/100乘以1/1.96。 左边需要小于或等于1/196的。 让我向下滚动一下。 这是比我们通常在统计学中做的 更复杂的代数, 至少是在统计学入门课上。 好吧,让我们看看,我们可以取 两边的倒数。 我们可以说n的平方根除以0.5, 和196除以2。 现在我们来看看196除以2是多少? 是98。 所以这是98。 如果我们取两边的倒数, 那么你需要改变不等号方向。 所以它变成大于或等于。 让我们看看,我可以把这两边都乘以0.5。 所以0.5。 我说0.5,但我却写下了0.4。 0.5。 我们得到 n的平方根需要 大于或等于49。 或n需要大于或等于49的平方。 那么49的平方是多少呢? 你知道50的平方是2,500。 你知道它会接近这个数字。 所以你已经可以做出一个很好的估计 答案会是D。 但是如果你想把它乘出来,我们也可以这样做。 49乘以49,9乘以9是81。 9乘以4是36加8是44。 4乘以9,是36。 4乘以4是16加3。 我们得到19。 然后你把这两行加在一起, 然后你就 这是10,这是一个14。 你就得到了2401。 所以这就是Della应该采取的最小样本量 如果她希望她的误差率 不超过2%。 现在你可能会发现, 当她实际抽取2401个样本的时候, 如果她的样本比例小于0.5 或大于0.5。 那么她就会处于这样一种情况,即 她的误差范围可能小于这个。 不过她只是想误差范围不超过这个数。 另一个需要注意的事情是 刚才的数学计算非常巧, 我得到我们的n正好是一个整数。 但是如果我得到了2401.5。 那么你就必须四舍五入到最接近的整数。 因为你的样本量 始终需要是一个整数值。 那么这道题就讲解完了。