If you're seeing this message, it means we're having trouble loading external resources on our website.

如果你被网页过滤器挡住,请确保域名*.kastatic.org*.kasandbox.org 没有被阻止.

主要内容

示例了解置信区间有效所需条件

置信区间有效所需条件的示例--随机条件, 独立条件和正态分布条件.

想加入讨论吗?

尚无帖子。
你会英语吗?单击此处查看更多可汗学院英文版的讨论.

视频字幕

阿里负责准备学校毕业舞会的菜单, 他打算用一个”单样本Z区间” 来估算有多少比例的毕业生 会选择素食菜单。 他从总计150名毕业生中随机选取了30名, 发现其中有7名 打算选素食菜单。 请问:阿里的这次抽样满足了 建立置信区间的哪些条件? 那么,现在请暂停视频,先自己考虑一下, 你可以选择不只一个选项。 好了,现在让我们一起看看这个问题。 首先你可能会问: 什么是“单样本Z区间”? 你可以把它理解成:阿里会做“一次”抽样 并基于该抽样建立一个 置信区间。 它之所以可以被称为“Z区间”, 是因为置信区间这个概念本身就 要求你在你想要估计的真实值上下 分别偏移一定倍数的标准差, 并基于此来做推断。 而在考虑具体要取多少倍的标准差时, 人们常把这个倍数称为“Z值”, 也就是说,Z常被用来代表,相对某个值而言, 上下所偏离的标准差的倍数。 所以实际上,阿里只是在试图建立一个置信区间。 但请注意,建立有效的置信区间, 是有一些前提条件要满足的。 这里一共有150名学生。 阿里发现,要问遍这150名学生, 以求得真实的总体比率是不现实的。 于是他决定从中抽样30名。 所以,N等于30。 基于这次抽样,他算得了一个样本比率。 也就是:30名学生中有7名, 想选素食菜单。 接着,他要选定一个置信水平, 并相应建立一个置信区间。 但请不要忘记我们在早先的视频中 讲过的条件。 首先,我们必须能确信, 这次抽样是完全随机的。 这就是所谓的“随机性条件”, 也正是选项A所陈述的: 这组数据是来自对目标总体的随机抽样。 我们能确定这一点吗? 在这里,条件有写说: 他从总计150名毕业生中“随机”选取了30名。 我想我们应该相信条件不会骗我们。 虽然我们不知道阿里具体用了什么方式确保随机性, 但我们姑且相信他,那么好的, 这一点有被满足。 这组数据来自随机抽样。 要是条件说他只抽样了足球队, 那就不能算随机抽样了。 第二个条件看上去完全是数学算式, 但它实际上就相当于我们讲过的“正态分布条件”。 所谓“正态分布条件”, 是指为了建立置信区间, 我们需要假设样本比率的抽样分布 大体上符合正态分布, 它既不偏向右边, 也不偏向左边。 所以,选项B说,样本容量乘以 我们的样本比率必须大于或等于10。 而且样本容量乘以1减去样本比率, 也必须大于或等于10。 换句话说,我们抽样中的成功次数需要 大于或等于10, 同时,抽样中的失败次数也需要 大于或等于10。 那么,在阿里的这次抽样中有多少次成功? 有7次。 你也可以更具体地说,看,我们的N是30, 我们的样本比率是7/30, 两者相乘等于7。 所以我们的成功次数小于10, 我们实际上违反了“正态分布条件”。 这个条件是一个经验法则,它提醒我们 我们实际的抽样分布可能并不对称。 注意,以上这些仅仅是我们, 基于这一次抽样所得出的结论。 这毕竟只是一个“单样本”Z区间。 我们的结论不一定对,但我们的确难以确信 我们在这里有满足“正态分布条件”。 所以我们排除这个选项。 C,单次观测可以被认为是互相独立的。 假如阿里随机抽样时有做放回的话, 那这些观测就会是互相独立的。 又或者,假如他的样本容量 小于总体的10%, 那么这些观测也可以被认为近乎是彼此独立的, 尽管并不是严格意义上的。 但我们看到,阿里从150人中抽样了30人。 所以他的样本容量占150中的30, 也就是总体的1/5, 或者说20%。 因为这个比率大于10%, 所以我们也违背了”独立性条件“。 假如阿里抽样时有做放回的话, 他本来是可以满足”独立性条件“的,但他并没有这样做。 又或者他的样本容量小于总体的10%也行。 但这一点也不满足,所以我们不能说 我们满足了这个条件。 综上所述,由于我们违反了针对有效置信区间的 三个条件中的两个, 我们没法对所得的”置信区间“抱有”信心“, 阿里的这次统计分析不大成功。