If you're seeing this message, it means we're having trouble loading external resources on our website.

如果你被网页过滤器挡住,请确保域名*.kastatic.org*.kasandbox.org 没有被阻止.

主要内容

t 区间有效的条件

在设立 t 区间来评估均值时, 如何确定条件是否满足.

想加入讨论吗?

尚无帖子。
你会英语吗?单击此处查看更多可汗学院英文版的讨论.

视频字幕

[讲师]弗拉维亚想估计她所在的大型大学 教职员工的平均年龄。 她采取了SRS,即简单随机样本, 从大约700名教职员工中抽取20名, 样本中的每个教师都向弗拉维亚提供了 他们的年龄。 数据向右偏斜,样本平均数为 为38.75。 她正在考虑用她的数据 构建一个置信区间来估计她所在的大学 教职员工的平均年龄。 哪些构建t区间的条件 已经被满足? 暂停这段视频,看看你是否能 自己回答这个问题。 好的,现在让我们试着一起回答这个问题。 这里有700名教职员工。 她正试图估计总体的平均数,即平均年龄。 她不可能和所有700人谈话,所以她抽取了一个样本。 一个简单的随机样本,样本量为20,所以这里的n等于20。 从这20个样本中,她计算出的样本平均数是38.75。 现在,理想情况下,她想构建一个t区间 一个置信区间,使用t统计量。 这个区间看起来会是这样的。 它是样本平均数加上或减去临界值 乘以样本标准差 除以n的平方根。 当我们试图创建关于平均值的置信区间, 在无法获得抽样分布的标准差, 但是可以计算出样本标准差的情况下, 我们会使用t统计量、 t表和t分布。 现在,为了使这一点成立,有三个条件需要满足 就像我们在构建z区间时看到的那样。 第一个条件是我们的样本是随机的。 题目在这里告诉我们 她抽取了一个样本量为20的简单的随机样本。 所以我们满足了这个约束条件。 选项A已经被满足了, 数据是我们感兴趣的总体中的一个随机样本。 所以我们可以把这个选项圈起来。 下一个条件是正态条件。 当我们在构建t区间时,正态分布条件 是很重要的,因为我们确实需要假设 样本平均值的抽样分布 是大致正态分布的。 我们有几种方法可以来判断该条件是否满足。 要么我们的样本量大于或等于30。 中心极限定理告诉我们 在这种情况下,我们的抽样分布, 不管总体中的分布是什么, 抽样分布都会是 近似正态分布的。 题目这里没有达成。 这里,她的样本量只有20。 所以到目前为止,情况并不乐观。 但这并不是满足正态条件的唯一方法。 另一种满足正态条件的方法: 如果我们有一个小于30的样本量, 如果年龄的原始分布是正态的 原始分布正态, 甚至如果它是围绕平均值大致对称的 大致对称的。 但是如果看一下,题目这里, 他们告诉我们,它是向右偏斜的。 他们说数据是向右偏斜的, 样本平均值为38.75。 因此,这告诉我们,我们的数据集 我们在样本中得到的数据是不对称的, 而且原始分布不太可能是正态的。 这么想: 它不太可能是对称的, 你可能有比这个平均值大30岁的教员, 68又3/4岁。 但你不太可能有教员 谁是比平均年龄年轻30年的。 这实际上是导致数据向右倾斜的原因。 所以不符合正态条件。 我们不能确信我们样本平均数的抽样分布 是正态的。 这项不符合。 选项C:单个观测值可以被认为是 独立的。 有两种方法来判断是否满足这个条件。 一种是如果我们用替换法取样。 我们在问完每个教员的年龄后, 我们把这些人在放回 候选池里,我们可能会再次挑选他们, 直到我们得到我们的20个样本。 看起来她并没有这样做。 她看上去没有用替换法取样。 而即使是在没有替换的情况下取样, 10%的法则是这样告诉我们的,"看,只要样本量这小于 10%,小于或等于总体的10%。 那么独立条件就得以满足了。“ 而这个总体的10% 是70。70是700的10%,所以这绝对是 小于或等于10%,所以它可以被认为是 独立的,所以我们实际上也 满足了这个约束条件。 我们构建的t区间可能不太有效的主要问题是 我们不能确信 我们的抽样分布是正态的。