如果你看到这则信息,这表示下载可汗学院的外部资源时遇到困难.

If you're behind a web filter, please make sure that the domains *.kastatic.org and *.kasandbox.org are unblocked.

主要内容

模拟显示 t 统计值

了解为什么我们在使用样本标准偏差代替总体标准偏差来构建均值的置信区间时使用 t 统计量.

想加入讨论吗?

尚无帖子。
你会英语吗?单击此处查看更多可汗学院英文版的讨论.

视频字幕

- 在之前的视频中,我们谈到过尝试 用一个样本平均数来估计一个群体总体平均数 然后构建一个关于该样本平均数的 置信区间。 我们还谈到了不同的情况。 我们可以使用Z表和真实的 总体标准差。 这实际上会构建 一个很不错的置信区间。 但问题是你不知道 总体标准差。 因此,你可以尝试用Z表 来找到你的临界值 并用样本标准差, 但我们讲过,这实际上 并不能很好地计算出我们的置信区间。 我们将在之后通过实验看到这一点。 基于此,我们可以用一个叫做t统计量的东西 如果我们想要我们的临界值,我们使用t表 而不是z表。 然后我们把它与 我们的样本标准差结合起来使用 然后,我们就突然能 得到相当不错的置信区间。 为了证实这一点, 让我们看一下模拟。 这是可汗学院的一个操作板, 由可汗学院用户Charlotte Allen制作。 重点是要看看 我们的置信区间 在这些不同的情况下是什么样子的。 假设我们有一个2.0的真实总体平均值。 我们说它是 人们每天吃苹果的平均数量。 真实的总体平均数是2,这似乎很高, 但也许这是因为在某个国家 有大量的苹果。 假设我们知道总体的 标准差是0.5。 我们将创建置信区间, 目标置信度是95%。 我们将抽取12个样本。 首先,我们可以 用z和sigma来构建我们的置信区间,这是一个合理的方法。 让我们在这里抽取一些样本。 我们看到,它看起来像 大概是95%。 当我们继续抽取样本,并构建 这些置信区间,95%的时间里, 这些置信区间包含我们 真实的总体平均数。 这些看起来是一个很不错的置信区间, 但我们也已经讨论过,通常当你 做这种类型的事时, 这种类型的推理统计, 你并不知道总体的标准差, 你不知道sigma。因此,你可能会想去 使用z与我们的样本标准差。 但是,如果你看一下我们刚刚计算使用的 这些完全相同的样本 注意,我们重复抽样了一遍又一遍,我们已经抽样了625次。 在这种情况下,我们一直在计算 的置信区间,真实的总体平均数 包含在区间内的时间 只有92.2%。 现在我们可以继续下去。 我们的命中率要比我们 真的使用z和sigma时的命中率要低得多。 现在有趣的是,如果我们使用t,使用t表。 注意,这越来越接近95%了,这很不错。 有了t表,和一个我们可以真正 从样本中得到的东西,样本标准差, 我们就有一个相当接近 我们真的知道 总体标准差时的命中率。 所以这就是t和t统计量的价值 我们将给出更多相关的例子 包括在未来的视频中教你如何使用t表。