如果你看到这则信息,这表示下载可汗学院的外部资源时遇到困难.

If you're behind a web filter, please make sure that the domains *.kastatic.org and *.kasandbox.org are unblocked.

主要内容

该模拟提供了证据,证明除以 (n-1) 能带给我们无偏差的估计

可汗用户的模拟表明,除以 (n-1) 给了我们一个无偏差的总体方差估计。模拟过程: http://www.khanacademy.org/cs/will-it-converge-towards-1/1167579097. Sal Khan 创建

想加入讨论吗?

尚无帖子。
你会英语吗?单击此处查看更多可汗学院英文版的讨论.

视频字幕

这是由可汗学院用户TETF创建的一个模拟。 我可以猜它的发音是tet f。 这让我们直观地了解 当计算样本方差时, 为什么要除以n减1, 以及为什么会得到 总体方差的无偏估计。 在开始之前, 我鼓励你先自己尝试一下, 你可以构建一个分布。 点击蓝色区域建立总体。 我们在这里创建一个总体。 每次我点击它,总体大小会增加 我现在随机的点击, 我鼓励你用这个便签本 —— 它在可汗学院计算机科学 —— 尝试自己创建。 我停在这里的某个点上。 好了,我已经创建了一个总体。 我在这里随机点几下。 这是总体, 正如你所看到的, 它计算了总体的参数。 总体均值为204.09 以及总体标准差 是由总体方差 推导出来的。 这是总体方差的平方根, 等于63.8。 同时,这里也画出了总体方差。 这里是63.8,是标准差, 有点看不太清,它说开平方 这些数都开了平方 也就是说,63.8开平方是总体方差。 这很有趣, 但它并没有告诉我们 为什么要除以n - 1。 这才是有趣的地方。 现在,我们开始抽样, 然后决定样本大小。 我从很小的样本开始, 也就是最小样本。 我从很小的样本开始。 每次取样本时 —— 模拟会做什么呢 每次取样本时, 它都会计算方差。 所以分子是样本中每个数据点之和 减去样本均值, 然后平方它, 再除以n加a, a会改变。 它会除以 n加负3之间的任何一个数。 所以n减3,一直到n加a。 我们会做很多很多很多次。 我们会求任意a方差的均值 然后算出哪个给了我们最好估计。 如果我在这里生成一个样本, 当看到这条曲线时, 当a的值很高时,表示我们低估了总体方差。 当a的值很低时, 表示我们低估了总体方差。 但这只是一个样本, 并没有太大的意义, 其样本大小是2 让我们生出一些样本, 然后取它们的均值。 当你看到许多许多例子时, 你会发现有趣的事情正在发生。 当你看这些样本的均值时, 当你将所有样本的曲线平均时, 你会发现最佳估计是 当a非常接近负1时, 也就是n加负1或者说n减1。 任何小于负1的数 —— 如果是n减1.05或是n减1.5 —— 就会高估总体方差。 任何少于负1, 如果是n加0,如果除以n或者除以n加0.05 或者其他, 就会高估总体方差。 你可以对不同大小的样本这样做。 让我试试样本大小为6的样本。 再来一次,当我按 —— 我一直按 “生成样本” 键 —— 当生成越来越多的样本时 —— 对于所有的a, 我们取这些样本的方差的均值, 这取决于我们如何计算 —— 你会再次看到,我们的最佳估计 非常接近于负1。 如果你生成了数百万个样本, 你会看到最佳估计是 当a是负1或者说除以n减1。 再次感谢TETF, tet f。 我觉得这是一个很有趣的方法 来思考为什么要除以n 减1。 .