If you're seeing this message, it means we're having trouble loading external resources on our website.

如果你被网页过滤器挡住,请确保域名*.kastatic.org*.kasandbox.org 没有被阻止.

主要内容

总体标准差

Sal Khan 创建

想加入讨论吗?

尚无帖子。
你会英语吗?单击此处查看更多可汗学院英文版的讨论.

视频字幕

假设你很想研究 停在停车场里的 汽车的尺寸。 然后测量它们的长度。 让我们简化一下计算。 假设停车场里有五辆车。 我们关心的总体数量规模 是5。 然后你去测量它们的长度 一辆车长4米,另一辆长4.2米, 另一辆车长5米,第四辆车 4.3米长,然后,假设 第五辆车是5.5米长。 下面来看总体的一些参数。 第一个你们可能想求出来的 是集中趋势的量度。 其中最常用的是算术平均值。 我们先计算一下。 这是总体的情况。 所以我们用μ来表示。 那么这里的算术均值是多少呢? 我们只需要把这些数据加起来 然后除以5。 我把计算器拿出来 这样会快一点。 这是4 + 4.2 + 5 + 4.3 + 5.5。 然后,我要把这个和除以5。 总体的算术均值是4.6。 这样很好。 如果我们想在这里加一些单位,这是4.6米。 这就是集中趋势或者说集中趋势的度量。 我们也可能好奇数据的分散程度, 尤其是来自集中趋势的数据。 那么我们用什么呢? 我们已经有了一个工具 总体方差。 总体方差是测量离散度 的一种方法。 它有一些非常简洁的性质 这里定义为离均值距离平方 的均值。 这是一种很有用的方法。 让我们来做。 我们来计算一下这个总体的 总体方差。 我们只需要求出 这些点到均值的距离。 然后让它们平方。 然后求这两个距离的平方的均值。 我们来做一下。 也就是4 - 4.6的平方 加上4.2 - 4.6的平方,加上5-4.6的平方 加上4.3 - 4.6的平方。 最后——没地方 写了——加上5.5- 4.6的平方。 然后,我们要把这些整个除以5 得到总体方差。 这将得到什么呢? 用计算器算一下。 4减去4.6的平方。 是负0.6的平方。 负0.6的平方和 0.6的平方是一样的。 所以写下0.6的平方 加上4.2减4.6是负0.4 当我们平方后,负号消失了。 所以是正0.4. 写下0.4的平方。 然后我们有5减4.6. 是0.4,所以加上0.4的平方。 4.3减4.6. 是负0.3. 平方的时候负号消失了。 所以是加0.3的平方。 然后最后,5.5减4.6是0.9. 所以加上0.9的平方。 然后除以数据的个数。 是0.316. 写下来是0.316. 现在,让我问你们一个稍微有趣的问题—— 总体方差的单位是多少呢? 因为我们在这个视频里很在意单位。 到现在是4米减去4.6米。 4.2米减去4.6米。 所以单位都是米。 这些是用米来测量的 在这里能看出来。 所以这些都是用米来测量的。 当减去他们,你也得到米。 但当你平方后,你 得到的是平方米加平方米加平方米 加平方米。 然后除以一个无单位的数字, 是你拥有数据的个数。 所以这里的单位将会是平方米。 你可能说, 这是很奇怪的单位,如果 我们尝试可视化的考虑 离均值的离散程度。 当我们尝试可视化它,我看到离散程度, 是关于多少米之间的不同而不是多少平方米。 我们能做什么? 一个大的提示:我们可以从 方差的符号中找到。 是这个σ的平方。 为什么不直接取方差的平方根呢? 用σ表示。 这很有道理。 那这是什么? 这是0.316的平方根。 单位是什么? 是米。 然后我们最后——求0.316的平方根。 是0.56——四舍五入到 千分之一,0.562 这大约是0.562米。 那我们把这个 叫做什么呢? 方差的平方根。 这里我们考虑的是总体。 还没有考虑抽样。 总体方差的平方根, 我们把这个叫什么? 这是一个熟悉的术语 通常,考试的时候 这个是会被算分的。 这是我们的总体——换个颜色 用黄色次数太多了 这是总体标准差。 它衡量的是数据偏离均值的程度。 通常,这个数值越大, 数据偏离平均值越多。 数越小,离散程度越小。 这是任意定义 的方差。 我们可以做四次方。 或者其他事情。 我们可以不算平方, 但是在这里取一个绝对值。 我们可以这样做的原因是因为它 具有简洁的统计特性,正如我们努力实现的。 但这是总体标准差。 给了我们很好的单位——米。 下一个视频,我们要考虑样本标准差。