If you're seeing this message, it means we're having trouble loading external resources on our website.

如果你被网页过滤器挡住,请确保域名*.kastatic.org*.kasandbox.org 没有被阻止.

主要内容

比较各种分布的平均数

Sal 老师比较了两个以点图形式展示的不同分布的平均数。 Sal Khan 创建

想加入讨论吗?

尚无帖子。
你会英语吗?单击此处查看更多可汗学院英文版的讨论.

视频字幕

画外音:肯尼在他的高中采访了 大一和大四学生. 问他们每天吃多少片水果。 结果如下图所示。 我们要完成的第一个表述 是水果的平均数量大于, 实际上,让我沿着屏幕往下看, 更重要的是, 我们必须在大一和大四之间选择。 然后他们说,均值是 一个很好的度量, 我们可以选择一年级或四年级。 我们可以选择一年级或四年级。 我们想一下。 让我们先考虑第一部分。 我们来计算一下 每个分布的均值。 我鼓励你们试着暂停视频 自己算一下。 首先考虑新生吃水果的平 均片数。 本质上,我们要取 每一个数据点, 把它们加在一起, 然后除以数据点 的个数。 在0处有一个数据点。 在0处有一个数据点。 所以我写0。 然后在1处有两个数据点, 所以我们可以说加上2 * 1。 然后2处有两个数据点, 写成+ 2 * 2。 然后,我们看一下,我们有一堆数据。 3处有四个数据点, 所以我们有4个3。 我把它圈起来。 所以我们有4个3。 加上4 * 3。 然后是3个4, 加上3 * 4。 然后是5, 所以+ 5, 然后是6。 我用一种你们能看到的颜色来画。 然后这里有个6, 加6. 我们总共得了多少分? 我们有1 2 3 4 5 6 7,8 9 10 11 12 13 14 哦,事实上,小心点。 我们有15个点,我没把那个放进去。 事实上,让我… 我们有15个点, 我不能忘记这里的这个, 加上…… 我的笔现在有点怪怪的, 但我们会挺过去的, + 19。 这是什么呢? 这就等于0。 这是2。 这是4。 这是12。 我的笔真出毛病了。 就像数字墨水快用完了 之类的。 这是另一个12, 然后是5 6和19。 这是什么呢? 2加4等于6, 加24等于30, 加11等于41, 加19等于60。 60除以15等于4, 也就是每天水果的平均数 新生每天吃4个水果。 在这里, 就在这里是我们的均值…… 我用一种你能看到的颜色。 现在我们对大四生做同样的计算。 我们有一个数据点,他们每天不吃 任何水果,不太健康。 然后有一个1, 我把它写成, 我们可以把它写成1乘以1, 我把它写成1。 然后有两个2, 加上2 * 2。 然后是1、2、3、4、5个3, 5个3, 所以加上5 * 3。 然后是3个4, 加上3 * 4。 然后有两个5, 加上2 * 5, 然后是6。 我们有一个6, + 6, 有一个7, 有人每天吃7个水果, 大量纤维, + 7。 现在,我们有多少数据点? 我们有1 2 3 4 5 6 7, 8 9 10 11 12 13 14 15 16个数据点。 所以我们要把这个除以16。 这是什么呢? 这就是0。 让我们来看看。 这是0。 这是4。 这是15。 这是12。 这是10。 1 + 4 = 5 + 15 = 20 加 12 等于 32, 加10等于42。 42加6等于48, 48。 我在做… 42加6等于48加7, 48加7等于55。 我做得对吗? 我再做一遍。 1加4等于5 加15等于20, 32、42。 42加13等于55。 所以这个等于55 / 16, 也就是,我们看一下, 这里是3, 3乘以16等于48, 所以是3又7/16。 高年级学生的均值是3又7/16, 就在…… 让我们来看看。 这是3,这是4,所以是7/16, 比一半少一点。 就在这里。 所以水果的平均数肯定 比新生的更大。 他们有4个… 他们每天吃水果的平均数是4。 相对于3又7/16。 平均数对于中心分布是 一个很好的衡量标准。 所以当我们考虑是大一还是大四的时候, 均值对离群值很敏感。 例如,有人在这里吃东西 每天19个水果。 这是大量的水果。 他们一定只是在吃水果。 你可以想象一下,这个数字甚至更大, 如果有人吃了20或者30个水果, 仅仅一个数据点就可以使整个平均值向上倾斜。 这不是对众数的影响 因为众数是中间数。 即使你一直 改变这一点, 也不会对众数产生影响因为众数是中间数。 所以均值对这些异常值 更敏感, 这些点非常非常高, 非常非常低。 因为大四学生似乎没有 任何像这样的异常值, 我认为平均数是大四分布 中心的一个很好的衡量标准, 或者更好地衡量大四的 分布中心。 把这两个都填上。 新生水果的平均数量更大, 而平均值是一个很好的 衡量大四分布中心的指标。 你甚至可以在这里看到它。 我们看到新生的平均数字是4, 但是如果你忽略这个人 考虑一下 这个分布的大部分, 4 看起来真的不像它的中心。 它的中心看起来更接近于3。 这个人每天 吃19个水果, 使平均值向上倾斜。 而这里,3又7/16看起来更接近 实际分布, 更接近… 事实上,我不应该说…… 我的意思是在这两次, 我们计算了实际 分布的均值。 但在这里,由于没有离群值, 平均值似乎更接近于, 我猜你可以说是这堆东西的中间 在这里。 我们来检查一下答案, 我们做对了。