If you're seeing this message, it means we're having trouble loading external resources on our website.

如果你被网页过滤器挡住,请确保域名*.kastatic.org*.kasandbox.org 没有被阻止.

主要内容

对中位数和平均数的影响:去除异常值

Sal 老师考虑从一组数据中去除一个小的异常值的影响。平均数和中位数会有什么变化?.

想加入讨论吗?

尚无帖子。
你会英语吗?单击此处查看更多可汗学院英文版的讨论.

视频字幕

“小红打了五轮高尔夫, 她的最低分是 80。 前四轮和最低分那一轮的得分 记录在下面的散点图里。 我们可以看到, 她的最低分是 80。 她还得了一次 90,得了一次 92, 一次 94,一次 96。 小红在最低分 80 的那一轮犯规了, (很明显作弊没有帮到她) 所以这个分数会从数据组中被去掉。 所以他们在这里把 80 给去掉了。 现在我们只有另外四轮里的分数。 去掉最低分 会怎样影响平均值和中位数?“ 让我们先想一想中位数。 中位数是中间的那个数字。 在这里如果你有 5 个数据点, 中间的数据点会是 左边右边各有两个数字的那个数。 所以中位数在这里是 92。 中位数是 92。 所以在去掉最低分之后中位数是多少? 现在你只有 4 个数据点了。 当你试着算一组有偶数个数字的数据 的中位数时, 你可以看看中间的两个数字, 也就是 92 和 94。 然后你算一下他们的平均值。 它们的正中间的那个数字就是中位数。 所以中位数在这里就是, 让我写的更清楚一点, 中位数是 92 和 94 中间的那个数,也就是 93。 所以中位数是 93。 中位数是 93。 所以去掉最低的数据点 在这里会使中位数增大。 所以中位数,让我写在这里, 中位数增加了一点, 中位数增加了。 现在平均值会发生什么? 平均值会如何变化? 一种不用任何计算的思考的方式就是 如果你去掉一个 比平均值低的数字,比现有的平均值低, 我还没有算出现有的平均值是多少, 但是如果你去掉这个数字,平均值会上升。 平均值会上升。 所以希望这给了你一些思路。 如果你去掉了一个比平均值高的数字, 你的平均值会下降, 因为你不再有那个大数字了。 如果你去掉一个比平均值低的数字, 你去掉它了之后,你就不再有那个拉低平均值的小数字了, 这就使平均值上升了。 但是让我们用算数确认一下。 让我们算一算这个平均值。 所以我们把 80,90, 92,94,96 都加起来。 这些就是我们的数据点。 我们得到了:2 加 4 是 6,加 6 是 12。 如果我们有 1 加 8,就是 9,这就是, 所以这是 9,然后还有另一个 9, 另一个 9,另一个 9, 另一个 9, 你实际上有,这是 5 个 9。 所以一共是 452。 所以这是这五轮的分数之和。 然后你把这个数字除以轮数。 所以就是 452 除以 5, 所以 452 除以 5 我们得到,这里是 5, 不能被 4 除,要被 45 除, 9 乘 5 是 45,再减去,得到 0, 把 2 拿下来, 2 可以被 5 除 0 次,0 乘 5 是 是 0, 减掉。 你剩下了一个 2,所以你可以说你的平均值 你的平均值是 90 又 2/5。 不是 9 和 2/5,90 和 2/5。 所以这就是平均值。 所以数据点的平均值在这里。 如果你去掉这个数,平均值是多少? 所以这里我们只把 90,92, 94,96 加起来, 所以我们来看,2 加 4 加 6 是 12。 接着你把这些都加起来得到 37。 372 除以 4,因为我现在 只有 4 个数据点了,不是 5 个。 4 进入,让我 写在你可以看见的地方。 372 除以 4, 37 可以被 4 除 9 次。 9 乘 4 等于 36,减去,你得到了 1。 把 2 写下来,可以正好除 3 次, 3 乘 4 等于 12。 没有余数。 所以中位数和平均值在这里 都,所以平均值在这里是, 平均值也是 93。 所以你可以看到, 中位数从 92 上升到 93,增加了。 平均数从 90 又 2/5 增加到了 93。 所以平均值比中位数增加的多。 它们都增加了,但是平均数增加的多一些。 这是合理的,因为这个数字比其他的数字 要低很多。 所以你可以想象如果你去掉这个数字, 平均值应该增加了不少。 但是让我们来看看这些选项中 哪一个符合我们刚刚的形容。 “平均值和中位数都会降低”,不对。 “平均值和中位数都会降低“,不对。 “平均值和中位数都会增加, 但是平均值增加的比中位数要多。“ 这就是我们形容的情况。 平均数从 90 又 2/5 或者说 90.4, 增长到了 93。 而中位数只增加了 1。 所以这就是正确答案。