If you're seeing this message, it means we're having trouble loading external resources on our website.

如果你被网页过滤器挡住,请确保域名*.kastatic.org*.kasandbox.org 没有被阻止.

主要内容

参数如何随数据的移动和缩放而变化

了解如果对一个数据集进行加, 减, 乘, 或除以一个常数将会如何影响中心和分布的变化.

想加入讨论吗?

尚无帖子。
你会英语吗?单击此处查看更多可汗学院英文版的讨论.

视频字幕

在这个电子表格中有一些数据。 你可以使用微软Excel或者 Google电子表格。 我们将会用这个电子表格来 快速计算一些参数。 比如说这是一个总体。 打个比方,这可能是一群学生的总体数量, 而我们想计算一些参数。 这是他们的年龄, 而我们想计算一些相关的参数。 那么首先,我会使用这个表格来计算。 接着我们会想一想 当我们改变数据的时候,这些参数会如何变化。 如果我们将数据增大或变小 或者我们把所有这些数据点乘以某个数字, 实际的参数会发生什么变化? 那么我要计算的第一个参数是平均值。 接着我会计算均方差。 然后我会计算中位数, 接着我会计算, 比如说,四分位距。 我会将四分位距成为IQR。 那么让我们来计算吧。 让我们首先看一看反映集中趋势的度量值。 那么在大多数表格中,用来计算平均值的程序 是平均值功能。 我可以用我的鼠标选择所有这些数字, 或者我可以用箭头标示按下shift键 然后选择所有这些数字。 好了,这就是这些数据的平均值。 现在,然后我们思考一下 如果我把所有这些数字 都增加某个定额,会发生什么? 那么如果我将所有这些数据 都增加5。 在表格中,这样做的一种简单的方式是 如果你选择这个,加5, 然后你可以向下拖动, 你会注意到每个我之前有的数据点 现在都增加了5。 所以这是我的新数据, 或者我可以叫它数据+5。 让我们看看平均值是多少。 所以我们可以注意到,平均值 比原来多正好5。 如果我增加或者减少 任何一个数字, 同样的事也会发生,平均值会对应的发生变化。 这不该使你吃惊, 因为当你在计算平均值时, 你把所有的数字都加起来 然后除以数的数目。 如果所有这些数字都比原来大5, 加5, 在这里,一共有多少个数字? 1,2,3,4,4,5,6,7,8, 9,10,11,12。 你会在总数上增加12个5,然后除以12, 所以你的平均值增加了5是很正常的。 让我们想想如果把数据乘以某个数,平均值会怎么变化。 所以如果你选中所有的数据, 然后都乘5,会发生什么? 那么这就等于它乘5。 现在所有数据点都增加到原来的5倍。 现在我的平均值会发生什么? 注意我的平均值也增加到了原来的五倍。 那么对于测量集中趋势的参数, 如果我增加或者减少某个定额, 平均值就会增加或者减少这个定额。 如果我把数据全部乘5, 或者如果我把数据全部除以5, 我的平均值就会乘上或者除以同样的数字(5)。 如果你看一看你是如何计算出平均值的, 你就会发现这些数字的变化是有道理的。 让我们看看另一个反映集中趋势的 典型度量,就是中位数。 让我们看看它是不是也有同样的特点。 那么让我们来计算一下中位数。 再一次,你可以将这些数字按顺序排好 然后找到中间的数字。 这并不是很难, 但是电脑可以非常快的完成。 所以这就是数据的中位数。 你觉得如果所有这些数字都增加5, 中位数会发生什么? 中位数, 如果你把这些数字都按顺序排好, 并把每个都加5, 你可以把原来的顺序 看作现有的顺序, 只不过现在中间的数字比原来多5。 所以这就是10.5。 确实,这的确是10.5, 那如果你把所有数字乘5,会发生什么? 再一次,你还是会有同样的数字顺序。 它应该只是它乘5。 确实,中间的数字现在应该是大5倍。 所以对于这两个反映集中趋势的度量, 如果你把所有的数字都增加一个定额, 乘以一个定额, 那么这两个度量就会对应的 增加或者减少。 现在让我们想一想关于分散程度的度量。 看一看它们是否也有相似的特质。 均方差, 在这里称作STDEV。 我会取总体的均方差。 假设这是我的整个总体, 那么让我来分析一下。 让我确认一下, 这些数据的 均方差 是2.99, 让我们看看当所有数字增加5,会发生什么。 实际上,暂停一下这个视频。 你觉得会发生什么? 这是一个关于分散程度的度量。 如果你把所有数字增加一个定额--我是这么想的, 如果我把所有数据点增加一个定额, 平均值会发生变化,但是每个数据点和平均值的距离 应该会保持不变。 所以均方差应该不会发生变化。 这个例子中,我认为不会, 而确实,它没有发生变化。 所以我们在移动数据。 在这里,我们刚刚把所有数据增加了5, 或者如果我们减少1, 你的反映数据分布的度量,在这里是均方差, 应该不会变化, 或者至少均方差这个度量 不会变化。 但是如果我们把数据点乘某个定额,我觉得它会变。 因为你可以想象出一个很简单的数据, 所有数据离平均值都有一个特定的距离, 而现在这些距离 会增加5倍。 所以我认为它实际上应该, 我们应该把它乘5, 而它看上去确实应该乘5。 如果我把它乘5, 把数据乘5将会使均方差 发生相似的变化。 那么四分位距呢? 我们实际上是要取上四分位数 减去下四分位数 来计算出中间50%的范围。 让我们就这样做。 我们可以用四分位距功能, 然后我们会想要看看我们的数据, 我们想要上四分位数。 这将会计算出上四分位数, 减去下四分位数,还是一样的数据, 现在我们想要再选择一次。 同样的数据,但是这将会是 下四分位数。 这将给我们四分位距。 这会计算出数据的上四分位数 而这个会计算出数据的下四分位数。 我们得到2.75。 现在,让我们想一想四分位距 是否应该变化。 我不认为会变化。 因为要记得,所有数据点都会移动了。 虽然说下四分位数现在增加了5, 但是上四分位数现在也会增加5。 所以它们之间的距离不应该变化。 而且确实,距离没有变化, 或者说差没有发生变化。 但是相似的,如果我们把所有数据放大缩小几倍, 如果我们把下四分位数 和上四分位数都乘5, 那么它们之间的差也应该乘5。 而且我们可以在这看到这一点。 所以重点是, 我刚刚举的例子中把数据 加了5或者乘以了5, 但是你可以减去任何数字, 也可以除以任何数字。 集中趋势的典型度量-- 平均值和中位数--都会随着数据的加减定额和乘除定额 而对应的加减和乘除定额。 但是典型的数据分布的度量, 均方差和四分位距, 并不会随着数据加减定额而发生变化, 但是它们会随着数据乘除定额而发生变化。