If you're seeing this message, it means we're having trouble loading external resources on our website.

如果你被网页过滤器挡住,请确保域名*.kastatic.org*.kasandbox.org 没有被阻止.

主要内容

平均绝对偏差(MAD)

一个数据集的平均绝对偏差(MAD)是每个数据点到平均值的平均距离。平均绝对偏差是测量数据集分布的一种方法。平均绝对偏差可以帮助我们了解一个数据集的"分散程度"。

想加入讨论吗?

尚无帖子。
你会英语吗?单击此处查看更多可汗学院英文版的讨论.

视频字幕

如果我有 两个不同的数据集 在第一个数据集中,有 2 另一个 2,4,和一个 4 在另一个数据集中,有一个 1 我们把这个放在屏幕右边 一个 1,一个 1,一个 6 与一个 4 我第一件想要思考的事情是 我应该如何, 是否有一个能帮我 测量这两个数据集中心的数字? 我们知道,其中有一个方法是 直接算平均数 那我们来算一下这两个数据集的平均数吧 第一个数据集,平均数是 我们只需要把所有数字加起来, 那就等于 2+2 +4+4 然后除以 我们总共有的几个数 我们有 1,2,3,4 个数 那这里就是 4 这里就是 2+2 等于 4 +4等于 8,+4 等于 12 等于 12 除以 4 等于 3 事实上,我们可以看看我们如何把上述的事情 在一条数轴上画出来 我来画一个 一个点阵图 这样我们可以看到所有的数值 如果这是 0,1,2, 3,4,和 5 我们有两个 2 我来 让这两个 2 我换成黄色 我有一个 2,然后我有另一个 2 我来在这里画一个点阵图 那我就有两个 4 1 个 4 和另一个 4,放在这里 我们可以算出,平均数是 3 平均数是 3 集中趋势的测量是 3 我把 3 放在这里 我用一个虚线来做个记号 这就是平均数值 好的,我们把这个可视化了 这的确看起来是中心 是一个特别 是说的通的 我们来看看这里另一个数据集 这里的平均数 等于 1+1 +6+4 完成后,我们会有 4 个数据点 这是 2+6=8 +4=12 12/4 也等于 3 这里也有同样的平均数 我们有不同的数字 但我们有同样的平均数 这个数据集 感觉有点不同 我们来把它可视化 来看看有什么不同 来看看我们是否能把它可视化 我得直接画到 6 这里是 0,1, 2,3,4, 5,6 然后我多加一个,7 我们有一个 1 我们有一个 1,我们有另一个 1 我们有一个 6 我们也有一个 4 我们算的平均数是 3 我们算的平均数是 3 平均数是 3 当我们用平均数来算出 中位数,或中位数的度量 我们用它作为平均数 它看起来一样,但是这个数据集看起来不同 他们怎么看起来不同呢? 我们聊过变异或变差 的概念 看起来这个数据集分散更广 看起来数值平均上离 平均数更远 比起这些数据值 这是一个很有意思的问题 在统计学中 我们不仅仅想要一个像平均数一样算出中心的测量 我们也想有一个测量变差的方式 比较直接的方式 来思考如何计算变差 平均来讲,每个数值离平均数 有多远? 可能听起来有点复杂 但我们会立马算出这个 平均数,我们不要过多使用“平均”这个词 我们想算出,平均来讲 每个数值离平均数多远 我们会计算 这就叫“平均绝对偏差” 绝对偏差 或平均绝对偏差 你也可以用简写,MAD mad,来代表平均绝对偏差 我们在讨论的 我们会算出这些数值 的距离,所以叫绝对偏差 这些数据和平均数差了多少? 它们的偏差绝对值是多少? 所以这些在 2 的点, 他们都离平均值差了 1 不管比平均值大还是小, 他们都离平均值差了 1 我们会找到所有这些偏差的平均值 这意味了什么? 哈哈,我用了“mean”(平均)这个词语 太多次了 我们来算出第一个数据集的 平均绝对偏差 我们能算出平均数是什么 平均数是 3 我们来用每一个数值 算出 它离平均值的绝对值 我们先来看看前两个 2 减去平均数 2减去平均数,然后我们来算出这个数的绝对值 所以这个是它的绝对偏差 我们有另两个 所以我们发现它离 3 的绝对偏差 记住,如果我们只是用 2-3 并取绝对值 就只是说它的绝对偏差 它离3 有多远? 这样子计算起来蛮容易的 我们也有一个 4,和另一个 4 我来写出来 那么我们有 4-3 的绝对偏差 和平均值的绝对偏差 而且,我们有另一个 4 我们在这里有个 4 4-3 然后我们取绝对值 因为我们在算“绝对偏差” 然后我们用它来除 我们把它除以我们一共有的多少个数 那等于多少呢 2-1 等于-1 但是我们会取绝对值 那就只会等于 1 2-3 等于 -1 我们取绝对值 会等于 1 你可以在这里看到 这个点距离平均值的距离为 1 离 3 的距离是 1 这个点离 3 的距离是 1 4-3=1 绝对值是 1 这个点离 3 的距离是 1 4-3 的绝对值 也是 1 所以你可以看到在这个情况下 所有的数值都正好距离 平均数是 1 所以我们用这个平均数 所以我们这里就不会有-1 我们只关注它距离的绝对值 所以你有 4 个数值 他们任何一个的绝对偏差是 4 所以这些绝对偏差的平均数 是 1+1+1+1 也就等于 4,再除以 4 等于 1 它其实表明 平均来讲,这些数值 离它们平均数的距离是 1 这个说的通,因为所有这些 正好距离平均值是 1 我们来看为什么 我们刚才算的结果在这边 我来看看 让我在这里腾出一些空间 在任何时候,如果你有了灵感 我鼓励你自己算一下 平均绝对偏差 我们来一起算一下 这里的平均绝对偏差 我会写 MAD(平均绝对偏差) 会等于 我们来算一下每个数值离 平均数的绝对偏差 等于 1-3 的绝对值 那就是这里第一个 加上绝对偏差 所以 1-3,这是第二个 然后加上 6-3 的绝对值 那就是 6 我们有 4 加上 4-3 的绝对值 我们就有 4 个点 所以 1-3 是负 2 它绝对值是 2 我们可以看到这里 这里距离 3 是 2 我们只关心绝对偏差 我们不在乎它在左边还是右边 然后我们有另一个 1-3 等于负 2 它的绝对值,那就是 2 它离平均数是 2 我们有 6-3 它的绝对值是 3 这里 我们看到 6 在平均数 右边 3 位 我们不在乎它在左边还是右边 然后 4-3 4-3 是 1,绝对值是 1 我们看到 它在 3 右边 1 位 所以我们有什么? 我们有 2+2 等于 4 加上 3 等于 7,再加1 8 除以 4,等于 2 所以平均绝对偏差 我们写下来 在这里 在这个数据集的这里 平均绝对偏差等于 2 对于这个数据集, 平均绝对偏差等于 1 这也说的通 他们有完全一样的平均数 他们的平均数都是 3 但这个分布更广 这个分布更广 因为,平均来讲,这些点的每一个 都和 3 的距离是 2 平均来讲,每个点 离 3 的距离都是 1 这里,绝对偏差的平均数是 1 这里,绝对偏差的平均数是 2 所以绿色的数据集更加分散