If you're seeing this message, it means we're having trouble loading external resources on our website.

如果你被网页过滤器挡住,请确保域名*.kastatic.org*.kasandbox.org 没有被阻止.

主要内容

密度曲线的中位数, 平均数和偏态

密度曲线的高级分析. 关注中位数, 平均数, 左偏态和右偏态.

想加入讨论吗?

尚无帖子。
你会英语吗?单击此处查看更多可汗学院英文版的讨论.

视频字幕

在其他的视频里我们介绍了 密度分布曲线。 是关于分布的总结 一个数据的分布,在未来 我们也要接触其他内容,比如概率密度 但是这个视频我想讨论 我们从中能获取什么, 哪些性质,如何去描述密度分布曲线, 和他们所代表的分布。 我们这里有四个 我考虑的第一件事是 能否估算这些密度曲线 所描述的数据集的中值或中位数。 记住,如果我们有一个数集 让他们按从小到大排序 中位数是最中间的值, 或者最中间两个数的中间值。 这个情况下,我们想找到 有一半的值比这个数高 和一半的值比这个数低 观察一个密度曲线。 你想看这个区域 然后你会说,好,哪个值 使它左右都是一样的面积? 对于这个,用眼看, 在这里的值是中位数。 通常,如果你有一个对称 的分布,中位数 是对称轴。 我们有一个有些不一般的分布 称作双峰分布 当你有两个主要的凸起在 这里,但是对称的 对称轴在这里 所以这个值,再一次,是中位数 另外一种来思考的方法是, 这个值左边的面积 等于它右边的面积 使它成为中位数 但如果我们考虑的是非对称的分布呢 我们想用同样的方法来做 思考,在哪个值的 左边和右边的面积相等 再一次,这不是很准确的 但我要尝试估测一下 你可能尝试到左边顶部 的这个凸起,但如果是我 这很清晰,观察他, 左边在这里的区域 比左边更大 所以这不是中位数 如果我移动中位数往右边一点 在这里,这看起来很接近 再一次,我在估测。 但这是有道理的,这里的面积 看起来很接近这里的面积 如果是这样 这将是中位数 同样的,在这里, 可能是这里 当然 ,我只是在估测,但看起来差不多 这片面积等于这个 即便它很长,但很低 这里的曲线更高 即便他比起右边更短 所以对于这样的分布,这是中位数 左边的面积和右边的面积一样 但是平均数呢 平均数,你取每一个值 用他们的频率来横量 你有他们的频率来衡量 然后加起来 对于对称的分布,平均数和中位数 是一样的 这也是平均数 这也是平均数 如果你从物理层面考虑 平均数是平衡点 在这个点上你想要放置一个支点 来平衡分布。 所以你可以在这里放一个点 然后想象一下这会 平衡,这会平衡 这个方法是基于 算这些值的加权平均值 那对于这些不怎么对称的分布呢 让我们在这里考虑 我该在哪里放置点呢,或 我们的直觉告诉我们如何平衡他们呢 我们在两边有一样的面积 但当你有这个长尾巴 在右边,这将把平均数拉到 中位数的右边。 我们平衡的点大概 是在这附近 再一次,这是我在估测 但这大约是我们的平均数 这个情况下是在中位数的右边 这个是中位数 这个是平均数 这个情况下,因为左边有一个长尾巴 我需要 在这里使他平衡 平均数将是这个值,在这里 对于那些非对称的分布 平均数和中位数不同 这样的分布被称为偏态分布。 这个分布里,它的平均数 在中位数的右边 右边是长尾,被称作右偏分布 偏度的具体概念有限复杂 但简单而言 你可以发现 当它有一个方向有个长尾 这是他偏向的方向 或者如果平均数在中位数的某个方向, 平均数在中位数右边, 通常,这是 右偏的分布 反过来说,平均数在中位数左边, 我们有长尾在左边, 通常, 这是左偏的分布