If you're seeing this message, it means we're having trouble loading external resources on our website.

如果你被网页过滤器挡住,请确保域名*.kastatic.org*.kasandbox.org 没有被阻止.

主要内容

什么是直方图

直方图是用不同高度的直条呈现数据的图表。在直方图中,每个直条将数字根据范围分组。更高的直条说明那个范围内的数据更多。直方图展示了连续样本数据的形状和分布。 

想加入讨论吗?

尚无帖子。
你会英语吗?单击此处查看更多可汗学院英文版的讨论.

视频字幕

假设你去了一家餐馆 出于好奇, 想了解一下来这边吃饭的人都是几岁 然后捏,你就在这家餐馆里走来走去 然后把里面所有人的年龄都记了下来 现在你所看到黑屏上 就记着此时餐馆里所有人的年龄 然后你脑子一热,想要用一种方法把这些年龄表示出来 也就是想办法把这些年龄分布啊什么的都给“画出来” 因为你想了解一些更深层次的问题,比如啊, “来吃饭的是年轻人最多啊?” “还是小孩儿最多啊?” “还是中年人最多啊?” “或者是老年人最多啊?” 如果你就光盯着这一堆数字 根本盯不出个什么所以然来 毕竟他们就是些数字罢了 问题来了,那我们应该怎么去表示这些数据呢? 这么来想吧,咱可以 把这些数字给丢进不同的篮子里,也就是给分分类 分完类之后呢,我们再看看每一个篮子里 也就是每一类里都有多少人 你要是不喜欢蓝子,咱还可以用箱子 咱就来看看每一个箱子都有多少人吧 就这么决定了 咱还是用蓝子来装人吧,一个篮子就是一个类 其实吧 篮子有时候也可以叫箱子 不乱扯了,咱还是用篮子来形容吧 假设这是个篮子,里面要装一堆数字 篮子里装了一堆数字 先写出篮子数量 ——哎呀 (笑)这个井号就是 这个井号就是“数量”的意思 不闹了 咱现在就划分几个篮子 每10年用一个篮子 比如第一个篮子就装0岁到9岁之间的人 那有多少人在0到9岁之间呢... 不如先把所有篮子都画出来再说 那么下一个就是从10岁到19岁 然后20到29,30到39 40到49,50到59 都能懂是啥意思哈 然后再来个60到69岁之间的 这几个应该能包括所有人了吧 因为我就没见有70岁以上的 那么有多少人应该被装到 “0到9”这一个篮子里呢? 快来快来数一数:一二三 四五六,六个人是属于这个篮子的 有多少人会被归类于... 有多少人应该被装到“10到19岁”这个篮子里呢? 咱来数一下 一个,两个, 三个 一共三个人 你应该知道接下来怎么办了 那多少人应该被装进“20-29”这个篮子里呢? 一个,两个,三个... 四个,五个人 一共五个人要被归进去 再来看看"30-39"这一类 喃,就一个 整个篮子里就这一人——“篮子”随便你怎么叫都可以 再来看看这个“40-49” 我们有一个,啊不,俩人 俩人住这一个篮子里 再看50到59 一个...两个... 还是俩人 最后在来看一看“60-69”这一类 咱们再换个颜色 60到69 就只剩下一个了,就是他 表示年龄有很多方式, 这只是其中一种 其实我们还可以把这些年龄和分类用一张表画出来 然后接下来我们画的这张表 就叫“直方图”(histogram) 来跟我念:直~方~图~ 再来:直~方~图~ 我们先拿到 这一大堆数字 然后再把它们分分类 然后我们要把 “每一类里都有多少人” “每一类的人数算多还是算少” “每一个篮子又有多大”都给表示出来 其实我应该写直方图的 我之前写的是直方表,其实应该是直方图 现在来画直方图 开始吧 在这一列最大的数字是6 这一列的数都表示桶里的人数 来画一下:一,二,三 四,五,六 一二三四五六... 这个井号就是“数字”的意思 横着的这条线(坐标轴)就用来表示那一堆篮子 让我往上划一划 因为我左边已经记好数据了 上面的那一堆就没什么用了 那我先标出来一个篮子 先画这个“0-9”的这个篮子吧 就画在这 从0到9岁的那个篮子 然后我们再来画有3个人的这个... 算了,我们先把0-9这一类先给画好再说 因为我现在的笔就是白色,和第一类是一样的 这一类一共有6个人 有六个人是0岁到9岁之间 就这么画来表示那六个人 然后我们再来看10-19这一类 这一类有仨人 有三个人是在10到19岁之间的 再来画个竖条俩表示 有五个人是在20到29岁这一类的 20-29这一类应该画在这里 画的稍微有点太粗了,重画 20到29这一类有这么粗就就行了 这一类有五个人 那高度就是五 那这根竖条应该长这样 说实话我应该把每根条话的在粗一点 这样我就能在它们底下多写点东西了 但是往事随风已远逝,一江春水东流去嘛! (笑)不闹了不闹了 大不了我写得小一点就是了,再来看30到39这一类 30到39这一类就画在这里就好了 这一类我们只有一个人 形单影只 然后我们再来看40到49这一类 这一类有俩人 40到49,有俩人 图应该长这样 40到49一共有俩人 就只剩两类了,再来看50到59 这一类还是有俩人 50到59,两个人 咱就把它画在这里了,挺好 这跟条就代表这一类了 就只剩下最后一类了,60到69,就一人, 60岁到69岁就这一位老年人 还是只有一个人。 我们再来总结一下 我们先拿到这一大堆数据 拿到这堆代表年龄的数字 然后呢,我们再把这些数字放到不同的篮子里 也就是给它们分分类 比如0岁到9岁就是一些小孩子 10岁到19岁嘛,都是少年了 勉强算是一些小青年吧 如果你是10岁,显然你还不算一个青年 然后以此类推,剩下的也都这么分分类 然后呢,我要数每一个类里都有几个人,或者几个数字 然后把每个篮子里的人数都给画到图里,这样我就能知道 这些人的年龄是怎么分布的了 这一家就像是那种 “会给客人发玩具”的那类餐馆了 因为这里有很多青少年嘛 或者是那种家庭餐馆 所以大人就跟着自己的小孩一起来吃 可能很多客人都是有了小孩的小两口 或者家里有小孩的老人 然后他们就带了一堆小孩来这里吃饭 经过这一波分析,你也能对这餐馆知道个大概 就是一大堆青少年嘛,然后少许的中老年人 回到正题,直方图就是一种“视觉化”(画出来)数据的方式 我们把一大堆数字合在一起来算(分类,看每类有多少人), 而不是一个一个的把它们全部都标出来 不跟隔壁某个叫点阵图的东西一样 在直方图里,我们不会问“有几个一岁的小孩呢?” 这里就一个一岁的 “有几个三岁的小孩呢?” 就一个三岁的 到头来约等于啥都不知道 如果我们画点阵图的话 我们就只有像这样的一个一个的点 但是,如果我们用直方图的话 我是把点放在一起按类来对待的,就比如: “0到9岁之间的一共有6个人” 然后我们会把这一整类画在一起,就像图中一样一条一条的 当然直方图并不是只能用来 记录餐馆里人的年龄 如果你想集中起来一类一类的来看数据的话 你可以把直方图用到任何地方