如果你看到这则信息,这表示下载可汗学院的外部资源时遇到困难.

If you're behind a web filter, please make sure that the domains *.kastatic.org and *.kasandbox.org are unblocked.

主要内容

可视化二项式分布

萨尔介绍了绘制二项式分布的步骤, 并将其与二项式概率的计算联系了起来。

想加入讨论吗?

尚无帖子。
你会英语吗?单击此处查看更多可汗学院英文版的讨论.

视频字幕

在上一个视频, 我们建立了一个随机变量 x, 其定义是,当我们抛了五次硬币时, 得到正面的次数。 接着,我们可以算出 随机变量取值 0,1,2,3,4 或 5 的概率。 让我们来一起看看它们。 我们来把它们画出来, 我们就可以 了解这个随机变量的概率分部。 那我们来画一下吧。 我可能换一个方法, 这样我们能更好地看到概率。 我把这边的内容先都擦掉。 啊,有点失误。 这样有可能能行。 让我快速地把这些内容擦掉, 把这些笔记擦掉, 现在我们可以真正地开始绘制分布图。 好的,在这一条轴上, 我会放上所有不同的结果 让我来画一下 看起来还行,还像个直线。 我来开始在这个直线上绘制概率 不错,画的蛮直的。 我们来看看有哪些概率。 我们来看看, 所有的概率分母都是 32, 最高的概率是10/32。 那这里,就作为 10/32, 这里,有两个5/32, 我们来看看,这个位置看起来差不多是一半, 这里是5/32, 另外1/32差不多在这里 1,2,让我们来看看, 如果我把它分割开,分成1,2,3 好的,让我来分一下, 1,2,3, 4,5 好的,我们把这里称为1/32, 那么我们的可能性,在这里, 那么这就是随机变量 可能的数值。 让我在这里画一个小小的直方图, x 等于 0, 在这里的概率, 其实,因为我会想去画一个直方图, 直方图会长这样, 让我来改改, 把它放在这里, x 等于 0 那么在这里,概率是1/32, 我来上个颜色。 现在,x 等于1 的时候, x 等于 1 的时候是 5/32, 那我来把它画出来, 所以5/32, 我把条形放在这里, 并给它上色, 因此这里, 代表着概率中 x等于 1, 因此我们能得到 1,正好在 5 次抛硬币中,能得到 1 次正面。 我们现在来看看概率 x 等于 2, x 等于 2 是 10/32, 那会看起来这样。 让我来努力地画一下, 我其实还蛮喜欢自己徒手画出来的美感。 有时候你如果用电脑来画, 不知道,有时候, 画出来的东西就没有它自己的个性了。 好的,那这里代表着我们 随机变量等于 2。 现在我们来看看 x 等于 3 的概率, 也是10/32, 这里是 10/32, 我来画一下, 这里是10/32, 来上个色。 玛尼玛尼哄,好啦。 我觉得这个过程还挺治愈。(笑) 好的,那么这个是 x 等于 3 的概率。 那么x 等于 4,就是5/32。 我们回来这里, 这里是5/32。 我们来上个色, 那么这里代表 x 等于 4, 那么最后, x 等于 5 的概率又是1/32, 和这里一样, 我们来上个色,那么这里代表 我们的随机变量 x 等于 5。 那么,当我们画出, 这个概率分布,要注意, 这是一个离散型概率分布。 这是一个离散型随机变量, 这个变量只能取 有限数量的值。 事实上,我应该说,它是一个 有限数量的离散型随机变量。 这个数值可以取离散变数, 但是理论上来说,它可以取 无限数量的离散型随机变量。 你可以越来越往上数, 但是这个是离散的,意味着, 它是这些特别的整数, 它无法取在这些整数之间的值, 并且它也是有限的。 它也可以取 x等于 0,x 等于 1, x 等于 2,x 等于 3,x 等于 4, 或x 等于 5, 并且当你画出它的概率分布, 这个离散型概率分布, 它会从1/32开始,先往上,然后会回来往下, 它是对称的, 一个看起来如此的分布 一个像这样的离散型分布, 我们叫它”二项式分布“, 我们会在未来讲到, 为什么它叫”二项式分布“, 但是给个线索, 事实上,我来讲讲 它为什么叫”二项式分布“, 因为这些概率, 可以通过二项式系数, 和组合数学来得出。 在另一个视频中,我们会聊聊, 尤其是当我们聊到二项式定理, 我们为什么要把这些事物叫”二项式系数“。 它实际上是基于代数中二项式的幂, 但这是一个特别,特别,特别,特别重要的分布, 在统计学中特别重要, 但是对于很多离散过程, 你可能会假设基础分布, 是一个二项式分布,当我们 深入了解统计, 我们会在未来讨论人们为什么这样做。 如果你会有比像现在这个例子中的 5 个案例多得多的情况, 如果,不说从抛 5 次硬币中 得到正面的次数,取而代之说, x 等于抛 500 万次硬币中 得到正面的次数, 你可以想想,你会有很多很多, 条形会相对于整个峰破越来越细, 它便会开始, 会开始接近一个看起来 很像一个钟形曲线的东西。 我来上个我还没用过的颜色, 让你看得更清楚一些, 那么它会看起来。。 如果你有更多的, 这些概率, 它会看起来 接近一个钟形曲线, 你可能原来听说过钟形曲线, 钟形曲线是一个常态分部。 所以有一种思考的方法,是 常态分布是一个概率密度函数。 是连续的。 那么,黄色的这个, 接近常态分布, 常态分布,在经典意义上, 会一直继续下去, 常态分部,与二项式分布有关联。 在统计学说,很多时候, 人们会假设常态分布的存在, 因为你可以说,好吧,它是一个 正在发生的,几乎无限数量的随机过程的产物。 在这里,我们抛了 5 次硬币, 但你可以想象,分子的相互作用 或人际交往,你可以说 噢,这些事物有无数次的交互, 因而会拥有一个常态分布, 这个概念在科学与统计中特别,特别重要。 二项分布是这个概念的离散型版本, 需要注意, 这是这些分布, 是这些分布的来源, 这是它们互相关联的由来。 你如果想,当你做了更多轮某件事情, 二项式分布会 非常地接近常态分布, 但是同样的也得考虑, 它们从哪里来。 我们会在统计学中更多地讨论它, 因为可以假设, 一个潜在的二项式分布, 或一个常态分布, 可以概括很多不同形态的过程, 但是有时候他它不是这样的,甚至对于经济学来说, 当在头或尾的事情 实际上更有可能发生, 有时候人们会直接假设有正态分布图, 但其实这样的假设会导致像经济危机 一样的事情发生 但无论如何,我不想再继续跑题了。 我想说的是,我们应该感激这个模型, 我们从随机变量开始, 到了抛 5 次硬币得到正面的次数, 然后我们画了图, 可以从视觉上看到这个二项式分布图, 我其实差不多在告诉你, 我还没有真正的让你看到, 如果你抛很多很多次硬币, 并用同样的方式定义一个变量, 那么这个直方图,这个条形图, 会看起来像一个钟形曲线, 如果你本质上有无数个它们, 你会有一个 连续概率分布, 或者,我也应该说,概率密度函数, 这会让我们接近一个常态分布。