If you're seeing this message, it means we're having trouble loading external resources on our website.

如果你被网页过滤器挡住,请确保域名*.kastatic.org*.kasandbox.org 没有被阻止.

主要内容

示例: 分析分布的差

通过理解正态分布变量之差的分布来求出一个随机选择的女人比一个随机选择的男人高的概率.

想加入讨论吗?

尚无帖子。
你会英语吗?单击此处查看更多可汗学院英文版的讨论.

视频字幕

- [讲师] 假设男性的平均身高为 为178厘米,标准偏差为 为8厘米。 女性的平均身高为170厘米 标准差为6厘米。 男性和女性的身高都是正态分布。 我们独立地、随机地选择一个男人和一个女人。 该女性 比该男性高的概率是多少? 我建议你暂停这段视频,仔细想想。 我给你一个提示。 我们定义随机变量M 等于一个随机选择的男性的身高如何? 一个随机选择的男子的身高。 如果我们定义随机变量W 等于 一个随机选择的女性的身高呢? 女性 我再定义第三个随机变量 用这前两个变量来表示。 让我把它叫做D,代表差异。 它等于 等于一个随机选择的男性的身高 和一个随机选择的女性的身高差。 所以D,随机变量D等于 等于随机变量M,减去随机变量W。 前两个显然是正态分布。 题目告诉我们了,就在这里。 男性和女性的身高都是正态分布。 而且我们还知道,或者说你即将知道。 正态分布的随机变量 的差值 也是正态分布的。 那么,鉴于此,你能不能考虑一下 如何解决这个问题? 女性的比男性高的概率。 好了,现在我们一起来研究一下这个问题。 为了帮助我们形象化,我来画一下 这三个随机变量的正态分布曲线。 所以这第一条曲线是关于变量M的。 在这里的中间,是M的平均值。 我们知道,这 等于178厘米。 我们假设一切以厘米为单位。 我们还知道,它有一个标准差 为8厘米。 因此,举例来说,如果这是一个标准差以上, 那么这就是一个标准差以下。 在这里这个点 比178多8厘米,所以是186。 而这个点会比它少8厘米。 所以这个是170厘米。 这就是随机变量M的情况。 现在我们来看看随机变量W。 随机变量W。 他们告诉我们W的平均值是170。 而平均数以上的一个标准差 是比平均值高出6厘米。 标准差是6,6厘米。 所以这里减去六, 指低于平均值的一个标准差。 现在我们来想想这两者之间的差值, 随机变量D。 那么让我们来考虑下这个 随机变量D。 D的平均值等于 这两个随机变量的平均值之差。 所以它等于M的平均值 M的平均值,减去W的平均值。 减去W的平均数。 我们知道这两个值,是178减去170。 让我把它写下来。 这就等于178厘米 减去170厘米。 这等于 让我用这个颜色来写, 这等于8厘米。 所以这个是8,在这里。 那么标准差是多少? 假设这两个随机变量是独立的。 并且题目告诉我们, 我们是独立地、随机地选择一个男人和一个女人。 男人的身高不会影响 女人的身高,反之亦然。 假设这两个是独立变量, 如果你取这两者的和或差, 那么离散程度就会增加。 但你不会只是把标准差加起来。 实际上二者之差的方差 等于 这二者的方差之和。 让我把它写下来。 我用VAR来表示方差, 或者我可以把它写成标准差的平方。 让我这样写。 D,即二者差值,的标准差,平方一下, 也就是方差,等于 我们的变量M的方差 加上我们的变量W的方差。 现在,这可能有点不太好理解。 如果这里是个加号, 你可能更好理解。 但是我们是做加法还是做减法并不重要。 这些是独立变量时, 那么不管我们是求二者之和还是二者之差的方差, 都是把二者方差加起来。 这样我们就可以算出来了。 这等于标准差 变量M的标准差是8。 8的平方将是64。 然后我们有6的平方。 这边的这个是6。 6的平方是36。 你把这两个加在一起。 这就等于100。 所以这里这个分布的方差 就等于100。 那么这个分布的标准差是多少? 它等于 等于方差的平方根。 100的平方根等于10。 所以,比如说,平均数以上的一个标准差 就是18。 低于平均值的一个标准差 就等于-2。 现在使用这个分布, 我们就可以回答这个问题了: 这个女性比 这个男性高的概率是多少? 我们可以把这个问题改写成说是 随机变量D 在什么情况下的概率会是多少? 暂停一下视频,想一想。 我们考虑的是女人比男人高, 如果女的比男的高, 那么这将是一个负值。 那么D就会小于零。 所以我们真正要做的是弄清楚 D小于零的概率。 所以我们要做的是,如果我们说零就在这里...... 如果我们说零在我们的分布上就在这里, 这里是D等于零。 我们想弄清楚, 曲线下小于这个零的面积是多少? 所以我们要算出这整个面积。 有几种方法可以做到这一点。 你可以算出D等于0时的Z分数, 这很直接。 你可以直接说,这个Z等于0减去我们的平均值 8除以我们的标准差10。 所以它是-8除以10, 这等于-8/10。 你可以查一个Z表,然后说 在Z等于负0.8时 曲线下Z之前的总面积是多少? 另一种方法是, 你可以用一个图形计算器。 我这里有一个TI-84计算器。 计算器里有一个正态累积分布函数。 我要按SEC然后VARS, 就可以进入分布了。 我有这些不同的功能。 我想要正态累积分布函数。 这是选择二。 输入下限。 我想写负的无穷大。 但是计算器没有负无穷大的按钮。 但你可以放一个非常 非常、非常、非常负的数字, 就我们的目的而言,它在这里相当于负无穷大。 所以我们可以说负1乘以10的99次方。 输入方法是点SEC, 然后这两个大写的E 指的是乘以10的,我输入的是99次方。 这是一个非常、非常、非常负的数字。 这里的上限,我们要删除这个。 上限是零。 我们要找到从负无穷大开始 一直到零的面积。 这里的平均值,我们已经算出来了 平均值是8。 然后是这里的标准差。 我们也算出了这个,这个等于10。 我们点击这个键, 我们就回到主界面,回车。 我们可以直接输入这些数据 直接在主屏幕上输入。 这表示,我们正在看一个正态分布。 我们想找到两个界限之间的累积面积。 在这里,是从负无穷大到零。 从负无穷大到零。 其中平均数是8,标准差是10。 我们按回车键,我们得到大约0.212。 大约是0.212。 或者我们可以说 女的比男的高的概率是多少呢? 是0.212,或者说大约, 有21.2%的机会发生这种情况。 比五分之一稍微高一点。