If you're seeing this message, it means we're having trouble loading external resources on our website.

如果你被网页过滤器挡住,请确保域名*.kastatic.org*.kasandbox.org 没有被阻止.

主要内容

卡方分布简介

卡方分布简介. Sal Khan 创建

想加入讨论吗?

尚无帖子。
你会英语吗?单击此处查看更多可汗学院英文版的讨论.

视频字幕

这一节我们要讲的是χ2分布 本字幕由网易公开课提供,更多课程请到http//open.163.com 这一节我们要讲的是χ2分布 后面的几节视频中 我将用它来检验 网易公开课官方微博 http://t.163.com/163open 理论分布同观测结果吻合得有多好 想想 假设有一些相互独立的标准正态分布随机变量 oCourse字幕组翻译:只做公开课的字幕组 http://ocourse.org 假设有一些相互独立的标准正态分布随机变量 回忆一下 假设随机变量X服从正态分布 记作X~N(0,1) 均值是0 方差是1 或者说X的期望值是0 X的方差是1 画一下 抽样就是从这个变量中获取实例 我们从这样一个标准正态分布中抽取样本 均值为0 方差为1 显然标准差为1 这里表示标准差 方差或标准差都是1 χ2分布 我这样定义 我定义一个新变量Q 我这样定义 我定义一个新变量Q 从这个标准正态分布中抽样 然后对得到的值进行平方 它等于随机变量X的平方 这个随机变量Q的分布 就是一个χ2分布的例子 这个视频中我们会了解到 χ2分布是这样一些数量的随机变量平方之和 这里只有1个随机变量 然后平方 这只是一例 之后我们还会讲到更多 这个Q就是一个χ2分布的随机变量 记号是这样的 Q服从χ2分布 这不是x 这是希腊字母χ 很像一个花体的x 它是χ2分布的一员 由于这里只是 1个独立的标准正态分布随机变量平方之和 我们说这里只有1个自由度 自由度数目这样表示 我们说这里只有1个自由度 自由度数目这样表示 这里只有1个自由度 假设这是Q? 下面我再来定义Q? 换个颜色 用蓝色吧 随机变量Q?这样定义 这里是1个独立的标准正态分布随机变量X? 取它的平方 然后是另一个独立的标准正态分布随机变量X? 然后平方 然后是另一个独立的标准正态分布随机变量X? 然后平方 每个随机变量的分布都如图所示 而且它们相互独立 要得到Q? 你可以从该分布中抽取X? 平方 从相同分布中抽取X? 平方 然后两者相加 就得到Q? 这里是Q? 而Q?服从自由度为2的χ2分布 这里表示2个自由度 下面看一下χ2分布的图像 这来自维基百科 给出了χ2分布的一些概率密度函数 这来自维基百科 给出了χ2分布的一些概率密度函数 第一条曲线自由度k=1 这条线也就是Q?的概率密度函数 接近0时它开始飞速上升 这说得通 此时只从标准正态分布中抽样一次 得到接近0的可能性非常大 被平方的东西如果接近0 平方后会更接近0 被平方的东西如果接近0 平方后会更接近0 所以得到小数值的概率非常高 低于某界限值的概率非常高 比如小于1/2处 得到大数值的概率则非常低 要得到4 样本值需要是2 要得到4 样本值需要是2 2也就是离均值2个标准差远 可能性很小 这还只是4 更大的数字就更不大可能了 所以得到这样的形状 2个自由度时 形状稍微缓和了一些 这条蓝色曲线表示Q? 注意到 接近0的可能性减少了 较远处的值更容易取到 不过仍然更容易取得小数字 再看下一个χ2分布的随机变量Q? 再看下一个χ2分布的随机变量Q? 它表示三个相互独立的随机变量平方之和 X? X? X?都服从标准正态分布 Q?是拥有3个自由度的χ2分布 Q?是拥有3个自由度的χ2分布 Q?对应图上的绿色曲线 也许我该用绿色的 Q?对应图上的绿色曲线 也许我该用绿色的 此时更有可能得到这里的值了 此时更有可能得到这里的值了 因为这里是取一些小数字之和 因为这里是取一些小数字之和 随着自由度增加 曲线会往右侧偏移 凸起部分越往右 某种程度上 曲线越来越对称 有趣的是 这和我们之前看到的曲线都不一样 它没有小于0的值 这种性质的曲线我们倒是见过 它没有小于0的值 这种性质的曲线我们倒是见过 因为这里是平方和 每个随机变量的值可能小于0 正态分布可以取负值 每个随机变量的值可能小于0 正态分布可以取负值 但由于这里是取平方和 结果显然是正的 但由于这里是取平方和 结果显然是正的 这个分布的用处 我们下一节会讲到 大体上就是衡量离期望值的误差 这个可以看成总误差 你能求出这种误差的概率 如果你假设一些参数的话 详细的下一节再说 下面我来教你们如何查阅χ2分布表 假设问题是… 假设这是我们的分布… 我用蓝色吧 这里有2个自由度 总共是2项相加 如果问题问 Q?>2.41的概率是多少 如果问题问 Q?>2.41的概率是多少 如果问题问 Q?>2.41的概率是多少 如果问题问 Q?>2.41的概率是多少 选2.41是有原因的 这里要求Q?>2.41的概率 这就需要查阅χ2分布表 Q?服从2个自由度的χ2分布 所以看2自由度这一行 我要求Q?>2.41的概率 选2.41是因为表上正好有 这里都是一些奇怪的数字 而不是整数或容易理解的分数 这里都是一些奇怪的数字 而不是整数或容易理解的分数 这是由于p值导致的 即大于某值的概率 一般是反过来看 你可以通过查χ2表看2自由度下大于哪个值的概率是30% 你可以通过查χ2表看2自由度下大于哪个值的概率是30% 结果得到2.41 但我这里会反过来看 我希望求Q?的值大于2.41的概率 我希望求Q?的值大于2.41的概率 也就是p值 结果是30% 我在图中画一下 χ2分布 Q?对应蓝色这条 看看2.41在哪里 这是3 这是2.5 那么2.41大概在这里 根据查表结果 蓝色曲线下 这整个面积是30% 或者说0.3 蓝色曲线下 这整个面积是30% 或者说0.3 蓝色曲线下 这整个面积是30% 或者说0.3 蓝色曲线下 这整个面积是30% 或者说0.3 显然整个概率加起来是1 这是对χ2分布的介绍 下一节视频中 我们将使用它来进行一些检验