如果你看到这则信息,这表示下载可汗学院的外部资源时遇到困难.

If you're behind a web filter, please make sure that the domains *.kastatic.org and *.kasandbox.org are unblocked.

主要内容

假设检验的卡方统计值

假设检验的卡方统计值(卡方拟合优度检验).

想加入讨论吗?

尚无帖子。
你会英语吗?单击此处查看更多可汗学院英文版的讨论.

视频字幕

题目说, 某个类型的标准化考试中 每个题目有四个选项 选项A, 选项B 选项C和选项D 出题人确信,经过这么多年下来 正确答案是A,B,C或者D的 几率是均等的 基本上它们的概率都是25% 现在,假设说你有一个直觉告诉你 也许答案会倾向于某个选项 我们如何测试? 你可以从零假设开始 还有它的备择假设 然后,做一个假设性验证 好,我们说,我们的零假设是平均分布 不同选项之间 符合平均分布 正确的选项是平均分布的 或者,另外一种考虑的办法是 25%的时间里A是正确选项 25%的时间里B是正确选项 25%的时间里C是正确选项 25%的时间里D是正确选项 现在,我们的备择假设是什么? 备择假设是说 它不是平均分布 不是 平均分布 现在,我们如何验证它? 我们此前看过, 至少在视频开始的时候 你在这里有一个所有可能项的总体空间 你取一个样本 然后,比如说我们取100项 所以n等于100 然后写下当我们看样本时 所得到的数据 这个是正确的选项 正确选项 然后,这个是期望的数值 你所期待的 这个是实际的数值 如果它不合理 我们就很快能看出来 好,我们有4个选项,A,B,C,D 样本数量100 记住,在任何假设检验中 我们假定零假设是正确的 所以,选项A是正确的,它的期望值 就会是100的25% 所以,我们预期,A是正确答案的次数是25次 B是正确答案的次数是25次 C是正确答案的次数是25次 D是正确答案的次数是25次 但是,假设说,当我们看这100项时 我们的实际结果是 我们得到A正确的次数是20次 B是20次 C是25次 D是35次 如果看一下 D选项的次数多一些 但是你会说,这只是一个样本 通过随机的选择 有可能得到更多次的D 还是有一些可能会得到这样结果的 即使是假设零假设是正确的 这些假设性验证的目的 是,计算得到这些极端结果 它的概率是多少? 如果概率是低于一定的门槛值 那么我们就可以推翻零假设 接受备择假设 我们此前有看到过这些门槛值 我们看到过显著性水平 比如说,我们设置一个显著性水平5%,0.05 如果得到这个结果, 或者比期望值更不同的的概率, 小于我们的显著性水平 那么我们就要否定零假设 但是,它们都会回到一个很有趣的问题上 我们如何计算得到一个如此极端的 乃至比这更极端的结果的概率? 我们如何计算它? 在这里,我们将引入一个新的统计 同时,对你们中的很多人来说,一个新的希腊字母 它是希腊字母chi的大写 看上去像X 但是比X更加曲折一些 看上去 其中一部分的曲线是X的一部分 但是它是chi,不是X 统计上我们称之为chi的平方 它的定义是取实际值 和期望值之间的差 然后将之转换为一个数字 chi的平方的分配是 我应该说,分布已经被很好的研究过了 我们可以用它来算出 得到这么极端或者更极端的概率 如果它比我们的显著性水平低 我们将推翻零假设 接受备择假设 但是我们如何计算chi的平方? 其实很直观 我们要做的,是对于每组 对于本题,就是每个选择项 我们取实际值和期望值 它们二者的差值 所以,对于选项A 我们说20是实际值, 减去期望值,然后取平方 然后将它除以期望值 然后,对选项B做同样处理 我们说,实际值是20,期望值是25 所以,20减去25 平方,除以期望值 除以25 加上,对选项C做同样处理 25减去25 我们知道,后面如何做 取平方,除以期望值,除以25 然后,选项D 也就是35 减去25 平方 所有这些除以25 然后现在,如果我们这么计算 它会是负5的平方, 结果是25 它会是25 然后得到0 35减去25,是10,平方,得到100 这个是1 加上1 加上0 加上4 所以,我们的chi的平方,在本例中 还是很清晰和简洁的 它不会一定得到6 我们如何来计算? 好,我们可以做的是 看一下合适的自由度下 chi平方的分布 我们待会讨论 得到chi平方统计值是6或者更大 它的概率是多少? 理解chi平方的分布 它看上去是什么样子 对于不同的自由度, 它们是不同的chi平方分布 为了计算自由度 我们看一下不同的分类 本例中,我们有4个分类 你可以减去一个 现在就很合理了 因为,如果你知道这里有多少A,B,C 如果你知道,或者假设它们的比例 你总是可以计算出第4个出来 这是为什么它的自由度是4减去1 在本例中,我们的自由度 计算下来是3 这里,有时你会把它描述为k k等于3 如果我们看这个淡蓝色部分 我们看的是这个chi平方的分布 自由度为3 我们要计算得到一个 chi平方统计是6或者大于6,它的概率是多少 我们看这里 你可以用计算器算出来 或者说是某种检验 像AP统计测验, 你可以使用他们给你的表格 像这样的一个表格会非常有用 记住,我们在处理的 是有3个自由度的一个问题 我们有4个分类,4减去1得到3 我们有chi平方的值 我们的chi平方统计是6 这里告诉我们 得到6.25的概率 或者比我们的chi平方值更大的概率是10% 如果我们回到这个表里 如果自由度为3, 我们得到概率是从6.25开始向上 这里,是10% 10% 然后这个概率 就是得到chi平方值 等于或者大于6的概率 会是大于10% 大于10% 我们可以将它视为我们的P值 同时,对于我们概率来说,假定了零假设 它大于10%,它一定 是大于我们的显著性水平的 因此,我们就不能推翻 不能够推翻 所以,这个是一个例子, 在你的例子中,你只是恰巧得到了更多的D 得到至少和你看到一样极端的结果, 它的概率只是稍微比10%多一点