If you're seeing this message, it means we're having trouble loading external resources on our website.

如果你被网页过滤器挡住,请确保域名*.kastatic.org*.kasandbox.org 没有被阻止.

主要内容

方差分析 3: F-统计量的假设检验

方差分析 3: F-统计量的假设检验. Sal Khan 创建

想加入讨论吗?

尚无帖子。
你会英语吗?单击此处查看更多可汗学院英文版的讨论.

视频字幕

在前几个视频中,我们首先求出了这9个数的总变异 结果是30,这是总平方和。然后我们问自己, 这些变异中有多少是来自组内的,多少是来自组间的? 所以,对于组内的变异, 我们是用组内平方和表示。 它等于6。 然后这个的剩余部分,30,是这个变异的剩余部分, 来自于组间的变异,我们计算过了, 等于24。 事实上,这一节我想做的是用这类信息, 也就是我们计算的这些统计量,做一些推论统计, 看能否得到某种结论。 我想做的是给这些组赋予一些意义。 我们一直在抽象地处理它们,但是你可以想象 这些是某种实验的结果。 假设我给参加测试的人3种不同的药片或3种不同的食物。 这些是测试的分数。 所以这是食物1,食物2,然后这里是食物3。 我想要弄清楚人们参加测试吃的食物是否会真的影响他们的分数? 从均值来看,第三组似乎比第二组和第一组都好。 但是这种差异是完全随机的吗?随机发生? 或者我能否确定这是由于总体均值的实际差异, 也就是吃过食物1,食物2或食物3的所有人的差异? 所以,我的问题是,均值和真总体均值相同吗? 这是基于3个样本的样本均值。但如果我知道真总体均值-- 所以我的问题是:吃食物1的人的总体均值是否等于吃食物2的人的总体均值? 显然,我不可能把这些食物给每一个人 然后让他们都参加测试。 但是这里存在一个真均值,它只是无法衡量。 所以我的问题是总体均值1等于总体均值2等于总体均值3,真总体均值3。 我的问题是,这三者相等吗? 因为如果他们不相等,那就意味着不同的食物种类确实会对 人们在测试中的表现产生某种影响。 我们来做一个假设检验。假设零假设 是均值相等。食物不会产生差异。 “食物不会产生差异” 我的备择假设是食物会产生差异。“食物会产生差异。” 用定量的思维方式来考虑这个问题 如果它没有产生差异, 各组的真总体均值将是相同的。 吃食物1的这一组的真总体均值等于吃食物2的这一组的真总体均值, 也等于吃食物3的这一组的真总体均值。 如果备择假设是成立的,那这些均值就不会都相同了。 我们如何来检验这个假设? 假设零假设成立, 这是一般假设检验的方式, 假设零假设成立。 然后得出, 达到如此极端的统计量的概率是多少? 我还没有定义统计量。 所以我们定义--假设零假设成立, 要用的统计量叫F统计量。 所以F统计量 它服从F分布--我们不会深入讨论F分布的细节。 但是你可以认为 它是两个卡方分布之比, 其自由度可以相等或者不等。 F统计量是样本间平方和之比-- 组间平方和 除以组间自由度 m-1 有时这被称为组间均方(MSB) 除以组内平方和, 就是我在上面写的,用蓝色的笔写SSW (组内平方和) 除以SSW(组内平方和) 除以组内平方和的自由度,也就是 m(n-1)。 现在我们来看看这是怎么回事。 如果这个数,这个分子,比分母大很多, 这告诉我们,数的变异大多由于 组间实际均值的差异 较少由于组内均值的变异。 如果在这的这个分子比分母大很多 这让我们相信,真总体均值 存在差异。 如果这个数真的很大, 它是在告诉我们 零假设成立的概率较低。 如果这个数很小,分母更大, 这意味着每个样本内的变异, 比样本间的变异占总变异的比例大。 这就意味着 每个样本内的变异占总变异的百分比更大 相对于样本间的变异来说。 所以这让我们相信 ”嗨,你知道的... 我们看到的均值之间的任何差异可能只是随机产生的.“ 这就更难拒绝零假设了。 我们来计算一下。 因此,在本例中,我们的组间平方和是24, 自由度是2。 组内平方和是6,我们有多少个自由度呢? 也是6,自由度是6. 也就是24除以2,也就是12除以1。 F统计量的计算结果是12. F表示的是费舍尔,他是位生物学家和统计学家,由他提出了这个分布 所以F统计量是12。 我们会发现这是一个相当大的数。 有一点我忘了说,任何假设检验, 都需要某种显著性水平。 假设我们关心的显著性水平, 对于我们的假设检验,是10%。 0.10--意味着 如果零假设成立, 得到我们得出的结果的概率将小于10%, 就是这个F统计量, 那么我们将拒绝零假设。 所以我们需要找出一个临界F统计值, 得到这个极端值或者更大的概率是10% 如果这个值大于临界F统计值, 那么我们就拒绝零假设, 如果小于,我们就不能拒绝零假设。 我就不深入讲解F统计量的主要内容了, 但是我们已经知道每个平方和 具有卡方分布。这个具有卡方分布, 这个具有另一个卡方分布 这是自由度为2的卡方分布, 这个卡方分布是--我们还没有把它们都规范化-- 但是大致是自由度为6的卡方分布。 所以F分布其实是两个卡方分布之比 这是加州大学洛杉矶分校一位教授的课程截图, 我希望他们不要介意,我需要找到一张F表供我们参考。 这就是F分布的样子。 显然,其结果的不同 会随着分子分母的自由度的不同而不同。 有两个自由度要考虑, 分子的自由度和分母的自由度 说了这么多,我们来计算一下临界F统计量, α等于0.10, 事实上,不同的α会有不同的F表, 我们分子的自由度2,分母的自由度6. 我得到的这整个表都是针对α是10%或0.10, 我们分子的自由度2,分母的自由度6。 所以临界F值是3.46。 所以临界F值是3.46--在这的这个值是3.46 我们根据数得到的值要比这个大得多, 远远高于这个值。它的p值将非常非常小。 得到这种极端值的概率, 偶然且在零假设成立的条件下,是非常低的。 它远远大于10%显著水平的 临界F统计值。 因此我们可以拒绝零假设, 这让我们相信,“你知道吗, 可能总体均值存在差异。” 这告诉我们如果给人们不同的食物 在测试中可能会有不同表现。