If you're seeing this message, it means we're having trouble loading external resources on our website.

如果你被网页过滤器挡住,请确保域名*.kastatic.org*.kasandbox.org 没有被阻止.

主要内容

在对斜率的检验中使用 p 值得出结论

在假设检验中得出最小二乘回归线斜率的结论.

想加入讨论吗?

尚无帖子。
你会英语吗?单击此处查看更多可汗学院英文版的讨论.

视频字幕

李夏对手机进行抽样, 发现在手机运算速度和价格之间存在正的线性相关。 她用电脑对抽样数据进行最小二乘法回归分析, 得到的结果如下。 我们理一理, 她对手机进行抽样, 题目没告诉我们是多少数量, 但她抽样了一些手机, 然后发现运行速度与价格线性相关。 所以这里是价格,这里是运行速度。 然后把样本在图中画成点。 每个手机一个数据点, 就是这样,然后她把这些数据输入电脑, 电脑计算出一条线, 对她的样本进行线性回归分析。 这是样本的回归线, 假设我们说它是 y 等于 是 y 小尖,它等于 a 加 bx, 对于她的样本,a 等于 127.092, 就是这个 a, 对于她的样本,回归线的斜率 就等于运行速度的系数。 也就是, x 表示运行速度, 它的系数就是这个斜率。 但我们要时刻提醒自己, 就算世界上有这个值, 这些也仅仅是真值的估计。 如果她的样本涵盖了市面上的每一台手机, 那她得到的就是总体参数真值, 但现在只是样本,只是估计。 她在样本中 看到了这个正的线性相关, 并不表示在总体中也一定会有同样的关系。 在抽样中出现这个关系, 有可能纯粹是巧合。 所以她要进行假设检验。 在假设检验中,你可以假设 运行速度和价格之间没有关系。 所以这里的 β, 是总体进行回归之后的参数真值。 比如这里表示总体, 比如其中,价格是竖轴, 运行速度是横轴, 如果你以上帝视角观察总体, 世界上有多少手机, 几十亿吧我想, 都在这里,然后线性回归, 我们的原假设是 回归线的斜率等于 0。 回归线可能是这个样子, 总体的回归方程, y 小尖等于 α 加 β 乘以 x。 所以我们的原假设是 β 等于 0, 而备择假设, 她猜想的就是这个假设, 回归线斜率的真值大于 0。 假设统计推断的条件都满足。 在 α 等于 0.01 的显著水平上, 是否有充分证据能够推断, 对所有手机,这两个变量之间存在正的线性关系呢? 为什么? 暂停视频,试一试自己先做。 要回答这个问题, 我们要先问自己,如果原假设为真, 如果这就是总体回归线的真实斜率, 那么我们抽样得到这个结果的概率是多大呢? 然后我们利用这个信息, 再加上我们对样本回归线斜率的抽样分布的估计, 我们就能算出 T 统计量。 在本题中,我们的备择假设是 总体回归线斜率的真值大于 0, 这时的 P 值就是指 T 统计量大于等于它的概率。 就是 T 统计量大于等于 2.999 的概率。 这时候,你有可能会说, “看,这里有一列是 P 值, “题目里已经给出了 “概率是 0.004。” 这你就掉到坑里了, 因为这里给出的, 叫做双侧的概率 P 值。 我们考虑 T 分布, 根据合适的自由度算出来的, 这个值的意义是, “得到的结果绝对值大于 2.999 的概率是多大?” 这是 T 等于 0,在中间, 这里是 2.999,我们考虑的是这个区间。 是右边的尾部。 而这里的 p 值, 不只表示右边, 还包括结果小于等于 -2.999 的那部分。 这个值是两侧的部分加起来, 如果我们只考虑这个情况下的 P 值, 那就只看这部分。 你可以看到, 由于这个分布是对称的, 这个值除以 2 即可。 所以它等于 0.002。 要做显著性检验, 当然就要把 P 值和显著性水平作比较。 这里是 0.002,与显著性水平 0.01 比较, 哪个大? 可能一眼看上去,2 大于 1, 但这是千分之 2 与百分之 1, 这可是 10 个千分之 1, 所以这种情况下, P 值小于显著性水平, 所以我们说:”如果原假设成立, ”那么得到这种极端的结果的概率太低了, “所以我们拒绝原假设。 ”我们拒绝原假设, “接受备择假设。“ 原题:”是否有充份证据能够推断, “对所有手机,这两个变量之间存在正的线性关系呢?” 对的。 “为什么?” 因为,因为 P 值小于显著性水平, 所以我们拒绝了原假设, 接受备择假设。