If you're seeing this message, it means we're having trouble loading external resources on our website.

如果你被网页过滤器挡住,请确保域名*.kastatic.org*.kasandbox.org 没有被阻止.

主要内容

计算回归线斜率的 t 统计量

计算回归线斜率测试中的检验统计量.

想加入讨论吗?

尚无帖子。
你会英语吗?单击此处查看更多可汗学院英文版的讨论.

视频字幕

小江得到了一个数据样本- 关于24个学生每人花多长时间 来完成一个计时反应游戏 和计时记忆游戏。 他注意到了这些时间之间的正的线性关系。 这是关于样本数据的计算输出。 那么,我们得到关于反应时间和记忆时间的一些统计量。 然后他用计算机对搜集的数据进行回归分析。 我们假设 所有的推论条件都已满足。 请计算一个检验统计量, 用于检测总体样本斜率为0的零假设。 请暂停本视频,试试解决本问题。 好了,首先保证我们理解了题意。 我们首先考虑总体。 我把它写在这里。 在该总体中, 可能存在某些真实的线性关系 理论上, x轴代表反应时间, y轴代表记忆时间。 如果你要画出所有可能的数据点, 当然数据有可能是无穷的, 或接近无穷的(笑), 这将很难做到。 但是如果你能, 事实总在那里, 比如,确实有一个正的线性关系。 它看起来像这样。 你可以将该回归线定义为y-帽。 这是一条回归线。 它等于某个真实的总体参数 这里是这个y的截距。 我们可以写成 阿尔法加上某个真实的总体参数 这里是这条回归线的斜率 我们称之为贝塔。 Times x. 现在我们并不知道关于反应时间和记忆时间的线性关系的真实情况。 但是我们可以尝试估计它。 这也是小江像做的。 所以他选取了24个数据的样本, 样本 24个数据的样本。 数据点。 这就容易多了, 你可以在散点图上可视化这个样本。 所以你有1,2,3,4,5,6,7, 8,9,10,11,12,13, 14, 15, 16, 17, 18,19, 20, 21, 22, 23, 24. 你将这些数据点输入电脑 然后得到一个回归线。 该线最小化了和所有数据点之间 距离的平方。 假设产生的回归线 像这样。 这条回归线可以被描述为 真实y截距的估计。 这里这个实际上是一个统计量。 它是这个参数的估计, 加上回归线的真实斜率的估计。 所以这是一个统计量, 这个b,是一个统计量, 它尝试估计这个真实的参数,贝塔。 现在我们继续, 把这些数据点输入电脑, 我们得到a和b的值。 a等于这个常系数。 而这个反应系数, 它告诉我们, 对于每个增加的反应时间, 我们期望记忆时间会变化多少。 或者说对于x的每个变化, 我们期望y会变化多少。 所以这其实是回归线斜率的估计。 现在你可以想象, 每次你选取不同的样本时, 你可能得到这些值的估计值会不同。 当做推论统计时, 我们会设定假设。 我们设定零假设和非零假设。 零假设代表不发生。 在处理回归时,不发生的意思是 尽管你怀疑 有正的线性关系, 尽管你在得到的数据中看到了这种线性关系, 但是在你的零假设中, 你将假定 没有正的线性关系。 所以这里我们的零假设是 真实回归线的真实的斜率, 即这里的这个参数, 等于0。 所以贝塔等于0。 所以我们的零假设是 我们的真实回归线 看起来像这样。 y代表的独立于x代表的。 而如果你怀疑 有一个正的线性关系, 你可以说 我的非零假设是 我的贝塔值大于0。 或者如果你怀疑 只是有某种线性关系, 但是你不知道是正还是负, 那么你可以说贝塔不等于0。 但在这里,他注意到或怀疑 有一个正的线性关系。 那么这就是他的非零假设。 但是你所需要做 来检测你的零假设, 这个我们已经做了很多次了, 是找到一个和你得到的统计量b相关的检测统计量。 理想情况,你会取b, 取b 然后从b中 减去 零假设中假定的斜率, 即你得到的回归线的斜率 减去 零假设中假定的斜率。 然后除以回归线斜率的样本分布的标准差。 这样做的结果, 你就得到了a, 这里使用z统计比较合适。 现在,问题是, 我们并不知道 样本分布的标准差究竟是多少。 但是我们可以估计它。 我们可以计算出 我们得到的样本回归线的斜率 减去零假设中假定的斜率, 即0, 因为我们知道我们假设的是什么。 而我们可以计算样本分布的标准误差。 实际上,我们的电脑已经帮我们算出来了。 这是这一项的估计。 那么我们知道这个是什么数值。 所以我们知道了所有的数值, 但是如果你要用到 样本分布标准差的估计值, 我们以前已经知道了。 当我们对均值做推论统计时, 使用t统计是合适的。 即使这么说,请暂停本视频, 这个公式的结果是什么? 这个等于 我们的样本回归线的斜率。 结果是14.686减去 我们假设的总体参数, 即真实的回归线的斜率, 我们假设是0。 所以减去0。 然后除以标准误差 即 我们可以使用这个作为b的标准误差。 所以是除以13.329。 所以是14.686除以13.329。 如果我们假设, 我们这里做的是单边检测, 我们要做的是取这个t统计量 然后考虑自由度。 接下来计算p值。 得到的某个结果比t=0高这么多的概率是多少? 或者说t统计量高于或等于这个值的概率是多少? 这就是我们的p值。 如果低于某个阈值, 那么本假设相当不可能。 这样情况下我们拒绝零假设, 而接受非零假设。 但是本题没有要求我们做所有这些。 他们只是要求我们 计算合适的检测统计量, 我们已经完成了。