If you're seeing this message, it means we're having trouble loading external resources on our website.

如果你被网页过滤器挡住,请确保域名*.kastatic.org*.kasandbox.org 没有被阻止.

主要内容

为成对数据设立 t 区间

在一些研究中, 我们对同一个体进行了两次观察. 例如, 我们可能会查看每个学生在一个课程中的考前和考后分数. 在其他研究中, 我们可能会对两个相似个体中的每一个进行观察. 例如, 一些医学实验涉及成对的相似主体, 其中一人接受药物, 另一人接受安慰剂.
当我们处理成对数据时, 我们对这两个观察结果之间的差异感兴趣. t 区间可用于估计均差.

例题一

一本跑步杂志想评测两种手表—手表 A 和 手表 B—它们使用全球定位系统 (GPS) 来计算某人的跑步距离. 他们注意到, 这两种手表在某人同一次跑步中给出的距离并常常不一致.
该杂志随机抽取了 5 名订阅用户, 并请求他们同时佩戴两种手表跑 10 公里的路线 (他们都同意参加). 在跑完后, 参与者记录了每块手表给出的运动距离. 以下是数据 (以公里为单位):
跑步者12345
手表 A9.89.810.110.110.2
手表 B10.11010.29.910.1
构造一个 95% 的置信区间, 以估计这些手表报告距离的均差. 该区间是否表明这两种手表有区别?

第 1 步: 计算均差

即使看起来我们有两组数据—手表 A 和手表 B—但这些数据并不是来自两个独立的样本. 该杂志采集了 5 名跑步者的单个样本, 每个跑步者都佩戴着这两只手表, 所以这是一个匹配的成对设计. 我们感兴趣的一组数据是每个跑步者的手表 A 和手表 B 之间的 差值. 让我们将此变量定义为 差值=BA, 并计算每个跑步者的差异:
跑步者12345
手表 A9.89.810.110.110.2
手表 B10.11010.29.910.1
差值 (BA)0.30.20.10.20.1

第 2 步: 检查条件

我们要使用这些 n=5 个差值来构造均差的置信区间. 由于我们不知道差值的总体标准差, 我们将不得不在这里使用样本的标准差. 这样就应该使用 t 区间, 而不是 z 区间来估计均差. 让我们检查使用 t 区间的条件.
  • 随机: 该杂志随机抽取了他们的订阅用户样本.
  • 正态: 由于我们的 n=5 名跑步者的样本较小, 我们需要绘制数据. 这些差值大致是对称分布的, 没有异常值, 因此继续这种方法应该是稳妥的.
  • 独立: 假设跑步者的测量值之间的独立性是合理的. 跑步者是随机选择的, 不应该影响彼此的结果.

第 3 步: 构造区间

以下是数据:
跑步者12345
手表 A9.89.810.110.110.2
手表 B10.110.010.29.910.1
差值 (BA)0.30.20.10.20.1
以下是统计量汇总:
均值标准差
手表 Ax¯A=10.00sA0.19
手表 Bx¯B=10.06sB0.11
差值 (BA)x¯差值=0.06s差值0.21
由于我们想要建立均差的置信区间, 我们只需要差值的统计量汇总.
我们将使用单样本均值的 t 区间:
(统计量)±(临界)(统计量的标准差)x¯差值± ts差值n
公式的组成部分:
我们的统计量是样本平均值 x¯差值=0.06 km.
我们的样本大小是n=5 名跑步者.
我们的样本标准差是 s差值=0.21 km.
我们的自由度是 df=51=4, 因此对于 95% 的置信度, 我们的临界值是 t=2.776.
计算:
x¯差值± ts差值n0.06±2.7760.2150.06±(2.776)(0.094)0.06±0.2610.060.261=0.2010.06+0.261=0.321
区间 (0.20,0.32)

第 4 步: 解释区间含义

该是否表明两只手表之间存在差异?
我们有 95% 的把握相信区间 (0.20,0.32) 包含了的两种手表在这样的跑步种给出距离的均差 (以公里为单位). 请注意, 区间包含 0 km—这表示没有区别—因此, 手表 A 和 手表 B 给出的距离之间没有显著差异是合理的.
如果整个区间大于0 (均为正), 或者完全小于0 (均为负), 则表明两种手表之间存在显著差异.

例 2—试一试!

一个教育网站为法学院招生考试 (LSAT) 提供了一个练习程序. 程序的用户在练习前后参与测试. 以下是随机抽取的 6 名用户的的分数和进步:
用户123456
练习前140152153159150146
练习后150159170164148166
进步 (练习后练习前)107175220
以下是统计量汇总:
均值标准差
练习前x¯=150s6.48
练习后x¯=159.5s8.89
进步 (练习后练习前)x¯进步=9.5s进步8.07
问题 A (例 2)
该例中, 程序用户的 95% 的置信区间是多少?
选出正确答案:

问题 B (例 2)
使用这个程序的用户没有平均进步是否合理?
选出正确答案:

该网站的制作者表示, 此置信区间提供了有力的证据表明使用他们的程序, 将使用户的 LSAT 分数增加.
问题 C (例 2)
这是合理的结论吗?
选出正确答案:

想加入讨论吗?

尚无帖子。
你会英语吗?单击此处查看更多可汗学院英文版的讨论.