If you're seeing this message, it means we're having trouble loading external resources on our website.

如果你被网页过滤器挡住,请确保域名*.kastatic.org*.kasandbox.org 没有被阻止.

主要内容

成对数据均值的置信区间

成对数据平均差的置信区间.

想加入讨论吗?

尚无帖子。
你会英语吗?单击此处查看更多可汗学院英文版的讨论.

视频字幕

-【讲师】 一群小伙伴想知道 他们用一只手打响指 与另一只手相比,能快多少。 这是生活中非常“重要”的问题。 每个人都用自己的惯用手 打10秒响指, 也用非惯用手打10秒响指。 如果你是右撇子, 右手就是你的惯用手。 如果你是左撇子, 左手就是你的惯用手。 每个被试者掷硬币来决定 他们会先用哪只手。 因为如果你总是先用你的惯用手,那么 也许当你开始 你用非惯用手做试验时,也可能有别的原因,你已经累了。 所以这里先用哪一只手是随机的。 下面是他们用每只手 完成打响指的数据, 每个参与者双手打响指的差异,以及汇总统计。 这实际上是真实的数据 来自可汗学院的内容团队。 你可以看到,每个参与者的数据。 这是杰夫的数据, 他能够在10秒内用他的优势手 打44次响指,这很厉害, 我想这比我能做的还要多。 他甚至能够用他的非优势手打35次响指。 这里是双手的数据差, 优势手减去非优势手的响指数是9。 然后他们将所有五位成员的这些数据制成表格。 现在他们还为这些数据做了汇总统计, 这行才是我们今天要重点关注的。 这就是惯用手和 非惯用手之间的差值, 他们对这些差值取平均, 他们所做的是取这里这一行 并计算了平均值,他们得到了6.8。 然后他们计算了这些差值的 标准差, 得到的标准差大约是1.64。 我们被要求 创建并解释一个关于参与者双手打响指的差值的平均数, 置信度为95%的 置信区间。 暂停这个视频, 看看你是否有一些思路。 看看你是否能自己处理这个问题。 这里有趣的是 我们不是在构建一个 关于惯用手的平均响指数 或非惯用手的平均响指数的置信区间, 我们要构建的是一个 关于差值的平均数的95%的置信区间。 你可能想说,等一下, 我这里有两个不同的样本, 然后这第三个数据是以某种方式 从另外两个中构建出来的。 如果你这样想呢? 这是个配对设计。 在配对设计中,你要做的是, 对于每个参与者,对于你的样本中的每个成员, 你会让他们做对照组和实验组。 举例来说,你可以认为 对照组是他们能在10秒内用惯用手打多少个响指, 而实验组则是他们能 用非惯用手能打多少个响指。 在配对设计中, 你真正关心的是差值, 所以你可以把这看作是 你有一个五人的样本量 用这些你要计算的是 该样本的每个成员的差值 和整个样本的差值的标准差。 在我们计算置信区间之前, 让我们提醒自己是否满足一些 当我们构建置信区间时的条件。 我们要考虑的 第一个条件是 我们的样本是否是随机的。 现在,如果我们试图 对所有的人和他们的打响指的能力做出某种类型的判断, 那这就不是一个随机的样本。 而这些人都在可汗学院工作。 也许,在我们的面试过程中, 我们选到了那些打响指能力特别强的人。 但是,无论我们做出什么样的推断, 我们都可以说这些数据大致可以 代表这一群小伙伴的情况。 现在我们要考虑的下一个条件是 正态条件。 现在有几种方法来考虑这个问题, 如果我们的样本量是30个或更大,那么 根据中心极限定理,我们能说: 抽样分布将是大致正态分布的。 样本平均值的抽样分布。 但显然,我们的样本量要比这小得多。 那么就有另一种方法可以考虑一下。 我们可以绘制出我们的数据点 看看它们是否以任何方式偏斜。 我们在这里做一个小点阵图, 我们可以说。 标注0,1,2,3,4,5, 6,7,8,9。 所以我们有一个数据点,其差值是9。 一个数据点的差值是5, 一个数据点的差值是8。 一个数据点的差值是6。 还有一个数据点的差值也是6。 这看起来没有任何大规模的偏斜。 我们的平均差值在这里。 大约是6.8。 它看起来大致上是对称的。 所以我们可以认为这个是正态分布的。 这并不是最严谨的研究。 这显然是一个小的样本量, 它不具备对于整个总体的随机性, 但我们还是可以用它。 此外,当你考虑到生物过程, 比如一个人的打响指这件事 是人体中发生许多事情后 的产物。 它是许多过程的总和。 这些东西也倾向于有 一个大致的正态分布。 但我不会在这方面讲得太深入。 综上所述,再一次强调 这并不是一个非常严谨的研究, 但这对朋友来说是一件可以研究的有趣的事, 如果他们没有其他事情可做的话。 好的。 第三个条件是独立。 这个条件已经满足了, 因为这里杰夫的差值 不会应该影响大卫的差值, 大卫的差值也不会影响 金的差值。 特别是如果他们没有观察到对方打响指的过程的话。 为了避免引起争论,我们姑且认为 他们都是在一个封闭的房间里独立完成的, 观察员也都是不同的。 所以他们没有试图互相竞争 或者有类似的倾向。 但还是那句话, 这并不是一项非常严谨的研究, 但我们仍然可以来计算一个95%的置信区间。 那么我们如何计算呢? 我们已经计算过很多次了。 我们的置信区间将是我们的样本平均值, 是我们差值的平均值, 差值的平均值加上或减去 现在我们不知道总体的标准差。 所以我们要使用我们的样本标准差 如果你使用的是样本标准差 而且这个置信区间是关于平均值的, 那么我们的临界值就是 基于t表的t统计量。 要把这个值乘以 差值的样本标准差, 再除以我们样本量的平方根, 除以5的平方根。 现在我们知道这些数据中的大部分, 让我把它写在这里。 我们知道这里的平均数,样本的平均数,6.8。 所以是6.8加或减 我们的临界值是多少? 我们想有一个95%的置信区间 我们的自由度是多少? 它是我们的样本量减去1。 所以我们这里的自由度就等于4。 我们可以使用T表进行查找了。 这是一个T表的一部分,我把它 放在屏幕上。 有几种方法来理解它。 这里他们给了我们置信水平, 之所以对应于一个尾部概率 为0.025的原因是,如果你取分布 中间的95%, 你会在两端各留下2.5%, 也就是你的尾部概率。 这就是为什么用这个尾部概率。 我们要查找的数值在这一列 我们使用的自由度是多少呢? 自由度为4。 因为我们的样本量是5, 5减去1就是4。 所以这就是我们的临界值,2.776。 我们有2.776作为我们的临界值。 然后再乘以我们的样本标准差。 差值的样本标准差 在这里,是1.64。 然后我们要把它除以 除以我们样本量的平方根。 我们的样本量的平方根 我已经在这里写了一个5。 有时我会在那里写一个N, 那么,这将等于什么呢? 首先,让我们计算一下 这里的误差范围。 是2.776乘以1.64 除以5的平方根。 我们得到的误差范围大约是2.036。 所以这就是6.8加上或减去2.036。 结果大约等于这个。 这是我们的误差范围。 如果我们想写成区间的形式,那么 我们可以用6.8减去这个,然后用6.8加上这个。 让我们用计算器再计算一次。 6.8减去2.036等于4.764。 所以我们的置信区间大约从4.764开始, 一直到,让我们看看, 这部分可以心算, 我用2.036加上6.8, 是8.836。 现在我们如何解释 这个置信区间呢? 一种解释方法是说我们有95%的信心 这个区间捕捉到了这些小伙伴左右手打响指 的真实平均差值。 我们也可以说, 这些小伙伴们左右手打响指确实存在差异, 因为在这个区间没有涵盖到0, 整个区间都大于0, 因为区间没有涵盖到0,整个区间都大于0, 这看起来,这里这群人, 这些来自可汗学院的小伙伴们 用他们的惯用手打响指更快。