If you're seeing this message, it means we're having trouble loading external resources on our website.

如果你被网页过滤器挡住,请确保域名*.kastatic.org*.kasandbox.org 没有被阻止.

主要内容

对均值进行 t 检验的条件

示例说明如何检查均值 t 检验的条件是否得到满足.

想加入讨论吗?

尚无帖子。
你会英语吗?单击此处查看更多可汗学院英文版的讨论.

视频字幕

小孙和他的朋友已经使用 一个群聊APP互相聊天一年多了, 他猜想他们平均每天送出 超过 100 条信息 小孙从他们的聊天历史中随机取了7天样本, 记录下 在这7天中,有多少信息被发出。 样本数据很明显地 偏在均值为125条信息的右面, 它的标准差是 44 条信息。 他想用这些样本, 来对均值进行 t 检验。 在进行这种显著性检验的条件中, 哪些条件是能够满足的? 我们来看看这个问题, 小孙或许有某种零假设, 或许他得到这个 100,或许他在某个杂志上读到 青少年平均 每天送出 100 条文本短信, 这样,零假设就是 他和它的朋友每天 送出的短信是 100, 它用 μ 来表示,这个零假设是 100, 这和其他的青少年没有什么差异, 而他怀疑, 实际上他在这里说到, 他的备择假设就是他猜想的, 他们每天发出超过 100 条信息。 他所做的就是, 从所有天的总体中,这里有 365 天, 他们说他们已经使用这个群聊APP 一年了, 取7 天, n 等于 7, 从这些样本计算统计特性。 他计算了样本均值, 打算用它来估计这个总体的均值, 他也能计算 样本的标准差, 在一个显著性检验中, 就是要找出 得到这个样本的均值,或者更加偏激的 零假设的概率是什么。 如果这个概率低于事先设定的阈值, 那么你就要否定这个零假设。 就要建议另外的备择假设。 但是为了使这个显著性检验合理, 为了能使得计算的 P 值可以置信, 对于完成 这种显著性检验有一些条件, 第一个条件就是,这些样本确实是随机的, 我们叫它随机条件, 这个条件在前面我们学习比率显著性检验时,你们已经见到过了, 这里,我们是在对均值进行显著性检验, 总体均值,样本均值, 而过去,我们做的是总体比率和样本比率。 关于随机条件,它在这里说了, 小孙在他的聊天记录中 随机地取了 7 天, 它没有说具体他怎么做的, 但是,从题目的词语, 我们可以说这是随机样本。 下一个条件就是我们知道的所谓, 独立条件,也就是说, 在我们的样本中,各个观察大致独立。 一个能确认独立性的方式 就是小孙是不是采用放回已选样本的方法。 他们没有提及这一点,但是另一个条件, 也就是或者放回已选样本, 或者另一种可以认为是 大致独立,这就是样本的大小 小于等于总体的10%。 在这个题目中,他取了 7 个样本, 他取的样本数是 7, 而总体的天数,就是 他们已经使用这个群聊 APP多于一年, 他们已经用了多于 365 天, 7 肯定小于等于 365 的 10%, 也就是 36.5, 所以我们满足这个条件, 也就是我们满足独立的条件。 现在,最后一个条件就是我们比较熟悉的 所谓正态条件。 也就是要符合 这个样本的均值 近似于是正态分布, 这与我们在 进行比率的显著性检验时, 有所不同。 有几个方法可以 判断样本均值 是正态分布。 一个方法就是,看抽取本的的母体是不是正态分布, 母体是正态分布, 题目没有告诉我们任何关于 每天所用时间 是正态分布的信息, 所以,我们肯定不知道是否符合这一条, 但是有时你或许会知道这一点。 另一个确定这个条件的方法就是 样本的数量要大于等于 30, 这是从中心极限定理来的。 那么我们的样本分布 就会近似地符合正态。 但是,我们明确地看到,我们的样本 没有大于或等于 30 ,所以也不能满足这个约束, 现在,第三个能让我们认为 我们的样本均值的分布 是近似正态的方法就是, 如果我们的样本是对称的,不存在远离均值的离群点, 或者说没有明显的离群值, 现在是这种情况吗? 这里说了,样本数据 很严重地偏在均值 125 的右边, 它的标准差是 44 条短信。 它严重地偏向右边, 显然不是对称的样本数据。 这样,我们不能满足 任何这些正态条件的子条件, 所以,我们不满足 进行显著性检验的正态条件。