主要内容

对均值进行 t 检验的条件

Name: 对均值进行 t 检验的条件
Uploaded: 2018-10-21T21:44:41Z
Description: 示例说明如何检查均值 t 检验的条件是否得到满足

Google课堂

示例说明如何检查均值 t 检验的条件是否得到满足.

想加入讨论吗？

排序方式:

尚无帖子。

你会英语吗？单击此处查看更多可汗学院英文版的讨论.

视频字幕

小孙和他的朋友已经使用一个群聊APP互相聊天一年多了，他猜想他们平均每天送出超过 100 条信息小孙从他们的聊天历史中随机取了7天样本，记录下在这7天中，有多少信息被发出。样本数据很明显地偏在均值为125条信息的右面，它的标准差是 44 条信息。他想用这些样本，来对均值进行 t 检验。在进行这种显著性检验的条件中，哪些条件是能够满足的？我们来看看这个问题，小孙或许有某种零假设，或许他得到这个 100，或许他在某个杂志上读到青少年平均每天送出 100 条文本短信，这样，零假设就是他和它的朋友每天送出的短信是 100，它用 μ 来表示，这个零假设是 100，这和其他的青少年没有什么差异，而他怀疑，实际上他在这里说到，他的备择假设就是他猜想的，他们每天发出超过 100 条信息。他所做的就是，从所有天的总体中，这里有 365 天，他们说他们已经使用这个群聊APP 一年了，取7 天， n 等于 7，从这些样本计算统计特性。他计算了样本均值，打算用它来估计这个总体的均值，他也能计算样本的标准差，在一个显著性检验中，就是要找出得到这个样本的均值，或者更加偏激的零假设的概率是什么。如果这个概率低于事先设定的阈值，那么你就要否定这个零假设。就要建议另外的备择假设。但是为了使这个显著性检验合理，为了能使得计算的 P 值可以置信，对于完成这种显著性检验有一些条件，第一个条件就是，这些样本确实是随机的，我们叫它随机条件，这个条件在前面我们学习比率显著性检验时，你们已经见到过了，这里，我们是在对均值进行显著性检验，总体均值，样本均值，而过去，我们做的是总体比率和样本比率。关于随机条件，它在这里说了，小孙在他的聊天记录中随机地取了 7 天，它没有说具体他怎么做的，但是，从题目的词语，我们可以说这是随机样本。下一个条件就是我们知道的所谓，独立条件，也就是说，在我们的样本中，各个观察大致独立。一个能确认独立性的方式就是小孙是不是采用放回已选样本的方法。他们没有提及这一点，但是另一个条件，也就是或者放回已选样本，或者另一种可以认为是大致独立，这就是样本的大小小于等于总体的10%。在这个题目中，他取了 7 个样本，他取的样本数是 7，而总体的天数，就是他们已经使用这个群聊 APP多于一年，他们已经用了多于 365 天， 7 肯定小于等于 365 的 10%，也就是 36.5，所以我们满足这个条件，也就是我们满足独立的条件。现在，最后一个条件就是我们比较熟悉的所谓正态条件。也就是要符合这个样本的均值近似于是正态分布，这与我们在进行比率的显著性检验时，有所不同。有几个方法可以判断样本均值是正态分布。一个方法就是，看抽取本的的母体是不是正态分布，母体是正态分布，题目没有告诉我们任何关于每天所用时间是正态分布的信息，所以，我们肯定不知道是否符合这一条，但是有时你或许会知道这一点。另一个确定这个条件的方法就是样本的数量要大于等于 30，这是从中心极限定理来的。那么我们的样本分布就会近似地符合正态。但是，我们明确地看到，我们的样本没有大于或等于 30 ，所以也不能满足这个约束，现在，第三个能让我们认为我们的样本均值的分布是近似正态的方法就是，如果我们的样本是对称的，不存在远离均值的离群点，或者说没有明显的离群值，现在是这种情况吗？这里说了，样本数据很严重地偏在均值 125 的右边，它的标准差是 44 条短信。它严重地偏向右边，显然不是对称的样本数据。这样，我们不能满足任何这些正态条件的子条件，所以，我们不满足进行显著性检验的正态条件。

统计和概率

课程: 统计和概率 > 单元 12

想加入讨论吗？

视频字幕