If you're seeing this message, it means we're having trouble loading external resources on our website.

如果你被网页过滤器挡住,请确保域名*.kastatic.org*.kasandbox.org 没有被阻止.

主要内容

抽样分布介绍

抽样分布介绍.

想加入讨论吗?

尚无帖子。
你会英语吗?单击此处查看更多可汗学院英文版的讨论.

视频字幕

这个视频里 我们讨论样本分布 为了使其更具体一些, 让我们想象我们有个总量。 关于一些球的, 他们都被写上了序号 对于这些总量,我们可以算出参数。 一个参数代表这个总量的 某特征值。 我们在其他视频里说过。 比如,你可以有总量的均值 写在球上面的数字的平均值。 也可以有总体标准差。 可以有球的数字是偶数 的占比,或是其他, 这都是总量参数。 在其他视频里, 你可能不知道总量参数 不是很简单能找到的, 估测总量参数的方法 是找一个样本, 在这里的样本数是n。 样本数量为n 然后我们可以通过样本计算 基于样本,可能我们取n个球, 从这里我们可以统计 经常用来计算参数 你知道这里是一个随机的样本, 每一次我们取样本, 计算的统计数据是对于那个样本的 不足以和 总数参数一致。 实际上,如果我们再次选择大小为n的样本 然后再算一次。 我们可能会有很不同的值。 这都将是参数的估测。 一个有趣的问题是 这些值的分布是如何的 我们可以从这些统计里得到什么? 我们得到不同的数值的频率是什么? 这些数值在统计里是来估测参数用的。 他们的分布是样本的分布 让我使这个问题更具体。 想象一个总数, 我举一个非常简单的例子 我们的总数有3个球 1,2,3 他们被写上数字,1,2,3 这是很简单能被计算的。 我们关心的参数是 总量的均值。 等于1加2加3 除以3 是6除以3,等于2 这是我们的总量参数 我们想找一些样本, 每次都抽2个球作为样本, 每次找一个球,然后替换他。 每一次拿到的球,都是独立的选择。 我们将用这些两个球的样本来 估测总量的均值。 比如,我们第一个样本的大小为2, 在第一个样本里,我们选择1 选择2, 我可以计算样本的统计数据。 这个情况下,样本的均值 用来估测总量的均值 对于样本大小为2的样本来说是1.5 再做一次, 我有1,3 现在计算样本均值, 1和3的均值是 等于2. 想想这些不一样的情况 我们可以取的样本 和我们得到的样本均值。 我们可以看出频率, 得到样本均值的频率。 让我画一个表格。 在这里画一个。 这是我们选的数 记住,我们选择1个球 我们记录这个数字,然后放回去。 然后再拿一个球。 这都是互相独立的时间。 是有放回的。 我们可以拿一个1,然后再拿1 可以拿1,然后2,或1,然后3 我们可以拿2,然后1. 可以拿2,2,或2,3 我们可以拿3,1 3和2,或3,3 第一次选择都有3种可能性, 第二次选择也有3个可能性 因为我们是有放回的。 所以每一个组合的样本 均值是多少? 对于第一次,样本均值是1, 这是1.5 是2 是1.5 是2, 是2.5 是2 是2.5 这里是3 我们可以画出频率 对于这些可能的样本均值 然后这个图将是样本的分布 对于这些样本的均值来说。 让我们这样做 画一个表在这里 画一个简单的图在这里。 这都是可能的样本均值。 我们有1,1.5, 可以有2,2。5 或者可以有3. 观察一下这些的频率。 我写在这里。 有多少1 在我们的9次可能性里? 只有1次我们的样本均值为1. 频率,如果我们设定一个数字, 让这条线往上走1个单位。 或者这么说,这将是9 个可能性里的1个。 让我来这样做。 在这里 这是1/9. 1.5呢 这里有1, 2个可能性,在9个可能性里。 1.5,看起来这样。 是2/9 2呢 这里有1,2,3 3/9 我们说2,是3/9 等于1/3 在这里是3/9 那2.5呢 有两个2.5 所以是2/9 你也可以这样想 当你随机抽样的时候有放回 两个球,你有2/9的机会 得到一个2.5均值的样本。 最后在这里 是9个中的1个情况, 当你有两个3,或1/9 在这里 这是样本的分布 样本的分布 关于样本均值。 关于n等于2 或样本大小为2.