If you're seeing this message, it means we're having trouble loading external resources on our website.

如果你被网页过滤器挡住,请确保域名*.kastatic.org*.kasandbox.org 没有被阻止.

主要内容

样本比例的抽样分布 第一部分

样本比例的抽样分布的平均值和标准差公式.

想加入讨论吗?

尚无帖子。
你会英语吗?单击此处查看更多可汗学院英文版的讨论.

视频字幕

这里有一台口香糖贩卖机。 有黄色,绿色,粉色和蓝色的口香糖球。 我放几个蓝色的进去。 这个视频里我们关注的是 黄色的口香糖。 我们知道 黄色口香糖的比例是P 这是 总体参数 为了便于讨论,更具体化 假设60%的口香糖是黄色的。 或他们的0.6 现在复习一些学过的内容 我要定义伯努利随机变量 我们称它为大写的Y, 它等于1,如果随机从机器里拿出的口香糖 是黄色口香糖。 它等于0,如果随机选的口香糖 不是黄色的。 不是黄色的 从之前的视频里我们知道了一些 关于伯努利随机变量有趣的事情 我们知道它的均值 伯努利随机变量的均值 等于黄色的球在总量里的比例 即等于P, 在这个例子是0.6 我们还知道它的标准差 这个伯努利随机变量的标准差。 是P乘1-P 事实上这是方差。 我们想要取它的平方根 来得到标准差。 在这个具体例子中, 就是根号0.6乘以0.4。 好 目前为止都是复习内容。 现在让我定义 另一个随机变量X, 等于10次 独立的Y的试验的和。 我们之前见过这样的随机变量。 这是一个二项随机变量。 关于它的均值和标准差,我们知道什么? 从之前的视频我们知道 二项随机变量的均值就等于 n乘以每个伯努利试验的均值 n乘P 在这个例子中 n是10,我们做10次试验,P是0.6, 等于6 挺合理 如果里面60%的球是黄色的 如果做10次实验 即你取10个球每次取一个 它必须是独立的,持续做 每次放回去,这样你取10个, 那你会预计6个是黄色的。 虽然不一定一直都是6个黄色的。 但估计你会预期如此。 好了,这里标准差是多少? 标准差等于 我们在其他视频里证明过 等于 n乘P 乘1-P 的平方根 注意你在根号下 放的n 那在这个例子中就是 10乘0.6乘0.4 然后取平方根 这都是复习 如果你不熟悉,建议你去复习一下 关于伯努利随机变量的视频 和二项随机变量的视频。 本视频中我们想要 研究一下样本的分布 一个样本统计量的分布 被称作为抽样比例 在首次介绍样本分布的时候 我们谈论过。 现在我们把这些先抛开 这些是背景内容 我们开始取10的样本 我不是随便选的 我想让它与我们 的随机变量一致 我取10个口香糖球为样本 计算其黄色的占比。 称之为抽样占比。 我用黄色来写。 我想计算样本中黄色的占比 我想计算样本中黄色的占比 这等同于什么? 你可以说,这等同于 我的随机变量X 我想算黄色口香糖球的数量, 然后除以样本的大小。 除以n. 这个情况下,等于X除以10. 一些人可能会想 等等 等等 X是10个独立的 独立的试验 既然是独立的,你不能一下拿10个口香糖球 你需要每次拿一个 然后每次都放回去 这才能是真正独立的。 但记住,我们有10%的法则 10%的法则告诉我们如果一个样本 小于等于10%的总量, 你可以把本例中每一个口香糖球当作 相互独立。 为了便于讨论,让我们说 这里有10000个口香糖球 我们可以接受 每一个在样本里的 都是互相独立的, 根据我们的10%法则。 那么,这每一个 我们看到的10个球里每一个 都是互相独立的, 我用引号注释,根据10%的法则 在这个情况下,可以说 或我们觉得这个说法大致正确 对于第一个样本, 我们的样本占比等于0.3. 3个口香糖球, 10个球里的3个碰巧是黄色。 再做一次, 找另一个样本, 计算样本占比,又是统计 记住,这是试着在估测我们的总量 碰巧是10次中的7次, 持续这样做。 如果我们一直这样做,画一个点状图, 或者点状的分布, 可能的结果是10次里面0个, 10次里面1,2,3,4,5,即一半 6,7,8,9,10次,即全部。 可以画出图,0.3是1,2,3 这是我得到的其中之一的情况 我的样本占比是0.3. 然后0.7,这是一个得到0.7的情况 我想找另一个样本数为10的样本 得到0.7,然后画出图 如果持续找样本然后计算 他们的样本占比,持续画图。 你能得到一个更好的,更好的估测, 关于样本分布的取样占比 但是我们如何描述真正的 取样占比的样本分布呢? 样本分布的均值和 标准差是多少呢? 我们可以从这里的内容得出结论。 我们取样占比的 样本分布的均值等于 随机变量X除以n的均值。 等于X除以n的均值。 等于多少? X的均值是n乘P 是n乘P 你除以n,得到的是P 这是合理的。 一种思维方法是, 对于取样占比的期望值将是 你看到的口香糖球的占比 这是一个很好的指标 一个合理的无偏估计量。 现在考虑标准方差 对于我们的样本占比。 可以考虑其为我们的 二项随机变量X除以n的标准差。 等于根号下 n乘P乘1-P,除以n 就是这里的内容 在根号里除以n 和根号下 nP乘1-P除以n的平方一样, 分式上下同除n 得到根号下P乘1-P 除以n 在这个具体例子中, 我们的参数是0.6. 总量参数是0.6 等于0.6,是 总量的占比。 抽样占比的标准差 是多少? 等于根号下 0.6乘0.4,除以10 拿出计算器来算, 0.6乘0.4,除以10等于 然后加一个根号 大约为0.15