如果你看到这则信息,这表示下载可汗学院的外部资源时遇到困难.

If you're behind a web filter, please make sure that the domains *.kastatic.org and *.kasandbox.org are unblocked.

主要内容

样本比例的抽样分布的正态条件

使样本比例的抽样分布大致为正态分布的条件.

想加入讨论吗?

尚无帖子。
你会英语吗?单击此处查看更多可汗学院英文版的讨论.

视频字幕

【讲师】今天的视频我们会讲 样本占比的抽样分布 样本占比的抽样分布 在什么情况下,是近似正态分布的 在什么情况下,是右尾偏态分布的 看起来就像这样 在什么情况下,是左尾偏态分布的 图形是这样 我们会讲这些情况 这是一个粗略的经验法则 如果我们用样本量 n 乘以 总体占比 p 是大于等于 10,并且 并且,如果用样本量 n 乘以 (1- p) 也大于等于 10 如果这两个条件都满足 经验法则告诉我们 这在形状上是近似正态分布的 样本占比的抽样分布 先记着这点,我们来看例题 第一个例题说 小E 经营一家餐馆 每天进货50个柑橘 根据供货商信息 大约12%的柑橘是过熟的(熟透了) 大约12%的柑橘是过熟的 假设小E 每天计算她50个样本中过熟柑橘的占比 假设小E 每天计算她50个样本中过熟柑橘的占比 假设小E 每天计算她50个样本中过熟柑橘的占比 我们假设供货商的信息真实 每天的柑橘代表一个随机样本 抽样分布的图形会是怎样? 过熟柑橘每日占比的抽样分布是怎样? 过熟柑橘每日占比的抽样分布是怎样? 暂停视频,回想我们刚刚说的 看你能不能自己回答出来 好,我们看这里 我们每天收到50个柑橘样本 所以本题中 n = 50 总体占比 过熟柑橘的总体占比是12%,p=0.12 如果用 n 乘以 p 得到什么? n p = 50 x 0.12 100 x 0.12 = 12 所以 50 x 0.12 = 6 6 ≤ 10 所以这就已经不满足第一个条件了 所以我们知道这里不会是正态分布了 所以我们知道这里不会是正态分布了 所以问题就变成了,是哪一种偏态分布? 记住关键的一点 样本占比的均值 或者样本占比的抽样分布 或者每日占比抽样分布的均值 或者每日占比抽样分布的均值 这都是一回事儿 作为总体占比,均值是12% 如果画出图来 我画在这里吧 这里是50%,这里是100% 咱们的均值12%大概在这里 图形在这里很高 而在右边这里倾斜下来 是一条很长的尾巴 这就是右尾偏态 我们看另一个例子 这道题说,根据一个调查显示 每周有88%的小朋友收听广播 假设我们每周随机抽样 n = 125个小朋友 在每个广播听众的样本当中,计算小朋友的比例 在每个广播听众的样本当中,计算小朋友的比例 抽样分布的图形会是怎样呢? 关于广播听众中小朋友的占比 同样的,暂停视频 看看自己能不能做出来 好,我们先来看 n 和 p 是多少 样本量是 n =125 每周广播听众中小朋友的总体占比 每周广播听众中小朋友的总体占比 是88%,所以 p = 0.88 现在来计算 np = 125 • 0.88 这肯定大于等于10 我们不用真的去计算 这差不多是125的90% 比100都大 那肯定大于等于10 所以第一个条件满足 第二个条件呢? 用 n=125 乘以 (1-p) 1-p = 0.12 所以是125的12% 125的10%是12.5,都已经大于10了 所以12%比10%更大 当然也就大于等于10 我依然不用真的计算 估算一下就好了 所以第二个条件也满足了 所以即便总体占比很高 几乎接近1 但是因为样本量非常大 所以基本是正态分布 还有个直观的方法 画个图,这个点为0 这里是50%,这里100% 咱们的均值0.88大概在这里 分析占比的抽样分布图形时 如果我们的样本量很小 那么标准差就会很大 就会成为一个左尾偏态 就会成为一个左尾偏态 但是样本量大的情况下 抽样分布的标准差就会小 抽样分布的标准差就会小 图形就会收紧 收紧使得标准差更小 这样看起来更接近正态 这样看起来更接近正态 所以选这项 近似正态 因为满足了经验法则的2个条件 那这个是完全正态分布吗? 不是! 事实上,如果我们没有这个画图的经验法则 事实上,如果我们没有这个画图的经验法则 可能有人会说左边的尾巴还是比右边的长一些 没准儿是个左尾偏态 但是使用这2个判断条件,加上经验法则 也是统计学的标准 这可以看作是近似正态