If you're seeing this message, it means we're having trouble loading external resources on our website.

如果你被网页过滤器挡住,请确保域名*.kastatic.org*.kasandbox.org 没有被阻止.

主要内容

构造和解释 p 的置信区间的示例

检查所需条件, 计算和解释置信区间, 用以估计人口比例.

想加入讨论吗?

尚无帖子。
你会英语吗?单击此处查看更多可汗学院英文版的讨论.

视频字幕

黛拉有500多首歌 在她的手机上, 她想估测 概率为多少的歌是由女艺术家做演唱的。 她采用简单随机抽样方法 也就是SRS,在手机里随机选取了50首歌 发现样本里的20首歌 由女艺术家创作演唱。 根据这个样本 下列哪一个是99% 的置信区间,关于手机的歌曲 样本中由女艺术家创作演唱的概率? 和以往一样,暂停视频,看看 可不可以自己做出来。 黛拉的库里有500多首歌 她想找出所有歌中由女艺术家演唱 的歌曲的概率是多少? 她没有时间调查所有的500首歌 来找到真实的总量占比,p。 她找了一个有50首的样本 n等于50 她计算了样本占比 记为p帽子 她找到50中的20首 由女生演唱 20除以50等于0.4 然后她想建造一个99%的置信区间 在我们想建造 置信区间之前 你想检查我们用的是 正确的假设和正确的方法 在计算置信区间之前 保证样本分布 没有被破坏 这样我们可以有自信 来建造置信区间 第一个情况是保证你的样本 是完全随机的 这里说是一个简单的随机抽样 所以我们就相信他们的话。 下一个情况是假设 你的样本占比的样本分布 大约为正态的 你要有自信或你想看 你的样本有至少10次成功 和至少10次失败 这里我们有20次成功,代表 50减20,有30次失败 他们同时都大于10 符合情况 最后一个情况是 有的时候被叫做独立性测试 或独立的法则或10%法则 如果你的抽样是有放回的 如果她看一个曲子 来检测是女生或不是然后再放回 到她的歌单里,然后再看去另一首歌 每一个观察的内容将是独立的 但我们不知道这一点 实际上我们假设她的抽样是无放回的 如果你不做有放回的抽样 可以假设大概是独立的 对于每一个曲子的观测,如果不大于 10%的总量 看起来这就是总量的10% 所以黛拉遵从我们 的独立性测试。 所以思考一下 置信区间是多少 这将是 样本占比加上或减去 有一些临界值 这个临界值会被 我们想要的置信区间决定 然后临界值乘上 样本分布的标准方差 关于我们不知道的样本占比的。 除了这样做 我们用样本比例的标准误差 这个情况下是p帽子 乘1-p帽子 除以n,我们的样本大小 除以50 等于什么 我们得到p帽子,我们的样本占比 是0.4加或减 写成z星,临界值 有一点。 我们用z表 将得到0.4 1-0.4是0.6 除以50 我们可以看一些选项了 很有趣 这两个看来很有趣 我们需要推理的主要问题是 哪一个有正确的临界值。 我们想要高于和低于1.96标准误差吗 关于我们的样本占比? 或我们要高于或低于样本占比的 2.576的标准误差,啊 重点是99%的置信区间 如果我们有99%的置信区间 一种考虑的方法是 画一下 正态分布的图。 如果想要99%置信区间 代表你想包含99% 中间的99%,在曲线下的这部分面积 如果这是99% 在这里的将是0.5% 这里是0.5% 希望z值比它高出0.5% 这等于99.5% 想从表里找到的 因为很多z表 包含了你从 AP统计考试上能看到的 他们的面积将达到并包括, 达到并包括一个确定的值 将不会留下这个 在z表上查看99.5% 好了,让我放下面一点 这是z表 看看我们在99,好了,这将是 在这个区域里 这是2.5 看起来是2.57 或2.5 2.58 大约是2.57 在2.57和2.58之间 给我足够的信息来回答问题 这不是这个 我们有2.576,在2.57和2.58中间 提醒自己 我们可以建造置信区间 在这里 这代表了什么? 代表了如果我们想重复取样 大小为50的样本,重复用 这种方法构造置信区间 大约99% 的区间我们建造的 包含真实的总量参数