If you're seeing this message, it means we're having trouble loading external resources on our website.

如果你被网页过滤器挡住,请确保域名*.kastatic.org*.kasandbox.org 没有被阻止.

主要内容

调查中的偏差的例子

调查中的偏差的例子.

想加入讨论吗?

尚无帖子。
你会英语吗?单击此处查看更多可汗学院英文版的讨论.

视频字幕

我们被告知大卫主持了一个播客 他很好奇他的听众有多喜欢他的节目 他决定搞一个网上民意调查。 他叫他的听众访问他的网站并参与民调。 该民调显示,200名受访者中约有89%的听众 “喜欢“ 他的节目。 在该情景下,最令人关注的偏差来源是什么? 和往常一样,暂停视频 看看你能不能自己想出来 然后我们再来一起解决。 让我们想想发生了什么。 他有这么多的听众,对吧? 我假设听众的数量超过200。 他说,“嘿,我想找一个样本, ”我不能叫所有的听众参与民调。” 谁知道呢,也许他有一万名听众, 题目没有告诉我们,但我们假设 这里有一万名听众。 他说,“我想知道 “有多少人喜欢我的节目。 “所以我需要一个样本。” 但他并没有随机抽取样本, 而是让他们自愿参与。 他叫他的听众访问他的网站。 这是典型的自愿回应抽样。 这不是随机的 因为决定去他的网站听他刚刚说了什么 甚至可能会使用电脑。 这不是随机的。 事实上,人们更有可能这么做, 一万名听众中 有200名听众决定参与进来。 这些人可能是那些已经喜欢大卫 或喜欢听他吩咐的人。 那些不喜欢大卫 或者不想按他说的去做的人, 他们不会说,“哦,我不是真的喜欢大卫” ”我不喜欢他告诉我该怎么做, "但嘿,我还是要去他的网站" "我要填那个民调。" 这不太可能。 或者你可能会走极端,那些不喜欢他的人可能会说, “我一定要去。” 在这种情况下,我想说的是, 你的粉丝更有可能会按照你的要求去做 去你的网站,在你的网站上花时间。 正因为如此,这89%可能被高估了。 89%可能是高估了真正喜欢他的节目 的听众人数。 因为更有可能是那些爱他的人 现身并填写调查问卷。 还有其他形式的偏差。 回答偏差,这是指你问了一些 人们不想如实回答的问题, 或者问问题的措辞可能会让别人 以一种有偏差的方式回答。 经典的例子有, “过去一周你对父母撒过谎吗?” 或者"你曾经对你的配偶不忠过吗" 比如,“你抽烟吗?” 人们可能不想 完全如实回答这些问题 或者他们可能想向外界隐瞒 他们可能不想在调查中如实回答。 因此你会得到回答偏差。 这个偏差不适用于该情景。 覆盖不全偏差是指当你抽样的时候, 你错过了一个重要的选区。 自愿回应 我们可能会错过一些重要的选区, 一些不喜欢访问你们网站的人, 和覆盖不全偏差比, 自愿回应样本偏差更符合该情景。 我们再看另一个例子, 也许大卫还想搞清楚另一个事实, 他仍然在主持一个播客, 他仍然很好奇听众有多喜欢他的节目, 但他试图取一个不同的样本。 在这种情况下,他决定对接下来给他发粉丝邮件的100名听众 进行投票。 并不是所有的听众都做出了回应, 但参与调查的97名听众中有94人表示他们“喜欢他的节目”。 在该情景下,最令人关注的偏差来源是什么? 嗯 这很经典,“嘿,我有一个小组,” 我面前有一个样本, ”是在我的邮箱里电子邮件,我只要打开它们“ 岂不是很方便? 这是典型的方便抽样。 这并不是说, 嘿,这是前100名听众, 很多时候你可能会说 为什么这不是随机的, 这是接下来给他发粉丝邮件的100名听众。 (笑) 这就是方便抽样 你碰巧出于方便而使用的样本 该样本里的听众非常倾向于喜欢你。 这还是高估了, 高估了百分比, 喜欢他的节目的百分比。 无回答偏差是指你让一定数量的人 填写一份调查问卷或回答一份问卷, 但由于某种原因,有一部分人没有填写。 你会想,“哇,这些人是谁?” 也许他们有重要的事情 也许 他们确实填了 但没有被恰当地反应到总数中 这里存在无回答偏差。 他叫发了粉丝邮件的100名听众 填写调查问卷来回答是否喜欢他的节目, 97人填写了。 有3个人没有填写调查问卷 所以会有一些偏差 来源于不回答, 但这不是最令人关注的。 这里题目叫我们填写 最令人关注的偏差来源, 方便抽样 显然是最大的问题。 是有3个人没有回应, 但这没什么大不了的。 自愿回应抽样。 他没有像上一个例子那样问人们, “嘿,你能到这里填一下吗?” 我想,我收回刚才的话, 这里有一点自愿回应, 他去找这100个人, 叫他们回答。 有97个人选择回答。 同样, 这可以是一种偏差来源, 这100人中有97人回答, 但再一次,最令人关注的偏差是来源于方便抽样, 他碰巧出于方便 而使用的这个样本, 是对代表了 他所有的听众的严重高估