If you're seeing this message, it means we're having trouble loading external resources on our website.

如果你被网页过滤器挡住,请确保域名*.kastatic.org*.kasandbox.org 没有被阻止.

主要内容

实验设计简介

实验设计介绍。解释变量与响应变量。对照组和测试组。

想加入讨论吗?

尚无帖子。
你会英语吗?单击此处查看更多可汗学院英文版的讨论.

视频字幕

【讲师】假设我是一家药品公司 我想出了一种药, 我认为它会帮助糖尿病患者 特别是在降低他们的血红蛋白A1c水平的方面,我认为这个药有帮助。 对于那些不熟悉什么是血红蛋白A1c的人来说, 我建议你可以 看我们在可汗学院关于这个的视频。 大致上来讲就是,如果在大约三个月的时间内, 你有高血糖 或者说高平均血糖。 你将会有一个高的A1c,一个高的血红蛋白A1c水平。 而如果在大约三个月的时间里, 你的平均血糖很低, 你就会有较低的血红蛋白A1c。 因此,如果吃药更能降低人们的A1c水平 而不是由于随机或由于其他变量降低A1c水平。 那么这就意味着你的新药 可能对控制人们的糖尿病很有效果。 在这种情况下,当我们设计一个实验 来测试这个时, 你是否吃药,是一个解释变量。 解释变量,以及它所影响的东西, 是你希望有一些反应的东西。 在这个例子里,A1c水平是 药物是否有助于控制血糖的指标。 我们称其为反应变量。 这边这个是反应变量。 那么,我们究竟要如何进行这个实验呢? 让我们假设有一群人。 比方说,我们有100个 需要控制糖尿病的人。 这里有100个人需要控制他们的糖尿病。 我们就从这组人中抽取一半, 然后把他们放入一个(你可以称为)实验组 而另一半人则把他们放在对照组中。 然后看实验组(也就是真正服药的组) 里的人的A1c水平是否得到改善, 而且不是随机现象。 让我们这样做,我们要有一个对照组。 这是我的控制组, 这是实验组。 你可能会说,"好吧,我们就给这些实验组的人吃药, 不给对照组的人吃药。“ 但这可能会引入一个心理学方面的问题, 那就是也许药片的效果只是人们的心理感觉。 "嘿,我正在服用可以控制我的糖尿病的东西。" 也许这样的想法会影响他们的血糖。 在某种程度上,这是有可能的。 也许这让他们在某些方面表现得更健康, 或者更不健康。 因为他们会有这样的想法,"哦,我有药 可以控制糖尿病,血糖, 我现在可以去吃更多的甜品了,反正药能控制住。“ 因此,为了避免这种情况, 避免这种“我现在在吃药, 所以可以有不同的行为, 或者这在心理上以某种方式影响我的身体“的说法, 我们需要做的是给两组人都吃药, 并且我们不能让任何一个组 知道他们吃了什么药。 所以我们要做的就是给这一组人 吃安慰剂, 给另一组人吃真正的药。 但是这些药丸看起来应该是一样的, 而且人们应该不知道他们在哪个组。 当我们这样做的时候,这就是一个盲实验。 你可能听说过双盲实验。 这种情况, 不仅人们不知道他们在哪个组, 而且他们的医师或管理实验的人 也不知道这些人吃的是什么药。 他们不知道自己发给每个组的是安慰剂, 还是真正的药。 我们确实想要这样做。 我们要进行双盲实验。 即使是发药的人 也不知道他们发的是哪一种药。 你可能会问,"这有什么重要的?" 如果医师或者管理实验,接触患者的人知道, 他们可能会以某种方式告知患者, 如果是安慰剂,他们可能不会那么强调吃药的重要性。 他们可能无意中泄露了一些信息。 所以要避免这类事情的发生, 你可以进行双盲实验, 甚至是有些人谈到的三盲实验。 即使是分析数据的人, 都不知道哪一组是对照组 哪一组是实验组。 这是另一种避免偏差的方法。 现在,我们有一个对照组 还有一个实验组, 我们把A1c作为反应变量,所以我们需要 测量人们在接受实验前的血红蛋白A1c水平, 无论是安慰剂组还是药物组。 然后,可能在三个月后, 我们会再次测量他们的A1c。 但下一个问题是,你怎么把这100个人 分到两个组里。 你可能会想要随机分组,这样做确实没错。 如果不随机分组, 比如你把男性放一组,女性放一组, 那么,首先,性别 或者男女行为区别 可能会解释两组 在A1c水平上的差异。如果你有很多同一年龄段的, 或一个国家的同一个部分或同一种饮食习惯的人,然而他们被不平衡地分配在两组里 你当然不希望这样, 所以为了避免一些潜在变量的不平衡, 你需要进行随机抽样, 我们已经做了多个关于随机抽样方法的视频。 你要进行随机抽样, 把人们分进两个组里。 一个非常简单的随机抽样方法是, 你可以给每个人一个从1到100的数字, 用一个随机数生成器来做这件事。 你可以用一个随机数生成器, 挑选50个数字对应的人放在对照组里, 或者挑选50个数字对应的人放在实验组里, 然后其他所有人都被放在另一个组里。 为了避免潜在变量的影响,我们使用了随机抽样。 但是在随机抽样时,你可能会遇到这样的情况: 你有可能 在一个组里分到更多的男性,或者在另一个组里有更多的女性。 为了避免这种情况,你可以尝试分层抽样。 我们在其他视频里已经介绍过分层抽样了。 也就是说,你可以 设计一个区组来进行随机分配。 其中,你把人们分为男性和女性。 这可能会使你得到50比50 或者那你随机地得到60名女性和40名男性。 如果是后者的情况,你现在要做的就是, 从60名女性里随机抽选30人,把她们放在对照组里, 把另外30名女性放在实验组中。 然后,随机抽选20名男性放在对照组中, 另外20名男性放在实验组中。 这样一来,性别这个因素就不那么容易 在数据中引入偏差。 在强调一次,这种做法被称为区块设计, 是分层抽样的一种形式。 可能还有其他潜在变量的存在, 你想确保它不会随机出现, 你也可以尝试 其他随机抽样的方法。 当我们完成分组,你可以观察A1c值实验前和实验后的变化, 如果你发现 两个组的A1c值都没有什么变化, 那你 会觉得这个药物很可能没有什么效果。 这都是关于概率的问题。 有的时候,你得出这样的(可能错误的)结论只是因为不走运而已, 不过这只是在很小的概率下, 所以我们想要更多的样本来避免这样的小概率事件。 当我们对统计学有进一步理解时, 我们会更好地理解在什么阈值水平上, 我们会认为概率是足够高或是是足够低的, 以达到我们对分析结果感到满意的程度。 假设你发现药物使A1c水平得到改善, 你需要想清楚这样的改善 是不是随机出现的, 还是它很大程度上 不依靠随机情况出现。 如果是后者的情况, 那么这是我们所希望的结果。 并且,当你公布药物有效时, 其他人也会认可这个结论。 到这里,我们的分析还没有结束。 没有人可以说他们有100%的把握证明 你的药物是完全有效的。 这个实验中,仍然可能有一些 我们没有适当调整潜在变量。 即使做了这个(基于性别的)区块设计,我们可能 还是会把一些老年人比例失调地 随机分配,使得某一组的老年人更多。 或者是把来自国家的某一地区的人更多地分在一组。 所以总是有一些情况需要考虑, 最重要的是, 即使你觉得你已经考虑周全, 你仍有可能在小概率的情况下, 得到一个假阳性,你得到了好的结论(药物有效),然而实际上药物是无效的; 或者是假阴性,你得到了不好的结论(药物无效) 即使实际上药物是有效的。 因此,实验中一个非常重要的想法 而且适用于在普遍的科学中, 那就是你需要把这个实验详细地记录下来, 然后其他人能够 重复这个实验, 并且得到一致的结果。 所以这并不仅仅是结论的问题, 这关乎到你的实验设计, 我们需要一个可以让他人重复验证的实验, 并且 通过反复验证可以增强结论的正确性。 而不仅仅是随机的,或者只是由于一些 实际实验中管理不善所致的结论。