If you're seeing this message, it means we're having trouble loading external resources on our website.

如果你被网页过滤器挡住,请确保域名*.kastatic.org*.kasandbox.org 没有被阻止.

主要内容

生成简单随机样本的方法

生成简单随机样本的方法.

想加入讨论吗?

尚无帖子。
你会英语吗?单击此处查看更多可汗学院英文版的讨论.

视频字幕

如果你的学校里 一共有 80 个学生。 可能不是整个学校, 只是在你的年级。 所以学生总体共有 80 个学生, 而你想要估计一下学生总体的 平均身高,而且你觉得 要测量全部 80 个学生的身高太困难了。 所以你决定抽取 一个简单随机样本。 你觉得测量 30 个学生的身高 比较合理, 所以你想要随机在这 80 个学生中 抽取 30 个学生,并计算他们的平均身高。 那么这个样本的平均身高就是一个 对总体平均身高的 很好的参数估计。 所以你决定就这样办。 那么,你要怎么选择 30 个学生 并且能够保证 这个样本确实是随机的呢? 实际上,有好几种方法可以做到这一点。 一种方法是把全校 每个人的名字都写在一张纸条上, 把纸条全部放进一个碗里, 然后挑出 30 张。我们就可以这样做。 所以我们假设按照字母表的顺序, 这是学校里的第一个人, 写在一张纸条上; 然后这是下一个人的纸条, 然后你会一直写下去, 直到你有 80 张纸条。 纸条应该都是一样的尺寸。 然后你把它们 全都放进某一个碗里。 这看起来是一种非常基础的做法, 但它实际上也能很有效的 为你提供一个 简单随机样本。 我来试着画一个 鱼缸形状的碗。 好了,这就是我们的碗。 所以所有的纸条都放进这里 然后你让一个人蒙上眼, 而且他也感觉不出来有哪些名字; 这样,他应该挑出 30 张纸条。 挑出后不能放回碗里, 因为很显然, 你不想重复挑到一个名字。 你挑出的这 30 个名字 就是你的简单随机样本。 然后你可以测量他们的身高 来估计学生总体的平均身高。 这是一个非常合理的做法。 如果你有一个电脑或是计算器, 你就可以用其他的方法。 你可以使用一个随机数生成器。 在计算器的编程语言中, 会有随机方程, 它们一般写成 math.rand, 其中 rand 是 random (随机) 的缩写。 你可能会看到类似 random 的方程, 像这样 类似于 random () 而且没有任何输入信息。 它可以给你一个范围在 0 到 1 的数字, 或者范围在 0 到 100 的数字。 使用时一定要仔细确认 挑选数字时的概率是相等的。 那么如果你能使用一个 随机数生成器, 而且它甚至可以随机挑出一个 范围在 1 到 80 的数字--包括 1 和 80, 你就可以把所有学生的名字 按照字母表排好顺序, 所以第一个学生 对应编号 01。 如果你在使用一个随机数生成器, 你可以简单地说编号 1, 但是我在这里会使用两个数字, 因为保持形式一致会很有帮助。 接下来,我们会使用另一个技巧, 到那时候,保持两个数字 就可以保证前后一致。 所以下一个编号是 02 , 然后你会一直写到 79 , 写到 80 , 然后用你的随机数生成器 不停的生成数字, 只要没有重复的数字, 你就可以挑出最开始的 30 个数字作为你的随机样本。 另外一个方法, 虽然有点传统, 但是确实是过去以来一直被使用的的方法 甚至现在有时也被使用, 就是用一个随机数字表。 你一开始还是让这些数字与 每个学生一一对应, 然后你用一列随机生成的数字, 比如说 这是我们的随机生成的数列, 它会一直写下去。 你从最开头开始 然后你可以说, 我们想要得到 30 个 从 1 到 80 的两位数字。 所以一种方法是 你可以从数列的最开头开始,比如说, 这是一个随机生成的数列, 这上面的第一个数字是 59 , 59 在 1 到 80 的范围内吗? 当然,只要我们确保 这里是 01 ,这个方法就会奏效。 如果这里是 80 ,这个方法就会奏效。 如果这里是 00 , 这个方法就不会奏效。 如果这里是 81 , 这个方法就不会奏效。 就在这里,这就是我们 挑出来的第一个名字。 你可以想象, 就和我们从帽子里挑出第一个名字一样, 我们挑出了对应编号 59 的那个人。 现在,你会继续下去, 你得到下面两个数字。 下面两个数字是 83 。 它们不在 1 到 80 的范围里, 所以我们不会使用它。 然后你会看到接下去的两个数字。 我们得到一个 5 和一个 9, 它属于我们的范围,但是我们已经挑出过 59 了, 我们已经挑出了对应编号 59 的学生, 所以我们不会重复的挑编号 59 , 所以我们继续下去, 接着我们得到了 37 。 它在我们的范围内, 我们也还没有挑过它, 我们挑出 37 , 接着我们得到一个 00 。 又一次,不在我们的范围内, 我想你已经明白该怎么做了。 91 。 不在范围内。 23 。 在范围内,我们也还没有挑过它, 所以我们挑出编号 23 。 我想你已经明白接下来怎么做了。 我们会沿着这个数列一直进行下去, 按照我刚刚形容的这种方法, 直到我们有 30 个这种数字。 我们现在只有 3 个。 我们只要一直继续下去, 这不是一张包含所有可以 生成随机数据的方法的清单, 但是它可以给你一些技巧。 你可以说, 为什么我不直接在脑海里随机想出一些数字呢? 我真的建议你不要这样做, 因为人们非常不擅长随机决定。 你可能会想用一些 你认为是随机的步骤, 但是你过一会可能会意识到, 它并不是如同你想象的那么随机。 所以再说一次,其实有好多种方法, 但是这几种我认为是最好的 生成随机数字的方法。