If you're seeing this message, it means we're having trouble loading external resources on our website.

如果你被网页过滤器挡住,请确保域名*.kastatic.org*.kasandbox.org 没有被阻止.

主要内容

统计问题

什么样的问题是"统计问题"?

想加入讨论吗?

尚无帖子。
你会英语吗?单击此处查看更多可汗学院英文版的讨论.

视频字幕

当我们开始探索统计学的世界时 我们不禁问自己 统计这个词到底意味着什么 统计学是你可以 用数据做的一大类事情 它通常包括数据和收集数据 那么它其实 让我写下来 它包括:收集数据 收集数据 你可以通过图表来展示数据 或者是一串数字 或者是任何其它的方法 它可以是分析数据 (拼写中) 展示和分析数据 整个课程的内容就是 你如何用数据来回答问题 或者试图弄清楚发生了什么 或者只是为了了解这个世界 这一整类的东西叫做统计学 一个在统计学中很常见的概念 就是变异性 变异性 简单来讲,变异性 就是某个事物有 某个事物变异了多少? 某个事物变化了多少? 这和统计学里对于变异性的认知是相同的 在统计学里,变异性是指 数据点彼此之间的不同的程度 即它们变异的程度 举个例子 为了更具体的理解 假设你去问5个人 你问这5个人 你昨天吃了几块砖头? 每个人会说:额 第一个人会说:“我可不吃砖头。 “我都不知道能怎么吃 “我吃了0块砖头。” 下一个人说0块 再下一个人也说0块 第四个人说0块 然后第五个人也说0块 很好,这就是我们的数据点 这些数据点之间的不同 我其实已经在做统计了 而我仅仅是走出去问问题 问人们吃了几块砖头 然后我可以问它们 昨天吃了多少葡萄 第一个人说:“我吃了0颗葡萄”。 但是下一位说:“我以吃葡萄为生 "我吃了235颗葡萄"。 再下一个人说:”哦,我挺喜欢葡萄的。 “我吃了17颗葡萄 再下一个人说吃了5颗葡萄 再下一个人也是 疯狂的热爱葡萄 它吃了318颗葡萄 如果你仔细观察这两组数据 其中一个是昨天大家分别吃了多少块砖头 另一个是昨天大家分别吃了多少颗葡萄 你马上能够看出这组数据变异的更多 这些数据点全都是0 但是这些数据,变化很大 每一个数据点变化都很大 我们能够了解这组数据 有更大的变异 我们现在开始在统计学中 经常要做的就是测量 数据的变异性 我们如何能够量化这个变异性 我们如何计算出一个数字 我们如何测量变异性 这是统计学的一个重要方面 但是这个视频不会包括全部的内容 未来更多的视频会涵盖这些 随着我们慢慢了解统计学 我们应该考虑我们的大脑 什么时候应该进入一种“统计学”模式 去思考我们所拥有的工具 去收集数据,测量变异性 测量并找出 那个能代表某组数据变异性的数字 我们应该问自己 世间的什么问题是统计学问题? 统计学 统计学 问题 让我们来 定义一下统计学问题 那种能让我们拿出 统计工具的问题 其中一种想法就是 当你需要使用统计工具的时候 为了回答这些问题 回答问题 你需要收集带有变异性的数据 为了回答,你需要 收集 带有变异性的数据 为我潦草的笔记道歉 带有变异性的数据 (拼写中) (拼写中) (拼写中) 你会想:好,这挺有道理的 但是我需要一些实实在在的问题 或者是实实在在的例子 来理解什么是 或不是统计问题 你想的很有道理 那就让我们来看一些例子吧 我这有6道题 我建议你停下视频 在看到答案之前,自己思考一下 根据我们刚才对于统计问题的定义 考虑一下哪些是统计问题 哪些会需要你使用统计工具 哪些不是统计问题 1. 我的宠物西柚有多重? 2. 平均有多少辆车会在星期一早上停在停车场里面? 3. 我饿了吗? 4. 我的母亲有多少颗牙齿? 5. 我的家人平均每年花费多长时间来进食? 6. 我看过几次星球大战? 我假设你已经自己尝试了 让我们一个一个分析一下 第一题 我的宠物西柚有多重? 你知道,拥有一个宠物西柚 本身就是一件很有趣的事情 言归正传,这是不是一个统计问题? 我需要做什么来回答这个问题? 我需要拿出我的宠物西柚 我需要给它称重 然后我需要记录 仅仅是做这些就已经是在收集数据 所以你可能会说我已经开始 在统计学中试水 但是我只收集到了一个数据点 我称了一下,然后我发现 我的宠物西柚是1镑 但这并不是带有变异性的数据 这只是一个数据点 为了拥有变异性,你需要有 多个数据点 并且数据应该有变异的可能 这些人都吃了0块砖头 但是确实是有可能某人吃了一块砖头 但是这里我们只有一个数据点 只有一个数据点是没有办法变异的 所以这并不是一个统计问题 我只收集了一个数据点 下一个例子 平均有多少辆车会在 星期一早上停在停车场里面 来确定这是否是一道统计问题 只需要考虑 我们做什么才能够回答这个问题 我需要连续多个星期一早上 去到一个停车场 去数一共有多少辆车 第一个星期一早上 我看到了50辆车 下一个星期一早上,我出去 数到了49辆车 再下一个星期一早上,我看到了50辆车 再下一个星期一早上,我看到了63辆车 所以我收集到多个数据点 来回答这个问题 然后我要取这些平均值 但是我确实收集到了多个数据点 来回答这个问题 这里绝对有可能会有变异 数据里会有变异 所以,这是一道统计问题 下一个例子,我饿了吗? 这是个很重要的问题 我们每天都会问自己多次 有些时候我们的身体会直接告诉我们 但是我们并没有收集 我想你可以说是在收集 你的胃的感受 或者说个人感觉有多虚弱 但是这肯定不是带有变异性的数据 在一天里,我要么饿,要么不饿 如果更广泛一点 每天饥饿感的变化 你可以搞一个读数来衡量你的饥饿程度 这种会更带有统计性 但是“饿不饿”是一个单纯的是非问题 这并不是 我不需要为了这个问题 来收集带有变异性的数据 所以这并不是一个统计问题 (下一个例子) 我的母亲有多少颗牙齿 为了回答这个问题,我需要找到我的母亲 然后询问她能不能张开嘴 然后数一下她有多少颗牙齿 我可能数出30颗 这个和“我的宠物西柚有多重”问题很相似 我需要收集一个数据点 但是一个数据点是不会有变异性的 所以我并没有收集带有变异性的数据 所以这不是一个统计问题 如果问题变成我认识的所有母亲的 平均牙齿颗数 或者我认识的所有母亲的 牙齿颗数的范围 这就带有统计性了 但是这就只是一个数据点 所以这不是一个统计问题 (下一个例子) 我的家人平均每年 有多少时间是花费在进食上? 我需要做什么来回答这个问题? 我需要去观察 或者询问家里的成员 或许我的母亲,妻子,孩子 还有我的叔叔和阿姨,还有家里的任何人 然后我会询问它们每天花多长时间来进食 把所有数字相加就会得出 它们每年会花费多长时间来进食 或许家人A 一年有813个小时都是在进食 家人B,或许是 一年花费732个小时 所以你可以看到我会从 不同的家庭成员中收集多个数据点 事实上 这组数据很有可能带有变异性 而且,不同年份的数据也很有可能变异 A可能进食时长 到明年就不一样了 所以我肯定会收集到带有变异性的数据 来回答这个问题 所以这是一道统计问题 最后一个例子 我观看了几次星球大战 这和“我的母亲有多少颗牙齿”问题很相似 和“我的宠物西柚有多重”问题也很相似 我只需要去回忆一下 看过星球大战的次数 或许我看过7次 只有一个数据点 不带有变异性 如果这个问题是:我的同事平均 看过多少次星球大战 那我则需要去收集带有变异性的数据 我需要去收集多个数据点 极有可能我的同事 观看星球大战的次数是不一样的 但是对于这个问题来说 你只需要一个数据 我看过多少次星球大战 我的回答应该是7次 这并不是一个统计问题 希望这能让你们 对统计学里的变异性有个概念 并且理解什么是统计问题