If you're seeing this message, it means we're having trouble loading external resources on our website.

如果你被网页过滤器挡住,请确保域名*.kastatic.org*.kasandbox.org 没有被阻止.

主要内容

散布地块中的异常点

了解什么是孤立数据, 和如何找到一个!

散点图上的离群值是什么?

散点图通常有一个分布模式. 如果一个数值不适用于该分布模式, 我们称该数值为 离群值.
观察上方的散点图,这个散点图表示的是参加背包旅行的学生的数据. (每一个点代表了一位学生.)
注意图中的两点是如何不适用这个分布模式的. 我们将这些点命名为布莱德和小莎, 用来代表学生的名字.
小莎的数值被认为是离群值, 因为她的背包比散点图的分布模式预测要重很多.
布莱德的数值被认为是离群值, 因为他的背包比散点图的分布模式预测要轻很多.
要点: 没有一个特定的规则告诉我们散点图中的某一点是否为离群值. 当我们在做更高等的统计时,建立一个准确的"离群值"定义或许是有帮助的, 但是我们现在还不需要.

练习

为了完全理解为何某些特定的数据点可能被认为是离群值, 让我们来尝试着做一些练习题.

练习 1: 买计算机

小米正在为学校挑选不同的计算机. 她查询了计算机样品的价格和质量等级. 她的数据显示在右边的散点图上, 每个点表示一台计算机.
小米想买一台质量等级远远高于根据其价格在分布模式中所对应质量等级的计算机.
哪一个被标记的点代表了小米想买的计算机呢?
选出正确答案:

练习 2: 考试成绩

美国的一些高中生在申请大学之前会参加一门叫做SAT的考试. 散点图右侧显示了每个州即将去大学的高中毕业生在 2009-2010 参加SAT考试的百分比, 还有该州的数学平均分数
可以将3个被标记的点视为离群值.
为什么这些点会被认为是异常值?
选出正确答案:

想加入讨论吗?

尚无帖子。
你会英语吗?单击此处查看更多可汗学院英文版的讨论.