If you're seeing this message, it means we're having trouble loading external resources on our website.

如果你被网页过滤器挡住,请确保域名*.kastatic.org*.kasandbox.org 没有被阻止.

主要内容

使用 1.5xIQR 规则识别离群值

离散值是分布中总体模式之外的数据点。
下面的分布显示了19 名申请人的驾照考试成绩。你看到多少个异常值?
有些人可能会说有 5 个离群值,但其他人可能不同意,说有34 个离群值。统计学家已经发展出许多方法来确定什么应该被称为离群值,什么不应该被称为离群值。
一个常用的规则:如果一个数据点高于第三个四分位数1.5IQR ,或者低于第一个四分位数,那么它就是一个离群值。换句话说,低的离群值低于Q11.5IQR,高的离群值高于Q3+1.5IQR
让我们从上面的分布上试试。

步骤1)找到中位数、四分位数和四分位数范围

这里列出了19个成绩。
5, 7, 10, 15, 19, 21, 21, 22, 22, 23, 23, 23, 23, 23, 24, 24, 24, 24, 25
中位数是多少?
中位数=
  • 你的答案是
  • 一个整数,例如 6
  • 一个最简真分数,如 3/5
  • 一个最简假分数,如 7/4
  • 一个混合带分数,例如 1 3/4
  • 一个精确的十进位小数,例如0.75
  • pi 的倍数, 例如 12\ \text{pi} 或 2/3\ \text{pi}$

什么是第一个四分位数?
Q1=
  • 你的答案是
  • 一个整数,例如 6
  • 一个最简真分数,如 3/5
  • 一个最简假分数,如 7/4
  • 一个混合带分数,例如 1 3/4
  • 一个精确的十进位小数,例如0.75
  • pi 的倍数, 例如 12\ \text{pi} 或 2/3\ \text{pi}$

什么是第三个四分位数?
Q3=
  • 你的答案是
  • 一个整数,例如 6
  • 一个最简真分数,如 3/5
  • 一个最简假分数,如 7/4
  • 一个混合带分数,例如 1 3/4
  • 一个精确的十进位小数,例如0.75
  • pi 的倍数, 例如 12\ \text{pi} 或 2/3\ \text{pi}$

四分位数范围是多少?
IQR=
  • 你的答案是
  • 一个整数,例如 6
  • 一个最简真分数,如 3/5
  • 一个最简假分数,如 7/4
  • 一个混合带分数,例如 1 3/4
  • 一个精确的十进位小数,例如0.75
  • pi 的倍数, 例如 12\ \text{pi} 或 2/3\ \text{pi}$

Step 2) 在第一个四分位数以下计算1.5IQR,并检查低离群值。

问题 a
计算 Q11.5IQR
Q11.5IQR=
  • 你的答案是
  • 一个整数,例如 6
  • 一个最简真分数,如 3/5
  • 一个最简假分数,如 7/4
  • 一个混合带分数,例如 1 3/4
  • 一个精确的十进位小数,例如0.75
  • pi 的倍数, 例如 12\ \text{pi} 或 2/3\ \text{pi}$

问题 b
我们可以说有多少数据点是低离群值?
选出正确答案:

Step 3) 在第三个四分位数以上计算1.5IQR,并检查高离群值。

问题 a
计算 Q3+1.5IQR
Q3+1.5IQR=
  • 你的答案是
  • 一个整数,例如 6
  • 一个最简真分数,如 3/5
  • 一个最简假分数,如 7/4
  • 一个混合带分数,例如 1 3/4
  • 一个精确的十进位小数,例如0.75
  • pi 的倍数, 例如 12\ \text{pi} 或 2/3\ \text{pi}$

问题 b
我们可以说有多少数据点是高离群值?
选出正确答案:

额外学习:在盒须图中显示离群值。

盒须图通常将异常值显示为与图的其余部分分离的点。
这是从上方的分布的盒须图,没有显示离群值。
这是从上方的分布的盒须图,显示离群值。
请注意,异常值是如何以点表示的,而晶须很难去更改。晶须延伸到数据中不是离群值的最远点,即15.。
下面是用于比较的原始数据集。

想加入讨论吗?

尚无帖子。
你会英语吗?单击此处查看更多可汗学院英文版的讨论.