主要内容
残差介绍
对什么是残差建立基本的理解.
当我们试图用一条直线描述散点图时, 我们遇到了一个统计问题。问题是:很难确定哪一条线最适合数据。
比如,假设三位科学家, , , 和 , 正在使用同样的数据集。如果每个科学家画的直线不一样,他们如何决定哪一条最合适呢?
要是我们有办法衡量每条线适合每个数据点的程度就好了.....
残差来帮助你!
残差是衡量直线对单个数据点的匹配程度的指标。
考虑一下这个有一条适合的线经过的简单数据集
并注意 的位置是在线上方 个单位:
垂直距离被称为残差。对于直线上方的数据,残差为正;直线下方的数据,残差为负。
比如,点 的残差为 :
一个数据的残差越接近 ,就说明更适合。这种情况下,这条直线更适合点 而非点 。