If you're seeing this message, it means we're having trouble loading external resources on our website.

如果你被网页过滤器挡住,请确保域名*.kastatic.org*.kasandbox.org 没有被阻止.

主要内容

使用变换后的数据进行线性回归的例子

使用变换后的数据进行线性回归的例子。改编自2007年 AP 统计课程自由回答,表格 b、问题 6、d 部分。

想加入讨论吗?

尚无帖子。
你会英语吗?单击此处查看更多可汗学院英文版的讨论.

视频字幕

【讲师】我们已知 一个以保护物种为长期目标的保护组织认为 那些濒危物种将会消失 当它们居住的土地被开发后 在一个即将被开发的地区有个购买土地的机会 在一个即将被开发的地区有个购买土地的机会 该组织可以选择建造一个大型自然保护区 面积为45平方公里 可容纳70种濒危物种 或者选择建造五个小型自然保护区 每个保护区的面积为3平方公里 每个保护区可容纳16种特有的濒危物种 每个保护区可容纳16种特有的濒危物种 你会推荐哪个方案,为什么? 你会推荐哪个方案,为什么? 这里有一些有趣的数据 这看起来像是他们从不同的岛屿收集的数据 这看起来像是他们从不同的岛屿收集的数据 这列是面积 这列是1990年濒危物种的数量 这列是2000年灭绝的物种数量 我们可以看到这些不同的岛屿的数据 还有它们的面积 还有灭绝数量的比例 这里是这些数据的散点图 看图的时候要非常注意 看这两个数轴 这里纵轴是2000年灭绝物种的比例 和这些数值 但横轴并不是直接使用了面积的值 而是面积的自然对数 为什么要这样画图呢 注意,当横轴是面积的自然对数时 注意,当横轴是面积的自然对数时 图形看起来像是线性关系 但要清楚,线性关系是 面积的自然对数 和2000年灭绝物种比例之间的 做这类转换有价值的原因在于 做这类转换有价值的原因在于 这样我们就可以用线性回归工具 来比较 在45平方公里的岛屿上灭绝物种的占比 来比较 在45平方公里的岛屿上灭绝物种的占比 和五个 3平方公里的小岛的灭绝占比 暂停视频 看你自己能不能算出来 题目给了我们一条根据数据画出的回归数据线 题目给了我们一条根据数据画出的回归数据线 好,我们一起来看一下 好,我们一起来看一下 我把表去掉,腾个地方出来 因为所有这些都已经画好了,我们有回归数据 回归线,我们知道是 y 轴截距上的斜率 y 轴截距就在这里,0.28996 这里是0.2,然后1、2、3、4、5 0.28996 差不多是0.29了 大概在这个位置 这是 y 轴截距 斜率大约是 负0.05 我目测 大概就是这样的 这就是回归线 或者说 回归线告诉我们一个占比 占比明显是说灭绝物种占比的简称 占比明显是说灭绝物种占比的简称 占比 = y 轴截距 0.28996 - 0.05323 占比 = y 轴截距 0.28996 - 0.05323 占比 = y 轴截距 0.28996 - 0.05323 这里要小心 你可能想说乘以面积 但是不对,横轴是面积的自然对数 乘以 ln(面积) 两个方案下我们都可以用这个方程 考虑两个方案下物种灭绝的预期占比是多少 考虑两个方案下物种灭绝的预期占比是多少 实际有多少物种会灭绝 实际有多少物种会灭绝 灭绝物种更少的方案才是最好的方案 灭绝物种更少的方案才是最好的方案 或者说我们能保护更多物种的方案是最好的 或者说我们能保护更多物种的方案是最好的 我们来看这两种情况 第一个方案是45平方公里的岛屿 只有一个,所以乘以1 灭绝物种的预期占比是多少呢 灭绝物种的预期占比是多少呢 根据这条回归线 占比 = 0.28996 - 0.05323 • ln(45) 占比 = 0.28996 - 0.05323 • ln(45) 如果想知道灭绝物种真正的数量 灭绝数量 = 占比 x 总数 灭绝数量 = 占比 x 总数 来看题里给了45平方公里的岛 容纳70个濒危物种 乘以 70 我们用计算器算出来结果 这就是在45平方公里岛屿上 根据线性回归计算出的预期灭绝物种占比 根据线性回归计算出的预期灭绝物种占比 结果等于 近似等于9% 如果要算出预期灭绝物种数量 如果要算出预期灭绝物种数量 就用占比乘以物种总数 所以再乘以70 约等于6.11 我写下来 这个方案里 约等于6.11 我们可以说大约有 就说是6种吧 这是非常近似的了 6种灭绝 也就是大约保护了64种 我们再来看另一个方案 这个方案里 有五个小型自然保护区 3 km² x 5 3 km² x 5 我们做同样的计算 占比 = 0.28996 还是 y 轴截距 - 0.05323 有负号,因为斜率是负的 - 0.05323 有负号,因为斜率是负的 然后不是乘以面积 是乘以面积的自然对数 占比 = 0.28996 - 0.05323 • ln(3) 占比 = 0.28996 - 0.05323 • ln(3) 灭绝数量 = 占比 x 总数 灭绝数量 = 占比 x 总数 占比就是上面刚刚列出来的这行 我们算一下 回到题里 五个小型自然保护区 每个面积3平方公里 每个容纳16个濒危物种 5个保护区乘以16个物种 5个保护区乘以16个物种 5 x 16 =80 这里乘以80 然后计算 还是用计算器吧 得到 先算出占比 这个结果大得多了 再用占比乘以总数 乘以 80 得到灭绝物种数量 约等于18.52 约等于18.52 我们还是近似取整 我们还是近似取整 就说大约有19个物种灭绝 如果有19个灭绝 那保护了多少个呢? 80-19 =61 保护了61种 就算我们按照18.5来算,保护了61.5种 怎么算也是45平方公里的大岛更好 有更少的物种灭绝 更多的物种被保护了 题目问你会推荐哪个方案,为什么? 我推荐建大岛的方案 因为预期可以保护更多物种 因为预期可以保护更多物种 预期更少的物种会灭绝 依据是线性回归线