主要内容
散布地块中的簇
了解散点图中的集群是什么!
什么是散布图中的群组?
有时散布图中的数据点形成不同的组. 这些组称为群组.
观察上面的散点图, 它显示 了 的 个品牌的热狗的营养信息. (每个点代表一个品牌.) 这些点形成两个群组, 一个在左边, 另一个在右边.
左侧群组里的品牌倾向于 .
右侧群组里的品牌倾向于 .
练习
为了让我们更加熟悉群组的概念,我们来尝试做几道题目.
问题1: 雄鱼和雌鱼
成年雄性 美鳍亮丽鲷(一种鱼) 比成年雌性要大许多, 重量是 倍之差. 此外, 当雌鱼长到 厘米长的时候, 雄性的长度会达到 厘米.
练习 2: SAT考试成绩
美国的一些高中生在申请大学之前会参加一门叫做SAT的考试. 下面的散点图显示了每个州即将去大学的高中毕业生在 参加SAT考试的百分比, 还有该州的数学平均分数
为什么数据中存在簇群?
解释为什么在特定数据集中存在群组可能会很困难. 本文介绍了三个数据集, 它们分别使用来自真实世界的数据. 但是只有鱼的数据集在群组这个概念之下有一个清楚的解释.
如果您有一个解释其他数据集中的群组的理论, 请在下面的评论中分享您的想法.