主要内容
描述散点图 (形状、方向、强度、异常值)
当我们观察散点图时,我们应该能够描述变量之间的关联。
对散点图的关联性的快速描述中,应该始终包括对关联的形式,方向和强度的描述,以及任何异常值的存在。
形式:关联性是线性的还是非线性的?
方向:关联是正向的还是反向的?
强度:这种关联看起来是强关联、中度关联的还是弱关联?
异常值:是否有任何数据点异常地远离整体图案?
在这些特性的描述中包含这两个变量的上下文也是很重要的。这里有一个例子。
举例
让我们描述一下这个散点图,它显示了在 年中司机的年龄和每 位司机的交通事故次数之间的关系。
这里有一个可能的描述,它提到了形式、方向、强度和异常值的存在,并提到了两个变量的上下文:
"这个散点图显示了司机的年龄和交通事故的数量之间有很强的,正向的,线性的联系。数据中似乎没有任何异常值。"
请注意到,描述中提到了形式(线性)、方向(反向)、强度(强)和缺少异常值。它还提到了有关的两个变量(司机的年龄和事故数量)的上下文。