7.2 EDA重新表述范式

表7.1是探索性数据分析(EDA)的重新表述范式,展示了多个变量的重新表述的目标和方法。5.2节讨论了一个变量和两个变量两个概念之间的关系,并且提供了校直数据的一个机器学习数据挖掘方法。一个变量和两个变量的幂阶梯法与箱线图,以及[1]突起规则将在第10章和第12章详细探讨。在表7.1里,我们列入了PCA法。PCA通过将多个原始变量重新表述为新变量而找出其中的变化规律,这些互不相关的新变量可以解释其中大部分变化。PCA作为一项EDA方法,用于识别数据间的关系,是一个有效的(新)数据挖掘工具。

表7.1 变量数量与重新表述的目标和方法

[1] 箱型图(boxplot)也称作箱线图。