3.4.2 示例3.2

考虑定性目标变量的回应情况(RS),用于度量对邮件的回复情况,预测变量HI来自一个样本量102 000的样本。RS将回复是(yes)和否(no),其值分别记为1和0。计算出的相关系数rRS,HI是0.01。RS-HI散点图3.3显示了“火车厢式”长链,掩盖了数据间的关系(假定存在某种关系)。之所以出现这种情况,是因为目标变量只能取两个值0和1。正如前一个例子,这幅图也无法展示计算出的rRS,HI是否可靠。

图3.3 回应与家庭收入的散点图