- Python数据分析从入门到精通(第2版)
- 明日科技编著
- 520字
- 2024-12-27 20:10:34
1.2.4 回归分析法
回归分析主要用于统计分析和预测。回归分析研究的是变量之间的关系以及相互影响的程度,可通过建立自变量和因变量的方程,研究某个因素受其他因素影响的程度或用来预测。回归分析有线性和非线性回归、一元和多元回归之分。常用的回归方程有一元线性和多元线性回归方程。
一元线性回归方程:以X为自变量、Y为因变量的一元线性方程。例如,以广告费为因变量,以销售收入为自变量,分析广告费对销售收入的影响程度,以及对未来销售收入的预测。
多元线性回归方程:当自变量有两个或多个时,研究因变量Y和多个自变量1X,2X,…,nX之间的关系。例如,考虑当有多个因素影响销售收入时,销售收入为因变量,满减、打折、季节变化等指标为自变量,分析这些因素对销售收入的影响程度,以及对未来销售收入的预测。
建立回归分析一般要经历这样一个过程:先收集数据,再用散点图确认关系,利用最小二乘法或其他方法建立回归方程,检验统计参数是否合适,进行方差分析或残差分析,优化回归方程。
例如,通过预支广告费(50000元)预测销售收入,首先根据以往广告费(X实际)和销售收入(Y实际)形成散点图,然后使用最小二乘法建立一元线性回归方程,拟合出一条回归线来预测销售收入,如图1.7所示。
图1.7 一元线性回归分析图