第四节 用动态因子模型进行预测

动态因子模型方法的问世,在一定程度上化解了VAR方法在实际应用中所遇到的困扰,其卓越的降维特性也使人们不再受限于对少量影响因素的研究。然而实践中人们却过分享受了这一特性,认为既然整个经济系统系由少量隐性因子所驱动,那么只要将所有能够收集到的变量尽可能多地纳入模型,则必然可以滤出所需隐性因子,从而对所关注的经济变量做出最佳预测。如Stock和Watson(2002)在对通货膨胀的预测中选用了多达143个变量;Giannone等(2008)在对GDP的预测中选用了超过200个变量。由于对影响因素无节制的涉猎,使所获取的动态因子失去了对所关注变量的针对性,因而使其预测效果不可避免地受到了影响,以至于Stock和Watson(2011)得出了动态因子模型对通货膨胀率预测效果较差的结论。

另外,考虑到上一节中提到的动态因子模型对数据的要求,当越来越多的变量被纳入动态因子模型之后,待估参数必然迅速上升。而为了使状态空间模型能够运行,势必要增加样本期的长度。上一章曾提到,当样本期过长时,样本期内经济运行规律将有较大的概率已发生变化,从而将导致所滤出的动态因子对待预测变量的预测能力出现下降,甚至失去应有的预测能力。

实践中,比较可行而且应该遵守以下原则选取变量。一是所选取的变量应与待预测变量高度相关;二是所选取的变量间有高度的共性,即能够保证待提取的因子个数不至于太大;三是所选取的变量应该尽可能全面地涵盖所有对待预测变量有影响的因素;四是应该在保证状态空间模型能够运行的前提下尽可能地缩短样本期;五是应该尽可能多地选取高频数据,以保证数据的时效性;六是尽量不选取已停用(将不再更新)的变量;七是变量的选取必须以提高对待预测变量之预测的准确性为前提。

根据Stock和Watson(2011)的观点,采用动态因子模型进行预测时,对预测期内动态因子的取值有两种处理方式,一是直接以样本期内的动态因子取值进行预测,即在对h期进行预测时以Yt+h直接对YtFt及其滞后项进行回归;二是先以各动态因子构成一个VAR模型,对预测期内动态因子的取值进行预测,而后利用这些预测值对Yt+h进行预测。从过去的实践看,两种方法并未表现出明显优劣。笔者选取了后一种方法,并且借助PcGive给出了扇形区间预测部分预测结果见http://xinhuahe.blog.sohu.com/。

本研究项目为G20内的大多数经济体建立了对GDP增长率和通货膨胀率进行短期预测的动态因子模型。由于缺少相应的数据或利用现有数据尚无法得出令人满意的预测结果,笔者最后不得不放弃了对阿根廷GDP增长率和通货膨胀率(数据样本区间过短,只有一到两年)的建模努力。

后续章节安排如下:接下来用两章的篇幅分别介绍通货膨胀率动态因子模型和GDP增长率动态因子模型,然后以中国为例较为详细地介绍通货膨胀率动态因子模型建模过程。随后将G20中其余经济体的通货膨胀率动态因子模型分为G7及欧盟、其他亚洲经济体和其余经济体分别进行讨论。在以中国为例较为详细地介绍GDP增长率动态因子模型建模过程的基础上,同上将G20中其余经济体的GDP增长率动态因子模型分为G7及欧盟、其他亚洲经济体和其余经济体分别进行讨论。

为方便读者尝试利用动态因子模型进行预测,本书最后以附录的形式给出动态因子模型的Eviews程序。