第3章 国际贸易对行业经济的影响——基于面板数据模型

3.1 面板数据模型简介

3.1.1 面板数据模型的提出和发展

面板数据模型是20世纪兴起的一种统计分析方法,主要用来分析同时具有截面和时间序列特征的面板数据。自20世纪80年代在法国巴黎召开第一届面板数据会议以来,面板数据模型受到了越来越多学者的关注。许多学者投入到面板数据模型的理论探索和应用研究当中。做出重要贡献的学者主要有萧政(Hsiao Cheng)、Hausman、Breasch、Pagan、Badi H.Baltagi、Arellano、Bond、Ziliak、Bhargava、Pedroni、Kao和Chen等。一些国家和组织为了经济和社会研究的需要建立了许多的面板数据,比较著名的面板数据主要有美国1968年建立PSID数据、NLS数据、LRHS数据、CPS数据、HRS数据等;1989年德国的GSOEP数据;1993年加拿大的CSLID数据;2002年欧共体的ECHP数据等。

萧政(Hsiao Cheng)在1986年出版了《面板数据分析》(Analysis of Panel Data)Cheng Hsiao. Analysis of Panel Data [M]. 2nd ed. Cambridge University Press, 2003.,这是第一本全面、系统、深入地介绍面板数据模型的教科书,书中对面板数据模型的基本理论和方法进行了系统的介绍,主要包括静态模型、动态模型、非平衡面板数据模型等经典模型,有力地推动了面板数据模型的理论研究和应用推广。HausmanHausman J. A. Specification Tests in Econometrics [M]. Econometrics, 1978(11):1251-1271.在1978年提出了著名的Hausman模型设定检验,他从不同效应的随机误差项与解释变量的相关性角度进行模型设定检验,用来判断应该采用随机效应模型还是固定效应模型。Breasch和PaganBreusch T. S, Pagan A. R. A Simple Test for Heteroscedasticity and Random Coefficient Variation [J]. Econometrics, 1979,47(5). 1287-1294.在1979年构造了LM检验统计量,通过检验不同效应随机误差是否为零来对模型设定进行判断。Badi H. BaltagiBaltagi Badi H. Econometric Analysis of Panel Data [ M ]. Chichester : John Wiley, 1995.自1980年开始对面板数据模型进行系统深入的研究,他发表了一系列有关面板数据模型的文章,对各种误差分解模型的估计效率、具有MA(q)和ARMA的误差分解模型以及联立方程误差分解模型进行了深入探讨,并于1995年出版了书籍《面板数据计量经济分析》(Econometric Analysis of Panel Data),书中对面板数据模型进行了系统的总结。Arellano与BondArellano Manuel, Bond Stephen. Some Tests of Specification for Panel Data: Monte Carlo Evidence and an Application to Employment Equations [ J ].The Review of Economic Studies, 1991, 58 (2) : 277-297.(1991)和Ziliak Ziliak James P. Efficient Estimation with Panel Data When Instruments Are Predetermined-An EmpiricalComparison of Moment-Condition Estimators [J] .Journal of Business & Economic Statistics, 1997, 15 (4) : 419-431.(1997)利用动态面板数据模型对经济的动态调整过程进行了分析,对就业、经济增长以及劳动力问题进行了研究。之后,许多学者开始对非平稳面板数据模型进行研究,探讨面板单位根和面板协整问题,面板单位根检验始于Bhargava等在1982年利用修正DW统计量的单位根检验。最早开始面板协整研究的是Pedroni、Kao、Chen、Kao和Chiang等学者。

3.1.2 面板数据模型的基本理论

1,面板数据模型的一般形式

面板数据模型的一般模型如下:

其中,i表示个体,t表示时间。横截面的个数为N,时间序列的维数为Tγit是被解释变量的第i个个体的第t时期观测值,χkit是第k个解释变量的第i个个体第t时期的观测值,βki是待估计参数,uit为随机误差项。用矩阵形式表示为

Yi= Xiβi +Ui(i=1,2, …, N

其中,为T×1的向量,为T×K向量,为K×1向量,为T×1向量。

2.混合回归模型

混合回归模型是将面板数据混合在一起采用普通最小二乘法进行参数估计的面板数据模型,主要应用于不同个体在时间上不存在显著差异并且在不同截面之间也不存在显著差异的情况,即混合回归模型建立在解释变量对被解释变量的影响与个体无关的假设基础之上,这种模型在实际问题的研究当中应用较少。

模型用公式表示为

用矩阵形式表示为

Y=+U

其中,NT×1向量,NT×K矩阵,K×1向量,NT×1向量。

混合回归模型的参数估计一般采用普通最小二乘法进行估计。

3. 固定效应模型

固定效应模型是指斜率系数相同,而截距存在一定差异的模型。固定效应模型按截距的不同形式可以分为三种类型:个体固定效应模型、时间固定效应模型和时间个体固定效应模型。固定效应模型一般采用LSDV估计法(The Least Sauare Dummy Variable Estimation)或者是ANCOVA估计法(The Analysis of Covariance Estimation)进行参数估计。

(1)个体固定效应模型

个体固定效应模型是指斜率系数相同而不同纵剖面(个体)截距不同的模型。用公式表示为

写成矩阵形式为

其中,INN阶单位矩阵,l T=(1,1, …,1)TT阶列向量, 表示克罗克内积,N×1向量,T×(K-1)矩阵,NT×(K-1)矩阵, 为(K-1)× 1向量。

(2)时间固定效应模型

时间固定效应模型是指斜率系数相同而横剖面(时间点)截距不同的模型。用公式表示为

写成矩阵形式为

其中,ITT阶单位矩阵,lN=(1,1, …,1)TN阶列向量, 表示克罗克内积。T ×1向量,T×(K-1)矩阵,NT ×(K-1)矩阵, 为(K-1)× 1向量。

(3)时间个体固定效应模型

时间个体固定效应模型是指斜率相同而纵剖面(个体)和横剖面(时间点)都具有不同截距的模型。用公式表示为

写成矩阵形式为

其中,ITT阶单位矩阵,l N=(1,1, …,1)TN阶列向量, 表示克罗克内积,N ×1向 量T ×1向 量,T×(K-1)矩阵,NT×(K-1)矩阵, 为(K-1)×1向量。

4. 随机效应模型

由于解释被解释变量的信息不够充分,固定效应模型往往通过设定虚拟变量来反映个体特征或者时间特征,或者是通过对模型截距项进行分解。但是固定效应模型存在一些不足,如固定效应模型是建立在一定的假设基础之上的。而实际情况并不能满足,并且虚拟变量的存在大大降低了模型的自由度,固定效应模型只考虑了确定性信息的效应,对于随机信息的效应未能得到有效考虑。随机效应模型可以在一定程度上弥补固定效应模型的这种不足。

随机效应模型将混合回归模型的随机误差项进行了分解,将其分解为三个部分:u it=ui+vt+wit,其中,ui表示个体分量,vt表示时间分量,wit表示混合分量。随机误差模型又称为双因素误差分解模型。随机效应模型采用的参数估计方法为FGLS估计法(Feasible Generalized Least Square Estimation)。

模型形式用公式表示为

如果仅存在个体随机误差分量而不存在时间随机误差分量,此时模型称为个体随机效应模型,模型形式用公式表示为

5.变系数模型

混合回归模型、固定效应模型和随机效应模型都是建立在个体解释变量系数相同的基础之上,在一定程度上符合了实际情况,满足了分析的需要,但绝大多数情况并不满足这个假设。变系数模型是面板数据模型的一般形式,不但截距项不同,并且斜率系数也存在一定的差异。变系数模型经常采用的参数估计方法为广义最小二乘法(GLS)。

模型形式如下:

当个体的模型系数不随时间变化时,模型变为

6.模型设定检验

有关面板数据模型设定的检验方法是许多学者关注的问题,不同学者提出了几种不同检验方法,下面简要介绍常见的模型设定检验方法。

(1)混合模型设定检验

混合模型的原假设为

经常采用的检验统计量为Chow检验的F统计量:

其中,URSS为无约束模型Yi=X1iβ1 +X22i+Ui, i=1,2, …, N的残差平方和,X1为前K1个解释变量,其系数与个体无关,X2为后K2个解释变量,其系数随个体变化。RRSS为有约束模型Y=+U的残差平方和。

(2)个体固定效应模型设定检验

个体固定效应模型的原假设为

经常采用的检验统计量为F统计量:

其中,RRSS为有约束模型Y=+U的残差平方和。URSS为无约束模型的ANCOVA估计残差平方和或LSDV估计残差平方和。

(3)时间固定效应模型设定检验

时间固定效应模型的原假设为

经常采用的检验统计量为F统计量:

其中,RRSS为有约束模型Y=+U的残差平方和。URSS为无约束模型的残差平方和。

(4)时间个体固定效应模型设定检验

时间个体固定效应模型的原假设分别为

在假设成立时,经常采用的检验统计量F统计量为

其中,RRSS为有约束模型Y=+U的残差平方和,URSS为无约束模型T的残差平方和。

在假设:成立时,经常采用的检验统计量为F统计量:

其中,RRSS为有约束模型Y=+U的残差平方和,URSS为无约束模型的残差平方和。

在假设成立时,经常采用的检验统计量为F统计量:

其中,RRSS为有约束模型Y=+U的残差平方和,URSS为无约束模型的残差平方和。

(5)个体随机效应模型设定检验

原假设和备择假设为

经常采用的检验统计量为Breusch和Pagan在1980年提出的LM统计量:

其中,为混合模型Y=+ U最小二乘法估计的残差。

在原假设成立时,LM~Χ21)。

(6)个体时间随机效应模型设定检验

原假设和备择假设为

经常采用的检验统计量为Breusch和Pagan在1980年提出的LM统计量:

其中,为混合模型Y=+ U最小二乘法估计的残差。

在原假设成立时,LM~Χ22)。

(7)Hansman检验

为了检验面板数据模型设定过程中采用固定效应还是随机效应,HausmanHausman J. A. Specification Tests in Econometrics [J]. Econometrics, 1978(11), 1251-1271.(1978)、Hausman和TaylorHausman J. A, Taylor William E. Panel Data and Unobservable Individual Effects [J]. Econometrica, 1981, 49(6): 1377-1398.(1981)构造了Hausman检验统计量。

原假设和备择假设为

检验统计量为

其中,为随机效应模型GLS估计量,为固定效应模型的组内估计量,为固定效应模型的组间估计量。

在原假设成立时,miΧ2K)。