- 伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解
- 圣才电子书
- 1523字
- 2021-05-21 18:12:40
5.2 课后习题详解
一、习题
1.在满足假定MLR.1到MLR.4的简单回归中,我们证明了斜率估计量是
的一致估计。
利用证明:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image744.png?sign=1739109503-XdSCfGFbzA4DKdoIcBgGmBCRQ9aEuxSi-0-05d30bce4fa076907065e511e56aac38)
[你在使用的同时,还需要使用
的一致性和大数定律。]
证明:简单模型为:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image746.png?sign=1739109503-6sLzkywHJP7C2HlhiVhO27AT2UbROvWh-0-99341c34e385503947918d2390dbb16c)
期望值是
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image747.png?sign=1739109503-RUvgmwNCq63onwP5sF3ZyF44tHqVPLVs-0-88e4eea30aaf5fff7e544c79cff18781)
因为,
,
,故
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image751.png?sign=1739109503-0DsRHdmKzbutybw3IV4wl2Awjd8AYaDB-0-f97c8920ca0a40a8ebbe435a7fb79529)
移项可得
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image752.png?sign=1739109503-dSbNO2emHJU6fU3YzzzKSr6vMbY1q49l-0-2882a5091af65ea8fc930d38d15f893d)
则有
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image753.png?sign=1739109503-3ca6RScxi9NzX8nRl0EXvRFjlfoKObqm-0-24990eee6af4d9d3fd0725561b106766)
根据大数定律
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image754.png?sign=1739109503-GhOyEjMVeWDox906bq33Kri8qAOSnm6H-0-23ffcd28439b88be553ff7f8dc5e935a)
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image755.png?sign=1739109503-kRlKm3NdItFgIJK5yjMMiqciaEXeVlA7-0-715102f9e41153e8fbe0c44ab9bcc9b6)
又
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image756.png?sign=1739109503-stmVdNqVauXtnXxM444Rf36MZqkixLcZ-0-196e3b0373fb1e7022a60da35e4b53e2)
则对等式两边同时取概率极限得:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image758.png?sign=1739109503-nURvtqmHfajwinXi85BfmvhLDV2QmIeu-0-3751f8453479c5f81cd82bead780e2ae)
2.假设模型
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image759.png?sign=1739109503-YRjZgKa9mELIiLUbDBnFO1V7sZDqMCnq-0-d742f5f41c5a619132a5a4e046122390)
满足前四个高斯—马尔科夫假定,其中,pctstck表示工人养老金投资于股票市场的百分比,funds表示工人可以选择的共同基金的个数,而risktol表示对风险承受能力的某种度量(risktol越大,则表明这个人对风险的承受能力越强)。如果funds和risktol正相关,pctstck对funds简单回归的斜率系数有怎样的不一致性?
答:对风险的承受能力越强,就更愿意在资本市场上投资,因此。假定可供选择的共同基金的个数与个人承受风险的能力是正相关的,使用公式5.5
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image760.png?sign=1739109503-SfFalTlBA2eA3lM8Bwl2j2L5I8lDltge-0-dec87163a25ec34b42699acbb4cae458)
因此有一个正的不一致性(渐进偏误)。这个结论是有意义的,如果省略个人对风险的承受能力这一变量,而它与可选择的共同基金个数相关,因此估计出来的funds对pctstck的影响实际上包括了risktol对pctstck的影响。
3.数据集SMOKE.RAW包含美国成人个人随机样本在抽烟行为和其他变量方面的信息。变量cigs为(平均)每天抽烟的数量。你是否认为在美国这个总体中,cigs具有正态分布?试做解释。
答:在美国这个总体中,cigs不具有正态分布。大多数人不抽烟,因此对一半以上的美国人而言,cigs=0,故正态分布随机变量的概率大于零并没有特殊的意义。另外,cigs的分布是左偏的,而正态分布随机变量是对称的。
4.在简单回归模型教材(5.16)中,我们在前4个高斯—马尔科夫假定下证明了,形如教材(5.17)的估计量是斜率的一致估计量。给定这样一个估计量,定义
的一个估计量为
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image761.png?sign=1739109503-G58Tmr8UyntfaNkvR4Jxd3eP0mwsmuiY-0-c34a9e1ba3790b72eb7b36ed83609233)
证明
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image762.png?sign=1739109503-1pPQFUEBrIzDh51tA2zNRjCkcIw1qaZ0-0-3b6010c613f6ffada7b72fa402e6cf80)
证明:简单回归模型为:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image763.png?sign=1739109503-YAaIJVHKwBYgKQR5H7E68Fir6O2saZF7-0-dcbc8fe92c94a8bc61ed610da54ebe74)
则其期望值是:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image764.png?sign=1739109503-pckM9CTTGtYgjXHYbQZ1fnDn1hK2hEkF-0-a3093a10511d706ae0aa1ba6561e0e01)
或
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image765.png?sign=1739109503-8v3mQa9bbh4v15M5pdC5PMGNGZ0NWUzG-0-0722260459572c66c1aee58916016704)
因为,则
,
。因此
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image766.png?sign=1739109503-CH9gjFx61a5FuvbymuhJa2SfqmAQoumM-0-8575958c6d43226bc101c57afcbf6caf)
则
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image767.png?sign=1739109503-NRvakTNUtoJW4rI4TXUVW2U57pT8wild-0-79dfb7a193a56774a40ad3297c6d6693)
现在
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image768.png?sign=1739109503-fpmEE82xM3aNjGs5cmkEY0ifF9LyuDVk-0-e9bf32c317fd8e6be4673343009525a7)
可得:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image769.png?sign=1739109503-HKI4a1jCbWhT7udILmi4NOBhQrV4oPdO-0-1ce9e80eec3545ef16024548ab5bb072)
根据大数定律可知:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image770.png?sign=1739109503-JrDR3FDmFD1seV1gkZIeEnIkL3psivAV-0-e5df51f6f85e3a84cfe5eba1ce18fc0e)
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image771.png?sign=1739109503-UhtuNjoi6gdCVwFKVWcccXAMkQwO89wA-0-271a5e0200813a67dfb64c7f57d61201)
因此
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image772.png?sign=1739109503-5jT0LJCGpoL2dvAg9m5092IWjqbYsa35-0-682b5231a6235b646ba2d04ffb48e4d5)
二、计算机练习
C1.本题使用WAGE1.RAW中的数据。
(i)估计方程
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image773.png?sign=1739109503-NM8LP8bCxX3t89DjBVBCo5YiVcHyepMD-0-f52e526902e4f2a868ad3b19f5c8f8ec)
保留残差并画出其直方图。
(ii)以log(wage)作为因变量重做第(i)部分。
(iii)你认为是水平值—水平值模型还是对数—水平值模型更接近于满足假定MLR.6?
答:(i)估计模型为:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image774.png?sign=1739109503-uc609W64NUDBQFqZioPJIrh5VvCySikA-0-4fdfc251fd1910643621772ad74fff7b)
526个残差,
的直方图如图5-1所示,根据STATA手册中的公式对526个观测值在直方图中使用了27个排序格,通过对比正态分布是适合图中描绘内容的数据分布。
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image776.jpg?sign=1739109503-KbREW49WDITnsLH64tpfH60ehnfyON0b-0-4491ed22534df48d4a21ba0f92aa2c15)
图5-1
(ii)log(wage)作为因变量的估计方程为:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image777.png?sign=1739109503-NcrX9Z9EdbxlQO3dOqcH1Ln8OMqmX76s-0-e24b3f43e1d7aa091107f166d33eb718)
从方程中推出的残差直方图,以及最合适的正态分布重叠图如图5-2所示:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image778.jpg?sign=1739109503-m4CwoZ6gMLH1oAxlATR7Jv2oJ06oGOZy-0-3b4875d4d5b662d4187cb2140bc2f9fb)
图5-2
(iii)log(wage)回归的残差看起来更符合正态分布,第(ii)部分的直方图的分布密度比第(i)部分直方图更好。wage残差直方图是显著左偏的。在wage的回归中,存在一些很大的残差(甚至等于15),这是基于残差平均值等于0的标准估计误差()很难支持的。在对数—水平值模型中残差不等于0并没有造成太大的问题,因此,对数—水平值模型更接近于满足假定MLR.6。
C2.本题使用GPA2.RAW中的数据。
(i)使用所有4137个观测,估计方程
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image780.png?sign=1739109503-y88IcvXjk4HU5duvPISL1mjqxnyq3E7N-0-55e0ab01414cfefce6a78cf515ff7680)
并以标准形式报告结论。
(ii)使用前2070个观测再重新估计第(i)部分中的方程。
(iii)求出第(i)部分与第(ii)部分所得到的标准误的比率。并将这个比率与教材(5.10)中的结论相比较。
答:(i)4137个观测值的回归模型为:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image781.png?sign=1739109503-8TjsmEXltBN78QxW6KXivcF8XOIFWTN1-0-ec8cf32be8d564997f83b3c77d11b927)
(ii)使用开始的2070个观测值的回归模型为:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image782.png?sign=1739109503-yEaLHRfCXwwucuLyt5tS3jYP0sZFNJUH-0-e8481267256c1c6548fde6eea717e186)
(iii)使用2070个观测值的标准误与使用4137个观测值的标准误的比率为1.31。根据教材5.10的经验法则,预期标准误的收缩速度为样本容量平方根的倒数。本题中,大于真实标准误的比率,即标准误的收缩速度略慢于样本容量变化速度。
C3.(i)根据第4章的计算机练习C6在第(i)部分中的等式:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image784.png?sign=1739109503-l6V3c29sBVMZaQAHlgKXwU80jXBpgBm6-0-3d287e20a95d0fc2ea319fe90bc1533b)
获得对于原假设为的LM统计量。
(ii)对于第(i)部分中的检验获得(渐进的)p值。
答:(i)首先进行约束模型的回归,然后将约束回归所得残差对所有变量进行回归为:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image787.png?sign=1739109503-rzZxSBgFgwsQ847Iu7fRRfzCtzQMxdmS-0-97dab8b7e3f64e24c3dfd7da51e766ef)
构造LM统计量:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image788.png?sign=1739109503-XLYkVBY3k0GRKANIi4iP71p9OYUPNNYs-0-cdaddd2b1dc1fa30b56f0259473cc61e)
因为q等于2,故,置信水平为95%的临界值为7.378。即LM统计量大于临界值,可以拒绝原假设,认为
不同时为零。
(ii)LM=21.4相对应的p值为0.0002254。