按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
= (XTX)…1XT(Xb+U)-b
= (XTX)…1XTU
在上述条件成立的前提下,容易求出b的期望为
E(b)=b
b的协方差矩阵为
Var(b)=E'(b-b)(b…b)T'
=(XTX)…1XTE(UUT)X(XTX)…1
=(XTX)…1s2
同时最小二乘估计量给出参数的最优线性无偏估计(best linear unbiased estmators:略为blue),即在所有可能的线性无偏估计的集合之中b具有最小协方差矩阵(半正定的意义上)。在这里需要读者留意的是在证明b的blue性质时,并不需要ut关于正态分布的假定6),只有在对模型的参数进行检验时,才用到此条假设。关于OLS估计的最小方差性的证明,可以查阅参考文献'41'。我们称满足假定1)-5)条件的模型为〃标准线性回归模型〃,加上假定6)时将回归模型称为〃标准线性正态回归模型〃。
OLS估计的残差向量定义为:
=Y…Xb = e =(e1; e2;…; en )T
其中 et = (t=1;2;…;n), 为Yt的估计值。从残差的定义可知它不同于误差。二者区别在于前者是估计回归平面同观察值高度的差,而后者是未知回归平面同观察值高度的差。由于
e=Y-Xb=Y-X(XTX)…1XTY='I-X(XTX)…1XT'Y
='I-X(XTX)…1XT'(Xb+U)
='I-X(XTX)…1XT'U=MU
残差在形式上可以理解为误差项ut的一种估计。利用公式
E(UTAU)=s2tr(A)
其中tr表示矩阵的迹,A为n×n矩阵,U为模型(3)中的误差向量。有
E(eTe)=E(UTMU)=s2(n-k)
故ut的方差s2的无偏估计由残差平方和除以它的自由度给出,即 。其平方根S称为回归模型的标准差。利用残差向量和估计回归平面垂直的性质可以把总离差平方和 (total sum of squares:TSS)分解为可解释平方和 (explaned sum of squares:ESS),残差平方和eTe (residual sum of squares:RSS)两部分。即
eTe (5)
亦可以写成TSS=ESS+RSS。(5)中 为Y的平均值,即 , 为Yt的估计值。(5)的分解只对于包含常数项的回归模型成立。
作为说明线性回归模型解释能力大小的一个指标量决定系数(coeffcient of determination)定义为:
(6)
R2表示被解释变量观察值的总变动之中解释变量所能解释部分的百分比,显然有0£R2£1,如果R2=0表明模型的解释能力为0,如果R2=1表明模型的解释能力为100%。当解释变量只有一个X时(模型中包含常数项),决定系数R2和Y与X的样本相关系数的平方相等。由(6)定义的R2可以看出随着解释变量个数的追加,其值增大,即使追加的解释变量对于模型没有太大的解释能力,最终仍能使R2变成1。为了对这一点进行修正,在实证分析中经常使用自由度调整后的决定系数;其定义为
(7)
其中(n…k)是残差平方和RSS的自由度,(n…1)为Yt样本方差的自由度,比较R2和 ,前者当模型中追加新的解释变量时,由于RSS不会增加(一般情况下RSS变小),故前者决不会减少,而后者当解释变量的个数增加时有减少的可能。 和R2的关系由下面的(8)式给出:
(8)
通常有(n…k)b2》 ……,这表明距离现在越近,影响也就越大。把bi代入(13)式,得出
Ct =a+b(1…l) Yt+b(1…l)l Yt…1+b(1…l)l2 Yt…2+ …… (14)
用l乘次Ct…1可得
l Ct…1=la + b(1…l)l Yt…1+b(1…l)l2 Yt…2+ …… (15)
(14)…(15)给出
Ct …l Ct…1 = a (1…l)+b(1…l) Yt (16)
即
Ct=a (1…l)+b(1…l) Yt+l Ct…1 (17)
Brown消费函数本质上是考虑了消费习惯影响到本期的消费,从模型中可以看出,短期MPC(边际消费倾向)为b(1…l),长期MPC为b。
利用表9。1的数据,Brown消费函数的估计结果由下面的(18)式给出
C=…74。38+0。6095Y/CP+0。3706C(…1) (18)
(…1。02) (5。44) (2。88)
R2=0。997 S=131 F(2;16)=2291 DW=1。78
如果考虑在Brown消费模型的基础上在增加一个解释变量实际储蓄存款利率(一年期利率),我们得到以下结果:
C=…8。894+0。4839Y/CP+0。5064C(…1) … 9。683R … 295。4D1 (19)
(…0。125) (4。29) (3。95) (…1。73) (…2。18)
R2=0。997 S=118 F(4;14)=1427 DW=1。76
(19) 式中的变量D1称为虚拟变量,它刻画了1989年物价的急剧波动。
从上面3种不同形式的消费函数的估计结果来看,回归模型中参数的符号及大小不仅和经济理论相吻合,而且参数的估计值在统计上有意义。3种模型中的长期MPC分别为0。93、0。97、0。98,在数值上没有发生明显的变化。这种高MPC反映了中国城市居民在此期间的消费特点,我们注意到1965年…1985年间的美国、德国(西德)、法国的宏观消费函数中的MPC都在0。9以上。考虑到MPC和投资乘数的关系,从投资乘数M=1/(1…MPC);可以得到在高MPC的情况下,投资乘数的效果增加。但是,应该注意的是,随着近年我国居民收入结构的改变和各种金融证券市场的日趋繁荣,消费函数中应考虑加入金融资产和隐性收入等变量,这样更能够说明城市居民的消费状况。
§7。2 计量模型分析中的诸问题
在第1节中看到模型中误差项ut的诸假设对于OLS估计具有blue性质至关重要,特别是如果ut关于方差一定和不相关的假定不成立时,OLS估计不再是有效的(即OLS估计的方差不再是最小的)。本节主要讨论这些假定不成立时,如何采取适当的对策或者如何对估计方法进行修正。
一﹑序列相关(autocorrelation)
对经济数据进行计量分析时,经常发生的问题是ut不满足E(utus)=0 (t1s; t;s=1;2;…;n)的假定条件,即误差项之间存在着序列相关性。产生这种相关的原因一般有以下两个方面:
1)模型设定的偏误。例如模型中丢掉了某个重要的解释变量。
2)经济行为的惯性。例如考虑消费函数模型Yt=a+bXt+ut,其中Xt为收入,Yt为消费,ut为除去收入之外影响消费的所有因素之和。如果收入之外的要素发生变化时,显然通过ut会对t期的消费Yt产生影响,通常这种影响要延续到下一期或者下几期的消费,这是因为经济活动尤其是消费行为并不一定是本期内完结的,在这种情况下,产生正的序列相关是显然的。经济变量一个显著特点是大多数都具有惯性或滞后性,尤其在经济时间序列的分析中,这种特点更加明显进而产生了序列相关性。
对于模型估计,序列相关存在的主要后果是:虽然OLS估计具有线性无偏性,但失去最小方差性,而且序列正相关时,参数估计的标准差相对于实际的估计值过小估计,导致t值过大,容易造成拒绝H0过度频繁出现,假回归的危险性增大进而产生使人们对模型的参数估计值过度信赖的假象。
众所周知,计量模型中误差项的相关模式绝大部分遇到的是具有以下的一阶自相关形式:
ut=rut…1+et (20)
其中et满足模型(3)中假设的1)、2)、3)和6),这种形式的模型称为一阶自回归模型(first…order autoregressive)记为AR(1)。模型(20)是一种在经济分析中非常重要的自相关模型,理由在于首先这种自相关模型代表了实证分析中大多数误差项自相关的形式,并且由于它的特殊性,简单性和实用性,一般情况下在实证分析中不考虑误差项之间存在的高阶相关的情况,主要是处理起来比较困难的原因。
通过模型(20)可知,如果r10表示ut之间存在自相关,r=0表示ut之间不存在自相关。作为检验序列相关是否存在的方法,可以考虑以下的假设检验。
H0:r=0
由于残差表现了误差项的行为,考虑下式给出的r的估计
(21)
可以看成et和et…1 之间的相关系数,实际为et对et…1作回归的系数估计。当ê ú的值较大时,可认为误差序列中存在一阶自相关性。
Durbin;J和Waston;G。S (DW)基于et和et…1之间的相关系数 提出了检验r的d统计量
(22)
通过简单的推导有下面的近似关系成立:
d〃2(1- ) (23)
考虑到r的取值范围,可以得到如下的结果
(24)
表明d的值约等于2时,误差序列不相关,d接近于4时,序列呈负相关关系,d接近于0时,序列呈正相关关系。一般利用 构成的d取值范围在0~4之间,从d的定义看到它依存残差向量e,而e=MU,虽然E(e)=0,但是E(eeT)=E(MUUTM)=Ms2;一般情况下e的分布依赖于X,这导致d的分布亦依赖于X,使得直接利用d的分布进行检验变得非常困难(虽然给定解释变量X后求d的分布也不是一件容易的事)。为了回避上述难题,DW考虑了不依赖于解释变量取值的d统计量的上界(du)和下界(dl)。为了检验模型(20)中
〃H0:r=0 对立H1:r》0〃
DW对显著水平0。05,0。01和不同的样本容量及解释变量个数,给出了统计检验表(可查阅参考文献Johnston'15';Maddala'18')。
如果ddu,接受H0;
如果dl£d£du,不能确定。
对于〃H0:r=0 对立H1:r