面板数据模型和stata软件应用面板数据模型-数据分析

面板数据模型和stata软件应用面板数据模型

关键词：面板数据var模型stata,面板数据模型 stata,stata gmm 面板模型

面板数据模型有以下几个优点:
第一,Panel Data 模型可以通过设置虚拟变量对个别差异(非观测效应)进行控制;
第二,Panel Data模型通过对不同横截面单元不同时间观察值的结合,增加了自由度,减少了解释变量之间的共线性,从而改进了估计结果的有效性;
第三,Panel Data模型是对同一截面单元集的重复观察, 能更好地研究经济行为变化的动态性
举例
交通死亡率与酒后驾车人数(一段时间内江苏省各市)
其他的非观测(潜在)因素:南京与苏州
汽车本身状况
道路质量
当地的饮酒文化
单位道路的车辆密度
非观测效应导致估计结果不准确,面板数据可以控制和估计非观测效应
面板数据模型形式:
其中, i=1,2,3…N,截面标示; t=1,2,… T,时间标示;xit为k×1解释变量,β为k×1系数列向量
对于特定的个体i 而言,ai表示那些不随时间改变的影响因素,而这些因素在多数情况下都是无法直接观测或难以量化的,如个人的消费习惯,地区的经济结构,法律和产权制度等,一般称其为”个体效应”(individual effects)
面板数据模型的误差项由两部分组成:
一部分是与个体观察单位有关的,它概括了所有影响被解释变量,但不随时间变化的因素,因此,面板数据模型也常常被成为非观测效应模型;
另外一部分概括了随截面随时间而变化的不可观测因素,通常被成为特异性误差或特异扰动项
GDP
X(Invest,edu)
北京
江苏省
山西省
基础设施更加完善,受教育程度较好,经济结构以服务业为主,法制更健全
面板模型选择:固定效应还是随机效应
对”个体效应”的处理主要有2种方式:1种是视其为不随时间改变的固定性因素,相应的模型称为”固定效应”模型;另1种是视其为随机因素,相应的模型称为”随机效应”模型
固定效应模型中的个体差异反映在每个个体都有1个特定的截距项上;
随机效应模型则假设所有的个体具有相同的截距项,个体的差异主要反应在随机干扰项的设定上
FE(Fixed Effects) Model
RE (Random Effects) Model
其中, 是截距中的随机变量部分,代表个体的随机影响
(Replace with dummy variables)
固定效应模型
1,例如,在研究财政支出与经济增长的关系,运用全国的时间序列数据来检验财政支出与经济增长的关系可能存在设定误差并且受统计资料的制约,仅用时间序列资料不能够满足大样本的要求
同时,由于我国不同地区的体制变革和财政政策的不断调整,造成各个地区财政支出结构随时间而不断变化
面板数据(Panel Data)从某种程度上克服了这一困难.考虑到中国各省份财政支出结构与经济增长的关系存在明显的地区差异,从时间序列的角度,考虑各省差异的动态性,是面板数据模型的优势
例如,在研究中国地区经济增长的过程中,以全国28 个省区为研究对象,可以认为这28 个省区几乎代表了整个总体
同时假设在样本区间内,各省区的
经济结构
人口素质
等不可观测的特质性因素是固定不变的,因此采用固定效应模型是比较合适的
2,而当我们研究某个县市居民的消费行为时,由于样本数相对于江苏省几千万人口是个很小的样本,此时,可以认为个体居民在个人能力,消费习惯等方面的差异是随机的,采用随机效应模型较为合适
随机效应模型:
RE认为个体的差异是随机的,其中
非观测的个体差异效应与随机扰动项一样都［wWW.nIUBB.net］是随机变量
随机效应模型
总结:如果把非观测效应看做是各个截面或个体特有的可估计参数,并且不随时间而变化,则模型为固定效应模型;
如果把非观测效应看作随机变量,并且符合1个特定的分布,则模型为随机效应模型
3,在实证分析中,一般通过hausman检验判断:由于随机效应模型把个体效应设定为干扰项的一部分,所以就要求解释变量与个体效应不相关,而固定效应模型并不需要这个假设条件
因此,我们可以通过检验该假设条件是否满足,如果满足,那么就应该采用随机效应模型,反之,就需要采用固定效应模型
Hausman检验的基本思想是:在固定效应u_i和其他解释变数不相关的原假设下,用OLS估计的固定效应模型和用GLS估计的随机效应模型的参数估计都是一致的.反之,OLS是一致的,但GLS则不是
因此,在原假设下,二者的参数估计应该不会有系统的差异,我们可以基于二者参数估计的差异构造统计检验量.如果拒绝了原假设,我们就认为选择固定效应模型是比较合适的.
四,stata软件简单介绍
STATA软件估计与应用:
打开数据库:
use “E:\Program Files\Stata10.0绿色软件\Stata10\东部.dta”
或者重新输入数据:edit
相关系数:cor gdp invest edu sci health
简单回归:regress gdp invest culture sci
无常数:regress gdp invest culture sci,noconstant
估计结果
回归诊断:
是否存在异方差:estat hettest
怀特检验: estat imtest,white
回归信息检验:estat imtest
是否遗漏重要解释变量:estat ovtest
拟合图: rvfplot
单一变量的相关图:cprplot invest
画图
菜单与命令结合
twoway (scatter gdp invest)
twoway (scatter gdp invest||lfit gdp invest)
基本建设支出与GDP的相关关系图
各省教育支出的增长趋势:1998-2006
Durbin-Watson 统计量:estat dwatson
序列相关检验:estat durbinalt
滞后阶数选择:estat durbinalt,lags(2)
条件异方差检验:estat archlm,lags(2)
可选变量的异方差检验:estat szroeter gdp invest culture sci
五,Stata对面板数据模型的估计
随机效应模型
Stata对面板数据模型的估计
首先对面板数据进行声明:
前面是截面单元,后面是时间标识:
tsset company year
tsset industry year
产生新的变量:gen newvar=human*lnrd
产生滞后变量Gen fiscal(2)=L2.fiscal
产生差分变量Gen fiscal(D)=D.fiscal
描述性统计:
xtdes :对Panel Data截面个数,时间跨度的整体描述
Xtsum:分组内,组间和样本整体计算各个变量的基本统计量

转载请注明：数据分析 » 面板数据模型和stata软件应用面板数据模型