stata数据分析_stata结果分析_stata数据分析案例
为什么数据都是红色的啊?除了年份那栏的数据是黑色,所以后面做分析都分析不出来。求助。
红色数据表示字符串变量,这是不能用于回归分析的。一般在做面板回归的时候,直接从excel将数据黏贴到STATA里地区变量是字符串变量,需要进行转换。但是你这里除了年份的数据是数值型的,其他的都是红色就有问题了。我的建议是:
(1)在excel中详细检查每一个变量下的数据,尤其注意有没有缺漏值,很多时候存在缺漏值是导致字符串变量的重要原因。
(2)对于地区这一变量,一般是将其进行转换。假设地区变量名为region,stata数据分析具体的操作命令是:
encode,gen(region1) /重新生成一个带标签值的变量/
drop region /去掉原来的地区变量/
rename region1 region /将region1的名称改为region/
这时候region的颜色应该为蓝色,进行时间序列或面板数据的设定就没有问题了。
直接转化数据类型就行了
用STATA进行相关分析_stata 相关性分析_stata相关性分析命令
黄色字体为自己填写部分,红色字体为可缺省部分。
1. Correlate计算pearson相关系数
pearson相关系数是最常用的相关分析依据,要求变量服从正态分布,代码为:
——————————————模板——————————————
correlate 变量1 变量2 … if var=value,means covariance
——————————————模板——————————————
此代码用来计算变量1、变量2…之间的相关系数矩阵。
If用来筛选满足条件的数据,可缺省。
Means要求显示一半描述统计量(均值、标准差、最小最大值)。
Covariance要求显示协方差矩阵而不是相关系数矩阵。
2.pwcorr推断总体相关系数
只用correlate计算样本的相关系数,会受到抽样波动的影响,样本相关不能说明总体相关。Pwcorr不仅可以计算相关系数,还可对相关系数显著性进行检验,原假设是总体相关系数为0,即不相关。代码为:
————————————模板————————————
pwcorr 变量1 变量2 … if var=value,sig star(#)
————————————模板————————————
Sig显示相关系数显著性的p值。
Star(#)是当相关系数显著性检验的p值小于设定的#%,则在相关系数旁标记星号。
比如,计算语文成绩与数学成绩的相关性,显著性水平为5%:
Pwcorr Chinese maths,sig star(5)
3.pcorr计算偏相关系数
偏相关分析的任务就是在研究两变量之间的相关关系时控制可能对其影响的其他变量。
————————————模板——————————————
pcorr 变量1 其他变量1 其他变量2 … if var=value
————————————模板——————————————
上面代码是考察其他变量与变量1的偏相关系数。
4. 等级相关
当变量联合正态分布不能满足,或者变量为定序与定类变量时,不宜使用pearson,而应使用spearman等级相关或kendal等级相关。
————————————模板————————————
spearman/kendal 变量1 变量2 … if var=value,star(#)
————————————模板————————————
语句开头用spearman或kendal都可以,分别代表两种相关系数的检验。
Star(#)是当相关系数显著性检验的p值小于设定的#%,则在相关系数旁标记星号。
转载请注明:数据分析 » stata数据分析_stata结果分析_stata数据分析案例