stata视频_stata教程_stata培训 初级、高级、论文视频
从一名stata小白到可以利用它完成大部分的实证研究工作,也进行了很多探索,虽然直到现在也不敢说自己对stata有多精通,但还是有一些经验可以写下来分享给完全不会stata,但又需要用到stata的萌新们。
【1】安装软件是第一步,目前最新版本已经到stata16了,正版软件是需要付费的,但网上有很多的破解版,可以自己去下载。stata的界面主要包括菜单栏、工具栏、历史窗口、命令窗口、结果显示窗口、变量窗口、属性窗口。工具栏有一个do文件编辑器,do文件可以说是stata做实证分析的精髓了,所有的分析代码都可以放在一个do文件中。当你不知道工具栏某个功能是什么的时候,只需要把鼠标移到对应功能附件,就会显示出该功能名称。do文件编辑器的右边的两个功能是数据编辑器和数据浏览器,当你导入数据到stata的工作空间时,就可以在这两个地方看到数据了。命令窗口可以书写单句的stata代码,然后历史窗口会记录每次在命令窗口输入的代码,有时候想重新运行之前输过的代码,就可以在历史窗口点击对应的代码。
【2】导入数据,软件安装好后,就可以开始数据处理了。导入数据的第一步要确定工作环境,把stata的工作环境转换到数据文件所在的路径下,比如说我的数据文件在桌面data文件夹下,只需要cd+路径,就可以完成。这句语句既可以写在命令窗口下,点击enter运行,也可以写在do文件编辑器中,然后选中运行。stata代码中两个反斜杠//或者星星可以进行单行注释,当需要多行注释时,可以这样 /。。。。。。。。。。*/。
stata的数据文件都是以.dta结尾的数据文件,然后也支持导入常见的数据文件比如Excel、csv以及spss文件等,这里我介绍一下导入.dta数据和Excel数据的代码,其他格式数据导入可自行百度。每次导入数据使用clear 语句是为了清除当前stata中打开的数据,如果没有clear语句,已经打开其他数据了,再次打开就会报错,所以务必每次加上clear语句,而在导入Excel文件时,sheet(“工作表”)语句是为了选择工作表,而firstrow语句是表示将数据文件的第一行当作字段名,如果没有firstrow,数据文件第一行将被当作数据,所以一般也应该加上这一句,在打开Excel数据文件后,一般可以将其保存为.dta格式的数据,方便后续处理,注意保存数据的时候加上replace, 不然如果文件夹中存在同名数据,便会报错。
1
2 3 4 5 |
cd C:\Users\may\Desktop\data //转换工作路径
*导入数据 use data_ready.dta, clear //导入dta数据 import excel data_ready2.xlsx, sheet(“Sheet1”) firstrow clear //导入Excel数据 save data_ready2.dta, replace //将Excel数据保存为.dta格式 |
【3】处理数据,导入数据后,需要进行一些初步的处理,包括更改变量名,生成一些新字段,删除重复数据,合并数据等。这里我介绍一些常用的数据处理方式。在导入数据的时候,有些本该是数值变量会变成字符类型,这时候可以使用destring 字段名,replace将其变换成数值,能正确变换的前提是该变量的值都是数字,不能存在字符。stata还可以横向合并表格,命令时merge,具体用法可用help merge 命令查看。而纵向合并数据为append 命令。如果需要分组计算字段,可以使用by和egen命令。
1
2 3 4 5 6 7 8 9 10 11 12 13 14 15 |
rename mon month //将字段mon的名字换成month
gen agenew = age + 1 //生成一个新字段agenew等于age加1 gen year = substr(date,1,4) //截取字符串date变量的前四位,1表示开始位置,4表示字 符个数 destring year, replace //将year字符型变量换成数值型变量,并替代原变量 gen lnorder = log(order) //生成一个新变量lnorder等于order的对数*横向合并数据 merge 1:1 companyID using depart.dta, update*纵向合并数据 append using depart.dta, force *分组计算字段 |
1
2 3 4 5 6 7 8 9 10 11 |
*设置面板数据
xtset companyID year tab year, gen(yeardummy) //生成年份虚拟变量*描述性统计分析 sum y x1 x2 x3 x4 x5 x6 x7 x8 logout, save(sum) word replace: sum y x1 x2 x3 x4 x5 x6 x7 x8*相关性分析 pwcorr y x1 x2 x3 x4 x5 x6 x7 x8, star(.01) logout, save(corr) word replace: pwcorr y x1 x2 x3 x4 x5 x6 x7 x8, star(.01) |
面板数据回归分析一般用固定效应模型和随机效应模型,两者十分类似,只是命令最后加fe(固定效应),re(随机效应)的区别。outreg2命令和louout命令类似,也需要下载,其可将回归结果的表格直接生成word文档,并且设置显著性水平的星星个数。加上调节变量,可以直接用c.自变量##c.调节变量,这个表达式直接包括自变量、调节变量以及两者乘积。如果模型中自变量需要滞后的话,只需在变量前面加上l.。
1
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 |
*设置全局变量
global y “sales” global ctrl “x3 x4 x5 x6 x7 x8” global years “yeardummy1 yeardummy2 yeardummy3 yeardummy4 yeardummy5” global ifclause “if sales !=. ” //设置过滤样本条件*面板数据固定效应回归分析 xtreg $y $ctrl $years $ifclause, fe vce(r) outreg2 using Result-Main.doc, alpha(0.001, 0.01, 0.05, 0.1) symbol(***, **, *, +) dec(3) replace xtreg $y $ctrl $years x1 x2 $ifclause, fe vce(r) outreg2 using Result-Main.doc, alpha(0.001, 0.01, 0.05, 0.1) symbol(***, **, *, +) dec(3)*调节效应x9 xtreg $y $ctrl $years c.x1##c.x9 c.x2##c.x9 $ifclause, fe vce(r) outreg2 using Result-Main.doc, alpha(0.001, 0.01, 0.05, 0.1) symbol(***, **, *, +) dec(3) *自变量需要滞后 |
到这里,整个实证过程基本上结束。
视频不加密,普通播放软件即可播放,也可在手机、Ipad上播放,非常方便使用!
stata视频教程、stata培训、stata教学教程、stata数据分析、stata零基础入门
需要的请加微信:efenxi