Stata与R比较_区别_使用心得分享
Stata与R比较:
我学用Stata已有几年了,感觉它易学易用,运行速度快,且功能强大;但也觉得它在相同变量与观测单位的情况下(如5000个单位,15个变量),好象对内存容量要求要比其它统计软件高,而且它的使用手册非常难求(Stata10之前难求,但在Stata11软件中手册已随之提供)。
最近有部分同学和同事建议我用R,虽然R及其相关材料是自由、免费(版权问题)的,但我觉得R较Stata难以上手。开始自学时,不看任何相关资料,我学Stata时约2个小时后基本可用命令作一些简单的分析,而我用同样多的时间却摸不着R的门道,而且,我认为当前很多人对R的热情主要是因它“免费”,这种“免费”能维持多久,或者是为免费来维护或更新R软件及其各程序包计算的准确性等而投入的人力、财力、时间与情感能维持多久,我看得观察一段时间。
Stata软件购买费用并不高,以单用户的标准版来说,估计价格在3500到6000元RMB之间,且可终生使用(并非租用)。
再说,就我国目前的统计专业而言,至少能熟练(知道算法,能编出应用程序的程度)使用一种统计软件的硕士生博士生的比例并不高, 所以,对统计专业本科生而言,我个人认为Stata似乎比R更合适。
请各位谈谈自己的看法 !!
国内大部分的“免费”都是“盗版”。而R的免费是因为R是一款开源软件,就如同Emacs和Latex一样,是有一支自发而成的团队来维系它。这只团队可谓是牛人众多,其中就包括当年开发S的工程师。开源软件是现在的一个趋势,是一种新的观念,提倡的是“众人拾柴火焰高”,让大家在网上提供自己的程序包,破开知识疆土的界限,大力促进“软件社会主义”,而不是“软件盗版主义”。既然Latex和Emacs这么多年(10年以上)来都没有任何倒退的迹象,反而是蓬勃发展,我们应该相信R也将会如此。
如果楼主有心于学术研究的话,提议用R,毕竟体现了你对版权的尊重,少用盗版的好。此外,R在网上拥有大量免费的资料,也相当便于学习。
再纠正楼主另一个错误的观点——易上手!
易上手是好事吗?
其实蛮难定义“上手”这个概念的。举个例子来说吧,例如:计量经济学中的线性回归,如果认为点击几下鼠标就能够得到结果是“易上手”的话,那却是Stata是较R容易。但是也正是这种方便性,成为了Stata乃至大部分商业软件的软肋,假如某个统计变量是Stata标准包中没有的,怎么办?还不是得用Stata的语言来DIY。既然这么费力,为何不一开始就用R来自己写程序?而且自己写程序才能够真正的理解公式背后的含义,自己写才能够感受到知识的无界性。正所谓“知识有多少,程序跑多好;知识比较少,程序跑不了”
R所提供的编程环境,以及网上提供的大量package都可以成为研究人员披荆斩棘的利器。我就不知道Stata能不能够做Bayesian Analysis了。Stata很难跟上时代的潮流的,毕竟商家需要时间来完善自己的软件,我们又需要时间来破解正版软件。
所以“易上手”未必就是好事,年轻的时候苦点,老了才能享福啊!
另外还有一点愚见就是,其实所有的软件程序都是基于课本上、论文中的数学逻辑,矩阵运算,概率统计,如果能够很好地掌握这些知识,其实根本就不存在“上手”的问题,只要会import,output,定义矩阵,生成随机数就OK了。——要算啥,就自己编啥贝。
我学R用了2天,Stata和SAS到现在都没学透,总是有新的命令,新的更新包,累啊~~
PS:作为R的Fans的一点遇见。言语若有得罪,多多包涵。大家都是混学术的嘛
Stata不仅入门容易,而且进阶也容易,例如根据自己的需要,即可自己编写所需统计量、估计方法等的程序,还可对所谓的标准包用记事本打开修改并另存就OK了,省事啊!同时网上有很多Stata用户编写的程序包可下载!还是省事,这并不亚于R。
由于Stata命令的简捷易董(大部分命令其实就是相应英语单词,只要不重复,也可只写单词的前几个字母),功能强大(主要体现在命令的选项上),……,受到广大用户的喜爱。
R我是不懂,上面仅是我的个人对Stata的看法,请各位能不吝赐教!我以前用Spss与Eviews,目前用的是Stata。我觉得个人能用精一两个较优秀的软件就行了,不必花费过多的时间与精力去学很多,但为了不误人子弟(统计专业本科生),我得了解各位对这两个软件的看法,再决定是学与否。
社会学,医学和生物的我建议用stata。
统计专业的我建议用r或者s。
外行用spss(没有贬低spss的意思,而是其他的外行根本不可能学的原因)。
r可不是其他专业可以学,用r的价值在于得到最近统计前沿的一些分析方法。而不是会计算矩阵,随机数(蒙特卡洛就是一个很专业的领域了)就完了的,你还有数据量的限制需要用不同的计算机算化来实现,所以学习r必须精通计算机编程(如何存储数据,数据的收敛性质等等)加统计算法,与其学到r的一些皮毛不如学精stata和spss+其他专业软件来得实际和更有效率。
r基本我是学来玩的,就当是一个高级玩具。尝试用一些新的过程研究数据也是一种进步。
我学用Stata已差不多有两年了,感觉它易学易用,运行速度快,且功能强大;但也觉得它在相同变量与观测单位的情况下(如5000个单位,15个变量),好象对内存容量要求要比其它统计软件高,而且它的使用手册非常难求。
最近有部分同学和同事建议我用R,虽然R及其相关材料是免费的,但我觉得R较Stata难以上手,不看任何相关资料,我学Stata时约2个小时后基本可用命令作一些简单的分析,而我用同样多的时间却摸不着R的门道,而且,我认为当前很多人对R的热情主要是因它免费,这种免费能维持多久,或者是为免费来维护R软件而投入的人力、财力、时间与情感能维持多久,我看得观察一段时间。
对统计专业本科生而言,我个人认为Stata似乎比R更合适。
请各位谈谈自己的看法 !!
楼主,这样说,只能说不懂R!不懂R的当然无法了解R的优点了!!我想澄清如下几点:
1、R的好处不仅仅在于其免费,更重要的在于其是开源,灵活,更新速度快,集思广益。而且R有点像是一种网络,用的人越多,贡献的人也越多,这样其的价值就成几何级数上升。我以前用过几乎所有的统计软件,但自从学会R,目前几乎只用R做分析。我相信很多人都有这种情形。
2、很多软件只是一个黑箱子,数据丢进去,结果出来。这样的结果,你会放心吗?而且这样学习,你根本不懂计量、统计背后真正的含义。可以这样说,永远别想真正学会统计思想,你的统计分析只是依样画葫芦,有时画得很像,但不懂神韵!很多时候是”garbage in and garbage out”
3、R初学确实有点难懂,但R的编程思想非常简单,几乎就是写数学公式一样简单,学过C和C++等低层语言就会知道R的编程是如此之简单,R是一种面向对象的高级语言。R入门者其实只要有人稍加指点,很快学会其基本操作!
4、学R应该说是一种趋势,如果和国外搞计量、搞统计的教授接触,应该知道现在大部分的教授都在用R,国内用R还只是一小部分,发展趋势一定是其他软件无法比拟的!
5、不同软件都有其优点和缺点,本人不是贬低其他软件之意!但我想真正学会计量、统计的人来说学R是非常重要的,除非只是想依样画葫芦。
6、R的好处和发展趋势,在未来3-5年,可能会超出任何人的想象!Let’s wait and see!
本人是先用的matlab,没用过R。当时复制一篇关于IPO的论文,计量其实不重要,最重要的是data management,最起码要统计均值、中位数、分组之类的,用matlab做这种几百万、上千万observation的实证分析是非常不便的,指导研究的教授本身都用stata来做实证,我后来便也改用stata。matlab不知是否跟R较像,个人觉得matlab的确做计算很方便,但不是为做统计来设计的。至于矩阵,stata可以用mata,有时替代stata自带的回归分析等操作更为方便。
stata和sas相比,广泛程度应该不如后者,包括在业界(最简单的可以看看Wind数据库,有matlab sas r以及python的接口,但没有stata),一个实际问题就是更大规模数据的处理,因为stata是将数据先读入内存。但正如xingxf所言,提高机器的配置,stata在这方面的弱势并不会显得很大。实际应用中,尤其对于中国人,stata一个显见的好处在于其对于中文字符的支持,而sas是不行的。另,上学时一位牛校的计量大咖给我们讲计量前沿课程时,其实是推荐stata的,原因之一在于在服务器上可以方便的同时运行多个stata程序。。
如果只是做金融经济方面的实证分析,个人感觉stata综合素质还是很高的。最后举个例子,比如说投资,所谓建模可能更多时候是做统计,像Fama、French那样,而非真的有个像BS公式那样的数理模型,所以重在数据处理而非科学计算
转载请注明:数据分析 » Stata与R比较_区别_使用心得分享