用STATA制作频数表及一致性检验

关键词：stata 统计频数、stata 频数分布图

（1）单变量频数分析
黄色字体为自己填写部分，红色字体为可缺省部分。
————————模板————————
tabulate 变量 if var=value,missing nolabel plot
————————模板————————
If…用来筛选满足条件的数据，可缺省。
Missing是将缺失值也同其他值一样列示，可缺省。
Nolabel使用数值而不使用数值标签，可缺省。
Plot显示相关频数的条形图，可缺省。

例如，列示出女生语文成绩的频数表
Tabulate Chinese if gender==”女”

（2）双变量频数分析、一致性检验
——————————————模板——————————————
tabulate 变量1 变量2, chi2 column row cell nolabel missing
——————————————模板——————————————
Column给出每一单元格频数占列频数的百分比。
Row给出每一单元格频数占行频数的百分比。
Cell给出每一单元格频数占总频数的百分比。
Chi2给出行列变量相互独立的pearson卡方检验结果，原假设是两变量独立。

比如，列示班级和性别的列联表，给出报告列百分数和行列变量独立性检验卡方值：
Tabulate class gender,column chi2

（3）直接对列联表分析
现在没有原始数据，只有如下现成的列联表，为3000名失业人员性别与文化程度的二维频数表：

文化程度性别	大专	中专	高中	初中以下	合计
男	40	138	620	1043	1841
女	20	72	442	625	1159
合计	60	210	1062	1668	3000

现在分析视野人员的性别和文化程度十分有关，语句为：
tabi 40 138 620 1043\20 72 442 625,chi2
结果给出p值为0.062，拒绝原假设，认为失业人员的性别和文化程度有关。

转载请注明：数据分析 » 用STATA制作频数表及一致性检验_stata频数