用STATA制作频数表及一致性检验
(1)单变量频数分析
黄色字体为自己填写部分,红色字体为可缺省部分。
————————模板————————
tabulate
————————模板————————
If…用来筛选满足条件的数据,可缺省。
Missing是将缺失值也同其他值一样列示,可缺省。
Nolabel使用数值而不使用数值标签,可缺省。
Plot显示相关频数的条形图,可缺省。
例如,列示出女生语文成绩的频数表
Tabulate Chinese if gender==”女”
(2)双变量频数分析、一致性检验
——————————————模板——————————————
tabulate
——————————————模板——————————————
Column给出每一单元格频数占列频数的百分比。
Row给出每一单元格频数占行频数的百分比。
Cell给出每一单元格频数占总频数的百分比。
Chi2给出行列变量相互独立的pearson卡方检验结果,原假设是两变量独立。
比如,列示班级和性别的列联表,给出报告列百分数和行列变量独立性检验卡方值:
Tabulate class gender,column chi2
(3)直接对列联表分析
现在没有原始数据,只有如下现成的列联表,为3000名失业人员性别与文化程度的二维频数表:
性别 |
大专 | 中专 | 高中 | 初中以下 | 合计 |
男 | 40 | 138 | 620 | 1043 | 1841 |
女 | 20 | 72 | 442 | 625 | 1159 |
合计 | 60 | 210 | 1062 | 1668 | 3000 |
现在分析视野人员的性别和文化程度十分有关,语句为:
tabi 40 138 620 1043\20 72 442 625,chi2
结果给出p值为0.062,拒绝原假设,认为失业人员的性别和文化程度有关。
转载请注明:数据分析 » 用STATA制作频数表及一致性检验_stata频数