如何让stata 计算出变量的p20 p80 这样的百分位数——stata 百分位数
sum varname, detail
或者
tabstat varname, s(p1 p5 p10 p25 p50 p75 p90 p95 p99)
只能在输出结果中得到给定的 百分位数的统计值
如果想计算出某个变量或某些变量的 p15 p20 p80 p85 这样非标准化的百分位数统计值, 该如何操作呢?
解答;
xtile varname2=varname, nq(100) sort varname2 duplicates list varname2 varname |
多谢回复和指教, 我去试试看!
请问: 如下注释正确吗?
实话实说, 虽然我参考帮助文件对您给出的每条命令的含义大体弄明白了, 但是您这几条命令的思路还是没有琢磨出来, 可否请您再给具体解释一下, 多谢啦!
xtile varname2=varname, nq(100) /* 创建名为 varname2 的新变量, 按照百分位数对 名为 varname 的变量进行分类,
nq(100) 选项 表示 百分位数的个数是100个, 即 每1%作为一个分段点.
*/
sort varname2 // 将数据集中的obs 按照 新变量 varname2 进行排序
duplicates list varname2 varname // 列出 变量 varname2 和 变量 varname 中 重复的 obs
基本就是你理解的,最后一条命令主要考虑样本数大于100情况下,按百分比从低到高排列样本
_pctile length, nq(10) |
转载请注明:数据分析 » 如何让stata 计算出变量的p20 p80 这样的百分位数