如何让stata 计算出变量的p20 p80 这样的百分位数-数据分析

如何让stata 计算出变量的p20 p80 这样的百分位数——stata 百分位数

sum varname, detail
或者
tabstat varname, s(p1 p5 p10 p25 p50 p75 p90 p95 p99)
只能在输出结果中得到给定的百分位数的统计值
如果想计算出某个变量或某些变量的 p15 p20 p80 p85 这样非标准化的百分位数统计值, 该如何操作呢?

解答；

xtile varname2=varname, nq(100)
sort varname2
duplicates list varname2 varname

多谢回复和指教, 我去试试看!
请问: 如下注释正确吗?
实话实说, 虽然我参考帮助文件对您给出的每条命令的含义大体弄明白了, 但是您这几条命令的思路还是没有琢磨出来, 可否请您再给具体解释一下, 多谢啦!

xtile varname2=varname, nq(100) /* 创建名为 varname2 的新变量, 按照百分位数对名为 varname 的变量进行分类,
nq(100) 选项表示百分位数的个数是100个, 即每1%作为一个分段点.
*/
sort varname2 // 将数据集中的obs 按照新变量 varname2 进行排序
duplicates list varname2 varname // 列出变量 varname2 和变量 varname 中重复的 obs

基本就是你理解的，最后一条命令主要考虑样本数大于100情况下，按百分比从低到高排列样本

_pctile length, nq(10)

转载请注明：数据分析 » 如何让stata 计算出变量的p20 p80 这样的百分位数