Logit模型与logistic模型的联系与区别_logit与logistic
关于logit和logistic模型的区别貌似是个老生常谈的问题,学习之后稍微整理一下:
(1)二者的根本区别在于广义化线性模型中的联系函数的形式。logit采用对数形式
log(a),logistic形式为log(a/1-a)。
(2)应用上,普通logistic的响应变量是二元的,多元logistic的因变量可为多元。logit的响应变量可以是多元的。
(3)统计软件spss中:logit属于对数线性模型,分析结果主要为因变量和自变量之间的关系,可以细化到各分类因变量与分类自变量之间;logistic属于回归分析,分析结果为估计出自变量参数。regression下有Binary logistic regression和 Multinomial logistic regression 。因变量只取0和1时用的就是Binary logistic regression。而Multinomial logistic regression 分为多分类无序因变量和多分类有序因变量的logistic回归。即因变量多于两个的。
(4)当因变量是多类的,可以采用logistic,也可以用logit,计算结果并无多少差别。 看到前面几个有关Logit回归的问题,给大家做点贡献吧。
1,对于(0,1)的情况,SAS里面默认0在先。要么你编码的时候讲事件编为0,要么在回归的时候加上Descending的选项。
2,结果一般用两张表。第一张就像一般的OLS回归,汇报系数的大小和符号(是的,Logit系数大小没有意义,符号表示影响的方向),系数是否为0的统计值,样本量(这个很重要,我看所有的文章里都有),最后就是模型的Fit。
3,系数是否为零的检验,可以直接汇报SAS结果里面的P值,也可以根据开方值计算通常用的T值,你知道,开方的平方根就是近似的T值。注意,不要汇报开方,看起来很傻的。
4,拟合度方面,现在流行报告一个PseudoR2(有人叫假R2)。比较流行的就是McFadden1974的方法。很简单,用Log-Likelihood(SAS结果的-2 Log L)的Intercept Only除于InterceptAndCovariates再减去1就是假R2了。 第一章表就结束了。因为Logit不是线性模型,系数大小没有意义,要解释每个变量到底在多大程度上影响自变量,就有了第二张表,就是要汇报概率相对于解释变量变化的变化,也就是DependentVar的Derivative,下次再说。
(1)二者的根本区别在于广义化线性模型中的联系函数的形式。logit采用对数形式log(a),logistic形式为log(a/1-a)。
(2)应用上,普通logistic的响应变量是二元的,多元logistic的因变量可为多元。logit的响应变量可以是多元的。
(3)统计软件spss中:logit属于对数线性模型,分析结果主要为因变量和自变量之间的关系,可以细化到各分类因变量与分类自变量之间;logistic属于回归分析,分析结果为估计出自变量参数。regression下有Binary logistic regression和 Multinomial logistic regression 。因变量只取0和1时用的就是Binary logistic regression
。而Multinomial logistic regression 分为多分类无序因变量和多分类有序因变量的logistic回归。即因变量多于两个的。
(4)当因变量是多类的,可以采用logistic,也可以用logit,计算结果并无多少差别。