本站分享:AI、大数据、数据分析师培训认证考试,包括:Python培训Excel培训Matlab培训SPSS培训SAS培训R语言培训Hadoop培训Amos培训Stata培训Eviews培训

spss回归分析中的虚拟变量_spss虚拟变量回归

spss培训 cdadata 12045℃

关键词:spss虚拟变量回归,spss回归分析控制变量,spss多变量回归分析,虚拟变量回归分析

spss作回归分析时如何设置虚拟变量,设置后又应该如何进入分析,如何解释结果呢?好的教程推荐一下吧~~


spss回归分析中的虚拟变量精彩回答:

对于一般线性回归,通常不主张用虚拟变量进行分析。因为要求资料是正态分布。但对于大样本,也可以进行分析SPSS中,可以用RECODE对变量赋值,生成新变量。三楼的解释不正确,或不确切。因为年级是有有序分类资料。虚拟变量通常是对无序分类资料而言。如民族的分类,血型的分类。举例如下:民族变量(X)分为3类:汉,回,其他。哑变量生成为三个变量,其赋值分别为:

X1(汉):0  0

X2(回):1  0

X3(其他):0  1

将这三个变量同时配合模型,可以得到两个回归系数(X2和X3)。X2回归系数的含义是:回族和汉族相比,对应变量的效应。X3回归系数的含义:其他民族与汉族相比,对应变量的效应。当然,虚拟变量的赋值根据需要决定,但赋值相同的变量是对照组。

SPSS中,对于LOGISTIC回归摸型,不需要用RECODE重新生成新变量,而是用CATEGORY选项,对变量配合摸型,其中,可以选最大的赋值做对照组,也可以选最小的赋值做对照组。其统计学含义与线性回归相似。


追问:对于一般线性回归,通常不主张用虚拟变量进行分析。因为要求资料是正态分布。但对于大样本,也可以进行分析。


在回答:您对虚拟变量的理解有误。
虚拟变量个数的选择标准:
1.若定性因素具有m个相互排斥属性(或几个水平),当回归模型有截距项时,只能引入(m-1)个虚拟变量;2.当回归模型无截距项时,则可引入m个虚拟变量;否则,就会陷入“虚拟变量陷阱”。
按照您说的,如果模型中存在截距项,模型中应该引入两个虚拟变量而不是三个,否则会造成虚拟变量之间的多重共线(即通常所说的虚拟变量陷阱);可以引入是否是汉族(1表示是汉族,0表示不是汉族),是否是回族这两个虚拟变量(1表示是回族,0表示不是回族)。

转载请注明:数据分析 » spss回归分析中的虚拟变量_spss虚拟变量回归

喜欢 (2)or分享 (0)