spss中设置虚拟变量的具体过程_spss虚拟变量设置-数据分析

spss中设置虚拟变量的具体过程

关键词：spss虚拟变量回归,spss虚拟变量设置,spss虚拟变量回归分析,spss如何设置虚拟变量,spss怎么设置虚拟变量

设置虚拟变量我是会做的，但是这里会有新问题。当使用spss软件做多元线性回归分析时，会纳入多个自变量，假如有5个自变量，其中一个是血型，其他自变量都是连续变量，那么设置自变量时，血型共有三个虚拟变量，加上其他四个，共有7个自变量需要纳入到回归方程中，请问这样做对吗？有的书上提到，血型的三个虚拟变量需要同时进同时出，如何办到？如果我以血型A为参照，是否就是说，血型A不设置虚拟变量而以其它三个血型设置三个虚拟变量，那么，这样做以后，如果血型B的OR值为1.2，可以这样解释，即血型B的患者比血型A的患者患所研究疾病的可能性大20%？

spss虚拟变量设置問題1：那么设置自变量时，血型共有三个虚拟变量，加上其他四个，共有7个自变量需要纳入到回归方程中，请问这样做对吗？
沒錯，迴歸方程式是這樣的
Y＝a+b1X1+b2X2+b3X3+b4X4+b5Type1+ b6Type2+ b7Type3
spss虚拟变量设置問題2：有的书上提到，血型的三个虚拟变量需要同时进同时出，如何办到？
如果讲的设置虚拟变量我是会做的，那麼你只要接著執行步驟3到步驟6
步驟1：輸入資料。類別資料以原始型態輸入。
步驟2：虛擬化處理類別變項：
轉換(transform)→重新編碼(Record into different variables)→成不同變數→
舊值與新值→指令設定新變項的轉換條件，。總共要做K-1次（你要做3次）
spss虚拟变量设置步驟3：選取統計→分析迴歸方法→線性
spss虚拟变量设置步驟4：選擇依變項
spss虚拟变量设置步驟5：選擇Type1,Type2, Type3虛擬變項以及X1,X2,X3,X4移入自變項清單中
spss虚拟变量设置步驟6：選擇強迫進入變數法，按確定執行。

spss虚拟变量设置問題3：如果我以血型A为参照，是否就是说，血型A不设置虚拟变量而以其它三个血型设置三个虚拟变量，那么，这样做以后，如果血型B的OR值为1.2，可以这样解释，即血型B的患者比血型A的患者患所研究疾病的可能性大20%？
『血型A不设置虚拟变量』？？？？
『如果我以血型A为参照』，按照邱皓政（2007）的作法，改寫如下；
如果間斷變項有K個水準，則需要K-1個虛擬變項【此例為5-1=4】

Blood Type (原變項)	Type 1 (虛擬變項1)	Type 2 (虛擬變項2)	Type 3 (虛擬變項3)	說明 1，血型A 2，血型B 3，血型O， 4，血型AB
1	0	0	0	代表是血型A，參照組
1	0	0	0	代表是血型A，參照組
2	1	0	0	代表是血型B
2	1	0	0	代表是血型B
3	0	1	0	代表是血型O
3	0	1	0	代表是血型O
4	0	0	1	代表是血型AB
4	0	0	1	代表是血型AB

上述血型虛擬變項
Type1表示『血型B組與血型A組的對比』
Type2表示『血型O組與血型A組的對比』
Type 3表示『血型AB組與血型A組的對比』
至於血型A組扮演參照組的角色
當你按照問題2所描述的步驟3到步驟6執行完畢之後，從SPSS提供的結果中：
血型B組與血型A組的對比
血型O組與血型A組的對比
血型AB組與血型A組的對比
會有分別對應的標準化Beta係數以及t值以及p值。
Beta係數的正負值會說明各血型組與A血型的差異
例如Beta—BA為正，則顯示就因變數而言，B血型高於A血型B
至於顯著性則看p值。

SPSS的多元回归，并不是一次把所有变量全进入方程，本质上是逐一分析的。另外，直接做线性回归的话，我认为不甚合理，应先做散点图拟合回归，采用Lowess

线选项对所有数据进行整体拟合，即局部加权回归散点图修匀法，以减少主观倾向，拟合结果表现出良好的线性关系后，才开始做回归分析。

想补充以下内容. 对于logistic回归模型中的多分类自变量,需要虚拟变量(哑变量)来分析,以期对结果有更正确合理的解释. 在以前的软件中,需要用楼上的方法, 由一个分类变量, 生成多个变量进行分析(变量数为分类数减去1). 若进行多个多分类变量分析, 很浪费时间.

但现在的软件包软件通常不用这种方法. 以下方法比较常用. SPSS中, 对logistic回归分析, 选择应变量放入应变量的选择框, 再选择自变量, 放入自变量的选择框, 然后,选择Categorical按扭, 将自变量中多分类的变量放入Categorical Covariates框, 其中, 有contrast indicator, reference category, 显示可选last或first. 如选first, click “continue”即可. 此时, 已将多分类变量设置为虚拟变量, 且以第一个分类为参照(如第一年龄组), 若选last, 则以最后的分类为参照(如最后年龄组). 然后进行分析即可. 若有多个多分类变量, 可采用同样的方法进行设置.

转载请注明：数据分析 » spss中设置虚拟变量的具体过程_spss虚拟变量设置