spss中设置虚拟变量的具体过程
关键词:spss虚拟变量回归,spss虚拟变量设置,spss虚拟变量回归分析,spss如何设置虚拟变量,spss怎么设置虚拟变量
设置虚拟变量我是会做的,但是这里会有新问题。当使用spss软件做多元线性回归分析时,会纳入多个自变量,假如有5个自变量,其中一个是血型,其他自变量都是连续变量,那么设置自变量时,血型共有三个虚拟变量,加上其他四个,共有7个自变量需要纳入到回归方程中,请问这样做对吗?有的书上提到,血型的三个虚拟变量需要同时进同时出,如何办到?如果我以血型A为参照,是否就是说,血型A不设置虚拟变量而以其它三个血型设置三个虚拟变量,那么,这样做以后,如果血型B的OR值为1.2,可以这样解释,即血型B的患者比血型A的患者患所研究疾病的可能性大20%?
spss虚拟变量设置問題1:那么设置自变量时,血型共有三个虚拟变量,加上其他四个,共有7个自变量需要纳入到回归方程中,请问这样做对吗?
沒錯,迴歸方程式是這樣的
Y=a+b1X1+b2X2+b3X3+b4X4+b5Type1+ b6Type2+ b7Type3
spss虚拟变量设置問題2:有的书上提到,血型的三个虚拟变量需要同时进同时出,如何办到?
如果讲的设置虚拟变量我是会做的,那麼你只要接著執行步驟3到步驟6
步驟1:輸入資料。類別資料以原始型態輸入。
步驟2:虛擬化處理類別變項:
轉換(transform)→重新編碼(Record into different variables)→成不同變數→
舊值與新值→指令設定新變項的轉換條件,。總共要做K-1次(你要做3次)
spss虚拟变量设置步驟3:選取統計→分析迴歸方法→線性
spss虚拟变量设置步驟4:選擇依變項
spss虚拟变量设置步驟5:選擇Type1,Type2, Type3虛擬變項以及X1,X2,X3,X4移入自變項清單中
spss虚拟变量设置步驟6:選擇強迫進入變數法,按確定執行。
spss虚拟变量设置問題3:如果我以血型A为参照,是否就是说,血型A不设置虚拟变量而以其它三个血型设置三个虚拟变量,那么,这样做以后,如果血型B的OR值为1.2,可以这样解释,即血型B的患者比血型A的患者患所研究疾病的可能性大20%?
『血型A不设置虚拟变量』????
『如果我以血型A为参照』,按照邱皓政(2007)的作法,改寫如下;
如果間斷變項有K個水準,則需要K-1個虛擬變項【此例為5-1=4】
Blood Type (原變項) |
Type 1 (虛擬變項1) |
Type 2 (虛擬變項2) |
Type 3 (虛擬變項3) |
說明 1,血型A 2,血型B 3,血型O, 4,血型AB |
1 | 0 | 0 | 0 | 代表是血型A,參照組 |
1 | 0 | 0 | 0 | 代表是血型A,參照組 |
2 | 1 | 0 | 0 | 代表是血型B |
2 | 1 | 0 | 0 | 代表是血型B |
3 | 0 | 1 | 0 | 代表是血型O |
3 | 0 | 1 | 0 | 代表是血型O |
4 | 0 | 0 | 1 | 代表是血型AB |
4 | 0 | 0 | 1 | 代表是血型AB |
上述血型虛擬變項
Type1表示『血型B組與血型A組的對比』
Type2表示『血型O組與血型A組的對比』
Type 3表示『血型AB組與血型A組的對比』
至於血型A組扮演參照組的角色
當你按照問題2所描述的步驟3到步驟6執行完畢之後,從SPSS提供的結果中:
血型B組與血型A組的對比
血型O組與血型A組的對比
血型AB組與血型A組的對比
會有分別對應的標準化Beta係數以及t值以及p值。
Beta係數的正負值會說明各血型組與A血型的差異
例如Beta—BA為正,則顯示就因變數而言,B血型高於A血型B
至於顯著性則看p值。
SPSS的多元回归,并不是一次把所有变量全进入方程,本质上是逐一分析的。另外,直接做线性回归的话,我认为不甚合理,应先做散点图拟合回归,采用Lowess
线选项对所有数据进行整体拟合,即局部加权回归散点图修匀法,以减少主观倾向,拟合结果表现出良好的线性关系后,才开始做回归分析。
想补充以下内容. 对于logistic回归模型中的多分类自变量,需要虚拟变量(哑变量)来分析,以期对结果有更正确合理的解释. 在以前的软件中,需要用楼上的方法, 由一个分类变量, 生成多个变量进行分析(变量数为分类数减去1). 若进行多个多分类变量分析, 很浪费时间.
但现在的软件包软件通常不用这种方法. 以下方法比较常用. SPSS中, 对logistic回归分析, 选择应变量放入应变量的选择框, 再选择自变量, 放入自变量的选择框, 然后,选择Categorical按扭, 将自变量中多分类的变量放入Categorical Covariates框, 其中, 有contrast indicator, reference category, 显示可选last或first. 如选first, click “continue”即可. 此时, 已将多分类变量设置为虚拟变量, 且以第一个分类为参照(如第一年龄组), 若选last, 则以最后的分类为参照(如最后年龄组). 然后进行分析即可. 若有多个多分类变量, 可采用同样的方法进行设置.
转载请注明:数据分析 » spss中设置虚拟变量的具体过程_spss虚拟变量设置