请问用SPSS做logistic回归时 多分类变量怎么设置哑变量

分自变量为有序多分类和无序多分类的情况
2024-11-18 16:32:01
推荐回答(3个)
回答1:

在SPSS中将多分类变量设置为哑变量比较麻烦,其中的一种方法就是将该多分类变量转换成N-1列的哑变量,举例来说,原多分类变量有四个取值(A/B/C/D),这时需要设置三列哑变量,比如D2,D3,D4
用如果变量值是B,则D2=1,否则取0,如果是C,则用D3=1,否则取0,如果是D,则D4=1,否则取0
D2 D3 D4
1 0 0——》B
0 1 0——》C
1 0 0——》B
0 0 1——》D
0 0 0——》A

注意,4分类只能设置3个哑变量,否则会出现虚拟变量陷阱问题,另外还需要考虑设置很多虚拟变量会造成自由度和共线性问题。

回答2:

哑变量问题可以参考SPSSAU帮助手册中的说明:哑变量说明-SPSSAU

也可以直接使用在线SPSS「SPSSAU」的生成变量功能,一键设置哑变量。然后分析时少放入一个作为参考项,其他放入自变量框即可。

回答3:

你的问题中不知道有没有错别字啊 读起来总是那么别扭
你是不是说自变量中很多是定类和定序的变量啊,不符合做回归的数据特征啊。这样的话,看情况可以转换过来,比如年龄可以有定类的分组转为定比的数据,要是有的不能转换的,你还要继续做回归分析的话,你可以用虚拟变量来做回归。
不知道你是不是上述这个意思