量纲对回归结果的影响_关于SPSS回归分析与数据预处理的心得体会,句句都是肺腑之言…

原标题:关于SPSS回归分析与数据预处理的心得体会,句句都是肺腑之言

量纲对回归结果的影响_关于SPSS回归分析与数据预处理的心得体会,句句都是肺腑之言...

今天小兵就先为大家分享一篇论坛网友SPSS数据分析的心得体会,原作者:xddlovejiao1314,谢谢他的宝贵经验分享。

关于SPSS数据预处理

拿到一份数据,或者在看到国内外某个学者的文章有想法而自己手里的数据刚好符合这个想法可以做时,在整理好数据后不要急于建模。一定要对数据做缺失值处理、异常值处理。在数据预处理的基础上再进一步建模,否则可能得到错误的结果。

心得1:缺失值的处理

我个人有几个看法:

数据样本量足够大,在删除缺失值样本的情况下不影响估计总体情况,可考虑删除缺失值;

数据样本量本身不大的情况下,可从以下两点考虑:

1是采用缺失值替换,SPSS中具体操作为 “转换” 菜单下的 “替换缺失值” 功能,里面有5种替换的方法。若数据样本量不大,同质性比较强,可考虑总体均值替换方法,如数据来自不同的总体(如我做农户调研不同村的数据),可考虑以一个小总体的均值作为替换(如我以一个村的均值替换缺失值)。

2是根据原始问卷结合客观实际自行推断估计一个缺失值的样本值,或者以一个类似家庭的值补充缺失值。

量纲对回归结果的影响_关于SPSS回归分析与数据预处理的心得体会,句句都是肺腑之言...

心得2:不建议采用后向步进法处理变量多重共线性

记得张文彤老师说过他有个同学做过一个研究,即采用后向步进法剔除变量的方式去做回归,得到的结果犯错的几率比较大。张老师也不建议用这个方法处理多重共线性。处理多重共线性比较好的方法是做主成分回归。

心得3:用未标准化的回归系数好,还是用标准化后的回归系数好

我个人觉得这个问题仁者见仁智者见智,要看想表达什么。具体而言,如果想表达在其它条件不变的情况下,自变量X每变化1个单位,因变量变化多少个单位,这种情况用未标准化回归系数就好;如果想比较各个自变量对因变量影响的相对大小,即判断相对而言,哪个变量对因变量影响更大。这时需要消除量纲的影响,看标准化后的回归系数。

心得4:稳健性检验

我做的是 无序多分类logistic回归模型。因变量分了5类,有一类个数比较多,达到300多,有1-2类个案比较少,只有30左右。专家提到了要做稳健性检验。这个用stata软件编程加一个robust即可解决问题。不知道在SPSS里面怎么做。欢迎知道的朋友一起讨论下。我个人认为这是一个好问题的。不做稳健性检验模型可能受一些极端值的影响,结果不稳定。可能本来显著的变量剔除1-2个样本后就变得不显著了。所以做回归分析稳健性检验也比较重要。

量纲对回归结果的影响_关于SPSS回归分析与数据预处理的心得体会,句句都是肺腑之言...

通知:网易云课堂《自学SPSS:数据分析12大经典案例》视频课程正在做年底回馈活动,感兴趣可以点【阅读原文】前往关注。返回搜狐,查看更多

责任编辑:

相关资源:本草纲目下载李时珍本草纲目查询软件版v1.4_本草纲目pdf彩图版…

来源:weixin_39955423

声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2020年11月19日
下一篇 2020年11月19日

相关推荐