SPSS——描述性统计分析——列联表

什么是列联表

列联表又称交互分类表,所谓交互分类,是指同时依据两个变量的值,将所研究的个案分类。交互分类的目的是将两变量分组,然后比较各组的分布状况,以寻找变量间的关系。

这里是按两个变量交叉分类的,该列联表称为两维列联表,若按3个变量交叉分类,所得的列联表称为3维列联表,依次类推。3维及以上的列联表通常称为“多维列联表”或“高维列联表”,而一维列联表就是频数分布表。

列联表的结构

这里写图片描述

r * c 列联表

这里写图片描述

百分比分布

这里写图片描述

这里写图片描述

相关系数

ψ相关系数

这里写图片描述

这里写图片描述

皮尔逊定义的列联系数

这里写图片描述

Fisher精确检验

卡方统计量是近似的,而Fisher精确检验使用的是超几何分布。

这里写图片描述

相对危险度(Relative Risk, RR)

参考下面的SPSS实例

优势比(Odds Ratio, OR)

参考下面的SPSS实例

Kappa一致性检验

在数据分析中,比较两种预测方法预测结果的一致性用到Kappa检验。

配对χ2检验

通过Kappa检验,解决了两种测量间究竟有无关联的问题,但是通过列联表的观察,发现两位顾问的评价是否不太一致,这种假设又如何来加以分析呢

McNemar配对χ2检验 就是经典的配对检验,专门用于解决这类问题。

分层χ2检验

分层χ2检验是把研究对象分解成不同层次,按各层对象来进行行变量与列变量的独立性研究。Statistics中Cochran’s and Mantel-Haenszel statistics会自动给出结果。

分层χ2检验是一种很好的控制其他因素的方法,使分析者能得到更准确的结果。如果数据量足够大 ,还可以引入更多的分层因素加以控制。 但是,和SAS中的CMH χ2不同,SPSS提供的CMH χ2检验只能进行二分类变量的检验,而不能进行多分类变量的检验。

检验比较

  • χ2检验
    假设观察频数与期望频数没有差别,而统计量χ2值表示二者间的偏离程度。
    卡方检验方法的适用条件

    这里写图片描述

    统计量

    这里写图片描述
    列联表分析表明,并没有太多人对杂志的邮件做出回应,但是其中订阅人占了较大比例。
  • 卡方检验

    这里写图片描述

    对于报纸订阅者而言,邮件响应的相对危险度是其回应概率与非报纸订阅者的回应概率的比值,其估计值是(380/2768) / (299/3632) = 13.7% / 8.2%=1.668,表明报纸订阅者对邮件的响应概率是非报纸订阅者的1.668倍。 或者说报纸订阅者对邮件的无响应的概率是非报纸订阅者的0.94倍。

    而优势比即一个事件的Odds Ratio是它发生的概率除以不发生的概率。

    这里写图片描述

    统计量

    这里写图片描述
  • Kappa一致性检验

    这里写图片描述

    Kappa一致性检验对两种方法结果的一致程度进行评价,而配对χ2检验则用于分析两种分类方法的分类结果是否有差异。

    此处原假设:两顾问的评价结果无差别,而p=0.072>0.05,故接受原假设,认为基本上相同

实例三:分层卡方检验

数据集(cmh.sav)

某零售连锁店对3家分店的客户满意度进行了调查,数据见cmh.sav,其中一项指标是在购物时是否经常向店员寻求帮助,现希望分析寻求帮助与性别有无联系。

统计结果

  • 未分层的卡方检验

    这里写图片描述

    可以看到分店的卡方检验并无显著性(p > 0.05),说明每个分店的寻求帮助与性别之间没有强关联。

    但是,由于分层后样本量大大减小,这究竟是因为检验效能不足导致的无差异,还是真的无差异

    为此可以使用Cochran’s and Mantel-Haenszel χ2检验来分析。这种方法可以在考虑了分层因素的影响后给出检验结果。

  • Cochran’s and Mantel-Haenszel χ2检验

    这里写图片描述

    调整了分层因素作用后的综合OR值=0.636,即去除了不同分店的混杂效应后,和女性相比,男性顾客寻求帮助的优势比为0.636,或者说更不容易寻求帮助。

来源:会编程的大白熊

声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2016年6月4日
下一篇 2016年6月4日

相关推荐