列联表篇之二:四格表的分析

在列联表中,二维表是最基础的一类表,在二维表中,四格表是最基础的一类表。

四格表的基本形式在《经典比较篇之十一:小样本的比率比较怎么做中已经介绍,这里在把表贴出来。

这个公式不再需要计算期望频数了,也不难记,放在这里大家参考着用。

3.卡方检验的校正公式

四格表中的数据不是连续的,因此计算出的卡方值也不是连续的,但

特别的,对于四格表

针对配对的四格表,有两种分析方法可以选择,即Mcnemar检验和Kappa检验。前者关注的是差异,后者关注的是一致性。

1.Mcnemar检验

ad代表结果的一致性,bc代表结果产生的变化。在Mcnemar检验中,原假设是对样本所施加的处理没有显著效应,也就是发生不同方向变化的可能性是一样的,有多少“-+”,就应该有多少“+-”,即b=c,如果两者差异很大,则说明两种不同的处理有显著的差异,或一种处理的前后状态存在显著差异。

从另一个角度来说,Mcnemar的原假设是边缘概率相等,即

以此建立的检验统计量为:

例1:某公司计划引入六西格玛管理,为此选取100员工,在实施六西格玛战略宣讲前后,就引入六西格玛的必要性进行调查,调查结果如下表。问宣讲前后员工的态度有变化吗/p>

α=0.05时,自由度为1的卡方检验临界值为3.84,因此我们拒绝原假设,认为宣讲前后员工的态度有显著变化。

根据孙振球教授的说法,当b+c

其中n=b+c。单比率检验在《经典比较篇之十一:小样本的比率比较怎么做中有介绍,这里不再赘述。

Mcnemar检验与ad两个格子的值无关,当这两个值很大时,即使检验结果显著,其实际意义也不是很大。因此我们需要考虑一致性的问题,这就需要Kappa检验。

2. Kappa检验

看到Kappa检验,熟悉测量系统分析的人马上就会想起来,在属性数据测量系统分析中,大量采用Kappa值来度量测量结果的一致性。在马逢时教授《六西格玛管理统计指南》p.399-402对此有详细介绍。

Kappa检验由Cohen于1960年提出,因此又称为Cohen’sKappa。它考虑的是实际的结果是不是瞎猜的结果,比如一个新员工对检验标准不了解,但也能蒙对一部分。而Kappa值就是对此的衡量,其公式为:

为实际一致的比率,而

根据上面的公式计算出Kappa值为0.2,说明两种检验的结果一致性很差。

可能有人会问,这个分析并没有告诉我们哪一种更好。为了确认哪一种方法更好,可以加入标准这个因素,即由专家对样品进行仔细鉴别,确定标准的结果,然后再将两种检验方法的结果分别与此对比。其中的一张表是这样的:

完全一致的有19+18+18+17=72,计算得P0=72/80=0.9。

Pe=(21×20+21×20+20×20+18×20)/80^2=0.25。

由此计算出Kappa=(0.9-0.25)/(1-0.25)=0.867。这个值比较大,说明学生的答案不是瞎蒙的,是真的学会了。

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2018年3月18日
下一篇 2018年3月18日

相关推荐