二、多个率或多个构成比的比较

(一)2×K表的专用公式,前面已讨论了,两个率的比较用四格表专用公式计算χ2值较为简便。如果是多个率比较,就要列成2×K表。这里的K暂为所比较的组数,2为每个组内所划分的类型数。求χ2值时本可用基本公式计算,但以用下列专用公式为便:

(3.10) (3.11)

表3.9 2×K表形式之一

a1
a2

b1
b2

n1
n2

∑ai ∑bi N

公式中符号的意义参阅表3.9,以上两个公式的计算结果是完全一样的。

例3.3 某地观察磺胺三甲氧吡嗪加增效剂(吡嗪磺合剂)预防疟疾复发的效果,用已知有抗疟疾复发效果的乙胺嘧啶和不投药组作对照,比较三组的疟疾复发率,资料如表3.10,问三组复发率有无显著差别?

表3.10 三个组的疟疾复发率

组 别 观察例数 复发例数 复发率(%)
吡嗪磺合剂
乙胺嘧啶
对 照
1996
473
484
76
27
53
3.81
5.71
10.95
合 计 2953 156 5.28

χ2检验步骤如下:

1.将表3.10资料写成2×K表形式,见表3.11。注意:这里必须把各组的观察例数分为复发和未复发两部分,这样表3.10就为写成2×3表。

表3.11 三个组疟疾复发率的比较

复发 未复发 合 计
吡嗪磺合剂 76 1920 1996
乙胺嘧啶 27 446 473
对 照 53 431 484
合 计 156 2797 2953

2.H:三个总体复发率相同

H:三个总体复发率不全相同

α=0.05

3.求χ2值 将表3.11的数值代入式(3.10)(因为在表3.11中,各组的a值较小,计算较方便)得:

4.求自由度,确定P值,作结论

ν=(K-1)(2-1)=(3-1)(2-1)=2,查χ2值表得χ20.01(2)=9.21,本例χ2=39.92>χ20.01(2),P<0.01,在α=0.05的水准处拒绝H,接受H1,即三个组的复发率有显著差别。

本例的结论是三个组的复发率有显著差别,因此,还需进一步说明三组中那两组有差别,可用四格表对每两个率进行假设检验。本例的检验结果是:吡嗪磺合剂与对照组比(P<0.01),乙胺嘧啶组与对照组比(P<0.01),而吡嗪磺合剂与乙胺嘧啶比(P>0.05),说明吡嗪磺合剂有预防疟疾复发的作用,其效果不低于乙胺嘧啶。

本例2×K表的2是指得发、未复发两项,K为比较的组数,K=3。如果比较组数只有2,而构成每组的项数则多于2,如甲状腺肿的型别构成可分为弥漫型、结节型、混合型三种。这类资料亦同样可用2×K表专用公式进行检验。这时把2作为比较组数,K作为项数,检验方法同上,表3.12是2×K表的另一种形式。

表3.12 2×K表形式之二

a1 a2 …… ∑ai∑bi
b1 b2 ……
n1 n2 …… N

例3.4,为研究不同地域甲状腺型别的构成有无显著差别,某省对两个县的居民进行甲状腺肿调查,得资料如表3.13,问甲乙两县各型甲状腺肿患者构成比有无显著判别?

表3.13 某省甲乙两县甲状腺肿患者型别构成比较

县名 弥漫型 结节型 混合型 合计
甲县 486 2 4 492
乙县 133 260 51 444
合计 619 262 55 936

检验步骤如下:

1.H:两总体甲状腺肿型别构成相同

H1两总体甲状腺肿型别构成不同

α=0.05

2.求χ2值, 将表3.13中的数值代入式3.10得:

3.求自由度,确定P值,作结论。

ν=(3-1)(2-1)=2,查χ2值表得χ20.01(2)=9.21,本例,χ2=494.36,P<0.01,在α=0.05水准处拒绝H,接受H1,甲、乙两县甲状腺肿型别构成有差别(P<0.01)。甲县以弥漫型为主,而乙县结节型较多,地域与患者的型别构成具有一定的关系。

此类资料经χ2检验作结论,如果不显著,说明两组资料的构成比来自同一总体,没有显著差别。如果结论显著,说明两组的构成比来自不同总体,差别有显著性。同时要指出两组构成的主要区别。

(二)R×C表的通用公式当资料的行数和列数都超过2时称R×C表。对此种资料作假设检验时,可用基本公式(3.5),但运算较繁,如果用R×C表的通用公式计算χ2值,较为简便。

(3.12)

式中,Aij为i行第j列的实际频数,ni为第i行的合计数,nj为第j行列的合计数,N为总频数。

这个公式也系由基本公式(3.5)推导出来,式(3.12)也可用以求四格表、2×K表资料的X2值,故称通用公式,用此公式不需计算理论频数,与基本公式(3.5)相比,较为简便。

例3.5某院肝胆外科在手术中观察了胆结石的部位与类型得资料如表3.14,试分析两者间有无关系存在?

表3.14 胆结石类型与部位的关系

结石部位 总例数 例 数 百 分 比
胆固醇结石 胆红素结石 其它 胆固醇结石 胆红素结石 其它
胆囊 118 70 16 32 59.3 13.6 27.1
肝外胆管 75 12 39 24 16.0 52.0 32.0
肝内胆管 29 2 20 7 6.9 69.0 24.1
合计 222 84 75 63 37.8 33.8 28.4

检验步骤如下:

1.将表3.14资料写成R×C表形式,见表3.15.

表3.15 胆结石类型与部位的关系

结石部位 结 构 类 型
胆固醇结石 胆红素结石 其它 合计
胆囊 70 16 32 118
肝外胆管 12 39 24 75
肝内胆管 2 20 7 29
合计 84 75 63 222

2.H:胆结石的类型与部位没有关系

H1:胆结石的类型与部位有关系

α=0.01

3.求χ2值 将表3.15数值代入式(3.12)得:

4.求自由度,确定P值,作结论。

ν=(3-1)(3-1)=4,查χ2值表得χ20.01(4)=13.28,本例χ2=64.06<χ20.01。在α=0.01水准处拒绝H,接受H1,胆结石类型与部位有显著关系存在(P<0.01),胆囊内以胆固醇结石居多,肝内、外胆管以胆红素结石为主。