三、算术均数与几何均数的意义及计算方法

(一)算术均数简称均数。设观察了n个变量值X1,X2,……Xa,一般可直接用式(4.6)求样本均数X。

式中∑是总和的符号,n是样本含量即例数。本书在不会引起误解的情况下简写成

X=1/n∑X (4.6)

例4.318-24岁非心脏疾患死亡的男子心脏重量(g)如下,求心重的均数。

350 320 260 380 270 235 285 300 300 200
275 280 290 310 300 280 300 310 310 320

X=1/20(350+320+…+320)=5875/20=293.75g

样本均数是总体均数的估计值,它有两个特性。(1)∑(X-X)=0,(2)∑(X-X)2为最小,前者读者

可自证,后者证明如下:

设:a≠X,则a=X±d d>0

∑(X-a)2=∑(X-X±d)2

∑[(X-X)±d]2

∑(X-X)2±2d∑(X-X)+Nd2

从第一个特性知∑(X-X)=0,因此2d∑(X-X)=0,

∑(X-a)2=∑(X-X)2+Nd2

N是例数,不可能为负,所以Nd2也不会是负数。

∑(X-a)2>∑(X-X)2,∑(X-X)2为最小。

当用电子计算机处理大量实验数据,考虑到有较大舍入误差时,则先取一较近均数的常数c ,然后用式(4.7)计算,可提高均数的精度。

X=C+1/n×(Xi-C)      (4.7)

若每输入一个变量值后都希望得到均数,那么可用式(4.8)

X=Xn-1+1/n×(Xn-Xn-1(4.8)

例4.4 仍用例4.3资料,已算得前19例心重的X10=292.37,又测得X20=320,求X20

X20=292.37+1/20×(320-292.37)=293.75g

若相同的变量值个数较多,或对频数表资料求均数时,可用式(4.9)计算X。

或简写为X=1/n∑fX (4.9)

式中K为不同变量值个数,或频数表中的组段数。Xi为第i个不同的变量值或频数表上的组中值,fi为第i个变量值的频数。

例4.5 计算表4.5菌痢治愈者的平均住院天数。

X=1/157(3×2.5+38×7.5……+1×77.5)=17.9天

式(4.9)中某变量值的频数愈大,则该变量值对X的影响亦愈大。因此,频数又称权数,这样

计算出来的均数又叫加权均数。亦有根据变量值的重要性进行加权,计算加权均数的。

(二)几何均数设n个变量值X1,X2,……,Xa呈对数正态分布,其几何均数G为

式中∏为连乘的符号。当变量值较多时,乘积很大,计算不便,常改用下式计算

(4.10)

(4.11)

式中符号含义同式(4.6)与式(4.9)。

例4.6 求下表中麻疹病毒特异性IgG荧光抗体的平均滴度。

表4.6 52例麻疹患者恢复期血清麻疹病毒

特异性IgG荧光抗体滴度

IgG滴度倒数 例数
40 3
80 22
160 17
320 9
640
1280 1

G=log-1[1/52×(3log40+22log80+…+log1280)]=129.3

麻疹患者恢复期血清麻疹病毒特异性IgG荧光抗体的平均滴度为1:129。

式(4.10)包含三个步骤,(1)令Xi=logXi,则式(4.10)可写成;(2)1/n∑Xi

即对数数值的均数X;(3)将X取反对数即得几何均数1og-1X=G。这里不难理解,若将这种资料作对数变换后,即可用式(4.6)至式(4.9)的各式计算均数,得到结果后再取反对数即得几何均数。读者可自已验证。