(二)加权法

当观察值个数较多时,可先将各观察值分组归纳成频数表,用加权法求均数。其计算步骤如例18.2。

例18.2 某地1993年随机测量了该地110名20岁健康男大学生的身高(cm),资料如下,试计算其均数。

173.9 173.9 166.9 179.5 171.2 167.8 177.1 174.7 173.8 182.5
173.6 165.8 168.7 173.6 173.7 177.8 180.3 173.1 173.0 172.6
173.6 175.3 178.4 181.5 170.5 176.4 170.8 171.8 180.7 170.7
173.8 164.4 170.0 175.0 177.7 171.4 162.9 179.0 174.9 178.3
174.5 174.3 170.4 173.2 174.5 173.7 173.4 173.9 172.9 177.9
168.3 175.0 172.1 166.9 172.7 172.2 168.0 172.7 172.3 175.2
171.9 168.6 167.6 169.1 166.8 172.0 168.4 166.2 172.8 166.1
173.5 168.6 172.4 175.7 178.8 169.1 175.5 170.3 171.7 164.6
171.2 169.1 170.7 173.6 167.2 170.7 174.7 171.8 167.3 174.8
168.5 178.7 177.3 165.9 174.0 170.2 169.5 172.1 178.2 170.9
171.3 176.1 169.7 177.9 171.1 179.3 183.5 168.5 175.5 175.9

1.编制频数表

(1)求全距(range):找出观察值中的最大值(183.5)和最小值(162.9),它们的差值即全距,常用R表示。本例R=20.6。

(2)定组距和组段:相邻两组的最小值之差称组距,常用i表示,各组距可相等,也可不相等,一般用等距。常取全距的1/10,取整作组距。本例全距的1/10为2.06,取整为2,用等距共划分11个组段。第一组段应包括资料中最小值,最末组段应包括最大值,一般要求组段的起点为较整齐的数。本例第一组段的起点(即下限)取162,其止点(即上限)为第二组段的起点即164,然后每一组距(本例为2)就成为一组段,最末组段应同时写出下限和上限,本例为182~184。

(3)列表划记:按上述的组段序列排列制表,用正字划记法将例18.2中的数据归纳到各组段中,最后清点出频数得频数表,表18-1中的第(2)、(3)栏。

表18-1 110名20岁健康男大学生身高(cm)的频数分布

110名20岁健康男大学生身高(cm)的频数分布

由频数表的频数分布可看出两个重要特征:集中趋势和离散趋势。集中趋势即频数分布向中央部分集中;离散趋势即频数分布由中央到两侧逐渐减少。频数分布可为①对称分布或近似正态分布,即集中位置在正中,两侧频数分布大致对称,如表18-1;②偏态分布,即集中位置偏向一侧,频数分布不对称,若集中位置偏向数值小的一侧,为正偏态分布;若集中位置偏向数值大的一侧,为负偏态分布。不同类型的分布,应采用相应描述指标和统计分析方法。

2.计算公式

110名20岁健康男大学生身高(cm)的频数分布公式(18.2)

式中,k为组段数;f1,f2,……,fk分别为各组段的频数;X1,X2,……,Xk分别为各组段的组中值,组中值为本组段的下限与相邻较大组段的下限相加除以2,如“162-”组段的组中值X1=(162+164)/2=163,余仿此。

3.列计算表(表18-2)计算均数

110名20岁健康男大学生身高(cm)的频数分布

110名20岁健康男大学生身主的均数为172.73(cm)。