2.6 随机误差的统计分布

2.6.1 频数分布

在2.4节中谈到,随机误差是具有统计规律的,即随机误差服从一定的统计分布规律。为了说明这个问题,先看一个例子。

某学校一个班有39名学生,在相同条件下用滴定分析法测定工业纯碱中Na2CO3的质量分数得113个数据,如表2-1所示。

由表2-1可以看出,这些数据有高有低,似乎杂乱无章,但仔细分析,这些数据是有统计规律的。先将表2-1中的数据按从小到大排列,方法是:在Excel的一个工作表的一个列中输入表2-1中的全部数据,然后选中全部数据,单击“升序”排序按钮,即得排序结果。为了观察方便,再把这些结果通过“复制”“粘贴”整理成表2-2。

表2.1 工业纯碱度分析数据(%)表Ⅰ

表2.2 工业纯碱度分析数据(%)表Ⅱ

续表

由表2-2可以看出,所有数据都处于73.30%~77.00%范围内,多数数据位于74.70%~75.10%之间,其他范围的数据较少,小于74.00%或大于75.50%的数据就更少。再进一步分析,将这113个数据分成10组。每个组中数据出现的个数称为频数,用ni表示。表2-3列出了这些数据,根据表2-3中的数据,绘出如图2-1所示的频数分布直方图。

表2-3 频数分布表

图2-1 频数分布直方图

由图2-1可见,众多的数据有明显集中的趋势;在这批测定数据的平均值74.840处左右,频数取最大值38;离平均值越近的数出现的次数就越多,而离平均值较远的数则出现的次数很少。可以设想,实验数据越多,分组越细,则频数直方图就趋近于一条平滑的曲线。这条曲线就是正态分布曲线。