二、常用的抽样方法

抽样方法有概率抽样和非概率抽样两类。概率抽样(probability sampling)又叫随机抽样,是指在总体中,每个研究对象都有被抽中的可能,任何一个对象被抽中的概率是已知的或可计算的。概率抽样方法有统计的理论依据,可计算抽样误差,能客观地评价调查结果的精度,在抽样设计时还能对调查误差加以控制,是最常用的抽样调查方法。非概率抽样(non-probability sampling)是指每个个体被抽样抽中的概率是未知的和无法计算的。一些非概率抽样方法,尽管不能按照常规的理论来计算抽样误差和推断总体,但是在特定条件下,还是有应用价值的。

(一)概率抽样方法

1.单纯随机抽样 又称简单随机抽样。单纯随机抽样(simple random sampling)是按等概率原则直接从含有N个观察单位的总体中抽取n个观察单位组成样本。常采用随机数字表来抽样。优点是均数(或率)及标准误的计算简便;缺点是当总体观察单位数较多时,要对观察单位一一编号,工作量大,实际工作中有时难以办到。

2.系统抽样 又称机械抽样。系统抽样(systematic sampling)是把总体的所有观察单位进行编号排序后,再计算出某种间隔,然后按这一固定的间隔抽取相应号码的观察单位来组成样本的方法。

系统抽样的优点:①易于理解,简便易行。②容易得到一个按比例分配的样本,其抽样误差小于单纯随机抽样。

系统抽样的缺点:①当总体的观察单位按顺序有周期趋势或单调增(或减)趋势,则系统抽样将产生明显的偏性,也缺乏代表性。②实际工作中一般按单纯随机抽样方法估计系统抽样的抽样误差,但系统抽样抽取各个观察单位并不是彼此独立的,因此对抽样误差的精度估计比较困难。

3.分层抽样 又称分类抽样或类型抽样。分层抽样(stratified sampling)是先将总体中的所有观察单位按某种特征或标志(如性别、年龄、职业或地域等)划分成若干类型或层次,然后在各个类型或层次中采用单纯随机抽样或系统抽样的办法抽取一个子样本,最后将这些子样本合起来构成样本。

当样本含量确定后,确定各层观察单位数的一般方法:①按比例分配(proportional allocation),即按总体各层观察单位数的比例分配各层样本观察单位数。②最优分配(optimum allocation),即同时按总体各层观察单位数的多少和标准差的大小分配各层样本观察单位数。

分层抽样的优点:①减少抽样误差:分层后增加了层内的同质性,因而可导致观察值的变异度减小,各层的抽样误差减小,其标准误一般均小于(样本含量相同时)单纯随机抽样、系统抽样和整群抽样的标准误。②便于对不同的层采用不同的抽样方法,有利于调查组织工作的实施。③可对不同层独立进行分析。

4.整群抽样 是从总体中随机抽取一些小的群体,然后由所抽出的若干个小群体内的所有观察单位构成调查的样本。整群抽样中对小群体的抽取可采用简单随机抽样、系统抽样或分层抽样的方法。整群抽样(cluster sampling)与前几种抽样的最大差别在于,它的抽样单位不是单个的个体,而是成群的个体。“群”的大小是一个相对的概念,可以是自然的区划,也可以是人为的区划。每个群内的观察单位数可以相等,也可以不等,但相差不应太大。

整群抽样的优点是便于组织,节省经费,容易控制调查质量;缺点是当样本含量一定时,其抽样误差一般大于单纯随机抽样的误差。群间差异越小,抽取的“群”越多,精度越高。因而在样本含量确定后,宜增加抽样的“群”数而相应地减少群内的观察单位数。

5.多阶段抽样 前述的四种基本抽样方法都是通过一次抽样产生一个完整的样本,称为单阶段抽样。但在现场调查中,往往面临的总体非常庞大,情况复杂,观察单位很多,而且分布面广,很难通过一次抽样产生完整的样本,而是根据实际情况将整个抽样过程分为若干阶段来进行,称为多阶段抽样(multistage sampling)。它是按抽样单位的隶属关系或层次关系,把抽样过程分为几个阶段进行。不同的阶段,可采用相同或不同的抽样方法。

当总体的规模特别大,或者总体分布的范围特别广时,研究者一般采取多阶段抽样的方法来获取样本。

(二)非概率抽样方法

1.偶遇抽样 又称便利抽样(convenience sampling)。偶遇抽样(accidental sampling)是指研究者根据现实情况,以自己方便的形式抽取偶然遇到的人作为调查对象,或者仅仅选择那些离得最近的、最容易找到的人作为调查对象。例如在车站或街头对来往行人进行调查等。

2.判断抽样 又称立意抽样(purpose sampling)。判断抽样(judgmental sampling)是调查者根据研究目标和自己主观的分析来选择和确定调查对象的方法。例如要调查吸毒者的吸毒过程和原因,就必须对一定的吸毒者进行访谈。由于吸毒是极其隐蔽的行为,不知道其总体有多大,不可能采用随机抽样的方法,只能找到符合条件的就调查,在样本数量达到一定数量的时候再进行分析。

3.定额抽样 又称配额抽样。进行定额抽样(quota sampling)时,研究者应尽可能地依据那些有可能影响研究变量的各种因素来对总体进行分层,并找出具有各种不同特征的成员在总体中所占的比例。它是一种比偶遇抽样要复杂些的非概率抽样方法。

4.雪球抽样 当无法了解总体情况时,可以从总体中少数成员入手,对他们进行调查,向他们询问还知道哪些符合条件的人,再去找那些人并再询问他们知道的人,这种方法称为雪球抽样(snowball sampling)。如同滚雪球一样,可以找到越来越多具有相同性质的群体成员,直到达到所需的样本含量。

【例2-3】因科研工作需要,请在20例某病患者(基本信息见表2-3)中随机抽取10名患者作为研究观察对象。

表2-3 某病20例患者基本信息

img

简单随机抽样方法:从随机数字表(附表21)中任意位置(例如第5行第3列),横向(或纵向)依次获取10个两位随机数字,有相同的或者超出20的跳过,获得随机数字:08,04,05,16,09,07,10,03,13,19。编号为这10个数字的患者被抽中,作为试验对象。