第三章 区域和样本抽样的方法

一 调查地区的抽样

本年度的调查抽样总体上按两个原则来实施:一是要形成全国的加总分析,因而样本要有代表性,能反映全国的总体状况;二是要能够满足全国各省(自治区、直辖市)以及重要城市的排名需求,因而省份和城市内部的抽样要具有代表性。按照以上原则,本年度的城市样本按以下步骤来确定:

第一步为必选城市,选取的地区对全国具有代表性,能够反映全国的总体状况。这些城市包含所有直辖市、省会城市和副省级城市:北京、上海、天津、重庆、沈阳、大连、青岛、哈尔滨、长春、呼和浩特、石家庄、济南、西安、太原、郑州、武汉、南京、杭州、福州、合肥、南昌、厦门、宁波、深圳、广州、南宁、海口、贵阳、成都、昆明、兰州、银川、西宁、乌鲁木齐、拉萨、长沙,共计36个。

第二步为其他城市,这一部分地区样本是为了能够使得样本对省级层面具有代表性。主要按照人均GDP排名分层抽样的方法来抽取,具体的抽取方法为:各省份的城市(含省会)按人均GDP排序,除省会城市以外,选择城市的标准:

(1)若该省人口低于5000万,则选取排名中位值城市,如有10个城市,则选取第5名或第6名的城市;

(2)若该省人口高于5000万,则除省会城市以外,选取2个城市,按名次取第70%分位和40%分位的城市,如有21个城市则取第14名和第7名城市。

根据以上两个原则,最终确定了除必选城市以外的33个城市,共计69个城市,与去年相比共有50个城市重合。

表3-1 除省会、副省级城市以外的其他城市的抽取

续表

续表

二 调查样本的选取

在所调查的城市里,本年度调查样本的个体抽样方案与2013年一致,即分为城市和农村两个层次的抽样。城市抽样按职业大类抽样,农村抽样按不同收入层级抽样。

样本容量(同时含农村和城市样本)为60和50的城乡样本分配分别如表3-2和表3-3所示。

其中当城市人口数大于农村人口数时,样本容量为60和50的城市抽样及名额分配分别如表3-4和表3-5所示。在抽取农村样本时,在所在的城市随机选取一个具有代表性的乡镇(经济发展和人口规模方面具有代表性),然后再选取2—3个村,每个村各选取6—8名被访对象,按收入分成低、中、高三组,每组各选取2—3名调查对象。

表3-2 样本容量为60的城乡样本分配表

表3-3 样本容量为50的城乡样本分配表

表3-4 样本容量为60的城市抽样及名额分配表[1]

表3-5 样本容量为50的城市抽样及名额分配表[2]

续表


[1] 注:该抽样方案是样本容量为60,且城市人口大于农村人口的抽样方案,其中城市抽取42个样本,农村抽取18个样本。

[2] 注:该抽样方案是样本容量为50,且城市人口大于农村人口的抽样方案,其中城市抽取35个样本,农村抽取15个样本。