2.2 数据与研究方法

2.2.1 数据

本章的数据来源于“西部地区基础教育发展项目影响力评价”(Basic Education in Western Areas Monitoring Surveys)的基线调查数据。按照概率比例系统抽样(systematic sampling with probability proportional to size)的原则,该调查分别于2006年和2008年对中国西部的甘肃、广西、宁夏、四川、云南五省区农村地区的中小学进行了大规模抽样调查。本章基于其中的2008年小学抽样样本数据进行研究。2008年小学抽样样本共有11417个观测对象,在剔除其中没有汇报家庭生育规模(也即同胞数量)信息或性别信息的观测值之后,最终使用的样本包括11102个观测值。(3)

2.2.2 变量设定

本章的研究用学业成就和社会心理品质来衡量儿童在认知能力和非认知能力方面的教育发展成果。具体来说,用语文和数学标准化测试得分来衡量儿童的学业成就(4),用本研究专门设计的“学生心理适应性量表”来衡量儿童的心理适应性——一个涵盖学生学习适应能力、情绪与行为问题、师生关系、同伴关系及自我概念等多个维度的社会心理品质综合度量指标。该量表共计28题,采取李克特五分量表形式,从1分到5分分别表示完全不符合、不太符合、一般、比较符合、完全符合。在对部分题目进行反向计分转换后,首轮因子分析将28道题均纳入其中。考虑到各题目在提取公因子后的“共同度”及因子分析的方差解释率等,又对题目逐步进行删减。在删除6个无法进入理论维度的题目后,共22个题目进入末轮的因子分析。最终学生心理适应性题目被分为五个维度,即学习适应性、情绪与行为问题、师生关系、同伴关系、自我概念,分别考查学生心理适应性的不同方面。其中,学习适应性指学生感知到的自身学习态度及对学习方法和策略的掌握程度;情绪与行为问题考查学生外显的孤独寂寞、焦虑害怕、敏感害羞等情绪,以及外显的多动、破坏和攻击行为;师生关系测量学生对教师的喜爱和认可程度及教师对学生的关爱程度两个方面;同伴关系主要通过学生拥有的同伴数量及同伴对被试的喜爱程度两个方面进行测量;自我概念则主要考查学生对自身的认知与评价。因此,本章的被解释变量共包括七个指标。

表2.1对样本中的被解释变量进行了描述性统计分析。我们用t检验比较了男生和女生及独生子女和非独生子女在教育成果上的差异。检验结果表明,女生的数学成绩并不显著低于男生(p=0.1057),但是语文成绩显著高于男生(p=0.0548)。除了自我概念得分不存在显著性别差异外(p=0.7181),其他四个心理适应性得分女生均显著低于男生(p都小于0.0004)。总体而言,女生的教育成果指标基本上不如男生。

表2.1 不同样本中教育成果变量的均值和标准差

注:括号中数值为标准差。

独生子女和非独生子女之间的差异符合我们的预期。从学业成绩来看,独生子女的数学和语文成绩均显著高于非独生子女(p都小于0.05);在社会心理品质方面,独生子女的学习适应性并不显著高于非独生子女(p=0.2461),但是其他四个心理适应性得分均显著低于非独生子女(p都小于0.05)。总体而言,独生子女的学业成绩好于非独生子女,但是心理适应性水平不如非独生子女。

由于本章的研究目的是考察家庭生育规模变化对儿童教育发展的影响,以及家庭生育规模缩小是否会缩小教育性别差异,因此本章的关键解释变量包括:家庭中的孩子总数(Sibsize,连续型变量)、是否为独生子女家庭(Onlychild,虚拟变量,1=独生子女家庭)、是否是女生(Female,虚拟变量,1=女生)。

此外,我们还控制了其他可能影响儿童学业成绩和心理适应性的个人、家庭和学校层面因素,具体包括:父亲受教育程度(虚拟变量,1=父亲具有初中及以上学历)、母亲受教育程度(虚拟变量,1=母亲具有小学及以上学历)、父亲是否外出打工(虚拟变量,1=父亲外出打工)、母亲是否外出打工(虚拟变量,1=母亲外出打工)、家庭日常交流语言是否为少数民族语言(虚拟变量,1=家庭日常交流语言为少数民族语言)、家庭社会经济地位得分(连续型变量)(5)、自我教育期望(虚拟变量,1=自我希望能读到大学及以上)、父母教育期望(虚拟变量,1=父母希望自己读到大学及以上)、所在学校是否是乡镇中心小学(虚拟变量,1=是)、所在学校是否是九年一贯制学校(虚拟变量,1=是,以所在学校是村完小作为参照组)、反映办学条件特征的生师比及生均图书册数(均为连续型变量)。

2.2.3 研究方法与研究假说

本章研究以下两个问题:第一,在不同的家庭生育规模下,特别是独生子女和非独生子女在教育发展结果上是否存在不同?第二,独生子女家庭中的教育性别差异状况是否好于非独生子女家庭?

针对第一个问题,我们使用式(2.1)和式(2.2)两个OLS回归模型。在包含男生和女生的全部样本中,分别引入家庭中的孩子总数(Sibsize)和是否为独生子女家庭(Onlychild)两个变量度量家庭生育规模的影响。我们预期:家庭生育规模越小,或者出生在独生子女家庭,将有利于提高标准化测试成绩,但不利于其心理适应性水平。或者说,在以标准化测试成绩为被解释变量的回归中,我们预期β1的符号显著为负,β2的符号显著为正;在以心理适应性为被解释变量的回归中,我们预期β1的符号显著为正,β2的符号显著为负。此外,我们还考察性别变量(Female)的符号,若该变量的估计系数显著,则表明在某一教育发展成果上存在显著的性别差异。

针对第二个问题,我们进一步将其分解为两个问题:第一,独生子女群体中的教育性别差异状况是否好于非独生子女群体?第二,生于独生子女家庭是否对女生的影响更大?为此,我们参考李明轩(Lee, 2012)的方法进行了样本拆分。首先,我们将样本拆分为独生子女样本和非独生子女样本,此时的关键解释变量是性别虚拟变量(Female),具体回归模型见式(2.3)。表2.1的描述性分析表明,在全样本中,女生的教育成果总体而言落后于男生。因此,我们预期,出生在独生子女家庭将有助于缩小男女之间在教育成果上的性别差异。具体而言,在独生子女当中,男女在教育成果上的差异应该缩小(或维持不变);在非独生子女当中,男女在教育成果上的差异应该维持不变(或放大)。不管怎样,在两类家庭样本中,性别变量的系数φ的符号或显著性应该有所不同。其次,我们将样本拆分为男生样本和女生样本,此时的关键解释变量是是否为独生子女家庭(Onlychild),具体回归模型见式(2.4)。在中国长期存在“男孩偏好”的家庭文化下,家庭生育规模大小并不会显著影响父母对男孩的教育投资及教育期望,因此我们预期,是否生于独生子女家庭对男孩教育成果的影响小于对女孩的影响。