
第五节 数据与方法
一 数据来源
本研究实证分析数据来源于西安交通大学人口与发展研究所于2009年11月在福建省X市实施的农民工调查。
X市是中国改革开放成立最早的经济特区之一,也是中国流动人口最为集中的地区之一。Y区是X市下属的一个区,是X市经济、文化、教育和旅游的中心区,也是外来流动人口最为集中的一个区。Y区外来人口高度聚集,有51.4万人,占全区总人口的72.41%,是福建省外来人口比例最高的区之一,其中外来人口的性别比是122,人口性别结构严重失衡,因此Y区是理想的调查地点。
调查选择X市户籍在农村、年龄在16周岁及以上的到X市务工的农民工作为调查对象。具体调查在Y区下属的5个街道进行。由于农民工调查存在缺乏具体的抽样框问题,在调查中为了尽量保证调查质量,对调查在以下几个方面进行了控制。第一,覆盖农民工从事的所有典型行业。第二,覆盖农民工的所有主要人群,调查将农民工分为5类人群,包括已婚男性、27岁及以下未婚男性、27岁以上未婚男性、已婚女性和未婚女性。第三,为了提高样本的代表性,调查采用宽松的配额抽样方法:一方面,根据街道和居委会提供的农村流动人口出租屋登记名册(抽样框)进行普查,并对未婚和已婚的流动人口按男女比例及婚姻状况从抽样框中进行等比抽样;另一方面,由于被调查对象具有较强的流动性,在实际调查中应用了较宽松的配额抽样方法,分别在社区和农民工所在单位同时调查。较好地覆盖了所有的典型职业,也很好地反映了农民工的性别结构、年龄结构和婚姻状态。最终获得1507个样本,其中男性899人,女性608人。基于研究的需要,本研究剔除了家庭主妇的样本。具体的抽样方法和质量控制,详见悦中山(2011)的博士论文。
尽管本次调查并没有采取严格的随机调查,不可避免地存在一定的数据偏差问题,但本次调查样本量较大,而且在调查过程中适度地控制了流动人口的婚姻、年龄和职业等特征,从而可以较好地反映X市农民工人群的主要特征,因而是适合用来做因果分析的。另外,由于农民工的流动性较强,因而,横截面的调查数据仅仅代表所调查时间内农民工的主要特征。但由于农民工的流入与流出具有一定的随机性,横截面的调查数据又可以反映出一段时期内调查地农民工的总体特征,因而尽管调查数据存在一定的偏差性,但依然可以较好地反映2009年X市农民工的总体特征。
二 研究方法
本研究根据已有关于心理失范和心理福利性别差异的理论和实证研究,建立了适合中国人口流动和性别失衡背景下农民工心理失范的分析框架。本研究结合公共管理学、社会学和心理学的研究方法,运用比较法、描述统计方法和高级统计方法对农民工心理失范性别差异进行了分析。
具体研究方法包括,根据已有关于心理失范和心理福利的理论与实证研究,总结和归纳出心理失范的一般性分析框架。在此基础上,结合中国人口流动和性别失衡的具体情境建立适用于中国农民工心理失范性别差异的分析框架。在分析框架的基础上,本研究运用高级统计方法对农民工心理失范性别效应的决定因素和不同婚姻状态下农民工心理失范影响因素的性别差异进行了分析。具体包括三章的实证研究内容,首先,分析全样本模型,识别婚姻状态和婚姻挤压对农民工总人群心理失范性别差异效应的影响,以及农民工心理失范影响因素的性别差异;其次,在全样本模型分析的基础上以已婚农民工为分析对象,分析已婚农民工心理失范的性别差异及已婚农民工心理失范影响因素的性别差异;最后,分析未婚农民工心理失范的性别差异及未婚农民工心理失范影响因素的性别差异。
关于性别差异程度的测量和比较,吴愈晓和吴晓刚(2009)总结了三种通常采用的方法:一是从数量的角度直接观测和比较收入等因素的总体性别差异,即比较收入在男性与女性之间的差异;二是控制了其他变量之后观测性别变量的效应及其变化,即观察性别变量的性别系数及其变化;三是不能被统计模型所揭示的性别差异部分的比例。为了分析农民工性别差异的效应,在具体的实证分析过程中,本研究分三步开展具体的分析,首先是描述统计,分性别描述和比较主要变量间的差异;其次是对各个群体的全样本建立回归模型,分析性别效应(性别系数变化)及性别效应的影响因素;最后是分婚姻状态,分析已婚群体和未婚群体心理失范影响因素的性别差异。本研究采用嵌套模型的方法,建立了OLS回归模型,以便识别变量之间的相互关系,力求用准确和具有说服力的分析与解释来完成对假设的证明。