
第一节 研究设计要点
一、调查类型
根据涉及研究对象的调查范围可将横断面研究分为普查、抽样调查和典型调查。
1.普查(census)
即全面调查,指在特定时点或时期、特定范围内的全部人群(总体)均为调查的研究对象,如全国人口普查。
2.抽样调查(sampling survey)
指通过随机抽样的方法,对特定时点、特定范围内人群的一个代表性样本进行调查,以样本的统计量来估计总体参数。如全国吸烟率、慢阻肺患病率等大型流行病学调查。
3.典型调查
根据调查目的,在对研究对象总体进行全面分析的基础上,从中选取若干个单位进行系统周密的调查研究的一种非全面调查。
二、明确研究目的
这是研究设计的重要步骤,应根据研究所期望解决的问题,明确该次调查的目的。例如:了解某疾病或健康状况的人群分布情况。应根据具体的研究目的来确定调查类型。
三、确定研究对象
确定合适的研究对象是顺利开展横断面研究的关键环节,应根据研究目的明确总体和目标人群。首先要确定研究对象的纳入标准,从目标总体中划分出一个子集为预期研究样本;制定排除标准来排除不适合参加研究的对象,提高研究结果的内部真实性。综合考虑研究的可行性及伦理学原则,确定最终的研究对象。
四、抽样方法
确定研究所需要纳入的目标人群,选择合适的抽样方法选取研究对象。抽样分为非随机抽样和随机抽样。
非随机抽样是指抽样不是遵循随机原则,而是按照研究人员的主观经验或其他条件来抽取样本的一种抽样方法,如重点调查、典型调查等。非随机抽样获得的样本不能应用统计推断。
随机抽样是遵循随机化原则,即保证总体中每一个对象都有已知的、非零概率被选入作为研究对象,保证样本的代表性。若样本量足够大、调查数据可靠、分析正确,则可以把调查结果外推到总体。
常见的随机抽样方法有单纯随机抽样、系统抽样、整群抽样、分层抽样和多阶段抽样。
1.单纯随机抽样(simple random sampling)
也称简单随机抽样,是将调查总体全部观察单位编号,利用抽签法或随机数字表法抽取部分观察单位组成样本,适用于调查总体人数较少的情况。
2.系统抽样(systematic sampling)
又称等距抽样,是按照一定顺序,每隔若干观察单位抽取一个单位的抽样方法。如设总体单位数为N,需要调查的样本数为n,则抽样间隔为K=N/n。将每K个单位为一组,用随机方法确定每一组的单位号,最后每隔K个单位抽取一个作为研究对象。该方法在人群现场易进行,如可按门牌号间隔K户调查一户。系统抽样对总体人数要求不高,可以使样本分布均匀,减小抽样误差,但当总体的排列有周期规律,而抽取的间隔恰好是其周期,则可能产生偏倚。
3.整群抽样(cluster sampling)
将总体分群,随机抽取其中几个群组成观察单位作为样本的抽样方法。若被抽到的群组中全部个体均作为调查对象,称为单纯整群抽样(simple cluster sampling);若调查部分个体,称为二阶段抽样(two stages sampling),适用于总体较大,需节省人力、物力或没有条件实施其他抽样方法时。整群抽样要求群之间的差异尽量小,群内的差异尽量大。但该方法抽样误差较大,故样本量比其他方法要增加至少1/2。
4.分层抽样(stratified sampling)
先按对观察指标影响较大的某种特征将总体分为若干个类别,再从每一层内随机抽取一定数量的观察单位组成一个样本。它适用于总体单位数量较多、内部差异较大的调查对象。与简单抽样和系统抽样相比,在样本数量相同时,它的抽样误差较小;在抽样误差的要求相同时,它所需的样本数量较少。分层抽样的缺点是必须对总体各单位的情况有较多了解,否则无法作出科学的分类。而这一点在实际调查前又往往难以做到。
5.多阶段抽样(multistage sampling)
结合使用几种抽样方法,先从总体中抽取范围较大的单元,称为一级抽样单位(如省),再从每个抽得的一级单元中抽取范围较小的二级单元(如县),依次类推,最后抽取其中范围更小的单元(如村)作为调查单位,是大型流行病学调查常用的最具有代表性的抽样方法。在抽样之前需要掌握各级调查单位的人口资料及特点。
五、数据收集
在横断面研究中,收集资料的方法在整个研究过程中必须保持一致,避免不同的收集方法对结果的影响。数据收集一般有两种方法,一是通过客观的测量或检查方法,如测量身高、体重和血压,实验室检测血糖和血脂水平等;二是使用问卷对研究对象进行调查,让其回答或回忆暴露或疾病情况。收集过程中要注意暴露(特征)的定义和疾病的诊断标准均要有依据,所有参与研究的调查员、检测或检验人员都应经过培训,以统一调查和检测标准,控制测量偏倚。
六、数据分析
对于横断面研究收集的资料,应先仔细检查数据的完整性和准确性,处理缺项、漏项数据信息,对重复的数据予以删除,错误的予以纠正等。数据分析主要是描述疾病分布,计算各种率,如患病率、暴露率、病残率和感染率等,这些率的定义与计算方法如下。
(1)患病率:
指特定时间内总人口中某病新旧病例所占比例。
(2)病残率:
某一人群中,在一定期间内每百(或千、万)人中实际存在的病残人数。
(3)感染率:
指在某个时间内能检查的整个人群样本中,某病现有感染者人数所占比例。
由于横断面研究收集了研究对象的暴露(特征)与疾病资料,可进一步将人群按暴露因素或疾病状况分组,比较各组间的特征差异,发现病因线索。横断面研究主要的数据整理与分析方法见表1-2-1,暴露组和非暴露组的现患率分别为a/(a+c)和b/(b+d);计算χ2值进行统计学检验,说明不同组的现患率是否有显著性差别。
表1-2-1 横断面研究资料整理表

七、偏倚及控制
横断面研究中各类偏倚产生的原因为:①主观选择研究对象,即选择研究对象具有随意性,没有采取随机抽样。②任意变换抽样方法,如根据出院号进行随机抽样时,就不能改用入院号等其他方法来抽样。③调查对象不合作或因种种原因不能或不愿意参加调查,导致无应答偏倚。若应答率低于85%则较难通过样本调查结果准确估计总体分布。④在横断面研究中,所调查到的对象均为幸存者,无法调查死亡的人,因此不能全面反映实际情况,有一定的局限性和片面性,此种现象又称为幸存者偏倚。由以上原因导致的偏倚主要是选择偏倚。⑤询问调查对象有关问题时,由于种种原因回答不准确从而引起报告偏倚;或调查对象对过去的暴露史或疾病史等回忆不清,特别是健康的调查对象由于没有疾病的经历,容易将过去的暴露等情况遗忘,导致回忆偏倚。⑥调查员有意识地深入调查某些人的某些特征,而不重视或随意对待其他人的这些特征而导致的偏倚,称为调查偏倚;在疾病的测量中由于测量工具不同、检验方法不正确、化验技术操作不规范等可导致测量偏倚。此外,在数据分析中,要注意有无混杂因素的存在及其影响程度。
偏倚是可以避免的,在横断面研究或其他类型的研究中需要注重质量控制,其目的是尽量减少偏倚的产生,从而尽量准确地反映真实情况。在研究设计阶段要反复论证,尽量严密,应考虑到调查中或调查结束时对资料进行质量评价的方法和指标。如调查结束时,随机抽取一定数量的研究对象进行重复调查,比较两次结果的一致性,或在调查过程中,对调查表中若干问题进行电话回访复查,均是非常有效的评价数据质量的方法。在横断面研究中,针对各种偏倚可能的来源做好预防与质量控制是研究成功与否的重要环节。
具体来说,横断面研究应着重强调以下几个方面的质量控制:①严格遵照抽样方法的要求,确保抽样过程完全按照方案实施;②提高研究对象的依从性和应答率,应答率一般应高于85%;③正确选择测量工具和检测方法,包括调查表的编制等,调查或检查方法还应标准化且前后一致;④调查员一定要经过培训,统一操作标准;⑤做好资料的复查、复核等工作;⑥选择正确的统计分析方法,注意识别混杂因素并评估其影响。