第四节 流行病学及统计学与社区卫生服务

流行病学(epidemiology)是研究疾病、健康状态以及卫生相关事件在人群中的分布、影响和决定因素,以预防和控制疾病,促进健康的学科。社区卫生服务的流行病学是通过研究社区中的个人、家庭、集体和整个社区的疾病、健康、健康事件的分布及影响因素,提出预防与促进的策略和措施,并评价效果,从而达到预防和控制疾病,促进健康的目的。而关注社区整体的健康状况和提高健康水平应是社区卫生服务的工作重心。
统计学(statistics)是研究数据的收集、整理、分析的一门科学。医学统计学(healthstatistics)是运用概率论数理统计的原理研究医学资料的搜集、整理、分析和推断的一门应用学科。概率(probability)是描述随机事件的可能性大小的数值,常用符号 P表示。一般将 P≤0.05或 P≤0.01的事件称为小概率事件。
流行病学和统计学关系密切,统计学是按照流行病学的原理去描述疾病分布特征,找出具体存在的差异,进而完成疾病病因的探索。

一、常见的流行病学统计方法

社区医务人员掌握了流行病学统计方法,就可以对已掌握的社区最基本的健康和疾病信息进行分析研究,为社区的健康促进和疾病预防控制提供相应的参考依据。本节主要说明基本的统计学概念及不同的数据类型所使用的统计学方法,具体统计软件的使用建议查阅相关书籍。
(一)统计设计
1.调查设计
常用于人口普查、生活状况调查、市场调查、民意测验等。在社区中通过调查研究探索社区居民的行为目的,了解其观点、态度、观念、期望、身体状况及特点、对某些疾病的认知程度等。故调查设计主要是确定调查的对象、调查研究的时间段、调查的目的和指标,确定调查的方法和资料的搜集方式、拟定调查项目,估计样本含量,确定抽样方法、质量控制等。
2.实验设计
主要包括各种实验模型、分组方法、样本量的估算等。优点在于能够更好地控制非处理因素的影响,避免人为造成偏倚,缺点是样本较小,不能保证非处理因素对各组的影响相同。
统计设计是统计描述和统计推断的基础,它关系到数据收集的准确性及研究结果的可靠性,所以在设计上必须保证不能出现失误和设计缺陷,否则容易导致整个研究失败。
(二)搜集资料和整理资料
1.搜集资料
是取得准确可靠的原始资料。常见资料来源有:①经常性资料,如社区卫生工作中的原始记录、报告卡、统计报表等;②一时性资料,如专题调查或实验研究的调查表和实验数据等。
2.整理资料
整理原始资料,使其系统化、条理化,方便进一步计算和分析指标。一般做到:①原始数据的检查和核对。检查原始资料有无错漏,数据中是否有异常值出现,有无逻辑错误,并进行补充、修正及合理剔除。②数据的分组和归纳。做好质量或数量分组,并进行归纳汇总,整理成统计表。
3.资料的分类
(1)计量资料:亦称定量资料,一般用专用仪器通过定量的方法获得数据资料,有度量衡单位,如身高(cm)、体重(kg)等。计量资料一般具有连续性的特点,如体重可以为120.1、120.2kg……。
(2)计数资料:亦称定性资料,指将观察单位按某种类别、性质、特征或属性进行分组,清点各组单位数后所得的资料。有二分类和多分类两种情况。二分类观察结果为两种相对立的属性,如“阳性”、“阴性”,“生存”、“死亡”;多分类的观察结果有两种以上互不包含的属性,如血型(A、B、O、AB型)等。
(3)等级资料:是介于定量测量和定性观察之间的半定性观察结果,通常有两个以上的等级。如治愈、好转、稳定、恶化等。
(三)统计分析
1.统计描述
是指运用统计指标、统计表、统计图等对分布规律进行描述。一般不涉及样本推断总体的问题。
(1)数值变量资料的统计描述:常用的有:①频数表。将所有观察结果出现的次数按一定顺序排列,达到简化数据,更便于观察结果的分布特征。②频数分布图。也称直方图,是将频数分为若干个组,再将每组的频数通过坐标系描述。它能直观地反映连续变量各种取值的出现机会。③集中趋势描述指标。观察结果数据相差不大或频数为正态分布的资料用算术均值描述, μ表示总体均数 表示样本均数;对于偏态分布资料用中位数( M)描述;对于等比资料和对数正态分布资料用几何均数( G)描述。④离散趋势描述指标。描述对称资料离散趋势的指标常用方差和标准差;描述偏态资料在某百分位上的水平及确定偏态资料医学参考值范围的指标常用百分位数( P x)。
(2)分类资料的统计描述:常用的有:①频数表。指在一个样本中表现为互不相容的属性或类别相同情形出现的次数。②相对数。包括率、相对比和构成比。
2.统计推断
包括抽样的方法及如何用样本信息推论总体特征。常用的计量资料统计推断方法有总体均数估计、 t检验、方差分析以及变量资料的秩和检验;计数资料的统计推断方法有总体率的估计以及 z检验、 χ 2检验,等级资料的统计推断方法有秩和检验。
(1) t检验:主要用于两个资料的均数之间有无显著性差异的一种检验方法。①样本均数与总体均数比较的 t检验。主要是通过一份完全随机样本,根据样本信息推断其总体均数是否与某已知样本均数相等。②样本均数间比较的 t检验。是通过已知两个样本均数推断它们的总体均数是否相等。这种 t检验要求两样本所属方差相等且总体均数为正态分布。③配对资料的 t检验。适用于自身对照比较和配对实验比较的一种检验。
(2)方差分析:检验两个以上样本均数有无显著性差别的一种方法。①单因素方差分析。它将数据按一个方向(即统一处理的不同水平或不同处理)进行分组,将产生的样本之间的均数进行比较,检验几个样本间是否存在差异的假设检验。②多样本两两比较方差分析。常用于对多个处理组与对照组的比较、某一对或某几对在专业上有特殊意义的均数间的比较等,也称组间比较。
(3)秩和检验:适用于未知比较资料的总体分布或资料不能满足参数检验条件时。常用于计量资料、等级资料比较组间的统计学检验。
(4) χ 2检验:常用于分类资料的统计推断,通过两组或两组以上的样本率来推断总体率是否相等,以及推断不同分类指标间有无相关关系。常用的检验方法有:①两样本率比较的 χ 2检验。②多样本率比较的 χ 2检验。③多样本率的两两比较的 χ 2检验。④配对设计资料的 χ 2检验。

二、流行病学研究方法在社区卫生服务中的应用

流行病学研究方法按照设计可分为观察性研究、实验性研究和数理学研究。在社区卫生服务工作中运用流行病学研究方法,其目的是对人群疾病和健康进行调查研究,并将结果用于社区卫生服务之中,为卫生部门制定社区健康甚至更高的卫生学标准提供依据。在社区卫生服务工作中,常用的流行病学研究方法为观察性研究和实验性研究。
(一)观察性研究
观察性研究包括描述性研究和分析性研究。该研究的特点是研究疾病发生的自然过程。是在无任何干预的情况下,研究者观察疾病和健康的分布规律,提出影响分布的原因假设的一种方法。观察性研究是社区护理评估、社区诊断的常用方法。
1.描述性研究(descriptive study)
是指利用已有的资料或通过特殊调查的资料(包括实验室检查结果),描述疾病或健康状况在不同时间、地点和人群中的分布特征,为进一步开展分析流行病学研究提供病因或流行因素的线索。它包括现况调查、生态学研究、暴发调查、筛检等研究方法。
(1)现况调查(prevalence study):
又称之为横断面研究(cross-sectional study)。它是在研究某一明确的人群中应用普查或抽样调查等方法收集特定时间点上的有关变量(暴露)与疾病或健康状况的关系。从时间上说,现况调查是在某一时间点或在短时间段内完成,它所收集的资料既不是过去的记录,也不是常规报告资料或随访的调查资料,而是调查当时所得到的疾病、健康和其他有关资料;根据收集到的资料了解不同时间、不同人群、不同地区的分布特征,描述某些暴露因素与疾病或健康状况之间的关系。现况调查为卫生服务需求、社区卫生规划的制定与评估和卫生行政部门的科学决策提供依据。
由于社区的规模和人群相对固定,因此在社区卫生服务中现况调查的主要用途是:①描述疾病或健康状况的三间分布,发现高危人群,有针对性地积极开展社区预防和护理工作。②通过调查发现某些因素或特征与疾病或健康状况的联系,以确定病因假设,供上级医疗单位或科学研究提供基础性的研究数据和研究方向。③利用普查等手段,可早期发现患者,实现“早发现、早诊断、早治疗”的目的。④通过收集有关暴露与疾病的资料,比较干预前后人群患病率,可考核和评价某些疾病防治措施的效果,同时也可以为评价防治措施和防治效果提供有价值的信息。
(2)生态学研究(ecological study):
它是在群体的水平上研究某种暴露因素与疾病的关系,在社区主要是研究与疾病有关的病因线索,评价社区的健康教育、健康促进以及其他社区护理干预的效果。疾病测量的指标可以是发病率、死亡率,也可以是烟草消耗量或食盐消耗量等。生态学研究一般分为生态比较研究和生态趋势研究。如某地政府怀疑当地的PM2.5(particulate matter 2.5)指数居高不下与当地一大型工厂使用的煤炭燃料有关,通过行政干预,该工厂用另一种燃料代替煤炭使用,结果发现该地区PM2.5污染指数逐步下降,空气质量好转,于是初步认定该地的大气污染与使用此种煤炭燃料有关。
(3)暴发调查(outbreak study):
是指局部地区或集体单位中短时间内出现大量某病的病例,针对该地区和人群开展的流行病学调查为暴发调查。在社区卫生工作中,暴发调查能促使及时采取有效措施控制疾病蔓延,描述暴发疾病的分布特征,查明暴发的来源、传播方式和途径,识别易感人群,最后提出预防控制的措施。如托幼机构的手足口病暴发、食用污染食物引起的食物中毒等。
(4)疾病监测(surveillance of disease):
是指长期、连续、系统地收集疾病的动态分布及其影响因素的资料,经过分析将信息上报、反馈和传达给上级卫生部门,方便及时采取干预措施并评价其效果。疾病监测能够了解疾病的长期变动趋势和自然史。疾病监测的指标可以分为直接指标和间接指标。
2.分析性研究(analytical study)
研究疾病的病因是医学研究的重要任务,由于现况研究中因与果同时存在,在病因研究中的作用有限,因而病因假设的验证常用分析性流行病学方法。常用的分析性研究方法有病例对照研究和队列研究。
(1)病例对照研究(case-control study):
选择一组患所研究疾病的患者为病例组与一组未患有该病的患者为对照组,通过询问、实验室检查或复查病史,搜集发病前某些因素的暴露情况,比较对照组和病例组中各因素的暴露比例的差异,研究这些因素和该研究的疾病的关系。病例对照研究属于回顾性研究,即其被研究因素的暴露状况是通过回顾获得的,因而它的研究特点是研究在疾病发生后才进行,便于将研究对象按是否已发病分为病例组和对照组;同时在因果关系上属于由已发生的结果去推导原因,即由“果”及“因”。
例如:用病例对照研究方法研究吸烟是否引起肺癌。把肺癌患者编为一组(病例组),未患肺癌的人编为一组(对照组),对两组人是否吸烟或吸烟的量进行比较,分析肺癌与吸烟的联系。
(2)队列研究(cohort study):
将特定的人群按照是否暴露于某可疑因素或暴露水平的不同分为不同的亚组,追踪一定时期,比较两组或不同亚组结局的差异,以此判定该因素与某疾病有无因果关联以及关联强度大小的一种观察性研究方法。队列研究是一种由“因”及“果”的病因学研究方法,研究中的暴露是在研究前已客观存在的,不是人为干预的。队列研究可以用于如吸烟与不吸烟对高血压发生的影响、食用母乳或奶粉对婴儿发育的影响的跟踪调查等,对社区健康教育、健康促进以及保健指导的实施均有意义。
(二)实验性研究
实验性研究(experimental study)是指将来自同一总体的研究对象随机分为实验组和对照组,对实验组给予某种干预措施,对照组不给予措施,而后随访并比较两组的结局来判定干预措施效果的研究方法。常用于验证某药物或治疗方法的效果、对干预措施及方法进行考核或评价等。而在社区卫生服务中常用于评价如危险因素干预、某病预防控制措施、某新护理措施使用后的效果等。

三、常用的疾病和其他统计学指标

在社区卫生服务中,进行社区诊断、护理评估、计划制订、护理效果评价等都需要对各种信息进行统计分析。以各项统计指标为依据,制订社区卫生服务计划,研究疾病的防治策略。
(一)人口统计
1.静态人口学调查(static demography)
常见于人口普查。其对象一般是某一国家全体公民。内容包括人口总数、人口的年龄结构和性别结构。
2.动态人口学调查
包括人口出生及死亡引起的“自然变动”和人口迁移引起的“机械变动”,一般是以一年内出生、死亡发生的数量进行统计。
(1)出生率:指每年平均每千人口的出生数。出生率显示某地区人口生育水平,但受人口性别、年龄结构、婚姻状况和生育水平的影响,需进行标化后比较(K=100%,1000‰或10 000/万……)。

(2)生育率:以15~49岁有生育能力的育龄妇女为观察对象的一组指标(K=1000‰)。

(3)死亡率(mortality rate):某年死亡总人数占同年平均每千人口数比例,反映某地区居民死亡水平,但受当地人口、年龄、性别构成影响,需进行标化后比较。(K=100%,1000‰,或10 000/万……)

死亡率可按不同年龄、性别、地区、人群、病种等分别计算死亡专率。
1)年龄别死亡率:某年某年龄组死亡人数在同年同年龄组平均每千人口数的比率,可与其他相应年龄的死亡率直接比较,但也受到性别构成的影响。

2)死因别死亡率:某年因某种原因死亡的人数在同年平均每千人口数中的比率。

(4)婴儿死亡率:某年不满一岁婴儿死亡数占同年活产婴儿总数的比率,是评估社区妇幼卫生工作的重要指标(K=1000‰)。

(5)孕产妇死亡率(maternal mortality):某年从妊娠开始到产后42天内,因各种原因(除意外事故外)造成的孕产妇死亡数占同年活产数的比率。孕产妇死亡率是妇幼卫生和产科工作评估的重要指标。(K=100 000/10万)

(6)5岁以下儿童死亡率:是指某地区一年内未满5岁儿童死亡人数与当年活产数之比,反映全球18岁以下儿童90%以上的死亡情况(K=1000‰)。

(二)疾病统计学指标
1.发病率(incidence rate)
表示在一定时期内,特定人群中某病新发病例出现的频率,反映疾病对人群健康的影响,发病率高说明疾病对健康影响大,反之则影响小。(K=100%,1000‰,或10 000/万……)

计算时应根据研究病种或卫生事件的特点选择时间,通常以年为时间单位,常用10万分率表示。诊断水平不高、报告制度不全等多种因素影响发病率的准确度,比较不同资料的发病率应考虑年龄、性别等的构成,进行发病率的标化。
2.罹患率
也是人群新发病例数的指标之一,指某一局限范围短时间的发病率,适用于局部地区暴发疾病流行情况,如食物中毒、传染病。
3.患病率(prevalence rate)
指某时期内某类人群中某病新旧病例所占同期平均人口的比率,用于反映病程较长的慢性病流行情况及对人群健康的影响程度,为规划医疗设施、估计医院床位周转、卫生设施及人力的需要量以及医疗费用的投入等提供科学依据。
按不同观察时间分:不超过一个月的时点患病率(point prevalence)和超过一个月的期间患病率(period prevalence),时点患 病率较为常用(K=100%,1000‰,或10 000/万……)。
1)时点患病率=

2)期间患病率=

4.病死率(case fatality rate)
观察期间某病死亡数占同时期某病患者数的比率,反映疾病的严重程度或诊治能力等医疗水平,评价时注意不同医疗单位的硬件设施及接收患者的病种、病情、病程等是否可比(K=1000‰)。

5.生存率(survival rate)
随访 N年仍存活的病例数占随访满 N年病例数的比率,是衡量疾病防治效果,观察预后的指标。

(三)其他统计学指标
1.死因构成比、死因顺位指标及疾病谱
①死因构成比:指死于某死因人数占全部死亡人数百分比,说明各种死因的相对重要性;②死因顺位:指按各类死因构成比大小由高到低排序的位次,说明各类死因的相对重要性;③疾病谱:指由固定的谱阶组成的疾病过程或按对某地区人群健康危害程度顺序的疾病谱带。

2.低出生体重儿百分比
指体重不满2500g的新生儿数占参加检测体重新生儿总数的比例,与社会经济和营养条件关系密切,是评价医疗保健措施效果的重要指标。

3.畸形儿百分比
指有先天畸形的胎婴儿数占活产与死产、死胎总数的百分比。

(四)率的标准化
社区卫生服务实际工作中比较几个不同强度的相对数应注意内部构成的差异,当几个率内部构成不同时应先进行率的标准化后再作比较,否则容易导致错误的结论;比较不同地区某病发病率或死亡率指标易受该地区人口年龄结构特征的影响,也要调整标化率后再进行比较。如甲县死亡率366/10万,乙县死亡率626/10万,表面上乙县死亡率高于甲县,但进一步分析发现两地人口年龄构成相差很大,甲县为经济发达地区,乙县大量年轻人在甲县打工并定居,造成乙县老龄人口多,死亡率增高,要比较两地区真正的死亡状况需进行率的标准化。一般有两种方法:
1.直接调整法
将两地标准人口构成的各年龄组人数乘以各年龄组的死亡专率,得出标准人口下各年龄组的预期死亡数,相加后得出按标准人口计算的预期死亡率人数,再除以标准总人口数,得出标化发病率后进行比较可真实反映两地的健康状况。
2.间接调整法
用于已知标准人口各年龄组死亡专率和未知标准人口各年龄组人口数的资料。

(许伟红)