第三节 公共卫生监测资料的分析
一、公共卫生监测资料分析计划的制订
在进行监测资料分析前,应明确开展本次分析的目的,并围绕目的,制订监测资料分析计划,计划应至少包含以下要素:
1.题目
应能说明开展本次监测资料分析的时间、地区、疾病或事件等。
2.目的
简要交代开展本次监测资料分析的理由和目的。
3.分析内容
紧紧围绕目的,说明为达到目的,需要从哪些方面开展哪些内容的分析。
4.数据来源
说明本次分析的资料来源、采集时间和地区等。
5.分析指标
罗列分析指标,必要时对指标进行定义。
6.分析方法
说明在整个分析过程中,需要用到哪些方法,并说明所使用的统计软件及其版本。
7.分析提纲
给出通篇报告的详细提纲,包括每项分析内容所用到的具体分析方法,以及可能需要的图表类型,如果可能,设计好分析所需表格框架。
二、公共卫生监测资料分析方法
监测资料分析通过汇总、整理所收集资料,选择适宜的指标,准确描述监测疾病或事件的分布特点,比较、分析变化趋势,判断是否发生值得关注的异常情况。
公共卫生监测资料的描述分析,主要是对人、时、地以及三者的综合分析。通过不同人群发病率的分析,发现高危人群;通过分析疾病随时间的变化,检测疾病趋势异常动向;通过不同地区发病的比较分析,以及随时间的发展变化,确定防治的重点地区;通过人、时、地的综合分析,揭示疾病随时间推移在不同人群和地域上的异常变化和发展规律。其主要指标包括:发病率、死亡率、病死率以及发病上升/下降比等。
1.疾病随时间变化情况
通常可用线图、半对数线图、直方图等进行分析。
(1) 直方图:
当描述的资料为定量变量时(如发病时间),可用直方图来反映其分布特征。注意,直方图与柱形图不同,后者用于描述定性变量的分布,这是两者的根本区别,因此,柱形图的各类别之间必须有间隔(以示为定性变量),直方图各柱形之间则须连续无间隔,且各柱形单位应相等(如必须具有相同的时间宽度),如图3-2。
(2) 线图:
为反映某种疾病随时间的变化趋势,可选用线图。与直方图相同,线图要求变量也为定量变量(通常为时间变量),且X轴时间单位相同(具有相同的时间宽度),如图3-3。
图3-2 某省2009~2010年甲型H1N1流感发病时间直方图(间隔= 1天)
(资料来源:何凡,2011)
图3-3 某地区2007~2009年甲乙类传染病发病率线图
(3) 半对数线图:
可用于描述某种疾病随时间变化的快慢。如图3-4。
图3-4 2005~2012年某省各型病毒性肝炎报告发病率半对数线图
从图3-5可见,某疾病虽然在1975年后发病率绝对值波动较小,但右侧的半对数线图表明,1975年后发病率反而波动较大,变化不稳定。
图3-5 线图与半对数线图的比较
(4) 周期性季节波动规律分析:
可用圆分布资料分析方法,分析疾病的周期性波动规律。多数疾病都具有季节性分布特征,利用圆分布原理,可以分析该疾病是否存在季节性波动,且可估计其发病高峰出现的时间。表3-1为某市1995~2007年细菌性痢疾分月发病数。
表3-1 某市1995~2007年细菌性痢疾月平均发病情况
利用圆形分布方法进行分析,得雷氏Z值= 4425.4766 > Z 0.05 = 2.9957,有统计学意义,表示平均角 存在,计算得, = -0.8211, = -0.5708, = 238.2639,转换成时间为8月27日,表明发病高峰日在8月27日。
(5) Cox-Staurt趋势检验:
Cox-Staurt趋势检验是Cox和Staurt于1995年提出,目的是检验一个时间序列是否存在上升或下降趋势。其基本思想是:如果存在上升趋势,则序列中后面的数值倾向于大于前面的数值,反之亦然。
方法:在序列中取出一些数据对(x 1,x 1+c)、(x 2,x 2+c)…,观察这些数据对中前后两个数据大于前面的,认为序列存在上升趋势,反之,则倾向认为序列存在下降趋势。在构成数据对时,数据对中前后数据的间隔c不能太小,否则易导致数据对的数目太小。当数据量m为偶数时,取c = m/2,可配成c对数据;当m为奇数时,取c-(m + 1)/2,可配成c - 1对数据,其中一个数据(第c个数据)没有配上对。
在所有的数据对中,若x 1 > x 1+c,则将此数据对换记为一个加号,若x i < x i+c,则将此数据对换记为一个减号,弃去x i = x i+c的数据对。统计加号的总个数,记为s +及减号的总个数s-,即为检验统计量。若序列不存在趋势,则s +与s-都服从 P = 0.5的二项分布 B(n,0.5),其界值可查“ P = 0.5的二项分布界值表”。
2.疾病在不同地区的分布
可用发病数和发病率来表示不同地区发病水平的高低,常用流行病学地图进行描述,常用的作图软件有Epiinfo、Mapinfo、Arcgis等。
(1) 点图:
用点的密度来表示发病数的大小,其优点可表明病例的确切位置,显示病例与病例、病例与背景之间的关系,但没有考虑到人口分母的影响,无法判断病例多的原因。
根据病例在点图中的具体分布,可以利用二项分布或泊松分布的独立性特征,进一步分析病例的聚集性。图3-6所示为某病地区分布图,将其划分为若干正方形的方格,将图中病例数分别为0、1和≥2例的方格数汇总于表3-2,利用Poisson分布原理分析其聚集性。经分析知,无论是较重组,还是危重死亡组,重症病例的分布均存在空间聚集性(表3-2)。
图3-6 某地区2009年EV71重症病例分布图
表3-2 利用Poisson分布原理分析某疾病空间聚集性结果
(2) 片图:
也称面积图,用某一种颜色的深浅来表示发病率的高低,颜色越深,表明发病率越高,反之越低。其缺点是:不能显示病例的确切位置,地图的其他信息将被掩盖,且无法显示同一区域内的差别。
图3-7为在某疾病暴发期间,该病在某地区各乡镇的罹患率示意图,途中用颜色的深浅来表示发病率的高低,其中白色区域表示无病例的乡镇。
图3-7 某疾病暴发期间罹患率的地区分布图
在制作流行病学地图时,需要注意:①地图的行政区划要完整,不可遗漏辖区内的任何区域;②需要有比例尺表明病例与病例之间的距离或疾病分布范围的大小;③需要有图例说明每个点表示的病例数或某种深度的颜色代表的发病率范围;④需要有指北针表示地图的东西南北走向;⑤制作面积图时,只能以一种颜色作为基底色,用该颜色的深浅来描述发病率的高低,切忌用多种颜色来表述不同范围的发病率。
3.疾病在不同人群中的分布
包括:①具有不同人口学特征的疾病分布,如年龄、性别、种族或民族等;②不同社会经济状况人群的疾病分布,如不同职业、教育程度和经济收入等;③疾病在流动/常住人口和不同疫苗接种率人群的分布情况等。注意,在比较不同人群的疾病分布时,尽量选择发病率指标进行描述,有需要时,还可对发病率按照不同人群特征进行标化处理。
(1) 对于年龄等定量资料,可以使用直方图或线图来表示。
在制作直方图或线图时,要求x轴上的单位一致(间隔相等),以表3-3数据为例,所做线图如下。
表3-3 某疾病年龄分组病例数
根据上表数据制作线图,如图3-8所示,x轴刻度代表各年龄组。左侧线图10岁以下以1岁为年龄间隔,10岁以上以5岁为间隔,前后单位不一致,歪曲了数据本身的分布特征,正确做法是统一年龄间隔,使x轴上的前后单位一致。
图3-8 某疾病按年龄组分布线图示意图
(2) 对于职业等定性资料,可以使用柱形图、饼图、条图和百分条图来描述其分布特征。如图3-9。
图3-9 某疾病按职业分布柱形图示意图
4.人、时、地的综合分析
多数情况下,仅仅对人、时、地某一要素的分析,很难发现异常信息,需要将三者结合考虑,开展综合性的分析。
例:时间和人群的结合分析。图3-10所示,左侧图为某省2009~2010年甲型H1N1流感的流行曲线图,右侧图为分学生和其他职业人群的流行曲线。从图中可以看出,该省甲型H1N1流感的流行有两个高峰,其中9月至10月初的小高峰由学生人群造成,可以推断该高峰的形成与9月学校陆续开学有关,而高峰的下降主要由国庆长假放假引起。同时,还可以看出,前期甲型H1N1流感病例以学生人群为主,其他职业人群上升缓慢,而后期其他职业人群所占比重较大,说明疫情逐渐由学校向社会的其他职业人群扩散。
图3-10 某省2009~2010年甲型H1N1流感分职业发病时间分布情况
(资料来源:何凡.2011.)
三、监测资料分析需注意的问题
(一) 数据异常情况评估
在开展监测资料分析时,需要对数据来源及其质量开展充分的评估,引起某种疾病的异常变化的因素是多方面的,包括数据的虚假报告、诊断标准的改变、政策的导向以及真实的变化等,这需要数据分析员去深入了解有关该疾病的各种情况,对可能导致该结果的可能原因做出尽量全面的评估,排除外在虚假因素的干扰,真实掌握疾病的变化规律,提出措施建议。
(二) 避免以“比”代“率”
在开展监测资料的分析时,尽量避免出现以“比”(构成比)代“率”问题,应该使用“率”来表述某种疾病的发病水平。表3-4所示1996年H地区的病毒性肝炎发病数最少,但受其人口基数影响,其发病率实际上是最高的。
表3-4 1996年病毒性肝炎在各地区的分布情况
(三) 疾病特征、时间、地点、人群的综合分析
在开展监测资料分析时,需要对疾病特征、时间、地点和人群等要素进行综合分析,从大量的分析结果中发现问题并查找原因。图3-11所示某县病毒性肝炎发病率随时间变化情况,在对病毒性肝炎分病种分析后,发现乙肝比上一年增加了6.8倍、未分型肝炎增加了653倍,其余病种则发病较为平稳,因此,分析员可进一步从乙肝和未分型肝炎着手,查找可能的原因。
图3-11 某县2005~2006年病毒性肝炎发病率随时间变化情况
(四) 基线问题
不同疾病在不同地区流行的程度迥异,在进行监测资料分析或制作预警线时,需要考虑某种疾病在当地的流行情况。假设A、B两个地区虽然报告了相同的病例数,但对于A地区来说,该疾病常年处于较低的发病基线水平(甚至罕见),则相对而言,A地区的分析员应对该问题引起足够的重视。
值得注意的是,在使用历年基线数据,制作预警线或建立预测模型的时候,需要将历年的暴发疫情发生的病例数从基线数据中去除。
另外,还需要注意,在全人群开展的具有普及性质的监测,不存在通过抽样从样本推断总体的问题,无需开展推断性统计学分析对率的差异进行统计学检验。