- 异构基因共表达网络的分析方法
- 熊芳等
- 2178字
- 2023-11-28 18:54:36
第1章 绪论
鼻咽癌(Nasopharyngeal Carcinoma,NPC)是指发生于鼻咽腔顶部和侧壁的恶性肿瘤。是我国高发恶性肿瘤之一,发病率为耳鼻咽喉恶性肿瘤之首,从流行病学、病因学、病理特征及治疗策略等方面都与其他头颈部恶性肿瘤有着明显的区别。根据对患者相关数据的统计分析发现,该癌症具有种族易感性、家族聚集性和地区集中性等特性,多见于黄种人,少见于白种人,且在世界上大部分地区发病率都较低,仅在东南亚及北非等地区高发,尤其在中国南方五省,即广东、广西、湖南、福建和江西及其周边地区鼻咽癌的发病率高达十万分之三十(在全球大部分地区鼻咽癌的发病率都低于十万分之一),占当地头颈部恶性肿瘤的首位,且发病率高的民族,在移居之后其后裔仍有较高的发病率。因此该疾病成为我国医学领域迫切需要得到控制和解决的重要问题之一。
目前,在鼻咽癌的治疗上,对于早期患者多采用放射治疗,对于晚期患者多采用同步放化疗,虽然对放化疗敏感,但由于原发部位隐蔽,早期症状不明显,因此在临床上容易出现漏检或误诊,且大多数鼻咽癌恶性程度高,有很强的转移倾向,因此鼻咽癌治疗的失败率仍然相对较高。鼻咽癌患者的高转移水平、高复发风险以及不良预后,使得鼻咽癌的治疗难度增加,且至今仍无根治措施,因此持久有效的新生物标志物以及治疗手段对于鼻咽癌患者而言至关重要。
在鼻咽癌发生和发展过程中,存在大量癌基因的激活、抑癌基因的失活,以及多条信号转导通路的异常改变,但鼻咽癌发生和发展的分子机制目前仍未被阐明。越来越多的研究表明,除蛋白编码基因外,非编码RNA(non-coding RNA,ncRNA)在恶性肿瘤发生和发展过程中起着重要的作用。ncRNA可被人为地分为多种类型,包括微小RNA(microRNA,miRNA)、长链非编码RNA、内含子RNA、环状RNA和胞外RNA等。目前已有广泛的证据表明,miRNA通过与靶向的mRNA结合,对靶基因表达进行调控,使肿瘤患者出现失调现象,表达异常,因此抑制靶基因表达或诱导其降解至关重要。在鼻咽癌的相关研究中,发现miRNA可作为鼻咽癌有效的生物标志物。Wen等人发现的16个miRNA可以成为鉴别鼻咽癌和其他头颈部癌症的第一个有意义的标志物。马俊团队发现了5个与鼻咽癌生存相关的miRNA。刘欢等进行了鼻咽癌关键miRNA的鉴定及其相关的生物信息学分析。与miRNA相比,在ncRNA中,绝大部分是长度超过200核苷酸(nucleotide,nt)的长链非编码RNA(Long non-coding RNA,LncRNA)。目前人类基因组上已经鉴定出的LncRNA基因超过90000个,可以编码超过140000万种不同的转录本,已经远远超过了蛋白编码基因的数目。尽管LncRNA不编码蛋白质,但是它们却在表观遗传、转录和转录后等多个层面调控细胞内的基因表达,从而发挥着重要的生物学功能。尽管目前在鼻咽癌中已有100多个LncRNA被报道,但相对于90000多个已经被鉴定的LncRNA基因来说,这还仅仅是极小的一部分,绝大部分LncRNA在鼻咽癌发生和发展过程中的作用和机制还不清楚。因此在全转录组水平构建鼻咽癌及其对照组织中LncRNA的表达谱,将为筛选和鉴定在鼻咽癌发生和发展过程中具有重要作用的LncRNA,并深入探讨它们在鼻咽上皮癌变过程中的分子机制提供重要参考。但是,目前已有的描述基因调控关系的网络模型尚未将人体内的各种不同类型的基因,如mRNA(Messenger RNA,信使RNA)、miRNA(microRNA,微小RNA)、LncRNA等多维网络模型的节点加以区别,而是将其割裂构成不同二元网络节点进行分析,这样降维无疑会造成有价值信息的丢失,从而使得肿瘤发生和发展过程中的动态变化规律的发现以及关键节点分析更为困难。
异构信息网络作为一种半结构化的表示方式,能够对现实系统进行具体的抽象,并保留现实中的语义信息。异构信息网络将现实系统中不同类型的节点及节点之间的各种丰富的交互关系区别对待,分别建模,因此异构信息网络不仅可以有效地融合更多的信息,而且能够涵盖节点和连接中丰富的语义。通过异构信息网络,可将人体内各种不同类型和不同作用的基因节点建模为同一个复杂信息网络模型中的不同类型节点,完整地描述它们之间的不同交互关系及权重角色。利用网络模式、元路径等异构信息网络特有的概念,可以无损地描述不同类型的节点和交互关系。此外,基于异构信息网络的挖掘算法可以有效发现异构信息网络中各种隐含的模式和交互结构及其变化规律。因此,异构信息网络相关技术对发现基因在鼻咽癌发生和发展过程中的动态变化规律、关键节点、结构演变具有天然的优势。
由于在已有的针对miRNA的研究中已经筛选出一定数量的鼻咽癌相关靶基因mRNA,且在肿瘤转录组中主要描述的是肿瘤细胞中转录的mRNA,本书重点研究的是mRNA与LncRNA之间的基因调控。基于异构信息网络相关技术、基因调控网络相关知识及有关生物信息学手段,构建恶性肿瘤发生和发展相关的LncRNA-mRNA基因共表达网络,通过异构信息网络相似性度量、排名和聚类等技术分析恶性肿瘤发生和发展对应的基因共表达网络的规律,特别关注ncRNA与其他重要生物分子间的相互调控关系,鉴定出下游调控网络中作为关键节点的ncRNA分子,这些ncRNA将在后续临床转化研究中作为恶性肿瘤早期预警和早期诊断的标志物,并成为恶性肿瘤防控的重要靶点。如果能通过这些ncRNA将“非可控性炎症”重新引导为“可控性炎症”,则有可能抑制炎症相关肿瘤的发生,将具有较好的潜在临床应用前景。研究的完成不仅有助于深刻理解炎症相关恶性肿瘤的发生和发展机制,对于完善恶性肿瘤的癌变原理也具有非常重要的理论研究意义。本文提出的基于LncRNA-mRNA的基因共表达网络模型的构建以及对网络相关性的分析等方法,也能为其他类型的基因调控网络分析提供理论支撑,并为异构信息网络分析挖掘提供新的范例。