肺结核病患者外周血转录组表达特征及肺结核生物标志物预测论文_刘巾豪1,刁玉涛2

(1.济南大学 山东省医学科学院医学与生命科学学院 250000;2.山东省医学科学院基础医学研究所 250000)

摘要:目的 基于生物信息学对肺结核潜在的生物标志物进行预测。方法 选取NCBI数据库的肺结核患者外周血数据。借助GEO2R工具,从而获得其中的差异表达基因(DEGs)。应用维恩图获得其中的共表达DEGs,再进一步的应用string数据库构建DEGs所对应的PPI网络,应用cytoscape软件获得上述PPI网络中的hub基因。结果 根据维恩图结果,共获得90个差异基因。其中,同TB关系较为密切的基因为:LRG1,RPAS2,MAPK14,DUSP3,OSM,SOCS3,GATA3,PTPDC1,IRAK3,TLR5,NAIP。根据cytoscape的结果可知,MAPK14、TLR5及IRAK3三个基因可作为TB研究的相关biomarker做进一步研究。结论 MAPK14、TLR5及IRAK3在所分析数据集内都呈现高表达的趋势。可推测,其同TB的发病及痊愈关系密切。而应用生物信息学可以快速锁定靶点,为未来的生物标志物选定,提供依据。

关键词:生物信息学;肺结核;数据挖掘;生物标志物

Objective:to predict the potential biomarkers of tuberculosis based on bioinformatics. Methods:peripheral blood data of tuberculosis patients in NCBI database were selected. With the help of the GEO2R tool,the differentially expressed genes(DEGs)were obtained. The co-expression of DEGs was obtained by using Venn diagram,and the corresponding PPI network was constructed by using string database. Finally,the hub gene in the PPI network was obtained by using cytoscape software. Results:according to the Venn diagram results,a total of 90 differentially expressed genes were obtained according to the operation results in GEO database. Among them,the genes closely related to TB were LRG1,RPAS2,MAPK14,DUSP3,OSM,SOCS3,GATA3,PTPDC1,IRAK3,TLR5,NAIP. According to cytoscape results,MAPK14,TLR5 and IRAK3 could be used as the relevant biomarkers for TB research. Conclusion:MAPK14,TLR5 and IRAK3 showed a trend of high expression in the analyzed data sets. It is speculated that it is closely related to the pathogenesis and recovery of TB. The application of bioinformatics can quickly locate the target and provide the basis for the selection of future biomarkers.

Keywords:bioinformatics,tuberculosis,data mining,biomarkers

结核(Tuberculosis,TB)主要由感染结核分枝杆菌(Mycobacterium tuberculosis,MTB)引起,其为临床常见的慢性传染性疾病,该病主要通过呼吸道传播,其临床致病的部位主要有肺、骨、肠、肾及神经系统等组织及器官[1]。其中,以肺结核(pulmonary tuberculosis,PTB)最为常见。其主要传染源为感染者,该疾病往往通过空气传播,并在亲密接触者中感染。从此角度而言该病的传播性强,极易造成社会压力。

虽然该病在及时诊断及合理治疗的基础之上,可快速的获得痊愈。然而,其早期临床诊断往往是通过涂片及X光片进行[2]。临床敏感度不高且容易出现误诊,快速的判定结核病的发病及相关的靶点基因,是解决上述问题的关键[3]。随着基因组学的发展,通过生物信息学的技术及方法,研究者可以通过已经报道的数据进行数据挖掘,从大量的数据中,挖掘出重要的信息,即可通过已知数据库中的数据集,获得同肺结核发病相关的重要基因[3]。本研究拟借助生物信息学的手段,对以往已经报道过的TB相关的转录组数据进行分析,以获得了同TB发病相关的生物标志物。

1.资料与方法

一、一般资料

为了获得TB患者外周血的转录样本及对其进行进一步的深入分析,本研究中所涉及到的高通量基因表达数据库资源如表1所示。

根据本研究的需要,我们在NCBI的GEO数据库中[4],以肺结核病(tuberculosis)为关键词对该数据库内的数据进行了搜索。共获得6819个结果,其中,属于人属的数据集共计177例。

进一步对上述数据结果进行细分。要求起满足如下几个要求:1. 样本为外周血数据。2.样本为TB患者/TB痊愈患者/志愿者的转录组数据。3.样本需包含至少两个组别,分别为治疗前患者的外周血转录组数据,及治疗后或志愿者的外周血转录组数据。经过上述三个要求的筛选,共获得符合要求的数据集共计三个,分别是GSE31348,GSE36238及GSE19435。

所获得三个数据集来源如表2所示,其中,GSE31348由伦敦卫生及热带医学学院提供。共计27例样本,分析上述TB患者治疗前、第1周、第2周、第4周及第26周的患者外周血数据。GSE36238亦由上述机构提供。样本数共计9例,主要是考察了9例治愈患者中,在治疗前后(26周),其外周血的转录组数据。GSE19435样本由美国贝勒免疫研究院提供。纳入的样本数共计12例志愿者,7例患者治疗前、治疗2月及治疗12月后的外周血转录组样本。根据GEO数据库的内容,最终形成了本研究同TB相关的差异基因初始数据。并在上述三个数据集的基础之上,对所得到的转录组数据进行系统的分析。

2.结果

一、TB患者外周血内转录组数据的DEGs分析

应用GEO数据库内自带的GEO2R对表二中的相应数据进行分别分析,筛选条件:p值≤0.01。另,对GSE36238内的数值,再取logFC值,使其保证logFC值>1,及logFC值<-1。根据获得的结果,筛选出各数据集。

对获得的DEGs数据,应用R语言的Venn Diagram包,制得相关的维恩图如图1所示,同时得出相关的重叠基因共计90个。

图2 TB患者血清内DEGs的蛋白互作关系图

根据图2的结果可知,由图1筛选出的DEGs形成了一个关系紧密的复杂的PPI网络。其中以MAPK14为核心的所形成了蛋白网络所涉及到的蛋白最多。另外,亦有一些DEGs形成了关系简单的蛋白互作网络。该结果证明,在TB发生及痊愈的过程中,起所对应形成的蛋白网络及其复杂。

三、TB患者的DEGs的Go及KEGG功能富集

图3:TB患者DEGs的Hub基因情况

最终可知,TB患者外周血内的Hub基因有3个,分别是MAPK14、TLR5及IRAK3。以上述三个基因为核心,最终调控了TB的发病及痊愈情况。

3.讨论

本研究通过挖掘高通量基因表达数据库(Gene Expression Omnibus,GEO)中存档的基因表达谱芯片,应用GEO自带的GEO20分析其中的差异表达基因(differentially expressed genes,DEGs),以文氏图获得其中共同差异基因。同时,将所获得的差异基因,应用srting数据库进行蛋白互作关系分析,获得其中的关键信号通路,并提取其中存在互作关系蛋白进行进一步的功能分析。

对已经获得的核心DEGs,应用基因本体学(gene ontology,GO)及KEGG(Kyoto Encyclopedia of Genes and Genomes)功能分析,获得上述DEG的功能,再进一步的应用cytoscape功能,对上述DEGs进行互作关系分析,以获得其中对调控最为核心的DEGs。本研究旨在解释外周血在TB发生中的作用,并判定其中同TB相关的biomarker的临床意义。根据研究结果,最终获得的可作为biomarker进行进一步深入研究的基因,分别是MAPK14、TLR5及IRAK3。

MAPK是信号从细胞表面传导到细胞核内部的重要传递者。作为TLR信号通路下游重要的调控枢纽,主要主导着各种分子进行的跨膜转运过程,并通过上述方式,直接刺激细胞的各种炎症反应以及应激反应,另,其也参与到细胞内部的增殖、分化及凋亡等一系列过程[5]。而在TB发病的过程中,MAPK通路起到了重要作用[6-9]。现有的研究表明,MAPK可作为miRNA及的作用靶点。而通过配合lncRNA,可以在MAPK通路上,挑选大量的biomarker作为TB未来研究的标志物。

在MAPK家族中,MAPK14(p38α)广泛的存在于人体的组织内。其传导的信号主要通过上调MKK3/MKK6的表达,进一步介导p38基因的转录,刺激p38基因产生相应生物学功能。因此,当MAPK14被激活后,其会诱导下游的蛋白以及相应的信号通路,产生相应的炎症级联反应,通过磷酸化下游的蛋白激酶和转录因子的方式,刺激细胞内部TNF-α、IL-6及IL-12等炎症因子的表达[10]。

作为MAPK调节的重要上游蛋白,Toll样受体(Toll-like receptors,TLR)是参与非特异性免疫(天然免疫)的一类重要蛋白质分子,也是连接非特异性免疫和特异性免疫的桥梁。其将外源性的信号,通过TLR-MAPK通路传导至细胞内部,从而介导后续的炎症反应。作为调节人体内部重要的信号通路,TLR5可经由MAPK通路,直接调节细胞内部IL-8的表达[11]。而IL-8作为TB发病的重要标志物,被广泛的报道[12-16]。另,现有的研究表明,在TB发病的过程中,TLR往往出现表达异常,如TLR2、TLR3、TLR4和TLR8表达水平与健康对照组有差异,然而,并无针对TLR5的相关文献报道[4.14-15.17]。因此,以MAPK14配合TLR5作为TB的特异性biomarker,潜力巨大。

IRAK 家族主要介导了TLR 和白细胞介素 1 受体(interleukin-1,IL1-R)信号通路,表达于单核/巨噬细胞和部分上皮细胞等其主要调控信号内部的信号网络以及炎症反应的发生[18]。作为其中之一的IRAK3(IRAKM),其主要通过下游的TLR信号通路,介导各种免疫反应的发生,现在并无其统TB的相关报道。IRAMK被证实在脓毒症发病过程中,起到了重要的作用[10,19-20]。另,其在肺炎中,也有异常表达。本研究显示,在TB患者的外周血转录组内,IRAK3亦存在着表达的异常,且其同MAPK14及TLR5的特异性高度相关。可以肯定,在TB发病的过程中,MAPK14、TLR5及IRAK3所形成的PPI互作网络,对自身的机体免疫与调节,起到了至关重要的作用。由于上述三种biomarker在TB的研究中报道较少,因此,不论是从TB发病机制的角度出发,或者miRNA靶向治疗的角度出发,亦或是未来biomarker的研究出发,都有重要的意义。

限于NCBI数据库中针对TB的样本较少,因此,本研究的取样难免产生误差,特别是入选样本,针对差异基因的表达是否会影响最终的结论,尚需进一步的临床及实验室验证方可确定。然而,应用生物信息学手段,对现有的数据进行系统的数据挖掘,以获得疾病相关的Hub基因或者潜在的biomarker,是一种十分有效的手段。

参考文献

[1] 陈大川,王在义. 肺结核诊断的研究进展[J]. 临床肺科杂志,2016,卷缺失(1):145-148.

[2] 李文文,冯喜英,关巍. 结核病诊断与治疗的研究进展[J]. 中华肺部疾病杂志:电子版,2016,9(2):204-206.

[3] 王杰. 肺结核误诊52例回顾性分析[J]. 中国冶金工业医学杂志,2017,34(5):552-553.

[4] T B,Se W,P L,et al. Ncbi Geo:Archive for Functional Genomics Data Sets--update.[J]. Nucleic Acids Research,2013,39(Database issue):10-1005.

[5] 刘亚楠,徐秋林,郭晓华,等. MAPKs家族在中暑小鼠肺微血管内皮细胞凋亡中的作用及机制研究[J]. 解放军医学杂志,2017,42(4):279-284.

[6] 陈钟梁. 基于血浆lncRNAs芯片技术的肺结核病潜在生物学标志物的筛选与鉴定[D]. [出版地不详]:学位授予单位缺失,2018.

[7] 刘耀婷. 结核病感染过程中单核细胞表型变化及其机制的研究[D]. [出版地不详]:学位授予单位缺失,2009.

[8] 申培. 巨噬细胞IRAK-M分子促进结核分枝杆菌胞内存活机制的研究[D]. [出版地不详]:学位授予单位缺失,2016.

[9] 魏晶,张晨晨,张国良,等. 高通量测序技术分析肺结核患者PBMC基因表达谱差异[J]. 中国免疫学杂志,2013,29(6):639-643.

[10] 高金梅. CysC对脓毒症预后的评估价值和IRAKM基因多态性与脓毒症关系的研究[D]. 天津:学位授予单位缺失,2012.

[11] Yu Y,Zeng H,Lyons S,et al. Tlr5-mediated Activation of P38 Mapk Regulates Epithelial Il-8 Expression Via Posttranscriptional Mechanism.[J]. Gastroenterology,2003,124(4):0-0.

[12] 李继翰,曹新瑞. 外周血内IL-37、IL-8、IL-6水平与活动性肺结核患者病情的相关性[J]. 热带医学杂志,2017,17(10):1389-1392.

[13] 张宁,王珂,张霞. 肺癌和肺结核相关生化指标变化及鉴别诊断[J]. 西北国防医学杂志,2016,卷缺失(9):596-598.

[14] 闫凌丽,吕志宇. PCT、CRP、IL-6、IL-8在胸腔积液中的鉴别诊断价值[J]. 四川医学,2016,37(10):1137-1140.

[15] 闫凌丽,Yanling-li. PCT、TNF-a、IL-6、IL-8在胸腔积液诊断中的应用价值[J]. 临床肺科杂志,2016,卷缺失(11):2071-2073.

[16] 习建冬. 黄芪注射液对肺结核患者纤维化及细胞因子的影响研究[J]. 海南医学院学报,2016,22(2):138-140.

[17] 林欣芳. TOLL样受体2、3、4、8在肺结核患者外周血单个核细胞的基因表达及意义[D]. 广州:广州医科大学,2015.

[18] 尹卫国,肖建华. IRAK家族在TLR介导的信号通路中的功能和意义[J]. 中南医学科学杂志,2012,40(2):109-115.

[19] 金培培. IRAK-M表达调控机制的初步研究[D]. 上海:学位授予单位缺失,2016.

[20] 张向莲,高金梅,魏殿军. 脓毒症与IRAKM基因多态性的相关性[J]. 中国卫生检验杂志,2013,卷缺失(16):3210-3211.

论文作者:刘巾豪1,刁玉涛2

论文发表刊物:《航空军医》2018年17期

论文发表时间:2018/11/21

标签:;  ;  ;  ;  ;  ;  ;  ;  

肺结核病患者外周血转录组表达特征及肺结核生物标志物预测论文_刘巾豪1,刁玉涛2
下载Doc文档

猜你喜欢