卤化酶阳性链霉菌Streptomyces论文_吕玉红,保玉心,李园园,李晓倩,王荫荫,王苗,邵

吕玉红保玉心李园园李晓倩王荫荫王苗邵美云岳昌武（通讯作者）黄英（通讯作者）

(遵义医学院贵州省微生物资源及药物开发特色重点实验室贵州遵义 563003)

【摘要】利用第二代技术对分离自贵州梵净山的链霉菌分离菌株Streptomyces sp.FJS31-2进行基因组测序，测序结果组装后利用相应生物信息学软件进行分析，预测其次级代谢产物生物合成基因簇，为相应产物的开发提供了理论依据和物质基础。

【关键词】链霉菌；基因组测序；基因簇；次级代谢

【中图分类号】R31 【文献标识码】A 【文章编号】2095-1752（2015）29-0050-03

1.前言

链霉菌来源的卤化天然产物是抗生素的重要来源，美国FDA在2014年新批准上市了4种新抗生素，其中3种为卤化产物（Dalvance 和Orbactiv为氯化产物、Sivextro为氟化物）[1-3]。

链霉菌来源卤化物生物合成基因簇克隆、解析可为卤化产物的基因组资源挖掘、卤化天然产物的发现提供参考[4]。大量的链霉菌基因组分析结果表明，链霉菌至少具备编码20个次级代谢产物的能力。对链霉菌基因组进行扫描，可以快速的获得链霉菌编码次级代谢产物潜力信息，为次级代谢产物的开发利用提供最直接的理论依据，正为越来越多链霉菌天然产物开发者所采用[5,6]。

典型生境链霉菌可能是新抗生素重要来源，梵净山地区生态环境的独特性和原始性为人们获得新的抗生素产生菌提供了良好的条件[7]。本文以课题组分离的1株梵净山来源卤化酶基因阳性链霉菌为研究对象，对其基因组测序。在分析其次级代谢潜力的基础上，着重分析其卤化天然产物的产生潜力，为天然产物的开发等后续的研究提供第一手的信息。

2.材料与方法

2.1 实验菌株

链霉菌Streptomyces sp.FJS31-2分离自贵州梵净山海拔1000m土壤样品，其次级代谢相关基因筛选为卤化酶、非核糖体肽合成酶、I型聚酮合酶和II型聚酮合酶阳性，III型聚酮合酶阴性。菌株发酵产物具有抗枯草芽孢杆菌、金黄色葡萄球菌、绿脓杆菌及白色念珠菌等测试菌活性。

2.2 链霉菌基因组测序策略

采取shotgun测序策略，利用用高通量Illumina测序技术对该样品的DNA进行paired-end测序，构建了500bp的文库，期望数据量为1000Mb。整个测序流程包括：基因组DNA获取、基因组DNA片段化及回收、测序文库构建、桥式PCR扩增、Illumina Hiseq 2000测序等。

2.3 链霉菌基因组测序原始结果处理[8]

基因组组装利用SOAP de novo v2.04 (http://soap.genomics.org.cn/)拼接软件对优化序列进行多个Kmer参数的拼接，得到最优的组装结果。其次，运用GapCloser v1.12软件对组装结果进行局部内洞填充和碱基校正。测序产生的序列数据的信息分析流程的具体步骤包括：测序数据过滤、de novo组装及组装后的评价、基因预测 (ORFs)、基因功能的注释 (KEGG/COG)。

2.4 次级代谢基因簇分析[9]

利用在线预测工具antiSMASH (http://antiSMASH.secondarymetabolites.org)在线预测分析3株链霉菌可能包含的次级代谢基因簇。主要流程包括：大片段DNA序列系统进化谱相似性检测(Detecting smCOGs for contig)和基于大片段次级代谢蛋白功能相似性比对分析的次级代谢基因簇预测 (ClusterBlast analysis for contig)等步骤。按照基因簇结构基因与同源基因的氨基酸残基的最大相似性预测同源基因簇。

3.结果与分析

3.1 原始测序数据质控

S.sp.FJS31-2菌株的 Illumina Hiseq 2000原始数据的质控图（图1）表明该测序文库虽然GC含量极高，但是碱基测序质量良好，可用于后续分析。该文库碱基分布均匀，但是由于GC含量异常高，高于70%，导致Illumina测序平台的结果Reads的后端质量较差。

图1.原始数据碱基质量分布

注：横坐标是reads碱基坐标，纵坐标是reads的碱基质量(Solexa Scale: 40=Highest，-15=Lowest)，图中垂直红线“Ⅰ”指定的范围是所有reads碱基的综合质量，红色垂直方块是质量的四分位值范围，加黑粗线是质量值的中位数

3.2 测序结果及次级代谢潜力预测分析

链霉菌S. sp. FJS31-2基因组全长约11.6 Mb，G+C摩尔%为70.73%，其中基因编码区全长约8.84 Mb，占基因组比例为76.2%，其G+C摩尔%为70.5%。预测到该基因组约有10877个编码基因，基因的平均长度为812 bp。

次级代谢基因簇预测结果表明 (表1)，链霉菌S. sp. FJS31-2基因组中包含7类，预测出23个次级代谢产物合成基因簇，其中3个萜类基因簇、3个铁离子载体类基因簇、2个II型聚酮类基因簇、4个NRPS类基因簇、7个I型聚酮类基因簇、3个羊毛硫抗菌肽类基因簇以及1个ectoine基因簇。其中包含一个卤化酶II型PKS类产物基因簇和1个卤化短肽类产物基因簇。

4.结论与讨论

微生物天然产物开发过程曾流行“新环境、新基因、新产物”这样观点，认为微生物在典型生境中长期进化会获得一些特殊的基因，在此基础上可能会积累一些编码特殊的产物合成新结构基因或催化某些特殊反应类型的修饰基因等。本文选取内陆山地来源的S.sp.FJS31-2菌株包含次级代谢基因簇23个。课题组也曾对与S.sp.FJS31-2来自同一生境的95株链霉菌分离菌株进行了次级代谢相关基因的勘探[10]，结果FAD依赖卤化酶基因阳性率仅为不到8.5%（8/95）、I型PKS基因阳性率为23.4%（22/95）、II型PKS基因阳性率为38.3%（36/95）、NRPS基因阳性率为 68.1%（64/95）.说明即使同一生境来源的链霉菌，其次级代谢潜力之间差别也是很明显的。基于此，我们认为生境来源和链霉菌的次级代谢潜力之间关联值得进一步探讨。

作为高G+C mol%的物种，多数链霉菌G+C mol%高达70%以上，基因组中存在众多的重复序列，特别是I型PKS和NRPS编码基因中相关模块的相似性很高，这就给基因组测序的拼接带来诸多不便，甚至会导致拼接错误或者基因组被割裂很成很多个支离破碎的片段，极大的影响了次级代谢基因簇的预测准确性。而通过构建基因文库，利用一代测序技术虽然可以有效的避免这个问题，但存在中周期长、成本高的问题。如果将二者的优势结合，采取基因组测序辅以基因组文库构建方式，在基因组survey测序并预测其次级代谢潜力基础上，利用特异引物筛选基因组文库中包含次级代谢基因簇碎裂片段的阳性克隆，构建亚克隆文库，利用一代测序技术有针对性地包含次级代谢基因的文库克隆进行测序，将是获得链霉菌次级代谢潜力信息的快捷途径。

【参考文献】

[1] Traynor K.2014. Dalbavancin approved for acute skin infections. Am J Health Syst Pharm. 71(13):1062.

[2] Tacconelli E, Kern WV. 2014. New antibiotics for skin and skin-structure infections. Lancet Infect Dis. 14(8):659-661.

[3] Markham A. 2014. Oritavancin: first global approval. Drugs. 74(15):1823-1828.

[4] Ochi K, Hosaka T. 2013. New strategies for drug discovery: activation of silent or weakly expressed microbial gene clusters. Appl Microbiol Biotechnol. 97(1):87-98.

[5] Borodina I, Krabben P, Nielsen J. 2005. Genome-scale analysis of Streptomyces coelicolor A3(2) metabolism.Genome Res. 15(6):820-829.

[6] Weber T. In silico tools for the analysis of antibiotic biosynthetic pathways. Int J Med Microbiol. 2014, 304(3-4):230-5.

[7] 邵美云,李园园,岳昌武,王苗.2014.抗多种病原微生物菌株的分离与鉴定.贵州农业科学.42 (7):88-92.

[8] Li RQ, Zhu HM, Ruan J, Qian WB, Fang XD, Shi ZB, Yingrui Li, Li ST, Shan G, Kristiansen K, Li SG, Yang HM, Wang J, Wang J.De novo assembly of human genomes with massively parallel short read sequencing.Genome Res. 2009,20: 265-272

[9] Blin K, Medema MH, Kazempour D, Fischbach MA, Breitling R, Takano E, Weber T. antiSMASH 2.0--a versatile platform for genome mining of secondary metabolite producers. Nucleic Acids Res. 2013,41: W204-212

[10] Gao P, Huang Y. 2009. Detection, Distribution, and Organohalogen Compound Discovery Implications of the Reduced Flavin Adenine Dinucleotide-Dependent Halogenase Gene in Major Filamentous Actinomycete Taxonomic Groups. Appl Environ Microb. 75:4813-4820.

基金资助：国家自然科学基金(31160004)，(31460008)；贵州省科学技术基金 [(2010)2156)]、[(2012)2348)]；贵州省社会发展科技攻关计划[(2013)3013)].

论文作者:吕玉红,保玉心,李园园,李晓倩,王荫荫,王苗,邵

论文发表刊物:《医药前沿》2015年第29期供稿

论文发表时间:2015/12/23

标签：基因论文; 次级论文; 霉菌论文; 基因组论文; 产物论文; 碱基论文; 菌株论文; 《医药前沿》2015年第29期供稿论文;

卤化酶阳性链霉菌Streptomyces论文_吕玉红,保玉心,李园园,李晓倩,王荫荫,王苗,邵

猜你喜欢