水稻叶绿体基因组序列的拼装验证和多态性分析

水稻叶绿体基因组序列的拼装验证和多态性分析

曾万勇[1]2002年在《水稻叶绿体基因组序列的拼装验证和多态性分析》文中进行了进一步梳理在对超级杂交水稻“两优培九”的父本93-11和母本培矮64S采用鸟枪法进行核基因组测序的过程中,积累了大量的细胞质基因组序列。以国际上已经发表的水稻日本晴(Nipponbare)叶绿体基因组序列为基础,用Blast从培矮64s和93-11的测序数据库中调出同源序列各5万余条。通过Phrap软件,用这些序列组装了完整的培矮64S和93-11叶绿体基因组序列。研究结果发现:1.培矮64s叶绿体基因组大小为134,559bp,93-11叶绿体基因组为134,505bp,与已知的日本晴叶绿体基因组(大小为134,525bp)存在长度差异。2.通过分子生物学实验方法论证了组装策略的正确性。3.通过序列比较分析了培矮64S和93-11与日本晴的叶绿体基因组的单核苷酸多态性(SNP)和多碱基插入缺失(InDel)变化。4.通过设计引物进行PCR扩增,验证了在日本晴、培矮64S和93-11之间存在的叁个片段69bp、32bp和15bpTnDel插入缺失变化。证明了在93-11中69bp缺失和32bp重复是真实存在的。15bp的差异则可能是由于日本晴叶绿体基因组原序列的拼接错误引起的。5.设计引物并选取27个材料对这两个片段差异进行PCR扩增。结果发现69bp片段缺失与否与材料的籼粳属性有关(只有窄叶青除外),32bp带型与69bp带型相关。研究结果印证了前人的结论,即69bp的片段差异的确与籼稻和粳稻分化有关系。山于32bp与69bp片段的带型相关,说明32bp片段差异也与籼粳分化有关系。6.对水稻叁个材料的叶绿体基因组GC含量分析表明,材料间GC含量差异较小:93-11为39.00%;培矮64S为38.52%;日本晴为38.99%。这表明可能在水稻亚种间叶绿体基因组在DNA组分上也是非常保守的。7.叁个材料叶绿体基因组中分别预测到339、332、328个ORF区,其中非重迭的ORF均为40个,最长的ORF有4,626 bp,与其他物种差异很大。

张扬勇[2]2011年在《甘蓝类蔬菜的细胞质DNA多样性研究》文中研究表明甘蓝类蔬菜(Brassica oleracea L.)属于十字花科芸薹属,包含结球甘蓝、青花菜、花椰菜、球茎甘蓝、芥蓝、羽衣甘蓝、抱子甘蓝等七个栽培变种。2006年全国结球甘蓝(Brassica oleracea var. capitata L.)的种植面积达93.73万公顷。结球甘蓝杂交种的生产主要利用自交不亲和系和雄性不育系两种途径,其中雄性不育系包括显性核基因雄性不育(DGMS)和改良的Ogura萝卜胞质不育(CMS)。但雄性不育系的利用存在胞质单一的风险。从分子水平研究甘蓝变种间和变种内的细胞质DNA多态性,为显性雄性不育系和胞质不育系的胞质多样化提供科学依据,而且对于阐明甘蓝各变种的进化路线具有重要意义。本研究利用甘蓝类蔬菜不同变种间和变种内材料,以开发的叶绿体SSR(cpSSR)和线粒体SSR(mtSSR)引物进行多态性筛选;利用全基因组重测序结果,全面揭示六份结球甘蓝材料间的细胞质DNA多样性;以获得的特异SNP或CAPS标记进行Ogura CMS不育系或DGMS不育系胞质多样性的验证。研究结果如下:1.利用已公布的拟南芥叶绿体、油菜线粒体全基因组序列,首次开发出可在结球甘蓝上应用的cpSSR和mtSSR引物。分别搜索获得89个叶绿体基因组SSRs(cpSSRs)、29个线粒体基因组SSRs(mtSSRs),SSR出现频率分别为1.736 kb/ 1个SSR、7.650 kb/ 1个SSR。针对这些SSR设计cpSSR引物58对、mtSSR引物21对,能在结球甘蓝上应用的cpSSR引物32对、mtSSR引物21对。在32对cpSSR引物中,5对引物在结球甘蓝自交系C300、C322和波里马油菜N478、N479间有扩增产物多态性,这些多态性片段均位于基因内含子区或基因间隔区。多态性片段测序结果显示单核苷酸A/T重复数从8个到13个不等,相似性比较表明C300、N479间的相似性大于两者与拟南芥之间的相似性。21对mtSSR引物均未在甘蓝C300、C322和波里马油菜N478、N479间检测到多态性,表明线粒体DNA的保守程度比叶绿体要高。这些细胞质SSR引物在结球甘蓝上的成功应用,为甘蓝类蔬菜细胞质多样性研究提供了基础。2.利用开发的cpSSR引物进行甘蓝类蔬菜不同变种间细胞质DNA多态性筛选,首次获得了具有变种特异性的叶绿体单核苷酸多态性(SNP)标记,并成功将其转化为dCAPS标记。以32对在结球甘蓝上应用的cpSSR引物对结球甘蓝、青花菜、花椰菜、芥蓝、球茎甘蓝等5个不同变种进行标记筛选,在聚丙烯酰胺凝胶电泳上没有获得扩增产物长度多态性。对这32对引物的PCR扩增产物进行测序,利用DNAstar软件比对发现1个SNP位点,该位点初步呈现变种特异性。为简便快速鉴定该SNP位点,将其成功转化为衍生的酶切扩增多态性序列(dCAPS)标记—ACP43-93 RsaⅠ。以该dCAPS标记对甘蓝类蔬菜不同变种的206份材料进行筛选,进一步验证了该标记的变种特异性。全部花椰菜和大部分青花菜为同一单元型,其它甘蓝变种为另一单元型,由此推测青花菜和花椰菜的分化时间相对较晚。同时,利用叁个甘蓝变种的雄性不育回交群体明确了该叶绿体SNP为母性遗传标记。3.采用Solexa基因组重测序方法,以结球甘蓝02-12新组装的叶绿体和线粒体基因组全长序列为参考,全面揭示六份结球甘蓝材料(Ogura CMS R_1、R_2、R_3、自交系60Tian、87-534、DGMS87-534)的叶绿体、线粒体基因组DNA序列多态性。与02-12相比,异源胞质雄性不育材料Ogura CMS R_1、R_2、R_3在叶绿体基因组水平上的SNP个数分别为1010、357、62,在线粒体基因组水平上的SNP个数分别是630、599、108,这些不育系的SNP数量在Ogura CMS R_1、R_2、R_3中呈现逐步减少的趋势,表明异源胞质含量越少,胞质不育系的应用前景就好。与结球甘蓝自交系Bo-1相比,Ogura CMS R_3特有的9个叶绿体SNPs、49个线粒体SNPs、3个线粒体插入和缺失变异(InDels),将为今后Ogura胞质不育系的进一步改良提供有效的筛选标记。在叁份结球甘蓝材料Bo-1、Bo-7、Bo-8中,各自特有的叶绿体SNP个数分别为4、21、0,线粒体SNP个数分别为9、18、2,特有的线粒体InDels个数分别为0、3、0,表明结球甘蓝变种内材料间具有细胞质多样性,为DGMS不育系的胞质多样化提供依据。4.以开发的32对cpSSR和21对mtSSR引物,对两种可实用的结球甘蓝Ogura CMS不育源CMS R_3、CMS HY进行分子鉴别,发现了在可实用Ogura胞质不育源中的胞质多样性。在cpSSR水平上,无法在聚丙烯酰胺凝胶电泳上获得多态性,经测序仅发现两种不育源在ACP9引物上存在SSR重复数的变异。在mtSSR水平上,仅mtSSR_2引物可以在聚丙烯酰胺凝胶电泳上区分这两种不育源,经测序发现其余5对mtSSR引物的扩增产物上存在9个多态性差异,其中3个为SSR位点重复数的变异。将其中2个可被MseⅠ酶切的多态性位点转化成CAPS标记,分别命名为m92-143 MseⅠ、m1-346 MseⅠ。这些标记表明CMS HY是一种不同于CMS R_3的改良结球甘蓝Ogura CMS雄性不育源。以CMS HY为不育源进行3个优良结球甘蓝自交系的转育,现已获得回交6代、花器官正常、结实性良好的优良雄性不育系。因此通过鉴别两种可实用的Ogura CMS不育源,发现了在可实用Ogura胞质不育源中的胞质多样性。5.采用微量花粉回交法,成功获得替换胞质的DGMS-T不育系四份,并进行了胞质来源鉴定。以结球甘蓝DGMS不育系微量花粉为父本,以不育系相应保持系为母本,杂交后获得了四份DGMS-T不育系——07-556、07-1005、07-1006、07-1007。田间鉴定表明在DGMS不育系的不育性遗传、不育稳定性、花器官形态、结实性、田间植株性状等方面,胞质替换前后并没有显着性差异。以DGMS不育源79-399-3及回交父本60Tian间特有的SNP标记和CAPS标记,验证了不育系DGMS-T 60Tian的胞质来源为其回交父本。总之,本研究的微量花粉回交法提供了一条实现DGMS不育系胞质多样化的途径,DGMS不育系胞质的成功替换实现了DGMS不育系的胞质多样化。

聂小军[3]2013年在《基于高通量测序技术的小麦和紫茎泽兰基因组学初步研究》文中提出基因组是一个物种的所有遗传信息的总和。基因组学就是在基因组水平上研究一个物种的序列结构、基因功能、表达调控网络以及代谢途径,是研究生命现象本质的科学。由于基因组庞大和结构复杂,植物基因组学研究一直是基因组学研究的难点和挑战。新一代高通量测序技术的产生和发展为非模式植物基因组学研究带来了新的机遇和契机。本研究采用IlluminaSolexa测序技术,以两种的非模式植物小麦和紫茎泽兰为研究对象,对小麦的单条染色体臂(7DL)进行的探查测序,对紫茎泽兰的核基因组、叶转录组和叶绿体基因组进行了测序及序列分析,以期获得大量的序列信息,揭示它们的基因组结构和遗传特征,建立其基因组学研究的平台。主要研究结果如下:(1)小麦7D染色体长臂(7DL)的探查(Survey)测序与序列分析。首先,利用细胞流式仪分离小麦品种中国春7DL染色体的染色体DNA,然后利用Illumina Hiseq2000测序平台进行高通量测序,共产生了14.54Gb的数据,大约覆盖整个染色体臂40倍,利用短序列拼接软件Velvet进行De novo拼装,获得了160,021条大于200bp的contigs,总长达223Mb,覆盖了整个染色体臂65%;然后,对7DL上的功能基因进行了初步预测,共预测鉴定了各类重要的功能基因2,893个,其中2,573个能够被GO注释,这为7DL重要功能基因的克隆与功能研究提供重要的资源;进一步,采用生物信息学方法预测了编码20个miRNA家族的149个miRNA前体,并利用荧光定量PCR对随机挑选的5个miRNA在小麦不同组织中的表达量进行了分析,初步验证了预测结果的可靠性;最后,对拼接序列中的重复元件进行分析,预测了120,262转座子重复元件和16,325个微卫星重复元件,重复序列比例达84.8%,随机挑选了33个位点开发SSR标记并在20个小麦品种进行多态性验证,最终发现90%的引物能扩增,多态性标记达80%,利用缺体-四体检验发现18个标记是小麦7D所特异的,这为染色体特异分子标记的开发提供了一条新的思路。(2)原生地和入侵地紫茎泽兰叶转录组的de novo测序与比较分析。本研究利用Illumina GAIIx测序平台对原生地和入侵地紫茎泽兰的叶转录组进行了de novo测序,各测序了4G的数据量,混合所有数据进行序列拼装,共获得了127,189unigenes,这是作为紫茎泽兰平均基因长度为702bp;通过与nr等数据库比对,有53,886个Unigene能够被注释,占总Unigene数的42.37%;GO注释可以将41,481个Unigene注释到3大类65亚类的GO分类上,COG分析可以将17,498个Unigene注释到25种COG功能类型,主要功能包括细胞信号转导、次生物质生物合成、细胞代谢等;KEGG分析能把18,306个基因定位到297个代谢通路中,包括信号转导、物质代谢和次生代谢产物生物合成等。根据转录本表达丰度分析(RPKM值),共筛选出9,495条差异表达的基因(︱log2Ratio︱≥1且FDR≤0.001),这些基因可能与紫茎泽兰的入侵和适应进化相关,GO富集和KEGG富集分析发现他们的功能主要集中在次生代谢物生物合成和植物信号转导。(3)紫茎泽兰叶绿体基因组的测序与菊科叶绿体的比较基因组学分析。利用Illumina GAII测序平台对紫茎泽兰的叶绿体全基因组进行了测序。拼接获得了全长150,698bp的完整紫茎泽兰叶绿体基因组,这是第一个被测序的菊科泽兰属叶绿体基因组。它具有典型的真核生物叶绿体基因组结构,由一个长度为84,815bp的长单拷贝区(LSC),一个18,358bp的短单拷贝区(SSC)和一对长度为23,755bp的反向重复序列组成,共编码130个基因,其中蛋白编码基因86个,31个tRNA基因和4个rRNA基因,17个基因含有内含子。对紫茎泽兰叶绿体基因组中的重复元件进行预测,共鉴定出了31个串联重复元件和28离散重复元件,为叶绿体分子标记开发提供了重要资源。同时,利用本次测序的紫茎泽兰叶绿体基因组和公共数据库检索中收录的5个其他菊科叶绿体,在全基因组水平对菊科叶绿体的基因组成、序列差异和基因组结构等进行了比较基因组学分析,鉴定了5个(ndhD-ccsA, psbI-trnS, ndhF-ycf1, ndhI-ndhG和atpA-trnR)潜在的可用于菊科分子鉴定的叶绿体位点。最后,取33个叶绿体基因组中的35个基因组成序列矩阵,进行分子进化分析,发现紫茎泽兰与油菊的亲缘关系较近。(4)紫茎泽兰部分核基因组微卫星序列特征分析与SSR分子标记开发。利用高通量测序技术对紫茎泽兰总DNA进行了2倍覆盖度的探查测序,拼接获得了58,432个大于200bp的序列片段。利用这些序列对紫茎泽兰基因组微卫星序列的特征进行了分析,共鉴定到3,012个SSR位点,其中两碱基的重复是最丰富的重复类型;利用鉴定的SSR位点,开发了30个紫茎泽兰特异的SSR分子标记,并在24个材料中对标记的多态性进行了验证,结果发现,15对引物表现出多态性,等位位点数在2-5个,平均每个位点3个,遗传多样性指数(PIC)范围为0.08-0.59,平均值为0.30,期望杂合度(He)的范围为0.08-0.63,平均值为0.37;观测杂合度(Ho)的范围为0到1,平均值为0.44。本研究首次报道了紫茎泽兰的SSR分子标记,这些多态性标记将为紫茎泽兰的群体遗传学和分子生态学研究提供重要工具。

王晓明[4]2013年在《水稻及其重要病原真菌BAC相关资源的构建和分析》文中进行了进一步梳理水稻是重要的粮食作物,为全世界超过50%的人口提供营养,也是禾本科研究的模式生物。绿色革命和杂交水稻使得水稻产量在1960年之后翻了一倍,但是传统育种手段很难再使水稻产量大幅飞跃。伴随着全球人口的快速增长和农作物病虫害的日益严重,我们面临着越来越严峻的粮食短缺问题。水稻及其真菌性病原菌大片段基因组文库和物理图谱在其基因组比较分析、基因组序列拼接和图位克隆等研究中具有重要价值,对提高水稻产量和控制水稻病害有着重要的意义。籼稻品种明恢63和珍汕97是我国种植面积最大的杂交水稻汕优63的父母本,蕴藏着众多优良性状相关基因,基于它们所构建的重组自交系群体在产量相关QTL的鉴定和分析中发挥了重要作用。我们构建了具有基因组10倍覆盖度的明恢63和珍汕97的BAC文库,对每个文库中一半的克隆进行了双末端测序和指纹图谱分析,并构建基于BAC的物理图谱。然后以克隆重迭群中的末端序列作为桥梁,将明恢63和珍汕97的物理图谱比对到粳稻日本晴和籼稻93-11的全基因组序列上,分别构建了栽培稻亚种间和亚种内的比较物理图谱,并依此鉴定了基因组之间大量的扩增、收缩和颠倒等染色体重排区域。在日本晴的扩增区域内,重复序列和与抗性相关的基因数量都高于全基因的平均值。将过滤掉重复序列后的末端序列比对到参考序列的同源区域,鉴定了大量的SNP, MNP, Insertion, Deletion和具有多态性的SSR标记。以来自OMAP(Oryza Map Alignment Project)的Oryza glaberrima, Oryza nivara和2个Oryza rufipogon作为对照材料,分析了我们所鉴定的结构变异在所有分析品种中的分布,并推断这些变异的来源以及在水稻进化和驯化过程中基因组的保守和易变区域。最后将实验室所有的水稻物理图谱(明恢63、珍汕97、93-11和中华11)、具有双末端序列的克隆、来自GRAMENE的水稻分子标记和QTL信息、具有多态性的SSR标记、日本晴的注释信息以及我们鉴定的所有结构变异整合在一起,并且对齐到日本晴的参考序列上(http://Gresource.hzau.edu.cn)。这些资源为水稻的比较基因组学和功能基因组学研究提供了良好的材料和基础。水稻稻曲病是由稻曲病菌(Villosiclava virens)引起的,它已经从水稻的次生病害上升为水稻的主要病害,在大部分的水稻主产区均有发生。目前,关于稻曲病菌的基因组和致病机制的研究基本上还是一片空白,我们构建了稻曲病菌UV-8b的BAC文库,对可以覆盖基因组10倍的克隆进行了双末端测序和指纹分析,并构建了稻曲病菌的第一个物理图谱。通过末端序列获得了对稻曲病菌基因组的初步认识,例如51.52%的GC含量、22.52%的重复序列、376.12/Mb的SSR密度和大约36.01%的基因编码序列。通过序列比较分析发现,稻曲病菌的基因组与绿僵菌(Metarhizium anisopliae)、木霉(Trichoderma reesei)、赤壳属(Nectria haematococca)和虫草属(Cordyceps militaris)亲缘关系较近。这是第一套稻曲病菌基因组资源,为稻曲病菌的遗传学、基因组学和分子生物学研究提供了资源和基础。稻瘟病菌(Magnaporthe grisea)所引起的水稻稻瘟病,是水稻最为严重的病害。病原菌基因组的多样性和易变性是稻瘟病防治中的难题。先前的研究者已经对分离自日本的P131菌株进行了全基因组测序,但是序列的连续性不高(1823个序列scaffold, N50和最长的序列长度分别为65Kb和459Kb)。为了提高P131菌株的序列拼接质量,我们用HindIII和BamHI分别构建了P131菌株的BAC文库,对每个文库中可以覆盖基因组5倍的克隆进行了双末端测序和指纹分析,并构建了物理图谱。加入双末端序列信息之后,N50和最长的序列长度分别提高到了147.28Kb和1848.42Kb。可以预见加入物理图谱信息后,序列拼接的质量还将大幅提高。

姚秋阳[5]2015年在《利用RNA-seq技术在云南山茶中解析重要分子通路与开发多态性EST-SSR》文中指出云南山茶(Camellia reticulata)是山茶属植物中最着名、最具经济价值的物种之一,以其花卉和茶油闻名于世。云南山茶原产中国西南,极具地区特色,适应我国西南山地和独特的高原季风气候,在花卉、油茶产业和特色旅游业中都具有重要的作用。但是,目前云南山茶遗传信息资源极其缺乏,使得我们对云南山茶与产油、花色形成和开花时间控制相关的基因及其调控机制知之甚少;也制约着利用分子标记、优异基因和丰富种质资源在现代遗传育种中的发掘利用。因此,本研究使用Illumina技术对云南山茶进行转录组测序。主要结果如下:1.应用Illumina RNA-seq技术对云南山茶的叶芽、成熟叶、花苞、花和果实五个组织的转录组分别进行建库和双端测序,获得了约311.3 x 106条高质量Reads。利用Trinity软件进行拼装,我们一共获得了141,460条Unigenes,总长约为96.1 x 106 nt。系统的转录组评估结果显示,我们获得了一个高质量的转录本数据集,适合用于SSR分子标记开发和代谢通路基因发掘等下游研究。2.通过与公共蛋白质数据库进行比对,有69,922个Unigene被注释为蛋白质编码基因。在与拟南芥和葡萄的基因组比对过程中发现,在云南山茶转录组中被注释到的基因平均有超过3个拷贝,暗示云南山茶可能经历过全基因组重复事件。3.我们将RNA-Seq的干净reads匹配到转录本上以评估基因的表达量水平,使用实时荧光定量反转录PCR (qRT-PCR)对基于RNA-seq的表达量分析进行检验评估,结果显示两个方法得到的表达量吻合度很高。一共有94,450个Unigene至少在一个组织中表达(FPKM≥1),其中22,229个Unigene在不同组织间存在差异表达(|fold change| ≥ 4且FDR≤0.001)。4.我们观察到云南山茶成花转变起始于4月中旬左右,这个时间段日照时间超过了12小时。这表明光周期成花途径有可能参与了云南山茶的成花转变过程。除了CONSTANS (CO)和CYCLING-DOF-FACTOR-1 (CDF1)没有找到之外,我们找到了光周期成花诱导途径中的绝大部分候选基因。这条途径中的基因存在多个拷贝;多拷贝基因间一般在组织间表现出不同的表达模式,如SOC1_α、SOC1_b和SOC1_c基因。5.我们在云南山茶转录组中一共找到了93个可能参与了叁酰甘油酯生物合成的Unigene。其中,42个Unigene为差异表达基因(DEG)。一共有29个(69%)DEG在花苞和花中高表达,其中有些基因是脂肪酸去饱和酶基因,如SAD_α、FAD2_α、FAD2_b、FAD3, FAD8_b和FAD8_c。这些结果说明在花发育过程中可能需要大量不同的脂肪酸发挥作用,而且这些在花中高表达的脂肪酸去饱和酶基因还可能在云南山茶花组织的抗寒性中有重要作用。与成熟叶片相比,FAD2_α在种子中的表达量大量减少,而SAD_α和FATA基因在种子中的表达量则增加了3倍以上。基于这些结果,我们认为SAD_α和FATA可能是云南山茶在种子中合成油酸的关键基因。上调SAD_α和FATA基因、同时下调FAD2_α在种子中的表达可能是一个非常有效的控制茶油中单不饱和脂肪酸和多不饱和脂肪酸比例的方式。6.类黄酮和类胡萝卜素是植物中两大主要的天然色素。前人在山茶属植物的花瓣中检测出了类黄酮和类胡萝卜素,表明在山茶属植物中这两类化合物可能参与了山茶花的花色形成。基于同源性分析,我们找到了56个参与类黄酮生物合成的Unigene,还找到了33个参与类胡萝卜素的生物合成的Unigene。通过对序列和表达量的比较分析,我们可以评估某个基因的变异程度。例如,类黄酮合成途径中的MYBF1转录因子基因在序列和表达模式上都存在着很大的变异,我们推测它可能失去了原有的功能。表达谱聚类分析表明,MYBA1_α与几个花色素苷合成特异基因聚在一个亚支,如UF3GT_α、UF3GT_c、UF5GT_b。 MYBAl1_α和这几个花色素苷合成的特定基因在花苞或花中的表达量显著提高,表明这些基因在花发育时的花色素苷合成过程中有着重要作用。在类胡萝卜素合成途径中,多个直接催化合成常见类胡萝卜素的色素化合物的基因,如LUT1、LUT2、LUT5和LYC,在云南山茶花苞或花中的表达量都很低。这些基因在花中的表达量下调很可能是云南山茶花中类胡萝卜素含量极低的原因。我们推测,类黄酮合成途径的花色素苷合成支路在云南山茶的花色形成过程中起着支配作用,类胡萝卜素合成途径在这一过程中的作用很轻或者不起作用。另外,类胡萝卜素合成途径的ABA合成支路中的ABA2_b, NCED4, NCED3a和ZEP_α在花中的表达量都较高,表明ABA合成基因可能在花发育过程中有着重要功能。总体来看,这些数据使得我们能够更好地理解这些候选基因的表达模式和潜在生物学功能。7.利用MISA工具,我们在云南山茶的25,188个Unigene中找到40,823个EST-SSRo我们开发了一个新的生物信息流程CandiSSR,能快速有效地在多个物种或个体的转录组或基因组序列中鉴定多态性的SSR。利用CandiSSR,我们在云南山茶及其近缘种中鉴定出835个同时具有种间、种内多态性的SSR。总而言之,本研究构建的转录组序列大大地增加了云南山茶公共数据库中可用的遗传信息资源。这些数据为在云南山茶中开发EST-SSR标记以及研究与油脂合成、光周期诱导、类黄酮生物合成、类胡萝卜素生物合成等途径相关的重要功能基因奠定了基础。本研究中的大量数据和成果将进一步促进云南山茶的功能基因组学、群体遗传学和遗传育种研究。

胡欣[6]2004年在《水稻4号染色体长臂74.5~78.2cM区段的基因注解以及水稻两组基因frr和trs的结构与功能研究》文中认为基于水稻两个亚种indica与japonica已被证实的高度共线性,在本中心1997年构建的第一代水稻基因组物理图的基础上,结合指纹法、分子标记锚标定位STC-PCR等技术,构建了构建了水稻籼稻广陆矮4号(GLA4)与粳稻日本晴(Nipponbare )4号染色体的物理图,并据此最终完成了Nipponbare 4号染色体的精确测序工作。完成序列(finished sequence)全长34.6 Mb,覆盖染色体的97.3%。使用基因中心自主开发的基因组注解软件包对Nipponbare 4号染色体长臂中段74.5~78.2 cM、全长1946125 bp的区段进行了基因预测和人工修正,确认预测基因297个,其中包括8个known基因,52个novel基因,134个putative基因及103个hypothetical基因。基因的平均长度2764 bp,平均外显子数目5.4个。根据上述基因注解结果并结合同源数据搜索,我们发现并实验验证了水稻中的两组表达基因——frr和trs。其中,frr具有两个同源基因——位于4号染色体上的OsfrrA和7号染色体上的OsfrrB。frr编码的核糖体再循环因子(Ribosome Recycling Factor,RRF)在原核生物的蛋白质合成系统中起着不可或缺的作用:帮助翻译后复合体的解聚,并且避免翻译错误,因此是除了古细菌外所有基因组已被研究的原核生物中均有的一个高度保守的基因。OsfrrA和OsfrrB在基因组中都是单拷贝的,分别编码260个氨基酸残基的OsRRFA和242个氨基酸残基的OsRRFB。根据OsRRFA与OsRRFB不同的N端特性、在不同组织和时期的转录谱及与其它35个原核和真核RRF的同源比较,我们推断,OsRRFA和OsRRFB虽然由核基因编码,但将被分别转运并定位于线粒体和叶绿体中,并在其蛋白质翻译系统中发挥与其在原核生物中相似的功能。鉴于水稻线粒体与叶绿体基因组中并没有发现这两个基因的同源序列,因此有理由相信它们是在进化的过程中从细胞器基因组转移到核基因组中的。对从GeneBank中搜集到的37个涵盖了各类已进行了基因组研究的原核生物及有限的几个真核生物的RRF的进化分析结果还揭示了RRF在分子进化研究中作为标尺的潜在价值。而水稻中的trs-like基因则与酵母转运蛋白颗粒(Transport Protein Particle,TRAPP)具有保守结构域的6种亚基的编码基因高度同源。TRAPP是小泡牵引复合体(vesicle tethering complex)的一种,可能在内<WP=17>质网-高尔基体转运后期发挥作用——通过激活膜表面的一个Rab-GTPase(Ypt1)触发SNARE桥的形成,两种细胞器膜融合,从而达成相关大分子物质从内质网到高尔基体的靶向性转运。我们发现水稻中至少有10个具有广泛转录活性的trs-like基因。这10个基因的编码产物与酵母TRAPP蛋白复合体中已知10个亚基中的6个—Bet3p、Bet5p、Trs20p、Trs23p、Trs31p和Trs33p分别同源。其中4对基因是双拷贝的,另2个(Os1bet5和Os1trs31)则是单拷贝的(基于已知的水稻基因组序列)。它们同时存在于水稻的两个亚种籼稻和粳稻中,且序列和结构上几乎完全相同。与其它真核生物中的同源基因在基因和蛋白质序列、结构及进化各层次上的比较说明,这是一组高度保守的基因,尤其是其中的bet3,其基因结构的保守性甚至跨越了动物与植物的界限。其中双拷贝的4对基因,其两个拷贝均位于不同的染色体上,且在同种组织中的转录强度往往有很大的差异,因此不排除它们还具有其它功能的可能性,正如人的trs20的两个拷贝SEDL基因和MIP-2A基因那样。

刘慧[7]2017年在《基于RNA-seq测序技术糜子转录组分析以及糜子叶绿体基因组密码子使用模式分析》文中指出糜子(Panicum miliaceum L.),也称为黍、稷,是最古老的和首批被驯化作物之一,主要分布在亚洲和欧洲的半干旱地区。作为短日照C4作物,糜子具有很多优异农艺性状,比如高产,生长季比较短,需水量低,适合在各种土壤上生长,尤其是在贫瘠的沙壤土上,因此能够很好地适应比较极端环境。RNA-seq主要是基于NGS(Next generation sequencing)技术,可以高质量、高数量地普查所有转录元件(如转录组),包括mRNAs,小RNAs(small RNAs)和其他非编码RNAs(non-coding RNAs)。其转录组数据普查结果为不同生理状态下的器官、组织或者是细胞基因表达模式和调节原件等情况及时作出描述,这对进一步了解生物发展和病害发生过程十分重要。密码子使用偏好性(CUB)是由于同义密码子在机体内外的使用频率存在差异,其是生物体重要的进化特征,对研究物种进化、基因功能及其外源基因表达具有重要意义。本研究将提取的Yumi 2和Yumi 3 RNA样品进行RNA-seq测序,对数据进行过滤、分析,对部分候选差异表达基因还进行RT-PCR验证。与此同时,还利用Mobyle等生物信息学软件对糜子叶绿体基因组密码子使用偏好性进行分析。得到分子结果如下:1.利用Illumina测序平台对糜子4种组织的混合样品进行测序研究,得到113,643个contigs,组装总长度164,535,293 bp。经序列拼接共鉴定得到65,470条长于1 kb的unigenes。2.将组装的unigene和NCBI中的NR数据库,Swiss-Prot数据库,COG数据库,KEGG数据库中蛋白序列进行blastx相似性比对分析发现共有60,352条unigene已经被注释。同时发现糜子unigenes和其他单子叶植物都具有同源性,包括高粱、水稻、二穗短柄草、乌拉尔图小麦、柳枝稷。3.对糜子Unigene功能进行GO、KOG、KEGG代谢通路分析发现,总共62,543unigene序列注释到了3个主要的GO分类中;比对到KOG数据库基因上的33,671unigenes分类成25个不同的功能群;共有15,514 unigenes主要分到了202个KEGG代谢通路上。4.在糜子中113,643 unigenes的27,055条序列中总共鉴定发现35,216 SSR位点。其中,2,536序列包括超过一个SSR。重复4次的SSRs是占比最高的重复类型,(49.99%),接下来是重复5次、10次、6次、超过20次的SSRs,分别约14.45%、13.38%、8.79%、0.05%。在这么多不同类型的SSRs中,叁核苷酸是最为丰富的重复单元,在所有的SSRs占比约为66.72%,其中CCG/CGG是最为丰富的结构单元。并且多数SSRs的长度是12bp(51.39%)。5.共鉴定发现292个差异表达基因,被归入88条GO分类,12KEGG代谢通路中,并通过qRT-PCR验证了4个差异表达基因,分别是unigene34608,unigene35973 and unigene41558、Unigene33484。6.从糜子叶绿体基因组中筛选出53条蛋白编码序列,通过codonW软件等分析表明,在糜子叶绿体基因组中,密码子GC3的含量为30.67%,所占比例最低;有效密码子数(ENC)表明多数密码子偏性比较弱;相对同义密码子使用度(RSCU)分析密码子多以A、U结尾,说明这些是糜子叶绿体基因组偏爱的密码子;中性分析、ENC-plot、对应性分析等结果说明糜子密码子偏好性是由于自然选择、变异压力及其他因素共同作用而形成。同时鉴定得到9个糜子叶绿体最优密码子。

崔立操[8]2018年在《栽培和野生大麦群体结构及大麦MAPK级联途径相关基因家族的鉴定研究》文中研究说明大麦(Hordeum vulgare L.)是最重要的谷类作物之一,其年产量及种植面积均具世界第四位,兼具食用、饲用及酿造价值,对保障粮食安全和社会经济发展具有重要意义。同时,大麦也是最古老、最早被人类驯化栽培的作物之一,考古学和分子生物学证据表明,最早的栽培大麦可溯源到公元前10,000年的新月沃土地区,该地区广泛分布着环境可塑性强、变异类型众多、遗传多样性丰富的大麦野生种质资源。因此,大麦也成为研究作物起源进化、人工驯化选择乃至农业栽培和人类文明发展史的理想模式系统。随着高通量测序技术的发展以及生信分析工具的完善,大麦高质量的全基因组序列精细图已经完成,这为大麦的群体遗传学及基因组学研究带来新的契机。本研究以不同大麦起源地的野生大麦及世界主要栽培大麦品种为材料,利用ISJ和SSR分子标记,结合全基因组重测序分析、转录组测序及叶绿体基因组序列,全面分析了野生大麦和栽培大麦的遗传多样性、遗传分化、系统进化关系和群体遗传结构,比较了不同地理生态型野生大麦间的遗传变异及单倍型分布,从多个层次探究了大麦在驯化过程中承受的选择的基因组区域及相关基因,并初步分析了选择的遗传学效应。最后,以MAPK级联途径基因家族为例,分析了大麦驯化相关基因家族的基因组组成、分布、表达特性等,为进一步研究其生物学功能奠定了基础。主要研究结果如下:(1)基于ISJ和SSR分子标记的大麦遗传多样性分析以全世界不同来源地的55份栽培大麦材料和89份野生大麦材料(4个群体)为研究材料,利用ISJ和SSR两类分子标记对大麦的遗传多样性、群体结构和遗传分化进行了初步研究。结果发现,大麦具有较高的遗传多样性,共检测到162个ISJ和196个SSR多态性条带;群体结构分析明显地将野生和栽培材料聚为两个分支,野生材料又可进一步细分为4个亚群,每一个亚群基本与其采样来源地分布一致;遗传多样性分析发现,野生群体Mount Gilboa拥有的遗传多样性指数最高(Na=3.944),而栽培大麦的多样性较低(Na=3.861),表明大麦在驯化过程中承受了较为严苛的人工选择压力,致使等位基因缺失,遗传多样性下降。(2)基于全基因组重测序的大麦遗传多样性、群体结构与人工选择效应分析为进一步探究栽培大麦和野生大麦的驯化痕迹和选择效应,本研究利用全基因组重测序技术对代表性的40份野生大麦和22份栽培大麦进行了全基因组重测序分析。以最新的大麦参考基因组为参照,共检测到107.12×10~6单核苷酸多态性(SNPs)和6.65×10~6个插入/缺失(InDels)变异位点,且这些变异比较均匀地分布于7个染色体;系统进化、主成分以及群体结构分析可将野生和栽培材料划分为两大类群,依据生态型或者地理来源可将野生大麦分为不同的亚群;与野生大麦相比,栽培材料的遗传多样性大约低38%,暗示在驯化过程中,由于遗传瓶颈效应,栽培大麦遗传多样性明显下降;进一步种群动态分析发现,人工选择效应塑造了野生与栽培大麦不同的种群动态发展模式;最后,通过全基因组扫描分析,共鉴定到了2,470个受选择基因,功能富集发现这些基因与大麦生长发育,激素相应,生物钟,生物胁迫及非生物胁迫相关,该研究为进一步从性状建成和基因功能角度阐明大麦的驯化选择效应提供了重要信息,为大麦全基因组水平的起源、进化和选择研究提供的宝贵资源。(3)野生和栽培大麦的叶绿体比较基因组学分析叶绿体序列是研究植物系统进化和物种鉴定的重要工具。本研究利用大麦全基因组重测序数据,利用自己搭建的分析流程,组装、获得了38个野生和18个栽培大麦的叶绿体全基因组序列。全基因组比对分析共鉴定到188个SNPs和108个InDels,平均为1.38个SNP/kb及0.41个In Del/kb;遗传多样性分析发现野生材料的遗传多样性高于栽培材料,这与核基因组的研究结果一致;同时,17个变异位点在野生和栽培材料中呈现不同的单倍型,将野生和栽培大麦区分开,可作为潜在的大麦鉴定的标记位点,其中7个为影响水平中等的基因内变异位点,2个影响水平中等的内含子区域变异以及8个低影响的同义突变;群体结构分析也将野生和栽培材料聚为两个分支,野生材料又可依据地理来源分为不同亚组;系统进化分析发现,叶绿体基因组与重测序的进化树拓扑结构不完全一致,暗示了两套基因组之间存在进化速率上的差异。最后我们探究了遗传距离与物理距离之间的相关性,结果发现物理距离每增加798.85公里,遗传距离增加0.1。这为利用叶绿体基因组测序探究大麦的群体结构和系统进化关系提供了重要信息,也为大麦叶绿体基因组进化研究提供了参考。(4)栽培大麦和野生大麦的群体转录组研究群体转录组测序为在转录层次开展遗传分化和比较分析提供了重要手段。本研究以26份栽培大麦和29份野生大麦为材料,进行了群体比较转录组分析。结果共鉴定到了12.6×10~6个SNP位点,将其与基因组发掘的SNP变异进行比较,发现两种测序结果得到的数据具有较高的一致性,互为验证。利用SNP进行群体结构分析发现野生和栽培材料分为两个组别。差异基因分析鉴定到395在栽培和野生大麦间显着差异表达的基因,这些基因的功能在ncRNA代谢过程、tRNA代谢过程、蛋白质翻译的tRNA氨酰化、连接酶活性、氨酰-tRNA连接酶活性、连接酶活性、细胞质组成、叶绿体组成等过程显着富集,该研究为进一步开展大麦驯化生物学研究提供了候选。(5)大麦MAPK级联途径基因家族的鉴定、表达特性及共表达网络分析结合基因组和转录组数据,我们发现激酶基因家族成员是大麦驯化过程受选择基因,为此我们以有丝分裂原激活蛋白激酶(MAPK)级联途径基因家族为例,对其进行了全基因组鉴定、系统进化和表达特性分析,以期为探究大麦驯化相关基因的生物学功能鉴定基础。利用最新发布大麦基因组数据,通过全基因组分析共预测、鉴定了20个MAPK、6个MAPKK和156个MAPKKK基因;系统进化树参照将所有MAPK级联途径基因分为叁组,即MAPK,MAPKK和MAPKKK,MAPKKK基因家族又可进一步聚集为MEKK,RAF和ZIK亚家族;分子进化分析表明,片段和串联重复事件都是MAPK级联基因家族的扩张的动力,非同义替换(Ka)和同义替换(Ks)的比率发现复制的基因对受到了强烈的纯性选择;利用公共可获得的RNA-seq数据,对MAPK级联途径基因在植物生长和发育及生物和非生物胁迫下的表达模式进行了分析,鉴定到了63个植物组织器官、阶段特异性表达及逆境响应相关的基因;最后,使用靶基因预测工具和WGCNA方法构建了MAPK级联途径基因及其与miRNA之间的互做网络,发现由46个HvMAPK级联途径基因和11个miRNA参与的共72条互作关系。本研究首次系统全面地探究了大麦中MAPK,MAPKK和MAPKKK基因家族的特征,为阐明其在植物中的生物学作用提供宝贵的信息,并有助于更好地了解大麦种驯化相关基因的功能及参与的调控网络。

钱前, 瞿礼嘉, 袁明, 王小菁, 杨维才[9]2013年在《2012年中国植物科学若干领域重要研究进展》文中提出2012年中国植物科学研究继续快速发展。中国科学家在植物科学多个领域中取得了大量的原创性、高水平研究成果,包括植物基因组研究、植物天然免疫抗性及其应答环境的信号转导机制以及植物去甲基化作用和DNA双链断裂修复机制研究等,受到国内外的高度评价。该文对2012年中国本土植物生命科学若干领域取得的重要研究进展进行概括性评述,旨在全面追踪当前中国植物科学领域发展的最新前沿和热点事件,并展现我国科学家所取得的杰出成就。

逄锦菲[10]2013年在《“黄海2号”中国对虾高通量SNP筛选及其与抗WSSV性状的关联分析》文中认为中国对虾(Fenneropenaeus chinensis)是我国重要的经济虾类,WSSV制约我国对虾养殖业的发展。传统对虾选择育种模式与分子标记辅助育种技术相结合有利于中国对虾抗病品种的选育。单核苷酸多态性(Single Nucleotide Polymorphisms,SNP)被认为是很有应用前景的分子标记技术。本研究在中国对虾转录组454高通量测序的基础上,依据预测的SNP位点设计引物,利用非标记探针HRM(HighResolution Melting)技术,对单核苷酸突变进行验证开发。利用开发的132个SNP标记(实验室前期开发39个+本论文开发93个),对2008-2012年中国对虾抗WSSV性状测试实验中获得的抗性群体和敏感群体进行了遗传多样性分析,并对各位点基因型与抗WSSV性状进行了关联分析,获得了与抗WSSV性状相关的9个SNP标记。使用RT-PCR结合RACE技术对抗WSSV相关SNP位点Contig1401-67TA所在基因——中国对虾醛缩酶基因(aldolase)进行了成功克隆,并获得了该基因cDNA全长序列。具体内容如下:一、中国对虾多态性SNP位点开发中国对虾转录组454高通量测序、contig的拼装和SNP位点的预测由国家人类基因组南方研究中心完成。依据预测的SNP位点,从造成错义突变(mis-sence)的SNP位点中挑选了530个位点,共设计合成引物378组,筛选得到候选SNP位点301个并设计非标记探针,通过非标记探针HRM分型方法,在96尾2012年人工选育的“黄海2号”中国对虾群体中进行检测和验证,结果共有93个SNP位点显示多态性。每个SNP位点的观测等位基因数(Na)均为2个,有效等位基因数(Ne)分布范围1.0105~2.000,观测杂合度(Ho)的分布范围为0.000~0.9792,期望杂合度(He)的范围为0.0104~0.5026,次要等位基因频率(MAF)分布范围0.0052~0.5000。多态信息含量分析显示93个位点的PIC,其平均值为0.2182,低于标准值0.5。Shannon信息指数分布范围为0.0326~0.6931,平均值为0.3330。研究结果表明,通过HRM技术对中国对虾候选SNP位点进行验证开发是一种有效的方法,开发获得中国对虾SNP位点可用于后续实验研究。二、中国对虾抗WSSV相关SNP位点的筛选及关联分析利用132个SNP位点对“黄海2号”中国对虾抗性群体和敏感群体进行HRM基因分型分析,并对基因型分布频率进行卡方检验。结果显示,有9个SNP位点的10个基因型在抗性群体和敏感群体中分布频率差异显着(P﹤0.05),其中C1401-67TA的A/A型、C7695-204AG的A/G型、C283-145AG的G/G型、C12355-592CT的C/C型在两群体中差异极显着(P﹤0.01),C6625-56CT的C/T型、C7911-209CT的T/T型、C9733-231TA的T/A型、C12698-488CA的A/A型、C364-89AT的A/A型和C12355-592CT的C/T型差异显着(P﹤0.05)。进一步分析显示,位点C1401-67TA的A/A型、C6625-56CT的C/T型、C364-89AT的A/A型和C12355-592CT的C/T型与抗病正相关,C7695-204AG的A/G型、C7911-209CT的T/T型、C9733-231TA的T/A型、C12698-488CA的A/A型、C283-145AG的G/G型和C12355-592CT的T/T型与抗病负相关。借助NCBI网站BlastX程序对获得的与抗病性状相关的9个Contig进行分析,推测其潜在功能。除了Contig12698,其余8个Contig均匹配到了序列相似度较高的功能基因(E值<10-10),分别是果糖-1,6-二磷酸醛缩酶(fructose-1,6-bisphosphatealdolase),脱氧胞苷酸脱氨酶(deoxycytidylate deaMase),u5小核核糖核蛋白200解旋酶样蛋白(u5small nuclear ribonucleoprotein200kda helicase-like protein),甘氨酸脱羧酶(glycine decarboxylase),多态缩多氨酸(DEAD-box polypeptide39),半胱氨酸天冬酶(effector caspase),肽转运蛋白家族1-like(predicted:peptidetransporter family1-like),40S核糖体蛋白S2(40S ribosomal protein S2)。叁、中国对虾SNP类型特征及分布特点在中国对虾转录组454高通量测序的基础上,依据测序获得的7万余个可能的SNP位点和经过HRM验证获得的多态性SNP位点,分析中国对虾碱基突变的类型及其与周围碱基的相关性。结果表明,C/T突变类型最多,G/C突变类型最少,并且存在“转换偏差”为2.0>0.5;随着突变位点直接相邻位置上A&T碱基个数的增加,该突变位点的转换偏差逐渐降低;突变位点发生突变前后碱基组成存在(G+C)/(A+T)偏差。四、中国对虾抗病相关基因克隆及全长序列分析使用RT-PCR结合RACE技术对抗WSSV相关SNP位点Contig1401-67TA所在基因——中国对虾醛缩酶基因(aldolase)进行了成功克隆,并获得了该基因cDNA全长序列。序列分析结果表明,该cDNA全长2127bp,包含一个1098bp的开放阅读框,编码365个氨基酸。通过对中国对虾醛缩酶基因核苷酸序列和氨基酸序列分析、蛋白质结构和功能的预测与分析,进一步证实了本研究所获得中国对虾醛缩酶基因序列的正确性。经同源比对和进化树分析,中国对虾醛缩酶基因编码的氨基酸与节肢动物的果糖-1,6-二磷酸醛缩酶氨基酸序列相似性达85%以上,确定其是果糖-1,6-二磷酸醛缩酶。基因时空表达分析,感染WSSV后,肝胰腺中醛缩酶的表达量先上升后下降,结果显示中国对虾醛缩酶基因在抗WSSV感染过程中可能具有一定应激功能。

参考文献:

[1]. 水稻叶绿体基因组序列的拼装验证和多态性分析[D]. 曾万勇. 四川农业大学. 2002

[2]. 甘蓝类蔬菜的细胞质DNA多样性研究[D]. 张扬勇. 中国农业科学院. 2011

[3]. 基于高通量测序技术的小麦和紫茎泽兰基因组学初步研究[D]. 聂小军. 西北农林科技大学. 2013

[4]. 水稻及其重要病原真菌BAC相关资源的构建和分析[D]. 王晓明. 华中农业大学. 2013

[5]. 利用RNA-seq技术在云南山茶中解析重要分子通路与开发多态性EST-SSR[D]. 姚秋阳. 云南大学. 2015

[6]. 水稻4号染色体长臂74.5~78.2cM区段的基因注解以及水稻两组基因frr和trs的结构与功能研究[D]. 胡欣. 中国科学院研究生院(上海生命科学研究院). 2004

[7]. 基于RNA-seq测序技术糜子转录组分析以及糜子叶绿体基因组密码子使用模式分析[D]. 刘慧. 西北农林科技大学. 2017

[8]. 栽培和野生大麦群体结构及大麦MAPK级联途径相关基因家族的鉴定研究[D]. 崔立操. 西北农林科技大学. 2018

[9]. 2012年中国植物科学若干领域重要研究进展[J]. 钱前, 瞿礼嘉, 袁明, 王小菁, 杨维才. 植物学报. 2013

[10]. “黄海2号”中国对虾高通量SNP筛选及其与抗WSSV性状的关联分析[D]. 逄锦菲. 上海海洋大学. 2013

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

水稻叶绿体基因组序列的拼装验证和多态性分析
下载Doc文档

猜你喜欢