精神分裂症相关基因变异数据库的构建

精神分裂症相关基因变异数据库的构建

周敏[1]2003年在《精神分裂症相关基因变异数据库的构建》文中进行了进一步梳理精神分裂症是一种普遍存在的精神疾病,在人群中的患病率约为1%,具有显着的家族聚集性。当前精神分裂症病因假说认为众多微效基因的相互作用以及与环境因素的作用导致了疾病的发生。连锁和关联策略均被应用到精神分裂症易感基因的研究中,寻找可能致病的基因组变异。药理学、神经化学和临床研究都提供了一些精神分裂症的易感位点。为了适应精神分裂症易感基因系统研究的需求,我们构建了精神分裂症相关基因的变异数据库VSD(a Database for Schizophrenia related genes focusing on Variations),VSD致力于收录易感基因的变异信息。 收录的易感基因大部分是神经递质受体、神经递质载体和参与神经递质代谢的酶。变异信息主要从公共的突变和多态数据库中获取,比如OMIM(http://www.ncbi.nlm.nih.gov/omim)、dbSNP(http://www.ncbi.nlm.nih.gov/SNP)和HGVbase(http://hgvbase.cgr.ki.se),多态数据均归于不同的基因位点。除此之外,VSD还提供了基因信息、酶和其它生物学信息。 另外,VSD有别于现有的其他变异数据库的主要特点是:一是在基因组、mRNAs和蛋白质叁个水平上定位了变异;二是分析了可能影响蛋白质功能的非同义单核苷酸多态性变异(nonsynonymous SNP,nsSNPs)。分别叙述如下: (1)由于NCBI的RefSeq(http://www.ncbi.nlm.nih.gov/refseq.html)数据库为基因组、mRNAs和蛋白质提供了标准的参考序列,使得定位变异和基于基因的查询成为可能。VSD便利用了这个高度引用的和非冗余的资源,来重新编排精神分裂症相关基因的变异,将基因变异归于不同的基因位点,并以参考序列为标准在基因组、mRNAs和蛋白质叁个水平上确定和定位变异位点。 (2)为了使易感基因的研究更有目的性,一个可行的策略是选择那些可能影响蛋白质功能的SNPs来检验这些SNPs和疾病之间的关联。很显然,那些位于编码区并引起氨基酸改变的nsSNPs会引起我们的兴趣。一个在蛋白质功能和nsSNPs之间的关联信息将会使我们有目的地选择进行关联研究的目标nsSNPs。在本研究中,我们比较了变异和蛋白质功能区域的位置,找出那些位于蛋白质重要特征中的nsSNPs,

陈超[2]2011年在《基因表达谱芯片校正批次效应算法的比较及网络分析在精神分裂症研究中的应用》文中指出基因表达谱芯片作为一种高通量的基因组研究手段,在生物医学领域应用极其广阔。然而,每年有数以千计的基于芯片的研究,其数据都被“批次效应”所混杂。批次效应是指由于芯片在不同的实验批次处理而产生的系统误差。它在以前的芯片研究中鲜有提及。虽然批次效应可以通过缜密的实验设计缓解,但除非所有样本都可以在同一批次中处理完成,否则它不可能消除。我们首先从多个平台的实验数据中证明了了批次效应的存在,并且从多方面解析了该混杂效应对生物因素的严重影响。接下来我们从基因芯片的实验步骤入手,通过详细介绍基因芯片的实验过程,指出批次效应可能的来源。因为批次效应可以严重影响基因表达的实验结果,一系列校正批次的方法被发展出来。对目前比较流行的几种批次校正的方法,我们从方差比例,精度,准度,以及总体评价等方面进行了系统的比较,发现ComBat——一个基于经验贝叶斯的分析方法,多数指标优于其他五个算法,而且针对每个批次中含有样本量较小的数据时仍有优异的表现。我们推荐ComBat作为对不同批次的数据进行批次效应校正的最佳统计算法。另外我们还建议在比较重复样本和非重复样本之间关联的时候,有必要在探针水平进行标准化校正,从而降低非重复样本之间的被虚夸了的相关性。我们的另一部分工作是利用基因表达谱芯片数据探寻精神分裂症的发病机制。目前已经有很多基于基因表达谱芯片的精神分裂症的研究,发现了很多的候选基因,但几乎没有基因可以通过多重校正并且从不同的实验中重复出来。这可能是因为人类大脑基因表达的异质性或因为基因表达在病人中的改变较小.我们设想基于基因基因相互作用的网络或者通路会在病人大脑中的改变会更加一致,在这个研究中,我们利用基因共表达网络来分析不同来源的5组脑组织数据。首先我们对基因表达谱芯片数据进行了严格的质量控制,除了利用ComBat校正批次效应外,我们还通过MAS算法对探针质量进行控制,通过修改的RMA算法剔除单核苷酸多态位点对探针的影响,剔出种族差异对基因表达的影响等。之后我们通过基因共表达网络的方法构建基因网络,利用每组基因网络的特征向量,我们使用了两种不同的统计算法,校正年龄,性别,大脑pH值等变量后,挖掘是否存在某一组基因的表达水平变化与精神分裂症有强关联。结果发现在5组数据中,金属硫蛋白家族的部分基因,MT1E,MT1F,MT1G, MTIM, MTIX, MT2A的表达量在精神分裂症患者中都有显着的提高。如此一致的结果证明金属硫蛋白家族基因确实参与了精神分裂症发病的过程,或是病因,或是症状。金属硫蛋白富含半胱氨酸,在人体中的主要作用是通过结合重金属离子调节体内微量元素,以及神经受损后的免疫反应和氧化应激等。氧化应激已经被报道与精神分裂发病机制有关。已知重金属锌(Zn)在神经发育,情绪控制和保护细胞免受损伤等方面发挥作用。另外其他重金属,铜(Cu)也推测有精神分裂症有关。我们猜测重金属的调控失调,氧化应激和组织受损等可能参与在精神分裂症的发病机理之中。除此之外,我们还从遗传学和表观遗传学角度,分别利用eQTL的方法和DNA甲基化的数据对金属硫蛋白表达量变化进行了简要的分析。

赵亚丽[3]2010年在《GRM7、GRM3、CMYA5基因与精神分裂症相关性研究》文中研究指明精神分裂症是一种常见的精神疾病,发病多见于青壮年,人群终生患病率达1%。临床症状多样,严重威胁人类的身心健康,并且给家庭和社会带来沉重负担。精神分裂症的病因及发病机理尚未完全阐明。多年研究发现,精神分裂症是一种典型的多基因复杂性状疾病,遗传度在80%以上,然而由于表型多样,其发病与多个微效基因变异有关,使多年的连锁分析和关联分析并未取得一致性结果。为了降低表型多样性困扰,精神分裂症遗传学引入内表型概念,促进了疾病易感基因的发现。针对上述的精神分裂症遗传学研究的特点我们拟采用两种策略探索精神分裂症的易感基因:一是以精神分裂症的某一发病机理假说的功能基因为切入点,系统探讨其和精神分裂症的相关性;二是从全面的变异分析入手,筛选出可能和发病机理相关的基因。谷氨酸假说在精神分裂症的病因学假说中占有重要地位,近年研究发现代谢型谷氨酸受体激动剂成为了新型的抗精神分裂症药物,因此其在精神分裂症的发病中可能发挥着重要作用。综合上述,本论文研究包括两部分内容:一、以谷氨酸通路基因为切入点,探讨谷氨酸代谢型受体基因7(Glutamate receptor, metabotropic7, GRM7)和谷氨酸代谢型受体基因3(Glutamate receptor, metabotropic3, GRM3)与精神分裂症或认知功能障碍内表型的相关性;二、以全基因组关联数据联合分析时筛选出的(cardiomyopathy associated5, CMYA5)基因入手,在中国汉族人群中验证其和精神分裂症的相关性。一代谢型谷氨酸受体基因GRM7和GRM3与精神分裂症相关性研究应用病例-对照关联研究的方法分析了GRM7和GRM3和精神分裂症的相关性。(一)GRM7:对位于GRM7基因功能区域的单核苷酸多态性(single nucleotide polymorphisms, SNPs)及基因组结构变异(Copy number variations, CNVs)分别进行了分析。1.GRM7基因SNPs和精神分裂症的相关性:初步分析步骤:在84名病例和85名对照中筛选GRM7功能区可能的SNPs,对筛选到的46个SNPs构建连锁不平衡区域,并按照较小等位基因频率(Minor allele frequency, MAF)进行划分,结合初步关联分析结果,确定验证步骤中需进一步分析的SNPs。验证步骤:在549名精神分裂症患者和562名对照中,对初步分析中确定的MAF>0.05且不位于同一连锁不平衡区域的14个常见SNPs进行了和疾病、表型及内表型相关性分析。在单位点分析未发现和精神分裂症相关SNPs。多位点分析中,发现5位点、6位点和7位点构成的单倍型中多组和精神分裂症相关,具体如下:1) rs3749380-rs9868134-rs2291867-rs712773-rs1704763(P=0.0169)2) rs3749380-rs9868134-rs2291867-rs712773-rs162802(P=0.0145)3)rs3749380-rs9868134-rs2291867-rs712773-rs17047632-rs162802(P=0.0497)4)rs3749380-rs9868134-rs2291867-rs712773-rs17047632-rs3792452-rs162802(P=0.0127)认知功能障碍相关性分析:GRM7基因和精神分裂症患者的认知功能障碍相关性分析发现,rs17047632位点基因型和经历记忆(WMS1)具有明显相关性(P=0.0004,Ajusted P=0.0364),和心智测验的积累项的相关性趋势(P=0.023)。2.GRM7基因CNVs和精神分裂症的相关性:应用Real-time PCR相对定量方法在180名精神分裂症患者和33名对照中,对GRM7基因的两个重组热点区域进行了CNVs检测,未发现和疾病相关的CNVs。(二)GRM3:在465名精神分裂症患者和477名对照中对覆盖GRM3基因的标签SNPs及部分已报道SNPs进行了分析。单位点分析发现位于启动子区的rs274622位点(allelic P=0.07)和位于intron1的rs701332位点(genotypic P=0.06)具有和精神分裂症相关的趋势。单倍型分析发现rs274622-rs701332-rs724226具有和精神分裂症相关的趋势(P=0.06)。Block间单倍型分析发现rs724226-rs10266758-rsl3230321构成的单倍型在精神分裂症和对照间存在差异,P=0.0004。二心肌病相关基因CMYA5和精神分裂症相关性研究在来自汉族人群的2701名精神分裂症患者和2803名对照中,运用病例-对照关联研究的方法分析了CMYA5基因rs3828611位点和rs4704591和精神分裂症的相关性。发现位于exon2的rs3828611(C/G,His3358G1n)的G等位基因(P=0.008)和G/G基因型(P=0.02)在病例组均明显降低,表现为精神分裂症的保护性因子。本论文结合目前精神分裂症遗传学研究特点,基于发病机理假说的候选基因策略(GRM7、GRM3)及全基因关联数据再分析验证策略(CMYA5)进行精神分裂症易感基因的研究。在对GRM7和GRM3基因的研究中,虽未发现和疾病相关的单个位点,但发现了几组和精神分裂症相关的单倍型,提示GRM7和GRM3基因上存在和疾病相关的位点,这些位点作用较小,通过联合作用影响疾病的发生。CMYA5基因研究中,在中国汉族人群中验证了CMYA5基因变异和精神分裂症相关性。该基因是在对欧裔人群的全基因组关联研究的数据再分析过程发现的,并在23个大样本量研究中进行了验证,其功能尚不清楚,该基因的发现有可能揭示全新的精神分裂症发病机理。

梁燕[4]2012年在《整合组学数据预测原发性免疫缺陷病和精神分裂症等复杂疾病候选基因》文中认为复杂疾病病因复杂,既有遗传因素也可能与环境因素有关。尽管在连锁分析方法、全基因组关联分析(GWAS)甚至全基因组测序等新方法的广泛应用下,复杂疾病致病基因的鉴定已取得了很大进展,但其致病基因鉴定以及分子机制研究仍然还是遗传学领域的难题。已知同一疾病表型的致病基因往往在功能水平上具有较紧密的联系,如果能在基因组中寻找到与已知致病基因有紧密功能关联的基因,我们有可能从中获得与疾病有关的候选基因。目前各种组学数据的积累为我们利用生物信息学模型整合组学数据预测复杂疾病候选致病基因提供了可能。在本文中,我们结合随机森林模型和基于基因关联网络的生物通路分析方法(GANPA),分别对12大类描述基因特征的组学数据以及3大类描述基因间相互作用关系的数据进行整合,构建了一个有效的疾病基因预测模型RF-GANPA.我们用叁个实例对这个生物信息学预测模型进行了验证。第一个实例为原发性免疫缺陷疾病(PID)候选基因的预测,我们预测得到了800个候选基因,结合基因表达数据分析我们对候选基因进行了优先级别的划分。与其它4种方法进行比较,RF-GANPA能预测最多新鉴定的PID致病基因,预测准确率高于其它4种方法。第二个实例为精神分裂症候选基因的预测,用RF-GANPA预测的精神分裂症候选基因中有18个基因被GWAS数据中的显着性SNP位点验证。第叁个实例为22大类人类遗传疾病候选基因的预测,预测结果用小鼠表型进行验证,结果表明这22大类人类遗传疾病候选基因基本都富集了已知疾病基因富集的小鼠表型。我们所有结果表明,RF-GANPA既具有预测候选基因的可靠性,又具有广泛的适用性,可以利用这个方法为复杂疾病研究领域提供高质量的候选基因清单。

徐瑾[5]2013年在《新疆维吾尔族精神分裂症生物学样本数据库的建立》文中研究指明目的:收集并建立新疆维吾尔族及其他少数民族精神分裂症的临床资料及基因组DNA数据库,分析新疆维吾尔族及其他少数民族精神分裂症患者初次入院病人与多次反复入院病人的文化程度、职业、遗传等方面的影响以及两组病人主要临床表现的差异及预后评估。方法:收集新疆维吾尔族及其他少数民族住院病人的一般临床资料并登记入“精神疾病家系调查表”,抽取外周静脉血,提取基因组DNA并存入新疆医科大学一附院重大疾病资源标本库保存。以住院次数将病人分为初次入院及反复入院两组,并运用PANSS和BPRS量表对其进行评定及分析。结果:新疆维吾尔族及其他少数民族精神分裂症多次入院与初次入院的患者中文化程度与职业p<0.05,存在统计学差异;新疆少数民族精神分裂症两组病人BPRS评分与PANSS评分中,两量表总分、BPRS的缺乏活力因子中、PANSS的阳性症状与阴性症状量表中均p<0.05,得分有统计学差异。而PANSS量表一般精神病理量表,BPRS焦虑抑郁、思维障碍、激活性及敌对性四个因子中p>0.05,提示得分没有统计学意义,其临床表现可能基本相同。结论:新疆维吾尔族及其他少数民族精神分裂症的患者存有遗传倾向性;初次入院与多次反复入院的患者的文化程度及职业有明显差异,两组患者的主要临床表现也有明显的差别,这对其预后及用药方面有重大意义。

胡颖[6]2004年在《人类染色体13q32区域精神分裂症相关基因的遗传学研究》文中进行了进一步梳理人类基因组计划是人类认识自我的伟大科学工程,计划的目标是测定人类基因组的全部序列,从而通过解读全部遗传信息,阐明人类基因组及所有基因的结构和功能,揭开人类生命的奥秘。人类基因组是一个十分稳定却又存在各种变异的体系。不同种族、群体和个体都有46条染色体,有相同数目的基因和基因分布,也有基本相同的核苷酸序列。这种基因组结构的稳定性保证了人类作为一个物种的共同性和稳定性。在长期进化的过程中,基因组DNA序列又不断发生变异,其中一些变异被保存下来,导致了不同种族、群体和个体间基因组的差异和多态性。人类基因组计划的最伟大成就之一就是发现数以百万计的多态性遗传标记,众多的多态性遗传标记不仅有助于基因的鉴别和定位,在整个基因组水平上探讨基因与基因、基因与环境的相互作用机制,而且对于揭示与遗传因素密切相关的人类重大疾病(如肿瘤、心脑血管疾病、神经与精神性疾病)的遗传本质具有重要意义,为人类最终在基因水平上预防、诊断和治疗疾病奠定了重要基础。人类基因组中,最常见的DNA序列变异形式是单核苷酸多态性(SNP),约占90%左右。至今已发现超过15000个SNPs并保存到公共数据库。SNPs以其丰富、稳定和容易判定等特点逐步取代微卫星成为研究基因组多样性和识别、定位疾病相关基因的新一代遗传标记。它不但有助于解释个体的表型差异、不同群体和个体对疾病,特别是对复杂疾病易感性的差异,对各种药物反应性、耐受性的差异及对环境因子反应性的差异,而且通过建立序列变异与表型、序列变异与疾病风险之间的关系,将复杂疾病的预防、诊断和治疗置于坚实的遗传学基础上,从而使HGP给人类健康带来实际的利益。精神分裂症是一种以基本个性改变,思维、情感和行为的分裂,精神活动与环境不协调为主要特征的精神疾患,是人类面临的最为严重的疾病之一。在全世界范围内终生患病率接近1%(种族、地域、文化等差异不显着)。精神分裂症的严重之处在于:不仅给患者本人造成终身的痛苦,这种痛苦除来自疾病本身的折磨外,还来自于社会经济地位的下降、社会的歧视及治疗药物的副作用等;而且给家庭和社<WP=114>会造成长期沉重的负担,精神分裂症约占全球疾病总负担的2.8%,占用大量的医疗卫生资源。因此,确定精神分裂症的病因并在基因水平上预防和治疗疾病是当前医学研究中的重大课题。遗传流行病学研究证实,精神分裂症与遗传因素关系密切,但并非经典的孟德尔单基因遗传疾病,不是由一对显性或隐性基因所导致,而是多对微效基因所产生的协同作用,属于多基因遗传的人类复杂疾病。全基因组扫描连锁分析及连锁不平衡研究为筛检精神分裂症易感基因提供了强有力的研究手段,人类基因组计划已构建和正在构建的遗传图、物理图、基因图、DNA序列图、SNP图和单倍型图为定位精神分裂症易感基因提供了强有力的研究工具。目前,精神分裂症易感基因研究已经取得了较大进展,许多研究报道证实1q21-22、5q31-33、6p21-24,6q25-26、8p21-22、10p11-15、13q14-33及22q11-13等染色体区域可能含有精神分裂症易感基因。本研究工作选择人类第13号染色体长臂叁区二带(13q32)为精神分裂症易感基因候选区域,应用基于家系的连锁不平衡分析方法和基于群体的case-control相关分析方法在13q32染色体区域内筛检与精神分裂症相关联的基因位点。以229个中国汉族精神分裂症患者及其健康父母双亲组成的核心家系为研究对象,利用生物信息学工具,通过http://www.ncbi.nlm.nih.gov/、http://www.ncbi.nlm.nih.gov/SNP及http://snp.cshl.org/等数据库,确定13q32染色体区域内的48个已知基因,浏览每个基因上的SNPs。在每个基因DNA序列上分析1~2个含有限制性内切酶酶切位点,杂合度大于10%的SNPs。选定13q32染色体区域内3个候选基因和2个EST上的7个SNPs,包括结合糖基磷脂酰肌醇的硫酸乙酰肝素蛋白多糖6基因(GPC6)的rs2892679、丝氨酸/苏氨酸激酶24基因(STK24)的rs1886089和亲核素β3基因(KPNB3)的rs626716、rs624066和rs2761072及LOC160889(EST位点)的rs2282135和LOC122330(EST位点)的rs942358。长度横跨13139.81kb,在GPC6和LOC122330两个基因之间构建SNPs连锁不平衡图。用PCR-RFLP方法检测SNPs基因型,采用SPSS统计学软件管理和分析基因分型数据。用拟合优度卡方检验验证每个SNP基因型在抽样群体中的分布是否符合Hardy-Weinberg平衡。用EH plus和UNPHASED软件分析两个SNPs之间的连锁不平衡程度。对于单位点的SNP数据,除进行单倍型相对风险(HRR)和传递不平衡(TDT)方法分析外,还要进行临床亚组分析。这是因为由于SNPs的突变时间不同,每个SNP有其自己的遗传祖先,它们的等位基因频数分布可能互相干扰,只有进行临床亚组分析才能发现与疾病相关联的SNPs,排除假阴性结果,并证实临床异质性与遗传异质性的存在。对于两个以上SNPs构成的单倍型数据,用Transmit软件进<WP=115>行分析。针对精神分裂症的某一特定临床症状将患者分为有或无该症状两组,分析每个SNP位点等位基因及基因型在两组之间的分布是否有显着性差异,从而推测SNPs位点与精神分裂症临床症状的关系

贺宽军[7]2014年在《汉族人群中CACNA1C、ITIHs家族基因与精神分裂症、重度抑郁症的关联研究》文中研究说明精神疾病是指在遗传和环境因素共同作用下大脑功能失调,从而导致认知、情感、意志和行为等精神活动出现不同程度障碍的疾病。对家系、双生子和寄养所做的研究结果均表明遗传因素在精神疾病的致病诱因中占据相当比例。利用关联研究,人们找到了一些与精神疾病相关的遗传易感基因或位点。尽管这些关联研究的结果不尽相同,同样的结果也很少能在不同人群中重复证实,但确实存在部分基因或SNP位点能够在不同人群中被一致性重复证实。钙离子通道CACNA1C基因和ITIHs家族基因就是很好的例子,二者在不同的人群中被一致发现是多种精神疾病共享的风险基因。为了调查CACNA1C基因和ITIHs家族基因区域ITIH1-ITIH3-ITIH4区是否也是汉族人群中精神分裂症和抑郁症的遗传易感基因或区域,我们采用Haploview软件,分别选取了CACNA1C基因内11个SNP位点和ITIH1-ITIH3-ITIH4区域内的7个标签SNP位点,采用TaqMan基因分型技术在Fludigm EP1平台上,对1,235个精神分裂症患者,1,045个重度抑郁症患者和1,235个正常对照组进行基因分型,对得到的基因分型数据进行病例对照关联分析。此外利用生物信息学方法,对CACNA1C基因和ITIHs家族基因:ITIH1、ITIH3和ITIH4基因对应的蛋白进行蛋白质与蛋白质相互作用分析,构建蛋白质与蛋白质相互作用网络并对网络中具有相互作用的蛋白进行功能富集分析,然后利用文本挖掘搜索得到的富集功能与精神疾病和抑郁症相关文献,得出结论。实验的主要结果如下:(1)对于CACNA1C基因,我们证实rs1006737不仅与精神分裂症相关联(Pallele=0.0014,Pgenotype=0.006,OR=1.384[95%CI=1.134~1.690]),而且与重度抑郁症关联(Pallele=0.0007,Pgenotype=0.003,OR=1.425[1.160~1.752])。经Bonferroni多重检验校正后,该位点仍然与精神分裂症(Pallele=0.014)和重度抑郁症(Pallele=0.007,Pgenotype=0.03)显着关联;同时我们还证实rs2239015,rs2283290和rs2239037与精神分裂症显着关联(rs2239015:Pallele=0.0003,Pgenotype=0.0015,OR=1.249[95%CI=1.100~1.400]; rs2283290: Pallele=0.039,OR=1.181[95%CI=1.008~1.384]; rs2239037: Pallele=0.008, Pgenotype=0.016,OR=0.859[95%CI=0.768~0.961]),经Bonferroni校正后,rs2239015仍与精神分裂症显着关联(Pallele=0.003,Pgenotype=0.015)。将精神分裂症和重度抑郁症视为一个整体病例进行分析后,我们发现rs1006737和rs2239015与合并病例同样存在显着关联(rs1006737:Pallele=0.0002,Pgenotype=0.001,OR=1.403[1.174~1.677];rs2239015:Pallele=0.001,Pgenotype=0.005,OR=1.249[1.100~1.400]);经过Bonferroni多重检验校正后,rs1006737和rs2239015仍然与合并病例显着关联(rs1006737:Pallele=0.002,Pgenotype=0.01;rs2239015:Pallele=0.01)。(2)对于ITIHs家族基因区域ITIH1-ITIH3-ITIH4区,我们发现rs2710322、rs1042779、rs17331151、rs3821831在Bonferroni多重校正之前与精神分裂症显着关联(rs2710322: Pallele=0.0003, Pgenotype=0.001,OR[95%CI]=1.278[1.117~1.462]; rs1042779: Pallele=0.008, Pgenotype=0.017,OR[95%CI]=1.164[1.040~1.303]; rs17331151: Pallele=0.015,OR[95%CI]=1.322[1.054~1.658]); rs3821831: Pgenotype=0.04,OR[95%CI]=1.044[0.866~1.258])。rs2710322、rs1042779、rs3821831在Bonferroni多重校正之前与重度抑郁症也存在关联(rs2710322: Pallele=0.01,OR[95%CI]=0.840[0.735~0.959]; rs1042779: Pallele=0.007, Pgenotype=0.012,OR[95%CI]=1.178[1.047~1.326]; rs3821831: Pallele=0.0005, Pgenotype=0.001,OR[95%CI]=1.426[1.156~1.760])。经Bonferroni多重校正后,rs2710322与精神分裂症依然显着相关(Pallele=0.0018,Pgenotype=0.006);rs3821831与重度抑郁症显着关联(Pallele=0.003,Pgenotype=0.006);而rs1042779与精神分裂症(Pallele=0.048)和重度抑郁症(Pallele=0.042)存在弱关联。将精神分裂症和重度抑郁症作为一个整体病例进行分析,我们发现rs1042779、rs17331151和rs3821831与合并病例显着关联(rs1042779: Palles=0.002, Pgenotype=0.003,OR[95%CI]=1.171[1.060~1.292]; rs17331151: Pallele=0.029,OR[95%CI]=1.240[1.022~1.504]; rs3821831: Palle=0.038, Pgenotype=0.002,OR[95%CI]=1.193[1.010~1.410])。经Bonferroni校正后,rs1042779和rs3821831与合并病例同样显着关联(rs1042779:Palles=0.012,Pgenotype=0.018;rs3821831:Pgenotype=0.012)。(3)利用生物信息学方法,对我们证实的精神分裂症和重度抑郁症遗传易感基因:CACNA1C基因和ITIHs家族基因(ITIH1、ITIH3和ITIH4基因)对应的蛋白进行蛋白质与蛋白质相互作用分析,我们发现CACNA1C蛋白与ITIH家族中的ITIH3蛋白有直接相互作用,而ITIHs家族的叁个蛋白能够直接或者间接的构成蛋白互作网络。功能富集分析显示,CACNA1C蛋白功能主要富集在参与离子转运生物学过程、参与细胞离子通道复合物组成、构成离子运输蛋白质功能域和参与钙离子信号通路、MAPK信号通路、GnRH信号通路等方面;而ITIHs家族蛋白功能富集在参与透明质酸代谢过程、粘多糖代谢过程、氨基聚糖代谢过程、组成细胞外基质区、激活酶抑制剂和参与A型血管性血友病因子的结构域等方面。而这些CACNA1C蛋白和ITIHs家族蛋白所富集的功能中的部分功能,被认为在精神分裂症和抑郁症发生的神经生物学过程中发挥着重要作用。文本挖掘证实已有研究证实这些富集的功能中的部分功能与精神分裂症或者抑郁症存在关联。总之,在中国汉族人群中,我们证实CACNA1C基因和ITIHs家族基因组成的区域ITIH1-ITIH3-ITIH4区是精神分裂症和重度抑郁症共享的遗传易感基因或区域,这进一步证明共享的遗传风险存在于精神分裂症和重度抑郁症的生发过程中。同时证实CACNA1C蛋白与ITIH家族蛋白有相互作用,功能富集分析得到了二者功能的富集范围,文本挖掘揭示已有研究证实一部分富集的功能与精神分裂症或者抑郁症相关。本研究得到的CACNA1C基因和ITIHs家族基因与神分裂症和重度抑郁症关联性及二者对应蛋白之间的相互作用的结果,为精神疾病生物学研究奠定了基础,为常见变异/多个疾病假说提供了进一步的实验证据,也为精神疾病的诊断及病因学分析提供了借鉴和参考。

刘亚兰[8]2012年在《中国人群儿童孤独症的NRXN1基因关联研究和两种疾病相关拷贝数变异的鉴定》文中研究指明第一部分中国人群儿童孤独症的NRXN1基因关联研究孤独症是一种严重影响儿童健康的神经发育性障碍疾病,以社交相互性受损、语言和沟通障碍以及重复刻板行为为主要特征。孤独症是广泛性发育障碍(PDD,Pervasive Developmental Disorder)的一个最重要的亚类。由于PDD以儿童孤独症为主,其他亚类也有类似的孤独症样表现,所以PDD又被称为孤独症谱群疾病(ASD,Autism Spectrum Disorder).孤独症的诊断缺乏客观指标,主要以行为障碍为依据。孤独症缺乏特效治疗,主要依赖行为学训练,其预后差,60-70%的患儿不能独立生活。流行病学研究显示,孤独症的发病率逐年上升,2012年3月美国疾病控制及预防中心(CDC)调查显示的最新孤独症发病率已上升至11.3‰(1/88),其中男孩被诊断为孤独症的比例是1/54,是女孩的5倍。据世界卫生组织(WHO)估计,中国有60-180万的孤独症患儿,给社会造成极大的负担。孤独症的病因复杂,家系和双生子研究结果表明遗传因素在孤独症致病因素中起重要作用。研究结果表明,已鉴定的孤独症相关基因多数与突触功能及神经元可塑性相关,如NRXN1,NLGN3和NLGN4, SHANK3,CNTNAP2,PCD9以及PCD10等。位于染色体2p16.3的NRXN1(neurexin-1)基因编码neurexin蛋白,neurexin家族是一类高度多态性细胞表面蛋白,特异地表达于哺乳动物神经元,参与细胞识别和细胞黏附,并可能介导细胞信号转导。α-neurexin或β-neurexin通过与neuroligin形成异四聚体,调控神经元的突触兴奋或突触抑制,而神经突触异常可能会导致孤独症的发生。白2006年Friedman等首次报道NRXN-1α的新发杂合缺失与神经发育疾病的相关性以来,在不同人群精神分裂症、孤独症以及智力低下等多种精神疾病患者中均检测到NRXN1基因外显子的缺失突变。2008年,Kim等在孤独症患者中对NRXN1进行重测序发现了罕见的错义突变,提示NRXN1与孤独症的发生和发展有关.NRXN-1α缺失小鼠和果蝇模型的神经行为学缺陷也为NRXN-1α参与孤独症发病机理提供了证据。这些研究结果显示NRXN1是孤独症重要的候选易感基因之一。中国的孤独症研究明显落后于国际前沿,中国汉族人群孤独症患者与NRXN1的相关性及突变筛查研究尚无报道,而不同种族的遗传易感因素存在着很大的差别,因此,对中国汉族孤独症患者及其家系进行NRXN1基因的突变筛查及相关性分析,有助于了解在中国汉族人群中,NRXN1基因的变异与孤独症的关系。本研究利用直接测序法,在中国汉族人群313个孤独症患者中对NRXN-1α的所有编码区外显子及外显子/内含子交界区序列,NRXN-1β的1号外显子及外显子/内含子交界区序列进行了突变检测。对于检测到的带有非同义突变的外显子,在500个正常对照样本中进一步检测,以验证被检突变是否为数据库中未报道过的多态。对于检测到所有非同义突变,尤其是仅在患者中出现而在对照中没有出现的非同义变异,进一步检测其父母亲DNA样本以证实该变异是父母遗传还是新发(de novo)。在鉴定罕见或新发变异的同时,再进行病例——对照(Case-Control)关联研究。我们的研究共发现22个位于neurexin-1外显子区域的变异,包括7个错义突变,3个缺失和12个同义突变。在这些变异中,有3个错义突变和3个同义突变是未报道过的新发突变且在500个正常对照中未检出。另有4个错义突变,3个缺失和3个同义突变在dbSNP数据库中末报道过,同时在500个正常对照中有检出。此外,我们的结果中还包含了2个编码区和4个内含子区的已知SNPs。对所有患者和对照中均检测到的变异的统计学分析结果表明,SNP (rs2303298)的等位基因频率和基因型频率在患者组和对照组之间的有显着统计学差异(26.2%vs.13.8%;χ2=22.487;p=3.45E-006;OR=2.152(1.559-2.970))。本研究结果显示NRXN1基因的一个常见SNP (rs2303298)与中国汉族人群孤独症的发生显着相关。在更多样本中发现孤独症相关的NRXN1基因变异,并开展其分子致病机制的研究,有望阐明NRXN1在孤独症发病机制中的作用。第二部分两种孤独症相关拷贝数变异的鉴定已有的研究显示,染色体异常及罕见基因变异等与孤独症的发生有关,随着基因组学研究的发展,拷贝数变异(Copy Number Variations, CNVs)也被认为与孤独症的发生有关,基于高密度芯片的拷贝数变异研究使孤独症易感位点的鉴定取得了很大的进展。孤独症是最早开展CNVs全基因组关联分析研究的疾病之一。2007年Sebat等最早报道了孤独症与新发CNVs显着相关,随后有研究小组在孤独症家系中发现16p11.2新发的约593kb的缺失,此研究结果得到了其他叁个研究小组的验证。研究发现的孤独症相关CNVs区域包含了许多新的孤独症相关基因,例如SHANK2,SYNGAP1, DLGAP2以及X染色体连锁DDX53-PTCHD1位点等。到目前为止,已有研究显示约7%-20%的孤独症患者存在疾病相关的CNVs,涉及染色体主要包括1、3、5、7、15、16和22等。这些研究为拷贝数变异参与孤独症等遗传异质性很强的复杂疾病的发病机理提供了重要证据。而所有这些已发现的CNVs在不同的患者身上可能影响不同的基因,这意味着尽管不同的孤独症患者拥有相似症状,但引起症状的原因却可能是不同的遗传缺陷。因此,鉴定新的CNVs位点将为定位CNVs累及的可能易感基因提供研究基础。为了阐明中国汉族人群的孤独症遗传基础,本研究采用HumanCNV370-Duo芯片对455例孤独症患者样本进行全基因组基因分型,并用软件cnv Partition v2.4.4对患者和对照样本的分型数据进行全基因组CNVs分析。对得到的CNVs结果与正常对照、Database of Genomic Variants(DGV)数据库等比较,分类已报道的CNVs和我们新发现的罕见CNVs.对新发罕见CNVs利用实时荧光定量PCR(Real-time PCR)技术进行验证。进一步地利用生物信息学分析方法对这些罕见CNVs区域内的基因进行筛选,评价该位点与孤独症的相关性以及对发病风险的贡献。孤独症是一种与神经发育有关的疾病,遗传学因素导致神经发育有关的蛋白质、酶、受体、神经递质等的异常表达,引起神经元增殖和分化异常,提供了孤独症易感性的生物学基础。因此,在进行生物信息学分析时重点关注相关CNVs中与神经发生和发育有关的基因。本研究在455例孤独症患者中发现了大量CNVs,通过与正常对照CNVs进行病例——对照(Case-Control)分析以及与DGV数据库进行对比,我们在两个孤独症患者中分别发现了两个新发的罕见CNVs。其一是位于5号染色体5p15.33-p15.2区域的一个8MB的杂合缺失,属于拷贝数减少改变,为新发CNV,该区域内的SLC6A3基因被报道参与多种与神经发育异常有关的精神和神经系统疾病的发生;其二是位于10号染色体10p12.33区域的一个1MB的杂合重复,属于拷贝数增加改变,该区域内的CACNB2基因属于钙离子通道基因,已有研究表明异常的钙离子信号通道可能导致孤独症相关表型。此外,该区域内的PTPLA和STAM基因参与信号转导,被认为与神经退行性疾病相关。这些基因可能影响神经发生或发育有关蛋白质的表达,提示这两个新发CNVs可能与孤独症发生相关。本研究在455例孤独症患者中鉴定了两种新的孤独症相关CNVs位点,这两个CNVs所包含的基因将成为我们接下来的重点研究的对象。本研究为孤独症易感基因的定位和克隆研究提供了一定分子研究基础。

饶文旺[9]2017年在《调控纤维蛋白肽A的miRNAs基因多态性与精神分裂症的关联性研究》文中指出精神分裂症(Schizophrenia)是一组以思维、情感和行为之间不调协、精神活动和现实脱离为主要特征的常见的精神疾病,其发病率和终身患病率已高达1%,被世界卫生组织界定为世界上第四大疾病。然而,由于认识和技术手段上的限制,人们对精神分裂症发病机制仍不清晰。当前精神分裂症的遗传研究大多是从单个候选基因切入,而对于某些mi RNA-SNP与精神分裂症的遗传易感性的报道却为数不多。本课题的研究结果将为阐述mi RNA-SNP与精神分裂症的关联性提供证据支持,同时也为揭示精神分裂症的病因提供理论依据。目的利用分子遗传流行病学的研究思路,结合生物信息学技术,探讨调控纤维蛋白肽A的mi RNAs基因多态性与精神分裂症的关系,分析mi RNA基因多态性之间的交互作用对精神分裂症的影响,揭示mi RNA表观遗传学调控机制在精神分裂症发病过程中的可能作用靶点。方法本研究选取513例精神分裂症患者和513例社区健康居民为研究对象,二者年龄性别匹配。结合本课题组前期研究基础,利用生物信息学的方法预测调控纤维蛋白肽A的mi RNAs基因多态性位点,包括pre-hsa-mi R-605(rs2043556)、pre-hsa-mi R-595(rs4909237)、pre-hsa-mi R-27a(rs895819)、hsa-mi R-499a-3p/hsa-mi R-499b-5p(rs3746444)和hsa-mi R-585-5p(rs62376935)。利用im LDRTM多重SNP分型技术检测每个研究对象的基因型;H-W平衡检测采用拟合优度卡方检验;应用卡方检验分析调控纤维蛋白肽A的mi RNAs基因多态性位点与精神分裂症的关联性;应用GMDR软件进行mi RNA基因与基因之间的交互作用与精神分裂症的关联分析;应用Quanto软件分析调控纤维蛋白肽A的mi RNAs基因多态性位点与精神分裂症的关联性的统计功效。结果1.本研究精神分裂症患者共有513名,其中男性273名(53.2%),女性240名(46.8%),男女比例(1.14:1);年龄最小为14岁,最大为70岁,男性平均年龄为31.60±10.786岁,女性平均年龄为32.94±11.554岁。2.精神分裂症组和健康对照组年龄和性别的分布差异无统计学意义(Age:t=-1.074,P=0.283;Gender:χ2=3.057,P=0.080)。在精神分裂症组中,位点rs3746444的基因型频率分布偏离了H-W平衡(P<0.05),其余SNPs位点符合H-W平衡(P>0.05)。3.Pre-hsa-mi R-605(rs2043556)、pre-hsa-mi R-595(rs4909237)、pre-hsa-mi R-27a(rs895819)、hsa-mi R-499a-3p/hsa-mi R-499b-5p(rs3746444)和hsa-mi R-585-5p(rs62376935)的等位基因在精神分裂症患者和健康对照中的频数分布均不存在统计学差异(P>0.05)。4.Hsa-mi R-499a-3p/hsa-mi R-499b-5p(rs3746444)位点最优遗传模型是隐性遗传模式,在此模式下,精神分裂症患者和健康对照位点的基因型频数分布存在显着的统计学差异(χ2=4.072,P=0.044;ORG/G/(A/A+G/A)=0.476,95%CI=0.228-0.994)。然而,其他位点(rs2043556、rs4909237、rs895819、rs62376935)的基因型频数分布在所有遗传模型下均无统计学差异(P>0.05)。5.基因间交互作用分析结果:rs4909237/rs895819/rs3746444是mi RNA基因交互作用的最佳模型,但是并没发现此模型与精神分裂症的相关性(P>0.05);不过利用perl语言进行1000次置换校正之后,叁阶多因子模型(rs4909237/rs895819/rs3746444)与精神分裂症的患病风险相关(P=0.019)。6.统计学功效分析结果:pre-hsa-mi R-605(rs2043556)、pre-hsa-mi R-595(rs4909237)、pre-hsa-mi R-27a(rs895819)、hsa-mi R-499a-3p/hsa-mi R-499b-5p(rs3746444)和hsa-mi R-585-5p(rs62376935)位点在隐性遗传模型下统计学功效偏低,在显性和重迭遗传模型下,均具有较高的统计学功效。结论1.Hsa-mi R-499a-3p/hsa-mi R-499b-5p的多态性位点rs3746444与中国北方汉族人群精神分裂症的遗传易感性相关。2.Hsa-mi R-499a-3p/h sa-mi R-499b-5p的多态性位点rs3746444与pre-hsa-mi R-595的多态性位点rs4909237和pre-hsa-mi R-27a的多态性位点rs895819对中国北方汉族人群精神分裂症的遗传易感性具有交互作用。

李超[10]2007年在《基于中国汉族人群的精神分裂症候选基因的关联研究分析》文中认为精神分裂症(schizophrenia)是最严重最常见的精神疾病之一,在全世界各个人群中普遍存在,发病率在1%左右。主要表现为特征性的感知、思维、情感和行为的障碍以及精神活动与环境的不协调。同胞对分析、家系分析以及寄生子的研究一致表明,遗传因素在发病机制中起了重要的作用。目前对于精神分裂症的发生被认为是在环境因素影响下,多个中至微效基因协同作用的结果。本论文从基因组水平上出发,研究了KIF2和PDLIM5在中国汉族人群中与精神分裂症的相关性。KIF2是动力蛋白Kinesin家族的一员,在哺乳动物的神经元生长过程中承担重要的转运膜复合体和蛋白复合体的作用,并且通过在生长锥的边缘解聚微管调节微管动力。Homma等报道Kif2a基因敲除的小鼠在海马体的CA1和CA3区域出现了不正常的松散排列;而且在海马神经元的体外培养实验中,Kif2a-/-的海马神经元细胞在缺失了KIF2蛋白的抑制侧枝生长后较野生型神经元细胞长出很多侧枝。因此,KIF2很有可能是精神分裂症的易感基因之一,具有功能候选的特性。小鼠Kif2基因的同源基因在人类基因组的5q12.1。为了检测KIF2基因与精神分裂症发病的相关性,我们根据NCBI数据库中已有的KIF2基因的信息,选择了四个常见高频率单核苷酸多态性(Single Nucleotide Polymorphism,SNP)位点,并用软件设计了PCR引物,在中国汉族人群280个核心家系样本中,用等位基因实时PCR技术试验获得了样本所选四个位点的基因型,进而根据基因型数据和家系样本的结构,用ETDT、2LD、Hapview和FBAT软件分析了KIF2基因和精神分裂症的相关性。所选四个常见SNPs位点的关联分析中没有得到任何显着性结果。然而,本研究发现一个2-SNP的核心区域(rs2289883/rs464058,G/A)单倍型分析结果与精神分裂症密切相关;此外研究发现一个拥有23.4%的频率的常见4-SNP的单倍型(T/G/A/G)与精神分裂症相关(P=0.00795)。实验结果支持了KIF2基因是精神分裂症的易感基因之一的假设。PDLIM5是一个LIM结构域的蛋白,在细胞骨架的组织,细胞系的分化,器官发育和肿瘤形成中都有重要作用。这个蛋白同时也是Enigma蛋白家族中的一员,具有典型的由N端PDZ结构域和C端的1-3个LIM结构域构成的典型特征。PDLIM5蛋白在大脑的许多区域都有表达,包括海马体,皮层,丘脑,丘脑下部,杏仁体和小脑。在海马的神经元上,PDLIM5蛋白分布在突触后,是阿尔茨海默症发病期过渡表达蛋白AD7c-NTP的同源蛋白。Iwamoto等研究者发现在精神分裂症和双向情感障碍的患者的淋巴细胞系中,PDLIM5的mRNAs的量较正常人的量偏低,但是在精神分裂症、双向情感障碍以及抑郁症的患者的脑中,PDLIM5的mRNAs的量较正常人偏高。Kato等研究者报道了PDLIM5 mRNA在精神分裂症和双向情感障碍的患者脑中表达上调。从基因组研究的角度上,PDLIM5定位于人类基因组的4q22.3的位置,这一区域已经被多个连锁研究证明是精神分裂症的阳性区域。以上蛋白功能方面和连锁方面的证据提示,PDLIM5可能是精神分裂症的易感基因之一。因此,我们根据NCBI和HapMap数据库中已有的PDLIM5基因的信息和以往的研究,选择了SNPs位点,并用软件设计了引物。接着我们在江西地区中国汉族人群的精神分裂症病例对照样本中,用单碱基延伸的试验方法获取了样本PDLIM5基因上六个常见单核苷酸多态性位点的基因型,并根据病例对照组样本的特点和基因型的结果,用COCAPHASE和Hapview等软件统计分析,根据统计结果估计精神分裂症与PDLIM5之间是否存在关联。所选的六个单核苷酸多态性位点中,rs2433322在病例组和对照组中的等位基因频率有显着性差异(P=0.000010),包含这个位点的单倍型也同样发现存在显着性差异(在邦弗朗尼校正后Global P=0.00019)。我们的结果支持了PDLIM5很可能是精神分裂症的易感基因之一的假设。

参考文献:

[1]. 精神分裂症相关基因变异数据库的构建[D]. 周敏. 中国协和医科大学. 2003

[2]. 基因表达谱芯片校正批次效应算法的比较及网络分析在精神分裂症研究中的应用[D]. 陈超. 复旦大学. 2011

[3]. GRM7、GRM3、CMYA5基因与精神分裂症相关性研究[D]. 赵亚丽. 北京协和医学院. 2010

[4]. 整合组学数据预测原发性免疫缺陷病和精神分裂症等复杂疾病候选基因[D]. 梁燕. 复旦大学. 2012

[5]. 新疆维吾尔族精神分裂症生物学样本数据库的建立[D]. 徐瑾. 新疆医科大学. 2013

[6]. 人类染色体13q32区域精神分裂症相关基因的遗传学研究[D]. 胡颖. 吉林大学. 2004

[7]. 汉族人群中CACNA1C、ITIHs家族基因与精神分裂症、重度抑郁症的关联研究[D]. 贺宽军. 上海交通大学. 2014

[8]. 中国人群儿童孤独症的NRXN1基因关联研究和两种疾病相关拷贝数变异的鉴定[D]. 刘亚兰. 中南大学. 2012

[9]. 调控纤维蛋白肽A的miRNAs基因多态性与精神分裂症的关联性研究[D]. 饶文旺. 吉林大学. 2017

[10]. 基于中国汉族人群的精神分裂症候选基因的关联研究分析[D]. 李超. 上海交通大学. 2007

标签:;  ;  ;  ;  ;  ;  ;  ;  

精神分裂症相关基因变异数据库的构建
下载Doc文档

猜你喜欢