苏州市吴江地区人群Y染色体STR和SNP的遗传结构分析论文

·技术与应用·

苏州市吴江地区人群Y染色体STR和SNP的遗传结构分析

吴泽1,2,陈天发2,曾志凡2,张义为1,汤真1,苏开元1,范辰韵1,李士林1

(1.复旦大学生命科学学院,上海 200438;2.苏州市吴江区公安局,江苏 苏州 215200)

摘 要: 目的 分析苏州市吴江地区男性汉族人群Y染色体STR和SNP的基因分型,探索吴江地区人群的遗传结构,以进一步发掘具有该地区特异性的Y-SNP遗传标记祖先单倍群。方法 随机采集472名吴江地区汉族男性个体的血样,采用YfilerTMPlus PCR扩增试剂盒进行基因分型,通过直接计算法得出各基因座的等位基因频率和单倍型频率,用Y-Predictor软件推测各样本的Y-SNP单倍群,并通过扩增阻滞突变系统聚合酶链反应(amplification refractory mutation system-polymerase chain reaction,ARMS-PCR)进行实验验证。结果 472名吴江地区汉族男性群体的27个Y-STR遗传标记中,共检出453种单倍型,单倍型多样性(haplotype diversity,HD)为0.99769693,其中基因多样性(gene diversity,GD)值最高的是DYF387S1a/b(0.9531)、最低的是DYS438(0.3218)。根据472个样本27个Y-STR的基因分型数据,推测并实验验证得到来自C、D、N、O和Q等单倍群下游的132种单倍群。结论 本研究基于Y染色体STR单倍型,通过YPredictor软件预测Y-SNP单倍群并利用ARMS-PCR进行验证,引入Y-SNP遗传标记,实现了对吴江地区3个镇区人群男性家系的精细遗传结构解析。

关键词: 法医遗传学;短串联重复;单核苷酸多态性;Y染色体;遗传结构;单倍群;汉族;苏州

Y染色体遗传标记由于其父系遗传的特点,在法医学个体识别、混合样本鉴定、家系溯源等方面应用广泛[1],其中又以Y染色体短串联重复(Y chromosome short tandem repeat,Y-STR)序列和Y染色体单核苷酸多态性(Y chromosome single nucleotide polymorphism,Y-SNP)应用最为广泛。Y-SNP与Y-STR相比具有极低的突变率(约为3.0×10-8[2],并且基本不会出现回复突变。精确的Y-SNP单倍群可以对应到一个或几个Y-STR单倍型,即对应到一个或数个家系,相对于分布着大量Y-STR单倍型、只能依靠基因座遗传频率排序归类进行大海捞针式的粗糙数据处理的人群来说,自有排序体系的Y-SNP单倍群分类系统更为直观简便,对于数据库体系的构建也有着更为重要的价值。

目前基于Y-STR单倍型建立的数据库系统中,由于筛选了部分高突变STR遗传标记,来自不同祖先的汉族男性个体Y-STR单倍型可能与其他汉族男性个体Y-STR单倍型一致,或者存在1~3个STR位点基因型不同,那么,仅利用Y-STR单倍型数据进行家系排查及确定案件侦查方向时,就会存在很多的假阳性结果。对基于Y-STR单倍型的数据库,通过加入家系特异性SNP遗传标记,可以更科学准确地定位现场嫌疑人的相关男性家系,从而使Y染色体数据库成为功能更强大的侦破工具。

考虑到上述Y-STR和Y-SNP遗传标记各自的特点以及Y-SNP单倍群的家系特异性和区域特异性,在构建特定地区的Y染色体数据库时,需要联合考虑区域人群的Y-STR和Y-SNP,并分析家系特异性的核心单倍群和区域特异性的遗传结构。本研究对苏州吴江地区(横扇镇、平望镇和七都镇)472名汉族男性个体进行Y-STR分型、Y-SNP推断和实验验证,并联系Y-STR单倍型和Y-SNP核心家系单倍群,进一步分析其乡镇人群的遗传结构,为实现精确的家系溯源提供理论支持,为该地区Y染色体数据库的建设奠定理论基础。

1 材料与方法

1.1 样本

随机采集472名苏州市吴江地区(横扇镇、平望镇和七都镇)汉族男性个体的末梢血样本,保存于FTA采血卡(英国Whatman公司)。样本采集遵照知情同意原则。

1.2 试剂与仪器

YfilerTMPlus PCR扩增试剂盒、甲酰胺(Hi-DiTM)、分子量内标GeneScanTM500 LIZTM均购自美国Thermo Fisher Scientific公司,分子量内标QD550购自阅微基因技术有限公司,9700型PCR仪、3500xL基因分析仪均购自美国AB公司。

1.3 PCR扩增

根据横扇镇O2单倍群样本绘制网络图(图2),可以看到相同单倍群的家系聚集成簇,而簇又大致形成距离较远的两个大簇,聚集成大簇的家系基本属于相近的单倍群。

1.4 电泳与分型检测

按照甲酰胺(Hi-DiTM)1 000 μL+GeneScanTM500 LIZTM标准品20μL配制混合液,分装时每孔加入8μL混合液和1μL PCR产物,在3500xL基因分析仪上进行毛细管电泳检测。使用GeneMapper ID-X v1.2软件进行基因分型。

1.5 数据分析

用直接计算法计算各基因座的等位基因频率和单倍型频率,基因多样性(gene diversity,GD)和单倍型多样性(haplotype diversity,HD)的计算公式如下:

其中n为样本数,pi为等位基因频率或单倍型频率。

为了验证软件推测的Y-SNP结果的准确性,对认定为推测准确的352个样本和推测不准确的120个样本分别进行了ARMS-PCR实验验证。352个认定为推测准确的样本,其实验结果的单倍群大支与推测结果完全一致,表明按照本筛选标准得到的软件推测结果较为可靠;认定为推测不准确的120个样本中,41个样本的分型结果属于O2a1,20个样本属于O1b,1个样本属于D1a1,有58个样本在IJK单倍群下游不能细分,需要进一步检测更多SNP位点。图1展示了两个认定为推测不准确样本的分型结果,其中:图1A样本的推测结果为C2b1但权重不足10%,其分型结果为O2a1;图1B样本的推测结果为D1a1或C2b1,分型结果验证其为D1a1。

从表3可以看出:在推测结果准确的352个个体中,214名个体来自O1和O2单倍群分支,超过总人数的60%,统计加入Oα、Oβ和Oγ单倍群时达291人(82.67%);O单倍群的比例在79.74%(平望镇)至86.75%(横扇镇),在横扇镇和七都镇占比超过80%,其中除O2在横扇镇(31.33%)占最高比例以外,其余两镇中均为O1占比最高,分别为35.29%(平望镇)和43.97%(七都镇)。此外,Oα、Oβ和Oγ单倍群在各镇区中也占18.97%(七都镇)至28.92%(横扇镇),而C单倍群的比例在3.61%(横扇镇)至15.03%(平望镇),N单倍群的比例在4.58%(平望镇)至7.76%(七都镇),而D和Q单倍群占比在0.00%~3.61%。

对于推测的结果:若同一样本的3个结果来自相同的Y-SNP大支,且权重合计大于80%,则认为推测结果准确;若推测结果距离较远或权重过低,则认为推测结果不准确。

1.6 Y-SNP实验验证

为了验证Y-Predictor软件推测的Y-SNP单倍群是否准确,通过扩增阻滞突变系统聚合酶链反应(amplification refractory mutation system-polymerase chain reaction,ARMS-PCR)对吴江地区427名汉族男性样本的E-M96、D-JST021355、N-M231、C-M130、OP186、O1-M119、O2-M122、O1b-M268、O1b2-M176、O2a1-KL1、O2a2b1a1-M117(Page23)、O2a2a1a2-M7、O2a2b-P164、N1a1-M46、D1a1a1-N1、O2a2-P201、D1a2a-P47、C2-M217、I-M170、IJ-M429、K-M9、QRM45、G-M201M201、IJKLT-M522共24个SNP位点进行检验。反应体系为 25 μL,包含引物 5 μL、Master Mix 10μL、ddH2O 10μL。PCR条件:95℃变性5min;94℃ 20s,59℃ 90s,共30个循环;60℃延伸60min;4℃保存。按照甲酰胺(Hi-DiTM)1000μL+分子量内标QD550 30 μL配制混合液,分装时每孔加入8 μL混合液和1μL PCR产物,在3500xL基因分析仪上进行毛细管电泳检测。使用GeneMapper ID-X v1.2软件进行基因分型。

(3)综上所述,GPR既可以保证原位探测的测量精度,又能够在短时间内提供较大研究范围内的土壤水分空间异质性信息,可以很好地为更多尺度的土壤水分研究提供数据支持。

英语词汇中广泛存在一词多义的现象,因此翻译过程中,译者对原句中关键词词义的把握和确定能力就显得相当重要,一旦疏忽,就会造成错误理解。例如:

2 结 果

苏州市吴江地区472名汉族男性人群27个Y-STR基因座的等位基因频率分布见表1。472名汉族男性样本中,共检出453种单倍型,其中435种单倍型出现1次、17种出现2次、1种出现3次,人群的HD值为0.997 696 93。除DYS385a/b和DYF387S1a/b以外的23个Y-STR基因座共检出等位基因182种,各基因座检出4~16个等位基因,频率分布在0.002 1~0.809 3。DYS385a/b基因座共检出42种单倍型,频率分布在0.0021~0.1695。DYF387S1a/b基因座共检出36种单倍型,频率分布在0.0021~0.0890。

目前海南大学的《商品学》课程主要在市场营销和国际贸易两个专业中开设,在该课程开设的几年时间中,学生的普遍反映为此课程“用处不大”,《商品学》原本为应用性极强的学科,在学生中得到如此反应,主要是在教学中存在以下几个问题。

表1 苏州市吴江地区汉族男性人群27个Y-STR基因座的等位基因频率 (n=472)

续表1

(4)能有效改善油层渗透性,该工艺在简化了出砂油田的采油工艺的同时,能够将油层近井地带的游离砂排出地面,增加了近井地带的渗透率,从而大规模提高单井产能,提高区块开发效益。

根据图纸说明并结合相关标准规范要求,在建筑模型中创建构造柱、圈梁、门过梁、反坎和门槛等二次结构构件,并生成材料明细表精确提取单层材料运输量,对构件进行平面标识,输出二维和三维深化图,指导现场施工(见图 5)。

表2 苏州市吴江地区汉族男性人群27个Y-STR基因座的GD值 (n=472)

吴江古时为苏州府吴江县,以吴江(现吴淞江)为名,始建于后梁开平三年(公元909年),吴江地处南北漕运走廊,大运河穿过松陵镇,水系发达的平望则是连接周边的交通枢纽,发达的丝绸产业吸引大量外来人口至此从事缫丝、纺经和往来贸易,使得这些商业发达的镇区有了频繁的人群流动[5]。而比邻太湖的横扇、七都等镇由于其充沛的水源和肥沃的土地,主要以发展渔业和农业为主,人群一般世代在本地聚居,形成了相对固定的本地主要家系[6]。对于这样群体结构相对复杂的地区,家系遗传结构的具体分析在数据库建设中显得尤为重要。

表3 吴江地区3个镇区人群的Y-SNP核心单倍群(个)

其中n为参与计算的Y-STR基因座数目,ai为待测样本A第i个Y-STR基因座的等位基因的数值,bi为已知样本B第i个Y-STR基因座的等位基因的数值,mi为第i个Y-STR基因座的突变速率。根据待测样本与数据库中每一个已知样本之间的遗传距离,通过加权算法可以推测出与该样本最接近的3个Y-SNP单倍群。

用本实验室开发的Y-Predictor软件(待发表),根据27个Y-STR数据推测各样本的Y-SNP单倍群。Y-Predictor的数据库是由本实验室在千人基因组计划Ⅲ期中筛选分析东亚地区Y-SNP和对应的YSTR得到的数据,根据Y-SNP单倍群构建系统发生树,一个样本的Y-STR单倍型可以通过其所属的YSNP单倍群追溯到系统发生树具体的支上。通过计算待测样本的Y-STR单倍型与数据库中已有的YSTR单倍型之间的遗传距离,就能够判断其在系统发生树上的位置[3]。两个Y-STR单倍型遗传距离(d)的计算公式[4]如下:

图1 两个认定为推测不准确样本的ARMS-PCR检测结果

A:分型结果为O2a1;B:分型结果为D1a1。WT表示野生型,MT表示突变型。

在3个镇区人群中,O1a1a1a1a*-F794是其共有的核心单倍群,聚类了67个不同家系的Y-STR单倍型(横扇镇10个、平望镇28个、七都镇29个),与其邻近的O1a1a1a1*-SK1567也有来自平望镇(12个)和七都镇(9个)的21个家系。此外,平望镇另有来自O1a1a1a1a*-F4149、O1a1a1a1a1-F707等9个O1下游单倍群的14个家系,七都镇另有来自O1a1a1a1*-SK1527、O1b1a2a1-F977等8个O1下游单倍群的13个家系,构成各自区域的核心单倍群和核心家系;横扇镇则有来自O2a2a1a2a1c1-F863、O2a1c1b1a12*-F806、O2a2a2a*-F2216等17个O2下游单倍群的26个家系,构成其核心单倍群和核心家系。

按照YfilerTMPlus PCR扩增试剂盒说明书,对472份血卡采用直接扩增法在9700型PCR仪上进行扩增。反应体系为 10 μL,包含引物 4 μL、PCR Mix 2μL、ddH2O 4μL。血卡打孔直径1.2mm。PCR程序:95℃变性1 min;94℃ 4 s,61.5℃ 1 min,60℃22min,共30个循环;60℃延伸22min;4℃保存。

27个Y-STR位点的GD值见表2,范围在0.3218~0.9531。其中DYF387S1a/b的GD值最高(0.9531),其次是 DYS385a/b(0.9478)、DYS449(0.8584)和 DYS627(0.844 7)。DYS438的GD值最低(0.321 8),其次是DYS391(0.4075)、DYS437(0.4536)和 DYS533(0.4704),除此4个基因座外,其余基因座的GD值均大于0.5。

图2 横扇镇O2单倍群27个Y-STR的网络图

3 讨 论

采用Y-Predictor软件根据吴江地区472名汉族男性个体27个Y-STR数据推测其各自的Y-SNP单倍群,得到来自C、D、N、O和Q等单倍群下游的132种不同的单倍群,其中推测结果准确的有352个,分布如表3所示。

Y-SNP突变具有迭代累加的特性,比如当某个父亲Y染色体上某个SNP位点发生了A突变,那么他的所有男性后代的Y染色体上都会出现A这种突变。如果这群人中的某个人的另一个SNP位点出现了B突变,那么这个人的男性后代就会同时出现A和B两种突变,故根据Y-SNP位点突变基因型可以定位男性家系的特异性遗传标记[7]

除了家系特异性以外,由于人类走出非洲后形成了不同的迁徙路线[8],Y-SNP单倍群在地域上也有着鲜明的特异性分布。在东亚地区最为常见的单倍群C、D、N、O中,C主要出现在北亚、东亚、大洋洲和美洲人群[9-10],D则只出现在亚洲,尤其是中国西藏和日本[10-12],N 广泛分布于亚欧大陆[7,13],而东亚地区人群80%~90%都属于单倍群O[14-18]

本研究在苏州市吴江地区获取了472名橫扇镇、平望镇及七都镇本地随机男性样本的完整27个YSTR基因型。为提高Y-STR技术的群体溯源和家系排查能力,本研究在Y-STR结果的基础上,利用YPredictor软件和ARMS-PCR技术,引入Y-SNP遗传标记对家系进行进一步细分,结果表明,C、D、N、O和Q单倍群在3个镇区人群中均有分布但差异明显,其中以O单倍群为主(占总体82.67%),与东亚人群的分布[2,7-8]基本相符合,而D和Q单倍群则分布极少。这一方面是由于此类单倍群人群在当地本身不多,另一方面则是因为Y-Predictor软件对吴江地区人群中推测为此类单倍群的样本给出了不同的推测结果或较低的可信程度,因此许多样本被认定为推断不准确,在进一步的实验验证过程中,发现了1例来自D1a1单倍群的样本,对于其他无法细分的样本则需要检测更多SNP位点以确认其具体单倍群。

根据Y-STR和Y-SNP的结果来看,横扇镇的人群结构可划分为两个主要的单倍群。由于横扇镇比邻太湖,从明清开始就形成了发达的捕鱼业,且地处太湖冲积平原,气候和土地条件适宜耕作。据《乾隆震泽县志》记载,横扇人群主要为渔民、农民聚居,人员流动较少,因此形成了较为稳定的本地家系。而清道光年间,有难民自河南逃难至此,于太湖以南的滩涂围垦湖田,由于此处天然肥沃的土地和充沛的水源,便成功以务农在此定居[19]。因此,距离较远的另一簇样本则很可能与此次人群迁徙有关。因此本地世居从事渔农的人群和外来逃难、务农定居的人群共同组成了如今的横扇群体。

综上所述,本研究利用Y-STR复合Y-SNP研究,对乡镇级别区域人群的遗传结构进行了分析,得到了区域核心单倍型和核心家系。本研究方法和数据适用于法医学实践中的亲权鉴定和家系溯源,为公安系统重点人群监控和实际案件中精确个体识别提供了科学依据和技术手段,为建设具有吴江地区特色的Y染色体数据库提供了理论依据和数据支持。

教育部《关于深化教学改革,培养适应21世纪需要的高质量人才的意见》中对“人才培养模式”给出了定义:“人才培养模式是学校为学生构建的知识、能力、素质结构,以及实现这种结构的方式,它从根本上规定了人才特征并集中地体现了教育思想和教育观念”。有学者认为,人才培养模式是一种关于人才培养的四大要素——人才培养目标、人才培养体系、人才培养过程和人才培养机制的“范型”和“式样”[2]。

在孔子生活的年代,士是由平民社会升入贵族阶层的过渡身份。向孔子求学的人,多未入仕(做官),因此孔子和他的弟子经常探讨在当时的社会应当怎样以士的身份立身处世。应该说,孔子是中国历史上以平民身份在社会上施教的第一人。但孔子的教学目的是使学生由明道而行道,而不是由求仕而得仕。学生一旦通过学习而得仕,也是为了藉仕行道,并非为了谋取个人的荣华富贵。所以,对于投入孔门之下的学生,孔子必先教之以道为志向。道是关系天下后世的公事,衣食则属于人之私利。人既想为公,又放不下己私,是不会成气候的。

参考文献:

[1] XU S,YANG S,YANG M,et al.Analysis of Y-chromosome short tandem repeat loci on 1 082 Nantong Han individuals in eastern China[J].Forensic Sci Int Genet,2016,23:e18-e19.

[2]XUE Y,WANG Q,LONG Q,et al.Human Y chromosome base-substitution mutation ratemeasured by direct sequencing in a deep-rooting pedigree[J].Curr Biol,2009,19(17):1453-1457.

[3] 许思娴.基于STR及SNP遗传标记的法医学研究[D].上海:复旦大学,2017.

[4] NEI M.Phylogenetic analysis in molecular evolutionary genetics[J].Annu Rev Genet,1996,30:371-403.

[5] 吴江市档案局.道光吴江县志汇编[M].扬州:广陵书社,2010.

[6] 童黄培.民国吴江县级财政与社会变迁[D].南昌:江西师范大学,2011.

[7]UNDERHILL P A,SHEN P,LIN A A,et al.Y chromosome sequence variation and the history of human populations[J].Nat Genet,2000,26(3):358-361.

[8]ELHAIK E,TATARINOVA T V,KLYOSOV A A,etal.The ‘extremely ancient’ chromosome that isn’t:A forensic bioinformatic investigation of Albert Perry’s X-degenerate portion of the Y chromosome[J].Eur J Hum Genet,2014,22(9):1111-1116.

[9]XUE Y,ZERJAL T,BAO W,et al.Male demography in East Asia:A north-south contrast in human population expansion times[J].Genetics,2006,172(4):2431-2439.

[10]HAMMER M F,KARAFET T M,PARK H,et al.Dual origins of the Japanese:Common ground for hunter-gatherer and farmer Y chromosomes[J].J Hum Genet,2006,51(1):47-58.

[11]SU B,XIAO C,DEKA R,et al.Y chromosome haplotypes reveal prehistorical migrations to the Himalayas[J].Hum Genet,2000,107(6):582-590.

[12]CORDAUX R,WEISS G,SAHA N,et al.The northeast Indian passageway:A barrier or corridor for human migrations?[J].Mol Biol Evol,2004,21(8):1525-1533.

[13]SHI H,QI X,ZHONG H,et al.Genetic evidence of an East Asian origin and paleolithic northward migration of Y-chromosome haplogroup N[J].PLoS One,2013,8(6):e66102.

[14]ROEWER L.Y chromosome STR typing in crime casework[J].Forensic Sci Med Pathol,2009,5(2):77-84.

[15]HURLES M E,SYKES B C,JOBLING M A,et al.The dual origin of the Malagasy in Island Southeast Asia and East Africa:Evidence from maternal and paternal lineages[J].Am J Hum Genet,2005,76(5):894-901.

[16]SCHEINFELDT L,FRIEDLAENDER F,FRIEDLAENDER J,etal.Unexpected NRY chromosome variation in Northern Island Melanesia[J].Mol Biol Evol,2006,23(8):1628-1641.

[17]LI H,HUANG Y,MUSTAVICH L F,et al.Y chromosomes of prehistoric people along the Yangtze River[J].Hum Genet,2007,122(3/4):383-388.

[18]YAN S,WANG C C,ZHENG H X,et al.Y chromosomes of 40%Chinese descend from three Neolithic super-grandfathers[J].PLoS One,2014,9(8):e105691.

[19]吴江区档案局,吴江区方志办.乾隆震泽县志[M].扬州:广陵书社,2016.

Genetic Structure Analysis of Y-Chromosome STR and SNP in Population of Wujiang Area,Suzhou City

WU Ze1,2,CHEN Tian-fa2,ZENG Zhi-fan2,ZHANG Yi-wei1,TANG Zhen1,SU Kai-yuan1,FAN Chenyun1,LI Shi-lin1
(1.School of Life Sciences,Fudan University,Shanghai 200438,China;2.Wujiang District Public Security Bureau of Suzhou,Suzhou 215200,Jiangsu Province,China)

Abstract: Objective To analyze the genetic phenotypes of Y-chromosome STR and SNP in Han male population of Wujiang area,Suzhou City and explore the genetic structure of population of Wujiang area for further examination of regional-specific Y-SNP genetic markers ancestor haplogroups.Methods Blood samples of 472 Wujiang area Han males were randomly collected and genotyped by YfilerTMPlus PCR Amplification Kit.The allele frequencies and haplotype frequencies of each locus were obtained using the direct calculation method.Y-SNP haplogroups of each sample were estimated using Y-Predictor software and verified through experiments by amplification refractory mutation system-polymerase chain reaction(ARMS-PCR).Results A total of 453 haplotypes were found in the 27 Y-STR genetic markers in 472 Han males of Wujiang area.The haplotype diversity(HD)was 0.997 696 93,among which,the highest gene diversity(GD) value was DYF387S1a/b(GD=0.953 1) and the lowest was DYS438(GD=0.321 8).Based on genotyping data of 27 Y-STRs and 472 samples,132 haplogroups from C,D,N,O and Q,etc downstream Y-SNP haplogroups were estimated and then verified through experiments.Conclusion This study is based on Y-chromosome STR haplotypes,and predicts Y-SNP haplogroups by Y-Predictor software,then uses ARMS-PCR to verify.Y-SNP genetic markers were introduced to achieve precise analysis of the genetic structure of male families in population of three towns in Wujiang area.

Keywords: forensic genetics;short tandem repeat;single nucleotide polymorphism;Y chromosome;genetic structures;haplogroup;Han nationality;Suzhou

中图分类号: DF795.2

文献标志码: A

doi: 10.12116/j.issn.1004-5619.2019.04.014

文章编号: 1004-5619(2019)04-0448-07

基金项目: 公安部物证鉴定中心开放课题资助项目(2015FGKFKT01);教育部科学技术研究资助项目(113022A)

作者简介: 吴泽(1979—),男,硕士研究生,主检法医师,主要从事DNA检验;E-mail:dandanbaobao521@163.com

通信作者: 李士林,男,副教授,主要从事法医遗传学研究;E-mail:lishilin@fudan.edu.cn

收稿日期 :2018-03-26)

(本文编辑:张素华)

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

苏州市吴江地区人群Y染色体STR和SNP的遗传结构分析论文
下载Doc文档

猜你喜欢