CN112011622B - 一种对未知来源个体进行非、东亚、欧洲群体来源分析的方法和系统 - Google Patents

一种对未知来源个体进行非、东亚、欧洲群体来源分析的方法和系统 Download PDF

Info

Publication number
CN112011622B
CN112011622B CN201910458160.3A CN201910458160A CN112011622B CN 112011622 B CN112011622 B CN 112011622B CN 201910458160 A CN201910458160 A CN 201910458160A CN 112011622 B CN112011622 B CN 112011622B
Authority
CN
China
Prior art keywords
population
dna
artificial sequence
amplification
east asia
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910458160.3A
Other languages
English (en)
Other versions
CN112011622A (zh
Inventor
李彩霞
韩俊萍
赵蕾
江丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Forensic Science Ministry of Public Security PRC
Original Assignee
Institute of Forensic Science Ministry of Public Security PRC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Forensic Science Ministry of Public Security PRC filed Critical Institute of Forensic Science Ministry of Public Security PRC
Priority to CN201910458160.3A priority Critical patent/CN112011622B/zh
Publication of CN112011622A publication Critical patent/CN112011622A/zh
Application granted granted Critical
Publication of CN112011622B publication Critical patent/CN112011622B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供一种对未知来源个体进行非、东亚、欧洲群体来源分析的方法和系统,所述方法包括提取未知来源个体的DNA;获得所述DNA的42个位点的基因型,所述42个位点包括40个非、东亚、欧洲群体常染色体InDel位点以及DYS439基因座和Amelogenin性别基因座;根据各位点的基因型对未知来源个体进行非、东亚、欧洲群体来源分析。本发明提供的方案能实现对未知来源个体的非、东亚、欧洲群体来源分析,并为未知来源个体进行非、东亚、欧洲群体来源推断提供数据支持。

Description

一种对未知来源个体进行非、东亚、欧洲群体来源分析的方法 和系统
技术领域
本发明涉及一种推断未知个体来源的方法和系统,尤其涉及一种对未知来源个体进行非、东亚、欧洲群体来源分析的方法和系统。
背景技术
伴随经济全球化,不同国家、区域间的人员流动加大,涉外、反恐、跨区域流动作案等复杂案件不断增多,案件侦查的难度日益加大。目前国际人种主要分为非、东亚、欧洲三大人种及由这些人种形成的混合人种。
同族群祖先的遗传标记信息可表现为等位基因频率分布的明显差异性,在法医分析中选取一组这样的遗传标记位点可以对某人群/个体的遗传成分构成进行分析,对个体祖先来源进行推断。
国际上针对洲际层面非、东亚、欧洲这3大最主要人群的分类划分已经研究的较为深入,形成了很多不同的AIM,SNP,STR位点组合,并构建了少数几套复合扩增检测体系用于实践检验。
插入/缺失多态性(insertion-deletion polymorphism,InDel)在基因组中含量广泛,每7.2Kb就至少有一个InDel位点,由于其结合了SNPs和STRs的有利特征:突变率较低且相当稳定;表现为二等位基因,本质上仍属于长度多态性遗传标记;易于从短片段中获得分型,适于案件中常见降解DNA样本;InDel可通过常规PCR-CE实现检测,与现有法医基因分型系统相匹配;在距离较远的群体之间能显示出等位基因频率分布差异,因此InDel成为较为理想的研究祖先信息的遗传标记。
如何针对非洲、东亚和欧洲人群的遗传结构特点,筛选出一组具有显著差异性的祖先信息InDel位点,用于非、东亚、欧洲人群的区分成为有待解决的问题。
发明内容
本发明提供了一种对未知来源个体进行非、东亚、欧洲群体来源分析的方法,通过获得未知来源个体DNA的40个非、东亚、欧洲群体常染色体InDel位点,以及DYS439基因座和Amelogenin性别基因座的基因型,根据各位点的基因型可实现对未知来源个体的非、东亚、欧洲群体的来源分析。
本发明还提供了一种对未知来源个体进行非、东亚、欧洲群体来源分析的系统,利用该系统中的复合扩增检测体系能快速获得未知来源个体的DNA 40个非、东亚、欧洲群体常染色体InDel位点,以及DYS439基因座和Amelogenin性别基因座的基因型,根据各位点的基因型可实现对未知来源个体的非、东亚、欧洲群体的来源分析。
本发明还提供了一种复合扩增检测体系,能获得未知来源个体的DNA 40个非、东亚、欧洲群体常染色体InDel位点,以及DYS439基因座和Amelogenin性别基因座的基因型,为获得未知来源个体的非、东亚、欧洲群体遗传主成分分析结果提供数据支持。
本发明还提供了一种检测试剂盒,含有所述复合扩增检测体系。该试剂盒能快速获得未知来源个体的DNA 40个非、东亚、欧洲群体常染色体InDel位点,以及DYS439基因座和Amelogenin性别基因座的基因型。
本发明提供的一种对未知来源个体进行非、东亚、欧洲群体来源分析的方法,该方法包括:
1)提取未知来源个体的DNA;
2)获得所述DNA的42个位点的基因型,所述42个位点包括40个非、东亚、欧洲群体常染色体InDel位点以及DYS439基因座和Amelogenin性别基因座,所述40个非、东亚、欧洲群体常染色体InDel位点为:rs3054057、rs112634351、rs1160852、rs145415095、rs2308036、rs10656283、rs35851958、rs2308101、rs16416、rs10612372、rs1610878、rs140847、rs143825911、rs72173922、rs5900168、rs34921138、rs111759013、rs5877023、rs35633537、rs548753180、rs17879936、rs3045215、rs34122827、rs16715、rs5789229、rs74748892、rs1160953、rs66850318、rs68050185、rs112109748、rs71425754、rs2307832、rs2308067、rs16711、rs3071043、rs3991155、rs3083306、rs2307805、rs67625332和rs1610963;
3)根据各位点的基因型对未知来源个体进行非、东亚、欧洲群体来源分析。
进一步的,上述2)包括采用与所述42个位点一一对应的42对扩增引物对其进行扩增以获得扩增产物的步骤。
更进一步的,所述扩增引物为序列表中SEQ ID No.1至SEQ ID No.84的核苷酸序列。
在本发明的一个具体实施方式中,2)还包括在获得扩增产物后,使用遗传分析仪分析该扩增产物,以获得所述42个位点的基因型的步骤。在本发明的方案中,所述遗传分析仪可以是本领域技术人员常规使用的遗传分析仪,例如ABI3130或ABI3500型遗传分析仪,通过
Figure BDA0002077237950000021
ID-X软件或其他GeneMapper软件等分析该延伸产物中所述40个常染色体InDel位点的基因型。
本发明提供的一种对未知来源个体进行非、东亚、欧洲群体来源分析的系统,包括DNA提取体系,复合扩增检测体系,数据获取体系;
所述DNA提取体系用于提取未知来源个体的DNA;
所述复合扩增检测体系用于获得所述DNA的42个位点的基因型,所述42个位点包括40个非、东亚、欧洲群体常染色体InDel位点以及DYS439基因座和Amelogenin性别基因座,所述40个非、东亚、欧洲群体常染色体InDel位点为:rs3054057、rs112634351、rs1160852、rs145415095、rs2308036、rs10656283、rs35851958、rs2308101、rs16416、rs10612372、rs1610878、rs140847、rs143825911、rs72173922、rs5900168、rs34921138、rs111759013、rs5877023、rs35633537、rs548753180、rs17879936、rs3045215、rs34122827、rs16715、rs5789229、rs74748892、rs1160953、rs66850318、rs68050185、rs112109748、rs71425754、rs2307832、rs2308067、rs16711、rs3071043、rs3991155、rs3083306、rs2307805、rs67625332和rs1610963;
所述数据获取体系用于根据各位点的基因型对未知来源个体进行非、东亚、欧洲群体来源分析。
在本申请的方案中,根据各位点的基因型,与现有软件结合,对未知来源个体的非、东亚、欧洲群体进行来源分析,包括:
1)将所述各特异性位点的基因型使用种族推断软件FI v1.0计算样本的群体匹配概率(Population assignment match probability,AMP)和似然比(Likelihood ratio,LR);
2)使用STRUCTURE v2.3.4软件计算人群祖先成分比例,使用CLUMPAK对STRUCTURE结果进行可视化;
综合分析AMP值和祖先成分进行最终判断,当LR>100时,AMP值排第一位的人群为待测个体的来源人群,当LR≤100时,AMP的前两位人群均不排除;或
3)采用Rv3.2.3进行主成分分析(Principal component analysis,PCA),并用R程序包ggplot2画出种族归类图。
在本申请的方案中,FI软件,STRUCTURE软件,CLUMPAK软件以及R语言编写的脚本为本领域现有的数据分析软件,其使用方法为本领域已知的,利用上述软件实施本发明的方案对本领域技术人员来说是可以实现的。FI软件即Forensic Intelligence软件(FIversion 1.0,可以通过在线获取地址:https://github.com/jiangl1989/FI/)。
进一步的,所述复合扩增检测体系用于采用与所述42个位点一一对应的42对扩增引物对其进行扩增以获得扩增产物,并由获得的扩增产物得到未知来源个体的DNA的42个位点的基因型。
更进一步的,所述扩增引物为序列表中SEQ ID No.1至SEQ ID No.84的核苷酸序列。
本发明提供的一种复合扩增检测体系,包括未知来源个体DNA,以及扩增引物,
所述复合扩增检测体系用于利用所述扩增引物扩增未知来源个体的DNA的42个位点获得扩增产物,并由获得的扩增产物得到未知来源个体的DNA的42个位点的基因型,所述42个位点包括40个非、东亚、欧洲群体常染色体InDel位点,DYS439基因座,Amelogenin性别基因座;
所述40个非、东亚、欧洲群体常染色体InDel位点为:rs3054057、rs112634351、rs1160852、rs145415095、rs2308036、rs10656283、rs35851958、rs2308101、rs16416、rs10612372、rs1610878、rs140847、rs143825911、rs72173922、rs5900168、rs34921138、rs111759013、rs5877023、rs35633537、rs548753180、rs17879936、rs3045215、rs34122827、rs16715、rs5789229、rs74748892、rs1160953、rs66850318、rs68050185、rs112109748、rs71425754、rs2307832、rs2308067、rs16711、rs3071043、rs3991155、rs3083306、rs2307805、rs67625332和rs1610963;
所述扩增引物由与所述42个位点一一对应的42对扩增引物组成,所述扩增引物为序列表中SEQ ID No.1至SEQ ID No.84的核苷酸序列。
本发明提供的一种检测试剂盒,包括所述的复合扩增检测体系。
在本发明的方案中,本发明利用所述复合扩增检测体系进行42个位点的分型的方法,包括:1)将提取的未知来源个体DNA作为模板;2)使用所述扩增引物对作为模板的未知来源个体DNA进行多重PCR扩增反应以得到扩增产物;3)将所述扩增产物利用遗传分析仪进行分析,以获得42个位点的分型结果。
上述40个常染色体InDel位点的组合是申请人通过查阅大量参考文献,通过对非、东亚、欧洲人群的生活环境、种族起源等进行综合分析,考察各地区民族人口的表型特征差异,包括外形特征,生理指标等,以及18个已知1000Genomes群体,也可称为参考群体,通过分析Hardy-Weinberg平衡(p>0.001),位点间连锁平衡(r2<0.2),以及δ值,平均Fst得到的。申请人同时还采用区别于上述18个参考群体的11个测试群体以及11份未知样本对本申请的方法和系统进行了验证。
具体的:所述18个参考群体:包括来自公共数据库1000Genomes中的18个人群,共1796份样本。11个测试群体:包括来自本实验室(即李彩霞实验室,来源于国家科技资源共享服务平台计划项目(YCZYPT[2017]01-3、2017JB025和2017JB0)9个人群1068份生物样本,来自北德克萨斯大学Bruce实验室2个人群164份DNA样本,共1232份样本。11份未知样本来源于本实验室日常收集的样本。
所述18个参考群体和11个测试群体(加粗和斜体)的样本信息如表1所示。
表1还显示了由40个常染色体InDel位点组合分析当K=3时,聚类得到29个群体的祖先成分比例,以及根据AMP值计算得到的匹配率精确度。由该比例可以看出,本申请的40个InDel位点能够用于上述29个群体(18个参考群体的11个测试群体)的划分。
表1中,在11个测试群体中,从祖先成分比例看,AFA的祖先主成分为非洲血统,占0.863;CXX,HCB,THC,CHL,HUX的东亚人种主成分均超过0.92,分别为最主要的东亚成分分别占0.935,0.969,0.969,0.97,0.917;CAU的祖先主成分为欧洲血统,占0.965;来自新疆的CUX、CTX、CKX、CZX群体为欧亚混合人种,其祖先主成分为东亚和欧洲,分别为0.458/0.506、0.238/0.718、0.583/0.367、0.639/0.321。
在11个测试群体中,从匹配率精确度看,AFA人群除了1个样本归入混合人群外,其余个体均被归入非洲人群(匹配率精确度达98.9%);CAU人群个体均被归入欧洲人群(匹配率精确度达100%);CXX人群除了5个样本归入混合人群外,其余个体均被归入东亚人群(匹配率精确度达94%);HCB、CHL、THC等人群所有个体均被归入东亚人群(匹配率精确度达100%);HUX人群中大多数样本被归入东亚人群(匹配率精确度达89.5%);CUX、CTX、CKX、CZX等混合人群大多数样本归类到混合人群中(匹配率精确度分别为75%、75%、86%、74%),部分个体由于LR≤100,推断结果为不排除其来源于混合人群(如表1)。11个人群中非洲(AFA)、欧洲(CAU)和东亚(CXX、HCB、CHL、THC、HUX)均根据其祖先主成分大于0.9正确地聚类,见表1。其余4个人群(CUX、CTX、CKX、CZX)则表现出明显的欧亚混合成分(分别为50.6%/45.8%、71.8%/23.8%、36.7%/58.3%、32.1%/63.9%)。
Figure BDA0002077237950000051
Figure BDA0002077237950000061
Figure BDA0002077237950000071
Figure BDA0002077237950000081
Figure BDA0002077237950000091
本发明提供的优选扩增引物序列如下。针对40个非、东亚、欧洲群体常染色体InDel位点,以及DYS439基因座和Amelogenin性别基因座的42对扩增引物用PRIMERPREMIER 5.0(PREMIER Biosoft,Palo Alto,CA,USA)设计,分别采用FAM、HEX、TAMRA和ROX进行荧光素标记。所有引物均由上海生工生物有限公司合成和标记。所述42对扩增引物及其相对应的位点如下表3所示,PCRU代表上游引物,PCRL代表下游引物。
表3
Figure BDA0002077237950000101
Figure BDA0002077237950000111
Figure BDA0002077237950000121
Figure BDA0002077237950000131
本发明的方案具有以下优点:
1、本发明方法和系统利用InDel位点,结合了SNPs和STRs的有利特征:突变率较低且相当稳定;表现为二等位基因,本质上仍属于长度多态性遗传标记;易于从短片段中获得分型,适于案件中常见降解DNA样本。
2、本申请的方法和系统,采用40个常染色体InDel位点,以及DYS439基因座和Amelogenin性别基因座的组合,构成出能对未知来源个体进行有效的复合扩增的检测体系,尤其是能采用PCR-CE复合扩增体系,在3小时内即可完成样本检测,所需试剂均为国产试剂,无须依赖昂贵的进口试剂,降低检测成本,同时操作简单,与常规STR检验方法相同,易于后续推广试用。这使得本发明的方法和系统能有效在各种涉及非、东亚、欧洲群体来源推断的案件中广泛应用。
3、由实施例数据可以看出,本申请的方法和系统对1000Genomes数据库中挑选的已知来源的1796份参考群体样本,以及自北德克萨斯大学Bruce实验室和李彩霞实验室的1232份测试群体样本(包括来自非洲、欧洲、东亚人群,以及其混合人群的样本)的群体祖先成分分析,以及最高似然比群体分析,除个别个体与样本已知群体来源不一致,绝大部分样本由此两种分析方法获得的结果与样本的已知群体来源一致,说明本发明的方法和系统获得的非、东亚、欧洲群体来源分析结果,可以为非、东亚、欧洲群体来源推断提供准确的数据支持。
附图说明
图1显示了基于40个InDel位点基因型,采用STRUCTURE软件计算祖先成分并通过CLUMPAK可视化而得到1000Genomes数据库中已知来源的18个参考群体(1796份样本)的STRUCTURE群体成分分析结果图。
图2显示了基于40个InDel位点的等位基因频率,采用Rv3.2.3对18个参考群体(1796份样本)进行主成分分析而得到的群体种族归类图。
图3显示了9948DNA标准品使用本发明的复合扩增检测体系(42个位点)的灵敏性检测结果。
图4显示了某待测样本使用本发明的复合扩增检测体系(42个位点)的检测结果。
图5显示了基于40个InDel位点的基因型,采用STRUCTURE软件计算祖先成分并通过CLUMPAK可视化而得到18个参考群体(1796份样本)与11个测试群体(1232份样本)的STRUCTURE群体成分分析结果图。
图6显示了基于40个InDel位点的等位基因频率,采用Rv3.2.3对18个参考群体(1796份样本)与11个测试群体(1232份样本)进行主成分分析而得到的种族归类图。
图7显示了基于40个InDel位点的等位基因频率,采用Rv3.2.3对18个参考群体(1796份样本)和11份未知来源样本进行主成分分析而得到的个体种族归类图。
具体实施方式
18个参考群体:包括来自公共数据库1000Genomes中的18个人群,共1796份样本。
11个测试群体:包括来自本实验室(即李彩霞实验室,来源于国家科技资源共享服务平台计划项目(YCZYPT[2017]01-3、2017JB025和2017JB0)9个人群1068份生物样本,来自北德克萨斯大学Bruce实验室2个人群164份DNA样本,共1232份样本。
11个未知来源样本:来自本实验室(李彩霞实验室)日常采集的来自欧洲、非洲、东亚人群的样本,随机编号为1-11号。
所有样本对象的采集受适用条款监督,采集对象签署知情同意书并告知祖先信息。
实施例1采用本发明的所述方法和系统对18个参考群体的个体进行来源分析。
1、提取待检测个体的DNA作为模板
采用
Figure BDA0002077237950000141
DNA Blood Mini Kit试剂盒(Qiagen公司,德国)提取上述各样本DNA,采用NanoDrop 2000c Spectrophotometer(Thermo公司,美国)进行DNA定量。以去离子灭菌水稀释浓度至1~2ng/μL备用。
2、对提取的DNA模板进行多重PCR扩增反应
2.1、引物池配置
扩增引物池的配置,其中所述扩增引物组为所述42个位点一一对应的42对扩增引物;本实施例中,优选的,所述42个位点的扩增引物组为序列表中SEQ ID No.1至SEQ IDNo.84的核苷酸序列;本发明提供的各种引物序列由上海生工生物工程技术服务有限公司合成。
2.2、多重PCR反应
本实施例使用具有96孔PCR板的AB 9700型DNA扩增仪进行多重PCR反应。
(1)配置PCR mix(42-plex PCR)
试剂名称 配置量(μL) 终浓度
PCR引物池(42-plex) 1 每对引物终浓度见下表
MgCl<sub>2</sub>(25mmol/L Mg<sup>2+</sup>) 0.2 Mg<sup>2+</sup>0.5mM
2.5×NiHi S9PCR Mix(含5mM Mg<sup>2+</sup>) 4
ddH<sub>2</sub>O(去离子水) 3.8
总体积 9(μL)
表4各位点引物加量及在引物池中的终浓度
Figure BDA0002077237950000151
Figure BDA0002077237950000161
按上表中的比例分别配置42重PCR mix,将扩增体系的PCR mix混匀后,取9μL加入到96孔PCR板的反应孔中,再分别在上述反应孔加入1μL浓度为1~2ng/μL待检测的DNA模板(10μL反应体系)。封膜后,3000rcf离心1分钟。
(2)扩增程序
Figure BDA0002077237950000162
2.3、PCR产物分析
取1μL PCR产物与9.5μL甲酰胺、Typer 500内标混匀,95℃3min后立即冰浴5min。毛细管电泳在ABI 3130XL型遗传分析仪,使用Pop7凝胶,36cm毛细管进行电泳分离。通过
Figure BDA0002077237950000163
v3.2软件进行分析判型,得到每个位点的基因型,按照软件说明书,制作适用于本研究的Panel文件、Bin文件及方法文件。
3、将各位点的基因型利用现有软件的分析结果
1)使用STRUCTURE v2.3.4软件计算人群祖先成分比例,使用CLUMPAK对STRUCTURE结果进行可视化。
图1显示了基于40个InDel位点基因型,采用STRUCTURE软件计算祖先成分并通过CLUMPAK可视化而得到1000Genomes数据库中已知来源的18个参考群体(1796份样本)的STRUCTURE群体成分分析结果图。
在条状图中每个个体估计得聚类成分比例以一个彩色条柱表示。K值表示STRUCTURE算法归类的簇数目,结果给出了K从3到4的结果。每一个簇指定一个颜色。彩色条的程度对应估测簇的成分。同一个群体的个体被聚到一起但算法并没有指定每个个体所属的群体。随着K值每增加1,就有一个新的簇被识别。具体的,当K=3时即三人群模式,18个人群被聚类成3个大的群体,拥有3个群体成分的混合人群也被区分出来,即非洲人群(ACB、ESN、MAG、LWK、MSL和YRI,主成分超过0.90)、东亚人群(CDX、CHB、CHS、JPT和KHV,主成分超过0.97)、欧洲人群(CEU、FIN、GBR、IBS和TSI,主成分超过0.97)以及非洲、欧洲、东亚的混合人群(BEB和GIH,以欧洲成分为主)。当K=4时即四人群模式,混合人群即BEB和GIH均独立出来。
2)采用Rv3.2.3进行主成分分析(Principal component analysis,PCA),并用R程序包ggplot2画出种族归类图。
图2显示了基于40个InDel位点的等位基因频率,采用Rv3.2.3对18个参考群体(1796份样本)进行主成分分析而得到的种族归类图。其中各InDel位点等位基因频率例如可以通过各InDel位点的基因型通过在线软件Genepop 4.6计算得出。
18个人群分为较为明显的4个部分,分别为左上非洲(ACB、ESN、MAG、LWK、MSL和YRI)、左下东亚人群(CDX、CHB、CHS、JPT和KHV)、右侧欧洲人群(CEU、FIN、GBR、IBS和TSI)和混合人群(BEB和GIH),其中混合人群在欧洲与东亚之间分布。
3)将所述各特异性位点的基因型使用种族推断软件FI v1.0计算样本的群体匹配概率(Population assignment match probability,AMP)和似然比(Likelihood ratio,LR)
根据AMP值计算得到的匹配概率精确度如表1所示,除ACB中有2个个体(匹配率精确度为97.9%)、KHV中有1个个体(匹配率精确度为98.99%)、FIN中有2个个体(匹配率精确度为97.98%)被划分到混合人群外,其余人群匹配率精确度达100%。
综合祖先成分和LR值得到了18个人群的族群推断结果,如表5所示,东亚、欧洲、非洲人群中除个别样本被判为混合人群外,其余个体均得到正确的推断结果。
表5 1000Genomes中18个群体的族群推断结果
Figure BDA0002077237950000171
注:每格数字代表归到该群体的样本数目,括号中的数字代表其中LR<100的样本数目。
由本实施例方法获得的上述检材的非、东亚、欧洲群体遗传主成分分析结果,除个别个体与样本已知群体来源不一致,绝大部分样本的分析结果与案例样本的已知群体来源一致,说明由本发明方法和系统获得的群体遗传主成分分析结果能为进行非、东亚、欧洲群体来源推断提供数据支持。
实施例2
利用实施例1相同的方法和系统,采用相同的步骤对18个参考群体(1796份样本)与11个测试群体(1232份样本)的3028份样本采用本发明方法和系统进行来源分析。
1)使用STRUCTURE v2.3.4软件计算人群祖先成分比例,使用CLUMPAK对STRUCTURE结果进行可视化
图5显示了基于40个InDel位点基因型,采用STRUCTURE软件计算祖先成分并通过CLUMPAK可视化而得到18个参考群体(1796份样本)与11个测试群体(1232份样本)的STRUCTURE群体成分分析结果图。
当K=3时,上述人群样本主要聚成4类:非洲人群、欧洲人群、欧洲-东亚混合人群、东亚人群。当K=4时,参考群体中的BEB和GIH,以及测试群体中其余4个人群(CUX、CTX、CKX、CZX)因表现出明显的欧亚混合成分(分别为50.6%/45.8%、71.8%/23.8%、36.7%/58.3%、32.1%/63.9%),则被独立出来。
2)采用Rv3.2.3进行主成分分析(Principal component analysis,PCA),并用R程序包ggplot2画出种族归类图。
图6显示了基于40个InDel位点的等位基因频率,采用Rv3.2.3对18个参考群体(1796份样本)与11个测试群体(1232份样本)样本进行主成分分析而得到的种族归类图。主成分1和主成分2合计占92.8%,29个人群的散点形成了4个大的聚类。左下为欧洲人群,右下东亚人群,最上面为非洲人群,混合人群在欧洲-东亚之间分布。
3)将所述各特异性位点的基因型使用种族推断软件FI v1.0计算样本的群体匹配概率(Population assignment match probability,AMP)和似然比(Likelihood ratio,LR)
根据AMP值计算得到的匹配概率精确度见表1,AFA人群有1个样本被归入混合人群,其匹配率精确度达98.89%;CXX有5个样本被归入混合人群,其匹配率精确度达94.05%;CAU、HCB、THC和CHL人群匹配率精确度达100%;HUX人群中大多数样本被归入东亚人群,匹配率精确度达89.48%;CUX、CTX、CKX、CZX混合人群中大多数样本归类到混合人群中,匹配率精确度分别为78.32%、63.74%、87.13%、74%。
综合祖先成分和LR值得到了11个测试群体的族群推断结果,如表6所示,东亚和非洲人群中个别样本被判为混合人群,其余个体、欧洲及混合人群的绝大部分均得到正确的推断结果。
表6 11个测试群体的族群推断结果
Figure BDA0002077237950000181
注:每格数字代表归到该群体的样本数目,括号中的数字代表其中LR<100的样本数目。
由以上数据可以看出,本申请的方法和系统应对1000Genomes数据库中挑选的已知来源的1796份参考群体样本,以及自北德克萨斯大学Bruce实验室和李彩霞实验室的1232份测试群体样本(包括来自非洲、欧洲、东亚人群,以及其混合人群的样本)的群体遗传主成分构成进行分析,以及最高似然比群体分析,除个别个体与样本已知群体来源不一致,绝大部分样本由此两种分析方法获得的结果均与样本的已知群体来源一致,说明由本发明的方法和系统获得的非、东亚、欧洲群体来源分析结果,可以为非、东亚、欧洲群体来源推断提供准确的数据支持。
实施例3本发明所述复合扩增检测体系准确性验证和灵敏度测试
1.准确性验证随机抽取5份样品,经比对DNA一代测序结果与本体系检测结果,其分型完全一致,证明本发明构建的体系对40个InDels位点,以及DYS439基因座和Amelogenin性别基因座共42个位点的基因分型结果准确性可靠。
2.灵敏度测试用本发明复合扩增检测体系对稀释的9948DNA标准品进行检验,以等位基因峰高≥50RFU位标准,结果显示,最佳DNA模板量在0.625~2.5ng之间,浓度低于0.157ng/μL时开始出现等位基因丢失。图3显示了9948DNA标准品使用本发明的复合扩增检测体系的灵敏度检测结果。
3.样本检测结果
采用本发明复合扩增检测体系(42个位点),检测11个测试群体的1232份样本,共获得49251个Indels位点的分型,检出率为99.9%,随机抽取其中的5份样进行样本测序,所有测序分型结果与本研究构建的复合体系检测结果完全一致。图4为某测试样本的分型图,可以看出同种荧光不同位点间的峰高均衡性良好。
可以看出,本发明提供的复合扩增检测体系可以准确,高效,灵敏的获得样本42个位点基因型,为获得的非、东亚、欧洲群体来源分析结果提供良好的数据支持。
4.未知来源样本的检测结果
Figure BDA0002077237950000191
Figure BDA0002077237950000201
Figure BDA0002077237950000211
由表8可以看出,1-11号样本各自的祖先主成分均大于0.96。基于1000Genomes中18个参考群体各位的等位基因频率,通过FI软件计算得到该11份未知样本的群体匹配概率和似然比,与AMP值最高的群体相比,1-11号样本在其余群体中的LR>100,排除了来源于其余群体的可能。
进一步,基于1000Genomes中18个参考群体和该11份未知样本的分型数据进行主成分分析,个体的种族归类图如图7。
综合祖先成分、似然比和个体种族归类图信息,可以推断1-3号、7号样本来源于欧洲人群,4-6号、11号样本来源于非洲人群,8-10号样本来源于东亚人群,所有样本祖先来源推断结果均与前期样本收集的信息一致。
序列表
<110> 公安部物证鉴定中心
<120> 一种对未知来源个体进行非、东亚、欧洲群体来源分析
<130> CNCNP201901267
<160> 84
<170> SIPOSequenceListing 1.0
<210> 1
<211> 18
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 1
aagtaggcaa gttcaaaa 18
<210> 2
<211> 18
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 2
acttggtaca tggtaggt 18
<210> 3
<211> 20
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 3
gtggggaggg cgactataaa 20
<210> 4
<211> 20
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 4
aaaagctcac tgaccctggt 20
<210> 5
<211> 25
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 5
atagcacaag ccagtattta ttcaa 25
<210> 6
<211> 18
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 6
aggtcccttc tgcctcta 18
<210> 7
<211> 21
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 7
actgctttta cttgttggcc t 21
<210> 8
<211> 25
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 8
accatcttct aaagtaggaa aaacg 25
<210> 9
<211> 20
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 9
ggggatcatc tggacctgtg 20
<210> 10
<211> 22
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 10
agattaaagg gaacctcaga gc 22
<210> 11
<211> 22
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 11
tggcaaaatg aagtggaaag gt 22
<210> 12
<211> 25
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 12
ttggcagact aaattattgg catga 25
<210> 13
<211> 21
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 13
acacacttca tggtgagagg g 21
<210> 14
<211> 20
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 14
actgcatctg tgtgtgccta 20
<210> 15
<211> 20
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 15
aggcgctggg tactcttagc 20
<210> 16
<211> 22
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 16
gcatcagtga ccagggttat tg 22
<210> 17
<211> 19
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 17
tgccagcttt cctacagcc 19
<210> 18
<211> 21
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 18
ccacccacaa aattggacat a 21
<210> 19
<211> 25
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 19
aaaccagact tttctgacca taaaa 25
<210> 20
<211> 19
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 20
tgcccatgtt cttcccacc 19
<210> 21
<211> 21
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 21
agggtattcc tttcactcgg c 21
<210> 22
<211> 20
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 22
gtgttgctgt ggctctaggt 20
<210> 23
<211> 18
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 23
ataagaagga gaagcaag 18
<210> 24
<211> 18
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 24
tgatatcgtc aacaatca 18
<210> 25
<211> 20
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 25
aagaaacagg aaagtatggc 20
<210> 26
<211> 20
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 26
tgatgtctag gcttcttcag 20
<210> 27
<211> 26
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 27
ttggacttca gttgactcta agtagc 26
<210> 28
<211> 25
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 28
aattttaact aggatttggg attca 25
<210> 29
<211> 22
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 29
cagggacata gaggatggaa tg 22
<210> 30
<211> 21
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 30
tggctgcctt aaagatgctc t 21
<210> 31
<211> 24
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 31
tgaactgtct tttgttcacc acac 24
<210> 32
<211> 20
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 32
cctcgcacca ttccagtaac 20
<210> 33
<211> 20
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 33
acagcccacc agagcactac 20
<210> 34
<211> 20
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 34
gagtatggcc tcctccacag 20
<210> 35
<211> 27
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 35
aatatgtgct gtagtaacaa ataagcc 27
<210> 36
<211> 21
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 36
ccaaatgact gagcagagcc t 21
<210> 37
<211> 23
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 37
acggtcaact ttgtagctcc aat 23
<210> 38
<211> 23
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 38
tcaagaggga aagacatctt cct 23
<210> 39
<211> 24
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 39
aaataatgta tcgctccaaa ctca 24
<210> 40
<211> 22
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 40
agaagattcc cctgacgaga ct 22
<210> 41
<211> 27
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 41
atcattcata atcctatcaa agaagca 27
<210> 42
<211> 22
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 42
acacacaccg agagagaatt ct 22
<210> 43
<211> 25
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 43
tctgttgtat aaatgtgtat ctagg 25
<210> 44
<211> 18
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 44
ttgtaacatc tgtgaggt 18
<210> 45
<211> 18
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 45
acaatgtctt gattactg 18
<210> 46
<211> 18
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 46
agaacaaagt aggagacc 18
<210> 47
<211> 21
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 47
agtgtgtcag aaaggaagcc a 21
<210> 48
<211> 23
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 48
accactctgt tatctgcaac tct 23
<210> 49
<211> 21
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 49
aacctcattg ctgtagtccc c 21
<210> 50
<211> 22
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 50
ttctgtactt tgccccatct tg 22
<210> 51
<211> 25
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 51
tgcagtagtt tacgatcaaa atggt 25
<210> 52
<211> 21
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 52
tgttctcctc catccttctg c 21
<210> 53
<211> 26
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 53
atatcattct taaaggaaga ggcttt 26
<210> 54
<211> 26
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 54
aagctaagtg tacaggatca aatttc 26
<210> 55
<211> 23
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 55
aatctttgtg taagctctgc aat 23
<210> 56
<211> 21
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 56
tgcaggaata ccaagccaga a 21
<210> 57
<211> 27
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 57
ttctgaatca taagacagct caataga 27
<210> 58
<211> 25
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 58
cttcatttac actttgattg attcg 25
<210> 59
<211> 24
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 59
aagtctattc tctttcttag ccga 24
<210> 60
<211> 24
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 60
agtgaccttt ggagaaaatc caga 24
<210> 61
<211> 20
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 61
ttccaatcca tgagcaaggg 20
<210> 62
<211> 23
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 62
atcaatctga aaacgaaagc aat 23
<210> 63
<211> 25
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 63
ttgccttcaa gaaatttatg gtgac 25
<210> 64
<211> 20
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 64
ggcctagctc aaatgccatc 20
<210> 65
<211> 18
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 65
atgtttgttg gtgggagg 18
<210> 66
<211> 18
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 66
gagaccgaag aacgaggg 18
<210> 67
<211> 21
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 67
gtaagatttg atgcgctgtc c 21
<210> 68
<211> 21
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 68
acagaagctg attttggttg g 21
<210> 69
<211> 21
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 69
ccaggaggat gtgctttatg c 21
<210> 70
<211> 22
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 70
ttcagaagtt gccattctcc ac 22
<210> 71
<211> 26
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 71
aagaatgaaa tgagtttcac tgaaga 26
<210> 72
<211> 30
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 72
gatagataaa atatccctga tacatgttaa 30
<210> 73
<211> 25
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 73
ccatttaccg tacaatcagt gtaga 25
<210> 74
<211> 24
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 74
agaaaaggaa gtgtagctgg attt 24
<210> 75
<211> 25
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 75
cactatcata acagagttga ccagt 25
<210> 76
<211> 20
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 76
tgtgtggtag tgacctgagc 20
<210> 77
<211> 22
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 77
atatccgagg catcatttct tg 22
<210> 78
<211> 26
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 78
ttcagcatct aaacaattaa aactga 26
<210> 79
<211> 21
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 79
ttgtcccttt cctgtctccc t 21
<210> 80
<211> 22
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 80
ttaggccact gtaaatggct gc 22
<210> 81
<211> 25
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 81
acataggtgg agacagatag atgat 25
<210> 82
<211> 20
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 82
gcctggcttg gaattctttt 20
<210> 83
<211> 19
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 83
ccctgggctc tgtaaagaa 19
<210> 84
<211> 24
<212> DNA
<213> 人工序列 (Artificial Sequence)
<400> 84
atcagagctt aaactgggaa gctg 24

Claims (7)

1.一种对未知来源个体进行非、东亚、欧洲群体来源分析的方法,其特征在于,该方法包括:
1)提取未知来源个体的DNA;
2)获得所述DNA的42个位点的基因型,所述42个位点包括40个非、东亚、欧洲群体常染色体InDel位点以及DYS439基因座和Amelogenin性别基因座,所述40个非、东亚、欧洲群体常染色体InDel位点为:rs3054057、rs112634351、rs1160852、rs145415095、rs2308036、rs10656283、rs35851958、rs2308101、rs16416、rs10612372、rs1610878、rs140847、rs143825911、rs72173922、rs5900168、rs34921138、rs111759013、rs5877023、rs35633537、rs548753180、rs17879936、rs3045215、rs34122827、rs16715、rs5789229、rs74748892、rs1160953、rs66850318、rs68050185、rs112109748、rs71425754、rs2307832、rs2308067、rs16711、rs3071043、rs3991155、rs3083306、rs2307805、rs67625332和rs1610963,所述常染色体InDel位点为常染色体插入/缺失多态性位点;采用与所述42个位点一一对应的42对扩增引物对其进行扩增以获得扩增产物;所述扩增引物为序列表中SEQ ID No.1至SEQ IDNo.84的核苷酸序列;
3)根据各位点的基因型对未知来源个体进行非、东亚、欧洲群体来源分析;对未知来源个体的非、东亚、欧洲群体进行来源分析,包括:将所述各位点的基因型使用种族推断软件FI v1.0计算样本的群体匹配概率AMP和似然比LR;使用STRUCTURE v2.3.4软件计算人群祖先成分比例,使用CLUMPAK对STRUCTURE结果进行可视化;综合分析AMP值和祖先成分进行最终判断,当LR>100时,AMP值排第一位的人群为待测个体的来源人群,当LR≤100时,AMP的前两位人群均不排除;或采用Rv3.2.3进行主成分分析,并用R程序包ggplot2画出种族归类图。
2.根据权利要求1所述的方法,其特征在于,其中2)还包括在获得扩增产物后,使用遗传分析仪分析该扩增产物,以获得所述42个位点的基因型的步骤。
3.一种对未知来源个体进行非、东亚、欧洲群体来源分析的系统,其特征在于,所述系统包括DNA提取体系,复合扩增检测体系;
所述DNA提取体系用于提取未知来源个体的DNA;
所述复合扩增检测体系用于获得所述DNA的42个位点的基因型,所述42个位点包括40个非、东亚、欧洲群体常染色体InDel位点以及DYS439基因座和Amelogenin性别基因座,所述40个非、东亚、欧洲群体常染色体InDel位点为:rs3054057、rs112634351、rs1160852、rs145415095、rs2308036、rs10656283、rs35851958、rs2308101、rs16416、rs10612372、rs1610878、rs140847、rs143825911、rs72173922、rs5900168、rs34921138、rs111759013、rs5877023、rs35633537、rs548753180、rs17879936、rs3045215、rs34122827、rs16715、rs5789229、rs74748892、rs1160953、rs66850318、rs68050185、rs112109748、rs71425754、rs2307832、rs2308067、rs16711、rs3071043、rs3991155、rs3083306、rs2307805、rs67625332和rs1610963;所述扩增引物由与所述42个位点一一对应的42对扩增引物组成;所述扩增引物为序列表中SEQ ID No.1至SEQ ID No.84的核苷酸序列。
4.根据权利要求3所述的系统,其特征在于,所述复合扩增检测体系用于采用与所述42个位点一一对应的42对扩增引物对其进行扩增以获得扩增产物,并由获得的扩增产物得到所述未知来源个体的DNA的42个位点的基因型。
5.根据权利要求4所述的系统,其特征在于,所述扩增引物为序列表中SEQ ID No.1至SEQ ID No.84的核苷酸序列。
6.一种复合扩增检测体系,其特征在于,所述复合扩增检测体系用于利用扩增引物扩增未知来源个体的DNA的42个位点获得扩增产物,并由获得的扩增产物得到未知来源个体的DNA的42个位点的基因型,所述42个位点包括40个非、东亚、欧洲群体常染色体InDel位点以及DYS439基因座和Amelogenin性别基因座;
所述40个非、东亚、欧洲群体常染色体InDel位点为:rs3054057、rs112634351、rs1160852、rs145415095、rs2308036、rs10656283、rs35851958、rs2308101、rs16416、rs10612372、rs1610878、rs140847、rs143825911、rs72173922、rs5900168、rs34921138、rs111759013、rs5877023、rs35633537、rs548753180、rs17879936、rs3045215、rs34122827、rs16715、rs5789229、rs74748892、rs1160953、rs66850318、rs68050185、rs1 12109748、rs71425754、rs2307832、rs2308067、rs16711、rs3071043、rs3991155、rs3083306、rs2307805、rs67625332和rs1610963;
所述扩增引物由与所述42个位点一一对应的42对扩增引物组成,所述扩增引物为序列表中SEQ ID No.1至SEQ ID No.84的核苷酸序列。
7.一种检测试剂盒,其特征在于,包括权利要求6所述的复合扩增检测体系。
CN201910458160.3A 2019-05-29 2019-05-29 一种对未知来源个体进行非、东亚、欧洲群体来源分析的方法和系统 Active CN112011622B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910458160.3A CN112011622B (zh) 2019-05-29 2019-05-29 一种对未知来源个体进行非、东亚、欧洲群体来源分析的方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910458160.3A CN112011622B (zh) 2019-05-29 2019-05-29 一种对未知来源个体进行非、东亚、欧洲群体来源分析的方法和系统

Publications (2)

Publication Number Publication Date
CN112011622A CN112011622A (zh) 2020-12-01
CN112011622B true CN112011622B (zh) 2022-12-02

Family

ID=73501045

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910458160.3A Active CN112011622B (zh) 2019-05-29 2019-05-29 一种对未知来源个体进行非、东亚、欧洲群体来源分析的方法和系统

Country Status (1)

Country Link
CN (1) CN112011622B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113322329B (zh) * 2021-05-14 2023-03-14 公安部物证鉴定中心 一种用于全集成微流控芯片的dip快速扩增检测试剂及其应用

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2914316A1 (fr) * 2006-11-15 2008-10-03 Igna Inst Genetique Nantes Atl Methodes et outils pour determiner l'origine d'un sujet.
EP2640848A1 (en) * 2010-11-15 2013-09-25 Life Technologies Corporation Methods and kits for multiplex amplification of short tandem repeat loci
CN104212886B (zh) * 2014-07-25 2016-06-22 公安部物证鉴定中心 一种对未知来源个体进行非、欧、东亚群体遗传主成分析的方法和系统
CN105861654A (zh) * 2016-04-05 2016-08-17 公安部物证鉴定中心 一种对未知来源个体进行十个群体来源分析的方法和系统
CN106480198B (zh) * 2016-11-01 2019-09-17 公安部物证鉴定中心 一种对未知检材进行个体识别的方法和系统
CN108060240B (zh) * 2018-02-12 2019-06-04 江苏苏博生物医学股份有限公司 一种用于插入缺失多态性检测的荧光标记复合扩增试剂盒及其应用

Also Published As

Publication number Publication date
CN112011622A (zh) 2020-12-01

Similar Documents

Publication Publication Date Title
CN108504749B (zh) 29个微单倍型位点、筛选方法、复合扩增体系及应用
CN103221551B (zh) Hla基因型别-snp连锁数据库、其构建方法、以及hla分型方法
EP2917368A1 (en) Methods and systems for identifying contamination in samples
CN108411008B (zh) 72个snp位点及相关引物在鉴定或辅助鉴定人类族群中的应用
CN110628891B (zh) 一种对胚胎进行基因异常筛查的方法
CN107419017B (zh) 对未知来源个体进行五大洲际族群来源推断的方法和系统
CN106755340B (zh) 一种利用26个y-str基因座对男性个体进行y-str分型的方法和系统
CN107541554B (zh) 用于人体个体识别和/或亲权鉴定的遗传标记及其检测方法和试剂盒
CN102250883B (zh) 一种荧光标记的x-str基因座复合pcr方法及其应用
Lan et al. MtDNA polymorphism analyses in the Chinese Mongolian group: Efficiency evaluation and further matrilineal genetic structure exploration
CN106434859A (zh) 先天性肾上腺皮质增生症基因筛查试剂盒、筛查方法及其应用
CN108624700A (zh) 基于二代测序技术同步检测124个微单倍型基因座的试剂盒及其专用引物对组合
CN106939334B (zh) 一种孕妇血浆中胎儿dna含量的检测方法
CN104818323B (zh) 人类13、18和21号染色体20个str基因座的基因分型检测试剂盒
CN112011622B (zh) 一种对未知来源个体进行非、东亚、欧洲群体来源分析的方法和系统
CN106520980B (zh) 一种对男性个体进行y-str分型的方法和系统
CN112342303A (zh) 一种基于ngs的人类y染色体str和snp遗传标记联合检测体系及检测方法
CN105586392B (zh) 评估胎儿样本中母体细胞污染程度的方法
CN108753934B (zh) 一种检测基因突变的方法、试剂盒及其制备方法
CN109762909A (zh) 一种用于降解检材法医学个体鉴识的44个InDels位点复合扩增检测试剂盒
CN111172248B (zh) 一种基于片段分析技术验证拷贝数变异的通用试剂盒
CN108517364A (zh) 基于56个y染色体snp遗传标记的法医学复合检测试剂盒
CN114657269A (zh) 一组高效能常染色体微单倍型遗传标记以及用于检测该组遗传标记的引物组
CN108060233B (zh) 30个y染色体str基因座的荧光复合扩增体系、试剂盒及应用
CN109852702B (zh) 一种snp-snp标记的复合体系及其检测不平衡混合样本的方法和应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant