CN118028493B - 包含73个多态性dip位点的复合扩增检测体系及其应用 - Google Patents

包含73个多态性dip位点的复合扩增检测体系及其应用 Download PDF

Info

Publication number
CN118028493B
CN118028493B CN202410436345.5A CN202410436345A CN118028493B CN 118028493 B CN118028493 B CN 118028493B CN 202410436345 A CN202410436345 A CN 202410436345A CN 118028493 B CN118028493 B CN 118028493B
Authority
CN
China
Prior art keywords
seq
primer pair
pair targeting
final concentration
targeting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202410436345.5A
Other languages
English (en)
Other versions
CN118028493A (zh
Inventor
朱波峰
雷梵章
张蕴盈
郑阳阳
杜蔚安
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Homy Genetech Inc
Southern Medical University
Original Assignee
Guangdong Homy Genetech Inc
Southern Medical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Homy Genetech Inc, Southern Medical University filed Critical Guangdong Homy Genetech Inc
Priority to CN202410436345.5A priority Critical patent/CN118028493B/zh
Publication of CN118028493A publication Critical patent/CN118028493A/zh
Application granted granted Critical
Publication of CN118028493B publication Critical patent/CN118028493B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6858Allele-specific amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及核酸检测技术领域,特别涉及包含73个多态性DIP位点的复合扩增检测体系及其应用。所述复合扩增检测体系包括引物组合和复合扩增预混物,所述引物组合分别靶向73个DIP位点。所述复合扩增检测体系通过一次反应能够同时对73个DIP位点进行检测,且适用于多种组织类型的检材,为包括非洲、欧洲、东亚、南亚和除混血美洲裔外的南美裔人群在内的主要五大洲际人群及包括东南亚民族、汉族、日本人等东亚内部人群提供一种高分辨率的生物地理祖先溯源的检测新方案。

Description

包含73个多态性DIP位点的复合扩增检测体系及其应用
技术领域
本发明涉及核酸检测技术领域,特别涉及包含73个多态性DIP位点的复合扩增检测体系及其应用。
背景技术
在法医学实践中,除常规生物检材外,各类陈旧、降解等疑难生物检材也屡见不鲜,这类检材的检测分析难度大,若使用短串联重复序列进行常规法医DNA分析容易出现DNA分型失败的情况,为检验鉴定工作带来困难和挑战。此外,同一反应体系所能容纳的短串联重复序列位点数量有限,导致体系的累积鉴别效能较低,需要补充额外位点以提供更多关于案件中未知个体的身份信息。
缺失/插入多态性(Deletion/Insertion Polymorphism, DIP)遗传标记是基因变异的一种替代形式,是由于DNA片段的插入或缺失形成的DNA多态性,其在人类基因组中分布广泛,突变率低(约为10-8),具有种族和群体遗传多态性,且扩增片段短,无stutter峰等人工伪峰,等位基因分型更为简便,在陈旧、降解等疑难生物检材分析中更具优势,因此具有良好的法医学应用前景,也是常用的祖先信息遗传标记之一。DIP遗传标记的检测适用于二代测序平台或毛细管电泳平台。前者的主要优势是通量高,且可以对不同类型的遗传标记进行检测,但二代测序平台对实验人员的技术要求较高,数据处理过程相对复杂,加上难以避免的测序错误、引物结合区突变等因素容易造成结果误判,因此二代测序并未常规应用于法医实际案件检验中。传统的PCR-CE检测方法准确度高、成本低、耗时短、操作简便,是适用于法医生物地理祖先溯源的可靠、经济、高效的检测平台。继2014年六色荧光检测方案问世之后,能同时进行毛细管分离的位点数量得到极大提高,对应的系统效能也随之提升,使得多区域多层次的群体鉴识成为可能,有助于生物地理祖先溯源DIP体系在基层法医DNA实验室的推广应用。
近五年来,一系列基于祖先信息DIP标记的多重复合扩增体系得到研发及验证,如基于30个DIP位点的Investigator®DIPplex体系、包含60个DIP位点的AGCU InDel 60 kit体系以及Zhu等人自主研发的39重二等位DIP和41重multi-InDel复合扩增体系。上述体系基本实现了三大祖先来源成分(非洲、欧洲和东亚)的准确区分,但对于欧洲、南亚和南美个体之间的区分效能仍有待提高。为进一步提高AI-DIP复合扩增体系在亚洲群体中的生物地理溯源效能,Sun等人则利用15个multi-InDel位点初步实现了东亚群体、东南亚群体以及东北亚俄罗斯阿迪格人的三分类。Zhang等人则使用21个高效能的AI-DIP位点实现了10个亚洲群体的三分类,交叉验证结果显示平均正确率为81.70%。尽管上述研究初步探索了对泛亚洲区域群体的溯源策略,但所选位点的数量及生物地理溯源效能仍存在不足,因而在针对东亚内部群体的法医学实践中无法提供更多有利的生物地理来源信息。尽管东亚群体在漫长的历史进程中不断迁徙、交流,形成了多民族、多文化、多语系的状态,但既往系统发育学及群体遗传学的分子生物结果均显示,东亚内部群体之间仍存在较高的遗传结构同质性。因此,构建包含更多高效能AI-DIP位点的东亚内部群体生物地理祖先溯源体系是祖源推断的重难点之一,这对复合扩增体系的开发技术、遗传标记的遴选方法及证据解析能力提出了更高的要求。六色荧光标记技术的发展使得复合扩增体系可容纳更多数量或类型的基因座,使体系能够提供更多样的遗传信息以及更高的法医鉴定效能。但随着复合扩增体系中基因座数目的增加,由于竞争的影响,各基因座的相对平衡控制难度加大,对扩增条件的适用性要求变高。因此,需通过多次反复验证扩增参数,不断调整引物浓度与配比,提高位点扩增均衡性。此外,机器学习算法在遗传标记遴选及证据力度解析方面有其独特优势,其对高维、稀疏数据的适用性有助于从海量的全基因组数据中挖掘出具有祖先信息推断潜能的位点,但目前适用于祖先信息DIP体系的机器学习方法论及其生物地理祖先溯源效能尚未得到开发和验证。
发明内容
本发明目的在于公开了一种包含73个多态性DIP位点的复合扩增检测体系及其应用,以解决现有技术中所存在的一个或多个技术问题,提供至少一种有益的选择或创造条件。
本发明第一方面在于提供一种复合扩增检测体系。
本发明第二方面在于提供一种含有本发明第一方面所述复合扩增检测体系的试剂盒。
本发明第三方面在于提供本发明第一方面所述复合扩增检测体系或本发明第二方面所述试剂盒在非疾病检测为目的的动物病原体检测中的应用。
本发明第一方面所述复合扩增检测体系包括引物组合和复合扩增预混物,所述引物组合分别靶向73个DIP位点,所述DIP位点分别为:rs73611618、rs28741387、rs141511864、rs71377077、rs10660476、rs879841278、rs55681325、rs140698686、rs200216987、rs71879919、rs10531408、rs59369367、rs56120126、rs71097946、rs77514652、rs561904853、rs5780349、rs2067285、rs5789056、rs5789729、rs141160384、rs139988800、rs141928144、rs56968651、rs59127488、rs1347535145、rs551883542、rs3994057、rs1342356747、rs3044086、rs35450593、rs72104851、rs59005026、rs71712626、rs138600078、rs879662430、rs10564190、rs140202531、rs10573591、rs10630253、rs77624782、rs141471313、rs10600917、rs71408252、rs1404627509、rs74816196、rs112473811、rs57051438、rs766586871、rs10628367、rs58227077、rs143267128、rs140671911、rs138465422、rs200935491、rs141613931、rs66462883、rs71110898、rs35991174、rs35880452、rs59377169、rs778835021、rs79710335、rs59605350、rs112524265、rs5886296、rs59218555、rs67579111、rs71004215、rs56358449、rs140200174、rs56783915和rs141047228。所述复合扩增检测体系基于国际千人基因组计划III期(1000 Genome Project phase III, 1KGP),扩展数据集中2598名个体的全基因组数据,根据一系列位点评估标准,优选出2.7万个针对主要洲际群体和东亚内部人群的具有生物地理祖先溯源潜力的二等位DIP位点,随后结合不同的降维可视化方法及机器学习特征选择算法甄选出157个候选DIP位点,通过位点引物设计、特征重要性等性能评估,进一步筛选出73个高分辨率、检测效果较好的常染色体DIP位点作为复合体系的候选开发位点集。并根据所得的73个DIP位点设计同管复合扩增体系,通过一次反应能够同时对73个DIP位点进行检测。具体技术路线如图1所示。
为实现同管复合扩增,在本发明第一方面的一些应用实施方式中还提供了相应的引物组合,所述引物组合中含有73对分别靶向上述73个DIP位点的引物对,具体各引物的核苷酸序列如表1所示。
在本发明第一方面的一些应用实施方式中,为提高所述复合扩增检测体系的准确率,可以进一步限定所述引物组合中每一对引物对的终浓度,具体如表1所示。
在本发明第一方面的一些应用实施方式中,各所述引物对中至少有一条引物的5’端标记有荧光染料,所述荧光染料选自FAM、HEX、SUM、LYN、PUR、A514、TAMRA、ROX、VIC、A555、PET、NED、TAZ、A488、SF488或A568。通过不同的荧光染料,将长度相似的扩增产物数量转化为荧光信号输出,从而实现多个DIP位点的同管复合扩增检测。
在本发明第一方面的一些应用实施方式中,将扩增产物长度差异较大的引物对归入同一群组,扩增产物长度差异较大的引物对归入不同群组,每一群组选用一种荧光染料,各群组选用荧光染料互不相同。通过不同群组的分配可以大幅度减少荧光染料的使用种类,降低检测分析难度。
在本发明第一方面的一些应用实施方式中,所述第一群组选用的所述荧光染料为FAM,所述第二群组选用的所述荧光染料为HEX,所述第三群组选用的所述荧光染料为SUM,所述第四群组选用的所述荧光染料为LYN,所述第五群组选用的所述荧光染料为PUR,具体如表1所示。
表1、73个DIP位点的引物序列及引物终浓度
在本发明第一方面的一些应用实施方式中,所述复合扩增预混物(Master Mix)的组分包括:dNTPs、Taq酶、Tris-HCl缓冲液、KCl、MgCl2及牛血清白蛋白(BSA)。
人源生物样本,可以是从人类体液/组织(如血痕、血液、唾液、口腔拭子、带毛囊的发根、精液、肌肉组织、脱落细胞等)中提取的基因组DNA,可通过Chelex-100法、酚氯仿法、磁珠法等方法进行DNA提取及定量;也可以直接对多种检材(如血滤纸、血纱布、FTA卡、唾液卡、脱落细胞等)进行免提取直接扩增。
本发明第二方面所述试剂盒包含有本发明第一方面所述复合扩增检测体系。
在本发明第二方面的一些应用实施方式中,应用分子克隆技术制备用于分析的等位基因分型标准物(Allelic Ladder),即阳性质控品。所述阳性质控品由各个位点分别扩增对应等位基因片段的产物混合组成。
在本发明第二方面的一些应用实施方式中,使用无核酸酶水(Nuclease-FreeWater)作为阴性质控品。
在本发明第二方面的一些应用实施方式中,扩增产物在毛细管电泳遗传分析仪上进行荧光检测,将PCR扩增产物(1 μL)、去离子甲酰胺(9.5 μL)及SIZE-500分子量内标(0.5μL)混合,经95℃变性3分钟,冰上孵育3分钟后即可在遗传分析仪(包括但不限于3100系列、3130系列、3500系列遗传分析仪)上进行毛细管电泳检测,随后对73个DIP位点的分型结果进行判读。
基于更多DIP遗传标记联合六色荧光标记技术和机器学习算法成功开发生物地理祖先精准溯源体系具有重要的现实意义。本发明旨在全基因组范围内结合机器学习算法深度挖掘并系统甄选与不同洲际、地理区域强相关的DIP分子遗传标记,利用毛细管电泳平台构建一个包含更多高效能位点的DIP复合检测体系,为洲际及东亚群体生物地理祖先的精准鉴识提供新的检测方案及证据解析流程。
本发明的优点在于:
本发明提供了一个同时适用于主要洲际群体和东亚内部群体的高祖先信息量DIP位点复合扩增检测体系,一次反应能够同时对73个DIP位点进行检测,且适用于多种组织类型的检材。所述复合扩增检测体系及相应的试剂盒可同时实现包括非洲、欧洲、东亚、南亚和除混血美洲裔外的南美裔人群在内的主要五大洲际人群及东亚内部人群的生物地理祖先精准溯源,并将东亚内部人群进一步细分为汉族、东南亚及日本人群,弥补了以往体系生物地理祖先溯源范围过大的不足,且有效提高东亚内部人群的祖源分辨率,提高了体系在我国法医实践中的适用性及可行性。
附图说明
图1是实施例1所述73个位点复合扩增体系开发技术路线图;
图2是实施例1所述的复合扩增检测体系的73个DIP位点扩增产物排布图;
图3是实施例2所述的Allelic Ladder电泳图谱;
图4是实施例3所述的人源DNA测试样本电泳图谱;
图5是实施例4中五洲际参考群体的t-SNE降维可视化结果;
图6是实施例4中五洲际参考群体的系统发育重建结果;
图7是实施例4中五洲际参考群体的祖先成分分析结果;
图8是实施例4中东亚参考群体的祖先成分分析结果;
图9是实施例4所述的体系生物地理祖先溯源模型的十折交叉验证结果,(A)为基于五洲际参考群体构建的一系列生物地理祖先溯源模型的标准化十折交叉验证混淆矩阵,(B)为基于东亚参考群体构建的生物地理祖先溯源模型的标准化十折交叉验证混淆矩阵。
具体实施方式
以下实施例进一步说明本发明的内容,但不应理解为对本发明的限制。在不背离本发明精神和实质的情况下,对本发明方法、步骤或条件所作的修改和替换,均属于本发明的范围。
若未特别指明,实施例中所用的技术手段为本领域技术人员所熟知的常规手段。
以下实施例中未作具体说明的分子生物学试验方法,均参照《分子克隆实验指南》(第三版)或者按照试剂盒和产品说明书进行;所述试剂盒生物材料,如无特殊说明,均可从商业途径获得。
实施例1:复合扩增体系的DIP位点筛选及引物设计
(1)73个多态性DIP位点的筛选
基于1KGP扩展数据集中2598名个体的全基因组数据,开展系统全面的生物地理祖先溯源标志物筛选。按照图1所示具体技术路线,基于上述筛选标准,采用数据预处理、降维可视化(t-SNE)、基于树模型的特征重要性评估以及交叉验证方法确定了最终用于体系构建的候选位点集,依次为rs73611618、rs28741387、rs141511864、rs71377077、rs10660476、rs879841278、rs55681325、rs140698686、rs200216987、rs71879919、rs10531408、rs59369367、rs56120126、rs71097946、rs77514652、rs561904853、rs5780349、rs2067285、rs5789056、rs5789729、rs141160384、rs139988800、rs141928144、rs56968651、rs59127488、rs1347535145、rs551883542、rs3994057、rs1342356747、rs3044086、rs35450593、rs72104851、rs59005026、rs71712626、rs138600078、rs879662430、rs10564190、rs140202531、rs10573591、rs10630253、rs77624782、rs141471313、rs10600917、rs71408252、rs1404627509、rs74816196、rs112473811、rs57051438、rs766586871、rs10628367、rs58227077、rs143267128、rs140671911、rs138465422、rs200935491、rs141613931、rs66462883、rs71110898、rs35991174、rs35880452、rs59377169、rs778835021、rs79710335、rs59605350、rs112524265、rs5886296、rs59218555、rs67579111、rs71004215、rs56358449、rs140200174、rs56783915和rs141047228。
针对选定的DIP位点设计引物组合。由于每个多态性位点的扩增产物片段大小和引物的扩增效率差别较大,需要根据单位点的扩增检测结果,采用复合扩增体系对所有位点的引物对进行反复验证、筛选,并对多种样本进行检测分析,通过一系列实验优化调整各位点的引物浓度,逐步提高引物组合的扩增均衡性,最终获得复合检测体系中各引物对的最优浓度。最终的引物组合如表1所示,相应的DIP位点扩增产物排布图如图2所示。
实施例2:复合扩增检测体系的构建
在成功建立单个位点扩增体系的基础上,向扩增体系中逐步加入新的位点引物进行测试,通过反复实验确定复合扩增体系中的各个参数,包括循环参数、退火温度、终延伸时间、酶量、复合扩增反应体系体积以及模板DNA量等,以实现复合体系稳定且均衡的分型检测结果,本体系最终确定的最优扩增反应总体积为10 μL,具体的复合扩增检测体系如表2所示。
表2、复合扩增检测体系的反应组分和加样体积
其中Master Mix包含有:dNTPs、Taq酶、Tris-HCl缓冲液、KCl、MgCl2及BSA;待测的人源生物样本,可以是从人类体液/组织(如血痕、血液、唾液、口腔拭子、带毛囊的发根、精液、肌肉组织、脱落细胞等)中提取的基因组DNA,可通过Chelex-100法、酚氯仿法、磁珠法等方法进行DNA提取及定量;也可以直接对多种检材(如血滤纸、血纱布、FTA卡、唾液卡、脱落细胞等)进行免提取直接扩增。具体的复合扩增程序如表3所示。
表3、复合扩增程序
扩增产物在毛细管电泳遗传分析仪上进行荧光检测,将PCR扩增产物(1 μL)、去离子甲酰胺(9.5 μL)及SIZE-500分子量内标(0.5 μL)混合,经95℃变性3分钟,冰上孵育3分钟后即可在遗传分析仪(包括但不限于3100系列、3130系列、3500系列遗传分析仪)上进行毛细管电泳检测。毛细管电泳结束后,使用GeneMapper®ID-X软件分析处理数据。首先按照软件格式要求编写相应的Bin文件和Panel文件,将DIP标记中的插入(Insertion)等位基因命名为I,缺失(Deletion)等位基因命名为D,创建本体系的电泳分析方法,随后导入毛细管电泳数据,选择相应的Panel、Bin、Analysis Method和Size Standard等分析参数,对73个复合扩增DIP位点的电泳结果进行判读。
本发明还应用分子克隆技术制备用于分析的等位基因分型标准物(AllelicLadder),等位基因分型标准物由各个位点引物分别扩增对应等位基因片段的产物混合组成,图3为本体系的Allelic Ladder电泳图谱。
实施例3:复合扩增检测体系的临床应用
根据实施例2提供的复合扩增检测体系,临床应用于实际人源DNA样本的检测。使用1 ng经Chelex-100法提取的人源血卡DNA样本进行检测,具体检测步骤如实施例2所示,检测结果的分型图谱如图4所示。所述复合扩增检测体系的各位点均能正常出峰,且位点间峰高均衡性良好,表明上述体系可以实现DNA样本的有效检测。
实施例4:73个DIP位点的生物地理祖先溯源效能评估
利用1KGP扩展数据集中的五洲际人群数据评估所选DIP遗传标记的祖先信息推断效能,基于非线性降维算法(t-SNE)、系统发育重建、Structure等群体遗传学方法,对73个DIP遗传标记的生物地理祖先溯源效能进行评估。
t-SNE降维可视化结果如图5显示,本体系选取的73个DIP位点基本能区分五洲际群体,并且在东亚群体内部可以看到日本、汉族、东南亚民族的初步聚簇。基于最大似然比法的系统发育重建结果如图6所示,也清楚显示五洲际群体的进化分支,且在东亚群体内部可以看到三个小分支。基于Structure方法的祖先成分分析显示,本体系能够在五洲际群体层面显示出不同洲际群体之间的遗传结构差异,最佳K值为4(见图7),东亚群体内部的遗传结构差异同样可以被辨识,最佳K值为2(见图8)。
基于本发明所述的73个位点体系和1KGP扩展数据集,使用多项式朴素贝叶斯、支持向量机、随机森林、极端梯度增强(XGBoost)等算法构建了一系列生物地理溯源模型。上述模型的十折交叉验证混淆矩阵结果显示,本发明所述的73个DIP体系在五大洲际人群中分类平均正确率超过98%[见图9中(A)],在东亚内部人群中分类平均正确率超过90%[见图9中(B)]。表4为不同生物地理溯源范围分类任务下,各机器学习模型在测试集中的十折交叉验证结果。如表4所示,73个DIP位点在五大洲际(非洲、欧洲、东亚、南亚、美洲)和东亚内部人群(汉族、日本及东南亚人群)中有着较高的分类效能及泛化能力。
上述群体遗传学分析结果表明,本体系包含的73个DIP位点对于五洲际群体来源的个体有良好的分辨能力,且能对东亚内部群体的始祖来源进一步细分。
表4、73个DIP位点的生物地理祖先溯源测试集十折交叉验证结果
实施例5:本发明所述复合体系的应用验证
利用实施例1所述的复合体系按照实施例2的方法及程序对2名已知生物地理祖先来源的不同个体进行基因分型检测,使用标准品9948 DNA样本作为阳性对照,并通过朴素贝叶斯方法对这些个体的生物地理祖先来源进行推测,评估体系对于真实样本的生物地理祖先溯源效能。
2名已知来源的不同个体的分型结果如表5所示。
表5、2名已知来源的不同个体的分型检测结果
2份样本在73个DIP位点中的群体匹配概率及似然比结果如表6所示。
表6、2份样本在73个DIP位点中的群体匹配概率及似然比结果
上述结果表明2份真实样本均能在所有位点中完整检测出基因分型,并且均被正确推测为真实的生物地理祖先来源,表明本发明所述复合体系对于真实样本有良好的检测能力和生物地理祖先溯源能力,可以应用本发明所述的系统和方法进行有效的个体地理祖先来源推断。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。

Claims (9)

1.一种复合扩增检测体系,其特征在于,包括引物组合和复合扩增预混物,所述引物组合包括:靶向rs73611618的引物对如SEQ ID No:1和SEQ ID No:2所示;靶向rs28741387的引物对如SEQ ID No:3和SEQ ID No:4所示;靶向rs141511864的引物对如SEQ ID No:5和SEQ ID No:6所示;靶向rs71377077的引物对如SEQ ID No:7和SEQ ID No:8所示;靶向rs10660476的引物对如SEQ ID No:9和SEQ ID No:10所示;靶向rs879841278的引物对如SEQ ID No:11和SEQ ID No:12所示;靶向rs55681325的引物对如SEQ ID No:13和SEQ IDNo:14所示;靶向rs140698686的引物对如SEQ ID No:15和SEQ ID No:16所示;靶向rs200216987的引物对如SEQ ID No:17和SEQ ID No:18所示;靶向rs71879919的引物对如SEQ ID No:19和SEQ ID No:20所示;靶向rs10531408的引物对如SEQ ID No:21和SEQ IDNo:22所示;靶向rs59369367的引物对如SEQ ID No:23和SEQ ID No:24所示;靶向rs56120126的引物对如SEQ ID No:25和SEQ ID No:26所示;靶向rs71097946的引物对如SEQ ID No:27和SEQ ID No:28所示;靶向rs77514652的引物对如SEQ ID No:29和SEQ IDNo:30所示;靶向rs561904853的引物对如SEQ ID No:31和SEQ ID No:32所示;靶向rs5780349的引物对如SEQ ID No:33和SEQ ID No:34所示;靶向rs2067285的引物对如SEQID No:35和SEQ ID No:36所示;靶向rs5789056的引物对如SEQ ID No:37和SEQ ID No:38所示;靶向rs5789729的引物对如SEQ ID No:39和SEQ ID No:40所示;靶向rs141160384的引物对如SEQ ID No:41和SEQ ID No:42所示;靶向rs139988800的引物对如SEQ ID No:43和SEQ ID No:44所示;靶向rs141928144的引物对如SEQ ID No:45和SEQ ID No:46所示;靶向rs56968651的引物对如SEQ ID No:47和SEQ ID No:48所示;靶向rs59127488的引物对如SEQ ID No:49和SEQ ID No:50所示;靶向rs1347535145的引物对如SEQ ID No:51和SEQ IDNo:52所示;靶向rs551883542的引物对如SEQ ID No:53和SEQ ID No:54所示;靶向rs3994057的引物对如SEQ ID No:55和SEQ ID No:56所示;靶向rs1342356747的引物对如SEQ ID No:57和SEQ ID No:58所示;靶向rs3044086的引物对如SEQ ID No:59和SEQ IDNo:60所示;靶向rs35450593的引物对如SEQ ID No:61和SEQ ID No:62所示;靶向rs72104851的引物对如SEQ ID No:63和SEQ ID No:64所示;靶向rs59005026的引物对如SEQ ID No:65和SEQ ID No:66所示;靶向rs71712626的引物对如SEQ ID No:67和SEQ IDNo:68所示;靶向rs138600078的引物对如SEQ ID No:69和SEQ ID No:70所示;靶向rs879662430的引物对如SEQ ID No:71和SEQ ID No:72所示;靶向rs10564190的引物对如SEQ ID No:73和SEQ ID No:74所示;靶向rs140202531的引物对如SEQ ID No:75和SEQ IDNo:76所示;靶向rs10573591的引物对如SEQ ID No:77和SEQ ID No:78所示;靶向rs10630253的引物对如SEQ ID No:79和SEQ ID No:80所示;靶向rs77624782的引物对如SEQ ID No:81和SEQ ID No:82所示;靶向rs141471313的引物对如SEQ ID No:83和SEQ IDNo:84所示;靶向rs10600917的引物对如SEQ ID No:85和SEQ ID No:86所示;靶向rs71408252的引物对如SEQ ID No:87和SEQ ID No:88所示;靶向rs1404627509的引物对如SEQ ID No:89和SEQ ID No:90所示;靶向rs74816196的引物对如SEQ ID No:91和SEQ IDNo:92所示;靶向rs112473811的引物对如SEQ ID No:93和SEQ ID No:94所示;靶向rs57051438的引物对如SEQ ID No:95和SEQ ID No:96所示;靶向rs766586871的引物对如SEQ ID No:97和SEQ ID No:98所示;靶向rs10628367的引物对如SEQ ID No:99和SEQ IDNo:100所示;靶向rs58227077的引物对如SEQ ID No:101和SEQ ID No:102所示;靶向rs143267128的引物对如SEQ ID No:103和SEQ ID No:104所示;靶向rs140671911的引物对如SEQ ID No:105和SEQ ID No:106所示;靶向rs138465422的引物对如SEQ ID No:107和SEQ ID No:108所示;靶向rs200935491的引物对如SEQ ID No:109和SEQ ID No:110所示;靶向rs141613931的引物对如SEQ ID No:111和SEQ ID No:112所示;靶向rs66462883的引物对如SEQ ID No:113和SEQ ID No:114所示;靶向rs71110898的引物对如SEQ ID No:115和SEQ ID No:116所示;靶向rs35991174的引物对如SEQ ID No:117和SEQ ID No:118所示;靶向rs35880452的引物对如SEQ ID No:119和SEQ ID No:120所示;靶向rs59377169的引物对如SEQ ID No:121和SEQ ID No:122所示;靶向rs778835021的引物对如SEQ ID No:123和SEQ ID No:124所示;靶向rs79710335的引物对如SEQ ID No:125和SEQ ID No:126所示;靶向rs59605350的引物对如SEQ ID No:127和SEQ ID No:128所示;靶向rs112524265的引物对如SEQ ID No:129和SEQ ID No:130所示;靶向rs5886296的引物对如SEQ ID No:131和SEQ ID No:132所示;靶向rs59218555的引物对如SEQ ID No:133和SEQ ID No:134所示;靶向rs67579111的引物对如SEQ ID No:135和SEQ ID No:136所示;靶向rs71004215的引物对如SEQ ID No:137和SEQ ID No:138所示;靶向rs56358449的引物对如SEQ ID No:139和SEQID No:140所示;靶向rs140200174的引物对如SEQ ID No:141和SEQ ID No:142所示;靶向rs56783915的引物对如SEQ ID No:143和SEQ ID No:144所示;靶向rs141047228的引物对如SEQ ID No:145和SEQ ID No:146所示;各所述引物对中至少有一条引物的5’端标记有荧光染料,所述引物组合中核苷酸序列如SEQ ID No:1至SEQ ID No:30所示的引物设为第一群组,核苷酸序列如SEQ ID No:31至SEQ ID No:62所示的引物设为第二群组,核苷酸序列如SEQ ID No:63至SEQ ID No:88所示的引物设为第三群组,核苷酸序列如SEQ ID No:89至SEQ ID No:118所示的引物设为第四群组,核苷酸序列如SEQ ID No:119至SEQ ID No:146所示的引物设为第五群组,每一群组选用一种荧光染料,各群组选用荧光染料互不相同。
2.根据权利要求1所述复合扩增检测体系,其特征在于,靶向rs73611618的引物对的终浓度为0.0476 μM;靶向rs28741387的引物对的终浓度为0.0311 μM;靶向rs141511864的引物对的终浓度为0.0385 μM;靶向rs71377077的引物对的终浓度为0.0476 μM;靶向rs10660476的引物对的终浓度为0.0458 μM;靶向rs879841278的引物对的终浓度为0.0641μM;靶向rs55681325的引物对的终浓度为0.0348 μM;靶向rs140698686的引物对的终浓度为0.0660 μM;靶向rs200216987的引物对的终浓度为0.0513 μM;靶向rs71879919的引物对的终浓度为0.0861 μM;靶向rs10531408的引物对的终浓度为0.0531 μM;靶向rs59369367的引物对的终浓度为0.0586 μM;靶向rs56120126的引物对的终浓度为0.0531 μM;靶向rs71097946的引物对的终浓度为0.0257 μM;靶向rs77514652的引物对的终浓度为0.0403μM;靶向rs561904853的引物对的终浓度为0.0660 μM;靶向rs5780349的引物对的终浓度为0.0660 μM;靶向rs2067285的引物对的终浓度为0.0751 μM;靶向rs5789056的引物对的终浓度为0.0403 μM;靶向rs5789729的引物对的终浓度为0.0623 μM;靶向rs141160384的引物对的终浓度为0.0708 μM;靶向rs139988800的引物对的终浓度为0.0793 μM;靶向rs141928144的引物对的终浓度为0.0708 μM;靶向rs56968651的引物对的终浓度为0.0764μM;靶向rs59127488的引物对的终浓度为0.0736 μM;靶向rs1347535145的引物对的终浓度为0.1132 μM;靶向rs551883542的引物对的终浓度为0.0594 μM;靶向rs3994057的引物对的终浓度为0.0906 μM;靶向rs1342356747的引物对的终浓度为0.0849 μM;靶向rs3044086的引物对的终浓度为0.0708 μM;靶向rs35450593的引物对的终浓度为0.0531 μM;靶向rs72104851的引物对的终浓度为0.0403 μM;靶向rs59005026的引物对的终浓度为0.0476μM;靶向rs71712626的引物对的终浓度为0.0311 μM;靶向rs138600078的引物对的终浓度为0.0366 μM;靶向rs879662430的引物对的终浓度为0.1026 μM;靶向rs10564190的引物对的终浓度为0.0879 μM;靶向rs140202531的引物对的终浓度为0.0458 μM;靶向rs10573591的引物对的终浓度为0.0678 μM;靶向rs10630253的引物对的终浓度为0.0898 μM;靶向rs77624782的引物对的终浓度为0.0989 μM;靶向rs141471313的引物对的终浓度为0.1869μM;靶向rs10600917的引物对的终浓度为0.0733 μM;靶向rs71408252的引物对的终浓度为0.0421 μM;靶向rs1404627509的引物对的终浓度为0.0293 μM;靶向rs74816196的引物对的终浓度为0.0421 μM;靶向rs112473811的引物对的终浓度为0.0825 μM;靶向rs57051438的引物对的终浓度为0.1154 μM;靶向rs766586871的引物对的终浓度为0.0679 μM;靶向rs10628367的引物对的终浓度为0.0679 μM;靶向rs58227077的引物对的终浓度为0.1274μM;靶向rs143267128的引物对的终浓度为0.0764 μM;靶向rs140671911的引物对的终浓度为0.0849 μM;靶向rs138465422的引物对的终浓度为0.0340 μM;靶向rs200935491的引物对的终浓度为0.0679 μM;靶向rs141613931的引物对的终浓度为0.1076 μM;靶向rs66462883的引物对的终浓度为0.0736 μM;靶向rs71110898的引物对的终浓度为0.1104μM;靶向rs35991174的引物对的终浓度为0.0651 μM;靶向rs35880452的引物对的终浓度为0.0708 μM;靶向rs59377169的引物对的终浓度为0.0758 μM;靶向rs778835021的引物对的终浓度为0.0884 μM;靶向rs79710335的引物对的终浓度为0.0455 μM;靶向rs59605350的引物对的终浓度为0.0758 μM;靶向rs112524265的引物对的终浓度为0.0379 μM;靶向rs5886296的引物对的终浓度为0.0303 μM;靶向rs59218555的引物对的终浓度为0.0425 μM;靶向rs67579111的引物对的终浓度为0.0474 μM;靶向rs71004215的引物对的终浓度为0.0278 μM;靶向rs56358449的引物对的终浓度为0.0360 μM;靶向rs140200174的引物对的终浓度为0.0343 μM;靶向rs56783915的引物对的终浓度为0.0425 μM;靶向rs141047228的引物对的终浓度为0.0409 μM。
3.根据权利要求1或2所述复合扩增检测体系,其特征在于,所述荧光染料选自FAM、HEX、SUM、LYN、PUR、A514、TAMRA、ROX、VIC、A555、PET、NED、TAZ、A488、SF488或A568。
4.根据权利要求3所述复合扩增检测体系,其特征在于,所述第一群组选用的所述荧光染料为FAM,所述第二群组选用的所述荧光染料为HEX,所述第三群组选用的所述荧光染料为SUM,所述第四群组选用的所述荧光染料为LYN,所述第五群组选用的所述荧光染料为PUR。
5.根据权利要求4所述复合扩增检测体系,其特征在于,所述复合扩增预混物的组分包括:dNTPs、Taq酶、Tris-HCl缓冲液、KCl、MgCl2和牛血清白蛋白。
6.一种试剂盒,其特征在于,包括如权利要求1至5任一项所述复合扩增检测体系。
7.根据权利要求6所述试剂盒,其特征在于,还包括1个阳性质控品和/或1个阴性质控品。
8.权利要求1至5任一项所述复合扩增检测体系或权利要求6至7任一项所述试剂盒在法医生物地理祖先推断和区分非洲、欧洲、东亚、南亚和美洲群体的应用。
9.权利要求1至5任一项所述复合扩增检测体系或权利要求6至7任一项所述试剂盒在法医生物地理祖先推断和区分汉族、东南亚和日本群体的应用。
CN202410436345.5A 2024-04-11 2024-04-11 包含73个多态性dip位点的复合扩增检测体系及其应用 Active CN118028493B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410436345.5A CN118028493B (zh) 2024-04-11 2024-04-11 包含73个多态性dip位点的复合扩增检测体系及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410436345.5A CN118028493B (zh) 2024-04-11 2024-04-11 包含73个多态性dip位点的复合扩增检测体系及其应用

Publications (2)

Publication Number Publication Date
CN118028493A CN118028493A (zh) 2024-05-14
CN118028493B true CN118028493B (zh) 2024-07-23

Family

ID=90993536

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410436345.5A Active CN118028493B (zh) 2024-04-11 2024-04-11 包含73个多态性dip位点的复合扩增检测体系及其应用

Country Status (1)

Country Link
CN (1) CN118028493B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116064842A (zh) * 2022-11-17 2023-05-05 南方医科大学 一种用于降解检材推断的生物地理祖先DIPs和性别鉴定的复合扩增盒

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2003265572A1 (en) * 2002-08-19 2004-03-03 Dnaprint Genomics, Inc. Compositions and methods for inferring ancestry
CN106868150B (zh) * 2017-03-09 2019-08-27 广州市刑事科学技术研究所 一种人类常染色体和Y染色体InDel遗传多态性位点复合扩增试剂盒及其应用
CN112011622B (zh) * 2019-05-29 2022-12-02 公安部物证鉴定中心 一种对未知来源个体进行非、东亚、欧洲群体来源分析的方法和系统
CN114774409A (zh) * 2022-03-10 2022-07-22 南方医科大学 基于224个InDel和57个SNP位点的二代测序检测体系

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116064842A (zh) * 2022-11-17 2023-05-05 南方医科大学 一种用于降解检材推断的生物地理祖先DIPs和性别鉴定的复合扩增盒

Also Published As

Publication number Publication date
CN118028493A (zh) 2024-05-14

Similar Documents

Publication Publication Date Title
ES2873850T3 (es) Bibliotecas de secuenciación de próxima generación
CN105934523A (zh) 核酸的多重检测
CN108192948B (zh) 一种利用α-溶血素纳米孔检测DNA糖基化酶活性的方法
CN111808854B (zh) 带有分子条码的平衡接头及快速构建转录组文库的方法
US11208692B2 (en) Combinatorial barcode sequences, and related systems and methods
CN109468384A (zh) 一种同时检测45个y基因座的复合扩增检测试剂盒
CN106834456A (zh) 一种采用新型荧光标记方法标记的y‑str复合扩增检测试剂盒及其使用方法
CN109504753A (zh) 遗传性耳聋相关基因检测芯片试剂盒
CN109439735A (zh) 一种脱碱基核酸内切酶1的荧光检测探针、试剂盒及应用
CN108624700A (zh) 基于二代测序技术同步检测124个微单倍型基因座的试剂盒及其专用引物对组合
CN108411008A (zh) 72个snp位点及相关引物在鉴定或辅助鉴定人类族群中的应用
Ren et al. Construction of a rapid microfluidic-based SNP genotyping (MSG) chip for ancestry inference
Gumna et al. RNAthor–fast, accurate normalization, visualization and statistical analysis of RNA probing data resolved by capillary electrophoresis
CN106755467B (zh) 一种检测ffpe样本dna含量及完整性的方法
CN108949929A (zh) 用于同时检测mthfr和mtrr基因多态性的产品及其方法和应用
CN106065417B (zh) 一种str分型系统及试剂盒
CN109706248A (zh) 基于snp-str遗传标记的法医学复合检测试剂盒及其应用
CN118028493B (zh) 包含73个多态性dip位点的复合扩增检测体系及其应用
CN114875118B (zh) 确定细胞谱系的方法、试剂盒和装置
CN110331202A (zh) 一种用于检测brac1基因snp的试剂盒与方法
CN114774557A (zh) 用于推断中国汉族人群个体年龄的组合标志物及其应用
CN108517364A (zh) 基于56个y染色体snp遗传标记的法医学复合检测试剂盒
CN110257489A (zh) 一种基于二代测序的30个Multiple-allele SNP位点的检测技术体系
Yang et al. A new strategy for the discrimination of mitochondrial DNA haplogroups in Han population
CN106222164B (zh) 利用转座子酶进行体外核酸单向扩增的方法、组合物和试剂盒

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant