CN115029425B - 兼容多种测序平台的高通量测序str检测试剂盒及其应用 - Google Patents

兼容多种测序平台的高通量测序str检测试剂盒及其应用 Download PDF

Info

Publication number
CN115029425B
CN115029425B CN202210587917.0A CN202210587917A CN115029425B CN 115029425 B CN115029425 B CN 115029425B CN 202210587917 A CN202210587917 A CN 202210587917A CN 115029425 B CN115029425 B CN 115029425B
Authority
CN
China
Prior art keywords
seq
primer
nucleotide sequences
primer pairs
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210587917.0A
Other languages
English (en)
Other versions
CN115029425A (zh
Inventor
潘雅姣
王颖希
薛建
曲保旺
陈朝辉
李鑫
邱笑违
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ipe Biotechnology Co ltd
Original Assignee
Ipe Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ipe Biotechnology Co ltd filed Critical Ipe Biotechnology Co ltd
Priority to CN202210587917.0A priority Critical patent/CN115029425B/zh
Publication of CN115029425A publication Critical patent/CN115029425A/zh
Application granted granted Critical
Publication of CN115029425B publication Critical patent/CN115029425B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种兼容多种测序平台的高通量测序STR检测试剂盒,试剂盒包括但不限于PCR扩增缓冲液、dNTP、DNA聚合酶,还包括第一次PCR融合引物和第二次PCR融合引物;所述第一次PCR融合引物的上游引物结构为依次连接的Read1、样本标签一、目的片段特异上游引物,其下游引物结构为依次连接的A接头、样本标签二、目的片段特异下游引物。本发明采用上述的一种兼容多种测序平台的高通量测序STR检测试剂盒及其应用,可以兼容多种测序平台,具有高分辨力、高准确性、高通量的特点。

Description

兼容多种测序平台的高通量测序STR检测试剂盒及其应用
技术领域
本发明涉及法医学、刑侦及物证鉴定等领域,尤其是涉及一种兼容多种测序平台的高通量测序STR检测试剂盒及其应用。
背景技术
在法医、刑侦及物证鉴定等工作中如何追踪、认定嫌疑人,在犯罪、灾害等事件中如何判定相关人员或遇难者,在亲属认定中如何确定亲缘关系等是人类文明史中早就出现并不断探索的目标。1985年,英国遗传学家杰弗瑞斯(A.Jeffreys)首次提出“DNA指纹”,指出在人类基因组中的某些区域具有重复序列,而且这类重复序列有个体差异(多态性)并能够遗传。
短串联重复序列(shorttandem repeat,STR)是广泛存在于人类基因组中的一类具有长度多态性的DNA序列,由2-6个碱基对构成核心序列。由于序列重复次数的个体间差异,多数STR基因具有多态性,为法医个体识别和亲子鉴定提供了DNA指纹标记来源。
目前,国内大多数实验室仍以长度分型为基础的荧光复合扩增和毛细管电泳作为STR检验技术手段,由于分析的对象是各个片段的长度大小,无法检测核酸序列的微小差异,限制了检测的分辨度。
高通量测序虽然可以反映序列微变异,提高分辨能力,但是成本高,操作复杂,并且存在同一文库无法在不同测序平台上进行测序的问题。
发明内容
本发明的目的是提供一种兼容多种测序平台的高通量测序STR检测试剂盒及其应用,可以兼容多种测序平台,具有高分辨力、高准确性、高通量的特点。
为实现上述目的,本发明提供了一种兼容多种测序平台的高通量测序STR检测试剂盒,试剂盒包括但不限于PCR扩增缓冲液、dNTP、DNA聚合酶,还包括第一次PCR融合引物和第二次PCR融合引物;
所述第一次PCR融合引物的上游引物结构为依次连接的Read1、样本标签一、目的片段特异上游引物,其下游引物结构为依次连接的A接头、样本标签二、目的片段特异下游引物;
所述第二次PCR融合引物的上游引物结构为依次连接的P5接头、P接头、Read1,其下游引物结构为依次连接的P7接头、A接头。
优选的,Read1的核苷酸序列如SEQ ID NO.1所示,A接头的核苷酸序列如SEQ IDNO.2所示。
优选的,P5接头的核苷酸序列如SEQ ID NO.3所示,P接头的核苷酸序列如SEQ IDNO.4所示,P7接头的核苷酸序列如SEQ ID NO.5所示。
优选的,目的片段特异上游引物和目的片段特异下游引物为以下(1)-(24)中的任意一组或多组;
(1)所述引物对的核苷酸序列如SEQ ID NO.6和SEQ ID NO.7所示;
(2)所述引物对的核苷酸序列如SEQ ID NO.8和SEQ ID NO.9所示;
(3)所述引物对的核苷酸序列如SEQ ID NO.10和SEQ ID NO.11所示;
(4)所述引物对的核苷酸序列如SEQ ID NO.12和SEQ ID NO.13所示;
(5)所述引物对的核苷酸序列如SEQ ID NO.14和SEQ ID NO.15所示;
(6)所述引物对的核苷酸序列如SEQ ID NO.16和SEQ ID NO.17所示;
(7)所述引物对的核苷酸序列如SEQ ID NO.18和SEQ ID NO.19所示;
(8)所述引物对的核苷酸序列如SEQ ID NO.20和SEQ ID NO.21所示;
(9)所述引物对的核苷酸序列如SEQ ID NO.22和SEQ ID NO.23所示;
(10)所述引物对的核苷酸序列如SEQ ID NO.24和SEQ ID NO.25所示;
(11)所述引物对的核苷酸序列如SEQ ID NO.26和SEQ ID NO.27所示;
(12)所述引物对的核苷酸序列如SEQ ID NO.28和SEQ ID NO.29所示;
(13)所述引物对的核苷酸序列如SEQ ID NO.30和SEQ ID NO.31所示;
(14)所述引物对的核苷酸序列如SEQ ID NO.32和SEQ ID NO.33所示;
(15)所述引物对的核苷酸序列如SEQ ID NO.34和SEQ ID NO.35所示;
(16)所述引物对的核苷酸序列如SEQ ID NO.36和SEQ ID NO.37所示;
(17)所述引物对的核苷酸序列如SEQ ID NO.38和SEQ ID NO.39所示;
(18)所述引物对的核苷酸序列如SEQ ID NO.40和SEQ ID NO.41所示;
(19)所述引物对的核苷酸序列如SEQ ID NO.42和SEQ ID NO.43所示;
(20)所述引物对的核苷酸序列如SEQ ID NO.44和SEQ ID NO.45所示;
(21)所述引物对的核苷酸序列如SEQ ID NO.46和SEQ ID NO.47所示;
(22)所述引物对的核苷酸序列如SEQ ID NO.48和SEQ ID NO.49所示;
(23)所述引物对的核苷酸序列如SEQ ID NO.50和SEQ ID NO.51所示;
(24)所述引物对的核苷酸序列如SEQ ID NO.52和SEQ ID NO.53所示。
优选的,目的片段特异引物对(1)的浓度为0.01-0.2μM,目的片段特异引物对(2)-(13)的浓度为0.01-0.05μM,目的片段特异引物对(14)的浓度为0.01-0.06μM,目的片段特异引物对(15)-(24)的浓度为0.02-0.1μM。
优选的,样本标签一为如下(a-l)任一项所示的核苷酸序列:
a、TCGCCTTA;b、CTAGTACG;c、TTCTGCCT;dGCTCAGGA;e、AGGAGTCC;f、CATGCCTA;g、CTAGAGAG;h、CCTCTCTG;i、CAGCCTCG;j、TGCCTCTT;k、TCCTCTAC;l、TCATGAGC。
优选的,样本标签二为如下①-⑧任一项所示的核苷酸序列:
①ACTTGTTCGA;②ATCCGCCGTA;③ATCCGTTCGA;④ATGGCGGTCA;⑤CAGGTGGCTA;⑥CTAAGTTGCA;⑦CGTTAGGTCA;⑧TCGGACCGTA。
因此,本发明采用上述一种兼容多种测序平台的高通量测序STR检测试剂盒及其应用,通过试剂盒组分和操作流程的设计和改良,形成全套的适用于ThermoFisher和Illumina两种高通量测序平台,可实现多样本、多STR基因座平行、稳定测试的试剂盒。试剂盒分辨度达到核苷酸水平,单次测定可在一个工作日内完成,一次测定实现几百人份的几十个STR基因座检测,测定成本和操作时间容许大批量的建库使用。
其具体的技术效果如下:
(1)所构建文库可以兼容不同测序平台;
(2)实现多样本(几十到几百人份)、多靶标(24个常染色体STR)并行检测。
(3)分辨度达到核苷酸序列水平,提高试剂盒个体识别能力。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
图1是ThermoFisher测序文库结构(正向测序)示意图;
图2是Illumina测序文库结构(单端测序)示意图;
图3是融合正向测序和Illumina单端测序文库结构示意图;
图4是ThermoFisher测序文库结构(反向测序)示意图;
图5是融合反向测序和Illumina单端测序文库结构示意图;
图6是测序文库构建示意图;
图7是常染色体STR基因座序列多态引起的等位基因数目变化图。
具体实施方式
以下通过附图和实施例对本发明的技术方案作进一步说明。
除非另外定义,本发明使用的技术术语或者科学术语应当为本发明所属领域内具有一般技能的人士所理解的通常意义。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的主旨或基本特征的情况下,能够以其它的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内,不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其它实施方式。这些其它实施方式也涵盖在本发明的保护范围内。
还应当理解,以上所述的具体实施例仅用于解释本发明,本发明的保护范围并不限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明/发明的保护范围之内。
对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。本发明中使用的术语“约”具有本领域技术人员公知的含义,优选指该术语所修饰的数值在其±50%,±40%,±30%,±20%,±10%,±5%或±1%范围内。
本公开使用的所有术语(包括技术术语或者科学术语)与本公开所属领域的普通技术人员理解的含义相同,除非另外特别定义。还应当理解,在诸如通用词典中定义的术语应当被理解为具有与它们在相关技术的上下文中的含义相一致的含义,而不应用理想化或极度形式化的意义来解释,除非本文有明确地这样定义。
对于相关领域普通技术人员已知的技术、方法和设备可能不作为详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
本发明说明书中引用的现有技术文献所公开的内容整体均通过引用并入本发明中,并且因此是本发明公开内容的一部分。
实施例一
确定可以兼容两种测序平台的文库结构
ThermoFisher文库结构如图1所示:目的片段两端连有不同接头,一侧为测序接头(A接头),用于结合测序引物,A接头下游为样本标签,以区分不同样本的测序结果。另一侧为固定接头(P接头),用于连接捕获颗粒。
Illumina单端测序文库结构如图2所示:目的片段两端连有P5、P7接头,用于和测序流动槽(flowcell)遍布的寡核苷酸序列结合,形成桥式结构。Read1引物结合区用以结合测序引物,并引导测序开始。样本标签用以区分样本。
illumina文库比ThermoFisher多出Read1引物结合区,但ThermoFisher的A、P接头与Illumina的P5、P7接头序列完全不一致,需要将一侧的A接头、P5接头先后排列,另一侧P接头、P7接头先后排列。A接头为ThermoFisher平台的测序引物结合区,靠近目的片段,P5接头在Illumina平台负责和测序流动槽的寡核苷酸序列结合,设置在序列边缘。ThermoFisher的P接头和Illumina的P7接头都用于和寡合苷酸序列的结合,二者排序没有要求。
整合ThermoFisher正向测序文库(图1)和Illumina单端测序文库(图2)文库结构如图3,A接头和Read1引物结合区分别负责引导ThermoFisher和Illumina测序(分别用红色和蓝色箭头表示),二者共用一段样本标签。
但是,图3文库结构存在两个问题:(1)目的片段两侧长度不均衡。上游含P5接头(29bp)、A接头(30bp)、Read1引物结合区(33bp)、样本标签(10bp),长度总和约100bp。下游只有P接头(24bp)、P7接头(24bp),长度总和48bp。引物设计时上、下游引物长度不容易平衡。(2)A接头引导的ThermoFisher测序区包含Read1引物结合区,对目的片段的检测没有实际意义,浪费掉33bp的前端测序资源。
如果将ThermoFisher改为反向测序(图4)和illumina文库(图2)进行整合,整合后文库结构(图5)目的片段两端的长度更接近,左侧96bp(29+24+33+10),右侧64bp(10+30+24)。ThermoFisher测序由A接头引导反向进行,illumina测序由Read1引物结合区引导正向进行,目的片段上游都没有无效片段的插入。样本标签1和样本标签2可以被两个测序平台共用,其中样本标签2靠近A接头,样本标签1靠近Read1,分别位于ThermoFisher和illumina平台的测序前端可以被优先检测到。如果测序长度和质量满足要求的话,尾部的样本标签也可以检测到,这样两个平台都均有2个样本标签。
综上所述,图5所示文库结构可以有效减少目的片段两端长度不均衡,并消除目的片段上游的无效测序。
实施例二
确定两轮PCR融合引物结构
融合引物是除了目的片段特异性引物外,还含有其他序列(包括测序接头、固定接头、样本标签)的长引物,如果只采用单次PCR获得测序文库,融合引物过长(上游融合引物长度约115碱基,下游引物长度约85碱基)会导致合成费高、扩增困难。
上游融合引物:5’-P5接头(29个碱基)-P接头(24个碱基)-Read1(33碱基)-样本标签1(10个碱基)-目的片段上游引物(19-23碱基)-3’
下游融合引物:5’-P7接头(24个碱基)-A接头(30个碱基)-样本标签2(10个碱基)-目的片段下游引物(19-23碱基)-3’
本申请采用两轮PCR方法完成文库构建,融合引物结构如下:
1、第一轮PCR
上游融合引物:5’-Read1(33碱基)-样本标签1(8-10个碱基)-目的片段上游引物(19-23碱基)-3’
下游融合引物:5’-A接头(30个碱基)-样本标签2(10-13个碱基)-目的片段下游引物(19-23碱基)-3’
2、第二轮PCR
上游融合引物:5’-P5接头(29个碱基)-P接头(24个碱基)-Read1(33碱基)-3’
下游融合引物:5’-P7接头(24个碱基)-A接头(30个碱基)-3’
3、两轮PCR融合引物序列的确定
(1)目的片段特异引物设计及验证
人类基因组中存在大量重复序列,重复序列数量的差异决定不同个体的遗传特征。本申请的试剂盒检测常染色体STR基因座24个:Amel、D3S1358、D13S317、D7S820、D16S539、D8S1179、D21S11、D18S51、VWA、D5S818、FGA、TPOX、TH01、D2S1338、CSF1PO、D19S43、PentaD、PentaE、D6S1043、D12S391、D1S1656、D6S474、D17S974、D1S1679。目的片段特异引物序列如下:
表1试剂盒中目的片段特异引物序列
Figure BDA0003663894770000081
Figure BDA0003663894770000091
(2)第一轮PCR融合引物序列
a、上游融合引物从5’到3’端依次为:Read1、样本标签1、目的片段特异上游引物。
Read1序列为5’TCGTCGGCAGCGTCAGATGTGTATAAGAGACAG。
样本标签1靠近Read1,在illumina平台测序前端被优先检测到,其序列如下。
表2样本标签1序列
样本标签1编号 序列 样本标签1编号 序列
1-1 TCGCCTTA 1-7 CTAGAGAG
1-2 CTAGTACG 1-8 CCTCTCTG
1-3 TTCTGCCT 1-9 CAGCCTCG
1-4 GCTCAGGA 1-10 TGCCTCTT
1-5 AGGAGTCC 1-11 TCCTCTAC
1-6 CATGCCTA 1-12 TCATGAGC
b、下游上游融合引物从5’到3’端依次为:A接头、样本标签2、目的片段特异下游引物
其中:A接头序列为5’CCATCTCATCCCTGCGTGTCTCCGACTCAG。
样本标签1靠近A接头,在赛默飞测序前端被优先检测到,其序列如下。
表3样本标签2序列
Figure BDA0003663894770000092
Figure BDA0003663894770000101
(3)第二轮PCR融合引物序列
a、上游融合引物从5’到3’端依次为:P5接头、P接头、Read1
其中:P5接头序列为5’AATGATACGGCGACCACCGAGATCTACAC
P接头序列为5’CCTCTCTATGGGCAGTCGGTGAT
Read1序列为5’TCGTCGGCAGCGTCAGATGTGTATAAGAGACAG
b、下游融合引物从5’到3’端依次为:P7接头、A接头
其中:P7接头序列为5’CAAGCAGAAGACGGCATACGAGAT
A接头序列为5’CCATCTCATCCCTGCGTGTCTCCGACTCAG
实施例三
建立平衡的多重PCR体系
第一轮PCR的上游融合引物包含Read1、样本标签1、目的片段上游引物三个部分,如果样本标签1有1-1、1-2…1-12有12种,目的片段上游引物包含24种,上游融合引物则有288条。下游融合引物包含A接头、样本标签2、目的片段下游引物三个部分,如果样本标签2有2-1、1-2…2-8共8种,目的片段下游引物包含24种,下游融合引物共192条。
第一轮PCR融合引物含不同目的片段特异引物,属于多重PCR。引物制备时,需要每24条含有相同样本标签1的上游融合引物混合成1个上游引物mix,并以F+样本标签1编号命名,例如F1-1、F1-2…F1-12。同理,每24条含有相同样本标签2的下游融合引物混合1个下游引物mix,并以R+样本标签2编号命名,例如R2-1、R2-2…R2-8。
含不同目的片段特异引物的融合引物的混合比例对多重PCR均衡性起关键作用,第一轮多重PCR扩增体系中各引物对的比例,实现各STR目的扩增产物量的平衡,各引物池内24对融合引物比例见表4。
表4试剂盒第一轮PCR引物池内融合引物比例
Figure BDA0003663894770000111
实施例四
两轮PCR完成后构建测序文库
第一轮PCR的上游引物5’端和第二轮PCR上游引物3’端有33碱基重叠(Read1),其下游引物5’端和第二轮PCR下游引物3’端有30碱基重叠(A接头),通过两次PCR扩增获得上述图6所示的可以兼容ThermoFisher和illumina两个平台的测序文库。
实施例五
一、样本信息
待测样本来自中国汉族的95份血样,制备成干血片保存并备用,阳性对照为2800M标准DNA(DD7101,普洛麦格)。
二、引物
(1)第一轮PCR融合引物
第一轮PCR的上游融合引物包含Read1、样本标签1、目的片段上游引物三个部分,其中样本标签1有1-1、1-2…1-12共12种,目的片段上游引物包含24种,因此上游融合引物共288条。每24条含有相同样本标签1的上游融合引物按照表4所示比例混合成1个上游引物mix,共获得12个引物池,分别命名为F1-1、F1-2…F1-12。
第一轮PCR的下游融合引物包含A接头、样本标签2、目的片段下游引物三个部分,其中样本标签2有2-1、1-2…2-8共8种,目的片段下游引物包含24种,下游融合引物共192条。每24条含有相同样本标签2的下游融合引物混合成1个下游引物mix,共获得8个引物池,分别命名为R2-1、R2-2…R2-8。
取出1个96孔板,将上游融合引物F1-1、F1-2…F1-12分别加入96孔板的第1、2…12列,每孔加入2.5μL。将下游融合引物R2-1、R2-2…R2-8分别加入96孔板的第1、2…8行,每孔加入2.5μL。此时,96孔板每孔含5μL上、下游融合引物混合物。
(2)第二轮PCR融合引物准备
上、下游融合引物均无可变序列,分别命名为F-2r和R-2r并稀释至10μM工作液备用即可。
三、样本准备
以直径1mm打孔器,将95份血片打入上述步骤(1)中每孔含有5μL第一轮PCR融合引物的96孔PCR板中,每个样本取血片1份。A1孔加入1ng 2800M标准DNA作为阳性对照。
四、文库制备
(1)第一轮PCR
按照下表配制PCRMix,混合后以每孔5μL分装至上述步骤2中装有血片(或2800M标准DNA)和5μL融合引物的96孔PCR板中。
Figure BDA0003663894770000131
分装完成后,按照如下程序进行第一轮PCR:
Figure BDA0003663894770000132
(2)第二轮PCR
上述步骤(1)的PCR产物等体积混合(可以每孔取5μL),然后取10μL混合物为DNA模板,以步骤(2)10μM第二轮PCR融合引物为扩增引物,按照下表配制PCR Mix。
Figure BDA0003663894770000133
按照如下程序进行第二轮PCR:
Figure BDA0003663894770000134
(3)PCR产物纯化
a、向上述步骤(2)PCR产物加入60μL纯化磁珠,吸打混匀后室温静置5分钟。
b、将混合物放在磁力架上,静置10分钟。
c、移除上清液后,将离心管从磁力架取下来。
d、吸取200μL 70%乙醇到离心管中,吸打10次以充分清洗磁珠,然后将离心管放置磁力架上静置2分钟,并移除上清。
e、重复步骤5一遍。
f、磁力架静置10分钟以充分干燥磁珠。
g、将EP管从磁力架拿出,加入50μL无核酸酶水洗脱,吸打混匀,室温静置30分钟。
h、EP管放回磁力架,静置2分钟。将上清液转移到一个新的1.5mLEP管备用。
(4)高通量测序
上述纯化产物采用Qiubit3.0定量,参考浓度范围0.1-0.4ng/μL的参考范围。如果符合浓度范围,可以直接取25μL进行高通量测序。
赛默飞测序采用Ion Chef自动化测序模板制备系统和S5XL测序系统进行,芯片采用520chip,操作参照Ion 510/520/530TM Kit-Chef(A34019)试剂盒说明。
Illumina测序试剂采用Illumina MiSeq FGx system进行,操作参照MiSeqReagentKit v2(500cycles)试剂盒说明。
(5)数据分析
采用以参考序列比对为基础SeqVision V1.5软件(北京爱普益生物科技有限公司)进行,分析流程包括长度质控,Barcode归类、基因座归类、基因分型。等位基因序列命名主要以ISFG(2016)和STRseq(2017)公布规定为准。
个体识别率按以下公式计算:
Figure BDA0003663894770000151
(6)等位基因多态性
与只反映长度多态性的CE方法相比,高通量测序可以反映STR基因座序列差异,并引起等位基因数目的增加。如图7所示:重复区序列结构差异在9个常染色体STR(D3S1358、vWA、D1S1656、D19S433、D8S1179、D2S1338、D21S11、D12S391、D6S1043)引起等位基因数目的增加,增加数目为2-31个。侧翼SNP在6个常染色体STR(D16S539、D17S974、D7S820、D5S818、D13S317、D12S391)引起等位基因数目增加,增加数目为5-10个。常染色体STR整体增幅为66.1%,其中D21S11、D2S1338、D12S391增长最为明显,涨幅分别为187%、179%、300%。
以D21S11为例展示重复区序列结构差异引起的等位基因多态增加(表5),以D16S539为例展示重复区侧翼SNP引起的等位基因多态增加(表6)。
其中,蓝色代表长度分型等位基因数;红色代表重复区序列差异引起的等位基因数增加;绿色代表重复区侧翼SNP引起的等位基因数增加。
表5 D21S11重复结构差异引起的等位基因多态性增加
Figure BDA0003663894770000152
Figure BDA0003663894770000161
表6 D16S539重复区侧翼SNP引起的等位基因多态性增加
Figure BDA0003663894770000162
(7)个体识别率
如表7所示,重复区存在序列多态的9个STR(D3S1358、vWA、D1S1656、D19S433、D8S1179、D2S1338、D21S11、D12S391、D6S1043)个体识别率从0.8077-0.9670增加至0.8763-0.9855,增长幅度0.1-8.7%。侧翼存在单碱基序列多态的5个STR(D16S539、D17S974、D7S820、D5S818、D13S317)个体识别率从0.7704-0.8913增加至0.8521-0.9449,增幅2.6-10.6%。累积随机匹配率由1.8E-23降至1.8E-26,24个常染色体的系统个体识别能力提高3个数量级。
表7个体识别率和累积随机匹配率统计结果
Figure BDA0003663894770000171
注:累积随机匹配率等于各STR基因座个体识别率和1差值的连续乘积
因此,本发明采用上述一种兼容多种测序平台的高通量测序STR检测试剂盒及其应用,可以兼容多种测序平台,具有高分辨力、高准确性、高通量的特点。
最后应说明的是:以上实施例仅用以说明本发明的技术方案而非对其进行限制,尽管参照较佳实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对本发明的技术方案进行修改或者等同替换,而这些修改或者等同替换亦不能使修改后的技术方案脱离本发明技术方案的精神和范围。
序列表
<110> 北京爱普益生物科技有限公司
<120> 兼容多种测序平台的高通量测序STR检测试剂盒及其应用
<160> 53
<170> SIPOSequenceListing 1.0
<210> 1
<211> 33
<212> DNA
<213> artificial series
<400> 1
tcgtcggcag cgtcagatgt gtataagaga cag 33
<210> 2
<211> 30
<212> DNA
<213> artificial series
<400> 2
ccatctcatc cctgcgtgtc tccgactcag 30
<210> 3
<211> 29
<212> DNA
<213> artificial series
<400> 3
aatgatacgg cgaccaccga gatctacac 29
<210> 4
<211> 23
<212> DNA
<213> artificial series
<400> 4
cctctctatg ggcagtcggt gat 23
<210> 5
<211> 24
<212> DNA
<213> artificial series
<400> 5
caagcagaag acggcatacg agat 24
<210> 6
<211> 21
<212> DNA
<213> artificial series
<400> 6
gctatgaggt aatttttctc t 21
<210> 7
<211> 21
<212> DNA
<213> artificial series
<400> 7
atatttagga ggacagactg a 21
<210> 8
<211> 20
<212> DNA
<213> artificial series
<400> 8
gctgtagtga gctatgattc 20
<210> 9
<211> 21
<212> DNA
<213> artificial series
<400> 9
tatttttctg tggtgtgtat t 21
<210> 10
<211> 21
<212> DNA
<213> artificial series
<400> 10
gaggagagtt catttcttta g 21
<210> 11
<211> 21
<212> DNA
<213> artificial series
<400> 11
tattcagaga gcttgaattg t 21
<210> 12
<211> 21
<212> DNA
<213> artificial series
<400> 12
gctgactatg gagttatttt a 21
<210> 13
<211> 19
<212> DNA
<213> artificial series
<400> 13
ttccacattt atcctcatt 19
<210> 14
<211> 19
<212> DNA
<213> artificial series
<400> 14
atttttatat gggagcaaa 19
<210> 15
<211> 20
<212> DNA
<213> artificial series
<400> 15
ttataccatt tagcgtttgt 20
<210> 16
<211> 18
<212> DNA
<213> artificial series
<400> 16
ttgcctgagt tttgctca 18
<210> 17
<211> 19
<212> DNA
<213> artificial series
<400> 17
cgtgaatatg ccttaattt 19
<210> 18
<211> 20
<212> DNA
<213> artificial series
<400> 18
gtctgttatg ggacttttct 20
<210> 19
<211> 21
<212> DNA
<213> artificial series
<400> 19
ataggaggta gatagactgg a 21
<210> 20
<211> 19
<212> DNA
<213> artificial series
<400> 20
cacacaccag agaagttaa 19
<210> 21
<211> 20
<212> DNA
<213> artificial series
<400> 21
attaacttct ctggtgtgtg 20
<210> 22
<211> 21
<212> DNA
<213> artificial series
<400> 22
gtggatgata agaataatca g 21
<210> 23
<211> 23
<212> DNA
<213> artificial series
<400> 23
atgataaata gatacatagg tta 23
<210> 24
<211> 21
<212> DNA
<213> artificial series
<400> 24
ttaatagcaa gtatgtgaca a 21
<210> 25
<211> 20
<212> DNA
<213> artificial series
<400> 25
aatgctttag tgctttttag 20
<210> 26
<211> 19
<212> DNA
<213> artificial series
<400> 26
aaagtcaaat gccccatag 19
<210> 27
<211> 21
<212> DNA
<213> artificial series
<400> 27
atatggttat tgaagtagct g 21
<210> 28
<211> 18
<212> DNA
<213> artificial series
<400> 28
atcactagca cccagaac 18
<210> 29
<211> 18
<212> DNA
<213> artificial series
<400> 29
tcttctgaac acaagtcg 18
<210> 30
<211> 19
<212> DNA
<213> artificial series
<400> 30
caaaattcaa agggtatct 19
<210> 31
<211> 18
<212> DNA
<213> artificial series
<400> 31
tgaaaagctc ccgattat 18
<210> 32
<211> 18
<212> DNA
<213> artificial series
<400> 32
agtggatttg gaaacaga 18
<210> 33
<211> 20
<212> DNA
<213> artificial series
<400> 33
tacatcccta gtacctagca 20
<210> 34
<211> 21
<212> DNA
<213> artificial series
<400> 34
agttttccta cctgtaaaat g 21
<210> 35
<211> 21
<212> DNA
<213> artificial series
<400> 35
actgagcctt ctcagatact a 21
<210> 36
<211> 21
<212> DNA
<213> artificial series
<400> 36
tataattgta ccactgcact c 21
<210> 37
<211> 21
<212> DNA
<213> artificial series
<400> 37
tgttggttac atgaataagt t 21
<210> 38
<211> 18
<212> DNA
<213> artificial series
<400> 38
ctaggtgaca gagcaaga 18
<210> 39
<211> 21
<212> DNA
<213> artificial series
<400> 39
taagaaatat ttgcctaacc t 21
<210> 40
<211> 19
<212> DNA
<213> artificial series
<400> 40
aacaggagaa tcacttgaa 19
<210> 41
<211> 21
<212> DNA
<213> artificial series
<400> 41
agaattctct tatttgggtt a 21
<210> 42
<211> 21
<212> DNA
<213> artificial series
<400> 42
tcatctagtt gcctgtatta g 21
<210> 43
<211> 20
<212> DNA
<213> artificial series
<400> 43
ctcagcttcc ataattgtat 20
<210> 44
<211> 20
<212> DNA
<213> artificial series
<400> 44
aacaggatca atggatgcat 20
<210> 45
<211> 20
<212> DNA
<213> artificial series
<400> 45
ggactgtcat gagatttttc 20
<210> 46
<211> 21
<212> DNA
<213> artificial series
<400> 46
atataagttc aagcctgtgt t 21
<210> 47
<211> 21
<212> DNA
<213> artificial series
<400> 47
aggattcttc agagaaatag a 21
<210> 48
<211> 21
<212> DNA
<213> artificial series
<400> 48
gaaaaatcag gcttttatta t 21
<210> 49
<211> 20
<212> DNA
<213> artificial series
<400> 49
agacagccta tcatgagaat 20
<210> 50
<211> 18
<212> DNA
<213> artificial series
<400> 50
tcaattccac tgtctgaa 18
<210> 51
<211> 18
<212> DNA
<213> artificial series
<400> 51
ctgcagtgag ctgagatg 18
<210> 52
<211> 19
<212> DNA
<213> artificial series
<400> 52
acagccatca agaaaacta 19
<210> 53
<211> 21
<212> DNA
<213> artificial series
<400> 53
agtgagtact gtttggagaa t 21

Claims (3)

1.一种兼容多种测序平台的高通量测序STR检测试剂盒,其特征在于:试剂盒包括PCR扩增缓冲液、dNTP、DNA聚合酶,还包括第一次PCR融合引物和第二次PCR融合引物;
所述第一次PCR融合引物的上游引物结构为依次连接的Read1、样本标签一、目的片段特异上游引物,其下游引物结构为依次连接的A接头、样本标签二、目的片段特异下游引物;
Read1的核苷酸序列如SEQ ID NO .1所示,A接头的核苷酸序列如SEQ ID NO.2所示;
样本标签一为如下(a-l)任一项所示的核苷酸序列:
a、TCGCCTTA;b、CTAGTACG;c、TTCTGCCT;d、GCTCAGGA;e、AGGAGTCC;f、CATGCCTA;g、CTAGAGAG;h、CCTCTCTG;i、CAGCCTCG;j、TGCCTCTT;k、TCCTCTAC;l、TCATGAGC;
样本标签二为如下①-⑧任一项所示的核苷酸序列:
①ACTTGTTCGA;②ATCCGCCGTA;③ATCCGTTCGA;④ATGGCGGTCA;⑤CAGGTGGCTA;⑥CTAAGTTGCA;⑦CGTTAGGTCA;⑧TCGGACCGTA;
所述第二次PCR融合引物的上游引物结构为依次连接的P5接头、P接头、Read1,其下游引物结构为依次连接的P7接头、A接头;
P5接头的核苷酸序列如SEQ ID NO.3所示,P接头的核苷酸序列如SEQ ID NO.4所示,P7接头的核苷酸序列如SEQ ID NO.5所示;
所述兼容多种测序平台为兼容ThermoFisher和Illumina两种高通量测序平台。
2.根据权利要求1所述的一种兼容多种测序平台的高通量测序STR检测试剂盒,其特征在于:目的片段特异上游引物和目的片段特异下游引物为以下(1)-(24)中的任意一组或多组;
(1)所述引物对的核苷酸序列如SEQ ID NO.6和SEQ ID NO.7所示;
(2)所述引物对的核苷酸序列如SEQ ID NO.8和SEQ ID NO.9所示;
(3)所述引物对的核苷酸序列如SEQ ID NO.10和SEQ ID NO.11所示;
(4)所述引物对的核苷酸序列如SEQ ID NO.12和SEQ ID NO.13所示;
(5)所述引物对的核苷酸序列如SEQ ID NO.14和SEQ ID NO.15所示;
(6)所述引物对的核苷酸序列如SEQ ID NO.16和SEQ ID NO.17所示;
(7)所述引物对的核苷酸序列如SEQ ID NO.18和SEQ ID NO.19所示;
(8)所述引物对的核苷酸序列如SEQ ID NO.20和SEQ ID NO.21所示;
(9)所述引物对的核苷酸序列如SEQ ID NO.22和SEQ ID NO.23所示;
(10)所述引物对的核苷酸序列如SEQ ID NO.24和SEQ ID NO.25所示;
(11)所述引物对的核苷酸序列如SEQ ID NO.26和SEQ ID NO.27所示;
(12)所述引物对的核苷酸序列如SEQ ID NO.28和SEQ ID NO.29所示;
(13)所述引物对的核苷酸序列如SEQ ID NO.30和SEQ ID NO.31所示;
(14)所述引物对的核苷酸序列如SEQ ID NO.32和SEQ ID NO.33所示;
(15)所述引物对的核苷酸序列如SEQ ID NO.34和SEQ ID NO.35所示;
(16)所述引物对的核苷酸序列如SEQ ID NO.36和SEQ ID NO.37所示;
(17)所述引物对的核苷酸序列如SEQ ID NO.38和SEQ ID NO.39所示;
(18)所述引物对的核苷酸序列如SEQ ID NO.40和SEQ ID NO.41所示;
(19)所述引物对的核苷酸序列如SEQ ID NO.42和SEQ ID NO.43所示;
(20)所述引物对的核苷酸序列如SEQ ID NO.44和SEQ ID NO.45所示;
(21)所述引物对的核苷酸序列如SEQ ID NO.46和SEQ ID NO.47所示;
(22)所述引物对的核苷酸序列如SEQ ID NO.48和SEQ ID NO.49所示;
(23)所述引物对的核苷酸序列如SEQ ID NO.50和SEQ ID NO.51所示;
(24)所述引物对的核苷酸序列如SEQ ID NO.52和SEQ ID NO.53所示。
3.根据权利要求2所述的一种兼容多种测序平台的高通量测序STR检测试剂盒,其特征在于:目的片段特异引物对(1)的浓度为0.01-0.2μM,目的片段特异引物对(2)-(13)的浓度为0.01-0.05μM,目的片段特异引物对(14)的浓度为0.01-0.06μM,目的片段特异引物对(15)-(24)的浓度为0.02-0.1μM。
CN202210587917.0A 2022-05-26 2022-05-26 兼容多种测序平台的高通量测序str检测试剂盒及其应用 Active CN115029425B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210587917.0A CN115029425B (zh) 2022-05-26 2022-05-26 兼容多种测序平台的高通量测序str检测试剂盒及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210587917.0A CN115029425B (zh) 2022-05-26 2022-05-26 兼容多种测序平台的高通量测序str检测试剂盒及其应用

Publications (2)

Publication Number Publication Date
CN115029425A CN115029425A (zh) 2022-09-09
CN115029425B true CN115029425B (zh) 2023-04-18

Family

ID=83121331

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210587917.0A Active CN115029425B (zh) 2022-05-26 2022-05-26 兼容多种测序平台的高通量测序str检测试剂盒及其应用

Country Status (1)

Country Link
CN (1) CN115029425B (zh)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105441534B (zh) * 2015-06-05 2019-01-22 公安部物证鉴定中心 一种用于对中国人群个体进行个体识别和亲子鉴定的方法和系统
CN111471754B (zh) * 2020-05-14 2021-01-29 北京安智因生物技术有限公司 一种通用型高通量测序接头及其应用
CN111575349B (zh) * 2020-05-27 2021-04-13 东莞博奥木华基因科技有限公司 一种接头序列及其应用
CN113416791B (zh) * 2021-08-23 2021-11-09 百特元生物科技(北京)有限公司 同时扩增人25个str基因座的特异性扩增引物组、荧光标记扩增试剂盒及应用和方法

Also Published As

Publication number Publication date
CN115029425A (zh) 2022-09-09

Similar Documents

Publication Publication Date Title
US11130995B2 (en) Simultaneous determination of aneuploidy and fetal fraction
EP3910069A1 (en) Methods and composition for dna profiling
CN106350590B (zh) 用于高通量测序的dna文库构建方法
EP2691544B1 (en) Method for verifying bioassay samples
CN110863056A (zh) 一种人类dna精准分型的方法、试剂和应用
CN113293204B (zh) 基于二代测序平台检测微卫星不稳定性的引物组合物、试剂盒和方法
CN106399553B (zh) 一种基于多重pcr的人线粒体全基因组高通量测序方法
CN106399496B (zh) 高通量检测str遗传标记的建库试剂盒
CN107099529B (zh) 基于二代测序技术的检测基因座的试剂盒及其专用引物组合
CN112592981B (zh) 用于dna档案建库的引物组、试剂盒和方法
WO2015196752A1 (en) A method and a kit for quickly constructing a plasma dna sequencing library
CN115029425B (zh) 兼容多种测序平台的高通量测序str检测试剂盒及其应用
CN111321212B (zh) 皮肤抗痘能力基因检测的引物组合及其应用
CN102286477B (zh) Str分型标准物质的制备方法
Vajpayee et al. Forensic DNA typing: inception, methodology, and technical advancements
CN108192982B (zh) 基于二代测序技术的检测y-str基因座的试剂盒及其专用引物组合
CN111394477A (zh) 基于二代测序技术的检测120个基因座的试剂盒及其使用的引物组合
CN113444769A (zh) 一种dna标签序列的构建方法及其应用
Mancia Genome-wide DNA Methylation protocol for epigenetics studies
Decorte et al. Allele frequency data for 19 short tandem repeats (PowerPlex® 16 and FFFl) in a Belgian population sample
Chen et al. Identification and use of personalized genomic markers for monitoring circulating tumor DNA
CN115976014A (zh) 引物组、检测试剂盒、其用途、以及相应的检测方法
KR20120015375A (ko) 개인식별 또는 친자확인을 하기 위한 특이 프라이머 및 이의 용도
CN115927562A (zh) 一种基于高通量测序平台的多源遗传标记复合检测体系及其应用
Moretto Improving resolution of mixtures by DNA sequencing using the Illumina MiSeq FGx system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant