CN114807300A - 单引物多重扩增技术在检测片段化稀有特征核酸分子中的应用及试剂盒 - Google Patents

单引物多重扩增技术在检测片段化稀有特征核酸分子中的应用及试剂盒 Download PDF

Info

Publication number
CN114807300A
CN114807300A CN202110085321.6A CN202110085321A CN114807300A CN 114807300 A CN114807300 A CN 114807300A CN 202110085321 A CN202110085321 A CN 202110085321A CN 114807300 A CN114807300 A CN 114807300A
Authority
CN
China
Prior art keywords
group
primer
sequence
amplification
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110085321.6A
Other languages
English (en)
Inventor
杨国华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yiming Suzhou Diagnostic Technology Co ltd
Original Assignee
Shanghai Yiming Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Yiming Biotechnology Co ltd filed Critical Shanghai Yiming Biotechnology Co ltd
Priority to CN202110085321.6A priority Critical patent/CN114807300A/zh
Publication of CN114807300A publication Critical patent/CN114807300A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay

Abstract

本发明提出了单引物多重扩增技术在检测片段化稀有特征核酸分子中的应用,通过3’末端核苷酸含有二象性功能基团修饰的特异性引物线性扩增目标DNA,获得线性扩增产物;将所述线性扩增产物进行接头连接,获得接头连接产物。本发明还提出可应用于单引物多重扩增技术在检测片段化稀有特征核酸分子中的试剂盒/试剂。本发明进一步通过在特异性引物中引入硫代修饰,有效降低线性扩增过程中的非特异性扩增,从而检测限达0.1个拷贝,达到低于单个分子的水平,实现高灵敏度检测效果。

Description

单引物多重扩增技术在检测片段化稀有特征核酸分子中的应 用及试剂盒
技术领域
本发明涉及生物技术领域,涉及利用单引物多重扩增技术在检测片段化稀有特征核酸分子中的应用,以及试剂/试剂盒。
背景技术
PCR技术作为第一种人类掌握的单分子级别的检测技术从发明至今已经超过35年了,在这个漫长的过程中科学家和技术人员对PCR技术进行了不断的改进,形成了一些改良的PCR技术如荧光实时PCR、等温PCR、多重PCR、数字PCR等。但是到目前为止,PCR以及这些改良的PCR技术对核酸分子在检测灵敏度上依然没有达到低于单个分子的水平。
事实上,对于核酸分子随机片段化的临床常规标本,如血浆、尿液中的游离DNA(cfDNA),PCR技术的短板更为显著。其检测的灵敏度受限于待测核酸分子长度和PCR扩增子长度的比值,在实际检测中,考虑到引物和检测探针的设计难度,通常对于100-200bp左右的cfDNA,其实际检出效率约在20%左右,远达不到单个分子的水平。
理论上,线性扩增(即通过单个引物捕获并延伸每一个目标区域,每一轮的扩增都只以原始样本中的DNA分子为模板的DNA扩增方式)是一种改善片段化DNA检出率的潜在方法。但现有技术中的DNA线性扩增的效率有限,要数十个循环才能达到预期的扩增倍数,一旦扩增中出现非特异的PCR指数扩增反应,则会耗尽反应中的底物,令线性扩增无法实现。非特异扩增出现的原因主要有三种:1)引物之间形成的二聚体,由于多重扩增体系中会使用数十种甚至上百种引物,相对反应模板浓度更高,引物之间形成的二聚体(引物的3’端间相互错配扩增形成的产物),会导致引物之间的PCR反应。2)引物脱靶产生非特异性PCR,在多重检测多个目标DNA序列的情况下,引物自身的降解所导致的脱靶结合容易与其他的引物形成PCR反应。3)高保真聚合酶引起的脱靶扩增,一般情况下,引物脱靶结合的DNA序列只要在3’端存在错配碱基,其扩增效率会显着下降。但是在应用高保真聚合酶的情况下,DNA聚合酶的3’-5’外切酶区域会对错配碱基进行剪切,令引物脱靶结合的DNA序列也能扩增,最终形成大量的脱靶产物。
PCR技术对于临床常规样本中片段化核酸分子的检测局限性,禁锢了以PCR扩增技术为核心的各类分子诊断技术在实际临床中的应用。因此针对临床最常见的片段化核酸分子开发一种全新核酸分子的扩增检测技术,已成为分子诊断突破现有瓶颈的最迫切需求。
发明内容
为克服现有技术存在的上述缺点,本发明的目的在于提供一种用单引物多重扩增技术在检测片段化稀有特征核酸分子中的应用及试剂盒/试剂。
本发明提出的单引物多重扩增技术在检测片段化稀有特征核酸分子中的应用,其中,所述单引物多重扩增技术包括以下步骤,(1)通过特异性引物线性扩增目标DNA,获得线性扩增产物;其中,所述特异性引物的3’末端核苷酸含有二象性功能基团;(2)将所获得的线性扩增产物进行接头连接,获得接头连接产物;其中,接头连接体系中包括单链连接酶和单链接头。
其中,所述片段化稀有特征核酸分子为与样本来源的物种/个体存在序列差异的外源DNA,包括但不限于如感染者样本中的病原体DNA,或是孕妇样本中的胎儿DNA。
本发明应用中,所述特异性引物的3’末端核苷酸含有二象性功能基团且部分核苷酸之间的磷脂键被硫代修饰。
其中,所述特异性引物的3’端至少部分的序列与所述片段化稀有特征核酸分子目标区域互补,与目标区域互补的序列的长度≥16nt;
和/或,所述特异性引物还包括第一通用序列、第一样本标签序列、第一测序序列中的一种或多种的组合。
本发明特异性引物的核苷酸序列包括如编号SEQ ID No.1-17所示序列之一种或多种的组合,为可用于线性扩增的特异性引物。
所述线性扩增过程中退火温度范围是60-75℃,优选的65-72℃。
在具体实施方案中,本发明应用中,对特征序列进行线性扩增1-100轮,进一步优选1-60轮,再优选20-40轮。对于每个特征序列,多重检测的引物数量可以是2-100个,进一步优选10-50个,最优选15-30个。所述片段化稀有特征核酸分子由包含特征序列的外源DNA分子片段化所形成;每个特征序列的长度>200bp以满足多重检测的要求,优选为>1000bp。片段化稀有特征核酸分子的拷贝数为<1000。
在具体实施方案中,本发明应用中,在设计多重引物时,任意一条特异性引物都应避免与整个引物组合中的任一特异性引物的线性扩增产物或其特异性引物本身在退火温度下结合(以避免形成PCR扩增,令线性扩增受到抑制),且还要考虑特异性引物之间的间隔,引物组合中任意一条特异性引物与其相邻特异性引物的间隔需大于50bp,以避免同一DNA分子同时被多个特异性引物进行线性扩增的情况,影响检测拷贝数的准确性。
在具体实施方案中,本发明应用中,在线性扩增和接头连接后,还需要进行预扩增和扩库步骤以构建完整的文库分子,用于测序。
本发明还包括单引物多重扩增技术在片段化稀有特征核酸分子目标区域测序中的应用,包括:通过上述所提供的文库产物进行测序,以提供片段化稀有特征核酸分子目标区域的测序结果。
本发明通过单引物多重扩增技术检测片段化稀有特征核酸分子的应用中,还包括基于生物信息学算法的特征序列识别方法。
本发明中基于生物信息学算法的特征序列识别方法,包括步骤:先对测序得到的reads(指测序结果的原始数据经碱基识别(Base Calling)转化成的序列数据)进行比对分析,得到各个reads对应的目标区域;再进行配对分析,以各个reads在特异性引物3’端延伸产生的连续X个碱基与参考基因组的对应目标区域的碱基完全匹配为过滤条件,剔除非特异的reads,得到过滤后的reads。其中可以有容错,即有1个碱基的不匹配;X可以是3至10的任一整数,优选的X是5,6,7,8;最后对过滤后的reads进行去重分析,得到去重后的reads。其中,去重分析是指将相同分子标签序列的类似reads进行归类,去除重复后得到扩库前文库分子的原始序列信息,用于去除扩库与测序步骤带来的碱基错误。去重分析并非必须的。
为了平衡片段化稀有特征核酸分子的检测灵敏度和特异性,要求reads的引物序列以及其后的数个碱基与参考基因组的对应序列完全匹配,不匹配的reads将被过滤掉。要求的引物序列后完全匹配的碱基个数可以按应用场景而定,要求检测灵敏度较高的场景可以要求较少完全匹配的碱基个数,要求检测特异性较高的场景可以要求较多完全匹配的碱基个数。
本发明还提供了一种试剂盒/试剂,用于片段化稀有特征核酸分子检测,其组成包括:3’末端核苷酸含有二象性功能基团的特异性引物。优选地,所述3’末端核苷酸含有二象性功能基团的特异性引物中,部分核苷酸之间的磷脂键被硫代修饰。
还包括:高保真DNA聚合酶、单链接头(包含分子标签)、单链连接酶。
本发明还提供了所述试剂盒/试剂在检测片段化稀有特征核酸分子中的应用,应用于高灵敏度检测片段化稀有特征核酸分子。本发明试剂盒/试剂还适用于上述的片段化稀有特征核酸分子目标区域的扩增方法。
本发明显著有益效果包括,通过在特异性引物中引入硫代修饰,有效降低了线性扩增过程中的非特异性扩增。本发明中线性扩增获得的扩增产物可以进一步用于构建文库,构建获得的文库数据质量能够符合要求。本发明还包括基于生物信息学算法的特征序列识别方法。
本发明解决了现有技术存在的远达不到单个分子的检测水平的问题,如实施例中,以所述单引物多重扩增技术检测血浆cfDNA(血浆cfDNA是片段化的DNA样本,研究指出其片段大小集中在166bp),结果可见单引物多重扩增技术的检测限在多重检测时(17个引物;特征序列长度>1kb)达0.1个拷贝,达到低于单个分子的水平。
本发明应用中单引物多重扩增技术,所述的单引物扩增是指由于每个靶点只以一个引物进行扩增,每一轮都以原始DNA为模板,所以扩增方式是线性的(线性扩增);而PCR每个靶点都以前、后引物成对进行扩增,每一轮的扩增产物都可以作为下一轮扩增的模板,所以扩增方式是指数扩增。使用单引物扩增靶向序列,最短检出长度低于30bp,已达到理论技术上的下限,彻底解决了短片段扩增的技术难题。且,使用多个引物对特征核酸分子断裂产生的不同片段化分子同时进行多重扩增检测,由于是一种基于线性扩增的技术,其对扩增反应中反应底物的消耗远低于PCR的指数扩增,单引物多重扩增技术可以保证几乎每个单引物都能对特征分子的扩增起到关键性的作用,因此增加单引物的数量可以成比例的提升检测灵敏度。
尽管理论上任何形式的多重检测都可以达到提高灵敏度的目的,只是由于引物偏好性的问题,令扩增效率低的引物被扩增效率高的引物抑制,导致灵敏度的提高不明显。本发明中单引物多重扩增技术的一系列特征主要改善的就是引物均一性的问题,令每个引物都能有效扩增,从而成比例的提高多重检测的灵敏度。而现有技术中的多重PCR的扩增性能几乎完全由扩增效率最高的1-2个扩增子决定,无法通过提高扩增子数量有效提高检测灵敏度。
附图说明
图1显示为本发明实施例1中以Panel 3(8个引物)进行检测,不同X参数下片段化稀有特征序列的检出值。
图2为本发明利用单引物多重扩增技术检测片段化稀有特征核酸分子的流程图。
具体实施方式
结合以下具体实施例和附图,对本发明作进一步的详细说明。实施本发明的过程、条件、实验方法等,除以下专门提及的内容之外,均为本领域的普遍知识和公知常识,本发明没有特别限制内容。以下进一步说明,但并不因此而限制本申请的范围。除非另外说明,本发明中所公开的实验方法、检测方法、制备方法均采用本技术领域常规的分子生物学、生物化学、染色质结构和分析、分析化学、细胞培养、重组DNA技术及相关领域的常规技术。这些技术在现有文献中已有完善说明,具体可参见Sambrook等MOLECULAR CLONING:ALABORATORY MANUAL,Second edition,Cold Spring Harbor Laboratory Press,1989andThird edition,2001;Ausubel等,CURRENT PROTOCOLS IN MOLECULAR BIOLOGY,JohnWiley&Sons,New York,1987and periodic updates;the series METHODS INENZYMOLOGY,Academic Press,San Diego;Wolffe,CHROMATIN STRUCTURE AND FUNCTION,Third edition,Academic Press,San Diego,1998;METHODS IN ENZYMOLOGY,Vol.304,Chromatin(P.M.Wassarman and A.P.Wolffe,eds.),Academic Press,San Diego,1999;和METHODS IN MOLECULAR BIOLOGY,Vol.119,Chromatin Protocols(P.B.Becker,ed.)Humana Press,Totowa,1999等。
本发明通过单引物多重扩增技术检测片段化稀有特征核酸分子的应用中,包括:通过特异性引物线性扩增包括目标区域的片段化DNA,以提供线性扩增产物,所述特异性引物的3’末端有二象性功能基团修饰,所述特异性引物的3’端部分核苷酸骨架的磷脂键被硫代修饰,所述的二象性功能基团用于阻止特异性引物的3’末端与其他寡聚核苷酸发生连接反应,同时能被特定的酶切除,以进行特异性引物的线性扩增反应。特异性引物中的核苷酸被硫代修饰具体指核苷酸骨架的磷脂键从双键O转换成了双键S,具体可以是如下结构式所示的结构变化。如上所述,在线性扩增的特异性引物中引入硫代修饰,可以有效提升质控文库分子的占比,显示可以显著地降低线性扩增过程中的非特异性扩增。
Figure BDA0002910560830000051
本发明应用中,上述线性扩增通常可以是多重线性扩增,扩增体系中通常可以包括多个靶向于不同目标区域的特异性引物,例如,所靶向的目标区域的数量≥2、2~3、3~4、4~5、5~6、6~8、8~10、10~15、15~20、或更多的目标区域数量。通常来说,特异性引物可以包括与片段化DNA的目标区域至少部分互补的序列,从而可以实现对片段化DNA的目标区域的特异性扩增,本领域技术人员可选择合适的片段化DNA的目标区域,并根据片段化DNA的目标区域,设计合适的互补的序列。例如,特异性引物与目标区域互补的序列的长度可以为≥16nt、16~45nt、16~20nt、20~25nt、25~30nt、30~35nt、35~40nt、或40~45nt。再例如,特异性引物还包括第一通用序列(例如,Illumina测序体系的SP1)和/或第一样本标签(例如,Illumina测序体系的i5)和/或第一测序序列(例如,Illumina测序体系的P5)等中的一种或多种的组合。
本发明应用中,合适的获取片段化DNA的方法对于本领域技术人员来说应该是已知的。例如,包括目标区域的片段化DNA通常可以源于基因组DNA。再例如,片段化DNA可以是由基因组DNA经(随机)打断(例如,超声打断和/或酶切打断)制备获得的。再例如,片段化DNA可以是游离DNA,其可以来源于体液,再例如,血液和/或尿液等。再例如,片段化DNA的结构可以为双链DNA、单链DNA和cDNA。对于线性扩增体系来说,片段化DNA通常需要具有合适的长度,例如,所述片段化DNA的长度可以为25~500bp/nt、25~30bp/nt、30~40bp/nt、40~50bp/nt、50~60bp/nt、60~80bp/nt、80~100bp/nt、100~150bp/nt、150~200bp/nt、200~300bp/nt、300~400bp/nt、或400~500bp/nt。
本发明应用中,线性扩增的扩增体系中通常可以包括上述的特异性引物、DNA聚合酶和dNTP。通过特异性引物线性扩增包括目标区域的片段化DNA的反应通常可以在DNA聚合酶和/或dNTP存在的条件下进行。所使用的DNA聚合酶通常可以具有3’-5’外切酶活性,从而可以切除结合模板后的引物3’末端的取代基团(例如,二象性功能基团),使引物被活化从而能够延伸,并可以在DNA扩增过程中切除碱基错配的核苷酸,从而确保扩增DNA的序列准确性。例如,所使用的DNA聚合酶可以是B族DNA聚合酶。dNTP(例如,dATP、dGTP、dTTP、dCTP等)是线性扩增中的必要组分,至少部分的dNTP可以是偶联标记分子的dNTP,所偶联的标记分子可以是生物素等,通过偶联标记分子可以对扩增产物进行纯化。
本发明应用中,多重线性扩增的特异性和/或均一度与引物上的硫代修饰的数量有关,当硫代修饰的数量过高或者过低时,都会导致线性扩增的特异性下降,而当硫代修饰的数量较高时,线性扩增会具有相对较好的均一度。通常来说,被硫代修饰的核苷酸的个数可以为1~11个、1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、或11个,优选可以为3~8个。对于被硫代修饰的核苷酸的分布位置来说,在特异性引物中,被硫代修饰的碱基通常可以是连续的(即硫代修饰的核苷酸的位置在引物上连续),也可以是不连续的,再或者,至少部分的被硫代修饰的核苷酸可以位于特异性引物的3’端,从而可以抑制引物与引物之间的相互作用。位于特异性引物的3’端的被硫代修饰的核苷酸的个数可以为1~11个、1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、或11个,优选可以为3~8个。
本发明应用中,特异性引物的3’末端的核苷酸的3位C原子羟基可以被二象性功能基团取代,以用于阻止特异性引物的3’末端与其他寡聚核苷酸发生连接反应,同时能被特定的酶切除,以进行特异性引物的线性扩增反应。本领域技术人员可选择合适的二象性功能基团以实现特异性引物3’末端的修饰,例如,所修饰的基团可以取代特异性引物3’末端核苷酸上的天然基团(例如,羟基等),以阻止所述特异性引物3’端发生连接反应。引物通过互补序列与模板上的目标区域结合形成双链结构后,引物3’端的二象性功能基团可以被酶切除,使得引物被活化,从而可以对目标序列进行有效延伸。例如,二象性功能基团可以是C3Spacer基团、Invert T基团、磷酸基团、生物素基团、C6Spacer基团、NH2-C6基团、SH-C6基团。再例如,二象性功能基团可以是核苷酸复合基团,核苷酸复合基团的化学结构式如下:
Figure BDA0002910560830000071
其中Base可以为腺嘌呤(A碱基)、鸟嘌呤(G碱基)、胞嘧啶(C碱基)、胸腺嘧啶(T碱基)或尿嘧啶(U碱基)中的任一碱基;
R1可以为羟基基团(-OH)、C3Spacer基团、Invert T基团、磷酸基团(-PO3)、生物素基团、C6Spacer基团、NH2-C6基团或SH-C6基团;
R2可以为氢原子(-H)、氟原子(-F)、羟基基团(-OH)或甲氧基基团(-OCH3)。
在本发明一具体实施例中,核苷酸复合基团可以是DL1~DL16,DL1~DL16所涉及的基团的具体组合如表1所示。
表1
Figure BDA0002910560830000072
Figure BDA0002910560830000081
*DL1与DL2的区别是DL1没有LNA修饰,DL2有LNA修饰。
在本发明一具体实施例中,二象性功能基团是C3Spacer基团时,可以形成如下所示的化学结构:
Figure BDA0002910560830000082
在本发明一具体实施例中,二象性功能基团是Invert T基团时,可以形成如下所示的化学结构:
Figure BDA0002910560830000083
在本发明一具体实施例中,二象性功能基团是磷酸基团时,可以形成如下所示的化学结构:
Figure BDA0002910560830000084
在本发明一具体实施例中,二象性功能基团是生物素基团时,可以形成如下所示的化学结构:
Figure BDA0002910560830000091
在本发明一具体实施例中,二象性功能基团是C6Spacer基团时,可以形成如下所示的化学结构:
Figure BDA0002910560830000092
在本发明一具体实施例中,二象性功能基团是NH2-C6基团时,可以形成如下所示的化学结构:
Figure BDA0002910560830000093
在本发明一具体实施例中,二象性功能基团是SH-C6基团时,可以形成如下所示的化学结构:
Figure BDA0002910560830000094
本发明应用中,还可以包括:纯化线性扩增产物。本领域技术人员可选择合适的方法对线性扩增产物进行纯化,例如,如上所述,至少部分的dNTP可以是偶联标记分子的dNTP,所偶联的标记分子可以是生物素等,具体的纯化方法可以是针对dNTP标记分子的亲和纯化等。
本发明单引物多重扩增技术在文库构建中的应用,包括:通过本发明提供的线性扩增产物构建文库。合适的通过上述线性扩增产物构建文库的方法对于本领域技术人员来说应该是已知的。例如,可以包括:连接接头、预扩增、扩库等步骤。
还包括:将所得的线性扩增产物连接单链接头,获得连接产物,所述单链接头包括第二测序序列(例如,Illumina测序体系的P7)和/或第二样本标签序列(例如,Illumina测序体系的i7)和/或第二通用序列(例如,Illumina测序体系的SP2)和/或分子标签序列(用于标记原始样本中的每个DNA分子的随机序列)。在获得针对目标区域的线性扩增产物以后,可以进一步在线性扩增产物上连接接头,以便于后续进行进一步的测序。
本发明中,本领域技术人员通常可以根据后续所需进行的测序方法,在线性扩增产物上连接合适的单链接头。例如,单链接头可以包括第二测序序列和/或第二样本标签序列和/或第二通用序列和/或分子标签序列。再例如,用于接头连接反应的单链连接酶可以为T4RNA连接酶或热稳定性RNA连接酶(虽然使用的是RNA酶,但是连接的是DNA分子)。再例如,单链接头的5’末端的核苷酸被修饰、且在接头连接的反应温度下为单链结构,具体来说,单链接头的5’末端的核苷酸的5位C原子连接有磷酸基团或腺苷基团。再例如,单链接头的3’末端的核苷酸的3位C原子羟基被封闭基团取代,具体来说,单链接头的3’末端的封闭基团选自Invert T基团、磷酸基团、生物素基团、C6Spacer基团、NH2-C6基团、SH-C6基团、C3Spacer基团,其所形成的化学基团可以参照上文所给出的化学结构。再例如,单链接头的5’端区域通常为具有黏性末端的部分双链结构。
本发明中,还可以包括:将连接产物进行预扩增,以提供预扩增产物。本领域技术人员通常可以根据后续所需进行的测序方法,选择合适的条件对连接产物进行预扩增,并纯化预扩增产物(例如,磁珠纯化等)。例如,预扩增的反应体系中可以包括预扩增引物、DNA聚合酶和dNTP,所述DNA聚合酶优选为B族DNA聚合酶,所述预扩增引物的前引物包括与第一测序序列互补的序列,和/或,所述预扩增引物的前引物还包括与第一通用序列互补的序列,和/或,所述预扩增引物的前引物还包括与第一样本标签序列互补的序列,所述预扩增引物的后引物包括与第二测序序列互补的序列。
本发明中,还可以包括:将预扩增产物进行扩库,以提供扩库产物。本领域技术人员通常可以根据后续所需进行的测序方法,选择合适的条件将预扩增产物进行扩库,并纯化扩库产物(例如,磁珠纯化等)。例如,扩库体系的反应体系中可以包括扩库引物、DNA聚合酶和dNTP,所述DNA聚合酶优选为B族DNA聚合酶,所述扩库引物的前引物包括与第一测序序列互补的序列,所述扩库引物的后引物包括与第二测序序列互补的序列。
本发明还提供单引物多重扩增技术在DNA目标区域测序方法中的应用,包括:通过所提供的文库,将扩库产物进行测序,以提供目标区域的测序结果。本领域技术人员通常可以根据后续所需进行的测序方法,选择合适的条件将扩库产物进行测序,例如,可以是各种二代测序技术。优选的,文库分子的结构如下:
Figure BDA0002910560830000111
其中,第一测序序列可以是Illumina测序体系的P5,第一/第二样本标签序列可以是Illumina测序体系的i5或i7,第一/第二通用序列可以是Illumina测序体系的SP1或SP2,第二测序序列可以是Illumina测序体系的P7。
本发明还提供一种基于单引物多重扩增技术的用于片段化稀有特征核酸分子检测的试剂盒和/或试剂,上述试剂盒和/或试剂适用本发明所提供的基于单引物多重扩增技术的DNA目标区域的扩增方法、或本发明文库构建方法、或本发明DNA目标区域的测序方法。上述试剂盒中,可以包括上述的各种特异性引物,特异性引物的3’端的部分核苷酸骨架的磷脂键可以被硫代修饰。上述试剂盒中,还可以包括DNA聚合酶、dNTP等线性扩增反应体系必要的组分。
本发明基于单引物多重扩增技术的片段化稀有特征核酸分子检测的方法及应用,通过在特异性引物中引入硫代修饰,有效降低了线性扩增过程中的非特异性扩增;且在特异性引物中引入二象性功能基团修饰,用于阻止特异性引物的3’末端与其他寡聚核苷酸发生连接反应,并在特异性引物结合模板后高效的被具有3’-5’外切酶活性的DNA聚合酶切除,以达到引物高效延伸的效果;且线性扩增获得的扩增产物可以进一步用于构建文库,构建获得的文库数据质量能够符合要求,具有良好的产业化前景。
实施例1:单引物多重扩增技术检测在提高片段化稀有特征核酸分子的检出灵敏度中的应用
通过使用不同引物数量(如1-20个)的特异性引物组合对含有片段化稀有特征核酸分子样本进行检测,其中模拟宿主的样本选用提取自女性血浆样本的cfDNA,对其分别掺入0.001%、0.003%、0.01%、0.03%和0.1%外源DNA,外源DNA提取自男性血浆的cfDNA。检测时每个样本量为60ng,约20000个拷贝的基因组分子,其中男性特征基因组(Y染色体)的拷贝分别为0.1个、0.3个、1个、3个和10个(Y染色体不是双倍体,只有一个,所以20000个女性拷贝掺入2个男性拷贝,实际上只掺入1个Y染色体,因此拷贝数=20000×掺入比÷2)。每个梯度的样本分别以1个、4个、8个和17个的特异性引物进行多重建库和测序。每个实验重复检测3次。
实验材料
1、检测样本
掺入0%、0.001%、0.003%、0.01%、0.03%和0.1%男性血浆cfDNA的女性血浆cfDNA样本。cfDNA样本都通过qubit定量。每个样本的总质量为60ng,约20000个人类基因组拷贝。
2、特异性引物序列详见表2,供应商均为上海生工。
表2
编号 引物名称 序列
SEQ ID No.1 AMEL_i01-1 TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGCCCAGAGTTCTAAGGGGTCCAACAACTCAGG
SEQ ID No.2 AMEL_i02-1 TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGACAGAGCCCAGGGGACTGCTAATGC
SEQ ID No.3 AZF_i02-1 TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGTGGAGTTTCCTAGGTTCAGAACAAAGAGTTCAG
SEQ ID No.4 AZF_i08-1 TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGAACAGGCTTAAATGCCTTAAGAAGCAACAC
SEQ ID No.5 AZF_i09-1 TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGCCTTAGAGAGGTAGTCACTATATGCTACACAGTG
SEQ ID No.6 CTS2657_s01-1 TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGCAATGGAAAAGCTGTATGAAATCCTCGG
SEQ ID No.7 CTS4658_s01-1 TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGGCAGGCTGACACCCACTACTTTC
SEQ ID No.8 F17_s01-1 TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGTGTTCAAATGCTAGGTGCTCTAAGCACTTATGTAG
SEQ ID No.9 F3373_s01-1 TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGTCTGGTTATGTAAGGGGCGGATCTTGAG
SEQ ID No.10 F42_s01-1 TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGCAAGAGTGGATAGCAGCTGGATTCACAG
SEQ ID No.11 F46_s01-1 TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGCCAATAAGGATTCACTCTCAGGAGCCAGGTATTAG
SEQ ID No.12 F492_s01-1 TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGCTCCCAAGTTTGCTATCCCAAAGTTAGTGATC
SEQ ID No.13 L467_s01-1 TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGTCCTCATCCATTTAAAGGCCAATGGTGTTTCAG
SEQ ID No.14 M145_s01-1 TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGCTCCCACTCCTTTTTGGATCATGGTTCTTGATTAG
SEQ ID No.15 P201_s01-1 TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGTGATGTGCTGTGCAAGTTGTGTGATCTTG
SEQ ID No.16 P4979_s01-1 TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGACTCTTGTGCTAGTGGGGTTTGAACAAC
SEQ ID No.17 ZFY_i01-1 TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGCTCCGCAGCCGCTCAGGGCAACTGG
其中panel 1包括SEQ ID No.4号引物,panel 2包括SEQ ID No.4、6、8和9号引物,panel 3包括SEQ ID No.4、6、8、9、12、13、15和16号引物,panel 4包括SEQ ID No.1-17号引物。引物浓度为80nM。所有的3’末端引物都有T核苷酸-NH2-C6二象性功能基团修饰,如DL1基团,而且在3’端的末尾3个核苷酸的磷脂键都有硫代修饰。粗体的序列表示第一通用序列,非粗体的序列表示与目标区域互补的序列。
3、单链接头与预扩增引物
表3
Figure BDA0002910560830000121
Figure BDA0002910560830000131
单链接头的5’末端核苷酸的5位C原子连接有磷酸基团,而3’末端核苷酸有C3Spacer基团修饰。单链接头中粗体的序列表示分子标签序列,底横线的序列表示第二通用序列,非粗体/非底横线/非斜体的序列表示第二样本标签序列,斜体的序列表示第二测序序列。预扩增引物中粗体的序列表示第一测序序列,非粗体/非底横线的序列表示第一样本标签序列,底横线的序列表示与第一通用序列互补的序列。
表4各实验对应的单链接头与预扩增引物
实验序号 样本 单链接头 预扩增引物
1 0拷贝-Test 1 UA4 i1
2 0拷贝-Test 2 UA4 i2
3 0拷贝-Test 3 UA4 i3
4 0.1拷贝-Test 1 UA4 i4
5 0.1拷贝-Test 2 UA4 i5
6 0.1拷贝-Test 3 UA4 i6
7 0.3拷贝-Test 1 UA5 i1
8 0.3拷贝-Test 2 UA5 i2
9 0.3拷贝-Test 3 UA5 i3
10 1拷贝-Test 1 UA5 i4
11 1拷贝-Test 2 UA5 i5
12 1拷贝-Test 3 UA5 i6
13 3拷贝-Test 1 UA6 i1
14 3拷贝-Test 2 UA6 i2
15 3拷贝-Test 3 UA6 i3
16 10拷贝-Test 1 UA6 i4
17 10拷贝-Test 2 UA6 i5
18 10拷贝-Test 3 UA6 i6
*不同引物组合(Panel 1-4)分别上机测序,所用的混样体系相同。
4、其他引物和探针
表5
寡核苷酸名称 供应商 序列
P5-AMP 生工生物工程(上海)股份有限公司 AATGATACGGCGACCACCGAGATCTACAC
F4-SP1 生工生物工程(上海)股份有限公司 TCGTCGGCAGCGTCAGATG
P7-AMP 上海百力格生物科技有限公司 CAAGCAGAAGACGGCATACGAGAT
MGB-iSP2-1 上海百力格生物科技有限公司 TCTCGTGGGCTCGGAGA
*P5-AMP是用于扩库的引物,与第一测序序列互补;F4-SP1和P7-AMP是qPCR法体系中用到的引物,其中F4-SP1是与第一通用序列互补的引物,P7-AMP是与第二测序序列互补的引物;而MGB-iSP2-1是qPCR体系中用到的探针,与第二通用序列互补。
5其他试剂
表6
试剂名称 厂家
APO-Enchanted DNA聚合酶I 上海羿鸣生物科技有限公司
5×Apo Buffer 上海羿鸣生物科技有限公司
APO biotin-dNTP mix 1 上海羿鸣生物科技有限公司
Blocking Reagent 上海羿鸣生物科技有限公司
链霉亲和素磁珠 上海羿鸣生物科技有限公司
Buffer A 上海羿鸣生物科技有限公司
Buffer B 上海羿鸣生物科技有限公司
Buffer C 上海羿鸣生物科技有限公司
Buffer D 上海羿鸣生物科技有限公司
ssDNA ligase 上海羿鸣生物科技有限公司
10×ligase buffer 上海羿鸣生物科技有限公司
MnCl<sub>2</sub> 上海羿鸣生物科技有限公司
5×SLA Buffer 上海羿鸣生物科技有限公司
SLA高保真DNA聚合酶 上海羿鸣生物科技有限公司
dNTP(10mM) 上海羿鸣生物科技有限公司
NA-Beads 上海羿鸣生物科技有限公司
Buffer E 上海羿鸣生物科技有限公司
Buffer F 上海羿鸣生物科技有限公司
Realtime PCR Master Mix TOYOBO
Qubit dsDNA HS Assay kit Invitrogen
QC校准品 上海羿鸣生物科技有限公司
*APO-Enchanted DNA聚合酶I是一种具有3’-5’外切酶活性的DNA聚合酶,5×ApoBuffer是线性扩增体系的缓冲液,APO biotin-dNTP mix 1是部分偶联有生物素的dNTP混合液,Blocking Reagent是用于封闭链霉亲和素磁珠的试剂,链霉亲和素磁珠是用于纯化线性扩增产物的磁珠,Buffer A-D分别是用于纯化线性扩增产物的结合缓冲液、洗涤缓冲液1、洗涤缓冲液2和洗脱缓冲液,ssDNA ligase是一种单链连接酶,10×ligase buffer是接头连接体系的缓冲液,MnCl2是接头连接体系的组分,5×SLA Buffer是用于预扩增或扩库的缓冲液,SLA高保真DNA聚合酶是用于预扩增或扩库的DNA聚合酶,dNTP Mix是用于预扩增或扩库的dNTP混合液,NA-Beads是用于纯化预扩增产物或扩库产物的磁珠,Buffer E和F分别是用于预扩增产物或扩库产物的结合缓冲液和洗脱缓冲液,Realtime PCR MasterMix是用于qPCR的混合液,Qubit dsDNA HS Assay kit是用于样本定量的试剂盒,QC校准品是用于质控的样本。
6实验设备
表7
仪器名称 厂家
Veriti 96Well Thermal Cycler l Thermo
离心机 Eppendorf
掌上离心机 其林贝尔
磁力架12孔/96孔 Thermo
7300plus Real-time PCR system Thermo
纯水仪 PALL
实验步骤
1、线性扩增
1.1线性扩增体系配制
表8
组份 体积(μL)
5×Apo Buffer 4
APO biotin-dNTP mix 1 0.8
Apo-Enchanted DNA聚合酶I 0.2
Mix溶液总量 5
引物组合 1
样本 1.5(30ng)
12.5
总量 20
1)按照上表先将5×Apo Buffer、APO biotin-dNTP mix 1和Apo-Enchanted DNA聚合酶I配制成Mix溶液
2)后续加入引物组合和样本,加水使每个样本的反应体积为20μL。
3)开启线性扩增程序。
1.2线性扩增条件设置
表9
Figure BDA0002910560830000161
1.3磁珠法纯化线性扩增产物。
2、接头连接反应
2.1接头连接体系配制
表10
组分 体积(μL)
10×ligase buffer 2.5
MnCl<sub>2</sub> 0.63
ssDNA ligase 0.63
混合液总量 3.75
单链接头 1.25
纯化后的线性扩增产物 20
总量 25
接头连接体系的单链接头(样本标签序列因样本而不同)单独加,根据样本数,配制好除单链接头之外的相应反应体系混合液,根据建库样本信息表(4)在相应的反应孔中加入含对应样本标签序列的单链接头。
2.2接头连接程序
表11
循环数 温度(℃) 时间(分钟)
1(热盖105℃) 60 60
1(热盖105℃) 90 3
1 8 /
3、预扩增反应
3.1预扩增反应体系的配制:
表12
Figure BDA0002910560830000162
Figure BDA0002910560830000171
3.1.1预扩增体系的前引物(样本标签序列因样本而不同)单独加,根据样本数,在1.5mL离心管内配制好除前引物之外的相应反应体系混合液,然后分装到8连管中,根据建库样本信息表(表4)在相应的反应孔中加入含对应样本标签序列的前引物。
3.1.2在对应的反应孔中加入24μL连接产物。后放到PCR仪中反应。
3.2预扩增反应体程序
表13
Figure BDA0002910560830000172
3.3磁珠法纯化预扩增产物。
4、扩库
4.1扩库反应体系的配制:
4.1.1按照下表配制相应的反应混合液。分装到8联管内。
表14
组份 浓度 体积(μL) 终浓度
ddH2O 2 /
5×SLA Buffer 6
dNTP Mix (10mM each) 0.6 200μM
P5-AMP 10μM 0.6 200nM
P7-AMP 10μM 0.6 200nM
SLA高保真DNA聚合酶 (2U/μL) 0.15 0.011U/μL
总量 10
混合液置于4℃ 10μL/孔
纯化后的预扩增产物 20
总量 30
4.1.2往扩库反应管内加入相应的纯化后的预扩增产物。快速离心10秒,放到PCR仪中反应。
4.2扩库反应程序:
表15
Figure BDA0002910560830000181
4.3扩库后磁珠法纯化。
按照如下体系配置文库总量检测体系,用于上机测序前的文库混样评估:
表16
组份 体积(μL) 终浓度
ddH2O 6.6 /
2×Realtime PCR Master Mix 10
F4-SP1(10μM) 0.6 300nM
P7-AMP(10μM) 0.6 300nM
MGB-iSP2-1(10μM) 0.2 100nM
纯化后的扩库产物/QC校准品 2 /
总量 20
检测程序:
表17
Figure BDA0002910560830000182
5、文库测序
采用Illumina的NovaSeq6000平台对文库进行150bp双端测序。通过生信分析计算所得的片段化稀有特征序列检出率。
实验结果
以X=6进行生信分析的片段化稀有特征序列检出值(结果以去重后的reads数表示,panel中的任一引物检测到片段化稀有特征序列即为检出):
表18
Figure BDA0002910560830000183
由表18可知,多重检测的特异性引物数量(如2-100个)愈多,片段化稀有特征序列的检出值愈高。
图1是以Panel 3(8个引物)进行检测,不同X参数下片段化稀有特征序列的检出值。由图1可知,不同X参数的设定对片段化稀有特征序列的检出值(即图1中纵轴显示的Specific reads)有一定的影响。当X=4时,掺入0%男性DNA的样本同样检出少量的特征序列,提示特异性较差;当X=5,6或8时,掺入0%男性DNA的样本检出值为0,提示特异性较高,同时可见增加X对灵敏度的影响不大(X=5时,可检出掺入0.1%男性DNA的样本;X=6/8时,还是可以检出掺入0.3%男性DNA的样本),提示X=5,6或8时的检测性能更好。
实施例2:硫代的数量对多重线性扩增建库的影响
通过硫代数量不同的硫代引物分别进行多重线性扩增,对人血浆cfDNA样本进行建库,比较硫代数量不同的硫代引物的建库成功率和特异性,筛选适合用于高特异性靶向建库的硫代引物。
实验材料
1、检测样本
样本为人血浆cfDNA样本。
样本使用Qubit定量后,将样本定浓度为20ng/μL。重复检测6次。
2、引物序列详见表19,供应商均为上海生工。
表19
Figure BDA0002910560830000191
*panel 3、panel 4、panel 5、panel 6、panel 7和panel 8所使用的引物以及其序列完全相同,只是panel 4的引物没有硫代修饰,而panel 3、panel 5、panel 6、panel 7和panel8的引物在3’端的末尾分别有3个、1个、5个、8个和12个核苷酸骨架的磷脂键都有硫代修饰。粗体的序列表示第一通用序列,非粗体的序列表示与目标区域互补的序列。所有引物都有DL1基团修饰。
3、单链接头与预扩增引物。
单链接头与预扩增引物都为前述的UA4/UA5和i3/i4(单链接头根据表25加入)。
4、其他引物和探针
表20
引物和探针名称 供应商 序列
SP-EGFR21-1 生工生物工程(上海)股份有限 TACTGGTGAAAACACCGCA
R-EGFR21 上海百力格生物科技有限公司 TTCCGCACCCAGCAGTTT
MGB-EGFR21 上海百力格生物科技有限公司 TGTCAAGATCACAGATTTTGGGC
*SP-EGFR21-1和R-EGFR21是qPCR法体系中用到的引物,其中SP-EGFR21-1是与EGFR第21外显子序列互补的引物,R-EGFR21是与EGFR第21外显子序列互补的引物;而MGB-EGFR21是qPCR体系中用到的探针,与EGFR第21外显子序列互补。
实验步骤
其余实验材料和步骤与实施例1完全相同,另外加有如下步骤:
1.在线性扩增前,按照如下体系配置qPCR检测体系,定量初始质控分子数,检测程序与表17相同。
表21
组份 体积 终浓度
ddH2O 6.6 /
2×Realtime PCR Master Mix 10
R-EGFR21(10μM) 0.6 300nM
SP-EGFR21-1(10μM) 0.6 300nM
MGB-EGFR21(10μM) 0.2 100nM
片段化DNA样本/QC校准品 2 /
总量 20
2.在接头连接后,取2μL连接产物,加入18μL TE缓冲液,稀释10倍,用于检测建库效率。建库效率使用qPCR法定量。
按照如下体系配置qPCR检测体系,定量质控文库分子数量,检测程序与表17相同:
表22
Figure BDA0002910560830000201
Figure BDA0002910560830000211
实验结果
1、不同引物组合线性扩增建库后的文库质控结果(初始质控分子数是以表21的qPCR体系检测得出的分子数,即初始投入的DNA量;质控文库分子数量是以表22的qPCR体系检测得出的分子数;总文库分子数量是以表16的qPCR体系检测得出的分子数;文库质控分子占比=质控文库分子数量/总文库分子数量x100%):
表23
Figure BDA0002910560830000212
Figure BDA0002910560830000221
由上表数据可知,多重线性扩增的性能与引物上的硫代修饰的数量有关,当硫代修饰的数量在3-8时(panel 3、6、7),文库的特异性较好,文库的转化率也较高,质控文库分子的占比高,符合预期;当硫代修饰的数量小于3(panel 4、5)或大于8(panel 8)时,文库的特异性较差;当硫代修饰的数量达到12(panel 8)时,文库的转化率也显着降低。
2、扩库后的总文库分子定量(连接后文库分子数量=总文库分子数量;扩库后文库分子总数是以表16的qPCR体系检测得出的扩库后的分子数;扩库倍数=扩库后文库分子总数/总文库分子数量x100%;样本拷贝数/μL=扩库后文库分子总数/20;上样拷贝数是扩库后的理论DNA投入量;上样体积μL=上样拷贝数/样本拷贝数/μL):
表24
Figure BDA0002910560830000222
Figure BDA0002910560830000231
由上表数据可知,所有文库的扩库效率符合预期。
3下机数据产量和质量:
表25
Figure BDA0002910560830000232
Figure BDA0002910560830000241
由上表数据可知,所有文库的测序数据质量符合要求。
4、不同引物线性扩增建库得到的reads与占比
4.1、不同引物线性扩增建库得到的reads数,结果如表26所示。
表26
Figure BDA0002910560830000242
Figure BDA0002910560830000251
4.2、不同引物线性扩增建库得到的reads占比,结果如表27所示。reads占比通过各引物的reads数÷Total reads数×100%计算所得。
表27
Figure BDA0002910560830000252
Figure BDA0002910560830000261
由表27~表28可知,随着硫代修饰个数的增多,体系扩增的均一度会有提升。当硫代数量达到3个以上时,多重线性扩增体系具有较好的均一度,出现非特异PCR扩增的几率大幅降低,从无硫代修饰的67%,降到了0%。
5、不同引物线性扩增文库分子的特异性占比,结果如表28所示。特异性占比通过各引物的ontarget reads数÷各引物的reads数×100%计算所得。
表28
Figure BDA0002910560830000262
Figure BDA0002910560830000271
由表28可知,多重线性扩增的特异性与引物上的硫代修饰的数量有关,当硫代修饰的数量在3-8时,文库的特异性较好,当硫代修饰的数量小于3或大于8时,文库的特异性较差。
实施例3:不同的引物二象性功能基团对线性扩增建库特异性的影响
通过有不同二象性功能基团修饰的硫代引物分别进行线性扩增,对人血浆cfDNA样本进行建库,比较有不同二象性功能基团修饰的硫代引物的建库特异性,筛选适合用于高特异性靶向建库的硫代引物。
实验材料
1、检测样本
样本为人血浆cfDNA样本。
样本通过qPCR定量,cfDNA定量体系和qPCR程序如之前实施例2中的表21和实施例1的表17所示。
2、引物序列(供应商均为上海生工)。
实施例4所用到的特异性引物(P01-P34)序列都与实施例2中的EGFR_i21-2N序列完全相同,只是做了不一样的修饰,具体修饰如下所述:P01和P02引物未有二象性功能基团修饰,且3’端末尾的硫代修饰个数分别为0个和3个;P03、P04和P05引物的二象性功能基团为NH2-C6基团,且3’端末尾的硫代修饰个数分别为0个、5个和3个;P06、P07和P08引物的二象性功能基团为DL1,且3’端末尾的硫代修饰个数分别为0个、3个和5个;P09引物的二象性功能基团为DL2(LNA修饰),且3’端末尾的硫代修饰个数为3个;P10-P23的3’端末尾的硫代修饰个数都为3个,而P10的二象性功能基团为DL3、P11的二象性功能基团为DL4、P12的二象性功能基团为DL5、P13的二象性功能基团为C6Spacer、P14的二象性功能基团为DL6、P15的二象性功能基团为Invert T、P16的二象性功能基团为DL7、P17的二象性功能基团为磷酸基团、P18的二象性功能基团为DL8、P19的二象性功能基团为C3Spacer、P20的二象性功能基团为DL9、P21的二象性功能基团为SH-C6、P22的二象性功能基团为DL10;P23和P24引物的二象性功能基团为DL11,且3’端末尾的硫代修饰个数分别为3个和0个;P25和P26引物的二象性功能基团为DL12,且3’端末尾的硫代修饰个数分别为3个和0个;P27和P28引物的二象性功能基团为DL13,且3’端末尾的硫代修饰个数分别为3个和0个;P29和P30引物的二象性功能基团为DL14,且3’端末尾的硫代修饰个数分别为3个和0个;P31和P32引物的二象性功能基团为DL15,且3’端末尾的硫代修饰个数分别为3个和0个;P33和P34引物的二象性功能基团为DL16,且3’端末尾的硫代修饰个数分别为3个和0个。
3、单链接头与预扩增引物都为前述的UA4和i3。
其余实验材料与实验设备均与实施例2相同,各实验步骤也基本参照实施例2的第1-3部分。样本DNA投入分子数是以表21的qPCR体系检测得出的分子数,即初始投入的DNA量。另外补充步骤如下:
在步骤1线性扩增后检测扩增效率。取2μL线性扩增产物,加入18μL TE缓冲液稀释10倍后,使用qPCR检测体系对线性扩增产物定量。线性扩增倍数=线性扩增产物分子数/样本DNA投入分子数。*线性扩增产物分子数是以表21的qPCR体系检测得出的分子数。
在步骤2纯化线性扩增产物后检测纯化效率。取2μL纯化后的线性扩增产物,加入18μL TE缓冲液稀释10倍后,使用qPCR检测体系对纯化后的线性扩增产物定量。纯化后线性扩增倍数=纯化后的线性扩增产物分子数/样本DNA投入分子数。纯化效率=纯化后的线性扩增产物分子数/线性扩增产物分子数。*纯化后的线性扩增产物分子数是以表21的qPCR体系检测得出的分子数。
实验结果具体如下表所示,其中:
连接效率=特异性文库分子数/纯化后的线性扩增产物分子数
特异性文库分子转化率=特异性文库分子数/样本DNA投入分子数
特异性文库分子占比=特异性文库分子数/文库分子总分子数
*特异性文库分子数是以表22的qPCR体系检测得出的分子数。*文库分子总分子数是以表16的qPCR体系检测得出的分子数。
表29
Figure BDA0002910560830000291
Figure BDA0002910560830000301
从上表可见,对比没有二象性功能基团修饰的P01和P02,采用其他有二象性功能基团修饰的引物进行线性扩增的连接效率、特异性文库分子转化率和特异性文库分子占比要明显更高。
综上所述,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。
序列表
<110> 上海羿鸣生物科技有限公司
<120> 单引物多重扩增技术在检测片段化稀有特征核酸分子中的应用及试剂盒
<160> 38
<170> SIPOSequenceListing 1.0
<210> 1
<211> 64
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
tcgtcggcag cgtcagatgt gtataagaga cagcccagag ttctaagggg tccaacaact 60
cagg 64
<210> 2
<211> 64
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
tcgtcggcag cgtcagatgt gtataagaga cagcccagag ttctaagggg tccaacaact 60
cagg 64
<210> 3
<211> 66
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
tcgtcggcag cgtcagatgt gtataagaga cagtggagtt tcctaggttc agaacaaaga 60
gttcag 66
<210> 4
<211> 63
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
tcgtcggcag cgtcagatgt gtataagaga cagaacaggc ttaaatgcct taagaagcaa 60
cac 63
<210> 5
<211> 67
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
tcgtcggcag cgtcagatgt gtataagaga cagccttaga gaggtagtca ctatatgcta 60
cacagtg 67
<210> 6
<211> 61
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
tcgtcggcag cgtcagatgt gtataagaga cagcaatgga aaagctgtat gaaatcctcg 60
g 61
<210> 7
<211> 56
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
tcgtcggcag cgtcagatgt gtataagaga caggcaggct gacacccact actttc 56
<210> 8
<211> 68
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
tcgtcggcag cgtcagatgt gtataagaga cagtgttcaa atgctaggtg ctctaagcac 60
ttatgtag 68
<210> 9
<211> 61
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
tcgtcggcag cgtcagatgt gtataagaga cagtctggtt atgtaagggg cggatcttga 60
g 61
<210> 10
<211> 61
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
tcgtcggcag cgtcagatgt gtataagaga cagcaagagt ggatagcagc tggattcaca 60
g 61
<210> 11
<211> 68
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
tcgtcggcag cgtcagatgt gtataagaga cagccaataa ggattcactc tcaggagcca 60
ggtattag 68
<210> 12
<211> 65
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
tcgtcggcag cgtcagatgt gtataagaga cagctcccaa gtttgctatc ccaaagttag 60
tgatc 65
<210> 13
<211> 66
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
tcgtcggcag cgtcagatgt gtataagaga cagtcctcat ccatttaaag gccaatggtg 60
tttcag 66
<210> 14
<211> 68
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
tcgtcggcag cgtcagatgt gtataagaga cagctcccac tcctttttgg atcatggttc 60
ttgattag 68
<210> 15
<211> 62
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
tcgtcggcag cgtcagatgt gtataagaga cagtgatgtg ctgtgcaagt tgtgtgatct 60
tg 62
<210> 16
<211> 61
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
tcgtcggcag cgtcagatgt gtataagaga cagactcttg tgctagtggg gtttgaacaa 60
c 61
<210> 17
<211> 58
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
tcgtcggcag cgtcagatgt gtataagaga cagctccgca gccgctcagg gcaactgg 58
<210> 18
<211> 66
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
ctgtctctta tacacatctc cgagcccacg agacggaatc tcatctcgta tgccgtcttc 60
tgcttg 66
<210> 19
<211> 66
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
ctgtctctta tacacatctc cgagcccacg agacttctga atatctcgta tgccgtcttc 60
tgcttg 66
<210> 20
<211> 66
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
ctgtctctta tacacatctc cgagcccacg agacacgaat tcatctcgta tgccgtcttc 60
tgcttg 66
<210> 21
<211> 56
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
aatgatacgg cgaccaccga gatctacaca ggctatatcg tcggcagcgt cagatg 56
<210> 22
<211> 56
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
aatgatacgg cgaccaccga gatctacacg cctctattcg tcggcagcgt cagatg 56
<210> 23
<211> 56
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
aatgatacgg cgaccaccga gatctacaca ggataggtcg tcggcagcgt cagatg 56
<210> 24
<211> 56
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
aatgatacgg cgaccaccga gatctacact tatgcgatcg tcggcagcgt cagatg 56
<210> 25
<211> 56
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
aatgatacgg cgaccaccga gatctacacc ttcgccttcg tcggcagcgt cagatg 56
<210> 26
<211> 56
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
aatgatacgg cgaccaccga gatctacact aagattatcg tcggcagcgt cagatg 56
<210> 27
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
aatgatacgg cgaccaccga gatctacac 29
<210> 28
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
tcgtcggcag cgtcagatg 19
<210> 29
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
caagcagaag acggcatacg agat 24
<210> 30
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
tctcgtgggc tcggaga 17
<210> 31
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
tcgtcggcag cgtcagatgt gtataagaga cagcctgatc agccaggagg atacacacg 59
<210> 32
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
tcgtcggcag cgtcagatgt gtataagaga cagtgccaag ccacagagtt ggagaagag 59
<210> 33
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
tcgtcggcag cgtcagatgt gtataagaga cagcaagtat aaccccacgt gaacgag 57
<210> 34
<211> 63
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 34
tcgtcggcag cgtcagatgt gtataagaga cagcctggca gccaggaacg tactggtgaa 60
aac 63
<210> 35
<211> 62
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 35
tcgtcggcag cgtcagatgt gtataagaga cagagtcttc cagtgtgatg atggtgagga 60
tg 62
<210> 36
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
tactggtgaa aacaccgca 19
<210> 37
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
ttccgcaccc agcagttt 18
<210> 38
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
tgtcaagatc acagattttg ggc 23

Claims (12)

1.一种单引物多重扩增技术在检测片段化稀有特征核酸分子中的应用,其特征在于,
所述单引物多重扩增技术包括以下步骤:(1)通过特异性引物线性扩增目标DNA,获得线性扩增产物;其中,所述特异性引物的3’末端核苷酸含有二象性功能基团;(2)将所获得的线性扩增产物进行接头连接,获得接头连接产物,其中,接头连接体系中包括单链连接酶和单链接头;
所述片段化稀有特征核酸分子为与样本来源的物种/个体存在序列差异的外源DNA分子。
2.如权利要求1所述的应用,其特征在于,还包括将所述连接产物进行预扩增、扩库、测序的步骤;
其中,所述预扩增的步骤为:将所述连接产物进行预扩增,以提供预扩增产物,所述的预扩增引物的前引物包括与第一通用序列互补的序列、与第一样本标签序列互补的序列、与第一测序序列互补的序列中的一种或多种的组合,所述的预扩增引物的后引物包括与第二测序序列互补的序列;
所述扩库的步骤为:将所述预扩增产物进行扩库,以提供文库产物,所述的扩库引物的前引物包括与第一测序序列互补的序列,所述的扩库引物的后引物包括与第二测序序列互补的序列;
所述测序的步骤为:通过对所述文库产物进行测序,以提供片段化稀有特征核酸分子目标区域的测序结果。
3.如权利要求1所述的应用,其特征在于,所述特异性引物的3’末端核苷酸含有二象性功能基团;所述特异性引物的3’末端的核苷酸的3位C原子羟基被二象性功能基团取代,所述特异性引物的3’末端的二象性功能基团选自C3Spacer基团、Invert T基团、磷酸基团、生物素基团、C6 Spacer基团、NH2-C6基团、SH-C6基团;
和/或,所述特异性引物的3’末端的二象性功能基团为核苷酸复合基团,核苷酸复合基团的结构如下:
Figure FDA0002910560820000011
其中,Base选自A碱基、G碱基、C碱基、T碱基或U碱基;
R1选自羟基基团、C3Spacer基团、Invert T基团、磷酸基团、生物素基团、C6 Spacer基团、NH2-C6基团或SH-C6基团;
R2选自氢原子、氟原子、羟基基团、或甲氧基基团。
4.如权利要求1所述的应用,其特征在于,所述特异性引物的3’端部分核苷酸之间的磷脂键被硫代修饰;所述特异性引物中,被硫代修饰的核苷酸的个数为1~11个,优选为3~8个;
和/或,所述特异性引物中,被硫代修饰的核苷酸为连续的;
和/或,所述特异性引物中,位于特异性引物的3’端的被硫代修饰的核苷酸的个数为1-11个,优选为3-8个。
5.如权利要求1所述的应用,其特征在于,
和/或,所述特异性引物的3’端至少部分的序列与所述片段化稀有特征核酸分子目标区域互补,与目标区域互补的序列的长度≥16nt;
和/或,所述特异性引物还包括第一通用序列、第一样本标签序列、第一测序序列中的一种或多种的组合;
和/或,所述特异性引物包括SEQ ID No.X001-SEQ ID No.X0017所示序列之一种或多种组合;
和/或,所述线性扩增的扩增体系中包括特异性引物、DNA聚合酶和dNTP,优选的,所述DNA聚合酶具有3’-5’外切酶活性,更优选的,所述DNA聚合酶选自B族DNA聚合酶;
和/或,在设计多重引物时,任意一条特异性引物都应避免与整个引物组合中的任一特异性引物的线性扩增产物或其特异性引物本身在退火温度下结合,且还要考虑特异性引物之间的间隔,引物组合中任意一条特异性引物与其相邻特异性引物的间隔需大于50bp,以避免同一DNA分子同时被多个特异性引物进行线性扩增的情况,影响检测拷贝数的准确性。
6.如权利要求1所述的应用,其特征在于,所述线性扩增包括多重线性扩增,所述多重线性扩增中,所靶向的片段化稀有特征核酸分子目标区域的数量≥2;
和/或,所述片段化稀有特征核酸分子的拷贝数为<1000;
和/或,所述片段化稀有特征核酸分子由包含特征序列的外源DNA分子片段化所形成;每个特征序列的长度>200bp,优选为>1000bp;
和/或,所述片段化稀有特征核酸分子的长度为25~500bp/nt,优选为50~200bp/nt;
和/或,所述片段化稀有特征核酸分子的结构为双链DNA、单链DNA或cDNA;
和/或,所述片段化稀有特征核酸分子为游离DNA;
和/或,所述片段化稀有特征核酸分子来源于体液,优选来源于血液和/或尿液;
和/或,所述片段化稀有特征核酸分子由基因组DNA经打断制备获得,优选为超声打断和/或酶切打断。
7.如权利要求1所述的应用,其特征在于,所述单链接头包括第二测序序列、第二样本标签序列、第二通用序列、分子标签序列中的一种或多种的组合;
其中,所述单链连接酶为T4RNA连接酶或热稳定性RNA连接酶;
和/或,所述单链接头的5’末端的核苷酸被修饰、且在接头连接的反应温度下为单链结构,优选的,单链接头的5’末端的核苷酸的5位C原子连接有磷酸基团或腺苷基团;
和/或,所述单链接头的3’末端的核苷酸的3位C原子羟基被封闭基团取代,优选的,所述单链接头的3’末端的封闭基团选自Invert T基团、磷酸基团、生物素基团、C6 Spacer基团、NH2-C6基团、SH-C6基团、C3 Spacer基团;
和/或,所述单链接头的5’端区域为具有黏性末端的部分双链结构。
8.如权利要求1所述的应用,其特征在于,还包括基于生物信息学算法的特征序列识别步骤,所述步骤为:先对测序得到的reads进行比对分析,得到各个reads对应的片段化稀有特征DNA分子目标区域;再进行配对分析,以各个reads在特异性引物3’端延伸产生的连续X个碱基与参考基因组的对应目标区域的碱基完全匹配为过滤条件,剔除非特异的reads,得到过滤后的reads;其中,可以有容错,即有1个碱基的不匹配;X可以是3至10的任一整数,优选的X是5,6,7,8。
9.一种片段化稀有特征核酸分子检测试剂盒/试剂,其特征在于,所述试剂/试剂盒包括:3’末端核苷酸含有二象性功能基团的特异性引物,且部分核苷酸之间的磷脂键被硫代修饰、高保真DNA聚合酶、包含分子标签的单链接头、以及单链连接酶。
10.如权利要求9所述的试剂盒/试剂在检测片段化稀有特征核酸分子中的应用。
11.一种特异性引物,其特征在于,所述特异性引物为SEQ ID No.1-SEQ ID No.17所示序列之一种或多种组合。
12.如权利要求11所述的特异性引物在单引物多重扩增技术用于检测片段化稀有特征核酸分子中的应用。
CN202110085321.6A 2021-01-22 2021-01-22 单引物多重扩增技术在检测片段化稀有特征核酸分子中的应用及试剂盒 Pending CN114807300A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110085321.6A CN114807300A (zh) 2021-01-22 2021-01-22 单引物多重扩增技术在检测片段化稀有特征核酸分子中的应用及试剂盒

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110085321.6A CN114807300A (zh) 2021-01-22 2021-01-22 单引物多重扩增技术在检测片段化稀有特征核酸分子中的应用及试剂盒

Publications (1)

Publication Number Publication Date
CN114807300A true CN114807300A (zh) 2022-07-29

Family

ID=82524914

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110085321.6A Pending CN114807300A (zh) 2021-01-22 2021-01-22 单引物多重扩增技术在检测片段化稀有特征核酸分子中的应用及试剂盒

Country Status (1)

Country Link
CN (1) CN114807300A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115948388A (zh) * 2022-12-30 2023-04-11 纳昂达(南京)生物科技有限公司 特异性捕获引物、靶向捕获探针组合物、靶向捕获文库的构建方法及应用
CN116200478A (zh) * 2023-03-07 2023-06-02 安徽安龙基因科技有限公司 一种基于单链连接的捕获建库方法和应用

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115948388A (zh) * 2022-12-30 2023-04-11 纳昂达(南京)生物科技有限公司 特异性捕获引物、靶向捕获探针组合物、靶向捕获文库的构建方法及应用
CN116200478A (zh) * 2023-03-07 2023-06-02 安徽安龙基因科技有限公司 一种基于单链连接的捕获建库方法和应用

Similar Documents

Publication Publication Date Title
US11072819B2 (en) Methods of constructing small RNA libraries and their use for expression profiling of target RNAs
US9745614B2 (en) Reduced representation bisulfite sequencing with diversity adaptors
CN110699426B (zh) 基因目标区域富集方法及试剂盒
KR102592367B1 (ko) 게놈 및 치료학적 적용을 위한 핵산 분자의 클론 복제 및 증폭을 위한 시스템 및 방법
JP7001678B2 (ja) Ngsライブラリー濃度の正規化
EP3702457A1 (en) Reagents, kits and methods for molecular barcoding
JP2020536525A (ja) プローブ及びこれをハイスループットシーケンシングに適用するターゲット領域の濃縮方法
CN112410331A (zh) 带分子标签和样本标签的接头及其单链建库方法
CN114807300A (zh) 单引物多重扩增技术在检测片段化稀有特征核酸分子中的应用及试剂盒
CN110699425B (zh) 基因目标区域的富集方法及体系
CN111801427A (zh) 用于单分子的单链环状dna模板的产生
WO2022156823A1 (zh) 一种优化的dna线性扩增方法及试剂盒
CN112680796A (zh) 一种靶标基因富集建库方法
US20180100180A1 (en) Methods of single dna/rna molecule counting
CN114807324A (zh) 单引物扩增建库技术在检测片段化稀有dna分子突变中的应用及试剂盒
CN111315895A (zh) 用于产生环状单链dna文库的新型方法
WO2018081666A1 (en) Methods of single dna/rna molecule counting
JP2023519979A (ja) ゲノム内の構造再編成の検出方法
CN114807325A (zh) 单引物扩增建库技术在检测片段化dna分子断点信息中的应用及试剂盒
CN114774522A (zh) 一种高保真测序文库构建的方法、试剂盒及应用
WO2023201487A1 (zh) 接头、接头连接试剂及试剂盒和文库构建方法
US20240124930A1 (en) Diagnostic and/or Sequencing Method and Kit
WO2024036445A1 (zh) 一种测序文库的制备方法及用于制备测序文库的试剂盒
CN117965709A (zh) 用于单端多重扩增检测基因突变频率的接头及使用方法
CN117626451A (zh) 一种高效rna多重靶向建库方法及试剂盒

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20220921

Address after: Room 411-20, Building 2, No. 8, Jinfeng Road, High-tech Zone, Suzhou City, Jiangsu Province, 215163

Applicant after: Yiming (Suzhou) Diagnostic Technology Co.,Ltd.

Address before: 201318 Room 201, building 10, No. 1-28, Lane 588, Tianxiong Road, Pudong New Area, Shanghai

Applicant before: Shanghai Yiming Biotechnology Co.,Ltd.

TA01 Transfer of patent application right