CN112041462A - 具有极低的错误水平的dsDNA有效测序 - Google Patents

具有极低的错误水平的dsDNA有效测序 Download PDF

Info

Publication number
CN112041462A
CN112041462A CN201980028668.8A CN201980028668A CN112041462A CN 112041462 A CN112041462 A CN 112041462A CN 201980028668 A CN201980028668 A CN 201980028668A CN 112041462 A CN112041462 A CN 112041462A
Authority
CN
China
Prior art keywords
hairpin
sequencing
adaptor
adaptors
zipper
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980028668.8A
Other languages
English (en)
Inventor
Z·奥特维诺夫斯基
D·博雷克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Texas System
Texas State University
Original Assignee
Texas State University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Texas State University filed Critical Texas State University
Publication of CN112041462A publication Critical patent/CN112041462A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1003Extracting or separating nucleic acids from biological samples, e.g. pure separation or isolation methods; Conditions, buffers or apparatuses therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/12Type of nucleic acid catalytic nucleic acids, e.g. ribozymes
    • C12N2310/122Hairpin

Abstract

DNA通过以下测序:a)在以下条件下将dsDNA片段与Y‑衔接子和包含亲和标记的发夹衔接子组合,其中所述衔接子连接到片段,形成侧接两个Y‑衔接子、侧接Y‑衔接子和发夹衔接子以及侧接两个发夹衔接子的片段插入物的混合物;和b)用选择用于所述Y‑衔接子的测序引物对选择的片段插入物进行测序。

Description

具有极低的错误水平的dsDNA有效测序
简介
本发明是Hairpin-seq—一种在合成测序中实现非常低的错误水平(每1,000,000个位置<1个错误)的高效方法。该方法依赖于每个dsDNA分子的两条链上的错误的独立性,其与由测序衔接子的新设计—亲和标记的发夹Y衔接子—引起的高信噪比读出结合。该高效方法可用于准确测量低水平的体细胞突变。高于背景水平的体细胞突变水平可以是癌症发展或癌症遗传易感性的标志,或是暴露于诱变剂的标志。我们的方法可以用作临床诊断测试的基础,如检测癌症的早期标志,监测癌症进展或治疗以及辅助癌症治疗,还可以在工业中评估各种物质、方法和医疗程序的诱变潜力和安全性。
相关文献包括我们小组在UT(Twin-Seq:WO2013/181170)的方法,以及小组在:UW(WO2013142389,US20150044687,US9752189)、Twinstrand Biosciences(WO2017100441)和在Guardan(WO2015100427)的方法。
发明概述
本发明提供了用于核酸的下一代测序(NGS)的方法和组合物。我们通俗地将主题方法的一些实施方案称为“Hairpin-Seq”。
一方面,本发明提供了一种用于DNA测序的方法,其包括:(a)在以下条件下将dsDNA片段与Y-衔接子和包含亲和标记的发夹衔接子组合,其中所述衔接子连接到片段,形成侧接两个Y-衔接子的片段插入物(YY)、侧接Y-衔接子和发夹衔接子的片段插入物(发夹)和侧接两个发夹衔接子的片段插入物(哑铃)的混合物;(b)用选择用于所述Y-衔接子的测序引物对片段插入物进行测序。
在实施方案中:
-所述测序是双端或长读测序;双端测序的另一种供选择的方案是通读,但效率较低,因为读取时间越长,读取质量越低;
-所述混合物包含大约相等的Y-衔接子和发夹衔接子,其中所述混合物中所得的连接产物为约1:2:1,并且所述方法还包括在测序步骤之前选择或富集标记的片段插入物。
-所述混合物包含与Y-衔接子相比,足以避免在测序步骤之前对选择步骤的需要的过量的发夹衔接子;例如,在比例为9:1(发夹与Y-衔接子)的情况下,则81%的反应应为哑铃,18%将为感兴趣的产物(发夹),1%将为YY。尽管效率较低,但在当DNA的量不是限制的情况下改变比例是有效的,因为它允许跳过选择步骤;当然,比例可以改变,9:1仅是实例;
-调节Y-衔接子长度以增加或减少聚合酶克隆(polony)密度。待测序的连接构建体(发夹)将在流动池上形成聚合酶克隆,这些聚合酶克隆的大小取决于Y-衔接子的单链部分的长度。通过调节Y-衔接子中此片段的长度,可以更有效地将聚合酶克隆包裹在流动池上。该实施方案特别适用于流动池,其中发夹中的Y-衔接子必须杂交的寡核苷酸之间的间隔将大于当前的标准长度构建体所允许的。
标准流动池被共价连接到流动池的寡核苷酸/引物密集覆盖。测序文库以DNA的单链片段的形式施加到流动池,该DNA的单链片段在两侧均具有合适的测序衔接子(与附着至流动池的寡核苷酸的嫁接序列互补)。ssDNA链与流动池衔接子杂交,并成为用聚合酶合成的模板。合成后,形成dsDNA分子,但只有一条ssDNA链与流动池共价连接。合成完成后,使dsDNA分子变性,并洗掉原始链(因为它未连接)。它的拷贝保留在流动池上,并且可以到达相邻的引物并与它们杂交,形成所谓的桥,并用作下一步合成的模板。重复该过程,直到一种类型的~1000条链形成。此时,桥被线性化并且一种类型的链(反向)被去除。流动池上的衔接子和线性化链的末端均被封闭。然后,从杂交到封闭的3'末端附近的引物开始对读取1测序。在第一次读取的测序结束后,对第二次读取重复类似的方法(桥式扩增)。
在这种情况下,聚合酶克隆大小与插入物的长度相关,即更长的插入物可以进一步延伸入流动池衔接子。由于距杂交起始位点的距离较大,所以聚合酶克隆变得更大,因此插入物(在我们的情况下为发夹构建体的dsDNA部分)越长,聚合酶克隆大小就越大。对于非常长的插入物,不得不在桥式扩增中降低测序构建体的浓度,以防止不同的聚合酶克隆由于其大小增加以及形状失真增加而彼此混合。
早期的商业流动池(例如Illumina)使用非模式化的表面,其具有显著过量的、非常紧密地附着的流动池衔接子,并且这种设计难以在不损害测序过程的情况下改变流动池引物的密度。然而,对于较新的模式化池,例如US20120316086,可以将模式设计为使得发夹构建体不会有效地形成聚合酶克隆,因为它太短。我们的解决方案是在我们的方法中延伸发夹衔接子——用生物素标记的发夹衔接子。延伸既可以通过延伸该衔接子的茎,也可以通过延伸其中的内环(bubble)来完成。
-所述dsDNA片段包含平末端,所述平末端任选地通过添加单碱基,例如通过dA或dT加尾进行修饰;
-所述dsDNA片段包含非平末端,所述非平末端任选地通过消化和部分补平(fill-in)而产生;
-步骤(b)还包括通过亲和杂交对发夹进行亲和富集并去除未杂交的哑铃;
-还包括用选择用于所述Y-衔接子的引物扩增富集或选择的片段,任选地引入索引衔接子,以及任选地进行另外的选择,例如使用基因特异性探针;通常使用对靶标DNA的亲和力比对其自身互补链更高的探针进行这种另外的选择;例如,可以使用锁核酸或其他修饰的碱基,与天然双链体的解链温度相比,其增加杂交后形成的“新”双链体的解链温度;
-所述Y-衔接子包含促进所述Y-衔接子的茎上的错配的碱基,例如氧代-G或通用碱基,如5-硝基吲哚和肌苷,所述错配足以弱化所述发夹的拉链闭合并通过测序引物促进退火过程(access),从而提供测序步骤,其中发夹通过聚合酶克隆扩增后的内环延伸;
-步骤(c)包括使用由延伸超过所述发夹茎的串联重复序列提供的诱饵(decoy)来产生另一个与所述拉链的形成竞争的靶标,优选地,其中所述诱饵与发夹的与测序引物相互作用的部分互补,确保发夹不能有效地闭合,例如其中诱饵被设计用于与测序引物的减弱的杂交;延伸到所述测序引物的区域外部;和/或它们可以是不完美的串联重复序列,如在具有互补性的13bp区域,通常为13bp区域具有不完美的碱基配对,例如使用G-T碱基配对;和/或
-其中步骤(c)包括在所述发夹的茎的外部部分或完全杂交所述测序引物,其中将测序引物配置为完全/大部分在发夹外部杂交是简单的,以一些额外的仅化学循环的适度成本来检查连接反应所需的茎。
本发明包括所叙述的具体实施方案的所有组合,就如同每个组合已经被详尽地叙述。
附图简述
图1:Hairpin-Seq的示意图。
图2:拉链闭合问题的示意图。
图3:荧光信号强度对不同类型的发夹的依赖性。
具体实施方案详述
本发明包括所叙述的特定实施方案的所有组合,就如同每个组合已经被详尽地叙述。
通过对以发夹形式制备的DNA进行测序,Hairpin-Seq获得了有效且可靠的结果。我们使用标准方法,例如超声处理将DNA片段化,用绿豆核酸酶酶促地将其平末端化,以避免相关错误,然后与两种衔接子的等摩尔混合物进行连接:修饰的Y-衔接子和被标记的发夹衔接子,例如用生物素标记的发夹衔接子。连接产生具有两个Y-衔接子、发夹和哑铃的插入物的混合物。双Y-衔接子不含生物素,而哑铃则不与连接到流动池的寡核苷酸杂交。从测序的角度来看,哑铃只是惰性材料。在选择含有至少一个用生物素标记的衔接子的构建体后,我们通过qPCR定量Y-衔接子,其中哑铃也是惰性的。与标准方法的理论效率相比,得到的文库制备的效率约为50%,远远高于无PCR方法所需的效率,并且消除PCR扩增还可以减少测序错误。
通过几种措施,我们的方法提供改善的效率:
(a)多少测序的dsDNA文库对应于有效的Twin-seq/Hairpin-seq对?对于Twin-seq,我们仅达到30%的效率,而UW方法学的效率降低了一个数量级。使用Hairpin-seq,我们可以在对我们的1:1的衔接子比例没有任何选择下实现66%的效率(原始反应的25%在测序中是惰性的)。然而,通过改变发夹与Y-衔接子的比例,我们可以进一步提高该效率,例如9:1的发夹与Y-衔接子将为我们提供81%的哑铃、18%的发夹和1%的YY构建体。仅发夹和YY会被测序,因此我们会具有接近90%的效率。此外,如果在两种情况下(1:1和9:1)都与选择相结合,效率应接近100%,因为我们将仅选择Y-发夹和哑铃构建体。这种效率使该方法在实验意义上切实可行。
(b)由于在UW和Twin-seq方法以及其他版本的数字测序中对克隆扩增的需求而损失了多少有效测序。这种效率—确定我们必须克隆扩增多少个dsDNA片段的拷贝由统计推理驱动。dsDNA片段的两条链在UW方法、Twin-seq和其他类似方法中在测序过程中分离;因此,每条链需要具有6-10个克隆拷贝,以确保它们属于同一克隆簇。这意味着效率仅为10-15%,因为我们对10-15%的独特dsDNA,而不是100%的独特dsDNA进行测序。85-90%代表10-15%的拷贝。在这里,因为我们有两个ssDNA拷贝一起进入测序,所以我们的效率提高到50%。如果使用选择,则此水平不受效率(a)影响。
(c)有多少dsDNA材料由于未连接或由于形成非有效构建体而未进入测序?这种效率的衡量—多少材料会导致不会用hairpin-seq测序的无效构建体。在YY和发夹衔接子的比例为1:1的情况下,只有50%的材料将形成侧接Y和发夹衔接子的构建体,25%的构建体将具有YY衔接子,而YY和发夹衔接子的比例为1:9时,只有18%将形成感兴趣的构建体。虽然我们会丢失最初的材料,但这种效率不是问题,因为DNA的量很少是限制。我们的hairpinseq提高了将dsDNA转化为提供关于互补链信息的有效构建体的效率,并降低对克隆扩增的需求。将(a)和(b)的效率增益结合,我们的方法的效率比现有方法高一到两个数量级。
Hairpin-seq的独特之处在于,它总是在双端测序中从原始DNA读取两条链。此外,由于读取长度短于发夹的茎,在一起观察相应位置的效率为100%(图2)。
图1是Hairpin-seq的示意图。Y-衔接子被修饰(在此),但为简单起见,未示出修饰。
图2是拉链闭合问题的示意图。将测序引物退火至流动池上的ssDNA片段需要将发夹解开拉链。但是,在测序的标准条件下,拉链闭合在动力学上将优于测序引物的退火。为了解决这个问题,我们引入通用碱基或在桥式扩增或PCR扩增之前有效促进供选择的配对的碱基,以获得具有较低的形成延伸到测序衔接子退火的标准序列之外的拉链的倾向的区域。如果使用PCR,我们在PCR扩增之前引入它们,而PCR扩增产生变异性,因此,如果是无PCR,那么我们会在桥式扩增之前引入它们。通用碱基在连接衔接子中引入,紧接在测序衔接子退火的标准序列之后。测序引物退火后,可在没有拉链闭合问题下进行链置换聚合酶。左下图显示引入通用碱基5-硝基吲哚和肌苷,使得削弱拉链闭合的效果;右下图显示,在桥式扩增后,形成发夹的序列将具有碱基段,该碱基段不会形成双链体或将具有较弱的碱基配对相互作用,例如G与T的相互作用或其他非标准配对,这将有助于退火测序引物;即结果可以用非标准碱基配对或用标准碱基实现。
Hairpin-seq如此具有创造性的核心原因之一来自分析正常文库制备中零星连接的假象,这导致与我们在Hairpin-seq中使用的发夹相同类型的发夹。这种发夹的测序质量远低于其他读取,因此即使像Hairpin-seq这样的提议也似乎在技术上无人问津。已报道,有时在测序过程中由反向的基因组重复序列形成的非人工发夹的发夹读取质量较低。但是,我们的仅通过检查荧光强度才有可能得到的详细分析表明,由反向重复序列形成的发夹和我们在此使用的那些发夹的测序质量问题是由两种不同的机制导致的。由反向重复序列形成的发夹具有良好的总荧光强度,但是与它们相关的读出质量有时受相位影响。另一方面,Hairpin-seq结构从读取的开始平均具有非常低的荧光强度,最常见的是比非发夹读取弱5至10倍(图3)。
图3显示荧光信号的强度对不同类型的发夹的依赖性。蓝色区域显示在数据分析中使用了多少个发夹碱基。棕色区域显示GC含量绘制为随荧光信号强度变化的函数。橙色区域显示串联重复序列的存在与荧光的增加如何相关,这表明荧光信号强度取决于测序引物的初始杂交。橙色表示发夹测序读取的分数,其中已检测到串联重复序列。具有串联重复序列的读取的分数随荧光信号的增加而增加。具有弱荧光信号的发夹茎比具有中等水平荧光信号的发夹茎含有更多的GC。这表明测序引物的弱杂交有助于荧光损失。由于这些GC含量比例的计数统计很高,因此这些差异是显著的。
这些发夹的许多特征指出,由于发夹的拉链闭合作用超过了测序引物的杂交,在测序过程中DNA合成的启动效率低下(图2)。图3呈现的相关性证实这种机制;较强的拉链(具有较高的GC含量)竞争性更好,而由延伸超过发夹茎的串联重复序列提供的诱饵的存在产生另一个与拉链的形成竞争的杂交靶标,从而增加测序引物的杂交。因此,在实施方案中,我们修饰Y-衔接子和/或测序引物,从而通过降低构建体的拉链闭合倾向来增加杂交频率,这使荧光信号改善到与非发夹读取一致相似的水平。Illumina测序允许添加定制测序引物,这被认为是标准特征—例如,当使用混合在一起的不同类型的定制设计的文库时。在实施方案中,我们重新配置Y-衔接子和一种或两种测序引物。一个实施方案在发夹的茎的外部杂交测序引物。这强加了浪费最初的13个测序循环的成本。可以使用所谓的“暗循环”执行这些循环,在没有读出步骤下施加化学物质。这提高了速度,但不降低测序成本。供选择地,可以利用在连接和测序起始的实验条件下发夹稳定性的差异,例如由于在这些步骤中使用的温度的差异而引起的发夹稳定性的差异。连接需要dsDNA底物;然而,它很好地接受前四个近端碱基外碱基配对的变化,甚至在这四个碱基对茎内也可以接受修饰的碱基。在实施方案中,我们采用通用碱基,如5-硝基吲哚和肌苷,并将它们在Y-衔接子的茎处引入。它们形成适合连接的dsDNA,但是在流动池上,当通过桥式扩增形成聚合酶克隆时,复制聚合酶将引入错配,这降低拉链闭合的倾向。为了另外弱化拉链,我们可以在Y-衔接子的双链部分中引入非标准配对,例如G-T,并相应地修饰测序引物。
实施例
Hairpin-Seq可以转化NGS方法,使得产生的结果足够可靠以允许用于分析亚克隆突变,而不在测序成本和样品数量方面牺牲效率。
我们的Hairpin-seq方法在可靠性和效率方面可以比其他方法1-7,包括双重测序3好一个或多个数量级。接近每十亿个碱基对一个错误的可靠性与高效的测序结合无疑会被测序领域的研究人员认为是一项重大技术进步,特别是当他们认为我们计划依靠主流硬件来实现这一目标时。具体的应用包括使用NGS作为工具的领域,但受到当前测序方法的技术限制阻碍。我们的方法可以对许多主题进行广泛的研究,例如:(1)通过提供关于亚克隆突变、错配修复和DNA断裂修复的作用以及在癌症治疗中的突变体表型的数据,研究癌症的体细胞进化;(2)通过提供关于突变率和光谱如何取决于年龄和环境因素的数据,研究衰老;(3)环境危害、医源性程序、食品补充剂和其他来源的诱变潜力,其可以导致新型的流行病学研究。这将指导广泛的预防策略,由于缺乏可靠的数据,这些策略现在经常是有争议的,并且可能具有高的成本和不确定的益处。
Hairpin-seq结合了几种创新想法。在Hairpin-seq的实验部分,关于DNA片段的两条互补链的序列的冗余信息是通过在测序文库制备过程中产生的发夹茎的双端测序来修正的。这种方法导致修正冗余互补序列的效率为100%,这使生产率比已发表的结果3中报道的高约50倍。但是,由于发夹干扰Illumina的测序质量的误解,因此容易不予考虑在测序中使用发夹的想法,因为它们的存在与低质量结果相关8-10。我们更详细的分析考虑了测序中使用的聚合酶的链置换特性11,揭示比发夹更复杂的结构受聚合酶延伸影响,而对于发夹而言,测序衔接子的杂交是主要问题。在本申请中,我们提供了杂交问题的解决方案,使得我们可以充分利用来自发夹构建体中存在的独立信息的获益。
参考文献
[1]Kinde,I.,Wu,J.,Papadopoulos,N.,Kinzler,K.W.和Vogelstein,B.(2011)Detection and quantification of rare mutations with massively parallelsequencing,Proceedings of the National Academy of Sciences of the UnitedStates of America 108,9530-9535.
[2]Kennedy,S.R.,Salk,J.J.,Schmitt,M.W.和Loeb,L.A.(2013)Ultra-Sensitive Sequencing Reveals an Age-Related Increase in Somatic MitochondrialMutations That Are Inconsistent with Oxidative Damage,PLoS genetics 9,e1003794.
[3]Schmitt,M.W.,Kennedy,S.R.,Salk,J.J.,Fox,E.J.,Hiatt,J.B.和Loeb,L.A.(2012)Detection of ultra-rare mutations by next-generation sequencing,Proceedings of the National Academy of Sciences of the United States ofAmerica 109,14508-14513.
[4]Wang,J.,Fan,H.C.,Behr,B.和Quake,S.R.(2012)Genome-wide single-cellanalysis of recombination activity and de novo mutation rates in human sperm,Cell 150,402-412.
[5]Gundry,M.,Li,W.,Maqbool,S.B.和Vijg,J.(2011)Direct,genome-wideassessment of DNA mutations in single cells,Nucleic Acids Res.
[6]Zong,C.,Lu,S.,Chapman,A.R.和Xie,X.S.(2012)Genome-wide detection ofsingle-nucleotide and copy-number variations of a single human cell,Science338,1622-1626.
[7]Lu,S.,Zong,C.,Fan,W.,Yang,M.,Li,J.,Chapman,A.R.,Zhu,P.,Hu,X.,Xu,L.,Yan,L.,Bai,F.,Qiao,J.,Tang,F.,Li,R.和Xie,X.S.(2012)Probing meioticrecombination and aneuploidy of single sperm cells by whole-genomesequencing,Science 338,1627-1630.
[8]Meyer,M.和Kircher,M.(2010)Illumina sequencing library preparationfor highly multiplexed target capture and sequencing,Cold Spring Harborprotocols 2010,pdb prot5448.
[9]Aird,D.,Ross,M.G.,Chen,W.S.,Danielsson,M.,Fennell,T.,Russ,C.,Jaffe,D.B.,Nusbaum,C.和Gnirke,A.(2011)Analyzing and minimizing PCRamplification bias in Illumina sequencing libraries,Genome biology 12,R18.
[10]Nakamura,K.,Oshima,T.,Morimoto,T.,Ikeda,S.,Yoshikawa,H.,Shiwa,Y.,Ishikawa,S.,Linak,M.C.,Hirai,A.,Takahashi,H.,Altaf-Ul-Amin,M.,Ogasawara,N.和Kanaya,S.(2011)Sequence-specific error profile of Illumina sequencers,NucleicAcids Res 39,e90.
[11]5747298,U.S.p.(2011)Bst DNA polymerase with proof-reading 3'-5'exonuclease activity.
应当理解,本文描述的实例和实施方案仅用于说明目的,并且本领域技术人员将会联想到鉴于其的各种修改或改变,并且所述修改或改变被包括在本申请的精神和范围以及所附权利要求的范围之内。本文引用的所有出版物、专利和专利申请,包括其中的引文,出于所有目的通过引用整体并入本文。

Claims (15)

1.一种用于DNA测序的方法,其包括:
a)在以下条件下将dsDNA片段与Y-衔接子和包含亲和标记的发夹衔接子组合,其中所述衔接子连接到片段,形成侧接两个Y-衔接子的片段插入物(YY)、侧接Y-衔接子和发夹衔接子的片段插入物(发夹)和侧接两个发夹衔接子的片段插入物(哑铃)的混合物;
b)用选择用于所述Y-衔接子的测序引物对选择的片段插入物进行测序。
2.权利要求1所述的方法,其中所述测序是双端或长读测序。
3.权利要求1或2所述的方法,其中所述混合物包含大约相等的Y-衔接子和发夹衔接子,其中所述混合物中所得的连接产物为约1:2:1,并且所述方法还包括在测序步骤之前选择或富集标记的片段插入物。
4.权利要求1、2或3所述的方法,其中所述混合物包含与Y-衔接子相比,足以避免在测序步骤之前对选择步骤的需要的过量的发夹衔接子其。
5.权利要求1、2、3或4所述的方法,其中所述dsDNA片段包含平末端,所述平末端任选地通过添加单碱基,例如通过dA或dT加尾进行修饰。
6.权利要求1、2、3、4或5所述的方法,其中所述dsDNA片段包含非平末端,所述非平末端任选地通过消化和部分补平(fill-in)而产生。
7.权利要求1、2、3、4、5或6所述的方法,其中步骤(b)还包括通过亲和杂交对发夹进行亲和富集并去除未杂交的哑铃。
8.权利要求1、2、3、4、5、6或7所述的方法,其还包括用选择用于所述Y-衔接子的引物扩增富集或选择的片段,任选地引入索引衔接子,以及任选地进行另外的选择,例如使用基因特异性探针进行另外的选择。
9.权利要求1、2、3、4、5、6、7或8所述的方法,其中所述Y-衔接子包含促进所述Y-衔接子的茎上的错配的碱基,所述错配足以弱化所述发夹的拉链闭合并通过测序引物促进退火过程(access),其中所述促进错配的碱基是氧代-G或通用碱基,如5-硝基吲哚和肌苷。
10.权利要求1、2、3、4、5、6、7、8或9所述的方法,其中所述Y-衔接子包含通用碱基或在桥式扩增或PCR扩增之前有效促进供选择的配对的碱基,以获得具有较低的形成延伸到测序衔接子退火的标准序列之外的拉链的倾向的区域。
11.权利要求1、2、3、4、5、6、7、8、9或10所述的方法,其中步骤(b)包括使用由延伸超过所述发夹茎的串联重复序列提供的诱饵来产生另一个与所述拉链的形成竞争的靶标。
12.权利要求1、2、3、4、5、6、7、8、9、10或11所述的方法,其中步骤(b)包括使用由延伸超过所述发夹茎的串联重复序列提供的诱饵来产生另一个与所述拉链的形成竞争的靶标,其中所述诱饵与所述发夹中与所述测序引物相互作用的部分互补,以确保所述发夹不能有效闭合。
13.权利要求1、2、3、4、5、6、7、8、9、10、11或12所述的方法,其中步骤(b)包括使用由延伸超过所述发夹茎的串联重复序列提供的诱饵来产生另一个与所述拉链的形成竞争的靶标,其中所述诱饵提供与所述测序引物的减弱的杂交,并且延伸到所述测序引物的区域外部。
14.权利要求1、2、3、4、5、6、7、8、9、10、11、12或13所述的方法,其中步骤(b)包括使用由延伸超过所述发夹茎的串联重复序列提供的诱饵来产生另一个与所述拉链的形成竞争的靶标,其中所述诱饵是不完美的串联重复序列,如在具有互补性的13bp区域,通常为13bp区域具有不完美的碱基配对,例如使用G-T碱基配对。
15.权利要求1、2、3、4、5、6、7、8、9、10、11、12、13或14所述的方法,其中步骤(c)包括在所述发夹的茎的外部部分或完全杂交所述测序引物。
CN201980028668.8A 2018-03-23 2019-03-25 具有极低的错误水平的dsDNA有效测序 Pending CN112041462A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862647623P 2018-03-23 2018-03-23
US62/647,623 2018-03-23
PCT/US2019/023931 WO2019183640A1 (en) 2018-03-23 2019-03-25 Efficient sequencing of dsdna with extremely low level of errors

Publications (1)

Publication Number Publication Date
CN112041462A true CN112041462A (zh) 2020-12-04

Family

ID=67988063

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980028668.8A Pending CN112041462A (zh) 2018-03-23 2019-03-25 具有极低的错误水平的dsDNA有效测序

Country Status (4)

Country Link
US (1) US11697837B2 (zh)
EP (1) EP3768853A4 (zh)
CN (1) CN112041462A (zh)
WO (1) WO2019183640A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109072294A (zh) 2015-12-08 2018-12-21 特温斯特兰德生物科学有限公司 用于双重测序的改良衔接子、方法和组合物
AU2018366213A1 (en) 2017-11-08 2020-05-14 Twinstrand Biosciences, Inc. Reagents and adapters for nucleic acid sequencing and methods for making such reagents and adapters
US20210269873A1 (en) 2018-07-12 2021-09-02 Twinstrand Biosciences, Inc. Methods and reagents for characterizing genomic editing, clonal expansion, and associated applications
US11920190B2 (en) 2019-12-30 2024-03-05 Industrial Technology Research Institute Method of amplifying and determining target nucleotide sequence
US11359238B2 (en) 2020-03-06 2022-06-14 Singular Genomics Systems, Inc. Linked paired strand sequencing
WO2023034920A2 (en) 2021-09-03 2023-03-09 Singular Genomics Systems, Inc. Amplification oligonucleotides

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6287825B1 (en) * 1998-09-18 2001-09-11 Molecular Staging Inc. Methods for reducing the complexity of DNA sequences
CN103774242A (zh) * 2012-10-19 2014-05-07 安捷伦科技有限公司 通过侵入性切割添加衔接子
WO2014071070A1 (en) * 2012-11-01 2014-05-08 Pacific Biosciences Of California, Inc. Compositions and methods for selection of nucleic acids
US20140221217A1 (en) * 2011-07-08 2014-08-07 Keygene N.V. Sequence based genotyping based on oligonucleotide ligation assays
AU2015202111A1 (en) * 2008-03-28 2015-05-14 Pacific Biosciences Of California, Inc. Compositions and methods for nucleic acid sequencing
WO2016093838A1 (en) * 2014-12-11 2016-06-16 New England Biolabs, Inc. Enrichment of target sequences
US20170002404A1 (en) * 2014-01-07 2017-01-05 Fundacio Privada Institut De Medicina Predictiva I Personalitzada Del Cancer Method for generating double stranded dna libraries and sequencing methods for the identification of methylated cytosines
US20170088887A1 (en) * 2014-03-03 2017-03-30 Swift Biosciences, Inc. Enhanced Adaptor Ligation
US20170211140A1 (en) * 2015-12-08 2017-07-27 Twinstrand Biosciences, Inc. Adapters, methods, and compositions for duplex sequencing
WO2017129647A1 (en) * 2016-01-29 2017-08-03 F. Hoffmann-La Roche Ag A novel adaptor for nucleic acid sequencing and method of use
WO2017202389A1 (zh) * 2016-05-27 2017-11-30 深圳市海普洛斯生物科技有限公司 一种适用于超微量dna测序的接头及其应用

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1123328A (zh) 1994-11-17 1996-05-29 中国科学院上海生物化学研究所 高温、高传真脱氧核糖核酸(DNA)聚合酶(HiFi Bst)
CA2991818C (en) 2008-03-28 2022-10-11 Pacific Biosciences Of California, Inc. Compositions and methods for nucleic acid sequencing
US20120244525A1 (en) * 2010-07-19 2012-09-27 New England Biolabs, Inc. Oligonucleotide Adapters: Compositions and Methods of Use
US8778848B2 (en) 2011-06-09 2014-07-15 Illumina, Inc. Patterned flow-cells useful for nucleic acid analysis
CN103827320B (zh) * 2011-07-25 2017-04-26 牛津纳米孔技术有限公司 使用跨膜孔进行双链多核苷酸测序的发夹环方法
ES2828661T3 (es) 2012-03-20 2021-05-27 Univ Washington Through Its Center For Commercialization Métodos para reducir la tasa de error de la secuenciación de ADN masiva en paralelo mediante el uso de la secuenciación de secuencia consenso bicatenaria
WO2013181170A1 (en) 2012-05-31 2013-12-05 Board Of Regents, The University Of Texas System Method for accurate sequencing of dna
CN105283557A (zh) 2013-05-08 2016-01-27 豪夫迈·罗氏有限公司 使用下一代系统深度测序hla 基因扩增子定量分析混合物来非侵入性早期检测实体器官移植物排斥反应
GB201406151D0 (en) * 2014-04-04 2014-05-21 Oxford Nanopore Tech Ltd Method
AU2014369841B2 (en) 2013-12-28 2019-01-24 Guardant Health, Inc. Methods and systems for detecting genetic variants

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6287825B1 (en) * 1998-09-18 2001-09-11 Molecular Staging Inc. Methods for reducing the complexity of DNA sequences
AU2015202111A1 (en) * 2008-03-28 2015-05-14 Pacific Biosciences Of California, Inc. Compositions and methods for nucleic acid sequencing
US20140221217A1 (en) * 2011-07-08 2014-08-07 Keygene N.V. Sequence based genotyping based on oligonucleotide ligation assays
US20170145492A1 (en) * 2012-01-31 2017-05-25 Pacific Biosciences Of California, Inc. Compositions and methods for selection of nucleic acids
CN103774242A (zh) * 2012-10-19 2014-05-07 安捷伦科技有限公司 通过侵入性切割添加衔接子
WO2014071070A1 (en) * 2012-11-01 2014-05-08 Pacific Biosciences Of California, Inc. Compositions and methods for selection of nucleic acids
US20170002404A1 (en) * 2014-01-07 2017-01-05 Fundacio Privada Institut De Medicina Predictiva I Personalitzada Del Cancer Method for generating double stranded dna libraries and sequencing methods for the identification of methylated cytosines
US20170088887A1 (en) * 2014-03-03 2017-03-30 Swift Biosciences, Inc. Enhanced Adaptor Ligation
WO2016093838A1 (en) * 2014-12-11 2016-06-16 New England Biolabs, Inc. Enrichment of target sequences
US20170211140A1 (en) * 2015-12-08 2017-07-27 Twinstrand Biosciences, Inc. Adapters, methods, and compositions for duplex sequencing
WO2017129647A1 (en) * 2016-01-29 2017-08-03 F. Hoffmann-La Roche Ag A novel adaptor for nucleic acid sequencing and method of use
WO2017202389A1 (zh) * 2016-05-27 2017-11-30 深圳市海普洛斯生物科技有限公司 一种适用于超微量dna测序的接头及其应用

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
GYLLENSTEN VB: "PCR与DNA测序", 国外医学分子生物学分册, vol. 12, no. 05, pages 242 - 244 *
TIMOKRATIS KARAMITROS 等: "A novel method for the multiplexed target enrichment of MinION next generation sequencing libraries using PCR-generated baits", NUCLEIC ACIDS RES ., vol. 43, no. 22, pages 152 *
ULRICH SCHLECHT 等: "ConcatSeq: A method for increasing throughput of single molecule sequencing by concatenating short DNA fragments", SCIENTIFIC REPORTS, vol. 7, pages 5252 *
WEI, SHAN 等: "Rapid Short-Read Sequencing and Aneuploidy Detection Using MinION Nanopore Technology", GENETICS, vol. 202, no. 1, pages 37 - 44, XP055396695, DOI: 10.1534/genetics.115.182311 *

Also Published As

Publication number Publication date
EP3768853A1 (en) 2021-01-27
EP3768853A4 (en) 2021-04-28
WO2019183640A1 (en) 2019-09-26
US20210002711A1 (en) 2021-01-07
US11697837B2 (en) 2023-07-11

Similar Documents

Publication Publication Date Title
CN112041462A (zh) 具有极低的错误水平的dsDNA有效测序
EP3191630B1 (en) Method for constructing sequencing library based on blood sample and usage thereof in determining fetal genetic abnormality
EP2725125B1 (en) High throughput methylation detection method
CN110734908A (zh) 高通量测序文库的构建方法以及用于文库构建的试剂盒
US20140051585A1 (en) Methods and compositions for reducing genetic library contamination
CN109844132B (zh) 分析核酸片段的方法
JP6899844B2 (ja) 超並列シークエンシングのためのdnaライブラリーを生成する方法及びキット
CN109536579B (zh) 单链测序文库的构建方法及其应用
WO2017054302A1 (zh) 测序文库及其制备和应用
WO2004065582A2 (en) Amplification of dna in a hairpin structure, and applications
US11261479B2 (en) Methods and compositions for enrichment of target nucleic acids
CN106498082B (zh) 卵巢癌易感基因变异文库构建方法
EP2885445A1 (en) Methods and compositions for reducing genetic library contamination
JP2020530767A (ja) 超並列シークエンシングのためのdnaライブラリー生成のための改良された方法及びキット
JP2022551401A (ja) デュアルインデックス付きメチル-seqライブラリーの調製方法
EP2971082A1 (en) Non-invasive prenatal screening
CN109628558B (zh) 一种用于高通量测序检测基因突变的捕获探针及其应用
US20150354000A1 (en) Method of analysis of composition of nucleic acid mixtures
CN105400864B (zh) 用于基于血液样品构建测序文库的方法及其在确定胎儿遗传异常中的用途
CN109280696B (zh) Snp检测技术拆分混合样本的方法
US11339424B2 (en) Method for amplification and quantitation of small amount of mutation using molecular barcode and blocking oligonucleotide
US11680290B2 (en) Efficient methods and compositions for multiplex target amplification PCR
CN111074354A (zh) 一种低丰度dna突变测序文库的构建方法
US20220411861A1 (en) A Multiplex Method of Preparing a Sequencing Library
EP3408408B1 (en) Selective amplification of desired nucleic acid regions in a target sequence.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination