CN115867675A - 核酸测序方法 - Google Patents

核酸测序方法 Download PDF

Info

Publication number
CN115867675A
CN115867675A CN202080097799.4A CN202080097799A CN115867675A CN 115867675 A CN115867675 A CN 115867675A CN 202080097799 A CN202080097799 A CN 202080097799A CN 115867675 A CN115867675 A CN 115867675A
Authority
CN
China
Prior art keywords
bhq
propargylamino
alexa
aminoallyl
deaza
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080097799.4A
Other languages
English (en)
Inventor
埃南柯·奥泰克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samore Inc
Original Assignee
Samore Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samore Inc filed Critical Samore Inc
Publication of CN115867675A publication Critical patent/CN115867675A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • C12Q1/6818Hybridisation assays characterised by the detection means involving interaction of two or more labels, e.g. resonant energy transfer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/107Nucleic acid detection characterized by the use of physical, structural and functional properties fluorescence
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/10Detection mode being characterised by the assay principle
    • C12Q2565/101Interaction between at least two labels
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/30Detection characterised by liberation or release of label

Abstract

本文提供了利用聚合酶、模板核酸和聚合酶试剂溶液对核酸分子进行测序的方法和系统。

Description

核酸测序方法
技术领域
本发明涉及单分子核酸测序的方法。
背景技术
当前的测序技术可以分为两大类:短读长测序和长读长测序。在每一类中,将DNA切割成长度不超过一定数量的核苷酸或碱基对(bp)的片段。在所有情况下,将所有DNA片段分散成二维阵列,并通过对应于至少一个传感器与一个DNA片段匹配的传感器阵列进行检测。
短读长测序方法是基于简单循环的技术,其包括连接测序(SBL)和合成测序(SBS)。SBL方法包括SOLID(Thermo Fisher)和Complete Genomics(BGI)。使用SOLID,可以达到75个碱基对(bp)左右的读出长度,而使用Complete Genomics方法可以实现28到100个碱基对的读长。使用这些方法,结构变异和基因组组装是不可能的,并且它们易受均聚物错误的影响。它们的运行时间在几天的量级上。Illumina和Qiagen的GeneReader技术使用具有循环可逆终止的SBS方法。它们可以达到至多300bp。然而,主要缺点是富含AT和GC的区域代表性不足、子站错误和高的半阳性率。另一方面,其他SBS方法例如454焦磷酸测序和IonTorrent(Thermo Fisher)使用单核苷酸添加/终止。454焦磷酸测序可以达到400bp,而IonTorrent可以达到700bp的读出长度。然而,尽管这些技术速度更快并且有利于即时检测,但它们也具有许多缺点,包括插入/缺失错误居多以及均聚物区域错误。它们不能用于揭示长程基因组或转录组结构,也不能进行配对末端测序。
长读长测序方法包括两种主要类型,即合成长读长测序或实时长读长测序。Illumina和10X Genomics使用的合成长读长测序侧重于利用条码并允许大片段的计算组装的文库制备。事实上,这些技术并未做到实际的长读长,而是进行短读长,其中使用条码方法来组合DNA片段,这有助于消除分析过程中的一些复杂性,从而允许获得类似于实际长读长方法的数据。然而,这种方法的成本非常高,部分原因是它需要甚至更高的覆盖度。另一种类型的长读长测序是实时长读长测序,其已被Pacific Biosciences和OxfordNanopore Technologies使用。与合成长读长测序不同,实时长读长测序不依赖于扩增的DNA的克隆群体,也不需要化学循环。Nanopore的技术具有30%左右的非常高的错误率,这也需要非常高的覆盖率,显著提高了成本。对于Nanopore的技术而言,使用修饰的碱基也特别具有挑战性,其产生了独特的信号,使分析甚至更加复杂。Pacific Biosciences可以达到高达4000-5000bps的读出长度。然而,由于长读长的15%左右的高的单次通过错误率,因此需要高覆盖率,这使得1Gb的测序成本超过1000美元(参见例如Goodwin等,Nat.Rev.Genet.17:333-351;2016)。
由于目前的大多数技术都提供每个单元短的核苷酸读出长度(40-100个碱基长左右),因此最具挑战性的问题之一在于将小的序列片段对齐成一个大的有意义的序列,并使用强大的超级计算机通过复杂的算法分析高覆盖率数据和生成的数据负载的后处理。新一代基于单分子的测序技术可以潜在地解决这个问题。然而,这些现有技术中的每一种都具有高错误率,需要通常30X至100X左右的高覆盖率(同一序列区域的多次读出)才能获得可靠的数据。
因此,对于核酸测序的改进的方法,存在着需求。
发明内容
本文提供了对核酸模板进行测序的方法,所述方法包括:
提供测序混合物,其包含(i)聚合酶,(ii)待测序的模板核酸和与所述模板核酸的区段互补的引物寡核苷酸,和(iii)具有用于对生长中的核酸链进行模板指导的合成的组分的聚合酶试剂溶液,其中所述聚合酶试剂溶液包含用于再淬灭反应的组分和多种类型的淬灭的核苷酸类似物;其中每种类型的淬灭的核苷酸类似物具有标记的离去基团,所述标记的离去基团是能够被所述聚合酶切割的,并且每种类型的淬灭的核苷酸类似物具有不同的标记物,其中所述标记的离去基团在相应的核苷酸类似物与所述模板链的聚合酶依赖性结合后被切掉;
进行核酸合成,使得多个淬灭的核苷酸类似物被顺序添加到所述模板,由此:a)淬灭的核苷酸类似物与所述聚合酶结合,b)当所述淬灭的核苷酸类似物上的标记的离去基团被所述聚合酶切掉时,该核苷酸类似物被所述聚合酶掺入到所述模板链上,其中所述标记的离去基团在切掉后产生信号(例如发射光等),然后c)通过再淬灭反应将所述核苷酸类似物上的标记的离去基团淬灭;以及
在核酸合成进行时检测来自于所述标记物的信号(例如光等),并使用在步骤b)当所述标记的离去基团被切掉时与步骤c)所述标记的离去基团被淬灭之间的时间中检测到的信号(例如光等)来确定所述模板核酸的序列。
本发明的方法可用于各种不同的用途,包括基因组测序和SNP变体检测。
在一个实施方式中,所述公开的发明是基于在聚合酶顺序掺入dNTP时监测单独的聚合酶的单分子测序技术。在特定实施方式中,本发明涵盖了一种方法,其中每当聚合酶掺入与所述模板互补的淬灭的dNTP时,都在所述掺入过程中产生荧光信号(例如通过标记的离去基团、PPi等)。随后所述未淬灭的荧光信号被再淬灭。对于下一个淬灭的dNTP的掺入,重复所述过程(图1)。
更具体地,每当聚合酶向与所述模板DNA互补的链掺入淬灭的修饰的脱氧核糖核苷三磷酸(dNTP)核苷酸类似物时,都产生对所述附连的核苷酸类型特异的荧光信号(例如通过标记的离去基团、PPi等)。存在5种类型的dNTP,即脱氧腺苷三磷酸(dATP)、脱氧鸟苷三磷酸(dGTP)、脱氧胞苷三磷酸(dCTP)、脱氧胸苷三磷酸(dTTP)和脱氧尿苷三磷酸(dUTP)。作为每个dNTP被聚合酶附连到互补链的结果,来自于淬灭的核苷酸(dNTP)的每个相应的离去基团在被外部光源连续激发后产生独特的荧光信号(例如红色、黄色、绿色或蓝色等),所述光源的光谱与附连到末端磷酸酯的荧光团的激发光谱至少部分重叠。在所述淬灭的核苷酸类似物与先前附连的核苷酸类似物的3’组成部分的附连完成后,通过适合的信号(例如荧光、发光等)传感器和/或检测装置检测由所述离去基团产生的信号(例如荧光、发光等),然后将它快速淬灭(图1)。
在特定实施方式中,测序通过检测每当淬灭的核苷酸被添加到互补链时产生的荧光来实现,所述荧光揭示了核苷酸的类型。因此,每个特定核苷酸的附连产生可以被荧光传感器检测的荧光信号的短峰。结果产生了一个连续、顺序的颜色数据数组,其可以被转换成相应的核苷酸序列的数据数组(图1)。
本文还提供了淬灭的核苷酸,其包含选自下述的结构:图6-11和表3中阐述的结构;以及dGTP-7-去氮-7-炔丙基氨基-Dabcyl-Alexa 405、dGTP-5-炔丙基氨基-Dabcyl-Alexa 405、dGTP-5-氨基烯丙基-Dabcyl-Alexa 405、dCTP-7-去氮-7-炔丙基氨基-Dabcyl-Alexa 405、dCTP-5-炔丙基氨基-Dabcyl-Alexa 405、dCTP-5-氨基烯丙基-Dabcyl-Alexa405、dATP-7-去氮-7-炔丙基氨基-Dabcyl-Alexa 405、dATP-5-炔丙基氨基-Dabcyl-Alexa405、dATP-5氨基烯丙基-Dabcyl-Alexa 405、dTTP-7-去氮-7-炔丙基氨基-Dabcyl-Alexa405、dTTP-5-炔丙基氨基-Dabcyl-Alexa 405、dTTP-5-氨基烯丙基-Dabcyl-Alexa 405、dUTP-7-去氮-7-炔丙基氨基-Dabcyl-Alexa 405、dUTP-5-炔丙基氨基-Dabcyl-Alexa 405、dUTP-5-氨基烯丙基-Dabcyl-Alexa 405、ATP-7-去氮-7-炔丙基氨基-Dabcyl-Alexa 405、ATP-5-炔丙基氨基-Dabcyl-Alexa 405、ATP-5-氨基烯丙基-Dabcyl-Alexa 405、dGTP-7-去氮-7-炔丙基氨基-BHQ2-花菁3、dGTP-5-炔丙基氨基-BHQ2-花菁3、dGTP-5-氨基烯丙基-BHQ2-花菁3、dCTP-7-去氮-7-炔丙基氨基-BHQ2-花菁3、dCTP-5-炔丙基氨基-BHQ2-花菁3、dCTP-5-氨基烯丙基-BHQ2-花菁3、dATP-7-去氮-7-炔丙基氨基-BHQ2-花菁3、dATP-5-炔丙基氨基-BHQ2-花菁3、dATP-5氨基烯丙基-BHQ2-花菁3、dTTP-7-去氮-7-炔丙基氨基-BHQ2-花菁3、dTTP-5-炔丙基氨基-BHQ2-花菁3、dTTP-5-氨基烯丙基-BHQ2-花菁3、dUTP-7-去氮-7-炔丙基氨基-BHQ2-花菁3、dUTP-5-炔丙基氨基-BHQ2-花菁3、dUTP-5-氨基烯丙基-BHQ2-花菁3、ATP-7-去氮-7-炔丙基氨基-BHQ2-花菁3、ATP-5-炔丙基氨基-BHQ2-花菁3、ATP-5-氨基烯丙基-BHQ2-花菁3、dGTP-7-去氮-7-炔丙基氨基-BHQ2-TAMRA、dGTP-5-炔丙基氨基-BHQ2-TAMRA、dGTP-5-氨基烯丙基-BHQ2-TAMRA、dCTP-7-去氮-7-炔丙基氨基-BHQ2-TAMRA、dCTP-5-炔丙基氨基-BHQ2-TAMRA、dCTP-5-氨基烯丙基-BHQ2-TAMRA、dATP-7-去氮-7-炔丙基氨基-BHQ2-TAMRA、dATP-5-炔丙基氨基-BHQ2-TAMRA、dATP-5氨基烯丙基-BHQ2-TAMRA、dTTP-7-去氮-7-炔丙基氨基-BHQ2-TAMRA、dTTP-5-炔丙基氨基-BHQ2-TAMRA、dTTP-5-氨基烯丙基-BHQ2-TAMRA、dUTP-7-去氮-7-炔丙基氨基-BHQ2-TAMRA、dUTP-5-炔丙基氨基-BHQ2-TAMRA、dUTP-5-氨基烯丙基-BHQ2-TAMRA、ATP-7-去氮-7-炔丙基氨基-BHQ2-TAMRA、ATP-5-炔丙基氨基-BHQ2-TAMRA、ATP-5-氨基烯丙基-BHQ2-TAMRA、dGTP-7-去氮-7-炔丙基氨基-BHQ2-ROX、dGTP-5-炔丙基氨基-BHQ2-ROX、dGTP-5-氨基烯丙基-BHQ2-ROX、dCTP-7-去氮-7-炔丙基氨基-BHQ2-ROX、dCTP-5-炔丙基氨基-BHQ2-ROX、dCTP-5-氨基烯丙基-BHQ2-ROX、dATP-7-去氮-7-炔丙基氨基-BHQ2-ROX、dATP-5-炔丙基氨基-BHQ2-ROX、dATP-5氨基烯丙基-BHQ2-ROX、dTTP-7-去氮-7-炔丙基氨基-BHQ2-ROX、dTTP-5-炔丙基氨基-BHQ2-ROX、dTTP-5-氨基烯丙基-BHQ2-ROX、dUTP-7-去氮-7-炔丙基氨基-BHQ2-ROX、dUTP-5-炔丙基氨基-BHQ2-ROX、dUTP-5-氨基烯丙基-BHQ2-ROX、ATP-7-去氮-7-炔丙基氨基-BHQ2-ROX、ATP-5-炔丙基氨基-BHQ2-ROX、ATP-5-氨基烯丙基-BHQ2-ROX、dGTP-7-去氮-7-炔丙基氨基-BHQ2-ALEXA-546、dGTP-5-炔丙基氨基-BHQ2-ALEXA-546、dGTP-5-氨基烯丙基-BHQ2-ALEXA-546、dCTP-7-去氮-7-炔丙基氨基-BHQ2-ALEXA-546、dCTP-5-炔丙基氨基-BHQ2-ALEXA-546、dCTP-5-氨基烯丙基-BHQ2-ALEXA-546、dATP-7-去氮-7-炔丙基氨基-BHQ2-ALEXA-546、dATP-5-炔丙基氨基-BHQ2-ALEXA-546、dATP-5氨基烯丙基-BHQ2-ALEXA-546、dTTP-7-去氮-7-炔丙基氨基-BHQ2-ALEXA-546、dTTP-5-炔丙基氨基-BHQ2-ALEXA-546、dTTP-5-氨基烯丙基-BHQ2-ALEXA-546、dUTP-7-去氮-7-炔丙基氨基-BHQ2-ALEXA-546、dUTP-5-炔丙基氨基-BHQ2-ALEXA-546、dUTP-5-氨基烯丙基-BHQ2-ALEXA-546、ATP-7-去氮-7-炔丙基氨基-BHQ2-ALEXA-546、ATP-5-炔丙基氨基-BHQ2-ALEXA-546、ATP-5-氨基烯丙基-BHQ2-ALEXA-546、dGTP-7-去氮-7-炔丙基氨基-BHQ2-ALEXA-568、dGTP-5-炔丙基氨基-BHQ2-ALEXA-568、dGTP-5-氨基烯丙基-BHQ2-ALEXA-568、dCTP-7-去氮-7-炔丙基氨基-BHQ2-ALEXA-568、dCTP-5-炔丙基氨基-BHQ2-ALEXA-568、dCTP-5-氨基烯丙基-BHQ2-ALEXA-568、dATP-7-去氮-7-炔丙基氨基-BHQ2-ALEXA-568、dATP-5-炔丙基氨基-BHQ2-ALEXA-568、dATP-5氨基烯丙基-BHQ2-ALEXA-568、dTTP-7-去氮-7-炔丙基氨基-BHQ2-ALEXA-568、dTTP-5-炔丙基氨基-BHQ2-ALEXA-568、dTTP-5-氨基烯丙基-BHQ2-ALEXA-568、dUTP-7-去氮-7-炔丙基氨基-BHQ2-ALEXA-568、dUTP-5-炔丙基氨基-BHQ2-ALEXA-568、dUTP-5-氨基烯丙基-BHQ2-ALEXA-568、ATP-7-去氮-7-炔丙基氨基-BHQ2-ALEXA-568、ATP-5-炔丙基氨基-BHQ2-ALEXA-568、ATP-5-氨基烯丙基-BHQ2-ALEXA-568、AMP-7-去氮-7-炔丙基氨基-Dabcyl、AMP-5-炔丙基氨基-Dabcyl、AMP-氨基烯丙基-Dabcyl、AMP-7-去氮-7-炔丙基氨基-BHQ2、AMP-5-炔丙基氨基-BHQ2和AMP-氨基烯丙基-BHQ2。
本文公开的本发明方法提供的优势在于其简单性和创新的化学方法,其显著降低了检测期间的背景信号,从而提高了灵敏度。根据本发明的方法,涉及试剂和酶的反应条件的较少修改提高了特异性、效率和速率。同样根据本发明的方法,聚合酶在接近理想的条件下运转,并且预期通过一起利用高灵敏度和特异性而达到每个DNA聚合酶分子数万个碱基左右的非常长的读出长度,并且产生的数据需要明显更少的后处理和分析。本文公开的本发明方法的组合特点降低了相应的装置和每次运行的成本,同时与竞争性技术相比,除了显著减少每次测试的时间之外还实现了高特异性。因此,所公开的本发明的方法和系统允许实现成本非常低的实时测序系统,而对特异性没有不利影响。
附图说明
图1示出了本发明的测序方法的一个实施方式的一般性说明:DNA聚合酶使用具有初始被淬灭的荧光团的修饰的dNTP作为构造块。在与聚合酶结合后,所述荧光分子变得激活,随后它被切掉、检测并最终被淬灭。
图2A示出了附连到dNTP的末端磷酸酯的荧光团的图示,所述dNTP在附连有所述荧光团时被相应的核碱基淬灭。每个相应的核碱基对不同荧光团具有不同的淬灭能力。
图2B示出了其中附连有荧光团的相应的核苷酸类似物与模板链的聚合酶依赖性结合,以及附连有荧光团的标记的焦磷酸盐的切割,这引起所述荧光团发射荧光信号。
图2C进一步示出了在核苷酸类似物dNTP与聚合酶相互作用期间,在切开所述标记的焦磷酸盐后产生荧光,所述切割产生与相应的荧光团的颜色对应的荧光信号。每种类别的核苷酸类似物dNTP具有颜色独特的荧光团,使得每种类型的核苷酸类似物具有不同的标记物。
图2D示出了在所述标记的焦磷酸盐从其相应的dNTP释放后,它接下来与ATP硫酸化酶相互作用,将相应的标记的焦磷酸盐结合到腺苷5’-磷酸硫酸酯(APS),导致所述荧光团在结合腺嘌呤后被腺嘌呤淬灭,从而显著降低荧光背景噪声。
图3示出了本发明测序方法的利用附连的荧光团的双重淬灭的实施方式的双重淬灭化学,由此所述荧光团被相应的核碱基和额外的非公价结合的淬灭剂淬灭。(A.)阶段1:dNTP被聚合酶的掺入和通过荧光标记的焦磷酸盐释放导致的荧光生成。(B.)阶段2:使用附连到ATP硫酸化酶系统中的APS的淬灭剂分子淬灭释放的产荧光的焦磷酸盐。
图4示出了dNTP在模板链中的掺入的生物化学过程的简化示意图。
图5:制造淬灭的核苷酸的通用示意方法阐述在图5中。
图6示出了构思用于本文的示例性的淬灭的核苷酸。
图7示出了构思用于本文的示例性的淬灭的核苷酸。
图8示出了构思用于本文的示例性的淬灭的核苷酸。
图9示出了构思用于本文的示例性的淬灭的核苷酸。
图10示出了构思用于本文的示例性的淬灭的核苷酸。
图11示出了构思用于本文的示例性的淬灭的核苷酸。
图12示出了用于测序核酸的本发明的ATP硫酸化酶系统的另一个图示。所述修饰的dNTP附连有不可移除的淬灭剂分子,以降低整个反应系统中的背景噪声。所述修饰的dNTP和APS两者上的淬灭剂分子用实心圆圈描绘。
图13示出了用于测序核酸的本发明的AGP酶系统的图示。所述修饰的dNTP附连有不可移除的淬灭剂分子,以降低整个反应系统中的背景噪声。所述修饰的dNTP和ADP-G两者上的淬灭剂分子用实心圆圈描绘。
图14示出了用于测序核酸的本发明的PPDK系统的图示。所述修饰的dNTP附连有不可移除的淬灭剂分子,以降低整个反应系统中的背景噪声。所述修饰的dNTP和AMP两者上的淬灭剂分子用实心圆圈描绘。
详细描述
本文提供了对核酸模板进行测序的方法,所述方法包括:
提供测序混合物,其包含(i)聚合酶,(ii)待测序的模板核酸和与所述模板核酸的区段互补的引物寡核苷酸,和(iii)具有用于对生长中的核酸链进行模板指导的合成的组分的聚合酶试剂溶液,其中所述聚合酶试剂溶液包含用于再淬灭反应的组分和多种类型的淬灭的核苷酸类似物;其中每种类型的淬灭的核苷酸类似物具有标记的离去基团,所述标记的离去基团是能够被所述聚合酶切割的,并且每种类型的淬灭的核苷酸类似物具有不同的标记物,其中所述标记的离去基团在相应的核苷酸类似物与所述模板链的聚合酶依赖性结合后被切掉;
进行核酸合成,使得多个淬灭的核苷酸类似物被顺序添加到所述模板,由此:a)淬灭的核苷酸类似物与所述聚合酶结合,b)当所述淬灭的核苷酸类似物上的标记的离去基团被所述聚合酶切掉时,该核苷酸类似物被所述聚合酶掺入到所述模板链上,其中所述标记的离去基团在切掉后产生信号(例如发射光等),然后c)通过再淬灭反应将所述核苷酸类似物上的标记的离去基团淬灭;以及
在核酸合成进行时检测来自于所述标记物的信号(例如荧光等),并使用在步骤b)当所述标记的离去基团被切掉时与步骤c)所述标记的离去基团被淬灭之间的时间中检测到的信号(例如光等)来确定所述模板核酸的序列。
当在本文中使用时,“聚合酶”是指负责执行核酸合成的公知的蛋白质。本文中使用的优选聚合酶是DNA聚合酶。在天然聚合酶介导的核酸合成中,在聚合酶、模板核酸序列和充当合成过程的起始点的引发序列之间形成复合体。在合成期间,所述聚合酶从反应混合物中取样核苷酸单体,以确定它们与模板序列中的下一个碱基的互补性。当所述取样的碱基与所述下一个碱基互补时,它被掺入到生长的新生链中。这个过程沿着所述模板序列的长度继续,以有效地复制该模板。尽管以简化的示意方式描述,但掺入的实际生物化学过程可能相对复杂。图4中提供了掺入生物化学的图解表述。该图不是核苷酸掺入机制的完整描述。在反应过程中,所述聚合酶经历一系列构象变化,这可能是所述机制中必不可少的步骤。
如图4中所示,所述合成过程始于步骤2处所述引发的核酸模板(D)与聚合酶(P)的结合。核苷酸(N)与所述复合体的结合发生在步骤4。步骤6代表了聚合酶从开放到闭合构象的异构化。步骤8是核苷酸被掺入到生长链中的化学步骤。在步骤10处,发生聚合酶从闭合到开放位置的异构化。在步骤12处,在掺入后被切掉的多磷酸盐组分从所述复合体中释放出来。尽管所述图示出了焦磷酸盐的释放,但应该理解,当使用标记的核苷酸或核苷酸类似物时,所述释放的组分可能不同于焦磷酸盐。在许多情况下,本发明的系统和方法使用在其末端磷酸酯上具有标记物的核苷酸类似物,使得所述释放的组分包含与染料相连的多磷酸盐(例如标记物焦磷酸盐;PPi)。在步骤14处,使用天然核苷酸或核苷酸类似物底物,所述聚合酶然后在模板上移位。在移位后,所述聚合酶处于添加另一个核苷酸的位置中并继续所述反应循环。
本文中使用的优选聚合酶包括DNA聚合酶,其根据不同的系统发育关系可以分为六大类,例如大肠杆菌Pol I(A类)、大肠杆菌Pol IIB类)、大肠杆菌Pol III(C类)、广古菌Pol II(D类)、人类Polβ(X类)以及大肠杆菌UmuC/DinB和真核生物RAD30/着色性干皮病变体(Y类)。对于命名法的综述,参见例如Burgers等,(2001),“真核生物DNA聚合酶:修改命名法的建议”(Eukaryotic DNA Polymerase:proposal for a modified nomenclature),JBiol Chem.276(47):43487-90。对于聚合酶的综述,参见例如Hubscher等,(2002),“真核生物DNA聚合酶”(Eukaryotic DNA Polymerases),Annual Review of BiochemistryVol.71:133-163;Alba(2001),“蛋白质家族回顾:复制性DNA聚合酶”(Protein FamilyReview:Replicative DNA Polymerases),Genome Biology 2(1):reviews 3002.1-3002.4;和Steitz(1999),“DNA聚合酶:结构多样性和共同机制”(DNA Polymerases:structural diversity and common mechanisms),J Biol Chem 274:17395-17398;每个所述文献整体通过参考并入本文。许多聚合酶的基本作用机制已被确定。实际上数百种聚合酶的序列是可公开获得的,并且它们中的许多的晶体结构已被确定,或者可以在与同源聚合酶的已解析晶体结构的相似性的基础上来推断。
可容易地获得适用于核酸测序的许多这样的聚合酶。例如,人类DNA聚合酶β可以从R&D systems获得。本文中使用的优选DNA聚合酶包括可以从Epicenter、GE HealthCare、Invitrogen、New England Biolabs、Promega、Roche Applied Science、SigmaAldrich等获得的DNA聚合酶I。DNA聚合酶I的Klenow片段可以从例如Ambion、Chimerx、eEnzyme LLC、GE Health Care、Invitrogen、New England Biolabs、Promega、RocheApplied Science、Sigma Aldrich等以重组和蛋白酶消化两种版本获得。PHI.29DNA聚合酶可以从例如Epicentre获得。Poly A聚合酶、反转录酶、测序酶、SP6 DNA聚合酶、T4 DNA聚合酶、T7 DNA聚合酶和各种热稳定DNA聚合酶(Taq、热启动、titanium Taq等)可以从各种不同的这些和其他来源获得。其他商品化DNA聚合酶包括可以从New England Biolabs获得的PhusionhM高保真DNA聚合酶,可以从Promega获得的GoTaqTM Flexi DNA聚合酶,可以从Epicentre Biotechnologies获得的RepIiPHITM PHI.29DNA聚合酶,可以从Stratagene获得的PfuUltraTM热启动DNA聚合酶,可以从Novagen获得的KOD HiFi DNA聚合酶等。
可用的DNA聚合酶也以各种不同方式进行修饰,以例如降低或消除核酸外切酶活性(许多天然DNA聚合酶具有证读核酸外切酶功能,其干扰例如测序应用),通过例如制备蛋白酶消化的酶片段例如重组Klenow片段等来简化生产。正如提到的,也已对聚合酶进行修饰,以提供特异性、持续合成能力的改善和标记的核苷酸在聚合酶-DNA-核苷酸复合体中的保留时间的改进(例如Hanzel等人的WO 2007/076057“用于核苷酸类似物掺入的聚合酶”(POLYMERASES FOR NUCLEOTIDE ANALOGUE INCORPORATION)和Rank等人的WO2008/051530“用于增强核酸测序的聚合酶和试剂”(POLYMERASES AND REAGENTS FOR ENHANCEDNUCLEIC ACID SEQUENCING)),改变分支分数和移位(例如由Pranav Patel等人在2009年9月4日提交的题为“用于改良掺入特性的工程化聚合酶和反应条件”(ENGINEERINGPOLYMERASES AND REACTION CONDITIONS FOR MODIFIED INCORPORATION PROPERTIES)的美国专利申请系列号12/584,481),提高光稳定性(例如由Keith Bjornson等人在2009年3月30日提交的题为“对光损伤有抗性的酶”(Enzymes Resistant to Photodamage)的美国专利申请系列号12/384,110)和提高表面固定的酶的活性(例如Hanzel等人的WO 2007/075987“有活性的表面偶联的聚合酶”(ACTIVE SURFACE COUPLED POLYMERASES)和Hanzel等人的WO 2007/076057“优化表面附连蛋白质的活性的蛋白质工程策略”(PROTEINENGINEERING STRATEGIES TO OPTIMIZE ACTIVITY OF SURFACE ATTACHED PROTEINS))。这些可用聚合酶中的任一者均可按照本发明进行修饰,以减少分支部分形成、提高封闭的聚合酶-DNA复合体的稳定性和/或改变反应速率常数。
作为突变的优选底物以降低分支分数、提高封闭复合体稳定性或改变反应速率常数的DNA聚合酶包括Taq聚合酶、核酸外切酶缺陷的Taq聚合酶、大肠杆菌DNA聚合酶1、Klenow片段、反转录酶、PHI-29相关的聚合酶包括野生型PHI-29聚合酶和此类聚合酶的衍生物例如核酸外切酶缺陷的形式、T7 DNA聚合酶、T5 DNA聚合酶和RB69聚合酶等。
此外,所述聚合酶可以出于应用特异性原因而被修饰,例如为了提高光稳定性,如在2009年3月30日提交的美国专利申请系列号12/384,110中所教导的,为了提高酶在结合到表面时的活性,如在WO 2007/075987和WO 2007/076057中所教导的,或者为了包括纯化或处理标签,如在引用的参考文献中教导的并在本领域中常见的。同样地,本文描述的修饰的聚合酶可以与其他策略组合使用以提高聚合酶性能,例如用于控制聚合酶速率常数的反应条件,如在2009年3月30日提交的题为“双慢步聚合酶系统和方法”(Two slow-steppolymerase systems and methods)的美国专利申请系列号12/414,191中所教导的,所述专利申请为所有目的整体通过参考并入本文。
当在本文中使用时,短语“模板核酸”是指待测序的任何适合的多核苷酸,包括双链DNA、单链DNA、单链DNA发夹、DNA/RNA杂交体、具有用于结合聚合因子的识别位点的RNA和RNA发夹。此外适合作为模板核酸用于本发明的测序方法的靶多核苷酸可以是细胞基因组的特定部分例如内含子、调控区、等位基因、变体或突变、完整基因组或其任何部分。在其他实施方式中,所述靶多核苷酸可以是mRNA、tRNA、rRNA、核酶、反义RNA或RNAi。所述靶多核苷酸可以具有任何长度,例如在约10个碱基直至约100,000个碱基之间、约10,000个碱基直至约90,000个碱基之间、约20,000个碱基直至约80,000个碱基之间、约30,000个碱基直至约70,000个碱基之间、约40,000个碱基直至约60,000个碱基之间或更长,典型的范围在约10,000–50,000个碱基之间。本文还构思了在约100个碱基至10,000个碱基之间的靶模板核酸长度。
本发明的模板核酸还可以包含非天然核酸例如PNA、修饰的寡核苷酸(例如包含对于生物RNA或DNA来说不典型的核苷酸的寡核苷酸,例如2’-O-甲基化寡核苷酸)、修饰的磷酸酯骨架等。核酸可以是例如单链或双链的。
当在本文中使用时,短语“淬灭的核苷酸”或“淬灭的核苷酸类似物”或其语法变化形式是指可以在DNA合成中使用的修饰的核苷酸(例如修饰的dNTP如dATP、dTTP、dGTP、dCTP和dUTP)。用于本发明的核苷酸类似物可以是能够作为聚合酶和选择性切割活性的底物的任何适合的核苷酸类似物。已示出的是,核苷酸可以被修饰并仍可作为聚合酶和其他酶的底物。在构思核苷酸类似物的变体的情况下,可以通过活性测定法来确定所述核苷酸类似物与聚合酶或另一种酶活性例如核酸外切酶活性的相容性。活性测定法的执行是直接的并且在本领域中是公知的。
所述核苷酸类似物可以是例如在其多磷酸酯链中具有三个或更多个磷酸的核苷多磷酸酯,在所述多磷酸酯链的在掺入到生长链中之后被切掉的部分上带有标记物。所述多磷酸酯可以是纯的多磷酸酯例如--O--PO3-或焦磷酸酯(例如PPi),或者所述多磷酸酯可以包括取代。关于类似物和制造这些类似物的方法的其他细节,可以在为所有目的整体通过参考并入本文的美国专利7,405,281、9,464,107等中找到。
可选的标记策略可以利用无机材料作为标记组成部分,例如荧光或发光纳米粒子(即量子点,例如纳米晶体)其由于半导体组成和纳米级范围内的尺寸而具有固有的荧光能力(参见例如美国专利号6,861,155、6,699,723、7,235,361,它们为所有目的通过参考并入本文)。此类纳米晶体材料通常可以从例如Life Technologies(Carlsbad Calif.)商购。同样地,此类化合物可以作为单独的标记基团或作为与例如其他无机纳米晶体或有机荧光团的交互式基团或对存在。在某些情况下,可以使用荧光蛋白例如绿色荧光蛋白(GFP、EGFP)、蓝色荧光蛋白(EBFP、EBFP2、Azurite、mKalama1)、青色荧光蛋白(ECFP、Cerulean、CyPet)和黄色荧光蛋白衍生物(YFP、Citrine、Venus、YPet)。还构思了在本文中使用荧光细胞条码,其使用多极荧光染料产生多种颜色编码的信号用于检测,例如在为所有目的整体通过参考并入本文的Krutzek等,Curr Protoc Cytom.2011January;CHAPTER:Unit-6.31.(doi:10.1002/0471142956.cy0631s55.)中所描述的。
在优选实施方式中,所述核苷酸类似物通过向末端磷酸酯添加荧光团进行修饰(参见例如Yarbrough等,J.Biol.Chem.、254:12069-12073、1979;其为所有目的整体通过参考并入本文),使得在所述核苷酸类似物被掺入到模板链中时通过所述聚合酶产生PPi标记的离去基团。在这个实施方式中,所述荧光团可以以某种方式附连,使得所述荧光信号被相应的核碱基淬灭,如在例如为所有目的整体通过参考并入本文的Seidal等,J Phys.Chem.、1996、100:5541-5553中所阐述。存在五种类型的dNTP,即脱氧腺苷三磷酸(dATP)、脱氧鸟苷三磷酸(dGTP)、脱氧胞苷三磷酸(dCTP)、脱氧胸苷三磷酸(dTTP)和脱氧尿苷三磷酸(dUTP)。在本文公开的本发明方法的优选实施方式中,每个相应的dNTP相对于其他dNTP使用不同的独特荧光团进行修饰,使得每当聚合酶向与模板DNA互补的链掺入修饰的脱氧核糖核苷三磷酸(dNTP)核苷酸类似物时,产生对附连的核苷酸类别或类型特异的荧光信号(例如dATP、dTTP、dGTP和dCTP中的每一者的独特信号)。在其他实施方式中,相同的荧光团可用于dTTP和dUTP两者,因为它们都与DNA链延长反应中的dATP互补。
在某些实施方式中,对于其中的荧光团已被核碱基淬灭的核苷酸类似物,在本发明的测序方法中所述修饰的dNTP的更强的永久性淬灭,通过将另外的不可移除的淬灭分子(例如淬灭剂)和/或具有增强核碱基本身淬灭能力的功能的化学基团结合到该核苷酸类似物来实现。在这个实施方式中,所述不可移除的淬灭剂分子和/或化学基团仍伴随着掺入的dNTP,所述dNTP在聚合酶结合后已被转变成dNMP。更具体地,当所述标记的离去基团(例如荧光标记的PPi)已被聚合酶从dNTP-类似物上切掉后,所述不可移除的淬灭分子和/或化学基团仍伴随着所述dNMP,因此不再淬灭所述焦磷酸盐离去基团上的标记物,使得所述标记的离去基团在被光源激发后发出可检测的光信号。除了被核苷酸类似物中的核碱基的固有淬灭之外还使用这种额外的第二永久性不可移除的淬灭剂和/或化学基团,在本文中被称为所述相应核苷酸类似物的永久且稳定的双重淬灭。在稳定的双重淬灭的这个特定实施方式中,在将各种不同的核苷酸类似物(例如dNTP)添加到反应混合物以与聚合酶相互作用之前,将不可移除的淬灭剂和/或化学基团(其具有增强核碱基本身淬灭能力的功能)永久性附连或稳定结合到所述核苷酸类似物,例如通过基于共价、离子、金属、静电或范德华力的方式附连到所述其中具有被相应的核碱基淬灭的荧光团的核苷酸类似物的碱基或糖,正如上文中阐述的(参见例如图5-图11)。
与仅用核碱基和/或第二不可移除的淬灭剂淬灭的核苷酸类似物相比,所述核苷酸(dNTP)类似物荧光信号的永久性、不可移除的双重淬灭急剧降低了背景。这种较低的背景提供了允许低激发强度的优势,从而减轻聚合酶上的物理压力,因此显著提高了测序准确性。
在ATP硫酸化酶系统(参见图2A-图2D和图3A和图3B)(ATP硫酸化酶的其他公知名称包括硫酸腺苷酰基转移酶、ATP:硫酸腺苷酰基转移酶、腺苷-5’-三磷酸硫酸化酶、腺苷三磷酸硫酸化酶、腺苷酰基硫酸酯焦磷酸化酶、ATP硫酸化酶、ATP-硫酸化酶和硫酸化酶)的特定实施方式中,在再淬灭反应中使用的APS上的淬灭剂分子(图2C)可以被共价或非共价附连。本文构思了在本文中使用的APS可以具有额外的(例如超过1种)淬灭剂,而对测序反应没有不利影响。在其他实施方式中,APS上的淬灭剂分子(图2C)被共价附连。
相似地,在PPDK系统(参见图14)(PPDK的其他公知名称包括丙酮酸磷酸二激酶、ATP:丙酮酸磷酸磷酸转移酶、丙酮酸正磷酸二激酶、丙酮酸-磷酸二激酶(磷酸化)、丙酮酸磷酸二激酶、丙酮酸-无机磷酸二激酶、丙酮酸-磷酸二激酶、丙酮酸-磷酸连接酶、丙酮酸-磷酸二激酶、丙酮酸-磷酸连接酶、丙酮酸Pi二激酶和PPDK)的特定实施方式中,在再淬灭反应中使用的AMP上的淬灭剂分子可以被共价或非共价附连。本文构思了在本文中使用的AMP可以具有额外的(例如超过1种)淬灭剂,而对测序反应没有不利影响。在其他实施方式中,AMP上的淬灭剂分子被共价附连。
相似地,在AGP酶系统(参见图13)(AGP酶的其他公知名称包括葡萄糖-1-磷酸腺苷酰基转移酶、ATP:α-D-葡萄糖-1-磷酸腺苷酰基转移酶、ADP葡萄糖焦磷酸化酶、葡萄糖1-磷酸腺苷酰基转移酶、腺苷二磷酸葡萄糖焦磷酸化酶、腺苷二磷酸葡萄糖焦磷酸化酶、ADP-葡萄糖焦磷酸化酶、ADP-葡萄糖合酶、ADP-葡萄糖合成酶、ADPG焦磷酸化酶、ADP:α-D-葡萄糖-1-磷酸腺苷酰基转移酶和AGP酶)的特定实施方式中,在再淬灭反应中使用的ADP-葡萄糖(ADP-G)上的淬灭剂分子可以被共价或非共价附连。本文构思了在本文中使用的ADP-葡萄糖可以具有额外的(例如超过1种)淬灭剂,而对测序反应没有不利影响。在其他实施方式中,ADP-葡萄糖上的淬灭剂分子被共价附连。
每个核苷酸当被聚合酶附连到互补链时产生独特的荧光信号(例如红色、黄色、绿色或蓝色等)。在所述核苷酸类似物与先前附连的核苷酸类似物的3’组成部分的附连完成后,通过适合的荧光传感器和/或检测装置检测由离去基团(例如产荧光焦磷酸盐;PPi)产生的荧光,随后将所述标记的焦磷酸盐迅速淬灭(图1)。
使用本文提供的本发明的方法,将仅在核苷酸与聚合酶的特异性相互作用期间产生指示所述核苷酸的特定类型的特定信号。聚合酶相互作用之前和之后的状态将是相近的,信号将在所述与聚合酶的相互作用期间“变化”。例如,在本文公开的荧光淬灭实施方式中:
1-最初,不存在或存在非常低的背景荧光。
2-在聚合酶相互作用期间,产生特定类型的荧光。
3-在PPi释放和焦磷酸盐的淬灭反应后,信号返回到初始状态。
在利用表面等离子体光子学的另一个实施方式中,金属纳米粒子的接近改变了信号:等离激元位移。例如,核苷酸的碱基或糖附连有金属纳米粒子,并且末端磷酸酯附连有另一个金属纳米粒子。在另一个实施方式中,这也被用于鉴定碱基的相应类型:通过不同的相应金属例如金、银、铜、铝等;或者可以使用具有不同直径的金属粒子:
1-最初,每个核苷酸具有偶联(等离激元方面)的两个金属纳米粒子,其对应于特定的背景等离激元信号。
2-在聚合酶相互作用期间,金属纳米粒子随着焦磷酸盐释放,等离激元偶联被破坏,在释放后产生等离激元位移,其对应于为相应的核苷酸检测的信号。
3-随后,将随着金属纳米粒子释放的焦磷酸盐附连到APS,使得所有金属纳米粒子返回到它们的初始被偶联的状态。
在又一个实施方式中,构思了在本文中使用荧光共振能量转移(FRET)来代替淬灭另一个碱基信号。例如,当在本发明的方法中利用FRET而不是淬灭反应时,在碱基或糖上存在受体染料(长波长例如红色)。在这个实施方式中,末端磷酸酯上的荧光团是具有较短波长的供体(例如蓝色、绿色、黄色、橙色),使得在合并时它们向受体进行FRET并且我们只看到红色荧光,这是基础信号。然后在附连和切割后看到它们的特异性荧光,直至使用二次反应将它们再结合,以再次进行FRET并发射红光。在本文中使用的大量供体:受体FRET对在本领域中是公知的。简单来说:
1-最初,存在特定的荧光发射(例如“红色”)。
2-在与聚合酶相互作用期间,产生不同于红色(例如蓝色、绿色、黄色、橙色)的特定类型的荧光。
3-在焦磷酸盐释放后,信号返回到初始状态(“红色”)。
本领域技术人员可以容易地确定哪些仪器是适合的,测定是需要多路还是高样品通量,以及何种类型的荧光标记物与相应的淬灭剂(例如不可移除的淬灭剂)的组合提供满足相应的核酸测序方法应用所需的特异性和灵敏度。表1中列出的荧光团可以与列出的表现出相似的互动荧光团以及激发和发射光谱并且可以从不同供应商获得的可选替荧光团一起使用;而表2提供了示例性淬灭剂组成部分的名单。
在为不同类型的荧光团标记的核苷酸和检测仪器选择适合的荧光团/淬灭剂组合时,可以遵照下述指导原则:
本文中构思的适合的光源包括在电磁光谱的紫外到红外区域的范围内工作的那些;例如激光器、LED、卤素灯、汞灯或光源等。相应地,根据所使用的荧光分光光度计,选择可以被所述仪器的光学器件激发和检测的适合的荧光团标记物。在特定实施方式中,配备氩蓝光激光器的仪器最适合激发波长在500至540nm之间的荧光团的激发,而具有更长最大激发波长的荧光团被这种光源的激发不太良好或完全不被激发。带有白色光源例如卤钨灯的仪器使用滤光片进行激发和发射,并且能够以相同的效率激发和检测激发和发射波长在400至700nm之间的荧光团。对于使用发光二极管作为激发源和发射滤光片来检测广范围荧光团的仪器,情况也是如此。
如果测定法被设计用于检测一个靶DNA序列并且只使用一种荧光标记物,则FAM、TET或HEX(或表1中列出的它们的可选替方案之一)将是用于标记相应核苷酸的良好荧光团。这些荧光团可以在所有可用的荧光光谱仪上被激发和检测。此外,由于这些荧光团的亚磷酰胺衍生物的可用性以及连接有淬灭剂的对照孔眼玻璃柱的可用性,带有这些标记物的荧光核苷酸可以完全在自动化过程中合成,具有制造起来相对更廉价和劳动密集性更低的优点。
表1.用于荧光杂交探针的荧光团标记物
Figure BDA0003819974830000171
A)CAL和Quasar荧光团可以从Biosearch Technologies获得;B)VIC和NED可以从Applied Biosystems获得;C)Cy染料可以从Amersham Biosciences获得;D)Oyster荧光团可以从Integrated DNA Technologies获得;并且E)LC(Light Cycler)荧光团可以从RocheApplied Science获得。
如果测定法被设计用于检测两个或更多个靶DNA序列(多重核酸靶检测测定法)并且因此将使用两种或更多种荧光标记的核苷酸,则选择吸收和发射波长彼此良好分离(光谱重叠最少)的荧光团。大多数仪器具有激发和发射滤光片的选择,可以最小化荧光团之间的光谱重叠。在发生光谱重叠的情况下,仪器由具有内置算法的软件程序支持,以确定链延长反应中存在的每个荧光团对发射的贡献。此外,大多数仪器具有为测定法中利用的荧光团手动校准光学元件的选项,以进一步优化每种荧光团对发射的贡献的确定。
对于利用荧光共振能量转移(FRET)的荧光核苷酸的设计,荧光选择具有足够的光谱重叠的荧光团-淬灭剂对。最大发射波长在500至550nm之间的荧光团例如FAM、TET和HEX,被最大吸收波长在450至550nm之间的淬灭剂例如dabcyl和BHQ-1(对于可选淬灭剂标记物,参见表2)最适合地淬灭。最大发射波长超过550nm的荧光团例如罗丹明类(包括TMR、ROX和德克萨斯红)和Cy染料(包括Cy3和Cy5),被最大吸收波长超过550nm的淬灭剂(包括BHQ-2)适合地淬灭。
表2.用于荧光杂交探针的淬灭剂标记物
Figure BDA0003819974830000181
A)DDQ或深暗淬灭剂可以从Eurogentec获得;B)Eclipse淬灭剂可以从EpochBiosciences获得;C)Iowa淬灭剂可以从Integrated DNA Technologies获得;D)BHQ或黑洞淬灭剂可以从Biosearch Technologies获得;并且E)QSY淬灭剂可以从Molecular Probes获得。
对于利用接触淬灭的荧光核苷酸的设计,任何非荧光淬灭剂可以充当来自于荧光团的能量的良好受体。例如,在特定实施方式中,Cy3和Cy5被BHQ-1和BHQ-2淬灭剂或“淬灭分子”最好地淬灭。
荧光团表现出特定的量子产率。荧光量子产率是荧光团能够将吸收的光转变成发射的光的效率的量度。更高的量子产率产生更高的荧光强度。量子产率对pH和温度的变化敏感。在大多数核酸链延长反应条件下,pH和温度变化不大,因此量子产率不会显著变化。
正如本文中阐述的,核苷酸内的核碱基可以淬灭荧光团的荧光,其中鸟苷是最高效的淬灭剂,其次是腺苷、胞苷和胸苷(参见例如Seidel、C.A.M.、Schulz、A.和Sauer、M.M.H.,(1996),“荧光染料的核碱基特异性淬灭。1.核碱基单电子氧化还原电位及其与静态和动态淬灭效率的相关性”(Nucleobase-specific quenching of fluorescentdyes.1.Nucleobase one-electron redox potentials and their correlation withstatic and dynamic quenching efficiencies),J.Phys.Chem.100、5541-5553;其为所有目的整体通过参考并入本文)。一般地,激发波长在500至550nm之间的荧光团与具有更长激发波长的荧光团相比更高效地被核苷酸淬灭。
在本文提供的特定实施方式中,制造淬灭的核苷酸的通用示意方法阐述在图5中。
在其他实施方式中,构思用于本发明的示例性的淬灭的核苷酸阐述在图6-图11中。
在其他实施方式中,构思用于本发明的示例性的淬灭的核苷酸包括在表3中阐述的dNTP(核苷酸)、碱基修饰、淬灭剂和附连的荧光团例如dNTP的y-磷酸酯的各种不同组合。
表3.
Figure BDA0003819974830000191
更具体地,它们可以以碱基修饰-dNTP-淬灭剂-荧光团的格式称呼。在特定实施方式中,例如,本文提供的淬灭的核苷酸包括:dGTP-7-去氮-7-炔丙基氨基-Dabcyl-Alexa405,dGTP-5-炔丙基氨基-Dabcyl-Alexa 405,dGTP-5-氨基烯丙基-Dabcyl-Alexa 405,dCTP-7-去氮-7-炔丙基氨基-Dabcyl-Alexa 405,dCTP-5-炔丙基氨基-Dabcyl-Alexa 405,dCTP-5-氨基烯丙基-Dabcyl-Alexa 405,dATP-7-去氮-7-炔丙基氨基-Dabcyl-Alexa 405,dATP-5-炔丙基氨基-Dabcyl-Alexa 405,dATP-5氨基烯丙基-Dabcyl-Alexa 405,dTTP-7-去氮-7-炔丙基氨基-Dabcyl-Alexa 405,dTTP-5-炔丙基氨基-Dabcyl-Alexa 405,dTTP-5-氨基烯丙基-Dabcyl-Alexa 405,dUTP-7-去氮-7-炔丙基氨基-Dabcyl-Alexa 405,dUTP-5-炔丙基氨基-Dabcyl-Alexa 405,dUTP-5-氨基烯丙基-Dabcyl-Alexa 405,ATP-7-去氮-7-炔丙基氨基-Dabcyl-Alexa 405,ATP-5-炔丙基氨基-Dabcyl-Alexa 405,ATP-5-氨基烯丙基-Dabcyl-Alexa 405等。
在其他特定实施方式中,例如,本文提供的淬灭的核苷酸包括:dGTP-7-去氮-7-炔丙基氨基-BHQ2-花菁3,dGTP-5-炔丙基氨基-BHQ2-花菁3,dGTP-5-氨基烯丙基-BHQ2-花菁3,dCTP-7-去氮-7-炔丙基氨基-BHQ2-花菁3,dCTP-5-炔丙基氨基-BHQ2-花菁3,dCTP-5-氨基烯丙基-BHQ2-花菁3,dATP-7-去氮-7-炔丙基氨基-BHQ2-花菁3,dATP-5-炔丙基氨基-BHQ2-花菁3,dATP-5氨基烯丙基-BHQ2-花菁3,dTTP-7-去氮-7-炔丙基氨基-BHQ2-花菁3,dTTP-5-炔丙基氨基-BHQ2-花菁3,dTTP-5-氨基烯丙基-BHQ2-花菁3,dUTP-7-去氮-7-炔丙基氨基-BHQ2-花菁3,dUTP-5-炔丙基氨基-BHQ2-花菁3,dUTP-5-氨基烯丙基-BHQ2-花菁3,ATP-7-去氮-7-炔丙基氨基-BHQ2-花菁3,ATP-5-炔丙基氨基-BHQ2-花菁3,ATP-5-氨基烯丙基-BHQ2-花菁3等。
在其他特定实施方式中,例如,本文提供的淬灭的核苷酸包括:dGTP-7-去氮-7-炔丙基氨基-BHQ2-TAMRA,dGTP-5-炔丙基氨基-BHQ2-TAMRA,dGTP-5-氨基烯丙基-BHQ2-TAMRA,dCTP-7-去氮-7-炔丙基氨基-BHQ2-TAMRA,dCTP-5-炔丙基氨基-BHQ2-TAMRA,dCTP-5-氨基烯丙基-BHQ2-TAMRA,dATP-7-去氮-7-炔丙基氨基-BHQ2-TAMRA,dATP-5-炔丙基氨基-BHQ2-TAMRA,dATP-5氨基烯丙基-BHQ2-TAMRA,dTTP-7-去氮-7-炔丙基氨基-BHQ2-TAMRA,dTTP-5-炔丙基氨基-BHQ2-TAMRA,dTTP-5-氨基烯丙基-BHQ2-TAMRA,dUTP-7-去氮-7-炔丙基氨基-BHQ2-TAMRA,dUTP-5-炔丙基氨基-BHQ2-TAMRA,dUTP-5-氨基烯丙基-BHQ2-TAMRA,ATP-7-去氮-7-炔丙基氨基-BHQ2-TAMRA,ATP-5-炔丙基氨基-BHQ2-TAMRA,ATP-5-氨基烯丙基-BHQ2-TAMRA等。
在其他特定实施方式中,例如,本文提供的淬灭的核苷酸包括:dGTP-7-去氮-7-炔丙基氨基-BHQ2-ROX,dGTP-5-炔丙基氨基-BHQ2-ROX,dGTP-5-氨基烯丙基-BHQ2-ROX,dCTP-7-去氮-7-炔丙基氨基-BHQ2-ROX,dCTP-5-炔丙基氨基-BHQ2-ROX,dCTP-5-氨基烯丙基-BHQ2-ROX,dATP-7-去氮-7-炔丙基氨基-BHQ2-ROX,dATP-5-炔丙基氨基-BHQ2-ROX,dATP-5氨基烯丙基-BHQ2-ROX,dTTP-7-去氮-7-炔丙基氨基-BHQ2-ROX,dTTP-5-炔丙基氨基-BHQ2-ROX,dTTP-5-氨基烯丙基-BHQ2-ROX,dUTP-7-去氮-7-炔丙基氨基-BHQ2-ROX,dUTP-5-炔丙基氨基-BHQ2-ROX,dUTP-5-氨基烯丙基-BHQ2-ROX,ATP-7-去氮-7-炔丙基氨基-BHQ2-ROX,ATP-5-炔丙基氨基-BHQ2-ROX,ATP-5-氨基烯丙基-BHQ2-ROX等。
在其他特定实施方式中,例如,本文中提供的淬灭的核苷酸包括:dGTP-7-去氮-7-炔丙基氨基-BHQ2-ALEXA-546,dGTP-5-炔丙基氨基-BHQ2-ALEXA-546,dGTP-5-氨基烯丙基-BHQ2-ALEXA-546,dCTP-7-去氮-7-炔丙基氨基-BHQ2-ALEXA-546,dCTP-5-炔丙基氨基-BHQ2-ALEXA-546,dCTP-5-氨基烯丙基-BHQ2-ALEXA-546,dATP-7-去氮-7-炔丙基氨基-BHQ2-ALEXA-546,dATP-5-炔丙基氨基-BHQ2-ALEXA-546,dATP-5氨基烯丙基-BHQ2-ALEXA-546,dTTP-7-去氮-7-炔丙基氨基-BHQ2-ALEXA-546,dTTP-5-炔丙基氨基-BHQ2-ALEXA-546,dTTP-5-氨基烯丙基-BHQ2-ALEXA-546,dUTP-7-去氮-7-炔丙基氨基-BHQ2-ALEXA-546,dUTP-5-炔丙基氨基-BHQ2-ALEXA-546,dUTP-5-氨基烯丙基-BHQ2-ALEXA-546,ATP-7-去氮-7-炔丙基氨基-BHQ2-ALEXA-546,ATP-5-炔丙基氨基-BHQ2-ALEXA-546,ATP-5-氨基烯丙基-BHQ2-ALEXA-546等。
在其他特定实施方式中,例如,本文中提供的淬灭的核苷酸包括:dGTP-7-去氮-7-炔丙基氨基-BHQ2-ALEXA-568,dGTP-5-炔丙基氨基-BHQ2-ALEXA-568,dGTP-5-氨基烯丙基-BHQ2-ALEXA-568,dCTP-7-去氮-7-炔丙基氨基-BHQ2-ALEXA-568,dCTP-5-炔丙基氨基-BHQ2-ALEXA-568,dCTP-5-氨基烯丙基-BHQ2-ALEXA-568,dATP-7-去氮-7-炔丙基氨基-BHQ2-ALEXA-568,dATP-5-炔丙基氨基-BHQ2-ALEXA-568,dATP-5氨基烯丙基-BHQ2-ALEXA-568,dTTP-7-去氮-7-炔丙基氨基-BHQ2-ALEXA-568,dTTP-5-炔丙基氨基-BHQ2-ALEXA-568,dTTP-5-氨基烯丙基-BHQ2-ALEXA-568,dUTP-7-去氮-7-炔丙基氨基-BHQ2-ALEXA-568,dUTP-5-炔丙基氨基-BHQ2-ALEXA-568,dUTP-5-氨基烯丙基-BHQ2-ALEXA-568,ATP-7-去氮-7-炔丙基氨基-BHQ2-ALEXA-568,ATP-5-炔丙基氨基-BHQ2-ALEXA-568,ATP-5-氨基烯丙基-BHQ2-ALEXA-568等。
在其他特定实施方式中,例如,本文提供的淬灭的核苷酸包括:AMP-7-去氮-7-炔丙基氨基-Dabcyl,AMP-5-炔丙基氨基-Dabcyl,AMP-氨基烯丙基-Dabcyl,AMP-7-去氮-7-炔丙基氨基-BHQ2,AMP-5-炔丙基氨基-BHQ2,AMP-氨基烯丙基-BHQ2等。
当在本文中使用时,短语“标记的离去基团”是指附连有标记物例如荧光团等的多磷酸盐链,其在相应的dNTP掺入到模板核酸链期间在被聚合酶(例如DNA pol)切割之时和/或之后从所述相应的dNTP释放。在本文的特定实施方式中,所述多磷酸盐是被切割并释放到反应混合物中的荧光标记的焦磷酸盐(PPi),用于后续的荧光检测,然后所述标记的焦磷酸盐变得被本文中所阐述的用于再淬灭反应的组分(例如淬灭酶等)淬灭(参见图2B)。
当在本文中使用时,短语“聚合酶试剂溶液”是指对生长中的核酸的模板进行指导合成所必需的组分的混合物。所述与聚合酶例如DNA pol I等一起使用的聚合酶试剂溶液包括淬灭酶(例如ATP硫酸化酶、PPDK、AGP酶等)和适合浓度的dNTP例如本描述的荧光团修饰的核苷酸类似物。在优选实施方式中,使用的dNTP的浓度远高于迄今为止可能的浓度,这部分是由于从在本发明的方法中有利地使用的标记的离去基团(例如荧光焦磷酸盐;PPi)产生的低荧光背景。由于淬灭酶(例如ATP硫酸化酶)和聚合酶速率可以随着酶的类型和来源显著变化,因此可以通过调整本文中描述的反应条件例如ATP硫酸化酶浓度等独立地调整通过本文中使用的ATP硫酸化酶反应所实现的淬灭速率。
当在本文中使用时,短语“测序混合物”是指用于执行本发明的单分子测序反应的组分。在一个实施方式中,所述测序混合物包括聚合酶(例如DNA pol I)、模板核酸和其中包含用于再淬灭反应的组分(例如淬灭酶如ATP硫酸化酶、PPDK、AGP酶等)和标记的核苷酸类似物的聚合酶试剂溶液。根据本发明,与以前的测序方法相比,在本发明的测序方法中使用的测序混合物提供了下述优点:使用的聚合酶在其理想状态下起作用;不需要改良聚合酶;高核苷酸(例如dNTP)浓度的使用导致最佳的效率;只需要低强度的激发光,这有利地减少荧光团的光漂白并减少聚合酶的变性;几乎不提供荧光背景,这提高了碱基调用的特异性和灵敏度;不需要精密复杂的光学元件或纳米结构化的芯片设计,这降低了成本;它提供高特异性,这减少了对高覆盖率的需求;以及相对于现有技术方法提供长读出长度(例如约50Kb至1个基因/池),并且所需的计算机处理少得多。
当在本文中使用时,短语“再淬灭反应”是指可以再淬灭信号发射体例如图2B和图2C中的释放的荧光团或本文中发射待检测信号的任何其他组成部分的任何反应。正如在本文的方法中阐述的,所述信号对应于DNA序列中的特定核苷酸碱基。当在本文中使用时,“用于再淬灭反应的组分”可以包括淬灭酶例如ATP硫酸化酶、PPDK、AGP酶等。一旦信号发射体(例如来自于图2B和图2C中的标记的离去基团的荧光团)经历所述再淬灭反应,它在本文中被称为“再淬灭的”。
所使用的反应条件也可以影响各种不同反应的相对速率。因此,控制反应条件可用于确保测序方法以高速率成功地调用模板中的碱基。所述反应条件包括例如缓冲液的类型和浓度、反应的pH、温度、盐的类型和浓度、影响酶的动力学的特定添加剂的存在以及包括金属辅因子在内的各种不同辅因子的类型、浓度和相对量。操控反应条件以实现或增强聚合酶的双慢步骤行为,被详细描述在通过参考并入本文的美国专利8,133,672中。
酶反应通常在缓冲液存在下允许,所述缓冲液部分用于控制反应混合物的pH。在某些情况下,缓冲液的类型可以以某种方式影响聚合酶反应的动力学,使得可以在需要双慢步骤动力学时产生这种动力学。例如,在某些情况下,使用IRIS作为缓冲液可用于获得双慢步骤反应。适合的缓冲液包括例如TAPS(3-{[三(羟甲基)甲基]氨基}丙磺酸)、Bicine(N,N-双(2-羟乙基)甘氨酸)、IRIS(三(羟甲基)甲胺)、ACES(N-(2-乙酰氨基)-2-氨基乙磺酸)、Tricine(N-三(羟甲基)甲基甘氨酸)、HEPES(4-2-羟乙基-1-哌嗪乙磺酸)、TES(2-{[三(羟甲基)甲基]氨基}乙磺酸)、MOPS(3-(N-吗啉基)丙磺酸)、PIPES(哌嗪-N,N'-双(2-乙磺酸))和MES(2-(N-吗啉基)乙磺酸)。
反应的pH可以影响聚合酶反应的动力学,并且可以用作聚合酶反应条件之一以获得表现出双慢步骤动力学的反应。可以将pH调整到产生双慢步骤反应机制的值。所述pH通常在约6至约9之间。在某些实施方式中,所述pH在约6.5至约8.0之间。在其他实施方式中,所述pH在约6.5至7.5之间。在特定实施方式中,所述pH选自约6.5、6.6、6.7、6.8、6.9、7.0、7.1、7.2、7.3、7.4或7.5。
可以对反应的温度进行调节以确保反应的相对速率出现在适合的范围内。反应温度可能取决于使用的聚合酶或选择性切割活性的类型。也构思了利用本文中使用的温度来操作和控制反应混合物中两个碱基之间的氢键形成以及碱基与水的相互作用,从而控制反应组分的溶解性。温度也影响非共价附连的淬灭剂的结合效率。在特定实施方式中,可以使用15℃至90℃之间、20℃至50℃之间、20℃至40℃之间或20℃至30℃之间的温度。
在某些实施方式中,可以向反应混合物添加影响反应动力学的添加剂。在某些情况下,所述添加剂可以与酶的活性部位相互作用,充当例如竞争性抑制剂。在某些情况下,添加剂可以以影响反应动力学的方式与酶的远离活性部位的部分相互作用。可以影响动力学的添加剂包括例如在分析反应中具有竞争性但无反应性的底物或抑制剂,以调节反应速率,如在全部公开内容为所有目的整体通过参考并入本文的美国实用专利8,252,911中所描述的。
作为另一个实例,可以添加同位素例如氘来影响聚合酶反应中的一个或多个步骤的速率。在某些情况下,由于氘同位素效应,氘可用于减缓聚合酶反应中的一个或多个步骤。通过改变聚合酶反应的步骤的动力学、在某些情况下可以实现本文所描述的双慢步骤动力学。氘同位素效应可用于例如通过减缓掺入速率来控制核苷酸掺入的速率。也可以使用氘之外的同位素,例如碳(例如13C)、氮、氧、硫或磷的同位素。
作为又一个实例,可用于控制聚合酶反应的动力学的添加剂包括有机溶剂的添加。所述有机添加剂通常是水溶性有机溶剂。所述溶剂不必在所有浓度下可溶,但是通常以用于控制聚合酶反应动力学的量可溶。尽管不受理论限制,但据信所述溶剂可以影响聚合酶的三维构型,这可以影响聚合酶反应中的各个不同步骤的速率。例如,所述溶剂可以影响涉及构型变化的步骤例如异构化步骤。添加的溶剂也可以影响、在某些情况下减缓移位速度。在某些情况下,所述溶剂通过影响氢键相互作用起作用。
可用于控制单分子测序中聚合酶反应的一个或多个步骤的速率的与水混溶的有机溶剂包括例如醇类、胺类、酰胺、腈类、亚砜、醚类、酯类和具有超过一种这些官能团的小分子。示例性的溶剂包括醇类例如甲醇、乙醇、丙醇、异丙醇、甘油和小分子醇。所述醇类可以具有1、2、3个或更多个醇基团。示例性的溶剂还包括小分子醚类例如四氢呋喃(THF)和二噁烷、二甲基乙酰胺(DMA)、二甲基亚砜(DMSO)、二甲基甲酰胺(DMF)和乙腈。
所述与水混溶的有机溶剂可以以足以控制聚合酶反应动力学的任何量存在。所述溶剂通常以重量计或体积计小于所述溶剂的40%的量添加。在某些实施方式中,所述溶剂以约0.1%至30%之间、约1%至约20%之间、约2%至约15%之间和约5%至12%之间添加。控制动力学的有效量可以通过本文描述的方法并由本领域技术人员确定。
控制聚合酶反应条件的另一方面涉及辅因子的类型、水平和相对量的选择。例如,在聚合酶反应过程中,二价金属辅因子例如镁或锰将与酶-底物复合体相互作用,在活性部位的定义中发挥结构性作用。对于聚合酶反应中的金属辅因子的讨论,参见例如Arndt等,Biochemistry(2001)40:5368-5375。适合的条件包括在为所有目的整体通过参考并入本文的美国专利8,257,954中描述的那些。
在本发明的方法的特定实施方式中,聚合酶反应的速率和保真度通过调整dNTP核苷酸类似物的浓度来控制,使得就诸如底物浓度、光学激发的量、化学修饰的水平等参数而言聚合酶在接近理想的条件下运行。因此,本文构思了聚合酶达到其最大读出长度,例如大约数万碱基对,与在天然背景中实现的DNA合成长度相近。这降低了装置的复杂性并提高了酶的灵敏度和特异性,从而导致低错误率以及因此低覆盖率。这不仅降低了装置的成本以及每个基因组的成本,而且使得诸如单核苷酸多态性检测、结构变异和基因组组装等应用可以在一个非常紧凑的系统中进行。
在另一个实施方式中,正如上文阐述的,由于淬灭酶(例如ATP硫酸化酶)和聚合酶的速率可以随着酶的类型和来源显著变化,因此可以通过调整反应条件例如ATP硫酸化酶浓度,独立地调整通过本文中使用的ATP硫酸化酶反应所实现的淬灭速率。
本发明包括用于核酸模板测序的系统。所述系统提供了多个核酸模板的同时测序。所述系统可以并入本文中描述的所有试剂和方法,并提供用于包含样品,用激发光照射样品,检测在测序期间从样品发射的光以便从核苷酸类似物被聚合酶掺入到其同源模板DNA时从它们切下的标记的离去基团和从标记的离去基团例如荧光团标记的焦磷酸盐产生强度随时间变化的数据,以及使用所述顺序强度随时间变化的数据确定模板的序列所需的仪器。
当在本文中使用时,短语“检测光”是指用于例如在荧光团标记物处于其发射相应的信号的激发态时检测从这些标记物发出的荧光的公知的方法。
用于测序的系统通常包含基板(substrate),其具有在例如独特的液滴等中的多个单一聚合酶、单一模板或单一引物。在高度持续性酶的情况下,各自包含聚合酶、核酸模板和引物的聚合酶反应被独特地限制,使得当发生核酸合成时它们的信号可以被指派给相应的核苷酸。所述测序试剂通常包括两种或更多种类型的核苷酸类似物,优选为对应于dATP、dATP、dAGP和dCTP的四种核苷酸类似物,每种核苷酸类似物用不同的标记物标记。所述聚合酶将核苷酸或核苷酸类似物顺序添加到从所述引物延伸的生长链。每个添加的核苷酸或核苷酸类似物与所述模板核酸上的相应碱基互补,使得产生的生长链的部分与所述模板互补。
所述系统包含照射光学元件,用于在相应的dNTP被掺入到模板链中时照射来自于所述dNTP的标记的离去基团,例如标记的焦磷酸盐。所述照射光学元件在会激发切下的焦磷酸盐上的标记物(不再被核碱基淬灭)的波长范围内照射所述标记的离去基团。
所述系统还包含检测光学元件,用于观察在聚合酶介导的向模板链的添加期间来自于从相应的dNTP切下的标记的离去基团的信号。所述检测光学元件同时观察多个单分子聚合酶测序反应,通过所述标记的离去基团(例如荧光团标记的焦磷酸盐;PPi)观察每个所述测序反应的核苷酸或核苷酸类似物添加。对于每个观察的单分子聚合酶测序反应,所述检测光学元件同时观察来自于每个标记的离去基团的指示了与相应的dNTP对应的相应的未淬灭的荧光团标记物的信号,直至每个相应的信号被淬灭酶(例如ATP硫酸化酶)淬灭。
所述系统还包含计算机,其被配置成使用从相应的离去基团观察到的信号来确定添加到生长链的核苷酸类似物的类型;由此使用从所述标记的离去基团观察到的信号指示某种类型的核苷酸或核苷酸类似物是否掺入到生长链中。所述计算机通常以信号数据的形式从检测光学元件接收关于观察到的信号的信息。所述计算机存储、处理和解释所述信号数据,使用所述信号数据以产生碱基调用的顺序。所述碱基调用代表了计算机根据接收到的信号数据以及提供给计算机以帮助序列确定的其他信息的组合对模板序列的估计。
在例如美国专利8,802,424、7,714,303和7,820,983中描述了可以与本发明一起使用的光学照射和检测系统,每个所述专利为所有目的整体通过参考并入本文。
用于执行本发明的方法的计算机可以从个人计算机例如运行Intel Pentium或DuoCore处理器的PC或MacintoshTM类型的计算机到运行UNIX、LINUX、WindowsTM或其他系统的工作站、实验室设备或高速服务器,本发明的逻辑处理可以完全由执行软件和/或固件逻辑指令的通用逻辑处理器(例如CPU)执行;或完全由并入到实验室或诊断系统或相机系统中并且也可能包括软件或固件要素的专用逻辑处理电路(例如ASIC)执行;或由通用和专用逻辑电路的组合执行。用于信号数据的数据格式可以包括任何方便的格式,包括基于数字图像的数据格式例如JPEG、GIF、BMP、TIFF,或其他测序特异性格式包括“fastq”或“qseq”格式(Illumina);同时可以使用基于视频的格式,例如avi、mpeg、mov、rmv或其他视频格式。本发明的软件过程通常可以用各种不同的编程语言编程,包括例如Matlab、C、C++、C#、NET、Visual Basic、Python、JAVA、CGI等。
在本发明的方法和系统的某些实施方式中,使用光学约束来增强同时观察多个单分子聚合酶测序反应的能力。通常,光学约束被配置在在基板上,并用于仅将电磁辐射提供到非常小的空间或体积中或仅从非常小的空间或体积中产生这种辐射。这样的光学约束可以包括结构约束例如孔、凹槽、导管等,或者它们可以包括与其他组件结合的光学过程,以仅将照射提供到非常小的体积中或仅从非常小的体积产生发射的辐射。这种光学约束的实例包括利用例如基于全内反射(TIR)的光学系统的系统,由此以在基板内产生全内反射的角度引导光通过所述基板的透明部分。
在特定实施方式中,优选的光学约束是微滴,其可以包含本文中阐述的单个测序反应。例如,可以将测序混合物反应成分分开,使得每个微滴含有一个聚合酶和一个模板核酸,由此每个信号检测单元聚焦于单个微滴上。本文中构思了每个微滴是含有单个单分子测序反应的单分子反应池。所述微滴反应池也可有利地用于本发明的测序方法以充当微型透镜,将光聚焦到所述反应上并送往相应的信号检测单元。
本发明的基板通常是刚性并且通常是平面的,但也不一定如此。在所述基板包含光学约束的阵列的情况下,所述基板通常具有可以与光学仪器相接的尺寸和形状,以允许来自于所述光学约束的光的照射和测量。通常,所述基板也被配置成与液体介质保持接触,例如包含用于光学测量的试剂和底物和/或标记的组分例如荧光团标记的焦磷酸盐。
在所述沉淀包含光学约束的阵列的情况下,所述阵列可以包含在沉淀表面上的单行或多行光学约束,其中当存在多个道时,道的数目通常为至少2,更通常超过10,更通常超过100。所述光学约束的主题阵列可以沿着所述基板的x-轴或y-轴水平或对角线排列。各个约束可以横跨所述基板的表面或在其上以任何格式排布,例如排布成行和列以形成网格,或者形成圆形、椭圆形、卵形、圆锥形、矩形、三角形或多边形图案。为了最小化相邻光学约束之间的最近邻距离,六边形阵列有时是优选的。
可以将所述光学约束的阵列并入到提供分析的便捷性、高通量或其他优点的结构中,例如在微量滴定板等中。这种设置在本文中也被称为“阵列的阵列”。例如,可以将主题阵列并入到另一个阵列例如微量滴定板中,其中所述板的每个微孔都含有光学约束的主题阵列。
根据本发明,约束(例如反应池、微滴等)的阵列被提供成在单个基板上的超过100个、超过1000个、超过10,000个、超过100,000个或超过1,000,000个独立的反应池(例如微滴等)的阵列。此外,所述反应池阵列通常以相对高的密度包含在所述基板的表面上。这种高密度通常包括反应池以超过10个反应池/mm2、优选地超过100个反应池/mm2基板表面积、更优选地超过500或甚至1000个反应池/mm2、在许多情况下高达或超过100,000个反应池/mm2的密度存在。尽管在许多情况下所述阵列中的反应池以规则的图案间隔,例如在给定阵列中2、5、10、25、50或100个或更多个规则间隔的反应池的行和/或列,但在某些优选情况下,以偏离标准的行和/或列格式的阵列提供反应池的组织是有利的。在优选情况下,所述基板包括作为特定反应池的微滴作为光学约束,以在所述基板上限定分立的单分子测序反应区。
所述光学约束阵列的整体尺寸通常可以在几纳米到几毫米的厚度以及几毫米到50厘米的宽度和/或长度的范围内。阵列可以具有约几百微米到几毫米厚度的总尺寸,并且可以具有取决于所需光学约束的数量的任何宽度或长度。
可以调整各个约束之间的间距以支持在其中使用所述主题阵列的特定应用。例如,如果目标应用需要阵列的暗场照明,而没有来自于光学约束的入射波长的衍射散射或具有低水平的衍射散射,则可以将所述各个约束相对于入射波长彼此靠近放置。
所述阵列中的单个约束可以提供小于约1000仄升(zeptoliter)、小于约900、小于约200、小于约80、小于约10仄升的有效观察体积。如果需要,可以提供小于1仄升的有效观察体积。在一个优选方面,单个约束产生允许分辨以等于或接近生理相关浓度存在的单个分子例如酶的有效观察体积。许多生物化学反应的生理相关浓度范围从微摩尔到毫摩尔,因为大多数酶的米氏常数都在这些范围内。因此,优选的光学约束阵列具有用于检测以高于约1微摩尔(uM)或更优选地高于50uM或甚至高于100uM的浓度存在的单个分子的有效观察体积。在特定实施方式中,典型的微滴尺寸在10微米至200微米的范围内,因此典型的微滴体积为5皮升至20纳升左右。
在光学约束内的化学或生物化学分析的情形中,通常希望确保感兴趣的反应至少发生在所述约束的光学质询的部分内,并且优选地使得在单个约束的质询部分内(例如在微滴等内)只发生单分子聚合酶测序反应的反应。许多方法通常可用于在观察体积内提供单个分子。各种不同的这些方法描述在为所有目的整体通过参考并入本文的美国专利7,763,423中,所述专利尤其描述了修饰的表面,其被设计成将单个分子以所需密度固定到所述表面,使得大约一个、两个、三个或某些其他选定数目的分子预期将落入给定的观察体积内。通常,此类方法利用稀释技术在表面上提供相对低密度的偶联基团,这通过稀释表面上的此类基团或稀释与感兴趣的分子相互作用的中间体或最终偶联基团或它们的组合来实现。本文还构思了使用这些稀释技术来提供一个、两个、三个或某些其他选定数目的单分子测序反应,以落入给定的观察体积内而不被固定到表面,例如在本文构思的用于光学约束的微滴反应池中发生的情况。在特定实施方式中,使用所述稀释技术在微滴中提供一个单分子测序反应,用于本发明的测序方法。
本发明的系统和方法可以通过使用本领域中公知的系统来监测来自核苷酸类似物的标记的离去基团例如多磷酸酯标记物的信号,而产生改进的序列确定和改进的碱基调用。通常,信号数据由处理器接收。处理器接收的信息可以直接来自于检测光学元件,或者来自于检测光学元件的信号在被处理器接收之前可以通过其他处理器进行处理。可以使用许多初始校准操作。这些初始校准步骤中的一些可以在运行开始时仅执行一次,或者在运行期间以更连续的方式执行。这些初始校准步骤可以包括诸如质心确定、对齐、网格化、漂移校正、初始背景减除、噪声参数调整、帧速率调整等。这些初始校准步骤中的某些步骤例如分箱,可能涉及从处理器返回到检测器/相机的通讯,如下文进一步讨论的。
通常,对初始信号数据应用某种类型的光谱迹线确定、光谱迹线提取或光谱过滤。这些过滤步骤中的一些或全部可以任选地在所述过程的稍后时间点进行,例如在脉冲识别步骤之后。光谱迹线提取/光谱过滤可以包括本领域中公知的大量降噪和其他过滤。由于接收到的初始信号数据是由一系列相邻像素检测器捕获的光水平或光子计数,因此对于本文中讨论的许多示例性系统,光谱迹线确定在此阶段进行。例如,在一个示例性系统中,在每一帧为单个波导捕获来自于位置的像素(或强度水平)。不同频率或光谱的光会落于一个以上的位置上,并且通常存在一些重叠并可能存在显著的重叠。根据本发明的特定实施方式,可以使用如下文所讨论的为每个光谱迹线提供最高信噪比的各种不同类型的分析来进行光谱迹线提取。
作为光谱迹线确定的替代方案,本发明的方法还可以分析从多个像素位置处的强度水平推导出的单个信号(这可以被称为总和光谱信号或灰度光谱信号或强度水平信号)。然而在许多情况下,已发现光谱提取提供了更好的SNR(信噪比),并且因此当或多或少独立地分析提取的光谱迹线的脉冲时提供了更好的脉冲检测。在其他实施方式中,根据本发明的方法可以使用诸如隐马尔可夫模型的统计模型来分析多个捕获的像素数据。在本文提供的本发明测序方法和系统中,从初始信号数据确定多个(例如四个)光谱迹线是优选的方法。
确定来自于标记的离去基团的信号是否可以归类为显著信号脉冲或事件。在某些示例性系统中,由于可用于检测的光子数量少并且由于检测速度,因此在确定是否检测到显著脉冲中可以执行各种不同的统计分析技术。
如果信号被识别为显著脉冲或信号事件,则可以执行进一步的可选光谱轮廓比较来验证光谱指派(spectral assignment)。在光谱迹线在脉冲识别之前或期间被确定的实施方式中,这种光谱轮廓比较是任选的。一旦将颜色指派到给定的掺入信号(例如荧光团标记的dNTP),则使用该指派来调用掺入的相应碱基或其在模板序列中的补码。为了做出这种确定,使用来自于对应于所述标记的离去基团的通道的信号来评估来自于核苷酸标记物的脉冲是否对应于掺入事件。然后对被调用碱基的编译进行额外的处理,以提供线性序列信息例如模板序列中的连续核苷酸序列,将序列片段组装成更长的重叠群等。
正如上文提到的,将信号数据输入到处理系统例如适当编程的计算机或其他处理器中。信号数据可以直接从检测系统输入以例如用于实时信号处理,或者它可以从信号数据存储文件或数据库输入。在某些情况下,例如,在寻求对检测系统性能的即时反馈、调整检测或其他实验参数的情况下,将采用实时信号处理。在某些实施方式中,将来自于检测系统的信号数据存储在适合的文件或数据库中,并以反应后或非实时方式进行处理。
与本发明相结合使用的信号数据可以采取各种不同的形式。例如,数据可以是代表在给定检测器或基于阵列的检测器的检测点处接收的光信号的强度值的数值数据。信号数据可以包括来自于成像检测器例如CCD、EMCCD、ICCD或CMOS传感器的图像数据。在特定实施方式中,为了检测来自于单个分子的少量光子,构思了在本发明方法中使用光电倍增管(PMT)和/或光子计数器单元。在任一情况下,根据本发明的特定实施方式使用的信号数据通常包括强度水平信息和光谱信息。在单独的检测元件的情形中,这种光谱信息通常包括对在其上检测强度的检测器部分(例如像素)的地点或位置的识别。在图像数据的情形中,光谱图像数据通常是从图像数据衍生的与成像系统和检测器的校准光谱图像数据相关的数据,当所述系统包括整体信号的光谱解析时。所述光谱数据可以从从检测器提取的图像数据中获得,或者,光谱数据的衍生可以发生在检测器上,以便从所述检测器提取光谱数据。
对于上述测序方法,检测系统将检测到一定量的不是来自于掺入事件的信号的结果的光信号。这样的信号将代表系统中的“噪声”,并且可能源自于多个来源,这些来源可能在被监测的反应的内部、检测系统的内部和/或以上所有的外部。本发明的实践有利地减少了通常存在于现有技术方法中的这些总体噪声源。根据本发明有利地降低的反应内部的现有技术噪声的实例包括例如:存在与检测事件不相关的荧光标记物,例如释放的标记物、与在溶液中扩散的未掺入的碱基结合的标记物、与复合体结合但未掺入的碱基;在单个观察体积或区域中存在多个复合体;染料或核苷酸与观察体积内的底物或酶复合体的非特异性吸附;被污染的核苷酸类似物,例如被其他荧光组分污染;可能发出微弱荧光的其他反应组分;光谱位移染料组分,例如作为反应条件的结果;等等。荧光信号检测以及来自于相应dNTP的离去基团上的在掺入下一个核苷酸类似物之前被淬灭的荧光标记物的信息的受控使用,有利地提供了一种减少或消除噪声源的方式,从而提高系统的信噪比,并提高碱基调用和相关序列确定的质量。
在检测系统内部但在反应混合物外部的噪声源可以包括例如通过过滤光学元件流出的反射激发辐射,来自于基板或任何光学组件的散射的激发或荧光辐射,相邻信号源的空间串扰,系统的任何或所有光学组件的自发荧光,来自于检测器例如CCD的读取噪声,例如EMCCD相机的增益寄存器噪声等。其他系统来源的噪声贡献可能来自于数据处理问题,例如背景校正误差、聚焦漂移误差、自动聚焦误差、脉冲频率分辨率、对准误差等。还有其他噪声贡献可能源自于整个系统外部的来源,包括环境光干扰、灰尘等。
这些噪声分量对隐含在可能与掺入事件相关的任何信号脉冲下的背景光子有贡献。因此,噪声水平通常形成任何信号脉冲可被确定为具有统计意义的界限。
噪声对整体信号数据的贡献可以通过多种方法来鉴定,包括例如在不存在感兴趣的反应的情况下进行信号监测,此时的任何信号数据被确定为不相关。可选并且优选地,估算基线信号并将其从系统产生的信号数据中减去,使得噪声测量是在与感兴趣的反应的测量的同时进行的。基线的生成和应用可以通过多种手段来进行,它们将在下文更详细地描述。
根据本发明,信号处理方法在噪声或广义来说所有基于非显著脉冲的信号事件与可能以合理的置信度被认为是与掺入事件相关并因此可初步鉴定为掺入事件的显著信号脉冲之间做出区分。在本发明的情形中,首先根据信号事件是否满足多个不同脉冲标准中的任一者来对信号事件是否构成显著信号脉冲进行分类。一旦被识别或分类为显著脉冲,可以进一步评估信号脉冲以确定所述信号脉冲是否构成掺入事件并且可以被称为特定掺入碱基。正如将会理解的,将特定信号事件称为显著脉冲并最终称为掺入事件的基础,基于如本文中一般性阐述的各种不同参数将受到一定量误差的影响。因此应当理解,本发明的涉及将信号数据分类为脉冲并最终分类为掺入事件或已识别的碱基的方面将受到相同或相似误差的影响,并且此类命名法用于讨论的目的,并且作为以一定的置信度预期被调用的碱基是序列中的正确碱基的指示,而不是作为被调用的碱基确实上是给定序列中给定位置中的碱基的绝对确定性的指示。
一个这样的信号脉冲标准是与所讨论的信号事件相关的信号与所有背景噪声水平的比率(“信噪比”或“SNR”),它提供了置信度或统计显著性的度量,可用于将信号事件归类为显著信号脉冲。在将显著脉冲信号与系统或其他噪声分量区分开来时,信号通常必须在多个度量中的一个或多个度量中超过信号阈值水平,所述度量包括例如信号强度、信号持续时间、时间信号脉冲形状、脉冲间隔脉冲光谱特征。
作为简化的实例,可以将信号数据输入到处理系统中。如果所述信号数据在信号强度和信号持续时间中的一者或多者方面超过信号阈值,则可以被视为显著脉冲信号。类似地,如果使用附加度量作为阈值,则可以将所述信号与此类度量进行比较,以将特定信号事件识别为显著脉冲。正如将会认识到的,这种比较通常将涉及至少一个前述度量,优选地至少两个这样的阈值,并且在许多情况下前述阈值中的三个或全部四个,以鉴定显著脉冲。
信号阈值,无论是在信号强度、信号持续时间、脉冲形状、间隔或脉冲光谱特性还是这些的组合方面,通常将在来自于先前实验数据的预期信号轮廓的基础上确定,尽管在某些情况下,这样的阈值可以从总信号数据的百分比中识别,其中统计评估表明这种阈值是适合的。特别地,在某些情况下,可以设置阈值信号强度和/或信号持续时间以排除除了总信号数据的某个部分或百分比之外的所有信号数据,允许实时设置阈值。然而,同样地,根据百分比或绝对信号值进行的阈值水平的识别,通常与先前的实验结果相关。在可选情况下,可以在给定评估的情形中确定信号阈值。具体地,例如,脉冲强度阈值可以基于绝对信号强度,但这种阈值未将例如通过试剂扩散导致的信号背景水平的变化考虑在内,这可能影响所使用的阈值,特别是在信号与背景水平相比相对弱的情况下。因此,在某些情况下,本发明的方法确定所讨论的特定反应的背景荧光,所述背景荧光相对较小,这是因为微滴内自由扩散的染料或染料标记的类似物的贡献是极小或不存在的,并将信号阈值设置为比实际背景高所需的水平,例如作为脉冲强度与背景荧光团扩散的比率,或通过统计方法例如5sigma等。通过校正实际反应背景,例如最小荧光团扩散背景,阈值可以针对染料浓度、激光功率等变化的影响自动校准。反应背景是指与感兴趣的反应特异性相关的背景信号水平,并且与对背景的系统贡献相反,预计会随着反应条件而变化,例如系统或底物组分的自发荧光、激光渗出等。
在依赖于掺入事件的实时检测的特别优选的情况下,显著信号脉冲的识别可能依赖于在信号强度和信号持续时间两方面跨越阈值的信号分布。例如,当检测到信号在增加的方向上越过较低强度阈值时,对来自同一组检测元件例如像素的后续信号数据进行监测,直至信号强度在减小的方向上越过同一个或不同的强度阈值。一旦检测到适合强度的峰值,将其超过一个或多个强度阈值的时段的持续时间与持续时间阈值进行比较。当峰包含足够强且持续时间足够长的信号时,它被称为显著信号脉冲。
除了使用强度和持续时间阈值之外或作为其替代方案,脉冲分类可以采用许多其他信号参数以将脉冲分类为显著的。这样的信号参数包括例如脉冲形状、信号的光谱轮廓例如脉冲光谱质心、脉冲高度、脉冲扩散比、脉冲间隔、总信号水平等。
在识别显著信号脉冲之后或之前,可以将信号数据与特定信号类型相关联。在结合本发明使用的光学检测方案的情形中,这通常表示产生信号数据的信号的特定光谱情况。具体地,与本发明的方法和过程相结合使用的光学检测系统通常被配置为接收具有可区分的光谱情况的光信号,其中每个光谱可区分的信号情况通常可以与不同的反应事件相关联。例如在核酸测序的情况下,每个光谱可区分的信号可以与掺入或存在于核酸序列的给定位置处的特定核苷酸相关联或指示所述特定核苷酸。因此,检测系统包括接收此类信号并基于它们的光谱来分离信号的光学元件组。然后将不同的信号导向不同的检测器,导向基于单个阵列的检测器上的不同位置,或在同一成像检测器上进行不同的成像(参见例如美国专利7,805,081,其为所有目的整体通过参考并入本文)。
在针对不同信号光谱使用不同检测器的系统中,将信号类型(为了便于讨论,在后文中被称为“颜色分类”或“光谱分类”)指派到给定信号是将信号脉冲与从其获得数据的检测器相关联的问题。具体地,在每个独立的信号分量通过分立的检测器检测的情况下,该检测器对信号的检测表明所述信号被分类为所述必需的颜色。
然而在优选情况下,与本发明相结合使用的检测系统利用成像检测器,在所述检测器上将整个信号的所有或至少几个不同的光谱分量以允许区分不同光谱分量的方式进行成像。因此,多个信号分量被导向同一个整体检测器,但可能入射到所述检测器的完全或部分不同的区域上,例如,在成像检测器中的不同像素组上成像,并产生可区分的光谱图像(和相关的图像数据)。当在本文中使用时,光谱或光谱图像通常指示具有由从反应位置接收的光信号的光谱扩展产生的多个强度的像素图像或帧(任选的被减少到一维的数据)。
在其最简单的形式中,应当理解,将颜色指派到在检测器中的一组毗连检测元件或像素上发生的信号事件,将以与为独立的检测器所阐述的相似的方式来完成。具体地,信号在其上成像并且从中推导出信号数据的像素组的位置指示了信号分量的颜色。然而,在特别优选的情况下,信号分量的空间分离可能不是完美的,使得不同颜色的信号在重叠的像素组上成像。因此,信号识别通常将基于信号入射在其上的多个像素的聚合的身份(或信号分量的整体图像)。
一旦特定信号被识别为显著脉冲并被指派有特定光谱,则可以进一步评估光谱指派的脉冲以确定所述脉冲是否可以调用掺入事件,并因此调用掺入到新生链中的碱基或其在模板序列中的补码。使用来自于标记的离去基团(例如荧光团标记的焦磷酸盐)的信号来鉴定应该调用哪个碱基。正如上文阐述的,在一个实施方式中,通过为每个核苷酸类似物使用两种淬灭剂例如核苷酸的核碱基和非共价附连的淬灭剂产生了一组特征性信号,其可以以高置信度与掺入事件相关联。
此外,从颜色指派的脉冲数据中调用碱基通常会采用再次鉴定调用碱基的置信度的测试。通常,此类测试将接收信号的数据环境考虑在内,包括许多与在识别显著脉冲中使用的相同的数据参数。例如,此类测试可以包括考虑背景信号水平、相邻脉冲信号参数(间距、强度、持续时间等)、光谱图像分辨率以及各种不同的其他参数。此类数据可用于为颜色指派的信号脉冲的给定碱基调用指派分值,其中此类分值与被调用的碱基不正确的概率相关,例如百分之一(99%准确)、千分之一(99.9%准确)、万分之一(99.99%准确)、十万分之一(99.999%准确)或甚至更高。与用于色谱衍生序列数据的PHRED或类似类型的评分相似,此类分值可用于为测序数据的准确度提供指示和/或过滤掉准确度不足的序列信息。
一旦碱基以足够的准确度被调用后,随后可以将在同一测序运行中并在同一引物延伸反应中调用的碱基附加到每个先前调用的碱基,以提供整个模板或新生链序列中的碱基序列。对于给定序列,可以使用迭代处理和进一步的数据处理来填充任何空白、纠正任何错误调用的碱基等。
根据本发明的特定实施方式,对反应位置阵列上通过掺入反应进行的测序的分析可以如美国专利9,447,464的图13中图示的来进行,所述专利为所有目的整体通过参考并入本文。例如,将相机捕获的数据表述为电影,它也是光谱的时间序列。使用光谱校准模板从光谱中提取迹线。然后使用在所述迹线中识别的脉冲返回到光谱数据,并从该数据产生每个脉冲的时间平均脉冲光谱,这种脉冲光谱将包括与酶构象变化有关的事件的光谱。然后也使用所述光谱校准模板将脉冲光谱分类为特定碱基。然后将碱基分类以及脉冲和迹线指标储存或将它们传递给其他逻辑以进行进一步分析。下游分析将包括使用来自于酶构象变化的信息来帮助确定碱基调用的掺入事件。用于本发明的其他碱基调用和序列确定方法可以包括在例如US 8,182,993中描述的那些,所述专利为所有目的整体通过参考并入本文。
实施例
单分子测序
在经历单分子测序反应之前,对于dATP、dTTP、dGTP和dCTP中的每一者,将相应的荧光团附连到其相应的dNTP的末端磷酸酯。尽管荧光团在与聚合酶反应之前被附连到dNTP,但所述荧光团被dNTP的核碱基(参见例如图2A)和/或附连到dNTP的永久性的、不可移除的淬灭剂分子(参见例如图3A和图12-图14)淬灭。在所述单分子测序反应过程中,在与DNA聚合酶相互作用后,当所述DNA聚合酶将所述dNTP核苷酸类似物结合到模板链时,它切掉附连有能够产生信号的荧光团的焦磷酸盐(参见图2B和图3A,以及图12-图14中的标记的PPi)。
作为dNTP与DNA聚合酶相互作用的结果,在切掉标记的焦磷酸盐后产生荧光,所述标记的焦磷酸盐产生与被选择用于特定dNTP的荧光团的颜色对应的荧光信号。每个dNTP碱基(A、T、G、C)具有不同的荧光团(参见图2C、图3A和图12-图14)。相应的荧光在所述光变得被再淬灭反应淬灭之前被检测。
在ATP硫酸化酶系统中,在被释放并且其荧光已被检测后,标记的焦磷酸盐(PPi)与ATP硫酸化酶相互作用,所述酶将标记的焦磷酸盐结合到酰胺5’-磷酸硫酸酯(APS),导致结合后所述荧光团被腺嘌呤淬灭(参见图3B和图12)。焦磷酸盐上荧光团标记物的淬灭基本上消除了测序混合物中的所有背景荧光信号(参见图2D)。
重复这个dNTP掺入过程,直至获得所需的核酸读出长度。
尽管已参考本文中的示例性实施方式具体示出和描述了本发明的实施方式,但本领域普通技术人员应该理解,在不背离由后面的权利要求书所定义的本发明的实施方式的精神和范围的情况下,可以在其中对形式和细节进行各种不同的改变。本领域技术人员将会认识到或能够使用不超过常规的实验来确定本文描述的特定程序的大量等同物。这样的等同物被认为是在本发明的范围之内,并且被下述权利要求书所覆盖。在整个本申请引用的所有非专利文献出版物、专利和专利申请的内容,均出于所有目的整体通过参考并入本文。可以为本发明及其实施方式选择那些专利、申请和其他文件的适合的组件、过程和方法。

Claims (22)

1.一种对核酸模板进行测序的方法,所述方法包括:
提供测序混合物,其包含(i)聚合酶,(ii)待测序的模板核酸和与所述模板核酸的区段互补的引物寡核苷酸,和(iii)聚合酶试剂溶液,所述聚合酶试剂溶液具有用于对生长中的核酸链进行模板指导的合成的组分,其中所述聚合酶试剂溶液包含用于再淬灭反应的组分和多种类型的淬灭的核苷酸类似物;其中每种类型的淬灭的核苷酸类似物具有标记的离去基团,所述标记的离去基团是能够被所述聚合酶切割的,并且每种类型的淬灭的核苷酸类似物具有不同的标记物,其中所述标记的离去基团在相应的核苷酸类似物与所述模板链的聚合酶依赖性结合后被切掉;
进行核酸合成,使得多个淬灭的核苷酸类似物被顺序添加到所述模板,由此:a)淬灭的核苷酸类似物与所述聚合酶结合,b)当所述淬灭的核苷酸类似物上的标记的离去基团被所述聚合酶切掉时,所述淬灭的核苷酸类似物被所述聚合酶掺入到所述模板链上,其中所述标记的离去基团在切掉后产生信号,然后c)通过再淬灭反应将所述核苷酸类似物上的标记的离去基团再淬灭;以及
在核酸合成进行时检测来自于所述标记物的信号,并使用在步骤b)当所述标记的离去基团被切掉时与步骤c)所述标记的离去基团被再淬灭之间的时间中检测到的信号来确定所述模板核酸的序列。
2.权利要求1所述的方法,其中所述淬灭的核苷酸类似物已被附连到其上的荧光团修饰。
3.权利要求1-2所述的方法,其中所述淬灭的核苷酸类似物已被附连到末端磷酸酯的荧光团修饰。
4.权利要求1-3所述的方法,其中所述在切掉后产生的信号是通过外部光源的激发产生的光发射。
5.权利要求1-4所述的方法,其中所述离去基团是标记的焦磷酸盐。
6.权利要求1-5所述的方法,其中所述焦磷酸盐是用荧光团标记的。
7.权利要求1-6所述的方法,其中淬灭的核苷酸类似物的每种碱基用相对于其他碱基独特的荧光团标记。
8.权利要求1-7所述的方法,其中所述荧光团选自由表1中所列的荧光团组成的组。
9.权利要求1-8所述的方法,其中所述再淬灭反应使用淬灭酶或表面等离子体光子学。
10.权利要求1-9所述的方法,其中所述淬灭酶选自由ATP硫酸化酶、PPDK和AGP酶组成的组。
11.权利要求1-10所述的方法,其中再淬灭是利用所述ATP硫酸化酶通过APS上的淬灭剂分子被实现的。
12.权利要求1-10所述的方法,其中再淬灭是利用所述PPDK酶通过AMP上的淬灭剂分子被实现的。
13.权利要求1-10所述的方法,其中再淬灭是利用所述AGP酶通过ADP-G上的淬灭剂分子被实现的。
14.权利要求10-13所述的方法,其中所述淬灭剂分子选自由表2中所列的淬灭剂组成的组,即,选自由DDQ-I、Dabcyl、Eclipse、Iowa Black FQ、BHQ-1、QSY-7、BHQ-2、DDQ-II、Iowa Black RQ、QSY-21和BHQ-3组成的组。
15.权利要求1-14所述的方法,其中所述聚合酶是DNA聚合酶。
16.权利要求1-15所述的方法,其中所述淬灭的核苷酸类似物的类型包括dATP、dTTP、dGTP、dCTP和dUTP。
17.权利要求1-16所述的方法,其中所述再淬灭反应使用表面等离子体光子学。
18.权利要求2-17所述的方法,其中所述荧光团通过将不可移除的淬灭剂附连到所述核苷酸(dNTP)类似物来淬灭。
19.权利要求1-18所述的方法,其中所述不可移除的淬灭剂分子被附连到所述核苷酸类似物的核碱基或糖处。
20.权利要求18-19所述的方法,其中所述不可移除的淬灭剂分子选自由表2中所列的淬灭剂组成的组,,即,选自由DDQ-I、Dabcyl、Eclipse、Iowa Black FQ、BHQ-1、QSY-7、BHQ-2、DDQ-II、Iowa Black RQ、QSY-21和BHQ-3组成的组。
21.一种淬灭的核苷酸,其结构包含选自由图6-图11或表3中所列的结构组成的组。
22.一种淬灭的核苷酸,其包含选自下述组成的组的结构:dGTP-7-去氮-7-炔丙基氨基-Dabcyl-Alexa 405,dGTP-5-炔丙基氨基-Dabcyl-Alexa 405,dGTP-5-氨基烯丙基-Dabcyl-Alexa 405,dCTP-7-去氮-7-炔丙基氨基-Dabcyl-Alexa 405,dCTP-5-炔丙基氨基-Dabcyl-Alexa 405,dCTP-5-氨基烯丙基-Dabcyl-Alexa 405,dATP-7-去氮-7-炔丙基氨基-Dabcyl-Alexa 405,dATP-5-炔丙基氨基-Dabcyl-Alexa 405,dATP-5-氨基烯丙基-Dabcyl-Alexa 405,dTTP-7-去氮-7-炔丙基氨基-Dabcyl-Alexa 405,dTTP-5-炔丙基氨基-Dabcyl-Alexa 405,dTTP-5-氨基烯丙基-Dabcyl-Alexa 405,dUTP-7-去氮-7-炔丙基氨基-Dabcyl-Alexa 405,dUTP-5-炔丙基氨基-Dabcyl-Alexa 405,dUTP-5-氨基烯丙基-Dabcyl-Alexa405,ATP-7-去氮-7-炔丙基氨基-Dabcyl-Alexa 405,ATP-5-炔丙基氨基-Dabcyl-Alexa405,ATP-5-氨基烯丙基-Dabcyl-Alexa 405,dGTP-7-去氮-7-炔丙基氨基-BHQ2-花菁3,dGTP-5-炔丙基氨基-BHQ2-花菁3,dGTP-5-氨基烯丙基-BHQ2-花菁3,dCTP-7-去氮-7-炔丙基氨基-BHQ2-花菁3,dCTP-5-炔丙基氨基-BHQ2-花菁3,dCTP-5-氨基烯丙基-BHQ2-花菁3,dATP-7-去氮-7-炔丙基氨基-BHQ2-花菁3,dATP-5-炔丙基氨基-BHQ2-花菁3,dATP-5氨基烯丙基-BHQ2-花菁3,dTTP-7-去氮-7-炔丙基氨基-BHQ2-花菁3,dTTP-5-炔丙基氨基-BHQ2-花菁3,dTTP-5-氨基烯丙基-BHQ2-花菁3,dUTP-7-去氮-7-炔丙基氨基-BHQ2-花菁3,dUTP-5-炔丙基氨基-BHQ2-花菁3,dUTP-5-氨基烯丙基-BHQ2-花菁3,ATP-7-去氮-7-炔丙基氨基-BHQ2-花菁3,ATP-5-炔丙基氨基-BHQ2-花菁3,ATP-5-氨基烯丙基-BHQ2-花菁3,dGTP-7-去氮-7-炔丙基氨基-BHQ2-TAMRA,dGTP-5-炔丙基氨基-BHQ2-TAMRA,dGTP-5-氨基烯丙基-BHQ2-TAMRA,dCTP-7-去氮-7-炔丙基氨基-BHQ2-TAMRA,dCTP-5-炔丙基氨基-BHQ2-TAMRA,dCTP-5-氨基烯丙基-BHQ2-TAMRA,dATP-7-去氮-7-炔丙基氨基-BHQ2-TAMRA,dATP-5-炔丙基氨基-BHQ2-TAMRA,dATP-5氨基烯丙基-BHQ2-TAMRA,dTTP-7-去氮-7-炔丙基氨基-BHQ2-TAMRA,dTTP-5-炔丙基氨基-BHQ2-TAMRA,dTTP-5-氨基烯丙基-BHQ2-TAMRA,dUTP-7-去氮-7-炔丙基氨基-BHQ2-TAMRA,dUTP-5-炔丙基氨基-BHQ2-TAMRA,dUTP-5-氨基烯丙基-BHQ2-TAMRA,ATP-7-去氮-7-炔丙基氨基-BHQ2-TAMRA,ATP-5-炔丙基氨基-BHQ2-TAMRA,ATP-5-氨基烯丙基-BHQ2-TAMRA,dGTP-7-去氮-7-炔丙基氨基-BHQ2-ROX,dGTP-5-炔丙基氨基-BHQ2-ROX,dGTP-5-氨基烯丙基-BHQ2-ROX,dCTP-7-去氮-7-炔丙基氨基-BHQ2-ROX,dCTP-5-炔丙基氨基-BHQ2-ROX,dCTP-5-氨基烯丙基-BHQ2-ROX,dATP-7-去氮-7-炔丙基氨基-BHQ2-ROX,dATP-5-炔丙基氨基-BHQ2-ROX,dATP-5氨基烯丙基-BHQ2-ROX,dTTP-7-去氮-7-炔丙基氨基-BHQ2-ROX,dTTP-5-炔丙基氨基-BHQ2-ROX,dTTP-5-氨基烯丙基-BHQ2-ROX,dUTP-7-去氮-7-炔丙基氨基-BHQ2-ROX,dUTP-5-炔丙基氨基-BHQ2-ROX,dUTP-5-氨基烯丙基-BHQ2-ROX,ATP-7-去氮-7-炔丙基氨基-BHQ2-ROX,ATP-5-炔丙基氨基-BHQ2-ROX,ATP-5-氨基烯丙基-BHQ2-ROX,dGTP-7-去氮-7-炔丙基氨基-BHQ2-ALEXA-546,dGTP-5-炔丙基氨基-BHQ2-ALEXA-546,dGTP-5-氨基烯丙基-BHQ2-ALEXA-546,dCTP-7-去氮-7-炔丙基氨基-BHQ2-ALEXA-546,dCTP-5-炔丙基氨基-BHQ2-ALEXA-546,dCTP-5-氨基烯丙基-BHQ2-ALEXA-546,dATP-7-去氮-7-炔丙基氨基-BHQ2-ALEXA-546,dATP-5-炔丙基氨基-BHQ2-ALEXA-546,dATP-5氨基烯丙基-BHQ2-ALEXA-546,dTTP-7-去氮-7-炔丙基氨基-BHQ2-ALEXA-546,dTTP-5-炔丙基氨基-BHQ2-ALEXA-546,dTTP-5-氨基烯丙基-BHQ2-ALEXA-546,dUTP-7-去氮-7-炔丙基氨基-BHQ2-ALEXA-546,dUTP-5-炔丙基氨基-BHQ2-ALEXA-546,dUTP-5-氨基烯丙基-BHQ2-ALEXA-546,ATP-7-去氮-7-炔丙基氨基-BHQ2-ALEXA-546,ATP-5-炔丙基氨基-BHQ2-ALEXA-546,ATP-5-氨基烯丙基-BHQ2-ALEXA-546,dGTP-7-去氮-7-炔丙基氨基-BHQ2-ALEXA-568,dGTP-5-炔丙基氨基-BHQ2-ALEXA-568,dGTP-5-氨基烯丙基-BHQ2-ALEXA-568,dCTP-7-去氮-7-炔丙基氨基-BHQ2-ALEXA-568,dCTP-5-炔丙基氨基-BHQ2-ALEXA-568,dCTP-5-氨基烯丙基-BHQ2-ALEXA-568,dATP-7-去氮-7-炔丙基氨基-BHQ2-ALEXA-568,dATP-5-炔丙基氨基-BHQ2-ALEXA-568,dATP-5氨基烯丙基-BHQ2-ALEXA-568,dTTP-7-去氮-7-炔丙基氨基-BHQ2-ALEXA-568,dTTP-5-炔丙基氨基-BHQ2-ALEXA-568,dTTP-5-氨基烯丙基-BHQ2-ALEXA-568,dUTP-7-去氮-7-炔丙基氨基-BHQ2-ALEXA-568,dUTP-5-炔丙基氨基-BHQ2-ALEXA-568,dUTP-5-氨基烯丙基-BHQ2-ALEXA-568,ATP-7-去氮-7-炔丙基氨基-BHQ2-ALEXA-568,ATP-5-炔丙基氨基-BHQ2-ALEXA-568,ATP-5-氨基烯丙基-BHQ2-ALEXA-568,AMP-7-去氮-7-炔丙基氨基-Dabcyl,AMP-5-炔丙基氨基-Dabcyl,AMP-氨基烯丙基-Dabcyl,AMP-7-去氮-7-炔丙基氨基-BHQ2,AMP-5-炔丙基氨基-BHQ2和AMP-氨基烯丙基-BHQ2。
CN202080097799.4A 2019-12-30 2020-12-30 核酸测序方法 Pending CN115867675A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962955344P 2019-12-30 2019-12-30
US62/955,344 2019-12-30
PCT/US2020/067589 WO2021138508A2 (en) 2019-12-30 2020-12-30 Methods for nucleic acid sequencing

Publications (1)

Publication Number Publication Date
CN115867675A true CN115867675A (zh) 2023-03-28

Family

ID=76687468

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080097799.4A Pending CN115867675A (zh) 2019-12-30 2020-12-30 核酸测序方法

Country Status (7)

Country Link
US (1) US20230080657A1 (zh)
EP (1) EP4085153A2 (zh)
JP (1) JP2023509922A (zh)
KR (1) KR20230002284A (zh)
CN (1) CN115867675A (zh)
CA (1) CA3163573A1 (zh)
WO (1) WO2021138508A2 (zh)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018112412A1 (en) * 2016-12-16 2018-06-21 Innovasion Labs, Inc. Methods for single molecule sequencing

Also Published As

Publication number Publication date
US20230080657A1 (en) 2023-03-16
JP2023509922A (ja) 2023-03-10
WO2021138508A3 (en) 2021-08-12
WO2021138508A2 (en) 2021-07-08
KR20230002284A (ko) 2023-01-05
CA3163573A1 (en) 2021-07-08
EP4085153A2 (en) 2022-11-09

Similar Documents

Publication Publication Date Title
US9200320B2 (en) Real-time sequencing methods and systems
US9447464B2 (en) Single molecule sequencing with two distinct chemistry steps
US7767394B2 (en) Nucleotide compositions and uses thereof
US20220033894A1 (en) Methods for single molecule sequencing
US20210040554A1 (en) Methods for single molecule sequencing
WO2009091847A2 (en) Compositions, methods and systems for single molecule sequencing
US20220090173A1 (en) Enhanced optical detection for nucleic acid sequencing using thermally-dependent fluorophore tags
US20230080657A1 (en) Methods for nucleic acid sequencing
CN115279921A (zh) 检测sars-cov-2的方法和设备
KR20230020950A (ko) 단일 분자 서열분석 및 표적 핵산 검출을 위한 lash 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination