CN116034167A - 用于单分子测序和靶核酸检测的lash方法 - Google Patents

用于单分子测序和靶核酸检测的lash方法 Download PDF

Info

Publication number
CN116034167A
CN116034167A CN202180037735.XA CN202180037735A CN116034167A CN 116034167 A CN116034167 A CN 116034167A CN 202180037735 A CN202180037735 A CN 202180037735A CN 116034167 A CN116034167 A CN 116034167A
Authority
CN
China
Prior art keywords
luminescent
polymerase
nucleotide
luminescent substrate
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180037735.XA
Other languages
English (en)
Inventor
埃南柯·奥泰克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samore Inc
Original Assignee
Samore Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samore Inc filed Critical Samore Inc
Publication of CN116034167A publication Critical patent/CN116034167A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/10Nucleotidyl transfering
    • C12Q2521/101DNA polymerase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/117Modifications characterised by incorporating modified base
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2533/00Reactions characterised by the enzymatic reaction principle used
    • C12Q2533/10Reactions characterised by the enzymatic reaction principle used the purpose being to increase the length of an oligonucleotide strand
    • C12Q2533/101Primer extension
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/103Nucleic acid detection characterized by the use of physical, structural and functional properties luminescence

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本文提供了利用用于发光反应的组分对单个核酸分子进行测序或检测的方法和系统。

Description

用于单分子测序和靶核酸检测的LASH方法
技术领域
本发明涉及用于单分子核酸测序和靶序列检测的方法。
背景技术
当前的测序技术可以分为两大类:短读长测序和长读长测序。在每一类中,将DNA切割成长度不超过一定数量的核苷酸或碱基对(bp)的片段。在所有情况下,将所有DNA片段分散到一个二维阵列中,并通过对应于其中至少一个传感器与一个DNA片段匹配的传感器阵列进行检测。
短读长测序方法是基于简单循环的技术,其包括连接测序(SBL)和合成测序(SBS)。SBL方法包括SOLID(Thermo Fisher)和Complete Genomics(BGI)。使用SOLID,可以达到75个碱基对(bp)左右的读出长度,而使用Complete Genomics方法可以实现28到100个碱基对的读长。使用这些方法,结构变异和基因组组装是不可能的,并且它们易受均聚物错误的影响。它们的运行时间在几天左右。Illumina和Qiagen的GeneReader技术使用具有循环可逆终止的SBS方法。它们可以达到300bp。然而,主要缺点是富含AT和GC的区域代表性不足、替换错误和高的半阳性率。
另一方面,其他SBS方法例如454焦磷酸测序和Ion Torrent(Thermo Fisher)使用单核苷酸添加/终止。454焦磷酸测序可以达到400bp,而Ion Torrent可以达到700bp的读出长度。然而,尽管这些技术速度更快并且有利于即时检测,但它们也具有许多缺点,包括插入/缺失错误居多以及均聚物区域错误。它们不能用于揭示长距离基因组或转录组结构,也不能进行配对末端测序。
长读长测序方法包括两种主要类型,即合成长读长测序或实时长读长测序。Illumina和10X Genomics使用的合成片段拼接长读长测序侧重于利用条形码并允许大片段的计算组装的文库制备。事实上,这些技术并未做到实际的长读长,而是进行短读长,其中使用条形码方法来组织DNA片段,这有助于消除分析过程中的一些复杂性,从而允许获得类似于实际长读长方法的数据。然而,这种方法的成本非常高,部分原因是它需要甚至更高的覆盖率。另一种类型的长读长测序是实时长读长测序,其已被Pacific Biosciences和Oxford Nanopore Technologies使用。与合成长读长测序不同,实时长读长测序不依赖于扩增的DNA的克隆群体,也不需要化学循环。Nanopore的技术具有30%左右的非常高的错误率,这也需要非常高的覆盖率,显著提高了成本。对于Nanopore的技术而言,使用修饰的碱基也特别具有挑战性,其产生了独特的信号,使分析甚至更加复杂。Pacific Biosciences可以达到高达4000-5000bps的读出长度。然而,由于长读长的单次错误率高达15%左右,因此需要高覆盖率,这使得1Gb的测序成本超过1000美元(参见例如Goodwin等,Nat.Rev.Genet.17:333-351;2016)。此外,存在的热背景和这些方法所使用的激发能量会破坏在关键反应中使用的DNA聚合酶,最终限制了这种技术的读出长度和适用性。此外,由于产生的发光是不依赖于被聚合酶附连的核苷酸的通用光谱,因此焦磷酸测序需要基于循环的方法,其中逐一施加每个核苷酸,收集来自于所有结合事件的信号。然后进行清洗循环以除去未结合的核苷酸,从而施加下一个核苷酸。
由于目前的大多数技术都提供每个单元短的核苷酸读出长度(40-100个碱基长左右),因此最具挑战性的问题之一在于将小的序列片段排列成一个大的有意义的序列,并使用强大的超级计算机通过复杂的算法分析高覆盖率数据并进行生成的数据负载的后处理。新一代基于单分子的测序技术可以潜在地解决这个问题。然而,这些现有技术中的每一种都具有高错误率,需要通常30X至100X左右的高覆盖率(同一序列区域的多次读出)才能获得可靠的数据。
因此,对于核酸测序的改进的方法,存在着需求。
发明内容
本文提供了用于对核酸模板进行测序的方法,所述方法包括:
提供测序混合物,其包含(i)聚合酶,(ii)发光酶,(iii)模板核酸和引物,和(iv)聚合酶-发光试剂溶液,该溶液具有由于进行生长的核酸链的模板指导合成的组分,其中所述试剂溶液包含多种类型的各自附连有发光底物的核苷酸偶联物类似物;其中每种类型的核苷酸偶联物类似物具有可以被所述聚合酶切割的附连有发光底物的离去基团(例如PPi-LS),并且每种类型的核苷酸偶联物类似物附连有不同的发光底物,其中所述附连有发光底物的离去基团在相应的核苷酸偶联物类似物与所述模板链的聚合酶依赖性结合后被切掉;
进行核酸合成,使得多个核苷酸偶联物类似物被顺序添加到所述模板,由此:a)核苷酸偶联物类似物与所述聚合酶结合,b)当所述核苷酸偶联物类似物上的附连有发光底物的离去基团被所述聚合酶切掉时,该核苷酸偶联物类似物被所述聚合酶掺入到所述模板链上,其中所述附连有发光底物的离去基团与所述发光酶在发光反应中结合,其中所述发光底物被所述发光酶催化,在有限的时间段内产生核苷酸特异性发光;以及
在核酸合成进行时检测核苷酸特异性发光信号(光),并使用在每个离散的发光时间段中检测到的核苷酸特异性发光信号来确定所述模板核酸的序列。
因此,本文提供了一种用于实时或基于循环的单分子测序方法LASH(连续杂交发光激活)。在这种方法中,发光底物被附连到各种不同核苷酸(例如dNTP)的磷酸例如γ磷酸等。每个核苷酸带有具有不同光谱的发光底物。聚合酶接受这种修饰的核苷酸作为底物。每当聚合酶将互补核苷酸结合到模板链时,它释放出附连有所述发光底物的焦磷酸并且对所述被聚合酶结合到模板链中的核苷酸来说特有的。
对于每种不同核苷酸来说,所述被附连的发光底物修饰的焦磷酸(在本文中被称为附连有发光底物的离去基团或PPi-LS)具有独特的光谱,并与发光酶(即萤火虫萤光素酶、叩甲虫萤光素酶、高斯萤光素酶、海肾萤光素酶、微过氧化物酶、髓过氧化物酶、辣根过氧化物酶、过氧化氢酶、黄嘌呤氧化酶、来自于Arthromyces ramosus的细菌过氧化物酶、碱性磷酸酶、在作为底物的吲哚酚偶联物存在下的β-D-半乳糖苷酶和b-葡萄糖苷酶、乳酸氧化酶、酰基辅酶A合成酶和酰基辅酶A氧化酶、二胺氧化酶、3-a羟基类固醇脱氢酶或葡萄糖-6-磷酸脱氢酶等)相互作用,以产生对应于掺入到模板链中的碱基或核苷酸的短寿命核苷酸特异性发光信号。实时测序通过读取所述具有对应于所述附连的相应核苷酸的独特光谱的短寿命脉冲来实现。
本发明的测序方法(在本文中也被称为LASH测序方法;连续杂交发光激活)的关键优点在于所述聚合酶在本发明的反应条件中例如被附连到特定表面或经受用于产生信号的外部光激发的多次暴露时不被损坏,而使用现有方法时发生损坏。本发明的方法不需要对聚合酶进行重大修饰,也不需要将它附连到表面和将它暴露到外部光源,这对聚合酶执行其天然的链延伸功能造成压力。这有利地产生了作用时间更长的聚合酶,能够达到非常长的读出长度,具有与在其原生环境中发生的同样精确的高保真度,与现有方法相比需要的覆盖率低得多。
例如,在本发明的特定实施方式中,将单个聚合酶或多个聚合酶约束在测序反应混合物中,例如在单个液滴中或类似的情况,其中所述聚合酶不经受外部光激发即可产生待检测的dNTP掺入信号。
本发明的方法具有各种不同的用途,包括全基因组测序、SNP变异检测等。本发明的方法与现有方法相比的一个优点是在核苷酸特异性发光反应(例如使用海洋萤光素酶和腔肠素或细菌萤光素酶和FMNH2等)中利用附连有发光底物的修饰的核苷酸偶联物类似物(例如附连有发光底物的核苷酸),以产生可控、独特定义、离散和/或瞬时的有限核苷酸特异性发光信号。已令人吃惊地发现,所述附连有发光底物的离去基团可以在使用海洋萤光素酶和腔肠素或细菌萤光素酶和FMNH2等的核苷酸特异性发光反应中起作用。本发明的方法与现有方法相比的另一个优点是发光反应使用的光强度降低,使得对DNA聚合酶的损坏不会发生,而大多数常规方法需要使用高强度光的外部激发,最终使聚合酶变性。例如,与现有测序方法相比产生的发光光强度可以降低至少5倍、10倍、25倍、50倍、75倍、100倍直到至少1,000倍。在特定实施方式中,光强度的降低可以是至少5倍、10倍、25倍、50倍、75倍、100倍、200倍、300倍、400倍、500倍、600倍、700倍、800倍、900倍、1000倍、2000倍等。这个优势导致DNA聚合酶的作用时间更长,从而产生更长的读出长度。
在特定实施方式中,本文提供的本发明的方法是一种单分子测序技术,其基于在单个聚合酶按顺序掺入dNTP时监测它们的结果。在特定实施方式中,本发明涵盖了一种过程,其中每当聚合酶掺入与模板互补的dNTP或其类似物时,在所述掺入过程中瞬时、独特和/或离散地产生核苷酸特异性发光信号,其中此类核苷酸特异性发光信号由瞬时、独特和/或离散的发光反应引起。换句话说,所述发光反应通过激发光谱等引起所述相应的发光底物发射有限时间量的特异性针对并对应于该特定dNTP的可检测信号。对于下一个dNTP掺入来说重复所述过程(图1)。
更具体来说,每当聚合酶将修饰的脱氧核糖核苷三磷酸(dNTP)核苷酸偶联物类似物掺入到与模板DNA互补的链中时,产生特异性针对附连的核苷酸的类型的发光信号(例如核苷酸特异性发光信号)。存在5种类型的dNTP,即脱氧腺苷三磷酸(dATP)、脱氧鸟苷三磷酸(dGTP)、脱氧胞苷三磷酸(dCTP)、脱氧胸苷三磷酸(dTTP)和脱氧尿苷三磷酸(dUTP)。将这些dNTP中的四个或五个用于模板指导的核酸合成反应,以识别(即调用)它在模板核酸链中的互补体(例如腺嘌呤、鸟嘌呤、胞嘧啶或胸腺嘧啶),从而对所述模板核酸链进行测序。
每个修饰的核苷酸偶联物类似物当在被聚合酶附连到互补链时,从所述附连的发光底物产生独特的发光信号(例如411、417、428、440、484、509nm等的波长)。在核酸合成链延伸反应中,可以使用dTTP或dUTP或两者的任何组合来调用(即识别)序列中的互补腺嘌呤(ATP)。如果在所述反应中同时使用修饰的dTTP和dUTP类似物,则它们各自可以附连有产生相同波长信号的相同发光底物,或者各自可以附连有不同的发光底物。在所述核苷酸偶联物类似物与先前附连的核苷酸偶联物类似物的3’端部分的连接完成后,所述由附连有发光底物的离去基团产生的发光被适合的发光传感器和/或检测装置检测,然后在某些实施方式中,它随后被该相应的dNTP掺入的发光反应的衰减迅速终止。换句话说,掺入到模板链中的每个dNTP产生离散的、有限时长的光脉冲(发光信号),其对相应的dNTP掺入事件来说是独特且指示性的,允许调用或识别所测序的模板核酸中的特定互补碱基。
在其他实施方式中,所述由附连有发光底物的离去基团产生的发光被放大并被适合的发光传感器和/或检测装置检测,然后在某些实施方式中,它随后被该相应的dNTP掺入的发光反应的衰减迅速终止。
所需模板核酸的测序通过检测每当核苷酸被添加到互补链时产生的揭示核苷酸的类型的发光来实现。因此,每个特定核苷酸附连物都会产生可以被发光传感器检测的发光信号的短峰。结果,产生了一系列连续的波长信号的数据陈列,其可以被转换成相应的核苷酸序列的数据陈列。
本文公开的本发明方法提供的优势在于其简单性和创新的化学方法,其显著降低了检测期间的背景信号,从而提高了灵敏度。根据本发明的方法,涉及试剂和酶的反应条件的较少修改提高了特异性、效率和速率。同样根据本发明的方法,聚合酶在接近理想的条件下运转,并且预期通过一起利用高灵敏度和特异性而达到每个DNA聚合酶分子数万个碱基左右的非常长的读出长度,并且产生的数据需要明显更少的后处理和分析。本文公开的本发明方法的组合特点降低了相应的装置和每次运行的成本,同时与竞争性技术相比,除了显著减少每次测试的时间之外还实现了高特异性。因此,所公开的本发明的方法和系统允许实现成本非常低的实时核酸测序系统,而对特异性没有不利影响。
本文还提供了检测样品中靶核酸序列的存在的方法,所述方法包括:
提供延伸混合物,其包含(i)聚合酶,(ii)发光酶,(iii)模板核酸样品,(iv)与特定靶核酸序列杂交(例如与其互补)的引物-探针,和(v)聚合酶-发光试剂溶液,该溶液具有用于进行生长的核酸链的模板指导合成的组分,其中所述试剂溶液包含多种类型的各自附连有发光底物的核苷酸偶联物类似物;其中每种类型的核苷酸偶联物类似物具有可以被所述聚合酶切割的附连有发光底物的离去基团,并且每种类型的核苷酸偶联物类似物附连有相同或不同的发光底物,其中所述附连有发光底物的离去基团在相应的核苷酸偶联物类似物与所述模板链的聚合酶依赖性结合后被切掉;
进行核酸延伸合成,使得在所述引物-探针杂交到所述靶核酸序列的情况下多个核苷酸偶联物类似物被依次添加到所述模板,由此:a)核苷酸偶联物类似物与所述聚合酶结合,b)当所述核苷酸偶联物类似物上的附连有发光底物的离去基团被所述聚合酶切掉时,该核苷酸偶联物类似物被所述聚合酶掺入到所述模板链上,其中附连有发光底物的离去基团与所述发光酶在发光反应中结合,其中所述发光底物被所述发光酶催化,以产生发光;以及
在核酸合成进行时检测来自于所述发光的光,由此光的检测指示了所述特定靶核酸序列的存在。
在特定实施方式中,对靶核酸的量进行定量。在一个实施方式中,靶核酸的量基于所述发光的强度进行定量。在特定实施方式中,每种类型的核苷酸偶联物类似物附连有相同的发光底物。在特定实施方式中,使用多个聚合酶。
本发明的靶核酸序列检测和/或定量方法的一个优点是不需要温度循环或DNA拷贝数的实质性增加即可检测特定序列。使用本发明的方法,在某些实施方式中,从引物-探针与其靶核酸的杂交产生的光在靶核酸模板的长度的基础上是基本上连续的,产生链延伸发光反应代替拷贝数的指数增加。
本文提供的本发明的光信号靶核酸检测方法的另一个优点在于它们在提供可检测、可执行的信号方面比PCR快得多。例如,典型的PCR通常具有多达30-40个左右的热循环,其中每个循环花费几分钟来完成,导致总运行持续时间为至少1小时至几小时。人们可以使用PCR进行更短的运行,但放弃了特异性;并且那些较短的运行案例在引物、探针和模板配置方面非常受限。相反,本发明的用于检测和/或定量靶核酸序列的光信号检测方法(例如LACES)一旦延伸开始就开始产生可检测的信号。在某些实施方式中,非常早(例如在几分钟内等)产生的初始信号相对于较晚的信号是最高且最特异的信号。因此,通过LACES产生的信号的演变可以通过初期快速上升随后长期衰减来描述;而使用定量PCR时,它是指数增加,在许多循环和长得多的时间框后变得可检测,最终达到平台。更具体来说,LACES在初始快速上升期中提供非常特异的信号,其发生得比qPCR早得多,并且不放弃特异性。
例如,在本发明的特定实施方式中,将单个聚合酶或多个聚合酶限制在核酸链延伸反应混合物中(例如在大体积反应中或单个液滴中),其中所述聚合酶不经受外部光激发即可产生待检测的dNTP掺入信号。
本文还提供了发光底物-核苷酸偶联物类似物,其包含脱氧核糖核苷酸(dNTP)或其类似物和附连到它的发光底物。在某些实施方式中,所述发光底物-核苷酸偶联物类似物中的核苷酸(dNTP)是修饰的核苷酸类似物。在特定实施方式中,所述dNTP选自dATP、dTTP、dGTP、dCTP和dUTP、dATPαS、dGTPαS、dCTPαS、dTTPαS和dUTPαS。在某些实施方式中,所述核苷酸偶联物类似物能够作为所述聚合酶和选择性切割活性的底物。
在一个实施方式中,所述核苷酸偶联物类似物是在多磷酸链中具有三个或更多个磷酸的多磷酸核苷,并且发光底物附连到所述多磷酸链的在掺入到生长的模板指导的链中之后被切掉的部分。在特定实施方式中,所述多磷酸是纯粹的多磷酸(--O--PO3-)、焦磷酸(PPi)或其中具有取代的多磷酸。在其他实施方式中,所述发光底物选自腔肠素、FMNH2或其类似物。在特定实施方式中,所述发光底物附连到末端磷酸。在其他实施方式中,当在所述发光底物-核苷酸偶联物被掺入到所述模板链中时通过所述聚合酶产生所述PPi附连有发光底物的离去基团时,所述附连有发光底物的焦磷酸或附连有发光底物的离去基团能够与相应的萤光素酶结合。
在特定实施方式中,所述PPi附连有发光底物的离去基团选自PPi-LS、PPi-C或PPi-FMNH2。在其他实施方式中,所述核苷酸偶联物类似物具有独特的发光信号。在特定实施方式中,所述发光信号是选自250nm–750nm范围内的波长。在另一个实施方式中,所述发光信号是选自411、417、428、440、484和509nm的波长。
本文还提供了一种核苷酸偶联物类似物的链延伸集合,其包含至少4种不同的脱氧核糖核苷酸(dNTP),使得所述链延伸集合可以掺入到模板指导的生长的核酸链的合成中。在一个实施方式中,每种相应的dNTP或其类似物使用不同的、相对于其他dNTP独特的发光底物进行修饰,使得每当聚合酶将修饰的脱氧核糖核苷三磷酸(dNTP)核苷酸偶联物类似物掺入到与模板DNA互补的链中时,产生特异性针对所述附连的相应核苷酸的发光信号。在另一个实施方式中,如果在反应中同时使用修饰的dTTP和dUTP类似物,则它们可以各自附连有产生相同波长信号的相同发光底物,或者可以各自附连有不同的发光底物。
在特定实施方式中,所述dNTP选自dATP、dTTP、dGTP、dCTP和dUTP、dATPαS、dGTPαS、dCTPαS、dTTPαS和dUTPαS。在其他实施方式中,所述发光底物选自腔肠素、FMNH2或其类似物。在其他实施方式中,所述核苷酸偶联物类似物的链延伸集合可以选自腔肠素-dNTP偶联物1(图7)、腔肠素-dNTP偶联物2(图8)或腔肠素-dNTP偶联物3(图9)。
附图说明
图1A示出了本发明的测序方法的一个示例性实施方式的总体图解,其为每种核苷酸使用由相同发光酶催化的四种不同的发光底物类似物。
图1B示出了本发明的测序方法的一个示例性实施方式的总体图解,其为每种核苷酸使用四种不同的发光底物-酶系统,使得每种核苷酸存在由四种不同的相应发光酶催化的四种不同的发光底物类似物。还设想了附加实施方式,其为4种修饰的核苷酸(例如A、T、G和C)上的4种不同发光底物类似物使用仅仅2或3种不同的发光底物-酶。
图2A示出了本发明的测序方法的一个示例性实施方式的总体图解,其使用腔肠素类似物和海肾萤光素酶或高斯萤光素酶中的任一者或两者:DNA聚合酶使用用相应的腔肠素发光底物修饰的dNTPs作为模板链的构件(例如dNTP-C1)。在与聚合酶结合后,所述含有腔肠素发光底物的焦磷酸(例如附连有发光底物的离去基团或PPi-C1)被切掉用于后期反应。
图2B示出了其中附连有腔肠素类似物发光底物的相应的核苷酸偶联物类似物与模板链的聚合酶依赖性结合以及附连有腔肠素类似物的焦磷酸-C1离去基团(例如附连有发光底物的离去基团)(PPi-C1)的切除,其接下来将与萤光素酶(例如海肾萤光素酶、高斯萤光素酶等)相互作用。
图2C示出了用于本文阐述的发光反应的试剂,即附连有发光底物的离去基团(PPi-C1)和海肾和/或高斯萤光素酶。示出了这些试剂在发光反应中的相互作用,附连有腔肠素的焦磷酸(PPi-C1)将从这种相互作用发光。每种类型的核苷酸偶联物类似物dNTP存在独特的发光底物(例如腔肠素或黄素类似物),使得每种类型的核苷酸产生对应于该相应碱基的独特的发光信号。
图3A示出了本发明的测序方法的一个示例性实施方式的总体图解,其使用黄素单核苷酸类似物(FMNH2类似物)和细菌萤光素酶:DNA聚合酶使用用相应的腔肠素发光底物修饰的dNTPs作为模板链的构件(例如dNTP-FMNH2)。在与聚合酶结合后,所述含有腔肠素发光底物的焦磷酸(例如附连有发光底物的离去基团或PPi-FMNH2)被切掉用于后期反应。
图3B示出了其中附连有黄素单核苷酸类似物(FMNH2类似物)发光底物的相应的核苷酸偶联物类似物与模板链的聚合酶依赖性结合以及附连有FMNH2类似物的焦磷酸-FMNH2离去基团(例如附连有发光底物的离去基团)(PPi-FMNH2)的切除,其接下来将与细菌萤光素酶或类似物相互作用。
图3C示出了本文阐述的发光反应的试剂,即附连有发光底物的离去基团(PPi-FMNH2)和细菌萤光素酶。示出了这些试剂在发光反应中的相互作用,附连有FMNH2的焦磷酸(PPi-FMNH2)将从这种相互作用发光。每种类型的核苷酸偶联物类似物dNTP存在独特的发光底物(例如腔肠素或黄素类似物),使得每种类型的核苷酸产生对应于该相应碱基的独特可检测的发光信号。
图4示出了用于腔肠素的大规模合成的示例性策略。
图5示出了腔肠素类似物-1的合成。
图6示出了腔肠素类似物-2的合成。
图7示出了腔肠素-dNTP偶联物-1的合成。
图8示出了腔肠素-dNTP偶联物-2的合成。
图9示出了腔肠素-dNTP偶联物1、2和3的合成。
图10A示出了将LASH反应试剂限制在对应于液滴的限制区域中的实施方式;并示出了在具有多个聚合酶和多个引物的测序混合物中的单个靶核酸模板。
图10B示出了将LASH反应试剂限制在对应于液滴的限制区域中的实施方式;并示出了具有多个靶核酸模板、多个聚合酶和单个引物的测序混合物,使得只有单个靶核酸模板被测序。
图10C示出了将LASH反应试剂限制在对应于液滴的限制区域中的实施方式;并示出了在具有多个聚合酶的测序混合物中的单个自引发靶核酸模板。
图11A示出了其中将引物附连到固体表面基质,用于后续靶模板核酸的结合的配置。
图11B示出了其中将靶核酸模板附连到固体表面基质,用于后续引物的结合的配置。
图12A示出了使用多个聚合酶在单个靶核酸模板上启动本发明的测序方法的实施方式。
图12B示出了其中靶模板的测序基本上是连续的实施方式,因为当开始合成互补链的聚合酶越过它典型的读出长度然后从模板脱落或解离时,反应混合物中的许多其他聚合酶中的另一个立即与模板结合并继续互补链的测序合成。
图13示出了其中大量相同的引物分别在离散位置上与底物结合,所述位置可以在单个总体反应室中或在各个离散的反应室中。这些引物结合基本上相同的靶模板核酸。
图14示出了其中大量不同(相互排他)的引物分别在离散位置与底物结合,所述位置可以在单个总体反应室中或在各个离散的反应室中。这些引物结合不同的相互排他的靶模板核酸。
图15示出了dNTP掺入到模板链中的生物化学过程的简化示意图。
图16A示出了本发明的测序方法的一个示例性实施方式的总体图解,其使用黄素单核苷酸类似物(FMNH2类似物)和细菌萤光素酶。
图16B示出了其中附连有黄素单核苷酸类似物(FMNH2类似物)发光底物的相应的核苷酸偶联物类似物与模板链的聚合酶依赖性结合以及附连有FMNH2类似物的焦磷酸-FMNH2离去基团(例如附连有发光底物的离去基团)(PPi-FMNH2)的切除,其接下来将与细菌萤光素酶等相互作用。
图16C示出了氧化还原酶/萤光素酶信号放大回路的开始,其中附连有发光底物的离去基团(PPi-FMNH2)在本文阐述的发光信号反应中被细菌萤光素酶氧化(用FMN*描绘)。
图16D示出了氧化还原酶反应,其中焦磷酸离去基团上氧化的发光底物FMN*被还原回FMNH2,以回环到图16C的发光反应中,从而完成氧化还原酶/萤光素酶的酶促回路。
详细描述
本文提供了对核酸模板进行测序的方法,其中所述方法包括:
提供测序混合物,其包含(i)聚合酶,(ii)发光酶,(iii)模板核酸和引物,和(iv)聚合酶-发光试剂溶液,该溶液具有用于进行生长的核酸链的模板指导合成的组分,其中所述试剂溶液包含多种类型的各自附连有发光底物的核苷酸偶联物类似物;其中每种类型的核苷酸偶联物类似物具有可以被所述聚合酶切割的附连有发光底物的离去基团,并且每种类型的核苷酸偶联物类似物附连有不同的发光底物,其中所述附连有发光底物的离去基团在相应的核苷酸偶联物类似物与所述模板链的聚合酶依赖性结合后被切掉;
进行核酸合成,使得多个核苷酸偶联物类似物被依次添加到所述模板,由此:a)核苷酸偶联物类似物与所述聚合酶结合,b)当所述核苷酸偶联物类似物上的附连有发光底物的离去基团被所述聚合酶切掉时,该核苷酸偶联物类似物被所述聚合酶掺入到所述模板链上,其中所述附连有发光底物的离去基团与所述发光酶在发光反应中结合,其中所述发光底物被所述发光酶催化,在有限的时间段内产生核苷酸特异性发光;以及
在核酸合成进行时检测核苷酸特异性发光信号(光),并使用在每个离散的发光时间段中检测到的核苷酸特异性发光信号来确定所述模板核酸的序列。
当在本文中使用时,短语“发光酶”或其语法变化形式例如“发光性酶”等是指可以在发光反应中催化附连有发光底物的离去基团(即PPi-LS)中的发光底物(发光性底物)的任何分子或酶。发光底物和发光性底物两者以及发光酶和发光性酶两者在本文中可互换使用。在本文中使用的示例性发光酶包括萤光素酶,例如海洋或细菌萤光素酶等。在其他实施方式中,示例性发光酶包括发光蛋白,例如水母发光蛋白、奥贝林蛋白(obelin)等。例如,在一个实施方式中,当使用腔肠素作为发光底物时,在萤光素酶反应中使用海洋萤光素酶,例如海肾萤光素酶、高斯萤光素酶等或其任何组合。在使用腔肠素的其他实施方式中,在反应混合物中使用发光蛋白,例如水母发光蛋白、奥贝林蛋白(obelin)等或其任何组合。本文中还设想了在萤光素酶反应中使用萤光素酶和发光蛋白的任何组合,只要总体发光反应能够区分来自于每个被独特修饰的核苷酸偶联物类似物的相应的发光信号(例如光谱)即可。
在其他实施方式中,当使用FMNH2作为发光底物时,适合的发光酶是一般来说从包括弧菌属和发光杆菌属在内的各种不同细菌属获得的细菌萤光素酶。更具体来说,适合于在本文中使用的生物发光萤光素酶种类包括从例如哈维氏弧菌(Vibrio harveyi)、费氏弧菌(Vibrio fischeri)(可以从Millipore,SIGMA商购)、费氏发光杆菌(Photobacteriumfischeri)、明亮发光杆菌(Photobacterium phosphoreum)、鳆发光杆菌(P.leiognathi)和发光光状杆菌(P.luminescens)等获得的萤光素酶。
当在本文中使用时,短语“发光底物”、“发光性底物”或其语法变化形式是指可以附连到核苷酸上的任何位置处的任何分子或组成部分,使得在该修饰的核苷酸并入到延伸的核酸链中之后,在发光酶存在下作为发光反应的结果产生发光信号。适合在本文中使用的发光底物包括腔肠素及其类似物、黄素单核苷酸(FMNH2)或其类似物、鲁米诺、异鲁米诺及其衍生物、吖啶衍生物、二氧杂环丁烷类、过氧草酸衍生物等。
腔肠素是参与由包括海肾萤光素酶(Rluc)、高斯萤光素酶(Gluc)在内的各种海洋萤光素酶和包括水母发光蛋白和奥贝林蛋白(obelin)在内的发光蛋白催化的生物发光的底物。腔肠素提供的一个重要优点在于它不需要ATP作为其萤光素酶反应中的辅因子,这不同于其他萤光素酶如萤火虫和叩甲虫萤光素酶的辅因子需求。腔肠素提供的另一个优点是它的生物发光光谱可以通过化学修饰来调整。因此,适合在本文中用作发光底物的腔肠素类似物可以从各种不同的来源商购,包括Molecular Probes(Eugen,OR)、Biotium(Freemont,CA)等。例如,可以从Molecular Probes(Eugen,OR)获得的腔肠素类似物包括C-2944(天然的)、C-14260(腔肠素cp)、C-6779(腔肠素f)、C-6780(腔肠素h)、C-14261(腔肠素hcp)、C-6776(腔肠素n)。可以从Biotium获得的腔肠素类似物包括目录号No.10110(天然腔肠素)、No.10124(腔肠素400a)、No.10112(腔肠素cp)、No.10114(腔肠素f)、No.10117(腔肠素fcp)、No.10111(腔肠素h)、No.10113(腔肠素hcp)、No.10121(腔肠素i)、10116(腔肠素ip)、No.10122(甲基腔肠素,2-甲基类似物)、No.10115(腔肠素n)等。使用海肾萤光素酶与腔肠素类似物的发光特性参见表1。
表1.使用海肾萤光素酶与腔肠素类似物的发光特性*
Figure BDA0003960857440000151
*数据来自于Biochem.Biophys.Res.Commun.233,349(1997)
使用发光蛋白水母发光蛋白与腔肠素类似物的发光特性参见表2。
表2.使用脱辅基水母发光蛋白与腔肠素类似物的发光特性*
Figure BDA0003960857440000152
Figure BDA0003960857440000161
*数据来自于Biochem.J.261,913(1989)
其他适合用于本文中的腔肠素类似物在Jiang等,Photochem.Photobiol.Sci.2016,15,4660480中被阐述为化合物1-120,在Jiang等,Org.Biomol.Chem.2017,15,7008-7018中被阐述为DeepBlueC和化合物B1-B12,并且在Lindberg等,Chem.Sci.,2013,4,4395-4400中被阐述为化合物CoelPhos、2-Bno-TEG-CTZ和6-BnO-TEG-CTZ;每个所述文献为所有目的整体通过参考并入本文。
使用在Mitchell等,J.Biol.Chem.,Vol.244,No.10,2572-2576(1969)中阐述的公知的机制,细菌萤光素酶利用氧气(O2)和还原的脂肪酸(RCHO)催化FMNH2的氧化,并释放出氧化形式的黄素单核苷酸的类似物(FMN)和脂肪酸(RCOOH)。在所述反应中消耗分子氧,这令人联想起有氧呼吸中的一部分电子传递系统,只是氧不充当最终电子受体,而是与萤光素酶和FMNH2相互作用产生光。作为这个过程的结果,每当新的核苷酸被附连到核酸模板链时,产生短时间的发光。已发现FMN适应于各种不同的官能化,导致发光的光谱迁移。参见例如在Mitchell等,J.Biol.Chem.,Vol.244,No.10,2572-2576(1969);Salzmann等,J.Phys.Chem.A 2009,113,9365-9375;Eckstein等,Biochemistry,1993,32,404-4111等中阐述的黄素单核苷酸类似物;每个所述杂志参考文献为所有目的整体通过参考并入本文。本领域中已知的在本文中使用的示例性黄素单核苷酸类似物包括1-脱氮核黄素、5-脱氮核黄素、7,8-二甲基-异丙基核黄素、8-异丙基核黄素、8-取代的3,7,10-三甲基异咯嗪、3-甲基-光黄素、3,7,10-三甲基异咯嗪和3,7-二甲基-8-甲氧基-10-乙基异咯嗪、3-甲基-4a,5-丙桥-4a,5-二氢异咯嗪、3.7.10-三甲基-4a,5-丙桥-4a,5-二氢异咯嗪、3.7.10-三甲基-8-氯-4a,5-丙桥-4a,5-二氢-异咯嗪、3.7.10-三甲基-8-甲氧基-4a,5-丙桥-4a,5-二氢异咯嗪和3,7,10-三甲基-8-氨基-4a,5-丙桥-4a,5-二氢异咯嗪、FAD、核黄素、Iso-FMN、2-硫代-FMN、2-吗啉代,2-脱氧-FMN、2-(β-羟基乙基氨基)-FMN、3-乙酰基-FMN、2-苯亚胺基-FMN、异核黄素、四乙酰基异核黄素、光黄素-3-乙酸、中性红等。
在一个实施方式中,将不同的FMNH2类似物附连到所述四种或五种核苷酸(例如dNTPs)中的每一个,使得每个FMNH2类似物在发光反应中具有不同的核苷酸特异性发光光谱(例如波长信号),特异性对应于被附连的核苷酸的类型。换句话说,每种核苷酸可以用不同的FMN类似物修饰,在与细菌萤光素酶相互作用时产生特异性针对所述核苷酸的不同发光光谱。FMNH2在一个末端具有磷酸基团,该基团可以作为末端基团附连到特定核苷酸的磷酸酯链。本领域技术人员将会认识到,这可以通过化学法或使用诸如ATP合成酶等的酶通过酶法来进行。
当在本文中使用时,短语“测序混合物”是指用于执行本发明的单分子测序反应的组分。在一个实施方式中,所述测序混合物包含:(i)聚合酶,(ii)发光酶,(iii)模板核酸和引物,和(iv)聚合酶-发光试剂溶液,该溶液具有用于进行生长的核酸链的模板指导合成的组分,其中所述试剂溶液包含多种类型的各自附连有发光底物的核苷酸偶联物类似物;其中每种类型的核苷酸偶联物类似物具有可以被所述聚合酶切割的附连有发光底物的离去基团,并且每种类型的核苷酸偶联物类似物附连有不同的发光底物。
根据本发明,所使用的测序混合物在本发明的测序方法中相比于以前的测序方法提供了下述优点:所使用的聚合酶在其理想状态下发挥作用;不需对聚合酶进行修饰;高核苷酸(例如dNTP)浓度的使用可获得最佳效率;通过发光反应只产生非常低强度、离散和时长有限的可检测光信号,这有利地减少了聚合酶的变性;基本上不提供(或提供非常低的)背景,这提高了碱基调用的特异性和灵敏度;不需要精密的光学器件或纳米结构化芯片设计,这降低了成本。本发明的方法还提供了高特异性,这降低了对高覆盖率的需求。由于每个事件相继产生短时信号,因此这种方法不依赖于仅仅一个聚合酶分子。因此,如果所述聚合酶在几个连续碱基附连(例如10、100、1,000或1,000,000个连续碱基附连)后从模板寡核苷酸上脱落,则新的聚合酶结合到先前的聚合酶脱落之处,以保持连续地附连碱基。通过这种方式,读出长度实际上是不受限制的。长达整个基因长度(几十Kbs)或跨越几个基因长度(几百Kbs)或甚至更大的区段例如几个Mbs的读出长度是可能的。这不仅使新的应用成为可能,而且相对于现有技术方法极大减少了所需的计算机处理。
当在本文中使用时,短语“聚合酶-发光试剂溶液”或其语法变化形式或“试剂溶液”是指执行所述生长的核酸的模板指导的合成和发光反应所必需的组分的混合物。在一个实施方式中,将dNTPs用作为发光底物的腔肠素和/或腔肠素类似物修饰。在这个实施方式中,与聚合酶例如DNA pol I和发光酶一起使用的聚合酶-发光试剂溶液包含海洋萤光素酶(例如海肾萤光素酶(Rluc)、高斯萤光素酶(Gluc)等)和适合浓度的修饰的dNTP类似物,例如本文描述的腔肠素修饰的核苷酸偶联物类似物。在某些实施方式中,所述核苷酸偶联物类似物可以在其中具有4个或更多个磷酸,并且所述腔肠素类似物被附连到末端磷酸。例如,本文中设想了具有4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个磷酸的核苷酸偶联物类似物,并且腔肠素类似物附连到末端磷酸。
在另一个实施方式中,将dNTPs用还原形式的黄素单核苷酸(FMNH2)的类似物作为发光底物进行修饰。在特定实施方式中,将黄素单核苷酸或其类似物附连到脱氧核苷酸的末端磷酸。在这个实施方式中,与聚合酶例如DNA pol I和发光酶一起使用的聚合酶-发光试剂溶液包含细菌萤光素酶和适合浓度的修饰的dNTP类似物,例如本文描述的FMNH2修饰的核苷酸偶联物类似物。正如上文中阐述的,在某些实施方式中,所述核苷酸偶联物类似物可以具有4个或更多个磷酸,并且所述FMNH2类似物被附连到末端磷酸。例如,本文中设想了具有4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个磷酸的核苷酸偶联物类似物,并且FMNH2类似物附连到末端磷酸。
在本文设想的另一个实施方式中,所述发光底物可以被附连到相应dNTP上的任何其他位置,只要在将该修饰的dNTP类似物掺入到延伸的序列中之后所述发光底物能够与发光酶组合以经历核苷酸特异性发光反应,产生核苷酸特异性发光信号即可。在其他实施方式中,dNTPs上适合附连发光底物的其他位置包括碱基和糖。
当在本文中使用时,短语“发光反应”是指可以产生不是完全或仅仅从发射体的温度衍生能量的光的发射(即白炽光之外的光的发射)的任何反应。发光可以由化学反应、电能、亚原子运动或晶体上的应力引起。“发光”包括但不限于荧光、磷光、热发光、化学发光、电发光和生物发光。“发光体”是指表现出发光的物体。在特定实施方式中,所述光在可见光谱中。然而,本发明不限于可见光,而是包括任何频率的电磁辐射。在特定实施方式中,本文中使用的发光反应由发光酶萤光素酶(例如海洋或细菌萤光素酶)引起,所述发光酶催化发光底物例如腔肠素或其类似物或黄素单核苷酸(FMNH2)或其类似物以产生发光。
例如,在一个实施方式中,本文中设想的迭代测序循环涉及第一个dNTP掺入反应,其导致产生附连有发光底物的离去基团(LSALG或PPi+LS)。在第二个反应即发光反应中,萤光素酶催化LSALG以产生光。因此,在每个相应的dNTP类似物掺入后,溶液中的每个附连有发光底物的焦磷酸(PPi+C或PPi+FMNH2)分子产生光量子。本发明不限于所使用的萤光素酶类型。尽管某些公开的实施方式利用海洋或细菌萤光素酶,但本领域中已知的可以催化本文描述的发光底物的任何萤光素酶均可用于所公开的方法中。
当在本文中使用时,“聚合酶”是指负责执行核酸合成的公知的蛋白质。本文中使用的优选聚合酶是DNA聚合酶。在天然聚合酶介导的核酸合成中,在聚合酶、模板核酸序列和充当合成过程的起始点的引发序列之间形成复合体。在合成期间,所述聚合酶从反应混合物中取样核苷酸单体,以确定它们与模板序列中的下一个碱基的互补性。当所述取样的碱基与所述下一个碱基互补时,它被掺入到生长的新生链中。这个过程沿着所述模板序列的长度继续,以有效地复制该模板。尽管以简化的示意方式描述,但掺入的实际生物化学过程可能相对复杂。图15中提供了掺入生物化学的图解表述。该图不是核苷酸掺入机制的完整描述。在反应过程中,聚合酶在所述机制中经历一系列构象变化。
如图15中所示,所述合成过程始于步骤2处所述引发的核酸模板(D)与聚合酶(P)的结合。核苷酸(N)与所述复合体的结合发生在步骤4。步骤6代表了聚合酶从开放到闭合构象的异构化。步骤8是核苷酸被掺入到生长链中的化学步骤。在步骤10处,发生聚合酶从闭合到开放位置的异构化。在步骤12处,在掺入后被切掉的多磷酸组分从所述复合体中释放出来。尽管所述图示出了焦磷酸的释放,但应该理解,当使用核苷酸或核苷酸偶联物类似物时,所述释放的组分可能不同于焦磷酸。在许多情况下,本发明的系统和方法使用在其末端磷酸上具有发光底物(例如腔肠素、FMNH2或类似物)的核苷酸偶联物类似物,使得所述释放的组分包含与发光底物相连的多磷酸(例如附连有发光底物的离去基团或PPi-LS)。在步骤14处,使用天然核苷酸或核苷酸偶联物类似物底物,所述聚合酶然后在模板上移位。在移位后,所述聚合酶处于添加另一个核苷酸的位置中并继续所述反应循环。
适合于在本文中使用的聚合酶包括DNA聚合酶,其根据不同的系统发育关系可以分为六大类,例如大肠杆菌Pol I(A类)、大肠杆菌Pol II(B类)、大肠杆菌Pol III(C类)、古菌Pol II(D类)、人类Polβ(X类)以及大肠杆菌UmuC/DinB和真核生物RAD30/着色性干皮病变体(Y类)。对于命名法的综述,参见例如Burgers等,(2001),“真核生物DNA聚合酶:修改命名法的建议”(Eukaryotic DNA Polymerase:proposal for a modified nomenclature),JBiol Chem.276(47):43487-90。对于聚合酶的综述,参见例如Hubscher等,(2002),“真核生物DNA聚合酶”(Eukaryotic DNA Polymerases),Annual Review ofBiochemistry Vol.71:133-163;Alba(2001),“蛋白质家族回顾:复制性DNA聚合酶”(Protein Family Review:Replicative DNA Polymerases),Genome Biology 2(1):reviews 3002.1-3002.4;和Steitz(1999),“DNA聚合酶:结构多样性和共同机制”(DNA Polymerases:structuraldiversity and common mechanisms),J Biol Chem 274:17395-17398;每个所述文献整体通过参考并入本文。许多聚合酶的基本作用机制已被确定。实际上数百种聚合酶的序列是可公开获得的,并且它们中的许多的晶体结构已被确定,或者可以在与同源聚合酶的已解析晶体结构的相似性的基础上来推断。
许多这样的适用于核酸测序的聚合酶可容易地获得。例如,人类DNA聚合酶β可以从R&D系统获得。适合在本文中使用的DNA聚合酶包括可以从Epicenter、GE Health Care、Invitrogen、New England Biolabs、Promega、Roche Applied Science、Sigma Aldrich等获得的DNA聚合酶I。DNA聚合酶I的Klenow片段可以从例如Ambion、Chimerx、eEnzyme LLC、GE Health Care、Invitrogen、New England Biolabs、Promega、Roche Applied Science、Sigma Aldrich等以重组和蛋白酶消化两种版本获得。PHI.29 DNA聚合酶可以从例如Epicentre获得。Poly A聚合酶、反转录酶、测序酶、SP6 DNA聚合酶、T4 DNA聚合酶、T7 DNA聚合酶和各种热稳定DNA聚合酶(Taq、热启动、钛Taq等)可以从各种不同的这些和其他来源获得。其他商品化DNA聚合酶包括可以从New England Biolabs获得的PhusionhM高保真DNA聚合酶,可以从Promega获得的GoTaq.RTM.Flexi DNA聚合酶,可以从EpicentreBiotechnologies获得的RepIiPHI.TM..PHI.29 DNA聚合酶,可以从Stratagene获得的PfuUltra.TM.热启动DNA聚合酶,可以从Novagen获得的KOD HiFi DNA聚合酶,等等。
可用的DNA聚合酶也以各种不同方式进行修饰,以例如降低或消除核酸外切酶活性(许多天然DNA聚合酶具有校对核酸外切酶功能,其干扰例如测序应用),通过制备蛋白酶消化的酶片段例如重组Klenow片段等来简化生产。正如提到的,也已对聚合酶进行修饰,以提供特异性、持续合成能力的改善和标记的核苷酸在聚合酶-DNA-核苷酸复合体中的保留时间的改进(例如Hanzel等人的WO 2007/076057“用于核苷酸类似物掺入的聚合酶”(POLYMERASES FOR NUCLEOTIDE ANALOGUE INCORPORATION)和Rank等人的WO 2008/051530“用于增强核酸测序的聚合酶和试剂”(POLYMERASES AND REAGENTS FOR ENHANCEDNUCLEIC ACID SEQUENCING)),改变分支部分和移位(例如由Pranav Patel等人在2009年9月4日提交的题为“用于改良掺入特性的工程化聚合酶和反应条件”(ENGINEERINGPOLYMERASES AND REACTION CONDITIONS FOR MODIFIED INCORPORATION PROPERTIES)的美国专利申请系列号12/584,481),提高光稳定性(例如由Keith Bjornson等人在2009年3月30日提交的题为“对光损伤有抗性的酶”(Enzymes Resistant to Photodamage)的美国专利申请系列号12/384,110)和提高表面固定的酶的活性(例如Hanzel等人的WO 2007/075987“有活性的表面偶联的聚合酶”(ACTIVE SURFACE COUPLED POLYMERASES)和Hanzel等人的WO 2007/076057“优化表面附连蛋白质的活性的蛋白质工程策略”(PROTEINENGINEERING STRATEGIES TO OPTIMIZE ACTIVITY OF SURFACE ATTACHED PROTEINS))。这些可用聚合酶中的任一种均可按照本发明进行修饰,以减少分支部分形成、提高封闭的聚合酶-DNA复合体的稳定性和/或改变反应速率常数。
作为突变的优选底物以降低分支部分、提高封闭复合体稳定性或改变反应速率常数的DNA聚合酶包括Taq聚合酶、核酸外切酶缺陷的Taq聚合酶、大肠杆菌DNA聚合酶1、Klenow片段、反转录酶、PHI-29相关的聚合酶包括野生型PHI-29聚合酶和此类聚合酶的衍生物例如核酸外切酶缺陷的形式、T7 DNA聚合酶、T5 DNA聚合酶和RB69聚合酶等。
此外,所述聚合酶可以出于应用特异性原因而被修饰,例如为了提高光稳定性,如在2009年3月30日提交的美国专利申请系列号12/384,110中所教导的,为了提高酶在结合到表面时的活性,如在WO 2007/075987和WO 2007/076057中所教导的,或者为了包括纯化或处理标签,如在引用的参考文献中教导的并在本领域中常见的。同样地,本文描述的修饰的聚合酶可以与其他策略组合使用以提高聚合酶性能,例如用于控制聚合酶速率常数的反应条件,如在2009年3月30日提交的题为“双慢步聚合酶系统和方法”(Two slow-steppolymerase systems and methods)的美国专利申请系列号12/414,191中所教导的,所述专利申请为所有目的整体通过参考并入本文。
当在本文中使用时,短语“模板核酸”或“靶模板核酸”是指任何适合的多核苷酸,包括双链DNA、单链DNA、单链DNA发夹、DNA/RNA杂交体、具有用于结合聚合剂的识别位点的RNA和RNA发夹。此外适合作为模板核酸用于本发明的测序方法的靶多核苷酸可以是细胞基因组的特定部分例如内含子、调控区、等位基因、变体或突变、全基因组或其任何部分。在其他实施方式中,所述靶多核苷酸可以是mRNA、tRNA、rRNA、核酶、反义RNA或RNAi。在特定实施方式中,例如在设想了仅将单个聚合酶用于测序特定靶的情况下,所述靶多核苷酸可以具有任何长度,例如在约10个碱基直至约100,000个碱基之间、约10,000个碱基直至约90,000个碱基之间、约20,000个碱基直至约80,000个碱基之间、约30,000个碱基直至约70,000个碱基之间、约40,000个碱基直至约60,000个碱基之间或更长,典型的范围在约10,000–50,000个碱基之间。在例如特定的单个聚合酶实施方式中,本文还设想了在约100个碱基至10,000个碱基之间的靶模板核酸长度。在每个模板核酸使用多个聚合酶的实施方式中,除了上面阐述的模板核酸长度之外,本文还设想了模板核酸长度可以100,000个碱基、在100,000个碱基至1,000,000个碱基之间、在1,000,000个碱基至1,000,000,000个碱基之间或超过1,000,000,000个碱基。
因此,由于使用本发明的方法核酸序列读出长度可以长达所述待测序的模板核酸的整个长度,通过本发明的方法实现的碱基对读出长度选自至少100、200、300、400、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000、5500、6000、6500、7000、7500、8000、8500、9000、9500、10000、15000、20000、25000、30000、35000、40000、45000、50000、60000、70000、80000、90000、100000、200000、300000、400000、500000、600000、700000、800000、900000、1000000(即1x106)、10000000(1x107)、100000000(1x108)、1000000000(1x109)或更长。
本发明的模板核酸也可以包括非天然核酸例如PNA、修饰的寡核苷酸(例如包含非典型生物RNA或DNA的核苷酸的寡核苷酸,例如2'-O-甲基化寡核苷酸)、修饰的磷酸骨架等。例如,核酸可以是单链或双链的。
当在本文中使用时,术语“引物”是指包含足以与模板核酸结合并在核酸合成链延伸反应期间允许酶法延伸的任何长度的寡核苷酸分子。在特定实施方式中,引物是长度为约12至约100个核苷酸,更特别地长度大于或等于12、15、20、25、30、35、40、45、50、55、60、70、75、80、85、90、95或100个核苷酸的一条连续链。在其他实施方式中,引物长度超过100个核苷酸,例如长度大于或等于110、120、130、140、150、160、170、180、190、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950或1,000个核苷酸。在本发明的方法用于核酸靶检测的特定实施方式中,引物是引物-探针。
检测靶核酸的方法
本文还提供了用于检测样品中靶核酸序列的存在的方法,所述方法包括:
提供延伸混合物,其包含(i)聚合酶,(ii)发光酶,(iii)模板核酸样品,(iv)与特定靶核酸序列杂交(例如与其互补)的引物-探针,和(v)聚合酶-发光试剂溶液,该溶液具有用于进行生长的核酸链的模板指导合成的组分,其中所述试剂溶液包含多种类型的各自附连有发光底物的核苷酸偶联物类似物;其中每种类型的核苷酸偶联物类似物具有可以被所述聚合酶切割的附连有发光底物的离去基团,并且每种类型的核苷酸偶联物类似物附连有相同或不同的发光底物,其中所述附连有发光底物的离去基团在相应的核苷酸偶联物类似物与所述模板链的聚合酶依赖性结合后被切割;
进行核酸延伸合成,使得在所述引物-探针杂交到所述靶核酸序列的情况下多个核苷酸偶联物类似物被顺序添加到所述模板,由此:a)核苷酸偶联物类似物与所述聚合酶结合,b)当所述核苷酸偶联物类似物上的附连有发光底物的离去基团被所述聚合酶切掉时,该核苷酸偶联物类似物被所述聚合酶掺入到所述模板链上,其中附连有发光底物的离去基团与所述发光酶在发光反应中结合,其中所述发光底物被所述发光酶催化,以产生发光;以及
在核酸合成进行时检测来自于所述发光的光,由此光的检测指示了所述特定靶核酸序列的存在。
在特定实施方式中,对靶核酸的量进行定量。在一个实施方式中,靶核酸的量在所述发光的强度的基础上定量。在特定实施方式中,每种类型的核苷酸偶联物类似物附连有相同的发光底物。在特定实施方式中,使用多个聚合酶。
在其他实施方式中,一种、两种、三种或所有核苷酸偶联物类似物被相同的发光底物类似物标记。所述反应延伸混合物含有一个或多个模板寡核苷酸。在引物-探针与所述模板核酸结合后和聚合酶与所述引物-模板复合物结合后,在一个或多个复合物上开始DNA链延伸反应。每个反应产生恒定的切下的发光底物流(例如PPi-LS;附连有发光底物的离去基团),其发光底物被送到发光反应中产生发光信号。在特定实施方式中,产生的发光信号强度与引物-模板对的数目相关,并因此被用于检测和定量那些引物-模板对的存在。在这个特定实施方式中,引物序列被用作探针序列以检测模板寡核苷酸上指定靶互补序列的存在。因此,除了确定序列之外,本发明的方法在本文中还提供了允许检测和/或定量模板寡核苷酸上的特定序列(区段),类似于其他分子生物学方法例如聚合酶链反应或微阵列的目的。这些本发明的靶检测方法在快速检测、即时检测、核酸检测中有用。
在又一个实施方式中,产生了可用于为附连或掺入到模板链中的每个核苷酸(例如核苷酸偶联物类似物)产生连续发光信号,从而放大发光信号的酶回路(参见图16)。使用被掺入到模板核酸链中的每个核苷酸偶联物类似物,将产生新的酶回路,增加所产生的总发光量。这个酶回路实施方式对于诸如使用引物寡核苷酸作为探针(例如引物-探针)检测特定靶核酸序列的存在的应用特别有益。在本文中被称为氧化还原酶/萤光素酶回路的一个实施方式中,将还原型黄素单核苷酸(或其类似物)附连到一种、两种、三种或所有四种核苷酸的末端磷酸(dNTP-FMNH2)。在通过聚合酶将核苷酸偶联物类似物掺入到模板链中之后,附连到还原型黄素单核苷酸类似物的焦磷酸(PPi-FMNH2)作为附连有发光底物的离去基团被释放,其然后被细菌萤光素酶氧化,产生发光。在这个特定实施方式中使用的氧化还原酶存在下,所述氧化型黄素单核苷酸类似物(PPi-FMN*)被氧化还原酶还原成PPi-FMNH2,同时也将二氢烟酰胺-腺嘌呤二核苷酸磷酸(NADPH)转变成氧化形式NADP+。这产生发光反应回路,其持续到溶液中的还原型脂肪酸(RCOOH)被完全耗尽。在另一个实施方式中,可以进一步包含脂肪酸还原酶,通过消耗ATP进一步再循环还原型脂肪酸。
当在本文中使用时,术语“氧化还原酶/萤光素酶回路”或其语法变化形式通常是指氧化还原酶与萤光素酶之间的酶回路(图16C-D),由此在由细菌萤光素酶催化的还原型黄素单核苷酸类似物(PPi-FMNH2)的发光反应后,氧化还原酶随后将形成的氧化型黄素单核苷酸类似物(PPi-FMN*)还原回初始的还原型PPi-FMNH2,也将二氢烟酰胺-腺嘌呤二核苷酸磷酸(NADPH)转变成氧化形式NADP+。这产生发光反应回路,其持续到溶液中的还原型脂肪酸(RCOOH)被完全耗尽。在其他实施方式中,可以将脂肪酸还原酶添加到反应混合物,以通过消耗ATP进一步再循环还原型脂肪酸。这种氧化还原酶/萤光素酶酶回路将从附连有FMNH2的焦磷酸离去基团产生连续信号,从而充当从最新的核苷酸的酶促掺入产生的萤光素酶信号的放大机制。
正如本文中阐述的,来自于图16C的这种焦磷酸(PPi-FMN*)可以通过图16D中阐述的氧化还原酶/萤光素酶放大回路中的反应多次循环。焦磷酸(PPi-FMN*)可以被循环以放大每个核苷酸类似物偶联物(dNTP)在延伸的序列中的插入事件的相应发光信号的次数,可以选自至少5、10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、200000、300000、400000、500000、600000、700000、800000、900000和至少1000000次。
当在本文中使用时,术语“引物-探针”是指可以启动链延伸,并且也起到探针的作用以优选地从待查询的未知核酸样品中鉴定特定靶核酸序列的引物。由于不存在温度循环和变性,并且不像PCR那样存在杂交循环,因此在本发明方法中可以使用的探针设计的长度和顺序方面有很大的灵活性。使用本文提供的本发明的方法,设计一个寡核苷酸探针(例如引物-探针)就已足够,代替使用如PCR所需的2个引物。所述引物-探针的长度可以是任何大小,只要它精确结合到它在模板核酸样品中的相应靶核酸序列即可。例如,除了上文为引物所阐述的长度之外,本文中使用的引物-探针长度的其他适合范围可以选自20-100、20-90、20-80、20-70、20-60、20-50、20-40、20-30、5-100、10-100、30-100、40-100、50-100、60-100、70-100、80-100、90-100、15-150、10-200、5-300、20-200、20-300、20-400、20-500、20-600、20-700、20-800、20-900、20-1000、至少5、至少10、至少15、至少20、至少30、至少40、至少50、至少60、至少70、至少80、至少90、至少100、至少150、至少200、至少300、至少400、至少500、至少600、至少700、至少800、至少900至少1000个核苷酸碱基。
适合在本文中使用的引物-探针长度的其他范围可以选自5-1000个碱基、10-950、15-900、20-800、25-700、30-600、35-500、40-400、50-300、25-250、25-200、25-150、25-100、25-90、25-80、25-70、25-60、25-50个碱基的长度。在其他实施方式中,引物-探针在20-100个碱基的范围内。在其他实施方式中,本领域技术人员可以为引物-探针长度选择选自25、30、40、45、50、55、60、65、70、80、85、90、95、100、110、120、130、140、150、160、170、180、190和200个或更多碱基的更长核苷酸序列以提高特异性。在其他实施方式中,与PCR相同,也设想了在本文中使用约20个碱基的探针长度。
核苷酸偶联物类似物
本文还提供了包含脱氧核糖核苷酸(dNTP)或其类似物并附连有发光底物的核苷酸偶联物类似物。当在本文中使用时,短语“核苷酸偶联物类似物”(在本文中也被称为“发光底物-核苷酸偶联物”)是指可用于DNA合成的用发光底物修饰的任何核苷酸(例如修饰的dNTPs如dATP、dTTP、dGTP、dCTP和dUTP)。在某些实施方式中,所述核苷酸偶联物类似物中的核苷酸是修饰的核苷酸类似物。用于本发明的核苷酸类似物可以是能够作为聚合酶和选择性切割活性的底物的任何适合的核苷酸类似物。已显示,核苷酸可以被修饰并仍用作聚合酶和其他酶的底物。在考虑核苷酸类似物的变体的情况下,可以通过活性测定来确定所述核苷酸类似物与聚合酶或其他酶活性例如核酸外切酶活性的相容性。活性测定的进行是简单明了且在本领域中公知的。
在本文阐述的本发明的方法的特定实施方式中,本发明的核苷酸偶联物类似物可以是例如在其多磷酸链中具有三个或更多个磷酸的多磷酸核苷,并且发光底物附连到所述多磷酸链在掺入到生长的链中之后被切掉的部分,这产生附连有发光底物的离去基团。所述多磷酸可以是纯粹的多磷酸例如--O--PO3-或焦磷酸(例如PPi),或者所述多磷酸可以包括取代物。关于类似物和制造此类类似物的方法的其他详情,可以在为所有目的整体通过参考并入本文的美国专利7,405,281、9,464,107等中找到。
在本发明的其他实施方式中,为了形成核苷酸偶联物类似物,通过将发光底物(例如腔肠素、FMNH2等)添加到末端磷酸对核苷酸或其类似物进行修饰(参见例如Yarbrough等,J.Biol.Chem.,254:12069-12073,1979;其为所有目的整体通过参考并入本文),使得当发光底物核苷酸偶联物被掺入到模板链中时通过聚合酶产生PPi附连有发光底物的离去基团(例如PPi-LS、PPi-C、PPi-FMNH2等),所述附连有发光底物的焦磷酸(或附连有发光底物的离去基团)能够与相应的萤光素酶组合(参见图1-3)。存在5种类型的dNTPs,即脱氧腺苷三磷酸(dATP)、脱氧鸟苷三磷酸(dGTP)、脱氧胞苷三磷酸(dCTP)、脱氧胸苷三磷酸(dTTP)和脱氧尿苷三磷酸(dUTP)。将这些dNTPs中的四者或五者用于模板指导的核酸合成反应,以识别(即调用)它在模板核酸链中的互补体(例如腺嘌呤、鸟嘌呤、胞嘧啶或胸腺嘧啶),从而对所述模板核酸链进行测序。代替dATP,可以使用dATPαS作为dATP的替代品,因为它充当DNA聚合酶而不是萤光素酶的底物。
每个修饰的核苷酸偶联物类似物当在被聚合酶附连到互补链时,从所述附连的发光底物产生独特的发光信号(例如411、417、428、440、484、509nm等的波长)。在一个实施方式中,所述独特的发光信号是选自范围250nm–750nm的波长。在另一个实施方式中,所述独特的发光信号可以是选自411、417、428、440、484和509nm的波长。
本文还提供了一种核苷酸偶联物类似物的链延伸集合,其包含至少4种不同的脱氧核糖核苷酸(dNTPs),使得所述链延伸集合可以掺入到生长的核酸链的模板指导的合成中。dTTP或dUTP中的任一者或两者的任何组合可用于核酸合成链延伸反应中,以调用(即识别)序列中的互补腺嘌呤(ATP)。如果在反应中使用修饰的dTTP和dUTP类似物两者,它们可以各自附连有相同的发光底物以产生相同的波长信号,或者可以各自附连有不同的发光底物。
在本文公开的本发明的方法的优选实施方式中,每种相应的dNTP或其类似物使用相对于其他dNTP来说不同的、独特的发光底物(例如腔肠素类似物、FMNH2类似物等)进行修饰,使得每当聚合酶将修饰的脱氧核糖核苷三磷酸(dNTP)核苷酸偶联物类似物掺入到与模板DNA互补的链中时,产生特异性针对附连的相应核苷酸的类别或类型的发光信号(例如dATP、dATPαS、dTTP、dGTP和dCTP或本领域中公知的其他修饰的核苷酸中的每一者的独特信号)。本文中考虑使用的其他修饰的核苷酸在本领域中是公知的,例如在下述文献中所描述的:Jordheim等,“用于癌症和病毒性疾病的核苷和核苷酸类似物的开发进展”(Advancesin the development of nucleoside and nucleotide analogues for cancer andviral diseases),Nat.Rev.Drug Discov.(2013)12:447-464;和Guo等,“使用3′-O-修饰的核苷酸可逆终止物和克化学切割的荧光双脱氧核苷酸的四色DNA测序”(Four-color DNAsequencing with 3′-O-modified nucleotide reversible terminators andchemically cleavable fluorescent dideoxynucleotides),Proc.Natl.Acad.Sci.U.S.A.(2008)105:9145-9150等(每个所述文献整体通过参考并入本文)。
在特定实施方式中,本文中使用的示例性的在本文中也被称为“附连有发光底物的dNTPs”的核苷酸偶联物类似物包括腔肠素-dNTP偶联物1(图7)、腔肠素-dNTP偶联物2(图8)、腔肠素-dNTP偶联物3(图9)等。
在其他实施方式中,使用dATPαS、dGTPαS、dCTPαS、dTTPαS代替dATP、dGTP、dCTP和dTTP,其在本文中被考虑用于减少核苷酸与聚合酶之外的其他酶(例如萤光素酶)的非特异性相互作用。
每种核苷酸偶联物类似物当被聚合酶附连到互补链时,有效地产生独特的发光信号或光谱(例如红色、黄色、绿色或蓝色以及类似物)。在所述核苷酸偶联物类似物与先前附连的核苷酸偶联物类似物的3’端组成部分的附连完成后,作为后续发光反应的结果,在相应的发光反应的不同且有限的时段中通过适合的发光传感器和/或检测装置检测由所述附连有发光底物的焦磷酸离去基团(例如PPi+LS、PPi-C、PPi-FMH2等)产生的发光信号(光谱)(图2C和图3C)。
使用本文提供的本发明的串联双酶系统和方法,仅在核苷酸与聚合酶-萤光素酶反应的特异性相互作用期间产生指示特定类型的核苷酸的特定信号。聚合酶相互作用之前和之后的状态将是相似的,并且在与聚合酶相互作用期间所述信号将“变化”。例如,在本文描述的一个实施方式中:
1-最初由于不存在外部光激发,因此不存在或存在非常低的背景发光。
2-在本发明的方法的聚合酶-萤光素酶相互作用期间,产生特定类型的发光。
3-在相应的发光反应停止后,所述附连有发光底物的焦磷酸信号(PPi+LS)返回到初始状态。
当在本文中使用时,短语“附连有发光底物的离去基团”是指附连有发光底物或类似物的多磷酸链,其在相应的dNTP掺入到模板核酸链期间在被本发明的双酶聚合酶-萤光素酶反应切割时和/或之后从相应的dNTP释放。在本文的特定实施方式中,所述多磷酸是发光焦磷酸(PPi+LS),其从dNTP切下(图2B和3B),随后进入萤光素酶反应(图2C和3C)用于后续的发光检测,然后如本文中阐述的终止所述相应的、离散的、时长有限的发光反应(参见图2C和3C)。
使用的反应条件也可以影响各种不同反应的相对速率。因此,控制反应条件在确保测序方法成功地以高速率调用模板内的碱基中可能是有用的。所述反应条件包括例如缓冲液的类型和浓度、反应的pH、温度、盐的类型和浓度、影响酶的动力学的特定添加剂的存在以及包括金属辅因子在内的各种不同辅因子的类型、浓度和相对量。操控反应条件以实现或增强聚合酶的双慢步骤行为,被详细描述在通过参考并入本文的美国专利8,133,672中。
酶反应通常在缓冲液存在下运行,所述缓冲液部分用于控制反应混合物的pH。在某些情况下,缓冲液的类型可以以某种方式影响聚合酶反应的动力学,使得可以在需要双慢步骤动力学时产生这种动力学。例如,在某些情况下,使用IRIS作为缓冲液可用于获得双慢步骤反应。适合的缓冲液包括例如TAPS(3-{[三(羟甲基)甲基]氨基}丙磺酸)、Bicine(N,N-双(2-羟乙基)甘氨酸)、IRIS(三(羟甲基)甲胺)、ACES(N-(2-乙酰氨基)-2-氨基乙磺酸)、Tricine(N-三(羟甲基)甲基甘氨酸)、HEPES(4-2-羟乙基-1-哌嗪乙磺酸)、TES(2-{[三(羟甲基)甲基]氨基}乙磺酸)、MOPS(3-(N-吗啉基)丙磺酸)、PIPES(哌嗪-N,N'-双(2-乙磺酸))和MES(2-(N-吗啉基)乙磺酸)。
反应的pH可以影响聚合酶反应的动力学,并且可以用作聚合酶反应条件之一以获得表现出双慢步骤动力学的反应。可以将pH调整到产生双慢步骤反应机制的值。所述pH通常在约6至约9之间。在某些实施方式中,所述pH在约6.5至约8.0之间。在其他实施方式中,所述pH在约6.5至7.5之间。在特定实施方式中,所述pH选自约6.5、6.6、6.7、6.8、6.9、7.0、7.1、7.2、7.3、7.4或7.5。
可以对反应的温度进行调节以确保反应的相对速率出现在适合的范围内。反应温度可能取决于使用的聚合酶或选择性切割活性的类型。也设想了利用本文中使用的温度来操作和控制反应混合物中两个碱基之间的氢键形成以及碱基与水的相互作用,从而控制反应组分的溶解性。
在某些实施方式中,可以向反应混合物添加影响反应动力学的添加剂例如镁、辅酶A等。在某些情况下,所述添加剂可以与酶的活性部位相互作用,充当例如竞争性抑制剂。在某些情况下,添加剂可以以影响反应动力学的方式与酶的远离活性部位的部分相互作用。可以影响动力学的添加剂包括例如在分析反应中具有竞争性但无反应性的底物或抑制剂,以调节反应速率,如在全部公开内容为所有目的整体通过参考并入本文的美国实用专利8,252,911中所描述的。
作为另一个实例,可以添加同位素例如氘来影响聚合酶反应中的一个或多个步骤的速率。在某些情况下,由于氘同位素效应,氘可用于减缓聚合酶反应中的一个或多个步骤。通过改变聚合酶反应步骤的动力学,在某些情况下可以实现本文所描述的双慢步骤动力学。氘同位素效应可用于例如通过减缓掺入速率来控制核苷酸掺入的速率。也可以使用氘之外的同位素,例如碳(例如13C)、氮、氧、硫或磷的同位素。
作为又一个实例,可用于控制聚合酶反应的动力学的添加剂包括有机溶剂的添加。所述溶剂添加剂通常是水溶性有机溶剂。所述溶剂不必在所有浓度下可溶,但是通常以用于控制聚合酶反应动力学的量可溶。尽管不受理论限制,但认为所述溶剂可以影响聚合酶的三维构型,这可以影响聚合酶反应中的各个不同步骤的速率。例如,所述溶剂可以影响涉及构型变化的步骤例如异构化步骤。添加的溶剂也可以影响、在某些情况下减缓移位速度。在某些情况下,所述溶剂通过影响氢键相互作用起作用。
可用于控制单分子测序中聚合酶反应的一个或多个步骤的速率的与水混溶的有机溶剂包括例如醇类、胺类、酰胺、腈类、亚砜、醚类、酯类和具有超过一种这些官能团的小分子。示例性的溶剂包括醇类例如甲醇、乙醇、丙醇、异丙醇、甘油和小分子醇。所述醇类可以具有1、2、3个或更多个醇基团。示例性的溶剂还包括小分子醚类例如四氢呋喃(THF)和二噁烷、二甲基乙酰胺(DMA)、二甲基亚砜(DMSO)、二甲基甲酰胺(DMF)和乙腈。
所述与水混溶的有机溶剂可以以足以控制聚合酶反应动力学的任何量存在。所述溶剂通常以重量计或体积计小于所述溶剂的40%的量添加。在某些实施方式中,所述溶剂以约0.1%至30%之间、约1%至约20%之间、约2%至约15%之间和约5%至12%之间添加。控制动力学的有效量可以通过本文描述的方法和本领域中已知的方法确定。
控制聚合酶反应条件的另一方面涉及辅因子的类型、水平和相对量的选择。例如,在聚合酶反应过程中,二价金属辅因子例如镁或锰将与酶-底物复合体相互作用,在活性部位的定义中发挥结构性作用。对于聚合酶反应中的金属辅因子相互作用的讨论,参见例如Arndt等,Biochemistry(2001)40:5368-5375。适合的条件包括在为所有目的整体通过参考并入本文的美国专利8,257,954中描述的那些。
在本发明的方法的特定实施方式中,聚合酶反应的速率和保真度通过调整dNTP核苷酸偶联物类似物的浓度来控制,使得就诸如底物浓度、光学激发的量、化学修饰的水平等参数而言聚合酶在接近理想的条件下运行。因此,本文设想了聚合酶达到其最大读出长度,例如大约数万碱基对,与在天然背景中实现的DNA合成长度相近。这降低了装置的复杂性并提高了酶的灵敏度和特异性,从而实现低错误率以及因此低覆盖率。这不仅降低了装置的成本以及每个基因组的成本,而且使得诸如单核苷酸多态性检测、结构变异和基因组组装等应用可以在一个非常紧凑的系统中进行。
在单分子反应中实现长读长的方法
实现长读长的能力一直是现有测序方法难以达到的目标。现代测序方法实现长读长的能力受限。具体对于单分子测序方法来说,这种限制来自于聚合酶与模板DNA的相对亲和性。在测序反应期间,聚合酶最终将从模板DNA掉落,从而在该相应的读出长度处终止dNTP链延伸反应。例如,使用典型的测序技术,每个反应池存在一个模板和一个聚合酶。对于这些单聚合酶测序反应来说,当所述单个聚合酶从模板解离(掉落)时,该特定读出序列的长度通常终止于相对短的读出长度,对应于据信约700个碱基对(bp)。
根据本发明,本文提供了对模板核酸进行测序的方法,所述方法包括:
提供本文所描述的测序混合物,其包含:靶模板核酸和引物,多种类型的核苷酸偶联物类似物和多个聚合酶;
进行核酸合成,使得多个核苷酸偶联物类似物被顺序添加到所述模板;以及
在核酸合成进行时检测相应的核苷酸偶联物类似物,以确定所述模板核酸的序列。
当在本文中使用时,术语“多个聚合酶”或其语法变化形式是指在单一测序反应混合物中使用的每个待测序核酸模板的聚合酶的数量。对于每个待测序的模板链来说,所述“多个聚合酶”中的聚合酶的量可以选自由每个待测序的模板链至少2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、200000、300000、400000、500000、600000、700000、800000、900000和至少1000000个聚合酶组成的组。在对靶核酸模板进行连续测序的其他实施方式中,聚合酶与模板的比例选自由至少2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1、150:1、200:1、250:1、300:1、350:1、400:1、450:1、500:1、550:1、600:1、650:1、700:1、750:1、800:1、850:1、900:1、950:1、1000:1、10000:1、20000:1、30000:1、40000:1、50000:1、60000:1、70000:1、80000:1、90000:1、100000:1、200000:1、300000:1、400000:1、500000:1、600000:1、700000:1、800000:1、900000:1和至少1000000:1组成的组。所述多个聚合酶中的聚合酶可以是同一类型聚合酶的均匀集合,或者可以是所述多个聚合酶中2种或更多种不同类型的聚合酶例如3、4、5、6、7、8、9、10、20、30、40、50直至100或更多种不同聚合酶的不均匀集合。
在特定实施方式中,所述单测序或靶检测反应混合物在其中仅具有一个(单个)待测序的靶模板核酸和一个或多个引物。在其他实施方式中,所述单测序或靶检测反应混合物在其中具有超过一个或多个待测序的靶模板核酸和多个引物。在特定实施方式中,在单个光学约束中提供一个靶模板核酸。
在本发明的LASH测序方法的某些实施方式中,将所述酶联合体提供在特定的单个约束(例如微滴等)中,使得在所述约束区域中仅存在一个模板靶核酸,同时存在多个(例如许多)聚合酶和相应的多个形成所述联合体的其他酶(图10)。在这个实施方式中,当聚合酶从靶模板核酸掉落(解离)时(图12B),被限制在所述特定靶核酸模板区域上的多个其他酶之一有利且相对即时地在模板上前一个聚合酶掉落或解离的位置处开始其链延伸(图12B)。换句话说,测序链延伸使用第一聚合酶进行到它从模板核酸离开和解离为止,然后所述测序链延伸反应使用第二聚合酶(不同于第一聚合酶)继续,直至它从模板核酸离开和解离为止,然后所述测序链延伸反应使用第三聚合酶(不同于所述第二聚合酶,可以是所述第一聚合酶或所述特定测序反应中的多个聚合酶中的另一者)继续,直至它从模板核酸离开和解离为止,以此类推。本领域技术人员将会容易地理解,使用这种方法,只要测序反应仍在运行,靶核酸模板即可被继续测序。本领域技术人员也将容易地理解,当使用本文公开的基本上连续的测序方法时,它的读出长度仅受靶核酸的长度和/或用于相应链延伸反应的反应约束区域的物理尺寸的限制。
因此,本文提供了一种对靶核酸模板进行连续测序的方法。在这个实施方式中,当在本文中使用时,“连续性”、“连续测序靶核酸模板”或“基本上连续测序靶核酸模板”不意味着单个聚合酶能够连续测序特定靶核酸的全长读出长度,而是意味着靶核酸模板的反应区中的多个聚合酶彼此之间合在一起,能够凭借该多个聚合酶连续地具有许多聚合酶可用于在前一个聚合酶从特定靶核酸模板解离之处的下一个核苷酸处接续dNTP链延长,来连续测序所述特定目标。
在本发明的连续LASH测序方法的特定实施方式中,特别是在使用多个聚合酶测序单个靶模板核酸的情况下,总读出长度仅受被提供到特定反应约束区域的靶模板核酸的长度限制。例如,本文设想的可以通过在单个靶核酸模板上使用多个聚合酶实现的总读出长度长达整个染色体的长度,例如5千万直至约3亿个碱基(例如300Mbp)等。在本文设想的其他某些实施方式中,通过本发明的测序方法实现的读出长度可以选自至少200bp、300bp、400bp、500bp、600bp、700bp、800bp、900bp、1000bp(即1kbp)、5kbp 10kbp、20kbp、30kbp、40kbp、50kbp、100kbp、200kbp、300kbp、400kbp、500kbp、600kbp、700kbp、800kbp、900kbp、1000kbp(1Mbp)、5Mbp、10Mbp、20Mbp、50Mbp、75Mbp、100Mbp、200Mbp、300Mbp、400Mbp、500Mbp、600Mbp、700Mbp、800Mbp、900Mpb、1000Mbp。
在如上所阐述的其他实施方式中,由于核酸序列读长可以高达使用本发明的方法所测序的模板核酸的整个长度,因此通过本发明的方法实现的碱基对读长可以选自至少100、200、300、400、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000、5500、6000、6500、7000、7500、8000、8500、9000、9500、10000、15000、20000、25000、30000、35000、40000、45000、50000、60000、70000、80000、90000、100000、200000、300000、400000、500000、600000、700000、800000、900000、1000000(即1x106)、10000000(1x107)、100000000(1x108)、1000000000(1x109)或更长。
由于所述靶模板核酸被多个聚合酶基本上连续测序,因此反应不受单个酶实现特定读出长度的能力限制。这允许在本发明的方法中使用具有较高特异性和低错误率的酶。根据本发明的LASH测序方法的特定实施方式,本文设想了使用一个模板和超过一个聚合酶(即多个)可以实现无限长的读长。正如本文中阐述的,当一个聚合酶从靶模板核酸掉落时,另一个聚合酶将从前一个聚合酶掉落之处继续,这有利地改变了可以选择和优化聚合酶以在本发明的LASH测序方法中发挥作用的方式。因此,本领域技术人员可以选择具有非常低错误率的聚合酶,即使该聚合酶可能也具有相对短的读出长度。这为这个特定实施方式提供了优势,因为被选择用于本发明的测序方法的聚合酶不需要同时具备长读出长度和特异性。
本发明包括用于核酸模板测序的系统。所述系统提供了多个核酸模板的同时测序。所述系统可以包含本文描述的所有试剂和方法,并提供在测序期间用于包含样品、用来自于发光反应的激发光照射样品、检测从样品发射的光所需的仪器,以便从当相应的dNTPs被聚合酶掺入到其同源模板核酸上时从所述核苷酸偶联物类似物切下的附连有发光底物的离去基团(例如PPi-C1、PPi-FMNH2等)产生强度随时间变化的数据,并从相应的附连有发光底物的离去基团例如PPi-C1或PPi-FMNH2或类似物,使用所述顺序的强度随时间变化的数据确定所述模板的序列。
当在本文中使用时,短语“检测光”是指公知的检测方法,例如在发光底物-离去基团处于其发射相应信号的激发态时检测从此类发光底物发出的发光。
在一个实施方式中,用于测序的系统通常包含基底,其具有在例如独特的微滴等中的多个单一聚合酶、单一模板或单一引物。在高度持续性酶聚合反应的情况下,各自包含聚合酶、核酸模板和引物被独特地限制,使得当发生基因合成时它们的信号可以被分配给相应的核苷酸。在本文提供的其他实施方式中,在例如独特的约束、微滴等中多个聚合酶与单一模板和/或单一引物一起使用。所述测序试剂通常包括两种或更多种类型的核苷酸偶联物类似物,优选为对应于dATP、dTTP、dAGP和dCTP的四种核苷酸偶联物类似物,每种核苷酸偶联物类似物用不同的发光底物标记物标记。所述聚合酶将核苷酸或核苷酸偶联物类似物依次添加到从所述引物延伸的生长链。每个添加的核苷酸或核苷酸偶联物类似物与所述模板核酸上的相应碱基互补,使得产生的生长链的部分与所述模板互补。
所述系统包含发光试剂(例如萤光素酶和相应的发光底物),用于在相应的dNTPs被掺入到模板链中时照射来自于所述dNTPs的附连有发光底物的离去基团,经历图2和图3中所阐述的发光反应。所述发光反应在对应于相应dNTP的波长范围内照射相应的附连有发光底物的离去基团。正如本文中阐述的,所述发光底物可以选自由以下组成的组:腔肠素或其类似物,FMNH2或其类似物,鲁米诺、异鲁米诺、吖啶、二氧杂环丁烷类、过氧草酸及其衍生物。
所述系统还包含检测光学元件,用于观察在聚合酶介导的向模板链的添加期间来自于从相应的核苷酸偶联物类似物切下的附连有发光底物的离去基团的信号。所述检测光学元件同时观察多个单分子聚合酶测序反应,通过在本发明的串联双酶(聚合酶-萤光素酶)系统中最终切下的附连有发光底物的离去基团(例如PPi-C1或PPi-FMNH2)观察每个所述核苷酸或核苷酸偶联物类似物的添加。对于每个观察的单分子聚合酶测序反应来说,所述检测光学元件同时观察来自于每个附连有发光底物的离去基团的指示了与相应的dNTP对应的相应发光反应所激发的相应发光底物的信号,直至每个离散且时长有限的信号由于来自于相应发光反应的发光信号的衰减和终止而停止。
所述系统还包含计算机,其被配置成使用从相应的附连有发光底物的离去基团观察到的信号来确定添加到生长链的核苷酸偶联物类似物的类型;由此使用从所述附连有发光底物的离去基团观察到的信号来指示某种类型的核苷酸或核苷酸偶联物类似物是否掺入到生长链中。所述计算机通常以信号数据的形式从检测光学元件接收关于观察到的信号的信息。所述计算机存储、处理和解释所述信号数据,使用所述信号数据以产生碱基调用的顺序。所述碱基调用代表了计算机根据接收到的信号数据以及提供给计算机以帮助序列确定的其他信息的组合对模板序列的估计。
在例如美国专利8,802,424、7,714,303和7,820,983中描述了可以与本发明一起使用的光学检测系统,每个所述专利为所有目的整体通过参考并入本文。
用于执行本发明的方法的计算机可以从个人计算机例如运行英特尔奔腾或双核处理器的PC或Macintosh.RTM.类型的计算机到运行UNIX、LINUX、Windows.RTM.或其他系统的工作站、实验室设备或高速服务器,本发明的逻辑处理可以完全由执行软件和/或固件逻辑指令的通用逻辑处理器(例如CPU)执行;或完全由并入到实验室或诊断系统或相机系统中并且也可能包括软件或固件要素的专用逻辑处理电路(例如ASIC)执行;或由通用和专用逻辑电路的组合执行。用于信号数据的数据格式可以包括任何方便的格式,包括基于数字图像的数据格式例如JPEG、GIF、BMP、TIFF,或其他测序特异性格式包括“fastq”或“qseq”格式(Illumina);同时可以使用基于视频的格式,例如avi、mpeg、mov、rmv或其他视频格式。本发明的软件过程通常可以用各种不同的编程语言编程,包括例如Matlab、C、C++、C#、NET、Visual Basic、Python、JAVA、CGI等。
在本发明的方法和系统的某些实施方式中,使用光学约束来增强同时观察多个单分子聚合酶测序反应的能力。通常,光学约束被配置在基底上,并用于仅将电磁辐射提供到非常小的空间或体积中或仅从非常小的空间或体积中产生这种辐射。这样的光学约束可以包括结构约束例如孔、凹槽、导管或类似物,或者它们可以包括与其他组件结合的光学过程,以仅将照射提供到非常小的体积中或仅从非常小的体积产生发射的辐射。这种光学约束的实例包括利用例如基于全内反射(TIR)的光学系统的系统,由此以在基底内产生全内反射的角度引导光通过所述基底的透明部分。
在特定实施方式中,优选的光学约束是微滴(例如油包水乳液等),其可以包含本文中阐述的单个测序反应。例如,可以将测序混合物反应成分分开,使得每个微滴含有一个聚合酶-萤光素酶酶组和相关试剂和一个模板核酸,由此每个信号检测单元聚焦于单个微滴上。本文中设想了每个微滴是含有单个单分子测序反应的单分子反应池。所述微滴反应池也可有利地用于本发明的测序方法以充当微型透镜,将光聚焦到相应的信号检测单元上。
本发明的基底通常是刚性并且通常是平面的,但也不一定如此。在所述基底包含光学约束的阵列的情况下,所述基底通常具有可以与光学仪器相接的尺寸和形状,以允许照射和来自于所述光学约束的光的测量。通常,所述基底也被配置成与液体介质保持接触,例如包含用于光学测量的试剂和底物和/或标记的组分例如核苷酸偶联物类似物。
用于将本发明的测序混合物的组分提供在限制区域中的示例性实施方式包括图10-14中示出的配置和大量其他配置。例如,在一个实施方式中,每个靶核酸模板被结合到单个相应信号检测器的表面。在一个实施方式中,所述核酸模板可以使用本领域中公知的大量方法例如通过硫醇键合到金表面等,直接结合或附连到表面或固体基底(图11B)。在其他实施方式中,DNA模板可以通过硅烷、NHS酯等直接结合或附连到相应的表面。在其他实施方式中,可以将用于测序的引物结合到单个相应信号检测器的表面(图11A)。正如本文中阐述的,每次附连可以在单个信号检测器的表面上。示例性的信号检测器已在本文中描述,并且可以是CCD、CMOS传感器的像素,或者它们可以是光电探测器、形成阵列的光电倍增器等。
在所述基底包含光学约束的阵列的情况下,所述阵列可以包含在基底表面上的单行或多行光学约束,其中当存在多个通道时,通道的数目通常为至少2,更常见的为超过10,更常见的为超过100。所述光学约束的主题阵列可以沿着所述基底的x-轴或y-轴水平或对角线排列。各个约束可以横跨所述基底的表面或在其上以任何格式排布,例如排布成行和列以形成网格,或者形成圆形、椭圆形、卵形、圆锥形、矩形、三角形或多边形图案。为了最小化相邻光学约束之间的最近邻距离,六边形阵列有时是优选的。
可以将所述光学约束的阵列并入到提供分析的便捷性、高通量或其他优点的结构中,例如在微量滴定板等中。这种设置在本文中也被称为“阵列的阵列”。例如,可以将主题阵列并入到另一个阵列例如微量滴定板中,其中所述板的每个微孔都含有光学约束的主题阵列。
根据本发明,约束(例如反应池、微滴等)的阵列被提供成在单个基底上的超过100个、超过1000个、超过10,000个、超过100,000个或超过1,000,000个独立的反应池(例如微滴等)的阵列。此外,所述反应池阵列通常以相对高的密度包含在所述基底的表面上。这种高密度通常包括反应池以超过10个反应池/mm2、优选地超过100个反应池/mm2基底表面积、更优选地超过500或甚至1000个反应池/mm2、在许多情况下高达或超过100,000个反应池/mm2的密度存在。尽管在许多情况下所述阵列中的反应池以规则的图案间隔,例如在给定阵列中2、5、10、25、50或100个或更多个规则间隔的反应池的行和/或列,但在某些优选情况下,以偏离标准的行和/或列格式的阵列提供反应池的组织是有利的。在优选情况下,所述基底包括作为特定反应池的微滴作为光学约束,以在所述基底上限定离散的单分子测序反应区。
所述光学约束阵列的整体尺寸通常可以在几纳米到几毫米的厚度以及几毫米到50厘米的宽度和/或长度的范围内。阵列可以具有约几百微米到几毫米厚度的总尺寸,并且可以具有取决于所需光学约束的数量的任何宽度或长度。
可以调整各个约束之间的间距以支持在其中使用所述主题阵列的特定应用。例如,如果目标应用需要阵列的暗场照明,而没有或具有低水平的来自于光学约束的入射波长的衍射散射,则可以将所述各个约束相对于入射波长彼此靠近放置。
所述阵列中的单个约束可以提供小于约1000仄升(zeptoliter)、小于约900、小于约200、小于约80、小于约10仄升的有效观察体积。如果需要,可以提供小于1仄升的有效观察体积。在一个优选方面,单个约束产生允许分辨以等于或接近生理相关浓度存在的单个分子例如酶的有效观察体积。许多生物化学反应的生理相关浓度范围从微摩尔到毫摩尔,因为大多数酶的米氏常数都在这些范围内。因此,优选的光学约束阵列具有用于检测以高于约1微摩尔(uM)或更优选地高于50uM或甚至高于100uM的浓度存在的单个分子的有效观察体积。在特定实施方式中,典型的微滴尺寸在10微米至200微米的范围内,因此典型的微滴体积为5皮升至20纳升左右。
在光学约束内的化学或生物化学分析的情形中,通常希望确保感兴趣的反应至少发生在所述约束的光学质询的部分内,并且优选地使得在单个约束的质询部分内(例如在微滴等内)只发生单分子聚合酶测序反应的反应。本领域中公知的许多方法通常可用于在观察体积内提供单个分子。各种不同的这些方法描述在为所有目的整体通过参考并入本文的美国专利7,763,423中,所述专利尤其描述了修饰的表面,其被设计成将单个分子以所需密度固定到所述表面,使得大约一个、两个、三个或某些其他选定数目的分子预期将落入给定的观察体积内。通常,此类方法利用稀释技术在表面上提供相对低密度的偶联基团,这通过稀释表面上的此类基团或稀释与感兴趣的分子相互作用的中间体或最终偶联基团或它们的组合来实现。本文还设想了使用这些稀释技术来提供一个、两个、三个或某些其他选定数目的单分子测序反应,以落入给定的观察体积内而不被固定到表面,例如在本文设想的用于光学约束的微滴反应池中发生的情况。在特定实施方式中,使用所述稀释技术在微滴中提供一个单分子测序反应,用于本发明的测序方法。
本发明的系统和方法可以通过使用本领域中公知的系统来监测来自于核苷酸偶联物类似物的附连有发光底物的离去基团在经历本文中阐述的双酶聚合酶-萤光素酶反应后的信号,而产生改进的序列确定和改进的碱基调用。通常,信号数据由处理器接收。处理器接收的信息可以直接来自于检测光学元件,或者来自于检测光学元件的信号在被处理器接收之前可以通过其他处理器进行处理。可以使用许多初始校准操作。这些初始校准步骤中的一些可以在运行开始时仅执行一次,或者在运行期间以更连续的方式执行。这些初始校准步骤可以包括诸如质心确定、对齐、网格化、漂移校正、初始背景减除、噪声参数调整、帧速率调整等。这些初始校准步骤中的某些步骤例如分箱,可能涉及从处理器返回到检测器/相机的通讯,如下文进一步讨论的。
通常,对初始信号数据应用某种类型的光谱迹线确定、光谱迹线提取或光谱过滤。这些过滤步骤中的一些或全部可以任选地在所述过程的稍后时间点进行,例如在脉冲识别步骤之后。光谱迹线提取/光谱过滤可以包括本领域中公知的大量降噪和其他过滤。由于接收到的初始信号数据是由一系列相邻像素检测器捕获的光水平或光子计数,因此对于本文中讨论的许多示例性系统来说,光谱迹线确定在此阶段进行。例如,在一个示例性系统中,在每一帧为单个波导捕获来自于位置的像素(或强度水平)。不同频率或光谱的光会落于一个以上的位置上,并且通常存在一些重叠并可能存在显著的重叠。根据本发明的特定实施方式,可以使用如下文所讨论的为每个光谱迹线提供最高信噪比的各种不同类型的分析来进行光谱迹线提取。
作为光谱迹线确定的替代方案,本发明的方法还可以分析从多个像素位置处的强度水平推导出的单个信号(这可以被称为总光谱信号或灰度光谱信号或强度水平信号)。然而在许多情况下,已发现光谱提取提供了更好的SNR(信噪比),并且因此当或多或少独立地分析提取的光谱迹线的脉冲时提供了更好的脉冲检测。在其他实施方式中,根据本发明的方法可以使用诸如隐马尔可夫模型的统计模型来分析多个捕获的像素数据。在本文提供的本发明测序方法和系统中,从初始信号数据确定多个(例如四个)光谱迹线是优选的方法。
确定来自于附连有发光底物的离去基团(例如PPi-C1或PPi-FMNH2)的信号是否可以归类为显著信号脉冲或事件。在某些示例性系统中,由于可用于检测的光子数量少并且由于检测速度快,因此在确定是否检测到显著脉冲中可以执行各种不同的统计分析技术。
如果信号被识别为显著脉冲或信号事件,则可以执行进一步的任选光谱轮廓比较来验证光谱分配。在光谱迹线在脉冲识别之前或期间被确定的实施方式中,这种光谱轮廓比较是任选的。一旦将颜色分配到给定的掺入信号(例如特定核苷酸偶联物类似物、dNTP-C1或dNTP-FMNH2),则使用该分配来调用掺入的相应碱基或其在模板序列中的补充。为了做出这种确定,使用来自于对应于所述相应的附连有发光底物的离去基团(例如PPi-发光底物)得通道的信号来评估来自于核苷酸标记物的脉冲是否对应于掺入事件。然后对被调用碱基的编译进行额外的处理,以提供线性序列信息例如模板序列中的连续核苷酸序列,将序列片段组装成更长的重叠群等。
正如上文提到的,将信号数据输入到处理系统例如适当编程的计算机或其他处理器中。信号数据可以直接从检测系统输入以例如用于实时信号处理,或者它可以从信号数据存储文件或数据库输入。在某些情况下,例如,在寻求对检测系统性能的即时反馈、调整检测或其他实验参数的情况下,将采用实时信号处理。在某些实施方式中,将来自于检测系统的信号数据存储在适合的文件或数据库中,并以反应后或非实时方式进行处理。
与本发明相结合使用的信号数据可以采取各种不同的形式。例如,数据可以是代表在给定检测器或基于阵列的检测器的检测点处接收的光信号的强度值的数值数据。信号数据可以包括来自于成像检测器例如CCD、EMCCD、ICCD或CMOS传感器的图像数据。在特定实施方式中,为了检测来自于单个分子的少量光子,设想了在本发明方法中使用光电倍增管(PMT)和/或光子计数器单元。在任一情况下,根据本发明的特定实施方式使用的信号数据通常包括强度水平信息和光谱信息。在单独的检测元件的情形中,这种光谱信息通常包括对在其上检测强度的检测器部分(例如像素)的地点或位置的识别。在图像数据的情形中,光谱图像数据通常是从图像数据衍生的与成像系统和检测器的校准光谱图像数据相关的数据,当所述系统包括整体信号的光谱解析时。所述光谱数据可以从从检测器提取的图像数据中获得,或者,光谱数据的衍生可以发生在检测器上,以便从所述检测器提取光谱数据。
对于上述测序方法来说,检测系统检测到一定量的光信号可能不是来自于掺入事件的信号的结果。这样的信号将代表系统中的“噪声”,并且可能源自于多个来源,这些来源可能在被监测的反应的内部、检测系统的内部和/或以上所有的外部。本发明的实践有利地减少了通常存在于现有技术方法中的这些总体噪声源。根据本发明有利地降低的反应内部的现有技术噪声的实例包括例如:存在与检测事件不相关的光学或光发射事件,例如与在溶液中扩散的未掺入的碱基相关的光发射,所述碱基与复合体有关但未掺入;在单个观察体积或区域中存在多个复合体;核苷酸与观察体积内的底物或酶复合体的非特异性吸附;被污染的核苷酸类似物,例如被其他荧光组分污染;可能发出微弱荧光的其他反应组分;光谱位移染料组分,例如作为反应条件的原因;等等。发光信号检测以及来自于相应dNTP的附连有发光底物的离去基团上的在掺入下一个核苷酸偶联物类似物之前经历了离散的时长有限的聚合物-萤光素酶反应的发光底物的信息的受控使用,有利地提供了一种减少或消除噪声源的方式,从而提高系统的信噪比,并提高碱基调用和相关序列确定的质量。
在检测系统内部但在反应混合物外部的噪声源可以包括例如通过过滤光学元件流出的反射激发辐射,来自于基底或任何光学组件的散射的激发或发光辐射,相邻信号源的空间串扰,来自于检测器例如CCD的读取噪声,例如EMCCD相机的增益寄存器噪声等。其他系统来源的噪声贡献可能来自于数据处理问题,例如背景校正误差、聚焦漂移误差、自动聚焦误差、脉冲频率分辨率、对准误差等。还有其他噪声贡献可能源自于整个系统外部的来源,包括环境光干扰、灰尘等。
这些噪声成分对隐含在可能与掺入事件相关的任何信号脉冲下的背景光子有贡献。因此,噪声水平通常形成任何信号脉冲可被确定为具有统计意义的界限。
噪声对整体信号数据的贡献可以通过本领域中公知的多种方法来鉴定,包括例如在不存在感兴趣的反应的情况下进行信号监测,此时的任何信号数据被确定为不相关。可选并且优选地,估算基线信号并将其从系统产生的信号数据中减去,使得噪声测量是在感兴趣的反应的测量之后并同时进行的。基线的生成和应用可以通过多种手段来进行,它们将在下文更详细地描述。
根据本发明,信号处理方法在噪声或广义来说所有基于非显著脉冲的信号事件与可能以合理的置信度被认为是与掺入事件相关并因此可初步鉴定为掺入事件的显著信号脉冲之间做出区分。在本发明的情形中,首先根据信号事件是否满足多个不同脉冲标准中的任一者来对信号事件是否构成显著信号脉冲进行分类。一旦被识别或分类为显著脉冲,可以进一步评估信号脉冲以确定所述信号脉冲是否构成掺入事件并且可以被称为特定掺入基础。正如将会理解的,将特定信号事件称为显著脉冲并最终称为掺入事件的基础,基于如本文中一般性阐述的各种不同参数将受到一定量误差的影响。因此应当理解,本发明的涉及将信号数据分类为脉冲并最终分类为掺入事件或已识别的碱基的方面将受到相同或相似误差的影响,并且此类命名法用于讨论的目的,并且作为以一定的置信度预期被调用的碱基是序列中的正确碱基的指示,而不是作为被调用的碱基确实上是给定序列中给定位置中的碱基的绝对确定性的指示。
一个这样的信号脉冲标准是与所讨论的信号事件相关的信号与所有背景噪声水平的比率(“信噪比”或“SNR”),它提供了置信度或统计显著性的标准,可用于将信号事件归类为显著信号脉冲。在将显著脉冲信号与系统或其他噪声成分区分开来时,信号通常必须在多个指标中的一个或多个指标中超过信号阈值水平,所述指标包括例如信号强度、信号持续时间、时间信号脉冲形状、脉冲间隔和脉冲光谱特征。
作为简化的实例,可以将信号数据输入到处理系统中。如果所述信号数据在信号强度和信号持续时间中的一者或多者方面超过信号阈值,则可以被视为显著脉冲信号。类似地,如果使用额外的指标作为阈值,则可以将所述信号与此类指标进行比较,以将特定信号事件识别为显著脉冲。正如将会认识到的,这种比较通常将涉及至少一个前述指标,优选地至少两个这样的阈值,并且在许多情况下前述阈值中的三个或全部四个,以鉴定显著脉冲。
信号阈值,无论是在信号强度、信号持续时间、脉冲形状、间隔或脉冲光谱特性还是这些的组合方面,通常将在来自于先前实验数据的预期信号轮廓的基础上确定,尽管在某些情况下,这样的阈值可以从总信号数据的百分比中识别,其中统计评估表明这种阈值是适合的。特别地,在某些情况下,可以设置阈值信号强度和/或信号持续时间以排除除了总信号数据的某个部分或百分比之外的所有信号数据,允许实时设置阈值。然而,同样地,根据百分比或绝对信号值进行的阈值水平的识别,通常与先前的实验结果相关。在可选情况下,可以在给定评估的情形中确定信号阈值。具体来说,例如,脉冲强度阈值可以基于绝对信号强度,但这种阈值未将例如通过试剂扩散导致的信号背景水平的变化考虑在内,这可能影响所使用的阈值,特别是在信号与背景水平相比相对弱的情况下。因此,在某些情况下,本发明的方法确定所讨论的特定反应的背景发光,所述背景发光相对较小,这是因为微滴内自由扩散的发光底物或核苷酸偶联物类似物的贡献是极小或不存在的,并将信号阈值设置为比实际背景高所需的水平,例如作为脉冲强度与背景发光底物扩散的比率,或通过统计方法例如5西格玛等。通过校正实际反应背景,例如最小发光底物扩散背景,阈值可以针对染料浓度、激光功率等变化的影响自动校准。反应背景是指与感兴趣的反应特异性相关的背景信号水平,并且与对背景的系统贡献相反,预计会随着反应条件而变化,例如系统或底物组分的自发光、激光渗出等。
在依赖于掺入事件的实时检测的特别优选的情况下,显著信号脉冲的识别可能依赖于在信号强度和信号持续时间两方面跨越阈值的信号分布。例如,当检测到信号在增加的方向上越过较低强度阈值时,对来自同一组检测元件例如像素的后续信号数据进行监测,直至信号强度在减小的方向上越过同一个或不同的强度阈值。一旦检测到适合强度的峰值,将其超过一个或多个强度阈值的时段的持续时间与持续时间阈值进行比较。当峰包含足够强且持续时间足够长的信号时,它被称为显著信号脉冲。
除了使用强度和持续时间阈值之外或作为其替代方案,脉冲分类可以采用许多其他信号参数以将脉冲分类为显著脉冲。这样的信号参数包括例如脉冲形状、信号的光谱轮廓例如脉冲光谱质心、脉冲高度、脉冲扩散比、脉冲间隔、总信号水平等。
在识别显著信号脉冲之后或之前,可以将信号数据与特定信号类型相关联。在结合本发明使用的光学检测方案的情形中,这通常表示产生信号数据的信号的特定光谱情况。具体来说,与本发明的方法和过程相结合使用的光学检测系统通常被配置为接收具有可区分的光谱情况的光信号,其中每个光谱可区分的信号情况通常可以与不同的反应事件相关联。例如在核酸测序的情况下,每个光谱可区分的信号可以与掺入或存在于核酸序列的给定位置处的特定核苷酸相关联或指示所述特定核苷酸。因此,检测系统包括接收此类信号并基于它们的光谱来分离信号的光学元件组。然后将不同的信号导向不同的检测器,导向基于单个阵列的检测器上的不同位置,或在同一成像检测器上进行不同的成像(参见例如美国专利7,805,081,其为所有目的整体通过参考并入本文)。
在针对不同信号光谱使用不同检测器的系统的情况下,将信号类型(为了便于讨论,在后文中被称为“颜色分类”、“波长”或“光谱分类”)分配到给定信号是将信号脉冲与从其获得数据的检测器相关联的问题。具体来说,在每个独立的信号分量通过离散的检测器检测的情况下,该检测器对信号的检测表明所述信号被分类为所述必需的颜色。
然而在优选情况下,与本发明相结合使用的检测系统利用成像检测器,在所述检测器上将整个信号的所有或至少几个不同的光谱分量以允许区分不同光谱分量的方式进行成像。因此,多个信号分量被导向同一个整体检测器,但可能入射到所述检测器的完全或部分不同的区域上,例如在成像检测器中的不同像素组上成像,并产生可区分的光谱图像(和相关的图像数据)。当在本文中使用时,光谱或光谱图像通常指示具有由从反应位置接收的光信号的光谱扩展产生的多个强度的像素图像或帧(任选的被减少到一维的数据)。
在其最简单的形式中,应当理解,将颜色分配到在检测器中的一组连续的检测元件或像素上发生的信号事件,将以与为独立的检测器所阐述的相似的方式来完成。具体来说,信号在其上成像并且从中推导出信号数据的像素组的位置指示了信号分量的颜色。然而,在特别优选的情况下,信号分量的空间分离可能不是完美的,使得不同颜色的信号在重叠的像素组上成像。因此,信号识别通常将基于信号入射在其上的多个像素的聚合的身份(或信号分量的整体图像)。
一旦特定信号被识别为显著脉冲并被分配有特定光谱,则可以进一步评估光谱分配的脉冲以确定所述脉冲是否可以调用掺入事件,并因此调用掺入到新生链中的碱基或其在模板序列中的补码。使用来自于附连有发光底物的离去基团(例如PPi-C1、PPi-FMNH2等)的信号来鉴定应该调用哪个碱基。正如上文阐述的,在一个实施方式中,通过使用本发明的双酶聚合酶-萤光素酶反应系统,产生了一组可以以高置信度与掺入事件相关联的特征性信号。
此外,从颜色分配的脉冲数据中调用碱基通常会采用再次鉴定调用碱基的置信度的测试。通常,此类测试将接收信号的数据环境考虑在内,包括许多与在识别显著脉冲中使用的相同的数据参数。例如,此类测试可以包括考虑背景信号水平、相邻脉冲信号参数(间距、强度、持续时间等)、光谱图像分辨率以及各种不同的其他参数。此类数据可用于为颜色分配的信号脉冲的给定碱基调用分配分值,其中此类分值与被调用的碱基不正确的概率相关,例如百分之一(99%准确)、千分之一(99.9%准确)、万分之一(99.99%准确)、十万分之一(99.999%准确)或甚至更高。与用于色谱衍生序列数据的PHRED或类似类型的评分相似,此类分值可用于为测序数据的准确度提供指示和/或过滤掉准确度不足的序列信息。
一旦碱基以足够的准确度被调用后,随后可以将在同一测序运行中并在同一引物延伸反应中调用的碱基附加到每个先前调用的碱基,以提供整个模板或新生链序列中的碱基序列。对于给定序列来说,可以使用迭代处理和进一步的数据处理来填充任何空白、纠正任何错误调用的碱基等。
根据本发明的特定实施方式,对反应位置阵列上通过掺入反应进行的测序的分析可以如美国专利9,447,464的图13中图示的来进行,所述专利为所有目的整体通过参考并入本文。例如,将相机捕获的数据表述为电影,它也是光谱的时间序列。使用光谱校准模板从光谱中提取迹线。然后使用在所述迹线中识别的脉冲返回到光谱数据,并从该数据产生每个脉冲的时间平均脉冲光谱,这种脉冲光谱将包括与酶构象变化有关的事件的光谱。然后也使用所述光谱校准模板将脉冲光谱分类为特定碱基。然后将碱基分类以及脉冲和迹线指标储存或将它们传递给其他逻辑以进行进一步分析。下游分析将包括使用来自于酶构象变化的信息来帮助确定碱基调用的掺入事件。用于本发明的其他碱基调用和序列确定方法可以包括在例如US 8,182,993中描述的那些,所述专利为所有目的整体通过参考并入本文。
本发明的单分子测序方法允许在为聚合酶更加优化的环境中使用聚合酶,其优点是每个测序运行实现非常低的错误率,或者换句话说,每个测序运行获得显著高水平的序列准确度。例如,天然聚合酶每1亿个碱基制造1个错误,并且这在本文中被设想为本文提供的本发明的LASH测序方法的靶错误率。此外,根据每个靶核酸模板使用多个聚合酶的本发明,所述错误率不依赖于读出长度;因此,通过选择较高保真度的聚合酶可以改善错误率,结果需要较低的覆盖率,并且通过使用多个聚合酶仍可实现非常长的读出长度。在考虑覆盖率之前,每次运行由本发明的方法中使用的聚合酶实现的错误率被设想在选自1%-30%、1%-20%、1%-10%、1%-5%、1%-3%、1%-2%、0.000001%-1%、0.00001%-1%、0.0001%-1%、0.001%-1%、0.01%-1%、0.000001%-0.00001%、0.000001%-0.0001%、0.000001%-0.001%的范围内。
这个优点降低了获得由行业标准所定义的准确序列所需的总体覆盖率,这相应地降低了获得核苷酸序列的总体成本。当在本文中使用时,覆盖率是指获得特定靶核酸序列在行业标准内的准确序列所需的测序运行的数目。
实施例
实施例1–基于发光的单分子测序
在经历单分子测序反应之前,对于dATP、dTTP、dGTP和dCTP中的每一者来说,将相应的发光底物附连到其相应的dNTP的末端磷酸。对于每种dNTP碱基(A、T、G、C)存在不同的发光底物(图1A和图1B)。在单分子测序反应过程中,在与DNA聚合酶相互作用后,当所述DNA聚合酶将所述dNTP核苷酸偶联物类似物结合到互补模板链时,它切掉并释放出附连有发光底物的焦磷酸(PPi-C1,图2B;和PPi-FMNH2,图3B)。
在释放后,所述标记的焦磷酸(PPi-C1;PPi-FMNH2)被用于与萤光素酶结合,作为酶催化的结果,产生离散且时间有限的发光(图2C和图3C)。这在所述生物发光的离散且有限的时长(寿命)中引起可检测的发光发射,光发射的光谱对应于掺入到模板链中的相应dNTP。因此,作为dNTP与DNA聚合酶相互作用的结果,通过由发光酶和发光底物产生的发光反应产生发光光,生成对应于为特定dNTP选择的波长的发光信号。所述相应的发光光在离散且有限的时间段后所述光消失之前,例如在一个实施方式中在添加下一个dNTP之前检测。
重复这个dNTP掺入过程,直至达到所需的核酸读长。
尽管已参考本文中的示例性实施方式具体示出和描述了本发明的实施方式,但本领域普通技术人员应该理解,在不背离由后面的权利要求书所定义的本发明的实施方式的精神和范围的情况下,可以在其中对形式和细节进行各种不同的改变。本领域技术人员将会认识到或能够使用不超过常规的实验来确定本文描述的特定程序的大量等同物。这样的等同物被认为是在本发明的范围之内,并且被下述权利要求书所覆盖。在整个本申请引用的所有非专利文献出版物、专利和专利申请的内容,均出于所有目的整体通过参考并入本文。可以为本发明及其实施方式选择那些专利、申请和其他文件的适合的组件、过程和方法。

Claims (36)

1.一种对核酸模板进行测序的方法,所述方法包括:
提供测序混合物,其包含(i)聚合酶,(ii)发光酶,(iii)模板核酸和引物,和(iv)聚合酶-发光试剂溶液,该溶液具有用于进行生长的核酸链的模板指导合成的组分,其中所述试剂溶液包含多种类型的各自附连有发光底物的核苷酸偶联物类似物;其中每种类型的核苷酸偶联物类似物具有可以被所述聚合酶切割的附连有发光底物的离去基团,并且每种类型的核苷酸偶联物类似物附连有不同的发光底物,其中所述附连有发光底物的离去基团在相应的核苷酸偶联物类似物与所述模板链的聚合酶依赖性结合时被切割;
进行核酸合成,使得多个核苷酸偶联物类似物被依次添加到所述模板,由此:a)核苷酸偶联物类似物与所述聚合酶结合,b)当所述核苷酸偶联物类似物上的附连有发光底物的离去基团被所述聚合酶切割时,该核苷酸偶联物类似物被所述聚合酶掺入到所述模板链上,其中所述附连有发光底物的离去基团与所述发光酶在发光反应中结合,其中所述发光底物被所述发光酶催化,在有限的时间段内产生核苷酸特异性发光;以及
在核酸合成进行时检测核苷酸特异性发光信号(光),并使用在每个离散的发光时间段中检测到的核苷酸特异性发光信号来确定所述模板核酸的序列。
2.权利要求1所述的方法,其中所述发光底物选自:腔肠素或其类似物,FMNH2或其类似物,鲁米诺、异鲁米诺、吖啶、二氧杂环丁烷类、过氧草酸(peroxyoxalic)和它们的衍生物。
3.权利要求1-2所述的方法,其中将核苷酸的每个碱基用相对于其他碱基独特的发光底物标记。
4.权利要求1-3所述的方法,其中所述发光酶是萤光素酶或发光蛋白。
5.权利要求1-4所述的方法,其中所述萤光素酶选自海肾萤光素酶、高斯(Gaussia)萤光素酶、哈维氏弧菌萤光素酶、费氏弧菌萤光素酶、费氏发光杆菌萤光素酶、明亮发光杆菌萤光素酶、鳆发光杆菌萤光素酶和发光光杆状菌萤光素酶。
6.权利要求1-4所述的方法,其中所述发光蛋白选自由水母发光蛋白和奥贝林蛋白(obelin)组成的组。
7.权利要求1-6所述的方法,其中所述聚合酶是DNA聚合酶。
8.权利要求1-7所述的方法,其中所述核苷酸偶联物类似物的类型包含选自由dATP、dTTP、dGTP、dCTP、dUTP、dGTPαS、dCTPαS、dTTPαS和dATPαS组成的组的核苷酸。
9.权利要求1-8所述的方法,其中使用多个聚合酶。
10.一种对模板核酸进行测序的方法,所述方法包括:
提供测序混合物,其包含:靶模板核酸,多种类型的各自附连有发光底物的核苷酸偶联物类似物(其中每种类型的核苷酸偶联物类似物具有可以被所述聚合酶切割的附连有发光底物的离去基团,并且每种类型的核苷酸偶联物类似物附连有不同的发光底物),发光酶和多个聚合酶;
进行核酸合成,使得多个核苷酸偶联物类似物被依次添加到所述模板;以及
在核酸合成进行时检测相应的核苷酸偶联物类似物,以确定所述模板核酸的序列。
11.一种检测样品中靶核酸序列的存在的方法,所述方法包括:
提供延伸混合物,其包含(i)聚合酶,(ii)发光酶,(iii)模板核酸样品,(iv)与特定靶核酸序列杂交(例如与其互补)的引物-探针,和(v)聚合酶-发光试剂溶液,该溶液具有用于进行生长的核酸链的模板指导合成的组分,其中所述试剂溶液包含多种类型的各自附连有发光底物的核苷酸偶联物类似物;其中每种类型的核苷酸偶联物类似物具有可以被所述聚合酶切割的附连有发光底物的离去基团,并且每种类型的核苷酸偶联物类似物附连有相同或不同的发光底物,其中所述附连有发光底物的离去基团在相应的核苷酸偶联物类似物与所述模板链的聚合酶依赖性结合时被切割;
进行核酸延伸合成,使得在所述引物-探针杂交到所述靶核酸序列的情况下多个核苷酸偶联物类似物被依次添加到所述模板,由此:a)核苷酸偶联物类似物与所述聚合酶结合,b)当所述核苷酸偶联物类似物上的附连有发光底物的离去基团被所述聚合酶切割时,该核苷酸偶联物类似物被所述聚合酶掺入到所述模板链上,其中附连有发光底物的离去基团与所述发光酶在发光反应中结合,其中所述发光底物被所述发光酶催化,以产生发光;以及
在核酸合成进行时检测来自于所述发光的光,由此光的检测指示了所述特定靶核酸序列的存在。
12.权利要求11所述的方法,其中对靶核酸的量进行定量。
13.权利要求11所述的方法,其中靶核酸的量基于所述发光的强度进行定量。
14.权利要求11-13所述的方法,其中每种类型的核苷酸偶联物类似物附连有相同的发光底物。
15.权利要求1-14所述的方法,其中使用多个聚合酶。
16.权利要求1-15所述的方法,其中多个聚合酶以选自由至少2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、200000、300000、400000、500000、600000、700000、800000、900000和至少1000000个聚合酶组成的组的量使用。
17.权利要求1-16所述的方法,其中多个聚合酶以选自由至少2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1、150:1、200:1、250:1、300:1、350:1、400:1、450:1、500:1、550:1、600:1、650:1、700:1、750:1、800:1、850:1、900:1、950:1、1000:1、10000:1、20000:1、30000:1、40000:1、50000:1、60000:1、70000:1、80000:1、90000:1、100000:1、200000:1、300000:1、400000:1、500000:1、600000:1、700000:1、800000:1、900000:1和至少1000000:1组成的组的聚合酶与模板的比例使用。
18.一种发光底物-核苷酸偶联物类似物,其包含脱氧核糖核苷酸(dNTP)或其类似物和附连到它的发光底物。
19.权利要求18所述的发光底物-核苷酸偶联物类似物,其中所述发光底物-核苷酸偶联物类似物中的核苷酸(dNTP)是修饰的核苷酸类似物。
20.权利要求18所述的发光底物-核苷酸偶联物类似物,其中所述dNTP选自由dATP、dTTP、dGTP、dCTP和dUTP、dATPαS、dGTPαS、dCTPαS、dTTPαS和dUTPαS组成的组。
21.权利要求18所述的发光底物-核苷酸偶联物类似物,其中所述核苷酸偶联物类似物能够作为所述聚合酶和选择性切割活性的底物。
22.权利要求18所述的发光底物-核苷酸偶联物类似物,其中所述核苷酸偶联物类似物是在多磷酸链中具有三个或更多个磷酸的多磷酸核苷,并且发光底物附连到所述多磷酸链的在掺入到生长的模板指导的链中之后被切掉的部分。
23.权利要求22所述的发光底物-核苷酸偶联物类似物,其中所述多磷酸是纯粹的多磷酸(--O--PO3-)、焦磷酸(PPi)或其中具有取代的多磷酸。
24.权利要求18所述的发光底物-核苷酸偶联物类似物,其中所述发光底物选自:腔肠素或其类似物,FMNH2或其类似物,鲁米诺、异鲁米诺、吖啶、二氧杂环丁烷类、过氧草酸和它们的衍生物。
25.权利要求18所述的发光底物-核苷酸偶联物类似物,其中所述发光底物附连到末端磷酸。
26.权利要求25所述的发光底物-核苷酸偶联物类似物,其中当在所述发光底物-核苷酸偶联物被掺入到所述模板链中时通过所述聚合酶产生所述PPi附连有发光底物的离去基团时,所述附连有发光底物的焦磷酸或附连有发光底物的离去基团能够与相应的萤光素酶结合。
27.权利要求26所述的发光底物-核苷酸偶联物类似物,其中所述PPi附连有发光底物的离去基团选自PPi-LS、PPi-C、PPi-FMNH2。
28.权利要求18所述的发光底物-核苷酸偶联物类似物,其中所述核苷酸偶联物类似物具有独特的发光信号。
29.权利要求28所述的发光底物-核苷酸偶联物类似物,其中所述发光信号是选自250nm–750nm范围内的波长。
30.权利要求28所述的发光底物-核苷酸偶联物类似物,其中所述发光信号是选自411、417、428、440、484和509nm的波长。
31.一种核苷酸偶联物类似物的链延伸集合,其包含至少4种不同的脱氧核糖核苷酸(dNTP),使得所述链延伸集合可以掺入到生长的核酸链的模板指导合成中。
32.权利要求31所述的核苷酸偶联物类似物的链延伸集合,其中每种相应的dNTP或其类似物使用不同的、相对于其他dNTP独特的发光底物进行修饰,使得每当聚合酶将修饰的脱氧核糖核苷三磷酸(dNTP)核苷酸偶联物类似物掺入到与模板DNA互补的链中时,产生特异性针对所述附连的相应核苷酸的发光信号。
33.权利要求31所述的核苷酸偶联物类似物的链延伸集合,其中如果在反应中使用修饰的dTTP和dUTP类似物两者,则它们可以各自附连有产生相同波长信号的相同发光底物,或者可以各自附连有不同的发光底物。
34.权利要求31所述的核苷酸偶联物类似物的链延伸集合,其中所述dNTP选自由dATP、dTTP、dGTP、dCTP和dUTP、dATPαS、dGTPαS、dCTPαS、dTTPαS和dUTPαS组成的组。
35.权利要求31所述的核苷酸偶联物类似物的链延伸集合,其中发光底物选自由下述组成的组:腔肠素或其类似物,FMNH2或其类似物,鲁米诺、异鲁米诺、吖啶、二氧杂环丁烷类、过氧草酸和它们的衍生物。
36.权利要求31所述的核苷酸偶联物类似物的链延伸集合,其选自腔肠素-dNTP偶联物1(图7)、腔肠素-dNTP偶联物2(图8)或腔肠素-dNTP偶联物3(图9)。
CN202180037735.XA 2020-03-27 2021-03-29 用于单分子测序和靶核酸检测的lash方法 Pending CN116034167A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063000979P 2020-03-27 2020-03-27
US63/000,979 2020-03-27
PCT/US2021/024721 WO2021195635A1 (en) 2020-03-27 2021-03-29 Lash methods for single molecule sequencing & target nucleic acid detection

Publications (1)

Publication Number Publication Date
CN116034167A true CN116034167A (zh) 2023-04-28

Family

ID=77890646

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180037735.XA Pending CN116034167A (zh) 2020-03-27 2021-03-29 用于单分子测序和靶核酸检测的lash方法

Country Status (7)

Country Link
US (1) US20230175054A1 (zh)
EP (1) EP4127230A1 (zh)
JP (1) JP2023519333A (zh)
KR (1) KR20230020950A (zh)
CN (1) CN116034167A (zh)
CA (1) CA3173699A1 (zh)
WO (1) WO2021195635A1 (zh)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69940433D1 (de) * 1998-08-11 2009-04-02 Siemens Healthcare Diagnostics Im nahen infrarot chemilumineszente akridinium derivate und ihre verwendung
US20050147965A1 (en) * 2003-12-31 2005-07-07 Zhong Zhandong D. Compositions and methods for detecting reverse transcriptase in a sample
JP7036343B2 (ja) * 2017-03-28 2022-03-15 国立大学法人電気通信大学 新規セレンテラジン誘導体
CN112368397A (zh) * 2018-03-13 2021-02-12 萨摩尔股份有限公司 用于单分子测序的方法
WO2019217939A1 (en) * 2018-05-11 2019-11-14 Complete Genomics, Inc. Polysubstrates and methods of use thereof

Also Published As

Publication number Publication date
CA3173699A1 (en) 2021-09-30
EP4127230A1 (en) 2023-02-08
WO2021195635A1 (en) 2021-09-30
KR20230020950A (ko) 2023-02-13
JP2023519333A (ja) 2023-05-10
US20230175054A1 (en) 2023-06-08

Similar Documents

Publication Publication Date Title
Gandelman et al. Novel bioluminescent quantitative detection of nucleic acid amplification in real-time
Mori et al. Real-time turbidimetry of LAMP reaction for quantifying template DNA
EP2425023B1 (en) Real-time sequencing methods and systems
US20210040554A1 (en) Methods for single molecule sequencing
US20220033894A1 (en) Methods for single molecule sequencing
US20110045485A1 (en) Analytical method and kit
US20230175054A1 (en) Lash methods for single molecule sequencing & target nucleic acid detection
US20230022124A1 (en) Sequencing using non-natural nucleotides
US20230080657A1 (en) Methods for nucleic acid sequencing
US20070117118A1 (en) Discrimination method of target base in DNA, and allele specific primer used in the method of the same
US20240124929A1 (en) Mesophilic compositions for nucleic acid amplification
US20070117116A1 (en) Discrimination method of target base in DNA, and allele specific primer used in the method of the same
WO2023081653A1 (en) Nucleic acid polymerase for incorporating labeled nucleotides
US20070082348A1 (en) Discrimination method of target base in DNA, and allele specific primer used in the method of the same
Gandelman et al. Novel Bioluminescent Quantitative Detection of Nucleic Acid Amplification in
US20070117117A1 (en) Discrimination method of target base in DNA, and Allele specific primer used in the method of the same
US20070117115A1 (en) Discrimination method of target base in DNA, and allele specific primer used in the method of the same
US20070037176A1 (en) Discrimination method of target base in DNA, and allele specific primer used in the method of the same
US20070082344A1 (en) Discrimination method of target base in DNA, and allele specific primer used in the method of the same

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination