CN109219664A - 双色纳米孔测序 - Google Patents

双色纳米孔测序 Download PDF

Info

Publication number
CN109219664A
CN109219664A CN201780033824.0A CN201780033824A CN109219664A CN 109219664 A CN109219664 A CN 109219664A CN 201780033824 A CN201780033824 A CN 201780033824A CN 109219664 A CN109219664 A CN 109219664A
Authority
CN
China
Prior art keywords
optical
chain
nano
nucleotide
label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201780033824.0A
Other languages
English (en)
Inventor
卡尔·盖格勒
简·F·西蒙斯
斯蒂芬·C·梅斯维兹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Quantapore Inc
Original Assignee
Quantapore Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Quantapore Inc filed Critical Quantapore Inc
Publication of CN109219664A publication Critical patent/CN109219664A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • G01N21/6408Fluorescence; Phosphorescence with measurement of decay time, time resolved fluorescence
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • G01N21/6428Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes"
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/483Physical analysis of biological material
    • G01N33/487Physical analysis of biological material of liquid biological material
    • G01N33/48707Physical analysis of biological material of liquid biological material by electrical means
    • G01N33/48721Investigating individual macromolecules, e.g. by translocation through nanopores
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • G01N21/6428Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes"
    • G01N2021/6439Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes" with indicators, stains, dyes, tags, labels, marks
    • G01N2021/6441Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes" with indicators, stains, dyes, tags, labels, marks with two or more labels

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Nanotechnology (AREA)
  • Optics & Photonics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及用于使用纳米孔和光学检测分析包含至少两种类型的单体的线性链的聚合物诸如多核苷酸包括DNA、RNA等的方法。在一些实施方案中,少至两种不同种类的核苷酸被不同的光学标记物标记,所述不同的光学标记物针对靶多核苷酸的有义链和反义链两者中的被选择种类的核苷酸生成可区分的光学信号。使标记的链易位通过纳米孔,其中链的核苷酸被限制为顺序地通过光学检测区,在所述光学检测区中,它们的标记物生成构成光学特征的光学信号的顺序。在一些实施方案中,将来自有义链和反义链两者的光学特征的信息组合以确定靶多核苷酸的完整核苷酸序列。

Description

双色纳米孔测序
相关申请的交叉引用
本申请要求2016年5月31日提交的美国临时专利申请第62/343,283号和2016年11月14日提交的美国临时专利申请第62/421,804号的优先权的权益,这两个申请的内容通过引用以其整体并入本文。
背景
纳米孔测序已被提出作为克服当前DNA测序技术中的一系列挑战的方法,所述挑战包括减少每次运行测序的成本、简化样品制备、减少运行时间、增加序列读段长度、提供实时样品分析等。然而,通过纳米孔的聚合物分析,诸如DNA分析,具有其自身的一系列技术困难,诸如用于限制DNA移动的纳米结构的可靠制造、DNA易位速率的控制、明确的核苷酸鉴别、来自大规模纳米级传感器阵列的信号的检测和处理等等,例如Branton等,NatureBiotechnology,26(10):1146-1153(2008)。
核苷酸的光学检测已被提出作为纳米孔测序领域中的一些技术困难,例如从大规模纳米孔阵列收集独立信号的困难的潜在解决方案。然而,实施这样的解决方案存在许多挑战,这包括例如克服基于光学的单分子分析的典型背景噪声,和建立用于将光学标记物附接至核苷酸的可靠且便利的方法。
鉴于以上情况,如果允许通过少至两种不同的光学标记物对靶多核苷酸进行基于光学的纳米孔序列分析的方法是可得的,这对于纳米孔测序技术及其特定应用诸如基于光学的纳米孔测序将是有利的。
发明概述
本发明涉及用于使用纳米孔和用于不同单体的少至两种光学标记物的聚合物分析诸如多核苷酸分析的方法和装置。
在一些实施方案中,本发明的方法可以通过以下步骤来实施:(a)拷贝双链多核苷酸的一条链,使得具有不同光学标记物的核苷酸类似物取代至少两种核苷酸,以形成标记的链;(b)拷贝所述链的互补链,使得所述核苷酸类似物取代相同的至少两种核苷酸,以形成标记的互补链;(c)使所述标记的链易位通过纳米孔,使得所述标记的链的核苷酸依次通过激发区,在所述激发区中光学标记物被激发以生成光学信号;(d)当所述标记的链易位通过纳米孔时,检测来自光学标记物的光学信号的时间序列以产生链的光学特征(signature);(e)使所述标记的互补链易位通过纳米孔,使得所述标记的互补链的核苷酸依次通过激发区,在所述激发区中光学标记物被激发以生成光学信号;(f)当所述标记的互补链易位通过纳米孔时,检测来自光学标记物的光学信号的时间序列以产生互补链的光学特征;(g)由所述链的光学特征和所述互补链的光学特征确定所述双链多核苷酸的序列。
本发明有利地克服了将光学标记物附接至每一个(each and every)核苷酸以用于基于光学的纳米孔测序的问题。在一个方面,该问题通过以下来解决:标记靶多核苷酸的有义链和反义链两者中的核苷酸类型的子集,例如,T和C;并且组合来自由两条链生成的光学特征的序列信息以获得靶多核苷酸的核苷酸序列。在另一个方面,该问题通过以下来解决:标记靶多核苷酸的一条链或另一条链中的核苷酸类型的子集,并且将生成的光学特征与源自已知基因组序列的或从所述已知基因组序列测量的光学特征的参考文库进行比较。本发明的这些优点和其他优点在许多实施方式和应用中被例证,其中一些在下文和整个说明书中被概述。
附图简述
图1A-1F示出了本发明的不同的实施方案。
图2示出了使用FRET信号生成和落射照明(epi-illumination)检测系统的基于光学的纳米孔测序系统。
图3示出了使用FRET信号生成和TIRF系统的基于光学的纳米孔测序系统。
图4示出了共焦落射照明系统的基本组件。
图5示出了用于激发光学标记物的无FRET信号生成的TIRF系统的元件。
图6为示出了用于基于包含来自多于一个(multiple)光学标记物的光的光学信号的测量来调用核苷酸序列的步骤的流程图。
发明详述
虽然本发明适用于各种修改和替代形式,其细节已通过举例的方式在附图中被显示并且将被详细描述。然而,应该理解的是,本发明并非将本发明限制于所描述的特定的实施方案。相反,本发明涵盖落入本发明精神和范围内的所有修改形式、等同形式物和替代形式。例如,出于说明的目的,显示了本发明的特定的纳米孔类型和数目、特定的标记物、FRET对、检测方案、制造方法。应该理解的是,本公开内容在这些方面不意图被限制,因为可以利用其他类型的光学标记物,特别是荧光标记物,以及其他类型的纳米孔、纳米孔的阵列和其他制造技术以实施本文讨论的系统的各个方面。关于本发明各方面的指导见于本领域普通技术人员熟知的许多可用的参考文献和论文,包括例如,Cao,Nanostructures&Nanomaterials(Imperial College Press,2004);Levinson,Principles ofLithography,第二版(SPIE Press,2005);Doering和Nishi主编,Handbook ofSemiconductor Manufacturing Technology,第二版(CRC Press,2007);Sawyer等,Electrochemistry for Chemists,第二版(Wiley Interscience,1995);Bard和Faulkner,Electrochemical Methods:Fundamentals and Applications,第二版(Wiley,2000);Lakowicz,Principles of Fluorescence Spectroscopy,第三版(Springer,2006);Hermanson,Bioconjugate Techniques,第二版(Academic Press,2008)等,其相关部分在此通过引用并入。
在一个方面,本发明涉及用于使用纳米孔和光学检测分析包含至少两种类型单体的线性链的聚合物例如多核苷酸包括DNA、RNA等的方法和装置。在一些实施方案中,少至两种不同种类的核苷酸被不同的光学标记物标记,所述不同的光学标记物针对靶多核苷酸的有义链和反义链两者中的被选择种类的核苷酸生成可区分的光学信号。例如,每个靶多核苷酸的互补链上的C和T可以被标记的类似物代替,其中C和T类似物的标记物能够生成不同的光学信号。然后通过使标记的链易位通过纳米孔来生成光学特征,其中所述链的核苷酸被限制为顺序地通过光学检测区,在所述光学检测区中,使得它们的标记物生成光学信号。在一些实施方案中,将来自靶多核苷酸的有义链和反义链两者的光学特征的信息组合以确定靶多核苷酸的完整核苷酸序列。在一些实施方案中,来自有义链和反义链的光学特征由单独的纳米孔测量确定,然后基于光学特征的互补性进行组合。在一些这样的实施方案中,这样的测定是靶多核苷酸的从头序列测定。在另外的实施方案中,来自单链聚合物包括但不限于ssDNA、RNA、多肽等的光学特征由来自其一个或更多个单体上的一个或更多个光学标记物的发射的纳米孔测量确定,此后,通过用数据库中的参考光学特征鉴定所测量的光学特征将这样的光学特征与单体序列关联。在一些实施方案中,单一核苷酸被标记,使得靶多核苷酸仅生成单色光学特征,其可用于鉴定参考文库中特定生物体的核苷酸序列。
在一些实施方案中,靶多核苷酸的被选择种类的核苷酸在使用核酸聚合酶的延伸反应中被标记的核苷酸类似物代替。使靶多核苷酸的标记的链易位通过纳米孔,所述纳米孔限制所述链为依次移动通过光学检测区,在所述光学检测区中所述链被激发使得它们产生光学信号,所述光学信号指示生成信号的标记物所附接的核苷酸的种类。个体链的光学信号的集合在本文中被称为该链的光学特征。在一些实施方案中,在链和其互补链(即有义链和反义链)例如经由发夹衔接子被连接的情况下,单个光学特征可以包括来自有义链和反义链两者的核苷酸上的光学标记物的光学信号。在其他实施方案中,靶多核苷酸的不同的链可以单独生成两种不同的光学特征,所述两种不同的光学特征可以被组合或者一起用于分析,如以上所提及的。这样的单独分析的链可以在生成光学特征之后例如通过使用分子标签(其可以是例如附接至靶多核苷酸的已知位置并且具有允许容易关联的长度和序列模式和多样性的寡核苷酸区段)被关联。可选地,这样的单独分析的链可以在生成光学特征之后通过它们的独特的光学信号即光学特征序列被关联,条件是不同的标记物被用于每条链上的多于一种(a plurality of)不同种类的核苷酸并且条件是靶多核苷酸比预定长度长且靶多核苷酸从低于预定尺寸的群体中提取出。即,来自双链靶多核苷酸的两条链的光学特征由于由同一原始分子产生可以以预定概率被正确地关联,其取决于所使用的标记方案(特别是每条链上使用的标记物的数目)、靶多核苷酸的长度和靶多核苷酸从其提取的群体的尺寸。通过链的独特的光学特征的这样的链的加标签在本文中可以被称为固有的链标签。
该概念可以通过以下简化的实例来说明:假设靶多核苷酸为108个随机序列多核苷酸群体的成员,每个多核苷酸的长度为100个碱基对,并且假设每条链上的T和C被不同地标记,使得与T、C和嘌呤相关的信号为可检测的。将存在3100(~5×l047)种可以被测量到的不同的光学特征,使得即使在108个序列的大样品情况下,测量的每个光学特征将是独特的概率也是非常高的,并且因此可以与由同一靶多核苷酸生成的互补链的光学特征独特地关联。在一些实施方案中,至少两种核苷酸具有不同的标记物(例如,T和C),靶多核苷酸的长度为至少50个碱基对,并且靶多核苷酸选自少于1010个不同分子的群体。在其他实施方案中,至少两种核苷酸具有不同的标记物(例如,T和C),靶多核苷酸的长度为至少100个碱基对,并且靶多核苷酸选自少于1015个至少100个碱基对的不同分子的群体。在其他实施方案中,至少两种核苷酸具有不同的标记物(例如T和C),靶多核苷酸的长度为至少100个碱基对,并且靶多核苷酸选自少于1010个至少100个碱基对的不同分子的群体。在一些实施方案中,每条链中被不同地标记的核苷酸的数目、靶多核苷酸的最小长度和靶多核苷酸的群体的尺寸被选择使得由同一靶多核苷酸的互补链生成的光学特征可以以至少95%的概率或以至少99%的概率或以至少99.9%的概率被正确地关联或鉴定。在一些实施方案中,靶多核苷酸的群体的尺寸可以是预定尺寸,或者它可以简单地是已知尺寸的群体,或者它可以是估计尺寸的群体。在这些情况的每个中,其他参数(标记物的数目、最小特征长度等)被选择以获得将来自互补链的光学特征正确关联或配对的期望的概率。
如本文使用的,在一些实施方案(例如,仅使用两种标记物)中,提及候选互补链的光学特征的术语“关联”或“配对”意指将来自一条链的信号的模式与来自另一条链的信号之间的间隔的模式匹配(取决于实施方案可能以逆时(reverse temporal)顺序)。在其中使用三种标记物(例如,C具有标记物1、T具有标记物2、以及A或G具有标记物3)的实施方案中,将存在来自标记物3的“A或G”信号的序列而不是信号(例如,C或T信号)之间的间隔。
在另外的实施方案中,如果仅两种核苷酸例如T和C被标记且为可检测的,来自这样的标记的链的可能的不同光学特征的数目仍然足够大,以用作固有链标签。例如,在具有长度为100个碱基对的随机序列多核苷酸的群体中,被标记的T和C将生成约250种,或约1015种不同的光学特征。
本领域普通技术人员将理解,在任何给定情况下不同固有链标签的数目的确定部分取决于来自几个来源的噪声的量级,例如,核苷酸的易位速度的链内变化、光学信号从其收集的检测区的体积的变化、对光学信号量级或质量的局部物理和化学影响等。来自这样的来源的噪声对光学特征的影响可以通过常规的数据分析技术来处理。
如下所述,本发明的光学特征可以包括混合的光学信号,因为在每个检测间隔中检测到的信号可以包括在分辨受限区域或体积内发射的来自多于一个光学标记物的贡献;即,它们可以(例如)是混合的FRET信号,如Huber等的美国专利公布US20160076091所描述的,其通过引用并入本文。
如以上所提及的,在一些实施方案中,本发明的方法可以通过以下步骤来实施:(a)拷贝双链多核苷酸的一条链,使得具有不同光学标记物的核苷酸类似物取代至少两种核苷酸,以形成标记的链;(b)拷贝所述链的互补链,使得所述核苷酸类似物取代相同的至少两种核苷酸,以形成标记的互补链;(c)使标记的链易位通过纳米孔,使得标记的链的核苷酸依次通过激发区,在所述激发区中光学标记物被激发以生成光学信号;(d)当标记的链易位通过纳米孔时,检测来自光学标记物的光学信号的时间序列以产生链的光学特征;(e)使标记的互补链易位通过纳米孔,使得标记的互补链的核苷酸依次通过激发区,在所述激发区中光学标记物被激发以生成光学信号;(f)当标记的互补链易位通过纳米孔时,检测来自光学标记物的光学信号的时间序列以产生互补链的光学特征;(g)由所述链的光学特征和所述互补链的光学特征确定所述双链多核苷酸的序列。在一些实施方案中,两种核苷酸被标记,其可以是C和T、C和G、C和A、T和G、T和A、或G和A。在一些实施方案中,嘧啶核苷酸被标记。在其他实施方案中,嘌呤核苷酸被标记。在一些实施方案中,链的被选择种类的核苷酸通过使用核酸聚合酶在引物延伸反应中掺入所述被选择种类的核苷酸的标记的类似物dNTP来标记。在其他实施方案中,链的被选择种类的核苷酸通过在延伸反应中掺入所述被选择种类的核苷酸的类似物dNTP来标记,其中类似物dNTP被衍生具有正交反应官能性,其允许在随后的反应中将不同的标记物附接至不同种类的核苷酸。该后一标记方法在Jett等的美国专利5,405,747中被公开,该专利通过引用并入本文。
在一些实施方案中,三种核苷酸被标记,其可以包括用第一光学标记物标记C,用第二光学标记物标记T,以及用第三光学标记物标记G和A。在其他实施方案中,可以如下所示标记以下核苷酸的组:分别用第一光学标记物和第二光学标记物标记C和G,并且用第三光学标记物标记T和A;分别用第一光学标记物和第二光学标记物标记C和A,并且用第三光学标记物标记T和G;分别用第一光学标记物和第二光学标记物标记T和G,并且用第三光学标记物标记C和A;分别用第一光学标记物和第二光学标记物标记A和G,并且用第三光学标记物标记T和C。
在一些实施方案中,光学标记物是在来自与纳米孔缔合的供体的能量转移之后生成荧光共振能量转移(FRET)信号的荧光受体分子。在一些实施方案中,如下面进一步描述的,供体可以是光学活性纳米颗粒,诸如量子点、纳米金刚石等。受体分子和供体的特定组合的选择是本领域普通技术人员的设计选择。在一些实施方案(其中的一些在下文被更充分地描述)中,单个量子点被附接至纳米孔并且使用激发光束被激发以发出荧光,所述激发光束的波长被充分分离,通常更低(即更蓝),使得激发光束对受体产生的FRET信号没有贡献。同样,选择其发射波长与两个受体分子的吸收带重叠的量子点以促进FRET相互作用。在一些实施方案中,两个供体可以被用于纳米孔的每个激发区,其中每个供体的发射波长被选择为最佳地与另一个受体分子的吸收带重叠。
图1A-1E示出了以上方法的几个实施方案。在图1A中,双链靶多核苷酸(100)(SEQID NO:1)由有义链(101)和互补的反义链(102)组成,使用常规方法将“Y”衔接子(104)和“Y”衔接子(106)连接(103)至所述双链靶多核苷酸(100);所述常规方法例如Weissman等,美国专利6,287,825;Schmitt等,美国专利公布US2015/004468,其通过引用并入本文。衔接子(分别为104和106)的臂(108)和臂(110)包含引物(116)和引物(118)退火(105)至其的引物结合位点。双链部分(112)和双链部分(114)可以包含标签序列,例如,一个或两个双链部分可以包含预定长度和组成的随机分子(randomer),其可以用于随后的链的再关联,例如以获得来自各自的链的光学特征的序列信息。在使引物(116)和引物(118)退火之后,它们可以在(例如,如所示出的)标记的dUTP类似物(在掺入的核苷酸中显示为空心圆圈的标记物)和标记的dCTP类似物(在掺入的核苷酸中显示为实心圆圈的标记物)和天然未标记的dGTP和dATP(既没有未标记的dTTP也没有未标记的dCTP存在,使得在延伸的链中类似物进行完全取代)的存在下通过核酸聚合酶延伸(107)。G和A上标记物的不存在在掺入的核苷酸上方用破折号表示。在没有噪声的理想检测系统中,空心圆圈、实心圆圈和破折号的顺序将是由示出的有义链和反义链在它们通过纳米孔的激发区时生成的光学特征的良好表示。尽管在该实施方案中,链的5’首先易位通过纳米孔,在其他实施方案中,可以选择易位取向(即,5’首先易位通过纳米孔或3’首先易位通过纳米孔)以产生不必需由反向互补链生成的光学特征。或者,可选地,可以选择易位取向使得互补的光学特征是基于3’首先易位的两个序列。
在图1B中,示出了采用三种标记物的可选实施方案的延伸产物(120)和延伸产物(122)。如上所示,掺入的标记的dUTP类似物被显示为空心圆圈,并且掺入的标记的dCTP类似物被显示为实心圆圈。掺入的标记的dATP和dGTP类似物被显示为实心菱形(并且在下方在核苷酸序列表示中各自被显示为“p”,用于表示“嘌呤”)。三种标记物的实施方案具有提供用于定量“C”或“T”的信号之间的空位(或核苷酸数目)的基础的优点。例如,来自一系列连续嘌呤的累积信号将提供嘌呤数目的度量,该度量可以与候选互补序列上的C和T的连续区段匹配。
在图1A和1B两个实施方案的变化形式中,核苷酸序列的推导可以通过首先将候选互补序列与参考序列的光学特征进行比较来促进。
关于选择标记的核苷酸的种类、标记物的种类和用于将标记物附接至碱基的接头的种类、以及用于在dNTP类似物的存在下的延伸反应的核酸聚合酶的指导可见于以下参考文献,这些参考文献通过引用并入:Goodman等,美国专利5,945,312;Jett等,美国专利5,405,747;Muehlegger等,美国专利公布US2004/0214221;Giller等,Nucleic AcidsResearch,31(10):2630-2635(2003);Tasara等,Nucleic Acids Research,31(10):2636-2646(2003);Augustin等,J.Biotechnology,86:289-301(2001);Brakmann,CurrentPharmacuetical Biltechnology,5(1):119-126(2004)等。用于与本发明一起使用的示例性核酸聚合酶包括但不限于Vent exo-、Taq、大肠杆菌(E.coli)Pol I、Tgo exo-、Klenow片段exo-、Deep Vent exo-等。在一些实施方案中,示例性核酸聚合酶包括但不限于Ventexo-和Klenow片段exo-。用于dNTP类似物的示例性荧光标记物包括但不限于Alexa 488、AMCA、Atto 655、Cy3、Cy5、Evoblue 30、荧光素、Gnothis蓝1、Gnothis蓝2、Gnothis蓝3、Dy630、Dy635、MR121、罗丹明(rhodamine)、罗丹明绿(Rhodamine Green)、Oregon绿、TAMRA等。用于dUTP类似物的示例性荧光标记物包括但不限于Alexa 488、AMCA、Atto 655、Cy3、Cy5、Dy630、Dy665、Evoblue 30、Evoblue 90、荧光素、Gnothis蓝1、Gnothis蓝2、Gnothis蓝3、MR121、Oregon绿、罗丹明、罗丹明绿、TAMRA等。用于dCTP类似物的示例性荧光标记物包括但不限于Atto 655、Cy5、Evoblue 30、Gnothis蓝3、罗丹明、罗丹明绿、TAMRA等。用于dATP类似物的示例性荧光标记物包括但不限于Atto 655、Cy5、Evoblue 30、Gnothis蓝3、罗丹明绿等。用于dGTP类似物的示例性荧光标记物包括但不限于Evoblue 30、Gnothis蓝3、罗丹明绿等。用于dUTP类似物和dCTP类似物的示例性荧光标记物对包括但不限于(TAMRA,罗丹明绿)、(Atto 655,Evoblue 30)、(Evoblue 30,Atto 655)、(Evoblue 30,Gnothis蓝3)、(Evoblue 30,罗丹明绿)、(Gnothis蓝1,罗丹明绿)、(Gnothis蓝2,Atto 655)、(Gnothis蓝3,Cy5)等。
图1C示出了一个实施方案,其中使用两种标记物,并且借助于发夹衔接子(130)连接有义链和反义链,例如如美国专利公布US 2015/0152492和US 2012/0058468中所教导的,其通过引用并入本文。将加尾的衔接子(132)和发夹衔接子(130)与靶多核苷酸(100)(SEQ ID NO:1)连接。在变性和引物(134)退火之后,延伸反应产生延伸产物(135),其包含区段(136)(其为链(101)的标记的互补链)和区段(138)(其为链(101)的标记的反向互补链)。在延伸产物(135)易位通过纳米孔并生成光学特征之后,可以确定靶多核苷酸(100)的序列。任选地,发夹(130)的序列可以被选择使得在延伸反应期间掺入预定的模式的标记物,其可以被用于例如通过指示区段(136)结束于何处以及区段(138)开始于何处等辅助光学特征的分析。
图1D示出了另一个实施方案,其中两个相同的发夹衔接子(140)被连接至靶多核苷酸(100)(SEQ ID NO:1)的末端。在该实施方案中,发夹衔接子(140)包含引物(142)可以退火(144)至其并且在滚环扩增(RCA)中被延伸以产生标记的延伸产物(148a和148b)的引物结合位点。在一些实施方案中,进行RCA(146)以使得至少一个完整的环形物(circuit)由有义链(101)和反义链(102)组成。然后使延伸产物(148a和148b)易位通过纳米孔,使得标记的核苷酸依次通过激发区用于生成光学特征。
图1E示出了一种测量,其中靶多核苷酸(100)(SEQ ID NO:1)包含遗传基因座(150),该遗传基因座(150)包含例如单核苷酸多态性(SNP)或由例如单核苷酸多态性(SNP)组成,但其另外包含已知序列。测量的目的是遵循与由以下公开的方法类似的方法确定SNP的身份:Nelson等,美国专利8921072;美国专利公布US2015/0031035和US20015/0031086;Lin等,国际专利公布WO2015/089333;Lou等,Proc.Natl.Acad.Sci.,110(49):19872-19877(2013),这些参考文献通过引用并入本文。即,在该实施方案中,感兴趣的基因座(及其互补序列)的滚环复制允许人们以更大的可靠性和以减少的错误率确定基因座(150)的身份。靶多核苷酸(100)如以上引用的参考文献中所教导的那样变性和环化(155),此后靶特异性引物(160)和靶特异性引物(161)被退火至包含序列(101)和序列(102)的单链环。靶特异性引物(160)和靶特异性引物(161)在选择的核苷酸类似物(例如,标记的dUTP和标记的dCTP)存在下延伸,此后光学特征被生成。有义链(101)和反义链(102)可以借助于靶多核苷酸(100)的固有标签关联,该固有标签由多核苷酸(100)中独特的遗传基因座(150)相对位置组成。在图IE的实例中,区段(151)和区段(153)的序列和多核苷酸(100)的长度允许鉴定有义链和反义链。可选地,具有一个或更多个分子标签的衔接子可以被连接至靶多核苷酸(100),然后进行变性和环化。
本发明的另外的实施方案包括用于测量光学特征的方法,所述光学特征允许在不提供完整的核苷酸序列的情况下鉴定标记的靶多核苷酸。特别地,这样的方法可用于表达谱分析。在一些实施方案中,本发明的该方面可以通过以下步骤进行:(a)获得RNA的样品;(b)逆转录mRNA链,使得具有不同光学标记物的核苷酸类似物取代至少两种核苷酸,以形成标记的第一链;(c)使标记的第一链易位通过纳米孔,使得标记的链的核苷酸依次通过激发区,在所述激发区中光学标记物被激发以生成光学信号;(d)当标记的第一链易位通过纳米孔时,检测来自光学标记物的光学信号的时间序列以产生第一链的光学特征;(e)通过将所述第一链的光学特征与参考光学特征进行比较,由所述第一链的光学特征确定所述RNA链的序列。
如本文使用的,“参考光学特征”意指由已知的多核苷酸产生的光学特征的集合或文库或数据库,所述已知的多核苷酸在预定种类的核苷酸上具有标准标记物,并且在标准条件下被测量,使得在相同条件(或允许将实验信号值合理转换为数据库信号值的条件)下获得的实验光学特征可以与参考光学特征相关或/和通过参考光学特征鉴定。在一些实施方案中,光学特征可以首先被处理以确定仅标记的核苷酸(例如,忽略未标记的核苷酸的身份)的核苷酸序列(即,“调用的碱基(base called)”或转化为核苷酸序列)。然后将这样的“特征”核苷酸序列与用于鉴定的参考特征序列的文库进行比较。这样的参考特征序列的文库可以用于特定的生物体或生物体组,例如人类(基因组、转录物组等)、微生物、细菌等。
图1F示出了以上方法的一个实施方案。使多聚T(PolyT)引物(184)退火(182)至mRNA(180)(SEQ ID NO:2)的多聚A尾部,此后其在标记的dUTP和标记的dCTP的存在下通过逆转录酶延伸,以产生延伸产物(185)。然后延伸产物(185)通过易位通过纳米孔被分离并分析,以产生光学特征,将该光学特征与参考特征数据库进行比较用于鉴定(188)。本领域普通技术人员理解,RNA(180)或其他靶多核苷酸的长度将必须具有最小长度以生成光学特征,该光学特征具有通过与数据库特征进行比较被独特鉴定的高概率。在一些实施方案中,这些实施方案的靶多核苷酸或RNA具有至少100个核苷酸、或至少200个核苷酸、或至少300个核苷酸的长度。在其他实施方案中,这样的靶多核苷酸或RNA具有至少500个核苷酸的长度。在一些实施方案中,RNA分析物被用于生成具有至少两种核苷酸被不同的荧光标记物标记的DNA。在另外的实施方案中,这样的RNA分析物具有用于鉴定的最小长度,该最小长度被选择使得编码RNA分析物的基因以至少95%的概率被鉴定出,或者在另外的实施方案中,以至少99%的概率被鉴定出。在一些实施方案中,至少两种核苷酸为C和T。在一些实施方案中,RNA分析物从人类样品,例如血液样品或其他组织样品中获得。
光学信号检测
在一些实施方案中,可以从分辨受限区域测量一系列光学信号,其中每个光学测量包括来自不同相邻单体的多于一个分量信号(component signal)(所述相邻单体在聚合物中的顺序不能由单个测量来确定,因为,例如分量信号在衍射受限区域内生成)。在这些情况下,基于光学的聚合物纳米孔分析(i)生成光学测量的时间序列,该时间序列包括来自多于一个标记的单体的序列的重叠贡献,从而使得难以(如果不是不可能的话)确定来自单个测量的单体的顺序;以及(ii)通过为单体选择生成可区分信号的光学标记物,光学测量可以被分离为来自不同种类的单体上的不同标记物的贡献,这允许重叠测量被转换为序列信息。
在一个方面,本发明的方法可以通过以下步骤实施:(a)使聚合物易位通过纳米孔,其中不同种类的聚合物单体被生成可区分光学信号的不同光学标记物标记,并且其中纳米孔限制单体为依次移动通过激发区,所述激发区包括多于一个单体;(b)当聚合物通过激发区时,检测来自单体的光学信号的时间序列;(c)分离来自不同种类的单体的光学信号;以及(d)由来自聚合物的分离的光学信号的时间序列确定单体的序列。
在一些实施方案中,光学信号可以是FRET信号,或者它们可以是来自直接激发的附接至单体的荧光标记物的荧光发射。图2示出了一个实施方案的组件,其中蛋白纳米孔(200)被布置于脂质双层(202)中,脂质双层(202)被布置(依次)跨越固态膜(206)的孔(204),所述固态膜(206)包括不透明层(208)(诸如金属层)、氮化硅层(210)和硅支撑层(212)。不透明层(208)防止或减少激发光束(214)通过固态膜(206)的传输,其中它可能激发不期望的背景荧光。当具有不同地标记的单体(被示出为黑色(222)和白色(224))的聚合物(220)通过纳米孔(200)时,在每个测量间隔,多于一个单体(诸如,241、242和243)存在于相同分辨受限区域内的激发区(226)和(228)中。在示出的实施方案中,用落射照明系统进行光学测量,并且假定已经选择了纳米孔(200),使得来自纳米孔(200)内部的单体的光学信号被抑制,并且对测量的光学信号不作出贡献。激发区(228)是与FRET供体(230)相邻的FRET区;即,激发区(228)限定了与FRET供体(230)的距离,在该距离内FRET可以在FRET供体(230)和附接至单体的光学标记物之间发生,该光学标记物也可以被称为受体标记物、或FRET受体标记物。激发区(226)为激发光束(214)的组分到孔(204)中的非传播突起(protrusion),每当选择孔(204)的尺寸以足够低于激发光束(214)的波长时,就会发生这种突起。如示出的,在该实施方案中,多于一个单体(241、242和243)将对在所述单体(241、242和243)处于激发区(226)和(228)中期间的同时或间隔测量的光学信号作出贡献。
图3示出了一个实施方案,其中在诸如Soni等,Review of ScientificInstruments,81:014301(2010)和美国专利公布2012/0135410(其通过引用并入本文)中描述的系统中通过全内反射荧光(TIRF)激发进行光学测量。在该实施方案中,将具有附接的FRET供体(302)的蛋白纳米孔(300)插入到被布置在具有孔(308)的固态膜(306)上的脂质双层(304)中。通过选择固态膜(306)的顺式(305)和反式(307)侧上的具有不同折射率的电解质使全内反射(TIR)成为可能。结果,在固态膜(306)被布置位于的平面处或附近产生TIR边界(310),使得在固态膜(306)的顺式(305)侧产生倏逝场。倏逝场可以在光学标记物进入纳米孔(300)之前激发光学标记物。FRET供体(302)被在TIR边界(310)处反射的光直接激发,使得FRET可以在FRET供体(302)和FRET区(320)内的单体(319)上的标记物之间发生。如图2的实施方案中示出的,可以选择纳米孔(300),使得当标记的单体处于纳米孔(300)的孔中时,标记物的荧光发射被抑制。多于一个单体,诸如325、326和327,对在图中示出的配置处记录的光学测量作出贡献。
在一些实施方案中,单体上的标记物可以使用与图5中所示的设备类似的设备通过单独的倏逝场激发。在该设备中,在纳米孔或纳米孔阵列的反式侧上的非常窄的第二室允许倏逝场从下面的玻璃载玻片的表面延伸,以在纳米孔的入口和出口处建立激发区,使得与纳米孔关联的每个光学测量都包含来自多于一个标记的单体的贡献。孔阵列(500)(其可包括插入于脂质双层中的蛋白纳米孔)可以在氮化硅层(502)中形成,所述氮化硅层(502)可以具有在20-100nm的范围内的厚度。氮化硅层(502)可以在硅支撑层(503)上形成。第二室(506)可以由氮化硅层(502)、确定第二室(506)的高度的二氧化硅层(504)和玻璃载玻片(510)的表面(508)形成。二氧化硅层(504)可以具有在50-100nm范围内的厚度。从表面(508)延伸跨越氮化硅层(502)的期望的倏逝场(507)可以通过在相对于玻璃载玻片(510)的适当角度处直射光束(512)来建立,使得发生TIR。为了驱动标记的多核苷酸分析物通过阵列(500),可以在第一室(516)中建立顺式(-)条件,并且可以在第二室(506)中建立反式(+)条件,其中电极可操作地连接至第一室和第二室(506和521)。
通过混合的FRET信号的序列确定
根据本发明,当标记的聚合物易位通过纳米孔及其相关的激发区时,光学测量的时间顺序集(time-ordered set)被记录。从每个光学测量包含来自相邻单体的标记物的贡献的意义上说,在相邻时间点的光学测量重叠。因此,例如,如果三个单体在每个时间点生成信号(例如,聚合物...-A-(B-C-D)-...的B、C和D,从左至右移动通过激发区),并且如果在连续测量之间一个单体离开激发区且另一个单体进入激发区(通过括号表示)(例如,A进入且D离开:-(A-B-C)-D...),则两个连续的光学测量将包含来自相同单体的贡献(在该实例中,两个测量都包括来自B和C的贡献)。以上实例是基于聚合物易位通过纳米孔的非常简化的模型;然而,连续重叠的光学测量的概念适用于更复杂的聚合物易位的描述。
由于来自纳米孔处的多于一个不同标记的单体的发射源自同一分辨受限区域,关于单体的相对位置信息(特别是序列信息)不能由单个光学测量来确定。然而,由于重叠和生成单体特异性信号的标记物的使用,在一些实施方案中,当序列信息被分离为多于一个单体特异性信号的时间顺序集时,可以由光学信号测量的时间顺序集确定序列信息。类似于杂交测序(sequencing-by-hybridization)(SBH)中使用以从杂交数据重构靶多核苷酸序列的那些算法的算法可以在本文被用于重构靶多核苷酸,例如,美国专利5,002,867;Timp等,Biophys.J.,102:L37-L39(2012)等,其通过引用并入。在光学检测的情况下,(i)时间顺序重叠信号及(ii)它们分离为单体特异性组分的约束显著简化了确定步骤。
图6示出了用于基于纳米孔易位的简单模型由重叠光学信号的时间顺序集确定单体序列信息的步骤的一个实施方案。该简单模型假定,在每个时间步骤(除了聚合物进入纳米孔以及从纳米孔离开时)的光学测量各自包含来自相同数目的单体的信号贡献(图6中被称为“n元组”,表示测量将包含来自n个单体的贡献)。应当理解,由于易位速度的局部变化、单体的线性移动的偏差及其他类似现象,更复杂的模型可以允许在每次测量中贡献单体的数目不同。即,在一些实施方案中,在不同时间的光学测量可以具有来自不同数目的核苷酸的贡献。在一些实施方案中,不同数目的核苷酸沿着靶多核苷酸的区段排序。图6所示的确定步骤假定标记的聚合物已经通过纳米孔,并且已经获得了光学测量的时间顺序集,包括将光学信号分离为单体特异性信号(600)。聚合物的进入和离开被不同地处理,因为在进入和离开时在激发区中必然存在不同数目的单体。在该实施方案中,假定在这些条件下的初始和最后的光学测量允许初始和最后的单体由其单体特异性信号直接确定。在其他实施方案中,用于分析的标记的聚合物的制备可以包括将多于一个预定标记的核苷酸插入这样的标记的聚合物的一个末端或两个末端,用于生成光学信号的已知序列以辅助序列确定步骤的目的。这样的预定标记的核苷酸将类似于Ion Torrent或454测序,例如美国专利7,575,865中的关键序列,该专利通过引用并入。
回到图6,在确定步骤开始时,时间指数i被设置为零;在当前时间i的候选序列的指数j被设置为1(602);并且检查单体特异性时间顺序光学信号集的初始n元组(604)。这样的检查包括首先由在时间i的测量确定与测量一致的所有可能的单体的n元组,然后由这些n元组确定哪些与候选序列Si正确重叠。新候选序列Si+1通过与测量一致的集的各自正确重叠的n元组形成(并且序列Si被延伸)(606)。新延伸的候选序列Si+1被存储,并且给予在时间i+1的候选序列的编号的指数Ji+1被更新(608)。重复该步骤,直到检查了每个候选序列Si(610),并且在每个时间i进行类似的检查,直到检查了时间顺序集中的每个光学测量。
纳米孔和纳米孔阵列
与本发明一起使用的纳米孔可以是固态纳米孔、蛋白纳米孔、或包括配置于固态膜或类似的框架中的蛋白纳米孔或有机纳米管诸如碳纳米管或石墨烯纳米管的杂化纳米孔(hybrid nanopore)。纳米孔的重要特征包括限制聚合物分析物,诸如多核苷酸,使得它们的单体按顺序通过信号生成区(或激发区等),即,使得单体诸如核苷酸依次通过检测区(或激发区或类似区域)。在一些实施方案中,纳米孔的另外的特征包括使单链核酸通过而不使双链核酸或等同的大分子通过。在其他实施方案中,纳米孔特别是蛋白纳米孔可以被选择使得它们的钻孔被定制尺寸使得单体的标记物在空间上受到限制使得FRET信号或甚至荧光信号被抑制。
在一些实施方案中,结合本发明的方法和装置使用的纳米孔可以以阵列的形式提供,诸如纳米孔簇的阵列,其可被规则地布置在平坦表面上。在一些实施方案中,簇各自处于单独的分辨受限区域中,使得来自不同簇的纳米孔的光学信号通过所采用的光学检测系统是可区分的,但来自同一簇内的纳米孔的光学信号通过所采用的光学检测系统不一定能够被指定给该簇内的特定的纳米孔。
固态纳米孔可以用多种材料制造,包括但不限于氮化硅(Si3N4)、二氧化硅(SiO2)等。用于分析应用诸如DNA测序的纳米孔的制造和操作在以下示例性参考文献中公开(其通过引用并入):Ling,美国专利7,678,562;Hu等,美国专利7,397,232;Golovchenko等,美国专利6,464,842;Chu等,美国专利5,798,042;Sauer等,美国专利7,001,792;Su等,美国专利7,744,816;Church等,美国专利5,795,782;Bayley等,美国专利6,426,231;Akeson等,美国专利7,189,503;Bayley等,美国专利6,916,665;Akeson等,美国专利6,267,872;Meller等,美国专利公布2009/0029477;Howorka等,国际专利公布WO2009/007743;Brown等,国际专利公布WO2011/067559;Meller等,国际专利公布WO2009/020682;Polonsky等,国际专利公布WO2008/092760;Van der Zaag等,国际专利公布WO2010/007537;Yan等,Nano Letters,5(6):1129-1134(2005);Iqbal等,Nature Nanotechnology,2:243-248(2007);Wanunu等,Nano Letters,7(6):1580-1585(2007);Dekker,Nature Nanotechnology,2:209-215(2007);Storm等,Nature Materials,2:537-540(2003);Wu等,Electrophoresis,29(13):2754-2759(2008);Nakane等,Electrophoresis,23:2592-2601(2002);Zhe等,J.Micromech.Microeng.,17:304-313(2007);Henriquez等,The Analyst,129:478-482(2004);Jagtiani等,J.Micromech.Microeng.,16:1530-1539(2006);Nakane等,J.Phys.Condens.Matter,15R1365-R1393(2003);DeBlois等,Rev.Sci.Instruments,41(7):909-916(1970);Clarke等,Nature Nanotechnology,4(4):265-270(2009);Bayley等,美国专利公布2003/0215881等。
在一些实施方案中,本发明包括具有一个或更多个阻光层(即一个或更多个不透明层)的纳米孔阵列。通常,纳米孔阵列用薄片材料制造,所述薄片材料诸如硅、氮化硅、氧化硅、氧化铝等,其容易传播光,特别是在所使用的厚度,例如少于50-100nm容易传播光。对于分析物的电学检测,这不成问题。然而,在易位通过纳米孔的标记的分子的基于光学的检测中,通过阵列传播的光总是激发预期的反应位点外的材料,因此生成光学噪声,例如来自非特异性背景荧光的光学噪声、来自尚未进入纳米孔的分子的标记物的荧光等。在一个方面,本发明通过提供具有反射和/或吸收来自激发光束的光的一个或更多个阻光层的纳米孔阵列,从而减少在与阵列的纳米孔相关的预期反应位点处生成的光学信号的背景噪声来解决该问题。在一些实施方案中,这允许在预期反应位点中的光学标记物被直接照射激发。在一些实施方案中,不透明层可以是金属层。这样的金属层可以包括Sn、Al、V、Ti、Ni、Mo、Ta、W、Au、Ag或Cu。在一些实施方案中,这样的金属层可以包括Al、Au、Ag或Cu。仍在其他实施方案中,这样的金属层可以包括铝或金,或者可以仅包括铝。不透明层的厚度可以广泛地变化,并取决于构成该层的材料的物理性质和化学性质。在一些实施方案中,不透明层的厚度可以是至少5nm、或至少10nm、或至少40nm。在其他实施方案中,不透明层的厚度可以在从5-100nm的范围内;在其他实施方案中,不透明层的厚度可以在从10-80nm的范围内。不透明层不需要阻挡(即反射或吸收)来自激发光束的100%的光。在一些实施方案中,不透明层可以阻挡来自激发光束的至少10%的入射光;在其他实施方案中,不透明层可以阻挡来自激发光束的至少50%的入射光。
不透明层或涂层可以通过本领域已知的各种技术被制造在固态膜上。可以使用材料沉积技术,包括化学气相沉积、电沉积、外延、热氧化、物理气相沉积(包括蒸发和溅射)、浇铸等。在一些实施方案中,可以使用原子层沉积,例如美国专利6,464,842;Wei等,Small,6(13):1406-1414(2010),其通过引用并入本文。
在一些实施方案中,1-100nm的通道或孔可以穿过固态基底通常为平面基底诸如膜而形成,分析物诸如单链DNA被诱导易位通过所述通道或孔。在其他实施方案中,2-50nm的通道或孔穿过基底而形成;并且仍在其他实施方案中,2-30nm、或2-20nm、或3-30nm、或3-20nm、或3-10nm的通道或孔穿过基底而形成。产生纳米孔的固态方法提供稳健性和耐久性以及调整纳米孔的尺寸和形状的能力,在晶片规模上制造高密度纳米孔阵列的能力,与基于脂质的系统相比优异的机械、化学和热特性,以及与电学或光学读出技术整合的可能性。另一方面,通过常规蛋白工程方法,生物纳米孔提供可再现的窄的钻孔或腔,特别是在1-10纳米范围内的钻孔或腔,以及用于定制纳米孔的物理和/或化学性质的技术以及用于直接地或间接地附接基团或元件诸如荧光标记物(其可以是FRET供体或受体)的技术。蛋白纳米孔通常依赖于精致的脂质双层获得机械支撑,并且具有精确尺寸的固态纳米孔的制造仍然具有挑战性。在一些实施方案中,可以将固态纳米孔与生物纳米孔组合以形成克服这些缺点中的一些的所谓的“杂化”纳米孔,从而提供生物孔蛋白的精确度与固态纳米孔的稳定性。对于光学读出技术,杂化纳米孔提供纳米孔的精确位置,这大大简化了数据采集。
在一些实施方案中,簇还可以通过将蛋白纳米孔布置在由包含孔阵列的固相膜支撑的脂质双层中来形成。例如,这样的阵列可以包括在固相支撑物中制造(例如钻、蚀刻等)的孔。这些孔的几何结构可以取决于所采用的制造技术而变化。在一些实施方案中,每个这样的孔与单独的分辨受限区域关联或被其包围;然而,在其他实施方案中,多于一个孔可以处于同一分辨受限区域内。尽管这些区域通常由于常规制造方法而基本上相同,但不同簇的孔的横截面积可以广泛地变化并且可以相同或不同。在一些实施方案中,孔具有在从10nm至200nm范围内的最小线性尺寸(例如在圆孔的情况下为直径),或者具有在从约100nm2至3×104nm2范围内的面积。跨越孔可以布置脂质双层。例如,通过在插入步骤期间控制蛋白纳米孔的浓度,可以改变每个孔的蛋白纳米孔的分布。在这样的实施方案中,纳米孔的簇可以包括随机数目的纳米孔。在蛋白纳米孔随机插入到孔中的一些实施方案中,包含一个或更多个孔的簇具有平均大于零的蛋白纳米孔数目;在其他实施方案中,这些簇具有大于0.25的蛋白纳米孔数目;在其他实施方案中,这些簇具有大于0.5的蛋白纳米孔数目;在其他实施方案中,这些簇具有大于0.75的蛋白纳米孔数目;在其他实施方案中,这些簇具有大于1.0的蛋白纳米孔数目。
在一些实施方案中,本发明的方法和装置包括固相膜,诸如SiN膜,其具有孔阵列,通过所述孔阵列提供第一室和第二室(有时也被称为“顺式室”和“反式室”)之间的连通,并且在面向第二室或反式室的表面上支撑脂质双层。在一些实施方案中,这样的固相膜中孔的直径可以在10nm至200nm的范围内,或者在20nm至100nm的范围内。在一些实施方案中,这样的固相膜还包括被插入到脂质双层中的蛋白纳米孔,所述蛋白纳米孔被插入在该双层在面向反式室的表面上跨越孔的区域中。在一些实施方案中,这些蛋白纳米孔使用本文所描述的技术从固相膜的顺式侧插入。在一些实施方案中,这样的蛋白纳米孔具有与α溶血素相同或相似的结构,因为它沿着轴线包括桶或钻孔,并且在一个末端处具有“帽”结构并且在另一个末端处具有“茎”结构(使用来自Song等,Science,274:1859-1866(1996)的术语)。在使用这样的蛋白纳米孔的一些实施方案中,向脂质双层的插入导致蛋白纳米孔被取向使得其帽结构暴露于顺式室并且其茎结构暴露于反式室。
在一些实施方案中,本发明可以采用成簇的杂化纳米孔,特别是用于多核苷酸的基于光学的纳米孔测序。这样的纳米孔包括固态孔口(orifice)或孔,蛋白生物传感器诸如蛋白纳米孔被稳定地插入固态孔口或孔中。带电荷的聚合物可以通过常规蛋白工程技术被附接至蛋白纳米孔(例如α溶血素),此后可以使用施加的电场将蛋白纳米孔引导至固态膜中的孔中。在一些实施方案中,固态基底中的孔被选择为略小于蛋白,从而防止其易位通过孔。相反,蛋白将被嵌入到固态孔口中。
在一些实施方案中,供体荧光团被附接至蛋白纳米孔。然后通过施加跨越固态纳米孔洞或孔的电场将该复合物插入到固态孔或纳米孔洞(例如,直径为3-10nm)中,直到蛋白纳米孔被运输到固态纳米孔洞中以形成杂化纳米孔。通过(a)基于对固态纳米孔洞的部分阻塞,插入的蛋白纳米孔导致电流下降,以及通过(b)供体荧光团的光学检测,可以验证杂化纳米孔的形成。
固态纳米孔或合成纳米孔可以以多种方式被制备,如以上引用的参考文献所示例的。在一些实施方案中,可以使用氦离子显微镜在多种材料中钻出合成纳米孔,例如如Yang等,Nanotechnolgy,22:285310(2011)所公开的,其通过引用并入本文。支撑薄膜材料例如氮化硅(其已经被加工成自持式膜(a free-standing membrane))的一个或更多个区域的芯片被引入到氦离子显微镜(HIM)室中。将HIM马达控制器用于在显微镜被设置为低放大率时将自持式膜带入离子束的路径。在靠近自持式膜但在固体基底上的区域,调节包括焦点和消像散(stigmation)的光束参数。在参数被适当地固定后,芯片位置被移动,使得自持式膜区域被集中在离子束扫描区域上并且光束被消隐。HIM视野被设置为足以包含整个预期的纳米孔图案并且足以在未来的光学读出(即,取决于光学放大率、相机分辨率等)中有用的尺寸(以μm计)。然后,一旦离子束在导致足以移除所有或大部分的膜自体荧光的总离子剂量的像素停留时间(pixel dwell time)穿过整个视野,将离子束光栅化。然后将视野设置为适当的值(小于以上使用的值)以进行单个纳米孔或纳米孔阵列的光刻定义的碾磨。图案的像素停留时间被设置为导致在样品加工之前通过使用校准样品确定的一个或更多个预定直径的纳米孔。对于单个芯片上的每个期望的区域和/或对于被引入到HIM室中的每个芯片重复该完整过程。
在一些实施方案中,纳米孔可以具有一个或更多个被附接用于在基于光学的纳米孔测序方法中使用的标记物。标记物可以是福斯特共振能量转移(Forster ResonanceEnergy Transfer;FRET)对的成员。这样的标记物可以包括有机荧光团、化学发光标记物、量子点、金属纳米颗粒和/或荧光蛋白。靶核酸的每个核苷酸可以具有一个不同的标记物。附接至核苷酸的标记物可以选自由有机荧光团组成的组。孔蛋白中的标记物附接位点可以通过常规的蛋白工程方法生成,例如可以构建将允许标记物的特异性结合的突变蛋白。例如,半胱氨酸残基可以在蛋白的期望位置处被插入,这插入了可以被用于附接标记物的巯基(SH)基团。半胱氨酸可以代替天然存在的氨基酸,或者可以作为额外氨基酸(additionamino acid)被掺入。然后将马来酰亚胺活化的标记物共价附接至蛋白纳米孔的巯基残基上。在一个优选的实施方案中,标记物与蛋白纳米孔或标记物与核酸的附接是可逆的。通过实施可裂解的交联剂,引入容易断裂的化学键(例如S-S键或pH不稳定键),并且当满足相应的条件时可以去除标记物。
在一些实施方案中,其中激发光束递送和光学信号收集通过单个物镜发生的落射照明系统可以被用于直接照射聚合物分析物上的标记物或纳米孔上的供体。用于与本发明一起使用的共焦落射照明系统的基本组件示于图4中。激发光束(402)通过二向色镜(dichroic)(404)并且到达物镜(406)上,物镜(406)将激发光束(402)聚焦(410)到层状膜(400)上,其中标记物被直接激发以发射光学信号诸如荧光信号,或者经由FRET相互作用被间接地激发以发射光学信号。这样的光学信号通过物镜(406)收集并且直射向二向色镜(404),其被选择使得其通过激发光束(402)的光但反射光学信号(411)的光。反射的光学信号(411)通过透镜(414),透镜(414)将其聚焦通过针孔(416)并且聚焦到检测器(418)上。
在一些实施方案中,用于实施以上用于分析聚合物(诸如单链多核苷酸)的方法的装置通常包括一组电极,所述电极用于建立跨越层状膜和纳米孔的电场。通过将单链核酸放置在第一室中的电解质中而将单链核酸暴露于纳米孔,所述第一室通过在室中放置负电极被配置为层状膜的“顺式”侧。在施加电场后,带负电荷的单链核酸被纳米孔捕获,并且被易位至层状膜的另一侧上的第二室,所述第二室通过在室中放置正电极被配置为膜的“反式”侧。易位速度部分取决于第一室和第二室中电解质的离子强度以及施加的跨越纳米孔的电压。在基于光学的检测中,可以通过初步校准测量,例如,使用对于不同电压以不同的预期速率/纳米孔生成信号的标记的单链核酸的预定标准品来选择易位速度。因此,对于DNA测序应用,可以基于来自这样的校准测量的信号速率来选择易位速度。因此,由这样的测量,可以选择例如允许或最大化可靠的核苷酸鉴定的跨越纳米孔阵列的电压。在一些实施方案中,可以使用来自被分析的模板样品的核酸(代替预定标准序列或除预定标准序列之外被使用)进行这样的校准。在一些实施方案中,可以在测序运行期间实时进行这样的校准,并且可以基于这样的测量实时修改所施加的电压,例如以最大化核苷酸特异性信号的获取。
控制聚合物通过纳米孔的易位速度是必需的以允许收集数据,从该数据中可以获得序列信息。易位速度部分取决于跨越纳米孔的电压差(或电场强度)和第一室的反应混合物中的条件,在该第一室中核酸聚合物被暴露于纳米孔(例如被布置在构成第一室的一个壁的固相膜中)。通过纳米孔的核酸聚合物捕获率取决于所述聚合物的浓度。在一些实施方案中,用于纳米孔测序的常规反应混合物条件可以被本发明采用,例如,1M KCl(或等效的盐,例如NaCl、LiCl等)和pH缓冲系统(其例如确保正被使用的蛋白,例如蛋白纳米孔、核酸酶等不被变性)。在一些实施方案中,可以使用pH缓冲体系保持pH基本上恒定在6.8至8.8范围内的值。在一些实施方案中,跨越纳米孔的电压差可以在从70mV至200mV的范围内。在其他实施方案中,跨越纳米孔的电压差可以在从80mV至150mV的范围内。可以使用常规测量技术来选择适当的操作电压。可以使用商购可得的仪器容易地测量跨越纳米孔的电流(或电压)。可以选择电压差使得易位速度在期望的范围内。在一些实施方案中,易位速度的范围包括小于1000个核苷酸/秒的那些速度。在其他实施方案中,易位速度的范围为从10个核苷酸/秒至800个核苷酸/秒;在其他实施方案中,易位速度的范围为从10个核苷酸/秒至600个核苷酸/秒;在其他实施方案中,易位速度的范围为从200个核苷酸/秒至800个核苷酸/秒;在其他实施方案中,易位速度的范围为从200个核苷酸/秒至500个核苷酸/秒。
用于纳米孔和聚合物的标记物
在一些实施方案中,纳米孔可以用一个或更多个量子点来标记。特别地,在一些实施方案中,一个或更多个量子点可以被附接至纳米孔,或者被附接至邻近纳米孔(并且在纳米孔的FRET距离内)的固相支持物,并且用作与分析物上的受体的FRET反应中的供体。量子点的这样的用途是熟知的并且在科学和专利文献中被广泛地描述,诸如在美国专利6,252,303、6,855,551、7,235,361等中,其通过引用并入本文。
可以用作孔标记物的量子点的一个实例是可以在含水溶液中合成的CdTe量子点。可以用亲核基团诸如伯胺、硫醇或官能团诸如羧酸官能化CdTe量子点。CdTe量子点可以包括巯基丙酸封端配体,所述巯基丙酸封端配体具有可以用于将量子点共价连接至蛋白孔外部的伯胺的羧酸官能团。交联反应可以使用生物缀合领域的普通技术人员已知的(同双功能以及异双功能)标准交联试剂来完成。可能需要注意确保修饰不会损害或基本上不会损害核酸通过纳米孔的易位。这可以通过改变所采用的用于将供体标记物附接至纳米孔的交联剂分子的长度来实现。
例如,可以使用天然α溶血素蛋白的赖氨酸残基131的伯胺(Song,L.等,Science274,(1996):1859-1866)经由1-乙基-3-[3-二甲基氨基丙基]碳二亚胺盐酸盐/N-羟基磺基琥珀酰亚胺(EDC/NHS)偶联化学共价结合羧基修饰的CdTe量子点。可选地,氨基酸129(苏氨酸)可以被置换为半胱氨酸。由于天然α溶血素蛋白中不存在其他半胱氨酸残基,新插入的半胱氨酸的巯基侧基可以被用于共价附接其他化学部分。
生物聚合物,例如核酸分子或聚合物,可以用一个或更多个受体标记物来标记。对于核酸分子,核酸分子的四种核苷酸或结构单元(building block)中的每一种可以用受体标记物来标记,从而对于每种天然存在的核苷酸产生标记的(例如荧光)对应物。受体标记物可以呈接受能量的分子的形式,所述接受能量的分子可以被附接至转化的核酸的一部分上或整条链上的一个或更多个核苷酸。
可以利用多种方法来标记核酸分子或聚合物的单体或核苷酸。可以在使用原始样品作为模板合成新核酸期间将标记的核苷酸掺入到核酸中(“通过合成标记(labeling bysynthesis)”)。例如,核酸的标记可以经由PCR、全基因组扩增、滚环扩增、引物延伸等或经由本领域普通技术人员已知的以上方法的各种组合和扩展来实现。
标记物可以包括反应性基团,诸如亲核试剂(胺、硫醇等)。然后可以使用不存在于天然核酸中的这些亲核试剂经由胺或硫醇反应性化学物质诸如NHS酯、马来酰亚胺、环氧环、异氰酸酯等来附接荧光标记物。这样的亲核反应性荧光染料(即NHS染料)容易从不同来源商购可得。用小的亲核试剂标记核酸的优点在于,当使用“通过合成标记”方法时这样的标记的核苷酸的高效的掺入。由于聚合过程期间标记物的空间位阻,大的荧光标记的核酸结构单元可能被不理想地通过聚合酶掺入新合成的DNA。
每当使用两种或更多种相互猝灭的染料时,可以使用正交附接化学(orthogonalattachment chemistry)将这样的染料附接至DNA。例如,NHS酯可以被用于与伯胺非常特异性地反应,或马来酰亚胺将与巯基基团反应。伯胺(NH2)或巯基(SH)修饰的核苷酸均商购可得。这些相对小的修饰容易被掺入聚合酶介导的DNA合成中,并且可以被用于使用NHS或马来酰亚胺修饰的染料的后续标记反应。用于选择和使用这样的正交接头化学的指导可见于Hermanson(以上引用的)。
用于典型附接位置的其他正交附接化学包括用于铜催化反应和非催化反应的Huisgen型环加成反应;烯烃加氧化腈环加成反应,例如如Gutsmiedl等,Org.Lett.,11:2405-2408(2009)中公开的;Diels-Alder环加成反应,例如Seelig等,Tetrahedron Lett.,38:7729-7732(1997)中公开的;羰基连接反应,例如如Casi等,J.Am.Chem.Soc.,134:5887-5892(2012);Shao等,J.Am.Chem.Soc.,117:3893-3899(1995);Rideout,Science,233:561-563(1986)中公开的;Michael加成反应,例如Brinkley,Bioconjugate Chemistry,3:2-13(1992)中公开的;自然化学连接反应(native chemical ligation),例如Schuler等,Bioconjugate Chemistry,13:1039-1043(2002);Dawson等,Science,266:776-779(1994)中公开的;或经由活化酯的酰胺形成,例如Hermanson(以上引用的)中公开的。
定义
“倏逝场(evanescent field)”意指非传播电磁场;即,它为坡印亭矢量的平均值为零的电磁场。
“FRET”或“或荧光共振能量转移”意指从激发的供体荧光团至处于基态的受体荧光团的非辐射偶极-偶极能量转移机制。FRET相互作用中的能量转移速率取决于供体的发射光谱与受体的吸收光谱的光谱重叠的程度、供体的量子产率、供体和受体跃迁偶极的相对取向、以及供体分子和受体分子之间的距离,Lakowitz,Principles ofFluorescence Spectroscopy,第三版(Springer,2006)。特别感兴趣的FRET相互作用是导致一部分能量被转移到受体,继而作为光子被受体发射(其频率低于激发其供体的光的频率(即“FRET信号”))的FRET相互作用。“FRET距离”意指在其内可以发生FRET相互作用并且FRET受体可以产生可检测的FRET信号的FRET供体和FRET受体之间的距离。
“试剂盒”指用于递送用于进行本发明方法的物质或试剂的任何递送系统。在反应测定的情况下,这样的递送系统包括允许反应试剂(例如,在适当的容器中的荧光标记物、诸如相互猝灭的荧光标记物,荧光标记物连接试剂,酶等)和/或支持物质(例如,缓冲剂,用于进行测定的书面说明等)从一个位置到另一个位置的储存、运输或递送的系统。例如,试剂盒包括包含相关反应试剂和/或支持物质的一个或更多个附件(例如盒子)。这样的内含物可以一起或单独地被递送到预期的接收者。例如,第一个容器可以包含用于测定的酶,而第二个或更多个容器包含相互猝灭的荧光标记物。
“纳米孔”意指位于基底中的任何开口,其允许分析物以预定的或可辨别的顺序通过基底,或者在聚合物分析物的情况下,允许聚合物分析物的单体单元以预定的或可辨别的顺序通过基底。在后一种情况下,预定的或可辨别的顺序可以是聚合物中单体单元的一级序列。纳米孔的实例包括蛋白性(proteinaceous)纳米孔或基于蛋白的纳米孔,合成纳米孔或固态纳米孔,并且包括其中嵌入有蛋白纳米孔的固态纳米孔的杂化纳米孔。纳米孔可以具有1-10nm或1-5nm或1-3nm的内径。蛋白纳米孔的实例包括但不限于,α溶血素、电压依赖性线粒体孔蛋白(VDAC)、OmpF、OmpC、MspA和LamB(麦芽糖孔蛋白(maltoporin)),例如,在Rhee,M等,Trends in Biotechnology,25(4)(2007):174-181;Bayley等(以上引用的);Gundlach等,美国专利公布2012/0055792等中公开的,其通过引用并入本文。可以采用任何允许单个核酸分子易位的蛋白孔。纳米孔蛋白可以在孔外部的特定位点处或在构成孔形成蛋白的一个或更多个单体单元的外部的特定位点处被标记。孔蛋白选自例如但不限于以下的蛋白的组:α溶血素、MspA、电压依赖性线粒体孔蛋白(VDAC)、炭疽孔蛋白、OmpF、OmpC和LamB(麦芽糖孔蛋白)。通过将带电荷的聚合物附接至孔蛋白来实现孔蛋白到固态孔洞中的整合。施加电场后,带电荷的复合物通过电泳被拉入固态孔洞中。合成纳米孔或固态纳米孔可以被创建在各种形式的固体基底中,其实例包括但不限于硅酮(例如Si3N4、SiO2)、金属、金属氧化物(例如Al2O3)、塑料、玻璃、半导体材料及其组合。合成纳米孔可以比位于脂质双层膜中的生物蛋白孔更稳定。合成纳米孔还可以通过使用嵌入合适的基底诸如但不限于聚合的环氧树脂中的碳纳米管来创建。碳纳米管可以具有一致和良好确定的化学性质和结构性质。可以获得各种尺寸的碳纳米管,范围从一纳米到几百纳米。已知碳纳米管的表面电荷为约零,并且因此,核酸通过纳米孔的电泳转运变得简单且可预测(Ito,T.等,Chem.Commun.12(2003):1482-83)。合成纳米孔的基底表面可以被化学修饰以允许蛋白孔的共价附接或使得表面性质适用于光学纳米孔测序。这样的表面修饰可以是共价的或非共价的。大多数共价修饰包括有机硅烷沉积,其最常用的方案被描述为:1)从含水乙醇中沉积。这是用于制备甲硅烷基化表面的最容易的方法。用乙酸将95%乙醇-5%水溶液调节至pH 4.5-5.5。在搅拌下添加硅烷以产生2%的最终浓度。水解和硅烷醇基团形成之后,持续2-5min添加基底。通过在乙醇中简单浸渍来冲洗掉过量的材料。硅烷层的固化在110摄氏度持续5-10分钟。2)气相沉积。硅烷可以通过化学气相沉积方法在干燥的质子惰性条件下被施加至基底上。这些方法有利于单层沉积。在封闭的室设计中,将基底加热至足以达到5mm蒸汽压的温度。可选地,可以施加真空,直到观察到硅烷蒸发。3)旋涂沉积(spin-ondeposition)。旋涂应用可以在有利于最大官能化和多层沉积的水解条件下或在有利于单层沉积的干燥条件下来进行。在一些实施方案中,本发明的方法采用单个纳米孔。在其他实施方案中,采用多于一个纳米孔。在后面的一些实施方案中,多于一个纳米孔作为纳米孔阵列被采用,所述纳米孔阵列通常被布置在平面基底诸如固相膜中。纳米孔阵列的纳米孔可以被规则地例如以直线模式间隔开,或者可以被随机地间隔开。在一个优选的实施方案中,在平面固相基底中纳米孔以直线模式被规则地间隔开。
“纳米结构”(与“纳米级结构”和“纳米级特征”可互换地使用)意指具有至少一个维度在几纳米至几百纳米的范围(例如从1纳米至1000纳米)内的结构。在一些应用中,该范围为从2纳米至500纳米;在其他应用中,该范围为从3纳米至500纳米。纳米结构的形状和几何结构可以非常广泛地变化并且包括但不限于纳米孔(nanopore)、纳米孔(nanowell)、纳米颗粒以及特别适用于进行系列反应的任何其他方便的形状。在一些实施方案中,纳米结构可以是可操作地与固相膜缔合的蛋白纳米孔。一些纳米结构,诸如纳米孔(nanopore)和纳米孔(nanowell),可以在较大的共同基底诸如固相膜或其他固体中形成,以形成纳米孔(nanopore)的阵列或纳米孔(nanowell)的阵列。特别感兴趣的纳米结构是能够支持或包含化学反应、物理反应(例如FRET)、酶促反应和/或结合反应或一系列这样的反应的那些纳米结构。在一些实施方案中,纳米结构诸如纳米孔围封(enclose)小于1纳升(1×10-9升)、小于1皮升(picoliter)或小于1飞升(femtoliter)的体积。在其他实施方案中,每个个体纳米孔提供小于1000仄升(zeptoliter)、100仄升、80仄升、或小于50仄升、或小于1仄升、或者甚至小于100幺升(yoctoliter)的体积。在一些实施方案中,纳米孔包括零模式波导。
“聚合物”意指连接为直链的多于一个单体。通常,聚合物包括多于一种类型的单体,例如,作为多核苷酸包括A、C、G和T,或作为多肽包括多于一种的氨基酸。单体可以包括但不限于核苷及其衍生物或类似物以及氨基酸及其衍生物和类似物。在一些实施方案中,聚合物是多核苷酸,其中核苷单体通过磷酸二酯键或其类似物被连接。
“多核苷酸”或“寡核苷酸”可互换地使用并且各自意指核苷酸单体的线性聚合物。构成多核苷酸和寡核苷酸的单体能够通过单体与单体相互作用诸如沃森-克里克型的碱基配对、碱基堆积、Hoogsteen或反向Hoogsteen类型的碱基配对等的规则模式特异性结合至天然多核苷酸。这样的单体及其核苷间键可以是天然存在的,或者可以是其类似物,例如天然存在的或非天然存在的类似物。非天然存在的类似物可以包括PNA,硫代磷酸酯核苷间键,包含允许标记物诸如荧光团或半抗原附接的连接基团的碱基等。每当寡核苷酸或多核苷酸的使用要求酶促加工,诸如通过聚合酶延伸、通过连接酶连接等时,普通技术人员将理解,在那些情况下,寡核苷酸或多核苷酸在任何位置或某些位置处将不包含核苷间键、糖部分或碱基的某些类似物。多核苷酸的尺寸范围通常为从几个单体单元例如5-40个(此时多核苷酸通常被称为“寡核苷酸”)至数千个单体单元。除非另有说明或从上下文中明显的,每当多核苷酸或寡核苷酸以字母(大写或小写)序列表示时,诸如“ATGCCTG”,应理解的是核苷酸从左至右以5'→3'的顺序,并且“A”表示脱氧腺苷,“C”表示脱氧胞苷,“G”表示脱氧鸟苷,并且“T”表示胸苷,“I”表示脱氧肌苷,“U”表示尿苷。除非另有说明,术语和原子编号惯例将遵循在Strachan和Read,Human Molecular Genetics2(Wiley-Liss,New York,1999)中公开的那些。通常,多核苷酸包括通过磷酸二酯键连接的四种天然核苷(例如用于DNA的脱氧腺苷、脱氧胞苷、脱氧鸟苷、脱氧胸苷或用于RNA的它们的核糖对应物);然而,它们也可以包括非天然核苷酸类似物,例如包括修饰的碱基、糖或核苷间键。对于本领域技术人员清楚的是,在酶的活性具有对特定的寡核苷酸或多核苷酸底物例如单链DNA、RNA/DNA双链体等的要求的情况下,则对于寡核苷酸或多核苷酸底物的合适组成的选择完全在普通技术人员的知识范围内,特别是在来自论文,诸如Sambrook等,Molecular Cloning,第二版(ColdSpring Harbor Laboratory,New York,1989)以及类似的参考文献的指导下。同样,寡核苷酸和多核苷酸可以指单链形式或双链形式(即寡核苷酸或多核苷酸及其各自的互补链的双链体)。普通技术人员从术语使用的上下文将清楚哪个形式是期望的或是否两种形式都是期望的。
“引物”意指天然或合成的寡核苷酸,其在与多核苷酸模板形成双链体后能够作为核酸合成的起始点并且从其3’末端沿模板延伸,从而形成延伸的双链体。引物的延伸通常用核酸聚合酶诸如DNA或RNA聚合酶来进行。在延伸过程中添加的核苷酸的序列由模板多核苷酸的序列确定。引物通常通过DNA聚合酶延伸。引物通常具有在从14个核苷酸至40个核苷酸范围内或从18个核苷酸至36个核苷酸范围内的长度。引物被用于各种核酸扩增反应,例如使用单一引物的线性扩增反应,或使用两种或更多种引物的聚合酶链式反应。对于选择用于特定应用的引物的长度和序列的指导为本领域普通技术人员熟知的,如以下参考文献所证明的:Dieffenbach,主编,PCR Primer:A Laboratory Manual,第二版(Cold SpringHarbor Press,New York,2003),其通过引用并入。
“分辨受限区域”是纳米孔(nanopore)或纳米孔(nanowell)阵列的表面的个体特征或光发射源在其中不能够被光学信号检测系统区分的区域。不意图被理论限制,该分辨受限区域由光学系统的分辨极限(有时也被称为“衍射极限”或“衍射屏障”)决定。该极限由发射源的波长和光学组件决定,并且可以由d=λ/NA被定义,其中d是可被分辨的最小特征,λ是光的波长,且NA是用于聚焦光的物镜的数值孔径。因此,每当两个或更多个纳米孔在分辨受限区域内并且在各纳米孔处生成两个或更多个光学信号时,光学检测系统不能够区分或确定哪个光学信号来自哪个纳米孔。根据本发明,纳米孔阵列的表面可以被划分或细分为对应于分辨受限区域的非重叠区域或基本上非重叠的区域。对应于分辨受限区域的这样的细分区的尺寸可以取决于所采用的特定光学检测系统。在一些实施方案中,每当光发射源在可见光谱内时,分辨受限区域在300nm2至3.0μm2的范围内;在其他实施方案中,分辨受限区域在1200nm2至0.7μm2的范围内;在其他实施方案中,分辨受限区域在3×104nm2至0.7μm2的范围内,其中上述区域的范围是关于纳米孔(nanopore)或纳米孔(nanowell)阵列的表面。在一些实施方案中,可见光谱意指在约380nm至约700nm范围内的波长。
关于多核苷酸的“序列确定”、“测序”或“确定核苷酸序列”等术语包括对多核苷酸的部分以及全部序列信息的确定。即,这些术语包括四种天然核苷酸A、C、G和T的完整的集的子集的序列,诸如例如靶多核苷酸的仅A和C的序列。即,这些术语包括确定靶多核苷酸内的四种类型的核苷酸中的一种、两种、三种或全部的身份、顺序和位置。在一些实施方案中,这些术语包括确定靶多核苷酸内的四种类型的核苷酸中的两种、三种或全部的身份、顺序和位置。在一些实施方案中,序列确定可以通过鉴定单一类型的核苷酸例如胞嘧啶在靶多核苷酸“catcgc…”内的顺序和位置,使得其序列被表示为二进制代码,例如,“100101…”表示“c-(非c)(非c)c-(非c)-c…”等来实现。在一些实施方案中,这些术语还可以包括靶多核苷酸的充当该靶多核苷酸的指纹的子序列;即独特地鉴定一组多核苷酸(例如由细胞表达的所有不同的RNA序列)内的一种靶多核苷酸或一类靶多核苷酸的子序列。
本公开内容不意图被限于所阐述的特定形式的范围,而意图包括本文描述的变化形式的替代形式、修改形式和等同形式。此外,本公开内容的范围完全包含鉴于本公开内容对于本领域技术人员而言可能变得明显的其他变化形式。本发明的范围仅由所附权利要求来限定。
序列表
<110> 昆塔波尔公司
卡尔·盖格勒
简·西蒙斯
斯蒂芬·梅斯维兹
<120> 双色纳米孔测序
<130> 213WO00
<150> 62/343283
<151> 2016-05-31
<150> 62/421804
<151> 2016-11-14
<160> 2
<170> PatentIn version 3.5
<210> 1
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 随机序列
<400> 1
accgtttaaa ggtttccccg tcgta 25
<210> 2
<211> 44
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 随机序列
<400> 2
accguuuaaa gguuuccccg ucguaaaaaa aaaaaaaaaa aaaa 44

Claims (23)

1.一种分析双链多核苷酸的方法,所述方法包括:
拷贝双链多核苷酸的一条链,使得具有不同光学标记物的核苷酸类似物取代至少两种核苷酸,以形成标记的链;
拷贝所述链的互补链,使得所述核苷酸类似物取代相同的至少两种核苷酸,以形成标记的互补链;
使所述标记的链易位通过纳米孔,使得所述标记的链的核苷酸依次通过激发区,在所述激发区中光学标记物被激发以生成光学信号;
当所述标记的链易位通过所述纳米孔时,检测来自所述光学标记物的光学信号的时间序列以产生链的光学特征;
使所述标记的互补链易位通过纳米孔,使得所述标记的互补链的核苷酸依次通过激发区,在所述激发区中光学标记物被激发以生成光学信号;
当所述标记的互补链易位通过所述纳米孔时,检测来自所述光学标记物的光学信号的时间序列以产生互补链的光学特征;
由所述链的光学特征和所述互补链的光学特征确定所述双链多核苷酸的序列。
2.如权利要求1所述的方法,其中所述确定步骤包括通过所述光学特征的互补性,将所述链的光学特征与所述互补链的光学特征配对。
3.如权利要求1所述的方法,其中所述至少两种核苷酸中的两种为嘧啶。
4.如权利要求1所述的方法,其中所述拷贝步骤通过引物延伸反应进行。
5.如权利要求4所述的方法,所述方法还包括将发夹衔接子连接至所述双链多核苷酸的末端的步骤,使得所述链和所述互补链可以通过单一引物延伸被拷贝。
6.如权利要求1所述的方法,其中所述拷贝步骤包括用所述核苷酸类似物取代所述至少两种核苷酸中的每一种,以形成所述标记的链和所述标记的互补链。
7.如权利要求1所述的方法,其中所述至少两种核苷酸中的两种为嘌呤。
8.如权利要求1所述的方法,其中所述至少两种核苷酸中的至少一种为嘧啶。
9.一种鉴定多核苷酸的方法,所述方法包括:
拷贝双链多核苷酸的一条链,使得具有不同光学标记物的核苷酸类似物取代至少两种核苷酸,以形成标记的链;
使所述标记的链易位通过纳米孔,使得所述标记的链的核苷酸依次通过激发区,在所述激发区中光学标记物被激发以生成光学信号;
当所述标记的链易位通过所述纳米孔时,检测来自所述光学标记物的光学信号的时间序列以产生链的光学特征;
通过将所述链的光学特征与参考光学特征进行比较,由所述链的光学特征确定所述双链多核苷酸的序列。
10.如权利要求9所述的方法,其中所述链来自人类基因组,且长度为至少100个核苷酸,并且其中所述参考光学特征源自人类基因组序列。
11.如权利要求9所述的方法,其中所述链来自微生物基因组,且长度为至少100个核苷酸,并且其中所述参考光学特征源自微生物基因组序列。
12.如权利要求11所述的方法,其中所述微生物基因组为细菌基因组。
13.如权利要求9所述的方法,其中所述链来自病毒基因组,且长度为至少100个核苷酸,并且其中所述参考光学特征源自病毒基因组序列。
14.一种测量基因表达的方法,所述方法包括:
获取mRNA的样品;
逆转录mRNA链,使得具有不同光学标记物的核苷酸类似物取代至少两种核苷酸,以形成标记的第一链;
使所述标记的第一链易位通过纳米孔,使得标记的链的核苷酸依次通过激发区,在所述激发区中光学标记物被激发以生成光学信号;
当所述标记的第一链易位通过所述纳米孔时,检测来自所述光学标记物的光学信号的时间序列以产生第一链的光学特征;
通过将所述第一链的光学特征与参考光学特征进行比较,由所述第一链的光学特征鉴定所述mRNA链。
15.如权利要求14所述的方法,其中所述mRNA的所述样品为人类样品。
16.如权利要求15所述的方法,其中所述鉴定步骤包括将所述第一链的光学特征与人类基因组序列和/或人类信使RNA序列的参考光学特征进行比较。
17.一种测量基因表达的方法,所述方法包括:
获取mRNA的样品;
逆转录mRNA链以产生第一DNA链;
转录所述第一DNA链,使得具有不同光学标记物的核苷酸类似物取代至少两种核苷酸,以形成标记的cDNA;
使所述标记的cDNA易位通过纳米孔,使得所述标记的cDNA的核苷酸依次通过激发区,在所述激发区中光学标记物被激发以生成光学信号;
当所述标记的cDNA易位通过所述纳米孔时,检测来自所述光学标记物的光学信号的时间序列以产生cDNA的光学特征;
通过将所述cDNA的光学特征与参考光学特征进行比较,由所述cDNA的光学特征确定所述mRNA链的序列。
18.如权利要求17所述的方法,其中所述确定步骤包括将所述cDNA的光学特征与人类基因组序列和/或人类信使RNA序列的参考光学特征进行比较。
19.一种分析群体的双链多核苷酸的方法,所述方法包括以下步骤:
拷贝每个双链多核苷酸的一条链,使得具有不同光学标记物的核苷酸类似物取代至少两种核苷酸,以形成标记的链,每个双链多核苷酸具有预定的最小长度;
拷贝所述链的互补链,使得所述核苷酸类似物取代相同的至少两种核苷酸,以形成标记的互补链;
使所述标记的链和所述标记的互补链单独易位通过纳米孔,使得所述标记的链和所述标记的互补链的核苷酸依次通过激发区,在所述激发区中光学标记物被激发以生成光学信号;
当所述标记的链易位通过所述纳米孔时,单独检测来自所述光学标记物的光学信号的时间序列以产生链的光学特征,并且当所述标记的互补链易位通过所述纳米孔时,单独检测来自所述光学标记物的光学信号的时间序列以产生互补链的光学特征;
使来自每个双链多核苷酸的所述链的光学特征和所述互补链的光学特征关联,其中所述预定的最小长度被选择使得所述关联以至少90%的概率为正确的。
由所关联的链的光学特征和互补链的光学特征确定每个双链多核苷酸的序列。
20.如权利要求19所述的方法,其中所述群体包括人类基因组、细菌基因组或单细胞真核生物体基因组的DNA片段。
21.如权利要求20所述的方法,其中所述DNA片段各自的长度为至少100个碱基对。
22.如权利要求21所述的方法,其中所述DNA片段的长度范围为100个至10,000个碱基对。
23.如权利要求19所述的方法,其中所述群体包括少于1015个不同的双链DNA。
CN201780033824.0A 2016-05-31 2017-05-04 双色纳米孔测序 Pending CN109219664A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201662343283P 2016-05-31 2016-05-31
US62/343,283 2016-05-31
US201662421804P 2016-11-14 2016-11-14
US62/421,804 2016-11-14
PCT/US2017/031129 WO2017209891A1 (en) 2016-05-31 2017-05-04 Two-color nanopore sequencing

Publications (1)

Publication Number Publication Date
CN109219664A true CN109219664A (zh) 2019-01-15

Family

ID=60477765

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780033824.0A Pending CN109219664A (zh) 2016-05-31 2017-05-04 双色纳米孔测序

Country Status (5)

Country Link
US (2) US20190112649A1 (zh)
EP (1) EP3464612A4 (zh)
JP (1) JP2019517252A (zh)
CN (1) CN109219664A (zh)
WO (1) WO2017209891A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114171117A (zh) * 2021-09-06 2022-03-11 百图生科(北京)智能技术有限公司 用于单细胞测序的方法、装置、设备、介质和程序产品

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102084001A (zh) * 2008-03-28 2011-06-01 加利福尼亚太平洋生物科学股份有限公司 用于核酸测序的组合物和方法
US20160011169A1 (en) * 2012-06-08 2016-01-14 Pacific Biosciences Of California, Inc. Nanopore sequencing methods

Family Cites Families (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5002867A (en) 1988-04-25 1991-03-26 Macevicz Stephen C Nucleic acid sequence determination by multiple mixed oligonucleotide probes
US5405747A (en) 1991-09-25 1995-04-11 The Regents Of The University Of California Office Of Technology Transfer Method for rapid base sequencing in DNA and RNA with two base labeling
US5798042A (en) 1994-03-07 1998-08-25 Regents Of The University Of California Microfabricated filter with specially constructed channel walls, and containment well and capsule constructed with such filters
US6362002B1 (en) 1995-03-17 2002-03-26 President And Fellows Of Harvard College Characterization of individual polymer molecules based on monomer-interface interactions
US5795782A (en) 1995-03-17 1998-08-18 President & Fellows Of Harvard College Characterization of individual polymer molecules based on monomer-interface interactions
AU2804597A (en) 1996-04-15 1997-11-07 University Of Alberta Synthesis of fluorophore-labeled dna
EP2306195A3 (en) 1998-09-18 2012-04-25 Massachusetts Institute of Technology Biological applications of semiconductor nanocrystals
US6287825B1 (en) 1998-09-18 2001-09-11 Molecular Staging Inc. Methods for reducing the complexity of DNA sequences
US6267872B1 (en) 1998-11-06 2001-07-31 The Regents Of The University Of California Miniature support for thin films containing single channels or nanopores and methods for using same
US6426231B1 (en) 1998-11-18 2002-07-30 The Texas A&M University System Analyte sensing mediated by adapter/carrier molecules
US6252303B1 (en) 1998-12-02 2001-06-26 Advanced Micro Devices, Inc. Intergration of low-K SiOF as inter-layer dielectric
US20040214221A1 (en) 1999-05-07 2004-10-28 Klaus Muehlegger High density labeling of DNA with modified or "chromophore" carrying nucleotides and DNA polymerases used
US6464842B1 (en) 1999-06-22 2002-10-15 President And Fellows Of Harvard College Control of solid state dimensional features
AU2001241474A1 (en) 2000-02-11 2001-08-20 The Texas A And M University System Biosensor compositions and methods of use
US7001792B2 (en) 2000-04-24 2006-02-21 Eagle Research & Development, Llc Ultra-fast nucleic acid sequencing device and a method for making and using the same
US7744816B2 (en) 2002-05-01 2010-06-29 Intel Corporation Methods and device for biomolecule characterization
US20030215881A1 (en) 2002-05-10 2003-11-20 Hagan Bayley Stochastic sensing through covalent interactions
US7575865B2 (en) 2003-01-29 2009-08-18 454 Life Sciences Corporation Methods of amplifying and sequencing nucleic acids
US20070042366A1 (en) 2003-02-28 2007-02-22 Brown University Nanopores, methods for using same, methods for making same and methods for characterizing biomolecules using same
WO2006020775A2 (en) 2004-08-13 2006-02-23 Harvard University An ultra high-throughput opti-nanopore dna readout platform
US7397232B2 (en) 2005-10-21 2008-07-08 The University Of Akron Coulter counter having a plurality of channels
US8003319B2 (en) 2007-02-02 2011-08-23 International Business Machines Corporation Systems and methods for controlling position of charged polymer inside nanopore
US9121843B2 (en) 2007-05-08 2015-09-01 Trustees Of Boston University Chemical functionalization of solid-state nanopores and nanopore arrays and applications thereof
GB0713143D0 (en) 2007-07-06 2007-08-15 Ucl Business Plc Nucleic acid detection method
AU2008282862B2 (en) * 2007-07-26 2014-07-31 Pacific Biosciences Of California, Inc. Molecular redundant sequencing
WO2010007537A1 (en) 2008-07-17 2010-01-21 Koninklijke Philips Electronics N.V. Nanopore device and a method for nucleic acid analysis
US8921072B2 (en) 2008-09-02 2014-12-30 General Electric Compnay Methods to generate DNA mini-circles
EP3029467B1 (en) 2008-09-22 2020-01-08 University of Washington Msp nanopores and related methods
AU2010209528B2 (en) 2009-01-30 2015-10-01 Oxford Nanopore Technologies Limited Adaptors for nucleic acid constructs in transmembrane sequencing
CN105928910A (zh) 2009-03-26 2016-09-07 波士顿大学董事会 在两液体间的薄固态界面上成像的方法
CA2808576A1 (en) * 2009-09-30 2011-04-07 Quantapore, Inc. Ultrafast sequencing of biological polymers using a labeled nanopore
JP5873023B2 (ja) 2009-12-01 2016-03-01 オックスフォード ナノポール テクノロジーズ リミテッド 生化学分析機器
AU2012288629B2 (en) * 2011-07-25 2017-02-02 Oxford Nanopore Technologies Limited Hairpin loop method for double strand polynucleotide sequencing using transmembrane pores
EP2794926B1 (en) * 2011-12-22 2018-01-17 SomaGenics Inc. Methods of constructing small rna libraries and their use for expression profiling of target rnas
CN105283560B (zh) 2013-05-24 2018-11-30 昆塔波尔公司 基于纳米孔的通过混合的fret检测的核酸分析
CN104253263A (zh) 2013-06-28 2014-12-31 富泰华工业(深圳)有限公司 三级性电池
US9644232B2 (en) 2013-07-26 2017-05-09 General Electric Company Method and device for collection and amplification of circulating nucleic acids
US9217167B2 (en) 2013-07-26 2015-12-22 General Electric Company Ligase-assisted nucleic acid circularization and amplification
CN109706222A (zh) 2013-12-11 2019-05-03 安可济控股有限公司 用于检测罕见序列变体的组合物和方法
WO2016065339A1 (en) * 2014-10-24 2016-04-28 Quantapore, Inc. Efficient optical analysis of polymers using arrays of nanostructures
EP3015554A1 (en) * 2014-10-31 2016-05-04 Rheinische Friedrich-Wilhelms-Universität Bonn Gene expression analysis
CN108473933A (zh) * 2015-12-08 2018-08-31 昆塔波尔公司 使核酸移位通过纳米孔的方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102084001A (zh) * 2008-03-28 2011-06-01 加利福尼亚太平洋生物科学股份有限公司 用于核酸测序的组合物和方法
US20160011169A1 (en) * 2012-06-08 2016-01-14 Pacific Biosciences Of California, Inc. Nanopore sequencing methods

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
韩宇,史岸冰编著: "《新兴产业和高新技术现状与前景研究丛书 生物技术产业现状与发展前景 》" *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114171117A (zh) * 2021-09-06 2022-03-11 百图生科(北京)智能技术有限公司 用于单细胞测序的方法、装置、设备、介质和程序产品

Also Published As

Publication number Publication date
US20190112649A1 (en) 2019-04-18
JP2019517252A (ja) 2019-06-24
EP3464612A1 (en) 2019-04-10
US20220112550A1 (en) 2022-04-14
EP3464612A4 (en) 2019-11-27
WO2017209891A1 (en) 2017-12-07

Similar Documents

Publication Publication Date Title
US20220112551A1 (en) Optically-based nanopore analysis with reduced background
JP6399610B2 (ja) 混合fret検出を用いたナノポアに基づく核酸の分析
US10823721B2 (en) Optically based nanopore sequencing
US20220106629A1 (en) Method of translocating nucleic acids through nanopores
US20220170088A1 (en) Mixed optical signals in polymer analysis with nanopores
US11453910B2 (en) Controlling fluorescent signal composition in optically-based nanopore sequencing
US20190033286A1 (en) Redundant polymer analysis by translocation reversals
US20220112550A1 (en) Two-color nanopore sequencing
JP2019528065A (ja) 消光剤を使用する光学に基づくナノポア配列決定
US20190277829A1 (en) Hybrid nanopores with annular dna nanostructures

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190115

RJ01 Rejection of invention patent application after publication