CN103052718B - 通过杂交的dna测序方法 - Google Patents

通过杂交的dna测序方法 Download PDF

Info

Publication number
CN103052718B
CN103052718B CN201180034601.9A CN201180034601A CN103052718B CN 103052718 B CN103052718 B CN 103052718B CN 201180034601 A CN201180034601 A CN 201180034601A CN 103052718 B CN103052718 B CN 103052718B
Authority
CN
China
Prior art keywords
nucleic acid
double
acid molecule
chain
molecule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201180034601.9A
Other languages
English (en)
Other versions
CN103052718A (zh
Inventor
D·邦西蒙
J-F·阿勒芒
M·马诺萨斯
丁方圆
V·克罗凯特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Centre National de la Recherche Scientifique CNRS
Universite Pierre et Marie Curie Paris 6
Ecole Normale Superieure
Original Assignee
Centre National de la Recherche Scientifique CNRS
Ecole Normale Superieure
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Centre National de la Recherche Scientifique CNRS, Ecole Normale Superieure filed Critical Centre National de la Recherche Scientifique CNRS
Publication of CN103052718A publication Critical patent/CN103052718A/zh
Application granted granted Critical
Publication of CN103052718B publication Critical patent/CN103052718B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/30Oligonucleotides characterised by their secondary structure
    • C12Q2525/301Hairpin oligonucleotides

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及通过物理操作测定核酸序列的方法。尤其是,所述方法包括步骤:通过向对应于所述核酸序列的双链核酸分子施加物理力,使所述分子变性;以及检测双链核酸分子复性的阻断。更具体地,所述方法包括步骤:通过向对应于所述核酸序列的双链核酸分子施加物理力,使所述分子变性;提供单链核酸分子;在所述单链核酸分子存在下,使所述双链核酸分子复性;以及检测双链核酸复性的阻断。

Description

通过杂交的DNA测序方法
技术领域
本发明涉及测定核酸(DNA或RNA)序列的快速方法,其特别适用于未知核酸的测序,或者用于检测用于诊断的特异性核酸序列。
背景技术
如今,核酸序列的测定是分子生物学的核心。例如,可以通过高通量DNA测序评估广泛范围的生物现象,如遗传变异、RNA表达、蛋白质-DNA相互作用和染色体构象(参见例如几个实例,Mitreva&Mardis,Methods Mol Biol,533:153-87,2009;Mardis,Genome Med.,1(4):40,2009;Cloonan等人,Nat Methods,5(7):613-619,2008;Valouev等人,Genome Res.,18(7):1051-63,2008,Valouev等人,Nat Methods.,5(9):829-34,2008;Orscheln等人,Clin Infect Dis.,49(4):536-42,2009;Walter等人,Proc Natl Acad Sci U S A.,106(31):12950-5,2009;Mardis等人,N Engl J Med.,361(11):1058-66,2009,Hutchinson,Nucl.Acids Res.,35(18):6227-6237,2007)。
此外,证明生理样本存在特异性的DNA序列在目前构成了开发诊断方法的主线,所述诊断方法如用于鉴定细菌发展成抗生素抗性的概率、遗传异常、与遗传修饰相关的癌症风险以及病毒感染(例如HIV相关的或肝炎病毒相关的感染)的诊断方法(参见例如Zhang等人,Nature,358:591-593,1992;Turner等人,J Bacteriol,176(12):3708-3722,1994;Weston等人,Infection and Immunity.,77(7):2840-2848,2009)。
如今,主要采用基于毛细管的、Sanger生物化学的半自动化实施来进行核酸测序。经典的方法包括目标DNA扩增的步骤,然后是“循环测序”的步骤,其中通过掺入荧光标记的双脱氧核苷酸(ddNTPs)随机终止每轮引物延伸。通过在基于毛细管的聚合物凝胶中的高分辨率电泳分离单链的、末端标记的延伸产物来测定序列。在96或384个独立毛细管中同时进行的电泳提供有限的并行水平。
对低成本测序的高度需求带动了高通量测序技术的发展,这样的高通量测序技术使得测序过程并行进行,立刻产生数千或数百万的序列(Shendure&Ji,NatBiotechnol,26(10):1135-45.2008)。高通量测序技术旨在降低DNA测序的成本至标准的染料终止剂法的成本以下。目前,在实质性牺牲各个读取的长度和精确度的情况下才能获得这种和Sanger测序相比非常高的通量。这样的新方法的实例包括454和Solexa技术。这些技术允许全基因组的鸟枪法测序,而无需在大肠杆菌中或任何宿主细胞中进行克隆。捕获于珠子表面的短的、两侧带接头的DNA片段的文库通过乳液PCR进行扩增。通过使用DNA聚合酶引发的合成进行测序。在454方法(也被称为“焦磷酸测序”)中,用4种dNTP中的每一个依次呈现阵列,利用释放的焦磷酸的发光计检测(luminometric detection)来监测掺入的量。该方法和Solexa之间的主要差异是后者使用链终止核苷酸。可以除去终止碱基上的荧光标记,留下未封闭的3'末端,使得链终止成为一个可逆的过程。SOLiD技术取决于荧光标记的双碱基探针与杂交到克隆扩增的文库模板中的接头序列的测序引物的连接。双碱基探针的特异性是通过在每个连接反应中询问每个第一和第二碱基而获得的。以测定最终的读取长度的循环数进行多个连接、检测和切割的循环。与三种以前的技术相反,Helicos平台允许单个DNA分子的测序,而以前的技术都需要扩增的第一步骤。这种技术基于对掺入荧光核苷酸的高灵敏度检测系统的使用,以经由通过合成的测序直接询问单个DNA分子。
这样的方法公开于例如美国专利No.4,882,127、美国专利No.4,849,077;美国专利No.7,556,922;美国专利No.6,723,513;PCT专利申请No.WO 03/066896;PCT专利申请No.WO2007111924;美国专利申请No.US2008/0020392;PCT专利申请No.WO2006/084132;美国专利申请No.US2009/0186349;美国专利申请No.US 2009/0181860;美国专利申请No.US 2009/0181385;美国专利申请No.US2006/0275782;欧洲专利EP-Bl-1141399;Shendure& Ji,Nat Biotechnol,26(10):1135-45.2008;Pihlak等人,Nat Biotechnol,26(6):676-684,2008;Fuller等人,NatureBiotechnol,27(11):1013-1023,2009;Mardis,Genome Med.,1(4):40,2009;Metzker,Nature Rev.Genet.,11(1):31-46,2010。
然而,至今开发的所有方法均受累于严重的缺点。特别是,它们都利用标记的核苷酸(例如,荧光的),从而致使整体成本的严重增加。此外,除了一个(Helicos平台)以外,所有这些新方法都需要在测序之前扩增靶序列,这一方面耗时,另一方面增加错误的概率,并且极易被污染。
发明内容
根据本发明的方法基于物理技术和电子处理,不同于当前的化学的或生化的方法。它的优点是多方面的:
1)它允许单个分子的测序,从而不需要在先的扩增步骤(例如,通过PCR)。
2)它远比本领域的方法便宜,由于标准单链核酸分子的使用,其远不及标记的核苷酸(有荧光团或一些其它基团)昂贵。此外,由于单个双链核酸分子的序列被测定,因此标准单链核酸分子的量被降到了最低。此外,在一些实施方式中,至少探针链可以被重复使用,因为它们在测序过程中并未被消耗。
3)它使得通过测量所述双链核酸分子两端之间的距离来确定配对单链核酸分子沿着双链核酸的定位(以bp为单位)成为可能。
4)它允许在一个复性分析中确定寡核苷酸在给定双链核酸发夹中的不同杂交位置。
5)该测量可以在另一个时间尺度上周期性地重复,从而导致假阳性(伪部分杂交)的消除、改进的统计学并允许显著降低仪器漂移。
6)在同一分子上可以多次重复该实验,由于可以在复性阶段完成期间驱除(eject)杂交的单链核酸(例如,通过降低力或离子强度,或通过使用解旋酶或核酸酶),从而改进了测量统计学和可靠性。
7)它允许不同的双链核酸分子的平行测序,因为每个分子可以独立于其它分子而进行操纵。
本发明涉及用于测定核酸序列的方法,其中对应于所述核酸序列的变性双链核酸的复性被阻断。
“核酸序列的测定”此处不仅表示破译核酸中碱基的实际连续,也表示直接或间接导致核酸序列上一些信息的获得的所有活动,比如检测核酸分子中的特定序列,或检测两个不同核酸分子序列之间的差异。
本发明基于这样的观察,即变性双链核酸的两条链在适当的条件下将重新杂交。如果一些分子在复性步骤期间结合至所述变性双链核酸的任意链,重新杂交仅仅是部分的。本发明人现在已发现,在确定条件下,永久或短暂的重新杂交的这种暂停可用于获得有关变性双链核酸分子中所包含的序列的信息。根据本发明,有可能检测双链核酸分子重新杂交的阻断;与这种阻断相关的物理参数(如,阻断持续时间,阻断在双链核酸分子上的位置),然后允许确定核酸序列。
因此,本发明涉及用于测定核酸序列的方法,所述方法包括步骤:检测对应于所述核酸序列的变性双链核酸复性的阻断。
“变性”在此处表示所述链之间的大部分氢键断裂时发生的双链核酸分子的链分离的过程。变性过程产生变性的核酸分子,其在此处表示双链核酸分子变性所产生的两条分离的互补链。“复性”在此处涉及这样的过程,通过这种过程两条分离的互补链通过杂交重新形成双螺旋。如此处所用,“杂交”是核酸的两条或两条以上互补链之间建立非共价的、序列特异性的相互作用从而形成单个杂交体的过程。
有本领域技术人员已知的变性核酸的几种可能。在一个最优选的方式中,通过向它们施加物理力将两条链分开。例如,所述双链核酸的游离端可被拉开,从而断裂配对碱基之间的所有键并打开双链核酸。
因此,在一个实施方式中,本发明的方法涉及用于测定核酸序列的方法,所述方法包括以下步骤:
·通过向所述分子施加物理力,使对应于所述核酸序列的双链核酸分子变性;以及
·检测双链核酸复性的阻断。
在这种类型的序列测定方法中,为了促进重新配对,安排双链DNA的游离端(即没有附着至支持物的端)在被拉开之前共价或准共价连接至另一端是有利的。在一个优选的实施方案中,双链核酸分子是发夹。如果想要双链核酸示意性表示在本发明的上下文中,可以将其比作“拉链”(zip fastener),其打开(或关闭):双链核酸的变性就是拉开拉链,复性是重新拉上拉链。
本发明人已经观察到,在一定条件下,当分子结合至变性双链核酸分子时,所述分子的复性被阻断。结合的分子可以是对所述变性双链核酸分子上的特异性序列具有亲和性的任何类型的分子,如核酸、蛋白质或小分子。然而,优选使用单链核酸,因为所述单链核酸可以与变性双链核酸链的一条链上的互补序列进行杂交。这种单链核酸可以是任何长度的,只要它长到足以阻断复性过程。优选地,单链核酸的长度包括3和20个之间的核苷酸,更优选7和15个之间,甚至更优选8和12个之间。
本发明的单链核酸尤其可以是DNA或RNA分子,天然的或修饰的。所述单链核酸也可以由修饰的核苷酸构成,如锁核酸(LNA),其是其中核糖部分修饰有连接2'氧和4'碳的额外桥的核苷酸,或者肽核酸(PNA),其中主链由通过肽键连接的重复的N-(2-氨乙基)-甘氨酸单元组成。
当单链核酸分子在复性之前添加至变性双链核酸时,重新杂交的阻断表明单链核酸分子的序列与双链核酸分子的至少部分序列是互补的。
因此,本发明的方法还涉及用于测定核酸序列的方法,所述方法包括以下步骤:
a)通过向所述分子施加物理力,使对应于所述核酸序列的双链核酸分子变性;
b)提供单链核酸分子;
c)在所述单链核酸分子存在下使所述双链核酸分子复性;以及
d)检测双链核酸复性的阻断。
本发明适用于任何类型的双链核酸。大多数情况下,双链核酸将是DNA,但应当理解,本发明也适用于完全配对的或者不完全配对的单链DNA-单链DNA双链体,或适用于完全配对的或者不完全配对的单链DNA-单链RNA双链体,或适用于完全配对的或者不完全配对的单链RNA-单链RNA双链体。此外,双链体可能由获自不同来源的样本的两条单链的至少部分重新配对组成。最后,本发明也适用于唯一单链DNA或唯一单链RNA的二级结构。
在典型的结构中,双链核酸分子可以特异性地锚定在两种固体基质上(如显微镜载玻片、微量吸移器、微粒)。末端之一可直接或间接地连接到表面上,而另一端直接或间接连接到一个可移动的表面。在本实施方式中,当支持物移开时,在双链核酸的两端施加了张力。当张力高于阈值时,两条链分离并且核酸分子被变性。施加的张力优选高于或等于15pN;更优选高于或等于16pN;甚至更优选高于或等于17pN;在非常优选的方面,它高于或等于18pN。这种力可随温度、核苷酸类型和缓冲液而变化,但本领域技术人员根据这些参数将很容易调整所述力,以获得两条链的分离。另一方面,当张力下降到低于最小值时,变性双链核酸的两条链可以重新杂交。要获得所述两条链的重新杂交,优选施加小于或等于12pN的张力;更优选它小于或等于11pN;甚至更优选,它小于或等于10pN。最优选地,双链核酸是发夹。如此处所用,“发夹”是指这样的双螺旋,其中一条链的5'端通过未配对的环物理连接到另一条链的3'端。所述物理连接可以是共价或非共价的。优选地,所述物理连接是共价键。因此,发夹由双链茎和未配对的环组成。在发夹中,两条链的未参与到环中的端是游离的,因此可被拉开。这导致双链核酸的未配对,从而产生变性的双链核酸分子。有可能通过用高于阈值的力拉所述核酸分子的每一端而完全打开发夹双链核酸分子。当施加到分子的张力下降到低于最小值时,核酸分子重新杂交并重新形成发夹。杂交至核酸链之一的单链核酸分子的存在导致重新杂交的暂停。因此,检测到这样的暂停表明单链核酸分子包括与双链茎的至少部分互补的序列。
在这方面,有利的是设计环序列和长度以便短的瞬态后发夹重新折叠,如1秒。在现有技术中已经描述了这种效果的方法,如在Woodside等人,Proc.Natl.Acad.Sci.U.S.A.,103(16):6190-6195,2006中。当力从打开降低至测试值时,开放发夹的伸展因为单链DNA的弹性而变化。发夹重新折叠前的小延迟允许用户在与用于检测阻断状态所用的力相同的力下确定发夹的伸展。
特别是,使用发夹使得有可能进行配对和解除配对的循环,从而改善信号/噪音比。
允许双链核酸的游离端连接在一起的技术是已知的,将在下面更详细地描述一些。
阻断的确定在此处意味着与阻断相关的物理参数的确定。这些参数中最有用的是阻断在双链核酸分子上的位置,所述位置对应单链核酸分子在双链核酸分子上杂交的位置。事实上,本发明人发现能够精确确定双链核酸上发生复性暂停的位置:发夹的使用为本领域技术人员提供一种手段,以便在变性/复性过程的任何时间确定发夹两个游离端之间的物理距离。
“游离端”在此处意味着一条链的末端没有共价连接到另一条链的末端;如上面所解释的,这些游离端中的每一个均可以结合至不同的表面。例如,这些表面中的一个可以是可移动的,而另一个可以是静止的。因此,本领域技术人员将很容易地认识到,为了测量发夹双链核酸游离端之间的距离,简单地测量两个表面之间的距离是有可能的。
当发夹分子完全变性时,这种距离为最大值(Z(F打开)),因为发夹核酸之后完全伸展;当所述发夹分子完全复性时,它是最小值(Z(F测试))。有利的是在相同力F测试下进行所有的长度比较,从而单链核酸具有相同的弹性特性。通过使用环关闭中的延迟,本领域技术人员可以测量Z(F测试)。同样地,复性过程暂时地暂停时,可以测量两个游离端之间的距离:如预期地,这种距离z介于Z和Z之间(所有z以F=F测试进行测量)。立即清楚的是,距离z随着序列在发夹分子中的位置而不同,其中单链核酸的序列互补于所述序列。如果所述单链核酸和位于接近发夹游离端的序列杂交,自我重新杂交过程就在重新形成完整发夹之间被阻断;在这种情况下,Z暂停是最小值。另一方面,如果所述单链核酸和接近未配对环的发夹部分杂交,复性过程将被停滞在这样一个情况下:其中发夹完全或几乎完全变性;在这种情况下,Z暂停是最大值(图1)。
有可能精确地将双链核酸分子中的物理距离与一些碱基相关联。例如,在10pN力下,1nm的距离对应着核酸中由两个核苷酸(1bp)所跨越的距离。由单链核酸的弹性给出相对于力的准确校准。因此,通过简单测量双链核酸分子两个游离端之间的距离能够精确确定复性在何处被阻断。
因此,在一个实施方式中,本发明由用于测定核酸序列的方法组成,其中对应于待测定序列的双链核酸分子首先通过施加物理力进行变性,然后在单链核酸存在下重新杂交,以及检测重新杂交中阻断的存在。在一个方面中,当复性过程被阻断时,确定双链分子两端之间的距离。优选地,当分子完全变性时,确定所述分子两端之间的距离。甚至更优选,比较两个距离并确定阻断的位置。
另一个与复性中的阻断相关的有用参数是复性阻断期间的时间长短(此处称为复性暂停的持续时间)。事实上,有可能测量重新杂交阻断期间的时间长短。例如,本领域技术人员能够确定双链核酸的两端之间距离为如上所定义的z期间的时间长短,即介于Z和Z之间的中间值。
阻断的持续时间取决于两条序列之间的互补程度。互补性越高,两分子之间建立的键的数目越多,并且因此,持续时间越长。同样清楚的是,阻断时间将取决于两条序列之间互补性区域的长度。区域越长,两分子之间建立的键的数目越多,因此,持续时间越长。因此,容易想到,在一定条件下,复性暂停的持续时间将几乎是永久的。特别是,当单链核酸包括能够与变性双链核酸杂交的超过20个,优选超过25个,甚至更优选超过30个核苷酸时,即使当向所述双链核酸施加的力降低到F测试时,单链核酸仍然与双链发夹杂交(许多分钟),从而防止所述双链发夹的自我重新杂交。在这样的情况下,使用酶去除单链核酸分子可能是有利的。因此,所述单链核酸分子的去除使得能够进行配对和解除配对的循环,从而改善信号/噪音比。作为合适的酶的例子,可以举出例如解旋酶,包括UvrD解旋酶、大肠杆菌UvrD解旋酶、Tte-UvrD解旋酶、T7Gp4解旋酶、RecBCD解旋酶、DnaB解旋酶、MCM解旋酶、Rep解旋酶、RecQ解旋酶、PcrA解旋酶、T4UvsW解旋酶、SV40大T抗原解旋酶、疱疹病毒解旋酶、酵母Sgsl解旋酶、DEAH_ATP依赖的解旋酶和乳头状瘤病毒解旋酶E1蛋白及其同源物。优选地,使用T4UvsW解旋酶。暂停的持续时间也可随着反应条件变化。所述持续时间将随着温度的升高而减少。同样,缓冲条件也可以调节暂停的持续时间:例如,镁、甜菜碱和氯化四甲铵(以摩尔浓度使用的TMAC)增加阻断时间。这些化合物比GC更加加强AT对,从而减少这些对之间强度的差异。然而,当固定温度和缓冲液时,暂停的持续时间将只取决于拉变性双链核酸的力,以及其与单链核酸的互补性。
因此,在一个具体方面中,本发明的方法包括以下步骤:
·通过向所述分子施加物理力,使对应于所述核酸序列的双链核酸分子变性;
·提供单链核酸分子;
·在所述单链核酸分子存在下,使所述双链核酸分子复性;以及
·检测所述双链核酸分子复性的阻断;以及
·确定暂停的持续时间。
在一个优选的方面中,检测所述双链核酸分子复性的阻断包括确定双链核酸分子上阻断的位置,如上所述。
在这个具体实施方式中,根据本发明的方法可以用于诊断目的,从而允许尤其是对应着要寻找的异常的核酸可变区进行测序;该技术之后和此后所述的针对测序的技术相似。
然而,有可能基于这样的观察提供简化的技术,即寡核苷酸和DNA序列之间的错配导致更短寿命的杂交。在首先的方面中,利用任何上述的方法使发夹双链核酸分子的复性被单链核酸阻断,并确定阻断的持续时间。在一个优选的方面中,该值和参考值进行比较。在另一个优选方面中,参考值对应着用参考单链核酸所观察到的暂停长度,如通过任何上述方法所确定的。
出于诊断目的,如寻找基因组DNA中的突变,该技术可以以两种方式实现:
1)用溶液中的寡核苷酸探测基因组DNA形成的发夹,所述基因组DNA包括待寻找的突变。
2)通过以固定大小的单链DNA片段形式存在于溶液中的基因组DNA来探测发夹,所述发夹包含具有待寻找的突变的序列。这将是显而易见的,即如果分析的目标只是找到这种序列中特异性序列或可能的突变的存在,把这种序列置于发夹环中则提供一个非常简单的检测方案。如果寡核苷酸在环中杂交,它完全阻止发夹的再折叠,导致非常大程度的变化,其从而可以轻易检测到,如下文所述。
本发明的方法也可以用于未知核酸的直接测序。本发明的测序方法提供多个实施方式。
在首先的实施方式中,用本发明的方法实现物理测序。通过接连地将不同的已知单链核酸探针去杂交核酸发夹(经历变性和复性的循环),从复性阶段期间的暂停位置(以nm的精确度测量的)可以推断所述核酸发夹的序列。
并非采用一组代表所有可能的序列组合的单链核酸去杂交待测序的双链核酸,有利地,本领域技术人员将采用将不同单链核酸探针的数目最小化的策略。根据是否优化单链探针、双链靶分子或两者皆有,可以获得各种选择。
在一个方面中,用一系列单链核酸探针进行本发明,其中只有有限数目的碱基是特异性的,其余的没有特异性。例如,这一系列的探针可以由n个碱基的单链核酸分子组成,其中所有可能的二核苷酸(例如,AA、AT、AG、……共16种可能的组合),或者所有可能的三核苷酸(例如AAA、AAT、AAG、……共64种可能的组合)分别连接有所有可能的n-2或n-3个核苷酸的组合,n优选为小于或等于30的整数,更优选n小于或等于20,甚至更优选n小于或等于8。当只有2或3个碱基是特异性的时(即一系列16或64个不同的探针),在每一个杂交确定二核苷酸或三核苷酸的位置。这允许混合一系列单链核酸分子以减少缓冲交换的数目。比如,在AANNNNNN的情况下,如在Applied Biosystems所开发的Solid测序平台上所实施的,只有四批探针是严格必需的。二核苷酸或三核苷酸可位于n聚探针的任何位置。在一个优选的实施方式中,测试的核苷酸位于寡核苷酸的中心;因为这个位置对错配更敏感,将提高方法的灵敏度。
本发明方法的一个明显优势是,所述方法允许在同一时间测序双链分子的两条链。事实上,每一条探针将杂交至包括互补于探针所携带的序列的序列的链。然后,利用如上所述的打开/拉上方法确定杂交探针的位置。因此,通过提供一个内对照,可在同一运行中确定两条链的序列。为了能够鉴定探针所结合的链,可以方便地设计探针,以使二核苷酸或三核苷酸位于靠近探针的中心的位置,但稍微偏离中心。本方法的另一个优选实施方式涉及这样的探针,其中这些核苷酸稍微偏离中心,从而阻断将取决于寡核苷酸结合哪条链而转移。例如,二核苷酸可直接位于探针中心的5'或3'。也可以使用这样的探针,其中,中心核苷酸是三核苷酸的最5'或最3'的核苷酸。例如,8聚寡核苷酸的可能选择是NNXXNNNN或NNXXXNNN。最后,也可能使用通用碱基(Z)而不是所有核苷酸的组合(N)。通用碱基(Z,如5-硝基吲哚或3-硝基吡咯(nitropyrole))表现出与所有四种碱基均一的相互作用并减少寡核苷酸的稀释。
通过杂交的机械检测进行的测序的分辨率受限于珠子和锚定表面之间的距离的测量中可达到的空间分辨率。通过栓系分子(其决定了珠子的布朗运动的幅度)的刚性最终确定分辨率。对于约1000bp的分子,在约10pN张力下,其空间分辨率(平均1秒)为约2nm(即约2bp(打开的))。由于布朗噪音随着DNA长度的平方(即核苷酸数目的平方)而减小,该技术非常适合较短分子的测序。
在另一个方面中,重新设计待测序的核酸以增强杂交探针位置的确定。例如,美国专利No.6,723,513中公开了一种涉及扩增一个或多个碱基以帮助鉴定位置的测序技术。在这种技术中,靶核酸中的碱基对与代表着四种碱基腺嘌呤、胞嘧啶、鸟嘌呤和胸腺嘧啶(或者,如果核酸是RNA时,是尿嘧啶)中每一个的四种不同标签(扩增标签)相关。然后,每一个特异性碱基腺嘌呤、胞嘧啶、鸟嘌呤和胸腺嘧啶的每一个发生被相应的扩增标签替换。在一个优选实施方式中,每一个扩增标签是特定长度(如n个碱基)和特定序列的寡核苷酸。因此,根据上面描述的方法,通过打开/拉上,在互补于针对腺嘌呤、胞嘧啶、鸟嘌呤和胸腺嘧啶的扩增标签的寡核苷酸的连续存在下,可以确定原始双链核酸。这些寡核苷酸将与相应的双链核酸的链配对,并在对应的编码碱基处阻断其重新杂交。
因此,在这个方面,本发明提供用于测定如上所述序列的方法,其中单链核酸是互补于扩增标签之一的寡核苷酸。在一个优选的方面中,该方法包括确定所述单链核酸在双链核酸分子上每一个阻断位置的另一个步骤。在另一个优选的方面,用互补于扩增标签的每一个寡核苷酸接连地重复用于测定序列的所述方法的所有步骤以及确定每一个阻断位置的步骤。
由于每个碱基均被扩增,即被n聚寡核苷酸替换,用于确定杂交探针位置所需的精确性只需低于n nm。例如,如果扩增标签是8聚寡核苷酸,当有可能以小于8个碱基(即小于8nm)的精确度确定分子两个游离端之间的物理距离时,可以精确地确定碱基的位置。这种方法的另一个优点是,只需四个连续分析就可以平行测序许多珠子。
在其次的实施方式中,本发明的方法包括酶的步骤。这种方法的一个优选实施方式由利用互补序列的连续杂交和连接的发夹测序组成。在本发明方法的本实施方式中,有可能测定长双链核酸分子的序列;长的双链核酸分子在此处理解为大于500bp的分子,更优选大于750bp,甚至更优选大于1000bp。该技术由将相邻的杂交单链核酸连接至上游的单链核酸引物组成。然后通过发夹双链核酸分子的变性和复性以及检测复性中的阻断来监测引物的延伸,如上所述。然后,用不同的单链核酸分子重复该方法。根据本发明的方法,不需要预先扩增待测序的双链核酸分子;本发明的方法可以在单个双链核酸分子上进行。
在一个优选的实施方式中,使用单链核酸分子的文库(参见例如美国专利No.4,882,127和No.4,849,077)。所述文库由n碱基的单链核酸分子组成,其中所有可能的二核苷酸(如AA、AT、AG、……共16种组合)通过所有可能的n-2核苷酸组合连接在其3'端,n优选为小于或等于20的整数,更优选n小于或等于12,甚至更优选n小于或等于8。在一个更优选的实施方式中,在进行下一轮杂交和连接之前切掉最后m个核苷酸,m是包含在1和n-1之间的整数;优选地,m等于n-1(Mir等人,Nucleic Acids Res.,37(1):e5,2009)。使用可切割的序列允许检测对阻断位置的精确度要求不太严格(几nm)且同时仍保持较少合成步骤的杂交。替代方法是使用在其5'端缺少磷酸的寡核苷酸,以便一次只可以连接一个寡核苷酸;在下一轮运行之前,使用激酶来添加缺少的磷酸,从而允许下一个连接。通过用16种可能的二核苷酸中的每一个来重复这一过程,有可能根据每一个连续单链寡核苷酸的连接检测互补链长度上的连续增加。也有可能合并16种寡核苷酸在4批中,以减少分析的数目。由于每一个二核苷酸序列被检测两次,这足以确定序列。因此,一旦整个双链核酸被单链核酸分子的文库所互补,便去除合成的链(例如,在解旋酶或核酸外切酶的帮助下),并且用上游单链核酸引物重新开始该过程,该引物相对于以前的引物向上游或下游移动一个核苷酸。重复该过程n-m次允许获得双链核酸序列的完整确定:例如,对于8聚寡聚物的文库,当m=3时,只需要5个程序的重复(即互补链的合成)来获得双链分子的完整序列。
然而,现有技术的方法都使用荧光核苷酸,本发明的方法只涉及探针延伸的机械检测。因此,本发明的方法不会受到任何与现有技术方法有关的缺点的困扰。例如,8聚寡聚物的成功连接代表8nm双链发夹的伸展变化。这可以用2nm分辨率容易地检测到,该2nm分辨率是约1000bp的分子在约10pN张力下的空间分辨率(一秒平均)。因为在每一步骤中连接了单一寡核苷酸,其检测只意味着伸展相对变化的检测,即成功连接之前和之后。
本发明方法的实现已成为可能,特别是利用设计用于在单分子水平探测实时核酸相互作用的装置(device)的存在。这样的装置(device)描述于,例如美国专利No.7,052,650和No.7,244,391。其中描述的设备(apparatus)使用磁阱来向微米尺寸的超顺磁性珠施加皮牛顿尺度的力。简要地说,所述设备包括光学显微镜、磁体和PC。双链核酸分子的一端在多个点上被锚定至静止元件(如表面),并且另一端被锚定至可移动的表面,在这种情况下是磁珠。提供磁体以便作用于珠子。尤其是,磁体可用于拉动珠子以离开表面。然而,本发明方法的实施并不限于上述设备。任何允许双链核酸分子完全伸展并然后再折叠并在同一时间同时监测所述分子的伸展的装置可用来实现本发明的方法。例如,可使用光镊(opticaltweezer);然而它们需要事先进行力的校准,并且不容易进行并行化用于高通量测量。其它缺点是缺乏核酸的总扭转控制(total torsional control)以及通过聚焦激光进行的可能的溶液局部加热,其会改变杂交的条件。
双链核酸在足够珠子(例如,链霉亲和素包被的珠子)的溶液中孵育数分钟,其标记(例如生物素)端之一结合至珠子。如果之后使用光镊进行操作,那么珠子可以是透明的,或者如果使用磁阱或镊子进行操作,那么珠子可以是磁性的。
珠子-核酸组装体注射至流体室,其表面已被处理过,例如以便结合分子的其它标记端(例如包被有抗地高辛抗体的表面,以结合至核酸的地高辛标记端)。因此,珠子经由核酸发夹锚定至表面,参见图1a。然后通过本领域技术人员已知的各种手段监测珠子到表面的距离:例如其在相机图像上的衍射环可以用来推导其距离,或者当以隐失模式(evanescent mode)照亮时,它们散射(或通过荧光发射)的光强度可以用来测量其距离。或者,可以测量它们所产生的磁场(使用如GMR或Hall传感器的磁传感器)来推导它们到锚定表面上的传感器的距离。
为了将锚定核酸分子的珠子拉至表面,各种技术已被描述。可以使用聚焦激光束的光捕获聚焦点附近的透明珠子。通过相对于锚定表面的光束的相对平移(translation),可以向栓系分子施加力(典型的光镊分析)。表现出的力与珠子距离其平衡位置的位移(displacement)成比例,为了在栓系分子上表现恒定的力需要在捕获束上的反馈环路。
为了在珠子上表现恒定的力,已描述了使用通过环绕珠子的流动所产生的动水拖曳力(hydrodynamic drag),但它通常产生低的空间精确度(>100nm)。优选的实施方式使用磁阱来拉动通过如上所述的核酸发夹锚定到表面上的超顺磁性珠子。在此结构中,放置在样本上的小磁体用于在锚定的珠子上施加恒定的力,可以以<1nm的精确度确定其位置(取决于拉力和归因于动水拖曳力的消耗)。在每一个情况下,注意到,可以通过用大于约16pN的力拉动珠子来机械地完全打开栓系发夹。施加到分子上的张力降低至低于约11pN时允许发夹自发地重新拉上(尽管是迟滞的,拉开转换是可逆的)。如果,在打开阶段期间,溶液中一些分子(例如蛋白质或DNA、RNA、LNA或PNA的互补寡核苷酸)结合至拉伸的单链核酸,当力降低到低于11pN时这些分子将阻断发夹重新拉上。因此,分析原理是两种力之间的切换:大的一个F打开来打开发夹以及较小的一个F测试来允许重新拉上以及测量短暂阻断时分子的伸展。通过充分伸展和阻断之间的线性关系,阻断位置和序列联系起来。对于最佳的精确度,优选于测试力F测试下测量充分伸展。这通过设计这样的发夹环来实现,即一旦力从F打开降低到F测试,发夹环需要一秒的间隔(fraction)来重新折叠。
为了将核酸附着至表面或支持物,可以使用本领域中已知的任一技术。实质上,核酸直接锚定至支持物,例如微珠,其涉及该表面的官能化,例如通过包被有能够与核酸的官能化末端反应的链霉亲和素、COOH基团等。
在一般情况下,这样的方法使核酸的官能化成为必需,特别是在3'和5'端,也就是说在其上接枝合适的化学基团。此外,优选通过环连接分子的另两个游离端以防止链在操作结束时解离,从而如果适当时可以重复后者。为了这个目的,可以采用不同的程序。
最简单的是使用合成的寡核苷酸用两个不同的官能团(例如生物素和胺)将双链核酸的末端之一官能化,其允许锚定到两个不同的预处理表面。使用部分配对的合成核苷酸,可以使另一端的两条链连接成环的形式。以这种方式,从双链核酸产生配对的单链核酸,即发夹。此方法的优点在于它能够官能化大核酸片段的不同群(如通过基因或染色体的片段化所获得的),其然后可以同时进行分析。在这种情况下,使用两种(或更多)限制性酶将核酸样本片段化,其使得能够在其端部用两种不同的限制性位点获得亚群,其端部在所有片段中都是相似的。这可以使两端被差别处理(例如通过以环的形式将一端连接到寡核苷酸,在其端部具有适当的限制性位点)。这种方法的缺点在于两个相邻官能团之间的立体干扰,其可以使得难以偶联至表面。为了解决这个问题,有利地的是,在发夹分子每一个游离端添加碱基“间隔”序列,然后向碱基“间隔”序列的末端加入官能团;两个间隔序列是非互补的,为每一个官能团提供足够的空间来结合至其专门的表面。更有利的是,设计每一个间隔序列的序列,以便在本发明的测序方法中使用已知序列的单链测序引物。可以用分子生物学中任何常用方法向双链核酸分子添加环和/或间隔。这些方法是本领域技术人员众所周知的,因此没有必要在此详述。
至于实际的锚定技术,有许多这种技术并且它们源自用于向市售可获得的预处理表面锚定大分子(蛋白质、DNA等)的技术。大多数这些技术已被开发用于免疫学测试,以及将蛋白(免疫球蛋白)连接至带有能够和蛋白羧基(-COOH)端或氨基(-NH2)端反应的基团(-COOH、-NH2、-OH等)的表面。
可以通过分子5'端的游离磷酸直接完成核酸的共价锚定,其中游离磷酸与仲胺(由斯特拉斯堡的Polylabo市场化的Covalink-NH表面)反应形成共价键。也可以用氨基将DNA官能化,然后如同处理蛋白质一样进行处理。
也有包被有链霉亲和素的表面(Dynal珠子等),其允许链霉亲和素和生物素化DNA分子之间的准共价锚定。最后,通过将针对地高辛的抗体接枝到表面上(通过上面提到的方法),用地高辛官能化的核酸可以锚定于此。这仅仅代表许多可能的锚定技术中的一个示例。
在附着和锚定技术当中还应该提到的是,例如在专利EP 152 886中所描述的技术,其使用酶偶联用于将DNA附着到固体支持物如纤维素上。
专利EP 146 815也描述了各种将DNA附着到支持物上的方法。相似地,专利申请WO92/16659提出使用聚合物来附着DNA的方法。
当然,核酸可以直接附着至支持物,但在必要的情况下,特别是考虑到要限制表面的影响时,核酸可以附着至肽或其他种类的惰性臂的末端,例如在专利EP329 198中描述的。
下面的实施例将使得本发明的其它特征和优点变得明显。
附图说明
图1:寡核苷酸杂交至其在发夹DNA上的互补序列的检测原理。将珠子锚定至表面的发夹DNA(a)通过将对珠子的拉力增加到16pN以上的值被瞬间拉开。在该阶段,溶液中的互补片段杂交至开放DNA发夹上的靶点,因此防止当力降低回到其初始值时发夹(b)重新拉上。发夹重新折叠表现出在明确伸展时发生的四个平台,但持续时间可变。73.71nm处的最高平台与在F测试下83bp完全打开的发夹有关,而底部的一个对应着完全重新折叠的发夹。因为两个寡核苷酸已被置于溶液中,在25.47nm和35.17nm处发生两个中间平台。从伸展中的这些变化(Z-z)有可能推导出互补序列沿着发夹在何处配对。此处,根据其位置,阻断与28.66bp和39.60bp定位符合,这与预期的29bp和40bp的位置非常吻合。通过高斯拟合至获自多种打开/关闭循环(此处~20个循环)的图,更好地估计平台位置。
图2:阻断时间强烈地取决于寡核苷酸长度和拉力。A)归因于10个碱基的寡核苷酸在1200bp的发夹上的阻断时间τ。B)阻断时间的图显示2秒平均值的泊松分布。C)阻断时间随着核苷酸大小而变化并随着测试阶段期间所用的力F 而呈指数变化。
图3:在9个碱基的寡核苷酸情况下,阻断概率和阻断时间与寡核苷酸浓度的演变。阻断时间独立于浓度。阻断概率表现为10nM的Km。
图4:具有12个核苷酸的寡核苷酸的阻断时间相对于力作图。除了带有圆形符号的曲线,所有这些寡核苷酸具有一个或两个错配,尽管在这后一种情况下,阻断太短以至于不能测量。如果错配位于最后一个或第一个碱基,阻断时间减少了4/5(by a factor5)。如果错配涉及寡核苷酸中间的AT碱基对,阻断时间减少了20倍以上,然而如果其涉及GC碱基对,其达到60倍。双错配减少阻断时间太多以至于它不能被测量。
图5a:对于10碱基寡核苷酸ACAGCCAGCC的阻断时间与温度的演变。通常情况下,当温度升高10度时阻断时间减少了2/3。
图5b:具有10bp核苷酸的寡核苷酸的阻断时间相对于力作图。除了带有圆形符号的曲线,所有寡核苷酸具有一个或三个LNA(标有方形符号)。取代DNA的一个LNA使阻断时间增加了2倍以上。
图6:在如图1c中显示的一个实验中,DNA伸展分布的图,其中溶液中的寡核苷酸可以和打开的DNA在沿着分子的不同位置上进行配对。根据图的峰位置(其与3种不同分子,即不同的结合珠子,高度关联)可以推导出沿着DNA的杂交位置。
图7:对于对应着扩增序列的DNA发夹的对应于四种8碱基核苷酸A8、C8、T8、G8的阻断位置的图。这些阻断位置精确对应着其预期的位置。我们此处有G8=GCACGCAC、C8=TCGCTCGC、T8=GCCAGCCA和A8=CCGACCGA。
具体实施方式
实施例
-DNA的制备
未知序列的以及包括在几十至几千个碱基对之间尺寸的双链(ds)DNA片段在其端之一被连接至DNA环。其另一端被连接到dsDNA片段,从而允许其两条链结合至不同包被的表面。例如,一条链的游离3'端可标记有生物素,从而允许结合到链霉亲和素包被的珠子,而另一条链的5'端可标记有地高辛(digoxigenine),从而允许其结合至包被有抗地高辛抗体的表面。通过本领域技术人员已知的各种方法可以实现这种末端标记,如使用末端转移酶来添加生物素(或地高辛)修饰的核苷酸,或者与适当标记的寡核苷酸进行杂交。
-力拉伸设备
这种DNA构建体在足够珠子(例如链霉亲和素包被的珠子)的溶液中孵育数分钟,其标记(例如生物素)端之一结合至珠子。如果之后使用光镊进行操作,那么珠子可以是透明的,或者如果使用磁阱或镊进行操作,那么珠子可以是磁性的。
珠子-核酸组装体注射至流体室,其表面已被处理过例如以便结合分子的其它标记端(例如包被有抗地高辛抗体的表面,以结合至DNA的地高辛标记端)。因此,珠子经由DNA-发夹锚定至表面,参见图1a。然后通过本领域技术人员已知的各种手段监测珠子到表面的距离:例如其在相机图像上的衍射环可以用来推导其距离,或者当以衰减模式照亮时,它们散射(或通过荧光发射)的光强度可以用来测量其距离。或者,可以测量它们所产生的磁场(使用如GMR或Hall传感器的磁传感器)来推导它们到锚定表面上的传感器的距离。
为了将锚定核酸分子的珠子拉至表面,各种技术已被描述。优选的实施方式使用磁阱来拉动通过如上所述的DNA发夹锚定到表面上的超顺磁性珠子。在此结构中,放置在样本上的小磁体用于在锚定的珠子上施加恒定的力,可以以<1nm的精确度确定其位置(取决于拉力和归因于动水拖曳力的消耗)。在这一系列实验中,使用了美国专利No.7,052,650和No.7,244,391中公开的设备。此外,除非另有指明,在25mM Tris pH7.5、150mM KAc、10mM MgCl2、0.2%BSA中进行此处报道的实验。
在每一个情况下,通过用大于约16pN的力拉动珠子来机械地完全打开栓系发夹。施加到分子上的张力降低至低于约11pN时允许发夹自发地重新拉上(尽管是迟滞的,拉开转换是可逆的)。如果,在打开阶段期间,溶液中一些分子(例如蛋白质或DNA、RNA、LNA或PNA的互补寡核苷酸)结合至拉伸的单链核酸(ss)DNA,当力降低到低于11pN时这些分子将瞬间阻断发夹重新拉上。分析原理是两种力之间的切换:大的一个F打开来打开发夹以及较小的一个F测试来允许重新拉上以及测量短暂阻断时分子的伸展。通过充分伸展和阻断之间的线性关系,阻断位置和序列联系起来。对于最佳的精确度,优选于测试力F测试下测量充分伸展。这通过设计这样的发夹环来实现,即一旦力从F打开降低到F测试,发夹环需要一秒的间隔来重新折叠。
-可以用碱基对分辨率测量寡核苷酸的杂交位置
有可能通过测量这些重新拉上的暂停之一期间DNA分子的伸展(珠子到表面的距离)以纳米精确度确定阻断的位置(1nm对应着在10pN力下,ssDNA中由两个核苷酸(1bp)所跨越的距离)。打开的结构表现出伸展相对于碱基对的最大比率(在dsDNA中,比率只有0.34nm每bp)。
这种测量的精确度受限于两种噪音的影响:
·测量方法的精确度,
·珠子的布朗运动。
可以使用不同的技术来测量珠子的垂直位置。最简单的技术之一取决于电视显微镜检查(美国专利No.7,052,650和No.7,244,391)。图1中的结果是用这种方法得到的,对于1秒平均,典型的分辨率达到1nm。具有更好的分辨率的其它方法已被证明,如带有PSD传感器的激光照射,其达到0.1nm的分辨率(Greenleaf和Block,Science,313:801,2006)以及隐失波照射(Singh-Zocchi等人,Proc NatlAcad Sci U S A.100(13):7605-7610,2003、Liu等人,Biophys J,96(9):3810-3821,2009)。
分辨率的固有限制由珠子拉动ssDNA分子的布朗波动给出。<x2>=4kBTΔf(6πηr)/k2 ssDNA(F),其中kssDNA(F)是ssDNA分子的刚度,KB是玻尔兹曼常数,T为绝对温度,η为水的粘度,r是珠子的半径和Δf是测量的频率范围。kssDNA(F=10pN)=0.05/Nb(N/m),其中Nb是ssDNA的碱基数。对于84bp的发夹,这将导致1秒(Δf=1赫兹)平均以上的0.04nm的噪音。图1中更大的噪音基本上归因于测量装置,而不是固有波动。固有的布朗噪音随着发夹的大小而增加:当平均超过1秒时,1200bp的发夹导致0.6nm的噪音。
通过阻断时间的平均值测量杂交质量。
阻断强度可以用两个参数进行特征化:阻断概率P阻断(=体现阻断的循环数/总循环数)和平均阻断时间τ阻断。P阻断取决于k和寡核苷酸的浓度,而τ阻断只取决于k,其中k和k分别是结合和解离反应常数。在图2上显示的是τ阻断随着寡核苷酸长度和力的典型波动。单个碱基错配对τ阻断有剧烈影响,相当于寡核苷酸长度减少了至少一个核苷酸,并且阻断时间减少了4/5。
实际上,τ阻断以及因此的k是更易于测量的,因为它不取决于寡核苷酸的浓度(图3)。然而也有可能测量k
平均阻断时间取决于寡核苷酸序列,但不取决于其沿着发夹的位置。研究了沿着发夹匹配两个特定位置的序列:对于两个阻断,尽管它们出现在不同的位置,阻断时间是一样的。
单一突变对阻断时间有剧烈影响
如图4所示,与具有单个错配的同一寡核苷酸相比,与发夹形成完美匹配的12个碱基的寡核苷酸表现出非常不同的阻断时间。在图4中,显示了不同寡核苷酸的相对于力的阻断时间。增加的力增加阻断时间。当突变仅仅是在第一或最后一个核苷酸时,其对阻断时间的影响是最小的,降低了4/5。正如预期的那样,这种减少取决于错配性质,在AT上的错配通常会导致阻断时间19/20的减少,而GC错配导致59/60的减少。
当错配位于寡核苷酸的中心时,阻断时间剧烈减少。
正如图4上可以看出的,只有当力最大时才可以观察到寡核苷酸中心的错配会引起非常短的阻断。这样的错配造成的阻断时间上的减少对于相同的力条件而言超过100倍。
阻断时间取决于温度和缓冲条件。
如图5a中可见的,增加温度显著减少阻断时间。缓冲条件也可以调节阻断时间:通过与这些实验中所用的缓冲液(25mM Tris pH7.5、150mM KAc、10mMMgCl2、0.2%BSA)进行比较,镁、甜菜碱和氯化四甲铵(以摩尔浓度使用的TMAC)显著增加阻断时间。在降低这些碱基对之间强度的差异方面,相对于GC,这些化合物更加加强AT对。
使用RNA或LNA寡核苷酸增加阻断时间。
和DNA寡核苷酸相比,RNA和LNA寡核苷酸与ssDNA形成更强的杂交体。对于相同的靶序列,与DNA寡核苷酸相比,RNA寡核苷酸的阻断时间增加了2倍。
LNA核苷酸有一个更强烈的作用:如果单个核苷酸从DNA转换为LNA,全部寡核苷酸的阻断时间增加了2倍。将三个碱基从DNA转换为LNA,阻断时间增加了5倍。当所有核苷酸从DNA转换为LNA时,其作用如此剧烈以至于10个碱基的LNA寡核苷酸的阻断时间超过1h。将寡核苷酸的大小减少至6个碱基的LNA导致1秒的合理阻断时间。
至于DNA寡核苷酸,可以通过测量这些替代寡核苷酸之一(LNA或RNA)的平均阻断时间确定其性质:是或不是归因于与互补寡核苷酸的完美杂交,以及如果不是,错配位于何处(例如在杂交的寡核苷酸的中心或接近其中的一端)。
可检测的寡核苷酸的长度。
由于阻断时间指数性地取决于寡核苷酸的长度,这个参数不能变化太大。如果寡核苷酸太小(在室温下少于8个碱基),阻断时间太短以至无法检测到。如果寡核苷酸过大(在室温下多于12个碱基),阻断时间变得太长。
酶可以稳定杂交体。
添加不含NTP的gp43DNA聚合酶增加寡核苷酸的阻断时间。因为杂交的引物是聚合酶的底物,这是可预期的。gp43聚合酶使得寡核苷酸的阻断时间增加了10倍。
杂交参数概述
寡核苷酸的长度是一个关键参数:在室温下,具有实用的阻断时间的寡核苷酸的长度从8至12个碱基不等。人们可以很容易地在同一分子上进行一系列打开/重新拉上实验,并测量利用归因于寡核苷酸和打开阶段的DNA的配对而重新拉上的阻断的平均时间。这种时间取决于寡核苷酸的大小、重新拉上期间所施加的力、温度和离子浓度。如果配对的片段显示错配,阻断时间将显著地并且以可量化的方式减少(至少10倍)。因此,机械的打开/重新拉上技术允许快速探测已知寡核苷酸序列和具有未知序列的DNA片段之间配对的位置和稳定性,见图lc和图2。这些观察表明了应用于DNA测序和诊断中的各种实施。
通过杂交的机械检测进行的诊断和测序。
通过用不同的寡核苷酸探测将珠子锚定至表面的DNA发夹(连续引入流体室),可以确定已知序列上可能的突变的存在(其导致与探针寡核苷酸的错配以及重新拉上期间更短的暂停)或者通过确定已知探针沿着分子的位置对未知DNA进行测序,见图6。
在另一个方面中,通过使用扩增标签重新设计待测序的核酸,以增强对杂交探针位置的确定。在图7所报告的实验中,在8聚寡核苷酸的这种情况下,每一种特定碱基腺嘌呤、胞嘧啶、鸟嘌呤和胸腺嘧啶的每一次发生都被相应的扩增标签替换。如图7中所示,阻断位置完美对应着序列中的预期位置。

Claims (24)

1.一种用于测定核酸序列的方法,所述方法包括步骤:
a)通过向对应于所述核酸序列的双链核酸分子施加物理力,通过移开支持物使所述分子变性;
b)提供单链核酸分子;
c)在所述单链核酸分子存在下,使所述双链核酸分子复性;
d)检测双链核酸复性的阻断,其中所述检测包括步骤:
·测量附着至支持物的双链核酸分子两端之间的距离(z),
·当所述双链核酸分子变性时,测量附着至支持物的双链核酸分子两端之间的距离(Z);
e)比较z和Z;以及
f)确定阻断的位置,
其中
所述双链核酸分子是发夹,
其中双链核酸链之一的碱基的至少一个直接或间接地附着至表面,并且其中双链核酸的另一条链的至少一个碱基附着至可移动的表面。
2.根据权利要求1所述的方法,其中通过移开支持物来向双链分子施加高于或等于15pN的物理力。
3.根据权利要求2所述的方法,其中施加高于或等于17pN的物理力。
4.根据权利要求2所述的方法,其中施加高于或等于18pN的物理力。
5.根据权利要求1所述的方法,其中通过将支持物带到一起使得变性的双链核酸在步骤c)中复性。
6.根据权利要求5所述的方法,其中通过将支持物带到一起使得向双链分子施加的力降低至小于或等于12pN。
7.根据权利要求6所述的方法,其中向双链分子施加的力降低至小于或等于11pN。
8.根据权利要求6所述的方法,其中向双链分子施加的力降低至小于或等于10pN。
9.根据权利要求1所述的方法,其中未附着至支持物的双链核酸的末端共价或非共价地彼此连接。
10.根据权利要求1所述的方法,其中步骤a)至d)重复数次从而积累测量并增加信号/噪音比。
11.根据权利要求1所述的方法,其包括测量阻断的持续时间的另一步骤。
12.根据权利要求11所述的方法,其包括阻断的持续时间与参考值进行比较的另一步骤,其中所述参考值对应着用参考单链核酸所观察到的暂停长度。
13.根据权利要求1所述的方法,其中单链核酸分子选自n聚单链核酸分子的文库,所述文库由连接有所有可能的n-2或n-3核苷酸组合的所有可能的二核苷酸或三核苷酸的组合组成,分别地n为小于或等于30的整数。
14.根据权利要求13所述的方法,其中二核苷酸或三核苷酸位于单链核酸分子的中心。
15.根据权利要求13所述的方法,其中二核苷酸或三核苷酸位于偏离单链核酸分子中心的位置。
16.根据权利要求1所述的方法,其中在双链核酸中四种碱基腺嘌呤、胞嘧啶、鸟嘌呤、和胸腺嘧啶中的至少一种的发生被特异性扩增标签替换,所述扩增标签是寡核苷酸。
17.根据权利要求16所述的方法,其中单链核酸是互补于扩增标签之一的寡核苷酸。
18.根据权利要求16所述的方法,其包括确定所述单链核酸在双链核酸分子上的每一个阻断位置的另一步骤。
19.根据权利要求16所述的方法,其中用互补于扩增标签的每一个寡核苷酸接连重复步骤a)至d)以及确定单链核酸在双链核酸分子上的每一个阻断位置的另一步骤。
20.根据权利要求1所述的方法,其包括进一步的步骤:
i)将相邻的杂交单链核酸连接至上游的单链核酸引物,以及
ii)通过如下步骤监测所述引物的延伸:
α在所述连接的引物存在时,使得所述双链核酸变性和复性,以及
β检测复性中的阻断。
21.根据权利要求20所述的方法,其中用不同单链核酸重复步骤i)至ii)。
22.根据权利要求20所述的方法,其中单链核酸分子选自n聚单链核酸分子的文库,所述文库由所有可能的二核苷酸的组合组成,所述二核苷酸3’端连接至所有可能的n-2核苷酸组合,n为小于或等于20的整数。
23.根据权利要求20所述的方法,其中去除或分解新合成的链。
24.一种用于测定核酸序列的方法,其中用引物重复权利要求20-23所述的步骤,所述引物相对于权利要求20所述的引物向上游或下游移动一个核苷酸。
CN201180034601.9A 2010-05-27 2011-05-26 通过杂交的dna测序方法 Active CN103052718B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP10305564A EP2390351A1 (en) 2010-05-27 2010-05-27 Method of DNA sequencing by hybridisation
EP10305564.6 2010-05-27
US37762110P 2010-08-27 2010-08-27
US61/377,621 2010-08-27
PCT/EP2011/058669 WO2011147931A1 (en) 2010-05-27 2011-05-26 Method of dna sequencing by hybridisation

Publications (2)

Publication Number Publication Date
CN103052718A CN103052718A (zh) 2013-04-17
CN103052718B true CN103052718B (zh) 2015-04-22

Family

ID=42732795

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201180034601.9A Active CN103052718B (zh) 2010-05-27 2011-05-26 通过杂交的dna测序方法

Country Status (14)

Country Link
US (2) US9512476B2 (zh)
EP (2) EP2390351A1 (zh)
JP (2) JP2013526870A (zh)
KR (1) KR101769893B1 (zh)
CN (1) CN103052718B (zh)
AU (1) AU2011257229B2 (zh)
CA (1) CA2800639C (zh)
DK (1) DK2576818T3 (zh)
ES (1) ES2542429T3 (zh)
HK (1) HK1183911A1 (zh)
HU (1) HUE025175T2 (zh)
IL (1) IL223257A (zh)
PL (1) PL2576818T3 (zh)
WO (1) WO2011147931A1 (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2390350A1 (en) 2010-05-27 2011-11-30 Centre National de la Recherche Scientifique (CNRS) Method of DNA sequencing by polymerisation
EP2390351A1 (en) 2010-05-27 2011-11-30 Centre National de la Recherche Scientifique (CNRS) Method of DNA sequencing by hybridisation
JP6169603B2 (ja) * 2011-12-22 2017-07-26 サントル、ナショナール、ド、ラ、ルシェルシュ、シアンティフィク、(セーエヌエルエス) 単一分子のハイブリダイゼーションおよび操作によるdnaの検出および定量法
WO2014113614A1 (en) * 2013-01-16 2014-07-24 The Regents Of The University Of California Label free molecular detection methods, systems and devices
US9994839B2 (en) 2013-01-16 2018-06-12 The Regents Of The University Of California Microfluidic devices to extract, concentrate and isolate molecules
BR112015017354A2 (pt) * 2013-01-22 2017-11-21 Centre Nat Rech Scient método para detectar pelo menos uma base modificada
EP3090803B1 (en) 2015-05-07 2019-08-07 Paris Sciences et Lettres - Quartier Latin Improved device for the analysis of nucleic acid molecules
WO2016177808A1 (en) * 2015-05-07 2016-11-10 Paris Sciences Et Lettres - Quartier Latin Formation of hairpins in situ using force-induced strand invasion
DE102015012172A1 (de) 2015-09-23 2017-03-23 Universität Kassel Thermisch aktivierbare, schnellhärtende Klebstoffbeschichtung
EP3950957A1 (en) 2017-08-08 2022-02-09 Depixus In vitro isolation and enrichment of nucleic acids using site-specific nucleases
FR3075820B1 (fr) 2017-12-21 2022-12-30 Paris Sciences Lettres Quartier Latin Molecule d'adn double-brin pour la detection et la caracterisation des interactions moleculaires
CN113330122A (zh) 2018-11-16 2021-08-31 德皮克斯公司 使用位点特异性核酸酶优化核酸的体外分离
ES2921401T3 (es) 2018-12-12 2022-08-25 Depixus Método de enriquecimiento de ácidos nucleicos usando nucleasas específicas de sitio seguido de captura
CN110396535B (zh) * 2019-05-08 2022-12-23 南开大学 单分子技术检测cgi序列甲基化调控cxxc结构域位点特异性结合的方法
EP4160199A1 (en) 2021-10-04 2023-04-05 Depixus Apparatus for biomolecule analysis with a well and a cavity below the well

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030027187A1 (en) * 1997-03-28 2003-02-06 Center National De La Recherche Scientifique (Cnrs) Apparatus and method for the manipulation and testing of molecules, and in particular of DNA
US20030166262A1 (en) * 1997-03-28 2003-09-04 Center National De La Recherche Scientifique (Cnrs) Apparatus and method for the manipulation and testing of molecules, and in particular of DNA
WO2010016937A2 (en) * 2008-08-08 2010-02-11 Ion Torrent Systems Incorporated Methods for sequencing individual nucleic acids under tension

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE48140T1 (de) 1981-04-17 1989-12-15 Univ Yale Modifizierte nukleotide und verfahren zu ihrer herstellung und anwendung.
IL73577A (en) 1983-12-12 1989-10-31 Miles Lab Method and reagent system for detecting dna or rna sequences in a test medium containing single stranded dna or rna using antibodies to intercalation complexes with double stranded nucleic acid
CA1223222A (en) 1984-02-22 1987-06-23 Nanibhushan Dattagupta Immobilized nucleic acid-containing probes
US4849077A (en) 1984-08-06 1989-07-18 Akademie Der Wissenschaften Der Ddr Process for solid phase-sequencing of nucleic acid fragments
CA2083173A1 (en) 1991-03-21 1992-09-22 Leonard J. Seaberg Element and method for nucleic acid amplification and detection using adhered probes
FR2703693B1 (fr) * 1993-04-06 1995-07-13 Pasteur Institut Procédé rapide de détermination d'une séquence d'ADN et application au séquençage et au diagnostic.
FR2760024B1 (fr) * 1997-02-21 1999-05-14 Centre Nat Rech Scient Procede de caracterisation de duplex d'acide nucleique
AU746135B2 (en) 1997-02-25 2002-04-18 Ludwig Institute For Cancer Research PARG, a GTPase activating protein which interacts with PTPL1
NO986133D0 (no) 1998-12-23 1998-12-23 Preben Lexow FremgangsmÕte for DNA-sekvensering
US20060275782A1 (en) 1999-04-20 2006-12-07 Illumina, Inc. Detection of nucleic acid reactions on bead arrays
WO2003066896A2 (de) 2002-02-09 2003-08-14 Nanotype Gmbh Verfahren zum nachweis von mutationen
JP2008528040A (ja) 2005-02-01 2008-07-31 アジェンコート バイオサイエンス コーポレイション ビーズベースの配列決定のための試薬、方法およびライブラリー
JP5075834B2 (ja) * 2005-11-15 2012-11-21 ザ プロクター アンド ギャンブル カンパニー 天然由来のアルキル若しくはヒドロキシアルキルスルフェート又はスルフォネート界面活性剤及び中鎖分枝状アミンオキシド界面活性剤を有する液体洗濯洗剤組成物
US7556922B2 (en) 2006-03-23 2009-07-07 The Board Of Trustees Of The Leland Stanford Junior University Motion resolved molecular sequencing
JP2011036150A (ja) 2009-08-07 2011-02-24 Olympus Corp 標的核酸分子の定量方法及び標的核酸分子定量キット
EP2390350A1 (en) 2010-05-27 2011-11-30 Centre National de la Recherche Scientifique (CNRS) Method of DNA sequencing by polymerisation
EP2390351A1 (en) * 2010-05-27 2011-11-30 Centre National de la Recherche Scientifique (CNRS) Method of DNA sequencing by hybridisation
JP6169603B2 (ja) 2011-12-22 2017-07-26 サントル、ナショナール、ド、ラ、ルシェルシュ、シアンティフィク、(セーエヌエルエス) 単一分子のハイブリダイゼーションおよび操作によるdnaの検出および定量法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030027187A1 (en) * 1997-03-28 2003-02-06 Center National De La Recherche Scientifique (Cnrs) Apparatus and method for the manipulation and testing of molecules, and in particular of DNA
US20030166262A1 (en) * 1997-03-28 2003-09-04 Center National De La Recherche Scientifique (Cnrs) Apparatus and method for the manipulation and testing of molecules, and in particular of DNA
WO2010016937A2 (en) * 2008-08-08 2010-02-11 Ion Torrent Systems Incorporated Methods for sequencing individual nucleic acids under tension

Also Published As

Publication number Publication date
KR20130118229A (ko) 2013-10-29
CN103052718A (zh) 2013-04-17
HK1183911A1 (zh) 2014-01-10
IL223257A (en) 2017-08-31
WO2011147931A1 (en) 2011-12-01
JP6325027B2 (ja) 2018-05-16
AU2011257229B2 (en) 2015-07-09
JP2013526870A (ja) 2013-06-27
US9512476B2 (en) 2016-12-06
US20130137098A1 (en) 2013-05-30
EP2390351A1 (en) 2011-11-30
EP2576818B1 (en) 2015-05-06
IL223257A0 (en) 2013-02-03
EP2576818A1 (en) 2013-04-10
AU2011257229A1 (en) 2013-01-10
CA2800639A1 (en) 2011-12-01
HUE025175T2 (en) 2016-01-28
CA2800639C (en) 2019-09-10
KR101769893B1 (ko) 2017-08-21
JP2017012171A (ja) 2017-01-19
US9765394B2 (en) 2017-09-19
ES2542429T3 (es) 2015-08-05
US20170037466A1 (en) 2017-02-09
PL2576818T3 (pl) 2015-10-30
DK2576818T3 (en) 2015-07-06

Similar Documents

Publication Publication Date Title
CN103052718B (zh) 通过杂交的dna测序方法
CN103097551B (zh) 通过聚合的dna测序方法
US12018317B2 (en) High throughput oil-emulsion synthesis of bowtie barcodes for paired mRNA capture and sequencing from individual cells
Mustafa et al. A force sensor that converts fluorescence signal into force measurement utilizing short looped DNA
CN104250645B (zh) 一种rna片段及其制备方法和用途

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: ECOLE NORMALE SUPERIEURE UNIVERSITE PIERRE ET MARI

Free format text: FORMER OWNER: ECOLE NORMALE SUPERIEURE

Effective date: 20150612

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20150612

Address after: France

Patentee after: National Center for scientific research

Patentee after: Ecole Normale Superieure

Patentee after: Univ Paris Curie

Address before: France

Patentee before: National Center for scientific research

Patentee before: Ecole Normale Superieure