CN103249843B - 测序方法 - Google Patents

测序方法 Download PDF

Info

Publication number
CN103249843B
CN103249843B CN201180057746.0A CN201180057746A CN103249843B CN 103249843 B CN103249843 B CN 103249843B CN 201180057746 A CN201180057746 A CN 201180057746A CN 103249843 B CN103249843 B CN 103249843B
Authority
CN
China
Prior art keywords
probe
bead
base
polynucleotide
test
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201180057746.0A
Other languages
English (en)
Other versions
CN103249843A (zh
Inventor
贾尔勒·科特斯巴克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GENESEQUE AS
Original Assignee
GENESEQUE AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GENESEQUE AS filed Critical GENESEQUE AS
Publication of CN103249843A publication Critical patent/CN103249843A/zh
Application granted granted Critical
Publication of CN103249843B publication Critical patent/CN103249843B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供了对单一多核苷酸测序的方法,其中在测序期间插入的核苷酸碱基和/或探针用珠粒标记,检测该珠粒以便识别结合至单一多核苷酸的碱基和/或探针。特别地,使用包含提供有用于检测珠粒的装置的表面的设备,可以进行珠粒的检测,例如提供有一种或多种光敏元件。

Description

测序方法
本发明涉及一种对多核苷酸进行测序的新方法,其中使用珠粒作为标记来识别多核苷酸中的碱基。
已经通过各种方法进行多核苷酸测序多年,并且已经提供了大量关于不同物种基因组的信息。尽管人类基因组已经被测序,但是为了识别遗传倾向性或者遗传性疾病或基因相关的疾病,仍非常关注测序。因此,对突变的定位以及组织特异性mRNA产生和表达分析给予了很大的关注。另外,还关注来自其它物种的基因组的测序,即从头测序(denovosequencing)。
自20世纪80年代年起,传统上通过使用Sanger双脱氧法(Sanger、Nicklen和Coulson,Proc.Natl.Acad.Sci.USA,1977,74,5463-7)进行DNA测序。其是一种基于克隆DNA(该克隆DNA首先被酶处理)的电泳过滤的多分子方法。酶处理通过使用荧光标记的双脱氧NTP和dNTP的混合物来中断聚合作用而产生单链DNA,其中双脱氧NTP终止链的延伸,而dNTP不能终止链的延伸。因此,利用这种方法获得了不同链长的混合物,其中每一个DNA链的长度代表碱基位置并且所连接的荧光团的颜色代表3′端碱基的特性(identity)。这些特性被表示为排列的彩色圆点,排列成一条线的圆点代表一个DNA序列。然而,Sanger测序法需要使用多条链并且仅可对约1000个碱基进行测序。
也使用了Maxam等人(Proc.Natl.Acad.Sci.,1977,74,560-4)的化学降解法以用于DNA测序,该方法涉及在特异性核苷酸处切割核苷酸序列,导致产生不同长度的链,其中每一个长度指示在该位置处存在特定的核苷酸。因此,化学降解法还需要链的电泳分离以用于序列确定。
因此,Sanger的链终止法与Maxam的化学降解法都需要产生一组或多组标记的DNA片段,其中每一DNA片段终止于特定的核苷酸碱基。这些片段必须按大小分离以便确定序列,并且因此所使用的电泳凝胶必须能够通过单一核苷酸来区分大量大小不同的片段。如上文讨论的,这限制了能够在一次测序中测序的DNA链的大小。
现有技术中已经提出了对链终止法的修改,例如通过组合酶切阶段与读出阶段。因此,代替以电泳过滤器上的位置来表示的碱基位置,通过在特定位点处及时进行读取来提供碱基位置。因此,能够实时地读出序列。使用该原理的第一种技术被称为焦磷酸测序(Ronaghi、Uhlen和Nyren,Science,1998,281,363-365),其不使用荧光团而使用荧光素酶,当被释放自聚合步骤(其中每次提供一个核苷酸)的焦磷酸盐间接地触发时产生光。来自该步骤的光产生远低于荧光团产生的光,因此依然需要克隆DNA以使得每一聚合步骤产生足以用于保证检测的光。这种方法可以处理长度为400个核苷酸的DNA,但是并不十分适合用于检测序列中的均聚物(同聚物,homopolymer),即相同核苷酸的重复。
其它实时方法包括通过合成(该合成能够被用于多分子或单分子测序)来测序、通过连接(用于多分子测序)来测序、以及通过逐步连接和切割(用于多分子测序)来测序。通过合成的测序涉及使用被添加至固定的靶DNA序列的荧光团标记的终止核苷酸碱基。因此,通过聚合作用在每个循环中将单一终止核苷酸碱基插入到靶DNA序列中,然后通过其荧光团标记的特性来确定该碱基。一旦获得读取结果,就可将该终止碱基化学中和,以使得聚合作用得以继续进行。此外,碱基与标记之间的脂质链(脂链)可以被化学或光化学切割,以便除去先前结合的标记以使得能够读出随后结合的标记。
通过连接进行的测序包括将荧光团标记的探针连接至未知的序列,其中通过能够与其连接的探针的序列来确定该序列。此外,通过逐步连接与切割进行的测序(Brenner等,US5,714,330,通过引用将其结合于本文)涉及稍加变化的方法的集合,该方法基于探针的使用,该探针具有核酸酶识别位点,该核酸酶的切割位点与识别位点不同(分开)。因此,可以通过与其结合的探针序列或通过连接于插入到DNA序列中的核酸碱基的标记来测定该DNA序列,然后探针中的核酸酶识别位点能够诱导待测定的DNA序列的切割以释放探针和/或结合的核苷酸以缩短序列,从而能够测定其后的(一个或多个)核苷酸。
然而,上文描述的测序方法都有其局限性。一些方法导致“相移”(“dephasing”)或异步性(asynchronism),这种“相移”或异步性产生结果的拖尾现象(smearing),这限制了可被测序的链的长度。其他方法具有长读取时间。现有技术中为了越过(address)这些局限性而尝试使用的替代方法需要使用昂贵的设备(例如高数值孔径激光扫描共焦显微镜)或由于延迟(stalling)而仅限于读出短序列,延迟的发生是由于使用修饰的核苷酸。因此,需要一种不需要使用昂贵的设备并且能够对长链进行测序的测序方法。
现在本发明人提供了一种新型测序方法,其中在测序反应中使用珠粒作为标记。因此,在本发明中,用珠粒标记可插入的碱基和/或探针,该碱基和/或探针包含一个或多个互补于待测定的靶多核苷酸中的碱基或序列的碱基。如下文中描述的,能够很容易检测已插入到多核苷酸中的连接于碱基或探针的单一珠粒的存在,这使得能够识别已结合的互补碱基和/或探针,并且因此识别在多核苷酸中碱基和/或探针结合的碱基或序列。与现有技术和传统上使用荧光团标记的测序方法相比,在测序反应中使用珠粒作为标记提供了很多优点。首先,珠粒容易检测,因为它们比荧光团大,这使得它们能够被应用在单分子测序中。此外,当使用珠粒作为标记时不再存在低信号水平问题。而且,不需使用昂贵的设备来检测珠粒,例如在集成电路中使用电子珠检测装置或基于光或磁性来检测珠粒。可以从反应中容易且快速地除去珠粒,尤其是当珠粒是顺磁性时,并且因此当使用珠粒标记时不存在噪声问题,这与荧光标记相反。此外,可以使用机械切割,从而避免了如一些现有技术测序方法中需要的化学除去。
之前没有人提出过将珠粒用于标记与待识别的碱基或序列互补的核苷酸或探针,其中在反复测序反应期间该核苷酸或探针结合至靶序列。尤其是,之前没有披露过使用单一珠粒作为标记来确定反复测序反应中的多核苷酸中的特定位置处的一个或多个核苷酸的特性,尤其是当靶分子的序列未知的时候。
Stahl等人(Genomics,2007,90,741-745)使用链霉亲和素包被的珠粒来检测杂交至固定于阵列的寡核苷酸的生物素标记(生物素化,biotinylated)的DNA。可在PCR期间用生物素标记DNA或者在杂交至阵列上的互补寡核苷酸之后利用蛋白酶介导的等位基因特异性延伸反应(PrASE)随后标记DNA,其中使用了生物素化的核苷酸并且将其结合于表面连接的具有匹配的3’末端的寡核苷酸。
还提出了联合使用链霉亲和素包被的珠粒与PrASE反应用于测序。然而,该方法需要在阵列上的单一位点处固定四种不同的寡核苷酸,其中每一种寡核苷酸的末端碱基是不同的。然后添加待测序的PCR产物,使得3’末端仅与一种寡核苷酸完全杂交(perfecthybridisation)。然后利用生物素化的核苷酸进行PrASe反应,其中仅有具有3’端完全(perfectly)匹配的寡核苷酸发生延伸。加入多重链霉亲和素包被的珠粒使得延伸的产物能够可视化。
相对于本发明,该方法具有一些缺点并且采取了不同的程序进行测序。首先,为了识别Stahl等人所述的单一核苷酸,需要产生杂交至靶DNA的4种不同寡核苷酸探针。因此,如果需要识别多核苷酸中的若干种核苷酸时,就需要生产许多不同的寡核苷酸(即,每一个位置需要4种)。在所提供的示例性实施例中,5个碱基通过结合至寡核苷酸而被重新测序,其中4个碱基是野生型的而一个碱基不同于野生类型序列。因此,产生了反映20种可能的排列(permutation)的20种空间分离的寡核苷酸。这需要知道它们产生的野生型靶序列。因此,如果序列是未知的并且该检测不能被用于重测序或用于检测多态性,则需要产生大量的测试寡核苷酸以涵盖所有碱基的可能排列,该碱基在靶序列中与寡核苷酸结合。本发明提供了一种不同的测序方法,其中可用珠粒来标记待结合的核苷酸碱基和/或探针,该核苷酸碱基和/或探针与待确定的碱基或序列互补。在该方法中,仅需要4种珠粒标记的寡核苷酸用于对任何位点与任何序列的组合进行测序,而不必知晓野生型。
没有人提出反复测序或可以利用Stahl等人的方法,即循环利用相同分子的测序来对连续的核苷酸进行测序。本发明通过在每个循环期间或每个循环结束时除去珠粒使得能够实现相同分子的重复测序。
另外,与在Stahl等人所述中使用大量的阵列点以使得对单一多核苷酸进行测序相比,本发明仅需要在多核苷酸中存在单一珠粒就能识别特定的(一个或多个)碱基。对单一分子进行测序的能力省去了任何克隆步骤且不需进行扩增。这使得为了获得序列所需要的工作减少,并且进一步防止向多核苷酸中引入不必要的错误。
因此,本发明人首次使用珠粒来标记核苷酸或探针,其识别与其互补的碱基或序列,以便能够通过聚合酶、连接酶或逐步连接(分步连接,stepwiseligation)与切割过程来进行测序。
第一方面中,本发明提供了一种用于确定固定在固体载体上的单一多核苷酸的核苷酸序列的方法,包括以下步骤:
(i)使所述多核苷酸与至少一种测试互补碱基和/或至少一种探针接触,该探针包含可与所述多核苷酸中的一个或多个碱基互补的部分,珠粒连接至至少一种测试互补碱基和/或至少一种探针或者结合对的第一结合伴侣连接至至少一种测试互补碱基和/或至少一种探针,并且当所述测试互补碱基和/或所述测试互补探针的部分与所述多核苷酸中的所述一个或多个碱基互补时,所述的测试互补碱基和/或探针共价结合于所述多核苷酸;
(ii)当结合伴侣连接至所述测试互补碱基和/或探针时,将连接至所述结合对的第二结合伴侣的珠粒结合至所述测试互补碱基和/或探针,所述第一结合伴侣通过所述结合对连接至所述测试互补碱基和/或探针;
(iii)可选地使用至少一种不同的测试互补碱基和/或探针重复步骤(i),或步骤(i)和步骤(ii),直到与所述一个或多个碱基互补的测试碱基和/或一部分与所述一个或多个碱基互补的测试探针结合至所述多核苷酸;
(iv)通过确定在步骤(i)至步骤(iii)期间连接至所述测试互补碱基和/或探针的所述珠粒是否结合到所述多核苷酸,来确定哪一测试互补碱基和/或测试探针的互补部分结合至多核苷酸的所述一个或多个碱基,从而识别该多核苷酸的所述一个或个碱基;并且
(v)如果在步骤(iv)期间未除去该珠粒,则除去所述珠粒;
其中,步骤(i)至步骤(v)的每一个循环进行一次或多次,并在每一个循环中识别所述序列的一个或多个碱基。
在一个优选的方面,多于一次地重复步骤(i)至步骤(v),即进行多于一次循环,如下文中讨论的优选至少2个循环。在一个尤其优选的方面,重复所述步骤以用于所有测试碱基或探针组。
因此,本发明的方法确定了特定的珠粒标记的核苷酸或探针是否已插入到待测序的多核苷酸中,其中珠粒的结合指示特定的测试互补核苷酸或探针的插入,并且因此能够识别在多核苷酸中与其结合的序列。待识别的所述一个或多个碱基可以是与测试探针结合的一个或多个碱基和/或与测试碱基结合的一个碱基。
如本文中使用的,术语“确定核苷酸序列”是指部分序列和全长序列的确定。(该措词可与“识别”序列中的一个碱基或多个碱基互换使用。)确定核苷酸序列包含任何序列长度,因此,通过该方法可以确定至少一个核苷酸碱基,但优选地可确定多于一个核苷酸,例如可以确定至少2、3、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、4000、6000或10000个或更多个核苷酸。因此,优选地实施该方法的步骤(即每一个循环)至少2、3、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、4000、6000或10000次,或者如果在每一个反复循环中确定多个碱基时则按比例减少循环次数。
确定核苷酸序列包括识别特定位点(A、T/U、G或C)处的具体碱基,即完全的识别或提供那个碱基的部分识别,例如该方法可以识别一组碱基,或识别由该碱基的选项(options)组成的一组少于4个(即3个或2个)的碱基,例如A或T而不是G或C,或者A、T或G而不是C。可替换地,部分识别提供了碱基特性的信息,当该碱基与所获得的信息结合时(例如在其它循环中)能够完全识别该碱基。当在每一个循环中识别(即读取)多于一个碱基时,即当探针组中与靶接触的没有完全降解的探针碱基的数目为两个或更多时,循环中的这种部分识别是尤其有用的。如果“步长”,即每一个循环中处理的碱基数目少于在读取中所涉及的碱基数目时(例如,每个循环识别两个碱基,但是靶序列在一次仅处理一个碱基(如被缩短),例如在下个循环之前,在逐步连接中的切割可以从靶序列中除去单个碱基),所获得的部分识别是尤其有用的。可以使用从重叠读取获得的信息的组合以便毫无疑义地或足够无疑义地获得有用的序列,尤其是当作为测序材料来源的个体属于某一物种(该物种的基因组图谱是已知的),并且测序的目的主要是单核苷酸多态性(SNP)数据时。事实上每一个碱基参与至少两个读取循环,其与探针组中探针序列的正确组合,可被用于提高信息水平以提高数据质量,例如在一个实例中用于识别连接酶对其具有最低的选择性和较高的确定性,而无需使用大量的探针组的碱基。
因此,举例而言,为了在每一个循环中识别两个碱基(但是一个碱基的步长),可以使用4个探针组而不是16个探针组,并且当基因组图谱已知时,在几乎所有的情况下,仍然可以较高质量的SNP数据来识别碱基序列。在这种情况下,尽管没有区分,但是在每一个探针组中存在4种不同类型的探针。因此,在第一循环中能够确定,基于包含其结合的探针的探针组,靶向二碱基序列具有4种可能性。在下一个循环中,可以识别靶向二碱基序列的类似的4种可能性。然而,由于测序反应步骤在两个循环之间仅推进(forward)一个碱基,因此在这两个循环中读出相同的碱基。随着测序继续进行以识别序列,通过识别在随后的循环中根据所显现的信息来确定的4种可能性中的哪一种的结合是正确的,能够结合并改善该重叠信息。
类似地,当读取循环中涉及3个碱基,但步长仅为一个碱基时,可以使用例如9个探针组来代替64个探针组。由于在这种方式中的所有碱基均已包含在3个读取中,因此在大多数情况下会检测到单个读取错误,尤其是在基因组图谱已知的情况下。另外,使用正确构成的探针组经常还可以检测到两个错误,尤其是在那些连接酶是最小特异性的情况中,即对于T4DNA连接酶而言是T/G特异性。
因此,如本文中提到的“循环”是指实现将测试碱基或探针与靶序列结合需要的步骤,其中进行上述步骤(i)至步骤(v)并且在该循环结束时识别所述碱基(一个或多个)可以是部分的或完全的。
此外,“确定核苷酸序列”包括对已知核苷酸序列进行重新测序,以及序列比对和已知序列中的多态性和突变研究。另外,“确定核苷酸序列”可包括确定序列中四种类型核苷酸的一种、两种或三种的位置,例如,仅期望确定序列中的胞嘧啶的位置,以及识别4种核苷酸碱基中的任一种或全部在序列中的位置。
该“多核苷酸”可以是任何多核苷酸,但优选DNA或RNA序列,其序列以本发明的方法确定。通常,在经历测序之前,使RNA序列经历逆转录以产生拷贝DNA(copyDNA)。可替换地,如果在本发明的方法中直接使用RNA序列,则可以使用逆转录酶/RNA聚合酶或RNA连接酶而不是DNA聚合酶或DNA连接酶(其应用于DNA序列),如下文进一步讨论的,结合互补碱基或探针。多核苷酸序列还可以是任何长度,但是包括至少两个核苷酸碱基,并且通常为至少3、4、5、6、7、8、9、或10个核苷酸碱基。例如,利用本发明可以检测至少100、200、300、400、500、600、700、800、900、1000、2000、4000、6000或10000个碱基的多核苷酸序列。
如本文中提到的,“单一”多核苷酸是指通过本文所述的方法用于测序的单一分子。利用该方法可以对所期望的多于一个分子同时测序,但是该情况中通过珠粒分析来识别每一单一多核苷酸的(一个或多个)碱基。该方法依赖于珠粒的使用,以产生即使在仅存在一个珠粒时可检测到的信号。
如本文中提到的,“固定”是指直接或间接地固定于载体,例如通过结合于另一个结合至载体的分子。如下文中描述的,可以通过化学偶联来实现直接固定,并且例如可以通过结合伴侣偶联来实现间接固定,例如通过杂交至互补的寡核苷酸,例如通过连接分子。优选这种形式的间接偶联。
杂交之后可以进行连接,以便避免在高温下或施加力时释放靶多核苷酸,尤其是在杂交区域较短的情况下。
“固体载体”可以是任何固体载体,例如载片(如玻璃载片)、微阵列、微粒等,但是尤其可以是如下文中进一步描述的用于检测珠粒的装置,如PCT/GB2010/00324中识别的,将其通过引用结合于本文(即用于光学检测或用于磁检测的芯片)。可以根据需要调整固体载体(例如芯片)以便能够适当地结合靶多核苷酸,例如在特异性位点结合以便能够实施该方法并且检测该珠粒。
如上文中讨论的,测试互补碱基或探针结合至待确定其序列(靶序列)的多核苷酸。因此,优选地,本发明的多核苷酸序列可以至少部分地为单链以便允许互补碱基或探针的结合。尤其是,该多核苷酸序列可以是具有5’端连接至待确定其序列的多核苷酸部分的互补寡核苷酸序列的单链,提供能够延伸的引物多核苷酸序列,例如通过聚合作用进行互补碱基结合。可替换地,多核苷酸可以大部分为双链,例如,具有单链突出(protrusion)的双链或几个核苷酸碱基的部分(如2、3、4、5、6、7、8、9、10个或更多的核苷酸碱基),探针可以通过连接(例如具有互补重叠的互补双链探针)与其结合。如下文讨论的,探针可以是单链或者可以是具有单链突出的双链,其可与多核苷酸序列中的单链突出的一部分或全部结合。
本文中提到的“接触”是指在测试探针或碱基具有互补于多核苷酸中的一个或多个碱基的碱基时,在能够形成互补碱基对结合的条件下,使多核苷酸与测试碱基或探针接触。
共价结合可以通过使得碱基或探针与多核苷酸序列中的其互补序列结合的任何方法或技术来实现。在一种优选的实施方式中,通过聚合作用或通过连接作用来实现碱基或探针的共价结合。具体地,通过聚合作用插入单个碱基,例如使用DNA或RNA聚合酶、或转录酶/逆转录酶,并且通过连接作用插入或结合探针。这样插入碱基或探针将以5′至3′或3′至5′方向延伸多核苷酸。
如本文中使用的,“连接”是指在模板驱动的反应中,两个或多个核酸的末端之间形成共价键或连接,其中该连接可以酶促方式或化学方式发生。可以利用DNA连接酶(对于DNA序列)和RNA连接酶(对于RNA序列)来实现连接。
如本文中使用的(可互换使用),术语“碱基”或“核苷酸”包括天然核苷酸腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶和尿嘧啶,尤其是以2’-脱氧形式存在,或以相同的方式起作用的非天然核苷酸,即与天然核苷酸一起形成互补碱基对,并且能够通过聚合作用或连接作用被插入多核苷酸序列中。
对于“互补碱基”,是指与多核苷酸中待识别的碱基进行特异性碱基匹配的碱基。因此,如果多核苷酸中待识别的碱基是胸腺嘧啶,则插入的互补碱基为腺嘌呤,或者如果多核苷酸中待识别的碱基是胞嘧啶,则插入的互补碱基为鸟嘌呤,反之亦然。
探针中“与所述多核苷酸中的一个或多个碱基互补”的“部分”是指当它们互补时能够与靶多核苷酸结合的一个或多个核苷酸或碱基的序列。
“测试”互补碱基或探针是指探针或碱基可以表现出所期望的与靶序列的互补性。如在下文中描述的,可能存在有限数量的排列,例如对于单个碱基仅可能存在4种排列。使用测试碱基或探针以存在不同的排列,从而确定碱基或探针是否与靶序列互补并且因此结合于靶序列。不存在所期望的互补的测试碱基或探针不能结合于靶序列。
如本文中提到的,所述“至少一个测试”碱基或探针使得能够同时包含多个不同的碱基或探针(如2、3、4、5、7或8个或更多的碱基或探针)。这种不同的碱基或探针在与研究中的一个或多个碱基互补的碱基或探针部分中是不同的。在这种情况下,可通过使用可被区分开的珠粒或选择性释放连接于不同探针的珠粒来实现已结合于靶多核苷酸的碱基或探针的识别。可替换地,如在上文中讨论的,可以获得探针的特性的部分信息,可将其与在随后的循环中获得的信息结合。
该探针可以包含至少2、3、4、5、6、7、8、9、10、15、20、25、30、40或50个核苷酸。在该探针为双链探针的情况下,每一条链可以包含这一数量的核苷酸。
该探针可以为单链或可以至少部分地为双链,这取决于该探针被使用的具体方法。如下文所述,在通过连接方法进行的测序中使用的探针可以是单链,而在通过逐步连接和切割方法进行的测序中使用的探针可以至少部分地为双链。在这方面中,该探针可以是具有突出的单链部分的双链,例如至少1、2、3、4、5或6个核苷酸碱基的突出的单链部分,其可以与多核苷酸序列的全部或部分突出单链部分互补。因此,探针的突出链是否是5′末端或3′末端并不是关键的,只要其能够连接至多核苷酸的突出链即可。优选地,该多核苷酸和该探针的突出链形成完全匹配的双链。该探针可进一步包含核酸酶(限制酶)的核酸酶识别位点,其使核酸酶能够在远离该识别位点的位置处进行切割。优选地,对于在下文中的逐步切割和连接反应中的使用,所述核酸酶是IIb型限制酶,优选AloI、ArsI、BaeI、BarI、BpiI、Bsp24I、FalI、Hin4I、NmeDI、PpiI、PsrI或TstI,或IIs型限制酶,优选AarI、Acc36I、AceIII、BbsI、BfuAI、BtgZI、Eco31I、EcoO441、EspI、FokI或LweI。
例如,核酸酶识别位点使得核酸酶能够从核酸酶识别位点上游和/或下游至少1、2、3、4、5、6、7、10、15或20个碱基处切割。这被认为是切割酶的“有效范围(reach)”。在下文中所述的连接和切割方法中,优选所述核酸酶在切割上产生长突出端(overhang)(单链区域)以用于下一个循环。在这方面,尤其是所述核酸酶是IIb型限制性位点,其在切割后产生5-bp的突出端。
如上文讨论的,涵盖靶序列中的所有排列的测试探针之一的一部分与该多核苷酸中的一个或多个碱基互补。因此,该探针应该能够被连接至多核苷酸,以使得该探针能够结合在其中。因而识别多核苷酸中一个或多个碱基是可能的。在任意探针的单链部分中发现互补于一个或多个碱基的相关测试探针的一部分,即可以连接至多核苷酸的部分。在部分双链探针中,在单链突出部中发现了互补部分。优选地,探针的单链部分与多核苷酸中的相应区域具有100%的互补性,尽管这并不是必需的。例如,在其中使用探针仅识别单一核苷酸的实施方式中,完全的碱基匹配仅是识别特定核苷酸所必需的。一般地,在这种情况下,所结合(例如连接至多核苷酸)的测试探针的末端核苷酸将与多核苷酸中待识别的碱基互补,尽管该互补核苷酸可能不是位于探针的末端。
在每一个循环中,如果多核苷酸中的待识别的核苷酸多于一个,则成功连接至多核苷酸的探针的至少2、3、4、5、6个(等等)核苷酸将与多核苷酸中的那些核苷酸互补。如在下文中讨论的,在这种情况下,需要产生足够的探针以涵盖每一种排列。
可以对每一个与多核苷酸成功连接的测试探针进行测试,以便能够识别连接的探针并因此识别多核苷酸中靶核苷酸的序列。
因此,虽然在一种优选实施方式中,成功连接至多核苷酸的探针的单链部分可以与该多核苷酸100%互补,但该探针的单链部分可以仅与其共享至少80%、90%或95%互补性。
如本文中提到的,“探针组”是指一组探针,需要该探针组来识别存在于靶序列中的可能排列之一。在本发明的方法中,可以使用探针组作为测试探针(例如当使用多于4种探针时,例如当在每个循环中识别2个碱基时产生4个探针组,并且可以例如基于珠粒类型或切割特性来识别每一组中的探针),并且因此如本文中所述的探针包括探针组。如果仅要识别单个碱基,也可以产生一个探针组,以使得测试探针能够结合于未知的靶序列。产生每一种排列的探针组,但如果每一组探针在与靶接触后是可区分的,例如经由其标记或释放,也可以一起使用这些探针组。如果仅对靶多核苷酸中的一个碱基进行测序,则仅存在4种可能排列并且在该情况中应当仅产生4组探针。如果同时对两个碱基进行测序,则在该情况中可能存在16种排列并且应该产生16组探针以便具有完全的特异性。
优选地,探针中碱基的数目(或探针的单链部分)高于数目读取,例如在仅确定第一碱基的特性的循环中可以使用5个碱基的探针。在每个循环中,当探针(或其中的单链部分)长度大于待测序的碱基的数目时,为了能够与靶序列结合,需要变化不与待测序碱基互补的碱基。因此,在这些位置处可以使用简并碱基(degeneratebase)或摆动碱基(wobblebase)。因此,例如,如果仅确定单个碱基,但是探针(或探针的单链部分)的长度是6个碱基,则应在5碱基位置处使用简并碱基或摆动碱基。在这种情况下,可能存在4种排列,但是对于每一种排列都需要一组涵盖简并碱基的探针。因此,在这种情况下,这4种探针组包括ANNNN、TNNNN、CNNNN和GNNNN,其中这些组中的每一个含有4×4×4×4=256种不同的探针。提供的探针组在未被读取的位置中是简并的。在这种情况下,例如通过连接方法测序所使用的,来自该方法的读取值(readout)将是每个第五位置处存在的碱基。为了识别插入的4个碱基,通过释放合成的链并在另一起点处重新开始实施该方法来重复该反应,以便将该序列总共进行5次以提供完整序列。当与逐步连接和切割方法一起使用时,在每个循环中进行一个或多个碱基的读取,这取决于切割酶的有效范围。
使用直接珠粒结合,优选每一组探针存在相同的珠粒上。不同排列的每一组探针可以存在于不同的珠粒上,或者如果该探针能够通过不同于珠粒信号的手段区分,则也可以存在相同的珠粒上,例如通过对于珠粒释放必需的条件(例如,如果每一种排列的探针具有不同机制,该机制能够用于珠粒的释放,例如使珠粒连接至探针的特异性限制性位点)。
如上文讨论的,在需要逐步连接与切割的测序方法中可以使用具有单链突出的部分双链探针。在该方面,在双链部分中,该探针可包含核酸酶识别位点。在该方法中,探针可以携带用于识别多核苷酸中的互补核苷酸的珠粒。可在将探针(如果是互补的)连接至靶多核苷酸(即在切割之前)时评价该珠粒的存在和/或使切割反应能够发生,从而释放该珠粒并使得能够对释放进行检测或使得其不存在于靶多核苷酸。
同时,在优选的方面中,该探针包括与一个或多个待检测核苷酸互补的一个或多个互补核苷酸,该方法还包括使用珠粒标记的核苷酸和探针,可以将该核苷酸和探针连接至核苷酸以提供核酸酶识别位点。在该情况中,可以评价珠粒的结合以知晓该珠粒是否在切割之前和/或在切割之后作为释放的探针的一部分或通过切割在一个或多个释放的核苷酸上连接至靶多核苷酸。
结合至多核苷酸的碱基或探针可以具有终止效应,以防止进一步延伸或将其他的碱基或探针结合到序列中。因此,该碱基可以是双脱氧核苷酸或者该探针可以在末端位置具有这样的碱基。这样的碱基仅在最终测序循环中是适合的,因为引入该核苷酸导致了永久的终止。对于终止,在序列反应期间和最后循环之前,可以使用替换的已知可逆的修饰。在这种情况下,在借助于连接至碱基或探针的珠粒来检测结合的碱基或探针之后,该终止效应就能够被化学中和,使得碱基或探针能够进一步插入或结合于多核苷酸序列。在本领域中,这种类型的终止是已知的,例如3′OH基团的修饰(例如Jingyue等人,US2004/0185466,图14)。在循环结束时,可以切割这些终止基团以使聚合反应能够继续(参见,Jingyue等人:PCT/US02/09752,该专利涉及用于此方法的合适的试剂)。在加入探针以用于例如连接方法的情况中,这些探针基本上终止该反应(例如,在连接切割方法的情况下直至发生切割反应或通过使用探针用于特异性序列),并且因此在所述探针上不需要终止核苷酸,但可以使用终止碱基,如其中5′是去磷酸化的。通过使用合适的激酶可以将其重新引入下一个循环。
可以通过切割标记的探针来除去探针的终止效应,例如在涉及逐步连接和切割步骤的方法中,通过核酸酶(例如限制酶如核酸酶或RNA内切酶)进行切割。
在一个优选的方面,如果选择其直径大于靶多核苷酸长度的珠粒,则互补的探针或碱基的结合可以具有终止效应。在该情况下,携带探针或碱基的第二珠粒不能接近该靶多核苷酸,其基本上终止了任何进一步的延伸或结合。以这种方式甚至可以正确识别同聚体,条件是珠粒上的碱基是这样放置的,使得两个连续的碱基不能结合在来自相同珠粒的相同靶上。利用这种方法的一个优点是不需要液体交换,或者可以直接地再利用该液体。
如果由于缺少互补性而使多核苷酸与不能结合的测试碱基或探针接触,则可以使用不同的测试探针(即,具有不同的测试互补碱基或探针部分)直至测试碱基或探针与该多核苷酸结合,即,可以进行步骤(iii)。如在下文中描述的,在该方法期间,可以在不同的点,尤其是在任何测试碱基或探针与该多核苷酸接触之前和/或之后,和/或在珠粒的释放和除去之前评价珠粒是否与多核苷酸结合。
如本文中定义的,“通过确定在步骤(i)至步骤(iii)期间...所述珠粒是否与所述多核苷酸结合来确定哪个测试互补碱基和/或测试探针的互补部分结合...”是指评价在步骤(i)至步骤(iii)期间所述珠粒的存在或不存在或来自与靶多核苷酸相关的所述珠粒信号水平,其指示了该测试碱基或探针结合至多核苷酸。如在本文中使用的,“结合”于所述多核苷酸的所述珠粒经由测试探针或碱基的中间性(intermediacy)来结合。
在步骤(i)至步骤(iii)期间,可以在不同的时间评价该珠粒的存在或不存在或信号水平以便能够测定,例如(a)在任意结合之前可以进行评价(即在步骤(i)开始时),(b)在任意步骤(i)、(ii)或(iii)之后评价珠粒结合以确定珠粒是否与该多核苷酸结合,和/或(c)在释放并除去该珠粒之后评价珠粒结合。该评价可以是定量的或定性的。
例如在下文中描述的,优选地,在确定步骤(iv)期间除去该珠粒。然而,如果尚未除去珠粒,可以在步骤(iv)结束时除去该珠粒。确定步骤包括实现该确定的所有必需的动作,例如包括释放并除去该珠粒,除非这样的步骤是单独陈述的。
如上文所述,可以使用使得能够实现步骤(iv)的测定的各种不同的方案。可将携带测试探针至单一排列的其最简单珠粒添加至该靶多核苷酸,并且可以评价与所述靶结合的珠粒的存在以便确定该靶多核苷酸中是否存在该排列(即,特异性碱基)。然后,可释放并除去该珠粒,并且用携带测试探针至不同排列的珠粒重复该方法,直到通过该珠粒的结合作为证据来识别相关的排列。在这种情况下,原位检测该珠粒。在可替换的情况下,可以在释放时检测该珠粒。
可以使用这样的方法,其中珠粒的释放指示了在研究中的碱基(例如,当不同的探针组之间的区别特征是探针与珠粒的连接时),那么在相关条件下(例如使用正确的限制酶用于在一种排列中的探针和珠粒之间的限制性位点)释放该珠粒并且因此该珠粒的释放指示了(一个或多个)靶碱基。在这个优选的方面,所述测试探针或者珠粒与所述测试互补探针或互补碱基之间的连接包括限制酶的识别位点。
在使用不同珠粒的情况下,产生的信号类型可用来确定哪个测试探针已经结合。
优选地,为了提高准确性,在循环期间检测来自所述珠粒的信号水平,并且可以在各时间点进行比较。方便地,在假定的结合之前和/或之后和/或在释放和除去之后检测该信号。在一个尤其优选的方面,在其中通过切割来除去珠粒(如果结合)的方法中,在所述切割步骤之前和之后测量来自珠粒的信号,并且所述水平的减少指示了所述珠粒的结合,这使得能够借助于连接至所述珠粒的探针来识别靶标的一个或多个碱基。由于通过设计或默认切割反应可能是不完全的(例如连接或切割),因此这种方法是有用的。
如本文中提到的,所述珠粒的“信号”是取决于所使用的珠粒的性质而检测的信号,例如其磁性、旋光性、荧光、颜色等。
在上述的方法中,与珠粒相关的信号或信号水平指示了所研究碱基的存在或不存在。因此,在一个优选的方面中,通过确定存在或不存在与珠粒相关的信号或信号水平来进行步骤(iv),其中信号的存在是所述测试碱基或探针结合的指征。在进一步的优选的方面中,在切割步骤之前与之后确定与所述珠粒相关的信号水平,并且在切割之后信号减少指示了所述测试碱基或探针。
“除去所述珠粒”是指从该靶多核苷酸空间分离该珠粒,以便能够在结合相关的测试碱基或探针(所述珠粒所连接的)之后,将珠粒相结合的靶多核苷酸与珠粒已从其释放且被除去的多核苷酸区别。在释放珠粒之后除去,例如通过断裂一个或多个相关的键,在断裂之后能够自由地将珠粒从靶多核苷酸的位点除去。通过切割一个或多个键方便地实现释放,例如在珠粒和碱基或连接至珠粒的探针之间的键或结合(association)(例如,破坏结合对中结合伴侣之间的结合)或通过切割键使得能够一起除去珠粒以及与其连接的一个或多个碱基,例如在限制酶切反应中。如在下文中论述的,在释放该珠粒之后,例如可以通过磁体或流体流动来除去该珠粒。
在本发明的一个优选的方面中,可以使用束缚的(tethered)珠粒。可以将该珠粒连接至固体载体或连接至靶分子的一部分或其连接分子,条件是它不影响本文中所描述的测序方法。在该方法中,将束缚的珠粒而不是外部提供的珠粒与每一个靶相结合,这样它们具有更高程度的自由度直到将它们连接到结合至靶序列的探针/碱基。当通过探针/碱基结合至靶时,加入的自由度限制可以是由于与束缚相比更短的靶长度或者是由于与所联合的靶相比束缚(束缚体,tether)的定位,这导致相对于一些参考位置更短的距离和/或不同的定位,当该方法在表面中使用检测器时其可以作为检测点。
在这种类型的方法中,将测试碱基或探针结合至所述靶多核苷酸,并且携带结合伴侣以便使得束缚的珠粒(该束缚的珠粒携带该结合对中的另一个结合伴侣)能够结合至那些碱基或探针。然而,应当注意避免使碱基或探针与珠粒过多地直接结合,即,在供应时直接结合至该珠粒,而不是在珠粒被保持在远离靶处时首次结合至该靶子,然后随着珠粒移向靶多核苷酸或自由的被允许移动时使珠粒与该靶结合,从而到达该靶(即,每一个珠粒到达其自己的靶)。在很多情况下,在聚合或连接期间,使用最佳设计的液体(例如,对于链霉亲和素Dynabeads,使用“结合和洗涤液体”)的结合伴侣的结合比使用酶缓冲液的结合要快得多。
在使用束缚的珠粒的情况下,珠粒的除去涉及从靶多核苷酸除去该珠粒,以便能够接近探针或碱基从而在随后的步骤或下一个循环中结合。
在上述所描述的方法中,进行该步骤一次或多次,并在每一个循环中识别所述序列的一个或多个碱基。如在上文中提及的,循环涉及识别靶序列的一个或多个碱基需要的步骤。如果在单一步骤中靶多核苷酸存在所有互补碱基/探针的排列,其具有例如使得能够区别不同珠粒的检测,即,一起使用所有的测试探针/碱基,则可以通过仅进行一次该步骤来完成该循环。然而,如果并不是所有的测试碱基/探针都同时地存在以用于识别碱基或序列,则需要额外的步骤以便能够识别碱基或靶序列。在该情况下,该方法包括如上文给出的步骤,但是其中对于所使用的每一组测试碱基/探针进行步骤(i)(或步骤(i)和步骤(ii))、步骤(iv)和步骤(v),直到已经实现识别。如在上文指出的,一个或多个碱基的识别可以是完全的或部分的。
在本发明的一种实施方式中,本发明的方法包括聚合酶的使用与通过合成法进行的测序。
因此,在进一步的方面中,本发明提供了一种用于确定固定在固体载体上的单一多核苷酸的核苷酸序列的方法,包括以下步骤:
(i)使所述多核苷酸与至少一种测试互补碱基(其可以互补于所述多核苷酸中的碱基)接触,珠粒或结合对的第一结合伴侣连接至该测试互补碱基,并且当所述测试互补碱基互补于所述多核苷酸中的所述碱基时,通过聚合反应将所述测试互补碱基共价结合至所述多核苷酸;
(ii)当将结合伴侣结合至所述测试互补碱基时,将连接至所述结合对的第二结合伴侣的珠结合至所述测试互补碱基,通过所述结合对将所述第一结合伴侣连接至所述测试互补碱基;
(iii)可选地使用至少一种不同的测试互补碱基重复步骤(i)、或步骤(i)与步骤(ii),直到互补于所述碱基的测试碱基结合至所述多核苷酸;
(iv)通过确定在步骤(i)至步骤(iii)期间连接至所述测试互补碱基的所述珠粒是否结合至所述多核苷酸来确定哪一个测试互补碱基结合至多核苷酸的所述碱基,以便识别该多核苷酸的所述碱基;以及
(v)如果在步骤(iv)期间没有除去珠粒,则除去所述珠粒;
其中,步骤(i)至步骤(v)的每一个循环进行一次或多次,并在每一个循环中识别所述序列的一个碱基。
该方法还能够确定多核苷酸中的均聚物序列。优选地,所述方法在聚合酶如DNA聚合酶或RNA聚合酶存在下进行。优选地,如上所述的方法包括使用经修饰的碱基以便防止进一步的链延伸,并且在所述方法结束时优选采用额外的步骤,其中修饰所述碱基以便能够进一步的延伸,例如除去防止链延伸的保护基团。
在这种情况下,借助于连接至测试碱基的珠粒的存在能够确定测试碱基的结合。方便地,如果连续加入四种不同碱基(例如A、G、C、T)中的每一种,即,依次至多核苷酸,则在加入每种不同类型的碱基后研究珠粒存在或不存在的确定。以这种方式,通过连接于该处的珠粒的存在可以识别结合或插入碱基(并且因此识别多核苷酸中碱基匹配的碱基)。可替换地,如下文进一步详细讨论的,如果将所有碱基一起添加至多核苷酸,则用于四种碱基中的每一种,可以使用不同类型的珠粒作为标记。识别连接至插入在多核苷酸中的碱基的具体珠粒类型,例如珠粒大小或颜色,则可以指示出所结合的具体碱基。
作为通过合成进行测序,该方法通常是已知的(上述的Jingyue等)。在该测序方法中,使用碱基的珠粒标记以使得能够容易地识别所结合的碱基,而无需昂贵的设备。
为了避免延迟(stalling),并且能够读取长的部分序列,优选不依赖于聚合酶的方法的应用。
因此,在进一步的实施方式中,本发明包括优选使用连接酶通过连接反应将一个或多个探针结合至多核苷酸序列(通过连接反应来测序)。
因此,在进一步的方面中,本发明提供了一种用于测定固定在固体载体上的单一多核苷酸的核苷酸序列的方法,包括以下步骤:
(i)使所述多核苷酸与至少一个测试互补探针接触,该测试互补探针包含可以互补于所述多核苷酸中的一个或多个碱基的部分,珠粒或结合对的第一结合伴侣连接至该探针,并且当所述测试互补探针的所述部分互补于所述多核苷酸中的所述一个或多个碱基时,通过将所述测试探针连接至所述多核苷酸将所述互补探针共价结合至所述多核苷酸,;
(ii)当将结合伴侣结合至所述测试互补探针时,将连接至所述结合对的第二结合伴侣的珠粒结合至所述测试互补探针,通过所述结合对将所述第一结合伴侣连接至所述测试互补探针;
(iii)可选地使用至少一种不同的测试互补探针重复步骤(i)、或步骤(i)与步骤(ii),直到测试探针具有互补于结合至所述多核苷酸的所述一个或多个碱基的部分;
(iv)通过确定在步骤(i)至步骤(iii)期间连接至所述测试探针的所述珠粒是否结合至所述多核苷酸来确定哪一测试探针的互补部分结合至多核苷酸的所述一个或多个碱基,以便识别该多核苷酸的所述一个或多个碱基;与
(v)如果在步骤(iv)期间没有除去该珠粒,则除去所述珠粒;
其中,步骤(i)至步骤(v)的各个循环进行一次或多次,并且在每一个循环中识别所述序列的一个或多个碱基。
优选地,使用连接酶来化学或酶促获得所述连接。用于进行该方法的合适的连接酶包括T4DNA连接酶。
在该实施方式中,初始多核苷酸模板可以是单链,并且可以通过沿着该单链模板的双链延伸(duplexextension)的一次或多次重复循环来确定其核苷酸序列。尤其是,延伸可以由初始化寡核苷酸与多核苷酸模板之间形成的双链体开始,其中该初始化寡核苷酸通过将寡核苷酸探针连接至其末端来形成延伸的双链体,以便在起始的延伸反应中被延伸。通过连接至成功结合的寡核苷酸探针的珠粒的存在,可以确定多核苷酸中一个或多个核苷酸的特性。
选择所使用的初始化寡核苷酸与多核苷酸一起形成高度稳定的双链体,并且初始化寡核苷酸的长度通常大于连接反应中使用的探针(具体的长度可以是20-30个核苷酸)。此外,该初始化寡核苷酸可以富含G/C。在US5,750,341中描述了初始化寡核苷酸的选择。
连接反应中使用的探针应当能够被连接至初始化寡核苷酸,并且当互补存在时应当在连接之前与多核苷酸一起形成双链体。优选地,探针(或其中结合至靶多核苷酸的区域)应当与多核苷酸完全匹配,以便能够成功地识别该多核苷酸序列,即该探针应当与待识别的序列100%互补。探针可以包含至少2个核苷酸碱基,并且具体地可以包含3、4、5、6、7、8、9或10个核苷酸碱基。为了获得连接,优选地所述探针具有3个或更多碱基的单链部分,例如4、5、6或7个碱基。如上述讨论的,为了识别多核苷酸中的具体序列,应当产生一组用于各种排列的探针,特定长度的探针中可能存在碱基的全部不同组合的代表。例如,2个核苷酸碱基的探针可以具有核苷酸碱基的16种不同组合,因此应当构建16种不同的探针用于添加至多核苷酸序列。在每一个循环中,如果探针的长度大于待检测的碱基数目,可以产生对于每一个排列的探针组。
可以彼此单独地和连续地加入不同的探针组,并且在每一次加入之后探究珠粒的存在或可以将不同的探针标记于不同的珠粒并同时将其加入靶多核苷酸。在这个方面,特定珠粒的检测可以指示特定探针的结合并且因此检测多核苷酸中的相应序列。
在进一步的实施方式中,可以通过使用逐步连接和切割的方法来确定多核苷酸的核苷酸序列,如在US5,714,330中描述的,其中使用珠粒标记互补结合的探针或核苷酸碱基。该方法能够识别多核苷酸序列的一个或多个末端核苷酸,并从该多核苷酸的末端除去一个或多个核苷酸,以便能够进行更进一步所期望的连接和切割的循环。
因此,在进一步的方面,本发明提供了一种用于确定固定在固体载体上的单一多核苷酸的核苷酸序列的方法,包括以下步骤:
(i)使用至少一种测试探针与所述多核苷酸以及可选地至少一个测试互补碱基接触,该测试探针的一部分可以与所述多核苷酸中的一个或多个碱基互补,至少一个测试互补碱基可以与所述多核苷酸中的碱基互补,珠粒或结合对的第一结合伴侣连接至所述多核苷酸和至少一个测试互补碱基中的任一个,并且当所述测试互补碱基和/或所述测试互补探针的部分与所述多核苷酸中的所述一个或多个碱基互补时,通过将所述探针连接至所述多核苷酸,将所述测试互补碱基和/或探针共价结合至所述多核苷酸;
(ii)当将结合伴侣结合至所述测试互补碱基和/或探针时,将连接至所述结合对的第二结合伴侣的珠粒连接至所述测试互补碱基和/或探针,通过所述结合对将所述第一结合伴侣连接至所述测试互补碱基和/或探针;
(iii)可选地使用至少一个不同的测试互补碱基和/或探针重复步骤(i)、或步骤(i)和步骤(ii),直到与所述一个或多个碱基互补的测试碱基和/或一部分与所述一个或多个碱基互补的测试探针结合至所述多核苷酸;
(iv)在每一步骤(i)、或步骤(i)与步骤(ii)之后、或在步骤(iii)之后,如果所述测试探针结合至所述多核苷酸,则加入一种能够除去所述珠粒的酶,该酶通过切割反应除去测试探针的至少一部分和待测序的多核苷酸的至少一个碱基;并且
(v)通过确定在步骤(i)至步骤(iii)期间连接至所述测试互补碱基和/或探针的所述珠粒是否结合至所述多核苷酸,来确定哪一个测试互补碱基和/或测试探针的互补部分结合至多核苷酸的所述一个或多个碱基,以识别该多核苷酸的所述一个或多个碱基;
其中,步骤(i)至步骤(v)的各个循环进行一次或多次,并且在每一个循环中识别所述序列的一个或多个碱基。
与上文中所描述的一般方法相比,使用了加入切割酶的步骤。在先前的方法中这种步骤落在测定步骤(iv)的范围内,但是在该优选的方面中是单独陈述的。
优选地,所述酶是核酸酶,例如限制酶,该核酸酶具有与其识别位点不同的切割位点,并且所述探针包括所述核酸酶的识别位点。在这种情况下,切割导致从靶多核苷酸除去一个或多个碱基。这使得能够重复该方法。可选地,每一个测试探针具有不同核酸酶的识别位点。
在所述方法中,如果可以在循环期间鉴别测试互补碱基或探针,在每一个循环中可以使用超过一种测试互补碱基或探针。如果同时使用多种测试互补探针,在步骤(iv)中可选地可以连续使用各自能够从不同的测试互补探针中除去珠粒的多种酶。
当使用互补碱基时,该互补碱基可以携带珠粒或用于连接珠粒的部件(means)。该互补碱基可以是通过聚合反应加入至延伸链末端的终止核苷酸。该碱基可以接近于结合至靶多核苷酸的探针。
在其中还应用了互补碱基的方法中,可以使用这些碱基以在自由3′末端(其中,探针结合于该位点的下游)来结合靶序列,并且可以使用合适的聚合酶通过聚合反应来连接这些碱基。珠粒可以与碱基或探针相连,但是在切割时必须释放该珠粒。
可以利用使用互补测试碱基的各种方法。在测试碱基简单地用于完成待切割的双链部分而不是与待测序的碱基互补的情况中,在反应中可以同时使用所有四种可能的碱基,并且序列的确定是基于结合的那个测试探针。在该情况下,在上述方法中,步骤(i)中还使用了聚合酶。通过连接将测试探针结合至靶多核苷酸。由于在切割时除去了插入碱基与至少一部分的测试探针(优选所有测试探针),(一个或多个)碱基或(一个或多个)测试探针可以携带珠粒。相对而言,如果待测序的碱基之一是测试碱基结合的碱基,由于探针提供了确定该探针通过其是否被连接至靶来结合并且为了切割而存在的部分(means),因此应当使用具有第一测试探针的第一测试碱基,以便可以通过第一测试探针的结合和切割来识别第一测试碱基的结合。在该情况下,在切割步骤之前,应当加入和连接步骤(i)中的第一测试探针和与碱基,并且应当在加入和连接第二测试探针和碱基等之前除去过量的测试探针和碱基等。在该情况中,可以将珠粒连接至测试碱基或探针。然而,方便地,为了尽可能的简化该方法,待检测的(一个或多个)碱基与测试探针中的一个或多个碱基互补,并且没有使用测试碱基(即该探针结合靶多核苷酸的单链部分的3′末端)或者一起使用所有可能的碱基来完成所得分子的双链部分,以便能够用于随后的切割。
在这种方法中,为了能够进行逐步连接和切割方法,在该方法期间必须结合测试探针,并且因此在步骤(i)中,所述测试互补探针通过连接反应共价结合至所述多核苷酸,如果进行必需步骤(iii)直到一部分与所述一个或多个碱基互补的测试探针结合至所述多核苷酸,并且可选地测试互补碱基结合至所述多核苷酸。
在本发明的方法中所使用的用于逐步连接和切割的测试探针优选地包括双链部分,该双链部分包含核酸酶的识别位点,并且可以进一步具有突出链(或单链部分),该突出链可以与多核苷酸的互补突出链一起形成双链体。以这种方式,将探针连接至具有互补突出部分的多核苷酸。可以借助于连接至测试探针的珠粒或者借助于连接至核苷酸碱基的珠粒(在连接步骤之前将该珠粒插入多核苷酸中)来确定多核苷酸序列。不论哪一种情况,在探针的连接之后,进行了切割,例如通过核酸酶,其识别探针内的序列(在来自连接位点的一个或多个核苷酸处沿着多核苷酸)切割连接的复合物,留下一个末端,该末端可以参与更进一步的连接反应和/或聚合反应的循环,并释放该珠粒(具有相关的核苷酸)以便允许其除去。
如本领域中已知的,在依赖引入切割的限制性位点的方法中,如果限制性位点出现在靶序列中时,则会影响测序。在固定靶之前,可以通过具有相同的限制酶或具有相同识别序列的限制酶来切割该靶以便避免该问题。可替换地,可以通过靶序列的甲基化来避免该问题。
在该方法中,可以使用如在上文中描述的限制酶(IIs型或IIb型)。优选利用IIb型限制酶,在切割时产生5′碱基突出端。
在确定珠粒是否连接时,可以使用如在上文中描述的检测步骤。因此,可以检测与珠粒相关的信号的存在或不存在或水平。根据本发明,在尤其优选的方面中,进行定量评价来确定连接至多核苷酸的信号的水平(来自珠粒)。
如本发明的其他方法一样,该珠粒和/或它们的连接基团对于每一个排列的碱基或探针可以是不同的,并且可以是可辨识的,以使得在该方法期间能够一起加入它们并且进行单独的检测。可替换的,用于所有测试探针的珠粒可以是相同的并且可以连续的加入每一个探针组,即可以重复步骤(i)(或步骤(i)与步骤(ii))与步骤(iv)直到利用了与相关的互补探针或者碱基一起的探针组。
如果可以在步骤(iv)与步骤(v)中区别探针组,可以一起加入探针组。
可以基于探针的珠粒或者例如在那些探针中的识别位点来区别探针。因此,例如,可以将不同的探针组结合至相同的珠粒或者相同类型的珠粒,但是一组或多组探针可以具有不同的限制性位点。在该情况下,可以将一组或多组探针加入至反应中,然后可以使用连续的限制酶,该限制酶涉及特异的探针限制性位点。通过特定的限制酶的释放将指示相关的探针结合,并且因此指示靶序列/碱基的特性。例如,该方法可以使用2种、3种、更多种限制酶,该限制酶在突出端中具有相同数量的碱基,接着,在每一次加入的前后检测与靶相连的珠粒。在4种不同的探针组的情况下,通过不同的限制性位点可以区别每一个探针组并且可以同时加入所有的探针组随后进行连续的切割反应。可替换地,在两个不同的循环中可以使用两个探针组,其中在每一个循环中不同的酶可以进行两轮的切割。可能存在不同组合。例如,可以使用由G和T探针组成的探针组进行连接,随后使用A和C探针的混合物进行连接。如果A和G探针使用一种限制酶,而C和T探针使用另一种限制酶,则可以在两次连接和两次切割之后区别所用四种碱基。使用另一种分组,使用三种连接与三种切割能够区别9组。通过被检测的组的合适组合(该组具有两种或更多种碱基),即不完全改变,但是可能部分改变,能够特异地提高数据质量,其中该连接至少是选择性的,如用于T/G检测。
如上所述,通过在该方法中的各种位点处评价珠粒的不存在或者存在或者与珠粒相关的信号水平,来进行确定结合的互补碱基或者探针的步骤。因此,步骤(v)涉及可以在该方法中的各时间点处进行的测定。因此,例如在结合时可以检测该珠粒并简单使用切割步骤来除去该珠粒。可替换地,当进行切割步骤(步骤(iv))时仅会显示关于探针是否结合的信息,并且在该情况下在切割步骤之后进行测定。然而,优选地进行两个步骤以用于比较目的。
可以使用各种的顺序用于该步骤,这取决于所使用的探针与酶。因此,如果两种或更多种探针的鉴别可以借助于它们的珠粒或者它们的切割反应,在切割之前可以将它们一起或者连续地加入。如果通过切割反应鉴别它们,可以连续地加入切割酶。可替换地,可以连续加入探针并且在每次加入之后进行切割。在这些情况中,可以在探针的加入之前、在它们的加入之后、在切割之前或者在切割之后进行珠粒的检测,并且可以用于每一个探针的结合或者切割步骤或者在多重探针除去之后或者多种切割步骤进行珠粒的检测,这取决于所使用的方案。
在一个优选的方面,在上述方法中使用多重切割酶,其能够区别结合的探针和/或碱基。因此,在一种尤其优选的方法中,本发明提供了一种用于确定固定在固体载体上的单一多核苷酸的核苷酸序列的方法,包括以下步骤:
(i)(a)使所述多核苷酸与至少第一和第二测试探针以及可选地至少一个测试互补碱基接触,每一个测试探针包括可以互补于所述多核苷酸中的一个或多个碱基的部分,至少一个测试互补碱基中的每一个可以互补于所述多核苷酸中的碱基,珠粒或结合对的第一结合伴侣连接至所述测试碱基和/或探针,并且当通过将所述第一或第二探针连接至所述多核苷酸所述检测的所述测试互补探针的第一或第二互补部分与所述多核苷酸中的所述一个或多个碱基互补时,将所述第一或第二测试互补碱基共价结合至所述多核苷酸;
(b)当将结合伴侣结合至所述测试互补碱基和/或探针时,将连接至所述结合对的第二结合伴侣的珠粒结合至所述测试互补碱基和/或探针,通过所述结合对将所述第一结合伴侣连接至所述测试互补碱基和/或探针;
(ii)如果所述第一测试探针结合至所述多核苷酸,加入第一种酶,该酶能够除去至少一部分的所述第一测试探针与至少一种通过切割反应待测序的多核苷酸的碱基,然后如果所述第二测试探针结合至所述多核苷酸,连续加入至少第二种酶,该酶能够除去至少部分的所述第二探针,其中,每一种酶是不同的并且特异于所述第一探针或第二探针;
(iii)使用至少两种不同的测试互补探针与至少两种酶可选地重复步骤(i)与步骤(ii),其中,所述酶对于步骤(ii)中使用的酶可以是相同的或不同的,直到部分所述一个或多个碱基互补的测试探针结合至所述多核苷酸,以及可选地测试互补碱基结合至所述多核苷酸;
(iv)通过确定在步骤(i)、(ii)或(iii)期间连接至所述测试互补碱基和/或探针的所述珠粒是否结合至所述多核苷酸,来测定哪一个测试互补碱基和/或测试探针的互补部分结合至多核苷酸的所述一个或多个碱基,以便识别该多核苷酸的所述一个或多个碱基;
其中,步骤(i)至步骤(iv)的各个循环进行一次或多次,并且在每一个循环中识别所述序列的一个或多个碱基。
要加入的至少两种测试探针,可以连续加入或者一起加入或加入其组合(例如一起加入两种探针,随后进一步加入两种探针)。当连续加入时,可以在每一次加入之后进行连接步骤(当还使用测试碱基时,该加入是适当的)或优选地一旦加入所有的测试探针就进行连接步骤。如下文讨论的,在该方法中,可以使用多于四种探针,所有的探针可以连续加入和/或一起加入。
在该方法的优选方面,在步骤(i)中使用至少第一、第二、第三和第四测试探针(每一种测试探针包括可以互补于所述多核苷酸中的一个或多个碱基的部分),在步骤(ii)中使用至少第一、第二、第三和第四种酶,所有的酶是不同的,并且特异于所述第一、第二、第三或第四探针。
在可替换的优选实施方式中,步骤(i)中,使用至少第一和第二测试探针,其均包含可以互补于所述多核苷酸中的一个或多个碱基的部分,并且在步骤(ii)中使用至少第一与第二酶。优选地,在每一个循环中识别所述序列的多于一个碱基。
在该方面的优选实施方式中,步骤(i)至(iv)重复多于一次,即进行多于一个循环,如在下文中讨论的,优选至少2个循环。在一个尤其优选的方面,重复所述步骤以便测试所有的测试碱基或探针组。
在所述方法中,可以在每一个循环中使用两种或更多种测试互补碱基或探针。在步骤(ii)中,可以连续使用多种酶,每一种酶能够切割不同的测试互补探针。
根据本发明的该方面,可以通过特异于该探针的酶来切割该探针。因此,方便地,该探针包括至少一个切割酶的识别位点。
该“能够除去至少部分的所述测试探针的酶”是一种切割酶,当该测试探针结合至靶核苷酸序列时,该切割酶识别并结合至测试探针并且切割该测试探针和/或切割在靶多核苷酸上接近于所述探针的序列,但是当探针未结合至靶核苷酸序列时,该切割酶则不必结合或切割所述测试探针。当所述酶切割测试探针时,该切割进行有效切割并因此从靶多核苷酸:探针复合物中除去该探针的切割部分。当所述酶切割相邻的序列时,该切割发生在所述探针的上游或下游,以便在切割时将该探针(其整体)与一些靶多核苷酸序列从该靶多核苷酸:探针复合物中除去。优选该切割与识别位点是分离的。尽管该识别位点由至少一部分的探针序列构成,该切割位点可以不包含任何该探针序列,例如,当切割位点在识别位点的上游或下游时,例如当酶是限制酶时。
该切割位点可以在珠粒与探针剩余部分(rest)之间,其结合至被测序的靶多核苷酸。在该情况下,根据需要,为了能够进行反复的测序反应,可以需要更多的切割酶来除去剩余的部分探针和至少一部分的靶序列来显示用于测序的新碱基。然而,方便地,定位该切割位点以便在切割时该探针从靶多核苷酸:探针复合物以及靶多核苷酸的至少一个碱基中完全地除去。
优选地,所述酶是如在上文中描述的核酸酶,并且每一个测试探针(或探针组)具有对于不同的核酸酶的识别位点。
在本发明的方法的该方面中,至少利用第一与第二探针,该探针具有特异于各自的探针的第一与第二酶。因此,当该探针结合至待测序的多核苷酸时,第一酶识别并切割第一(而不是第二)探针,即,其特异性识别或切割第一探针而不识别或切割第二探针。方便地,通过使用含有不同识别位点的酶(和对应的探针)来实现。因在,在本发明的优选实施方式中,每一种酶是核酸酶,该核酸酶具有不同于其识别位点的切割位点,所述测试探针包括用于所述核酸酶的识别位点,并且在所述方法中使用的每一种酶具有不同的识别位点。酶的切割位点可以是相同的或不同的。优选地,如上文讨论的,所述酶是限制酶,优选IIb型限制酶,并且在所述方法中使用的每一种酶是不同的限制酶。
在上述方法中,在步骤(i)至步骤(iii)期间的各个时间点评价珠粒的存在或不存在以便能够确定,例如(a)在任何结合(即在步骤(i)开始时)之前进行评价,(b)在步骤(i)或者步骤(iii)(部分(i))之后评价结合,以便确定珠粒是否结合至多核苷酸,和/或(c)在切割之后(即在步骤(ii)或者步骤(iii)(步骤(ii))之后)评价结合。由于该方法依赖于通过不同的酶来选择性的切割,因此至少在切割步骤之后进行测定。在该方法中,其中珠粒提供了附加的序列信息,至少在步骤(i)或步骤(iii)(部分(i))的结合之后进行测定。
本发明允许使用单一珠粒,但是也可以使用多个不同的珠粒,每一个珠粒产生不同类型的信号,以便识别结合的测试探针。可以使用这种方法作为额外确认(一个或多个)靶碱基的特性,例如通过探针的切割特性与探针连接的珠粒来识别结合探针。可替换地,在该方法期间,可以使用这种方法来显示额外的测序信息。当使用单一类型珠粒时,在切割反应期间使用该单一珠粒来识别哪个探针是结合的以及哪个探针被除去的。由于该珠粒独立于切割识别位点,因此还可以使用该珠粒来提供额外的测序信息。因此,例如,对于两种碱基的变化同样的可以产生16种探针来涵盖可能的每一个排列。然后,可以将这些探针归类成组,其中第一(或者第二碱基)是相同的但是另一个所关心的碱基是改变的,即归类成4种探针组,所有的探针组携带相同的珠粒类型但是其中基于它们的切割特性来区别4种探针的组合,即切割酶识别位点。在该方法中加入第一探针组并且评价了来自组中(切割之前)的探针的结合。如果没有探针结合,则加入第二探针组等直到探针结合。一旦来自探针组的探针结合,则允许识别序列中的一个碱基,其是基于探针组的特性,其中第一(或第二)碱基是不变的。为了识别第二(或者第一)碱基,即结合自4种探针组的探针内的特异性探针的特性,使用每一个不同的切割酶进行连续的切割反应,直到发生切割并且释放该珠粒。以这种方式,在单一循环中可以识别第一和第二碱基。
方便地,在这种方法中还可以使用多种不同的珠粒,并且在该情况下可以同时使用所有的探针组。因此,例如在每一循环中同样的可以确定两个相邻的碱基,其中一个碱基基于珠粒类型来确定,并且另一个碱基基于探针的切割特性来确定。在这种情况下,同样可以产生16种探针来涵盖两种碱基中变化的可能存在的每一排列。可以基于不同的珠粒来区别针对第一碱基不同的4种探针组,并且可以基于4种探针组的切割特性来区别针对第二碱基不同的4种探针组。在本发明的方法中,可以一起或者连续使用该4种探针组。因此,例如,如果一起使用探针组,并且使用不同的切割酶连续切割,同样可以检测结合的珠粒并且需要切割酶用于切割以便识别16种探针中的哪个是结合的,并且因此在每一循环中可以测序两种碱基。
应当理解,可以通过使用如上文讨论的不同的鉴别技术和/或连续的加入探针或者探针组在单一循环中识别更多的碱基。通过举例,可以通过使用连续加入的4种探针组来识别3个碱基,在第一探针组(探针组1)中每一探针在N位置是不变的,但是在探针组中提供在N+1与N+2位置的每一排列的探针。在探针组内,可以通过用于不同改变的不同的信号方法识别在N+1处改变的探针,并且可以通过用于不同改变的不同的切割特性识别N+2位置处改变的探针。在本发明的方法中,将探针组1加入靶多核苷酸。如果在探针组1中没有探针结合,则将探针组2与靶多核苷酸接触等直到探针结合。一旦发生结合,检测结合探针的信号装置(mean),之后使用相关的酶连续切割。通过包含结合探针的探针组显示N位置的特性,信号装置的特性能够识别N+1位置并且切割以便移去至少部分探针的酶显示了N+2位置的特性。
因此,在优选的方面中,本方法提供了一种方法,其中所述第一与第二探针包括第一组和第二组探针,并且珠粒连接至所述探针和/或碱基,连续加入所述至少第一与第二探针组和/或碱基并且在每一次加入之后检测与该珠粒相关的信号,以便确定结合至所述多核苷酸的那个测试互补碱基和/或探针,以确定所述靶序列的一个或多个碱基的序列,其中所识别的一个或多个碱基是不同于通过测定步骤(ii)期间被切割的探针来识别的一个或多个碱基。
在一个尤其优选的方面,使用的珠粒可以是不同的。在该情况下,可以一起加入第一和第二探针和/或碱基,并且在单一步骤中进行测定。因此,在一个优选的方面,所述第一和第二探针包括第一组与第二组探针,并且将不同的珠粒(该珠粒可以被鉴别)连接至探针的每一组的至少两种探针和/或测试碱基,并检测与所述不同的珠粒相关的信号,以便测定结合至所述多核苷酸的那个测试互补碱基和/或探针,以确定所述靶序列的一个或多个碱基的序列,其中所识别的一个或多个碱基不同于通过测定步骤(ii)期间被切割的探针来识别的一个或多个碱基。在这种情况下,基于第一组或第二组探针的切割特性来区别第一或第二探针组,并且基于探针的珠粒来识别在组内的探针。方便地,使用4种探针组,每一探针组包括4种不同的探针,可以鉴别连接至不同珠粒的4种不同的探针。
在本发明的方法中,互补碱基或探针在结合至多核苷酸之前被珠粒标记或通过利用结合伴侣在结合至多核苷酸之后标记珠粒。在一种具体的实施方式中,在结合至多核苷酸之后标记该碱基或探针。如果在结合之后标记,应当在确定连接至结合碱基或探针的珠粒存在的步骤之前进行除去任何未结合珠粒的步骤。这可以通过利用磁体容易地实现,例如当该珠粒为顺磁性时。
类似地,如果在结合之前标记碱基/探针,则应当在确定连接至结合碱基或探针的珠粒的存在的步骤之前进行除去任何未结合碱基/探针珠粒标记的复合物的步骤。
可以在原位(即当连接至靶序列时)或在释放时检测标记的探针或者碱基。在后一种情况中,冲洗测序反应以便从混合物中除去未连接的珠粒,并且然后如在下文中描述的释放该珠粒。在释放的混合物中珠粒的存在证明了在靶序列中相应的(一个或多个)互补碱基的存在。
在可以开始评价下一组的测试探针之前,必须从靶序列中(或者用于重复使用的释放的探针或者碱基)释放并且除去珠粒。在其中在原位检测珠粒的方法中,在检测珠粒之后必须将其释放并且除去该珠粒。
可以通过任何合适的方法释放珠粒例如通过酶切法(如使用RNA核酸内切酶)、化学法、光化学法(参见WO2004/007773和PCT/US2003/021818)或者机械切割法。当利用逐步连接和切割的方法时,酶切包括核酸酶切割。在这种方法中,通过使用核酸酶(该核酸酶具有不同于识别位点的切割位点)使切割位点出现在靶多核苷酸中。在本发明的其它方法中,还可以通过酶切来释放该珠粒。因此,可以将切割位点设置在碱基或探针与珠粒之间。尤其是,可以将限制酶位点插入在珠粒与碱基或探针之间。可以使用任何限制酶,然后使用适合该位点的任何限制酶来实现切割。尤其是,如在上文中描述的,可以利用IIs型或IIb型限制性核酸内切酶。可以直接地将限制位点或切割位点设置在接近于碱基或探针(即在最接近于珠粒的探针部分)以便能够与任何接头(linker)一起切割该珠粒,或者可以直接地将其它存在的结合部分或者限制位点或者切割位点设置在接近于该珠粒以便能够切割,并且可以再利用该珠粒。如果通过连接反应将珠粒标记的探针插入多核苷酸中,则可以使用切口限制酶(nickingrestrictionenzyme)来释放该珠粒。
在本发明的一种优选实施方式中,可以使用机械切割以避免如在一些现有技术的测序方法中需要的化学除去。当将该方法用于聚合测序(其中使用预标记的珠粒或碱基)方法中时,相比于化学或者光化学切割,该方法是尤其有用的,因为在弱连接时仅仅切断了包含的修饰碱基。在释放的珠粒上的其它碱基没有被切割,该碱基可能已经发生断裂(disruptive),同样地通过聚合反应可以很容易插入该碱基。
可以通过使用更大磁性的活性珠粒或者通过加速流动池(flowcell),或来自两种或更多种的磁性、加速度与振动的结合力借助于提高的磁力来释放小的顺磁性珠粒,后者(振动)的频率优选接近于靶/珠粒体系的机械共振频率。另一种可以容易地单独释放珠粒的力或者与前者结合的力是产生自流体流动的力。采用该形式的释放形成了本发明的优选的方面。只要在珠粒上有足够的剩余碱基并且焦磷酸盐的水平足够低,就可以再利用该液体。可以使用珠粒的定期再补给和/或焦磷酸盐的除去。
然后可以从反应中除去切割的珠粒,例如当该珠粒是顺磁性时可以使用磁体。可替换地,可以通过分离和洗涤来实现除去,例如使用流体流动,如在芯片内。可以使用这些技术的组合。在该切割的珠粒已经被除去之后可以进行更多珠粒的检测或可视化步骤,以便核对已经成功的除去所有的珠粒,在反应之前进行恢复,例如在链终止效应中和之前并且优选地进行该步骤。
如在本文中所使用的,术语″珠粒″是指微粒,其通常是、但不一定是球形固体载体。虽然珠粒的大小并不是关键的,但它们可以例如具有至少0.05、0.1、0.3、0.5、1、1.5、2、2.5、3或3.5μm的直径量级并具有不大于50、20、10、8或6μm的最大直径。尤其是,在本发明中可以使用1或2.8或4.5或10μm的珠粒。直径是指沿着珠粒的最长轴或沿着球形珠粒的任何轴的大小。″半径″是指上述直径的一半。
在本文描述的方法中,对于每个单一多核苷酸,在每个循环中,仅结合单一探针/碱基和单一连接珠粒。以复数形式提及″珠粒″应理解为单数形式或反映一起进行的多个反应但各自针对单一多核苷酸。
单分散性珠粒,其具有基本上均一的大小(例如具有直径标准偏差小于5%的大小),可以用于本发明,因为它们提供反应的非常均匀的可重复性。
可以由能够形成适宜载体的任何材料制备珠粒。适用于本发明的方法的非磁性聚合物珠粒可获自Invitrogen以及可获自Qiagen、Serotec、Merck、Promega(仅举几例)。非磁性珠粒可以由本领域公知的许多不同材料制备,例如,由塑料制备,例如由聚苯乙烯制备。
然而,为了有助于操作和分离,磁珠是优选的。如在本文中所使用的,术语″磁性的″是指珠粒能够具有当被放置在磁场中时赋予它的磁矩,因而在磁场的作用下是可位移的。换句话说,可以通过磁团聚容易地除去磁珠,其提供在用测试碱基或探针温育珠粒以后或在从多核苷酸切割它们以后快速、简单和有效的分离任何未连接珠粒的方式。相对于在现有技术的许多测序方法中所使用的荧光团,这提供明显的优势。
因此,通过施加磁场,例如利用永磁体,可以在适宜的表面上除去未结合的磁性颗粒。
磁珠包括响应于磁场的磁响应材料,例如,顺磁性材料、铁磁材料、亚铁磁材料和变磁材料。因此,可以使用铁、镍和钴以及金属氧化物如Fe3O4、BaFe12O19、CoO、NiO、Mn2O3、Cr2O3和CoMnP。磁响应材料可以仅是珠粒的一种成分,其余部分可以由磁响应材料与其附着的聚合物材料组成。
在珠粒中磁响应材料的量并不是关键的并且可以在宽范围内变化,例如,整个颗粒的按重量计约1%至约75%。范围可以是2%至50%,3%至25%或5%至15%。可以将磁响应材料分散于整个聚合物,施加为在聚合物表面上的涂层或以任何其它方式并入或固定,其将磁响应材料固定于聚合物。因此,磁响应材料可以形成珠粒的核或核心。
形成珠粒的其余部分的聚合物材料可以是可以形成为固体珠粒的任何材料。适宜聚合物的实例是聚酯、聚醚、聚烯烃、聚环氧烷、聚酰胺、聚氨酯、多糖、纤维素和聚异戊二烯。在许多聚合物中,交联可用于赋予珠粒结构完整性和刚性。
还可以使用超顺磁珠例如由Sintef在EP-A-106873中描述的那些超顺磁珠,其使得能够避免甚至具有高渗透性的珠粒的磁团聚和凝集(clumping)。另外,由Invitrogen出售的作为Dynabead的磁性颗粒特别适用于本发明。
使用磁珠特别有利的是,可以将珠粒″下拉″到多核苷酸上,其可以被固定于固体载体上,以能够将珠粒标记的碱基或探针更加快速地并入多核苷酸,或能够将珠粒更加快速地结合于碱基或探针,其已并入多核苷酸但还未被标记。
根据在本领域已知的和在文献中描述的技术,在并入多核苷酸以前或以后,以任何方便的方式,可以直接或间接地将珠粒连接于测试互补碱基或探针,但要确保珠粒并不阻止它所连接的探针或碱基进入靶标多核苷酸,或防止所需要的反应发生,例如,聚合、连接或切割反应。
因此,可以直接将碱基或探针连接于珠粒。通过本领域已知的方法(例如偶联化学)可以容易地实现上述连接,以及方便地,可以将碱基或探针直接结合于珠粒,例如通过涂布(coating)。
可替换地,可以将珠粒间接连接于测试互补碱基或探针。因此,可以通过可以直接连接于珠粒的一个或多个其它分子将碱基或探针连接于珠粒。这些可以产生共价或非共价连接。在优选方面,珠粒可以携带一个或多个连接部分或间隔区(spacer),其对于碱基或探针或对于并入碱基或探针的标记具有亲和力。优选地,经由结合伴侣来实现这种间接结合。在这种情况下,珠粒可以方便地携带或提供有能够结合于碱基或探针的结合部分,使得借助于结合对的至少两个结合伴侣进行结合。如本文所指的,″结合对″是指分子对,其形成特定的和稳定的相互作用。实例包括DNA:DNA、配体:受体、抗体:抗原相互作用。上述结合部分在本领域中是公知的,例如可以使用生物素/链霉亲和素,其中将碱基或探针结合于生物素基团并用链霉亲和素涂布珠粒。
在优选方面,可以将碱基或探针连接于珠粒,其中通过生物素/链霉亲和素结合或通过生物素/抗生物素蛋白结合,其中生物素和链霉亲和素形成结合伴侣。因此,链霉亲和素或抗生物素蛋白涂布的珠粒,可以用来结合碱基或探针,其被连接于生物素基团。可以使用的其它结合对包括异羟洋地黄毒甙元:抗异羟洋地黄毒甙元(digoxigenin:antidigoxigenin)。
在特别优选的方面,借助于可切割的连接物(优选但不一定包括结合对),将碱基或探针连接于所述珠粒。这使得所述珠粒能够释放。在进一步优选方面,所述可切割连接物具有可通过限制酶切割的限制位点。方便地,它的产生可以通过使用至少部分单链寡核苷酸,其是结合伴侣,在杂交以后其一起形成识别和限制位点。
在结合于多核苷酸以前,可以将测试碱基或探针连接于珠粒。在这方面,可以将碱基或探针的单个拷贝或多个拷贝连接到每个珠粒。优选地,所述珠粒,携带至少100、500、1000、10000或100000个探针。这些探针可以是相同或不同的,但优选为单组探针。在不同探针被携带在相同珠粒上但它们并不形成单组探针(即指向单一改变)的情况下,每组的探针优选可借助于它们的结合对区别,例如可以借助于可区别的切割位点连接它们。当使用非终止碱基时,可以将一个以上的碱基结合于每个珠粒,但数目应保持较低以避免均聚物并入。
可替换地,在被连接于珠粒以前,可以首先将碱基或探针结合于多核苷酸序列。在这种情况下,珠粒可以方便地携带或提供有如上文描述的结合伴侣对中的一个。
在本发明的方法中,有色的透明珠粒可以使用并可以加以检测。一种或多种不同颜色的不同珠粒可以用作标记。因此,在本发明中,可以使用两种、三种或四种不同的珠粒颜色。尤其是,可以同时使用一种或多种不同珠粒颜色并且可以加以检测(如下文进一步详细描述的)。因此,不同的珠粒颜色可以用来检测不同的测试探针或碱基是否已并入多核苷酸,例如四种碱基可以标记有四种不同颜色的珠粒,以及连接于结合碱基的珠粒的颜色可以识别碱基,因而识别它在多核苷酸中的互补碱基。当同时将所有四种碱基施用于多核苷酸时,这是特别有利的。因此,特定珠粒颜色可以具体识别特定碱基或探针。
可以通过它们对例如三种或四种颜色,对其存在过滤物质,其尽可能地具有非重叠滤波曲线(filtercurve)的过滤效应,来检测不同颜色。通过以不同量结合这些物质,例如,10种不同量,则理论上可以区分1000或10000种不同的珠粒。由于滤波曲线的某些重叠,可以需要减少数目,但可以区分256种不同珠粒,从而能够通过利用针对256种改变的每一种的探针在任何时间读取可达4个碱基。
作为对滤波珠粒(filteringbead)的替换方案,可以通过进行标记来产生有色珠粒,例如,用染料例如荧光染料来涂布上述珠粒。另外,可以使用不同颜色水平的珠粒。然而,优选地,在本发明的方法中,由珠粒携带的标记是非荧光的。
不同大小的珠粒可以用作标记。可以同时使用2、3、4、5、6、7、8、9或10种不同大小的珠粒作为标记并加以检测。不同大小的珠粒,将能够识别它们所连接的不同的碱基或探针,在本发明的方法中其将是特别有利的,其中同时将不同的碱基或探针加入多核苷酸。借助于它所结合的珠粒的大小可以确定并入的碱基。
当使用不同大小和/或颜色的珠粒作为用于碱基或探针的标记时,可以必要的是,在结合于多核苷酸以前单独地标记碱基或探针,或使用不同的连接物或亲和结合对以将特定碱基或探针特异性地结合于特定珠粒。在前一种情况下,在测序反应以前进行珠粒标记,并将每组探针(例如ANNN)或碱基(例如A)连接于不同的珠粒。可以将每组的多个探针或碱基连接于每种珠粒以提供可达256种不同的珠粒(例如)。在结合于多核苷酸靶标以后进行标记的情况下,因为珠粒类型的变化受限于可以容纳的独特的结合伴侣的数目,所以可以使用不同珠粒类型的数目并且其取决于可以使用的独特的结合伴侣的数目。如果独特的寡核苷酸用作结合伴侣,这可以是较大的。
另外通过使用不同的珠粒大小、颜色和/或亮度(intensity)的组合,可以多路进行(multiplex)上述方法。因此,珠粒的不同亚组,其可以是一系列的颜色、颜色水平和/或大小,可以用于本发明的方法。珠粒的上述亚组的检测可以需要各种不同参数的测量,例如珠粒大小的磁性检测和珠粒颜色的光检测。
因此,在用于每个碱基的每个测序循环中,可以一起或分开地加入不同组的待测试的探针或核苷酸,其取决于将使用的检测技术。因此,可以一起加入所有测试探针或核苷酸,如果可以借助于其所连接的珠粒来区分它们,例如,借助于4种不同类型的珠粒来表示4种可能碱基中的每一种。可替换地,可以分开地或以组的形式加入探针,如果那些组可以加以区分,例如,2种的2组,其中在每一种情况下使用2种可区别的探针。在此类型的另外的替换方案中,可以一起或以组的形式加入探针,但可以分开地或以可区别的组释放它们。这可以例如在连接/切割方法中实现,其中使用具有不同核酸酶识别位点的探针,使得响应于特定限制酶的加入的珠粒释放能够识别结合的探针(基于所使用的限制酶和确定的珠粒),因而使得能够识别靶标核苷酸。
珠粒标记的检测可以是通过光、磁、电或电化学方式。例如,可以借助于磁场来检测珠粒的大小以及其存在。方便地,在芯片上实施本发明的方法。
在特别优选的实施方式中,可以利用仪器来进行珠粒的检测,其中上述仪器包括表面,其提供有用于检测珠粒的装置。上述表面可以包括一个或多个元件,其提供依赖于珠粒的存在或不存在的输出。在优选的实施方式中,可以通过在PCT/GB2010/00324中描述的方法来光学地检测珠粒,例如利用其中描述的仪器。
在这样的方法中,可以将多核苷酸连接于表面,其提供有用于检测珠粒的装置。因此,表面可以提供有一个或多个光敏元件,其中设置每个光敏元件以检测与其相邻的珠粒。可替换地,可以代替或连同其它元件一起使用光敏元件,其中上述其它元件能够检测珠粒例如Hall元件。在表面上或表面内提供的一个或多个光敏元件能够输出依赖于珠粒的存在或不存在的信号,以及由每个光敏元件提供的信号因此将表明是否存在珠粒,因而表明是否存在并入的碱基或探针。在这种检测方法中,通过一个或多个光敏元件直接检测珠粒本身。可以设置珠粒以发射光,其可以通过光敏元件检测,例如,它可以是发荧光的,虽然在优选方面,当它阻止光到达提及的光敏元件时检测珠粒。因此,优选地,所述检测是通过检测光变化,其来自在光敏表面上珠粒的存在。因此,珠粒在元件上有效地投射阴影。使用的光源可以是背景光(ambientlight),或可以提供专用光源。通过照明表面,可以更加容易地检测任何这样的阴影,其产生自珠粒的存在或光自光敏元件的阻碍。另外,为了防止外部光源影响结果,优选地,通过适宜的外罩(housing),使光敏元件屏蔽外界光。
因此,光敏元件能够测量由表面接收的光量,其可以确定珠粒的存在或不存在。可以通过单个光敏元件或通过光敏元件组来检测珠粒,其取决于珠粒的大小、光敏元件和珠粒离表面的距离。因此,可能的是,单个光敏元件可以检测一个珠粒,或2、3、4个珠粒,但更可能的是,4、9、16或更多光敏元件可以检测一个珠粒。当不存在珠粒时,通过每个光敏元件检测的光量和因而由光敏元件输出的信号,可以用作参比点,相对于其可以比较其它测量结果。由光敏元件接收的光的减少(即,由珠粒的阴影所产生的)将导致信号的输出不同于当珠粒不存在时的输出。如下文所讨论的,当珠粒存在时,由每个光敏元件接收的光量将取决于各种因素,其包括珠粒大小、每个光敏元件的大小和连接于表面的多核苷酸的长度。
″表面″优选提供有设置以形成阵列的多个光敏元件。光敏元件可以是在表面上或形成表面的外层或可以包括在表面内,例如,可以存在于一个或多个其它材料层的下方。光传感器或光敏元件的阵列是本领域公知的,并且包括例如在照相机或CMOS有源像素传感器中所使用类型的电荷耦合器件。可以对上述CCD或CMOS图像芯片进行改进(改性,modification)(如下文中进一步讨论的)。表面可以是上述装置的底面。
可以将其序列待确定的多核苷酸连接于一个或多个光敏元件或放置在一个或多个光敏元件(其存在于表面内或表面上)之上,以使得能够从连接的珠粒产生输出。优选地,单一多核苷酸可以与光敏元件或元件组有关并且可以检测。可以在一个以上的光敏元件或元件组上进一步划分多核苷酸序列,以使得能够更容易地确定序列,即对于待确定的序列的部分,其中通过不同的光敏元件,但在每一种情况下测序单一多核苷酸。
当珠粒存在时,珠粒可以在表面上和在光敏元件或光敏元件组上投下阴影,因而减少由光敏元件接收的光量。例如,珠粒可以减少由光敏元件接收的光量约10-100%,例如尤其是至少10、20、30、40、50、60、70、80、90或95%。可以理解,提供的输出将取决于所使用的珠粒的大小、在表面上存在的单个光敏元件的大小和拴住的珠粒与表面的距离。因此,相同大小或大于光敏元件的珠粒可以防止大多数光落到光敏元件上。当珠粒存在或连接于光敏元件时,可以通过测量输出的信号来校准每种光敏元件和珠粒大小组合。
可能的是,特定珠粒大小的选择取决于在表面内或表面上的光敏元件的大小。尤其是,对于多核苷酸的测序,其中相对彼此顺次地加入4种碱基或不同的探针,可以选择珠粒,其对应于在表面内或在表面上一个或多个光敏元件的大小。可替换地,对于多核苷酸的测序,其中同时将所有4种碱基或不同的探针加入多核苷酸以及其中基于珠粒大小来区分碱基或探针,珠粒大小将优选小于元件或元件组的大小。因此,可以选择珠粒,当连接于表面时其将减少光量至少10、20、30、40、50、60、70、80、90或95%。例如,1μm直径珠粒可以连同1.75x1.75μm的光敏元件一起使用,或2.8μm直径珠粒可以连同3.2x3.2μm的光敏元件一起使用。
通过每个光敏元件并通过用不同颜色的光照明表面,在表面上可以检测不同颜色珠粒。因此,通过表面并通过用不同颜色光的照明,可以检测2种、3种、4种或更多种不同颜色珠粒。表面可以能够对所施用的每种颜色珠粒/光颜色组合提供输出。
光敏元件能够将接收的光能转换成电压,其然后可以被转换成数字数据。以这种方式,包括元件的表面本身能够检测分子的存在,其中通过检测连接于上述分子的珠粒。无需采用外部贵重仪器来检测连接于分子的信号或标记的存在。表面本身能够检测分子。
如上所述,已知的CMOS或CCD检测器适用于检测珠粒。例如,在本发明的方法中,在移动电话中所使用类型的图像芯片可以用于检测珠粒。因此,例如CMOS或CCD图像传感器的表面可以形成在本发明的检测步骤中使用的表面。
已开发了CMOS光检测器(或有源像素传感器),基本上用于消费相机应用,例如在网络摄像机或移动电话中。可获得这种检测器的两种变体,即裸模变体(baredievariant)或具有用保护玻璃包装并连接于垫片(其被连接于用于焊接的外部垫片)的模具的变体。裸模变体可以直接用于本发明,而包装模具变体(packageddievariant)CMOS光检测器可以通过除去玻璃盖改进。对于两种变体,可以优选的是,除去微透镜和颜色滤波器的层,其通常覆盖像素,这是因为在透镜和滤波器下的表面通常是玻璃层,其是优选的,尤其用来避免珠粒的非特异性连接。可以制造CMOS或其它光检测器而没有另外的微透镜/滤光层,其是用于移动电话所需要的,直接用于本发明。因此,特别适用的CMOS图像芯片可以用于本发明。
特别地,表面可以包含至少3兆像素(2048x1536个光敏元件)或至少4、5、6、7、8、9、10、11或12兆像素。利用标准沉积过程,可以沉积与至少1、5、10、15、20、25、30、35或37%的光敏元件有关的多核苷酸。在图像芯片上存在的光敏元件或像素通常具有相同大小,虽然可以产生大小的差异。像素可以是例如0.5x0.5μm至10x10μm,例如1x1μm、2x2μm、3x3μm、4x4μm、5x5μm或6x6μm,以及特别地,像素可以是1.75x1.75μm或3.2x3.2μm。
可以对表面例如对图像芯片的表面另外进行改性,以有助于分子连接于表面。特别地,图像芯片可以涂布有金或可以改性以具有连接的硅烷或抗异羟洋地黄毒甙元基团。可以使用的金层的厚度并不是关键的,条件是没有太多的光被阻止到达光敏元件。例如,金层可以为5至50nm。以这样的方式来使表面改性的方法在本领域中是已知的。可以通过真空沉积或通过由高度浓缩的金溶液沉积来进行金涂布。可以通过例如在室温下用在干丙酮中的5%氨基丙基三乙氧基硅烷(CAS:019-30-2)温育表面1小时,来实现表面的氨基硅烷改性。氨基硅烷表面可以作为本身直接加入所期望的分子,或可以通过加入双官能团交联剂来进一步改性,如间-马来酰亚胺二苯甲酰-N-羟基磺基-琥珀酰亚胺酯(m-maleididibenzoyl-N-hydroxysulfo-succinimideester),以能够将分子结合于表面。通过首先用聚-1赖氨酸溶液(10%聚-1赖氨酸v/v和10%PBS)将表面涂覆底层(prime),然后通过加入在InvitrogenCNB0011涂层缓冲液A中的抗异羟洋地黄毒甙元1:100来实现抗异羟洋地黄毒甙元改性。
另外,表面可以配有流动池(flowcell),其使得流体能够流动到和从表面流动。因此,流动池可以用来施加珠粒或珠粒标记碱基/探针或未标记碱基/探针。另外,表面可以设置读取器,其能够检测和读取来自在表面内或在表面上的每个传感元件的信号。可以由计算机接收来自每个元件的输出。可以容易地制作流动池以包含一个以上的芯片,例如,它可以用64个图像芯片来产生。在这种情况下,可以用同一控制单元来控制所有芯片。
另外或可替换地,可以改变或适应表面的形状,以有助于珠粒结合于并入的碱基或探针或有助于在每个位置或像素处珠粒标记碱基/探针的结合,以及使得能够产生灵敏而准确的方法。因此,可以改变或调整表面,例如具有一定形状,以使得在每个位置处珠粒能够结合。
因此,表面可以成一定形状以使得珠粒能够连接或结合于每个传感元件(例如光敏元件)。单独的凹槽可以与每个传感元件或传感元件组有关或由每个传感元件或传感元件组所定位,其使得每个珠粒能够连接于以及与在表面上的单个或单独传感元件或传感元件组有关。凹槽可以使珠粒能够仅定位于单个元件上以及防止珠粒在一个以上传感元件或传感元件组上移动。
可替换地,可以用障碍物包围每个传感元件或传感元件组,以确保珠粒仅连接于以及结合于上述传感元件或传感元件组。因此,可以在表面上围绕一个或多个传感元件放置障碍物。
凹槽和障碍物的组合还可以用于表面上。通常,将具有与其连接的多核苷酸的传感元件将适合于具有与其相关联的凹槽(recess)或障碍物。可以使在表面上的一个或多个元件适应,虽然通常可以使所有元件适应,例如,以具有与其相关联的凹槽和/或障碍物。
以这种方式,表面的适应,例如,凹槽(recess)和/或障碍物的使用,使得能够产生更加灵敏而准确的方法以及可以使得能够测序更长的多核苷酸。因此,表面可以适应以使得在每个位置处单一珠粒能够结合。因此,每个传感元件或传感元件组和其周围的障碍物或凹槽可以具有适宜的大小以结合单一珠粒。因此,可以使传感元件和/或障碍物/凹槽适应于和表面一起使用的任何特定珠粒大小。可以利用本领域公知的技术来调整表面。
另外,为了使得靶标多核苷酸能够连接于检测器的敏感区(例如对于光或磁性),改性可以是必要的。这可以例如通过平版印刷法来实现,例如限定金层的岛(island),其可以在靶标固定于表面的一端连接于硫醇改性,或通过限定被硅烷化的区域。
可以在表面上的不同位置处同时测序不同的多核苷酸。要做到这一点,将有必要在开始测序以前确定它们在表面上的位置。可替换地,可以产生多核苷酸的重叠片段并随机放置在表面上的单独位置供测序。在这种情况下,在测序以前,不必要确定每个片段在表面上的位置,这是因为在已完成测序以后可以将重叠序列拼合在一起。
通过示例的方式,上述方法可以实施如下。首先,应分离和制备供测序的靶标多核苷酸。然后应直接或间接地将靶标多核苷酸连接于固体载体(如上文描述的)。在含水反应混合物中,在使得它们能够结合于靶标多核苷酸的条件下,加入在上述方法中使用的测试互补碱基和/或探针(其可以携带珠粒)。可以同时或在加入可选的珠粒标记测试互补碱基和/或探针以前或以后加入为实现共价结合所必要的酶(例如连接酶或聚合酶)。可替换地,进行化学连接。在已经实现共价结合以后,应洗涤复合物以除去未结合的碱基和/或探针。在此步骤以后,可以进行珠粒检测(如上文描述的)或可以加入信号单元以标记复合物。在后者情况下,可以在适合于在结合伴侣之间发生结合的条件下加入携带有关结合伴侣的珠粒,然后在洗涤以除去未结合的珠粒以后可以确定珠粒的存在或不存在。
如果仅在它们的释放以后检测珠粒,则可以在没有检测的情况下进行洗涤和珠粒结合步骤。进行珠粒的释放(如上文描述的),例如通过化学或酶促或机械切割。在连接/切割测序的情况下,可以通过限制酶的加入来进行切割反应。可以从反应混合物除去释放的携带珠粒的探针和/或碱基,然后确定珠粒的特性。
在其中仅使用一种类型的珠粒和释放系统的情形中,在上述步骤中仅检查单一测试探针组。在该情况下应当通过连续使用每一个组的探针(当每个循环中测定单一碱基时该组探针包括4个组,或者当在每个循环中测定2种碱基时包括16个组等)来重复该步骤。一旦已经使用所有组的探针,或者已经测定该碱基(一种或多种)的特性,就认为完成了测序的循环。当在以上步骤中一次使用多于一组的探针时,可以通过进行那些步骤仅足够的次数来完成循环,使得使用所有组,例如,当16组探针连同4种区分标记一起使用时,每组步骤可以进行4次,其中每当完成测序步骤时评估4组探针的结合。在完成循环并在该循环中已确定待测序的一个或多个碱基以后,可以重复循环。因此,优选地,如上文描述的方法包括以下步骤:加入有关酶,洗涤复合物以除去未结合酶、探针、碱基或珠粒。
现将通过非限制性实施例并参照附图来描述本发明,其中:
图1示出了通过使用本发明的方法合成测序。将用于测定序列的多核苷酸(2)固定至固体载体(1)并且将链终止碱基(A、T、G和C)连续加入反应中使用DNA聚合酶用于链延伸。因此,分别加入链终止碱基A、T、G和C。在A(3)的情况中,将互补碱基插入多核苷酸中并且将珠粒连接至接头(4),其将结合并特异于加入的插入碱基(通过结合伴侣)。因此将珠粒标记连接至插入的碱基并且通过珠粒的存在可以检测该碱基。
图2示出了通过使用本发明的方法利用连接酶测序。将用于测定序列的多核苷酸固定至固体载体并且将珠粒标记的探针加入到多核苷酸中,通过连接酶该珠粒标记的探针可插入或可能不插入多核苷酸中。在这种情况下,探针中的7个碱基是完全不同的(简并的)并因此必须产生代表所有不同组合的探针组。一旦加入互补的探针,通过连接酶将其插入序列中并且能够通过连接至该探针的珠粒的特性来检测。
图3示出了通过逐步连接和切割的测序,其中利用本发明的方法。因此,将其序列待确定的多核苷酸(DNA)固定于固体载体,其中多核苷酸具有突出部分(AGC)。产生探针,其也具有突出部分(在相对于多核苷酸的突出部分的相反链上),其中最外面的碱基是已知的并且其它2个碱基是简并的。探针标记有4种不同的珠粒,各自表示一种碱基,并被并入多核苷酸。利用连接酶,将具有相对于多核苷酸的互补突出部分的探针并入多核苷酸。因此借助于珠粒特性,可以检测探针的加入以及已知的碱基。在已确定珠粒标记以后,利用核酸酶,可以在箭头所示位置切割多核苷酸/探针复合物。这切割了复合物,致使在原始多核苷酸中末端C残基的除去,然后可以使少一个碱基的多核苷酸经受另一轮的探针的连接和切割。
图4示出3D印刷单元,其置于包装的图像芯片上以产生流动池。
图5示出流动池的横截面,其中流动池置于粘合(glued)和结合于印刷电路板的″裸模(baredie)″图像芯片上。
图6示出另一个流动池的3D图片,其中该流动池具有较好的流体流动特性,并置于粘合和结合于印刷电路板的″裸模″图像芯片上。
图7示出图像芯片的完整系统的示意图。
图8示出在实施例1中描述的测序程序。
图9示出在实施例1中描述的测序程序,其中使用了多种切割酶。
图10示出了如在实施例3中描述的所制备的压花玻璃(图案化玻璃,patternedglass)表面。
图11示出了玻璃表面的差示干涉差显微图像(differentialinterferencecontrastmicroscopyimage),该玻璃表面携带如在实施例3中描述的所制备的磁珠。
实施例1:通过顺次连接和切割进行的测序
仪器的制备
将MicronMT9T001(Aptina)3兆像素CMOS数字图像传感器焊接到印刷电路板(PCB)上并通过连接于来自AnalogDevices的Blackfin微控制器来测试功能,该微控制器是一种使用PPI(并行外围接口)的微控制器。
在焊接于PCB以后,通过金刚石切割器,从CMOS数字图像传感器,小心除去保护玻璃,并通过用纯乙醇进行洗涤来清洗芯片表面。通过使内室暴露于丙酮15分钟除去微透镜和Bayer滤波器,其后通过用塑料牙签小心刮划除去上层。
流动池的装配
通过3D印制(printing),由塑料制备流动池(图4),使得它适合与MT9T001CMOS数字图像传感器的大小并使得流体能够流动到活性表面和从活性表面流动,其中通过可以经由柔性塑料管连接的入口和出口(10)。
使环氧胶的薄层分布于边缘,例如,通过相对于流体胶的薄层冲压。然后将它放置在芯片上,并使得环氧胶硬化。对于一些芯片,在此阶段除去微透镜和Bayer滤波器。在定位盖玻片以前,使连同NTC电阻器一起的电阻器网络(用作温度传感器)适应区室(compartment)。与控制电路的电连接是通过连接器,其突出通过在流动池中的切口(14)。
将盖玻片放置在顶部,从而覆盖内室和外室,并且外室通过入孔(12)填充有环氧胶,通过出孔(13)使空气排出。从而密封内室,并保护芯片的外区和所有开放的接合线。
基于晶片(裸模)的芯片装置(裸模)
在装配Bayer滤波器以及任何其它滤波器和透镜以前,从正常生产线除去晶片。可替换地,这些可以在进一步制备以前用NaOH除去。用来增强聚合物固定(锚定,anchorage)的任何制备现可以方便地进行,例如敷金属,其中利用保护连接区域的掩模。以正常方式测试晶片并切成芯片(裸模)。图5和图6示出芯片装置。借助于金线并通过粘接(15)将芯片(25)连接于板。将反应室单元放置在芯片的顶部。然后首先将它粘合到芯片,接着通过入口(12)将包含粘接连接的封闭容积填充环氧胶,同时在出口(13)处放出空气。
通过塑料管(11),将反应容积连接于流体供给和排出单元。这可以用于在一个单元中的小批量生产(通过透明塑料3D印制),同时其对于较大系列,它可以产生自,例如在两侧具有空腔的塑料片和扁平的透明片。通过研磨或通过模塑,前者可以产生自扁平片。
成像装置与控制和图像采集单元的连接
如图7所示,连接成像装置(17)。可以在Blackfin控制单元(18)中捕获图像,其中利用硬件加速(从图像芯片直接存取(memoryaccess)到RAM)。可以通过晶体或通过Blackfin来产生相对于图像芯片的时钟信号。通过利用uClinux分布,测试程序ppifcd_test,其连同程序包一起分配,可以捕捉到RAM磁盘文件。这描述于uClinuxwiki,参见以下链接:http://docs.blackfin.uclinux.org/doku.php?id=frame_capture_device。在此链接中的文本的拷贝作为附录1,但需改性以除去非功能性连接。
然后可以经网络(如果使得具有以太网控制器的开发板)将此文件转移到计算机(19),其中通过利用NFS、tftp、ftp等,或利用USB。
成像装置与流体供应单元的连接
如图7所示,进一步将成像装置(17)连接于流体供应单元。流体供应由多个单独的流体容器(20)组成,各自配有其自身的电机控制注射器以驱使流体通过管道(21)流到分流管(22)并进一步到成像装置(17)。将使用过的流体排入容器。
图像芯片的硅烷化:
通过在NaOH(1M)中浸泡芯片1小时,用水冲洗并在氮气流下干燥,来官能化表面。为了产生带负电荷的表面,利用HCl(1M)代替NaOH来重复此程序。为了硅烷化,在室温下,用在干丙酮中的5%溶液(容积/容积)(3-氨基丙基)三乙氧基硅烷(CAS:919-30-2)来覆盖图像芯片1小时。然后用丙酮洗涤图像芯片三次,其中利用5分钟温育时间。然后在乙醇中冲洗芯片,并其后在N2气体下干燥。通过异双功能连接物间-马来酰亚胺基苯甲酰-N-羟基磺基琥珀酰亚胺酯(s-MBS)(20mM)在PBS(0.1MNaH2PO4、0.15MNaCl,(pH7.2))中的溶液中温育图像芯片5小时进行交联。然后在PBS中洗涤图像芯片,浸泡在去离子水中,然后浸泡在乙醇中,最后在氮气流中干燥。
固定DNA到图像芯片的制备和连接
将待测序的DNA连接于在芯片表面上的固定DNA。通过共价键,将固定DNA连接于芯片。可以通过退火两个寡核苷酸来制备固定DNA,其中上述两个寡核苷酸形成双链DNA分子,其包含在一端的硫醇以及其中另一端是粘性的。(它还可以通过适宜质粒的部分的PCR扩增形成,其中引物之一被5′-硫醇化。然后利用限制酶将获得粘性末端。)为了激活5′硫醇,需要将二硫键(S-S)还原成自由硫醇(H-S)。这是通过在Tris-HCl(0.1M,pH7.5)中的还原剂Tris(2-羧乙基)膦盐酸盐(Tris(2-carboxyethyl)phosphinehydrochloride)(TCEP)(10mM)中温育制备的固定DNA两小时来实现。然后按照指导手册通过Biospin30柱(Bio-Rad)并通过用NaPi缓冲液(NaH2PO4(0.1M,pH6.5)、NaCl(0.15M))洗脱DNA来纯化固定DNA。然后在NaPi缓冲液中稀释固定DNA至0.01μM的最终浓度。将还原和纯化的固定DNA立即施用于图像芯片并在潮湿环境下温育5小时。然后用NaPi冲洗图像芯片,在NaPi中的巯基乙醇(10mM)中阻滞1小时,接着再次用NaPi冲洗。然后用NaCl(1.5M)在NaH2PO4(10mM,pH7.0)中的溶液冲洗它,并用这种溶液温育5分钟,以消除多核苷酸与芯片表面的非特异性结合。其后,用5xSSC(0.075M柠檬酸钠,0.75MNaCl(pH7.0))、用0.1%的吐温20、用恰好5xSSC冲洗它,并存储于4℃下的5xSSC中直到进一步使用。
通过顺次连接和切割进行测序
珠粒:链霉亲和素涂布的2.8μm顺磁珠
探针:探针的4种不同的混合物由34个碱基对组成,其中在一端具有5′端突出3个碱基突出端以及在另一端具有多种生物素。在每种探针混合物(A、C、G、和T)中,一个碱基保持不变,在突出端中的其它碱基则是完全变化的。选择用来固定的碱基是最靠近连接点的碱基。探针的5′端并不包含磷酸盐以避免在两个探针之间的连接。
用于测序的靶标和珠粒的制备
为了确保在测序反应中所使用的限制酶的识别序列(EarI,在图8中)并不存在于待测序的DNA中,进行借助于上述酶的切割步骤。然后在雾化器或HydroShear装置(设置为3000个碱基对的平均长度)中将DNA剪切成片段。可以通过在琼脂糖凝胶上分离DNA,接着通过纯化期望长度的片段,来减小尺寸分布。在剪切过程中获得的在DNA中的单链缺口需要使用T4DNA连接酶。DNA聚合酶用来填充或除去突出端(例如,DNA聚合酶I,较大(克林诺)片段)。
在图8中靶标以标记为31的片段示出。适配体(adapter)32是固定适配体。在第一测序步骤中,适配体33需要用于随后连接于测序探针。如果这些适配体具有大约相同长度,则以相同量来提供它们。适配体32包含互补于在载体上的固定DNA的粘性末端的区,因而可以被连接于它们。适配体33包含限制位点(阴影线区域),其用来除去连接于生物素(空心圆)的珠粒,以及是足够长以使得能够酶接近珠粒进行操作。
如在来自Dynal的产品指南中描述的并利用程序″核酸的固定″来制备珠粒。
进一步的程序如下,参照图8。
将适配体连接于靶标:通过2步连接,将两个适配体(32和33)连接于靶标DNA。首先,过量供应一种适配体,连同400粘性单元(U)的T4DNA连接酶。在25℃下进行连接2小时。然后利用PCR纯化来纯化连接产物,其将除去非连接的适配体片段(由于它们的较小尺寸)。在纯化以后,过量供应其它适配体,连同400粘性单元(U)的T4DNA连接酶。除想要产物32-31-33以外,将出现产物32-31-32、33-31-33和一些自连接的靶标DNA。在上述方法中,32-31-32和33-31-33产物并不是有害的,这是因为它们将分别仅关联于图像芯片或关联于珠粒。自连接的靶标DNA将并不关联于芯片或珠粒。
然而,如果连接在一起的两个适配体(32-33)足够小以致通过PCR纯化被除去,则仅需要1次连接,以及通过加入过量的按比例(其使得它们以相同概率连接于31,如下文描述的)的两种适配体来进行。
过量供应两种适配体,连同400粘性单元(U)的T4DNA连接酶,并按一定比例,其使得它们以相同概率连接于31。在25℃下进行连接2小时。除想要产物32-31-33以外,还出现许多32-33连接产物(连接在一起的两个适配体)、产物32-31-32和33-31-33,以及自连接的靶标DNA。通过在琼脂糖凝胶上的分离,接着DNA纯化,来除去产物32-33和自连接的靶标DNA。在上述方法中,32-31-32和33-31-33产物并不是有害的(如上文所讨论的)。
将产物加入图像芯片:将小部分的得到的产物混合物加入装配的流动池,以及400U的T4DNA连接酶。
将产物连接于在图像芯片上的固定DNA:将32-31-33产物连接于固定DNA的粘性末端(在图8中的34),其是在像素窗口中过量制备。在25℃下进行连接10分钟。此后,用适用于珠粒结合的缓冲液洗去未反应分子和酶。
加入和检测链霉亲和素涂布的珠粒:加入大约2x106个珠粒并温育30分钟。每分钟轻轻摇动装配的流动池5秒。通过小心洗涤来除去所有未结合的珠粒。登记珠粒的图像,同时施加向上磁场以稳定珠粒。
检查珠粒密度:检查图像以看到5至10%的像素具有被加以定位以主要在一个像素上产生阴影的珠粒。如果存在太少的珠粒,则重复来自″将产物加入图像芯片″的程序。
利用Earl进行切割,除去带有切割的片段的珠粒:用限制酶缓冲液进行洗涤,然后在它的反应缓冲液中加入1U的核酸酶FastDigest(FD)Earl(Fermentas)并在37℃下进行切割5分钟。用适合于T4DNA连接酶的缓冲液洗去连接于释放片段的核酸酶和珠粒。登记剩余珠粒的图像,同时施加向上磁场。
还进行这种方法,其中使用对于适配体具有特异性的不同的限制酶。在这种情况下,用限制酶缓冲液进行洗涤,然后在它的反应缓冲液中加入适量的限制酶并进行切割,直到已切割大多数探针。如上述,洗涤连接于释放片段的核酸酶和珠粒。如上述,登记剩余珠粒的图像。
通过顺序连接和切割进行测序
加入4探针混合物之一:连同400U的T4DNA连接酶和它的反应缓冲液一起加入A型探针(35)。
连接匹配探针:在25℃下温育10分钟期间,使得能够匹配探针退火并连接于切割的片段。用适用于珠粒结合的反应缓冲液洗去连接酶以及未结合的探针。
加入和检测链霉亲和素涂布的珠粒:如上文所述,加入珠粒并登记图像。
释放测序珠粒,登记供证实:按照早先描述为″利用Earl进行切割,除去带有切割的片段的珠粒″的程序。
重复上述步骤,每次加入不同的(C、G或T,然后再次A)探针类型。重复进行,直到在每个循环中登记的珠粒的数目大大减少或在大多数像素中读取固定序列,其表明已完成大多数靶标读数。
按照本发明的测序方法可以在逐步连接和切割方法中使用多种切割酶进行。该方法如下进行。所使用的方案示于图9。
如上文所述,使用探针的4种不同的混合物,其中每种探针混合物具有用于不同限制酶的限制位点。适配体(33)具有这些限制位点的一种。方法进行如下:
通过顺序连接和切割进行的测序
加入4种探针混合物的一种:连同400U的T4DNA连接酶和它的反应缓冲液一起加入探针。
连接匹配探针:在25℃下温育10分钟期间使得能够匹配探针退火和连接于切割的片段。用适用于珠粒结合的反应缓冲液洗去连接酶以及未结合的探针。
加入和检测链霉亲和素涂布的珠粒:如上文所述,加入珠粒并登记图像。
释放测序珠粒:加入识别4种探针混合物之一的限制酶。在完成酶反应以后,洗去酶和释放的探针,并登记剩余珠粒的图像,同时施加向上磁场。然后,重复此步骤,其中通过逐个地分别加入识别探针混合物2、3和4的限制酶。
通过加入探针混合物重复上述步骤,直到在每个循环中登记的珠粒的数目大大减少或在大多数像素中读取固定序列,其表明已完成大多数的靶标读数。
实施例2:用于图像芯片的表面改性的程序,其中通过硅烷化并利用 APTE以及交联与戊二醛
此程序是硅烷化芯片表面的另一种方式。该程序是Howarteretal(2006,Langmuir,22,p11142-11147)、Aksyonovetal(Anal.Biochem.,2006,348,p127-138)、和Wangetal(J.Agric.FoodChem.,2007,55,p10509-10516)的那些程序的改进。具有5′-胺基的DNA可以结合于交联剂的醛基团,以及胺基可以构成固定DNA的一部分,其是以相同方式,如同在实施例1中5′-硫醇基团连接于固定DNA。
1.在1MNaOH溶液中浸泡芯片1小时。
2.用去离子水充分冲洗芯片并在氮气流下干燥。
3.用1MHCl溶液处理芯片1小时以产生带负电荷的表面。
4.用去离子水充分冲洗芯片并在氮气流下干燥。
5.将芯片移动到手套箱,其中湿度和氧气水平为0.1ppm。用5%(3-氨基丙基)三乙氧基硅烷(APTES)在无水甲苯中的溶液处理芯片1小时。
6.用无水甲苯冲洗。
7.将芯片移动到标准大气压,然后用甲醇并其后用去离子水冲洗。在去离子水中温育24小时以完全水解在芯片上的APTES分子。
8.在氮气下干燥芯片。
9.在~120℃下烘1小时。
10.对于交联:在10×磷酸盐缓冲盐水(PBS)溶液中的5%戊二醛溶液中浸泡芯片过夜。
11.用去离子水洗涤并在氮气流下干燥。
12.在被干燥以后,可以将醛改性载玻片存储在4℃的暗处。
附录1
PPI架捕获装置
PPI架捕获装置(PPIFCD)是CMOS相机,经由并行外围接口,其连接于Blackfin。它旨在仅捕捉单帧。目前支持两个相机传感器。
此处参见:v4l_blackfin_相机,对于支持若干传感器的v4l视频驱动程序。
MicronMT9T001
可以利用MicronMT9T001来制备PPIFCD。它利用标准内部IC总线和可编程标志来控制相机(例如,来除去备用方式等)。
使用PPIFCD的程序
ppifcd_test
PPIFCD架捕获驱动程序测试应用(FrameCaptureDrivertestapplication)目的在于看看是否数字图像传感器可以有效地拍摄照片,其通过PPI端口连接于靶标板。它记录行时间、总帧时间、总帧捕获时间、和拍摄的相片。如果打印的数据是如预期的,则情况合格,否则失败。
fcd
此程序服务基于CGI的网页,其使得能够用户指定设置、捕获帧、和证实相机的整体操作。
配置uClinux内核
BlackfinPPI支持若干子插件板,PPIFCD是一种。然而,如果启用两者,则PPI驱动程序将与PPI相机帧捕获驱动程序发生冲突。当PPI驱动程序试图登记用于字符装置(chardevice)的相同主设备号(majornumber)时,你将在内核日志中看到这种情况(即,显示开机信息(dmesg))。
以下是用于BF533和BF537STAMP板的一些配置设置。为获得任何一种上述程序,指定以下内容:
在定制供应商/用户设置下
==选择Blackfin测试程序==
启用PPIFCD测试程序
==选择Blackfinapp程序==
启用用于PPI帧捕获驱动程序的基于CGI的测试应用程序
BF533-STAMP板
如此处描述的,已知,在以下设置下BF533-STAMP板与PPIFCD一起工作:
在定制内核设置下
==选择装置驱动程序==
==选择字符装置==
启用[*]BlackfinBF53x可编程标志驱动程序
启用[*]BlackfinBF5xxPPI相机帧捕获驱动程序
[]BlackfinBF5xxPPI驱动程序
==选择I2C支持==
启用I2C支持
启用I2C设备接口
选择I2C硬件总线支持
启用GenericBlackfin和HHBF533/561开发板I2C支持
选择BFINI2CSDA/SCL选择
设置(2)SDA是PF[0:15]
设置(1)SCL是PF[0:15]
BF537-STAMP板
BF537具有内置的两线接口外围并且不同于BF333,并不需要通用的I2C支持。
在定制内核设置下
==选择装置驱动程序==
==选择字符装置==
启用[*]BlackfinBF53x可编程标志驱动程序
启用[*]BlackfinBF5xxPPI相机帧捕获驱动程序。
[]BlackfinBF5xxPPI驱动程序
==选择I2C支持==
启用I2C支持
启用I2C设备接口
选择I2C硬件总线支持
启用BlackfinTWII2C支持
实施例3:通过化学气相沉积与平版印刷术图案化的硅烷化
在类似于芯片表面的玻璃表面上进行。使用载玻片用于该方法。首次使用丙酮清洗该玻璃表面,然后快速通过异丙醇清洗,然后丙酮干燥,使用氮气干燥异丙醇。然后利用氧等离子体处理(在来自Diener的Femto中,以100%氧气流和100%功率进行1分钟)彻底清洗基板。
图案化
将彻底清洗的基板放置在旋涂仪(spincoater)上,并且将足够的正性抗蚀剂SPR-700(约0.25ml)放置在表面上并以参数2000RPM在250RPM/s下旋转90秒。手动的除去边缘珠粒并且该基板在95℃下软烤(softbake)60秒。然后通过掩模将基板暴露于紫外光,在215w/cm2下产生图案。在115℃下进行曝光后烘烤(postexposurebake)60秒。然后在显影剂MF26-A中洗涤玻璃表面,无金属离子的显影剂(ametalionfreedeveloper)用于MicropositS1800G2系列和SPR700系列。参见图10,该表面具有可视的玻璃表面的正方形岛。
3-缩水甘油氧基丙基三甲氧基硅烷的化学气相沉积
在100%氧气气流和100%功率下使用等离子处理基板2分钟。处理的区域具有活性氧基团,并且将其与容器中的0.2ml3-缩水甘油氧基丙基三甲氧基硅烷(GOPS)一起放置在干燥器中。使用Veeco真空泵或中心真空管线降低压力。该基板在低压下温育至少2.5小时,以便确保GOPS在图案化的正方形岛上化学气相沉积。除了在岛上以外,在载玻片上图案化的区域被划线,然后进行离脱(lift-off)处理以便从玻璃表面除去硅烷基团。当强力旋转容器时,将抗蚀剂在丙酮浴中溶解3-4分钟,然后将其移至异丙醇浴中10秒并且使用氮气干燥。
DNA的固定
将含有生物素末端的PCR产物液滴(20-30ml)放置在图案化的区域并且在室温下于潮湿空气中温育至少7小时。在温育之后,在PBS-T中洗涤基板,然后在PBS中洗涤并且然后在蒸馏水中洗涤。在洗涤之后将基板放置在pH9.0包含SDS(0.1%)与氨乙醇(50mM)的Tris-HCl缓冲液(0.05M)中并且在37℃下于潮湿空气中温育至少8小时。这避免了链霉亲和素偶联的磁珠的非特异性结合。该温育之后,再使用PBS(该PBS包含5%牛血清蛋白)进行另一个温育步骤。进行该步骤以便阻断表面区域。
使用差示干涉差显微镜检测
根据Invitrogen手册所提出的,制备约10ml链霉亲和素偶联的珠粒,DynabeadsM-270链霉亲和素。将约30-40ml放置在玻璃表面上的划线区域上并且在室温下于50RPM的旋转台上温育20分钟。然后将基板放置在结合&洗涤(B&W:10mMTris-HCl(pH7.5),1mMEDTA,2MNaCl)溶液中并在室温下以80RPM旋转1-2分钟。重复最后的步骤,并且然后在室温下于Panhorst溶液(50mMNa2HPO4、10mMTris-Base、5mMEDTA、0.1%SDS、0.01%月桂酰肌氨酸、0.01%Tween20、0.01%TritonX100、0.1MNaCl、0.5%PEG4000,用乙酸将pH调节至8.5)中以100RPM洗涤两次基板。然后将基板放置在Tris-HCl缓冲液中并且使用差示干涉差显微镜检查。结果参见图11。

Claims (18)

1.一种用于确定固定在固体载体上的单一多核苷酸的核苷酸序列的方法,包括以下步骤:
(i)使所述多核苷酸与至少一种测试互补碱基和/或至少一种探针接触,所述探针包括可与所述多核苷酸中的一个或多个碱基互补的部分,珠粒连接至所述至少一种测试互补碱基和/或至少一种探针或者结合对的第一结合伴侣连接至所述至少一种测试互补碱基和/或至少一种探针,并且当所述测试互补碱基和/或所述测试互补探针的部分与所述多核苷酸中的所述一个或多个碱基互补时,所述测试互补碱基和/或探针共价结合至所述多核苷酸;
(ii)当结合伴侣连接至所述测试互补碱基和/或探针时,通过所述结合对,将连接至所述结合对的第二结合伴侣的珠粒结合至所述测试互补碱基和/或探针,所述第一结合伴侣连接至所述测试互补碱基和/或探针;
(iii)可选地,使用至少一种不同的测试互补碱基和/或探针,重复步骤(i)、或步骤(i)与步骤(ii),直到与所述一个或多个碱基互补的测试碱基和/或其部分与所述一个或多个碱基互补的测试探针已结合至所述多核苷酸;
(iv)通过确定步骤(i)至步骤(iii)期间连接至所述测试互补碱基和/或探针的所述珠粒是否结合至所述多核苷酸,来确定哪种测试互补碱基和/或所述测试探针的哪个互补部分结合至所述多核苷酸的所述一个或多个碱基,从而识别所述多核苷酸的所述一个或多个碱基;以及
(v)如果在步骤(iv)期间没有除去珠粒,则除去所述珠粒;
其中,步骤(i)至步骤(v)的每一个循环进行一次或多次,并且在每一个循环中识别所述序列的一个或多个碱基,
其中,利用包括提供有一个或多个光敏元件的表面的设备来检测所述珠粒,并且所述检测是通过检测由于所述珠粒阻止光到达所述一个或多个光敏元件所产生的光改变。
2.根据权利要求1中所述的方法,其中,至少进行两次循环。
3.根据权利要求1所述的方法,其中,通过连接或聚合进行所述互补碱基和/或所述探针的共价结合。
4.根据权利要求1所述的方法,其中,所述方法是通过合成测序、通过连接测序或通过逐步连接和切割测序中的一种。
5.根据权利要求1所述的方法,其中,所述方法包括以下步骤:
(i)使所述多核苷酸与至少一种测试探针以及可选地至少一种测试互补碱基接触,至少一种所述测试探针包括可与所述多核苷酸中的一个或多个碱基互补的部分,至少一种所述测试互补碱基可与所述多核苷酸中的碱基互补,珠粒连接至至少一种所述测试探针或至少一种所述测试互补碱基,或结合对的第一结合伴侣连接至至少一种所述测试探针或至少一种所述测试互补碱基,并且当所述测试互补碱基和/或所述测试互补探针的部分与所述多核苷酸中的所述一个或多个碱基互补时,通过将所述探针连接至所述多核苷酸,将所述测试互补碱基和/或探针共价结合至所述多核苷酸;
(ii)当结合伴侣连接至所述测试互补碱基和/或探针时,通过所述结合对,将连接至所述结合对的第二结合伴侣的珠粒结合至所述测试互补碱基和/或探针,所述第一结合伴侣连接至所述测试互补碱基和/或探针;
(iii)可选地,使用至少一种不同的测试互补碱基和/或探针重复步骤(i)、或步骤(i)与步骤(ii),直到与所述一个或多个碱基互补的测试碱基和/或其部分与所述一个或多个碱基互补的测试探针已结合至所述多核苷酸;
(iv)在每一步骤(i)、或步骤(i)与步骤(ii)之后、或在步骤(iii)之后,如果所述测试探针结合至所述多核苷酸,则加入能够除去所述珠粒的酶,所述酶通过切割反应除去至少一部分的所述测试探针和待测序的多核苷酸的至少一个碱基;以及
(v)通过确定步骤(i)至步骤(iii)期间连接至所述测试互补碱基和/或探针的所述珠粒是否结合至所述多核苷酸,来确定哪种测试互补碱基和/或所述测试探针的哪个互补部分结合至所述多核苷酸的所述一个或多个碱基,从而识别所述多核苷酸的所述一个或多个碱基;
其中,步骤(i)至步骤(v)的每一个循环进行一次或多次,并且在每一个循环中识别所述序列的一个或多个碱基。
6.根据权利要求5所述的方法,其中,所述酶是核酸酶,所述核酸酶具有不同于其识别位点的切割位点,并且所述测试探针包括针对所述核酸酶的识别位点。
7.根据权利要求6中所述的方法,其中,所述酶是限制酶。
8.根据权利要求7中所述的方法,其中,所述限制酶是IIb型限制酶。
9.根据权利要求1至8中任一项所述的方法,其中,在步骤(iv)中依次使用各自能够从不同的测试互补探针中除去珠粒的多种酶。
10.根据权利要求1至8中任一项所述的方法,其中,确定步骤(iv)或步骤(v)包括确定与所述珠粒相关的信号的存在、不存在或水平,其中所述信号的存在指示所述测试碱基和/或探针的结合。
11.根据权利要求10中所述的方法,其中,确定在所述切割步骤之前和之后与所述珠粒相关的信号水平,并且切割之后信号的降低指示所述测试碱基和/或探针。
12.根据权利要求1至8中任一项所述的方法,其中,所述珠粒的半径大于所述多核苷酸的长度。
13.根据权利要求1至8中任一项所述的方法,其中,所述探针或者所述珠粒与所述测试互补探针和/或碱基之间的连接包括针对限制酶的识别位点。
14.根据权利要求1至8中任一项所述的方法,其中,所述珠粒是磁性的。
15.根据权利要求1至8中任一项所述的方法,其中,所述互补碱基或探针在结合进一步的互补碱基或探针时终止。
16.根据权利要求1至8中任一项所述的方法,其中,在所述互补碱基和/或探针结合至所述多核苷酸之前或之后,将所述珠粒连接至所述互补碱基和/或所述探针。
17.根据权利要求14所述的方法,其中,通过其磁性来除去和/或检测所述珠粒。
18.根据权利要求1至8中任一项所述的方法,其中,所述固体载体是芯片。
CN201180057746.0A 2010-09-30 2011-09-30 测序方法 Expired - Fee Related CN103249843B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB1016484.6 2010-09-30
GBGB1016484.6A GB201016484D0 (en) 2010-09-30 2010-09-30 Method
PCT/EP2011/067200 WO2012042052A1 (en) 2010-09-30 2011-09-30 Method of sequencing

Publications (2)

Publication Number Publication Date
CN103249843A CN103249843A (zh) 2013-08-14
CN103249843B true CN103249843B (zh) 2015-11-25

Family

ID=43243311

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201180057769.1A Expired - Fee Related CN103261440B (zh) 2010-09-30 2011-09-30 测序方法
CN201180057746.0A Expired - Fee Related CN103249843B (zh) 2010-09-30 2011-09-30 测序方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201180057769.1A Expired - Fee Related CN103261440B (zh) 2010-09-30 2011-09-30 测序方法

Country Status (7)

Country Link
US (2) US10167504B2 (zh)
EP (2) EP2622096A1 (zh)
CN (2) CN103261440B (zh)
AU (2) AU2011310055A1 (zh)
CA (2) CA2812904A1 (zh)
GB (1) GB201016484D0 (zh)
WO (2) WO2012042052A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201016484D0 (en) 2010-09-30 2010-11-17 Geneseque As Method
GB201215435D0 (en) * 2012-08-30 2012-10-17 Geneseque As Sequencing method
GB201413929D0 (en) 2014-08-06 2014-09-17 Geneseque As Method
EP3288973B1 (en) * 2015-04-30 2021-10-20 AbCheck s.r.o. Method for mass humanization of rabbit antibodies
EP3394292B1 (en) * 2015-12-21 2021-04-28 RealSeq Biosciences, Inc. Methods of library construction for polynucleotide sequencing
US10538808B2 (en) 2017-05-26 2020-01-21 Vibrant Holdings, Llc Photoactive compounds and methods for biomolecule detection and sequencing

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100009354A1 (en) * 2006-02-20 2010-01-14 National University Corporation Hokkaido University Method for determining base sequence of dna

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NO155316C (no) 1982-04-23 1987-03-11 Sintef Fremgangsmaate for fremstilling av magnetiske polymerpartikler.
DE68909445T2 (de) 1988-02-26 1994-05-11 Profile Diagnostic Sciences Methode zur Bestimmung genetischer Sequenzen und Testsatz hierfür.
US5552278A (en) 1994-04-04 1996-09-03 Spectragen, Inc. DNA sequencing by stepwise ligation and cleavage
US5714330A (en) 1994-04-04 1998-02-03 Lynx Therapeutics, Inc. DNA sequencing by stepwise ligation and cleavage
US5599668A (en) 1994-09-22 1997-02-04 Abbott Laboratories Light scattering optical waveguide method for detecting specific binding events
US5750341A (en) 1995-04-17 1998-05-12 Lynx Therapeutics, Inc. DNA sequencing by parallel oligonucleotide extensions
GB9620209D0 (en) 1996-09-27 1996-11-13 Cemu Bioteknik Ab Method of sequencing DNA
US6046005A (en) 1997-01-15 2000-04-04 Incyte Pharmaceuticals, Inc. Nucleic acid sequencing with solid phase capturable terminators comprising a cleavable linking group
NO986133D0 (no) 1998-12-23 1998-12-23 Preben Lexow FremgangsmÕte for DNA-sekvensering
US6994971B1 (en) 1999-10-08 2006-02-07 University Of Utah Research Foundation Particle analysis assay for biomolecular quantification
ATE356222T1 (de) 2000-10-06 2007-03-15 Univ Columbia Massives parallelverfahren zur dekodierung von dna und rna
US20020168663A1 (en) 2001-02-27 2002-11-14 Phan Brigitte Chau Methods for DNA conjugation onto solid phase including related optical biodiscs and disc drive systems
US20030027140A1 (en) 2001-03-30 2003-02-06 Jingyue Ju High-fidelity DNA sequencing using solid phase capturable dideoxynucleotides and mass spectrometry
JP2005513475A (ja) 2001-12-21 2005-05-12 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ マイクロアレイ上の磁気ナノ粒子の領域密度を測定するセンサー及び方法
US6989235B2 (en) 2002-02-13 2006-01-24 Motorola, Inc. Single molecule detection of bio-agents using the F1-ATPase biomolecular motor
AUPS159702A0 (en) 2002-04-09 2002-05-16 Tong, Sun Wing Molecular detection and assay by magneto-thermal biochip micro-assay
US7074597B2 (en) 2002-07-12 2006-07-11 The Trustees Of Columbia University In The City Of New York Multiplex genotyping using solid phase capturable dideoxynucleotides and mass spectrometry
AU2003267583A1 (en) 2002-09-19 2004-04-08 The Chancellor, Master And Scholars Of The University Of Oxford Molecular arrays and single molecule detection
EP1578952B1 (en) 2002-12-12 2011-11-23 Nanosphere, Inc. Direct snp detection with unamplified dna
DE602004036672C5 (de) 2003-01-29 2012-11-29 454 Life Sciences Corporation Nukleinsäureamplifikation auf Basis von Kügelchenemulsion
GB0308851D0 (en) 2003-04-16 2003-05-21 Lingvitae As Method
US20050250094A1 (en) 2003-05-30 2005-11-10 Nanosphere, Inc. Method for detecting analytes based on evanescent illumination and scatter-based detection of nanoparticle probe complexes
US20050170367A1 (en) 2003-06-10 2005-08-04 Quake Stephen R. Fluorescently labeled nucleoside triphosphates and analogs thereof for sequencing nucleic acids
US7585664B2 (en) 2004-10-14 2009-09-08 The Hong Kong University Of Science And Technology Integrated circuit optical detector for biological detection
WO2006131892A2 (en) 2005-06-09 2006-12-14 Koninklijke Philips Electronics N.V. Amplification of nucleic acids with magnetic detection
CN102925561B (zh) 2005-06-23 2015-09-09 科因股份有限公司 用于多态性的高通量鉴定和检测的策略
WO2007092941A2 (en) 2006-02-08 2007-08-16 Oxonica, Inc. Sers nanotag assays
KR100702415B1 (ko) 2006-03-03 2007-04-09 안웅식 올리고 핵산 탐침 비드 어레이를 이용한 인유두종바이러스검출 키트 및 방법
US20100120132A1 (en) 2006-03-31 2010-05-13 Intel Corporation Bioassays by direct optical detection of nanoparticles
JP2009538123A (ja) 2006-04-19 2009-11-05 アプライド バイオシステムズ, エルエルシー ゲル非含有ビーズベースの配列決定のための試薬、方法およびライブラリー
US20080182235A1 (en) 2007-01-30 2008-07-31 Celsis International Plc Detection of Analytes in Samples Using Liposome-Amplified Luminescence and Magnetic Separation
EP2191016B1 (en) 2007-08-20 2015-03-04 The General Hospital Corporation Isolation of protein factors that associate directly or indirectly with nucleic acids
EP2060637A1 (en) 2007-11-14 2009-05-20 Koninklijke Philips Electronics N.V. Means and methods for detection of nucleic acids
CN101918590B (zh) 2007-12-10 2013-03-27 高晓莲 核酸测序
US20090181853A1 (en) * 2008-01-11 2009-07-16 Peter Brian J Array-based method for performing genomic analysis
CN101245390B (zh) 2008-04-03 2013-05-01 毅新兴业(北京)科技有限公司 一种检测snp的磁珠系统及其使用方法
US20100035252A1 (en) 2008-08-08 2010-02-11 Ion Torrent Systems Incorporated Methods for sequencing individual nucleic acids under tension
US20110171749A1 (en) 2009-03-02 2011-07-14 Board Of Trustees Of Michigan State University Nanoparticle tracer-based electrochemical dna sensor for detection of pathogens-amplification by a universal nano-tracer (aunt)
GB0904934D0 (en) 2009-03-23 2009-05-06 Geneseqe As Method and apparatus for detecting molecules
GB201016484D0 (en) 2010-09-30 2010-11-17 Geneseque As Method

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100009354A1 (en) * 2006-02-20 2010-01-14 National University Corporation Hokkaido University Method for determining base sequence of dna

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
The challenges of sequencing by synthesis;CARL W FULLER ET AL;《NATURE BIOTECHNOLOGY》;20091101;第27卷(第11期);第1013-1023页 *
Visual DNA -identificcation of DNA sequence viriations by bead trapping;STAHL ET AL;《GENOMICS,ACADEMIC PRESS》;20071024;第90卷(第6期);第741-745页 *

Also Published As

Publication number Publication date
EP2622094A1 (en) 2013-08-07
US20140045703A1 (en) 2014-02-13
CN103261440B (zh) 2015-10-21
AU2011310054A1 (en) 2013-04-18
GB201016484D0 (en) 2010-11-17
US20140031239A1 (en) 2014-01-30
US9447465B2 (en) 2016-09-20
AU2011310055A1 (en) 2013-04-18
CN103261440A (zh) 2013-08-21
CA2812849A1 (en) 2012-04-05
WO2012042052A1 (en) 2012-04-05
WO2012042053A1 (en) 2012-04-05
CN103249843A (zh) 2013-08-14
CA2812904A1 (en) 2012-04-05
EP2622096A1 (en) 2013-08-07
US10167504B2 (en) 2019-01-01

Similar Documents

Publication Publication Date Title
CN103249843B (zh) 测序方法
EP2411788B1 (en) Method and apparatus for detecting molecules
US11933957B1 (en) Imaging system hardware
US10982260B2 (en) Sequencing by emergence
CN115698324A (zh) 用于整合原位空间测定的方法和组合物
US9536041B2 (en) Methods and devices for single-molecule whole genome analysis
CN105392898A (zh) 通过顺序杂交编条形码的分子多重标记
CN102918166A (zh) 用于纳米孔解链依赖性核酸测序的工具和方法
CN115176027A (zh) 用于光指导的生物分子条形码化的组合物和方法
US20200082913A1 (en) Systems and methods for determining sequence
TW202219490A (zh) 用於檢測樣本分析物之結構及方法
Castellarnau et al. Stochastic particle barcoding for single‐cell tracking and multiparametric analysis
CA2957326C (en) Method of sequencing immobilized polynucleotides
TW202242128A (zh) 用於檢測樣品分析物之結構及方法
JP2024512158A (ja) マイクロ流体デバイス上へのタンパク質共局在デバイス(pcd)の組み込み
JP2024507375A (ja) サンプル検体の検出のための構造体及び方法
ES2688363T3 (es) Detección instantánea de biomarcadores y usos de los mismos

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20151125

Termination date: 20160930

CF01 Termination of patent right due to non-payment of annual fee