具体实施方式
应理解,所公开的产品和方法的不同应用可根据本领域的具体需要进行修改。还应理解,本文使用的术语目的仅为描述本发明的具体实施方案,并不意欲进行限制。
另外,除非文中另有清楚的说明,当用于本说明书及所附的权利要求中时,单数形式―一个‖(―a‖、an‖和―the‖)包括复数指代对象。因此,例如,提到―一种分析物‖包括―两种或多种分析物‖,提到―一个检测器‖包括两个或多个这种检测器,提到―一个孔‖包括两个或多个这种孔,提到―一个核酸序列‖包括两个或多个这种序列,等等。
所有本文引用的出版物、专利和专利申请,不论上文还是下文,都以引用的方式全文纳入本文。
本发明的方法
本发明提供了一种确定分析物的存在、不存在或特征的方法。所述方法包括将所述分析物偶联到膜上并使所述分析物与所述膜中存在的检测器相互作用。从而确定所述分析物的存在、不存在或特征。在一个实施方案中,本发明提供了一种确定分析物的存在或不存在的方法,包括(a)将所述分析物偶联到膜上和(b)使所述分析物与所述膜中存在的检测器相互作用,从而确定所述分析物的存在或不存在。
如上所述,将所述分析物偶联到含有检测器的膜上,使需要的分析物的量减少了几个数量级。所述方法对于检测以低浓度存在的分析物来说显然是有利的。当所述分析物以约0.001pM至约1nM,例如低于0.01pM、低于0.1pM、低于1pM、低于10pM或低于100pM的浓度存在时,所述方法优选地能够确定所述分析物的存在或特征。
本发明的方法尤其有利于核酸测序,因为如上所述,从人血仅可获得少量纯化的核酸。所述方法优选地能够评估以约0.001pM至约1nM,例如低于0.01pM、低于0.1pM、低于1pM、低于10pM或低于100pM的浓度存在的靶多核苷酸的序列或对其进行测序。
将多核苷酸的一个末端偶联到膜上(甚至暂时地)还意味着可防止该末端干扰基于纳米孔的测序过程。这将参考本发明的外切核酸酶测序方法在下文更详细地论述。
本发明的方法可以包括确定或测量分析物例如多核苷酸的一个或多个特征。所述方法可包括确定或测量分析物例如多核苷酸的二、三、四或五或更多个特征。对于多核苷酸,所述一个或多个特征优选地选自(i)靶多核苷酸的长度,(ii)靶多核苷酸的种类,(iii)靶多核苷酸的序列,(iv)靶多核苷酸的二级结构以及(v)靶多核苷酸是否被修饰。可根据本发明确定或测量(i)至(v)的任意组合。所述方法优选地包括评估多核苷酸的序列或对其进行测序。
分析物
分析物可以是任何物质。适合的分析物包括但不限于,金属离子、无机盐、聚合物例如聚合的酸或碱、染料、漂白剂、药物、诊断剂、休闲类药物、爆炸物和环境污染物。
分析物可以是由细胞分泌的分析物。或者,分析物可以是存在于细胞内的分析物,这样使得在实施本发明之前必须从细胞提取分析物。
分析物优选地为氨基酸、肽、多肽、蛋白质或多核苷酸。所述氨基酸、肽、多肽或蛋白质可以是天然存在或非天然存在的。多肽或蛋白质中可以包括合成或修饰的氨基酸。许多不同类型的对氨基酸的修饰是本领域中已知的。为了本发明的目的,应该理解可以通过任何本领域中可用的方法修饰所述分析物。
蛋白质可以是酶、抗体、激素、生长因子或生长调节蛋白例如细胞因子。所述细胞因子可以选自白细胞介素,优选IFN-1、IL-2、IL-4、IL-5、IL-6、IL-10、IL-12或IL-13,干扰素优选IL-γ,或其他细胞因子例如TNF-α。蛋白质可以是细菌蛋白、真菌蛋白、病毒蛋白或寄生物来源的蛋白。在其与孔或通道接触前,可将蛋白质解折叠以形成多肽链。
分析物最优选地为多核苷酸例如核酸。多核苷酸在下文更详细地论述。可将多核苷酸在其5′末端或3′末端或在沿着链的一个或多个中间点偶联到膜上。多核苷酸可以是如下所述的单链或双链。多核苷酸可以是环状的。多核苷酸可以是适体,与微RNA杂交的探针或微RNA本身(Wang,Y.et al,Nature Nanotechnology,2011,6,668-674)。
当分析物为与微RNA杂交的探针时,所述探针可永久(图23A)或暂时(图23B和C)地偶联到膜上。探针自身可被改造以适于直接与膜偶联或可以杂交至被改造以适于与膜偶联的互补多核苷酸。分析物可以是杂交至探针的微RNA的复合体,其中所述探针具有独特的序列或条形码使其被清楚地鉴定。
当分析物是适体时,适体可永久或暂时偶联到所述膜上。适体本身可被改造以适于直接与膜偶联或可以杂交至被改造以适于与膜偶联的互补多核苷酸。适体可以结合或不结合蛋白质分析物,并且检测适体的最终目的可以是检测其结合的蛋白质分析物的存在、不存在或特征。
分析物可存在于任何适合的样品中。本发明通常在已知含有或怀疑含有分析物的样品上实施。本发明可以在含有一种或多种种类未知的分析物的样品上实施。或者,本发明可以在样品上实施以确认已知或预期存在于所述样品中的一种或多种分析物的种类。
样品可以是生物样品。本发明可以在获自或提取自任何生物或微生物的样品上体外实施。所述生物或微生物一般为太古代生物、原核生物或真核生物并且通常属于五界之一:植物界、动物界、真菌界、原核生物界和原生生物界。本发明可以在获自或提取自任何病毒的样品上体外实施。样品优选地为流体样品。样品一般包含患者的体液。样品可以是尿、淋巴、唾液、粘液或羊水但优选地为血液、血浆或血清。一般而言,样品是人来源的,但是可选择地其可以来自另外的哺乳动物例如商业养殖的动物例如马、牛、绵羊或猪,或者可选择地可以是宠物例如猫或狗。或者,植物来源的样品通常获自经济作物,例如谷类、豆类(legume)、水果或蔬菜,例如小麦、大麦、燕麦、芸苔、玉米、大豆(soya)、水稻、香蕉、苹果、西红柿、马铃薯、葡萄、烟草、豆类(beans)、小扁豆、甘蔗、可可、棉花。
样品可以是非生物样品。所述非生物样品优选地为流体样品。非生物样品的实例包括外科流体、水例如饮用水、海水或河水以及用于实验室试验的试剂。
一般在进行测定之前先处理样品,例如通过离心或通过穿过膜来处理,所述膜可滤除不想要的分子或细胞例如红细胞。可以在取得样品后立即对其进行测量。一般还可在测定前储藏样品(优选低于-70℃)。
膜
根据本发明可以使用任何膜。适合的膜是本领域中熟知的。膜优选地为两亲层。两亲层是由两亲分子例如磷脂形成的层,其具有亲水性和亲脂性。两亲分子可以是合成的或天然存在的。非天然存在的两亲物和形成单层的两亲物在本领域中已知,包括例如嵌段共聚物(Gonzalez-Perez et al.,Langmuir,2009,25,10447-10450)。嵌段共聚物是其中两种或多种单体亚基聚合在一起形成单个聚合物链的聚合材料。嵌段共聚物的性质通常由每个单体亚基赋予。但是,嵌段共聚物可具有由单独的亚基形成的聚合物所不具有的独特性质。可对嵌段共聚物进行工程化改造以使得在水性介质中所述单体亚基之一为疏水的(即亲脂的),同时其他亚基为亲水的。在这种情况中,嵌段共聚物可具有两亲性质并可以形成模拟生物膜的结构。嵌段共聚物可以是二嵌段(由两种单体亚基组成),但还可以由多于两种单体亚基构建以形成为两亲物的更复杂排列。共聚物可以是三嵌段、四嵌段或五嵌段共聚物。
古细菌双极性四醚脂质是天然存在的脂质,其被构建为使所述脂质形成单层膜。这些脂质通常存在于在严苛生物环境中存活的极端微生物、嗜热菌、嗜盐菌以及嗜酸菌中。它们的稳定性被认为来源于最终双分子层的融合性质。通过形成具有通常基序亲水-疏水-亲水的三嵌段聚合物,构建模拟这些生物实体的嵌段共聚物材料是简单的。这种材料可以形成与脂双层表现类似的单体膜并且具有从小囊泡到叠层状膜的一系列相特性。由这些三嵌段共聚物形成的膜相对于生物脂质膜具有几个优点。因为所述三嵌段共聚物是合成的,可以仔细地控制精确的构建以提供形成膜以及与孔和其他蛋白相互作用所需的正确链长度和性质。
嵌段共聚物还可由未被归类为脂质子材料(sub-materials)的亚基构建;例如疏水聚合物可以由硅氧烷或其他非基于烃的单体制造。嵌段共聚物的亲水亚部分还可具有低的蛋白结合性质,这使得能够形成暴露于粗生物样品时具有高度抵抗性的膜。这种头基单元还可以来源于非典型的脂质头基。
与生物脂质膜相比,三嵌段共聚物膜还具有增加的机械和环境稳定性,例如高得多的操作温度或pH范围。嵌段共聚物的合成性质提供了一个平台,定制用于多种应用的基于聚合物的膜。
在一个优选实施方案中,本发明提供了一种确定分析物的存在、不存在或特征的方法,包括(a)将所述分析物偶联到包含三嵌段共聚物的膜上,任选地其中所述膜被修饰以有助于偶联,和(b)使所述分析物与所述膜中存在的检测器相互作用,从而确定所述分析物的存在、不存在或特征。如上所述,三嵌段共聚物是由三种不同单体亚基形成的聚合物。
可对两亲分子进行化学修饰或功能化以有助于分析物的偶联。
两亲层可以是单层或双层。两亲层通常为平面的。两亲层可以是弯曲的。
两亲膜通常是可自然流动的,本质上充当脂质扩散速率约10-8cms-1的二维流体。这意味着所述检测器和偶联的分析物通常可以在两亲膜内移动。
所述膜优选地为脂双层。脂双层是细胞膜的模型并作为用于一系列实验研究的优秀平台。例如,脂双层可通过单通道记录用于膜蛋白的体外研究。或者,脂双层可用作生物传感器来检测一系列物质的存在。脂双层可以是任何脂双层。适合的脂双层包括但不限于平面脂双层、支撑的双层或脂质体。所述脂双层优选地为平面的脂双层。适合的脂双层公开于国际申请No.PCT/GB08/000563(公开为WO2008/102121)、国际申请No.PCT/GB08/004127(公开为WO2009/077734)和国际申请No.PCT/GB2006/001057(公开为WO2006/100484)。
形成脂双层的方法在本领域中已知。适合的方法公开于实施例中。脂双层通常是通过Montal and Mueller(Proc.Natl.Acad.Sci.USA.,1972;69:3561-3566)的方法形成,其中将脂单层加载于穿过开口的任一侧的水性溶液/空气界面上,所述开口与所述界面垂直。一般通过以下方式将所述脂质添加到水性电解质溶液的表面:首先将脂质溶解于有机溶剂,然后使一滴所述溶剂在位于所述开口任一侧的水性溶液的表面上蒸发。一旦所述有机溶剂蒸发,在所述开口任一侧的溶液/空气界面按物理规律上下移动通过所述开口,直到形成双层。平面脂双层可以跨越膜上的开口或跨越内凹开口而形成。
Montal&Mueller的方法是流行的,因为其是形成质量好的适于蛋白孔插入的脂双层的经济且相对简单的方法。其他常见的双层形成方法包括尖头浸渍(tip-dipping)、涂抹双层和脂质体双层的膜片箝。
尖头浸渍双层形成需要使开口表面(例如移液器吸头)接触带有脂单层的测试溶液的表面。同样,首先通过使一滴溶于有机溶剂的脂质在所述溶液表面蒸发来在溶液/空气界面产生脂单层。然后通过Langmuir-Schaefer过程形成双层并需要机械自动化以使开口相对于溶液表面移动。
对于涂抹双层,将一滴溶于有机溶剂的脂质直接施加到开口上,所述开口浸没在水性测试溶液中。使用漆刷或等同物将所述脂质溶液在所述开口上薄薄地展开。所述溶剂变薄导致形成了脂双层。但是,难于从所述双层完全除去所述溶剂,因此通过这种方法形成的双层不太稳定并且在电化学测量过程中更容易有噪声。
膜片箝常常用于生物细胞膜的研究。通过吸入将细胞膜夹到吸管的末端,所述膜的一片就附着在所述开口上。所述方法已被改造为适于通过以下方式制备脂双层:夹住脂质体,然后脂质体爆炸,留下在吸管的开口上封闭的脂双层。所述方法需要稳定、巨大且单层的脂质体以及在具有玻璃表面的材料中制造小的开口。
可以通过超声处理、挤压或Mozafari方法形成脂质体(Colas et al.(2007)Micron38:841–847)。
在一个优选实施方案中,按国际申请No.PCT/GB08/004127(公开为WO2009/077734)所述形成脂双层。在该方法中有利的是,由干脂质形成脂双层。在一个最优选的实施方案中,按WO2009/077734(PCT/GB08/004127)所述跨越开口形成脂双层。
脂双层是由两个相对的脂质层形成。排列所述两个脂质层,使得其疏水尾基彼此面对形成疏水的内部。所述脂质的亲水头基在所述双层的每一侧向外面向水性环境。所述双层可以以多种脂质相存在,包括但不限于,液态无序相(流体片层)、液态有序相、固态有序相(片层凝胶相、交错凝胶相)和平面双层结晶(片层亚凝胶相、片层结晶相)。
可以使用任何形成脂双层的脂质组合物。选择脂质组合物,使得形成的脂双层具有所需要的性质,例如表面电荷,支持膜蛋白的能力,堆积密度或机械性质。所述脂质组合物可以包含一种或多种不同脂质。例如,所述脂质组合物可以含有最高达100种脂质。所述脂质组合物优选地含有1-10种脂质。所述脂质组合物可以包含天然存在的脂质和/或人工脂质。
所述脂质通常包含头基、交界部分和两种可以相同或不同的疏水尾基。适合的头基包括但不限于中性头基例如二酰甘油酯(DG)和神经酰胺(CM);两性离子头基,例如磷脂酰胆碱(PC)、磷脂酰乙醇胺(PE)和鞘磷脂(SM);带负电的头基,例如磷脂酰甘油(PG)、磷脂酰丝氨酸(PS)、磷脂酰肌醇(PI)、磷酸(PA)和心磷脂(CA);以及带正电的头基,例如三甲铵-丙烷(TAP)。适合的交界部分包括但不限于天然存在的交界部分,例如基于甘油或基于神经酰胺的部分。适合的疏水尾基包括但不限于饱和烃链,例如月桂酸(正十二烷酸(Dodecanolicacid))、豆蔻酸(正十四烷酸)、棕榈酸(正十六酸)、硬脂酸(正十八烷酸)和花生酸(正二十烷酸);不饱和烃链,例如油酸(顺-9-十八烷酸);以及支链烃链例如植烷酰。所述不饱和烃链的链长度以及双键的位置和数量可以不同。所述支链烃链的链长度以及支链例如甲基的位置和数量可以不同。所述疏水尾基可以作为醚或酯连接到所述交界部分。
所述脂质还可以是经化学修饰的。所述脂质的头基或尾基可以是经化学修饰的。头基已经被化学修饰的合适脂质包括但不限于,PEG修饰的脂质,例如1,2-二酰基-sn-甘油-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-2000];功能化的PEG脂质,例如1,2-二硬脂酰基-sn-甘油-3-磷酸乙醇胺-N-[生物素基(聚乙二醇)2000];以及为缀合而修饰的脂质,例如1,2-二油酰基-sn-甘油-3-磷酸乙醇胺-N-(琥珀酰基)和1,2-二棕榈酰基-sn-甘油-3-磷酸乙醇胺-N-(生物素基)。尾基已经被化学修饰的合适脂质包括但不限于,可聚合的脂质,例如1,2-双(10,12-二十三碳二炔酰基)-sn-甘油-3-磷酸胆碱;氟化的脂质,例如1-棕榈酰基-2-(16-氟代棕榈酰基)-sn-甘油-3-磷酸胆碱;氘化的脂质,例如1,2-二棕榈酰基-D62-sn-甘油-3-磷酸胆碱;以及醚连接的脂质,例如1,2-二-O-植烷基-sn-甘油-3-磷酸胆碱。可对所述脂质进行化学修饰或功能化以有助于分析物的偶联。
所述两亲层(例如所述脂质组合物)通常包含一种或多种会影响所述层的性质的添加剂。适合的添加剂包括但不限于脂肪酸,例如棕榈酸、豆蔻酸和油酸;脂肪醇,例如棕榈醇、豆蔻醇和油醇;甾醇,例如胆固醇、麦角固醇、羊毛固醇、谷甾醇和豆固醇;溶血磷脂,例如1-酰基-2-羟基-sn-甘油-3-磷酸胆碱;和神经酰胺。
在另一个优选实施方案中,所述膜为固态层。固态层不是生物来源的。换句话说,固态层并不衍生自或分离自生物环境例如生物体或细胞,也不是合成方法制造的生物学可用结构。固态层可以由有机和无机材料形成,所述有机和无机材料包括但不限于微电子材料,绝缘材料例如Si3N4、A1203和SiO,有机和无机聚合物例如聚酰胺,塑料例如Teflon
或弹性体例如双组分加成固化硅橡胶和玻璃。固态层可以由石墨烯形成。适合的石墨烯层公开于国际申请NO.PCT/US2008/010637(公开为WO2009/035647)。
偶联
可以使用任何已知方法将分析物偶联到膜上。如果所述膜为两亲层,例如脂双层,那么所述分析物优选地通过所述膜上存在的多肽或所述膜上存在的疏水锚偶联到所述膜上。所述疏水的锚优选地为脂质、脂肪酸、甾醇、碳纳米管、多肽、蛋白质或氨基酸,例如胆固醇、棕榈酸酯或生育酚。在优选实施方案中,所述分析物没有通过检测器偶联到所述膜上。
可对所述膜的组分(例如两亲分子或脂质)进行化学修饰或功能化以有助于将所述分析物直接或通过一个或多个接头偶联到所述膜上。适合的化学修饰和对所述膜组分进行功能化的适合方式的实例在下文更详细地论述。可对任何比例的膜组分进行功能化,例如至少0.01%、至少0.1%、至少1%、至少10%、至少25%、至少50%或100%。
可以直接将分析物偶联到膜上。可以在一个或多个例如2、3、4或更多个位点直接将分析物偶联到膜上。
分析物优选地是通过接头偶联到膜上。分析物可以通过一个或多个例如2、3、4或更多个接头偶联到膜上。一个接头可以将多于一个例如2、3、4或更多种分析物偶联到膜上。
分析物可以在一个或多个位点且通过一个或多个接头直接偶联到膜上。
优选的接头包括但不限于聚合物例如多核苷酸、聚乙二醇(PEG)、多糖和多肽。这些接头可以是直链、支链或环状的。例如,所述接头可以是环状多核苷酸。如果分析物自身为多核苷酸,那么其可与环状多核苷酸接头上的互补序列杂交。
功能化的接头和它们可以偶联分子的方式是本领域中已知的。例如,用马来酰亚胺基团功能化的接头会与蛋白质中的半胱氨酸残基反应并与其连接。在本发明上下文中,所述蛋白质可存在于膜中,可以是分析物本身或可用于与分析物结合。这在下文更详细地论述。
使用―锁钥‖排列可以避免分析物的交联。仅每个接头的一个末端可以一起反应形成较长的接头,接头的另一末端各自与分析物或膜分别反应。这种接头记载于国际申请No.PCT/GB10/000132(公开为WO2010/086602)。
在下文论述的测序实施方案中优选使用接头。如果将多核苷酸分析物永久地直接偶联到膜上,那么会丢失一些序列数据,因为所述测序运行由于膜和检测器之间的距离而不能继续到达多核苷酸的末端。如果使用接头,那么可完成对多核苷酸分析物的处理。偶联可以是永久或稳定的。换句话说,偶联可以是这样的,在所述方法中分析物保持与膜偶联。偶联可以是暂时的。换句话说,偶联可以是这样的,在所述方法中分析物从膜上解偶联。对于某些应用,例如适体检测,偶联优选是暂时性的。如果永久或稳定的接头被直接连接至多核苷酸的5’或3’末端并且接头短于所述双层与纳米孔通道或多核苷酸结合蛋白活性位点之间的距离,那么会丢失一些序列数据,因为所述测序运行不能继续到达多核苷酸的末端。如果偶联是暂时的,那么当偶联的末端被随机地从所述双层释放时,可完成对多核苷酸的处理。与膜形成永久/稳定的或暂时的连接的化学基团在下文更详细地论述。可以使用胆固醇或脂肪酰链将分析物暂时偶联到两亲层或脂双层。可以使用长度为6-30个碳原子的任何脂肪酰链,例如十六烷酸。
在优选实施方案中,将多核苷酸分析物例如核酸偶联到两亲层例如脂双层。之前已经用多种不同的束缚策略实现了核酸与合成脂双层的偶联。这些概述于下文表3。
表3
可以在合成反应中使用修饰的亚磷酰胺对合成的多核苷酸分析物或接头进行功能化,所述修饰的亚磷酰胺可以容易地适于直接添加适合的偶联部分,例如胆固醇、生育酚或棕榈酸酯以及反应性基团,例如巯基、胆固醇、脂质和生物素基团。这些不同的连接化学物质提供了用于连接靶多核苷酸的一系列选择。每种不同的修饰基团以略微不同的方式束缚多核苷酸,并且偶联并不总是永久的,因此分析物在双层上的停留时间不同。暂时偶联的优点如上所述。
多核苷酸与接头或与功能化的膜的偶联还可通过许多其他方式实现,条件是互补的反应性基团或系链可被添加到靶多核苷酸。之前已经报告了将反应性基团添加到DNA的任一末端。可以使用T4多核苷酸激酶和ATPγS将巯基添加到ssDNA或dsDNA的5’端(Grant,G.P.andP.Z.Qin(2007)."A facile method for attaching nitroxide spin labels atthe5'terminus of nucleic acids."Nucleic Acids Res35(10):e77)。可以使用T4多核苷酸激酶和γ-[2-叠氮基乙基]-ATP或γ-[6-叠氮基己基]-ATP将叠氮基添加到ssDNA或dsDNA的5’-磷酸。使用巯基或点击(Click)化学,可将含有巯基、碘乙酰胺OPSS或马来酰亚胺基(与巯基反应)或DIBO(二苯并环辛炔(dibenzocyclooxtyne))或炔基(与叠氮基反应)的系链共价连接至分析物。可使用末端转移酶添加更多样的化学基团,例如生物素、巯基和荧光团,以将修饰的寡核苷酸纳入到ssDNA的3’(Kumar,A.,P.Tchen,et al.(1988)."Nonradioactivelabeling of synthetic oligonucleotide probes with terminaldeoxynucleotidyl transferase."Anal Biochem169(2):376-82)。下文实施例3描述了怎样使用链霉亲和素/生物素将DNA偶联至脂双层。链霉亲和素/生物素偶联可以用于任何其他的分析物。也可以使用末端转移酶用适当修饰的核苷酸(例如胆固醇或棕榈酸酯)将系链添加到靶多核苷酸。
或者,反应性基团或系链可被视为是添加多核苷酸例如DNA的短片段,其与已经偶联到双层的多核苷酸互补,使得可以通过杂交实现连接。在这种情况中,反应性基团可以是单链或双链多核苷酸。可以将反应性基团连接至单链或双链多核苷酸分析物。已经报告了使用T4RNA连接酶I进行ssDNA的短片段的连接(Troutt,A.B.,M.G.McHeyzer-Williams,et al.(1992)."Ligation-anchored PCR:a simpleamplification technique with single-sided specificity."Proc Natl AcadSci U S A89(20):9823-5)。或者,可将ssDNA或dsDNA连接至天然分析物dsDNA,然后将两条链通过热或化学变性分开。对于天然dsDNA,可以将ssDNA的片段添加至所述双链体的一个或两个末端,或将dsDNA的片段添加到一个或两个末端。对于向天然DNA添加单链核酸,这可以使用T4RNA连接酶I,像连接至单链核酸的其他区域一样来实现。对于向天然双链体DNA添加dsDNA,那么连接可以是―平端的‖,互补的3’dA/dT尾分别在天然DNA和衔接体(adaptor)上(如许多样品制备应用中常规做的那样以防止多联体或二聚体形成),或使用通过限制性消化天然DNA产生的―粘性末端‖并连接相容的衔接体。然后,当双链体解链时,每条单链会具有5’或3’修饰(如果连接使用了ssDNA)或者具有在5’末端、3’末端或两个末端的修饰(如果连接使用了dsDNA)。如果多核苷酸为合成链,那么可以在多核苷酸的化学合成过程中纳入偶联化学作用。例如,可以使用其上连接有反应性基团的引物合成所述多核苷酸。
腺苷酰化的核酸(AppDNA)是连接反应的中间体,在所述连接反应中腺苷一磷酸被连接至核酸的5’-磷酸。可以使用多种试剂盒产生该中间体,例如NEB的5′DNA腺苷酰化试剂盒。通过将所述反应中的ATP替换为修饰的核苷酸三磷酸,可以将反应性基团(例如巯基、胺、生物素、叠氮基等)添加至DNA的5’。也可以使用5’DNA腺苷酰化试剂盒用适当修饰的核苷酸(例如胆固醇或棕榈酸酯)将系链直接添加到靶多核苷酸。
扩增基因组DNA的一部分的常见技术是使用聚合酶链式反应(PCR)。其中,使用两条合成的寡核苷酸引物,可以产生DNA同一部分的许多拷贝,其中对于每个拷贝,双链体中每条链的5’是合成的多核苷酸。通过使用反义引物,可以使用聚合酶将单个或多个核苷酸添加到单链或双链DNA的3’末端。可以使用的聚合酶的实例包括但不限于末端转移酶、Klenow和大肠杆菌Poly(A)聚合酶。通过将反应中的ATP替换为修饰的核苷酸三磷酸,可将反应性基团例如胆固醇、巯基、胺、叠氮基、生物素或脂质纳入到DNA中。因此,靶扩增的DNA的每个拷贝均会含有用于偶联的反应性基团。
理想的是,将分析物偶联到膜上,而不必对分析物进行功能化。这可以通过将结合基团(例如多核苷酸结合蛋白或化学基团)锚定到膜上并使得所述结合基团能够与分析物相互作用或通过对膜进行功能化来实现。可以通过本文描述的任何方法将所述结合基团偶联到所述膜上。具体地,可以使用一个或多个接头(例如马来酰亚胺功能化接头)来将所述结合基团偶联到所述膜上。
在该实施方案中,分析物通常为RNA、DNA、PNA、TNA或LNA并且可以是双链或单链的。该实施方案尤其适合基因组DNA分析物。
结合基团可以是与单链或双链核酸、分析物中的特定核苷酸序列或分析物中经修饰的核苷酸的模式,或多核苷酸上存在的任何其他配体相互作用的任何基团。
适合的结合蛋白包括大肠杆菌单链结合蛋白、P5单链结合蛋白、T4gp32单链结合蛋白、TOPO V dsDNA结合区域、人组蛋白、大肠杆菌HU DNA结合蛋白以及其他古细菌、原核或真核生物的单链或双链核酸结合蛋白,包括下文列出的那些。
特定核苷酸序列可以是被转录因子、核糖体、内切核酸酶、拓扑异构酶或复制起始因子识别的序列。经修饰的核苷酸的模式可以是甲基化或损伤的模式。
化学基团可以是嵌入多核苷酸分析物中或与其相互作用的任何基团。所述基团可以通过静电键合、氢键合或范德华力相互作用来嵌入多核苷酸分析物中或与其相互作用。这种基团包括赖氨酸单体、聚赖氨酸(其与ssDNA或dsDNA相互作用)、溴化乙锭(其嵌入dsDNA)、通用碱基或通用核苷酸(其可与任何多核苷酸分析物杂交)以及锇络合物(其可与甲基化的碱基反应)。因此可以使用与膜连接的一个或多个通用核苷酸将多核苷酸分析物偶联到膜上。每个通用核苷酸残基均可以用一个或多个接头连接到膜上。通用碱基的实例包括肌苷、3-硝基吡咯、5-硝基吲哚、4-硝基吲哚、6-硝基吲哚、3,4-二氢-嘧啶并[4,5-c][1,2]氧杂嗪-7-酮(dp)、2-二甲基氨基亚甲基氨基-6-甲氧基氨基嘌呤(dK)、脱氧肌苷、脱氧水松蕈素。
在该实施方案中,对至少1%、至少10%、至少25%、至少50%或100%的膜组分进行功能化。
结合基团为蛋白质时,其能够直接锚定到膜中而无需进行进一步的功能化,例如只要其已经具有与膜相容的外部疏水区域。这种蛋白质的实例包括跨膜蛋白。或者所述蛋白质可被表达为具有与膜相容的基因融合的疏水区域。这种疏水蛋白区域是本领域中已知的。
结合基团优选地与分析物混合,然后与膜接触,但是结合基团可以与膜接触,随后与分析物接触。
在另一方面,可使用上文所述方法对分析物进行功能化,使得其可被特定的结合基团识别。具体地,可以用配体例如生物素(用于与链霉亲和素结合)、直链淀粉(用于与麦芽糖结合蛋白或融合蛋白结合)、Ni-NTA(用于与聚组氨酸或聚组氨酸标记的蛋白质结合)或肽(例如抗原)对分析物进行功能化。
根据另一方面,当多核苷酸分析物已经与多核苷酸衔接体结合时,可以使用结合基团将所述分析物偶联到膜上。具体地,分析物与包含前导序列的衔接体结合,所述前导序列被设计为优先穿过检测器例如纳米孔。这种前导序列可以包含同聚的多核苷酸或脱碱基区域。所述衔接体通常被设计为可与接头杂交并且与分析物连接或杂交。这在分析物和衔接体之间形成了进入检测器的竞争。如果接头包含结合基团,那么与衔接体相比长度更长的分析物意味着若干个接头可以同时与分析物结合,从而使分析物的浓度相对于衔接体的浓度增加。
当然,任何上述将多核苷酸与两亲层例如脂双层偶联的方法均可以应用于其他分析物和膜组合。在一些实施方案中,将氨基酸、肽、多肽或蛋白质与脂双层偶联。可以使用用于化学连接这种分析物的多种方法。用于化学连接的分子的实例为EDC(1-乙基-3-[3-二甲基氨基丙基]碳二亚胺盐酸盐)。还可以使用可商购的试剂盒(Thermo Pierce,Part No.22980)将反应性基团添加到DNA的5’端。适合的方法包括但不限于使用组氨酸残基和Ni-NTA的暂时亲和连接,以及利用反应性半胱氨酸、赖氨酸或非天然氨基酸的更强的共价连接。
检测器
检测器可以是响应分析物的存在、不存在或特征而提供可读信号的任何结构。检测器可以是响应分析物的存在、不存在或特征而提供可读信号的任何结构。适合的检测器在本领域中已知。它们包括但不限于跨膜孔、隧道电极、经典电极、纳米管、FET(场效晶体管)和光检测器例如原子力显微镜(AFM)和扫描隧道显微镜(STM)。
在优选实施方案中,检测器用电的方式检测分析物。可以使用标准的单通道记录设备进行电测量,如Stoddart D et al.,Proc Natl Acad Sci,12;106(19):7702-7,Lieberman KR et al,J Am Chem Soc.2010;132(50):17961-72和国际申请WO-2000/28312所述。或者,可以使用多通道系统进行电测量,例如如国际申请WO-2009/077734和国际申请WO-2011/067559所述。
在其他优选实施方案中,检测器不用荧光方式检测分析物。
检测器优选地包含跨膜孔。跨膜孔是容许外加电位驱动水合离子从膜的一侧流动到膜另一侧的结构。
跨膜孔优选地为跨膜蛋白孔。跨膜蛋白孔是容许水合离子(例如分析物)从膜的一侧流动到膜另一侧的多肽或多肽集合。在本发明中,跨膜蛋白孔能够形成容许外加电位驱动水合离子从膜的一侧流动到另一侧的孔。跨膜蛋白孔优选地容许分析物(例如核苷酸)从膜(例如脂双层)的一侧流动到另一侧。跨膜蛋白孔优选地使得多核苷酸或核酸(例如DNA或RNA)能够移动穿过所述孔。
跨膜蛋白孔可以是单体或寡聚体。所述孔优选地由若干个重复亚基例如6、7或8个亚基组成。所述孔更优选地为七聚体或八聚体孔。
跨膜蛋白孔通常包含离子可以流过的桶或通道。所述孔的亚基通常围绕一个中心轴并为跨膜β桶或通道或者跨膜α-螺旋束或通道提供链。
跨膜蛋白孔的桶或通道通常包含可有助于与分析物(例如核苷酸、多核苷酸或核酸)相互作用的氨基酸。这些氨基酸优选地位于所述桶或通道的收敛处附近。跨膜蛋白孔通常包含一个或多个带正电的氨基酸(例如精氨酸、赖氨酸或组氨酸),或芳香族氨基酸(例如酪氨酸或色氨酸)。这些氨基酸通常可有助于所述孔与核苷酸、多核苷酸或核酸之间的相互作用。可以用衔接体帮助检测核苷酸。这在下文更详细地论述。
用于本发明的跨膜蛋白孔可以衍生自β-桶孔或α-螺旋束孔。β-桶孔包含由β-链形成的桶或通道。适合的β-桶孔包括但不限于β-毒素、例如α-溶血素、炭疽毒素和杀白细胞素,以及细菌的外部膜蛋白/孔蛋白,例如耻垢分枝杆菌(Mycobacterium smegmatis)孔蛋白(Msp),例如MspA、MspB、MspC或MspD,外膜孔蛋白F(OmpF)、外膜孔蛋白G(OmpG)、外膜磷脂酶A和奈瑟球菌属(Neisseria)自转运脂蛋白(NalP)。α-螺旋束孔包含由α-螺旋形成的桶或通道。适合的α-螺旋束孔包括但不限于内膜蛋白和α外膜蛋白,例如WZA和ClyA毒素。跨膜孔可以衍生自Msp或α-溶血素(α-HL)。
对于链测序,跨膜蛋白孔优选地衍生自Msp,优选衍生自MspA。这种孔是寡聚物并通常包含7、8、9或10个衍生自Msp的单体。所述孔可以是包含相同单体的衍生自Msp的同寡聚体孔。或者,所述孔可以是包含至少一个与其他单体不同的单体的衍生自Msp的异寡聚体孔。所述孔还可以包含一个或多个构建体,所述构建体包含两个或多个共价连接的衍生自Msp的单体。适合的孔公开于国际申请No.PCT/GB2012/050301(要求美国临时申请No.61/441,718的优先权)。优选地,所述孔衍生自MspA或其同系物或横向同源物(paralog)。
衍生自Msp的单体包含SEQ ID NO:2中示出的序列或其变体。SEQ ID NO:2为所述MspA单体的NNN-RRK突变体。其包括以下突变:D90N、D91N、D93N、D118R、D134R和E139K。SEQ ID NO:2的变体为氨基酸序列与SEQ ID NO:2的不同但保留了其形成孔的能力的多肽。变体形成孔的能力可以使用本领域中已知的任何方法测定。例如,可将变体与其他适合的亚基一起插入到脂双层中,然后可以确定其进行寡聚形成孔的能力。将亚基插入到膜(例如脂双层)中的方法在本领域中已知。例如,可将亚基以纯化形式悬浮在含有脂双层的溶液中,使得其扩散到脂双层,通过与脂双层结合并组装成有功能的状态而进行插入。或者,可以使用M.A.Holden,H.Bayley.J.Am.Chem.Soc.2005,127,6502-6503和国际申请No.PCT/GB2006/001057(公开为WO2006/100484)中描述的―拾取并放置(pick and place)‖方法将亚基直接插入到膜中。
优选的变体公开于国际申请No.PCT/GB2012/050301(要求美国临时申请No.61/441,718的优先权)。尤其优选的变体包括但不限于,包含一个或多个如下置换的那些:
L88N;L88S;L88Q;L88T;D90S;D90Q;D90Y;I105L;I105S;Q126R;C75S;C77S;G75S,C77S、L88N和Q126R;G75S、G77S、L88N、D90Q和Q126R;D90Q和Q126R;L88N、D90Q;和Q126R;L88S和D90Q;L88N和D90Q;E59R;G75Q;G75N;G75S;G75T;G77Q.G77N;G77S;G77T;I78L;S81N;T83N;N86S;N86T;187F;187V;I87L;L88N;L88S;L88Y;L88F;L88V;L88Q;L88T.189F,189V;189L;N90S;N90Q;N90L;N90Y;N91S;N91Q;N91L;N91M;N91I;N91A;N91V;N91G;G92A;G92S:N93S:N93A;N93T;I94L;T95V;A96R;A96D;A96V;A96N;A96S:A96T;P97S;P98S;F99S;G100S;L101F,N102K;N102S;N102T;S103A;S103Q;S103N;S103G;S103T;V1041;I105Y;I105L;I105A;I105Q;I105N;I105S:I105T;T106F;T106I;T106V;T106S;N108P;N108S;D90Q和I105A;D90S和C92S;L88T和D90S;I87Q和D90S;I89Y和D90S;L88N和I89F;L88N和I89Y;D90S和G92A;D90S和I94N;D90S和V104I;L88D和I105K;L88N和Q126R;L88N,D90Q和D91R;L88N、D90Q和D91S;L88N、D90Q和I105V;D90Q、093S和I105A;N91Y;N90Y和N91G;N90G和N91Y;N90G和N91G;I05G;N90R;N91R;N90R和N91R;N90K;N91K;N90K和N91K;N90Q和N91G;N90G和N91Q;N90Q和N91Q;R118N;N91C;N90C;N90W;N91W;N90K;N91K;N90R;N91R;N90S和N91S;N90Y和H05A;N90G和I105A;N90Q和I105A;N90S和I105A;L88A和I105A;L88S和I105S;L88N和I105N;N90G和N93G;N9OG;N93G;N90G和N91A;I105K;I105R;I105V;I105P;I105W;L88R;L88A;L88G;L88U;N90R和I105A;N90S和I105A;L88A和I105A;L88S和l105S;L88N和l105N;L88C;S103C;和1105C。
除上文详述的具体突变外,变体可包括其他突变。在SEQ ID NO:2的全长氨基酸序列上,基于氨基酸同一性,变体优选地与该序列是至少50%同源的。更优选地,基于氨基酸同一性,变体与SEQ ID NO:2的氨基酸序列在整个序列上可以是至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%,更优选至少95%、97%或99%同源的。在100或更多个,例如125、150、175或200或更多个连续氨基酸的序列段上可以有至少80%,例如至少85%、90%或95%的氨基酸同一性(―硬同源性(hard homology)‖)。
可使用本领域中的标准方法确定同源性。例如,UWGCG Package提供了可用于计算同源性的BESTFIT程序,例如以其默认设置使用(Devereux et al(1984)Nucleic Acids Research12,p387-395)。PILEUP和BLAST算法可以用于计算同源性或对齐序列(例如鉴定等价残基或相应序列(一般用其默认设置)),例如如Altschul S.F.(1993)J Mol Evol36:290-300;Altschul,S.F et al(1990)J Mol Biol215:403-10中所述。公众可以从美国国家生物技术信息中心(http://www.ncbi.nlm.nih.gov/)获得用于执行BLAST分析的软件。
SEQ ID NO:2为MspA单体的NNN-RRK突变体。与MspA相比,所述变体可包括MspB、C或D单体中的任何突变。成熟形式的MspB、C和D在SEQ ID NO:15-17中示出。尤其地,所述变体可包含存在于MspB中的如下置换:A138P。所述变体可包含一个或多个存在于MspC中的如下置换:A96G、N102E和A138P。所述变体可包含一个或多个存在于MspD中的如下突变:G1缺失、L2V、E5Q、L8V、D13G、W21A、D22E、K47T、I49H、I68V、D91G、A96Q、N102D、S103T、V104I、S136K和G141A。所述变体可包含来自MspB、C和D的一个或多个突变和置换的组合。
可以对SEQ ID NO:2的氨基酸序列进行除了上文详述的那些氨基酸置换以外的氨基酸置换,例如最多达1、2、3、4、5、10、20或30个置换。保守置换将氨基酸用具有相似化学结构、相似化学性质或相似侧链大小的其他氨基酸代替。引入的氨基酸可具有与其所代替的氨基酸相似的极性、亲水性、疏水性、碱性、酸性、中性或电荷。或者,保守置换可引入另一芳香族或脂肪族氨基酸替代原先存在的芳香族或脂肪族氨基酸。保守氨基酸改变是本领域中熟知的并可根据下表4中定义的20种主要氨基酸的性质进行选择。氨基酸具有相似的极性时,这还可以通过参照表5中氨基酸侧链的亲水性量表来确定。
表4-氨基酸的化学性质
表5-亲水性量表
可另外将SEQ ID NO:2氨基酸序列中的一个或多个氨基酸残基从上述多肽删除。可删除最多达1、2、3、4、5、10、20或30个残基,或更多个。
变体可包括SEQ ID NO:2的片段。这种片段保留孔形成活性。片段长度可以为至少50、100、150或200个氨基酸。这种片段可用于产生孔。片段优选地包含SEQ ID NO:2的孔形成结构域。片段必须包括SEQ ID NO:2残基88、90、91、105、118和134之一。一般而言,片段包括SEQ ID NO:2残基88、90、91、105、118和134的全部。
可选地或额外地将一个或多个氨基酸添加到上述多肽。可以在SEQID NO:2的氨基酸序列或者其多肽变体或片段的氨基或羧基末端进行延伸。延伸可以非常短,例如长度为1-10个氨基酸。或者,所述延伸可以更长,例如最多达50或100个氨基酸。可将载体蛋白与本发明的氨基酸序列融合。其他融合蛋白在下文更详细地论述。
如上所述,变体是氨基酸序列与SEQ ID NO:2的不同且保留了其形成孔的能力的多肽。变体一般含有SEQ ID NO:2中负责孔形成的区域。含有β-桶的Msp的孔形成能力是由每个亚基中的β-片层提供。SEQID NO:2的变体一般包含SEQ ID NO:2中形成β-片层的区域。可以对SEQ ID NO:2中形成β-片层的区域进行一个或多个修饰,只要产生的变体保留其形成孔的能力。SEQ ID NO:2的变体优选地包括在其α-螺旋和/或环区域内的一个或多个修饰,例如置换、添加或缺失。
可修饰衍生自Msp的单体以帮助其鉴定或纯化,例如通过添加组氨酸残基(hist标签)、天冬氨酸残基(asp标签)、链霉亲和素标签或flag标签,或者通过添加信号序列以促进其从细胞(其中多肽天然不含有这种序列)分泌。引入遗传标签的替代方案是通过化学反应使标签添加到所述孔的天然或改造的位置上。这种方法的实例是使凝胶迁移试剂与改造在孔外部上的半胱氨酸反应。这已经被证明可作为分离溶血素异寡聚体的方法(Chem Biol.1997Jul;4(7):497-505)。
衍生自Msp的单体可用显示标记物标记。显示标记物可以是任何使孔能够被检测到的适合标记物。适合的标记物包括但不限于,荧光分子、放射性同位素例如125I和35S、酶、抗体、抗原、多核苷酸和配体例如生物素。
衍生自Msp的单体还可用D-氨基酸产生。例如衍生自Msp的单体可以包含L-氨基酸和D-氨基酸的混合物。在本领域中这种蛋白质或肽的产生是常规的。
衍生自Msp的单体含有一个或多个特异性修饰以有利于核苷酸区分。衍生自Msp的单体还可含有其他非特异性的修饰,只要它们不干扰孔形成。许多非特异性的侧链修饰是本领域中已知的并且可以对衍生自Msp的单体的侧链进行这种修饰。这种修饰包括,例如,通过使氨基酸与醛反应然后用NaBH4还原进行的氨基酸的还原性烷基化、用甲基乙酰亚胺进行脒基化或用乙酸酐进行的酰化。
可以使用本领域中已知的标准方法来产生衍生自Msp的单体。可以合成方法或通过重组的方式制备衍生自Msp的单体。例如,可以通过体外翻译和转录(IVTT)合成孔。用于产生孔的适合方法记载于国际申请No.PCT/GB09/001690(公开为WO2010/004273)、PCT/GB09/001679(公开为WO2010/004265)或PCT/GB10/000133(公开为WO2010/086603)。将孔插入膜的方法在下文论述。
对于外切核酸酶测序,跨膜蛋白孔优选地衍生自α-溶血素(α-HL)。野生型α-HL孔由七个相同单体或亚基形成(即其为七聚体)。α-溶血素M113R的一个单体或亚基的序列在SEQ ID NO:4示出。跨膜蛋白孔优选地包含七个单体,每个单体包含SEQ ID NO:4示出的序列或其变体。SEQ ID NO:4的氨基酸1、7-21、31-34、45-51、63-66、72、92-97、104-111、124-136、149-153、160-164、173-206、210-213、217、218、223-228、236-242、262-265、272-274、287-290和294形成环区。SEQID NO:4的残基113和147形成α-HL桶或通道的收敛处的一部分。
在这样的实施方案中,在本发明的方法中优选地使用包含七个蛋白或单体的孔,所述蛋白或单体每个包含SEQ ID NO:4示出的序列或其变体。所述七个蛋白可以相同(同七聚体)或不同(异七聚体)。
SEQ ID NO:4的变体是氨基酸序列与SEQ ID NO:4不同但保留其孔形成能力的蛋白质。变体形成孔的能力可以使用本领域中已知的任何方法测定。例如,可将变体与其他适合的亚基一起插入脂双层,然后可以确定其进行寡聚以形成孔的能力。将亚基插入到膜(例如脂双层)的方法是在本领域中已知。适合的方法如上所述。
所述变体可以包括有助于与核酸结合蛋白共价连接或相互作用的修饰。所述变体优选地包含一个或多个有助于与核酸结合蛋白连接的反应性半胱氨酸残基。例如,所述变体可以包括在SEQ ID NO:4的位置8、9、17、18、19、44、45、50、51、237、239和287中的一个或多个处和/或其氨基末端或羧基末端上的半胱氨酸。优选的变体包含在SEQID NO:4的位置8、9、17、237、239和287处的残基被置换为半胱氨酸的置换(A8C、T9C、N17C、K237C、S239C或E287C)。所述变体优选地为国际申请No.PCT/GB09/001690(公开为WO2010/004273)、PCT/GB09/001679(公开为WO2010/004265)或PCT/GB10/000133(公开为WO2010/086603)中描述的变体中的任一个。
所述变体还可包括有助于与核苷酸的任何相互作用或有助于如下文所述分子衔接体的定向的修饰。所述变体还可含有有助于共价连接分子衔接体的修饰。
具体地,所述变体优选地包含在SEQ ID NO:4的第139位处的谷氨酰胺。所述变体优选地在SEQ ID NO:4的第119、121或135位具有半胱氨酸。SEQ ID NO:4的变体可以具有在第113位处重新引入的野生型甲硫氨酸。
优选的SEQ ID NO:4变体在第113位为甲硫氨酸(R113M),第135位为半胱氨酸(L135C),第139位为谷氨酰胺(N139Q)。其他优选的SEQ ID NO:4变体在第113位为甲硫氨酸(R113M),第139位为谷氨酰胺(N139Q)。一个这样的变体在SEQ ID NO:34示出。用于外切核酸酶测序的优选跨膜蛋白孔包含(a)一个包含SEQ ID NO:4变体——第113位为甲硫氨酸(R113M),第135位为半胱氨酸(L135C)第139位为谷氨酰胺(N139Q)——的单体,和(b)六个各自包含SEQID NO:4变体——第113位为甲硫氨酸(R113M),第139位为谷氨酰胺(N139Q)——的单体。(b)中的六个单体各自优选地包含SEQ ID NO:34示出的序列。
所述变体可以由生物例如葡萄球菌(Staphylococcus)天然表达的的天然存在的变体。或者,所述变体可以在体外表达或通过细菌例如大肠杆菌(Escherichia coli)重组表达。变体还包括由重组技术产生的非天然存在的变体。基于氨基酸同一性,在SEQ ID NO:4的全长氨基酸序列上,变体优选地与该序列是至少50%同源的。更优选地,基于氨基酸同一性,所述变体多肽可以与SEQ ID NO:4的氨基酸序列在整个序列上是至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%,更优选至少95%、97%或99%同源的。在200个或更多个例如230、250、270或280个或更多个连续氨基酸的序列段上可以有至少80%,例如至少85%、90%或95%的氨基酸同一性(―硬同源性‖)。可以如上所述确定同源性。
可以对SEQ ID NO:4的氨基酸序列进行除上述那些之外的氨基酸置换,例如最多达1、2、3、4、5、10、20或30个置换。可以如上所述进行保守置换。
可以另外从上述多肽删除SEQ ID NO:4氨基酸序列的一个或多个氨基酸残基。可以删除最多达1、2、3、4、5、10、20或30个残基,或更多个。
变体可以是SEQ ID NO:4的片段。这种片段保留了孔形成的活性。片段长度可以为至少50、100、200或250个氨基酸。片段优选地包含SEQ ID NO:4的孔形成结构域。片段通常包括SEQ ID NO:4的残基119、121、135、113和139。
可选地或额外地将一个或多个氨基酸添加到上述多肽。可以在SEQID NO:4氨基酸序列或者其变体或片段的氨基末端或羧基末端进行延伸。所述延伸可以非常短,例如长度为1-10个氨基酸。或者,所述延伸可以更长,例如最长达50或100个氨基酸。可以将载体蛋白与亚基或变体融合。
可选地或额外地将一个或多个氨基酸添加到上述多肽。可在SEQID NO:4的氨基酸序列或者其变体或片段的氨基末端或羧基末端进行延伸。所述延伸可以非常短,例如长度为1-10个氨基酸。或者,所述延长可以更长,例如最长达50或100个氨基酸。可以将载体蛋白与孔或变体融合。
如上所述,SEQ ID NO:4的变体是氨基酸序列与SEQ ID NO:4不同但保留其形成孔的能力的亚基。变体通常含有SEQ ID NO:4中负责孔形成的区域。含有β-桶的α-HL的孔形成能力是由每个亚基中的β-链提供。SEQ ID NO:4的变体通常包含SEQ ID NO:4中形成β-链的区域。SEQ ID NO:4中形成β-链的氨基酸如上所述。可以对SEQ ID NO:4中形成β-链的区域进行一个或多个修饰,只要所产生的变体保留其形成孔的能力。可以对SEQ ID NO:4的β-链区域进行的具体修饰如上所述。
SEQ ID NO:4的变体优选地包括在其α-螺旋和/或环区域内的一个或多个修饰,例如替换、添加或缺失。形成α-螺旋和环的氨基酸如上所述。
可如上所述对变体进行修饰以帮助其鉴定或纯化。
尤其优选的用于外切核酸酶测序的孔包含一个SEQ ID NO:36示出的亚基(即α-HL-E287C-QC-D5FLAGH6)和六个SEQ ID NO:34示出的亚基(即α-HL-Q)。
可以参照衍生自Msp的孔如上所述制造衍生自α-HL的孔。
在一些实施方案中,跨膜蛋白孔是经化学修饰的。所述孔可在任何位点以任何方式进行化学修饰。跨膜蛋白孔优选地是通过以下方式进行化学修饰的:将分子连接到一个或多个半胱氨酸(半胱氨酸键)、将分子连接到一个或多个赖氨酸、将分子连接到一个或多个非天然氨基酸、对表位进行酶修饰或对末端进行修饰。进行这种修饰的适合方法是本领域中熟知的。跨膜蛋白孔可通过连接任何分子来进行化学修饰。例如,所述孔可通过连接染料或荧光团来进行化学修饰。
可对所述孔中任意数量的单体进行化学修饰。优选地,如上所述对一个或多个,例如2、3、4、5、6、7、8、9或10个单体进行化学修饰。
在一些实施方案中,跨膜蛋白孔包含有助于检测分析物的分子衔接体。用于外切核酸酶测序的孔通常包含分子衔接体。
分子衔接体可通过介导孔和分析物之间的相互作用直接帮助检测分析物。在这样的实施方案中,所述衔接体的存在改善了孔和分析物的主客体化学作用,从而改善了孔检测分析物的能力。主客体化学作用的原理是本领域中熟知的。所述衔接体对孔的物理或化学性质具有作用,改善其与分析物的相互作用。所述衔接体可以改变孔的桶或通道的电荷,或特异性地与分析物相互作用或结合,从而促进所述分析物与孔的相互作用。
在其他实施方案中,分子衔接体通过介导孔和产物(例如由处理分析物产生的片段)之间的相互作用而间接地帮助检测分析物。例如,对于外切核酸酶测序,所述分子衔接体可促进孔与从多核苷酸分析物消化下来的单个核苷酸之间的相互作用。在这样的实施方案中,所述衔接体的存在改善了所述孔与单个核苷酸的主客体化学作用,从而改善了所述孔检测单个核苷酸的能力。所述衔接体对孔的物理或化学性质具有作用,改善其与单个核苷酸的相互作用。所述衔接体可以改变孔的桶或通道的电荷,或特异性地与单个核苷酸相互作用或结合,从而促所述单个核苷酸与孔的相互作用。
分子衔接体优选地为环状分子例如环糊精、能够进行杂交的物质、DNA结合剂或交互螯合剂、肽或肽类似物、合成聚合物、芳香族平面分子、带正电小分子或能够进行氢键结合的小分子。
衔接体可以是环状的。环状衔接体优选地具有与孔相同的对称性。如果所述孔衍生自Msp,那么所述衔接体优选地具有八重对称性,因为Msp一般具有围绕中心轴的八个亚基。如果所述孔衍生自α-HL,那么所述衔接体优选地具有七重对称性,因为α-HL一般具有围绕中心轴的七个亚基。这在下文中更详细地论述。
衔接体一般通过主客体化学作用与分析物相互作用。所述衔接体一般能够与核苷酸或多核苷酸相互作用。所述衔接体包含一个或多个能够与分析物(例如核苷酸或多核苷酸)相互作用的化学基团。所述一个或多个化学基团优选地通过非共价相互作用(例如疏水性相互作用、氢键合、范德华力、π-阳离子相互作用和/或静电力)与分析物、核苷酸或多核苷酸相互作用。所述一个或多个能够与核苷酸或多核苷酸相互作用的化学基团优选地是带正电的。所述一个或多个能够与核苷酸或多核苷酸相互作用的化学基团更优选地包含氨基。所述氨基可以连接至伯、仲或叔碳原子。所述衔接体甚至更优选地包含氨基环,例如6、7或8个氨基的环。所述衔接体最优选地包含七或八个氨基的环。质子化氨基的环可以与核苷酸或多核苷酸中带负电的磷酸基团相互作用。
可通过所述衔接体与孔之间的主客体化学作用来帮助所述衔接体在所述孔内的正确定位。所述衔接体优选地包含一个或多个能够与所述孔中的一个或多个氨基酸相互作用的化学基团。所述衔接体更优选地包含一个或多个能够通过非共价相互作用(例如疏水性相互作用、氢键合、范德华力、π-阳离子相互作用和/或静电力)与孔中的一个或多个氨基酸相互作用的化学基团。所述能够与孔中的一个或多个氨基酸相互作用的化学基团一般为羟基或胺。羟基可连接至伯、仲或叔碳原子。羟基可与所述孔中不带电的氨基酸形成氢键。可使用可促进所述孔与核苷酸或多核苷酸之间相互作用的任何衔接体。
适合的衔接体包括但不限于环糊精、环肽和葫芦脲(cucurbituril)。所述衔接体优选地为环糊精或其衍生物。所述环糊精或其衍生物可以是Eliseev,A.V.,and Schneider,H-J.(1994)J.Am.Chem.Soc.116,6081-6088中公开的那些中的任一种。衔接体更优选地为七-6-氨基-β-环糊精(am7-βCD)、6-单脱氧-6-单氨基-β-环糊精(am1-βCD)或七-(6-脱氧-6-胍基)-环糊精(gu7-βCD)。gu7-βCD的胍基具有比am7-βCD的伯胺更高的pKa,因此其带有更多正电。该gu7-βCD衔接体可用于增加所述核苷酸在所述孔中的停留时间,以提高所测量的剩余电流的准确度,以及提高在高温或低数据采集率时的基线检测率。
如果如下文所详述地使用3-(2-吡啶二硫基)丙酸琥珀酰亚胺酯(SPDP)交联剂,那么所述衔接体优选地为七(6-脱氧-6-氨基)-6-N-单(2-吡啶)二硫丙酰基-β-环糊精(am6amPDP1-βCD)。
更适合的衔接体包括γ-环糊精,其包含8个糖单元(因此具有八重对称性)。γ-环糊精可含有接头分子或者可被修饰以包含所有或更多的上文详述的β-环糊精实例中使用的修饰糖单元。
所述分子衔接体优选地被共价连接至所述孔。可使用任何本领域中已知的方法将所述衔接体共价连接至所述孔。一般通过化学键连接衔接体。如果通过半胱氨酸键连接所述分子衔接体,那么优选地已通过置换将一个或多个半胱氨酸引入至所述突变体。如上所述,衍生自Msp的单体可在第88、90、91、103和105位中的一个或多个处包含半胱氨酸残基。可通过将分子衔接体连接至这种半胱氨酸的一个或多个例如2、3、4或5个来对所述孔的每个单体进行化学修饰。或者,可通过将分子连接至在其他位置上引入的一个或多个半胱氨酸来对所述单体进行化学修饰。所述分子衔接体优选地连接至SEQ ID NO:2中第90、91和103位中的一个或多个位置。
对于衍生自α-HL的孔,可以对所述孔进行特定修饰以帮助所述衔接体在所述孔的桶或通道内的正确定向以及所述衔接体与孔的共价连接。具体地,所述孔的每个亚基优选地在SEQ ID NO:2的第139位上为谷氨酰胺。所述孔的一个或多个亚基在SEQ ID NO:2的第113位上为精氨酸。所述孔的一个或多个亚基在SEQ ID NO:2的第119、121或135位上为半胱氨酸,以帮助所述分子衔接体与孔的连接。
可通过修饰邻近残基来增强半胱氨酸残基的反应性。例如,侧翼(flanking)精氨酸、组氨酸或赖氨酸残基的碱性基团会将半胱氨酸巯基的pKa改变为更具反应性的S-基团的pKa。可通过巯基保护基团例如dTNB来保护半胱氨酸残基的反应性。可将它们与孔的一个或多个半胱氨酸残基反应,然后连接接头。
可以直接将所述分子(使用该分子对所述孔进行化学修饰)与孔连接或者通过接头与所述孔连接,如国际申请No.PCT/GB09/001690(公开为WO2010/004273)、PCT/GB09/001679(公开为WO2010/004265)或PCT/GB10/000133(公开为WO2010/086603)中所公开的。
在一个优选实施方案中,检测器包含多核苷酸结合蛋白。这使得本发明的方法可用于对多核苷酸或核酸进行测序。多核苷酸在下文定义。多核苷酸结合蛋白的实例包括但不限于核酸处理酶,例如核酸酶、聚合酶、拓扑异构酶、连接酶和解旋酶;以及非催化性的结合蛋白,例如通过SCOP(蛋白质结构分类)归类在核酸结合蛋白超家族(50249)下的那些。优选地对多核苷酸结合蛋白进行修饰以除去和/或替换半胱氨酸残基,如国际申请No.PCT/GB10/000133(公开为WO2010/086603)所述。优选的多核苷酸结合蛋白衍生自Phi29聚合酶。所述蛋白优选地包含SEQ ID NO:6示出的序列或其变体。这在下文更详细地论述。其他用于本发明的优选多核苷酸结合蛋白包括来自大肠杆菌的外切核酸酶I(SEQ ID NO:8)、来自大肠杆菌的外切核酸酶III(SEQ ID NO:10)、来自嗜热栖热菌的RecJ(SEQ ID NO:12)和λ噬菌体外切核酸酶(SEQ ID NO:14)及它们的变体。三个相同的SEQ ID NO:14亚基相互作用形成三聚体外切核酸酶。优选地对所述变体进行修饰以促进与膜蛋白的连接并且所述变体可以是国际申请No.PCT/GB09/001679(公开为WO2010/004265)或PCT/GB10/000133(公开为WO2010/086603)中论述的那些中的任一个。所述蛋白可以是国际申请No.PCT/GB10/000133(公开为WO2010/086603)中记载的SEQ ID NO:8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48和50中的任一个或者记载该国际申请中的它们的变体。多核苷酸结合蛋白可以以任何方式连接到所述孔并优选地如国际申请No.PCT/GB09/001679(公开为WO2010/004265)或PCT/GB10/000133(公开为WO2010/086603)所述进行连接。
优选地,所述检测器除跨膜蛋白孔之外还包含多核苷酸结合蛋白。这样的检测器形成了可用于本发明测序方法中的模块(modular)测序系统。所述多核苷酸结合蛋白可以连接到所述孔,但并不必须如此。
在外切核酸酶测序中,允许靶多核苷酸与所述检测器中存在的外切核酸酶相互作用。所述外切核酸酶通常连接到所述检测器中的孔。在链测序中,所述检测器通常除所述孔之外还包含聚合酶。允许所述靶多核苷酸与所述检测器中存在的聚合酶例如Phi29聚合酶相互作用。所述聚合酶和孔通常不连接在一起,但一起形成检测器。
对于外切核酸酶测序,所述外切核酸酶优选地共价连接至所述跨膜蛋白孔。可使用本领域已知的任何方法将所述外切核酸酶共价连接至所述孔。可以将所述孔和蛋白化学融合或在基因上融合。如果整个构建体是由单个多核苷酸序列表达,那么所述孔和外切核酸酶是在基因上融合的。孔与外切核酸酶的基因融合详述于国际申请No.PCT/GB09/001679(公开为WO2010/004265)中。
如果所述外切核酸酶是通过半胱氨酸键连接至所述孔,那么优选地已通过置换将一个或多个半胱氨酸引入至所述孔。当然,衍生自Msp的孔可包含在第10-15、51-60、136-139和168-172位中一个或多个位置上的半胱氨酸残基。这些位置存在于同系物中保守性低(表明可以容许突变或插入)的环区。因此,它们适于连接外切核酸酶。可如上文所述通过修饰来增强半胱氨酸残基的反应性。
所述外切核酸酶可直接连接至所述孔或经一个或多个接头连接。可使用国际申请No.PCT/GB10/000132(公开为WO2010/086602)中描述的杂交接头来将所述外切核酸酶连接至所述孔。或者,可使用肽接头。肽接头为氨基酸序列。肽接头的长度、柔性和亲水性一般被设计为使得其不会干扰所述孔和外切核酸酶的功能。优选的柔性肽接头为2-20个,例如4、6、8、10或16个丝氨酸和/或甘氨酸氨基酸的序列段。更优选的柔性接头包括(SG)1、(SG)2、(SG)3、(SG)4、(SG)5和(SG)8,其中S为丝氨酸,G为甘氨酸。优选的刚性接头为2-30个,例如4、6、8、16或24个脯氨酸氨基酸的序列段。更优选的刚性接头包括(P)12,其中P为脯氨酸。
检测器可以包含用分子衔接体和外切核酸酶化学修饰的跨膜蛋白孔。这种检测器可用于外切核酸酶测序。
对于外切核酸酶测序,最优选的检测器包含(a)衍生自α-HL的孔,(b)与所述孔共价连接的外切核酸酶和(c)环糊精或其衍生物。在该优选实施方案中,所述孔优选包含一个SEQ ID NO:36示出的亚基(即α-HL-E287C-QC-D5FLAGH6)和六个SEQ ID NO:34示出的亚基(即α-HL-Q)。所述外切核酸酶优选地为来自大肠杆菌的外切核酸酶I(SEQ ID NO:8)或其变体。所述环糊精的衍生物优选地为七-6-氨基-β-环糊精(am7-βCD)、6-单脱氧-6-单氨基-β-环糊精(am1-βCD)或七-(6-脱氧-6-胍基)-环糊精(gu7-βCD)。
对于链测序,优选的检测器包含(a)衍生自Msp的孔和(b)Phi29聚合酶。所述孔和聚合酶不连接在一起。该优选的实施方案在下文更详细地论述。
检测器可以以单独或单个检测器的形式存在。或者,检测器可以以两个或多个检测器的同源或异源群的形式存在。
多核苷酸
多核苷酸例如核酸是包含两个或多个核苷酸的大分子。被所述蛋白结合的多核苷酸或核酸可以包含任何核苷酸的任何组合。所述核苷酸可以是天然存在的或人造的。所述核苷酸可被氧化或甲基化。所述多核苷酸中的一个或多个核苷酸可受损。例如所述多核苷酸可以包含嘧啶二聚体。这种二聚体通常与紫外线造成的损伤有关,并且是皮肤黑素瘤的主要原因。
核苷酸一般含有核碱基、糖和至少一个磷酸基团。核碱基一般是杂环的。核碱基包括但不限于嘌呤和嘧啶,更具体是腺嘌呤、鸟嘌呤、胸腺嘧啶、尿嘧啶和胞嘧啶。糖一般为戊糖。核苷酸糖包括但不限于核糖和脱氧核糖。所述核苷酸一般为核糖核苷酸或脱氧核糖核苷酸。所述核苷酸一般含有单磷酸、双磷酸或三磷酸。磷酸可以连接在核苷酸的5’或3’侧。
核苷酸包括但不限于,腺苷一磷酸(AMP)、腺苷二磷酸(ADP)、腺苷三磷酸(ATP)、鸟苷一磷酸(GMP)、鸟苷二磷酸(GDP)、鸟苷三磷酸(GTP)、胸苷一磷酸(TMP)、胸苷二磷酸(TDP)、胸苷三磷酸(TTP)、尿苷一磷酸(UMP)、尿苷二磷酸(UDP)、尿苷三磷酸(UTP)、胞苷一磷酸(CMP)、胞苷二磷酸(CDP)、胞苷三磷酸(CTP)、环腺苷一磷酸(cAMP)、环鸟苷一磷酸(cGMP)、脱氧腺苷一磷酸(dAMP)、脱氧腺苷二磷酸(dADP)、脱氧腺苷三磷酸(dATP)、脱氧鸟苷一磷酸(dGMP)、脱氧鸟苷二磷酸(dGDP)、脱氧鸟苷三磷酸(dGTP)、脱氧胸苷一磷酸(dTMP)、脱氧胸苷二磷酸(dTDP)、脱氧胸苷三磷酸(dTTP)、脱氧尿苷一磷酸(dUMP)、脱氧尿苷二磷酸(dUDP)、脱氧尿苷三磷酸(dUTP)、脱氧胞苷一磷酸(dCMP)、脱氧胞苷二磷酸(dCDP)和脱氧胞苷三磷酸(dCTP)、所述核苷酸优选地选自AMP、TMP、GMP、CMP、UMP、dAMP、dTMP、dGMP或dCMP。
核苷酸可以含有糖和至少一个磷酸基团(即没有核碱基)。
所述多核苷酸中的核苷酸可以以任何方式互相连接。如在核酸中核苷酸通常通过其糖和磷酸基团连接。如在嘧啶二聚体中核苷酸可以通过其核碱基连接。
所述多核苷酸可以为单链或双链的。优选地,所述多核苷酸的至少一部分为双链的。单链多核苷酸可以具有一个或多个与其杂交的引物,并因此包含一个或多个双链多核苷酸的短区域。所述引物可以是与靶多核苷酸相同类型的多核苷酸或者可以是不同类型的多核苷酸。
所述多核苷酸可以是核酸,例如脱氧核糖核酸(DNA)或核糖核酸(RNA)。所述多核苷酸可以是任何本领域中已知的合成核酸,例如肽核酸(PNA)、甘油核酸(GNA)、苏糖核酸(TNA)、锁核酸(LNA)或其他合成的具有核苷酸侧链的聚合物。被所述蛋白质结合的多核苷酸优选地为单链,例如cDNA、RNA、GNA、TNA或LNA。被所述蛋白质结合的多核苷酸优选地为双链,例如DNA。结合单链多核苷酸的蛋白质可用于对双链DNA进行测序,只要所述双链DNA在被所述蛋白质结合之前解离为单链。
如果使用本发明的链测序方法,那么所述多核苷酸分析物通常含有一部分双链,即使通常仅对一条链进行测序。在引物/模板设置中,通常对模板链进行测序(即5’端穿入所述孔)。在任何情况中,对于链测序,双链多核苷酸优选地包含单链前导序列。所述前导序列可以是任何长度,但通常长度为27-150个核苷酸,例如长度为50-150个核苷酸。可以以多种方式将单链多核苷酸的部分添加到双链多核苷酸中。可以进行化学连接或酶连接。另外,Epicentre的Nextera方法是合适的。本发明人开发了一种使用正义引物的PCR方法,像通常那样含有与基因组DNA靶区域的起始处互补的部分,但是额外地延续有50个polyT的部分。为了防止聚合酶延伸与所述polyT部分相对的互补链而产生平端的PCR产物(如通常那样),在所述polyT部分和互补引发部分(primingsection)之间添加四个脱碱基位点。这些脱碱基位点会阻止聚合酶延伸越过该区域,因此所述polyT部分在每个扩增的拷贝上将保持为5’单链的DNA。
纳米孔传感
如果所述检测器包含孔,那么本发明的方法优选地还包括使所述分析物与所述检测器相互作用,并测量相互作用期间通过所述孔的电流,从而确定所述分析物的存在或不存在或特征。如果电流以所述分析物特异性的方式流过所述孔(即如果检测到与所述分析物相关的特征性电流流过所述孔),那么所述分析物存在。如果电流没有以所述分析物特异性的方式流过所述孔,那么所述分析物不存在。类似地,可使用相互作用期间流过所述孔的电流来确定所述分析物的特征。
因此本发明涉及分析物的纳米孔传感。本发明可用于区分结构类似的分析物,这是基于所述分析物对通过所述孔的电流的不同影响。本发明还可用于测量样品中特定分析物的浓度。
本发明还可用于在大量传感应用中使用许多或成千上万个孔的传感器。
所述方法可以使用任何适合的膜(例如两亲层或脂双层)系统(其中孔被插入到膜中)来进行。所述方法通常使用(i)包含孔的人工膜(例如两亲层或脂双层),(ii)包含孔的分离的、天然存在的脂双层或(iii)其中插入孔的细胞来进行。所述方法优选地使用人工膜(例如两亲层或脂双层)进行。所述膜可以包含其他跨膜蛋白和/或膜内蛋白以及除所述孔之外的其他分子。下文将参照本发明的测序实施方案论述适合的装置和条件。本发明的方法通常在体外进行。
在所述分析物与所述孔的相互作用期间,所述分析物以该分析物特异性的方式影响流过所述孔的电流。例如,特定的分析物会使流过所述孔的电流降低达特定的平均时间并降低至特定的程度。换句话说,对于特定的分析物而言流过所述孔的电流是特征性的。可以进行对照实验以确定特定分析物对流过所述孔的电流的影响。然后可以将在测试样品上实施本发明的方法所得到的结果与源自这种对照实验的结果相比较,以鉴定所述样品中的特定分析物,确定所述样品中是否存在特定分析物或确定所述分析物的特征。其中流过所述孔的电流被以可指示特定分析物的方式影响的频率,可被用于确定所述样品中该分析物的浓度。
对多核苷酸进行测序的方法
本发明还提供了评估靶多核苷酸分析物的序列的方法。本发明还提供了对靶多核苷酸分析物进行测序的方法。多核苷酸是包含两个或多个核苷酸的大分子。所述核苷酸可以是上述那些核苷酸的任一种,包括甲基化、氧化和损伤的核苷酸。所述多核苷酸可以是上述那些多核苷酸的任一种,并优选地为核酸。
这些方法是可行的,因为可基于结构类似的不同核苷酸对通过跨膜蛋白孔的电流的不同影响而使用所述孔区分这些核苷酸。当单个核苷酸与所述孔相互作用时可根据其电流振幅在单分子水平上鉴定它们。如果电流以所述核苷酸特异性的方式流过所述孔(即如果检测到与该核苷酸相关的特征性电流流过所述孔),那么所述核苷酸存在于所述孔中(单独地或作为多核苷酸的一部分)。连续鉴定靶多核苷酸中的核苷酸使得能够确定所述多核苷酸的序列。
在一个实施方案中,所述方法包括(a)将所述靶多核苷酸偶联到膜上;(b)使所述靶多核苷酸与所述膜中存在的检测器相互作用,其中所述检测器包含跨膜孔和外切核酸酶,使得所述外切核酸酶从所述靶多核苷酸的一个末端开始消化单个的核苷酸;(c)使所述核苷酸与所述孔相互作用;(d)测量所述相互作用期间通过所述孔的电流,从而确定所述核苷酸的种类;和(e)在所述靶多核苷酸的同一末端重复步骤(b)至(d),从而确定所述靶多核苷酸的序列。在另一个实施方案中,所述方法包括(a)将所述靶多核苷酸偶联到膜上;(b)使所述靶多核苷酸与所述膜中存在的检测器相互作用,其中所述检测器包含跨膜蛋白孔、有助于所述孔与一个或多个核苷酸之间相互作用的分子衔接体以及外切核酸酶,使得所述外切核酸酶从所述靶多核苷酸的一个末端开始消化单个的核苷酸;(c)使所述核苷酸与所述衔接体相互作用;(d)测量所述相互作用期间通过所述孔的电流,从而确定所述核苷酸的种类;和(e)在所述靶多核苷酸的同一末端重复步骤(b)至(d),从而确定所述靶多核苷酸的序列。因此所述方法包括以连续方式对靶多核苷酸中的部分核苷酸进行纳米孔传感以对所述靶多核苷酸进行测序。单个核苷酸在上文和下文中叙述。这是外切核酸酶测序。
在另一个实施方案中,所述方法包括:(a)将所述靶多核苷酸偶联到膜上;(b)使所述靶多核苷酸与所述膜中存在的检测器相互作用,其中所述检测器包含跨膜孔,使得所述靶多核苷酸移动穿过所述孔;和(c)测量所述靶多核苷酸相对于所述孔移动时通过所述孔的电流,从而确定所述靶多核苷酸的序列。在另一个实施方案中,所述方法包括(a)将所述靶多核苷酸偶联到膜上;(b)使所述靶多核苷酸与所述膜中存在的检测器相互作用,其中所述检测器包含跨膜蛋白孔和多核苷酸结合蛋白(优选聚合酶),使得所述蛋白质控制所述靶多核苷酸移动穿过所述孔并且所述靶多核苷酸中的一部分核苷酸与所述孔相互作用;和(c)测量每次相互作用期间通过所述孔的电流,从而确定所述靶多核苷酸的序列。因此所述方法包括当靶多核苷酸中的一部分核苷酸单个地通过所述桶或通道时对所述核苷酸进行纳米孔传感,以对所述靶多核苷酸进行测序。这是链测序。
本发明的这些方法尤其适合于测序靶多核苷酸例如核酸,因为核酸序列与膜的偶联使所需要的多核苷酸的量降低了几个数量级。可以使用本发明测序的靶多核苷酸的浓度如上所述。
可以使用该方法对整个或部分的靶多核苷酸进行测序。所述多核苷酸可以是任何长度。例如,所述多核苷酸长度可以是至少10、至少50、至少100、至少150、至少200、至少250、至少300、至少400或至少500个核苷酸。所述多核苷酸长度可以是1000或更多个核苷酸或者5000或更多个核苷酸。所述多核苷酸可以是天然存在的或人造的。例如,所述方法可用于验证所制备的寡核苷酸的序列。所述方法通常在体外进行。
所述核苷酸(从靶多核苷酸消化下来的或存在于所述多核苷酸中的)可以在膜的任一侧与所述孔相互作用。所述核苷酸可以以任何方式在任何位点与所述孔相互作用。如上文详述,核苷酸优选地经衔接体或连同衔接体一起可逆地与所述孔结合。所述核苷酸最优选地在其通过跨越膜的孔时可以经衔接体或连同衔接体一起可逆地与所述孔结合。所述核苷酸还可在其通过跨越膜的孔时经衔接体或连同衔接体一起可逆地与所述孔的桶或通道结合。
在核苷酸与孔相互作用过程中,所述核苷酸以该核苷酸特有的方式影响流经所述孔的电流。例如,特定的核苷酸会降低流经孔的电流达特定的平均时间并且降低至特定的程度。换句话说,对于特定的核苷酸,流经所述孔的电流是特征性的。可以进行对照实验来确定特定核苷酸对流经所述孔的电流的影响。然后,可以将在测试样品上实施本发明的方法得到的结果与这种对照实验得到的结果相比较,以确定所述靶多核苷酸的序列。
所述测序方法可以使用任何适合的膜/孔系统(其中孔存在于膜中或插入到膜中)来进行。所述方法通常使用包含天然存在的或合成的脂质的膜来进行。所述膜通常在体外形成。所述方法优选地不使用分离的、天然存在的包含孔的膜或表达孔的细胞来进行。所述方法优选地使用人工膜来进行。所述膜可以包含其他跨膜蛋白和/或膜内蛋白以及除孔之外的其他分子。
所述膜形成对离子、核苷酸和多核苷酸流动的屏障。所述膜优选地为两亲层例如脂双层。适合用于本发明的脂双层如上文所述。
本发明的测序方法一般在体外进行。
所述测序方法可以使用适于研究膜/孔系统(其中孔存在于膜中或插入到膜中)的任何装置进行。所述方法可以使用适于纳米孔传感的任何装置进行。例如,所述装置包含含有水性溶液的腔室以及将所述腔室分为两部分的屏障。所述屏障物具有开口,在所述开口中形成含有所述孔的膜。所述分析物可被偶联到所述腔室两个部分中任一部分中的膜上。
所述测序方法可以使用国际申请No.PCT/GB08/000562中描述的装置进行。
本发明的方法包括测量所述孔与所述核苷酸相互作用期间或所述靶多核苷酸相对于所述孔移动时通过所述孔的电流。因此,所述装置还包含能够跨越所述膜和孔施加电位并测量电信号的电路。所述方法可以使用膜片箝或电压箝进行。所述方法优选地包括使用电压箝。
本发明的测序方法包括测量所述孔与所述核苷酸相互作用期间或所述靶多核苷酸相对于所述孔移动时通过所述孔的电流。测量通过跨膜蛋白孔的离子电流的适合条件是本领域中已知的并且公开于实施例中。一般地,使用跨越所述膜和孔施加的电压实施所述方法。所使用的电压一般为–400mV至+400mV。所使用的电压范围优选地具有选自-400mV、-300mV、-200mV、-150mV、-100mV、-50mV、-20mV和0mV的下限和独立地选自+10mV、+20mV、+50mV、+100mV、+150mV、+200mV、+300mV和+400mV的上限。所使用的电压更优选地为100mV至240mV的范围,最优选地为160mV至240mV的范围。可通过使用增加的外加电位来提高孔对不同核苷酸的辨别力。
所述测序方法一般在任何碱金属氯化物盐的存在下进行。在上述示例性装置中,所述盐存在于所述腔室的水性溶液中。一般使用氯化钾(KCl)、氯化钠(NaCl)或氯化铯(CsCl)。优选KCl。盐浓度一般为0.1-2.5M、0.3-1.9M、0.5-1.8M、0.7-1.7M、0.9-1.6M或1M-1.4M。盐浓度优选地为150mM至1M。高盐浓度可提供高的信噪比并使得可相对于正常的电流波动背景鉴定出指示核苷酸存在的电流。如果在酶的存在下进行核苷酸检测,例如当对多核苷酸测序时,可以使用更低的盐浓度。这在下文中更详细地讨论。
一般在缓冲液的存在下实施所述方法。在上文详述的示例性装置中,所述缓冲液存在于所述腔室的水性溶液中。任何缓冲液均可用于本发明的方法。一种适合的缓冲液为Tris-HCl缓冲液。所述方法一般在4.0-12.0、4.5-10.0、5.0-9.0、5.5-8.8、6.0-8.7或7.0-8.8或7.5-8.5的pH下进行。所使用的pH优选约7.5。
所述方法一般在0-100℃、15-95℃、16-90℃、17-85℃、18-80℃、19-70℃或20-60℃下进行。所述方法可以在室温下进行。所述方法优选地在支持酶功能的温度,例如约37℃下进行。
如上文所述,如果提高温度,则可以在低盐浓度下实现良好的核苷酸辨别。除了提高溶液温度外,可以使用多种其他策略增加所述溶液的电导并同时维持适合酶活性的条件。一种这样的策略是使用脂双层分开两种不同浓度的盐溶液,低盐浓度的盐在酶的一侧,较高浓度的在对侧。这种方法的一个实例是在所述膜的顺侧使用200mM的KCl,在反侧腔室中使用500mM KCl。在这些条件下,预期通过所述孔的电导大致等价于正常条件下的400mM KCl,而如果放置在顺侧,所述酶仅经受200mM。使用非对称盐条件的另一个可能益处是跨越所述孔引起的渗透梯度。这种水的净流动可用于将核苷酸拉到所述孔中以进行检测。使用中性渗透物例如蔗糖、甘油或PEG可以达到类似的效果。另一种可能性是使用具有相对低水平的KCl的溶液并且依靠另外的荷电的且对酶活性有较低破坏性的物质。
可将要分析的靶多核苷酸与已知的保护性化学物质结合以保护所述多核苷酸在本体溶液中时免受所述结合蛋白或外切核酸酶的作用。然后,所述孔可用于除去所述保护性化学物质。这可以通过如下方式来实现:使用在外加电位下被所述孔、结合蛋白或酶去杂交(unhybridised)的保护基团(WO2008/124107)或使用当接近所述孔时被所述结合蛋白或酶除去的保护性化学物质(J Am Chem Soc.2010Dec22;132(50):17961-72)。
外切核酸酶测序
在一个实施方案中,对靶多核苷酸分析物进行测序的方法包括使所述靶多核苷酸与外切核酸酶相互作用。本发明方法可使用上述的任意外切核酸酶。所述外切核酸酶从所述靶多核苷酸的一个末端释放单个核苷酸。所述酶可以如上文所述共价连接至所述孔。
单独的核苷酸为单个核苷酸。单独的核苷酸是没有通过核苷酸键结合至另一个核苷酸或多核苷酸的核苷酸。核苷酸键包括核苷酸的磷酸基团之一结合到另一个核苷酸的糖基。单独的核苷酸通常是没有通过核苷酸键结合到另一个具有至少5、至少10、至少20、至少50、至少100、至少200、至少500、至少1000或至少5000个核苷酸的多核苷酸的核苷酸。例如,单独的核苷酸已经被从靶多核苷酸(例如DNA或RNA链)上消化下来。单独的核苷酸可以是上述那些中的任一种。
外切核酸酶是通常锁定到多核苷酸的一个末端并从该末端一次消化所述多核苷酸的一个核苷酸的酶。所述外切核酸酶可以以5’至3’方向或3’至5’方向消化所述多核苷酸。所述外切核酸酶结合的多核苷酸末端通常是通过选择所使用的酶和/或使用本领域中已知方法来确定。在所述多核苷酸任一末端的羟基或帽子结构通常可用于防止或促进所述外切核酸酶与所述多核苷酸特定末端的结合。
所述方法包括使所述多核苷酸与所述外切核酸酶相互作用,使得以能够按上文所述鉴定一部分核苷酸的速率从所述多核苷酸的末端消化下来核苷酸。这么做的方法是本领域中熟知的。例如,埃德曼(Edman)降解被用于从多肽的末端连续消化单个氨基酸,使得可以使用高效液相色谱(HPLC)鉴定它们。类似的方法可以用于本发明。
所述外切核酸酶发挥作用的速率一般慢于野生型外切核酸酶的最佳速率。在所述测序方法中外切核酸酶的适合活性速率包括每秒消化0.5-1000个核苷酸,每秒消化0.6-500个核苷酸,每秒消化0.7-200个核苷酸,每秒消化0.8-100个核苷酸,每秒消化0.9-50个核苷酸或每秒消化1-20或10个核苷酸。所述速率优选地为每秒消化1、10、100、500或1000个核苷酸。外切核酸酶活性的适合速率可以以多种方式实现。例如,本发明可以使用具有降低的最佳活性速率的变体外切核酸酶。
除了减少需要的多核苷酸量以外,本发明的外切核酸酶测序方法有额外的优势。本发明人研究了在电位下溶液中的单链DNA到外切核酸酶-纳米孔(―X-孔‖)/膜系统的呈递。当DNA分析物被引入到所述系统中时,所述孔可被永久或暂时地阻断,阻止检测单个核苷酸。当所述DNA分析物的一个末端的位置远离所述孔(例如偶联到膜上)时,出乎意料地发现不再能观察到这种阻断。对于所述酶而言,因为与分析物在同一平面而增加了有效浓度,从而增加了可能的DNA穿入事件的数量。这起到降低分析物之间的结合时间并增加测序通量的作用。
链测序
链测序涉及多核苷酸以受控且逐步的方式移位通过孔。多核苷酸是包含两个或多个核苷酸的大分子。被所述蛋白结合的多核苷酸可以包含任何核苷酸的任何组合。所述核苷酸可以是上文所述那些中的任一种。
本发明的链测序方法一般使用多核苷酸结合蛋白来控制所述靶多核苷酸移动通过所述孔。这种蛋白的实例在上文给出。所述多核苷酸结合蛋白优选地为多核苷酸处理酶。多核苷酸处理酶是能够与多核苷酸相互作用并改变多核苷酸的至少一种性质的多肽。所述酶可通过切割所述多核苷酸形成单个核苷酸或较短的核苷酸链(例如二核苷酸或三核苷酸)来改变所述多核苷酸。所述酶可通过将所述多核苷酸定向或将其移动到特定位置来改变所述多核苷酸。所述多核苷酸处理酶不需要展现出酶活性,只要其能够结合所述靶多核苷酸并控制其移动通过所述孔。例如,所述酶可被改变以除去其酶活性或可在阻止其作为酶起作用的条件下使用。这种条件在下文更详细地讨论。
所述多核苷酸处理酶优选地衍生自溶核酶。用于所述多核苷酸处理酶的构建体中的酶更优选地衍生自酶分类(EC)组3.1.11、3.1.13、3.1.14、3.1.15、3.1.16、3.1.21、3.1.22、3.1.25、3.1.26、3.1.27、3.1.30和3.1.31中任一组的成员。所述酶可以是国际申请No.PCT/GB10/000133(公开为WO2010/086603)中公开的那些中的任一种。
优选的酶为聚合酶、外切核酸酶、解旋酶、移位酶和拓扑异构酶例如回旋酶。适合的酶包括但不限于来自大肠杆菌的外切核酸酶I(SEQID NO:8)、来自大肠杆菌的外切核酸酶III(SEQ ID NO:10)、来自嗜热栖热菌的RecJ(SEQ ID NO:12)和λ噬菌体外切核酸酶(SEQ IDNO:14)及它们的变体。包含SEQ ID NO:14示出的序列或其变体的三个亚基可相互作用形成三聚体外切核酸酶。所述酶最优选地衍生自Phi29DNA聚合酶。衍生自Phi29聚合酶的酶包含SEQ ID NO:6示出的序列或其变体。
根据一个实施方案,所述多核苷酸结合蛋白被偶联或束缚到所述膜上并且都能够与分析物多核苷酸结合,然后控制所述分析物移位通过所述孔。在该实施方案中,所述分析物多核苷酸可通过所述多核苷酸结合蛋白偶联到所述膜上。所述分析物多核苷酸和所述多核苷酸结合蛋白可以都被偶联到膜上,优选地通过不同的偶联方法。所述多核苷酸结合蛋白优选地为解旋酶。
SEQ ID NO:6、8、10、12或14的变体是其氨基酸序列从SEQ IDNO:6、8、10、12或14的氨基酸序列变化而来且保留多核苷酸结合能力的酶。所述变体可以包括促进所述多核苷酸结合和/或促进其在高盐浓度和/或室温下的活性的修饰。
在SEQ ID NO:6、8、10、12或14的全长氨基酸序列上,基于氨基酸同一性,变体优选地与该序列至少50%同源。更优选地,基于氨基酸同一性,所述变体多肽与SEQ ID NO:6、8、10、12或14的氨基酸序列在整个序列上可以至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%,更优选至少95%、97%或99%同源。在200或更多个,例如230、250、270或280或更多个连续氨基酸的序列段上可以有至少80%,例如至少85%、90%或95%的氨基酸同一性(―硬同源性‖)。同源性可如上文所述确定。所述变体可以以上文参照SEQ ID NO:详述的任何方式不同于野生型序列。所述酶可以如上所文所详述共价连接到所述孔。
所述酶不需要像进行单个核苷酸测序那样尽可能地接近所述孔腔,因为核苷酸到达所述孔的传感部分的顺序不可能紊乱。
链DNA测序的两个策略是DNA移位通过纳米孔,从顺侧到反侧以及从反侧到顺侧,顺着或逆着外加电位。最有利的链测序机制之一是单链DNA在外加电位下受控地移位通过纳米孔。可渐进或持续地对双链DNA起作用的外切核酸酶可在所述孔的顺侧使用以在外加电位下将其余的单链送入,或者在反向电位下在反侧使用。同样,可解开双链DNA的解旋酶也可以以类似的方式使用。还可能存在需要链逆着外加电位移位的测序应用,但是DNA必须首先在反向电位或没有电位的情况下被所述酶―捕捉‖。结合之后顺着被转换回来的电位,所述链将从顺侧到反侧通过所述孔并被电流保持为展开的构象。单链DNA外切核酸酶或单链DNA依赖的聚合酶可以起到分子马达的作用,将最近移位的单链以受控且逐步方式从反侧到顺侧,逆着外加电位拉回通过所述孔。或者,所述单链DNA依赖的聚合酶可以起到分子制动器的作用以减慢多核苷酸移动通过所述孔。
在最优选的实施方案中,链测序使用衍生自Msp的孔和Phi29DNA聚合酶进行。所述方法可以包括(a)将所述靶多核苷酸偶联到膜上;(b)使所述靶多核苷酸与所述膜中的检测器相互作用,所述检测器包含衍生自Msp的孔和Phi29DNA聚合酶,使得所述聚合酶控制所述靶多核苷酸移动通过所述孔;和(c)测量所述靶多核苷酸相对于所述孔移动时通过所述孔的电流,从而确定所述靶多核苷酸的序列,其中进行步骤(b)和(c)时跨越所述孔施加有电压。所述方法可以包括(a)将所述靶多核苷酸偶联到膜上;(b)使所述靶多核苷酸与所述膜中的检测器相互作用,所述检测器包含衍生自Msp的孔和Phi29DNA聚合酶,使得所述聚合酶控制所述靶多核苷酸移动穿过所述孔并且所述靶多核苷酸中的一部分核苷酸与所述孔相互作用;和(c)测量每次相互作用期间通过所述孔的电流,从而确定所述靶多核苷酸的序列,其中进行步骤(b)和(c)时跨越所述孔施加有电压。当所述靶多核苷酸与Phi29DNA聚合酶和衍生自Msp的孔接触时,所述靶多核苷酸首先与Phi29DNA聚合酶形成复合体。当跨越所述孔施加电压时,所述靶多核苷酸/Phi29DNA聚合酶复合体与所述孔形成复合体并且控制所述靶多核苷酸移动通过所述孔。
这些Msp/Phi29实施方案具有三个预料不到的优点。第一,所述靶多核苷酸以商业上可行且允许有效测序的速率运动通过所述孔。所述靶多核苷酸移动通过所述Msp孔比其移动通过溶血素孔更快。第二,当所述多核苷酸移动通过所述孔时观察到电流范围增加,使得能够更容易确定所述序列。第三,当特定的孔和聚合酶一起使用时观察到电流变化减少,从而提高信噪比。
可对上文所述的任何多核苷酸进行测序。优选地至少一部分所述多核苷酸是双链。
所述孔可以是上文详述的任何孔。所述孔可以包含八个含有SEQID NO:2示出的序列或其变体的单体。
野生型Phi29DNA聚合酶具有聚合酶和外切核酸酶活性。其还可以在恰当条件下解开双链多核苷酸。因此,所述酶可以以三种模式工作。这在下文中更详细地讨论。
Phi29DNA聚合酶可包含SEQ ID NO:6示出的序列或其变体。SEQ ID NO:6的变体是其氨基酸序列从SEQ ID NO:6的氨基酸序列变化而来且保留多核苷酸结合活性的酶。所述变体必须在下文详述的三种模式中的至少一种下工作。优选地,所述变体在全部三种模式下工作。所述变体可以包括有利于处理多核苷酸和/或有利于其在高盐浓度和/或室温下的活性的修饰。
在SEQ ID NO:6的全长氨基酸序列上,基于氨基酸同一性,变体优选地与该序列至少40%同源。更优选地,基于氨基酸同一性,所述变体多肽与SEQ ID NO:4的氨基酸序列在整个序列上可以至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%,更优选至少95%、97%或99%同源。在200或更多个,例如230、250、270或280或更多个连续氨基酸的序列段上可以有至少80%,例如至少85%、90%或95%的氨基酸同一性(―硬同源性‖)。同源性可如上文所述确定。所述变体可以以上述参照SEQ ID NO:2讨论的任何方式不同于野生型序列。所述酶可以如上文所详述共价连接到所述孔。
该优选实施方案可以使用上文详述的任何系统、装置或条件。所述盐浓度一般为0.15M至0.6M。所述盐优选KCl。
所述方法可以基于Phi29DNA聚合酶的三种模式以三种优选方式之一进行。每种方式均包括对序列进行校对读取(proof-reading)的方法。第一,所述方法优选使用Phi29DNA聚合酶作为聚合酶来进行。在该实施方案中,步骤(b)和(c)在游离核苷酸和酶辅因子的存在下进行,使得所述聚合酶使所述靶多核苷酸逆着外加电压产生的场移动通过所述孔。所述靶多核苷酸以5’到3’方向移动。所述游离核苷酸可以是上文详述的个体核苷酸的任一种或多种。所述酶辅因子是使Phi29DNA聚合酶作为聚合酶或外切核酸酶发挥作用的因子。所述酶辅因子优选地为二价金属阳离子。所述二价金属阳离子优选地为Mg2+、Mn2+、Ca2+或Co2+。所述酶辅因子最优选地为Mg2+。所述方法优选地还包括(d)除去所述游离核苷酸,使得所述聚合酶使所述靶多核苷酸顺着外加电压产生的场移动通过所述孔(即以3’到5’方向)并且使所述靶多核苷酸中的一部分核苷酸与所述孔相互作用,和(e)测量每次相互作用期间通过所述孔的电流,从而对步骤(c)中获得的靶多核苷酸的序列进行校对读取,其中步骤(d)和(e)进行时跨越所述孔也施加有电压。
第二,所述方法优选地使用Phi29DNA聚合酶作为外切核酸酶来进行。在该实施方案中,其中步骤(b)和(c)在不存在游离核苷酸但存在酶辅因子的情况下进行,使得所述聚合酶使所述靶多核苷酸顺着外加电压产生的场移动通过所述孔。所述靶多核苷酸以3’到5’方向移动。所述方法优选地还包括(d)添加游离核苷酸,使得所述聚合酶使所述靶多核苷酸逆着外加电压产生的场移动通过所述孔(即以5’到3’方向)并且使所述靶多核苷酸中的一部分核苷酸与所述孔相互作用,和(e)测量每次相互作用期间通过所述孔的电流,从而对步骤(c)中获得的靶多核苷酸的序列进行校对读取,其中步骤(d)和(e)进行时也跨越所述孔施加有电压。
第三,所述方法优选地使用Phi29DNA聚合酶以解链模式进行。在该实施方案中,步骤(b)和(c)在不存在游离核苷酸和酶辅因子的情况下进行,使得所述聚合酶控制所述靶多核苷酸顺着外加电压产生的场移动通过所述孔(因为所述靶多核苷酸被解开)。在该实施方案中,所述聚合酶像制动器一样起作用,阻止所述靶多核苷酸在外加电压的影响下过快地移动通过所述孔。所述方法优选地还包括(d)降低跨越所述孔施加的电压,使得所述靶多核苷酸以与步骤(b)和(c)中相反的方向移动通过所述孔(即因为其再退火),并且使所述靶多核苷酸中的一部分核苷酸与所述孔相互作用,和(e)测量每次相互作用期间通过所述孔的电流,从而对步骤(c)中获得的靶多核苷酸的序列进行校对读取,其中步骤(d)和(e)进行时也跨越所述孔施加有电压。
试剂盒
本发明还提供了用于对靶多核苷酸分析物进行测序的试剂盒。所述试剂盒包含(a)跨膜孔例如跨膜蛋白孔,(b)多核苷酸结合蛋白和(c)将所述靶多核苷酸偶联到膜上的工具。在一个优选实施方案中,所述多核苷酸结合蛋白为外切核酸酶,所述试剂盒还包含可促进所述孔与所述靶多核苷酸中一个或多个核苷酸相互作用的分子衔接体。这种试剂盒可用于外切核酸酶测序。在另一个优选实施方案中,所述试剂盒包含膜的组分,例如形成脂双层所需要的磷脂。
将所述靶多核苷酸偶联到所述膜上的工具优选地包含反应性基团。适合的基团包括但不限于巯基、胆固醇、脂质和生物素基团。上文参照本发明的方法所讨论的任何实施方案同样适用于本发明的试剂盒。
本发明的试剂盒可额外地包含一种或多种能够使上述任何实施方案得以实施的其他试剂或仪器。这种试剂或仪器包括如下的一种或多种:适合的缓冲液(水性溶液)、从受试者获得样品的工具(例如包含针的管或器具)、扩增和/或表达多核苷酸的工具、如上定义的膜或电压箝或膜片箝装置。试剂可以以干燥状态存在于所述试剂盒中,使得流体样品重悬所述试剂。所述试剂盒还可任选地包含能够使所述试剂盒用于本发明方法的说明书或关于所述方法可用于何种患者的详细说明。所述试剂盒可任选地包含核苷酸。
装置
本发明还提供了用于对靶多核苷酸分析物进行测序的装置。所述装置包含(a)膜,(b)所述膜中的多个跨膜孔,(c)多个多核苷酸结合蛋白和(d)偶联到所述膜上的多个靶多核苷酸。所述多个多核苷酸结合蛋白可以在所述膜中。所述装置可以是用于分析物分析的任何常规装置,例如阵列或芯片。在一个优选实施方案中,所述多核苷酸结合蛋白为外切核酸酶并且所述装置包含可促进所述孔与所述靶多核苷酸中一个或多个核苷酸相互作用的分子衔接体。这种装置可用于外切核酸酶测序。上文参照本发明方法所讨论的任何实施方案可同样适用于本发明的试剂盒。所述装置优选地包含:
传感器装置,其能够支持所述膜和多个孔并且可被操作以使用
所述孔和蛋白进行多核苷酸测序;和
至少一个贮器,其用于容纳用于进行所述测序的材料。
所述装置优选地包含:
传感器装置,其能够支持所述膜和多个孔并且可被操作以使用
所述孔和蛋白质进行多核苷酸测序;
至少一个贮器,其用于容纳用于进行所述测序的材料;
流路系统(fluidics system),其被配置用于将材料可控制地从至少一个贮器供应到所述传感器装置;和
一个或多个例如许多个用于接受各个样品的容器,所述流路系统被配置用于将所述样品选择性地从所述一个或多个容器供应到所述传感器装置的。
所述装置可以是记载于国际申请NO.PCT/GB08/004127(公开为WO2009/077734)、PCT/GB10/000789(公开为WO2010/122293)、国际申请No.PCT/GB10/002206(未公开)或国际申请PCT/US99/25679(公开为WO00/28312)中的那些中的任一种。
以下实施例解释本发明:
1.实施例1–外切核酸酶测序
1.1材料和方法
1.1.1材料和寡核苷酸
寡核苷酸购自ADTBio或IDTDNA。确切的序列和修饰的详情见于下表(SEQ ID NO:18-21)。
在大肠杆菌中表达的重组链霉亲和素购自Sigma Aldrich(S0677)。合成的脂质1,2-二植烷酰基-sn-甘油-3-磷酸胆碱(16:04ME PC)和1,2-二棕榈酰基-sn-甘油-3-磷酸乙醇胺-N-cap生物素基(16:0Cap BiotinylPE)购自Avanti Polar Lipids。
1.1.2单取代的链霉亲和素的HPLC纯化
将1uM的5’-生物素修饰的DNA与10uM链霉亲和素在25mMTris.HCl、400mM KCl、10mM MgCl2,pH7.5中混合并在22℃下孵育30分钟。使用包含二元泵的Agilent1200分析LC系统分离单取代的Strep:DNA缀合物,柱加热炉维持在23℃,UV检测器有13ul流动室,样品区室和级分维持在4℃。所述柱为以1ml min-1运行的AgilentBioMonolith QA并且用溶于100mM Tris pH8.5中30mM-1.1MNaCl的梯度分离样品。在凝胶电泳之后使用光密度测定法对纯化的单取代Strep:DNA缀合物进行定量,所述光密度测定法使用一系列的DNA标准品产生标准曲线。
1.1.3来自平面脂双层的单通道记录
通过并置100%16:04ME PC或95%16:04ME PC、5%16:0CapBiotinyl PE的两个单层来形成双层。在Teflon薄膜(25μm厚,来自Goodfellow,Malvern,PA)上跨越60-150μm直径的开口形成了双层,所述Teflon薄膜将腔室分为两个缓冲液区室(顺侧和反侧),每个体积为1ml。通过连续升高每个区室中的缓冲液水平来跨越所述开口形成了双层,直到观察到高电阻封闭(≥10GΩ)。除非另有说明,将DNA和蛋白质加入到接地的顺侧区室。在连接到放大器探头(hear-stage ofamplifier)的反侧区室中没有加入任何试剂。除非另有说明,在22℃下在25mM Tris.HCl、400mM KCl、10mM MgCl2,pH7.5中进行实验。
1.2结果
1.2.1束缚的分析物的单分子检测
对溶液中游离的单链DNA的纳米孔检测速率可以通过测量每秒DNA移位通过所述纳米孔(事件)的数量来确定。DNA移位可以通过数字记录中特征性的暂时电流阻断来鉴定。对于束缚的分析物,可类似地计算相互作用的数量,条件是DNA仅暂时地(例如通过胆固醇基团)被束缚到所述双层上。当DNA的游离末端进入所述纳米孔时,其会在所述桶中驻留直到所述束缚的末端从所述双层释放,使得所述分子可以移位(图2A和2B)。如果所述束缚更稳定,那么所述阻断就是永久的(图2C和2D)。
以10、100和1000pM的终浓度测定胆固醇修饰的PolyA和PolyC(分别为ONLA0682和ONLA0683)的50%混合物以确定Chol-DNA对所述事件速率和停留时间的影响(下表)。将此与游离单链DNA的事件速率相比较。
在所有浓度下速率随电压增加(上表),当然在更高的浓度下事件速率更高。在更低的浓度和电压下,事件速率太低而不能被认为是真正有意义的。也就是说,很可能,在这些条件下大多数(如果不是全部)的事件只是偶然的假阳性。但是有点出乎意料的是,在更高电流水平下仅用10pM的DNA就观察到显著数量的DNA事件。尽管所述DNA浓度低了至少100倍,使用胆固醇修饰的DNA时事件速率更高。有点出乎意料的是,在更高的电流水平(≥160mV)下仅用10pM的DNA时仍然观察到显著数量的DNA事件,这些DNA事件发生的频率与100nM未修饰的ssDNA相似。可以估计,束缚DNA使DNA分析物的检测提高了3-4个数量级。对于某些应用,优选地,所述束缚是暂时性的。如果稳定束缚的分子被直接连接到DNA的5’或3’末端,那么会丢失一些序列数据,因为所述测序运行由于所述双层和所述酶活性位点之间的距离而不能继续进行到DNA的末端。如果所述束缚更多地是暂时性的,那么当束缚的末端随机地从所述双层释放时,那么所述酶可完成对DNA的处理。
1.3结论
本发明人在此已经证明,电位使纳米孔检测器对分析物的检测效率提高了约3-4个数量级。快速的孔封闭表明,这种束缚的分析物仍然能够为来自溶液的和双层中的蛋白质(分别地为例如酶或纳米孔构建体)所用,并因此有潜力作为向所述孔本身或纳米孔-酶构建体传递的传递机制。
可以使用将分析物与脂双层连接的多种方式,并且大多数已经被报告用于束缚ssDNA,因为在寡核苷酸合成过程中可以容易地纳入功能性的化学物质。在优选的方式中,使用末端转移酶将用生物素修饰的ddNTP纳入到ssDNA的3’末端。通过与链霉亲和素混合,分析物DNA就可被加入到含有1-5%生物素PE的脂双层中的单个孔中,在此其被束缚。或者,如果所述序列是已知的,那么可将DNA与一个末端已经修饰为亲脂性的、互补的合成DNA杂交。
束缚分析物的另一个优点是可控制DNA的一个末端。以上可以看出,如果DNA的一个末端非常接近(在上述情况中是双层),那么DNA会快速封闭所述孔。如果DNA处理酶(例如外切核酸酶)被连接到所述纳米孔,那么其将结合所述DNA的一个末端并再次使其定位于所述孔,因此另一末端会迅速地封闭。但是如果DNA被固定,那么当所述酶与一个末端结合时,那么两个末端都被占用,都不能被所述孔利用。
一些应用例如用于表观遗传学的单细胞测序还有对小量生物样品进行筛选,都需要低分析物需要量的DNA测序。对于测序文库制备物,当前的Illumina基因组分析仪系统需要100ng-1ug的DNA。用于纳米孔测序的单个128通道芯片可以使用约0.5ng DNA而无需扩增;基于10pM浓度下的1000mer片段生成和读取长度。
2.实施例2–链测序
除了将ssDNA连接到脂质膜上用于外切核酸酶测序的工作外,所述技术还可被改造以适用于链测序方法。在链测序中,多核苷酸链的一部分在外加电位下穿入所述纳米孔。所述链通常为DNA或RNA,例如单链或双链DNA。优选地,所述链为单链DNA(ssDNA)。包含在所述链中的碱基残基与所述纳米孔相互作用,产生对每种残基而言特征性的信号。所述链移动穿过所述孔,导致信号变化。所述信号可用于推断所述DNA链的序列。
链测序的一个实施方案使用嵌入脂质膜中的蛋白孔。电极被放置在电解质中所述脂质膜两侧并跨越所述系统施加电位。在所述电位下,所述多核苷酸移位通过所述孔。当它们通过所述孔的跨膜桶时,可测量通过所述蛋白孔的电流并将其用于识别碱基。通常,所述蛋白孔会是细菌膜蛋白,例如孔蛋白或毒素。优选地,所述孔为溶血素、短杆菌肽或MspA。
DNA移位通过孔的速率可能太快使得不能准确鉴定每个碱基,因此可能需要使移位变慢。一种使DNA链的移位变慢的方法是使用DNA处理蛋白例如DNA聚合酶。所述DNA处理蛋白可与所述孔连接,例如通过直接的或经接头基团的共价键合来连接。通常所述DNA处理蛋白被连接到所述孔用于外切核酸酶测序应用。通常对于链测序应用而言,所述DNA处理蛋白不与所述孔连接。
对于链测序方法,需要这样的DNA处理蛋白,其在纳米孔的顶部有非常长的结合时间。长的结合时间使得许多待处理的核苷酸能够被所述DNA处理蛋白处理从而通过所述纳米孔。对于聚合酶,一般的处理速率可以为每秒约20个核苷酸。10分钟的结合时间使得能够移动12000个核苷酸。一分钟的结合时间使得能够处理120个核苷酸。
使用该方法时,长的结合时间还与读取长度有关。目前,约100个核苷酸的读取长度将足以与现有技术竞争,但是需要更长的读取长度,例如200、500或1000个核苷酸的读取长度。优选的读取长度为至少5000个核苷酸,更优选10000或50000个核苷酸。长读取长度的一个优点是其大大减少了分析测序信息所需要的生物信息学的复杂度。
通常DNA处理蛋白为DNA聚合酶。优选的DNA处理蛋白包括Phi29DNA聚合酶。
2.1材料和方法
通过并置100%DPhPC或99%DPhPC、1%16:0Cap Biotinyl PE的两个单层来形成双层。在Teflon薄膜(25μm厚,来自Goodfellow,Malvern,PA)上跨越60-150μm直径的开口形成了双层,所述Teflon薄膜将腔室分为两个缓冲液区室(顺侧和反侧),每个体积为1ml。通过连续升高每个区室中的缓冲液水平来跨越所述开口形成了双层,直到观察到高电阻封闭(≥10GΩ)。除非另有说明,将DNA和蛋白质加入到接地的顺侧区室。不向连接放大器探头的反侧区室中加入任何试剂。用400mM KCl、25mM Tris.HCl、10uM EDTA,pH7.5进行实验。使用的溶血素变体为HL-(E111N/K147N)7(SEQ ID NO:38)。
将1uM的5’-生物素修饰的DNA(链DNA1)与10uM链霉亲和素在25mM Tris.HCl、400mM KCl、10mM MgCl2,pH7.5中混合并在22℃下孵育30分钟。使用包含二元泵的Agilent1200分析LC系统分离单取代的Strep:DNA缀合物,柱加热炉维持在23℃,UV检测器有13ul流动室,样品区室和级分都维持在4℃。所述柱为以1ml min-1运行的Agilent BioMonolith QA,并用溶于100mM Tris pH8.5中30mM-1.1M NaCl的梯度分离样品。在凝胶电泳之后使用光密度测定法对纯化的单取代Strep:DNA缀合物进行定量,所述光密度测定法使用一系列DNA标准品来产生标准曲线。为形成链DNA3,通过在PCR加热块上加热至50℃并持续10分钟使DNA-链霉亲和素复合体与5倍过量的链DNA2杂交。以每分钟2度的速率使温度降低至23℃。
对于膜束缚运行,用99%DPhPC、1%16:0Cap Biotinyl PE形成双层。一旦形成所述双层,将1nM链DNA3加入到顺侧区室并良好地混合。在+180mV下记录对照部分持续5分钟以获得DNA与纳米孔的结合事件。在记录对照部分后,加入5nM KF(外切酶负型(exo minus))(NEB)并在+180mV下记录信号持续5分钟。
对于分析物是在溶液中的运行,用100%DPhPC形成双层。通过使链DNA4和链DNA5以等摩尔浓度杂交产生链DNA6。杂交通过如下方式进行:在PCR块上加热至50℃并持续10分钟,然后以2℃/min冷却至23℃。一旦形成所述双层,将400nM链DNA6加入到顺侧区室并良好地混合。在+180mV下记录对照部分持续5分钟以获得DNA与纳米孔的结合事件。在记录对照部分后,加入800nM KF(外切酶负型)(NEB)并在+180mV下记录信号持续5分钟。
目测评估开孔水平,当数据落在阈值之下的时候DNA移位事件被定义为偶然的,所述阈值位于孔水平之下约5Σ(其中Σ为噪声的标准差)。从所述数据中手动除去任何明显的假象,然后进行事件检测。图中示出的是以pA计的每个事件的平均电流水平(纵轴)与以秒计的事件的长度(横轴)。注意,横轴以对数标度显示,因为事件长度的范围从少于一毫秒至多达10秒。在所有四种情况中,还有许多已被排除的非常短的事件(少于1ms)。这是因为它们的电流水平太短而不能被可靠地评估,因为它们不足以区分所示出的不同条件。
链DNA1:5’-生物素-
TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTT
TTTTTTTTTTTTTTTTTTTGGCTACGACCTGCATGAGAATGC-3'(SEQ ID NO:22)
链DNA2:5’-
CTCACCTATCCTTCCACTCACCCCCCAAAAAAccccccAAAAAACCCCCCAAAAAAGCATTCTCATGCAGGTCGTAGCC-3'(SEQIDNO:23)
链DNA3:与链DNA2杂交的链DNA1(SEQ ID NO:22和23)
链DNA4:5’-
AACCCCCAAAAACCCCCAAAAACCCCCAAAAACCCCCAAAAACCCCCAAAAACCCCCAAAAACCCCCAAAAACCCCCATAGAGACAAGAATAACGAAGTA-3’(SEQ TD NO24)
链DNA5:5’-TACTTCGTTATTCTTGTCTCTAT-3(SEQ ID NO:25)
链DNA6:与链DNA5杂交的链DNA4(SEQ ID NO:24和25)
2.2结果
已经设计了可评价DNA处理蛋白在外加电位下抓住DNA的能力的实验。在该实验中,DNA-酶复合体被拉入到纳米孔中,产生特征性的电流水平。当所述DNA-酶复合体解离时,所述DNA被拉入到纳米孔中的更深位臵,产生第二个电流水平。然后所述DNA完全移位通过所述纳米孔,导致了开放的孔并使系统复位到其最初状态。可以通过在该过程的多次重复期间检查所述酶结合状态的持续时间来评估所述DNA-酶结合的动力学(图3)。
最近的工作中,已经使用聚合酶来控制DNA链的移位。为了进行这样的实验,理想的DNA浓度为100-1000nM以被所述纳米孔捕获。当所述酶与DNA结合时,所述酶浓度优选地与所述DNA具有类似的摩尔浓度,或相对于所述DNA来说为过量的。通常使用两倍于所述DNA浓度的酶浓度以确保大部分(优选全部)的DNA形成酶-DNA复合体。这对所需材料的数量提出了高的要求。因此需要有使用较少DNA因而使用较少酶的系统。
一种达到此目的的方法是将DNA束缚到脂质膜上。如所呈现的那样,通过增强DNA和膜之间的相互作用可以极大地增加DNA插入的比例。这可以产生与DNA在溶液中游离时相当的比例,但是使用1/1000至1/10,000的材料。通过使用较低浓度的DNA,可以极大地降低所使用的酶的浓度(见图4)。
适合的DNA处理蛋白为Klenow片段(KF)(N.A.Wilson,R.Abu-Schmays,B.Gyarfas,H.Wang,K.R.Lieberman,M.Akeson andW.B.Dunbar(2009).Electronic Control of DNA Polymerase Bindingand Unbinding to Single DNA Molecules.ACS Nano3,995-1003)。所述Klenow片段为枯草杆菌蛋白酶对来自大肠杆菌的DNA聚合酶I进行酶切割时产生的大的蛋白质片段。其保留了5'-3'聚合酶活性和用于除去预编码核苷酸和进行校对读码的3’→5’外切核酸酶活性,但丧失了其5'→3'外切核酸酶活性。还可以通过基因工程除去所述KF保留的3’→5’外切核酸酶活性。该DNA处理蛋白通常在单链和双链DNA的交界处(引物/模板接合处)结合DNA并可以通过添加核苷酸来催化所述DNA链的复制。已经研究了Klenow片段用于链测序方法,但是发现当通过施加电位将其拉到纳米孔的顶部时其具有1-100ms的结合时间。
本发明人以如上所示的膜束缚的分析物设置中筛选了KF(图4)。当DNA在溶液中时,KF-DNA复合体的结合时间为1-100ms(图5和6)(与公开的结果(参考Wilson/Akeson2009)类似)。这个时间太短而不能用于链测序方法,因为100ms的持续时间仅能够读取几个核苷酸。但是,当所述DNA被束缚到脂质膜时,结合时间增加至0.1-10s(图7和8)。
2.3结论
所述酶-DNA复合体在孔顶部的持续时间是外加场对带电荷的DNA链施加的力的函数。所述蛋白抵抗这种力的能力决定了所述复合体在所述孔顶部保持完整的时间长度。所述束缚的DNA有较长的停留时间可能是因为当其跨越所述脂质膜扩散时移动的脂质分子对所述孔中的链施加了额外的力。这种力与由外加场所施加的力相抵消,所述KF受到的净力降低。这种设置可受益于较高场所赋予的优势(例如更高的信噪比,更快的DNA捕获),但是仍能够使DNA处理蛋白在所述孔的顶部有长的结合时间。
所述束缚方法提供了另外的控制纳米孔顶部酶行为的方式。有许多可能方法来探索这个概念。通过改变所述膜的组成或改变物理参数例如温度,将可以改变被束缚的分子在脂双层中的扩散速率,从而改变在所述纳米孔处DNA-酶复合体经受的力。在外切核酸酶测序的实施方案中,增加膜流动性可以增加多核苷酸对外切核酸酶的可及性。膜流动性可以通过加入试剂例如胆固醇来改变。另外,可以改变束缚试剂的性质来控制被束缚分析物的扩散速率以产生类似效果。与束缚到小分子例如脂质上相比,束缚到大的物质例如蛋白质上很可能产生更慢的扩散速率。已经表明,当酶与多核苷酸形成复合体并被拉进所述纳米孔时其速率会受到跨越所述纳米孔的外加场影响。来自分析物束缚的扩散力可能会减少所述孔上的酶经受的净力。本发明人预期能够通过结合来自外加电位的力与来自分析物束缚的扩散力来控制聚合物移动的速率。这种效应的另一种潜在用途是控制所述链通过所述孔的速度而不使用DNA处理蛋白。所述由外加电位施加的力可以与所述膜的扩散力相匹配。
3.实施例3–更多链测序
在最近工作中,Phi29DNA聚合酶已经被用于控制DNA链移位通过α-溶血素(Akeson et al.,2010,J Am Chem Soc.2010Dec22;132(50):17961-72.)。已经报道了使用Phi29作为分子马达控制DNA链移动通过纳米孔的两种模式,这两种方法都依赖于其对5’悬垂的双链体上双链/单链DNA接合处的作用。通过从与目的链反向杂交的引物链开始进行聚合,或通过其中引物链被连续地从目的链上去杂交以露出越来越多之前为双链体DNA的靶序列的解链方法,可以发生移动。
3.1材料和方法
如对于单链DNA所呈现的那样,可改变所述束缚部分以产生展现出与所述双层的暂时相互作用或持续时间更长的束缚(例如分别用胆固醇或生物素:链霉亲和素)的链。对于dsDNA分析物,可以认为展现出暂时性结合行为的双链体DNA分析物可能更适合于链测序,以使得所述酶能够使所述分析物完全解链并清理所述纳米孔为下一个做好准备。
设计了在靶链(ONLA1346)的3’端含有胆固醇基团且在5’端具有含有单个A的polyC延长部分的互补寡核苷酸(ONLA1346和ONLA1347,分别为65nt和31nt)。当杂交时,这些寡核苷酸形成了有34nt5’悬突的31bp的双链体,使得所述靶链可以首先从5’穿入所述纳米孔并被其捕获。然后通过所述纳米孔的读取器头观察所述单个A在polyC背景中的移动,可以追踪解链。为了与未束缚的分析物进行比较,设计了序列与所述靶链相同但是没有胆固醇基团的链(ONLA1049)。
使用突变体MspA-NNNRRK孔(ONLP2726)与phi29DNA聚合酶进行单通道记录。获得单通道,并且用10ml新鲜缓冲液(400mMKCl、10mM HEPES pH8.0)充满顺侧缓冲区以使单通道插入的几率最小。在5分钟后,加入对照部分DNA,对于束缚和未束缚的实验,分别至0.5nM或100nM。在加入DNA后观察到许多短持续时间的事件(约10ms),所述事件被认为是双链体DNA被所述纳米孔捕获以及所述引物被所述孔的力从所述模板上剥离。在5分钟后,再次将Phi29 DNA聚合酶加入到顺侧区室,对于束缚和未束缚的实验,分别得到10nM或200nM。
使用的寡核苷酸:
ONLA1346
CCCCCCCCCCCCCCCACCCCCCCCCCCCCCCCCCCTATTCTGTTTATCTTTCTTGTTTGTTAGCC-Chol(SEQ ID NO:26)
ONLA1347GGCTAACAAACAAGAAACATAAACAGAATAG(SEQ ID NO:27)
ONLA1049
CCCCCCCCCCCCCCCACCCCCCCCCCCCCCCCCCCTATTCTGTTTATGTTTCTTGTTTGTTAGCC(SEQ ID NO:28)
PolyT-50mer_XXXX_正义链
TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTXXXXGGTTGTTTCTGTTGGTGCTGATATTGC(SEQ ID NO:29)
PhiX 235bp反义链Chol-GTTAGACCAAACCATGAAACCAACATA(SEQ IDNO: 30)
PhiX400bp反义链Chol-GACCGCCTCCAAACAATTTAGACA(SEQID NO: 31)
PhiX822bp反义链Chol-GGCAATCTCTTTCTCATTGTCCAG(SEQID NO: 32)
3.2结果
在加入Phi29DNA聚合酶后,在两个实验中都观察到许多被认为是DNA:蛋白质复合体的捕获的长持续时间事件。这些事件在状态间振荡之前显示出在恒定水平的短停留时间,这被认为发生起始解链以及所述A开始移动通过所述孔的读取器头。对于束缚的(图9)和未束缚的(图10)实验,这种情况的实例示出在图12和11中。
对束缚的DNA事件和溶液DNA事件的所有解链事件进行的分析均示出了许多观察到的状态的大概组成模式、每种状态的均值与停留时间以及每种状态的均值与标准差(图11为未束缚的,图12为束缚的)。
胆固醇的位臵没有被设臵为在所述靶链的3’端,而是可以改变成在模板链或引物链的5’锻或在发夹结构内。由于需要使所述酶位于所述引物链的3’端,认为单链和双链DNA的接合处并不是进行束缚的适合位点,但是这尚未经实验证明。
虽然所述束缚方法对于合成的链来说效果挺好(其中可以在化学合成所述寡核苷酸的过程中纳入连接化学作用),但是将其应用于源于基因组DNA的样品会更加困难。扩增部分基因组DNA的常见技术是使用聚合酶链式反应。其中,使用两条合成的寡核苷酸引物,可以产生DNA的同一部分的许多拷贝,其中对于每个拷贝,双链体中每条链的5’均是合成的寡核苷酸。通过使用具有5’胆固醇基团的反义引物,所扩增的靶DNA的每个拷贝会含有用于束缚的胆固醇基团。通过PCR产生的分析物的唯一问题是,其是平端的或含有单个3’-A悬突,这两种分析物都不适合穿入到纳米孔中用于链测序。将单链DNA的部分添加到双链体DNA的5’是不容易进行的。可以进行化学或酶的连接,但是它们都不够高效并且还需要另外的下游反应和纯化步骤。本发明人开发的PCR方法中使用的正义引物,其像通常那样含有与基因组DNA靶区域的起始处互补的部分,但是额外地延续有50polyT部分。为了防止聚合酶延伸与所述polyT部分相对的互补链而产生平端的PCR产物(如通常那样),在所述polyT部分和互补引物部分之间添加四个脱碱基位点。这些脱碱基位点会阻止聚合酶延伸越过该区域,因此所述polyT部分在每个扩增的拷贝上将保持为5’单链的DNA(图13和14)。
虽然该PCR方法是连接5’前导序列polyT部分的有效方式,但是可以使用其他的纳入所述连接化学作用的方法,例如使用末端转移酶添加到3’端或通过T4多核苷酸激酶和ATPγS将反应性巯基添加到5’端用于化学偶联。但是,该方法使得能够产生适合于链测序的形式的束缚的分析物,其中唯一的对大小的限制,以及由此造成的读取长度限制是由PCR导致的(约20kb)。
如上所述进行单通道记录,但是使用这些基因组DNA扩增的片段以观察任何解链事件(图15和16)。观察到向前进行然后主动结束的若干解链事件,因此表明了双链体DNA的完全解链。
为了观察到从溶液中捕获用于链测序的DNA:蛋白质复合体的可接受的事件速率,就需要100nM DNA和200nM Phi29DNA聚合酶。假定使用上述的1ml的腔室体积,对于800bp片段,这等价于每次实验约50ug的dsDNA。使用束缚的dsDNA分析物时,使用0.1nM DNA和10nM phi29DNA聚合酶可以满足并超过相同的可接受事件速率。假定使用上述的1ml腔室体积,对于800bp片段,这等价于每次实验约50ng的dsDNA。
4.实施例4–固态测序
以上证明的束缚到脂质膜上的优势还可以扩展至固态纳米孔实验。可以在固态材料中产生纳米孔并以与生物纳米孔相似的方式使用。它们的使用和制造已被很好地记载于别处(WO00/79257;WO00/78668;Dekker C,Nat Nanotechnol.2007Apr;2(4):209-15;和Schloss JA,et al.,Nat Biotechnol.2008Oct;26(10):1146-53)。
固态材料(例如氮化硅)中的纳米孔作为孔来说比生物通道有优势。固态材料远比脂质膜结实。与经常原位形成的生物膜不同,固态材料中的纳米孔可以在工厂中形成并具有长的保存期。最近有关固态纳米孔的进展还使得能够使用具有独特性质的非常薄的材料例如石墨烯(Golovchenko J,et al.,Nature.2010Sep9;467(7312):190-3;Drndi
M,et al.,Nano Lett.2010Aug11;10(8):2915-21;和Dekker C,et al.,NanoLett.2010Aug11;10(8):3163-7)。还提出了石墨烯中的纳米间隙(Postma,2008,Rapid Sequencing of Individual DNA Molecules inGraphene Nanogaps)。
固态膜的另一个实施方案是使用嵌入到所述纳米孔中的两个或多个电极之间的隧道电流。当分析物通过所述孔时(由跨膜电位驱动),所述分析物促进电极之间的隧道电流。该电流可用于检测所述分析物的种类(Schloss,上文;US7,253,434和WO2008/092760)。
一种纳米孔的替代方法是使用固态材料中的纳米间隙作为传感器(Chen et al.,Materials Today,2010,13(11):28-41)。
固态纳米孔实验可受益于上述的脂质膜的优势。所述两种膜类型的关键差异是,两亲膜通常是可自然地移动的,本质上充当脂质扩散速率约10-8cm s-1的二维流体,而在材料例如氮化硅中的膜是固态的。虽然将分析物以固定方式束缚到表面上可以是有优势的,但是需要使所述分析物能够跨越膜移动,使得多个分析物分子可以与所述检测器相互作用。
可以使用许多方案将分析物束缚到固态膜上(图17)。第一种方法是依靠所述分析物与未修饰的膜例如Si3N4的天然相互作用。但是这几乎不能控制所述分析物在所述表面上的扩散速率。因此优选修饰所述表面、所述分析物或所述表面和所述分析物以提供需要的相互作用。
对固态材料进行化学修饰的方法在本领域中公知。固态纳米孔也已被化学修饰,通过在溶液中自组装或通过在外加电位下驱动反应性物质通过所述纳米孔(WO2009/020682)。
前两种方案使用化学修饰的膜以产生其中所述分析物可以暂时地与所述层相互作用的表面(图17A、B)。
在第一种方案中,所述分析物的束缚基团自身嵌入到修饰的层中(图17A)。长链烷可被连接到所述表面并且会使用束缚基团例如胆固醇或烷。可以通过使用氯代-十六烷基-二甲基硅烷(或类似物)以及记载于WO2009/020682中的方法实现所述表面修饰。
在第二种方案中,所述束缚分析物没有嵌入到所述层中,而是驻留在所述表面上。这可以如同在第一种方案中一样使用疏水性实现。另外,还可以设想类似的方法,其中所述分析物与所述表面的结合是通过静电、氢键合或范德华力相互作用介导的。
第三种方案与使用蛋白纳米孔的膜最相似。在该实施方案中,所述固态膜被修饰以支持脂单层(图17C)。该方法具有上述的脂质膜束缚的实施例所指出的所有益处。束缚可以通过使用胆固醇锚或者通过脂质头基或膜中受体进行的连接来实现。在固体表面形成双层或单层的方法在本领域中熟知(Duran RS,et al.,Langmuir.2007Mar13;23(6):2924-7;和Cremer PS,et al.,Surface Science Reports.2006;61:429-444)。当使所述表面为疏水性时,溶液中的脂质小泡可以自发形成脂单层。可以以许多方式使所述表面为疏水性,包括等离子处理(例如CH4)或化学方法,例如氯硅烷化学作用(WO2009/020682)和金-巯基偶联(Duran,上文;和Cremer,上文)。
将分析物束缚到膜上的第四种方案是使用固态膜作为脂双层的支持物(图17D)。在该实施方案中,所述检测器元件是固态膜中的纳米孔。该方法具有上述的脂质膜束缚的实施例所指出的所有益处。如果使所述表面为亲水性,那么脂双层会在所述表面上自组装——这是在玻璃表面上形成双层时常见的效应(Cremer,上文)。对于所有上述实施例,所述固态纳米孔可以与多核苷酸结合蛋白组合形成检测器。
实施例5
该实施例描述了,当暴露于嵌入到三嵌段共聚物中的MspA纳米孔时,没有观察到未束缚的DNA如何以受解旋酶控制的方式进行DNA移动。所述芯片有128个带铂电极的孔和具有连接到帽子的铂常用电极的30μm的开口。
用溶于油中的50mg/ml三嵌段共聚物(TBCP6-33-6、OH-PMOXA-(PEG接头)-PDMS-(PEG接头)-PMOXA-OH,聚合物来源产品ID:P3691B-MOXZDMSMOXZ)的溶液混合物形成了单层。然后将纳米孔(MS-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)8)加入到所述缓冲液中的芯片上。一旦所述芯片形成,仅跨越所述芯片的顶部(顺侧)加入试剂。
用625mM氯化钠、25mM铁氰化钾、75mM亚铁氰化钾、100mM HEPES,pH8.0(缓冲液1)进行实验。使用的MspA突变体为MS-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)8。在该实验中使用的DNA序列为双链的400mer链(SEQ ID NO:39示出了正义链的序列)。
SEQ ID NO:39–
TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTGGTTGTTTCTGTTGGTGCTGATATTGCGCTCCACTAAAGGGCCGATTGACCCGGTGGTACCTTGGTTGTTTCTGTTGGTGCTGATATTGCTTTTGATGCCGACCCTAAATTTTTGCCTGTTTGGTTCGCTTTGAGTCTTCTTCGGTTCCGACTACCCTCCCGACTGCCTATGATGTTTATCCTTTGGATGGTCGCCATGATGGTGGTTATTATACCGTCAAGGACTGTGTGACTATTGACGTCCTTCCCCGTACGCCGGGCAATAATGTTTATGTTGGTTTCATGGTTTGGTCTAACTTTACCGCTACTAAATGCCGCGGATTGGTTTCGCTGAATCAGGTTATTAAAGAGATTATTTGTCTCCAGCCACTTAAGTGAGGTGATTTATGTTTGGTGCTATTGCTGGCGGTATTGCTTCTGCTCTTGCTGGTGGCGCCATGTCTAAATTCTTTGGAGGCGGTCGAGCT
用溶于油中的50mg/ml三嵌段共聚物(TBCP6-33-6、OH-PMOXA-(PEG接头)-PDMS-(PEG接头)-PMOXA-OH,聚合物来源产品ID:P3691B-MOXZDMSMOXZ)和预先插入到所述芯片上的纳米孔(MS-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)8)形成了单层。然后将所述芯片插入到叶片(blade)中,用移液管手动除去所述溶液并再插入。然后将1.5nM DNA(正义链序列为SEQ ID NO:39)、500nM解旋酶、10mM MgCl2和1mM ATP加入到150ul的缓冲液1中。然后将所述溶液通过所述帽子中的通道吸取到跨越所述芯片的位臵并让其扩散到所述纳米孔。在+120mV下记录数据1小时(其中每5分钟有到0mV,然后是-50mV的电位翻转),以获得所述纳米孔中的解旋酶事件。
没有检测到未束缚的DNA(正义链序列为SEQ ID NO:39)以受解旋酶控制方式DNA移动通过插入到三嵌段共聚物(TBCP6-33-6、OH-PMOXA-(PEG接头)-PDMS-(PEG接头)-PMOXA-OH,聚合物来源产品ID:P3691B-MOXZDMSMOXZ)中的MS-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)8纳米孔。观察到所述孔在测试条件下被阻断,但没有观察到受解旋酶控制的DNA移动。
实施例6
该实施例描述了,当暴露于嵌入到三嵌段共聚物中的MspA纳米孔时,观察到了束缚的DNA如何以受解旋酶控制的方式进行的DNA移动。所述芯片有128个带铂电极的孔和带有连接到所述帽子的铂常用电极的30μm的开口。
用溶于油中的50mg/ml三嵌段共聚物(TBCP6-33-6、OH-PMOXA-(PEG接头)-PDMS-(PEG接头)-PMOXA-OH、聚合物来源产品ID:P3691B-MOXZDMSMOXZ)的溶液混合物形成了单层。然后将纳米孔(MS-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)8)加入到所述缓冲液中的芯片上。一旦所述芯片形成,仅跨越所述芯片的顶部(顺侧)加入试剂。
用625mM氯化钠、25mM铁氰化钾、75mM亚铁氰化钾、100mM HEPES,pH8.0(缓冲液1)进行实验。使用的MspA突变体为MS-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)8。在该实验中使用的DNA序列由双链的400mer DNA(SEQ ID NO:40示出了正义链序列)和可与SEQ ID NO:40的一部分杂交且在3’末端连接有胆固醇的短互补DNA链(SEQ ID NO:41)组成。
SEQ ID NO:40
TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTGGTTGTTTCTGTTGGTGCTGATATTGCGCTCCACTAAAGGGCCGATTGACGCTCCACTAAAGGGCCGATTGACCCGGTTGTTTCTGTTGGTGCTGATATTGCTTTTGATGCCGACCCTAAATTTTTTGCCTCTTTGGTTCGCTTTGAGTCTTCTTCGGTTCCGACTACCCTCCCGACTGCCTATGATGTTTATCCTTTGGATGGTCGCCATGATGGTGGTTATTATACCGTCAAGGACTGTGTGACTATTGACGTCCTTCCCCGTACGCCGGGCAATAATGTTTATGTTGGTTTCATGGTTTGGTCTAACTTTACCGCTACTAAATGCCGCGGATTGGTTTCGCTGAATCAGCTTATTAAAGAGATTATTTGTCTCCAGCCACTA4AGTGAGGTGATTTATGTTTGGTGCTATTGCTGGCGGTATTGCTTCTGCTCTTGCTGGTGGCGCCATGTCTAAATTGTTTGGAGGCGGTCGAGCT
SEQ ID NO:41
AGCGACTAACAAACACAATCTGATGGCTTTTTTTTTTTTTTTTTTTTTTTTTTTTTT/3CholTEG/
用溶于油中的50mg/ml三嵌段共聚物(TBCP6-33-6、OH-PMOXA-(PEG接头)-PDMS-(PEG接头)-PMOXA-OH,聚合物来源产品ID:P3691B-MOXZDMSMOXZ)和预先插入到所述芯片上的纳米孔形成了单层。然后将所述芯片插入到叶片中,用移液管来手动除去所述溶液并再插入。然后将1.5nM DNA(SEQ ID NO:40的正义链序列和短互补束缚链SEQ ID NO:41)、500nM解旋酶、10mM MgCl2和1mM ATP加入到150ul的缓冲液1中。然后将所述溶液通过所述帽子中的通道吸取到跨越所述芯片的位置并让其扩散到所述纳米孔。在+120mV下记录数据1小时(其中每5分钟有到0mV,然后是-50mV的电位翻转),以获得通过所述纳米孔的受解旋酶控制的DNA移动。
检测到了束缚的DNA(SEQ ID NO:40的正义链序列和短互补束缚链SEQ ID NO:41)以受解旋酶控制的方式移位通过插入到三嵌段共聚物(TBCP6-33-6、OH-PMOXA-(PEG接头)-PDMS-(PEG接头)-PMOXA-OH,聚合物来源产品ID:P3691B-MOXZDMSMOXZ)中的MS-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)8纳米孔。在1、5分钟正循环的过程中检测到了十二次受解旋酶控制的DNA移动。受解旋酶控制的DNA移动的中位数时间为0.5秒。因此,通过将DNA束缚到所述三嵌段共聚物,可以观察到在类似实验中使用未束缚的DNA时没有检测到(实施例5)的受解旋酶控制的DNA移动。