CN107636168A

CN107636168A - 方法

Info

Publication number: CN107636168A
Application number: CN201680022991.0A
Authority: CN
Inventors: 拉科马·贾亚辛格; 约翰·约瑟夫·基尔戈; 尼尔·罗杰·伍德
Original assignee: Oxford Nanopore Technologies PLC
Current assignee: Oxford Nanopore Technologies PLC
Priority date: 2015-02-19
Filing date: 2016-02-17
Publication date: 2018-01-26
Also published as: US11307192B2; US20180095066A1; EP3259351B1; WO2016132124A1; US20220283141A1; GB201502810D0; EP3259351A1

Abstract

本发明涉及一种制备异源寡聚孔的新方法。本发明还涉及使用该方法制备的异源寡聚孔和使用该异源寡聚孔进行的多核苷酸表征。

Description

方法

技术领域

本发明涉及一种制备异源寡聚孔的新方法。本发明还涉及使用该方法制备的异源寡聚孔和使用异源寡聚孔进行的多核苷酸表征。

背景技术

目前很多应用中都需要快速廉价的多核苷酸(例如DNA或RNA)测序和鉴定技术。现有技术缓慢且昂贵，这主要是因为它们依靠扩增技术来产生大量的多核苷酸，并且需要大量的专门的荧光化学物质用于信号检测。

跨膜孔(纳米孔)具有作为聚合物和各种小分子的直接电生物传感器的巨大潜力。特别是，最近的焦点是将纳米孔作为潜在的DNA测序技术。

当跨纳米孔施加电势时，当分析物(例如核苷酸)在桶状体中短暂驻留一段时间后，电流发生变化。核苷酸的纳米孔检测给出了已知标记和持续时间的电流变化。在链测序方法中，使单个多核苷酸链穿过孔，得到对核苷酸的鉴别。链测序可以包括使用多核苷酸结合蛋白来控制多核苷酸穿过孔的运动。

Msp的不同形式是来自耻垢分枝杆菌(Mycobacterium smegmatis)的孔蛋白。MspA为来自耻垢分枝杆菌的157kDa八聚体孔蛋白。野生型MspA不以允许DNA被表征或被测序的方式与DNA相互作用。MspA的结构以及其与DNA相互作用及表征DNA所需的修饰已有大量文献记载(Butler，2007，核酸的纳米孔分析，哲学博士论文，华盛顿大学；Gundlach，ProcNatl Acad Sci USA.2010年9月14；107(37)：16060-5.Epub 2010年8月26；以及国际申请No.PCT/GB2012/050301(公布号为WO/2012/107778)。负电荷，例如位置90、91和93处的电荷，通常被从孔中除去以使其成为中性。

发明内容

发明人出人意料地证明了，可通过差异表达两种不同的单体在单个细胞中制备包含特定化学计量比的两种不同单体的异源寡聚孔。

因此，本发明提供了一种制备包含特定化学计量比的两种不同单体的异源寡聚孔的方法，包括：(a)在第一可诱导载体中用第一不同单体转染或转化细胞；(b)在第二可诱导载体中用第二不同单体转染或转化细胞；和(c)诱导所述第一和第二可诱导载体，使得所述细胞以特定化学计量比产生包含所述第一和第二不同单体的异源寡聚孔。

本发明还提供了：

-一种使用本发明方法制备的异源寡聚孔；

-一种表征目标多核苷酸的方法，包括：

a)使多核苷酸与本发明的异源寡聚孔接触，使得所述多核苷酸移动通过所述孔；和

b)当多核苷酸相对于所述孔移动时获取一个或多个测量值，其中所述测量值指示所述多核苷酸的一个或多个特征，并从而表征目标多核苷酸；

-一种用于表征目标多核苷酸的试剂盒，包括(a)本发明的异源寡聚孔，和(b)膜的组分；

-一种用于表征样品中目标多核苷酸的设备，包括(a)本发明的多个异源寡聚孔，和(b)多个膜；

-一种表征目标多核苷酸的方法，包括：

a)使多核苷酸与本发明的异源寡聚孔、聚合酶和标记的核苷酸接触，使得通过聚合酶将磷酸盐标记的物质顺序添加到目标多核苷酸，其中磷酸盐物质含有对每个核苷酸特异性的标记；和

b)使用孔检测磷酸盐标记的物质，从而表征多核苷酸；

-一种形成用于表征目标多核苷酸的传感器的方法，包括形成本发明的异源寡聚孔与多核苷酸结合蛋白之间的复合物，并从而形成用于表征所述目标多核苷酸的传感器；和

-用于表征目标多核苷酸的传感器，包括本发明的异源寡聚孔和多核苷酸结合蛋白之间的复合物。

附图说明

图1显示了10％TGX凝胶，带有用考马斯染色而可视化的条带。泳道(Lane)1对应于蛋白质分子量标记。凝胶侧面的数字对应于kDa。泳道2对应于纯化的MspA2。泳道3对应于在85℃下加热后的MspA 2。泳道4对应于在50％DMSO中加热至100℃后的MspA 2。泳道5对应于纯化的MspA-((Del-L74/G75/D118/L119)D56N/E59R/L88N/D90N/D91N/Q126R/D134R/E139K)8＝MspA 6(均聚纳米孔作为参考)。泳道6对应于在50％DMSO中加热至100℃之后的MspA 6(在这些条件下，寡聚孔可以分解成其组成单体的亚单元)。条带A对应于包含8个单体单元的寡聚MspA同源/异源孔。条带B对应于含有附着的BasTL-H6的MspA 2的单体单元。条带C对应于不含有附着的BasTL-H6的MspA单体单元。

图2显示了7.5％Tris HCl凝胶，其对具有或不具有不同长度的BasTL标签的MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)(具有以下突变的SEQ IDNO：2：G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)的寡聚作用进行了比较。泳道A对应于没有附着于任何单体的标签的同源寡聚体MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)8。泳道B对应于MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K(单体和MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K/BasTL)单体的2∶1混合物。泳道C对应于同源寡聚体MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K/BasTL(减去20aa))8。泳道D对应于MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)单体和MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K/BasTL(减去20aa))单体的2∶1混合物。泳道E对应于同源寡聚体MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K/BasTL(减去40aa))8。泳道F对应于MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)单体和MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K/BasTL(减去40aa))单体的2∶1混合物。凝胶带旁边引述的比例对应于标记的单体：未标记的单体的比例。

图3显示了5％Tris HCl凝胶，其比较了将多种不同标签连接到C末端时MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)单体的寡聚作用。泳道A对应于没有附加到任何单体的标签的同源寡聚体MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)8。泳道B对应于在85℃热处理15分钟的同源寡聚体MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)8。泳道C对应于尝试对同源寡聚体MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K/D10H6)8(具有以下突变的SEQ ID NO：2：G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K，其中在C末端附着有D10H6标签)进行寡聚。泳道D对应于尝试对在85℃热处理15分钟的同源寡聚体MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K/D10H6)8(具有以下突变的SEQ ID NO：2：G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K，其中在C末端附着有D10H6标签)进行寡聚。泳道E对应于尝试对同源寡聚体MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K/R8)8(具有以下突变的SEQ ID NO：2：G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K，其中在C末端附着有R8标签)进行寡聚。泳道F对应于尝试对在85℃热处理15分钟的同源寡聚体MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K/R8)8(具有以下突变的SEQID NO：2：G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K，其中在C末端附着有R8标签)进行寡聚。泳道G对应于尝试对同源寡聚体MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K/R8H6)8(具有以下突变的SEQ ID NO：2：G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K，其中在C末端附着有R8H6标签)进行寡聚。泳道H对应于尝试对在85℃热处理15分钟的同源寡聚体MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K/R8H6)8(具有以下突变的SEQ ID NO：2：G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K，其中在C末端附着有R8H6标签)进行寡聚。白点表示在每个泳道形成的MspA同源寡聚体。

序列表的说明

SEQ ID NO：1示出了编码野生型MspA单体的密码子优化的多核苷酸序列。该突变体缺少信号序列。

SEQ ID NO：2示出了野生型MspA单体的成熟形式的氨基酸序列。该突变体缺少信号序列。

SEQ ID NO：3示出了编码α-溶血素-E111N/K147N(α-HL-NN；Stoddart等人，PNAS，2009；106(19)：7702-7707)的一个单体的多核苷酸序列。

SEQ ID NO：4示出了α-HL-NN的一个单体的氨基酸顺序。

SEQ ID NO：5至7示出了MspB、C和D的氨基酸序列。

SEQ ID NO：8示出了编码Phi29 DNA聚合酶的多核苷酸序列。

SEQ ID NO：9示出了Phi29 DNA聚合酶的氨基酸顺序。

SEQ ID NO：10示出了来自大肠杆菌的sbcB基因的密码子优化的多核苷酸序列。它编码来自大肠杆菌的核酸外切酶I(EcoExo I)。

SEQ ID NO：11示出了来自大肠杆菌的核酸外切酶I(EcoExo I)的氨基酸序列。

SEQ ID NO：12示出了来自大肠杆菌的xthA基因的密码子优化的多核苷酸序列。它编码来自大肠杆菌的核酸外切酶III。

SEQ ID NO：13示出了来自大肠杆菌的核酸外切酶III的氨基酸序列。该酶从双链DNA(dsDNA)的一条链以3′-5′方向进行5′单磷酸核苷的分布消化。链上的酶引发需要约4个核苷酸的5′突出端(overhang)。

SEQ ID NO：14示出了来自嗜热栖热菌(T.thermophilus)的recJ基因的密码子优化的多核苷酸序列。它编码来自嗜热栖热菌的RecJ酶(TthRecJ-cd)。

SEQ ID NO：15示出了来自嗜热栖热菌的RecJ酶(TthRecJ-cd)的氨基酸序列。该酶从ssDNA以5′-3′方向进行5′单磷酸核苷的进行性(processive)消化。链上的酶引发需要至少4个核苷酸。

SEQ ID NO：16示出了衍生自细菌噬菌体λexo(redX)基因的密码子优化的多核苷酸序列。它编码细菌噬菌体λ核酸外切酶。

SEQ ID NO：17示出了细菌噬菌体λ核酸外切酶的氨基酸序列。该序列是组装成三聚体的三个相同亚基之一。该酶从dsDNA的一条链以5′-3′方向进行核苷酸的高度进行性消化(http：//www.neb.com/nebecomm/products/productM0262.asp)。链上的酶引发优先需要约4个具有5′磷酸的核苷酸的5′突出端。

SEQ ID NO：18示出了Hel308 Mbu的氨基酸序列。

SEQ ID NO：19示出了Hel308 Csy的氨基酸序列。

SEQ ID NO：20示出了Hel308 Tga的氨基酸序列。

SEQ ID NO：21示出了Hel308 Mhu的氨基酸顺序。

SEQ ID NO：22示出了TraI Eco的氨基酸顺序。

SEQ ID NO：23示出了XPD Mbu的氨基酸顺序。

SEQ ID NO：24示出了Dda 1993的氨基酸顺序。

SEQ ID NO：25示出了Trwc Cba的氨基酸顺序。

SEQ ID NO：26示出了BasTL的氨基酸顺序。该序列附着在MspA单体的C末端。

SEQ ID NO：27示出了编码实施例1和2中使用的序列的多核苷酸。

SEQ ID NO：28示出了编码实施例1和2中使用的序列的多核苷酸。

SEQ ID NO：29示出了编码实施例3中使用的多核苷酸。

SEQ ID NO：30示出了编码实施例3中使用的多核苷酸。

SEQ ID NO：31示出了胞溶素(lysenin)单体的氨基酸顺序。

SEQ ID NO：32示出了来自大肠杆菌菌株K-12的亚株MC4100的野生型CsgG单体的成熟形式的氨基酸序列。该单体缺少信号序列。对该CsgG使用的缩写为CsgG＝CsgG-Eco。

具体实施方式

应该理解的是，所公开的产品和方法的不同应用可以根据本领域的特定需要进行调节。还应理解，本文使用的术语仅用于描述本发明的具体实施方案，并且不意在限制。

此外，除非内容另有明确规定，否则用于本说明书和所附权利要求书中的单数形式“一”，“一个”，和“所述”包括复数指代。因此，例如，涉及“多核苷酸”时包括两个或更多个多核苷酸，涉及“多核苷酸结合蛋白”时包括两个或更多个该蛋白，涉及“解旋酶”时包括两个或更多个解旋酶，涉及“单体”时包括两个或更多个单体，涉及“孔”时包括两个或更多个孔，等等。

文本无论在上文还是下文中引用的所有出版物、专利和专利申请，以全文引用的方式纳入本文。

本发明的方法

异源寡聚孔

本发明提供一种制备异源寡聚孔的方法。所述异源寡聚孔含有足够的单体以形成孔。所述单体可以是任何类型。所述孔通常包含至少3个，至少4个，至少5个，至少6个，至少7个，至少8个，至少9个，至少10个单体，至少11个单体，至少12个单体，至少13个单体或至少14个单体，例如3，4，5，6，7，8，9，10，11，12，13或14个单体。所述孔优选包括七个，八个或九个单体。

所述孔是异源寡聚孔，因为它包含两种不同的单体。所述孔可以是异源寡聚孔，因为它包含至少两种不同的单体。所述两种单体可以任何方式不同。基于其氨基酸序列，第二不同单体通常不同于第一不同单体。基于1，2，3，4，5，10，15，20，30，40或更多个氨基酸差异，第二不同单体可与第一不同单体不同。可以用如下所述的标签来修饰第二不同单体。

异源寡聚孔通常衍生自或基于跨膜蛋白孔。异源寡聚孔通常是跨膜蛋白孔的变体。异源寡聚孔通常是跨膜蛋白孔的变体，其中孔中的一个或多个单体已被修饰，使得其不同于其他单体。异源寡聚孔通常包含来自跨膜蛋白孔的单体，例如MspA，MspB，MspC或MspD，其中孔中的一个或多个单体已经被修饰，使得其不同于其他单体。

异源寡聚孔通常不包含两个各自来自两个不同跨膜蛋白孔的不同单体。特别是，异源寡聚孔通常不包含来自MspA的第一单体和来自α-溶血素的第二单体。异源寡聚孔可以包括两个各自来自两个不同Msp孔的不同单体，例如MspA，MspB，MspC和MspD中的两个。

异源寡聚孔可以衍生自或基于任何跨膜蛋白孔。跨膜孔是在一定程度上穿过膜的结构。它允许由施加电位驱动的水合离子流过膜或在膜内流动。跨膜孔通常穿过整个膜，使得水合离子可以从膜的一侧流动到膜的另一侧。然而，跨膜孔不一定要穿过膜。它可以是一端封闭的。例如，孔可以是膜中的可使水合离子沿其流动或流入其中的阱、间隙、通道、沟槽或狭缝。

任何跨膜蛋白孔可用于本发明。跨膜蛋白孔通常是多肽的集合，即寡聚体，其围绕中心轴排列以形成通道。该通道允许水合离子、核苷酸或多核苷酸从膜的一侧流到膜的另一侧。在本发明中，跨膜蛋白孔能够形成允许由施加电位驱动的水合离子从膜的一侧流到另一侧的孔。跨膜蛋白孔优选允许诸如核苷酸或多核苷酸的分析物从膜例如三嵌段共聚物膜的一侧流到另一侧。跨膜蛋白孔通常允许多核苷酸如DNA或RNA移动通过孔。

跨膜蛋白孔是寡聚体。跨膜蛋白孔优选由几个重复的亚基组成，例如至少3个，至少4个，至少5个，至少6个，至少7个，至少8个，至少9个，至少10个，至少11个单体，至少12个单体，至少13个单体或至少14个单体，如3，4，5，6，7，8，9，10，11，12，13或14个单体。孔优选为三聚体、四聚体、五聚体、六聚体、七聚体、八聚体或九聚体的孔。天然存在的跨膜蛋白孔可以是同源寡聚体或异源寡聚体。

跨膜蛋白孔通常包含离子可以流过的桶状体或通道。孔的亚基通常围绕中心轴并且向跨膜β桶状体或通道或者跨膜α-螺旋束或通道贡献链。

跨膜蛋白孔的桶状体或通道通常包含能促进与分析物，例如核苷酸，多核苷酸或核酸相互作用的氨基酸。这些氨基酸优选位于桶状体或通道的收缩口(constriction)附近。跨膜蛋白孔通常包含一个或多个带正电荷的氨基酸，例如精氨酸、赖氨酸或组氨酸，或芳族氨基酸，例如酪氨酸或色氨酸。这些氨基酸通常能促进孔和核苷酸、多核苷酸或核酸之间的相互作用。

本发明使用的跨膜蛋白孔可以衍生自β-桶状体孔或α-螺旋束孔。β-桶状体孔包括由β链形成的桶状体或通道。合适的β-桶状体孔包括但不限于形成毒素的β-孔，例如α-溶血素、炭疽毒素、NetB、CytK和杀白细胞素以及细菌的外膜蛋白/孔蛋白，例如耻垢分枝杆菌孔蛋白(Msp)，例如MspA，MspB，MspC或MspD，来自皮疽诺卡菌(Nocardia farcinica)的NfpAB孔，外膜孔蛋白F(OmpF)，外膜孔蛋白G(OmpG)，外膜磷脂酶A和奈瑟氏菌属(Neisseria)自体转运脂蛋白(NalP)，以及其他孔，如胞溶素，CsgG和FRAC。α-螺旋束孔包括由α-螺旋形成的桶状体或通道。合适的α-螺旋束孔包括但不限于内膜蛋白和α外膜蛋白，例如WZA和ClyA毒素。跨膜孔可以衍生自胞溶素。国际申请号PCT/GB2013/050667(公布号为WO 2013/153359)中公开了合适的衍生自胞质素的孔。跨膜孔可以衍生自CsgG。衍生自CsgG的合适的孔在国际申请号PCT/EP2015/069965中公开。跨膜孔可以衍生自Msp，例如MspA，或衍生自α-溶血素(α-HL)。

异源寡聚孔可以衍生自或基于MspA或其变体，即衍生自七个或更多个单体的跨膜孔，所述单体包含SEQ ID NO：2所示序列或其变体。异源寡聚孔更优选衍生自包含8或9个单体的孔，所述单体包含SEQ ID NO：2所示序列或其变体。第一不同单体优选包含SEQ ID NO：2所示序列或其变体。第二不同单体优选包含SEQ ID NO：2所示序列或其变体。最优选地，第一和第二不同单体包含SEQ ID NO：2所示序列的不同变体。下文更详细地论述SEQ ID NO：2及其变体。

异源寡聚孔也可以衍生自或基于α-溶血素(α-HL)。野生型α-HL孔由七个相同的单体或亚基组成(即，其是七聚体)。α-溶血素-NN的一个单体或亚基的序列示于SEQ ID NO：4中。异源寡聚孔可以衍生自包含七个单体的跨膜蛋白孔，每个所述单体包含SEQ ID NO：4所示序列或其变体。根据本发明制备的异源寡聚孔可以包含两种不同的单体，每个单体包含SEQ ID NO：4所示序列或其变体。第一不同单体优选包含SEQ ID NO：4所示序列或其变体。第二不同单体优选包含SEQ ID NO：4所示的序列或其变体。最优选地，第一和第二不同单体包含SEQ ID NO：4所示序列的不同变体。

SEQ ID NO：4的氨基酸1，7至21，31至34，45至51，63至66，72，92至97，104至111，124至136，149至153，160至164，173至206，210至213，217，218，223至228，236至242，262至265，272至274，287至290和294形成环区域。SEQ ID NO：4的残基113和147构成α-HL的桶状体或通道内的收缩口的一部分。

SEQ ID NO：4的变体是具有下述氨基酸序列的蛋白质：从SEQ ID NO：4的氨基酸序列变化而来并保持其成孔能力。可以使用本领域已知的任何方法测定变体形成孔的能力。例如，可以将该变体与其他合适的亚基一起插入两亲层，例如三嵌段共聚物膜，并且可以确定其寡聚形成孔的能力。将亚基插入两亲层如三嵌段共聚物膜的方法是本领域已知的。

所述变体可以包括用以促进共价连接的修饰。所述变体优选包含一个或多个促进连接到例如其他单体的反应性半胱氨酸残基。例如，所述变体可以包括在SEQ ID NO：4的8，9，17，18，19，44，45，50，51，237，239和287位和/或氨基或羧基末端的一个或多个位置的半胱氨酸。优选的变体包括将SEQ ID NO：4的8，9，17，237，239和287位的残基用半胱氨酸(A8C，T9C，N17C，K237C，S239C或E287C)取代。所述变体优选是国际申请号PCT/GB09/001690(公布号为WO 2010/004273)、PCT/GB09/001679(公布号为WO 2010/004265)或PCT/GB10/000133(公布号为WO 2010/086603)中所述的任意一个变体。

所述变体还可以包括用以促进与核苷酸的任何相互作用的修饰。

所述变体可以是天然存在的变体，其由生物体例如葡萄球菌属(Staphylococcus)细菌天然表达。或者，所述变体可以由细菌如大肠杆菌体外表达或重组表达。变体还包括通过重组技术产生的非天然存在的变体。在SEQ ID NO：4的氨基酸序列的整个长度上，基于氨基酸相似性或同一性，变体将优选与该序列至少50％同源。更优选地，基于氨基酸相似性或同一性，变体多肽可以与SEQ ID NO：4的氨基酸序列在整个序列上至少55％，至少60％，至少65％，至少70％，至少75％，至少80％，至少85％，至少90％并且更优选至少95％，97％或99％同源。在200个或更多个例如230，250，270或280或更多个连续氨基酸的延伸段上，可以具有至少80％，例如至少85％，90％或95％的氨基酸相似性或同一性(“严格同源性(hardhomology)”)。同源性可以如下所述确定。

异源寡聚孔也可以衍生自或基于胞溶素。野生型α-HL孔由至少7个，至少8个，至少9个或至少10个，优选9个相同的单体或亚基形成(即，其是七聚体)。胞溶素的一个单体或亚单的序列示于SEQ ID NO：31中。异源寡聚孔可以衍生自包含至少7个，至少8个，至少9个或至少1个，优选9个单体的跨膜蛋白孔，所述每个单体包含SEQ ID NO：31所示序列或其变体。根据本发明产生的异源寡聚孔可以包含两种不同的单体，每个单体包含SEQ ID NO：31所示序列或其变体。第一不同单体优选包含SEQ ID NO：31所示序列或其变体。第二不同单体优选包含SEQ ID NO：31所示序列或其变体。最优选地，第一和第二不同单体包含SEQ ID NO：31所示序列的不同变体。

所述变体优选包含来自SEQ ID NO：2的约位置44至约位置126的一个或多个修饰，其改变单体与多核苷酸相互作用的能力。这类修饰在国际申请号PCT/GB2013/050667(公布号为WO2013153359)中公开。

单体与多核苷酸相互作用的能力可以使用本领域公知的方法确定。单体可以以任何方式与多核苷酸相互作用，例如，通过非共价相互作用，如疏水相互作用，氢键，范德华力，pi(π)-阳离子相互作用或静电力。例如，该区域结合多核苷酸的能力可以使用常规结合试验测定。合适的试验包括但不限于基于荧光的结合试验、核磁共振(NMR)、等温滴定量热法(ITC)或电子自旋共振(ESR)光谱。或者，包含一个或多个突变体单体的孔与多核苷酸相互作用的能力可以使用上述或下文论述的任何方法来确定。

一个或多个修饰在SEQ ID NO：2的约位置44至约位置126的区域内。一个或多个修饰优选在以下任何一个区域内：从大约位置40到大约位置125，从大约位置50到大约位置120，从大约位置60到大约位置110以及大约位置70到大约位置100。如果进行一个或多个修饰以改善对多核苷酸的捕获，则这些修饰更优选在以下任意一个区域内进行：从大约位置44到大约位置103，从大约位置68到大约位置103，从大约位置84到大约位置103，从大约位置44到大约位置97，从大约位置68到大约位置97，或从大约位置84到大约位置97。如果进行一个或多个修饰以改善对多核苷酸的识别或鉴别，则这些修饰更优选在以下任何一个区域内进行：从大约位置44至大约位置109，从大约位置44至大约位置97或大约位置48至大约位置88。所述区域优选从SEQ ID NO：2的大约位置44至大约位置67。

如果所述一个或多个修饰旨在改善对多核苷酸的识别或鉴别，则优选除了改进多核苷酸捕获的一个或多个修饰之外进行所述修饰。这允许由突变体单体形成的孔有效捕获多核苷酸，然后表征多核苷酸，如估计其序列，如下所述。

对蛋白质纳米孔进行的改变其与多核苷酸相互作用的能力的修饰，特别是提高其捕获和/或识别或鉴别多核苷酸的能力的修饰，在本领域中有大量记载。例如，这样的修饰在WO 2010/034018和WO 2010/055307中公开。根据本发明可以对胞溶素单体进行类似修饰。国际申请号PCT/GB2013/050667(公布号为WO2013153359)公开了优选的修饰。

可以进行任何数量的修饰，例如1，2，5，10，15，20，30或更多个修饰。可以进行任何修饰，只要单体与多核苷酸相互作用的能力发生变化即可。合适的修饰包括但不限于氨基酸取代，氨基酸添加和氨基酸缺失。所述一个或多个修饰优选为一个或多个取代。这将在下面更详细地论述。

所述一个或多个修饰优选(a)改变单体的空间效应，或优选改变区域的空间效应，(b)改变单体的净电荷，或优选改变区域的净电荷，(c)改变单体或优选地区域与多核苷酸氢键键合的能力，(d)引入或除去通过离域电子pi系统进行相互作用的化学基团，和/或(e)改变结构的单体，或者优选地改变区域的结构。所述一个或多个修饰更优选地得到(a)至(e)的任何组合，例如(a)和(b)；(a)和(c)；(a)和(d)；(a)和(e)；(b)和(c)；(b)和(d)；(b)和(e)；(c)和(d)；(c)和(e)；(d)和(e)，(a)，(b)和(c)；(a)，(b)和(d)；(a)，(b)和(e)；(a)，(c)和(d)；(a)，(c)和(e)；(a)，(d)和(e)；(b)，(c)和(d)；(b)，(c)和(e)；(b)，(d)和(e)；(c)，(d)和(e)；(a)，(b)，(c)和d)；(a)，(b)，(c)和(e)；(a)，(b)，(d)和(e)；(a)，(c)，(d)和(e)；(b)，(c)，(d)和(e)；和(a)，(b)，(c)和(d)。

SEQ ID NO：31的变体是具有下述氨基酸序列的蛋白质：其从SEQ ID NO：31的氨基酸序列变化而来并保持其成孔能力。可以使用本领域已知的和如上所述的任何方法来测定变体形成孔的能力。

在SEQ ID NO：31的氨基酸序列的整个长度上，基于氨基酸相似性或同一性，变体将优选与该序列至少50％同源。更优选地，基于氨基酸相似性或同一性，变体多肽可以与SEQ ID NO：31的氨基酸序列在整个序列上至少55％，至少60％，至少65％，至少70％，至少75％，至少80％，至少85％，至少90％且更优选至少95％，97％或99％同源。在200或更多个例如230，250，270或280个或更多个连续氨基酸的延伸段上，可以具有至少80％，例如至少85％，90％或95％的氨基酸相似性或同一性(“严格同源性”)。同源性可以如下所述确定。

异源寡聚孔也可以衍生自或基于CsgG。野生型CsgG孔由至少7个，至少8个，至少9个或至少10个，优选9个相同的单体或亚基形成(即，其是七聚体)。SEQ ID NO：32中示出了CsgG的一个单体或亚单的序列。异源寡聚孔可以衍生自包含至少7个，至少8个，至少9个或至少10个，优选9个单体的跨膜蛋白孔，每个单体包含SEQ ID NO：32所示序列或其变体。根据本发明产生的异源寡聚孔可以包含两种不同的单体，每个单体包含SEQ ID NO：32所示序列或其变体。第一不同单体优选包含SEQ ID NO：32所示序列或其变体。第二不同单体优选包含SEQ ID NO：32所示序列或其变体。最优选地，第一和第二不同单体包含SEQ ID NO：32所示序列的不同变体。

在本文的所有论述中，对各氨基酸使用标准单字母代码。这些标准单字母代码如下：丙氨酸(A)，精氨酸(R)，天冬酰胺(N)，天冬氨酸(D)，半胱氨酸(C)，谷氨酸(E)，谷氨酰胺(Q)，甘氨酸(G)，组氨酸(H)，异亮氨酸(I)，亮氨酸(L)，赖氨酸(K)，甲硫氨酸(M)，苯丙氨酸(F)，脯氨酸(P)，丝氨酸(S)，苏氨酸(T)，色氨酸(W)，酪氨酸(Y)和缬氨酸(V)。还使用标准替代符号，即Q42R表示42位置的Q被R替代。

SEQ ID NO：32的变体包含以下一个或多个：(i)以下位置的一个或多个突变(即以下一个或多个位置的突变)：N40，D43，E44，S54，S57，Q62，R97，E101，E124，E131，R142，T150和R192，例如以下位置的一个或多个突变(即，一个或多个以下位置的突变)：N40，D43，E44，S54，S57，Q62，E101，E131和T150或N40，D43，E44，E101和E131；(ii)Y51/N55，Y51/F56，N55/F56或Y51/N55/F56处的突变；(iii)Q42R或Q42K；(iv)K49R；(v)N102R，N102F，N102Y或N102W；(vi)D149N，D149Q或D149R；(vii)E185N，E185Q或E185R；(viii)D195N，D195Q或D195R；(ix)E201N，E201Q或E201R；(x)E203N，E203Q或E203R；和(xi)一个或多个以下位置的缺失：F48，K49，P50，Y51，P52，A53，S54，N55，F56和S57。变体可以包含(i)至(xi)的任何组合。

如果变体包含(i)和(iii)至(xi)中的任一个，则其还可包含Y51，N55和F56中的一个或多个处的突变，例如Y51，N55，F56，Y51/N55，Y51/F56，N55/F56或Y51/N55/F56处的突变。

在(i)中，变体可以包含N40，D43，E44，S54，S57，Q62，R97，E101，E124，E131，R142，T150和R192的任何数目和组合的突变。在(i)中，变体优选包含在以下位置的一个或多个突变(即在一个或多个以下位置的突变)：N40，D43，E44，S54，S57，Q62，E101，E131和T150。在(i)中，变体优选包含以下位置的一个或多个突变(即在一个或多个以下位置的突变)：N40，D43，E44，E101和E131。在(i)中，变体优选包含在S54和/或S57的突变。在(i)中，变体更优选包含在以下位置的突变：(a)S54和/或S57和(b)Y51，N55和F56中的一个或多个，例如在Y51，N55，F56，Y51/N55，Y51/F56，N55/F56或Y51/N55/F56处。如果在(xi)中缺失S54和/或S57，则它/们不能在(i)中突变，反之亦然。在(i)中，变体优选包含在T150的突变，例如在T150I。或者变体优选包含在以下位置的突变：(a)T150和(b)Y51，N55和F56中的一个或多个，例如在Y51，N55，F56，Y51/N55，Y51/F56，N55/F56或Y51/N55/F56。在(i)中，变体优选包含在Q62的突变，例如在Q62R或Q62K。或者，变体优选包含在以下位置的突变：(a)Q62和(b)Y51，N55和F56中的一个或多个，例如在Y51，N55，F56，Y51/N55，Y51/F56，N55/F56或Y51/N55/F56。变体可包含在D43，E44，Q62或其任何组合例如D43，E44，Q62，D43/E44，D43/Q62，E44/Q62或D43/E44/Q62的突变。或者变体优选包含在以下位置的突变：(a)D43，E44，Q62，D43/E44，D43/Q62，E44/Q62或D43/E44/Q62，和(b)Y51，N55和F56中的一个或多个，例如在Y51，N55，F56，Y51/N55，Y51/F56，N55/F56或Y51/N55/F56。

在(ii)中以及本申请的其他地方，/符号表示“和”，因此Y51/N55是Y51和N55。在(ii)中，变体优选包含在Y51/N55的突变。已经提出，CsgG中的收缩口由残基Y51，N55和F56的侧链形成的三个堆叠的同心环组成(Goyal等人，2014，Nature，516，250-253)。因此(ii)中的这些残基的突变可以减少当多核苷酸移动通过孔时对电流有贡献的核苷酸的数目，从而使得更容易识别观察到的电流(当多核苷酸移动通过孔时)和多核苷酸之间的直接关系。Y56可以以下面参考本发明方法中可用的变体和孔而论述的任何方式进行突变。

在(v)中，变体可以包含N102R，N102F，N102Y或N102W。变体优选包含(a)N102R，N102F，N102Y或N102W，和(b)在Y51，N55和F56中的一个或多个处的突变，例如在Y51，N55，F56，Y51/N55，Y51/F56，N55/F56或Y51/N55/F56。

在(xi)中，可以缺失K49，P50，Y51，P52，A53，S54，N55，F56和S57中的任何数量和组合。优选地，可以缺失K49，P50，Y51，P52，A53，S54，N55和S57中的一个或多个。如果在(xi)中缺失Y51，N55和F56中的任意一个，则它/它们不能在(ii)中突变，反之亦然。

在(i)中，变体优选包含以下取代中的一个或多个：N40R，N40K，D43N，D43Q，D43R，D43K，E44N，E44Q，E44R，E44K，S54P，S57P，Q62R，Q62K，R97N，R97G，R97L，E101N，E101Q，E101R，E101K，E101F，E101Y，E101W，E124N，E124Q，E124R，E124K，E124F，E124Y，E124W，E131D，R142E，R142N，T1501，R192E和R192N，例如N40R，N40K，D43N，D43Q，D43R，D43K，E44N，E44Q，E44R，E44K，S54P，S57P，Q62R，Q62K，E101N，E101Q，E101R，E101K，E101F，E101Y，E101W，E131D和T150I中的一个或多个，或者N40R，N40K，D43N，D43Q，D43R，D43K，E44N，E44Q，E44R，E44K，E101N，E101Q，E101R，E101K，E101F，E101Y，E101W和E131D中的一个或多个。变体可以包括任何数目和组合的这些取代。在(i)中，变体优选包含S54P和/或S57P。在(i)中，变体优选包含(a)S54P和/或S57P和(b)在Y51，N55和F56中的一个或多个处的突变，例如在Y51，N55，F56，Y51/N55，Y51/F56，N55/F56或Y51/N55/F56。Y51，N55和F56中的一个或多个处的突变可以是以下论述的任意个。在(i)中，变体优选包含F56A/S57P或S54P/F56A。变体优选包含T150I。或者变体优选包含在以下位置的突变：(a)T150I和(b)Y51，N55和F56中的一个或多个，例如在Y51，N55，F56，Y51/N55，Y51/F56，N55/F56或Y51/N55/F56。

在(i)中，变体优选包含Q62R或Q62K。或者，变体优选包含(a)Q62R或Q62K和(b)在Y51，N55和F56中的一个或多个处的突变，例如在Y51，N55，F56，Y51/N55，Y51/F56，N55/F56或Y51/N55/F56。变体可包含D43N，E44N，Q62R或Q62K或其任何组合，例如D43N，E44N，Q62R，Q62K，D43N/E44N，D43N/Q62R，D43N/Q62K，E44N/Q62R，E44N/Q62K，D43N/E44N/Q62R或D43N/E44N/Q62K。或者，变体优选包含(a)D43N，E44N，Q62R，Q62K，D43N/E44N，D43N/Q62R，D43N/Q62K，E44N/Q62R，E44N/Q62K，D43N/E44N/Q62R或D43N/E44N/Q62K，(b)在Y51，N55和F56中的一个或多个处的突变，例如在Y51，N55，F56，Y51/N55，Y51/F56，N55/F56或Y51/N55/F56。

在(i)中，变体优选包含D43N。

在(i)中，变体优选包含E101R，E101S，E101F或E101N。

在(i)中，变体优选包含E124N，E124Q，E124R，E124K，E124F，E124Y，E124W或E124D，例如E124N。

在(i)中，变体优选包含R142E和R142N。

在(i)中，变体优选包含R97N，R97G或R97L。

在(i)中，变体优选包含R192E和R192N。

在(ii)中，变体优选包含F56N/N55Q，F56N/N55R，F56N/N55K，F56N/N55S，F56N/N55G，F56N/N55A，F56N/N55T，F56Q/N55Q，F56Q/N55R，F56Q/N55K，F56Q/N55S，F56Q/N55G，F56Q/N55A，F56Q/N55T，F56R/N55Q，F56R/N55R，F56R/N55K，F56R/N55S，F56R/N55G，F56R/N55A，F56R/N55T，F56S/N55Q，F56S/N55R，F56S/N55K，F56S/N55S，F56S/N55G，F56S/N55A，F56S/N55T，F56G/N55Q，F56G/N55R，F56G/N55K，F56G/N55S，F56G/N55G，F56G/N55A，F56G/N55T，F56A/N55Q，F56A/N55R，F56A/N55K，F56A/N55S，F56A/N55G，F56A/N55A，F56A/N55T，F56K/N55Q，F56K/N55R，F56K/N55K，F56K/N55S，F56K/N55G，F56K/N55A，F56K/N55T，F56N/Y51L，F56N/Y51V，F56N/Y51A，F56N/Y51N，F56N/Y51Q，F56N/Y51S，F56N/Y51G，F56Q/Y51L，F56Q/Y51V，F56Q/Y51A，F56Q/Y51N，F56Q/Y51Q，F56Q/Y51S，F56Q/Y51G，F56R/Y51L，F56R/Y51V，F56R/Y51A，F56R/Y51N，F56R/Y51Q，F56R/Y51S，F56R/Y51G，F56S/Y51L，F56S/Y51V，F56S/Y51A，F56S/Y51N，F56S/Y51Q，F56S/Y51S，F56S/Y51G，F56G/Y51L，F56G/Y51V，F56G/Y51A，F56G/Y51N，F56G/Y51Q，F56G/Y51S，F56G/Y51G，F56A/Y51L，F56A/Y51V，F56A/Y51A，F56A/Y51N，F56A/Y51Q，F56A/Y51S，F56A/Y51G，F56K/Y51L，F56K/Y51V，F56K/Y51A，F56K/Y51N，F56K/Y51Q，F56K/Y51S，F56K/Y51G，N55Q/Y51L，N55Q/Y51V，N55Q/Y51A，N55Q/Y51N，N55Q/Y51Q，N55Q/Y51S，N55Q/Y51G，N55R/Y51L，N55R/Y51V，N55R/Y51A，N55R/Y51N，N55R/Y51Q，N55R/Y51S，N55R/Y51G，N55K/Y51L，N55K/Y51V，N55K/Y51A，N55K/Y51N，N55K/Y51Q，N55K/Y51S，N55K/Y51G，N55S/Y51L，N55S/Y51V，N55S/Y51A，N55S/Y51N，N55S/Y51Q，N55S/Y51S，N55S/Y51G，N55G/Y51L，N55G/Y51V，N55G/Y51A，N55G/Y51N，N55G/Y51Q，N55G/Y51S，N55G/Y51G，N55A/Y51L，N55A/Y51V，N55A/Y51A，N55A/Y51N，N55A/Y51Q，N55A/Y51S，N55A/Y51G，N55T/Y51L，N55T/Y51V，N55T/Y51A，N55T/Y51N，N55T/Y51Q，N55T/Y51S，N55T/Y51G，F56N/N55Q/Y51L，F56N/N55Q/Y51V，F56N/N55Q/Y51A，F56N/N55Q/Y51N，F56N/N55Q/Y51Q，F56N/N55Q/Y51S，F56N/N55Q/Y51G，F56N/N55R/Y51L，F56N/N55R/Y51V，F56N/N55R/Y51A，F56N/N55R/Y51N，F56N/N55R/Y51Q，F56N/N55R/Y51S，F56N/N55R/Y51G，F56N/N55K/Y51L，F56N/N55K/Y51V，F56N/N55K/Y51A，F56N/N55K/Y51N，F56N/N55K/Y51Q，F56N/N55K/Y51S，F56N/N55K/Y51G，F56N/N55S/Y51L，F56N/N55S/Y51V，F56N/N55S/Y51A，F56N/N55S/Y51N，F56N/N55S/Y51Q，F56N/N55S/Y51S，F56N/N55S/Y51G，F56N/N55G/Y51L，F56N/N55G/Y51V，F56N/N55G/Y51A，F56N/N55G/Y51N，F56N/N55G/Y51Q，F56N/N55G/Y51S，F56N/N55G/Y51G，F56N/N55A/Y51L，F56N/N55A/Y51V，F56N/N55A/Y51A，F56N/N55A/Y51N，F56N/N55A/Y51Q，F56N/N55A/Y51S，F56N/N55A/Y51G，F56N/N55T/Y51L，F56N/N55T/Y51V，F56N/N55T/Y51A，F56N/N55T/Y51N，F56N/N55T/Y51Q，F56N/N55T/Y51S，F56N/N55T/Y51G，F56Q/N55Q/Y51L，F56Q/N55Q/Y51V，F56Q/N55Q/Y51A，F56Q/N55Q/Y51N，F56Q/N55Q/Y51Q，F56Q/N55Q/Y51S，F56Q/N55Q/Y51G，F56Q/N55R/Y51L，F56Q/N55R/Y51V，F56Q/N55R/Y51A，F56Q/N55R/Y51N，F56Q/N55R/Y51Q，F56Q/N55R/Y51S，F56Q/N55R/Y51G，F56Q/N55K/Y51L，F56Q/N55K/Y51V，F56Q/N55K/Y51A，F56Q/N55K/Y51N，F56Q/N55K/Y51Q，F56Q/N55K/Y51S，F56Q/N55K/Y51G，F56Q/N55S/Y51L，F56Q/N55S/Y51V，F56Q/N55S/Y51A，F56Q/N55S/Y51N，F56Q/N55S/Y51Q，F56Q/N55S/Y51S，F56Q/N55S/Y51G，F56Q/N55G/Y51L，F56Q/N55G/Y51V，F56Q/N55G/Y51A，F56Q/N55G/Y51N，F56Q/N55G/Y51Q，F56Q/N55G/Y51S，F56Q/N55G/Y51G，F56Q/N55A/Y51L，F56Q/N55A/Y51V，F56Q/N55A/Y51A，F56Q/N55A/Y51N，F56Q/N55A/Y51Q，F56Q/N55A/Y51S，F56Q/N55A/Y51G，F56Q/N55T/Y51L，F56Q/N55T/Y51V，F56Q/N55T/Y51A，F56Q/N55T/Y51N，F56Q/N55T/Y51Q，F56Q/N55T/Y51S，F56Q/N55T/Y51G，F56R/N55Q/Y51L，F56R/N55Q/Y51V，F56R/N55Q/Y51A，F56R/N55Q/Y51N，F56R/N55Q/Y51Q，F56R/N55Q/Y51S，F56R/N55Q/Y51G，F56R/N55R/Y51L，F56R/N55R/Y51V，F56R/N55R/Y51A，F56R/N55R/Y51N，F56R/N55R/Y51Q，F56R/N55R/Y51S，F56R/N55R/Y51G，F56R/N55K/Y51L，F56R/N55K/Y51V，F56R/N55K/Y51A，F56R/N55K/Y51N，F56R/N55K/Y51Q，F56R/N55K/Y51S，F56R/N55K/Y51G，F56R/N55S/Y51L，F56R/N55S/Y51V，F56R/N55S/Y51A，F56R/N55S/Y51N，F56R/N55S/Y51Q，F56R/N55S/Y51S，F56R/N55S/Y51G，F56R/N55G/Y51L，F56R/N55G/Y51V，F56R/N55G/Y51A，F56R/N55G/Y51N，F56R/N55G/Y51Q，F56R/N55G/Y51S，F56R/N55G/Y51G，F56R/N55A/Y51L，F56R/N55A/Y51V，F56R/N55A/Y51A，F56R/N55A/Y51N，F56R/N55A/Y51Q，F56R/N55A/Y51S，F56R/N55A/Y51G，F56R/N55T/Y51L，F56R/N55T/Y51V，F56R/N55T/Y51A，F56R/N55T/Y51N，F56R/N55T/Y51Q，F56R/N55T/Y51S，F56R/N55T/Y51G，F56S/N55Q/Y51L，F56S/N55Q/Y51V，F56S/N55Q/Y51A，F56S/N55Q/Y51N，F56S/N55Q/Y51Q，F56S/N55Q/Y51S，F56S/N55Q/Y51G，F56S/N55R/Y51L，F56S/N55R/Y51V，F56S/N55R/Y51A，F56S/N55R/Y51N，F56S/N55R/Y51Q，F56S/N55R/Y51S，F56S/N55R/Y51G，F56S/N55K/Y51L，F56S/N55K/Y51V，F56S/N55K/Y51A，F56S/N55K/Y51N，F56S/N55K/Y51Q，F56S/N55K/Y51S，F56S/N55K/Y51G，F56S/N55S/Y51L，F56S/N55S/Y51V，F56S/N55S/Y51A，F56S/N55S/Y51N，F56S/N55S/Y51Q，F56S/N55S/Y51S，F56S/N55S/Y51G，F56S/N55G/Y51L，F56S/N55G/Y51V，F56S/N55G/Y51A，F56S/N55G/Y51N，F56S/N55G/Y51Q，F56S/N55G/Y51S，F56S/N55G/Y51G，F56S/N55A/Y51L，F56S/N55A/Y51V，F56S/N55A/Y51A，F56S/N55A/Y51N，F56S/N55A/Y51Q，F56S/N55A/Y51S，F56S/N55A/Y51G，F56S/N55T/Y51L，F56S/N55T/Y51V，F56S/N55T/Y51A，F56S/N55T/Y51N，F56S/N55T/Y51Q，F56S/N55T/Y51S，F56S/N55T/Y51G，F56G/N55Q/Y51L，F56G/N55Q/Y51V，F56G/N55Q/Y51A，F56G/N55Q/Y51N，F56G/N55Q/Y51Q，F56G/N55Q/Y51S，F56G/N55Q/Y51G，F56G/N55R/Y51L，F56G/N55R/Y51V，F56G/N55R/Y51A，F56G/N55R/Y51N，F56G/N55R/Y51Q，F56G/N55R/Y51S，F56G/N55R/Y51G，F56G/N55K/Y51L，F56G/N55K/Y51V，F56G/N55K/Y51A，F56G/N55K/Y51N，F56G/N55K/Y51Q，F56G/N55K/Y51S，F56G/N55K/Y51G，F56G/N55S/Y51L，F56G/N55S/Y51V，F56G/N55S/Y51A，F56G/N55S/Y51N，F56G/N55S/Y51Q，F56G/N55S/Y51S，F56G/N55S/Y51G，F56G/N55G/Y51L，F56G/N55G/Y51V，F56G/N55G/Y51A，F56G/N55G/Y51N，F56G/N55G/Y51Q，F56G/N55G/Y51S，F56G/N55G/Y51G，F56G/N55A/Y51L，F56G/N55A/Y51V，F56G/N55A/Y51A，F56G/N55A/Y51N，F56G/N55A/Y51Q，F56G/N55A/Y51S，F56G/N55A/Y51G，F56G/N55T/Y51L，F56G/N55T/Y51V，F56G/N55T/Y51A，F56G/N55T/Y51N，F56G/N55T/Y51Q，F56G/N55T/Y51S，F56G/N55T/Y51G，F56A/N55Q/Y51L，F56A/N55Q/Y51V，F56A/N55Q/Y51A，F56A/N55Q/Y51N，F56A/N55Q/Y51Q，F56A/N55Q/Y51S，F56A/N55Q/Y51G，F56A/N55R/Y51L，F56A/N55R/Y51V，F56A/N55R/Y51A，F56A/N55R/Y51N，F56A/N55R/Y51Q，F56A/N55R/Y51S，F56A/N55R/Y51G，F56A/N55K/Y51L，F56A/N55K/Y51V，F56A/N55K/Y51A，F56A/N55K/Y51N，F56A/N55K/Y51Q，F56A/N55K/Y51S，F56A/N55K/Y51G，F56A/N55S/Y51L，F56A/N55S/Y51V，F56A/N55S/Y51A，F56A/N55S/Y51N，F56A/N55S/Y51Q，F56A/N55S/Y51S，F56A/N55S/Y51G，F56A/N55G/Y51L，F56A/N55G/Y51V，F56A/N55G/Y51A，F56A/N55G/Y51N，F56A/N55G/Y51Q，F56A/N55G/Y51S，F56A/N55G/Y51G，F56A/N55A/Y51L，F56A/N55A/Y51V，F56A/N55A/Y51A，F56A/N55A/Y51N，F56A/N55A/Y51Q，F56A/N55A/Y51S，F56A/N55A/Y51G，F56A/N55T/Y51L，F56A/N55T/Y51V，F56A/N55T/Y51A，F56A/N55T/Y51N，F56A/N55T/Y51Q，F56A/N55T/Y51S，F56A/N55T/Y51G，F56K/N55Q/Y51L，F56K/N55Q/Y51V，F56K/N55Q/Y51A，F56K/N55Q/Y51N，F56K/N55Q/Y51Q，F56K/N55Q/Y51S，F56K/N55Q/Y51G，F56K/N55R/Y51L，F56K/N55R/Y51V，F56K/N55R/Y51A，F56K/N55R/Y51N，F56K/N55R/Y51Q，F56K/N55R/Y51S，F56K/N55R/Y51G，F56K/N55K/Y51L，F56K/N55K/Y51V，F56K/N55K/Y51A，F56K/N55K/Y51N，F56K/N55K/Y51Q，F56K/N55K/Y51S，F56K/N55K/Y51G，F56K/N55S/Y51L，F56K/N55S/Y51V，F56K/N55S/Y51A，F56K/N55S/Y51N，F56K/N55S/Y51Q，F56K/N55S/Y51S，F56K/N55S/Y51G，F56K/N55G/Y51L，F56K/N55G/Y51V，F56K/N55G/Y51A，F56K/N55G/Y51N，F56K/N55G/Y51Q，F56K/N55G/Y51S，F56K/N55G/Y51G，F56K/N55A/Y51L，F56K/N55A/Y51V，F56K/N55A/Y51A，F56K/N55A/Y51N，F56K/N55A/Y51Q，F56K/N55A/Y51S，F56K/N55A/Y51G，F56K/N55T/Y51L，F56K/N55T/Y51V，F56K/N55T/Y51A，F56K/N55T/Y51N，F56K/N55T/Y51Q，F56K/N55T/Y51S，F56K/N55T/Y51G，F56E/N55R，F56E/N55K，F56D/N55R，F56D/N55K，F56R/N55E，F56R/N55D，F56K/N55E或F56K/N55D。

在(ii)中，变体优选包含Y51R/F56Q，Y51N/F56N，Y51M/F56Q，Y51L/F56Q，Y51I/F56Q，Y51V/F56Q，Y51A/F56Q，Y51P/F56Q，Y51G/F56Q，Y51C/F56Q，Y51Q/F56Q，Y51N/F56Q，Y51S/F56Q，Y51E/F56Q，Y51D/F56Q，Y51K/F56Q或Y51H/F56Q。

在(ii)中，变体优选包含Y51T/F56Q，Y51Q/F56Q或Y51A/F56Q。

在(ii)中，变体优选包含Y51T/F56F，Y51T/F56M，Y51T/F56L，Y51T/F56I，Y51T/F56V，Y51T/F56A，Y51T/F56P，Y51T/F56G，Y51T/F56C，Y51T/F56Q，Y51T/F56N，Y51T/F56T，Y51T/F56S，Y51T/F56E，Y51T/F56D，Y51T/F56K，Y51T/F56H或Y51T/F56R。

在(ii)中，变体优选包含Y51T/N55Q，Y51T/N55S或Y51T/N55A。

在(ii)中，变体优选包含Y51A/F56F，Y51A/F56L，Y51A/F56I，Y51A/F56V，Y51A/F56A，Y51A/F56P，Y51A/F56G，Y51A/F56C，Y51A/F56Q，Y51A/F56N，Y51A/F56T，Y51A/F56S，Y51A/F56E，Y51A/F56D，Y51A/F56K，Y51A/F56H或Y51A/F56R。

在(ii)中，变体优选包含Y51C/F56A，Y51E/F56A，Y51D/F56A，Y51K/F56A，Y51H/F56A，Y51Q/F56A，Y51N/F56A，Y51S/F56A，Y51P/F56A或Y51V/F56A。

在(xi)中，变体优选包含Y51/P52，Y51/P52/A53，P50至P52，P50至A53，K49至Y51，K49至A53的缺失，和用单个脯氨酸(P)，K49至S54的替换，和用单个P，Y51至A53，Y51至S54，N55/F56，N55至S57，N55/F56的替换，和用单个P，N55/F56的替换，和用单个甘氨酸(G)，N55/F56的替换，和用单个丙氨酸(A)，N55/F56的替换，和用单个P及Y51N，N55/F56的替换，和用单个P及Y51Q，N55/F56的替换，和用单个P及Y51S，N55/F56的替换，和用单个G及Y51N，N55/F56的替换，和用单个G及Y51Q，N55/F56的替换，和用单个G及Y51S，N55/F56的替换，和用单个A及Y51N，N55/F56的替换，和用单个A/Y51Q或N55/F56的替换，和用单个A及Y51S的替换。

SEQ ID NO：32的优选变体在国际申请No.PCT/EP2015/069965中公开。

SEQ ID NO：32的变体是具有以下氨基酸序列的蛋白质：其从SEQ ID NO：32的氨基酸序列变化而来并保持其成孔能力。可以使用本领域已知的和如上所述的任何方法来测定变体形成孔的能力。

在SEQ ID NO：32的氨基酸序列的整个长度上，基于氨基酸相似性或同一性，变体将优选与该序列至少50％同源。更优选地，基于氨基酸相似性或同一性，变体多肽可以与SEQ ID NO：32的氨基酸序列在整个序列上至少55％，至少60％，至少65％，至少70％，至少75％，至少80％，至少85％，至少90％且更优选至少95％，97％或99％同源。在200或更多个，例如230，250，270或280或更多个连续氨基酸的延伸段上，可以具有至少80％，例如至少85％，90％或95％的氨基酸相似性或同一性(“严格同源性”)。同源性可以如下所述确定。

除了上述论述的那些外，可以对SEQ ID NO：4，31或32的氨基酸序列进行氨基酸取代，例如多达1，2，3，4，5，10，20或30个取代。可以如上所述进行保守取代。

SEQ ID NO：4，31或32的氨基酸序列的一个或多个氨基酸残基可另外从上述多肽中缺失。可以缺失多达1，2，3，4，5，10，20或30个残基，或更多。

变体可以是SEQ ID NO：4，31或32的片段。这样的片段保持成孔活性。片段长度可以至少为50，100，200或250个氨基酸。片段优选包含SEQ ID NO：4，31或32的成孔结构域。片段通常包括SEQ ID NO：4的残基119，121，135，113和139。

替代地或另外地，将一个或多个氨基酸添加到上述多肽。可以在SEQ ID NO：4，31或32的氨基酸序列的氨基末端或羧基末端或其变体或片段处提供延伸。延伸可能相当短，例如1至10个氨基酸长度。或者，延伸可以更长，例如多达50或100个氨基酸。载体蛋白可以与孔或变体融合。

如上所述，SEQ ID NO：4，31或32的变体是具有下述氨基酸序列的亚基：其从SEQID NO：4，31或32的氨基酸序列变化而来并保留其形成孔的能力。变体通常包含SEQ ID NO：4，31或32的负责孔形成的区域。含有β-桶状体的α-HL的孔形成能力由每个亚基中的β链提供。SEQ ID NO：4的变体通常包含形成β链的SEQ ID NO：4中的区域。上文论述了形成β链的SEQ ID NO：4的氨基酸。可以对形成β链的SEQ ID NO：4的区域进行一个或多个修饰，只要所得变体保持其形成孔的能力即可。可以对SEQ ID NO：4的β链区域如上所述进行具体修饰。

SEQ ID NO：4，31或32的变体优选包括在其α-螺旋和/或环区域内的一个或多个修饰，例如取代、添加或缺失。形成α-螺旋和环的氨基酸在上文已论述。

可以修饰SEQ ID NO：4，31或32的变体以影响其寡聚作用和/或有助于其鉴定或纯化，如下所述。

在一些实施方案中，异源寡聚孔被化学修饰。孔可以以任何方式在任何位置进行化学修饰。下面论述了适当的修饰。这类修饰可以应用于本发明中产生的任何孔。

构建体

本发明的异源寡聚孔可以包括含有两个或更多个共价连接的单体的构建体。第一不同单体可以构成包含两个或更多个基因融合单体的第一不同构建体的一部分。第二不同单体可以构成包含两个或更多个基因融合单体的第二不同构建体的一部分。第一和第二不同构建体可以以上文和下文论述的任何方式彼此不同。

第一不同构建体和第二不同构建体保留了形成孔的能力。这可以如上所述来确定。每个构建体可以包含至少2个，至少3个，至少4个，至少5个，至少6个，至少7个，至少8个，至少9个或至少10个单体。每个构建体优选包含两个单体。两个或更多个单体可以相同或不同。

构建体中的单体优选大致相同的长度或相同的长度。构建体中单体的桶状体优选大致相同的长度或相同的长度。长度可以以氨基酸数量和/或长度单位来测量。构建体中的单体优选具有相同数目的氨基酸从桶状体中缺失，例如从MspA(SEQ ID NO：2)中的位置72至82和/或位置111至121。如下所述，一个或多个不同的构建体可以连接到标签或其BasTL序列或片段，这使得它比孔中的其他构建体更长。

构建体中的单体是基因融合的。如果整个构建体从单个多核苷酸序列表达，则单体是基因融合的。单体的编码序列可以以任何方式组合以形成编码该构建体的单个多核苷酸序列。

单体可以以任何构造基因融合。单体可以通过其末端氨基酸融合。例如，一个单体的氨基末端可以与另一个单体的羧基末端融合。构建体中的第二个和随后的单体(沿氨基至羧基方向)的氨基末端(各自与前一单体的羧基末端融合)可以包含一个甲硫氨酸。例如，如果M是单体(不含氨基末端甲硫氨酸)，并且mM是具有氨基末端甲硫氨酸的单体，则构建体可以包含序列mM-mM，mM-mM-mM或mM-mM-mM-mM。这些甲硫氨酸的存在通常来源于在编码整个构建体的多核苷酸内编码单体的多核苷酸的5′端的起始密码子(即ATG)的表达。构建体中的第二个和随后的单体(在氨基至羧基方向)可缺少甲硫氨酸(例如，mM-M，mM-M-M或mM-M-M-M)。

两个或更多个单体可以直接基因融合在一起。单体优选使用连接体进行基因融合。连接体可以设计成限制单体的移动。优选的连接体是氨基酸序列(即肽连接体)。可以使用以下论述的任何肽连接体。

孔含有足够的用以形成孔的构建体和(如有必要)单体。例如，八聚体孔可以包含(a)四个构建体，每个构建体包含两个单体，(b)两个构建体，每个构建体包含四个单体，或(b)一个包含两个单体的构建体，和六个不构成构建体一部分的单体。例如，九聚体孔可以包含(a)四个各自包含两个单体的构建体，和一个不构成构建体一部分的单体，(b)两个各自包含四个单体的构建体，和一个不构成构建体一部分的单体，或(b)一个包含两个单体的构建体和七个不构成构建体一部分的单体。本领域技术人员可以设想构建体和单体的其他组合。

本发明的孔通常包含(a)一个包含两个单体的构建体，和(b)5，6，7或8个单体。构建体可以是上面论述的那些中的任何构建体。

另一个典型的孔包含多于一个的本发明构建体，例如两个，三个或四个本发明构建体。如果需要，这些孔还包含足够的用以形成孔的额外单体或构建体。所述额外单体可以是上面论述的那些中的任何单体。

本发明的另一个孔仅包括含有2单体的构建体，例如，孔可以包括4，5，6，7或8个含有2单体的构建体。

一个或多个构建体可以如上所述化学修饰。在下面的所有论述中，涉及第一不同单体和/或第二不同单体，特别是特定化学计量比的实施方案同样适用于第一不同构建体和/或第二不同构建体。术语单体和构建体在以下所有论述中可互换使用。

特定化学计量比

通过本发明方法制备的异源寡聚孔包含具有特定化学计量比的两种不同单体。特定化学计量比通常是预先确定的。它也可以称为所需的化学计量比。

所述特定化学计量比是异源寡聚孔中第一不同单体与第二不同单体的比例。如果异源寡聚孔包含3个单体，则第一不同单体与第二不同单体的特定化学计量比可以是1∶2或2∶1。如果异源寡聚孔包括4个单体，则第一不同单体与第二不同单体的特定化学计量比可以是1∶3，2∶2或3∶1。如果异源寡聚孔包含5个单体，则第一不同单体与第二不同单体的特定化学计量比可以是1∶4，2∶3，3∶2或4∶1。如果异源寡聚孔包含6个单体，则第一不同单体与第二不同单体的特定化学计量比可以是1∶5，2∶4，3∶3，4∶2或5∶1。如果异源寡聚孔包含7个单体，则第一不同单体与第二不同单体的特定化学计量比可以是1∶6，2∶5，3∶4，4∶3，5∶2或6∶1。如果异源寡聚孔包含8个单体，则第一不同单体与第二不同单体的特定化学计量比可以是1∶7，2∶6，3∶5，4∶4，5∶3，6∶2或7∶1。如果异源寡聚孔包含9个单体，则第一不同单体与第二不同单体的特定化学计量比可以是1∶8，2∶7，3∶6，4∶5，5∶4，6∶3，7∶2或8∶1。如果异源寡聚孔包含10个单体，则第一不同单体与第二不同单体的特定化学计量比可以是1∶9，2∶8，3∶7，4∶6，5∶5，6∶4，7∶3，8∶2或9∶1。

第一不同单体与第二不同单体的特定化学计量比至少为5∶1，例如至少6∶1，至少7∶1，至少8∶1或至少9∶1。第一不同单体与第二不同单体的特定化学计量比最优选为6∶1或7∶1。

本发明的方法制备包含特定化学计量比的两种不同单体的异源寡聚孔。这意味着在细胞中产生的大部分孔包含特定化学计量比的两种不同单体。例如，细胞产生的异源寡聚孔的至少55％包含特定化学计量比的两种不同单体。至少60％，至少65％，至少70％，至少75％，至少80％，至少85％，至少90％，至少95％，至少97％，至少98％或至少99％的由细胞产生的异源寡聚孔包含特定化学计量比的两种不同单体。在一些情况下，细胞产生的全部异源寡聚孔，即100％的异源寡聚孔，包含特定化学计量比的两种不同单体。可以使用本领域中的方法来测量包含特定化学计量比的两种不同单体的细胞产生的异源寡聚孔的％。例如，如果所述不同单体之一如下所述进行标记，则包含不同比率的不同单体的异源寡聚孔将具有不同的大小。可以使用凝胶电泳鉴定和定量不同大小的异源寡聚孔。

载体

本发明的方法包括用两个不同的单体转染或转化细胞。转染或转化包括将多核苷酸(例如核酸)引入细胞中。转染或转化通常涉及非病毒性方法。

在第一可诱导载体或第一可诱导表达载体中用第一不同单体转染或转化细胞。也可以在第二可诱导载体或第二可诱导表达载体中，用第二不同单体转染或转化细胞。该方法可以包括用第一和第二可诱导载体或可诱导表达载体以任何顺序转染或转化细胞。该方法可以包括在第二可诱导载体或第二可诱导表达载体之前用第一可诱导载体或第一可诱导表达载体转染或转化细胞。该方法可以包括在第一可诱导载体或第一诱导表达载体之前用第二可诱导载体或第二可诱导表达载体转染或转化细胞。该方法可以包括同时用第一和第二可诱导载体或第一和第二可诱导表达载体转染或转化细胞。在诱导第一和第二可诱导载体使得细胞产生包含特定化学计量比的第一和第二不同单体的异源寡聚孔之前，用第一和第二可诱导载体或第一和第二可诱导表达载体转染或转化细胞。

通常在第一可诱导载体或第一可诱导表达载体中用编码第一不同单体的多核苷酸序列转染或转化细胞。还通常在第二可诱导载体或第二可诱导表达载体中用编码第二不同单体的多核苷酸序列转染或转化细胞。

编码单体的多核苷酸序列可以使用本领域的标准方法得到和复制。编码野生型孔的染色体DNA可以从产生生物体如金黄色葡萄球菌(Staphyloccoccus aureus)、耻垢分枝杆菌或大肠杆菌的孔中提取。可以使用包括特异性引物的PCR扩增编码孔亚基的基因。然后可以对扩增的序列进行定点诱变(site-directed mutagenesis)。合适的定点诱变的方法是本领域已知的，并且包括例如组合链反应。多核苷酸可以使用众所周知的技术制备，例如Sambrook，J.and Russell，D.(2001).Molecular Cloning：A Laboratory Manual，3rdEdition.Cold Spring Harbor Laboratory Press，Cold Spring Harbor，NY中记载的方法。它们也可以商购获得。

然后将得到的多核苷酸序列并入重组可复制载体如克隆载体中。载体可用于在相容的宿主细胞中复制多核苷酸。因此，多核苷酸序列可以通过将多核苷酸引入可复制载体中，将该载体引入相容的宿主细胞中，然后在引起载体复制的条件下使宿主细胞生长，来制备。载体可以从宿主细胞中回收。用于克隆多核苷酸的合适的宿主细胞是本领域已知的并且在下文中更详细地描述。

多核苷酸序列可以克隆到合适的表达载体中。在表达载体中，多核苷酸序列通常可操作地连接到能够通过宿主细胞提供编码序列的表达的控制序列。这样的表达载体可用于表达单体。编码第一不同单体的多核苷酸序列优选可操作地连接到第一可诱导载体或第一可诱导表达载体中的第一可诱导控制序列，例如第一可诱导启动子。编码第二不同单体的多核苷酸序列优选可操作地连接到第二可诱导载体或第二可诱导表达载体中的第二可诱导控制序列，例如第二可诱导启动子。

术语“可操作地连接”是指并置(juxtaposition)，其中，所描述的组分具有允许它们以其预期方式起作用的关系。“可操作地连接”到编码序列的控制序列以这样的方式连接：在与控制序列相容的条件下实现编码序列的表达。可以将相同或不同的多核苷酸序列的多个拷贝引入载体中。

第一可诱导载体和第二可诱导载体通常是可诱导的，因为它们各自包含可诱导启动子。第一可诱导载体通常包含第一可诱导启动子，第二可诱导载体通常包含第二可诱导启动子。第一和/或第二可诱导启动子可以是阿拉伯糖启动子，丙酸酯启动子，鼠李糖可诱导启动子，木糖启动子或乳糖启动子。编码第一不同单体的多核苷酸序列优选可操作地连接到阿拉伯糖启动子，丙酸酯启动子，鼠李糖可诱导启动子，木糖启动子或乳糖启动子。编码第二不同单体的多核苷酸序列优选可操作地连接到阿拉伯糖启动子，丙酸酯启动子，鼠李糖可诱导启动子，木糖启动子或乳糖启动子。

第一可诱导载体和第二可诱导载体中的启动子优选是不同的。第一可诱导载体优选包含鼠李糖可诱导启动子，第二可诱导载体包含乳糖启动子。编码第一不同单体的多核苷酸序列优选可操作地连接到鼠李糖可诱导启动子，并且编码第二不同单体的多核苷酸序列优选可操作地连接到乳糖启动子。第一可诱导载体或第一可诱导启动子优选由鼠李糖诱导。第二可诱导载体或第二可诱导启动子优选由异丙基β-D-硫代半乳糖吡喃糖苷(IPTG)诱导。

第一和第二可诱导载体优选进行差异诱导。差异诱导在下面更详细地论述。

第一可诱导载体和/或第二可诱导载体可以是例如质粒，病毒或噬菌体载体。第一可诱导载体和/或第二可诱导载体可以包括复制起点。

第一可诱导载体和/或第二可诱导载体可以含有一个或多个选择标记基因，例如四环素抗性基因，三氯生抗性基因，氨苄青霉素抗性基因或卡那霉素抗性基因。第一可诱导载体优选包括第一选择标记，第二可诱导载体优选包括第二选择标记。第一和第二选择标记优选彼此不同。如果选择标记不同，则可以直接确认细胞已被两个载体转染或转化。第一选择标记优选为对卡那霉素提供抗性的基因。第二选择标记优选为对氨苄青霉素提供抗性的基因。

根据本发明转染或转化的细胞可以称为宿主细胞。该方法可以包括在将要转染或转化细胞的条件下使细胞与第一和第二可诱导载体接触。合适的条件是本领域已知的(参见，例如，Sambrook，J.and Russell，D.见上文)。

细胞通常以高水平表达第一和/或第二不同单体。通常将细胞选择为与用于转染或转化该细胞的表达载体相容。用于本发明的合适的细胞包括原核细胞和真核细胞。原核细胞优选为细菌细胞。合适的细菌细胞包括但不限于，大肠杆菌，棒状杆菌和荧光假单胞菌。任何具有DE3溶原体的大肠杆菌细胞，例如C41(DE3)，BL21(DE3)，JM109(DE3)，B834(DE3)，TUNER，Origami和Origami B都可以表达包含T7启动子的载体。

合适的真核细胞包括但不限于，酿酒酵母(Saccharomyces cerevisiae)，巴斯德毕赤酵母(Pichia pastoris)，丝状真菌如曲霉属(Aspergillus)，木霉属(Trichoderma)和嗜热毁丝霉C1(Myceliophthora thermophila C1)，杆状病毒感染的昆虫细胞如Sf9，Sf21和高五株(High Five strain)，非裂解性昆虫细胞，利什曼原虫(Leishmania)细胞，植物细胞，如烟草植物细胞，和哺乳动物细胞，如原牛(Bos primigenius)细胞(Bovine)，小家鼠(Mus musculus)细胞(Mouse)，中国仓鼠卵巢(CHO)细胞，人胚胎肾(HEK)细胞，幼仓鼠肾(BHK)细胞和HeLa细胞。其他优选的哺乳动物细胞包括但不限于PC12，HEK293，HEK293A，HEK293T，CHO，BHK-21，HeLa，ARPE-19，RAW264.7和COS细胞。

宿主细胞优选为大肠杆菌。

重组表达的第一和第二不同单体通常在细胞膜中自组装成异源寡聚孔。在步骤(c)中，第一和第二单体优选在细胞中以特定化学计量比表达，并且异源寡聚孔在细胞膜中形成。

差异诱导

该方法优选包括差异诱导第一和第二可诱导载体。这通常包括以不同的方式诱导第一和第二可诱导载体。例如，可以通过鼠李糖诱导第一可诱导载体，并且可以通过异丙基β-D-硫代半乳糖吡喃糖苷(IPTG)诱导第二可诱导载体。技术人员可以进行控制实验以确定差异诱导对异源寡聚孔中第一和第二不同单体的化学计量比的影响。

该方法优选包括以不同的程度诱导第一和第二可诱导载体。这通常包括以不同的程度诱导第一和第二可诱导载体。通常使用不同浓度的诱导化学物质或分子，将第一和第二可诱导载体诱导到不同程度。本领域技术人员可以进行控制实验以确定将载体进行不同程度的诱导对异源寡聚孔中第一和第二不同单体化学计量比的影响。

第一和第二可诱导载体可以差异诱导到不同的程度。

表达比例

使用本发明制备的异源孔可以包括具有特定化学计量比的第一和第二不同单体，因为细胞以特定比例表达第一和第二不同单体。在步骤(c)中，第一和第二不同单体优选由细胞以下述比例表达：允许形成包含特定化学计量比的第一和第二不同单体的异源寡聚孔。然而，第一和第二不同单体不需要以特定化学计量比表达。表达第一和第二不同单体的所述比例可以允许形成不同的异源寡聚孔，所述异源寡聚孔包含具有特定化学计量比的第一和第二不同单体的不同比例。例如，如果异源寡聚孔包含8个单体，并且第一不同单体与第二不同单体的特定化学计量比为7∶1，则所述不同的单体可以下述比例表达：允许形成含有6∶2，7∶1和8∶0比例的第一和第二不同单体的异源寡聚孔。具有特定化学计量比的异源寡聚孔可以按下面更详细的论述进行纯化。

第一不同单体与第二不同单体的表达比例可以使用例如SDS-PAGE，蛋白印迹法(白印迹法)或质谱法等常规方法测量。可以如上所述，通过差异诱导第一和第二可诱导载体和/或诱导它们到不同程度来影响表达比例。

第一和第二不同单体的表达比例也可通过修饰其中一者或两者而被影响。优选对第一和第二不同单体中的至少一个，例如这两者，进行修饰，以影响其表达——与其在不存在修饰时的表达相比。与不存在修饰时的表达相比，可以修饰第一不同单体以增加或减少其表达。与不存在修饰时的表达相比，可以修饰第二不同单体以增加或减少其表达。修饰或缺乏修饰的优选组合示于下表1中。

第一不同单体	第二不同单体
		增加其表达的修饰	无修饰
无修饰	增加其表达的修饰
		减少其表达的修饰	无修饰
无修饰	减少其表达的修饰
		增加其表达的修饰	减少其表达的修饰
减少其表达的修饰	增加其表达的修饰
		增加其表达的修饰	增加其表达的修饰
减少其表达的修饰	减少其表达的修饰

表1

可以对第一不同单体和/或第二不同单体的表达进行任何程度的影响。例如，第一不同单体和/或第二不同单体的表达可以增加或减少至少5％，例如至少10％，至少20％，至少30％，至少40％，至少50％，至少60％，至少70％，至少80％，至少90％，至少100％，至少150％，至少200％，少300％，至少400％，至少500％。可以使用例如SDS-PAGE，蛋白印迹法，UV280浓度测量或质谱法等常规方法确定单体的表达水平。影响单体表达的修饰能力可以通过在相同细胞中相同条件下将修饰单体的表达与未修饰单体的表达进行比较来确定。

将两个单体的表达增加或减少到不同程度可以有助于确保单体以近似特定化学计量比表达。

技术人员将能够设计影响单体表达的修饰。修饰优选是将肽、多肽或蛋白质序列与单体进行基因融合，使得肽、多肽或蛋白质序列用单体表达。如果单体和肽、多肽或蛋白质序列从单个多核苷酸序列表达，则将它们进行基因融合。下文将参照标签更详细地论述减少单体表达的优选方法。

影响寡聚作用的修饰

使用本发明制备的异源孔可以包括具有特定化学计量比的第一和第二不同单体，因为第一和第二不同单体中的一个或两个被修饰以影响其寡聚能力。优选修饰第一和第二不同单体中的至少一个，例如两个，以影响其与自身或与其他不同单体寡聚的能力。可以修饰第一不同单体以增加或减少其与第二不同单体寡聚的能力。可以修饰第二不同单体以增加或减少其与第一不同单体寡聚的能力。增加单体寡聚的能力将增加其在使用所述方法产生的异源寡聚孔中的发生率(incidence)，并因此可以影响特定化学计量比。相反，减少单体寡聚的能力将降低其在使用所述方法产生的异源寡聚孔中的发生率。

在下表2中示出了修饰或缺乏修饰的优选组合。

第一不同单体	第二不同单体
		增加其寡聚能力的修饰	无修饰
无修饰	增加其寡聚能力的修饰
		减少其寡聚能力的修饰	无修饰
无修饰	减少其寡聚能力的修饰
		增加其寡聚能力的修饰	减少其寡聚能力的修饰
减少其寡聚能力的修饰	增加其寡聚能力的修饰
		增加其寡聚能力的修饰	增加其寡聚能力的修饰
减少其寡聚能力的修饰	减少其寡聚能力的修饰

表2

可以对第一不同单体和/或第二不同单体与其他单体寡聚的能力进行任何程度的影响。例如，第一不同单体和/或第二不同单体与其他单体寡聚的能力可以增加或减少至少5％，例如至少10％，至少20％，至少30％，至少40％，至少50％，至少60％，至少70％，至少80％，至少90％，至少100％，至少150％，至少200％，至少300％，至少400％，至少500％。可以使用例如SDS-PAGE，蛋白印迹法，UV280浓度测量，尺寸排色谱法或质谱法等常规方法确定单体寡聚的能力。影响单体寡聚的修饰能力可以通过在相同条件下将修饰单体和未修饰单体与相同单体的寡聚作用进行比较来确定。

增加或减少两个单体寡聚的能力至不同程度有助于确保异源寡聚孔包含特定化学计量比的两种不同单体。

技术人员将能够设计影响单体寡聚能力的修饰。修饰优选是将肽、多肽或蛋白质序列基因融合至单体，使得肽、多肽或蛋白质序列用单体表达。基因融合如上所述。基因融合可以在单体的氨基(N)和/或羧基(C)末端。降低单体寡聚能力的优选方法将在下面参照标签更详细地论述。修饰优选是单体的截短(truncation)。截短可以在单体的氨基(N)和/或羧基(C)末端。修饰优选是负责寡聚的单体的氨基酸/区域的一个或多个突变。

负责寡聚的葡萄球菌α-溶血素的氨基酸和区域是本领域已知的。Walker andBayley，Journal of Biological Chemistry，第270卷，第39期，9月29日发行，第23065-23071页，1995公开了通过半胱氨酸扫描诱变靶向化学修饰(scanning mutagenesisandtargeted chemical modification)鉴定的葡萄球菌α-溶血素的膜结合、寡聚和孔形成活性的关键残基。Panchal和Bayley，Journal of Biological Chemistry，第270卷，第39期，9月29日发行，第23072-23076页，1995公开了通过反向诱变揭示的葡萄球菌α-溶血素中的残基之间的相互作用。Cheley等人，Protein Engineering等10卷第12期，第1433-1443页，1997公开了通过去除形成跨膜β-桶状体的残基进行构象约束的葡萄球菌α-溶血素的自发寡聚。Jayasinghe等人，The Journal Of Biological Chemistry第281卷第4期第2195-2204页2006年1月27日公开了葡萄球菌α-溶血素的氨基封闭物(amino latch)在孔形成中的作用，并揭示了n末端和位置217之间的协作相互作用。

标签

标签还可以用于允许第一和第二不同单体以特定化学计量比在细胞中表达和/或影响单体寡聚的能力。标签优选为肽或多肽。一个或多个肽或多肽标签可以基因融合到第一和/或第二不同单体。如果单体和标签(一个或多个)从单个多核苷酸序列表达，则它们进行基因融合。一个或多个标签的存在可以增加或降低不同单体被表达的能力。一个或多个标签的存在可以增加或降低不同单体与其自身或异源寡聚孔中的其他单体寡聚的能力。

第二不同单体优选基因融合到肽或多肽标签，这与不存在标签时该单体的表达相比降低了该单体与其自身寡聚的能力或降低了该单体的表达。肽或多肽标签优选在第二不同单体的羧基(C)末端基因融合，并降低其与自身寡聚的能力。第二不同单体在存在和不存在标签时寡聚的能力可以如上文所述测量。

肽或多肽标签优选在第二不同单体的氨基(N)末端基因融合，并且与不存在标签时该单体的表达相比减少了该单体的表达。在存在和不存在标签的情况下，可以如上文所述测量第二不同单体的表达。

肽或多肽标签可以是任何长度。肽的长度优选为1，2，3，4或5个氨基酸。多肽的长度优选大于5个氨基酸，例如长度为8，10，12，20，30，40，50或100个氨基酸或更多。肽或多肽可以包含任何天然存在或非天然存在的氨基酸。

标签优选包含两个或更多个连续的精氨酸(R)残基或天冬氨酸(D)残基。标签更优选包含(a)1，2，3，4，5，6，7，8，9，10，11，12，13，14，15，16，17，18，19或20个连续的精氨酸(R)残基或天冬氨酸(D)残基和/或(b)1，2，3，4，5，6，7，，8，9，10，11，12，13，14，15，16，17，18，19或20个连续组氨酸(H)残基。标签最优选包含(a)4，6，8或10个连续的精氨酸(R)残基或天冬氨酸(D)残基和/或(b)6或9个连续的组氨酸(H)残基。

标签优选还包含丝氨酸-甘氨酸(SG)，天冬酰胺-甘氨酸-天冬氨酸-丝氨酸(NGDS)或甘氨酸-天冬氨酸-丝氨酸-甘氨酸(GDSG)。

优选的标签包括但不限于R8SG，D6SG，R6SG，R8，NGDSD6SG，D4SG，R4SG，D4，D6，GDSGD4SG，R4H6，D4H6，D8，R6，D10，R4，D4，D8H6，R8H9，D10H6，R6H6和D6。

第二不同单体优选具有在其氨基(N)末端基因融合的以下标签之一：R8SG，D6SG，R6SG，R8，NGDSD6SG，D4SG，R4SG，D4，D6和GDSGD4SG。第二不同单体优选具有在其羧基(C)末端基因融合的以下标签之一：R4H6，D4H6，D8，R6，D10，R4，D4，D8H6，R8，R8H9，D10H6，R6H6和D6。第二不同单体优选具有在其羧基(C)末端基因融合的下标签之一：D4H6，D8，D10，D4，D8H6，R8，R8H9，D10H6，R6H6和D6。

本发明的方法优选还包括(d)使用标签纯化包含特定化学计量比的两种不同单体的异源寡聚孔。例如，可以使用连续的组氨酸(H)残基(hist标签)纯化特定化学计量比的两种不同单体。例如，如果异源寡聚孔包含8个单体，则第一不同单体与第二不同单体的特定化学计量比为7∶1，并且第二不同单体基因融合到his标签，his标签可以用于纯化含有比例为7∶1的第一和第二不同单体的孔。含有8∶0比例的第一和第二不同单体的孔——如果使用his标签——和his标签的洗脱浓度可以设计成，使得不同单体不以6∶2的比例纯化。

第二不同单体优选基因融合到BasTL序列(SEQ ID NO：26)或其片段。与不存在BasTL序列(SEQ ID NO：26)或其片段相比，这可能增加或降低第二不同单体与其自身寡聚的能力。该片段可以是任何长度，例如40个或更多，50个或更多，60个或更多，70个或更多，80个或更多或90个或更多的氨基酸长度。该片段优选包含在BasTL序列(SEQ ID NO：26)中的连续氨基酸。该片段优选通过从羧基(C)末端缺失20个氨基酸或40个氨基酸形成。BasTL序列或其片段优选在第二不同单体的羧基(C)末端进行基因融合。BasTL序列或其片段优选在第二不同单体的羧基(C)末端进行基因融合，并且将如上定义的标签与第二不同单体分离。例如，第第二不同单体从N到C可以具有以下结构：单体-SEQ ID NO：26-H6。

异源寡聚孔

本发明提供了使用本发明方法制备的异源寡聚孔。上述任何实施方案都适用于本发明的孔。

所述孔具有改善的多核苷酸读取性质，即显示改善的多核苷酸捕获和核苷酸鉴别。特别是，本发明的孔比野生型更容易捕获核苷酸和多核苷酸。此外，本发明的孔显示出增加的电流范围，这使得更容易区分不同的核苷酸，并显示出减少的状态变化，这增加了信噪比。此外，当多核苷酸移动通过从突变体构建的孔时，对电流作出贡献的核苷酸数量减少。这使得更容易鉴定多核苷酸移动通过孔时观察到的电流和多核苷酸序列之间的直接关系。本发明的孔还可以显示出改善的多核苷酸运动，如下面更详细论述的。

本发明的孔也可以在一系列条件下区分不同核苷酸。特别地，所述孔在有利于核酸表征(如测序)的条件下区分各核苷酸。本发明的孔可区分不同核苷酸的程度可通过改变施加的电位、盐浓度、缓冲液、温度和添加剂如脲、甜菜碱和DTT的存在，进行控制。这允许对孔的功能进行微调，特别是在测序时。这将在下面更详细地论述。本发明的孔也可用于从与一个或多个单体的相互作用而不是在核苷酸上通过核苷酸碱基来识别多核苷酸聚合物。

一般来说，异源寡聚孔相比于同源寡聚孔的主要优点是相对于(或不同于)其他单体改变、修改孔的一个或多个单体或使孔的一个或多个单体突变的能力。所述一个或多个单体的任何部分可以发生改变或突变，例如所述一个或多个单体的能形成与多核苷酸相互作用的孔的一部分的部分，或所述一个或多个单体的能形成孔的顶部并与多核苷酸结合蛋白相互作用的部分。通过使孔非对称地(即，在一个或多个单体中不同地)突变，从孔获得的电流信号的范围、形状和水平，以及信噪比，可以不能通过突变所有单体来实现的方式发生改变。

本发明的孔可以被分离、基本被分离、纯化或基本被纯化。如果本发明的孔完全不含任何其他组分，例如脂质或其他孔，则本发明的孔被分离或纯化。如果孔中混有不会干扰其预期用途的载体或稀释剂，则孔基本被分离。例如，如果孔以含有小于10％，小于5％，小于2％或小于1％的其他组分(如三嵌段共聚物、脂质或其他孔)的形式存在，则孔基本被分离或基本被纯化。或者，本发明的孔可以存在于膜中。下面论述合适的膜。

本发明的孔可以单独的孔或单个孔存在。或者，本发明的孔可以存在于两个或更多个孔的同源或异源群体中。

本发明的孔是异源寡聚孔。异源寡聚孔含有足够的用以形成孔的单体。所述单体可以是任何类型。孔通常包含至少3个，至少4个，至少5个，至少6个，至少7个，至少8个，至少9个，至少10个单体，至少11个单体，至少12个单体，至少13个单体或至少14个单体，如3，4，5，6，7，8，9，10，11，12，13或14个单体。孔优选包括七个、八个或九个单体。

如果孔中至少一个单体与其余单体不同，则孔是异质寡聚孔。所述至少一个单体可以以任何方式不同。所述至少一个单体通常在其氨基酸序列的基础上不同于其他单体。所述至少一个单体可以在1，2，3，4，5，10，15，20或更多个氨基酸差异的基础上不同于其余单体。两个、三个或四个单体可与孔中其余单体相同或不同。孔中的所有单体可彼此不同。优选地，只有一个单体与孔中的其余单体不同，即其余单体是相同的。

异源寡聚孔优选衍生自Msp，并且包括具有净负电荷的收缩部分(narrowing)。这种孔在与本申请共同申请的英国申请1502809.5中公开。优选地，只有一个单体不同于孔中的其余单体，并且只有一个单体在其形成收缩部分的区域中一个或多个带负电荷的氨基酸的基础上与其余单体不同。

所述收缩部分具有净负电荷。所述收缩部分通常是孔通道中最窄的部分。孔的收缩部分通常不是帽区域或桶状体区域的一部分。收缩部分的内径(即，通过收缩部分的通道的直径)通常为约25埃或更小，例如约或更小，约或更小，约或更小，约或更小，约或更小或约或更小。

收缩部分有净负电荷。收缩部分在生理pH值下具有净负电荷。当pH在2至12，2.5至11，3至10范围内时，更优选在4至9，5至8.5的范围内时或甚至更优选在6至8或6.5至7.5范围内时，收缩部分通常具有净负电荷。

收缩部分的净电荷可以使用本领域已知的方法测量。例如，收缩部分的净电荷可以使用常规方法在特定pH下计算。

收缩部分通常包含一个或多个带负电荷的氨基酸。收缩部分可以包含任何数量的带负电荷的氨基酸，例如1，2，3，4，5，6，7，8，9，10，11，12或更多个带负电荷的氨基酸。收缩部分优选包含一个、两个、三个或四个带负电荷的氨基酸。带负电荷的氨基酸是具有净负电荷的氨基酸。带负电荷的氨基酸包括但不限于天冬氨酸(D)和谷氨酸(E)。本领域技术人员还可以构思其他带负电荷的氨基酸。例如，半胱氨酸(C)可以用带负电荷的分子修饰。

如果收缩部分含有多于一个的带负电荷的氨基酸，例如两个、三个或四个带负电荷的氨基酸，则它们优选地在不同的单体中，即不全部在相同的单体中。例如，如果有两个带负电荷的氨基酸，则每个氨基酸可以在不同的单体中。如果有三个带负电荷的氨基酸，则它们可以在两个或三个不同的单体中。如果收缩部分含有多于一个的带负电荷的氨基酸，例如两个、三个或四个带负电荷的氨基酸，则它们可以在相同的单体中。

收缩部分中的其余氨基酸优选不带电。不带电的氨基酸通常是不带电荷的、非极性的和/或芳香族的氨基酸。不带电荷的氨基酸、非极性氨基酸和/或芳族氨基酸可以是天然存在的或非天然存在的。它们可以是合成的或修饰的。不带电荷的氨基酸没有净电荷。合适的不带电的氨基酸包括但不限于半胱氨酸(C)，丝氨酸(S)，苏氨酸(T)，甲硫氨酸(M)，天冬酰胺(N)和谷氨酰胺(Q)。非极性氨基酸具有非极性侧链。合适的非极性氨基酸包括但不限于甘氨酸(G)，丙氨酸(A)，脯氨酸(P)，异亮氨酸(I)，亮氨酸(L)和缬氨酸(V)。芳香族氨基酸具有芳香族侧链。合适的芳香族氨基酸包括但不限于组氨酸(H)，苯丙氨酸(F)，色氨酸(W)和酪氨酸(Y)。除了一个或多个带负电荷的氨基酸之外，收缩部分中可以存在任何数目和组合的这些氨基酸。

如果收缩部分包含一个或多个带正电荷的氨基酸，则收缩部分中优选带正电荷的氨基酸比带负电荷的氨基酸更少。收缩部分优选不包含任何带正电荷的氨基酸。带正电荷的氨基酸包括但不限于组氨酸(H)、赖氨酸(K)和精氨酸(R)。

孔中的各单体优选具有大致相同的长度或相同的长度。孔中各单体的桶状体优选具有大致相同的长度或相同的长度。长度可以以氨基酸数量和/或长度单位来测量。桶状体缺失在下面更详细地论述。孔中各单体优选具有从SEQ ID NO：2的位置72至82和/或位置111至121缺失的相同数量的氨基酸。如上所述，可以连接一个或多个单体到标签或BasTL序列或其片段，这使得它比孔中的其他单体长。

在上述所有实施方案中，突变体单体的一个或多个，例如2，3，4，5，6，7，8，9或10个可以如下所述化学修饰。

孔优选包含八个单体，每个单体包含SEQ ID NO：2所示序列或其变体。SEQ ID NO：2是野生型MspA单体。孔优选包含两个不同单体，每个单体包含SEQ ID NO：2所示序列或其变体，其中第一不同单体与第二不同单体的特定化学计量比为7∶1或8∶1，最优选7∶1。

SEQ ID NO：2的变体是具有下述氨基酸序列的多肽：从SEQ ID NO：2的氨基酸序列变化而来并保留其形成孔的能力。所述变体或每个变体可以仅包含与SEQ ID NO：2比较的氨基酸取代，或可以包含氨基酸缺失。变体将在下面更详细地论述。

异源寡聚孔可以包含任何数量的含SEQ ID NO：2的单体，例如含SEQ ID NO：2的1，2，3或4个单体。孔可以包含任何数量的含SEQ ID NO：2的变体的单体，例如含SEQ ID NO：2的变体的1，2，3，4，5，6，7或8个单体。孔中的所有单体优选包含SEQ ID NO：2的变体，即孔中的全部单体与SEQ ID NO：2中所示野生型序列相比已经以某种方式被修饰。合适的修饰在下文论述。

孔可以包括七个第一不同单体和一个第二不同单体，每个第一不同单体包括含有D90N、D91N和D93N的SEQ ID NO：2的变体，所述第二不同单体包括SEQ ID NO：2。

SEQ ID NO：2中的氨基酸83至111对包括含有SEQ ID NO：2的单体的孔的收缩部分有贡献。本发明孔中的收缩部分优选包含每个单体中对应于SEQ ID NO：2的位置83至111的氨基酸。包含SEQ ID NO：2的变体的单体中的氨基酸对应于SEQ ID NO：2中与它们对齐的位置。可以使用任何对齐方法，包括以下论述的任何方法。如果仅对SEQ ID NO：2进行氨基酸取代以产生变体，则变体中与SEQ ID NO：2中位置83至111相对应的氨基酸将编号为83至111，即变体中的位置90对应在SEQ ID NO：2中的位置90。如果缺失SEQ ID NO：2的部分以产生变体，或将氨基酸添加到SEQ ID NO：2以形成变体，则变体中对应于SEQ ID NO：2的位置83至111的氨基酸将不被编号为83至111。举例说明，SEQ ID NO：2的位置71至111(即SEQ IDNO：3)如下所示。SEQ ID NO：2的变体的相应部分——其仅通过缺失位置72和73(来自桶状体)和取代D91N和D93N(粗体)而与SEQ ID NO：2不同——示于SEQ ID NO：4中。

...PWSLGVGINFSYTTPNILIDDGDITAPPFGLNSVITPNLFPGVSISADLGN...(SEQ ID NO：3)

变体中的位置D90，N91和N93(SEQ ID NO：4中下划线部分)分别对应于SEQ ID NO：2中的位置D88，D89和D91(因为SEQ ID NO：2中的氨基酸72和73被从变体中删除)。基于此，技术人员可以确定变体中哪些氨基酸与SEQ ID NO：2中的位置83至111相对应。

收缩部分更优选包含每个单体中对应于SEQ ID NO：2的位置88，90，91，92，93，102，103和105的氨基酸。如果单体或每个单体包含其中仅进行氨基酸取代的SEQ ID NO：2的变体，则收缩部分优选包含变体中位置88，90，91，92，93，102，103和105处的氨基酸。

收缩部分更优选包含每个单体中对应于SEQ ID NO：2的位置90，91，93和105的氨基酸。如果单体或每个单体包含其中仅进行氨基酸取代的SEQ ID NO：2的变体，则收缩部分更优选包含变体中位置90，91，93和105处的氨基酸。

第二不同单体优选通过在与SEQ ID NO：2的位置88，90，91，92，93，102，103和105对应的一个或多个位置处包含带负电荷的氨基酸而与第一不同单体不同。带负电荷的氨基酸可以存在于对应于SEQ ID NO：2的位置88，90，91，92，93，102，103和105的任何数目和组合的位置处。优选的组合在下面更详细地论述。带负电荷的氨基酸如上所述。如果孔中的每个单体包含其中仅进行氨基酸取代的SEQ ID NO：2的变体，则第二不同单体优选通过在位置88，90，91，92，93，102，103和105中的一个或多个处包含带负电荷的氨基酸而与第一不同单体不同。

第二不同单体优选通过在对应于SEQ ID NO：2的位置90，91，93和105的一个或多个位置处包含带负电荷的氨基酸而与第一不同单体不同。带负电荷氨基酸可以在对应于SEQ ID NO：2的位置90，91，93和105的任何数目和组合位置处存在，即(i)90；(ii)91；(iii)93；(iv)105；(v)90和91；(vi)90和93；(vii)90和105；(viii)91和93；(ix)91和105；(x)93和105；(xi)90，91和93；(xii)90，91和105；(xiii)90，93和105；(xiv)91，93和105；或(xv)90，91，93和105。

第二不同单体优选通过在对应于SEQ ID NO：2的以下位置的位置处包含带负电荷的氨基酸而与第一不同单体不同：(x)90；(xi)91；(xii)93；(xiii)90和91；(xiv)90和93；(xv)91和93；(xvi)105；(xvii)90和105；或(xviii)90，91和105。带负电荷的氨基酸如上文所述。如果孔中的每个单体包含其中仅进行氨基酸取代的SEQ ID NO：2的变体，则第二不同单体优选通过在位置90，91，93和105中的一个或多个位置处包含带负电荷的氨基酸而与第一不同单体不同。所述一个或多个单体可以通过在上述(i)至(xv)或(x)至(xviii)中论述的位置90，91，93和105的任何组合处包含带负电荷的氨基酸而不同。

优选地，第二不同单体通过在其收缩部分形成区域中包含一个或多个带负电荷的氨基酸，例如1，2，3或4个带负电荷的氨基酸而与第一不同单体不同。例如，第二不同单体优选通过在对应于SEQ ID NO：2的位置90，91，93和105的一个或多个位置处包含带负电荷的氨基酸而与第一不同单体不同。第二不同单体可以包含与上述(i)至(xv)或(xv)至(xviii)中论述的SEQ ID NO：2的位置90，91，93和105相对应的任何数目和组合的位置处包含带负电荷的氨基酸。

在上述任何实施方案中，第一不同单体优选在与SEQ ID NO：2的位置90和/或91对应的位置处包含不带电的氨基酸。第一不同单体优选在与SEQ ID NO：2的位置90，91和/或93对应的位置处包含不带电的氨基酸。如果孔中的每个单体包含其中仅进行氨基酸取代的SEQ ID NO：2的变体，则第一不同单体优选在位置90和/或91或位置90，91和/或93处包含不带电的氨基酸。可以存在任何不带电荷且上文论述的氨基酸。氨基酸优选为天冬酰胺(N)或谷氨酰胺(Q)。

本发明的优选的孔是这样的孔：其中，

(a)第二不同单体在与SEQ ID NO：2的位置90对应的位置处包含天冬氨酸(D)，第一不同单体在与SEQ ID NO：2的位置90对应的位置处包含天冬酰胺(N)；

(b)第二不同单体在与SEQ ID NO：2的位置91对应的位置处包含天冬氨酸(D)，第一不同单体在与SEQ ID NO：2的位置91对应的位置处包含天冬酰胺(N)；

(c)第二不同单体在与SEQ ID NO：2的位置90和91对应的位置处包含天冬氨酸(D)，第一不同单体在与SEQ ID NO：2的位置90和91对应的位置处包含天冬酰胺(N)；

(d)第二不同单体在与SEQ ID NO：2的位置90对应的位置处包含谷氨酸(E)，第一不同单体在与SEQ ID NO：2的位置90对应的位置处包含天冬酰胺(N)；

(e)第二不同单体在与SEQ ID NO：2的位置91对应的位置处包含谷氨酸(E)，第一不同单体在与SEQ ID NO：2的位置91对应的位置处包含天冬酰胺(N)；

(f)第二不同单体在与SEQ ID NO：2的位置90和91对应的位置处包含谷氨酸(E)，第一不同单体在与SEQ ID NO：2的位置90和91对应的位置处包含天冬酰胺(N)；

(g)第二不同单体在与SEQ ID NO：2的位置90对应的位置处包含天冬氨酸(D)，第一不同单体在与SEQ ID NO：2的位置90对应的位置处包含谷氨酰胺(Q)；

(h)第二不同单体在与SEQ ID NO：2的位置91对应的位置处包含天冬氨酸(D)，第一不同单体在与SEQ ID NO：2的位置91对应的位置处包含谷氨酰胺(Q)；

(i)第二不同单体在与SEQ ID NO：2的位置90和91对应的位置处包含天冬氨酸(D)，第一不同单体在与SEQ ID NO：2的位置90和91对应的位置处包含谷氨酰胺(Q)；

(j)第二不同单体在与SEQ ID NO：2的位置90对应的位置处包含谷氨酸(E)，第一不同单体在与SEQ ID NO：2的位置90对应的位置处包含谷氨酰胺(Q)；

(k)第二不同单体在与SEQ ID NO：2的位置91对应的位置处包含谷氨酸(E)，第一不同单体在与SEQ ID NO：2的位置91对应的位置处包含谷氨酰胺(Q)；

(l)第二不同单体在与SEQ ID NO：2的位置90和91对应的位置处包含谷氨酸(E)，第一不同单体在与SEQ ID NO：2的位置90和91对应的位置处包含谷氨酰胺(Q)；

(m)第二不同单体在与SEQ ID NO：2的位置88对应的位置处包含天冬氨酸(D)，第一不同单体在与SEQ ID NO：2的位置88对应的位置处包含天冬酰胺(N)；

(n)第二不同单体在与SEQ ID NO：2的位置88对应的位置处包含天冬氨酸(D)，第一不同单体在与SEQ ID NO：2的位置88对应的位置处包含谷氨酰胺(Q)；

(o)第二不同单体在与SEQ ID NO：2的位置103对应的位置处包含天冬氨酸(D)，第一不同单体在与SEQ ID NO：2的位置103对应的位置处包含丝氨酸(S)；

(p)第二不同单体在与SEQ ID NO：2的位置105对应的位置处包含天冬氨酸(D)，第一不同单体在与SEQ ID NO：2的位置105对应的位置处包含异亮氨酸(I)；

(q)第二不同单体在与SEQ ID NO：2的位置88和90对应的位置处包含天冬氨酸(D)，第一不同单体在与SEQ ID NO：2的位置88和90对应的位置处包含天冬酰胺(N)；

(r)第二不同单体在与SEQ ID NO：2的位置88和90对应的位置处包含天冬氨酸(D)，第一不同单体在与SEQ ID NO：2的位置88和90对应的位置处包含谷氨酰胺(Q)；

(s)第二不同单体在与SEQ ID NO：2的位置90和103对应的位置处包含天冬氨酸(D)，第一不同单体在与SEQ ID NO：2的位置90和103对应的位置处分别包含天冬酰胺(N)和丝氨酸(S)；

(t)第二不同单体在与SEQ ID NO：2的位置90和103对应的位置处包含天冬氨酸(D)，第一不同单体在与SEQ ID NO：2的位置90和103对应的位置处分别包含谷氨酰胺(Q)和丝氨酸(S)；

(u)第二不同单体在与SEQ ID NO：2的位置90和105对应的位置处包含天冬氨酸(D)，第一不同单体在与SEQ ID NO：2的位置90和105对应的位置处分别包含天冬酰胺(N)和异亮氨酸(I)；

(v)第二不同单体在与SEQ ID NO：2的位置90和105对应的位置处包含天冬氨酸(D)，第一不同单体在与SEQ ID NO：2的位置90和105对应的位置处分别包含谷氨酰胺(Q)和异亮氨酸(I)；

(w)第二不同单体在与SEQ ID NO：2的位置90和93对应的位置处包含天冬氨酸(D)，第一不同单体在与SEQ ID NO：2的位置90和93对应的位置处包含天冬酰胺(N)；

(x)第二不同单体在与SEQ ID NO：2的位置90和93对应的位置处包含天冬氨酸(D)，第一不同单体在与SEQ ID NO：2的位置90和93对应的位置处包含谷氨酰胺(Q)；

(v)第二不同单体在与SEQ ID NO：2的位置91和93对应的位置处包含天冬氨酸(D)，第一不同单体在与SEQ ID NO：2的位置91和93对应的位置处包含天冬酰胺(N)；

(z)第二不同单体在与SEQ ID NO：2的位置91和93对应的位置处包含天冬氨酸(D)，第一不同单体在与SEQ ID NO：2的位置91和93对应的位置处包含谷氨酰胺(Q)；

(aa)第二不同单体在与SEQ ID NO：2的位置93对应的位置处包含天冬氨酸(D)，第一不同单体在与SEQ ID NO：2的位置93对应的位置处包含天冬酰胺(N)；

(ab)第二不同单体在与SEQ ID NO：2的位置93对应的位置处包含天冬氨酸(D)，第一不同单体在与SEQ ID NO：2的位置93对应的位置处包含谷氨酰胺(Q)；

(ac)第二不同单体在与SEQ ID NO：2的位置90对应的位置处包含天冬氨酸(D)，第一不同单体在与SEQ ID NO：2的位置93对应的位置处包含天冬氨酸(D)；

(ad)第二不同单体在与SEQ ID NO：2的位置90和93对应的位置处包含天冬氨酸(D)，第一不同单体在与SEQ ID NO：2的位置93对应的位置处包含天冬氨酸(D)；

(ae)第二不同单体在与SEQ ID NO：2的位置91和93对应的位置处包含天冬氨酸(D)，第一不同单体在与SEQ ID NO：2的位置93对应的位置处包含天冬氨酸(D)；

(af)第二不同单体在与SEQ ID NO：2的位置90对应的位置处包含天冬氨酸(D)，第一不同单体在与SEQ ID NO：2的位置93对应的位置处包含天冬氨酸(D)；

(ag)第二不同单体在与SEQ ID NO：2的位置88和105对应的位置处包含天冬氨酸(D)，第一不同单体在与SEQ ID NO：2的位置88和105对应的位置处包含天冬酰胺(N)和异亮氨酸(I)；或

(ah)第二不同单体在与SEQ ID NO：2的位置88和105对应的位置处包含天冬氨酸(D)，第一不同单体在与SEQ ID NO：2的位置88和105对应的位置处分别包含谷氨酰胺(Q)和异亮氨酸(I)。

在上述(a)至(ah)的任一项中，如果孔中的每个单体包含其中仅进行氨基酸取代的SEQ ID NO：2的变体，则与SEQ ID NO：2中的位置相对应的位置具有与SEQ ID NO：2中的位置相同的数目。例如，如果(a)中，孔中的每个单体包含其中仅进行氨基酸取代的SEQ IDNO：2的变体，则第二不同单体在位置90包含天冬氨酸(D)，第一不同单体在位置90包含天冬酰胺(N)。

SEQ ID NO：2的变体是具有下述氨基酸序列的多肽：从SEQ ID NO：2的氨基酸序列变化而来并且保留其形成孔的能力。可以使用本领域已知的任何方法测定变体形成孔的能力。例如，可以将变体与其他合适的亚基一起插入两亲层中，并且可以确定其寡聚形成孔的能力。本领域已知将亚基插入例如两亲层的膜中的方法。例如，亚基可以在含有三嵌段共聚物膜的溶液中以纯化的形式悬浮，使得其扩散到膜并通过结合到膜并组装成功能状态而被插入。变体可以以各种方式被修饰。

本发明的孔可以包含任何数量的各自包含SEQ ID NO：2的变体的单体，例如各自包含SEQ ID NO：2的变体的1，2，3，4，5，6，7或8个单体。在优选的实施方案中，孔中的所有单体都包含SEQ ID NO：2的变体。

SEQ ID NO：2的变体或每个变体优选在与SEQ ID NO：2的位置G75，G77，L88，D118，Q126，D134和E139相对应的位置中的一个或多个处包含突变或取代。如果孔中的单体或者每个单体包含其中仅进行氨基酸取代的SEQ ID NO：2的变体，则变体或每个变体优选在位置位置G75，G77，L88，D118，Q126，D134和E139中的一个或多个处包含突变或取代。所述变体或者每个变体更优选包含G75S，G77S，L88N，D118R，Q126R，D134R和E139K中的一个或多个。下面更详细地论述这些突变的目的。

刚性(Rigidity)

SEQ ID NO：2的变体或每个变体优选在对应于SEQ ID NO：2中的位置108的位置处包含脯氨酸(P)。如果孔中的单体或每个单体包含其中仅进行氨基酸取代的SEQ ID NO：2的变体，则变体或每个变体优选包含位置108处的P。

桶状体缺失

在SEQ ID NO：2的变体或每个变体中，(a)优选缺失对应于SEQ ID NO：2的位置72至82的2，4，6，8或10个氨基酸，和(b)优选缺失对应于SEQ ID NO：2的位置111至121的2，4，6，8或10个氨基酸。换言之，当形成变体时，优选从SEQ ID NO：2的桶状体区域的下行链(位置72至82)和上行链(位置111至121)缺失2，4，6，8或10个氨基酸。从位置72到82和11至121的氨基酸的缺失改变变体中随后的氨基酸的编号，如上文所述。

从位置72至82缺失的氨基酸数量可以不同于从位置111至121缺失的氨基酸数量。从位置72至82缺失的氨基酸数量优选与从位置111至121缺失的氨基酸数量相同。

可以缺失位置72至82的氨基酸和位置111至121的氨基酸的任何组合。SEQ ID NO：2中桶状体的下行链和上行链中的大多数氨基酸在疏水性和亲水性之间交替。疏水性氨基酸选自色氨酸(W)，亮氨酸(L)，缬氨酸(V)，异亮氨酸(I)，苯丙氨酸(F)和酪氨酸(Y)。亲水性氨基酸选自丝氨酸(S)，甘氨酸(G)，天冬酰胺(N)，脯氨酸(P)和天冬氨酸(D)。疏水性和亲水性氨基酸之间的交替得到形成孔的桶状体的一部分的β片状体。

位置72至82的缺失后剩余的氨基酸(即，2，4，6，8或10个氨基酸已从位置72至82缺失)优选包含3，5，7或9个连续的且在疏水和亲水性之间交替的氨基酸。

位置111至121的缺失后剩余的氨基酸(即，2，4，6，8或10个氨基酸已从位置111至121缺失)优选包含3，5，7或9个连续的且在疏水和亲水性之间交替的氨基酸。

从位置72至82缺失的氨基酸可以对应于从位置111至121缺失的氨基酸，如下表3所示。例如，如果L74和G75从位置72至82缺失，则D118和L119可以从位置111至121缺失。

表3-SEQ ID NO：2的桶状体中的对应氨基酸

从位置72至82缺失的氨基酸的一个或多个位置可不对应于从位置111至121缺失的氨基酸的一个或多个位置，如表3所示。例如，如果L74和G75从位置72至82缺失，A117和D118可以从位置111至121缺失。

从位置72至82中缺失的(全部)氨基酸的位置可不对应于从位置111至121中缺失的(全部)氨基酸的位置，如表3所示。例如，如果L74和G75从位置72至82缺失，I115和S116可以从位置111到121缺失。

从位置72至82中缺失的氨基酸优选是连续的。从位置111至121中缺失的氨基酸优选是连续的。从位置72至82缺失的氨基酸和从位置111至121缺失的氨基酸优选是连续的。

SEQ ID NO：2所示序列的变体或每个变体优选为这样的变体：其中(i)L74，G75，D118和L119已缺失，(ii)G75，V76，A117和D118已缺失，(iii)V76，G77，S116和A117已缺失，(iv)G77，I78，I115和S116已缺失，(v)I78，N79，S114和I115已缺失，(vi)N79，F80，V113和S114已缺失或(vii)F80，S81，G112和V113已缺失。EQ ID NO：2所示的序列的变体或每个变体优选为这样的变体：其中L74，G75，V76，G77，S116，A117，D118和L119已缺失。SEQ ID NO：2所示序列的变体或每个变体优选为这样的变体：其中L74，G75，N79，F80，V113，S114，D118和L119已缺失或L74，G75，F80，S81，G112，V113，D118和L119已缺失。

技术人员可以识别可以根据本发明鉴定可缺失的氨基酸的其他组合。

位置90和91

在SEQ ID NO：2中，氨基酸90和91都是天冬氨酸(D)。如果包含变体的单体对收缩部分的负电荷有贡献，则所述变体可以在与SEQ ID NO：2的位置90和/或91相对应的位置包含带负电荷的氨基酸，例如天冬氨酸(D)或谷氨酸(E)。如果变体在与SEQ ID NO：2的位置90和/或91相对应的位置包含谷氨酸(E)或非天然带负电荷的氨基酸，则它或它们可通过取代而引入。如果单体包含其中仅进行氨基酸取代的SEQ ID NO：2的变体，则所述变体可以在位置90和/或91包含带负电荷的氨基酸，例如天冬氨酸(D)或谷氨酸(E)。

如果包含变体的单体对收缩部分的负电荷没有贡献，则所述变体可以在与SEQ IDNO：2的位置90和/或91对应的位置处不包含带负电荷的氨基酸。变体可以在与SEQ ID NO：2的位置90和/或91对应的位置处包含任何不带电的上文论述的氨基酸。如果单体包含其中仅进行氨基酸取代的SEQ ID NO：2的变体，则所述变体可以在与位置90和/或91对应的位置处不包含带负电荷的氨基酸。变体优选可以在与SEQ ID NO：2的位置90和/或91对应的位置处，或在位置90和/或91处包含丝氨酸(S)，谷氨酰胺(Q)，亮氨酸(L)，甲硫氨酸(M)，异亮氨酸(I)，丙氨酸(A)，缬氨酸(V)，甘氨酸(G)，苯丙酸(F)，色氨酸(W)，酪氨酸(Y)，组氨酸(H)，苏氨酸(T)，精氨酸(R)，赖氨酸(K)，天冬酰胺(N)或半胱氨酸(C)。本发明设想了位置90和91处的这些氨基酸的任何组合。变体优选在与SEQ ID NO：2的位置90和/或91对应的位置处或在位置90和/或91处包含天冬酰胺(N)或谷氨酰胺(Q)。这些氨基酸优选通过取代而在位置90和/或91插入。

位置93

在野生型MspA中，氨基酸93是天冬氨酸(D)。如果包含变体的单体对收缩部分的负电荷有贡献，则所述变体可以在与SEQ ID NO：2的位置93相对应的位置处包含带负电荷的氨基酸，例如天冬氨酸(D)或谷氨酸(E)。如果变体在与SEQ ID NO：2的位置93相对应的位置包含谷氨酸(E)或非天然带负电荷的氨基酸，则它可通过取代而引入。如果孔中的单体包含其中仅进行氨基酸取代的SEQ ID NO：2的变体，则所述变体可以在位置93包含带负电荷的氨基酸，例如天冬氨酸(D)或谷氨酸(E)。

如果包含变体的单体对收缩部分的负电荷没有贡献，则所述变体可以在与SEQ IDNO：2的位置93相对应的位置处不包含带负电荷的氨基酸。如果孔中的单体包含其中仅进行氨基酸取代的SEQ ID NO：2的变体，则所述变体可以在位置93不包含带负电荷的氨基酸，例如天冬氨酸(D)或谷氨酸(E)。变体优可以在与SEQ ID NO：2的位置93相对应的位置处包含不带电的且上文论述的任何氨基酸。变体优选可以在与SEQ ID NO：2的位置93对应的位置处或位置93处包含丝氨酸(S)，谷氨酰胺(Q)，亮氨酸(L)，甲硫氨酸(M)，异亮氨酸(I)，丙氨酸(A)，缬氨酸(V)，甘氨酸(G)，苯丙酸(F)，色氨酸(W)，酪氨酸(Y)，组氨酸(H)，苏氨酸(T)，精氨酸(R)，赖氨酸(K)，天冬酰胺(N)或半胱氨酸(C)。变体优选在与SEQ ID NO：2的位置93相对应的位置处或位置93处包含天冬酰胺(N)。这些氨基酸优选通过取代在位置93插入。

帽形成区域

在SEQ ID NO：2中，氨基酸1至72和122至184形成孔的帽。在这些氨基酸中，V9，Q12，D13，R14，T15，W40，I49，P53，G54，D56，E57，E59，T61，E63，Y66，Q67，I68，F70，P123，I125，Q126，E127，V128，A129，T130，F131，S132，V133，D134，S136，G137，E139，V144，H148，T150，V151，T152，F163，R165，I167，S169，T170和S173面向孔的通道内。

桶状体形成区域

在SEQ ID NO：2中，氨基酸72至82和112至121形成孔的桶状体。在这些氨基酸中，S73，G75，G77，N79，S81，G112，S114，S116，D118和G120面向孔的通道内。S73，G75，G77，N79，S81在下行链中面向内，G112，S114，S116，D118和G120在上行链中面向内。

减少的净负电荷

所述变体或每个变体优选包含一个或多个减少单体的帽形成区域和/或桶状体形成区域中面向内的氨基酸的净负电荷的修饰。变体优选包含两个或更多个减少单体的帽形成区域和/或桶状体形成区域中面向内的氨基酸的净负电荷的修饰。对桶状体形成区域的任何这样的修饰是除了上述本发明的缺失之外。

变体可以包括任何数量的修饰，例如1个或更多，2个或更多，3个或更多，4个或更多，5个或更多，6个或更多，7个或更多，8个或更多，9个或更多，10个或更多，15个或更多，20个或更多，30个或更多，或40个或更多的修饰。

可以通过本领域已知的任何方式来减少净负电荷。净负电荷以不影响突变体单体形成孔的能力的方式降低。这可以如上所述测量。

帽形成区域和/或桶状体形成区域中面向内的氨基酸的净负电荷可以减少。这意味着帽形成区域和/或成桶状体形成区域中面向内的氨基酸比SEQ ID NO：2包含更少的带负电荷的氨基酸和/或包含比SEQ ID NO：2更多的带正电荷的氨基酸。所述一个或多个修饰可以导致在帽形成区域和/或桶状体形成区域中面向内的氨基酸中的净正电荷

可以使用本领域已知的方法测量净电荷。例如，可以使用常规方法计算帽形成区域和/或桶状体形成区域中面向内的氨基酸的净电荷。

所述一个或多个修饰优选是带负电荷的氨基酸的一个或多个缺失。去除一个或多个带负电荷的氨基酸减少了帽形成区域和/或桶状体形成区域内面向内的氨基酸的净负电荷。带负电荷的氨基酸是具有净负电荷的氨基酸。带负电荷的氨基酸包括但不限于天冬氨酸(D)和谷氨酸(E)。从蛋白质(如MspA单体)缺失氨基酸的方法是本领域熟知的。

所述一个或多个修饰优选是用一个或多个带正电荷、不带电荷的、非极性和/或芳香族氨基酸取代一个或多个带负电荷的氨基酸。带正电荷的氨基酸是具有净正电荷的氨基酸。带正电荷的氨基酸可以是天然存在的或非天然存在的。带正电荷的氨基酸可以是合成的或修饰的。例如，具有净正电荷的修饰的氨基酸可以专门设计用于本发明。对氨基酸的许多不同类型的修饰是本领域公知的。

优选的天然存在的带正电荷的氨基酸包括但不限于组氨酸(H)，赖氨酸(K)和精氨酸(R)。H，K和/或R的任何数量和组合可以替代帽形成区域和/或桶状体形成区域中面向内的氨基酸。

不带电荷的氨基酸、非极性氨基酸和/或芳香族氨基酸可以是天然存在的或非天然存在的。它们可以是合成的或修饰的。不带电氨基酸没有净电荷。合适的不带电氨基酸包括但不限于半胱氨酸(C)，丝氨酸(S)，苏氨酸(T)，甲硫氨酸(M)，天冬酰胺(N)和谷氨酰胺(Q)。非极性氨基酸具有非极性侧链。合适的非极性氨基酸包括但不限于甘氨酸(G)，丙氨酸(A)，脯氨酸(P)，异亮氨酸(I)，亮氨酸(L)和缬氨酸(V)。芳香族氨基酸具有芳香侧链。合适的芳族氨基酸包括但不限于组氨酸(H)，苯丙氨酸(F)，色氨酸(W)和酪氨酸(Y)。这些氨基酸的任何数目和组合可以被代入帽形成区域和/或桶状体形成区域中面向内的氨基酸中。

所述一个或多个带负电荷的氨基酸优选用丙氨酸(A)，缬氨酸(V)，天冬酰胺(N)，谷氨酰胺(Q)或甘氨酸(G)取代。优选的取代包括但不限于用A取代D，用V取代D，用N取代D，用Q取代D和用G代替D。

所述一个或多个修饰优选是带正电荷的氨基酸的一个或多个引入。正电荷的引入减少了净负电荷。所述一个或多个带正电荷的氨基酸可以通过添加或取代引入。任何氨基酸可以被带正电荷的氨基酸取代。一个或多个不带电荷的氨基酸、非极性氨基酸和/或芳香族氨基酸可以被一个或多个带正电荷的氨基酸取代。可以引入任何数量的带正电荷的氨基酸。

野生型MspA包含位置126处的极性谷氨酰胺(Q)。所述一个或多个修饰优选减少在与SEQ ID NO：2中的位置126对应的变体中的位置处的净负电荷。如果单体包含其中仅发生氨基酸取代的SEQ ID NO：2的变体，则一个或多个修饰优选减少对应于位置126的变体中的位置处的净负电荷。所述一个或多个修饰优选增加对应于位置126的位置或位置126处的净正电荷。这可以通过用带正电荷的氨基酸替代位置126处或相邻或附近的面向内的氨基酸来实现。所述变体或每个变体优选包含对应于位置126的位置处或位置126处的带正电荷的氨基酸。所述变体或每个变体优选包含对应于SEQ ID NO：2中的位置123，125，127和128的一个或多个位置处或位置123，125，127和128中的一个或多个处的带正电荷的氨基酸。所述变体或每个变体可以包含在对应于位置123，125，127和128的位置处或在位置123，125，127和128中的一个或多个位置处的任何数量和组合的带正电荷的氨基酸。带正电荷的氨基酸可以通过添加或取代而引入。

所述一个或多个修饰优选是引入一个或多个带正电荷的氨基酸，其中和一个或多个带负电荷的氨基酸。负电荷的中和减少了净负电荷。所述一个或多个带正电荷的氨基酸可以通过添加或取代引入。任何氨基酸可以被带正电荷的氨基酸取代。一个或多个不带电荷的氨基酸、非极性氨基酸和/或芳香族氨基酸可以被一个或多个带正电荷的氨基酸取代。可以引入任何数量的带正电荷的氨基酸。该数量通常与被中和的带负电荷的氨基酸的数量相同。

所述一个或多个带正电荷的氨基酸可以在帽形成区域和/或桶状体形成区域中的任何位置处引入，只要它们中和所述一个或多个面向内的带负电荷的氨基酸的负电荷即可。为了有效地中和帽形成区域中的负电荷，在引入的每个带正电荷的氨基酸和其要中和的带负电荷的氨基酸之间的变体中通常有5个或更少的氨基酸。在引入的每个带正电荷的氨基酸和其要中和的带负电荷的氨基酸之间的变体的帽形成区域中，优选具有4个或更少，3个或更少或2个或更少的氨基酸。在引入的每个带正电荷的氨基酸和其要中和的带负电荷的氨基酸之间的变体的帽形成区域中更优选具有两个氨基酸。每个带正电荷的氨基酸最优选在相邻的变体的帽形成区域引到其要中和的带负电荷的氨基酸。

为了有效地中和桶状体形成区域中的负电荷，在引入的每个带正电荷的氨基酸和其要中和的带负电荷的氨基酸之间通常具有5个或更少的面向内的氨基酸。在引入的每个带正电荷的氨基酸和其要中和的带负电荷的氨基酸之间的变体的桶状体形成区域中，优选具有4个或更少，3个或更少或2个或更少的面向内的氨基酸。在引入的每个带正电荷的氨基酸和其要中和的带负电荷的氨基酸之间的变体的桶状体形成区域中，更优选具有一个面向内的氨基酸。每个带正电荷的氨基酸最优选在相邻的变体的桶状体形成区域的面向内的位置引入到其要中和的带负电荷的氨基酸。

SEQ ID NO：2包含在位置118和134处的天冬氨酸(D)和在位置139处的谷氨酸(E)。每个单体中的氨基酸118存在于孔的桶状体内。所述变体或每个变体优选在对应于SEQ IDNO：2的位置114，116，120，123，70，73，75，77和79的一个或多个位置处包含带正电荷的氨基酸。如果孔中的所述单体或每个单体包含其中仅进行氨基酸取代的SEQ ID NO：2的变体，则变体优选在位置114，116，120，123，70，73，75，77和79中的一个或多个处包含带正电荷的氨基酸。这些位置中的一个或多个处的正电荷中和位置118处的负电荷。带正电荷的氨基酸可以存在于任意数目和组合的下述位置处：所述位置对应于位置114，116，120，123，70，73，75，77和79；或存在于位置114，116，120，123，70，73，75，77和79处。氨基酸可以通过添加或取代而引入。

每个单体中的氨基酸134和139是帽的一部分。所述或每个变体优选在对应于SEQID NO：2的位置129，132，136，137，59，61和63的一个或多个位置处包含带正电荷的氨基酸。如果孔中的所述或每个单体包含其中仅进行氨基酸取代的SEQ ID NO：2的变体，则所述或每个变体优选在位置129，132，136，137，59，61和63中的一个或多个处包含带正电荷的氨基酸。这些位置中的一个或多个处的正电荷中和在位置134处的负电荷。带正电荷的氨基酸可以存在于下述任意数目和组合的位置处：所述位置对应于SEQ ID NO：2中的位置129，132，136，137，59，61和63；或存在于位置129，132，136，137，59，61和63处。氨基酸可以通过添加或取代而引入。

变体优选在对应于SEQ ID NO：2的位置137，138，141，143，45，47，49和51的一个或多个位置处或在位置137，138，141，143，45，47，49和51处包含带正电荷的氨基酸。这些位置中的一个或多个处的正电荷中和在位置139处的负电荷。带正电荷的氨基酸可以存在于任何数目和组合的下述位置处：所述位置对应于SEQ ID NO：2中的位置137，138，141，143，45，47，49和51；或存在于位置137，138，141，143，45，47，49和51。氨基酸可以通过添加或取代而引入。

位置118，126，134和139

所述一个或多个修饰优选地减少在对应于SEQ ID NO：2中的位置118，126，134和139的一个或多个位置处或在位置118，126，134和139处的净负电荷。所述一个或多个修饰优选地减少在对应于下述位置的位置处或在下述位置处的净负电荷：SEQ ID NO：2中的118；126；134；139；118和126；118和134；118和139；126和134；126和139；134和139；118，126和134；118，126和139；118，134和139；126，134和139；或118，126，134和139。

所述变体优选在对应于SEQ ID NO：2的位置118，126，134和139的一个或多个位置处或在位置118，126，134和139处不包含天冬氨酸(D)或谷氨酸(E)。所述变体优选在上述对应于位置118，126，134和139的任意组合位置处或在位置118，126，134和139处不包含天冬氨酸(D)或谷氨酸(E)。所述变体更优选在下述位置处包含精氨酸(R)、甘氨酸(G)或天冬酰胺(N)：在与SEQ ID NO：2的位置118，126，134和139对应的一个或多个位置处或在位置118，126，134和139处，例如上述公开的位置118，126，134和139的任意组合位置处。所述变体最优选包含D118R，Q126R，D134R和E139K。

引入或替代天然存在的氨基酸的方法是本领域公知的。例如，通过在多核苷酸编码突变体单体的相关位置处用甲硫氨酸的密码子(ATG)替代精氨酸的密码子(CGT)，甲硫氨酸(M)可以被精氨酸(R)取代。然后可以如上所述表达多核苷酸。

所述一个或多个修饰优选是一个或多个带负电荷的氨基酸的一个或多个化学修饰，其中和带负电荷的氨基酸的负电荷。例如，一个或多个带负电荷的氨基酸可以与碳二亚胺反应。

其他修饰

所述变体优选地包括以下中的一个或多个：

(e)在对应于SEQ ID NO：2的位置75的位置处或在位置75处的丝氨酸(S)；

(f)在对应于SEQ ID NO：2的位置77的位置处或在位置77处的丝氨酸(S)；和

(g)在对应于SEQ ID NO：2的位置88的位置处或在位置88处的天冬酰胺(N)或赖氨酸(K)。

所述变体可包含(e)至(g)的任意数目和组合，包括(e)，(f)，(g)，(e)和(f)，(f)和(g)，(e)和(g)和(e)，(f)和(g)。变体优选包含G75S，G77S和L88N。

所述变体最优选包含(a)D90N，D91N，D93N，D118R，D134R和E139K，(b)L88N，D90N，D91N，D93N，D118R，D134R和E139K，(c)G75S，G77S，L88N，D90N，D91N，D93N，D118R，Q126R，D134R和E139K或(d)G75S，G77S，L88N，D90N，D91N，D118R，Q126R，D134R和E139K。其中，(a)至(d)中所述的位置对应于SEQ ID NO：2中的那些位置或者为所述变体中的位置。

所述变体优选地还包含以下中的一个或多个：

(i)在对应于SEQ ID NO：2的位置89的位置处或在位置89处的苯丙氨酸(F)；

(j)在对应于SEQ ID NO：2的位置95的位置处或在位置95处的谷氨酸(E)和在对应于SEQ ID NO：2的位置98的位置处或在位置98处的赖氨酸(K)；

(l)在对应于SEQ ID NO：2的位置96的位置处或在位置96处的天冬氨酸(D)；

(m)在对应于SEQ ID NO：2的位置102的位置处或在位置102处的甘氨酸(G)；

(n)在对应于SEQ ID NO：2的位置103的位置处或在位置103处的丙氨酸(A)；和

(o)在对应于位置108的位置处或在位108处的丙氨酸(A)、丝氨酸(S)或脯氨酸(P)。

所述变体可以包括(i)至(o)的任何数量和组合。

改善的运动

所述或每个变体优选在与多核苷酸结合蛋白相互作用的变体的一部分中包含一个或多个修饰。当运动由多核苷酸结合蛋白控制时，这改善了目标多核苷酸相对于含变体的孔的运动。这些修饰及其优点在国际申请号PCT/GB2015/051291(公布号为WO 2015/166276)中有论述。所述一个或多个修饰优选提供了目标多核苷酸相对于(例如穿过)含变体的跨膜孔的更一致的运动。所述一个或多个修饰优选地减少了与目标多核苷酸相对于(例如穿过)含变体的跨膜孔的运动相关的噪声。如果目标多核苷酸是双链的，则所述一个或多个修饰优选地减少与互补链相对于模板链的运动相关的噪声和/或提供互补链相对于模板链的更一致的运动。这有利于双链目标多核苷酸的链测序。双链多核苷酸的两条链优选通过桥接部分连接，例如发夹环或发夹环适配器。这将在下面更详细地论述。

可以进行任何数目的修饰，例如2个或更多，3个或更多，5个或更多，10个或更多，15个或更多，20个或更多，25个或更多，30个或更多，50个或更多或者100个或更多的修饰。

与多核苷酸结合蛋白相互作用的变体部分通常在下述位置包含氨基酸：对应于SEQ ID NO：2的位置12，14，48，52，53，54，55，56，57，58，59，60，134，135，136，137，138，139，169和170处，或在位置12，14，48，52，53，54，55，56，57，58，59，60，134，135，136，137，138，139，169和170处。

与多核苷酸结合蛋白相互作用的变体部分优选在下述位置包含氨基酸：

(a)对应于SEQ ID NO：2中的位置12，14，52，54，56，57，59，134，136，138，139和169，或在位置12，14，52，54，56，57，59，134，136，138，139和169处；

(b)SEQ ID NO：2中的位置12，14，56，57，59，134，136，139和169，或在位置12，14，56，57，59，134，136，139和169处；

(c)SEQ ID NO：2中的56，57，59，134，136，139和169，或在位置56，57，59，134，136，139和169处；或

(d)SEQ ID NO：2中的56，57，59，134和139，或在位置56，57，59，134和139处。

可以根据本发明进行任何修饰。所述变体可以包括一个或多个修饰，所述修饰(a)改变电荷，(b)改变空间位置，(c)改变氢键，(d)改变π堆叠，或(e)改变变体中与多核苷酸结合蛋白相互作用的部分的结构。可以改变这些中的任何数量和组合。例如，该方法可以包括进行下述多个修饰之一：{a}；{b}；{c}；{d}；{e}；{a，b}；{a，c}；{a，d}；{a，e}；{b，c}；{b，d}；{b，e}；{c，d}；{c，e}；{d，e}；{a，b，c}；{a，b，d}；{a，b，e}；{a，c，d}；{a，c，e}；{a，d，e}；{b，c，d}；{b，c，e}；{b，d，e}；{c，d，e}；{a，b，c，d}；{a，b，c，e}；{a，b，d，e}；{a，c，d，e}；{b，c，d，e}；或{a，b，c，d，e}。

当修饰变体时，所述一个或多个修饰通常涉及引入或替代一个或多个氨基酸。本发明通常涉及进行一个或多个氨基酸取代。

改变电荷的修饰可涉及增加净负电荷或减少净负电荷。该方法优选包括进行一个或多个减少与多核苷酸结合蛋白相互作用的变体部分的净负电荷的修饰。上文更详细地论述了减少净负电荷的修饰。在优选的实施方案中，所述变体在对应于SEQ ID NO：2的位置56，57，59，134和139的一个或多个位置处或在位置56，57，59，134和139处不包含天冬氨酸(D)或谷氨酸(E)。变体优选包含以下中的一个或多个：(a)D56N或D56R，(b)E57N或E57R，(c)E59N或E59R，(d)D134N或D134R，和(e)E139N，E139R或E139K。变体可以包括这些修饰中的任何数量和组合。例如，单体中的一个或多个可以包括{a}；{b}；{c}；{d}；{e}；{a，b}；{a，c}；{a，d}；{a，e}；{b，c}；{b，d}；{b，e}；{c，d}；{c，e}；{d，e}；{a，b，c}；{a，b，d}；{a，b，e}；{a，c，d}；{a，c，e}；{a，d，e}；{b，c，d}；{b，c，e}；{b，d，e}；{c，d，e}；{a，b，c，d}；{a，b，c，e}；{a，b，d，e}；{a，c，d，e}；{b，c，d，e}；或{a，b，c，d，e}。

改变空间位置的修饰可涉及增加或减少氨基酸残基的大小，例如通过置换。例如，可通过引入一个或多个大体积的氨基酸，例如苯丙氨酸(F)，色氨酸(W)，酪氨酸(Y)和组氨酸(H)，来增加空间位置。

改变氢键的修饰可涉及引入或替换一个或多个可进行氢键键合的氨基酸。

改变π堆叠的修饰可涉及引入或替换通过离域电子π系统而相互作用的氨基酸。例如，可通过引入一个或多个芳香族氨基酸，例如苯丙氨酸(F)，色氨酸(W)，酪氨酸(Y)和组氨酸(H)，来增加π堆叠。

变体

除了上述特定突变之外，变体可以包括其他突变。在SEQ ID NO：2的氨基酸序列的整个长度上，基于氨基酸相似性或同一性，变体将优选与该序列至少50％同源。更优选地，基于氨基酸相似性或同一性，所述变体可以与SEQ ID NO：2的氨基酸序列在整个序列上至少55％，至少60％，至少65％，至少70％，至少75％，至少80％，至少85％，至少90％且更优选至少95％，97％或99％同源。在100或更多个例如125，150，175或200或更多个连续氨基酸的延伸段上，可以具有至少80％，例如至少85％，90％或95％的氨基酸相似性或同一性(“严格同源性”)。

可使用本领域的标准方法确定同源性。例如，UWGCG软件包提供了可用于计算同源性的BESTFIT程序，例如使用其默认设置(Devereux等人(1984)Nucleic AcidsResearch12，p387-395)。PILEUP和BLAST算法可用于计算同源性或比对序列(line upsequence)(例如识别等同残基或相应序列(通常基于其默认设置))，例如Altschul S.F.(1993)J Mol Evol 36：290-300；Altschul，S.F et al(1990)J Mol Biol 215：403-10中所述。用于进行BLAST分析的软件可通过国家生物技术信息中心(National Center forBiotechnology Information)

(http：//www.ncbi.nlm.nih.gov/)公开获得。

可以使用配对识别(pairwise identity)或通过应用例如BLOSUM62的评分矩阵，并转换为等同身份来测量相似性。由于它们代表功能变化而不是演变的变化(evolvedchange)，因此在确定同源性时，故意突变的位置将被掩盖。通过对蛋白质序列的综合数据库使用例如PSIBLAST的位置特异性评分矩阵，可以更灵敏地确定相似性。可以使用反映氨基酸化学物理性质而不是随进化的时间尺度的取代频率(例如电荷)的不同评分矩阵。

SEQ ID NO：2是野生型MspA单体的成熟形式。与MspA相比，变体可包含MspB，C或D单体中的任何突变。MspB，C和D的成熟形式示于SEQ ID NO：5至7中。特别地，变体可以包含存在于MspB中的以下取代：A138P。变体可以包含存在于MspC中的一个或多个以下取代：A96G，N102E和A138P。所述变体可以包含存在于MspD中的一个或多个以下突变：G1，L2V，E5Q，L8V，D13G，W21A，D22E，K47T，I49H，I68V，D91G，A96Q，N102D，S103T，V104I，S136K和G141A的缺失。所述变体可以包含来自MspB、C和D的一个或多个突变和取代的组合。

可以对SEQ ID NO：2中除上述论述的那些氨基酸序列之外的氨基酸序列进行氨基酸取代，例如多达1，2，3，4，5，10，20或30个取代。保守取代可将氨基酸用具有相似化学结构、相似化学性质或相似侧链体积的其他氨基酸替换。引入的氨基酸可与其所替代的氨基酸具有相似的极性、亲水性、疏水性、碱性、酸性、中性或电荷。或者，保守取代可以引入另一种芳香族或脂肪族的氨基酸来代替之前存在的芳香族或脂肪族氨基酸。保守的氨基酸变化是本领域公知的，并且可以根据下表4中限定的20个主要氨基酸的性质进行选择。当氨基酸具有相似的极性时，这也可以参考表5中氨基酸侧链的亲水性大小来确定。

表4-氨基酸的化学性能

表5-亲水性大小

SEQ ID NO：2的氨基酸序列的一个或多个氨基酸残基可以另外从上述多肽中缺失。可以缺失多达1，2，3，4，5，10，20或30或更多个残基。

所述变体可以包括SEQ ID NO：2的片段。这类片段保留有形成孔的活性。各片段可以至少为50、100、150或200个氨基酸长度。这类片段可用于产生孔。片段优选含有SEQ IDNO：2的形成孔的结构域。各片段必须包括对应于SEQ ID NO：2的位置88，90，91，105，118和134的残基之一。通常，各片段包括SEQ ID NO：2的残基88，90，91，105，118和134的全部。

一个或多个氨基酸可以替代地或另外地添加到上述的多肽。可以在SEQ ID NO：2或其多肽变体或其片段的氨基酸序列的氨基末端或羧基末端提供一延伸。所述延伸可以是非常短的，例如1至10个氨基酸长度。替代地，所述延伸可以更长，例如多达50或100个氨基酸。载体蛋白可以根据本发明融合到氨基酸序列。其他融合蛋白在下文更详细地论述。

如上所述，变体是具有下述氨基酸序列的多肽：其由SEQ ID NO：2的氨基酸序列变化而来并保留有其形成孔的能力。变体通常含有SEQ ID NO：2的负责形成孔的区域。含有β-桶状体的Msp的形成孔的能力由每个亚基中的β-片状体提供。SEQ ID NO：2的变体通常含有SEQ ID NO：2中形成β-片状体的区域。对SEQ ID NO：2中形成β-片状体的区域进行一个或多个修饰，只要所得变体保留其形成孔的能力即可。SEQ ID NO：2的变体优选在其α-螺旋和/或环形区域中包括一个或多个修饰，例如取代、添加或缺失。

可以修饰单体以帮助其鉴定或纯化，例如通过添加链霉亲和素标签或通过添加信号序列来促进其从单体不天然含有这种序列的细胞分泌。下面更详细地论述其他合适的标签。单体可用显示标记物(revealing label)标记。显示标记物可以是允许检测单体的任何合适的标记物。合适的标记物如下所述。

单体也可以使用D-氨基酸制备。例如，单体可以包含L-氨基酸和D-氨基酸的混合物。这是制备这种蛋白质或肽的领域中常规的。

所述单体通常包含一个或多个特定修饰以促进核苷酸鉴别。所述单体也可以含有其他非特异性修饰，只要它们不影响孔形成即可。许多非特异性侧链修饰是本领域已知的，并且可对衍生自Msp的单体的侧链进行这类修饰。这类修饰包括例如通过与醛进行反应然后用NaBH₄还原而进行的氨基酸的还原烷基化，用乙酰亚胺酸甲酯(methylacetimidate)进行的脒基化，或用乙酸酐进行的酰化。

所述单体可以使用本领域已知的标准方法制备。单体可以合成制备或通过重组方式制备。例如，所述单体可以通过体外翻译和转录(IVTT)合成。用于制备孔和单体的适宜方法在国际申请号PCT/GB09/001690(公布号为WO 2010/004273)，PCT/GB09/001679(公布号为WO 2010/004265)或PCT/GB10/000133(公布号为WO 2010/086603)中有论述。将孔插入膜中的方法是本领域已知的。

化学修饰

在一些实施方案中，单体经化学修饰。一旦单体根据本发明形成了异源寡聚孔，所述单体通常被化学改性。所述单体可以任何方式和在任何位置进行化学修饰。所述单体优选通过将分子连接到一个或多个半胱氨酸(半胱氨酸连接)，将分子连接到一个或多个赖氨酸，将分子连接到一个或多个非天然氨基酸，表位的酶修饰或末端的修饰而进行化学修饰。用于进行这种修饰的合适方法是本领域公知的。所述单体可以通过任何分子的连接而进行化学修饰。例如，所述单体可以通过连接染料或荧光团而进行化学修饰。

在另一个实施方案中，所述单体可以连接到多核苷酸结合蛋白。这形成了可用于本发明的测序方法的模块化测序系统。多核苷酸结合蛋白在下面论述。

多核苷酸结合蛋白优选共价连接到单体上。蛋白质可以使用本领域已知的任何方法共价连接到单体上。单体和蛋白质可以化学融合或基因融合。如果整个构建体由单个多核苷酸序列表达，则单体和蛋白质进行基因融合。单体与多核苷酸结合蛋白的基因融合在国际申请号PCT/GB09/001679(公布号为WO 2010/004265)。

如果多核苷酸结合蛋白通过半胱氨酸连接体连接，则一个或多个半胱氨酸优选已通过取代引入单体中。所述单体可以在对应于SEQ ID NO：2的位置10至15，51至60，136至139和168至172的一个或多个位置或在位置10至15，51至60，136至139和168至172处的半胱氨酸残基。这些位置存在于在同系物中具有低保守性——表明可以耐受突变或插入——的环形区域中。因此，它们适用于连接多核苷酸结合蛋白。半胱氨酸残基的反应性可以通过如上所述的修饰来增强。

多核苷酸结合蛋白可以直接连接到单体或通过一个或多个连接体连接到单体。该分子可以使用国际申请号PCT/GB10/000132(公布号WO 2010/086602)中描述的杂交连接体连接到单体上。或者，可以使用肽连接体。肽连接体是氨基酸序列。肽连接体的长度、柔韧性和亲水性通常被设计成使其不影响所述单体和分子的功能。优选的柔性肽连接体是2至20个，例如4，6，8，10或16个丝氨酸和/或甘氨酸的延伸段。更优选的柔性连接体包括(SG)₁，(SG)₂，(SG)₃，(SG)₄，(SG)₅和(SG)₈，其中S是丝氨酸，G是甘氨酸。优选的刚性连接体是2至30个，例如4，6，8，16或24个脯氨酸的延伸段。更优选的刚性连接体包括(P)₁₂，其中P是脯氨酸。

所述单体可以用分子适配器和多核苷酸结合蛋白进行化学修饰。

半胱氨酸残基的反应性可以通过修饰相邻残基来增强。例如，侧翼(flanking)精氨酸，组氨酸或赖氨酸残基的碱基将半胱氨酸硫醇基团的pKa改变为更具反应性的S-基团的pKa。半胱氨酸残基的反应性可以通过硫醇保护基如dTNB保护。这些保护基可以在连接体连接之前与单体的一个或多个半胱氨酸残基反应。

所述分子(用它对单体进行化学修饰)可以直接连接到所述单体，或通过连接体连接到所述单体，如国际申请号PCT/GB09/001690(公布号WO 2010/004273)，PCT/GB09/001679(公布号WO 2010/004265)或PCT/GB10/000133(公布号WO 2010/086603)中所公开。

本文所述的任何蛋白质，例如本发明的单体和孔可以通过下述进行修饰以帮助其鉴定或纯化：例如通过添加组氨酸残基(his标签)、天冬氨酸残基(asp标签)、链霉亲和素标签、旗帜标签、SUMO标签、GST标签或MBP标签，或者通过添加信号序列以促进它们从其中多肽不天然含有这类序列的细胞分泌。引入遗传标签的替代方法是将标签化学反应到蛋白质上的天然或工程位置上。这的一个实例是使凝胶转移试剂与在蛋白质外部工程化的半胱氨酸反应。这已经被证明是一种分离溶血素异源寡聚物的方法(Chem Biol.1997 Jul；4(7)：497-505)。

本文所述的任何蛋白质，例如本发明的单体和孔，可以用显示标记物标记。显示标记物可以是允许检测蛋白质的任何合适的标记物。合适的标记物包括但不限于荧光分子、放射性同位素，例如，¹²⁵I，³⁵S，酶，抗体，抗原，多核苷酸和配体如生物素。

本文所述的任何蛋白质，例如本发明的单体或孔，可以通过合成或通过重组方法制备。例如，蛋白质可以通过体外翻译和转录(IVTF)合成。蛋白质的氨基酸序列可以被修饰以包括非天然存在的氨基酸或增加蛋白质的稳定性。当通过合成方法制备蛋白质时，可以在制备过程中引入这种氨基酸。蛋白质也可在合成或重组制备之后被改变。

也可以使用D-氨基酸制备蛋白质。例如，蛋白质可以包含L-氨基酸和D-氨基酸的混合物。这是制备这种蛋白质或肽的领域中常规的。

蛋白质还可以含有其他非特异性修饰，只要它们不干扰蛋白质的功能即可。许多非特异性侧链修饰是本领域已知的，并且可以制备成蛋白质的侧链。这样的修饰包括例如通过与醛反应然后用NaBH₄还原反应进行氨基酸的还原烷基化，用乙酰亚胺酸甲酯进行脒基化，或用乙酸酐进行酰化。

本文描述的任何蛋白质，包括本发明的单体和孔，可以使用本发明的方法或本领域已知的标准方法来制备。可以使用本领域的标准方法导出和复制编码蛋白质的多核苷酸序列。编码蛋白质的多核苷酸序列可以使用本领域的标准技术在细菌宿主细胞中表达。蛋白质可以通过从重组表达载体原位表达多肽而在细胞中产生。表达载体可任选携带可诱导启动子以控制多肽的表达。这些方法在Sambrook，J.和Russell，D.(2001).MolecularCloning：A Laboratory Manual，3rd Edition.Cold Spring Harbor Laboratory Press，Cold Spring Harbor，NY.中有描述。

蛋白质可以从产生蛋白质的生物体或重组表达后通过任何蛋白质液相色谱系统在纯化后进行大规模制备。典型的蛋白质液相色谱系统包括FPLC，AKTA系统，Bio-Cad系统，Bio-Rad BioLogic系统和Gilson HPLC系统。

构建体

本发明的异源寡聚孔可以包括含有两个或更多个共价连接的单体的第一不同构建体，和含有两个或更多个共价连接的单体的第二不同构建体。上述任何构造实施方案均适用于本发明的孔。

多核苷酸表征

本发明提供了表征目标多核苷酸的方法。该方法包括测量目标多核苷酸的一个或多个特征。目标多核苷酸也可称为模板多核苷酸或感兴趣的多核苷酸。

多核苷酸

多核苷酸，例如核酸，是包含两个或更多个核苷酸的大分子。所述多核苷酸或核酸可以包括任何核苷酸的任何组合。核苷酸可以是天然存在的或人造的。多核苷酸中的一个或多个核苷酸可被氧化或甲基化。多核苷酸中的一个或多个核苷酸可被损坏。例如，多核苷酸可以包含嘧啶二聚体。这种二聚体通常与紫外线造成的损伤相关，并且是皮肤黑素瘤的主要原因。多核苷酸中的一个或多个核苷酸可被修改，例如用标记物或标签修改。合适的标记物如下所述。多核苷酸可以包含一个或多个间隔区(spacer)。

核苷酸通常含有核碱基、糖和至少一个磷酸基。核碱基和糖形成核苷。

核碱基通常是杂环的。核碱基包括但不限于嘌呤和嘧啶，更具体地包括腺嘌呤(A)，鸟嘌呤(G)，胸腺嘧啶(T)，尿嘧啶(U)和胞嘧啶(C)。

糖通常是戊糖。核苷酸糖包括但不限于核糖和脱氧核糖。糖优选为脱氧核糖。

多核苷酸优选包含以下核苷：脱氧腺苷(dA)，脱氧尿苷(dU)和/或胸苷(dT)，脱氧鸟苷(dG)和脱氧胞苷(dC))。

核苷酸通常是核糖核苷酸或脱氧核糖核苷酸。核苷酸通常含有一磷酸盐、二磷酸盐或三磷酸盐。核苷酸可以包含多于三个的磷酸盐，例如4或5个磷酸盐。磷酸盐可以连接在核苷酸的5′或3′侧。核苷酸包括但不限于单磷酸腺苷(AMP)，单磷酸鸟苷(GMP)，单磷酸胸苷(TMP)，单磷酸尿苷(UMP)，单磷酸5-甲基胞苷，单磷酸5-羟甲基胞苷，单磷酸胞苷(CMP))，环状单磷酸腺苷(cAMP)，环状单磷酸鸟苷(cGMP)，单磷酸脱氧腺苷(dAMP)，单磷酸脱氧鸟苷(dGMP)，单磷酸脱氧胸苷(dTMP)，单磷酸脱氧尿苷(dUMP)，单磷酸脱氧胞苷(dCMP)和脱氧甲基单磷酸胞苷。核苷酸优选选自AMP，TMP，GMP，CMP，UMP，dAMP，dTMP，dGMP，dCMP和dUMP。

核苷酸可以是非碱性的(即缺乏核碱基)。核苷酸也可以缺少核碱基和糖(即C3间隔区)。

多核苷酸中的核苷酸可以以任何方式彼此连接。核苷酸通常通过它们的糖和磷酸基团连接，如在核酸中一样。核苷酸可以通过其核碱基连接，如嘧啶二聚体中一样。

多核苷酸可以是单链的或双链的。多核苷酸的至少一部分优选是双链的。

多核苷酸可以是核酸，例如脱氧核糖核酸(DNA)或核糖核酸(RNA)。多核苷酸可以包含与一条DNA链杂交的一条RNA链。多核苷酸可以是本领域已知的任何合成核酸，例如肽核酸(PNA)，甘油核酸(GNA)，苏糖核酸(TNA)，锁定核酸(LNA)或其他具有核苷酸侧链的合成聚合物。PNA骨架由通过肽键连接的重复的N-(2-氨基乙基)-甘氨酸单元组成。GNA骨架由通过磷酸二酯键连接的重复的二醇单元组成。TNA骨架由通过磷酸二酯键连接在一起的重复的苏糖组成。LNA由如上所述的核糖核苷酸形成，其具有连接核糖部分中的2′氧和4′碳的额外的桥。

多核苷酸最优选为核糖核酸(RNA)或脱氧核糖核酸(DNA)。

多核苷酸可以是任何长度。例如，多核苷酸可以是至少10个，至少50个，至少100个，至少150个，至少200个，至少250个，至少300个，至少400个或至少500个核苷酸或核苷酸对的长度。多核苷酸可以是1000或更多个核苷酸或核苷酸对，5000或更多个核苷酸或核苷酸对的长度或100000或更多个核苷酸或核苷酸对的长度。

可以研究任何数量的多核苷酸。例如，本发明的方法可涉及表征2，3，4，5，6，7，8，9，10，20，30，50，100或更多个核苷酸。如果两个或更多个多核苷酸被表征，则它们可以是不同的多核苷酸或相同多核苷酸的两种情形。

多核苷酸可以是天然存在的或人造的。例如，所述方法可以用于验证制造的寡核苷酸的序列。所述方法通常在体外进行。

样品

每个分析物通常存在于任何合适的样品中。本发明通常针对已知含有或怀疑含有分析物的两个或更多个样品实施。替换地，本发明可以对两个或更多个样品实施，以确认对已知或预期存在于样品中的两个或更多个分析物的鉴别。

所述样品可以是生物样品。本发明可以使用至少一种从任何生物体或微生物获得或提取的样品体外进行。所述生物体或微生物通常是古菌(archaeal)、原核的或真核的，并且通常属于以下五界之一：植物界、动物界、真菌、原核生物界和原生生物。本发明针对从任何病毒中获得或提取的样品在体外实施。所述样品优选是液体样品。样品通常包括患者的体液。所述样品可以是尿液、淋巴液、唾液、粘液或羊水，但优选血液、血浆或血清。通常，所述样品来源于人，但替代地，其可以来自其他哺乳动物，如来自商业上养殖的动物如马、牛、羊、鱼、鸡或猪，或者可以是宠物如猫或狗。或者，第一样品和/或第二样品可以是植物来源的，例如从商业作物获得的样品，例如谷类、豆类、水果或蔬菜，如小麦、大麦、燕麦、油菜、玉米、大豆、大米、大黄、香蕉、苹果、西红柿、土豆、葡萄、烟草、菜豆、扁豆、甘蔗、可可、棉花。

样品可以是非生物样品。非生物样品优选为流体样品。非生物样品的实例包括手术液，饮用水、海水或河水等水，以及实验室试验用试剂。

样品通常在本发明使用之前进行处理，例如通过离心，或经由膜过滤掉不想要的分子或细胞如红细胞。样品可以在取出后立即测量。样品也可以典型地在测定之前储存，优选低于-70℃。

表征

该方法可涉及测量多核苷酸的二个、三个、四个或五个或更多个特征。一个或多个特征优选选自(i)多核苷酸的长度，(ii)多核苷酸的同一性，(iii)多核苷酸的序列，(iv)二核苷酸的二级结构，和(v)多核苷酸是否被修饰。可以根据本发明测量(i)至(v)的任何组合，例如{i}，{ii}，{iii}，{iv}，{v}，{i，ii}，{i，iii}，{i，iv}，{i，v}，{ii，iii}，{ii，iv}，{ii，v}，{iii，iv}，{iii，v}，{iv，v}，{i，ii，iii}，{i，ii，iv}，{i，ii，v}，{i，iii，iv}，{i，iii，v}，{i，iv，v}，{ii，iii，iv}，{ii，iii，v}，{ii，iv，v}，{iii，iv，v}，{i，ii，iii，iv}，{i，ii，iii，v}，{i，ii，iv，v}，{i，iii，iv，v}，{ii，iii，iv，v}或{i，ii，iii，iv，v}。可以测量与第二多核苷酸相比而言的第一多核苷酸的(i)至(v)的不同组合，包括以上所列的任何组合。

对于(i)，多核苷酸的长度可以例如通过确定多核苷酸与孔之间的相互作用的次数或多核苷酸与孔之间的相互作用的持续时间来测量。

对于(ii)，多核苷酸的同一性可以以多种方式测量。多核苷酸的同一性可以结合多核苷酸序列的测量来测量或不结合多核苷酸序列的测量来测量。前者较简单；对多核苷酸进行测序，从而识别出。后者可以通过几种方式完成。例如，可以测量多核苷酸中特定基序的存在(不测量多核苷酸的其余序列)。或者，该方法中可以测量特定电和/或光信号来识别来自特定来源的多核苷酸。

对于(iii)，可以如前所述确定多核苷酸的序列。Stoddart D等人，Proc NatlAcad Sci，12；106(19)：7702-7，Lieberman KR等人，J Am Chem Soc.2010；132(50)：17961-72和国际申请WO 2000/28312中描述了合适的测序方法，特别是使用电测量的测序方法。

对于(iv)，所述二级结构可以以各种方式测量。例如，如果该方法涉及电测量，则可以使用停留时间的变化或流过孔的电流的变化来测量二次结构。这可以区分单链和双链多核苷酸的区域。

对于(v)，可以测量是否存在任何修饰。该方法优选包括通过甲基化、氧化、损伤、用一个或多个蛋白质或用一个或多个标记物、标签或间隔区，来确定多核苷酸是否被修饰。特异性修饰将导致与孔的特异性相互作用，其可以使用下述方法测量。例如，可以基于在甲基胞嘧啶与每个核苷酸相互作用期间流过孔的电流，将甲基胞嘧啶与胞嘧啶区别开。

目标多核苷酸与本发明的异源寡聚孔接触。孔通常存在于膜中。合适的膜在下面论述。该方法可以使用适用于研究膜/孔系统——其中孔存在于膜中——的任何设备来进行。该方法可以使用适用于跨膜孔感测的任何设备来进行。例如，该设备包括含有水性溶液的腔室和将所述腔室分为两个部分的屏障。所述屏障通常具有形成包含所述孔的膜的孔洞。或者，所述屏障形成存在有所述孔的所述膜。

该方法可以使用在国际申请号PCT/GB08/000562(WO 2008/102120)中描述的设备来实施。

可以进行各种不同类型的测量。这包括但不限于：电测量和光学测量。可能的电测量包括：电流测量，阻抗测量，隧道测量(tunnelling measurement)(Ivanov AP等人，NanoLett.2011 Jan 12；11(1)：279-85)和FET测量(国际申请WO 2005/124888)。光学测量可以与电测量结合(Soni GV等人，Rev Sci Instrum.2010 Jan；81(1)：014301)。测量可以是跨膜电流测量，例如流经孔的离子电流的测量。

可以使用标准单通道记录设备进行电测量，如Stoddart D等人，Proc Natl AcadSci，12；106(19)：7702-7，Lieberman KR等人，J Am Chem Soc.2010；132(50)：17961-72和国际申请WO 2000/28312中所述。或者，可以使用多通道系统进行电测量系统，例如国际申请WO 2009/077734和国际申请WO 2011/067559中所述。

该方法优选以跨膜施加的电位进行。所施加的电位可以是电压电位。或者，施加的电位可以是化学电位。这方面的一个例子是跨膜使用盐梯度，所述膜例如两亲层。在Holden等人，J Am Chem Soc.2007 Jul 11；129(27)：8650-5中公开了盐梯度。在某些情况下，使用多核苷酸相对于孔移动时通过孔的电流来估计或确定多核苷酸的序列。这就是链测序。

该方法可以包括测量多核苷酸相对于孔移动时通过孔的电流。因此，该方法中使用的设备还可以包括能够穿过膜和孔施加电位和测量电信号的电路。该方法可以使用膜片钳或电压钳进行。这些方法优选涉及使用电压钳。

本发明的方法可以包括测量多核苷酸相对于孔移动时通过该孔的电流。测量通过跨膜蛋白孔的离子电流的合适条件是本领域已知的并且在实施例中公开。该方法通常通过跨膜和孔施加电压而进行。所使用的电压通常为+5V至-5V，例如从+4V至-4V，+3V至-3V或+2V至-2V。所使用的电压通常为-600mV至+600mV或-400mV至+400mV。所使用的电压优选在具有选自-400mV，-300mV，-200mV，-150mV，-100mV，-50mV，-20mV和0mV的下限和独立地选自+10mV，+20mV，+50mV，+100mV，+150mV，+200mV，+300mV和+400mV的上限的范围内。所使用的电压更优选在100mV至240mV的范围内，最优选在120mV至220mV的范围内。通过使用增加的施加电位，可以增加通过孔对不同核苷酸之间的识别。

该方法通常在任何电荷载体例如金属盐，例如碱金属盐，卤化物盐，如氯化物盐，如碱金属氯化物盐的存在下进行。电荷载体可以包括离子液体或有机盐，例如四甲基氯化铵、三甲基苯基氯化铵、苯基三甲基氯化铵或1-乙基-3-甲基咪唑鎓氯化物。在上述示例性设备中，盐存在于腔室内的水性溶液中。通常使用氯化钾(KCl)、氯化钠(NaCl)、氯化铯(CsCl)或亚铁氰化钾和铁氰化钾的混合物。KCl、NaCl和亚铁氰化钾和铁氰化钾的混合物是优选的。跨膜的电荷载体可以是不对称的。例如，在膜的每一侧上，电荷载体的类型和/或浓度可以不同。

盐浓度可处于饱和状态。盐浓度可以为3M或更低，通常为0.1至2.5M，0.3至1.9M，0.5至1.8M，0.7至1.7M，0.9至1.6M或1M至1.4M。盐浓度优选为150mM至1M。该方法优选使用至少0.3M的盐浓度进行，例如至少0.4M，至少0.5M，至少0.6M，至少0.8M，至少1.0M，至少1.5M，至少2.0M，至少2.5M或至少3.0M。高的盐浓度提供高的信噪比并允许在正常电流波动的背景下，识别出代表核苷酸存在的电流。

该方法通常在存在缓冲液的情况下进行。在上述示例性设备中，缓冲液存在于腔室中的水性溶液中。本发明的方法中可以使用任何缓冲液。通常，缓冲液是磷酸盐缓冲液。其他合适的缓冲液是HEPES和Tris-HCl缓冲液。该方法通常在4.0至12.0，4.5至10.0，5.0至9.0，5.5至8.8，6.0至8.7或7.0至8.8或7.5至8.5的pH下进行。所使用的pH优选为约7.5。

该方法可以在0℃至100℃，15℃至95℃，16℃至90℃，17℃至85℃，18℃至80℃，19℃至70℃，或20℃至60℃进行。该方法通常在室温下进行。所述方法任选地在支持酶功能的温度下进行，例如约37℃。

多核苷酸结合蛋白

步骤(a)优选包括使多核苷酸与多核苷酸结合蛋白接触，使得所述蛋白控制多核苷酸通过孔的运动。

更优选地，该方法包括(a)使多核苷酸与本发明的孔和多核苷酸结合蛋白接触，使得所述蛋白控制多核苷酸通过孔的运动，和(b)当多核苷酸相对于孔移动时获取一个或多个测量值，其中测量值表示多核苷酸的一个或多个特征，从而表征多核苷酸。

多核苷酸结合蛋白可以是能够结合多核苷酸并控制其通过孔的运动的任何蛋白质。确定蛋白质是否结合到多核苷酸时本领域中较简单的。所述蛋白质通常与多核苷酸相互作用并且修饰多核苷酸的至少一种性质。该蛋白质可以通过将多核苷酸裂解以形成各单个的核苷酸或短链的核苷酸，例如二核苷酸或三核苷酸，来修饰所述多核苷酸。蛋白质可以通过将多核苷酸定向到或将其移动到特定的位置，即控制其运动，来修饰多核苷酸。

多核苷酸结合蛋白优选衍生自多核苷酸处理酶。多核苷酸处理酶是能够与多核苷酸相互作用并修饰多核苷酸的至少一种性质的多肽。该酶可以通过将多核苷酸裂解以形成各单个的核苷酸或短链的核苷酸，例如二核苷酸或三核苷酸，来修饰所述多核苷酸。酶可以通过将多核苷酸定向到或将其移动到特定位置来修饰所述多核苷酸。多核苷酸处理酶不需要显示酶活性，只要其能够结合多核苷酸并控制其通过孔的运动即可。例如，该酶可以被修饰以除去其酶活性，或者可以在防止其作为酶起作用的条件下使用。这类条件将在下面更详细地论述。

多核苷酸处理酶优选衍生自溶核酶。在酶的构建体中使用的多核苷酸处理酶更优选地衍生自任何酶分类(EC)组3.1.11，3.1.13，3.1.14，3.1.15，3.1.16，3.1.21，3.1.22，3.1.25，3.1.26，3.1.27，3.1.30和3.1.31中的成员。该酶可以是国际申请号PCT/GB10/000133(公布号WO 2010/086603)中公开的任何酶。

优选的酶是聚合酶、核酸外切酶、解旋酶和拓扑异构酶，例如促旋酶。合适的酶包括但不限于，来自大肠杆菌的核酸外切酶I(SEQ ID NO：11)，来自大肠杆菌的核酸外切酶III(SEQ ID NO：13)，来自嗜热栖热菌的RecJ(SEQ ID NO：15)，和细菌噬菌体λ核酸外切酶(SEQ ID NO：17)，TatD核酸外切酶及其变体。包含SEQ ID NO：15所示序列或其变体的三个亚基相互作用，形成三聚体核酸外切酶。聚合酶可以是3173 DNA聚合酶(其可从Corporation商购得到)，SD聚合酶(从商购得到)或其变体。该酶优选为Phi29 DNA聚合酶(SEQ ID NO：9)或其变体。拓扑异构酶优选为酶分类(EC)组5.99.1.2和5.99.1.3中的任何成员。

该酶最优选衍生自解旋酶，例如Hel308 Mbu(SEQ ID NO：18)，Hel308 Csy(SEQ IDNO：19)，Hel308(Tga)，Hel308 Mhu(SEQ ID NO：21)，TraI Eco(SEQ ID NO：22)，XPD Mbu(SEQ ID NO：23)或其变体。本发明中可以使用任何解旋酶。解旋酶可以是或来自Hel308解旋酶，RecD解旋酶，如TraI解旋酶或TrwC解旋酶，XPD解旋酶或Dda解旋酶。解旋酶可以是国际申请PCT/GB2012/052579(公布号WO 2013/057495)；PCT/GB2012/053274(公布号WO2013/098562)；PCT/GB2012/053273(公布号WO 2013098561)；PCT/GB2013/051925(公布号WO 2014/013260)；PCT/GB2013/051924(公布号WO 2014/013259)；PCT/GB2013/051928(公布号WO 2014/013262)；PCT/GB2014/052736(公布号WO 2015/055981)和PCT/GB2015/052916中公布的任何解旋酶、经修饰的解旋酶或解旋酶构建体。

解旋酶优选包含SEQ ID NO：25(Trwc Cba)或其变体所示的序列，SEQ ID NO：18(Hel308 Mbu)或其变体所示的序列，或SEQ ID NO：24(Dda)或其变体所示的序列。变体可以以下对于跨膜孔所论述的任何方式不用于天然序列。SEQ ID NO：24的优选变体包括(a)E94C和A360C或(b)E94C，A360C，C109A和C136A，然后任选地(ΔM1)G1G2(即缺失M1，然后添加G1和G2)。

根据本发明可以使用任何数量的解旋酶。例如，可以使用1，2，3，4，5，6，7，8，9，10或更多个解旋酶。在一些实施方案中，可以使用不同数量的解旋酶。

本发明的方法优选包括使多核苷酸与两个或更多个解旋酶接触。所述两个或更多个解旋酶通常是相同的解旋酶。所述两个或更多个解旋酶可以是不同的解旋酶。

所述两个或更多个解旋酶可以是上述解旋酶的任何组合。所述两个或更多个解旋酶可以是两个或更多个Dda解旋酶。所述两个或更多个解旋酶可以是一个或多个Dda解旋酶和一个或多个TrwC解旋酶。所述两个或更多个解旋酶可以是同一解旋酶的不同变体。

所述两个或更多个解旋酶优选彼此连接。所述两个或更多个解旋酶更优选彼此共价连接。解旋酶可以以任何顺序并使用任何方法连接。用于本发明的优选的解旋酶构建体在国际申请No.PCT/GB2013/051925(公布号WO 2014/013260)；PCT/GB2013/051924(公布号WO 2014/013259)；PCT/GB2013/051928(公布号WO 2014/013262)；PCT/GB2014/052736(公布号WO 2015/055981)和PCT/GB2015/052916中有描述。

SEQ ID NO：9，11，13，15，17，18，19，20，21，22，23，24或25的变体是具有以下氨基酸序列的酶：从SEQ ID NO：9，11，13，15，17，18，19，20，21，22，23，24或25的氨基酸序列变化而来并且保持多核苷酸结合能力。这可以使用本领域已知的任何方法来测量。例如，变体可以与多核苷酸接触，并且其结合多核苷酸以及沿多核苷酸移动的能力可以测量。变体可以包括促进多核苷酸的结合和/或促进其在高盐浓度和/或室温下的活性的修饰。可以对变体进行修饰，使得它们结合到多核苷酸(即保留多核苷酸结合能力)，但不起到解旋酶的作用(即，当提供有用以促进移动的所有必需组分例如ATP和Mg²⁺时，不沿多核苷酸移动)。这类修饰是本领域已知的。例如，解旋酶中Mg²⁺结合结构域的修饰通常导致不起解旋酶作用的变体。这些类型的变体可以用作分子制动器(见下文)。

在SEQ ID NO：9，11，13，15，17，18，19，20，21，22，23，24或25的氨基酸序列的整个长度上，基于氨基酸相似性或同一性，变体将优选与该序列至少50％同源。更优选地，基于氨基酸相似性或同一性，变体多肽可以与SEQ ID NO：9，11，13，15，17，18，19，20，21，22，23，24或25的氨基酸序列在整个序列上至少55％，至少60％，至少65％，至少70％，至少75％，至少80％，至少85％，至少90％且更优选至少95％，97％或99％同源。在200或更多个，例如230，250，270，280，300，400，500，600，700，800，900或1000或更多个连续氨基酸的延伸段上，可以具有至少80％，例如至少85％，90％或95％的氨基酸相似性或同一性(“严格同源性”)。如上所述确定同源性。所述变体可以以上文参照SEQ ID NO：2和4论述的任何方式不同于野生型序列。酶可以共价连接到孔。可以使用任何方法将酶共价连接到孔上。

优选的分子制动器是TrwC Cba-Q594A(具有突变Q594A的SEQ ID NO：25)。该变体不具有解旋酶的作用(即，当提供有便于移动的所有必需组分，例如ATP和Mg²⁺时，可结合多核苷酸但不会沿其移动)。

在链测序中，所述多核苷酸顺着或逆着所施加电位移位穿过所述孔。逐渐地或进行性地作用于双链多核苷酸上的核酸外切酶可在施加的电位下用在所述孔的顺侧上使剩余的单链穿过，或者在反向电位下用在所述孔的反侧上使剩余的单链穿过。同样地，解开双链DNA的解旋酶也可以类似的方式使用。也可以使用聚合酶。还有可能用于需要使链逆着施加电位移位的测序应用中，但是在反向电位或没有电位的情况下DNA必须首先被所述酶“捕获”。然后随着在结合之后电位被切换回，所述链将从顺侧到反侧而穿过所述孔并通过电流保持延伸的构造。单链DNA核酸外切酶或单链DNA依赖性聚合酶可用作分子马达，用于将最近移位的单链以受控并逐步的方式逆着施加的电位从反侧到顺侧穿过所述孔而拉回。

所述方法中可以使用任何解旋酶。解旋酶可以两种模式相对于所述孔起作用。首先，所述方法优选使用解旋酶实施，使得所述解旋酶顺着由施加电压产生的场而移动所述多核苷酸穿过所述孔。在这种模式下，多核苷酸的5′端首先在孔中被捕获，然后解旋酶将多核苷酸移动到孔中，使得多核苷酸顺着所述场穿过所述孔，直到其最终移位穿至膜的反侧。替代地，所述方法优选以下述方式实施：使得解旋酶将多核苷酸逆着由施加电压产生的场移动穿过所述孔。在这种模式下，多核苷酸的3′端首先在孔中被捕获，然后解旋酶使多核苷酸移动穿过所述孔，使得多核苷酸逆着施加的场被拉出所述孔，直到其最终返回至膜的顺侧。

所述方法也可以按相反的方向实施。使多核苷酸的3′端首先在孔中被捕获，然后解旋酶可以将多核苷酸移动到所述孔中，使得多核苷酸顺着所述场穿过所述孔，直到其最终移位穿至膜的反侧。

当解旋酶不具有有助于移动的必要组分或被修饰为阻碍或阻止其移动时，所述解旋酶可以结合到多核苷酸，并在多核苷酸被所施加场拉入孔中时用作减缓多核苷酸的移动的制动器。在非活性模式下，多核苷酸是否在3′或5′端被捕获并不重要，是所施加的场用起制动器作用的酶朝着反侧将多核苷酸拉入孔中。当在非活性模式时，解旋酶对多核苷酸的移动控制可以多种方式描述，包括齿合(ratcheting)、滑动和制动。缺少解旋酶活性的解旋酶变体也可以这种方式使用。

所述多核苷酸可与多核苷酸结合蛋白及孔以任何顺序接触。优选的是，当多核苷酸与多核苷酸结合蛋白(如解旋酶)及孔接触时，多核苷酸首先与蛋白质形成复合物。然后当跨所述孔施加电压时，多核苷酸/蛋白质复合物与所述孔形成复合物，并控制多核苷酸穿过所述孔的移动。

使用多核苷酸结合蛋白的方法中的任何步骤通常在游离核苷酸或游离核苷酸类似物以及促进多核苷酸结合蛋白起作用的酶辅因子存在下实施。所述游离核苷酸可以是上述各多核苷酸中的任意一个或多个。所述游离核苷酸包括但不限于，腺苷单磷酸(AMP)，腺苷二磷酸(ADP)，腺苷三磷酸(ATP)，鸟苷单磷酸(GMP)，鸟苷二磷酸(GDP)，鸟苷三磷酸(GTP)，胸苷单磷酸(TMP)，胸苷二磷酸(TDP)，胸苷三磷酸(TTP)，尿苷单磷酸(UMP)，尿苷二磷酸(UDP)，尿苷三磷酸(UTP)，胞苷单磷酸(CMP)，胞苷二磷酸(CDP)，胞苷三磷酸(CTP)，环状腺苷单磷酸(cAMP)，环状鸟苷单磷酸(cGMP)，脱氧腺苷单磷酸(dAMP)，脱氧腺苷二磷酸(dADP)，脱氧腺苷三磷酸(dATP)，脱氧鸟苷单磷酸(dGMP)，脱氧鸟苷二磷酸(dGDP)，脱氧鸟苷三磷酸(dGTP)，脱氧胸苷单磷酸(dTMP)，脱氧胸苷二磷酸(dTDP)，脱氧胸苷三磷酸(dTTP)，脱氧尿苷单磷酸(dUMP)，脱氧尿苷二磷酸(dUDP)，脱氧尿苷三磷酸(dUTP)，脱氧胞苷单磷酸(dCMP)，脱氧胞苷二磷酸(dCDP)和脱氧胞苷三磷酸(dCTP)。所述游离核苷酸优选选自AMP，TMP，GMP，CMP，UMP，dAMP，dTMP，dGMP或dCMP。所述游离核苷酸优选为腺苷三磷酸(ATP)。所述酶辅因子为使构建体发挥功能的因子。所述酶辅因子优选为二价金属阳离子。所述二价金属阳离子优选为Mg²⁺，Mn²⁺，Ca²⁺或Co²⁺。所述酶辅因子最优选为Mg²⁺。

解旋酶(一个或多个)和分子制动器(一个或多个)

在优选的实施方案中，所述方法包括：

(a)提供多核苷酸，其具有一个或多个解旋酶和一个或多个分子制动器连接到所述多核苷酸；

(b)使所述多核苷酸与本发明的孔接触并跨所述孔施加电势，使得所述一个或多个解旋酶和所述一个或多个分子制动器联合在一起来控制所述多核苷酸通过所述孔的移动；

(c)当所述多核苷酸相对于所述孔移动时，获取一个或多个测量值，其中所述测量值表示所述多核苷酸的一个或多个特征，由此表征所述多核苷酸。

这类方法在国际申请PCT/GB2014/052737(公布号为WO2015/110777)中有详细论述。

所述一个或多个解旋酶可以是上文论述的任何解旋酶。所述一个或多个分子制动器可以是能结合到所述多核苷酸并减缓所述多核苷酸通过所述孔的移动的任何化合物或分子。所述一个或多个分子制动器优选包含能结合到所述多核苷酸的一种或多种化合物。所述一种或多种化合物优选为一种或多种大环化合物。合适的大环化合物包括，但不限于，环糊精、杯芳烃、环肽、冠醚、葫芦脲、柱芳烃、其衍生物或其组合。所述环糊精或其衍生物可以是任何在Eliseev，A.V.，and Schneider，H-J.(1994)J.Am.Chem.Soc.116，6081-6088中公开的那些。该试剂更优选为七-6-氨基-β-环糊精(am₇-βCD)、6-单脱氧-6-单氨基-β-环糊精(am₁-βCD)或七-(6-脱氧-6-胍基)-环糊精(gu₇-βCD)。

所述一个或多个分子制动器优选为一个或多个单链结合蛋白(SSB)。所述一个或多个分子制动器更优选为包含不具有净负电荷的羧基末端(C-末端)区域的单链结合蛋白(SSB)，或为(ii)C-末端区域中包含能减少C-末端区域的净负电荷的一个或多个修饰的经修饰SSB。所述一个或多个分子制动器最优选为在国际申请No.PCT/GB2013/051924(公布号为WO 2014/013259)中公开的任何SSB。

所述一个或多个分子制动器优选为一个或多个多核苷酸结合蛋白。所述多核苷酸结合蛋白可以是能够结合到多核苷酸并控制其移动通过所述孔的任何蛋白质。现有技术中可直接确定蛋白质是否结合到多核苷酸。所述蛋白通常与多核苷酸相互作用并修饰所述多核苷酸的至少一种特性。所述蛋白可通过使多核苷酸裂解形成各单个核苷酸或短链核苷酸，如二核苷酸或三核苷酸，来修饰所述多核苷酸。该部分可以通过将多核苷酸定向或将其移动到特定位置，即控制其移动，来修饰所述多核苷酸。

所述多核苷酸结合蛋白优选衍生自多核苷酸处理酶。所述一个或多个分子制动器可以衍生自上述的任何多核苷酸处理酶。用作分子制动器的Phi29聚合酶的经修饰的变体(SEQ ID NO：8)在美国专利No.5576204中公开。充当分子制动器的Phi29聚合酶的经修饰的变体(SEQ ID NO：8)在美国专利5,576,204中有公开。所述一个或多个分子制动器优选衍生自解旋酶。

可以使用任何数目的衍生自解旋酶的分子制动器。例如，可以使用1、2、3、4、5、6、7、8、9、10或更多个解旋酶作为分子制动器。如果使用两个或更多个解旋酶作为分子制动器，所述两个或更多个解旋酶通常是相同的解旋酶。所述两个或更多个解旋酶可以是不同的解旋酶。

所述两个或更多个解旋酶可以是上文提到的解旋酶的任意组合。所述两个或更多个解旋酶可以是两个或更多个Dda解旋酶。所述两个或更多个解旋酶可以是一个或多个Dda解旋酶和一个或多个TrwC解旋酶。所述两个或更多个解旋酶可以是相同解旋酶的不同变体。

所述两个或更多个解螺旋酶优选彼此连接。所述两个或更多个解旋酶更优选彼此共价连接。所述解旋酶可以以任何顺序使用任何方法连接。从解旋酶衍生的所述一个或多个分子制动器优选被修饰以减少多核苷酸结合结构域域中开口的大小，所述多核苷酸可在至少一个构象状态下通过所述开口从解旋酶解绑。这在WO 2014/013260中公开。

用于本发明的优选的解旋酶构建体在国际申请No.PCT/GB2013/051925(公布号WO2014/013260)；PCT/GB2013/051924(公布号WO 2014/013259)和PCT/GB2013/051928(公布号WO 2014/013262)；和在PCT/GB2014/052736(公布号WO/2015/055981)中有描述。

间隔区

所述一个或多个解旋酶可以在一个或多个间隔区停滞，如在国际申请No.PCT/GB2014/050175(公布号WO 2014/135838)中论述的。本发明中可以使用在该国际申请中公开的一个或多个解旋酶和一个或多个间隔区的任意构造。

膜

本发明的孔可以存在于膜中。在本发明方法中，多核苷酸通常与本发明的孔在膜中接触。任何膜可以按照本发明使用。合适的膜是本领域公知的。所述膜优选为两亲层。两亲层是由具有亲水性和亲脂性的两亲分子形成的层，如磷脂。所述两亲分子可以是合成的或天然存在的。非天然存在的两亲物和形成单层的两亲物在本领域中是已知的，且包括，例如，嵌段共聚物(Gonzalez-Perez等人，Langmuir，2009，25，10447-10450)。嵌段共聚物是其中两个或更多个单体亚基一起聚合以生成单个聚合物链的聚合物材料。嵌段共聚物通常具有由每个单体亚基贡献的特性。然而，嵌段共聚物可具有由各个亚基形成的聚合物不具有的独特的特性。嵌段共聚物可以被加工，使得单体亚基中的一个是疏水性的(即亲脂的)，而其他亚基在含水介质中是亲水性的。在这种情况下，该嵌段共聚物可具有两亲特性，并且可以形成模仿生物膜的结构。嵌段共聚物可以是二嵌段(由两个单体亚基组成)，但也可以由多于两个的单体亚基构成以形成充当两亲物的更复杂的排列。所述共聚物可以是三嵌段、四嵌段或五嵌段共聚物。膜优选为三嵌段共聚物膜。

古细菌双极四醚脂质是天然存在的脂质，其被构造为使得所述脂质形成单层膜。这些脂质通常在恶劣的生物环境、嗜热菌、嗜盐菌和嗜酸菌中生存的嗜极菌(extremophiles)中被发现。它们的稳定性被认为是从最终双层的融合性质中衍生的。比较简单的是，通过生成具有亲水性-疏水性-亲水性一般基序的三嵌段聚合物构造模仿这些生物实体的嵌段共聚物材料。所述材料可以形成行为类似于脂质双层且包含从囊泡到层状膜的一系列相行为的单体膜。由这些三嵌段共聚物形成的膜与生物脂质膜相比持有一些优点。因为三嵌段共聚物是合成的，因此可以仔细控制其确切构造以提供用于形成膜和与孔及其他蛋白相互作用所需的正确链长度和特性。

嵌段共聚物也可以从不被分类为脂质子材料的亚基构建；例如疏水性聚合物可从硅氧烷或其他非基于烃的单体制成。嵌段共聚物的亲水性子段也可具有低的蛋白质结合特性，这使得当暴露于未处理的生物样品时，其可生成高抗性的膜。该头部基团单元也可以从非经典的脂质头部基团衍生。

三嵌段共聚物膜与生物脂质膜相比，还具有增强的机械稳定性和环境稳定性，例如高得多的操作温度或pH范围。嵌段共聚物的合成性质为定制用于广泛应用范围的基于聚合物的膜提供了平台(platform)。

所述膜最优选为在国际申请No.PCT/GB2013/052766(公布号WO 2014/06443)或PCT/GB2013/052767(公布号WO/2014/064444)中公开的膜之一。

所述两亲分子可以是经化学修饰的或官能化的以有助于多核苷酸的耦合。

该两亲层可以是单层或双层。两亲层通常是平面的。两亲层可以是弯曲的。两亲层可以被支撑。

两亲膜通常天然是移动的，本质上充当具有约10^-8cm s^-1的脂质扩散速率的二维流体。这意味着孔和耦合的多核苷酸通常在两亲膜内移动。

膜可以是脂质双层。脂质双层是细胞膜的模型，并充当用于一系列实验研究的优秀的平台。例如，脂质双层可通过单通道记录用于膜蛋白的体外研究。或者，脂质双层可用作生物传感器以检测一系列物质的存在。脂质双层可以是任何脂质双层。合适的脂质双层包括，但不限于，平面脂双层、支撑双层或脂质体。脂质双层优选平面脂质双层。合适的脂质双层在国际申请No.PCT/GB08/000563(公布号WO 2008/102121)、国际申请No.PCT/GB08/004127(公布号WO2009/077734)和国际申请No.PCT GB2006/001057(公布号WO 2006/100484)中公开。

偶联

多核苷酸优选与包含本发明的孔的膜偶联。该方法可以包括将多核苷酸与包含本发明的孔的膜偶联。多核苷酸优选使用一个或多个锚偶联到膜上。多核苷酸可以使用任何已知的方法与膜偶联。合适的偶联方法在国际申请号No.PCT/GB2012/051191(公布号WO2012/164270)和PCT/GB2015/050991(公布号WO 2015/150786)中有公开。

双链多核苷酸

所述多核苷酸可以是双链的。如果多核苷酸是双链的，则在接触步骤之前，所述方法优选进一步包括将桥连部分，例如，发夹环，接合到所述多核苷酸的一端。然后所述多核苷酸的两条链可在所述多核苷酸与本发明的孔接触时或接触之前分离。当多核苷酸穿过所述孔的移动是由多核苷酸结合蛋白，如解旋酶或分子制动器控制时，所述两条链可以被分离。

以这种方式连接并询问双链构建体上的两条链提高了表征的效率和准确性，如PCT/GB2010/000160(公布号WO 2010/086622)和PCT/GB2012/051786(公布号WO 2013/014451)中所述。

修饰的多核苷酸

在表征之前，目标多核苷酸可通过使该多核苷酸与聚合酶和一组游离核苷酸在其中所述聚合酶使用所述目标多核苷酸作为模板形成经修饰多核苷酸的条件下接触而进行修饰，其中所述聚合酶在形成所述经修饰的多核苷酸时将目标多核苷酸中的一个或多个核苷酸物质用不同核苷酸物质替代。然后，可对经修饰多核苷酸提供一个或多个连接到该多核苷酸的解旋酶和一个或多个连接到该多核苷酸的分子制动器。这类修饰在国际申请PCT/GB2015/050483(公布号WO2015/124935)中进行了描述。上面论述的任何聚合酶均可以使用。聚合酶优选为Klenow或9°North。

其他表征方法

在另一个实施方案中，通过检测被标记的且当聚合酶将核苷酸插入多核苷酸时释放的物质来表征所述多核苷酸。所述聚合酶使用所述多核苷酸作为模板。各个标记的物质对每个核苷酸具有特异性。使所述多核苷酸与本发明的孔、聚合酶和标记的核苷酸接触，使得在核苷酸通过聚合酶添加到所述多核苷酸(一个或多个)时，磷酸盐标记的物质依次释放，其中磷酸盐物质包含对每个核苷酸特异性的标记物。所述聚合酶可以是任何上文论述的聚合酶。使用所述孔检测磷酸盐标记的物质，从而表征所述多核苷酸。这类方法在欧洲申请No.13187149.3(公布号EP2682460)中有公开。上文论述的任何实施方案同样适用于该方法。

试剂盒

本发明还提供了一种用于特征目标多核苷酸的试剂盒。所述试剂盒包括本发明的异源寡聚孔和膜的组分。所述膜优选由所述组分形成。所述孔优选存在于所述膜中。所述试剂盒可以包含上文公开的任何膜(例如两亲层或三嵌段共聚物膜)的组分。

所述试剂盒还可以包含多核苷酸结合蛋白。

所述试剂盒可以进一步包含用于将多核苷酸与膜偶联的一个或多个锚。

所述试剂盒优选用于表征双链多核苷酸，并且优选包含Y适配器和桥接部分适配器，例如发夹环适配器。Y适配器优选具有一个或多个连接的解旋酶，并且桥接部分适配器或发夹环适配器优选具有连接的一个或多个分子制动器。Y适配器优选包含用于将多核苷酸与膜偶联的一个或多个第一锚，桥接部分适配器或发夹环适配器优选包含用于将多核苷酸与膜偶联的一个或多个第二锚，并且桥接部分适配器或发夹环适配器与膜偶联的强度优选大于Y适配器与膜偶联的强度。

本发明的试剂盒还可以包含一种或多种使上述任何实施方案能够进行的其他试剂或仪器。这类试剂或仪器包括以下中的一种或多种：合适的缓冲液(一种或多种；水性溶液)，从受试者获得样品的工具(例如包含针的容器或仪器)，用于扩增和/或表达多核苷酸的工具，或者电压钳或膜片钳设备。试剂可以干燥状态存在于试剂盒中，使得流体样品重新悬浮所述试剂。所述试剂盒还可以任选地包括使试剂盒能够用于本发明方法的说明书，或关于该方法可以用于哪种生物体的详细资料。

设备

本发明还提供了用于表征目标多核苷酸的设备。该设备包括多个本发明的异源寡聚孔和包括多个膜。所述的多个孔优选存在于所述多个膜中。孔和膜的数量优选相等。优选地，每个膜中存在单个孔。

所述设备优选进一步包括用于实施本发明方法的说明书。所述设备可以是任何用于多核苷酸分析的常规设备，例如阵列或芯片。上面论述的关于本发明方法的任何实施方案同样适用于本发明的设备。所述设备可以进一步包括存在于本发明试剂盒中的任何特征。

所述设备优选被设置成用于实施本发明方法。

所述设备优选包括：

传感器装置，其能够支持所述多个孔和膜并且可操作为使用所述孔和膜来实施多核苷酸表征；和

至少一个端口，其用于传输实施表征所用的材料。

或者，所述设备优选包括：

传感器装置，其能够支持所述多个孔和膜并可操作为使用所述孔和膜来实施多核苷酸表征；和

至少一个存储器，用于容纳实施表征所用的材料。

所述设备更优选包括：

传感器装置，其能够支持所述膜和多个孔和膜并可操作为使用所述孔和膜来实施多核苷酸表征；

至少一个存储器，其用于容纳实施表征所用的材料；

流体系统，其配置成将材料从至少一个所述存储器可控地供应到所述传感器装置；和

一个或多个容器，其用于接收各个样品，所述流体系统被配置成将所述样品选择性地从一个或多个容器供应到所述传感器装置。

所述设备可以是在国际申请No.PCT/GB08/004127(公布号WO 2009/077734)，PCT/GB10/000789(公布号WO 2010/122293)，国际申请No.PCT/GB10/002206(公布号WO 2011/067559)或国际申请No.PCT/US99/25679(公布号WO 00/28312)中描述的任何设备。

形成传感器的方法

本发明还提供了形成用于表征目标多核苷酸的传感器的方法。该方法包括在本发明的异源寡聚孔和多核苷酸结合蛋白(例如解旋酶或核酸外切酶)之间形成复合物。所述复合物可以通过在目标多核苷酸的存在下使所述孔和所述蛋白接触然后跨所述孔施加电位而形成。所施加的电位可以是如上所述的化学电位或电压电位。或者，述复合物可以通过将所述孔共价连接到所述蛋白而形成。用于共价连接的方法是本领域已知的，并且例如在国际申请No.PCT/GB09/001679(公布号WO 2010/004265)和PCT/GB10/000133(公布号WO2010/086603)中公开。所述复合物是用于表征目标多核苷酸的传感器。所述方法优选包括在本发明的异源寡聚孔和解旋酶之间形成复合物。上述任何实施方案同样适用于该方法。

本发明还提供了用于表征目标多核苷酸的传感器。该传感器包括本发明的异源寡聚孔与多核苷酸结合蛋白之间形成的复合物。上述任何实施方案同样适用于本发明的传感器。

以下实施例示意说明本发明。

实施例1

该实施例描述了用于纯化MspA异源寡聚孔的按比例放大的大肠杆菌纯化方法。下面描述了突变的异源寡聚纳米孔MspA 1＝MspA-((Del-L74/G75/D118/L119)D56N/E59R/L88N/D90N/D91N/Q126R/D134R/E139K)7((Del-L74/G75/D118/L119)D56N/E59R/L88N/D91N/Q126R/D134R/E139K/BasTL)1(SEQ ID NO：2，在七个单体中具有以下突变：D56N/E59R/L88N/D90N/D91N/Q126R/D134R/E139K且在七个单体中具有以下氨基酸的缺失：L74/G75/D118/L119，以及在一个单体中具有以下突变：D56N/E59R/L88N/D91N/Q126R/D134R/E139K/BasTL，其中BasTL具有SEQ ID NO：26并且连接在C末端，且在一个单体中就有以下氨基酸的缺失：L74/G75/D118/L119)的制备。该方法适用于制备其他异源寡聚纳米孔。

合成编码MspA-((Del-L74/G75/D118/L119)D56N/E59R/L88N/D90N/D91N/Q126R/D134R/E139K)(SEQ ID NO：2，在单体中具有以下突变：D56N/E59R/L88N/D90N/D91N/Q126R/D134R/E139K和在单体中具有以下氨基酸的缺失：L74/G75/D118/L119)的多肽的DNA(SEQID NO：27)(GenScript USA Inc.)并克隆到含有卡那霉素抗性基因的pRham载体中。pRham载体的蛋白质表达可以由鼠李糖诱导。合成编码多肽的DNA(SEQ ID NO：28)MspA-(Del-L74/G75/D118/L119)D56N/E59R/L88N/D91N/Q126R/D134R/E139K/BasTL/H6)(SEQ ID NO：2，单体中具有以下突变：D56N/E59R/L88N/D91N/Q126R/D134R/E139K/BasTL，其中BasTL具有SEQ ID NO：26，并连接到C末端，六个组氨酸(H6)连接到C末端的BasTL的3’端，并且在一个单体中具有以下氨基酸的缺失：L74/G75/D118/L119)(GenScript USA Inc)并克隆到含有氨苄青霉素抗性基因的pT7载体中。可以通过IPTG(异丙基β-D-硫代半乳糖吡喃糖苷)诱导pT7载体的蛋白质表达。将两种DNA溶液的浓度调节至400ng/uL。然后将两种DNA溶液以1∶1的比例混合在一起，并使用1uL该混合物转化Lemo21(DE3)感受态的(competent)大肠杆菌细胞(50μl，NEB，目录号C2528H)。然后将转化的细胞用SOC培养基(100μl)在37℃下搅拌培育2小时。然后将细胞接种(plated out)在含有氨苄青霉素(0.1mg/ml)和卡那霉素(0.034mg/ml)的LB琼脂上，并在37℃培育约16小时。

在含有氨苄青霉素和卡那霉素的LB平板中生长的细菌菌落已经用两种质粒进行了转化：含有MspA-((Del-L74/G75/D118/L119)D56N/E59R/L88N/D90N/D91N/Q126R/D134R/E139K)的DNA的PRham和含有MspA-(Del-L74/G75/D118/L119)D56N/E59R/L88N/D91N/Q126R/D134R/E139K/BasTL/H6)的DNA的pT7。使用一个这样的菌落来接种含有氨苄青霉素(0.1mg/ml)和卡那霉素(0.034mg/ml)的Terrific Broth(TB)培养基(10mL)的起子培养物(starter culture)。所述起子培养物在37℃搅拌下生长直到OD600达到0.8-1.0。然后使用1mL起子培养物接种500mL含有氨苄青霉素(0.1mg/ml)和卡那霉素(0.034mg/ml)的TB培养基。培养物在37℃搅拌下生长直到OD600达到0.8-1.0。然后将培养物的温度调节至18℃，并通过添加IPTG(0.5mM终浓度)和鼠李糖(1.5％终浓度)引发诱导。在18℃搅拌下进行约18小时的诱导。

诱导后，通过以6,000g离心30分钟使培养物沉淀(was pelleted)。然后将沉淀(pellet)重悬于50mM Tris pH9.0(每克沉淀约12.5ml缓冲液)中。将悬浮液充分混合直到其完全均匀。通过超声处理(开启6×30秒，关闭6×30秒)进行细胞裂解。将DDM加入到细胞裂解物中至1％终浓度，并在频繁拌和下将混合物在37℃下培育45分钟。通过以20,000g离心45分钟使裂解物沉淀，然后分离上清液。含有不同寡聚物的单体和混合物两种形式的上清液通过如下所述的柱色谱法纯化。

将样品用50mM Tris，500mM NaCl，0.1％DDM，pH 8.0(缓冲液A)以1∶1稀释，并施加到5ml His Crude FF柱(GE Healthcare)上。将柱洗涤直到维持10个柱体积的稳定基线。通过用15mM咪唑(Sigma/Aldrich Biopuriss等级)洗涤所述柱除去松散结合的蛋白质直到保持稳定的基线。用200mM咪唑(Sigma/Aldrich Biopuriss等级)进行洗脱。

合并洗脱峰，加热至85℃达15分钟以除去热不稳定的污染蛋白质。然后将加热的溶液在20,000g下离心10分钟，弃去沉淀。将上清液在缓冲液A中在120ml Sephadex S200柱(GE Healthcare)上以1ml/min进行凝胶过滤。样品以约60ml体积洗脱。洗脱峰在10％TGX(Bio Rad)上运行，以确认感兴趣的MspA1的异源孔的存在。将所鉴定的级分合并，接着进行进一步纯化。

将样品在缓冲液A中加载到1ml His HP柱(GE Healthcare)上。一旦稳定的基线维持10个柱体积，则用15mM咪唑(Sigma/Aldrich Biopuriss等级)洗涤该柱。在60分钟内用15mM咪唑至80mM咪唑(Sigma/Aldrich Biopuriss等级)的梯度以1ml/min洗脱MspA 1。通过将洗脱中的咪唑浓度增加至100mM，洗脱含有多于一个His标签的异源孔的其他构象。

下面列出的异源寡聚纳米孔也是使用该方法制备。在每种情况下，将编码非标记亚基的DNA克隆到pRham载体中，并将编码含有BasTL-H6的亚基的DNA克隆到pT7载体中，然后如上述实施例中所述进行纯化。

MspA 2＝MspA-((Del-L74/G75/D118/L119)D56N/E59R/L88N/D90N/D91N/N108P/Q126R/D134R/E139K)7((Del-L74/G75/D118/L119)D56N/E59R/L88N/D91N/N108P/Q126R/D134R/E139K/BasTL/H6)1(SEQ ID NO：2，在七个单体中具有以下突变：

D56N/E59R/L88N/D90N/D91N/N108P/Q126R/D134R/E139K，并且在七个单体中具有以下氨基酸的缺失：L74/G75/D118/L119，以及在一个单体中具有以下突变：

D56N/E59R/L88N/D91N/N108P/Q126R/D134R/E139K/BasTL/H6，其中，所述BasTL具有SEQ ID NO：26，所述六个组氨酸(H6)连接到BasTL的C末端的3’端并且连接在C末端，在一个单体中具有以下氨基酸的缺失：L74/G75/D118/L119)

MspA 3＝MspA-((Del-L74/G75/D118/L119)D56N/E59R/L88N/D90N/D91N/N108P/Q126R/D134R/E139K)7((Del-L74/G75/D118/L119)D56N/E59R/L88N/D91G/N108P/Q126R/D134R/E139K/BasTL/H6)1(SEQ ID NO：2，在七个单体中具有以下突变：

D56N/E59R/L88N/D90N/D91N/N108P/Q126R/D134R/E139K并且在七个单体中具有以下氨基酸的缺失：L74/G75/D118/L119，以及在一个单体中具有以下突变：

D56N/E59R/L88N/D91G/N108P/Q126R/D134R/E139K/BasTL/H6，其中，所述BasTL具有SEQ ID NO：26，所述六个组氨酸(H6)连接到BasTL的C末端的3’端并且连接在C末端，在一个单体中具有以下氨基酸的缺失：L74/G75/D118/L119)

MspA 4＝MspA-((Del-L74/G75/D118/L119)D56F/E59R/L88N/D90N/D91N/N108P/Q126R/D134R/E139K)7((Del-L74/G75/D118/L119)D56F/E59R/L88N/D91N/N108P/Q126R/D134R/E139K/BasTL/H6)1(SEQ ID NO：2，在七个单体中具有以下突变：

D56F/E59R/L88N/D90N/D91N/N108P/Q126R/D134R/E139K并且在七个单体中具有以下氨基酸的缺失：L74/G75/D118/L119，以及在一个单体中具有以下突变：

D56F/E59R/L88N/D91N/N108P/Q126R/D134R/E139K/BasTL/H6，其中，所述BasTL具有SEQ ID NO：26，所述六个组氨酸(H6)连接到BasTL的C末端的3’端并且连接在C末端，在一个单体中具有以下氨基酸的缺失：L74/G75/D118/L119)

MspA 5＝MspA-((Del-L74/G75/D118/L119)D56F/E59R/L88N/D90N/D91N/N108P/Q126R/D134R/E139K)7((Del-L74/G75/D118/L119)D56F/E59R/L88N/D91G/N108P/Q126R/D134R/E139K/BasTL/H6)1(SEQ ID NO：2，在七个单体中具有以下突变：

D56F/E59R/L88N/D91G/N108P/Q126R/D134R/E139K/BasTL/H6，其中，所述BasTL具有SEQ ID NO：26，所述六个组氨酸(H6)连接到BasTL的C末端的3’端并且连接在C末端，在一个单体中具有以下氨基酸的缺失：L74/G75/D118/L119)

MspA 7＝MspA-((Del-L74/G75/D118/L119)(D56N/E59R/L88N/D90N/D91N/N108P/Q126R/D134R/E139K)7((Del-L74/G75/D118/L119)(D56N/E59R/L88N/D91Q/N108P/Q126R/D134R/E139K/BasTL/H6)1(SEQ ID NO：2，在七个单体中具有以下突变：

D56N/E59R/L88N/D91Q/N108P/Q126R/D134R/E139K/BasTL/H6，其中，所述BasTL具有SEQ ID NO：26，所述六个组氨酸(H6)连接到BasTL的C末端的3’端并且连接在C末端，在一个单体中具有以下氨基酸的缺失：L74/G75/D118/L119)

纯化的MspA 2的一个实例如图1所示。蛋白质在10％TGX凝胶(BioRad)中分析，并用考马斯染色(coomasie staining)而显现。泳道3显示了纯化的MspA-2，其具有对应于由8个单体单元寡聚而构成的异源寡聚孔的条带。泳道4显示经热处理后的纯化MspA-2，所述热处理将孔分解成其单体单元。在泳道4中观察到两个条带——一个条带对应于连接了BasTL-H6的单体单元(条带B)，一个条带对应于没有连接BasTL-H6的单体单元。这说明泳道8中的纯化孔分解成两个不同的单体单元，这证明已经形成了MspA-2异源孔。

实施例2

该实施例描述了对照实验，其显示了两个单体的共转化和随后的受控表达是获得感兴趣的异源孔所必需的。单独转化但在相同培养物中一起生长的两个亚基不产生异源寡聚孔。

将编码多肽的DNA(SEQ ID NO：27)MspA-((Del-L74/G75/D118/L119)D56N/E59R/L88N/D90N/D91N/Q126R//D134R/E139K)(SEQ ID NO：2，在单体中具有以下突变：D56N/E59R/L88N/D90N/D91N/Q126R//D134R/E139K，并且在单体中具有以下氨基酸的缺失：L74/G75/D118/L119)和编码多肽的DNA(SEQ ID NO：28)MspA-((Del-L74/G75/D118/L119)D56N/E59R/L88N/D91N/Q126R//D134R/E139K)(SEQ ID NO：2，在单体中具有以下突变：D56N/E59R/L88N/D91N/Q126R//D134R/E139K，并且在单体中具有以下氨基酸的缺失：L74/G75/D118/L119)克隆到含有氨苄青霉素抗性基因的pT7载体中。将这两个编码多肽的DNA分别转化到BL21 DE3 PlysS感受态细胞中。通过用来自每个转化体的单个菌落接种含有0.1mg/ml氨苄青霉素的10ml的TB培养基来制备起子培养物。起子培养物在37℃搅拌下生长至OD600为0.8。通过添加1ml每个亚基的起子培养物，用两个亚基接种含有0.1mg/ml氨苄青霉素的500ml TB培养基。使接种的培养物生长至OD600为0.8。一旦达到所需的OD600，将培养物冷却至18℃，并通过添加1mM IPTG诱导。然后将培养物在18℃下搅拌培育8小时。

培育后，将样品进行裂解作为标准——通过以6,000g离心30分钟使培养物沉淀，将沉淀重新悬浮于50mM Tris pH9(约12.5ml/克沉淀)中。将悬浮液混合直至完全均匀。细胞裂解通过超声处理进行(开启6x30秒，关闭6x30秒)。将DDM加入到裂解物中(1％终浓度)，然后在频繁拌和下在37℃培育45分钟。通过在20,000g离心45分钟使裂解物沉淀。然后将样品在加热至85℃之前和之后在7.5％Tris HCl凝胶上可视化，以确定是否形成异源孔。

对于所有测试的样品，没有观察到异源孔。这证实了将相同的细菌细胞用编码两个亚基的所述DNA进行共转化，并随后以受控方式诱导表达是获得感兴趣的异源孔所必需的。

实施例3

该实施例描述了为了确定有利于形成稳定的7∶1异源孔的最佳IPTG：鼠李糖的比例而研究的许多不同条件。

简言之，含有编码MspA-((Del-L74/G75/D118/L119)D56N/E59R/L88N/D90N/D91N/N108P/Q126R/D134R/E139K)(SEQ ID NO：2，在单体中具有以下突变：D56N/E59R/L88N/D90N/D91N/Q126R/D134R/E139K，并且在单体中具有以下氨基酸的缺失：L74/G75/D118/L119)的多肽的DNA(SEQ ID NO：29)的pRham载体和含有编码MspA-((Del-L74/G75/D118/L119)D56N/E59R/L88N/D91N/N108P/Q126R/D134R/E139K/BastL/H6)(SEQ ID NO：2，在单体中具有以下突变：D56N/E59R/L88N/D90N/D91N/Q126R/D134R/E139K，其中BasTL具有SEQ IDNO：26并且连接到C末端，所述六个组氨酸(H6)连接到BasTL的C末端的3’端，并且在单体中具有以下氨基酸的缺失：L74/G75/D118/L119)的多肽的DNA(SEQ ID NO：30)的pT7载体共转化为Lemo21(DE3)感受态大肠杆菌细胞并在含有0.1mg/ml氨苄青霉素和0.034mg/ml卡那霉素的500ml TB培养基中生长，如实施例1中所述。一旦培养物达到OD600为0.85，则将其等分成14×10ml子培养物。用如下所示不同量的鼠李糖和IPTG诱导每个子培养物：

1)0.5％鼠李糖/1mM IPTG

2)1％鼠李糖/1mM IPTG

3)1％鼠李糖/0.5mM IPTG

4)1.5％鼠李糖/1mM IPTG

5)1.5％鼠李糖/0.5mM IPTG

6)2％鼠李糖/1mM IPTG

7)2％鼠李糖/0.5mM IPTG

8)3％鼠李糖/1mM IPTG

9)3％鼠李糖/0.5mM IPTG

10)1％鼠李糖/0.25mM IPTG

11)0.5％鼠李糖/0.5mM IPTG

12)0.5％鼠李糖/0.25mM IPTG

13)0％鼠李糖/1mM IPTG

14)0.5％鼠李糖/0mM IPTG

在18℃搅拌下进行约18小时的诱导。通过在6,000g离心30分钟使培养物沉淀。将沉淀重悬于50mM Tris pH9(约12.5ml/克沉淀)中。将悬浮液混合直到完全均匀。通过超声处理进行细胞裂解(开启6×30秒，关闭6×30秒)。将DDM加入到细胞裂解物中(1％终浓度)，然后在频繁拌和下在37℃下培育45分钟。通过在20,000g离心45分钟使裂解物沉淀。

溶解后，将样品按照制造商所说明的在Qiagen NiNTA琼脂糖珠上批量纯化。洗脱液分成两等份。将一个等份试样保持不加热，并将另一个等份加热至85℃，以评估两个样品在10％TGX(电泳槽(bio rad))凝胶上可视化之前的热稳定性。凝胶分析证实，具有1.5％鼠李糖和0.5mM IPTG的条件5时得到了最多量的稳定的兴趣MspA-2的异源孔。

实施例4

该实施例描述了，如何研究许多不同标签它们改变单体寡聚效率的能力。为了本实验的目的，将不同长度和电荷的不同标签添加到MspA单体MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)(SEQ ID NO：2，具有以下突变：G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)的N或C终端。通过本领域已知的PCR方法产生这种构建体的DNA。通过QIAGEN Plasmid Midi Kit(目录号12145)制备含有T7启动子和有或没有标签的MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)(SEQID NO：2，具有以下突变：G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)的DNA的环状DNA质粒，并将样品的浓度调节至400ng/uL。通过使用用于环状DNA的大肠杆菌T7-S30提取系统(Promega，No.L1130)，通过偶联的体外转录和翻译(IVTT)产生蛋白质。使用制备的兔红细胞膜(rRBCM)来促进单体寡聚成为其寡聚物。将感兴趣单体的DNA(16ul，400ng/ul)用于100uL IVTT反应，产生同源寡聚孔——其中寡聚物中的所有单体均相同。将两个单体的DNA(例如：标记和未标记的版本)以特定比例混合在一起，并将该DNA混合物(16μl，400ng/uL)用于100uL IVTT反应，以产生异源寡聚孔。根据所使用的DNA的比例(未标记的：标记的)，在反应中产生一系列异源寡聚物(例如：8∶0，7∶1，6∶2，5∶3等)。因此，调整两个单体之间的DNA的比例以偏向所产生的所需的寡聚孔(例如：8∶0，7∶1中的多个而不是3∶5，2∶6)。

为了在IVTT中产生蛋白质，将50uL的rRBCM(10mM Mops pH 7.4，2mg/mL)在1.5mLEppendorf管中离心并除去上清液。将沉淀重新悬浮于进行100uL IVTT反应所需的IVTT试剂中。将试剂盒中提供的减去了半胱氨酸的完整氨基酸混合物(1mM)和减去了甲硫氨酸的完整氨基酸混合物(1mM)，以等体积混合，产生用于产生高浓度蛋白质所需的工作氨基酸溶液。将10uL该氨基酸混合物与预混合溶液(40uL)，L-[35S]甲硫氨酸(2uL，PerkinElmer，商品编号NEG009A001MC)，如上所述的质粒DNA(16uL，400ng/uL)和补充有利福平(最终20μg/ml)的T7-S30提取物(30uL)混合。在37℃进行1.5小时蛋白质合成，以产生放射性标记的IVTT蛋白质。由于在IVTT反应混合物中存在rRBCM和大肠杆菌细胞膜，所以在反应中合成的单体在膜上组装以产生同源或异源寡聚纳米孔。离心后，用MBSA(100uL，用NaOH滴定的10mMMOPS，150mM NaCl，pH 7.4，含有1mg/ml BSA)洗涤所得的膜沉淀物，并将沉淀重新悬浮于100uL的1xlaemmli样品缓冲液中。将样品分成两份，将一份样品在85℃加热15分钟以评估寡聚物的热稳定性。加热和/或未加热的样品用TGS运行缓冲液在5％或7.5％Tris HCl凝胶中在50mV进行电泳16小时。将凝胶干燥并进行放射自显影(autoradiography)以显现蛋白质。

4.1-标签长度的影响

通过改变标签的长度，可以偏向产生所需寡聚物。在以下的实施例中，将MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)(SEQ ID NO：2，具有以下突变：G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)用完整长度的BasTL(SEQ ID NO：26)和截断型的BasTL进行标记。将标记的单体寡聚成其同源寡聚物或与未标记的MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)(SEQ ID NO：2，具有以下突变：G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)混合，以产生异源寡聚物。将加热的样品在7.5％Tris HCl凝胶上运行(参见图2)。

图2的泳道A显示了MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)8同源寡聚物。泳道C和E分别显示了MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K/BasTL(减去20aa))8和MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K/BasTL(减去40aa))8的同源寡聚物。虽然在每个实验中使用相同量的DNA，但是与未标记的版本相比(图2中显示出更暗的条带的泳道A)，当连接长多肽标签(BasTL为这种情况)(图2的泳道C和E)时，产生的同源寡聚物的量减少。图2的泳道B、D和F显示了当MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)分别与MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K/BasTL)，MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K/BasTL(减去20aa))和MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K/BasTL(减去40aa))混合时产生的异源寡聚物。图2的每个泳道中的每个条带具有在相应条带旁边标记的凝胶中产生条带的单体单元的比例(未标记的单体：标记的单体)。结果表明，通过改变标签的长度，可以操纵所需的异源寡聚物的产生。

4.2标签电荷的影响

将MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)单体在N或C末端用不同长度的各种带电荷的标签进行修饰。在IVTT实验中分析了这些单体形成孔的能力。所测试的不同标签的完整列表包括R8SG，D6SG，R6SG，R8，NGDSD6SG，D4SG，R4SG，D4，D6，GDSGD4SG，R4H6，D4H6，D8，R6，D10，R4，D4，D8H6，R8H9，D10H6和R6H6。用D10H6，R8或R8H6标签标记的MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)单体在下文和图3中更详细地描述。

图3展示了5％Tris HCl凝胶，其比较了当多种不同标签连接到MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)单体的C末端时该单体的寡聚。图3中的白色圆圈表示在每个通道中形成的MspA同源寡聚体。泳道A显示了在C末端没有任何标签时的MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)单体能很好地寡聚。泳道B显示了由MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)单体形成的寡聚物在至少高达85℃时仍稳定。泳道C显示了在MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)单体C末端的D10H6标签能阻止其完全寡聚，或至少形成的寡聚物不是SDS稳定的。泳道E和F显示了虽然MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)单体的C末端的R8标签能很好地寡聚，但是寡聚物的热稳定性因添加标签而受到损害。泳道G显示了与泳道A中未标记单体相比，MspA-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)单体C末端的R8H6标签降低了其寡聚化能力。泳道H显示了与R8标签相似地，R8H6标签也损害了其寡聚物的热稳定性。

Claims

1.一种包含特定化学计量比的两种不同单体的异源寡聚孔的制备方法，包括：(a)在第一可诱导载体中用第一不同单体转染或转化细胞；(b)在第二可诱导载体中用第二不同单体转染或转化所述细胞；和(c)诱导所述第一和第二可诱导载体，使得所述细胞产生包含特定化学计量比的所述第一和第二不同单体的异源寡聚孔。

2.根据权利要求1所述的方法，其中所述第一不同单体与所述第二不同单体的所述特定化学计量比为至少5∶1。

3.根据权利要求1或2所述的方法，其中所述第一不同单体与所述第二不同单体的所述特定化学计量比为6∶1或7∶1。

4.根据前述权利要求中任一项所述的方法，其中所述第一和第二可诱导载体是可差异诱导的。

5.根据权利要求4所述的方法，其中步骤(c)包括差异诱导所述第一和第二可诱导载体。

6.根据权利要求5所述的方法，其中步骤(c)包括以不同的程度诱导所述第一和第二可诱导载体。

7.根据前述权利要求中任一项所述的方法，其中在步骤(c)中，所述第一和第二不同单体由所述细胞以使得形成包含所述特定化学计量比的所述第一和第二不同单体的异源寡聚孔的比例进行表达。

8.根据前述权利要求中任一项所述的方法，其中对所述第一和第二不同单体中的至少一个进行修饰，以与其不存在修饰时的表达相比影响其表达。

9.根据前述权利要求中任一项所述的方法，其中所述第一和第二不同单体中的至少一个进行修饰，以影响其与自身或与其他不同单体寡聚的能力。

10.根据前述权利要求中任一项所述的方法，其中所述第一可诱导载体和/或所述第二可诱导载体包括阿拉伯糖启动子、丙酸酯启动子、鼠李糖可诱导启动子、木糖启动子或乳糖启动子。

11.根据前述权利要求中任一项所述的方法，其中所述第一可诱导载体包括鼠李糖可诱导启动子，所述第二可诱导载体包括乳糖启动子。

12.根据前述权利要求中任一项所述的方法，其中所述第一可诱导载体由鼠李糖诱导，所述第二可诱导载体由异丙基β-D-硫代半乳糖吡喃糖苷(IPTG)诱导。

13.根据前述权利要求中任一项所述的方法，其中所述第二不同单体与肽或多肽标签进行基因融合，所述肽或多肽标签能降低所述第二不同单体与自身寡聚的能力或降低其与不存在标签时的表达相比其表达。

14.根据权利要求13所述的方法，其中所述标签在所述第二不同单体的羧基(C)末端进行基因融合，并降低其与自身寡聚的能力

15.根据权利要求13所述的方法，其中所述标签在所述第二不同单体的氨基(N)末端进行基因融合，并与不存在标签时其表达相比降低其表达。

16.根据权利要求13-15中任一项所述的方法，其中所述标签包括(a)4，6，8或10个连续的精氨酸(R)残基或天冬氨酸(D)残基，和/或(b)6或9个连续的组氨酸(H)残基。

17.根据权利要求16所述的方法，其中所述标签进一步包括丝氨酸-甘氨酸(SG)、天冬酰胺-甘氨酸-天冬氨酸-丝氨酸(NGDS)或甘氨酸-天冬氨酸-丝氨酸-甘氨酸(GDSG)。

18.根据权利要求13-17中任一项所述的方法，其中所述方法进一步包括(d)使用所述标签纯化包含所述特定化学计量比的两种不同单体的异源寡聚孔。

19.根据前述权利要求中任一项所述的方法，其中所述第二不同单体与BasTL序列(SEQID NO：26)或其片段进行基因融合。

20.根据权利要求19所述的方法，其中所述BasTL序列或其片段在所述第二不同单体的羧基(C)末端进行基因融合，或者其中所述BasTL序列或其片段在所述第二不同单体的羧基(C)末端进行基因融合并将所述标签——如果存在的话——与所述第二不同单体分离。

21.根据前述权利要求中任一项所述的方法，其中所述第一可诱导载体包含第一选择标记，所述第二可诱导载体包含第二选择标记。

22.根据权利要求21所述的方法，其中所述第一和第二选择标记彼此不同。

23.根据权利要求22所述的方法，其中所述第一选择标记为提供对卡那霉素的抗性的基因，所述第二选择标记为提供对氨苄青霉素的抗性的基因。

24.根据前述权利要求中任一项所述的方法，其中在步骤(c)中，所述第一和第二单体在细胞中以特定化学计量比进行表达，所述异源寡聚孔在细胞膜中形成。

25.根据前述权利要求中任一项所述的方法，其中所述细胞为大肠杆菌。

26.一种异源寡聚孔，其使用根据前述权利要求中任一项所述的方法制备。

27.根据权利要求26所述的异源寡聚孔，其中所述孔包括两种不同单体，每种单体包括SEQ ID NO：2中所示序列或其变体，并且其中所述第一不同单体与所述第二不同单体的特定化学计量比为7∶1。

28.根据权利要求27所述的异源寡聚孔，其中所述第二不同单体不同于所述第一不同单体之处在于，在对应于SEQ ID NO：2的位置88，90，91，92，93，102，103和105的一个或多个位置处含有带负电荷的氨基酸。

29.根据权利要求28所述的异源寡聚孔，其中所述第二不同单体不同于所述第一不同单体之处在于，在对应于SEQ ID NO：2的位置90，91，93和105的一个或多个位置处含有带负电荷的氨基酸。

30.一种表征目标多核苷酸的方法，包括：

a)使多核苷酸与权利要求25-28中任一项所述的异源寡聚孔接触，使得所述多核苷酸移动通过所述孔；和

b)在所述多核苷酸相对于所述孔移动时获取一个或多个测量值，其中所述测量值指示所述多核苷酸的一个或多个特征，并从而表征所述目标多核苷酸。

31.根据权利要求30所述的方法，其中所述一个或多个特征选自(i)多核苷酸的长度，(ii)多核苷酸的同一性，(iii)多核苷酸的序列，(iv)二核苷酸的二级结构，和(v)多核苷酸是否被修饰。

32.根据权利要求30或31所述的方法，其中多核苷酸的所述一个或多个特征通过电测量和/或光学测量进行测量。

33.根据权利要求32所述的方法，其中所述电测量为电流测量、阻抗测量、隧道测量或场效应晶体管(FET)测量。

34.根据权利要求30-33中任一项所述的方法，其中步骤a)进一步包括，使所述多核苷酸与多核苷酸结合蛋白接触，使得所述蛋白控制所述多核苷酸通过所述孔的运动。

35.根据权利要求34所述的方法，其中所述方法进一步包括：

a)使所述多核苷酸与所述孔和多核苷酸结合蛋白接触，使得所述多核苷酸移动通过所述孔，并且所述蛋白控制所述多核苷酸通过所述孔的移动；和

b)当所述多核苷酸相对于所述孔移动时测量通过所述孔的电流，其中所述电流表示所述多核苷酸的一个或多个特征，从而表征所述目标多核苷酸。

36.根据权利要求34或35所述的方法，其中所述多核苷酸结合蛋白为解旋酶或衍生自解旋酶。

37.根据权利要求30-36中任一项所述的方法，其中所述孔在膜中。

38.根据权利要求37所述的方法，其中所述膜为两亲层或固态层。

39.根据权利要求37或38所述的方法，其中所述多核苷酸在与所述孔接触之前偶联到所述膜。

40.一种用于表征目标多核苷酸的试剂盒，包括(a)权利要求25-28中任一项所述的异源寡聚孔，和(b)膜的组分。

41.一种用于表征样品中的目标多核苷酸的设备，包括(a)多个权利要求25-28中任一项所述的异源寡聚孔，和(b)多个膜。

42.一种用于表征目标多核苷酸的方法，包括：

a)使多核苷酸与权利要求25-28中任一项所述的异源寡聚孔、聚合酶和标记的核苷酸接触，使得通过聚合酶将磷酸盐标记的物质顺序添加到目标多核苷酸，其中磷酸盐物质含有对每个核苷酸特异性的标记；和

b)使用所述孔检测磷酸盐标记的物质，并从而表征所述多核苷酸。

43.一种形成用于表征目标多核苷酸的传感器的方法，包括在权利要求25-28中任一项所述的异源寡聚孔和多核苷酸结合蛋白之间形成复合物，并从而形成用于表征目标多核苷酸的传感器。

44.一种用于表征目标多核苷酸的传感器，包括在权利要求25-28中任一项所述的异源寡聚孔和多核苷酸结合蛋白之间形成的复合物。