CN104710519A - Msp纳米微孔和相关方法 - Google Patents

Msp纳米微孔和相关方法 Download PDF

Info

Publication number
CN104710519A
CN104710519A CN201510144374.5A CN201510144374A CN104710519A CN 104710519 A CN104710519 A CN 104710519A CN 201510144374 A CN201510144374 A CN 201510144374A CN 104710519 A CN104710519 A CN 104710519A
Authority
CN
China
Prior art keywords
msp
sudden change
porin
mspa
monomer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510144374.5A
Other languages
English (en)
Other versions
CN104710519B (zh
Inventor
J·H·贡德拉赫
M·尼德韦斯
T·Z·巴特勒
M·帕夫伦科
M·A·特罗尔
S·斯库马兰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Washington
UAB Research Foundation
Original Assignee
University of Washington
UAB Research Foundation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=42040208&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=CN104710519(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by University of Washington, UAB Research Foundation filed Critical University of Washington
Publication of CN104710519A publication Critical patent/CN104710519A/zh
Application granted granted Critical
Publication of CN104710519B publication Critical patent/CN104710519B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/02Bacterial antigens
    • A61K39/04Mycobacterium, e.g. Mycobacterium tuberculosis
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/35Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Mycobacteriaceae (F)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N13/00Treatment of microorganisms or enzymes with electrical or wave energy, e.g. magnetism, sonic waves
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • G01N27/26Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating electrochemical variables; by using electrolysis or electrophoresis
    • G01N27/416Systems
    • G01N27/447Systems using electrophoresis
    • G01N27/44704Details; Accessories
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • G01N27/26Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating electrochemical variables; by using electrolysis or electrophoresis
    • G01N27/416Systems
    • G01N27/447Systems using electrophoresis
    • G01N27/44756Apparatus specially adapted therefor
    • G01N27/44791Microapparatus
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/483Physical analysis of biological material
    • G01N33/487Physical analysis of biological material of liquid biological material
    • G01N33/48707Physical analysis of biological material of liquid biological material by electrical means
    • G01N33/48721Investigating individual macromolecules, e.g. by translocation through nanopores
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6872Intracellular protein regulatory factors and their receptors, e.g. including ion channels
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N24/00Investigating or analyzing materials by the use of nuclear magnetic resonance, electron paramagnetic resonance or other spin effects

Abstract

本文中提供了耻垢分枝杆菌孔蛋白纳米孔、包含此类纳米孔的系统以及使用和产生此类纳米孔的方法。此类纳米孔可以是野生型MspA孔蛋白、突变MspA孔蛋白、野生型MspA旁系同源物孔蛋白、野生型MspA同系物孔蛋白、突变MspA旁系同源物孔蛋白、突变MspA同系物孔蛋白或单链Msp孔蛋白。还提供了能够诱导型表达Msp孔蛋白的细菌菌株。

Description

MSP纳米微孔和相关方法
本申请是申请日为2009年9月22日、发明名称为“MSP纳米微孔和相关方法”的中国发明专利申请200980142855.5的分案申请。
交叉参考相关申请
本申请要求2008年9月22日提交的美国临时申请系列案61/098,938的权益,所述临时申请系列案以其全文通过引用合并入本文。
政府许可权利的声明
本发明是利用在由国立卫生研究院授予的基金号5R21HG004145下的政府资助进行的。政府在本发明中具有某些权利。
背景
已建立的DNA测序技术需要大量DNA和若干冗长的步骤来仅构建全长序列的数十个碱基。然后必须以“鸟枪法”方式(非线性地依赖于基因组的大小和依赖于从其构建全长基因组的片段的长度的工作)装配该信息。这些步骤很昂贵且费时,尤其当测定哺乳动物基因组的序列时。
概述
本文中提供了包括对具有界定通道(tunnel)的前厅(vestibule)和缢缩区(constriction zone)的耻垢分枝杆菌(Mycobacteriumsmegmatis)孔蛋白(Msp)孔蛋白施加电场的方法,其中Msp孔蛋白位于第一导电液体介质与第二导电液体介质之间。
还提供了改进通过Msp孔蛋白的通道(tunnel)的电导的方法,包括除去、添加或置换野生型Msp孔蛋白的前厅或缢缩区中的至少一个氨基酸。
还提供了包括具有界定通道的前厅和缢缩区的Msp孔蛋白的系统,其中所述通道位于第一液体介质与第二液体介质之间,其中至少一种液体介质包含分析物,以及其中系统对于检测分析物的性质是有效的。
还提供了包括具有界定通道的前厅和缢缩区的Msp孔蛋白的系统,其中所述通道位于第一液体介质与第二液体介质之间的脂双层中,并且其中第一与第二液体介质之间的液体连通的唯一点存在于通道中。
还提供了突变的Msp孔蛋白。例如,提供了突变的耻垢分枝杆菌孔蛋白A(MspA),其包含界定通道的前厅和缢缩区,以及至少第一突变MspA单体,所述单体包含位置93上的突变和位置90、位置91或位置90及91上的突变。还提供了突变的MspA孔蛋白,其包含具有约2至约6nm的长度和约2至约6nm的直径的前厅,和具有约0.3至约3nm的长度和约0.3至约3nm的直径的缢缩区,其中所述前厅和缢缩区一起界定了通道,以及还包含至少第一突变MspA旁系同源物或(paralog)同系物(homolog)单体。还提供了突变MspA旁系同源物或同系物,其包含具有约2至约6nm的长度和约2至约6nm的直径的前厅,和具有约0.3至约3nm的长度和约0.3至约3nm的直径的缢缩区,其中所述前厅和缢缩区一起界定了通道。
描述了产生突变的Msp孔蛋白的方法。例如,本文中提供了产生突变的MspA孔蛋白的方法,包括在位置93上和位置90、位置91或位置90及91上修饰野生型MspA单体。还提供了产生具有界定了通道的前厅和缢缩区的突变MspA孔蛋白的方法,包括在野生型MspA旁系同源物或同系物单体的前厅或缢缩区中缺失、添加或置换任何氨基酸以便所得的突变MspA孔蛋白能够在施加电场后将分析物转位通过通道。
还提供了一种方法,所述方法包括在不使用电场的情况下使分析物转位通过耻垢分枝杆菌孔蛋白(Msp)孔蛋白的通道。
本文中提供了核酸序列。任选地,核酸序列可包含第一和第二核苷酸序列,其中所述第一核苷酸序列编码第一Msp单体序列并且第二核苷酸序列编码第二Msp单体序列。该核酸序列还可包含编码氨基酸连接体序列的第三核苷酸序列。任选地,该核酸序列还包含编码第三或更多Msp单体序列的第三或更多核苷酸序列。例如,所述核酸序列还可包含第3、第4、第5、第6、第7和第8核苷酸序列。所述第1、第2、第3、第4、第5、第6、第7和第8核苷酸序列编码第1、第2、第3、第4、第5、第6、第7和第8Msp单体序列,并且该核酸序列还包含编码氨基酸连接体序列的第9核苷酸序列。还提供了包含两个或更多个单链Msp的Msp孔蛋白。
还提供了由本文中所述的核酸编码的多肽。还提供了包含本文中描述的多肽的载体。还提供了用本文中描述的任何载体转染的培养细胞或其后代,其中所述细胞能够表达Msp孔蛋白或Msp孔蛋白单体。还提供了包含本文中描述的任何载体的耻垢分枝杆菌菌株。
还提供了能够诱导Msp单体表达的突变的细菌菌株,所述细菌菌株包含:(a)野生型MspA的缺失;(b)野生型MspC的缺失;(c)野生型MspD的缺失;和(d)包含有效地连接于Msp单体核酸序列的诱导型启动子的载体。
还提供了产生单链Msp孔蛋白的方法,所述方法包括:(a)用包含能够编码单链Msp孔蛋白的核酸序列的载体转化突变的细菌菌株;和任选地(b)从所述细菌纯化单链Msp孔蛋白。该突变的菌株可包含野生型MspA、野生型MspB、野生型MspC和野生型MspD的缺失,以及包含有效地连接于Msp核酸序列的诱导型启动子的载体。可用包含能够编码单链Msp孔蛋白的核酸序列的载体转化该突变的菌株。
还提供了使用Mps孔蛋白例如单链Msp孔蛋白的方法。例如,所述方法可包括产生具有第一侧面和第二侧面的脂双层,向脂双层的第一侧面加入Msp孔蛋白例如纯化的单链Msp孔蛋白,对双分子层的第二侧面施加正电位,使实验性核酸序列或多肽序列转位通过Msp孔蛋白,测量使序列转位通过Msp孔蛋白的阻塞电流,以及将该实验性阻塞电流与阻塞电流标准相比较,确定该实验性序列。
附图概述
上述方面和许多附带的有利方面将变得更容易理解,因为当与下列附图结合,参考下列详述,上述方面和许多附带的有利方面可得到更好地理解。
图1显示野生型MspA(WTMspA)孔蛋白的结构和电荷分布。在pH 8时,预期酸性残基主要带负电荷并且碱性残基主要带正电荷。突变的位置和残基由箭头和标记指示。参见Faller等人,Science,303:1189(2004)。
图2显示WTMspA、突变体D90N/D91N/D93N(M1MspA,也称为M1-NNN)和突变体D90N/D91N/D93N/D118R/E139K/D134R(M2MspA,也称为M2-NNN)孔蛋白的通道形成活性和单通道电导的测定结果。左图显示当MspA孔蛋白存在于水浴双分子层的溶液(1MKCl,20℃)中时,双分子层的电导随时间的变化。电导的逐步增加被解释为MspA孔蛋白至双分子层内的插入。右边是这些电导步长(conductance step)的大小的直方图。WTMspA、M1MspA和M2MspA孔蛋白的直方图分别概括了来自3个重复实验的40个插入、来自3个重复实验的144个插入和来自5个重复实验的169个插入。
图3A和3B显示了WTMspA孔蛋白的自发阻塞行为。图3A是实验的示意图。图3B显示在DNA不存在的情况下在60mV(左)和100mV(右)下对于WTMspA孔蛋白观察到的代表性离子电流信号。负电流的间隔时间相应于施加的电压的反转,这通常是重建未被阻塞的离子电流水平所需的。
图4显示电泳凝胶中突变的MspA单体的表达。向各泳道中加入粗制提取物(13μL)。用考马斯蓝染色凝胶。泳道1:蛋白质分子量标准;泳道2:WTMspA;泳道3:无MspA;泳道4:突变体M1MspA;泳道5:突变体D90N/D91N/D93N/D118R;泳道6:突变体D90N/D91N/D93N/D118R/E139R;泳道7:突变体D90N/D91N/D93N/D118R/E139K;泳道8:突变体M2MspA。构建、提取和测定泳道5至7中的突变体以确保对于每一个连续氨基酸置换保持表达和通道形成活性。凝胶上方的简图示意性显示在该实验中突变的氨基酸的大致位置和极性。
图5A-5C显示利用M1MspA孔蛋白进行的ssDNA发夹构建体的检测。图5A是实验的示意图。图5B显示在180和140mV下在DNA不存在和在8μM hp08(SEQ ID NO:4)发夹DNA存在的情况下对于M1MspA孔蛋白观察到的代表性离子电流信号。图5C显示在放大的时标(expanded time scale)上来自图5B中的描记线的已编号的阻塞。
图6显示M1MspA孔蛋白中来自发夹构建体的深度阻塞的特征。每一个点的坐标给出了1个深度阻塞的持续时间和平均电流。分别在140和180mV获得黑色和灰色数据。对于每一个数据集,标出深度阻塞驻留时间tD的log10模式。右边的简图显示每一个发夹构建体的序列:hp08(5′GCTGTTGC TCTCTC GCAACAGC A503′)(SEQ IDNO:4)、hp10(5′GCTCTGTTGC TCTCTC GCAACAGAGC A503′)(SEQ ID NO:5)和hp12(5′GCTGTCTGTTGC TCTCTCGCAACAGACAGC A50-3′)(SEQ ID NO:6)。
图7是显示M1MspA孔蛋白中针对hp08(SEQ ID NO:4)的部分阻塞驻留时间分布的图。分布十分拟合单指数模式。在180mV下的部分阻塞具有约比在140mV上长3倍的时间常数。
图8提供了M1MspA孔蛋白中发夹构建体深度阻塞的驻留时间分布的详细外观。左边的图框显示具有驻留时间(x)的log10的概率分布的对数二进制图(阶梯图)和相应核平滑密度估计的驻留时间直方图。将这些平滑的密度估计值的最大值tD用于参数化驻留时间分布。垂直线显示tD值。右边的图框显示来源于驻留时间数据(实线)和单衰减指数(single decaying exponential)的存活概率曲线,时间常数设置为每一个数据组的tD值(虚线)。数据明显偏离单指数变动形态(simpleexponential behavior)。然而,进行tD值与用于其他观察的指数时间常数之间的定性比较是合理的(Kasianowicz等人,Proc.Natl Acad.Sci.USA,93:13770(1996)),因为这两个参数均反映了驻留时间分布的相似方面。
图9A-9G显示获自跨双层探针实验(transbilayer probeexperiment)的数据。图9A显示分子构型的动画(animation):(1)未被阻塞的孔;(2)具有阻止nA–ssDNA复合物转位的neutravidin(nA)的丝状ssDNA;(3)与nA–ssDNA杂交的靶DNA在负电压下分离;和(4)nA–ssDNA复合物在某一电压下(依赖于靶DNA的杂交)从孔排出。图9B是外施电压的时间序列。电流阻塞在约200ms的延迟后触发从180mV捕捉电压至40mV的维持电压的变化。维持电压维持5秒以允许杂交,然后向负电压下降。图9C和9D各自显示表明nA–ssDNA分别在负和正电压下排出的电流时间序列。由于瞬间电压改变和在大的负电压下自发的孔关闭,大电流尖脉冲产生。图9E–9G是排出电压(exit voltage)(Vexit)直方图。图9E显示一个实验,在该实验中,探针5'-C6A54-CTCTATTCTTATCTC-3'(SEQ ID NO:7)与靶ssDNA分子5'-GAGATAAGAATAGAG-3'(SEQ ID NO:9)互补。图9F显示与图9E中相同的孔,但其使用不与靶DNA互补的探针5'-C6A54-CACACACACACACAC-3'(SEQ ID NO:8)。图9G显示来自使用与图9E中的探针相同的探针(SEQ ID NO:7)但在反面区室(transcompartment)中不存在靶DNA的单独的对照的结果。只在图9E中观察到大量负Vexit事件,其中探针(SEQ ID NO:7)与靶互补。图9F和9G中负Vexit事件的极少发生排除了图9E中的大部分负Vexit是由非特异性探针-靶结合或由探针对孔的结合所引起这种可能性。
图10A-10C比较了M1MspA与M2MspA孔蛋白的dT50(SEQ IDNO:32)均聚物阻塞。图10A是实验的示意图。图10B显示了对于利用8μM dT50(左)的M1MspA孔蛋白和利用2μM dT50(右)的M2MspA孔蛋白观察到的代表性离子电流信号。图10C显示在放大的时标上来自图10B中的描记线的已编号的阻塞。
图11显示M2MspA孔蛋白中dT50(SEQ ID NO:32)阻塞的统计学特征。在阻塞开始和结束时平均结构的比较。通过重叠事件开始时(左)和事件结束时(右)对齐的数据文件中的事件来产生图。显示了阻塞以离子电流的短暂向下偏转终止的趋势以及该趋势随电压升高而增加。
图12A显示被DNA构建体阻塞的M1MspA孔蛋白中阻塞电流水平的直方图。DNA构建体从上至下为:3'-A47AAC-hp-5'(SEQ IDNO:14);3'-A47ACA-hp-5'(SEQ ID NO:33);3'-A47CAA-hp-5'(SEQ IDNO:13);3'-C50-hp-5'(SEQ ID NO:16);3'-A50-hp-5'(SEQ ID NO:10)。图12B显示针对poly-C(=1.0)与poly-A(=0.0)水平之间的差异标度的电流水平对单个C的位置的曲线。高斯拟合表明对于单个C的识别位置距离发夹末端1.7±0.8个核苷酸(nt)。
图13显示许多阻塞M1-NNN MspA(也称为M1MspA)孔蛋白的DNA的电流直方图。DNA构建体从上到下为:3'-C50-hp-5'(SEQ IDNO:16);3'-A50-hp-5'(SEQ ID NO:10);3'-T47TTT-hp-5'(SEQ IDNO:17);3'-A47AAT-hp-5'(SEQ ID NO:34);3'-A47ATA-hp-5'(SEQ IDNO:35);3'-A47TAA-hp-5'(SEQ ID NO:36);3'-C47CCA-hp-5'(SEQ IDNO:37);3'-C47CAC-hp-5'(SEQ ID NO:38);3'-C47ACC-hp-5'(SEQ IDNO:39)。每一个构建体或混合物示于左边。每一个直方图中事件的数量示于右边。上图:"校准混合物"(poly-A-hp和poly-C-hp)。图2-5:Poly-T-hp和poly-A背景中的单个T碱基。下方三个图:poly-A背景中的单个A碱基。Poly-A-hp包含在用于参照的混合物中(小峰值在19.5%上)。全部数据采用180mV。
图14显示DNA尾不影响识别性质。图例是关于图13的。两个非均质尾('ran1'(SEQ ID NO:51)、'ran2'(SEQ ID NO:52),各自47个碱基)连接至三核苷酸和发夹。中间的图显示当将A50-hp DNA(SEQ ID NO:10)与ran1-C3-hp DNA的混合物用于孔时产生的电流直方图,其为其他图的参照点。电流水平与A50或C50尾的电流水平相同。全部数据采用180mV。
图15A和15B显示M2-QQN孔蛋白(另一种突变的MspA孔蛋白)的表征数据。图15A显示了该突变体的表达水平。全部蛋白质在ML16耻垢分枝杆菌中表达。将10μl 0.5%辛基聚氧乙烯(octylpolyoxyethylene)粗制提取物加入每一个孔。泳道1:WTMspA;泳道2:背景(pMS2,空载体);泳道3:M2-QQN(pML866)。图15B显示在1M KCl中记录的二植烷酰磷脂酰胆碱(diphytanoylphosphatidylcholine)脂双层中的M2-QQN孔蛋白的电流描记线。将大约70pg的蛋白质加入至双层小室。在脂双层实验中分析4个膜的约100个孔。M2-QQN孔蛋白的主电导(mainconductance)为2.4纳秒(nS)。
图16显示关于暴露于hp-T50(SEQ ID NO:17)、hp-C50(SEQ IDNO:16)和hp-A50(SEQ ID NO:10)的发夹DNA混合物的3种不同突变MspA孔蛋白的阻塞电流直方图。在每一种情况下,对于每一个突变体,将电流针对右边显示的开放态电流(open state current)进行标准化。将hp-C50和hp-A50作为混合物使用,而T50单独使用。
图17是显示两种突变MspA孔蛋白的深度电流阻塞的存在概率。显示了比t持续更长的事件的概率。圆圈表示M2-QQN孔蛋白,十字形表示M2-NNN孔蛋白。双层两侧施加的电压是100、120和140mV。将数据针对每一个记录中的事件总数标准化。
图18显示耻垢分枝杆菌的MspA、MspB、MspC和MspD单体的比对。开放阅读框架的第一ATG或GTG密码子被当作假定的起始密码子。蛋白质的编号始于成熟部分的第一个氨基酸。MspA单体氨基酸序列是SEQ ID NO:28,MspB单体氨基酸是SEQ ID NO:29,MspC单体氨基酸是SEQ ID NO:30,以及MspD单体氨基酸序列是SEQ ID NO:31。
图19是显示耻垢分枝杆菌孔蛋白-四重突变体(quadruplemutant)ML59中每一个孔蛋白基因的缺失的凝胶图像。
图20显示显示Msp孔蛋白在耻垢分枝杆菌中表达和耻垢分枝杆菌孔蛋白突变体的Western印迹。泳道1是1:10稀释的野生型耻垢分枝杆菌的蛋白质提取物,泳道2是突变体MN01(△mspA),泳道3是突变体ML10(△mspAC),泳道4是突变体ML16(△mspACD),以及泳道5是突变体ML180(△mspABCD)。
图21A和21B显示用于四重孔蛋白突变体的构建的质粒图谱。Hyg:潮霉素抗性基因;ColE1:大肠杆菌(E.coli)复制起始点。图21A是用于MspA表达的整合质粒图谱。AmiC、A、D、S是MspA的乙酰胺诱导型表达所必需的。attP:噬菌体L5的染色体附着位点;int:L5整合酶;FRT:Flp重组酶位点。图21B是MspB缺失载体的质粒图谱。MspBup、MspBdown:MspB的上游和下游区域;loxP:Cre重组位点;SacB:蔗糖6-果糖基转移酶;XylE:儿茶酚-2,3-双加氧酶;Gfp2+:绿色荧光蛋白;tsPAL5000:分枝杆菌的温度敏感型复制起点。
图22是显示耻垢分枝杆菌中MspA单体的诱导型表达的考马斯蓝染色凝胶的图像。
图23是显示Msp四重突变体ML705在Middlebrook 7H10琼脂板上生长的图像。
图24是显示ML705在丰富液体培养中的生长率的照片。
图25是显示在用乙酰胺诱导后MspA单体在四重突变体ML705中的表达的Western印迹图像。泳道1是野生型耻垢分枝杆菌,泳道2是利用乙酰胺的四重突变菌株ML705,泳道3是不使用乙酰胺的四重msp突变菌株ML705,以及泳道4是三重突变菌株ML16。使用针对MspA的多克隆抗体检测蛋白质。
图26A-26D显示单链MspA纳米孔二聚体的结构和通道活性。图26A是单链纳米孔MspA二聚体的分子模型的图像。图26B显示单链MspA纳米孔二聚体(scMspA)基因构建体的示意图。氨基酸连接体区域(GGGGS)3(SEQ ID NO:3)被放大。还显示了氨基酸连接体的DNA序列(5'-GGCGGTGGCGGTAGCGGCGGTGGCGGTAGCGGCGGTGGCGGTAGC-3')(SEQ ID NO:19)。图26C是显示scMspA纳米孔二聚体在耻垢分枝杆菌中表达的Western印迹的图像。泳道1是分子量标准(M),泳道2是野生型耻垢分枝杆菌(WT Msmeg),泳道3是无scMspA基因构建体(ML16)的ML16菌株,泳道4是具有野生型MspA基因构建体(WTMspA)的ML16菌株,泳道5是具有scMspA纳米孔二聚体基因构建体(scMspA)的ML16菌株。图26D显示scMspA纳米孔二聚体的电流描记线。
图27显示运输dC58(SEQ ID NO:40)ssDNA通过野生型MspA孔蛋白的示意图。DNA运输由下列步骤组成:a)开始模拟;b)和c)在快速前进之前和之后DNA构象改变;和d)DNA附着至MspA孔蛋白的表面。
图28是显示图27的dC58(SEQ ID NO:40)ssDNA运输的累积离子电流的图。在1.2V的跨膜偏压下进行运输。
图29显示单链MspA(scMspA)纳米孔八聚体序列的设计。scMspA八聚体由下述组成:野生型MspA基因单体、MspA1单体、MspA2单体、MspA3单体、MspA4单体、MspA5单体、MspA6单体和MspA7单体组成。PacI和HindIII限制性位点侧翼连接scMspA纳米孔八聚体序列。X1-X14是侧翼连接单个单体序列的唯一限制性位点。连接每一个单体的黑线表示(GGGGS)3(SEQ ID NO:3)连接体。
图30显示野生型MspA单体和多种MspA旁系同源物和同系物单体的缢缩区(矩形框)。
图31显示被DNA构建体阻塞的M1MspA中的阻塞电流水平的直方图。DNA构建体从上至下为:3'-A40AAAAAAAAAA-hp-5'(SEQID NO:10);3'-A40CCCCAAAAAA-hp-5'(SEQ ID NO:11);3'-A40AAACCCCAAA-hp-5'(SEQ ID NO:12);3'-A40AAAAAAACAA-hp-5'(SEQ ID NO:13);3'-A40AAAAAAAAAC-hp-5'(SEQ ID NO:14);3'-A40AAAAAACCCC-hp-5'(SEQ ID NO:15);3'-C40CCCCCCCCCC-hp-5'(SEQ ID NO:16);3'-T40TTTTTTTTTT-hp-5'(SEQ ID NO:17);3'-A40AAAAAAAGGG-hp-5'(SEQ ID NO:18)。
发明详述
本文中提供了方法,其包括对具有界定通道的前厅和缢缩区的耻垢分枝杆菌孔蛋白(Msp)孔蛋白施加电场,其中所述Msp孔蛋白位于第一导电液体介质与第二导电液体介质之间。任选地,所述第一和第二液体导电介质相同。任选地,所述第一和第二液体导电介质不同。Msp孔蛋白可以是本文中描述的任何Msp孔蛋白。例如,Msp孔蛋白可选自野生型MspA孔蛋白、突变的MspA孔蛋白、野生型MspA旁系同源物或同系物孔蛋白以及突变的MspA旁系同源物或同系物孔蛋白。
在本文中的任何实施方案中,Msp孔蛋白还可包含分子发动机(motor)。所述分子发动机可以能够以这样的转位速度或平均转位速度将分析物移入或穿过通道,所述速率小于分析物在分子发动机不存在的情况下通过电泳转位入或穿过通道时的转位速度或平均转位速度。因此,在本文中的包括施加电场的任何实施方案中,电场可能足以使分析物通过电泳转位通过通道。
本文中所述的任何液体介质例如导电液体介质可包含分析物。分析物可以是本文中所述的任何分析物。本文中的实施方案还可包括在例如下述方法中检测分析物,所述方法包括当分析物与Msp孔蛋白通道相互作用时测量离子电流以提供电流模式,其中电流模式中阻塞的出现标示着分析物的存在。
任选地,Msp孔蛋白是突变的MspA或突变的MspA旁系同源物或同系物孔蛋白,并且分析物的穿过孔蛋白通道的转位速度或平均转位速度小于或大于分析物穿过野生型MspA或野生型MspA旁系同源物或同系物孔蛋白的通道的转位速度或平均转位速度。
在本文中的任何实施方案中,分析物可具有小于0.5nm/μs的穿过通道的转位速度或平均转位速度。任选地,分析物可具有小于0.05nm/μs的穿过通道的转位速度或平均转位速度。
本文中所述的任何Msp孔蛋白可包含在脂双层中。在本文中的这类实施方案或任何其他实施方案中,Msp孔蛋白可具有顺面(cis side)和反面(trans side)。任选地,分析物通过电泳或其他方式从顺面转位通过通道至反面。任选地,分析物通过电泳或其他方式从反面转位通过通道至顺面。任选地,分析物通过电泳或其他方式被驱动从顺面或反面进入通道并且停留在通道中或接着分别退回顺面或反面。
本文中的任何实施方案还可包括鉴定分析物。此类方法可包括将针对未知的分析物获得的电流模式与在相同的条件下使用已知的分析物获得的已知的电流模式相比较。
在本文中的任何实施方案中,分析物可以是核苷酸、核酸、氨基酸、肽、蛋白质、聚合物、药物、离子、污染物、纳米级物体或生物战剂。任选地,分析物是聚合物例如蛋白质、肽或核酸。任选地,分析物是核酸。任选地,核酸具有小于1个核苷酸/μs的穿过通道的平均转位速度。任选地,核酸具有小于0.1个核苷酸/μs的穿过通道的转位速度或平均转位速度。核酸可以是ssDNA、dsDNA、RNA或其组合。
本文中的实施方案可包括区分聚合物内的至少第一单元与聚合物内的至少第二单元。所述区分可包括测量第一和第二单元分别地转位通过通道时产生的离子电流,以分别产生第一和第二电流模式,其中第一和第二电流模式彼此不同。
本文中的任何实施方案还可包括测定聚合物的序列。测序可包括当聚合物的每一个单元分别转位通过通道时测量离子电流模式或光信号,以提供与每一个单元关联的电流模式,和将每一个电流模式与在相同条件下获得的已知单元的电流模式相比较,以便测定聚合物的序列。
本文中的任何实施方案还可包括测定分析物的浓度、大小、分子量、形状或取向或其任何组合。本文中所述的任何液体介质例如导电液体介质可包含多种分析物。本文中描述的任何分析物可包括光学珠粒或磁性珠粒。
本文中论述的任何Msp孔蛋白还可被进一步确定为突变的MspA孔蛋白。突变的MspA孔蛋白可包括:界定通道的前厅和缢缩区,和至少第一突变的MspA单体,其包含位置93、位置91、位置90上的突变或其任何组合。突变的MspA孔蛋白可包含位置93和91、位置93和90上、位置91和90上或位置93、90和91上的突变。任选地,突变的MspA孔蛋白在下列氨基酸位置:88、105、108、118、134或139的任何位置上的一个或多个突变或本文中描述的任何其他突变。
在本文中的任何实施方案中,突变的MspA孔蛋白或突变的MspA旁系同源物或同系物的直径可能小于相应的野生型MspA孔蛋白或野生型MspA旁系同源物或同系物的缢缩区的直径。突变的MspA孔蛋白或突变的MspA旁系同源物或同系物可在前厅或缢缩区具有突变,所述突变允许分析物电泳转位或以其他方式穿过突变的MspA孔蛋白或突变MspA旁系同源物或同系物的通道的转位速度或平均转位速度小于该分析物转位通过野生型Msp孔蛋白或野生型MspA旁系同源物或同系物的通道时的转位速度或平均转位速度。
突变的Msp孔蛋白例如突变的MspA孔蛋白或突变的MspA旁系同源物或同系物孔蛋白可包含中性缢缩区。突变的Msp孔蛋白,例如突变的MspA孔蛋白或突变的MspA旁系同源物或同系物孔蛋白,其通过通道的电导可以比通过其相应的野生型Msp孔蛋白的通道的电导更高(例如高2倍)。突变的Msp孔蛋白(例如突变的MspA孔蛋白或突变的MspA旁系同源物或突变的孔蛋白)可包括比通过其相应的野生型Msp孔蛋白的通道的电导更小的通过通道的电导。
本文中论述的任何Msp孔蛋白可包含具有约2至约6nm的长度和约2至约6nm的直径的前厅,和具有约0.3至约3nm的长度和约0.3至约3nm的直径的缢缩区,其中所述前厅和缢缩区一起界定了通道。本文中还提供了突变的MspA孔蛋白,其包含具有约2至约6nm的长度和约2至约6nm的直径的前厅以及具有约0.3至约3nm的长度和约0.3至约3nm的直径的缢缩区(其中所述前厅和缢缩区一起界定了通道),并且还包含至少第一突变MspA旁系同源物或同系物单体。
突变的Msp孔蛋白(例如突变的MspA孔蛋白或突变的MspA旁系同源物或同系物)的缢缩区的直径可以小于其相应的野生型Msp孔蛋白(例如野生型MspA孔蛋白或野生型MspA旁系同源物或同系物)的缢缩区的直径。突变的Msp孔蛋白(例如突变的MspA孔蛋白或突变的MspA旁系同源物或同系物)可在前厅或缢缩区包含突变,所述突变允许分析物通过电泳或其他方式转位通过孔蛋白的通道的转位速度或平均转位速度小于该分析物转位通过其相应的野生型Msp孔蛋白(例如,野生型MspA孔蛋白、野生型MspA旁系同源物或同系物)的通道时的转位速度或平均转位速度。
任选地,Msp孔蛋白完全或部分地由编码部分或完整单链Msp孔蛋白的核酸序列编码,其中核酸序列包含:(a)第一和第二核苷酸序列,其中所述第一核苷酸序列编码第一Msp单体序列并且第二核苷酸序列编码第二Msp单体序列;和(b)编码氨基酸连接体序列的第三核苷酸序列。单体序列可以是本文中描述的任何单体序列。任选地,所述第一和第二Msp单体序列独立地选自野生型MspA单体、野生型MspB单体、野生型MspC单体、野生型MspD单体和其突变体。任选地,所述第一Msp单体序列包含野生型MspA单体或其突变体。任选地,所述第一Msp单体序列包含突变的MspA单体。
在本文中的任何实施方案中,Msp孔蛋白可完全或部分由编码部分或完整单链Msp孔蛋白的核酸序列编码,其中所述核酸序列包含:(a)第1、第2、第3、第4、第5、第6、第7和第8核苷酸序列或其任何亚组(subset),其中所述第1、第2、第3、第4、第5、第6、第7和第8核苷酸序列分别编码第1、第2、第3、第4、第5、第6、第7和第8Msp单体序列;和(b)编码氨基酸连接体序列的第9核苷酸序列。因此,所述孔蛋白可包含与其他Msp单体或其他部分单链Msp孔蛋白杂交、二聚化、三聚化等的一个或多个部分单链Msp孔蛋白。可选择地,完整单链Msp孔蛋白可形成孔蛋白而无需与其他Msp元件结合。在本文中的任何实施方案中,例如,Msp孔蛋白可由编码完整单链Msp孔蛋白的核酸序列编码,其中所述核酸序列包含:(a)第1、第2、第3、第4、第5、第6、第7和第8核苷酸序列,其中所述第1、第2、第3、第4、第5、第6、第7和第8核苷酸序列分别编码第1、第2、第3、第4、第5、第6、第7和第8Msp单体序列;和(b)
编码氨基酸连接体序列的第9核苷酸序列。每一个Msp单体可包含野生型MspA单体或其突变体。任选地,至少一个Msp单体包含野生型MspA单体或其突变体。因此,可完整地编码孔蛋白。
在本文中的任何实施方案中,Msp单体可以是野生型MspA旁系同源物或同系物,例如MspA/Msmeg0965、MspB/Msmeg0520、MspC/Msmeg5483、MspD/Msmeg6057、MppA、PorM1、PorM2、PorM1、Mmcs4296、Mmcs4297、Mmcs3857、Mmcs4382、Mmcs4383、Mjls3843、Mjls3857、Mjls3931Mjls4674、Mjls4675、Mjls4677、Map3123c、Mav3943、Mvan1836、Mvan4117、Mvan4839、Mvan4840、Mvan5016、Mvan5017、Mvan5768、MUL_2391、Mflv1734、Mflv1735、Mflv2295、Mflv1891、MCH4691c、MCH4689c、MCH4690c、MAB1080、MAB1081、MAB2800、RHA1ro08561、RHA1ro04074和RHA1ro03127。
本文中还提供了修饰通过Msp孔蛋白的通道的电导的方法,其包括在野生型Msp孔蛋白的前厅或缢缩区中除去、添加或置换至少一个氨基酸。例如,所述方法可包括增加电导。所述方法可包括减小电导。
还提供了包括使分析物转位通过Msp孔蛋白的通道而不施加电场的方法。在该实施方案或本文中的任何其他实施方案中,Msp孔蛋白还可包含分子发动机。Msp孔蛋白可以是本文中描述的任何Msp孔蛋白,例如野生型MspA孔蛋白、突变的MspA孔蛋白、野生型MspA旁系同源物或同系物孔蛋白以及突变的MspA旁系同源物或同系物孔蛋白。Msp孔蛋白可由编码单链Msp孔蛋白的核酸序列编码。
还提供了包括具有界定通道的前厅和缢缩区的Msp孔蛋白的系统,其中所述通道位于第一液体介质与第二液体介质之间,其中至少一种液体介质包含分析物,并且其中所述系统对于检测分析物的性质是有效的。系统可以对于检测任何分析物的性质均是有效的,包括将Msp孔蛋白经受电场以便分析物与Msp孔蛋白相互作用。系统对于检测分析物的性质是有效的,包括将Msp孔蛋白经受电场以便分析物通过电泳转位通过Msp孔蛋白的通道。还提供了包括具有界定通道的前厅和缢缩区的Msp孔蛋白的系统,其中所述通道位于第一液体介质与第二液体介质之间的脂双层中,并且其中第一和第二液体介质之间的液体连通的唯一的点存在于通道中。此外,本文中描述的任何Msp孔蛋白可以包含在本文中描述的任何系统中。
第一和第二液体介质可以相同或不同,并且任一种或两种液体介质可包含如下的一种或多种:盐、去垢剂或缓冲剂。事实上,本文中描述的任何液体介质可包含如下的一种或多种:盐、去垢剂或缓冲剂。任选地,至少一种液体介质是导电的。任选地,至少一种液体介质是不导电的。本文中描述的任何液体介质可包含改变粘性的物质或改变速率的物质。液体介质可包含本文中描述的任何分析物。分析物的性质可以是电性质、化学性质或物理性质。
Msp孔蛋白可包含在本文中描述的系统或任何其他实施方案中的脂双层中。系统可包含多个Msp孔蛋白。
系统可包含本文中描述的任何Msp孔蛋白,例如野生型MspA孔蛋白、突变的MspA孔蛋白、野生型MspA旁系同源物或同系物孔蛋白或突变的MspA旁系同源物或同系物孔蛋白。任选地,Msp孔蛋白被进一步确定为突变的MspA孔蛋白。系统可包含含有界定通道的前厅和缢缩区的突变Msp孔蛋白和至少第一突变的MspA单体(其包含位置93上的突变和位置90、位置91或位置90及91上的突变)。包括在系统中的突变的Msp孔蛋白可包含具有约2至约6nm的长度和约2至约6nm的直径的前厅,和具有约0.3至约3nm的长度和约0.3至约3nm的直径的缢缩区,其中所述前厅和缢缩区一起界定了通道。突变的MspA孔蛋白还可包含至少第一突变的MspA旁系同源物或同系物单体。包括在系统中的Msp孔蛋白可由编码单链Msp孔蛋白的核酸序列编码。
包含在系统中的Msp孔蛋白还可包含分子发动机。本文中的系统或任何其他实施方案中的分子发动机可以能够以这样的转位速度或平均转位速度将分析物移入或穿过通道,所述转位速度或平均转位速度小于分析物在分子发动机不存在的情况下转位入或通过通道时的转位速度或平均转位速度。
本文中描述的任何系统还可包括膜片钳放大器或数据获取装置。系统还可包括与第一液体介质、第二液体介质或两者连通的一个或多个温度调节装置。
本文中描述的任何系统对于使分析物通过电泳或其他方式转位通过Msp孔蛋白通道是有效的。
还提供了Msp孔蛋白,其包含具有约2至约6nm的长度和约2至约6nm的直径的前厅,和具有约0.3至约3nm的长度和约0.3至约3nm的直径的缢缩区,其中所述前厅和缢缩区一起界定了通道。还提供了突变的Msp孔蛋白,其包含具有约2至约6nm的长度和约2至约6nm的直径的前厅,和具有约0.3至约3nm的长度和约0.3至约3nm的直径的缢缩区,其中所述前厅和缢缩区一起界定了通道。还提供了突变的MspA孔蛋白,其包含具有约2至约6nm的长度和约2至约6nm的直径的前厅,和具有约0.3至约3nm的长度和约0.3至约3nm的直径的缢缩区,其中所述前厅和缢缩区一起界定了通道。还提供了突变的MspA旁系同源物或同系物孔蛋白,其包含具有约2至约6nm的长度和约2至约6nm的直径的前厅,和具有约0.3至约3nm的长度和约0.3至约3nm的直径的缢缩区,其中所述前厅和缢缩区一起界定了通道。本文中描述的任何突变的MspA旁系同源物或同系物还可包含至少第一突变的MspA旁系同源物或同系物单体。还提供了突变的MspA孔蛋白,其包含具有约2至约6nm的长度和约2至约6nm的直径的前厅,和具有约0.3至约3nm的长度和约0.3至约3nm的直径的缢缩区,其中所述前厅和缢缩区一起界定了通道,并且还包含至少第一突变的MspA旁系同源物或同系物单体。这些孔蛋白的任一个可用于本文中的任何实施方案。
还提供了突变的MspA孔蛋白,其包含界定通道的前厅和缢缩区,和至少第一突变的MspA单体(其包含位置93上的突变和位置90、位置91或位置90及91上的突变)。该突变的MspA孔蛋白和本文中描述的任何其他突变的Msp孔蛋白或MspA孔蛋白可用于本文中描述的任何实施方案。突变的MspA孔蛋白可包含位置93和90上的突变。突变的MspA孔蛋白可包含位置93和91上的突变。突变的MspA孔蛋白可包含位置93、91和90上的突变。突变的MspA孔蛋白可包含本文中描述的任何其他突变。
突变的MspA孔蛋白的缢缩区的直径可以小于相应的野生型MspA孔蛋白的缢缩区的直径。MspA孔蛋白可在前厅或缢缩区中具有突变,所述突变允许分析物以这样的转位速度或平均转位速度通过电泳或其他方式转位通过突变体的通道,所述转位速度或平均转位速度小于分析物转位通过野生型Msp孔蛋白的通道时的转位速度或平均转位速度。MspA孔蛋白可在前厅或缢缩区中具有突变,所述突变允许分析物例如以小于0.5nm/μs或小于0.05nm/μs的平均转位速度通过电泳转位通过通道。分析物可选自核苷酸、核酸、氨基酸、肽、蛋白质、聚合物、药物、离子、生物战剂、污染物、纳米级物体或其组合或聚簇。任选地,分析物被进一步确定为核酸。核酸可以以小于1个核苷酸/μs或小于0.1个核苷酸/μs的平均转位速度通过电泳或其他方式转位通过通道。核酸可被进一步确定为ssDNA、dsDNA、RNA或其组合。
本文中的任何实施方案中的分析物还可包括磁性珠粒。磁性珠粒可被进一步确定为链霉抗生物素蛋白包被的磁性珠粒。分析物还可包括光学珠粒。本文中描述的任何分析物可以是离子或可以是中性的。分析物可包括生物素。
本文中描述的任何Msp孔蛋白,例如突变的MspA孔蛋白,可包含2至15个相同或不同的Msp单体。任选地,Msp孔蛋白,例如突变的MspA孔蛋白,包含为相同或不同的7至9个Msp单体。任选地,至少第二单体选自野生型MspA单体、第二突变的MspA单体、野生型MspA旁系同源物或同系物单体以及突变的MspA旁系同源物或同系物单体,其中所述第二突变的MspA单体可以与所述第一突变的MspA单体相同或不同。任选地,所述第二单体是野生型MspA旁系同源物或同系物单体。野生型MspA旁系同源物或同系物单体可以是野生型MspB单体。MspA单体可在任何下列氨基酸位置:88、105、108、118、134或139上包含一个或多个突变。MspA单体可包含一个或多个下列突变:L88W、D90K/N/Q/R、D91N/Q、D93N、I105W、N108W、D118R、D134R或E139K。MspA单体可包含下列突变:D90N/D91N/D93N。MspA单体可包含下列突变:D90N/D91N/D93N/D118R/D134R/E139K。MspA单体可包含下列突变:D90Q/D91Q/D93N。MspA单体可包含下列突变:D90Q/D91Q/D93N/D118R/D134R/E139K。MspA单体可包含下列突变:D90(K,R)/D91N/D93N。MspA单体可包含下列突变:(L88,I105)W/D91Q/D93N。MspA单体可包含下列突变:I105W/N108W。此外,MspA单体可包含本文中描述的任何其他突变。
在本文中的任何实施方案中,突变的Msp孔蛋白,例如突变的MspA孔蛋白或突变的MspA旁系同源物或同系物,与野生型Msp孔蛋白的前厅或缢缩区相比较,可分别包含至少一个额外的带正电荷的氨基酸;与野生型MspA孔蛋白的前厅或缢缩区相比较,可分别包含至少一个额外的带负电荷的氨基酸;与野生型MspA孔蛋白的前厅或缢缩区相比较,可分别少包含至少一个带正电荷的氨基酸;或与野生型MspA孔蛋白的前厅或缢缩区相比较,可分别少包含至少一个带负电荷的氨基酸。
任选地,可用带负电荷的氨基酸置换野生型Msp孔蛋白的前厅和缢缩区中每一个带正电荷的氨基酸,并且每一个带负电荷的氨基酸是相同的或不同的;或野生型Msp孔蛋白的前厅和缢缩区中每一个带负电荷的氨基酸可用带正电荷的氨基酸置换,并且每一个带正电荷的氨基酸是相同的或不同的。
任选地,突变的Msp孔蛋白的前厅或缢缩区分别包含比野生型Msp孔蛋白的前厅或缢缩区的带正电荷残基更大量的带正电荷残基;或者前厅或缢缩区分别包含比野生型Msp孔蛋白的前厅或缢缩区的带负电荷残基更大量的带负电荷残基;或者野生型Msp孔蛋白(例如野生型MspA孔蛋白或野生型MspA旁系同源物或同系物孔蛋白)的前厅或缢缩区中至少一个带正电荷的氨基酸缺失或被带负电荷的氨基酸置换;或者野生型Msp孔蛋白的前厅或缢缩区中至少一个带负电荷的氨基酸缺失或被带正电荷的氨基酸置换。
野生型Msp孔蛋白(例如野生型MspA孔蛋白或野生型MspA旁系同源物或同系物孔蛋白)的前厅或缢缩区中至少一个氨基酸可被具有空间上更大的侧链的氨基酸、具有空间上更小的侧链的氨基酸、具有更大极性的侧链的氨基酸、具有更小极性的侧链的氨基酸或具有更大疏水性的侧链的氨基酸、具有更小疏水性的侧链的氨基酸置换。
在本文中的任何实施方案中,突变的Msp孔蛋白的前厅或缢缩区中至少一个氨基酸可包括非天然氨基酸或化学修饰的氨基酸。
本文中描述的任何Msp孔蛋白可包含一个或多个周质环的缺失、添加或置换。
如本文中所描述的,任何Msp孔蛋白例如突变的MspA孔蛋白还可包含分子发动机。本文中描述的任何分子发动机可以能够以这样的转位速度或平均转位速度将分析物移入或通过通道,所述转位速度或平均转位速度小于分析物在分子发动机不存在的情况下转位进入或穿过通道时的转位速度或平均转位速度。在本文中的任何实施方案中,分子发动机可以是酶,例如聚合酶、外切核酸酶或Klenow片段。
还提供了产生本文中描述的Msp孔蛋白的方法。因此,提供了产生包含至少一个突变MspA单体的突变MspA孔蛋白的方法,所述方法包括在位置93和位置90、位置91或位置90及91上修饰野生型MspA单体的方法。该方法可包括在位置93和90上修饰野生型MspA单体。该方法可包括在位置93和91上修饰野生型MspA单体。该方法可包括在位置93、91和90上修饰野生型MspA单体。该方法可包括进一步地或可变通地在下列位置:88、105、108、118、134或139的任何一个或多个位置上修饰野生型MspA单体,或进行本文中描述的任何其他修饰。可由本文中描述的方法产生的突变MspA孔蛋白可包括本文中描述的任何突变或孔蛋白性质。例如,突变MspA可包括中性缢缩区。突变MspA孔蛋白还可包括至少一个Msp单体,例如野生型MspA单体、突变的MspA单体、野生型MspA旁系同源物或同系物或第二突变的MspA旁系同源物或同系物单体。突变的MspA孔蛋白的通过通道的电导可比其相应的野生型MspA孔蛋白的通过通道的电导更高,例如高1倍。
本文中描述的任何突变Msp孔蛋白,例如突变的MspA孔蛋白或突变的MspA旁系同源物或同系物孔蛋白,可包含一个或多个突变的MspB、突变的MspC或突变的MspD单体或其组合。
还提供了产生具有界定通道的前厅和缢缩区的突变MspA孔蛋白的方法,包括缺失、添加或置换野生型MspA旁系同源物或同系物单体的前厅和缢缩区内的任何氨基酸,以便所得的突变MspA孔蛋白能够在施加电场后使分析物转位通过通道。该突变的MspA孔蛋白可以是本文中描述的任何类型。
还提供了编码本文中描述的Msp孔蛋白的核酸序列。例如,提供了编码突变MspA孔蛋白或者突变MspA旁系同源物或同系物的核酸序列。还涉及包含本文中描述的核酸序列的载体,例如包含编码突变MspA孔蛋白或突变MspA旁系同源物或同系物的核酸序列的载体。本文中描述的任何载体还可包含启动子序列。本文中描述的任何载体还可包含组成型启动子。组成型启动子可包括psmyc启动子。启动子可包括诱导型启动子。诱导型启动子可包括乙酰胺诱导型启动子。
还提供了用本文中描述的任何载体转染的培养细胞,或其后代,其中所述细胞能够表达Msp孔蛋,白例如突变的MspA孔蛋白或突变的MspA旁系同源物或同系物。
还提供了包含本文中描述的任何载体的耻垢分枝杆菌菌株。还涉及不含内源孔蛋白的耻垢分枝杆菌菌株,其可包含本文中描述的任何载体。“不含”意指当使用适当的Msp-特异性抗血清时不能在免疫印迹上检测到内源孔蛋白,或包含少于1%的内源孔蛋白。
还提供了包含编码野生型Msp单体的核酸序列的载体,其中所述核酸序列有效地受诱导型启动子控制。载体可以是整合载体。还提供了用该载体转染的培养细胞或其后代,其中所述细胞能够表达野生型Msp孔蛋白。还涉及包含该载体的耻垢分枝杆菌菌株。
还提供了编码本文中描述的部分或完整单链Msp孔蛋白的核酸序列。所述核酸序列可包括例如:(a)第一和第二核苷酸序列,其中所述第一核苷酸序列编码第一Msp单体序列并且第二核苷酸序列编码第二Msp单体序列;和(b)编码氨基酸连接体序列的第三核苷酸序列。所述第一和第二Msp单体序列可独立地选自野生型MspA单体、突变的MspA单体、野生型MspA旁系同源物或同系物单体以及突变的MspA旁系同源物或同系物单体。所述第一Msp单体序列包含野生型MspA单体或其突变体。任选地,所述第一Msp单体序列包含突变的MspA单体。所述第一Msp单体序列可包含一个或多个突变,所述突变选自氨基酸138上的A至P置换、氨基酸139上的E至A或K置换、氨基酸90上的D至K或R或Q置换、氨基酸91上的D至N或Q置换、氨基酸93上的D至N置换、氨基酸88上的L至W置换、氨基酸105上的I至W置换、氨基酸108上的N至W置换、氨基酸118上的D至R置换和氨基酸134上的D至R置换。事实上,本文中描述的任何Msp单体可包含任何此类置换。
任选地,所述突变的MspA单体包含氨基酸138上的A至P置换、氨基酸139上的E至A置换或其组合;氨基酸90上的D至K或R置换、氨基酸91上的D至N置换、氨基酸93上的D至N置换或其任何组合;氨基酸90上的D至Q置换、氨基酸91上的D至Q置换、氨基酸93上的D至N置换或其任何组合;氨基酸88上的L至W置换、氨基酸105上的I至W置换、氨基酸91上的D至Q置换、氨基酸93上的D至N置换或其任何组合;氨基酸105上的I至W置换、氨基酸108上的N至W置换或其组合;或氨基酸118上的D至R置换、氨基酸139上的E至K置换、氨基酸134上的D至R置换或其任何组合。
任何Msp孔蛋白可包含第一、第二或更多Msp单体序列,包括野生型MspA旁系同源物或其突变体,其中旁系同源物或其突变体是野生型MspB单体或其突变体。一个或多个Msp单体序列可包含SEQID NO:1、SEQ ID NO:2或其组合。任选地,第二Msp单体序列包括突变的MspB单体。任选地,第一Msp单体序列包括野生型MspA单体或其突变体并且第二Msp单体序列包括野生型MspB单体或其突变体。任选地,第一Msp单体序列包含SEQ ID NO:1并且第二Msp单体序列包含SEQ ID NO:2。
本文中描述了氨基酸连接体序列。在本文中的任何实施方案中,氨基酸连接体序列可以例如包含10至20个氨基酸。例如,氨基酸连接体包含15个氨基酸。任选地,氨基酸连接体序列包括(GGGGS)3(SEQ ID NO:3)肽序列。
本发明还涵盖由本文中描述的任何核酸序列编码的多肽。
还提供了编码部分或完整单链Msp孔蛋白的核酸序列,其中所述核酸序列包含:(a)第1、第2、第3、第4、第5、第6、第7和第8核苷酸序列或其任何亚组,其中所述第1、第2、第3、第4、第5、第6、第7和第8核苷酸序列分别编码第1、第2、第3、第4、第5、第6、第7和第8Msp单体序列;和(b)编码氨基酸连接体序列的第9核苷酸序列。第一和第二Msp单体序列可独立地选自野生型Msp单体、突变的Msp单体、野生型MspA旁系同源物或同系物单体以及突变MspA旁系同源物或同系物单体。各Msp单体可包含野生型MspA单体或其突变体。任选地,至少一个Msp单体包含野生型MspA单体或其突变体。任选地,至少一个Msp单体包括突变的MspA单体。突变的Msp单体序列可包含本文中描述的任何突变。例如,一个或多个所述突变选自氨基酸138上的A至P置换、氨基酸139上的E至A或K置换、氨基酸90上的D至K或R或Q置换、氨基酸91上的D至N或Q置换、氨基酸93上的D至N置换、氨基酸88上的L至W置换、氨基酸105上的I至W置换、氨基酸108上的N至W置换、氨基酸118上的D至R置换和氨基酸134上的D至R置换。每一个Msp单体序列可包含SEQ ID NO:1。任选地,至少一个Msp单体序列包含SEQ ID NO:1。任选地,至少一个Msp单体序列包含野生型MspA旁系同源物或其突变体,其中所述MspA旁系同源物或其突变体是野生型MspB单体或其突变体。任选地,至少一个Msp单体序列包含SEQ ID NO:2。任选地,至少一个Msp单体序列包含突变的MspB单体。任选地,至少一个Msp单体序列包含野生型MspA单体或其突变体并且至少一个Msp单体序列包含野生型MspB单体或其突变体。任选地,至少一个Msp单体序列包含EQ ID NO:1并且至少一个Msp单体序列包含SEQ ID NO:2。还提供了由前述核酸序列的任一个编码的多肽。还提供了包含任何前述核酸序列的载体。所述载体还可包含启动子序列。所述启动子可包括组成型启动子。该组成型启动子可包括psmyc启动子。该启动子可包括诱导型启动子。该诱导型启动子可包括乙酰胺诱导型启动子。
还提供了能够诱导型表达Msp的突变的细菌菌株,所述细菌菌株包含:(a)野生型MspA的缺失;(b)野生型MspC的缺失;(c)野生型MspD的缺失;和(d)包含有效地连接于Msp单体核酸序列的诱导型启动子的载体。该细菌菌株还可包括耻垢分枝杆菌菌株ML16。Msp核酸可编码野生型MspA单体或野生型MspA旁系同源物或同系物单体。Msp核酸可编码选自野生型MspA单体、野生型MspC单体和野生型MspD单体的Msp单体。任选地,Msp核酸编码野生型MspA单体。诱导型启动子可包含乙酰胺诱导型启动子。所述细菌菌株还可包含野生型MspB的缺失。细菌菌株还可包含本文中描述的载体,例如包含有效地连接于编码Msp孔蛋白或单体的核酸序列的组成型启动子的载体。Msp可以是野生型MspA孔蛋白或单体或者野生型MspA旁系同源物或同系物孔蛋白或单体。Msp孔蛋白或单体可选自野生型MspA孔蛋白或单体、野生型MspB孔蛋白或单体、野生型MspC孔蛋白或单体以及野生型MspD孔蛋白或单体。任选地,Msp孔蛋白或单体是野生型MspA孔蛋白或单体。
细菌菌株还可包含含有编码完整或部分单链Msp孔蛋白的核酸的载体,其中所述核酸包含:(a)第一和第二核苷酸序列,其中所述第一核苷酸序列编码第一Msp单体序列并且第二核苷酸序列编码第二Msp单体序列;和(b)编码氨基酸连接体序列的第三核苷酸序列。细菌菌株还可包含含有编码完整或部分单链Msp孔蛋白的核酸的载体,其中所述核酸包含:(a)第1、第2、第3、第4、第5、第6、第7和第8核苷酸序列或其任何亚组,其中所述第1、第2、第3、第4、第5、第6、第7和第8核苷酸序列分别编码第1、第2、第3、第4、第5、第6、第7和第8Msp单体序列;和(b)编码氨基酸连接体序列的第9核苷酸序列。
还提供了产生完整或部分单链Msp孔蛋白的方法,所述方法包括:(a)用含有能够编码完整或部分单链Msp孔蛋白的核酸序列的载体转化本文中描述的细菌菌株;和(b)从细菌纯化完整或部分单链Msp孔蛋白。所述载体可包含编码完整或部分单链Msp孔蛋白的核酸序列,其中所述核酸序列包含:(a)第一和第二核苷酸序列,其中所述第一核苷酸序列编码第一Msp单体序列并且第二核苷酸序列编码第二Msp单体序列;和(b)编码氨基酸连接体序列的第三核苷酸序列。所述载体可包含编码完整或部分单链Msp孔蛋白的核酸序列,其中所述核酸序列包含:(a)第1、第2、第3、第4、第5、第6、第7和第8核苷酸序列或其任意亚组,其中所述第1、第2、第3、第4、第5、第6、第7和第8核苷酸序列分别编码第1、第2、第3、第4、第5、第6、第7和第8Msp单体序列;和(b)编码氨基酸连接体序列的第9核苷酸序列。Msp单体序列可独立地选自野生型MspA单体、突变的MspA单体、野生型MspA旁系同源物或同系物单体以及突变的MspA旁系同源物或同系物单体。例如,Msp单体序列是野生型MspA单体。
"耻垢分枝杆菌孔蛋白(Msp)"或"Msp孔蛋白"是指由两个或更多个Msp单体组成的多聚体复合物。Msp单体由耻垢分枝杆菌中的基因编码。耻垢分枝杆菌具有4个已鉴定的Msp基因,称为MspA、MspB、MspC和MspD。Msp孔蛋白可以例如由野生型MspA单体、突变的MspA单体、野生型MspA旁系同源物或同系物单体、或突变的MspA旁系同源物或同系物单体组成。任选地,Msp孔蛋白是单链Msp孔蛋白或是若干单链Msp孔蛋白的多聚体。单链Msp孔蛋白可以例如包括由两个或更多个Msp单体(例如,8个单体)通过一个或多个氨基酸连接体肽连接的多聚体。部分单链Msp孔蛋白是指必需二聚化、三聚化等来形成孔蛋白的单链多聚体复合物。完全单链Msp孔蛋白是指形成孔蛋白而无需二聚化、三聚化等以形成孔蛋白的单链多聚体复合物。
本文中任何实施方案中的Msp孔蛋白可以是本文中描述的任何Msp孔蛋白,例如野生型MspA孔蛋白、突变的MspA孔蛋白、野生型MspA旁系同源物或同系物孔蛋白或者突变的MspA旁系同源物或同系物孔蛋白。Msp孔蛋白可以由编码单链Msp孔蛋白的核酸序列编码。此处的任何Msp孔蛋白可包含本文中描述的任何Msp单体,例如突变的Msp单体。
营养物在分枝杆菌(mycobacteria)中通过野生型孔蛋白。野生型MspA孔蛋白、野生型MspB孔蛋白、野生型MspC孔蛋白和野生型MspD孔蛋白是野生型通道形成孔蛋白的实例。Msp孔蛋白可被进一步确定为本文中描述的任何Msp孔蛋白,包括旁系同源物、同系物、突变体和单链孔蛋白。
"突变的MspA孔蛋白"是与其相应的野生型MspA孔蛋白具有至少或至多70、75、80、85、90、95、98或99%或更多、或可来自其间的任何范围、但小于100%的同一性并且保持通道形成能力的多聚体复合物。突变的MspA孔蛋白可以是重组蛋白质。任选地,突变的MspA孔蛋白是在野生型MspA孔蛋白的缢缩区或前厅具有突变的孔蛋白。任选地,突变可存在于野生型MspA孔蛋白的周质环的边缘或外部。突变的MspA孔蛋白可用于本文中描述的任何实施方案。
表1中提供了示例性野生型MspA旁系同源物和同源物。提供了野生型MspA旁系同源物,其包括野生型MspB、野生型MspC和野生型MspD。“旁系同源物”,如本文中定义的,是来自相同细菌种类的具有相似结构和功能的基因。"同源物",如本文中定义的,是来自另一细菌种类的具有相似结构和进化来源的基因。例如,提供了野生型MspA同源物,其包括MppA、PorM1、PorM2、PorM1和Mmcs4296。
"突变的MspA旁系同源物或同系物孔蛋白"是与其相应的野生型MspA旁系同源物或同系物孔蛋白具有至少或至多70、75、80、85、90、95、98或99%或更多、或来自其间的任何范围、但小于100%的同一性并且保持通道形成能力的多聚复合物。突变的MspA旁系同源物或同系物孔蛋白可以是重组蛋白质。任选地,突变的MspA旁系同源物或同系物孔蛋白是在野生型MspA旁系同源物或同系物孔蛋白的缢缩区或前厅中具有突变的孔蛋白。任选地,突变可存在于野生型MspA旁系同源物或同系物孔蛋白的周质环的边缘或外部。任何突变的MspA旁系同源物或同系物孔蛋白可用于本文中描述的任何实施方案,并且可包含本文中描述的任何突变。
Msp孔蛋白可包含两个或更多个Msp单体。"Msp单体"是为野生型MspA单体、突变的MspA单体、野生型MspA旁系同源物或同系物单体或者突变的MspA旁系同源物或同系物单体的蛋白质单体,并且当与一个或多个其他Msp单体结合时保持通道形成能力。本文中描述的任何Msp孔蛋白可包含一个或多个本文中描述的任何Msp单体。任何Msp孔蛋白可以包含例如2至15个Msp单体,其中每一个单体可以是相同的或不同的。
"突变的MspA单体"是指与野生型MspA单体具有至少或至多70、75、80、85、90、95、98或99%或更多、或可来自其间的任何范围、但小于100%的同一性并且当与一个或多个其他Msp单体结合时保持形成通道的能力的Msp单体。任选地,突变的MspA单体被进一步确定为在促进完全形成的通道形成孔蛋白的前厅或缢缩区的形成的序列部分中包含突变。突变的Msp单体可以是例如重组蛋白。突变的MspA单体可包含本文中描述的任何突变。
"突变的MspA旁系同源物或同系物单体"是指与野生型MspA旁系同源物或同系物单体具有至少或至多70、75、80、85、90、95、98或99%或更多,或可来自其间的任何范围,但小于100%的同一性并且保持通道形成能力的MspA旁系同源物或同系物单体。任选地,突变的MspA旁系同源物或同系物单体被进一步确定为在序列的该部分包含突变,所述部分促进完全形成的通道形成孔蛋白的前厅和/或缢缩区的形成。突变的MspA旁系同源物或同系物单体可以例如是重组蛋白质。任何突变的MspA旁系同源物或同系物单体可以任选地用于本文中的任何实施方案。
Msp孔蛋白可表达为两个或更多个野生型MspA单体、突变的MspA单体、野生型MspA旁系同源物或同系物单体或突变的MspA旁系同源物或同系物单体的组合。这样,Msp孔蛋白可以是或可包括二聚体、三聚体、四聚体、五聚体、六聚体、七聚体、八聚体、九聚体等。例如,Msp孔蛋白可包括野生型MspA单体和野生型MspB单体的组合。Msp孔蛋白可包括1至15个单体,其中每一个单体是相同的或不同的。事实上,本文中描述的任何Msp孔蛋白可包含至少或至多1、2、3、4、5、6、7、8、9、10、11、12、13、14或15个或可来自其间的任何范围内的个数的单体,其中每一个单体是相同的或不同的。例如,Msp孔蛋白可包含一个或多个相同的或不同的突变MspA单体。作为另一个实例,Msp孔蛋白可包含至少一个突变的MspA单体和至少一个MspA旁系同源物或同系物单体。
如上文中定义的,单链Msp孔蛋白包含两个或更多个通过一个或多个氨基酸连接体肽连接的Msp单体。包含2个Msp单体的单链Msp孔蛋白(其中所述Msp单体由氨基酸连接体序列连接)可称为单链Msp孔蛋白二聚体。包含8个Msp单体(其中所述Msp单体由氨基酸连接体序列连接)的单链Msp孔蛋白可称为单链Msp孔蛋白八聚体。单链Msp孔蛋白可包含通过氨基酸连接体序列连接的2、3、4、5、6、7、8、9、10、11、12、13、14、15或更多个Msp单体或可来自其间的任何范围内的Msp单体。任选地,单链Msp孔蛋白可以例如包括两个或更多个单链Msp孔蛋白二聚体、两个或更多个单链Msp孔蛋白三聚体、两个或更多个单链Msp孔蛋白四聚体、两个或更多个单链Msp孔蛋白五聚体、一个或多个单链Msp孔蛋白六聚体、一个或多个单链Msp孔蛋白七聚体、一个或多单链Msp孔蛋白八聚体或其组合。例如,单链Msp孔蛋白可包括一个单链Msp孔蛋白二聚体和两个单链Msp孔蛋白三聚体。作为另一个实例,单链Msp孔蛋白可包括一个单链Msp孔蛋白四聚体和两个单链Msp孔蛋白二聚体。
野生型单链Msp孔蛋白由野生型Msp单体组成。任选地,单链Msp孔蛋白中的一个或多个突变存在于单链Msp孔蛋白的前厅或缢缩区中。突变的单链Msp孔蛋白例如与野生型单链Msp相比较在周质环、前厅或缢缩区的氨基酸序列中具有至少一个突变(例如,缺失、置换或添加)。单链的多聚体也可形成孔蛋白,其中每一个单链包括2、3、4、5、6、7或更多个Msp单体。
本文中提供了编码Msp单体序列和其突变体的核酸序列。对于上文列出的突变的MspA单体序列,参照MspA序列是成熟野生型MspA单体序列(SEQ ID NO:1)。本文中提供的核酸序列中的每一个核苷酸序列可以例如包含突变的MspA单体序列。表7中提供了突变的MspA序列的非限制性实例。任选地,突变的MspA包含氨基酸138上的A至P置换、氨基酸139上的E至A置换或其组合。任选地,突变的MspA包含氨基酸90上的D至K或R置换、氨基酸91上的D至N置换、氨基酸93上的D至N置换或其任何组合。任选地,突变的MspA包含氨基酸90上的D至Q的置换、氨基酸91上的D至Q的置换、氨基酸93上的D至N的置换或其任何组合。任选地,突变的MspA包含氨基酸88上的L至W的置换、氨基酸105上的I至W的置换、氨基酸91上的D至Q的置换、氨基酸93上的D至N的置换或其任何组合。任选地,突变的MspA包含氨基酸105上的I至W的置换、氨基酸108上的N至W的置换或其组合;任选地,突变的MspA包含氨基酸118上的D至R的置换、氨基酸139上的E至K的置换、氨基酸134上的D至R的置换或其任何组合。对于下面所列的突变的MspB单体序列,参照MspB序列是成熟野生型MspB单体序列(SEQID NO:2)。任选地,突变的MspB包含氨基酸90上的D至K或R的置换、氨基酸91上的D至N的置换、氨基酸93上的D至N的置换或其任何组合。
本文中论述的野生型Msp单体的序列在万维网上公开于位于pubmed.gov的GenBank中,并且这类序列和其他序列以及其中包含的各个亚序列或片段以其全文通过引用合并入本文。例如,野生型MspA单体的核苷酸和氨基酸序列可分别见于GenBank登录号AJ001442和CAB56052。野生型MspB单体的核苷酸和氨基酸序列可以例如分别见于GenBank登录号NC_008596.1(从核苷酸600086至600730)和YP_884932.1。野生型MspC单体的核苷酸和氨基酸序列可以例如分别见于GenBank登录号AJ299735和CAC82509。野生型MspD单体的核苷酸和氨基酸序列可以例如分别见于GenBank登录号AJ300774和CAC83628。因此提供了MspA、MspB、MspC和MspD单体的核苷酸序列,所述核苷酸包含与前述核苷酸GenBank登录号的核苷酸序列至少约70、75、80、85、90、95、98、99%或更大、或可来自其间的任何范围内的同一性的核苷酸序列。还提供了MspA、MspB、MspC和MspD单体的氨基酸序列(图18),所述序列包含与前述氨基酸序列GenBank登录号的序列至少约70、75、80、85、90、95、98、99%或更大或可来自其间的任何范围内的同一性的氨基酸序列。
还提供了MspA旁系同源物和同源单体的氨基酸序列,所述MspA旁系同源物和同源单体包含与野生型MspA旁系同源物或是同源单体至少约70、75、80、85、90、95、98、99%或更大,或可来源于其的任何范围内的同一性的氨基酸序列。野生型MspA旁系同源物和同源单体在本领域内是公知的。表1提供了这类旁系同源物和同源物的非限定性列表:
表1.野生型MspA和野生型MspA旁系同源物和同源单体
只包括在蛋白质的全长范围上具有显著氨基酸相似性的蛋白质。利用PSI-Blast算法(BLOSUM62矩阵),使用万维网上ncbi.nlm.nih.gov/blast/Blast.cgi上的NIH GenBank数据库获得数据。
n.d.:"未测定的”
*Stahl等人,Mol.Microbiol.40:451(2001)
**Dorner等人,Biochim.Biophys.Acta.1667:47-55(2004)
可进一步修饰和改变本文中描述的肽、多肽、单体、多聚体、蛋白质等,只要期望的功能得到维持或增强即可。应理解,确定本文中公开的基因和蛋白质的任何已知的修饰和衍生物或可能产生的修饰和衍生物的一个方法是通过根据与特定的已知序列的同一性确定修饰和衍生物。具体地公开了与野生型MspA和野生型MspA旁系同源物或同系物(例如,野生型MspB、野生型MspC、野生型MspD、MppA、PorM1、Mmcs4296)和本文中提供的突变体具有至少70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99%的同一性的多肽。
本领域技术人员容易理解测定两个多肽的同一性的方法。例如,可在对齐两个序列(以使同一性处于其最高水平)后计算同一性。例如,为了测定两个氨基酸序列或两个核酸序列的“同一性百分比”,就最佳比较目的对齐序列(例如,为了与第二氨基酸或核酸序列的最佳比对,可在第一氨基酸或核酸序列中引入缺口)。然后比较位于相应的氨基酸位置或核苷酸位置上的氨基酸残基或核苷酸。当第一序列中的位置由与第二序列中的相应位置上的相同氨基酸残基或核苷酸占据时,那么所述分子在该位置上是同一的。两个序列之间的同一性百分比是由各序列共有的同一位置的数量的函数(即,同一性百分比=同一位置的数量/位置的总数(例如,重叠的位置)x 100)。在一个实施方案中,两个序列长度相同。
有几种方法可用于测定同一性百分比。一种方法可以以下列方式测定同一性百分比。使用来自包括BLASTN 2.0.14版和BLASTP2.0.14版的BLASTZ独立版本的BLAST 2序列(Bl2seq)程序将靶核酸或氨基酸序列与鉴定的核酸或氨基酸序列相比较。可从美国政府的美国国家生物技术信息中心网站(万维网址ncbi.nlm.nih.gov)获得BLASTZ的独立版本。解释如何使用Bl2seq程序的说明书可见于BLASTZ附带的帮助文件。
Bl2seq利用BLASTN或BLASTP算法进行两个序列之间的比较。BLASTN用于比较核酸序列,而BLASTP用于比较氨基酸序列。为了比较两个核酸序列,可如下设置选择:将–i设定为含有待比较的第一核酸序列的文件(例如,C:\seq1.txt);将-j设定为含有待比较的第二核酸序列的文件(例如,C:\seq2.txt);将-p设定为blastn;将-o设定为任何期望的文件名(例如,,C:\output.txt);将-q设定为-1;将-r设定为2;并且所有其他选项保持为其缺省设置。下列命令将产生包含两个序列之间的比较的输出文件:C:\Bl2seq-i c:\seq1.txt-j c:\seq2.txt-pblastn-o c:\output.txt-q-1-r 2。如果靶序列与已鉴定的序列的任何部分共有同源性,那么该指定的输出文件将以对齐的序列提供这类同源的区域。如果靶序列与已鉴定的序列的任何部分不共有同源性,那么该指定的输出文件将不提供对齐的序列。
一旦对齐,通过计数来自靶序列的与来自已鉴定的序列的始于任何匹配的位置并且终止于任何其他匹配的位置的序列的比对中的连续核苷酸的数量来测定长度。匹配的位置是靶序列和已鉴定的序列中提供相同核苷酸的任何位置。不计数靶序列中提供的缺口,因为缺口不是核苷酸。同样,不计数已鉴定的序列中提供的缺口,因为计数的是靶序列核苷酸,而非来自已鉴定的序列的核苷酸。
可这样测定特定长度范围上的同一性百分比,即通过计数在该长度范围上匹配的位置的数量并且将该数量除以长度,然后将所得的值乘法以100来测定。例如,如果(1)将50个核苷酸的靶序列与编码野生型MspA的序列相比较,(2)Bl2seq程序提供与编码野生型MspA的序列的区域对齐的来自靶序列的45个核苷酸,其中该45个核苷酸区域的第一和最后一个核苷酸是匹配的,并且(3)在该45个对齐的核苷酸范围上匹配的数量是40,那么所述50个核苷酸的靶序列包含45个核苷酸的长度并且在该长度范围上的同一性百分比为89(即,40/45x100=89)。
计算同一性的另一个方法可通过公布的算法来进行。用于比较的序列的最佳比对可利用Smith和Waterman,Adv.Appl.Math 2:482(1981)的局部同一性算法,利用Needleman和Wunsch,J.Mol.Biol.48:443(1970)的同一性比对算法,利用Pearson和Lipman,Proc.Natl.Acad.Sci.USA 85:2444(1988)的相似性搜索算法(search forsimilarity method),利用此类算法的计算机化操作(WisconsinGenetics软件包中的GAP、BESTFIT、FASTA和TFASTA,GeneticsComputer Group,575Science Dr.,Madison,WI)或利用目测观察来进行。
可以例如利用例如Zuker,Science 244:48-52(1989);Jaeger等人,Proc.Natl.Acad.Sci.USA 86:7706-10(1989);Jaeger等人,MethodsEnzymol.183:281-306(1989)(其因至少与核酸比对实质相关而通过引用合并入本文)中公开的算法获得核酸的相同类型的同一性。应理解,通常可使用所述方法的任何方法,并且在某些情况下,这类不同方法的结果可能不同,但本领域技术人员理解,如果利用这类方法的至少一个方法发现有同一性,那么所述序列就被认为具有声明的同一性并且公开于本文中。
还公开了编码本文中公开的蛋白质序列的核酸及其变体和片段。这类序列包括与特定蛋白质序列相关的全部简并序列,即具有编码一个特定蛋白质序列的序列的全部核酸以及编码所述蛋白质序列的公开的变体和衍生物的全部核酸,包括简并核酸。因此,虽然每一个特定的核酸序列可能未在本文中书面写出,但应理解:每一个序列事实上通过公开的蛋白质序列在本文中得到了公开和描述。
Msp孔蛋白或单体的片段和部分序列可用于本文中描述的方法。关于所有肽、多肽和蛋白质,包括其片段,应理解可产生本文中公开的Msp多肽的氨基酸序列中的另外的修饰,所述修饰不改变肽、多肽和蛋白质的性质或功能。应理解,对这些修饰的唯一限制是实用性,它们必须包括用于相关实施方案所必需的功能元件(例如,通道形成能力)。此类修饰包括保守氨基酸置换并且在下文中更详细地进行说明。
确定蛋白质是否是通道形成蛋白的方法在本领域内是公知的。通过确定蛋白质是否插入双分子层可确定Msp是否形成通道,如在下列实施例2中所说明的:如果蛋白质插入双分子层,那么孔蛋白是通道形成蛋白。通常,通道形成可通过观察电导的不连续变化来检测。参见,例如图2,实施例2和Niederweis等人,Mol.Microbiol.33:933(1999)。本文中描述了双分子层。
如上文中所表明的,Msp孔蛋白通常能够被插入脂双层或其他薄膜中,所述脂双层或薄膜各自在本领域内是公知的。在本文中解释了将突变的MspA孔蛋白插入脂双层的实例;该技术同样可用于其他Msp孔蛋白。此外,美国专利6,746,594(通过引用合并入本文)描述了多种脂双层和薄膜,包括无机材料,其可用于本文中描述的Msp孔蛋白。美国专利6,267,872(以其全文通过引用合并入本文)中描述的方法、装置和技术也可用于本文中描述的Msp孔蛋白。
此外,脂双层中可包括超过一个Msp孔蛋白。例如脂双层中可包含2、3、4、5、10、20、200、2000或更多个Msp孔蛋白。任选地,2至1010范围内的任何多个Msp孔蛋白可用于本文中描述的方法。这样的多种Msp孔蛋白可以以Msp孔蛋白的聚簇的形式存在。聚簇可以随机装配或可采用一定的模式。如本文中所用的,"聚簇"是指聚在一起并且作为一个单位移动(但彼此并非共价结合)的分子。
任选地,Msp孔蛋白不会自发地门控(gate)。"门控"是指通常为短暂(例如,持续短至1-10毫秒至多至秒)的通过蛋白质的通道的电导自发变化。长持续时间的门控事件通常可通过改变极性来逆转。在大多数情况下,门控的概率可通过施加更高电压来增加。取决于例如前厅和缢缩区的组成以及蛋白质浸没于其中的液体介质的性质,门控和通过通道的导电程度在Msp孔蛋白之间是高度可变的。通常,蛋白质在门控期间导电性减小,并且作为结果电导可永久性停止(即,通道可永久性关闭),以致该过程不可逆。任选地,门控是指通过蛋白质的通道的电导自发地改变至低于其开放态电流的75%。
各种条件,例如光和接触Msp孔蛋白的液体介质(包括其pH、缓冲液组成、去垢剂组成和温度),可暂时或永久性地影响Msp孔蛋白的行为,特别是对于其通过通道的电导以及分析物相对于通道的运动。
特别相关的是Msp孔蛋白,尤其是MspA孔蛋白的通道的几何形状。Msp孔蛋白的几何形状可提供提高的空间分辨率。此外,野生型MspA孔蛋白是非常稳定的并且在暴露于任何pH后和在极端温度(例如,高至100℃持续长达30分钟和在高至80℃下温育长达15分钟)下提取后保持通道形成活性。可使用本文中描述的体外测定就其期望的活性测试所述多肽。
特别地对于MspA孔蛋白而言,任选地,MspA孔蛋白是由8个184个氨基酸的MspA单体组成的八聚体。可在野生型MspA孔蛋白的一个或多个氨基酸MspA单体中产生一个或多个突变来产生突变的MspA孔蛋白。此外,MspA孔蛋白可具有少于或多于8个单体,其中任何一个或多个可包含突变。
此外,野生型MspA孔蛋白包含由13个氨基酸组成的并且正好与缢缩区相邻的周质环。参见Huff等人,J.Biol.Chem.284:10223(2009)。野生型MspB、C和D孔蛋白还包含周质环。一个或多个突变可存在于野生型Msp孔蛋白的周质环中,从而产生突变的Msp孔蛋白。例如,在野生型MspA孔蛋白的周质环中可发生多达全部13个氨基酸的缺失。通常,周质环中的缺失不影响Msp孔蛋白的通道形成能力。
还可化学或生物地修饰Msp孔蛋白或Msp单体。例如,可用化学物质修饰Msp孔蛋白或Msp单体,以产生二硫桥,这对于本领域技术人员来说是已知的。
Msp孔蛋白可包含核苷酸结合位点。如本文中所使用的,“核苷酸结合位点”是指Msp孔蛋白中核苷酸停留在其上与氨基酸接触或位于所述氨基酸上的时间长于因扩散运动而停留或位于其上的时间(例如长于1皮秒或1纳秒)的位置。分子动力学计算可用于估计这类短暂静止时间。
"前厅"是指Msp孔蛋白内部的圆锥形部分,其直径通常沿中心轴从一端至另一端减小,其中前厅的最窄的部分连接于缢缩区。前厅还可称为“高脚杯(goblet)”。关于野生型MspA孔蛋白的前厅的实例,参见图1。前厅和缢缩区一起界定了Msp孔蛋白的通道。
当提及前厅的直径时,应理解,因为前厅在形状上是圆锥样的,因此直径沿中心轴的路径而变化,其中直径在一端比另一端大。直径的范围可以是约2nm至约6nm。任选地,直径为约,至少约或至多约2、2.1、2.2、2.3、2.4、2.5、2.6、2.7、2.8、2.9、3.0、3.1、3.2、3.3、3.4、3.5、3.6、3.7、3.8、3.9、4.0、4.1、4.2、4.3、4.4、4.5、4.6、4.7、4.8、4.9、5.0、5.1、5.2、5.3、5.4、5.5、5.6、5.7、5.8、5.9或6.0nm,或可来自其间的任何范围。中心轴的长度范围可以是约2nm至约6nm。任选地,长度为约,至少约或至多约2、2.1、2.2、2.3、2.4、2.5、2.6、2.7、2.8、2.9、3.0、3.1、3.2、3.3、3.4、3.5、3.6、3.7、3.8、3.9、4.0、4.1、4.2、4.3、4.4、4.5、4.6、4.7、4.8、4.9、5.0、5.1、5.2、5.3、5.4、5.5、5.6、5.7、5.8、5.9或6.0nm,或可来自其间的任何范围。当在本文中提及“直径”时,可通过测量中心至中心距离或原子的表面至表面距离来测定直径。
"缢缩区"是就直径而言Msp孔蛋白的通道的最窄部分,其与前厅连接。野生型MspA孔蛋白的缢缩区示于图1中(标记为"内缢缩")。缢缩区的长度范围可以是约0.3nm至约2nm。任选地,长度是约,至多约或至少约0.3、0.4、0.5、0.6、0.7、0.8、0.9、1.0、1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2或3nm,或可来自其间的任何范围。缢缩区的直径范围可以是约0.3nm至约2nm。任选地,直径是约,至多约或至少约0.3、0.4、0.5、0.6、0.7、0.8、0.9、1.0、1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2或3nm,或在可来自其间的任何范围内。
"中性缢缩区"是指包含当浸没于水溶液中时总体上不展示净电荷的氨基酸侧链的缢缩区。与缢缩区接触的液体介质(例如,缓冲水溶液)的pH可以影响缢缩区是否被表征为中性。
"通道"是指由前厅和缢缩区界定的Msp的中央空心部分,气体、液体、离子或分析物可通过其。
如本文中所使用的,"正面"是指分析物通过其进入通道或分析物移动横穿其表面的Msp通道的一侧。
如本文中所使用的,"反面"是指分析物(或其片段)通过其排出通道或分析物不移动穿过其表面的Msp通道的一侧。
如本文中所使用的,"通过电泳转位分析物"和其语法变型,是指对与一种或多种溶液接触(例如,浸没在溶液中)的Msp孔蛋白施加电场,以便电流流过Msp孔蛋白通道。电场移动分析物以便其与通道相互作用。“相互作用”,其意指分析物移入和任选地穿过通道,其中"穿过Msp通道"(或"转位")意指进入通道的一侧并且移向和移出通道的另一侧。
特别地涉及,本文中论述的任何分析物在本文描述的任何实施方案中可通过电泳或其他方式转位通过Msp孔蛋白通道。在这一点上,明确地提及:除非明确指出,否则包括转位的本文中的任何实施方案可以指电泳转位或非电泳转位。任选地,不使用电泳转位的方法也涵盖在内。
"液体介质"包括水性、有机-水性和仅有机的液体介质。有机介质包括例如甲醇、乙醇、二甲基亚砜和其混合物。可用于本文中描述的方法的液体在本领域内是公知的。此类介质包括电导液体介质的说明和实例提供于例如美国专利7,189,503中,其以全文通过引用合并入本文。可向这样的介质中加入盐、去垢剂或缓冲剂。此类试剂可用于改变液体介质的pH或离子强度。改变粘度的物质例如甘油或各种聚合物(例如,聚乙烯吡咯烷酮、聚乙二醇、聚乙烯醇、纤维素聚合物)和其混合物可包含在液体介质中。测量粘度的方法在本领域内是公知的。可向液体介质中加入的任何试剂还可改变被研究的分析物的速度。这样,改变速度的试剂可以是盐、去垢剂、缓冲剂、改变粘度的物质或加入液体介质的可增加或减少分析物速度的任何其他物质。
通常,本文中使用的分析物在至少一种与本文中描述的Msp接触的液体介质中是可溶性的或部分可溶的。任何分析物可用于本文中,包括例如核苷酸、核酸、氨基酸、肽、蛋白质、聚合物、药物、离子、生物战剂、污染物、纳米级物体或包括这类分析物的一种或其组合的任何其他分子。分析物可以是分子的聚簇,因为所述聚簇作为整体被认为是分析物。通常,分析物的大小不会大至其不能进入Msp的通道:换句话说,经典分析物在大小上会小于Msp的通道的开口。然而,可使用比通道的开口更大的分析物,并且可使用本文中描述的方法测定分析物是否太大以至其不能进入通道。任选地,分析物的分子量小于1百万Da。任选地,分析物的分子量为约,至多约或至少约1,000,000、950,000、900,000、850,000、800,000、750,000、700,000、650,000、600,000、550,000、500,000、450,000、400,000、350,000、300,000、250,000、200,000、150,000、100,000、75,000、50,000、25,000、20,000、15,000、10,000、7,500、5,000、2,500、2,000、1,500、1,000或500Da或更小,或在可来自其间的任何范围内。
蛋白质修饰包括氨基酸序列修饰。氨基酸序列的修饰可天然地产生为等位基因变型(例如,由于遗传多态性),可因环境影响(例如,因接触紫外辐射)而产生,或者可因人干预(例如通过克隆DNA序列的诱变)而产生,例如诱导的点突变体、缺失、插入和置换突变体。此类修饰可导致氨基酸序列的变化,提供沉默突变,改变限制性位点或提供其他特定突变。氨基酸序列修饰通常落在如下3类中的一类或多类中:置换、插入或缺失修饰。插入包括氨基酸和/或末端融合以及单个或多个氨基酸残基的序列内插入。插入通常将是比氨基或羧基末端融合更小的插入,例如,1至4个残基的插入。可通过从蛋白质序列除去一个或多个氨基酸残基来表征缺失。通常,在蛋白质分子内的任何一个位置上缺失不超过约2至6个残基。氨基酸置换通常是单个残基的置换,但可一次在许多不同位置上发生;插入通常属于约1至10个氨基酸残基的插入;缺失的范围可以是1至30个残基。优选在相邻对上进行缺失或插入,即,2个残基的缺失或2个残基的插入。可组合置换、缺失、插入或其任何组合来获得终构建体。突变可以发生在或可以不发生在阅读框架外的序列中以及可以产生或可以不产生能形成mRNA二级结构的互补区。置换型修饰是其中已除去至少一个残基并且在其位置上插入不同残基的修饰。
可利用已知的方法进行修饰,包括特定氨基酸的置换。例如,可通过编码蛋白质的DNA中核苷酸的定点诱变进行修饰,从而产生编码修饰的DNA,接着在重组细胞培养物中表达所述DNA。用于在具有已知序列的DNA中预先确定的位置上产生置换突变的技术是公知的,例如M13引物诱变和PCR诱变。
Msp孔蛋白中的一个或多个突变可存在于蛋白质的前厅或缢缩区中。任选地,与野生型Msp孔蛋白相比较,突变的Msp孔蛋白在其周质环、前厅或缢缩区氨基酸序列中具有至少一个差异(例如,缺失、置换、添加)。
如本文中所使用的,“氨基酸”是指蛋白质中发现的20种天然存在的氨基酸中的任何氨基酸、天然存在的氨基酸的D-立体异构体(例如,D-苏氨酸)、非天然氨基酸以及化学修饰的氨基酸。这些氨基酸类型中的每一种类型不是相互排斥的。α-氨基酸包含与氨基、羧基、氢原子和称为“侧链”的独特基团键合的碳原子。天然存在的氨基酸的侧链在本领域内是公知的并且包括例如氢(例如,如在甘氨酸中)、烷基(例如,如在丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸中)、取代烷基(例如,如在苏氨酸、丝氨酸、甲硫氨酸、半胱氨酸、天冬氨酸、天冬酰胺、谷氨酸、谷氨酰胺、精氨酸和赖氨酸中),芳烷基(例如,如在苯丙氨酸和色氨酸中)、取代芳烷基(例如,如在酪氨酸中)和杂芳烷基(例如,如在组氨酸中)。
下列缩写用于20种天然存在的氨基酸:丙氨酸(Ala;A)、天冬酰胺(Asn;N)、天冬氨酸(Asp;D)、精氨酸(Arg;R)、半胱氨酸(Cys;C),谷氨酸(Glu;E)、谷氨酰胺(Gln;Q)、甘氨酸(Gly;G)、组氨酸(His;H)、异亮氨酸(Ile;I)、亮氨酸(Leu;L)、赖氨酸(Lys;K)、甲硫氨酸(Met;M)、苯丙氨酸(Phe;F)、脯氨酸(Pro;P)、丝氨酸(Ser;S)、苏氨酸(Thr;T)、色氨酸(Trp;W)、酪氨酸(Tyr;Y)和缬氨酸(Val;V)。
非天然氨基酸(即,非在蛋白质中天然发现的氨基酸)在本领域内也是已知的,如例如在Williams等人,Mol.Cell.Biol.9:2574(1989);Evans等人,J.Amer.Chem.Soc.112:4011-4030(1990);Pu等人,J.Amer.Chem.Soc.56:1280-1283(1991);Williams等人,J.Amer.Chem.Soc.113:9276-9286(1991)以及其中所引用的所有参考文献中所示的。β-和γ-氨基酸在本领域内是已知的并且在本文中被提及为非天然氨基酸。下列表显示本文中涉及的非天然氨基酸的非限定性实例。
表2.示例性非天然氨基酸
缩写. 氨基酸 缩写. 氨基酸
Aad 2-氨基己二酸 EtAsn N-乙基天冬酰胺
Baad 3-氨基己二酸 Hyl 羟基赖氨酸
Bala β-丙氨酸,β-氨基丙酸 AHyl 别-羟基赖氨酸
Abu 2-氨基丁酸 3Hyp 3-羟基脯氨酸
4Abu 4-氨基丁酸,piperidinic acid 4Hyp 4-羟基脯氨酸
Acp 6-氨基己酸 Ide 异锁链赖氨素
Ahe 2-氨基庚酸 AIle 别-异亮氨酸
Aib 2-氨基异丁酸 MeGly N-甲基甘氨酸,肌氨酸
Baib 3-氨基异丁酸 MeIle N-甲基异亮氨酸
Apm 2-氨基庚二酸 MeLys 6-N-甲基赖氨酸
Dbu 2,4-二氨基丁酸 MeVal N-甲基缬氨酸
缩写. 氨基酸 缩写. 氨基酸
Des 锁链素 Nva 正缬氨酸
Dpm 2,2'-二氨基庚二酸 Nle 正亮氨酸
Dpr 2,3-二氨基丙酸 Orn 鸟氨酸
EtGly N-乙基甘氨酸
如本文中所使用的,“化学修饰的氨基酸”是指其侧链已被化学修饰的氨基酸。例如,侧链可被修饰以包含产生信号的部分例如荧光团或放射性标记(radiolabel)。侧链可被修饰以包含新型官能团例如硫氢基、羧酸或氨基。翻译后修饰的氨基酸也包括在化学修饰的氨基酸的定义中。
氨基酸和更具体地其侧链可用其化学特征来表征。例如,氨基酸侧链可以带正电荷、负电荷或是中性的。溶液的pH影响某些侧链的带电性质,这对于本领域技术人员来说是已知的。可带正电荷的侧链的非限定性实例包括组氨酸,精氨酸和赖氨酸。可带负电荷的侧链的非限定性实例包括天冬氨酸和谷氨酸。可表征为中性的侧链的非限定性实例包括甘氨酸、丙氨酸、苯丙氨酸、缬氨酸、亮氨酸、异亮氨酸、半胱氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、甲硫氨酸、脯氨酸和色氨酸。
侧链的立体化学(Sterics)还可用于表征氨基酸。原子直径表可帮助人们确定一个侧链是否比另一个侧链大。计算机模型也可帮助该确定。
氨基酸可用其侧链的极性来表征。极性侧链(其通常比非极性侧链更亲水)包括例如丝氨酸、苏氨酸、酪氨酸、半胱氨酸、天冬酰胺和谷氨酰胺的侧链。非极性侧链(其通常比极性侧链更疏水)包括例如甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、甲硫氨酸、苯丙氨酸和色氨酸的侧链。可使用涉及侧链的原子电负性测定和三维结构估计的本领域内已知的常规技术确定侧链的极性。还可使用本领域内已知的常规技术比较侧链的疏水性/亲水性,例如比较每一个氨基酸的辛醇/水分配系数。参见Sangster,In:Octanol-Water PartitionCoefficients:Fundamentals and Physical Chemistry,Wiley Series inSolution Chemistry,Chichester:John Wiley&Sons Ltd.,2:178pages(1997)。
下表提供了可帮助本领域技术人员确定如何选择用于本文中所述Msp孔蛋白或单体修饰的氨基酸的氨基酸性质的非限定性实例。
表3.氨基酸性质
a该栏表示氨基酸被埋藏在蛋白质内部的趋势(定义为可接触溶剂的残基<5%),并且是基于9种蛋白质的结构(总共约2000个被研究的单个残基,这些残基中有587个(29%)被埋藏)。数值表示发现每一个氨基酸相对于该氨基酸的残基在蛋白质中存在的总数而言被埋藏的频率。括号的值表示相对于蛋白质中全部被埋藏的残基而言发现该氨基酸被埋藏的残基的数量。数据来自Schien,BioTechnology 8:308(1990);关于具有相似结果的其他计算方法,参见Janin,Nature277:491(1979);和Rose等人,Science 229:834(1985)。
b埋藏残基的平均体积(Vr),根据侧链的表面积计算。Richards,Annu.Rev.Biophys.Bioeng.6:151(1977);Baumann,Protein Eng.2:329(1989)。
c数据来自Darby N.J.和Creighton T.E.Protein structure.InIn focus(ed.D.Rickwood),p.4.IRL Press,Oxford,United Kingdom(1993)。
d主链以伸展构象存在的Gly-X-Gly三肽中残基X的氨基酸侧链的总的可及表面积(accessible surface area,ASA)。Miller等人,J.Mol.Biol.196:641(1987).
e显示的值表示针对38个公布的疏水性标度,氨基酸根据其在每一序列等级上出现的频率的平均等级。Trinquier和Sanejouand,Protein Eng.11:153(1998)。虽然大部分此类疏水性标度来自分离氨基酸的化学行为或物化性质(例如,水中的溶解度、水与有机溶剂之间的分配、色谱转位或对表面张力的影响)的实验测量,但还包括基于蛋白质中氨基酸的已知环境特征,例如其溶解可及性或其占据蛋白质核心的趋势(基于残基在三级结构中的位置,如利用x射线衍射晶体分析法或NMR观察到的)的几种“可使用的(operational)”的疏水性标度。更低的等级表示最疏水的氨基酸,更高的值表示最亲水的氨基酸。为了比较目的,Radzicka和Wolfenden,Biochem.27:1664(1988)的疏水性标度示于括号内。该标度来自氨基酸基于其从气相转移至环己烷、1-辛醇和中性水溶液的自由能的测量的水合势能。
可选地,可考虑氨基酸的亲水指数(hydropathic index)。基于其疏水性和/或电荷特征,已给每一种氨基酸分配了亲水指数,这些指数是:异亮氨酸(+4.5);缬氨酸(+4.2);亮氨酸(+3.8);苯丙氨酸(+2.8);半胱氨酸/胱氨酸(+2.5);甲硫氨酸(+1.9);丙氨酸(+1.8);甘氨酸(-0.4);苏氨酸(-0.7);丝氨酸(-0.8);色氨酸(-0.9);酪氨酸(-1.3);脯氨酸(-1.6);组氨酸(-3.2);谷氨酸(-3.5);谷氨酰胺(-3.5);天冬氨酸(-3.5);天冬酰胺(-3.5);赖氨酸(-3.9)和/或精氨酸(-4.5)。亲水氨基酸指数在赋予蛋白质相互作用的生物学功能中的重要性在本领域内是普通知晓的。已知某些氨基酸可置换具有相似亲水指数和/或分值的其他氨基酸和/或仍然保持相似的生物学功能。在基于亲水指数引起变化时,置换氨基酸的亲水指数可在±2以内、±1以内或±0.5以内。
在本领域内还应理解,可基于亲水性有效地进行相似氨基酸的置换。如美国专利4,554,101(通过引用合并入本文)中所述,已将下列亲水性值分配给氨基酸残基:精氨酸(+3.0);赖氨酸(+3.0);天冬氨酸(+3.0±1);谷氨酸(+3.0±1);丝氨酸(+0.3);天冬酰胺(+0.2);谷氨酰胺(+0.2);甘氨酸(0);苏氨酸(-0.4);脯氨酸(-0.5±1);丙氨酸(-0.5);组氨酸(-0.5);半胱氨酸(-1.0);甲硫氨酸(-1.3);缬氨酸(-1.5);亮氨酸(-1.8);异亮氨酸(-1.8);酪氨酸(-2.3);苯丙氨酸(-2.5);色氨酸(-3.4)。在基于相似亲水性值进行变化中,预期置换其亲水指数可在±2以内、±1以内或±0.5以内的氨基酸。
任何突变的Msp孔蛋白或单体与野生型Msp孔蛋白或单体相比较可包含保守氨基酸置换。如果置换对蛋白质的生化性质破坏很小,任何这样的置换突变是保守的。被引入以置换保守氨基酸残基的突变的非限定性实例包括:用带正电荷的残基置换带正电荷的残基(例如,H、K和R);用带负电荷的残基置换带负电荷的残基(例如,D和E);用中性极性残基置换中性极性残基(例如,C、G、N、Q、S、T和Y);以及用中性非极性残基置换中性非极性残基(例如,A、F、I、L、M、P、V和W)。可按照下列表4进行保守置换。同样地进行非保守置换(例如,脯氨酸对甘氨酸的置换)。
表4:示例性氨基酸置换
氨基酸 置换
Ala Ser,Gly,Cys
Arg Lys,Gln,Met,Ile
Asn Gln,His,Glu,Asp
Asp Glu,Asn,Gln
Cys Ser,Met,Thr
Gln Asn,Lys,Glu,Asp
Glu Asp,Asn,Gln
Gly Pro,Ala
His Asn,Gln
Ile Leu,Val,Met
Leu Ile,Val,Met
Lys Arg,Gln,Met,Ile
Met Leu,Ile,Val
Phe Met,Leu,Tyr,Trp,His
Ser Thr,Met,Cys
Thr Ser,Met,Val
Trp Tyr,Phe
Tyr Trp,Phe,His
Val Ile,Leu,Met
如本文中所使用的,“肽”是指由酰胺键(即,“肽键”)连接在一起的两个或更多个氨基酸。肽包含多至或包括50个氨基酸。肽可以是线性的或环状的。肽可以是α、β、γ、δ或更高级的,或混合的。肽可包含本文中定义的氨基酸的任何混合物,例如包含D、L、α、β、γ、δ或更高级氨基酸的任何组合。
如本文中所使用的,“蛋白质”是指具有51个或更多个氨基酸的氨基酸序列。
如本文中所使用的,“聚合物”是指包含两个或更多个线性单元(也称为“聚体”)的分子,其中每一个单元可以相同或不同。聚合物的非限定性实例包括核酸、肽和蛋白质,以及多种烃聚合物(例如,聚乙烯、聚苯乙烯)和官能化的烃聚合物,其中聚合物的主链包含碳链(例如,聚氯乙烯、聚甲基丙烯酸酯)。聚合物包括共聚物、嵌段共聚物和支化聚合物例如星形聚合物和树状聚合物(dendrimer)。
本文中描述了使用Msp孔蛋白测定聚合物的序列的方法。此外,可以以与美国专利7,189,503(以其全文通过引用合并入本文)中描述的方法类似的方法进行测序方法。也参见美国专利6,015,714,以其全文通过引用合并入本文。可以以这样的测序方法进行一种以上的阅读以提高准确性。分析聚合物的特征(例如,大小、长度、浓度、身份)和鉴定聚合物的离散单元(或"聚体(mer)")的方法也论述于'503专利中,并且可用于本Msp孔蛋白。实际上,Msp孔蛋白可用于'503专利中论述的任何方法。
目前,几种类型的可观察到的信号正被开发为纳米测序和分析物检测中的读出机制。最初提出的最直接的并且最多开发的读出方法依赖于由占据孔中最窄缢缩区的核苷酸或其他分析物的身份而独特地测定的离子“阻塞电流(blockade current)”或“共通过电流(copassingcurrent)”。该方法称为“阻塞电流纳米孔测序”或BCNX。核酸的阻塞电流检测和表征已在蛋白质孔α-溶血素(αHL)和固态纳米孔中得到例证。已显示阻塞电流检测和表征提供了一大堆关于不同背景中穿过或保留在纳米孔中的DNA的结构的信息。
一般而言,“阻塞”由与噪声波动明显可区别并且通常与分析物分子在孔的中央开口处的存在相关联的离子电流的变化所证实。阻塞的强度取决于存在的分析物的类型。更具体地,“阻塞”是指其中离子电流降至低于未阻塞电流水平的约5-100%的阈值,在该点保持至少1.0μs,然后自发地返回至未阻塞的水平的间期。例如,离子电流可降至低于约、至少约或至多约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%或在可来自其间的任何范围内的阈值。如果正好在阻塞之前或之后的未阻塞信号的平均电流偏离典型的未阻塞水平在未阻塞信号的平方根噪声值的两倍以上,那么舍弃阻塞。"深度阻塞”被确定为其中离子电流降至小于未阻塞水平的50%的间隔。其中电流保持在未阻塞水平的80%至50%的间隔被确定为“部分阻塞”。
如本文中所使用的,术语“受试者”是指活哺乳动物生物体例如人、猴、牛、绵羊、山羊、狗、猫、小鼠、大鼠、豚鼠或其转基因物种。任选地,患者或受试者是灵长类动物。人受试者的非限定性实例是成人、青少年、婴儿和胎儿。
术语“核酸”是指以单链或双链形式存在的脱氧核糖核苷酸或核糖核苷酸聚合物,并且除非另外限定,否则包括以与天然存在的核苷酸相似的方式与核酸杂交的天然核苷酸的已知类似物,例如肽核酸(PNAs)和硫代磷酸酯DNA。除非另外指出,否则一个具体的核酸序列包括其互补序列。核苷酸包括但不限于ATP、dATP、CTP、dCTP、GTP、dGTP、UTP、TTP、dUTP、5-甲基-CTP、5-甲基-dCTP、ITP、dITP、2-氨基-腺苷-TP、2-氨基-脱氧腺苷-TP、2-硫代胸腺核苷三磷酸(thiothymidine triphosphate)、吡咯并-嘧啶三磷酸和2-巯基胞苷以及上述所有核苷酸的α硫代三磷酸(alphathiotriphosphates)和所有上述碱基的2’-O-甲基核糖核苷三磷酸。经修饰的碱基包括但不限于5-Br-UTP、5-Br-dUTP、5-F-UTP、5-F-dUTP、5-丙炔基dCTP和5-丙炔基-dUTP。
如本文中所使用的,“药物”是指可改变受试者的生物学过程的任何物质。药物可被设计用于或用在受试者的疾病、障碍、综合征或其他健康折磨的诊断、治疗或预防中。药物在性质上可以是娱乐性的,即仅用于改变生物学过程并且不用于或用在受试者的疾病、障碍、综合征或其他健康折磨的诊断、治疗或预防中。生物制品,即意指由牵涉重组DNA技术的生物学机制产生的物质,也包括在术语“药物”中。药物包括例如抗菌药物、抗炎药、抗凝血药、抗病毒剂、抗高血压药、抗抑郁药、抗微生物剂、镇痛药、麻醉药、β-阻塞剂、双磷酸盐类(bisphosphonate)、化疗药物、造影剂、生育用药(fertility medication)、致幻药、激素类、麻醉品、阿片制剂、镇静药、他汀类、类固醇和血管扩张剂。药物的非限定性实例还可见于默克索引(Merck Index)。用于治疗结核病的抗菌药例如包括异烟肼、利福平、吡嗪酰胺和乙胺丁醇。
使用药物作为分析物的方法还可包括药物筛选。例如,可使用Msp孔蛋白,通过观察离子电流阻塞来研究药物至细胞或生物体内的摄入。可构建具有不同大小、静电性质和化学性质的特定Msp孔蛋白的缢缩区和/前厅,以近似地模仿药物进入或排出细胞或生物体的期望的途径。此类方法可极大地加速药物的筛选以及药物设计。已使用其他孔蛋白例如由Pagel等人,J.Bacteriology 189:8593(2007)描述的孔蛋白进行了此类研究。
如本文中所使用的,“生物战剂”是指能够引起植物或动物(包括人)的死亡或疾病或者食物或水供应恶化或环境退化的任何生物体或任何这样的微生物的任何天然存在、生物工程改造的或合成的组分。非限定性实例包括埃勃拉病毒、马尔堡病毒、炭疽芽孢杆菌(Bacillusanthracis)和肉毒梭菌(Clostridium botulinum)、重型天花(Variolamajor)、类天花(Variola minor)、炭疽和篦麻毒素。
如本文中所使用的,“污染物”是指污染空气、水或土壤的物质。污染物的非限定性实例包括肥料、农药、杀虫剂、去垢剂、石油烃类、烟和含重金属物质例如含锌、铜或汞(例如,甲基汞)的物质。
分析物可以是“纳米级物体”,其是在两个其维度上小于100nm的物体。
可使用的珠粒包括磁性珠粒和光学珠粒。例如,可使用链霉抗生物素蛋白包被的磁性珠粒对牵引DNA通过Msp孔蛋白通道的静电力施加相反的力。在该后一种技术中,将磁性珠粒附着生物素化的DNA,使用强磁场梯度可施加可与静电驱动力(约10pN)相当的力。参见,Gosse和Croquette,Biophys.J.82:3314(2002)。这样,阻塞电流读出将不受影响,但可独立地控制对DNA的力。然后使每一个DNA的数十或数百个完整独立的读出关联起来并且装配以重构准确的DNA序列。
通过“光摄(optical tweezers)”操纵的光学珠粒在本领域内也是已知的,并且可将此类方法用于本文中描述的Msp孔蛋白。光摄是用于对纳米级物体产生力的常见工具。将分析物连接至珠粒的一端,同时可将将另一端插入孔蛋白的通道。使用光摄控制和测量珠粒的位置和力。此类方法控制分析物至通道内的通过并且允许更大地控制分析物的读出,例如聚合物单元的读出。关于人造纳米孔背景中此类方法的描述,参见例如Trepagnier等人,Nano Lett.7:2824(2007)。美国专利5,795,782(通过引用合并入本文)也论述了光摄的用途。
荧光共振能量转移(FRET)是一种公知的技术,其可用于本文中的分析方法。例如,可将荧光FRET-受体或FRET-供体分子整合入Msp孔蛋白。然后用匹配的FRET-供体或FRET-受体标记分析物。当匹配的FRET-供体与FRET受体在距离内时,将可能发生能量转移。不用或除了本文中描述的使用离子电流的方法外,所得的信号可用于分析目的。因此,检测、鉴定或测序的方法可包括FRET技术。
可使用的其他光学方法包括将旋光分子引入Msp孔蛋白的内部(例如前厅或缢缩区)。外部光可用于影响蛋白质的内部:此类方法可用于影响分析物的转位速度或可允许分析物进入或从通道排出,从而提供了分析物的受控通过。可选地,聚焦在孔上的光学脉冲可用于加热孔以影响其与分析物相互作用的方式。这样的控制可以非常快,因为来自小体积的焦点的热可快速消散。控制分析物的转位速度的方法从而可使用此类旋光分子或光学脉冲。
还可通过将物体连接至分析物的一端来实现转位速度的操纵,然后分析物的另一端与Msp孔蛋白相互作用。物体可以是珠粒(例如,聚苯乙烯珠)、细胞、大分子例如链霉抗生物素蛋白、neutravidin、DNA等或纳米级物体。然后可将物体处于流体流中,可使其经受被动粘性曳力。
"分子发动机"在本领域内是公知的并且是指物理上与分析物例如聚合物(例如,多核苷酸)相互作用并且能够物理上相对于固定位置(例如Msp孔蛋白的前厅、缢缩区或通道)移动分析物的分子(例如,酶)。然而,不期望受理论束缚,分子发动机利用化学能产生机械力。分子发动机可以以顺序方式与聚合物的每一个单元(或“聚体”)相互作用。分子发动机的非限定性实例包括DNA聚合酶、RNA聚合酶解旋酶、核糖体和外切核酸酶。非酶促的发动机也是已知的,例如包装DNA的病毒发动机。参见Smith等人,Nature 413:748(2001)。多种分子发动机和此类发动机的期望的性质描述于美国专利7,238,485中,所述专利以其全文通过引用合并入本文。分子发动机可沉积在Msp孔蛋白的顺面或反面并且任选地可被固定,例如由'485专利所描述的。可使用'485专利中描述的方法将分子发动机整合入Msp孔蛋白。同样地,还可将'485专利中描述的系统和装置用于本文中描述的Msp孔蛋白。事实上,'485专利中论述的任何实施方案可使用Msp孔蛋白进行应用,如本文中所描述的。分子发动机也在例如Cockroft等人,J.Amer.Chem.Soc.130:818(2008);Benner等人,Nature Nanotech.2:718(2007);和Gyarfas等人,ACS Nano 3:1457(2009)中进行了描述。
分子发动机通常用于调节分析物与Msp孔蛋白相互作用时的速率或转位速度。本文中描述的任何Msp蛋白可包含分子发动机。任选地,应用分子发动机以减小分析物进入Msp孔蛋白通道的速率,或减少分析物转位通过Msp孔蛋白通道的转位速度。任选地,转位速度或平均转位速度小于0.5nm/μs。任选地,转位速度或平均转位速度小于0.05nm/μs。任选地,转位速度或平均转位速度小于1个核苷酸/μs。任选地,转位速度或平均转位速度小于0.1个核苷酸/μs。任选地,分析物的运动速率在大于0Hz至2000Hz的范围内。此处,速率是指规整聚合物在1秒钟内前进的亚基(或“聚体”)的数量(Hz)。任选地,该范围在约50至1500Hz、100至1500Hz或350至1500Hz之间。任选地,运动速率为约、至多约或至少约25、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、1750、1800、1850、1900、1950或2000Hz或在可来自其间的任何范围内。在表征过程中,可通过使用以基本上恒定的速率移动分析物的分子发动机来控制速率,至少进行一段时间。此外,运动速率的范围可取决于分子发动机。例如,对于RNA聚合酶,范围可以是350至1500Hz;对于DNA聚合酶,范围可以是75至1500Hz;并且对于核糖体、解旋酶和外切核酸酶,范围可以是50至1500Hz。
可用于本文中描述的方法的记录和检测技术。此外,美国专利5,795,782和7,189,503(以其全文通过引用合并入本文)也描述了可用于Msp孔蛋白的记录方法和仪器,以及用于最优化电导读数的方法。美国专利6,746,594(以其全文通过引用合并入本文)描述了用于含有纳米孔的薄膜的支持物和使用可用于本文中描述的Msp孔蛋白的支持物的方法。
另外还提供了包含本文中描述的任何核酸的载体。如本文中所使用的,载体可包含编码单链Msp纳米孔(例如,单链Msp二聚体或单链Msp八聚体)的核酸分子,其中所述核酸分子有效地连接于表达控制序列。适当的载体主链包括例如本领域中常规使用的主链,例如质粒、人工染色体BAC或PAC。许多载体和表达系统可从这样的公司如Novagen(Madison,WI)、Clonetech(Pal Alto,CA)、Stratagene(LaJolla,CA)和Invitrogen/Life Technologies(Carlsbad,CA)商购获得。载体通常包含一个或多个调控区。调控区包括但不限于启动子序列、增强子序列、应答元件、蛋白质识别位点、可诱导元件、蛋白质结合序列、5'和3'非翻译区(UTR)、转录起始位点、终止序列、多聚腺苷酸化序列和内含子。
在另一个方面,提供了用包含本文中描述的核酸的载体转染的培养细胞。在这一点上,当完整细胞的转录机器接触核酸模板以产生mRNA时,细胞被载体成功地转染。促进载体至细胞内的转染的方案在本领域内是公知的。
本文中提供了用上述载体稳定地转染的培养细胞的后代。这样的后代可包含载体的拷贝而无需经历转染方案并且能够转录载体中包含的在表达控制序列控制下的核酸。利用用表达载体转染的培养细胞产生大量多肽的技术在本领域内是公知的。参见,例如,Wang,H.,等人,J.Virology 81:12785(2007)。
本文中还提供了能够诱导型表达Msp的突变细菌菌株。该突变细菌菌株包含野生型MspA的缺失、野生型MspC的缺失、野生型MspD的缺失和包含有效地连接Msp单体核酸序列的诱导型启动子的载体。任选地,该突变细菌菌株包含耻垢分枝杆菌菌株ML16。任选地,所述Msp单体核酸序列编码选自野生型MspA单体、野生型MspC单体、野生型MspD单体和其突变单体之中的Msp单体。任选地,所述诱导型启动子包含乙酰胺诱导型启动子。
任选地,突变的细菌菌株还包含野生型MspB的缺失。包含野生型MspB缺失的突变细菌菌株还可包含具有有效连接核酸序列的组成型启动子的载体,所述核酸序列编码Msp孔蛋白或单体。任选地,Msp孔蛋白或单体选自野生型MspA、野生型MspC、野生型MspD和其突变体。任选地,载体包含本文中描述的任何核酸。
还提供了产生完整或部分单链Msp孔蛋白的方法。所述方法包括转化突变的细菌菌株。该突变的菌株包含野生型MspA、野生型MspB、野生型MspC、野生型MspD的缺失和包含有效地连接Msp单体核酸序列的诱导型启动子的载体。用包含能够编码单链Msp孔蛋白的核酸序列的载体转化该突变的菌株。然后从细菌纯化单链Msp孔蛋白。任选地,单链Msp孔蛋白包含单链MspA孔蛋白。任选地,载体包含本文中描述的任何核酸。
还提供了使用单链Msp孔蛋白测定核酸或多肽序列的方法。所述方法包括产生包含第一和第二侧面的脂双层,向脂双层的第一侧面加入纯化的Msp孔蛋白,对脂双层的第二侧面施加正电压,使实验核酸或多肽序列转位通过该单链Msp孔蛋白,将实验阻塞电流与阻塞电流标准相比较,和测定实验序列。任选地,该单链Msp孔蛋白包含野生型MspA单体或其突变的单体。任选地,Msp单体包含选自表1的MspA旁系同源物或同系物单体。
除非明确指出择一地指示或选项是相互排斥的,否则术语“或”在权利要求中的使用用于表示“和/或”,虽然本公开内容支持表示择一选项和“和/或”的定义。
在整个本申请中,术语“约”用于表示数值包括用于测定该数值的装置或方法的误差的标准差。在与术语“约”结合使用的数值的上下文中论述的任何实施方案中,明确地预期术语约可被省略。
根据长期专利法,除非明确地指出,否则词"a"和"an"(一种/一个等),当在权利要求或说明书中与词“包含”结合使用时,表示一个或多个。
本发明公开了可与本文公开的方法和组合物结合使用、用于其制备成作为其产物的材料、组合物和组分,本文中公开了这类和其他材料,并且应理解,当公开此类材料的组合、亚组、相互作用、类等、然而未明确地公开此类化合物的每一个不同的个别和集体组合以及排列时,在本文中仍明确地涉及和描述了这些情形。例如,如果公开和论述了某一方法,并且论述了可对该方法中包括的许多分子进行的许多修饰(包括该方法),那么除非明确地指出与之相反,否则明确地涉及所述方法的所有组合及排列和可能的修饰。同样地,也明确地涉及和公开了此类方法和修饰的任何亚组或组合。该概念用于本公开内容的所有方面,包括但不限于使用所公开组合物的方法中的步骤。因此,如果存在可进行的许多另外的步骤,那么应理解可用任何特定的方法步骤或所公开方法中的方法步骤的组合进行此类另外的步骤中的每一步骤,以及每一个这样的组合或组合的亚组是被明确地涉及的并且应当被认为是公开的。因此预期本说明书中论述的任何实施方案可应用于本文中公开的任何方法、化合物、蛋白质、孔蛋白、肽、多肽、多聚体、单体、核酸、载体、菌株、培养细胞、系统或组合物等,反之亦然。例如,本文中描述的任何蛋白质可用于本文中公开的任何方法。
因此本文中引用的出版物和它们被引用的材料以其全文通过引用合并入本文中。
为了举例说明(非限定性地)本文中公开的材料,提供下列实施例。
实施例
实施例1:实施例1至7的材料和方法
由Integrated DNA Technologies,(IDT;Coralville,IA)合成均质的ssDNA寡核苷酸dA50,dC50和dT50(分别为SEQ ID NO:10、SEQID NO:16和SEQ ID NO:17)和发夹构建体hp08(5′GCTGTTGCTCTCTC GCAACAGC A503′)(SEQ ID NO:4)、hp10(5′GCTCTGTTGC TCTCTC GCAACAGAGC A503′)(SEQ ID NO:5)和hp12(5′GCTGTCTGTTGC TCTCTC GCAACAGACAGC A503′)(SEQ ID NO:6)。
细菌菌株和生长条件。用于本研究的全部细菌菌株列于表5中。将分枝杆菌在37℃下培养在补充有0.2%甘油、0.05%Tween的Middlebrook 7H9液体培养基(Difco)中或补充有0.2%甘油的Middlebrook 7H10琼脂糖(Difco)上。大肠杆菌DH5α用于全部克隆实验并且在37℃常规地培养于Luria–Bertani(LB)培养基中。以200μg/mL(对于大肠杆菌而言)和50μg/mL(对于耻垢分枝杆菌而言)的浓度使用潮霉素。
表5.菌株和质粒.
注释HygR表示对潮霉素的抗性。MspA、mspC和mspD是耻垢分枝杆菌的孔蛋白基因。
mspA的定点诱变。利用定点诱变,使用如由Bi和Stambrook,Nucl.Acids Res.25:2949(1997)描述的联合链式反应(combined chainreaction,CCR)以分步的方式构建M1MspA和M2MspA突变单体。质粒pMN016含有psmyc-mspA转录融合物(Stephan等人,Mol.Microbiol.58:714(2005))并且用作模板。将寡核苷酸psmyc1和pMS-seq1(表6)分别作为正向和反向引物用于CCR。将3个随后的突变引入mspA以构建m1mspA基因。将3个另外的突变引入m1mspA以产生m2mspA。通过在将所有质粒转化入三重孔蛋白突变耻垢分枝杆菌ML16(Stephan等人,Mol.Microbiol.58:714(2005))以产生蛋白质之前,通过测定完整mspA基因的序列来验证所有质粒。
表6.寡核苷酸
被改变以引入MspA突变的密码子加以下划线。
单通道实验。利用以等比例或非等比例制备的二植烷酰-PA和二植烷酰-PC脂质来产生双分子层,并且如(Akeson等人,Biophys.J.77:3227(1999))所述的铁氟龙(Teflon)中所述横跨水平的约20μm-直径的孔形成。以约2.5ng/mL的浓度向双分子层的一侧(顺面)加入MspA孔蛋白。将顺面接地,并且对双分子层的反面施加正电压。应用Axopatch-1B膜片钳放大器(Axon Instruments)在双分子层两侧施加电压并且测量流过孔的离子电流。用4极Bessel滤波器在50kHz对模拟信号进行低通滤波。在250kHz对滤过的信号数字化。使用在LabWindows/CVI(National Instruments)中书写的定制软件控制数据获取。在21±2℃下于1M KCl,在pH 8下缓冲的10mM Hepes/KOH中进行全部实验。
数据分析。使用在Matlab(The MathWorks;Natick,MA)中书写的定制软件进行数据分析。阻塞被确定为其中离子电流降至未阻塞电流水平的80%的阈值以下,在该点保持至少12μs,然后自发地返回至未阻塞水平的间期。如果正好在阻塞之前或之后的未阻塞信号的平均电流偏离典型未阻塞水平多于未阻塞信号的平方根噪声值的两倍,则舍弃阻塞。如果阻塞在另一个阻塞的26μs内发生,那么也舍弃所述阻塞。深度阻塞被确定为其中离子电流下降至未阻塞水平的50%以下的间期。其中电流保持在未阻塞水平的80%至50%的间期被确定为“部分阻塞”。每一个事件利用其组成型部分和深度子区间的驻留时间和平均电流来进行参数化。
将用于参数化发夹深度阻塞驻留时间分布的tD值估计为驻留时间的以10为底的对数的概率密度分布的峰值(图8)。使用Matlab核光滑密度估计器(Kernel smoothing density estimator),利用标准核函数(normal kernel function)和0.15的宽度估计该分布。通过检测从小于1nS至大于1nS的电导的陡变来分析跨双层数据。记录这些变化发生时的电压,然后概述于图9E-9G显示的直方图中。
在全部实验中,孔的方向被定向为“入口”(图1)暴露于装置的顺面区室(cis compartment)。
图5-8中展示的全部发夹数据来源于对相同长寿命M1MspA孔蛋白采集的数据。利用与所述发夹数据不同的不同长寿命M1MspA孔蛋白获得实施例5中提供的同聚物数据,但在对这两种孔采集的扩展发夹数据集之间存在定量的一致性。
实施例2:具有和不具有分析物的野生型MspA(WTMspA)孔蛋 白的阻塞特征
MspA孔蛋白的纯化。从耻垢分枝杆菌选择性提取MspA孔蛋白,随后如(Heinz和Niederweis,Anal.Biochem.285:113(2000);Heinz等人,Methods Mol.Biol.228:139(2003))中所述通过阴离子交换和凝胶过滤层析进行纯化。
与之前的结果(Niederweis等人,Mol.Microbiol.33:933(1999))相一致,纯化的蛋白质显示高通道形成活性,在约20℃下于1.0MKCl中最常见的电导为4.9nS(图2)。将顺面区室接地并且对反面区室施加正电压(图3A)。在约60mV以上,WTMspA孔蛋白在ssDNA不存在的情况下显示频繁的离子电流自发阻塞(图3)。一些自发阻塞是短暂的,其他阻塞需要反转电压来重建未阻塞的电流水平。尽管存在该行为,对于高至约100mV的电压,仍然存在持续数十秒的稳定的未阻塞信号的间期(图3)。向顺面区室加入约2–8μM dC50(SEQ IDNO:48)ssDNA不会导致这些阻塞特征的显著增强或改变。在约100mV以上,自发阻塞如此频繁以至于ssDNA检测实验不能实施。
ssDNA与WTMspA孔蛋白的相互作用的明显不存在的一个解释是孔中负电荷的高密度(图1)。与带负电荷的通道内部的静电相互作用可能抑制了DNA进入孔内。为了解决该问题,用天冬酰胺置换缢缩区中的天冬氨酸残基(图1)。在实施例3中论述了所得的MspA突变D90N/D91N/D93N(M1MspA)孔蛋白。
实施例3:具有和不具有分析物的MspA突变M1MspA孔蛋白的 阻塞特征
实验
如实施例2中所指出的,ssDNA与WTMspA孔蛋白的通道之间的静电相互作用可影响ssDNA通过孔的转位。MspA突变D90N/D91N/D93N(M1MspA,也称为M1-NNN)被设计用以测试该理论。从缺乏大多数内源孔蛋白的耻垢分枝杆菌菌株ML16表达M1MspA孔蛋白并且纯化其(Stephan等人,Mol.Microbiol.58:714(2005))。M1MspA孔蛋白(图4)的表达水平和其通道形成活性与WTMspA孔蛋白相似,然而电导下降至1/2至1/3(图2)。此外,自发阻塞的频率在M1MspA孔蛋白中急剧减少,从而使得可能在高至180mV和更高的电压下进行DNA检测实验(图5)。
ssDNA发夹构建体用于研究DNA与M1MspA孔蛋白的相互作用。每一个构建体具有50-nt poly-dA突出(在3′末端上)、可变长度(对于构建体hp08(SEQ ID NO:4)、hp10(SEQ ID NO:5)和hp12(SEQ ID NO:6)分别为8、10和20bp)的dsDNA双链体区域和6-nt的环(图6)。在180mV,向顺面区室加入约8μM hp08ssDNA引起瞬间离子电流阻塞的速率从每秒0.1–0.6次阻塞增加至每秒20–50次阻塞(图5)。阻塞速率与DNA浓度成比例并且呈现强烈的电压依赖性,施用的电压减少20-mV,则阻塞速率减小至约1/3。足够长而能良好分辨的阻塞是其中离子电流减小至未阻塞水平的80%至50%的部分阻塞或其中离子电流减少至未阻塞水平的50%以下的深度阻塞(图5C)。同时展示部分和深度子区的阻塞是非常罕见的。部分阻塞持续数十至数百微秒,并且其驻留时间随电压增加而增加(图5C和7)。深度阻塞持续数百微秒至数百毫秒,并且其驻留时间随电压增加而减少(图6和7)。在使用全部三种发夹的实验中均观察到这些趋势。
分析
与利用αHL观察到的类似信号(Butler等人,Biophys.J.93:3229-40(2007))相似,部分阻塞被解释为DNA进入M1MspA孔蛋白的前厅而未使单链区段穿过通道缢缩发生丝状化。对于该机制,预期离子电流有适度减小。无意受限于理论,驻留时间随电压的增加而增加(图7)最可能是因不断增加的静电屏障防止DNA分子从前厅逃回顺面区室而引起的。这一对驻留时间的解释可以在动力学框架内得到理解,在所述框架中,聚合物从前厅的衰减通过逃离所施加电压梯度和一个末端穿过缢缩的丝状化的两个一级过程而发生。因而寿命是这些过程的速率常数之和的倒数。如果(i)逃逸速率常数随电压的升高而减小并且(ii)其减小超过丝状化速率常数的任何变化,那么该寿命将随电压的升高而增加。
对于深度阻塞,驻留时间随电压不断升高而明显减少与牵涉DNA逃回顺面区室的任何过程不相符。离子电流减小的程度和驻留时间的电压依赖性与其中单链polydA区段被驱动通过约1-nm直径的缢缩直至约2.2-nm-直径的DNA双链体到达缢缩区并且停止转位的过程相符(图5A)。发夹构建体保持其丝状构型直至DNA双链体的解链(Vercoutere等人,Nat.Biotech.19:248-52(2001);Sauer-Budge等人,Phys.Rev.Lett.90:238101(2003);Mathe等人,Biophys.J.87:3205-12(2004))或M1MspA孔蛋白缢缩区的构象重排允许转位完成。不受理论束缚,转位完成的解链机制似乎是最合理的,因为dsDNA螺旋的通过要求缢缩在直径上大致加倍,破坏侧翼连接缢缩的β-桶的氢键(Faller等人,Science 303:1189(2004))并且潜在地将蛋白质的疏水区和双分层内部暴露于水。
M1MspA孔蛋白中的发夹深度阻塞具有非常宽广的驻留时间分布,其不能由简单的指数或指数之和充分说明(图8)。为了使分布参数化,使用图6中相应于具有最高阻塞密度的驻留时间的深度阻塞驻留时间tD的对数模式(图8)。对于全部电压,hp08具有最短的tD。在160mV以下,hp10和hp12具有相似的tD。然而,在160mV以上,hp10始终具有比hp12更长的tD。这些观察结果与来自αHL的观察结果(其中利用单指数建立发夹阻塞驻留时间分布的模型并且具有更大的标准生成自由能的发夹一致地产生更长的深度阻塞)稍有不同(Vercoutere等人,Nat.Biotechnol.19:248(2001);Mathe等人,Biophys.J.87:3205(2004))。假定深度阻塞是由以双链体解链作为限速步骤的转位产生的,那么该过程在M1MspA孔蛋白中应该比在αHL中慢10至100倍(Mathe等人,Biophys.J.87:3205(2004))。有趣地,hp10阻塞持续比hp12阻塞更长的时间。在于180mV下利用hp10的6个重复的实验中,各自观察到为340±7pA的平均未阻塞电流水平和9±1ms(平均值±SEM)的平均tD。
实施例4:利用M1MspA孔蛋白进行的跨双层检测
理论。
为了获得DNA转位通过MspA的直接证据,使用图9中举例说明的和由Nakane等人创建的跨膜检测技术(Nakane等人,Biophys.J.87:615(2004))。通过电泳驱动在一端具有大块锚复合物的ssDNA探针分子进入纳米孔。游离的ssDNA末端穿过孔进入反面区室直至锚终止转位。如果反面区室含有与ssDNA探针的末端互补的短ssDNA靶分子,那么探针和靶可杂交。如果杂交发生,那么探针以带螺纹的构型被锁定直至施加足够负的电压引起探针与靶解离并且排入顺面区室。如果杂交因随机原因或因为探针末端与靶不互补而未发生,或者如果在反面区域中不存在靶分子,那么探针退回至顺面区域就不需要负电压。出现只有通过足够负的电压才能清除的阻塞的是ssDNA探针已穿过纳米孔至反面区室并且与靶DNA杂交的证据。
实验。
构建包含75-nt-长的ssDNA分子的探针分子,所述ssDNA分子在其生物素化的5′末端连接至neutravidin(nA)锚并且在其3′末端具有异质的15-nt长的互补序列。从Invitrogen(Carlsbad,CA)获得nA。由IDT合成两个不同的5′-生物素化的ssDNA构建体5′-bt-dC6dA54d(CTCTATTCTTATCTC)-3′(SEQ ID NO:7)和5′-bt-dC6dA54d(CACACACACACACAC)-3′(SEQ ID NO:8)。将nA和ssDNA构建体以1:1的比例以50μM的浓度混合于实验性1M KCl缓冲液中并且于-20℃下贮存直至即将使用。由IDT合成15-nt长的靶DNA,3′-GAGATAAGAATAGAG-5′(SEQ ID NO:9),将其悬浮于该实验性缓冲液中,于-20℃下贮存直至即将使用。顺面区室预先加载约100μM的靶DNA并且反面区室用无DNA的缓冲液灌洗。在双分子层形成后,灌洗顺面区室以除去通过孔扩散的任何靶DNA。一旦建立稳定的M1MspA孔蛋白,向反式区室加入nA–ssDNA复合物至约1μM的终浓度。将于LabWindows中书写的定制实验控制软件用于连续监控电流和施加适当的电压。
当将用180mV驱动探针分子从顺面区室进入孔时,观察到不明确的深度电流阻塞。为了进行跨双层实验,利用180mV捕捉探针分子。在短暂延迟以确保ssDNA尽可能穿过M1MspA孔蛋白后,将电压降至40mV并且在该水平上保持5秒以允许15-nt长的靶ssDNA之一与探针的互补末端退火。然后将电压以130mV/s的速度下降。对于每一个事件,探针排出电压Vexit被确定为当在电压逐渐下降时观察到电导发生大且急剧的增加时的电压(图9C和9D)。
通过检测电导从小于1至大于1nS的陡变分析跨双分子层数据。记录这些变化发生时的电压,然后概括于图9E–9G中显示的直方图中。关于有关数据分析的其他信息参见实施例1中的材料和方法。
分析。
来自使用3个不同探针/靶组合的实验的Vexit的直方图示于图9中。当探针DNA与靶DNA互补时(图9E),相当数量的Vexit是负的,表明探针/靶杂交。在6个使用互补探针/靶分子的重复实验中,观察到相似的负Vexit群体。在其中ssDNA 3′末端不与靶分子互补的5个重复实验(图9F)中和在不具有靶DNA的一个实验(图9G)中,很少观察到负的Vexit值。对两个不同的纳米孔使用互补和非互补探针/靶组合。这些孔之一的数据示于图10E和10F中。这些数据提供了ssDNA可穿过M1MspA孔蛋白的明确和直接的证据,从而证实了图5中观察到的深度阻塞确实是由ssDNA转位通过M1MspA孔蛋白引起的这一假设。
实施例5:MspA突变M1MspA孔蛋白和线性均质的ssDNA
还研究了M1MspA孔蛋白与线性均质ssDNA 50-聚体之间的相互作用。在180mV,向顺面区室加入约8μM dT50引起每秒约5次阻塞(图10),比在dT50(SEQ ID NO:32)不存在的情况下的阻塞速率增加约20倍。这些阻塞的大部分短于30μs,这些阻塞太短以至不能分辨内部结构或估计阻塞的深度。使用dA50(SEQ ID NO:49)和dC50(SEQ ID NO:48)的实验产生相似的结果。观察到的阻塞的短持续时间表明这些线性均质的ssDNA 50-聚体的转位通常短于30μs。所述阻塞也与聚合物进入前厅的短途旅行(以逃回顺面区室结束)相符。虽然在使用线性ssDNA 50-聚体的实验中转位和逃逸都可能发生,但不可能估计这两个过程的相对频率。
实施例6:具有和不具有分析物的MspA突变体M2MspA孔蛋 白的阻塞特征
为了进一步检查MspA孔蛋白中电荷对其DNA分析能力的效应,对M1MspA孔蛋白进行3个另外的突变,并且用带正电荷的残基置换前厅中和入口周围的带负电荷的残基(图1)。所得的突变体D90N/D91N/D93N/D118R/D134R/E139K(M2MspA)孔蛋白显示与WTMspA(图2)孔蛋白相似的表达水平(图4)和通道形成活性。
与M1MspA孔蛋白一样,M2MspA孔蛋白具有比WTMspA孔蛋白(图2)更小的电导并且对于高至180mV或更高的电压展示最小的自发阻塞。在180mV,向顺面区室加入2μM dT50(SEQ ID NO:32)导致每秒约25次阻塞的阻塞速率(图10B)。以明确的向下峰电位结束的约100μs的部分阻塞是常见阻塞模式(图10C)。部分阻塞持续时间和其以向下峰电位结束的趋势都随电压的升高而增加(图11)。这些趋势与其中聚合物进入前厅并且保持在其中(从而产生部分阻塞直至一端进入强电场缢缩和启动转位)的过程相符。该机制准确地解释了使用αHL观察到的相似的部分-至-深度阻塞模式(Butler等人,Biophys.J.93:3229(2007))。向下峰电位的短持续时间表明线性ssDNA 50-聚体通过M2MspA孔蛋白的转位短于约30μs。不以向下峰电位结束的部分阻塞被解释为逃回至顺面区室或短于约10μs的转位,该转位太短以至在这些实验中不能被观察到。
实施例7:M1和M2MspA突变孔蛋白与αHL性质的比较
M1MspA与M2MspA孔蛋白之间的重要相似性是线性ssDNA 50聚体的转位似乎太快以至于不能产生具有可分辨的结构的深度阻塞。不受理论束缚,这一观察结果表明对于两种突变体来说都相同的缢缩是主要决定线性ssDNA分子转位通过MspA孔蛋白的速度的区域。比较M1MspA和M2MspA孔蛋白的约2至10个碱基/μs的MspA转位速度与利用αHL观察到的约0.5–1个碱基/μs的转位速度(Meller等人,Proc.Natl Acad.Sci.USA 97:1079(2000);Butler等人,Biophys.J.93:3229(2007)),支持了通道几何形状和组成的细节在确定转位速度中起着首要作用的概念。
在MspA孔蛋白和αHL的情况下,转位速度上的大差异可能因侧面连接缢缩的通道区域的宽度所致。如果DNA与通道壁之间的相互作用减慢了DNA的通过(Slonkina and Kolomeisky,J.Chem.Phys.118:7112-8(2003)),那么在αHL中预期含有更慢的转位,其中被高度限制在缢缩区和跨膜区中的10至20个碱基被迫与通道壁相互作用。在MspA孔蛋白中,缢缩区中只有2至4个碱基被迫与该蛋白质接触。缢缩区中电荷的分布是αHL与M1和M2MspA突变孔蛋白之间的另一个显著差异。αHL缢缩区由E111、K147和M113的侧链形成(Song等人,Science 274:1859(1996)),这迫使带负电荷的ssDNA主链与7个带正电荷的和7个带负电荷残基极其靠近。M1和M2MspA突变孔蛋白的缢缩区中带电荷残基的缺乏还可能是造成与αHL相比较更快的转位速度的原因。
两个MspA突变孔蛋白之间的同聚物阻塞特征的进一步比较有助于了解通道中带电荷残基的排列是如何影响其与DNA的相互作用。对于给定的ssDNA浓度,M2MspA孔蛋白的阻塞速率约为M1MspA孔蛋白速率的20倍(图10B)。在低至约80mV下,M2MspA孔蛋白还显示可容易地观察的阻塞,然而对于M1MspA孔蛋白,低于约140mV几乎未看到阻塞。最后,针对M2MspA孔蛋白的部分阻塞至少为M1MspA孔蛋白的约100倍长(图9C)。这些趋势与简单静电模型相符,其中M2MspA孔蛋白中带正电荷的残基都促进ssDNA进入前厅并且抑制ssDNA分子从前厅逃回顺面区室。这些观察结果显示带电荷残基的适当放置提供了实质上定制(tailor)MspA孔蛋白与DNA之间的相互作用的简单方法。
实施例8:M1MspA孔蛋白通过发夹(hp)区段识别保持在孔中的 DNA中的单核苷酸
如实施例3中所述进行使用M1MspA孔蛋白和(i)具有包埋在poly-A背景中的单个C及(ii)具有包埋在poly-A背景中的单个T的poly-A DNA链的实验。如上文中所指出的,所述发夹在MspA孔蛋白缢缩区中保持该DNA构建体的时间足够长而能获得极好地确定的电流特征(current signature)。
包埋在poly-A DNA发夹构建体中的单个C。图12A显示由发夹后位置1、2和3上的单个C以及poly-A和poly-C的混合物产生的电流直方图。每一个位点的电流直方图极不相同,并且显示“识别位点”在位置2的附近。为了进行更多的定量描述,根据针对poly-C和poly-A发现的电流差异标度电流分布的峰值(图12B)。高斯拟合显示MspA孔蛋白对于单个C的识别位置是距离发夹所在的位置1.7个核苷酸(nt)。识别位置的长度(缢缩区长度)可与高斯的宽度(1.6nt,约长)相当。
包埋在poly-A DNA发夹构建体中的单个T。以相似的方式进行在poly-A DNA中使用单个T的实验,仅聚焦于与发夹相邻的前3个位置上(图13,图框2-4)。特异性同样令人难忘,但在该情况下在位置1的附近展示最大的灵敏度。单个T的位置可远比一个位置好分辨。不受理论束缚,本发明者推测与poly-A中的C相比较而言位置识别的差异实际上由促成形成缢缩的静电环境的DNA本身引起。关于C背景中的单个A的数据示于图13的最底下的3个图框中。虽然单个A产生仅能与poly-C背景微弱地分开的电流阻塞特征,但电流分布足够窄,能够分辨单个A。A在poly-C链中的最佳位置似乎在位置2附近,即,与单个C在A链中的相似。
位置3以外的DNA尾的组成不影响碱基识别性质。Poly-A DNA形成二级结构,并且poly-A背景中的C与poly-C背景中的A之间的数据差异可归因于poly-A尾的二级结构(刚度)的中断。利用由A或C三核苷酸占据的前3个位置之后的47个碱基长的异质序列进行测量。发现电流水平不能与纯A50和C50尾的电流水平相区别,从而表明尾二级结构或组成不影响电流阻塞(图14)。
进行另外系列的实验(1)以评估M1MspA孔蛋白区别不同核苷酸的能力和(2)评估孔蛋白对其敏感的区域的位置和长度(空间分辨率)。在这些实验中,使用具有50个核苷酸的ssDNA链的不同DNA构建体,所述ssDNA链连接至14碱基对发夹区段以阻止瞬间转位(immediatetranslocation)。数据概述于图31中。dA50(SEQ ID NO:49)和dC50(SEQ ID NO:48)产生显著不同的阻塞电流。接着,测试一系列构建体,识别位点被分离至发夹后的前4个碱基。这些构建体在发夹之后具有dC4dA46(SEQ ID NO:15)、dA3dC4dA43(SEQ ID NO:12)和dA6dC4dA40(SEQ ID NO:11)的ssDNA序列。dC4dA46展示几乎与dC50相同的阻塞电流分布,而dA3dC4dA43和dA6dC4dA40阻塞与dA50相似。这使识别位点缩窄至发夹后的前3个核苷酸。然后,使用位于poly-dA背景中的不同位置上的单个dC测试构建体。Hp-dC1dA49(dC在位置1上)(SEQ ID NO:14)以处于poly-dA与poly-dC值中间的水平阻塞电流。构建体dA2dC3dA47(dC在位置3上)(SEQ ID NO:50)以处于poly-dA与poly-dC中间的水平阻塞电流,但更接近poly-dA。Poly-dT50(SEQID NO:32)以最小的电流发生阻塞,hp-dG3dA47(SEQ ID NO:18)产生处于poly-dC与poly-dA中间的电流。在不同突变体(D90/91Q+D93N+D118/134R+E139K)中,测量poly-dC、poly-dA和poly-dT的阻塞电流并且其是彼此可区分的。这些数据表明M1MspA孔蛋白具有识别能力并且识别位点较短。此外,假定发夹正好在缢缩区的顺面被阻止,那么所述识别位点似乎位于缢缩区。
实施例9:突变的MspA M1-QQN和M2-QQN孔蛋白的构建和表
在设计以用减慢DNA转位通过MspA孔蛋白通道的另一组实验中,产生两个另外的突变体。以与上述M1-NNN(或M1MspA)相似的方式,通过用谷氨酰胺置换野生型MspA单体的位置90和91中的氨基酸和用天冬酰胺置换位置90中氨基酸来产生一个突变体(称为M1-QQN)。关于M2-QQN,通过在M2MspA突变体(参见实施例6;D90Q+D91Q+D93N+D118R+E139K+D134R)的背景中在位置90和91上引入更庞大的谷氨酰胺来减小孔的缢缩区。其在上文实施例1和3中描述的耻垢分枝杆菌ML16突变体中表达。M2-QQN孔蛋白在去垢剂提取物中的量与WTMspA孔蛋白的量一样高(图15A),这表明新突变不影响孔表达。脂双层实验显示M2-QQN孔蛋白与WTMspA孔蛋白一样形成稳定的开放孔(图15B)。孔形成活性与WTMspA孔蛋白相似。M2-QQN孔蛋白的单通道电导(2.4nS)高于其亲本M2(1.4nS)的电导。
QQN突变体在A、C和T碱基之间也可区分。与M1MspA突变孔蛋白(也称为M1-NNN突变体)的性质相似,使用同聚物-hp链,QQN突变体展示良好分辨的电流水平,但水平之间的相对间距在M1-QQN孔蛋白中是不同的。对于每一个孔,收集关于具有A50、T50和C50尾(分别地SEQ ID NO:49、SEQ ID NO:32、SEQ ID NO:48)的发夹的数据。将阻塞电流作为未阻塞的开孔电流的一部分作图(图16)。在每一个情况下,poly-T比poly-C更容易阻塞,poly-C比poly-A更容易阻塞。每一个峰与其他峰很好分辨。在QQN孔蛋白中,平均poly-A和poly-C电流水平不如M1-NNN孔蛋白中的好分离,但在M1-NNN孔蛋白中,poly-T与poly-C更好分离。令人惊讶地,两种QQN突变孔蛋白中poly-T阻塞的相对水平截然不同。这两个突变体仅在远离缢缩区的边缘结构域置换上有不同。不受理论束缚,这可能是由于边缘结构域与锚定发夹之间的相互作用造成的。
QQN突变孔蛋白似乎减慢DNA转位通过MspA。构建QQN突变体的主要动机是减慢DNA通过。随深度阻塞状态的持续时间记录异质的100nt ssDNA区段(不具有锚定发夹)的转位。存在曲线(图17)显示持续比时间t更长的阻塞事件的部分。在大约前100μs过程中,NNN突变体衰减显著快速于具有QQN缢缩区的突变体。这些数据与通过QQN增加对转位的阻碍相符。
实施例10:耻垢分枝杆菌四重Msp缺失突变体的构建
为了制备MspA孔蛋白,选择性提取来自突变菌株耻垢分枝杆菌ML16的蛋白质,所述菌株只包含4个Msp基因之一(MspB)(其他基因是MspA、MspC和MspD)。所述方法通过在0.5%正辛基聚氧乙烯烃(OPOE)(非离子去垢剂)中煮沸耻垢分枝杆菌细胞而利用了MspA的极端热稳定性,得到极少污染有其他蛋白质的MspA孔蛋白(Heinz和Niederweis,Anal.Biochem.285:113-20(2000))。然而,仍然可在使用Msp-特异性抗血清的免疫印迹中检测到MspB的背景表达(Stephan等人,Mol.Microbiol.58:714-30(2005)),这表明混合的MspA/MspB寡聚物可形成和促成在孔重建实验中观察到的孔异质性。因此,目的之一是构建不含内源孔蛋白的耻垢分枝杆菌菌株。由于耻垢分枝杆菌需要孔蛋白活性以存活,因此,对于孔蛋白三重突变体ML16的分枝杆菌噬菌体L5,将loxP-侧翼连接的MspA表达盒整合入染色体attB位点。
这使MspA单体在菌株ML56中的表达恢复至野生型水平的一半。接着,在如(Stephan等人,Gene 343:181-190(2004))所描述的两步策略中使用自杀载体pMN247利用FRT-侧翼连接的hyg基因置换MspB基因。在利用Flp重组酶切除hyg基因后,获得孔蛋白四重突变菌株ML59(ΔMspA ΔMspB ΔMspC ΔMspDattB::loxP-MspA-loxP)。通过Southern印迹杂交确认MspB基因的缺失。PCR证明4个原始Msp基因中的每一个基因均不存在(图19)。loxP-MspA-loxP盒的切除导致小的能存活的克隆,更详尽地检查其中之一(ML180)。使用相同的高温方法从ML180细胞提取蛋白质,Western分析显示ML180细胞不表达Msp孔蛋白,在加入20μg蛋白质后在脂双层实验中也不存在任何重建事件(图20)。这些结果综合在一起显示已产生了缺乏全部4种Msp孔蛋白的耻垢分枝杆菌孔蛋白突变体。然而,使用MspA表达载体不可能检测到MspA单体的表达,这最可能是由于未知的次级突变所致。因此,该耻垢分枝杆菌菌株不能用于针对DNA转位而工程改造的MspA孔的表达。
实施例11:利用MspA的诱导型表达构建耻垢分枝杆菌四重Msp 缺失突变体ML705
为了分离野生型和突变MspA孔蛋白,目前使用耻垢分枝杆菌ML16菌株(△MspA、△MspC、△MspD)。然而,MspB的背景表达使得转位实验的解释变得复杂。因此,需要构建缺乏全部4种Msp基因的耻垢分枝杆菌菌株来改进单孔实验。为了达到这一点,将在乙酰胺诱导型启动子控制下的MspA基因整合入耻垢分枝杆菌ML16的L5attB位点,从而导致通过等位基因交换除去MspB基因。因此,在乙酰胺存在的情况下,表达MspA来拯救耻垢分枝杆菌四重突变体的生长。
为了实现这一点,构建整合质粒pML967,其包含在乙酰胺诱导型启动子控制之下的MspA基因(图21A)。还构建MspB缺失载体pML1611(图21B),其包含两个报告基因gfp和xylE作为整合和等位基因置换的标记。
在将MspA单体表达质粒pML967整合入耻垢分枝杆菌ML16后获得菌株ML341(ML16,attP::pML967)。通过由之前描述的质粒pML2005临时表达Flp重组酶(Song等人,Mycobacteria protocols(2008))从该菌株除去潮霉素抗性基因,从而产生菌株ML343(ML341,attP::pacet-MspA)。为了检查整合的MspA基因单体的功能性,用去垢剂从未诱导的和诱导的细胞提取MspA。图22显示在加入2%的乙酰胺后MspA以野生型水平的20%从整合的构建体表达。该MspA单体水平足以使耻垢分枝杆菌能够存活。在未诱导的细胞中存在极低的Msp孔蛋白的背景表达(图22),表明表达系统受到调控。
然后,将MspB缺失载体pML1611转化入ML343。将转化体涂板在含有10%蔗糖的Middlebrook 7H10琼脂板上以进行双交换候选者的直接选择。获得若干集落,所述集落在用蓝光照射时并且在XylE不存在的情况下通过绿色荧光显示GFP的存在。来自所述克隆之一的菌落PCR(Colony PCR)确认了MspB基因的不存在和能存活的Msp四重突变体的构建。该菌株称为ML378。用pCreSacB1质粒转化ML378菌株以除去gfp-hyg表达盒。在随后的负选择后,获得若干克隆,通过菌落PCR对其进行检查。耻垢分枝杆菌的8个未标记的孔蛋白四重突变体之一称为ML705,对其进一步进行表征。
为了检查MspA单体是否补偿四重突变体的表型,将MspA表达质粒pMN016转化入ML705。图24显示ML705在7H10琼脂板上的生长急剧减少;然而,MspA从pMN016的表达完全将ML705的生长恢复至野生型水平(图23)。这些结果证明无次级突变引起了生长缺陷,并且可表达MspA单体以在Msp四重突变体ML705中产生MspA孔蛋白。
孔蛋白四重突变体ML705在Middlebrook 7H9培养基中的生长远比野生型耻垢分枝杆菌的生长慢得多,并且显著慢于孔蛋白三重突变体ML16的生长(图24)。加入2%乙酰胺以诱导L5位点上的MspA基因单体的表达和质粒pMN016上的MspA的表达使生长速率恢复至野生型水平(图24)。ML705在板上和在液体培养基中的生长都比所述三重突变体的生长慢,表明ML705在外膜中具有比Msp三重突变体ML16更少的孔蛋白。这一假定在Western印迹中得到验证(图25)。MspA单体的量少于野生型(wt)耻垢分枝杆菌的MspA单体量的5%,并且比三重突变体的MspA单体量少50%。图25还显示当加入2%乙酰胺时,我们可将MspA诱导至高达野生型的25%。
上述实验显示已构建了Msp四重突变体(Ml705),其可在乙酰胺存在的情况下生长以临时产生野生型MspA单体。然后用含有野生型或突变的MspA单体、或者野生型或突变的单链Msp孔蛋白的表达盒的质粒转化ML705菌株。可通过洗掉乙酰胺和将细胞转移至无乙酰胺的培养基来关闭野生型MspA单体的产生。这引起野生型或突变的MspA单体的产生或者更少污染有野生型MspA的野生型或突变的单链Msp孔蛋白的产生。因此,ML705适合用于产生野生型和突变的MspA孔蛋白以用于任何目的。
实施例12:单链MspA孔蛋白二聚体的构建
单链DNA不是旋转对称的(rotationally symmetric)。因此,为了测序目的具有不对称的孔是比较有利的。为了组合MspA孔蛋白的优良测序能力与增强的使前厅和缢缩区性质适应DNA测序的能力,将构建单链MspA纳米孔。将MspA链末端在MspA孔蛋白二聚体中连接在一起(图26A),其可通过短肽连接体连接。为了测试该想法,将MspA基因单体与MspB基因单体融合在一起,其编码与野生型MspA单体相比较仅有2个改变(A138P,E139A)的蛋白质(Stahl等人,Mol.Microbiol.40:451(2001))。将通常用于连接蛋白质的(GGGGS)3(SEQ ID NO:3)肽(Huston等人,Proc.Natl.Acad.Sci.USA 85:5879(1988))用于连接MspA单体的C末端与MspB单体的缺乏信号肽的N末端(图26B)。将所得的MspA-MspB孔蛋白二聚体置于质粒pML870中组成型psmyc启动子的控制之下,然后将其在耻垢分枝杆菌ML16中表达。使用标准热提取方法纯化蛋白质。虽然单链MspA孔蛋白二聚体的表达水平比野生型MspA孔蛋白的表达水平低(图26C),但两种孔蛋白的通道活性相似(图26D)。电流记录的分析显示由MspA二聚体形成的孔的单通道电导为2.6nS。该结果显示连接体区段未削弱Msp孔的折叠或功能。
实施例13:单链MspA孔蛋白的构建
为了组合MspA的优良测序能力与增加的使前厅和缢缩区性质适应DNA测序的能力,将构建允许前厅和缢缩区的最佳性质用于DNA测序的单链MspA孔蛋白八聚体。将MspA链末端在MspA孔蛋白中连接在一起,通过短肽连接体连接。使用(GGGGS)3(SEQ ID NO:3)肽将前面的MspA单体的羧基末端连接至后面的MspA单体的缺乏信号肽的氨基末端。
为了产生含有MspA孔蛋白序列的载体,用唯一的限制性位点侧翼连接每一个MspA单体序列,这样能够突变任何单个单体。用PacI和HindIII限制性位点侧翼连接整个MspA孔蛋白序列。MspA单体序列之间的限制性位点包括:BamHI、ClaI、EcoRV、HpaI、KpnI、MluI、NdeI、NheI、PstI、ScaI、SpeI、XbaI、NotI和SphI(图31)。为了产生MspA孔蛋白序列,利用唯一的限制性位点分步装配每一个MspA序列以形成二聚体、四聚体和八聚体单链MspA。为了在产生单链MspA多聚体中避免重组的问题,使用不同的密码子用法合成7个MspA基因(SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQID NO:24,SEQ ID NO:25,SEQ ID NO:26,SEQ ID NO:27),即所述基因编码完全相同的氨基酸序列,然而DNA序列与原始MspA基因核苷酸序列(SEQ ID NO:20)相比发生了改变。为了产生MspA孔蛋白序列,第一Msp单体必须包含图18中所示的前导序列(例如,SEQID NO:28的氨基酸1至27))。第一Msp单体序列后的7个Msp单体序列中的每一个序列可包含SEQ ID NO:1或选自表7中所列突变的SEQ ID NO:1突变。表达载体pML2604是含有克隆入PacI和HindIII限制性位点的MspA孔蛋白序列的亲本载体。将pML2604转化入四重孔蛋白突变体,通过非变性和变性蛋白的Western印迹检查MspA孔蛋白的表达水平以及寡聚状态。通过脂双层实验检查MspA孔蛋白的通道活性。
表7:MspA突变体
本发明具体涉及以下实施方式:
1.包括对具有界定通道的前厅和缢缩区的耻垢分枝杆菌孔蛋白(Msp)施加电场的方法,其中Msp孔蛋白位于第一导电液体介质与第二导电液体介质之间。
2.实施方式1的方法,其中所述Msp孔蛋白选自野生型MspA孔蛋白、突变MspA孔蛋白、野生型MspA旁系同源物或同系物孔蛋白和突变MspA旁系同源物或同系物孔蛋白。
3.实施方式1或实施方式2的方法,其中所述Msp孔蛋白还包括分子发动机,其中所述分子发动机能够以这样的平均转位速度将分析物移入或穿过通道,所述平均转位速度小于分析物在分子发动机不存在的情况下通过电泳转位入或穿过通道时的平均转位速度。
4.实施方式1至3之一中的方法,其中至少一种导电液体介质包含分析物。
5.实施方式3或实施方式4的方法,其还包括在方法中检测分析物,所述方法包括当分析物与通道相互作用时测量离子电流以提供电流模式,其中电流模式中阻塞的出现标示着分析物的存在。
6.实施方式3至5之一中的方法,其中施加电场足以引起分析物穿过电泳转移通过通道。
7.实施方式3至6之一中的方法,其中所述Msp孔蛋白是突变MspA或者突变MspA旁系同源物或同系物孔蛋白,并且分析物穿过通道的平均转位速度小于分析物穿过野生型MspA或者野生型MspA旁系同源物或同系物孔蛋白的通道的平均转位速度。
8.实施方式3至6之一中的方法,其中所述Msp孔蛋白是突变MspA或者突变MspA旁系同源物或同系物孔蛋白,并且分析物穿过通道的平均转位速度大于分析物穿过野生型MspA或者野生型MspA旁系同源物或同系物孔蛋白的通道的平均转位速度。
9.实施方式3至8之一中的方法,其中分析物穿过通道的平均转位速度小于0.5nm/μs。
10.实施方式3至9之一中的方法,其还包括鉴定分析物。
11.实施方式10的方法,其中鉴定分析物包括将电流模式与在相同的条件下使用已知的分析物获得的已知电流模式相比较。
12.实施方式3至11之一中的方法,其中分析物是核苷酸、核酸、氨基酸、肽、蛋白质、聚合物、药物、离子、污染物、纳米级物体或生物战剂。
13.实施方式3至12之一中的方法,其中分析物是聚合物。
14.实施方式13的方法,其中聚合物是蛋白质、肽或核酸。
15.实施方式14的方法,其中聚合物是核酸。
16.实施方式15的方法,其中核酸穿过通道的平均转位速度小于1个核苷酸/μs。
17.实施方式15或实施方式16的方法,其中核酸是ssDNA、dsDNA、RNA或其组合。
18.实施方式13至17之一中的方法,其还包括区分聚合物内的至少第一单元与聚合物内的至少第二单元,所述区分包括测量当第一和第二单元分别地转位通过通道时产生的离子电流,以分别产生第一和第二电流模式,其中第一和第二电流模式彼此不同。
19.实施方式13至18之一中的方法,其还包括测定聚合物的序列。
20.实施方式19的方法,其中测序包括当聚合物的每一个单元分别地转位通过通道时测量离子电流或光信号,以提供与每一个单元关联的电流模式,和将每一个电流模式与在相同条件下获得的已知单元的电流模式相比较,以便测定聚合物的序列。
21.实施方式3至20之一中的方法,其还包括测定分析物的浓度、大小、分子量、形状或取向或其任何组合。
22.实施方式1至21之一中的方法,其中至少一种导电液体介质包含多种分析物。
23.实施方式1至22之一中的方法,其中所述Msp孔蛋白被进一步确定为突变MspA孔蛋白。
24.实施方式23的方法,其中所述突变MspA孔蛋白包包含:
界定通道的前厅和缢缩区,和
至少第一突变MspA单体,其包含位置93上的突变和位置90、位置91上的突变或位置90及91上的突变。
25.实施方式23或实施方式24的方法,其中突变MspA孔蛋白的缢缩区的直径小于野生型MspA孔蛋白的缢缩区的直径。
26.实施方式23至25之一中的方法,其中所述突变MspA孔蛋白在前厅或缢缩区中包含突变,所述突变允许分析物通过电泳转位通过突变体的通道的平均转位速度小于分析物通过电泳转位通过野生型MspA孔蛋白的通道的平均转位速度。
27.实施方式24至26之一中的方法,其中所述第一突变MspA单体还在下列氨基酸位置:88、105、108、118、134或139的任何位置上包含一个或多个突变。
28.实施方式23至27之一中的方法,其中所述突变MspA孔蛋白包含中性缢缩区。
29.实施方式23至28之一中的方法,其中通过突变MspA孔蛋白的通道的电导高于通过其相应的野生型MspA孔蛋白的通道的电导。
30.实施方式23的方法,其中所述突变MspA孔蛋白包含
具有约2至约6nm的长度和约2至约6nm的直径的前厅,和
具有约0.3至约3nm的长度和约0.3至约3nm的直径的缢缩区,
其中所述前厅和缢缩区一起界定了通道,和
还包含至少第一突变MspA旁系同源物或同系物单体。
31.实施方式30的方法,其中突变MspA孔蛋白的缢缩区的直径小于其相应的野生型MspA孔蛋白的缢缩区的直径。
32.实施方式30或实施方式31的方法,其中所述突变MspA孔蛋白在前厅或缢缩区包含突变,所述突变允许分析物通过电泳转位通过突变体的通道的平均转位速度小于分析物通过电泳转位通过其相应的野生型MspA孔蛋白的通道的平均转位速度。
33.实施方式30至32之一中的方法,其中通过突变MspA孔蛋白的通道的电导高于通过其相应的野生型MspA孔蛋白的通道的电导。
34.实施方式1、3至6或9至22之一中的方法,其中所述Msp孔蛋白被进一步确定为这样的Msp孔蛋白,其包含
具有约2至约6nm的长度和约2至约6nm的直径的前厅,和
具有约0.3至约3nm的长度和约0.3至约3nm的直径的缢缩区,
其中所述前厅和缢缩区一起界定了通道。
35.实施方式1、3至6或9至22之一中的方法,其中所述Msp孔蛋白由编码单链Msp孔蛋白的核酸序列编码,其中所述核酸序列包含:
(a)第一和第二核苷酸序列,其中所述第一核苷酸序列编码第一Msp单体序列并且第二核苷酸序列编码第二Msp单体序列;和
(b)编码氨基酸连接体序列的第三核苷酸序列。
36.实施方式35的方法,其中所述第一和第二Msp单体序列独立地选自野生型MspA单体、野生型MspB单体、野生型MspC单体、野生型MspD单体和其突变体。
37.实施方式35的方法,其中所述第一Msp单体序列包含野生型MspA单体或其突变体。
38.实施方式37的方法,其中所述第一Msp单体序列包含突变MspA单体。
39.实施方式1、3至6或9至22之一中的方法,其中所述Msp孔蛋白由编码单链Msp孔蛋白的核酸序列编码,其中所述核酸序列包含:
(a)第1、第2、第3、第4、第5、第6、第7和第8核苷酸序列,其中所述第1、第2、第3、第4、第5、第6、第7和第8核苷酸序列分别编码第1、第2、第3、第4、第5、第6、第7和第8Msp单体序列;和
(b)编码氨基酸连接体序列的第9核苷酸序列。
40.实施方式39的方法,其中每一个Msp单体包含野生型MspA单体或其突变体。
41.实施方式39的方法,其中至少一个Msp单体包含野生型MspA单体或其突变体。
42.实施方式35至41之一中的方法,其中所述Msp单体是野生型MspA旁系同源物或同系物。
43.实施方式42的方法,其中所述野生型MspA旁系同源物或同系物选自MspA/Msmeg0965、MspB/Msmeg0520、MspC/Msmeg5483、MspD/Msmeg6057、MppA、PorM1、PorM2、PorM1、Mmcs4296、Mmcs4297、Mmcs3857、Mmcs4382、Mmcs4383、Mjls3843、Mjls3857、Mjls3931Mjls4674、Mjls4675、Mjls4677、Map3123c、Mav3943、Mvan1836、Mvan4117、Mvan4839、Mvan4840、Mvan5016、Mvan5017、Mvan5768、MUL_2391、Mflv1734、Mflv1735、Mflv2295、Mflv1891、MCH4691c、MCH4689c、MCH4690c、MAB1080、MAB1081、MAB2800、RHA1ro08561、RHA1ro04074和RHA1ro03127。
44.改变通过耻垢分枝杆菌孔蛋白(Msp)的通道的电导的方法,包括在野生型Msp孔蛋白的前厅或缢缩区中除去、添加或置换至少一个氨基酸。
45.包括具有界定通道的前厅和缢缩区的耻垢分枝杆菌孔蛋白(Msp)的系统,其中所述通道位于第一液体介质与第二液体介质之间,其中至少一种液体介质包含分析物,并且其中所述系统对于检测分析物的性质是有效的。
46.实施方式45的系统,其中所述系统对于将分析物转位穿过通道是有效的。
47.实施方式45的系统,其中所述系统对于检测分析物的性质是有效的,包括将Msp孔蛋白经受电场以便分析物与Msp孔蛋白相互作用。
48.实施方式45至47之一的方法,其中所述系统对于检测分析物的性质是有效的,包括将Msp孔蛋白经受电场以便分析物通过电泳转位通过Msp孔蛋白的通道。
49.实施方式45至48之一中的系统,其中所述性质是分析物的电性质、化学性质或物理性质。
50.实施方式45至49之一中的系统,其中所述Msp孔蛋白包含在脂双层中。
51.实施方式45至50之一中的系统,其还被定义为包含多个Msp孔蛋白。
52.实施方式45至51之一中的系统,其中所述Msp孔蛋白选自野生型MspA孔蛋白、突变MspA孔蛋白、野生型MspA旁系同源物或同系物孔蛋白、或者突变MspA旁系同源物或同系物孔蛋白。
53.实施方式45至52之一中的系统,其中所述Msp孔蛋白被进一步确定为突变MspA孔蛋白。
54.实施方式53的系统,其中所述突变MspA孔蛋白包含
界定通道的前厅和缢缩区,和
至少第一突变MspA单体,其包含位置93上的突变和位置90、位置91上的突变或位置90及91上的突变。
55.实施方式53的系统,其中所述突变MspA孔蛋白包含
具有约2至约6nm的长度和约2至约6nm的直径的前厅,和
具有约0.3至约3nm的长度和约0.3至约3nm的直径的缢缩区,
其中所述前厅和缢缩区一起界定了通道,和
还包含至少第一突变MspA旁系同源物或同系物单体。
56.实施方式45至51之一中的系统,其中所述Msp孔蛋白还被确定为这样的Msp孔蛋白,其包含
具有约2至约6nm的长度和约2至约6nm的直径的前厅,和
具有约0.3至约3nm的长度和约0.3至约3nm的直径的缢缩区,
其中所述前厅和缢缩区一起界定了通道。
57.实施方式52的系统,其中所述Msp是野生型MspA旁系同源物或同系物孔蛋白。
58.实施方式57的系统,其中所述野生型MspA旁系同源物或同系物孔蛋白选自MspA/Msmeg0965、MspB/Msmeg0520、MspC/Msmeg5483、MspD/Msmeg6057、MppA、PorM1、PorM2、PorM1、Mmcs4296、Mmcs4297、Mmcs3857、Mmcs4382、Mmcs4383、Mjls3843、Mjls3857、Mjls3931、Mjls4674、Mjls4675、Mjls4677、Map3123c、Mav3943、Mvan1836、Mvan4117、Mvan4839、Mvan4840、Mvan5016、Mvan5017、Mvan5768、MUL_2391、Mflv1734、Mflv1735、Mflv2295、Mflv1891、MCH4691c、MCH4689c、MCH4690c、MAB1080、MAB1081、MAB2800、RHA1ro08561、RHA1ro04074和RHA1ro03127。
59.实施方式45至51之一中的系统,其中所述Msp孔蛋白由编码单链Msp孔蛋白的核酸序列编码,其中所述核酸序列包含:
(a)第一和第二核苷酸序列,其中所述第一核苷酸序列编码第一Msp单体序列并且第二核苷酸序列编码第二Msp单体序列;和
(b)编码氨基酸连接体序列的第三核苷酸序列。
60.实施方式45至51之一中的方法,其中所述Msp孔蛋白由编码单链Msp孔蛋白的核酸序列编码,其中所述核酸序列包含:
(a)第1、第2、第3、第4、第5、第6、第7和第8核苷酸序列,其中所述第1、第2、第3、第4、第5、第6、第7和第8核苷酸序列分别编码第1、第2、第3、第4、第5、第6、第7和第8Msp单体序列;和
(b)编码氨基酸连接体序列的第9核苷酸序列。
61.实施方式45至60之一中的系统,其中所述Msp孔蛋白还包括分子发动机,其中所述分子发动机能够以这样的平均转位速度将分析物移入或穿过通道,所述平均转位速度小于分析物在分子发动机不存在的情况下转位入或穿过通道的平均转位速度。
62.实施方式45至61之一中的系统,其还包含膜片钳放大器。
63.实施方式45至62之一中的系统,其还包含数据获取装置。
64.实施方式45至63之一中的系统,其还包含与第一液体介质、第二液体介质或两者连通的一个或多个温度调节装置。
65.包含具有界定通道的前厅和缢缩区的耻垢分枝杆菌孔蛋白(Msp)的系统,其中所述通道位于第一液体介质与第二液体介质之间的脂双层中,并且其中第一和第二液体介质之间的液体连通的唯一的点存在于通道中。
66.突变的耻垢分枝杆菌孔蛋白A(MspA)孔蛋白,其包含
界定通道的前厅和缢缩区,和
至少第一突变MspA单体,其包含位置93上的突变和位置90、位置91上的突变或位置90及91上的突变。
67.实施方式66的突变MspA孔蛋白,其包含位置93和90上的突变。
68.实施方式66的突变MspA孔蛋白,其包含位置93和91上的突变。
69.实施方式66的突变MspA孔蛋白,其包含位置93、91和90上的突变。
70.实施方式66的突变MspA孔蛋白,其中突变MspA孔蛋白的缢缩区的直径小于野生型MspA孔蛋白的缢缩区的直径。
71.实施方式66至70之一中的突变MspA孔蛋白,其中所述MspA孔蛋白在前厅或缢缩区中具有突变,所述突变允许分析物以这样的平均转位速度转位穿过突变体的通道,所述平均转位速度小于分析物转位穿过野生型Msp孔蛋白的通道的平均转位速度。
72.实施方式66至70之一中的突变MspA孔蛋白,其中所述MspA孔蛋白在前厅或缢缩区中具有突变,所述突变允许分析物以这样的平均转位速度通过电泳转位通过突变体的通道,所述平均转位速度小于分析物通过电泳转位通过野生型Msp孔蛋白的通道的平均转位速度。
73.实施方式66至72之一中的突变MspA孔蛋白,其中所述MspA孔蛋白在前厅或缢缩区具有突变,所述突变允许分析物以小于0.5nm/μs的平均转位速度转位通过通道。
74.实施方式71至73之一中的突变MspA孔蛋白,其中分析物选自核苷酸、核酸、氨基酸、肽、蛋白质、聚合物、药物、离子、生物战剂、污染物、纳米级物体或其组合或聚簇。
75.实施方式74的突变MspA孔蛋白,其中分析物被进一步确定为核酸。
76.实施方式75的突变MspA孔蛋白,其中核酸以小于1个核苷酸/μs的平均转位速度转位通过通道。
77.实施方式75或实施方式76的突变MspA孔蛋白,其中核酸被进一步确定为ssDNA、dsDNA、RNA或其组合。
78.实施方式66至77之一中的突变MspA孔蛋白,其中所述突变MspA孔蛋白包含为相同或不同的2至15个Msp单体。
79.实施方式78的突变MspA孔蛋白,其中所述突变MspA孔蛋白包含为相同或不同的7至9个Msp单体。
80.实施方式66至79之一中的突变MspA孔蛋白,其还包含选自野生型MspA单体、第二突变MspA单体、野生型MspA旁系同源物或同系物单体以及突变MspA旁系同源物或同系物单体中的至少第二单体,其中所述第二突变MspA单体可以与第一突变MspA单体相同或不同。
81.实施方式80的突变MspA孔蛋白,其中所述第二单体是野生型MspA旁系同源物或同系物单体。
82.实施方式81的突变MspA孔蛋白,其中野生型MspA旁系同源物或同系物单体是野生型MspB单体。
83.实施方式66至82之一中的突变MspA孔蛋白,其中所述第一突变MspA单体还在下列氨基酸位置:88、105、108、118、134或139的任何位置上包含一个或多个突变。
84.实施方式66至82之一中的突变MspA孔蛋白,其中所述第一突变MspA单体包含一个或多个下列突变:L88W、D90K/N/Q/R、D91N/Q、D93N、I105W、N108W、D118R、D134R或E139K。
85.实施方式66至82之一中的突变MspA孔蛋白,其中所述第一突变MspA单体包含下列突变:D90N/D91N/D93N。
86.实施方式66至82之一中的突变MspA孔蛋白,其中所述第一突变MspA单体包含下列突变:D90N/D91N/D93N/D118R/D134R/E139K。
87.实施方式66至82之一中的突变MspA孔蛋白,其中所述第一突变MspA单体包含下列突变:D90Q/D91Q/D93N。
88.实施方式66至82之一中的突变MspA孔蛋白,其中所述第一突变MspA单体包含下列突变:D90Q/D91Q/D93N/D118R/D134R/E139K。
89.实施方式66至82之一中的突变MspA孔蛋白,其中所述第一突变MspA单体包含下列突变:D90(K,R)/D91N/D93N。
90.实施方式66至82之一中的突变MspA孔蛋白,其中所述第一突变MspA单体包含下列突变:(L88,I105)W/D91Q/D93N。
91.实施方式66至82之一中的突变MspA孔蛋白,其中所述第一突变MspA单体包含下列突变:I105W/N108W。
92.实施方式66至91之一中的突变MspA孔蛋白,其还包含一个或多个周质环缺失。
93.实施方式66至92之一中的突变MspA孔蛋白,其通过通道的电导高于通过其相应野生型MspA孔蛋白的通道的电导。
94.实施方式66至93之一中的突变MspA孔蛋白,其还包括分子发动机,其中所述分子发动机能够以这样的平均转位速度将分析物移入或穿过通道,所述平均转位速度小于分析物在分子发动机不存在的情况下转位入或穿过通道的平均转位速度。
95.实施方式66至94之一中的突变MspA孔蛋白,其还包括分子发动机,其中所述分子发动机能够以这样的平均转位速度将分析物移入或穿过通道,所述平均转位速度小于分析物在分子发动机不存在的情况下通过电泳转位入或穿过通道的平均转位速度。
96.实施方式94或实施方式95的突变MspA孔蛋白,其中所述分子发动机是酶。
97.实施方式96的突变MspA孔蛋白,其中所述酶是聚合酶、外切核酸酶或Klenow片段。
98.一种突变的耻垢分枝杆菌孔蛋白A(MspA)孔蛋白,其包含
具有约2至约6nm的长度和约2至约6nm的直径的前厅,和
具有约0.3至约3nm的长度和约0.3至约3nm的直径的缢缩区,
其中所述前厅和缢缩区一起界定了通道,和
还包含至少第一突变MspA旁系同源物或同系物单体。
99.实施方式98的突变MspA孔蛋白,其中所述突变MspA孔蛋白的缢缩区的直径小于其相应野生型MspA孔蛋白的缢缩区的直径。
100.实施方式98或实施方式99的突变MspA孔蛋白,其在前厅或缢缩区具有突变,所述突变允许分析物以这样的平均转位速度穿过突变体的通道,所述平均转位速度小于分析物转位通过其相应野生型MspA孔蛋白的通道的平均转位速度。
101.实施方式98至100之一中的突变MspA孔蛋白,其在前厅或缢缩区中具有突变,所述突变允许分析物以这样的平均转位速度电泳转位通过突变体的通道,所述平均转位速度小于分析物通过电泳转位通过其相应野生型MspA孔蛋白的通道的平均转位速度。
102.实施方式98至101之一中的突变MspA孔蛋白,其在前厅或缢缩区中具有允许分析物以小于0.5nm/μs的平均转位速度穿过通道的突变。
103.实施方式101至102之一中的突变MspA孔蛋白,其中所述分析物被进一步确定为核苷酸、核酸、氨基酸、肽、蛋白质、聚合物、药物、离子、生物战剂、污染物、纳米级物体或其组合或聚簇。
104.实施方式103的突变MspA孔蛋白,其中所述分析物被进一步确定为核酸。
105.实施方式104的突变MspA孔蛋白,其中所述核酸以小于1个核苷酸/μs的平均转位速度转位通过通道。
106.实施方式104或实施方式105的突变MspA孔蛋白,其中所述核酸被进一步确定为ssDNA、dsDNA、RNA或其组合。
107.实施方式98至106之一中的突变MspA孔蛋白,其中所述突变MspA孔蛋白还包含至少一个Msp单体。
108.实施方式107的突变MspA孔蛋白,其中所述Msp单体选自野生型MspA单体、突变MspA单体、野生型MspA旁系同源物或同系物或者第二突变MspA旁系同源物或同系物单体。
109.实施方式98至108之一中的突变MspA孔蛋白,其还包含一个或多个周质环缺失。
110.实施方式98至109之一中的突变MspA孔蛋白,其在前厅或缢缩区中包含突变。
111.实施方式98至110之一中的突变MspA孔蛋白,其通过通道的电导高于通过其相应野生型MspA孔蛋白的通道的电导。
112.实施方式98至111之一中的突变MspA孔蛋白,其还包含分子发动机,其中所述分子发动机能够以这样的平均转位速度将分析物移入或穿过通道,所述平均转位速度小于分析物在分子发动机不存在的情况下转位通过或穿过通道时的平均转位速度。
113.实施方式98至112之一中的突变MspA孔蛋白,其还包含分子发动机,其中所述分子发动机能够以这样的平均转位速度将分析物移入或穿过通道,所述平均转位速度小于分析物在分子发动机不存在的情况下通过电泳转位入或穿过通道的平均转位速度。
114.实施方式112或实施方式113的突变MspA孔蛋白,其中所述分子发动机是酶。
115.实施方式114的突变MspA孔蛋白,其中所述酶是聚合酶、外切核酸酶或Klenow片段。
116.一种突变的耻垢分枝杆菌孔蛋白A(MspA)旁系同源物或同系物,其包含
具有约2至约6nm的长度和约2至约6nm的直径的前厅,和
具有约0.3至约3nm的长度和约0.3至约3nm的直径的缢缩区,
其中所述前厅和缢缩区一起界定了通道。
117.实施方式116的突变MspA旁系同源物或同系物,其还包含至少第一突变MspA旁系同源物或同系物单体。
118.制备包含至少一个突变MspA单体的突变耻垢分枝杆菌孔蛋白A(MspA)孔蛋白的方法,所述方法包括在位置93和位置90、位置91、或位置90及91上修饰野生型MspA单体。
119.制备具有界定通道的前厅和缢缩区的突变耻垢分枝杆菌孔蛋白A(MspA)孔蛋白的方法,包括在野生型MspA旁系同源物或同系物单体的前厅或缢缩区中缺失、添加或置换任何氨基酸,以便所得的突变MspA孔蛋白能够在施加电场后使分析物转位通过通道。
120.一种方法,包括在不应用电场的情况下使分析物转位通过耻垢分枝杆菌孔蛋白(Msp)孔蛋白的通道。
121.实施方式120的方法,其中所述Msp孔蛋白还包括分子发动机。
122.实施方式120或实施方式121的方法,其中所述Msp孔蛋白选自野生型MspA孔蛋白、突变MspA孔蛋白、野生型MspA旁系同源物或同系物孔蛋白以及突变MspA旁系同源物或同系物孔蛋白。
123.实施方式120或实施方式121的方法,其中所述Msp孔蛋白由编码单链Msp孔蛋白的核酸序列编码,其中所述核酸序列包含:
(a)第一和第二核苷酸序列,其中所述第一核苷酸序列编码第一Msp单体序列并且第二核苷酸序列编码第二Msp单体序列;和
(b)编码氨基酸连接体序列的第三核苷酸序列。
124.实施方式120或实施方式121的方法,其中所述Msp孔蛋白由编码单链Msp孔蛋白的核酸序列编码,其中所述核酸序列包含:
(a)第1、第2、第3、第4、第5、第6、第7和第8核苷酸序列,其中所述第1、第2、第3、第4、第5、第6、第7和第8核苷酸序列分别编码第1、第2、第3、第4、第5、第6、第7和第8Msp单体序列;和
(b)编码氨基酸连接体序列的第9核苷酸序列。
125.实施方式120至124之一中的方法,其中所述分析物包含光学珠粒或磁性珠粒。
126.编码单链Msp孔蛋白的核酸序列,其中所述核酸序列包含:
(a)第一和第二核苷酸序列,其中所述第一核苷酸序列编码第一Msp单体序列并且第二核苷酸序列编码第二Msp单体序列;和
(b)编码氨基酸连接体序列的第三核苷酸序列。
127.实施方式126的核酸序列,其中所述第一和第二Msp单体序列独立地选自野生型MspA单体、突变MspA单体、野生型MspA旁系同源物或同系物单体以及突变MspA旁系同源物或同系物单体。
128.实施方式126或实施方式127的核酸序列,其中所述第一Msp单体序列包含野生型MspA单体或其突变体。
129.实施方式128的核酸序列,其中所述Msp单体序列包含突变MspA单体。
130.实施方式128的核酸序列,其中所述第一Msp单体序列包含一个或多个选自下述的突变:氨基酸138上的A至P置换、氨基酸139上的E至A或K置换、氨基酸90上的D至K或R或Q置换、氨基酸91上的D至N或Q置换、氨基酸93上的D至N置换、氨基酸88上的L至W置换、氨基酸105上的I至W置换、氨基酸108上的N至W置换、氨基酸118上的D至R置换和氨基酸134上的D至R置换。
131.实施方式130的核酸序列,其中所述突变MspA单体包含氨基酸138上的A至P置换、氨基酸139上的E至A置换或其组合。
132.实施方式130的核酸序列,其中所述突变MspA单体包含氨基酸90上的D至K或R置换、氨基酸91上的D至N置换、氨基酸93上的D至N置换或其任何组合。
133.实施方式130的核酸序列,其中所述突变MspA单体包含氨基酸90上的D至Q置换、氨基酸91上的D至Q置换、氨基酸93上的D至N置换或其任何组合。
134.实施方式130的核酸序列,其中所述突变MspA单体包含氨基酸88上的L至W置换、氨基酸105上的I至W置换、氨基酸91上的D至Q置换、氨基酸93上的D至N置换或其任何组合。
135.实施方式130的核酸序列,其中所述突变MspA单体包含氨基酸105上的I至W置换、氨基酸108上的N至W置换或其组合。
136.实施方式130的核酸序列,其中所述突变MspA单体包含氨基酸118上的D至R置换、氨基酸139上的E至K置换、氨基酸134上的D至R置换或其任何组合。
137.实施方式126的核酸序列,其中所述第一MspA单体序列包含SEQ ID NO:1。
138.实施方式126的核酸序列,其中所述第二MspA单体序列包含野生型MspA旁系同源物或其突变体,其中所述旁系同源物或其突变体是野生型MspB单体或其突变体。
139.实施方式138的核酸序列,其中所述第二MspA单体序列包含SEQ ID NO:2。
140.实施方式138的核酸序列,其中所述第二MspA单体序列包含突变MspB单体。
141.实施方式126的核酸序列,其中所述第一MspA单体序列包含野生型MspA单体或其突变体,并且所述第二Msp单体包含野生型MspB单体或其突变体。
142.实施方式126的核酸序列,其中所述第一MspA单体序列包含SEQ ID NO:1并且所述第二Msp单体包含SEQ ID NO:2。
143.实施方式126至142中任一项的核酸序列,其中所述氨基酸连接体序列包含10至20个氨基酸。
144.实施方式143的核酸序列,其中所述氨基酸连接体序列包含15个氨基酸。
145.实施方式144的核酸序列,其中所述氨基酸连接体序列包含(GGGGS)3(SEQ ID NO:3)肽序列。
146.由实施方式126至145之一中的核酸序列编码的多肽。
147.包含实施方式126至145之一中的核酸序列的载体。
148.实施方式147的载体,其中所述载体还包含启动子序列。
149.实施方式148的载体,其中所述启动子包括组成型启动子。
150.实施方式149的载体,其中所述组成型启动子包括psmyc启动子。
151.实施方式148的载体,其中所述启动子包括诱导型启动子。
152.实施方式151的载体,其中所述诱导型启动子包括乙酰胺诱导型启动子。
153.编码单链Msp孔蛋白的核酸序列,其中所述核酸序列包含:
(a)第1、第2、第3、第4、第5、第6、第7和第8核苷酸序列,其中所述第1、第2、第3、第4、第5、第6、第7和第8核苷酸序列分别编码第1、第2、第3、第4、第5、第6、第7和第8Msp单体序列;和
(b)编码氨基酸连接体序列的第9核苷酸序列。
154.实施方式153的核酸序列,其中所述第一和第二Msp单体序列独立地选自野生型Msp单体、突变Msp单体、野生型MspA旁系同源物或同系物单体以及突变MspA旁系同源物或同系物单体。
155.实施方式153的核酸序列,其中每一个Msp单体包含野生型MspA单体或其突变体。
156.实施方式153的核酸序列,其中至少一个Msp单体包括野生型MspA单体或其突变体。
157.实施方式155或实施方式156的核酸序列,其中至少一个Msp单体包含突变MspA单体。
158.实施方式157的核酸序列,其中所述突变Msp单体序列包含一个或多个选自如下的突变:氨基酸138上的A至P置换、氨基酸139上的E至A或K置换、氨基酸90上的D至K或R或Q置换、氨基酸91上的D至N或Q置换、氨基酸93上的D至N置换、氨基酸88上的L至W置换、氨基酸105上的I至W置换、氨基酸108上的N至W置换、氨基酸118上的D至R置换和氨基酸134上的D至R置换。
159.实施方式158的核酸序列,其中所述突变MspA单体包含氨基酸138上的A至P置换、氨基酸139上的E至A置换或其组合。
160.实施方式158的核酸序列,其中所述突变MspA单体包含氨基酸90上的D至K或R置换、氨基酸91上的D至N置换、氨基酸93上的D至N置换或其任何组合。
161.实施方式158的核酸序列,其中所述突变MspA单体包含氨基酸90上的D至Q置换、氨基酸91上的D至Q置换、氨基酸93上的D至N置换或其任何组合。
162.实施方式158的核酸序列,其中所述突变MspA单体包含氨基酸88上的L至W置换、氨基酸105上的I至W置换、氨基酸91上的D至Q置换、氨基酸93上的D至N置换或其任何组合。
163.实施方式158的核酸序列,其中所述突变MspA单体包含氨基酸105上的I至W置换、氨基酸108上的N至W置换或其组合。
164.实施方式158的核酸序列,其中所述突变MspA单体包含氨基酸118上的D至R置换、氨基酸139上的E至K置换、氨基酸134上的D至R置换或其任何组合。
165.实施方式153的核酸序列,其中每一个Msp单体序列包含SEQ ID NO:1。
166.实施方式153的核酸序列,其中至少一个Msp单体序列包含SEQ ID NO:1。
167.实施方式153的核酸序列,其中至少一个Msp单体序列包含野生型MspA旁系同源物或其突变体,其中所述MspA旁系同源物或其突变体是野生型MspB单体或其突变体。
168.实施方式166或实施方式167的核酸序列,其中至少一个Msp单体序列包含SEQ ID NO:2。
169.实施方式166至168之一中的核酸序列,其中至少一个Msp单体序列包含突变MspB单体。
170.实施方式153的核酸序列,其中至少一个Msp单体序列包含野生型MspA单体或其突变体,以及至少一个Msp单体序列包含野生型MspB单体或其突变体。
171.实施方式153的核酸序列,其中至少一个Msp单体序列包含SEQ ID NO:1,并且至少一个Msp单体序列包含SEQ ID NO:2。
172.实施方式153至171之一中的核酸序列,其中所述氨基酸连接体序列包含10至20个氨基酸。
173.实施方式172的核酸序列,其中所述氨基酸连接体序列包含15个氨基酸。
174.实施方式173的核酸序列,其中所述氨基酸连接体序列包含(GGGGS)3(SEQ ID NO:3)肽序列。
175.由实施方式66至115或153至174的一个中的核酸序列编码的多肽。
176.包含实施方式66至115或153至174的一个中的核酸序列的载体。
177.实施方式176的载体,其中所述载体还包含启动子序列。
178.实施方式177的载体,其中所述启动子包括组成型启动子。
179.实施方式178的载体,其中所述组成型启动子包括psmyc启动子。
180.实施方式179的载体,其中所述启动子包括诱导型启动子。
181.实施方式180的启动子,其中所述诱导型启动子包括乙酰胺诱导型启动子。
182.被实施方式176至181之一中的载体转染的培养细胞或其后代,其中所述细胞能够表达Msp孔蛋白或Msp孔蛋白单体.
183.包含实施方式176至181之一的载体的耻垢分枝杆菌菌株。
184.能够诱导型表达Msp单体的突变细菌菌株,所述细菌菌株包含:
(a)野生型MspA的缺失;
(b)野生型MspC的缺失;
(c)野生型MspD的缺失;和
(d)包含有效地连接Msp单体核酸序列的诱导型启动子的载体。
185.实施方式184的细菌菌株,其中所述细菌菌株包括耻垢分枝杆菌菌株ML16。
186.实施方式184的细菌菌株,其中所述Msp核酸编码野生型MspA单体或者野生型MspA旁系同源物或同系物单体。
187.实施方式184的细菌菌株,其中所述Msp核酸编码选自下组的Msp单体:野生型MspA单体、野生型MspC单体和野生型MspD单体。
188.实施方式187的细菌菌株,其中所述Msp核酸编码野生型MspA单体。
189.实施方式184的细菌菌株,其中所述诱导型启动子包括乙酰胺诱导型启动子。
190.实施方式184的细菌菌株,其还包含野生型MspB的缺失。
191.实施方式190的细菌菌株,其还包含载体,所述载体包含有效地连接于编码Msp孔蛋白或单体的核酸序列的组成型启动子。
192.实施方式191的细菌菌株,其中所述Msp是野生型MspA孔蛋白或单体或者野生型MspA旁系同源物或同系物孔蛋白或单体。
193.实施方式191的细菌菌株,其中所述Msp孔蛋白或单体选自野生型MspA孔蛋白或单体、野生型MspB孔蛋白或单体、野生型MspC孔蛋白或单体以及野生型MspD孔蛋白或单体。
194.实施方式193的细菌菌株,其中所述Msp孔蛋白或单体是野生型MspA孔蛋白或单体。
195.实施方式190的细菌菌株,其还包含含有编码单链Msp孔蛋白的核酸的载体,其中所述核酸包含:
(a)第一和第二核苷酸序列,其中所述第一核苷酸序列编码第一Msp单体序列并且第二核苷酸序列编码第二Msp单体序列;和
(b)编码氨基酸连接体序列的第三核苷酸序列。
196.实施方式190的细菌菌株,其还包含含有编码单链Msp孔蛋白的核酸的载体,其中所述核酸包含:
(a)第1、第2、第3、第4、第5、第6、第7和第8核苷酸序列,其中所述第1、第2、第3、第4、第5、第6、第7和第8核苷酸序列分别编码第1、第2、第3、第4、第5、第6、第7和第8Msp单体序列;和
(b)编码氨基酸连接体序列的第9核苷酸序列。
197.产生单链Msp孔蛋白的方法,所述方法包括:
(a)用包含能够编码单链Msp孔蛋白的核酸序列的载体转化实施方式190的细菌菌株;和
(b)从细菌纯化单链Msp孔蛋白。
198.实施方式197的方法,其中所述载体包含编码单链Msp孔蛋白的核酸序列,其中所述核酸序列包含:
(a)第一和第二核苷酸序列,其中所述第一核苷酸序列编码第一Msp单体序列并且第二核苷酸序列编码第二Msp单体序列;和
(b)编码氨基酸连接体序列的第三核苷酸序列。
199.实施方式197的方法,其中所述载体包含编码单链Msp孔蛋白的核酸序列,其中所述核酸序列包含:
(a)第1、第2、第3、第4、第5、第6、第7和第8核苷酸序列,其中所述第1、第2、第3、第4、第5、第6、第7和第8核苷酸序列分别编码第1、第2、第3、第4、第5、第6、第7和第8Msp单体序列;和
(b)编码氨基酸连接体的第9核苷酸序列。
200.实施方式198或实施方式199的方法,其中所述Msp单体序列独立地选自野生型MspA单体、突变MspA单体、野生型MspA旁系同源物或同系物单体和突变MspA旁系同源物或同系物单体。
201.如实施方式198至200之一中的方法,其中所述Msp单体序列是野生型MspA单体。
*****************
虽然已在本文中举例说明和描述了示例性实施方案,但应理解可在本文中进行各种改变而不背离本文中描述的内容的精神和范围。

Claims (41)

1.耻垢分枝杆菌(Mycobacterium smegmatis)孔蛋白(Msp),其包含界定通道的前厅和缢缩区,其中所述Msp包含突变MspA,其中与野生型Msp的缢缩区相比,从所述Msp的缢缩区内除去了负电荷,并且其中所述Msp包含带正电荷的氨基酸取代野生型Msp的缢缩区内存在的带负电荷的氨基酸。
2.权利要求1的Msp,其中所述突变MspA包含位置90、91和93处的突变。
3.权利要求1的Msp,其中所述突变MspA包含位置90、91和93处的突变,其中位置90处的突变是D90N,位置91处的突变是D91N,并且位置93处的突变是D93N。
4.权利要求3的Msp,其中包含位置118处的突变,其中位置118处的突变是D118R。
5.权利要求4的Msp,其中包含位置139处的突变,其中位置139处的突变是E139K或E139R。
6.权利要求5的Msp,其中包含位置118、139和134处的突变,其中位置118处的突变是D118R,位置134处的突变是D134R,并且位置139处的突变是E139K。
7.权利要求3的Msp,其中突变MspA包含位置126处的突变,其中位置126处的突变是Q126R。
8.权利要求1的Msp,其中所述突变MspA包含位置88处的突变。
9.权利要求1的Msp,其中所述突变MspA包含位置90、91和93处的突变,其中位置90处的突变是D90Q,位置91处的突变是D91Q,并且位置93处的突变是D93N。
10.权利要求9的Msp,其中包含位置118、139和134处的突变,其中位置118处的突变是D118R,位置134处的突变是D134R,并且位置139处的突变是E139K。
11.权利要求1的Msp,其中所述突变MspA包含带正电荷的氨基酸取代野生型Msp的入口处存在的带负电荷的氨基酸。
12.耻垢分枝杆菌(Mycobacterium smegmatis)孔蛋白(Msp),其包含界定通道的前厅和缢缩区,其中所述Msp包含突变MspA,所述突变MspA包含位置90、91和93处的突变,其中位置90处的突变是D90N,位置91处的突变是D91N,并且位置93处的突变是D93N。
13.耻垢分枝杆菌(Mycobacterium smegmatis)孔蛋白(Msp),其包含界定通道的前厅和缢缩区,其中所述Msp包含突变MspA,所述突变MspA包含位置90、91和93处的突变,其中位置90处的突变是D90Q,位置91处的突变是D91Q,并且位置93处的突变是D93N。
14.权利要求13的Msp,其中包含位置118、139和134处的突变,其中位置118处的突变是D118R,位置134处的突变是D134R,并且位置139处的突变是E139K。
15.前述权利要求中任一项的Msp,其用于检测分析物的存在。
16.权利要求15的Msp,其中所述分析物是核酸。
17.权利要求16的Msp,其中所述核酸是DNA。
18.权利要求17的Msp,其中所述DNA是单链DNA。
19.权利要求18的Msp,其中所述单链DNA包含发夹。
20.权利要求1-14中任一项的Msp,其用于分析核酸。
21.权利要求20的Msp,其中所述核酸是DNA。
22.权利要求21的Msp,其中所述DNA是单链DNA。
23.权利要求22的Msp,其中所述单链DNA包含发夹。
24.在检测分析物存在的方法中使用的装置,其中包含权利要求1-14中任一项的Msp,其中所述Msp的通道位于第一导电性液体介质与第二导电性液体介质之间,其中至少一种导电性液体介质包含分析物,并且其中所述装置对于检测分析物是有效的。
25.权利要求24的装置,其中包含施加足以将分析物从第一导电性液体介质转位至第二导电性液体介质通过Msp进行液体连通的电场的设备。
26.权利要求25的装置,其中包含测定跨过Msp的电流的设备。
27.权利要求24-26中任一项的装置,其中包含将第一导电性液体介质接地和向第二导电性液体介质施加正电压的设备。
28.权利要求24-27中任一项的装置,其中所述分析物是聚合物。
29.权利要求28的装置,其中所述聚合物是核酸。
30.权利要求29的装置,其中所述核酸是DNA。
31.权利要求30的装置,其中所述DNA是单链DNA。
32.权利要求29的装置,其中所述核酸是RNA。
33.权利要求29-32中任一项的装置,其中所述装置用于核酸测序。
34.权利要求29-33中任一项的装置,其中所述装置还包含分子发动机,其中所述分子发动机能够以这样的平均转位速度将分析物移入或穿过通道,所述平均转位速度小于分析物在所述分子发动机不存在的情况下转位入或穿过通道的平均转位速度。
35.权利要求34的装置,其中所述分子发动机是解旋酶。
36.权利要求34的装置,其中所述分子发动机是聚合酶。
37.编码权利要求1-14中任一项的Msp的核酸。
38.一种载体,其中包含与权利要求37的核酸序列可操作性连接的启动子。
39.能够表达Msp的突变耻垢分枝杆菌(Mycobacteriumsmegmatis)细菌,所述细菌包含:
(a)野生型MspA的缺失;
(b)野生型MspC的缺失;
(c)野生型MspD的缺失;和
(d)权利要求38的载体。
40.权利要求39的突变耻垢分枝杆菌细菌,其中所述细菌是耻垢分枝杆菌ML16菌株。
41.从权利要求39或40的突变耻垢分枝杆菌细菌能够获得的耻垢分枝杆菌孔蛋白。
CN201510144374.5A 2008-09-22 2009-09-22 Msp纳米微孔和相关方法 Active CN104710519B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US9893808P 2008-09-22 2008-09-22
US61/098,938 2008-09-22
CN200980142855.5A CN102216783B (zh) 2008-09-22 2009-09-22 Msp纳米微孔和相关方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN200980142855.5A Division CN102216783B (zh) 2008-09-22 2009-09-22 Msp纳米微孔和相关方法

Publications (2)

Publication Number Publication Date
CN104710519A true CN104710519A (zh) 2015-06-17
CN104710519B CN104710519B (zh) 2021-05-28

Family

ID=42040208

Family Applications (2)

Application Number Title Priority Date Filing Date
CN200980142855.5A Active CN102216783B (zh) 2008-09-22 2009-09-22 Msp纳米微孔和相关方法
CN201510144374.5A Active CN104710519B (zh) 2008-09-22 2009-09-22 Msp纳米微孔和相关方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN200980142855.5A Active CN102216783B (zh) 2008-09-22 2009-09-22 Msp纳米微孔和相关方法

Country Status (10)

Country Link
US (9) US8673550B2 (zh)
EP (3) EP3029467B1 (zh)
CN (2) CN102216783B (zh)
CA (3) CA2774710C (zh)
DE (1) DE202009019021U1 (zh)
DK (1) DK2344891T3 (zh)
ES (2) ES2576114T3 (zh)
HK (1) HK1211310A1 (zh)
HU (1) HUE029215T2 (zh)
WO (1) WO2010034018A2 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105801676A (zh) * 2016-04-13 2016-07-27 东南大学 一种突变MspA蛋白单体及其表达基因和应用
WO2018137592A1 (zh) * 2017-01-24 2018-08-02 四川大学 跨膜核酸解旋纳米孔及其构建方法与应用
CN109890980A (zh) * 2016-07-12 2019-06-14 格罗宁根大学 基于FraC actinoporin的用于生物聚合物传感和测序的生物纳米孔

Families Citing this family (98)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0523282D0 (en) 2005-11-15 2005-12-21 Isis Innovation Methods using pores
EP2158476B8 (en) 2007-05-08 2019-10-09 Trustees of Boston University Chemical functionalization of solid-state nanopores and nanopore arrays and applications thereof
GB2453377A (en) 2007-10-05 2009-04-08 Isis Innovation Transmembrane protein pores and molecular adapters therefore.
CN103695530B (zh) 2008-07-07 2016-05-25 牛津纳米孔技术有限公司 酶-孔构建体
EP3029467B1 (en) 2008-09-22 2020-01-08 University of Washington Msp nanopores and related methods
GB0820927D0 (en) 2008-11-14 2008-12-24 Isis Innovation Method
WO2010086622A1 (en) 2009-01-30 2010-08-05 Oxford Nanopore Technologies Limited Adaptors for nucleic acid constructs in transmembrane sequencing
GB0905140D0 (en) 2009-03-25 2009-05-06 Isis Innovation Method
WO2010117470A2 (en) 2009-04-10 2010-10-14 Pacific Biosciences Of California, Inc. Nanopore sequencing devices and methods
AU2010301128B2 (en) 2009-09-30 2014-09-18 Quantapore, Inc. Ultrafast sequencing of biological polymers using a labeled nanopore
EP3933402A1 (en) 2010-02-23 2022-01-05 University of Washington Method of making unsupported artificial mycolic acid membranes
EP2673638B1 (en) * 2011-02-11 2019-10-30 Oxford Nanopore Technologies Limited Mutant pores
CA2837306C (en) 2011-05-27 2020-03-10 Oxford Nanopore Technologies Limited Determining the presence, absence or characteristics of an analyte coupled to a membrane
EP2724150A4 (en) * 2011-06-24 2014-12-03 Electronic Biosciences Inc METHODS FOR CHARACTERIZING A COMPONENT OF A DEVICE BASED ON A SIGNAL TO NOISE RATIO ON THE CONTRAST
WO2012178093A1 (en) 2011-06-24 2012-12-27 Electronic Biosciences Inc. High contrast signal to noise ratio device components
WO2013014451A1 (en) 2011-07-25 2013-01-31 Oxford Nanopore Technologies Limited Hairpin loop method for double strand polynucleotide sequencing using transmembrane pores
CA2847442A1 (en) 2011-08-30 2013-03-07 The Uab Research Foundation Mycobacterium tuberculosis porins and toxins and related methods
JP6226869B2 (ja) 2011-10-21 2017-11-08 オックスフォード ナノポール テクノロジーズ リミテッド 酵素法
US9617591B2 (en) 2011-12-29 2017-04-11 Oxford Nanopore Technologies Ltd. Method for characterising a polynucleotide by using a XPD helicase
CN104321441B (zh) 2012-02-16 2016-10-19 牛津楠路珀尔科技有限公司 聚合物的测量的分析
US9777049B2 (en) 2012-04-10 2017-10-03 Oxford Nanopore Technologies Ltd. Mutant lysenin pores
US20130274148A1 (en) 2012-04-11 2013-10-17 Illumina, Inc. Portable genetic detection and analysis system and method
US10612083B2 (en) 2012-04-19 2020-04-07 University Of Washington Through Its Center For Commercialization Methods and compositions for generating reference maps for nanopore-based polymer analysis
FR2990697B1 (fr) * 2012-05-21 2015-12-18 Assist Publ Hopitaux Marseille Procede d'attenuation d'une bacterie du complexe mycobacterium tuberculosis pour la fabrication d'un vaccin contre la tuberculose
CA2879261C (en) 2012-07-19 2022-12-06 Oxford Nanopore Technologies Limited Modified helicases
WO2014013262A1 (en) 2012-07-19 2014-01-23 Oxford Nanopore Technologies Limited Enzyme construct
US11155860B2 (en) 2012-07-19 2021-10-26 Oxford Nanopore Technologies Ltd. SSB method
AU2013296207B2 (en) 2012-08-03 2018-11-08 University Of Washington Through Its Center For Commercialization Compositions and methods for improving nanopore sequencing
US9651539B2 (en) 2012-10-28 2017-05-16 Quantapore, Inc. Reducing background fluorescence in MEMS materials by low energy ion beam treatment
WO2014071250A1 (en) * 2012-11-01 2014-05-08 University Of Washington Through Its Center For Commercialization Methods for detecting and mapping modifications to nucleic acid polymers using nanopore systems
GB201222928D0 (en) 2012-12-19 2013-01-30 Oxford Nanopore Tech Ltd Analysis of a polynucleotide
WO2014100481A2 (en) 2012-12-20 2014-06-26 Electornic Biosciences Inc. Modified alpha hemolysin polypeptides and methods of use
GB201314695D0 (en) 2013-08-16 2013-10-02 Oxford Nanopore Tech Ltd Method
EP2964779B1 (en) 2013-03-08 2018-08-29 Oxford Nanopore Technologies Limited Use of spacer elements in a nucleic acid to control movement of a helicase
GB201313477D0 (en) 2013-07-29 2013-09-11 Univ Leuven Kath Nanopore biosensors for detection of proteins and nucleic acids
AU2014268322B2 (en) 2013-05-24 2019-01-24 Quantapore, Inc. Nanopore-based nucleic acid analysis with mixed FRET detection
DK3004378T3 (en) 2013-05-24 2018-03-26 Illumina Cambridge Ltd Pyrophosphorolytic sequencing using nanopores
CN105992634B (zh) 2013-08-30 2019-06-14 华盛顿大学商业中心 选择性修饰聚合物亚单位以改进基于纳米孔的分析
WO2015051378A1 (en) * 2013-10-04 2015-04-09 University Of Washington Through Its Center For Commercialization Systems and methods for nanopore-based analysis of nucleic acids
GB201406151D0 (en) 2014-04-04 2014-05-21 Oxford Nanopore Tech Ltd Method
EP3575410A3 (en) 2013-10-18 2020-03-04 Oxford Nanopore Technologies Limited Modified enzymes
WO2015081178A1 (en) 2013-11-26 2015-06-04 Illumina, Inc. Compositions and methods for polynucleotide sequencing
AU2015208919B9 (en) 2014-01-22 2021-04-01 Oxford Nanopore Technologies Limited Method for attaching one or more polynucleotide binding proteins to a target polynucleotide
GB201406155D0 (en) 2014-04-04 2014-05-21 Oxford Nanopore Tech Ltd Method
US10359395B2 (en) 2014-02-19 2019-07-23 University Of Washington Nanopore-based analysis of protein characteristics
GB201403096D0 (en) 2014-02-21 2014-04-09 Oxford Nanopore Tech Ltd Sample preparation method
US10337060B2 (en) 2014-04-04 2019-07-02 Oxford Nanopore Technologies Ltd. Method for characterising a double stranded nucleic acid using a nano-pore and anchor molecules at both ends of said nucleic acid
EP3978516A1 (en) 2014-04-16 2022-04-06 The UAB Research Foundation Msp nanopores and uses thereof
CN106574300A (zh) * 2014-05-02 2017-04-19 牛津纳米孔技术公司 改善目标多核苷酸相对于跨膜孔移动的方法
GB201417712D0 (en) 2014-10-07 2014-11-19 Oxford Nanopore Tech Ltd Method
WO2015187670A2 (en) 2014-06-03 2015-12-10 Illumina, Inc. Compositions, systems, and methods for detecting events using tethers anchored to or adjacent to nanopores
US10519499B2 (en) * 2014-07-31 2019-12-31 Illumina, Inc. Hybrid nanopore sensors
AU2015310913B2 (en) * 2014-09-01 2021-04-01 Oxford Nanopore Technologies Limited Mutant CsgG pores
WO2016055778A1 (en) 2014-10-07 2016-04-14 Oxford Nanopore Technologies Limited Mutant pores
ES2789000T3 (es) 2014-10-10 2020-10-23 Quantapore Inc Análisis de polinucleótidos basado en nanoporos con marcadores fluorescentes que se inactivan mutuamente
GB201418159D0 (en) 2014-10-14 2014-11-26 Oxford Nanopore Tech Ltd Method
WO2016059427A1 (en) 2014-10-16 2016-04-21 Oxford Nanopore Technologies Limited Analysis of a polymer
GB201418469D0 (en) * 2014-10-17 2014-12-03 Oxford Nanopore Tech Ltd Method
WO2016065339A1 (en) 2014-10-24 2016-04-28 Quantapore, Inc. Efficient optical analysis of polymers using arrays of nanostructures
GB201502810D0 (en) 2015-02-19 2015-04-08 Oxford Nanopore Tech Ltd Method
GB201502809D0 (en) * 2015-02-19 2015-04-08 Oxford Nanopore Tech Ltd Mutant pore
CN107735686B (zh) 2015-04-14 2021-06-11 鲁汶天主教大学 具有内部蛋白质衔接子的纳米孔
AU2016270887B2 (en) 2015-06-03 2019-09-19 Illumina, Inc. Compositions, systems, and methods for sequencing polynucleotides using tethers anchored to polymerases adjacent to nanopores
US10641764B2 (en) 2015-07-02 2020-05-05 The University Of Massachusetts Membrane and droplet-interface bilayer systems and methods
CN105259229B (zh) * 2015-10-22 2018-04-20 清华大学 一种检测药物的单分子分析方法
CA3011830A1 (en) 2015-12-08 2017-06-15 Katholieke Universiteit Leuven Ku Leuven Research & Development Modified nanopores, compositions comprising the same, and uses thereof
US20190078145A1 (en) 2015-12-08 2019-03-14 Quantapore, Inc. Method of translocating nucleic acids through nanopores
JP6967006B2 (ja) 2016-01-15 2021-11-17 クアンタポール, インコーポレイテッド 低減されたバックグラウンドの光学に基づくナノポア分析
US10859562B2 (en) 2016-02-29 2020-12-08 Iridia, Inc. Methods, compositions, and devices for information storage
US10640822B2 (en) 2016-02-29 2020-05-05 Iridia, Inc. Systems and methods for writing, reading, and controlling data stored in a polymer
US10438662B2 (en) 2016-02-29 2019-10-08 Iridia, Inc. Methods, compositions, and devices for information storage
WO2017149317A1 (en) 2016-03-02 2017-09-08 Oxford Nanopore Technologies Limited Mutant pore
EP4122949A1 (en) 2016-04-06 2023-01-25 Oxford Nanopore Technologies plc Mutant pore
GB201609220D0 (en) 2016-05-25 2016-07-06 Oxford Nanopore Tech Ltd Method
JP2019517252A (ja) 2016-05-31 2019-06-24 クアンタポール, インコーポレイテッド 二色ナノポア配列決定
CN109477813A (zh) 2016-07-05 2019-03-15 昆塔波尔公司 基于光学的纳米孔测序
CN109804087A (zh) 2016-08-19 2019-05-24 昆塔波尔公司 使用猝灭剂的基于光学的纳米孔测序
EP4273156A3 (en) 2017-06-30 2024-01-17 Vib Vzw Novel protein pores
US11331019B2 (en) 2017-08-07 2022-05-17 The Research Foundation For The State University Of New York Nanoparticle sensor having a nanofibrous membrane scaffold
EP3775893A1 (en) * 2018-04-13 2021-02-17 F. Hoffmann-La Roche AG Methods and compositions for detection and analysis of analytes
GB201807793D0 (en) 2018-05-14 2018-06-27 Oxford Nanopore Tech Ltd Method
CN109239140B (zh) * 2018-08-16 2021-04-13 广东第二师范学院 一种纳米孔功能性控制方法及系统
CN112997080A (zh) * 2018-08-28 2021-06-18 南京大学 用于识别分析物的蛋白质纳米孔
EP4036106A4 (en) * 2019-09-29 2024-01-17 Qitan Tech Ltd Beijing MNEP MONOMER VARIANT AND THEIR USE
WO2021056598A1 (zh) 2019-09-29 2021-04-01 北京齐碳科技有限公司 一种Mmup单体变体及其应用
WO2021056599A1 (zh) 2019-09-29 2021-04-01 北京齐碳科技有限公司 一种Mnep单体变体及其应用
CN111164096B (zh) * 2019-09-29 2021-02-19 北京齐碳科技有限公司 一种Mmup单体变体及其应用
CN110954445B (zh) * 2019-10-31 2022-08-16 四川大学华西医院 一种活细胞生物传感器及其制备方法与应用
CN111235224B (zh) * 2020-01-14 2023-06-20 广东工业大学 一种基于磁泳分离的生物分子精确修饰方法及装置
US11837302B1 (en) 2020-08-07 2023-12-05 Iridia, Inc. Systems and methods for writing and reading data stored in a polymer using nano-channels
WO2022033998A1 (en) 2020-08-11 2022-02-17 F. Hoffmann-La Roche Ag Nucleoside-5'-oligophosphates tagged with positively-charged polymers, nanopores incorporating negative charges, and methods and systems using the same
WO2022263496A1 (en) 2021-06-17 2022-12-22 F. Hoffmann-La Roche Ag Engineered nanopore with a negatively charged polymer threaded through the channel
CN113651876B (zh) * 2021-08-18 2024-02-02 成都齐碳科技有限公司 孔蛋白单体的突变体、蛋白孔及其应用
GB202112235D0 (en) 2021-08-26 2021-10-13 Oxford Nanopore Tech Ltd Nanopore
CN116165373A (zh) * 2021-08-30 2023-05-26 四川大学 一种基于铜离子修饰MspA纳米孔的多肽成分分析方法
WO2023050031A1 (zh) * 2021-09-28 2023-04-06 成都齐碳科技有限公司 孔蛋白单体的突变体、蛋白孔及其应用
WO2023060422A1 (zh) * 2021-10-12 2023-04-20 成都齐碳科技有限公司 孔蛋白单体的突变体、蛋白孔及其应用
GB202118939D0 (en) * 2021-12-23 2022-02-09 Oxford Nanopore Tech Plc Pore

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001016327A2 (de) * 1999-08-31 2001-03-08 Michael Niederweis Verfahren zur herstellung eines kanalbildenden proteins
WO2002081676A2 (de) * 2001-04-04 2002-10-17 Michael Niederweis Nichtpathogener bakterieller rezipientenstamm eines mycolsäure-haltigen bakteriums, verfahren zu dessen herstellung und dessen verwendung

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4554101A (en) 1981-01-09 1985-11-19 New York Blood Center, Inc. Identification and preparation of epitopes on antigens and allergens on the basis of hydrophilicity
JPH07248329A (ja) 1994-03-11 1995-09-26 Nippon Bio Ratsudo Lab Kk 結核感染症検査用膜およびこれを用いる結核感染症関連抗体の検出方法
US5795782A (en) 1995-03-17 1998-08-18 President & Fellows Of Harvard College Characterization of individual polymer molecules based on monomer-interface interactions
US6362002B1 (en) 1995-03-17 2002-03-26 President And Fellows Of Harvard College Characterization of individual polymer molecules based on monomer-interface interactions
US6406880B1 (en) 1997-05-02 2002-06-18 Integrated Research Technology, Llc Betaines as adjuvants to susceptibility testing and antimicrobial therapy
US6267872B1 (en) 1998-11-06 2001-07-31 The Regents Of The University Of California Miniature support for thin films containing single channels or nanopores and methods for using same
DE19941448A1 (de) 1999-08-31 2001-03-01 Stefan Bossmann Verfahren zur Herstellung von regelmäßigen Nanostrukturen
CA2384100C (en) 1999-09-07 2011-03-29 The Regents Of The University Of California Methods of determining the presence of double stranded nucleic acids in a sample
US20040146430A1 (en) * 2002-10-15 2004-07-29 Dugas Matthew P. Solid state membrane channel device for the measurement and characterization of atomic and molecular sized samples
WO2002009647A2 (en) 2000-07-28 2002-02-07 Emory University Biological component comprising artificial membrane
WO2002042496A2 (en) 2000-11-27 2002-05-30 The Regents Of The University Of California Methods and devices for characterizing duplex nucleic acid molecules
AU2003256566A1 (en) * 2002-07-16 2004-02-02 Stuart Bussell Methods to construct multimeric dna and polymeric protein sequences as direct fusions or with linkers
ITMI20022096A1 (it) 2002-10-03 2004-04-04 Garden Ventures S R L Sistema di registrazione di un programma tv impostabile
US7444053B2 (en) 2003-06-16 2008-10-28 The Regents Of The University Of California Integrated electrical and optical sensor for biomolecule analysis with single molecule sensitivity
WO2006028508A2 (en) * 2004-03-23 2006-03-16 President And Fellows Of Harvard College Methods and apparatus for characterizing polynucleotides
US20070269843A1 (en) 2004-04-28 2007-11-22 Integrated Research Technology, Llc. Diagnostic Assays That Use Mycobacteriophages
WO2007041621A2 (en) 2005-10-03 2007-04-12 Xingsheng Sean Ling Hybridization assisted nanopore sequencing
WO2007146158A1 (en) 2006-06-07 2007-12-21 The Trustees Of Columbia University In The City Of New York Dna sequencing by nanopore using modified nucleotides
CN1932039B (zh) * 2006-09-21 2010-06-16 上海交通大学 外切酶-纳米孔的单分子核酸测序方法
GB2453377A (en) 2007-10-05 2009-04-08 Isis Innovation Transmembrane protein pores and molecular adapters therefore.
EP3029467B1 (en) 2008-09-22 2020-01-08 University of Washington Msp nanopores and related methods
EP2673638B1 (en) 2011-02-11 2019-10-30 Oxford Nanopore Technologies Limited Mutant pores
WO2013014451A1 (en) 2011-07-25 2013-01-31 Oxford Nanopore Technologies Limited Hairpin loop method for double strand polynucleotide sequencing using transmembrane pores
JP6226869B2 (ja) 2011-10-21 2017-11-08 オックスフォード ナノポール テクノロジーズ リミテッド 酵素法
AU2012360244B2 (en) 2011-12-29 2018-08-23 Oxford Nanopore Technologies Limited Enzyme method
EP2964779B1 (en) 2013-03-08 2018-08-29 Oxford Nanopore Technologies Limited Use of spacer elements in a nucleic acid to control movement of a helicase
EP3575410A3 (en) 2013-10-18 2020-03-04 Oxford Nanopore Technologies Limited Modified enzymes
CN106574300A (zh) 2014-05-02 2017-04-19 牛津纳米孔技术公司 改善目标多核苷酸相对于跨膜孔移动的方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001016327A2 (de) * 1999-08-31 2001-03-08 Michael Niederweis Verfahren zur herstellung eines kanalbildenden proteins
WO2002081676A2 (de) * 2001-04-04 2002-10-17 Michael Niederweis Nichtpathogener bakterieller rezipientenstamm eines mycolsäure-haltigen bakteriums, verfahren zu dessen herstellung und dessen verwendung

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
BUTLER,THOMAS: "Nanopore analysis of nucleic acids.", 《THESIS(PH.D.) UNIVERSITY OF WASHINGTON》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105801676A (zh) * 2016-04-13 2016-07-27 东南大学 一种突变MspA蛋白单体及其表达基因和应用
CN105801676B (zh) * 2016-04-13 2020-02-18 东南大学 一种突变MspA蛋白单体及其表达基因和应用
CN109890980A (zh) * 2016-07-12 2019-06-14 格罗宁根大学 基于FraC actinoporin的用于生物聚合物传感和测序的生物纳米孔
WO2018137592A1 (zh) * 2017-01-24 2018-08-02 四川大学 跨膜核酸解旋纳米孔及其构建方法与应用

Also Published As

Publication number Publication date
HUE029215T2 (en) 2017-02-28
EP3029467B1 (en) 2020-01-08
US20160137703A1 (en) 2016-05-19
US20170218443A1 (en) 2017-08-03
DK2344891T3 (en) 2016-06-06
US20210189480A1 (en) 2021-06-24
US9988679B2 (en) 2018-06-05
US8673550B2 (en) 2014-03-18
US20140256913A1 (en) 2014-09-11
US9170230B2 (en) 2015-10-27
EP3029467A1 (en) 2016-06-08
US20140309402A1 (en) 2014-10-16
CA2931824C (en) 2020-09-08
EP2344891B1 (en) 2016-03-16
CN102216783B (zh) 2015-04-01
ES2781858T3 (es) 2020-09-08
DE202009019021U1 (de) 2015-09-24
WO2010034018A3 (en) 2010-10-14
CN104710519B (zh) 2021-05-28
US9534024B2 (en) 2017-01-03
US9624275B2 (en) 2017-04-18
EP2344891A4 (en) 2012-08-22
US20140308662A1 (en) 2014-10-16
ES2576114T3 (es) 2016-07-05
US20190062825A1 (en) 2019-02-28
EP2344891A2 (en) 2011-07-20
WO2010034018A2 (en) 2010-03-25
CA2931824A1 (en) 2010-03-25
CA2774710A1 (en) 2010-03-25
HK1211310A1 (zh) 2016-05-20
US10870883B2 (en) 2020-12-22
US9540422B2 (en) 2017-01-10
US20240124928A1 (en) 2024-04-18
EP3686602A1 (en) 2020-07-29
CN102216783A (zh) 2011-10-12
CA2774710C (en) 2016-08-02
US20120055792A1 (en) 2012-03-08
CA3092369A1 (en) 2010-03-25
US11634764B2 (en) 2023-04-25

Similar Documents

Publication Publication Date Title
CN102216783B (zh) Msp纳米微孔和相关方法
US11913905B2 (en) Analyte sequencing with nanopores
CN109072295A (zh) 修饰的纳米孔,包含其的组合物及其应用
Niederweis c12) United States Patent

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1211310

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant