CN104685361B - 单分子蛋白测序 - Google Patents

单分子蛋白测序 Download PDF

Info

Publication number
CN104685361B
CN104685361B CN201380048170.0A CN201380048170A CN104685361B CN 104685361 B CN104685361 B CN 104685361B CN 201380048170 A CN201380048170 A CN 201380048170A CN 104685361 B CN104685361 B CN 104685361B
Authority
CN
China
Prior art keywords
albumen
amino acid
molecular transport
clpp
detector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201380048170.0A
Other languages
English (en)
Other versions
CN104685361A (zh
Inventor
朱智珉
塞斯·德克尔
金克尔 亨德里卡·海特勒伊达·西奥多拉·玛丽亚·范
安妮·萨拉·迈尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Technische Universiteit Delft
Original Assignee
Technische Universiteit Delft
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Technische Universiteit Delft filed Critical Technische Universiteit Delft
Publication of CN104685361A publication Critical patent/CN104685361A/zh
Application granted granted Critical
Publication of CN104685361B publication Critical patent/CN104685361B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/34Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving hydrolase
    • C12Q1/37Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving hydrolase involving peptidase or proteinase
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/483Physical analysis of biological material
    • G01N33/487Physical analysis of biological material of liquid biological material
    • G01N33/48707Physical analysis of biological material of liquid biological material by electrical means
    • G01N33/48721Investigating individual macromolecules, e.g. by translocation through nanopores
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/58Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving labelled substances
    • G01N33/582Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving labelled substances with fluorescent label
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6818Sequencing of polypeptides
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6827Total protein determination, e.g. albumin in urine
    • G01N33/6839Total protein determination, e.g. albumin in urine involving dyes, e.g. Coomassie blue, bromcresol green
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/90Enzymes; Proenzymes
    • G01N2333/914Hydrolases (3)
    • G01N2333/948Hydrolases (3) acting on peptide bonds (3.4)
    • G01N2333/95Proteinases, i.e. endopeptidases (3.4.21-3.4.99)
    • G01N2333/952Proteinases, i.e. endopeptidases (3.4.21-3.4.99) derived from bacteria
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2458/00Labels used in chemical analysis of biological material

Abstract

本发明提供了用于确定液体中蛋白的类型的装置,该装置包括(a)基于固定的ATP依赖性蛋白酶的分子转运蛋白器,配置为引导用标记物功能化的蛋白通过检测器的检测区,(b)所述检测器,配置为检测作为标记的氨基酸的标记物的函数的信号,(c)处理器单元,配置为从检测器信号识别功能化的蛋白的氨基酸的序列,其中,该处理器单元进一步配置为比较氨基酸的识别序列与这种序列在蛋白的数据库中的出现以及识别蛋白的类型。

Description

单分子蛋白测序
技术领域
本发明涉及用于确定蛋白的类型(通过测序)的(单分子)方法,以及可以用于这种方法的装置。
背景技术
用于单分子蛋白分析的方法在本领域中是已知的。例如,WO2010065531描述了这种方法可以用于发现新的生物标记物、定量以及高通量筛选。可以表明的是,使用改进的埃德曼降解(Edman degradation),随后通过检测(例如,标记物的抗体检测),能够直接测序表面结合肽。使用分子(例如,标记物的抗体)的池(pool)以识别和定量生物样品中的各种蛋白分析物,能够实现高通量筛选。
进一步地,WO2010144151描述了用于进行其中发生蛋白合成的分析反应的单分子、实时分析的组合物、方法和系统。分析这种反应的能力提供了研究这些反应以及潜在地识别因子的机会和/或用于影响这种反应的方法,例如,增强、抑制或以其他方式影响这种反应,包括但不限于影响反应速率、持续合成能力(processivity)、保真度(精确度,fidelity)、持续时间等。该文献特别描述了测定由靶mRNA分子编码的氨基酸的序列的方法,包括:a)提供包含靶mRNA分子的反应混合物、在P位点包含tMet-tRNA tMet的核糖体复合物、以及在溶液中游离的多种类型的标记物的氨酰基-tRNA,其中,核糖体和/或靶mRNA分子固定在载体上,使得观察体积包括不超过一个核糖体和/或mRNA分子,并且进一步地,其中,核糖体复合物不包括可检测的标记物或淬灭基团;b)通过核糖体复合物引发mRNA分子的连续翻译;c)在所述连续翻译过程中,顺序地并且可选地检测核糖体复合物与至少一个第一标记物的氨酰基-tRNA和第二标记物的氨酰基-tRNA的关系,其中,所述关系导致来自第一标记物的氨酰基-tRNA的第一氨基酸和来自第二标记物的氨酰基-tRNA的第二氨基酸结合在新生多肽链中;以及d)识别第一氨基酸和第二氨基酸,从而确定由靶mRNA分子编码的氨基酸的序列。
发明内容
蛋白是生命的基础,因为它们是所有生命形式的工作机器。为了理解生物现象,需要具有所涉及的蛋白的综合知识。确定蛋白的氨基酸的序列的蛋白测序用于获得从细胞系到细胞组织到生物个体的蛋白种群的谱图(profile)。由于1950年的胰岛素的首次蛋白测序,测序技术已经稳定演化成开启了蛋白组学、细胞蛋白谱图全面绘制的纪元。
现代的蛋白测序主要基于质谱技术(ESI、MALDI等)。各自具有其自身的优点和缺点,但它们均共享相同的限制。第一,它们可以仅分析蛋白片段(约10-20个氨基酸)。当检查全长蛋白(通常,几百个氨基酸长)时,计算的复杂化阻止了精确的序列预测。第二,由于通过分析复杂的谱峰进行序列预测,使得它们通常不能识别嵌入在其他主要物质(物种,species)之间的次要物质。由于许多细胞蛋白以低丰度存在,这使得难以获得大规模的蛋白组学信息。
在DNA测序中,面临类似的挑战,但当扩增DNA样品直至达到高信噪比时,克服了它们。不同于DNA,不存在可以扩增蛋白的天然系统(机器,machinery)。在此,我们的目的在于:在与大规模技术一样高的精度并且使用与单细胞一样小的样品数量下,开发可以量化细胞蛋白的全新的方法。
因此,本发明的一个方面是提供用于确定蛋白的类型的可替换的(单分子)(测序)方法和/或用于确定蛋白的类型的可替换的装置(尤其适用于这种可替换的(单分子)的方法),其中,所述方法和/或装置优选进一步至少部分避免上述限制中的一个或多个。
因此,提出了使用(在一个实施方式中)单分子荧光技术的新测序方法。该新方法将分子接分子地探索蛋白,而不仅仅是取它们的平均;因此,尽管细胞蛋白的复杂的性质和宽动态范围,但其可以覆盖全部蛋白。不同于基于质谱的测序,该方法将读取全长蛋白序列,这将使得测序预测更不容易出错。单分子检测如此敏感使得该方法可以仅需要小量的用于分析细胞蛋白的样品(不超过1fmol)。这将产生用于单细胞分析的机会。这些优点与通常需要大于103-105倍的用于分析的蛋白的质谱的限制相比。
新方法的特征可以在于三个新构思:(1)指纹分析(fingerprinting)、(2)基于酶的操作、以及(3)实时测序。由于我们的分析表明在仅(已经)读取两种类型的氨基酸下可以预测蛋白序列(参见以下关于预测能力),使得通过仅探测两种不同的氨基酸如仅半胱氨酸和赖氨酸残基便可以识别蛋白。为了控制具有纳米精度的测序过程,可以应用伴侣蛋白(例如,ClpXP),尽管也可以应用其他合适的分子转运蛋白器(分子转运器,moleculartransporter machine)。使用(在一个实施方式中)单分子荧光显微镜,我们将观察通过例如单一ClpXP蛋白实时探测的各个测序底物。因此,新技术特别适合测序具有至少300个氨基酸,甚至更特别地,至少600个氨基酸的蛋白。因此,即使在少至约300个氨基酸下,也可以进行测序(尽管,在一些情况下,甚至更小的数目也是可能的;同样参见以下)。
在另一个实施方式中(参见以下),应用了纳米孔技术。
本发明提供了用于分析液体(包含蛋白)中的蛋白的方法(特别地,用于确定包含蛋白的液体中的蛋白的类型),所述方法包括(a)用对特别地至少2种,如2-8种,特别地2-4种,如仅2种类型的预定蛋白氨基酸具有选择性的特别地至少2种,如2-8种,特别地2-4种,如仅2种类型的氨基酸标记物,特别地,对仅两种氨基酸(特别地,C和K氨基酸)具有选择性的仅两种类型的氨基酸标记物功能化蛋白,(b)在液相中,用基于固定的ATP依赖性蛋白酶的分子转运蛋白器引导功能化的蛋白通过配置为检测作为标记的氨基酸的标记物的函数的信号的检测器的检测区(当引导功能化的蛋白通过检测器的检测区(用基于固定的ATP依赖性蛋白酶的分子转运蛋白器)时);(c)从检测的信号确定预定氨基酸的序列;以及可选地,(d)比较预定氨基酸的序列与这种序列在蛋白的数据库中的出现并且确定液体中的蛋白的类型。术语“氨基酸标记物”是指用于氨基酸的标记物。在本文中,代替“氨基酸标记物”,还应用了术语“标记物”。这些标记物特别地是染料,同样参见以下。
进一步地,本发明提供了用于确定液体中的蛋白的类型的装置,所述装置包括(a)基于固定的ATP依赖性蛋白酶的分子转运蛋白器,配置为引导用标记物功能化的蛋白(即,一些(预测定的)氨基酸用标记物功能化)通过检测器的检测区,(b)所述检测器,配置为检测作为标记的氨基酸的标记物的函数的信号,(c)处理器单元,配置为从检测器信号识别功能化的蛋白的氨基酸的序列,其中,(d)处理器单元可选地进一步被配置为比较氨基酸的识别序列与这种序列在蛋白的数据库中的出现以及(基于比较)识别蛋白的类型。因此,该装置可以包括基于固定的ATP依赖性蛋白酶的分子转运蛋白器,其被配置为引导用对(特别地,2-4种类型的)预定蛋白氨基酸具有选择性的氨基酸标记物功能化的蛋白通过检测器的检测区。
该革命性的单分子方法将提供用于蛋白分析的新的深度测序工具。期待的是在生物学、生物技术和医学科学中的各种应用。当该技术在未来发展为桌面工具时,我们预期通过示踪个体之间、不同组织之间以及在不同的环境条件下的变化,医学研究者将能够阐明蛋白表达谱。该新测序技术可以改变蛋白组学的模式,并且可以成为通用的诊断工具。
单分子蛋白测序的直接挑战是由20种不同氨基酸组成的蛋白。不同于仅区别四种不同的核苷酸(A、G、C和T)并且仅需要四种荧光团的DNA测序,全蛋白测序要求20种荧光标签。然而,实际上不可能发现其光谱不会彼此重叠的20种荧光团。
因此,通过从非常不同于DNA测序的角度接近蛋白测序,我们将带来新的构思‘蛋白指纹分析’。让我们首先问对于蛋白识别我们需要多少信息的问题。DNA测序需要精确的读出每一个核苷酸;否则,由于缺失、插入和突变使得获得的信息无意义。另一方面,蛋白测序不需要所有氨基酸的真实读数。更确切地说,参照公开的基因组和蛋白组学数据库,测序可以降低到从每种生物体中的蛋白种群(例如,人类细胞中约20,000种)的池识别出蛋白的问题。
让我们假定我们仅读出两种类型的氨基酸。在该两位信息下,我们应当连续地读出多少氨基酸以识别蛋白呢?数学估算214<20,000<215表明我们仅需要读出15个氨酸酸或更多。为了将蛋白肽的20位信息转换成2位,我们将靶向可以有效并且特异性标记的两种高度亲核的氨基酸-赖氨酸(Lys,K)和半胱氨酸(Cys,C)。如在图1a中示出的(同样参见以下),读出的K和C氨基酸将记录为‘…CKCCKCKCKCCKCK...,’并且该数据将用于预测蛋白身份(identity)。平均每20个氨基酸观察到1个K;并且每40个氨基酸观察到1个C。典型的蛋白是约400个氨基酸长,并且因此平均包含30个K和C的残基。该数远高于最小数15个氨基酸,其是参考蛋白数据库识别(通常)所需的(然而,同样进一步参见以下)。
然而,以上预测基于简单的数学估算,使用人类蛋白数据库Uniprot(www.uniprot.org)进行对于指纹分析的实际预测能力的估算。进行了使用人类有机体的完整并且检查的蛋白组(9606号)的计算的指纹分析。废弃来自数据库的所有位置信息,并且将每个完整的蛋白序列减少至仅C和K氨基酸的序列(C-K数据库)。给定模拟序列,我们的程序是将其与C-K数据库中的所有序列进行比较,并且提出最佳匹配。将预测保真度定义为最佳匹配数目的倒数。对于这些计算分析,我们采用了点到点(point-point)匹配算法(其基于相关分析)和Smith-Waterman算法(Smith,Temple F.;和Waterman,Michael S.(1981)."Identification of Common Molecular Subsequences".Journal of MolecularBiology 147:195-197)。
我们的分析表明,当读出约17个氨基酸或更长时,预测能力达到令人满意的水平(图1b)。该数比我们估算的15个氨基酸稍大,但比K和C残基的平均数30/蛋白小的多。因此,所述方法特别地包括检测待识别的蛋白中至少15个,特别地,至少17个预定蛋白氨基酸的存在。这可以特别地适用于人类蛋白。对于非人类蛋白(和/或对于非动物蛋白),可能的是可以标记小于至少15个氨基酸,并且仍然获得良好的可预测性。进一步地,应注意的是,在该技术用于确定有限数目的预定蛋白的蛋白类型的情况下,至少15个氨基酸的数目还可以更低。
应指出,短语“检测蛋白中至少15个,特别地,至少17个预定蛋白氨基酸的存在”不排除该方法进一步测序并且测量多于仅15个,或仅17个预定蛋白。不排除测量多于例如(总计)15个氨基酸K和C,如超过20个,像超过40个氨基酸。
进一步地,基于以上原则,应建议的是,标记2-8种不同的氨基酸,特别地,仅2-4种,如甚至仅2种不同的氨基酸,特别地,如Lys(K)和Cys(C)。在本文中,使用术语“蛋白氨基酸”和类似术语以表明本发明涉及在蛋白中已知可得到的氨基酸。代替该术语,在本文中还应用短术语“氨基酸”。术语“蛋白”特别地指天然存在的蛋白,如人类蛋白、动物蛋白或植物蛋白。
我们注意到固有的测量误差和不完整的荧光团标记物可以干扰预测,因为它们将导致明显的缺失、插入或Lys和Cys信号交换。我们的误差分析表明,在荧光标记和测量中,人类蛋白的识别可容许约10%的误差。例如,我们的分析(图4a)表明,给定40-长CK序列,即使当存在许多存在的交换误差(NSE)(即,在扫描过程中C和K的顺序交换)时,预测保真度(PF)也不会显著下降。我们使用点到点匹配算法和Smith-Waterman算法进行该误差分析。
为了读取蛋白的C和K残基,我们需要将来自复杂的三维构象的蛋白展开(解折叠,unfold)成线性一维构象并且用纳米精度扫描其的特定纳米装置。我们提出基于酶的实时方法,在不包括任何化学反应的情况下使用工具快速读取(如,0.1-60个氨基酸/s)。在该角度下,我们的目标在于使用在紧密的相互作用下沿着蛋白底物易位的天然存在的蛋白。实时DNA测序使用结合至DNA的酶(DNA聚合酶)并且扫描DNA链,该行为自然地报告DNA序列。
ClpXP(ClpX和ClpP的蛋白复合物)是展开蛋白底物并且沿着其易位的伴侣复合物(图2a)。ClpXP是与其底物保持紧密接触的进行性并且快速的酶。单个ClpXP可以沿着串联单体(8个20kD单体,>1000个氨基酸长)易位。ClpXP可以快至60个氨基酸/秒地易位(Maillard,R.A.,Chistol,G.,Sen,M.,Righini,M.,Tan,J.,Kaiser,C.M.,Hodges,C.,Martin,A.和Bustamante,C.(2011).ClpX(P)generates mechanical force to unfoldand translocate its protein substrates.Cell 145,459-469)。ClpX具有纳米范围的通道,并且ClpP具有纳米范围的孔,其尺寸提供了用纳米精度操纵测序底物的能力。很好地表征了ClpXP的生化性能如底物特异性和对蛋白修饰的耐性。ClpXP可以易位和降解修饰的底物如化学变性底物、染料标记物的底物和化学交联蛋白。ClpXP在底物处理中似乎高度混杂。已经发现,测序底物的修饰将不会干扰ClpXP活性。单分子测序也可以需要ClpP或ClpX的修饰。ClpP和ClpX的突变和染料标记似乎是可行的。
然而,也可以应用其他ATP依赖性蛋白酶。在一个实施方式中,分子转运蛋白器是选自由ClpXP、ClpAP、ClpCP、ClpEP、ClpYQ(HslUV)、ClpB、Lon、FtsH、archeal PAN组成的组的分子转运蛋白器,以及基于蛋白酶体的分子转运蛋白器(同样参见Kirstein,J.,Mollière,N.,Dougan,D.A.和Turgay,K.,Adapting the machine:adaptor proteins forHsp100/Clp and AAA+proteases,Nature Reviews-Biology,7,2009年8月,589-599),特别地,是基于ClpXP的分子转运蛋白器。然而,还可以应用其他(ATP依赖性蛋白酶)分子转运蛋白器。这些ATP依赖性蛋白酶共享共同的基本结构和作用机制,其中,AAA+酶可以选择蛋白底物并且沿着它们进行性易位,而蛋白酶可以降解蛋白底物。在一个特定的实施方式中,应用ClpXP。在仍另一个实施方式中,应用ClpAP。
使用ClpXP作为扫描探针,可以如下应用荧光技术。我们首先需要用染料标记测序底物。在一个特定的实施方式中,我们选择高度亲核的氨基酸(赖氨酸(K)和半胱氨酸(C))。K的胺基将与NHS-酯染料结合,并且C的硫醇基与马来酰亚胺染料结合。两个反应彼此正交,这防止交叉标记。这些化学反应如此有效地发生(在一般反应条件(活性染料的微摩尔浓度和几个小时的温育)下达到约100%的产率),使得几个标记试剂盒是商业可获得的。这使得标记过程具有时间效益和成本效益。为了确保C和K残基的完整标记,我们将通过蛋白变性暴露内部的氨基酸。代替或除了赖氨酸和半胱氨酸,还可以选择丝氨酸、苏氨酸、酪氨酸、以及翻译后修饰的氨基酸。因此,特别地,可以选择赖氨酸、半胱氨酸、丝氨酸、苏氨酸、酪氨酸、以及翻译后修饰的氨基酸中的两种或更多种,特别地,赖氨酸、半胱氨酸、丝氨酸、苏氨酸、以及酪氨酸中的两种或更多种以标记。在一个实施方式中,仅标记半胱氨酸和赖氨酸。
在几种变性方法中,可以采用在破坏二级和三级蛋白结构中是有效的SDS(十二烷基硫酸钠)介导的变性和热诱导的变性。为了断裂二硫键,在该苛刻变性条件下,可以使用强还原剂(如β-巯基乙醇)。在随后的染料标记步骤中,将优选除去还原剂,因为它们可以干扰(半胱氨酸)标记。例如,可以利用通常的蛋白沉淀操作(用丙酮、硫酸铵或聚乙烯亚胺)进行除去。在染料标记之后,可以进行缓冲液更换(通过透析或尺寸排阻柱)或另一轮的蛋白沉淀以除去过量的染料。这些纯化步骤可以特别地保证在生物学上优化条件下运行的酶介导的测序反应。
由于标记,通常在几纳米的距离上,将沿着测序底物穿插染料。为了顺序解决它们,我们需要纳米分辨率成像方法。在此,我们引入纳米标尺,FRET(供体和受体荧光团之间的荧光共振能量转移)(Roy,R.,Hohng,S.和Ha,T.(2008).A practical guide to single-molecule FRET.Nat Methods 5,507-516)。以下,我们还引入可以用于解决标记物的顺序的纳米孔滤波器。在分别用两种不同颜色的受体染料(Cy5和Cy7)标记的K和C残基下,通过用Cy3供体分子扫描并且用Cy3测量Cy5和Cy7荧光信号的FRET,可以探测受体分子。以类似的方法,可以探测其他受体染料如Cy3.5和Cy5.5(对于其他氨基酸)。因此,尽管没有排除其他荧光团,但标记物可以包括选自例如花青家族、Alexa家族、Atto家族、Dy家族以及罗丹明家族中的一种或多种的有机荧光团。
如在图2b中示出的,ClpX(六聚体环,显示为椭圆)在顶部具有进入口,并且ClpP(七聚体环的二聚体)在底部具有假定的出口。紧密结合的这两种蛋白的高度是约16nm并且宽度是约9-15nm。当测序底物通过其标签对接(dock)在ClpX进入口上时,底物被易位在ClpX的窄通道(1nm宽)并且成为展开的。将未折叠蛋白移交给其伴侣蛋白(ClpP蛋白酶),其随后将易位的肽裂解成小片段。
ClpXP识别仅示出某一特定标签的底物。众所周知的标签λO((TNTAKILNFGR)SEQID NO:1)(Farell,C.M.,Baker,T.A和Sauer,R.T.,Altered specificity of a AAA+protease,Molecular Cell 25,161–166,2007年1月12日,161-166-)可以连接在测序底物的N端。EDC化学可以用于使合成的λO肽的C端(羧基)与测序底物的N端(氨基)结合。由于Lys的氨基也通过EDC化学靶向,使得该结合需要仔细的考虑。第一,由于与Lys的ε氨基的pK值(pKa=10.5)相比,α氨基的pK值(pKa=8.9)较低,使得EDC化学可以在6.5-8.5的pH进行。第二,在pH 9.0-11.0Lys标记之后,可以进行连接反应以最小化任何非特异性连接。代替N端λO(TNTAKILNFGR)标签,还可以应用C端标签ssrA((AANDENYALAA)SEQ ID NO:2),或任何其他N端或C端标签(同样参见Flynn J.M.,Neher,S.B.,Kim,Y.,Sauer,R.T.,Baker,A.T.,Proteomic Discovery of Cellular Substrates of the ClpXP Protease Reveals FiveClasses of ClpX-Recognition Signals,Molecular Cell,Vol.11,2003年3月,671-683)。因此,在一个实施方式中,所述方法进一步包括用通过分子转运蛋白器可识别的标签(或标记物)来标记蛋白。
ClpP室的半径是约5nm。由于Cy3-Cy5对在6nm是最敏感的并且Cy3-Cy7在4nm是最敏感的,使得在开发FRET敏感性中该尺寸是最佳的。如果我们将供体(Cy3)放置在ClpP室中,我们可以使用该最佳距离测量肽片段的供体(Cy3)和受体(Cy5和Cy7)之间的FRET。此外,由于进入口和ClpP室之间的距离是7.5-12.5nm(大于常规FRET距离(其在量级4-6nm中)),使得以这种方式我们可以避免供体和邻近进入口的受体池之间的非特异性的FRET。可替换地,可以用Cy3供体荧光团标记ClpX。进一步地,Cy3、Cy5和Cy7是指本领域中已知的花青染料如,例如Lee et al,2010(Lee,J.,Lee,S.,Ragunathan,K.,Joo,C.,Ha,T.和Hohng,S.(2010).Single-molecule four-color FRET.Angew.Chem Int.Ed.Engl.49,9922-9925)中描述的。然而,还可以应用选自花青家族、Alexa家族、Atto家族、Dy家族以及罗丹明家族中的一种或多种的其他标记物。
在任何受体分子在ClpP室中的情况下,将发生来自供体的FRET。因此,为了获得高质量的FRET时间踪迹,在一定时间下在室中具有尽可能少的染料是必要的。为了实现这一点,我们的测序技术利用ClpP的独特特性。ClpP将蛋白裂解成片段并且将各片段释放出室。特别地,当足够地减慢ClpX易位速度(如通过减少可得到的ATP能量的量)(Martin,A.,Baker,T.A.,Sauer,R.T.,Protein unfolding by a AAA+protease is dependent on AT-hydrolysis rates and substrate energy landscapes,Nature Structural&MolecularBiology,volume 15,no.2,2008年2月,139-145;Shin,Y,Davids,J.H.,Brau,R.R.,Martin,A.,Kenniston,J.A.,Baker,Sauer,R.T.,Lang,M.J.,Single-molecule denaturation anddegradation of proteins by the AAA+ClpXP protease,PNAS,November 17,2009,vol.106,no.46,19340-19345)时,在一定时间下将仅存在在ClpP室中发生的一个裂解反应,其后是单个片段的分散控制释放。该控制易位方案将保持室中的片段的数目平均小低于1,这将使得能够在最小的模糊度下解释FRET时间踪迹。相关地,该确定还将保证片段释放的顺序遵循初始蛋白序列的相同顺序,这最小化了读出中的任何交换误差(C←→K)。
通过使半胱氨酸的硫醇基分别与马来酰亚胺-Cy3染料和马来酰亚胺-生物素结合,可以进行用供体和生物素标记ClpX或ClpP。来自大肠杆菌的ClpX和ClpP具有两个半胱氨酸残基/单体。由于两种氨基酸不是跨细菌物种保守的,使得我们可以将它们敲除并且引入其中应当定位Cy3和生物素的新半胱氨酸残基。当指定半胱氨酸点突变的位置时,将利用ClpX和ClpP蛋白的晶体结构。
ClpP室由14个ClpP单体组成,这提出了两个实际问题。第一,由于这种寡聚结构,使得可以用多于一个供体分子标记室。由于我们可以仅分析受体信号,使得多种供体染料将不会干扰我们的测量。事实上,我们可以有意地添加多于一个供体分子以延长总观察时间。第二,由于ClpP室的点对称,使得供体分子的随机定位可以导致其被放置在不期望侧,即,放置在ClpX和ClpP之间的界面上而不是邻近出口。在一个实施方式中,通过产生其中环之一由不可以与ClpX相互作用的突变的ClpP组成的不对称ClpP室,我们可以解决该问题。在组装室之前,我们将仅染料标记该突变的ClpP。可以应用如通过Maglica等描述的过程(Maglica,Z.,Kolygo,K.和Weber-Ban,E.,Optimal efficiency of ClpAP and ClpXPchaperone-proteases is achieved by architectural symmetry,Structure 17,2009,508-516.)。因此,特别地,分子转运蛋白器是基于ClpXP的分子转运蛋白器,其中,基于ClpXP的分子转运蛋白器包括ClpP单体以及至少一种突变ClpP单体的不对称ClpP室,其中,至少一种突变ClpP单体不能对接至ClpX,并且其中,该至少一种突变ClpP是标记的荧光供体(在组装室之前)。应注意的是,在用供体荧光团标记ClpX的情况下,产生不对称ClpP蛋白不是必需的。因此,在另一个实施方式中,分子转运蛋白器是基于ClpXP的分子转运蛋白器,其中,用供体荧光团标记ClpX。
因此,更通常地,分子转运蛋白器可以包括供体,特别地,荧光供体(供体荧光团),该供体可以特别地被配置为探测氨基酸标记物。这可以包括荧光供体标记的ClpXP或荧光供体标记的ClpAP等。可以标记ClPX或ClPA等。然而,可选地此外或可替换地,可以用荧光供体(供体荧光团)标记ClpP。可选地,可以应用两种或更多种标记物。
为了用单分子荧光观察测序事件,我们可以将ClpXP蛋白固定在石英表面上并且将用TIRF(全内反射荧光)显微镜获得图像。通过用生物素标记ClpX或ClpP蛋白并且将它们引入在抗生蛋白链菌素层叠的石英表面上,可以进行固化(图3a-3c)。特别地,当通过层流将染料标记的测序底物引入单分子室中时,将开始测序反应,并且它们通过在室中扩散对接在固定的ClpXP蛋白上。
用现有技术的CCD照相机(如,例如Andor,iXon,电子倍增CCD),在高时间分辨率(高达10毫秒)下可以获得随后的FRET时间轨迹。对于最佳的信噪比,花青染料的三个一组(Cy3、Cy5和Cy7)(Lee,J.,Lee,S.,Ragunathan,K.,Joo,C.,Ha,T.和Hohng,S.(2010).Single-molecule four-color FRET,Angew.Chem Int.Ed.Engl.49,9922-9925)可以用作FRET对。对于最小的照片闪烁和缓慢的照片漂白,可以使用除氧剂系统(葡糖氧化酶和过氧化氢酶)和三重态猝灭剂(Trolox)。由于优选防止蛋白非特异性吸附在表面上,使得将用聚合物(PEG,聚乙二醇)涂覆石英表面。然而,还可以应用其他表面。例如,可以应用牛血清白蛋白或酪蛋白涂覆的表面。在其中代替光信号的情况下,评估电信号(如在纳米孔系统的情况下),还可以用蛋白或脂双层涂覆表面。
ClpX易位应当足够快,从而在供体分子照片漂白之前完成测序。近来的单分子研究表明,ClpX的速度是60个氨基酸/秒。将该速率转换成6.7秒/测序(平均大小的蛋白底物,约400个氨基酸)。该时间窗口在Cy3观察的时间尺度内很好,当使用0.1秒时间分辨率时,通常是几分钟。另一方面,对于足够的光子统计和时间踪迹的可靠分析,ClpX易位应当足够缓慢。当我们需要减慢过程时,由于ClpX的易位是能量(ATP)依赖的,使得我们仅需要降低ATP浓度(从毫摩尔至微摩尔)。
因此,在一个实施方式中,在一定的易位速度下,用基于固定的ATP依赖性蛋白酶的分子转运蛋白器易位功能化的蛋白通过检测器的检测区,其中,易位速度选自0.1-60个氨基酸/秒的范围。特别地,通过控制液体中ATP浓度来控制易位速度。
因此,在一个实施方式中,用固定的(基于ATP依赖性蛋白酶)分子转运蛋白器,引导功能化的蛋白(在液相中)通过检测器的检测区。
由于ClpX单体的低关联亲和力,使得期望使用ClpX的人工连接的六聚体形式,用于单分子研究。我们已经表达并且已经纯化了ClpX的该六聚体形式。另一方面,ClpP具有高关联亲和力,并且因此,我们已经将ClpP表达为单体。
ClpX和ClpP可以形成1:2或2:2(ClpX:ClpP)复合物。对于蛋白测序,我们尤其可以使用1:2复合物,以避免通过相同的复合物同时处理多个底物。使用超化学计量比,如混合中ClpP十四聚体浓度和ClpX六聚体浓度之间的至少3:1的比率,可以可靠地实现该化学计量。
未折叠蛋白趋向于团聚。为了防止与测序底物发生这种情况,可以将未折叠的标记底物保持在变性剂中。应指出,由于将通过稀释在生理缓冲液中,在约1nM的浓度下将未折叠底物引入测序室中,使得该变性剂可以不干扰测序反应,并且这将导致变性剂的低浓度。为了进一步最小化任何团聚,按照由Meyer优化的操作(Meyer,A.S.,Gillespie,J.R.,Walther,D.,Millet,I.S.,Doniach,S.和Frydman,J.(2003).Closing the foldingchamber of the eukaryotic chaperonin requires the transition state of ATPhydrolysis.Cell113,369-381.),我们可以在测序反应之前立即快速稀释测序底物。
在此,我们提供使用单分子FRET技术的基于ClpXP的扫描方法的证明(图4b)。我们产生了ClpX的人工连接的六聚体形式和其生物素化的C-末端。使用抗生蛋白链菌素-生物素结合,我们将与蛋白酶ClpP复合的该纳米通道蛋白固定在石英表面上。在该样品室中,我们添加了包含K和C残基的肽。用包含NHS酯基的Cy3荧光团标记K残基(图中的绿色球体),并且用包含单马来酰亚胺基的Cy5的荧光团标记C残基(红色球体)。肽包含通过具有高特异性的ClpX识别的ssrA标签。
使用实验室制造的全内反射显微镜和使用电子倍增CCD照相机的记录荧光信号,我们获得肽通过ClpX的纳米通道的易位过程的图像。荧光信号的突然增加(在图Y中,时间在25.5s)报告了肽对接至固定的ClpXP扫描仪。如通过高受体荧光(供体时间踪迹是绿线,并且受体的是红色的)示出的,由于设计的肽的折叠结构,使得Cy3和Cy5之间的FRET最初是有效的。当肽被ClpX拉动并且经由ATP水解而易位通过ClpX的纳米通道时,肽被线性地拉伸,Cy3和Cy5之间的距离变大,并且FRET效率变低(时间在26.2s)。该易位过程之后是ClpP室中肽的重折叠(时间在26.5s),以及其裂解和随后的解离事件(时间在27.0s和27.6s)。
因此,如以上描述的,在一个实施方式中,本发明提供了用于分析包含蛋白的液体中的蛋白的方法(特别地,用于确定包含蛋白的液体中的蛋白的类型),所述方法包括(a)用对2-4种类型的预定蛋白氨基酸具有选择性的2-4种类型的氨基酸标记物,特别地,对仅两种氨基酸(特别地,C和K氨基酸)具有选择性的仅两种氨基酸标记物来功能化蛋白,(b)在液相中,用基于固定的ATP依赖性蛋白酶的分子转运蛋白器引导功能化的蛋白通过配置为检测作为标记的氨基酸的标记物的信号的函数的检测器的检测区;以及(c)从检测的信号确定预定氨基酸的序列。特别地,该分析方法进一步包括:(d)比较预定氨基酸的序列与这种序列在蛋白的数据库中的出现并且确定液体中蛋白的类型。以这种方式,可以确定蛋白的类型。在一个实施方式中,这种数据库可以是远程数据库。例如,确定的序列可以与来自关于已知测序的氨基酸的互联网的数据比较。
特别地,所述方法是半体内方法。以上提及的液体可以是体液,但也可以是稀释的体液。进一步地,其他液体也是可设想的,如来自细菌、古细菌、真核生物的细胞提取物和细胞器。特别地,液体是含水液体。
如以上还指出的,本发明还提供了用于确定液体中的蛋白的类型的装置,所述装置包括(a)基于固定的ATP依赖性蛋白酶的分子转运蛋白器,配置为引导用标记物功能化的蛋白通过检测器的检测区,(b)所述检测器,配置为检测作为标记的氨基酸的标记物的函数的信号,(c)处理器单元,配置为从检测器信号识别功能化的蛋白的氨基酸的序列,并且可选地,进一步被配置为比较氨基酸的识别序列与这种序列在蛋白的数据库中的出现以及识别蛋白的类型。
特别地,可以配制处理器单元以比较蛋白的预定蛋白氨基酸的序列与这种序列在蛋白的数据库中的出现,并且确定液体中蛋白的类型,其中,用对2-8种,特别地,2-4种类型的预定蛋白氨基酸具有选择性的2-8种,特别地,如仅2-4种类型的氨基酸标记功能化蛋白。因此,可以配置处理器单元,从而在用这些选择性标记物来标记各个蛋白氨基酸(或其总数的至少部分)时,根据仅2-8种,特别地,2-4种类型的标记的氨基酸,即,2-8种,特别地,2-4种类型的不同氨基酸选择性标记物确定蛋白的类型。即使仅2种类型的标记物,例如,对于赖氨酸和半胱氨酸,也可以是足够的。
用在所述方法中的标记物可以用于基于荧光的分析方法,或标记物可以用于基于电子信号的分析方法(参见以下,当更详细地描述纳米孔方法时)。原则上,尽管其他标记物(如金珠粒、量子点以及其他固态纳米颗粒)也可以应用在后一种方法中,但如以上描述的荧光受体还可以应用在纳米孔方法中。因此,在一个实施方式中,标记包括荧光受体,其中,配置为与荧光受体中的一种暂时形成供体受体对的荧光供体被配置在检测区中,并且其中,检测器包括荧光显微镜,其包括全内反射荧光(TIRF)显微镜、共聚焦荧光显微镜、或基于零模式波导的荧光显微镜。因此,特别地,检测器包括荧光显微镜,其包括全内反射荧光(TIRF)显微镜、共聚焦荧光显微镜、或基于零模式波导的荧光显微镜。在一个具体的实施方式中,基于固定的ATP依赖性蛋白酶的分子转运蛋白器包括附接至其的荧光供体。甚至更特别地,同样参见以上,分子转运蛋白器是基于ClpXP的分子转运蛋白器,其中,基于ClpXP的分子转运蛋白器包括ClpP单体以及至少一种突变ClpP单体的不对称ClpP室,其中,至少一种突变ClpP单体不可以与ClpX相互作用,并且其中,该至少一种突变ClpP是标记的荧光供体,或其中,基于ClpXP的分子转运蛋白器由含有1个荧光供体标记物/六聚体的ClpX蛋白组成。如以上提及的,可以应用例如选自花青家族、Alexa家族、Atto家族、Dy家族以及罗丹明家族等中的一种或多种的标记物。
然而,在仍另一种实施方式中,所述方法包括用分子转运蛋白器引导功能化的蛋白通过具有纳米转运侧和相反侧的包括滤波器的纳米孔,其中,检测器包括配置为测量包括滤波器的纳米孔的纳米转运侧和相反侧之间的电参数的检测器单元,并且其中,电参数选自由电位差、电流和电阻组成的组。因此,在进一步的实施方式中,如在本文中描述的装置可以进一步包括具有纳米转运侧和相反侧的包括滤波器的纳米孔,并且其中,检测器被配置为测量包括滤波器的纳米孔的纳米转运侧和相反侧之间的电参数,其中,电参数选自由电位差、电流和电阻组成的组,其中,在装置的使用过程中,装置进一步被配置为引导用标记物功能化的蛋白通过纳米孔。纳米孔的孔可以具有0.1-10nm范围内的直径。滤波器的宽度,即纳米孔的通道长度可以在0.3-10nm的范围内。
代替或除了确定(标记的)氨基酸的顺序,(还)可以确定(标记的)氨基酸之间的时间间隔。从该信息(以及分子转运蛋白器的测序速度),可以确定邻近的(标记的)氨基酸之间的距离。该信息可以(进一步)用于确定蛋白(在液体中)的类型。因此,从传感器信号,还可以确定邻近的标记的AA之间的距离参数。该距离参数还可以应用于进一步确定蛋白(在液体中)的类型。
在本文中,特别地,应用了在纳米精度下用于易位测序底物并且还用于减慢整个易位过程的分子转运系统。几十年来,荧光和纳米孔界一直期待单分子蛋白测序方法。尽管关于分子转运系统和新单分子技术的发展的所有现有文献,但是没有来自所述界的任何人已经提出如同我们的任何类似的设计。例如,在现有技术中,未知或没有提出任何染料标记的ClpXP或其他转运蛋白。
在本文中,本领域技术人员将理解如在“基本上所有发射”中或在“基本上由...组成”中的术语“基本上”。术语“基本上”还可以包括具有“全部”、“完全”、“所有”等的实施方式。因此,在实施方式中,也可以除去形容词基本上。在可应用时,术语“基本上”还可以涉及90%或更高,如95%或更高,特别地,99%或更高,甚至更特别地,99.5%或更高,包括100%。术语“包含”还包括其中术语“包含”意指“由...组成”的实施方式。
此外,说明书和权利要求书中的术语第一、第二、第三等用于相似要素之间的区分,而并不一定用于描述相继顺序或时间顺序。应理解的是,在适当的情况下,如此使用的术语可互换,并且本文中描述的本发明的实施方式能够以不同于本文中描述的或说明的其他顺序操作。
在此,除了其它,还在操作过程中描述了装置或仪器。如本领域技术人员将清楚的是,本发明不限于操作中的操作方法或装置。
应当注意的是,上述实施方式说明而非限制本发明,并且本领域技术人员将能够在不背离所附权利要求的范围的情况下设计许多可替换的实施方式。在权利要求中,置于括号之间的任何参考标记不应被解释为限制该权利要求。动词“包括”及其变形的使用不排除除了权利要求中所述的那些之外的要素或步骤的存在。在要素之前的冠词“一个”或“一种”不排除多个这种要素的存在。本发明可以通过包括几种不同的元件的硬件,并且通过适当编程的计算机实施。在列举了几种方法的装置权利要求中,这些方法中的几种可以通过一种并且相同的硬件项目来体现。互相不同的从属权利要求中引用了某些措施的单纯事实不能表明这些措施的组合不能被有利地使用。
本发明进一步适用于包括描述在说明书中和/或示出在附图中的特性特征中的一种或多种的仪器或装置。本发明进一步关于包括描述在说明书中和/或示出在附图中的特性特征中的一种或多种的方法或工艺。
该专利中所讨论的各个方面可以组合以提供另外的优点。此外,特征中的一些可以形成一个或多个分案申请的基础。
附图说明
现在,将参照其中相应的参考符号指示相应的部件的所附示意性图,仅通过实施例描述本发明的实施方式,并且其中:
图1a-图1b描绘了本发明的原理的一些方面;
图2a-图2b示意性地描绘了基于ATP依赖性蛋白酶的分子转运蛋白(在此是ClpXP)的一个实施方式的一些方面;
图3a-图3c示意性地示出了关于本发明的方法和装置的一些实施方式以及变体;以及
图4a和图4b示出了一些模拟和实验结果。
附图无需按比例。
具体实施方式
图1a示意性地描绘了蛋白,如酶。蛋白用参考符号100表示。蛋白100基本上由氨基酸110的链组成。标记的氨基酸110用参考符号111表示。参考符号L1表示第一标记物并且参考符号L2是指第二标记物(即,分别具有标记L1和L2的氨基酸)。如以上表明的,特别地,可以标记两种氨基酸,如赖氨酸(20个氨基酸中约1个)和半胱氨酸(40个氨基酸中约1个)。如以上表明的,可以仅从例如C(Cys)和K(Lys)残基的顺序识别蛋白。
图1b示出了关于提出的方法的预测能力的计算。预测保真度与测序底物中的C和K残基的数目成比例。当数目大于15,如至少16,特别地,像至少17时,指纹分析变得可靠。超过25时,预测能力是100%。应指出,至少15的数目涉及用不同的标记物所标记的不同氨基酸的数目。因此,6个标记的C氨基酸和12个标记的K氨基酸组成18个标记的氨基酸,其将产生高预测能力。因此,在至少15-25个标记的氨基酸的量级下测量之后,确定可以是结论性的。
图2a示意性地描绘了ClpXP酶200,ClpX(ATP酶)用参考符号210表示并且ClpP(蛋白酶)用参考符号220表示。各个单体分别用参考符号211(ClpX)和221(ClpP)表示。图2b示出了ClpXP的截面图。将Cy5和Cy7标记的测序底物100,即,蛋白100(其具有标记的氨基酸,在此再次用标记物L1和L2标记)向下拉至ClpX 210的窄通道212中。将拉伸的底物移交至其中其被消化成小片段(约7个氨基酸)的ClpP 220。在靠近ClpP出口的Cy3(供体,用参考符号50表示)和ClpP室中的片段上的Cy5以及Cy7之间将存在FRET(参见以下)。
ClpX 210的高度用参考符号H1(约7.5nm)表示;宽度用参考符号d2(约15nm)表示。通道212的通道直径用d1(约1nm)表示。ClpP 220的高度用H2(约9nm)表示;宽度(未注明)同样是约9nm,室223的宽度用直径d3(其是约5nm)表示。
图3a在左边示出了ClpXP酶200固定在表面300(如石英)的一个实施方式。例如,通过用生物素302标记ClpP蛋白(酶)200并且将它们引入在抗生蛋白链菌素层叠的表面(如石英)上,进行固化。抗生蛋白链菌素用参考符号303表示。底物的表面可以用利用参考符号301表示的聚合物如PEG(聚乙二醇)预涂覆。在图3a的左手边示意性地示出了所述过程(用箭头)。PEG可以防止蛋白(ClpXP和测序底物)非特异性吸附至表面。在不存在PEG的情况下,ClpXP可能失去其功能,并且来自测序底物的信号可以非特异性地出现在CCD屏幕上。PEG还可以提供抗生蛋白链菌素结合至其的生物素。
图3b示意性地描绘了用在例如本发明的方法中的基于FRET的(检测)装置。装置用参考符号400表示。参考符号431和432分别表示激光,如分别是532nm激光和633nm激光。参考符号434是反射镜,参考符号433是透射镜(如分色镜)。参考符号433可以由多于一个反射镜组成。参考符号435是反射镜,并且参考符号436是具有例如100mm的焦距的透镜。参考符号440表示TIRF(全内反射荧光)显微镜(参见放大)。参考符号441表示狭缝并且参考符号442表示具有例如100mm的焦距的透镜。参考符号443表示分色镜(特别地,用于供体光束),并且参考符号444表示反射镜(特别地,用于受体光束)。参考符号445又是具有例如150mm的焦距的透镜,参考符号446表示反射镜,并且参考符号447表示检测器,如EM-CCD(电子倍增CCD)。参考符号402表示贝林-布洛卡(Pellin-Broca)棱镜并且参考符号300表示表面(在此是石英板)。相对于描述的图3a,在表面300上存在固定的ClpXP 200。瞬逝场用参考符号401表示。参考符号404表示透明盖,如玻璃盖玻片。参考符号405表示透明介质,如水。参考符号406表示带通滤波器并且参考符号407表示物镜(如60x水,NA 1.2)。参考符号480表示处理器并且参考符号490表示可选库(其可以是远程的,例如具有蛋白的氨基酸序列的互联网数据库)。
图3c示意性地描绘了具有带有纳米孔461的板472的装置1的一个可替换的实施方式。例如,板可以是以下材料:氮化硅(“SiN”)、Si/SiO2、Al2O3、聚合物、石墨烯、BN。在纳米转运蛋白侧472和相反侧471之间测定电信号。在此,检测器440包括配置为测量包括滤波器的纳米孔的纳米转运蛋白侧和相反侧之间的电参数的检测器单元。电参数选自由电位差、电流和电阻组成的组。当蛋白200通过纳米孔461(从相反侧到纳米转运蛋白侧462)时,由于标记物的存在,使得将改变电信号。信号改变将取决于标记物的类型。应指出,在这种情况下,标记物不一定是发光的。进一步地,应指出配置分子转运蛋白器以牵引蛋白100通过纳米孔461。
例如,我们的分析(图4a)表明,给定40-长CK序列,即使当存在许多存在的交换误差(NSE)(即,在扫描过程中C和K的顺序交换)时,预测保真度(PF)也不会显著下降。我们使用点到点匹配算法和Smith-Waterman算法进行该误差分析。
在此,我们提供使用单分子FRET技术的基于ClpXP的扫描方法的证明(图4b)。我们产生了ClpX的人工连接的六聚体形式和其生物素化的C-末端。使用抗生蛋白链菌素-生物素结合,我们将与蛋白酶ClpP复合的该纳米通道蛋白固定在石英表面上。在该样品室中,我们添加了包含K和C残基的肽。用包含NHS酯基的Cy3荧光团标记K残基(图中的绿色球体),并且用包含单马来酰亚胺基的Cy5的荧光团标记C残基(红色球体)。肽包含通过具有高特异性的ClpX识别的ssrA标签。参考符号RN、TN、DN和RE分别表示识别、易位、降解和释放。在图中,y轴上的I表示强度(以任意单位表示),以及x轴上的t是时间(以秒表示)。

Claims (27)

1.一种用于确定包含蛋白的液体中所述蛋白的类型的方法,所述方法包括:
a)用对2种类型的预定蛋白氨基酸具有选择性的至少2种类型的氨基酸标记物功能化蛋白,
b)在液相中,用基于固定的ATP依赖性蛋白酶的分子转运蛋白器引导功能化的所述蛋白通过检测器的检测区,所述检测器配置为检测作为标记的所述氨基酸的所述标记物的函数的信号;
c)从检测的所述信号,确定所述预定蛋白氨基酸的序列;
d)比较所述预定蛋白氨基酸的序列与这种序列在蛋白的数据库中的出现,以及确定所述液体中的蛋白的类型。
2.根据权利要求1所述的方法,其中,所述分子转运蛋白器是选自由ClpXP、ClpAP、ClpCP、ClpEP、ClpYQ、ClpB、Lon、FtsH、archealPAN组成的ATP依赖性蛋白酶的组中的分子转运蛋白器,以及基于蛋白酶体的分子转运蛋白器。
3.根据前述权利要求中任一项所述的方法,其中,所述分子转运蛋白器是基于ClpXP的分子转运蛋白器。
4.根据权利要求1或2所述的方法,其中,仅标记半胱氨酸和赖氨酸。
5.根据权利要求1或2所述的方法,其中,所述分子转运蛋白器包括配置为探测氨基酸标记物的供体。
6.根据权利要求1或2所述的方法,其中,所述标记物包括荧光受体,其中,配置为与所述荧光受体中的一种暂时形成供体受体对的荧光供体配置在所述检测区内,并且其中,所述检测器包括荧光显微镜,所述荧光显微镜包括全内反射荧光显微镜、共聚焦荧光显微镜或基于零模式波导的荧光显微镜;并且其中,所述标记物包括选自花青家族、Alexa家族、Atto家族、Dy家族和罗丹明家族中的一种或多种的有机荧光团。
7.根据权利要求6所述的方法,其中,所述分子转运蛋白器是基于ClpXP的分子转运蛋白器。
8.根据权利要求7所述的方法,其中,所述基于ClpXP的分子转运蛋白器包括ClpP单体和至少一种突变ClpP单体的不对称ClpP室,其中,至少一种突变ClpP单体不能对接至ClpX,并且其中,该至少一种突变ClpP被荧光供体标记。
9.根据权利要求7所述的方法,其中,所述基于ClpXP的分子转运蛋白器包括与未标记的ClpP蛋白复合的荧光供体标记的ClpX。
10.根据权利要求1或2所述的方法,其中,所述方法包括用所述分子转运蛋白器引导功能化的所述蛋白通过具有纳米转运侧和相反侧的包括滤波器的纳米孔,其中,所述检测器包括配置为测量所述包括滤波器的纳米孔的所述纳米转运侧和所述相反侧之间的电参数的检测器单元,并且其中,所述电参数选自由电位差、电流和电阻组成的组。
11.根据权利要求1或2所述的方法,进一步包括用通过所述分子转运蛋白器可识别的标签标记所述蛋白。
12.根据权利要求1或2所述的方法,其中,利用所述基于固定的ATP依赖性蛋白酶的分子转运蛋白器,使功能化的所述蛋白以一定的易位速度易位通过所述检测器的所述检测区,其中,所述易位速度选自0.1-60个氨基酸/秒的范围。
13.根据权利要求12所述的方法,其中,通过控制所述液体中的ATP浓度控制所述易位速度。
14.根据权利要求1或2所述的方法,包括检测待识别的所述蛋白中至少15个所述预定蛋白氨基酸的存在。
15.根据权利要求1或2所述的方法,其中,所述数据库是远程数据库。
16.根据权利要求1或2所述的方法,包括用对2-4种类型的预定蛋白氨基酸具有选择性的2-4种类型的氨基酸标记物功能化所述蛋白。
17.根据权利要求1或2所述的方法,包括检测待识别的所述蛋白中至少17个所述预定蛋白氨基酸的存在。
18.一种用于确定液体中蛋白的类型的装置,所述装置包括:
a)基于固定的ATP依赖性蛋白酶的分子转运蛋白器,配置为引导用对至少2种类型的预定蛋白氨基酸具有选择性的氨基酸标记物功能化的蛋白通过检测器的检测区,
b)所述检测器,配置为检测作为标记的所述氨基酸的所述标记物的函数的信号,
c)处理器单元,配置为从所述检测器的信号识别功能化的所述蛋白的氨基酸的序列,其中,所述处理器单元进一步被配置为比较识别的所述氨基酸的序列与这种序列在蛋白的数据库中的出现以及识别蛋白的类型。
19.根据权利要求18所述的装置,其中,所述分子转运蛋白器是选自由ClpXP、ClpAP、ClpCP、ClpEP、ClpYQ、ClpB、Lon、FtsH、archealPAN组成的ATP依赖性蛋白酶的组中的分子转运蛋白器,以及基于蛋白酶体的分子转运蛋白器。
20.根据权利要求18-19中任一项所述的装置,其中,所述分子转运蛋白器是基于ClpXP的分子转运蛋白器。
21.根据权利要求18-19中任一项所述的装置,其中,所述检测器包括荧光显微镜,所述荧光显微镜包括全内反射荧光显微镜、共聚焦荧光显微镜或基于零模式波导的荧光显微镜。
22.根据权利要求18-19中任一项所述的装置,其中,所述基于固定的ATP依赖性蛋白酶的分子转运蛋白器包括附接至其的荧光供体。
23.根据权利要求18-19中任一项所述的装置,其中,所述分子转运蛋白器是基于ClpXP的分子转运蛋白器,其中,所述基于ClpXP的分子转运蛋白器包括ClpP单体和至少一种突变ClpP单体的不对称ClpP室,其中,所述至少一种突变ClpP单体不能对接至ClpX,并且其中,该至少一种突变ClpP被荧光供体标记。
24.根据权利要求18-19中任一项所述的装置,其中,所述分子转运蛋白器是基于ClpXP的分子转运蛋白器,其中,所述基于ClpXP的分子转运蛋白器包括与ClpP蛋白复合的荧光供体标记的ClpX。
25.根据权利要求18-19中任一项所述的装置,其中,所述装置进一步包括具有纳米转运侧和相反侧的包括滤波器的纳米孔,并且其中,所述检测器配置为测量所述包括滤波器的纳米孔的所述纳米转运侧和所述相反侧之间的电参数,其中,所述电参数选自由电位差、电流和电阻组成的组,其中,所述装置进一步配置为在所述装置的使用过程中,引导用标记功能化的所述蛋白通过所述纳米孔。
26.根据权利要求18-19中任一项所述的装置,其中,基于固定的ATP依赖性蛋白酶的分子转运蛋白器配置为引导用对2-4种类型的预定蛋白氨基酸具有选择性的氨基酸标记物功能化的蛋白通过检测器的检测区。
27.根据权利要求18-19中任一项所述的装置,其中,所述检测器配置为比较所述蛋白的所述预定蛋白氨基酸的序列与这种序列在蛋白的数据库中的出现以及确定所述液体中蛋白的类型,其中,仅用对2-4种类型的预定蛋白氨基酸具有选择性的2-4种类型的氨基酸标记物功能化所述蛋白。
CN201380048170.0A 2012-07-16 2013-07-15 单分子蛋白测序 Expired - Fee Related CN104685361B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
NL2009191A NL2009191C2 (en) 2012-07-16 2012-07-16 Single molecule protein sequencing.
NL2009191 2012-07-16
PCT/NL2013/050537 WO2014014347A1 (en) 2012-07-16 2013-07-15 Single molecule protein sequencing

Publications (2)

Publication Number Publication Date
CN104685361A CN104685361A (zh) 2015-06-03
CN104685361B true CN104685361B (zh) 2017-05-10

Family

ID=49151279

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380048170.0A Expired - Fee Related CN104685361B (zh) 2012-07-16 2013-07-15 单分子蛋白测序

Country Status (8)

Country Link
US (1) US20150185199A1 (zh)
EP (1) EP2872898B1 (zh)
JP (1) JP2015524561A (zh)
CN (1) CN104685361B (zh)
CA (1) CA2879288A1 (zh)
ES (1) ES2613745T3 (zh)
NL (1) NL2009191C2 (zh)
WO (1) WO2014014347A1 (zh)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11435358B2 (en) 2011-06-23 2022-09-06 Board Of Regents, The University Of Texas System Single molecule peptide sequencing
US9625469B2 (en) 2011-06-23 2017-04-18 Board Of Regents, The University Of Texas System Identifying peptides at the single molecule level
GB201316849D0 (en) 2013-09-23 2013-11-06 Isis Innovation Method
US20170227520A1 (en) * 2014-07-25 2017-08-10 Mikhail Shchepinov Single Molecule Proteomics
US10545153B2 (en) * 2014-09-15 2020-01-28 Board Of Regents, The University Of Texas System Single molecule peptide sequencing
AU2017259794B2 (en) 2016-05-02 2023-04-13 Encodia, Inc. Macromolecule analysis employing nucleic acid encoding
EP4365597A2 (en) 2016-12-01 2024-05-08 Nautilus Subsidiary, Inc. Methods of assaying proteins
JP6991504B2 (ja) * 2017-07-13 2022-01-12 国立研究開発法人産業技術総合研究所 目的物質検出装置及び目的物質検出方法
WO2019036055A2 (en) 2017-08-18 2019-02-21 Ignite Biosciences, Inc. METHODS OF SELECTING BINDING REAGENTS
KR102556494B1 (ko) 2017-10-31 2023-07-18 엔코디아, 인코포레이티드 핵산 암호화 및/또는 표지를 이용한 분석용 키트
WO2019195633A1 (en) 2018-04-04 2019-10-10 Ignite Biosciences, Inc. Methods of generating nanoarrays and microarrays
US10720993B2 (en) 2018-05-11 2020-07-21 Government Of The United States Of America, As Represented By The Secretary Of Commerce Metasurface optical pulse shaper for shaping an optical pulse in a temporal domain
TW202032125A (zh) 2018-11-15 2020-09-01 美商寬騰矽公司 用於蛋白質定序之方法及組合物
EP3696548A1 (en) 2019-02-14 2020-08-19 Nederlandse Organisatie voor toegepast- natuurwetenschappelijk onderzoek TNO Method for determining a peptide fingerprint of a target protein
CN114072499A (zh) 2019-04-30 2022-02-18 Encodia 公司 用于制备分析物的方法和相关试剂盒
CN112147185B (zh) * 2019-06-29 2022-07-01 清华大学 一种控制多肽穿过纳米孔速度的方法及其应用
CA3159560A1 (en) * 2019-10-28 2021-05-06 Quantum-Si Incorporated Methods of single-cell protein and nucleic acid sequencing
CN112480204A (zh) * 2020-04-13 2021-03-12 南京大学 一种采用Aerolysin纳米孔道的蛋白质/多肽测序方法
NL2030638B1 (en) 2022-01-21 2023-08-03 Univ Delft Tech Method for measuring a protein
WO2023140732A1 (en) 2022-01-21 2023-07-27 Technische Universiteit Delft Method for measuring a linearized protein, a 2d material membrane, a nanopore device comprising the 2d material membrane, a system comprising the nanopore device, and a production method for providing the 2d material membrane

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1860370A (zh) * 2003-10-29 2006-11-08 英特尔公司 表征分析物的方法和设备
DE102006049682A1 (de) * 2006-10-12 2008-04-17 Nölting, Bengt, Dipl.-Phys. Dr. Einzelmolekül-Protein-Sequenzierung
CN102169086A (zh) * 2010-12-31 2011-08-31 清华大学 用于单分子检测的分子载体
WO2012033524A2 (en) * 2010-09-07 2012-03-15 The Regents Of The University Of California Control of dna movement in a nanopore at one nucleotide precision by a processive enzyme

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1149909A1 (en) * 2000-04-28 2001-10-31 Boehringer Mannheim Gmbh Methods for regulating protein conformation using molecular chaperones
CA2434469A1 (en) * 2001-01-12 2002-07-18 Syngenta Participations Ag Thin film electrophoresis apparatus and method
US7744816B2 (en) * 2002-05-01 2010-06-29 Intel Corporation Methods and device for biomolecule characterization
US20060014212A1 (en) * 2002-05-10 2006-01-19 Epitome Biosystems, Inc. Proteome epitope tags and methods of use thereof in protein modification analysis
WO2004046164A2 (en) * 2002-05-10 2004-06-03 Engeneos, Inc. Unique recognition sequences and methods of use thereof in protein analysis
US20040197793A1 (en) * 2002-08-30 2004-10-07 Arjang Hassibi Methods and apparatus for biomolecule detection, identification, quantification and/or sequencing
DE102005013608A1 (de) * 2005-03-24 2006-09-28 Westfälische Wilhelms-Universität Münster Vorrichtung und Verfahren für die zellfreie analytische und präparative Proteinsynthese
WO2010065531A1 (en) 2008-12-01 2010-06-10 Robi David Mitra Single molecule protein screening
US8609421B2 (en) 2009-06-12 2013-12-17 Pacific Biosciences Of California, Inc. Single-molecule real-time analysis of protein synthesis
EP2483680A4 (en) * 2009-09-30 2014-01-01 Quantapore Inc ULTRASOUND SEQUENCING OF BIOLOGICAL POLYMERS WITH THE HELP OF A MARKED NANOPORE

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1860370A (zh) * 2003-10-29 2006-11-08 英特尔公司 表征分析物的方法和设备
DE102006049682A1 (de) * 2006-10-12 2008-04-17 Nölting, Bengt, Dipl.-Phys. Dr. Einzelmolekül-Protein-Sequenzierung
WO2012033524A2 (en) * 2010-09-07 2012-03-15 The Regents Of The University Of California Control of dna movement in a nanopore at one nucleotide precision by a processive enzyme
CN102169086A (zh) * 2010-12-31 2011-08-31 清华大学 用于单分子检测的分子载体

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
ClpX(P) generates mechanical force to unfold and translocate its protein substrates.;Rodrigo A. Maillard等;《Cell》;20110429;第145卷;摘要,第467页左侧栏 *
Optimal efficiency of ClpAP and ClpXP chaperone-proteases is achieved by architectual symmetry.;Zeljka Maglica等;《Structure》;20090415;第17卷;图1、4B、4C,第512页左侧栏,第515页右侧栏第1段 *
Protein unfolding by a AAA+ protease is dependent on ATP-hydrolysis rates and substrate energy landscapes.;Andreas Martin等;《Nature Structural & Molecular Biology》;20080229;第15卷(第12期);摘要 *
Single-molecule denaturation and degradation of proteins by the AAA+ ClpXP protease.;Yongdae Shin等;《PNAS》;20091117;第106卷(第46期);摘要,图1 *
Sing-molecule protein unfolding and translocation by an ATP-fueled proteolytic machine.;Marie-Eve Aubin-Tam等;《Cell》;20110415;第145卷;摘要 *
Studying chaperone–proteases using a real-time approach based on FRET.;Kristina Kolygo等;《Journal of Structural Biology》;20090708;第168卷;图1b,第267页右侧栏-第268页左侧栏第4段,第275页右侧栏最后两段 *
Unfoldase-mediated protein translocation through an α-hemolysin nanopore.;Jeff Nivala等;《Nature Biotechnology》;20130203;第31卷(第3期);摘要,图1,图2,第250页左侧栏 *

Also Published As

Publication number Publication date
CA2879288A1 (en) 2014-01-23
US20150185199A1 (en) 2015-07-02
JP2015524561A (ja) 2015-08-24
ES2613745T3 (es) 2017-05-25
WO2014014347A1 (en) 2014-01-23
EP2872898B1 (en) 2016-12-07
EP2872898A1 (en) 2015-05-20
NL2009191C2 (en) 2014-01-20
CN104685361A (zh) 2015-06-03

Similar Documents

Publication Publication Date Title
CN104685361B (zh) 单分子蛋白测序
Joo et al. Single-molecule FRET with total internal reflection microscopy
CN104703700B (zh) 用于核酸测序的方法和试剂盒
US8273530B2 (en) Method for simultaneous analysis of multiple biological reactions or changes in in vivo conditions
CN109072297A (zh) 使用增强的核苷酸特异性三元复合物形成检测的核酸测序方法和系统
US9012150B2 (en) Methods for evaluating ribonucleotide sequences
Xu et al. A multicoloured Au NCs based cross-reactive sensor array for discrimination of multiple proteins
WO2009056831A1 (en) Polymerase-based single-molecule sequencing
US20020168692A1 (en) Biosensor detector array
US20220170088A1 (en) Mixed optical signals in polymer analysis with nanopores
Severin et al. A high throughput molecular force assay for protein–DNA interactions
EP2224241A1 (en) Carrier for use in measurement of analyte, and method for production thereof
Liu et al. Using time-shared scanning optical tweezers assisted two-photon fluorescence imaging to establish a versatile CRISPR/Cas12a-mediated biosensor
Green et al. Polyhistidine-tag-enabled conjugation of quantum dots and enzymes to DNA nanostructures
Hira et al. Detection of target ssDNA using a microfabricated Hall magnetometer with correlated optical readout
Cheng et al. Progress toward the application of molecular force spectroscopy to DNA sequencing
JP2007178439A (ja) 生化学反応体の検出方法とバイオチップ
Xu et al. Interactions of antifouling monolayers: Energy transfer from excited albumin molecule to phenol red dye
Joshi et al. iMAX FRET (Information Maximized FRET) for multipoint single-molecule structural analysis
Enderlein Recent advances in single molecule fluorescence spectroscopy
Weilbaecher et al. Development of a novel nanomaterial-based optical platform for a protease biosensor
Ploetz et al. Fluorescence resonance energy transfer and protein-induced fluorescence enhancement as synergetic multi-scale molecular rulers
Shiffler Binding Kinetics of FlAsH and AsCy3 to Tetra-Cysteine Peptides

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170510

Termination date: 20180715

CF01 Termination of patent right due to non-payment of annual fee