CN107002110A - 用具有改善的合成水解比的枯草杆菌蛋白酶变体的肽片段缩合和环化 - Google Patents

用具有改善的合成水解比的枯草杆菌蛋白酶变体的肽片段缩合和环化 Download PDF

Info

Publication number
CN107002110A
CN107002110A CN201580067787.6A CN201580067787A CN107002110A CN 107002110 A CN107002110 A CN 107002110A CN 201580067787 A CN201580067787 A CN 201580067787A CN 107002110 A CN107002110 A CN 107002110A
Authority
CN
China
Prior art keywords
mutation
enzyme
amino acid
peptide
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201580067787.6A
Other languages
English (en)
Inventor
P·J·L·M·夸德弗雷格
T·纽珍斯
J·M·范德兰
D·B·简森
A·托普拉克
吴边
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Enzypep BV
Original Assignee
Enzypep BV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Enzypep BV filed Critical Enzypep BV
Publication of CN107002110A publication Critical patent/CN107002110A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K1/00General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
    • C07K1/02General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length in solution
    • C07K1/026General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length in solution by fragment condensation in solution
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K1/00General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
    • C07K1/14Extraction; Separation; Purification
    • C07K1/36Extraction; Separation; Purification by a combination of two or more processes of different types
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/52Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from bacteria or Archaea
    • C12N9/54Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from bacteria or Archaea bacteria being Bacillus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y304/00Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
    • C12Y304/21Serine endopeptidases (3.4.21)
    • C12Y304/21062Subtilisin (3.4.21.62)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明涉及一种酶促合成(寡)肽的方法,包括偶联(a)(寡)肽C‑末端酯或硫酯和(b)具有N‑末端未保护的胺的(寡)肽亲核基团,其中在包含水的流体中进行偶联,并且其中通过枯草杆菌蛋白酶BPN’变体或其同源物催化偶联,其与SEQUENCE ID NO:2所述的枯草杆菌蛋白酶BPN’或其同源序列相比包括以下突变:对应于75‑83位的氨基酸缺失;对应于S221的氨基酸位置处的突变,该突变是S221C或S221硒代半胱氨酸;优选对应于P225的氨基酸位置处的突变,其中按照SEQUENCE ID NO:2所示的枯草杆菌蛋白酶BPN’的序列定义氨基酸位置。另外,本发明涉及适于用作本发明方法中的催化剂的酶。

Description

用具有改善的合成水解比的枯草杆菌蛋白酶变体的肽片段缩 合和环化
本发明涉及酶促合成(寡)肽(即,一种肽,尤其是寡肽)的方法,涉及适于催化所述合成的酶,涉及能够功能性表达所述酶的宿主细胞,并涉及制备所述酶的方法。
肽,尤其是寡肽具有许多应用,例如,作为药物、食物或饲料成分,或美容成分。
本领域通常已知合成(寡)肽的方法。
寡肽可在固相上通过高度优化的过程或在溶液中以逐步方式化学合成。然而,由于副反应并且由此的纯化存在麻烦,通常非常难以合成长于10-15个氨基酸的肽。因此,通常通过组合侧链保护的寡肽片段的固相合成(其随后在溶液中化学缩合,例如,以10+10缩合以制备20个氨基酸的寡肽)来合成长于10个氨基酸的肽。化学侧链保护的寡肽片段缩合的主要缺点在于在酰基供体的C-末端C-末端氨基酸侧链活化之后,发生外消旋化。相反,酶催化的肽偶联完全避免外消旋并且具有相比化学肽合成的几大其他优势,如侧链官能团上没有副反应。对于工业应用,基于动态方法的酶促肽合成概念,即,使用酰基供体C-末端酯是最有吸引力的(参见例如N.Sewald和H.-D.Jakubke,于《肽:化学和生物学》(“Peptides:Chemistry and Biology”),第一次重印,Wiley-VCH Verlag GmbH编,Weinheim 2002)。
化学-酶促肽合成可能需要寡肽片段的酶促偶联,其已经使用化学合成、发酵或通过化学和酶促偶联步骤的组合单独合成。一些报道已经公开了在水溶液中酶促缩合寡肽片段(Kumaran等,Protein Science,2000,9,734;等,Bioorg.Med.Chem.1998,6,891;Homandberg等,Biochemistry,1981,21,3387;Komoriya等,Int.J.Pep.Prot.Res.1980,16,433)。然而,这种水溶液中酶促寡肽片段缩合的主要缺点在于发生寡肽片段内的肽键和C-末端C-末端酯官能团的同时水解,导致低产率和许多副产物。
蛋白酶迄今为止主要通过商业生产用于水解应用,例如,用于清洁,其中由蛋白酶水解肽键。典型的示例是枯草杆菌蛋白酶,其形成对于其作为去污剂的应用而言相当重要的酶类型。因此,枯草杆菌蛋白酶已经是多种蛋白质工程改造研究的对象。枯草杆菌蛋白酶已经用于寡肽合成,然而,其几乎总是伴随着明显程度的水解副反应。Wells等(US 5,403,737)发现水溶液中寡肽的缩合可能受到改变枯草杆菌蛋白酶BPN’的活性位点的显著影响,其是来自解淀粉芽孢杆菌(B.amyloliquefaciens)的枯草杆菌蛋白酶(SEQUENCE ID NO:2)。当引入两个突变,即S221C和P225A时,获得与野生型枯草杆菌蛋白酶BPN’相比合成水解比(S/H比)增加500倍的称为枯草杆菌蛋白酶BPN’变体的枯草杆菌连接酶(subtiligase)。然而,平均连接产率为约66%,并且寡肽酰基供体C-末端C-末端酯的水解仍然是显著的(Wells等,Science,1994,266,243)。最通常的,使用10当量的寡肽酰基供体C-末端C-末端酯来获得良好的反应产率。枯草杆菌酶的另一个缺点是对溶解寡肽片段所需的有机共溶剂、对升高的温度和对变性剂的弱稳定性,成功寡肽缩合通常都需要这些。因此,Wells等向枯草杆菌肽添加了5个额外突变,即,M50F、N76D、N109S、K213R和N218S来使酶更稳定(Proc.Natl.Acad.Sci.USA,1994,91,12544)。称为稳定连接酶(stabiligase)的新突变体似乎对十二烷基硫酸钠和盐酸胍有适度的更强抗性,但是水解仍然是主要副反应。例如,使用稳定连接酶将寡肽羧基酰氨基甲基-酯(Cam-酯)连接至寡肽胺的产率为44%。在该示例中,使用10当量的寡肽C-末端C-末端酯并且因此,9.56当量的寡肽C-末端C-末端酯在C-末端C-末端酯官能团处水解并且仅0.44当量连接至寡肽胺以形成产物。很明显,需要具有高S/H比的改进酶使寡肽缩合反应变成经济上可行的过程。可能出于这一原因,在过去的20年,枯草杆菌连接酶或稳定连接酶已经在工业上应用至发明人知识的极限。
枯草杆菌蛋白酶BPN’已得到注意的另一个方面是酶在较高温度下和/或在金属螯合剂存在下用作去污剂(即,用于肽键水解)的稳定性。这种研究的一个典型示例被Bryan等公开,其工程改造缺少高亲和性Ca2+结合位点的枯草杆菌蛋白酶BPN’变体(WO02/22796)。枯草杆菌蛋白酶BPN’中的高亲和性Ca2+结合位点由包含氨基酸74-82以及氨基酸Gln2(Q2)和Asp41(D41)的环组成。比较枯草杆菌蛋白酶BPN’的3D结构和同源枯草杆菌蛋白酶的结构显示高亲和性Ca2+结合位点是高度保守的。在已知枯草杆菌蛋白酶中,这种结合位点对于其稳定性而言是重要的。由例如金属螯合剂反萃取Ca2+离子导致解折叠和由此的已知枯草杆菌蛋白酶的失活。当Bryan等删除了枯草杆菌蛋白酶BPN’的氨基酸75-83(Δ75-83)并且额外进行突变Q2K、S3C、P5S、S9A、I31L、K43N、M50F、A73L、E156S、G166S、G169A、S188P、Q206C、N212G、Y217L、N218S、T254A和Q271E时,获得了枯草杆菌蛋白酶BPN’变体(称为BS149,也称为Sbt149),其缺少Ca2+结合结构域并且对金属螯合剂具有极大改善的稳定性(1000倍)。然而,这种酶无法用于在水溶液中的肽片段缩合,因为其仅有水解活性。
本发明的目的是提供一种通过缩合第一和第二(寡)肽片段或通过环化(寡)肽来制备(寡)肽的酶促方法,其可用作制备(寡)肽的已知方法的替代。一般需要替代性方法,尤其是为了扩宽用于制备特异性(寡)肽的工具范围。
具体地,一个目的是提供用于通过缩合第一和第二(寡)肽片段或通过环化(寡)肽来制备(寡)肽的酶促方法,其中使用至少在某些反应条件下具有与枯草杆菌蛋白酶BPN’相比改善的S/H比和稳定性的酶。
另外,一个目的是提供用于通过缩合第一和第二(寡)肽片段或通过环化(寡)肽来制备(寡)肽的酶促方法,其中使用至少在某些反应条件下具有与枯草杆菌连接酶相比改善的稳定性和S/H比的酶。
本发明的另一个目的是提供(寡)肽与蛋白质的偶联。提供允许肽与蛋白质偶联的酶促方法尤其是一种挑战,特别是由于蛋白质的三维结构的额外复杂性。
另一个目的是提供能够催化2个(寡)肽的缩合或(寡)肽环化的新型枯草杆菌蛋白酶BPN’变体,尤其是这种酶具有改善的性质,如在某些反应条件下,与适于催化这种缩合的已知酶,如枯草杆菌蛋白酶BPN’和/或枯草杆菌连接酶相比改善的合成水解比和/或改善的稳定性。
可以成为本发明的目的的一个或多个其他目的在以下说明中。
现在已经惊讶地发现可能提供一种枯草杆菌蛋白酶BPN’变体,其中在对应于氨基酸75-83的位置处的钙结合结构域已经通过删除失活,其对于两个(寡)肽片段的缩合或肽环化有催化活性,并且具体提供与枯草杆菌蛋白酶BPN’和/或枯草杆菌连接酶相比有改善的S/H比的变体,通过提供具有除了删除对应于75-83的氨基酸以外的特定突变(优选是突变的特定组合)的枯草杆菌BPN’变体。
因此,本发明涉及酶促合成(寡)肽的方法,包括偶联(a)(寡)肽C-末端C-末端酯或硫酯和(b)具有N-末端去保护的胺的(寡)肽亲核基团,
其中在包含水的流体中进行该偶联,并且
其中由枯草杆菌蛋白酶BPN’变体或其同源物催化该偶联,其与SEQUENCE ID NO:2所示的枯草杆菌蛋白酶BPN’或其同源序列相比包含以下突变:
i)删除对应于75-83位的氨基酸;
ii)在对应于S221的氨基酸位置处的突变,该突变是S221C或S221硒代半胱氨酸(S221U);
iii)优选地,在对应于P225的氨基酸位置处的突变;
其中按照SEQUENCE ID NO:2所示的枯草杆菌蛋白酶BPN’的序列定义氨基酸位置。
另外,本发明涉及酶促合成至少12个氨基酸的环状(寡)肽的方法,包括使具有N-末端去保护的胺的(寡)肽C-末端C-末端酯或硫酯经过环化步骤,其中在包含水的流体中进行所述环化,并且
其中由枯草杆菌蛋白酶BPN’变体或其同源物催化该环化,其与SEQUENCE ID NO:2所示的枯草杆菌蛋白酶BPN’或其同源序列相比包含以下突变:
i)删除对应于75-83位的氨基酸;
ii)在对应于S221的氨基酸位置处的突变,该突变是S221C或S221硒代半胱氨酸;
iii)优选地,在对应于P225的氨基酸位置处的突变;
其中按照SEQUENCE ID NO:2所示的枯草杆菌蛋白酶BPN’的序列定义氨基酸位置。
另外,本发明涉及酶,该酶是枯草杆菌蛋白酶BPN’变体或其同源物,与SEQUENCEID NO:2所示的枯草杆菌蛋白酶BPN’或其同源序列相比包含以下突变:
i)删除对应于75-83位的氨基酸;
ii)在对应于S221的氨基酸位置处的突变,该突变是S221C或S221硒代半胱氨酸;
iii)在对应于P225的氨基酸位置处的突变;
其中按照SEQUENCE ID NO:2所示的枯草杆菌蛋白酶BPN’的序列定义氨基酸位置。
另外,本发明涉及用于制备本发明的酶的重组方法,所述方法包括:
a)提供在功能上表达编码所述酶的基因的重组宿主细胞;
b)在提供功能上活性的酶进行表达的条件下培养所述宿主细胞;并且
c)从所述微生物宿主中回收表达的酶。
另外,本发明涉及包含编码本发明的酶的序列的重组多核苷酸。
另外,本发明涉及包含本发明的多核苷酸的宿主细胞。该宿主细胞能够功能性表达本发明的酶。
另外,本发明涉及本发明的酶作为催化剂的用途。这类用途一般包括在酶催化底物参与的化学反应的条件下,在酶存在下接触一种或多种底物(反应物)。该酶已经发现可特别用作肽合成中的催化剂。具体预期本发明的酶可用于催化已知枯草杆菌蛋白酶有催化活性的反应。在一个实施方式中,合成的肽是蛋白质。在一个实施方式中,合成的肽是寡肽。在另一个实施方式中,合成的肽包含至少201个氨基酸单元。
本发明提供制备(寡)肽,包括(寡)肽延伸的蛋白质的已知方法的有用替代。
此外,已经惊讶地发现本发明的方法可在包含水的液体中以高合成水解比酶促缩合2个(寡)肽片段或环化(寡)肽。本发明的方法的优势在于其提供了在没有明显水解副反应的情况下以高产率在水溶液中偶联各种寡肽片段的可能性。这种惊人的发现示于实施例,其显示本发明的方法不仅适于合成缺少二级和三级蛋白质结构的(寡)肽,也能够偶联2个肽片段,其中片段中的至少一个是蛋白质,从而合成具有氨基酸单元的额外序列的(延长的)蛋白质。也发现可能合成这种蛋白质同时保持蛋白质的二级和三级结构。
出于本发明的目的,“合成水解比”(S/H比)表示酶促合成(寡)肽产物的量除以酯或硫酯基团已经水解的(寡)肽C-末端C-末端酯或硫酯的量。
本发明的酶的S/H比值取决于多种因素,例如,底物性质((寡)肽亲核基团的氨基酸序列和(寡)肽C-末端C-末端酯或硫酯的氨基酸序列)和反应条件(例如,温度、pH、肽片段浓度、酶浓度)。如实施例中所示,已经发现在各种反应条件下和多余各种底物,S/H比高于已知枯草杆菌蛋白酶,如枯草杆菌连接酶和枯草杆菌蛋白酶BPN’。因此,预期在相同反应条件下并使用相同底物测试时,一般本发明的酶的S/H比具有比枯草杆菌连接酶和枯草杆菌蛋白酶BPN’明显更高的S/H比,并且具体地,预期本发明的酶在实施例1或一个或多个其他实施例中使用的条件(100mM磷酸盐缓冲液,pH 8.0,温度约20℃,(寡)肽C-末端C-末端酯的浓度0.83mM,(寡)肽亲核基团的浓度3.33mM,酶浓度5.5mg/L)下具有明显较高的S/H比。因此,具体地,本发明涉及枯草杆菌蛋白酶BPN’变体或其同源物,其中至少在实施例1或一个或多个其他实施例中所述的条件下,枯草杆菌蛋白酶BPN’变体或其同源物的S/H比除以枯草杆菌连接酶的S/H比大于1,优选2或更大,尤其是5或更大。该商的上限不是关键的;实际上,其可以是,例如,100或更小,尤其是20或更小。
至少在实施例1或一个或多个其他实施例中所述的条件下,枯草杆菌蛋白酶BPN’变体或其同源物的S/H比除以枯草杆菌蛋白酶BPN’的S/H比通常大于100,优选250或更大,更优选500或更大,尤其是1000或更大。该商的上限不是关键的;在至少本文所示的反应条件下,枯草杆菌蛋白酶BPN’的S/H比一般非常低,其甚至可以是0(没有可检测的合成)。因此,本发明的枯草杆菌蛋白酶BPN’变体或其同源物的S/H比除以枯草杆菌蛋白酶BPN’的S/H比可能大约是无限的。在枯草杆菌蛋白酶BPN’具有明显的连接酶或环化酶活性的潜在情况中,发明人认为本发明的枯草杆菌蛋白酶BPN’变体或其同源物的S/H比除以枯草杆菌蛋白酶BPN’的S/H比也很高,例如,高至100000,尤其是高至25000,更尤其是高至10000。
另外,使用本发明的方法,非常易于从反应混合物中纯化(寡)肽产物,因为仅形成非常少的水解副产物。
本发明的另一个优势在于,由于改善的S/H比,需要少量或不过量的(寡)肽C-末端C-末端酯或硫酯或(寡)肽亲核基团来达到缩合反应中的高产率(超过80%)。因此,在优选的实施方式中,(寡)肽C-末端C-末端酯或硫酯和(寡)肽亲核基团以少量过量或约化学剂量比与所述(寡)肽片段接触,虽然也可使用一个相比另一个更大的过量,如下所述。
如实施例所示,本发明的酶的优势还在于其能够以比枯草杆菌连接酶明显更高的产率合成环状(寡)肽(78%对比枯草杆菌连接酶的61%)。环状(寡)肽是一种特别感兴趣类别的肽,因为他们通常由于更受限制的三维结构和对蛋白水解的更高抗性而更强效。
附图说明
图1A和1B分别显示了与枯草杆菌连接酶相比,本发明的不同酶的酶活性S/H比;对于BS149-DM而言,M222、Y104、I107和/或L135上的全部所示突变是附加的。名称“BS149-DM”在本文中用于枯草杆菌蛋白酶BPN’变体,其与枯草杆菌蛋白酶BPN’(SEQUENCE ID NO 2)相比具有以下突变:删除氨基酸75-83(Δ75-83),S221C、P225A、Y217L、Q2K、S3C、P5S、S9A、I31L、K43N、M50F、A73L、E156S、G166S、G169A、S188P、Q206C、N212G、N218S、T254A和Q271E。
图2A和2B分别显示了不同BS149-DM+M222P+L217突变体的活性S/H比;对于BS149-DM+M222P而言,L217上的全部所示突变是附加的。
图3A:BS149-DM和BS149-DM+Y104突变体的P4袋特异性。
图3B:BS149-DM和BS149-DM+I107突变体的P4袋特异性。
图3C:BS149-DM和BS149-DM+L135突变体的P4袋特异性。
图4A:BS149-DM和BS149-DM+M222A,M222E和M222Q突变体的P1’袋特异性。
图4B:BS149-DM和BS149-DM+M222A,M222E和M222Q突变体的P2’袋特异性。
图4C:BS149-DM和BS149-DM+M222G,M222N和M222P突变体的P1’袋特异性。
图4D:BS149-DM和BS149-DM+M222G,M222N和M222P突变体的P2’袋特异性。
图5A:BS149-DM+M222P+L217N,L217T和L217E突变体的P1’袋特异性。
图5B:BS149-DM+M222P+L217N,L217T和L217E突变体的P2’袋特异性。
图5C:BS149-DM+M222P+L217I,L217V和L217A突变体的P1’袋特异性。
图5D:BS149-DM+M222P+L217I,L217V和L217A突变体的P2’袋特异性。
图5E:BS149-DM+M222P+L217M,L217K和L217Q突变体的P1’袋特异性。
图5F:BS149-DM+M222P+L217M,L217K和L217Q突变体的P2’袋特异性。
图5G:BS149-DM+M222P+L217S,L217G和L217Y突变体的P1’袋特异性。
图5H:BS149-DM+M222P+L217S,L217G和L217Y突变体的P2’袋特异性。
图5I:BS149-DM+M222P+L217F,L217H和L217W突变体的P1’袋特异性。
图5J:BS149-DM+M222P+L217F,L217H和L217W突变体的P2’袋特异性。
图5K:BS149-DM+M222P+L217R,L217C,L217D和L217P突变体的P1’袋特异性。
图5L:BS149-DM+M222P+L217R,L217C,L217D和L217P突变体的P2’袋特异性。
图6A:BS149-DM+M222G+L217N,L217T和L217E突变体的P1’袋底物特异性。
图6B:BS149-DM+M222G+L217I,L217V和L217A突变体的P1’袋底物特异性。
图6C:BS149-DM+M222G+L217M,L217K和L217Q突变体的P1’袋底物特异性。
图6D:BS149-DM+M222G+L217S,L217G和L217Y突变体的P1’袋底物特异性。
图6E:BS149-DM+M222G+L217F,L217H和L217R突变体的P1’袋底物特异性。
图6F:BS149-DM+M222G+L217C,L217D和L217P突变体的P1’袋底物特异性。
图7A:BS149-DM和BS149-DM+M222G和BS149-DM+I107V+M222G突变体的P1’袋特异性。
图7B:BS149-DM和BS149-DM+M222G和BS149-DM+1107V+M222G突变体的P2’袋特异性。
图7C:BS149-DM,BS149-DM+I107V和BS149-DM+I107V+M222G突变体的P4袋特异性。
图8:不同pH值下BS149-DM+M222G突变体的S/H比。
图9A:使用不同浓度的酰基供体和H-Glu-Leu-Arg-NH2亲核基团的BS149-DM+M222G突变体的S/H比。
图9B:使用不同浓度的酰基供体和H-Ala-Leu-Arg-NH2亲核基团的BS149-DM+M222G突变体的S/H比。
图10:与枯草杆菌连接酶相比,用于(寡)肽环化的本发明的不同酶的S/H比。
图11:不同pH值下用于(寡)肽环化的BS149-DM+M222G突变体的S/H比。
图12:具有BS149-DM基因的枯草芽孢杆菌(B.subtilis)/大肠杆菌(E.coli)穿梭载体pBE-S(pBES DNA-BS149-DM HIStag)。
图13:具有枯草杆菌连接酶基因的枯草芽孢杆菌/大肠杆菌穿梭载体PBS42-S5。
图14:可用作提供本发明的枯草杆菌蛋白酶BPN’变体的同源物的模板的枯草杆菌蛋白酶列表和含Ca2+结合环的序列片段与枯草杆菌蛋白酶BPN’中的相应环(SEQ ID NO 2)和BS149-DM中删除环(SEQ ID NO 5)的比对。
本发明的多核苷酸可以是单链或双链形式,并且除非另外限制,包括具有天然核苷酸的基本性质的已知类似物,其以与天然产生的核苷酸相似的方式与单链核酸杂交。多核苷酸可以是全长或天然或杂交结构或调节序列的子序列。除非另外说明,该数据包括具体序列及其互补序列。因此,具有针对稳定性或针对其他原因修饰的主链的DNA或RNA是“多核苷酸”,如该术语本文所指。本文所用的术语多核苷酸包括多核苷酸的这种化学、酶促或代谢修饰的形式,以及病毒和细胞,包括单个或复合细胞的DNA和RNA特征的化学形式。
本发明的重组多核苷酸一般是合成的。本发明具体延伸至从任何生物体中分离的DNA或RNA。在具体实施方式中,本发明延伸至包含本发明的重组DNA的宿主细胞。宿主细胞一般是转基因的。
本文所用术语“重组”是指多核苷酸或含该多核苷酸的细胞,其是使用重组DNA技术和/或其他诱变技术的一种或多种遗传修饰的结果。具体地,重组细胞可包含在相应野生型细胞中不存在的多核苷酸,该多核苷酸已经使用重组DNA技术导入该细胞(转基因细胞),或所述野生型细胞中不存在的该多核苷酸是一个或多个突变的结果-例如,使用重组DNA技术或其他诱变技术如UV-辐射-在所述野生型细胞中存在的多核苷酸序列中(如编码野生型多肽,如酶的基因)或其中基因的多核苷酸序列已经修饰以将多肽产物(编码其)靶向另一个细胞隔室。另外,术语“重组(细胞)”具体是指已经使用重组DNA技术从中取出DNA序列的株系(细胞)。
具体地,可通过使用本领域已知的任何方法的定点诱变来实现将突变导入多核苷酸序列以用一个多核苷酸交换另一个多核苷酸。另外,可通过基因合成来获得突变的基因,其除了在氨基酸水平上导入变化以外,还可用于优化编码序列以改善转录和翻译(R.Carlson,Nature Biotechnology,2009,27,1091;E.Angov等,PLoS ONE 2008,3(5):e2189)。
本文所用术语“转基因细胞”是指一种株系(细胞),其含有在该株系(细胞)中天然不存在的多核苷酸,并且已经使用重组DNA技术将该多核苷酸导入该株系(细胞),即重组细胞。
本文所用术语“或”定义为“和/或”,除非另外说明或者其后面的内容表示“……或……中任一个”。
本文所用术语“一个”或“一种”定义为“至少一个”,除非另外说明或者其后面的内容应该仅指单数。
当指代单数形式的名词(例如,化合物、添加剂等),往往包括复数,除非其后面的内容应该仅指单数。
出于本发明的目的,“肽”表示包含2个或更多个氨基酸的任何链。因此,肽一般是通过一个的羰基碳与另一个的氮原子形成共价键(形式上失去水)而至少概念上包含2个或更多个氨基羧酸分子(即,氨基酸)的酰胺。该术语通常应用于从α-氨基酸形成的结构。肽可以是直链、支链或环状。肽可具有包含2个或更多个氨基酸的单链或者肽可具有多条链。在肽包含2条或更多条链的情况中,各链一般包含2个或更多个氨基酸分子。肽的氨基酸序列被称为一级结构。
在一个实施方式中,肽基本没有二级结构并且基本没有三级结构。
在另一个实施方式中,肽具有二级结构。二级结构一般是高度规则的局部亚结构,如α-螺旋和β-折叠(或β-链),通过单个氨基酸和肽主链之间的相互作用。
在一个实施方式中,肽(或多个肽)具有三级结构。三级结构一般通过多重相互作用形成,包括氢键、疏水相互作用、范德华力、离子相互作用和二硫键。二级结构也可构成三级结构。三级结构提供了三维形状(其基本在稳定环境中固定,如在温度没有变化和肽所在的介质中没有变化等的情况中)。本领域技术人员知晓,三级结构不同于缺少任何固定的三维结构的随机螺旋肽链。蛋白质是具有三级结构的(寡)肽。三级结构的熟知示例是球状蛋白的球状结构。在一个实施方式中,该蛋白质是用于将药物活性(寡)肽靶向递送至特定位点,例如,至肿瘤或器官组织的蛋白质。适于该目的的蛋白质的已知示例是免疫球蛋白或其部分,如免疫球蛋白的抗原结合片段(Fab)。因此,与药物活性(寡)肽偶联的免疫球蛋白可用于将药物活性(寡)肽更高效地递送至含有针对免疫球蛋白的抗原的靶标,例如,肿瘤组织或器官组织。在一个实施方式中,该蛋白质是适于增加(寡)肽在活生物体内的半衰期,尤其是血浆半衰期的蛋白质。白蛋白是可偶联至(寡)肽以增加半衰期的蛋白质的示例。
二硫键(二硫桥)一般是2个半胱氨酸单元之间的键(由氧化形成)。因此,相同肽链(氨基酸序列)中的2个氨基酸同样可共价结合,如果他们在氨基酸序列中不是相邻氨基酸。同样,可形成第一肽链的第一半胱氨酸和第二肽链的第二半胱氨酸之间的二硫键以形成肽,第一和第二肽链可具有相同或不同的氨基酸序列。这种肽包含超过一条肽链。包含超过一条肽链,其中不同链通过二硫键连接的肽的示例是胰岛素。连接不同肽链的其他键是本领域已知的。
在一个实施方式中,(寡)肽基本由氨基酸单元组成。在另一个实施方式中,(寡)肽基本由氨基酸单元和保护基团组成。在一个实施方式中,肽是2个或更多个氨基酸的肽链和另一个分子,尤其是糖或脂质的偶联物。这些肽分别被称为糖蛋白和脂蛋白。在另一个实施方式中,肽偶联物是2个或更多个氨基酸和成像剂如荧光、磷光、发色或放射性基团的偶联物。肽偶联物也可含有螯合剂或毒素。
一般而言,肽-该术语包括寡肽、蛋白质和肽偶联物-包含高至35000个氨基酸单元,尤其是3-20000个氨基酸单元,更由其是4-5000个氨基酸单元,优选5-1000个氨基酸单元。在特别优选的实施方式中,肽包含500个氨基酸单元或更少,尤其是200个或更少,更由其是100个或更少。在一个特别优选的实施方式中,肽包含至少10个氨基酸单元,更具体至少15个氨基酸,至少25个氨基酸或至少40个氨基酸。
本发明内容中的“寡肽”表示包含2-200个氨基酸单元,尤其包含5-100个氨基酸单元,更尤其包含10-50个氨基酸单元的肽。
本文所用术语“(寡)肽”是短语“肽,尤其是寡肽”的缩写。
合成的(寡)肽可以是直链、支链或环状。直链或环状寡肽的合成已经实现良好结果。在具有超过200个氨基酸单元,例如,约800个氨基酸单元的肽的合成中已经实现其他良好结果。因此,肽可具有至少250个氨基酸单元或至少400个氨基酸单元。另外,通过将肽片段与蛋白质,如胰岛素偶联,同时保持二级和三级蛋白质结构已经实现良好结果。蛋白质可具有200个或更少的氨基酸单元,或可具有超过201个氨基酸单元。
从小于合成的(寡)肽的第一(寡)肽和第二(寡)肽合成非环状(寡)肽。第一(寡)肽是(寡)肽C-末端C-末端酯或硫酯并且第二(寡)肽包含N-末端去保护的胺。(寡)肽C-末端C-末端酯或硫酯也被称作(寡)肽酰基供体。第二(寡)肽也被称作(寡)肽亲核基团。从中形成合成(寡)肽的这些(寡)肽被称为“(寡)肽片段”。这些(寡)肽片段本身可从较小的(寡)肽酰基供体和(寡)肽亲核基团酶促合成或通过本领域技术人员已知的常规化学溶液或固相肽合成。
出于本发明的目的,“肽键”表示(i)一个α-氨基酸的α-氨基末端或一个β-氨基酸的β-氨基酸末端和(ii)另一个α-氨基酸的α-羧基末端或另一个β-氨基酸的β-羧基末端之间的酰胺键。优选地,肽键在一个氨基酸的α-氨基末端和另一个氨基酸的α-羧基末端之间。
出于本发明的目的,“环状肽”表示(寡)肽链,其中支链或支链(寡)肽的α-氨基末端和α-羧基末端通过肽键连接,从而形成至少12个氨基酸单元的环结构。环状肽具体包含12-200个氨基酸单元,更尤其包含12-100个氨基酸单元并且优选包含12-50个氨基酸单元。
出于本发明的目的,“缩合”表示在(寡)肽的C-末端C-末端羧基官能团和相同(寡)肽或另一个(寡)肽的N-端胺官能团之间形成新的肽键。
在本申请的内容中,术语“约”具体表示与给定值偏差10%或更少,更具体5%或更少,甚至更具体3%或更少。
如Schechter和Berger所定义,蛋白酶,包括枯草杆菌蛋白酶的活性位点残基包含连续称为袋的亚位置。各亚位置袋结合至肽底物序列的相应残基中,在此称为序列位置。根据该定义,底物序列中的氨基酸残基从切割位点向外如下连续编号...-P4-P3-P2-P1-P1′-P2′-P3′-P4′-...(易切断的键位于P1和P1′位置之间),而活性位点中的亚位置被相应标记为...-S4-S3-S2-S1-S1′-S2′-S3′-S4′-.(Schechter和Berger,Biochem Biophys ResCommun.1967年4月20日;27(2):157-62.))。.
出于本发明的目的,“S1、S2、S3和S4袋”表示与(寡)肽酰基供体的氨基酸相互作用的蛋白酶的氨基酸。酰基公司(寡)肽的C-末端C-末端氨基酸(第一氨基酸;P1)与蛋白酶的S1袋中的氨基酸相互作用。酰基供体(寡)肽的倒数第二氨基酸(第二氨基酸;P2)与蛋白酶的S2袋中的氨基酸相互作用,第三氨基酸(P3)与D3相互作用并且第四氨基酸(P4)与S4袋相互作用。由几个氨基酸定义蛋白酶的S1-S4结合袋,其可在蛋白酶的一级结构上远离,但在三维空间上靠近。出于本发明的目的,S1’和S2’袋表示与(寡)肽亲核基团的N-端氨基酸相互作用的蛋白酶的氨基酸。(寡)肽亲核基团的N-端氨基酸与蛋白酶的S1’袋中的氨基酸相互作用。(寡)肽亲核基团的N-端倒数第二氨基酸与蛋白酶的S2’袋中的氨基酸相互作用。由几个氨基酸定义蛋白酶的S1’和S2’结合袋,其可在蛋白酶的一级结构上远离,但在三维空间上靠近。
出于本发明的目的,“变性剂”表示可潜在破坏蛋白酶的三维结构的添加剂,并且因此可潜在灭活蛋白酶。
在本发明的内容中,“氨基酸侧链”表示任何蛋白质或非蛋白质氨基酸侧链。
蛋白质氨基酸是由特定密码子编码的氨基酸。蛋白质氨基酸包括:丙氨酸(Ala),缬氨酸(Val),亮氨酸(Leu),异亮氨酸(Ile),丝氨酸(Ser),苏氨酸(Thr),甲硫氨酸(Met),半胱氨酸(Cys),天冬酰胺(Asn),酪氨酸(Tyr),色氨酸(Trp),甘氨酸(Gly),天冬氨酸(Asp),谷氨酸(Glu),组氨酸(His),赖氨酸(Lys),精氨酸(Arg),脯氨酸(Pro)和苯丙氨酸(Phe)。硒代半胱氨酸(Sec,U)是一种氨基酸,其结构对应于半胱氨酸,前提是硒原子代替硫原子。
非蛋白质氨基酸可具体选自D-氨基酸、L-或D-苯基甘氨酸、DOPA(3,4-二羟基-L-苯丙氨酸)、β-氨基酸、4-氟-苯丙氨酸、或Cα-烷基化氨基酸。
关于蛋白质或多肽,尤其是酶,本文所用术语“突变的”或“突变”表示野生型或天然存在的蛋白质或多肽序列中的至少一个氨基酸通过对编码这些氨基酸的核酸的诱变已被不同的氨基酸取代,插入,或从序列中删除。诱变是本领域熟知的方法,并且包括,例如,通过PCR方式的定点诱变或通过Sambrook等,《分子克隆-实验室手册》,第二版,卷1-3(1989)中所述的寡核苷酸介导的诱变。关于基因,本文所用术语“突变的”或“突变”表示该基因或其调控序列的核酸序列中的至少一个核苷酸已经通过诱变被不同核苷酸取代,已经插入,已经附加,或已经从序列中删除,导致具有定性或定量改变的功能的蛋白质序列的转录或导致该基因的敲除。
在本发明的说明书中,氨基酸取代的缩写采用取代的氨基酸的单字母氨基酸代码,之后是表示蛋白质氨基酸序列中发生取代的位置的数字。该数字是野生型氨基酸序列的氨基酸位置(一般是枯草杆菌蛋白酶BPN’,除非另外说明)。因此,对于突变的氨基酸序列,其是对应于野生型酶中该数字的位置的氨基酸位置。由于在较低位置处的一个或多个其他突变(添加、插入、删除等),实际位置可能不必相同。本领域技术人员将能够使用一般已知的比对技术,如NEEDLE确定相应的位置。该编号后面是替代本文中野生型氨基酸的氨基酸的单字母代码。例如,G116S表示在对应于116位的位置处甘氨酸被取代为丝氨酸。X用于表示除被取代的氨基酸以外的任何其他蛋白质氨基酸。例如,G166X表示甘氨酸166被取代成任何其他蛋白质氨基酸。
当指代存在立体异构体的化合物时,该化合物可以是任意这类异构体或其混合物。因此,当指代例如,存在立体异构体的氨基酸时,氨基酸可以是L-对映异构体、D-对映异构体或其混合物。在存在天然立体异构体的情况中,化合物优选是天然立体异构体。
本文所用术语“pH”是表观pH,即用标准校准的pH电极测量的pH。
当参考括号中的酶类别(EC)提及酶时,酶类别是其中酶被分类或可能被分类的类别,基于由国际生物化学与分子生物学联盟的命名委员会(NC-IUBMB)提供的酶命名法,其命名可发现于http://www.chem.qmul.ac.uk/iubmb/enzyme/。往往包括还未被分类为特定类别但可能已经这样分类的其他合适酶。
同源物一般具有与其同源的多肽(酶)相应多核苷酸共同的预期功能,如分别编码能够催化相同反应的相同肽。术语同源物也表示包括由于遗传密码的简并性与另一个氨基酸序列不同并且编码相同的多肽序列的氨基酸序列(多核苷酸序列)。
当显示出一定程度的相似性时,氨基酸或核苷酸序列被称为是同源的。2条序列同源表示共同的进化起源。两条同源序列是否紧密相关或更远相关分别由高或低“相同性百分比”或“相似性百分比”表示。
术语“同源性”、“同源性百分比”、“相同性百分比”或“相似性百分比”可在本文中互换使用。出于本发明的目的,本文定义为了确定两条氨基酸序列或两条核酸序列的相同性百分比,出于最优比较目的比对完全序列。为了优化2条序列之间的比对,可在比较的2条序列中的任一个中引入缺口。这种比对在比较的序列的全长上进行。替代地,可在较短的长度上,例如,在约20、约50、约100或更多个核酸或氨基酸上进行比对。相同性百分比是在报告的比对区域上的2个序列之间相同匹配的百分比。
序列的比较和两个序列之间百分比同一性的确定可以使用数学算法来完成。本领域技术人员将认识以下事实:可使用几种不同的计算机程序来比对2条序列并确定2条序列之间的同源性(Kruskal,J.B.(1983)序列比较概述(An overview of sequencecomparison)D.Sankoff和J.B.Kruskal,(编),时间弯曲,字符串苄基和大分子:序列比较的理论和实践(Time warps,string edits and macromolecules:the theory and practiceof sequence comparison),第1-44页,Addison Wesley)。可使用用于比对两条序列的Needleman和Wunsch算法来确定两条氨基酸序列之间的相同性百分比。(Needleman,S.B.和Wunsch,C.D.(1970)J.Mol.Biol.48,443-453)。该算法比对氨基酸序列以及核苷酸序列。已经在计算机程序NEEDLE中实现Needleman-Wunsch算法。出于本发明的目的,使用来自EMBOSS包的NEEDLE程序(版本2.8.0或更高,EMBOSS:欧洲分子生物学开放软件套(2000)Rice,P.Longden,I.和Bleasby,A.Trends in Genetics 16,(6)第276-277页,http://emboss.bioinformatics.nl/)。对于蛋白质序列,EBLOSUM62用于取代矩阵。对于核苷酸序列,使用EDNAFULL。其他矩阵可以是专门的。用于比对氨基酸序列的最优参数是10的缺口开放罚分和0.5的延伸缺口罚分。本领域技术人员将理解所有这些不同参数将产生稍有不同的结果,在当使用不同算法时并不会显著改变两条序列的总体相同性百分比。
如下计算两条比对的序列之间的同源性或相同性:在两条序列中显示相同氨基酸的比对中的相应位置的数量除以减去比对中缺口总数的比对总长度。本文定义的相同性可通过使用NOBRIEF选项从NEEDLE获得并且在程序的输出中标记为“最长相同性”。出于本发明的目的,按照可通过使用程序NEEDLE进行的“最长相同性”的定义计算两条序列(氨基酸或核苷酸)之间的相同性(同源性)水平。
代表本发明的酶的多肽序列还可用作“参考序列”以进行针对序列数据库的检索,例如,以鉴定其他家族成员或相关序列。可使用BLAST程序来进行这类检索。进行BLAST分析的软件可从国家生物技术信息中心(National Center for Biotechnology Information)公开获得(http://ncbi.nlm.nih.gov/)。BLASTP用于氨基酸序列并且BLASTN用于核苷酸序列。BLAST程序使用以下默认参数:
-开放缺口成本:默认=5对于核苷酸/11对于蛋白质
-延伸缺口成本:默认=2对于核苷酸/1对于蛋白质
-核苷酸错配罚分:默认=-3
-核苷酸错配奖励:默认=1
-预期值:默认=10
-字长:默认=11对于核苷酸/28对于megablast/3对于蛋白质
通常,由BLAST程序确定氨基酸序列参考或核酸序列参考与回收的同源序列之间的局部相同性(同源性)程度。然而,只比较给出高于特定阈值的匹配的那些序列区段。因此,该程序仅计算这些匹配区段的相同性。因此,以这种方式计算的相同性被称为局部相同性。
尤其针对多肽(酶)的本文使用的术语“同源物”具有与同源肽与之比较的多肽(酶)的至少50%,优选至少60%,更优选至少70%,至少80%,至少90%,至少95%,至少96%,至少97%,至少98%或至少99%的序列相同性。显而易见,序列相同性将小于100%。序列相同性的百分比将取决于突变数量和同源物比较的多肽的长度。具体地,对于枯草杆菌蛋白酶BPN’变体,本发明的酶的突变数量将一般是至少11,其中至少9个突变是删除并且至少2个突变是被另一种氨基酸替换。在“最长相同性”比对中,不考虑删除。这意味着与枯草杆菌蛋白酶BPN’相比,本发明的酶的相同性一般是99.25%(在具有266个氨基酸的多肽中的2个替换)或更小。优选地,与SEQUENCE ID NO 2相比,本发明的酶的序列相同性是98%或更小,更优选96%或更小,尤其是94%或更小,更尤其是92%或更小,或90%或更小。
“表达”是指基因转录成结构RNA(rRNA,tRNA)或信使RNA(mRNA),随后翻译成蛋白质。
参考核酸或蛋白质的本文所用的“异源”是指来自外来物种,或如果来自相同物质,在组成和/或遗传基因座上通过故意人为干预从其天然形式显著修饰的核酸或蛋白质。例如,可操作地连接至异源结构基因的启动子来自与该结构基因所衍生的不同的物种,或如果来自相同物质,其一或两者从其原始形式显著修饰。异源蛋白质可来自外来物种,或如果来自相同物质,通过故意人为干预从其原始形式显著修饰。
术语“异源表达”是指在宿主细胞中表达异源核酸。合适宿主细胞系统中的异源蛋白质表达是本领域技术人员所熟知的。基于公知常识和本文公开的信息,本领域技术人员将能够提供合适的宿主细胞用于从各种生物体中生产本发明的酶,而没有过多的负担。.
本文所用“启动子”是引导(结构)基因转录的DNA序列。一般而言,启动子位于基因的5′区中,靠近(结构)基因的转录起始位点。启动子序列可以是组成型、诱导型或抑制型。如果启动子是诱导型启动子,则转录速率响应诱导剂增加。
本文所用术语“载体”包括指代常染色体表达载体并指代用于整合进染色体的整合载体。
术语“表达载体”指包含感兴趣多肽编码区段(酶)的线形或环形DNA分子,所述感兴趣多肽编码区段在提供转录的其他核酸区段的控制下(即,可操作连接)。这类其他区段可包括启动子和终止子序列,并且可任选地包括一个或多个复制起点,一个或多个可选择标记物,增强子,聚腺苷酸化信号等。表达载体通常来源于质粒或病毒DNA,或者可含有上述两者的元件。
“质粒”是指自主复制的染色体外DNA,其并不整合到微生物体的基因组中并且在自然中通常是环形的。
“整合载体”是指线形或环形的DNA分子,其可被整合到微生物的基因组中并提供编码感兴趣多肽的基因的稳定遗传。整合载体一般包括一个或多个区段,其包含编码在提供转录的其他核酸区段控制下(即,可操作连接)的编码感兴趣多肽的基因序列。这种其他区段可包括启动子和终止子序列,和通常通过同源重组的过程驱动感兴趣基因整合到靶细胞的基因组中的一个或多个区段。一般而言,整合载体将是可转移到靶细胞中,但具有在该生物体中无功能的复制子的载体。如果在该区段中包括合适的标记物,则可选择包含感兴趣基因的区段的整合。
本文所用术语“可操作地连接”表示并置位置,其中如此描述的组分的关系允许其以所需方式发挥功能。“可操作地连接”至另一个控制序列和/或编码序列的控制序列以在与控制序列相容的条件下完成编码序列的转录和/或表达的方式连接。一般而言,可操作地连接表示连接的核酸序列是连续的,并且,在需要接合两个蛋白质编码区时,是连续的并在相同阅读框中。
“宿主细胞”指含有载体并且支持该载体复制或表达的细胞。宿主细胞可以是原核细胞如细菌细胞,或真核细胞如酵母、植物、昆虫、两栖动物或哺乳动物细胞。
本文所用的“转化”和“转化的”是指向宿主细胞中插入外源性多核苷酸,无论插入所使用的方法,例如,直接摄取、转导、f-匹配或电转。所述外源多核苷酸可维持为非整合载体例如质粒,或者可以整合到宿主细胞基因组中。
出于清楚和简洁的目的,各特征在本发明中被描述为相同或单独的实施方式的一部分,然而,应理解本发明的范围可包括具有所有或一些所述特征的组合的实施方式。
本文所用术语“C-末端C-末端保护”表示向(寡)肽的C-末端C-末端羧基提供保护性基团,一般显著保护羧基免于偶联至另一个(寡)肽或相同(寡)肽分子的N-端胺基团。C-末端保护性基团可以是叔烷基酯基团,例如,叔丁酯基团,其是常用的保护性基团。C-末端保护性基团也可以是C-末端羧酰胺。伯羧酰胺是常用的保护性基团。
本文所用术语“N-端保护”表示向(寡)肽的N-端胺基提供保护性基团,一般至少显著保护N-端氨基免于偶联至另一个(寡)肽或相同(寡)肽分子的C-末端羧基。
(寡)肽C-末端酯或硫酯一般是活化的(硫)酯,即,其含有可参与酶促偶联反应的羧基酯或羧基硫酯基团。原理上,可使用任何(取代或未取代的)烷基或(取代或未取代的)芳基(硫)酯。可参与酶促偶联反应的(硫)酯的一般形式是甲基、乙基、丙基、异丙基、苯基、苄基、2,2,2-三氯乙基-、2,2,2-三氟乙基-、氰基甲基-和羧基酰胺基甲基-(硫)酯。
已经用由式肽-(C=O)-O-CX1X2-C(=O)N-R1R2表示的羧基酰胺基甲基型酯获得特别良好的结果。再次,各X1和X2独立地表示氢原子或烷基。当X1和X2都是氢原子(肽-(C=O)-O-CH2-C(=O)N-R1R2)时,已经实现了良好结果。在此,R1表示氢原子或烷基并且R2表示具有C-末端羧基酰胺或羧酸官能团的肽残基或氢原子或烷基或氨基酸,任选地在氨基酸的侧链官能团上或在多个氨基酸的侧链官能团中的一个或多个上得到保护。在此,各烷基可独立地表示(取代或未取代的)C1-C7烷基,优选(取代或未取代的)线性C1-C6烷基,更优选(取代或未取代的)线性C1-C3烷基,和最优选甲基。已经在本发明的方法中实现了良好结果,其中R1和R2都表示氢原子或其中R1表示氢原子并且R2表示具有C-末端羧酰胺或羧酸官能团的肽残基或氨基酸,任选地在氨基酸的侧链官能团上或在多个氨基酸的侧链官能团中的一个或多个上得到保护。当X1、X2、R1和R2是氢原子时,使用Cam-酯实现特别良好的结果。
(寡)肽C-末端(硫)酯可以是N-端去保护的或N-端保护的。在一个实施方式中,向一个或多个侧链官能团(尤其是羧基,胺基),例如,所有侧链官能团提供保护基团;在另一个实施方式中,所有侧链官能团是去保护的。在一个优选的实施方式中,仅向在(寡)肽酰基供体的P4和P1位置处或(寡)肽亲核基团的P1’或P2’位置处的氨基酸的侧链官能团(尤其是羟基、羧基或胺基)提供保护基团。合适的保护基团是本领域技术人员熟知的。例如,可用环己基、苄基或烯丙基来保护羧酸基团;例如,可用烯丙基羰基或三氟乙酰基来保护胺官能团。
在没有外消旋的情况下,可以高产率和纯度使用固相合成来合成(寡)肽C-末端(硫)酯的活化的C-末端(硫)酯基团。使用(硫)酯的另一个优势在于可使用廉价且工业上可得的2-氯三苯甲基氯树脂来合成它们的活化的C-末端酯或硫酯基团,其中R1表示氢原子并且R2表示具有C-末端羧酸官能团的肽残基或氨基酸,任选地在氨基酸的侧链官能团上或多个氨基酸的侧链官能团中的一个或多个上被保护。
也可通过使用微生物发酵来合成(寡)肽C-末端(硫)酯的活化的C-末端(硫)酯基团。一种使用发酵获得(寡)肽(硫)酯的可靠方法是通过所谓的内含肽表达(参见例如E.K.Lee,Journal of Chemical Technology and Biotechnology,2010,9,11-18)。可购得不同的内含肽表达系统试剂盒(例如,IMPACTTM试剂盒)。本领域已知发酵生产(寡)肽(硫)酯的其他方法。
(寡)肽C-末端(硫)酯的C-末端氨基酸和(寡)肽C-末端(硫)酯的其他氨基酸原则上可以是任何蛋白质或非蛋白质氨基酸。如果(寡)肽C-末端(硫)酯的C-末端部分的氨基酸序列由于偶联酶的氨基酸优先性和/或由于(寡)肽的二级或三级结构而导致偶联酶识别较差或不可及,则可在C-末端处延长一级结构(氨基酸序列)。基本上,(寡)肽C-末端(硫)酯的C-末端延长一定数量的氨基酸以确保被酶良好识别或可及,用于酶促偶联反应。本领域技术人员将知晓如何基于本文公开的信息和公知常识来延长(寡)肽C-末端(硫)酯。通常,延长的氨基酸数量范围是1-10,虽然原则上其可以更高。已经通过用4氨基酸残基延长(寡)肽C-末端(硫)酯获得良好结果,例如,-Phe-Ser-Lys-Leu-(硫)酯。
具体地,(任选N-端保护的)(寡)肽C-末端(硫)酯可由式I的化合物表示。
本文中Q表示OR或SR部分。R可表示(取代或未取代的)烷基或(取代或未取代的)芳基。
本文中P1代表氢或N-端保护基团。合适的N-端保护基团是可用于合成(寡)肽的那些N-保护基团。这类基团是本领域技术人员熟知的。
合适的N-保护基团的示例包括氨基甲酸酯或酰基型保护基团,例如,“Cbz”(苄氧基羰基)、“Boc”(叔丁氧基羰基)、“For”(甲酰基)、“Fmoc”(9-芴基甲氧基羰基)、“PhAc”(苯乙酰基)和“Ac”(乙酰基)。基团For、PhAc和Ac可被引入并分别使用酶肽去甲酰酶、PenG酰基转移酶或酰基转移酶酶促切割。本领域一般已知化学切割方法。
在本文中,n是至少2的整数。n可以具体是至少3、至少4、至少5、至少6、至少7、至少8、至少9或至少10。n可以具体是100或更小、75或更小、50或更小、25或更小、20或更小、15或更小,例如,10或更小。
本文中,各RA和各RB独立地表示氢原子或有机部分,优选氨基酸侧链。因此,不需要RA在所有n个氨基酸单元中都相同。类似地,不需要RB在所有n个氨基酸单元中都相同。任选地,侧链官能团中的一个或多个可含有保护基团。
(寡)肽亲核基团的氨基酸单元原则上可选自任何蛋白质或非蛋白质氨基酸。
具体地,可由式II的化合物表示(寡)肽亲核基团。
在此,n、RA和RB如上述定义。
在此,P2表示胺部分或OR部分。
在P2表示胺部分的情况中,胺部分可由式NR3R4表示,其中R3和R4可各自独立地表示任何(取代或未取代的)烷基或(取代或未取代的)芳基。具体地,R3和R4之一是氢原子并且另一个是(取代或未取代的)烷基。尤其当R3和R4都是氢原子时获得良好结果。
在P2表示OR部分的情况中,R可表示C-末端保护性基团或阳离子,例如,单价阳离子,如三取代或四取代的铵离子或碱金属离子或H。在R是C-末端保护性基团的情况中,这可具体是任选取代的烷基。优选地,其是叔烷基,虽然原则上其也可以是任何其他保护性酯,如本领域技术人员所知。叔烷基原则上可以是任何保护性叔烷基。优选地,叔烷基选自下组:叔丁基(2-甲基-2-丙基)、叔戊基(2-甲基-2-丁基)和叔己基(2,3-二甲基-2-丁基)。
在一个实施方式中,(寡)肽亲核基团是C-末端保护的。在另一个实施方式中,其不是C-末端保护的。
可使用本领域已知的方法合成(寡)肽亲核基团,如固相合成、溶液相合成或通过使用微生物发酵。(寡)肽亲核基团的N-端氨基酸和(寡)肽亲核基团的其他氨基酸原则上可以是任何蛋白质或非蛋白质氨基酸。如果(寡)肽亲核基团的N-端部分的氨基酸序列由于偶联酶的氨基酸优先性或由于(寡)肽亲核基团的二级或三级结构而导致偶联酶识别较差或不可及,则可在N-端处延长一级结构(氨基酸序列)。基本上,(寡)肽亲核基团的N-端延长一定数量的氨基酸以确保被酶良好识别或可及,用于酶促偶联反应。本领域技术人员将知晓如何基于本文公开的信息和公知常识来延长(寡)肽亲核基团。通常,延长的氨基酸数量范围是1-10,虽然原则上其可以更高。已通过用3个氨基酸残基延长(寡)肽亲核基团获得良好结果,例如,H-Ser-Tyr-Arg。
本发明提供了对于形成肽键具有催化活性(缩合活性)的酶,从而其具有以高S/H比合成(寡)肽的催化活性。具体地,该酶具有连接酶活性或环化酶活性,即,通过催化通过偶联(寡)肽的C-末端和N-端的肽键形成在(寡)肽环化中的催化活性。
具体地,本发明提供了分离的酶(从其已经表达的生物体(一般是重组生物体)中分离),如果其已经在生物体中产生,或来自其已经合成的反应介质
具体地,出于本发明的目的,如果本发明的酶已经通过任意合适的技术,例如,Smith和Johnson,Gene 67:31-40(1988)中公开的单步纯化方法被明显纯化,则本发明的酶被认为是分离的,。
可以至少基本纯的形式(例如,超过75重量%,超过80重量%)或在具有一种或多种其他组分的混合物中,例如,在母液形式中,尤其是水性缓冲溶液中提供本发明的酶。
这种酶一般是枯草杆菌蛋白酶BPN’变体或其同源物。本发明提供了本发明的酶的各种示例,其具体被认为是枯草杆菌蛋白酶BPN’变体。如上所述,本发明的酶应该包含至少:
-对应于枯草杆菌蛋白酶BPN’的75、N76、N77、S78、I79、G80、V81、L82和G83的氨基酸删除(Δ75-83;因此一般删除相应的Ca2+结合位点)
-在对应于枯草杆菌蛋白酶BPN’的221位的位置处的半胱氨酸或硫代半胱氨酸
-优选地,在对应于枯草杆菌蛋白酶BPN’的225位的位置处的不同于脯氨酸的氨基酸。
已经令人惊讶地发现同时具有枯草杆菌蛋白酶BPN’的Δ75-83的删除和对应于枯草杆菌蛋白酶BPN’的221位的半胱氨酸的突变的突变体具有足够的稳定性和超过1的S/H比,其是与例如枯草杆菌连接酶相比改善的S/H比。枯草杆菌蛋白酶中对应于S221的位置被认为对于酶的稳定性和活性而言是重要的,并且碱性蛋白酶(alcalase)已经报道了对应于S221C的单个突变导致实际无活性的酶。在这一方面,已经用对应于221位的位置处突变成半胱氨酸实现了良好结果。
本发明的酶还可具有与枯草杆菌蛋白酶BPN’相比的突变,前提是其在(寡)肽的制备中具有酶促片段缩合或环化活性,尤其是本文他处所述的一个或多个其他突变。
作为枯草杆菌蛋白酶BPN’的替代,可通过诱变从中衍生出本发明的酶,尤其是本发明的枯草杆菌蛋白酶BPN’变体的同源物的模板酶是其他枯草杆菌蛋白酶,尤其是与枯草杆菌蛋白酶BPN’具有至少50%同源性的枯草杆菌蛋白酶
合适的枯草杆菌蛋白酶序列可取自2014年8月11日得到的UNIPROT序列数据库(http://www.uniprot.org/),通过对数据库进行BLAST,使用枯草杆菌蛋白酶BPN’(SEQ ID2)作为参考。然而,序列获取并不限于UNIPROT或数据。本领域技术人员知晓如何查询替代序列保藏或通过测序收集其他同源序列(参见例如,粪便微生物放大:土壤中枯草杆菌溶素的分子微多样性(Zooming in on metagenomics:molecular microdiversity ofSubtilisin Carlsberg in soil.),Gabor E,Niehaus F,Aehle W,Eck J.J MolBiol.2012年4月20日;418(1-2):16-20)。具体地,本发明还涉及图14中所示的枯草杆菌蛋白酶中任一个的变体,其具有至少对应于枯草杆菌蛋白酶BPN’的L75直至并包括G83的氨基酸的删除,对应于枯草杆菌蛋白酶BPN’中221位的位置处的半胱氨酸和对应于枯草杆菌蛋白酶BPN’的225位的位置处的丙氨酸或另一个突变(如对应于SEQUENCE ID NO:2的P225N、225D、P225S、P225C、P225G、P225A、P225T、P225V、P225I、P225L、P225H、P225Q的突变),其全长序列可获自所述UNIPROT序列数据库并且显示了其在75-83位附近的比对。
优选地,本发明的枯草杆菌蛋白酶BPN’变体或同源物包含对应于P225的位置处的突变。对于S/H比的改善,突变通常是选自下组的对应于P225的突变:P225N、P225D、P225S、P225C、P225G、P225A、P225T、P225V、P225I、P225L、P225H、P225Q、P225F和P225E。对于相对于例如枯草杆菌连接酶的S/H比的改善,突变优选是选自下组的对应于P225的突变:P225N、P225D、P225S、P225C、P225G、P225A、P225T、P225V、P225I、P225L、P225H和P225Q。在这些中,已用所述突变成通常称为“Asx”的组的氨基酸之一实现了特别良好的结果,即,天冬酰胺(Asn/N)和天冬氨酸(Asp/D),即,对应于P225N或P225D的突变。另外,已经用对应于P225S的突变实现了特别良好的结果。另外,已经用对应于P225C的突变实现了特别良好的结果。
另外,已经用对应于P225G的突变实现了良好的结果。另外,已经用对应于P225A的突变实现了良好的结果。另外,已经用对应于P225T的突变实现了良好的结果。另外,已经用对应于P225的位置处突变成分支氨基酸,即,缬氨酸(V)、异亮氨酸(I)或亮氨酸(L)实现了良好的结果。
优选地,本发明的枯草杆菌蛋白酶BPN’变体或同源物包含对应于SEQUENCE ID NO2的Q2、S3、P5、S9、I31、K43、M50、A73、E156、G166、G169、S188、Q206、N212、N218S、T254和Q271的氨基酸位置处的一个或多个突变。发明人发现以下突变中的一个或多个在本发明的枯草杆菌蛋白酶BPN’变体中是优选的:Q2K、S3C、P5S、S9A、I31L、K43N、M50F、A73L、E156S、G166S、G169A、S188P、Q206C、N212G、N218S、T254A和Q271E。具体地,为了改善的活性、改善的稳定性或改善的S/H比,多个所述突变优选存在于本发明的酶中,如选自下组的至少2、至少3、更优选4或更多、更优选5或更多、更优选6或更多、更优选至少8、更优选至少12个突变:Q2K、S3C、P5S、S9A、I31L、K43N、M50F、A73L、E156S、G166S、G169A、S188P、Q206C、N212G、N218S、T254A和Q271E。发明人认为突变N218S、S3C-Q206C、G169A、T254A、A73L、M50F和Q2K中一个或多个的存在对于改善酶稳定性而言是特别有优势的。另外,发明人认为突变I31L、E156S、G166S、G169A中一个或多个的存在对于改善活性和/或S/H比而言是特别有优势的。
另外,包含对应于SEQUENCE ID NO 2的Q2、S3、P5、S9、I31、K43、M50、A73、E156、G166、G169、S188、Q206、N212、N218S、T254和Q271的氨基酸位置处的多个突变的本发明的枯草杆菌蛋白酶BPN’变体或同源物比枯草杆菌连接酶更易于生产和纯化。
在一个优选的实施方式中,酶包括在对应于N218的氨基酸位置处的突变,尤其是N218S。
在一个优选的实施方式中,酶包括在对应于M50的氨基酸位置处的突变,尤其是M50F。
在一个优选的实施方式中,酶包括在对应于Q2的氨基酸位置处的突变,尤其是Q2K。
在一个优选的实施方式中,酶包括在对应于A73的氨基酸位置处的突变,尤其是A73L。
在一个优选的实施方式中,酶包括在对应于P5的氨基酸位置处的突变,尤其是P5S。
在一个优选的实施方式中,酶包括在对应于G166的氨基酸位置处的突变,尤其是G166S。
在一个优选的实施方式中,酶包括在对应于S3和Q206的氨基酸位置处的突变,尤其是S3C-Q206C。
为了改善的S/H比,特别优选该酶在对应于Q2、P5、M50、A73和N218的各位置处,更具体在对应于Q2、P5、M50、A73、G166和N218的各位置处包含突变。
具体地,已经用包含对应于Q2K、S3C、P5S、S9A、I31L、K43N、M50F、A73L、E156S、G166S、G169A、S188P、Q206C、N212G、N218S、T254A和Q271E的各突变的枯草杆菌蛋白酶BPN’变体来实现良好的结果。
另外,已经令人惊讶地发现通过在所述袋的氨基酸位置中的一个或多个中的点特异性突变改变S1’袋或S4袋对于一般或某些底物改善了S/H比。特别令人惊讶的是在袋中,尤其是在P1’袋中的点特异性突变对另一个袋,尤其是P2’袋有影响。发明人认识到拓宽可优选用于本发明的合成肽的方法的底物范围也是有优势的。因此,这拓宽了本发明的酶提供高S/H比的底物范围。
S1’袋主要由氨基酸M222和Y217形成(Strausberg L.等,Biochemistry,2005,44,3272;Estell D.A.等,J.Biol.Chem.,1985,260,6518)。也可通过更远的氨基酸,例如,N62、G100、S125、L126、G127、P129、N155和N218来改变S1’结合袋的三维结构。这些氨基酸中的一个或多个的取代可显著改变并改善枯草杆菌蛋白酶BPN’变体或同源物的S/H比,至少对于多个肽序列而言。在一个优选的实施方式中,在对应于M222或Y217的氨基酸位置处的取代增加了活性、S/H比或酶显示(高度)改善的S/H比的底物范围。
优选地,存在于对应于M222的位置处的突变是M222G、M222P、M222N、M222E、M222Q或M222A。在一个特别优选的实施方式中,所述突变对应于M222P或M222G。
优选地,在对应于Y217的位置处的突变是Y217L、Y217N、Y217E、Y217G、Y217S、Y217F或Y217H。
已经用具有选自M222G、M222P和Y217L的突变的变体获得特别良好的结果,所得枯草杆菌蛋白酶BPN’变体的S/H比和/或后行显著增加,至少对于一些肽序列而言。
S4结合袋主要通过氨基酸Y104、I107、L126、S101、G102、G127、和G128形成,但是S4结合袋的三维结构也由更远的氨基酸如L135和P168决定(Ruan等,Biochemistry,2008,47,6628;Rheinnecker等,Biochemistry,1994,33,221)。
优选地,该酶包含对应于Y104、I107和L135的位置中的一个、两个或各自处的突变。已经用具有选自下组的突变的枯草杆菌蛋白酶BPN’变体获得特别良好的结果:Y104F、Y104S、I107V、I107A、L135N、L135S、L135D和L135A。这些氨基酸的取代可显著改变并改善该酶的S/H比和/或活性,至少对于某些底物。
具体地,对P4底物范围有良好结果,已经用对应于I107的氨基酸中有取代(I107V)和L135中有取代(L135S或L135N)的枯草杆菌蛋白酶BPN’变体获得酶活性和S/H比。
在一个优选的实施方式中,本发明的酶在S1’结合袋中具有一个或多个取代并且在S4结合袋中具有一个或多个取代,尤其是在S1’结合袋中有2个或更多个取代并且在S4结合袋中有2个或更多个取代。
已经发现同时对应于M222和I107的2个氨基酸的取代优选与仅具有所述突变之一的本发明的变体相比提供具有改善的活性和S/H比的酶。任何单独突变也发现对酶活性和S/H比有益。具体地,已经通过突变I107V和M222G在该实施方式中实现良好结果。特别感兴趣的突变的其他组合的示例是具有突变L135N+M222G的变体和具有突变I107V+M222P的变体。另外,在对应于I107和M222的位置处的突变的组合提供了相对于P4和P1’袋的底物范围的改善。
在优选的实施方式中,本发明的枯草杆菌蛋白酶BPN’变体或其同源物在对应于M222的位置处和对应于Y217的位置处有S1’结合袋中的取代。在该实施方式中,M222突变优选是M222G或M222P。Y217突变优选选自Y217F、Y217H和Y217G之一。已经发现本发明的这种酶具有宽底物范围和良好S/H比。已用包含以下的枯草杆菌蛋白酶BPN’变体或其同源物实现了特别良好的结果:突变M222P和Y217H;突变M222P和Y217G;突变M222G和Y217F;或突变M222G和Y217G。在这些中,包含M222G和Y217F的枯草杆菌蛋白酶BPN’变体或其同源物实现了在底物宽度和S/H比方面特别良好的结果。
已经用本发明的枯草杆菌蛋白酶BPN’变体或其同源物实现了良好结果,该变体在对应于M222的位置处具有S1’结合袋中的取代,并且在对应于Y217的位置处没有S4结合袋的突变。然而,在一个也实现良好结果的替代性实施方式中,在S4结合袋中还有一个或多个突变。在一个具体实施方式中,这种枯草杆菌蛋白酶BPN’变体或其同源物在对应于Y104、I107、L126、L135、S101、G102、G127、和G128的S4结合袋的2个或更多个位置中有取代。S4结合袋中的突变可具体包括I107V和/或L135N或L135S。
本发明的优选的酶具体是包含SEQUENCE ID NO 3、4或5所示序列中任一个的枯草杆菌蛋白酶BPN’变体或同源物或其同源物。SEQUENCE ID NO 3显示对应于S221C的优选突变,虽然在另一个实施方式中,这可能是硒代半胱氨酸。在对应于P225的位置处的X可以是P,或不同的氨基酸,优选地,本文他处鉴定的优选突变之一(N/D/S/C/G/A/T/V/I/LH/Q)。与SEQUENCE ID NO 3相比,SEQUENCE ID NO 4显示优选突变位点。在SEQUENCE ID NO 4中,各X独立地表示任何蛋白质氨基酸。具体地,任何X可以是在该X的位置处的野生型枯草杆菌蛋白酶BPN’中存在的氨基酸,或在本发明中他处描述的突变。优选地,一个或多个X表示突变,如本文他处所述。
在本发明的方法中,在包含水的流体中进行酶促偶联反应和环化。优选地,在缓冲的流体中进行反应。基于总液体,含水量通常是10-100体积%,优选20体积%或更大,优选40体积%或更大,尤其是50体积%或更大,或更加尤其是60体积%或更大。
原则上,任何缓冲液都是合适的。本领域技术人员已知良好缓冲液。参见,例如,David Sheehan,于《物理生化》(Physical Biochemistry),第二版,Wiley-VCH VerlagGmbH,Weinheim 2009;http://www.sigmaaldrich.com/life-science/core-bioreagents/biological-buffers/1earning-center/buffer-calculator.html。
(寡)肽片段缩合的缓冲液的pH可以是至少5,尤其是至少6,优选至少7。所需的最大pH通常小于11,尤其是小于10,甚至更优选小于9。通常,酶促反应的最优pH是7-9。对于环化反应,最优pH可能不同。环化反应的pH可以是至少3,尤其是至少4,优选至少5。所需的最大pH通常小于11,尤其是小于10,优选小于9。通常,酶促环化反应的最优pH是5-9。
由于高S/H比,一般不需要大量过量的(寡)肽C-末端酯或硫酯或(寡)肽亲核基团来在缩合反应中达到高产率。通常,(a)(寡)肽C-末端酯或硫酯与(b)(寡)肽亲核基团之比为1∶5至5∶1,优选1∶3至3∶1,更优选1.0∶2.5至2.5∶1.0,尤其是1∶2至2∶1,更尤其是1∶1.5至1.5∶1。已经发现大约化学计量比是特别有效的。
在本发明的方法中,可优选向流体中添加添加剂,其中进行反应以改善(寡)肽片段的溶解性或改善反应产率。这类添加剂可以是盐或有机分子,例如,盐酸胍、尿素、十二烷基硫酸钠或吐温。
反应可在完全水性流体或水和水可混合共溶剂,如N,N-二甲基甲酰胺(DMF)、N-甲基-吡咯烷酮(NMP)、N,N-二甲基乙酰胺(DMA)、二甲亚砜(DMSO)、乙腈、酯,如四氢呋喃(THF)、2-甲基-四氢呋喃(Me-THF)或1,2-二甲氧基乙烷,或(卤化)醇,如甲醇、乙醇、异丙醇、叔丁醇、2,2,2-三氟乙醇(TFE)、1,1,1,3,3,3-六氟异丙醇,或这些有机溶剂的混合物中进行。根据枯草杆菌蛋白酶BPN’变体的稳定性和(寡)肽底物的溶解性,共溶剂的量优选低于70体积%、更优选低于60体积%、甚至更优选低于50体积%、并且最优选低于40%。
原则上,酶促片段缩合或环化期间的温度不是关键的,只要选择温度,在该温度下使用的枯草杆菌蛋白酶BPN’变体显示出足够的活性和稳定性。这种温度通常是待使用的枯草杆菌蛋白酶BPN’变体所已知的或可常规确定,利用已知反应条件下枯草杆菌蛋白酶BPN’变体的已知底物。一般而言,温度可以是至少-10℃,尤其是至少0℃或至少10℃。一般而言,温度可以是70℃或更低,尤其是60℃或更低或者50℃或更低。本领域技术人员可易于通过常规实验基于公知常识和本文公开的信息鉴定用于特定酶促片段缩合或环化的特定枯草杆菌蛋白酶BPN’变体的最优温度条件。一般而言,温度优选范围是20-50℃。
本发明的枯草杆菌蛋白酶BPN’变体一般通过重组方法产生,尤其是通过枯草杆菌蛋白酶BPN’DNA的表达,其已经突变使得在表达后,其产生具有酶促活性的本发明的枯草杆菌蛋白酶BPN’变体。
使用可用载体和调控序列提供本发明枯草杆菌蛋白酶BPN’变体的DNA及其同源物的表达。实际选择很大部分取决于用于表达的特定宿主细胞。例如,如果在芽孢杆菌中表达枯草杆菌蛋白酶BPN’突变体DNA,则一般使用芽孢杆菌启动子以及芽孢杆菌衍生的载体。
为了从宿主细胞中产生并向介质中分泌本发明的酶,可使用在成熟酶之前编码含有信号序列和初前(pre-pro)序列的前体多肽(酶)的基因。在枯草杆菌蛋白酶BPN’中,额外N-端序列包括107个氨基酸。在分泌后,首先可去除信号序列,并且在分泌后,可去除初前序列,产生完全活性酶(James A.Wells,Nucleic Acids Research,第11卷,第22期,1983)。在天然枯草杆菌蛋白酶BPN’的情况中,成熟酶包括275个氨基酸。为了方便地描述枯草杆菌蛋白酶BPN’及其同源物的多肽链中单个氨基酸的位置,使用所谓的枯草杆菌蛋白酶BPN’编号,其从N-端(氨基酸1)到C-末端(氨基酸275)。可通过比对同源序列与枯草杆菌蛋白酶BPN’的序列来确定同源酶中的相应位置。
如本领域技术人员已知,SEQ ID NO:5内编码为1-275的成熟多肽或SEQ ID NO:2、3或4的氨基酸(如氨基酸1-275所示)的成熟酶的N-和/或C-末端可能是异质性的,由于成熟期间处理的变化。具体地,这种处理变化可能发生在酶的过表达之后。另外,外-蛋白酶活性可能产生异质性。出现异质性的程度也取决于使用的宿主和发酵方案。这种C-末端处理假象可能产生比成熟野生型枯草杆菌蛋白酶BPN’(SEQ ID NO:2)或SEQ ID NO:3或4所示的本发明的成熟酶所示更短的多肽或更长的多肽。这种处理变化的结果在于,N-端也可能是异质性的。在N-端处处理变体可能是由于信号肽酶对信号序列的替代性切割。
基于公知常识和本文公开的信息,可通过重组技术产生本发明的酶。为了将翻译的酶分泌到内质网的腔中、周质空间中或胞外环境中,合适的分泌信号序列可与编码本发明的酶的多核苷酸融合。这些信号对酶可以是内源性的或者其可以是外源性信号。
可以修饰的形式产生本发明的酶,如融合蛋白,并且可不仅包括分泌信号,还有其他异源功能区。因此,例如,其他氨基酸区(所谓的标签),尤其是带电荷氨基酸,可添加至酶,尤其是酶的C-末端,以改善宿主细胞中,在纯化或后续操作以及储存期间的稳定性和持续性或促进纯化。合适标签的示例如M.E.Kimple等,于《新编蛋白质科学指南》(CurrentProtocols in Protein Science)9.9.1-9.9.23,2013年8月的综述中所述。可用的标签的一个熟知示例是所谓的His标签,具有多个组氨酸单元的氨基酸序列。发明人发现这种标签可在本发明的酶的生产和纯化中连续使用。在具有His标签的酶和没有His标签的酶之间没有观察到功能性酶性质上的显著差异。
另外,本发明的酶可以包涵体的形成产生,在合适的缓冲液中重新折叠。@@
本发明的酶包括天然纯化的产物,化学合成过程的产物,和通过重组技术从原核或真核宿主,包括,例如,细菌、酵母、高级植物、昆虫和哺乳动物中产生的产物。根据在重组生产过程中采用的宿主,本发明的酶可以是糖基化的或可以是非糖基化的。另外,在一些情况中由于宿主介导的过程,本发明的酶也可包括初始修饰的甲硫氨酸残基。
本发明的多核苷酸可纳入到载体中,包括克隆和表达载体。载体可以是重组可复制载体。载体可用于在相容的宿主细胞中复制本发明的多核苷酸。载体可方便地经过重组DNA过程。
本发明还涉及在合适的宿主细胞中生长、转化或转染这类载体的方法,例如,在发生本发明的酶的表达的情况下。本发明提供了一种制备本发明的酶的方法,通过向载体(在一个实施方式中,表达载体)中导入本发明的多核苷酸,将所述载体导入相容的宿主细胞,并在产生所述载体复制的条件下使所述宿主细胞生长。
可从宿主细胞中回收载体。
本发明的载体可以是自主复制载体,即,以染色体外实体存在的载体,其复制独立于染色体复制,例如,质粒。
或者,所述载体可以是在引入宿主细胞时整合到宿主细胞基因组中并随被整合的染色体一起复制的载体。
载体的一种类型是“质粒”,其指的是环状双链DNA环,其中可插入额外DNA区段。载体的另一类型是病毒载体,其中可将额外DNA区段插入病毒基因组。
某些载体能够在其转导的宿主细胞中自主复制(例如,具有细菌复制起点和细菌载体和附加体哺乳动物载体)。在导入宿主细胞后将其他载体(例如,没有合适复制起点的细菌整合载体或非附加体哺乳动物载体)整合到宿主细胞的基因组中,从而与宿主基因组一起复制。
本发明的重组表达载体包含本发明的多核苷酸,该多核苷酸具有示于所述核酸序列在宿主细胞中表达的形式,这意味着该重组表达载体包括一种或多种调控序列,其选择基于待用于表达的宿主细胞,其被操作性地连接至待表达的多核苷酸序列。术语“调控序列”包括启动子、增强子和其它表达控制元件(例如,多腺苷酸化信号)。所述调控序列描述于,例如,Goeddel;《基因表达技术:酶学方法》(Gene Expression Technology:Methods inEnzymology)185,学术出版社(Academic Press),加利福尼亚州圣迭戈(1990)。
给定宿主细胞的载体或表达构建体因此可包括以下以从相对于编码本发明的酶的序列的编码链的5′-末端至3′-末端的连续顺序互相可操作地连接的元件:(1)能够引导编码所述酶的核苷酸序列在给定的宿主细胞中的转录的启动子序列;(2)核糖体结合位点以促进转录的RNA的翻译;(3)任选地,能够引导所述酶从宿主细胞分泌到培养基中的信号序列;(4)本发明的多核苷酸序列;和优选地,还有(5)能够终止编码所述酶的核苷酸序列的下游转录的转录终止区(终止子)。
根据本发明的核苷酸序列的下游可以是含有一个或多个转录终止位点的3′非翻译区(例如终止子,本文也称为终止密码子)。终止子的起点不太关键。例如,终止子可以对编码酶的DNA序列而言是天然的。然而,优选细菌宿主细胞中使用细菌终止子,丝状真菌宿主细胞中使用丝状真菌终止子。更优选地,终止子对宿主细胞是内源的(其中编码酶的核苷酸序列将被表达)。在转录区域中,可能存在用于翻译的核糖体结合位点。由构建体表达的成熟转录物的编码部分将包括起始密码子通常为AUG(或ATG),但也有替代的起始密码子,例如GUG(或GTG)和UUG(或TTG),其用于原核生物。也可以在待翻译的多肽的末端适当地放置终止或翻译终止密码子。
本发明的多核苷酸的增强表达也可以通过选择同源和异源调控区,例如,启动子,分泌前导序列和/或终止子区来实现,其可以用于增加来自表达宿主的感兴趣蛋白质的表达和(如果需要)分泌水平和/或提供对本发明的酶的表达的诱导型控制。
根据本发明的酶可以在细菌细胞如大肠杆菌和芽孢杆菌(使用杆状病毒表达载体),真菌细胞,酵母细胞或哺乳动物细胞中产生。合适的宿主细胞描述于本文并且在Goeddel,《基因表达技术:酶学方法》(Gene Expression Technology:Methods inEnzymology)185,)学术出版社,San Diego,CA(1990)和“重组蛋白质生产:新微生物和真核表达系统(Production of Recombinant Proteins:Novel Microbial and EukaryoticExpression Systems)”,2004,Wiley-Blackwell编,(http://eu.wiley.com/WileyCDA/Section/id-302479.html?query=Gerd+Gellissen)中进一步描述。或者,重组表达载体可以在体外转录和翻译,例如使用T7启动子调控序列和T7聚合酶。
对于大多数细菌,丝状真菌和酵母,载体或表达构建体优选整合在宿主细胞的基因组中,以获得稳定的转化体。在表达构建体整合到宿主细胞基因组中的情况下,构建体在基因组中的随机基因座处或使用同源重组的预定靶基因座处整合,在这种情况下,靶基因座优选包含高度表达的基因。
在本发明中,细菌特别是芽孢杆菌可优选用作宿主细胞用于表达本发明的酶。可用于这种宿主细胞的合适的诱导型启动子包括主要由辅助因子如阻遏物或活化剂调节的启动子。阻遏物是抑制启动子活性的序列特异性DNA结合蛋白。可以在诱导剂存在下从该启动子起始转录,其阻止阻遏物与启动子的操纵子结合。次级西格玛因子的产生主要导致来自特定启动子的转录。衰减和抗肿瘤也调节转录。
强组成型启动子是众所周知的,并且根据要在宿主细胞中控制的具体序列可以选择合适的启动子。可以使用能够在本发明的重组宿主细胞中指导转录的多种启动子。优选地,启动子序列来自高度表达的基因。
可以通过天然能力,常规转化或转染技术将载体DNA引入原核或真核细胞。如本文所用,术语“转化”和“转染”旨在表示将外源多核苷酸(例如DNA)引入宿主细胞的多种本领域公认的技术,包括磷酸钙或氯化钙共沉淀,DEAE-葡聚糖介导的转染,转导,感染,脂转染,阳离子脂质介导的转染或电穿孔。用于转化或转染宿主细胞的合适方法可以在Sambrook等(同上)和其他实验室手册中找到。
为了鉴定和选择含有载体的细胞,通常将本发明的多核苷酸与编码选择性标记物的基因(例如抗生素抗性)一起引入宿主细胞。优选的选择性标记物包括但不限于赋予药物抗性或补偿宿主细胞缺陷的那些。它们还包括例如,可用于转化大多数丝状真菌和酵母的多功能标记物基因,例如乙酰胺酶基因或为抗生素如G418、潮霉素、博来霉素、卡那霉素、甲氨蝶呤、腐草霉环球蛋白抗性(benA)提供抗性的基因。或者,可以使用特异性选择标记物,例如需要相应的突变宿主菌株的营养缺陷型标记物:例如,D-丙氨酸消旋酶(来自芽孢杆菌属),URA3(来自酿酒酵母或其他酵母的类似基因),pyrG或pyrA(来自构巢曲霉或黑曲霉),argB(来自构巢曲霉或黑曲霉)或trpC。在一个实施方案中,在引入表达构建体后,从转化的宿主细胞中删除选择标记物,以获得能够产生不含选择标记物基因的本发明酶的转化宿主细胞。
蛋白质在原核生物中的表达通常用含引导融合蛋白或非融合蛋白表达的组成型或诱导型启动子的载体进行。融合载体向其中编码的蛋白质添加许多氨基酸,例如,到重组蛋白质的氨基末端。这种融合载体通常有三个目的:1)增加重组蛋白的表达;2)增加重组蛋白的溶解度;和3)通过在亲和纯化中用作配体来帮助重组蛋白的纯化。通常,在融合表达载体中,在融合部分和重组蛋白的连接处引入蛋白水解切割位点,以便在融合蛋白纯化后能够从重组蛋白与融合部分分离。
优选用于细菌的载体例如在WO-A1-2004/074468中公开,其通过引用并入本文。其它合适的载体对于本领域技术人员将是显而易见的。
本发明的载体可以如本文所述转化至合适的宿主细胞,以提供本发明的多肽的表达。因此,在另一方面,本发明提供了制备根据本发明的酶的方法,其包括培养用编码该酶的表达载体转化或转染的宿主细胞,并回收表达的多肽。
当本发明的多核苷酸转化入适当的宿主细胞时,编码本发明的酶。本发明的特征在于细胞,例如转化的宿主细胞或包含根据本发明的多核苷酸或包含本发明载体的重组宿主细胞。“转化的宿主细胞”或“重组宿主细胞”是通过重组DNA技术引入本发明的多核苷酸的细胞。
包括原核和真核细胞,例如细菌、真菌、酵母、昆虫、哺乳动物等。
合适的宿主细胞包括细菌,包括大肠杆菌,鱼腥藻,细菌,葡糖杆菌,红细菌,假单胞菌,副球菌,芽孢杆菌,短杆菌,棒状杆菌,中华根瘤菌,黄杆菌,克雷伯杆菌,肠杆菌,乳杆菌属,乳球菌属,细杆菌属,葡萄球菌链霉菌属和假单胞菌属。在本发明的载体的一个方面中,宿主细胞是选自下组的细菌细胞:枯草芽孢杆菌(B.subtilis)、潘蒂芽孢杆菌(B.puntis)、巨大芽孢杆菌(B.megaterium)、耐盐芽孢杆菌(B.halodurans)、短小芽孢杆菌(B.pumilus)、氧化葡萄糖酸杆菌(G.oxydans)、新月柄杆菌CB15(Caulobactertcrescentus CB 15)、扭脱甲基杆菌(Methylobacterium extorquens)、类球红细菌(Rhodobacter sphaeroides)、黄质假单胞菌(Pseudomonas zeaxanthinifaciens)、脱氮副球菌(Paracoccus denitrificans)、谷氨酸棒杆菌(C.glutamicum)、肉葡萄球菌(Staphylococcus carnosus)、浅青紫链霉菌(Streptomyces lividans)、苜蓿中华根瘤菌(Sinorhizobium melioti)和放射根瘤菌(Rhizobium radiobacter)。
在本发明的载体的另一个实施方式中,合适的宿主细胞是曲霉属,白僵菌属,克鲁维酵母属,青霉属,酵母属或踝节菌属物种。
优选地,宿主细胞是枯草芽孢杆菌,解淀粉芽孢杆菌,地衣芽孢杆菌,大肠杆菌,尼日尔曲霉或米曲霉种。
根据本发明的重组宿主细胞可以包含本发明的多核苷酸或本发明的载体。
在本发明的重组宿主细胞的一个实施方式中,重组宿主细胞能够表达或过表达本发明的多核苷酸或本发明的载体。
本发明的用于制备本发明的多核苷酸或本发明的载体的方法包括以下步骤:培养用所述多核苷酸或所述载体转化的宿主细胞,并从所述宿主细胞中分离所述多核苷酸或所述载体。
优选芽孢杆菌菌株的细胞,例如,嗜碱芽孢杆菌(Bacillus alkalophilus)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、短芽孢杆菌(Bacillus brevis)、环状芽孢杆菌(Bacillus circulans)、克氏芽孢杆菌(Bacillus clausii)、凝结芽孢杆菌(Bacilluscoagulans)、坚强芽孢杆菌(Bacillus firmus)、灿烂芽孢杆菌(Bacillus lautus)、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌(Bacillus licheniformis)、巨大芽孢杆菌(Bacillus megaterium)、短小芽孢杆菌(Bacillus pumilus)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、枯草芽孢杆菌(Bacillus subtilis)、或苏云金芽孢杆菌(Bacillus thuringiensis);或链霉菌菌株的细胞,例如,浅青紫链霉菌(Streptomyceslividans)或鼠灰链霉菌(Streptomyces murinus);或来自革兰氏阴性菌,例如,大肠杆菌或假单胞菌(Long Liu等,Appl Microbiol Biotechnol(2013)97:6113-6127和Kay Terpe,Appl Microbiol Biotechnol(2006)72:211-222)。
根据另一个方面,宿主细胞是真核宿主细胞。在一个实施方式中,真核细胞是真菌细胞,即酵母细胞,例如假丝酵母,汉逊酵母,克鲁维酵母,毕赤酵母,酵母属,裂殖酵母属或耶氏酵母属菌株。优选地,酵母细胞是乳酸克鲁维酵母,酿酒酵母,多形汉逊酵母,解脂耶氏酵母,巴斯德毕赤酵母或丝状真菌细胞。
丝状真菌包括细分为真菌纲和卵菌纲的所有丝状形式(由Hawksworth等定义,《Ainsworth和Bisby真菌词典》(Ainsworth and Bisby′s Dictionary of the Fungi),第8版,1995,CAB International,大学出版社(University Press),英国剑桥)。丝状真菌的特征在于由壳多糖,纤维素,葡聚糖,壳聚糖,甘露聚糖和其他复合多糖组成的菌丝体壁。营养生长是通过菌丝伸长和碳分解代谢是绝对好氧的。丝状真菌菌株包括但不限于顶孢菌属、伞菌属、曲霉属、短梗霉属、粟酒孢菌属、鬼伞属、隐球菌属、线黑粉菌属、镰刀霉属、腐质霉属、稻痕菌属、毛霉菌属、毁丝霉属、新美鞭菌属、脉孢菌属、拟青霉属、青梅属、胃梨囊霉属、平革菌属、侧耳、裂褶菌、踝节菌属、热子囊菌属、梭孢壳属、弯颈霉属和木霉属。在一个实施方式中,使用丝状真菌细胞属于曲霉属,芽孢杆菌属,青霉属,塔拉酵母属,镰刀菌属或木霉属的物种,优选为黑曲霉,泡盛曲霉,烟曲霉,大豆曲霉,烟曲霉,马鞭草霉,米曲霉(Chrysosporium lucknowense),嗜热丝孢菌(Thermocophorora thermophila),尖孢镰刀菌(Fusarium oxysporum),里氏木霉(Trichoderma reesei)或产黄青霉(Penicilliumchrysogenum)。
可以选择宿主细胞,其在翻译后以特定的所需方式修饰和处理编码的酶。蛋白质产物的这种翻译后修饰(例如糖基化)和加工(例如,切割)可促进蛋白质的最佳功能。各种宿主细胞对蛋白质和基因产物的翻译后加工和修饰具有特征性和特定的机制。可以选择合适的细胞系或分子生物学和/或微生物学领域的技术人员熟悉的宿主系统,以确保产生的外源蛋白质的期望和正确的修饰和加工。例如,在一个实施方式中,枯草杆菌蛋白酶BPN’变体或其同源物最初以初前酶分泌,并且77氨基酸前序列的存在对于体内产生成熟枯草杆菌蛋白酶而言是重要的,但必须被切割以获得完全催化活性。
本发明的生产酶的方法通常包括培养重组宿主细胞,例如,在表达编码所述酶的编码序列的条件下用表达载体转化或转染,并从细胞或培养基中回收和纯化产生的酶。本发明的多核苷酸可以整合到重组可复制载体中,例如,表达载体或复制载体。转录载体用于扩增其插入片段。
将遗传信息传递给另一个细胞的载体的目的通常是分离、增殖或表达靶细胞中的插入片段。称为表达载体(表达构建体)的载体特异性用于靶细胞中表达转基因,并且通常具有驱动转基因表达的启动子序列。称为转录载体的更简单载体仅能够被转录但不能被翻译:与表达载体不同,它们可以在靶细胞中复制但不表达。转录载体用于扩增其插入片段。因此,在另一个实施方式中,本发明提供了通过将本发明的多核苷酸引入可复制载体中,将载体导入相容性宿主细胞中并在使得宿主细胞产生载体复制的条件下生长来制备本发明的多核苷酸的方法。可从宿主细胞中回收载体。
优选地,本发明的酶是作为分泌蛋白质产生的,在这种情况下,表达构建体中编码成熟形式的酶的核苷酸序列与编码信号序列的核苷酸序列可操作地连接。优选地,信号序列是天然的(同源的),本文也称为编码该酶的核苷酸序列的“野生型”。或者,信号序列相对于编码酶的核苷酸序列是外来的(异源的),在这种情况下,信号序列优选是内源于其中表达本发明的核苷酸序列的宿主细胞。杆菌的合适信号序列的示例可发现于“van Dijl,J.M.等,2001.In:Sonenshein,A.L.,Hoch,J.A.和Losick,R.编,枯草杆菌及其近亲:从基因到细胞(Bacillus subtilis and its closest relatives:from genes to cells).哥伦比亚特区华盛顿:ASM出版社,第337-355页”和“Degering C等,Appl Environ Microbiol.2010年10月;76(19):6370-6.”
异源蛋白在酵母中的表达是众所周知的。Sherman,F等,《酵母遗传方法》(Methodsin Yeast Genetics),冷泉港实验室(1982)是一种公认的工作,描述了可用于在酵母中表达蛋白质的各种方法。用于表达的载体,菌株和方案,例如,酵母属和毕赤酵母属是本领域公知的,可从商业供应商获得(例如,英杰公司(Invitrogen))。合适的载体通常具有表达控制序列,例如启动子,包括3-磷酸甘油酸激酶或醇氧化酶,以及所需的复制起点,终止序列等。更具体地,合适的酵母信号序列是来自酵母α-因子基因的序列。类似地,丝状真菌宿主细胞的合适的信号序列是例如,来自丝状真菌淀粉葡糖苷酶(AG)基因的信号序列,例如,黑曲霉g/aA基因。这可以与淀粉葡糖苷酶(也称为(gluco)淀粉酶)启动子本身以及与其它启动子组合使用。混合信号序列也可以与本发明的内容一起使用。优选的异源分泌前导序列是来自真菌淀粉葡糖苷酶(AG)基因(g/aA-来自曲霉属的18和24个氨基酸形式),α-因子基因(酵母例如酵母属和克鲁维酵母)或[α-淀粉酶(amyE,amyQ和amyL)和碱性蛋白酶aprE和中性蛋白酶基因(芽孢杆菌)。
还可以选择异源宿主细胞,其中本发明的酶以基本上没有可干扰应用的酶活性的形式产生,例如,没有降解或修饰酶的肽。具体地,在产生变体的情况下,宿主细胞不应产生任何野生型酶。这可以通过选择通常不产生这种酶的宿主细胞或通过本领域已知的技术故意去除相应的基因来实现。
本发明包括通过重组表达编码本发明的酶的DNA序列来生产本发明的酶的方法。为此目的,本发明的DNA序列可用于表达信号的基因扩增和/或交换,例如启动子,分泌信号序列,以便允许酶在合适的同源或异源宿主细胞中经济地生产。同源宿主细胞是与获得DNA序列的物种相同物种或相同物种内的变体的宿主细胞。宿主细胞可能过表达酶,并且用于工程过表达的技术是众所周知的。因此,宿主可以具有编码多核苷酸的两个或多个拷贝(并且因此该载体可以相应地具有两个或多个拷贝)。因此,在本发明的一个实施方式中,本发明的重组宿主细胞能够表达或过表达本发明的多核苷酸或载体。
本发明的另一方面是制备本发明的酶的方法,其包括(a)在制备本发明的酶的条件下培养本发明的重组宿主细胞;和(b)任选地从细胞培养基中回收本发明的酶。对于启动子和宿主细胞的每种组合,可获得可用于表达编码该酶的DNA序列的培养条件。达到所需细胞密度或酶的滴度后,停止培养,并回收酶。术语“培养”包括维持和/或生长本发明的活重组宿主细胞,特别是本发明的重组宿主细胞。
一方面,将本发明的重组宿主细胞在液体培养基中培养。另一方面,将重组宿主细胞在固体培养基或半固体培养基中培养。优选地,本发明的重组宿主细胞在包含对重组宿主细胞的维持和/或生长至关重要或有益的营养素的液体培养基中培养。可以通过常规培养方法如立式培养,试管培养,振荡培养,通气旋转培养或发酵,连续或间歇地在液体培养基中培养重组宿主细胞。优选地,将重组宿主细胞在发酵罐中培养。本发明的发酵方法包括分批、补料分批和连续发酵方法。已经开发了多种这样的方法,并且是本领域公知的。
重组宿主细胞优选在受控pH下培养。在一个实施方式中,可以在4.5至8.5,优选6.0至8.5,更优选在约7的pH下培养重组宿主细胞。可以通过本领域技术人员已知的任何方法来维持所需的pH。
优选地,在受控的通气和受控温度下进一步培养重组宿主细胞。在一个实施方式中,受控温度包括15至70℃之间的温度,优选温度在20至55℃之间,更优选在30至50℃之间。通常根据表达宿主和待产生的蛋白质的选择来选择合适的条件。
在具体实施方式中,酶在芽孢杆菌菌株GX4935中表达(参见实施例)。在需氧条件下,在合适的发酵培养基中培养菌株。除了无机盐之外,合适的培养基可以含有可吸收的碳和氮源,任选地还含有促进生长的营养物质例如酵母提取物。发酵通常在35-40℃和6.5-7.5的pH下进行,优选通过自动方式保持大致恒定。该酶被分泌到培养基中。在发酵结束时,如果需要,可以通过本领域技术人员已知的方法杀死生产宿主。随后的发酵液可以例如通过过滤或离心从其中除去细菌细胞、碎屑与其它固体。可以进一步澄清含有酶的滤液或上清液,例如通过过滤或离心,然后根据需要例如通过超滤或在蒸发器中减压浓缩,得到浓缩物,如果需要,可将其浓缩至干,例如通过冻干或喷雾干燥。
发酵后,如果需要,可以通过离心或过滤从发酵液中除去细胞。在发酵停止或除去细胞后,然后可以回收本发明的酶,如果需要,通过常规方法纯化和分离,包括但不限于用常规树脂处理,用常规吸附剂处理,改变pH,溶剂萃取,透析,过滤,浓缩,结晶,重结晶,pH调节,冻干等。例如,根据本发明的酶可以通过本领域已知的方法(《蛋白质纯化方案》(Protein Purification Protocols),Paul Cutler的分子生物学方法系列,Humana出版社,2004)从重组细胞培养物中回收并纯化。通常,当所得制剂基本上不含其它组分时,化合物是“分离的”。
在一个实施方案中,提供分离的酶制剂,其纯度为本发明的酶的约80%(干重)或更多(即组分或发酵副产物小于全部培养基的约20%)。在一个具体实施方式中,本发明提供纯度为约90%或更高,优选纯度为95%或更高,特别是纯度为98%或更高的本发明的酶。实际上,在本发明的分离的酶制剂中可能存在少量的其它成分。因此,酶的纯化制剂可以包含99%或更少,尤其是98%或更少的酶。
然而,或者,本发明的酶不从重组宿主细胞或培养物中纯化。可以将整个培养物或培养物上清液用作酶的来源。在具体实施方式中,使用含有酶的培养物或培养物上清液而无需实质修饰。
进一步注意到,也可以通过已知的化学蛋白质合成技术,例如通过固相肽合成来制备本发明的酶,例如枯草杆菌蛋白酶BPN’变体。然而,枯草杆菌蛋白酶突变体在微生物宿主细胞中的表达通常是优选的,因为这将允许微生物宿主细胞以对于酶活性适当的构象形式产生枯草杆菌蛋白酶。然而,应该可以将不正确折叠的枯草杆菌蛋白酶BPN’变体或其同源物转化为活性构象。
本发明的酶(枯草杆菌蛋白酶BPN’变体或其同系物)可以是化学或生物化学修饰的,例如,翻译后修饰。例如,它们可以是糖基化的或包含修饰的氨基酸残基。如上所述,它们也可以通过添加标签来修饰。这类修饰的多肽和蛋白质在本发明的术语“酶”的范围内。
为了进一步说明本发明及其优点,给出以下具体实施例,应理解,其仅作为说明性和限制性的目的。
实施例
本发明(用途)的酶的生产
诱变、克隆和表达
编码枯草杆菌蛋白酶BS149(Ruan等,2008)的基因得自Philip N.Bryan(马里兰大学生物技术研究所,9600Gudelsky Drive,Rockville,Maryland20850)。使用具有BS149基因的pUB110基大肠杆菌-枯草芽孢杆菌(E.coli-B.subtilis)穿梭载体,使用天然启动子或替代地使用aprE启动子和任选的C末端his标签进行诱变(pBE-S DNA,http://www.clontech.com/takara)。通过使用定点诱变方法(Sambrook等,1989)将突变S221C和P225A引入BS149基因中构建了编码本发明的酶的基因。所有引物均使用Agilent Primer设计工具(http://www.genomics.agilent.com)设计。通过DNA测序验证构建的序列,然后转化到枯草芽孢杆菌GX4935中。
为了生产没有His标签的BS149-DM,编码BS149-DM及其天然启动子序列的基因在EcoRI/BamHI位点处克隆到pBS42穿梭载体(DSMZ,Germany)中。将连接混合物转化到感受态大肠杆菌中,将转化体铺在含有氯霉素(34μg/mL)的LB平板上。质粒pBS42-S5在大肠杆菌中繁殖,分离并通过测序验证。序列验证的质粒用于转化枯草芽孢杆菌宿主。
使用MluI和BamHI位点将编码具有His标签的BS149-DM的基因克隆到pUB-110基大肠杆菌-枯草芽孢杆菌穿梭载体(pBES)中(图12)。编码本发明的酶(多肽)和编码的酶的基因(BS149-DM)的多核苷酸序列示于SEQUENCE ID NO 5中。相应的氨基酸序列根据枯草杆菌蛋白酶BPN’编号方案编号。氨基酸-107至-1包含信号序列,前序列和初序列在完全成熟后被切去。氨基酸1-275包含具有完全催化活性的成熟酶。为了能够快速高效地纯化,在氨基酸275之后连接C末端His标签,如SEQ ID NO NO 5所示。作为去除钙结合位点的结果,与枯草杆菌蛋白酶BPN’中包含对应于L75,N76,N77,S78,I79,G80,V81,L82和G83的氨基酸的枯草杆菌蛋白酶BPN′相比较,BS149-DM含有9个氨基酸的缺失。为了保持BS149-DM的枯草杆菌蛋白酶BPN’编号,编号从74跳到83。在穿梭载体中,该基因的表达受aprE启动子的控制。载体含有用于芽孢杆菌和卡那霉素抗性标记物的pUB复制起点。该载体还含有ColE1复制起点和用于在大肠杆菌中维持的氨苄青霉素抗性标记物。将得到的质粒pBES-BS149DMHIS在大肠杆菌TOP10中繁殖并转化到枯草芽孢杆菌GX4935(ΔnprE ΔaprE)中。使用pBES-BS149DMHIS作为模板,通过Quikchange方法(安捷伦公司(Agilent))进行诱变。或者可以使用本领域已知的其它定点诱变方法(Sambrook等,1989)。
在DNA2.0pJ201克隆载体中的枯草杆菌连接酶(Abrahmsén等人,1991)的基因在DNA2.0(https://www.dna20.com/)上订购,并重新克隆到大肠杆菌-枯草芽孢杆菌穿梭载体(来自DSMZ的pBS42 DSM 8748;pBS42-S5)中。含有枯草杆菌连接酶的pJ201载体(DNA2.0)以及pBS42穿梭载体(DSMZ)用EcoRI和BamHI(NEB)消化。从凝胶中分离线性穿梭载体以及枯草杆菌连接酶插入片段(LigaFast,普洛麦格公司(Promega))。将构建体转化到大肠杆菌MM294菌株(DSMZ)中。质粒pBS42-S5在大肠杆菌中繁殖,分离并通过测序验证(图13)。将验证的DNA用于枯草芽孢杆菌DB104或枯草芽孢杆菌GX4935的转化。枯草芽孢杆菌GX4935菌株具有降低的胞外蛋白水解活性(Kawamura和Doi1984;Fahnestock和Fisher 1987)。由Abrahmsén等1991报道,没有必要添加野生型枯草杆菌蛋白酶以促进成熟形式的产生。
除了实施例23中的枯草杆菌连接酶和不含His标签的BS149-DM外,在所有实验中,利用C末端His标签制备酶。
枯草杆菌蛋白酶BPN’变体的产生和纯化:
挑选pBS42穿梭载体中的转化体,并在含有10μg/mL氯霉素的LB平板上于37℃培养16小时,挑取并接种到含有10μg/mL氯霉素的5mL LB肉汤中。在37℃下孵育16小时后,将1%(v/v)培养物接种到1升terrific肉汤(12g/1胰蛋白胨,24g/1酵母提取物,0.4%(v/v)甘油,17mM KH2PO4和72mM K2HPO4,50mg/L Trp,50mg/L Lys,50mg/L Met)。培养物在37℃下剧烈摇动培养,继续孵育48小时。48小时表达后,通过在4℃下6,000g离心20分钟,从培养基中分离细胞。随后,将5g CaCl2加入到培养基中,将pH调节至7.5。通过在4℃下6,000g离心20分钟,使沉淀物沉淀。将硫酸铵加入到上清液中至终浓度为45%(w/v)以沉淀酶。通过在4℃下8,000g离心40分钟收集沉淀的酶。沉淀物用80%丙酮洗涤,并重悬于15mL水中。使用HiPrep 26/10脱盐柱(GE医疗)在缓冲液(20mM N-三(羟甲基)甲基甘氨酸,1mM CaCl2pH7.5)中对蛋白质样品进行脱盐。将脱盐蛋白质加载在HiTrap Q HP柱(GE医疗)上。收集并浓缩含有酶的流穿物(flowthrough)。通过SDS-PAGE分析蛋白质的纯度,并通过测量280nm处的吸光度来测定酶浓度(Stoscheck,CM.蛋白质定量(Quantitative of Protein),Methodsin Enzymology 182:50-69,1990),例如,通过NanoDrop分光光度计(赛默飞世尔科技公司(Thermo Fisher Scientific Inc))。根据Gasteiger E.,Hoogland C.,Gattiker A.,Duvaud S.,Wilkins M.R.,Appel R.D.,Bairoch A,可以在http://web.expasy.org/protparam/上计算得到的具体消光系数。ExPASy服务器上的蛋白质鉴定和分析工具;(于)John M.Walker(编):《蛋白组学方案手册》(The Proteomics Protocols Handbook),Humana出版社(2005),第571-607页。约90%或更高的纯度是可行的。在20mM N-三(羟甲基)甲基甘氨酸,1mM CaCl2pH7.5的水溶液中以约2mg/mL的浓度提供所得的酶。该酶溶液原样用于(寡)肽片段缩合和环化。
携带His-标签的合成枯草杆菌蛋白酶BPN’变体的生产和纯化:
将含有具有感兴趣的枯草杆菌蛋白酶变体基因的质粒的枯草芽孢杆菌的单个微生物菌落在37℃下在摇动培养箱中接种于含有卡那霉素(10μg/mL)的5mL LB中。向补充有抗生素(卡那霉素10μg/mL)和氨基酸(100mg/L Trp,100mg/L Met和100mg/L Lys)的30mLTerrific肉汤中加入0.6mL过夜培养物。细胞在37℃下在摇动培养箱(200rpm)中生长48小时。通过离心(15分钟,4000rpm,4℃)收获细胞。在两个离心步骤(15分钟,4000rpm,4℃)中倾析培养基(30mL)并在Amicon离心装置(15ml,10kDa MW截止值)上浓缩。然后将浓缩的培养基(0.5ml)在三个洗涤/浓缩步骤(14ml缓冲液A,10分钟,4000rpm,4℃)中更换为缓冲液A(25mM N-三(羟甲基)甲基甘氨酸,pH 7.5,0.5M NaCl,20mM咪唑))。对于His标签纯化,将Talon树脂(2.5ml,Clonetech)加入到塑料柱筒中。树脂用5mL的MilliQ水洗涤并用5mL缓冲液A平衡。将粗酶加载到柱上,用5mL缓冲液A洗涤。酶用5mL缓冲液B(25mM N-三(羟甲基)甲基甘氨酸,pH 7.5,0.5M NaCl,200mM咪唑)洗脱。通过离心(15分钟,4000rpm,4℃)将洗脱液在Amicon离心单元(5ml,10kDa MW截止值)上浓缩,并在三次洗涤/浓缩步骤中将缓冲液更换为25mM N-三(羟甲基)甲基甘氨酸,pH 7.5(5ml缓冲液,10分钟,4000rpm,4℃)。
如上所述测定纯度和酶浓度。纯度大于90%。所得到的含有约2mg/ml所得酶的水溶液(25mM N-三(羟甲基)甲基甘氨酸,pH 7.5)用于(寡)肽片段缩合和环化。
参考文献
Abrahmsén,L,J Tom,J Burnier,K A Butcher,A Kossiakoff和J A Wells.1991.工程改造枯草杆菌蛋白酶及其底物用于水溶液中肽键的高效连接(EngineeringSubtilisin and Its Substrates for Efficient Ligation of Peptide Bonds inAqueous Solution.)Biochemistry 30(17)(4月30日):4151-9.http://www.ncbi.nlm.nih.gov/pubmed/2021606.
Fahnestock SR,Fisher KE:通过使用来自解淀粉芽孢杆菌α-淀粉酶基因的启动子的基因融合在枯草芽孢杆菌中表达葡萄球菌蛋白A基因(Expression of thestaphylococcal protein A gene in Bacillus subtilis by gene fusions utilizingthe promoter from a Bacillus amyloliquefaciens alpha-amylase gene).JBacteriol.1986年3月;165(3):796-804
Kawamura,Fujio,和Roy H.Doi.构建枯草芽孢杆菌双突变体缺乏细胞外碱性和中性蛋白酶(Construction of a Bacillus subtilis double mutant deficient inextracellular alkaline and neutral proteases).J Bacteriol.1984年10月;160(1):442-4
Ruan,Biao,Viktoriya London,Kathryn E Fisher,D Travis Gallagher,和Philip N Bryan.枯草杆菌蛋白酶的工程改造底物偏好:特异性突变体的结构和动力学分析(Engineering substrate preference in subtilisin:structural and kineticanalysis of a specificity mutant).Biochemistry.2008年6月24日;47(25):6628-36.
Sambrook J,Fritsch EF,Maniatis T.1989.《分子克隆:实验室手册》(MolecularCloning:A Laboratory Manual).第2版.冷泉港实验室出版社,纽约冷泉港.
Wells,James A,Eugenio Ferrari,Dennis J Henner,David A Estell,和EllsonY Chen.解淀粉芽孢杆菌枯草杆菌蛋白酶在枯草芽孢杆菌中的克隆、测序和分泌(Cloning,sequencing,and secretion of Bacillus amyloliquefaciens subtilisin in Bacillussubtilis).Nucleic Acids Res.1983年11月25日;11(22):7911-25.
酶促片段缩合和环化实施例
材料和方法
除非另有说明,否则从商业来源获得化学物不经进一步纯化即可使用。使用反相柱(Phenomenex,C18,5μm粒径,150×4.6mm)在HP1090液相色谱仪上在40℃下进行分析型HPLC。使用UV-VIS 204线性光谱仪在220nm下进行UV检测。梯度程序为:0-25分钟从5%到98%洗脱剂B的线性梯度和25.1-30分钟的5%洗脱液B(洗脱剂A:H2O中为0.5mL/L甲磺酸(MSA),洗脱剂B 0.5mL/L乙腈中的MSA)。流量从0-25.1分钟为1mL/分钟,从25.2-29.8分钟为2mL/分钟,然后回到1mL/分钟,直至30分钟时停止。注射体积为20μL。使用固相柱(Pursuit XRs,C18,10μm粒径,500×41.4mm)的Varian PrepStar系统进行制备型HPLC。在Agilent1200系列液相色谱仪上,使用反相柱(Phenomenex,C18,5μm粒度,150×4.6mm)在40℃下进行LC-MS。UV检测和梯度程序如分析型HPLC所述。使用Agilent 6130四极杆LC/MS系统测定分子量。
方案1:如下所述合成N-Fmoc-保护的(寡)肽-OCam酯:
用二氯甲烷(DCM,2×2分钟,10mL)和1-甲基-2-吡咯烷酮(NMP,2×2分钟,10mL)洗涤1克Rink树脂(4-((2,4-二甲氧基苯基)(Fmoc氨基)甲基)苯氧基烷基接头,载量为0.64mmol/g)并使用哌啶/NMP(1/4,v/v,2×8分钟,10mL)进行Fmoc脱保护。用NMP(2×2分钟,10mL),DCM(2×2分钟,10mL)和NMP(2×2分钟,10mL)洗涤后,使用DCM中的HOAt(4当量)和DCC(4当量)将碘乙酸(4当量)与树脂偶联(45分钟,10mL)。用NMP(2×2分钟,10mL),DCM(2×2分钟,10mL)和THF(2×2分钟,10mL)洗涤后,使用DMF/THF(1/1,v/v,10mL)中的10当量DiPEA和4当量Fmoc-Xxx-OH用Fmoc保护的氨基酸于50℃加载树脂20小时。在此和本公开的其他部分中,“Xxx”代表一个氨基酸(如下文所示的附图中所示的变体)。
用DMF(2×2分钟,10mL),DCM(2×2分钟,10mL)和NMP(2×2分钟,10mL)洗涤后,遵循标准SPPS方案来延伸肽(Weng C.Chan和Peter White,OUP Oxford,2000)。使用三氟乙酸(TFA)、三异丙基硅烷(TIS)和水(95/2.5/2.5,v/v/v,15mL)的混合物进行树脂切断和侧链脱保护120分钟。使用甲基叔丁基醚(MTBE)/正庚烷(1/1,v/v,50mL)沉淀粗肽。通过离心收集沉淀的肽,用MTBE/正庚烷(1/1,v/v,50mL)洗涤两次,然后从乙腈/水(1/1,v/v,50mL)中冷冻干燥。
方案2:如下所述合成N-Fmoc-保护的(寡)肽-OCam-Xxx-NH2酯:
用DCM(2×2分钟,10mL)和NMP(2×2分钟,10mL)洗涤1克Rink树脂,并用哌啶/NMP(1/4,v/v,2×8分钟,10mL)进行Fmoc去保护。用NMP(2×2分钟,10mL)、DCM(2×2分钟,10mL)和NMP(2×2分钟,10mL)洗涤后,用NMP(45分钟,10mL)中的HBTU(4当量)、HOBt(4当量)和DiPEA(8当量)将Fmoc-Xxx-OH(4当量)偶联至树脂。用NMP(2×2分钟,10mL),DCM(2×2分钟,10mL)和NMP(2×2分钟,10mL)洗涤后,使用哌啶/NMP(1/4,v/v,2×8分钟,10mL)对树脂进行Fmoc-去保护。用NMP(2×2分钟,10mL),DCM(2×2分钟,10mL)和NMP(2×2分钟,10mL)洗涤后,使用DCM中的DCC(4当量)和HOAt(4当量)偶联碘乙酸(4当量)(45分钟,10mL)。用NMP(2×2分钟,10mL),DCM(2×2分钟,10mL)和THF(2×2分钟,10mL)洗涤后,使用DMF/THF(1/1,v/v,10mL)中的10当量DiPEA和4当量Fmoc-Xxx-OH在50℃偶联Fmoc保护的氨基酸20小时。用DMF(2×2分钟,10mL),DCM(2×2分钟,10mL)和NMP(2×2分钟,10mL)洗涤后,遵循标准SPPS方案来延伸肽(Weng C.Chan和Peter White,OUP Oxford,2000)。使用TFA/TIS/水(95/2.5/2.5,v/v/v,15mL)的混合物进行树脂切断和侧链去保护120分钟。使用MTBE/正庚烷(1/1,v/v,50mL)沉淀粗肽。通过离心收集沉淀的肽,用MTBE/正庚烷(1/1,v/v,50mL)洗涤两次,然后从乙腈/水(1/1,v/v,50mL)中冷冻干燥。
方案3:如下所述合成N-Fmoc-保护的(寡)肽-OCam-Xxx-OH酯:
用DCM(2 x 2分钟,10mL)洗涤1g三苯甲基树脂(2-氯-氯代三苯甲基接头,载量1.0mmol/g)并且使用DCM(30分钟,10mL)中的DiPEA(5当量)将Fmoc-Xxx-OH(2当量)偶联至树脂。在用DMF(2 x 2分钟,10mL)洗涤后,未反应的氯代三苯甲基基团用DCM/MeOH/DiPEA(80/15/5,v/v/v,2 x 10分钟,10mL)加帽。用NMP(2×2分钟,10mL),DCM(2×2分钟,10mL)和NMP(2×2分钟,10mL)洗涤树脂,并使用哌啶/NMP(1/4,v/v,2×8分钟,10mL)对树脂进行Fmoc-去保护。用NMP(2×2分钟,10mL),DCM(2×2分钟,10mL)和NMP(2×2分钟,10mL)洗涤后,使用DCM中的DCC(4当量)和HOAt(4当量)偶联碘乙酸(4当量)(45分钟,10mL)。用NMP(2×2分钟,10mL),DCM(2×2分钟,10mL)和THF(2×2分钟,10mL)洗涤后,使用DMF/THF(1/1,v/v,10mL)中的10当量DiPEA和4当量Fmoc-Xxx-OH在50℃偶联Fmoc保护的氨基酸20小时。用DMF(2×2分钟,10mL),DCM(2×2分钟,10mL)和NMP(2×2分钟,10mL)洗涤后,遵循标准SPPS方案来延伸肽(Weng C.Chan和Peter White,OUP Oxford,2000)。使用TFA/TIS/水(95/2.5/2.5,v/v/v,15mL)的混合物进行树脂切断和侧链去保护120分钟。使用MTBE/正庚烷(1/1,v/v,50mL)沉淀粗肽。通过离心收集沉淀的肽,用MTBE/正庚烷(1/1,v/v,50mL)洗涤两次,然后从乙腈/水(1/1,v/v,50mL)中冷冻干燥。
方案4:如下所述合成(寡)肽C-末端酰胺亲核基团:
用DCM(2×2分钟,10mL)和NMP(2×2分钟,10mL)洗涤1克Rink树脂(4-((2,4-二甲氧基苯基)(Fmoc氨基)甲基)苯氧基烷基接头,载量为0.64mmol/g)并使用哌啶/NMP(1/4,v/v,2×8分钟,10mL)进行Fmoc脱保护。按照标准SPPS方案来延长肽(Weng C.Chan和PeterWhite,OUP Oxford,2000)。使用TFA/TIS/水(95/2.5/2.5,v/v/v,15mL)的混合物进行树脂切断和侧链去保护120分钟。使用MTBE/正庚烷(1/1,v/v,50mL)沉淀粗肽。通过离心收集沉淀的肽,用MTBE/正庚烷(1/1,v/v,50mL)洗涤两次,然后从乙腈/水(1/1,v/v,50mL)中冷冻干燥。
方案5:如下所述合成N-乙酰基-保护的(寡)肽活化的酯:
在按照方案1-3中任一项的所需序列的SPPS之后,使用哌啶/NMP(1/4,v/v,2 x 8分钟,10mL)对树脂结合的肽进行Fmoc-去保护。用NMP(2 x 2分钟,10mL)、DCM(2 x 2分钟,10mL)和NMP(2 x 2分钟,10mL)对树脂进行洗涤并且使用NMP(2 x 10分钟,10mL)中Ac2O(10体积%)、DiPEA(5体积%)、HOBt(0.2重量%)的混合物对肽N-末端胺功能进行乙酰化。用NMP(3 x 2分钟,10mL)和DCM(3 x 2分钟,10mL)洗涤树脂。使用TFA/TIS/水(95/2.5/2.5,v/v/v,15mL)的混合物进行树脂切断和侧链去保护120分钟。使用MTBE/正庚烷(1/1,v/v,50mL)沉淀粗肽。通过离心收集沉淀的肽,用MTBE/正庚烷(1/1,v/v,50mL)洗涤两次,然后从乙腈/水(1/1,v/v,50mL)中冷冻干燥。
方案6:如下所述合成(寡)肽C-末端酸:
用DCM(2 x 2分钟,10mL)洗涤1g三苯甲基树脂(2-氯-氯代三苯甲基接头,载量1.0mmol/g)并且使用DCM(30分钟,10mL)中的DiPEA(5当量)将Fmoc-Xxx-OH(2当量)在偶联至树脂。在用DMF(2 x 2分钟,10mL)洗涤后,未反应的氯代三苯甲基基团用DCM/MeOH/DiPEA(80/15/5,v/v/v,2 x 10分钟,10mL)加帽。用DMF(2×2分钟,10mL),DCM(2×2分钟,10mL)和NMP(2×2分钟,10mL)洗涤树脂,并遵循标准SPPS方案来延伸肽(Weng C.Chan和PeterWhite,OUP Oxford,2000)。使用TFA/TIS/水(95/2.5/2.5,v/v/v,15mL)的混合物进行树脂切断和侧链去保护120分钟。使用MTBE/正庚烷(1/1,v/v,50mL)沉淀粗肽。通过离心收集沉淀的肽,用MTBE/正庚烷(1/1,v/v,50mL)洗涤两次,然后从乙腈/水(1/1,v/v,50mL)中冷冻干燥。
方案7:合成部分保护的(寡)肽片段
在方案1-6之一的肽序列的SPPS期间,在所需位置,不同的(TFA稳定的)保护的氨基酸被偶联,例如Fmoc-Asp(OcHex)-OH、Fmoc-Glu(OBn)-OH或Fmoc-Lys(Alloc)-OH。使用TFA/TIS/水(95/2.5/2.5,v/v/v,15mL)的混合物进行树脂切断和侧链去保护120分钟,除了TFA稳定的cHex、Bn或Alloc不受影响。使用MTBE/正庚烷(1/1,v/v,50mL)沉淀粗肽。通过离心收集沉淀的肽,用MTBE/正庚烷(1/1,v/v,50mL)洗涤两次,然后从乙腈/水(1/1,v/v,50mL)中冷冻干燥。
偶联实施例
注:与SEQUENCE ID NO.2相比,表示为BS149-DM(SEQ ID NO:5)的酶含有氨基酸75-83的缺失和突变Q2K,S3C,P5S,S9A,I31L,K43N,M50F,A73L,E156S,G166S,G169A,S188P,Q206C,N212G,Y217L,N218S,S221C,P225A,T254A和Q271E。在本公开、公知常识和可选的有限量的常规(route)测试的基础上,本领域技术人员可以恢复以下的一个或多个突变Q2K,S3C,P5S,S9A,I31L,K43N,M50F,A73L,E156S,G166S,G169A,S188P,Q206C,N212G,Y217L,N218S,T254A和Q271E,或在Q2,S3,P5,S9,I31,K43,M50,A73,E156,G166,G169,S188,Q206,N212,N218S,T254,Q271位置中的一个或多个处进行不同的取代,同时与枯草杆菌连接酶相比仍然具有显着改善的性质(参见例如实施例24)。
与SEQUENCE ID NO:2相比,表示为枯草杆菌连接酶的酶含有突变S221C和P225A。
实施例1-23中使用的本发明的酶具有BS149-DM的所有突变,以及实施例中提到的任选的其他突变。
如下所示,使用上述技术制备具有其他突变的酶。
实施例1:使用不同BS149-DM突变体的酶促寡肽片段偶联:
为了测试不同突变体的活性和S/H比,进行了以下标准反应。将800μL磷酸盐缓冲液(100mM,pH 8.0)加入到100μL三肽C-末端酰胺母液(300μL水中0.01mmol H-Ala-Leu-Arg-NH2.2TFA)和100μL五肽C-末端Cam-酯母液(1200μL水中0.01mmol Ac-Asp-Phe-Ser-Lys-Leu-OCam.TFA)。向该混合物中加入5.5μg酶,并将反应混合物在室温下摇晃(150rpm)。30分钟后,抽出500μL等份的反应混合物,并用500μL MSA/水(1/99,v/v)淬灭并通过LC-MS分析。将产物,水解的五肽C-末端Cam-酯和剩余的五肽C-末端Cam-酯峰取积分。
不同BS149-DM突变体的活性定义为在规定的反应时间内,产物量和水解五肽C-末端Cam-酯的量的总和除以产物的量、水解的五肽C-末端Cam-酯和剩余的Cam-酯的总和。最活跃的突变体设定为100%(参见图1A)。不同BS149-DM突变体的S/H比定义为在指定时间内的产物的量除以水解五肽C-末端Cam-酯的量(参见图1B)。
除非另有规定,否则以相同的方式测定其他实施例中的活性和S/H比。
结论:显然,与枯草杆菌连接酶相比,BS149-DM具有高两倍的活性和改善的S/H比(1.8对0.9)。M222位置对于酶的S/H比非常重要。使用BS149-DM的M222G和M222P突变体获得了非常好的结果。所有含有P4袋突变(位置Y104,I107和L135)的BS149-DM变体具有与BS149-DM相当的S/H比。然而,对于某些突变,BS149-DM变体的活性显著改善。突变Y104S,I107V,L135D,L135N和L135S获得了特别好的结果。当组合P4袋突变时,获得具有甚至更高活性的BS149-DM变体,即I107V+L135S和I107V+L135N。当P4袋突变与P1’袋突变组合时,获得了与BS149-DM相比具有增加的S/H比的非常活跃的BS149-DM变体,例如,I107V+M222G。
实施例2:使用不同的BS149-DM+M222P+L217突变体的酶促寡肽片段偶联:
为了测试不同突变体的活性和S/H比,进行与实施例1中所述相同的反应。不同BS149-DM+M222P+L217突变体的活性定义为产物的量和水解寡肽C-末端Cam-酯的量的总量除以产物、水解的寡肽C-末端、Cam-酯和剩余的Cam-酯的量的总量。最活跃的突变体设定为100%(参见图2A)。不同BS149-DM+M222P+L217突变体的S/H比定义为产物的量除以水解的C-末端Cam-酯的量(参见图2B)。
结论:很明显,与枯草杆菌连接酶相比,所有的BS149-DM+M222P+L217突变体都具有改善的S/H和类似或改善的活性,其中一些与BS149-DM+M222P相比具有增加的活性。突变L217N,L217T,L217E,L217I,L217V和L217A获得了特别好的结果。L217位置证明不仅对于活性和S/H比非常重要,而且对于底物的范围更为重要,如实施例5所述。
实施例3:绘制含有P4袋突变(位置Y104,I107和L135)的不同BS149-DM突变体的P4袋底物特异性:
为了确定不同突变体的P4袋底物特异性,进行以下标准反应。将800μL磷酸盐缓冲液(100mM,pH 8.0)加入到100μL三肽C-末端酰胺母液(300μL水中0.01mmol H-Ala-Leu-Arg-NH2.2TFA)和200μL五肽C-末端Cam-酯母液(1.2mL水+1mL Acn中0.01mLAc-Asp-Xxx-Ser-Lys-Leu-OCam.TFA)。与所有这些肽酯进行偶联,区别在于该位置处的氨基酸,如图3A-3C所示。
向该混合物中加入5.5μg酶,并将反应混合物在室温下摇晃(150rpm)。30分钟后,抽出500μL等份的反应混合物,并用550μL MSA/水(1/99,v/v)淬灭并通过LC-MS分析。将产物,水解的五肽C-末端Cam-酯和剩余的五肽C-末端Cam-酯峰取积分。活性定义为在指定的反应时间内产物的量除以产物、水解五肽C-末端Cam-酯和剩余的五肽C-末端Cam-酯的量的总量。最活跃的底物设定为100%,见图3A-C。
结论:从图3A-C可以看出,具有P4突变(位置Y104,I107和/或L135)的BS149-DM突变体的P4底物范围明显不同于BS149-DM的范围,其对于各种肽序列可能有优势。几个突变体显示比BS149-DM更广泛的P4底物范围。特别是突变I107V、L135D、L135N和L135S的情况。
实施例4:绘制不同BS149-DM+M222突变体的P1′和P2′袋底物特异性:
为了确定不同突变体的P1’和P2’袋底物特异性,进行以下2个标准反应。将800μL磷酸盐缓冲液(100mM,pH 8.0)加入到100μL三肽C-末端酰胺母液(300μL水中H-Xxx-Leu-Arg-NH2.2TFA(对于P1’)和H-Ala-Xxx-Arg-NH2.2TFA(对于P2’))和100μL五肽C-末端Cam-酯母液(在1200μL水中0.01mmol Ac-Asp-Phe-Ser-Lys-Leu-OCam.TFA)。向该混合物中加入5.5μg酶,并将反应混合物在室温下摇晃(150rpm)。30分钟后,抽出500μL等份的反应混合物,并用550μL MSA/水(1/99,v/v)淬灭并通过LC-MS分析。将产物,水解的五肽C-末端Cam-酯和剩余的五肽C-末端Cam-酯峰取积分。活性定义为在指定的反应时间内产物的量除以产物、水解五肽C-末端Cam-酯和剩余的五肽C-末端Cam-酯的量的总量。最活跃的底物设为100%。不同BS149-DM+M222突变体的P1’和P2’袋底物特异性示于图4A-D。由于LC-MS峰中的重叠,没有测定与P1’位中色氨酸的偶联。
结论:从图4A-D显而易见,在位置M222处具有P1’突变的BS149-DM突变体的P1’和P2’底物范围明显不同于对于各种特定肽序列有利的BS149-DM突变体。几个突变体显示比BS 149-DM更广泛的P1’和P2’底物范围。特别是突变M222G和M222P的情况。
实施例5:绘制不同BS149-DM+M222P+L217突变体的P1’和P2’袋底物特异性:
为了确定不同突变体的P1’和P2’袋底物特异性,如实施例4所述进行相同的反应和分析。在图5A-L中显示了不同BS149-DM+M222P+L217突变体的P1’和P2’袋底物特异性。
结论:从图5A-L可以看出,在位置L217处具有P1’突变的BS149-DM+M222P突变体的P1’和P2’底物范围明显不同于BS149-DM+M222P,其对于各种特异性肽序列有利。几个突变体显示比BS149-DM更广泛的P1’和P2’底物范围。特别是突变L217G和L217H的情况。几种突变体对于某些特定的底物显示出显着改善的活性。例如,突变BS149-DM+M222P+L217N,E,G,Y,F或H的P1’袋中的Phe的改善的活性。突变体BS149-DM+M222P+L217H还显示出Asn在P1’袋中远远增加的活性。突变体BS149-DM+M222P+L217E和A对P1’袋中的Leu、Ile和Val具有改善的活性。突变体BS149-DM+M222P+L217T和S对P1’袋中的Asp具有改善的活性。
实施例6:绘制不同BS149-DM+M222G+L217突变体的P1’袋底物特异性:
为了确定不同突变体的P1’袋底物特异性,如实施例4所述进行相同的反应和分析。不同的BS149-DM+M222G+L217突变体的P1’袋底物特异性示于图6A-F中。
结论:从图6A-F可以看出,在位置L217处具有P1’突变的BS149-DM+M222G突变体的P1’底物范围明显不同于BS149-DM+M222G,其对于各种特定肽序列可能有利。几种突变体显示比BS149-DM更广泛的P1’底物范围。突变L217G和L217F的情况特别如此。几种突变体对于某些特定的底物显示出显著改善的活性。例如,突变BS149-DM+M222G+L217N,E,G,Y,F,I或H的P1’袋中Phe的改进的活性。突变体BS149-DM+M222G+L217F也显示出P1’袋里对Asn活性大大增加。突变体BS149-DM+M222G+L217F,G,A和Y对P1’袋中的Leu,Ile和Val具有改善的活性。突变体BS149-DM+M222G+L217R,T和S对P1’袋中的Asp具有改善的活性。
实施例7:绘制BS149-DM+M222G+I107V突变体的P1’、P2’和P4袋底物特异性:
为了确定BS149-DM+M222G+I107V的P1’和P2’袋底物特异性,按照实施例4所述进行相同的反应和分析。BS149-DM+M222G+I107V突变体的P1’和P2’袋底物特异性分别显示在图67A和B中。为了确定BS149-DM+M222G+I107V的P4袋底物特异性,如实施例3所述进行相同的反应和分析。BS 7C-M+M222G+I107V突变体的P4袋底物特异性示于图7C。
结论:从图7A-C可以看出,与BS149-DM相比,BS149-DM+M222G+I107V突变体的P1’和P2’底物范围以及P4底物范围更宽。显然,P1’和P2’袋(即M222G)和P4袋(即I107V)的有利突变可以成功地结合,因为底物宽度与BS149-DM+M222G突变体相当,但S/H比明显较高(见实施例1)。
实施例8:使用不同的N-乙酰基保护的寡肽C-末端Cam-酯酰基供体的酶促偶联反应:
肽连接反应在25℃下在含有15μM BS149-DM,10mM肽C-末端Cam-酯(Ac-Asp-Leu-Ser-Lys-Gln-OCam.TFA,Ac-Thr-Ser-Asp-Leu-Ser-Lys-Gln-OCam.TFA,Ac-Thr-Phe-Thr-Ser-Asp-Leu-Ser-Lys-Gln-OCam.TFA or Ac-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Leu-Ser-Lys-Gln-OCam.TFA)和15mM二肽C-末端酰胺(H-Ala-Phe-NH2)的100mM Tricine缓冲液(pH8.0)中进行。180分钟后,通过LC-MS分析反应混合物。将产物,水解的C-末端Cam-酯和剩余的Cam-酯峰取积分。不同反应的S/H比定义为在指定的反应时间内产物的量除以水解的C-末端Cam-酯的量。
表1:不同酰基供体与H-Ala-Phe-NH2的偶联
结论:可以使用不同长度的寡肽酰基供体。S/H比随着寡肽酰基供体的长度而增加。
实施例9:使用不同寡肽C-末端酰胺亲核基团的酶促偶联反应:
肽连接反应在25℃下在含有15μM BS149-DM,1mM五肽C-末端Cam-酯(Ac-Phe-Ile-Glu-Trp-Leu-OCam)和3mM肽胺亲核基团(H-Ala-Phe-NH2,H-Ala-Phe-Ala-NH2或H-Ala-Phe-Ala-Tyr-NH2)中进行。60分钟后,通过LC-MS分析反应混合物。将产物,水解的五肽C-末端Cam-酯和剩余的五肽C-末端Cam-酯峰取积分。不同反应的S/H比定义为在指定的反应时间内产物的量除以水解的五肽C-末端Cam-酯的量。
表2:不同寡肽亲核基团与Ac-Phe-Ile-Glu-Trp-Leu-OCam的偶联
肽C-末端Cam-酯 肽胺亲核基团 S/H比
Ac--Phe-Ile--Glu-Trp-Leu-OCam H-Ala-Phe-NH2 1.5
Ac--Phe-Ile--Glu-Trp-Leu-OCam H-Ala-Phe-Ala-NH2 1.7
Ac--Phe-Ile--Glu-Trp-Leu-OCam H-Ala-Phe-Ala-TyrNH2 1.9
结论:可以使用不同长度的寡肽亲核基团。S/H比随着寡肽亲核基团的长度而增加。
实施例10:pH值对BS149-DM+M222G突变体S/H比的影响:
为了检查pH对BS149-DM+M222G突变体的S/H比的影响,进行了以下标准反应。将800μL磷酸盐缓冲液(1M,pH 7.0-8.8)或N-三(羟甲基)甲基甘氨酸缓冲液(1M,pH 7.9-8.9)或碳酸盐缓冲液(1M,pH 9.2-10.6)加入到100μL三肽C-末端酰胺母液(在300μL水中0.01mmolH-Ala-Leu-Arg-NH2.2TFA)和100μL五肽C-末端Cam-酯母液(1.2mL水中0.01mmolAc-Asp-Phe-Ser-Lys-Leu-OCam.TFA)。向该混合物中加入5.5μg酶,并将反应混合物在室温下摇晃(150rpm)。30分钟后,抽出550μL等份的反应混合物,用50μL MSA淬灭并用LC-MS分析。将产物,水解的五肽C-末端Cam-酯和剩余的五肽C-末端Cam-酯峰取积分,并将S/H比定义为在规定的反应时间内,产物的量除以水解的五肽C-末端Cam-酯的量,见图8。
结论:BS149-DM+M222G的S/H比取决于pH值,在pH 8和pH 9之间存在明显的最佳值,但也可以使用较低或更高的pH值,这取决于寡肽的溶解度和稳定性。
实施例11:酰基供体和亲核基团浓度对BS149-DM+M222G的S/H比的影响:
为了检查底物浓度对突变体BS149-DM+M222G的S/H比的影响,进行了以下反应。制备150μL水中的三肽C-末端酰胺(12.9mg H-Glu-Leu-Arg-NH2.2TFA或11.7mg H-Ala-Leu-Arg-NH2.2TFA)和C-末端五肽Cam-酯(4.2mg Ac-Asp-Phe-Ser-Lys-Leu-OCam.TFA)。混合物用5.1μL NaOH(水中32重量%)调至中性pH。为了制备具有不同浓度底物的反应混合物,将10μL上述母液之一用10、20、50、100、200、500、1000、2000、5000和10000μL磷酸盐缓冲液(1M,pH 8.5)稀释。向这些反应混合物中加入11μg BS149-DM+M222G,并将反应混合物在室温下摇动(150rpm)。30分钟后,抽出550μL等份的反应混合物,用50μL MSA淬灭并用LC-MS分析。将产物,水解的五肽C-末端Cam-酯和剩余的五肽C-末端Cam-酯峰取积分,并将S/H比定义为在规定的反应时间内,产物的量除以水解的五肽C-末端Cam-酯的量,见图9A和B。
结论:S/H比取决于底物浓度。根据亲核基团对酶的亲和性和寡肽的溶解度和稳定性,每个单独底物有最佳的底物浓度。
实施例12:给予酰基供体对使用BS149-DM+M222G的S/H比的影响:
为了检查给予酰基供体对突变体BS149-DM+M222G的S/H比的影响,进行以下两个反应。向两倍800μL的磷酸盐缓冲液中(100mM,pH 8.0)加入将100μL三肽C-末端酰胺母液(300μL水中0.01mmolH-Ala-Leu-Arg-NH2.2TFA)和5.5μg BS149-DM+M222G。向其中一种混合物中加入100μL五肽C-末端Cam-酯母液(1.2mL水中0.01mLAc-Asp-Phe-Ser-Lys-Leu-OCam.TFA),并将反应混合物在室温下振荡(150rpm)。向另一混合物中,每分钟以3.5μL的分数给予100μL五肽C-末端Cam-酯母液(1.2mL水中0.01mmol Ac-Asp-Phe-Ser-Lys-Leu-OCam.TFA),同时在室温下摇晃反应混合物(150rpm)。30分钟后,抽出两个反应混合物的550μL等份试样并用50μL MSA淬灭并通过LC-MS分析。对于两个反应,五肽C-末端Cam-酯起始原料的转化率为100%。将产物和水解的五肽C-末端Cam-酯峰取积分,并将S/H比定义为在指定的反应时间内产物的量除以水解的五肽C-末端Cam-酯的量。在t=0时添加所有酰基供体的反应的S/H比为2.45,其中每分钟给予酰基供体的反应的S/H比为2.73。
结论:通过及时给予寡肽C-末端Cam-酯可以提高S/H比。
实施例13:使用不同酶的寡肽C-末端Cam-酯的环化:
进行以下实验以确定枯草杆菌连接酶、BS149-DM和BS149-DM+M222G对于寡肽C-末端Cam-酯的环化的S/H比。
将800μL磷酸盐缓冲液(100mM,pH 8.0)加入到100μL含5mg/mL二硫苏糖醇的具有N-末端游离胺(0.01mmol H-Ala-Cys-Lys-Asn-Gly)的寡肽C末端Cam-酯的母液(1mL水中0.01mmolH-Ala-Cys-Lys-Asn-Gly-Gln-Thr-Asn-Cys-Tyr-Gln-Ser-Tyr-OCam.2TFA)中。向该混合物中加入5.5μg酶,并将反应混合物在室温下摇晃(150rpm)。30分钟后,抽出500μL等份的反应混合物,并用550μL MSA/水(1/99,v/v)淬灭并通过LC-MS分析。将产物,水解的C末端Cam-酯和剩余的Cam-酯起始物质峰取积分,将不同酶的S/H比定义为指定的反应时间内产物的量除以水解的C末端Cam-酯的量,见图10。
结论:显然,同样对于肽环化,与枯草杆菌连接酶相比,BS149-DM具有改善的S/H比。BS-149-DM+M222G突变体甚至具有更高的S/H比。
实施例14:使用BS149-DM+M222G在寡肽C-末端Cam-酯环化期间pH对S/H比的影响:
为了确定在寡肽C-末端Cam-酯环化期间pH对BS149-DM+M222G的S/H比的影响,进行了以下标准反应。将800μL磷酸盐缓冲液(1M,pH 5,6,7,8和9)加入到100μL含5mg/mL二硫苏糖醇的具有N-末端游离胺的十三肽C末端Cam-酯(1mL水中0.01mmol H-Ala-Cys-Lys-Asn-Gly-Gln-Thr-Asn-Cys-Tyr-Gln-Ser-Tyr-OCam.2TFA)的母液中。向该混合物中加入5.5μg BS149-DM+M222G,将反应混合物在室温下摇动(150rpm)。30分钟后,抽出550μL等份的反应混合物,用50μL MSA淬灭并用LC-MS分析。将产物,水解的C-末端Cam-酯和剩余的C-末端Cam-酯起始物质峰取积分,并将S/H比定义为指定的反应时间内,产物的量除以水解的C-末端Cam-酯的量,见图11。
结论:用于酶促寡肽环化的BS149-DM+M222G的S/H比值取决于pH值,尽管比酶促寡肽片段缩合的程度更小。
实施例15:与超过10个氨基酸长度的寡肽的片段缩合:
为了检查在水溶液中与较长寡肽的酶促裂解缩合是否可行,进行以下标准反应。将800μL磷酸盐缓冲液(1M,pH 8.0)加入到100μL十肽C-末端酰胺母液(300μL水中0.01mmolH-Ala-Leu-Met-Lys-Tyr-Asn-Ser-Thr-Glu-Val-NH2.2TFA)和200μL十三肽C-末端Cam-酯母液(1.2mL水+1mL DMF中0.01mmolFmoc-His-Ala-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Leu-Ser-Lys-Gln-OCam.2TFA)。向该混合物中加入5.5μg BS149-DM+M222G,将反应混合物在室温下摇动(150rpm)。30分钟后,抽出550μL等份的反应混合物,用50μLMSA淬灭并用LC-MS分析。将产物,水解的C-末端Cam-酯和剩余的C末端Cam-酯峰取积分。规定的反应时间内产物(Fmoc-His-Ala-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Leu-Ser-Lys-Gln-Ala-Leu-Met-Lys-Tyr-Asn-Ser-Thr-Glu-Val-NH2)的量为68面积%。
结论:使用较长肽的片段缩合是可行的。
实施例16:使用没有N-或C-末端保护基团的寡肽进行片段缩合:
为了检查没有显着的副产物形成的没有N-或C-末端保护基团的酶片段缩合是否可行,进行了以下标准反应。将800μL磷酸盐缓冲液(1M,pH 8.0)加入到100μL三肽C-末端羧酸母液(300μL水中0.01mmol H-Ala-Leu-Arg-OH.2TFA)和100μL N-末端游离胺五肽C-末端Cam-酯母液(1.2mL水中0.01mmol H-His-Ala-Glu-Gly-Thr-OCam.TFA)。向该混合物中加入5.5μg BS149-DM+M222G,将反应混合物在室温下摇动(150rpm)。30分钟后,抽出550μL等份的反应混合物,用50μL MSA淬灭并用LC-MS分析。将产物,水解的五肽C-末端Cam-酯和剩余的五肽C末端Cam-酯峰取积分。在规定的反应时间内,产物(H-His-Ala-Glu-Gly-Thr-Ala-Leu-Arg-OH)的量为74面积%。没有观察到副产物,表明在H-Ala-Leu-Arg-OH.2TFA的C-末端羧酸官能团上没有发生副反应,也没有在H-His-Ala-Glu-Gly-Thr-OCam的N-末端胺官能团发生副反应。
结论:一些寡肽序列可以成功地酶促连接而不使用N-或C-末端保护基团。
实施例17:使用寡肽C-末端Cam-Xxx-NH2或Cam-Xxx-OH酯的片段缩合:
为了检验Cam-Xxx-NH2或Cam-Xxx-OH酯的酶促片段缩合是否可行,进行以下标准反应。向100μL三肽C-末端酰胺母液(300μL水中0.01mmolH-Ala-Leu-Arg-NH2.2TFA)和100μL五肽C-末端Cam-酯母液(1.2mL水中0.01mmol Ac-Asp-Phe-Ser-Lys-Leu-OCam-Leu-OH.TFA,Ac-Asp-Phe-Ser-Lys-Leu-OCam-Leu-NH2.TFA,Ac-Asp-Phe-Ser-Lys-Leu-OCam-Lys-NH2.2TFA或Ac-Asp-Phe-Ser-Lys-Leu-OCam-Glu-NH2.TFA)的混合物中加入800μL的磷酸盐缓冲液(1M,pH 8.0)。向这4种混合物中各自加入5.5μg BS149-DM+M222G,将反应混合物在室温下摇动(150rpm)。30分钟后,抽出550μL等份的反应混合物,用50μL MSA淬灭并用LC-MS分析。将产物,水解的五肽C-末端Cam-酯和剩余的四肽C末端Cam-酯峰取积分。规定反应时间内产物(Ac-Asp-Phe-Ser-Lys-Leu-Ala-Leu-Arg-NH2)的量为86面积%对于Ac-Asp-Phe-Ser-Lys-Leu-OCam-Leu-OH,83面积%对于Ac-Asp-Phe-Ser-Lys-Leu-OCam-Leu-NH2,78面积%对于Ac-Asp-Phe-Ser-Lys-Leu-OCam-Lys-NH2和83面积%对于Ac-Asp-Phe-Ser-Lys-Leu-OCam-Glu-NH2
结论:该实施例显示Cam-Xxx-NH2和Cam-Xxx-OH酯可成功地用于酶促寡肽片段缩合。
实施例18:使用C-末端寡肽硫酯和BS149DM+I107V+M222G的片段缩合:
为了检验使用C-末端硫酯的酶促寡肽片段缩合是否可行,进行以下标准反应。在25℃下摇晃(150rpm)含2.5mM五肽C-末端硫酯(Suc-Ala-Ala-Pro-Phe-SBzl)、25mM二肽C-末端酰胺(H-Gly-Phe-NH2)、和5μg BS149-DM+L107V+M222G的1mL的N-三(羟甲基)甲基甘氨酸缓冲液(100mM,pH 7.5)。30分钟后,抽出550μL等份的反应混合物,用50μL MSA淬灭并用LC-MS分析。将产物,水解的四肽C-末端硫酯和剩余的四肽C末端硫酯峰取积分。在规定反应时间内产物(Suc-Ala-Ala-Pro-Phe-Gly-Phe-NH2)的量为85面积%。
结论:该实施例显示寡肽C-末端硫酯可成功用于酶促寡肽片段缩合。
实施例19:使用C-末端寡肽烷基酯和BS149DM+I107V+M222G的片段缩合:
为了检验使用C-末端烷基酯的酶促寡肽片段缩合是否可行,进行以下标准反应。在25℃下摇晃(150rpm)含2.5mM五肽C-末端烷基酯(Ac-Asp-Phe-Ser-Lys-Leu-OTFE(TFE=2,2,2-三氟乙基))、25mM三肽C-末端酰胺(H-Ala-Leu-Arg-NH2)、和5μg BS149-DM+L107V+M222G的1mL的N-三(羟甲基)甲基甘氨酸缓冲液(100mM,pH 7.5)。30分钟后,抽出550μL等份的反应混合物,用50μL MSA淬灭并用LC-MS分析。将产物,水解的五肽C-末端烷基酯和剩余的五肽烷基酯峰取积分。在规定的反应时间内,产物(Ac-Asp-Phe-Ser-Lys-Leu-Ala-Leu-Arg-NH2)的量为55面积%。
结论:该实施例显示寡肽C-末端烷基酯可成功用于酶促寡肽片段缩合。
实施例20:使用部分侧链保护的酶促寡肽片段缩合:
为了证明部分P1’侧链保护是有益的,进行以下反应。向100μL三肽C-末端酰胺母液(300μL水中0.01mmol H-Asp-Leu-Arg-NH2.2TFA或0.01mmol H-Asp(OcHex)-Leu-Arg-NH2.2TFA)和100μL五肽C-末端Cam-酯母液(1200μL水中0.01mmol Ac-Asp-Phe-Ser-Lys-Leu-OCam.TFA)的混合物中加入800μL磷酸盐缓冲液(100mM,pH 8.0)。向该混合物中加入5.5μg BS149-DM+M222G,将反应混合物在室温下摇动(150rpm)。30分钟后,抽出500μL等份的反应混合物,并用500μL MSA/水(1/99,v/v)淬灭并通过LC-MS分析。将产物,水解的五肽C-末端Cam-酯和剩余的五肽Cam-酯峰取积分。在规定的反应时间内使用未保护底物(H-Asp-Leu-Arg-NH2)的产物的量为18面积%,在规定的反应时间内使用部分侧链保护底物(H-Asp(OcHex)-Leu-Arg-NH2)的产物的量为73面积%。
为了证明部分P2’侧链保护是有益的,进行以下反应。向100μL三肽C-末端酰胺母液(300μL水中0.01mmol H-Asp-Glu(OBn)-Arg-NH2.2TFA或0.01mmol H-Asp-Glu-Arg-NH2.2TFA)和100μL五肽C-末端Cam-酯母液(1200μL水中0.01mmol Ac-Asp-Phe-Ser-Lys-Leu-OCam.TFA)的混合物中加入800μL磷酸盐缓冲液(100mM,pH 8.0)。向该混合物中加入5.5μg BS149-DM+M222G,将反应混合物在室温下摇动(150rpm)。30分钟后,抽出500μL等份的反应混合物,并用500μL MSA/水(1/99,v/v)淬灭并通过LC-MS分析。将产物,水解的五肽C-末端Cam-酯和剩余的五肽Cam-酯峰取积分。在规定的反应时间内使用未保护底物(H-Asp-Glu-Arg-NH2)的产物的量为15面积%,在规定的反应时间内使用部分侧链保护底物(H-Asp-Glu(OBn)-Arg-NH2)的产物的量为58面积%。
为了证明部分P1侧链保护是有益的,进行以下反应。将800μL磷酸盐缓冲液(100mM,pH 8.0)加入到100μL三肽C-末端酰胺母液(300μL水中0.01mmol H-Asp-Leu-Arg-NH2.2TFA)和100μL五肽C-末端Cam-酯母液(1200μL水中0.01mmol Ac-Asp-Phe-Ser-Leu-Lys-OCam.TFA或0.01mmol Ac-Asp-Phe-Ser-Leu-Lys(Alloc)-OCam)。向该混合物中加入5.5μgBS149-DM+M222G,将反应混合物在室温下摇动(150rpm)。30分钟后,抽出500μL等份的反应混合物,并用500μL MSA/水(1/99,v/v)淬灭并通过LC-MS分析。将产物,水解的五肽C-末端Cam-酯和剩余的五肽Cam-酯峰取积分。在规定的反应时间内使用未保护底物(Ac-Asp-Phe-Ser-Leu-Lys-OCam.TFA)的产物的量为5面积%,在规定的反应时间内使用部分侧链保护底物(Ac-Asp-Phe-Ser-Leu-Lys(Alloc)-OCam)的产物的量为84面积%。
为了证明部分P4侧链保护是有益的,进行以下反应。将800μL磷酸盐缓冲液(100mM,pH 8.0)加入到100μL三肽C-末端酰胺母液(300μL水中0.01mmol H-Ala-Leu-Arg-NH2.2TFA)和100μL四肽C-末端Cam-酯母液(1200μL水中0.01mmol Ac-Asp-Ser-Lys-Leu-OCam.TFA或0.01mmol Ac-Asp(OBn)-Ser-Lys-Leu-OCam.TFA)。向该混合物中加入5.5μgBS149-DM+M222G,将反应混合物在室温下摇动(150rpm)。30分钟后,抽出500μL等份的反应混合物,并用500μL MSA/水(1/99,v/v)淬灭并通过LC-MS分析。将产物,水解的四肽C-末端Cam-酯和剩余的四肽Cam-酯峰取积分。在规定的反应时间内使用未保护底物(mmol Ac-Asp-Ser-Lys-Leu-OCam.TFA)的产物的量为32面积%,在规定的反应时间内使用部分侧链保护底物(Ac-Asp(OBn)-Ser-Lys-Leu-OCam.TFA)的产物的量为78面积%。
结论:该实施例显示部分侧链保护可改善酶促寡肽片段缩合的产率和/或反应速率。
实施例21:BS149-DM的热稳定性:
使用基于荧光的热稳定性测定法测定BS149-DM和枯草杆菌连接酶的表观解链温度。将20μL蛋白质溶液在缓冲液(20mM N-三(羟甲基)甲基甘氨酸缓冲液,pH7.5)和金属离子(10mM)或EDTA(10mM)中的样品与5μL 100倍稀释的Sypro Orange(分子探针公司(Molecular Probes),生命技术公司(Life Technologies),美国)染料在薄壁96孔PCR板中混合。将该板用光学质量密封胶带密封,并在CFX 96实时PCR系统(美国加利福尼亚州赫克里斯的伯乐公司(BioRad))中以1.75℃/分钟的加热速度从20℃加热至99℃。用电荷耦合器件(CCD)照相机监测荧光变化。激发和发射的波长分别为490和575nm。如上所述测定纯化的BS149-DM的热稳定性。加入不同的金属离子和螯合剂后也测定了热稳定性,见下表3。观察到66℃的表观转变温度(Tm),表明酶BS149-DM很好地保留了BS149的热稳定性。相反,枯草杆菌连接酶的Tm值确定为59℃。
表3.金属离子(10mM)和螯合剂EDTA(10mM)对BSl49-DM的热稳定性的影响。
结论:与枯草杆菌连接酶相比,BS149-DM具有改善的热稳定性。酶BS149-DM也耐金属离子和螯合剂,因为在它们的存在下,Tm值几乎不受影响。
实施例22:有机溶剂和不同添加剂对BS149-DM活性的影响:
肽连接反应在25℃下在含有15μM BS149-DM,1mM五肽C-末端Cam-酯(Ac-Phe-Ile-Glu-Trp-Leu-OCam)和3mM二肽C-末端酰胺(H-Ala-Phe-NH 2)的100mM N-三(羟甲基)甲基甘氨酸缓冲液(pH 8.0)中进行。加入不同量的金属离子(10mM)、EDTA(10mM)或有机溶剂,60分钟后,通过LC-MS分析反应混合物。将产物,水解的五肽C-末端Cam-酯和剩余的五肽Cam-酯峰取积分。BS149-DM的活性定义为在规定的反应时间内产物的量和水解的五肽C-末端Cam-酯的量的总量除以产物、水解的五肽C-末端Cam-酯和剩余Cam-酯的量的总量。最高活性的反应设为100%,见表4-8。
表4.金属离子(10mM)和螯合剂EDTA(10mM)对BS149-DM活性的影响。
表5.THF对BS149-DM活性的影响。
表6.DMF对BS149-DM活性的影响。
表7.DMSO对BS149-DM活性的影响。
表8.GndCl对BS149-DM活性的影响。
实施例23:使用带或不带His-标签的BS149-DM的酶促寡肽片段偶联:
为了测试不同酶的活性和S/H比,进行了以下2个标准反应。将800μL磷酸盐缓冲液(100mM,pH 8.0)加入到100μL三肽C-末端酰胺母液(300μL水中0.01mmol H-Ala-Leu-Arg-NH2.2TFA)和100μL五肽C-末端Cam-酯母液(在1200μL水中0.01mmol Ac-Asp-Phe-Ser-Lys-Leu-OCam.TFA)。向该混合物中添加5.5μg带或不带His-标签的BS149-DM并且反应混合物在室温下摇晃(150rpm)。30分钟后,抽出500μL等份的反应混合物,并用500μL MSA/水(1/99,v/v)淬灭并通过LC-MS分析。将产物,水解的五肽C-末端Cam-酯和剩余的五肽C末端Cam-酯峰取积分。
带His-标签和不带His-标签的BS149-DM的S/H比定义为在规定的反应时间内产物(合成的寡肽)的量除以水解的五肽C-末端Cam-酯的量。带His-标签的BS149的S/H比为1.91并且不带His-标签的BS149为1.98。
带和不带His-标签的BS149-DM的活性定义为在规定的反应时间内产物的量和水解的五肽C-末端Cam-酯的量的总量除以产物、水解的五肽C-末端Cam-酯和剩余Cam-酯的量的总量。带His-标签的BS149-DM的活性为97.3%并且不带His-标签的BS149-DN为98.6%。
结论:His-标签的存在或缺失对S/H比和活性没有明显影响。
实施例24:对应于具有不同突变的SEQ ID NO 3的酶的S/H比:
为了测试不同突变体的活性和S/H比,进行了以下标准反应。将800μL磷酸盐缓冲液(100mM,pH 8.0)加入到100μL三肽C-末端酰胺母液(300μL水中0.01mmol H-Ala-Leu-Arg-NH2.2TFA)和100μL五肽C-末端Cam-酯母液(在1200μL水中0.01mmol Ac-Asp-Phe-Ser-Lys-Leu-OCam.TFA)。向该混合物中加入5.5μg酶,并将反应混合物在室温下摇晃(150rpm)。30分钟后,抽出500μL等份的反应混合物,并用500μL MSA/水(1/99,v/v)淬灭并通过LC-MS分析。将产物,水解的五肽C-末端Cam-酯和剩余的五肽C末端Cam-酯峰取积分。
不同突变体的S/H比定义为在指定时间内产物的量除以水解的五肽C-末端Cam-酯的量(见表9)。
表9.对应于具有不同突变的SEQ ID NO 3的酶的S/H比
结论:很明显,与枯草杆菌连接酶(S/H枯草杆菌连接酶=0.9,参见实施例1)相比,对应于SEQ ID NO 3(X=A)的具有S221C突变的几种酶具有两倍增加的S/H比。X=P,G或A,S/H比值不受影响。
实施例25:BS149-DM+M222P+L217H+X225突变体的S/H比:
为了测试不同突变体的活性和S/H比,进行了以下标准反应。将800μL磷酸盐缓冲液(100mM,pH 8.0)加入到100μL三肽C-末端酰胺母液(300μL水中0.01mmol H-Ser-Leu-Arg-NH2.2TFA)和100μL五肽C-末端Cam-酯母液(1200μL水中0.01mmol Ac-Asp-Phe-Ser-Lys-Leu-OCam.TFA)。向该混合物中加入5.5μg酶,并将反应混合物在室温下摇晃(150rpm)。30分钟后,抽出500μL等份的反应混合物,并用500μL MSA/水(1/99,v/v)淬灭并通过LC-MS分析。将产物,水解的五肽C-末端Cam-酯和剩余的五肽C末端Cam-酯峰取积分。
不同突变体的S/H比定义为在指定时间内产物的量除以水解的五肽C-末端Cam-酯的量(见表10)。
表10.BS149-DM+M222P+L217H+X225突变体的S/H比
结论:显然,X225位的突变对S/H比有很大的影响。许多突变具有极好的效果,例如X=N,D,S,C,G和A。几种其它酶与枯草杆菌连接酶相比具有超过三倍增加的S/H比(S/H枯草杆菌连接酶=0.9,见实施例1),如X=L,I,V和T。同时,X225突变成H,Q和-较小程度上-F和E显示出比X225为P的野生型酶的改善。
实施例26:选择性地将五肽与人胰岛素的A链的N末端偶联。
5mg的人胰岛素(CAS#11061-68-0)和2.5mg的Ac-Asp-Phe-Ser-Lys-Leu-OCam-Leu-OH.TFA溶于200μL DMF中。随后,加入含20μg的BS149-DM+M222G突变体的200μL磷酸盐缓冲液(1M,pH 8.0)和200μL H2O并且反应混合物在室温下摇晃(150rpm)。60分钟后,抽出100μL等份的反应混合物并用500μL MSA/水(1/99,v/v)猝灭并通过LC-MS分析,显示92%的胰岛素起始物质被转化成单一产物,即,与胰岛素A-链的N-末端偶联的Ac-Asp-Phe-Ser-Lys-Leu-。
实施例27:选择性地将五肽与人胰岛素的A-链和B-链的N末端偶联。
5mg的人胰岛素(CAS#11061-68-0)和5mg的Ac-Asp-Phe-Ser-Lys-Leu-OCam-Leu-OH.TFA溶于200μL DMF中。随后,加入含55μg的BS149-DM+M222G+L217F突变体的200μL磷酸盐缓冲液(1M,pH 8.0)和200μL H2O并且反应混合物在室温下摇晃(150rpm)。60分钟后,抽出100μL等份的反应混合物并用500μL MSA/水(1/99,v/v)猝灭并通过LC-MS分析,显示胰岛素起始物质被完全消耗并转化成三个产物峰,即1)与胰岛素A-链的N-末端偶联的Ac-Asp-Phe-Ser-Lys-Leu-(22面积%),2)与胰岛素B-链的N-末端偶联的Ac-Asp-Phe-Ser-Lys-Leu-(3面积%)和3)同时与胰岛素A-和B-链的N-末端偶联的Ac-Asp-Phe-Ser-Lys-Leu-(75面积%)。
序列
SEQ ID NO1:编码枯草杆菌蛋白酶BPN’氨基酸-107至275的野生型基因ENA|K02496|K02496.1B.枯草杆菌蛋白酶BPN′解淀粉芽孢杆菌
GTGAGAGGCAAAAAAGTATGGATCAGTTTGCTGTTTGCTTTAGCGTTAATCTTTACGATGG
CGTTCGGCAGCACATCCTCTGCCCAGGCGGCAGGGAAATCAAACGGGGAAAAGAAATATAT
TGTCGGGTTTAAACAGACAATGAGCACGATGAGCGCCGCTAAGAAGAAAGATGTCATTTCT
GAAAAAGGCGGGAAAGTGCAAAAGCAATTCAAATATGTAGACGCAGCTTCAGCTACATTAA
ACGAAAAAGCTGTAAAAGAATTGAAAAAAGACCCGAGCGTCGCTTACGTTGAAGAAGATCA
CGTAGCACATGCGTACGCGCAGTCCGTGCCTTACGGCGTATCACAAATTAAAGCCCCTGCT
CTGCACTCTCAAGGCTACACTGGATCAAATGTTAAAGTAGCGGTTATCGACAGCGGTATCG
ATTCTTCTCATCCTGATTTAAAGGTAGCAGGCGGAGCCAGCATGGTTCCTTCTGAAACAAA
TCCTTTCCAAGACAACAACTCTCACGGAACTCACGTTGCCGGCACAGTTGCGGCTCTTAAT
AACTCAATCGGTGTATTAGGCGTTGCGCCAAGCGCATCACTTTACGCTGTAAAAGTTCTCG
GTGCTGACGGTTCCGGCCAATACAGCTGGATCATTAACGGAATCGAGTGGGCGATCGCAAA
CAATATGGACGTTATTAACATGAGCCTCGGCGGACCTTCTGGTTCTGCTGCTTTAAAAGCG
GCAGTTGATAAAGCCGTTGCATCCGGCGTCGTAGTCGTTGCGGCAGCCGGTAACGAAGGCA
CTTCCGGCAGCTCAAGCACAGTGGGCTACCCTGGTAAATACCCTTCTGTCATTGCAGTAGG
CGCTGTTGACAGCAGCAACCAAAGAGCATCTTTCTCAAGCGTAGGACCTGAGCTTGATGTC
ATGGCACCTGGCGTATCTATCCAAAGCACGCTTCCTGGAAACAAATACGGGGCGTACAACG
GTACGTCAATGGCATCTCCGCACGTTGCCGGAGCGGCTGCTTTGATTCTTTCTAAGCACCC
GAACTGGACAAACACTCAAGTCCGCAGCAGTTTAGAAAACACCACTACAAAACTTGGTGAT
TCTTTCTACTATGGAAAAGGGCTGATCAACGTACAGGCGGCAGCTCAGTAA
SEQ ID NO2:野生型枯草杆菌蛋白酶BPN’(成熟)
>SUBT_BACAM枯草杆菌蛋白酶BPN′解淀粉芽孢杆菌成熟1至275
AQSVPYGVSQIKAPALHSQGYTGSNVKVAVIDSGIDSSHPDLKVAGGASMVPSETNPFQDNNSHGTHVAGTVAALNNSIGVLGVAPSASLYAVKVLGADGSGQYSWIINGIEWAIANNMDVINMSLGGPSGSAALKAAVDKAVASGVVVVAAAGNEGTSGSSSTVGYPGKYPSVIAVGAVDSSNQRASFSSVGPELDVMAPGVSIQSTLPGNKYGAYNGTSMASPHVAGAAALILSKHPNWTNTQVRSSLENTTTKLGDSFYYGKGLINVQAAAQ
SEQ ID NO3:具有Ca2+结合环删除以及S221C和优选P225突变(表示为P225X)的枯草杆菌蛋白酶BPN’变体
AQSVPYGVSQIKAPALHSQGYTGSNVKVAVIDSGIDSSHPDLKVAGGASMVPSETNPFQDNNSHGTHVAGTVAAVAPSASLYAVKVLGADGSGQYSWIINGIEWAIANNMDVINMSLGGPSGSAALKAAVDKAVASGVVVVAAAGNEGTSGSSSTVGYPGKYPSVIAVGAVDSSNQRASFSSVGPELDVMAPGVSIQSTLPGNKYGAYNGTCMASXHVAGAAALILSKHPNWTNTQVRSSLENTTTKLGDSFYYGKGLINVQAAAQ
SEQ ID NO4:与SEQ ID NO3相比具有优选突变位置的枯草杆菌蛋白酶BPN’变体
AXXVXYGVXQIKAPALHSQGYTGSNVKVAVXDSGIDSSHPDLXVAGGASXVPSETNPFQDNNSHGTHVAGTVXAVAPSASLYAVKVLGADGSGQYSWIINGIEWAIANNMDVINMSLGGPSGSAALKAAVDKAVASGVVVVAAAGNXGTSGSSSTVXYPXKYPSVIAVGAVDSSNQRAXFSSVGPELDVMAPGVSIXSTLPGXKYGAXXGTCMASXHVAGAAALILSKHPNWTNTQVRSSLENTXTKLGDSFYYGKGLINVXAAAQ
SEQ ID NO5:含枯草芽孢杆菌来源的枯草杆菌蛋白酶(aprE)启动子区(bp 1-197,Takara),BPN’信号序列(bp 198-287),BPN’前结构域(bp 288-518),成熟的BS149-DM,6xHis标签,终止密码子的大肠杆菌/枯草芽孢杆菌穿梭载体pBES:Pt149DM His。从核苷酸1590起,序列遵循来自Takara的pBES。
*相对于BPN’删除氨基酸72-80(Val-Ala-Ala-Leu-Asn-Asn-Ser-Ile-Gly);GTTGCG GCT CTT AAT AAC TCA ATC GGT.

Claims (85)

1.一种酶促合成(寡)肽的方法,包括偶联(a)(寡)肽C-末端末端酯或硫酯和(b)具有N-末端去保护的胺的(寡)肽亲核基团,
其中在包含水的流体中进行所述偶联,并且
其中由枯草杆菌蛋白酶BPN’变体或其同源物催化所述偶联,其与SEQUENCE ID NO:2所示的枯草杆菌蛋白酶BPN’或其同源序列相比包含以下突变:
-对应于75-83位的氨基酸缺失;
-对应于S221的氨基酸位置处的突变,所述突变是S221C或S221硒代半胱氨酸;
-优选地,对应于P225的氨基酸位置处的突变;
其中按照SEQUENCE ID NO:2所示的枯草杆菌蛋白酶BPN’的序列定义氨基酸位置。
2.如权利要求1所述的方法,其特征在于,所述对应于S221的氨基酸位置处的突变是S221C。
3.如权利要求1或2所述的方法,其特征在于,所述枯草杆菌蛋白酶BPN’变体或其同源物包含对应于P225的氨基酸位置处的突变,所述突变选自下组:P225N、P225D、P225S、P225C、P225G、P225A、P225T、P225V、P225I、P225L、P225H和P225Q。
4.如权利要求3所述的方法,其特征在于,所述突变是P225N或P225D。
5.如权利要求3所述的方法,其特征在于,所述突变是P225S。
6.如权利要求3所述的方法,其特征在于,所述突变是P225C。
7.如权利要求3所述的方法,其特征在于,所述突变是P225G。
8.如权利要求3所述的方法,其特征在于,所述突变是P225A。
9.如权利要求3所述的方法,其特征在于,所述突变是P225T。
10.如权利要求3所述的方法,其特征在于,所述突变是P225V、P225I或P225L。
11.如前述权利要求中任一项所述的方法,其特征在于,提供带保护性基团的(寡)肽C-末端酯或硫酯的N-末端和/或(寡)肽C-末端酯或硫酯的一个或多个侧链官能团。
12.如前述权利要求中任一项所述的方法,其特征在于,提供带保护性基团的(寡)肽亲核基团的C-末端和/或提供带保护性基团的(寡)肽亲核基团的一个或多个侧链官能团。
13.酶促合成至少12个氨基酸的环状(寡)肽的方法,包括使具有N-末端去保护的胺的(寡)肽C-末端酯或硫酯经过环化步骤,其中在包含水的流体中进行所述环化,并且
其中由枯草杆菌蛋白酶BPN’变体或其同源物催化所述环化,其与SEQUENCE ID NO:2所示的枯草杆菌蛋白酶BPN’或其同源序列相比包含以下突变:
-对应于75-83位的氨基酸缺失;
-对应于S221的氨基酸位置处的突变,所述突变是S221C或S221硒代半胱氨酸;
-优选地,对应于P225的氨基酸位置处的突变;
其中按照SEQUENCE ID NO:2所示的枯草杆菌蛋白酶BPN’的序列定义氨基酸位置。
14.如权利要求13所述的方法,其特征在于,所述对应于S221的氨基酸位置处的突变是S221C。
15.如权利要求13或14所述的方法,其特征在于,所述枯草杆菌蛋白酶BPN’变体或其同源物包含对应于P225的氨基酸位置处的突变,所述突变选自下组:P225N、P225D、P225S、P225C、P225G、P225A、P225T、P225V、P225I、P225L、P225H和P225Q。
16.如权利要求15所述的方法,其特征在于,所述突变是P225N或P225D。
17.如权利要求15所述的方法,其特征在于,所述突变是P225S。
18.如权利要求15所述的方法,其特征在于,所述突变是P225C。
19.如权利要求15所述的方法,其特征在于,所述突变是P225G。
20.如权利要求15所述的方法,其特征在于,所述突变是P225A。
21.如权利要求15所述的方法,其特征在于,所述突变是P225T。
22.如权利要求15所述的方法,其特征在于,所述突变是P225V、P225I或P225L。
23.如权利要求13-22中任一项所述的方法,其特征在于,提供带保护性基团的(寡)肽C-末端酯或硫酯的一个或多个侧链官能团。
24.如前述权利要求中任一项所述的方法,其特征在于,所述枯草杆菌蛋白酶BPN’变体或其同源物包含对应于SEQUENCE ID NO 2的Q2、S3、P5、S9、I31、K43、M50、A73、E156、G166、G169、S188、Q206、N212、N218、T254或Q271的氨基酸位置处的一个或多个突变。
25.如权利要求24所述的方法,其特征在于,所述一个或多个突变选自下组:Q2K、S3C、P5S、S9A、I31L、K43N、M50F、A73L、E156S、G166S、G169A、S188P、Q206C、N212G、N218S、T254A和Q271E。
26.如权利要求25所述的方法,其特征在于,所述枯草杆菌蛋白酶BPN’变体或其同源物包含至少4个,优选至少6个,更优选至少8个,更优选至少12个选自下组的所述突变:Q2K、S3C、P5S、S9A、I31L、K43N、M50F、A73L、E156S、G166S、G169A、S188P、Q206C、N212G、N218S、T254A和Q271E。
27.如权利要求26所述的方法,其特征在于,所述枯草杆菌蛋白酶BPN’变体或其同源物包含突变Q2K、S3C、P5S、S9A、I31L、K43N、M50F、A73L、E156S、G166S、G169A、S188P、Q206C、N212G、N218S、T254A和Q271E。
28.如前述权利要求中任一项所述的方法,其特征在于,所述枯草杆菌蛋白酶BPN’变体或其同源物包含选自对应于以下位置处的氨基酸的突变组的一个或多个突变:SEQUENCEID NO 2的N62、G100、S125、L126、G127、P129、N155、Y217、N218或M222。
29.如权利要求28所述的方法,其特征在于,所述枯草杆菌蛋白酶BPN’变体或其同源物含有对应于SEQUENCE ID NO 2的M222的位置处的突变。
30.如权利要求29所述的方法,其特征在于,所述对应于M222的位置处的突变是M222G、M222P、M222N、M222E、M222Q或M222A,优选M222G或M222P。
31.如权利要求28-30中任一项所述的方法,其特征在于,所述枯草杆菌蛋白酶BPN’变体或其同源物包含对应于SEQUENCE ID NO 2的Y217的氨基酸位置处的突变。
32.如权利要求31所述的方法,其特征在于,Y217处的突变是Y217L、Y217N、Y217E、Y217G、Y217F、Y217S、Y217A或Y217H。
33.如前述权利要求中任一项所述的方法,其特征在于,所述酶,尤其是枯草杆菌蛋白酶BPN’变体或其同源物包含选自对应于以下氨基酸位置处的突变组的至少一个突变:SEQUENCE ID NO 2的Y104、I107、L126、S101、G102、G127、G128、L135、或P168。
34.如权利要求33所述的方法,其特征在于,所述突变选自下组:Y104、I107和L135,优选选自下组:Y104F、Y104S、I107V、I107A、L135N、L135S、L135D或L135A。
35.如前述权利要求中任一项所述的方法,其特征在于,所述(寡)肽C-末端酯定义为式肽-(C=O)O-CX2-C(=O)N-R1R2,各X独立自表示氢原子或烷基;并且R1表示氢原子或烷基并且R2表示具有C-末端羧酰胺或羧酸官能团的肽残基或氢原子或烷基或氨基酸,任选地在氨基酸的侧链官能团上或在多个氨基酸的侧链官能团中的一个或多个上得到保护。
36.如权利要求35所述的方法,其特征在于,各X表示氢原子。
37.如权利要求35或36所述的方法,其特征在于,R1和R2都表示氢原子。
38.如权利要求35或36所述的方法,其特征在于,R1表示氢原子并且R2表示具有C-末端羧基酰胺或羧酸官能团的肽残基或氨基酸,任选地在氨基酸的侧链官能团上或在多个氨基酸的侧链官能团中的一个或多个上得到保护。
39.如权利要求35-38中任一项所述的方法,其特征在于,所述(寡)肽酯的C-末端酯基团连接至固相。
40.如前述权利要求中任一项所述的方法,其特征在于,合成的(寡)肽是包含多至200个氨基酸单元的寡肽,尤其是包含5-100个氨基酸单元的寡肽,更尤其是包含10-50个氨基酸单元的寡肽。
41.如权利要求1-39中任一项所述的方法,其特征在于,合成的(寡)肽是包含超过200个氨基酸单元,尤其是201-35000个氨基酸单元,更尤其是201-5000个氨基酸单元,优选201-1000个氨基酸单元的肽。
42.如前述权利要求中任一项所述的方法,其特征在于,所述(寡)肽是蛋白质。
43.如权利要求1-41中任一项所述的方法,其特征在于,所述(寡)肽没有二级和三级蛋白质结构。
44.一种酶,其中所述酶是枯草杆菌蛋白酶BPN’变体或其同源物,其与SEQUENCE IDNO:2所示的枯草杆菌蛋白酶BPN’或其同源序列相比包含以下突变:
-对应于75-83位的氨基酸缺失;
-对应于S221的氨基酸位置处的突变,所述突变是S221C或S221硒代半胱氨酸;
-优选地,对应于P225的氨基酸位置处的突变;
其中按照SEQUENCE ID NO:2所示的枯草杆菌蛋白酶BPN’的序列定义氨基酸位置。
45.如权利要求44所述的酶,其特征在于,所述对应于S221的氨基酸位置处的突变是S221C。
46.如权利要求44或45所述的酶,其特征在于,所述枯草杆菌蛋白酶BPN’变体或其同源物包含对应于P225的氨基酸位置处的突变,所述突变选自下组:P225N、P225D、P225S、P225C、P225G、P225A、P225T、P225V、P225I、P225L、P225H和P225Q。
47.如权利要求46所述的酶,其特征在于,所述突变是P225N或P225D。
48.如权利要求46所述的酶,其特征在于,所述突变是P225S。
49.如权利要求46所述的酶,其特征在于,所述突变是P225C。
50.如权利要求46所述的酶,其特征在于,所述突变是P225G。
51.如权利要求46所述的酶,其特征在于,所述突变是P225A。
52.如权利要求46所述的酶,其特征在于,所述突变是P225T。
53.如权利要求46所述的酶,其特征在于,所述突变是P225V、P225I或P225L。
54.如权利要求44-53中任一项所述的酶,其特征在于,包含对应于SEQUENCE ID NO 2的Q2、S3、P5、S9、I31、K43、M50、A73、E156、G166、G169、S188、Q206、N212、N218、T254和Q271的氨基酸位置处的一个或多个突变。
55.如权利要求54所述的酶,其特征在于,包含对应于N218的氨基酸位置处的突变。
56.如权利要求54或55所述的酶,其特征在于,包含对应于M50的氨基酸位置处的突变。
57.如权利要求54-56中任一项所述的酶,其特征在于,包含对应于Q2的氨基酸位置处的突变。
58.如权利要求54-57中任一项所述的酶,其特征在于,包含对应于A73的氨基酸位置处的突变。
59.如权利要求54-58中任一项所述的酶,其特征在于,包含对应于P5的氨基酸位置处的突变。
60.如权利要求54-59中任一项所述的酶,其特征在于,包含对应于G166的氨基酸位置处的突变。
61.如权利要求54-60中任一项所述的酶,其特征在于,所述一个或多个突变选自下组:Q2K、S3C、P5S、S9A、I31L、K43N、M50F、A73L、E156S、G166S、G169A、S188P、Q206C、N212G、N218S、T254A和Q271E。
62.如权利要求54-61中任一项所述的酶,其特征在于,包含对应于N218和M50的位置处的突变,所述突变优选是N218S和M50F。
63.如权利要求54-62中任一项所述的酶,包含对应于S3C和Q206C的氨基酸位置处的突变(其中对应于3位和206位的位置处的半胱氨酸形成二硫桥)。
64.如权利要求44-63中任一项所述的酶,还包含对应于N218、M50、Q2、A73和P5的各位置处的突变,所述突变优选是N218S、M50F、Q2K、A73L、P5S。
65.如权利要求54-64中任一项所述的酶,包含至少6个,优选至少8个,更优选至少12个选自下组的所述突变:Q2K、S3C、P5S、S9A、I31L、K43N、M50F、A73L、E156S、G166S、G169A、S188P、Q206C、N212G、N218S、T254A和Q271E。
66.如权利要求65所述的酶,其特征在于,所述酶包含对应于SEQUENCE ID NO 2的Q2K、S3C、P5S、S9A、I31L、K43N、M50F、A73L、E156S、G166S、G169A、S188P、Q206C、N212G、N218S、T254A和Q271E的突变。
67.如权利要求44-66中任一项所述的酶,包含对应于SEQUENCE ID NO 2的N62、G100、S125、L126、G127、P129、N155、Y217、N218或M222的氨基酸位置处的一个或多个突变。
68.如权利要求67所述的酶,包含对应于SEQUENCE ID NO 2的M222的位置处的突变。
69.如权利要求68所述的酶,其特征在于,所述对应于M222的位置处的突变是M222G、M222P、M222N、M222E、M222Q或M222A,优选M222G或M222P。
70.如权利要求44-69中任一项所述的酶,包含对应于SEQUENCE ID NO 2的Y217的氨基酸位置处的突变。
71.如权利要求70所述的酶,其特征在于,Y217处的突变是Y217L、Y217N、Y217E、Y217G、Y217F、Y217A、Y217S或Y217H。
72.如权利要求71所述的酶,其特征在于,Y217处的突变是Y217F、Y217G或Y217H。
73.如权利要求72所述的酶,其特征在于,所述酶包含对应于M222和Y217的氨基酸位置处的突变,其中所述突变是:
-M222P和Y217H;
-M222P和Y217G;
-M222G和Y217F;或
-M222G和Y217G。
74.如权利要求73所述的酶,其特征在于,所述突变是M222G和Y217F。
75.如权利要求44-74中任一项所述的酶,包含选自对应于SEQUENCE ID NO 2的Y104、I107、L126、S101、G102、G127、G128、L135和P168的氨基酸位置处的突变组的至少一个突变。
76.如权利要求75所述的酶,其特征在于,所述突变选自下组:Y104F、Y104S、I107V、I107A、L135N、L135S、L135D或L135A。
77.如权利要求44-76中任一项所述的酶,具有与Sequence ID 3、4或5的50-100%,优选至少70%,更优选至少80%,更优选至少85%,尤其至少90%,更尤其至少95%的序列相同性。
78.一种制备权利要求44-77中任一项所述的酶的重组方法,所述方法包括:
a)提供在功能上表达编码所述酶的基因的重组宿主细胞;
b)在提供功能上活性的酶的表达的条件下培养所述宿主细胞;并且
c)从所述微生物宿主中回收表达的酶。
79.一种包含编码权利要求44-78中任一项所述的酶的序列的重组多核苷酸。
80.一种宿主细胞,其包含权利要求79所述的多核苷酸。
81.如权利要求44-77中任一项所述的酶作为催化剂的用途。
82.如权利要求81所述的用途,其特征在于,所述酶用作肽合成中的催化剂。
83.如权利要求82所述的用途,其特征在于,所述肽是寡肽。
84.如权利要求82所述的用途,其特征在于,所述肽包含至少201个氨基酸单元。
85.如权利要求82-84中任一项所述的用途,其特征在于,所述肽是蛋白质。
CN201580067787.6A 2014-10-10 2015-10-09 用具有改善的合成水解比的枯草杆菌蛋白酶变体的肽片段缩合和环化 Pending CN107002110A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
NL2014050707 2014-10-10
NLPCT/NL2014/050707 2014-10-10
NLPCT/NL2015/050441 2015-06-16
NL2015050441 2015-06-16
PCT/NL2015/050711 WO2016056913A1 (en) 2014-10-10 2015-10-09 Peptide fragment condensation and cyclisation using a subtilisin variant with improved synthesis over hydrolysis ratio

Publications (1)

Publication Number Publication Date
CN107002110A true CN107002110A (zh) 2017-08-01

Family

ID=55066722

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580067787.6A Pending CN107002110A (zh) 2014-10-10 2015-10-09 用具有改善的合成水解比的枯草杆菌蛋白酶变体的肽片段缩合和环化

Country Status (6)

Country Link
US (2) US10138268B2 (zh)
EP (1) EP3204401A1 (zh)
JP (2) JP7017409B2 (zh)
CN (1) CN107002110A (zh)
CA (1) CA2962903C (zh)
WO (1) WO2016056913A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111757891A (zh) * 2018-03-09 2020-10-09 恩细贝普有限公司 索马鲁肽、利拉鲁肽和glp-1的化学-酶法合成
CN111819191A (zh) * 2018-03-09 2020-10-23 恩细贝普有限公司 利拉鲁肽、索马鲁肽和glp-1的化学酶促合成

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6265020B2 (ja) * 2014-04-16 2018-01-24 Jnc株式会社 エビルシフェラーゼの触媒蛋白質の変異遺伝子とその使用法
US10752931B2 (en) 2015-07-09 2020-08-25 Enzypep B.V. Designing an enzymatic peptide fragment condensation strategy
EP3260548A1 (en) 2016-06-21 2017-12-27 Enzypep B.V. Enzymatic coupling of (oligo)peptides to the b-chain of an insulin receptor ligand
WO2018045200A2 (en) * 2016-09-02 2018-03-08 The Regent Of The University Ofcalifornia Engineered subtiligase variants for versatile, site-specific labeling of proteins
EP3299085A1 (en) * 2016-09-26 2018-03-28 Enzypep B.V. Peptide coupling molecule
CN106754833B (zh) * 2017-01-16 2020-06-09 广东溢多利生物科技股份有限公司 在枯草芽孢杆菌中高效表达普鲁兰酶的方法及重组枯草芽孢杆菌
EP3404036A1 (en) 2017-05-19 2018-11-21 Enzypep B.V. Subtilisin variants having a mutation in the s2 or s2' pocket
CN109306366B (zh) * 2017-07-26 2021-12-21 深圳翰宇药业股份有限公司 一种合成pt141的方法
AU2019205912A1 (en) 2018-01-03 2020-07-16 Palleon Pharmaceuticals Inc. Recombinant human sialidases, sialidase fusion proteins, and methods of using the same
EP3768835A1 (en) * 2018-03-23 2021-01-27 Novozymes A/S Subtilase variants and compositions comprising same
EP4162040A2 (en) * 2020-06-04 2023-04-12 California Institute of Technology Novel signal peptides generated by attention-based neural networks
WO2022006492A2 (en) * 2020-07-03 2022-01-06 Palleon Pharmaceuticals Inc. Recombinant sialidases with reduced protease sensitivity, sialidase fusion proteins, and methods of using the same
US20240043897A1 (en) 2021-02-12 2024-02-08 Fresenius Kabi Ipsum S.R.L. Subtilisin variants and their use
EP4122944A1 (en) 2021-07-21 2023-01-25 EnzyTag B.V. Enzymatic synthesis of cyclic peptides

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0542931A4 (zh) * 1990-08-09 1994-04-13 Genentech, Inc.
US5629173A (en) * 1990-08-09 1997-05-13 Genentech, Inc. Methods of use of serine protease variants having peptide ligase activity
CN101454452A (zh) * 2003-08-06 2009-06-10 马里兰大学生物技术研究所 用于亲和纯化的工程蛋白酶及融合蛋白的加工
CN102216324A (zh) * 2008-11-19 2011-10-12 帝斯曼知识产权资产管理有限公司 使用酶促反应和偶联反应的肽合成
CN102762222A (zh) * 2009-12-09 2012-10-31 丹尼斯科美国公司 包含蛋白酶变体的组合物和方法
CN103396904A (zh) * 2008-11-11 2013-11-20 宝洁公司 包含丝氨酸蛋白酶变体的组合物和方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1994018329A2 (en) 1993-02-04 1994-08-18 Genentech, Inc. Serine protease variants having peptide ligase activity
US5567601A (en) * 1993-06-01 1996-10-22 University Of Maryland Subtilisin mutants lacking a primary calcium binding site
US6541234B1 (en) * 2000-09-11 2003-04-01 University Of Maryland Biotechnology Institute Calcium free subtilisin mutants
US6541235B1 (en) * 2000-09-29 2003-04-01 University Of Maryland Biotechnology Institute Calcium free subtilisin mutants
EP1507857A1 (en) 2002-05-30 2005-02-23 DSM IP Assets B.V. Novel pectinases and uses thereof
EP2634193B1 (en) * 2012-02-29 2015-01-14 Enzypep B.V. Side-chain protected oligopeptide fragment condensation using subtilisins in organic solvents

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0542931A4 (zh) * 1990-08-09 1994-04-13 Genentech, Inc.
US5629173A (en) * 1990-08-09 1997-05-13 Genentech, Inc. Methods of use of serine protease variants having peptide ligase activity
CN101454452A (zh) * 2003-08-06 2009-06-10 马里兰大学生物技术研究所 用于亲和纯化的工程蛋白酶及融合蛋白的加工
CN103396904A (zh) * 2008-11-11 2013-11-20 宝洁公司 包含丝氨酸蛋白酶变体的组合物和方法
CN102216324A (zh) * 2008-11-19 2011-10-12 帝斯曼知识产权资产管理有限公司 使用酶促反应和偶联反应的肽合成
CN102762222A (zh) * 2009-12-09 2012-10-31 丹尼斯科美国公司 包含蛋白酶变体的组合物和方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ALMOG O 等: "Structural Basis of Thermostability. ANALYSIS OF STABILIZING MUTATIONS IN SUBTILISIN BPN", 《JOURNAL OF BIOLOGICAL CHEMISTRY》 *
SUSAN L 等: "Directed Coevolution of Stability and Catalytic Activity in Calcium-free Subtilisin", 《BIOCHEMISTRY》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111757891A (zh) * 2018-03-09 2020-10-09 恩细贝普有限公司 索马鲁肽、利拉鲁肽和glp-1的化学-酶法合成
CN111819191A (zh) * 2018-03-09 2020-10-23 恩细贝普有限公司 利拉鲁肽、索马鲁肽和glp-1的化学酶促合成

Also Published As

Publication number Publication date
CA2962903A1 (en) 2016-04-14
US10253061B2 (en) 2019-04-09
US20190031710A1 (en) 2019-01-31
WO2016056913A1 (en) 2016-04-14
US10138268B2 (en) 2018-11-27
JP7017409B2 (ja) 2022-02-08
JP2021020958A (ja) 2021-02-18
CA2962903C (en) 2023-01-10
JP2017531040A (ja) 2017-10-19
EP3204401A1 (en) 2017-08-16
US20170305963A1 (en) 2017-10-26

Similar Documents

Publication Publication Date Title
CN107002110A (zh) 用具有改善的合成水解比的枯草杆菌蛋白酶变体的肽片段缩合和环化
US10752931B2 (en) Designing an enzymatic peptide fragment condensation strategy
US7794979B2 (en) Solubility tags for the expression and purification of bioactive peptides
CN101263225A (zh) 改进转谷氨酰胺酶的底物特异性
EP0789078B1 (en) Engineered peptide synthetases and their use for the non-ribosomal production of peptides
Liu et al. Fusion expression of pedA gene to obtain biologically active pediocin PA-1 in Escherichia coli
US10336994B2 (en) Subtilisin variants having a mutation in the S2 or S2# pocket
KR20190027698A (ko) 재조합 단백질의 분비를 증가시키는 방법
CN116829719A (zh) 蛋白质脱酰胺酶
US8557558B2 (en) Compositions and methods of producing enterokinase in yeast
KR100365838B1 (ko) 브레비바실러스 보스테렌시스 bcs-1 에서 유래한 신규내열성 d-입체특이적 디펩티다아제 및 이를 이용한d-아미노산 함유 펩타이드의 합성 방법
Shan et al. Kinetically controlled carboxypeptidase-catalyzed synthesis of novel antioxidant dipeptide precursor BOC-Tyr-Ala
KR102084054B1 (ko) 재조합 단백질의 분비를 증가시키는 방법
CN116731126B (zh) 内含肽ChiATP、内含肽ChiATP-二肽-2融合蛋白及二肽-2的表达方法
EP4122944A1 (en) Enzymatic synthesis of cyclic peptides
CN110157750B (zh) 一种改良赖氨酸脱羧酶、生产方法及其应用
CN1989246A (zh) L-氨基酸酰胺不对称水解酶及其编码dna
Brockmeier New strategies to optimize the secretion capacity for heterologous proteins in Bacillus subtilis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination