CN117098843A - 枯草杆菌蛋白酶变体及其用途 - Google Patents

枯草杆菌蛋白酶变体及其用途 Download PDF

Info

Publication number
CN117098843A
CN117098843A CN202280014758.3A CN202280014758A CN117098843A CN 117098843 A CN117098843 A CN 117098843A CN 202280014758 A CN202280014758 A CN 202280014758A CN 117098843 A CN117098843 A CN 117098843A
Authority
CN
China
Prior art keywords
ser
peptide
leu
lys
ala
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280014758.3A
Other languages
English (en)
Inventor
蒂莫·努詹斯
尤尔根·马特曼
罗温·德·维瑟
沃尔特·卡布里
凯尔斯廷·瓦勒文
埃尔维拉·维杰尔
安东尼奥·里奇
安娜·托普拉克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Freseniuskabi Co ltd
Original Assignee
Freseniuskabi Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Freseniuskabi Co ltd filed Critical Freseniuskabi Co ltd
Priority claimed from PCT/EP2022/053121 external-priority patent/WO2022171667A1/en
Publication of CN117098843A publication Critical patent/CN117098843A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Peptides Or Proteins (AREA)

Abstract

本发明涉及枯草杆菌蛋白酶BPN’变体或其同源物,其包含与SEQ ID NO:2所示的枯草杆菌蛋白酶BPN’或其同源序列相比新的突变。此类突变可以出现在选自L96、D99、A223和S224的氨基酸位置处。本发明还涉及一种通过偶联肽片段来酶法合成肽的方法,其中所述偶联由所述枯草杆菌蛋白酶BPN’变体或其同源物催化。

Description

枯草杆菌蛋白酶变体及其用途
技术领域
本发明涉及一种酶,其是枯草杆菌蛋白酶BPN’变体或其同源物。本发明还涉及这种酶催化肽片段偶联的方法以及使用这种酶进行肽合成的方法。
背景技术
合成肽的方法在本领域中是公知的。相对短的肽可以在溶液中以分步方法或通过被称为肽固相合成的方法进行化学合成,其中肽固相合成是指通过高度优化的方法,将一末端固定到固相的同时构建肽的合成。然而,由于潜在的副反应,长度超过10~15个氨基酸的肽通常难以合成。结果是其纯化很麻烦。因此,此类肽通常通过将固相合成侧链保护的肽片段及其随后在溶液中的化学缩合组合来合成。侧链保护的肽片段的化学偶联的主要缺点是,酰基供体C-端氨基酸残基活化后发生的外消旋。相比之下,在肽片段的酶催化偶联中未观察到外消旋。与肽化学合成相比的另一个优点是,在侧链官能团上不存在副反应。化学合成的肽经酶法偶联被称为肽化学-酶促合成
术语肽化学-酶促合成是指多个肽片段的酶法偶联,其中多个肽片段已经使用化学合成(在溶液和/或固相中),发酵,或通过化学和酶法偶联步骤的组合单独合成了。
Wells等人(US 5,403,737)发现,通过改变枯草杆菌蛋白酶BPN’的活性位点,可以显著提高肽在水性溶液中的偶联,其中枯草杆菌蛋白酶BPN’是来自于解淀粉芽孢杆菌(B.amyloliquefaciens)的枯草杆菌蛋白酶(SEQ ID NO:2)。当引入两个突变即S221C和P225A时,得到一种被称为枯草杆菌连接酶(subtiligase)的枯草杆菌蛋白酶BPN’变体,其与野生型枯草杆菌蛋白酶BPN’相比合成/水解比(S/H比)提高500倍。在进一步实验中,Wells等人向枯草杆菌连接酶中引入了5个另外的突变,即M50F、N76D、N109S、K213R和N218S,以提高酶的稳定性(Proc.Natl.Acad.Sci.USA,1994,91,12544)。这种新突变体被称为稳定连接酶(stabiligase),对使用十二烷基硫酸钠和盐酸胍的处理似乎具有适度更高的抵抗力,但水解仍然是主要的副反应。
在WO 2016/056913中解决了诸如枯草杆菌连接酶或稳定连接酶的酶当用于水性环境中的肽合成时不想要的高水解活性的问题,其中提供了显示出改善的S/H比的枯草杆菌蛋白酶BPN’变体,其特征在于第75~83位置处的氨基酸缺失和氨基酸位置S221处的突变。
在WO 2018/212658中提供了其他枯草杆菌蛋白酶BPN’突变体,其在靠近偶联位点的倒数第二个口袋中、即在S2’口袋中和/或S2口袋中具有一个或多个特定突变,从而拓宽了所述肽的底物范围并提高了偶联效率。
WO2019170895和WO2019170918公开了,通过由枯草杆菌蛋白酶BPN’突变体催化的特定肽片段偶联策略,来酶法合成利拉鲁肽和索马鲁肽的方法。
然而,仍需要提供其他枯草杆菌蛋白酶BPN’变体或其同源物,其可用于通过片段偶联或环化进行肽的酶法合成,从而提高反应速率和偶联反应效率,同时保持或提高BPN’变体的稳定性。
此外,仍需要找到对具有药理学意义的新肽进行酶法合成的高效方法,特别是适合于工业应用的方法。
根据本发明的酶和方法解决或至少减轻了上述问题的一部分或全部。
发明内容
现在已发现,通过提供在枯草杆菌蛋白酶BPN’变体或其同源物的酰基供体结合口袋中具有一个或多个特定突变的新酶,可以克服所有或至少一部分上面讨论的问题。
因此,在第一实施方式中,本发明提供了一种枯草杆菌蛋白酶BPN’变体或其同源物,其与枯草杆菌蛋白酶BPN’SEQ ID NO:2具有至少80%的序列同一性,包含第75~83位氨基酸的缺失和在氨基酸位置S221处的突变,所述突变是S221C或S221硒代半胱氨酸,优选为S221C;并且,所述枯草杆菌蛋白酶BPN’变体或其同源物的特征在于,具有在选自L96、D99、A223和S224的氨基酸位置处的至少一个突变,其中所述氨基酸位置根据SEQ ID NO:2或其同源序列定义,并且其中所述变体或其同源物具有反应速率和偶联效率提高的连接酶和/或环化酶活性。
根据本发明的酶在肽键形成方面具有催化活性(偶联活性)。这种活性也被称为“连接酶活性”。
本发明提供了,优选在水性反应介质中显示出反应速率提高和偶联效率提高的酶。本发明还提供了如下的酶,该酶对(a)肽C-端(硫)酯与(b)具有N-端未保护的胺的肽亲核试剂的偶联反应具有提高的选择性,由此产生靶肽。
因此,在第二实施方式中,本发明提供了一种酶法合成肽的方法,所述方法包括将(a)肽C-端(硫)酯与(b)具有N-端未保护的胺的肽亲核试剂进行偶联的步骤,其中所述偶联优选地在水性溶液中进行,并且其中所述偶联由枯草杆菌蛋白酶BPN’变体或其同源物催化,所述变体或其同源物与枯草杆菌蛋白酶BPN’SEQ ID NO:2具有至少80%的序列同一性,包含第75~83位氨基酸的缺失和在氨基酸位置S221处的突变,所述突变是S221C或S221硒代半胱氨酸,优选为S221C;并且,所述变体或其同源物的特征在于在选自L96、D99、A223和S224的氨基酸位置处具有至少一个突变,
其中所述氨基酸位置根据SEQ ID NO:2定义或其同源序列定义。
具体实施方式
本文所使用的术语“反应”是指在枯草杆菌蛋白酶BPN’变体或其同源物的催化下发生的反应。具体而言,术语“偶联反应”或“偶联”是指氨基与羧基之间形成酰胺键(或肽键)。这可能涉及两个分子(分子间的偶联反应)或一个分子(分子内的偶联反应)。
本文所使用的术语“反应速率”是指,肽酰基供体(硫)酯起始原料被枯草杆菌蛋白酶BPN’变体或其同源物消耗的速度。当形成酰基酶复合物时,酰基供体可以与酰基受体(即肽亲核试剂)偶联(优选的偶联反应)或者可以被水水解(不想要的副反应)。酰基供体反应速率或转化速率是产物形成速率和水解速率之和。反应速率提高的酶与野生型酶相比具有更高的催化效率。使用相同量的酶,反应在更短时间内完成。
本文所使用的术语“(硫)酯”是表述“酯或硫酯”的简写形式。
本文所使用的术语“偶联效率”或“偶联反应效率”是指,通过枯草杆菌蛋白酶BPN’变体或其同源物的催化作用,在一定时间内形成的肽连接产物(即靶肽)的量。偶联效率提高的酶与野生型酶相比在一定时间内合成更多的产物。对于偶联效率评估来说,不将酰基供体(硫)酯水解考虑在内。
本文所使用的术语“合成/水解比”(S/H比)是指,肽连接产物的量除以已被水解的酰基供体(硫)酯(即酰基供体(硫代)酸)的量。当酰基供体(硫)酯在反应中过量使用时,S/H比的估算可以用肽连接产物的量除以肽亲核试剂的量给出。
本文所使用的术语“选择性”是指,当酰基供体(硫)酯与肽连接产物的N-端未保护的胺反应时,肽连接产物的量除以形成的副产物的量。这种副产物形成是非常不合乎需要的,每一个副产物分子均会消耗反应物和靶肽之一。因此,高度选择性的酶大多是优选的。
本文所使用的术语“肽”是指,由通过酰胺键彼此线性连接的两个或更多个氨基酸组成的任何序列。肽通常由α-氨基酸形成,但肽也可能包含其他氨基酸,例如一个或多个β-氨基酸和/或一个或多个γ-氨基酸。任何肽均由其特定氨基酸序列定义。
肽与蛋白质的区别在于其较短的长度,但用于区分肽和蛋白质的截止氨基酸数量在本领域中是可变的。通常,肽包含2至500个,更通常2至200个,或2至100个氨基酸。优选地,肽包含至少10个氨基酸,更优选地至少15个氨基酸。此外,肽的长度不超过200个、优选地不超过100个、最优选地不超过50个氨基酸。因此,最优选地,肽的长度为10至50个氨基酸。
肽可以含有蛋白原氨基酸和/或非蛋白原氨基酸。蛋白原氨基酸是由遗传密码编码的具有L-构型的α-氨基酸。非蛋白原氨基酸是非天然氨基酸,例如D-氨基酸、L-或D-苯甘氨酸、DOPA(3,4-二羟基-L-苯丙氨酸)、β-氨基酸、4-氟-苯丙氨酸、α-氨基异丁酸(Aib)、其他C-α-烷基化氨基酸和硒代半胱氨酸(Sec,U),其中硒代半胱氨酸是结构对应于半胱氨酸但用硒代替硫原子的氨基酸。肽可以是直链、支链或环状的,其中支链肽具有至少两个相互连接的氨基酸序列。
肽可以由氨基酸或由氨基酸和保护基团组成,其中保护基团可以存在于末端氨基和羧基处或氨基酸侧链处。本文所使用的表述“氨基酸侧链”是指任何蛋白原或非蛋白原氨基酸侧链。
肽可以是“偶联肽”,即两个或更多个氨基酸的肽序列,其附连到另一个残基,例如:合成亲水性聚合物,如聚亚烷基二醇,优选聚乙二醇(PEG);亲脂性部分或氨基酸或其组合;成像剂;放射性治疗剂;毒素;另一种非肽试剂,例如螯合剂或非肽生物活性部分。
肽可以是生物活性肽。生物活性肽的优选实例包括胰高血糖素、glp-1、glp-2及其类似物,例如达西格列酮(dasiglucagon)、艾塞那肽(exenatide)、利拉鲁肽(liraglutide)、索马鲁肽(semaglutide)、利西拉肽(lixisenatide)、替度鲁肽(teduglutide)、格列帕格鲁肽(glepaglutide)、度拉糖肽(dulaglutide)、艾司格鲁肽(elsiglutide)、胸腺肽-α-1、胸腺肽-α-1类似物、特立帕肽(teriparatide)、鲑鱼降钙素(salmon calcitonin)、比伐卢定(bivalirudin),以及包含这些肽中的任一者的序列和至少一个另外的氨基酸的肽。
本文所使用的术语“环肽”是指具有环结构的肽,其中这种肽由氨基酸序列的末端α-氨基与末端α-羧基之间形成酰胺键(也被称为“环化反应”)而产生。具体而言,这种氨基酸序列具有至少12个氨基酸。
本文所使用的术语“肽键”是指(i)一个氨基酸的氨基与(ii)另一个氨基酸的羧基之间的酰胺键。具体而言,肽键可以在一个α-氨基酸的α-氨基与另一个α-氨基酸的α-羧基之间。
当提及蛋白质或酶时,本文所使用的术语“突变的”或“突变”意味着,在野生型或天然存在的蛋白质或酶序列中,通过编码这些氨基酸的核酸诱变,使得至少一个氨基酸替换成不同氨基酸、插入到该序列中、附加到该序列或从该序列中缺失。诱变包括例如通过PCR或寡核苷酸介导的诱变而进行的定点诱变,例如在Siloto等,“位点饱和诱变:方法和在蛋白质工程中的应用”(Site saturation mutagenesis:Methods and applications inprotein engineering),Biocatalysis and Agricultural Biotechnology 1,(2012)181-189中所述。当提及核酸或基因时,本文所用的术语“突变的”或“突变”是指核酸序列中的至少一个核苷酸,已被不同的核苷酸取代,已被插入序列中,已被附加到序列中,或已通过诱变从序列中缺失,导致转录功能被定性或定量改变的蛋白质序列,或导致该核酸的“敲除”,其指不再编码突变前曾编码的具有功能的蛋白质的核酸。
在本公开中,突变描述为被替换的氨基酸的单字母氨基酸代码,后面接着指示在所述蛋白质氨基酸序列中进行替换的位置的数字。这个数字是野生型氨基酸序列的氨基酸位置。因此,对于突变的氨基酸序列来说,它是与野生型酶中具有该数字的位置相对应的氨基酸位置。由于在其他位置处的一个或多个其他突变(添加、插入、缺失等),突变体中的实际位置不一定是同一个位置。专业技术人员可以使用公知的比对技术例如NEEDLE来确定相对应的位置。在所述数字之后是替换野生型氨基酸的氨基酸的单字母代码。例如,F189W表示第189位置处的苯丙氨酸(F)被色氨酸(W)替换。X用于指示可能存在于该位置处的除了将被替换的氨基酸之外的其他任何蛋白原氨基酸。例如,F189X表示第189位置处的苯丙氨酸被任何其他蛋白原氨基酸替换。
本文所使用的术语“连接酶”是指,在通过催化第一个肽的C-端与另一个肽的N-端之间形成肽键而在两个肽的偶联中具有催化活性的酶。这种活性也被称为“连接酶活性”。在这种酶在同一肽分子的C-端与N-端之间形成分子内肽键中具有催化活性的情况下,这种活性也可以被称为“环化酶活性”。因此,同一种酶可以具有连接酶和/或环化酶活性。当酶的S/H比大于1时,所述酶可以被表征为具有连接酶活性。这种S/H比可以通过HPLC分析相应量来确定。
在所使用的反应介质中,特别是在包含水的反应介质、更特别是水性介质(也被称为水性溶液)中,连接酶通常具有大于1、优选为2或更大、特别是5或更大的S/H比。这个商数的上限值并不重要;它可以是例如100或更小。
本文所指称的酶“同源物”是具有与所述酶相同的预期功能,例如能够催化相同的反应的酶。在本公开中,这种反应是偶联反应,即形成肽键。具体而言,本文所使用的酶的同源物具有连接酶和/或环化酶活性。
术语同源物进一步通过它的序列与所述酶相比具有一定的相似性水平来定义。在本申请的全文中,这种相似性水平被称为“百分同一性”或“序列同一性”。术语“百分同一性”和“序列同一性”在本文中可互换使用。
根据本发明,“枯草杆菌蛋白酶BPN’同源物”是具有连接酶和/或环化酶活性的酶,其与枯草杆菌蛋白酶BPN’(即,所述同源物肽或酶与之相比的酶)具有至少80%、优选地至少85%、更优选地至少90%、更优选地至少95%或至少96%或至少97%或至少98%或至少99%的序列同一性。百分同一性根据下文概述的NEEDLE EMBOSS方法来确定。显然,百分同一性将小于100%。百分同一性取决于突变的数目和与所述同源物与之相比的肽(酶)的长度。
出于本发明的目的,本文中定义了为了确定两个氨基酸序列的百分同一性,将完整的成熟序列出于最佳比较的目的比对,使得相似的区域对齐。在确定百分同一性中不考虑(在N或C-端处)任何序列延长,例如常用的His标签或例如用于纯化、信号传导、溶解和定位目的的其他标签。为了优化两个序列之间的比对,可以在所比较的两个序列中的任一序列中引入空位。用于确定序列同一性%值的比对在所比较的序列的至少200个氨基酸的长度上进行。
两个序列之间的序列比较和百分同一性的确定可以使用数学算法来完成,例如Needleman-Wunsch算法(Needleman,S.B.和Wunsch,C.D.,(1970)J.Mol.Biol.48(3),pp443-453),其在计算机程序NEEDLE中执行。
为了计算百分同一性,使用来自于EMBOSS软件包的NEEDLE程序(2.8.0或更高版本,《EMBOSS:欧洲分子生物学开放软件套装》(EMBOSS:The European Molecular BiologyOpen Software Suite)(2000),Rice,P.Longden,I.和Bleasby,A.,Trends in Genetics16(6)pp 276-277)。对于蛋白质序列而言,应该将EBLOSUM62用于替换矩阵。用于氨基酸序列比对的参数必须被设定为10的空位开放罚分和0.5的空位延长罚分。两个比对序列之间的同源性或百分同一性如下计算:比对中在两个序列中显示出相同氨基酸的相应位置的数目除以比对的总长度(减去比所述对中空位的总数之后)。
本文所定义的百分同一性可以从NEEDLE获得,并在所述程序的输出中标为“同一性”。
术语肽的“类似物”在本文中具体用于作为所述肽的结构类似物和/或功能类似物的肽。功能类似物具有相同的体内靶标(例如细胞膜上相同的靶受体);结构类似物在氨基酸序列方面具有高相似性。一肽的功能类似物与该肽(这些类似物是该肽的类似物)可能在整个氨基酸序列上具有相对低的氨基酸序列同一性,例如约50%或更低的氨基酸序列同一性,但在氨基酸序列的某区段,例如靠近N-端部分或靠近C-端部分的区段中具有高序列同一性(以及因此高的结构相似性)。具体而言,结构类似物包含氨基酸序列,其与该肽(这些结构类似物是该肽的类似物)的氨基酸序列具有至少80%、优选地至少85%、更优选地至少90%序列同一性、甚至更优选地至少95%序列同一性。当指称偶联反应的靶肽时,在本文中使用术语“类似物”。
术语酶的“变体”或“突变体”在本文中用于作为酶的结构类似物,相对于这种酶具有至少一个突变或突变的氨基酸的酶。具体而言,枯草杆菌蛋白酶BPN’变体是相对于SEQID NO:2的序列具有至少一个突变的酶。
令人吃惊的是,已发现与从WO2016/06913已知的枯草杆菌蛋白酶BPN’变体或其同源物相比,L96位置处的突变在根据本发明的反应中显著提高反应速率和偶联效率。因此,根据本发明,L96是优选的突变位置。通过D99、A223或S224位置处的突变可以获得类似的提高。因此,D99、A223和S224各自是优选的突变位置。
因此,本发明提供了一种枯草杆菌蛋白酶BPN’变体或其同源物,其与表示枯草杆菌蛋白酶BPN’的序列的SEQ ID NO:2具有至少80%的序列同一性,包含第75~83位氨基酸的缺失和在氨基酸位置S221处的突变,所述突变是S221C或S221硒代半胱氨酸,优选为S221C;其特征在于
在选自L96、D99、A223和S224的氨基酸位置处的至少一个突变,
其中所述氨基酸位置根据由SEQ ID NO:2所示的枯草杆菌蛋白酶BPN’的序列或其同源序列来定义。
枯草杆菌蛋白酶BPN’的氨基酸序列提供在SEQ ID NO:2中(成熟形式)。编码枯草杆菌蛋白酶BPN’的第-107至275位氨基酸的核酸序列提供在SEQ ID NO:1中。
SEQ ID NO:3示出了一种根据本发明的枯草杆菌蛋白酶BPN’变体,其具有对应于第75~83位氨基酸(所谓的Ca2+结合环)的缺失,具有S221突变(被表示为S221C),其中在L96、D99、A223和S224位置处都被标记为X的氨基酸表示在该位置中的任何蛋白原氨基酸,从而包括根据SEQ ID NO:2的氨基酸(如果所述位置未被突变的话),前提是在这些位置之一处的至少一个X是在SEQ ID NO:2中在所述位置处不存在的氨基酸,即至少一个X是突变。其他优选的酶可以包含一个或多个另外的突变,特别是在下文中别处鉴定的一个或多个其他突变。
具体而言,本发明提供了一种分离的酶。在本文中,术语“分离的”意味着它从表达它的生物体、通常为重组生物体(如果它已在生物体中产生的话)中或从合成它的反应介质中分离。
具体而言,根据本发明的酶通过任何适合的技术例如在Smith和Johnson,Gene67:31-40(1988)中公开的单步纯化方法,以粗品形式分离或基本上纯化。
根据本发明的酶可以以至少基本上纯的形式提供,其中术语“基本上纯的酶”是指纯度为至少75wt.%、优选地超过80wt.%的酶。所述酶也可以以与一种或多种其他组分的混合物的形式提供,例如以储用溶液的形式,优选地在水性缓冲液中。
根据本发明的酶可以包含末端His标签,优选为6-His标签。
令人吃惊的是,已发现当将上述位置L96、D99、A223和S224处的两种或三种或所有四种突变组合时,观察到累积效应。
因此,在优选实施方式中,根据本发明的枯草杆菌蛋白酶BPN’变体或其同源物包含下述之一:
-在选自L96、D99、A223和S224的氨基酸位置处的一个突变;或
-在选自L96和D99,L96和A223,L96和S224,D99和A223,D99和S224以及A223和S224的氨基酸位置处的两个突变;或
-在选自L96、D99和A223,L96、D99和S224,L96、A223和S224以及D99、A223和S224的氨基酸位置处的三个突变;或
-在氨基酸位置L96、D99、A223和S224处的四个突变。
在位置L96处的几个可能的突变中,8个特定突变即L96I、L96V、L96M、L96T、L96C、L96Q、L96A和L96S表现特别好。它们是特别优选的突变,L96I和L96V甚至更加优选。
在另一个实施方式中,根据本发明的枯草杆菌蛋白酶BPN’变体或其同源物包含L96位置处的突变,其优选地选自L96I、L96V、L96M、L96T、L96C、L96Q、L96A和L96S,更优选地选自L96I和L96V。
在位置D99处的几个可能的突变中,15个突变即D99R、D99K、D99G、D99F、D99T、D99S、D99N、D99Q、D99Y、D99M、D99I、D99H、D99E、D99L和D99W表现特别好,并因此是优选的。使用突变D99R、D99K和D99G获得了特别好的结果,因此它们是甚至更加优选的。
在又一个实施方式中,根据本发明的枯草杆菌蛋白酶BPN’变体或其同源物包含D99位置处的突变,其优选地选自D99R、D99K、D99G、D99F、D99T、D99S、D99N、D99Q、D99Y、D99M、D99I、D99H、D99E、D99L和D99W,更优选地选自D99R、D99K和D99G。
在位置A223处的几个可能的突变中,突变A223S和A223G表现特别好,并因此是更加优选的。
在另一个实施方式中,根据本发明的枯草杆菌蛋白酶BPN’变体或其同源物包含A223位置处的突变,其优选地选自A223S和A223G。
在位置S224处的几个可能的突变中,突变S224M、S224Q、S224E、S224H、S224L、S224V和S224I是特别优选的,因为它们显示出特别好的结果。
因此,在另一个实施方式中,根据本发明的枯草杆菌蛋白酶BPN’变体或其同源物包含位置S224处的突变,优选地选自S224M、S224Q、S224E、S224H、S224L、S224V和S224I。
在优选实施方式中,根据本发明的枯草杆菌蛋白酶BPN’变体或其同源物包含选自L96I、L96V、L96M、L96T、L96C、L96Q、L96A、L96S、D99R、D99K、D99G、D99F、D99T、D99S、D99N、D99Q、D99Y、D99M、D99I、D99H、D99E、D99L、D99W、A223S、A223G、S224M、S224Q、S224E、S224H、S224H、S224L、S224V和S224I的至少一个、优选地两个或三个或四个突变;更优选地,突变的组合选自L96V和D99R;L96I和D99R;L96I和D99K;L96I和A223S;L96I和S224V;L96V、D99R和A223S;L96V、D99R和S224V;L96I、D99R和A223S;L96I、D99R和S224V;L96I、D99K和A223S;L96I、D99K和S224V;L96V、D99R、A223S和S224V;L96I、D99R、A223S和S224V;L96V、D99K、A223S和S224V;以及L96I、D99K、A223S和S224V。
2个突变的优选组合选自L96V和D99R;L96I和D99R;L96I和D99K;L96I和A223S;以及L96I和S224V。
3个突变的优选组合选自L96V、D99R和A223S;L96V、D99R和S224V;L96I、D99R和A223S;L96I、D99R和S224V;L96I、D99K和A223S;L96I、A223S和S224V;以及L96I、D99K和S224V。
4个突变的优选组合选自L96V、D99R、A223S和S224V;L96I、D99R、A223S和S224V;L96V、D99K、A223S和S224V;以及L96I、D99K、A223S和S224V。
根据本发明的酶与枯草杆菌蛋白酶BPN’相比可以具有另外的突变,前提是它具有如上所定义的连接酶和/或环化酶活性,优选地具有本文别处所描述的一个或多个另外的突变。
根据本发明的酶优选地还包含在对应于P225的氨基酸位置处的突变,这可能对提高感兴趣的偶联或环化反应中的S/H比有利。
因此,本发明提供了一种枯草杆菌蛋白酶BPN’变体或其同源物,其还包含在氨基酸位置P225处的突变,优选地选自P225N、P225D、P225S、P225C、P225G、P225A、P225T、P225V、P225I、P225L、P225H和P225Q,更优选地选自P225N、P225D、P225S、P225C、P225G、P225A和P225T,甚至更优选地对应于P225N或P225D。
为了获得良好的酶稳定性,根据本发明的枯草杆菌蛋白酶BPN’变体或其同源物优选地还包含在选自Q2、S3、P5、S9、I31、K43、M50、A73、G169、S188、Q206、N212、T254和Q271的氨基酸位置处的一个或多个突变。优选地,所述一个或多个另外的突变选自Q2K、S3C、P5S、S9A、I31L、K43N、M50F、A73L、G169A、S188P、Q206C、N212G、T254A和Q271E。
因此,本发明提供了一种枯草杆菌蛋白酶BPN’变体或其同源物,其还包含在选自Q2、S3、P5、S9、I31、K43、M50、A73、G169、S188、Q206、N212、T254和Q271的氨基酸位置处的至少6个、优选地至少8个、更优选地至少10个、甚至更优选地至少12个突变,其中此类突变优选地选自Q2K、S3C、P5S、S9A、I31L、K43N、M50F、A73L、G169A、S188P、Q206C、N212G、T254A和Q271E。
此外优选地,根据本发明的枯草杆菌蛋白酶BPN’变体或其同源物还包含在选自S33、N62、E156、G166、Y217、N218和F189的氨基酸位置处的一个或多个突变,此类突变优选地选自S33T、N62A、N62R、N62K、E156S、E156N、E156K、E156R、G166S、G166E、G166D、Y217L、Y217H、Y217R、N218S、N218D和F189W。更优选的突变组合是E156K和G166E;以及E156K和G166D。
在另一个优选实施方式中,根据本发明的枯草杆菌蛋白酶BPN’变体或其同源物还包含在氨基酸位置M222和Y217处的至少一个突变或成对突变,其中单突变优选地选自M222P、M222G、M222H、Y217H、Y217G、Y217F、Y217L和Y217R,并且其中所述成对突变优选地选自M222P和Y217H;M222P和Y217G;M222G和Y217F;M222G和Y217G;M222G和Y217L;以及M222H和Y217R。
在其他优选实施方式中,根据本发明的枯草杆菌蛋白酶BPN’变体或其同源物还包含突变Q2K、S3C、P5S、S9A、I31L、K43N、M50F、N62A、A73L、E156N、G166E、G169A、S188P、F189W、Q206C、N212G、Y217H、N218D、M222P、P225N、T254A和Q271E。
在又一个优选实施方式中,根据本发明的枯草杆菌蛋白酶BPN’变体或其同源物还包含突变Q2K、S3C、P5S、S9A、I31L、K43N、M50F、A73L、I107V、E156S、G166S、G169A、S188P、F189W、Q206C、N212G、Y217H、N218S、M222P、P225N、T254A和Q271E。
在更优选实施方式中,根据本发明的枯草杆菌蛋白酶BPN’变体或其同源物包含突变Q2K、S3C、P5S、S9A、I31L、K43N、M50F、N62A、A73L、E156K、G166D、G169A、S188P、F189W、Q206C、N212G、Y217R、N218D、M222H、P225N、T254A、Q271E,和选自以下的突变组合:L96I和D99R;L96I和D99K;L96I和A223S;L96I和S224V;L96I、A223S和S224V;L96I、D99R和S224V;L96I、D99R、A223S和S224V;L96I、D99K和A223S;L96I、D99K和S224V;以及L96I、D99K、A223S和S224V。
可以使用其他枯草杆菌蛋白酶、特别是枯草杆菌蛋白酶BPN’同源物代替枯草杆菌蛋白酶BPN’,作为模板酶,可以通过诱变从其衍生出根据本发明的酶。根据本发明的此类变体至少具有对应于枯草杆菌蛋白酶BPN’的L75直至并包括G83的氨基酸的缺失,在对应于枯草杆菌蛋白酶BPN’中的第221位的位置处具有半胱氨酸或硒代半胱氨酸,并在选自L96、D99、A223和S224的氨基酸位置处具有采取如上所定义的所有可能的组合的所述其他突变中的至少一者。
因此,在一个实施方式中,本发明提供了一种枯草杆菌蛋白酶BPN’变体或其同源物,其与SEQ ID NO:2具有至少80%的序列同一性,优选地至少85%、更优选地至少90%或甚至更优选地至少95%的同一性;包含第75~83位氨基酸的缺失和在氨基酸位置S221处的突变,所述突变是S221C或S221硒代半胱氨酸,优选为S221C;并且所述变体或其同源物的特征在于在选自L96、D99、A223和S224的氨基酸位置处的至少一个突变,其中所述氨基酸位置根据由SEQ ID NO:2所示的枯草杆菌蛋白酶BPN’的序列或其同源序列来定义,并且其中此类变体或其同源物具有反应速率和偶联效率提高的连接酶和/或环化酶活性。
本发明的酶通常通过重组方法来生产,优选地通过表达已被突变的枯草杆菌蛋白酶BPN’DNA,使得在表达后产生具有酶活性的本发明的枯草杆菌蛋白酶BPN’变体。
因此,本发明还提供了一种制备根据本发明的酶的重组方法,所述方法包括下述步骤:
a)提供功能性表达编码所述酶的基因的重组宿主细胞,例如细菌细胞,如大肠杆菌或芽孢杆菌;
b)在提供有酶活性的酶的表达的条件下,培养所述宿主细胞;和
c)从所述微生物宿主回收所表达的酶。
本发明还提供了一种重组多核苷酸,其包含编码根据本发明的酶的序列。
本发明还提供了一种宿主细胞,其包含根据本发明的多核苷酸,所述多核苷酸能够表达所述酶。
根据本发明的枯草杆菌蛋白酶BPN’变体或其同源物催化酰胺键的形成。因此,本发明提供了一种酶法合成肽的方法,所述方法包括将(a)肽C-端(硫)酯与(b)具有N-端未保护的胺的肽亲核试剂偶联的步骤,其中所述偶联优选地在水性溶液中进行,并且其中所述偶联由枯草杆菌蛋白酶BPN’变体或其同源物催化,所述变体或其同源物与SEQ ID NO:2具有至少80%的序列同一性,包含第75~83位氨基酸的缺失和在氨基酸位置S221处的突变,所述突变是S221C或S221硒代半胱氨酸,优选为S221C;并且
所述变体或其同源物的特征在于在选自L96、D99、A223和S224的氨基酸位置处具有至少一个突变,
其中所述氨基酸位置根据由SEQ ID NO:2所示的枯草杆菌蛋白酶BPN’的序列或其同源序列来定义,并且其中所述变体或其同源物具有反应速率和偶联效率提高的连接酶和/或环化酶活性。
根据本发明的酶的用途扩展到催化如上所述的肽的环化反应和/或肽C-端(硫)酯与肽亲核试剂的偶联之外。所述枯草杆菌蛋白酶BPN’变体或其同源物可用于肽键之外的酰胺键的形成,但其与肽键相关的用途是特别优选的。
在根据本发明的方法中,反应通常在水性介质(优选地包含缓冲剂)中进行。
水性介质中的溶剂的水含量在10~100vol%的范围内。在水性介质中获得了特别好的结果,其中溶剂包含70~100vol%的水,更特别地90~100vol.%、95~100vol.%或98~100vol.%的水。更优选地,所述溶剂仅为水。
其他适合的溶剂是与水混溶的共溶剂,例如N,N-二甲基甲酰胺(DMF)、N-甲基吡咯烷酮(NMP)、N,N-二甲基乙酰胺(DMA)、二甲基亚砜(DMSO)、乙腈(ACN),或醚类例如四氢呋喃(THF)、2-甲基-四氢呋喃(Me-THF)或1,2-二甲氧基乙烷,或(卤代)醇例如甲醇、乙醇、异丙醇、叔丁醇、2,2,2-三氟乙醇(TFE)、1,1,1,3,3,3-六氟异丙醇,或其混合物。取决于枯草杆菌蛋白酶BPN’变体的稳定性和肽底物的溶解性,共溶剂的量优选地低于30vol%。
用于偶联或环化反应的水性缓冲介质的pH可以是至少5,特别是至少6,优选为至少7。所需pH通常低于11,特别是低于10,甚至更优选地低于9。更优选地,用于偶联或环化反应的pH在约7至9之间。
原则上,将pH维持在5至11范围内的任何缓冲剂都是适合的。适合的缓冲剂对于本领域技术人员来说是已知的,其也描述在例如Good,N.E.等,(1966),“用于生物学研究的氢离子缓冲剂”(Hydrogen Ion Buffers for Biological Research),Biochemistry5(2),467-477中。例如,使用古氏(Good’s)缓冲剂例如tricine已获得了特别好的结果。所述缓冲剂的浓度可以在宽限度内选择,例如在10~1000mM的范围内,特别是在25~500mM的范围内,更特别是在50~250mM的范围内。
向水性溶液中添加添加剂以便提高肽片段的溶解性或提高反应得率,可能是有利的。此类添加剂可以是盐或有机分子,例如盐酸胍、脲、十二烷基硫酸钠或吐温。
原则上,在偶联或环化反应期间的温度并不重要,只要选择待使用的酶显示出足够的活性和稳定性的温度即可。这种温度可以常规确定。通常,所述温度可以是至少10℃或更高,或至少20℃或更高,或70℃或更低,特别是50℃或更低。优选地,根据本发明的偶联或环化反应期间的温度在20~50℃的范围内。
通常使用的肽C-端酯或硫酯是活化的(硫)酯,即它含有可以参与反应的羧基酯或羧基硫酯基团。原则上,可以使用任何取代或未取代的烷基,或任何取代或未取代的芳基(硫)酯。可以参与反应的(硫)酯的典型实例是甲基-、乙基-、丙基-、异丙基-、苯基-、苯甲基-(例如对羧基-苯甲基-)、2,2,2-三氯乙基-、2,2,2-三氟乙基-、氰基甲基-和羧酰胺基甲基-(硫)酯。
使用由式肽-(C=O)O-CX1X2-C(=O)N-R1R2所示的羧酰胺基甲基类型的酯(Cam-酯)已获得了特别好的结果,其中每个X1和X2独立地表示氢原子或烷基,优选地两者都是氢原子;并且其中每个R1和R2独立地表示氢原子,或烷基,或具有C-端羧酰胺或羧酸官能团并在其侧链上任选被保护的氨基酸或肽残基。其中,每个烷基可以独立地表示取代或未取代的C1-C7烷基,优选为取代或未取代的直链C1-C6烷基,更优选为取代或未取代的直链C1-C3烷基,最优选为甲基。优选地,R1和R2两者均表示氢原子,或者R1表示氢原子,并且R2表示具有C-端羧酰胺或羧酸官能团并在其侧链上任选被保护的氨基酸或肽残基。使用Cam-AA1-AA2-酯是特别优选的,其中R2是二肽,其中AA1是第一氨基酸并且AA2是第二氨基酸。在这里,AA1是疏水氨基酸例如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、苯丙氨酸、甲硫氨酸或色氨酸。AA2是碱性氨基酸,例如精氨酸或赖氨酸。AA1和AA2通常具有游离侧链,即其不含保护基团或另一个残基。特别优选的是Cam酯肽-(C=O)O-CH2-C(=O)N-Phe-Arg-NH2/N-Phe-Lys-NH2
使用羧基取代的苯甲基酯,特别是由式肽-(C=O)-O-CH2-C6H4-(C=O)E所示的对或间羧基取代的苯甲基酯,也获得了特别好的结果,其中E表示羟基,羧酸盐例如铵盐,或具有C-端羧酰胺或羧酸官能团并在氨基酸/侧链上任选被保护的氨基酸或肽残基。使用由式肽-(C=O)-O-CH2-C6H4-(C=O)E所示的对或间羧基取代的苯甲基酯也获得了良好结果,其中E如上所定义,并且其中苯基环(上式中的C6H4)中的一个或多个氢原子被取代基例如羟基、烷氧基、芳氧基或卤素取代。
所述肽C-端(硫)酯可以是N-端未保护或N-端保护的。术语“N-端保护”在本文中用于表示肽的N-端胺基被提供有保护基团,通常至少基本上保护了N-端胺基免于与另一个肽或同一个肽分子的C-端羧基偶联。优选地,所述肽C-端(硫)酯未被N-端保护。
在本发明中使用的肽C-端(硫)酯可以使用固相合成,以高的得率和纯度合成,且没有外消旋。使用羧酰胺基甲基类型的(硫)酯(其中R1表示氢原子,并且R2表示具有C-端羧酸官能团,并任选地在氨基酸的侧链官能团上或在氨基酸的一个或多个侧链官能团上被保护的氨基酸或肽残基)的额外优点,在于它们的活化的C-端(硫)酯基团可以使用常用的固相支持物,如2-氯三苯甲基氯树脂(CTC树脂)、林克(Rink)树脂和王氏(Wang)树脂,通过固相合成来合成,正如也在本公开的方案1~2中所描述的。
所述肽C-端(硫)酯也可以通过溶液相合成或使用微生物发酵来合成。使用发酵获得肽(硫)酯的可靠方法是通过所谓的内含肽表达来进行(参见例如E.K.Lee,Journal ofChemical Technology and Biotechnology,2010,9,11-18)。不同的内含肽表达系统试剂盒是可商购的(例如IMPACTTM试剂盒)。用于肽(硫)酯的发酵生产的其他方法在本领域中是已知的。
肽C-端(硫)酯(即酰基供体硫酯)的氨基酸原则上可以选自任何蛋白原或非蛋白原氨基酸。任选地N-端保护的肽C-端(硫)酯可以由式I的化合物表示:
其中Q表示OR或SR部分,其中R可以表示取代或未取代的烷基或取代或未取代的芳基;并且P1表示氢或N-端保护基团。适合的N-端保护基团是可用于肽合成的基团,包括氨基甲酸酯或酰基类型的保护基团,例如Cbz(苯甲氧基羰基)、Boc(叔丁氧基羰基)、For(甲酰基)、Fmoc(9-芴基甲氧基羰基)、Smoc(2,7-二磺基-9-芴基甲氧基羰基)、PhAc(苯乙酰基)和Ac(乙酰基)。可以引入基团For、PhAc和Ac,并分别使用肽脱甲酰基酶、PenG酰化酶或酰基转移酶进行酶法切割。用于所有提到的保护基团的化学切割方法在本领域中是已知的。
在这里,n是值为至少2的整数,并取决于肽C-端(硫)酯的长度。
在这里,取决于参与的氨基酸,每个RA和每个RB独立地表示氢原子或氨基酸侧链。任选地,一个或多个侧链可以包含保护基团。
肽亲核试剂(即酰基受体)的氨基酸原则上可以选自任何蛋白原或非蛋白原氨基酸。具体而言,所述肽亲核试剂可以由式II的化合物表示:
其中n、RA和RB如上为式I所定义,并作必要的修改。
所述肽亲核试剂可以是C-端未保护或C-端保护的。术语“C-端保护”在本文中用于表示肽、特别是肽亲核试剂的C-端羧基被提供有保护基团,通常基本上保护了羧基免于与另一个肽或同一个肽分子的N-端胺基偶联。在这里,P2表示胺部分或OR部分。在P2表示胺部分的情况下,所述胺部分可以由式NR3R4表示,其中R3和R4可以各自独立地表示任何取代或未取代的烷基或任何取代或未取代的芳基。优选地,R3和R4之一是氢原子,并且另一者是取代或未取代的烷基;更优选地,R3和R4两者都是氢原子。在P2表示OR部分的情况下,R可以表示羧酸保护基团或阳离子,例如单价阳离子如三取代或四取代的铵离子或碱金属阳离子或H。在R是羧酸保护基团的情况下,OR具体来说可以是酯,其中R优选为叔烷基例如叔丁基、2-甲基-2-丁基和2,3-二甲基-2-丁基。
所述肽亲核试剂可以使用本领域中已知的方法例如固相合成、溶液相合成或使用微生物发酵来合成。
在一个实施方式中,所述肽C-端(硫)酯和/或肽亲核试剂的一个或多个侧链可以包含保护基团,其可以选自本领域中已知的适合的保护基团。羧酸基团可以例如用环己基、苯甲基或烯丙基保护;胺官能团可以例如用烷氧基羰基或三氟乙酰基保护。在优选实施方式中,所述肽C-端(硫)酯和肽亲核试剂不含侧链保护基团。
由于使用根据本发明的方法可以获得高的S/H比,因此通常不需要大大过量的肽C-端(硫)酯或肽亲核试剂即可在偶联反应中达到高得率。(a)肽C-端(硫)酯与(b)肽亲亲核试剂的适合比例在1:5至5:1,优选地在1:3至3:1的范围内,更优选地在1.0:2.5至2.5:1.0的范围内,特别是在1:2至2:1的范围内,更特别地在1:1.5至1.5:1的范围内。已发现大约化学计算量的比例是特别优选的。
本发明具体来说提供了一种允许通过肽片段的偶联高效制备生物活性肽的酶。这些肽包括胰高血糖素、glp-1、glp-2及其类似物例如dasiglucagon、艾塞那肽、利拉鲁肽、索马鲁肽、利西拉肽、替度鲁肽、glepaglutide、度拉糖肽、elsiglutide等,胸腺肽-α-1、胸腺肽-α-1类似物、特立帕肽、鲑鱼降钙素、比伐卢定和包含这些肽中的任一者的序列和至少一个另外的氨基酸的肽。优选地,glp-1类似物是利拉鲁肽和索马鲁肽;glp-2类似物优选为glepaglutide和elsiglutide。
因此,本发明提供了一种酶法合成选自利拉鲁肽、索马鲁肽、dasiglucagon、替度鲁肽、glepaglutide、elsiglutide、特立帕肽、鲑鱼降钙素、比伐卢定及其类似物的肽的方法。
本发明还提供了根据本发明的酶在酶法合成具有药理学意义的肽的方法中作为催化剂的用途,所述肽包括利拉鲁肽、索马鲁肽、dasiglucagon、替度鲁肽、glepaglutide、elsiglutide、特立帕肽、鲑鱼降钙素、比伐卢定及其类似物,其中dasiglucagon、glepaglutide、elsiglutide、特立帕肽、鲑鱼降钙素和比伐卢定是特别优选的。在根据本发明的方法中,优选地所述类似物是结构类似物。
利拉鲁肽(SEQ ID NO:6)是一种在第20位中赖氨酸的ε-氨基上被Glu隔开的棕榈酸取代的GLP-1类似物。因此,利拉鲁肽具有式H-His-Ala-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Lys(Pal-γ-Glu)-Glu-Phe-Ile-Ala-Trp-Leu-Val-Arg-Gly-Arg-Gly-OH。在Lys(Pal-γ-Glu)中,Lys残基的ε-氨基与γ-Glu羧基侧链相连,并且所述Glu被N-棕榈酰化。
索马鲁肽(SEQ ID NO:7)也是一种在第20位中赖氨酸的ε-氨基上具有取代的GLP-1类似物,并具有式H-His-Aib-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Lys(AEEA-AEEA-γ-Glu-17-羧基十七烷酰基)-Glu-Phe-Ile-Ala-Trp-Leu-Val-Arg-Gly-Arg-Gly-OH,其中AEEA-AEEA-γ-Glu-17-羧基十七烷酰基是N-(17-羧基-1-酮基十七烷基)-L-γ-谷氨酰基-2-[2-(2-氨基乙氧基)乙氧基]乙酰基-2-[2-(2-氨基乙氧基)乙氧基]乙酰基。
达西格列酮(Dasiglucagon)(SEQ ID NO:8)是一种人类胰高血糖素的新型肽类似物,具有式H-His-Ser-Gln-Gly-Thr-Phe-Thr-Ser-Asp-Tyr-Ser-Lys-Tyr-Leu-Asp-Aib-Ala-Arg-Ala-Glu-Glu-Phe-Val-Lys-Trp-Leu-Glu-Ser-Thr-OH。
格列帕格鲁肽(Glepaglutide)(SEQ ID NO:9)是一种GLP-2类似物,具有式H-His-Gly-Glu-Gly-Thr-Phe-Ser-Ser-Glu-Leu-Ala-Thr-Ile-Leu-Asp-Ala-Leu-Ala-Ala-Arg-Asp-Phe-Ile-AIa-Trp-Leu-Ile-Ala-Thr-Lys-Ile-Thr-Asp-Lys-Lys-Lys-Lys-Lys-Lys-NH2
艾司格鲁肽(Elsiglutide)(SEQ ID NO:10)是一种GLP-2类似物,具有式H-His-Gly-Glu-Gly-Ser-Phe-Ser-Ser-Glu-Leu-Ser-Thr-Ile-Leu-Asp-Ala-Leu-Ala-Ala-Arg-Asp-Phe-Ile-Ala-Trp-Leu-Ile-Ala-Thr-Lys-Ile-Thr-Asp-Lys-Lys-Lys-Lys-Lys-Lys-NH2
特立帕肽(SEQ ID NO:11)是一种重组人甲状旁腺激素(rhPTH),具有式H-Ser-Val-Ser-Glu-Ile-Gln-Leu-Met-His-Asn-Leu-Gly-Lys-His-Leu-Asn-Ser-Met-Glu-Arg-Val-Glu-Trp-Leu-Arg-Lys-Lys-Leu-Gln-Asp-Val-His-Asn-Phe-OH。
降钙素是一种肽激素,具体来说鲑鱼降钙素(SEQ ID NO:12)具有式H-Cys-Ser-Asn-Leu-Ser-Thr-Cys-Val-Leu-Gly-Lys-Leu-Ser-Gln-Glu-Leu-His-Lys-Leu-Gln-Thr-Tyr-Pro-Arg-Thr-Asn-Thr-Gly-Ser-Gly-Thr-Pro-NH2,并且在第1和7位处的半胱氨酸之间还带有二硫键。
比伐卢定(SEQ ID NO:13)是一种凝血酶抑制剂,具有式H-D-Phe-Pro-Arg-Pro-Gly-Gly-Gly-Gly-Asn-Gly-Asp-Phe-Glu-Glu-Ile-Pro-Glu-Glu-Tyr-Le u-OH。
通过酶法合成制备dasiglucagon、glepaglutide、elsiglutide、特立帕肽、鲑鱼降钙素和比伐卢定的方法在本领域中是未知的。
在优选实施方式中,本发明的枯草杆菌蛋白酶变体高效催化涉及特定肽片段偶联反应的dasiglucagon、glepaglutide、elsiglutide、特立帕肽、鲑鱼降钙素、比伐卢定、利拉鲁肽和索马鲁肽的制备,因此是优选的。
因此,在一个实施方式中,本发明提供了一种酶法合成dasiglucagon(SEQ ID NO:8)的方法,所述方法包括将(a)肽C-端(硫)酯与(b)具有N-端未保护的胺的肽亲核试剂偶联的步骤,并且其中所述偶联由如上所述并且如权利要求1及其从属权利要求中所定义的根据本发明的枯草杆菌蛋白酶BPN’变体或其同源物催化。
本发明还提供了一种合成肽的方法,所述肽包含dasiglucagon的序列(SEQ IDNO:8),即His-Ser-Gln-Gly-Thr-Phe-Thr-Ser-Asp-Tyr-Ser-Lys-Tyr-Leu-Asp-Aib-Ala-Arg-Ala-Glu-Glu-Phe-Val-Lys-Trp-Leu-Glu-Ser-Thr,所述方法包括将下述物质偶联的步骤:
(a)肽C-端(硫)酯,其包含具有序列His-Ser-Gln-Gly-Thr-Phe-Thr-Ser-(硫)酯(SEQ ID NO:15)的第一肽片段,和
(b)具有N-端未保护的胺的肽亲核试剂片段,其包含具有序列H-Asp-Tyr-Ser-Lys-Tyr-Leu-Asp-Aib-Ala-Arg-Ala-Glu-Glu-Phe-Val-Lys-Trp-Leu-Glu-Ser-Thr(SEQID NO:16)的第二肽片段;
(c)肽C-端(硫)酯,其包含具有序列His-Ser-Gln-Gly-Thr-Phe-Thr-Ser-Asp(硫)酯(SEQ ID NO:17)的第一肽片段,和
(d)具有N-端未保护的胺的肽亲核试剂片段,其包含具有序列H-Tyr-Ser-Lys-Tyr-Leu-Asp-Aib-Ala-Arg-Ala-Glu-Glu-Phe-Val-Lys-Trp-Leu-Glu-Ser-Thr(SEQ IDNO:18)的第二肽片段;
(e)肽C-端(硫)酯,其包含具有序列His-Ser-Gln-Gly-Thr-Phe-Thr-Ser-Asp-Tyr(硫)酯(SEQ ID NO:19)的第一肽片段,和
(f)具有N-端未保护的胺的肽亲核试剂片段,其包含具有序列H-Ser-Lys-Tyr-Leu-Asp-Aib-Ala-Arg-Ala-Glu-Glu-Phe-Val-Lys-Trp-Leu-Glu-Ser-Thr(SEQ ID NO:20)的第二肽片段;
其中所述偶联由本发明的枯草杆菌蛋白酶变体催化。
在另一个实施方式中,本发明提供了一种酶法合成glepaglutide(SEQ ID NO:9)的方法,所述方法包括将(a)肽C-端(硫)酯与(b)具有N-端未保护的胺的肽亲核试剂偶联的步骤,并且其中所述偶联由根据本发明并且如权利要求1及其从属权利要求中所定义的枯草杆菌蛋白酶BPN’变体或其同源物催化。
本发明还提供了一种合成肽的方法,所述肽包含glepaglutide的序列(SEQ IDNO:9),即His-Gly-Glu-Gly-Thr-Phe-Ser-Ser-Glu-Leu-Ala-Thr-Ile-Leu-Asp-Ala-Leu-Ala-Ala-Arg-Asp-Phe-Ile-AIa-Trp-Leu-Ile-Ala-Thr-Lys-Ile-Thr-Asp-Lys-Lys-Lys-Lys-Lys-Lys,所述方法包括将下述物质偶联的步骤:
(a)肽C-端(硫)酯,其包含具有序列His-Gly-Glu-Gly-Thr-Phe-Ser-Ser-Glu-Leu-Ala-(硫)酯(SEQ ID NO:21)的第一肽片段,和
(b)具有N-端未保护的胺的肽亲核试剂片段,其包含具有序列H-Thr-Ile-Leu-Asp-Ala-Leu-Ala-Ala-Arg-Asp-Phe-Ile-AIa-Trp-Leu-Ile-Ala-Thr-Lys-Ile-Thr-Asp-Lys-Lys-Lys-Lys-Lys-Lys(SEQ ID NO:22)的第二肽片段;
(c)肽C-端(硫)酯,其包含具有序列His-Gly-Glu-Gly-Thr-Phe-Ser-Ser-Glu-Leu-Ala-Thr-Ile-Leu-Asp-Ala-(硫)酯(SEQ ID NO:23)的第一肽片段,和
(d)具有N-端未保护的胺的肽亲核试剂片段,其包含具有序列H-Leu-Ala-Ala-Arg-Asp-Phe-Ile-AIa-Trp-Leu-Ile-Ala-Thr-Lys-Ile-Thr-Asp-Lys-Lys-Lys-Lys-Lys-Lys(SEQ ID NO:24)的第二肽片段;
其中所述偶联由本发明的枯草杆菌蛋白酶变体催化。
在另一个实施方式中,本发明提供了一种酶法合成elsiglutide(SEQ ID NO:10)的方法,所述方法包括将(a)肽C-端(硫)酯与(b)具有N-端未保护的胺的肽亲核试剂偶联的步骤,并且其中所述偶联由根据本发明并且如权利要求1及其从属权利要求中所定义的枯草杆菌蛋白酶BPN’变体或其同源物催化。
本发明还提供了一种合成肽的方法,所述肽包含elsiglutide的序列(SEQ ID NO:10),即His-Gly-Glu-Gly-Ser-Phe-Ser-Ser-Glu-Leu-Ser-Thr-Ile-Leu-Asp-Ala-Leu-Ala-Ala-Arg-Asp-Phe-Ile-AIa-Trp-Leu-Ile-Ala-Thr-Lys-Ile-Thr-Asp-Lys-Lys-Lys-Lys-Lys-Lys,所述方法包括将下述物质偶联的步骤:
(a)肽C-端(硫)酯,其包含具有序列His-Gly-Glu-Gly-Ser-Phe-Ser-Ser-Glu-Leu-Ser-(硫)酯(SEQ ID NO:25)的第一肽片段,和
(b)具有N-端未保护的胺的肽亲核试剂片段,其包含具有序列H-Thr-Ile-Leu-Asp-Ala-Leu-Ala-Ala-Arg-Asp-Phe-Ile-AIa-Trp-Leu-Ile-Ala-Thr-Lys-Ile-Thr-Asp-Lys-Lys-Lys-Lys-Lys-Lys(SEQ ID NO:26)的第二肽片段;
(c)肽C-端(硫)酯,其包含具有序列His-Gly-Glu-Gly-Ser-Phe-Ser-Ser-Glu-Leu-Ser-Thr-Ile-Leu-Asp-Ala-(硫)酯(SEQ ID NO:27)的第一肽片段,和
(d)具有N-端未保护的胺的肽亲核试剂片段,其包含具有序列H-Leu-Ala-Ala-Arg-Asp-Phe-Ile-AIa-Trp-Leu-Ile-Ala-Thr-Lys-Ile-Thr-Asp-Lys-Lys-Lys-Lys-Lys-Lys(SEQ ID NO:28)的第二肽片段,
其中所述偶联由本发明的枯草杆菌蛋白酶变体催化。
在又一个实施方式中,本发明提供了一种酶法合成特立帕肽(SEQ ID NO:11)的方法,所述方法包括将(a)肽C-端(硫)酯与(b)具有N-端未保护的胺的肽亲核试剂偶联的步骤,并且其中所述偶联由根据本发明并且如权利要求1及其从属权利要求中所定义的枯草杆菌蛋白酶BPN’变体或其同源物催化。
本发明还提供了一种合成肽的方法,所述肽包含特立帕肽的序列(SEQ ID NO:11),即
Ser-Val-Ser-Glu-Ile-Gln-Leu-Met-His-Asn-Leu-Gly-Lys-His-Leu-Asn-Ser-Met-Glu-Arg-Val-Glu-Trp-Leu-Arg-Lys-Lys-Leu-Gln-Asp-Val-His-Asn-Phe,所述方法包括将下述物质偶联的步骤:
(a)肽C-端(硫)酯,其包含具有序列Ser-Val-Ser-Glu-Ile-Gln-Leu-Met-His-Asn-Leu-(硫)酯(SEQ ID NO:29)的第一肽片段,和
(b)具有N-端未保护的胺的肽亲核试剂片段,其包含具有序列H-Gly-Lys-His-Leu-Asn-Ser-Met-Glu-Arg-Val-Glu-Trp-Leu-Arg-Lys-Lys-Leu-Gln-Asp-Val-His-Asn-Phe(SEQ ID NO:30)的第二肽片段;
其中所述偶联由本发明的枯草杆菌蛋白酶变体催化。
在优选实施方式中,所述酶法合成特立帕肽的方法包括将(a)肽C-端(硫)酯与(b)具有N-端未保护的胺的肽亲核试剂偶联的步骤,其中所述偶联由根据本发明的枯草杆菌蛋白酶BPN’变体或其同源物催化,并且其中所述肽C-端(硫)酯被N-端保护。
在另一个实施方式中,本发明提供了一种酶法合成鲑鱼降钙素(SEQ ID NO:12)的方法,所述方法包括将(a)肽C-端(硫)酯与(b)具有N-端未保护的胺的肽亲核试剂偶联的步骤,并且其中所述偶联由根据本发明并且如权利要求1及其从属权利要求中所定义的枯草杆菌蛋白酶BPN’变体或其同源物催化。
本发明还提供了一种合成肽的方法,所述肽包含鲑鱼降钙素的序列(SEQ ID NO:12),即Cys-Ser-Asn-Leu-Ser-Thr-Cys-Val-Leu-Gly-Lys-Leu-Ser-Gln-Glu-Leu-His-Lys-Leu-Gln-Th r-Tyr-Pro-Arg-Thr-Asn-Thr-Gly-Ser-Gly-Thr-Pro,所述方法包括将下述物质偶联的步骤:
(a)肽C-端(硫)酯,其包含具有序列Cys-Ser-Asn-Leu-Ser-Thr-Cys-Val-Leu-Gly-Lys-Leu-(硫)酯(SEQ ID NO:31)的第一肽片段,和
(b)具有N-端未保护的胺的肽亲核试剂片段,其包含具有序列H-Ser-Gln-Glu-Leu-His-Lys-Leu-Gln-Thr-Tyr-Pro-Arg-Thr-Asn-Thr-Gly-Ser-Gly-Thr-Pro(SEQ IDNO:32)的第二肽片段;
(c)肽C-端(硫)酯,其包含具有序列Cys-Ser-Asn-Leu-Ser-Thr-Cys-Val-Leu-Gly-Lys-Leu-Ser-Gln-Glu-Leu-His-Lys-Leu-Gln-(硫)酯(SEQ ID NO:33)的第一肽片段,和
(d)具有N-端未保护的胺的肽亲核试剂片段,其包含具有序列H-Thr-Tyr-Pro-Arg-Thr-Asn-Thr-Gly-Ser-Gly-Thr-Pro(SEQ ID NO:34)的第二肽片段,
其中所述偶联由本发明的枯草杆菌蛋白酶变体催化。
在另一个实施方式中,本发明提供了一种酶法合成比伐卢定(SEQ ID NO:13)的方法,所述方法包括将(a)肽C-端(硫)酯与(b)具有N-端未保护的胺的肽亲核试剂偶联的步骤,并且其中所述偶联由根据本发明并且如权利要求1及其从属权利要求中所定义的枯草杆菌蛋白酶BPN’变体或其同源物催化。
本发明还提供了一种合成肽的方法,所述肽包含比伐卢定的序列(SEQ ID NO:13),即
D-Phe-Pro-Arg-Pro-Gly-Gly-Gly-Gly-Asn-Gly-Asp-Phe-Glu-Glu-Ile-Pro-Glu-Glu-Tyr-Leu,所述方法包括将下述物质偶联的步骤:
(a)肽C-端(硫)酯包含具有序列D-Phe-Pro-Arg-Pro-Gly-Gly-Gly-Gly-Asn-Gly-(硫)酯(SEQ ID NO:35)的第一肽片段,和
(b)具有N-端未保护的胺的肽亲核试剂片段,其包含具有序列H-Asp-Phe-Glu-Glu-Ile-Pro-Glu-Glu-Tyr-Leu(SEQ ID NO:36)的第二肽片段;
其中所述偶联由本发明的枯草杆菌蛋白酶变体催化。
在优选实施方式中,所述酶法合成比伐卢定(SEQ ID NO:13)的方法包括将(a)肽C-端硫酯与(b)具有N-端未保护的胺的肽亲核试剂偶联的步骤,其中所述偶联由由根据本发明并且如权利要求1及其从属权利要求中所定义的枯草杆菌蛋白酶BPN’变体或其同源物催化。
在另一个实施方式中,本发明提供了一种酶法合成利拉鲁肽(SEQ ID NO:6)的方法,所述方法包括将(a)肽C-端(硫)酯与(b)具有N-端未保护的胺的肽亲核试剂偶联的步骤,并且其中所述偶联由根据本发明并且如权利要求1及其从属权利要求中所定义的枯草杆菌蛋白酶BPN’变体或其同源物催化。
在又一个实施方式中,本发明提供了一种酶法合成索马鲁肽(SEQ ID NO:7)的方法,所述方法包括将(a)肽C-端(硫)酯与(b)具有N-端未保护的胺的肽亲核试剂偶联的步骤,并且其中所述偶联由根据本发明并且如权利要求1及其从属权利要求中所定义的枯草杆菌蛋白酶BPN’变体或其同源物催化。
本发明提供了一种用于合成肽的方法,所述肽包含序列His-W-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Z-Glu-Ph e-Ile-Ala-Trp-Leu-Val-Arg-Gly-Arg-Gly,其中
对于合成利拉鲁肽,W是Ala并且Z选自Lys、Lys(PG)、Lys(γ-Glu)和Lys(Pal-γ-Glu);或者其中
对于合成索马鲁肽,W是Aib,并且Z选自Lys、Lys(PG)和Lys(AEEA-AEEA-γ-Glu-17-羧基十七烷酰基);
所述方法包括将下述物质偶联的步骤:
(a)肽C-端(硫)酯,其包含具有序列His-W-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-(硫)酯(SEQ ID NO:37)的第一肽片段,和
(b)具有N-端未保护的胺的肽亲核试剂片段,其包含具有序列H-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Z-Glu-Phe-Ile-Ala-Trp-Leu-Val-Arg-Gly-Arg-Gly-OH(SEQ IDNO:38)的第二肽片段;
其中所述偶联由本发明的枯草杆菌蛋白酶变体催化,并且其中PG是Lys侧链氨基的保护基团。
在另一个优选实施方式中,本发明提供了一种酶法合成肽的方法,所述肽包含利拉鲁肽的序列(SEQ ID NO:6),即His-Ala-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Z-Glu-Phe-Ile-Ala-Trp-Leu-Val-Arg-Gly-Arg-Gly,
其中Z选自Lys、Lys(PG)、Lys(γ-Glu)和Lys(Pal-γ-Glu);所述方法包括将下述物质偶联的步骤:
a)肽C-端(硫)酯,其包含具有序列His-Ala-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-(硫)酯(SEQ ID NO:37)的第一肽片段,和
(b)具有N-端未保护的胺的肽亲核试剂片段,其包含具有序列H-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Z-Glu-Phe-Ile-Ala-Trp-Leu-Val-Arg-Gly-Arg-Gly-OH(SEQ IDNO:38)的第二肽片段,
其中所述偶联优选地在水性溶液中进行,并且其中所述偶联由枯草杆菌蛋白酶BPN’变体催化,所述变体与枯草杆菌蛋白酶BPN’SEQ ID NO:2具有至少80%的序列同一性,包含第75~83位氨基酸的缺失和在氨基酸位置S221处的突变,所述突变是S221C或S221硒代半胱氨酸,优选为S221C;并且
所述变体的特征在于在选自L96、D99、A223和S224的氨基酸位置处具有至少一个突变,
其中所述氨基酸位置根据SEQ ID NO:2定义,
并且其中此类变体或其同源物具有选择性提高的连接酶活性。
在更优选实施方式中,上述方法中的枯草杆菌蛋白酶BPN’变体被进一步表征为具有选自下述的突变组合:
L96V和D99R;L96I和D99R;L96I和D99K;L96I和A223S;L96I和S224V;
L96V、D99R和A223S;L96V、D99R和S224V;L96I、A223S和S224V;L96I、D99R和A223S;L96I、D99R和S224V;L96I、D99K和S224V;
L96V、D99R、A223S和S224V;L96I、D99R、A223S和S224V;以及L96I、D99K、A223S和S224V。
甚至更优选地,上述方法中的枯草杆菌蛋白酶BPN’变体具有选自下述的一个或多个突变组合:
E156K和G166E;E156K和G166D;以及M222H和Y217R。
例如,优选的突变组合是:E156K、G166E、L96I和D99R;
E156K、G166E、L96I和A223S;
E156K、G166E、L96I和S224V;
E156K、G166E、L96I、A223S和S224V;
E156K、G166E、L96I、D99R和A223S;
E156K、G166E、L96I、D99R和S224V;
E156K、G166E、L96I、D99R、A223S和S224V;
Y217R、M222H、L96I、E156K和G166D;
Y217R、M222H、L96I、E156K、G166D和D99R;
Y217R、M222H、L96I、E156K、G166D和D99K;
Y217R、M222H、L96I、E156K、G166D和A223S;
Y217R、M222H、L96I、E156K、G166D和S224V;
Y217R、M222H、L96I、E156K、G166D、A223S和S224V;
Y217R、M222H、L96I、E156K、G166D、D99R和S224V;
Y217R、M222H、L96I、E156K、G166D、D99R、A223S和S224V;
Y217R、M222H、L96I、E156K、G166D、D99K和S224V;以及
Y217R、M222H、L96I、E156K、G166D、D99K、A223S和S224V。
因此,本发明的另一个实施方式是一种枯草杆菌蛋白酶BPN’变体,其与枯草杆菌蛋白酶BPN’SEQ ID NO:2具有至少80%的序列同一性,包含第75~83位氨基酸的缺失和在氨基酸位置S221处的突变,所述突变是S221C或S221硒代半胱氨酸,优选为S221C;并且所述变体的特征在于上面列出的突变和突变组合,并且其中所述变体具有对于酶法合成利拉鲁肽来说反应速率、偶联效率和选择性提高的连接酶活性。
使用实施例9中所描述的根据本发明的枯草杆菌蛋白酶BPN’变体,在用于利拉鲁肽的反应在偶联效率和选择性方面获得了惊人的好的结果,其中突变被称为Ptl-84(SEQID NO:4)连接酶序列,其相对于野生型枯草杆菌蛋白酶BPN’(SEQ ID NO:2)具有突变。例如,在第156位,SEQ ID NO:2具有E,而SEQID NO:4具有N。因此,例如,在实施例9的表中第9条,被指示为Ptl-84+N156K+E166E+L96I的根据本发明的枯草杆菌蛋白酶BPN’变体在第156位处具有被指示为N156K的突变,而不是在被称为SEQ ID NO:2的情况下将是E156K的突变。
现在将通过下述实施例说明本发明。
缩略语
SPPS 肽固相合成
CTC 2-氯-三苯甲基氯
AEEA 2-[2-(2-氨基乙氧基)乙氧基]乙酰基
Cbz 苯甲氧基羰基
For 甲酰基
Fmoc 9-芴基甲氧基羰基
Boc 叔丁氧基羰基
Smoc 2,7-二磺基-9-芴基甲氧基羰基
Ac 乙酰基
PhAc 苯乙酰基
Trt 三苯甲基(三苯基甲基)
tBu 叔丁基
Pbf 2,2,4,6,7-五甲基-二氢苯并呋喃-5-磺酰基
eq 当量
h 小时
min 分钟
HPLC 高效液相层析
DIPEA N,N-二异丙基乙胺
TFA 三氟乙酸
TIS 三异丙基甲硅烷
Ac2O 乙酸酐
DMF N,N-二甲基甲酰胺
DMA N,N-二甲基乙酰胺
DCM 二氯甲烷
THF 四氢呋喃
NMP N-甲基-2-吡咯烷酮
MTBE 甲基-叔丁基醚
MeOH 甲醇
DCC N,N‘-二环己基碳二亚胺
EDC N-(3-二甲基氨基丙基)-N′-乙基碳二亚胺
HOBt 1-羟基苯并三唑
HOAt 1-羟基-7-氮杂苯并三唑
TCEP 三(2-羧基乙基)膦
Tricine N-(2-羟基-1,1-双(羟甲基)乙基)甘氨酸
实施例
根据本发明(的用途)的酶(或酶变体)的生产
诱变、克隆和表达
称为Ptl-84(SEQ ID NO:4)的参比酶对应于SEQ ID NO:2,其中缺失了对应于第75~83位置的氨基酸(Δ75-83,Ca2+结合环),并包括突变Q2K、S3C、P5S、S9A、I31L、K43N、M50F、N62A、A73L、E156N、G166E、G169A、S188P、F189W、Q206C、N212G、Y217H、N218D、S221C、M222P、P225N、T254A和Q271E。将编码带有His标签的Ptl-84的基因克隆到基于pUB-110的大肠埃希氏杆菌-枯草芽孢杆菌穿梭载体(即pBS42或pBES)中。Ptl-84在先公开于WO2019170918中(在其中对应于SEQ ID NO:3)。
相应的氨基酸序列按照枯草杆菌蛋白酶BPN’编号方案编号。第-107至-1位氨基酸包含信号序列、前体(pre-)序列和原(pro-)序列,它们在完全成熟后被切除。第1~275位氨基酸包含表现出完全催化活性的成熟酶。为了能够进行快速高效的纯化,在第275位氨基酸之后附连了C-端His标签。由于去除了钙结合位点,Ptl-84与枯草杆菌蛋白酶BPN’相比含有9个氨基酸的缺失,包括对应于枯草杆菌蛋白酶BPN’中的L75、N76、N77、S78、I79、G80、V81、L82和G83的氨基酸。为了使Ptl-84(和本发明的酶)维持枯草杆菌蛋白酶BPN’的编号,所述编号从74跳到84。在穿梭载体中,基因的表达在aprE启动子的控制之下。将得到的质粒pBES-Ptl-84 HIS在大肠埃希氏杆菌TOP10中繁殖,并转化到枯草芽孢杆菌GX4935(trpC2metB10 lys-3ΔnprEΔaprE)中。使用pBES-Ptl-84 HIS作为模板,通过Quikchange方法(Agilent)进行突变。或者,可以使用本领域中已知的用于定点突变的其他方法。或者,DNA由GenScript,USA合成,并整合到相应的穿梭载体中。
带有His标签的合成的枯草杆菌蛋白酶BPN’变体的生产和纯化:
将含有具有感兴趣的枯草杆菌蛋白酶变体基因的质粒的枯草芽孢杆菌的单个微生物菌落接种到5mL含卡那霉素(10μg/mL)的LB中,在振荡培养箱中,在37℃下培养。将0.6mL过夜培养物添加到30mL增补有抗生素(卡那霉素10μg/mL)和氨基酸(100mg/L Trp、100mg/L Met和100mg/L Lys)的Terrific肉汤中。将细胞在振荡培养箱(200rpm)中,在37℃下生长48h。通过离心(30min,4,000rpm,4℃)收获细胞。倾倒出培养基(30mL),并在Amicon离心装置(15ml,10kDa截留MW)上,通过两个离心步骤(15min,4000rpm,4℃)进行浓缩。然后将浓缩的培养基(0.5ml)用缓冲液A(25mM Tricine,pH 7.5,0.5M NaCl)在三个清洗/浓缩步骤(14ml缓冲液A,10min,4,000rpm,4℃)中交换。对于His标签纯化来说,将Talon树脂(2.5ml,Clonetech)添加到塑料柱套中。将树脂用20mL脱矿物质水清洗,并用20mL缓冲液A平衡。将粗酶装载在柱上,并在定轨摇床上在4℃下温育过夜。在温育后,将树脂用100mL缓冲液A清洗。将酶用15mL缓冲液B(25mM Tricine,pH 7.5,0.5M NaCl,0.5M咪唑)洗脱下来。将洗脱液与6mM TCEP(三(2-羧基乙基)膦)进一步温育30min,并在Amicon离心装置(15ml,10kDa截留MW)上通过离心(30min,4000rpm,4℃)进行浓缩,并将缓冲液在三个清洗/浓缩步骤(15ml缓冲液,10min,4,000rpm,4℃)中交换成25mM Tricine,pH 7.5。
通过SDS-PAGE和密度测量分析(BioRad GS-900)确定纯度。通过使用Nanodrop(Thermo Scientific)测量280nm处的吸光度来确定酶浓度,1Abs=1mg/ml。得到的水性溶液(25mM Tricine,pH 7.5)含有约0.1~2mg/ml得到的酶。将酶浓度经过校正(mg/ml*纯度)的溶液用于偶联和环化反应。
关于合成的枯草杆菌蛋白酶BPN’变体参比物的生产和纯化的详细描述,参见WO2016/056913和WO 2018/212658。
片段酶法偶联的实施例
材料和方法
除非另有陈述,否则化学品从商业来源获得,无需进一步纯化可直接使用。分析HPLC在HP1090液相色谱上,使用反相柱(Phenomenex,C18,5μm粒径,150×4.6mm)在40℃下进行。UV检测在220nm处,使用UV-VIS204线性光谱仪进行。梯度程序是:0~25min,5%至98%的洗脱剂B的线性梯度匀变;25.1~30min,5%洗脱剂B(洗脱剂A:0.5mL/L甲磺酸(MSA)的H2O溶液,洗脱剂B:0.5mL/L MSA的乙腈溶液)。流速在0~25.1min为1mL/min,在25.2~29.8min为2mL/min,然后回到1mL/min直至在30min时停止。进样体积为20μL。制备HPLC在Varian PrepStar系统上,使用固定相柱(Pursuit XRs,C18,10μm粒径,500×41.4mm)进行。LC-MS在Agilent 1200系列液相色谱上,使用反相柱(Phenomenex,C18,5μm粒径,150×4.6mm)在40℃下进行。UV检测和梯度程序如为分析HPLC所述。分子量使用Agilent 6130四极LC/MS系统确定。
方案1:肽-OCam-Leu-OH酯的制备
将1g Fmoc-Leu-Wang树脂(载量为0.72mmol/g)用DCM(2×2min,10mL)和DMF(2×2min,10mL)清洗,并使用哌啶/DMF(1/4,v/v,2×8min,10mL)进行Fmoc去保护。在用DMF(2×2min,10mL)、DCM(2×2min,10mL)和DMF(2×2min,10mL)清洗后,使用DCM(45min,10mL)中的DCC(4eq)和HOAt(4eq)将碘乙酸(4eq)偶联到树脂。在用DMF(2×2min,10mL)、DCM(2×2min,10mL)和THF(2×2min,10mL)清洗后,使用DMF/THF(1/1,v/v,10mL)中的4eq.Fmoc-Xxx-OH和10eq.DIPEA在50℃下20h,将树脂用Fmoc保护的氨基酸装载。在这里和本公开的其他部分中“Xxx”表示一个氨基酸(正如在下面的实施例中所示,可以随着靶肽而变)。
在用DMF(2×2min,10mL)、DCM(2×2min,10mL)和DMF(2×2min,10mL)清洗后,按照标准的SPPS方案延长所述肽。从树脂的切割和侧链去保护使用TFA、TIS和水的混合物(95/2.5/2.5,v/v/v,15mL)进行120min。使用MTBE/正庚烷(1/1,v/v,50mL)将粗品肽沉淀。通过离心收集沉淀的肽并将其用MTBE/正庚烷(1/1,v/v,50mL)清洗两次,然后从乙腈/水(1/1,v/v,50mL)冻干。
方案2:肽-OCam-Phe-Lys-NH2酯的制备
将1g Rink树脂(4-((2,4-二甲氧基苯基)(Fmoc-氨基)甲基)苯氧基烷基接头,载量为0.64mmol/g)用DCM(2×2min,10mL)和DMF(2×2min,10mL)清洗,然后使用哌啶/DMF(1/4,v/v,2×8min,10mL)进行Fmoc去保护。按照标准的SPPS方案偶联Fmoc-Lys(Boc)-OH,然后是Fmoc-Phe-OH。在使用哌啶/DMF(1/4,v/v,2×8min,10mL)Fmoc去保护后,用DMF(2×2min,10mL)、DCM(2×2min,10mL)和DMF(2×2min,10mL)清洗,使用DCM(45min,10mL)中的DCC(4eq)和HOAt(4eq)将碘乙酸(4eq)偶联到树脂。在用DMF(2×2min,10mL)、DCM(2×2min,10mL)和THF(2×2min,10mL)清洗后,使用DMF/THF(1/1,v/v,10mL)中的Fmoc-Xxx-OH(4eq)和DIPEA(10eq)将树脂用Fmoc保护的氨基酸在50℃下装载20h。
在用DMF(2×2min,10mL)、DCM(2×2min,10mL)和DMF(2×2min,10mL)清洗后,按照标准的SPPS方案延长所述肽。从树脂的切割和侧链去保护使用TFA、TIS和水的混合物(95/2.5/2.5,v/v/v,15mL)进行120min。使用MTBE/正庚烷(1/1,v/v,50mL)将粗品肽沉淀。通过离心收集沉淀的肽,将其用MTBE/正庚烷(1/1,v/v,50mL)清洗两次并真空干燥,以提供标题酯(也被标为肽-OCam-FK-NH2酯)。在酶法连接之前,将所述粗品肽通过制备HPLC进行纯化,然后将纯的级分冻干。
类似地,制备了肽-OCam-FR-NH2酯。
方案3a:C-端酰胺肽亲核试剂的制备
将1g Rink树脂(4-((2,4-二甲氧基苯基)(Fmoc-氨基)甲基)苯氧基烷基接头,载量为0.64mmol/g)用DCM(2×2min,10mL)和DMF(2×2min,10mL)清洗,然后使用哌啶/DMF(1/4,v/v,2×8min,10mL)进行Fmoc去保护。按照标准的SPPS方案延长所述肽。从树脂的切割和侧链去保护使用TFA/TIS/水的混合物(95/2.5/2.5,v/v/v,15mL)进行120min。使用MTBE/正庚烷(1/1,v/v,50mL)将粗品肽沉淀。通过离心收集沉淀的肽,将其用MTBE/正庚烷(1/1,v/v,50mL)清洗两次并真空干燥。在酶法连接之前,将所述粗品肽通过制备HPLC进行纯化,然后将纯的级分冻干。
方案3b:C-端羧酸肽亲核试剂的制备
将1克预先装载的Fmoc-Xxx-Wang树脂(载量为0.30mmol/克)用DCM(2×2min,10mL)和DMF(2×2min,10mL)清洗,并使用哌啶/DMF(1/5,v/v,2×8min,10mL)进行Fmoc去保护。按照标准的SPPS方案延长所述肽。从树脂的切割和侧链去保护使用TFA/TIS/水的混合物(95/2.5/2.5,v/v/v,15mL)进行120min。使用MTBE/正庚烷(1/1,v/v,50mL)将粗品肽沉淀。通过离心收集沉淀的肽,将其用MTBE/正庚烷(1/1,v/v,50mL)清洗两次并真空干燥。在酶法连接之前,将所述粗品肽通过制备HPLC进行纯化,然后将纯的级分冻干。
方案4:N-乙酰基保护的肽活化酯的制备
在按照方案1或2之一对所需序列进行SPPS后,使用哌啶/DMF(1/4,v/v,2×8min,10mL)对树脂结合的肽进行Fmoc去保护。将树脂用DMF(2×2min,10mL)、DCM(2×2min,10mL)和DMF(2×2min,10mL)清洗,并使用Ac2O(10vol%)、DIPEA(5vol%)、HOBt(0.2wt%)在DMF中的混合物(2×10min,10mL)将肽N-端胺官能团乙酰化。将树脂用DMF(3×2min,10mL)和DCM(3×2min,10mL)清洗。从树脂的切割和侧链去保护使用TFA/TIS/水的混合物(95/2.5/2.5,v/v/v,15mL)进行120min。使用MTBE/正庚烷(1/1,v/v,50mL)将粗品肽沉淀。通过离心收集沉淀的肽,将其用MTBE/正庚烷(1/1,v/v,50mL)清洗两次并真空干燥。在酶法连接之前,将所述粗品肽通过制备HPLC进行纯化,然后将纯的级分冻干。
类似地,通过用PhAc2O代替Ac2O,也制备了N-苯乙酰基保护的肽活化酯。
方案5:在从两个片段合成利拉鲁肽(SEQ ID NO:6)中筛选新的酶变体
制备5mg/mL H-Lira(1-11)-OCam-FK-NH2(即按照方案2制备的H-1His-2Ala-3Glu-4Gly-5Thr-6Phe-7Thr-8Ser-9Asp-10Val-11Ser-OCam-Phe-Lys-NH2·3TFA(SEQ ID NO:39))和5mg/mL H-Lira(12-31)-OH(按照方案3b制备的H-12Ser-13Tyr-14Leu-15Glu-16Gly-17Gln-18Ala-19Ala-20Lys(Pal-γ-Glu)-21Glu-22Phe-23Ile-24Ala-25Trp-26Leu-27Val-28Arg-29Gly-30Arg-31Gly-OH·3TFA(SEQ ID NO:40),也参见WO2019170918)的储用溶液,溶解在含有50mM Tricine、220mM三氟乙酸钾和2mg/mL TCEP的缓冲液中,并使用1N KOH水溶液将pH设定到7.9。该储用溶液可以被分成等分试样,并储存在-20℃,以备进一步使用。向玻璃小瓶添加50μL上述肽储用溶液,并通过与25μL酶变体溶液(0,2mg/mL,在含有25mM Tricine的pH7.5的缓冲液中)混合开始偶联反应。在不同时间点(通常为0、15、30、60和120min),将10μL反应混合物在250μL甲磺酸的脱矿物质水溶液(5mL/L)中猝灭,以终止任何酶活性。使用HPLC/MS分析所述猝灭的样品。将指示偶联产物利拉鲁肽(H-Lira(1-31)-OH)的HPLC峰积分,并在每个实施例的表中表示为HPLC面积%。
注:在60min后,反应一般尚未完成,因此这个时间点被用于突出变体之间的差异(较慢的酶在较晚的时间点仍可给出相同的产物得率)。60min时间点被用于与利拉鲁肽相关的实施例1、2、3、5、6、8以及实施例4、10、11、12和13中。
方案6:在8-mer模型肽(SEQ ID NO:14)的合成中筛选新的酶变体
制备9.4mg/mL酯(按照方案1和4制备的Ac-Asp-Phe-Ser-Lys-Leu-OCam-Leu-OH·1TFA(SEQ ID NO:41))和8.8mg/mL胺(按照方案3a制备的H-Ala-Leu-Arg-NH2·2TFA)的储用溶液,溶解在含有50mM Tricine、220mM三氟乙酸钾和2mg/mL TCEP的缓冲液中,并使用1NKOH水溶液将pH设定到7.9。该储用溶液可以被分成等分试样,并储存在-20℃,以备进一步使用。向玻璃小瓶添加25μL上述肽储用溶液,65μL含有50mM Tricine、220mM三氟乙酸钾的缓冲液,并通过与12.5μL酶变体溶液(0,2mg/mL,在含有25mM Tricine的pH 7.5的缓冲液中,因此总计2,5μg酶)混合开始反应。在不同时间点(通常为0、15、30、60和120min),将10μL反应混合物在190μL甲磺酸的脱矿物质水溶液(5mL/L)中猝灭,以终止任何酶活性。使用HPLC/MS分析所述猝灭的样品。对于每种酶变体来说将指示偶联产物利拉鲁肽(Ac-Asp-Phe-Ser-Lys-Leu-Ala-Leu-Arg-NH2,SEQ ID NO:14)的HPLC峰积分,并在相应实施例的表中表示为HPLC面积%。
方案7:在从两个片段合成利拉鲁肽(SEQ ID NO:6)中筛选新的酶变体的选择性
制备7.87mM H-Lira(1-11)-OCam-FK-NH2(按照方案2制备的H-1His-2Ala-3Glu-4Gly-5Thr-6Phe-7Thr-8Ser-9Asp-10Val-11Ser-OCam-Phe-Lys-NH2(SEQ ID NO:39))和4.49mMH-Lira(12-31)-OH(按照方案3b制备的H-12Ser-13Tyr-14Leu-15Glu-16Gly-17Gln-18Ala-19Ala-20Lys(Pal-γ-Glu)-21Glu-22Phe-23Ile-24Ala-25Trp-26Leu-27Val-28Arg-29Gly-30Arg-31Gly-OH(SEQ ID NO:40),也参见WO2019170918)的储用溶液,溶解在含有50mM Tricine、220mM三氟乙酸钾和0.25mg/mL TCEP的缓冲液中,并使用3N KOH水溶液将pH设定到7.9。该储用溶液可以被分成等分试样,并储存在-20℃,以备进一步使用。向玻璃小瓶添加85μL上述肽储用溶液,并通过与15μL酶变体溶液(0,2mg/mL,在含有25mM Tricine、125mM NaCl的pH 7.5的缓冲液中)混合开始反应。在不同时间点(通常为0、15、30、60、120和360min),将10μL反应混合物在250μL甲磺酸的脱矿物质水溶液(5mL/L)中猝灭,以终止任何酶活性。使用HPLC/MS分析所述猝灭的样品。通过对利拉鲁肽(H-Lira(1-31)-OH)产物和未反应的肽胺(H-Lira(12-31)-OH)峰进行积分来计算向产物的转化率,并在每个实施例的表中表示为HPLC面积%。选择性值通过用利拉鲁肽(H-Lira(1-31)-OH)产物的量(面积%)除以不想要的副产物H-Lira(1-11-1-31)-OH的量(面积%)来计算。向产物的转化率和选择性值在酰基供体酯完全转化后(30-360min之间)计算。
偶联实施例
注:如上所述,被命名为为的Ptl-84(SEQ ID NO:4)参比酶对应于缺失了对应于第75-83位的氨基酸并包括额外突变Q2K、S3C、P5S、S9A、I31L、K43N、M50F、N62A、A73L、E156N、G166E、G169A、S188P、F189W、Q206C、N212G、Y217H、N218D、S221C、M222P、P225N、T254A和Q271E并加上6-His标签的SEQ ID NO:2(野生型枯草杆菌蛋白酶BPN’)。
另一种参比酶被命名为Ptl-79(SEQ ID NO:5),并对应于缺失了对应于第75~83位的氨基酸并包括额外突变Q2K、S3C、P5S、S9A、I31L、K43N、M50F、A73L、I107V、E156S、G166S、G169A、S188P、F189W、Q206C、N212G、Y217H、N218S、S221C、M222P、P225N、T254A和Q271E并加上6-His标签的SEQ ID NO:2(野生型枯草杆菌蛋白酶BPN’)。
在实施例1~13中使用的所有酶均具有所提到的参比酶(Ptl-84或Ptl-79)的所有突变,加上在每个实施例中所提到的额外突变。Ptl-84、Ptl-79、任何其他参比酶和本发明的酶均使用上述技术来生产。
实施例1:使用Ptl-84+L96X变体从两个片段合成利拉鲁肽(SEQ ID NO:6)
为了确定L96突变对利拉鲁肽合成的影响,按照方案5进行筛选。对于代表性酶变体来说,在反应60min后偶联产物利拉鲁肽(H-Lira(1-31)-OH)的量列于下表中。在L96位置处不含突变的参比酶Ptl-84用粗体表示。
编号 酶变体 H-Lira(1-31)-OH的面积%
1 Ptl-84+L96I 51,50
2 Ptl-84+L96V 46,11
3 Ptl-84+L96M 43,84
4 Ptl-84+L96T 41,82
5 Ptl-84+L96A 41,18
6 Ptl-84+L96C 40,24
7 Ptl-84+L96S 39,81
8 Ptl-84+L96Q 36,51
9 Ptl-84+L96H 35,28
10 Ptl-84 33,93
显然,L96位置对反应速率和偶联效率具有显著影响。9种变体(Ptl-84+L96I/V/M/T/A/C/S/Q/H)的评分明显好于野生型酶。相对于野生型酶,这些变体可用于以更高的得率生产利拉鲁肽,同时相同的转化率所需的酶更少。
实施例2:使用Ptl-84+D99X变体从两个片段合成利拉鲁肽(SEQ ID NO:6)
为了确定D99突变对利拉鲁肽合成的影响,按照方案5进行筛选。对于代表性酶变体来说,在反应60min后偶联产物利拉鲁肽(H-Lira(1-31)-OH)的量列于下表中。
显然,D99位置对反应速率和偶联效率具有显著影响。17种变体(Ptl-84+D99R/K/G/F/T/S/Q/N/Y/A/M/I/V/H/L/E/W)评分明显好于野生型。相对于野生型,这些变体可用于以更高的得率生产利拉鲁肽,同时相同的转化率所需的酶更少。
实施例3:使用Ptl-84+A223X变体从两个片段合成利拉鲁肽(SEQ ID NO:6)
为了确定A223突变对利拉鲁肽合成的影响,按照方案5进行筛选。对于代表性酶变体来说,在反应60min后偶联产物利拉鲁肽(H-Lira(1-31)-OH)的量列于下表中。
编号 酶变体 H-Lira(1-31)-OH的面积%
1 Ptl-84+A223S 51,54
2 Ptl-84+A223G 50,14
3 Ptl-84 45,13
显然,A223位置对反应速率和偶联效率有影响。令人吃惊的是,A223S和A223G突变对反应速率和效率具有非常积极的影响。相对于野生型酶,这些变体可用于以更高的得率生产利拉鲁肽,同时相同的转化率所需的酶更少。
实施例4:使用Ptl-84+S224X变体合成8-mer模型肽(SEQ ID NO:14)
为了确定S224突变对8-mer模型肽合成的影响,按照方案6进行筛选。对于代表性酶变体来说,在反应60min后偶联产物Ac-Asp-Phe-Ser-Lys-Leu-Ala-Leu-Arg-NH2(SEQ IDNO:14)的量列于下表中。
编号 酶变体 Ac-Asp-Phe-Ser-Lys-Leu-Ala-Leu-Arg-NH2
1 Ptl-84+S224M 95,64%
2 Ptl-84+S224Q 89,20%
3 Ptl-84+S224E 76,13%
4 Ptl-84+S224H 72,10%
5 Ptl-84+S224L 70,16%
6 Ptl-84+S224V 68,41%
7 Ptl-84+S224I 66,90%
8 Ptl-84 61,08%
显然,S224位置对反应速率和偶联效率具有显著影响。7种变体(Ptl-84+S224I/V/L/H/E/Q/M)评分明显好于野生型酶。相对于野生型酶,这些变体可用于以更高的得率生产肽,同时相同的转化率所需的酶更少。
实施例5:通过向几种不同酶变体添加L96突变从两个片段合成利拉鲁肽(SEQ IDNO:6)
为了确定L96突变对利拉鲁肽的影响,按照方案5进行筛选。对于代表性酶变体来说,反应60min后偶联产物利拉鲁肽(H-Lira(1-31)-OH)的量列于下表中。将9种参比酶与在L96位置处带有突变的相应突变体进行比较。对于每个系列来说,在L96位置处不含突变的参比酶用粗体表示。每种参比酶(编号为1、4、7、10、13、16、18、21、23)具有Ptl-84突变加上在156、166、33、62、217、222位置处额外指示的突变。
显然,L96突变对反应速率和偶联效率具有正面影响。当与以前描述的突变位置(WO 2018/212658)例如S33、N62、E156、G166、Y217和/或M222处的其他突变组合时,这个突变仍然有益。
实施例6:使用D99突变的变体从两个片段合成利拉鲁肽(SEQ ID NO:6)
为了确定D99突变对利拉鲁肽合成的影响,按照方案5进行了筛选,但仅仅使用15μL酶变体溶液(代替25μL)。对于每种代表性酶变体来说,在反应60min后偶联产物利拉鲁肽(H-Lira(1-31)-OH)的量列于下表中。将两种参比酶与在D99位置处带有突变的相应突变体进行比较。对于每个系列来说,在D99位置处不含突变的参比酶用粗体表示。参比酶(3)具有Ptl-84突变加上额外指示的突变。
编号 酶变体 H-Lira(1-31)-OH的面积%
1 Ptl-84 30,96
2 Ptl-84+D99R 39,46
3 Ptl-84+N156K 41,20
4 Ptl-84+N156K+D99R 46,04
5 Ptl-84+N156K+D99K 45,68
6 Ptl-84+N156K+D99G 48,69
显然,D99突变对反应速率和偶联效率具有正面影响。
实施例7:使用组合变体合成8-mer模型肽(SEQ ID NO:14)
为了确定本发明的突变组合对8-mer模型肽合成的影响,按照方案6进行筛选。由于所述酶是改进的变体,因此为了更好地区分突变的影响,使用了较少的酶(5μL酶变体溶液,合计1μg酶)。此外,在15min后对靶肽Ac-Asp-Phe-Ser-Lys-Leu-Ala-Leu-Arg-NH2(SEQID NO:14)和水解的肽酯Ac-Asp-Phe-Ser-Lys-Leu-OH(SEQ ID NO:41)两者的HPLC峰进行积分,并通过用靶肽的面积%除以水解的肽酯的面积%来计算S/H比(最后一列)。参比酶用粗体表示。
显然,每种单突变均对反应速率具有正面影响,并且也导致S/H比的提高。具体来说,相对于单一L96V(条目2)和D99R(条目3)变体,L96V+D99R的组合(条目4)在反应速率和S/H比两方面均显示出协同效应。
实施例8:使用组合突变的变体从两个片段合成利拉鲁肽(SEQ ID NO:6)
为了确定突变组合对利拉鲁肽合成的影响,按照方案5进行筛选,但仅仅使用15μL酶变体溶液(代替25μL)。对于每种代表性变体来说,在反应60min后偶联产物利拉鲁肽(H-Lira(1-31)-OH)的量列于下表中。参比酶Ptl-84用粗体表示。
编号 酶变体 H-Lira(1-31)-OH的面积%
1 Ptl-84 28,48
2 Ptl-84+D99R 39,46
3 Ptl-84+L96V 51,48
4 Ptl-84+L96V+D99R 59,38
显然,L96和D99位置处的突变在作为单突变和组合时,均对反应速率和偶联效率具有正面影响。
实施例9:从两个片段合成利拉鲁肽(SEQ ID NO:6)以确定对组合变体的选择性的影响
为了确定突变组合对偶联效率和选择性的影响,按照方案7进行筛选。为了评估向连接产物的转化率,在酰基供体酯片段(SEQ ID NO:39)完全转化后(30~360min内)测量偶联产物利拉鲁肽(H-Lira(1-31)-OH,SEQ ID NO:6)、未反应的肽胺(H-Lira(12-31)-OH,SEQID NO:40)和副产物H-Lira(1-11-1-31)-OH(SEQ ID NO:42,其由酰基供体H-Lira(1-11)-OCam-FK-NH2(SEQ ID NO:39)与H-Lira(1-31)-OH(SEQ ID NO:6)的反应形成)的量。对于每种测试的酶变体来说,利拉鲁肽的量与相应的选择性值一起列于下表中。
/>
显然,本发明的突变提高了所述酶与参比Ptl-84相比的反应速率和偶联效率以及选择性两者。99、96和224位置处的单突变(条目2、3和5)提高了Ptl-84酶的选择性。96和99位置处的突变可以与223和224位置处的突变组合,显示出反应速率和偶联效率的提高,同时保持非常高的选择性。
实施例10:使用不同酶变体从两个片段合成特立帕肽(SEQ ID NO:11)
制备1.3mg/ml PhAc-Teri(1-11)-OCam-L-OH(按照方案1和4制备的PhAc-1Ser-2Val-3Ser-4Glu-5Ile-6Gln-7Leu-8Met-9His-10Asn-11Leu-OCam-Leu-OH·1TFA(SEQ ID NO:43))和4.98mg/ml H-Teri(12-34)-OH(按照方案3b制备的H-12Gly-13Lys-14His-15Leu-16Asn-17Ser-18Met-19Glu-20Arg-21Val-22Glu-23Trp-24Leu-25Arg-26Lys-27Lys-28Leu-29Gln-30Asp-31Val-32His-33Asn-34Phe-OH·6TFA(SEQ ID NO:30))的储用溶液,溶解在含有200mMTricine、2mg/mL TCEP的缓冲液中,并使用3N KOH水溶液将pH设定到7.9。该储用溶液可以被分成等分试样,并储存在-20℃,以备进一步使用。向玻璃小瓶添加80μL上述肽储用溶液,并通过与20μL酶变体溶液(0,1mg/mL,在含有25mM Tricine、125mM NaCl的pH 7.5的缓冲液中)混合开始反应。在不同时间点(通常为0、15、30、60和120min),将10μL反应混合物在250μL甲磺酸的脱矿物质水溶液(5mL/L)中猝灭,以终止任何酶活性。使用HPLC/MS分析所述猝灭的样品。将指示偶联产物特立帕肽(PhAc-Teri(1-34)-OH)(SEQ ID NO:11)的HPLC峰积分,并在下表中表示为HPLC面积%(60min样品)。
编号 酶变体 PhAc-特立帕肽(1-34)-OH的面积%
1 Ptl-79 30,99
2 Ptl-79+L96V 31,00
3 Ptl-79+D99R 29,67
4 Ptl-79+L96V+D99R 34,81
5 Ptl-79+G100D 35,18
尽管与Ptl-79参比酶相比L96和D99位置处的单突变单独地未显示出对反应速率和偶联效率有影响,但它们的组合导致协同效应。
实施例11:使用几种不同酶变体从两个片段合成索马鲁肽(SEQ ID NO:7)
制备6.06mM H-Sema(1-11)-OCam-FK-NH2(按照方案2制备的H-1His-2Aib-3Glu-4Gly-5Thr-6Phe-7Thr-8Ser-9Asp-10Val-11Ser-OCam-Phe-Lys-NH2(SEQ ID NO:44))和4.04mMH-Sema(12-31)-OH(按照方案3b制备的H-12Ser-13Tyr-14Leu-15Glu-16Gly-17Gln-18Ala-19Ala-20Lys(AEEA-AEEA-γ-Glu-17-羧基十七烷酰基)-21Glu-22Phe-23Ile-24Ala-25Trp-26Leu-27Val-28Arg-29Gly-30Arg-31Gly-OH(SEQ ID NO:45))的储用溶液,溶解在含有50mMTricine、220mM三氟乙酸钾和0.25mg/mL TCEP的缓冲液中,并使用3N KOH水溶液将pH设定到7.9。该储用溶液可以被分成等分试样,并储存在-20℃,以备进一步使用。向玻璃小瓶添加83.5μL上述肽储用溶液,并通过与16.7μL酶变体溶液(0,15mg/mL,在含有25mM Tricine、125mM NaCl的pH 7.5的缓冲液中)混合开始反应。在不同时间点(通常为0、15、30、60和120min),将5μL反应混合物在250μL甲磺酸的脱矿物质水溶液(5mL/L)中猝灭,以终止任何酶活性。使用HPLC/MS分析所述猝灭的样品。将指示索马鲁肽(H-Sema(1-31)-OH)的HPLC峰积分,并在下表中表示为HPLC面积%(60min样品)。
编号 酶变体 H-Sema(1-31)-OH的面积%
1 Ptl-84 61,84
2 Ptl-84+D99R 76,92
3 Ptl-84+L96V 91,33
4 Ptl-84+L96V+D99R 87,73
显然,与Ptl-84参比酶相比,L96和D99位置处的突变对反应速率和偶联效率具有正面影响。
实施例12:使用酶变体从两个片段合成鲑鱼降钙素(SEQ ID NO:12)
制备1.7mg/ml H-Calci(1-12)-OCam-L-OH(按照方案1制备的H-1Cys-2Ser-3Asn-4Leu-5Ser-6Thr-7Cys-8Val-9Leu-10Gly-11Lys-12Leu-OCam-Leu-OH·1TFA(SEQ ID NO:31))和1.7mg/ml H-Calci(13-32)-NH2(按照方案3a制备的H-13Ser-14Gln-15Glu-16Leu-17His-18Lys-19Leu-20Gln-21Thr-22Tyr-23Pro-24Arg-25Thr-26Asn-27Thr-28Gly-29Ser-30Gly-31Thr-32Pro-NH2·3TFA(SEQ ID NO:32))的储用溶液,溶解在含有2M盐酸胍和50mM Tricine、2mg/mL TCEP的缓冲液中,并使用3N KOH水溶液将pH设定到7.9。该储用溶液可以被分成等分试样,并储存在-20℃,以备进一步使用。向玻璃小瓶添加70μL上述肽储用溶液,并通过与30μL酶变体溶液(0,1mg/mL,在含有25mM Tricine、125mM NaCl的pH 7.5的缓冲液中)混合开始反应。在不同时间点(通常为0、15、30、60和120min),将10μL反应混合物在250μL甲磺酸的脱矿物质水溶液(5mL/L)中猝灭,以终止任何酶活性。使用HPLC/MS分析所述猝灭的样品。将指示偶联产物鲑鱼降钙素(H-Cal(1-32)-NH2)的HPLC峰积分,并在下表中表示为HPLC面积%(60min样品)。
酶变体 H-Cal(1-32)-NH2的面积%
Ptl-79+D99R 60,25
本实施例显示,根据本发明的含有变体的酶变体可以有效地用于合成鲑鱼降钙素。
实施例13:使用酶变体从两个片段合成dasiglucagon(SEQ ID NO:8)
制备3.7mg/ml H-Dasi(1-8)-OCam-L-OH(按照方案1制备的H-1His-2Ser-3Gln-4Gly-5Thr-6Phe-7Thr-8Ser-OCam-Leu-OH·2TFA(SEQ ID NO:15))和5.9mg/ml H-Dasi(9-29)-OH(按照方案3b制备的H-9Asp-10Tyr-11Ser-12Lys-13Tyr-14Leu-15Asp-16Aib-17Ala-18Arg-19Ala-20Glu-21Glu-22Phe-23Va l-24Lys-25Trp-26Leu-27Glu-28Ser-29Thr-OH·4TFA(SEQID NO:16))的储用溶液,溶解在含有50mM Tricine、220mM三氟乙酸钾、1mg/mL TCEP的缓冲液中,并使用3N KOH水溶液将pH设定到7.9。该储用溶液可以被分成等分试样,并储存在-20℃,以备进一步使用。向玻璃小瓶添加100μL上述肽储用溶液,并通过与2.5μL酶变体溶液(2mg/mL,在含有25mM Tricine、125mM NaCl的pH 7.5的缓冲液中)混合开始反应。在不同时间点(通常为0、15、30、60和120min),将10μL反应混合物在250μL甲磺酸的脱矿物质水溶液(5mL/L)中猝灭,以终止任何酶活性。使用HPLC/MS分析所述猝灭的样品。将指示偶联产物dasiglucagon(H-Dasi(1-29)-OH)的HPLC峰积分,并在下表中表示为HPLC面积%(60min样品)。
酶变体 H-Dasi(1-29)-OH的面积%
Ptl-84+N156K+E166E+L96I 80,59
本实施例显示,根据本发明的含有变体的酶变体可以有效地用于合成dasiglucagon。
序列
SEQ ID NO:1:编码枯草杆菌蛋白酶BPN’的第-107至275位氨基酸的野生型基因
ENA|K02496|K02496.1 B.枯草杆菌蛋白酶BPN'解淀粉芽孢杆菌
GTGAGAGGCAAAAAAGTATGGATCAGTTTGCTGTTTGCTTTAGCGTTAATCTTTACGATGGCGTTCGGCAGCACATCCTCTGCCCAGGCGGCAGGGAAATCAAACGGGGAAAAGAAATATATTGTCGGGTTTAAACAGACAATGAGCACGATGAGCGCCGCTAAGAAGAAAGATGTCATTTCTGAAAAAGGCGGGAAAGTGCAAAAGCAATTCAAATATGTAGACGCAGCTTCAGCTACATTAAACGAAAAAGCTGTAAAAGAATTGAAAAAAGACCCGAGCGTCGCTTACGTTGAAGAAGATCACGTAGCACATGCGTACGCGCAGTCCGTGCCTTACGGCGTATCACAAATTAAAGCCCCTGCTCTGCACTCTCAAGGCTACACTGGATCAAATGTTAAAGTAGCGGTTATCGACAGCGGTATCGATTCTTCTCATCCTGATTTAAAGGTAGCAGGCGGAGCCAGCATGGTTCCTTCTGAAACAAATCCTTTCCAAGACAACAACTCTCACGGAACTCACGTTGCCGGCACAGTTGCGGCTCTTAATAACTCAATCGGTGTATTAGGCGTTGCGCCAAGCGCATCACTTTACGCTGTAAAAGTTCTCGGTGCTGACGGTTCCGGCCAATACAGCTGGATCATTAACGGAATCGAGTGGGCGATCGCAAACAATATGGACGTTATTAACATGAGCCTCGGCGGACCTTCTGGTTCTGCTGCTTTAAAAGCGGCAGTTGATAAAGCCGTTGCATCCGGCGTCGTAGTCGTTGCGGCAGCCGGTAACGAAGGCACTTCCGGCAGCTCAAGCACAGTGGGCTACCCTGGTAAATACCCTTCTGTCATTGCAGTAGGCGCTGTTGACAGCAGCAACCAAAGAGCATCTTTCTCAAGCGTAGGACCTGAGCTTGATGTCATGGCACCTGGCGTATCTATCCAAAGCACGCTTCCTGGAAACAAATACGGGGCGTACAACGGTACGTCAATGGCATCTCCGCACGTTGCCGGAGCGGCTGCTTTGATTCTTTCTAAGCACCCGAACTGGACAAACACTCAAGTCCGCAGCAGTTTAGAAAACACCACTACAAAACTTGGTGATTCTTTCTACTATGGAAAAGGGCTGATCAACGTACAGGCGGCAGCTCAGTAA
SEQ ID NO:2:野生型枯草杆菌蛋白酶BPN’(成熟体)
>SUBT_BACAM枯草杆菌蛋白酶BPN'解淀粉芽孢杆菌成熟体1至275
75-83、96、99、223和224位置处的氨基酸用粗体表示。
AQSVPYGVSQIKAPALHSQGYTGSNVKVAVIDSGIDSSHPDLKVAGGASMVPSETNPFQD 60
NNSHGTHVAGTVAALNNSIGVLGVAPSASLYAVKVLGADGSGQYSWIINGIEWAIANNMDVINMSLGGPS130
GSAALKAAVDKAVASGVVVVAAAGNEGTSGSSSTVGYPGKYPSVIAVGAVDSSNQRASFS 190
SVGPELDVMAPGVSIQSTLPGNKYGAYNGTSMASPHVAGAAALILSKHPNWTNTQVRSSL 250
ENTTTKLGDSFYYGKGLINVQAAAQ
SEQ ID NO:3:根据本发明的枯草杆菌蛋白酶BPN’变体,具有对应于第75-83位的氨基酸(Ca2+结合环)的缺失、S221突变(S221C)和可能的L96、D99、A223和S224突变(所有四者均用粗体X标出)加上6-His标签。
AQSVPYGVSQIKAPALHSQGYTGSNVKVAVIDSGIDSSHPDLKVAGGASMVPSETNPFQD 60
NNSHGTHVAGTVAA-VAPSASLYAVKVXGAXGSGQYSWIINGIEWAIANNMDVINMSLGGPS 130(-9)
GSAALKAAVDKAVASGVVVVAAAGNEGTSGSSSTVGYPGKYPSVIAVGAVDSSNQRASFS 190(-9)
SVGPELDVMAPGVSIQSTLPGNKYGAYNGTCMXXPHVAGAAALILSKHPNWTNTQVRSSL 250(-9)
ENTTTKLGDSFYYGKGLINVQAAAQHHHHHH
SEQ ID NO:4-参比酶Ptl-84
枯草杆菌蛋白酶BPN’变体,其具有突变Q2K、S3C、P5S、S9A、I31L、K43N、M50F、N62A、A73L、Δ75-83、E156N、G166E、G169A、S188P、F189W、Q206C、N212G、Y217H、N218D、S221C、M222P、P225N、T254A和Q271E,加上6-His标签。
AKCVSYGVAQIKAPALHSQGYTGSNVKVAVLDSGIDSSHPDLNVAGGASFVPSETNPFQD 60
NASHGTHVAGTVLA-VAPSASLYAVKVLGADGSGQYSWIINGIEWAIANNMDVINMSLGGPS 130(-9)
GSAALKAAVDKAVASGVVVVAAAGNNGTSGSSSTVEYPAKYPSVIAVGAVDSSNQRAPWS190(-9)
SVGPELDVMAPGVSICSTLPGGKYGAHDGTCPASNHVAGAAALILSKHPNWTNTQVRSSL 250(-9)
ENTATKLGDSFYYGKGLINVEAAAQHHHHHH
SEQ ID NO:5-参比酶Ptl-79
枯草杆菌蛋白酶BPN’变体,其具有突变Q2K、S3C、P5S、S9A、I31L、K43N、M50F、A73L、Δ75-83、I107V、E156S、G166S、G169A、S188P、F189W、Q206C、N212G、Y217H、N218S、S221C、M222P、P225N、T254A和Q271E,加上6-His标签。
AKCVSYGVAQIKAPALHSQGYTGSNVKVAVLDSGIDSSHPDLNVAGGASFVPSETNPFQD 60
NNSHGTHVAGTVLAVAPSASLYAVKVLGADGSGQYSWVINGIEWAIANNMDVINMSLGGPS130(-9)
GSAALKAAVDKAVASGVVVVAAAGNSGTSGSSSTVSYPAKYPSVIAVGAVDSSNQRAPWS190(-9)
SVGPELDVMAPGVSICSTLPGGKYGAHSGTCPASNHVAGAAALILSKHPNWTNTQVRSSL 250(-9)
ENTATKLGDSFYYGKGLINVEAAAQHHHHHH
SEQ ID NO:6-利拉鲁肽
HAEGTFTSDV SSYLEGQAAK EFIAWLVRGR G
其中K是Lys(Pal-γ-Glu)
SEQ ID NO:7-索马鲁肽
HXEGTFTSDV SSYLEGQAAK EFIAWLVRGR G
其中X是Aib,并且K是Lys(AEEA-AEEA-γ-Glu-17-羧基十七烷酰基)
SEQ ID NO:8–dasiglucagon
HSQGTFTSDY SKYLDXARAE EFVKWLEST
其中X是Aib
SEQ ID NO:9–glepaglutide
HGEGTFSSEL ATILDALAAR DFIAWLIATK ITDKKKKKK
其中C-端是酰胺
SEQ ID NO:10–elsiglutide
HGEGSFSSEL STILDALAAR DFIAWLIATK ITDKKKKKK
其中C-端是酰胺
SEQ ID NO:11–特立帕肽
SVSEIQLMHN LGKHLNSMER VEWLRKKLQD VHNF
其中在特立帕肽前体中N-端可以被苯乙酰化
SEQ ID NO:12-鲑鱼降钙素
CSNLSTCVLG KLSQELHKLQ TYPRTNTGSG TP
其中Cys1和Cys7通过二硫键相连,并且它具有C-端酰胺
SEQ ID NO:13-比伐卢定
XPRPGGGGNG DFEEIPEEYL
其中X是D-Phe
SEQ ID NO:14-8-mer模型肽
DFSKLALR
其中所述肽在N-端氨基酸处被乙酰化并具有C-端酰胺
SEQ ID NO:15–Dasi 1-8
HSQGTFTS
其中C-端是(硫)酯
SEQ ID NO:16–Dasi 9-29
DYSKYLDXAR AEEFVKWLES T
其中X是Aib
SEQ ID NO:17–Dasi 1-9
HSQGTFTSD
其中C-端是(硫)酯
SEQ ID NO:18–Dasi 10-29
YSKYLDXARA EEFVKWLEST
其中X是Aib
SEQ ID NO:19–Dasi 1-10
HSQGTFTSDY
其中C-端是(硫)酯
SEQ ID NO:20–Dasi 11-29
SKYLDXARA EEFVKWLEST
其中X是Aib
SEQ ID NO:21–Glepa 1-11
HGEGTFSSEL A
其中C-端是(硫)酯
SEQ ID NO:22–Glepa 12-39
TILDALAARD FIAWLIATKI TDKKKKKK
SEQ ID NO:23–Glepa 1-16
HGEGTFSSEL ATILDA
其中C-端是(硫)酯
SEQ ID NO:24–Glepa 17-39
LAARD FIAWLIATKI TDKKKKKK
SEQ ID NO:25–Elsi 1-11
HGEGSFSSEL S
其中C-端是(硫)酯
SEQ ID NO:26–Elsi 12-39
TILDALAARD FIAWLIATKI TDKKKKKK
SEQ ID NO:27–Elsi 1-16
HGEGSFSSEL STILDA
其中C-端是(硫)酯
SEQ ID NO:28–Elsi 17-39
LAARDFIAWL IATKITDKKK KKK
SEQ ID NO:29–Teri 1-11
SVSEIQLMHN L
其中C-端是(硫)酯
SEQ ID NO:30–Teri 12-34
GKHLNSMERV EWLRKKLQDV HNF
SEQ ID NO:31–Calci 1-12
CSNLSTCVLG KL
其中C-端是(硫)酯
SEQ ID NO:32–Calci 13-32
SQELHKLQTY PRTNTGSGTP
其中C-端可能是酰胺
SEQ ID NO:33–Calci 1-20
CSNLSTCVLG KLSQELHKLQ
其中C-端是(硫)酯
SEQ ID NO:34–Calci 21-32
TYPRTNTGSG TP
其中C-端可能是酰胺
SEQ ID NO:35–Biva 1-10
XPRPGGGGNG
其中X是D-Phe
SEQ ID NO:36–Biva 11-20
DFEEIPEEYL
SEQ ID NO:37–Lira-Sema 1-11
HXEGTFTSDV S
其中X是Ala或Aib,并且C-端是(硫)酯
SEQ ID NO:38-Lira-Sema 12-31
SYLEGQAAKE FIAWLVRGRG
其中Lys选自Lys、Lys(PG)、Lys(γ-Glu)、Lys(Pal-γ-Glu)和Lys(AEEA-AEEA-γ-Glu-17-羧基十七烷酰基)
SEQ ID NO:39–Lira 1-11
HAEGTFTSDV S
其中C-端是-OCam-Phe-Lys-NH2
SEQ ID NO:40-Lira 12-31
SYLEGQAAKE FIAWLVRGRG
其中Lys是Lys(Pal-γ-Glu)
SEQ ID NO:41–模型肽片段
DFSKL
其中N-端被乙酰化,并且C-端是-OCam-Leu-OH酯或OH
SEQ ID NO:42–lira 1-11-1-31
HAEGTFTSDV SHAEGTFTSD VSSYLEGQAA KEFIAWLVRG RG
其中Lys是Lys(Pal-γ-Glu)
SEQ ID NO:43–Teri 1-11酯
SVSEIQLMHN L
其中N-端被苯乙酰化,并且C-端是-OCam-Leu-OH酯
SEQ ID NO:44–Sema 1-11
HXEGTFTSDV S
其中X是Aib,并且C-端是-OCam-Phe-Lys-NH2
SEQ ID NO:45-Sema 12-31
SYLEGQAAKE FIAWLVRGRG
其中Lys是Lys(AEEA-AEEA-γ-Glu-17-羧基十七烷酰基)。
SEQUENCE LISTING
<110> 费森尤斯卡比有限公司
<120> 枯草杆菌蛋白酶变体及其用途
<130> FK20233
<160> 45
<170> PatentIn version 3.5
<210> 1
<211> 1149
<212> DNA
<213> 淀粉芽孢杆菌
<400> 1
gtgagaggca aaaaagtatg gatcagtttg ctgtttgctt tagcgttaat ctttacgatg 60
gcgttcggca gcacatcctc tgcccaggcg gcagggaaat caaacgggga aaagaaatat 120
attgtcgggt ttaaacagac aatgagcacg atgagcgccg ctaagaagaa agatgtcatt 180
tctgaaaaag gcgggaaagt gcaaaagcaa ttcaaatatg tagacgcagc ttcagctaca 240
ttaaacgaaa aagctgtaaa agaattgaaa aaagacccga gcgtcgctta cgttgaagaa 300
gatcacgtag cacatgcgta cgcgcagtcc gtgccttacg gcgtatcaca aattaaagcc 360
cctgctctgc actctcaagg ctacactgga tcaaatgtta aagtagcggt tatcgacagc 420
ggtatcgatt cttctcatcc tgatttaaag gtagcaggcg gagccagcat ggttccttct 480
gaaacaaatc ctttccaaga caacaactct cacggaactc acgttgccgg cacagttgcg 540
gctcttaata actcaatcgg tgtattaggc gttgcgccaa gcgcatcact ttacgctgta 600
aaagttctcg gtgctgacgg ttccggccaa tacagctgga tcattaacgg aatcgagtgg 660
gcgatcgcaa acaatatgga cgttattaac atgagcctcg gcggaccttc tggttctgct 720
gctttaaaag cggcagttga taaagccgtt gcatccggcg tcgtagtcgt tgcggcagcc 780
ggtaacgaag gcacttccgg cagctcaagc acagtgggct accctggtaa atacccttct 840
gtcattgcag taggcgctgt tgacagcagc aaccaaagag catctttctc aagcgtagga 900
cctgagcttg atgtcatggc acctggcgta tctatccaaa gcacgcttcc tggaaacaaa 960
tacggggcgt acaacggtac gtcaatggca tctccgcacg ttgccggagc ggctgctttg 1020
attctttcta agcacccgaa ctggacaaac actcaagtcc gcagcagttt agaaaacacc 1080
actacaaaac ttggtgattc tttctactat ggaaaagggc tgatcaacgt acaggcggca 1140
gctcagtaa 1149
<210> 2
<211> 275
<212> PRT
<213> 淀粉芽孢杆菌
<400> 2
Ala Gln Ser Val Pro Tyr Gly Val Ser Gln Ile Lys Ala Pro Ala Leu
1 5 10 15
His Ser Gln Gly Tyr Thr Gly Ser Asn Val Lys Val Ala Val Ile Asp
20 25 30
Ser Gly Ile Asp Ser Ser His Pro Asp Leu Lys Val Ala Gly Gly Ala
35 40 45
Ser Met Val Pro Ser Glu Thr Asn Pro Phe Gln Asp Asn Asn Ser His
50 55 60
Gly Thr His Val Ala Gly Thr Val Ala Ala Leu Asn Asn Ser Ile Gly
65 70 75 80
Val Leu Gly Val Ala Pro Ser Ala Ser Leu Tyr Ala Val Lys Val Leu
85 90 95
Gly Ala Asp Gly Ser Gly Gln Tyr Ser Trp Ile Ile Asn Gly Ile Glu
100 105 110
Trp Ala Ile Ala Asn Asn Met Asp Val Ile Asn Met Ser Leu Gly Gly
115 120 125
Pro Ser Gly Ser Ala Ala Leu Lys Ala Ala Val Asp Lys Ala Val Ala
130 135 140
Ser Gly Val Val Val Val Ala Ala Ala Gly Asn Glu Gly Thr Ser Gly
145 150 155 160
Ser Ser Ser Thr Val Gly Tyr Pro Gly Lys Tyr Pro Ser Val Ile Ala
165 170 175
Val Gly Ala Val Asp Ser Ser Asn Gln Arg Ala Ser Phe Ser Ser Val
180 185 190
Gly Pro Glu Leu Asp Val Met Ala Pro Gly Val Ser Ile Gln Ser Thr
195 200 205
Leu Pro Gly Asn Lys Tyr Gly Ala Tyr Asn Gly Thr Ser Met Ala Ser
210 215 220
Pro His Val Ala Gly Ala Ala Ala Leu Ile Leu Ser Lys His Pro Asn
225 230 235 240
Trp Thr Asn Thr Gln Val Arg Ser Ser Leu Glu Asn Thr Thr Thr Lys
245 250 255
Leu Gly Asp Ser Phe Tyr Tyr Gly Lys Gly Leu Ile Asn Val Gln Ala
260 265 270
Ala Ala Gln
275
<210> 3
<211> 272
<212> PRT
<213> 人工序列
<220>
<223> 本发明的枯草杆菌蛋白酶BPN’变体
<220>
<221> 变体
<222> (87)..(87)
<223> L96位
<220>
<221> 变体
<222> (90)..(90)
<223> D99位
<220>
<221> 变体
<222> (214)..(214)
<223> A223位
<220>
<221> 变体
<222> (215)..(215)
<223> S224位
<400> 3
Ala Gln Ser Val Pro Tyr Gly Val Ser Gln Ile Lys Ala Pro Ala Leu
1 5 10 15
His Ser Gln Gly Tyr Thr Gly Ser Asn Val Lys Val Ala Val Ile Asp
20 25 30
Ser Gly Ile Asp Ser Ser His Pro Asp Leu Lys Val Ala Gly Gly Ala
35 40 45
Ser Met Val Pro Ser Glu Thr Asn Pro Phe Gln Asp Asn Asn Ser His
50 55 60
Gly Thr His Val Ala Gly Thr Val Ala Ala Val Ala Pro Ser Ala Ser
65 70 75 80
Leu Tyr Ala Val Lys Val Xaa Gly Ala Xaa Gly Ser Gly Gln Tyr Ser
85 90 95
Trp Ile Ile Asn Gly Ile Glu Trp Ala Ile Ala Asn Asn Met Asp Val
100 105 110
Ile Asn Met Ser Leu Gly Gly Pro Ser Gly Ser Ala Ala Leu Lys Ala
115 120 125
Ala Val Asp Lys Ala Val Ala Ser Gly Val Val Val Val Ala Ala Ala
130 135 140
Gly Asn Glu Gly Thr Ser Gly Ser Ser Ser Thr Val Gly Tyr Pro Gly
145 150 155 160
Lys Tyr Pro Ser Val Ile Ala Val Gly Ala Val Asp Ser Ser Asn Gln
165 170 175
Arg Ala Ser Phe Ser Ser Val Gly Pro Glu Leu Asp Val Met Ala Pro
180 185 190
Gly Val Ser Ile Gln Ser Thr Leu Pro Gly Asn Lys Tyr Gly Ala Tyr
195 200 205
Asn Gly Thr Cys Met Xaa Xaa Pro His Val Ala Gly Ala Ala Ala Leu
210 215 220
Ile Leu Ser Lys His Pro Asn Trp Thr Asn Thr Gln Val Arg Ser Ser
225 230 235 240
Leu Glu Asn Thr Thr Thr Lys Leu Gly Asp Ser Phe Tyr Tyr Gly Lys
245 250 255
Gly Leu Ile Asn Val Gln Ala Ala Ala Gln His His His His His His
260 265 270
<210> 4
<211> 272
<212> PRT
<213> 人工序列
<220>
<223> 参照酶Ptl-84
<400> 4
Ala Lys Cys Val Ser Tyr Gly Val Ala Gln Ile Lys Ala Pro Ala Leu
1 5 10 15
His Ser Gln Gly Tyr Thr Gly Ser Asn Val Lys Val Ala Val Leu Asp
20 25 30
Ser Gly Ile Asp Ser Ser His Pro Asp Leu Asn Val Ala Gly Gly Ala
35 40 45
Ser Phe Val Pro Ser Glu Thr Asn Pro Phe Gln Asp Asn Ala Ser His
50 55 60
Gly Thr His Val Ala Gly Thr Val Leu Ala Val Ala Pro Ser Ala Ser
65 70 75 80
Leu Tyr Ala Val Lys Val Leu Gly Ala Asp Gly Ser Gly Gln Tyr Ser
85 90 95
Trp Ile Ile Asn Gly Ile Glu Trp Ala Ile Ala Asn Asn Met Asp Val
100 105 110
Ile Asn Met Ser Leu Gly Gly Pro Ser Gly Ser Ala Ala Leu Lys Ala
115 120 125
Ala Val Asp Lys Ala Val Ala Ser Gly Val Val Val Val Ala Ala Ala
130 135 140
Gly Asn Asn Gly Thr Ser Gly Ser Ser Ser Thr Val Glu Tyr Pro Ala
145 150 155 160
Lys Tyr Pro Ser Val Ile Ala Val Gly Ala Val Asp Ser Ser Asn Gln
165 170 175
Arg Ala Pro Trp Ser Ser Val Gly Pro Glu Leu Asp Val Met Ala Pro
180 185 190
Gly Val Ser Ile Cys Ser Thr Leu Pro Gly Gly Lys Tyr Gly Ala His
195 200 205
Asp Gly Thr Cys Pro Ala Ser Asn His Val Ala Gly Ala Ala Ala Leu
210 215 220
Ile Leu Ser Lys His Pro Asn Trp Thr Asn Thr Gln Val Arg Ser Ser
225 230 235 240
Leu Glu Asn Thr Ala Thr Lys Leu Gly Asp Ser Phe Tyr Tyr Gly Lys
245 250 255
Gly Leu Ile Asn Val Glu Ala Ala Ala Gln His His His His His His
260 265 270
<210> 5
<211> 272
<212> PRT
<213> 人工序列
<220>
<223> 参照酶Ptl-79
<400> 5
Ala Lys Cys Val Ser Tyr Gly Val Ala Gln Ile Lys Ala Pro Ala Leu
1 5 10 15
His Ser Gln Gly Tyr Thr Gly Ser Asn Val Lys Val Ala Val Leu Asp
20 25 30
Ser Gly Ile Asp Ser Ser His Pro Asp Leu Asn Val Ala Gly Gly Ala
35 40 45
Ser Phe Val Pro Ser Glu Thr Asn Pro Phe Gln Asp Asn Asn Ser His
50 55 60
Gly Thr His Val Ala Gly Thr Val Leu Ala Val Ala Pro Ser Ala Ser
65 70 75 80
Leu Tyr Ala Val Lys Val Leu Gly Ala Asp Gly Ser Gly Gln Tyr Ser
85 90 95
Trp Val Ile Asn Gly Ile Glu Trp Ala Ile Ala Asn Asn Met Asp Val
100 105 110
Ile Asn Met Ser Leu Gly Gly Pro Ser Gly Ser Ala Ala Leu Lys Ala
115 120 125
Ala Val Asp Lys Ala Val Ala Ser Gly Val Val Val Val Ala Ala Ala
130 135 140
Gly Asn Ser Gly Thr Ser Gly Ser Ser Ser Thr Val Ser Tyr Pro Ala
145 150 155 160
Lys Tyr Pro Ser Val Ile Ala Val Gly Ala Val Asp Ser Ser Asn Gln
165 170 175
Arg Ala Pro Trp Ser Ser Val Gly Pro Glu Leu Asp Val Met Ala Pro
180 185 190
Gly Val Ser Ile Cys Ser Thr Leu Pro Gly Gly Lys Tyr Gly Ala His
195 200 205
Ser Gly Thr Cys Pro Ala Ser Asn His Val Ala Gly Ala Ala Ala Leu
210 215 220
Ile Leu Ser Lys His Pro Asn Trp Thr Asn Thr Gln Val Arg Ser Ser
225 230 235 240
Leu Glu Asn Thr Ala Thr Lys Leu Gly Asp Ser Phe Tyr Tyr Gly Lys
245 250 255
Gly Leu Ile Asn Val Glu Ala Ala Ala Gln His His His His His His
260 265 270
<210> 6
<211> 31
<212> PRT
<213> 人工序列
<220>
<223> 利拉鲁肽
<220>
<221> MOD_RES
<222> (20)..(20)
<223> Lys 是 Lys(Pal-γ-Glu)
<400> 6
His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly
1 5 10 15
Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Arg Gly Arg Gly
20 25 30
<210> 7
<211> 31
<212> PRT
<213> 人工序列
<220>
<223> 索马鲁肽
<220>
<221> MOD_RES
<222> (2)..(2)
<223> Aib
<220>
<221> MOD_RES
<222> (20)..(20)
<223> Lys 是 Lys(AEEA-AEEA-γ-Glu-17-羧基十七烷酰)
<400> 7
His Xaa Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly
1 5 10 15
Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Arg Gly Arg Gly
20 25 30
<210> 8
<211> 29
<212> PRT
<213> 人工序列
<220>
<223> 达西格列酮
<220>
<221> MOD_RES
<222> (16)..(16)
<223> Aib
<400> 8
His Ser Gln Gly Thr Phe Thr Ser Asp Tyr Ser Lys Tyr Leu Asp Xaa
1 5 10 15
Ala Arg Ala Glu Glu Phe Val Lys Trp Leu Glu Ser Thr
20 25
<210> 9
<211> 39
<212> PRT
<213> 人工序列
<220>
<223> 格列帕格鲁肽
<220>
<221> MOD_RES
<222> (39)..(39)
<223> 消融C-末端
<400> 9
His Gly Glu Gly Thr Phe Ser Ser Glu Leu Ala Thr Ile Leu Asp Ala
1 5 10 15
Leu Ala Ala Arg Asp Phe Ile Ala Trp Leu Ile Ala Thr Lys Ile Thr
20 25 30
Asp Lys Lys Lys Lys Lys Lys
35
<210> 10
<211> 39
<212> PRT
<213> 人工序列
<220>
<223> 艾司格鲁肽
<220>
<221> MOD_RES
<222> (39)..(39)
<223> 消融C-末端
<400> 10
His Gly Glu Gly Ser Phe Ser Ser Glu Leu Ser Thr Ile Leu Asp Ala
1 5 10 15
Leu Ala Ala Arg Asp Phe Ile Ala Trp Leu Ile Ala Thr Lys Ile Thr
20 25 30
Asp Lys Lys Lys Lys Lys Lys
35
<210> 11
<211> 34
<212> PRT
<213> 人工序列
<220>
<223> 特立帕肽
<220>
<221> MOD_RES
<222> (1)..(1)
<223> 特立帕肽前体中可能存在N-末端苯乙酰化
<400> 11
Ser Val Ser Glu Ile Gln Leu Met His Asn Leu Gly Lys His Leu Asn
1 5 10 15
Ser Met Glu Arg Val Glu Trp Leu Arg Lys Lys Leu Gln Asp Val His
20 25 30
Asn Phe
<210> 12
<211> 32
<212> PRT
<213> Salmo salar
<220>
<221> DISULFID
<222> (1)..(7)
<220>
<221> MOD_RES
<222> (32)..(32)
<223> 消融C-末端
<400> 12
Cys Ser Asn Leu Ser Thr Cys Val Leu Gly Lys Leu Ser Gln Glu Leu
1 5 10 15
His Lys Leu Gln Thr Tyr Pro Arg Thr Asn Thr Gly Ser Gly Thr Pro
20 25 30
<210> 13
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> 比伐卢定
<220>
<221> MOD_RES
<222> (1)..(1)
<223> D-Phe
<400> 13
Xaa Pro Arg Pro Gly Gly Gly Gly Asn Gly Asp Phe Glu Glu Ile Pro
1 5 10 15
Glu Glu Tyr Leu
20
<210> 14
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> 8-mer模型肽
<220>
<221> MOD_RES
<222> (1)..(1)
<223> 乙酰化N-末端
<220>
<221> MOD_RES
<222> (8)..(8)
<223> 消融C-末端
<400> 14
Asp Phe Ser Lys Leu Ala Leu Arg
1 5
<210> 15
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> Dasi 1-8
<220>
<221> MOD_RES
<222> (8)..(8)
<223> C-末端(硫代)酯
<400> 15
His Ser Gln Gly Thr Phe Thr Ser
1 5
<210> 16
<211> 21
<212> PRT
<213> 人工序列
<220>
<223> Dasi 9-29
<220>
<221> MOD_RES
<222> (8)..(8)
<223> Aib
<400> 16
Asp Tyr Ser Lys Tyr Leu Asp Xaa Ala Arg Ala Glu Glu Phe Val Lys
1 5 10 15
Trp Leu Glu Ser Thr
20
<210> 17
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> Dasi 1-9
<220>
<221> MOD_RES
<222> (9)..(9)
<223> C-末端(硫代)酯
<400> 17
His Ser Gln Gly Thr Phe Thr Ser Asp
1 5
<210> 18
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> Dasi 10-29
<220>
<221> MOD_RES
<222> (7)..(7)
<223> Aib
<400> 18
Tyr Ser Lys Tyr Leu Asp Xaa Ala Arg Ala Glu Glu Phe Val Lys Trp
1 5 10 15
Leu Glu Ser Thr
20
<210> 19
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> Dasi 1-10
<220>
<221> MOD_RES
<222> (10)..(10)
<223> C-末端(硫代)酯
<400> 19
His Ser Gln Gly Thr Phe Thr Ser Asp Tyr
1 5 10
<210> 20
<211> 19
<212> PRT
<213> 人工序列
<220>
<223> Dasi 11-29
<220>
<221> MOD_RES
<222> (6)..(6)
<223> Aib
<400> 20
Ser Lys Tyr Leu Asp Xaa Ala Arg Ala Glu Glu Phe Val Lys Trp Leu
1 5 10 15
Glu Ser Thr
<210> 21
<211> 11
<212> PRT
<213> 人工序列
<220>
<223> Glepa 1-11
<220>
<221> MOD_RES
<222> (11)..(11)
<223> C-末端(硫代)酯
<400> 21
His Gly Glu Gly Thr Phe Ser Ser Glu Leu Ala
1 5 10
<210> 22
<211> 28
<212> PRT
<213> 人工序列
<220>
<223> Glepa 12-39
<400> 22
Thr Ile Leu Asp Ala Leu Ala Ala Arg Asp Phe Ile Ala Trp Leu Ile
1 5 10 15
Ala Thr Lys Ile Thr Asp Lys Lys Lys Lys Lys Lys
20 25
<210> 23
<211> 16
<212> PRT
<213> 人工序列
<220>
<223> Glepa 1-16
<220>
<221> MOD_RES
<222> (16)..(16)
<223> C-末端(硫代)酯
<400> 23
His Gly Glu Gly Thr Phe Ser Ser Glu Leu Ala Thr Ile Leu Asp Ala
1 5 10 15
<210> 24
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> Glepa 17-39
<400> 24
Leu Ala Ala Arg Asp Phe Ile Ala Trp Leu Ile Ala Thr Lys Ile Thr
1 5 10 15
Asp Lys Lys Lys Lys Lys Lys
20
<210> 25
<211> 11
<212> PRT
<213> 人工序列
<220>
<223> Elsi 1-11
<220>
<221> MOD_RES
<222> (11)..(11)
<223> C-末端(硫代)酯
<400> 25
His Gly Glu Gly Ser Phe Ser Ser Glu Leu Ser
1 5 10
<210> 26
<211> 28
<212> PRT
<213> 人工序列
<220>
<223> Elsi 12-39
<400> 26
Thr Ile Leu Asp Ala Leu Ala Ala Arg Asp Phe Ile Ala Trp Leu Ile
1 5 10 15
Ala Thr Lys Ile Thr Asp Lys Lys Lys Lys Lys Lys
20 25
<210> 27
<211> 16
<212> PRT
<213> 人工序列
<220>
<223> Elsi 1-16
<220>
<221> MOD_RES
<222> (16)..(16)
<223> C-末端(硫代)酯
<400> 27
His Gly Glu Gly Ser Phe Ser Ser Glu Leu Ser Thr Ile Leu Asp Ala
1 5 10 15
<210> 28
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> Elsi 17-39
<400> 28
Leu Ala Ala Arg Asp Phe Ile Ala Trp Leu Ile Ala Thr Lys Ile Thr
1 5 10 15
Asp Lys Lys Lys Lys Lys Lys
20
<210> 29
<211> 11
<212> PRT
<213> 人工序列
<220>
<223> Teri 1-11
<220>
<221> MOD_RES
<222> (11)..(11)
<223> C-末端(硫代)酯
<400> 29
Ser Val Ser Glu Ile Gln Leu Met His Asn Leu
1 5 10
<210> 30
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> Teri 12-34
<400> 30
Gly Lys His Leu Asn Ser Met Glu Arg Val Glu Trp Leu Arg Lys Lys
1 5 10 15
Leu Gln Asp Val His Asn Phe
20
<210> 31
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> Calci 1-12
<220>
<221> MOD_RES
<222> (12)..(12)
<223> C-末端(硫代)酯
<400> 31
Cys Ser Asn Leu Ser Thr Cys Val Leu Gly Lys Leu
1 5 10
<210> 32
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> Calci 13-32
<220>
<221> MOD_RES
<222> (20)..(20)
<223> 可能存在消融C-末端
<400> 32
Ser Gln Glu Leu His Lys Leu Gln Thr Tyr Pro Arg Thr Asn Thr Gly
1 5 10 15
Ser Gly Thr Pro
20
<210> 33
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> Calci 1-20
<220>
<221> MOD_RES
<222> (20)..(20)
<223> C-末端(硫代)酯
<400> 33
Cys Ser Asn Leu Ser Thr Cys Val Leu Gly Lys Leu Ser Gln Glu Leu
1 5 10 15
His Lys Leu Gln
20
<210> 34
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> Calci 21-32
<400> 34
Thr Tyr Pro Arg Thr Asn Thr Gly Ser Gly Thr Pro
1 5 10
<210> 35
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> Biva 1-10
<220>
<221> MOD_RES
<222> (1)..(1)
<223> D-Phe
<220>
<221> MOD_RES
<222> (10)..(10)
<223> C-末端(硫代)酯
<400> 35
Xaa Pro Arg Pro Gly Gly Gly Gly Asn Gly
1 5 10
<210> 36
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> Biva 11-20
<400> 36
Asp Phe Glu Glu Ile Pro Glu Glu Tyr Leu
1 5 10
<210> 37
<211> 11
<212> PRT
<213> 人工序列
<220>
<223> Lira-Sema 1-11
<220>
<221> 变体
<222> (2)..(2)
<223> Ala或Aib
<220>
<221> MOD_RES
<222> (11)..(11)
<223> C-末端(硫代)酯
<400> 37
His Xaa Glu Gly Thr Phe Thr Ser Asp Val Ser
1 5 10
<210> 38
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> Lira-Sema 12-31
<220>
<221> MOD_RES
<222> (9)..(9)
<223> Lys选自 Lys, Lys(PG), Lys(γ-Glu),
Lys(Pal-γ-Glu)和
Lys(AEEA-AEEA-γ-Glu-17-羧基十七烷酰)
<400> 38
Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val
1 5 10 15
Arg Gly Arg Gly
20
<210> 39
<211> 11
<212> PRT
<213> 人工序列
<220>
<223> Lira 1-11
<220>
<221> MOD_RES
<222> (11)..(11)
<223> C-末端 -OCam-Phe-Lys-NH2酯
<400> 39
His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser
1 5 10
<210> 40
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> Lira 12-31
<220>
<221> MOD_RES
<222> (9)..(9)
<223> Lys 是 Lys(Pal-γ-Glu)
<400> 40
Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val
1 5 10 15
Arg Gly Arg Gly
20
<210> 41
<211> 5
<212> PRT
<213> 人工序列
<220>
<223> 模型肽片段
<220>
<221> MOD_RES
<222> (1)..(1)
<223> 乙酰化 N-末端
<220>
<221> MOD_RES
<222> (5)..(5)
<223> C-末端 -OCam-Leu-OH 酯或 OH
<400> 41
Asp Phe Ser Lys Leu
1 5
<210> 42
<211> 42
<212> PRT
<213> 人工序列
<220>
<223> lira 1-11-1-31
<220>
<221> MOD_RES
<222> (31)..(31)
<223> Lys是Lys(Pal-γ-Glu)
<400> 42
His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser His Ala Glu Gly Thr
1 5 10 15
Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu
20 25 30
Phe Ile Ala Trp Leu Val Arg Gly Arg Gly
35 40
<210> 43
<211> 11
<212> PRT
<213> 人工序列
<220>
<223> Teri 1-11酯
<220>
<221> MOD_RES
<222> (1)..(1)
<223> N-末端苯乙酰化
<220>
<221> MOD_RES
<222> (11)..(11)
<223> C-末端 -OCam-Leu-OH酯
<400> 43
Ser Val Ser Glu Ile Gln Leu Met His Asn Leu
1 5 10
<210> 44
<211> 11
<212> PRT
<213> 人工序列
<220>
<223> Sema 1-11
<220>
<221> MOD_RES
<222> (2)..(2)
<223> Aib
<220>
<221> MOD_RES
<222> (11)..(11)
<223> C-末端 -OCam-Phe-Lys-NH2酯
<400> 44
His Xaa Glu Gly Thr Phe Thr Ser Asp Val Ser
1 5 10
<210> 45
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> Sema 12-31
<220>
<221> MOD_RES
<222> (9)..(9)
<223> Lys 是 Lys(AEEA-AEEA-γ-Glu-17-羧基十七烷酰)
<400> 45
Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val
1 5 10 15
Arg Gly Arg Gly
20

Claims (17)

1.一种枯草杆菌蛋白酶BPN’变体,其具有与枯草杆菌蛋白酶BPN’SEQ ID NO:2至少80%的序列同一性,包含第75~83位氨基酸的缺失和在氨基酸位置S221处的突变,所述突变是S221C或S221硒代半胱氨酸,优选为S221C;并且
其特征在于,所述枯草杆菌蛋白酶BPN’变体具有在选自L96、D99、A223和S224的氨基酸位置处的至少一个突变,
其中所述氨基酸位置根据SEQ ID NO:2定义,
并且其中此类变体具有反应速率和偶联效率提高的连接酶和/或环化酶活性。
2.根据权利要求1所述的枯草杆菌蛋白酶BPN’变体,其包含下述之一:
在选自L96、D99、A223和S224的氨基酸位置处的一个突变;或
在选自L96和D99,L96和A223,L96和S224,D99和A223,D99和S224以及A223和S224的氨基酸位置处的两个突变;或
在选自L96、D99和A223,L96、D99和S224,L96、A223和S224,以及D99、A223和S224的氨基酸位置处的三个突变;或
在氨基酸位置L96、D99、A223和S224处的四个突变。
3.根据前述权利要求中任一项所述的枯草杆菌蛋白酶BPN’变体,其包含在L96位置处的突变,所述突变优选地选自L96I、L96V、L96M、L96T、L96C、L96Q、L96A和L96S,更优选地选自L96I和L96V。
4.根据前述权利要求中任一项所述的枯草杆菌蛋白酶BPN’变体,其包含在D99位置处的突变,所述突变优选地选自D99R、D99K、D99G、D99F、D99T、D99S、D99N、D99Q、D99Y、D99M、D99I、D99H、D99E、D99L和D99W,更优选地选自D99R、D99K和D99G。
5.根据前述权利要求中任一项所述的枯草杆菌蛋白酶BPN’变体,其包含在A223位置处的突变,所述突变优选地选自A223S和A223G。
6.根据前述权利要求中任一项所述的枯草杆菌蛋白酶BPN’变体,其包含在S224位置处的突变,所述突变优选地选自S224M、S224Q、S224E、S224H、S224L、S224V和S224I。
7.根据前述权利要求中任一项所述的枯草杆菌蛋白酶BPN’变体,其中所述至少一个、优选地两个或三个或四个突变选自L96I、L96V、L96M、L96T、L96C、L96Q、L96A、L96S、D99R、D99K、D99G、D99F、D99T、D99S、D99N、D99Q、D99Y、D99M、D99I、D99H、D99E、D99L、D99W、A223S、A223G、S224M、S224Q、S224E、S224H、S224H、S224L、S224V和S224I,并且
其中最优选地所述突变的组合选自L96V和D99R;L96I和D99R;L96I和D99K;L96I和A223S;L96I和S224V;L96V、D99R和A223S;L96V、D99R和S224V;L96I、D99R和A223S;L96I、D99R和S224V;L96I、D99K和A223S;L96I、A223S和S224V;L96I、D99K和S224V;L96V、D99R、A223S和S224V;L96I、D99R、A223S和S224V;L96V、D99K、A223S和S224V;以及L96I、D99K、A223S和S224V。
8.根据前述权利要求中任一项所述的枯草杆菌蛋白酶BPN’变体,其还包含在P225氨基酸位置处的突变,所述突变优选地选自P225N、P225D、P225S、P225C、P225G、P225A、P225T、P225V、P225I、P225L、P225H和P225Q,更优选地选自P225N、P225D、P225S、P225C、P225G、P225A和P225T,甚至更优选地对应于P225N或P225D。
9.根据前述权利要求中任一项所述的枯草杆菌蛋白酶BPN’变体,其还包含在选自Q2、S3、P5、S9、I31、K43、M50、A73、G169、S188、Q206、N212、T254和Q271的氨基酸位置处的至少6个、优选地至少8个、更优选地至少10个、甚至更优选地至少12个突变,其中此类突变优选地选自Q2K、S3C、P5S、S9A、I31L、K43N、M50F、A73L、G169A、S188P、Q206C、N212G、T254A和Q271E。
10.根据前述权利要求中任一项所述的枯草杆菌蛋白酶BPN’变体,其还包含在选自S33、N62、E156、G166、Y217、N218和F189的氨基酸位置处的至少一个突变,此类突变优选地选自S33T、N62A、N62R、N62K、E156S、E156N、E156K、E156R、G166S、G166E、G166D、Y217L、Y217H、Y217R、N218S、N218D和F189W。
11.根据前述权利要求中任一项所述的枯草杆菌蛋白酶BPN’变体,其还包含在氨基酸位置M222和Y217处的至少一个突变或成对突变,其中单突变优选地选自M222P、M222G、M222H、Y217H、Y217G、Y217F、Y217L和Y217R,并且其中所述成对突变优选地选自M222P和Y217H,M222P和Y217G,M222G和Y217F,M222G和Y217G,M222G和Y217L,以及M222H和Y217R。
12.根据前述权利要求中任一项所述的枯草杆菌蛋白酶BPN’变体,其包含突变Q2K、S3C、P5S、S9A、I31L、K43N、M50F、N62A、A73L、E156K、G166D、G169A、S188P、F189W、Q206C、N212G、Y217R、N218D、M222H、P225N、T254A、Q271E,和选自L96I和D99R,L96I和D99K,L96I和A223S,L96I和S224V,L96I、A223S和S224V,L96I、D99R和S224V,L96I、D99R、A223S和S224V,L96I、D99K和A223S,L96I、D99K和S224V,以及L96I、D99K、A223S和S224V的突变组合。
13.根据前述权利要求中任一项所述的枯草杆菌蛋白酶BPN’变体,其特征在于,所述枯草杆菌蛋白酶BPN’变体具有与SEQ ID NO:2至少85%、更优选地至少90%或甚至更优选地至少95%的同一性。
14.一种用于酶法合成肽的方法,所述方法包括将(a)肽C-端(硫)酯与(b)具有N-端未保护的胺的肽亲核试剂偶联的步骤,
其中所述偶联优选地在水性溶液中进行,并且其中所述偶联由枯草杆菌蛋白酶BPN’变体催化,所述枯草杆菌蛋白酶BPN’变体具有与枯草杆菌蛋白酶BPN’SEQ ID NO:2至少80%的序列同一性,包含第75~83位置处的氨基酸的缺失和在氨基酸位置S221处的突变,所述突变是S221C或S221硒代半胱氨酸,优选为S221C;并且
其特征在于,所述枯草杆菌蛋白酶BPN’变体具有在选自L96、D99、A223和S224的氨基酸位置处的至少一个突变,
其中所述氨基酸位置根据SEQ ID NO:2定义,
并且其中此类变体具有反应速率和偶联效率提高的连接酶和/或环化酶活性。
15.根据权利要求14所述的方法,其中所述合成的肽选自利拉鲁肽、索马鲁肽、达西格列酮、替度鲁肽、格列帕格鲁肽、艾司格鲁肽、特立帕肽、鲑鱼降钙素、比伐卢定及其类似物。
16.根据权利要求14所述的方法,所述方法用于合成包含达西格列酮序列(SEQ ID NO:8)的肽,所述方法包括将下述物质偶联的步骤:
(a)包含第一肽片段的肽C-端(硫)酯,其中所述第一肽片段具有序列His-Ser-Gln-Gly-Thr-Phe-Thr-Ser-(硫)酯(SEQ ID NO:15),和
(b)包含第二肽片段的具有N-端未保护的胺的肽亲核试剂片段,其中所述第二肽片段具有序列H-Asp-Tyr-Ser-Lys-Tyr-Leu-Asp-Aib-Ala-Arg-Ala-Glu-Glu-Phe-Val-Lys-Trp-Leu-Glu-Ser-Thr(SEQ ID NO:16);
(c)包含第一肽片段的肽C-端(硫)酯,其中所述第一肽片段具有序列His-Ser-Gln-Gly-Thr-Phe-Thr-Ser-Asp(硫)酯(SEQ ID NO:17),和
(d)包含第二肽片段的具有N-端未保护的胺的肽亲核试剂片段,其中所述第二肽片段具有序列H-Tyr-Ser-Lys-Tyr-Leu-Asp-Aib-Ala-Arg-Ala-Glu-Glu-Phe-Val-Lys-Trp-Leu-Glu-Ser-Thr(SEQ ID NO:18);
(e)包含第一肽片段的肽C-端(硫)酯,其中所述第一肽片段具有序列His-Ser-Gln-Gly-Thr-Phe-Thr-Ser-Asp-Tyr(硫)酯(SEQ ID NO:19),和
(f)包含第二肽片段的具有N-端未保护的胺的肽亲核试剂片段,其中所述第二肽片段具有序列H-Ser-Lys-Tyr-Leu-Asp-Aib-Ala-Arg-Ala-Glu-Glu-Phe-Val-Lys-Trp-Leu-Glu-Ser-Thr(SEQ ID NO:20);
或者,所述方法用于合成包含格列帕格鲁肽序列(SEQ ID NO:9)的肽,所述方法包括将下述物质偶联的步骤:
(a)包含第一肽片段的肽C-端(硫)酯,其中所述第一肽片段具有序列His-Gly-Glu-Gly-Thr-Phe-Ser-Ser-Glu-Leu-Ala-(硫)酯(SEQ ID NO:21),和
(b)包含第二肽片段的具有N-端未保护的胺的肽亲核试剂片段,其中所述第二肽片段具有序列H-Thr-Ile-Leu-Asp-Ala-Leu-Ala-Ala-Arg-Asp-Phe-Ile-AIa-Trp-Leu-Ile-Ala-Thr-Lys-Ile-Thr-Asp-Lys-Lys-Lys-Lys-Lys-Lys(SEQ ID NO:22);
(c)包含第一肽片段的肽C-端(硫)酯,其中所述第一肽片段具有序列His-Gly-Glu-Gly-Thr-Phe-Ser-Ser-Glu-Leu-Ala-Thr-Ile-Leu-Asp-Ala-(硫)酯(SEQ ID NO:23),和
(d)包含第二肽片段的具有N-端未保护的胺的肽亲核试剂片段,其中所述第二肽片段具有序列H-Leu-Ala-Ala-Arg-Asp-Phe-Ile-AIa-Trp-Leu-Ile-Ala-Thr-Lys-Ile-Thr-Asp-Lys-Lys-Lys-Ly s-Lys-Lys(SEQ ID NO:24);
或者,所述方法用于合成包含艾司格鲁肽序列(SEQ ID NO:10)的肽,所述方法包括将下述物质偶联的步骤:
(a)包含第一肽片段的肽C-端(硫)酯,其中所述第一肽片段具有序列His-Gly-Glu-Gly-Ser-Phe-Ser-Ser-Glu-Leu-Ser-(硫)酯(SEQ ID NO:25),和
(b)包含第二肽片段的具有N-端未保护的胺的肽亲核试剂片段,其中所述第二肽片段具有序列H-Thr-Ile-Leu-Asp-Ala-Leu-Ala-Ala-Arg-Asp-Phe-Ile-AIa-Trp-Leu-Ile-Ala-Thr-Lys-Ile-Thr-Asp-Lys-Lys-Lys-Lys-Lys-Lys(SEQ ID NO:26);
(c)包含第一肽片段的肽C-端(硫)酯,其中所述第一肽片段具有序列His-Gly-Glu-Gly-Ser-Phe-Ser-Ser-Glu-Leu-Ser-Thr-Ile-Leu-Asp-Ala-(硫)酯(SEQ ID NO:27),和
(d)包含第二肽片段的具有N-端未保护的胺的肽亲核试剂片段,其中所述第二肽片段具有序列H-Leu-Ala-Ala-Arg-Asp-Phe-Ile-AIa-Trp-Leu-Ile-Ala-Thr-Lys-Ile-Thr-Asp-Lys-Lys-Lys-Ly s-Lys-Lys(SEQ ID NO:28);
或者,所述方法用于合成包含特立帕肽序列(SEQ ID NO:11)的肽,所述方法包括将下述物质偶联的步骤:
(a)包含第一肽片段的肽C-端(硫)酯,其中所述第一肽片段具有序列Ser-Val-Ser-Glu-Ile-Gln-Leu-Met-His-Asn-Leu-(硫)酯(SEQ ID NO:29),和
(b)包含第二肽片段的具有N-端未保护的胺的肽亲核试剂片段,其中所述第二肽片段具有序列H-Gly-Lys-His-Leu-Asn-Ser-Met-Glu-Arg-Val-Glu-Trp-Leu-Arg-Lys-Lys-Leu-Gln-Asp-Val-His-Asn-Phe(SEQ ID NO:30);
或者,所述方法用于合成包含鲑鱼降钙素序列(SEQ ID NO:12)的肽,所述方法包括将下述物质偶联的步骤:
(a)包含第一肽片段的肽C-端(硫)酯,其中所述第一肽片段具有序列Cys-Ser-Asn-Leu-Ser-Thr-Cys-Val-Leu-Gly-Lys-Leu-(硫)酯(SEQ ID NO:31),和
(b)包含第二肽片段的具有N-端未保护的胺的肽亲核试剂片段,其中所述第二肽片段具有序列H-Ser-Gln-Glu-Leu-His-Lys-Leu-Gln-Thr-Tyr-Pro-Arg-Thr-Asn-Thr-Gly-Ser-Gly-Thr-Pro(SEQ ID NO:32);
(c)包含第一肽片段的肽C-端(硫)酯,其中所述第一肽片段具有序列Cys-Ser-Asn-Leu-Ser-Thr-Cys-Val-Leu-Gly-Lys-Leu-Ser-Gln-Glu-Leu-His-Lys-Leu-Gln-(硫)酯(SEQ ID NO:33),和
(d)包含第二肽片段的具有N-端未保护的胺的肽亲核试剂片段,其中所述第二肽片段具有序列H-Thr-Tyr-Pro-Arg-Thr-Asn-Thr-Gly-Ser-Gly-Thr-Pro(SEQ ID NO:34);
或者,所述方法用于合成包含比伐卢定序列(SEQ ID NO:13)的肽,所述方法包括将下述物质偶联的步骤:
(a)包含第一肽片段的肽C-端(硫)酯,其中所述第一肽片段具有序列D-Phe-Pro-Arg-Pro-Gly-Gly-Gly-Gly-Asn-Gly-(硫)酯(SEQ ID NO:35),和
(b)包含第二肽片段的具有N-端未保护的胺的肽亲核试剂片段,其中所述第二肽片段具有序列H-Asp-Phe-Glu-Glu-Ile-Pro-Glu-Glu-Tyr-Leu(SEQ ID NO:36);
或者,所述方法用于合成包含序列His-W-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Z-Glu-Ph e-Ile-Ala-Trp-Leu-Val-Arg-Gly-Arg-Gly的利拉鲁肽或索马鲁肽,
其中
对于合成利拉鲁肽(SEQ ID NO:6),W是Ala并且Z选自Lys、Lys(PG)、Lys(γ-Glu)和Lys(Pal-γ-Glu),或者
对于合成索马鲁肽(SEQ ID NO:7),W是Aib并且Z选自Lys、Lys(PG)和Lys(AEEA-AEEA-γ-Glu-17-羧基十七烷酰基),
并且PG是Lys侧链氨基的保护基团;
所述方法包括将下述物质偶联的步骤:
(a)包含第一肽片段的肽C-端(硫)酯,其中所述第一肽片段具有序列His-W-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-(硫)酯(SEQ ID NO:37),和
(b)包含第二肽片段的具有N-端未保护的胺的肽亲核试剂片段,其中所述第二肽片段具有序列H-Ser-Tyr-Leu-Glu-Gly-Gln-Ala-Ala-Z-Glu-Phe-Ile-Ala-Trp-Leu-Val-Arg-Gly-Arg-Gly-OH(SEQ ID NO:38)。
17.根据权利要求14至16中任一项所述的方法,其中所述枯草杆菌蛋白酶BPN’变体如权利要求2至13中任一项中所定义。
CN202280014758.3A 2021-02-12 2022-02-09 枯草杆菌蛋白酶变体及其用途 Pending CN117098843A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
EP21156989.2 2021-02-12
EP21176039.2 2021-05-26
EP21176039 2021-05-26
PCT/EP2022/053121 WO2022171667A1 (en) 2021-02-12 2022-02-09 Subtilisin variants and their use

Publications (1)

Publication Number Publication Date
CN117098843A true CN117098843A (zh) 2023-11-21

Family

ID=76138018

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280014758.3A Pending CN117098843A (zh) 2021-02-12 2022-02-09 枯草杆菌蛋白酶变体及其用途

Country Status (1)

Country Link
CN (1) CN117098843A (zh)

Similar Documents

Publication Publication Date Title
US10253061B2 (en) Peptide fragment condensation and cyclisation using a subtilisin variant with improved synthesis over hydrolysis ratio
US10883132B2 (en) Chemo-enzymatic synthesis of Semaglutide, Liraglutide and GLP-1
US10858414B2 (en) Chemo-enzymatic synthesis of semaglutide, liraglutide and GLP-1
US10752931B2 (en) Designing an enzymatic peptide fragment condensation strategy
US9598714B2 (en) Side-chain protected oligopeptide fragment condensation using subtilisins in organic solvents
KR20230144058A (ko) 서브틸리신 변이체 및 그의 용도
US10336994B2 (en) Subtilisin variants having a mutation in the S2 or S2# pocket
JP2023531168A (ja) インスリンデグルデク誘導体およびその製造方法と使用
CN117098843A (zh) 枯草杆菌蛋白酶变体及其用途
čeřovský et al. Enzymatic semisynthesis of dicarba analogs of calcitonin
WO2017222369A1 (en) Enzymatic coupling of (oligo)peptides to the b-chain of an insulin receptor ligand
EP4122944A1 (en) Enzymatic synthesis of cyclic peptides
KR100904169B1 (ko) 유전자 재조합 폴리펩티드의 생산에 있어서 부생성물의생성을 억제하는 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination