CN116897210A - S-甲基硫核糖激酶多肽以及s-甲基硫核糖激酶多肽的制备和使用方法 - Google Patents

S-甲基硫核糖激酶多肽以及s-甲基硫核糖激酶多肽的制备和使用方法 Download PDF

Info

Publication number
CN116897210A
CN116897210A CN202180084368.9A CN202180084368A CN116897210A CN 116897210 A CN116897210 A CN 116897210A CN 202180084368 A CN202180084368 A CN 202180084368A CN 116897210 A CN116897210 A CN 116897210A
Authority
CN
China
Prior art keywords
ala
leu
polypeptide
val
asp
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180084368.9A
Other languages
English (en)
Inventor
T·本科维奇
H-I·何
J·A·麦金托什
G·S·墨菲
W·潘
D·维玛
H·杨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Merck Sharp and Dohme BV
Original Assignee
Merck Sharp and Dohme BV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Merck Sharp and Dohme BV filed Critical Merck Sharp and Dohme BV
Priority claimed from PCT/US2021/062503 external-priority patent/WO2022132543A1/en
Publication of CN116897210A publication Critical patent/CN116897210A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Enzymes And Modification Thereof (AREA)

Abstract

本公开提供了与天然存在的野生型MTR激酶多肽相比,具有改善的特性的MTR激酶多肽,所述改善的特性包括磷酸化D‑核糖和5′‑D‑异丁酰核糖以给出α‑D‑核糖‑1‑磷酸和α5′‑D‑异丁酰核糖‑1‑磷酸的能力。还提供了编码MTR激酶多肽的多核苷酸,能够表达MTR激酶多肽的宿主细胞,以及使用MTR激酶多肽来合成α‑D‑核糖‑1‑磷酸和α5′‑D‑异丁酰核糖‑1‑磷酸的方法。

Description

S-甲基硫核糖激酶多肽以及S-甲基硫核糖激酶多肽的制备和 使用方法
技术领域
本公开涉及可用于生物催化和合成方法中的S-甲基硫核糖激酶多肽。此类酶在合成方法中可能是特别有用的,所述合成方法可以用作制备含有5′-酰基或烷基的核糖核苷或在制备此类核糖核苷期间形成的中间体的一部分。
背景技术
酶是作用于加速活细胞的化学反应(经常为几个数量级)的多肽。如果没有酶,大多数生化反应将太慢,以至于甚至无法进行生命过程。酶展示极大的特异性,并且并不通过其参与反应而永久地改变。因为它们在反应过程中并不改变,所以酶可以经济高效地用作所需化学转化的催化剂。
S-甲基硫核糖激酶,也称为MTR激酶,是磷酸化催化试剂,催化S-甲基-5-硫核糖的选择性1-磷酸化的一类特定酶。这些酶的合成应用先前并未在学术文献中得到报道。属于MTR激酶类别的酶在本文中显示为可用于合成1-磷酸化糖,且然后可以通过核苷磷酸化酶的作用转换为相应的核苷。MTR激酶可以使用ATP选择性地磷酸化核糖和核糖类似物的1-位置。酶促磷酸化需要辅因子的参与,所述辅因子可以充当磷酰基供体,经常是核苷酸三磷酸例如ATP。
迄今为止,MTR激酶一直是有限的生物化学表征的主题。参见例如,KennethA.Cornell等人,317BIOCHEM.J.285-290(1996);Toshihiro Nakano等人,77(5)BIOSCI.BIOTECHNOL.BIOCHEM.1104-1107(2013);Agnieszka Sekowska等人,BMCMICROBIOLOGY 2001,1:15;Andrezej Guranowski,71PLANT PHYSIOL.932-935(1983);Shao-Yang Ku等人,ACTA CRYST.(2004)D60,116-119;Margret Sauter等人,136PLANTPHYSIOLOGY 4061-6071(2004年12月)。使用生物信息学比对,鉴定该酶家族的另外推定成员是可能的。在本文中,证实了这些酶用于合成中的有用性。
发明内容
本公开涉及其为MTR激酶的多肽,所述MTR激酶能够将核糖和5-异丁酰核糖转换为相应的1-磷酸酯,特别是作为核苷酸合成的一部分。在实施方案中,本文描述的主题MTR激酶能够将核糖转换为1-磷酸核糖或将5-异丁酰核糖转换为5-异丁酰核糖-1-磷酸。特别地,本文描述的主题MTR激酶可以用于制备核苷,例如尿苷4-肟5′-(2-甲基丙酸酯),且特别是{(2R,3S,4R,5R)-3,4-二羟基-5-[(4Z)-4-(羟基亚氨基)-2-氧代-3,4-二氢嘧啶-1(2H)-基]氧杂环戊-2-基}甲基2-甲基丙酸酯。此类核苷可用作生物活性化合物或用作用于合成更复杂的生物活性化合物的中间体。
另外的实施方案描述了用于制备主题MTR激酶的方法以及关于使用主题MTR激酶的方法。
本公开的其它实施方案、方面和特征在随后的说明书、实施例和所附权利要求中进一步描述或者根据其将是显而易见的。
具体实施方式
定义
某些技术和科学术语在下文具体定义。除非在本文件的其它地方具体定义,否则本文使用的所有其它技术和科学术语具有由本公开相关领域的普通技术人员普遍理解的含义。即,本文使用的术语具有其普通含义,这在其每次出现时都是独立的。尽管如此并且除非另有说明,否则下述定义适用于整个说明书和权利要求。化学名称、通用名称和化学结构可以互换使用以描述相同的结构。如果化学化合物使用化学结构和化学名称两者来提及,并且在结构和名称之间存在歧义,则以结构为主。除非另有说明,否则无论术语是单独使用还是与其它术语组合使用,这些定义均适用。因此,“烷基”的定义适用于“烷基”以及“羟烷基”、“卤代烷基”、“-O-烷基”等的“烷基”部分。
除非另有说明,否则如本文和本公开自始至终所用,下述术语应该理解为具有下述含义:
如本文包括所附权利要求所用,单数形式的词语,例如“一个”、“一种”和“该/所述”包括其相应的复数指示物,除非上下文另有明确规定。特别地,“一个”、“一种”和“该/所述”项目各自包括从列表中选择的单个项目、以及从列表中选择的两个或更多个项目的混合物。因此,例如,提及“一种多肽”包括多于一种多肽。
如本文所用,术语“至少一个”项目或者“一个或多个”项目各自包括从列表中选择的单个项目、以及从列表中选择的两个或更多个项目的混合物。例如,“至少一种S-甲基-5-硫核糖激酶多肽”(可替代地被称为“S-甲基-5-硫核糖激酶多肽”、“至少一种S-甲基-5-硫核糖激酶”、“S-甲基-5-硫核糖激酶”、“至少一种MTR激酶多肽”、“MTR多肽”、“至少一种MTR激酶”、“MTR激酶”、“至少一种MTR激酶”或“MTR激酶”)指单一的MTR激酶以及两种或更多种不同MTR激酶的混合物。类似地,术语“至少两个”项目和“两个或更多个”项目各自包括从列表中选择的两个项目的混合物、以及从列表中选择的三个或更多个项目的混合物。
如说明书和权利要求自始至终所用,“基本上由......组成(Consistsessentially of)”和变化例如“基本上由......组成(consist essentially of)”或“基本上由......组成(consisting essentially of)”,指示包括任何叙述的元素或元素组,以及任选包括与叙述的元素具有相似或不同性质的其它元素,所述其它元素并不实质性改变指定剂量方案、方法或组合物的基本或新型性质。
本说明书和权利要求自始至终,词语“包含(comprise)”或变化例如“包含(comprises)”或“包含(comprising)”应理解为暗示包括所述的整数或整数组,但不排除任何其它整数或整数组。术语“包含(comprise)”、“包含(comprises)”、“包含(comprising)”、“包括(include)”、“包括(includes)”和“包括(including)”是可互换的,并不意图为限制性的。因此,如本文所用,“包含”及其同源词以其包容性意义使用(即等价于术语“包括”及其相应的同源词)。除非上下文另有要求,否则单数术语应该包括复数,且复数术语应该包括单数。在术语“例如(e.g.)”或“例如(for example)”之后的任何实例并不意味着是详尽的或限制性的。应理解,无论何时实施方案在本文中用语言“包含”进行描述,还提供了按照“由......组成”和/或“基本上由......组成”描述的在其它方面类似的实施方案。
除非另有相反的明确说明,否则本文引用的所有范围都是包括在内的;即,范围包括范围的上限值和下限值以及介于两者之间的所有值。所有范围也意图包括所有包括的子范围,尽管不一定明确地阐述。作为示例,本文描述的温度范围、百分比、当量范围等等包括范围的上限和下限以及介于两者之间的连续体中的任何值。本文提供的数值以及术语“约”的使用可以包括±1%、±2%、±3%、±4%、±5%和±10%的变化及其数值等价物。术语“约”意指关于特定值的可接受误差,在一些情况下,这意味着在0.05%、0.5%、1.0%或2.0%内。在一些情况下,“约”意指在给定值的1、2、3或4个标准差内。当用于修饰数字定义的参数时,“约”意指参数可能改变低于或高于该参数的所述数值的多达10%;适当时,所述参数可以四舍五入到最接近的整数。例如,约5mg的量可能在4.5mg和5.5mg之间变化。另外,如本文所用,术语“或”指示适当时可以组合的替代方案;即,术语“或”包括分开列出的每个替代方案以及其组合。
“蛋白质”、“多肽”和“肽”在本文中可互换使用,以表示通过酰胺键共价连接的至少两个氨基酸的聚合物,无论长度或翻译后修饰(例如,糖基化或磷酸化、脂质化、豆蔻酰化、泛素化等)如何
如在本文公开的多肽的上下文中使用的“氨基酸”或“残基”指在序列位置处的特定单体。氨基酸在本文中通过其通常已知的三字母符号或通过由IUPAC-IUB生化命名委员会(Biochemical Nomenclature Commission)推荐的单字母符号来提及。同样地,核苷酸可以通过其通常公认的单字母代码来提及。
用于遗传编码的氨基酸的缩写是常规的并且如下:丙氨酸(Ala或A)、精氨酸(Arg或R)、天冬酰胺(Asn或N)、天冬氨酸(Asp或D)、半胱氨酸(Cys或C)、谷氨酸(Glu或E)、谷氨酰胺(Gln或Q)、组氨酸(His或H)、异亮氨酸(Ile或I)、亮氨酸(Leu或L)、赖氨酸(Lys或K)、甲硫氨酸(Met或M)、苯丙氨酸(Phe或F)、脯氨酸(Pro或P)、丝氨酸(Ser或S)、苏氨酸(Thr或T)、色氨酸(Trp或W)、酪氨酸(Tyr或Y)和缬氨酸(Val或V)。
用于遗传编码的核苷的缩写是常规的并且如下:腺苷(A);鸟苷(G);胞苷(C);胸苷(T);和尿苷(U)。除非具体说明,否则缩写的核苷可以是核糖核苷或2′-脱氧核糖核苷。核苷可以在个别的基础上或在聚集体的基础上指定为核糖核苷或2′-脱氧核糖核苷。当核酸序列作为一串单字母缩写呈现时,序列按照通常约定以5′到3′方向呈现,并且磷酸并不指示。
如本文在MTR激酶多肽的上下文中使用的,“衍生自”鉴定起源MTR激酶多肽、和/或编码MTR多肽基于其的此类MTR激酶的基因。例如,SEQ ID NO:7的MTR激酶通过经过多代使编码SEQ ID NO:1的MTR多肽的基因人工进化而获得。因此,这种进化的MTR多肽“衍生自”SEQ ID NO:1的MTR激酶。
“亲水性氨基酸或残基”指具有这样的侧链的氨基酸或残基,根据Eisenberg等人,1984,J.MOL.BIOL.179:125-142的标准化的共有疏水性标度,所述侧链显示出小于零的疏水性。遗传编码的亲水性氨基酸包括L-Thr(T)、L-Ser(S)、L-His(H)、L-Glu(E)、L-Asn(N)、L-Gln(Q)、L-Asp(D)、L-Lys(K)和L-Arg(R)。
“酸性氨基酸或残基”指具有这样的侧链的亲水性氨基酸或残基,当氨基酸包括在肽或多肽中时,所述侧链显示出小于约6的pK值。由于氢离子的丧失,酸性氨基酸在生理pH下通常具有带负电荷的侧链。遗传编码的酸性氨基酸包括L-Glu(E)和L-Asp(D)。
“碱性氨基酸或残基”指具有这样的侧链的亲水性氨基酸或残基,当氨基酸包括在肽或多肽中时,所述侧链显示出大于约6的pKa值。由于与水合氢离子结合,碱性氨基酸在生理pH下通常具有带正电荷的侧链。遗传编码的碱性氨基酸包括L-Arg(R)和L-Lys(K)。
“极性氨基酸或残基”指具有这样的侧链的亲水性氨基酸或残基,所述侧链在生理pH下不带电荷,但具有其中由两个原子共享的电子对被原子之一更紧密地持有的至少一个键。遗传编码的极性氨基酸包括L-Asn(N)、L-Gln(Q)、L-Ser(S)和L-Thr(T)。
“非极性氨基酸或残基”指具有这样的侧链的疏水性氨基酸或残基,所述侧链在生理pH下不带电荷,并且具有其中由两个原子共享的电子对一般被两个原子各自平等地持有的键(即,侧链不是极性的)。遗传编码的非极性氨基酸包括L-Gly(G)、L-Leu(L)、L-Val(V)、L-Ile(I)、L-Met(M)和L-Ala(A)。
“疏水性氨基酸或残基”指具有这样的侧链的氨基酸或残基,根据Eisenberg等人,1984,J.MOL.BIOL.179:125-142的标准化的共有疏水性标度,所述侧链显示出大于零的疏水性。遗传编码的疏水性氨基酸包括L-Pro(P)、L-Ile(I)、L-Phe(F)、L-Val(V)、L-Leu(L)、L-Trp(W)、L-Met(M)、L-Ala(A)和L-Tyr(Y)。
“芳香族氨基酸或残基”指具有这样的侧链的亲水性或疏水性氨基酸或残基,所述侧链包括至少一个芳环或杂芳环。遗传编码的芳香族氨基酸包括L-Phe(F)、L-Tyr(Y)、L-His(H)和L-Trp(W)。L-His(H)组氨酸在本文中也被归类为亲水性残基或受限残基。
如本文所用,“受限氨基酸或残基”指具有受限几何结构的氨基酸或残基。在本文中,受限残基包括L-Pro(P)和L-His(H)。组氨酸具有受限的几何结构,因为它具有相对较小的咪唑环。脯氨酸具有受限的几何结构,因为它也具有一个五元环。
如本文所用,“脂肪族氨基酸或残基”指具有脂肪族烃侧链的疏水性氨基酸或残基。遗传编码的脂肪族氨基酸包括L-Ala(A)、L-Val(V)、L-Leu(L)和L-Ile(I)。
L-Cys(C)(以及具有含-SH侧链的其它氨基酸)以还原的游离-SH或氧化的二硫键桥接形式存在于肽中的能力影响L-Cys(C)是对肽贡献净疏水性还是亲水性特性。虽然L-Cys(C)根据Eisenberg(Eisenberg等人,1984,同上)的标准化的共有标度显示出0.29的疏水性,但应理解,为了本公开的目的,L-Cys(C)被归类到它自己独特的组内。值得注意的是,半胱氨酸(或“L-Cys”或“[C]”)是不寻常的,因为它可以与其它L-Cys(C)氨基酸或者其它含硫烷基或巯基的氨基酸形成二硫桥。“半胱氨酸样残基”包括半胱氨酸和其它含有巯基部分的氨基酸,所述巯基部分可用于形成二硫桥。
如本文所用,“小氨基酸或残基”指具有这样的侧链的氨基酸或残基,所述侧链由总共三个或更少的碳和/或杂原子(排除α-碳和氢)构成。按照上文定义,小氨基酸或残基可以进一步分类为脂肪族、非极性、极性或酸性小氨基酸或残基。遗传编码的小氨基酸包括L-Ala(A)、L-Val(V)、L-Cys(C)、L-Asn(N)、L-Ser(S)、L-Thr(T)和L-Asp(D)。
“含羟基氨基酸或残基”指含有羟基(-OH)部分的氨基酸。遗传编码的含羟基氨基酸包括L-Ser(S)、L-Thr(T)和L-Tyr(Y)。
如本文所用,“多核苷酸”和“核酸”指共价连接在一起的两个或更多个核苷酸。多核苷酸可以完全由核糖核苷酸(即RNA)构成,完全由2′脱氧核糖核苷酸(即DNA)构成,或由核糖核苷酸和2′脱氧核糖核苷酸的混合物构成。虽然核苷通常经由标准磷酸二酯键合连接在一起,但多核苷酸可以包括一个或多个非标准键合。多核苷酸可以是单链或双链的,或者多核苷酸可以包括单链区域和双链区域两者。此外,虽然多核苷酸通常由天然存在的编码核碱基(即腺嘌呤、鸟嘌呤、尿嘧啶、胸腺嘧啶和胞嘧啶)构成,但它可能包括一种或多种修饰和/或合成的核碱基,例如肌苷、黄嘌呤、次黄嘌呤等。在一些实施方案中,此类修饰的或合成的核碱基是编码氨基酸序列的核碱基。
如本文所用,“核苷”指包含核碱基(即,含氮碱基)和5-碳糖(例如,核糖或脱氧核糖)的葡基胺。核苷的非限制性实例包括胞苷、尿苷、腺苷、鸟苷、胸苷和肌苷。相比之下,术语“核苷酸”指包含核碱基、5-碳糖和一个或多个磷酸基的葡基胺。在一些实施方案中,核苷可以被激酶磷酸化以产生核苷酸。
如本文所用,“核苷二磷酸”指包含核碱基(即,含氮碱基)、5-碳糖(例如,核糖或脱氧核糖)和二磷酸(即,焦磷酸)部分的葡基胺。在本文的一些实施方案中,“核苷二磷酸”缩写为“NDP”。核苷二磷酸的非限制性实例包括胞苷二磷酸(CDP)、尿苷二磷酸(UDP)、腺苷二磷酸(ADP)、鸟苷二磷酸(GDP)、胸苷二磷酸(TDP)和肌苷二磷酸(IDP)。术语“核苷”和“核苷酸”在一些背景下可以互换使用。
如本文所用,“核苷三磷酸”指包含核碱基(即,含氮碱基)、5-碳糖(例如,核糖或脱氧核糖)和三磷酸部分的葡基胺。在本文的一些实施方案中,“核苷三磷酸”缩写为“NTP”。核苷三磷酸的非限制性实例包括胞苷三磷酸(CTP)、尿苷三磷酸(UTP)、腺苷三磷酸(ATP)、鸟苷三磷酸(GTP)、胸苷三磷酸(TTP)和肌苷三磷酸(ITP)。术语“核苷”和“核苷酸”在一些背景下可以互换使用。
如本文所用,“保守氨基酸取代”指用具有相似侧链的不同残基取代残基,并且因此通常涉及用在相同或相似限定的氨基酸类别内的氨基酸取代多肽中的氨基酸。例如但不限于,在一些实施方案中,具有脂肪族侧链的氨基酸用另一种脂肪族氨基酸(例如,丙氨酸、缬氨酸、亮氨酸和异亮氨酸)进行取代;具有羟基侧链的氨基酸用具有羟基侧链的另一种氨基酸(例如,丝氨酸和苏氨酸)进行取代;具有芳香族侧链的氨基酸用具有芳香族侧链的另一种氨基酸(例如,苯丙氨酸、酪氨酸、色氨酸和组氨酸)进行取代;具有碱性侧链的氨基酸用具有碱性侧链的另一种氨基酸(例如,赖氨酸和精氨酸)进行取代;具有酸性侧链的氨基酸用具有酸性侧链的另一种氨基酸(例如,天冬氨酸和谷氨酸)进行取代;和/或疏水性或亲水性氨基酸分别用另一种疏水性或亲水性氨基酸进行替换。
如本文所用,“非保守取代”指用具有显著不同的侧链性质的氨基酸取代多肽中的氨基酸。非保守取代可以使用在限定的组之间而不是组内的氨基酸,并且影响(a)取代区域中的肽骨架的结构(例如,脯氨酸取代甘氨酸),(b)电荷或疏水性,或(c)侧链的体积。作为示例而非限制,示例性的非保守取代可以是用碱性或脂肪族氨基酸取代的酸性氨基酸;用小分子氨基酸取代的芳香族氨基酸;以及用疏水性氨基酸取代的亲水性氨基酸。
如本文所用,“缺失”指通过从参考多肽中去除一个或多个氨基酸,对于多肽的修饰。缺失可以包含去除构成参考酶的1个或多个氨基酸、2个或更多个氨基酸、5个或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸、或者20个或更多个氨基酸、氨基酸总数的最多10%、或氨基酸总数的最多20%,同时保留酶促活性和/或保留进化酶的改进性质。缺失可以针对多肽的内部部分和/或末端部分。在各个实施方案中,缺失可以包含连续区段或可以是不连续的。缺失通常在氨基酸序列中由“-”指示。
如本文所用,“插入”指通过添加来自参考多肽的一个或多个氨基酸,对于多肽的修饰。插入可以在多肽的内部部分,或者针对羧基或氨基末端。如本文所用,插入包括如本领域已知的融合蛋白。插入可以是邻接的氨基酸区段,或者通过天然存在的多肽中的一个或多个氨基酸分开。
术语“氨基酸取代集合”或“取代集合”指与参考序列相比,多肽序列中的一组氨基酸取代。取代集合可以具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15个或更多个氨基酸取代。
“功能片段”和“生物活性片段”在本文中可互换使用,以指具有氨基末端和/或羧基末端缺失和/或内部缺失的多肽,但其中剩余的氨基酸序列等同于它与之比较的序列中的相应位置,并且基本上保留全长多肽的所有活性。
如本文所用,“分离的多肽”指与天然伴随其的其它污染物(例如,蛋白质、脂质和多核苷酸)基本上分开的多肽。该术语涵盖已从其天然存在的环境或表达系统(例如,在宿主细胞内或经由体外合成)中取出或纯化的多肽。重组MTR激酶多肽可以存在于细胞内,存在于细胞培养基中,或以各种形式例如裂解物或分离的制剂进行制备。像这样,在一些实施方案中,重组MTR激酶多肽可以是分离的多肽。
如本文所用,“基本上纯的多肽”或“纯化的蛋白质”指其中多肽种类是存在的占优势种类的组合物(即,在摩尔或重量基础上,它比组合物中的任何其它各个大分子种类更丰富),并且当目标种类包含按摩尔或%重量计至少约50%的存在的大分子种类时,一般是基本上纯化的组合物。然而,在一些实施方案中,包含MTR激酶的组合物包含小于50%纯(例如,约10%、约20%、约30%、约40%或约50%)的MTR激酶。一般地,基本上纯的MTR激酶组合物包含按摩尔或%重量计约60%或更多、约70%或更多、约80%或更多、约90%或更多、约95%或更多、以及约98%或更多的组合物中存在的所有大分子种类。在一些实施方案中,目标种类被纯化至基本同质性(即,通过常规检测方法在组合物中无法检测到污染物种类),其中所述组合物基本上由单一大分子种类组成。溶剂种类、小分子(<500道尔顿)和元素离子种类不被视为大分子种类。在一些实施方案中,分离的重组MTR激酶多肽是基本上纯的多肽组合物。
“改善的酶性质”指与参考MTR激酶相比,显示出任何酶性质的改善的MTR激酶。对于本文所述的MTR激酶,一般与野生型MTR激酶多肽进行比较,尽管在一些实施方案中,参考MTR激酶可以是另一种改善的MTR激酶。对于其期望改善的酶性质包括但不限于酶促活性(其可以按照底物的百分比转换来表示)、热稳定性、pH活性谱、辅因子要求、对抑制剂的不应性(refractoriness)(例如,产物抑制)、立体特异性和立体选择性(包括对映选择性)。
“增加的酶促活性”指MTR激酶的改善性质,其可以通过与参考MTR激酶相比,比活性的增加(例如,所产生的产物/时间/重量蛋白质)、或底物向产物的百分比转换的增加(例如,使用指定量的MTR激酶,在指定时间段内起始量的底物向产物的百分比转换)来表示。实施例中提供了确定酶活性的示例性方法。与酶活性有关的任何性质都可能受到影响,包括Km、Vmax或kcat的经典酶性质,所述性质的改变可以导致酶促活性的增加。酶活性的改善可以是相应的野生型MTR激酶多肽的酶促活性的约1.5倍到天然存在的MTR激酶或MTR激酶多肽由其衍生的另一种MTR激酶的酶促活性的多达2倍、5倍、10倍、20倍、25倍、50倍、75倍、100倍、150倍、200倍、500倍、1000倍、3000倍、5000倍、7000倍或更多倍。在具体实施方案中,MTR激酶多肽显示出在亲本MTR激酶多肽的150至3000倍、3000至7000倍或多于7000倍的范围内的酶促活性改善。技术人员应理解,任何酶的活性都受到扩散限制,使得催化周转率无法超过底物包括任何所需辅因子的扩散率。扩散极限或kca/Km的理论最大值一般为约108至109(M-1s-1)。因此,MTR激酶的酶活性的任何改善将具有与MTR激酶作用于其的底物的扩散速率相关的上限。MTR激酶活性可以通过以下进行测量:用于测量激酶活性的任何一种标准测定,或者经由使用核苷磷酸化酶的偶联测定,所述核苷磷酸化酶能够催化MTR激酶产物和核苷碱基之间的反应以提供核苷,或者用于测定化学反应的任何传统方法,包括但不限于HPLC、HPLC-MS、UPLC、UPLC-MS、TLC和NMR。酶活性的比较使用限定的酶制剂、在设定条件下的限定测定和一种或多种限定的底物来进行,如本文进一步详细描述的。一般地,当比较裂解物时,确定细胞的数目和所测定的蛋白质的量以及使用相同的表达系统和相同的宿主细胞,以使通过宿主细胞产生的和裂解物中存在的酶量的变化降到最低。
如本文所用,“载体”是用于将DNA序列引入细胞内的DNA构建体。在一些实施方案中,载体是可操作地连接到合适的控制序列的表达载体,所述控制序列能够影响DNA序列中编码的多肽在合适宿主中的表达。在一些实施方案中,“表达载体”具有可操作地连接到DNA序列(例如,转基因)的启动子序列,以驱动宿主细胞中的表达,并且在一些实施方案中,还包含转录终止子序列。
如本文所用,术语“表达”包括涉及多肽生产的任何步骤,包括但不限于转录、转录后修饰、翻译和翻译后修饰。在一些实施方案中,该术语还包括多肽从细胞中的分泌。
如本文所用,术语“生产”指通过细胞的蛋白质和/或其它化合物生产。预期该术语包括涉及多肽生产的任何步骤,包括但不限于转录、转录后修饰、翻译和翻译后修饰。在一些实施方案中,该术语还包括多肽从细胞中的分泌。
如本文所用,氨基酸或核苷酸序列(例如,启动子序列、信号肽、终止子序列等)对于它与之可操作地连接的另一种序列是“异源的”,如果这两种序列在自然界中不相关的话。例如,“异源多核苷酸”是通过实验室技术引入宿主细胞内的任何多核苷酸,并且该术语包括从宿主细胞中取出,经受实验室操作,且然后再引入宿主细胞内的多核苷酸。
如本文所用,术语“宿主细胞”和“宿主菌株”指关于包含本文提供的DNA(例如,编码MTR激酶变体的多核苷酸)的表达载体的合适宿主。在一些实施方案中,宿主细胞是已用载体转化或转染的原核或真核细胞,所述载体使用如本领域已知的重组DNA技术进行构建。
术语“类似物”意指与参考多肽具有多于70%序列同一性,但小于100%序列同一性(例如多于75%、78%、80%、83%、85%、88%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性)的多肽。在一些实施方案中,“类似物”意指含有一个或多个非天然存在的氨基酸残基,包括但不限于高精氨酸、鸟氨酸和正缬氨酸,以及天然存在的氨基酸的多肽。在一些实施方案中,类似物还包括一个或多个D-氨基酸残基以及在两个或更多个氨基酸残基之间的非肽键合。
如本文所用,“EC”编号指国际生物化学和分子生物学联合会命名委员会(Nomenclature Committee of the International Union of Biochemistry andMolecular Biology)(NC-IUBMB)的酶命名法。IUBMB生物化学分类是基于其催化的化学反应,用于酶的数字分类系统。
如本文所用,“ATCC”指美国典型培养物保藏中心,其生物储存库集合包括基因和菌株。
如本文所用,“NCBI”指美国国家生物信息中心(National Center forBiological Information)及其中提供的序列数据库。
“编码序列”指编码蛋白质的氨基酸序列的核酸(例如,基因)的一部分。
“天然存在的”或“野生型”指在自然界中发现的形式。例如,天然存在的或野生型多肽或多核苷酸序列是生物中存在的序列,其可以从自然界中的来源分离,并且尚未通过人为操作进行有意修饰。在本文中,“野生型”多肽或多核苷酸序列可以表示为“WT”。
当关于例如细胞、核酸或多肽使用时,“重组”指一种材料、或者与该材料的天然或自然形式相对应的材料,其已以否则在自然界中不存在的方式进行修饰,或者与其相同但由合成材料和/或通过使用重组技术的操作而产生或衍生。非限制性实例尤其包括表达在自然(非重组)形式的细胞内并未发现的基因,或表达以不同水平另外表达的自然基因的重组细胞。
“序列同一性的百分比”、“百分比同一性(percent identity)”和“百分比同一性(percent identical)”在本文中用于指多核苷酸序列或多肽序列之间的比较,并且通过在比较窗口上比较两个最佳比对的序列来确定,其中在比较窗口中的多核苷酸或多肽序列的一部分可以包含与参考序列相比的添加或缺失(即,空位),用于两个序列的最佳比对。百分比通过以下进行计算:确定在其处相同的核酸碱基或氨基酸残基在两个序列中出现的位置数目,或者核酸碱基或氨基酸残基伴随空位进行比对以产生匹配位置的数目,将匹配位置的数目除以比较窗口中的位置总数目,并且将结果乘以100以得到序列同一性的百分比。使用BLAST和BLAST 2.0算法(参见例如,Altschul等人,1990,J.MOL.BIOL.215:403-410;以及Altschul等人,1977,NUCLEIC ACIDS RES.3389-3402),来执行最佳比对和百分比序列同一性的确定。用于执行BLAST分析的软件可通过美国国家生物技术信息中心(NationalCenter for Biotechnology Information)网站公开获得。
简言之,BLAST分析涉及首先通过在查询序列中鉴定长度为W的短词来鉴定高评分序列对(HSP),当与数据库序列中相同长度的词比对时,所述短词匹配或满足某个正值阈值评分T。T被称为邻域词评分阈值(Altschul等人,同上)。这些初始的邻域词命中充当启动搜索的种子,以查找含有其的更长HSP。词命中然后沿着每个序列在两个方向上扩展,直到累积比对评分可以增加为止。对于核苷酸序列,使用参数M(关于一对匹配残基的奖励评分;始终>0)和N(关于不匹配残基的惩罚评分;始终<0)来计算累积评分。对于氨基酸序列,使用评分矩阵来计算累积评分。在以下情况下,词命中在每个方向上的扩展停止:累积比对评分从其最大实现值下降数量X;由于一个或多个负评分残基比对的积累,累积评分变为零或更低;或到达任一序列的端部。BLAST算法参数W、T和X决定了比对的灵敏度和速度。BLASTN程序(用于核苷酸序列)使用字长(W)11、期望值(E)10、M=5、N=-4和两条链的比较作为缺省值。对于氨基酸序列,BLASTP程序使用字长(W)3、期望值(E)10和BLOSUM62评分矩阵(参见Henikoff和Henikoff,1989,PROC.NATL.ACAD.SCI.USA 89:10915)作为缺省值。
在提供两个序列的同一性百分比方面,功能类似于BLAST的众多其它算法是可获得的。用于比较的序列的最佳比对可以例如通过以下进行:Smith和Waterman,1981,ADV.APPL.MATH.2:482的局部同源性算法,Needleman和Wunsch,1970,J.MOL.BIOL.48:443的同源性比对算法,Pearson和Lipman,1988,N USA 85:2444的相似性搜索方法,这些算法的计算机化实现(GCG Wisconsin Software Package中的GAP、BESTFIT、FASTA和TFASTA),或目视检查(一般参见,Current Protocols in Molecular Biology,F.M.Ausubel等人,编,Current Protocols,ajoint venture between Greene Publishing Associates,Inc.and John Wiley&Sons,Inc.,(1995Supplement)(Ausubel))。另外,序列比对和百分比序列同一性的确定可以采用GCG Wisconsin Software包(Accelrys,Madison WI)中的BESTFIT或GAP程序,使用提供的默认参数。
“基本同一性”指在至少20个残基位置的比较窗口上,通常在至少30-50个残基的窗口上,与参考序列相比,具有至少80%的序列同一性,优选至少85%的序列同一性,更优选至少89%的序列同一性,更优选至少95%的序列同一性,且甚至更优选至少99%的序列同一性的多核苷酸或多肽序列,其中所述序列同一性的百分比通过以下进行计算:在比较窗口上,将参考序列与包括参考序列的总共20%或更少的缺失或添加的序列进行比较。在应用于多肽的具体实施方案中,术语“基本同一性”意指当例如通过程序GAP或BESTFIT使用默认空位权重进行最佳比对时,两个多肽序列共享至少80%的序列同一性,优选至少89%的序列同一性,更优选至少95%的序列同一性或更多(例如,99%的序列同一性)。优选地,不相同的残基位置因保守氨基酸取代而不同。
当在给定氨基酸或多核苷酸序列的编号的上下文中使用时,“对应于”、“参考”或“相对于”指当给定的氨基酸或多核苷酸序列与参考序列进行比较时,指定的参考序列的残基的编号。换言之,给定聚合物的残基编号或残基位置关于参考序列进行指定,而不是通过残基在给定氨基酸或多核苷酸序列内的实际数字位置进行指定。例如,给定的氨基酸序列,例如MTR激酶的氨基酸序列,可以通过引入空位以优化两个序列之间的残基匹配,与参考序列进行比对。在这些情况下,尽管存在空位,但给定氨基酸或多核苷酸序列中残基的编号关于它已与之进行比对的参考序列进行。
“立体选择性”指在化学或酶促反应中一种立体异构体超过另一种的优先形成。立体选择性可以是部分的,其中一种立体异构体的形成有利地超过另一种,或者它可以是完全的,其中仅形成一种立体异构体。当立体异构体是对映异构体时,立体选择性被称为对映选择性,一种对映异构体在两者的总和中的分数(通常报告为百分比)。它在本领域中通常可替代地报告为根据式(主要对映异构体-次要对映异构体)/(主要对映异构体+次要对映异构体),由其计算的对映体过量(EE)(通常报告为百分比)。当立体异构体是非对映异构体时,立体选择性被称为非对映选择性,一种非对映异构体在两种非对映异构体的混合物中的分数(通常报告为百分比),通常可替代地报告为非对映体过量(DE)。对映体过量和非对映体过量是立体异构体过量的类型。
“高度立体选择性”指能够将底物转换为其相应产物的化学或酶促反应,伴随至少约85%的立体异构体过量。
“化学选择性”指在化学或酶促反应中,一种产物超过另一种的优先形成。
“转换”指底物向相应产物的酶促转化。“百分比转换”指在指定条件下在一段时间内底物转换为产物的百分比。因此,例如,MTR激酶多肽的“酶促活性”或“活性”可以表示为底物向产物的“百分比转换”。
“手性醇”指具有通式R1-CH(OH)-R2的胺,其中R1和R2不相同并且在本文中以其最广泛的意义使用,包括广泛各种不同和混合官能类型的脂肪族和脂环族化合物,其特征在于存在与仲碳原子结合的伯羟基,除氢原子之外,所述仲碳原子还携带(i)形成手性环状结构的二价基团,或(ii)在结构或手性方面彼此不同的两个取代基(除氢外)。形成手性环状结构的二价基团包括例如2-甲基丁烷-1,4-二基、戊烷-1,4-二基、己烷-1,4-二基、己烷-1,5-二基、2-甲基戊烷-1,5-二基。在仲碳原子上的两个不同取代基(上文的R1和R2)也可以广泛不同,并且包括烷基、芳烷基、芳基、卤素、羟基、低级烷基、低级烷氧基、低级烷硫基、环烷基、羧基、烷氧羰基(carboalkoxy)、氨基甲酰基、单-和二-(低级烷基)取代的氨基甲酰基、三氟甲基、苯基、硝基、氨基、单-和二-(低级烷基)取代的氨基、烷基磺酰基、芳基磺酰基、烷基甲酰氨基(alkylcarboxamido)、芳基甲酰氨基等,以及由前述取代的烷基、芳烷基或芳基。
固定化的酶制剂具有许多公认的优点。例如,它们可以对酶制剂赋予贮存期限,它们可以改善反应稳定性,它们可以允许在有机溶剂中的稳定性,它们可以有助于从反应流中去除蛋白质。“稳定的”指固定化酶在含有有机溶剂的溶剂系统中保留其结构构象和/或其活性的能力。在含有有机溶剂的溶剂系统中,稳定的固定化酶丧失少于10%的活性/小时。在含有有机溶剂的溶剂系统中,稳定的固定化酶丧失少于9%的活性/小时。优选地,在含有有机溶剂的溶剂系统中,稳定的固定化酶丧失少于8%的活性/小时。优选地,在含有有机溶剂的溶剂系统中,稳定的固定化酶丧失少于7%的活性/小时。优选地,在含有有机溶剂的溶剂系统中,稳定的固定化酶丧失少于6%的活性/小时。优选地,在含有有机溶剂的溶剂系统中,稳定的固定化酶丧失少于5%的活性/小时。优选地,在含有有机溶剂的溶剂系统中,稳定的固定化酶丧失少于4%的活性/小时。优选地,在含有有机溶剂的溶剂系统中,稳定的固定化酶丧失少于3%的活性/小时。优选地,在含有有机溶剂的溶剂系统中,稳定的固定化酶丧失少于2%的活性/小时。优选地,在含有有机溶剂的溶剂系统中,稳定的固定化酶丧失少于1%的活性/小时。
“热稳定的”指与未处理的酶相比,在暴露于升高的温度(例如,40-80℃)一段时间(例如,0.5-24小时)后,维持相似活性(例如,多于60%至80%)的MTR激酶多肽。
“溶剂稳定的”指与未处理的酶相比,在暴露于不同浓度(例如,5-99%)的溶剂(异丙醇、四氢呋喃、2-甲基四氢呋喃、丙酮、甲苯、乙酸丁酯、甲基叔丁基醚等)一段时间(例如,0.5-24小时)后,维持相似活性(例如,多于60%至80%)的MTR激酶多肽。
“pH稳定的”指与未处理的酶相比,在暴露于高或低pH(例如4.5-6或8至12)一段时间(例如,0.5-24小时)后,维持相似活性(例如,多于60%至80%)的MTR激酶多肽。
“热稳定和溶剂稳定的”指既是热稳定的又是溶剂稳定的MTR激酶多肽。
如本文所用,术语“生物催化”、“生物催化的”、“生物转化”和“生物合成”指使用酶对有机化合物执行化学反应。
术语“有效量”意指足以产生所需结果的量。本领域的普通技术人员可以通过使用常规实验来确定有效量。
术语“分离的”和“纯化的”用于指从它与之天然相关的至少一种其它组分中取出的分子(例如,分离的核酸、多肽等)或其它组分。术语“纯化的”并不要求绝对纯度,而是意图作为相对定义。
如本文所用,“S-甲基硫核糖激酶”或“MTR激酶”指具有磷酸化S-甲基-5-硫核糖的酶促能力的多肽。多肽可以使用辅因子,例如二价阳离子,包括Mg2+、Ca2+、Mn2+或Co2+,并且使用ATP或另一种核苷酸三磷酸作为辅因子,从其中它将磷酸基残基转移到底物。如本文所用,MTR激酶包括天然存在的(野生型)MTR激酶以及通过人为操作生成的非天然存在的多肽。
本领域的技术人员将认识到手性化合物,且特别是糖,可以用多种不同的等价方式进行描绘。本领域技术人员将进一步认识到核糖上的取代基的身份和区域化学位置可以广泛变化,并且无论取代基如何,立体化学等价的相同原理都适用。此类等价的非限制性实例包括下文举例说明的那些。
MTR激酶
本公开涉及能够将核糖和核糖衍生物磷酸化为相应的α-1-磷酸糖(或其盐)的MTR激酶多肽,所述α-1-磷酸糖是另一种核苷磷酸化酶的底物,所述另一种核苷磷酸化酶然后可以在核苷合成中用于将1-磷酸酯转换为核苷,特别是5-异丁酰核糖,其可以转换为5′-异丁酰核苷,特别是5′-异丁酰尿苷。在实施方案中,MTR激酶能够进行下述转换:
在特定实施方案中,MTR激酶多肽能够进行下述转换:
在此类实施方案中,磷酸化化合物可以是盐的形式。
在实施方案中,本文所述的MTR激酶优先将核糖和5-异丁酰核糖磷酸化为α形式。此处显示了D-核糖1-磷酸的α形式用于说明目的。
此处还显示了D-核糖1-磷酸的β形式,用于比较和说明的目的。
在实施方案中,本文所述的MTR激酶多肽具有的氨基酸序列与野生型MTR激酶或修饰的MTR激酶的参考氨基酸序列相比具有一个或多个氨基酸差异,其导致酶关于限定底物的改善性质。
本文所述的MTR激酶多肽是从商购可得的野生型MTR激酶定向进化的产物,其已被表征为MTR激酶(参见Kenneth A.Cornell等人,317BIOCHEM.J.285-290(1996)),并且具有如下文SEQ ID NO:1中所示的氨基酸序列。
在特定情况下,野生型MTR激酶可以由如下文SEQ ID NO:2中所示的DNA序列编码。
在实施方案中,本公开的MTR激酶多肽可以证实相对于SEQ ID NO:1的MTR激酶的改善,例如酶活性、立体选择性、立体特异性、热稳定性、溶剂稳定性或磷酸化产物抑制的增加。
在实施方案中,本公开的MTR激酶多肽可以证实酶促促活性的速率,即,将底物转换为产物的速率的改善。在一些实施方案中,MTR激酶是能够将底物转换为产物的多肽,其速率是通过SEQ ID NO:1的酶显示出的速率的至少1.5倍、2倍、3倍、4倍、5倍、10倍、25倍或50倍。
在一些实施方案中,此类MTR激酶是也能够将底物转换为产物的多肽,伴随至少约80%的百分比非对映体过量。在一些实施方案中,此类MTR激酶是也能够将底物转换为产物的多肽,伴随至少约90%的百分比非对映体过量。在一些实施方案中,此类MTR激酶是也能够将底物转换为产物的多肽,伴随至少约99%的百分比非对映体过量。
在一些实施方案中,MTR激酶多肽是高度立体选择性的,其中所述多肽可以以大于约99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%或99.9%的非对映体过量,将底物磷酸化为产物。
在实施方案中,本文所述的MTR激酶包括具有如下文SEQ ID NO:3中所示的氨基酸序列的多肽。
在特定情况下,包含如上文SEQ ID NO:3中所示的氨基酸序列的多肽可以由如下文中SEQ ID NO:4中所示的DNA序列编码。
/>
在另外的实施方案中,本文所述的MTR激酶包括具有如下文SEQ ID NO:5中所示的氨基酸序列的多肽。
在特定情况下,包含如上文SEQ ID NO:5中所示的氨基酸序列的多肽可以由如下文中SEQ ID NO:6中所示的DNA序列编码。
/>
在另外的实施方案中,本文所述的MTR激酶包括具有如下文SEQ ID NO:7中所示的氨基酸序列的多肽。
在特定情况下,包含如上文SEQ ID NO:7中所示的氨基酸序列的多肽可以由如下文中SEQ ID NO:8中所示的DNA序列编码。
/>
在该第一情形的特定情况下,本文所述的MTR激酶包括具有如下文SEQ ID NO:9中所示的氨基酸序列的多肽。
在此类情况的特定实例中,包含如上文SEQ ID NO:9中所示的氨基酸序列的多肽可以由如下文中SEQ ID NO:10中所示的DNA序列编码。
在该第一情形的特定情况下,本文所述的MTR激酶包括具有如下文SEQ ID NO:11中所示的氨基酸序列的多肽。
在该第一情形的特定情况下,本文所述的MTR激酶包括具有如下文SEQ ID NO:12中所示的氨基酸序列的多肽。
在一些实施方案中,本公开的改善的MTR激酶是基于SEQ ID NO:1、3、5、7、9、11或12的氨基酸序列的多肽,并且可以包含与SEQ ID NO:1、3、5、7、9、11或12的参考序列至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列。这些差异可以是氨基酸插入、缺失、取代或此类改变的任何组合。在一些情况下,氨基酸序列差异可以包含非保守的氨基酸取代、保守的氨基酸取代、以及非保守的氨基酸取代和保守的氨基酸取代的组合。
在一些实施方案中,本公开的改善的MTR激酶是由SEQ ID NO:2、4、6、8或10的DNA序列编码的多肽,并且可以包含与SEQ ID NO:2、4、6、8或10的翻译的参考序列至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的序列。这些差异可以是氨基酸插入、缺失、取代或此类改变的任何组合。在一些情况下,序列差异可以包含非保守的氨基酸取代、保守的氨基酸取代、以及非保守的氨基酸取代和保守的氨基酸取代的组合。
另外的实施方案提供了包含本文所述的多核苷酸和/或表达载体的宿主细胞。宿主细胞可以是大肠杆菌(E.coli),或者它们可以是不同的生物。宿主细胞可以用于表达和分离本文所述的MTR激酶,或者可替代地,它们可以直接用于将底物转换为立体异构产物。
无论是用全细胞、细胞提取物还是纯化的MTR激酶进行该方法,都可以使用单一的MTR激酶,或者可替代地,可以使用两种或更多种MTR激酶的混合物。
实施方案涉及能够在核苷的合成中选择性制备α-1-磷酸糖的MTR激酶多肽。在实施方案中,MTR激酶多肽能够进行下述转换:
在特定实施方案中,MTR激酶多肽能够进行下述转换:
在此类实施方案中,α-1-磷酸糖可以是盐的形式。
对于其期望改善的酶性质包括但不限于酶促活性、热稳定性、pH活性谱、辅因子要求、对抑制剂的不应性(例如,产物抑制)、立体特异性、立体选择性和溶剂稳定性。这些改善可以涉及单一的酶性质例如酶促活性,或不同酶性质的组合例如酶促活性和立体选择性。
下表1提供了本文公开的具有相关活性的SEQ ID NO列表。下文氨基酸序列基于SEQ ID NO:1的MTR激酶多肽序列,除非另有说明。在下表中,每行列出了一个SEQ ID NO。列出突变数目(即,残基改变)的列指与SEQ ID NO:1的MTR激酶多肽序列相比的氨基酸取代数目。在表1中,“d.r.”用于表示“非对映体比率”。第一个数字表示其为5′-异丁酰-α-核糖-1-磷酸形式的产物的分数,而第二个数字表示其为5′-异丁酰-β-核糖-1-磷酸的产物的分数。
表1:MTR激酶多肽的酶促活性
表1:MTR激酶多肽的酶促活性
编码MTR激酶的多核苷酸
在另一个方面,本公开提供了编码本文公开的MTR激酶的多核苷酸。多核苷酸可以可操作地连接到控制基因表达的一个或多个异源调控序列,以产生能够表达多肽的重组多核苷酸。可以将含有编码MTR激酶的异源多核苷酸的表达构建体引入适当的宿主细胞内,以表达相应的MTR激酶多肽。
由于对应于各种氨基酸的密码子的了解,蛋白质序列的可用性提供了能够编码主题的所有多核苷酸的描述。其中相同的氨基酸由替代密码子或同义密码子编码的遗传密码的简并性,允许制备极其大量的核酸,其全部编码本文公开的改善的MTR激酶。因此,在鉴定了特定的氨基酸序列后,本领域技术人员可以通过简单地修饰一个或多个密码子的序列来制备任何数目的不同核酸,其方式并不改变蛋白质的氨基酸序列。在这方面,本公开具体考虑了可以通过基于可能的密码子选择来选择组合进行制备的多核苷酸的每种和每一种可能的变化,并且所有此类变化都被视为对于本文公开的任何多肽具体公开。
在各个实施方案中,密码子优选地选择为适合待在其中产生蛋白质的宿主细胞。例如,细菌中使用的优选密码子用于在细菌中表达基因;酵母中使用的优选密码子用于在酵母中的表达;并且哺乳动物中使用的优选密码子用于在哺乳动物细胞中的表达。例如,SEQ ID NO:2的多核苷酸已对于在大肠杆菌中的表达进行密码子优化。
在某些实施方案中,不需要替换所有密码子来优化MTR激酶的密码子使用,由于天然序列将包含优选密码子,并且因为优选密码子的使用可能并非所有氨基酸残基需要的。因而,编码MTR激酶的密码子优化的多核苷酸可以含有在全长编码区的约40%、50%、60%、70%、80%或大于90%密码子位置处的优选密码子。
在各个实施方案中,编码改善的MTR激酶多肽的分离的多核苷酸可以以各种方式进行操作,以提供多肽的表达。取决于表达载体,分离的多核苷酸在其插入载体内之前的操作可能是期望的或必需的。利用重组DNA方法用于修饰多核苷酸和核酸序列的技术是本领域众所周知的。指导在以下中提供:Sambrook等人,2001,MOLECULAR CLONING:ALABORATORY MANUAL,第3版,Cold Spring Harbor Laboratory Press;以及CURRENTPROTOCOLS IN MOLECULAR BIOLOGY,Ausubel.F.编,Greene Pub.Associates,1998,更新至2006年。
在一些实施方案中,编码本文任何MTR激酶多肽的分离的多核苷酸以各种方式进行操作,以促进MTR激酶多肽的表达。在一些实施方案中,编码MTR激酶多肽的多核苷酸包含表达载体,其中存在一个或多个控制序列,以调控MTR激酶多肽的表达。取决于所利用的表达载体,分离的多核苷酸在其插入载体内之前的操作可能是期望的或必需的。利用重组DNA方法用于修饰多核苷酸和核酸序列的技术是本领域众所周知的。在一些实施方案中,控制序列尤其包括启动子、前导序列、聚腺苷酸化序列、前肽序列、信号肽序列和转录终止子。在一些实施方案中,合适的启动子基于宿主细胞的选择进行选择。对于细菌宿主细胞,用于指导本公开的核酸构建体转录的合适启动子包括但不限于从大肠杆菌lac操纵子获得的启动子、由T7 RNA聚合酶结合位点随后为lac操纵子序列组成的杂合启动子。另外,合适的启动子可以包括天蓝色链霉菌(Streptomyces coelicolor)琼脂糖酶基因(dagA)、枯草芽孢杆菌(Bacillus subtilis)果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌(Bacilluslicheniformis)α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌(Bacillusstearothermophilus)产麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌(Bacillusamyloliquefaciens)α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因、以及原核β-内酰胺酶基因(参见例如,Villa-Kamaroff等人,PROC.NATL ACAD.SCI.USA 75:3727-3731(1978))、以及tac启动子(参见例如,DeBoer等人,PROC.NATLACAD.SCI.USA 80:21-25(1983))。
在一些实施方案中,控制序列也是合适的转录终止子序列(即,被宿主细胞识别以终止转录的序列)。在一些实施方案中,终止子序列可操作地连接到编码酶多肽的核酸序列的3′末端。在所选宿主细胞中有功能的任何合适的终止子都可用于本公开中。用于大肠杆菌的示例性转录终止子包括T7终止子。
在一些实施方案中,控制序列也是合适的前导序列(即,对于通过宿主细胞的翻译重要的mRNA的非翻译区)。在一些实施方案中,前导序列可操作地连接到编码MTR激酶的核酸序列的5′末端。在所选宿主细胞中有功能的任何合适的前导序列都可用于本公开中。用于大肠杆菌的示例性前导区将编码核糖体结合位点。
在一些实施方案中,还利用调控序列。这些序列促进调控相对于宿主细胞生长的多肽表达。调控系统的实例是响应化学或物理刺激包括调控化合物的存在,促使基因的表达开启或关闭的那些系统。在原核宿主细胞中,合适的调控序列包括但不限于lac、tac和trp操纵子系统。在酵母宿主细胞中,合适的调控系统包括但不限于ADH2系统或GAL1系统。在丝状真菌中,合适的调控序列包括但不限于TAKA α-淀粉酶启动子、黑曲霉(Aspergillusniger)葡糖淀粉酶启动子和米曲霉(Aspergillus oryzae)葡糖淀粉酶启动子。
在另一个方面,本公开涉及重组表达载体,其包含编码MTR激酶多肽的多核苷酸,以及一个或多个表达调控区,例如启动子和终止子、复制起点等,取决于它们待引入其内的宿主类型。在一些实施方案中,将本文所述的各种核酸和控制序列连接在一起,以产生重组表达载体,其包括一个或多个方便的限制性位点,以允许编码酶多肽的核酸序列在此类位点处的插入或取代。可替代地,在一些实施方案中,通过将核酸序列或包含该序列的核酸构建体插入适当的表达载体内来表达本公开的核酸序列。在涉及产生表达载体的一些实施方案中,编码序列定位于载体中,使得编码序列与适当的表达控制序列可操作地连接。
重组表达载体可以是任何合适的载体(例如,质粒或病毒),其可以方便地经受重组DNA程序并引起酶多核苷酸序列的表达。载体的选择通常取决于载体与载体待引入其内的宿主细胞的相容性。载体可以是线性或闭合环状质粒。
在一些实施方案中,表达载体是自主复制载体(即,作为染色体外实体存在的载体,其复制不依赖于染色体复制,例如质粒、染色体外元件、微染色体或人工染色体)。载体可以含有确保用于自我复制的任何手段。在一些可替代实施方案中,载体是这样的载体,其中当引入宿主细胞内时,它被整合到基因组内,并且连同它已整合到其内的染色体一起复制。此外,在一些实施方案中,利用单一载体或质粒、或者一起含有待引入宿主细胞的基因组内的总DNA的两种或更多种载体或质粒、和/或转座子。
在一些实施方案中,表达载体含有一种或多种可选择标记物,其允许转化细胞的容易选择。“可选择标记物”是一种基因,其产物提供杀生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养型等等。细菌可选择标记物的实例包括但不限于来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或者赋予抗生素抗性例如氨苄青霉素、卡那霉素、氯霉素或四环素抗性的标记物。用于酵母宿主细胞的合适标记物包括但不限于ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于丝状真菌宿主细胞中的可选择标记物包括但不限于amdS(乙酰胺酶;例如,来自构巢曲霉(A.nidulans)或米曲霉)、argB(鸟氨酸氨甲酰基转移酶)、bar(草胺膦乙酰转移酶;例如,来自吸水链霉菌(S.hygroscopicus))、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷-5′-磷酸脱羧酶;例如,来自构巢曲霉或米曲霉)、sC(硫酸腺苷酰转移酶)和trpC(邻氨基苯甲酸合酶)以及其等价物。
在另一个方面,本公开提供了包含编码本公开的至少一种MTR激酶的至少一种多核苷酸的宿主细胞,该多核苷酸可操作地连接到一个或多个控制序列,用于在宿主细胞中表达至少一种MTR激酶。适用于表达由本公开的表达载体编码的多肽的宿主细胞是本领域众所周知的,并且包括但不限于细菌细胞,例如大肠杆菌、河流弧菌(Vibrio fluvialis)、链霉菌属(Streptomyces)和鼠伤寒沙门氏菌(Salmonella typhimurium)细胞;真菌细胞,例如酵母细胞(例如酿酒酵母(Saccharomyces cerevisiae)或巴斯德毕赤酵母(Pichiapastoris)(ATCC登录号201178))。示例性宿主细胞还包括各种大肠杆菌菌株(例如,W3110(△fhuA)和BL21)。细菌可选择标记物的实例包括但不限于来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或者赋予抗生素抗性例如氨苄青霉素、卡那霉素、氯霉素和或四环素抗性的标记物。
在一些可替代的实施方案中,表达载体含有另外的核酸序列,用于指导通过同源重组整合到宿主细胞的基因组内。另外的核酸序列使载体能够在染色体中的精确位置处整合到宿主细胞基因组内。为了增加在精确位置处整合的可能性,整合元件优选含有足够数目的核苷酸,例如100至10,000个碱基对,优选400至10,000个碱基对,且最优选800至10,000个碱基对,其与相应的靶序列是高度同源的,以增强同源重组的概率。整合元件可以是与宿主细胞的基因组中的靶序列同源的任何序列。此外,整合元件可以是非编码或编码核酸序列。另一方面,载体可以通过非同源重组整合到宿主细胞的基因组内。
对于自主复制,载体可以进一步包含使载体能够在所讨论的宿主细胞中自主复制的复制起点。细菌复制起点的实例是P15A ori,或者允许在大肠杆菌中的复制的质粒pBR322、pUC19、pACYC177(其含有P15A ori)或pACYC184(其含有P15A ori)的复制起点,以及允许在芽孢杆菌属(Bacillus)中的复制的pUB110、pE194或pTA1060。用于酵母宿主细胞中的复制起点的实例是2微米复制起点、ARS 1、ARS4、ARS 1和CEN3的组合、以及ARS4和CEN6的组合。复制起点可以是具有使得其功能在宿主细胞中温度敏感的突变的复制起点(参见例如,Ehrlich,Proc.Natl.Acad.Sci.USA 75:1433(1978))。
在一些实施方案中,将本公开的核酸序列的多于一个拷贝插入宿主细胞内,以增加基因产物的产生。核酸序列的拷贝数的增加可以通过以下获得:将该序列的至少一个另外拷贝整合到宿主细胞基因组内,或将可扩增的可选择标记物基因与核酸序列包括在一起,其中通过在适当的选择剂的存在下培养细胞,可以选择含有可选择标记物基因的扩增拷贝,以及从而包含核酸序列的另外拷贝的细胞。
用于本公开中的许多表达载体是商购可得的。合适的商业表达载体包括但不限于NovagenTM的pET大肠杆菌T7表达载体(Millipore Sigma)和p3xFLAGTM表达载体(Sigma-Aldrich Chemicals)。其它合适的表达载体包括但不限于pBluescriptII SK(-)和pBK-CMV(Stratagene),以及衍生自pBR322(Gibco BRL)、pUC(Gibco BRL)、pREP4、pCEP4(Invitrogen)或pPoly(参见例如,Lathe等人,Gene 57:193-201(1987))的质粒。
因此,在一些实施方案中,将包含编码至少一种变体MTR激酶的序列的载体转化到宿主细胞内,以便允许载体的繁殖和变体MTR激酶的表达。在一些实施方案中,上述转化的宿主细胞在合适的营养培养基中在允许变体MTR激酶表达的条件下进行培养。可用于培养宿主细胞的任何合适的培养基可用于本公开,包括但不限于含有适当补充物的基本或复杂培养基。在一些实施方案中,宿主细胞在HTP培养基中生长。合适的培养基可从各种商业供应商获得,或可以根据公布的配方(例如,在美国典型培养物保藏中心的目录中)进行制备。
用于表达MTR激酶的宿主细胞
在另一个方面,本公开提供了包含编码本公开的改善的MTR激酶多肽的多核苷酸的宿主细胞,该多核苷酸可操作地连接到一个或多个控制序列,用于在宿主细胞中表达MTR激酶。用于表达由本公开的表达载体编码的MTR激酶多肽的宿主细胞是本领域众所周知的,并且包括但不限于细菌细胞,例如产气克雷伯氏菌(Klebsiella aerogenes)、肺炎克雷伯氏菌(Klebsiella pneunoniae)、大肠杆菌、枯草芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌(B.megaterium)、嗜热脂肪芽孢杆菌、解淀粉芽孢杆菌、Lactobacillus kejir、短乳杆菌(Lactobacillus brevis)、微小乳杆菌(Lactobacillus minor)、链霉菌属和鼠伤寒沙门氏菌细胞;真菌细胞,例如酵母细胞(例如酿酒酵母或巴斯德毕赤酵母(ATCC登录号201178))。用于上述宿主细胞的适当培养基和生长条件是本领域众所周知的。
可以通过本领域已知的各种方法将用于表达MTR激酶的多核苷酸引入细胞内。技术尤其包括电穿孔、生物弹道粒子轰击、脂质体介导的转染、氯化钙转染和原生质体融合。用于将多核苷酸引入细胞内的各种方法对技术人员将是显而易见的。
在本公开的一些实施方案中,丝状真菌宿主细胞属于任何合适的属和种,包括但不限于绵霉属(Achlya)、枝顶孢霉属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、黑管菌属(Bjerkandera)、拟蜡菌属(Ceriporiopsis)、头孢霉属(Cephalosporium)、金孢子菌属(Chrysosporium)、旋孢腔菌属(Cochliobolus)、棒囊壳属(Corynascus)、隐丛赤壳菌属(Cryphonectria)、隐球菌属(Cryptococcus)、鬼伞属(Coprinus)、革盖菌属(Coriolus)、色二孢属(Diplodia)、Endothis、镰刀菌属(Fusarium)、赤霉属(Gibberella)、粘帚霉属(Gliocladium)、腐质霉属(Humicola)、肉座菌属(Hypocrea)、毁丝霉属(Myceliophthora)、毛霉属(Mucor)、脉孢菌属(Neurospora)、青霉属(Penicillium)、柄孢壳菌属(Podospora)、射脉菌属(Phlebia)、梨囊鞭菌属(Piromyces)、梨孢属(Pyricularia)、根毛霉属(Rhizomucor)、根霉属(Rhizopus)、裂褶菌属(Schizophyllum)、柱霉属(Scytalidium)、侧孢霉属(Sporotrichum)、篮状菌属(Talaromyces)、耐热囊菌属(Thermoascus)、梭孢壳属(Thielavia)、栓菌属(Trametes)、弯颈霉属(Tolypocladium)、木霉属(Trichoderma)、轮枝孢属(Verticillium)和/或小包脚菇属(Volvariella)、和/或有性型、或无性型、及其同义词、基名或分类学等价物。
在本公开的一些实施方案中,宿主细胞是酵母细胞,包括但不限于假丝酵母属(Candida)、汉逊酵母属(Hansenula)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、毕赤酵母属(Pichia)、克鲁维酵母属(Kluyveromyces)或耶氏酵母属(Yarrowia)物种的细胞。在本公开的一些实施方案中,酵母细胞是多形汉逊酵母(Hansenula polymorpha)、酿酒酵母、卡尔斯伯酵母(Saccharomyces carlsbergensis)、糖化酵母(Saccharomyces diastaticus)、诺地酵母(Saccharomyces norbensis)、克鲁维酵母(Saccharomyces kluyveri)、粟酒裂殖酵母(Schizosaccharomyces pombe)、巴斯德毕赤酵母、芬兰毕赤酵母(Pichiafinlandica)、喜海藻糖毕赤酵母(Pichia trehalophila)、Pichiakodamae、膜醭毕赤酵母(Pichia membranaefaciens)、Pichia opuntiae、Pichiathermotolerans、柳毕赤酵母(Pichia salictaria)、Pichia quercuum、Pichia pijperi、树干毕赤酵母(Pichia stipitis)、甲醇毕赤酵母(Pichia methanolica)、安格斯毕赤酵母(Pichia angusta)、乳酸克鲁维酵母(Kluyveromyces lactis)、白色假丝酵母(Candidaalbieans)或解脂耶氏酵母(Yarrowia lipolytica)。
在一些其它实施方案中,宿主细胞是原核细胞。合适的原核细胞包括但不限于革兰氏阳性菌、革兰氏阴性菌和革兰氏不定菌细胞。任何合适的细菌生物可用于本公开,包括但不限于农杆菌属(Agrobacterium)、脂环酸芽孢杆菌属(Alicyclobacillus)、鱼腥藻属(Anabaena)、组囊藻属(Anacystis)、不动杆菌属(Acinetobacter)、热酸菌属(Acidothermus)、节杆菌属(Arthrobacter)、固氮菌属(Azobacter)、芽孢杆菌属、双歧杆菌属(Bifidobacterium)、短杆菌属(Brevibacterium)、丁酸弧菌属(Butyrivibrio)、黑草属(Buchnera)、Campestris、弯曲菌属(Camplyobacter)、梭菌属(Clostridium)、棒状杆菌属(Corynebacterium)、着色菌属(Chromatium)、粪球菌属(Coprococcus)、埃希氏菌属(Escherichia)、肠球菌属(Enterococcus)、肠杆菌属(Enterobacter)、欧文氏菌属(Erwinia)、梭杆菌属(Fusobacterium)、普拉梭菌属(Faecalibacterium)、弗朗西斯菌属(Francisella)、黄杆菌属(Flavobacterium)、地芽孢杆菌属(Geobacillus)、嗜血杆菌属(Haemophilus)、螺杆菌属(Helicobacter)、克雷伯氏菌属(Klebsiella)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、泥杆菌属(Ilyobacter)、微球菌属(Micrococcus)、微杆菌属(Microbacterium)、中慢生根瘤菌属(Mesorhizobium)、甲基杆菌属(Methylobacterium)、甲基杆菌属、分枝杆菌属(Mycobacterium)、奈瑟球菌属(Neisseria)、泛菌属(Pantoea)、假单胞菌属(Pseudomonas)、原绿球藻属(Prochlorococcus)、红细菌属(Rhodobacter)、红假单胞菌属(Rhodopseudomonas)、红假单胞菌属、罗氏菌属(Roseburia)、红螺菌属(Rhodospirillum)、红球菌属(Rhodococcus)、栅藻属(Scenedesmus)、链霉菌属、链球菌属(Streptococcus)、聚球藻属(Synecoccus)、糖单孢菌属(Saccharomonospora)、葡萄球菌属(Staphylococcus)、沙雷氏菌属(Serratia)、沙门氏菌属(Salmonella)、志贺氏菌属(Shigella)、嗜热厌氧杆菌属(Thermoanaerobacterium)、养障体属(Tropheryma)、Tularensis、Temecula、热聚球藻属(Thermosynechococcus)、嗜热球菌属(Thermococcus)、脲原体属(Ureaplasma)、黄单胞菌属(Xanthomonas)、木杆菌属(Xylella)、耶尔森氏菌属(Yersinia)和发酵单胞菌属(Zymomonas)。在一些实施方案中,宿主细胞是以下的物种:农杆菌属、不动杆菌属、固氮菌属、芽孢杆菌属、双歧杆菌属、黑草属、土芽孢杆菌属、弯曲菌属、梭菌属、棒状杆菌属、埃希氏菌属、肠球菌属、欧文氏菌属、黄杆菌属、乳杆菌属、乳球菌属、泛菌属、假单胞菌属、葡萄球菌属、沙门氏菌属、链球菌属、链霉菌属或发酵单胞菌属。在一些实施方案中,细菌宿主菌株对于人是非致病性的。在一些实施方案中,细菌宿主菌株是工业菌株。众多细菌工业菌株是已知的并且适合于本公开。在本公开的一些实施方案中,细菌宿主细胞是农杆菌属物种(例如,放射形农杆菌(A.radiobacter)、发根农杆菌(A.rhizogenes)和悬钩子农杆菌(A.rubi))。在本公开的一些实施方案中,细菌宿主细胞是节杆菌属物种(例如,金黄节杆菌(A.aurescens)、柠檬节杆菌(A.citreus)、球形节杆菌(A.globiformis)、裂烃谷氨酸节杆菌(A.hydrocarboglutamicus)、迈索尔节杆菌(A.mysorens)、烟草节杆菌(A.nicotianae)、石蜡节杆菌(A.paraffineus)、A.protophonniae、A.roseoparqffinus、硫磺色节杆菌(A.sullareus)和产脲节杆菌(A.ureafaciens))。在本公开的一些实施方案中,细菌宿主细胞是芽孢杆菌属物种(例如,苏云金芽孢杆菌(B.thuringensis)、炭疽芽孢杆菌(B.anthracis)、巨大芽孢杆菌、枯草芽孢杆菌、迟缓芽孢杆菌(B.lentus)、环状芽孢杆菌(B.circulans)、短小芽孢杆菌(B.pumilus)、灿烂芽孢杆菌(B.lautus)、凝结芽孢杆菌(B.coagulans)、短芽孢杆菌(B.brevis)、坚强芽孢杆菌(B.firmus)、B.alkaophius、地衣芽孢杆菌、克劳氏芽孢杆菌(B.clausii)、嗜热脂肪芽孢杆菌、耐盐芽孢杆菌(B.halodurans)和解淀粉芽孢杆菌)。在一些实施方案中,宿主细胞是工业芽孢杆菌属菌株,包括但不限于枯草芽孢杆菌、短小芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、克劳氏芽孢杆菌、嗜热脂肪芽孢杆菌或解淀粉芽孢杆菌。在一些实施方案中,芽孢杆菌属宿主细胞是枯草芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、嗜热脂肪芽孢杆菌和/或解淀粉芽孢杆菌。在一些实施方案中,细菌宿主细胞是梭菌属物种(例如,丙酮丁醇梭菌(C.acetobutylicum)、破伤风梭菌(C.tetani)E88、象牙海岸梭菌(C.lituseburense)、糖丁醇梭菌(C.saccharobutylicum)、产气荚膜梭菌(C.perfringens)和拜氏梭菌(C.beijerinckii))。在一些实施方案中,细菌宿主细胞是棒状杆菌属物种(例如,谷氨酸棒状杆菌(C.glutamicum)和嗜乙酰乙酸棒状杆菌(C.acetoacidophilum))。在一些实施方案中,细菌宿主细胞是埃希氏菌属物种(例如,大肠杆菌)。在一些实施方案中,宿主细胞是大肠杆菌W3110。在一些实施方案中,宿主是大肠杆菌BL21或BL21(DE3)。在一些实施方案中,细菌宿主细胞是欧文氏菌属物种(例如,噬夏孢欧文氏菌(E.uredovora)、胡萝卜欧文氏菌(E.carotoyora)、菠萝欧文氏菌(E.ananas)、草生欧文氏菌(E.herbicola)、点状欧文氏菌(E.punctata)和土欧文氏菌(E.terreus))。在一些实施方案中,细菌宿主细胞是泛菌属物种(例如,柠檬泛菌(P.citrea)和成团泛菌(P.agglomerans))。在一些实施方案中,细菌宿主细胞是假单胞菌属物种(例如,恶臭假单胞菌(P.putida,)、铜绿假单胞菌(P.aeruginosa)、P.mevalonii和假单胞菌属物种D-0110)。在一些实施方案中,细菌宿主细胞是链球菌属物种(例如,似马链球菌(S.equisimiles)、化脓性链球菌(S.pyogenes)和乳房链球菌(S.uberis))。在一些实施方案中,细菌宿主细胞是链霉菌属物种(例如,生二素链霉菌(S.ambofaciens)、不产色链霉菌(S.achromogenes)、阿维链霉菌(S.avermitilis)、天蓝色链霉菌、金霉素链霉菌(S.aureofaciens)、金色链霉菌(S.aureus)、杀真菌素链霉菌(S.fungicidicus)、灰色链霉菌(S.griseus)和变铅青链霉菌(S.lividans))。在一些实施方案中,细菌宿主细胞是发酵单胞菌属物种(例如,运动发酵单胞菌(Z.mobilis)和Z.lipolytica)。
可用于本公开的许多原核菌株和真核菌株从许多培养物保藏中心对于公众可容易获得,所述保藏中心例如美国典型培养物保藏中心(ATCC)、德国微生物和细胞培养物保藏中心(Deutsche Sammlung von Mikroorganismenund Zellkulturen GmbH)(DSM)、真菌培养物保藏中心(Centraalbureau Voor Schimmelcultures)(CBS)、以及北部地区研究中心(Northern Regional Research Center)(NRRL)的农业研究服务专利培养物保藏中心(Agricultural Research Service Patent Culture Collection)。
在一些实施方案中,对宿主细胞进行遗传修饰,以具有改善蛋白质分泌、蛋白质稳定性和/或对于蛋白质的表达和/或分泌期望的其它性质的特性。遗传修饰可以通过基因工程技术和/或经典微生物技术(例如,化学或UV诱变和后续选择)来实现。实际上,在一些实施方案中,重组修饰和经典选择技术的组合用于产生宿主细胞。使用重组技术,核酸分子可以被引入、缺失、抑制或修饰,其方式导致在宿主细胞内和/或在培养基中的MTR激酶变体的产率增加。在一种基因工程方法中,同源重组用于通过特异性地靶向体内基因以压制编码蛋白的表达来诱导靶向基因修饰。在替代方法中,siRNA、反义和/或核酶技术可用于抑制基因表达。本领域已知各种方法用于减少细胞中的蛋白质表达,包括但不限于编码蛋白质的基因的全部或部分的缺失和定点诱变,以破坏基因产物的表达或活性(参见例如,Chaveroche等人,NUCL.ACIDS RES.,28:22e97(2000);Cho等人,MOLEC.PLANT MICROBEINTERACT.,19:7-15(2006);Maruyama和Kitamoto,BIOTECHNOL LETT.,30:1811-1817(2008);Takahashi等人,MOL.GEN.GENOM.,272:344-352(2004):以及You等人,Arch.Microbiol.,191:615-622(2009),所有所述参考文献都通过引用并入本文)。随机诱变,随后为筛选所需的突变也是有用的(参见例如,Combier等人,FEMS MICROBIOL.LETT.,220:141-8(2003);以及Firon等人,EUKARY.CELL 2:247-55(2003),所述两个参考文献均通过引用并入)。
载体或DNA构建体引入宿主细胞内可以使用本领域已知的任何合适的方法来完成,所述方法包括但不限于磷酸钙转染、DEAE-葡聚糖介导的转染、PEG介导的转化、电穿孔或本领域已知的其它常用技术。
在一些实施方案中,本公开的改造的宿主细胞(即,“重组宿主细胞”)在常规营养培养基中进行培养,所述培养基适当地进行修饰,用于激活启动子、选择转化体或扩增MTR激酶多核苷酸。培养条件,例如温度、pH等等,是先前用于选择用于表达的宿主细胞的那些条件,并且是本领域技术人员众所周知的。如指出的,许多标准参考文献和文本可用于许多细胞的培养和生产,所述细胞包括细菌、植物、动物(尤其是哺乳动物)和古细菌起源的细胞。
在一些实施方案中,表达本公开的MTR激酶的细胞在分批或连续发酵条件下生长。经典的“分批发酵”是封闭的系统,其中培养基的组成在发酵开始时进行设定,并且在发酵过程中并不经受人为改变。分批系统的变体是“补料分批发酵”,其也可用于本公开。在这种变体中,底物随着发酵进展以增量添加。当分解代谢物阻遏很可能抑制细胞的新陈代谢,并且期望在培养基中具有有限量的底物时,补料分批系统是有用的。分批和补料分批发酵是本领域常见的和众所周知的。“连续发酵”是开放的系统,其中将限定的发酵培养基连续添加到生物反应器中,并且同时取出等量的条件培养基用于处理。连续发酵一般将培养物维持在恒定的高密度下,其中细胞主要处于对数生长期。连续发酵系统努力维持稳态生长条件。用于调节关于连续发酵过程的营养素和生长因子的方法以及用于使产物形成速率达到最大的技术是工业微生物学领域众所周知的。
可以将本公开的核酸序列的多于一个拷贝插入宿主细胞内,以增加基因产物的产生。核酸序列的拷贝数的增加可以通过以下获得:将该序列的至少一个另外拷贝整合到宿主细胞基因组内,或将可扩增的可选择标记物基因与核酸序列包括在一起,其中通过在适当的选择剂的存在下培养细胞,可以选择含有可选择标记物基因的扩增拷贝,以及从而包含核酸序列的另外拷贝的细胞。
在本公开的一些实施方案中,无细胞转录和翻译系统可用于产生MTR激酶。几种系统是商购可得的,并且这些方法是本领域技术人员众所周知的。
使MTR激酶进化的方法
在一些实施方案中,为了制备本公开的MTR激酶,催化核糖和5-异丁酰核糖的1-磷酸化的MTR激酶得自(或衍生自)大肠杆菌。在一些实施方案中,对亲代多核苷酸序列进行密码子优化,以增强MTR激酶在指定宿主细胞中的表达。指定为SEQ ID NO:2的亲本多核苷酸序列对于在大肠杆菌中的表达进行密码子优化,并且将密码子优化的多核苷酸克隆到表达载体内,将MTR激酶基因的表达置于tac启动子的控制下。表达目的基因所需的T7 RNA聚合酶在lacUV5启动子的控制下,并且目的基因和T7 RNA聚合酶两者均经受通过葡萄糖的阻遏。乳糖或乳糖类似物如异丙基β-d-1-硫代半乳糖吡喃糖苷(IPTG)的存在激活T7 RNA聚合酶的产生并消除阻遇,导致MTR激酶基因的产生。鉴定了在大肠杆菌中表达活性MTR激酶的克隆,并且对基因进行测序以确认其身份。
本公开的MTR激酶可以通过使编码亲本序列的多核苷酸经受诱变和/或定向进化方法来获得。示例性定向进化技术是诱变和/或DNA改组,如Stemmer,1994,PROC.NATL.ACAD.SCI.USA 91:10747-10751;WO 95/22625:WO 97/20078;WO 97/35966:WO98/27230;WO 00/42651;WO 01/75767和美国专利号6,537,746中所述。可以使用的其它定向进化程序尤其包括交错延伸过程(StEP),体外重组(Zhao等人,1998,NAT.BIOTECHNOL.16:258-261),诱变PCR(Caldwell等人,1994,PCR METHODS APPL.3:S136-S140)和盒式诱变(Black等人,1996,PROC.NATL.ACAD.SCI.USA 93:3525-3529)。
在诱变处理之后获得的克隆中筛选具有所需改善的酶性质的MTR激酶。测量来自表达文库的酶活性可以使用用于测量底物和产物的标准化学分析技术例如UPLC-MS来执行。在该反应中,ATP的γ磷酸基残基通过MTR激酶转移到底物的1-位置处,以产生ADP和磷酸化核糖或5-异丁酰核糖。反应也可以在其中MTR激酶是产率限制催化剂的条件下运行,使得MTR激酶浓度的加倍或减半将导致在给定时间点观察到的核苷产物产率的加倍或减半。当所需的改善的酶性质是热稳定性时,可以在使酶制剂经受限定的温度并测量热处理后剩余的酶活性的量之后测量酶活性。然后分离含有编码MTR激酶的多核苷酸的克隆,测序以鉴定核苷酸序列改变(如果有的话),并且用于在宿主细胞中表达酶。
当多肽的序列是已知的时,编码酶的多核苷酸可以根据已知的合成方法,通过标准固相方法进行制备。在一些实施方案中,最多约100个碱基的片段可以个别地合成,然后连接(例如,通过酶促或化学连接方法、或者聚合酶介导的方法),以形成任何所需的连续序列。例如,本公开的多核苷酸和寡核苷酸可以通过化学合成进行制备,使用例如通过Beaucage等人,1981,TET.LETT.22:1859-69描述的经典亚磷酰胺方法,或通过Matthes等人,1984,EMBO J.3:801-05描述的方法,例如,如它通常在自动化合成方法中实践的。根据亚磷酰胺方法,寡核苷酸例如在自动DNA合成仪中合成、纯化、退火、连接并克隆到适当的载体中。另外,基本上任何核酸都可以得自各种商业来源中的任一种,例如MidlandCertified Reagent Company,Midland,Tex.,The Great American Gene Company,Ramona,Calif.,ExpressGen Inc.Chicago,Ill.,Operon Technologies Inc.,Alameda,Calif.以及许多其它公司。
在宿主细胞中表达的MTR激酶多肽可以使用任何一种或多种众所周知的蛋白质纯化技术从细胞和/或培养基中回收,所述技术尤其包括溶菌酶处理、超声处理、过滤、盐析、超速离心和层析。用于裂解细菌如大肠杆菌以及从其中高效提取蛋白质的合适溶液以商品名B-PERTM从ThermoFisher Scientific商购可得。
用于分离MTR激酶多肽的层析技术尤其包括反相层析、高效液相层析、离子交换层析、凝胶电泳和亲和层析。用于纯化特定酶的条件将部分取决于因素如净电荷、疏水性、亲水性、分子量、分子形状等,并且对于本领域技术人员将是显而易见的。
在一些实施方案中,亲和技术可以用于分离改善的MTR激酶多肽。对于亲和层析纯化,蛋白质序列可以用识别序列加上标签,以允许纯化。常见标签包括纤维素结合结构域、聚His标签、双His螯合物、FLAG标签以及对于本领域技术人员显而易见的许多其它标签。抗体也可以用作亲和纯化试剂。可以使用特异性地结合MTR激酶多肽的任何抗体。
使用MTR激酶的方法
本文所述的MTR激酶可以催化式A的底物化合物:
磷酸化为式B的相应异构产物:
或其盐。
在特定实施方案中,本文所述的MTR激酶可以催化式C的底物化合物:
磷酸化为式D的相应异构产物:
或其盐。
在一些实施方案中,用于磷酸化的方法包括在适合于磷酸化的反应条件下,使底物与本文公开的MTR激酶接触或温育。在一些实施方案中,产物为超过相应的次要产物大于约99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%或99.9%的非对映体过量。
在用于将底物磷酸化为产物的方法的一些实施方案中,使底物磷酸化以给出大于约85%非对映体过量的产物,其中所述MTR激酶多肽包含对应于SEQ ID NO:1、3、5、7、9、11或12的序列。在用于将底物磷酸化为产物的方法的一些实施方案中,使底物磷酸化以提供以大于约85%非对映体过量的产物,其中所述MTR激酶多肽由对应于SEQ ID NO:2、4、6、8或10的DNA序列编码。
在用于使底物磷酸化以获得产物的这种方法的另一个实施方案中,当用大于约50g/L的底物和小于约5g/L的多肽进行时,至少约95%的底物在少于约24小时内被转换以获得产物,其中所述多肽包含对应于SEQ ID NO:1、3、5、7、9、11或12的氨基酸序列。在用于使底物磷酸化以获得产物的该方法的实施方案中,当用大于约50g/L的底物和小于约5g/L的多肽进行时,至少约95%的底物在少于约24小时内被转换为产物,其中所述MTR激酶多肽由对应于SEQ ID NO:2、4、6、8或10的DNA序列编码。
在一些实施方案中,用于磷酸化的方法包括用于制备磷酸化核糖或磷酸核糖衍生物或其盐的过程,所述过程包括在多肽的存在下使核糖或核糖衍生物与磷酸源反应,所述多肽包含对应于SEQ ID NO:1、3、5、7、9、11或12的氨基酸序列,或其中所述MTR激酶多肽由对应于SEQ ID NO:2、4、6、8或10的DNA序列编码。在具体实施方案中,核糖或核糖衍生物选自:
在特定实施方案中,该过程包括在包含对应于SEQ ID NO:1、3、5、7、9、11或12的氨基酸序列的多肽,或者由对应于SEQ ID NO:2、4、6、8或10的DNA序列编码的多肽的存在下,使核糖与磷酸源反应:
在其它特定实施方案中,该过程包括在包含对应于SEQ ID NO:1、3、5、7、9、11或12的氨基酸序列的多肽,或者由对应于SEQ ID NO:2、4、6、8或10的DNA序列编码的多肽的存在下,使核糖与磷酸源反应:
本公开的另外的实施方案提供了选自以下的化合物:
及其盐。
如由本领域技术人员已知的,激酶催化的反应通常需要辅因子。由本文所述的MTR激酶多肽催化的反应通常也需要辅因子,尽管改造的MTR激酶的许多实施方案需要比用野生型MTR激酶催化的反应少得多的辅因子。如本文所用,术语“辅因子”指与MTR激酶组合起作用的非蛋白质化合物。适用于本文所述的改造的MTR激酶的辅因子包括但不限于二价阳离子,包括Mg2+、Ca2+、Mn2+或Co2+,以及核苷三磷酸包括ATP,其充当将磷酸基残基转移到底物的辅因子。
本文所述的MTR激酶催化的磷酸化反应一般在溶剂中进行。在一些实施方案中,使用水性溶剂,包括水和水性共溶剂系统。
示例性水性共溶剂系统具有水和一种或多种有机溶剂。一般而言,这样选择水性共溶剂系统的有机溶剂组分,使得它并不使MTR激酶完全失活。适当的共溶剂系统可以通过以下容易地鉴定:利用酶活性测定如本文所述的那些测定,测量指定的改造的MTR激酶对于候选溶剂系统中感兴趣的限定底物的酶促活性。
水性共溶剂系统的有机溶剂组分可以与水性组分混溶,提供单一液相,或者可以与水性组分部分混溶或不混溶,提供两个液相。一般地,当采用水性共溶剂系统时,它选择为双相的,其中水分散在有机溶剂中,或反之亦然。一般地,当利用水性共溶剂系统时,期望选择可以与水相容易地分开的有机溶剂。一般而言,共溶剂系统中的水与有机溶剂的比率通常在约99∶1至约10∶90(v/v)的有机溶剂/水的范围内、以及80∶20至20∶80(v/v)的有机溶剂/水之间。共溶剂系统可以在加入反应混合物之前预先形成,或者它可以在反应容器中原位形成。
水性溶剂(水或水性共溶剂系统)可以是pH缓冲的或未缓冲的。一般地,磷酸化可以在约5至约9的范围内的pH下进行。在一些实施方案中,磷酸化在约8或更低的pH下进行,经常在约5至约8的范围内,且通常在约6.5至约8的范围内。
在磷酸化反应的过程期间,反应混合物的pH可能改变。通过在反应的过程期间加入酸或碱,反应混合物的pH可以维持在所需的pH下或所需的pH范围内。可替代地,可以通过使用包含缓冲液的水性溶剂来控制pH。维持所需pH范围的合适缓冲液是本领域已知的,并且包括例如磷酸盐缓冲液、三乙醇胺缓冲液等等。也可以使用缓冲和酸或碱添加的组合。
当采用化学计量的乙酰基或丙酰基磷酸ATP循环时,如方程式(1)中所示的,乙酸或丙酸(pKa=3.6)的共同产生促使反应混合物的pH下降,如果所得到的乙酸或丙酸水溶液(pKa=4.7)不以其它方式中和的话。反应混合物的pH可以通过标准缓冲技术维持在所需水平下,其中缓冲液中和乙酸或丙酸直到所提供的缓冲容量,或通过与转换过程同时的碱添加。也可以使用缓冲和碱添加的组合。上文描述了维持所需pH范围的合适缓冲液。用于中和乙酸或丙酸的合适的碱是有机碱例如胺、醇盐等等,以及无机碱例如氢氧化物盐(例如NaOH)、碳酸盐(例如NaHCO3)、碳酸氢盐(例如K2CO3)、碱性磷酸盐(例如K2HPO4、Na3PO4)等等。与转换过程同时的碱添加可以在监测反应混合物pH的同时手动完成,或者更方便地通过使用自动滴定仪作为pH恒稳器(pH stat)来完成。部分缓冲容量和碱添加的组合也可以用于过程控制。
当碱添加用于中和在MTR激酶催化的磷酸化反应期间释放的乙酸或丙酸时,转换的进展可以通过为了维持pH而添加的碱的量来监测。通常,在磷酸化的过程中加入未缓冲或部分缓冲的反应混合物中的碱是在水溶液中添加的。
在一些实施方案中,当使用宿主生物的全细胞进行该过程时,全细胞可以自然地提供ATP。可替代地或组合地,细胞可以自然地或重组地提供丙酮酸氧化酶或使ATP再循环所需的其它酶。
在进行本文所述的立体选择性磷酸化反应时,MTR激酶和构成任选的ATP再生系统的任何酶可以加入反应混合物中,其形式为纯化的酶、用编码酶的基因转化的全细胞、和/或此类细胞的细胞提取物和/或裂解物。编码MTR激酶多肽和任选的ATP再生酶的基因可以分别转化到宿主细胞内或一起转化到同一宿主细胞内。例如,在一些实施方案中,一组宿主细胞可以用编码MTR激酶的基因进行转化,而另一组可以用编码ATP再生酶的基因进行转化。两组转化细胞可以全细胞的形式,或者以裂解物或由其衍生的提取物的形式一起用于反应混合物中。在其它实施方案中,宿主细胞可以用编码MTR激酶多肽和ATP再生酶两者的基因进行转化。
用编码MTR激酶多肽和/或任选的ATP再生酶的基因转化的全细胞、或其细胞提取物和/或裂解物,可以以各种不同的形式采用,所述形式包括固体(例如,冻干的、喷雾干燥的等等)或半固体(例如,粗制糊)。
细胞提取物或细胞裂解物可以通过沉淀(硫酸铵、聚乙烯亚胺、热处理等等),随后为在冻干之前的脱盐程序(例如,超滤、透析等等)得到部分纯化。任何细胞制剂可以通过使用已知交联剂交联而得到稳定。
用于进行本文所述的MTR激酶催化反应的合适条件包括可以通过例行实验容易地优化的广泛各种条件,所述例行实验包括但不限于在实验pH和温度下使改造的MTR激酶多肽和底物接触,并且例如使用本文提供的实施例中描述的方法来检测产物。
MTR激酶催化的磷酸化通常在约20℃至约55℃的范围内的温度下进行。在实施方案中,它在约20℃至约45℃的范围内的温度下进行。反应也可以在环境条件下进行。
一般允许反应进行直到获得底物的基本上完全或接近完全的磷酸化。可以使用已知方法通过检测底物和/或产物来监测底物磷酸化为产物。合适的方法包括HPLC-CAD(荷电气溶胶检测)、HPLC-MS等等。反应混合物中生成的磷酸化产物的转换产率一般大于约50%,还可以大于约60%,还可以大于约70%,还可以大于约80%,还可以大于90%,并且经常大于约97%。
实施例
缩写
ATP 腺苷5′-三磷酸
DNA酶I 商购可得的核酸内切酶,其非特异性地切割DNA,以释放具有5′-磷酸化和3′-羟基化端部的二核苷酸、三核苷酸和寡核苷酸产物
IPTG 异丙基β-D-1-硫代半乳糖吡喃糖苷
LB-琼脂 Luria-Bertani培养基,商购可得的、营养丰富的培养基,用于细菌的培养和生长
LB-培养液 Luria-Bertani培养液,商购可得的、营养丰富的培养基,用于细菌的培养和生长
NdeI 商购可得的限制性酶,其是从脱氮奈瑟球菌(Neisseria denitrificans)分离的核酸内切酶
pET30 用于在大肠杆菌中表达重组蛋白质的商购可得的系统
XhoI 商购可得的限制性酶
ZYM-5052 商购可得的、营养丰富的培养基,用于细菌的培养和生长
w/v 重量/体积
实施例1:用于孔板反应的酶的制备
合成了来自肺炎克雷伯氏菌的密码子优化的野生型MTR激酶,并且经由NdeI/XhoI限制性位点克隆到pET30内。经由电穿孔,将含有来自肺炎克雷伯氏菌的野生型MTR激酶的质粒转化到电感受态的大肠杆菌BL21(DE3)内。在37℃下的1小时生长之后,转化的一部分在补充有50微克/mL的卡那霉素和1%(w/v)葡萄糖的LB琼脂上铺平板。第二天,挑取菌落并且接种到含有0.2mL/孔的Luria-Bertani培养液(用于细胞的培养基)的96孔板内,所述Luria-Bertani培养液补充有50微克/mL的卡那霉素和1%(w/v)葡萄糖。96孔板在250RPM/30℃下振荡过夜。第二天,来自每个孔的0.01mL/孔的培养物用于接种新的96孔板的相应孔,所述96孔板含有0.39mL/孔的ZYM-5052培养基。该培养物在30℃/250RPM下生长18小时,这之后通过离心使细胞形成团块并弃去上清液。在离心后,将细胞冷冻、解冻,且然后重悬浮于裂解缓冲液(0.2mL/孔的50mM三乙醇胺-HCl pH 7.5、1mg/mL溶菌酶、0.5mg/mL硫酸多粘菌素B、1U/mL DNA酶I和1mM MgSO4)中。然后,使平板在室温下以1200RPM振荡2小时。裂解物然后通过离心(4000x g,10分钟)得到澄清。在这个步骤之后的上清液然后用于后续的孔板反应(实施例3)中。
实施例2:用于小瓶和大规模反应的酶的制备
合成了来自肺炎克雷伯氏菌的密码子优化的野生型MTR激酶,并且经由NdeI/XhoI限制性位点克隆到pET30内,并且使用T4连接酶进行连接。质粒使用T7f和T7TRM测序引物进行序列验证。经由电穿孔,将含有来自肺炎克雷伯氏菌的野生型MTR激酶的质粒转化到电感受态的大肠杆菌BL21(DE3)内。在37℃下的1小时生长之后,转化的一部分在补充有50微克/mL的卡那霉素和1%(w/v)葡萄糖的LB琼脂上铺平板。第二天,挑取单个菌落并且接种到含有50mL的Luria-Bertani培养液(用于细胞的培养基)的125mL烧瓶内,所述Luria-Bertani培养液补充有50微克/mL的卡那霉素和1%(w/v)葡萄糖。烧瓶在250RPM/30℃下振荡过夜。第二天,用100倍稀释的饱和过夜培养物接种含有1L ZYM-5052培养基的2.8L烧瓶。该培养物在30℃/250RPM下生长18小时,这之后通过离心收获细胞。在离心后,将细胞重悬浮至0.33克/1mL水性50mM三乙醇胺-HCl缓冲液pH 7.5的浓度。使该悬浮液在20℃下振荡30分钟,这之后将细胞置于冰上冷却,且然后通过高压匀浆(16,000PSI)进行破碎。所得到的裂解物然后通过以10,000x g离心30分钟得到澄清。在离心之后,使上清液冷冻并冻干。
实施例3:在孔板中的MTR激酶反应
向96孔圆底聚丙烯板的孔中装入5′-异丁酰核糖(1.14M的水溶液,16μL,4mg)、丙酰磷酸单铵盐(水中1M,pH调整至7.5,25μL,4.3mg)、三乙醇胺(水中1M,pH调整至7.5,40μL,6.0mg)、氯化镁(水中0.1M,10μL,0.095mg)、ATP(水中0.1M,2μL,0.11mg)、具有通过下述SEQID NO:13指定的氨基酸序列的乙酸激酶(水中20g/L,4μL,0.08mg)、具有通过SEQ ID NO.3指定的氨基酸序列的S-甲基硫核糖激酶(水中2g/L,100μL,0.2mg)。将平板密封并且在25℃、700RPM下振荡过夜。获取10μL反应混合物,并且用190μL50/50(v/v)乙腈:水稀释,用于UPLC-MS分析。获得了95%的测定产率。
实施例4:在小瓶中的MTR激酶反应
向干净且干燥的Falcon管内加入60mg三乙醇胺、4mg MgCl六水合物、200mg丙酰磷酸单铵盐和3mg ATP,连同4mL水。溶液的pH为约4.0,因此用6M KOH溶液调整至7.5。然后将200mg的5′-异丁酰核糖和4mg具有通过上文SEQ ID NO:13指定的氨基酸序列的乙酸激酶加入pH调整的储备溶液中。pH并未改变。
向两个干净且干燥的2打兰(dram)小瓶中,加入50mg MTR激酶多肽变体,随后为1mL其它试剂的储备溶液。反应物在30℃和500rpm下搅拌,直到判断完成。表2显示了转换率。
表2
小瓶 酶SEQ ID NO pH %转换
A 1 7.5 <5%
B 3 6.5 >99%
应了解,可以期望将各种上文讨论的以及其它特征和功能或其替代组合到许多其它不同的系统或应用内。另外,随后可以通过本领域技术人员做出其中的各种替代、修改、变化或改善,这些也意图由下述权利要求涵盖。
序列表
<110> MERCK SHARP & DOHME CORP.
<120> S-甲基硫核糖激酶多肽以及S-甲基硫核糖激酶多肽的制备和使用方法
<130> 25182-WO-PCT
<140>
<141>
<150> 63/278,284
<151> 2021-11-11
<150> 63/125,154
<151> 2020-12-14
<160> 13
<170> PatentIn version 3.5
<210> 1
<211> 399
<212> PRT
<213> 肺炎克雷伯氏菌(Klebsiella pneumoniae)
<400> 1
Met Ser Gln Tyr His Thr Phe Thr Ala His Asp Ala Val Ala Tyr Ala
1 5 10 15
Gln Gln Phe Ala Gly Ile Asp Asn Pro Ser Glu Leu Val Ser Ala Gln
20 25 30
Glu Val Gly Asp Gly Asn Leu Asn Leu Val Phe Lys Val Phe Asp Arg
35 40 45
Gln Gly Val Ser Arg Ala Ile Val Lys Gln Ala Leu Pro Tyr Val Arg
50 55 60
Cys Val Gly Glu Ser Trp Pro Leu Thr Leu Asp Arg Ala Arg Leu Glu
65 70 75 80
Ala Gln Thr Leu Val Ala His Tyr Gln His Ser Pro Gln His Thr Val
85 90 95
Lys Ile His His Phe Asp Pro Glu Leu Ala Val Met Val Met Glu Asp
100 105 110
Leu Ser Asp His Arg Ile Trp Arg Gly Glu Leu Ile Ala Asn Val Tyr
115 120 125
Tyr Pro Gln Ala Ala Arg Gln Leu Gly Asp Tyr Leu Ala Gln Val Leu
130 135 140
Phe His Thr Ser Asp Phe Tyr Leu His Pro His Glu Lys Lys Ala Gln
145 150 155 160
Val Ala Gln Phe Ile Asn Pro Ala Met Cys Glu Ile Thr Glu Asp Leu
165 170 175
Phe Phe Asn Asp Pro Tyr Gln Ile His Glu Arg Asn Asn Tyr Pro Ala
180 185 190
Glu Leu Glu Ala Asp Val Ala Ala Leu Arg Asp Asp Ala Gln Leu Lys
195 200 205
Leu Ala Val Ala Ala Leu Lys His Arg Phe Phe Ala His Ala Glu Ala
210 215 220
Leu Leu His Gly Asp Ile His Ser Gly Ser Ile Phe Val Ala Glu Gly
225 230 235 240
Ser Leu Lys Ala Ile Asp Ala Glu Phe Gly Tyr Phe Gly Pro Ile Gly
245 250 255
Phe Asp Ile Gly Thr Ala Ile Gly Asn Leu Leu Leu Asn Tyr Cys Gly
260 265 270
Leu Pro Gly Gln Leu Gly Ile Arg Asp Ala Ala Ala Ala Arg Glu Gln
275 280 285
Arg Leu Asn Asp Ile His Gln Leu Trp Thr Thr Phe Ala Glu Arg Phe
290 295 300
Gln Ala Leu Ala Ala Glu Lys Thr Arg Asp Ala Ala Leu Ala Tyr Pro
305 310 315 320
Gly Tyr Ala Ser Ala Phe Leu Lys Lys Val Trp Ala Asp Ala Val Gly
325 330 335
Phe Cys Gly Ser Glu Leu Ile Arg Arg Ser Val Gly Leu Ser His Val
340 345 350
Ala Asp Ile Asp Thr Ile Gln Asp Asp Ala Met Arg His Glu Cys Leu
355 360 365
Arg His Ala Ile Thr Leu Gly Arg Ala Leu Ile Val Leu Ala Glu Arg
370 375 380
Ile Asp Ser Val Asp Glu Leu Leu Ala Arg Val Arg Gln Tyr Ser
385 390 395
<210> 2
<211> 1197
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多核苷酸
<220>
<223> 编码野生型多肽的密码子优化的序列
<400> 2
atgagccagt atcatacctt caccgcgcat gatgcggtgg cgtatgcgca gcaatttgcg 60
ggcattgata acccgagcga gctggttagc gcgcaagaag ttggtgacgg caacctgaac 120
ctggtgttca aggtttttga tcgtcagggt gtgagccgtg cgatcgttaa acaagcgctg 180
ccgtacgtgc gttgcgttgg tgaaagctgg ccgctgaccc tggaccgtgc gcgtctggaa 240
gcgcagaccc tggtggcgca ctatcagcac agcccgcaac acaccgttaa gatccaccac 300
ttcgatccgg agctggcggt gatggttatg gaagacctga gcgatcaccg tatttggcgt 360
ggtgagctga tcgcgaacgt gtactatccg caggcggcgc gtcaactggg tgactacctg 420
gcgcaggttc tgttccacac cagcgatttt tatctgcacc cgcacgagaa gaaagcgcag 480
gtggcgcaat tcattaaccc ggcgatgtgc gagatcaccg aagacctgtt ctttaacgat 540
ccgtaccaga ttcacgaacg taacaactat ccggcggagc tggaagcgga tgtggcggcg 600
ctgcgtgatg atgcgcaact gaagctggcg gttgcggcgc tgaaacaccg tttctttgcg 660
catgcggagg cgctgctgca tggtgacatt cacagcggca gcatcttcgt tgcggagggt 720
agcctgaagg cgatcgacgc ggaattcggt tactttggcc cgatcggttt tgatattggt 780
accgcgatcg gcaacctgct gctgaactat tgcggtctgc cgggtcaact gggtattcgt 840
gatgcggcgg cggcgcgtga acagcgtctg aacgatatcc accaactgtg gaccaccttc 900
gcggagcgtt ttcaagcgct ggcggcggaa aagacccgtg acgcggcgct ggcgtacccg 960
ggttatgcga gcgcgttcct gaagaaagtg tgggcggatg cggttggttt ttgcggcagc 1020
gagctgattc gtcgtagcgt gggcctgagc cacgttgcgg acatcgatac cattcaggac 1080
gatgcgatgc gtcacgaatg cctgcgtcac gcgatcaccc tgggtcgtgc gctgattgtt 1140
ctggcggagc gtatcgacag cgtggatgaa ctgctggcgc gtgttcgtca atacagc 1197
<210> 3
<211> 407
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多肽
<220>
<223> MTR激酶AA序列
<400> 3
Met Ser Gln Tyr His Thr Phe Thr Ala His Asp Ala Val Ala Tyr Ala
1 5 10 15
Gln Gln Phe Ala Gly Ile Asp Asn Pro Ser Glu Leu Val Ser Ala Gln
20 25 30
Glu Val Gly Asp Gly Asn Leu Asn Leu Val Phe Lys Val Phe Asp Arg
35 40 45
Gln Gly Val Ser Arg Ala Ile Val Lys Gln Ala Leu Pro Tyr Val Arg
50 55 60
Cys Val Gly Glu Ser Trp Pro Leu Thr Leu Asp Arg Ala Arg His Glu
65 70 75 80
Ala Gln Thr Leu Val Ala His Tyr Gln His Ser Pro Gln His Thr Val
85 90 95
Lys Ile His His Phe Asp Pro Glu Leu Ala Val Met Val Met Glu Asp
100 105 110
Leu Ser Asp His Arg Ile Trp Arg Gly Glu Leu Ile Ala Asn Val Tyr
115 120 125
Tyr Pro Gln Ala Ala Arg Gln Leu Gly Asp Tyr Leu Ala Gln Val Leu
130 135 140
Phe His Thr Ser Asp Phe Tyr Leu His Pro His Glu Lys Lys Ala Gln
145 150 155 160
Val Ala Gln Phe Ile Asn Pro Ala Met Cys Glu Ile Thr Glu Asp Leu
165 170 175
Phe Phe Asn Asp Pro Tyr Gln Ile His Glu Arg Asn Asn Tyr Pro Ala
180 185 190
Glu Leu Glu Ala Asp Val Ala Ala Leu Arg Asp Asp Ala Gln Leu Lys
195 200 205
Leu Ala Val Ala Ala Leu Lys His Arg Phe Phe Ala His Ala Glu Ala
210 215 220
Leu Leu His Gly Asp Ile His Ser Gly Ser Ile Phe Val Ala Glu Gly
225 230 235 240
Ser Leu Lys Ala Ile Asp Ala Glu Phe Gly Tyr Phe Gly Pro Ile Gly
245 250 255
Phe Asp Ile Gly Thr Ala Ile Gly Asn Leu Leu Leu Asn Tyr Cys Gly
260 265 270
Leu Pro Gly Gln Leu Gly Ile Arg Asp Ala Ala Ala Ala Arg Glu Gln
275 280 285
Arg Leu Asn Asp Ile His Gln Leu Trp Thr Thr Phe Ala Glu Arg Phe
290 295 300
Gln Ala Leu Ala Ala Glu Lys Thr Arg Asp Ala Ala Leu Ala Tyr Pro
305 310 315 320
Gly Tyr Ala Ser Ala Phe Leu Lys Lys Val Trp Ala Asp Ala Val Gly
325 330 335
Phe Cys Gly Ser Glu Leu Ile Arg Arg Ser Val Gly Leu Ser His Val
340 345 350
Ala Asp Ile Asp Thr Ile Gln Asp Asp Ala Met Arg His Glu Cys Leu
355 360 365
Arg His Ala Ile Thr Leu Gly Arg Ala Leu Ile Val Leu Ala Glu Arg
370 375 380
Ile Asp Ser Val Asp Glu Leu Leu Ala Arg Val Arg Gln Tyr Ser Leu
385 390 395 400
Glu His His His His His His
405
<210> 4
<211> 1224
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多核苷酸
<220>
<223> MTR激酶DNA序列
<400> 4
atgagccagt atcatacctt caccgcgcat gatgcggtgg cgtatgcgca gcaatttgcg 60
ggcattgata acccgagcga gctggttagc gcgcaagaag ttggtgacgg caacctgaac 120
ctggtgttca aggtttttga tcgtcagggt gtgagccgtg cgatcgttaa acaagcgctg 180
ccgtacgtgc gttgcgttgg tgaaagctgg ccgctgaccc tggaccgtgc gcgtcatgaa 240
gcgcagaccc tggtggcgca ctatcagcac agcccgcaac acaccgttaa gatccaccac 300
ttcgatccgg agctggcggt gatggttatg gaagacctga gcgatcaccg tatttggcgt 360
ggtgagctga tcgcgaacgt gtactatccg caggcggcgc gtcaactggg tgactacctg 420
gcgcaggttc tgttccacac cagcgatttt tatctgcacc cgcacgagaa gaaagcgcag 480
gtggcgcaat tcattaaccc ggcgatgtgc gagatcaccg aagacctgtt ctttaacgat 540
ccgtaccaga ttcacgaacg taacaactat ccggcggagc tggaagcgga tgtggcggcg 600
ctgcgtgatg atgcgcaact gaagctggcg gttgcggcgc tgaaacaccg tttctttgcg 660
catgcggagg cgctgctgca tggtgacatt cacagcggca gcatcttcgt tgcggagggt 720
agcctgaagg cgatcgacgc ggaattcggt tactttggcc cgatcggttt tgatattggt 780
accgcgatcg gcaacctgct gctgaactat tgcggtctgc cgggtcaact gggtattcgt 840
gatgcggcgg cggcgcgtga acagcgtctg aacgatatcc accaactgtg gaccaccttc 900
gcggagcgtt ttcaagcgct ggcggcggaa aagacccgtg acgcggcgct ggcgtacccg 960
ggttatgcga gcgcgttcct gaagaaagtg tgggcggatg cggttggttt ttgcggcagc 1020
gagctgattc gtcgtagcgt gggcctgagc cacgttgcgg acatcgatac cattcaggac 1080
gatgcgatgc gtcacgaatg cctgcgtcac gcgatcaccc tgggtcgtgc gctgattgtt 1140
ctggcggagc gtatcgacag cgtggatgaa ctgctggcgc gtgttcgtca atacagcctc 1200
gagcaccacc accaccacca ctga 1224
<210> 5
<211> 407
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多肽
<220>
<223> MTR激酶AA序列
<400> 5
Met Ser Gln Tyr His Thr Phe Thr Ala His Asp Ala Val Ala Tyr Ala
1 5 10 15
Gln Gln Phe Ala Gly Ile Asp Asn Pro Ser Glu Leu Val Ser Ala Gln
20 25 30
Glu Val Gly Asp Gly Asn Leu Asn Leu Val Phe Lys Val Phe Asp Arg
35 40 45
Gln Gly Val Ser Arg Ala Ile Val Lys Gln Ala Leu Pro Tyr Pro Arg
50 55 60
Cys Val Gly Glu Ser Trp Pro Leu Thr Leu Asp Arg Ala Arg His Glu
65 70 75 80
Ala Gln Thr Leu Val Ala His Tyr Gln His Ser Pro Gln His Thr Val
85 90 95
Lys Ile His His Phe Asp Pro Glu Leu Ala Val Met Val Met Glu Asp
100 105 110
Leu Ser Asp His Arg Ile Trp Arg Gly Glu Leu Ile Ala Asn Val Tyr
115 120 125
Tyr Pro Gln Ala Ala Arg Gln Leu Gly Asp Tyr Leu Ala Gln Val Leu
130 135 140
Phe His Thr Ser Asp Phe Tyr Leu His Pro His Glu Lys Lys Ala Gln
145 150 155 160
Val Ala Gln Phe Ile Asn Pro Ala Met Cys Glu Ile Ser Glu Asp Leu
165 170 175
Ile Phe Asn Asp Pro Tyr Gln Ile His Glu Arg Asn Asn Tyr Pro Ala
180 185 190
Glu Leu Glu Ala Asp Val Ala Ala Leu Arg Asp Asp Ala Gln Leu Lys
195 200 205
Leu Ala Val Ala Ala Leu Lys His Arg Phe Phe Ala His Ala Glu Ala
210 215 220
Leu Leu His Gly Asp Leu His Ser Gly Ser Ile Phe Val Ala Glu Gly
225 230 235 240
Ser Leu Lys Ala Ile Asp Ala Glu Phe Gly Tyr Phe Gly Pro Ile Gly
245 250 255
Phe Asp Ile Gly Thr Ala Ile Gly Asn Leu Leu Leu Asn Tyr Cys Gly
260 265 270
Leu Pro Gly Gln Leu Gly Ile Arg Asp Ala Ala Ala Ala Arg Glu Gln
275 280 285
Arg Leu Asn Asp Ile His Gln Leu Trp Thr Thr Phe Ala Glu Arg Phe
290 295 300
Gln Ala Leu Ala Ala Glu Lys Thr Arg Asp Ala Ala Leu Ala Tyr Pro
305 310 315 320
Gly Tyr Ala Ser Ala Phe Leu Lys Lys Val Trp Ala Asp Ala Val Gly
325 330 335
Phe Cys Gly Ser Glu Leu Ile Arg Arg Ser Val Gly Leu Ser His Val
340 345 350
Ala Asp Ile Asp Thr Ile Gln Asp Asp Ala Met Arg His Glu Cys Leu
355 360 365
Arg His Ala Ile Thr Leu Gly Arg Ala Leu Ile Val Leu Ala Glu Arg
370 375 380
Ile Asp Ser Val Asp Glu Leu Leu Ala Arg Val Arg Gln Tyr Ser Leu
385 390 395 400
Glu His His His His His His
405
<210> 6
<211> 1224
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多核苷酸
<220>
<223> MTR激酶DNA序列
<400> 6
atgagccagt atcatacctt caccgcgcat gatgcggtgg cgtatgcgca gcaatttgcg 60
ggcattgata acccgagcga gctggttagc gcgcaagaag ttggtgacgg caacctgaac 120
ctggtgttca aggtttttga tcgtcagggt gtgagccgtg cgatcgttaa acaagcgctg 180
ccgtaccccc gttgcgttgg tgaaagctgg ccgctgaccc tggaccgtgc gcgtcatgaa 240
gcgcagaccc tggtggcgca ctatcagcac agcccgcaac acaccgttaa gatccaccac 300
ttcgatccgg agctggcggt gatggttatg gaagacctga gcgatcaccg tatttggcgt 360
ggtgagctga tcgcgaacgt gtactatccg caggcggcgc gtcaactggg tgactacctg 420
gcgcaggttc tgttccacac cagcgatttt tatctgcacc cgcacgagaa gaaagcgcag 480
gtggcgcaat tcattaaccc ggcgatgtgc gagatcagcg aagacctgat ttttaacgat 540
ccgtaccaga ttcacgaacg taacaactat ccggcggagc tggaagcgga tgtggcggcg 600
ctgcgtgatg atgcgcaact gaagctggcg gttgcggcgc tgaaacaccg tttctttgcg 660
catgcggagg cgctgctgca tggtgacctt cacagcggca gcatcttcgt tgcggagggt 720
agcctgaagg cgatcgacgc ggaattcggt tactttggcc cgatcggttt tgatattggt 780
accgcgatcg gcaacctgct gctgaactat tgcggtctgc cgggtcaact gggtattcgt 840
gatgcggcgg cggcgcgtga acagcgtctg aacgatatcc accaactgtg gaccaccttc 900
gcggagcgtt ttcaagcgct ggcggcggaa aagacccgtg acgcggcgct ggcgtacccg 960
ggttatgcga gcgcgttcct gaagaaagtg tgggcggatg cggttggttt ttgcggcagc 1020
gagctgattc gtcgtagcgt gggcctgagc cacgttgcgg acatcgatac cattcaggac 1080
gatgcgatgc gtcacgaatg cctgcgtcac gcgatcaccc tgggtcgtgc gctgattgtt 1140
ctggcggagc gtatcgacag cgtggatgaa ctgctggcgc gtgttcgtca atacagcctc 1200
gagcaccacc accaccacca ctga 1224
<210> 7
<211> 407
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多肽
<220>
<223> MTR激酶AA序列
<400> 7
Met Ser Gln Tyr His Thr Phe Thr Ala Asp Asp Ala Val Ala Tyr Ala
1 5 10 15
Gln Gln Phe Ala Gly Ile Asp Asn Pro Ser Glu Leu Val Ser Ala Gln
20 25 30
Glu Val Gly Asp Gly Asn Leu Asn Leu Val Phe Lys Val Phe Asp Arg
35 40 45
Gln Gly Val Ser Arg Ala Ile Val Lys Gln Ala Leu Pro Tyr Pro Arg
50 55 60
Arg Val Gly Pro Ser Trp Pro Leu Thr Leu Asp Arg Ala Arg His Glu
65 70 75 80
Ala Gln Thr Leu Val Ala His Tyr Gln His Ser Pro Gln His Thr Val
85 90 95
Lys Ile His His Phe Asp Pro Glu Leu Ala Val Met Val Met Glu Asp
100 105 110
Leu Ser Asp His Arg Ile Trp Arg Gly Glu Leu Ile Ala Asn Val Tyr
115 120 125
Tyr Pro Gln Ala Ala Arg Gln Leu Gly Asp Tyr Leu Ala Gln Val Leu
130 135 140
Phe His Thr Ser Asp Phe Tyr Leu His Pro His Glu Lys Lys Ala Gln
145 150 155 160
Val Ala Gln Phe Ile Asn Pro Ala Met Cys Glu Ile Ser Glu Asp Leu
165 170 175
Val Phe Asn Asp Pro Tyr Gln Ile His Glu Arg Asn Asn Tyr Pro Ala
180 185 190
Glu Leu Glu Ala Asp Val Ala Ala Leu Arg Asp Asp Ala Gln Leu Lys
195 200 205
Leu Ala Val Ala Ala Leu Lys His Arg Phe Phe Ala His Ala Glu Ala
210 215 220
Leu Leu His Gly Asp Leu His Thr Gly Ser Ile Phe Val Ala Glu Gly
225 230 235 240
Ser Leu Lys Val Ile Asp Ala Glu Phe Gly Tyr Phe Gly Pro Ile Gly
245 250 255
Phe Asp Ile Gly Thr Ala Ile Gly Asn Leu Leu Leu Asn Tyr Cys Gly
260 265 270
Leu Pro Gly Gln Leu Gly Ile Arg Asp Ala Ala Ala Ala Arg Glu Gln
275 280 285
Arg Leu Asn Asp Ile His Gln Leu Trp Thr Thr Phe Ala Glu Arg Phe
290 295 300
Gln Ala Leu Ala Ala Glu Lys Thr Arg Asp Ala Ala Leu Ala Tyr Pro
305 310 315 320
Gly Tyr Ala Ser Ala Phe Leu Lys Lys Val Trp Ala Asp Ala Val Gly
325 330 335
Phe Cys Gly Ser Glu Leu Ile Arg Arg Ser Val Gly Leu Ala His Val
340 345 350
Ala Asp Ile Asp Thr Ile Gln Asp Asp Ala Met Arg His Glu Cys Leu
355 360 365
Arg Glu Ala Ile Thr Leu Gly Arg Ala Leu Ile Val Leu Ala Glu Arg
370 375 380
Ile Asp Ser Val Asp Glu Leu Leu Ala Arg Val Arg Gln Tyr Ser Leu
385 390 395 400
Glu His His His His His His
405
<210> 8
<211> 1224
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多核苷酸
<220>
<223> MTR激酶DNA序列
<400> 8
atgagccagt atcatacctt caccgcggat gatgcggtgg cgtatgcgca gcaatttgcg 60
ggcattgata acccgagcga gctggttagc gcgcaagaag ttggtgacgg caacctgaac 120
ctggtgttca aggtttttga tcgtcagggt gtgagccgtg cgatcgttaa acaagcgctg 180
ccgtaccccc gtcgcgttgg tccgagctgg ccgctgaccc tggaccgtgc ccgtcatgaa 240
gcgcagaccc tggttgcgca ctatcagcac agcccgcaac acaccgttaa gatccaccac 300
ttcgatccgg agctggcggt gatggttatg gaagacctga gcgatcaccg tatttggcgt 360
ggtgagctga tcgcgaacgt gtactatccg caggcggcgc gtcaactggg tgactacctg 420
gcgcaggttc tgttccacac cagcgatttt tatctgcacc cgcacgagaa gaaagcgcag 480
gtggcgcaat tcattaaccc ggccatgtgc gaaatcagcg aagacctggt gtttaacgat 540
ccgtaccaga ttcacgaacg taacaactat ccggcggagc tggaagcgga tgtggcggcg 600
ctgcgtgatg atgcgcaact gaagctggcg gttgcggcgc tgaaacaccg tttctttgcg 660
catgcggagg cgctgctgca tggtgacctt cacaccggca gcatcttcgt tgcggagggt 720
agcctgaagg tgatcgacgc ggaattcggt tactttggcc cgatcggttt tgatattggt 780
accgcgatcg gcaacctgct gctgaactat tgcggtctgc cgggtcaact gggtattcgt 840
gatgcggcgg cggcgcgtga acagcgtctg aacgatatcc accaactgtg gaccaccttc 900
gcggagcgtt ttcaagcgct ggcggcggaa aagacccgtg acgcggcgct ggcgtacccg 960
ggttatgcga gcgcgttcct gaagaaagtg tgggcggatg cggttggttt ttgcggcagc 1020
gagctgattc gtcgtagcgt gggcctggcg cacgttgcgg acatcgatac cattcaggac 1080
gatgcgatgc gtcacgaatg cctgcgtgaa gcgatcaccc tgggtcgtgc gctgattgtt 1140
ctggcggagc gcatcgacag cgtggatgaa ctgctggcgc gtgttcgtca atacagcctc 1200
gagcaccacc accaccacca ctga 1224
<210> 9
<211> 407
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多肽
<220>
<223> MTR激酶AA序列
<400> 9
Met Ser Gln Tyr His Thr Phe Thr Ala Asp Asp Ala Val Ala Tyr Ala
1 5 10 15
Gln Gln Phe Ala Gly Ile Asp Asn Pro Ser Glu Leu Val Ser Ala Gln
20 25 30
Glu Val Gly Asp Gly Asn Leu Asn Leu Val Phe Lys Val Phe Asp Arg
35 40 45
Gln Gly Val Ser Arg Ala Ile Val Lys Gln Ala Leu Pro Tyr Pro Arg
50 55 60
Ala Val Gly Pro Ser Trp Pro Leu Thr Leu Asp Arg Ala Arg His Glu
65 70 75 80
Ala Gln Thr Leu Val Ala His Tyr Gln His Ser Pro Gln His Thr Val
85 90 95
Lys Ile His His Phe Asp Pro Glu Leu Ala Val Met Val Met Glu Asp
100 105 110
Leu Ser Asp His Arg Ile Trp Arg Gly Glu Leu Ile Ala Asn Val Tyr
115 120 125
Tyr Pro Gln Ala Ala Arg Gln Leu Gly Asp Tyr Leu Ala Gln Val Leu
130 135 140
Phe His Thr Ser Asp Phe Tyr Leu His Pro His Glu Lys Lys Ala Gln
145 150 155 160
Val Ala Gln Phe Ile Asn Pro Gly Met Cys Glu Ile Ser Glu Asp Leu
165 170 175
Ser Phe Asn Asp Pro Tyr Gln Ile His Glu Arg Asn Asn Tyr Pro Ala
180 185 190
Glu Leu Glu Ala Asp Val Ala Ala Leu Arg Asp Asp Ala Gln Leu Lys
195 200 205
Leu Ala Val Ala Ala Leu Lys His Arg Phe Phe Ala His Ala Glu Ala
210 215 220
Leu Leu His Gly Asp Leu His Ser Gly Ser Ile Phe Val Ala Glu Gly
225 230 235 240
Ser Leu Lys Val Ile Asp Ala Glu Phe Gly Tyr Phe Gly Pro Ile Gly
245 250 255
Phe Asp Ile Gly Thr Ala Ile Gly Asn Leu Leu Leu Asn Tyr Cys Gly
260 265 270
Leu Pro Gly Gln Leu Gly Ile Arg Asp Ala Ala Ala Ala Arg Glu Gln
275 280 285
Arg Leu Asn Asp Ile His Gln Leu Trp Thr Thr Phe Ala Glu Arg Phe
290 295 300
Gln Ala Leu Ala Ala Glu Lys Thr Arg Asp Ala Ala Leu Ala Tyr Pro
305 310 315 320
Gly Tyr Ala Ser Ala Phe Leu Lys Lys Val Trp Ala Asp Ala Val Gly
325 330 335
Phe Cys Gly Ser Glu Leu Ile Arg Arg Ser Val Gly Leu Ser His Val
340 345 350
Ala Asp Ile Asp Thr Ile Gln Asp Asp Ala Met Arg His Glu Cys Leu
355 360 365
Arg His Ala Ile Thr Leu Gly Arg Ala Leu Ile Val Leu Ala Glu Thr
370 375 380
Ile Asp Ser Val Asp Glu Leu Leu Ala Arg Val Arg Gln Tyr Ser Leu
385 390 395 400
Glu His His His His His His
405
<210> 10
<211> 1224
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多核苷酸
<220>
<223> MTR激酶DNA序列
<400> 10
atgagccagt atcatacctt caccgcggat gatgcggtgg cgtatgcgca gcaatttgcg 60
ggcattgata acccgagcga gctggttagc gcgcaagaag ttggtgacgg caacctgaac 120
ctggtgttca aggtttttga tcgtcagggt gtgagccgtg cgatcgttaa acaagcgctg 180
ccgtaccccc gtgcggttgg tccgagctgg ccgctgaccc tggaccgtgc gcgtcatgaa 240
gcgcagaccc tggtggcgca ctatcagcac agcccgcaac acaccgttaa gatccaccac 300
ttcgatccgg agctggcggt gatggttatg gaagacctga gcgatcaccg tatttggcgt 360
ggtgagctga tcgcgaacgt gtactatccg caggcggcgc gtcaactggg tgactacctg 420
gcgcaggttc tgttccacac cagcgatttt tatctgcacc cgcacgagaa gaaagcgcag 480
gtggcgcaat tcattaaccc gggcatgtgc gaaatcagcg aagacctgag ctttaacgat 540
ccgtaccaga ttcacgaacg taacaactat ccggcggagc tggaagcgga tgtggcggcg 600
ctgcgtgatg atgcgcaact gaagctggcg gttgcggcgc tgaaacaccg tttctttgcg 660
catgcggagg cgctgctgca tggtgacctt cacagcggca gcatcttcgt tgcggagggt 720
agcctgaagg tgatcgacgc ggaattcggt tactttggcc cgatcggttt tgatattggt 780
accgcgatcg gcaacctgct gctgaactat tgcggtctgc cgggtcaact gggtattcgt 840
gatgcggcgg cggcgcgtga acagcgtctg aacgatatcc accaactgtg gaccaccttc 900
gcggagcgtt ttcaagcgct ggcggcggaa aagacccgtg acgcggcgct ggcgtacccg 960
ggttatgcga gcgcgttcct gaagaaagtg tgggcggatg cggttggttt ttgcggcagc 1020
gagctgattc gtcgtagcgt gggcctgtcg cacgttgcgg acatcgatac cattcaggac 1080
gatgcgatgc gtcacgaatg cctgcgtcac gcgatcaccc tgggtcgtgc gctgattgtt 1140
ctggcggaga ccatcgacag cgtggatgaa ctgctggcgc gtgttcgtca atacagcctc 1200
gagcaccacc accaccacca ctga 1224
<210> 11
<211> 407
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多肽
<220>
<223> MTR激酶AA序列
<400> 11
Met Ser Gln Tyr His Thr Phe Thr Ala Asp Asp Ala Val Ala Tyr Ala
1 5 10 15
Gln Gln Phe Ala Gly Ile Asp Asn Pro Ser Glu Leu Val Ser Ala Gln
20 25 30
Glu Val Gly Asp Gly Asn Leu Asn Leu Val Phe Lys Val Phe Asp Arg
35 40 45
Gln Gly Val Ser Arg Ala Ile Val Lys Gln Ala Leu Pro Tyr Pro Arg
50 55 60
Arg Val Gly Pro Ser Trp Pro Leu Thr Leu Asp Arg Ala Arg His Glu
65 70 75 80
Ala Gln Thr Leu Val Ala His Tyr Gln His Ser Pro Gln His Thr Val
85 90 95
Lys Ile Phe His Phe Asp Pro Glu Leu Ala Val Met Val Met Glu Asp
100 105 110
Leu Ser Asp His Arg Ile Trp Arg Gly Glu Leu Ile Ala Asn Val Tyr
115 120 125
Tyr Pro Gln Ala Ala Arg Gln Leu Gly Asp Tyr Leu Ala Gln Val Leu
130 135 140
Phe His Thr Ser Asp Phe Tyr Leu His Pro His Glu Lys Lys Arg Gln
145 150 155 160
Val Ala Gln Phe Ile Asn Pro Ala Met Cys Gly Ile Ser Glu Asp Leu
165 170 175
Val Phe Asn Asp Pro Tyr Gln Ile His Glu Arg Asn Asn Tyr Pro Ala
180 185 190
Glu Leu Glu Ala Gln Val Ala Ala Leu Arg Asp Asp Ala Gln Leu Lys
195 200 205
Leu Ala Val Ala Ala Leu Lys His Arg Phe Phe Ala His Ala Glu Ala
210 215 220
Leu Leu His Gly Asp Leu His Thr Gly Ser Ile Phe Val Lys Glu Gly
225 230 235 240
Ser Leu Lys Val Ile Asp Ala Glu Phe Gly Tyr Phe Gly Pro Ile Gly
245 250 255
Phe Asp Ile Gly Thr Ala Ile Gly Asn Leu Leu Leu Asn Tyr Cys Gly
260 265 270
Leu Pro Gly Gln Leu Gly Ile Arg Asp Ala Ala Ala Ala Arg Glu Gln
275 280 285
Arg Leu Asn Asp Ile His Gln Leu Trp Thr Thr Phe Ala Glu Arg Phe
290 295 300
Gln Ala Leu Ala Ala Glu Lys Thr Arg Asp Ala Ala Leu Ala Tyr Pro
305 310 315 320
Gly Tyr Ala Ser Ala Phe Leu Lys Lys Val Trp Ala Asp Ala Val Gly
325 330 335
Phe Cys Gly Ser Glu Leu Ile Arg Arg Ser Val Gly Leu Ala His Val
340 345 350
Ala Asp Ile Asp Thr Ile Gln Asp Asp Ala Met Arg His Glu Cys Leu
355 360 365
Arg Glu Ala Ile Thr Leu Gly Arg Ala Leu Ile Val Leu Ala Glu Arg
370 375 380
Ile Asp Ser Val Asp Glu Leu Leu Ala Arg Val Arg Gln Tyr Ser Leu
385 390 395 400
Glu His His His His His His
405
<210> 12
<211> 407
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多肽
<220>
<223> MTR激酶AA序列
<400> 12
Met Ser Gln Tyr His Thr Phe Thr Ala Asp Asp Ala Val Ala Tyr Ala
1 5 10 15
Gln Gln Phe Ala Gly Ile Asp Asn Pro Ser Glu Leu Val Ser Ala Gln
20 25 30
Glu Val Gly Asp Gly Asn Leu Asn Leu Val Phe Lys Val Phe Asp Arg
35 40 45
Gln Gly Val Ser Arg Ser Ile Val Lys Gln Ala Leu Pro Tyr Pro Arg
50 55 60
Arg Val Gly Pro Ser Trp Pro Leu Thr Leu Asp Arg Ala Arg His Glu
65 70 75 80
Ala Gln Thr Leu Val Ala His Tyr Gln His Ser Pro Gln His Thr Val
85 90 95
Lys Ile Phe His Phe Asp Pro Glu Leu Ala Val Met Val Met Glu Asp
100 105 110
Leu Ser Asp His Arg Ile Trp Arg Gly Glu Leu Ile Ala Asn Val Tyr
115 120 125
Tyr Pro Gln Ala Ala Arg Gln Leu Gly Asp Tyr Leu Ala Gln Val Leu
130 135 140
Phe His Thr Ser Asp Phe Tyr Leu His Pro His Glu Lys Lys Arg Gln
145 150 155 160
Val Ala Gln Phe Ile Asn Pro Ala Met Cys Gly Ile Ser Glu Asp Leu
165 170 175
Val Phe Asn Asp Pro Tyr Gln Ile His Glu Arg Asn Asn Tyr Pro Ala
180 185 190
Glu Leu Glu Ala Gln Val Ala Ala Leu Arg Asp Asp Ala Gln Leu Lys
195 200 205
Leu Ala Val Ala Ala Leu Lys His Arg Phe Phe Ala His Ala Glu Ala
210 215 220
Leu Leu His Gly Asp Leu His Thr Gly Ser Ile Phe Val Lys Glu Gly
225 230 235 240
Ser Leu Lys Val Ile Asp Ala Glu Phe Gly Tyr Phe Gly Pro Ile Gly
245 250 255
Phe Asp Ile Gly Thr Ala Ile Gly Asn Leu Leu Leu Asn Tyr Cys Gly
260 265 270
Leu Pro Gly Gln Leu Gly Ile Arg Asp Ala Ala Ala Ala Arg Glu Gln
275 280 285
Arg Leu Asn Asp Ile His Gln Leu Trp Thr Thr Phe Ala Glu Arg Phe
290 295 300
Gln Ala Leu Ala Ala Glu Lys Thr Arg Asp Ala Ala Leu Arg Tyr Pro
305 310 315 320
Gly Tyr Ala Ser Ala Phe Leu Lys Lys Val Trp Ala Asp Ala Val Gly
325 330 335
Phe Cys Gly Ser Glu Leu Ile Arg Arg Ser Val Gly Leu Ala His Val
340 345 350
Ala Asp Ile Asp Thr Ile Gln Asp Asp Ala Met Arg His Glu Cys Leu
355 360 365
Arg Glu Ala Ile Thr Leu Gly Arg Ala Leu Ile Val Leu Ala Glu Arg
370 375 380
Ile Asp Ser Val Asp Glu Leu Leu Ala Arg Val Arg Gln Tyr Ser Leu
385 390 395 400
Glu His His His His His His
405
<210> 13
<211> 413
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多肽
<220>
<223> 乙酸激酶
<400> 13
Met Gly Ser His His His His His His Gly Ser Arg Val Leu Asn Ile
1 5 10 15
Asn Ser Gly Ser Ser Ser Ile Lys Tyr Gln Leu Ile Glu Met Glu Gly
20 25 30
Glu Lys Val Leu Cys Lys Gly Ile Ala Glu Arg Ile Gly Ile Glu Gly
35 40 45
Ser Arg Leu Val His Arg Val Gly Asp Glu Lys His Val Ile Glu Arg
50 55 60
Glu Leu Pro Asp His Glu Glu Ala Leu Lys Leu Ile Leu Asn Thr Leu
65 70 75 80
Val Asp Glu Lys Leu Gly Val Ile Lys Asp Leu Lys Glu Ile Asp Ala
85 90 95
Val Gly His Arg Val Val His Gly Gly Glu Arg Phe Lys Glu Ser Val
100 105 110
Leu Val Asp Glu Glu Val Leu Lys Ala Ile Glu Glu Val Ser Pro Leu
115 120 125
Ala Pro Leu His Asn Pro Ala Asn Leu Met Gly Ile Lys Ala Ala Met
130 135 140
Lys Leu Leu Pro Gly Val Pro Asn Val Gln Val Phe Asp Thr Ala Phe
145 150 155 160
His Gln Thr Ile Pro Gln Lys Ala Tyr Leu Tyr Ala Ile Pro Tyr Glu
165 170 175
Tyr Tyr Glu Lys Tyr Lys Ile Arg Arg Tyr Gly Phe His Gly Ile Ser
180 185 190
His Arg Tyr Val Ser Lys Arg Ala Ala Glu Ile Leu Gly Lys Lys Leu
195 200 205
Glu Glu Leu Lys Ile Ile Thr Cys His Ile Gly Asn Gly Ala Ser Val
210 215 220
Ala Ala Val Lys Tyr Gly Lys Cys Val Asp Thr Ser Met Gly Phe Thr
225 230 235 240
Pro Leu Glu Gly Leu Val Met Gly Thr Arg Ser Gly Asp Leu Asp Pro
245 250 255
Ala Ile Pro Phe Phe Ile Met Glu Lys Glu Gly Ile Ser Pro Gln Glu
260 265 270
Met Tyr Asp Ile Leu Asn Lys Lys Ser Gly Val Tyr Gly Leu Ser Lys
275 280 285
Gly Phe Ser Ser Asp Met Arg Asp Asn Phe Glu Ala Ala Leu Lys Gly
290 295 300
Asp Glu Trp Cys Lys Leu Val Leu Glu Ile Tyr Asp Tyr Arg Ile Ala
305 310 315 320
Lys Tyr Ile Gly Ala Tyr Ala Ala Ala Met Asn Gly Val Asp Ala Ile
325 330 335
Val Phe Thr Ala Gly Val Gly Glu Asn Ser Pro Ile Thr Arg Glu Asp
340 345 350
Val Cys Lys Tyr Leu Glu Phe Leu Gly Val Lys Leu Asp Lys Gln Lys
355 360 365
Asn Glu Glu Thr Ile Leu Gly Lys Glu Gly Ile Ile Ser Thr Pro Asp
370 375 380
Ser Arg Val Lys Val Leu Val Val Pro Thr Asn Glu Glu Leu Met Ile
385 390 395 400
Ala Arg Asp Thr Lys Glu Ile Val Glu Lys Ile Gly Arg
405 410

Claims (23)

1.一种多肽,其中所述多肽包含具有如下氨基酸序列的区域,所述氨基酸序列与SEQID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11或SEQ ID NO:12中任何一个的残基具有至少90%的序列同一性。
2.根据权利要求1的多肽,其中所述多肽包含具有如下氨基酸序列的区域,所述氨基酸序列与SEQ ID NO:3的残基具有至少90%的序列同一性。
3.根据权利要求1的多肽,其中所述多肽包含具有如下氨基酸序列的区域,所述氨基酸序列与SEQ ID NO:5的残基具有至少90%的序列同一性。
4.根据权利要求1的多肽,其中所述多肽包含具有如下氨基酸序列的区域,所述氨基酸序列与SEQ ID NO:7的残基具有至少90%的序列同一性。
5.根据权利要求1的多肽,其中所述多肽包含具有如下氨基酸序列的区域,所述氨基酸序列与SEQ ID NO:9的残基具有至少90%的序列同一性。
6.根据权利要求1的多肽,其中所述多肽包含具有如下氨基酸序列的区域,所述氨基酸序列与SEQ ID NO:11的残基具有至少90%的序列同一性。
7.根据权利要求1的多肽,其中所述多肽包含具有如下氨基酸序列的区域,所述氨基酸序列与SEQ ID NO:12的残基具有至少90%的序列同一性。
8.一种多肽,其中所述多肽由与SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8或SEQ ID NO二10中任何一个的残基具有至少90%的序列同一性的DNA序列编码。
9.根据权利要求8的多肽,其中所述多肽由与SEQ ID NO:4的残基具有至少90%的序列同一性的DNA序列编码。
10.根据权利要求8的多肽,其中所述多肽由与SEQ ID NO:6的残基具有至少90%的序列同一性的DNA序列编码。
11.根据权利要求8的多肽,其中所述多肽由与SEQ ID NO:8的残基具有至少90%的序列同一性的DNA序列编码。
12.根据权利要求8的多肽,其中所述多肽由与SEQ ID NO:10的残基具有至少90%的序列同一性的DNA序列编码。
13.一种表达载体,其包含根据权利要求1到权利要求12中任一项的多肽,其可操作地连接到适合于指导所编码的多肽在宿主细胞中的表达的一个或多个控制序列。
14.权利要求13的表达载体,其中所述控制序列包含启动子。
15.权利要求14的表达载体,其中所述启动子包括大肠杆菌启动子。
16.一种宿主细胞,其包含权利要求13的表达载体。
17.权利要求16的宿主细胞,其中所述宿主细胞是大肠杆菌。
18.一种用于制备磷酸化核糖或磷酸化核糖衍生物或其盐的方法,所述方法包括在根据权利要求1到权利要求12中任一项的多肽的存在下,使核糖或核糖衍生物与磷酸源反应。
19.权利要求18的方法,其中所述核糖或核糖衍生物选自:
20.权利要求18的方法,其中所述方法包括在根据权利要求1到权利要求12中任一项的多肽的存在下,使核糖与磷酸源反应:
21.权利要求18的方法,其中所述方法包括在根据权利要求1到权利要求12中任一项的多肽的存在下,使核糖与磷酸源反应:
22.一种化合物,其选自
及其盐。
23.权利要求22的化合物,其中所述化合物是
CN202180084368.9A 2020-12-14 2021-12-09 S-甲基硫核糖激酶多肽以及s-甲基硫核糖激酶多肽的制备和使用方法 Pending CN116897210A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US63/125154 2020-12-14
US202163278284P 2021-11-11 2021-11-11
US63/278284 2021-11-11
PCT/US2021/062503 WO2022132543A1 (en) 2020-12-14 2021-12-09 S-methylthioribose kinase polypeptides and processes for making and using s-methylthioribose kinase polypeptides

Publications (1)

Publication Number Publication Date
CN116897210A true CN116897210A (zh) 2023-10-17

Family

ID=88312479

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180084368.9A Pending CN116897210A (zh) 2020-12-14 2021-12-09 S-甲基硫核糖激酶多肽以及s-甲基硫核糖激酶多肽的制备和使用方法

Country Status (1)

Country Link
CN (1) CN116897210A (zh)

Similar Documents

Publication Publication Date Title
US11795445B2 (en) Engineered phosphopentomutase variant enzymes
US11198861B2 (en) Engineered phenylalanine ammonia lyase polypeptides
JP2021502068A (ja) トランスグルタミナーゼバリアント
KR20210031926A (ko) 조작된 퓨린 뉴클레오사이드 포스포릴라제 변이체 효소
US10889806B2 (en) Engineered pantothenate kinase variant enzymes
US20220243183A1 (en) Engineered sucrose phosphorylase variant enzymes
CN114760980A (zh) 针对10-乙酰基-3,7-二羟基吩噁嗪的过氧化物酶活性
CN116897210A (zh) S-甲基硫核糖激酶多肽以及s-甲基硫核糖激酶多肽的制备和使用方法
US20230174992A1 (en) Reductase enzymes and processes for making and using reductase enzymes
WO2022132543A1 (en) S-methylthioribose kinase polypeptides and processes for making and using s-methylthioribose kinase polypeptides
US11898174B2 (en) Engineered uridine phosphorylase variant enzymes
WO2022251402A1 (en) Transaminase enzymes for the transamination of (1s,5r)-6,8-dioxabicyclo[3.2.1]octan-4-one
US20230374486A1 (en) Engineered phosphopentomutase variant enzymes
CN116761614A (zh) 工程化尿苷磷酸化酶变体酶
CN116615534A (zh) 工程化泛酸激酶变体酶

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination