CN101784669B - 用于(r)-3-羟基四氢噻吩的立体选择性制备的改善的酮还原酶多肽 - Google Patents

用于(r)-3-羟基四氢噻吩的立体选择性制备的改善的酮还原酶多肽 Download PDF

Info

Publication number
CN101784669B
CN101784669B CN200880104011.7A CN200880104011A CN101784669B CN 101784669 B CN101784669 B CN 101784669B CN 200880104011 A CN200880104011 A CN 200880104011A CN 101784669 B CN101784669 B CN 101784669B
Authority
CN
China
Prior art keywords
residue
acid
aminoacid sequence
difference
amino
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN200880104011.7A
Other languages
English (en)
Other versions
CN101784669A (zh
Inventor
杰克·梁
史提芬尼·J·珍妮
艾米丽·穆德弗
拉玛·沃兰德里
詹姆士·拉伦德
吉伽特·哈思曼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pfizer Inc
Codexis Inc
Original Assignee
Kodak Heath
Pfizer Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=40076739&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=CN101784669(B) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Kodak Heath, Pfizer Inc filed Critical Kodak Heath
Publication of CN101784669A publication Critical patent/CN101784669A/zh
Application granted granted Critical
Publication of CN101784669B publication Critical patent/CN101784669B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0006Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/16Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing two or more hetero rings
    • C12P17/167Heterorings having sulfur atoms as ring heteroatoms, e.g. vitamin B1, thiamine nucleus and open chain analogs
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/01Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
    • C12Y101/01184Carbonyl reductase (NADPH) (1.1.1.184)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P20/00Technologies relating to chemical industry
    • Y02P20/50Improvements relating to the production of bulk chemicals
    • Y02P20/52Improvements relating to the production of bulk chemicals using catalysts, e.g. selective catalysts

Abstract

本公开提供与天然存在的野生型酮还原酶相比,具有改善的性质的工程酮还原酶。还提供了编码该工程酮还原酶的多核苷酸、能够表达该工程酮还原酶的宿主细胞和使用该工程酮还原酶合成手性化合物的方法。

Description

用于(R)-3-羟基四氢噻吩的立体选择性制备的改善的酮还原酶多肽
1.相关申请的交叉引用
本申请根据35 U.S.C.§119(e)要求2007年8月24日提交的申请序列号60/957,974的权益,其内容通过引用在此并入。
2.技术领域
本公开涉及工程多肽以及该多肽的用途。
3.序列表、表格或计算机程序的引用
根据37 C.F.R.§1.821,经EFS-Web与本申请同时提交的计算机可读形式(CRF)的序列表,文件名为376247-016.txt,通过引用其整体并入。序列表的电子拷贝产生于2008年8月24日,文件大小272 Kb。
4.背景
属于酮还原酶(KRED)或羰基还原酶类(EC 1.1.1.184)的酶用于从对应的前立体异构体酮底物合成光学活性醇。KRED通常将酮或醛底物转化为对应的醇产物,但是还可以催化逆反应,将醇底物氧化为对应的酮/醛产物。酶,诸如KRED,对酮和醛的还原和对醇的氧化需要辅因子,最常见地是还原型烟酰胺腺嘌呤二核苷酸(NADH)或还原型烟酰胺腺嘌呤二核苷酸磷酸(NADPH)和用于氧化反应的烟酰胺腺嘌呤二核苷酸(NAD)或烟酰胺腺嘌呤二核苷酸磷酸(NADP)。NADH和NADPH作为电子供体,而NAD和NADP作为电子受体。经常观察到酮还原酶和醇脱氢酶接受磷酸化或未磷酸化的辅因子(在其氧化和还原状态下)。
KRED酶可以在大范围的细菌和酵母中发现(参见综述:Kraus和Waldman,Enzyme catalysis in organic synthesis(有机合成中的酶催化),第1和2卷,VCH Weinheim 1995;Faber,K.,Biotransformations in organicchemistry(有机化学中的生物转化),第4版Springer,Berlin Heidelberg NewYork.2000;Hummel和Kula,1989,Eur.J.Biochem.184:1-13)。已经报道了几种KRED基因和酶序列,例如木兰假丝酵母(Candida magnoliae)(Genbank登录号JC7338;GI:11360538)、近平滑假丝酵母(Candidaparapsilosis)(Genbank登录号BAA24528.1;GI:2815409)、赭色掷孢酵母(Sporobolomyces salmonicolor)(Genbank登录号AF 160799;GI:6539734)。
为了避开制备关键化合物的许多化学合成过程,酮还原酶的使用在不断增加,以将不同的酮底物酶促转化为手性醇产物。这些应用可以采用表达酮还原酶的全细胞用于生物催化的酮和醛还原,或在其中在全细胞中存在多个酮还原酶将不利地影响所需产物的立体纯和收率的那些实例中,采用纯化酶。对于体外应用,辅因子(NADH或NADPH)再生酶,诸如葡糖脱氢酶(GDH)、甲酸脱氢酶等等,与酮还原酶联合使用。使用酮还原酶制备有用的化合物的实例包括4-氯乙酰乙酸酯类的不对称还原(Zhou,J.Am.Chem.Soc.1983105:5925-5926;Santaniello,J.Chem.Res.(S)1984:132-133;美国专利号5,559,030;美国专利号5,700,670和美国专利号5,891,685);二氧羧酸类的还原(例如美国专利号6,399,339);(S)氯-5-羟基-3-氧代己酸叔丁酯的还原(例如美国专利号6,645,746和WO01/40450);基于吡咯并三嗪的化合物的还原(例如美国申请号2006/0286646);取代的乙酰苯的还原(例如美国专利号6,800,477);以及酮基四氢噻吩(ketothiolanes)的还原(WO 2005/054491)。
期望鉴别可用于执行多种酮和醛底物向其对应的手性醇产物转化的其他酮还原酶。
5.概述
本公开提供具有将3-酮基四氢噻吩(此后称为“底物”)还原至(R)-3-羟基四氢噻吩(此后称为“产物”)的能力的酮还原酶多肽、编码这种多肽的多核苷酸和使用该多肽的方法。一般来说,本公开的工程酮还原酶多肽与获自克菲尔乳杆菌(Lactobacillus kefir;“L.kefir”;SEQ ID NO:4)、短乳杆菌(Lactobacillus brevis;“L.brevis”;SEQ ID NO:2)和稍小乳杆菌(Lactobacillus minor;“L.minor”;SEQ ID NO:142)的天然存在的野生型酮还原酶相比,在将确定的酮底物转化成对应的手性醇产物方面,具有改善的性质。酶活性的改善可包括立体选择性、酶活性、热稳定性、溶剂稳定性、降低的产物抑制或其组合的增加。
在一些实施方案中,本公开的酮还原酶多肽包括其中对应SEQ IDNO:2、4或142的参考序列的145位的氨基酸残基不是酸性残基,即谷氨酸或天冬氨酸的氨基酸序列。如此,对应145位的残基是非酸性残基。在一些实施方案中,本公开的酮还原酶多肽具有其中对应145位的残基是极性残基的氨基酸序列。在一些实施方案中,这一对应X145的残基是丝氨酸。
在一些实施方案中,本公开的酮还原酶多肽具有与在对应X145的残基处具有丝氨酸的基于SEQ ID NO:2或SEQ ID NO:4或SEQ ID NO:142的参考序列(或其区域或结构域,诸如残基90-211)具有至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性的氨基酸序列,条件是酮还原酶多肽氨基酸序列在对应X145的残基处具有极性残基。在一些实施方案中,对应残基X145的残基是丝氨酸。在一些实施方案中,酮还原酶多肽基于SEQ ID NO:143、144或145的序列式或其结构域,诸如残基90-211,其中对应X145的残基是极性残基,特别是丝氨酸。在一些实施方案中,与参考序列,诸如SEQ IDNO:4、2或142的参考序列相比,酮还原酶多肽可在氨基酸序列或确定的结构域或区域中额外地具有一个或多个氨基酸残基差异。在一些实施方案中,结构域中的氨基酸序列差异可包括非保守的氨基酸取代、保守的氨基酸取代以及非保守的和保守的氨基酸取代的组合。其中可进行这种变化的多种氨基酸残基位置描述于本文中。
在一些实施方案中,本文描述的酮还原酶多肽能够以比来自克菲尔乳杆菌的野生型酶(即SEQ ID NO:4)高的立体异构体过量将底物立体选择性地还原成产物。在一些实施方案中,本文描述的酮还原酶多肽能够以至少约70%的立体异构体过量将底物酮基四氢噻吩立体选择性地还原成产物(R)-3-羟基四氢噻吩。
在一些实施方案中,本公开提供能够以超过约90%的立体异构体过量(s.e.)将底物还原成产物的高度立体选择性的酮还原酶多肽。具有这种高度立体选择性的示例性酮还原酶多肽包括但不限于包括对应SEQ ID NO:6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、86、88、90、92、94、96、100、102、104、106、108、110、112、126、128、130和134的氨基酸序列的多肽。
在一些实施方案中,本公开提供能够以超过约98%的s.e.将底物还原成产物的立体选择性的酮还原酶多肽。具有这种立体选择性的示例性多肽包括但不限于包括对应SEQ ID NO:6、8、10、18、20、22、24、26、28、30、34、36、38、40、42、50、52、54、58、62、66、70、72、76、78、80和134的氨基酸序列的多肽。
在一些实施方案中,与野生型酮还原酶相比,在将确定的酮底物还原成产物方面,工程酮还原酶多肽可具有增加的酶活性。改善的量的范围可从对应野生型酮还原酶的酶活性的1.5倍多达达2倍、5倍、10倍、20倍、25倍、50倍、75倍、100倍或更多倍的酶活性。在特定的实施方案中,工程酮还原酶表现出改善的酶活性,其范围为大于野生型酮还原酶的酶活性的1.5至50倍、1.5至100倍。能够将底物以超过野生型酶的速率转化成产物的示例性多肽包括但不限于包括对应SEQ ID NO:6、8、10、12、14、16、18、20、22、24、26、30、32、38、40、42、44、46、48、50、52、54、56、58、60、64、66、68、70、74、76、78、80、86、88、90、92、104、106、110、112、124、126、130和134的氨基酸序列的多肽。
在一些实施方案中,本公开提供具有超过野生型酶的改善的活性和稳定性,且可以以大于约95%s.e将底物还原成产物的酮还原酶多肽。具有这种能力的示例性多肽包括但不限于包括对应SEQ ID NO:6、8、12、14、22、24、26、30、32、38、42、44、46、50、52、56、58、60、64、66、68、70、74、76、78、80、82、86、88、90、92、104、106、110、112和134的氨基酸序列的多肽。
在一些实施方案中,本公开的酮还原酶多肽与野生型相比,在它们的热稳定性方面被改善,其按照由与野生型在高温下对比,酶活性的速率的提高所确定。具有改善的稳定性的示例性酮还原酶多肽包括但不限于包括对应SEQ ID NO:6、8、12、14、22、24、26、32、34、36、38、42、44、46、50、52、56、58、60、64、66、68、70、74、76、78、80、82、86、88、90、92、104、106、110、112、124和134的氨基酸序列的多肽。
在另一个方面,本公开提供编码本文描述的工程酮还原酶的多核苷酸或与此类多核苷酸在高度严格条件下杂交的多核苷酸。该多核苷酸可包含用于表达所编码的工程酮还原酶的启动子和其他调节元件,并且可利用针对具体所需表达系统所优化的密码子。示例性多核苷酸包括但不限于对应SEQ ID NO:5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131和133的核苷酸序列。
在另一个方面,为了操作和表达酮还原酶多肽的目的,本公开提供包括多核苷酸和/或表达载体的宿主细胞。这些宿主细胞可以是克菲尔乳杆菌、短乳杆菌或稍小乳杆菌,或它们可以是不同的生物体。这些宿主细胞可用于本文描述的工程酮还原酶的表达和分离,或可选地,它们可直接用于将3-酮基四氢噻吩底物转化为手性(R)-3-羟基四氢噻吩产物。
不论用全细胞、细胞提取物或纯化的酮还原酶执行所述方法,可使用单一酮还原酶,或可选地,可使用两种或更多种酮还原酶的混合物。
如上所示,本文描述的酮还原酶能够催化结构式(I)的化合物3-酮基四氢噻吩中的酮基
至对应结构式(II)的手性醇产物(R)-3-羟基四氢噻吩的还原反应
因此,在一些实施方案中,本公开提供将3-酮基四氢噻吩(“底物”)还原成(R)-3-羟基四氢噻吩(“产物”)的方法,所述方法包括用本公开的酮还原酶多肽在适合于将底物还原或转化为产物的反应条件下接触或孵育底物。在这一方法的一些实施方案中,底物被还原成具有至少超过约65%或至少超过野生型的立体异构体过量的产物。
在这一方法的一些实施方案中,底物以超过约90%s.e.被还原成产物,其中所述酮还原酶多肽包括对应SEQ ID NO:6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、86、88、90、92、94、96、100、102、104、106、108、110、112、126、128、130和134的氨基酸序列。
在这一方法的一些实施方案中,底物以超过约98%s.e.被还原成产物,其中所述酮还原酶多肽包括对应SEQ ID NO:6、8、10、18、20、22、24、26、28、30、34、36、38、40、42、50、52、54、58、62、66、70、72、76、78、80和134的氨基酸序列。
在这一用于将底物还原成产物的方法的一些实施方案中,与野生型酶(SEQ ID NO:4)对比,底物以至少1.5倍、2倍、3倍4倍、5倍、10倍、20倍或更多倍的提高的速率被还原成产物,其中所述酮还原酶多肽包括对应SEQ ID NO:6、8、10、12、14、16、18、20、22、24、26、30、32、38、40、42、44、46、48、50、52、54、56、58、60、64、66、68、70、74、76、78、80、86、88、90、92、104、106、110、112、124、126、130和134的氨基酸序列。
在一些实施方案中,所述方法涉及酮还原酶多肽在合成其他化合物,诸如药物化合物中的用途。在一些实施方案中,所述方法涉及酮还原酶多肽在合成具有以下结构式(III)的抗生素硫培南(CP-70,429)中的用途:
因此,在一些实施方案中,在合成结构式(III)的抗生素(即CP-70,429)的方法中,方法中的步骤可包括在适合于将结构式(I)的底物转化或还原成结构式(II)的产物的反应条件下,用任何本文描述的酮还原酶接触式(I)的底物。至少70%、80%、90%、95%、96%、97%、98%或99%或更高的立体异构体过量的结构式(II)的化合物可用于制备式(III)的化合物。
6.附图简述
图1阐释酮还原酶(KRED)在将底物式(I)的化合物3-酮基四氢噻吩转化成对应的式(II)的手性醇产物(R)-3-羟基四氢噻吩中的作用。在这一反应中,底物被生物催化地还原成对应的(R)-醇。这一还原使用本公开的KRED和诸如NADPH的辅因子。葡糖脱氢酶(GDH)可用于将NADP+转换/再循环为NADPH。葡萄糖转化成葡糖酸,其转而通过加入氢氧化钠转化成其钠盐(葡糖酸钠)。实施例9提供了用于进行该反应的非限制性方法。
7.详述
7.1定义
如本文所用,以下术语意在具有以下含义。
酮还原酶”和“KRED”在本文中可相互交换使用以指具有将羰基还原为其对应的醇的酶促能力的多肽。更加具体地,本文描述的酮还原酶多肽能够将上述的式(I)的化合物立体选择性地还原为对应的上述式(II)的产物。该多肽通常利用辅因子还原型烟酰胺腺嘌呤二核苷酸(NADH)或还原型烟酰胺腺嘌呤二核苷酸磷酸(NADPH)作为还原剂。如本文所用,酮还原酶包括天然存在的(野生型)酮还原酶以及由人工处理产生的非天然存在的工程多肽。
编码序列”指编码蛋白质的氨基酸序列的那部分核酸(例如基因)。
天然存在的”或“野生型”指在自然界中发现的形式。例如,天然存在的或野生型多肽或多核苷酸序列是存在于生物体的序列,它可以从自然界中的来源分离,并且没有被人工处理所特意地修饰。
当使用涉及例如,细胞、核酸或多肽时,“重组”指已经以自然界中未另外存在的方式修饰的,或与其相同,但是是由合成材料和/或通过使用重组技术的处理制备或衍生的物质,或对应于物质的天然或固有形式的物质。其中,非限制性的实例包括表达在细胞的固有(非重组)形式中未发现的基因或表达以不同水平另外表达的固有基因的重组细胞。
序列同一性的百分比”和“百分比同源性”在本文中可互换使用以指多核苷酸和多肽之间的对比,并且通过在对比视窗(comparison window)对比两个最佳比对序列来确定,其中在对比视窗中的多核苷酸或多肽序列部分与用于两条序列的最佳比对的参考序列(其不包含添加或缺失)对比,可包含添加或缺失(即缺口)。该百分比可通过以下计算:确定相同核酸碱基或氨基酸残基在两个序列都存在的位置数以产生匹配位置数,将匹配位置数除以对比视窗中位置的总数,并用100乘以结果以产生序列同一性的百分比。可选地,该百分比可通过以下计算:确定相同核酸碱基或氨基酸残基在两个序列都存在或核酸碱基或氨基酸残基与缺口比对的位置数以产生匹配位置数,该匹配位置数除以对比视窗中的位置总数,并用100乘以结果以产生序列同一性的百分比。本领域技术人员应理解,有许多可用于比对两个序列的确定的算法。用于对比的序列的最佳比对可通过以下进行:例如Smith和Waterman的局部同源性算法,1981,Adv.Appl.Math.2:482,Needleman和Wunsch的同源性比对算法,1970,J.Mol.Biol.48:443,Pearson和Lipman的相似性搜索方法,1988,Proc.Natl.Acad.Sci.USA85:2444,通过这些算法的计算机化执行(GCG Wisconsin软件包中的GAP、BESTFIT、FASTA和TFASTA),或目测(一般参见Current Protocols inMolecular Biology(最新分子生物学实验方法汇编),F.M.Ausubel等人编,Current Protocols,Greene Publishing Associates,Inc.和John Wiley&Sons,Inc.之间合作,(1995补充)(Ausubel))。适合于确定百分比序列同一性和序列相似性的算法的实例是BLAST和BLAST 2.0算法,它们分别描述于Altschul等人,1990,J.Mol.Biol.215:403-410和Altschul等人,1977,Nucleic Acids Res.3389-3402。用于执行BLAST分析的软件是通过美国国家生物技术信息中心的网站公共可用的。这一算法包括首先通过鉴别查询序列中长度W的短字来鉴别高分序列对(HSP),所述短字与数据库序列中相同长度的字比对时匹配或满足一些正值阀值得分T。T称为邻近字得分阀值(Altschul等人,同上)。这些起始邻近字匹配作为启动搜索的种子以寻找含有它们的更长HSP。然后,将字匹配沿着每个序列的两个方向延伸,直到累积比对得分可以被增加。对于核苷酸序列,使用参数M(匹配残基对的奖励得分;总是>0)和N(错配残基的罚分;总是<0)计算累积得分。对于氨基酸序列,得分矩阵用于计算累积得分。当以下情况时,每个方向中的字匹配的延伸被终止:累积比对得分从其最大达到值下降了量X;由于累积一个或多个负得分残基比对,累积得分达到0或以下;或到达任一序列末端。BLAST算法参数W、T和X确定比对的敏感度和速度。BLASTN程序(针对核苷酸序列)使用字长(W)11、期望值(E)10、M=5、N=-4以及两条链的对比作为默认值。针对氨基酸序列,BLASTP程序使用字长(W)3、期望值(E)10和BLOSUM62得分矩阵作为默认值(参见Henikoff和Henikoff,1989,Proc Natl AcadSci USA 89:10915)。序列比对和%序列同一性的示例性确定可使用GCG Wisconsin软件包(Accelrys,Madison WI)中的BESTFIT或GAP程序,使用所提供的默认参数。
参考序列”指用于作为序列对比的基础的确定序列。参考序列可以是较大序列的子集,例如全长基因或多肽序列的区段。一般来说,参考序列为至少20个核苷酸或氨基酸残基长度、至少25个残基长度、至少50个残基长度或核酸或多肽的全长。由于两个多核苷酸或多肽可能各自(1)包含在两个序列之间相似的序列(即完整序列的一部分),并且(2)可进一步包括两个序列之间不同的序列,因此两个(或更多个)多核苷酸或多肽之间的序列对比通常通过对比“对比视窗”上两个多核苷酸的序列以鉴别并比较序列相似性的局部区域来进行。
在一些实施方案中,“参考序列”可基于一级氨基酸序列,其中参考序列是可在一级序列中具有一个或多个改变的序列。例如,“基于在对应X145的残基处具有丝氨酸的SEQ ID NO:4的”参考序列指其中SEQ IDNO:4的X145对应的残基已改变为丝氨酸。
对比视窗”指至少约20个连续核苷酸位置或氨基酸残基的概念上的区段,其中序列可以与至少20个连续核苷酸或氨基酸的参考序列对比,并且其中对比视窗中的序列部分可包括与用于两个序列的最佳比对的参考序列(其不包含添加或缺失)相比,20%或更少的添加或缺失(即缺口)。对比视窗可以比20个连续的残基更长,并且包括任选地30、40、50、100个或更长的视窗。
基本同一性”指在至少20个残基位置的对比视窗内、通常在至少30-50个残基的视窗内与参考序列对比,具有至少80%的序列同一性、至少85%的同一性和89%至95%的序列同一性,更加常见地至少99%的序列同一性的多核苷酸或多肽序列,其中序列同一性的百分比是通过在对比视窗内对比参考序列和包括总计为参考序列的20%或更少的缺失或添加的序列来计算。在应用于多肽的具体实施方案中,术语“基本同一性”指当诸如通过程序GAP或BESTFIT,使用默认缺口权重进行最佳比对时,两个多肽序列共享至少80%的序列同一性、优选至少89%的序列同一性、至少95%的序列同一性或更多的序列同一性(例如99%的序列同一性)。优选地,不同的氨基酸残基位置因保守氨基酸取代而不同。
当在给定的氨基酸或多核苷酸序列的编号的情况下使用时,“对应 ”、“参考”或“相对于”指当给定的氨基酸或多核苷酸序列与指定的参考序列对比时,所述参考序列的残基的编号。换言之,给定聚合体的残基编号或残基位置是根据参考序列指定的,而不是通过给定氨基酸或多核苷酸序列中残基的实际编号位置指定。例如,给定的氨基酸序列,诸如工程酮还原酶的氨基酸序列,可通过导入缺口来与参考序列比对以优化两个序列之间的残基匹配。在这些情况下,尽管存在缺口,给定氨基酸或多核苷酸序列中的残基根据其已经比对的参考序列进行编号。
立体选择性”指一个立体异构体与另一个立体异构体相比在化学或酶促反应中的优先形成。立体选择性可以是部分的,其中一个立体异构体的形成相对另一立体异构体是有利的,或其可以是完全的,其中仅形成一个立体异构体。当立体异构体是对映体时,立体选择性称为对映选择性,一个对映体在两个总和中的比例(通常报道为百分比)。其在本领域中一般可选地报道(通常为百分比)为根据式[主要对映体-次要对映体]/[主要对映体+次要对映体]从中计算的对映体过量(e.e)。这也可以称为立体异构体过量(s.e)。如果立体异构体是非对映异构体,则立体选择性称为非对映选择性,一个非对映体在两个非对应的混合物中的比例(通常报道为百分比)。
高度立体选择性”指能够以至少约85%的立体异构体过量将底物转化或还原为对应的(R)-产物的酮还原酶多肽。
改善的酶性质”指与参考酮还原酶相比在任何的酶性质方面表现出改善的酮还原酶多肽。对于本文描述的工程酮还原酶多肽,通常与野生型酮还原酶进行对比,尽管在一些实施方案中,参考酮还原酶可以是另一个改善的工程酮还原酶。需要改善的酶性质包括但不限于,酶促活性(其可以根据底物的转化百分比来表达)、热稳定性、pH活性特征、辅因子需求、对抑制剂的不应性(例如产物抑制)、立体特异性和立体选择性(包括对映选择性)。
增加的酶促活性”指工程酮还原酶多肽的改善的性质,其可以表示为与参考酮还原酶对比,比活性(例如所产生的产物/时间/重量蛋白)的增加,或底物转化为产物的百分比(例如使用指定量的KRED时,起始量的底物在指定的时间段内转化为产物的百分比)的增加。在实施例中提供确定酶活性的示例性方法。可能影响涉及酶活性的任何性质,包括典型的酶性质Km、Vmax或kcat,它们的变化可导致酶促活性的增加。酶活性的改善可以是从对应野生型酮还原酶的酶促活性的约1.5倍,至超过衍生所述酮还原酶多肽的天然存在的酮还原酶或另一个工程酮还原酶的酶促活性多达2倍、5倍、10倍、20倍、25倍、50倍、75倍、100倍或更多。在具体的实施方案中,工程酮还原酶可表现出改善的酶促活性,其范围是比母体酮还原酶的酶促活性大1.5至50倍或1.5至100倍。本领域技术人员应理解,任何酶的活性是扩散限制的,以致催化周转速率不可能超过底物(包括任何所需的辅因子)的扩散速率。扩散限制的理论最大值,或kcat/Km,一般是约108至109(M-1s-1)。因此,酮还原酶的酶活性的任何改善将具有与酮还原酶所作用的底物的扩散速率有关的上限。酮还原酶活性可通过测量酮还原酶所用的标准测定中的任何一个来测量,诸如测量由于伴随酮或醛还原成醇的NADPH氧化导致的NADPH吸光度或荧光的降低(参见实施例6),或通过在偶联测定中所产生的产物来测量。如本文中进一步详细地描述,使用确定的酶制品、在设定条件下的确定测定和一个或多个确定的底物进行酶活性的对比。一般来说,当对比溶解产物时,确定细胞的数量和所测定的蛋白质的量,并使用相同表达系统和相同宿主细胞,以使宿主细胞所产生的和在溶解产物中存在的酶的量的变化最小化。
转化”指将底物酶促还原为对应产物。“转化百分比”指在指定的条件下在一定时间段内还原为产物的底物的百分比。因此,酮还原酶多肽的“酶促活性”或“活性”可以表达为底物至产物的“转化百分比”。
热稳定”指在暴露于升高的温度(例如40-80℃)一段时间(例如0.5-24小时)后,与未处理的酶对比,维持相似的活性(例如超过60%至80%)的酮还原酶多肽。
溶剂稳定”指在暴露于变化浓度(例如5-99%)的溶剂(例如异丙醇、四氢呋喃、2-甲基四氢呋喃、丙酮、甲苯、醋酸丁酯、甲基叔丁基醚等等)一段时间(例如0.5-24小时)后,与未处理的酶对比,维持相似的活性(超过例如60%至80%)的酮还原酶多肽。
pH稳定”指在暴露于高或低pH(例如4.5-6或8至12)一段时间(例如0.5-24小时)后,与未处理的酶对比,维持相似的活性(超过例如60%至80%)的酮还原酶多肽。
热稳定和溶剂稳定”指既热稳定又溶剂稳定的酮还原酶多肽。
如本文的工程酮还原酶的情况下所用,“衍生自”鉴别工程所依靠的起始酮还原酶和/或编码此类酮还原酶的基因。例如,通过多代人工进化编码SEQ ID NO:4的克菲尔乳杆菌酮还原酶的基因来获得SEQ ID NO:134的工程酮还原酶。因此,这一工程酮还原酶“衍生自”SEQ ID NO:4的野生型酮还原酶。
亲水氨基酸或残基”指具有表现出根据Eisenberg等人,1984,J.Mol.Biol.179:125-142的标准化统一疏水性标度,疏水性小于零的侧链的氨基酸或残基。遗传编码的亲水氨基酸包括L-Thr(T)、L-Ser(S)、L-His(H)、L-Glu(E)、L-Asn(N)、L-Gln(Q)、L-Asp(D)、L-Lys(K)和L-Arg(R)。
酸性氨基酸或残基”指当氨基酸包含于肽或多肽时,具有表现出小于约6的pK值的侧链的亲水氨基酸或残基。在生理pH下,酸性氨基酸由于缺失了氢离子而通常具有带负电的侧链。遗传编码的酸性氨基酸包括L-Glu(E)和L-Asp(D)。
碱性氨基酸或残基”指当氨基酸包含于肽或多肽时,具有表现出大于约6的pK值的侧链的亲水氨基酸或残基。在生理pH下,碱性氨基酸由于与水合氢离子缔合而通常具有带正电的侧链。遗传编码的碱性氨基酸包括L-Arg(R)和L-Lys(K)。
极性氨基酸或残基”指具有生理pH下不带电的侧链的亲水氨基酸或残基,但该侧链具有其中两个原子共享的电子对维持为更加接近所述原子之一的至少一个键。遗传编码的极性氨基酸包括L-Asn(N)、L-Gln(Q)、L-Ser(S)和L-Thr(T)。
疏水氨基酸或残基”指具有表现出根据Eisenberg等人,1984,J.Mol.Biol.179:125-142的标准化统一疏水性标度,疏水性大于零的侧链的氨基酸或残基。遗传编码的疏水氨基酸包括L-Pro(P)、L-Ile(I)、L-Phe(F)、L-Val(V)、L-Leu(L)、L-Trp(W)、L-Met(M)、L-Ala(A)和L-Tyr(Y)。
芳族氨基酸或残基”指具有包含至少一个芳族环或杂芳族环的侧链的亲水或疏水氨基酸或残基。遗传编码的芳族氨基酸包括L-Phe(F)、L-Tyr(Y)和L-Trp(W)。尽管由于L-His(H)的杂芳族氮原子的pKa,其有时被分类为碱性残基,或因为其侧链包含杂芳族环而分类为芳族残基,但本文中组氨酸被分类为亲水残基或为“限制残基”(见下文)。
限制氨基酸或残基”指具有限制几何学的氨基酸或残基。本文中,限制残基包括L-pro(P)和L-his(H)。组氨酸具有限制几何学,是因为其具有相对小的咪唑环。脯氨酸具有限制几何学,也是因为其也具有五元环。
非极性氨基酸或残基”指具有生理pH下不带电的侧链的疏水氨基酸或残基,并且该侧链具有其中两个原子共享的电子对一般由两个原子中的每一个平等维持的键(即侧链是非极性的)。遗传编码的非极性氨基酸包括L-Gly(G)、L-Leu(L)、L-Val(V)、L-Ile(I)、L-Met(M)和L-Ala(A)。
脂肪族氨基酸或残基”指具有脂肪烃侧链的疏水氨基酸或残基。遗传编码的脂肪族氨基酸包括L-Ala(A)、L-Val(V)、L-Leu(L)和L-Ile(I)。
半胱氨酸”。氨基酸L-Cys(C)不常见,原因是其可与其他L-Cys(C)氨基酸或其他含有硫烷基或硫氢基的氨基酸形成二硫桥。“半胱氨酸样残基”包括半胱氨酸和含有可用于形成二硫桥的硫氢基部分的其他氨基酸。L-Cys(C)(和具有含-SH的侧链的其他氨基酸)以还原的游离-SH或氧化的二硫桥形式存在于肽中的能力影响L-Cys(C)是否对肽贡献净疏水或亲水特征。虽然根据Eisenberg(Eisenberg等人,1984,同上)的标准化统一标度,L-Cys(C)表现为0.29的疏水性,但应理解,为了本公开的目的,L-Cys(C)其自身单独划分为一组。
小的氨基酸或残基”指具有主要由总计三个或更少的碳和/或杂原子(排除α-碳和氢)组成的侧链的氨基酸或残基。根据以上定义,小的氨基酸或残基可进一步分类为脂肪族、非极性、极性或酸性的小的氨基酸或残基。遗传编码的小氨基酸包括L-Ala(A)、L-Val(V)、L-Cys(C)、L-Asn(N)、L-Ser(S)、L-Thr(T)和L-Asp(D)。
含有羟基的氨基酸或残基”指含有羟基(-OH)部分的氨基酸。遗传编码的含有羟基的氨基酸包括L-Ser(S)、L-Thr(T)和L-Tyr(Y)。
保守”氨基酸取代或突变指具有相似侧链的残基的可交换性,因此通常包括用属于相同或相似的氨基酸定义类型的氨基酸取代多肽中的氨基酸。然而,如本文所用,在一些实施方案中,如果保守突变可以替代地是从脂肪族残基到脂肪族残基、从非极性残基到非极性残基、从极性残基到极性残基、从酸性残基到酸性残基、从碱性残基到碱性残基、从芳族残基到芳族残基或限制残基到限制残基的取代,保守突变不包括从亲水残基到亲水残基、从疏水残基到疏水残基、从含有羟基的残基到含有羟基的残基或从小残基到小残基的取代。此外,如本文所用,可将A、V、L或I保守地突变为另一个脂肪族残基或另一个非极性残基。下表显示示例性保守取代。
  残基   可能的保守突变
  A、L、V、I   其他的脂肪族残基(A、L、V、I)其他的非极性残基(A、L、V、I、G、M)
  G、M   其他的非极性残基(A、L、V、I、G、M)
  D、E   其他的酸性残基(D、E)
  K、R   其他的碱性残基(K、R)
  P、H   其他的限制残基(P、H)
  N、Q、S、T   其他的极性残基
  Y、W、F   其他的芳族残基(Y、W、F)
  C   无
非保守取代”指用侧链性质显著不同的氨基酸取代或突变多肽中的氨基酸。非保守取代可使用以上列出的定义组之间的氨基酸,而不是属于一组的氨基酸。在一个实施方案中,非保守突变影响(a)取代区域内肽主链的结构(例如脯氨酸取代甘氨酸)(b)电荷或疏水性,或(c)侧链的体积。
缺失”指通过去除参考多肽的一个或多个氨基酸来修饰多肽。氨基酸序列中的缺失可包括去除组成参考酶的1个或更多个氨基酸、2个或更多个氨基酸、3个或更多个氨基酸、4个或更多个氨基酸、5个或更多个氨基酸、6个或更多个氨基酸、8个或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸、或20个或更多个氨基酸、多达氨基酸总数的10%、多达氨基酸总数的15%或多达氨基酸总数的20%,而保留酶促活性和/或保留工程酮还原酶的改善的性质。缺失可针对多肽的内部部分和/或末端部分。在不同的实施方案中,缺失可包括连续的区段或可以是不连续的。
插入”指与参考多肽相比,通过添加一个或多个氨基酸来修饰多肽。在一些实施方案中,改善的工程酮还原酶包括向天然存在的酮还原酶多肽插入一个或多个氨基酸,以及向其他的改善的酮还原酶多肽插入一个或多个氨基酸。可以在多肽的内部部分插入,或插入到羧基或氨基末端。如本文所用,插入包括本领域所知的融合蛋白。插入可以是连续的氨基酸区段,或被天然存在的多肽中的一个或多个氨基酸隔开。
片段”指具有氨基末端和/或羧基末端缺失,但其中剩余的氨基酸序列与序列中的对应位置相同的多肽。片段可以是至少14个氨基酸长、至少20个氨基酸长、至少50个氨基酸长或更长,和多达全长酮还原酶多肽的70%、80%、90%、95%、98%和99%。在一些实施方案中,所述全长酮还原酶可以是全长工程或野生型酮还原酶多肽(例如SEQ ID NO:2和4)。
分离的多肽”指从与天然伴随多肽的其他杂质(如蛋白质、脂质和多核苷酸)基本上分离的多肽。该术语包括已经从多肽的天然存在的环境或表达系统(例如宿主细胞或体外合成)中移出或纯化的多肽。改善的酮还原酶可存在于细胞中、存在于细胞培养基中,或以不同的形式诸如溶解产物或分离的制品来制备。因此,在一些实施方案中,改善的酮还原酶可以是分离的多肽。
基本纯的多肽”指一种组合物,其中多肽物类是存在的主要物类(即根据摩尔或重量,它比组合物中的任何其他单个大分子物类更丰富),并且当目标物类以摩尔或%重量计包括存在的大分子物类为至少约50%时,该组合物一般是基本纯化的组合物。一般来说,基本纯的酮还原酶组合物按摩尔或%重量计,将包括存在于组合物中所有大分子物类的约60%或更多、约70%或更多、约80%或更多、约90%或更多、约95%或更多和约98%或更多。在一些实施方案中,将目标物类纯化为基本同质(即在组合物中通过常规检测方法不能检测到杂质物类),其中该组合物基本上由单一大分子物类组成。溶剂物类、小分子(<500道尔顿)和元素离子物类不认为是大分子物类。在一些实施方案中,分离的改善的酮还原酶多肽是基本纯的多肽组合物。
本文所用的“严格杂交”指核酸杂交体稳定的条件。如本领域技术人员所知,杂交体的稳定性是以杂交体的解链温度(Tm)来反映。一般来说,杂交体的稳定性是离子强度、温度、G/C含量和离液剂的存在的函数。多核苷酸的Tm值可使用用于预测解链温度的已知方法来计算(参见例如Baldino等人1989,MethodsEnzymology 168:761-777;Bolton等人,1962,Proc.Natl.Acad.Sci.USA 48:1390;Bresslauer等人,1986,Proc.Natl.Acad.Sci USA 83:8893-8897;Freier等人,1986,Proc.Natl.Acad.Sci USA83:9373-9377;Kierzek等人,Biochemistry 25:7840-7846;Rychlik等人,1990,Nucleic Acids Res 18:6409-6412(勘误,1991,Nucleic Acids Res19:698);Sambrook等人,同上;Suggs等人,1981,在Developmental BiologyUsing Purified Genes(使用纯化基因的发育生物学)(Brown等人编)中,第683-693页,Academic Press;和Wetmur,1991,Crit Rev Biochem Mol Biol26:227-259;所有出版物在此通过引用并入)。在一些实施方案中,多核苷酸编码本文公开的多肽,并且在确定条件(诸如适度严格或高度严格条件)下杂交于编码本公开的工程酮还原酶的序列的互补序列。
杂交严格性”指核酸的杂交中,诸如洗涤条件的杂交条件。一般来说,杂交反应在较低严格性的条件下进行,随后在变化的但是较高的严格性下洗涤。术语“适度严格杂交”指允许目标DNA结合互补核酸的条件,所述互补核酸与目标DNA具有约60%的同一性、优选约75%的同一性、约85%的同一性,其与目标多核苷酸具有大于约90%的同一性。示例性适度严格条件是等同于在42℃下在50%甲酰胺、5×Denhart溶液、5×SSPE、0.2%SDS中杂交,随后在42℃下在0.2×SSPE、0.2%SDS中洗涤的条件。“高度严格杂交”一般指如在确定的多核苷酸序列的溶液条件下所确定的,比热解链温度Tm低约10℃或更少的条件。在一些实施方案中,高度严格条件指仅允许在65℃下0.018M NaCl中形成稳定杂交体的那些核酸序列杂交的条件。(即如本文所涵盖,如果杂交体在65℃下0.018M NaCl中不稳定,那么它在高度严格条件下也是不稳定的)。例如,可通过以下提供高度严格条件:在等同于42℃下50%甲酰胺、5×Denhart溶液、5×SSPE、0.2%SDS的条件下杂交,随后在65℃下在0.1×SSPE和0.1%SDS中洗涤。另一个高度严格条件是在等同于65℃下在含有0.1%(w:v)SDS的5×SSC的条件下杂交,且在65℃下在含有0.1%SDS的0.1×SSC中洗涤。其他高度严格杂交条件,以及适度严格条件在以上引用的参考文献中描述。
异源”多核苷酸指通过实验室技术导入宿主细胞的任何多核苷酸,并且包括从宿主细胞移出,进行实验室处理,然后再次导入宿主细胞的多核苷酸。
优化的密码子”指编码蛋白质的多核苷酸的密码子变化为在特定生物体中优先使用的密码子,以便所编码的蛋白质在关注的生物体中被有效地表达。尽管遗传密码是简并的,即大多数氨基酸是由几个称为“同义”或“同义的”密码子的密码子代表,但已公知特定生物体对密码子的使用是非随机的并且偏好于特定的密码子三联体。对于给定基因、共同功能或祖先起源的基因、相对低拷贝数的蛋白质高度表达的蛋白质,以及生物体的基因组的聚集蛋白质编码区,这一密码子使用偏好可能更高。在一些实施方案中,编码酮还原酶的多核苷酸可能为了在选择用于表达的宿主生物体中最佳生产而进行了密码子优化。
优选的最佳高度密码子使用偏好密码子”互换地指在蛋白质编码区中比编码相同氨基酸的其他密码子使用频率更高的密码子。优选密码子的确定可与以下有关:单个基因、具有共同功能或起源的一组基因、高度表达的基因中的密码子使用;整个生物体的聚集蛋白质编码区中的密码子频率;相关生物体的聚集蛋白质编码区中的密码子频率或其组合。频率随基因表达水平增加的密码子通常是用于表达的最佳密码子。已知用于确定具体生物体中密码子频率(例如密码子使用、相对同义密码子使用)和密码子喜好的多种方法,包括多变量分析,例如使用聚类分析或对应分析,以及在基因中所用的密码子的有效数(参见GCG CodonPreference,GeneticsComputer Group Wisconsin Package;CodonW,John Peden,University ofNottingham;McInerney,J.O,1998,Bioinformatics 14:372-73;Stenico等人,1994,Nucleic Acids Res.222437-46;Wright,F.,1990,Gene 87:23-29)。可获得不断增加的生物体列表的密码子使用表(参见例如Wada等人,1992,NucleicAcids Res.20:2111-2118;Nakamura等人,2000,Nucl.AcidsRes.28:292;Duret等人,同上;Henaut和Danchin,“Escherichia coli andSalmonella(大肠杆菌和沙门氏菌)”,1996,Neidhardt等人编,ASM Press,Washington D.C.,第2047-2066页)。用于获得密码子使用的数据源可依赖于能够编码蛋白质的任何可用核苷酸序列。这些数据集包括实际已知编码表达的蛋白质(例如完全蛋白质编码序列-CDS)、表达的序列标签(ESTS)或基因组序列的预测编码区的核酸序列(参见例如Mount,D.,Bioinformatics:Sequence and Genome Analysis(生物信息学:序列和基因组分析),第8章,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y,2001;Uberbacher,E.C.,1996,Methods Enzymol.266:259-281;Tiwari等人,1997,Comput.Appl.Biosci.13:263-270)。
本文定义的“控制序列”包括对关注的多核苷酸或多肽的表达必需的或有利的所有组分。对于编码多肽的核酸序列,每个控制序列可以是固有的或外源的。这种控制序列包括但不限于,前导区序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。至少,控制序列包括启动子,以及转录和翻译终止信号。可提供具有连接体的控制序列,以便导入促进所述控制序列与编码多肽的核酸序列的编码区连接的具体限制位点。
可操作地连接”在本文中被定义为一种构型,其中控制序列以与关注的多核苷酸或多肽(诸如DNA序列中的编码序列)以功能关系(即处于与其相关的位置)适当放置,以便控制序列指导或调节多核苷酸和/多肽的表达。
启动子序列”是由用于表达关注的多核苷酸(诸如编码区)的宿主细胞所识别的核酸序列。一般来说,启动子序列包括介导关注的多核苷酸的表达的转录控制序列。启动子可以是在选择的宿主细胞中表现出转录活性的任何核酸序列,包括突变、截短和杂合启动子,并且可以从与宿主细胞的同源或异源的编码细胞外或细胞内多肽的基因获得。
辅因子再生系统”指参与还原氧化形式的辅因子的反应(例如NADP+到NADPH)的一组反应物。由酮还原酶催化的酮底物的还原所氧化的辅因子通过辅因子再生系统再生为还原形式。辅因子再生系统包括化学计量的还原剂,它是还原氢等同物的来源,并且能够还原氧化形式的辅因子。辅因子再生系统可进一步包括催化剂,例如酶催化剂,它催化还原剂还原氧化形式的辅因子。从NAD+或NADP+分别再生NADH或NADPH的辅因子再生系统为本领域所知,并且可用于本文描述的方法中。
7.2酮还原酶
本公开提供工程酮还原酶(“KRED”),其能够将结构式(I)的3-酮基四氢噻吩(“底物”)
立体选择性还原或转化为结构式(II)的(R)-3-羟基四氢噻吩(“产物”):
并且当与获自克菲尔乳杆菌(SEQ ID NO:4)、短乳杆菌(SEQ ID NO:2)或稍小乳杆菌(SEQ ID NO:142)的天然存在的野生型KRED酶对比时,或与其他的工程酮还原酶对比时,具有改善的性质。需要改善的酶性质包括但不限于酶促活性、热稳定性、pH活性特征、辅因子需求、对抑制剂的不应性(例如产物抑制)、立体特异性、立体选择性和溶剂稳定性。改善可涉及单个酶性质(诸如酶促活性)或不同酶性质(诸如酶促活性和立体选择性)的组合。
本公开提供能够将确定的酮底物立体选择性地还原为其对应的醇产物的工程酮还原酶(“KRED”),并且该酶当与获自克菲尔乳杆菌(SEQ IDNO:2)或短乳杆菌(SEQ ID NO:4)或稍小乳杆菌(SEQ ID NO:142)的天然存在的野生型KRED酶对比,或与其他工程酮还原酶对比时,具有改善的性质。本公开的酮还原酶多肽具有对应SEQ ID NO:2或4或142的145位的残基不是酸性残基的需求。在一些实施方案中,与SEQ ID NO:2或4或142的克菲尔乳杆菌或短乳杆菌或稍小乳杆菌KRED序列对比,酮还原酶多肽在对应145位的残基处具有极性氨基酸。在一些实施方案中,与SEQID NO:2或4或142的克菲尔乳杆菌或短乳杆菌或稍小乳杆菌KRED序列对比,酮还原酶多肽在对应145位的残基处具有丝氨酸。
如上所示,在一些实施方案中,参照SEQ ID NO:4的克菲尔乳杆菌酮还原酶、SEQ ID NO:2的短乳杆菌酮还原酶、SEQ ID NO:142的稍小乳杆菌或工程酮还原酶描述具有改善的酶活性的工程酮还原酶。在这些酮还原酶中,氨基酸残基位置从起始的甲硫氨酸(M)残基开始确定(即M代表1位残基),尽管本领域技术人员将理解,诸如在宿主细胞或体外翻译系统中,这一起始的甲硫氨酸残基通过生物加工系统除去以产生缺乏起始的甲硫氨酸残基的成熟蛋白质。氨基酸序列中存在的特定氨基酸或氨基酸变化的氨基酸残基位置在本文中有时描述为术语“Xn”或“n位”,其中n指残基位置。如果酮还原酶之间相同残基位置上的氨基酸残基不同,则不同的残基通过“/”使用排列为例如“克菲尔乳杆菌残基/短乳杆菌残基/稍小乳杆菌”来指示。在一些实施方案中,取代突变,其为用不同的氨基酸残基取代参考序列(例如SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:142的野生型酮还原酶)的对应残基中的氨基酸残基的置换,用符号“→”指示。
本文中,突变有时描述为突变“成一种”类型的氨基酸。例如,残基X7可将甘氨酸突变“成一种”丝氨酸残基。但是短语“成一种”的使用不排除从一种类型的一个氨基酸突变成相同类型的另一个氨基酸。例如,残基X7可从甘氨酸突变成精氨酸。
编码天然存在的克菲尔乳杆菌、短乳杆菌或稍小乳杆菌的酮还原酶(还称为“ADH”或“醇脱氢酶”)的多核苷酸序列以及由此的对应氨基酸序列可获自:对于克菲尔乳杆菌,Genbank登录号AAP94029GI:33112056或SEQ ID NO:3;对于短乳杆菌,Genbank登录号CAD66648GL28400789或SEQ ID NO:1;且对于稍小乳杆菌,SEQ ID NO:141。
在一些实施方案中,本文的酮还原酶多肽具有对参考序列(例如天然存在的多肽或工程多肽)的许多修饰以产生改善的酮还原酶性质。在这种实施方案中,对氨基酸序列的修饰的数量可包括参考多肽序列的1个或多个氨基酸、2个或更多个氨基酸,3个或更多个氨基酸、4个或更多个氨基酸、5个或更多个氨基酸、6个或更多个氨基酸、8个或更多个氨基酸、10个或更多个、15个或更多个氨基酸或20个或更多个氨基酸、多达氨基酸的总数量的10%、多达氨基酸的总数量的10%、多达氨基酸的总数量的15%、多达氨基酸的总数量的20%或多达氨基酸的总数量的30%。在一些实施方案中,产生改善的酮还原酶性质的对天然存在的多肽或工程多肽的修饰的数量可包括参考序列的约1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35或约1-40个残基修饰。在一些实施方案中,修饰的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个氨基酸残基。修饰可包括插入、缺失、取代或其组合。
在一些实施方案中,修饰包括对参考序列的氨基酸取代。可产生改善的酮还原酶性质的取代可位于参考酶序列的1个或多个氨基酸、2个或更多个氨基酸、3个或更多个氨基酸、4个或更多个氨基酸、5个或更多个氨基酸、6个或更多个氨基酸、8个或更多个氨基酸、10个或更多个、15个或更多个氨基酸,或20个或更多个氨基酸、多达氨基酸的总数量的10%、多达氨基酸的总数量的10%、多达氨基酸的总数量的20%,或多达氨基酸的总数量的30%。在一些实施方案中,产生改善的酮还原酶性质的对天然存在的多肽或工程多肽的取代的数量可包括参考序列的约1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35或约1-40个氨基酸取代。在一些实施方案中,取代的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个氨基酸残基。
在一些实施方案中,酮还原酶多肽的改善的性质(对比野生型或另一工程多肽)与其将3-酮基四氢噻吩底物还原或转化成(R)-3-羟基四氢噻吩的立体选择性有关。在一些实施方案中,酮还原酶多肽能够以至少约65%、70%、75%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.9%或99.99%的百分比立体异构体过量将底物立体选择性地还原成产物。
在一些实施方案中,酮还原酶多肽能够以与野生型克菲尔乳杆菌或短乳杆菌或稍小乳杆菌KRED(SEQ ID NO:4或2或142)相比,提高的百分比立体异构体过量(s.e),将底物立体选择性地还原成产物。在一些实施方案中,酮还原酶多肽能够以至少约70%的百分比立体异构体过量将底物立体选择性地还原成产物。
在一些实施方案中,本公开的酮还原酶多肽具有高度的立体选择性,因为酮还原酶可以以大于约90%立体异构体过量(s.e.)将底物还原成产物。具有这种高度立体选择性的示例性酮还原酶多肽包括但不限于包括对应SEQ ID NO:6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、86、88、90、92、94、96、100、102、104、106、108、110、112、126、128、130和134的氨基酸序列的多肽。
在一些实施方案中,本公开的酮还原酶多肽与野生型(SEQ ID NO:4)对比在它们的酶促活性的速率(即它们将底物转化为产物的速率或能力)方面被改善。能够以超过野生型的速率将底物转化为产物的示例性多肽包括但不限于包括对应SEQ ID NO:6、8、10、12、14、16、18、20、22、24、26、30、32、38、40、42、44、46、48、50、52、54、56、58、60、64、66、68、70、74、76、78、80、86、88、90、92、104、106、110、112、124、126、130和134的氨基酸序列的多肽。
在一些实施方案中,本公开的酮还原酶多肽具有高度立体选择性,且可以以大于约98%s.e.将将底物还原成产物。具有这种立体选择性的示例性多肽包括但不限于包括对应SEQ ID NO:6、8、10、18、20、22、24、26、28、30、34、36、38、40、42、50、52、54、58、62、66、70、72、76、78、80和134的氨基酸序列的多肽。
在一些实施方案中,本公开的酮还原酶多肽与野生型对比在它们的热稳定性方面被改善,其由在高温下,与野生型对比酶促活性的速率的提高所确定。具有改善的稳定性的示例性酮还原酶多肽包括但不限于包括对应SEQ ID NO:6、8、12、14、22、24、26、32、34、36、38、42、44、46、50、52、56、58、60、64、66、68、70、74、76、78、80、82、86、88、90、92、104、106、110、112、124和134的氨基酸序列的多肽。
在一些实施方案中,本公开的酮还原酶多肽具有超过野生型的改善的活性和稳定性,且可以以大于约95%s.e.将将底物还原成产物。具有这种能力的示例性多肽包括但不限于包括对应SEQ DI NO:6、8、12、14、22、24、26、30、32、38、42、44、46、50、52、56、58、60、64、66、68、70、74、76、78、80、82、86、88、90、92、104、106、110、112和134的氨基酸序列的多肽。
在一些实施方案中,本公开的酮还原酶能够在室温下用约0.8-1.0g/L的酮还原酶多肽在小于24小时(例如约20-24小时)内将至少100g/L酮基四氢噻吩还原或转化成对应的产物。具有这种能力的示例性多肽包括但不限于包括对应SEQ ID NO:6、8、10、12、14、18、20、22、24、26、30、32、38、40、42、44、46、48、50、52、54、56、58、60、64、66、68、70、74、76、78、80、82、86、88、90、92、104、106、110、112、126、130和134的氨基酸序列的多肽。
在一些实施方案中,本公开的酮还原酶能够在室温下用约0.8-1.0g/L的酮还原酶多肽在小于20小时(例如约12-20小时)内将至少100g/L酮基四氢噻吩还原或转化成产物。具有这种能力的示例性多肽包括但不限于SEQ ID NO:26、44、68和104。
以下表2提供示例性酮还原酶。除非另外指出,以下所有序列衍生自野生型克菲尔乳杆菌酮还原酶序列(SEQ ID NO:3和4)。表2中的每个多肽序列由具有比表中的编号少1的SEQ ID NO的核苷酸序列编码,即SEQID NO:4的多肽是由SEQ ID NO:3的核苷酸序列编码。
表2:序列和性质的列表
在以上表2中,在立体选择性列中,“0”表示产物(R)-3-羟基四氢噻吩的约61.0-71.9%s.e.,“+”表示产物的约80.0-89.9%s.e.,“++”表示产物的约90.0-94.9%s.e.,“+++”表示产物的约95.0-97.9%s.e.,“++++”表示产物的约98.0-98.0%s.e.,且“+++++”表示产物的大于99.0%s.e.。在活性列中,“0”表示在室温下在大于24小时内完全转化100g/L酮基四氢噻吩需要1.0-4.0g/L KRED;“+”表示在室温下在20-24小时内完全转化100g/L酮基四氢噻吩需要0.8-1.0g/L KRED;且“++”表示在室温下在12-20小时内完全转化100g/L酮基四氢噻吩需要0.8-1.0g/L KRED。在稳定性列中,“-”表示表现出比野生型差的热稳定性的多肽;“0”表示表现出与野生型相似的热稳定性的多肽;“+”表示表现出与野生型相比的改善的热稳定性的多肽;且“++”表示表现出与野生型相比的更多地改善的热稳定性的多肽。
在一些实施方案中,本文的改善的酮还原酶多肽包括与基于SEQ IDNO:2、4或142的参考序列对比,具有至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性的氨基酸序列,在参考序列中对应145位的氨基酸残基是极性残基,特别是丝氨酸,条件是酮还原酶多肽在对应145位的残基处具有极性残基,特别是丝氨酸。在一些实施方案中,酮还原酶多肽与参考序列对比,可在其他的氨基酸残基处具有一个或多个残基差异。与参考序列对比的差异可包括取代、缺失和插入。差异可以是非保守取代、保守取代或非保守和保守取代的组合。在一些实施方案中,这些酮还原酶多肽在其他的氨基酸残基处可任选地具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35或约1-40个差异。在一些实施方案中,与参考序列在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个差异。在一些实施方案中,与参考序列对比的差异包括保守突变。
在一些实施方案中,改善的酮还原酶多肽包括对应SEQ ID NO:143或SEQ ID NO:144或SEQ ID NO:145中所列的序列式的氨基酸序列或其结构域,诸如残基90-211。SEQ ID NO:145基于克菲尔乳杆菌酮还原酶的野生型氨基酸序列(SEQ ID NO:4);SEQ ID NO:144基于短乳杆菌酮还原酶的野生型氨基酸序列(SEQ ID NO:2);且SEQ ID NO:143基于稍小乳杆菌酮还原酶的野生型氨基酸序列(SEQ ID NO:142)。基于SEQ ID NO:143、144和145的序列式的酮还原酶指明对应X145的残基是极性氨基酸。
在一些实施方案中,酮还原酶多肽包括基于SEQ ID NO:143.144.或145的序列式或其结构域(诸如残基90-211)的,并在对应X145的残基处具有极性残基特别是丝氨酸的氨基酸序列,所述酮还原酶多肽可进一步包括选自以下的一个或多个特征:对应X3的残基是极性、酸性或芳族残基;对应X7的残基是非极性、极性或限制残基;对应X11的残基是脂肪族、非极性或极性残基;对应X16的残基是脂肪族或非极性残基;对应X19的残基是非极性或脂肪族残基;对应X23的残基是非极性或芳族残基;对应X41的残基是脂肪族、非极性或极性残基;对应X45的残基是脂肪族、非极性或极性残基;对应X49的残基是碱性残基;对应X57的残基是脂肪族或非极性残基;对应X60的残基是芳族、脂肪族、非极性或极性残基;对应X64的残基是脂肪族或非极性残基;对应X72的残基是碱性残基;对应X82的残基是非极性或极性残基;对应X94的残基是极性、碱性、脂肪族或非极性残基;对应X95的残基是非极性或脂肪族残基;对应X96的残基是限制、脂肪族、非极性、酸性或极性残基;对应X97的残基是酸性、碱性或脂肪族残基;对应X106的残基是酸性残基;对应X108的残基是碱性、限制或芳族残基;对应X111的残基是脂肪族或非极性残基;对应X117的残基是非极性或极性残基;对应X126的残基是脂肪族或非极性残基;对应X127的残基是极性或碱性残基;对应X147的残基是芳族、脂肪族残基、非极性或极性残基;对应X152的残基是极性、脂肪族或非极性残基;对应X157的残基是极性或酸性残基;对应X163的残基是脂肪族或非极性残基;对应X173的残基是酸性或非极性残基;对应X177的残基是碱性残基;对应X192的残基是碱性或酸性残基;对应X194的残基是限制、极性、酸性、非极性或脂肪族残基;对应X198的残基是酸性或非极性残基;对应X200的残基是限制、酸性或碱性残基;对应X206的残基是极性或非极性残基;对应X208的残基是极性、限制或碱性残基;对应X210的残基是脂肪族、非极性或极性残基;对应X211的残基是碱性或酸性残基;对应X214的残基是非极性、脂肪族或极性残基;对应X217的残基是芳族、脂肪族或非极性残基;对应X223的残基是脂肪族或非极性残基;且对应X226的残基是非极性或脂肪族残基。在一些实施方案中,对应X94的残基不是芳族残基、组氨酸或甘氨酸。在一些实施方案中,对应X96的残基不是芳族残基、甘氨酸、异亮氨酸或半胱氨酸。在一些实施方案中,包括对应SEQID NO:143、144或145所列的序列式(或其结构域)的氨基酸序列的多肽可具有保守突变的X未指出的残基中的一个或多个。在一些实施方案中,保守突变可以是在未由以上X定义的其他氨基酸残基处的1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35或约1-40个突变。在一些实施方案中,突变的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个氨基酸残基。
在一些实施方案中,包括基于SEQ ID NO:143、144或145中提供的序列式的氨基酸序列的多肽与SEQ ID NO:4、2或142的参考序列对比,可具有一个或多个保守突变。示例性保守取代包括氨基酸置换,诸如但不限于:用另一脂肪族残基,例如缬氨酸置换对应X19的残基(I);用用另一非极性残基,例如苯丙氨酸置换对应X23的残基(I);用另一碱性残基,例如精氨酸置换对应X49的残基(K);用另一脂肪族残基,例如缬氨酸置换对应X57的残基(I);用另一碱性氨基酸,例如精氨酸置换对应X72的残基(K);用另一脂肪族氨基酸,例如缬氨酸置换对应X94的残基(A);用另一脂肪族残基,例如缬氨酸置换对应X95的残基(A);用另一碱性氨基酸,例如精氨酸置换对应X97的残基(K);用另一酸性氨基酸,例如天冬氨酸置换对应X106的残基(E);用另一非极性或脂肪族氨基酸,例如甲硫氨酸置换对应X111的残基(L);用另一非极性氨基酸,例如亮氨酸置换残基X147(F);用另一碱性氨基酸,例如精氨酸置换对应X177的残基(K);用另一碱性氨基酸,例如精氨酸置换对应X192的残基(K);用另一非极性氨基酸,例如缬氨酸置换对应X214的残基(M);用另一非极性氨基酸,例如苯丙氨酸置换对应X217的残基(I);用另一非极性或脂肪族氨基酸,例如缬氨酸置换对应X223的残基(I);并且用另一非极性或脂肪族氨基酸,例如亮氨酸置换对应X226的残基(I)。
在一些实施方案中,酮还原酶多肽包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的,并在对应X145的残基处具有极性残基特别是丝氨酸的氨基酸序列,所述酮还原酶多肽可进一步包括选自以下的一个或多个特征:对应X3的残基是天冬酰胺、天冬氨酸或酪氨酸;对应X7的残基是甘氨酸、组氨酸、丝氨酸或天冬酰胺;对应X11的残基是异亮氨酸或苏氨酸;对应X16的残基是苏氨酸、丙氨酸、缬氨酸或甘氨酸;对应X19的残基是异亮氨酸或缬氨酸;对应X23的残基是异亮氨酸或苯丙氨酸;对应X41的残基是丝氨酸、丙氨酸或缬氨酸;对应X45的残基是谷氨酸或甘氨酸;对应X49的残基是赖氨酸或精氨酸,特别是精氨酸;对应X57的残基是异亮氨酸或缬氨酸;对应X60的残基是苯丙氨酸、缬氨酸或苏氨酸;对应X64的残基是丙氨酸、丝氨酸或苏氨酸;对应X72的残基是赖氨酸或精氨酸,特别是精氨酸;对应X82的残基是甘氨酸或丝氨酸;对应X94的残基是丙氨酸、缬氨酸、苏氨酸、丝氨酸或精氨酸;对应X95的残基是缬氨酸或丙氨酸;对应X96的残基是天冬酰胺、丝氨酸、脯氨酸、丙氨酸或谷氨酸;对应X97的残基是赖氨酸、精氨酸或亮氨酸;对应X106的残基是谷氨酸或天冬氨酸;对应X108的残基是精氨酸或组氨酸;对应X111的残基是亮氨酸或甲硫氨酸;对应X117的残基是甘氨酸或丝氨酸;对应X126的残基是异亮氨酸或缬氨酸;对应X127的残基是谷氨酰胺或精氨酸;对应X147的残基是苯丙氨酸、亮氨酸或丝氨酸;对应X152的残基是苏氨酸、丝氨酸或甲硫氨酸;对应X157的残基是天冬酰胺、谷氨酰胺、苏氨酸、丝氨酸或天冬氨酸;对应X163的残基是缬氨酸或异亮氨酸;对应X173的残基是天冬氨酸或甘氨酸;对应X177的残基是赖氨酸或精氨酸;对应X192的残基是赖氨酸、精氨酸或谷氨酸;对应X194的残基是脯氨酸、甘氨酸、天冬氨酸、精氨酸或亮氨酸;对应X198的残基是天冬氨酸或甘氨酸;对应X200的残基是脯氨酸、谷氨酸或赖氨酸;对应X206的残基是甲硫氨酸或谷氨酰胺;对应X208的残基是谷氨酰胺、组氨酸或精氨酸;对应X210的残基是苏氨酸或丙氨酸;对应X211的残基是赖氨酸或谷氨酸;对应X214的残基是甲硫氨酸、缬氨酸或苏氨酸或丝氨酸、特别是缬氨酸或苏氨酸;对应X217的残基是异亮氨酸或苯丙氨酸;对应X223的残基是异亮氨酸或缬氨酸;且对应X226的残基是异亮氨酸或缬氨酸。在一些实施方案中,包括对应SEQ ID NO:143、144或145所列的序列式(或其结构域)的氨基酸序列的多肽可具有保守突变的X未指出的残基中的一个或多个。在一些实施方案中,保守突变可以是在未由以上X定义的其他氨基酸残基处的1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35或约1-40个突变。在一些实施方案中,突变的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个氨基酸残基。
在一些实施方案中,酮还原酶多肽包括基于SEQ ID NO:143.144.或145的序列式或其结构域(诸如残基90-211)的,并在对应X145的残基处具有极性残基特别是丝氨酸的氨基酸序列,所述酮还原酶多肽可进一步包括以下特征中的一个或多个或至少全部:对应X7的残基是非极性、极性或限制残基;对应X94的残基是极性、碱性、脂肪族或非极性残基;对应X96的残基是限制、脂肪族、非极性、酸性或极性残基;对应X108的残基是碱性、限制或芳族残基;对应X117的残基是非极性或极性残基;对应X157的残基是极性或酸性残基;对应X173的残基是酸性或非极性残基;对应X206的残基是极性或非极性残基;且对应X223的残基是脂肪族或非极性残基。在一些实施方案中,对应X145的氨基酸残基是丝氨酸。在一些实施方案中,除了以上特征之外,酮还原酶多肽可进一步包括选自以下的特征中的一个或多个:对应X3的残基是极性、酸性或芳族残基;对应X11的残基是脂肪族、非极性或极性残基;对应X16的残基是脂肪族或非极性残基;对应X19的残基是非极性或脂肪族残基;对应X23的残基是非极性或芳族残基;对应X41的残基是脂肪族、非极性或极性残基;对应X45的残基是甘氨酸、脂肪族、非极性或极性残基;对应X49的残基是碱性残基;对应X57的残基是脂肪族或非极性残基;对应X60的残基是芳族、脂肪族、非极性或极性残基;对应X64的残基是脂肪族或非极性残基;对应X72的残基是碱性残基;对应X82的残基是非极性或极性残基;对应X95的残基是非极性或脂肪族残基;对应X97的残基是酸性、碱性或脂肪族残基;对应X106的残基是酸性残基;对应X111的残基是脂肪族或非极性残基;对应X126的残基是脂肪族或非极性残基;对应X127的残基是极性或碱性残基;对应X147的残基是芳族、脂肪族残基、非极性或极性残基;对应X152的残基是极性、脂肪族或非极性残基;对应X163的残基是脂肪族或非极性残基;对应X177的残基是碱性残基;对应X192的残基是碱性或酸性残基;对应X194的残基是限制、极性、非极性、酸性或脂肪族残基;对应X198的残基是酸性或非极性残基;对应X200的残基是限制、酸性或碱性残基;对应X208的残基是极性、限制或碱性残基;对应X210的残基是脂肪族、非极性或极性残基;对应X211的残基是碱性或酸性残基;对应X214的残基是非极性、脂肪族或极性残基;对应X217的残基是芳族、脂肪族或非极性残基;且对应X226的残基是非极性或脂肪族残基。在一些实施方案中,包括对应SEQ ID NO:143、144或145所列的序列式(或其结构域)的氨基酸序列的多肽可具有保守突变的X未指出的残基中的一个或多个。在一些实施方案中,保守突变可以是在未由以上X定义的其他氨基酸残基处的1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35或约1-40个突变。在一些实施方案中,突变的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个氨基酸残基。
在一些实施方案中,酮还原酶多肽包括基于SEQ ID NO:143.144.或145的序列式或其结构域(诸如残基90-211)的,并在对应X145的残基处具有极性残基特别是丝氨酸的氨基酸序列,所述酮还原酶多肽可进一步包括选自以下的特征中的一个或多个或至少全部:对应X7的残基是甘氨酸、组氨酸、丝氨酸或天冬酰胺;对应X94的残基是丙氨酸、缬氨酸、苏氨酸、丝氨酸或精氨酸;对应X96的残基是天冬酰胺、丝氨酸、脯氨酸、丙氨酸或谷氨酸;对应X108的残基是精氨酸或组氨酸;对应X117的残基是甘氨酸或丝氨酸;对应X157的残基是天冬酰胺、谷氨酰胺、苏氨酸、丝氨酸或天冬氨酸;对应X173的残基是天冬氨酸或甘氨酸;对应X206的残基是甲硫氨酸或谷氨酰胺;且对应X223的残基是异亮氨酸或缬氨酸。在一些实施方案中,除了以上特征之外,酮还原酶多肽可进一步包括选自以下的特征中的一个或多个:对应X3的残基是天冬酰胺、天冬氨酸或酪氨酸;对应X11的残基是异亮氨酸或苏氨酸;对应X16的残基是苏氨酸、丙氨酸、缬氨酸或甘氨酸;对应X19的残基是异亮氨酸或缬氨酸;对应X23的残基是异亮氨酸或苯丙氨酸;对应X41的残基是丝氨酸、丙氨酸或缬氨酸;对应X45的残基是谷氨酸或甘氨酸;对应X49的残基是赖氨酸或精氨酸,特别是精氨酸;对应X57的残基是异亮氨酸或缬氨酸;对应X60的残基是苯丙氨酸、缬氨酸或苏氨酸;对应X64的残基是丙氨酸、丝氨酸或苏氨酸;对应X72的残基是赖氨酸或精氨酸,特别是精氨酸;对应X82的残基是甘氨酸或丝氨酸;对应X95的残基是缬氨酸或丙氨酸;对应X97的残基是赖氨酸、精氨酸或亮氨酸;对应X106的残基是谷氨酸或天冬氨酸;对应X111的残基是亮氨酸或甲硫氨酸;对应X126的残基是异亮氨酸或缬氨酸;对应X127的残基是谷氨酰胺或精氨酸;对应X147的残基是苯丙氨酸、亮氨酸或丝氨酸;对应X152的残基是苏氨酸、丝氨酸或甲硫氨酸;对应X163的残基是缬氨酸或异亮氨酸;对应X177的残基是赖氨酸或精氨酸;对应X192的残基是赖氨酸、精氨酸或谷氨酸;对应X194的残基是脯氨酸、甘氨酸、天冬氨酸、精氨酸或亮氨酸;对应X198的残基是天冬氨酸或甘氨酸;对应X200的残基是脯氨酸、谷氨酸或赖氨酸;对应X208的残基是谷氨酰胺、组氨酸或精氨酸;对应X210的残基是苏氨酸或丙氨酸;对应X211的残基是赖氨酸或谷氨酸;对应X214的残基是甲硫氨酸、缬氨酸或苏氨酸或丝氨酸,特别是缬氨酸或苏氨酸;对应X217的残基是异亮氨酸或苯丙氨酸;且对应X226的残基是异亮氨酸或缬氨酸。在一些实施方案中,包括对应SEQ ID NO:143、144或145所列的序列式(或其结构域)的氨基酸序列的多肽可具有保守突变的X未指出的残基中的一个或多个。在一些实施方案中,保守突变可以是在未由以上X定义的其他氨基酸残基处的1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35或约1-40个突变。在一些实施方案中,突变的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个其他氨基酸残基。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X145的残基是极性残基,特别是丝氨酸;且对应X3的残基是极性、酸性或芳族残基,特别是酪氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X145的残基是极性残基,特别是丝氨酸,且对应X7的残基是非极性、极性或限制残基,特别是丝氨酸、组氨酸或精氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X145的残基是极性残基,特别是丝氨酸,且对应X11的残基是脂肪族、非极性或极性残基。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X145的残基是极性残基,特别是丝氨酸,且对应X16的残基是脂肪族或非极性残基,特别是丙氨酸或甘氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X145的残基是极性残基,特别是丝氨酸,且对应X19的残基是非极性或脂肪族残基,特别是丙氨酸或甘氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X145的残基是极性残基,特别是丝氨酸,且对应X23的残基是非极性或芳族残基,特别是苯丙氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X145的残基是极性残基,特别是丝氨酸,且对应X41的残基是脂肪族、非极性或极性残基,特别是丝氨酸、丙氨酸或缬氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X145的残基是极性残基,特别是丝氨酸,且对应X45的残基是甘氨酸,脂肪族、非极性或极性残基,特别是谷氨酸或甘氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X145的残基是极性残基,特别是丝氨酸,且对应X49的残基是碱性残基,特别是精氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X145的残基是极性残基,特别是丝氨酸,且对应X57的残基是脂肪族或非极性残基,特别是异亮氨酸或缬氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X145的残基是极性残基,特别是丝氨酸,且对应X60的残基是芳族、脂肪族、非极性或极性残基,特别是苯丙氨酸、缬氨酸或苏氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X145的残基是极性残基,特别是丝氨酸,且对应X64的残基是脂肪族或非极性残基,特别是丙氨酸、丝氨酸或苏氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X145的残基是极性残基,特别是丝氨酸,且对应X72的残基是碱性残基,特别是丙氨酸、丝氨酸或苏氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X145的残基是极性残基,特别是丝氨酸,且对应X82的残基是非极性或极性残基,特别是甘氨酸或丝氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X145的残基是极性残基,特别是丝氨酸,且对应X94的残基是极性、碱性、脂肪族或非极性残基,特别是缬氨酸、苏氨酸或精氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ IDNO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X145的残基是极性残基,特别是丝氨酸,且对应X95的残基是非极性残基或脂肪族残基,特别是丙氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X145的残基是极性残基,特别是丝氨酸,且对应X96的残基是限制、脂肪族、非极性、酸性或极性残基,特别是天冬酰胺、丝氨酸、脯氨酸、丙氨酸或谷氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X145的残基是极性残基,特别是丝氨酸,且对应X97的残基是酸性、碱性或脂肪族残基,特别是赖氨酸、精氨酸或亮氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X145的残基是极性残基,特别是丝氨酸,且对应X106的残基是酸性残基,特别是天冬氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X145的残基是极性残基,特别是丝氨酸,且对应X108的残基是碱性、限制或芳族残基,特别是精氨酸或组氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X145的残基是极性残基,特别是丝氨酸,且对应X111的残基是脂肪族或非极性残基,特别是甲硫氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X145的残基是极性残基,特别是丝氨酸,且对应X117的残基是非极性或极性残基,特别是丝氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X145的残基是极性残基,特别是丝氨酸,且对应X126的残基是脂肪族或非极性残基,特别是缬氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X145的残基是极性残基,特别是丝氨酸,且对应X127的残基是极性或碱性残基,特别是谷氨酰胺或精氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X145的残基是极性残基,特别是丝氨酸,且对应X147的残基是芳族、脂肪族残基、非极性或极性残基,特别是苯丙氨酸、亮氨酸或丝氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X145的残基是极性残基,特别是丝氨酸,且对应X152的残基是极性、脂肪族或非极性残基、非极性或极性残基,特别是苏氨酸、丝氨酸或甲硫氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X145的残基是极性残基,特别是丝氨酸,且对应X157的残基是极性或碱性残基,特别是天冬酰胺、苏氨酸、丝氨酸或天冬氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X145的残基是极性残基,特别是丝氨酸,且对应X163的残基是脂肪族或非极性残基,特别是缬氨酸或异亮氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X145的残基是极性残基,特别是丝氨酸,且对应X173的残基是酸性或非极性残基,特别是天冬氨酸或甘氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X145的残基是极性残基,特别是丝氨酸,且对应X177的残基是碱性残基,特别是精氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X145的残基是极性残基,特别是丝氨酸,且对应X192的残基是碱性或酸性残基,特别是赖氨酸、精氨酸或谷氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X145的残基是极性残基,特别是丝氨酸,且对应X194的残基是限制、极性、非极性、酸性或脂肪族残基,特别是脯氨酸、甘氨酸、天冬氨酸、精氨酸或亮氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X145的残基是极性残基,特别是丝氨酸,且对应X198的残基是酸性或非极性残基,特别是天冬氨酸或甘氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X145的残基是极性残基,特别是丝氨酸,且对应X200的残基是限制、酸性或碱性残基,特别是脯氨酸、谷氨酸或赖氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X145的残基是极性残基,特别是丝氨酸,且对应X200的残基是限制、酸性或碱性残基,特别是脯氨酸、谷氨酸或赖氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X145的残基是极性残基,特别是丝氨酸,且对应X206的残基是极性或非极性残基,特别是甲硫氨酸或谷氨酰胺。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X145的残基是极性残基,特别是丝氨酸,且对应X208的残基是极性、限制或碱性残基,特别是谷氨酰胺、组氨酸或精氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X145的残基是极性残基,特别是丝氨酸,且对应X210的残基是脂肪族、非极性或极性残基,特别是苏氨酸或丙氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X145的残基是极性残基,特别是丝氨酸,且对应X211的残基是碱性或酸性残基,特别是赖氨酸或谷氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X145的残基是极性残基,特别是丝氨酸,且对应X214的残基是非极性、脂肪族或极性残基,特别是缬氨酸或苏氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X145的残基是极性残基,特别是丝氨酸,且对应X217的残基是芳族,脂肪族或非极性残基,特别是异亮氨酸或苯丙氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X145的残基是极性残基,特别是丝氨酸,且对应X223的残基是脂肪族或非极性残基,特别是异亮氨酸或缬氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X145的残基是极性残基,特别是丝氨酸,且对应X226的残基是非极性或脂肪族残基,特别是异亮氨酸或缬氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X145的残基是极性残基,特别是丝氨酸,且对应X228的残基是非极性或脂肪族残基,特别是缬氨酸或丙氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶多肽包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X117的残基是非极性或极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;且对应X157的残基是极性或酸性残基,特别是苏氨酸。在一些实施方案中,酮还原酶可在对应X223的残基处额外地具有脂肪族残基,特别是缬氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶多肽包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X7的残基是非极性、极性或限制残基,特别是丝氨酸、组氨酸或天冬酰胺;对应X117的残基是非极性或极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;且对应X157的残基是极性或酸性残基,特别是苏氨酸。在一些实施方案中,酮还原酶可在对应X223的残基处额外地具有脂肪族残基,特别是缬氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶多肽包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X94的残基是极性、碱性、脂肪族或非极性残基;特别是缬氨酸、苏氨酸或精氨酸;对应X117的残基是非极性或极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;且对应X157的残基是极性或酸性残基,特别是苏氨酸。在一些实施方案中,酮还原酶可在对应X223的残基处额外地具有脂肪族残基,特别是缬氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶多肽包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X96的残基是限制、脂肪族、非极性、酸性或极性残基,特别是天冬酰胺、脯氨酸、丙氨酸或谷氨酸;对应X117的残基是非极性或极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;且对应X157的残基是极性或酸性残基,特别是苏氨酸。在一些实施方案中,酮还原酶可在对应X223的残基处额外地具有脂肪族残基,特别是缬氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶多肽包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X108的残基是碱性、限制或芳族残基,特别是组氨酸;对应X117的残基是非极性或极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;且对应X157的残基是极性或酸性残基,特别是苏氨酸。在一些实施方案中,酮还原酶可在对应X223的残基处额外地具有脂肪族残基,特别是缬氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶多肽包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X117的残基是非极性或极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;对应X173的残基是酸性或非极性残基,特别是甘氨酸;且对应X157的残基是极性或酸性残基,特别是苏氨酸。在一些实施方案中,酮还原酶可在对应X223的残基处额外地具有脂肪族残基,特别是缬氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶多肽包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X117的残基是非极性或极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;对应X157的残基是极性或酸性残基,特别是苏氨酸;且对应X206的残基是极性或非极性残基,特别是谷氨酰胺。在一些实施方案中,酮还原酶可在对应X223的残基处额外地具有脂肪族残基,特别是缬氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶多肽包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X7的残基是非极性、极性或限制残基,特别是丝氨酸、组氨酸或天冬酰胺;对应X108的残基是碱性、限制或芳族残基,特别是组氨酸;对应X117的残基是非极性或极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;且对应X157的残基是极性或酸性残基,特别是苏氨酸。在一些实施方案中,酮还原酶可在对应X223的残基处额外地具有脂肪族残基,特别是缬氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶多肽包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X7的残基是非极性、极性或限制残基,特别是丝氨酸、组氨酸或天冬酰胺;对应X94的残基是极性、碱性、脂肪族或非极性残基;特别是缬氨酸、苏氨酸或精氨酸;对应X108的残基是碱性、限制或芳族残基,特别是组氨酸;对应X117的残基是非极性或极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;且对应X157的残基是极性或酸性残基,特别是苏氨酸。在一些实施方案中,酮还原酶可在对应X223的残基处额外地具有脂肪族残基,特别是缬氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶多肽包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X7的残基是非极性、极性或限制残基,特别是丝氨酸、组氨酸或天冬酰胺;对应X96的残基是限制、脂肪族、非极性、酸性或极性残基,特别是天冬酰胺、脯氨酸、丙氨酸或谷氨酸;对应X108的残基是碱性、限制或芳族残基,特别是组氨酸;对应X117的残基是非极性或极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;且对应X157的残基是极性或酸性残基,特别是苏氨酸。在一些实施方案中,酮还原酶可在对应X223的残基处额外地具有脂肪族残基,特别是缬氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶多肽包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X7的残基是非极性、极性或限制残基,特别是丝氨酸、组氨酸或天冬酰胺;对应X94的残基是极性、碱性、脂肪族或非极性残基;特别是缬氨酸、苏氨酸或精氨酸;对应X96的残基是限制、脂肪族、非极性、酸性或极性残基,特别是天冬酰胺、脯氨酸、丙氨酸或谷氨酸;对应X108的残基是碱性、限制或芳族残基,特别是组氨酸;对应X117的残基是非极性或极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;且对应X157的残基是极性或酸性残基,特别是苏氨酸。在一些实施方案中,酮还原酶可在对应X223的残基处额外地具有脂肪族残基,特别是缬氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶多肽包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X108的残基是碱性、限制或芳族残基,特别是组氨酸;对应X117的残基是非极性或极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;对应X157的残基是极性或酸性残基,特别是苏氨酸;且对应X206的残基是极性或非极性残基,特别是谷氨酰胺。在一些实施方案中,酮还原酶可在对应X223的残基处额外地具有脂肪族残基,特别是缬氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶多肽包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X7的残基是非极性、极性或限制残基,特别是丝氨酸、组氨酸或天冬酰胺;对应X108的残基是碱性、限制或芳族残基,特别是组氨酸;对应X117的残基是非极性或极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;对应X157的残基是极性或酸性残基,特别是苏氨酸;且对应X206的残基是极性或非极性残基,特别是谷氨酰胺。在一些实施方案中,酮还原酶可在对应X223的残基处额外地具有脂肪族残基,特别是缬氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶多肽包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X7的残基是非极性、极性或限制残基,特别是丝氨酸、组氨酸或天冬酰胺;对应X94的残基是极性、碱性、脂肪族或非极性残基;特别是缬氨酸、苏氨酸或精氨酸;对应X108的残基是碱性、限制或芳族残基,特别是组氨酸;对应X117的残基是非极性或极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;对应X157的残基是极性或酸性残基,特别是苏氨酸;且对应X206的残基是极性或非极性残基,特别是谷氨酰胺。在一些实施方案中,酮还原酶可在对应X223的残基处额外地具有脂肪族残基,特别是缬氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶多肽包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X7的残基是非极性、极性或限制残基,特别是丝氨酸、组氨酸或天冬酰胺;对应X96的残基是限制、脂肪族、非极性、酸性或极性残基,特别是天冬酰胺、脯氨酸、丙氨酸或谷氨酸;对应X108的残基是碱性、限制或芳族残基,特别是组氨酸;对应X117的残基是非极性或极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;对应X157的残基是极性或酸性残基,特别是苏氨酸;且对应X206的残基是极性或非极性残基,特别是谷氨酰胺。在一些实施方案中,酮还原酶可在对应X223的残基处额外地具有脂肪族残基,特别是缬氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶多肽包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X7的残基是非极性、极性或限制残基,特别是丝氨酸、组氨酸或天冬酰胺;对应X94的残基是极性、碱性、脂肪族或非极性残基;特别是缬氨酸、苏氨酸或精氨酸;对应X96的残基是限制、脂肪族、非极性、酸性或极性残基,特别是天冬酰胺、脯氨酸、丙氨酸或谷氨酸;对应X108的残基是碱性、限制或芳族残基,特别是组氨酸;对应X117的残基是非极性或极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;对应X157的残基是极性或酸性残基,特别是苏氨酸;且对应X206的残基是极性或非极性残基,特别是谷氨酰胺。在一些实施方案中,酮还原酶可在对应X223的残基处额外地具有脂肪族残基,特别是缬氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶多肽包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X117的残基是非极性或极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;对应X157的残基是极性或酸性残基,特别是苏氨酸;对应X173的残基是酸性或非极性残基,特别是甘氨酸;且对应X206的残基是极性或非极性残基,特别是谷氨酰胺。在一些实施方案中,酮还原酶可在对应X223的残基处额外地具有脂肪族残基,特别是缬氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶多肽包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X7的残基是非极性、极性或限制残基,特别是丝氨酸、组氨酸或天冬酰胺;对应X117的残基是非极性或极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;对应X157的残基是极性或酸性残基,特别是苏氨酸;对应X173的残基是酸性或非极性残基,特别是甘氨酸;且对应X206的残基是极性或非极性残基,特别是谷氨酰胺。在一些实施方案中,酮还原酶可在对应X223的残基处额外地具有脂肪族残基,特别是缬氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶多肽包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X7的残基是非极性、极性或限制残基,特别是丝氨酸、组氨酸或天冬酰胺;对应X94的残基是极性、碱性、脂肪族或非极性残基;特别是缬氨酸、苏氨酸或精氨酸;对应X117的残基是非极性或极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;对应X157的残基是极性或酸性残基,特别是苏氨酸;对应X173的残基是酸性或非极性残基,特别是甘氨酸;且对应X206的残基是极性或非极性残基,特别是谷氨酰胺。在一些实施方案中,酮还原酶可在对应X223的残基处额外地具有脂肪族残基,特别是缬氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶多肽包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X7的残基是非极性、极性或限制残基,特别是丝氨酸、组氨酸或天冬酰胺;对应X96的残基是限制、脂肪族、非极性、酸性或极性残基,特别是天冬酰胺、脯氨酸、丙氨酸或谷氨酸;对应X117的残基是非极性或极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;对应X157的残基是极性或酸性残基,特别是苏氨酸;对应X173的残基是酸性或非极性残基,特别是甘氨酸;且对应X206的残基是极性或非极性残基,特别是谷氨酰胺。在一些实施方案中,酮还原酶可在对应X223的残基处额外地具有脂肪族残基,特别是缬氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQ ID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶多肽包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其中所述氨基酸序列具有至少以下特征:对应X7的残基是非极性、极性或限制残基,特别是丝氨酸、组氨酸或天冬酰胺;对应X94的残基是极性、碱性、脂肪族或非极性残基;特别是缬氨酸、苏氨酸或精氨酸;对应X96的残基是限制、脂肪族、非极性、酸性或极性残基,特别是天冬酰胺、脯氨酸、丙氨酸或谷氨酸;对应X117的残基是非极性或极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;对应X157的残基是极性或酸性残基,特别是苏氨酸;对应X173的残基是酸性或非极性残基,特别是甘氨酸;且对应X206的残基是极性或非极性残基,特别是谷氨酰胺。在一些实施方案中,酮还原酶可在对应X223的残基处额外地具有脂肪族残基,特别是缬氨酸。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中氨基酸序列与具有以上特征的基于SEQID NO:2、4或142的参考序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶包括与选自如表2所列的SEQ IDNO:6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、86、88、90、92、94、96、100、102、104、106、108、110、112、126、128、130和134的参考序列具有至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性的氨基酸序列,其中所述改善的酮还原酶多肽氨基酸序列包括表2中提供的任何一组指定的氨基酸取代组合。在一些实施方案中,与参考序列对比,酮还原酶多肽可在其他氨基酸残基处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶包括具有对应SEQ ID NO:6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、86、88、90、92、94、96、100、102、104、106、108、110、112、126、128、130和134的氨基酸序列的多肽。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其具有至少以下特征:对应X72的残基是碱性残基,特别是精氨酸;对应X117的残基是极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;对应X157的残基是极性残基,特别是苏氨酸;且对应X223的残基是脂肪族残基,特别是缬氨酸。在一些实施方案中,与SEQ ID NO:104的参考序列对比,酮还原酶多肽可在其他残基位置处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个残基差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。在一些实施方案中,酮还原酶多肽包括具有以上特征的氨基酸序列,且其中所述氨基酸序列与SEQ ID NO:104具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其具有至少以下特征:对应X7的残基是极性残基,特别是丝氨酸;对应X108的残基是限制残基,特别是组氨酸;对应X117的残基是极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;对应X157的残基是极性残基,特别是苏氨酸;且对应X223的残基是脂肪族残基,特别是缬氨酸。在一些实施方案中,与SEQ ID NO:44的参考序列对比,酮还原酶多肽可在其他残基位置处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个残基差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。在一些实施方案中,酮还原酶多肽包括具有以上特征的氨基酸序列,且其中所述氨基酸序列与SEQ ID NO:44具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其具有至少以下特征:对应X7的残基是极性残基,特别是丝氨酸;对应X49的残基是碱性残基,特别是精氨酸;对应X111的残基是非极性残基,特别是甲硫氨酸;对应X117的残基是极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;对应X157的残基是极性残基,特别是苏氨酸;对应X173的残基是非极性残基,特别是甘氨酸;且对应X223的残基是脂肪族残基,特别是缬氨酸。在一些实施方案中,与SEQ ID NO:68的参考序列对比,酮还原酶多肽可在其他残基位置处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个残基差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。在一些实施方案中,酮还原酶多肽包括具有以上特征的氨基酸序列,且其中所述氨基酸序列与SEQ ID NO:68具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其具有至少以下特征:对应X7的残基是极性残基,特别是丝氨酸;对应X94的残基是非极性或极性残基,特别是苏氨酸;对应X97的残基是非极性或脂肪族残基,特别是亮氨酸;对应X108的残基是限制残基,特别是组氨酸;对应X117的残基是极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;对应X157的残基是极性残基,特别是苏氨酸;对应X223的残基是脂肪族残基,特别是缬氨酸;且对应X226的残基是脂肪族残基,特别是亮氨酸。在一些实施方案中,与SEQ ID NO:42的参考序列对比,酮还原酶多肽可在其他残基位置处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个残基差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。在一些实施方案中,酮还原酶多肽包括具有以上特征的氨基酸序列,且其中所述氨基酸序列与SEQID NO:42具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其具有至少以下特征:对应X7的残基是极性残基,特别是丝氨酸;对应X94的残基是非极性或极性残基,特别是苏氨酸;对应X96的残基是限制或酸性残基,特别是脯氨酸;对应X108的残基是限制残基,特别是组氨酸;对应X117的残基是极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;对应X157的残基是极性残基,特别是苏氨酸;且对应X223的残基是脂肪族残基,特别是缬氨酸。在一些实施方案中,与SEQ ID NO:24的参考序列对比,酮还原酶多肽可在其他残基位置处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个残基差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。在一些实施方案中,酮还原酶多肽包括具有以上特征的氨基酸序列,且其中所述氨基酸序列与SEQ ID NO:24具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其具有至少以下特征:对应X7的残基是极性残基,特别是丝氨酸;对应X94的残基是非极性或极性残基,特别是苏氨酸;对应X108的残基是限制残基,特别是组氨酸;对应X117的残基是极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;对应X157的残基是极性残基,特别是苏氨酸;对应X206的残基是极性残基,特别是谷氨酰胺;且对应X223的残基是脂肪族残基,特别是缬氨酸。在一些实施方案中,与SEQ ID NO:38的参考序列对比,酮还原酶多肽可在其他残基位置处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个残基差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。在一些实施方案中,酮还原酶多肽包括具有以上特征的氨基酸序列,且其中所述氨基酸序列与SEQ ID NO:38具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其具有至少以下特征:对应X7的残基是极性残基,特别是丝氨酸;对应X94的残基是非极性或极性残基,特别是苏氨酸;对应X96的残基是限制或酸性残基,特别是谷氨酸;对应X108的残基是限制残基,特别是组氨酸;对应X117的残基是极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;对应X157的残基是极性残基,特别是苏氨酸;且对应X223的残基是脂肪族残基,特别是缬氨酸。在一些实施方案中,与SEQ ID NO:32的参考序列对比,酮还原酶多肽可在其他残基位置处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个残基差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。在一些实施方案中,酮还原酶多肽包括具有以上特征的氨基酸序列,且其中所述氨基酸序列与SEQ ID NO:32具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其具有至少以下特征:对应X7的残基是极性残基,特别是精氨酸;对应X94的残基是非极性或极性残基,特别是苏氨酸;对应X106的残基是酸性残基,特别是天冬氨酸;对应X108的残基是限制残基,特别是组氨酸;对应X117的残基是极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;对应X157的残基是极性残基,特别是苏氨酸;且对应X223的残基是脂肪族残基,特别是缬氨酸。在一些实施方案中,与SEQ ID NO:8的参考序列对比,酮还原酶多肽可在其他残基位置处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个残基差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。在一些实施方案中,酮还原酶多肽包括具有以上特征的氨基酸序列,且其中所述氨基酸序列与SEQ ID NO:8具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其具有至少以下特征:对应X3的残基是芳族残基,特别是酪氨酸;对应X7的残基是极性残基,特别是精氨酸;对应X94的残基是非极性或极性残基,特别是苏氨酸;对应X108的残基是限制残基,特别是组氨酸;对应X117的残基是极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;对应X157的残基是极性残基,特别是苏氨酸;且对应X223的残基是脂肪族残基,特别是缬氨酸。在一些实施方案中,与SEQ ID NO:134的参考序列对比,酮还原酶多肽可在其他残基位置处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个残基差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。在一些实施方案中,酮还原酶多肽包括具有以上特征的氨基酸序列,且其中所述氨基酸序列与SEQ ID NO:134具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其具有至少以下特征:对应X7的残基是极性残基,特别是精氨酸;对应X94的残基是非极性或极性残基,特别是苏氨酸;对应X108的残基是限制残基,特别是组氨酸;对应X117的残基是极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;对应X157的残基是极性残基,特别是苏氨酸;对应X208的残基是限制残基,特别是组氨酸;且对应X223的残基是脂肪族残基,特别是缬氨酸。在一些实施方案中,与SEQ ID NO:6的参考序列对比,酮还原酶多肽可在其他残基位置处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个残基差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。在一些实施方案中,酮还原酶多肽包括具有以上特征的氨基酸序列,且其中所述氨基酸序列与SEQ ID NO:6具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其具有至少以下特征:对应X7的残基是极性残基,特别是精氨酸;对应X94的残基是非极性或极性残基,特别是苏氨酸;对应X96的残基是限制残基,特别是脯氨酸;对应X108的残基是限制残基,特别是组氨酸;对应X117的残基是极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;对应X157的残基是极性残基,特别是苏氨酸;对应X206的残基是极性残基,特别是谷氨酰胺;且对应X223的残基是脂肪族残基,特别是缬氨酸。在一些实施方案中,与SEQ ID NO:26的参考序列对比,酮还原酶多肽可在其他残基位置处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个残基差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。在一些实施方案中,酮还原酶多肽包括具有以上特征的氨基酸序列,且其中所述氨基酸序列与SEQ ID NO:26具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其具有至少以下特征:对应X7的残基是极性残基,特别是精氨酸;对应X108的残基是限制残基,特别是组氨酸;对应X117的残基是极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;对应X157的残基是极性残基,特别是苏氨酸;对应X206的残基是极性残基,特别是谷氨酰胺;且对应X223的残基是脂肪族残基,特别是缬氨酸。在一些实施方案中,与SEQ ID NO:52的参考序列对比,酮还原酶多肽可在其他残基位置处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个残基差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。在一些实施方案中,酮还原酶多肽包括具有以上特征的氨基酸序列,且其中所述氨基酸序列与SEQ ID NO:52具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其具有至少以下特征:对应X7的残基是极性残基,特别是精氨酸;对应X96的残基是限制残基,特别是脯氨酸;对应X108的残基是限制残基,特别是组氨酸;对应X117的残基是极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;对应X157的残基是极性残基,特别是苏氨酸;对应X206的残基是极性残基,特别是谷氨酰胺;且对应X223的残基是脂肪族残基,特别是缬氨酸。在一些实施方案中,与SEQ ID NO:50的参考序列对比,酮还原酶多肽可在其他残基位置处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个残基差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。在一些实施方案中,酮还原酶多肽包括具有以上特征的氨基酸序列,且其中所述氨基酸序列与SEQID NO:50具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其具有至少以下特征:对应X7的残基是极性残基,特别是精氨酸;对应X16的残基是非极性或脂肪族残基,特别是甘氨酸;对应X96的残基是限制残基,特别是脯氨酸;对应X108的残基是限制残基,特别是组氨酸;对应X117的残基是极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;对应X157的残基是极性残基,特别是苏氨酸;对应X206的残基是极性残基,特别是谷氨酰胺;且对应X223的残基是脂肪族残基,特别是缬氨酸。在一些实施方案中,与SEQ ID NO:76的参考序列对比,酮还原酶多肽可在其他残基位置处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个残基差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。在一些实施方案中,酮还原酶多肽包括具有以上特征的氨基酸序列,且其中所述氨基酸序列与SEQ ID NO:76具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其具有至少以下特征:对应X7的残基是极性残基,特别是精氨酸;对应X16的残基是非极性或脂肪族残基,特别是缬氨酸;对应X94的残基是非极性或极性残基,特别是苏氨酸;对应X96的残基是限制残基,特别是脯氨酸;对应X108的残基是限制残基,特别是组氨酸;对应X117的残基是极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;对应X157的残基是极性残基,特别是苏氨酸;对应X206的残基是极性残基,特别是谷氨酰胺;且对应X223的残基是脂肪族残基,特别是缬氨酸。在一些实施方案中,与SEQ ID NO:80的参考序列对比,酮还原酶多肽可在其他残基位置处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个残基差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。在一些实施方案中,酮还原酶多肽包括具有以上特征的氨基酸序列,且其中所述氨基酸序列与SEQ ID NO:80具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其具有至少以下特征:对应X7的残基是极性残基,特别是精氨酸;对应X16的残基是非极性或脂肪族残基,特别是甘氨酸;对应X94的残基是非极性或极性残基,特别是苏氨酸;对应X96的残基是限制残基,特别是脯氨酸;对应X108的残基是限制残基,特别是组氨酸;对应X117的残基是极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;对应X157的残基是极性残基,特别是苏氨酸;对应X206的残基是极性残基,特别是谷氨酰胺;且对应X223的残基是脂肪族残基,特别是缬氨酸。在一些实施方案中,与SEQ ID NO:78的参考序列对比,酮还原酶多肽可在其他残基位置处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个残基差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。在一些实施方案中,酮还原酶多肽包括具有以上特征的氨基酸序列,且其中所述氨基酸序列与SEQ ID NO:78具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其具有至少以下特征:对应X7的残基是极性残基,特别是精氨酸;对应X94的残基是非极性或极性残基,特别是苏氨酸;对应X96的残基是限制残基,特别是脯氨酸;对应X108的残基是限制残基,特别是组氨酸;对应X117的残基是极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;对应X157的残基是极性残基,特别是苏氨酸;对应X194的残基是非极性残基,特别是甘氨酸;对应X206的残基是极性残基,特别是谷氨酰胺;且对应X223的残基是脂肪族残基,特别是缬氨酸。在一些实施方案中,与SEQ ID NO:30的参考序列对比,酮还原酶多肽可在其他残基位置处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个残基差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。在一些实施方案中,酮还原酶多肽包括具有以上特征的氨基酸序列,且其中所述氨基酸序列与SEQ ID NO:30具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其具有至少以下特征:对应X7的残基是极性残基,特别是精氨酸;对应X94的残基是非极性或极性残基,特别是苏氨酸;对应X96的残基是限制残基,特别是脯氨酸;对应X108的残基是限制残基,特别是组氨酸;对应X117的残基是极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;对应X157的残基是极性残基,特别是苏氨酸;对应X194的残基是碱性残基,特别是精氨酸;对应X206的残基是极性残基,特别是谷氨酰胺;且对应X223的残基是脂肪族残基,特别是缬氨酸。在一些实施方案中,与SEQ ID NO:22的参考序列对比,酮还原酶多肽可在其他残基位置处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个残基差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。在一些实施方案中,酮还原酶多肽包括具有以上特征的氨基酸序列,且其中所述氨基酸序列与SEQ ID NO:22具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其具有至少以下特征:对应X7的残基是极性残基,特别是精氨酸;对应X49的残基是碱性残基,特别是精氨酸;对应X111的残基是非极性或脂肪族残基,特别是甲硫氨酸;对应X117的残基是极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;对应X157的残基是极性残基,特别是苏氨酸;对应X173的残基是非极性残基,特别是甘氨酸;对应X206的残基是极性残基,特别是谷氨酰胺;且对应X223的残基是脂肪族残基,特别是缬氨酸。在一些实施方案中,与SEQ ID NO:70的参考序列对比,酮还原酶多肽可在其他残基位置处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个残基差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。在一些实施方案中,酮还原酶多肽包括具有以上特征的氨基酸序列,且其中所述氨基酸序列与SEQ ID NO:70具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其具有至少以下特征:对应X7的残基是极性残基,特别是精氨酸;对应X49的残基是碱性残基,特别是精氨酸;对应X96的残基是限制残基,特别是脯氨酸;对应X111的残基是非极性或脂肪族残基,特别是甲硫氨酸;对应X117的残基是极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;对应X157的残基是极性残基,特别是苏氨酸;对应X173的残基是非极性残基,特别是甘氨酸;对应X206的残基是极性残基,特别是谷氨酰胺;且对应X223的残基是脂肪族残基,特别是缬氨酸。在一些实施方案中,与SEQ ID NO:66的参考序列对比,酮还原酶多肽可在其他残基位置处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个残基差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。在一些实施方案中,酮还原酶多肽包括具有以上特征的氨基酸序列,且其中所述氨基酸序列与SEQ ID NO:66具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。
在一些实施方案中,改善的酮还原酶包括基于SEQ ID NO:143、144或145的序列式或其结构域(诸如残基90-211)的氨基酸序列,其具有至少以下特征:对应X7的残基是极性残基,特别是精氨酸;对应X49的残基是碱性残基,特别是精氨酸;对应X94的残基是极性残基,特别是苏氨酸;对应X96的残基是限制残基,特别是脯氨酸;对应X111的残基是非极性或脂肪族残基,特别是甲硫氨酸;对应X117的残基是极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;对应X157的残基是极性残基,特别是苏氨酸;对应X173的残基是非极性残基,特别是甘氨酸;对应X206的残基是极性残基,特别是谷氨酰胺;且对应X223的残基是脂肪族残基,特别是缬氨酸。在一些实施方案中,与SEQ ID NO:58的参考序列对比,酮还原酶多肽可在其他残基位置处额外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个残基差异。在一些实施方案中,在其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个残基差异。在一些实施方案中,差异包括保守突变。在一些实施方案中,酮还原酶多肽包括具有以上特征的氨基酸序列,且其中所述氨基酸序列与SEQ ID NO:58具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。
在一些实施方案中,改善的酮还原酶包括具有对应SEQ ID NO:143、144或145的序列式的残基90-211的区域或结构域的氨基酸序列,其中结构域中的对应X145的残基是极性残基。在一些实施方案中,对应SEQ IDNO:143、144或145的序列式的残基90-211的区域或结构域在对应X145的残基处具有丝氨酸。在一些实施方案中,与基于SEQ ID NO:2、4或142的参考序列的结构域对比,对应残基90-211的区域或结构域可在其他氨基酸残基处额外地具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18或1-20个残基差异。在一些实施方案中,在结构域的其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18或约20个残基差异。在一些实施方案中,差异包括保守突变。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中所述氨基酸序列与具有以上特征的对应基于SEQ ID NO:2、4或142的参考序列的残基90-211的氨基酸序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。
在一些实施方案中,具有对应残基90-211的结构域,并在对应X145的残基处具有极性残基,特别是丝氨酸的酮还原酶多肽可进一步包括选自以下的一个或多个特征:对应X94的残基是极性、碱性、脂肪族或非极性残基;对应X95的残基是非极性或脂肪族残基;对应X96的残基是限制、脂肪族、非极性、酸性或极性残基;对应X97的残基是酸性、碱性或脂肪族残基;对应X106的残基是酸性残基;对应X108的残基是碱性、限制或芳族残基;对应X111的残基是脂肪族或非极性残基;对应X117的残基是非极性或极性残基;对应X126的残基是脂肪族或非极性残基;对应X127的残基是极性或碱性残基;对应X147的残基是芳族、脂肪族残基、非极性或极性残基;对应X152的残基是极性、脂肪族或非极性残基;对应X157的残基是极性或酸性残基;对应X163的残基是脂肪族或非极性残基;对应X173的残基是酸性或非极性残基;对应X177的残基是碱性残基;对应X192的残基是碱性或酸性残基;对应X194的残基是限制、极性、非极性、酸性或脂肪族残基;对应X198的残基是酸性或非极性残基;对应X200的残基是限制、酸性或碱性残基;对应X206的残基是极性或非极性残基;对应X208的残基是极性、限制或碱性残基;对应X210的残基是脂肪族、非极性或极性残基;且对应X211的残基是碱性或酸性残基。在一些实施方案中,对应X94的残基不是芳族残基、组氨酸或甘氨酸。在一些实施方案中,对应X96的残基不是芳族残基、甘氨酸、异亮氨酸或半胱氨酸。在一些实施方案中,与基于SEQ ID NO:2、4或142的参考序列的结构域对比,对应残基90-211的区域或结构域可在其他氨基酸残基处额外地具有约1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18或1-20个残基差异。在一些实施方案中,在结构域的其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18或约20个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,与SEQ ID NO:4、2或142的氨基酸序列对比,具有对应基于SEQ ID NO:143、144或145的序列式的残基90-211的结构域或区域的酮还原酶多肽可具有一个或多个保守突变。示例性保守取代包括氨基酸置换,诸如但不限于:用另一脂肪族氨基酸,例如缬氨酸置换对应X94的残基(A);用另一非极性或脂肪族残基,例如丙氨酸置换对应X95的残基(V);用另一碱性氨基酸,例如精氨酸置换对应X97的残基(K);用另一酸性氨基酸,例如天冬氨酸置换对应X106的残基(E);用另一非极性或脂肪族氨基酸,例如甲硫氨酸置换对应X111的残基(L);用另一非极性氨基酸,例如亮氨酸置换残基X147(F);用另一碱性氨基酸,例如精氨酸置换对应X177的残基(K);用另一碱性氨基酸,例如精氨酸置换对应X192的残基(K)。
在一些实施方案中,具有对应残基90-211的结构域,并在对应X145的残基处具有极性残基,特别是丝氨酸的酮还原酶多肽可进一步包括选自以下的一个或多个特征:对应X94的残基是丙氨酸、缬氨酸、苏氨酸、丝氨酸或精氨酸;对应X95的残基是缬氨酸或丙氨酸;对应X96的残基是天冬酰胺、丝氨酸、脯氨酸、丙氨酸或谷氨酸;对应X97的残基是赖氨酸、精氨酸或亮氨酸;对应X106的残基是谷氨酸或天冬氨酸;对应X108的残基是精氨酸或组氨酸;对应X111的残基是亮氨酸或甲硫氨酸;对应X117的残基是甘氨酸或丝氨酸;对应X126的残基是异亮氨酸或缬氨酸;对应X127的残基是谷氨酰胺或精氨酸;对应X147的残基是苯丙氨酸、亮氨酸或丝氨酸;对应X152的残基是苏氨酸、丝氨酸或甲硫氨酸;对应X157的残基是天冬酰胺、谷氨酰胺、苏氨酸、丝氨酸或天冬氨酸;对应X163的残基是缬氨酸或异亮氨酸;对应X173的残基是天冬氨酸或甘氨酸;对应X177的残基是赖氨酸或精氨酸;对应X192的残基是赖氨酸、精氨酸或谷氨酸;对应X194的残基是脯氨酸、甘氨酸、天冬氨酸、精氨酸或亮氨酸;对应X198的残基是天冬氨酸或甘氨酸;对应X200的残基是脯氨酸、谷氨酸或赖氨酸;对应X206的残基是甲硫氨酸或谷氨酰胺;对应X208的残基是谷氨酰胺、组氨酸或精氨酸;对应X210的残基是苏氨酸或丙氨酸;且对应X211的残基是赖氨酸或谷氨酸。在一些实施方案中,与基于SEQ ID NO:2、4或142的参考序列的结构域对比,对应残基90-211的区域或结构域可在其他氨基酸残基处额外地具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18或1-20个残基差异。在一些实施方案中,在结构域的其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18或约20个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,具有对应残基90-211的结构域,并在对应X145的残基处具有极性残基,特别是丝氨酸的酮还原酶多肽可进一步包括选自以下的特征中的一个或多个或至少全部:对应X94的残基是极性、碱性、脂肪族或非极性残基;对应X96的残基是限制、脂肪族、非极性、酸性或极性残基;对应X108的残基是碱性、限制或芳族残基;对应X117的残基是非极性或极性残基;对应X157的残基是极性或酸性残基;对应X173的残基是酸性或非极性残基;且对应X206的残基是极性或非极性残基。在一些实施方案中,除了以上特征之外,所述结构域或区域可进一步包括选自以下的特征中的一个或多个:对应X97的残基是酸性、碱性或脂肪族残基;对应X106的残基是酸性残基;对应X111的残基是脂肪族或非极性残基;对应X126的残基是脂肪族或非极性残基;对应X127的残基是极性或碱性残基;对应X147的残基是芳族、脂肪族残基、非极性或极性残基;对应X152的残基是极性、脂肪族或非极性残基;对应X163的残基是脂肪族或非极性残基;对应X177的残基是碱性残基;对应X192的残基是碱性或酸性残基;对应X194的残基是限制、极性、非极性、酸性或脂肪族残基;对应X198的残基是酸性或非极性残基;对应X200的残基是限制、酸性或碱性残基;对应X208的残基是极性、限制或碱性残基;对应X210的残基是脂肪族、非极性或极性残基;且对应X211的残基是碱性或酸性残基。在一些实施方案中,与基于SEQ ID NO:2、4或142的参考序列的结构域对比,对应残基90-211的区域或结构域可在其他氨基酸残基处额外地具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18或1-20个残基差异。在一些实施方案中,在结构域的其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18或约20个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,具有对应残基90-211的结构域,并在对应X145的残基处具有极性残基,特别是丝氨酸的酮还原酶多肽可进一步包括选自以下的特征中的一个或多个或至少全部:对应X94的残基是丙氨酸、缬氨酸、苏氨酸、丝氨酸或精氨酸;对应X96的残基是天冬酰胺、丝氨酸、脯氨酸、丙氨酸或谷氨酸;对应X108的残基是精氨酸或组氨酸;对应X117的残基是甘氨酸或丝氨酸;对应X157的残基是天冬酰胺、谷氨酰胺、苏氨酸、丝氨酸或天冬氨酸;对应X173的残基是天冬氨酸或甘氨酸;且对应X206的残基是甲硫氨酸或谷氨酰胺。在一些实施方案中,除了以上特征之外,所述结构域或区域可进一步包括选自以下的特征中的一个或多个:对应X95的残基是缬氨酸或丙氨酸;对应X97的残基是赖氨酸、精氨酸或亮氨酸;对应X106的残基是谷氨酸或天冬氨酸;对应X111的残基是亮氨酸或甲硫氨酸;对应X126的残基是异亮氨酸或缬氨酸;对应X127的残基是谷氨酰胺或精氨酸;对应X147的残基是苯丙氨酸、亮氨酸或丝氨酸;对应X152的残基是苏氨酸、丝氨酸或甲硫氨酸;对应X163的残基是缬氨酸或异亮氨酸;对应X173的残基是天冬氨酸或甘氨酸;对应X177的残基是赖氨酸或精氨酸;对应X192的残基是赖氨酸、精氨酸或谷氨酸;对应X194的残基是脯氨酸、甘氨酸、天冬氨酸、精氨酸或亮氨酸;对应X198的残基是天冬氨酸或甘氨酸;对应X200的残基是脯氨酸、谷氨酸或赖氨酸;对应X208的残基是谷氨酰胺、组氨酸或精氨酸;对应X210的残基是苏氨酸或丙氨酸;且对应X211的残基是赖氨酸或谷氨酸。在一些实施方案中,与基于SEQ ID NO:2、4或142的参考序列的结构域对比,对应残基90-211的区域或结构域可在其他氨基酸残基处额外地具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18或1-20个残基差异。在一些实施方案中,在结构域的其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18或约20个残基差异。在一些实施方案中,差异包括保守突变。
在一些实施方案中,改善的酮还原酶包括具有对应基于SEQ ID NO:143、144或145的序列式的残基90-211的区域或结构域的氨基酸序列,其具有至少以下特征:对应X117的残基是非极性或极性残基,特别是丝氨酸;对应X145的残基极性残基,特别是丝氨酸;且对应X157的残基是极性或酸性残基,特别是丝氨酸或苏氨酸。在一些实施方案中,与基于SEQID NO:2、4或142的参考序列的对应结构域对比,对应残基90-211的区域或结构域可在其他氨基酸残基处额外地具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18或1-20个残基差异。在一些实施方案中,在结构域的其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18或约20个残基差异。在一些实施方案中,差异包括保守突变。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中所述氨基酸序列与具有以上特征的对应基于SEQ ID NO:2、4或142的参考序列的残基90-211的氨基酸序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。
在一些实施方案中,改善的酮还原酶包括具有对应基于SEQ ID NO:143、144或145的序列式的残基90-211的区域或结构域的氨基酸序列,其具有至少以下特征:对应X108的残基是碱性、限制或芳族残基,特别是组氨酸;对应X117的残基是非极性或极性残基,特别是丝氨酸;对应X145的残基极性残基,特别是丝氨酸;且对应X157的残基是极性或酸性残基,特别是丝氨酸或苏氨酸。在一些实施方案中,与基于SEQ ID NO:2、4或142的参考序列的结构域对比,对应残基90-211的区域或结构域可在其他氨基酸残基处额外地具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18或1-20个残基差异。在一些实施方案中,在结构域的其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18或约20个残基差异。在一些实施方案中,差异包括保守突变。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中所述氨基酸序列与具有以上特征的对应基于SEQ ID NO:2、4或142的参考序列的残基90-211的氨基酸序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。
在一些实施方案中,改善的酮还原酶包括具有对应基于SEQ ID NO:143、144或145的序列式的残基90-211的区域或结构域的氨基酸序列,其具有至少以下特征:对应X94的残基是极性、碱性、脂肪族或非极性残基,特别是苏氨酸或缬氨酸;对应X108的残基是碱性、限制或芳族残基,特别是组氨酸;对应X117的残基是非极性或极性残基,特别是丝氨酸;对应X145的残基极性残基,特别是丝氨酸;且对应X157的残基是极性或酸性残基,特别是丝氨酸或苏氨酸。在一些实施方案中,与基于SEQ IDNO:2、4或142的参考序列的结构域对比,对应残基90-211的区域或结构域可在其他氨基酸残基处额外地具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18或1-20个残基差异。在一些实施方案中,在结构域的其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18或约20个残基差异。在一些实施方案中,差异包括保守突变。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中所述氨基酸序列与具有以上特征的对应基于SEQ ID NO:2、4或142的参考序列的残基90-211的氨基酸序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。
在一些实施方案中,改善的酮还原酶包括具有对应基于SEQ ID NO:143、144或145的序列式的残基90-211的区域或结构域的氨基酸序列,其具有至少以下特征:对应X96的残基是限制、脂肪族、非极性、酸性或极性残基,特别是天冬酰胺、脯氨酸、丙氨酸或谷氨酸;对应X108的残基是碱性、限制或芳族残基,特别是组氨酸;对应X117的残基是非极性或极性残基,特别是丝氨酸;对应X145的残基极性残基,特别是丝氨酸;且对应X157的残基是极性或酸性残基,特别是丝氨酸或苏氨酸。在一些实施方案中,,对应残基90-211的区域或结构域可在结构域的其他氨基酸残基处额外地具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18或1-20个突变。在一些实施方案中,与基于SEQ ID NO:2、4或142的参考序列的结构域对比,对应残基90-211的区域或结构域可在其他氨基酸残基处额外地具有约1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18或1-20个残基差异。在一些实施方案中,在结构域的其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18或约20个残基差异。在一些实施方案中,差异包括保守突变。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中所述氨基酸序列与具有以上特征的对应基于SEQ ID NO:2、4或142的参考序列的残基90-211的氨基酸序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。
在一些实施方案中,改善的酮还原酶包括具有对应基于SEQ ID NO:143、144或145的序列式的残基90-211的区域或结构域的氨基酸序列,其具有至少以下特征:对应X94的残基是非极性或极性残基,特别是苏氨酸或缬氨酸;对应X96的残基是限制、脂肪族、非极性、酸性或极性残基,特别是天冬酰胺、脯氨酸、丙氨酸或谷氨酸;对应X108的残基是碱性、限制或芳族残基,特别是组氨酸;对应X117的残基是非极性或极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;且对应X157的残基是极性或酸性残基,特别是丝氨酸或苏氨酸。在一些实施方案中,与基于SEQ ID NO:2、4或142的参考序列的结构域对比,对应残基90-211的区域或结构域可在其他氨基酸残基处额外地具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18或1-20个残基差异。在一些实施方案中,在结构域的其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18或约20个残基差异。在一些实施方案中,差异包括保守突变。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中所述氨基酸序列与具有以上特征的对应基于SEQ ID NO:2、4或142的参考序列的残基90-211的氨基酸序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。
在一些实施方案中,改善的酮还原酶包括具有对应基于SEQ ID NO:143、144或145的序列式的残基90-211的区域或结构域的氨基酸序列,其具有至少以下特征:对应X108的残基是碱性、限制或芳族残基,特别是组氨酸;对应X117的残基是非极性或极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;且对应X157的残基是极性或酸性残基,特别是丝氨酸或苏氨酸;且对应X206的残基是极性或非极性残基,特别是谷氨酰胺。在一些实施方案中,与基于SEQ ID NO:2、4或142的参考序列的结构域对比,对应残基90-211的区域或结构域可在其他氨基酸残基处额外地具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18或1-20个残基差异。在一些实施方案中,在结构域的其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18或约20个残基差异。在一些实施方案中,差异包括保守突变。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中所述氨基酸序列与具有以上特征的对应基于SEQ ID NO:2、4或142的参考序列的残基90-211的氨基酸序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。
在一些实施方案中,改善的酮还原酶包括具有对应基于SEQ ID NO:143、144或145的序列式的残基90-211的区域或结构域的氨基酸序列,其具有至少以下特征:对应X94的残基是非极性或极性残基,特别是苏氨酸或缬氨酸;对应X108的残基是碱性、限制或芳族残基,特别是组氨酸;对应X117的残基是非极性或极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;且对应X157的残基是极性或酸性残基,特别是丝氨酸或苏氨酸;且对应X206的残基是极性或非极性残基,特别是谷氨酰胺。在一些实施方案中,与基于SEQ ID NO:2、4或142的参考序列的结构域对比,对应残基90-211的区域或结构域可在其他氨基酸残基处额外地具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18或1-20个残基差异。在一些实施方案中,在结构域的其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18或约20个残基差异。在一些实施方案中,差异包括保守突变。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中所述氨基酸序列与具有以上特征的对应基于SEQ ID NO:2、4或142的参考序列的残基90-211的氨基酸序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。
在一些实施方案中,改善的酮还原酶包括具有对应基于SEQ ID NO:143、144或145的序列式的残基90-211的区域或结构域的氨基酸序列,其具有至少以下特征:对应X96的残基是限制、脂肪族、非极性、酸性或极性残基,特别是天冬酰胺、脯氨酸、丙氨酸或谷氨酸;对应X108的残基是碱性、限制或芳族残基,特别是组氨酸;对应X117的残基是非极性或极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;且对应X157的残基是极性或酸性残基,特别是丝氨酸或苏氨酸;且对应X206的残基是极性或非极性残基,特别是谷氨酰胺。在一些实施方案中,与基于SEQ ID NO:2、4或142的参考序列的结构域对比,对应残基90-211的区域或结构域可在其他氨基酸残基处额外地具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18或1-20个残基差异。在一些实施方案中,在结构域的其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18或约20个残基差异。在一些实施方案中,差异包括保守突变。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中所述氨基酸序列与具有以上特征的对应基于SEQ ID NO:2、4或142的参考序列的残基90-211的氨基酸序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。
在一些实施方案中,改善的酮还原酶包括具有对应基于SEQ ID NO:143、144或145的序列式的残基90-211的区域或结构域的氨基酸序列,其具有至少以下特征:对应X94的残基是非极性或极性残基,特别是苏氨酸或缬氨酸;对应X96的残基是限制、脂肪族、非极性、酸性或极性残基,特别是天冬酰胺、脯氨酸、丙氨酸或谷氨酸;对应X108的残基是碱性、限制或芳族残基,特别是组氨酸;对应X117的残基是非极性或极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;且对应X157的残基是极性或酸性残基,特别是丝氨酸或苏氨酸;且对应X206的残基是极性或非极性残基,特别是谷氨酰胺。在一些实施方案中,与基于SEQID NO:2、4或142的参考序列的结构域对比,对应残基90-211的区域或结构域可在其他氨基酸残基处额外地具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18或1-20个残基差异。在一些实施方案中,在结构域的其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18或约20个残基差异。在一些实施方案中,差异包括保守突变。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中所述氨基酸序列与具有以上特征的对应基于SEQ ID NO:2、4或142的参考序列的残基90-211的氨基酸序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。
在一些实施方案中,改善的酮还原酶包括具有对应基于SEQ ID NO:143、144或145的序列式的残基90-211的区域或结构域的氨基酸序列,其具有至少以下特征:对应X117的残基是非极性或极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;且对应X157的残基是极性或酸性残基,特别是丝氨酸或苏氨酸;对应X173的残基是酸性或非极性残基,特别是甘氨酸;且对应X206的残基是极性或非极性残基,特别是谷氨酰胺。在一些实施方案中,与基于SEQ ID NO:2、4或142的参考序列的结构域对比,对应残基90-211的区域或结构域可在其他氨基酸残基处额外地具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18或1-20个残基差异。在一些实施方案中,在结构域的其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18或约20个残基差异。在一些实施方案中,差异包括保守突变。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中所述氨基酸序列与具有以上特征的对应基于SEQ ID NO:2、4或142的参考序列的残基90-211的氨基酸序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。
在一些实施方案中,改善的酮还原酶包括具有对应基于SEQ ID NO:143、144或145的序列式的残基90-211的区域或结构域的氨基酸序列,其具有至少以下特征:对应X94的残基是非极性或极性残基,特别是苏氨酸或缬氨酸;对应X117的残基是非极性或极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;且对应X157的残基是极性或酸性残基,特别是丝氨酸或苏氨酸;对应X173的残基是酸性或非极性残基,特别是甘氨酸;且对应X206的残基是极性或非极性残基,特别是谷氨酰胺。在一些实施方案中,与基于SEQ ID NO:2、4或142的参考序列的结构域对比,对应残基90-211的区域或结构域可在其他氨基酸残基处额外地具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18或1-20个残基差异。在一些实施方案中,在结构域的其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18或约20个残基差异。在一些实施方案中,差异包括保守突变。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中所述氨基酸序列与具有以上特征的对应基于SEQ ID NO:2、4或142的参考序列的残基90-211的氨基酸序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。
在一些实施方案中,改善的酮还原酶包括具有对应基于SEQ ID NO:143、144或145的序列式的残基90-211的区域或结构域的氨基酸序列,其具有至少以下特征:对应X96的残基是限制、脂肪族、非极性、酸性或极性残基,特别是天冬酰胺、脯氨酸、丙氨酸或谷氨酸;对应X117的残基是非极性或极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;且对应X157的残基是极性或酸性残基,特别是丝氨酸或苏氨酸;对应X173的残基是酸性或非极性残基,特别是甘氨酸;且对应X206的残基是极性或非极性残基,特别是谷氨酰胺。在一些实施方案中,与基于SEQ ID NO:2、4或142的参考序列的结构域对比,对应残基90-211的区域或结构域可在其他氨基酸残基处额外地具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18或1-20个残基差异。在一些实施方案中,在结构域的其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18或约20个残基差异。在一些实施方案中,差异包括保守突变。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中所述氨基酸序列与具有以上特征的对应基于SEQ ID NO:2、4或142的参考序列的残基90-211的氨基酸序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。
在一些实施方案中,改善的酮还原酶包括具有对应基于SEQ ID NO:143、144或145的序列式的残基90-211的区域或结构域的氨基酸序列,其具有至少以下特征:对应X94的残基是非极性或极性残基,特别是苏氨酸或缬氨酸;对应X96的残基是限制、脂肪族、非极性、酸性或极性残基,特别是天冬酰胺、脯氨酸、丙氨酸或谷氨酸;对应X117的残基是非极性或极性残基,特别是丝氨酸;对应X145的残基是极性残基,特别是丝氨酸;且对应X157的残基是极性或酸性残基,特别是丝氨酸或苏氨酸;对应X173的残基是酸性或非极性残基,特别是甘氨酸;且对应X206的残基是极性或非极性残基,特别是谷氨酰胺。在一些实施方案中,与基于SEQID NO:2、4或142的参考序列的结构域对比,对应残基90-211的区域或结构域可在其他氨基酸残基处额外地具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18或1-20个残基差异。在一些实施方案中,在结构域的其他氨基酸残基处的差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18或约20个残基差异。在一些实施方案中,差异包括保守突变。在一些实施方案中,酮还原酶多肽包括具有至少以上特征的氨基酸序列,且其中所述氨基酸序列与具有以上特征的对应基于SEQ ID NO:2、4或142的参考序列的残基90-211的氨基酸序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。
在一些实施方案中,改善的酮还原酶包括具有对应SEQ ID NO:143、144或145的序列式的残基1-89的区域或结构域的氨基酸序列。在一些实施方案中,结构域中的对应X7的残基是极性或限制残基,特别是丝氨酸、组氨酸或天冬酰胺。在一些实施方案中,与SEQ ID NO:2、4或142的参考序列对比,对应残基1-89的区域或结构域可在结构域的其他氨基酸残基处额外地具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18或1-20个残基差异。在一些实施方案中,在结构域中,差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18或约20个残基差异。在一些实施方案中,与参考序列对比,差异包括保守突变。在一些实施方案中,酮还原酶多肽包括与在残基X7处具有以上特征的对应基于SEQ ID NO:2、4或142的参考序列的残基1-89的氨基酸序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性的氨基酸序列。
在一些实施方案中,对应残基1-89的区域或结构域可具有选自以下的特征中的一个或多个:对应X3的残基是极性、酸性或芳族残基,特别是酪氨酸或天冬氨酸;对应X7的残基是非极性、极性或限制残基,特别是丝氨酸、组氨酸或天冬酰胺;对应X11的残基是脂肪族、非极性或极性残基,特别是异亮氨酸或苏氨酸;对应X16的残基是脂肪族或非极性残基,特别是苏氨酸、丙氨酸、缬氨酸或甘氨酸;对应X19的残基是非极性或脂肪族残基,特别是异亮氨酸或缬氨酸;对应X23的残基是非极性或芳族残基,特别是苯丙氨酸;对应X41的残基是脂肪族、非极性或极性残基,特别是丝氨酸、丙氨酸或缬氨酸;对应X45的残基是脂肪族、非极性或极性残基,特别是谷氨酸或甘氨酸;对应X49的残基是碱性残基,特别是赖氨酸或精氨酸;对应X57的残基是脂肪族或非极性残基,特别是异亮氨酸或缬氨酸;对应X60的残基是芳族、脂肪族、非极性或极性残基,特别是苯丙氨酸、缬氨酸或苏氨酸;对应X64的残基是脂肪族或非极性残基,特别是丙氨酸、丝氨酸或苏氨酸;对应X72的残基是碱性残基,特别是赖氨酸或精氨酸;且对应X82的残基是非极性或极性残基,特别是甘氨酸或丝氨酸。在一些实施方案中,与基于SEQ ID NO:2、4或142的参考序列对比,对应残基1-89的区域或结构域可在结构域的其他氨基酸残基处额外地具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-5、1-16、1-18或1-20个残基差异。在一些实施方案中,在结构域中,差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18或约20个残基差异。在一些实施方案中,与参考序列对比,差异包括保守突变。在一些实施方案中,酮还原酶多肽包括与在残基X7处具有以上特征的对应基于SEQ ID NO:2、4或142的参考序列的残基1-89的氨基酸序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性的氨基酸序列。
在一些实施方案中,改善的酮还原酶包括具有对应SEQ ID NO:143、144或145的序列式的残基212-252的区域或结构域的氨基酸序列。在一些实施方案中,结构域中的对应X223的残基是脂肪族残基,特别是缬氨酸。在一些实施方案中,与SEQ ID NO:2、4或142的参考序列对比,对应残基212-252的区域或结构域可在结构域的其他氨基酸残基处额外地具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18或1-20个残基差异。在一些实施方案中,在结构域中,差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18或约20个残基差异。在一些实施方案中,与参考序列对比,差异包括保守突变。在一些实施方案中,酮还原酶多肽包括与在残基X223处具有以上特征的对应基于SEQ ID NO:2、4或142的参考序列的残基212-252的氨基酸序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性的氨基酸序列。
在一些实施方案中,对应残基212-252的区域或结构域可具有选自以下的特征中的一个或多个或至少全部:对应X214的残基是非极性、脂肪族或极性残基,特别是甲硫氨酸、缬氨酸、苏氨酸或丝氨酸;对应X217的残基是芳族、脂肪族或非极性残基,特别是异亮氨酸或苯丙氨酸;对应X223的残基是脂肪族或非极性残基,特别是异亮氨酸或缬氨酸;且对应X226的残基是非极性或脂肪族残基,特别是异亮氨酸或缬氨酸。在一些实施方案中,与基于SEQ ID NO:2、4或142的参考序列的结构域对比,对应残基212-252的区域或结构域可在其他氨基酸残基处额外地具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18或1-20个残基差异。在一些实施方案中,在结构域中其他残基处,差异的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18或约20个残基差异。在一些实施方案中,差异包括保守突变。在一些实施方案中,酮还原酶多肽包括与在残基X223处具有以上特征的对应基于SEQ ID NO:2、4或142的参考序列的残基212-252的氨基酸序列对比,具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性的氨基酸序列。
在一些实施方案中,本公开的酮还原酶多肽可包括与基于SEQ IDNO:2、SEQ ID NO:4或SEQ ID NO:142的参考序列或其区域或结构域,诸如残基90-211具有至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性的氨基酸序列,条件是对应残基145的残基是极性残基。在一些实施方案中,对应残基145的残基可以是极性残基,且多肽能够以至少约70%s.e.将底物还原成产物。在一些实施方案中,对应残基145的残基是丝氨酸,且额外地具有以下取代中的一个或多个以致多肽进一步优于(在立体选择性、酶促活性和/或热稳定性方面)野生型克菲尔酮还原酶或另一工程酮还原酶:3→Y(即对应SEQ ID NO:2、4或142的残基3的残基被取代成酪氨酸);7→S,N;11→T;16→A,V,G;19→V;23→F;41→V;45→G;49→R;57→V;60→T;64→T;72→R;82→S;94→T,R;95→A;96→P,A,E;97→R;106→D;108→H;111→M;117→S;126→V;127→R;147→L,S;152→M;157→T,S,D;163→I;173→G;177→R;192→R,E;194→G,D,N,L;198→G;200→K;206→Q;208→H,R;210→A;211→E;214→V,T;217→F;223→V;226→L;且228→A。
在一些实施方案中,对应残基145的残基是丝氨酸,且额外地具有以下取代中的一个或多个,以致多肽进一步优于野生型克菲尔酮还原酶或另一工程酮还原酶:7→S,N;94→T,V;96→P;108→H;117→S;157→T;194→N;206→Q;和223→V。
在一些实施方案中,对应残基145的残基是丝氨酸,且额外地具有以下取代中的一个或多个,以致多肽进一步优于野生型克菲尔酮还原酶或另一工程酮还原酶:7→S,N;94→T,V;96→P;108→H;117→S;157→T;173→G;194→N;206→Q;且223→V。
在一些实施方案中,本文描述的改善的工程酮还原酶的每一个可包括本文描述的多肽的缺失。因此,对于本公开的酮还原酶多肽的各个和每个实施方案,缺失可以是酮还原酶多肽的1个多个氨基酸、2个或更多个氨基酸、3个或更多个氨基酸、4个或更多个氨基酸、5个或更多个氨基酸、6个或更多个氨基酸、8个或更多个氨基酸、10个或更多个、15个或更多个氨基酸或20个或更多个氨基酸、多达氨基酸的总数量的10%、多达氨基酸的总数量的10%、多达氨基酸的总数量的20%或多达氨基酸的总数量的30%,只要保持酮还原酶活性的功能活性。在一些实施方案中,缺失可包括1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或约1-40个氨基酸。在一些实施方案中,缺失可包括1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10或1-20个氨基酸残基的缺失。在一些实施方案中,缺失的数量可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或约40个氨基酸。在一些实施方案中,缺失可包括1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、18或20个氨基酸残基的缺失。
如本领域技术人员所理解,除非另外说明,否则以上定义的氨基酸残基的分类中的一些不是相互排斥的。因此,具有展示出两种或更多种物理-化学性质的侧链的氨基酸可包含在多个分类中。任何氨基酸或残基的合适分类对本领域技术人员是显然的,特别是按照本文提供的详细公开。
如本文所描述,本公开的酮还原酶多肽可以以融合多肽的形式存在,其中酮还原酶多肽融合于其他多肽,诸如抗体标签(例如myc表位)或纯化序列(例如His标签)。因此,可使用与其他多肽融合的或未融合的酮还原酶多肽。
在一些实施方案中,本文描述的多肽不限于遗传编码的氨基酸。除了遗传编码的氨基酸之外,本文描述的多肽可完全地或部分地包括天然存在的和/或合成的非编码的氨基酸。本文描述的多肽可包括的某些常见的非编码氨基酸包括但不限于:遗传编码的氨基酸的D-立体异构体;2,3-二氨基丙酸(Dpr);α-氨基异丁酸(Aib);ε-氨基己酸(Aha);δ-氨基戊酸(Ava);N-甲基甘氨酸或肌氨酸(MeGly或Sar);鸟氨酸(ORN);瓜氨酸(Cit);叔丁基丙氨酸(Bua);叔丁基甘氨酸(Bug);N-甲基异亮氨酸(MeIle);苯基甘氨酸(Phg);环己基丙氨酸(Cha);正亮氨酸(Nle);萘基丙氨酸(Nal);2-氯苯丙氨酸(Ocf);3-氯苯丙氨酸(Mcf);4-氯苯丙氨酸(Pcf);2-氟苯丙氨酸(Off);3-氟苯丙氨酸(Mff);4-氟苯丙氨酸(Pff);2-溴苯丙氨酸(Obf);3-溴苯丙氨酸(Mbf);4-溴苯丙氨酸(Pbf);2-甲基苯丙氨酸(Omf);3-甲基苯丙氨酸(Mmf);4-甲基苯丙氨酸(Pmf);2-硝基苯丙氨酸(Onf);3-硝基苯丙氨酸(Mnf);4-硝基苯丙氨酸(Pnf);2-氰基苯丙氨酸(Ocf);3-氰基苯丙氨酸(Mcf);4-氰基苯丙氨酸(Pcf);2-三氟甲基苯丙氨酸(Otf);3-三氟甲基苯丙氨酸(Mtf);4-三氟甲基苯丙氨酸(Ptf);4-氨基苯丙氨酸(Paf);4-碘苯丙氨酸(Pif);4-氨基甲基苯丙氨酸(Pamf);2,4-二氯苯丙氨酸(Opef);3,4-二氯苯丙氨酸(Mpcf);2,4-二氟苯丙氨酸(Opff);3,4-二氟苯丙氨酸(Mpff);吡啶-2-基丙氨酸(2pAla);吡啶-3-基丙氨酸(3pAla);吡啶-4-基丙氨酸(4pAla);萘-1-基丙氨酸(1nAla);萘-2-基丙氨酸(2nAla);噻唑丙氨酸(taAla);苯并噻吩基丙氨酸(bAla);噻吩基丙氨酸(tAla);呋喃基丙氨酸(fAla);高苯丙氨酸(hPhe);高酪氨酸(hTyr);高色氨酸(hTrp);五氟苯丙氨酸(5ff);苯乙烯基丙氨酸(sAla);蒽基丙氨酸(aAla);3,3-二苯丙氨酸(Dfa);3-氨基-5-苯基戊酸(Afp);青霉胺(Pen);1,2,3,4-四氢异喹啉-3-羧酸(Tic);β-2-噻吩基丙氨酸(Thi);甲硫氨酸亚砜(Mso);N(w)-硝基精氨酸(nArg);高赖氨酸(hLys);膦酰基甲基苯丙氨酸(pmPhe);磷酸丝氨酸(pSer);磷酸苏氨酸(pThr);高天冬氨酸(hAsp);高谷氨酸(hGlu);1-氨基环戊-(2或3)-烯-4羧酸;哌可酸(PA),氮杂环丁烷-3-羧酸(ACA);1-氨基环戊烷-3-羧酸;烯丙基甘氨酸(aOly);炔丙基甘氨酸(pgGly);高丙氨酸(hAla);正缬氨酸(nVal);高亮氨酸(hLeu),高缬氨酸(hVal);高异亮氨酸(hIle);高精氨酸(hArg);N-乙酰基赖氨酸(AcLys);2,4-二氨基丁酸(Dbu);2,3-二氨基丁酸(Dab);N-甲基缬氨酸(MeVal);高半胱氨酸(hCys);高丝氨酸(hSer);羟基脯氨酸(Hyp)和高脯氨酸(hPro)。本文描述的多肽包括其他的非编码氨基酸对本领域技术人员将是显然的(参见例如Fasman,1989,CRC Practical Handbook of Biochemistry andMolecular Biology(CRC生物化学和分子生物学实践手册),CRC Press,Boca Raton,FL,第3-70页以及其中引用的参考文献中提供的各种氨基酸,所有所述参考文献通过引用并入)。这些氨基酸可以以L-构型或D-构型存在。
本领域技术人员将了解,含有保护基侧链的氨基酸或残基也可包括本文描述的多肽。在属于芳族分类的情况中,这种被保护的氨基酸的非限制性实例包括(保护基列于括号中)但不限于:Arg(tos)、Cys(甲基苄基)、Cys(硝基吡啶次磺酸基)、Glu(δ-苄基酯)、Gln(氧杂蒽基)、Asn(N-δ-氧杂蒽基)、His(bom)、His(苄基)、His(tos)、Lys(fmoc)、Lys(tos)、Ser(邻苄基)、Thr(邻苄基)和Tyr(邻苄基)。
本文描述的多肽可包括的,构象限制的非编码氨基酸包括但不限于N-甲基氨基酸(L-构型);1-氨基环戊-(2或3)-烯-4-羧酸;哌可酸;氮杂环丁烷-3-羧酸;高脯氨酸(hPro)和1-氨基环戊烷-3-羧酸。
7.3编码工程酮还原酶的多核苷酸
在另一个方面中,本公开提供编码工程酮还原酶的多核苷酸。多核苷酸可以可操作地连接到控制基因表达的一个或多个异源调节序列以产生能够表达该多肽的重组多核苷酸。含有编码工程酮还原酶的异源多核苷酸的表达构建体可导入合适的宿主细胞以表达对应酮还原酶多肽。
由于对对应于不同氨基酸的密码子的了解,蛋白质序列的可用性提供对能够编码目标的所有多核苷酸的描述。遗传密码的简并性(其中相同氨基酸由可选的或同义密码子编码)允许制备极大量的核酸,它们所有均编码本文公开的改善的酮还原酶。因此,已经鉴别了特定的氨基酸序列后,本领域技术人员能够通过以不改变蛋白质的氨基酸序列的方式简单地修饰序列的一个或多个密码子,来制备任何数量的不同核酸。在这方面,本公开特别涵盖了多核苷酸的各种和每个可能的变化,这可通过根据可能的密码子选择挑选组合来制备,并且所有这些变化被认为是为本文公开的任何多肽所特别公开的,包括表2中提供的氨基酸序列。
在不同的实施方案中,优选地挑选密码子以适合其中产生该蛋白质的宿主细胞。例如,用于细菌的优选密码子用于表达细菌中的基因;用于酵母中的优选密码子用于在酵母中表达;且用于哺乳动物的优选密码子用于在哺乳动物细胞中表达。例如,SEQ ID NO:3的多核苷酸为在大肠杆菌(E.coli)中表达而进行了密码子优化,但是另外编码天然存在的克菲尔乳杆菌的酮还原酶。
在一些实施方案中,多核苷酸包括编码酮还原酶多肽的核苷酸序列,所述酮还原酶多肽具有与本文描述的参考工程酮还原酶多肽中的任何一个具有至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更大的序列同一性的氨基酸序列,其中所述编码酮还原酶多肽包括在对应SEQ ID NO:2、4或142的残基145位的残基处具有极性残基,特别是丝氨酸的氨基酸序列。在一些实施方案中,多核苷酸编码包括选自SEQ ID NO:6、8、10、12、14、16、18、20、22、24、26、30、32、38、40、42、44、46、48、50、52、54、56、58、60、64、66、68、70、74、76、78、80、86、88、90、92、104、106、110、112、124、126、130或134的氨基酸序列的工程酮还原酶多肽。
在一些实施方案中,编码工程酮还原酶的多核苷酸选自SEQ ID NO:5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131和133。
在一些实施方案中,多核苷酸能够在高度严格条件下杂交于包括对应以下的序列的多核苷酸之一:SEQ ID NO:5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131和133,其中在高度严格条件下杂交的多核苷酸编码能够将结构式(I)的底物转化成结构式(II)的产物的功能酮还原酶。
在一些实施方案中,多核苷酸包括编码本文描述的多肽的核酸序列,但与编码工程酮还原酶的参考多核苷酸在核苷酸水平上具有约80%或更大的序列同一性,约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更大的序列同一性,其中多核苷酸编码能够将结构式(I)的底物转化成结构式(II)的产物的功能酮还原酶。在一些实施方案中,参考多核苷酸选自对应SEQ ID NO:5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131和133的序列。
编码改善的酮还原酶多肽的分离的多核苷酸可以多种方式处理以提供多肽的表达。根据表达载体,在将分离的多核苷酸插入载体前,对其处理可能是需要的或必需的。利用重组DNA方法修饰多核苷酸和核酸序列的技术在本领域中是公知的。指导提供于Sambrook等人,2001,MolecularCloning:A Laboratory Manual(分子克隆:实验室手册),第3版,Cold SpringHarbor Laboratory Press;和Current Protocols in Molecular Biology(最新分子生物学实验方法汇编),Ausubel.F编,Greene Pub.Associates,1998,更新至2006。
对于细菌宿主细胞,用于指导本公开的核酸构建体的转录的合适启动子包括从以下获得的启动子:大肠杆菌lac操纵子、天蓝色链霉菌(Streptomyces coelicolor)琼脂糖酶基因(dagA)、枯草芽孢杆菌(Bacillussubtilis)果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌(Bacillus licheniformis)α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因及原核β-内酰胺酶基因(Villa-Kamaroff等人,1978,Proc.NatlAcad.Sci.USA 75:3727-3731),以及tac启动子(DeBoer等人,1983,Proc.NatlAcad.Sci.USA 80:21-25)。此外,启动子描述于“Usefulproteins from recombinant bacteria(来自重组细菌的有用蛋白质)”,ScientiffcAmerican,1980,242:74-94;以及Sambrook等人,见上。
对于丝状真菌宿主细胞,用于指导本公开的核酸构建体的转录的合适启动子包括从以下的基因获得的启动子:米曲霉(Aspergillus oryzae)TAKA淀粉酶、米黑根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、黑曲霉(Aspergillus niger)中性α-淀粉酶、黑曲霉酸稳定型α-淀粉酶、黑曲霉或泡盛曲霉(Aspergillus awamori)葡糖淀粉酶(glaA)、米黑根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、构巢曲霉(Aspergillusnidulans)乙酰胺酶和尖孢镰刀菌(Fusarium oxysporum)胰蛋白酶样蛋白酶(WO 96/00787),以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶和米曲霉磷酸丙糖异构酶基因的启动子的杂合体)及其突变体、截短和杂合启动子。
在酵母宿主中,有用的启动子可来自酿酒酵母(Saccharomycescerevisiae)烯醇化酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)和酿酒酵母3-磷酸甘油酸激酶的基因。用于酵母宿主细胞的其他有用启动子描述于Romanos等人,1992,Yeast 8:423-488。
控制序列还可以是合适的转录终止子序列——一种由宿主细胞识别以终止转录的序列。终止子序列可操作地连接于编码多肽的核酸序列的3′末端。在选择的宿主细胞中起作用的任何终止子可用于本发明。
例如,用于丝状真菌宿主细胞的示例性转录终止子可从米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合成酶、黑曲霉α-葡糖苷酶和尖孢镰刀菌胰蛋白酶样蛋白酶的基因获得。
用于酵母宿主细胞的示例性终止子可从酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶的基因获得。用于酵母宿主细胞的其他有用终止子描述于Romanos等人,1992,同上。
控制序列还可以是合适的前导区序列——一种对宿主细胞的翻译重要的mRNA的非翻译区。该前导区序列可操作地连接于编码多肽的核酸序列的5′末端。可使用在选择的宿主细胞中起作用的任何前导区序列。用于丝状真菌宿主细胞的示例性前导区是从米曲霉TAKA淀粉酶和构巢曲霉磷酸丙糖异构酶的基因获得。用于酵母宿主细胞的合适前导区是从酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α-因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)的基因获得。
控制序列还可以是聚腺苷酸化序列——一种可操作地连接于核酸序列的3′末端并且当转录时被宿主细胞识别为向转录的mRNA添加聚腺苷残基的信号的序列。在选择的宿主细胞中起作用的任何聚腺苷酸化序列可用于本发明。用于丝状真菌宿主细胞的示例性聚腺苷酸化序列可来自米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合成酶、尖孢镰刀菌胰蛋白酶样蛋白酶和黑曲霉α-葡糖苷酶的基因。对酵母宿主细胞有用的聚腺苷酸化序列描述于Guo和Sherman,1995,Mol Cell Bio15:5983-5990。
控制序列还可以是信号肽编码区,其编码连接于多肽的氨基末端的氨基酸序列,并且指导编码多肽进入细胞分泌途径。核酸序列的编码序列的5′末端本身可含有按翻译阅读框天然连接于编码分泌的多肽的编码区的区段的信号肽编码区。可选地,编码序列的5′末端可含有外源于编码序列的信号肽编码区。如果编码序列不是天然含有信号肽编码区,则可能需要外源信号肽编码区。
可选地,外源信号肽编码区可简单地代替天然信号肽编码区,从而增强多肽的分泌。然而,指导表达的多肽进入选择的宿主细胞的分泌途径的任何信号肽编码区可用于本发明。
用于细菌宿主细胞的有效的信号肽编码区是从以下的基因获得的信号肽编码区:芽孢杆菌(Bacillus)NClB 11837麦芽糖淀粉酶、嗜热脂肪芽孢杆菌α-淀粉酶、地衣芽孢杆菌枯草蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)和枯草芽孢杆菌prsA。另外的信号肽描述于Simonen和Palva,1993,MicrobiolRev 57:109-137。
用于丝状真菌宿主细胞的有效的信号肽编码区可以是从以下的基因获得的信号肽编码区:米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米黑根毛霉天冬氨酸蛋白酶、特异腐质霉(Humicola insolens)纤维素酶和柔毛腐质霉(Humicola lanuginosa)脂肪酶。
对酵母宿主细胞有用的信号肽可来自酿酒酵母α-因子和酿酒酵母转化酶的基因。其他有用的信号肽编码区描述于Romanos等人,1992,同上。
控制序列还可以是前肽编码区,它编码位于多肽的氨基末端的氨基酸序列。产生的多肽称为酶原(proenzyme)或多肽原(或在一些情况下称为酶原(zymogen))。多肽原通常无活性,并且可通过从多肽原催化或自身催化切割前肽而转化为成熟的活性多肽。前肽编码区可从以下的基因获得:枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、酿酒酵母α-因子、米黑根毛霉天冬氨酸蛋白酶和嗜热毁丝霉(Myceliophthora thermophila)乳糖酶(WO 95/33836)。
如果信号肽和前肽区都存在于多肽的氨基末端,则前肽区位于多肽氨基末端的相邻位置,且信号肽区位于前肽区的氨基末端的相邻位置。
还可期望添加调节序列,其允许相对宿主细胞生长调节多肽的表达。调节系统的实例是引起响应化学或物理刺激(包括调节化合物的存在)而打开或关闭基因的表达的调节系统。在原核宿主细胞中,合适的调节序列包括lac、tac和trp操纵基因系统。在酵母宿主细胞中,合适的调节系统包括,例如ADH2系统或GAL1系统。在丝状真菌中,合适的调节序列包括TAKA α-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子。
调节序列的其他实例是允许基因扩增的序列。在真核系统中,这些包括在氨甲蝶呤存在时扩增的二氢叶酸还原酶基因和用重金属扩增的金属硫蛋白基因。在这些情况下,编码本发明的KRED多肽的核酸序列将与调节序列可操作地连接。
因此,在一些实施方案中,本公开还涉及重组表达载体,根据它们所导入的宿主的类型,其包括编码工程酮还原酶多肽或其变体的多核苷酸,和一个或多个表达调节区(诸如启动子和终止子)、复制起点等等。以上描述的各种核酸和控制序列可连接到一起以产生重组表达载体,其可包括一个或多个方便的限制位点以使得编码多肽的核酸序列在该位点插入或取代。可选地,可通过将核酸序列或包含该序列的核酸构建体插入到用于表达的合适载体来表达本公开的核酸序列。在产生表达载体中,编码序列位于载体中,以使编码序列可操作地连接于用于表达的合适控制序列。
重组表达载体可以是可方便地经受重组DNA操作并可使多核苷酸序列表达的任何载体(例如质粒或病毒)。载体的选择将通常依赖于载体与该载体所导入的宿主细胞的相容性。载体可以是直线的或封闭环状质粒。
在一些实施方案中,表达载体可以是自主复制载体,即作为染色体外实体存在的载体,其复制独立于染色体复制,该载体例如质粒、染色体外元件、微型染色体或人工染色体。该载体可包括确保自身复制的任何部件(means)。可选地,该载体可以是当导入宿主细胞时整合于基因组并与其所整合的染色体一起复制的载体。此外,可使用单个载体或质粒,或一起含有被导入到宿主细胞的基因组的总DNA的两个或更多个载体或质粒,或转座子。
本公开的表达载体可含有一个或多个选择标志物,其允许易于选择转化细胞。选择标志物是一种基因,其产物提供杀生物剂或病毒抗性、对重金属的抗性、营养缺陷型的原养型,以及类似性质。细菌选择标志物的实例是来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或赋予抗生素抗性,诸如氨比西林、卡那霉素、氯霉素(实施例1)或四环素抗性的标志物。适合于酵母宿主细胞的标志物是ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。
在丝状真菌宿主细胞中使用的选择标志物包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰转移酶)、bar(膦丝菌素乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷-5′-磷酸脱羧酶)、sC(硫酸腺苷酰转移酶)和trpC(邻氨基苯甲酸合成酶),以及其等同物。在曲霉菌细胞中使用的实施方案包括构巢曲霉或米曲霉的amdS和pyrG基因,以及吸水链霉菌(Streptomyces hygroscopicus)的bar基因。
本发明的表达载体优选地包含允许该载体整合到宿主细胞的基因组或允许载体在细胞中独立于基因组自主复制的元件。对于整合到宿主细胞基因组,该载体可依靠编码多肽的核酸序列或载体的任何其他元件,从而通过同源或非同源重组将载体整合到基因组。
可选地,表达载体可包含用于指导通过同源重组整合到宿主细胞的基因组的另外的核酸序列。该另外的核酸序列能够使载体在染色体的精确位置整合到宿主细胞基因组。为了增加在精确位置整合的可能性,该整合元件应该优选地包含足够数量的与对应靶序列高度同源的核酸,诸如100至10,000个碱基对、优选400至10,000个碱基对和最优选800至10,000个碱基对以增加同源重组的可能性。整合元件可以是与宿主细胞的基因组中的靶序列同源的任何序列。此外,整合元件可以是非编码或编码的核酸序列。另一方面,载体可通过非同源重组整合到宿主细胞的基因组。
对于自主复制,载体可进一步包括能够使载体在相关的宿主细胞中自主复制的复制起点。细菌复制起点的实例是P15A ori,或允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177(该质粒具有P15A ori)或pACYC184的复制起点,和允许在芽孢杆菌中复制的pUB110、pE194、pTA1060或pAMβ1的复制起点。在酵母宿主细胞中使用的复制起点的实例是2微米的复制起点ARS1、ARS4,ARS1和CEN3的组合以及ARS4和CEN6的组合。复制起点可以是具有使之在宿主细胞中的功能温度敏感的突变的复制起点(参见例如Ehrlich,1978,Proc Natl Acad Sci.USA75:1433)。
可将本发明的核酸序列的多于一个拷贝插入到宿主细胞以增加基因产物的生产。可通过将序列的至少一个另外的拷贝整合到宿主细胞基因组中,或通过随核酸序列包含可扩增的选择标志物基因(如果细胞包含选择标志物基因的扩增拷贝,则核酸序列的另外拷贝可通过在存在合适的选择剂下培养细胞来筛选)来获得核酸序列的拷贝数量的增加。
用于本发明中的表达载体中的许多是商业上可获得的。合适的商业表达载体包括来自Sigma-Aldrich Chemicals,St.Louis MO.的p3xFLAGTMTM表达载体,它包括用于在哺乳动物宿主细胞中表达的CMV启动子和hGH聚腺苷酸化位点,以及用于在大肠杆菌中扩增的pBR322复制起点和氨比西林抗性标记基因。其他合适的表达载体是可从Stratagene,LaJolla CA商业获得的pBluescriptII SK(-)和pBK-CMV,以及从pBR322(Gibco BRL)、pUC(Gibco BRL)、pREP4、pCEP4(Invitrogen)或pPoly衍生的质粒(Lathe等人,1987,Gene 57:193-201)。
7.4用于表达酮还原酶多肽的宿主细胞
在另一个方面中,本公开提供包含编码本公开的改善的酮还原酶多肽的多核苷酸的宿主细胞,该多核苷酸可操作地连接于在宿主细胞中用于表达酮还原酶的一个或多个控制序列。用于表达由本发明的表达载体编码的KRED多肽的宿主细胞在本领域中是公知的,并且包括但不限于细菌细胞,诸如大肠杆菌、克菲尔乳杆菌、短乳杆菌、链霉菌(Streptomyces)和鼠伤寒沙门氏菌(Salmonella typhimurium)细胞;真菌细胞,诸如酵母细胞(例如酿酒酵母或毕赤酵母(Pichia pastoris)(ATCC登录号201178));昆虫细胞,诸如果蝇S2和灰翅夜蛾Sf9(Spodoptera Sf9)细胞;动物细胞,诸如CHO、COS、BHK、293和Bowes黑色素瘤细胞;以及植物细胞。以上描述的宿主细胞的合适的培养基和生长条件在本领域中是公知的。
通过本领域中所知的各种方法可将用于表达酮还原酶的多核苷酸导入细胞。技术尤其包括电穿孔、基因枪粒子轰击、脂质体介导的转染、氯化钙转染和原生质体融合。用于将多核苷酸导入细胞的各种方法对本领域技术人员将是明显的。
示例性宿主细胞是大肠杆菌(Escherichia coli)W3110。通过将编码改善的酮还原酶的多核苷酸可操作地连接到质粒pCK110900,进而可操作地连接于由lacI阻抑蛋白控制的lac启动子来产生表达载体。表达载体还包含P15a复制起点和氯霉素抗性基因。大肠杆菌W3110中含有所试多核苷酸的细胞通过使细胞经受氯霉素选择来分离。
7.5产生工程酮还原酶多肽的方法
在一些实施方案中,为了制备本公开的改善的KRED多核苷酸和多肽,从克菲尔乳杆菌或短乳杆菌获得(或衍生)催化还原反应的天然存在的酮还原酶。在一些实施方案中,对母体多核苷酸序列进行了密码子优化以增强特定宿主细胞中酮还原酶的表达。作为示例,从根据Genbank数据库中可获得的克菲尔乳杆菌KRED序列的已知多肽序列(Genbank登录号AAP94029GI:33112056)制备的寡核苷酸构建编码野生型克菲尔乳杆菌的KRED多肽的母体多核苷酸序列。将母体多核苷酸序列密码子优化以在大肠杆菌中表达,并且将密码子优化的多核苷酸克隆于表达载体,将酮还原酶基因的表达置于lac启动子和lacI阻抑蛋白基因的控制之下。鉴别在大肠杆菌中表达活性酮还原酶的克隆,并且测序基因以确定它们的同一性。指定的序列(SEQ ID NO:1)是用作从克菲尔乳杆菌酮还原酶进化的工程酮还原酶的大部分实验和文库构建的起始点的母体序列。
如前所述,通过使编码天然存在的酮还原酶的多核苷酸经受诱变和/或定向进化方法可获得工程酮还原酶。示例性定向进化技术是诱变和/或DNA混编,如在以下中所述:Stemmer,1994,Proc Natl Acad Sci USA91:10747-10751;WO 95/22625;WO 97/0078;WO 97/35966;WO 98/27230;WO 00/42651;WO 01/75767和美国专利6,537,746。除了别的以外,可用的其他定向进化操作包括交错延伸过程(StEP)、体外重组(Zhao等人,1998,Nat.Biotechnol.16:258-261)、诱变PCR(Caldwell等人,1994,PCRMethodsAppl.3:S136-S140)和盒式诱变(Black等人,1996,Proc NatlAcadSci USA 93:3525-3529)。
从诱变处理后获得的克隆中筛选具有所需改善的酶性质的工程酮还原酶。由于NADH或NADPH转化为NAD+或NADP+,因此使用监测NADH或NADPH浓度的减少速率(经由吸光度或荧光的减少)的标准生物化学技术可对来自表达文库的酶活性进行测量。(例如参见实施例7)在这一反应中,当酮还原酶将酮底物还原为对应的羟基时,酮还原酶消耗(氧化)了NADH或NADPH。如通过吸光度或荧光的减少所测,每单位时间NADH或NADPH浓度的减少速率表明在固定量的溶解产物(或由此制备的冻干粉末)中KRED多肽的相对(酶促)活性。如果所需的改善的酶性质是热稳定性,则可在酶制品经受确定的温度并测量热处理后剩余的酶活性的量之后来测量酶活性。然后分离含有编码酮还原酶的多核苷酸的克隆,并对其测序以鉴别核苷酸序列的变化(如果有),并将其用于在宿主细胞中表达酶。
根据已知的合成方法,如果知道工程多肽的序列,则编码酶的多核苷酸可通过标准固相方法制备。在一些实施方案中,多达约100个碱基的片段可被单独地合成,然后连接(例如通过酶促或化学连接方法,或聚合酶介导的方法)以形成任何所需的连续序列。例如,本发明的多核苷酸和寡核苷酸可通过化学合成来制备,其使用例如Beaucage等人,1981,TetLett22:1859-69中描述的经典亚磷酰胺方法,或Matthes等人,1984,EMBO J.3:801-05中描述的方法,例如,如其通常在自动化合成方法中所实践的。根据亚磷酰胺方法,寡核苷酸被合成(例如在自动DNA合成仪中)、纯化、退火、连接并克隆于合适的载体中。此外,基本上任何核酸可从各种商业来源中任何一个来获得,所述商业来源诸如The Midland Certified ReagentCompany,Midland,TX、The Great American Gene Company,Ramona,CA、ExpressGen Inc.Chicago,IL、Operon Technologies Inc.,Alameda,CA以及许多其他的公司。
在宿主细胞中表达的工程酮还原酶可从细胞和/或培养基回收,其使用了蛋白质纯化公知技术中的任何一种或多种,尤其包括溶菌酶处理、超声、过滤、盐析、超速离心和色谱。用于从细菌(诸如大肠杆菌)中溶解和高效提取蛋白质的合适溶液是以St.Louis MO的Sigma-Aldrich的商标名CelLytic BTM市售的。
用于分离酮还原酶多肽的色谱技术尤其包括反相色谱高效液相色谱、离子交换色谱、凝胶电泳和亲和色谱。用于纯化特定酶的条件将部分依赖于诸如净电荷、疏水性、亲水性、分子量、分子形状等因素,并将对本领域技术人员是明显的。
在一些实施方案中,亲和技术可用于分离改善的酮还原酶。对于亲和色谱纯化,可使用特异性结合酮还原酶多肽的任何抗体。为了产生抗体,各种宿主动物,包括但不限于兔、小鼠、大鼠等等,可通过用多肽注射来免疫。该多肽可通过侧链官能团或连接到侧链官能团的连接体连接于合适的载体,诸如BSA。根据宿主物种,可使用各种佐剂以增加免疫应答,佐剂包括但不限于弗氏佐剂(完全和不完全)、矿物凝胶(诸如氢氧化铝)、表面活性物质(诸如溶血卵磷脂)、普卢兰尼克多元醇类(pluronic polyo1)、聚阴离子、肽、油乳剂、匙孔血蓝蛋白、二硝基苯酚和可能有用的人类佐剂,诸如BCG(卡介苗)和短小棒状杆菌(Corynebacterium parvum)。
7.6使用工程酮还原酶和由其制备的化合物的方法
本文描述的酮还原酶能够催化结构式(I)的化合物3-酮基四氢噻吩中的酮基
至对应结构式(II)的手性醇产物(R)-3-羟基四氢噻吩的还原反应
在一些实施方案中,本公开提供将结构式(I)的化合物的底物还原成结构式(II)的产物的方法,其中所述方法包括用本公开的酮还原酶多肽在适合于将底物还原成醇产物的反应条件下接触或孵育底物。
例如,在本方法的一些实施方案中,分别与SEQ ID NO:4、2和142的野生型克菲尔乳杆菌或短乳杆菌或稍小乳杆菌KRED序列对比,酮还原酶多肽包括在对应X145的残基处具有极性残基,特别是丝氨酸的氨基酸序列。如本文所指,与SEQ ID NO:2,4或106的参考序列对比,酮还原酶多肽还可在其他氨基酸残基处具有一个或多个突变。这些差异描述于SEQID NO:143、144和145的序列式和本文的描述中。
在这一方法的一些实施方案中,酮还原酶多肽包括,例如且不限于,与在对应X145的残基处具有极性残基特别是丝氨酸的基于SEQ ID NO:2、4或142的参考序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性的氨基酸序列,其中酮还原酶多肽在对应X145的残基处也具有极性残基,特别是丝氨酸。
在本方法的一些实施方案中,产物以大于约65%的立体异构体过量被还原,其中酮还原酶多肽包括对应SEQ ID NO:6、8、10、12、14、16、18、20、22、24、26、30、32、38、40、42、44、46、48、50、52、54、56、58、60、64、66、68、70、74、76、78、80、86、88、90、92、104、106、110、112、124、126、130或134的序列。
在本方法的一些实施方案中,产物以大于约90%的立体异构体过量还原成产物,其中酮还原酶多肽包括对应SEQ ID NO:6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、86、88、90、92、94、96、100、102、104、106、108、110、112、126、128、130或134的氨基酸序列。
在本方法的一些实施方案中,产物以大于约98%s.e还原成产物,其中酮还原酶多肽包括对应SEQ ID NO:6、8、10、18、20、22、24、26、28、30、34、36、38、40、42、50、52、54、58、62、66、70、72、76、78、80和134的氨基酸序列。
在用于将底物还原成产物的方法的一些实施方案中,底物以与野生型酶(SEQ ID NO:4)对比的提高的速率还原成产物,其中所述酮还原酶多肽包括对应SEQ ID NO:6、8、10、12、14、16、18、20、22、24、26、30、32、38、40、42、44、46、48、50、52、54、56、58、60、64、66、68、70、74、76、78、80、86、88、90、92、104、106、110、112、124、126、130或134的氨基酸序列。
在一些实施方案中,反应条件是pH 7.5或更低。在一些实施方案中,反应条件是从约5.0至约7.5的pH。在一些实施方案中,反应条件是从约pH 6.0至约7.5的pH。在一些实施方案中,反应条件温度是约25℃或更低。在一些实施方案中,反应条件是5℃至约25℃,或5℃至15℃的温度。在一些实施方案中,反应条件还包括辅因子再生系统,如下文进一步描述。
在一些实施方案中,用于将底物还原成产物的方法可包括用本公开的酮还原酶在包括至少100g/L底物和至少0.8-1.0g/L酮还原酶多肽的反应条件中接触底物,其中至少90%的底物在小于24小时(例如20-24小时)内转化成产物。在一些实施方案中,大于95%、96%、97%、98%或99%或更多的底物在反应条件下转化成产物。用于该方法的示例性多肽包括但不限于包括对应SEQ ID NO:6、8、10、12、14、18、20、22、24、26、30、32、38、40、42、44、46、48、50、52、54、56、58、60、64、66、68、70、74、76、78、80、82、86、88、90、92、104、106、110、112、126、130和134的氨基酸序列的多肽。
在一些实施方案中,用于将底物还原成产物的方法可包括用本公开的酮还原酶在包括至少100g/L底物和至少0.8-1.0g/L酮还原酶多肽的反应条件中接触底物,其中至少90%的底物在12-20小时内转化成产物。在一些实施方案中,大于95%、96%、97%、98%或99%或更多的底物在反应条件下转化成产物。用于该方法的示例性多肽包括但不限于SEQ ID NO:26、44、68和104。
在一些实施方案中,本文提供的酮还原酶多肽中的任何一种可用于产生(R)-3-羟基四氢噻吩,其为用于生产多种药物,诸如抗生素和蛋白酶抑制剂的中间体。在一些实施方案中,酮还原酶多肽可用于生产具有以下结构式(III)的抗生素硫培南(CP-70,429),及其盐,及其溶剂化物和水合物:
因此,在一些实施方案中,在用于合成结构式(III)的抗生素(即CP-70,429)的方法中,方法中的步骤可包括将式(I)的底物与本文描述的酮还原酶中的任何一种接触,由此将底物转化或还原成结构式(II)的产物。
结构式(II)的产物可通过J.Org.Chem.,1992,57:4352中描述的合成途径转化成具有结构式(III)的硫培南,及其中间体,所述文献通过引用在此并入。其中描述的途径描述于下文,其中Ts是对甲苯磺酰基,Ac是乙酰基,且TBS是叔丁基二甲基硅烷基。
在一些实施方案中,方法提供了结构式(IV)、(V)、(VI)、(VII)、(VIII)、(IX)、(X)和(XI)的中间体的每一个的合成,其中合成中间体的方法中的步骤可包括在适合将底物转化或还原成结构式(II)的产物的条件下用本文描述的酮还原酶中的任何一种接触式(I)的底物。
这种方法中的其他一个或多个步骤可依据J.Org.Chem.,1992,57:4352中描述一个或多个步骤的操作或其改良,所述文献通过引用并入。为了将结构式(II)的产物转化成结构式(IV)的中间体,在J.Org.Chem.,1992,57:4352描述的操作中使用的二甲基氨基吡啶试剂可用吡啶或1-甲基咪唑代替。为了将结构式(IV)的中间体转化成结构式(V)的中间体,在J.Org.Chem.,1992,57:4352描述的操作中在0℃下进行的反应可在更低的温度,例如-25℃下进行,以进一步使对应的砜副产物的形成最小化。
在一些实施方案中,(R)-3-羟基四氢噻吩中间体可用于合成HIV-蛋白酶抑制剂(J.Med.Chem.,1994,37:1177)或其他化合物或药物,它们的合成依赖于中间体(R)-3-羟基四氢噻吩(式(II)),其中用于合成药物化合物的方法中的步骤包括使用本文提供的酮还原酶多肽中的任何一种将式(I)的化合物还原或转化成式(II)的化合物。
如本领域技术人员所知,酮还原酶催化的还原反应通常需要辅因子。由本文描述的工程酮还原酶催化的还原反应通常也需要辅因子,尽管工程酮还原酶的许多实施方案需要的辅因子远少于用野生型酮还原酶催化的反应。如本文所用,术语“辅因子”指与酮还原酶组合起作用的非蛋白质化合物。适合与本文描述的工程酮还原酶一起使用的辅因子包括但不限于NADP+(烟酰胺腺嘌呤二核苷酸磷酸)、NADPH(NADP+的还原形式)、NAD+(烟酰胺腺嘌呤二核苷酸)和NADH(NAD+的还原形式)。一般来说,将还原形式的辅因子添加到反应混合物。还原型NAD(P)H形式可使用辅因子再生系统从氧化型NAD(P)+形式任选地再生。
术语“辅因子再生系统”指参与还原氧化形式的辅因子的反应(例如NADP+到NADPH)的一组反应物。由酮还原酶催化的酮底物的还原所氧化的辅因子通过辅因子再生系统再生为还原形式。辅因子再生系统包括化学计量的还原剂,它是还原氢等同物的来源,并且能够还原氧化形式的辅因子。辅因子再生系统可进一步包括催化剂,例如酶催化剂,它催化还原剂还原氧化形式的辅因子。从NAD+或NADP+分别再生NADH或NADPH的辅因子再生系统为本领域所知,并且可用于本文描述的方法中。
可使用的合适的示例性辅因子再生系统包括但不限于葡萄糖和葡糖脱氢酶、甲酸盐和甲酸脱氢酶、葡糖6-磷酸和葡糖-6-磷酸脱氢酶、仲醇(例如异丙醇)和仲醇脱氢酶、亚磷酸酯和亚磷酸脱氢酶、分子氢和氢化酶,以及类似系统。这些系统可与作为辅因子的NADP+/NADPH或NAD+/NADH组合使用。使用氢化酶的电化学再生也可用作辅因子再生系统。参见,例如美国专利第5,538,867和6,495,023号,它们两者通过引用在此并入。包含金属催化剂和还原剂(例如,分子氢或甲酸盐)的化学辅因子再生系统也是合适的。参见例如PCT公布WO 2000/053731,其通过引用在此并入。
本文中,术语“葡糖脱氢酶”和“GDH”可互换使用以指NAD+或NADP+依赖性酶,它们分别催化D-葡萄糖和NAD+或NADP+转化为葡糖酸和NADH或NADPH。以下反应式(1)描述葡糖脱氢酶催化的葡萄糖对NAD+或NADP+的还原。
适合用于本文描述的方法的实践的葡糖脱氢酶包括天然存在的葡糖脱氢酶以及非天然存在的葡糖脱氢酶。天然存在的葡糖脱氢酶编码基因已经在文献中报道。例如枯草芽孢杆菌61297GDH基因在大肠杆菌中被表达,并且已经报道它表现出与其固有宿主中产生的酶相同的物理化学性质(Vasantha等人,1983,Proc.Natl.Acad.Sci.USA 80:785)。对应于Genbank登录号M12276的枯草芽孢杆菌GDH基因的基因序列由Lampel等人,1986,J.Bacteriol.166:238-243报道,并且由Yamane等人,1996,Microbiology 142:3047-3056报道其修正形式为Genbank登录号D50453。天然存在的GDH基因还包括编码来自蜡状芽孢杆菌(B.cereus)ATCC14579(Nature,2003,423:87-91;Genbank登录号AE017013)和巨大芽孢杆菌(B.megaterium)(Eur.J.Biochem.,1988,174:485-490,Genbank登录号X12370;J.Ferment.Bioeng.,1990,70:363-369,Genbank登录号GI216270)的GDH的基因。来自芽孢杆菌(Bacillus sp.)的葡糖脱氢酶在PCT公布WO 2005/018579中提供为SEQ ID NO:10和12(分别由对应于PCT公布的SEQ ID NO:9和11的多核苷酸序列编码),其公开通过引用在此并入。
非天然存在的葡糖脱氢酶可使用已知的方法诸如,例如,诱变、定向进化以及类似方法制备。具有合适活性的GDH酶,不论是天然存在的还是非天然存在的,可使用PCT公布WO 2005/018579的实施例4中描述的测定来容易地鉴别,所述专利的公开通过引用在此并入。示例性非天然存在的葡糖脱氢酶在PCT公布WO 2005/018579中提供为SEQ ID NO:62、64、66、68、122、124和126。编码它们的多核苷酸序列在PCT公布WO2005/018579中分别提供为SEQ ID NO:61、63、65、67、121、123和125。所有这些序列通过引用在此并入。适合于在本文公开的酮还原酶催化的还原反应中使用的另外的非天然存在的葡糖脱氢酶在美国申请公布第2005/0095619和2005/0153417号中提供,其公开通过引用在此并入。
在本文描述的酮还原酶催化的还原反应中使用的葡糖脱氢酶在PCT公布WO 2005/018579的实施例4中描述的测定中可表现出至少约10μmol/min/mg,并且有时为至少约102μmol/min/mg或约103μmol/min/mg、多达约104μmol/min/mg或更高的活性。
本文描述的酮还原酶催化的还原反应一般在溶剂中进行。合适的溶剂包括水、有机溶剂(例如乙酸乙酯、乙酸丁酯、1-辛醇、庚烷、辛烷、甲基叔丁基醚(MTBE)、甲苯以及类似溶剂)、离子液体(例如1-乙基4-甲基咪唑鎓四氟硼酸盐、1-丁基-3-甲基咪唑鎓四氟硼酸盐、1-丁基-3-甲基咪唑鎓六氟磷酸盐以及类似离子液体)。在一些实施方案中,使用水性溶剂,包括水和水性共溶剂系统。
示例性水性共溶剂系统具有水和一种或多种有机溶剂。一般来说,选择水性共溶剂系统的有机溶剂组分以使其不会完全使酮还原酶灭活。利用如本文描述的那些酶活性测定,通过在候选溶剂系统中用确定的关注底物测量指定的工程酮还原酶的酶促活性,可容易地鉴别合适的共溶剂系统。
水性共溶剂系统的有机溶剂组分可以是与水性组分混溶的,提供单一的液相,或可以是与水性组分部分混溶的或不能混溶的,提供两个液相。一般来说,当使用水性共溶剂系统时,选择它是两相的,水分散于有机溶剂,或相反。一般来说,当利用水性共溶剂系统时,需要选择能够容易地与水相分离的有机溶剂。一般来说,共溶剂系统中水比有机溶剂的比例通常在有机溶剂比水约90∶10至约10∶90(v/v)的范围内,和有机溶剂比水在80∶20和20∶80(v/v)之间。共溶剂系统可在加入反应混合物前预先形成,或其可以在反应器内原位形成。
水性溶剂(水或水性共溶剂系统)可以是pH缓冲的或未缓冲的。一般来说,可在约10或以下的pH,通常在约5至约10的范围内进行还原。在一些实施方案中,在约9或以下的pH,通常在约5至约9的范围内进行还原。在一些实施方案中,在约8或以下的pH,经常在约5至约8的范围内并且通常在约6至约8的范围内进行还原。还可以在约7.8或以下,或7.5或以下的pH下进行还原。可选地,可在中性pH(即约7)下进行还原。
在还原反应过程期间,反应混合物的pH可以改变。通过在反应过程期间加入酸或碱,可将反应混合物的pH维持在所需的pH或所需的pH范围内。可选地,通过使用包含缓冲剂的水性溶剂可控制pH。维持所需pH范围的合适缓冲剂为本领域所知,并且包括,例如,磷酸盐缓冲剂、三乙醇胺缓冲剂以及类似缓冲剂。还可使用缓冲和酸或碱的添加的组合。
当使用葡萄糖/葡糖脱氢酶辅因子再生系统时,如果产生的水性葡糖酸没有通过其他途径中和,如反应式(1)所代表,葡糖酸(pKa=3.6)的共同产生引起反应混和物的pH的下降。可通过标准缓冲技术,其中缓冲剂中和葡糖酸直到所提供的缓冲容量,或通过与转化过程同步加入碱,将反应混合物的pH维持在所需水平。还可使用缓冲和碱的添加的组合。维持所需pH范围的合适缓冲剂如上所述。用于中和葡糖酸的合适的碱是有机碱例如胺、醇盐以及类似有机碱,和无机碱例如氢氧化物盐(例如NaOH)、碳酸盐(例如NaHCO3)、碳酸氢盐(例如K2CO3)、碱式磷酸盐(例如K2HPO4、Na3PO4)以及类似无机碱。伴随转化过程的碱添加,可在监测反应混合物pH的同时手动进行,或更加方便地,通过使用自动滴定计作为恒pH器(pH stat)来进行。部分缓冲容量和碱的添加的组合也可用于过程控制。
当使用碱的添加来中和酮还原酶催化的还原反应期间释放的葡糖酸时,转化的过程可通过维持pH所添加的碱的量来监测。通常,将在还原过程中加入到非缓冲的或部分缓冲的反应混合物的碱以水性溶液添加。
在一些实施方案中,辅因子再生系统可包括甲酸脱氢酶。本文中,术语“甲酸脱氢酶”和“FDH”可互换使用以指NAD+或NADP+依赖性酶,它们分别催化甲酸盐和NAD+或NADP+转化为二氧化碳和NADH或NADPH。适合于用作本文描述的酮还原酶催化的还原反应中的辅因子再生系统的甲酸脱氢酶包括天然存在的甲酸脱氢酶以及非天然存在的甲酸脱氢酶。甲酸脱氢酶包括对应于PCT公布WO 2005/018579的SEQ ID NO:70(假单胞菌(Pseudomonas sp.))和72(博伊丁假丝酵母(Candida boidinii))的甲酸脱氢酶,SEQ ID NO:70和72由对应于PCT公布2005/018579的SEQ ID NO:69和71的多核苷酸序列分别编码,所述专利的公开通过引用在此并入。在本文描述的方法中使用的甲酸脱氢酶,不论是天然存在的还是非天然存在的,可表现出至少约1μmol/min/mg、有时至少约10μmol/min/mg、或至少约102μmol/min/mg,多达约103μmol/min/mg或更高的活性,并且在PCT公布WO 2005/018579的实施例4中描述的测定中可容易地筛选其活性。
如本文所用,术语“甲酸盐”指甲酸阴离子(HCO2 -)、甲酸(HCO2H)及其混合物。甲酸盐可提供为盐的形式,通常是碱金属盐或铵盐(例如HCO2Na、KHCO2NH4以及类似的盐);甲酸的形式,通常是甲酸水溶液;或其混合物的形式。甲酸是中度酸。在其pKa(水中pKa=3.7)的几个pH单位内的水溶液中,甲酸盐以平衡浓度的HCO2 -和HCO2H存在。当pH值大于约pH 4时,甲酸盐主要以HCO2 -存在。当甲酸盐作为甲酸提供时,反应混合物通常被缓冲或通过加入碱来使酸性降低以提供所需的pH,通常是约pH 5或更高。用于中和甲酸的合适的碱包括但不限于有机碱例如胺、醇盐以及类似有机碱,和无机碱例如氢氧化物盐(例如NaOH)、碳酸盐(例如NaHCO3)、碳酸氢盐(例如K2CO3)、碱式磷酸盐(例如K2HPO4、Na3PO4)以及类似无机碱。
对于大于约pH 5的pH值,此时甲酸盐主要以HCO2 -存在,以下反应式(2)描述甲酸脱氢酶催化的甲酸盐对NAD+或NADP+的还原。
当使用甲酸盐和甲酸脱氢酶作为辅因子再生系统时,可通过标准缓冲技术,其中缓冲剂释放质子至多为所提供的缓冲容量,或通过与转化过程同时添加酸,将反应混合物的pH维持在所需的水平。反应过程期间添加以维持pH的合适的酸包括有机酸,例如羧酸、磺酸、膦酸以及类似有机酸,无机酸例如氢卤酸(诸如盐酸)、硫酸、磷酸以及类似无机酸,酸式盐例如二氢磷酸盐(例如KH2PO4)、硫酸氢盐(例如NaHSO4)以及类似酸式盐。一些实施方案利用甲酸,借此维持甲酸盐浓度和溶液的pH。
在使用甲酸盐/甲酸脱氢酶辅因子再生系统的还原反应期间,当使用添加酸来维持pH时,可通过维持pH所添加的酸的量监测转化过程。通常,转化过程中加入到非缓冲的或部分缓冲的反应混合物的酸以水性溶液添加。
本文中,术语“仲醇脱氢酶”和“sADH”互换使用以指NAD+或NADP+依赖性酶,它们分别催化仲醇和NAD+或NADP+转化为酮和NADH或NADPH。以下,反应式(3)描述仲醇对NAD+或NADP+的还原,以异丙醇为例。
适合于用作本文描述的酮还原酶催化的还原反应中的辅因子再生系统的仲醇脱氢酶包括天然存在的仲醇脱氢酶以及非天然存在的仲醇脱氢酶。天然存在的仲醇脱氢酶包括来自布氏热厌氧菌(Thermoanerobiumbrockii)、红平红球菌(Rhodococcus etythropolis)、克菲尔乳杆菌和短乳杆菌的已知醇脱氢酶,而非天然存在的仲醇脱氢酶包括由此衍生的工程醇脱氢酶。在本文描述的方法中使用的仲醇脱氢酶,不论是天然存在的还是非天然存在的,可表现出至少约1μmol/min/mg、有时至少约10μmol/min/mg、或至少约102μmol/min/mg,多达约103μmol/min/mg或更高的活性。
合适的仲醇包括低级仲烷醇和芳基-烷基甲醇。低级仲醇的实例包括异丙醇、2-丁醇、3-甲基-2-丁醇、2-戊醇、3-戊醇、3,3-二甲基-2-丁醇以及类似低级仲醇。在一个实施方案中,仲醇是异丙醇。合适的芳基-烷基甲醇包括未取代的和取代的1-芳基乙醇。
当使用仲醇和仲醇脱氢酶作为辅因子再生系统时,通过仲醇脱氢酶将仲醇偶联氧化为酮,进而还原产生的NAD+或NADP+。一些工程酮还原酶还具有使仲醇还原剂脱氢的活性。在一些使用仲醇作为还原剂的实施方案中,工程酮还原酶和仲醇脱氢酶是同一个酶。
在使用辅因子再生系统执行本文描述的酮还原酶催化的还原反应的实施方案时,初始可提供氧化或还原形式的辅因子。如上所述,辅因子再生系统将氧化的辅因子转化为其还原形式,然后在酮还原酶底物的还原中使用所述还原形式。
在一些实施方案中,不使用辅因子再生系统。对于没有使用辅因子再生系统执行的还原反应,向反应混合物加入还原形式的辅因子。
在一些实施方案中,当使用宿主生物体的全细胞执行该过程时,该全细胞可自身提供辅因子。可选地或在组合中,该细胞可自身或重组地提供葡糖脱氢酶。
在执行本文描述的立体选择性还原反应中,可向反应混合物加入纯化酶、用编码该酶的基因转化的全细胞、和/或该细胞的细胞提取物和/或溶解产物的形式的工程酮还原酶和包含任选的辅因子再生系统的任何酶。编码工程酮还原酶和任选的辅因子再生酶的基因可分别转化到宿主细胞,或一起转化到相同的宿主细胞。例如,在一些实施方案中,一组宿主细胞可用编码工程酮还原酶的基因转化,并且另一组可用编码辅因子再生酶的基因转化。可以以全细胞的形式或由此衍生的溶解产物或提取物的形式,将两组转化的细胞一起用于反应混合物。在其他的实施方案中,宿主细胞可以用编码工程酮还原酶和辅因子再生酶两者的基因转化。
用编码工程酮还原酶和/或任选的辅因子再生酶的基因转化的全细胞,或其细胞提取物和/或溶解产物,可以以多种不同的形式使用,包括固体(例如冻干固体、喷雾干燥的固体以及类似的固体)或半固体(例如粗糊剂)。
通过沉淀(硫酸铵、聚乙烯亚胺、热处理或类似处理),随后通过冻干前的脱盐程序(例如超滤、透析以及类似处理)可部分纯化细胞提取物或细胞溶解产物。可通过使用已知交联剂(诸如例如戊二醛)交联或固定于固相(例如Eupergit C以及类似固相)来稳定任何的细胞制品。
可向反应提供各种不同形式的固体反应物(例如酶、盐等等),包括粉末(例如冻干的、喷雾干燥的以及类似的)、溶液、乳剂、悬浮液以及类似形式。使用本领域普通技术人员所知的方法和设备,可容易地冻干或喷雾干燥反应物。例如,蛋白质溶液可以以小的等份在-80℃下冷冻,然后加入到预冷的冻干室中,随后施用真空。在除去样品中的水后,通常将温度升至4℃,持续2小时,然后释放真空并回收冻干样品。
在还原反应中所用的反应物的量通常将根据所需产物的量和伴随地所用酮还原酶底物的量而变化。以下指导可用于确定使用的酮还原酶、辅因子和任选的辅因子再生系统的量。一般来说,使用约50mg至约5g的酮还原酶和约10mg至约150mg的辅因子,可使用浓度约20至300克/升的酮底物。本领域普通技术人员将容易地理解,如何改变这些量以将它们调整到生产力和生产规模的所需水平。根据所用的辅因子和/或酮还原酶的量,通过常规实验可容易地确定任选的辅因子再生系统的合适的量。一般来说,使用的还原剂(例如葡萄糖、甲酸盐、异丙醇)的水平超过酮还原酶底物的等摩尔水平,以实现酮还原酶底物基本完全或几乎完全的转化。
反应物的加入顺序并不重要。反应物可在相同的时间一起加入到溶剂(例如单相溶剂、两相水性共溶剂系统以及类似溶剂)中,或可选地,可分别加入反应物中的一些,并且一些反应物在不同的时间点一起加入。例如,可首先将辅因子再生系统、辅因子、酮还原酶和酮还原酶底物加入到溶剂中。
为了改善使用水性共溶剂系统时的混合效力,可首先将辅因子再生系统、酮还原酶和辅因子加入并混合到水相。然后可加入有机相并混合,随后加入酮还原酶底物。可选地,酮还原酶底物可以在加入到水相之前,于有机相中预混合。
用于执行本文描述的酮还原酶催化的还原反应的合适条件包括很多种条件,它们可容易地被常规实验优化,实验包括但不限于在实验pH和温度下使工程酮还原酶和底物接触,并且例如,使用本文提供的实施例中描述的方法检测产物。
通常在约15℃至约75℃的温度范围内执行酮还原酶催化的还原。对于一些实施方案,在约20℃至约55℃的温度范围内执行反应。在其他的实施方案中,在约20℃至约45℃的温度范围内执行反应。还可以在环境条件下执行反应。
通常允许还原反应进行,直到实现底物的基本完全或几乎完全还原。底物还原为产物可使用已知的方法,通过检测底物和/或产物来监测。合适的方法包括气相色谱、HPLC以及类似方法。在反应混合物中产生的醇还原产物的转化收率通常大于约50%,还可大于约60%,还可大于约70%,还可大于约80%,还可大于90%,并且通常大于约97%。
8.实施例
在以下的代表性实施例中阐明本公开的各种特征和实施方案,实施例意在示例而不是限制。
8.1实施例1:野生型酮还原酶基因的获得和表达载体的构建
根据已报道的酮还原酶的氨基酸序列和如美国临时申请序列号60/848,950和WO2008042876(通过引用在此并入)的实施例1所描述的密码子优化算法,设计用于在大肠杆菌中表达的酮还原酶(KRED)编码基因。使用包括42个核苷酸的寡核苷酸合成基因,并且将其克隆于lac启动子控制下的表达载体pCK110900(如美国专利申请公布20060195947的图3所描述)。该表达载体还包含P15a复制起点和氯霉素抗性基因。使用标准方法将产生的质粒转化到大肠杆菌W3110。密码子优化的基因的序列以及编码的多肽列于表3。如美国临时申请序列号60/848,950所描述,确认了野生型酮还原酶的活性。
编码本公开的工程酮还原酶的多核苷酸同样地克隆于载体pCK110900,以便在大肠杆菌W3110中表达。
8.2实施例2:酮还原酶粉末的产生;摇瓶步骤。
将含有具有所关注的酮还原酶基因的质粒的大肠杆菌的单一微生物菌落接种于50ml含有30μg/ml氯霉素和1%葡萄糖的LB肉汤(LuriaBertani broth)。30℃,250rpm振荡下,使细胞在培养箱中生长过夜(至少16小时)。将培养物稀释于250ml Terrific肉汤(12g/L细菌用胰蛋白胨、24g/L酵母提取物、4ml/L甘油、65mM磷酸钾、pH 7.0、1mM MgSO4、30μg/ml氯霉素于1升烧瓶中)至600nm处的光密度(OD600)为0.2,并允许其在30℃下生长。当培养物的OD600是0.6至0.8时,酮还原酶基因的表达用1mM IPTG诱导,并孵育过夜(至少16小时)。通过离心(5000rpm,15min,4℃)收获细胞,并弃去上清液。将细胞沉淀物用等体积的冷(4℃)的100mM三乙醇胺(氯化物)缓冲液,pH 7.0(在ADH-LK和ADH-LB以及由此衍生的工程酮还原酶的情况中,包括2mM MgSO4)再次悬浮,并通过如上的离心收获。将洗涤的细胞在两体积的冷三乙醇胺(氯化物)缓冲液中再次悬浮,并在12000psi下穿过弗氏压碎器2次,且保持在4℃。通过离心(9000rpm,45min,4℃)除去细胞碎片。收集澄清的溶解产物上清液,并在-20℃下储存。冻干冷冻的澄清溶解产物提供粗酮还原酶的干燥粉末。
如美国临时申请序列号60/848,950所描述,确认了野生型酮还原酶的活性。向1mL 100mM磷酸盐(钠)缓冲液,pH 7.5的溶液加入10mg酮还原酶粉末、50mg NAD(P)H、100μL异丙醇和10mg 4’-氯乙酰苯或未取代的乙酰苯。将反应混合物在室温下搅拌16小时,然后用1mL MTBE萃取。通过手性HPLC分析MTBE相的样品中4’-氯-乙酰苯的转化和产物的对映异构体组成。
8.3实施例3:酮还原酶的生产-发酵步骤。
在充气搅拌的15L发酵罐中,使6.0L的生长培养基达到30℃的温度,所述培养基包括0.88g/L硫酸铵、0.98g/L的柠檬酸钠;12.5g/L的磷酸氢二钾三水合物、6.25g/L的磷酸二氢钾、6.2g/L的Tastone-154酵母提取物、0.083g/L柠檬酸铁铵和8.3ml/L的微量元素溶液,微量元素溶液含有2g/L的氯化钙二水合物、2.2g/L硫酸锌七水合物、0.5g/L硫酸镁一水合物、1g/L硫酸亚铜七水合物、0.1g/L钼酸铵四水合物和0.02g/L四硼酸钠十水合物。发酵罐用大肠杆菌W3110的后期指数培养物接种,所述大肠杆菌W3110含有具有所关注的酮还原酶基因的质粒,在如实施例2所描述的摇瓶中生长至起始OD600为0.5至2.0。发酵罐以500-1500rpm搅拌,并且以1.0-15.0L/min向发酵容器提供空气以保持30%饱和的溶氧水平或更高。通过加入20%v/v的氢氧化铵,将培养物的pH控制在7.0。通过添加含有500g/L工业葡萄糖(cerelose)、12g/L氯化铵和10.4g/L硫酸镁七水合物的料液来维持培养物的生长。培养物达到50的OD600后,通过加入异丙基-β-D-硫代半乳糖苷(IPTG)至1mM的最终浓度来诱导酮还原酶的表达。使培养物生长另外14个小时。然后将培养物冷却至4℃,并维持在4℃直到收获。4℃下在Sorval RC12BP离心机中以5000G离心40分钟收获细胞。收获的细胞直接用于以下的下游回收过程,或在4℃下储存直到此类使用。
4℃下,将细胞沉淀物再次悬浮于2体积的100mM三乙醇胺(氯化物)缓冲液,pH 6.8至每体积的湿细胞糊状物。通过使用12000psig的压力将该悬浮液通过安装二级匀浆阀组件的匀浆机,使细胞内酮还原酶从细胞释放。破坏后,立即将细胞匀浆物冷却至4℃。将10%w/v的聚乙烯亚胺溶液,pH 7.2加入到溶解产物至最终浓度0.5%w/v,并搅拌30分钟。通过在标准实验室离心机中以5000G离心30分钟,使产生的悬浮液澄清。倾出澄清的上清液,使用具有截留分子量为30Kd的纤维素超滤膜浓缩10倍。将最终浓缩物分散于浅容器,在-20℃下冷冻,并冻干成粉末。将酮还原酶粉末储存于-80℃。
8.4实施例4:确定3-酮基四氢噻吩的转化和R-3-羟基四氢噻吩的对映体过量的分析方法。
确定转化的手性GC:使用Agilent HP-5MS气相色谱确定3-酮基四氢噻吩还原成3-羟基四氢噻吩,所述气相色谱装有5%苯甲基硅氧烷柱(型号19091S-433:30mx250μm,额定厚度0.25μm),具有1.0mL/min的氦流量。入口温度是220℃,且使用以下温度程序:120℃,持续1分钟,然后20℃/分钟至160℃,然后160℃持续0.5分钟。210nm处,分光光度定量检测化合物。酮和醇的保留时间分别是2.8分钟和3.0分钟。
确定3-羟基四氢噻吩的立体异构体纯度的手性HPLC:在室温下使用Agilent 1100或1050HPLC确定3-羟基四氢噻吩的R和S对映体的丰度,所述HPLC装有Chiralpak AD柱(4.6x250mm,且无保护柱),具有IPA/己烷(2/98)作为洗脱液,流量2.5mL/min。酮、S-醇和R-醇的保留时间分别是8.6、12.0和13.1分钟。
可选地,可在40℃下使用装有Chiralpak AD-H柱(4.6x150mm和10mm保护柱)的HPLC,其用IPA/己烷(2/98),流量2.0mL/min。210nm处,分光光度定量检测化合物。酮、S-醇和R-醇的保留时间分别是6.3、8.7和9.4分钟。
8.5实施例5:野生型酮还原酶用于还原3-酮基四氢噻吩的评估
在如下辅因子限制条件下,筛选用于对映选择性还原3-酮基四氢噻吩的表3中描述的酮还原酶(实施例1):在空气下,将1-20mg酶、含有溶解在20mL100mM pH 8.0三乙醇胺(氯化物)缓冲液中的766mg NAD(P)H的1mL辅因子储备溶液和20μL 3-酮基四氢噻吩加入小瓶。在室温下搅拌过夜后,用乙酸乙酯提取反应混合物,且按照实施例4所描述测定对映选择性。结果描述于表4中。(NR=不反应。)
这一实施例显示在测试的野生型酶中,ADH-LK是最具R-对映选择性的酮还原酶,其产生67%e.e.的R-3-羟基四氢噻吩。因此,ADH-LK被选为针对所需特征的酶工程的起点。
8.6实施例6:鉴别改善的酶还原3-酮基四氢噻吩的高通量NADPH荧光预筛选。
含有进化的酮还原酶基因的质粒文库被转化至大肠杆菌W3110并涂板于含有1%葡萄糖和30μg/mL氯霉素(CAM)的Luria-Bertani(LB)琼脂板上。在30℃下孵育至少16小时后,使用Q-自动菌落挑取器(Genetix USA,Inc.,Beaverton,OR),将菌落挑取到含有180μL LB、1%葡萄糖和30μg/mL CAM的96孔浅孔微量滴定板。250rpm振荡下,使细胞在37℃下生长过夜。然后,将10μL的这一培养物转移至含有390μLTerrific肉汤(TB)和30μg/mL CAM的96孔微量滴定板(深孔)上。30℃,250rpm振荡下,将深孔板孵育2.5至3小时(OD6000.6-0.8)后,通过最终浓度1mM的异丙基硫代半乳糖苷(IPTG)诱导细胞培养物表达重组基因。然后,30℃,250rpm振荡下,将板孵育过夜。
细胞经由离心沉淀,在300μL溶解缓冲液中再次悬浮,并通过在室温下振荡至少2小时来溶解。溶解缓冲液含有100mM三乙醇胺(氯化物)缓冲液,pH 7.0-7.2、1mg/mL溶菌酶和750μg/mL硫酸多粘菌素B。板在4000RPM离心10分钟,且在荧光测定中使用澄清的上清液(溶解产物)。
在96孔避光微量滴定板中,将20μl澄清上清液(必要时,稀释于100mM三乙醇胺/氯化物缓冲液,pH 7.0,1mM MgSO4)加入到180μl测定混合物,所述测定混合物由100mM三乙醇胺(氯化物)缓冲液,pH 7.0、1mM MgSO4、0.25mM NADPH、600mM葡萄糖、1200mM葡糖酸钠和1mM 3-酮基四氢噻吩组成,并且通过根据在Flexstation(Molecular Devices,USA)中,在330nm下激发后,445nm下NADPH的荧光的降低,测量反应进程。为了评估KRED变体的热稳定性,澄清上清液在40℃至50℃的温度范围下,任选地预孵育至少16小时,然后加入到测定混合物中。
这一实施例描述了用于鉴别3-酮基四氢噻吩还原速率提高的和/或热稳定性提高的KRED变体的方法。
8.7实施例7:使用辅因子再循环的葡萄糖/葡糖脱氢酶的用于3-酮基四氢噻吩还原的酮还原酶活性和对映选择性的高通量HPLC测定
按照实施例6所描述制备溶解产物。通过将测定量的细胞溶解产物转移至深孔微量滴定板的各孔,测量酮还原酶活性。孔中的测定混合物(每个孔的最终体积为500μl)含有1mg/mL GDH、0.4mg/ml Na-NADP、0.2至1.25M葡萄糖、0至400mM葡糖酸钠、100mM三乙醇胺(氯化物)缓冲液(pH 7)、20mM MgSO4和多达50mg碳酸钙。通过加入多达100μl细胞溶解产物和50μl 3-酮基四氢噻吩(最终浓度1M)启动反应。用铝/聚丙烯薄片耐热密封带(Velocity 11(Menlo Park,CA),目录编号06643-001)密封后,将板在4℃至25℃下孵育多达16小时。将1ml乙酸乙酯注射到板的每个孔,并将板摇动10分钟,然后离心20秒;将100μl乙酸乙酯相转移至潜孔微量滴定板。这些样品板用耐热密封带密封以防止蒸发。样品通过实施例4的方法由HPLC分析。
这一实施例显示如何鉴别酮还原酶基因文库中的具有还原3-酮基四氢噻吩的改善的活性和/或形成R-3-羟基四氢噻吩的改善的对映选择性的酮还原酶变体。
8.8实施例8:衍生自ADH-LK的工程酮还原酶对3-酮基四氢噻吩的还原。
衍生自ADH-LK变体的改善的酮还原酶以如下的制备规模评价。将含有6.63g葡萄糖的18ml水(水或缓冲液)相加入到25ml三颈容器中,该容器装有PTFE包裹的磁力搅拌棒和连接于自动滴定器的pH电极,其用于根据需要经导管向容器进行碱的pH控制添加。随后加入3.0g 3-酮基四氢噻吩(重蒸馏)、在1mL的水相中的30至120mg KRED变体、在1mL的水相中的30mg GDH和12mg NADP-Na2。自动滴定器通过加入4NNaOH将pH维持在7,其被持续记录。通过碱的速率和不断加入,以及对反应混合物的周期采样以用乙酸乙酯提取,并通过实施例4的方法分析,监控反应进程。反应完成时,R-3-羟基四氢噻吩的浓度是100±5g/L。
表5提供了对应酮还原酶变体的SEQ ID NO.、从野生型ADH-LK的氨基酸突变的数量、它们用于还原3-酮基四氢噻吩的活性(如在24小时反应中将3-酮基四氢噻吩完全转化成3-羟基四氢噻吩所需的酶粉末的量)和3-羟基四氢噻吩产物的R-对映选择性(如e.e.范围)。
这一实施例阐释了衍生自酮还原酶ADH-LK的提供了与野生型酮还原酶ADH-LK对比的改善的对映选择性和活性的工程酮还原酶。
a对映选择性列:
0  (R)对映体61.0-79.99%ee
+  (R)对映体80.0-89.99%ee
++ (R)对映体90.0-94.99%ee
+++(R)对映体95.0-97.99%ee
++++(R)对映体98.0-98.99%ee
+++++(R)对映体>99.0%ee
b活性列:
0需要1.0-4.0g/L的浓度的这种酶以提供在24h内完全转化100g/L 3-酮基四氢噻吩+0.8-1.0g/L的浓度的这种酶提供在20至24h内完全转化100g/L 3-酮基四氢噻吩++0.8-1.0g/L的浓度的这种酶提供在12至20h内完全转化100g/L 3-酮基四氢噻吩
c稳定性列:
-比ADH-LK的稳定性差
0与ADH-LK的稳定性相似
+比ADH-LK更稳定
8.9实施例9:R-(3)-羟基四氢噻吩的制备规模生产
在空气和室温下,将600mL 100mM pH 7.0三乙醇胺(氯化物)缓冲液、2mL 1M MgSO4和225g D-葡萄糖加入到2-L带夹套的三颈烧瓶中,该烧瓶装有约300rpm的机械搅拌器、温度计和连接于自动滴定器的pH电极,其用于根据需要经导管向容器进行碱的pH控制添加。葡萄糖溶解后(约1/2h),将100g 3-酮基四氢噻吩加入反应以获得两相混合物。将反应温度降低至15℃,并加入在30mL 100mM pH 7.0三乙醇胺(氯化物)缓冲液中的1.0g酮还原酶粉末(SEQ-ID No.22)和在20mL 100mM pH7.0三乙醇胺(氯化物)缓冲液中的0.25g GDH,以及在10mL 100mM pH7.0三乙醇胺(氯化物)缓冲液中的0.4g NADP-Na2。反应温度经外循环冷凝器维持在15℃,并且自动滴定器通过加入8N NaOH将pH维持在7.0+0.1。在15℃下搅拌15h后,将循环器温度升至25℃,且在另外1小时后,加入0.25g GDH粉末(最终GDH浓度=0.5g/L)。在总共23小时后,加入10g Na2S2O5。在25℃下另外搅拌1小时后,用750ml乙酸乙酯提取产物。通过约20g硅藻土545过滤分离的有机相。用750mL EtOAc漂洗湿硅藻土垫。合并的有机相用100mL水洗涤。60℃下,将分离的有机相真空旋转蒸发,以获得淡黄色油状83.6g(收率82%)的3-羟基四氢噻吩。手性HPLC分析显示99.3%对映体过量的(R)-3-羟基四氢噻吩。
对于所有的目的,本申请引用的所有出版物、专利、专利申请和其他文件在此通过引用以其整体并入,其等同于对于所有的目的,单独地指明每个个体出版物、专利、专利申请或其他文件通过引用并入。
尽管已经阐述并描述了各个具体的实施方案,但应理解,可进行各种变化而不脱离本发明的精神和范围。
序列表
<110>杰克·梁
     史提芬尼·J·珍妮
     艾米丽·穆德弗
     拉玛·沃兰德里
     詹姆士·拉伦德
     吉伽特·哈思曼
<120>用于(R)-3-羟基四氢噻吩的立体选择性制备的改善的酮还原酶多肽
<130>376247-016(385337)
<150>US 60/957,974
<151>2007-08-24
<160>155
<210>1
<211>762
<212>DNA
<213>人工序列
<220>
<223>密码子优化的短乳杆菌序列
<400>1
atgtctaacc gtctggatgg caaagtagcc atcattaccg gcgggactct gggtatcggt  60
ttggcaatcg ccacgaaatt tgtagaggag ggtgcgaaag taatgattac tggtcgtcac 120
tccgatgtag gtgaaaaggc cgccaaatca gtaggcactc cggatcagat tcagtttttt 180
cagcacgatt catccgatga agatggctgg acgaaactgt tcgacgccac cgagaaagca 240
ttcggcccgg ttagcacctt agtgaacaat gcagggattg cagttaacaa aagcgttgaa 300
gaaactacca cggccgaatg gcgtaaactg ctggccgtta atctggatgg tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420
atgagcagta ttgaggggtt cgtaggcgat ccgagcctgg gggcatacaa cgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctgccg 600
ggtgctgagg aagcgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacatcg catatatctg tgtgtacctg gcatctaatg aatcgaaatt tgcgacgggt 720
tccgaatttg tggtcgacgg cgggtatacc gcacagtaat ga                    762
<210>2
<211>252
<212>PRT
<213>人工序列
<220>
<223>密码子优化的短乳杆菌序列的翻译
<400>2
Met Ser Asn Arg Leu Asp Gly Lys Val Ala Ile Ile Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Thr Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Met Ile Thr Gly Arg His Ser Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Val Gly Thr Pro Asp Gln Ile Gln Phe Phe Gln His Asp Ser
    50                  55                  60
Ser Asp Glu Asp Gly Trp Thr Lys Leu Phe Asp Ala Thr Glu Lys Ala
65                  70                  75                  80
Phe Gly Pro Val Ser Thr Leu Val Asn Asn Ala Gly Ile Ala Val Asn
                85                  90                  95
Lys Ser Val Glu Glu Thr Thr Thr Ala Glu Trp Arg Lys Leu Leu Ala
            100                 105                 110
Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Glu Gly Phe Val Gly Asp Pro Ser Leu Gly Ala Tyr Asn Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Pro Gly Ala Glu Glu Ala Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala
    210                 215                 220
Tyr Ile Cys Val Tyr Leu Ala Ser Asn Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ser Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>3
<211>759
<212>DNA
<213>人工序列
<220>
<223>密码子优化的克菲尔乳杆菌序列
<400>3
atgaccgatc gtctgaaggg caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cagtttccaa aagcgttgaa 300
gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420
atgagcagta ttgaggggtt cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>4
<211>252
<212>PRT
<213>人工序列
<220>
<223>密码子优化的克菲尔乳杆菌序列的翻译
<400>4
Met Thr Asp Arg Leu Lys Gly Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Ser
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Glu Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>5
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>5
atgaccgatc gtctgaaaag caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggta ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggatta ccgtttccaa aagcgttgaa 300
gacactacca cggaggaatg gcacaaactg ctgtccgtta atctggatag tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaag aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacac tgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgatgtc acatcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacgtgg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>6
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>6
Met Thr Asp Arg Leu Lys Ser Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Thr Val Ser
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp His Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Ser Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Thr Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser His
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Val Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>7
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>7
atgaccgatc gtctgaagaa caaagtagcc atcgtaaccg gcgggactct gggtataggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggta ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggatta ccgtttccaa aagcgttgaa 300
gacactacca cggaggattg gcacaaactg ctgtccgtta atctggatag tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaag aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacac tgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacgtgg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>8
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>8
Met Thr Asp Arg Leu Lys Asn Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Thr Val Ser
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Asp Trp His Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Ser Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Thr Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Val Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>9
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>9
atgaccgatc gtctgaagag caaagtagcc atcgtaaccg gcgggaccct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggta ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggatta ccgtttccaa aagcgttgaa 300
gacactacca cggaggaatg gcacaaactg ctgtccgtta atctggatag tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaag aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacac tgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgag ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgcaatc acggcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacgtgg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>10
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>10
Met Thr Asp Arg Leu Lys Ser Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Thr Val Ser
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp His Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Ser Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Thr Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Arg Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Gln Ser Arg
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Val Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>11
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>11
atgaccgatc gtctgaagag caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gcgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cagtttccaa aagcgttgaa 300
gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatag tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacac tgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>12
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>12
Met Thr Asp Arg Leu Lys Ser Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Ser
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Ser Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Thr Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>13
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>13
atgaccgatc gtctgaagag caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cagtttccaa aagcgttgaa 300
gacactacca cggaggaatg gcacaaactg ctgtccgtta atctggatag tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacac tgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>14
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>14
Met Thr Asp Arg Leu Lys Ser Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Ser
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp His Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Ser Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Thr Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>15
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>15
atgaccgatc gtctgaagag caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cagtttccaa aagcgttgaa 300
gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctagtcga tgatctggaa 600
ggtgctgagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacgtcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>16
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>16
Met Thr Asp Arg Leu Lys Ser Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Ser
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Val Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>17
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>17
atgaccgatc gtctgaagag caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggta ctgatgttat tcgctttgtc 180
cagcacgacg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggatta ccgttccaaa aagcgttgaa 300
gacactacca cggaggaatg gcacaaactg ctgtccgtta atctggatag tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaag aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggct cgttggcgat ccgacgctgg gggcatacac tgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc tgctggtcga tgatctggaa 600
ggtgctgagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacgtgg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>18
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>18
Met Thr Asp Arg Leu Lys Ser Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Thr Val Pro
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp His Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Ser Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Thr Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Leu Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Val Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>19
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>19
atgaccgatc gtctgaagag caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggta ctgatgttat tcgctttgtc 180
cagcacgata catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggatta ccgttccaaa aagcgttgaa 300
gacactacca cggaggaatg gcacaaactg ctgtccgtta atctggatag tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaag aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacac tgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacgtgg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>20
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>20
Met Thr Asp Arg Leu Lys Ser Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Thr
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Thr Val Pro
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp His Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Ser Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Thr Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Val Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>21
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>21
atgaccgatc gtctgaagag caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggta ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggatta ccgttccaaa aagcgttgaa 300
gacactacca cggaggaatg gcacaaactg ctgtccgtta atctggatag tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaag aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacac tgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagacca acctggtcga tgatctggaa 600
ggtgctgagg aaatgcaatc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacgtgg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>22
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>22
Met Thr Asp Arg Leu Lys Ser Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Thr Val Pro
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp His Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Ser Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Thr Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Asn Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Gln Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Val Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>23
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>23
atgaccgatc gtctgaagag caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggta ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggatta ccgttccaaa aagcgttgaa 300
gacactacca cggaggaatg gcacaaactg ctgtccgtta atctggatag tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaag aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacac tgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacgtgg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>24
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>24
Met Thr Asp Arg Leu Lys Ser Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Thr Val Pro
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp His Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Ser Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Thr Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Val Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>25
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>25
atgaccgatc gtctgaagag caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggta ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggatta ccgttccaaa aagcgttgaa 300
gacactacca cggaggaatg gcacaaactg ctgtccgtta atctggatag tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaag aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacac tgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgcaatc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacgtgg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>26
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>26
Met Thr Asp Arg Leu Lys Ser Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Thr Val Pro
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp His Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Ser Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Thr Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Gln Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Val Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>27
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>27
atgaccgatc gtctgaagag caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggta ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggatta ccgttccaaa aagcgttgaa 300
gacactacca cggaggaatg gcacaaactg ctgtccgtta atctggatag tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaag aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacac tgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccg acctggtcga tgatctggaa 600
ggtgctgagg aaatgcaatc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacgtgg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>28
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>28
Met Thr Asp Arg Leu Lys Ser Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Thr Val Pro
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp His Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Ser Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Thr Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Asp Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Gln Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Val Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>29
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>29
atgaccgatc gtctgaagag caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggta ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggatta ccgttccaaa aagcgttgaa 300
gacactacca cggaggaatg gcacaaactg ctgtccgtta atctggatag tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaag aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacac tgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccg ggctggtcga tgatctggaa 600
ggtgctgagg aaatgcaatc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacgtgg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>30
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>30
Met Thr Asp Arg Leu Lys Ser Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Thr Val Pro
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp His Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Ser Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Thr Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Gly Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Gln Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Val Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>31
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>31
atgaccgatc gtctgaagag caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggta ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggatta ccgttgagaa aagcgttgaa 300
gacactacca cggaggaatg gcacaaactg ctgtccgtta atctggatag tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaag aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacac tgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacgtgg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>32
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>32
Met Thr Asp Arg Leu Lys Ser Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Thr Val Glu
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp His Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Ser Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Thr Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Val Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>33
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>33
atgaccgatc gtctgaagag caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggta ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggatta ccgttgccaa aagcgttgaa 300
gacactacca cggaggaatg gcacaaactg ctgtccgtta atctggatag tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaag aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacac tgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacgtgg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>34
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>34
Met Thr Asp Arg Leu Lys Ser Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Thr Val Ala
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp His Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Ser Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Thr Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Val Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>35
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>35
atgaccgatc gtctgaagag caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggta ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggatta ccgtttccaa aagcgttgaa 300
gacactacca cggaggaatg gcacaaactg ctgtccgtta atctggatag tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaag aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacac tgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacgtgg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>36
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>36
Met Thr Asp Arg Leu Lys Ser Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Thr Val Ser
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp His Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Ser Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Thr Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Val Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>37
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>37
atgaccgatc gtctgaagag caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggta ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggatta ccgtttccaa aagcgttgaa 300
gacactacca cggaggaatg gcacaaactg ctgtccgtta atctggatag tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaag aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacac tgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgcaatc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacgtgg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>38
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>38
Met Thr Asp Arg Leu Lys Ser Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Thr Val Ser
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp His Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Ser Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Thr Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Gln Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Val Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                  240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>39
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>39
atgaccgatc gtctgaagag caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggta ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggatta ccgtttccag aagcgttgaa 300
gacactacca cggaggaatg gcacaaactg ctgtccgtta atctggatag tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaag aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacac tgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgcaatc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacgtgg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>40
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>40
Met Thr Asp Arg Leu Lys Ser Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Thr Val Ser
                85                  90                  95
Arg Ser Val Glu Asp Thr Thr Thr Glu Glu Trp His Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Ser Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Thr Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Gln Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Val Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>41
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>41
atgaccgatc gtctgaagag caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggta ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggatta ccgtttccct tagcgttgaa 300
gacactacca cggaggaatg gcacaaactg ctgtccgtta atctggatag tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaag aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacac tgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacgtgg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>42
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>42
Met Thr Asp Arg Leu Lys Ser Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Thr Val Ser
                85                  90                  95
Leu Ser Val Glu Asp Thr Thr Thr Glu Glu Trp His Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Ser Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Thr Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Val Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>43
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>43
atgaccgatc gtctgaagag caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggta ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cagtttccaa aagcgttgaa 300
gacactacca cggaggaatg gcacaaactg ctgtccgtta atctggatag tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaag aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacac tgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacgtgg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>44
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>44
Met Thr Asp Arg Leu Lys Ser Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Ser
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp His Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Ser Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Thr Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Val Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>45
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>45
atgaccgatc gtctgaagag caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggta ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cagtttccaa aagcgttgaa 300
gacactacca cggaggaatg gcacaaactg ctgtccgtta atctggatag tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaag aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacac tgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcgaaaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacgtgg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>46
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>46
Met Thr Asp Arg Leu Lys Ser Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Ser
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp His Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Ser Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Thr Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Glu
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Val Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val AspGly Gly Tyr Thr Ala Gln
                245                250
<210>47
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>47
atgaccgatc gtctgaagag caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggta ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cagtttccaa aagcgttgaa 300
gacactacca cggaggaatg gcacaaactg ctgtccgtta atctggatag tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaag aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacac tgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcgagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgatgtc acagcgtacg aaaaccccta tgggccactt tggcgaaccg 660
aatgacgtgg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>48
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>48
Met Thr Asp Arg Leu Lys Ser Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Ser
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp His Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Ser Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Thr Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Glu
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Phe Gly Glu Pro Asn Asp Val Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>49
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>49
atgaccgatc gtctgaagag caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggta ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cggttcctaa aagcgttgaa 300
gacactacca cggaggaatg gcacaaactg ctgtccgtta atctggatag tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaag aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacac tgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgcaatc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacgtgg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>50
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>50
Met Thr Asp Arg Leu Lys Ser Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Pro
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp His Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Ser Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Thr Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Gln Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Val Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>51
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>51
atgaccgatc gtctgaagag caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggta ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cggtttccaa aagcgttgaa 300
gacactacca cggaggaatg gcacaaactg ctgtccgtta atctggatag tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaag aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacac tgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgcaatc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacgtgg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>52
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>52
Met Thr Asp Arg Leu Lys Ser Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Ser
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp His Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Ser Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Thr Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Gln Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Val Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>53
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>53
atgaccgatc gtctgaagag caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggta ctgatgttat tcgctttgtc 180
cagcacgatg cgtccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggatta ccgttccaaa aagcgttgaa 300
gacactacca cggaggaatg gcacaaactg ctgtccgtta atctggatag tgtttttttc 360
ggcacccgtc tgggcattca acgcatgaag aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacac tgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgatgtc acagcgtacg aaaaccccga tgggtcactt tggcgagcca 660
aatgatgtgg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>54
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>54
Met Thr Asp Arg Leu Lys Ser Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Thr Val Pro
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp His Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Ser Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Thr Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Phe Gly Glu Pro Asn Asp Val Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>55
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>55
atgaccgatc gtctgaagag caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgaaaaggc tgccaaatca atcggcggta ctgatgttgt ccgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cagtttccga aagcgttgaa 300
gacactacca cggaggaatg gcacaaactg ctgtccgtta atctggatag tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacac tgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacgtgg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>56
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>56
Met Thr Asp Arg Leu Lys Ser Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Val Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Ser
                85                  90                  95
Glu Ser Val Glu Asp Thr Thr Thr Glu Glu Trp His Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Ser Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Thr Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Val Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>57
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>57
atgaccgatc gtctgaagag caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgagaaggc cgcccgttca atcggcggta ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggatta ccgttccaaa aagcgttgaa 300
gacactacca cggaggaatg gcgcaaactg atgtccgtta atctggatag tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaag aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacac tgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctgggtt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgcaatc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacgtgg catggatctg tgtgtacctg gcatctgacg agtcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>58
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>58
Met Thr Asp Arg Leu Lys Ser Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Arg Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Thr Val Pro
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Met Ser
            100                 105                 110
Val Asn Leu Asp Ser Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Thr Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Gly Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Gln Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Val Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>59
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>59
atgaccgatc gtctgaagag caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgagaaggc cgcccgttca atcggcggta ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggatta ccgtttccaa aagcgttgaa 300
gacactacca cggaggaatg gcgcaaactg atgtccgtta atctggatag tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaag aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacac tgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctgggtt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacgtgg catggatctg tgtgtacctg gcatctgacg agtcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>60
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>60
Met Thr Asp Arg Leu Lys Ser Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Arg Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Thr Val Ser
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Met Ser
            100                 105                 110
Val Asn Leu Asp Ser Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Thr Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Gly Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Val Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>61
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>61
atgaccgatc gtctgaagag caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgagaaggc cgcccgttca atcggcggta ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggatta ccgtttccaa aagcgttgaa 300
gacactacca cggaggaatg gcgcaaactg atgtccgtta atctggatag tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaag aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacac tgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctgggtt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgcaatc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacgtgg catggatctg tgtgtacctg gcatctgacg agtcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>62
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>62
Met Thr Asp Arg Leu Lys Ser Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Arg Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Thr Val Ser
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Met Ser
            100                 105                 110
Val Asn Leu Asp Ser Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Thr Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Gly Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Gln Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Val Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>63
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>63
atgaccgatc gtctgaagag caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgagaaggc cgcccgttca atcggcggta ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cagttccaaa aagcgttgaa 300
gacactacca cggaggaatg gcgcaaactg atgtccgtta atctggatag tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaag aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacac tgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctgggtt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacgtgg catggatctg tgtgtacctg gcatctgacg agtcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>64
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>64
Met Thr Asp Arg Leu Lys Ser Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Arg Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Pro
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Met Ser
            100                 105                 110
Val Asn Leu Asp Ser Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Thr Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Gly Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Val Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>65
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>65
atgaccgatc gtctgaagag caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgagaaggc cgcccgttca atcggcggta ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cagttccaaa aagcgttgaa 300
gacactacca cggaggaatg gcgcaaactg atgtccgtta atctggatag tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaag aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacac tgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctgggtt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgcaatc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacgtgg catggatctg tgtgtacctg gcatctgacg agtcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>66
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>66
Met Thr Asp Arg Leu Lys Ser Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Arg Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Pro
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Met Ser
            100                 105                 110
Val Asn Leu Asp Ser Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Thr Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Gly Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Gln Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Val Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>67
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>67
atgaccgatc gtctgaagag caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgagaaggc cgcccgttca atcggcggta ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cagtttccaa aagcgttgaa 300
gacactacca cggaggaatg gcgcaaactg atgtccgtta atctggatag tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaag aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacac tgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctgggtt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacgtgg catggatctg tgtgtacctg gcatctgacg agtcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>68
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>68
Met Thr Asp Arg Leu Lys Ser Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Arg Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Ser
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Met Ser
            100                 105                 110
Val Asn Leu Asp Ser Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Thr Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Gly Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Val Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>69
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>69
atgaccgatc gtctgaagag caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgagaaggc cgcccgttca atcggcggta ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cagtttccaa aagcgttgaa 300
gacactacca cggaggaatg gcgcaaactg atgtccgtta atctggatag tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaag aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacac tgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctgggtt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgcaatc acagcgtacg aaaaccccta tgggceacat tggcgaaccg 660
aatgacgtgg catggatctg tgtgtacctg gcatctgacg agtcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>70
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>70
Met Thr Asp Arg Leu Lys Ser Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Arg Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Ser
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Met Ser
            100                 105                 110
Val Asn Leu Asp Ser Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Thr Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Gly Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Gln Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Val Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>71
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>71
atgaccgatc gtctgaagag caaagtagcc atcgtaaccg gcgggggact gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggta ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggatta ccgttccaaa aagcgttgaa 300
gacactacca cggaggaatg gcacaaactg ctgtccgtta atctggatag tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaag aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacac tgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgcaatc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacgtgg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>72
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>72
Met Thr Asp Arg Leu Lys Ser Lys Val Ala Ile Val Thr Gly Gly Gly
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Thr Val Pro
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp His Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Ser Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Thr Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Gln Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Val Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>73
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>73
atgaccgatc gtctgaagag caaagtagcc atcgtaaccg gcgggggact gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggta ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cagtttccaa aagcgttgaa 300
gacactacca cggaggaatg gcacaaactg ctgtccgtta atctggatag tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaag aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacac tgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacgtgg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>74
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>74
Met Thr Asp Arg Leu Lys Ser Lys Val Ala Ile Val Thr Gly Gly Gly
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Ser
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp His Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Ser Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Thr Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Val Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>75
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>75
atgaccgatc gtctgaagag caaagtagcc atcgtaaccg gcgggggact gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggta ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cggttcctaa aagcgttgaa 300
gacactacca cggaggaatg gcacaaactg ctgtccgtta atctggatag tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaag aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacac tgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgcaatc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacgtgg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>76
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>76
Met Thr Asp Arg Leu Lys Ser Lys Val Ala Ile Val Thr Gly Gly Gly
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Pro
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp His Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Ser Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Thr Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Gln Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Val Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>77
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>77
atgaccgatc gtctgaagag caaagtagcc atcgtaaccg gcgggggact gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggta ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg tggttcctaa aagcgttgaa 300
gacactacca cggaggaatg gcacaaactg ctgtccgtta atctggatag tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaag aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacac tgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgcaatc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacgtgg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>78
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>78
Met Thr Asp Arg Leu Lys Ser Lys Val Ala Ile Val Thr Gly Gly Gly
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Val Val Pro
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp His Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Ser Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Thr Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Gln Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Val Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>79
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>79
atgaccgatc gtctgaagag caaagtagcc atcgtaaccg gcggggtcct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggta ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggatta ccgttccaaa aagcgttgaa 300
gacactacca cggaggaatg gcacaaactg ctgtccgtta atctggatag tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaag aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacac tgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgcaatc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacgtgg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>80
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>80
Met Thr Asp Arg Leu Lys Ser Lys Val Ala Ile Val Thr Gly Gly Val
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Thr Val Pro
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp His Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Ser Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Thr Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Gln Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Val Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>81
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>81
atgaccgatc gtctgaagca caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggta ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cagtttccaa aagcgttgaa 300
gacactacca cggaggaatg gcacaaactg ctgtccgtta atctggatag tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaag aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacac tgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacgtgg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>82
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>82
Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Ser
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp His Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Ser Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Thr Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Val Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>83
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>83
atgaccgatc gtctgaaggg caaagtagcc accgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180
cagcatgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgactgt cgtgaacaat gcagggatta cagtttccaa aagcgttgaa 300
gacactacca cggaggaatg gcgcaaactg ctgtccgtta atctggatgg tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420
atgagcagta ttgaggggtt cgtaggcgat ccgacgctgg gggcatacag cgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggtgaaccg 660
aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>84
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>84
Met Thr Asp Arg Leu Lys Gly Lys Val Ala Thr Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Thr Val Ser
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Glu Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Ser Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>85
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>85
atgaccgatc gtctgaaggg caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cagtttccaa aagcgttgaa 300
gacactacca cggaggaatg gcacaaactg ctgtccgtta atctggatag tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagcgggtt cgtaggcgat ccgacgctgg gggcatacac tgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atccgcaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacgtgg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>86
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>86
Met Thr Asp Arg Leu Lys Gly Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Ser
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp His Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Ser Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Thr Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Arg
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Val Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>87
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>87
atgaccgatc gtctgaaggg caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cagtttccaa aagcgttgaa 300
gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatag tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaac 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacac cgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>88
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>88
Met Thr Asp Arg Leu Lys Gly Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Ser
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Ser Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Thr Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>89
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>89
atgaccgatc gtctgaaggg caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cagtttccaa aagcgttgaa 300
gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatag tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>90
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>90
Met Thr Asp Arg Leu Lys Gly Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Ser
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Ser Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>91
<21l>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>91
atgaccgatc gtctgaaggg caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cagtttccaa aagcgttgaa 300
gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatag tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacac tgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atccgcaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>92
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>92
Met Thr Asp Arg Leu Lys Gly Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Ser
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Ser Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Thr Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Arg
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>93
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>93
atgaccgatc gtctgaaggg caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cagtttccaa aagcgttgaa 300
gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatag tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgatgctgg gggcatacac tgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>94
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>94
Met Thr Asp Arg Leu Lys Gly Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Ser
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Ser Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Met Leu Gly Ala Tyr Thr Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>95
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>95
atgaccgatc gtctgaaggg caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cagtttccaa aagcgttgaa 300
gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgatgtc acagcgtacg aaaaccccta cgggccacat tggcgaaccg 660
aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>96
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>96
Met Thr Asp Arg Leu Lys Gly Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Ser
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Thr Gly His Ile Gly Glu Pro Asn Asp Ile Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>97
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>97
atgaccgatc gtctgaaggg caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cagtttccaa aagcgttgaa 300
gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>98
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>98
Met Thr Asp Arg Leu Lys Gly Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Ser
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>99
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>99
atgaccgatc gtctgaaggg caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cagtttccaa aagcgttgaa 300
gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgatgtc acagcgtacg aaaaccccta tgggccactt tggcgaaccg 660
aatgacatcg cgtggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>100
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>100
Met Thr Asp Arg Leu Lys Gly Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Ser
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Phe Gly Glu Pro Asn Asp Ile Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>101
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>101
atgaccgatc gtctgaaggg caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cagtttccaa aagcgttgaa 300
gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacac cgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>102
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>102
Met Thr Asp Arg Leu Lys Gly Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Ser
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Thr Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>103
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>103
atgaccgatc gtctgaaggg caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgagactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cagtttccaa aagcgttgaa 300
gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatag tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacac cgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacgtgg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>104
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>104
Met Thr Asp Arg Leu Lys Gly Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Arg Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Ser
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Ser Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Thr Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Val Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>105
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>105
atgaccgatc gtctgaaggg caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgaaaaggc cgccagatca atcggcggca ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt ttgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cagtttccaa aagcgttgaa 300
gacactacca cggaggaatg gcacaaactg ctgtccgtta atctggatag tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacac tgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacgtgg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>106
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>106
Met Thr Asp Arg Leu Lys Gly Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Arg Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Ser
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp His Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Ser Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Thr Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Val Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>107
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>107
atgaccgatc gtctgaaggg caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgaaaaggc cgcgaaatca atcggcggca ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cagtttccaa aagcgttgaa 300
gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgatgtc acagcgtacg aaaacccctg tgggccacat tggcgaaccg 660
aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>108
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>108
Met Thr Asp Arg Leu Lys Gly Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Ser
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Val Gly His Ile Gly Glu Pro Asn Asp Ile Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>109
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>109
atgaccgatc gtctgaaggg caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtggcaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cagtttccaa aagcgttgaa 300
gacactacca cggaggaatg gcacaaactg ctgtccgtta atctggatag tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgttgg gggcatacac tgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat cggcgaaccg 660
aatgacgtgg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcggaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>110
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>110
Met Thr Asp Arg Leu Lys Gly Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Gly Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Ser
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp His Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Ser Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Thr Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Val Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>111
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>111
atgaccgatc gtctgaaggg caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtggcaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cggtttccaa aagcgttgaa 300
gacactacca cggaggaatg gcacaaactg ctgtccgtta atctggatag tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacac tgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atccgtaccc cgctggtcga tggtctggaa 600
ggtgctgagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacgtgg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagagtttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>112
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>112
Met Thr Asp Arg Leu Lys Gly Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Gly Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Ser
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp His Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Ser Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Thr Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Arg
            180                 185                 190
Thr Pro Leu Val Asp Gly Leu Glu Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Val Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>113
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>113
atgaccgatc gtctgaaggg caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cagtttccaa aagcgttgaa 300
gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420
atgagcagta ttgaggggtt cgtaggcgat ccgacgctgg gggcatacag cgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacatcg catggatctg tgcgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>114
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>114
Met Thr Asp Arg Leu Lys Gly Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Ser
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Glu Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Ser Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala
    210                 215                 220
Trp Ile Cys Ala Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>115
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>115
atgaccgatc gtctgaaggg caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cagtttccaa aagcgttgaa 300
gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420
atgagcagta ttgatgggtt cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>116
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>116
Met Thr Asp Arg Leu Lys Gly Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Ser
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Asp Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>117
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>117
atgaccgatc gtctgaaggg caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180
cagcacgatg catcggatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggatta cagtttccaa aagcgttgaa 300
gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360
ggcacccgtc tgggcgttca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420
atgagcagta ttgaggggtt cgtaggcgat ccgacgctgg gggcatacag cgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgcgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggtgaaccg 660
aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>118
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>118
Met Thr Asp Arg Leu Lys Gly Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Thr Val Ser
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Val Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Glu Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Ser Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>119
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>119
atgaccgatc gtctgaaggg caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180
cagcatgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgactgt cgtgaacaat gcagggattg cagtttccaa aagcgttgaa 300
gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420
atgagcagta ttgaggggtt cgtaggcgat ccgacgctgg gggcatacag cgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggtgaaccg 660
aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>120
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>120
Met Thr Asp Arg Leu Lys Gly Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Ser
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Glu Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Ser Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>121
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>121
atgaccgatc gtctgaaggg caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcgtca ctgatgttat tcgctttgtc 180
cagcacgacg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cagtttccaa aagcgttgaa 300
gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420
atgagcagta ttgaggggtt cgtaggcgat ccgacgctgg gggcatacag cgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>122
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>122
Met Thr Asp Arg Leu Lys Gly Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Val Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Ser
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Glu Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Ser Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>123
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>123
atgaccgatc gtctgaaggg caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120
gtggatgtag gtgaaaaggc cgccagatca atcggcggca ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cagtttccaa aagcgttgaa 300
gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360
ggcacccgtc tgggcattcg gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420
atgagcagta ttgaggggct cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480
ggggcggtac gcatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctgaaa 600
ggtgctgagg aaatgatgtc acagcgtacg aaaaccccta tgggccactt tggcgaaccg 660
aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>124
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>124
Met Thr Asp Arg Leu Lys Gly Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Val Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Arg Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Ser
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Arg Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Glu Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Lys Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Phe Gly Glu Pro Asn Asp Ile Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>125
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>125
atgaccgatc gtctgaaggg caaagtagcc atcgtaaccg gcgggactct gggtgttggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cagtttccaa aagcgttgaa 300
gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>126
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>126
Met Thr Asp Arg Leu Lys Gly Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Val Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Ser
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>127
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>127
atgaccgatc gtctgaaggg caaagtagcc atcgtaaccg gcggggctct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttgt tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cagtttccaa aagcgttgaa 300
gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>128
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>128
Met Thr Asp Arg Leu Lys Gly Lys Val Ala Ile Val Thr Gly Gly Ala
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Val Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Ser
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>129
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>129
atgaccgatc gtctgaaggg caaagtagcc atcgtaaccg gcggggctct gggtatcggt  60
ttggcaatcg ccgataagtt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cagtctccaa aagcgttgaa 300
gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgac ccgacgttag gggcatacaa cgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>130
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>130
Met Thr Asp Arg Leu Lys Gly Lys Val Ala Ile Val Thr Gly Gly Ala
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Ser
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>131
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>131
atgaccgatc gtctgaaggg cagagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcattcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggatta cagcttccaa aagcgttgaa 300
gacactacca cggaggaatg gcataaactg ctgtccgtta atctggatgg tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420
atgagcagta ttgaggggtt cgtaggcgat ccgacgctgg gggcatacag cgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggtgaaccg 660
aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>132
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>132
Met Thr Asp Arg Leu Lys Gly Arg Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Phe Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Thr Ala Ser
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp His Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Glu Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Ser Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>133
<211>759
<212>DNA
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>133
atgacctatc gtctgaagag caaagtagcc atcgtaaccg gcgggactct gggtatcggt  60
ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgccac 120
gcggatgtag gtgaaaaggc cgccaaatca atcggcggta ctgatgttat tcgctttgtc 180
cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240
ttcggcccgg ttacgaccgt cgtgaacaat gcagggatta ccgtttccaa aagcgttgaa 300
gacactacca cggaggaatg gcacaaacta ctgtccgtta atctggatag tgtttttttc 360
ggcacccgtc tgggcattca gcgcatgaag aataaaggct tgggcgctag catcatcaat 420
atgagcagta tcagtgggtt cgtaggcgat ccgacgctgg gggcatacac tgcttccaag 480
ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540
gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600
ggtgctgagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660
aatgacgtgg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720
gcagaatttg tggtcgacgg cgggtatacc gcacagtga                        759
<210>134
<211>252
<212>PRT
<213>人工序列
<220>
<223>克菲尔乳杆菌的变体
<400>134
Met Thr Tyr Arg Leu Lys Ser Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                 40                   45
Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                 80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Thr Val Ser
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp His Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Ser Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Ser Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Thr Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Val Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>135
<211>1041
<212>DNA
<213>人工序列
<220>
<223>来自赭色掷孢酵母的密码子优化的ADH-SB
<400>135
atgaaggcac tgcagtaccg caccatcggc gccccgcccg aggtcgtcac cgtcccggac   60
ccggagccgg gccccggcca ggtgctgttg aaggtgaccg cggccggagt ctgccactcc  120
gacatcgcgg tgatgagctg gcccgccgag ggcttcccgt acgagctgcc gctcaccctc  180
ggccacgagg gcgtcggcac cgtggccgcg ctcggcgccg gggtgacggg gctcgccgag  240
ggcgacgcgg tcgccgtgta cgggccctgg ggctgcggca cctgcgccaa gtgcgcggag  300
ggcaaggaga actactgcct gcgcgccgac gagctgggca tccgtccgcc ggggctcggg  360
cgtccggggt ccatggccga gtacctgctg atcgacgacc cccggcacct ggtcccgctg  420
gacgggctcg acccggtcgc ggcggtgccg ctcaccgacg ccggactgac gccgtaccac  480
gcgatcaagc ggtcgctgcc caagctggtc cccggctcca ccgcggtggt catcggcacc  540
ggtggtctcg gccacgtcgc catccagctg ctgcgcgccc tgacgtccgc ccgggtggtc  600
gccctggacg tcagcgagga gaagctgcgc ctcgcccgtg cggtgggcgc gcacgaggcg  660
gtgctgtcgg acgcgaaggc cgcggacgcg gtgcgcgaga tcaccggcgg tctcggtgcc  720
gaggccgtgt tcgacttcgt cggcgtggcg cccaccgtgc agaccgccgg agccgtcgcg  780
gccgtcgagg gcgatgtcac cctggtcggc atcggcggcg gatcgctgcc cgtcggcttc  840
ggcatgctgc cgttcgaggt gtcggtcaac gccccctact ggggcagccg cagcgagctg  900
accgaggtgc tgaacctggc ccgctccggt gccgtgtcgg tgcacaccga gacgtactcc  960
ctggacgacg ccccgctcgc ctacgagcgg ctgcacgagg gcagggtcaa cggccgcgcg 1020
gtgatcctgc cccacggctg a                                           1041
<210>136
<211>346
<212>PRT
<213>人工序列
<220>
<223>来自赭色掷孢酵母的ADH-SB
<400>136
Met Lys Ala Leu Gln Tyr Arg Thr Ile Gly Ala Pro Pro Glu Val Val
1               5                   10                  15
Thr Val Pro Asp Pro Glu Pro Gly Pro Gly Gln Val Leu Leu Lys Val
            20                  25                  30
Thr Ala Ala Gly Val Cys His Ser Asp Ile Ala Val Met Ser Trp Pro
        35                  40                  45
Ala Glu Gly Phe Pro Tyr Glu Leu Pro Leu Thr Leu Gly His Glu Gly
    50                  55                  60
Val Gly Thr Val Ala Ala Leu Gly Ala Gly Val Thr Gly Leu Ala Glu
65                  70                  75                  80
Gly Asp Ala Val Ala Val Tyr Gly Pro Trp Gly Cys Gly Thr Cys Ala
                85                  90                  95
Lys Cys Ala Glu Gly Lys Glu Asn Tyr Cys Leu Arg Ala Asp Glu Leu
            100                 105                 110
Gly Ile Arg Pro Pro Gly Leu Gly Arg Pro Gly Ser Met Ala Glu Tyr
        115                 120                 125
Leu Leu Ile Asp Asp Pro Arg His Leu Val Pro Leu Asp Gly Leu Asp
    130                 135                 140
Pro Val Ala Ala Val Pro Leu Thr Asp Ala Gly Leu Thr Pro Tyr His
145                 150                 155                 160
Ala Ile Lys Arg Ser Leu Pro Lys Leu Val Pro Gly Ser Thr Ala Val
                165                 170                 175
Val Ile Gly Thr Gly Gly Leu Gly His Val Ala Ile Gln Leu Leu Arg
            180                 185                 190
Ala Leu Thr Ser Ala Arg Val Val Ala Leu Asp Val Ser Glu Glu Lys
        195                 200                 205
Leu Arg Leu Ala Arg Ala Val Gly Ala His Glu Ala Val Leu Ser Asp
    210                 215                 220
Ala Lys Ala Ala Asp Ala Val Arg Glu Ile Thr Gly Gly Leu Gly Ala
225                 230                 235                 240
Glu Ala Val Phe Asp Phe Val Gly Val Ala Pro Thr Val Gln Thr Ala
                245                 250                 255
Gly Ala Val Ala Ala Val Glu Gly Asp Val Thr Leu Val Gly Ile Gly
            260                 265                 270
Gly Gly Ser Leu Pro Val Gly Phe Gly Met Leu Pro Phe Glu Val Ser
        275                 280                 285
Val Asn Ala Pro Tyr Trp Gly Ser Arg Ser Glu Leu Thr Glu Val Leu
    290                 295                 300
Asn Leu Ala Arg Ser Gly Ala Val Ser Val His Thr Glu Thr Tyr Ser
305                 310                 315                 320
Leu Asp Asp Ala Pro Leu Ala Tyr Glu Arg Leu His Glu Gly Arg Val
                325                 330                 335
Asn Gly Arg Ala Val Ile Leu Pro His Gly
            340                 345
<210>137
<211>1032
<212>DNA
<213>人工序列
<220>
<223>来自天蓝色链霉菌的密码子优化的ADH-SC
<400>137
atggcaaaga tcgacaacgc agttctgccg gagggttctc tggtgctggt caccggcgcg   60
aacggctttg tcgctagcca tgtggtcgaa caactgctgg aacacggcta taaggtgcgc  120
ggcactgctc gctctgcctc caaactggcg aacctgcaga aacgttggga cgccaaatac  180
cctggtcgtt tcgagactgc cgttgttgaa gacatgctga agcagggtgc atatgatgaa  240
gttattaaag gcgcggcagg tgtcgcccac atcgcgtccg tggtcagctt ttctaacaaa  300
tatgatgagg tggtaactcc tgcgatcggt ggcacgctga atgccctgcg tgccgcagct  360
gctacgcctt ccgtgaaacg ttttgtgctg accagcagca ctgtttctgc actgattcca  420
aaacctaacg tcgaaggtat ttatctggat gagaagagct ggaacctgga aagcattgat  480
aaggctaaaa ccctgcctga atctgatccg cagaaaagcc tgtgggtcta cgccgcaagc  540
aaaacggaag cggaactggc tgcctggaaa ttcatggacg aaaacaaacc gcactttact  600
ctgaatgccg ttctgccaaa ctacactatc ggtaccattt ttgacccaga aacccaatcc  660
ggttccactt ccggctggat gatgtctctg ttcaatggcg aagtatctcc ggcactggcg  720
ctgatgccgc cgcagtacta tgtctctgca gttgatatcg gtctgctgca cctgggttgt  780
ctggttctgc cgcaaatcga acgccgtcgt gtttacggca ccgcaggcac ctttgattgg  840
aacaccgttc tggcgacctt ccgtaaactg tatccgtcca agacgttccc ggctgacttt  900
ccggatcagg gccaggatct gtccaaattt gataccgccc cgagcctgga gattctgaaa  960
tccctgggcc gccctggctg gcgtagcatc gaggaatcta tcaaagatct ggtgggttcc 1020
gagaccgcct aa                                                     1032
<210>138
<211>343
<212>PRT
<213>人工序列
<220>
<223>来自天蓝色链霉菌的ADH-SC
<400>138
Met Ala Lys Ile Asp Asn Ala Val Leu Pro Glu Gly Ser Leu Val Leu
1               5                   10                  15
Val Thr Gly Ala Asn Gly Phe Val Ala Ser His Val Val Glu Gln Leu
            20                  25                  30
Leu Glu His Gly Tyr Lys Val Arg Gly Thr Ala Arg Ser Ala Ser Lys
        35                  40                  45
Leu Ala Asn Leu Gln Lys Arg Trp Asp Ala Lys Tyr Pro Gly Arg Phe
    50                  55                  60
Glu Thr Ala Val Val Glu Asp Met Leu Lys Gln Gly Ala Tyr Asp Glu
65                  70                  75                  80
Val Ile Lys Gly Ala Ala Gly Val Ala His Ile Ala Ser Val Val Ser
                85                  90                  95
Phe Ser Asn Lys Tyr Asp Glu Val Val Thr Pro Ala Ile Gly Gly Thr
            100                 105                 110
Leu Asn Ala Leu Arg Ala Ala Ala Ala Thr Pro Ser Val Lys Arg Phe
        115                 120                 125
Val Leu Thr Ser Ser Thr Val Ser Ala Leu Ile Pro Lys Pro Asn Val
    130                 135                 140
Glu Gly Ile Tyr Leu Asp Glu Lys Ser Trp Asn Leu Glu Ser Ile Asp
145                 150                 155                 160
Lys Ala Lys Thr Leu Pro Glu Ser Asp Pro Gln Lys Ser Leu Trp Val
                165                 170                 175
Tyr Ala Ala Ser Lys Thr Glu Ala Glu Leu Ala Ala Trp Lys Phe Met
            180                 185                 190
Asp Glu Asn Lys Pro His Phe Thr Leu Asn Ala Val Leu Pro Asn Tyr
        195                 200                 205
Thr Ile Gly Thr Ile Phe Asp Pro Glu Thr Gln Ser Gly Ser Thr Ser
    210                 215                 220
Gly Trp Met Met Ser Leu Phe Asn Gly Glu Val Ser Pro Ala Leu Ala
225                 230                 235                 240
Leu Met Pro Pro Gln Tyr Tyr Val Ser Ala Val Asp Ile Gly Leu Leu
                245                 250                 255
His Leu Gly Cys Leu Val Leu Pro Gln Ile Glu Arg Arg Arg Val Tyr
            260                 265                 270
Gly Thr Ala Gly Thr Phe Asp Trp Asn Thr Val Leu Ala Thr Phe Arg
        275                 280                 285
Lys Leu Tyr Pro Ser Lys Thr Phe Pro Ala Asp Phe Pro Asp Gln Gly
    290                 295                 300
Gln Asp Leu Ser Lys Phe Asp Thr Ala Pro Ser Leu Glu Ile Leu Lys
305                 310                 315                 320
Ser Leu Gly Arg Pro Gly Trp Arg Ser Ile Glu Glu Ser Ile Lys Asp
                325                 330                 335
Leu Val Gly Ser Glu Thr Ala
            340
<210>139
<211>1056
<212>DNA
<213>人工序列
<220>
<223>来自布氏热厌氧菌的密码子优化的ADH-TB
<400>139
atgaaaggct tcgccatgct gagcatcggc aaagtgggtt ggattgaaaa agaaaaaccg   60
gcgccaggcc cgttcgatgc aattgtgcgc cctctggcag tagcgccgtg taccagcgat  120
attcatactg tgtttgaagg tgccattggc gagcgtcaca atatgattct gggccatgaa  180
gccgttggtg aagttgttga ggttggcagc gaagtgaagg atttcaaacc gggcgatcgc  240
gttgtcgttc cagcgattac cccggattgg cgcaccagcg aagtccagcg cggctaccat  300
cagcactctg gcggcatgct ggccggctgg aaattcagca atgtaaagga tggtgtgttc  360
ggtgaatttt ttcacgttaa cgacgcagac atgaatctgg cgcacctgcc gaaagaaatc  420
ccgctggaag cagcggttat gattccggat atgatgacca cgggttttca cggcgcagag  480
ctggcggaca ttgaactggg cgctacggta gccgtactgg gcatcggtcc ggtgggcctg  540
atggcagttg caggcgctaa gctgcgcggc gcaggtcgta ttattgccgt tggttctcgc  600
ccggtgtgtg tggacgccgc taagtattat ggtgcaacgg acattgtcaa ttacaaggac  660
ggcccaattg aatctcagat catgaacctg acggaaggta aaggcgttga cgccgcgatt  720
atcgctggcg gcaacgccga catcatggcg accgcagtta aaatcgtcaa gccaggtggt  780
actattgcta acgtcaacta cttcggcgaa ggtgaggtcc tgcctgtccc acgtctggaa  840
tggggttgcg gtatggcaca taaaaccatt aaaggtggcc tgtgcccagg cggccgtctg  900
cgtatggaac gcctgatcga tctggtcttc tacaaacgcg tggatcctag caaactggtg  960
actcacgttt tccgcggctt tgataacatc gaaaaagctt ttatgctgat gaaagataaa 1020
ccgaaagatc tgattaaacc ggttgtcatc ctggct                           1056
<210>140
<211>352
<212>PRT
<213>人工序列
<220>
<223>来自布氏热厌氧菌的ADH-TB
<400>140
Met Lys Gly Phe Ala Met Leu Ser Ile Gly Lys Val Gly Trp Ile Glu
1               5                   10                  15
Lys Glu Lys Pro Ala Pro Gly Pro Phe Asp Ala Ile Val Arg Pro Leu
            20                  25                  30
Ala Val Ala Pro Cys Thr Ser Asp Ile His Thr Val Phe Glu Gly Ala
        35                  40                  45
Ile Gly Glu Arg His Asn Met Ile Leu Gly His Glu Ala Val Gly Glu
    50                  55                  60
Val Val Glu Val Gly Ser Glu Val Lys Asp Phe Lys Pro Gly Asp Arg
65                  70                  75                  80
Val Val Val Pro Ala Ile Thr Pro Asp Trp Arg Thr Ser Glu Val Gln
                85                  90                  95
Arg Gly Tyr His Gln His Ser Gly Gly Met Leu Ala Gly Trp Lys Phe
            100                 105                 110
Ser Asn Val Lys Asp Gly Val Phe Gly Glu Phe Phe His Val Asn Asp
        115                 120                 125
Ala Asp Met Asn Leu Ala His Leu Pro Lys Glu Ile Pro Leu Glu Ala
    130                 135                 140
Ala Val Met Ile Pro Asp Met Met Thr Thr Gly Phe His Gly Ala Glu
145                 150                 155                 160
Leu Ala Asp Ile Glu Leu Gly Ala Thr Val Ala Val Leu Gly Ile Gly
                165                 170                 175
Pro Val Gly Leu Met Ala Val Ala Gly Ala Lys Leu Arg Gly Ala Gly
            180                 185                 190
Arg Ile Ile Ala Val Gly Ser Arg Pro Val Cys Val Asp Ala Ala Lys
        195                 200                 205
Tyr Tyr Gly Ala Thr Asp Ile Val Asn Tyr Lys Asp Gly Pro Ile Glu
    210                 215                 220
Ser Gln Ile Met Asn Leu Thr Glu Gly Lys Gly Val Asp Ala Ala Ile
225                 230                 235                 240
Ile Ala Gly Gly Asn Ala Asp Ile Met Ala Thr Ala Val Lys Ile Val
                245                 250                 255
Lys Pro Gly Gly Thr Ile Ala Asn Val Asn Tyr Phe Gly Glu Gly Glu
            260                 265                 270
Val Leu Pro Val Pro Arg Leu Glu Trp Gly Cys Gly Met Ala His Lys
        275                 280                 285
Thr Ile Lys Gly Gly Leu Cys Pro Gly Gly Arg Leu Arg Met Glu Arg
    290                 295                 300
Leu Ile Asp Leu Val Phe Tyr Lys Arg Val Asp Pro Ser Lys Leu Val
305                 310                 315                 320
Thr His Val Phe Arg Gly Phe Asp Asn Ile Glu Lys Ala Phe Met Leu
                325                 330                 335
Met Lys Asp Lys Pro Lys Asp Leu Ile Lys Pro Val Val Ile Leu Ala
            340                 345                 350
<210>141
<211>759
<212>DNA
<213>稍小乳杆菌
<400>141
atgaccgatc ggttgaaggg gaaagtagca attgtaactg gcggtacctt gggaattggc   60
ttggcaatcg ctgataagtt tgttgaagaa ggcgcaaagg ttgttattac cggccgtcac  120
gctgatgtag gtgaaaaagc tgccagatca atcggcggca cagacgttat ccgttttgtc    180
caacacgatg cttctgatga aaccggctgg actaagttgt ttgatacgac tgaagaagca    240
tttggcccag ttaccacggt tgtcaacaat gccggaattg cggtcagcaa gagtgttgaa    300
gataccacaa ctgaagaatg gcgcaagctg ctctcagtta acttggatgg tgtcttcttc    360
ggtacccgtc ttggaatcca acgtatgaag aataaaggac tcggagcatc aatcatcaat    420
atgtcatcta tcgaaggttt tgttggtgat ccagctctgg gtgcatacaa cgcttcaaaa    480
ggtgctgtca gaattatgtc taaatcagct gccttggatt gcgctttgaa ggactacgat    540
gttcgggtta acactgttca tccaggttat atcaagacac cattggttga cgatcttgaa    600
ggggcagaag aaatgatgtc acagcggacc aagacaccaa tgggtcatat cggtgaacct    660
aacgatatcg cttggatctg tgtttacctg gcatctgacg aatctaaatt tgccactggt    720
gcagaattcg ttgtcgacgg agggtacacc gcccaatag                           759
<210>142
<211>252
<212>PRT
<213>稍小乳杆菌
<400>142
Met Thr Asp Arg Leu Lys Gly Lys Val Ala Ile Val Thr Gly Gly Thr
1               5                   10                  15
Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala
        35                  40                  45
Arg Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala
    50                  55                  60
Ser Asp Glu Thr Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Ser
                85                  90                  95
Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser
            100                 105                 110
Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Glu Gly Phe Val Gly Asp Pro Ala Leu Gly Ala Tyr Asn Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu
                165                 170                 175
Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys
            180                 185                 190
Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln
        195                 200                 205
Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala
    210                 215                 220
Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>143
<211>252
<212>PRT
<213>人工序列
<220>
<223>具有稍小乳杆菌骨架的工程酮还原酶序列式
<223>合成构建体
<220>特征
<221>MISC_FEATURE
<222>(3)..(3)
<223>Xaa是极性、酸性或芳族残基
<220>特征
<221>MISC_FEATURE
<222>(7)..(7)
<223>Xaa是极性、非极性或限制残基
<220>特征
<221>MISC_FEATURE
<222>(11)..(11)
<223>Xaa是脂肪族、非极性或极性残基
<220>特征
<221>MISC_FEATURE
<222>(16)..(16)
<223>Xaa是脂肪族或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(19)..(19)
<223>Xaa是非极性或脂肪族残基
<220>特征
<221>MISC_FEATURE
<222>(23)..(23)
<223>Xaa是非极性或芳族残基
<220>特征
<221>MISC_FEATURE
<222>(41)..(41)
<223>Xaa是脂肪族、极性或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(45)..(45)
<223>Xaa是脂肪族、非极性或极性残基
<220>特征
<221>MISC_FEATURE
<222>(49)..(49)
<223>Xaa是碱性残基
<220>特征
<221>MISC_FEATURE
<222>(57)..(57)
<223>Xaa是脂肪族或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(60)..(60)
<223>Xaa是芳族、脂肪族、极性或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(64)..(64)
<223>Xaa是脂肪族或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(72)..(72)
<223>Xaa是碱性残基
<220>特征
<221>MISC_FEATURE
<222>(82)..(82)
<223>Xaa是极性或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(94)..(94)
<223>Xaa是极性、非极性、碱性或脂肪族残基
<220>特征
<221>MISC_FEATURE
<222>(95)..(95)
<223>Xaa是非极性或脂肪族残基
<220>特征
<221>MISC_FEATURE
<222>(96)..(96)
<223>Xaa是限制、脂肪族、酸性、极性或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(97)..(97)
<223>Xaa是酸性、碱性或脂肪族残基
<220>特征
<221>MISC_FEATURE
<222>(106)..(106)
<223>Xaa是酸性残基
<220>特征
<221>MISC_FEATURE
<222>(108)..(108)
<223>Xaa是碱性、限制或芳族残基
<220>特征
<221>MISC_FEATURE
<222>(111)..(111)
<223>Xaa是脂肪族或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(117)..(117)
<223>Xaa是极性或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(126)..(126)
<223>Xaa是脂肪族或非极性残基\
<220>特征
<221>MISC_FEATURE
<222>(127)..(127)
<223>Xaa是极性或碱性残基
<220>特征
<221>MISC_FEATURE
<222>(145)..(145)
<223>Xaa是极性残基
<220>特征
<221>MISC_FEATURE
<222>(147)..(147)
<223>Xaa是芳族、脂肪族、极性或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(152)..(152)
<223>Xaa是极性、脂肪族或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(157)..(157)
<223>Xaa是极性或酸性残基
<220>特征
<221>MISC_FEATURE
<222>(163)..(163)
<223>Xaa是脂肪族或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(173)..(173)
<223>Xaa是酸性或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(177)..(177)
<223>Xaa是碱性残基
<220>特征
<221>MISC_FEATURE
<222>(192)..(192)
<223>Xaa是碱性或酸性残基
<220>特征
<221>MISC_FEATURE
<222>(194)..(194)
<223>Xaa是限制、酸性、脂肪族、极性或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(198)..(198)
<223>Xaa是酸性或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(200)..(200)
<223>Xaa是限制、酸性或碱性残基
<220>特征
<221>MISC_FEATURE
<222>(206)..(206)
<223>Xaa是极性或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(208)..(208)
<223>Xaa是极性、限制或碱性残基
<220>特征
<221>MISC_FEATURE
<222>(210)..(210)
<223>Xaa是脂肪族、极性或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(211)..(211)
<223>Xaa是碱性或酸性残基
<220>特征
<221>MISC_FEATURE
<222>(214)..(214)
<223>Xaa是非极性、脂肪族或极性残基
<220>特征
<221>MISC_FEATURE
<222>(217)..(217)
<223>Xaa是芳族、脂肪族或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(223)..(223)
<223>Xaa是脂肪族或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(226)..(226)
<223>Xaa是非极性或脂肪族残基
<220>特征
<221>MISC_FEATURE
<222>(228)..(228)
<223>Xaa是非极性或脂肪族残基
<400>143
Met Thr Xaa Arg Leu Lys Xaa Lys Val Ala Xaa Val Thr Gly Gly Xaa
1               5                   10                  15
Leu Gly Xaa Gly Leu Ala Xaa Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Xaa Asp Val Gly Xaa Lys Ala Ala
        35                  40                  45
Xaa Ser Ile Gly Gly Thr Asp Val Xaa Arg Phe Xaa Gln His Asp Xaa
    50                  55                  60
Ser Asp Glu Thr Gly Trp Thr Xaa Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Xaa Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Xaa Xaa Xaa
                85                  90                  95
Xaa Ser Val Glu Asp Thr Thr Thr Glu Xaa Trp Xaa Lys Leu Xaa Ser
            100                 105                 110
Val Asn Leu Asp Xaa Val Phe Phe Gly Thr Arg Leu Gly Xaa Xaa Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Xaa Gly Xaa Val Gly Asp Pro Xaa Leu Gly Ala Tyr Xaa Ala Ser Lys
145                 150                 155                 160
Gly Ala Xaa Arg Ile Met Ser Lys Ser Ala Ala Leu Xaa Cys Ala Leu
                165                 170                 175
Xaa Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Xaa
            180                 185                 190
Thr Xaa Leu Val Asp Xaa Leu Xaa Gly Ala Glu Glu Met Xaa Ser Xaa
        195                 200                 205
Arg Xaa Xaa Thr Pro Xaa Gly His Xaa Gly Glu Pro Asn Asp Xaa Ala
    210                 215                 220
Trp Xaa Cys Xaa Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>144
<211>252
<212>PRT
<213>人工序列
<220>
<223>具有短乳杆菌骨架的工程酮还原酶序列式
<223>合成构建体
<220>特征
<221>MISC_FEATURE
<222>(3)..(3)
<223>Xaa是极性、酸性或芳族残基
<220>特征
<221>MISC_FEATURE
<222>(7)..(7)
<223>Xaa是极性、非极性或限制残基
<220>特征
<221>MISC_FEATURE
<222>(11)..(11)
<223>Xaa是脂肪族、非极性或极性残基
<220>特征
<221>MISC_FEATURE
<222>(16)..(16)
<223>Xaa是脂肪族或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(19)..(19)
<223>Xaa是非极性或脂肪族残基
<220>特征
<221>MISC_FEATURE
<222>(23)..(23)
<223>Xaa是非极性或芳族残基
<220>特征
<221>MISC_FEATURE
<222>(41)..(41)
<223>Xaa是脂肪族、极性或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(45)..(45)
<223>Xaa是脂肪族、非极性或极性残基
<220>特征
<221>MISC_FEATURE
<222>(49)..(49)
<223>Xaa是碱性残基
<220>特征
<221>MISC_FEATURE
<222>(57)..(57)
<223>Xaa是脂肪族或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(60)..(60)
<223>Xaa是芳族、脂肪族、极性或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(64)..(64)
<223>Xaa是脂肪族或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(72)..(72)
<223>Xaa是碱性残基
<220>特征
<221>MISC_FEATURE
<222>(82)..(82)
<223>Xaa是极性或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(94)..(94)
<223>Xaa是极性、非极性、碱性或脂肪族残基
<220>特征
<221>MISC_FEATURE
<222>(95)..(95)
<223>Xaa是非极性或脂肪族残基
<220>特征
<221>MISC_FEATURE
<222>(96)..(96)
<223>Xaa是限制、脂肪族、酸性、极性或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(97)..(97)
<223>Xaa是酸性、碱性或脂肪族残基
<220>特征
<221>MISC_FEATURE
<222>(106)..(106)
<223>Xaa是酸性残基
<220>特征
<221>MISC_FEATURE
<222>(108)..(108)
<223>Xaa是碱性、限制或芳族残基
<220>特征
<221>MISC_FEATURE
<222>(111)..(111)
<223>Xaa是脂肪族或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(117)..(117)
<223>Xaa是极性或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(126)..(126)
<223>Xaa是脂肪族或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(127)..(127)
<223>Xaa是极性或碱性残基
<220>特征
<221>MISC_FEATURE
<222>(145)..(145)
<223>Xaa是极性残基
<220>特征
<221>MISC_FEATURE
<222>(147)..(147)
<223>Xaa是芳族、脂肪族、极性或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(152)..(152)
<223>Xaa是极性、脂肪族或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(157)..(157)
<223>Xaa是极性或酸性残基
<220>特征
<221>MISC_FEATURE
<222>(163)..(163)
<223>Xaa是脂肪族或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(173)..(173)
<223>Xaa是酸性或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(177)..(177)
<223>Xaa是碱性残基
<220>特征
<221>MISC_FEATURE
<222>(192)..(192)
<223>Xaa是碱性或酸性残基
<220>特征
<221>MISC_FEATURE
<222>(194)..(194)
<223>Xaa是限制、酸性、脂肪族、极性或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(198)..(198)
<223>Xaa是酸性或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(200)..(200)
<223>Xaa是限制、酸性或碱性残基
<220>特征
<221>MISC_FEATURE
<222>(206)..(206)
<223>Xaa是极性或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(208)..(208)
<223>Xaa是极性、限制或碱性残基
<220>特征
<221>MISC_FEATURE
<222>(210)..(210)
<223>Xaa是脂肪族、极性或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(211)..(211)
<223>Xaa是碱性或酸性残基
<220>特征
<221>MISC_FEATURE
<222>(214)..(214)
<223>Xaa是非极性、脂肪族或极性残基
<220>特征
<221>MISC_FEATURE
<222>(217)..(217)
<223>Xaa是芳族、脂肪族或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(223)..(223)
<223>Xaa是脂肪族或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(226)..(226)
<223>Xaa是非极性或脂肪族残基
<220>特征
<221>MISC_FEATURE
<222>(228)..(228)
<223>Xaa是非极性或脂肪族残基
<400>144
Met Ser Xaa Arg Leu Asp Xaa Lys Val Ala Xaa Ile Thr Gly Gly Xaa
1               5                   10                  15
Leu Gly Xaa Gly Leu Ala Xaa Ala Thr Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Met Ile Thr Gly Arg His Xaa Asp Val Gly Xaa Lys Ala Ala
        35                  40                  45
Xaa Ser Val Gly Thr Pro Asp Gln Xaa Gln Phe Xaa Gln His Asp Xaa
    50                  55                  60
Ser Asp Glu Asp Gly Trp Thr Xaa Leu Phe Asp Ala Thr Glu Lys Ala
65                  70                  75                  80
Phe Xaa Pro Val Ser Thr Leu Val Asn Asn Ala Gly Ile Xaa Xaa Xaa
                85                  90                  95
Xaa Ser Val Glu Glu Thr Thr Thr Ala Xaa Trp Xaa Lys Leu Xaa Ala
            100                 105                 110
Val Asn Leu Asp Xaa Val Phe Phe Gly Thr Arg Leu Gly Xaa Xaa Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Xaa Gly Xaa Val Gly Asp Pro Xaa Leu Gly Ala Tyr Xaa Ala Ser Lys
145                 150                 155                 160
Gly Ala Xaa Arg Ile Met Ser Lys Ser Ala Ala Leu Xaa Cys Ala Leu
                165                 170                 175
Xaa Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Xaa
            180                 185                 190
Thr Xaa Leu Val Asp Xaa Leu Xaa Gly Ala Glu Glu Ala Xaa Ser Xaa
        195                 200                 205
Arg Xaa Xaa Thr Pro Xaa Gly His Xaa Gly Glu Pro Asn Asp Xaa Ala
    210                 215                 220
Tyr Xaa Cys Xaa Tyr Leu Ala Ser Asn Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ser Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>145
<211>252
<212>PRT
<213>人工序列
<220>
<223>具有克菲尔乳杆菌骨架的工程酮还原酶序列式
<223>合成构建体
<220>特征
<221>MISC_FEATURE
<222>(3)..(3)
<223>Xaa是极性、酸性或芳族残基
<220>特征
<221>MISC_FEATURE
<222>(7)..(7)
<223>Xaa是极性、非极性或限制残基
<220>特征
<221>MISC_FEATURE
<222>(11)..(11)
<223>Xaa是脂肪族、非极性或极性残基
<220>特征
<221>MISC_FEATURE
<222>(16)..(16)
<223>Xaa是脂肪族或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(19)..(19)
<223>Xaa是非极性或脂肪族残基
<220>特征
<221>MISC_FEATURE
<222>(23)..(23)
<223>Xaa是非极性或芳族残基
<220>
<221>MISC_FEATURE
<222>(41)..(41)
<223>Xaa是脂肪族、极性或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(45)..(45)
<223>Xaa是脂肪族、非极性或极性残基
<220>特征
<221>MISC_FEATURE
<222>(49)..(49)
<223>Xaa是碱性残基
<220>特征
<221>MISC_FEATURE
<222>(57)..(57)
<223>Xaa是脂肪族或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(60)..(60)
<223>Xaa是芳族、脂肪族、极性或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(64)..(64)
<223>Xaa是脂肪族或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(72)..(72)
<223>Xaa是碱性残基
<220>特征
<221>MISC_FEATURE
<222>(82)..(82)
<223>Xaa是极性或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(94)..(94)
<223>Xaa是极性、非极性、碱性或脂肪族残基
<220>特征
<221>MISC_FEATURE
<222>(95)..(95)
<223>Xaa是非极性或脂肪族残基
<220>特征
<221>MISC_FEATURE
<222>(96)..(96)
<223>Xaa是限制、脂肪族、酸性、极性或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(97)..(97)
<223>Xaa是酸性、碱性或脂肪族残基
<220>特征
<221>MISC_FEATURE
<222>(106)..(106)
<223>Xaa是酸性残基
<220>特征
<221>MISC_FEATURE
<222>(108)..(108)
<223>Xaa是碱性、限制或芳族残基
<220>特征
<221>MISC_FEATURE
<222>(111)..(111)
<223>Xaa是脂肪族或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(117)..(117)
<223>Xaa是极性或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(126)..(126)
<223>Xaa是脂肪族或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(127)..(127)
<223>Xaa是极性或碱性残基
<220>特征
<221>MISC_FEATURE
<222>(145)..(145)
<223>Xaa是极性残基
<220>特征
<221>MISC_FEATURE
<222>(147)..(147)
<223>Xaa是芳族、脂肪族、极性或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(152)..(152)
<223>Xaa是极性、脂肪族或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(157)..(157)
<223>Xaa是极性或酸性残基
<220>特征
<221>MISC_FEATURE
<222>(163)..(163)
<223>Xaa是脂肪族或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(173)..(173)
<223>Xaa是酸性或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(177)..(177)
<223>Xaa是碱性残基
<220>特征
<221>MISC_FEATURE
<222>(192)..(192)
<223>Xaa是碱性或酸性残基
<220>特征
<221>MISC_FEATURE
<222>(194)..(194)
<223>Xaa是限制、酸性、脂肪族、极性或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(198)..(198)
<223>Xaa是酸性或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(200)..(200)
<223>Xaa是限制、酸性或碱性残基
<220>特征
<221>MISC_FEATURE
<222>(206)..(206)
<223>Xaa是极性或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(208)..(208)
<223>Xaa是极性、限制或碱性残基
<220>特征
<221>MISC_FEATURE
<222>(210)..(210)
<223>Xaa是脂肪族、极性或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(211)..(211)
<223>Xaa是碱性或酸性残基
<220>特征
<221>MISC_FEATURE
<222>(214)..(214)
<223>Xaa是非极性、脂肪族或极性残基
<220>特征
<221>MISC_FEATURE
<222>(217)..(217)
<223>Xaa是芳族,脂肪族或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(223)..(223)
<223>Xaa是脂肪族或非极性残基
<220>特征
<221>MISC_FEATURE
<222>(226)..(226)
<223>Xaa是非极性或脂肪族残基
<220>特征
<221>MISC_FEATURE
<222>(228)..(228)
<223>Xaa是非极性或脂肪族残基
<400>145
Met Thr Xaa Arg Leu Lys Xaa Lys Val Ala Xaa Val Thr Gly Gly Xaa
1               5                   10                  15
Leu Gly Xaa Gly Leu Ala Xaa Ala Asp Lys Phe Val Glu Glu Gly Ala
            20                  25                  30
Lys Val Val Ile Thr Gly Arg His Xaa Asp Val Gly Xaa Lys Ala Ala
        35                  40                  45
Xaa Ser Ile Gly Gly Thr Asp Val Xaa Arg Phe Xaa Gln His Asp Xaa
    50                  55                  60
Ser Asp Glu Ala Gly Trp Thr Xaa Leu Phe Asp Thr Thr Glu Glu Ala
65                  70                  75                  80
Phe Xaa Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Xaa Xaa Xaa
                85                  90                  95
Xaa Ser Val Glu Asp Thr Thr Thr Glu Xaa Trp Xaa Lys Leu Xaa Ser
            100                 105                 110
Val Asn Leu Asp Xaa Val Phe Phe Gly Thr Arg Leu Gly Xaa Xaa Arg
        115                 120                 125
Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile
    130                 135                 140
Xaa Gly Xaa Val Gly Asp Pro Xaa Leu Gly Ala Tyr Xaa Ala Ser Lys
145                 150                 155                 160
Gly Ala Xaa Arg Ile Met Ser Lys Ser Ala Ala Leu Xaa Cys Ala Leu
                165                 170                 175
Xaa Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Xaa
            180                 185                 190
Thr Xaa Leu Val Asp Xaa Leu Xaa Gly Ala Glu Glu Met Xaa Ser Xaa
        195                 200                 205
Arg Xaa Xaa Thr Pro Xaa Gly His Xaa Gly Glu Pro Asn Asp Xaa Ala
    210                 215                 220
Trp Xaa Cys Xaa Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly
225                 230                 235                 240
Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln
                245                 250
<210>146
<211>939
<212>DNA
<213>人工序列
<220>
<223>来自酿酒酵母的YDL ADH
<400>146
atgtcttttc accaacagtt tttcacgctg aacaacggca ataaaatccc ggcgattgcc  60
atcatcggca ctggtacacg ttggtataaa aatgaagaaa ctgacgcgac cttctccaat 120
agtctggttg aacaaatcgt gtatgcgttg aaactgccgg ggattatcca catcgacgcc 180
gcggagattt atcgcaccta cccggaagtg ggtaaagcac tgtccctgac cgaaaagcct 240
cgtaacgcga tttttctgac ggataaatat tctccgcaga ttaaaatgag tgactcccct 300
gcggacggtc tggatttagc attgaagaaa atgggtacag attatgttga tttatatctg 360
ttacattccc cgtttgtttc gaaggaagtg aatggcttaa gcttagaaga ggcttggaaa 420
gatatggagc agttatacaa aagtggtaaa gctaaaaaca tcggggtttc caatttcgca 480
gtggaagacc tgcaacgtat cctgaaagtc gctgaagtta aacctcaggt caaccagatt 540
gagttctctc cgttcctgca aaaccaaaca ccaggcattt ataaattctg tcaggagcac 600
gatatcctgg tggaagcata ttctccgctg ggcccgctgc agaagaaaac cgcgcaggat 660
gacagccaac cattttttga gtacgtcaaa gaattgagcg aaaaatacat caaatccgag 720
gcccagatca tcctgcgctg ggtcactaaa cgcggtgtgc tgccagttac cacctcttca 780
aagcctcagc gcattagcga tgctcagaac ctgttttcct tcgacctgac agcggaagag 840
gttgataaaa tcacggagct gggtctggaa catgaaccgc tgcgcctgta ctggaataaa 900
ttgtatggca aatataacta cgccgcccag aaagtgtaa                        939
<210>147
<211>312
<212>PRT
<213>人工序列
<220>
<223>来自酿酒酵母的YDL ADH
<400>147
Met Ser Phe His Gln Gln Phe Phe Thr Leu Asn Asn Gly Asn Lys Ile
1               5                   10                  15
Pro Ala Ile Ala Ile Ile Gly Thr Gly Thr Arg Trp Tyr Lys Asn Glu
            20                  25                  30
Glu Thr Asp Ala Thr Phe Ser Asn Ser Leu Val Glu Gln Ile Val Tyr
        35                  40                  45
Ala Leu Lys Leu Pro Gly Ile Ile His Ile Asp Ala Ala Glu Ile Tyr
    50                  55                  60
Arg Thr Tyr Pro Glu Val Gly Lys Ala Leu Ser Leu Thr Glu Lys Pro
65                  70                  75                  80
Arg Asn Ala Ile Phe Leu Thr Asp Lys Tyr Ser Pro Gln Ile Lys Met
                85                  90                  95
Ser Asp Ser Pro Ala Asp Gly Leu Asp Leu Ala Leu Lys Lys Met Gly
            100                 105                 110
Thr Asp Tyr Val Asp Leu Tyr Leu Leu His Ser Pro Phe Val Ser Lys
        115                 120                 125
Glu Val Asn Gly Leu Ser Leu Glu Glu Ala Trp Lys Asp Met Glu Gln
    130                 135                 140
Leu Tyr Lys Ser Gly Lys Ala Lys Asn Ile Gly Val Ser Asn Phe Ala
145                 150                 155                 160
Val Glu Asp Leu Gln Arg Ile Leu Lys Val Ala Glu Val Lys Pro Gln
                165                 170                 175
Val Asn Gln Ile Glu Phe Ser Pro Phe Leu Gln Asn Gln Thr Pro Gly
            180                 185                 190
Ile Tyr Lys Phe Cys Gln Glu His Asp Ile Leu Val Glu Ala Tyr Ser
        195                 200                 205
Pro Leu Gly Pro Leu Gln Lys Lys Thr Ala Gln Asp Asp Ser Gln Pro
    210                 215                 220
Phe Phe Glu Tyr Val Lys Glu Leu Ser Glu Lys Tyr Ile Lys Ser Glu
225                 230                 235                 240
Ala Gln Ile Ile Leu Arg Trp Val Thr Lys Arg Gly Val Leu Pro Val
                245                 250                 255
Thr Thr Ser Ser Lys Pro Gln Arg Ile Ser Asp Ala Gln Asn Leu Phe
            260                 265                 270
Ser Phe Asp Leu Thr Ala Glu Glu Val Asp Lys Ile Thr Glu Leu Gly
        275                 280                 285
Leu Glu His Glu Pro Leu Arg Leu Tyr Trp Asn Lys Leu Tyr Gly Lys
    290                 295                 300
Tyr Asn Tyr Ala Ala Gln Lys Val
305                 310
<210>148
<211>1047
<212>DNA
<213>人工序列
<220>
<223>来自红平红球菌的ADH
<400>148
atgaaagcca ttcagtacac tcgtatcggt gcggaaccag aactgactga aatcccgaag   60
ccggaaccgg gcccgggcga agtactgctg gaagtcacgg cagctggcgt gtgccattcc  120
gatgatttca ttatgtctct gccggaagaa cagtacacct acggcctgcc gctgaccctg  180
ggtcatgaag gtgctggtaa agttgccgca gttggcgaag gtgttgaagg gttggatatt  240
ggcaccaatg tggttgtgta cggcccatgg ggttgtggca actgttggca ttgcagtcag  300
ggcctggaga actattgctc ccgtgcgcag gaactgggta ttaacccgcc tggtctgggt  360
gctccggggg ctttggcaga atttatgatt gtcgactcac cacgtcattt ggtcccgatt  420
ggcgatttag accctgttaa aactgttccg ttgactgatg cgggcctgac cccataccat  480
gcaatcaaac gctccctgcc gaaactgcgc ggcggctctt atgcagtagt gatcggtacg  540
ggtggcctgg gccacgtggc tatccaactg ctgcgtcatt tatctgctgc aacggtgatc  600
gccttggacg tttctgccga taaactggaa ctggctacca aagtcggcgc acatgaagta  660
gtcctgtctg ataaagatgc agcggagaat gtgcgtaaaa ttactggtag ccaaggtgca  720
gctttggtgt tggattttgt gggctatcag cctaccattg acaccgccat ggcagtggcg  780
ggcgtgggct ctgacgtcac cattgttggt atcggtgatg gccaggcaca tgcgaaagtt  840
ggtttcttcc agagtcctta tgaggcatcg gttacggtac cttattgggg cgctcgtaat  900
gaactgatcg aattgatcga tctggcgcat gctggtattt tcgacattgc cgttgagacc  960
ttctctttgg ataatggtgc agaggcctat cgtcgcctgg ctgcgggcac actgtcaggc 1020
cgtgcggtag tcgtcccggg cctgtaa                                     1047
<210>149
<211>348
<212>PRT
<213>人工序列
<220>
<223>来自红平红球菌的ADH
<400>149
Met Lys Ala Ile Gln Tyr Thr Arg Ile Gly Ala Glu Pro Glu Leu Thr
1               5                   10                  15
Glu Ile Pro Lys Pro Glu Pro Gly Pro Gly Glu Val Leu Leu Glu Val
            20                  25                  30
Thr Ala Ala Gly Val Cys His Ser Asp Asp Phe Ile Met Ser Leu Pro
        35                  40                  45
Glu Glu Gln Tyr Thr Tyr Gly Leu Pro Leu Thr Leu Gly His Glu Gly
    50                  55                  60
Ala Gly Lys Val Ala Ala Val Gly Glu Gly Val Glu Gly Leu Asp Ile
65                  70                  75                  80
Gly Thr Asn Val Val Val Tyr Gly Pro Trp Gly Cys Gly Asn Cys Trp
                85                  90                  95
His Cys Ser Gln Gly Leu Glu Asn Tyr Cys Ser Arg Ala Gln Glu Leu
            100                 105                 110
Gly Ile Asn Pro Pro Gly Leu Gly Ala Pro Gly Ala Leu Ala Glu Phe
        115                 120                 125
Met Ile Val Asp Ser Pro Arg His Leu Val Pro Ile Gly Asp Leu Asp
    130                 135                 140
Pro Val Lys Thr Val Pro Leu Thr Asp Ala Gly Leu Thr Pro Tyr His
145                 150                 155                 160
Ala Ile Lys Arg Ser Leu Pro Lys Leu Arg Gly Gly Ser Tyr Ala Val
                165                 170                 175
Val Ile Gly Thr Gly Gly Leu Gly His Val Ala Ile Gln Leu Leu Arg
            180                 185                 190
His Leu Ser Ala Ala Thr Val Ile Ala Leu Asp Val Ser Ala Asp Lys
        195                 200                 205
Leu Glu Leu Ala Thr Lys Val Gly Ala His Glu Val Val Leu Ser Asp
    210                 215                 220
Lys Asp Ala Ala Glu Asn Val Arg Lys Ile Thr Gly Ser Gln Gly Ala
225                 230                 235                 240
Ala Leu Val Leu Asp Phe Val Gly Tyr Gln Pro Thr Ile Asp Thr Ala
                245                 250                 255
Met Ala Val Ala Gly Val Gly Ser Asp Val Thr Ile Val Gly Ile Gly
            260                 265                 270
Asp Gly Gln Ala His Ala Lys Val Gly Phe Phe Gln Ser Pro Tyr Glu
        275                 280                 285
Ala Ser Val Thr Val Pro Tyr Trp Gly Ala Arg Asn Glu Leu Ile Glu
    290                 295                 300
Leu Ile Asp Leu Ala His Ala Gly Ile Phe Asp Ile Ala Val Glu Thr
305                 310                 315                 320
Phe Ser Leu Asp Asn Gly Ala Glu Ala Tyr Arg Arg Leu Ala Ala Gly
                325                 330                 335
Thr Leu Ser Gly Arg Ala Val Val Val Pro Gly Leu
            340                 345
<210>150
<211>1047
<212>DNA
<213>人工序列
<220>
<223>来自酿酒酵母的YGL ADH
<400>150
atgaccacgg aaaaaaccgt agtgttcgtg tcaggcgcga ccggttttat tgctctgcac   60
gtggtagatg acctgctgaa aactggttac aaagtaattg gttccggtcg ttctcaggaa  120
aaaaatgacg gtttgctgaa gaagttcaag tccaacccga atctgagcat ggaaattgtg  180
gaagatattg cggcaccaaa cgccttcgat aaagtattcc agaaacatgg taaagaaatt  240
aaagtggtcc tgcatatcgc gtccccggtc catttcaaca ctaccgattt cgaaaaagac  300
ttactgatcc cggcggtaaa cggtaccaaa tctattttgg aagcaattaa gaactatgcc  360
gcagacaccg tggaaaaagt ggttattact tcatctgttg ccgcgttggc ctctccgggt  420
gatatgaaag ataccagctt cgtggttaac gaagaatcct ggaataaaga cacctgggaa  480
tcgtgtcagg cgaatgctgt gtccgcttat tgcggttcta aaaaattcgc agagaaaacg  540
gcgtgggact tcttggaaga aaaccagagc agcattaaat ttactctgtc cacgattaac  600
ccaggcttcg tttttggtcc gcagctgttc gccgactcct tgcgcaatgg tattaactct  660
agcagtgcga ttattgcgaa cctggtgtcg tataaattag gggataactt ctacaattat  720
agcggcccgt ttatcgacgt ccgtgacgtt tccaaagctc atctgctggc atttgagaaa  780
cctgaatgcg ccggtcagcg cctgtttctg tgcgaggata tgttctgttc ccaggaagcc  840
ctggacattc tgaacgaaga atttccacag ctgaagggca agatcgcaac gggcgaacct  900
ggcagcggct cgaccttcct gactaaaaat tgttgcaaat gcgacaatcg taaaactaaa  960
aacttgctgg gcttccagtt caacaaattc cgcgactgca ttgtcgatac tgcgtcccag 1020
ttgctggaag tgcaaagcaa aagctaa                                     1047
<210>151
<21l>348
<212>PRT
<213>人工序列
<220>
<223>来自酿酒酵母的YGL ADH
<400>151
Met Thr Thr Glu Lys Thr Val Val Phe Val Ser Gly Ala Thr Gly Phe
1               5                   10                  15
Ile Ala Leu His Val Val Asp Asp Leu Leu Lys Thr Gly Tyr Lys Val
            20                  25                  30
Ile Gly Ser Gly Arg Ser Gln Glu Lys Asn Asp Gly Leu Leu Lys Lys
        35                  40                  45
Phe Lys Ser Asn Pro Asn Leu Ser Met Glu Ile Val Glu Asp Ile Ala
    50                  55                  60
Ala Pro Asn Ala Phe Asp Lys Val Phe Gln Lys His Gly Lys Glu Ile
65                  70                  75                  80
Lys Val Val Leu His Ile Ala Ser Pro Val His Phe Asn Thr Thr Asp
                85                  90                  95
Phe Glu Lys Asp Leu Leu Ile Pro Ala Val Asn Gly Thr Lys Ser Ile
            100                 105                 110
Leu Glu Ala Ile Lys Asn Tyr Ala Ala Asp Thr Val Glu Lys Val Val
        115                 120                 125
Ile Thr Ser Ser Val Ala Ala Leu Ala Ser Pro Gly Asp Met Lys Asp
    130                 135                 140
Thr Ser Phe Val Val Asn Glu Glu Ser Trp Asn Lys Asp Thr Trp Glu
145                 150                 155                 160
Ser Cys Gln Ala Asn Ala Val Ser Ala Tyr Cys Gly Ser Lys Lys Phe
                165                 170                 175
Ala Glu Lys Thr Ala Trp Asp Phe Leu Glu Glu Asn Gln Ser Ser Ile
            180                 185                 190
Lys Phe Thr Leu Ser Thr Ile Asn Pro Gly Phe Val Phe Gly Pro Gln
        195                 200                 205
Leu Phe Ala Asp Ser Leu Arg Asn Gly Ile Asn Ser Ser Ser Ala Ile
    210                 215                 220
Ile Ala Asn Leu Val Ser Tyr Lys Leu Gly Asp Asn Phe Tyr Asn Tyr
225                 230                 235                 240
Ser Gly Pro Phe Ile Asp Val Arg Asp Val Ser Lys Ala His Leu Leu
                245                 250                 255
Ala Phe Glu Lys Pro Glu Cys Ala Gly Gln Arg Leu Phe Leu Cys Glu
            260                 265                 270
Asp Met Phe Cys Ser Gln Glu Ala Leu Asp Ile Leu Asn Glu Glu Phe
        275                 280                 285
Pro Gln Leu Lys Gly Lys Ile Ala Thr Gly Glu Pro Gly Ser Gly Ser
    290                 295                 300
Thr Phe Leu Thr Lys Asn Cys Cys Lys Cys Asp Asn Arg Lys Thr Lys
305                 310                 315                 320
Asn Leu Leu Gly Phe Gln Phe Asn Lys Phe Arg Asp Cys Ile Val Asp
                325                 330                 335
Thr Ala Ser Gln Leu Leu Glu Val Gln Ser Lys Ser
            340                 345
<210>152
<211>939
<212>DNA
<213>人工序列
<220>
<223>来自酿酒酵母的YPR ADH
<400>152
atgccggcaa cgttaaaaaa cagcagtgct accttaaaat taaacacagg tgcgagcatt  60
cctgtcctgg ggttcggcac ctggcgctct gtcgataaca acggctatca tagtgtaatt 120
gcggcgctga aagcggggta ccgtcatatc gatgctgcgg ccatctatct gaatgaagaa 180
gaagtcggcc gtgcgatcaa ggactccggt gttcctcgtg aagaaatttt tattaccacc 240
aaactgtggg gcaccgaaca acgcgatcca gaagcagccc tgaacaaatc tctgaaacgt 300
ctgggtctgg actatgtgga cctgtatctg atgcactggc cggtccctct gaaaacagac 360
cgtgtaactg acggtaacgt cctgtgcatc ccgaccctgg aagatggcac cgtggacatc 420
gataccaaag agtggaattt tattaaaacc tgggaactga tgcaggaatt gccgaaaact 480
ggtaagacca aagccgtcgg tgtgtccaat ttttccatca acaatatcaa agaactgctg 540
gaatcgccaa ataacaaggt cgttccagca accaatcaga tcgagattca tccgttgctg 600
ccgcaggatg aattaatcgc cttttgtaaa gaaaaaggca ttgtggtcga agcatatagc 660
ccattcggct ccgctaacgc cccgctgctg aaagaacagg cgattatcga tatggccaaa 720
aagcacggcg tcgaaccggc gcaactgatt atcagctggt cgattcagcg cggttatgtg 780
gtattggcca agtccgtaaa tccggagcgt atcgtgtcga actttaagat ttttaccctg 840
ccagaggatg atttcaaaac catctctaac ctgagcaaag tgcacggtac caaacgtgtc 900
gttgacatga aatggggctc atttccgatt tttcaataa                        939
<210>153
<211>312
<212>PRT
<213>人工序列
<220>
<223>来自酿酒酵母的YPR ADH
<400>153
Met Pro Ala Thr Leu Lys Asn Ser Ser Ala Thr Leu Lys Leu Asn Thr
1               5                   10                  15
Gly Ala Ser Ile Pro Val Leu Gly Phe Gly Thr Trp Arg Ser Val Asp
            20                  25                  30
Asn Asn Gly Tyr His Ser Val Ile Ala Ala Leu Lys Ala Gly Tyr Arg
        35                  40                  45
His Ile Asp Ala Ala Ala Ile Tyr Leu Asn Glu Glu Glu Val Gly Arg
    50                  55                  60
Ala Ile Lys Asp Ser Gly Val Pro Arg Glu Glu Ile Phe Ile Thr Thr
65                  70                  75                  80
Lys Leu Trp Gly Thr Glu Gln Arg Asp Pro Glu Ala Ala Leu Asn Lys
                85                  90                  95
Ser Leu Lys Arg Leu Gly Leu Asp Tyr Val Asp Leu Tyr Leu Met His
            100                 105                 110
Trp Pro Val Pro Leu Lys Thr Asp Arg Val Thr Asp Gly Asn Val Leu
        115                 120                 125
Cys Ile Pro Thr Leu Glu Asp Gly Thr Val Asp Ile Asp Thr Lys Glu
    130                 135                 140
Trp Asn Phe Ile Lys Thr Trp Glu Leu Met Gln Glu Leu Pro Lys Thr
145                 150                 155                 160
Gly Lys Thr Lys Ala Val Gly Val Ser Asn Phe Ser Ile Asn Asn Ile
                165                 170                 175
Lys Glu Leu Leu Glu Ser Pro Asn Asn Lys Val Val Pro Ala Thr Asn
            180                 185                 190
Gln Ile Glu Ile His Pro Leu Leu Pro Gln Asp Glu Leu Ile Ala Phe
        195                 200                 205
Cys Lys Glu Lys Gly Ile Val Val Glu Ala Tyr Ser Pro Phe Gly Ser
    210                 215                 220
Ala Asn Ala Pro Leu Leu Lys Glu Gln Ala Ile Ile Asp Met Ala Lys
225                 230                 235                 240
Lys His Gly Val Glu Pro Ala Gln Leu Ile Ile Ser Trp Ser Ile Gln
                245                 250                 255
Arg Gly Tyr Val Val Leu Ala Lys Ser Val Asn Pro Glu Arg Ile Val
            260                 265                 270
Ser Asn Phe Lys Ile Phe Thr Leu Pro Glu Asp Asp Phe Lys Thr Ile
        275                 280                 285
Ser Asn Leu Ser Lys Val His Gly Thr Lys Arg Val Val Asp Met Lys
    290                 295                 300
Trp Gly Ser Phe Pro Ile Phe Gln
305                 310
<210>154
<211>1029
<212>DNA
<213>人工序列
<220>
<223>来自酿酒酵母的GRE ADH
<400>154
atgtctgtgt tcgtgtcagg cgcgaatggt tttattgctc agcacatcgt agatctgctg   60
ctgaaagaag attacaaagt aattggttcc gcacgttctc aggaaaaagc tgaaaatttg  120
accgaagcct tcggtaacaa cccgaaattt agcatggaag tggtgcctga tattagcaaa  180
ctggatgcct tcgatcatgt attccagaaa catggtaaag atattaaaat cgtcctgcat  240
accgcgtccc cgttttgttt cgatattacc gattccgaac gtgacttact gatcccggcg  300
gtaaacggtg tcaaaggtat tttgcacagt attaagaaat atgccgcaga cagcgtggaa  360
cgcgtggttc tgacttcatc ttacgccgcg gtatttgata tggcgaagga aaacgataag  420
agcctgacct tcaacgaaga atcctggaat ccggcgacct gggaatcgtg tcagagtgat  480
ccggtgaacg cttattgcgg ttctaaaaaa ttcgcagaga aagcagcgtg ggaattcttg  540
gaagaaaacc gtgatagcgt gaaatttgag ctgacagcgg tcaacccagt ttacgttttt  600
ggtccgcaga tgttcgataa agatgttaaa aaacacttga acaccagctg cgaactggtg  660
aactctctga tgcatctgag ccctgaagat aaaattccgg aactgtttgg cggttacatc  720
gacgtccgtg acgttgcgaa agctcatctg gttgcatttc agaaacgtga aacaatcggt  780
cagcgcctga tcgtgtcgga ggcacgtttc acgatgcagg acgttctgga cattctgaac  840
gaagactttc cagtactgaa gggcaatatc ccggtcggca agcctggcag cggcgccacc  900
cataatactc tgggcgccac cctggacaat aaaaaaagca aaaaattgct gggcttcaaa  960
ttccgtaatc tgaaagagac tattgacgat actgcgtccc agatcctgaa attcgaaggt 1020
cgcatttaa                                                         1029
<210>155
<211>342
<212>PRT
<213>人工序列
<220>
<223>来自酿酒酵母的GRE ADH
<400>155
Met Ser Val Phe Val Ser Gly Ala Asn Gly Phe Ile Ala Gln His Ile
1               5                   10                  15
Val Asp Leu Leu Leu Lys Glu Asp Tyr Lys Val Ile Gly Ser Ala Arg
            20                  25                  30
Ser Gln Glu Lys Ala Glu Asn Leu Thr Glu Ala Phe Gly Asn Asn Pro
        35                  40                  45
Lys Phe Ser Met Glu Val Val Pro Asp Ile Ser Lys Leu Asp Ala Phe
    50                  55                  60
Asp His Val Phe Gln Lys His Gly Lys Asp Ile Lys Ile Val Leu His
65                  70                  75                  80
Thr Ala Ser Pro Phe Cys Phe Asp Ile Thr Asp Ser Glu Arg Asp Leu
                85                  90                  95
Leu Ile Pro Ala Val Asn Gly Val Lys Gly Ile Leu His Ser Ile Lys
            100                 105                 110
Lys Tyr Ala Ala Asp Ser Val Glu Arg Val Val Leu Thr Ser Ser Tyr
        115                 120                 125
Ala Ala Val Phe Asp Met Ala Lys Glu Asn Asp Lys Ser Leu Thr Phe
    130                 135                 140
Asn Glu Glu Ser Trp Asn Pro Ala Thr Trp Glu Ser Cys Gln Ser Asp
145                 150                 155                 160
Pro Val Asn Ala Tyr Cys Gly Ser Lys Lys Phe Ala Glu Lys Ala Ala
                165                 170                 175
Trp Glu Phe Leu Glu Glu Asn Arg Asp Ser Val Lys Phe Glu Leu Thr
            180                 185                 190
Ala Val Asn Pro Val Tyr Val Phe Gly Pro Gln Met Phe Asp Lys Asp
        195                 200                 205
Val Lys Lys His Leu Asn Thr Ser Cys Glu Leu Val Asn Ser Leu Met
    210                 215                 220
His Leu Ser Pro Glu Asp Lys Ile Pro Glu Leu Phe Gly Gly Tyr Ile
225                 230                 235                 240
Asp Val Arg Asp Val Ala Lys Ala His Leu Val Ala Phe Gln Lys Arg
                245                 250                 255
Glu Thr Ile Gly Gln Arg Leu Ile Val Ser Glu Ala Arg Phe Thr Met
            260                 265                 270
Gln Asp Val Leu Asp Ile Leu Asn Glu Asp Phe Pro Val Leu Lys Gly
        275                 280                 285
Asn Ile Pro Val Gly Lys Pro Gly Ser Gly Ala Thr His Asn Thr Leu
    290                 295                 300
Gly Ala Thr Leu Asp Asn Lys Lys Ser Lys Lys Leu Leu Gly Phe Lys
305                 310                 315                 320
Phe Arg Asn Leu Lys Glu Thr Ile Asp Asp Thr Ala Ser Gln Ile Leu
                325                 330                 335
Lys Phe Glu Gly Arg Ile
            340

Claims (18)

1.一种工程酮还原酶多肽,其能够将3-酮基四氢噻吩立体选择性地还原成(R)-3-羟基四氢噻吩,所述工程酮还原酶多肽由SEQ ID NO:6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、86、88、90、92、94、96、100、102、104、106、108、110、112、126、128、130或134的氨基酸序列组成。
2.如权利要求1所述的酮还原酶多肽,其中所述立体选择性是至少90%的百分比立体异构体过量。
3.如权利要求1所述的酮还原酶多肽,其中所述立体选择性是至少98%的百分比立体异构体过量。
4.如权利要求3所述的酮还原酶多肽,所述酮还原酶多肽由对应SEQID NO:6、8、10、18、20、22、24、26、28、30、34、36、38、40、42、50、52、54、58、62、66、70、72、76、78、80或134的氨基酸序列组成。
5.如权利要求1所述的酮还原酶多肽,其能够以超过SEQ ID NO:4的野生型酮还原酶多肽的速率将3-酮基四氢噻吩转化成(R)-3-羟基四氢噻吩,其中所述酮还原酶多肽由对应SEQ ID NO:6、8、10、12、14、16、18、20、22、24、26、30、32、38、40、42、44、46、48、50、52、54、56、58、60、64、66、68、70、74、76、78、80、86、88、90、92、104、106、110、112、126、130或134的氨基酸序列组成。
6.如权利要求1所述的酮还原酶多肽,其能够以至少95%的百分比立体异构体过量将3-酮基四氢噻吩立体选择性地还原成(R)-3-羟基四氢噻吩,其与SEQ ID NO:4的野生型酮还原酶多肽对比,具有改善的活性和热稳定性,且由对应SEQ ID NO:6、8、12、14、22、24、26、30、32、38、42、44、46、50、52、56、58、60、64、66、68、70、74、76、78、80、82、86、88、90、92、104、106、110、112或134的氨基酸序列组成。
7.一种多核苷酸,其编码根据权利要求1至6中的任何一项所述的酮还原酶多肽。
8.如权利要求7所述的多核苷酸,其选自由以下组成的组:SEQ ID NO:5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131和133。
9.一种表达载体,其包括如权利要求7或8所述的多核苷酸,所述多核苷酸可操作地连接于适于指导在宿主细胞中表达的至少一种控制序列。
10.一种宿主细胞,其包括权利要求9所述的表达载体。
11.一种用于将底物3-酮基四氢噻吩立体选择性地还原成产物(R)-3-羟基四氢噻吩的方法,其包括将所述3-酮基四氢噻吩与权利要求1至6中的任何一项所述的酮还原酶多肽在适合将所述3-酮基四氢噻吩还原成所述(R)-3-羟基四氢噻吩的反应条件下接触。
12.如权利要求11所述的方法,其中3-酮基四氢噻吩被以至少70%的立体异构体过量还原成(R)-3-羟基四氢噻吩。
13.如权利要求11所述的方法,其中3-酮基四氢噻吩被以至少90%立体异构体过量还原成(R)-3-羟基四氢噻吩。
14.如权利要求11所述的方法,其中所述3-酮基四氢噻吩被以至少98%的立体异构体过量还原成(R)-3-羟基四氢噻吩。
15.如权利要求11所述的方法,其中所述底物为至少100g/L,且至少90%的所述底物在小于24小时内被转化成产物,其中所述酮还原酶多肽为0.8-1.0g/L,且选自由以下组成的组:SEQ ID NO:6、8、10、12、14、18、20、22、24、26、30、32、38、40、42、44、46、48、50、52、54、56、58、60、64、66、68、70、74、76、78、80、82、86、88、90、92、104、106、110、112、126、130和134。
16.如权利要求11所述的方法,其中所述底物为至少100g/L,且至少90%的所述底物在小于20小时内被转化成产物,其中所述酮还原酶多肽为0.8-1.0g/L,且选自由SEQ ID NO:26、44、68和104组成的组。
17.如权利要求11所述的方法,其中所述方法用于结构式(III)的抗生素的合成:
18.一种组合物,其包括3-酮基四氢噻吩和权利要求1所述的酮还原酶多肽。
CN200880104011.7A 2007-08-24 2008-08-24 用于(r)-3-羟基四氢噻吩的立体选择性制备的改善的酮还原酶多肽 Active CN101784669B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US95797407P 2007-08-24 2007-08-24
US60/957,974 2007-08-24
PCT/US2008/074135 WO2009029554A2 (en) 2007-08-24 2008-08-24 Improved ketoreductase polypeptides for the stereoselective production of (r)-3-hydroxythiolane

Publications (2)

Publication Number Publication Date
CN101784669A CN101784669A (zh) 2010-07-21
CN101784669B true CN101784669B (zh) 2015-02-18

Family

ID=40076739

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200880104011.7A Active CN101784669B (zh) 2007-08-24 2008-08-24 用于(r)-3-羟基四氢噻吩的立体选择性制备的改善的酮还原酶多肽

Country Status (5)

Country Link
US (9) US7977078B2 (zh)
EP (1) EP2195443B1 (zh)
JP (1) JP2010536385A (zh)
CN (1) CN101784669B (zh)
WO (1) WO2009029554A2 (zh)

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090083900A (ko) 2006-10-02 2009-08-04 코덱시스, 인코포레이티드 입체이성질체적으로 순수한 스타틴 및 이의 합성 중간체 제조용 조성물 및 제조 방법
CN101627116B (zh) * 2007-02-08 2013-07-10 科德克希思公司 酮还原酶及其用途
CN101784669B (zh) 2007-08-24 2015-02-18 科德克希思公司 用于(r)-3-羟基四氢噻吩的立体选择性制备的改善的酮还原酶多肽
WO2009036404A2 (en) * 2007-09-13 2009-03-19 Codexis, Inc. Ketoreductase polypeptides for the reduction of acetophenones
JP2010539948A (ja) 2007-09-28 2010-12-24 コデクシス, インコーポレイテッド ケトレダクターゼポリペプチドおよびその使用
WO2009046153A1 (en) 2007-10-01 2009-04-09 Codexis, Inc. Ketoreductase polypeptides for the production of azetidinone
US8288141B2 (en) * 2008-08-27 2012-10-16 Codexis, Inc. Ketoreductase polypeptides for the production of 3-aryl-3-hydroxypropanamine from a 3-aryl-3-ketopropanamine
WO2010027710A2 (en) 2008-08-27 2010-03-11 Codexis, Inc. Ketoreductase polypeptides and uses thereof
EP2329013B1 (en) 2008-08-27 2015-10-28 Codexis, Inc. Ketoreductase polypeptides for the production of a 3-aryl-3-hydroxypropanamine from a 3-aryl-3-ketopropanamine
SG10201404330VA (en) 2008-08-29 2014-10-30 Codexis Inc Ketoreductase Polypeptides For The Stereoselective Production Of (4S)-3[(5S)-5(4-Fluorophenyl)-5-Hydroxypentanoyl]-4-Phenyl-1,3-Oxazolidin-2-One
ES2575560T3 (es) 2009-08-19 2016-06-29 Codexis, Inc. Polipéptidos cetorreductasa para preparar fenilefrina
CN102884178B (zh) 2009-12-08 2014-12-03 科德克希思公司 拉唑化合物的合成
US9040262B2 (en) 2010-05-04 2015-05-26 Codexis, Inc. Biocatalysts for ezetimibe synthesis
HUE037616T2 (hu) 2010-12-08 2018-09-28 Codexis Inc Biokatalizátorok és eljárások armodafinil szintéziséhez
EP2697662B1 (en) 2011-04-13 2018-06-06 Codexis, Inc. Biocatalytic process for preparing eslicarbazepine and analogs thereof
SG11201402401TA (en) 2011-11-18 2014-06-27 Codexis Inc Biocatalysts for the preparation of hydroxy substituted carbamates
WO2013170050A1 (en) 2012-05-11 2013-11-14 Codexis, Inc. Engineered imine reductases and methods for the reductive amination of ketone and amine compounds
WO2014150633A1 (en) 2013-03-15 2014-09-25 Merck Sharp & Dohme Corp. Immobilized ketoreductases and process for making and using immobilized ketoreductase
CN103421854A (zh) * 2013-07-30 2013-12-04 苏州汉酶生物技术有限公司 一种(s)-3-(二甲胺基)-1-(噻吩-2-基)-1-丙醇的生物制备方法
RU2019140645A (ru) 2013-09-27 2020-01-27 Кодексис, Инк. Автоматизированный скрининг вариантов фермента
CN106232619B (zh) 2013-11-13 2022-09-09 科德克希思公司 工程化的亚胺还原酶和用于酮和胺化合物的还原胺化的方法
EP4282973A3 (en) 2013-11-15 2024-03-27 F. Hoffmann-La Roche AG Processes for the preparation of pyrimidinylcyclopentane compounds
WO2015162064A1 (en) 2014-04-22 2015-10-29 C-Lecta Gmbh Ketoreductases
SG11201703258PA (en) 2014-11-25 2017-05-30 Codexis Inc Engineered imine reductases and methods for the reductive amination of ketone and amine compounds
CN107354179B (zh) * 2016-05-09 2021-02-19 上海医药工业研究院 一种制备含有羟基的手性化合物的方法
CN106497996B (zh) * 2016-10-11 2021-01-12 凯莱英医药集团(天津)股份有限公司 手性醇的酶催化制备方法
EP3652328A1 (en) 2017-07-14 2020-05-20 c-LEcta GmbH Ketoreductases
CN109576312B (zh) * 2017-09-29 2021-08-24 尚科生物医药(上海)有限公司 一种制备(r)- 2-氯-1-(3-羟基苯基)乙醇的方法
JP6988000B6 (ja) * 2018-01-22 2022-01-19 ジーリン アシムケム ラボラトリーズ カンパニー リミテッド ケトレダクターゼ変異体及びその応用
GB201802383D0 (en) * 2018-02-14 2018-03-28 Givaudan Sa Process
US11208398B2 (en) 2018-07-16 2021-12-28 Novartis Ag Chemical process for preparing phenylpiperidinyl indole derivatives
US20200095619A1 (en) * 2018-09-26 2020-03-26 Kalamazoo Holdings, Inc . New enzymatic process for production of modified hop products
MX2021003534A (es) 2018-09-26 2021-06-08 Kalamazoo Holdings Inc Proceso enzimatico para produccion de productos de lupulo modificado.
US11591625B2 (en) 2018-09-26 2023-02-28 Kalamazoo Holdings, Inc. Enzymatic process for production of modified hop products
KR102329311B1 (ko) * 2018-09-28 2021-11-23 씨제이제일제당 주식회사 신규 과당-4-에피머화 효소 및 이를 이용한 타가토스의 제조 방법
KR102072311B1 (ko) * 2018-11-08 2020-01-31 배재대학교 산학협력단 엔트로코커스 페시움 ka84 균주 및 이를 이용한 오르니틴 생산 방법
CN109943543B (zh) * 2019-03-28 2020-12-11 上海健康医学院 醇脱氢酶突变体及其制备方法和应用
CN113710812A (zh) * 2019-04-19 2021-11-26 株式会社Api (1r,3r)-3-(三氟甲基)环己烷-1-醇及其中间体的生产方法
CN110218718A (zh) * 2019-06-19 2019-09-10 南京趣酶生物科技有限公司 固定化酮还原酶突变体及其在制备奈必洛尔手性醇中间体及其类似物中的应用
CN112458142B (zh) * 2020-12-11 2023-05-12 上海合全药物研发有限公司 生物催化制备(1r,2r)-2-羟基环戊腈的方法
WO2024013383A1 (en) * 2022-07-15 2024-01-18 F. Hoffmann-La Roche Ag Mutant ketoreductase with increased ketoreductase activity as well as methods and uses involving the same

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002086126A2 (de) * 2001-04-20 2002-10-31 Juelich Enzyme Products Gmbh Enzymatisches verfahren zur enantioselektiven reduktion von ketoverbindungen
EP1323830A2 (de) * 2001-12-27 2003-07-02 DSM Fine Chemicals Austria Nfg GmbH & Co KG Verfahren zur Herstellung von heterocyclischen (R)-und (S)-Cyanhydrinen
WO2005033094A2 (de) * 2003-10-01 2005-04-14 Basf Aktiengesellschaft Verfahren zur herstellung von 3-methylamino-1-(thien-2-yl)-propan-1-ol

Family Cites Families (61)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4443373A (en) 1982-03-30 1984-04-17 Schering Corporation Process for the production of antibiotic penems
US4530793A (en) 1982-11-29 1985-07-23 Schering Corporation Processes for the production of penems
US4619924A (en) 1984-05-18 1986-10-28 Pfizer Inc. 2-alkylthiopenem derivatives
US4739047A (en) 1985-10-17 1988-04-19 Pfizer Inc. Intermediates for 2-(1-oxo-3-thiolanyl)-2-penem antibiotics
US4695626A (en) 1986-07-29 1987-09-22 Pfizer Inc. 1-aza-4,5-dithiabicyclo [4.2.0] oct-2-en-8-one-2 carboxylate esters
US5013729A (en) 1987-05-11 1991-05-07 Pfizer Inc. Diastereomeric 5R,6S-6-(1R-hydroxyethyl)-2-(cis-1-oxo-3-thiolanylthio)-2-penem-3-carboxylic acids
US5191077A (en) 1987-05-11 1993-03-02 Pfizer Inc. Diastereomeric 5R,6S-6-(1R-hydroxyethyl)-2-(cis-1-oxo-3-thiolanylthio)-2-penem-3-carboxylic acids
US4874877A (en) 1988-04-19 1989-10-17 Pfizer Inc. Process for optically active 3-(methane-sulfonyloxy)thiolane and analogs
US5538867A (en) 1988-09-13 1996-07-23 Elf Aquitaine Process for the electrochemical regeneration of pyridine cofactors
US4864046A (en) 1989-02-09 1989-09-05 Pfizer Inc. Process for optically active 3-thiolanyl sulfonate esters
US4940823A (en) 1989-07-12 1990-07-10 Pfizer Inc. Process for optically active 3-thiolanyl sulfonate esters
DE4014573C1 (zh) 1990-05-07 1991-10-10 Forschungszentrum Juelich Gmbh, 5170 Juelich, De
JP2681057B2 (ja) 1990-10-01 1997-11-19 高砂香料工業株式会社 2,2’―ビス(ジフェニルホスフィノ)―5,5’,6,6’,7,7’,8,8’―オクタヒドロ―1,1’―ビナフチル及びこれを配位子とする遷移金属錯体
US5225339A (en) 1992-02-26 1993-07-06 The Scripps Research Institute Lactobacillus kefir alcohol dehydrogenase
JP3155107B2 (ja) 1993-01-12 2001-04-09 ダイセル化学工業株式会社 光学活性4−ハロ−3−ヒドロキシ酪酸エステルの製造方法
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
US5837458A (en) 1994-02-17 1998-11-17 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
US6335160B1 (en) 1995-02-17 2002-01-01 Maxygen, Inc. Methods and compositions for polypeptide engineering
ES2165420T3 (es) 1994-06-03 2002-03-16 Novozymes Biotech Inc Lacasas myceliophthora purificadas y acidos nucleicos que las codifican.
CN101659926A (zh) 1994-06-30 2010-03-03 诺沃奇梅兹有限公司 非毒性、非产毒性、非致病性镰孢属表达系统及所用启动子和终止子
US5427933A (en) 1994-07-20 1995-06-27 Merck & Co., Inc. Reduction of phenylalkyl ketones to the corresponding (S)-hydroxy derivatives using mucor hiemalis IFO 5834
US5491077A (en) 1994-07-20 1996-02-13 Merck & Co., Inc. Microbial method
JPH08336393A (ja) 1995-04-13 1996-12-24 Mitsubishi Chem Corp 光学活性なγ−置換−β−ヒドロキシ酪酸エステルの製造法
FI104465B (fi) 1995-06-14 2000-02-15 Valio Oy Proteiinihydrolysaatteja allergioiden hoitamiseksi tai estämiseksi, niiden valmistus ja käyttö
DE19610984A1 (de) 1996-03-21 1997-09-25 Boehringer Mannheim Gmbh Alkohol-Dehydrogenase und deren Verwendung zur enzymatischen Herstellung chiraler Hydroxyverbindungen
US5891685A (en) 1996-06-03 1999-04-06 Mitsubishi Chemical Corporation Method for producing ester of (S)-γ-halogenated-β-hydroxybutyric acid
DK1036198T3 (da) 1997-12-08 2013-01-02 California Inst Of Techn Fremgangsmåde til fremstilling af polynukleotid- og polypeptidsekvenser
DE19812004A1 (de) 1998-03-19 1999-09-30 Forschungszentrum Juelich Gmbh Dehydrogenasen mit verbesserter NAD-Abhängigkeit, deren Herstellung und Verwendung
US6495023B1 (en) 1998-07-09 2002-12-17 Michigan State University Electrochemical methods for generation of a biological proton motive force and pyridine nucleotide cofactor regeneration
DE19857302C2 (de) 1998-12-14 2000-10-26 Forschungszentrum Juelich Gmbh Verfahren zur enantioselektiven Reduktion von 3,5-Dioxocarbonsäuren, deren Salze und Ester
JP4221100B2 (ja) 1999-01-13 2009-02-12 エルピーダメモリ株式会社 半導体装置
AU3874900A (en) 1999-03-11 2000-09-28 Eastman Chemical Company Enzymatic reductions with dihydrogen via metal catalyzed cofactor regeneration
WO2001004336A1 (de) 1999-07-09 2001-01-18 Forschungszentrum Jülich GmbH Verfahren zur reduktion von keto-carbonsäuren und deren estern
SI20642A (sl) 1999-12-03 2002-02-28 Kaneka Corporation Nova karbonil-reduktaza, gen le-te in postopek za uporabo le-teh
AU4964101A (en) 2000-03-30 2001-10-15 Maxygen Inc In silico cross-over site selection
DE10037101A1 (de) 2000-07-27 2002-02-07 Degussa Rekombinant hergestellte Enzyme mit verbesserter NAD(H)-Akzeptanz
US7202070B2 (en) 2000-10-31 2007-04-10 Biocatalytics, Inc. Method for reductive amination of a ketone using a mutated enzyme
CN1498273A (zh) 2001-03-22 2004-05-19 ����˹�ж�-����˹˹������˾ 取代乙酰苯的立体选择还原
JP4213524B2 (ja) 2003-04-17 2009-01-21 ダイセル化学工業株式会社 新規なカルボニル還元酵素、その酵素をコードするdnaを含むポリヌクレオチド、その製造方法、およびこれを利用した光学活性アルコールの製造方法
US7824898B2 (en) 2003-08-11 2010-11-02 Codexis, Inc. Halohydrin dehalogenases and related polynucleotides
JP2007502114A (ja) 2003-08-11 2007-02-08 コデクシス, インコーポレイテッド 改良されたグルコースデヒドロゲナーゼポリペプチドおよび関連ポリヌクレオチド
AU2004266100A1 (en) 2003-08-11 2005-03-03 Codexis, Inc. Enzymatic processes for the production of 4-substituted 3-hydroxybutyric acid derivatives and vicinal cyano, hydroxy substituted carboxylic acid esters
US7629157B2 (en) 2003-08-11 2009-12-08 Codexis, Inc. Ketoreductase polypeptides and related polynucleotides
WO2005054491A1 (ja) 2003-12-02 2005-06-16 Mercian Corporation 光学活性テトラヒドロチオフェン誘導体の製造方法、および、光学活性テトラヒドロチオフェン-3-オールの晶析方法
AU2005201221A1 (en) 2004-03-31 2005-10-20 Daiso Co., Ltd Process for Preparing 3-Hydroxythiolane
US7393667B2 (en) 2005-05-31 2008-07-01 Bristol-Myers Squibb Company Stereoselective reduction process for the preparation of pyrrolotriazine compounds
WO2007010944A1 (ja) 2005-07-20 2007-01-25 Kaneka Corporation 光学活性2-(n-置換アミノメチル)-3-ヒドロキシ酪酸エステル類の製造方法
AT502395B1 (de) 2005-07-27 2007-03-15 Iep Gmbh Oxidoreduktasen zur stereoselektiven reduktion von ketoverbindungen
KR20090083900A (ko) 2006-10-02 2009-08-04 코덱시스, 인코포레이티드 입체이성질체적으로 순수한 스타틴 및 이의 합성 중간체 제조용 조성물 및 제조 방법
CN101627116B (zh) 2007-02-08 2013-07-10 科德克希思公司 酮还原酶及其用途
CN101784669B (zh) * 2007-08-24 2015-02-18 科德克希思公司 用于(r)-3-羟基四氢噻吩的立体选择性制备的改善的酮还原酶多肽
WO2009036404A2 (en) 2007-09-13 2009-03-19 Codexis, Inc. Ketoreductase polypeptides for the reduction of acetophenones
JP2010539948A (ja) 2007-09-28 2010-12-24 コデクシス, インコーポレイテッド ケトレダクターゼポリペプチドおよびその使用
WO2009046153A1 (en) 2007-10-01 2009-04-09 Codexis, Inc. Ketoreductase polypeptides for the production of azetidinone
WO2010027710A2 (en) 2008-08-27 2010-03-11 Codexis, Inc. Ketoreductase polypeptides and uses thereof
EP2329013B1 (en) 2008-08-27 2015-10-28 Codexis, Inc. Ketoreductase polypeptides for the production of a 3-aryl-3-hydroxypropanamine from a 3-aryl-3-ketopropanamine
US8288141B2 (en) 2008-08-27 2012-10-16 Codexis, Inc. Ketoreductase polypeptides for the production of 3-aryl-3-hydroxypropanamine from a 3-aryl-3-ketopropanamine
SG10201404330VA (en) * 2008-08-29 2014-10-30 Codexis Inc Ketoreductase Polypeptides For The Stereoselective Production Of (4S)-3[(5S)-5(4-Fluorophenyl)-5-Hydroxypentanoyl]-4-Phenyl-1,3-Oxazolidin-2-One
ES2575560T3 (es) 2009-08-19 2016-06-29 Codexis, Inc. Polipéptidos cetorreductasa para preparar fenilefrina
EP2697662B1 (en) 2011-04-13 2018-06-06 Codexis, Inc. Biocatalytic process for preparing eslicarbazepine and analogs thereof
SG11201402401TA (en) 2011-11-18 2014-06-27 Codexis Inc Biocatalysts for the preparation of hydroxy substituted carbamates

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002086126A2 (de) * 2001-04-20 2002-10-31 Juelich Enzyme Products Gmbh Enzymatisches verfahren zur enantioselektiven reduktion von ketoverbindungen
EP1323830A2 (de) * 2001-12-27 2003-07-02 DSM Fine Chemicals Austria Nfg GmbH & Co KG Verfahren zur Herstellung von heterocyclischen (R)-und (S)-Cyanhydrinen
WO2005033094A2 (de) * 2003-10-01 2005-04-14 Basf Aktiengesellschaft Verfahren zur herstellung von 3-methylamino-1-(thien-2-yl)-propan-1-ol

Also Published As

Publication number Publication date
US20210054426A1 (en) 2021-02-25
US10851397B2 (en) 2020-12-01
CN101784669A (zh) 2010-07-21
US10385371B2 (en) 2019-08-20
US8227229B2 (en) 2012-07-24
US9394552B2 (en) 2016-07-19
US8962285B2 (en) 2015-02-24
US20120276599A1 (en) 2012-11-01
US20150125910A1 (en) 2015-05-07
US20110217754A1 (en) 2011-09-08
US20160289717A1 (en) 2016-10-06
US9932615B2 (en) 2018-04-03
EP2195443A2 (en) 2010-06-16
US20190323044A1 (en) 2019-10-24
WO2009029554A2 (en) 2009-03-05
EP2195443B1 (en) 2015-01-07
US11427841B2 (en) 2022-08-30
US11965194B2 (en) 2024-04-23
US7977078B2 (en) 2011-07-12
US20180187223A1 (en) 2018-07-05
US20230068040A1 (en) 2023-03-02
JP2010536385A (ja) 2010-12-02
US20090093031A1 (en) 2009-04-09
WO2009029554A3 (en) 2009-07-02

Similar Documents

Publication Publication Date Title
CN101784669B (zh) 用于(r)-3-羟基四氢噻吩的立体选择性制备的改善的酮还原酶多肽
CN101889081B (zh) 酮还原酶多肽及其用途
US11512332B2 (en) Engineered ketoreductase polypeptides
CN101855342B (zh) 用于还原苯乙酮的酮还原酶多肽
CN102186972B (zh) 用于立体选择性生产(4s)-3-[(5s)-5-(4-氟苯基)-5-羟基戊酰基]-4-苯基-1,3-噁唑烷-2-酮的酮还原酶多肽
US10329540B2 (en) Ketoreductase polypeptides for the production of azetidinone
EP2329013B1 (en) Ketoreductase polypeptides for the production of a 3-aryl-3-hydroxypropanamine from a 3-aryl-3-ketopropanamine

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: PFIZER INC. (US) 235 EAST 42ND STREET, NEW YORK, N

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20100901

Address after: California, USA

Applicant after: Codexis, Inc.

Co-applicant after: Pfizer Inc.

Address before: California, USA

Applicant before: Codexis, Inc.

C14 Grant of patent or utility model
GR01 Patent grant