CN113710807A

CN113710807A - 用于由己糖生产含氧化合物的微生物和方法

Info

Publication number: CN113710807A
Application number: CN202080029871.XA
Authority: CN
Inventors: D·J·科赫; L·佩德森帕里齐; F·加尔泽拉尼
Original assignee: Braskem SA
Current assignee: Braskem SA
Priority date: 2019-02-20
Filing date: 2020-02-20
Publication date: 2021-11-26
Also published as: EP3908663A1; JP2022521904A; WO2020168407A1; US20200283806A1

Abstract

本申请涉及可用于由一种或多种己糖原料生物合成单乙二醇(MEG)或任选MEG和一种或多种联产品(co‑product)的重组微生物。本申请还涉及用于由一种或多种己糖原料生物合成乙醇酸(GA)或任选GA和一种或多种联产品的重组微生物。本申请涉及可用于由一种或多种己糖原料生物合成木糖醇或任选木糖醇和一种或多种联产品的重组微生物。还提供使用重组微生物由一种或多种己糖原料生产MEG(或GA或木糖醇)或任选MEG(或GA或木糖醇)和一种或多种联产品的方法，以及包含所述重组微生物和/或产物MEG(或GA或木糖醇)或任选MEG(或GA或木糖醇)和一种或多种联产品的组合物。

Description

用于由己糖生产含氧化合物的微生物和方法

相关申请的交叉引用

本申请要求于2019年2月20日提交的题为“MICROORGANISMS AND METHODS FORTHE PRODUCTION OF OXYGENATED COMPOUNDS FROM HEXOSES”的美国临时申请号62/808,247的优先权，其公开内容通过引用并入本文。

技术领域

本申请涉及可用于由一种或多种己糖原料生物合成单乙二醇或单乙二醇和一种或多种联产品(co-product)的重组微生物。本申请另外涉及用于由一种或多种己糖原料生物合成乙醇酸或乙醇酸和一种或多种联产品的重组微生物。本申请还涉及使用重组微生物由一种或多种己糖原料生产单乙二醇或单乙二醇和一种或多种联产品的方法，以及使用重组微生物由一种或多种己糖原料生产乙醇酸或乙醇酸和一种或多种联产品的方法。本申请进一步涉及包含一种或多种这些化合物和/或重组微生物的组合物。

关于序列表的声明

与本申请相关的序列表以文本格式代替纸质副本提供，并在此通过引用并入说明书。包含序列表的文本文件的名称是BRSK-004_02WO_ST25.txt。该文本文件大小约616KB，创建于2020年2月18日，通过EFS-Web以电子方式提交。

背景技术

目前，大量的化合物来源于石油化工产品。化合物如单乙二醇(MEG)、乙醇酸、丙酮、异丙醇(IPA)、丙烯、丝氨酸、甘氨酸、单乙醇胺和乙二胺，是生产产品的有价值的原料，所述产品如聚对苯二甲酸乙二醇酯(PET)树脂(由MEG生产)、聚丙烯塑料(由丙烯生产)、聚乙醇酸和其他生物相容性共聚物(由乙醇酸生产)和聚氨酯纤维(由乙二胺生产)。烯烃(例如乙烯、丙烯、不同的丁烯和戊烯)用于塑料工业、燃料和化学工业的其他领域。例如，异丁烯是一种小而高反应性的分子，广泛用作平台化合物(platform chemical)以制造各种产品，所述产品包括燃料添加剂、橡胶和橡胶添加剂以及专用化学品。

然而，这些化合物目前是由源自化石燃料的前体生产的，这会导致气候变化。为了开发更环保的MEG生产工艺，研究人员已经工程化了具有生产MEG的生物合成途径的微生物。然而，这些途径的实施具有挑战性，一些主要的待克服的障碍有产品产率的损失、氧化还原平衡和过量的生物质形成。

因此，需要改进的生物合成途径，其用于生产MEG和其他可用于工业和制药应用的化合物。

发明内容

本申请涉及具有一种或多种生物合成途径的重组微生物，其用于由一种或多种己糖原料生产单乙二醇(MEG)或乙醇酸(GA)或任选MEG(或GA)和一种或多种联产品。

本公开的重组微生物和方法组合了基于葡萄糖的发酵性MEG生产和基于木糖的发酵性MEG生产的优点。在一些实施方案中，本公开的重组微生物和方法将木糖降解生物化学用于高产率形成MEG(或GA)或任选MEG(或GA)和一种或多种联产品的优点，与容易获得的纯己糖原料的优点相组合。

在一些实施方案中，本公开的重组微生物和方法解决了木糖原料可得性的问题。在一些实施方案中，本公开的重组微生物和方法解决了木糖原料价格难以承受的问题。在一些实施方案中，本公开的重组微生物和方法解决了木糖原料杂质的问题。在一些实施方案中，本公开的重组微生物和方法解决了微生物摄入木糖效率低的问题。在一些实施方案中，本公开的重组微生物和方法解决了葡萄糖诱导的木糖利用受抑制的问题。在一些实施方案中，本公开的重组微生物和方法解决了MEG(或GA)生产途径中ATP短缺的问题。在一些实施方案中，本公开的重组微生物和方法解决了MEG(或GA)生产途径中NADH过量的问题。在一些实施方案中，本公开的重组微生物和方法解决了整体产品产率潜力低的问题。

在一些实施方案中，本公开的重组微生物和方法提供了一种或多种己糖原料向一种或多种戊糖-5-磷酸中间体的无损转化。在一些实施方案中，通过一种或多种基于木糖的发酵方法，将所述一种或多种戊糖-5-磷酸中间体用于生产MEG(或GA)或任选MEG(或GA)和一种或多种联产品。在一些实施方案中，将葡萄糖流(flux)输送至磷酸戊糖途径而不是糖酵解途径。

一方面，本公开提供重组微生物，其包含一种或多种生化途径，所述生化途径由一种或多种己糖原料通过一种或多种戊糖-5-磷酸中间体生产单乙二醇(MEG)(或乙醇酸)。在一个实施方案中，一种或多种联产品与MEG(或乙醇酸)联产。在另一个实施方案中，所述一种或多种戊糖-5-磷酸中间体是D-木酮糖-5-磷酸、D-核酮糖-5-磷酸或D-核糖-5-磷酸中的一种或多种。

因此，在一个实施方案中，本申请涉及重组微生物，其包含一种或多种包含至少一种酶的表达的生化途径，所述酶具有将一种或多种己糖原料无损转化为一种或多种戊糖-5-磷酸中间体的活性。

在一些实施方案中，所述重组微生物包含至少一种具有转酮醇酶活性的酶的表达。在一些实施方案中，具有转酮醇酶活性的酶由与来自大肠杆菌(E.coli)的tktA具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在其他实施方案中，所述具有转酮醇酶活性的酶是来自大肠杆菌的tktA。在一些实施方案中，具有转酮醇酶活性的酶由与来自大肠杆菌的tktB具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在其他实施方案中，所述具有转酮醇酶活性的酶是来自大肠杆菌的tktB。在另一个实施方案中，编码具有转酮醇酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO：148和SEQ ID NO：150的氨基酸序列。在一些实施方案中，编码具有转酮醇酶活性的酶的一种或多种核酸分子是tktA或其同源物。在一些实施方案中，编码具有转酮醇酶活性的酶的一种或多种核酸分子是tktB或其同源物。在一个进一步的实施方案中，编码具有转酮醇酶活性的酶的一种或多种核酸分子由选自SEQ ID NO：147和SEQ ID NO：149的核酸序列编码。

在一些实施方案中，所述重组微生物包含至少一种具有转醛醇酶活性的酶的表达。在一些实施方案中，具有转醛醇酶活性的酶由与来自大肠杆菌的talA或talB具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码。在一些实施方案中，所述具有转醛醇酶活性的酶是来自大肠杆菌的talA。在其他实施方案中，所述具有转醛醇酶活性的酶是来自大肠杆菌的talB。在另一个实施方案中，编码具有转醛醇酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO：152和SEQ ID NO：154的氨基酸序列。在一个进一步的实施方案中，编码具有转醛醇酶活性的酶的一种或多种核酸分子由选自SEQ ID NO：151和SEQ ID NO：153的核酸序列编码。

在一些实施方案中，所述重组微生物包含至少一种具有核酮糖-5-磷酸3-差向异构酶(epimerase)活性的酶的表达。在一些实施方案中，具有核酮糖-5-磷酸3-差向异构酶活性的酶由与来自大肠杆菌的rpe具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码。在其他实施方案中，所述具有核酮糖-5-磷酸3-差向异构酶活性的酶是来自大肠杆菌的rpe。在另一个实施方案中，编码具有核酮糖-5-磷酸3-差向异构酶活性的酶的一种或多种核酸分子包含SEQ ID NO：158中列出的氨基酸序列。在一个进一步的实施方案中，编码具有核酮糖-5-磷酸3-差向异构酶活性的酶的一种或多种核酸分子由SEQ ID NO：157中列出的核酸序列编码。

在一些实施方案中，所述重组微生物包含至少一种具有核糖-5-磷酸异构酶活性的酶的表达。在一些实施方案中，所述具有核糖-5-磷酸异构酶活性的酶由与来自大肠杆菌的rpiA具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码。在其他实施方案中，所述具有核糖-5-磷酸异构酶活性的酶是来自大肠杆菌的rpiA。在其他实施方案中，所述具有核糖-5-磷酸异构酶活性的酶由与来自大肠杆菌的rpiB具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码。在其他实施方案中，所述具有核糖-5-磷酸异构酶活性的酶是来自大肠杆菌的rpiB。在另一个实施方案中，编码具有核糖-5-磷酸异构酶活性的酶的一种或多种核酸分子包含SEQID NO：156中列出的氨基酸序列。在一个进一步的实施方案中，编码具有核糖-5-磷酸异构酶活性的酶的一种或多种核酸分子由SEQ ID NO：155中列出的核酸序列编码。

在一些实施方案中，所述重组微生物包含至少一种具有转酮醇酶活性、转醛醇酶活性、核酮糖-5-磷酸3-差向异构酶活性和核糖-5-磷酸异构酶活性的酶的表达。在其他实施方案中，所述重组微生物进一步包含一种或多种内源性酶的活性缺失或降低，所述内源性酶选自甘油醛3-磷酸脱氢酶、磷酸甘油酸激酶和磷酸甘油酸变位酶。在一些实施方案中，内源性的甘油醛3-磷酸脱氢酶是gapA，磷酸甘油酸激酶是pgk，磷酸甘油酸变位酶是gpmA和/或gpmM。

在一些实施方案中，所述重组微生物包含至少一种具有果糖6-磷酸磷酸酮醇酶(phosphoketolase)活性的酶的表达。在一些实施方案中，具有果糖-6-磷酸磷酸酮醇酶活性的酶由与选自以下的具有果糖-6-磷酸磷酸酮醇酶活性的酶具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码：齿双歧杆菌(Bifidobacterium dentium)BDP_1006、乳双歧杆菌(Bifidobacterium lactis)xfp、类植物乳杆菌(Lactobacillus paraplantarum)xpkA和短双歧杆菌(Bifidobacterium breve)xfp。在一个优选的实施方案中，具有果糖-6-磷酸磷酸酮醇酶活性的酶选自齿双歧杆菌BDP_1006、乳双歧杆菌xfp、类植物乳杆菌xpkA和短双歧杆菌xfp。在另一个实施方案中，编码具有果糖-6-磷酸磷酸酮醇酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO：212、214、216和218的氨基酸序列。在一个进一步的实施方案中，编码具有果糖-6-磷酸磷酸酮醇酶活性的酶的一种或多种核酸分子由选自SEQ ID NO：211、213、215和217的核酸序列编码。

在一些实施方案中，所述重组微生物包含至少一种具有磷酸乙酰转移酶活性的酶的表达。在一些实施方案中，具有磷酸乙酰转移酶活性的酶由与选自以下的具有磷酸乙酰转移酶活性的酶具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码：大肠杆菌pta和丙酮丁醇梭菌(Clostridium acetobutylicum)pta。在一个优选的实施方案中，具有磷酸乙酰转移酶活性的酶选自大肠杆菌pta和丙酮丁醇梭菌pta。在另一个实施方案中，编码具有磷酸乙酰转移酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO：220和222的氨基酸序列。在一个进一步的实施方案中，编码具有磷酸乙酰转移酶活性的酶的一种或多种核酸分子由选自SEQ ID NO：219和SEQ ID NO：221的核酸序列编码。

在一些实施方案中，所述重组微生物包含至少一种具有果糖-6-磷酸磷酸酮醇酶活性、磷酸乙酰转移酶活性、转酮醇酶活性、转醛醇酶活性、核酮糖-5-磷酸3-差向异构酶活性和核糖-5-磷酸异构酶活性的酶的表达。在其他实施方案中，所述重组微生物进一步包含内源性6-磷酸果糖激酶的活性缺失或降低。在一些实施方案中，所述内源性6-磷酸果糖激酶是pfkA和/或pfkB。

在另一个实施方案中，通过将一种或多种戊糖-5-磷酸中间体转化为一种或多种戊糖和/或戊糖-1-磷酸中间体，由一种或多种己糖原料无损转化生产的一种或多种戊糖-5-磷酸中间体可以与任一个已知的C2 MEG或乙醇酸生产途径相连接。在一些实施方案中，所述重组微生物包含至少一种具有戊糖磷酸酶活性、阿糖醇磷酸脱氢酶活性、和/或磷酸戊糖变位酶活性的酶的表达。在一些实施方案中，所述磷酸戊糖变位酶是(Pgm3)。在一些实施方案中，所述磷酸戊糖变位酶是来自酿酒酵母(Saccharomyces cerevisiae)的(Pgm3)。在一些实施方案中，所述磷酸戊糖变位酶由与来自酿酒酵母的Pgm3具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码。

在一些实施方案中，所述重组微生物包含至少一种具有戊糖磷酸酶活性的酶的表达。在其他实施方案中，所述至少一种具有戊糖磷酸酶活性的酶选自以下一种或多种：具有D-戊糖-5-磷酸酶活性的酶、具有D-木酮糖-5-磷酸酶活性的酶、具有D-核糖-5-磷酸酶活性的酶和具有D-核酮糖-5-磷酸酶活性的酶。在一些实施方案中，戊糖磷酸酶由与选自以下的D-戊糖-5-磷酸酶具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码：大肠杆菌phoA、大肠杆菌yfbT和大肠杆菌yidA。在一些实施方案中，具有D-木酮糖-5-磷酸酶活性的酶由与枯草芽孢杆菌(Bacillus subtilis)araL具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码。在一些实施方案中，具有D-核糖-5-磷酸酶活性的酶由与选自以下的具有D-核糖-5-磷酸酶活性的酶具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码：拟南芥(Arabidopsis thaliana)SGPP、荧光假单胞菌(Pseudomonas fluorescens)PFLU_2693和大肠杆菌ybiV。在一些实施方案中，具有D-核酮糖-5-磷酸酶活性的酶由与恶性疟原虫(Plasmodium falciparum)的PF10_0325具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码。在一些实施方案中，编码具有D-戊糖-5-磷酸酶活性的酶的一种或多种核酸分子选自SEQ ID NO：159、161、163、165、167、169、171和173。在另一个实施方案中，编码具有D-戊糖-5-磷酸酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO：160、162、164、166、168、170、172和174的氨基酸序列。

在一些实施方案中，所述重组微生物包含至少一种具有阿糖醇磷酸脱氢酶活性的酶的表达。在一些实施方案中，所述具有阿糖醇磷酸脱氢酶活性的酶选自以下一种或多种：具有D-阿糖醇1-磷酸4-脱氢酶活性的酶、具有D-阿糖醇5-磷酸2-脱氢酶活性的酶、具有D-阿糖醇1-磷酸2-脱氢酶活性的酶和具有D-阿糖醇5-磷酸4-脱氢酶活性的酶。

在一些实施方案中，具有D-阿糖醇1-磷酸4-脱氢酶活性的酶由与来自鸟肠球菌(Enterococcus avium)的APDH具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码。在一个优选的实施方案中，具有D-阿糖醇1-磷酸4-脱氢酶活性的酶是来自鸟肠球菌的APDH。在一些实施方案中，编码具有D-阿糖醇1-磷酸4-脱氢酶活性的酶的一种或多种核酸分子在SEQ ID NO：175中列出。在另一个实施方案中，编码具有D-阿糖醇1-磷酸4-脱氢酶活性的酶的一种或多种核酸分子包含SEQ ID NO：176中列出的氨基酸序列。

在一些实施方案中，具有D-阿糖醇5-磷酸2-脱氢酶活性的酶由与来自鸟肠球菌(Enterococcus avium)的APDH具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码。在一个优选的实施方案中，具有D-阿糖醇5-磷酸2-脱氢酶活性的酶是来自鸟肠球菌的APDH。在一些实施方案中，编码具有D-阿糖醇5-磷酸2-脱氢酶活性的酶的一种或多种核酸分子在SEQ ID NO：175中列出。在另一个实施方案中，编码具有D-阿糖醇5-磷酸2-脱氢酶活性的酶的一种或多种核酸分子包含SEQ ID NO：176中列出的氨基酸序列。

在一些实施方案中，具有D-阿糖醇1-磷酸2-脱氢酶活性的酶由与选自以下的具有D-阿糖醇1-磷酸2-脱氢酶活性的酶具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码：白色念珠菌(Candida albicans)ARD1、热带念珠菌(Candida tropicalis)ARD1、Scheffersomyces stipitis ARDH、枯草芽孢杆菌egsA(araM)、敏捷气热菌(Aeropyrum pernix)egsA、大肠杆菌gpsA和酿酒酵母GPD1。在一个优选的实施方案中，具有D-阿糖醇1-磷酸2-脱氢酶活性的酶选自白色念珠菌ARD1、热带念珠菌ARD1、Scheffersomyces stipitis ARDH、枯草芽孢杆菌egsA(araM)、敏捷气热菌egsA、大肠杆菌gpsA和酿酒酵母GPD1。在一些实施方案中，编码具有D-阿糖醇1-磷酸2-脱氢酶活性的酶的一种或多种核酸分子选自SEQ ID NO：177、179、181、189、191、193和195。在另一个实施方案中，编码具有D-阿糖醇1-磷酸2-脱氢酶活性的酶的一种或多种核酸分子包含选自SEQID NO：178、180、182、190、192、194和196的氨基酸序列。

在一些实施方案中，具有D-阿糖醇5-磷酸4-脱氢酶活性的酶由与选自以下的具有D-阿糖醇5-磷酸4-脱氢酶活性的酶具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码：荧光假单胞菌mtlD、肺炎克雷伯氏菌(Klebsiellapneumoniae)dalD、茄科雷尔氏菌(Ralstonia solanacearum)dalD、枯草芽孢杆菌egsA(araM)、敏捷气热菌egsA、大肠杆菌gpsA和酿酒酵母GPD1。在一个优选的实施方案中，具有D-阿糖醇5-磷酸4-脱氢酶活性的酶选自荧光假单胞菌mtlD、肺炎克雷伯氏菌(Klebsiellapneumoniae)dalD、茄科雷尔氏菌(Ralstonia solanacearum)dalD、枯草芽孢杆菌egsA(araM)、敏捷气热菌egsA、大肠杆菌gpsA和酿酒酵母GPD1。在一些实施方案中，编码具有D-阿糖醇5-磷酸4-脱氢酶活性的酶的一种或多种核酸分子选自SEQ ID NO：183、185、187、189、191、193和195。在另一个实施方案中，编码具有D-阿糖醇5-磷酸4-脱氢酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO：184、186、188、190、192、194和196的氨基酸序列。

在一些实施方案中，重组微生物包含至少一种具有磷酸戊糖变位酶活性的酶的表达。在一些实施方案中，具有磷酸戊糖变位酶活性的酶由与选自以下的具有磷酸戊糖变位酶活性的酶具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码：大肠杆菌deoB、大肠杆菌pgm、枯草芽孢杆菌pgcA、乳酸乳球菌(Lactococcuslactis)pgmB、大肠杆菌ycjU、铜绿假单胞菌(Pseudomonas aeruginosa)algC和大肠杆菌cpsG。在一个优选的实施方案中，具有磷酸戊糖变位酶活性的酶选自大肠杆菌deoB、大肠杆菌pgm、枯草芽孢杆菌pgcA、乳酸乳球菌(Lactococcus lactis)pgmB、大肠杆菌ycjU、铜绿假单胞菌(Pseudomonas aeruginosa)algC和大肠杆菌cpsG。在一些实施方案中，编码具有磷酸戊糖变位酶活性的酶的一种或多种核酸分子选自SEQ ID NO：197、199、201、203、205、207和209。在另一个实施方案中，编码具有磷酸戊糖变位酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO：198、200、202、204、206、208和210的氨基酸序列。

在上述任何重组微生物的一些实施方案中，所述重组微生物进一步包含一种或多种内源性酶中降低的活性，所述内源性酶选自葡萄糖6-磷酸-1-脱氢酶、6-磷酸葡萄糖酸内酯酶和6-磷酸葡萄糖酸脱氢酶。在进一步的实施方案中，所述葡萄糖6-磷酸-1-脱氢酶是zwf，所述6-磷酸葡萄糖酸内酯酶是pgl，所述6-磷酸葡萄糖酸脱氢酶是gnd。

在一些实施方案中，本申请提供重组微生物，其联产MEG(或乙醇酸)和一种或多种联产品，所述联产品选自丙酮、异丙醇、丙烯、异丁烯和一种或多种丝氨酸途径化合物。在一些优选的实施方案中，所述一种或多种丝氨酸途径化合物选自丝氨酸、甘氨酸、单乙醇胺(MEA)和乙二胺(EDA)。

在一些实施方案中，所述一种或多种己糖原料选自葡萄糖或葡萄糖的低聚物。在其他实施方案中，所述葡萄糖的低聚物选自果糖、蔗糖、淀粉、纤维二糖、麦芽糖、乳糖和纤维素。

在一些实施方案中，在所述重组微生物中，具有转酮醇酶活性的酶或具有果糖-6-磷酸磷酸酮醇酶活性的酶的表达能够使一种或多种己糖原料无损转化为一种或多种戊糖-5-磷酸中间体。

在一些实施方案中，所述重组微生物通过C2途径中乙醇醛的转化和C3途径中磷酸二羟丙酮(DHAP)或丙酮酸的转化，生产MEG或乙醇酸(GA)。在其他实施方案中，乙醇醛由乙醇醛脱氢酶氧化为乙醇酸。

在一些实施方案中，用于通过C3途径中DHAP或丙酮酸的转化来生产MEG或GA的至少一种酶选自具有选自以下的活性的至少一种酶：3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、丝氨酸转氨酶活性、羟基丙酮酸脱羧酶活性、3-磷酸羟基丙酮酸还原酶活性、乙醇醛还原酶活性、乙醇醛脱氢酶活性、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶活性、丝氨酸脱羧酶活性、乙醇胺转氨酶或乙醇胺氧化还原酶(脱氨基)活性、甘油酸脱羧酶活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性和甘油酸2-激酶活性。

在一些实施方案中，所述重组微生物通过C2途径中乙醇醛的转化生产MEG或乙醇酸(GA)，并通过C3途径中磷酸二羟丙酮(DHAP)或丙酮酸的转化生产一种或多种联产品。在其他实施方案中，所述一种或多种联产品选自丙酮、异丙醇、丙烯、异丁烯和一种或多种丝氨酸途径化合物。在一些优选的实施方案中，所述一种或多种丝氨酸途径化合物选自丝氨酸、甘氨酸、单乙醇胺(MEA)和乙二胺(EDA)。

在一些实施方案中，用于通过C3途径中DHAP或丙酮酸的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶：硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A：乙酰乙酸转移酶或乙酸：乙酰乙酰辅酶A水解酶活性和乙酰乙酸脱羧酶活性，并且所述一种或多种联产品包含丙酮。

在一些实施方案中，用于通过C3途径中DHAP或丙酮酸的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶：硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A：乙酰乙酸转移酶或乙酸：乙酰乙酰辅酶A水解酶活性、乙酰乙酸脱羧酶活性和仲醇脱氢酶活性，并且所述一种或多种联产品包含异丙醇。

在一些实施方案中，用于通过C3途径中DHAP或丙酮酸的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶：硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A：乙酰乙酸转移酶或乙酸：乙酰乙酰辅酶A水解酶活性、乙酰乙酸脱羧酶活性、仲醇脱氢酶活性和脱水酶活性，并且所述一种或多种联产品包含丙烯。

在一些实施方案中，用于通过C3途径中DHAP或丙酮酸的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶：硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A：乙酰乙酸转移酶或乙酸：乙酰乙酰辅酶A水解酶活性、乙酰乙酸脱羧酶活性、3-羟基异戊酸(3HIV)合酶活性、羟甲基戊二酰辅酶A合酶活性、甲基戊烯二酰辅酶A水合酶活性、甲基巴豆酰辅酶A羧化酶活性、甲基巴豆酰辅酶A水合酶活性、3-羟基异戊酰辅酶A硫酯酶活性、3HIV激酶活性、3HIV-3-磷酸脱羧酶活性和3HIV脱羧酶活性，并且所述一种或多种联产品包含异丁烯。

在一些实施方案中，用于通过C3途径中DHAP或丙酮酸的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶：3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性和甘油酸2-激酶活性，并且其中所述一种或多种联产品包含L-丝氨酸。

在一些实施方案中，用于通过C3途径中DHAP或丙酮酸的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶：丝氨酸羟甲基转移酶活性、转移酶活性、甲醛脱氢酶活性、甲酸脱氢酶活性、与甘氨酸裂解系统相关的活性、3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、丝氨酸转氨酶活性、羟基丙酮酸脱羧酶活性、丝氨酸氧化还原酶(脱氨基)活性、丝氨酸脱羧酶活性、乙醇胺转氨酶或乙醇胺氧化还原酶(脱氨基)活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性、甘油酸2-激酶活性、乙醇醛脱氢酶活性、乙醇酸脱氢酶活性、丙氨酸-乙醛酸转氨酶活性、丙氨酸转氨酶活性和NAD(P)H依赖性谷氨酸脱氢酶活性，并且一种或多种联产品包含甘氨酸。在另一个实施方案中，与甘氨酸裂解系统相关的活性包含选自以下的酶或蛋白：甘氨酸脱羧酶(P蛋白)、氨甲基转移酶(T蛋白)、二氢硫辛酰胺脱氢酶(L蛋白)和H蛋白。

在一些实施方案中，用于通过C3途径中DHAP或丙酮酸的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶：3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、转氨酶活性、羟基丙酮酸脱羧酶活性、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶活性、丝氨酸脱羧酶活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性、甘油酸2-激酶活性、乙醛脱氢酶活性和乙醇胺解氨酶活性，并且所述一种或多种联产品包含单乙醇胺(MEA)。

在一些实施方案中，用于通过C3途径中DHAP或丙酮酸的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶：丝氨酸脱氢酶活性、2-氨基丙二酸半醛脱羧酶活性、氨基乙醛转氨酶活性、2-氨基丙二酸半醛转氨酶活性、2,3-二氨基丙酸脱羧酶活性、丝氨酸脱羧酶活性、乙醇胺脱氢酶活性、丝氨酸羟甲基转移酶活性、醛氧化酶活性、N-乙酰转移酶或O-乙酰转移酶活性、N-乙酰丝氨酸脱氢酶活性、转氨酶活性、脱乙酰酶活性、丝氨酸氨基酶活性和2,3-二氨基丙酸解氨酶活性，并且所述一种或多种联产品包含乙二胺(EDA)。

在一些实施方案中，用于通过C2途径中乙醇醛的转化生产MEG或GA的至少一种酶选自具有选自以下的活性的至少一种酶：D-塔格糖3-差向异构酶活性、D-核酮糖激酶活性、D-核酮糖-1-磷酸醛缩酶活性、D-木酮糖1-激酶活性、D-木酮糖-1-磷酸醛缩酶活性、木糖还原酶或醛糖还原酶活性、木糖醇脱氢酶活性、木糖异构酶活性、木糖脱氢酶活性、木糖酸内酯酶活性、木糖酸脱氢酶活性、2-酮-3-脱氧-D-戊酸醛缩酶活性、乙醇醛还原酶活性和乙醇醛脱氢酶活性。在一些实施方案中，具有D-木酮糖-1-磷酸醛缩酶活性的酶是aldoB。在一些实施方案中，具有D-核酮糖-1-磷酸醛缩酶活性的酶是fucA。

在上述任何重组微生物的一些实施方案中，所述重组微生物进一步包含一种或多种修饰，以减少或缺失乙醇醛脱氢酶、乳酸脱氢酶、木糖异构酶、木酮糖激酶或其组合的活性。

在一个实施方案中，将至少一部分在C3途径中生产的过量NADH用作C2途径中还原当量的来源。在另一个实施方案中，将至少一部分在C3途径中生产的过量NADH用于生产ATP。

在一个实施方案中，最小化过量的生物质形成，并且最大化MEG(或乙醇酸)或MEG(或乙醇酸)和一种或多种联产品的生产。

在另一方面，本申请提供了一种使用上述实施方案中任一项所述的重组微生物生产MEG或乙醇酸(GA)的方法，其中所述方法包括在含有提供碳源的一种或多种己糖原料的培养介质中培养重组微生物，直至生产MEG或GA。在一些实施方案中，一种或多种联产品与MEG或GA联产。在进一步的实施方案中，所述一种或多种联产品选自丙酮、异丙醇、丙烯、异丁烯和一种或多种丝氨酸途径化合物。在仍进一步的实施方案中，所述一种或多种丝氨酸途径化合物选自丝氨酸、甘氨酸、单乙醇胺(MEA)和乙二胺(EDA)。

在又一方面，一种生产重组微生物的方法，所述重组微生物通过一种或多种戊糖-5-磷酸中间体由一种或多种外源己糖原料生产或积累MEG或乙醇酸(GA)，所述方法包括：在重组微生物中引入或表达一种或多种酶，其用于将一种或多种己糖原料转化为一种或多种戊糖-5-磷酸中间体；在重组微生物中引入或表达一种或多种酶，其用于将一种或多种戊糖-5-磷酸中间体转化为一种或多种戊糖或戊糖-1-磷酸中间体；在重组微生物中引入或表达一种或多种C2途径，其包含一种或多种用于从乙醇醛生产MEG或GA的酶；在重组微生物中引入或表达一种或多种C3途径，其包含一种或多种用于生产衍生自DHAP或丙酮酸的MEG或GA的酶；以及在含有一种或多种己糖原料的培养介质中培养重组微生物以生产或积累MEG或GA，其中乙醇醛和DHAP(或丙酮酸)是C2途径中生产的中间体，并且其中C2和C3两种途径中均生产MEG或GA。

在一些实施方案中，本申请提供了一种生产重组微生物的方法，所述微生物通过一种或多种戊糖-5-磷酸中间体由一种或多种外源己糖原料生产或积累MEG或乙醇酸(GA)和一种或多种联产品，所述方法包括：在重组微生物中引入或表达一种或多种酶，其用于将一种或多种己糖原料转化为一种或多种戊糖-5-磷酸中间体；在重组微生物中引入或表达一种或多种酶，其用于将一种或多种戊糖-5-磷酸中间体转化为一种或多种戊糖或戊糖-1-磷酸中间体；在重组微生物中引入或表达一种或多种C2途径，其包含一种或多种用于从乙醇醛生产MEG或GA的酶；在重组微生物中引入或表达一种或多种C3途径，其包含一种或多种用于生产一种或多种衍生自DHAP或丙酮酸的联产品的酶；在含有一种或多种己糖原料的培养介质中培养重组微生物以生产或积累MEG或GA和一种或多种联产品，其中乙醇醛和DHAP(或丙酮酸)是C2途径中生产的中间体，其中在一种或多种C2途径中生产MEG或GA，并且在一种或多种C3途径中生产一种或多种联产品。

附图说明

附图中说明了本公开的说明性实施方案，其中：

图1说明了葡萄糖无损转化为磷酸戊糖。符号

意为将可能下调或失活/消除的酶，即各自的基因可能减弱或缺失。

图2说明了MEG和可能的通过D-木酮糖-1-磷酸的联产途径。

图3说明了MEG和可能的通过D-木糖酸的联产途径。

图4说明了MEG和可能的通过D-核酮糖-1-磷酸的联产途径。

图5说明了通过戊糖磷酸酶(PP)连接磷酸戊糖途径和MEG生产途径的选项方案。

图6说明了通过阿糖醇磷酸脱氢酶(APD)由磷酸戊糖途径生产戊糖-1-磷酸和衍生物的方案。

图7说明了由阿糖醇磷酸脱氢酶(APD)介导的磷酸戊糖的异构化。

图8说明了通过磷酸戊糖变位酶(PPM)由磷酸戊糖途径生产戊糖-1-磷酸和衍生物的方案。

图9说明了葡萄糖无损转化为磷酸戊糖和乙酰辅酶A。符号

图10说明了MEG和Ser、Gly、MEA、EDA联产途径的概述。

图11说明了已公开的EDA生产途径。来自WO 2014/049382。反应F：通过L-丝氨酸氨基酶，直接将L-丝氨酸氨基化。反应G：通过2,3-二氨基丙酸解氨酶，直接将丙酮酸氨基化。

图12说明了使用磷酸酶由葡萄糖生物合成木糖醇的途径。符号

图13说明了使用阿糖醇-P脱氢酶(ADP)由葡萄糖生物合成木糖醇的途径。符号

图14说明了使用磷酸戊糖变位酶(PPM)由葡萄糖生物合成木糖醇的途径。符号

图15是磷酸葡萄糖变位酶对其天然底物葡萄糖-1P的体外测定的方案。

图16是通过磷酸葡萄糖变位酶作用于关键的戊糖-5P中间体，将戊糖体外转化为乙醇酸前体的方案。

图17是用于促进戊糖转化为乙醇酸的关键候选酶的体内筛选方案。

图18是通过醛缩酶作用于关键的戊糖-1P中间体，将戊糖体外转化为乙醇酸前体的方案。

具体实施方式

定义

以下定义和缩写将用于解释本公开。

如本文和所附权利要求中使用的，单数形式“一(a)”、“一个(an)”和“所述……(the)”包括复数所指对象，除非上下文另有明确规定。因此，例如，提及“一种酶”包括多种这样的酶，提及“所述微生物”包括提及一种或多种微生物，等等。

如本文所用，术语“包含(comprises)”、“包含(comprising)”、“包括(includes)”、“包括(including)”、“具有(has)”、“具有(having)”、“含有(contains)”、“含有(containing)或其任何其他变体旨在涵盖非排他性的包含。包含元素列表的组合物、混合物、过程、方法、物品或装置不必须仅限于那些元素，而是可以包括其他未明确列出的元素或此类组合物、混合物、过程、方法、物品或装置所固有的其他元素。此外，除非另有明确相反说明，“或”是指包含性的“或”，而不是排他性的“或”。

如本文所用，修饰数值的术语“约”和“左右”表示围绕该明确值的近距离范围。如果“X”是该值，则“约X”或“X左右”将指示0.9X至1.1X的值，或在一些实施方案中，0.95X至1.05X的值。对“约X”或“X左右”的任何提及具体表示至少以下值：X、0.95X、0.96X、0.97X、0.98X、0.99X、1.01X、1.02X、1.03X、1.04X和1.05X。因此，“约X”和“X左右”旨在对权利要求的限定(例如“0.98X”)进行教导和提供书面描述支持。

如本文所用，术语“微生物的(microbial)”和“微生物(microbial organism,microorganism)”包括在古细菌、细菌或真核生物界内作为微观细胞存在的任何生物体，所述真核生物包括酵母和丝状真菌、原生动物、藻类或高等原生生物。因此，该术语旨在涵盖具有微观尺寸的原核或真核细胞或生物体，并且包括所有物种的细菌、古细菌和真细菌，以及真核微生物如酵母和真菌。还包括可以培养用于生产化学品的任何物种的细胞培养物。

如本文所述，在一些实施方案中，所述重组微生物是原核微生物。在一些实施方案中，所述原核微生物是细菌。“细菌”或“真细菌”是指原核生物的界。细菌包括至少十一个不同的组，如下：(1)革兰氏阳性(gram+)菌，其中有两大主要分支：(1)高G+C组(放线菌属(Actinomycetes)、分枝杆菌属(Mycobacteria)、微球菌属(Micrococcus)和其他)(2)低G+C组(芽孢杆菌属(Bacillus)、梭菌属(Clostridia)、乳杆菌属(Lactobacillus)、葡萄球菌属(Staphylococci)、链球菌属(Streptococci)和支原体属(Mycoplasmas))；(2)变形菌(Proteobacteria)，例如紫色光合+非光合革兰氏阴性菌(包括大多数“常见”革兰氏阴性菌)；(3)蓝细菌(Cyanobacteria)，例如产氧光养菌(oxygenic phototroph)；(4)螺旋体(Spirochetes)及相关物种；(5)浮霉状菌属(Planctomyces)；(6)拟杆菌属(Bacteroides)、黄杆菌属(Flavobacteria)；(7)衣原体属(Chlamydia)；(8)绿色硫细菌(Green sulfurbacteria)；(9)绿色非硫细菌(Green non-sulfur bacteria，也是厌氧光养菌(anaerobicphototroph))；(10)抗辐射微球菌及其相关；(11)栖热袍菌(Thermotoga)和栖热腔菌(Thermosipho)嗜热菌。

“革兰氏阴性菌”包括球菌、非肠杆菌(nonenteric rods)和肠杆菌(entericrods)。革兰氏阴性菌的属包括例如：奈瑟氏菌属(Neisseria)、螺旋菌属(Spirillum)、巴氏杆菌属(Pasteurella)、布鲁氏菌属(Brucella)、耶尔森氏菌属(Yersinia)、弗朗西斯氏菌属(Francisella)、嗜血杆菌属(Haemophilus)、博德特氏菌属(Bordetella)、埃希氏菌属(Escherichia)、沙门氏菌属(Salmonella)、志贺氏菌属(Shigella)、克雷伯氏菌属(Klebsiella)、变形杆菌属(Proteus)、弧菌属(Vibrio)、假单胞菌属(Pseudomonas)、拟杆菌属(Bacteroides)、醋杆菌属(Acetobacter)、气杆菌属(Aerobacter)、土壤杆菌属(Agrobacterium)、固氮菌属(Azotobacter)、螺旋菌属(Spirilla)、沙雷氏菌属(Serratia)、弧菌属(Vibrio)、根瘤菌属(Rhizobium)、衣原体属(Chlamydia)、立克次氏体属(Rickettsia)、密螺旋体属(Treponema)和梭杆菌属(Fusobacterium)。

“革兰氏阳性菌”包括球菌、非孢子杆菌(nonsporulating rods)和孢子杆菌(sporulating rods)。革兰氏阳性菌的属包括例如：放线菌属(Actinomyces)、芽孢杆菌属(Bacillus)、梭菌属(Clostridium)、棒杆菌属(Corynebacterium)、丹毒丝菌属(Erysipelothrix)、乳杆菌属(Lactobacillus)、李斯特菌属(Listeria)、分枝杆菌属(Mycobacterium)、粘球菌属(Myxococcus)、诺卡氏菌属(Nocardia)、葡萄球菌属(Staphylococcus)、链球菌属(Streptococcus)和链霉菌属(Streptomyces)。

术语“重组微生物”和“重组宿主细胞”在本文中可互换使用，是指已被遗传修饰以表达或过表达内源性酶、表达异源酶(如包括在载体中、在整合构建体中的那些酶)、或内源基因的表达发生改变的微生物。“改变(alteration)”意为基因的表达、或编码一种或多种多肽或多肽亚基的RNA分子或等效RNA分子的水平、或一种或多种多肽或多肽亚基的活性被上调或下调，使得表达、水平或活性大于或小于在没有改变的情况下观察到的表达、水平或活性。例如，术语“改变(alter)”可以表示“抑制”，但“改变”一词的使用不限于此定义。应理解，术语“重组微生物”和“重组宿主细胞”不仅指特定的重组微生物，而且指此类微生物的后代或潜在后代。因为由于突变或环境影响，某些修饰可能在后代中发生，所以这样的后代实际上可能与亲本细胞不同，但仍包括在本文所用的术语的范围内。

与基因序列相关的术语“表达”是指基因的转录，以及在适当情况下，指所得mRNA转录物翻译成蛋白质。因此，如从上下文可以清楚看出的，蛋白质的表达是由开放阅读框序列的转录和翻译引起的。可以基于细胞中存在的相应mRNA的量或由选定序列编码的所需产物的量，来确定宿主细胞中所需产物的表达水平。例如，可以通过qRT-PCR或Northern杂交定量由选定序列转录的mRNA(参见Sambrook等人，Molecular Cloning：A LaboratoryManual,Cold Spring Harbor Laboratory Press(1989))。可以通过各种方法定量由所选择的序列编码的蛋白质，例如通过ELISA，通过测定该蛋白质的生物活性，或通过使用独立于这种活性的测定，如蛋白质印迹或放射免疫测定(使用识别并结合该蛋白质的抗体)。参见Sambrook等人，1989，同上。

在本文中，术语“多核苷酸”可与术语“核酸”互换使用，是指由两种或多种单体组成的有机聚合物，其包括核苷酸、核苷或其类似物，包括但不限于单链或双链、有义或反义的任何长度的脱氧核糖核酸(DNA)，以及在适当情况下，包括单链或双链、有义或反义的任何长度的核糖核酸(RNA)(包括siRNA)。术语“核苷酸”是指由连接到嘌呤或嘧啶碱基和磷酸基团的核糖或脱氧核糖组成的几种化合物中的任一种，并且是核酸的基本结构单元。术语“核苷”是指由嘌呤或嘧啶碱基与脱氧核糖或核糖组合组成的化合物(如鸟苷或腺苷)，尤其见于核酸中。术语“核苷酸类似物”或“核苷类似物”分别是指一种核苷酸或核苷，其中一个或多个单个原子被不同的原子或不同的官能团替换。相应地，术语多核苷酸包括任何长度的核酸、DNA、RNA、其类似物及其片段。三个或更多核苷酸的多核苷酸也称为核苷酸低聚物或寡核苷酸。

应理解，本文所述的多核苷酸包括“基因”，本文所述的核酸分子包括“载体”或“质粒”。相应地，术语“基因”，也称为“结构基因”，是指编码特定氨基酸序列的多核苷酸，其包含一种或多种蛋白质或酶的全部或部分，并且可以包括调节性(非转录)DNA序列，如启动子序列，其决定例如基因表达的条件。基因的转录区可以包括非翻译区，包括内含子、5'-非翻译区(UTR)和3'-UTR，以及编码序列。

如本文所用，术语“酶”是指催化或促进一种或多种化学或生化反应的任何物质，其通常包括完全或部分由一种或多种多肽组成的酶，但也可以包括由包括多核苷酸的不同分子组成的酶。

如本文所用，术语“非天然存在的”，当用于提及本公开的微生物或酶活性时，旨在表示该微生物或酶具有至少一种在参考物种的天然存在的株(包括参考物种的野生型株)中通常不存在的遗传改变。遗传改变包括例如，引入编码代谢多肽的可表达核酸的修饰、其他核酸添加、核酸缺失和/或微生物遗传物质的其他功能破坏。此类修饰包括例如，参考物种的异源、同源或异源和同源多肽的编码区及其功能片段。其他修饰包括例如，其中的修饰改变基因或操纵子的表达的非编码调控区。示例性的非天然存在的微生物或酶活性包括上述羟基化活性。

如本文所用，关于各种分子(例如多核苷酸、多肽、酶等)的术语“外源的”是指在自然界中给定酵母、细菌、生物体、微生物或细胞中通常或天然不存在和/或由其生产的分子。

另一方面，如本文所用，关于各种分子(例如多核苷酸、多肽、酶等)的术语“内源的”或“天然的(native)”是指在自然界中给定酵母、细菌、生物体、微生物或细胞中通常或天然存在和/或由其生产的分子。

如本文的上下文中使用的，修饰的宿主细胞的术语“异源的”是指各种分子(例如多核苷酸、多肽、酶等)，其中以下至少一项为真：(a)该分子对于宿主细胞是外来的(“外源的”)(即，不是天然存在于宿主细胞中的)；(b)该分子天然存在于(例如，是“内源的”)给定的宿主微生物或宿主细胞中，但在细胞中的非天然位置或以非天然的量生产；和/或(c)该分子在核苷酸或氨基酸序列上与内源性核苷酸或氨基酸序列不同，使得在核苷酸或氨基酸序列上与内源性存在的内源性核苷酸或氨基酸不同的该分子在细胞中以非天然的(例如，大于天然存在的)量生产。

如本文所用，关于第一家族或物种的原始酶或基因的术语“同源物”是指第二家族或物种的不同酶或基因，其通过功能、结构或基因组分析确定为对应于第一家族或物种的原始酶或基因的第二家族或物种的酶或基因。同源物通常具有功能、结构或基因组相似性。已知技术可以容易地使用遗传探针和PCR克隆酶或基因的同源物。可以使用基因的功能测定和/或基因组作图来确认克隆序列作为同源物的特性。

如果基因编码的氨基酸序列与第二基因的氨基酸序列相似，则该蛋白质与第二蛋白质具有“同源性”或为“同源的”。或者，如果两个蛋白质具有“相似”的氨基酸序列，则该蛋白质与第二蛋白质具有同源性。因此，术语“同源蛋白质”旨在表示两种蛋白质具有相似的氨基酸序列。在某些情况下，两种蛋白质之间的同源性表明其与进化相关的共有祖先。认为、相信或已知术语“同源序列”或“同源物”在功能上相关。可以通过多种方式中的任何一种来表示函数关系，所述方式包括但不限于：(a)序列同一性的程度和/或(b)相同或相似的生物学功能。优选地，同时表明(a)和(b)。序列同一性的程度可以变化，但在一个实施方案中，为至少50％(当使用本领域已知的标准序列比对程序时)、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少约91％、至少约92％、至少约93％、至少约94％、至少约95％、至少约96％、至少约97％、至少约98％、或至少98.5％、或至少约99％、或至少99.5％、或至少99.8％、或至少99.9％。可以使用本领域中容易获得的软件程序来确定同源性，例如在Current Protocols in Molecular Biology(F.M.Ausubel等人，eds.,1987)附录30，7.718节，表7.71中讨论的那些程序。MacVector(Oxford MolecularLtd,Oxford,U.K)和ALIGN Plus(Scientific and Educational Software,Pennsylvania)是一些比对程序。其他非限制性比对程序包括Sequencher(Gene Codes,Ann Arbor,Michigan)、AlignX和Vector NTI(Invitrogen,Carlsbad,CA)。相似的生物学功能可以包括但不限于：催化相同或相似的酶促反应；对底物或辅因子具有相同或相似的选择性；具有相同或相似的稳定性；对各种发酵条件(温度、pH值等)具有相同或相似的耐受性；和/或对各种代谢底物、产物、副产物、中间体等具有相同或相似的耐受性。生物功能的相似程度可以变化，但在一个实施方案中，为至少1％、至少2％、至少3％、至少4％、至少5％、至少6％、至少7％、至少8％、至少9％、至少10％、至少20％、至少30％、至少40％、至少50％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少约91％、至少约92％、至少约93％、至少约94％、至少约95％、至少约96％、至少约97％、至少约98％、或至少98.5％、或至少约99％、或至少99.5％、或至少99.8％、或至少99.9％，根据本领域技术人员已知的一种或多种测定来确定给定的生物学功能。

术语“变体”是指本文所述的任何多肽或酶。变体还涵盖多聚体(multimer)的一种或多种组分、包含单个组分的多聚体、包含多个单个组分的多聚体(例如参考分子的多聚体)、化学分解产物和生物分解产物。特别地，在非限制性实施方案中，由于编码参考酶的多肽序列的任何部分的改变，该酶可以是相对于参考酶的“变体”。在用于测量参考酶制剂的酶活性的标准测定中，参考酶的变体可以具有至少10％、至少30％、至少50％、至少80％、至少90％、至少100％、至少105％、至少110％、至少120％、至少130％或更高的酶活性。在一些实施方案中，变体还可以指与本公开的全长或未加工的酶具有至少50％、至少60％、至少70％、至少80％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％或至少99％的序列同一性的多肽。在一些实施方案中，变体还可以指与本公开的成熟或加工的酶具有至少50％、至少60％、至少70％、至少80％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％或至少99％的序列同一性的多肽。

如本文所用，术语“信号序列”是指将肽和多肽靶向至细胞位置或细胞外环境的氨基酸序列。信号序列通常位于多肽的N-末端部分，并且通常被酶促去除。具有其信号序列的多肽称为全长的和/或未加工的。已去除其信号序列的多肽称为成熟的和/或加工的。

如本文所用，术语“产率潜力(yield potential)”是指来自生物合成途径的产物的产率。在一个实施方案中，产率潜力可以表示为每重量起始化合物的最终产物的重量百分比。

如本文所用，术语“热力学最大产率(thermodynamic maximum yield)”是指基于产物与原料相比的能量值，由给定原料(如葡萄糖)的发酵获得的产物的最大产率。例如，在正常发酵中，如果不使用额外的能源(如光、氢气或甲烷或电力)，则产物不能比原料含有更多能量。热力学最大产率表示来自原料的所有能量和质量都转化为产物的产物产率。该产率可以计算，并且与特定途径无关。如果通向产物的特定途径的产率低于热力学最大产率，则其损失质量，并且很可能可以改进为或以更有效的通向该产物的途径取代。

术语“氧化还原平衡的(redox balanced)”是指一组反应，其总体生产与消耗一样多的氧化还原辅因子。设计代谢途径和工程化生物体，使得氧化还原辅因子平衡或接近平衡，通常会导致所需化合物的生产效率更高、产率更高。氧化还原反应总是同时发生，因为一个氧化反应和另一个还原反应这两个半反应同时发生。在氧化还原过程中，还原剂将电子转移至氧化剂。因此，在该反应中，还原剂(reductant,reducing agent)失去电子并被氧化，氧化剂(oxidant,oxidizing agent)获得电子并被还原。在一个实施方案中，氧化还原反应发生在生物系统中。经常通过氧化还原反应储存和释放生物能量。光合作用涉及将二氧化碳还原为糖类和将水氧化为分子氧。逆反应呼吸作用将糖类氧化以生产二氧化碳和水。作为中间步骤，还原的碳化合物用于还原烟酰胺腺嘌呤二核苷酸(NAD+)，其随后促进产生质子梯度，所述质子梯度驱动三磷酸腺苷(ATP)的合成并由氧的还原维持。术语氧化还原状态通常用于描述生物系统(如细胞或器官)中GSH/GSSG、NAD+/NADH和NADP+/NADPH的平衡。氧化还原状态反映在几组代谢物(例如乳酸和丙酮酸、β-羟基丁酸和乙酰乙酸)的平衡中，其互变取决于这些比率。异常氧化还原状态可以在各种有害情况(如缺氧、休克和败血症)下发展。

如本文所用，术语“C2途径”、“C2分支途径”、“C2生化途径”或“C2流”是指其中可以通过乙醇醛生产MEG的生化途径。

如本文所用，术语“C3途径”、“C3分支途径”、“C3生化途径”或“C3流”是指其中可以通过丙酮酸、乙酰辅酶A或磷酸二羟丙酮(DHAP)生产MEG和/或一种或多种联产品(如丙酮、异丙醇、丙烯、异丁烯和/或丝氨酸途径化合物)的生化途径。

引言

本公开将木糖降解生物化学用于高产率形成MEG(或乙醇酸)或MEG(或乙醇酸)和联产品的优点，与容易获得的纯己糖原料的优点相组合。其通过如下实现：通过任一种前述基于D-木糖的方法，提供将己糖葡萄糖无损转化为中间体D-木酮糖-5-磷酸，并进一步转化为戊糖D-木酮糖或D-核酮糖，以用作生产MEG(或乙醇酸)或MEG(或乙醇酸)和联产品的中间体。除葡萄糖之外，还可以使用其他己糖(如果糖)或己糖寡糖(如淀粉或蔗糖或纤维二糖)。在一些实施方案中，己糖可以选自D-阿洛糖、D-阿卓糖、D-葡萄糖、D-甘露糖、D-古洛糖、D-艾杜糖、D-半乳糖、D-塔洛糖、D-塔格糖、D-山梨糖、D-果糖、D-阿洛酮糖和本领域已知的其他己糖。在一些实施方案中，戊糖可以选自D-木糖、D-核糖、D-阿拉伯糖、D-来苏糖、D-木酮糖、D-核酮糖和本领域已知的其他戊糖。在一些实施方案中，己糖和戊糖可以选自本文公开的任何己糖和戊糖的左旋或右旋对映异构体。

与其他基于葡萄糖的MEG或乙醇酸生产方法相比，本方法解决了以下问题：ATP短缺(如果利用联产)；NADH大幅过量；整体产品产率潜力低。

与其他基于木糖的MEG或乙醇酸生产方法相比，本方法解决了以下挑战和问题：依赖于木糖的过程(可得性/市场限制、价格、纯度)；葡萄糖诱导的木糖利用抑制。

WO2010/076324(或US2011/0294178；Metabolic Explorer)中描述了发酵性MEG生产，其全文并入本文。该申请建议通过2-酮酸脱羧和还原生产二醇，包括基于丝氨酸生物合成的途径生产中间体羟基丙酮酸并进一步生产乙二醇。然而，该公开的途径具有降低的总产率潜力，其为0.69g_MEG/g_葡萄糖，而葡萄糖→MEG转化的热力学最大产率为0.82g/g。该途径也不是氧化还原平衡的，并且具有高度过量的NADH，消耗的每mol葡萄糖对应2mol过量的NADH，需要重新氧化所有NADH以使细胞存活。在有氧发酵中，这种NADH可以用于生成ATP，但ATP会大量过量(2NADH→6ATP)，导致在生产阶段形成过量的生物质，从而降低产品形成和产率。

因此，WO2010/076324中公开的发酵性MEG生产途径具有ATP短缺(每个MEG对应-1ATP)、过量NADH(每个MEG对应+1NADH)、低产率潜力(ymax＝0.69g_MEG/g_葡萄糖)，并且是尚未被证明具有高效率/生产率的具有挑战性的途径。

WO2011/130378A1(或US2011/0312049；Genomatica)的公开内容提出了一种类似于WO2010/076324的方法，其通过羟基丙酮酸由葡萄糖生产MEG，但也提到了具有可选的但相关的关键中间体甘油酸或乙醇胺的途径变化。

除了ATP短缺之外，WO2011/130378A1的公开与WO2010/076324具有相同的缺点。每个MEG可以对应+0ATP或+1ATP，取决于所利用的酶。

在乙醇酸的情况下，所描述的由葡萄糖的途径也通过3-磷酸甘油酸和丝氨酸途径的反应，或通过乙醛酸旁路。在这两种情况下，每个乙醇酸损失一个CO₂，导致最大产率(0.84g/g)远低于热力学最大产率潜力(1.7g/g)。

已证实通过核酮糖-1-磷酸由木糖发酵生产MEG(WO2013/126721)具有高产率潜力(0.82g_MEG/g_木糖)，其等于热力学最大产率。其通过2-碳流(通过乙醇醛)和3-碳流(通过磷酸二羟丙酮)这两种不同的并行活性途径生产MEG。C2流易于实施，但C3流难以通过代谢工程化高效实施。C3流利用WO2010/076324或WO2011/130378中所示的途径。

假设典型地由ATP驱动木糖输入，则整个过程至少是ATP中性的。因此，为了获得细胞生长和维持所需的一些多余ATP，将损失一些木糖并因此损失产率。

然而，葡萄糖是大多数微生物的首选碳源，木糖的摄入不像葡萄糖的摄入那样有效和快速。此外，培养介质中葡萄糖的存在通常会抑制其他糖类(如木糖)的利用。为了更有效的过程，需要破坏导致这种优先消耗的生物体调节，并使株适应木糖优先或糖的共同消耗。

然而，关键的挑战是获得作为负担得起的清洁原料的木糖。作为纯化学品的木糖价格昂贵且不能大量供应。半纤维素水解物中的木糖的量较多且成本可能低于葡萄糖，但伴随着许多杂质和抑制发酵的物质。

因此，由木糖发酵生产MEG(或乙醇酸)(WO2013/126721)对使用木糖作为原料(可得性、价格、纯度、葡萄糖对木糖利用的抑制)和使用C3途径提出了挑战，其尚未在高效率/生产力方面得到证明。此外，存在ATP短缺，+0ATP(如果不使用甘油酸激酶，则为-1ATP)，其不足以维持细胞。

已进一步证实的通过木酮糖-1-磷酸由木糖发酵生产MEG(Alkim等人，MicrobCell Fact(2015)14：127)，与WO2013/126721描述的途径非常相似。其具有相同的高产率潜力(0.82g/g)，难以通过DHAP实施MEG生产的C3流，ATP短缺和原料的挑战。

另外的已证实的通过木糖酸由木糖发酵生产MEG(WO2013/119020)，与WO2013/126721描述的途径有相似之处。其生产乙醇醛和丙酮酸作为关键中间体，以允许以0.41g/g的产率潜力由乙醇醛生产MEG。这代表了高相对产率，因为它的实现仅用了一半的流。然而，WO2013/119020或别处没有介绍将剩余的丙酮酸转化为MEG的途径。目前，没有已知的现实和有效的途径将丙酮酸转化为MEG。虽然丙酮酸本身作为联产品使得整个过程是氧化还原中性的(+0NADH)，但其不是经济上令人关注的产品，并且该过程将缺乏1ATP(对于丙酮酸输出可能还多～2ATP)。因此，理想情况下，需要丙酮酸衍生的、经济上令人关注的高产率联产品，以递送多余ATP。因此，通过木糖酸由木糖发酵生产MEG(WO2013/119020)对以下方面提出了挑战：使用木糖作为原料(可得性、价格、纯度、葡萄糖对木糖利用的抑制)、MEG的绝对产率低、ATP短缺(其可能是-1至有丙酮酸时-3ATP，取决于联产品)、并且需要具有高产率潜力和多余ATP的丙酮酸衍生的联产品。

美国申请号62/305814、美国申请号62/430742和美国申请号62/406684各自整体并入本文，其描述了高产率且容易实施的用于联产MEG和化合物(如丙酮、异丙醇(IPA)、丙烯或异丁烯)的途径，并且为上述MEG生产方法的大部分已描述的挑战提供了解决方案。此外，其为上述由葡萄糖生产IPA或异丁烯时遇到的挑战提供了解决方案。

所有目前已知的使用葡萄糖作为原料的MEG(或乙醇酸)生产方法均具有低产率潜力。这是葡萄糖被降解为MEG的生物化学的固有缺点，对于所有建议的和已知的途径，每个生产的MEG(或乙醇酸)分子发生一次脱羧。然而，每个MEG一次脱羧过多，不能达到氧化还原中性，因此也不能达到最佳产率。

由于利用特定的和有利的木糖降解生物化学，导致或接近理想的每个MEG分子0.5脱羧反应，使得所有展示的利用木糖作为原料的MEG(或乙醇酸)生产方法均具有高产率潜力或高相对产率潜力。然而，所有这些方法共有的挑战是使用木糖为原料，如其市场局限性和由原料杂质导致的技术挑战。

本公开将木糖降解生物化学用于高产率形成MEG(或乙醇酸)或任选MEG(或乙醇酸)和一种或多种联产品的优点，与容易获得的纯己糖原料的优点相组合。其通过如下实现：通过任一种前述基于D-木糖的方法，提供将己糖葡萄糖无损转化为中间体D-木酮糖-5-磷酸，并进一步转化为戊糖D-木酮糖或D-核酮糖，以用作生产MEG(或乙醇酸)或任选MEG(或乙醇酸)和一种或多种联产品的中间体。通过氧化乙醇醛，可以生产乙醇酸(GA)而不是MEG。除葡萄糖以外，也可以使用其他己糖(如果糖)或己糖寡糖(如淀粉或蔗糖)。

与其他基于葡萄糖的MEG(或乙醇酸)生产方法相比，本发明的重组微生物和方法解决了：ATP短缺的问题(如果利用联产)；NADH大幅过量的问题；整体产品产率潜力低的问题。

与其他基于木糖的MEG(或乙醇酸)生产方法相比，本发明的重组微生物和方法解决了：依赖于木糖的过程(可得性/市场限制、价格、纯度)的挑战，和葡萄糖诱导的木糖利用抑制的问题。

本公开涉及由己糖生产MEG，或任选MEG和一种或多种联产品，优选在大肠杆菌中生产。可选地，通过氧化乙醇醛，可以生产乙醇酸(GA)而不是MEG。

如果通过糖酵解(大肠杆菌和大多数其他生物体的标准降解途径)利用葡萄糖，则将通过3-磷酸甘油酸(至今描述的所有葡萄糖到MEG的方法的共同关键中间体)降解葡萄糖。然而，对于所有描述的途径变化都为真的是，该3-碳化合物降解为2-碳化合物(MEG)，每个MEG损失一个CO₂，其中NADH过量并意味着产率潜力的显著损失(仅0.69g_MEG每克糖，对比0.82g_MEG的热力学最大产率潜力)。

利用非氧化进入磷酸戊糖途径

在本公开中，将葡萄糖流输送至磷酸戊糖途径而不是糖酵解途径(图1)。将转酮醇酶(如由来自大肠杆菌的tktA或tktB编码)用作非氧化进入磷酸戊糖途径，将糖酵解中间体果糖-6-磷酸和甘油醛-3-磷酸转化为D-木酮糖-5-磷酸和D-赤藓糖-4-磷酸(图1)。这生产了关键的中间体D-木酮糖-5-磷酸。

可选地，可以将果糖6-磷酸磷酸酮醇酶(Fpk)和磷酸乙酰转移酶(PTA)用作进入磷酸戊糖途径，由果糖-6-磷酸产生一个赤藓糖-4-磷酸和一个乙酰辅酶A(图9)。

利用磷酸戊糖途径完全转化为戊糖中间体

为了将所有的己糖碳无损转化为戊糖中间体，需要进一步加工D-赤藓糖-4-磷酸。转醛醇酶(如由来自大肠杆菌的talA或talB编码)催化D-赤藓糖-4-磷酸和D-果糖-6-磷酸的转化，以生成D-景天庚酮糖-7-磷酸和D-甘油醛-3-磷酸。这些中间体由转酮醇酶(如由来自大肠杆菌的tktA或tktB编码)进一步加工，以生成D-核糖-5-磷酸和D-木酮糖-5-磷酸。D-核糖-5-磷酸可以容易地分别通过核糖-5-磷酸异构酶(如由大肠杆菌中的rpiA或rpiB编码)转化为D-核酮糖-5-磷酸，并通过核酮糖-5-磷酸3-差向异构酶(如由大肠杆菌中的rpe编码)进一步转化为D-木酮糖-5-磷酸。因此，所有葡萄糖或果糖都可以完全转化为D-木酮糖-5-磷酸。总化学计量为：

2.5葡萄糖+2.5ATP+0.5磷酸→2D-木酮糖-5-磷酸+D-核糖-5-磷酸

当然，双向异构酶和差向异构酶反应也可以将生产的两个D-木酮糖-5-磷酸和一个D-核糖-5-磷酸分子转化为三个D-核酮糖-5-磷酸。总体净转化最终取决于后续途径实际上消耗的中间体是D-木酮糖-5-磷酸还是D-核酮糖-5-磷酸。

如果可选地通过Fpk进入磷酸戊糖途径(图9)，则化学计量为：

2葡萄糖+2ATP+辅酶A->2D-木酮糖-5-磷酸+1乙酰辅酶A

非氧化进入磷酸戊糖途径的流的优化

磷酸戊糖途径氧化分支的失活

不应利用大肠杆菌中的常见途径(即，通过6-磷酸D-葡萄糖酸-1,5-内酯，氧化进入磷酸戊糖途径并氧化脱羧为D-核酮糖-5-磷酸)，因为该途径将己糖葡萄糖转化为戊糖时损失一个碳(图1)。抑制催化磷酸戊糖途径氧化分支中一个或多个适当反应的至少一种或多种酶(即葡萄糖-6-磷酸-1-脱氢酶、6-磷酸葡萄糖酸内酯酶和6-磷酸葡萄糖酸脱氢酶)是有利的；所述抑制是通过缺失一个或多个负责基因来实现的，例如在大肠杆菌中，所述基因是zwf(葡萄糖6-磷酸-1-脱氢酶)、pgl(6-磷酸葡萄糖酸内酯酶)和gnd(6-磷酸葡萄糖酸脱氢酶)。

下调糖酵解下游反应

需要糖酵解的上部，将2.5葡萄糖或果糖转化为关键中间体2x果糖-6-磷酸和1x甘油醛-3-磷酸。为了减少或消除进一步流向糖酵解的下部，即甘油醛-3-磷酸氧化磷酸化为1,3-双磷酸D-甘油酸，随后转化为3-磷酸-D-甘油酸和2-磷酸-D-甘油酸，可以在大肠杆菌中分别通过gapA、pgk和gpmA/gpmM降低甘油醛3-磷酸脱氢酶、磷酸甘油酸激酶和磷酸甘油酸变位酶的活性。

然而，如果利用了通过果糖6-磷酸磷酸酮醇酶(Fpk)可选进入磷酸戊糖途径，则不需要甘油醛3-磷酸，并且可以使适当的6-磷酸果糖激酶活性减少或缺失(在大肠杆菌中的pfkA和/或pfkB基因)。

将戊糖-磷酸中间体与MEG生产途径连接

为了将磷酸戊糖途径中间体D-木酮糖-5-磷酸与任一种已知的MEG或乙醇酸生产途径连接，需要通过戊糖5-磷酸酶将D-木酮糖-5-磷酸中间体去磷酸化，以生成D-木酮糖(图2和图5)。类似地，可以通过戊糖5-磷酸酶的去磷酸化以生成D-核酮糖，将D-核酮糖-5-磷酸中间体与任一种已知的MEG或乙醇酸生产途径连接(图4和图5)。

在基于木糖酸的MEG途径的情况下，进一步需要木糖异构酶功能(如来自大肠杆菌的XylA)以将生成的D-木酮糖转化为D-木糖(图3)。

将磷酸戊糖途径与MEG生产途径连接的可选方案和变化

在基于D-核酮糖-1-磷酸的途径的情况下，如所述，可以通过形成D-木酮糖，将D-木酮糖-5-磷酸中间体与磷酸戊糖途径连接，随后差向异构化和磷酸化(由dte和fucK介导)(图4)。可选地，D-核酮糖-5-磷酸可以用作入口点，并通过利用D-核酮糖5-磷酸酶降解为D-核酮糖。这样，必要的异构化反应在RPE水平上进行，而不是DTE(图4)。

在一些实施方案中，可以使用连续的两个阿糖醇脱氢酶反应将戊糖-5-磷酸转化为戊糖-1-磷酸(图6)。此处，D-木酮糖-5-磷酸或D-核酮糖-5-磷酸的2-酮位置被还原，然后4-羟基位置被氧化为酮基团，将戊糖-5-磷酸转化为戊糖-1-磷酸(图7)。

在进一步的实施方案中，通过戊糖磷酸变位酶(也称为磷酸戊糖变位酶或PPM)的作用，可以将戊糖-5-磷酸直接转化为戊糖-1-磷酸。类似于磷酸葡萄糖变位酶或磷酸甘露糖变位酶，其将磷酸残基从最后一位转移至磷酸糖的1-位。

己糖的利用

本公开中进入途径的分子为果糖-6-磷酸和甘油醛-3-磷酸，两者在大多数生物体中均由葡萄糖或果糖的正常糖酵解降解获得。如果生物体具有消耗淀粉或蔗糖或纤维素的能力(例如通过蔗糖转化酶的表达)，其仍将生成葡萄糖(和果糖)，使其能够以相同的方式和相同的程度利用本公开的方法产生相同的益处。

单乙二醇(MEG)

单乙二醇(MEG)是工业应用的重要原料。MEG的主要用途是制造聚对苯二甲酸乙二醇酯(PET)树脂、膜和纤维。此外，MEG在防冻剂、冷却剂、飞行器防冰剂、除冰剂和溶剂的生产中也很重要。MEG也称为乙-1,2-二醇。

乙二醇还用作对流热传递的介质，例如在汽车和液冷计算机中。

由于其高沸点和对水的亲和力，乙二醇是有用的干燥剂。乙二醇广泛用于抑制将天然气从偏远气田输送至天然气加工设施的多相长管道中天然气包合物(水合物)的形成。可以从天然气中回收乙二醇，并在去除水和无机盐的净化处理后将其作为抑制剂再利用。

乙二醇的次要用途包括：用于电容器制造，作为制造1,4-二恶烷的化学中间体，以及作为防止个人计算机液体冷却系统腐蚀的添加剂。乙二醇也用于制造一些疫苗；作为鞋油、油墨和染料的次要成分；用于处理木材腐烂和真菌；以及作为生物标本的防腐剂。

乙醇酸

乙醇酸在纺织工业中用作染色剂和鞣剂，在食品加工中用作调味剂和防腐剂，在制药工业中用作护肤剂。其还用于粘合剂和塑料中。乙醇酸通常包含于用于油墨和涂料的乳液聚合物、溶剂和添加剂中，以改善流动性能并赋予光泽。其用于增加瓷砖地板摩擦系数的表面处理产品中。

由于其优异的渗透皮肤的能力，乙醇酸在护肤产品中得到应用，以改善皮肤的外观和质地。其可以以20％至70％的浓度用作由皮肤科医生进行的化学换肤，或以介于10％至20％之间的较低浓度用于家用试剂盒。除浓度之外，pH在决定溶液中乙醇酸的效力中也起着很大的作用。

可以通过多种方式合成乙醇酸。主要方法使用甲醛与合成气的催化反应(甲醛的羰基化)，因为其成本低。也可以通过氯乙酸与氢氧化钠反应，随后重新酸化来制备乙醇酸。其他未明显在使用中的方法包括草酸的氢化和由甲醛衍生的氰醇的水解。今天的一些乙醇酸不含甲酸。可以从天然来源(如甘蔗、甜菜、菠萝、哈密瓜和未成熟的葡萄)中分离乙醇酸。

乙醇酸是可用于一系列反应的有机合成中间体，所述反应包括：氧化还原、酯化和长链聚合。其用作制备聚乙醇酸和其他生物相容性共聚物(例如PLGA)的单体。商业上，重要的衍生物包括易于蒸馏的甲基(CAS#96-35-5)和乙基(CAS#623-50-7)酯。丁酯是一些漆的成分，因为其不挥发并具有良好的溶解性能而受欢迎。

丙酮

丙酮(acetone，也称为propanone)是具有分子式(CH3)₂CO的有机化合物。其是无色、易挥发、易燃的液体，是最简单的酮。

丙酮与水混溶，是重要的溶剂，通常在实验室中用于清洁目的。全球产量超过670万吨，主要用作溶剂以及甲基丙烯酸甲酯和双酚A的生产。其是有机化学中的常见组成部分。丙酮的常见家庭用途是作为指甲油去除剂的活性成分和作为涂料稀释剂。

异丙醇

异丙醇(isopropyl alcohol，IUPAC名称为2-丙醇，也称为isopropanol)是具有化学式C₃H₈O或C₃H₇OH或CH₃CHOHCH₃的化合物。其是无色、易燃的化合物，具有强烈的气味。其是仲醇的最简单示例，其中醇碳原子连接至其他两个碳原子，有时示为(CH3)₂CHOH。其是丙醇的结构异构体。其具有广泛的工业和家庭用途。

丙烯(propene，propylene)也称为甲基乙烯，是具有化学式C₃H₆的不饱和有机化合物。其具有一个双键，是烯烃类的烃中第二简单的成员。

丙烯由化石燃料(石油、天然气，以及在小得多的程度上由煤炭)生产。丙烯是炼油和天然气加工的副产品。

异丁烯

异丁烯(isobutene，isobutylene，也称为2-甲基丙烯)是具有工业意义的碳氢化合物。其是四碳支链烯烃(alkene，olefin)，是丁烯(butylene，butene)的四种异构体之一。其在标准温度和压力下是无色可燃气体。

异丁烯用作生产各种产品的中间体。其分别在汽油含氧化合物甲基叔丁基醚(MTBE)和乙基叔丁基醚(ETBE)的制造中与甲醇和乙醇反应。与丁烷的烷基化生产另一种燃料添加剂异辛烷。异丁烯也用于生产甲基丙烯醛。异丁烯的聚合生产丁基橡胶(聚异丁烯)。通过使用异丁烯对苯酚进行Friedel-Crafts烷基化，生产抗氧化剂如丁基羟基甲苯(BHT)和丁基羟基茴香醚(BHA)。

通常通过叔丁醇脱水或异丁烷催化脱氢获得聚合物和化学级的异丁烯。通常通过将甲醇或乙醇与来自烯烃蒸汽裂解装置或炼油厂的丁烯流中含有的异丁烯反应，来生产汽油含氧化合物MTBE和ETBE。因为将醚与剩余的丁烯分离更简单，所以不在反应前分离异丁烯。

丝氨酸途径化合物

可以与MEG(或乙醇酸)联产的化合物包括丝氨酸途径化合物，例如丝氨酸、甘氨酸、单乙醇胺(MEA)和乙二胺(EDA)。

丝氨酸是非必需氨基酸，其可以在人体内合成。由于高度水溶性，丝氨酸在制药和化妆品工业的乳液中用作保湿剂。此外，丝氨酸在化学工业中有着巨大的市场，因为其可以转化为其他化学品，如塑料、清洁剂、膳食补充剂和各种其他产品。事实上，丝氨酸被提及为30种最有希望替代石油工业化学品的生物物质之一。

丝氨酸的α-脱羧产生乙醇胺，其是工业产品，用作除草剂、纺织、金属、清洁剂、塑料和个人护理产品工业的中间体，具有高达每年数百千吨的产量(Scott,E.等人(2007)Biomass in the manufacture of industrial products—the use of proteins andamino acids.Appl Microbiol Biotechnol.75(4)：751-762)。

甘氨酸是最简单的氨基酸，对制药和工业应用很有价值。其作为添加剂包含在宠物食品和动物饲料中。对于人，甘氨酸作为甜味剂/增味剂出售。某些食品补充剂和蛋白质饮料含有甘氨酸。某些药物制剂包含甘氨酸，以改善药物的胃吸收。甘氨酸在抗酸剂、镇痛剂、止汗剂、化妆品和洗漱用品中用作缓冲剂。许多杂项产品使用甘氨酸或其衍生物，如生产橡胶海绵制品、肥料和金属络合剂。甘氨酸在合成各种化学产品中作为中间体也很有价值。其用于制造除草剂草甘膦。甘氨酸可以转化为草酸，其在纺织和纸浆工业以及废水处理中用作漂白剂。甘氨酸还广泛用于实验室研究中，例如凝胶电泳中。

乙二胺(EDA)(1,2-二氨基乙烷，C₂H₄(NH₂)₂)被大量用于生产许多工业化学品。其与羧酸(包括脂肪酸)、腈、醇(在高温下)、烷化剂、二硫化碳以及醛和酮形成衍生物。由于其具有两个胺的双功能性质，其容易形成杂环如咪唑烷。乙二胺最突出的衍生物是螯合剂EDTA，其通过涉及氰化物和甲醛的Strecker合成由乙二胺衍生而来。羟乙基乙二胺是另一种商业上重要的螯合剂。许多生物活性化合物和药物含有N-CH2-CH2-N键，包括一些抗组胺药。亚乙基双二硫代氨基甲酸盐是商业上重要的杀菌剂，商品名为代森锰(Maneb)、代森锰锌(Mancozeb)、代森锌(Zineb)和代森联(Metiram)。一些含有咪唑啉的杀菌剂衍生自乙二胺。乙二胺是常见的支气管扩张药氨茶碱中的成分，其用于溶解活性成分茶碱。乙二胺也已用于皮肤病制剂。当用作药物赋形剂时，由于显著的首过效应，口服给药后其生物利用度约为0.34。小于20％通过小便排泄消除。由于乙二胺含有两个胺基团，其是广泛使用的各种聚合物的前体。衍生自甲醛的缩合物是增塑剂。其广泛用于生产聚氨酯纤维。PAMAM类树枝状聚合物衍生自乙二胺。漂白活化剂四乙酰乙二胺由乙二胺生成。衍生物N,N-亚乙基双(硬脂酰胺)(EBS)是一种商业上有意义的脱模剂，以及汽油和机油中的表面活性剂。

乙二胺还用作：溶解蛋白质(如白蛋白和酪蛋白)的溶剂；某些电镀浴；涂料和冷却剂中的腐蚀抑制剂；用于彩色摄影显影的化学品、粘合剂(binder)、粘着剂(adhesive)、织物柔软剂、环氧树脂固化剂和染料。乙二胺二氢碘化物(EDDI)被加入动物饲料中作为碘化物的来源。

木糖醇

木糖醇是化合物，是糖醇，作为甜味剂具有相当大的价值。人的味觉检测到其甜度近似于蔗糖，并且其无毒且不致龋。

一种生产木糖醇的方法是利用从硬木和玉米芯中提取的木聚糖(一种半纤维素)。木聚糖可以水解为木糖，然后木糖催化氢化为木糖醇。木糖醇的催化途径是成本和能源密集型的，因为在该过程中使用了大量的分离和纯化步骤，并且总产率低。另一种生产木糖醇的方法包括在细菌、真菌和/或酵母细胞中利用发酵和生物催化过程。

酶

示例性的酶列于表1中，其可用于本文公开的MEG(或乙醇酸)或任选MEG(或乙醇酸)和一种或多种联产品的生物合成途径中。

表1

D-塔格糖3-差向异构酶(EC 5.1.3.31)

本公开描述了可以催化以下反应的酶：各种酮糖在C-3位置的差向异构化，D-果糖和D-阿洛酮糖、D-塔格糖和D-山梨糖、D-核酮糖和D-木酮糖以及L-核酮糖和L-木酮糖的相互转化。特异性取决于物种。来自菊苣假单胞菌(Pseudomonas cichorii)和类球红细菌(Rhodobacter sphaeroides)的酶需要Mn²⁺。在一个实施方案中，该酶是D-塔格糖3-差向异构酶(dte)。在另一个实施方案中，D-塔格糖3-差向异构酶催化D-木酮糖向D-核酮糖的转化。

在一个实施方案中，D-塔格糖3-差向异构酶由一种或多种获自微生物的核酸分子编码，所述微生物选自假单胞菌属物种(Pseudomonas sp.)、中慢生根瘤菌属物种(Mesorhizobium sp.)和红细菌属物种(Rhodobacter sp.)。在一些实施方案中，D-塔格糖3-差向异构酶由一种或多种获自微生物的核酸分子编码，所述微生物选自菊苣假单胞菌、假单胞菌属物种ST-24、百脉根中慢生根瘤菌(Mesorhizobium loti)和类球红细菌。在一些实施方案中，所述一种或多种核酸分子是dte和/或FJ851309.1，或其同源物。在一个进一步的实施方案中，D-塔格糖3-差向异构酶包含选自SEQ ID NO：3和5的氨基酸序列。在一个仍进一步的实施方案中，D-塔格糖3-差向异构酶由选自SEQ ID NO：1、2和4的核酸序列编码。

D-塔格糖3-差向异构酶也可以称为L-核酮糖3-差向异构酶或酮糖3-差向异构酶。

D-核酮糖激酶(EC 2.7.1.16)

本公开描述了可以催化以下反应的酶：

L-岩藻糖+ATP→L-岩藻糖1-磷酸+ADP+H+

D-核酮糖+ATP→D-核酮糖1-磷酸+ADP+H+

D-核酮糖激酶也可以称为L-岩藻糖激酶(L-fuculokinase)、岩藻糖激酶、ATP：L-岩藻糖1-磷酸转移酶或L-岩藻糖激酶(L-fuculose kinase)。

因此，在一些实施方案中，本公开提供了在岩藻糖降解途径、岩藻糖和鼠李糖降解的超级途径和/或D-阿拉伯糖降解I途径中起作用的酶。

在一些实施方案中，该酶可以既作为L-岩藻糖激酶也作为D-核酮糖激酶发挥作用，分别为L-岩藻糖和D-阿拉伯糖降解途径的第二种酶。

在具体的实施方案中，该酶将D-核酮糖转化为D-核酮糖-1-磷酸。在一个实施方案中，D-核酮糖激酶由获自大肠杆菌的一种或多种核酸分子编码。在一些实施方案中，所述一种或多种核酸分子是fucK或其同源物。在一个进一步的实施方案中，D-核酮糖激酶包含SEQID NO：8中列出的氨基酸序列。在一个仍进一步的实施方案中，D-核酮糖激酶由选自SEQ IDNO：6和7的核酸序列编码。

D-核酮糖-1-磷酸醛缩酶(EC 4.1.2.17)

本公开描述了可以催化以下可逆反应的酶：

D-核酮糖-1-磷酸醛缩酶也可以称为L-岩藻糖-磷酸醛缩酶、L-岩藻糖1-磷酸醛缩酶或L-岩藻糖-1-磷酸(S)-乳醛-裂解酶。

因此，在一些实施方案中，本公开提供了在岩藻糖降解途径、岩藻糖和鼠李糖降解的超级途径和/或D-阿拉伯糖降解I途径中起作用的酶。在一个实施方案中，该酶可以使用Zn²⁺作为辅因子。在另一个实施方案中，该酶的抑制剂可以是磷酸乙醇羟肟酸。

在一些实施方案中，该酶可以既作为L-岩藻糖-磷酸醛缩酶也作为D-核酮糖-磷酸醛缩酶，分别为L-岩藻糖和D-阿拉伯糖降解途径的第三种酶。

已用来自大肠杆菌株的部分纯化制剂测试了该酶的底物特异性。

已经解析了该酶的晶体结构和许多点突变体。突变体的结构数据和酶活性的组合允许对酶的催化机制进行建模和改进。已研究了该酶的对映体选择性。

在具体的实施方案中，该酶将D-核酮糖-1-磷酸转化为乙醇醛和DHAP。在一个实施方案中，D-核酮糖-1-磷酸醛缩酶由获自大肠杆菌的一种或多种核酸分子编码。在一些实施方案中，所述一种或多种核酸分子是fucA或其同源物。在一个进一步的实施方案中，D-核酮糖-1-磷酸醛缩酶包含SEQ ID NO：11中列出的氨基酸序列。在一个仍进一步的实施方案中，D-核酮糖-1-磷酸醛缩酶由选自SEQ ID NO：9和10的核酸序列编码。

乙醇醛还原酶(EC 1.1.1.77)

本公开描述了可以催化以下可逆反应的酶：

乙醇醛还原酶也可以称为乳醛还原酶、丙二醇氧化还原酶、(R)[或(S)]-丙烷-1,2-二醇：NAD+氧化还原酶或L-1,2-丙二醇氧化还原酶。

因此，在一些实施方案中，本公开提供了在乙二醇降解途径、乙二醇代谢和降解的超级途径、厌氧L-乳醛降解途径和/或岩藻糖和鼠李糖降解的超级途径中起作用的酶。在一个实施方案中，该酶可以使用Fe²⁺作为辅因子。

L-1,2-丙二醇氧化还原酶是铁依赖性III族脱氢酶。其将L-乳醛(L-岩藻糖和L-鼠李糖分解代谢途径的产物)厌氧还原为L-1,2-丙二醇，然后其从细胞中排出。

已解析了该酶的晶体结构，表明结构域交换的二聚体，金属、辅因子和底物结合位点可以位于其中。需要一个天冬氨酸和三个保守的组氨酸残基实现Fe²⁺的结合和酶促活性。

在体外，高浓度的NAD+可以重新活化该酶，Fe³⁺和抗坏血酸或Fe²⁺和H₂O₂的混合物可以有效失活该酶。保守的His277残基的金属催化氧化被认为是失活的原因。

FucO的表达能够实现工程化的β-氧化循环的单转逆转(one-turn reversal)。FucO活性有助于在工程化株中将异丁醛转化为异丁醇。

在具体的实施方案中，该酶将乙醇醛转化为MEG。在一些实施方案中，乙醇醛还原酶来自大肠杆菌。在一些实施方案中，乙醇醛还原酶由fucO基因编码。

在一个实施方案中，乙醇醛还原酶由获自微生物的一种或多种核酸分子编码，所述微生物选自大肠杆菌和酿酒酵母。在另一个实施方案中，所述一种或多种核酸分子选自gldA、GRE2、GRE3、yqhD、ydjG、fucO、yafB(dkgB)和/或yqhE(dkgA)，或其同源物。在另一个实施方案中，所述一种或多种核酸分子是yqhD。在一些实施方案中，yqhD包含G149E突变。在进一步的实施方案中，乙醇醛还原酶包含选自SEQ ID NO：13、15、17、20、23、25、28、30和32的氨基酸序列。在一个仍进一步的实施方案中，乙醇醛还原酶由选自SEQ ID NO：12、14、16、18、19、21、22、24、26、27、29和31的核酸序列编码。

醛还原酶

许多醛还原酶可以用于将乙醇醛转化为MEG。

NADPH依赖性醛还原酶(YqhD)可以催化以下反应：

醛+NADP++H₂O→羧酸酯+NADPH+2H+(EC 1.2.1.4)

YqhD是NADPH依赖性醛还原酶，其可能参与乙二醛解毒和/或是对脂质过氧化的非谷胱甘肽依赖性反应的一部分。

据报道，各种醇、醛、氨基酸、糖和α-羟基酸已被测试为YqhD的底物。纯化的蛋白质仅显示了NADP依赖性的醇脱氢酶活性，具有对长于C(3)的醇的偏好，但具有毫摩尔范围内的Km值，表明其不是生理底物。相比之下，YqhD的确对底物(如丙醛、乙醛和丁醛以及丙烯醛和丙二醛)表现出短链醛还原酶活性。在代谢工程化株中，内源性醛还原酶YqhD、YjgB和YahK将苯乙醛和4-羟基苯乙醛被还原为2-苯乙醇和2-(4-羟苯基)乙醇。

YqhD的过表达增加了细胞的1,3-丙二醇氧化还原酶活性。已将大肠杆菌工程化以表达YqhD，用于1,3-丙二醇的工业生产。YqhD活性也有助于异丁醇、1,2-丙二醇、1,2,4-丁三醇和丙酮醇的生产。yqhD的突变能够实现通过工程化的β-氧化循环的单转逆转来生产丁醇。

YqhD具有糠醛还原酶活性，其表现出导致生长抑制，是由于从木质纤维素生物质生产乙醇的代谢工程化株中NADPH的消耗。

已以

的分辨率解析了YqhD的晶体结构。YqhD是二聚体的不对称二聚体，活性位点含有Zn²⁺离子。NADPH辅因子在烟酰胺环中的5和6位被羟基基团修饰。

yqhD的过表达导致对活性氧生成化合物(如过氧化氢、百草枯、铬酸盐和亚碲酸钾)的抗性增加。yqhD缺失突变体显示出对这些化合物和乙二醛的敏感性增加，并且含有的在脂质过氧化过程中生成的活性醛水平增加。相反，yqhD缺失导致糠醛耐受性增加。

在具体的实施方案中，NADPH依赖性醛还原酶将乙醇醛转化为MEG。在一些实施方案中，NADPH依赖性醛还原酶来自大肠杆菌。在一些实施方案中，NADPH依赖性醛还原酶由yqhD基因编码。

多功能甲基乙二醛还原酶(DkgA)可以催化以下反应：

2-酮-L-古洛糖酸+NADP+←2,5-双脱氢-D-葡萄糖酸+NADPH+H+(该反应有利于相反的方向，EC 1.1.1.346)

DkgA(YqhE)属于醛酮还原酶(AKR)家族，已显示具有甲基乙二醛还原酶和β-酮酯还原酶活性。

据报道，dkgA编码2,5-二酮-D-葡萄糖酸还原酶(25DKGR)A，是大肠杆菌中两种25DKG还原酶之一。该酶使用NADPH作为优选的电子供体，并被认为参与酮葡萄糖酸代谢。据报道，该酶对2,5-二酮-D-葡萄糖酸的比活性比其对甲基乙二醛的活性低近1000倍。

由于其对NADPH的Km低，DkgA还原呋喃可能耗尽NADPH库，从而限制细胞生物合成。对醛还原酶的广泛调查表明，DkgA是几种内源性醛还原酶之一，其有助于降解代谢工程所需的醛终产物。

已以

的分辨率解析了DkgA的晶体结构。

在具体的实施方案中，多功能甲基乙二醛还原酶将乙醇醛转化为MEG。在一些实施方案中，多功能甲基乙二醛还原酶来自大肠杆菌。在一些实施方案中，多功能甲基乙二醛还原酶由dkgA基因编码。

多功能甲基乙二醛还原酶(DkgB)可以催化以下反应：

DkgB(YafB)是醛酮还原酶(AKR)亚家族3F的成员。已表明DkgB具有2,5-二酮-D-葡萄糖酸还原酶、甲基乙二醛还原酶和4-硝基苯甲醛还原酶活性。

据报道，dkgB编码2,5-二酮-D-葡萄糖酸还原酶(25DKGR)B，是大肠杆菌中两种25DKG还原酶之一。该酶使用NADPH作为优选的电子供体，并被认为涉及酮葡萄糖酸代谢。然而，据报道，该酶对2,5-二酮-D-葡萄糖酸的比活性比其对甲基乙二醛的活性低近1000倍。

在具体的实施方案中，多功能甲基乙二醛还原酶将乙醇醛转化为MEG。在一些实施方案中，多功能甲基乙二醛还原酶来自大肠杆菌。在一些实施方案中，多功能甲基乙二醛还原酶由dkgB基因编码。

甲基乙二醛还原酶(YeaE)可以催化以下反应：

已表明YeaE具有甲基乙二醛还原酶活性。

YeaE的亚基结构尚未确定，但其氨基酸序列与醛酮还原酶DkgA(YqhE)和DkgB(YafB)的相似性表明其可能是单体的。

在具体的实施方案中，甲基乙二醛还原酶将乙醇醛转化为MEG。在一些实施方案中，甲基乙二醛还原酶来自大肠杆菌。在一些实施方案中，甲基乙二醛还原酶由yeaE基因编码。

L-甘油醛3-磷酸还原酶(yghZ)可以催化以下反应：

L-甘油醛3-磷酸+NADPH+H+→sn-甘油3-磷酸+NADP+(EC 1.1.1.-)

YghZ是L-甘油醛3-磷酸(L-GAP)还原酶。该酶还能够以低速率解毒甲基乙二醛。YghZ界定了AKR14(醛酮还原酶14)蛋白家族。

L-GAP不是天然代谢物，并对大肠杆菌有毒。L-GAP是大肠杆菌K-12的甘油-3-磷酸和己糖磷酸转运系统的底物。据推测，YghZ的生理作用是L-GAP的解毒作用，其可能由GAP的非酶促消旋化或由未知的细胞过程形成。

已确定大肠杆菌酶的晶体结构，认为是四聚体。然而，其他人已发现，基于凝胶过滤和电子显微镜研究，该蛋白质形成八聚体。

在具体的实施方案中，L-甘油醛3-磷酸还原酶将乙醇醛转化为MEG。在一些实施方案中，L-甘油醛3-磷酸还原酶来自大肠杆菌。在一些实施方案中，L-甘油醛3-磷酸还原酶由yghZ基因编码。

L-1,2-丙二醇脱氢酶/甘油脱氢酶(GldA)可以催化以下反应：

氨基丙酮+NADH+H+→(R)-1-氨基丙-2-醇+NAD+(EC 1.1.1.75)

GldA酶的生理功能长期以来一直不清楚。该酶作为甘油脱氢酶和D-1-氨基-2-丙醇：NAD+氧化还原酶被独立地分离。当时，认为D-1-氨基-2-丙醇是维生素B12生物合成的中间体，虽然大肠杆菌不能够从头合成维生素B12，但一直在寻找催化该化合物合成的酶。后来发现GldA负责这两项活性。

最近提出GldA的主要体内作用是通过将二羟基丙酮转化为甘油来去除二羟基丙酮。然而，最近还建立了在甘油发酵中的双重作用。可以通过两种不同的途径完成大肠杆菌中的甘油异化。甘油和甘油磷酸二酯降解途径需要末端电子受体的存在，并利用Glp系统的ATP依赖性激酶，该激酶将甘油磷酸化为甘油-3-磷酸。然而，在使激酶失活并选择以甘油生长后，发现连接NAD+的脱氢酶GldA能够支持甘油发酵。最近表明GldA既作为甘油脱氢酶参与甘油发酵，生产二羟基丙酮，也作为1,2-丙二醇脱氢酶参与甘油发酵，通过由丙酮生产1,2-丙二醇来再生NAD+。

该酶以两种催化活性形式存在，一种八个亚基的大型形式和一种两个亚基的小型形式。大型形式表现为主要类别。

在具体的实施方案中，L-1,2-丙二醇脱氢酶/甘油脱氢酶将乙醇醛转化为MEG。在一些实施方案中，L-1,2-丙二醇脱氢酶/甘油脱氢酶来自大肠杆菌。在一些实施方案中，L-1,2-丙二醇脱氢酶/甘油脱氢酶由gldA基因编码。

来自酿酒酵母的NADPH依赖性甲基乙二醛还原酶(GRE2)可以催化以下反应：

Gre2是一种多功能酶，其使用NADPH作为辅因子，催化广泛的底物的立体选择性还原，所述底物包括脂肪族和芳香族酮、二酮以及醛。

已以

的分辨率解析了apo形式的来自酿酒酵母的Gre2晶体结构，并以

的分辨率解析了NADPH复合形式的来自酿酒酵母的Gre2晶体结构。Gre2形成同源二聚体，其每个亚基含有参与底物识别的N-末端罗斯曼折叠(Rossmann-fold)结构域和可变C-末端结构域。与辅因子NADPH结合后诱导契合(fit)使该两个结构域向彼此移动，产生更适合底物的结构域间裂缝。计算模拟与定点诱变和酶活性分析相组合，能够表征潜在的底物结合口袋，其决定催化的严格底物立体选择性。

Gre2催化细胞毒性化合物甲基乙二醛(MG)不可逆地还原为(S)-乳醛，作为乙二醛酶I GLO1对MG解毒的替代方法。通过糖酵解旁路由磷酸二羟丙酮合成MG，据信MG在细胞周期调节和应激适应中发挥作用。GRE2还催化异戊醛还原为异戊醇。该酶通过调节异戊醛的水平来抑制异戊醇诱导的丝状形成(filamentation)，细胞通过丝状形成来响应异戊醛信号。GRE2也参与麦角甾醇代谢。

在具体的实施方案中，NADPH依赖性甲基乙二醛还原酶将乙醇醛转化为MEG。在一些实施方案中，NADPH依赖性甲基乙二醛还原酶来自酿酒酵母。在一些实施方案中，NADPH依赖性甲基乙二醛还原酶由GRE2基因编码。

硫解酶/乙酰辅酶A乙酰转移酶(EC 2.3.1.9)

本公开描述了可以催化以下反应的酶：

硫解酶/乙酰辅酶A乙酰转移酶也可以称为乙酰辅酶A-C-乙酰转移酶、乙酰乙酰辅酶A硫解酶、乙酰辅酶A：乙酰辅酶A C-乙酰转移酶或硫解酶II。

因此，在一些实施方案中，本公开提供了在乙酰乙酸降解(至乙酰辅酶A)中起作用的酶。在一个实施方案中，该酶的抑制剂可以是乙酰乙酰辅酶A。

在具体的实施方案中，该酶将乙酰辅酶A转化为乙酰乙酰辅酶A。在一个实施方案中，硫解酶或乙酰辅酶A乙酰转移酶由一种或多种获自微生物的核酸分子编码，所述微生物选自梭菌属物种、芽孢杆菌属物种、大肠杆菌、酵母属物种和海杆菌属物种(Marinobactersp.)。在一些实施方案中，硫解酶或乙酰辅酶A乙酰转移酶由一种或多种获自微生物的核酸分子编码，所述微生物选自丙酮丁醇梭菌、热解糖梭菌(Clostridiumthermosaccharolyticum)、蜡状芽孢杆菌(Bacillus cereus)、大肠杆菌、酿酒酵母和除烃海杆菌(Marinobacter hydrocarbonoclasticus)。在一些实施方案中，所述一种或多种核酸分子是thlA、atoB和/或ERG10，或其同源物。在进一步的实施方案中，硫解酶或乙酰辅酶A乙酰转移酶包含选自SEQ ID NO：35、37和40的氨基酸序列。在一个仍进一步的实施方案中，硫解酶或乙酰辅酶A乙酰转移酶由选自SEQ ID NO：33、34、36、38和39的核酸序列编码。

乙酰辅酶A：乙酰乙酰辅酶A转移酶(EC 2.8.3.-)

本公开描述了可以催化以下反应的酶：

乙酰辅酶A：乙酰乙酰辅酶A转移酶也可以称为乙酸：乙酰乙酰辅酶A转移酶或乙酰乙酰辅酶A转移酶。

因此，在一些实施方案中，本公开提供了在乙酰乙酸降解(至乙酰辅酶A)中起作用的酶。在一个实施方案中，该酶的抑制剂可以包括乙酰辅酶A和辅酶A。

大肠杆菌以短链脂肪酸(C3-C6)生长，需要将这些酸活化成各自的硫酯。乙酰乙酰辅酶A转移酶催化该活化。该反应发生在两个半反应中，其中涉及共价酶-辅酶A。该酶在反应过程中经历了两个可检测的构象变化。认为该反应可能通过乒乓机制(ping-pongmechanism)进行。该酶可以利用多种短链酰基辅酶A和羧酸底物，但对正常的和3-酮底物表现出最大活性。

在具体的实施方案中，该酶将乙酰乙酰辅酶A转化为乙酰乙酸。在一些实施方案中，乙酰辅酶A：乙酰乙酸辅酶A转移酶来自梭菌。在一些实施方案中，乙酰辅酶A：乙酰乙酸辅酶A转移酶来自丙酮丁醇梭菌。在一些实施方案中，乙酰辅酶A：乙酰乙酸辅酶A转移酶来自大肠杆菌。在一些实施方案中，乙酰辅酶A：乙酰乙酸辅酶A转移酶由atoA和atoD基因编码。在另一个实施方案中，乙酰乙酰辅酶A转移酶的亚基组成是[(AtoA)₂][(AtoD)₂]，其中(AtoA)₂是β复合物，(AtoD)₂是α复合物。在一个实施方案中，乙酰辅酶A：乙酰乙酸辅酶A转移酶是融合的乙酰辅酶A：乙酰乙酸辅酶A转移酶：α亚基/β亚基。在另一个实施方案中，乙酰辅酶A：乙酰乙酸辅酶A转移酶由ydiF基因编码。

乙酸：乙酰乙酰辅酶A水解酶(EC 3.1.2.11)

本公开描述了可以催化以下反应的酶：

乙酰乙酰辅酶A水解酶(acetoacetyl-CoA hydrolase)也可以称为乙酰乙酰辅酶A水解酶(acetoacetyl coenzyme A hydrolase)或乙酰乙酰辅酶A脱酰酶(acetoacetyl CoAdeacylase或acetoacetyl coenzyme A deacylase)。

该酶属于水解酶家族，具体为那些作用于硫酯键的酶。

在具体的实施方案中，该酶将乙酰乙酰辅酶A转化为乙酰乙酸。在一些实施方案中，乙酸：乙酰乙酰辅酶A水解酶来自梭菌。在一些实施方案中，乙酸：乙酰乙酰辅酶A水解酶来自丙酮丁醇梭菌。在另一个实施方案中，乙酰乙酰辅酶A水解酶由ctfA(亚基A)和/或ctfB(亚基B)基因编码。

在进一步的实施方案中，乙酰辅酶A：乙酰乙酸辅酶A转移酶或乙酸：乙酰乙酰辅酶A水解酶包含选自SEQ ID NO：43、46、97、99、101和103的氨基酸序列。在一个仍进一步的实施方案中，乙酰辅酶A：乙酰乙酸辅酶A转移酶或乙酸：乙酰乙酰辅酶A水解酶由选自SEQ IDNO：41、42、44、45、96、98、100和102的核酸序列编码。

乙酰乙酸脱羧酶(EC 4.1.1.4)

本公开描述了可以催化以下反应的酶：

乙酰乙酸+H+→丙酮+CO₂

乙酰乙酸脱羧酶也可以称为ADC、AADC或乙酰乙酸羧基裂解酶。

因此，在一些实施方案中，本公开提供了在异丙醇生物合成、丙酮酸发酵为丙酮、丙酮丁醇梭菌产酸和产溶剂发酵的超级途径和/或丙酮丁醇梭菌产溶剂发酵的超级途径中起作用的酶。

乙酰乙酸脱羧酶(ADC)在丙酮丁醇梭菌的溶剂生产中起关键作用。在生长的产酸阶段，酸积累导致代谢转变为溶剂生产。在这个阶段，酸被重新吸收和代谢以生产丙酮、丁醇和乙醇。

该酶的初步纯化和结晶揭示了活性位点中涉及赖氨酸残基。该酶是由单一类型亚基的12个拷贝组成的大型复合物。

已纯化了丙酮丁醇梭菌ATCC 824的该酶，并克隆了编码其的adc基因。也已从相关株丙酮丁醇梭菌DSM 792中纯化该酶，并对基因进行了克隆和测序。脱羧反应通过形成席夫碱(Schiff base)中间体进行。

ADC是酸摄入的关键酶，其有效地将辅酶A转移酶反应拉向乙酰乙酸形成的方向。

在具体的实施方案中，该酶将乙酰乙酸转化为丙酮。在一个实施方案中，乙酰乙酸脱羧酶由一种或多种获自微生物的核酸分子编码，所述微生物选自梭菌属物种、芽孢杆菌属物种、色杆菌属物种(Chromobacterium sp.)和假单胞菌属物种。在另一个实施方案中，乙酰乙酸脱羧酶由一种或多种获自微生物的核酸分子编码，所述微生物选自丙酮丁醇梭菌、拜氏梭菌(Clostridium beijerinckii)、解纤维素梭菌(Clostridiumcellulolyticum)、多粘芽孢杆菌(Bacillus polymyxa)、紫色色杆菌(Chromobacteriumviolaceum)和恶臭假单胞菌(Pseudomonas putida)。在一些实施方案中，编码乙酰乙酸脱羧酶的一种或多种核酸分子是adc或其同源物。在进一步的实施方案中，乙酰乙酸脱羧酶包含选自SEQ ID NO：49和52的氨基酸序列。在一个仍进一步的实施方案中，乙酰乙酸脱羧酶由选自SEQ ID NO：47、48、50和51的核酸序列编码。

醇脱氢酶(EC 1.1.1.-)

本公开描述了可以分别催化伯醇或仲醇可逆氧化为醛或酮的酶。在一个实施方案中，该酶是仲醇脱氢酶(S-ADH)并且催化酮(如丙酮)还原为仲醇(如2-丙醇(异丙醇))。

在一些实施方案中，S-ADH来自伯克霍尔德氏菌属物种(Burkholderia sp.)。在一些实施方案中，S-ADH来自伯克霍尔德氏菌属物种AIU 652。在一些实施方案中，S-ADH来自产碱杆菌属物种(Alcaligenes sp.)。在一些实施方案中，S-ADH来自真养产碱杆菌(Alcaligenes eutrophus)。在一些实施方案中，S-ADH来自梭菌。在一些实施方案中，S-ADH来自拉格利梭菌(Clostridium ragsdalei)。在一些实施方案中，S-ADH来自拜氏梭菌。在一些实施方案中，S-ADH来自嗜热厌氧杆菌属物种(Thermoanaerobacter sp.)。在一些实施方案中，S-ADH来自布氏嗜热厌氧杆菌(Thermoanaerobacter brockii)。在一些实施方案中，S-ADH来自嗜热厌氧乙醇杆菌(Thermoanaerobacter ethanolicus)(热氢硫酸梭菌Clostridium thermohydrosulfuricum)。在一些实施方案中，S-ADH由adhB基因编码。在一些实施方案中，S-ADH来自锥虫植生滴虫属物种(Phytomonas sp.)。在一些实施方案中，S-ADH来自红球菌属物种(Rhodococcus sp.)。在一些实施方案中，S-ADH来自赤红球菌(Rhodococcus ruber)。在一些实施方案中，S-ADH来自沼泽产甲烷菌(Methanobacteriumpalustre)。在一些实施方案中，S-ADH来自产甲烷古细菌泥游产甲烷菌(Methanogeniumliminatans)。在一些实施方案中，S-ADH来自寄生原生生物溶组织内阿米巴(Entamoebahistolytica，EhAdh1)。在一些实施方案中，S-ADH来自寄生原生动物猫毛滴虫(Tritrichomonas foetus)。在一些实施方案中，S-ADH来自人寄生虫阴道毛滴虫(Trichomonas vaginalis)。

在一些实施方案中，根据同源性预测S-ADH，并且S-ADH可以来自马瑞氏热厌氧杆菌(Thermoanaerobacter mathranii)、藤黄微球菌(Micrococcus luteus)、白色拟诺卡氏菌(Nocardiopsis alba)、黑森分枝杆菌(Mycobacterium hassiacum)、猪螺杆菌(Helicobacter suis)、白色念珠菌、近平滑念珠菌(Candida parapsilosis)、拟平滑念珠菌(Candida orthopsilosis)、似平滑念珠菌(Candida metapsilosis)、长喙壳菌(Grosmannia clavigera)和Scheffersomyces stipitis。

在一些实施方案中，醇脱氢酶与来自梭菌的醇脱氢酶具有至少70％的序列同一性、至少80％的序列同一性或至少90％的序列同一性。在其他实施方案中，醇脱氢酶是选自拜氏梭菌adh和食碳梭菌(Clostridium carboxidivorans)adh的醇脱氢酶。在进一步的实施方案中，醇脱氢酶包含选自SEQ ID NO：138和140的氨基酸序列。在一个仍进一步的实施方案中，醇脱氢酶由选自SEQ ID NO：136、137和139的核酸序列编码。

脱水酶(EC 4.2.1.-)

本公开描述了可以催化以下反应的酶：

D-木酮糖1-激酶(EC 2.7.1.-)

本公开描述了可以催化D-木酮糖转化为D-木酮糖-1-磷酸的酶。在一些实施方案中，人酮己糖激酶C(khk-C)，也称为果糖激酶，可以催化该转化。

酮己糖激酶或果糖激酶将果糖磷酸化为果糖-1-磷酸。该酶参与果糖代谢，果糖代谢是碳水化合物代谢的一部分。其存在于肝脏、肠和肾脏皮质中。

在人肝脏中，已发现纯化的果糖激酶联合上醛缩酶有助于由木糖醇生产草酸的替代机制。以联合的顺序，果糖激酶和醛缩酶通过D-木酮糖1-磷酸由D-木酮糖产生乙醇醛(草酸的前体)。

在具体的实施方案中，该酶将D-木酮糖转化为D-木酮糖-1-磷酸。在一个实施方案中，D-木酮糖1-激酶由获自人的一种或多种核酸分子编码。在一些实施方案中，编码D-木酮糖1-激酶的一种或多种核酸分子是酮己糖激酶C(khk-C)或其同源物。在另一个实施方案中，编码D-木酮糖1-激酶的一种或多种核酸分子包含SEQ ID NO：55或256中列出的氨基酸序列。在一个进一步的实施方案中，编码D-木酮糖1-激酶的一种或多种核酸分子由选自SEQID NO：53和54的核酸序列编码。

D-木酮糖-1-磷酸醛缩酶(EC 4.1.2.-)

本公开描述了可以催化D-木酮糖-1-磷酸转化为乙醇醛和DHAP的酶。在一些实施方案中，人醛缩酶B可以催化该转化，其也称为果糖-二磷酸醛缩酶B或肝型醛缩酶。

醛缩酶B是I类果糖1,6-二磷酸醛缩酶(EC 4.1.2.13)的三种同工酶(A、B和C)之一，其在糖酵解和糖异生中都起着关键作用。通用的果糖1,6-二磷酸醛缩酶催化果糖1,6-二磷酸(FBP)可逆裂解为甘油醛3-磷酸和磷酸二羟丙酮(DHAP)，以及果糖1-磷酸(F1P)可逆裂解为甘油醛和磷酸二羟丙酮。在哺乳动物中，醛缩酶B优先在肝脏中表达，而醛缩酶A在肌肉和红细胞中表达，醛缩酶C在脑中表达。同工酶结构的细微差异导致对FBP和果糖1-磷酸这两种底物分子的活性不同。醛缩酶B表现出无偏好，因此催化这两种反应，而醛缩酶A和C偏好FBP。

醛缩酶B是同源四聚体酶，由四个亚基组成。每个亚基具有36kDa的分子量，并含有八链α/β桶，其中包含赖氨酸229(形成希夫碱的氨基酸，是催化的关键)。

在具体的实施方案中，该酶将D-木酮糖-1-磷酸转化为乙醇醛和DHAP。在一个实施方案中，D-木酮糖-1-磷酸醛缩酶由获自人的一种或多种核酸分子编码。在另一个实施方案中，编码D-木酮糖-1-磷酸醛缩酶的一种或多种核酸分子是醛缩酶B(aldoB)或其同源物。在一些实施方案中，编码D-木酮糖-1-磷酸醛缩酶的一种或多种核酸分子包含SEQ ID NO：58中列出的氨基酸序列。在一些实施方案中，编码D-木酮糖-1-磷酸醛缩酶的一种或多种核酸分子由选自SEQ ID NO：56和57的核酸序列编码。

D-木糖异构酶(EC 5.3.1.5)

本公开描述了可以催化以下可逆反应的酶：

D-木糖异构酶也可以称为木糖异构酶或D-木糖酮醇异构酶。

因此，在一些实施方案中，本公开提供了在木糖降解中起作用的酶。

木糖异构酶催化D-木糖分解代谢的第一个反应。

已表明两个保守的组氨酸残基H101和H271是催化活性所必需的。在木糖结合期间，两个保守的色氨酸残基W49和W188的荧光被淬灭，并且已表明W49是催化活性所必需的。Mg²⁺、Mn²⁺或Co²⁺的存在保护酶免于热变性。

亚基组成尚未通过实验确定。

在具体的实施方案中，该酶将D-木糖转化为D-木酮糖。在一个实施方案中，重组微生物进一步包含内源性或外源性木糖异构酶，其催化D-木糖转化为D-木酮糖。在一个实施方案中，木糖异构酶是外源的。在另一个实施方案中，木糖异构酶由获自Pyromyces sp.或大肠杆菌的一种或多种核酸分子编码。在另一个实施方案中，编码木糖异构酶的一种或多种核酸分子是xylA或其同源物。在又一个实施方案中，编码木糖异构酶的一种或多种核酸分子包含选自SEQ ID NO：95和144的氨基酸序列。在一个进一步的实施方案中，编码木糖异构酶的一种或多种核酸分子由选自SEQ ID NO：93、94和143的核酸序列编码。

在一些实施方案中，生产MEG或GA或任选MEG或GA和一种或多种联产品的重组微生物，在编码D-木糖异构酶的基因中包含缺失、插入或功能缺失突变，以防止D-木糖转化为D-木酮糖，而将反应分流至D-木糖转化为D-木糖酸。

D-木酮糖5-激酶/木酮糖激酶

本公开描述了可以催化以下反应的酶：

D-木酮糖+ATP→D-木酮糖5-磷酸+ADP+H+(EC 2.7.1.17)

ATP+1-脱氧-D-木酮糖→1-脱氧-D-木酮糖5-磷酸+ADP+H+(EC 2.7.1.-)

D-木酮糖5-激酶也可以称为木酮糖激酶(xylulose kinase或xylulokinase)。

木酮糖激酶催化D-木酮糖的磷酸化，这是木糖降解途径的第二步，生产磷酸戊糖途径的中间体D-木酮糖-5-磷酸。

在没有底物的情况下，木酮糖激酶的ATPase活性很弱。木酮糖激酶还可以催化1-脱氧-D-木酮糖的磷酸化。这将允许潜在的补救途径用于生成1-脱氧-D-木酮糖5-磷酸，其用于萜类、硫胺素和吡哆醛的生物合成。1-脱氧-D-木酮糖的磷酸化速率比D-木酮糖的磷酸化速率低32倍。

已经研究了该细菌酶的动力学机制，表明主要是有序的反应机制。该酶在与底物和ATP结合后发生显著的构象变化。已证明两个保守的天冬氨酸残基D6和D233是催化活性所必需的，并提出了催化机制。

已分别以

和

的分辨率确定了apo形式的和与D-木酮糖结合的细菌木酮糖激酶的晶体结构。

在具体的实施方案中，该酶将D-木酮糖转化为D-木酮糖-5-磷酸。在一些实施方案中，D-木酮糖5-激酶来自大肠杆菌。在一些实施方案中，D-木酮糖5-激酶由xylB基因编码。在一些实施方案中，D-木酮糖5-激酶来自酿酒酵母。在一些实施方案中，D-木酮糖5-激酶由XKS1基因编码。在一些实施方案中，D-木酮糖5-激酶来自树干毕赤酵母(Pichiastipitis)。在一些实施方案中，D-木酮糖5-激酶由XYL3基因编码。

在一些实施方案中，D-木酮糖5-激酶由与来自大肠杆菌的xylB具有至少70％序列同一性的氨基酸序列编码。在一个进一步的实施方案中，D-木酮糖5-激酶由与来自大肠杆菌的xylB具有至少80％序列同一性的氨基酸序列编码。在一个仍进一步的实施方案中，D-木酮糖5-激酶由与来自大肠杆菌的xylB具有至少90％序列同一性的氨基酸序列编码。在其他实施方案中，D-木酮糖5-激酶是来自大肠杆菌的xylB。

在一个实施方案中，D-木酮糖5-激酶由一种或多种获自大肠杆菌的核酸分子编码。在一些实施方案中，编码D-木酮糖5-激酶的一种或多种核酸分子是xylB或其同源物。在另一个实施方案中，编码D-木酮糖5-激酶的一种或多种核酸分子包含SEQ ID NO：146中列出的氨基酸序列。在一个进一步的实施方案中，编码D-木酮糖5-激酶的一种或多种核酸分子由SEQ ID NO：145中列出的核酸序列编码。

木糖脱氢酶(EC 1.1.1.175或EC 1.1.1.179)

本公开描述了可以催化以下反应的酶：

醛-D-木糖+NAD++H₂O→D-木糖酸+NADH+2H+

木糖脱氢酶也可以称为D-木糖脱氢酶、D-木糖1-脱氢酶、连接(NAD+)-的D-木糖脱氢酶、NAD+-D-木糖脱氢酶、D-木糖：NAD+1-氧化还原酶。

D-木糖脱氢酶催化NAD+依赖的D-木糖氧化为D-木糖酸内酯。这是新月柄杆菌(Caulobacter crescentus)中D-木糖降解的氧化、非磷酸化途径中的第一个反应。该途径类似于巴西固氮螺菌(Azospirillum brasilense)中L-阿拉伯糖降解的途径。该新月柄杆菌酶的氨基酸序列与来自古细菌Haloarcula marismortui的木糖脱氢酶或巴西固氮螺菌的L-阿拉伯糖1-脱氢酶的氨基酸序列无关。

D-木糖是来自新月柄杆菌的重组D-木糖脱氢酶的优选底物。该酶可以使用L-阿拉伯糖，但其是一种较差的底物。对L-阿拉伯糖的Km为166mM。如通过NADH生产所测量的，其他底物如D-阿拉伯糖、L-木糖、D-核糖、D-半乳糖、D-葡萄糖和D-葡萄糖-6-磷酸在测定中显示出很少的活性或没有活性。新月柄杆菌D-木糖脱氢酶可以直接将D-木糖转化为D-木糖酸。

来自新月柄杆菌的部分纯化的天然D-木糖脱氢酶对D-木糖具有70μM的Km。该值低于重组His标记酶的Km(760μM)。

在一些实施方案中，D-木糖脱氢酶来自嗜盐古菌沃氏富盐菌(Haloferaxvolcanii)。沃氏富盐菌D-木糖脱氢酶催化嗜盐古菌沃氏富盐菌的氧化木糖降解途径中的第一个反应。沃氏富盐菌D-木糖脱氢酶与来自Haloarcula marismortui的功能特征木糖脱氢酶具有59％的氨基酸序列同一性，与Halorubrum lacusprofundi中的直系同源物具有56％的同一性，但与来自新月柄杆菌CB15的细菌NAD+依赖性木糖脱氢酶仅有11％的同一性。

在具体的实施方案中，该酶将D-木糖转化为D-木糖酸内酯。在一个实施方案中，木糖脱氢酶由一种或多种获自微生物的核酸分子编码，所述微生物选自柄杆菌属物种(Caulobacter sp.)、嗜盐小盒菌属物种(Haloarcula sp.)、富盐菌属物种(Haloferaxsp.)、盐红菌属物种(Halorubrum sp.)和木霉属物种(Trichoderma sp.)。在另一个实施方案中，木糖脱氢酶由一种或多种获自微生物的核酸分子编码，所述微生物选自新月柄杆菌、Haloarcula marismortui、沃氏富盐菌、Halorubrum lacusprofundi和里氏木霉(Trichoderma reesei)。在一些实施方案中，编码木糖脱氢酶的一种或多种核酸分子选自xylB、xdh1(HVO_B0028)和/或xyd1，或其同源物。在一个进一步的实施方案中，编码木糖脱氢酶的一种或多种核酸分子包含选自SEQ ID NO：61、63和65的氨基酸序列。在又一个实施方案中，编码木糖脱氢酶的一种或多种核酸分子由选自SEQ ID NO：59、60、62和64的核酸序列编码。

木糖酸内酯酶(3.1.1.68)

本公开描述了可以催化以下反应的酶：

该酶属于水解酶家族，具体为那些作用于羧酸酯键的酶。该酶参与戊糖和葡萄糖醛酸的互变。

木糖酸内酯酶也可以称为D-木糖酸内酯酶、木糖酸-1,4-内酯酶、木糖酸-γ-内酯酶或D-木糖酸-1,4-内酯内酯水解酶。

在具体的实施方案中，该酶将D-木糖酸内酯转化为D-木糖酸。在一个实施方案中，木糖酸内酯酶由一种或多种获自微生物的核酸分子编码，所述微生物选自柄杆菌属物种(Caulobacter sp.)和富盐菌属物种(Haloferax sp.)。在另一个实施方案中，木糖酸内酯酶由一种或多种获自微生物的核酸分子编码，所述微生物选自新月柄杆菌、沃氏富盐菌和吉氏富盐菌(Haloferax gibbonsii)。在一些实施方案中，编码木糖酸内酯酶的一种或多种核酸分子是xylC或其同源物。在一个进一步的实施方案中，编码木糖酸内酯酶的一种或多种核酸分子包含SEQ ID NO：67中列出的氨基酸序列。在又一个实施方案中，编码木糖酸内酯酶的一种或多种核酸分子由SEQ ID NO：66中列出的核酸序列编码。

木糖酸脱水酶(EC 4.2.1.82)

本公开描述了可以催化以下反应的酶：

该酶属于裂解酶家族，具体为水裂解酶，其裂解碳-氧键。该酶参与戊糖和葡萄糖醛酸的互变。

木糖酸脱水酶也可以称为D-木糖酸水裂解酶、D-木糖醛酸脱水酶或D-木糖酸脱水酶。

在具体的实施方案中，该酶将D-木糖酸转化为2-酮-3-脱氧-D-木糖酸。在一个实施方案中，木糖酸脱水酶由一种或多种获自微生物的核酸分子编码，所述微生物选自柄杆菌属物种、硫化叶菌属物种(Sulfolobus sp.)和大肠杆菌。在另一个实施方案中，木糖酸脱水酶由一种或多种获自微生物的核酸分子编码，所述微生物选自新月柄杆菌、硫矿硫化叶菌(Sulfolobus solfataricus)和大肠杆菌。在一些实施方案中，编码木糖酸脱水酶的一种或多种核酸分子选自xylD、yjhG和/或yagF，或其同源物。在一个进一步的实施方案中，编码木糖酸脱水酶的一种或多种核酸分子包含选自SEQ ID NO：69、72和75的氨基酸序列。在又一个实施方案中，编码木糖酸脱水酶的一种或多种核酸分子由选自SEQ ID NO：68、70、71、73和74的核酸序列编码。

2-酮-3-脱氧-D-戊糖酸醛缩酶(4.1.2.28)

本公开描述了可以催化以下反应的酶：

该酶属于裂解酶家族，具体为醛裂解酶，其裂解碳-碳键。该酶参与戊糖和葡萄糖醛酸的互变。

2-酮-3-脱氧-D-戊糖酸醛缩酶也可以称为2-脱氢-3-脱氧-D-戊糖酸乙醇醛裂解酶(形成丙酮酸)、2-脱氢-3-脱氧-D-戊糖酸醛缩酶、3-脱氧-D-戊糖酸醛缩酶和2-脱氢-3-脱氧-D-戊糖酸乙醇醛裂解酶。

YjhH表现为2-脱氢-3-脱氧-D-戊糖酸醛缩酶。遗传证据表明，YagE还可以作为2-脱氢-3-脱氧-D-戊糖酸醛缩酶发挥作用。yagE是原噬菌体CP4-6的一部分。

yjhH yagE双突变体不能使用D-木酸作为唯一碳源，并且粗细胞提取物不包含2-脱氢-3-脱氧-D-戊糖酸醛缩酶活性。通过在质粒上提供yjhH来补充这两种表型。

ArcA在厌氧条件下表现出激活yjhH基因表达。在该基因上游211bp和597bp处鉴定了两个推定的ArcA结合位点，但尚未鉴定出其上游的启动子。

YagE的晶体结构表明该蛋白质是同源四聚体。已解析了在丙酮酸和2-酮-3-脱氧半乳糖酸存在下的YagE共晶结构。

在具体的实施方案中，该酶将2-酮-3-脱氧-木糖酸转化为乙醇醛和丙酮酸。在一个实施方案中，2-酮-3-脱氧-D-戊糖酸醛缩酶由一种或多种获自微生物的核酸分子编码，所述微生物选自假单胞菌属物种和大肠杆菌。在另一个实施方案中，2-酮-3-脱氧-D-戊糖酸醛缩酶由获自大肠杆菌的一种或多种核酸分子编码。在一些实施方案中，编码2-酮-3-脱氧-D-戊糖酸醛缩酶的一种或多种核酸分子选自yjhH和/或yagE，或其同源物。在一个进一步的实施方案中，编码2-酮-3-脱氧-D-戊糖酸醛缩酶的一种或多种核酸分子包含选自SEQID NO：78和81的氨基酸序列。在又一个实施方案中，编码2-酮-3-脱氧-D-戊糖酸醛缩酶的一种或多种核酸分子由选自SEQ ID NO：76、77、79和80的核酸序列编码。

乙醇醛脱氢酶(1.2.1.21)

本公开描述了可以催化以下反应的酶：

该酶属于氧化还原酶家族，具体为那些以NAD+或NADP+作为受体作用于供体的醛或氧代基团的酶。该酶参与乙醛酸和二羧酸代谢。

乙醇醛脱氢酶(glycolaldehyde dehydrogenase)也可以称为乙醇醛：NAD+氧化还原酶或乙醇醛脱氢酶(glycol aldehyde dehydrogenase)。

在大肠杆菌中，醛脱氢酶A(AldA)是一种对小α-羟基醛底物具有相对广泛底物特异性的酶。其因此在多种代谢途径中被利用。

L-岩藻糖和L-鼠李糖通过平行途径代谢，所述途径在其相应的醛缩酶反应后汇聚，产生相同的产物：磷酸二羟丙酮和L-乳醛。有氧地，醛脱氢酶A将L-乳醛氧化为L-乳酸。

在利用相同酶的平行途径中，D-阿拉伯糖和L-木糖可以代谢为磷酸二羟丙酮和乙醇醛，醛脱氢酶A将乙醇醛氧化为乙醇酸。

已解析了单独的酶以及三元和二元复合物的晶体结构。

醛脱氢酶A仅在有氧条件下存在，并且在岩藻糖、鼠李糖或谷氨酸的存在下被最高度地诱导。NADH抑制该酶，NADH可以作为开关，从氧化乳醛转变为通过丙二醇氧化还原酶还原乳醛。在对葡萄糖限制的短期适应期间，AldA被上调。

基于序列相似性，预测AldA为琥珀酸半醛脱氢酶。

已研究了aldA表达的调节。该基因受以下调节：分解代谢物的抑制、在厌氧条件下通过ArcA的抑制和碳源的诱导。

在具体的实施方案中，该酶将乙醇醛转化为乙醇酸。在一些实施方案中，乙醇醛脱氢酶来自大肠杆菌。在一些实施方案中，乙醇醛脱氢酶由aldA基因编码。

在一些实施方案中，生产MEG或任选MEG和一种或多种联产品的重组微生物，在编码乙醇醛脱氢酶的基因中包含缺失、插入或功能缺失突变，以防止由乙醇醛生产乙醇酸，而将反应分流至乙醇醛转化为MEG。在一些实施方案中，催化乙醇醛转化为乙醇酸的乙醇醛脱氢酶活性是部分缺失、破坏、突变和/或降低的，其中仍然生产一定量的乙醇酸。

在其他实施方案中，生产乙醇酸的重组微生物包含或表达至少一种编码乙醇醛脱氢酶的核酸分子。

乳酸脱氢酶(1.1.1.28)

本公开描述了可以催化以下反应的酶：

(R)-乳酸+NAD+←丙酮酸+NADH+H+

乳酸脱氢酶(LDH)是存在于几乎所有活细胞中的酶，如存在于动物、植物和原核生物中。LDH催化乳酸转化为丙酮酸和反向，以及催化NADH转化为NAD+和反向。脱氢酶是将氢化物从一个分子转移至另一个分子的酶。

存在四种不同酶类的LDH。最常见的一种是NAD(P)依赖性L-乳酸脱氢酶。其他LDH作用于D-乳酸和/或依赖于细胞色素c：D-乳酸脱氢酶(细胞色素)和L-乳酸脱氢酶(细胞色素)。

LDH具有医学意义，因为其广泛存在于身体组织中，如血细胞和心肌。因为其在组织损伤期间释放，所以其是常见损伤和疾病(如心力衰竭)的标志。

乳酸脱氢酶(lactate dehydrogenase)也可以称为乳酸脱氢酶(lactic aciddehydrogenase)、(R)-乳酸：NAD+氧化还原酶或发酵D-乳酸脱氢酶。

在大肠杆菌中，乳酸脱氢酶(LdhA)是可溶性的连接NAD的乳酸脱氢酶(LDH)，其特异性生产D-乳酸。LdhA是同源四聚体，在较高pH条件下显示正同向协同性。

大肠杆菌含有另外两种乳酸脱氢酶：D-乳酸脱氢酶和L-乳酸脱氢酶。两者都是以乳酸有氧生长所需的膜相关黄素蛋白。

LdhA在有氧条件下存在，但当大肠杆菌在酸性pH和厌氧条件下以各种糖生长时被诱导。与大多数参与厌氧呼吸的基因不同，ldhA不受Fnr激活；相反，ArcAB系统和数个参与控制碳水化合物代谢的基因(csrAB和mlc)显示出调节表达。ldhA的表达受到转录调节因子ArcA的负向影响。ldhA属于σ32调节子。

ldhA基因是代谢工程中突变的常见靶点，最常是为了消除不需要的发酵副产品的生产，但也是为了特别生产D-乳酸。

在具体的实施方案中，该酶将丙酮酸转化为乳酸。在一些实施方案中，乳酸脱氢酶来自大肠杆菌。在一些实施方案中，乳酸脱氢酶由ldhA基因编码。

在一些实施方案中，生产MEG或GA或任选MEG或GA和一种或多种联产品的重组微生物，在编码乳酸脱氢酶的基因中包含缺失、插入或功能缺失突变，以防止由丙酮酸生产乳酸，而将反应分流至生产一种或多种联产品。

木糖还原酶或醛糖还原酶(EC 1.1.1.21)

本公开描述了可以催化以下反应的酶：

醛糖还原酶也可以称为糖醇：NAD(P)+1-氧化还原酶、多元醇脱氢酶或醛还原酶。

醛糖还原酶是一种胞质氧化还原酶，其催化多种醛和羰基(包括单糖)的还原。

可以认为醛糖还原酶是醛酮还原酶超家族的原型酶。该酶包含315个氨基酸残基并折叠为由8条平行β链组成的β/α-桶结构基序。相邻的链由8个与β折叠反向平行的外围α螺旋段连接。催化活性位点位于桶的核心。NADPH辅因子位于β/α桶的顶部，其烟酰胺环在桶的中心向下突出，并且焦磷酸跨在桶的边缘。

醛糖还原酶在醛还原方向上的反应机制遵循顺序有序的路径，其中NADPH结合，然后底物结合。NADPH的结合诱导构象变化(酶·NADPH–>酶*·NADPH)，其涉及表面环(残基213-217)的铰链状运动，使得以类似于安全带的方式盖住NADPH的一部分。通过将NADPH的pro-R氢化物转移至底物的羰基碳的对面形成醇产物。醇产物释放后，发生另一种构象变化(E*·NAD(P)+–>E·NAD(P)+)以释放NADP+。动力学研究表明，该回路的重新定向以允许NADP+的释放表现为代表了醛还原方向上的限速步骤。由于辅酶释放速率限制了催化速率，可以看出对稳定辅酶结合的相互作用的扰动会对最大速度(Vmax)产生显著影响。

已表明发酵D-木糖的树干毕赤酵母(Pichia stipitis)和休哈塔念珠酵母(Candida shehatae)产生单一的醛糖还原酶(ALR)，其对NADPH和NADH都有活性。其他酵母如嗜鞣管囊酵母(Pachysolen tannophilus)和热带念珠酵母(C.tropicalis)合成多种形式的具有不同辅酶特异性的ALR。显著的双重辅酶特异性将树干毕赤酵母和休哈塔念珠酵母的酶与迄今为止从哺乳动物或微生物来源分离的大多数其他ALR区分开来。酵母纤细念珠酵母(Candida tenuis)CBS 4435以D-木糖生长期间，产生相当的连接NADH和NADPH的醛还原活性。

在具体的实施方案中，该酶将D-木糖转化为木糖醇。在一些实施方案中，木糖还原酶或醛糖还原酶由一种或多种获自微生物的核酸分子编码，所述微生物选自肉座菌属物种(Hypocrea sp.)、Scheffersomyces sp.、酵母属物种(Saccharomyces sp.)、管囊酵母属物种(Pachysolen sp.)、毕赤酵母属物种(Pichia sp.)、念珠菌属物种(Candida sp.)、曲霉属物种(Aspergillus sp.)、链孢霉属物种(Neurospora sp.)和隐球菌属物种(Cryptococcus sp.)。在一些实施方案中，木糖还原酶或醛糖还原酶由一种或多种获自微生物的核酸分子编码，所述微生物选自红褐肉座菌(Hypocrea jecorina)、Scheffersomyces stipitis、酿酒酵母、嗜鞣管囊酵母、树干毕赤酵母、Pichia quercuum、休哈塔念珠酵母、纤细念珠酵母、热带念珠菌、黑曲霉(Aspergillus niger)、粗糙链孢霉(Neurospora crassa)和嗜乳酸隐球菌(Cryptococcus lactativorus)。在另一个实施方案中，编码木糖还原酶或醛糖还原酶的一种或多种核酸分子是xyl1和/或GRE3或其同源物。在一些实施方案中，编码木糖还原酶或醛糖还原酶的一种或多种核酸分子包含选自SEQ IDNO：84和87的氨基酸序列。在一些实施方案中，编码木糖还原酶或醛糖还原酶的一种或多种核酸分子由选自SEQ ID NO：82、83、85和86的核酸序列编码。

木糖醇脱氢酶(1.1.1.9)

本公开描述了可以催化以下反应的酶：

木糖醇脱氢酶也可以称为D-木酮糖还原酶、NAD+依赖性木糖醇脱氢酶、赤藓糖醇脱氢酶、2,3-顺式-多元醇(DPN)脱氢酶(C3-5)、戊糖醇-DPN脱氢酶、木糖醇-2-脱氢酶或木糖醇：NAD+2-氧化还原酶(形成D-木酮糖)。

木糖醇脱氢酶(XDH)是负责将木糖吸收进入真核代谢的几种酶之一，可用于发酵农业副产品中含有的木糖以生产乙醇。为了在高流率下有效利用木糖，共底物应在NAD+特异性XDH和NADPH偏好性木糖还原酶(该途径中的另一种酶)之间循环。

在具体的实施方案中，该酶将木糖醇转化为D-木酮糖。在以上公开的任何方面的一个实施方案中，木糖醇脱氢酶由一种或多种获自微生物的核酸分子编码，所述微生物选自Scheffersomyces sp.、木霉属物种、毕赤酵母属物种、酵母属物种、葡糖杆菌属物种(Gluconobacter sp.)、Galactocandida sp.、链孢霉属物种(Neurospora sp.)和沙雷氏菌属物种(Serratia sp.)。在另一个实施方案中，木糖醇脱氢酶由一种或多种获自微生物的核酸分子编码，所述微生物选自Scheffersomyces stipitis、里氏木霉、树干毕赤酵母、酿酒酵母、氧化葡糖杆菌(Gluconobacter oxydans)、Galactocandida mastotermitis、粗糙链孢霉(Neurospora crassa)和粘质沙雷氏菌(Serratia marcescens)。在另一个实施方案中，编码木糖醇脱氢酶的一种或多种核酸分子是xyl2和/或xdh1，或其同源物。在一些实施方案中，编码木糖脱氢酶的一种或多种核酸分子包含选自SEQ ID NO：90和92的氨基酸序列。在一些实施方案中，编码木糖脱氢酶的一种或多种核酸分子由选自SEQ ID NO：88、89和91的核酸序列编码。在另一个实施方案中，该酶将D-木酮糖转化为木糖醇。在另一个实施方案中，该酶对D-木酮糖转化为木糖醇具有高活性，并且优选对逆反应(即对木糖醇转化为D-木酮糖)具有低活性或没有活性。在另一个实施方案中，其通过酶工程实现。

可溶性吡啶核苷酸转氢酶(EC 1.6.1.1.)

本公开描述了可以催化以下反应的酶：

可溶性吡啶核苷酸转氢酶也可以称为NAD(P)+转氢酶(B-特异性)、STH、吡啶核苷酸转氢酶或转氢酶。

大肠杆菌含有可溶性和膜结合吡啶核苷酸转氢酶。可溶性吡啶核苷酸转氢酶是sthA或udhA基因的产物；其主要生理作用表现为NADPH的再氧化。膜结合质子转运转氢酶是pntAB基因的产物；PntAB是NADPH的主要来源。

UdhA含有非共价结合的FAD，并以由七个或八个单体组成的形式存在。

UdhA(SthA)的适度过表达允许磷酸葡萄糖异构酶突变体的最大生长速率增加，而pgi sthA双突变体不能存活。这些表型可能是由于UdhA在NADPH形成过多的条件下恢复细胞氧化还原平衡的能力。sthA中的突变出现在pgi突变株适应以葡萄糖基本介质生长的过程中。

以甘油生长下调sthA的转录。

在一些实施方案中，转氢酶的表达可以增加NADPH依赖性醇脱氢酶的活性，导致丙酮转化为2-丙醇提高。在一个实施方案中，可溶性吡啶核苷酸转氢酶由一种或多种获自大肠杆菌的核酸分子编码。在另一个实施方案中，编码可溶性吡啶核苷酸转氢酶的一种或多种核酸分子是udhA，或其同源物。在一些实施方案中，编码可溶性吡啶核苷酸转氢酶的一种或多种核酸分子包含SEQ ID NO：142中列出的氨基酸序列。在一些实施方案中，编码可溶性吡啶核苷酸转氢酶的一种或多种核酸分子由SEQ ID NO：141中列出的核酸序列编码。

羟甲基戊二酰辅酶A合酶(EC 2.3.3.-)

本公开描述了可以催化以下反应的酶：

羟甲基戊二酰辅酶A合酶也可以称为(S)-3-羟基-3-甲基戊二酰辅酶A乙酰乙酰辅酶A-裂解酶(辅酶A-乙酰化)、3-羟基-3-甲基戊二酰辅酶A合成酶(3-hydroxy-3-methylglutaryl CoA synthetase，3-hydroxy-3-methylglutaryl coenzyme Asynthetase)、3-羟基-3-甲基戊二酰辅酶A合酶(3-hydroxy-3-methylglutaryl coenzymeA synthase，3-hydroxy-3-methylglutaryl-CoA synthase，3-hydroxy-3-methylglutaryl-coenzyme A synthase)、β-羟基-β-甲基戊二酰辅酶A合酶、HMG-辅酶A合酶、乙酰乙酰辅酶A转乙酰酶、羟甲基戊二酰辅酶A合酶和羟甲基戊二酰辅酶A缩合酶。

羟甲基戊二酰辅酶A合酶催化乙酰辅酶A与乙酰乙酰辅酶A缩合形成(S)-3-羟基-3-甲基戊二酰辅酶A，这是胆固醇前体(R)-甲羟戊酸合成的早期阶段。

该酶催化可以分为四个步骤的复杂反应。第一步涉及酶-乙酰辅酶A二元复合物的形成，随后乙酰基团从辅酶A硫酯转移至酶上的半胱氨酸残基，形成硫酯酰基-酶中间体。在下一步中，现在已还原的辅酶A解离，第二底物乙酰乙酰辅酶A与酶结合。第三步涉及通过从乙酰半胱氨酸的甲基中去除质子来形成碳负离子。然后，活化的乙酰半胱氨酸与乙酰乙酰辅酶A配体的γ-碳进行类克莱森(Claisen-like)缩合，形成HMG-辅酶A，同时保留与酶的硫酯键。最后一步包括该键的水解，产生游离的HMG-辅酶A。

已克隆和测序了来自人的HMGCS1基因(Russ AP等人(1992)Amplification anddirect sequencing of a cDNA encoding human cytosolic 3-hydroxy-3-methylglutaryl-coenzyme A synthase.Biochim Biophys Acta 1132(3)：329-31)。该基因在大肠杆菌中表达，并已纯化和表征该重组蛋白(Rokosz LL等人(1994)Humancytoplasmic 3-hydroxy-3-methylglutaryl coenzyme A synthase：expression,purification,and characterization of recombinant wild-type and Cys129mutantenzymes.Arch Biochem Biophys 312(1)：1-13)。该酶是120kDa的同源二聚体。通过形成共价乙酰-酶中间体进行催化。动力学数据表明两种底物(乙酰辅酶A和乙酰乙酰辅酶A)竞争结合同一位点。

在一个实施方案中，羟甲基戊二酰辅酶A合酶可以具有3-羟基异戊酸(3HIV)合酶活性，并且可以催化以下反应：

在一个实施方案中，3HIV合酶由一种或多种获自微生物的核酸分子编码，所述微生物选自鼠属物种(Mus sp.)、酵母属物种、乳杆菌属物种和单胞菌属物种(Polaromonassp.)。在另一个实施方案中，3HIV合酶由一种或多种获自微生物的核酸分子编码，所述微生物选自小鼠、酿酒酵母、卷曲乳杆菌(Lactobacillus crispatus)和食萘极地单胞菌(Polaromonas naphthalenivorans)。在一些实施方案中，编码3HIV合酶的一种或多种核酸分子选自Hmgcs1、ERG13、PksG和/或Pnap_0477，或其同源物。在一个进一步的实施方案中，编码3HIV合酶的一种或多种核酸分子包含选自SEQ ID NO：105、107、109和111的氨基酸序列。在又一个实施方案中，编码3HIV合酶的一种或多种核酸分子由选自SEQ ID NO：104、106、108和110的核酸序列编码。在一些实施方案中，编码羟甲基戊二酰辅酶A合酶的一种或多种核酸分子是hmgS，或其同源物。在一个进一步的实施方案中，编码羟甲基戊二酰辅酶A合酶的一种或多种核酸分子包含SEQ ID NO：123中列出的氨基酸序列。在又一个实施方案中，编码羟甲基戊二酰辅酶A合酶的一种或多种核酸分子由SEQ ID NO：122中列出的核酸序列编码。

甲基戊烯二酰辅酶A水合酶(EC 4.2.1.18)

本公开描述了可以催化以下反应的酶：

该酶在亮氨酸降解途径中催化3-甲基戊烯二酰辅酶A顺式水合(syn-hydration)为(S)-3-羟基-3-甲基戊二酰辅酶A。已在恶臭假单胞菌中表征该细菌酶。其与哺乳动物酶的不同之处在于，其活性位点只具有一个谷氨酰残基而不是两个，从而导致不同的反应机制。这些酶是巴豆酸酶(crotonase)超家族的成员(Wong BJ和Gerlt JA(2004)Evolutionof function in the crotonase superfamily：(3S)-methylglutaconyl-CoA hydratasefrom Pseudomonas putida.Biochemistry 43(16)：4646-4654)，并综述于(Hamed RB等人(2008)Mechanisms and structures of crotonase superfamily enzymes--how naturecontrols enolate and oxyanion reactivity.Cell Mol Life Sci 65(16)：2507-2527)中。

在大肠杆菌中表达、纯化和表征了该重组酶。通过ESI-MS确定10-His标记多肽的表观分子量为32.251kDa。随后在对酶进行表征之前去除10-His标签(Wong和Gerlt，2004)。

在一个实施方案中，甲基戊烯二酰辅酶A水合酶由获自假单胞菌属物种的一种或多种核酸分子编码。在另一个实施方案中，甲基戊烯二酰辅酶A水合酶由获自恶臭假单胞菌的一种或多种核酸分子编码。在一些实施方案中，编码甲基戊烯二酰辅酶A水合酶的一种或多种核酸分子是liuC，或其同源物。在一个进一步的实施方案中，编码甲基戊烯二酰辅酶A水合酶的一种或多种核酸分子包含SEQ ID NO：125中列出的氨基酸序列。在又一个实施方案中，编码甲基戊烯二酰辅酶A水合酶的一种或多种核酸分子由SEQ ID NO：124中列出的核酸序列编码。

甲基巴豆酰辅酶A羧化酶(EC 6.4.1.4)

本公开描述了可以催化以下反应的酶：

该酶活性与3-甲基巴豆酰辅酶A羧化酶复合物有关。该酶是含有生物素的生物素依赖性羧化酶，其参与铜绿假单胞菌(Pseudomonas aeruginosa)PAO1的L-亮氨酸(和异戊酸)降解途径。该途径也是无环萜烯利用途径(香茅醇降解和顺式-香叶辅酶A降解途径)的最后阶段。该酶不在以香茅醇或香茅酸生长的细胞中表达，但在以异戊酸生长的细胞中表达。基因liuB和liuD编码3-甲基巴豆酰辅酶A羧化酶的两个亚基。这些亚基编码于该生物体的liuRABCDE基因簇中(Hoschle B等人(2005)Methylcrotonyl-CoA and geranyl-CoAcarboxylases are involved in leucine/isovalerate utilization(Liu)and acyclicterpene utilization(Atu)，and are encoded by liuB/liuD and atuC/atuF,inPseudomonas aeruginosa.Microbiology 151(Pt11)：3649-3656；Forster-Fromme K和Jendrossek D(2010).Catabolism of citronellol and related acyclic terpenoidsin pseudomonads.Appl Microbiol Biotechnol 87(3)：859-869)。

通过亲和素亲和层析从细胞提取物中纯化该酶，并对SDS凝胶分离的亚基进行胰蛋白酶指纹分析和ESI-MS，使得可以鉴定其相应的基因(Hoschle等人，2005)。

更早的工作中表征了香茅醇假单胞菌(Pseudomonas citronellolis)的3-甲基巴豆酰辅酶A羧化酶(Hector ML和Fall RR(1976)Multiple acyl-coenzyme A carboxylasesin Pseudomonas citronellolis.Biochemistry 15(16)：3465-3472；Fall RR和Hector ML(1977)Acyl-coenzyme A carboxylases.Homologous 3-methylcrotonyl-CoA andgeranyl-CoA carboxylases from Pseudomonas citronellolis.Biochemistry 16(18)：4000-4005；Fall RR(1981)3-Methylcrotonyl-CoA and geranyl-CoA carboxylases fromPseudomonas citronellolis.Methods Enzymol 71 Pt C：791-799)。

在一个实施方案中，甲基巴豆酰辅酶A羧化酶由获自假单胞菌属物种的一种或多种核酸分子编码。在另一个实施方案中，甲基巴豆酰辅酶A羧化酶由获自铜绿假单胞菌的一种或多种核酸分子编码。在一些实施方案中，编码甲基巴豆酰辅酶A羧化酶的一种或多种核酸分子选自liuB和/或liuD，或其同源物。在一个进一步的实施方案中，编码甲基巴豆酰辅酶A羧化酶的一种或多种核酸分子包含选自SEQ ID NO：127和129的氨基酸序列。在又一个实施方案中，编码甲基巴豆酰辅酶A羧化酶的一种或多种核酸分子由SEQ ID NO：126和128的核酸序列编码。

甲基巴豆酰辅酶A水合酶(EC 4.2.1.17)

本公开描述了可以催化以下反应的酶：

示例性酶是3-酮酰辅酶A硫解酶。其通过β-氧化循环参与脂肪酸的降解。其对底物具有广泛的链长特异性，尽管其对中链底物表现出最高的活性。其是多酶复合物的一部分，由fadA基因编码(Yang SY等人(1990)Nucleotide sequence of the fadA gene.Primarystructure of 3-ketoacyl-coenzyme A thiolase from Escherichia coli and thestructural organization of the fadAB operon.J Biol Chem 265(18)：10424-10429)。

3-酮酰辅酶A硫解酶也可以称为乙酰辅酶A C-酰基转移酶、β-酮硫解酶、乙酰辅酶A酰基转移酶和酰基辅酶A：乙酰辅酶A C-酰基转移酶。

另一种示例性酶是烯酰辅酶A水合酶。α亚基有四种与之相关的酶活性。其是多酶复合物的一部分。其中两种活性，烯酰辅酶A水合酶(EC 4.2.1.17)和3-OH酰基辅酶A差向异构酶(EC 5.1.2.3)由相同的N末端活性位点进行(Yang SY和Elzinga M(1993)Associationof both enoyl coenzyme A hydratase and 3-hydroxyacyl coenzyme A epimerasewith an active site in the amino-terminal domain of the multifunctional fattyacid oxidation protein from Escherichia coli.J Biol Chem 268(9)：6588-6592)。

在一个实施方案中，甲基巴豆酰辅酶A水合酶是3-酮酰辅酶A硫解酶。在另一个实施方案中，甲基巴豆酰辅酶A水合酶由获自大肠杆菌的一种或多种核酸分子编码。在一些实施方案中，编码甲基巴豆酰辅酶A水合酶的一种或多种核酸分子是fadA，或其同源物。在一个进一步的实施方案中，编码甲基巴豆酰辅酶A水合酶的一种或多种核酸分子包含SEQ IDNO：131中列出的氨基酸序列。在又一个实施方案中，编码甲基巴豆酰辅酶A水合酶的一种或多种核酸分子由SEQ ID NO：130中列出的核酸序列编码。

在一个实施方案中，甲基巴豆酰辅酶A水合酶是烯酰辅酶A水合酶。在另一个实施方案中，甲基巴豆酰辅酶A水合酶由获自大肠杆菌的一种或多种核酸分子编码。在一些实施方案中，编码甲基巴豆酰辅酶A水合酶的一种或多种核酸分子是fadB，或其同源物。在一个进一步的实施方案中，编码甲基巴豆酰辅酶A水合酶的一种或多种核酸分子包含SEQ IDNO：133中列出的氨基酸序列。在又一个实施方案中，编码甲基巴豆酰辅酶A水合酶的一种或多种核酸分子由SEQ ID NO：132中列出的核酸序列编码。

3-羟基-异戊酰辅酶A硫酯酶(EC 3.1.2.-)

本公开描述了可以催化以下反应的酶：

酰基辅酶A+H₂O→羧酸+辅酶A+H⁺

示例性的酰基辅酶A硫酯酶是TesB。硫酯酶II(TesB)是大肠杆菌中存在的多种硫酯酶之一。该酶具有相对广泛的底物特异性，其裂解中链和长链酰基辅酶A底物；测试的最好底物是3,5-十四二烯酰辅酶A(Nie L等人(2008)A novel paradigm of fatty acidbeta-oxidation exemplified by the thioesterase-dependent partial degradationof conjugated linoleic acid that fully supports growth of Escherichiacoli.Biochemistry 47(36)：9618-9626)。硫酯酶II是支持以油酸或共轭亚油酸为唯一碳源生长的硫酯酶之一(Nie等人，2008)。

已以

的分辨率解析了该酶的晶体结构。预测D204残基位于活性位点中；突变体的动力学分析证实了其重要性(Li J等人(2000)Crystal structure of theEscherichia coli thioesterase II,a homolog of the human Nef bindingenzyme.Nat Struct Biol 7(7)：555-559)。

缺乏或过度生产tesB的株不具有明显的缺陷(Narasimhan ML等人(1986)Geneticand biochemical characterization of an Escherichia coli K-12mutant deficientin acyl-coenzyme A thioesterase II.J Bacteriol 165(3)：911-917；Naggert J等人(1991)Cloning,sequencing,and characterization of Escherichia colithioesterase II.J Biol Chem 266(17)：11044-11050)。TesB的过量生产减轻了在甘油饥饿时积累的长链酰基-ACP分子对脂肪酸合成的抑制(Jiang P和Cronan JE(1994)Inhibition of fatty acid synthesis in Escherichia coli in the absence ofphospholipid synthesis and release of inhibition by thioesterase action.JBacteriol 176(10)：2814-2821)。

在一个实施方案中，3-羟基-异戊酰辅酶A硫酯酶由获自大肠杆菌的一种或多种核酸分子编码。在一些实施方案中，编码3-羟基-异戊酰辅酶A硫酯酶的一种或多种核酸分子是tesB，或其同源物。在一个进一步的实施方案中，编码3-羟基-异戊酰辅酶A硫酯酶的一种或多种核酸分子包含SEQ ID NO：135中列出的氨基酸序列。在又一个实施方案中，编码3-羟基-异戊酰辅酶A硫酯酶的一种或多种核酸分子由SEQ ID NO：134中列出的核酸序列编码。

甲羟戊酸-3-激酶(EC 2.7.1.-)

本公开描述了可以催化以下反应的酶：

(R)-甲羟戊酸+ATP→(R)-甲羟戊酸3-磷酸+ADP+H+

甲羟戊酸-3-激酶也可以称为(R)-MVA 3-磷酸转移酶或3-羟基异戊酸(3HIV)激酶。

尚未报道来自嗜酸热原体(Thermoplasma acidophilum)的这种酶的亚基结构。

认为来自嗜热古菌嗜酸热原体的甲羟戊酸-3-激酶参与了古细菌中发现的甲羟戊酸途径的变体(Azami Y等人(2014)(R)-Mevalonate 3-Phosphate Is an Intermediateof the Mevalonate Pathway in Thermoplasma acidophilum.J Biol Chem 289(23)：15957-15967；Vinokur JM等人(2014)Evidence of a Novel Mevalonate Pathway inArchaea.Biochemistry 53(25)：4161-4168)。

在大肠杆菌中表达、纯化和表征了重组的His标记的酶。尽管其与二磷酸甲羟戊酸脱羧酶具有同源性，但其表现为无脱羧酶活性(Azami等人，2014；Vinokur等人，2014)。该酶显示出弱的磷酸甲羟戊酸激酶活性，生产少量的(R)-甲羟戊酸二磷酸(Azami等人，2014)。其不具有甲羟戊酸-5-激酶活性(Vinokur等人，2014)。

在一个实施方案中，3HIV激酶由一种或多种获自微生物的核酸分子编码，所述微生物选自热原体属物种(Thermoplasma sp.)和嗜酸古菌属物种(Picrophilus sp.)。在另一个实施方案中，3HIV激酶由一种或多种获自微生物的核酸分子编码，所述微生物选自嗜酸热原体和托氏嗜酸古菌(Picrophilus torridus)。在一些实施方案中，编码3HIV激酶的一种或多种核酸分子是TA1305和/或PTO1356，或其同源物。在一些实施方案中，TA1305包含L200E突变。在一个进一步的实施方案中，编码3HIV激酶的一种或多种核酸分子包含选自SEQ ID NO：113、115和117的氨基酸序列。在又一个实施方案中，编码3HIV激酶的一种或多种核酸分子由选自SEQ ID NO：112、114和116的核酸序列编码。

甲羟戊酸二磷酸脱羧酶(EC 4.1.1.-)

本公开描述了可以催化以下反应的酶：

(R)-甲羟戊酸二磷酸+ATP→异戊烯二磷酸+CO₂+ADP+磷酸

3-膦氧基异戊酸→CO₂+异丁烯

3-羟基异戊酸→CO₂+异丁烯

甲羟戊酸二磷酸脱羧酶也可以称为焦磷酸甲羟戊酸脱羧酶(pyrophosphomevalonate decarboxylase)、甲羟戊酸-5-焦磷酸脱羧酶、焦磷酸甲羟戊酸脱羧酶(pyrophosphomevalonic acid decarboxylase)、5-焦磷酸甲羟戊酸脱羧酶、甲羟戊酸5-二磷酸脱羧酶和ATP：(R)-5-二磷酸甲羟戊酸羧基裂解酶(脱水)、3-膦氧基异戊酸脱羧酶、3-羟基异戊酸-3-磷酸脱羧酶、3HIV-3-磷酸脱羧酶、3-羟基异戊酸脱羧酶和3HIV脱羧酶。

该酶通过ATP依赖性脱羧作用将甲羟戊酸5-二磷酸(MVAPP)转化为异戊烯二磷酸(IPP)。该酶的两种底物是ATP和甲羟戊酸5-二磷酸，而其四种产物是ADP、磷酸、异戊烯二磷酸和CO₂。

甲羟戊酸二磷酸脱羧酶催化甲羟戊酸途径的最后一步。甲羟戊酸途径负责由乙酸生物合成类异戊二烯。该途径通过合成甾醇类异戊二烯(如胆固醇)和非甾醇类异戊二烯(如多萜醇、血红素A、tRNA异戊烯基转移酶和泛醌)，在多个细胞过程中发挥关键作用。该酶属于裂解酶家族，具体为羧基裂解酶，其裂解碳-碳键。

甲羟戊酸二磷酸脱羧酶识别并结合两种底物：ATP和甲羟戊酸5-二磷酸。结合后，该酶进行三类反应，其可以分为两个主要阶段。首先，发生磷酸化。这产生了一种反应性中间体，其在第二阶段进行协同脱磷酸和脱羧。

在一个实施方案中，催化3-膦氧基异戊酸→CO₂+异丁烯反应的酶是3HIV-3-磷酸脱羧酶。在另一个实施方案中，3HIV-3-磷酸脱羧酶由获自链球菌属物种的一种或多种核酸分子编码。在一些实施方案中，所述微生物选自缓症链球菌(Streptococcus mitis)和/或戈登氏链球菌(Streptococcus gordonii)。在一些实施方案中，编码3HIV-3-磷酸脱羧酶的一种或多种核酸分子包含选自SEQ ID NO：119和121的氨基酸序列。在一个进一步的实施方案中，编码3HIV-3-磷酸脱羧酶的一种或多种核酸分子由选自SEQ ID NO：118和120的核酸序列编码。

在一个实施方案中，催化反应3-羟基异戊酸→CO₂+异丁烯的酶是3HIV脱羧酶。在另一个实施方案中，3HIV脱羧酶由一种或多种获自微生物的核酸分子编码，所述微生物选自链球菌属物种、热原体属物种和嗜酸古菌属物种。在另一个实施方案中，3HIV脱羧酶由一种或多种获自微生物的核酸分子编码，所述微生物选自戈登氏链球菌、嗜酸热原体和托氏嗜酸古菌。在一些实施方案中，编码3HIV脱羧酶的一种或多种核酸分子包括mvaD、TA1305和/或PTO1356，或其同源物。在一个进一步的实施方案中，编码3HIV脱羧酶的一种或多种核酸分子包含选自SEQ ID NO：113、117和121的氨基酸序列。在又一个实施方案中，编码3HIV脱羧酶的一种或多种核酸分子由选自SEQ ID NO：112、116和120的核酸序列编码。

转酮醇酶(EC 2.2.1.1)

本公开描述了可以催化以下反应的酶：

转酮醇酶催化酮醇基团在几个供体和受体底物之间的可逆转移。该关键酶是糖酵解和磷酸戊糖途径之间的可逆联系。该酶参与戊糖的分解代谢、D-核糖5-磷酸的形成以及D-赤藓糖4-磷酸(芳香族氨基酸和PLP的前体)的提供。大肠杆菌含有TktA和TktB两种转酮醇酶同工酶。TktA负责主要的转酮醇酶活性。

除了其在中心碳代谢中的功能之外，转酮醇酶在染色体结构中也表现出具有意想不到的作用；tktA突变体影响染色体拓扑。

已解析了与供体和受体底物复合的TktA的晶体结构，阐明了转酮醇酶的反应机制和作用方式。已提出了使用量子力学/分子力学方法的转酮醇酶活性计算模型，定义了硫胺素二磷酸活化的新途径。转酮醇酶I(TktA)是同源二聚体。已研究了TktA野生型和活性位点突变体的尿素变性途径，并确定了温度和pH对转酮醇酶的结构、稳定性、聚集和活性的影响。已研究了TktA的受体特异性。

TktA的丰度受SOS诱导剂和诱变剂7-甲氧基-2-硝基萘[2,1-b]呋喃(R7000)的影响。tktA在进入稳定期期间受到负调节。RpoS的影响可能是间接的，并且可能由其本身受RpoS直接调节的中间调节因子介导。

尚未明确确定转酮醇酶II(TktB)的亚基结构。TktB的过度生产抑制tktA突变表型。在苯丙氨酸存在下，tyrR突变体中tktB的表达增加。tktB表达在稳定期增加，并受RpoS和ppGpp的正调控。在有氧而不是厌氧生长条件下，渗透应激期间TktB蛋白的水平增加。TktB表现出与降解体有关，并可能将碳代谢与复制联系起来。

tktA和tktB的表达是互补的，导致在整个生长过程中转酮醇酶表达水平大致恒定。

在一些实施方案中，转酮醇酶由与来自大肠杆菌的tktA具有至少70％序列同一性的氨基酸序列编码。在一个进一步的实施方案中，转酮醇酶由与来自大肠杆菌的tktA具有至少80％序列同一性的氨基酸序列编码。在一个仍进一步的实施方案中，转酮醇酶由与来自大肠杆菌的tktA具有至少90％序列同一性的氨基酸序列编码。在其他实施方案中，转酮醇酶是来自大肠杆菌的tktA。在一些实施方案中，转酮醇酶由与来自大肠杆菌的tktB具有至少70％序列同一性的氨基酸序列编码。在一个进一步的实施方案中，转酮醇酶由与来自大肠杆菌的tktB具有至少80％序列同一性的氨基酸序列编码。在一个仍进一步的实施方案中，转酮醇酶由与来自大肠杆菌的tktB具有至少90％序列同一性的氨基酸序列编码。在其他实施方案中，转酮醇酶是来自大肠杆菌的tktB。

在一些实施方案中，编码转酮醇酶的一种或多种核酸分子是tktA，或其同源物。在一些实施方案中，编码转酮醇酶的一种或多种核酸分子是tktB，或其同源物。在另一个实施方案中，编码转酮醇酶的一种或多种核酸分子包含选自SEQ ID NO：148和150的氨基酸序列。在一个进一步的实施方案中，编码转酮醇酶的一种或多种核酸分子由选自SEQ ID NO：147和149的核酸序列编码。

转醛醇酶(EC 2.2.1.2)

本公开描述了可以催化以下反应的酶：

转醛醇酶也可以称为二羟基丙酮转移酶；二羟基丙酮合酶；甲醛转酮醇酶。

转醛醇酶B是磷酸戊糖途径非氧化分支的酶。转醛醇酶与转酮醇酶一起，在磷酸戊糖途径和糖酵解之间建立可逆的联系。其催化甘油醛-3-磷酸和景天庚酮糖-7-磷酸互变为果糖-6-磷酸和赤藓糖-4-磷酸。已在实验和理论上解决了该反应的可逆性和通过磷酸戊糖途径的碳流。

大肠杆菌中有两种密切相关的转醛醇酶，由talA和talB编码。只有转醛醇酶B已被生物化学表征。TalB在溶液和晶体结构中是二聚体。R300残基的突变导致催化活性单体的形成。通过定点诱变鉴定了对催化重要的活性位点残基。

已确定了转醛醇酶B的晶体结构，证实了在活性位点存在席夫碱中间体，并导致了建议的反应机制。

talB无效突变体在以葡萄糖为碳源的基本介质上不具有生长缺陷。

在一些实施方案中，转醛醇酶由与来自大肠杆菌的talA或talB具有至少70％序列同一性的氨基酸序列编码。在一个进一步的实施方案中，转醛醇酶由与来自大肠杆菌的talA或talB具有至少80％序列同一性的氨基酸序列编码。在一个仍进一步的实施方案中，转醛醇酶由与来自大肠杆菌的talA或talB具有至少90％序列同一性的氨基酸序列编码。在其他实施方案中，转醛醇酶是来自大肠杆菌的talA。在仍进一步的实施方案中，转醛醇酶是来自大肠杆菌的talB。

在一些实施方案中，编码转醛醇酶的一种或多种核酸分子是talA，或其同源物。在一些实施方案中，编码转醛醇酶的一种或多种核酸分子是talB，或其同源物。在另一个实施方案中，编码转醛醇酶的一种或多种核酸分子包含选自SEQ ID NO：152和154的氨基酸序列。在一个进一步的实施方案中，编码转醛醇酶的一种或多种核酸分子由选自SEQ ID NO：151和153的核酸序列编码。

核糖-5-磷酸异构酶(EC 5.3.1.6)

本公开描述了可以催化以下反应的酶：

核糖-5-磷酸异构酶也可以称为磷酸戊糖异构酶；磷酸核糖异构酶；核糖磷酸异构酶；5-磷酸核糖异构酶；D-核糖5-磷酸异构酶；D-核糖-5-磷酸酮醇异构酶。

在大肠杆菌中存在两种物理上和遗传上不同的核糖-5-磷酸异构酶。组成型核糖-5-磷酸异构酶A(rpiA)通常占细胞中99％以上的核糖-5-磷酸异构酶活性，并在磷酸戊糖途径(非氧化分支)中发挥作用。如果其表达被诱导，诱导型核糖-5-磷酸异构酶B(rpiB)可以替代rpiA的功能。两种酶之间没有序列相似性。

已解析了rpiA的晶体结构，并预测了活性位点残基和酸碱催化机制。rpiA突变体需要核糖以生长。

在一些实施方案中，核糖-5-磷酸异构酶由与来自大肠杆菌的rpiA或rpiB具有至少70％序列同一性的氨基酸序列编码。在一个进一步的实施方案中，核糖-5-磷酸异构酶由与来自大肠杆菌的rpiA或rpiB具有至少80％序列同一性的氨基酸序列编码。在一个仍进一步的实施方案中，核糖-5-磷酸异构酶由与来自大肠杆菌的rpiA或rpiB具有至少90％序列同一性的氨基酸序列编码。在其他实施方案中，核糖-5-磷酸异构酶是来自大肠杆菌的rpiA或rpiB。

在一些实施方案中，编码核糖-5-磷酸异构酶的一种或多种核酸分子是rpiA，或其同源物。在另一个实施方案中，编码核糖-5-磷酸异构酶的一种或多种核酸分子包含SEQ IDNO：156中列出的氨基酸序列。在一个进一步的实施方案中，编码核糖-5-磷酸异构酶的一种或多种核酸分子由SEQ ID NO：155中列出的核酸序列编码。在一些实施方案中，编码核糖-5-磷酸异构酶的一种或多种核酸分子是rpiB，或其同源物。在另一个实施方案中，编码核糖-5-磷酸的一种或多种核酸分子包含SEQ ID NO：253中列出的氨基酸序列。在一个进一步的实施方案中，编码核糖-5-磷酸异构酶的一种或多种核酸分子由SEQ ID NO：254中列出的核酸序列编码。

核酮糖-5-磷酸3-差向异构酶(EC 5.1.3.1)

本公开描述了可以催化以下反应的酶：

核酮糖-5-磷酸3-差向异构酶也可以称为核酮糖-磷酸3-差向异构酶；磷酸核酮糖差向异构酶；赤藓糖-4-磷酸异构酶；磷酸酮戊糖3-差向异构酶；木酮糖磷酸3-差向异构酶；磷酸酮戊糖差向异构酶；D-核酮糖磷酸-3-差向异构酶；D-核酮糖5-磷酸差向异构酶；D-核酮糖-5-P 3-差向异构酶；D-木酮糖-5-磷酸3-差向异构酶；戊糖-5-磷酸3-差向异构酶。

核酮糖-5-磷酸3-差向异构酶(Rpe)是磷酸戊糖途径非氧化分支的酶。

Rpe的活性需要亚铁，并且由于芬顿化学(Fenton chemistry)而容易受到H₂O₂的攻击而损坏。Mn²⁺、Co²⁺和Zn²⁺可以不同程度地取代Fe²⁺，并且含有这些替代阳离子的Rpe不易受到H₂O₂的攻击。诱导锰转运蛋白可以保护Rpe免受H₂O₂的损害。

在一些实施方案中，核酮糖-5-磷酸3-差向异构酶由与来自大肠杆菌的rpe具有至少70％序列同一性的氨基酸序列编码。在一个进一步的实施方案中，核酮糖-5-磷酸3-差向异构酶由与来自大肠杆菌的rpe具有至少80％序列同一性的氨基酸序列编码。在一个仍进一步的实施方案中，核酮糖-5-磷酸3-差向异构酶由与来自大肠杆菌的rpe具有至少90％序列同一性的氨基酸序列编码。在其他实施方案中，核酮糖-5-磷酸3-差向异构酶是来自大肠杆菌的rpe。

在一些实施方案中，编码核酮糖-5-磷酸3-差向异构酶的一种或多种核酸分子是rpe，或其同源物。在另一个实施方案中，编码核酮糖-5-磷酸3-差向异构酶的一种或多种核酸分子包含SEQ ID NO：158中列出的氨基酸序列。在一个进一步的实施方案中，编码核酮糖-5-磷酸3-差向异构酶的一种或多种核酸分子由SEQ ID NO：157中列出的核酸序列编码。

果糖6-磷酸磷酸酮醇酶(Fpk，EC 4.1.2.22)

本公开描述了可以催化以下反应的酶：

β-D-呋喃果糖6-磷酸转化为D-赤藓糖4-磷酸和乙酰磷酸的磷酸酮醇酶反应是双歧杆菌(Bifidobacterium)旁路中的关键反应之一。有证据表明双歧杆菌中存在两种不同的F6P-磷酸酮醇酶。一种仅对F6P具有特异性，而另一种能够利用F6P和D-木酮糖5-磷酸(EC：4.1.2.9)，该反应在双歧杆菌旁路中随后出现。由xfp基因编码的酶最初发现于动物双歧杆菌乳酸亚种(Bifidobacterium animalis lactis)中，其是双特异性酶。也从肠系膜明串珠菌(Leuconostoc mesenteroides)(LEUM_1961)中纯化了磷酸酮醇酶。

在一些实施方案中，具有果糖-6-磷酸磷酸酮醇酶活性的酶由与选自以下的具有果糖-6-磷酸磷酸酮醇酶活性的酶具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码：齿双歧杆菌(Bifidobacterium dentium)BDP_1006、乳双歧杆菌(Bifidobacterium lactis)xfp、类植物乳杆菌(Lactobacillus paraplantarum)xpkA和短双歧杆菌(Bifidobacterium breve)xfp。在一个优选的实施方案中，具有果糖-6-磷酸磷酸酮醇酶活性的酶选自齿双歧杆菌BDP_1006、乳双歧杆菌xfp、类植物乳杆菌xpkA和短双歧杆菌xfp。在另一个实施方案中，编码所述果糖-6-磷酸磷酸酮醇酶的一种或多种核酸分子包含选自SEQ ID NO：212、214、216和218的氨基酸序列。在一个进一步的实施方案中，编码所述果糖-6-磷酸磷酸酮醇酶的一种或多种核酸分子由选自SEQ ID NO：211、213、215和217的核酸序列编码。

磷酸乙酰转移酶(EC 2.3.1.8)

本公开描述了可以催化以下反应的酶：

磷酸乙酰转移酶(Pta)催化乙酰辅酶A和乙酰磷酸之间的可逆转化，这是乙酸代谢中的一个步骤。丙酮酸和磷酸烯醇丙酮酸都在乙酰磷酸合成方向上激活该酶，并在乙酰辅酶A合成方向上抑制该酶。从乙酰辅酶A I途径形成乙酸一直是代谢工程的目标，以减少流向乙酸的流并增加商业所需终产物的产量。还使用系统生物学方法(如代谢建模和流平衡分析)对其进行了研究。

Pta由三个结构域组成；磷酸乙酰转移酶活性只需要C-末端结构域。N-末端结构域参与天然四级结构的稳定和代谢调节。

Pta可能能够利用乙酰辅酶A和丙酰辅酶A。ack pta双突变体具有降低的来自L-苏氨酸的丙酸水平，表明该酶是将L-苏氨酸代谢为丙酸的厌氧途径的一部分。pta突变体不能以乙酸作为唯一的碳源生长。pta和pta ackA突变体在葡萄糖饥饿中存活的能力均受损。pta突变体的生长缺陷表现为由于乙酰辅酶A的流的扰动。pta突变体在微需氧条件下以葡萄糖作为碳源生长时生产大量乳酸。最近已彻底研究了pta突变对代谢、酶活性和基因表达的影响。pta和recBC突变体被合成地生长抑制。

以乙酸生长和低pH条件下生长降低Pta的水平。pta属于CreBC调节子。FNR对pta表达具有轻微的积极影响。测量了pta-ackA的生长速率依赖性表达模式。

已从丙酮丁醇梭菌中克隆编码该酶的pta基因，并在大肠杆菌中进行测序和表达。该基因与ackA基因相邻，ackA基因编码催化第二步的酶——乙酸激酶。对来自含有亚克隆的大肠杆菌和丙酮丁醇梭菌的细胞提取物进行的酶活性测定表明活性升高。当生物体达到溶剂形成阶段时，该酶表现出比活性的降低。

也已从以下之中鉴定或测量了具有磷酸乙酰转移酶活性或磷酸乙酰转移酶基因的酶：大肠杆菌(eutD、pta)、抑云玫瑰变色菌(Roseovarius nubinhibens)ISM、克氏梭菌(Clostridium kluyveri)、莱因衣藻(Chlamydomonas reinhardtii)(PAT2)、Dasytricharuminantium、Pelobacter acetylenicus、Gottschalkia acidurici、旧金山乳酸菌(Lactobacillus sanfranciscensis)、脱氮副球菌(Paracoccus denitrificans)NKNIS、氧化还原真杆菌(Eubacterium oxidoreducens)G41、肺炎支原体(Mycoplasma pneumoniae)M129、海栖热袍菌(Thermotoga maritima)、Moorella thermoacetica、Methanosarcinathermophile、丙酸梭菌(Clostridium propionicum)和具核梭杆菌(Fusobacteriumnucleatum)。

在一些实施方案中，具有磷酸乙酰转移酶活性的酶由与选自以下的具有磷酸乙酰转移酶活性的酶具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码：大肠杆菌pta和丙酮丁醇梭菌(Clostridium acetobutylicum)pta。在一个优选的实施方案中，具有磷酸乙酰转移酶活性的酶选自大肠杆菌pta和丙酮丁醇梭菌pta。在另一个实施方案中，编码磷酸乙酰转移酶的一种或多种核酸分子包含选自SEQ IDNO：220和222的氨基酸序列。在一个进一步的实施方案中，编码磷酸乙酰转移酶的一种或多种核酸分子由选自SEQ ID NO：219和221的核酸序列编码。

戊糖磷酸酶(EC 3.1.3.23和EC 3.1.3.1)

本公开描述了可以催化以下反应的酶：

D-戊糖5-磷酸+H₂O→D-戊糖+磷酸

D-核糖5-磷酸+H₂O→D-核糖+磷酸

D-木酮糖5-磷酸+H₂O→D-木酮糖+磷酸

D-核酮糖5-磷酸+H₂O→D-核酮糖+磷酸

糖磷酸+H₂O→糖+磷酸

大肠杆菌YbiV是一种糖磷酸酶，其属于II型卤酸脱卤酶(HAD)样水解酶家族。其显示出其优选底物之间的低水平区分。此外，YbiV使用单磷酸作为磷酸供体，表现出具有低水平的磷酸转移酶活性。也在纯化蛋白质的高通量筛选中发现了YbiV的磷酸酶活性。已解析了YbiV的晶体结构，并提出了催化机制。YbiV可能以同源二聚体的形式存在于溶液中。

大肠杆菌YidA是混杂的糖磷酸酶，属于卤酸脱卤酶(HAD)样水解酶超家族。其优选底物是赤藓糖-4-磷酸。YidA选择性水解α-D-葡萄糖-1-磷酸，而对β形式没有活性。该反应通过经典的磷酸单酯水解酶机制进行，该机制涉及P-O键的断裂，而不是C1-O键的断裂。最初在纯化蛋白质的高通量筛选中发现了YidA的磷酸酶活性。诱变YidA中预测的催化Asp残基，导致磷酸酶活性的丧失。YidA不催化磷酰基转移至糖受体。

大肠杆菌碱性磷酸酶(phoA)是周质同源二聚体酶，其催化很多种磷酸单酯的水解和转磷酸。该反应通过磷酸丝氨酰中间体进行，随后释放无机磷酸盐和醇。转磷酸反应导致磷酰基团转移至受体(如Tris或乙醇胺)的醇中。碱性磷酸酶是一种金属酶，每个单体结合两个锌原子和一个镁离子。碱性磷酸酶以三种主要形式存在，称为同工酶1、2和3，其相对比例取决于生长条件。通过NH₂-末端精氨酸残基的存在与否来区分同工酶：在同工酶1的两个亚基中均存在，在同工酶3的两个亚基中均不存在，在同工酶2中杂合。膜结合的蛋白水解酶Iap催化N-末端精氨酸的去除。前体多肽穿过内膜分泌至周质空间，同时去除信号序列。周质蛋白DsbA催化PhoA在体内的折叠，并且被认为是随着多肽从核糖体延伸而发生的。phoA是磷酸调节子的一部分；其表达受PhoB转录调节因子的正调控。

在一些实施方案中，戊糖磷酸酶是碱性磷酸酶。在一些优选的实施方案中，碱性磷酸酶可以进化为优选作用于靶向的戊糖5-磷酸。在一些实施方案中，戊糖磷酸酶是糖磷酸酶。在其他实施方案中，糖磷酸酶可以进化为优选作用于靶向的戊糖5-磷酸。在一些实施方案中，戊糖磷酸酶是卤酸脱卤酶样水解酶。在另一个实施方案中，卤酸脱卤酶样水解酶可以进化为优选作用于靶向的戊糖5-磷酸。

在一些实施方案中，戊糖磷酸酶选自以下的一种或多种：D-戊糖-5-磷酸酶、D-木酮糖-5-磷酸酶、D-核糖-5-磷酸酶和D-核酮糖-5-磷酸酶。在一些实施方案中，戊糖磷酸酶由与选自以下的D-戊糖-5-磷酸酶具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码：大肠杆菌phoA、大肠杆菌yfbT和大肠杆菌yidA。在一些实施方案中，D-木酮糖-5-磷酸酶由与枯草芽孢杆菌(Bacillus subtilis)araL具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码。在一些实施方案中，D-核糖-5-磷酸酶由与选自以下的D-核糖-5-磷酸酶具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码：拟南芥(Arabidopsisthaliana)SGPP、荧光假单胞菌(Pseudomonas fluorescens)PFLU_2693和大肠杆菌ybiV。在一些实施方案中，D-核酮糖-5-磷酸异构酶由与恶性疟原虫(Plasmodium falciparum)PF10_0325具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码。

在一些实施方案中，编码D-戊糖-5-磷酸酶的一种或多种核酸分子选自SEQ IDNO：159、161、163、165、167、169、171和173。在另一个实施方案中，编码D-戊糖-5-磷酸酶的一种或多种核酸分子包含选自SEQ ID NO：160、162、164、166、168、170、172和174的氨基酸序列。

阿糖醇磷酸脱氢酶(EC 1.1.1.-)

本公开描述了可以催化以下反应的酶：

已将来自鸟肠球菌(Enterococcus avium)的D-阿糖醇磷酸脱氢酶APDH纯化至均质。该蛋白质形成同源四聚体，催化D-阿糖醇1-磷酸和D-阿糖醇5-磷酸的脱氢，分别生产D-木酮糖5-磷酸和D-核酮糖5-磷酸。与D-阿糖醇1-磷酸的最大速度是与D-阿糖醇5-磷酸的10倍。对纯化的蛋白质进行了部分测序，并克隆了编码其的APDH基因。该酶需要Mn²⁺，并且为了活性不能利用Zn²⁺。接受NAD(+)和NADP(+)两者为辅因子，但与NAD+/NADH的反应速率比与NADP+/NADPH高约14倍。该酶催化可逆反应，但还原反应的速率远高于氧化反应。动力学数据表明该酶与其底物和NADH形成三元复合物。生化证据和蛋白质序列同源性比较表明，相似的酶在革兰氏阳性菌中广泛存在并参与阿糖醇分解代谢。

在一些实施方案中，戊醇脱氢酶活性可以进化为适用于戊醇磷酸。

在一些实施方案中，阿糖醇磷酸脱氢酶选自以下一种或多种：具有D-阿糖醇1-磷酸4-脱氢酶活性的酶、具有D-阿糖醇5-磷酸2-脱氢酶活性的酶、具有D-阿糖醇1-磷酸2-脱氢酶活性的酶和具有D-阿糖醇5-磷酸4-脱氢酶活性的酶。

在一些实施方案中，具有D-阿糖醇1-磷酸4-脱氢酶活性的酶由与来自鸟肠球菌(Enterococcus avium)的APDH具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码。在一个优选的实施方案中，具有D-阿糖醇1-磷酸4-脱氢酶活性的酶是来自鸟肠球菌的APDH。在一些实施方案中，编码D-阿糖醇1-磷酸4-脱氢酶的一种或多种核酸分子在SEQ ID NO：175中列出。在另一个实施方案中，编码D-阿糖醇1-磷酸4-脱氢酶的一种或多种核酸分子包含SEQ ID NO：176中列出的氨基酸序列。

在一些实施方案中，具有D-阿糖醇5-磷酸2-脱氢酶活性的酶由与来自鸟肠球菌(Enterococcus avium)的APDH具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码。在一个优选的实施方案中，具有D-阿糖醇5-磷酸2-脱氢酶活性的酶是来自鸟肠球菌的APDH。在一些实施方案中，编码D-阿糖醇5-磷酸2-脱氢酶的一种或多种核酸分子在SEQ ID NO：175中列出。在另一个实施方案中，编码D-阿糖醇5-磷酸2-脱氢酶的一种或多种核酸分子包含SEQ ID NO：176中列出的氨基酸序列。

在一些实施方案中，具有D-阿糖醇1-磷酸2-脱氢酶活性的酶由与选自以下的具有D-阿糖醇1-磷酸2-脱氢酶活性的酶具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码：白色念珠菌(Candida albicans)ARD1、热带念珠菌(Candida tropicalis)ARD1、Scheffersomyces stipitis ARDH、枯草芽孢杆菌egsA(araM)、敏捷气热菌egsA、大肠杆菌gpsA和酿酒酵母GPD1。在一些实施方案中，具有D-阿糖醇1-磷酸2-脱氢酶活性的酶选自白色念珠菌(Candida albicans)ARD1、热带念珠菌(Candida tropicalis)ARD1、Scheffersomyces stipitis ARDH、枯草芽孢杆菌egsA(araM)、敏捷气热菌egsA、大肠杆菌gpsA和酿酒酵母GPD1。在一些实施方案中，编码D-阿糖醇1-磷酸2-脱氢酶的一种或多种核酸分子选自SEQ ID NO：177、179、181、189、191、193和195。在另一个实施方案中，编码D-阿糖醇1-磷酸2-脱氢酶的一种或多种核酸分子包含选自SEQ ID NO：178、180、182、190、192、194和196的氨基酸序列。

在一些实施方案中，具有D-阿糖醇5-磷酸4-脱氢酶活性的酶由与选自以下的具有D-阿糖醇5-磷酸4-脱氢酶活性的酶具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码：荧光假单胞菌mtlD、肺炎克雷伯氏菌(Klebsiellapneumoniae)dalD、茄科雷尔氏菌(Ralstonia solanacearum)dalD、枯草芽孢杆菌egsA(araM)、敏捷气热菌egsA、大肠杆菌gpsA和酿酒酵母GPD1。在一个优选的实施方案中，具有D-阿糖醇5-磷酸4-脱氢酶活性的酶选自荧光假单胞菌mtlD、肺炎克雷伯氏菌(Klebsiellapneumoniae)dalD、茄科雷尔氏菌(Ralstonia solanacearum)dalD、枯草芽孢杆菌egsA(araM)、敏捷气热菌egsA、大肠杆菌gpsA和酿酒酵母GPD1。在一些实施方案中，编码D-阿糖醇5-磷酸4-脱氢酶的一种或多种核酸分子选自SEQ ID NO：183、185、187、189、191、193和195。在另一个实施方案中，编码D-阿糖醇5-磷酸4-脱氢酶的一种或多种核酸分子包含选自SEQ ID NO：184、186、188、190、192、194和196的氨基酸序列。

磷酸戊糖变位酶(EC 5.4.2.-)

本公开描述了可以催化以下反应的酶：

2-脱氧-α-D-核糖1-磷酸→2-脱氧-D-核糖5-磷酸

大肠杆菌磷酸戊糖变位酶deoB是分解代谢酶，其分别催化核糖和脱氧核糖的C1和C5碳原子之间的磷酸基团转移。

deoB中的突变抑制thy突变体生长对胸腺嘧啶的高需求，并提高thyA突变体在稳定期的存活率。deoB中的转座子插入突变抑制tktA tktB突变体的生长缺陷。与野生型相比，缺失deoB增加甘油消耗以及氢气和乙醇的产量，并增加工程化株中番茄红素的产量。deo操纵子具有复杂的调节模式。氮饥饿下调deoB的表达。大肠杆菌磷酸戊糖变位酶在生化和结构上表现为与哺乳动物磷酸戊糖变位酶不同，使其成为抗生素开发的潜在目标。

在一些实施方案中，磷酸戊糖变位酶(PPM)，在此也称为磷酸糖变位酶(PSM)，也具有磷酸葡萄糖变位酶活性，并且是酿酒酵母磷酸核糖变位酶PRM15(也称为PGM3)(SEQ IDNO：255或SEQ ID NO：258)。在一些实施方案中，磷酸戊糖变位酶由与来自酿酒酵母的Pgm3具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码。

在一些实施方案中，磷酸戊糖变位酶是人磷酸葡萄糖变位酶-2(PGM2)。

在一些实施方案中，磷酸戊糖变位酶活性可以进化为适用于D-木酮糖5-磷酸。在其他实施方案中，磷酸戊糖变位酶活性可以进化为适用于D-核酮糖5-磷酸。在一些实施方案中，α-磷酸葡萄糖变位酶活性可以进化为适用于D-核酮糖5-磷酸或D-木酮糖5-磷酸。据报道，来自EC 5.4.2.2类的该酶需要α-葡萄糖1,6-二磷酸作为辅因子。在进一步的实施方案中，β-磷酸葡萄糖变位酶活性可以进化为适用于D-核酮糖5-磷酸或D-木酮糖5-磷酸。据报道，来自EC 5.4.2.6类的酶能够自身磷酸化，因此不需要外部葡萄糖1,6-二磷酸作为辅因子。在仍进一步的实施方案中，磷酸甘露糖变位酶活性可以进化为适用于D-核酮糖5-磷酸或D-木酮糖5-磷酸。据报道，来自EC 5.4.2.8类的该酶需要α-葡萄糖1,6-二磷酸或α-D-甘露糖1,6-二磷酸作为辅因子。

在一些实施方案中，具有磷酸戊糖变位酶活性的酶由与选自以下的具有磷酸戊糖变位酶活性的酶具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码：大肠杆菌deoB、大肠杆菌pgm、枯草芽孢杆菌pgcA、乳酸乳球菌(Lactococcus lactis)pgmB、大肠杆菌ycjU、铜绿假单胞菌(Pseudomonas aeruginosa)algC和大肠杆菌cpsG。在一个优选的实施方案中，具有磷酸戊糖变位酶活性的酶选自大肠杆菌deoB、大肠杆菌pgm、枯草芽孢杆菌pgcA、乳酸乳球菌pgmB、大肠杆菌ycjU、铜绿假单胞菌algC、酿酒酵母PGM3和大肠杆菌cpsG。在一些实施方案中，编码磷酸戊糖变位酶的一种或多种核酸分子选自SEQ ID NO：197、199、201、203、205、207和209。在另一个实施方案中，编码磷酸戊糖变位酶的一种或多种核酸分子包含选自SEQ ID NO：198、200、202、204、206、208和210的氨基酸序列。

葡萄糖-6-磷酸1-脱氢酶(EC 1.1.1.49)

本公开描述了可以催化以下反应的酶：

葡萄糖-6-磷酸1-脱氢酶也可以称为葡萄糖-6-磷酸脱氢酶(NADP+)；NADP-葡萄糖-6-磷酸脱氢酶；中间发酵(Zwischenferment)；D-葡萄糖6-磷酸脱氢酶；葡萄糖6-磷酸脱氢酶(NADP)；NADP依赖性葡萄糖6-磷酸脱氢酶；6-磷酸葡萄糖脱氢酶；Entner-Doudoroff酶；G6PDH；GPD；葡萄糖-6-磷酸脱氢酶。

葡萄糖-6-磷酸脱氢酶(G6PDH)是磷酸戊糖途径的第一种酶，提供合成代谢所需的大部分NADPH。

大肠杆菌G6PDH显示出对NADP+的强烈偏好，而不是NAD+。使用分子模拟、定点突变体的动力学表征和系统发育分析，研究了这种偏好的结构基础。

使用GC-MS和¹³C标记和2D NMR光谱，测量了通过中心碳代谢途径的代谢流。在不同生长条件下，在酶表达和活性水平上测量了对这些途径的调节。

用生产NADH的葡萄糖-6-磷酸脱氢酶取代天然的生产NADPH的酶，降低了野生型细胞的生长速度，同时增加了Δpgi突变体的生长速度。这表明由G6PDH生产NADH在体内是有益还是有害取决于上游Embden-Meyerhof途径的运行。

除了在中心碳代谢中的作用之外，还发现G6PDH是具有氨基酸序列Asn-Asn-Trp-Asn-Asn(NNWNN)的线性肽的来源，其作为“细胞外死亡因子”(EDF)用于MazEF介导的细胞死亡。该肽通过增加毒素MazF和ChpBK的内切核糖核酸酶活性发挥作用。应激条件下的EDF产生是由于MazF在特定ACA位点切割zwf mRNA，生成无前导的截短的mRNA。EDF编码区相对于MazF切割位点的位置很重要，并且需要反式翻译系统(trans-translation system)。

zwf是最一致的流-耦合(flux-coupled)基因之一，这些基因在扰动时的表达转换模式与其相应的流量值相关。zwf的表达在转录水平上受生长速率调节。G6PDH活性在快速生长的细胞中更高，并且与碳限制生长条件相比，在氮限制条件下更高。zwf是响应超氧化物应激的SoxRS调节子的一部分。已证明其他调节因子可以激活zwf的转录。接触亚碲酸盐激活zwf的转录，从而增加NADPH的合成。

zwf无效突变不会显著影响生长速率。然而，中心碳代谢和代谢流发生了变化。pgizwf双突变体不能以葡萄糖作为唯一碳源生长。在葡萄糖存在下，其积累高水平的6-磷酸葡萄糖而抑制果糖-1,6-双磷酸酶I的活性。缺失zwf降低大肠杆菌JM109的有机溶剂耐受性。

在一些实施方案中，生产MEG(或乙醇酸)或任选MEG(或乙醇酸)和一种或多种联产品的重组微生物在编码葡萄糖-6-磷酸脱氢酶的基因中包含缺失、插入或功能缺失突变，以防止葡萄糖-6-磷酸通过磷酸戊糖途径的氧化分支的流，而是通过磷酸戊糖途径的非氧化分支分流葡萄糖-6-磷酸，以生产一种或多种戊糖-5-磷酸中间体。

6-磷酸葡萄糖酸内酯酶(EC 3.1.1.31)

本公开描述了可以催化以下反应的酶：

6-磷酸D-葡萄糖酸-1,5-内酯+H₂O→D-葡萄糖酸6-磷酸+H+

6-磷酸葡萄糖酸内酯酶也可以称为磷酸葡萄糖酸内酯酶；6-PGL。

6-磷酸葡萄糖酸内酯酶是氧化磷酸戊糖途径的酶。

pgl突变株以葡萄糖作为唯一碳源生长仅比野生型稍慢。以葡萄糖生长可能是由于6-磷酸D-葡萄糖酸-1,5-内酯的非酶水解或旁路途径，其涉及去磷酸化和葡萄糖酸内酯的输出，水解为葡萄糖酸，随后是葡萄糖酸的重新输入和磷酸化。当以麦芽糖介质生长时，缺乏Pgl活性的株在碘处理后变成蓝色。可以通过来自恶臭假单胞菌的pgl基因的表达来补偿pgl缺失株的表型，尽管这两个基因之间没有可检测到的相似性。

用于生产核黄素的大肠杆菌代谢工程策略包括过表达pgl，导致核黄素滴度增加。

pgl是在大肠杆菌B株BL21中缺失的基因组区域的一部分，但存在于K-12株MG1655中。

在一些实施方案中，生产MEG(或乙醇酸)或任选MEG(或乙醇酸)和一种或多种联产品的重组微生物在编码6-磷酸葡萄糖酸内酯酶的基因中包含缺失、插入或功能缺失突变，以防止葡萄糖-6-磷酸通过磷酸戊糖途径的氧化分支的流，而是通过磷酸戊糖途径的非氧化分支分流葡萄糖-6-磷酸，以生产一种或多种戊糖-5-磷酸中间体。

6-磷酸葡萄糖酸脱氢酶，脱羧(EC 1.1.1.44)

本公开描述了可以催化以下反应的酶：

D-葡萄糖酸6-磷酸+NADP+→D-核酮糖5-磷酸+CO₂+NADPH

6-磷酸葡萄糖酸脱氢酶(6-phosphogluconate dehydrogenase)也可以称为磷酸葡萄糖酸脱氢酶(NADP+依赖性，脱羧)；磷酸葡萄糖酸脱氢酶；6-磷酸葡萄糖酸脱氢酶(6-phosphogluconic dehydrogenase)；6-磷酸葡萄糖酸羧化酶；6-磷酸-D-葡萄糖酸脱氢酶；甘油醛3-磷酸脱氢酶。

6-磷酸葡萄糖酸脱氢酶是磷酸戊糖途径氧化分支的酶。

已解析了该酶与底物和共底物化合物复合的三种晶体结构。结合NADP+可以诱导该酶的构象变化。已经提出了催化机制。

gnd是大肠杆菌种群中高度多态性的基因，可能是由于株间转移和重组所致。这可能是因为其靠近决定O抗原结构的rfb区。

6-磷酸葡萄糖酸脱氢酶的表达受生长速率调节。大部分生长速率依赖性的Gnd水平增加是由于转录增加，导致更高的mRNA水平。转录后调控涉及gnd mRNA密码子67和78之间的二级结构元件。该区可能通过将翻译起始区隔离到mRNA二级结构中而发挥作用，从而降低翻译起始的效率。然而，显然尚未确定这种调节机制的效应子。truA(hisT)突变体通过转录后调控降低生长速率依赖性的Gnd表达增加。在酸性条件下生长上调gnd的表达。gnd是最一致的流-耦合基因(FCG)之一，这些基因在扰动时的表达转换模式与其相应的流量值相关。

为启动子区域中的缺失突变选择的某些生长条件导致gnd转录增加和酶活性增加。edd gnd双突变体不能以葡萄糖酸生长。gnd中的无效突变不会显著改变生长速率。然而，细胞代谢和代谢流发生了变化；以葡萄糖或甘油生长的过程中琥珀酸产量增加。与野生型相比，gnd缺失突变体在以甘油厌氧生长期间表现出增强的乙醇和H₂产量，而在不同的高度工程化的株中，过表达gnd增加乙醇和H₂的产量。

在一些实施方案中，生产MEG(或乙醇酸)或任选MEG(或乙醇酸)和一种或多种联产品的重组微生物在编码6-磷酸葡萄糖酸脱氢酶的基因中包含缺失、插入或功能缺失突变，以防止葡萄糖-6-磷酸通过磷酸戊糖途径的氧化分支的流，而是通过磷酸戊糖途径的非氧化分支分流葡萄糖-6-磷酸，以生产一种或多种戊糖-5-磷酸中间体。

甘油醛3-磷酸脱氢酶，磷酸化(EC 1.2.1.12)

本公开描述了可以催化以下反应的酶：

甘油醛3-磷酸脱氢酶也可以称为甘油醛-3-磷酸脱氢酶(磷酸化)；磷酸丙糖脱氢酶；脱氢酶，磷酸甘油醛；磷酸甘油醛脱氢酶；3-磷酸甘油醛脱氢酶；NAD+依赖性甘油醛磷酸脱氢酶；甘油醛磷酸脱氢酶(NAD+)；甘油醛-3-磷酸脱氢酶(NAD+)；NADH-甘油醛磷酸脱氢酶；甘油醛-3-P-脱氢酶。

在大肠杆菌糖酵解和糖异生过程中，在NAD+和磷酸存在下，甘油醛3-磷酸脱氢酶A催化D-甘油醛-3-磷酸可逆氧化磷酸化为1,3-双磷酸-D-甘油酸。该酶还存在于许多其他生物体中，其特性已得到广泛研究。

大肠杆菌不寻常地具有由gapA和epd(gapB)编码的两种甘油醛-3-磷酸脱氢酶(GAPDH)活性。然而，gapA编码的酶具有高效的磷酸化的甘油醛-3-磷酸脱氢酶活性和低的磷酸化的赤藓糖4-磷酸脱氢酶活性，而epd编码的酶具有有效的非磷酸化的赤藓糖-4-磷酸脱氢酶活性和非常低的磷酸化的甘油醛-3-磷酸脱氢酶活性。

GapA蛋白具有的序列与真核序列的相似度高于与嗜热细菌酶的相似度，并且通常高于与原核酶的相似度。糖酵解需要gapA产物，而不需要epd产物。这两种酶都可以参与吡哆醛5'-磷酸(PLP)的生产。

对来自大肠杆菌K-10的gapA突变体的早期研究表明了其在糖酵解中的作用并证明了其一些催化特性。gapA突变体表现出生长缺陷，并且还表现出增加的聚集和裂解表型，这些表型可被高盐介质挽救。

已研究了gapA基因表达的调节。fkpA、gapA和hslT基因的调节受慢性热应激条件下进化的影响。

大肠杆菌序列含有几个在所有GAPDH中都保守且假定参与NAD+结合或催化机制的氨基酸。

已以

的分辨率确定了在NAD+存在下野生型酶的晶体结构，其与其他GAPDH的晶体结构相似。已以

的分辨率确定了N313T突变体的晶体结构。已报道了其他几种有和没有结合的NAD+，以及处于半缩醛中间状态的大肠杆菌GAPDH的晶体结构。

已使用定点诱变研究了负责NAD+辅因子立体特异性的分子因子。该酶是一种B-特异性脱氢酶，其催化pro-S氢的转移并以顺烟酰胺方向结合NAD(H)。已研究了在伴侣蛋白Tig存在下，变性的大肠杆菌GAPDH的重折叠的触发因素。

ADP-核糖基化GAPDH是一些真菌和革兰氏阳性病原体以及大肠杆菌致病株中的分泌毒力因子。非致病性大肠杆菌不分泌GAPDH。证据表明大肠杆菌GAPDH也参与DNA修复。

构建了一系列可诱导表达末端配对反义RNA的载体，以沉默宿主大肠杆菌K-12MG1655中的中心碳代谢。以93％的效率沉默gapA的载体导致了严重的生长抑制。已证明通过温度变化调节工程化大肠杆菌gapA的表达可以控制糖酵解。

在一些实施方案中，生产MEG(或乙醇酸)或任选MEG(或乙醇酸)和一种或多种联产品的重组微生物在编码甘油醛3-磷酸脱氢酶的基因中包含缺失、插入或功能缺失突变，以防止甘油醛3-磷酸转化为1,3-二磷酸-D-甘油酸，而是允许D-甘油醛3-磷酸通过转酮醇酶转化为D-木酮糖-5-磷酸(同时将果糖-6-磷酸转化为D-赤藓糖-4-磷酸)，从而产生生产MEG(或乙醇酸)或任选MEG(或乙醇酸)和一种或更多的联产品所需的戊糖-5-磷酸中间体，并为磷酸戊糖途径的非氧化分支提供更多的D-赤藓糖-4-磷酸，以进一步产生一种或多种戊糖-5-磷酸中间体。

6-磷酸果糖激酶(EC 2.7.1.11)

磷酸果糖激酶(Pfk)在糖酵解过程中催化果糖-6-磷酸在C1碳上的磷酸化。大肠杆菌含有Pfk-1(pfkA)和Pfk-2(pfkB)两种Pfk同工酶，其不具有序列相似性。野生型大肠杆菌中90％以上的磷酸果糖激酶活性可以归因于Pfk-1。

PfkA催化果糖-6-磷酸的磷酸化，是调节糖酵解途径的关键酶。该酶不能在体内催化逆反应。该酶显示出与底物果糖-6-磷酸的协同动力学，但与另一底物ATP不显示协同动力学。最近表明了PfkA还催化景天庚酮糖-7-磷酸的磷酸化，作为二磷酸景天庚酮糖旁路的一部分。已在有和没有激活剂和抑制剂的情况下解析了PfkA的晶体结构。基于序列相似性，预测PfkA是NAD+激酶。

PfkB是糖激酶的核糖激酶家族的成员。与PfkA不同，PfkB不显示与果糖-6-磷酸的协同相互作用、PEP的抑制或ADP的激活。MgATP^2-是该酶的真正底物。PfkB还可以使用塔格糖-6-磷酸作为底物。该反应是半乳糖醇分解代谢途径的一部分。已以

的分辨率解析了MgATP抑制的四聚体形式的PfkB晶体结构。将此结构与PfkB与果糖-6-磷酸复合物的晶体结构进行比较，表明了果糖-6-磷酸结合和MgATP结合之间存在负相互作用。

在一些实施方案中，生产MEG(或乙醇酸)或任选MEG(或乙醇酸)和一种或多种联产品的重组微生物在编码6-磷酸果糖激酶的基因中包含缺失、插入或功能缺失突变，以防止果糖-6-磷酸转化为1,6-二磷酸，而是允许通过6-磷酸果糖磷酸酮醇酶将果糖-6-磷酸转化为赤藓糖-4-磷酸和乙酰磷酸，并为磷酸戊糖途径的非氧化分支提供更多的赤藓糖-4-磷酸，以进一步产生生产MEG(或GA)或任选MEG(或GA)和一种或多种联产品所需的一种或多种戊糖-5-磷酸中间体。在一些实施方案中，6-磷酸果糖激酶是pfkA和/或pfkB。

羟基丙酮酸脱羧酶、2-氧代戊二酸脱羧酶、2-酮酸脱羧酶(EC 4.1.1.-)

本公开描述了可以催化以下反应的酶：

2-氧代戊二酸+辅酶A+NAD+→琥珀酰辅酶A+CO₂+NADH

4-甲基-2-氧代戊酸+H+→3-甲基丁醛+CO₂

3-甲基-2-氧代丁酸+H+→异丁醛+CO₂

羟基丙酮酸脱羧酶也可以称为羟基丙酮酸羧基裂解酶。

2-氧代戊二酸脱羧酶也可以称为氧代戊二酸脱羧酶；α-酮戊二酸脱羧酶(alpha-ketoglutarate decarboxylase，alpha-ketoglutaric decarboxylase)；前-2-氧代戊二酸脱羧酶；2-氧代戊二酸羧基裂解酶。

大肠杆菌SucA负责2-氧代戊二酸脱氢酶多酶复合物(OGDHC)的2-氧代戊二酸脱羧酶活性，该复合物催化2-氧代戊二酸(2-酮戊二酸)转化为琥珀酰辅酶A和CO₂，并产生NADH。

OGDHC是2-氧代酸脱氢酶家族的成员。该家族的成员含有三种酶组分的多个拷贝：2-氧代戊二酸脱羧酶(E1)、硫辛酰胺酰基转移酶(E2)和硫辛酰胺脱氢酶(E3)。在大多数革兰氏阳性细菌和线粒体中，E1组分是由两个亚基组成的异源二聚体，而在大多数(但不是全部)革兰氏阴性细菌中，其由单一类型的亚基组成。在这两种情况下，E1组分的多个拷贝以及E3组分的多个拷贝围绕具有八面体对称性的24个亚基的E2核心或具有二十面体对称性的60个亚基的E2核心(取决于复合物和物种)组装。在大肠杆菌中，丙酮酸脱氢酶和甘氨酸裂解多酶复合物共享E3组分。2-氧代戊二酸和丙酮酸脱氢酶复合物的E1和E2略有不同，将其指定为(o)和(p)以进行区分。

大肠杆菌OGDHC含有12个单位的E1(o)组分2-氧代戊二酸脱羧酶，其需要硫胺素并由sucA编码，24个单位的E2(o)组分二氢硫辛基转琥珀酰酶，其由sucB编码，以及2个单位的E3组分硫胺脱氢酶，其由lpd编码。24个E2(o)单元形成复合物的八面体核心。其含有硫辛酰赖氨酸以及E1(o)和E3亚基二聚体的结合位点。电子冷冻断层扫描表明其灵活地连接至E2核心。

在OGDHC反应循环中，SucA结合2-氧代戊二酸并使其脱羧，SucA是含有硫胺二磷酸辅因子的酶。已以

的分辨率测定了缺乏N-末端77个残基的截短的apo形式的SucA的晶体结构。以

的分辨率测定了具有硫胺二磷酸和Mg²⁺的holo形式的结构。截短的形式保留了脱羧酶活性，但没有与E2(o)组装成OGDH复合物。数据还表明存在AMP结合位点。证明了在OGDHC中通过与O₂的副反应生成氧依赖性的硫胺自由基。

对通过His260和His298饱和诱变制备的工程化SucA的研究表明，底物识别需要His260，但His298可以被类似大小的疏水残基替换。数据还表明E2(o)在特异性方面发挥作用。

在早期工作中克隆和测序了sucA基因，并研究了sucABCD的调控。表明了sucAB和sucCD基因是相互必需的，任一对都足以生产琥珀酰辅酶A，但同时缺失sucAB和sucCD不能存活。

α-酮异戊酸脱羧酶催化3-甲基-2-氧代丁酸脱羧为异丁醛。该酶对3-甲基-2-氧代丁酸具有高度特异性，但也对其他支链2-酮酸显示出活性(4-甲基-2-氧代戊酸，相对活性22.7％；(S)-3-甲基-2-氧代戊酸，16.7％，2-氧代-3-苯基丙酸，7.1％，以及4-(甲硫基)-2-氧代丁酸，5.8％)。

该酶是同源四聚体，由已测序和克隆的kivd基因编码。推导出的蛋白质序列与由ipd基因(该基因因插入IS983元件而在L439位置中断)编码的乳酸乳球菌IL1403株蛋白质具有98.6％的同一性(在其前438个氨基酸上)。kivd基因与乳酸乳球菌MG1363和SK11株的测序基因组中的任何基因都没有任何同源性。

对156株乳酸菌(乳球菌(Lactococcus)、乳杆菌(Lactobacillus)、明串珠菌(Leuconostoc))的Kivd活性检测研究表明，只有乳酸乳球菌的株具有该活性，即使在乳球菌株中，45株中也只有7株具有该活性。

将来自乳酸乳球菌B1157株的同源蛋白质描述为支链α-酮酸脱羧酶。该蛋白质与Kivd具有89.8％的同一性，并且还具有对2-酮异戊酸的偏好。

在一些实施方案中，具有2-酮酸脱羧酶活性的酶、具有羟基丙酮酸脱羧酶活性的酶或具有2-氧代戊二酸脱羧酶活性的酶将羟基丙酮酸转化为乙醇醛。在一些实施方案中，将羟基丙酮酸转化为乙醇醛的酶由与Kivd或SucA具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在一些实施方案中，具有2-酮酸脱羧酶活性的酶是Kivd。在一些实施方案中，具有2-氧代戊二酸脱羧酶活性的酶是SucA。

在一些实施方案中，编码具有2-氧代戊二酸脱羧酶活性的酶的一种或多种核酸分子是sucA，或其同源物。在一些实施方案中，编码具有2-酮酸脱羧酶活性的酶的一种或多种核酸分子是Kivd，或其同源物。在另一个实施方案中，编码具有2-酮酸脱羧酶活性的酶、具有羟基丙酮酸脱羧酶活性的酶或具有2-氧代戊二酸脱羧酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO：224和226的氨基酸序列。在一个进一步的实施方案中，编码具有2-酮酸脱羧酶活性的酶、具有羟基丙酮酸脱羧酶活性的酶或具有2-氧代戊二酸脱羧酶活性的酶的一种或多种核酸分子由选自SEQ ID NO：223和225的核酸序列编码。

2-氧代戊二酸还原酶、3-磷酸-羟基丙酮酸还原酶、3-磷酸甘油酸脱氢酶(EC 1.1.1.-)

本公开描述了可以催化以下反应的酶：

3-磷酸甘油酸脱氢酶也可以称为磷酸甘油酸脱氢酶(phosphoglyceratedehydrogenase)；PHGDH(基因名称)；D-3-磷酸甘油酸：NAD+氧化还原酶；α-磷酸甘油酸脱氢酶；3-磷酸甘油酸脱氢酶；D-3-磷酸甘油酸脱氢酶；甘油酸3-磷酸脱氢酶；甘油酸-1,3-磷酸脱氢酶；磷酸甘油酸氧化还原酶；磷酸甘油酸脱氢酶(phosphoglyceric aciddehydrogenase)；SerA；3-磷酸甘油酸：NAD+2-氧化还原酶；SerA 3PG脱氢酶；3PHP还原酶。

3-磷酸甘油酸脱氢酶催化L-丝氨酸生物合成的第一个关键步骤。该酶受显示出协同作用的变构终产物抑制作用的调节。丝氨酸的抑制主要通过降低催化速度起作用，对底物的Km影响很小；因此，SerA被归类为V型变构酶。

已广泛研究了丝氨酸变构和协同抑制的基础。在同源四聚体中占据四个丝氨酸结合位点中的两个导致85％的活性抑制。丝氨酸的进一步结合显示出负协同性。磷酸能够减少对丝氨酸结合的位点协同效应；该效应主要是由于存在固有结合的NADH。Trp139Gly突变导致同型二聚酶在丝氨酸结合和变构抑制方面失去协同作用。效应子结合位点内残基的定点诱变、亚基之间的调节界面和灵活的铰链区支持一个模型，该模型中相邻结构域的移动参与抑制酶活性。瞬时动力学分析表明，抑制催化活性的协同作用是由于丝氨酸结合引起的构象变化。缺少调节结构域的酶不再受丝氨酸抑制，但其他动力学参数保持不变。杂合四聚体提供了对变构抑制机制的进一步了解。

定点诱变已允许鉴定活性位点内有助于底物结合和催化的残基。底物和核苷酸结合结构域之间铰链区的突变影响酶的kcat；某些突变使丝氨酸结合和催化抑制解耦合。

广泛的定点诱变和结构研究有助于详细了解变构调节、协同性和催化活性之间的相互作用。停流动力学分析(stopped-flow kinetic analysis)提供了对催化途径的进一步了解，表明两个催化方向的限速步骤都是酶的构象变化。丝氨酸结合表现为导致酶、辅酶、底物和效应子之间形成无活性-端(dead-end)四元复合物，消除了底物结合后的构象变化。

该酶还具有α-酮戊二酸还原酶活性，生成2-羟基戊二酸。虽然该反应的代谢作用尚不清楚，但认为其可能在调节丝氨酸生物合成和将NADH再循环回NAD+方面发挥作用，尤其是在厌氧过程中。

已解析了野生型酶和许多点突变体的晶体结构。该结构表明该同源四聚体的每个亚基由三个不同的结构域组成，一个核苷酸结合结构域、一个底物结合结构域和一个调节/丝氨酸结合结构域。

serA是以甘油基本介质生长所必需的；加入丝氨酸可以挽救生长缺陷。

在一些实施方案中，具有3-磷酸甘油酸脱氢酶活性的酶可以是具有3-磷酸-羟基丙酮酸还原酶活性的酶或具有2-氧代戊二酸还原酶活性的酶。在一些实施方案中，具有3-磷酸甘油酸脱氢酶活性的酶、具有3-磷酸-羟基丙酮酸还原酶活性的酶或具有2-氧代戊二酸还原酶活性的酶催化甘油酸3-磷酸转化为3-磷酸羟基丙酮酸。在一些实施方案中，具有3-磷酸甘油酸脱氢酶活性的酶、具有3-磷酸-羟基丙酮酸还原酶活性的酶或具有2-氧代戊二酸还原酶活性的酶由与serA具有至少70％序列同一性、具有至少80％序列同一性、或具有至少90％序列同一性的氨基酸序列编码。在一些实施方案中，具有3-磷酸甘油酸脱氢酶活性的酶、具有3-磷酸-羟基丙酮酸还原酶活性的酶或具有2-氧代戊二酸还原酶活性的酶是serA。

在一些实施方案中，编码具有3-磷酸甘油酸脱氢酶活性的酶的一种或多种核酸分子是serA，或其同源物。在另一个实施方案中，编码具有3-磷酸甘油酸脱氢酶活性的酶、具有3-磷酸-羟基丙酮酸还原酶活性的酶或具有2-氧代戊二酸还原酶活性的酶的一种或多种核酸分子包含SEQ ID NO：228中列出的氨基酸序列。在一个进一步的实施方案中，编码具有3-磷酸甘油酸脱氢酶活性的酶、具有3-磷酸-羟基丙酮酸还原酶活性的酶或具有2-氧代戊二酸还原酶活性的酶的一种或多种核酸分子由SEQ ID NO：227中列出的核酸序列编码。

磷酸丝氨酸转氨酶、丝氨酸转氨酶、L-丝氨酸转氨酶(EC 2.6.1.52)

本公开描述了可以催化以下反应的酶：

磷酸丝氨酸转氨酶(phosphoserine aminotransferase)也可以称为磷酸丝氨酸转氨酶(phosphoserine transaminase)；PSAT；3-磷酸丝氨酸转氨酶；羟基丙酮酸磷酸-谷氨酸转氨酶；L-磷酸丝氨酸转氨酶；磷酸羟基丙酮酸转氨酶；磷酸羟基丙酮酸-谷氨酸转氨酶；3-O-磷酸-L-丝氨酸：2-氧代戊二酸转氨酶；SerC；PdxC；3PHP转氨酶。

serC编码的酶是磷酸丝氨酸/磷酸羟基苏氨酸转氨酶，其通过使用不同的底物在丝氨酸和吡哆醇的生物合成中起作用。吡哆醛5'-磷酸是这两种酶活性的辅因子，表明其可以以自催化方式起作用，刺激其自身的生物合成。

已研究了转氨酶之间的冗余和混杂。没有观察到对非磷酸化底物的活性；然而，3-羟基丙酮酸能够用作SerC酶活性测定的底物。此外，遗传实验表明SerC是一种次要的丙氨酸转氨酶。

ArgD和SerC两种酶的正常活性足以生物合成琥珀酰二氨基庚二酸(SDAP)和赖氨酸；第三种酶AstC足以生物合成SDAP，但单独时不能满足细胞对赖氨酸的需求。其他酶(包括GabT和PuuE)可能有助于SDAP的生物合成。从质粒表达argD、astC、serC、aspC、gabT、hisC、ilvE、patA、puuE或tyrB允许三重ΔargD serC astC突变体以基本介质生长。

已解析了未连接形式的酶和与底物类似物α-甲基-L-谷氨酸复合的该酶的晶体结构，并提出了分子反应机制。

serC是以甘油基本介质生长所必需的；加入丝氨酸和吡哆醇(pyridoxol)/吡哆素(pyridoxine)可以挽救生长缺陷。

在一些实施方案中，具有磷酸丝氨酸转氨酶活性的酶可以是具有L-丝氨酸转氨酶活性的酶或具有丝氨酸转氨酶活性的酶。在一些实施方案中，具有磷酸丝氨酸转氨酶活性的酶、具有L-丝氨酸转氨酶活性的酶或具有丝氨酸转氨酶活性的酶催化L-丝氨酸转化为羟基丙酮酸。在一些实施方案中，具有磷酸丝氨酸转氨酶活性的酶、具有L-丝氨酸转氨酶活性的酶或具有丝氨酸转氨酶活性的酶由与serC具有至少70％序列同一性、具有至少80％序列同一性、或具有至少90％序列同一性的氨基酸序列编码。在一些实施方案中，具有磷酸丝氨酸转氨酶活性的酶、具有L-丝氨酸转氨酶活性的酶或具有丝氨酸转氨酶活性的酶是serC。

在一些实施方案中，编码具有磷酸丝氨酸转氨酶活性的酶的一种或多种核酸分子是serC，或其同源物。在另一个实施方案中，编码具有磷酸丝氨酸转氨酶活性的酶、具有L-丝氨酸转氨酶活性的酶或具有丝氨酸转氨酶活性的酶的一种或多种核酸分子包含SEQ IDNO：230中列出的氨基酸序列。在一个进一步的实施方案中，编码具有磷酸丝氨酸转氨酶活性的酶、具有L-丝氨酸转氨酶活性的酶或具有丝氨酸转氨酶活性的酶的一种或多种核酸分子由SEQ ID NO：229中列出的核酸序列编码。

3-磷酸-羟基丙酮酸磷酸酶

本公开描述了可以催化以下反应的酶：

3-磷酸-羟基丙酮酸+H₂O→羟基丙酮酸+磷酸

YeaB(NudL)属于Nudix水解酶家族，预测其具有辅酶A焦磷酸水解酶活性。

yeaB(nudL)作为pgsA突变体中flhDC转录抑制的多拷贝抑制因子被分离。该抑制可能是由于过表达nudL的细胞中σ^S表达的减少。

yeaB(nudL)也作为pdxB缺失株的PLP营养缺陷的多拷贝抑制因子被分离。发现NudL是偶然发现的代谢途径的一部分，该途径产生吡哆醛5'-磷酸生物合成I途径的中间体4-磷酸-羟基-L-苏氨酸，其位于PdxB的下游。该途径从丝氨酸生物合成中转移3-磷酸羟基丙酮酸。NudL是将3-磷酸羟基丙酮酸转化为羟基丙酮酸的低效催化剂(K_cat为5.7×10^-5)，但其活性表现为足以生产PLP。

在一些实施方案中，具有3-磷酸-羟基丙酮酸磷酸酶活性的酶由与yeaB具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在一些实施方案中，具有3-磷酸-羟基丙酮酸磷酸酶活性的酶是yeaB。

在一些实施方案中，编码具有3-磷酸-羟基丙酮酸磷酸酶活性的酶的一种或多种核酸分子是yeaB，或其同源物。在另一个实施方案中，编码具有3-磷酸-羟基丙酮酸磷酸酶活性的酶的一种或多种核酸分子包含SEQ ID NO：232中列出的氨基酸序列。在一个进一步的实施方案中，编码具有3-磷酸-羟基丙酮酸磷酸酶活性的酶的一种或多种核酸分子由SEQID NO：231中列出的核酸序列编码。

磷酸丝氨酸磷酸酶(EC 3.1.3.3)

本公开描述了可以催化以下反应的酶：

3-磷酸-L-丝氨酸+H₂O→L-丝氨酸+磷酸

磷酸丝氨酸磷酸酶催化丝氨酸生物合成的最后一步。该酶属于卤酸脱卤酶(HAD)样水解酶超家族。最初使用来自大肠杆菌W株的部分纯化的酶进行酶学研究；作为HAD酶超家族研究的一部分，对该纯化酶进行了分析。

serB是以甘油基本介质生长所必需的；加入丝氨酸可以挽救生长缺陷。鉴定了Gph、HisB和YtjC为条件ΔserB表型的多拷贝抑制因子。定向进化实验鉴定了增加这些抑制因子的适应性和酶活性的突变。

在一些实施方案中，具有磷酸丝氨酸磷酸酶活性的酶由与serB具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在一些实施方案中，具有磷酸丝氨酸磷酸酶活性的酶是serB。

在一些实施方案中，编码具有磷酸丝氨酸磷酸酶活性的酶的一种或多种核酸分子是serB，或其同源物。在另一个实施方案中，编码具有磷酸丝氨酸磷酸酶活性的酶的一种或多种核酸分子包含SEQ ID NO：234中列出的氨基酸序列。在一个进一步的实施方案中，编码具有磷酸丝氨酸磷酸酶活性的酶的一种或多种核酸分子由SEQ ID NO：233中列出的核酸序列编码。

丝氨酸-丙酮酸转氨酶(EC 2.6.1.51)

本公开描述了可以催化以下反应的酶：

丝氨酸-丙酮酸转氨酶也可以称为丙氨酸-乙醛酸转氨酶。

过氧化物酶体丝氨酸-丙酮酸转氨酶(AGXT1)和线粒体定位的丙氨酸-乙醛酸转氨酶2(AGXT2)均使用丙氨酸作为氨基供体催化乙醛酸转化为甘氨酸。与AGXT2不同，AGXT1不能利用非对称的二甲基精氨酸(ADMA)作为氨基供体。

过氧化物酶体丝氨酸-丙酮酸转氨酶是磷酸吡哆醛依赖性的肝脏特异性的酶，其由同源二聚体组成。其在过氧化物酶体中的位置对于适当的酶活性至关重要。C-末端的过氧化物酶体靶向序列(PTS1)是易位至过氧化物酶体中所必需的。

丝氨酸-丙酮酸转氨酶的功能障碍或错误靶向导致肝过氧化物酶体缺失，导致乙醛酸逃逸至细胞质中并在其中进一步代谢为草酸和乙醇酸。草酸不能在人体中进一步代谢，导致在肾脏和泌尿道中形成不溶性的草酸钙。AGXT1基因的突变导致过氧化物酶体靶向不当，并导致常染色体隐性代谢障碍(1型原发性高草酸尿症)，其导致不可逆的肾损伤。三分之一的1型原发性高草酸尿症患者具有独特的蛋白质分选缺陷，其中肝过氧化物酶体的酶误定位至线粒体。

在一些实施方案中，具有丝氨酸-丙酮酸转氨酶活性的酶由与人AGXT1具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在一些实施方案中，具有丝氨酸-丙酮酸转氨酶活性的酶是人AGXT1。

在一些实施方案中，编码具有丝氨酸-丙酮酸转氨酶活性的酶的一种或多种核酸分子是AGXT1，或其同源物。在一些实施方案中，编码具有丝氨酸-丙酮酸转氨酶活性的酶的一种或多种核酸分子包含SEQ ID NO：244中列出的氨基酸序列。在一个进一步的实施方案中，编码具有丝氨酸-丙酮酸转氨酶活性的酶的一种或多种核酸分子由SEQ ID NO：243中列出的核酸序列编码。

丝氨酸脱羧酶(EC 4.1.1.65)

本公开描述了可以催化以下反应的酶：

3-O-sn-磷脂酰-L-丝氨酸+H+→L-1-磷脂酰乙醇胺+CO₂

丝氨酸脱羧酶也可以称为磷脂酰丝氨酸脱羧酶；PS脱羧酶；磷脂酰-L-丝氨酸羧基裂解酶。

磷脂酰丝氨酸脱羧酶是使用共价结合的丙酮酰辅基的一小类酶之一。认为丙酮酰基团的作用方式类似于磷酸吡哆醛辅因子，通过与底物的氨基基团形成席夫碱，然后作为电子库(electron sink)促进脱羧作用。

这其中的四种酶，组氨酸脱羧酶(E.C.4.1.1.22)、磷脂酰丝氨酸脱羧酶、天冬氨酸1-脱羧酶和S-腺苷甲硫氨酸脱羧酶是形成重要生物胺的脱羧酶。已知所有这些酶都具有通过酰胺连接至α亚基的氨基末端的丙酮酰辅基。该组中的另外两种酶是D-脯氨酸还原酶和甘氨酸还原酶(E.C.1.21.4.2)。

含有丙酮酰基的酶表达为酶原，通过称为丝氨酸分解(serinolysis)的自成熟裂解对酶原进行翻译后加工。在这个过程中，由丝氨酸残基形成丙酮酰基团，将前体蛋白分成两部分，成为α和β亚基。在某些情况下，可能涉及另外的亚基。

该酶与其他由不同亚基组成的丙酮酰基依赖性脱羧酶的不同之处在于，丙酮酸辅基与较小的亚基相关联。该酶是数目未知的异源二聚体的多聚体。

在一些实施方案中，具有丝氨酸脱羧酶活性的酶催化L-丝氨酸转化为乙醇胺。

在一些实施方案中，具有丝氨酸脱羧酶活性的酶由与拟南芥SDC具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在一些实施方案中，具有丝氨酸脱羧酶活性的酶是拟南芥SDC。

在一些实施方案中，编码具有丝氨酸脱羧酶活性的酶的一种或多种核酸分子是SDC，或其同源物。在一些实施方案中，编码具有丝氨酸脱羧酶活性的酶的一种或多种核酸分子包含SEQ ID NO：236中列出的氨基酸序列。在一个进一步的实施方案中，编码具有丝氨酸脱羧酶活性的酶的一种或多种核酸分子由SEQ ID NO：235中列出的核酸序列编码。

乙醇胺氧化还原酶(脱氨基)(EC 1.4.3.8)、乙醇胺转氨酶(EC 2.6.1.-)

本公开描述了可以催化以下反应的酶：

乙醇胺+氧+H₂O→铵+过氧化氢+乙醇醛

乙醇胺+2-氧代戊二酸→乙醇醛+L-谷氨酸

乙醇胺氧化还原酶(脱氨基)也可以称为乙醇胺氧化酶。该酶属于氧化还原酶家族，具体是那些以氧为受体作用于供体的CH-NH₂基团的酶。

在一些实施方案中，乙醇胺氧化酶或乙醇胺转氨酶催化乙醇胺转化为乙醇醛。

在一些实施方案中，具有乙醇胺氧化酶活性的酶由与大肠杆菌tynA具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在一些实施方案中，具有乙醇胺氧化酶活性的酶是大肠杆菌tynA。

在一些实施方案中，编码具有乙醇胺氧化酶活性的酶的一种或多种核酸分子是tynA，或其同源物。在一些实施方案中，编码具有乙醇胺氧化酶活性的酶的一种或多种核酸分子包含SEQ ID NO：238中列出的氨基酸序列。在一个进一步的实施方案中，编码具有乙醇胺氧化酶活性的酶的一种或多种核酸分子由SEQ ID NO：237中列出的核酸序列编码。

在一些实施方案中，具有乙醇胺转氨酶活性的酶由与大肠杆菌alaA具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在一些实施方案中，具有乙醇胺转氨酶活性的酶是大肠杆菌alaA。

在一些实施方案中，编码具有乙醇胺转氨酶活性的酶的一种或多种核酸分子是alaA，或其同源物。在一些实施方案中，编码具有乙醇胺转氨酶活性的酶的一种或多种核酸分子包含SEQ ID NO：240中列出的氨基酸序列。在一个进一步的实施方案中，编码具有乙醇胺转氨酶活性的酶的一种或多种核酸分子由SEQ ID NO：239中列出的核酸序列编码。

羟基丙酮酸还原酶(EC 1.1.1.-)

本公开描述了可以催化以下反应的酶：

羟基丙酮酸还原酶也可以称为β-羟基丙酮酸还原酶；NADH：羟基丙酮酸还原酶；D-甘油酸脱氢酶。

羟基丙酮酸还原酶是存在于高等植物、藻类、哺乳动物组织和细菌中的酶。在大多数情况下，已假定其将羟基丙酮酸转化为甘油酸。然而，大多数酶也将乙醛酸还原为乙醇酸。

在丝氨酸循环甲基营养菌中，羟基丙酮酸还原酶在碳的同化中起关键作用。其催化羟基丙酮酸转化为甘油酸，这是丝氨酸循环的关键步骤，但该酶也通过乙醛酸和乙醇酸的相互转化在C2化合物的代谢中发挥重要作用。

在一些实施方案中，羟基丙酮酸还原酶催化甘油酸转化为羟基丙酮酸。

在一些实施方案中，具有羟基丙酮酸还原酶活性的酶由与大肠杆菌ghrB具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在一些实施方案中，具有羟基丙酮酸还原酶活性的酶是大肠杆菌ghrB。

在一些实施方案中，编码羟基丙酮酸还原酶的一种或多种核酸分子是ghrB，或其同源物。在一些实施方案中，编码具有羟基丙酮酸还原酶活性的酶的一种或多种核酸分子包含SEQ ID NO：242中列出的氨基酸序列。在一个进一步的实施方案中，编码具有羟基丙酮酸还原酶活性的酶的一种或多种核酸分子由选自SEQ ID NO：241的核酸序列编码。

甘油酸脱羧酶

本公开描述了可以催化以下反应的酶：

D-甘油酸+H+→乙二醇+CO₂

在一些实施方案中，具有甘油酸脱羧酶活性的酶催化甘油酸转化为乙二醇。

3-磷酸甘油酸磷酸酶(EC 3.1.3.38)或2-磷酸甘油酸磷酸酶(EC 3.1.3.20)

本公开描述了可以催化以下反应的酶：

3-磷酸-D-甘油酸+H₂O→D-甘油酸+磷酸

2-磷酸-D-甘油酸+H₂O→D-甘油酸+磷酸

3-磷酸甘油酸磷酸酶也可以称为D-3-磷酸甘油酸磷酸酶；3-PGA磷酸酶。2-磷酸甘油酸磷酸酶也可以称为D-2-磷酸甘油酸磷酸酶；2-PGA磷酸酶。这些酶属于水解酶家族，具体是那些作用于磷酸单酯键的酶。

在一些实施方案中，具有3-磷酸甘油酸磷酸酶活性的酶或具有2-磷酸甘油酸磷酸酶活性的酶由与大肠杆菌phoA具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在一些实施方案中，具有3-磷酸甘油酸磷酸酶活性的酶或具有2-磷酸甘油酸磷酸酶活性的酶是大肠杆菌phoA。

在一些实施方案中，编码具有3-磷酸甘油酸磷酸酶活性的酶或具有2-磷酸甘油酸磷酸酶活性的酶的一种或多种核酸分子是phoA，或其同源物。在一些实施方案中，编码具有3-磷酸甘油酸磷酸酶活性的酶或具有2-磷酸甘油酸磷酸酶活性的酶的一种或多种核酸分子包含SEQ ID NO：246中列出的氨基酸序列。在一个进一步的实施方案中，编码具有3-磷酸甘油酸磷酸酶活性的酶或具有2-磷酸甘油酸磷酸酶活性的酶的一种或多种核酸分子由SEQID NO：245中列出的核酸序列编码。

甘油酸激酶(EC 2.7.1.31)

本公开描述了可以催化以下反应的酶：

甘油酸激酶也可以称为甘油酸3-激酶；甘油酸激酶(磷酸化)(双关(ambiguous))；D-甘油酸3-激酶；D-甘油酸激酶(双关)；甘油酸激酶(双关)；GK(双关)；D-甘油酸激酶(双关)；ATP：(R)-甘油酸3-磷酸转移酶。

该酶属于转移酶家族，具体是那些以醇基团为受体转移含有磷的基团的酶(磷酸转移酶)。该酶参与3种代谢途径：丝氨酸/甘氨酸/苏氨酸代谢、甘油脂代谢和乙醛酸-二羧酸代谢。

在一些实施方案中，具有甘油酸激酶活性的酶催化3-磷酸甘油酸转化为甘油酸。在其他实施方案中，具有甘油酸激酶活性的酶催化2-磷酸甘油酸转化为甘油酸。

在一些实施方案中，具有甘油酸激酶活性的酶是甘油酸3-激酶。在一些实施方案中，具有甘油酸3-激酶活性的酶由与拟南芥GLYK具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在一些实施方案中，甘油酸3-激酶是拟南芥GLYK。

在一些实施方案中，编码具有甘油酸3-激酶活性的酶的一种或多种核酸分子是GLYK，或其同源物。在一些实施方案中，编码具有甘油酸3-激酶活性的酶的一种或多种核酸分子包含SEQ ID NO：248中列出的氨基酸序列。在一个进一步的实施方案中，编码具有甘油酸3-激酶活性的酶的一种或多种核酸分子由SEQ ID NO：247中列出的核酸序列编码。

在一些实施方案中，具有甘油酸激酶活性的酶是具有甘油酸2-激酶活性的酶。在一些实施方案中，具有甘油酸2-激酶活性的酶由与大肠杆菌glxK具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在一些实施方案中，具有甘油酸2-激酶活性的酶由与大肠杆菌garK具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在其他实施方案中，具有甘油酸2-激酶活性的酶是大肠杆菌glxK。在一些实施方案中，甘油酸2-激酶是大肠杆菌garK。

在一些实施方案中，编码具有甘油酸2-激酶活性的酶的一种或多种核酸分子是glxK，或其同源物。在一些实施方案中，编码具有甘油酸2-激酶活性的酶的一种或多种核酸分子是garK，或其同源物。在一些实施方案中，编码具有甘油酸2-激酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO：250和252的氨基酸序列。在一个进一步的实施方案中，编码具有甘油酸2-激酶活性的酶的一种或多种核酸分子由选自SEQ ID NO：249和251的核酸序列编码。

转移一碳基团的转移酶(EC 2.1.2.-)

本公开描述了可以催化以下反应的酶：

可以使用转移酶如羟甲基-、甲酰基-和相关转移酶。羟甲基-、甲酰基-和相关转移酶的示例包括甘氨酸羟甲基转移酶、磷酸核糖基甘氨酰胺甲酰基转移酶、磷酸核糖氨基咪唑甲酰胺甲酰基转移酶、甘氨酸亚氨甲基转移酶、谷氨酸亚氨甲基转移酶、D-丙氨酸2-羟甲基转移酶、脱氧胞苷酸5-羟甲基转移酶、甲硫氨酰基-tRNA甲酰基转移酶、氨甲基转移酶、3-甲基-2-氧代丁酸羟甲基转移酶和UDP-4-氨基-4-脱氧-L-阿拉伯糖甲酰基转移酶。

丝氨酸羟甲基转移酶(EC 2.1.2.1)

本公开描述了可以催化以下反应的酶：

丝氨酸羟甲基转移酶(GlyA)将丝氨酸转化为甘氨酸，同时将甲基基团转移至四氢叶酸，从而形成5,10-亚甲基四氢叶酸(M-THF)。M-THF是细胞中C1单位的主要来源，使GlyA成为嘌呤、胸苷、甲硫氨酸、胆碱和脂质的生物合成的关键酶。

该酶还催化多种副反应，包括5,10-亚甲基THF水解为5-甲酰THF，以及3-羟基氨基酸(L-苏氨酸、别苏氨酸、3-苯基丝氨酸)可逆裂解为甘氨酸和醛。D-丙氨酸通过与磷酸吡哆醛辅基反应形成磷酸吡哆胺使酶失活。

该酶保守区内的Thr226残基表现为与底物鉴别有关。His228残基在确定反应的特异性中起作用。Lys229表现为不起到催化作用。Arg363表现为是氨基酸底物的羧基基团的结合位点。Tyr65的羟基基团可能参与活性位点从封闭构象到开放构象的转化。Tyr55和Arg235都是转醛基反应所必需的。

对酶重折叠的研究表明，吡哆醛5'-磷酸(PLP)仅在折叠途径的末尾与二聚脱辅基酶结合。已进一步研究了PLP加入的机制。在高浓度的PLP下，第二个PLP分子可以在Lys346处结合。PLP结合位点的稳定性涉及保守的疏水接触区。Tyr55是正确定位PLP辅因子所必需的。

已解析了野生型和突变体丝氨酸羟甲基转移酶的晶体结构。

glyA突变体不能使用甘氨酸作为唯一氮源。glyA突变体对甘氨酸是营养缺陷的；后来表明glyA是以甘油基本介质生长所必需的。

glyA mRNA中结构基因的3'序列是mRNA稳定性所必需的。

在一些实施方案中，具有丝氨酸羟甲基转移酶活性的酶由与大肠杆菌glyA具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在一些实施方案中，编码具有丝氨酸羟甲基转移酶活性的酶的一种或多种核酸分子包含UniProt ID P0A825中列出的氨基酸序列。在一个进一步的实施方案中，编码具有丝氨酸羟甲基转移酶活性的酶的一种或多种核酸分子由Gene ID 947022中列出的核酸序列编码。

甲醛脱氢酶(EC 1.2.1.46和EC 1.2.1.-)

本公开描述了可以催化以下反应的酶：

甲醛+NAD⁺+H₂O→甲酸+NADH+2H⁺

甲醛脱氢酶也可以称为连接NAD的甲醛脱氢酶、NAD依赖性甲醛脱氢酶或甲醛：NAD+氧化还原酶。

在动物、植物和细菌中发现的大部分甲醛脱氢酶都属于III类醇脱氢酶组，需要加入谷胱甘肽才能发挥活性。事实上，表明了这些酶的真正底物不是甲醛，而是由甲醛和谷胱甘肽以非酶促方式形成的S-羟甲基谷胱甘肽。

与那些酶不同，从恶臭假单胞菌中分离出的酶催化甲醛不可逆氧化为甲酸，而无需加入谷胱甘肽。由于其底物是甲醛，本质上这是“真正的”甲醛脱氢酶。与其他甲醛脱氢酶一样，恶臭假单胞菌FDH是含有锌的金属酶。其还需要NAD+作为电子受体。然而，与属于III类醇脱氢酶组的酶不同，其对4-甲基吡唑敏感。在一个实施方案中，甲醛脱氢酶来自恶臭假单胞菌。在一些实施方案中，甲醛脱氢酶由与恶臭假单胞菌fdhA具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在一些实施方案中，编码甲醛脱氢酶的一种或多种核酸分子包含GenBank登录号BAA04743.1中列出的氨基酸序列。在一个进一步的实施方案中，编码甲醛脱氢酶的一种或多种核酸分子由GenBank登录号D21201.1中列出的核酸序列编码。

在工业上重要的放线菌谷氨酸棒杆菌(Corynebacterium glutamicum)ATCC13032中，有证据表明两种酶有助于降解有毒的甲醛，即由fadH基因编码的分枝硫醇(mycothiol)依赖性甲醛脱氢酶，和由ald(乙醛脱氢酶)基因编码的乙醛脱氢酶，后者在较小程度上起作用。缺乏这两种酶的突变体无法在含有甲醛的介质中生长。该突变体也不在含有香草酸的介质中生长，因为香草酸的氧化产生细胞内甲醛。当这种土壤细菌在其栖息地遇到甲醛时，或者当环境化合物(如香草酸)代谢过程中产生甲醛时，甲醛的解毒是必需的。FadH产生的甲酸可以被fdhF基因编码的甲酸脱氢酶进一步氧化为CO₂。

与野生型相比，ald突变体的甲醛降解减少了约30％。染色体ald基因的失活导致乙醛脱氢酶活性的丧失和该生物体以乙醇生长或利用乙醇的能力的丧失，表明乙醇经过两步氧化为乙酸。ald基因的表达依赖于转录调节因子RamA，而RamB对表达有轻微的负面影响。在一个实施方案中，甲醛脱氢酶来自谷氨酸棒杆菌ATCC 13032。在一些实施方案中，甲醛脱氢酶由与谷氨酸棒杆菌ATCC 13032的ald具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在一些实施方案中，编码甲醛脱氢酶的一种或多种核酸分子包含UniProt ID Q8NLZ0中列出的氨基酸序列。在一个进一步的实施方案中，编码甲醛脱氢酶的一种或多种核酸分子由Gene ID 1020739中列出的核酸序列编码。

在一些实施方案中，具有甲醛脱氢酶活性的酶由与食油假单胞菌(Pseudomonasoleovorans)alkH具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。

在酿酒酵母中，两个串联重复基因ALD2和ALD3编码醛脱氢酶的两种细胞质应激诱导亚型。这些同种型的表达依赖于一般应激转录因子Msn2和Msn4，但不依赖于HOG MAP激酶途径。两种形式都可以比使用NADP+更有效地使用辅因子NAD+，并且不被任何阳离子激活。虽然ALD3由多种压力诱导，包括渗透性休克、热休克、葡萄糖耗竭、氧化应激和药物，但ALD2仅由渗透应激和葡萄糖耗竭诱导。

在一些实施方案中，具有甲醛脱氢酶活性的酶由与酿酒酵母ALD2具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在其他实施方案中，具有甲醛脱氢酶活性的酶由与酿酒酵母ALD3具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在一些实施方案中，编码具有甲醛脱氢酶活性的酶的一种或多种核酸分子包含选自UniProt ID P47771和UniProt ID P54114的氨基酸序列。在一个进一步的实施方案中，编码具有甲醛脱氢酶活性的酶的一种或多种核酸分子由选自Gene ID 855206和Gene ID 855205的核酸序列编码。

在一些实施方案中，具有甲醛脱氢酶活性的酶由与人ALDH3A2具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在其他实施方案中，具有甲醛脱氢酶活性的酶由与人ALDH9A1具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在一些实施方案中，编码具有甲醛脱氢酶活性的酶的一种或多种核酸分子包含选自UniProt ID P51648和UniProtID P49189的氨基酸序列。在一个进一步的实施方案中，编码具有甲醛脱氢酶活性的酶的一种或多种核酸分子由选自Gene ID 224和Gene ID 223的核酸序列编码。

甲酸脱氢酶(EC 1.2.1.-)

本公开描述了可以催化以下反应的酶：

甲酸+氧化的电子受体+H+→CO₂+还原的电子受体

甲酸+H+→CO₂+H₂(由复合物催化)

甲酸+氧化的氢化酶3→CO₂+还原的氢化酶3

甲酸脱氢酶-H是大肠杆菌中三种膜相关甲酸脱氢酶同工酶之一。所有同工酶都在生物体的厌氧代谢中起作用。

甲酸脱氢酶-H(FDH-H)位于细胞质中，FDH-H与氢化酶-3形成甲酸-氢裂解酶复合物。该酶对氧敏感，并且由于在FdhF开放阅读框中的框内UGA终止密码子位置共翻译掺入硒代半胱氨酸而含有硒。已以

的分辨率解析了FDH-H的晶体结构，证实了[4Fe-4S]簇的存在、硒代半胱氨酸与Mo辅因子的配位以及抑制剂硝酸结合位点的位置。甲酸和外部电子受体的缺失诱导fdhF的表达，硝酸、亚硝酸、三甲胺N-氧化物和氧抑制fdhF的表达。甲酸可以克服硝酸的抑制，但不能克服氧的抑制。DNA促旋酶的抑制增强fdhF的表达。

fdnGHI编码膜结合甲酸脱氢酶N(FDH-N)，FDH-N是呼吸酶，其催化甲酸氧化为二氧化碳，向醌池提供电子以减少厌氧呼吸底物(如硝酸盐和三甲胺N-氧化物)。FDH-N是复合铁硫钼酶(CISM)家族的成员。FDH-N氧化甲酸是生电的(H+/e-＝1)；周质中甲酸的氧化伴随着内膜细胞质面的甲基萘醌还原。硝酸和厌氧菌诱导甲酸脱氢酶-N的表达，分别由NarL和Fnr介导。纯化的FDH-N含有三个亚基，分别称为α(FdnG)、β(FdnH)和γ(FdnI)。以

解析的晶体结构表明，该亚复合物进一步组织为生理相关的三聚体，其中α和β亚基位置朝向内膜的周质面，而γ亚基位置朝向细胞质。电子从α亚基中的甲酸氧化位点跨膜转移至γ亚基中的甲基萘醌还原位点。在甲基萘醌还原位点，从细胞质中吸收质子。

fdoGHI编码甲酸脱氢酶O(FDH-O)，FDH-O是呼吸性钼酶，其催化甲酸氧化为二氧化碳，向膜可溶性醌池提供电子以还原硝酸。FDH-O和硝酸还原酶Z参与从甲酸至硝酸的电子传递途径，该途径在细胞从需氧条件转变为厌氧条件时是活跃的。该途径通过甲基萘醌或泛醌运转。FDH-O表现为组成型表达的；与甲酸脱氢酶N(FDH-N)不同，其不受Fnr或NarL的调控。FDH-O的表达在有氧条件下增加；在厌氧条件下，硝酸轻微刺激表达；全局调节因子H-NS和CRP可能在FDH-O表达的调节中发挥作用。FDH-O可能有助于细胞快速适应厌氧环境的能力，同时FDH-N的水平仍然不足。FDH-O是由α(FdoG)、β(FdoH)和γ(FdoI)亚基组成的异源三聚体复合物，其与厌氧表达的FDH-N具有广泛的序列相似性和共同的免疫学特性。

Candida boidinii甲酸脱氢酶FDH1是NAD依赖性酶，其介导甲酸的解毒，并受Cu²⁺、Hg、对氯汞苯甲酸、氰化物、叠氮化物、硫氰酸和氰酸的强烈抑制。氰化物的抑制是可逆的，并与甲酸竞争。甲醇诱导蛋白质表达，葡萄糖抑制蛋白质表达。由于该甲酸脱氢酶催化的酶促反应可以再生NADH，因此已将该酶克隆至大肠杆菌中，以优化需要NADH的工程化途径。

在工业上重要的放线菌谷氨酸棒杆菌ATCC 13032中，有证据表明甲酸脱氢酶催化甲酸氧化为CO₂。甲酸和有毒的甲醛都存在于环境中，并且可以被这种土壤细菌通过甲醛氧化为甲酸而异化。这可以通过FadH和Ald实现。然后甲酸通过FdhF转化为CO₂。FdhF是钼辅因子依赖性甲酸脱氢酶，其在有氧条件下有活性，据推测与应激反应有关。尚未定义FdhF使用的确切电子受体。fdhF基因是含有相关基因fdhD和cg0617的基因簇的一部分，突变体分析显示这些基因是甲酸脱氢酶活性所必需的。在甲酸存在下，谷氨酸棒杆菌ATCC 13032的生长受到一定程度的抑制，而缺乏甲酸脱氢酶活性的株则表现出更强的抑制作用。放射性示踪剂实验表明，当谷氨酸棒杆菌ATCC 13032以葡萄糖和¹³C-甲酸生长时，甲酸被代谢为¹³C-二氧化碳。fdhF缺失突变体不能代谢甲酸。生长研究还表明需要Mo²⁺。蛋白质序列分析表明FdhF不是完整的膜蛋白，但可能是细胞溶质的或膜相关蛋白。已在多种其他土壤细菌中鉴定出推定的直系同源物。

当Cupriavidus oxalaticus以甲酸为主要碳源和能源生长时，NAD+依赖性甲酸脱氢酶是生成NADH和CO₂的关键酶。后者进入二磷酸核酮糖羧化酶反应。已从以甲酸生长的细胞中将该酶纯化至均质。该酶是复合黄素蛋白，含有2个FMN(黄素单核苷酸)、18-25个非血红素铁原子和15-20个酸不稳定硫化物。比活性为42单位/mg。该酶对其天然底物甲酸具有特异性，但可以接受多种非生理电子受体，包括甲基紫精、吩嗪硫酸甲酯、亚甲蓝、硝基蓝四唑盐、FMN、FAD、核黄素和氧。已经表明该酶也可以催化相反方向的反应。然而，在所采用的条件下，该酶催化甲酸氧化比CO₂还原快约30倍。

来自Gottschalkia acidurici的NAD+依赖性甲酸脱氢酶催化可逆反应。在催化甲酸氧化为CO₂的同时，其还催化后者还原为甲酸，然后甲酸转化为乙酸。该酶已部分纯化，发现其是大型酶复合物(分子量至少为200kDa)，对氧气和光非常敏感。该酶含有L-硒代半胱氨酸。在通过铁氧还蛋白进行甲酸氧化的过程中，该酶的粗制品可以与NAD还原偶联。当使用人工电子受体甲基紫精而不是NAD时，则不需要铁氧还蛋白。氰化物抑制该酶90％。细胞提取物中的基础甲酸氧化活性为0.85μmol/min/mg蛋白质，但在加入钨酸和亚硒酸后增加12倍。有趣的是，来自相关生物体Clostridium cylindrosporum的酶虽然对亚硒酸有类似的需求，但需要钼酸而不是钨酸，钨酸对其具有拮抗作用。

来自扭脱甲基杆菌(Methylobacterium extorquens)的含有钨的NAD+依赖性甲酸脱氢酶是异源二聚体，含有铁硫簇、FMN和钨。尽管已经发现了其他几个例子，但在需氧细菌中发现含有钨的酶是有些不寻常的。较小的β亚基表现为融合蛋白，其N-末端结构域与NueE样亚基相联系，其C-末端结构域与已知的NADH-泛醌氧化还原酶的NuoF样亚基相联系。

两个小组独立地从Methylosinus trichosporium OB3b中纯化出了两种不同形式的甲酸脱氢酶FDH，发现这两种蛋白质具有不同的特性。该蛋白质由两类亚基组成，亚基呈明显的α₂β₂排列，总大小为315kDa。该蛋白质含有非血红素铁和硫化物，不含其他金属，表现为需要FMN。

莫拉氏菌属物种(Moraxella sp.)的NAD+依赖性甲酸脱氢酶fdh是相对简单的二聚体蛋白质，没有辅基基团。

在一些实施方案中，具有甲酸脱氢酶活性的酶由与选自以下的甲酸脱氢酶具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码：大肠杆菌fdhF(chlF，FDH-H)、大肠杆菌FDH-N、大肠杆菌FDH-O、Candida boidiniiFDH1、谷氨酸棒杆菌fdhF、Cupriavidus oxalaticus的NAD+依赖性甲酸脱氢酶、Gottschalkia acidurici的NAD+依赖性甲酸脱氢酶、扭脱甲基杆菌(Methylobacteriumextorquens)Fdh1、Methylosinus trichosporium的甲酸脱氢酶和莫拉氏菌属物种的NAD+依赖性甲酸脱氢酶fdh。在一些实施方案中，编码甲酸脱氢酶或甲酸脱氢酶亚基的一种或多种核酸分子包含选自以下的氨基酸序列：UniProt ID P07658、UniProt ID P0AEK7、UniProt ID P0AAJ3、UniProt ID P24183、UniProt ID P32176、UniProt ID P0AAJ5、UniProt ID P0AEL0、UniProt ID O13437、UniProt ID Q8NSY6、UniProt ID Q8KTI7、UniProt ID Q8KTI8和UniProt ID O08375。在一个进一步的实施方案中，编码甲酸脱氢酶或甲酸脱氢酶亚基的一种或多种核酸分子由选自以下的核酸序列编码：Gene ID 948584、Gene ID 946038、Gene ID 948794、Gene ID 946035、Gene ID 948394、Gene ID 948395、Gene ID 948383、GenBank登录号AJ011046.2、Gene ID 1021531、GenBank登录号AF489516和GenBank登录号Y13245.1。

甲酸氢解酶(hydrogenlyase)复合物

本公开描述了可以催化以下反应的酶：

甲酸+H+→CO₂+H₂(由复合物催化)

甲酸氢解酶复合物的组分酶是：1)甲酸脱氢酶H(也称为ChlF、FdhF、FDH-H)，2)氢化酶3，其具有多个亚基(hycBCDEFG基因：hycB、hycC、hycD、hycE、hycF、hycG)。

甲酸脱氢酶-H(FDH-H)如上所述。

微生物氢化酶催化质子可逆还原为分子氢。大肠杆菌氢化酶3是由hyc基因(hycD、hycC、hycF、hycG、hycB和hycE)编码的多亚基酶，是甲酸氢解酶(FHL)复合物的一部分，负责甲酸的发酵或厌氧氧化为二氧化碳和分子氢。

氢化酶3主要在生产H₂中起作用，并且对于酸性pH下生产H₂很重要。在缺乏氢化酶1和氢化酶2的株中，通过引入hycE突变进一步降低了氢摄入，表明氢化酶3也可以在氢摄入中起作用。氢化酶3显示出对产物(H₂)抑制的高度耐受性。

氢化酶3是一种膜相关的H₂进化呼吸[NiFe]氢化酶。其含有具有“标准”NiFe氢化酶特征的大(HycE)和小(HycG)亚基，加上两个另外的亲水亚基(HycB和HycF)和两个内膜亚基(HycC和HycD)。位于复合物亲水部分的Fe-S辅基可以形成电子传递途径。使用亲和层析分离FHL表明存在含有HycE、HycB、HycF、HycG和FdhF的核心复合物，该复合物在体外具有甲酸氢解酶活性；在去垢剂存在下分离出了含有膜相关亚基HyC和HycD的较大复合物。

在缺乏氢化酶1和氢化酶2酶的厌氧生长的发酵大肠杆菌株中，甲酸的氧化生成膜电位。

已经报道了编码氢化酶3的基因与那些编码形成储存能量的NADH：醌氧化还原酶(复合物I)核心的亚基的基因之间的序列相似性，并提出了两者之间的进化关系。

在hyc操纵子内具有基因插入突变的株的氢化酶活性有缺陷。

氢化酶3是含有镍的Fe-S蛋白。

hyc操纵子与甲酸脱氢酶H的结构基因受到协同调节。在发酵生长条件下，氧和硝酸抑制表达，甲酸诱导表达。甲酸是甲酸氢解酶复合物基因的专性诱导物。

大肠杆菌K-12含有其他三种氢化酶：氢化酶1和氢化酶2(在H₂摄入中起作用的呼吸酶)和氢化酶4(表征较不完善；可能是沉默的)。

在一些实施方案中，氢化酶3由与选自以下的氢化酶3具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码：大肠杆菌hycB、大肠杆菌hycC、大肠杆菌hycD、大肠杆菌hycE、大肠杆菌hycF和大肠杆菌hycG。在一些实施方案中，编码氢化酶3或甲酸氢解酶复合物的一种或多种核酸分子包含选自以下的氨基酸序列：UniProt ID P0AAK1、UniProt ID P16429、UniProt ID P16430、UniProt ID P16431、UniProt ID P16432和UniProt ID 16433。在一个进一步的实施方案中，编码甲酸氢解酶复合物或甲酸氢解酶亚基的一种或多种核酸分子由选自以下的核酸序列编码：Gene ID948002、Gene ID 945327、Gene ID 948994、Gene ID 947396、Gene ID 947048和Gene ID947191。

甘氨酸裂解系统

甘氨酸裂解系统由四种蛋白质组成：三种酶和一种载体蛋白。在动物中，该系统与线粒体内膜松散结合。这些酶是i)P-蛋白(含有磷酸吡哆醛的蛋白质)或甘氨酸脱氢酶(脱羧)(EC1.4.4.2)，ii)T-蛋白或氨甲基转移酶(EC2.1.2.10)，以及iii)L-蛋白或二氢硫辛酰胺脱氢酶(EC1.8.1.4)。该载体蛋白称为H-蛋白(含有硫辛酸的蛋白质)。

甘氨酸裂解反应催化以下可逆反应：

该系统分为三个部分反应。该反应是完全可逆的，在甘氨酸裂解和甘氨酸合成中，与H-蛋白的硫辛酸结合的氨甲基部分代表一种中间体，通过T-蛋白的作用，该中间体随后降解为亚甲基四氢叶酸(M-THF)和氨，或可以由M-THF和氨形成该中间体。可能地，该反应可能涉及P-蛋白、甘氨酸的氨甲基部分和H-蛋白的三元复合物，将其作为关键中间状态。

P-蛋白催化的反应

甘氨酸降解的第一个部分反应是由P蛋白(甘氨酸脱羧酶)催化的脱羧反应。H-蛋白作为共底物。甘氨酸裂解反应最典型的特性之一是，虽然P-蛋白应该属于一类磷酸吡哆醛依赖性的氨基酸脱羧酶，但P-蛋白需要H-蛋白来显著催化甘氨酸的脱羧。该反应通过顺序随机机制进行，其中甘氨酸的羧基碳转化为二氧化碳。甘氨酸分子的残余部分被转移至巯基基团之一，巯基基团通过还原裂解与H蛋白相连的硫辛酸中的二硫键而形成。

P-蛋白是约200kDa的含有磷酸吡哆醛的蛋白质，是同源二聚体或异源二聚体的二聚体。前者每个亚基具有一分子磷酸吡哆醛，后者在β亚基上每个二聚体具有一分子该辅因子。吡哆醛辅因子连接于特定的赖氨酸残基上。吡哆醛辅因子与活性位点口袋非共价相互作用。T.thermophilus P-蛋白的活性位点通过具有面向溶剂的宽入口的通道连接至分子表面。通道周围的分子表面由几个带正电的氨基酸残基组成，这些氨基酸残基可能涉及与H蛋白形成复合物。

在一些实施方案中，具有甘氨酸脱羧酶活性的酶由与大肠杆菌gcvP具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在一些实施方案中，编码具有甘氨酸脱羧酶活性的酶的一种或多种核酸分子包含UniProt IDP33195中列出的氨基酸序列。在一个进一步的实施方案中，编码具有甘氨酸脱羧酶活性的酶的一种或多种核酸分子由Gene ID 947394中列出的核酸序列编码。

T-蛋白催化的反应

与H-蛋白相连的甘氨酸脱羧部分在T-蛋白(氨甲基转移酶)的催化下进一步降解。该反应需要THF并产生氨、M-THF和具有还原的硫辛酸的H-蛋白。在不存在THF的情况下，产生甲醛而不是M-THF，但反应速率小于在THF存在下测量的反应速率的0.05％。在逆反应中，T-蛋白通过有序的Ter Bi机制催化由M-THF、氨和具有还原的硫辛酸的H-蛋白形成H-蛋白结合的氨甲基硫辛酸中间体，其中H-蛋白是第一个结合的底物，随后是M-THF和氨。产物释放的顺序是THF和装载甲胺的H-蛋白。

T-蛋白是约40kDa的单体，与H-蛋白形成1：1的复合物。一项使用大肠杆菌蛋白的交联研究表明，H-蛋白与T-蛋白的相互作用导致T-蛋白的构象变化。发现了T-蛋白的Lys-288和H-蛋白的Asp-43之间的分子间接触。T-蛋白的N-末端区是与H-蛋白的相互作用和将T-蛋白保持在紧凑的形式所必需的。已分析了游离形式的和与N5-甲基-四氢叶酸(M-THF的类似物)结合的人T-蛋白的晶体结构。整体结构由三个三叶草样的结构组成，在中央腔中THF辅因子与深埋在疏水口袋中的蝶啶环结合，谷氨酰基团指向C-末端侧表面。该结构类似于来自Termotoga naritima、大肠杆菌和Pyrococcus horikoshii OT3的细菌T-蛋白的结构。人T-蛋白的结构和突变分析表明，不变的Asp-101可能通过增加叶酸底物N10原子的亲核特性在催化起始中起关键作用。

已通过交联和定点诱变鉴定了参与叶酸结合的残基。GvcT的N-末端区域对于GvcT的正确构象是重要的，使得能够与H-蛋白相互作用。

在一些实施方案中，具有氨甲基转移酶活性的酶由与大肠杆菌gcvT具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在一些实施方案中，编码具有氨甲基转移酶活性的酶的一种或多种核酸分子包含UniProt IDP27248中列出的氨基酸序列。在一个进一步的实施方案中，编码具有氨甲基转移酶活性的酶的一种或多种核酸分子由Gene ID 947390中列出的核酸序列编码。

L-蛋白催化的反应

甘氨酸裂解反应的最后一步是在L-蛋白的催化下，连接至H-蛋白的还原硫辛酸的再氧化。L-蛋白是公知的二氢硫辛酰胺脱氢酶、硫辛酰胺脱氢酶、二氢硫辛酰基脱氢酶或2-含氧酸(丙酮酸、2-氧代戊二酸和支链2-含氧酸)脱氢酶多酶复合物的E3蛋白组分。其催化电子向最终受体NAD的转移。

使用豌豆L-蛋白和H-蛋白的实验表明，二氢硫辛酰H-蛋白的氧化不受结构相关类似物(如apoH-蛋白或辛酰化H-蛋白)的存在的影响。L-蛋白和H-蛋白之间的结构相互作用对于氧化反应可能不是必需的。

已经研究了该反应的动力学，并提出了改进的乒乓机制。将定点诱变用于鉴定和表征氧化还原活性二硫化物和影响FAD辅因子氧化还原电位的带电残基。FAD辅因子的插入对于二聚化和充分的活性至关重要。

lpd无效突变体在有氧条件下产生更多的丙酮酸和L-谷氨酸。代谢通量分析显示Entner-Doudoroff途径I和乙醛酸旁路被激活。在大肠杆菌lpd突变体中检测到了另一种二氢硫辛酸脱氢酶活性；因此，可能存在同工酶。

大肠杆菌中lpd基因的突变导致丙酮酸脱氢酶复合物对NADH抑制不太敏感，并在厌氧生长期间具有活性。在Glu354处的氨基酸替换降低了该酶对NADH抑制的敏感性，提出其通过限制NADH的移动来发挥作用。

已表明lpd中的抑制子突变使缺乏硫氧还蛋白和谷胱甘肽/谷氧还蛋白还原途径的氧化还原缺陷突变体的生长得以恢复。抑制子突变降低了Lpd活性，导致二氢硫辛酰胺积累，然后二氢硫辛酰胺可以通过还原谷氧还蛋白作为电子供体。Lpd的再氧化使TCA循环的功能恢复。

与专性厌氧微生物相比，在耐氧微生物中lpd显示出不同的密码子适应，导致不同的翻译效率特征。因此预测lpd在氧化应激反应中起作用。已表明lpd缺失突变体特别是对过氧化氢暴露(而不是对其他应激)比野生型更敏感。

在一些实施方案中，具有二氢硫辛酰胺脱氢酶活性的酶由与大肠杆菌lpd(lpdA，E3亚基)具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在一些实施方案中，编码具有二氢硫辛酰胺脱氢酶活性的酶的一种或多种核酸分子包含UniProt ID P0A9P0中列出的氨基酸序列。在一个进一步的实施方案中，编码具有二氢硫辛酰胺脱氢酶活性的酶的一种或多种核酸分子由Gene ID 944854中列出的核酸序列编码。

H-蛋白

H-蛋白是约14kDa的单体热稳定蛋白质。脊椎动物H-蛋白由125个氨基酸残基组成，硫辛酸共价连接至Lys-59。硫辛酰化豌豆叶H-蛋白(131个残基)的X射线晶体结构揭示了硫辛酰赖氨酸位于该蛋白质表面。如上所述，H-蛋白上的硫辛酰赖氨酸臂在甘氨酸裂解系统组分的活性位点之间运送反应中间体和还原当量。该机制类似于在2-含氧酸脱氢酶复合物中发现的机制。

大肠杆菌中的硫辛酸蛋白连接酶A(LplA)催化H-蛋白以及2-含氧酸脱氢酶复合物中酰基转移酶(E2)组分的硫辛酰化(lipoylation)。该酶催化由硫辛酸和ATP形成硫辛酰-AMP以及将硫辛酰-AMP的硫辛酰部分转移至H-蛋白和E2组分。X射线晶体学研究表明，LplA由一个大N-末端结构域和一个小C-末端结构域组成，在两个结构域之间的界面处有一个底物结合口袋。

在哺乳动物中，硫辛酰化是线粒体内事件。硫辛酸首先被硫辛酸激活酶激活为硫辛酰-GMP，使用GTP作为高能化合物。硫辛酸激活酶与已知为异生素代谢中链脂肪酸：辅酶A连接酶III的蛋白质相同。然后通过硫辛酰转移酶的作用，将硫辛酸从硫辛酰-GMP转移至脱辅基蛋白。

H-蛋白是由大肠杆菌中的gcvH基因编码的硫辛酰蛋白，该蛋白在将甘氨酸的甲胺基团从P-蛋白运送至T-蛋白时被还原，并被二氢硫辛酰胺脱氢酶重新氧化。GcvH作为gcv复合物的三种酶的底物发挥作用。

根据残基61-65的保守性及其与豌豆(Pisum sativum)蛋白的硫辛酸附着位点的对应关系，预测这些残基含有硫辛酰修饰(在赖氨酸上)。

已检查了GcvH和GcvT之间的相互作用。这两种蛋白质之间的相互作用可能是形成叶酸结合位点所必需的，其中叶酸聚谷氨酰区结合而暴露蝶啶环。GcvT N-末端对于与GcvH的相互作用很重要，可能是通过介导构象变化，并且GcvH的D43残基与GcvH-GcvT复合物中的GcvT接近。

在一些实施方案中，H-蛋白由与大肠杆菌gcvH具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在一些实施方案中，编码H-蛋白的一种或多种核酸分子包含UniProt ID P0A6T9中列出的氨基酸序列。在一个进一步的实施方案中，编码H-蛋白的一种或多种核酸分子由Gene ID 947393中列出的核酸序列编码。

乙醇酸脱氢酶或乙醇酸氧化酶(EC 1.1.99.14)

本公开描述了可以催化以下反应的酶：

乙醇酸+氧化的电子受体→乙醛酸+还原的电子受体

乙醇酸脱氢酶也可以称为乙醇酸氧化酶、乙醇酸氧化还原酶和乙醇酸：(受体)2-氧化还原酶。

乙醇酸氧化酶催化利用乙醇酸作为唯一碳源的第一步。该酶可以是膜相关的。已分离了来自大肠杆菌ATCC11775(血清型O1：K1：H7)的细胞质膜相关乙醇酸氧化还原酶活性，并且GlcF亚基本身只能在膜部分中检测到。生理电子受体未知。从表达来自多拷贝质粒的glcDEF的大肠杆菌株中提取的粗提取物含有乙醇酸氧化酶活性。glcD、glcE或glcF中的插入突变体消除了这种活性，表明所有三种基因产物都是乙醇酸氧化酶复合物的亚基。以乙醇酸生长诱导glcDEFGB操纵子的表达。

拟南芥中推定的乙醇酸氧化酶是线粒体同源二聚体蛋白，每个单体结合一个FAD，并在叶、茎、花和根中表达。氰化物离子抑制酶活性。其立体特异性地催化D-乳酸氧化为丙酮酸，介导甲基乙二醛和D-乳酸的解毒。

在一些实施方案中，具有乙醇酸脱氢酶活性的酶由与选自以下的具有乙醇酸脱氢酶活性的酶具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码：大肠杆菌乙醇酸脱氢酶GLC和拟南芥乙醇酸脱氢酶。在一些实施方案中，编码乙醇酸脱氢酶或乙醇酸脱氢酶亚基的一种或多种核酸分子包含选自以下的氨基酸序列：UniProt ID P0AEP9、UniProt ID P52073、UniProt ID P52074和UniProt IDQ94AX4。在一个进一步的实施方案中，编码乙醇酸脱氢酶或乙醇酸脱氢酶亚基的一种或多种核酸分子由选自以下的核酸序列编码：Gene ID 947353、Gene ID 2847718、Gene ID2847717和GenBank登录号Y13245.1。

丙氨酸-乙醛酸转氨酶(EC 2.6.1.44)

本公开描述了可以催化以下反应的酶：

在酿酒酵母中，丙氨酸-乙醛酸转氨酶亚基是用于甘氨酸合成的三种不同的酶之一。通过比较敲除株中的酶比活性，鉴定了编码该酶的AGX1基因。当置于缺乏其他负责甘氨酸合成的酶的背景中时，AGX1中的突变产生了完全的甘氨酸营养缺陷。随后纯化和表征了该酶。该酶含有吡哆醛5'-磷酸作为辅因子，是约80kDa的同源二聚体，对L-丙氨酸和乙醛酸具有高度特异性。

线粒体定位的人丙氨酸-乙醛酸转氨酶2(AGXT2)和过氧化物酶体丝氨酸-丙酮酸转氨酶(AGXT1，见上文)均使用丙氨酸作为氨基供体催化乙醛酸转化为甘氨酸。然而，AGXT2也可以利用不对称二甲基精氨酸(ADMA)作为氨基供体，导致形成α-酮-δ-(NN-二甲基胍基)戊酸(DMGV)，而AGXT1不可以。ADMA是一氧化氮(NO)合酶的有效内源性抑制剂。ADMA水平也受细胞溶质二甲基精氨酸二甲氨基水解酶(DDAH)的控制，DDAH将ADMA水解为瓜氨酸和二甲胺。ADMA水平升高与糖尿病、高血压、充血性心力衰竭和动脉粥样硬化有关。AGXT2是磷酸吡哆醛依赖性酶，主要在肾脏中表达，其活性是肾脏调节血压的一种机制。

在拟南芥中，已鉴定出具有四种转氨酶活性的丙氨酸转氨酶。AOAT1(GGAT1)位于过氧化物酶体。敲除植物具有降低的AOAT、GPAT(谷氨酸：丙酮酸转氨酶)、AGAT(丙氨酸：乙醛酸转氨酶)和GGAT(谷氨酸：乙醛酸转氨酶)活性。GGAT和AGAT活性的减少幅度最大。这表明AOAT1主要参与光呼吸。类似地，预测位于过氧化物酶体中的AOAT2(GGAT2)可能参与光呼吸。重组蛋白体外测定表明，GGAT1和GGAT2具有四种转氨酶活性，即GGAT、AGAT、GPAT和AOAT。这两种重组蛋白对氨基酸底物谷氨酸和丙氨酸以及含氧酸底物乙醛酸、丙酮酸和2-氧代戊二酸表现出非常相似的Km值。

在一些实施方案中，具有丙氨酸-乙醛酸转氨酶活性的酶由与选自以下的具有丙氨酸-乙醛酸转氨酶活性的酶具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码：酿酒酵母AGX1、人AGXT2、拟南芥AOAT1和拟南芥AOAT2。在一些实施方案中，编码具有丙氨酸-乙醛酸转氨酶活性的酶的一种或多种核酸分子包含选自以下的氨基酸序列：UniProt ID P43567、UniProt ID Q9BYV1、UniProt IDQ9LR30和UniProt ID Q9S7E9。在一个进一步的实施方案中，编码具有丙氨酸-乙醛酸转氨酶活性的酶的一种或多种核酸分子由选自以下的核酸序列编码：Gene ID 850514、Gene ID64902、TAIR登录号AT1G23310和TAIR登录号AT1G70580。

丙氨酸转氨酶(EC 2.6.1.2)

本公开描述了可以催化以下反应的酶：

在一些实施方案中，丙氨酸转氨酶是谷氨酸-丙酮酸转氨酶。AlaA是大肠杆菌中三种主要的丙氨酸合成转氨酶之一。AlaA和AlaC占细胞中90％的谷氨酸-丙酮酸转氨酶(GPT)活性。已以

的分辨率解析了AlaA的晶体结构。该结构显示了典型的折叠I型转氨酶的对称α2同源二聚体。alaA缺失株不具有生长缺陷，但alaA avtA双突变体在琼脂平板上形成小菌落。alaA avtA alaC三突变体具有在液体介质中生长缓慢的表型。可以通过加入丙氨酸来挽救双突变体和三突变体的缺陷。在不同的生长条件下进行了适应性和竞争性生长实验。特别是在限氧条件下，与在丰富介质中的生长相比，ΔalaA株在基本介质中的倍增时间增加。在竞争性生长条件下，即使在丰富介质中，ΔalaA突变与野生型相比也具有劣势。alaA在对减少应激的致命影响的基因的筛选中被鉴定。alaA插入突变体比野生型对丝裂霉素C和其他应激更敏感，对10％SDS更不敏感。alaA基因最初被鉴定为对丙氨酸或缬氨酸具有渗漏型需求的突变体。

AlaB是大肠杆菌中三种主要的丙氨酸合成转氨酶之一。AlaB催化谷氨酸-丙酮酸转氨酶反应，以谷氨酸作为氨基供体，由丙酮酸生成丙氨酸。已在粗细胞提取物中测定了该活性，并已在质粒上分离出了编码AlaB的基因。从多拷贝质粒表达alaB部分抑制了ilvEalaA突变株的生长缺陷。

AlaC是大肠杆菌中三种主要的丙氨酸合成转氨酶之一。已生成基于AlaA晶体结构的该酶的同源模型。alaC缺失株不具有生长缺陷，但alaA avtA alaC三突变体具有在液体介质中生长缓慢的表型。加入丙氨酸可以挽救该缺陷。在不同的生长条件下进行了适应性和竞争性生长实验。特别是在限氧条件下，与在丰富介质中的生长相比，ΔalaC株在基本介质中的倍增时间增加；与alaA和avtA突变体不同，加入L-丙氨酸使倍增时间恢复至在DMEM介质中观察到的倍增时间。在竞争性生长条件下，即使在丰富介质中，ΔalaC突变与野生型相比也具有劣势。转录调节因子SgrR激活alaC的表达。因此，AlaC可能在葡萄糖-磷酸应激中发挥作用。然而，alaC缺失突变体未显示出对诱导糖-磷酸应激的α-甲基葡萄糖苷的敏感性改变。

在人中，丙氨酸转氨酶是细胞质酶，其催化L-丙氨酸和2-氧代戊二酸之间的可逆转氨作用以形成丙酮酸和L-谷氨酸。这四种主要代谢中间体的相互转化赋予该酶降解和生物合成的双重作用。该酶参与骨骼肌和肝脏的丙氨酸-葡萄糖循环、糖异生和大脑中的谷氨酸生成。丙氨酸转氨酶在肾脏、骨骼肌、脂肪组织和心脏中表达。该酶有两种同工型：丙氨酸转氨酶1(GPT)和丙氨酸转氨酶2(GPT2)。从肝脏中纯化了人丙氨酸转氨酶1(GPT)。来自脂肪组织的重组人丙氨酸转氨酶2(GPT2)在大肠杆菌中表达，通过SDS-PAGE测定了分子量。该酶在脂肪组织、肌肉、大脑和肾脏中的表达水平较高，而在乳房和肝脏中的表达水平较低。

尚未报道来自海洋多毛类环节动物Arenicola marina(沙躅，lugworm)的丙氨酸转氨酶的亚基结构。通过凝胶过滤色谱法确定其天然表观分子量为91kDa。尚未鉴定在该生物体中编码其的基因。在海洋环节动物和软体动物中，该反应参与在缺氧(hypoxia)或缺氧症(anoxia)期间运作的厌氧能量生成途径。已从体壁肌肉中部分纯化并表征了来自该生物体的丙氨酸转氨酶(谷氨酸丙酮酸转氨酶)。在该组织中发现了高丙氨酸转氨酶活性。也已在贻贝(Mytilus edulis)组织中证实了特定的、可逆的、L-谷氨酸依赖性的L-丙氨酸转氨酶和L-天冬氨酸转氨酶活性。

拟南芥色氨酸转氨酶TAA1蛋白参与吲哚-3-丙酮酸的形成，吲哚-3-丙酮酸是吲哚-3-乙酸(IAA)的前体，IAA是生物学上重要的生长素，在许多植物物种中发挥植物激素作用。体外测定揭示了该吡哆醛5'-磷酸(PLP)依赖性转氨酶可以作用于多种不同的L-氨基酸，包括L-苯丙氨酸、L-酪氨酸、L-亮氨酸、L-丙氨酸、L-甲硫氨酸和L-谷氨酰胺，使用丙酮酸或2-氧代戊二酸作为共底物。然而，酶测定、计算机对接实验和突变体表型分析都表明L-色氨酸是该酶的体内底物。当用L-色氨酸和丙酮酸测试时，TAA1具有Km为0.29mM，Vmax为12.9μM/min。不清楚丙酮酸或2-氧代戊二酸哪一个是该酶的生物学上更相关的共底物。

在避荫(shade avoidance)突变体和具有弱乙烯不敏感性的突变体的筛选中鉴定了编码该蛋白质的基因，表明通过TAA1介导的途径合成的生长素对于对特定环境和激素刺激的反应特别重要。此外，当在拟南芥属植物中敲除TAA1和其一个或多个密切相关的家族成员(即TAR1和TAR2)时，需要适当生长素水平的正常发育过程(如胚胎发生)受到破坏。基于分布在16个科的30个不同物种的酶提取物在转氨酶反应中催化IPA形成的能力，该酶活性表现为广泛分布于植物界。三种藻类物种也具有该活性。

也已描述了来自Candida maltosa、丙酸梭菌(Clostridium propionicum)、Pyrococcus furiosus、Megathyrsus maximus和黍(Panicum miliaceum)的丙氨酸转氨酶活性。从NAD-ME型C4植物黍中克隆了推定的丙氨酸转氨酶，发现该酶在叶肉和束鞘细胞中均表达，并且该基因表达是光诱导的。在两种细胞类型的绿化过程中，mRNA积累大幅增加，这与该酶在C4光合作用中的预测作用一致。

在一些实施方案中，具有丙氨酸转氨酶活性的酶由与选自以下的具有丙氨酸转氨酶活性的酶具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码：大肠杆菌谷氨酸-丙酮酸转氨酶alaA、大肠杆菌谷氨酸-丙酮酸转氨酶alaB、大肠杆菌谷氨酸-丙酮酸转氨酶alaC、人丙氨酸转氨酶1(GPT)、人丙氨酸转氨酶2(GPT2)、Arenicola marina丙氨酸转氨酶、拟南芥色氨酸转氨酶TAA1、拟南芥AOAT1、拟南芥AOAT2、Candida maltosa丙氨酸转氨酶、丙酸梭菌丙氨酸转氨酶、Pyrococcus furiosus丙氨酸转氨酶aat、Megathyrsus maximus丙氨酸转氨酶和黍丙氨酸转氨酶AlaAT-2。在一些实施方案中，编码具有丙氨酸转氨酶活性的酶的一种或多种核酸分子包含选自以下的氨基酸序列：UniProt ID P0A959、UniProt ID P77434、UniProt ID P24298、UniProt ID Q8TD30、UniProt ID Q9S7N2、UniProt ID Q9LR30、UniProt ID Q9S7E9、UniProt ID Q9P9M8和UniProt ID P34106。在一个进一步的实施方案中，编码具有丙氨酸转氨酶活性的酶的一种或多种核酸分子由选自以下的核酸序列编码：Gene ID 946772、Gene ID 946850、Gene ID2875、Gene ID 84706、Gene ID 843393、TAIR登录号AT1G23310、TAIR登录号AT1G70580、GenBank登录号AF163769.1和GenBank登录号X69421.1。

谷氨酸脱氢酶(EC 1.4.1.2和EC 1.4.1.3)

本公开描述了可以催化以下反应的酶：

在一些实施方案中，谷氨酸脱氢酶是来自酿酒酵母的NAD依赖性谷氨酸脱氢酶(GDH2)，其将谷氨酸降解为氨和α-酮戊二酸。GDH2的表达对氮分解代谢物的抑制和细胞内氨水平敏感。

拟南芥中有两个NAD依赖性谷氨酸脱氢酶(GDH)基因GDH1和GDH2，分别编码α和β亚基。已检测到GDH的七种六聚体同种型，其由不同比例的α和β亚基组成。在不同的环境和生理条件下，不同的同种型分布在不同的组织中。GDH的酶活性部分在转录水平上部分受控制。

来自不解糖嗜胨菌(Peptoniphilus asaccharolyticus)的谷氨酸脱氢酶催化L-谷氨酸NAD依赖性氧化脱氨基为2-氧代戊二酸。该反应具有高度的底物特异性。在存在D-谷氨酸、D-或L-天冬氨酸、谷氨酰胺或当NADP替换NAD时未观察到活性。使用蔗糖梯度密度离心，研究人员估计该天然酶的分子量在300-340kDa之间，表明该酶可能是同源六聚体。另一方面，其他研究人员使用凝胶过滤估计该天然酶的分子量约为226kDa。对L-谷氨酸和NAD+的K_M值分别为1.3mM和0.25mM。

Halobacterium salinarum是据报道具有多于一种GDH形式的生物体之一，不同形式的GDH利用不同的辅因子(NAD和NADP)。最终表明该生物体具有编码四种不同谷氨酸脱氢酶的四个基因。已纯化和生化表征了这些基因产物中的两个。最初预测其中一个基因gdhA1编码一种NADP特异性形式，但发现其编码一种NAD特异性酶。

人谷氨酸脱氢酶(GDH)是同源六聚体线粒体基质酶，其催化L-谷氨酸可逆氧化脱氨基为2-氧代戊二酸和氨。哺乳动物GDH是不寻常的酶，因为其能够使用NAD或NADP作为辅因子。人表达两种GDH同工酶。谷氨酸脱氢酶1(GLUD1)在肝脏、大脑、胰腺和肾脏中高水平表达。谷氨酸脱氢酶2(GLUD2)由X染色体连锁的无内含子基因编码，在视网膜、睾丸和大脑中表达。导致酶活性过度的GLUD1突变导致高胰岛素血症。已经广泛研究了正效应子(如ADP和L-亮氨酸)和负效应子(如GTP)对哺乳动物GDH活性的变构控制。

枯草芽孢杆菌PCI 219具有单一的谷氨酸脱氢酶(GDH)，该酶对NAD(H)和NADP(H)具有双重辅酶特异性。通过凝胶过滤估计其分子量为250,000+/-20,000，通过蔗糖密度梯度区域离心估计为270,000+/-30,000。亚基大小约为57,000，表明其是同源四聚体。

从番茄(Solanum lycopersicum)组织中分离出了cDNA克隆。该cDNA编码的蛋白质与植物的谷氨酸脱氢酶(GDH)具有相同的特性。该蛋白的表达分析表明其在茎、根和叶中表达，但在果实组织中不存在。该研究还表明，番茄GDH1的两个亚基由单个基因编码。该酶将2-氧代戊二酸转化为L-谷氨酸。

也描述了来自丙酸梭菌和海栖热袍菌的谷氨酸脱氢酶活性。

在一些实施方案中，具有谷氨酸脱氢酶活性的酶由与选自以下的谷氨酸脱氢酶具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码：酿酒酵母NAD依赖性谷氨酸脱氢酶GDH2、拟南芥NAD依赖性谷氨酸脱氢酶GDH2、拟南芥NAD依赖性谷氨酸脱氢酶GDH1、不解糖嗜胨菌NAD依赖性谷氨酸脱氢酶gdhA、Halobacterium salinarum NAD依赖性谷氨酸脱氢酶gdhA、海栖热袍菌谷氨酸脱氢酶、人谷氨酸脱氢酶1(GLUD1)、人谷氨酸脱氢酶2(GLUD2)、枯草芽孢杆菌谷氨酸脱氢酶和番茄谷氨酸脱氢酶GDH1。在一些实施方案中，编码具有谷氨酸脱氢酶活性的酶的一种或多种核酸分子包含选自以下的氨基酸序列：UniProt ID P33327、UniProt ID Q38946、UniProt IDQ38946、UniProt ID P28997、UniProt ID P29051、UniProt ID P00367、UniProt IDP49448和UniProt ID P93541。在一个进一步的实施方案中，编码具有谷氨酸脱氢酶活性的酶的一种或多种核酸分子由选自以下的核酸序列编码：Gene ID 461927、TAIR登录号AT5G07440、TAIR登录号AT5G18170、GenBank登录号M76403.1、GenBank登录号X63837.1、Gene ID 2746、Gene ID 2747和GenBank登录号U48695.1。

乙醛脱氢酶(EC 1.2.1.10)

本公开描述了可以催化以下反应的酶：

大肠杆菌mhpF编码酰化乙醛脱氢酶。MhpF作为单体具有活性；反应的限速步骤表现为转硫酯化。MhpF参与β-氧化途径的工程化逆转中正丁醇的合成。MhpE的表达在翻译上与MhpF偶联，这两种蛋白质之间的相互作用表现为MhpE溶解所必需的。

大肠杆菌AdhE是同聚蛋白，具有三种Fe²+依赖性催化功能：醇脱氢酶、辅酶A依赖性乙醛脱氢酶和丙酮酸甲酸裂解酶失活酶。然而，AdhE是否存在丙酮酸甲酸裂解酶失活酶活性一直有争议。AdhE的同聚结构的不寻常之处在于，20-60个亚基呈螺旋状排列以形成棒状超微结构。在发酵条件下，AdhE催化乙酰辅酶A还原为乙醛，并将乙醛化合物还原为乙醇。有氧地，在相反的方向上，AdhE可以催化乙醛氧化为乙酰辅酶A。adhE的表达表现为在转录和翻译水平上受到调节，并且可能在翻译后水平上受到调节。adhE的表达在厌氧生长期间比在有氧生长期间高约10倍。在早期工作中部分纯化和表征了来自大肠杆菌B的AdhE。后来从大肠杆菌B中将其纯化至同质，并对其连接辅酶A的醛脱氢酶活性进行了详细的动力学分析。提出了双-单-单-单乒乓机制(bi-uni-uni-uni ping-pong mechanism)。来自肠道沙门氏菌(Salmonella enterica)enterica serovar Typhimurium亚种的AdhE与大肠杆菌AdhE显示出70％氨基酸序列同一性。与大肠杆菌酶相比，该酶对醇底物具有较低的Km，并且具有一些底物特异性的差异。在代谢工程领域，adhE的缺失是生产化合物如琥珀酸、D-乳酸和聚羟基链烷酸的决定因素。

莱茵衣藻(Chlamydomonas reinhardtii)ADH1编码双功能乙醇脱氢酶/乙醛脱氢酶。其在缺氧条件下表现活跃，并参与衣藻中两种不同的厌氧乙醇生产途径。

DmpF是来自假单胞菌属物种的酰化乙醛脱氢酶。在假单胞菌属物种CF600中，间位裂解(meta-cleavage)途径的最后两个步骤涉及通过酶4-羟基-2-氧代戊酸醛缩酶和乙醛脱氢酶(酰化)将(S)-4-羟基-2-氧代戊酸转化为丙酮酸和乙酰辅酶A。生化研究表明，这两种酶包含双功能醛缩酶-脱氢酶异二聚体，并表明醛缩酶反应的产物乙醛通过通道机制(channeling mechanism)转移至脱氢酶活性位点。这将有毒的乙醛对细胞造成的风险最小化。

质粒构建体的蛋白质表达模式表明，在恶臭假单胞菌F1中存在todI基因产物。todI基因产物的预测氨基酸序列显示出与其他细菌酰化醛脱氢酶基因产物非常高的同一性。

丙酮丁醇梭菌ATCC 824的adhE基因编码具有乙醇脱氢酶和乙醛脱氢酶活性的多功能酶。在溶剂生成过程中，这两种活性对于正丁醇和乙醇的形成都是必要的。adhE基因是sol操纵子的一部分，位于pSOL1巨大质粒上。在丙酮丁醇梭菌ATCC 824中从质粒表达该基因导致NADH依赖性丁醇脱氢酶、NAD依赖性乙醛脱氢酶和丁醛脱氢酶的活性升高，以及NADH依赖性乙醇脱氢酶的活性小幅增加。用adhE基因补充缺乏丁醛脱氢酶、乙酰乙酸脱羧酶和乙酰乙酰辅酶A：乙酸/丁酸：辅酶A转移酶活性的突变体(其既不产生丁醇也不产生丙酮)，导致恢复丁醇的形成，而没有任何丙酮形成或任何乙醇产量的显著增加，表明该酶的主要作用是形成丁醇，提供丁醛脱氢酶活性(将丁酰辅酶A转化为正丁醛)和丁醇脱氢酶活性。此外，该基因的失活大幅降低丁醇的产量(85％)，支持了这一作用。来自pSOL1质粒的另一个基因adhE2编码第二个参与丁醇生产的多功能醛/醇脱氢酶。然而，该酶仅在产醇条件下产生，在产溶剂条件下不表达。来自株ATCC 824的基因最初称为aad。

还描述了来自肠系膜明串珠菌(Leuconostoc mesenteroides)、Pelobacteracetylenicus和恶臭假单胞菌的乙醛脱氢酶活性。部分纯化的肠系膜明串珠菌辅酶A依赖性醛脱氢酶无法与与其共纯化的连接NAD的醇脱氢酶分离。该酶对NAD具有特异性，不能使用NADP。虽然乙醛和1-丙醛是最好的底物，该酶也可以使用正丁醛(与乙醛的活性的31％)和异丁醛(14％)。

在一些实施方案中，具有乙醛脱氢酶活性的酶由与选自以下的具有乙醛脱氢酶活性的酶具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码：大肠杆菌mhpF、大肠杆菌AdhE、莱因衣藻ADH1、肠系膜明串珠菌辅酶A依赖性乙醛脱氢酶、Pelobacter acetylenicus乙醛脱氢酶、假单胞菌属物种dmpF、恶臭假单胞菌酰化乙醛脱氢酶todl、恶臭假单胞菌乙醛脱氢酶cmtH和丙酮丁醇梭菌醇/醛脱氢酶AdhE。在一些实施方案中，编码具有乙醛脱氢酶活性的酶的一种或多种核酸分子包含选自以下的氨基酸序列：UniProt ID P77580、UniProt P0A9Q7、UniProt ID A8JI07、UniProt IDQ52060、UniProt ID Q51949和UniProt ID P33744。在一个进一步的实施方案中，编码具有乙醛脱氢酶活性的酶的一种或多种核酸分子由选自以下的核酸序列编码：Gene ID945008、Gene ID 945837、Gene ID 5729132、GenBank登录号X60835.1、GenBank登录号U09250.1和Gene ID 1116167。

乙醇胺解氨酶(EC 4.3.1.7)

本公开描述了可以催化以下反应的酶：

乙醇胺解氨酶(EAL)允许大肠杆菌在外部维生素B12存在的情况下利用乙醇胺作为唯一氮源和唯一碳源。EAL是腺苷钴胺素依赖性酶，其被其底物自发失活，并可以被EutA重新激活。最初在非K-12株NCIB 8114中研究了该酶。已解析了N-末端截短但具有活性形式的、与辅因子和底物在二元和三元复合物中的该酶的晶体结构。该酶由(αβ)2二聚体的六聚体组成，α亚基保持着活性位点，钴胺素辅因子结合在α和β亚基之间的界面上。作者提出了与前述的腺苷钴胺素依赖性重排机制一致的反应机制。已在晶体结构的基础上对该反应的立体化学过程建模，对该酶明显缺乏立体特异性作出了解释。分解代谢物抑制EAL的产生，乙醇胺和腺苷钴胺素辅因子同时存在诱导EAL的产生。乙醇胺解氨酶包含两个亚基α(EutB)和β(EutC)。

在一些实施方案中，具有乙醇胺解氨酶活性的酶由与具有乙醇胺解氨酶活性的大肠杆菌酶具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在一些实施方案中，编码乙醇胺解氨酶亚基的一种或多种核酸分子包含选自UniProt ID P0AEJ6和UniProt ID P19636的氨基酸序列。在一个进一步的实施方案中，编码乙醇胺解氨酶亚基的一种或多种核酸分子由选自Gene ID 946924和Gene ID946925的核酸序列编码。

丝氨酸氨基酶(EC 2.6.1.-)

本公开描述了可以催化以下反应的酶：

L-丝氨酸+NH4⁺→(S)-2,3-二氨基丙酸

在一些实施方案中，具有丝氨酸氨基酶活性的酶可以是丝氨酸-乙醛酸转氨酶。在其他实施方案中，具有丝氨酸氨基酶活性的酶可以是丝氨酸-丙酮酸转氨酶(见上文)。

丝氨酸-乙醛酸转氨酶催化L-丝氨酸的α-氨基转移至乙醛酸，形成甘氨酸和羟基丙酮酸。在丝氨酸循环甲基营养生物中，该酶发挥两个重要作用：形成一碳单元的受体(甘氨酸)，以及在同化途径中将L-丝氨酸转化为羟基丙酮酸。这是第一个纯化的微生物丝氨酸-乙醛酸转氨酶，几年后也鉴定出了编码该酶的基因。

拟南芥AGT1编码的丝氨酸：乙醛酸转氨酶是同源二聚体。纯化的重组蛋白丝氨酸：乙醛酸转氨基的活性最高。该酶还催化比活性低得多的丙氨酸：乙醛酸转氨基和丝氨酸：丙酮酸转氨基。

推测sgaA是编码扭脱甲基杆菌(Methylobacterium extorquens)染色体上丝氨酸-乙醛酸转氨酶的基因。虽然尚未表达该克隆基因的产物，但使用了突变互补来研究其作用。该基因中的突变消除了以C1化合物生长的能力，并且向突变体补充该基因片段的克隆完整版本使活性恢复。此外，sgaA序列与许多转氨酶相似。

在进一步的实施方案中，具有丝氨酸氨基酶活性的酶可以是具有磷酸丝氨酸转氨酶活性的酶。在一些实施方案中，编码磷酸丝氨酸转氨酶的一种或多种核酸分子是serC，或其同源物。在另一个实施方案中，编码具有磷酸丝氨酸转氨酶活性的酶、具有L-丝氨酸转氨酶活性的酶或具有丝氨酸转氨酶活性的酶的一种或多种核酸分子包含SEQ ID NO：230中列出的氨基酸序列。在一个进一步的实施方案中，编码具有磷酸丝氨酸转氨酶活性的酶、具有L-丝氨酸转氨酶活性的酶或具有丝氨酸转氨酶活性的酶的一种或多种核酸分子由SEQ IDNO：229中列出的核酸序列编码。在一些实施方案中，具有磷酸丝氨酸转氨酶活性的酶是人PSAT1，或其同源物。在一个实施方案中，编码具有磷酸丝氨酸转氨酶活性的酶的一种或多种核酸分子包含UniProt ID Q9Y617中列出的氨基酸序列。在另一个实施方案中，编码具有磷酸丝氨酸转氨酶活性的酶的一种或多种核酸分子由Gene ID 29968中列出的核酸序列编码。

在一些实施方案中，具有丝氨酸转氨酶活性的酶由与以下的酶具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码：拟南芥丝氨酸-乙醛酸转氨酶AGT1、Hyphomicrobium methylovorum GM2丝氨酸-乙醛酸转氨酶sgaA和扭脱甲基杆菌sgaA。在一些实施方案中，编码具有丝氨酸-乙醛酸转氨酶活性的酶的一种或多种核酸分子包含选自UniProt ID Q56YA5和UniProt ID O08374的氨基酸序列。在一个进一步的实施方案中，编码具有丝氨酸-乙醛酸转氨酶活性的酶的一种或多种核酸分子由选自以下的核酸序列编码：TAIR登录号AT2G13360、GenBank登录号D86125.1和GenBank登录号L27235.1。

在一些实施方案中，具有丝氨酸转氨酶活性的酶是具有丝氨酸-丙酮酸转氨酶活性的酶。在一些实施方案中，具有丝氨酸-丙酮酸转氨酶活性的酶由与人AGXT1具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在一些实施方案中，具有丝氨酸-丙酮酸转氨酶活性的酶是人AGXT1。在一些实施方案中，编码具有丝氨酸-丙酮酸转氨酶活性的酶的一种或多种核酸分子是AGXT1，或其同源物。在一些实施方案中，编码具有丝氨酸-丙酮酸转氨酶活性的酶的一种或多种核酸分子包含SEQ ID NO：244中列出的氨基酸序列。在一个进一步的实施方案中，编码具有丝氨酸-丙酮酸转氨酶活性的酶的一种或多种核酸分子由SEQ ID NO：243中列出的核酸序列编码。

在一些实施方案中，具有丝氨酸转氨酶活性的酶是具有丙氨酸-乙醛酸转氨酶活性的酶。在一些实施方案中，具有丙氨酸-乙醛酸转氨酶活性的酶由与选自以下的具有丙氨酸-乙醛酸转氨酶活性的酶具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码：酿酒酵母AGX1、人AGXT2、拟南芥AOAT1和拟南芥AOAT2。在一些实施方案中，编码具有丙氨酸-乙醛酸转氨酶活性的酶的一种或多种核酸分子包含选自以下的氨基酸序列：UniProt ID P43567、UniProt ID Q9BYV1、UniProt IDQ9LR30和UniProt ID Q9S7E9。在一个进一步的实施方案中，编码具有丙氨酸-乙醛酸转氨酶活性的酶的一种或多种核酸分子由选自以下的核酸序列编码：Gene ID 850514、Gene ID64902、TAIR登录号AT1G23310和TAIR登录号AT1G70580。

在一些实施方案中，具有丝氨酸转氨酶活性的酶是具有丙氨酸转氨酶活性的酶。在一些实施方案中，具有丙氨酸转氨酶活性的酶由与选自以下的具有丙氨酸转氨酶活性的酶具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码：大肠杆菌谷氨酸-丙酮酸转氨酶alaA、大肠杆菌谷氨酸-丙酮酸转氨酶alaB、大肠杆菌谷氨酸-丙酮酸转氨酶alaC、人丙氨酸转氨酶1(GPT)、人丙氨酸转氨酶2(GPT2)、Arenicola marina丙氨酸转氨酶、拟南芥色氨酸转氨酶TAA1、拟南芥AOAT1、拟南芥AOAT2、Candida maltosa丙氨酸转氨酶、丙酸梭菌丙氨酸转氨酶、Pyrococcus furiosus丙氨酸转氨酶aat、Megathyrsus maximus丙氨酸转氨酶和黍丙氨酸转氨酶AlaAT-2。在一些实施方案中，编码具有丙氨酸转氨酶活性的酶的一种或多种核酸分子包含选自以下的氨基酸序列：UniProt ID P0A959、UniProt ID P77434、UniProt ID P24298、UniProt ID Q8TD30、UniProt ID Q9S7N2、UniProt ID Q9LR30、UniProt ID Q9S7E9、UniProt ID Q9P9M8和UniProt ID P34106。在一个进一步的实施方案中，编码具有丙氨酸转氨酶活性的酶的一种或多种核酸分子由选自以下的核酸序列编码：Gene ID 946772、Gene ID 946850、Gene ID2875、Gene ID 84706、Gene ID 843393、TAIR登录号AT1G23310、TAIR登录号AT1G70580、GenBank登录号AF163769.1和GenBank登录号X69421.1。

二氨基丁酸脱羧酶(EC 4.1.1.86)

本公开描述了可以催化以下反应的酶：

该酶类的系统名称是L-2,4-二氨基丁酸羧基裂解酶(形成丙-1,3-二胺)。二氨基丁酸脱羧酶也可以称为DABA DC、L-2,4-二氨基丁酸脱羧酶、L-2,4-二氨基丁酸羧基裂解酶。

在一些实施方案中，编码L-2,4-二氨基丁酸脱羧酶的基因是苜蓿中华根瘤菌(Sinorhizobium meliloti)Rm2011的rhbB基因。rhbB基因与鲍曼不动杆菌(Acinetobacterbaumannii)的ddc基因同源，ddc参与该生物体生产丙-1,3-二胺。因此，提出这些基因分别编码二氨基丁酸--2-氧代戊二酸转氨酶和L-2,4-二氨基丁酸脱羧酶。

在一些实施方案中，二氨基丁酸脱羧酶是L-2,4-二氨基丁酸脱羧酶。在一些实施方案中，L-2,4-二氨基丁酸脱羧酶由与苜蓿中华根瘤菌Rm2011 rhbB具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在一些实施方案中，L-2,4-二氨基丁酸脱羧酶是苜蓿中华根瘤菌Rm2011rhbB。

在一些实施方案中，编码L-2,4-二氨基丁酸脱羧酶的一种或多种核酸分子是rhbB，或其同源物。在一些实施方案中，编码L-2,4-二氨基丁酸脱羧酶的一种或多种核酸分子包含UniProt ID Q9Z3R2中列出的氨基酸序列。在一个进一步的实施方案中，编码L-2,4-二氨基丁酸脱羧酶的一种或多种核酸分子由Gene ID 1236295中列出的核酸序列编码。

鸟氨酸脱羧酶(EC 4.1.1.17)

本公开描述了可以催化以下反应的酶：

该酶类的系统名称是L-鸟氨酸羧基裂解酶(形成腐胺)。鸟氨酸脱羧酶也可以称为SpeC和L-鸟氨酸羧基裂解酶。大肠杆菌编码两种鸟氨酸脱羧酶，生物合成(组成型)SpeC和降解(诱导型)SpeF。鸟苷核苷酸GTP、GDP、pppGpp和ppGpp激活SpeF。当细胞在pH 5.2生长时，从含有speF的质粒中过量产生SpeF，但在pH 7时则不然。来自质粒的RNase III的过表达增加speF启动子的表达，可能是通过5'UTR的加工。

当可以获得鸟氨酸时，大肠杆菌能够通过两种途径合成腐胺。一种途径通过鸟氨酸脱羧酶催化的反应直接由鸟氨酸产生腐胺。另一种途径涉及使用精氨酸的两个反应。此外，大肠杆菌具有两种形式的鸟氨酸脱羧酶，一种明显存在于所有株中的生物合成(或组成型)形式，以及存在于某些大肠杆菌株中的生物降解(或诱导型)形式。已在大肠杆菌K-12中表征了这两类鸟氨酸脱羧酶。低pH和生长介质中存在的鸟氨酸诱导生物降解鸟氨酸脱羧酶。生物合成鸟氨酸脱羧酶的活性受许多正和负效应子的调节。正效应子包括核苷酸，GTP更有效地激活鸟氨酸脱羧酶，而ppGpp作为鸟氨酸脱羧酶的负效应子反应。ppGpp的积累导致稳定的RNA合成停止，表现为与蛋白质合成的保真度有关。

据报道，名为抗酶(antizyme)的蛋白质抑制剂使鸟氨酸脱羧酶的调节发生，该抑制剂与鸟氨酸脱羧酶结合并非竞争性地抑制其活性。多胺诱导抗酶。克隆了编码大肠杆菌抗酶的基因，并鉴定为双功能抗酶/转录调节因子。然而，另一出版物得出的结论是大肠杆菌抗酶不是哺乳动物抗酶基因的直接对应物。后来将大肠杆菌atoC基因的产物(见AtoC转录激活因子；ODC的Az蛋白抑制剂)鉴定为双功能蛋白，其具有抗酶活性(多胺生物合成酶的翻译后抑制)和作为参与短链脂肪酸分解代谢基因的转录调节因子的活性。多胺激活了atoC的转录。AtoC与感觉性组氨酸激酶AtoS是双组分信号转导系统的一部分。尽管AtoS催化的AtoC磷酸化对于用于短链脂肪酸分解代谢的atoDAEB操纵子的转录激活至关重要，但尚不清楚抗酶的磷酸化是否在鸟氨酸脱羧酶的调节中起作用。

在一些实施方案中，编码鸟氨酸脱羧酶的基因是大肠杆菌的speC和speF基因。在一些实施方案中，鸟氨酸脱羧酶是L-鸟氨酸脱羧酶。在一些实施方案中，鸟氨酸脱羧酶由与大肠杆菌speC或speF具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在一些实施方案中，鸟氨酸脱羧酶是大肠杆菌speC或speF。

在一些实施方案中，编码鸟氨酸脱羧酶的一种或多种核酸分子是speC，或其同源物。在一些实施方案中，编码鸟氨酸脱羧酶的一种或多种核酸分子是speF，或其同源物。在一些实施方案中，编码鸟氨酸脱羧酶的一种或多种核酸分子包含选自UniProt ID P21169和UniProt ID P24169的氨基酸序列。在一个进一步的实施方案中，编码鸟氨酸脱羧酶的一种或多种核酸分子由选自Gene ID 947457和Gene ID 945297的核酸序列编码。

2,3-二氨基丙酸解氨酶(EC 4.3.1.15)

本公开描述了可以催化以下反应的酶：

2,3-二氨基丙酸解氨酶不是立体特异性的，其催化2,3-二氨基丙酸的D和L立体异构体的α,β-消除。该酶也表现出对D-丝氨酸的弱活性，对L-丝氨酸、D-β-Cl-丙氨酸或L-β-Cl-丙氨酸没有活性。

该酶是同源二聚体，含有一个吡哆醛5'-磷酸辅基，属于含PLP的酶的折叠II型家族。已解析了脱辅基酶和全酶以及与反应中间体和底物复合的该酶的晶体结构。分析了活性位点残基突变体的动力学特性，提出了反应机理。

在一些实施方案中，具有2,3-二氨基丙酸解氨酶活性的酶由与大肠杆菌2,3-二氨基丙酸解氨酶ygeX具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在其他实施方案中，具有2,3-二氨基丙酸解氨酶活性的酶是大肠杆菌ygeX。在一些实施方案中，编码具有2,3-二氨基丙酸解氨酶活性的酶的一种或多种核酸分子包含UniProt ID P66899中列出的氨基酸序列。在进一步的实施方案中，编码具有2,3-二氨基丙酸解氨酶活性的酶的一种或多种核酸分子由Gene ID 947012中列出的核酸序列编码。

乙醛酸旁路

乙醛酸循环是三羧酸循环的变体，是发生在植物、细菌、原生生物和真菌中的合成代谢途径。乙醛酸循环的核心是将乙酰辅酶A转化为琥珀酸以合成碳水化合物。在微生物中，当不能获得复杂来源如葡萄糖时，乙醛酸循环允许细胞利用简单的碳化合物作为碳源。通常认为该循环在动物中不存在，但胚胎发生早期阶段的线虫除外。然而近年来，在一些动物组织中检测到参与乙醛酸循环的关键酶苹果酸合酶和异柠檬酸裂解酶，对细菌和动物中酶的进化关系提出了质疑，并表明动物编码了该循环的替代酶，这些替代酶在功能上不同于非后生动物物种中已知的苹果酸合酶和异柠檬酸裂解酶。

乙醛酸循环利用与三羧酸循环相关的八种酶中的五种：柠檬酸合酶、顺乌头酸酶、琥珀酸脱氢酶、延胡索酸酶和苹果酸脱氢酶。这两个循环的不同之处在于，在乙醛酸循环中，异柠檬酸裂解酶将异柠檬酸转化为乙醛酸和琥珀酸，而不是转化为α-酮戊二酸。这绕过了发生在TCA循环中的脱羧步骤，允许在随后的大分子(包括葡萄糖)合成中使用简单的碳化合物。乙醛酸随后与乙酰辅酶A结合产生苹果酸，由苹果酸合酶催化。也通过琥珀酸脱氢酶和延胡索酸酶的作用，从琥珀酸平行形成苹果酸。

脊椎动物通常将来自脂质的脂肪酸用作能量来源，因为脂肪酸通过β氧化降解为乙酸分子。该乙酸与辅酶A的活性硫醇基团结合，进入柠檬酸循环(TCA循环)，在其中该乙酸被完全氧化为二氧化碳。因此，该途径允许细胞从脂肪中获得能量。为了利用来自脂肪的乙酸来生物合成碳水化合物，使用乙醛酸循环，其初始反应与TCA循环相同。

含有细胞壁的生物，如植物、真菌和细菌，在生长过程中需要非常大量的碳水化合物来生物合成复杂结构的多糖，如纤维素、葡聚糖和壳多糖。在这些生物体中，在没有可用碳水化合物的情况下(例如，在某些微生物环境中或在植物种子萌发期间)，乙醛酸循环允许由脂质通过脂肪酸β-氧化生成的乙酸合成葡萄糖。

乙醛酸循环绕过了柠檬酸循环中碳以CO₂形式损失的步骤。乙醛酸循环的两个初始步骤与柠檬酸循环中的相同：乙酸→柠檬酸→异柠檬酸。在下一步中，在第一个乙醛酸循环酶异柠檬酸裂解酶的催化下，异柠檬酸裂解为琥珀酸和乙醛酸(后者为该循环命名)。乙醛酸与乙酰辅酶A缩合(该步骤由苹果酸合酶催化)，产生苹果酸。苹果酸和草酰乙酸都可以转化为磷酸烯醇丙酮酸，其是磷酸烯醇丙酮酸羧激酶的产物，是糖异生的第一个酶。因此，乙醛酸循环的最终结果是由脂肪酸生产葡萄糖。第一步生成的琥珀酸可以进入柠檬酸循环，最终形成草酰乙酸。

使用重组微生物生物合成MEG(或乙醇酸)或任选MEG(或乙醇酸)和一种或多种联产品

如上所述，一方面，本公开提供重组微生物，其包含一种或多种生化途径，所述生化途径由一种或多种己糖原料通过一种或多种戊糖-5-磷酸中间体生产单乙二醇(MEG)(或乙醇酸)。在一个实施方案中，一种或多种联产品与MEG(或乙醇酸)联产。在另一个实施方案中，所述一种或多种戊糖-5-磷酸中间体是D-木酮糖-5-磷酸、D-核酮糖-5-磷酸或D-核糖-5-磷酸中的一种或多种。

因此，在一个实施方案中，本申请涉及重组微生物，其包含一种或多种包含至少一种酶的生化途径，所述酶具有在无损转化中将一种或多种己糖原料转化为一种或多种戊糖-5-磷酸中间体的活性。

在一些实施方案中，重组微生物包含至少一种具有转酮醇酶活性的酶的表达。在一些实施方案中，具有转酮醇酶活性的酶由与来自大肠杆菌的tktA具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码。在其他实施方案中，具有转酮醇酶活性的酶是来自大肠杆菌的tktA。在一些实施方案中，具有转酮醇酶活性的酶由与来自大肠杆菌的tktB具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在其他实施方案中，具有转酮醇酶活性的酶是来自大肠杆菌的tktB。在另一个实施方案中，编码具有转酮醇酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO：148和150的氨基酸序列。在一些实施方案中，编码具有转酮醇酶活性的酶的一种或多种核酸分子是tktA或其同源物。在一些实施方案中，编码具有转酮醇酶活性的酶的一种或多种核酸分子是tktB或其同源物。在一个进一步的实施方案中，编码具有转酮醇酶活性的酶的一种或多种核酸分子由选自SEQ ID NO：147和149的核酸序列编码。

在一些实施方案中，所述重组微生物包含至少一种具有转醛醇酶活性的酶的表达。在一些实施方案中，具有转醛醇酶活性的酶由与来自大肠杆菌的talA或talB具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码。在一些实施方案中，具有转醛醇酶活性的酶是来自大肠杆菌的talA。在其他实施方案中，具有转醛醇酶活性的酶是来自大肠杆菌的talB。在另一个实施方案中，编码具有转醛醇酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO：152和154的氨基酸序列。在一个进一步的实施方案中，编码具有转醛醇酶活性的酶的一种或多种核酸分子由选自SEQ ID NO：151和153的核酸序列编码。

在一些实施方案中，所述重组微生物包含至少一种具有核酮糖-5-磷酸3-差向异构酶活性的酶的表达。在一些实施方案中，具有核酮糖-5-磷酸3-差向异构酶活性的酶由与来自大肠杆菌的rpe具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码。在其他实施方案中，具有核酮糖-5-磷酸3-差向异构酶活性的酶是来自大肠杆菌的rpe。在另一个实施方案中，编码具有核酮糖-5-磷酸3-差向异构酶活性的酶的一种或多种核酸分子包含SEQ ID NO：158中列出的氨基酸序列。在一个进一步的实施方案中，编码具有核酮糖-5-磷酸3-差向异构酶活性的酶的一种或多种核酸分子由SEQ IDNO：157中列出的核酸序列编码。

在一些实施方案中，重组微生物包含至少一种具有核糖-5-磷酸异构酶活性的酶的表达。在一些实施方案中，具有核糖-5-磷酸异构酶活性的酶由与来自大肠杆菌的rpiA或rpiB具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码。在其他实施方案中，具有核糖-5-磷酸异构酶活性的酶是来自大肠杆菌的rpiA或rpiB。在另一个实施方案中，编码具有核糖-5-磷酸异构酶活性的rpiA酶的一种或多种核酸分子包含SEQ ID NO：156中列出的氨基酸序列。在一个进一步的实施方案中，编码具有核糖-5-磷酸异构酶活性的rpiA酶的一种或多种核酸分子由SEQ ID NO：155中列出的核酸序列编码。在另一个实施方案中，编码具有核糖-5-磷酸异构酶活性的rpiB酶的一种或多种核酸分子包含SEQ ID NO：253中列出的氨基酸序列。在一个进一步的实施方案中，编码具有核糖-5-磷酸异构酶活性的rpiB酶的一种或多种核酸分子由SEQ ID NO：254中列出的核酸序列编码。

在一些实施方案中，重组微生物包含至少一种具有转酮醇酶活性、转醛醇酶活性、核酮糖-5-磷酸3-差向异构酶活性和核糖-5-磷酸异构酶活性的酶的表达。在其他实施方案中，重组微生物进一步包含一种或多种内源性酶的缺失或降低的活性，所述内源性酶选自甘油醛3-磷酸脱氢酶、磷酸甘油酸激酶和磷酸甘油酸变位酶。在一些实施方案中，内源性的甘油醛3-磷酸脱氢酶是gapA，磷酸甘油酸激酶是pgk，磷酸甘油酸变位酶是gpmA和/或gpmM。

在一些实施方案中，重组微生物包含至少一种具有果糖6-磷酸磷酸酮醇酶活性的酶的表达。在一些实施方案中，具有果糖-6-磷酸磷酸酮醇酶活性的酶由与选自以下的具有果糖-6-磷酸磷酸酮醇酶活性的酶具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码：齿双歧杆菌(Bifidobacterium dentium)BDP_1006、乳双歧杆菌(Bifidobacterium lactis)xfp、类植物乳杆菌(Lactobacillus paraplantarum)xpkA和短双歧杆菌(Bifidobacterium breve)xfp。在一个优选的实施方案中，具有果糖-6-磷酸磷酸酮醇酶活性的酶选自齿双歧杆菌BDP_1006、乳双歧杆菌xfp、类植物乳杆菌xpkA和短双歧杆菌xfp。在另一个实施方案中，编码具有果糖-6-磷酸磷酸酮醇酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO：212、214、216和218的氨基酸序列。在一个进一步的实施方案中，编码具有果糖-6-磷酸磷酸酮醇酶活性的酶的一种或多种核酸分子由选自SEQID NO：211、213、215和217的核酸序列编码。

在一些实施方案中，重组微生物包含至少一种具有磷酸乙酰转移酶活性的酶的表达。在一些实施方案中，具有磷酸乙酰转移酶活性的酶由与选自以下的具有磷酸乙酰转移酶活性的酶具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码：大肠杆菌pta和丙酮丁醇梭菌(Clostridium acetobutylicum)pta。在一个优选的实施方案中，具有磷酸乙酰转移酶活性的酶选自大肠杆菌pta和丙酮丁醇梭菌pta。在另一个实施方案中，编码具有磷酸乙酰转移酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO：220和222的氨基酸序列。在一个进一步的实施方案中，编码具有磷酸乙酰转移酶活性的酶的一种或多种核酸分子由选自SEQ ID NO：219和221的核酸序列编码。

在一些实施方案中，重组微生物包含至少一种具有果糖-6-磷酸磷酸酮醇酶活性、磷酸乙酰转移酶活性、转酮醇酶活性、转醛醇酶活性、核酮糖-5-磷酸3-差向异构酶活性和核糖-5-磷酸异构酶活性的酶的表达。在其他实施方案中，重组微生物进一步包含内源性6-磷酸果糖激酶的活性缺失或降低。在一些实施方案中，内源性6-磷酸果糖激酶是pfkA和/或pfkB。

在另一个实施方案中，由一种或多种己糖原料无损转化生产的一种或多种戊糖-5-磷酸中间体可以通过其转化为一种或多种戊糖和/或戊糖-1-磷酸中间体，与任一个已知的C2 MEG或乙醇酸生产途径相连接。在一些实施方案中，重组微生物包含至少一种具有戊糖磷酸酶活性、阿糖醇磷酸脱氢酶活性、和/或磷酸戊糖变位酶活性的酶的表达。

在一些实施方案中，重组微生物包含至少一种具有戊糖磷酸酶活性的酶的表达。在其他实施方案中，至少一种具有戊糖磷酸酶活性的酶选自以下一种或多种：具有D-戊糖-5-磷酸酶活性的酶、具有D-木酮糖-5-磷酸酶活性的酶、具有D-核糖-5-磷酸酶活性的酶和具有D-核酮糖-5-磷酸酶活性的酶。在一些实施方案中，戊糖磷酸酶由与选自以下的D-戊糖-5-磷酸酶具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码：大肠杆菌phoA、大肠杆菌yfbT和大肠杆菌yidA。在一些实施方案中，具有D-木酮糖-5-磷酸酶活性的酶由与枯草芽孢杆菌(Bacillus subtilis)araL具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码。在一些实施方案中，具有D-核糖-5-磷酸酶活性的酶由与选自以下的具有D-核糖-5-磷酸酶活性的酶具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码：拟南芥(Arabidopsis thaliana)SGPP、荧光假单胞菌(Pseudomonas fluorescens)PFLU_2693和大肠杆菌ybiV。在一些实施方案中，具有D-核酮糖-5-磷酸酶活性的酶由与恶性疟原虫(Plasmodium falciparum)的PF10_0325具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码。在一些实施方案中，编码具有D-戊糖-5-磷酸酶活性的酶的一种或多种核酸分子选自SEQ ID NO：159、161、163、165、167、169、171和173。在另一个实施方案中，编码具有D-戊糖-5-磷酸酶活性的酶的一种或多种核酸分子包含选自SEQID NO：160、162、164、166、168、170、172和174的氨基酸序列。

在一些实施方案中，重组微生物包含至少一种具有阿糖醇磷酸脱氢酶活性的酶的表达。在一些实施方案中，具有阿糖醇磷酸脱氢酶活性的酶选自以下一种或多种：具有D-阿糖醇1-磷酸4-脱氢酶活性的酶、具有D-阿糖醇5-磷酸2-脱氢酶活性的酶、具有D-阿糖醇1-磷酸2-脱氢酶活性的酶和具有D-阿糖醇5-磷酸4-脱氢酶活性的酶。

在一些实施方案中，具有D-阿糖醇1-磷酸2-脱氢酶活性的酶由与选自以下的具有D-阿糖醇1-磷酸2-脱氢酶活性的酶具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码：白色念珠菌(Candida albicans)ARD1、热带念珠菌(Candida tropicalis)ARD1、Scheffersomyces stipitis ARDH、枯草芽孢杆菌egsA(araM)、敏捷气热菌egsA、大肠杆菌gpsA和酿酒酵母GPD1。在优选实施方案中，具有D-阿糖醇1-磷酸2-脱氢酶活性的酶选自白色念珠菌(Candida albicans)ARD1、热带念珠菌(Candida tropicalis)ARD1、Scheffersomyces stipitis ARDH、枯草芽孢杆菌egsA(araM)、敏捷气热菌egsA、大肠杆菌gpsA和酿酒酵母GPD1。在一些实施方案中，编码具有D-阿糖醇1-磷酸2-脱氢酶活性的酶的一种或多种核酸分子选自SEQ ID NO：177、179、181、189、191、193和195。在另一个实施方案中，编码具有D-阿糖醇1-磷酸2-脱氢酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO：178、180、182、190、192、194和196的氨基酸序列。

在上述任何重组微生物的一些实施方案中，所述重组微生物进一步包含一种或多种内源性酶中降低的活性，所述内源性酶选自葡萄糖6-磷酸-1-脱氢酶、6-磷酸葡糖酸内酯酶和6-磷酸葡糖酸脱氢酶。在进一步的实施方案中，葡萄糖6-磷酸-1-脱氢酶是zwf，6-磷酸葡萄糖酸内酯酶是pgl，6-磷酸葡萄糖酸脱氢酶是gnd。

在一些实施方案中，本申请提供重组微生物，其联产MEG(或乙醇酸)和一种或多种联产品，所述联产品选自丙酮、异丙醇、丙烯、异丁烯和一种或多种丝氨酸途径化合物。在一些优选的实施方案中，一种或多种丝氨酸途径化合物选自丝氨酸、甘氨酸、单乙醇胺(MEA)和乙二胺(EDA)。

在一些实施方案中，一种或多种己糖原料选自葡萄糖或葡萄糖的低聚物。在其他实施方案中，葡萄糖的低聚物选自果糖、蔗糖、淀粉、纤维二糖、麦芽糖、乳糖和纤维素。

在一些实施方案中，在重组微生物中，具有转酮醇酶活性的酶或具有果糖-6-磷酸磷酸酮醇酶活性的酶的表达能够使一种或多种己糖原料无损转化为一种或多种戊糖-5-磷酸中间体。

在一些实施方案中，重组微生物通过C2途径中乙醇醛的转化和C3途径中磷酸二羟丙酮(DHAP)或丙酮酸的转化，生产MEG或乙醇酸(GA)。在其他实施方案中，乙醇醛由乙醇醛脱氢酶氧化为乙醇酸。

在一些实施方案中，重组微生物通过C2途径中乙醇醛的转化生产MEG或乙醇酸(GA)，并通过C3途径中磷酸二羟丙酮(DHAP)或丙酮酸的转化生产一种或多种联产品。在其他实施方案中，一种或多种联产品选自丙酮、异丙醇、丙烯、异丁烯和一种或多种丝氨酸途径化合物。在一些优选的实施方案中，一种或多种丝氨酸途径化合物选自丝氨酸、甘氨酸、单乙醇胺(MEA)和乙二胺(EDA)。

在一些实施方案中，用于通过C3途径中DHAP或丙酮酸的转化生产一种或多种联产品的至少一种酶选自至少一种具有选自以下的活性的酶：硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A：乙酰乙酸转移酶或乙酸：乙酰乙酰辅酶A水解酶活性和乙酰乙酸脱羧酶活性，并且一种或多种联产品包括丙酮。

在一些实施方案中，用于通过C3途径中DHAP或丙酮酸的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶：硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A：乙酰乙酸转移酶或乙酸：乙酰乙酰辅酶A水解酶活性、乙酰乙酸脱羧酶活性和仲醇脱氢酶活性，并且一种或多种联产品包含异丙醇。

在一些实施方案中，用于通过C3途径中DHAP或丙酮酸的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶：硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A：乙酰乙酸转移酶或乙酸：乙酰乙酰辅酶A水解酶活性、乙酰乙酸脱羧酶活性、仲醇脱氢酶活性和脱水酶活性，并且一种或多种联产品包含丙烯。

在一些实施方案中，用于通过C3途径中DHAP或丙酮酸的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶：硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A：乙酰乙酸转移酶或乙酸：乙酰乙酰辅酶A水解酶活性、乙酰乙酸脱羧酶活性、3-羟基异戊酸(3HIV)合酶活性、羟甲基戊二酰辅酶A合酶活性、甲基戊烯二酰辅酶A水合酶活性、甲基巴豆酰辅酶A羧化酶活性、甲基巴豆酰辅酶A水合酶活性、3-羟基异戊酰辅酶A硫酯酶活性、3HIV激酶活性、3HIV-3-磷酸脱羧酶活性和3HIV脱羧酶活性，并且一种或多种联产品包含异丁烯。

在一些实施方案中，用于通过C3途径中DHAP或丙酮酸的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶：3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性和甘油酸2-激酶活性，并且一种或多种联产品包含L-丝氨酸。

在一些实施方案中，用于通过C3途径中DHAP或丙酮酸的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶：3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、转氨酶活性、羟基丙酮酸脱羧酶活性、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶活性、丝氨酸脱羧酶活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性、甘油酸2-激酶活性、乙醛脱氢酶活性和乙醇胺解氨酶活性，并且一种或多种联产品包含单乙醇胺(MEA)。

在一些实施方案中，用于通过C3途径中DHAP或丙酮酸的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶：丝氨酸脱氢酶活性、2-氨基丙二酸半醛脱羧酶活性、氨基乙醛转氨酶活性、2-氨基丙二酸半醛转氨酶活性、2,3-二氨基丙酸脱羧酶活性、丝氨酸脱羧酶活性、乙醇胺脱氢酶活性、丝氨酸羟甲基转移酶活性、醛氧化酶活性、N-乙酰转移酶或O-乙酰转移酶活性、N-乙酰丝氨酸脱氢酶活性、转氨酶活性、脱乙酰酶活性、丝氨酸氨基酶活性和2,3-二氨基丙酸解氨酶活性，并且一种或多种联产品包含乙二胺(EDA)。

在一些实施方案中，用于在C2途径中由乙醇醛生产MEG或GA的至少一种酶选自具有选自以下的活性的至少一种酶：D-塔格糖3-差向异构酶活性、D-核酮糖激酶活性、D-核酮糖-1-磷酸醛缩酶活性、D-木酮糖1-激酶活性、D-木酮糖-1-磷酸醛缩酶活性、木糖还原酶或醛糖还原酶活性、木糖醇脱氢酶活性、木糖异构酶活性、木糖脱氢酶活性、木糖酸内酯酶活性、木糖酸脱氢酶活性、2-酮-3-脱氧-D-戊酸醛缩酶活性、乙醇醛还原酶活性和乙醇醛脱氢酶活性。

在一个实施方案中，至少一部分在C3途径中生产的过量NADH用作C2途径中还原当量的来源。在另一个实施方案中，至少一部分在C3途径中生产的过量NADH用于生产ATP。

己糖至戊糖-5-磷酸的中间体

在本公开中，通过使用非氧化进入磷酸戊糖途径，将葡萄糖流输送至磷酸戊糖途径而不是糖酵解途径。

[A]因此，在一个实施方案中，本申请涉及一种能够由一种或多种己糖原料生产一种或多种戊糖-5-磷酸中间体的重组微生物，其中该重组微生物表达以下(a)至(d)的一种或多种：

(a)至少一种内源性或外源性核酸分子，其编码具有转酮醇酶活性的酶，该酶催化果糖-6-磷酸和甘油醛-3-磷酸分别可逆转化为赤藓糖-4-磷酸和D-木酮糖-5-磷酸，和/或催化来自(b)的甘油醛-3-磷酸和来自(b)的景天庚酮糖-7-磷酸分别可逆转化为D-核糖-5-磷酸和D-木酮糖-5-磷酸；

(b)至少一种内源性或外源性核酸分子，其编码具有转醛醇酶活性的酶，该酶催化来自(a)的果糖-6-磷酸和赤藓糖-4-磷酸分别可逆转化为甘油醛-3-磷酸和景天庚酮糖-7-磷酸；

(c)至少一种内源性或外源性核酸分子，其编码具有核糖-5-磷酸异构酶活性的酶，该酶催化来自(a)的D-核糖-5-磷酸和D-核酮糖-5-磷酸的相互转化；

(d)至少一种内源性或外源性核酸分子，其编码具有核酮糖-5-磷酸3-差向异构酶活性的酶，该酶催化来自(a)的D-木酮糖-5-磷酸和来自(c)的D-核酮糖-5-磷酸的相互转化；

其中重组微生物任选地进一步在编码甘油醛3-磷酸脱氢酶的基因中包含缺失、插入或功能缺失突变；

其中一种或多种己糖原料在重组微生物中通过内源性糖酵解途径转化为果糖-6-磷酸和甘油醛-3-磷酸，

并且其中产生的一种或多种戊糖-5-磷酸中间体是D-核糖-5-磷酸、D-木酮糖-5-磷酸或D-核酮糖-5-磷酸中的一种或多种。

[B]在另一个实施方案中，本申请涉及一种能够由一种或多种己糖原料生产一种或多种戊糖-5-磷酸中间体的重组微生物，其中该重组微生物表达以下(a)至(f)的一种或多种：

(a)至少一种内源性或外源性核酸分子，其编码具有果糖-6-磷酸磷酸酮醇酶活性的酶，该酶催化果糖-6-磷酸可逆转化为赤藓糖-4-磷酸和乙酰磷酸；

(b)至少一种内源性或外源性核酸分子，其编码具有磷酸乙酰转移酶活性的酶，该酶催化来自(a)的乙酰磷酸可逆转化为乙酰辅酶A；

(c)至少一种内源性或外源性核酸分子，其编码具有转醛醇酶活性的酶，该酶催化来自(a)的果糖-6-磷酸和赤藓糖-4-磷酸分别可逆转化为甘油醛-3-磷酸和景天庚酮糖-7-磷酸；

(d)至少一种内源性或外源性核酸分子，其编码具有转酮醇酶活性的酶，该酶催化来自(c)的甘油醛-3-磷酸和来自(c)的景天庚酮糖-7-磷酸分别可逆转化为D-核糖-5-磷酸和D-木酮糖-5-磷酸；

(e)至少一种内源性或外源性核酸分子，其编码具有核糖-5-磷酸异构酶活性的酶，该酶催化来自(d)的D-核糖-5-磷酸和D-核酮糖-5-磷酸的相互转化；

(f)至少一种内源性或外源性核酸分子，其编码具有核酮糖-5-磷酸3-差向异构酶活性的酶，该酶催化来自(d)的D-木酮糖-5-磷酸和来自(e)的D-核酮糖-5-磷酸的相互转化；

其中重组微生物任选地进一步在编码6-磷酸果糖激酶的基因中包含缺失、插入或功能缺失突变；

其中一种或多种己糖原料在重组微生物中通过内源性糖酵解途径转化为果糖-6-磷酸，

其中步骤(b)中产生的乙酰辅酶A可以用于生产一种或多种联产品，所述联产品选自丙酮、异丙醇、丙烯、异丁烯和丝氨酸途径化合物；

在一些实施方案中，磷酸戊糖途径的氧化分支被删除或失活，以优化朝向非氧化性进入磷酸戊糖途径的流。

[C]因此，在一个实施方案中，实施方案[A]或实施方案[B]的重组微生物任选地进一步包含一种或多种选自以下的修饰：

(i)编码葡萄糖6-磷酸-1-脱氢酶的基因中的缺失、插入或功能缺失突变，该酶催化葡萄糖-6-磷酸转化为6-磷酸-D-葡萄糖酸-1,5-内酯；

(ii)编码6-磷酸葡萄糖酸内酯酶的基因中的缺失、插入或功能缺失突变，该酶催化6-磷酸-D-葡萄糖酸-1,5-内酯转化为葡萄糖酸-6-磷酸；和

(iii)编码6-磷酸葡萄糖酸脱氢酶的基因中的缺失、插入或功能缺失突变，该酶催化葡萄糖酸-6-磷酸转化为D-核酮糖-5-磷酸。

在一些实施方案中，具有转酮醇酶活性的酶由与大肠杆菌tktA具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在其他实施方案中，转酮醇酶由与大肠杆菌tktB具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在一些实施方案中，转酮醇酶是来自大肠杆菌的tktA。在其他实施方案中，转酮醇酶是来自大肠杆菌的tktB。

在一些实施方案中，编码具有转酮醇酶活性的酶的一种或多种核酸分子是tktA或其同源物。在一些实施方案中，编码具有转酮醇酶活性的酶的一种或多种核酸分子是tktB或其同源物。在另一个实施方案中，编码具有转酮醇酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO：148和150的氨基酸序列。在一个进一步的实施方案中，编码具有转酮醇酶活性的酶的一种或多种核酸分子由选自SEQ ID NO：147和149的核酸序列编码。

在一些实施方案中，具有转醛醇酶活性的酶由与来自大肠杆菌的talA或talB具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码。在一些实施方案中，具有转醛醇酶活性的酶是来自大肠杆菌的talA。在其他实施方案中，具有转醛醇酶活性的酶是来自大肠杆菌的talB。在另一个实施方案中，编码具有转醛醇酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO：152和154的氨基酸序列。在一个进一步的实施方案中，编码具有转醛醇酶活性的酶的一种或多种核酸分子由选自SEQ ID NO：151和153的核酸序列编码。

在一个实施方案中，具有核糖-5-磷酸异构酶活性的酶由与大肠杆菌rpiA或rpiB具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在一些实施方案中，具有核糖-5-磷酸异构酶活性的酶是大肠杆菌rpiA或rpiB。

在一些实施方案中，编码具有核糖-5-磷酸异构酶活性的酶的一种或多种核酸分子是rpiA，或其同源物。在另一个实施方案中，编码具有核糖-5-磷酸异构酶活性的酶的一种或多种核酸分子包含SEQ ID NO：156中列出的氨基酸序列。在一个进一步的实施方案中，编码具有核糖-5-磷酸异构酶活性的酶的一种或多种核酸分子由SEQ ID NO：155中列出的核酸序列编码。

在一个实施方案中，具有核酮糖-5-磷酸3-差向异构酶活性的酶由与大肠杆菌rpe具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在一些实施方案中，具有核酮糖-5-磷酸3-差向异构酶活性的酶是大肠杆菌rpe。

在一些实施方案中，编码具有核酮糖-5-磷酸3-差向异构酶活性的酶的一种或多种核酸分子是rpe，或其同源物。在另一个实施方案中，编码具有核酮糖-5-磷酸3-差向异构酶活性的酶的一种或多种核酸分子包含SEQ ID NO：158中列出的氨基酸序列。在一个进一步的实施方案中，编码具有核酮糖-5-磷酸3-差向异构酶活性的酶的一种或多种核酸分子由SEQ ID NO：157中列出的核酸序列编码。

在一个实施方案中，具有果糖-6-磷酸磷酸酮醇酶活性的酶由与选自以下的具有果糖-6-磷酸磷酸酮醇酶活性的酶具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码：齿双歧杆菌(Bifidobacterium dentium)BDP_1006、乳双歧杆菌(Bifidobacterium lactis)xfp、类植物乳杆菌(Lactobacillus paraplantarum)xpkA和短双歧杆菌(Bifidobacterium breve)xfp。在其他实施方案中，具有果糖-6-磷酸磷酸酮醇酶活性的酶选自齿双歧杆菌BDP_1006、乳双歧杆菌xfp、类植物乳杆菌xpkA和短双歧杆菌xfp。

在一些实施方案中，编码具有果糖-6-磷酸磷酸酮醇酶活性的酶的一种或多种核酸分子选自BDP_1006、xfp、xpkA，或其同源物。在另一个实施方案中，编码具有果糖-6-磷酸磷酸酮醇酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO：212、214、216和218的氨基酸序列。在一个进一步的实施方案中，编码具有果糖-6-磷酸磷酸酮醇酶活性的酶的一种或多种核酸分子由选自SEQ ID NO：211、213、215和217的核酸序列编码。

在一个实施方案中，具有磷酸乙酰转移酶活性的酶由与选自以下的具有磷酸乙酰转移酶活性的酶具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码：大肠杆菌pta和丙酮丁醇梭菌(Clostridium acetobutylicum)pta。在其他实施方案中，具有磷酸乙酰转移酶活性的酶选自大肠杆菌pta和丙酮丁醇梭菌pta。

在一些实施方案中，编码具有磷酸乙酰转移酶活性的酶的一种或多种核酸分子是pta，或其同源物。在另一个实施方案中，编码具有磷酸乙酰转移酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO：220和222的氨基酸序列。在一个进一步的实施方案中，编码具有磷酸乙酰转移酶活性的酶的一种或多种核酸分子由选自SEQ ID NO：219和221的核酸序列编码。

连接磷酸戊糖途径和MEG(或乙醇酸)生产途径

在另一方面，在实施方案[A]或实施方案[B](和任选地包括实施方案[C])中产生的戊糖-5-磷酸中间体可以通过戊糖磷酸酶与任何一种已知的MEG或乙醇酸生产途径连接。

[D]因此，在一个实施方案中，本申请涉及一种能够由D-木酮糖-5-磷酸生产D-木酮糖的重组微生物，其中所述重组微生物表达一种或多种具有戊糖-5-磷酸酶活性的酶，其中D-木酮糖-5-磷酸通过磷酸戊糖途径的非氧化分支产生，且其中D-木酮糖可以用于生产MEG(或乙醇酸)和任选的一种或多种联产品。

在一个实施方案中，具有戊糖-5-磷酸酶活性的酶由与选自以下的具有戊糖-5-磷酸酶活性的酶具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码：大肠杆菌phoA、大肠杆菌yfbT和大肠杆菌yidA。在进一步的实施方案中，具有戊糖-5-磷酸酶活性的酶选自大肠杆菌phoA、大肠杆菌yfbT和大肠杆菌yidA。

在一些实施方案中，编码具有戊糖-5-磷酸酶活性的酶的一种或多种核酸分子是phoA、yfbT、yidA，或其同源物。在另一个实施方案中，编码具有戊糖-5-磷酸酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO：160、168和172的氨基酸序列。在一个进一步的实施方案中，编码具有戊糖-5-磷酸酶活性的酶的一种或多种核酸分子由选自SEQ ID NO：159、167和171的核酸序列编码。

在另一个实施方案中，戊糖-5-磷酸酶是D-木酮糖-5-磷酸酶。在另一个实施方案中，D-木酮糖-5-磷酸酶由与枯草芽孢杆菌(Bacillus subtilis)araL具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码。在进一步的实施方案中，D-木酮糖-5-磷酸酶是枯草芽孢杆菌araL。

在一些实施方案中，编码具有D-木酮糖-5-磷酸酶活性的酶的一种或多种核酸分子是araL，或其同源物。在另一个实施方案中，编码具有D-木酮糖-5-磷酸酶活性的酶的一种或多种核酸分子包含SEQ ID NO：164中列出的氨基酸序列。在一个进一步的实施方案中，编码具有D-木酮糖-5-磷酸酶活性的酶的一种或多种核酸分子由SEQ ID NO：163中列出的核酸序列编码。

[E]在一个实施方案中，本申请涉及一种能够由D-核酮糖-5-磷酸或由D-核糖-5-磷酸生产D-核酮糖的重组微生物，其中该重组微生物表达以下(a)至(c)的一种或多种：

(a)至少一种内源性或外源性核酸分子，其编码具有D-核酮糖-5-磷酸酶活性的酶和/或具有戊糖-5-磷酸酶活性的酶，该酶催化D-核酮糖-5-磷酸可逆转化为D-核酮糖；

(b)至少一种内源性或外源性核酸分子，其编码具有D-核糖-5-磷酸酶活性的酶和/或具有戊糖-5-磷酸酶活性的酶，该酶催化D-核糖-5-磷酸可逆转化为D-核糖；

(c)至少一种内源性或外源性核酸分子，其编码具有D-核糖异构酶活性的酶，该酶催化来自(b)的D-核糖可逆转化为D-核酮糖；

其中D-核酮糖-5-磷酸和/或D-核糖-5-磷酸通过磷酸戊糖途径的非氧化分支产生，且其中D-核酮糖可以用于生产MEG(或乙醇酸)和任选的一种或多种联产品。

在另一个实施方案中，具有D-核酮糖-5-磷酸酶活性的酶由与恶性疟原虫(Plasmodium falciparum)的PF10_0325具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码。在进一步的实施方案中，具有D-核酮糖-5-磷酸酶活性的酶是恶性疟原虫PF10_0325。

在一些实施方案中，编码具有D-核酮糖-5-磷酸酶活性的酶的一种或多种核酸分子是PF10_0325，或其同源物。在另一个实施方案中，编码具有D-核酮糖-5-磷酸酶活性的酶的一种或多种核酸分子包含SEQ ID NO：174中列出的氨基酸序列。在一个进一步的实施方案中，编码具有D-核酮糖-5-磷酸酶活性的酶的一种或多种核酸分子包含SEQ ID NO：173中列出的核酸序列。

在一个实施方案中，具有D-核糖-5-磷酸酶活性的酶由与选自以下的具有D-核糖-5-磷酸酶活性的酶具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码：拟南芥SGPP、荧光假单胞菌(Pseudomonas fluorescens)PFLU_2693和大肠杆菌ybiV。在一些实施方案中，具有D-核糖-5-磷酸酶活性的酶选自：拟南芥SGPP、荧光假单胞菌PFLU_2693和大肠杆菌ybiV。

在一些实施方案中，编码具有D-核糖-5-磷酸酶活性的酶的一种或多种核酸分子是SGPP、PFLU_2693、ybiV，或其同源物。在另一个实施方案中，编码具有D-核糖-5-磷酸酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO：162、166和170的氨基酸序列。在一个进一步的实施方案中，编码具有D-核糖-5-磷酸酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO：161、165和169的核酸序列。

在另一方面，在实施方案[A]或实施方案[B](和任选地包括实施方案[C])中产生的戊糖-5-磷酸中间体可以通过阿糖醇磷酸脱氢酶与任何一种已知的MEG或乙醇酸生产途径连接。

[F]在一个实施方案中，本申请涉及一种能够由D-木酮糖-5-磷酸生产D-核酮糖-1-磷酸或由D-核酮糖-5-磷酸生产D-木酮糖-1-磷酸的重组微生物，其中所述重组微生物表达一种或多种阿糖醇磷酸脱氢酶，且其中所述一种或多种阿糖醇磷酸脱氢酶催化以下(a)至(d)中的一种或多种：

(a)D-木酮糖-5-磷酸可逆转化为D-阿糖醇-1-磷酸；

(b)来自(a)的D-阿糖醇-1-磷酸可逆转化为D-核酮糖-1-磷酸；

(c)D-核酮糖-5-磷酸可逆转化为D-阿糖醇-5-磷酸；

(d)来自(c)的D-阿糖醇-5-磷酸可逆转化为D-木酮糖-1-磷酸，

其中D-木酮糖-5-磷酸和/或D-核酮糖-5-磷酸通过磷酸戊糖途径的非氧化分支产生，且其中D-核酮糖-1-磷酸和/或D-木酮糖-1-磷酸可以用于生产MEG(或乙醇酸)和任选的一种或多种联产品。

在一些实施方案中，所述具有阿糖醇磷酸脱氢酶活性的酶选自以下一种或多种：具有D-阿糖醇1-磷酸4-脱氢酶活性的酶、具有D-阿糖醇5-磷酸2-脱氢酶活性的酶、具有D-阿糖醇1-磷酸2-脱氢酶活性的酶和具有D-阿糖醇5-磷酸4-脱氢酶活性的酶。

在一些实施方案中，具有D-阿糖醇5-磷酸2-脱氢酶活性的酶由与来自鸟肠球菌的APDH具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码。在一个优选的实施方案中，具有D-阿糖醇5-磷酸2-脱氢酶活性的酶是来自鸟肠球菌的APDH。在一些实施方案中，编码具有D-阿糖醇5-磷酸2-脱氢酶活性的酶的一种或多种核酸分子在SEQ ID NO：175中列出。在另一个实施方案中，编码具有D-阿糖醇5-磷酸2-脱氢酶活性的酶的一种或多种核酸分子包含SEQ ID NO：176中列出的氨基酸序列。

在一些实施方案中，具有D-阿糖醇1-磷酸2-脱氢酶活性的酶由与选自以下的具有D-阿糖醇1-磷酸2-脱氢酶活性的酶具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码：白色念珠菌(Candida albicans)ARD1、热带念珠菌(Candida tropicalis)ARD1、Scheffersomyces stipitis ARDH、枯草芽孢杆菌egsA(araM)、敏捷气热菌egsA、大肠杆菌gpsA和酿酒酵母GPD1。在一个优选的实施方案中，具有D-阿糖醇1-磷酸2-脱氢酶活性的酶选自白色念珠菌(Candida albicans)ARD1、热带念珠菌(Candida tropicalis)ARD1、Scheffersomyces stipitis ARDH、枯草芽孢杆菌egsA(araM)、敏捷气热菌egsA、大肠杆菌gpsA和酿酒酵母GPD1。在一些实施方案中，编码具有D-阿糖醇1-磷酸2-脱氢酶活性的酶的一种或多种核酸分子选自SEQ ID NO：177、179、181、189、191、193和195。在另一个实施方案中，编码具有D-阿糖醇1-磷酸2-脱氢酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO：178、180、182、190、192、194和196的氨基酸序列。

在另一方面，在实施方案[A]或实施方案[B](和任选地包括[C])中产生的戊糖-5-磷酸中间体可以通过磷酸戊糖变位酶与任何一种已知的MEG或乙醇酸生产途径连接。

[G]在一个实施方案中，本申请涉及一种能够由D-木酮糖-5-磷酸生产D-木酮糖-1-磷酸或由D-核酮糖-5-磷酸生产D-核酮糖-1-磷酸的重组微生物，其中所述重组微生物表达一种或多种磷酸戊糖变位酶，其中D-木酮糖-5-磷酸和/或D-核酮糖-5-磷酸通过磷酸戊糖途径的非氧化分支产生，且其中D-核酮糖-1-磷酸和/或D-木酮糖-1-磷酸可以用于生产MEG(或乙醇酸)和任选的一种或多种联产品。

在一些实施方案中，具有磷酸戊糖变位酶活性的酶由与选自以下的具有磷酸戊糖变位酶活性的酶具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码：大肠杆菌deoB、大肠杆菌pgm、枯草芽孢杆菌pgcA、乳酸乳球菌(Lactococcus lactis)pgmB、大肠杆菌ycjU、铜绿假单胞菌(Pseudomonas aeruginosa)algC和大肠杆菌cpsG。在一个优选的实施方案中，具有磷酸戊糖变位酶活性的酶选自大肠杆菌deoB、大肠杆菌pgm、枯草芽孢杆菌pgcA、乳酸乳球菌pgmB、大肠杆菌ycjU、铜绿假单胞菌algC和大肠杆菌cpsG。在一些实施方案中，编码具有磷酸戊糖变位酶活性的酶的一种或多种核酸分子选自SEQ ID NO：197、199、201、203、205、207和209。在另一个实施方案中，编码具有磷酸戊糖变位酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO：198、200、202、204、206、208和210的氨基酸序列。

MEG(或乙醇酸)或任选MEG(或乙醇酸)和联产品的生产途径

在一些实施方案中，实施方案[D]、[E]、[F]和[G]中生产的戊糖或戊糖-1-磷酸中间体用于已知的MEG(或乙醇酸)C2生产途径中，该途径偶联至C3途径，如下所述，以联产额外的MEG(或乙醇酸)和/或一种或多种联产品。

在一些实施方案中，通过使用D-木酮糖-1-磷酸的C2途径生产MEG(或乙醇酸)。

[H]在一个实施方案中，本申请涉及一种能够由一种或多种己糖原料生产单乙二醇(MEG)(或乙醇酸)的重组微生物，其中来自实施方案[A]或来自实施方案[B](和任选地包括实施方案[C])并且另外包括实施方案[D]、[F]和[G]中的一个或多个的重组微生物进一步表达以下(a)至(d)中的一种或多种：

(a)至少一种内源性或外源性核酸分子，其编码具有D-木酮糖1-激酶活性的酶，该酶催化来自实施方案[D]的D-木酮糖转化为D-木酮糖-1-磷酸；

(b)至少一种内源性或外源性核酸分子，其编码具有D-木酮糖-1-磷酸醛缩酶活性的酶，该酶催化来自(a)、来自实施方案[F]和/或来自实施方案[G]的D-木酮糖-1-磷酸转化为乙醇醛和磷酸二羟丙酮(DHAP)；

(c)至少一种内源性或外源性核酸分子，其编码具有乙醇醛还原酶活性的酶或具有醛还原酶活性的酶，该酶催化来自(b)的乙醇醛转化为MEG；

(d)至少一种内源性或外源性核酸分子，其编码具有乙醇醛脱氢酶活性的酶，该酶催化来自(b)的乙醇醛转化为乙醇酸；

其中生产MEG(或乙醇酸)和DHAP。

在一个实施方案中，具有D-木酮糖1-激酶活性的酶由获自人的一种或多种核酸分子编码。在一些实施方案中，编码具有D-木酮糖1-激酶活性的酶的一种或多种核酸分子是酮己糖激酶C(khk-C)，或其同源物。在另一个实施方案中，编码具有D-木酮糖1-激酶活性的酶的一种或多种核酸分子包含SEQ ID NO：55中列出的氨基酸序列。在一个进一步的实施方案中，编码具有D-木酮糖1-激酶活性的酶的一种或多种核酸分子由选自SEQ ID NO：53和54的核酸序列编码。

在一个实施方案中，具有D-木酮糖-1-磷酸醛缩酶活性的酶由获自人的一种或多种核酸分子编码。在另一个实施方案中，编码具有D-木酮糖-1-磷酸醛缩酶活性的酶的一种或多种核酸分子是醛缩酶B(aldoB)，或其同源物。在一些实施方案中，编码具有D-木酮糖-1-磷酸醛缩酶活性的酶的一种或多种核酸分子包含SEQ ID NO：58中列出的氨基酸序列。在一些实施方案中，编码具有D-木酮糖-1-磷酸醛缩酶活性的酶的一种或多种核酸分子由选自SEQ ID NO：56和57的核酸序列编码。

在一些实施方案中，通过使用D-核酮糖-1-磷酸的C2途径生产MEG(或乙醇酸)。

[I]在一个实施方案中，本申请涉及一种能够由一种或多种己糖原料生产单乙二醇(MEG)(或乙醇酸)的重组微生物，其中来自实施方案[A]或来自实施方案[B](和任选地包括实施方案[C])并且另外包括实施方案[D]、[E]、[F]和[G]中的一个或多个的重组微生物进一步表达以下(a)至(e)中的一种或多种：

(a)至少一种内源性或外源性核酸分子，其编码具有D-塔格糖3-差向异构酶活性的酶，该酶催化来自实施方案[D]的D-木酮糖转化为D-核酮糖；

(b)至少一种内源性或外源性核酸分子，其编码具有D-核酮糖激酶活性的酶，该酶催化来自(a)和/或来自实施方案[E]的D-核酮糖转化为D-核酮糖-1-磷酸；

(c)至少一种内源性或外源性核酸分子，其编码具有D-核酮糖-1-磷酸醛缩酶活性的酶，该酶催化来自(b)、来自实施方案[F]和/或来自实施方案[G]的D-核酮糖-1-磷酸转化为乙醇醛和磷酸二羟丙酮(DHAP)；

(d)至少一种内源性或外源性核酸分子，其编码具有乙醇醛还原酶活性的酶，该酶催化来自(c)的乙醇醛转化为MEG；

(e)至少一种内源性或外源性核酸分子，其编码具有乙醇醛脱氢酶活性的酶，该酶催化来自(c)的乙醇醛转化为乙醇酸；

其中生产MEG(或乙醇酸)和DHAP。

在一个实施方案中，具有D-塔格糖3-差向异构酶活性的酶由一种或多种获自微生物的核酸分子编码，所述微生物选自假单胞菌属物种(Pseudomonas sp.)、中慢生根瘤菌属物种(Mesorhizobium sp.)和红细菌属物种(Rhodobacter sp.)。在一些实施方案中，具有D-塔格糖3-差向异构酶活性的酶由一种或多种获自微生物的核酸分子编码，所述微生物选自菊苣假单胞菌(Pseudomonas cichorii)、假单胞菌属物种ST-24、百脉根中慢生根瘤菌(Mesorhizobium loti)和类球红细菌(Rhodobacter sphaeroides)。在一些实施方案中，一种或多种核酸分子是dte和/或FJ851309.1，或其同源物。在一个进一步的实施方案中，具有D-塔格糖3-差向异构酶活性的酶包含选自SEQ ID NO：3和5的氨基酸序列。在一个仍进一步的实施方案中，具有D-塔格糖3-差向异构酶活性的酶由选自SEQ ID NO：1、2和4的核酸序列编码。

在一个实施方案中，具有D-核酮糖激酶活性的酶由获自大肠杆菌的一种或多种核酸分子编码。在一些实施方案中，一种或多种核酸分子是fucK，或其同源物。在一个进一步的实施方案中，具有D-核酮糖激酶活性的酶包含SEQ ID NO：8中列出的氨基酸序列。在一个仍进一步的实施方案中，具有D-核酮糖激酶活性的酶由选自SEQ ID NO：6、7和257的核酸序列编码。

在一个实施方案中，具有D-核酮糖-1-磷酸醛缩酶活性的酶由获自大肠杆菌的一种或多种核酸分子编码。在一些实施方案中，一种或多种核酸分子是fucA，或其同源物。在一个进一步的实施方案中，具有D-核酮糖-1-磷酸醛缩酶活性的酶包含SEQ ID NO：11中列出的氨基酸序列。在一个仍进一步的实施方案中，具有D-核酮糖-1-磷酸醛缩酶活性的酶由选自SEQ ID NO：9和10的核酸序列编码。

在一些实施方案中，通过使用D-木糖酸的C2途径生产MEG(或乙醇酸)。

[J]在一个实施方案中，本申请涉及一种能够由一种或多种己糖原料生产单乙二醇(MEG)(或乙醇酸)的重组微生物，其中来自实施方案[A]或来自实施方案[B](和任选地包括实施方案[C])并且另外包括实施方案[D]的重组微生物进一步表达以下(a)至(d)中的一种或多种：

(a)至少一种内源性或外源性核酸分子，其编码具有木糖异构酶活性的酶，该酶催化来自实施方案[D]的D-木酮糖转化为D-木糖；

(b)至少一种内源性或外源性核酸分子，其编码具有木糖脱氢酶活性的酶，该酶催化来自(a)的D-木糖转化为D-木糖酸内酯；

(c)至少一种内源性或外源性核酸分子，其编码具有木糖酸内酯酶活性的酶，该酶催化来自(b)的D-木糖酸内酯转化为D-木糖酸；

(d)至少一种内源性或外源性核酸分子，其编码具有木糖脱氢酶活性的酶，该酶催化来自(a)的D-木糖转化为D-木糖酸；

其中所述重组微生物进一步表达以下(e)至(h)中的一种或多种：

(e)至少一种内源性或外源性核酸分子，其编码具有木糖酸脱水酶活性的酶，该酶催化来自(c)或(d)的D-木糖酸转化为2-酮-3-脱氧-木糖酸；

(f)至少一种内源性或外源性核酸分子，其编码具有2-酮-3-脱氧-D-戊糖酸醛缩酶活性的酶，该酶催化来自(e)的2-酮-3-脱氧-木糖酸转化为乙醇醛和丙酮酸；

(g)至少一种内源性或外源性核酸分子，其编码具有乙醇醛还原酶活性的酶，该酶催化来自(f)的乙醇醛转化为MEG；

(h)至少一种内源性或外源性核酸分子，其编码具有乙醇醛脱氢酶活性的酶，该酶催化来自(f)的乙醇醛转化为乙醇酸；

其中生产MEG(或乙醇酸)和丙酮酸。

在一些实施方案中，重组微生物包含内源性或外源性的具有木糖异构酶活性的酶，该酶催化D-木酮糖转化为D-木糖。在一个实施方案中，具有木糖异构酶活性的酶是外源的。在另一个实施方案中，具有木糖异构酶活性的酶由获自Pyromyces sp.的一种或多种核酸分子编码。在一个进一步的实施方案中，具有木糖异构酶活性的酶由获自大肠杆菌的一种或多种核酸分子编码。在另一个实施方案中，编码具有木糖异构酶活性的酶的一种或多种核酸分子是xylA，或其同源物。在又一个实施方案中，编码具有木糖异构酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO：95和144的氨基酸序列。在一个进一步的实施方案中，编码具有木糖异构酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO：93、94和143的核酸序列。

在一个实施方案中，具有木糖脱氢酶活性的酶由一种或多种获自微生物的核酸分子编码，所述微生物选自柄杆菌属物种(Caulobacter sp.)、嗜盐小盒菌属物种(Haloarcula sp.)、富盐菌属物种(Haloferax sp.)、盐红菌属物种(Halorubrum sp.)和木霉属物种(Trichoderma sp.)。在另一个实施方案中，具有木糖脱氢酶活性的酶由一种或多种获自微生物的核酸分子编码，所述微生物选自新月柄杆菌(Caulobacter crescentus)、Haloarcula marismortui、沃氏富盐菌(Haloferax volcanii)、Halorubrumlacusprofundi和里氏木霉(Trichoderma reesei)。在一些实施方案中，编码具有木糖脱氢酶活性的酶的一种或多种核酸分子选自xylB、xdh1(HVO_B0028)和/或xyd1，或其同源物。在一个进一步的实施方案中，编码具有木糖脱氢酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO：61、63和65的氨基酸序列。在又一个实施方案中，编码具有木糖脱氢酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO：59、60、62和64的核酸序列。

在一个实施方案中，具有木糖酸内酯酶活性的酶由一种或多种获自微生物的核酸分子编码，所述微生物选自柄杆菌属物种(Caulobacter sp.)和富盐菌属物种(Haloferaxsp.)。在另一个实施方案中，具有木糖酸内酯酶活性的酶由一种或多种获自微生物的核酸分子编码，所述微生物选自新月柄杆菌、沃氏富盐菌和吉氏富盐菌(Haloferaxgibbonsii)。在一些实施方案中，编码具有木糖酸内酯酶活性的酶的一种或多种核酸分子是xylC，或其同源物。在一个进一步的实施方案中，编码具有木糖酸内酯酶活性的酶的一种或多种核酸分子包含SEQ ID NO：67中列出的氨基酸序列。在又一个实施方案中，编码具有木糖酸内酯酶活性的酶的一种或多种核酸分子包含SEQ ID NO：66中列出的氨基酸序列。

在一个实施方案中，具有木糖酸脱水酶活性的酶由一种或多种获自微生物的核酸分子编码，所述微生物选自柄杆菌属物种、硫化叶菌属物种(Sulfolobus sp.)和大肠杆菌。在另一个实施方案中，具有木糖酸脱水酶活性的酶由一种或多种获自微生物的核酸分子编码，所述微生物选自新月柄杆菌、硫矿硫化叶菌(Sulfolobus solfataricus)和大肠杆菌。在一些实施方案中，编码具有木糖酸脱水酶活性的酶的一种或多种核酸分子选自xylD、yjhG和/或yagF，或其同源物。在一个进一步的实施方案中，编码具有木糖酸脱水酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO：69、72和75的氨基酸序列。在又一个实施方案中，编码具有木糖酸脱水酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO：68、70、71、73和74的核酸序列。

在一个实施方案中，具有2-酮-3-脱氧-D-戊糖酸醛缩酶活性的酶由一种或多种获自微生物的核酸分子编码，所述微生物选自假单胞菌属物种和大肠杆菌。在另一个实施方案中，具有2-酮-3-脱氧-D-戊糖酸醛缩酶活性的酶由获自大肠杆菌的一种或多种核酸分子编码。在一些实施方案中，编码具有2-酮-3-脱氧-D-戊糖酸醛缩酶活性的酶的一种或多种核酸分子选自yjhH和/或yagE，或其同源物。在一个进一步的实施方案中，编码具有2-酮-3-脱氧-D-戊糖酸醛缩酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO：78和81的氨基酸序列。在又一个实施方案中，编码具有2-酮-3-脱氧-D-戊糖酸醛缩酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO：76、77、79和80的核酸序列。

通过C2途径联产MEG(或乙醇酸)和通过C3途径联产MEG(或乙醇酸)

一方面，由一种或多种己糖原料生产MEG(或乙醇酸)如下：将一种或多种己糖原料无损转化为一种或多种戊糖-5-磷酸中间体，然后将一种或多种戊糖-5-磷酸中间体转化为一种或多种戊糖和/或戊糖-1-磷酸中间体，然后通过C2途径，将一种或多种戊糖和/或戊糖-1-磷酸中间体转化为MEG(或乙醇酸)和DHAP或丙酮酸，以及通过C3途径，将DHAP或丙酮酸转化为MEG。

在一些实施方案中，本申请涉及能够由一种或多种己糖原料生产MEG(或乙醇酸)的重组微生物，其中来自实施方案[A]或来自实施方案[B](任选地包括实施方案[C])并且另外具有一个或多个实施方案[D]、[E]、[F]和[G]的重组微生物进一步包含一个或多个选自实施例[H]、[I]和[J]的C2生物合成途径，用于生产MEG(或乙醇酸)，以及一种或多种C3生物合成途径，用于生产MEG(或乙醇酸)。用于生产MEG的C3生物合成途径例如如WO 2010/076324(Metabolic Explorer)中所述，其通过引用整体并入本文。

在一些实施方案中，用于生产MEG的C3生物合成途径包括三个酶促反应，从3-磷酸羟基丙酮酸前体(丝氨酸的前体)的转化开始。首先，磷酸酶活性允许磷酸羟基丙酮酸转化为羟基丙酮酸。然后在2-酮酸脱羧酶活性的作用下，羟基丙酮酸转化为乙醇醛。最后，羟基醛还原酶活性允许乙醇醛转化为乙二醇。另一种生产乙二醇的途径从L-丝氨酸作为前体开始。首先，转氨酶或氨基酸氧化酶活性允许丝氨酸转化为羟基丙酮酸。接下来的两步将羟基丙酮酸转化为乙醇醛，然后转化为MEG，这两步与上述第一个途径相似。

在一个优选的实施方案中，本公开提供重组微生物，其包含一种或多种用于生产MEG的C3生物合成途径。在一些实施方案中，重组微生物(特别是细菌)含有至少一种编码具有2-酮酸脱羧酶活性的多肽的基因和一种编码具有羟基醛还原酶活性的多肽的基因。这些基因可以是外源的或内源的，并且可以在染色体或染色体外表达。

在本公开的一个进一步的实施方案中，重组微生物(特别是细菌)包含其中中间体3-磷酸甘油酸的可得性增加的修饰。优选地，通过减弱编码磷酸甘油酸变位酶的基因(特别是基因gpmA和pgmM之一或两者)的表达水平来实现该增加。这可以通过用较弱的启动子替换这些基因的野生型启动子来实现，或者通过使用使相应信使RNA或蛋白质不稳定的元件来实现。如果需要，也可以通过删除相应的DNA序列来实现基因的完全衰减。

在另一个实施方案中，重组微生物(特别是细菌)包含这样的修饰，其刺激进入丝氨酸生物合成途径的流。这可以通过增加分别由serA和serC基因编码的3-磷酸甘油酸脱氢酶和/或磷酸丝氨酸转氨酶的表达水平来实现。可以通过引入驱动serA和/或serC基因表达的人工启动子、通过增加细胞中的拷贝数或通过将增加相应蛋白质活性的突变引入serA和/或serC基因，来增加3-磷酸甘油酸脱氢酶和/或磷酸丝氨酸转氨酶的表达水平。也可以通过用lrp突变等位基因(如lrp-1等位基因对应于lrp蛋白中的GLU 114ASP取代)替换野生型lrp基因(编码亮氨酸反应性调节蛋白)导致serA基因转录的组成型激活，来增加serA基因的表达。

在本公开的一个具体实施方案中，可以将突变引入serA基因中，该突变降低SerA蛋白对反馈抑制剂丝氨酸(反馈脱敏等位基因)的敏感性，因此允许在丝氨酸存在下增加活性。EP 0 931 833(Ajinomoto)或EP 0 620 853(Wacker)中描述了脱敏等位基因(即反馈不敏感等位基因)的例子。

在另一个实施方案中，重组微生物(特别是细菌)包含这样的修饰，其刺激进入羟基丙酮酸生物合成途径的流。可以通过增加丝氨酸转氨酶或丝氨酸氧化酶(对于从丝氨酸作为前体开始的途径)的表达水平，或通过增加3-磷酸羟基丙酮酸磷酸酶的表达来实现这个结果。可以通过引入和过表达来自R.opacus的编码L-氨基酸氧化酶的基因，或通过将增加相应蛋白质活性的突变引入基因，来增加丝氨酸氧化酶的表达水平。可以通过引入驱动大肠杆菌serC基因表达的人工启动子、通过增加细胞中的拷贝数或通过将增加相应蛋白质活性的突变引入serC基因中，来增加丝氨酸转氨酶的表达。可以通过引入驱动大肠杆菌yeaB基因或serB基因表达的人工启动子、通过增加细胞中的拷贝数或通过将增加相应蛋白质活性的突变引入yeaB基因或serB基因中，来增加3-磷酸羟基丙酮酸磷酸酶的表达。可以通过引入和过表达来自酿酒酵母的GPP2基因，或通过将增加相应蛋白质活性的突变引入GPP2基因，来增加3-磷酸羟基丙酮酸磷酸酶的表达。

在本公开的一个进一步的实施方案中，重组微生物(特别是细菌)包含修饰，以呈现减弱水平的乙醇醛转化为除乙二醇之外的其他化合物。这可以通过降低消耗乙醇醛的酶如羟基苏氨酸醛缩酶(由UaE编码)或乙醇醛脱氢酶(由aldA、aldB编码)的水平来实现。可以通过用较低强度的启动子替换天然启动子或通过使相应的信使RNA或蛋白质不稳定的元件，来减弱这些基因。如果需要，也可以通过删除相应的DNA序列来实现基因的完全衰减。

在本公开的一个进一步的实施方案中，通过使用不依赖于磷酸烯醇式丙酮酸(PEP)作为磷供体的糖输入系统，如已知转运葡萄糖的galP，或通过向糖-磷酸转移酶系统提供更多的磷酸烯醇式丙酮酸(PEP)，来提高糖输入的效率。存在多种可用于增加微生物中PEP的可得性的方法。特别地，这可以通过减弱反应PEP→丙酮酸来实现。优选地，在所述株中减弱选自pykA和pykF的至少一个编码丙酮酸激酶的基因，以获得该结果。增加PEP可得性的另一种方法是有利于反应丙酮酸→PEP。这可以通过增加催化上述反应的磷酸烯醇式丙酮酸合酶的活性来实现。该酶由ppsA基因编码。因此，在微生物中，优先增加ppsA基因的表达。两种修饰可以同时存在于微生物中。

在本公开的一个进一步的实施方案中，重组微生物(特别是细菌)包含修饰，以呈现减弱水平的丝氨酸转化为除乙二醇之外的其他化合物。可以通过减弱消耗丝氨酸的酶的水平，如丝氨酸脱氨酶(由sdaA、sdaB和/或tdcG编码)、丝氨酸转乙酰酶(由cysE编码)、色氨酸合酶(由trpAB编码)或丝氨酸羟甲基转移酶(由glyA编码)，来实现该结果。可以通过用较低强度的启动子替换天然启动子或通过使相应的信使RNA或蛋白质不稳定的元件，来减弱这些基因。如果需要，也可以通过删除相应的DNA序列来实现基因的完全衰减。

在本公开的一个进一步的实施方案中，重组微生物(特别是细菌)包含修饰，以呈现减弱的水平将羟基丙酮酸转化为除乙醇醛之外的其他化合物。可以通过减弱消耗羟基丙酮酸的酶的水平，如羟基丙酮酸还原酶(由ghrA编码)或羟基丙酮酸异构酶(由hyi编码)，来实现该结果。可以通过用较低强度的启动子替换天然启动子或通过使相应的信使RNA或蛋白质不稳定的元件，来减弱这些基因。如果需要，也可以通过删除相应的DNA序列来实现基因的完全衰减。

在一些实施方案中，本申请涉及一种能够由一种或多种己糖原料生产MEG(或乙醇酸)的重组微生物，其中来自实施方案[A]或来自实施方案[B](和任选地包括实施方案[C])并且另外具有实施方案[D]、[E]、[F]和[G]中的一个或多个的重组微生物进一步包含一种或多种用于生产MEG(或乙醇酸)的C3生物合成途径。用于生产MEG的C3生物合成途径例如如WO 2011/130378(Genomatica)中所述，其通过引用整体并入本文。

在一些实施方案中，本公开提供重组微生物，其包含具有至少一种编码乙二醇途径酶的外源核酸的乙二醇途径，所述外源核酸以足以产生乙二醇的量表达，所述乙二醇途径包括丝氨酸转氨酶、丝氨酸氧化还原酶(脱氨基)、羟基丙酮酸脱羧酶、乙醇醛还原酶、丝氨酸脱羧酶、乙醇胺转氨酶、乙醇胺氧化还原酶(脱氨基)、羟基丙酮酸还原酶或甘油酸脱羧酶。

在一些实施方案中，重组微生物包含具有至少一种编码乙二醇途径酶的外源核酸的乙二醇途径，所述外源核酸以足以产生乙二醇的量表达，所述乙二醇途径包括丝氨酸转氨酶或丝氨酸氧化还原酶(脱氨基)；羟基丙酮酸脱羧酶和乙醇醛还原酶。

在一些实施方案中，重组微生物包含具有至少一种编码乙二醇途径酶的外源核酸的乙二醇途径，所述外源核酸以足以产生乙二醇的量表达，所述乙二醇途径包括丝氨酸转氨酶或丝氨酸氧化还原酶(脱氨基)；羟基丙酮酸还原酶和甘油酸脱羧酶。

在一些实施方案中，重组微生物包含具有至少一种编码乙二醇途径酶的外源核酸的乙二醇途径，所述外源核酸以足以产生乙二醇的量表达，所述乙二醇途径包括丝氨酸脱羧酶；乙醇胺转氨酶或乙醇胺氧化还原酶(脱氨基)和乙醇醛还原酶。

在一些实施方案中，本公开提供重组微生物，其包含具有至少一种编码乙二醇途径酶的外源核酸的乙二醇途径，所述外源核酸以足以产生乙二醇的量表达，所述乙二醇途径包括羟基丙酮酸脱羧酶、乙醇醛还原酶、羟基丙酮酸还原酶、甘油酸脱羧酶、3-磷酸甘油酸磷酸酶和甘油酸激酶。

在一些实施方案中，重组微生物包含具有至少一种编码乙二醇途径酶的外源核酸的乙二醇途径，所述外源核酸以足以产生乙二醇的量表达，所述乙二醇途径包括羟基丙酮酸还原酶；羟基丙酮酸脱羧酶和乙醇醛还原酶。

在一些实施方案中，重组微生物包含具有至少一种编码乙二醇途径酶的外源核酸的乙二醇途径，所述外源核酸以足以产生乙二醇的量表达，所述乙二醇途径包括3-磷酸甘油酸磷酸酶或甘油酸激酶；羟基丙酮酸还原酶；羟基丙酮酸脱羧酶和乙醇醛还原酶。

在一些实施方案中，重组微生物包含具有至少一种编码乙二醇途径酶的外源核酸的乙二醇途径，所述外源核酸以足以产生乙二醇的量表达，所述乙二醇途径包括甘油酸脱羧酶。

在一些实施方案中，重组微生物包含具有至少一种编码乙二醇途径酶的外源核酸的乙二醇途径，所述外源核酸以足以产生乙二醇的量表达，所述乙二醇途径包括3-磷酸甘油酸磷酸酶或甘油酸激酶和甘油酸脱羧酶。

在一些实施方案中，本公开提供了包含乙二醇途径的重组微生物，其中所述重组微生物包含至少一种编码酶或蛋白质的外源核酸，所述酶或蛋白质将底物转化为产物，选自以下：丝氨酸转化为羟基丙酮酸、羟基丙酮酸转化为乙醇醛、乙醇醛转化为乙二醇、丝氨酸转化为乙醇胺、乙醇胺转化为乙醇醛、3-磷酸甘油酸转化为甘油酸、甘油酸转化为羟基丙酮酸、羟基丙酮酸转化为甘油酸以及甘油酸转化为乙二醇。本领域技术人员将理解，这些仅是示例性的，本领域技术人员基于本文的教导，可以容易地确定适用于生产所需产物并且可获得用于将底物转化为产物的适当活性的本文公开的任何底物-产物对。因此，本公开内容提供了重组微生物，其含有至少一种编码酶或蛋白质的外源核酸，其中所述酶或蛋白质转化乙二醇途径的底物和产物。

虽然在本文中笼统地描述为含有乙二醇途径的重组微生物，但应理解，本公开另外提供了包含至少一种编码乙二醇途径酶的外源核酸的重组微生物，所述外源核酸以足以产生乙二醇途径的中间体的量表达。因此，除了含有产生乙二醇的乙二醇途径的重组微生物之外，本公开还提供了包含至少一种编码乙二醇途径酶的外源核酸的重组微生物，其中所述微生物产生乙二醇途径中间体，例如羟基丙酮酸、乙醇胺、乙醇醛或甘油酸。

在一些实施方案中，丝氨酸转氨酶或丝氨酸氧化还原酶(脱氨基)催化丝氨酸转化为羟基丙酮酸。在一些实施方案中，羟基丙酮酸脱羧酶催化羟基丙酮酸转化为乙醇醛。在一些实施方案中，乙醇醛还原酶催化乙醇醛转化为乙二醇。在一些实施方案中，丝氨酸脱羧酶催化丝氨酸转化为乙醇胺。在一些实施方案中，乙醇胺转氨酶或乙醇胺氧化还原酶(脱氨基)催化乙醇胺转化为乙醇醛。在一些实施方案中，羟基丙酮酸还原酶催化甘油酸转化为羟基丙酮酸。在一些实施方案中，甘油酸脱羧酶催化甘油酸转化为乙二醇。在一些实施方案中，3-磷酸甘油酸磷酸酶或甘油酸激酶催化3-磷酸甘油酸转化为甘油酸。

在一些实施方案中，生产MEG(或乙醇酸)如下：将一种或多种己糖原料无损转化为一种或多种戊糖-5-磷酸中间体，然后将一种或多种戊糖-5-磷酸中间体转化为一种或多种戊糖和/或戊糖-1-磷酸中间体，然后通过C2途径，将一种或多种戊糖和/或戊糖-1-磷酸中间体转化为MEG(或乙醇酸)和DHAP或丙酮酸，以及通过C3途径，将DHAP或丙酮酸转化为MEG(或乙醇酸)。

在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[H]，用于生产MEG(或乙醇酸)的C3途径包括实施方案[K]。在其他实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[H]，用于生产MEG(或乙醇酸)的C3途径包括实施方案[L]。在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[I]，用于生产MEG(或乙醇酸)的C3途径包括实施方案[K]。在进一步的实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[I]，用于生产MEG(或乙醇酸)的C3途径包括实施方案[L]。在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[J]，用于生产MEG(或乙醇酸)的C3途径包括实施方案[K]。在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[J]，用于生产MEG(或乙醇酸)的C3途径包括实施方案[L]。

[K]在一个实施方案中，本申请涉及一种能够由一种或多种己糖原料生产单乙二醇(MEG)(或乙醇酸)的重组微生物，其中来自实施方案[A]或来自实施方案[B](和任选地包括实施方案[C])并且另外包括实施方案[D]、[E]、[F]和[G]中的一个或多个、进一步包括实施方案[H]、[I]和[J]中的一个或多个的重组微生物进一步表达以下(a)至(h)中的一种或多种：

(a)至少一种内源性或外源性核酸分子，其编码具有3-磷酸甘油酸脱氢酶活性的酶，该酶催化3-磷酸甘油酸转化为3-磷酸羟基丙酮酸；

(b)至少一种内源性或外源性核酸分子，其编码具有磷酸丝氨酸转氨酶活性的酶，该酶催化来自(a)的3-磷酸羟基丙酮酸转化为磷酸-L-丝氨酸；

(c)至少一种内源性或外源性核酸分子，其编码具有3-磷酸羟基丙酮酸磷酸酶活性的酶，该酶催化来自(a)的3-磷酸羟基丙酮酸转化为羟基丙酮酸；

(d)至少一种内源性或外源性核酸分子，其编码具有磷酸丝氨酸磷酸酶活性的酶，该酶催化来自(b)的磷酸-L-丝氨酸转化为L-丝氨酸；

(e)至少一种内源性或外源性核酸分子，其编码具有L-丝氨酸转氨酶或丝氨酸氧化酶活性的酶，该酶催化来自(d)的L-丝氨酸转化为羟基丙酮酸；

(f)至少一种内源性或外源性核酸分子，其编码具有羟基丙酮酸脱羧酶活性的酶，该酶催化来自(c)或(e)的羟基丙酮酸转化为乙醇醛；

其中来自实施方案[H]和/或[I]的产生的中间体DHAP和/或来自实施方案[J]的丙酮酸分别通过微生物中的内源性糖酵解或糖异生转化为3-磷酸甘油酸，并且其中生产MEG(或乙醇酸)。

[L]在一个实施方案中，本申请涉及一种能够由一种或多种己糖原料生产单乙二醇(MEG)(或乙醇酸)的重组微生物，其中来自实施方案[A]或来自实施方案[B](和任选地包括实施方案[C])并且另外包括实施方案[D]、[E]、[F]和[G]中的一个或多个、进一步包括实施方案[H]、[I]和[J]中的一个或多个的重组微生物进一步表达以下(a)至(j)中的一种或多种：

(a)至少一种内源性或外源性核酸分子，其编码具有2-磷酸甘油酸磷酸酶活性的酶和/或具有甘油酸-2-激酶活性的酶，该酶催化2-磷酸甘油酸转化为甘油酸；

(b)至少一种内源性或外源性核酸分子，其编码具有3-磷酸甘油酸磷酸酶活性的酶或具有甘油酸-3-激酶活性的酶，该酶催化3-磷酸甘油酸转化为甘油酸；

(c)至少一种内源性或外源性核酸分子，其编码具有羟基丙酮酸还原酶活性的酶，该酶催化来自(a)和/或(b)的甘油酸转化为羟基丙酮酸；

(d)至少一种内源性或外源性核酸分子，其编码具有丝氨酸转氨酶活性的酶或具有丝氨酸氧化还原酶(脱氨基)活性的酶，该酶催化L-丝氨酸转化为羟基丙酮酸；

(e)至少一种内源性或外源性核酸分子，其编码具有L-丝氨酸脱羧酶活性的酶，该酶催化L-丝氨酸转化为乙醇胺；

(f)至少一种内源性或外源性核酸分子，其编码具有羟基丙酮酸脱羧酶活性的酶，该酶催化来自(c)和/或(d)的羟基丙酮酸转化为乙醇醛；

(g)至少一种内源性或外源性核酸分子，其编码具有乙醇胺转氨酶或乙醇胺氧化还原酶(脱氨基)活性的酶，该酶催化来自(e)的乙醇胺转化为乙醇醛；

(h)至少一种内源性或外源性核酸分子，其编码具有甘油酸脱羧酶活性的酶，该酶催化来自(a)和/或(b)的甘油酸转化为MEG；

(i)至少一种内源性或外源性核酸分子，其编码具有乙醇醛还原酶活性的酶，该酶催化来自(f)和/或(g)的乙醇醛转化为MEG；

(j)至少一种内源性或外源性核酸分子，其编码具有乙醇醛脱氢酶活性的酶，该酶催化来自(f)和/或(g)的乙醇醛转化为乙醇酸；

其中来自实施方案[H]和/或[I]的产生的中间体DHAP和/或来自实施方案[J]的丙酮酸分别通过微生物中的内源性糖酵解或糖异生转化为3-磷酸甘油酸和/或2-磷酸甘油酸，并且其中生产MEG(或乙醇酸)。

在一些实施方案中，2-酮酸脱羧酶、羟基丙酮酸脱羧酶或2-氧代戊二酸脱羧酶将羟基丙酮酸转化为乙醇醛。在一些实施方案中，将羟基丙酮酸转化为乙醇醛的酶由与Kivd、dxs或SucA具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在一些实施方案中，2-酮酸脱羧酶是来自乳酸乳球菌的Kivd。在又一个实施方案中，编码2-酮酸脱羧酶的一种或多种核酸分子包含SEQ ID NO：224中列出的氨基酸序列。在一个进一步的实施方案中，编码2-酮酸脱羧酶的一种或多种核酸分子包含SEQID NO：223中列出的核酸序列。在一些实施方案中，2-氧代戊二酸脱羧酶是来自大肠杆菌的SucA。在又一个实施方案中，编码2-氧代戊二酸脱羧酶的一种或多种核酸分子包含SEQ IDNO：226中列出的氨基酸序列。在一个进一步的实施方案中，编码2-氧代戊二酸脱羧酶的一种或多种核酸分子包含SEQ ID NO：225中列出的核酸序列。

在一些实施方案中，羟基醛还原酶可以是乙醇醛还原酶。在一些实施方案中，具有乙醇醛还原酶活性的酶由与yqhD或FucO具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在一些实施方案中，具有乙醇醛还原酶活性的酶由获自微生物的一种或多种核酸分子编码，所述微生物选自大肠杆菌和酿酒酵母。在另一个实施方案中，一种或多种核酸分子选自gldA、GRE2、GRE3、yqhD、ydjG、fucO、yafB(dkgB)和/或yqhE(dkgA)，或其同源物。在另一个实施方案中，一种或多种核酸分子是yqhD。在一些实施方案中，yqhD包含G149E突变。在一个进一步的实施方案中，具有乙醇醛还原酶活性的酶包含选自SEQ ID NO：13、15、17、20、23、25、28、30和32的氨基酸序列。在一个仍进一步的实施方案中，具有乙醇醛还原酶活性的酶由选自SEQ ID NO：12、14、16、18、19、21、22、24、26、27、29和31的核酸序列编码。

在一些实施方案中，3-磷酸甘油酸脱氢酶可以是3-磷酸-羟基丙酮酸还原酶或2-氧代戊二酸还原酶。在一些实施方案中，具有3-磷酸-羟基丙酮酸还原酶活性的酶由与serA具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在一些实施方案中，具有3-磷酸-羟基丙酮酸还原酶活性的酶是来自大肠杆菌的serA。在又一个实施方案中，编码具有3-磷酸-羟基丙酮酸还原酶活性的酶的一种或多种核酸分子包含SEQ ID NO：228中列出的氨基酸序列。在一个进一步的实施方案中，编码具有3-磷酸-羟基丙酮酸还原酶活性的酶的一种或多种核酸分子包含SEQ ID NO：227中列出的核酸序列。

在一些实施方案中，磷酸丝氨酸转氨酶可以是L-丝氨酸转氨酶、丝氨酸转氨酶或丝氨酸-丙酮酸转氨酶。在一些实施方案中，具有磷酸丝氨酸转氨酶活性的酶由与serC具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在一些实施方案中，具有磷酸丝氨酸转氨酶活性的酶是来自大肠杆菌的serC。在又一个实施方案中，编码具有磷酸丝氨酸转氨酶活性的酶的一种或多种核酸分子包含SEQ IDNO：230中列出的氨基酸序列。在一个进一步的实施方案中，编码具有磷酸丝氨酸转氨酶活性的酶的一种或多种核酸分子包含SEQ ID NO：229中列出的核酸序列。

在一些实施方案中，具有丝氨酸-丙酮酸转氨酶活性的酶是来自人的AGXT1。在又一个实施方案中，编码具有丝氨酸-丙酮酸转氨酶活性的酶的一种或多种核酸分子包含SEQID NO：244中列出的氨基酸序列。在一个进一步的实施方案中，编码具有丝氨酸-丙酮酸转氨酶活性的酶的一种或多种核酸分子包含SEQ ID NO：243中列出的核酸序列。

在一些实施方案中，具有3-磷酸-羟基丙酮酸磷酸酶活性的酶由与yeaB(nudL)具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在一些实施方案中，具有3-磷酸-羟基丙酮酸磷酸酶活性的酶是来自大肠杆菌的yeaB(nudL)。在又一个实施方案中，编码具有3-磷酸-羟基丙酮酸磷酸酶活性的酶的一种或多种核酸分子包含SEQ ID NO：232中列出的氨基酸序列。在一个进一步的实施方案中，编码具有3-磷酸-羟基丙酮酸磷酸酶活性的酶的一种或多种核酸分子包含SEQ ID NO：231中列出的核酸序列。

在一些实施方案中，具有磷酸丝氨酸磷酸酶活性的酶由与serB具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在一些实施方案中，具有磷酸丝氨酸磷酸酶活性的酶是来自大肠杆菌的serB。在又一个实施方案中，编码具有磷酸丝氨酸磷酸酶活性的酶的一种或多种核酸分子包含SEQ ID NO：234中列出的氨基酸序列。在一个进一步的实施方案中，编码具有磷酸丝氨酸磷酸酶活性的酶的一种或多种核酸分子包含SEQ ID NO：233中列出的核酸序列。

在一些实施方案中，具有2-磷酸甘油酸磷酸酶活性的酶或具有甘油酸-2-激酶活性的酶将2-磷酸甘油酸转化为甘油酸。在一些实施方案中，将2-磷酸甘油酸转化为甘油酸的酶由与phoA、glxK或garK具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在一些实施方案中，具有2-磷酸甘油酸磷酸酶活性的酶是来自大肠杆菌的phoA。在又一个实施方案中，编码具有2-磷酸甘油酸磷酸酶活性的酶的一种或多种核酸分子包含SEQ ID NO：246中列出的氨基酸序列。在一个进一步的实施方案中，编码具有2-磷酸甘油酸磷酸酶活性的酶的一种或多种核酸分子包含SEQ ID NO：245中列出的核酸序列。在一些实施方案中，具有甘油酸-2-激酶活性的酶是来自大肠杆菌的glxK。在又一个实施方案中，编码具有甘油酸-2-激酶活性的酶的一种或多种核酸分子包含SEQ ID NO：250中列出的氨基酸序列。在一个进一步的实施方案中，编码具有甘油酸-2-激酶活性的酶的一种或多种核酸分子包含SEQ ID NO：249中列出的核酸序列。在一些实施方案中，具有甘油酸-2-激酶活性的酶是来自大肠杆菌的garK。在又一个实施方案中，编码具有甘油酸-2-激酶活性的酶的一种或多种核酸分子包含SEQ ID NO：252中列出的氨基酸序列。在一个进一步的实施方案中，编码具有甘油酸-2-激酶活性的酶的一种或多种核酸分子包含SEQ ID NO：251中列出的氨基酸序列。

在一些实施方案中，具有3-磷酸甘油酸磷酸酶活性的酶或具有甘油酸-3-激酶活性的酶将3-磷酸甘油酸转化为甘油酸。在一些实施方案中，将3-磷酸甘油酸转化为甘油酸的酶由与phoA或GLYK具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在一些实施方案中，具有3-磷酸甘油酸磷酸酶活性的酶是来自大肠杆菌的phoA。在又一个实施方案中，编码具有3-磷酸甘油酸磷酸酶活性的酶的一种或多种核酸分子包含SEQ ID NO：246中列出的氨基酸序列。在一个进一步的实施方案中，编码具有3-磷酸甘油酸磷酸酶活性的酶的一种或多种核酸分子包含SEQ ID NO：245中列出的核酸序列。在一些实施方案中，具有甘油酸-3-激酶活性的酶是来自拟南芥的GLYK。在又一个实施方案中，编码具有甘油酸-3-激酶活性的酶的一种或多种核酸分子包含SEQ IDNO：248中列出的氨基酸序列。在一个进一步的实施方案中，编码具有甘油酸-3-激酶活性的酶的一种或多种核酸分子包含SEQ ID NO：247中列出的核酸序列。

在一些实施方案中，具有羟基丙酮酸还原酶活性的酶将甘油酸转化为羟基丙酮酸。在一些实施方案中，将甘油酸转化为羟基丙酮酸的酶由与ghrB具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在一些实施方案中，具有羟基丙酮酸还原酶活性的酶是来自大肠杆菌的ghrB。在又一个实施方案中，编码具有羟基丙酮酸还原酶活性的酶的一种或多种核酸分子包含SEQ ID NO：242中列出的氨基酸序列。在一个进一步的实施方案中，编码具有羟基丙酮酸还原酶活性的酶的一种或多种核酸分子包含SEQ ID NO：241中列出的核酸序列。

在一些实施方案中，具有丝氨酸脱羧酶活性的酶将L-丝氨酸转化为乙醇胺。

在一些实施方案中，将L-丝氨酸转化为乙醇胺的酶由与SDC具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。

在一些实施方案中，具有丝氨酸脱羧酶活性的酶是来自拟南芥的SDC。在又一个实施方案中，编码具有丝氨酸脱羧酶活性的酶的一种或多种核酸分子包含SEQ ID NO：236中列出的氨基酸序列。在一个进一步的实施方案中，编码具有丝氨酸脱羧酶活性的酶的一种或多种核酸分子包含SEQ ID NO：235中列出的核酸序列。

在一些实施方案中，具有乙醇胺转氨酶活性的酶或具有乙醇胺氧化还原酶(脱氨基)活性的酶将乙醇胺转化为乙醇醛。在一些实施方案中，将乙醇胺转化为乙醇醛的酶由与alaA或tynA具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在一些实施方案中，具有乙醇胺转氨酶活性的酶是来自大肠杆菌的alaA。在又一个实施方案中，编码具有乙醇胺转氨酶活性的酶的一种或多种核酸分子包含SEQ ID NO：240中列出的氨基酸序列。在一个进一步的实施方案中，编码具有乙醇胺转氨酶活性的酶的一种或多种核酸分子包含SEQ ID NO：239中列出的核酸序列。在一些实施方案中，具有乙醇胺氧化还原酶(脱氨基)活性的酶是来自大肠杆菌的tynA。在又一个实施方案中，编码具有乙醇胺氧化还原酶(脱氨基)活性的酶的一种或多种核酸分子包含SEQ ID NO：238中列出的氨基酸序列。在一个进一步的实施方案中，编码具有乙醇胺氧化还原酶(脱氨基)活性的酶的一种或多种核酸分子包含SEQ ID NO：237中列出的核酸序列。

另一方面，生产MEG(或乙醇酸)如下：将一种或多种己糖原料无损转化为一种或多种戊糖-5-磷酸中间体，然后将一种或多种戊糖-5-磷酸中间体转化为一种或多种戊糖和/或戊糖-1-磷酸中间体，然后通过C2途径，将一种或多种戊糖和/或戊糖-1-磷酸中间体转化为MEG(或乙醇酸)和DHAP或丙酮酸，以及通过C3途径，将DHAP或丙酮酸转化为一种或多种联产品。在一些实施方案中，C2途径包含实施方案[H]。在进一步的实施方案中，C2途径包含实施方案[I]。在仍进一步的实施方案中，C2途径包含实施方案[J]。

通过C2途径联产MEG(或乙醇酸)和通过C3途径联产丙酮、异丙醇、丙烯和/或异丁烯

在一些实施方案中，生产MEG(或乙醇酸)如下：将一种或多种己糖原料无损转化为一种或多种戊糖-5-磷酸中间体，然后将一种或多种戊糖-5-磷酸中间体转化为一种或多种戊糖和/或戊糖-1-磷酸中间体，然后通过C2途径，将一种或多种戊糖和/或戊糖-1-磷酸中间体转化为MEG(或乙醇酸)和DHAP或丙酮酸，以及通过C3途径，将DHAP或丙酮酸转化为丙酮。在一些实施方案中，C2途径包含实施方案[H]。在进一步的实施方案中，C2途径包含实施方案[I]。在仍进一步的实施方案中，C2途径包含实施方案[J]。

在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[H]，用于生产丙酮的C3途径包括实施方案[M]。在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[I]，用于生产丙酮的C3途径包括实施方案[M]。在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[J]，用于生产丙酮的C3途径包括实施方案[M]。

[M]在一个实施方案中，本申请涉及一种能够由一种或多种己糖原料联产单乙二醇(MEG)(或乙醇酸)和丙酮的重组微生物，其中来自实施方案[A]或来自实施方案[B](和任选地包括实施方案[C])并且另外包括实施方案[D]、[E]、[F]和[G]中的一个或多个、进一步包括实施方案[H]、[I]和[J]中的一个或多个的重组微生物进一步表达以下(a)至(c)中的一种或多种：

(a)至少一种内源性或外源性核酸分子，其编码具有硫解酶或乙酰辅酶A乙酰转移酶活性的酶，该酶催化乙酰辅酶A转化为乙酰乙酰辅酶A；

(b)至少一种内源性或外源性核酸分子，其编码具有乙酰辅酶A：乙酰乙酸辅酶A转移酶活性的酶或具有乙酸：乙酰乙酰辅酶A水解酶活性的酶，该酶催化来自(a)的乙酰乙酰辅酶A转化为乙酰乙酸；和/或

(c)至少一种内源性或外源性核酸分子，其编码具有乙酰乙酸脱羧酶活性的酶，该酶催化来自(b)的乙酰乙酸转化为丙酮；

其中来自实施方案[H]和/或[I]的产生的中间体DHAP和/或来自实施方案[J]的丙酮酸通过微生物中的内源性糖酵解转化为乙酰辅酶A，并且其中联产MEG(或乙醇酸)和丙酮。

在一些实施方案中，生产MEG(或乙醇酸)如下：将一种或多种己糖原料无损转化为一种或多种戊糖-5-磷酸中间体，然后将一种或多种戊糖-5-磷酸中间体转化为一种或多种戊糖和/或戊糖-1-磷酸中间体，然后通过C2途径，将一种或多种戊糖和/或戊糖-1-磷酸中间体转化为MEG(或乙醇酸)和DHAP或丙酮酸，以及通过C3途径，将DHAP或丙酮酸转化为异丁烯。在一些实施方案中，C2途径包含实施方案[H]。在进一步的实施方案中，C2途径包含实施方案[I]。在仍进一步的实施方案中，C2途径包含实施方案[J]。

在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[H]，用于生产异丁烯的C3途径包括实施方案[N]。在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[I]，用于生产异丁烯的C3途径包括实施方案[N]。在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[J]，用于生产异丁烯的C3途径包括实施方案[N]。

[N]在一些实施方案中，本申请涉及一种能够由一种或多种己糖原料、通过丙酮或HMG-辅酶A(HMG-CoA)联产单乙二醇(MEG)(或乙醇酸)和异丁烯的重组微生物，其中来自实施方案[A]或来自实施方案[B](和任选地包括实施方案[C])并且另外包括实施方案[D]、[E]、[F]和[G]中的一个或多个、进一步包括实施方案[H]、[I]和[J]中的一个或多个的重组微生物进一步表达以下(a)至(d)中的一种或多种：

(b)至少一种内源性或外源性核酸分子，其编码具有乙酰辅酶A：乙酰乙酸辅酶A转移酶活性的酶或具有乙酸：乙酰乙酰辅酶A水解酶活性的酶，该酶催化来自(a)的乙酰乙酰辅酶A转化为乙酰乙酸；

(d)至少一种内源性或外源性核酸分子，其编码具有3-羟基异戊酸合酶活性的酶，该酶催化来自(c)的丙酮和乙酰辅酶A转化为3-羟基异戊酸(3HIV)；

或

其中所述重组微生物表达以下(e)至(j)中的一种或多种：

(e)至少一种内源性或外源性核酸分子，其编码具有硫解酶或乙酰辅酶A乙酰转移酶活性的酶，该酶催化乙酰辅酶A转化为乙酰乙酰辅酶A；

(f)至少一种内源性或外源性核酸分子，其编码具有羟甲基戊二酰辅酶A合酶活性的酶，该酶催化来自(e)的乙酰乙酰辅酶A和乙酰辅酶A转化为3-羟基-3-甲基戊二酰辅酶A(HMG-CoA)；

(g)至少一种内源性或外源性核酸分子，其编码具有甲基戊烯二酰辅酶A水合酶活性的酶，该酶催化来自(f)的HMG-CoA转化为3-甲基戊烯二酰辅酶A；

(h)至少一种内源性或外源性核酸分子，其编码具有甲基巴豆酰辅酶A羧化酶活性的酶，该酶催化来自(g)的3-甲基戊烯二酰辅酶A转化为3-甲基巴豆酰辅酶A；

(i)至少一种内源性或外源性核酸分子，其编码具有甲基巴豆酰辅酶A水合酶活性的酶，该酶催化来自(h)的3-甲基巴豆酰辅酶A转化为3-羟基异戊酰辅酶A；

(j)至少一种内源性或外源性核酸分子，其编码具有3-羟基异戊酰辅酶A硫酯酶活性的酶，该酶催化来自(i)的3-羟基异戊酰辅酶A转化为3HIV；

其中所述重组微生物进一步表达(a1)和(a2)和/或(b1)，选自：

(a1)至少一种内源性或外源性核酸分子，其编码具有3HIV激酶活性的酶，该酶催化来自(d)或(j)的3HIV转化为3HIV-3-磷酸；

(a2)至少一种内源性或外源性核酸分子，其编码具有3HIV-3-磷酸脱羧酶活性的酶，该酶催化来自(a1)的3HIV-3-磷酸转化为异丁烯；

(b1)至少一种内源性或外源性核酸分子，其编码具有3HIV脱羧酶活性的酶，该酶催化来自(d)或(j)的3HIV转化为异丁烯；

其中来自实施方案[H]和/或[I]的产生的中间体DHAP和/或来自实施方案[J]的丙酮酸通过微生物中的内源性糖酵解转化为乙酰辅酶A，并且其中联产MEG(或乙醇酸)和异丁烯。

在一些实施方案中，生产MEG(或乙醇酸)如下：将一种或多种己糖原料无损转化为一种或多种戊糖-5-磷酸中间体，然后将一种或多种戊糖-5-磷酸中间体转化为一种或多种戊糖和/或戊糖-1-磷酸中间体，然后通过C2途径，将一种或多种戊糖和/或戊糖-1-磷酸中间体转化为MEG(或乙醇酸)和DHAP或丙酮酸，以及通过C3途径，将DHAP或丙酮酸转化为异丙醇。在一些实施方案中，C2途径包含实施方案[H]。在进一步的实施方案中，C2途径包含实施方案[I]。在仍进一步的实施方案中，C2途径包含实施方案[J]。

[O]在一个实施方案中，来自实施方案[M]和/或[N](任选地包括实施方案[EE])的重组微生物任选地进一步表达至少一种内源性或外源性核酸分子，其编码具有仲醇脱氢酶活性的酶，该酶催化丙酮转化为异丙醇。

在一些实施方案中，醇脱氢酶与来自梭菌的醇脱氢酶具有至少70％的序列同一性、至少80％的序列同一性或至少90％的序列同一性。在其他实施方案中，醇脱氢酶是选自拜氏梭菌(Clostridium beijerinckii)adh和食碳梭菌(Clostridium carboxidivorans)adh的醇脱氢酶。在进一步的实施方案中，醇脱氢酶包含选自SEQ ID NO：138和140的氨基酸序列。在一个仍进一步的实施方案中，醇脱氢酶由选自SEQ ID NO：136、137和139的核酸序列编码。

在一些实施方案中，生产MEG(或乙醇酸)如下：将一种或多种己糖原料无损转化为一种或多种戊糖-5-磷酸中间体，然后将一种或多种戊糖-5-磷酸中间体转化为一种或多种戊糖和/或戊糖-1-磷酸中间体，然后通过C2途径，将一种或多种戊糖和/或戊糖-1-磷酸中间体转化为MEG(或乙醇酸)和DHAP或丙酮酸，以及通过C3途径，将DHAP或丙酮酸转化为丙烯。在一些实施方案中，C2途径包含实施方案[H]。在进一步的实施方案中，C2途径包含实施方案[I]。在仍进一步的实施方案中，C2途径包含实施方案[J]。

[P]在另一个实施方案中，来自实施方案[O](任选地包括实施方案[EE])的重组微生物任选地进一步表达至少一种内源性或外源性核酸分子，其编码具有脱水酶活性的酶，该酶催化异丙醇转化为丙烯。

在上文公开的用于联产异丁烯的任何途径的一个实施方案中，具有3-羟基异戊酸合酶活性的酶由一种或多种获自微生物的核酸分子编码，所述微生物选自鼠属物种(Mussp.)、酵母属物种、乳杆菌属物种和单胞菌属物种(Polaromonas sp.)。在另一个实施方案中，具有3-羟基异戊酸合酶活性的酶由一种或多种获自微生物的核酸分子编码，所述微生物选自小鼠、酿酒酵母、卷曲乳杆菌(Lactobacillus crispatus)和食萘极地单胞菌(Polaromonas naphthalenivorans)。在一些实施方案中，编码具有3-羟基异戊酸合酶活性的酶的一种或多种核酸分子选自Hmgcs1、ERG13、PksG和/或Pnap_0477，或其同源物。在一个进一步的实施方案中，编码具有3-羟基异戊酸合酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO：105、107、109和111的氨基酸序列。在又一个实施方案中，编码具有3-羟基异戊酸合酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO：104、106、108和110的氨基酸序列。

在上文公开的用于联产异丁烯的任何途径的一个实施方案中，具有羟甲基戊二酰辅酶A合酶活性的酶由一种或多种获自酵母属物种的核酸分子编码。在另一个实施方案中，具有羟甲基戊二酰辅酶A合酶活性的酶由获自酿酒酵母的一种或多种核酸分子编码。在一些实施方案中，编码具有羟甲基戊二酰辅酶A合酶活性的酶的一种或多种核酸分子是HmgS，或其同源物。在一个进一步的实施方案中，编码具有羟甲基戊二酰辅酶A合酶活性的酶的一种或多种核酸分子包含SEQ ID NO：123中列出的氨基酸序列。在又一个实施方案中，编码具有羟甲基戊二酰辅酶A合酶活性的酶的一种或多种核酸分子包含SEQ ID NO：122中列出的核酸序列。

在上文公开的用于联产异丁烯的任何途径的一个实施方案中，具有甲基戊烯二酰辅酶A水合酶活性的酶由一种或多种获自假单胞菌属物种的核酸分子编码。在另一个实施方案中，具有甲基戊烯二酰辅酶A水合酶活性的酶由获自恶臭假单胞菌的一种或多种核酸分子编码。在一些实施方案中，编码具有甲基戊烯二酰辅酶A水合酶活性的酶的一种或多种核酸分子是liuC，或其同源物。在一个进一步的实施方案中，编码具有甲基戊烯二酰辅酶A水合酶活性的酶的一种或多种核酸分子包含SEQ ID NO：125中列出的氨基酸序列。在又一个实施方案中，编码具有甲基戊烯二酰辅酶A水合酶活性的酶的一种或多种核酸分子包含SEQ ID NO：124中列出的核酸序列。

在上文公开的用于联产异丁烯的任何途径的一个实施方案中，具有甲基巴豆酰辅酶A羧化酶活性的酶由一种或多种获自假单胞菌属物种的核酸分子编码。在另一个实施方案中，具有甲基巴豆酰辅酶A羧化酶活性的酶由获自铜绿假单胞菌的一种或多种核酸分子编码。在一些实施方案中，编码具有甲基巴豆酰辅酶A羧化酶活性的酶的一种或多种核酸分子是liuB和/或liuD，或其同源物。在一个进一步的实施方案中，编码具有甲基巴豆酰辅酶A羧化酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO：127和129的氨基酸序列。在又一个实施方案中，编码具有甲基巴豆酰辅酶A羧化酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO：126和128的核酸序列。

在上文公开的用于联产异丁烯的任何途径的一个实施方案中，具有甲基巴豆酰辅酶A水合酶活性的酶是3-酮酰基辅酶A硫解酶。在另一个实施方案中，具有甲基巴豆酰辅酶A水合酶活性的酶是烯酰辅酶A水合酶。在另一个实施方案中，具有甲基巴豆酰辅酶A水合酶活性的酶由获自大肠杆菌的一种或多种核酸分子编码。在一些实施方案中，编码具有甲基巴豆酰辅酶A水合酶活性的酶的一种或多种核酸分子是fadA和/或fadB，或其同源物。在一个进一步的实施方案中，编码具有甲基巴豆酰辅酶A水合酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO：131和133的氨基酸序列。在又一个实施方案中，编码具有甲基巴豆酰辅酶A水合酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO：130和132的核酸序列。

在上文公开的用于联产异丁烯的任何途径的一个实施方案中，具有3-羟基异戊酰辅酶A硫酯酶活性的酶由一种或多种获自大肠杆菌的核酸分子编码。在一些实施方案中，编码具有3-羟基异戊酰辅酶A硫酯酶活性的酶的一种或多种核酸分子是tesB，或其同源物。在一个进一步的实施方案中，编码具有3-羟基异戊酰辅酶A硫酯酶活性的酶的一种或多种核酸分子包含SEQ ID NO：135中列出的氨基酸序列。在又一个实施方案中，编码具有3-羟基异戊酰辅酶A硫酯酶活性的酶的一种或多种核酸分子包含SEQ ID NO：134中列出的核酸序列。

在上文公开的用于联产异丁烯的任何途径的一个实施方案中，具有3HIV激酶活性的酶由一种或多种获自微生物的核酸分子编码，所述微生物选自热原体属物种(Thermoplasma sp.)和Picrophilus sp.。在另一个实施方案中，具有3HIV激酶活性的酶由一种或多种获自微生物的核酸分子编码，所述微生物选自嗜酸热原体(Thermoplasmaacidophilum)和托氏嗜酸古菌。在一些实施方案中，编码具有3HIV激酶活性的酶的一种或多种核酸分子是TA1305和/或PTO1356，或其同源物。在一些实施方案中，TA1305包含L200E突变。在一个进一步的实施方案中，编码具有3HIV激酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO：113、115和117的氨基酸序列。在又一个实施方案中，编码具有3HIV激酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO：112、114和116的核酸序列。

在上文公开的用于联产异丁烯的任何途径的一个实施方案中，具有3HIV-3-磷酸脱羧酶活性的酶由一种或多种获自链球菌属物种的核酸分子编码。在另一个实施方案中，具有3HIV-3-磷酸脱羧酶活性的酶由获自微生物的一种或多种核酸分子编码，所述微生物选自缓症链球菌(Streptococcus mitis)和/或戈登氏链球菌(Streptococcus gordonii)。在一些实施方案中，编码具有3HIV-3-磷酸脱羧酶活性的酶的一种或多种核酸分子是smi_1746和/或mvaD，或其同源物。在一个进一步的实施方案中，编码具有3HIV-3-磷酸脱羧酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO：119和121的氨基酸序列。在又一个实施方案中，编码具有3HIV-3-磷酸脱羧酶活性的酶的一种或多种核酸分子包含选自SEQ IDNO：118和120的核酸序列。

在上文公开的用于联产异丁烯的任何途径的一个实施方案中，具有3HIV脱羧酶活性的酶由一种或多种获自微生物的核酸分子编码，所述微生物选自链球菌属物种、热原体属物种(Thermoplasma sp.)和Picrophilus sp.。在另一个实施方案中，具有3HIV脱羧酶活性的酶由一种或多种获自微生物的核酸分子编码，所述微生物选自戈登氏链球菌、嗜酸热原体和Picrophilus torridus。在一些实施方案中，编码具有3HIV脱羧酶活性的酶的一种或多种核酸分子是mvaD、TA1305和/或PTO1356，或其同源物。在一个进一步的实施方案中，编码具有3HIV脱羧酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO：113、117和121的氨基酸序列。在又一个实施方案中，编码具有3HIV脱羧酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO：112、116和120的核酸序列。

通过C2途径联产MEG(或乙醇酸)和通过C3途径联产一种或多种丝氨酸途径化合物

在一些实施方案中，通过C2途径生产MEG与通过C3途径生产一种或多种丝氨酸途径化合物相偶联。在一个实施方案中，一种或多种丝氨酸途径化合物涉及L-丝氨酸生物合成途径。在另一个实施方案中，一种或多种丝氨酸途径化合物是L-丝氨酸(Ser)、甘氨酸(Gly)、单乙醇胺(MEA)和/或乙二胺(EDA)(图10)。

通过一个或多个C2途径生产单乙二醇(MEG)或乙醇酸

为了生产MEG，如上所述，一种或多种己糖或己糖原料通过非氧化性进入磷酸戊糖途径以保持产率潜力的方式转化为一种或多种戊糖-5-磷酸中间体。然后通过戊糖-5-磷酸酶、D-阿糖醇磷酸脱氢酶和/或磷酸戊糖变位酶(如上所述)将一种或多种戊糖-5-磷酸中间体转化为一种或多种戊糖-1-磷酸或戊糖中间体。一种或多种戊糖-1-磷酸或戊糖中间体随后通过已知的C2途径(D-木酮糖-1-磷酸途径(Alkim等人，Microb Cell Fact(2015)14：127)、D-核酮糖-1-磷酸途径(WO2013/126721)或D-木糖酸途径(WO2013/119020))通过醛缩酶降解为C2碳化合物乙醇醛和C3碳化合物磷酸二羟丙酮(DHAP)或丙酮酸。乙醇醛被还原为MEG，消耗NADH。可选地，乙醇醛可以被乙醇醛脱氢酶氧化为乙醇酸。C3化合物DHAP被进一步氧化为L-丝氨酸途径化合物Ser、Gly、MEA或EDA中的一种或多种，产生NADH。

氨(NH₃)

氨是分子式为NH₃的氮和氢的化合物，其用作食品和肥料的前体，也用作合成医药产品和商业清洁产品的基础材料。氨在带正电荷时以铵阳离子形式存在，其化学式为NH₄ ⁺。

本公开教导利用氨或类似化合物作为氮源。当氨或类似化合物用作氮源时，其被固定在有机物质中，例如谷氨酸。在一个实施方案中，当2-氧代戊二酸通常地形成谷氨酸时，氨被固定，并且该过程消耗一个NADH。

L-丝氨酸(Ser)的生产

Ser通过天然途径由磷酸丝氨酸或其变体生产。在一个实施方案中，通过C2途径生产MEG(或乙醇酸)所产生的DHAP通过微生物中的内源性糖酵解转化为3-磷酸-D-甘油酸(3-磷酸甘油酸)。3-磷酸甘油酸通过D-3-磷酸甘油酸脱氢酶(EC1.1.1.95)转化为3-磷酸羟基丙酮酸。然后3-磷酸羟基丙酮酸通过磷酸丝氨酸转氨酶(EC 2.6.1.52)转化为3-磷酸丝氨酸。然后3-磷酸丝氨酸通过磷酸丝氨酸磷酸酶(EC 3.1.3.3)转化为L-丝氨酸。

在一些实施方案中，3-磷酸甘油酸至L-丝氨酸的反应如下：

3-磷酸-D-甘油酸+NAD⁺+L-谷氨酸+H₂O→L-丝氨酸+NADH+2-氧代戊二酸+磷酸

考虑到从DHAP至3-磷酸羟基丙酮酸产生两个NADH和NH₃固定需要一个NADH，生产Ser正好产生一个过量的NADH，这是等摩尔联产一个MEG(或乙醇酸)所需要的。

在一些实施方案中，生产MEG(或乙醇酸)和L-丝氨酸非常接近于热力学最大产率潜力，即使用一种或多种己糖无损转化为一种或多种戊糖-5-磷酸中间体，随后将一种或多种戊糖-5-磷酸中间体转化为一种或多种戊糖-1-磷酸和/或戊糖中间体，然后通过C2途径联产MEG(或乙醇酸)和通过C3途径由一种或多种戊糖-1-磷酸和/或戊糖中间体联产L-丝氨酸。在一些实施方案中，与通过天然、标准的C3途径由葡萄糖制造L-丝氨酸的生产相比，通过本申请中公开的途径联产MEG(或乙醇酸)和L-丝氨酸的热力学产率潜力高14％。

联产：己糖+NH₃→MEG(或乙醇酸)+Ser+0ATP

Y(途径)＝(0.371+0.629)g/g＝1.00g(MEG(或乙醇酸)+Ser)/g(己糖+NH₃)，96％的Y(最大)(燃烧热)＝1.044g/g

标准途径：葡萄糖+2NH₃→2Ser+2NADH+0ATP

Y(途径)＝0.981g(Ser)/g(葡萄糖+2NH₃)，84％的Y(最大)(燃烧热)＝1.164g/g

在一些实施方案中，MEG(或乙醇酸)和丝氨酸的联产如下：将一种或多种己糖原料无损转化为一种或多种戊糖-5-磷酸中间体，然后将一种或多种戊糖-5-磷酸中间体转化为一种或多种戊糖和/或戊糖-1-磷酸中间体，然后通过C2途径，将一种或多种戊糖和/或戊糖-1-磷酸中间体转化为MEG(或乙醇酸)和DHAP或丙酮酸，以及通过C3途径，将DHAP或丙酮酸转化为丝氨酸。在一些实施方案中，C2途径包含实施方案[H]。在进一步的实施方案中，C2途径包含实施方案[I]。在仍进一步的实施方案中，C2途径包含实施方案[J]。

在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[H]，用于生产丝氨酸的C3途径包括实施方案[Q]。在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[I]，用于生产丝氨酸的C3途径包括实施方案[Q]。在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[J]，用于生产丝氨酸的C3途径包括实施方案[Q]。

[Q]在一个实施方案中，本申请涉及一种能够由一种或多种己糖原料和一种氮源联产单乙二醇(MEG)(或乙醇酸)和丝氨酸的重组微生物，其中来自实施方案[A]或来自实施方案[B](和任选地包括实施方案[C])并且另外包括实施方案[D]、[E]、[F]和[G]中的一个或多个、进一步包括实施方案[H]、[I]和[J]中的一个或多个的重组微生物进一步表达以下(a)至(h)中的一种或多种：

(b)至少一种内源性或外源性核酸分子，其编码具有3-磷酸甘油酸磷酸酶活性的酶和/或具有甘油酸3-激酶活性的酶，该酶催化3-磷酸甘油酸转化为甘油酸；

(c)至少一种内源性或外源性核酸分子，其编码具有2-磷酸甘油酸磷酸酶活性的酶和/或具有甘油酸2-激酶活性的酶，该酶催化2-磷酸甘油酸转化为甘油酸；

(d)至少一种内源性或外源性核酸分子，其编码具有磷酸丝氨酸转氨酶活性的酶，该酶催化来自(a)的3-磷酸羟基丙酮酸转化为磷酸-L-丝氨酸；

(e)至少一种内源性或外源性核酸分子，其编码具有3-磷酸羟基丙酮酸磷酸酶活性的酶，该酶催化来自(a)的3-磷酸羟基丙酮酸转化为羟基丙酮酸；

(f)至少一种内源性或外源性核酸分子，其编码具有磷酸丝氨酸磷酸酶活性的酶，该酶催化来自(d)的磷酸-L-丝氨酸转化为L-丝氨酸；

(g)至少一种内源性或外源性核酸分子，其编码具有羟基丙酮酸还原酶活性的酶，该酶催化来自(b)和/或(c)的甘油酸转化为羟基丙酮酸；

(h)至少一种内源性或外源性核酸分子，其编码具有丝氨酸-丙酮酸转氨酶活性的酶，该酶催化来自(e)和/或(g)的羟基丙酮酸转化为L-丝氨酸；

其中来自实施方案[H]和/或[I]的产生的中间体DHAP和/或来自实施方案[J]的丙酮酸分别通过微生物中的内源性糖酵解或糖异生转化为3-磷酸甘油酸和/或2-磷酸甘油酸，并且其中生产MEG(或乙醇酸)和丝氨酸。

甘氨酸(Gly)的生产

Gly通过天然途径生产，例如由Ser或其变体。

在一个实施方案中，Gly通过基于Ser的途径生产。在该基于Ser的途径中，由THF产生5,10-亚甲基四氢叶酸(M-THF)，L-丝氨酸通过丝氨酸羟甲基转移酶转化为甘氨酸。M-THF用于各种细胞化合物的生物合成，例如在甲基化反应中。

在一个优选的实施方案中，M-THF也可以用于生产多两个NADH或一个NADH和一个H₂：

(EC 2.1.2.-；转移酶，如羟甲基-、甲酰基-和相关的转移一个碳基团的转移酶)，随后将甲醛氧化(EC 1.2.1.46；甲醛脱氢酶)为甲酸和NADH，并进一步将甲酸氧化为CO₂和NADH(甲酸脱氢酶，FDH)或CO₂和H₂(甲酸氢解酶复合物)。

在一些实施方案中，如果部分进行这种THF的重构，则可以用于生成刚好足够的NADH以进行另一条不同的甘氨酸生物合成途径。在一个实施方案中，通过甘氨酸裂解系统的途径(其利用M-THF、NH₃、CO₂和NADH直接合成甘氨酸)可以与基于丝氨酸的甘氨酸生产一起使用，以利用产生的过量M-THF来生产更多的甘氨酸。

甘氨酸裂解系统(GCV)是多酶复合物，其催化甘氨酸的可逆氧化，产生二氧化碳、氨、5,10-亚甲基四氢叶酸(M-THF)和还原的吡啶核苷酸：

四氢叶酸用作甘氨酸裂解形成亚甲基基团期间产生的一碳单元的受体。GCV系统由P蛋白、H蛋白、T蛋白和L蛋白四种蛋白质组分组成。P蛋白(EC 1.4.4.2，甘氨酸脱氢酶(脱羧))催化从甘氨酸中磷酸吡哆醛依赖性释放CO₂，留下甲胺部分。甲胺部分转移至H蛋白的硫辛酸基团，H蛋白在甘氨酸脱羧之前与P蛋白结合。T蛋白(EC 2.1.2.10，氨甲基转移酶)催化从甲胺基团中释放NH₃，并将剩余的C1单元转移至THF形成5,10-mTHF。然后L蛋白(EC1.8.1.4，二氢硫辛酰脱氢酶)氧化H蛋白的硫辛酸成分，并将电子转移至NAD+形成NADH。

有时当同一组酶以相反方向运行以形成甘氨酸时，称为甘氨酸合酶。在厌氧菌尿酸发酵梭菌(Clostridium acidiurici)中，甘氨酸裂解系统主要在甘氨酸合成方向运行。

可选地，在另一个实施方案中，也可以通过丙氨酸-乙醛酸转氨酶(EC 2.6.1.44)的乙醛酸转氨作用生产甘氨酸。尽管在生物体(如酿酒酵母)中，该途径仅在以不可发酵碳源(如乙醇或乙酸)生长期间表达，但该途径很容易在任何微生物中过表达。氨基基团供体丙氨酸通过与谷氨酸的转氨作用(丙氨酸转氨酶，EC 2.6.1.2)重构，而谷氨酸又通过NADH或NADPH依赖性谷氨酸脱氢酶(EC 1.4.1.2或EC1.4.1.3)固定氨而重构。在一个实施方案中，该甘氨酸途径避免了中间体L-丝氨酸，并且不会导致产生M-THF，而是直接产生两个还原当量(如NADH)。

在一些实施方案中，生产MEG(或乙醇酸)和甘氨酸较接近于热力学最大产率潜力，即使用一种或多种己糖无损转化为一种或多种戊糖-5-磷酸中间体，随后将一种或多种戊糖-5-磷酸中间体转化为一种或多种戊糖-1-磷酸和/或戊糖中间体，然后通过C2途径联产MEG(或乙醇酸)和通过C3途径由一种或多种戊糖-1-磷酸和/或戊糖中间体联产甘氨酸。在一些实施方案中，与通过天然、标准的C3途径由葡萄糖制造甘氨酸的生产相比，通过本申请中公开的途径联产MEG(或乙醇酸)和甘氨酸的热力学产率潜力高37％。

联产，丝氨酸途径：己糖+NH₃+THF->MEG(或乙醇酸)+Gly+M-THF+0ATP

联产，丝氨酸途径，假设通过甲酸使用FDH重构THF：

己糖+NH₃->MEG(或乙醇酸)+Gly+2NADH+0ATP

联产，乙醛酸途径：己糖+NH₃->MEG(或乙醇酸)+Gly+2NAD(P)H+0ATP

Y(途径)＝(0.371+0.449)g/g＝0.820g(MEG(或乙醇酸)+Gly)/g(己糖+NH₃)，81％的Y(最大)(燃烧热)＝1.013g/g

联产，丝氨酸途径，假设通过甲酸和FDH部分重构THF，加上通过甘氨酸裂解系统合成甘氨酸：

通过NADH生产部分重构THF：M-THF->2/3M-THF+1/3THF+2/3NADH为甘氨酸裂解系统利用剩余的M-THF和生成的NADH：

2/3M-THF+2/3NADH+2/3NH₃+2/3CO₂->2/3Gly

己糖+5/3NH₃+2/3CO₂->MEG(或乙醇酸)+5/3Gly+0ATP

y(途径)＝(0.348+0.698)g/g＝1.046g/g,97％的y(最大)＝1.076g/g

标准途径：葡萄糖+2NH₃+2THF->2Gly+2M-THF+2NADH+0ATP

Y(途径)＝0.701g(Gly)/g(葡萄糖+2NH3)，59％的Y(最大)(燃烧热)＝1.197g/g

在一些实施方案中，联产MEG(或乙醇酸)和甘氨酸如下：将一种或多种己糖原料无损转化为一种或多种戊糖-5-磷酸中间体，然后将一种或多种戊糖-5-磷酸中间体转化为一种或多种戊糖和/或戊糖-1-磷酸中间体，然后通过C2途径，将一种或多种戊糖和/或戊糖-1-磷酸中间体转化为MEG(或乙醇酸)和DHAP或丙酮酸，以及通过C3途径，将DHAP或丙酮酸转化为甘氨酸。在一些实施方案中，C2途径包含实施方案[H]。在进一步的实施方案中，C2途径包含实施方案[I]。在仍进一步的实施方案中，C2途径包含实施方案[J]。

在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[H]，用于生产甘氨酸的C3途径包括实施方案[R]。在其他实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[H]，用于生产甘氨酸的C3途径包括实施方案[S]。在其他实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[H]，用于生产甘氨酸的C3途径包括实施方案[T]。在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[I]，用于生产甘氨酸的C3途径包括实施方案[R]。在其他实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[I]，用于生产甘氨酸的C3途径包括实施方案[S]。在其他实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[I]，用于生产甘氨酸的C3途径包括实施方案[T]。在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[J]，用于生产甘氨酸的C3途径包括实施方案[R]。在其他实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[J]，用于生产甘氨酸的C3途径包括实施方案[S]。在其他实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[J]，用于生产甘氨酸的C3途径包括实施方案[T]。

[R]在一个实施方案中，本申请涉及一种能够由一种或多种己糖原料和一种氮源生产单乙二醇(MEG)(或乙醇酸)和甘氨酸的重组微生物，其中来自实施方案[A]或来自实施方案[B](和任选地包括实施方案[C])并且另外包括实施方案[D]、[E]、[F]和[G]中的一个或多个、进一步包括实施方案[H]、[I]和[J]中的一个或多个的重组微生物进一步表达以下(a)至(e)中的一种或多种：

(a)至少一种内源性或外源性核酸分子，其编码具有丝氨酸羟甲基转移酶活性的酶，该酶催化L-丝氨酸和四氢叶酸(THF)转化为甘氨酸和5,10-亚甲基四氢叶酸(M-THF)；

(b)至少一种内源性或外源性核酸分子，其编码具有转移酶活性的酶，该酶催化来自(a)的M-THF转化为甲醛；

(c)至少一种内源性或外源性核酸分子，其编码具有甲醛脱氢酶活性的酶，该酶催化来自(b)的甲醛转化为甲酸和NADH；

(d)至少一种内源性或外源性核酸分子，其编码具有甲酸脱氢酶活性的酶，该酶催化来自(c)的甲酸转化为CO₂和NADH；

(e)至少一种内源性或外源性核酸分子，其编码甘氨酸裂解系统的蛋白质，该蛋白质催化来自(a)的M-THF、CO₂、NH₃和来自(c)或(d)的NADH转化为甘氨酸和THF；

其中THF由步骤(b)至(e)重构，其中任选地来自(c)的甲酸被甲酸氢解酶复合物进一步氧化为CO₂和H₂，并且其中生产MEG(或乙醇酸)和甘氨酸。

[S]在一个实施方案中，本申请涉及一种能够由一种或多种己糖原料和一种氮源联产单乙二醇(MEG)(或乙醇酸)和甘氨酸的重组微生物，其中来自实施方案[A]或来自实施方案[B](和任选地包括实施方案[C])并且另外包括实施方案[D]、[E]、[F]和[G]中的一个或多个、进一步包括实施方案[H]、[I]和[J]中的一个或多个的重组微生物进一步表达以下(a)至(k)中的一种或多种：

(g)至少一种内源性或外源性核酸分子，其编码具有乙醇醛脱氢酶活性的酶，该酶催化来自(f)的乙醇醛转化为乙醇酸；

(h)至少一种内源性或外源性核酸分子，其编码具有乙醇酸脱氢酶活性的酶，该酶催化来自(g)的乙醇酸转化为乙醛酸；

(i)至少一种内源性或外源性核酸分子，其编码具有丙氨酸-乙醛酸转氨酶活性的酶，该酶催化来自(h)的乙醛酸和丙氨酸转化为甘氨酸和丙酮酸；

(j)至少一种内源性或外源性核酸分子，其编码具有丙氨酸转氨酶活性的酶，该酶催化来自(i)的丙酮酸和谷氨酸转化为丙氨酸和2-氧代戊二酸；

(k)至少一种内源性或外源性核酸分子，其编码具有NAD(P)H依赖性谷氨酸脱氢酶活性的酶，该酶催化来自(j)的2-氧代戊二酸和氨转化为谷氨酸；

其中来自实施方案[H]和/或[I]的产生的中间体DHAP和/或来自实施方案[J]的丙酮酸通过微生物中的内源性糖酵解或糖异生转化为3-磷酸甘油酸和/或2-磷酸甘油酸，其中用于步骤(i)的乙醛酸任选地来自该微生物中的乙醛酸旁路，其中丙氨酸和谷氨酸由步骤(j)和(k)重构，并且其中联产MEG(或乙醇酸)和甘氨酸。

[T]在一个实施方案中，本申请涉及一种能够由一种或多种己糖原料和一种氮源联产单乙二醇(MEG)(或乙醇酸)和甘氨酸的重组微生物，其中来自实施方案[A]或来自实施方案[B](和任选地包括实施方案[C])并且另外包括实施方案[D]、[E]、[F]和[G]中的一个或多个、进一步包括实施方案[H]、[I]和[J]中的一个或多个的重组微生物进一步表达以下(a)至(l)中的一种或多种：

(b)至少一种内源性或外源性核酸分子，其编码具有3-磷酸甘油酸磷酸酶活性的酶和/或具有甘油酸-3-激酶活性的酶，该酶催化3-磷酸甘油酸转化为甘油酸；

(d)至少一种内源性或外源性核酸分子，其编码具有丝氨酸转氨酶或丝氨酸氧化还原酶(脱氨基)活性的酶，该酶催化L-丝氨酸转化为羟基丙酮酸；

(g)至少一种内源性或外源性核酸分子，其编码具有乙醇胺转氨酶活性的酶或具有乙醇胺氧化还原酶(脱氨基)活性的酶，该酶催化来自(e)的乙醇胺转化为乙醇醛；

(h)至少一种内源性或外源性核酸分子，其编码具有乙醇醛脱氢酶活性的酶，该酶催化来自(f)和/或(g)的乙醇醛转化为乙醇酸；

(i)至少一种内源性或外源性核酸分子，其编码具有乙醇酸脱氢酶活性的酶，该酶催化来自(g)的乙醇酸转化为乙醛酸；

(j)至少一种内源性或外源性核酸分子，其编码具有丙氨酸-乙醛酸转氨酶活性的酶，该酶催化来自(i)的乙醛酸和丙氨酸转化为甘氨酸和丙酮酸；

(k)至少一种内源性或外源性核酸分子，其编码具有丙氨酸转氨酶活性的酶，该酶催化来自(j)的丙酮酸和谷氨酸转化为丙氨酸和2-氧代戊二酸；

(l)至少一种内源性或外源性核酸分子，其编码具有NAD(P)H依赖性谷氨酸脱氢酶活性的酶，该酶催化来自(k)的2-氧代戊二酸和氨转化为谷氨酸；

其中来自实施方案[H]和/或[I]的产生的中间体DHAP和/或来自实施方案[J]的丙酮酸通过微生物中的内源性糖酵解或糖异生转化为3-磷酸甘油酸和/或2-磷酸甘油酸，其中用于步骤(j)的乙醛酸任选地来自该微生物中的乙醛酸旁路，其中丙氨酸和谷氨酸由步骤(k)和(l)重构，并且其中联产MEG(或乙醇酸)和甘氨酸。

在一些实施方案中，具有丝氨酸羟甲基转移酶活性的酶将L-丝氨酸转化为甘氨酸。在一些实施方案中，将L-丝氨酸转化为甘氨酸的酶由与大肠杆菌glyA具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在一些实施方案中，编码具有丝氨酸羟甲基转移酶活性的酶的一种或多种核酸分子包含UniProt ID P0A825中列出的氨基酸序列。在一个进一步的实施方案中，编码具有丝氨酸羟甲基转移酶活性的酶的一种或多种核酸分子由Gene ID 947022中列出的核酸序列编码。

在一些实施方案中，具有转移一碳基团的转移酶活性的酶用于将M-THF转化为甲醛。可以使用转移酶如羟甲基-、甲酰基-和相关的转移酶。羟甲基-、甲酰基-和相关转移酶的示例包括甘氨酸羟甲基转移酶、磷酸核糖基甘氨酰胺甲酰基转移酶、磷酸核糖氨基咪唑甲酰胺甲酰基转移酶、甘氨酸亚氨甲基转移酶、谷氨酸亚氨甲基转移酶、D-丙氨酸2-羟甲基转移酶、脱氧胞苷酸5-羟甲基转移酶、甲硫氨酰基-tRNA甲酰基转移酶、氨甲基转移酶、3-甲基-2-氧代丁酸羟甲基转移酶和UDP-4-氨基-4-脱氧-L-阿拉伯糖甲酰基转移酶。

在一些实施方案中，具有甲醛脱氢酶活性的酶用于将甲醛转化为甲酸和NADH。在一些实施方案中，具有甲醛脱氢酶活性的酶由与选自以下的甲醛脱氢酶具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码：酿酒酵母ALD2、酿酒酵母ALD3、人ALDH3A2和人ALDH9A1。在一些实施方案中，编码具有甲醛脱氢酶活性的酶的一种或多种核酸分子包含选自以下的氨基酸序列：UniProt ID P47771、UniProt ID P54114、UniProt ID P51648和UniProt ID P49189。在一个进一步的实施方案中，编码具有甲醛脱氢酶活性的酶的一种或多种核酸分子由选自Gene ID 855206、Gene ID855205、Gene ID 224和Gene ID 223的核酸序列编码。

在一些实施方案中，具有甲酸脱氢酶活性的酶用于将甲酸转化为CO₂和NADH。在一些实施方案中，具有甲酸脱氢酶活性的酶由与选自以下的具有甲酸脱氢酶活性的酶具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码：大肠杆菌fdhF(chlF，FDH-H)、大肠杆菌FDH-N、大肠杆菌FDH-O、Candida boidiniiFDH1、谷氨酸棒杆菌(Corynebacterium glutamicum)fdhF、Cupriavidus oxalaticus的NAD+依赖性甲酸脱氢酶、Gottschalkia acidurici的NAD+依赖性甲酸脱氢酶、扭脱甲基杆菌(Methylobacterium extorquens)Fdh1、Methylosinus trichosporium的甲酸脱氢酶和莫拉氏菌属物种(Moraxella sp.)的NAD+依赖性甲酸脱氢酶fdh。在一些实施方案中，编码与甲酸脱氢酶活性相关的酶或酶的亚基的一种或多种核酸分子包含选自以下的氨基酸序列：UniProt ID P07658、UniProt ID P0AEK7、UniProt ID P0AAJ3、UniProt ID P24183、UniProt ID P32176、UniProt ID P0AAJ5、UniProt ID P0AEL0、UniProt ID O13437、UniProt ID Q8NSY6、UniProt ID Q8KTI7、UniProt ID Q8KTI8和UniProt ID O08375。在一个进一步的实施方案中，编码与甲酸脱氢酶活性相关的酶或酶的亚基的一种或多种核酸分子包含选自以下的核酸序列：Gene ID 948584、Gene ID 946038、Gene ID948794、Gene ID946035、Gene ID 948394、Gene ID 948395、Gene ID 948383、GenBank登录号AJ011046.2、Gene ID 1021531、GenBank登录号AF489516和GenBank登录号Y13245.1。

在一些实施方案中，甘氨酸裂解系统的一种或多种蛋白质用于由M-THF、CO₂、NH₃和NADH生产甘氨酸。在一些实施方案中，甘氨酸裂解系统的蛋白质包含：i)P-蛋白(含有磷酸吡哆醛的蛋白)或甘氨酸脱羧酶(EC 1.4.4.2)，ii)T-蛋白或氨甲基转移酶(EC 2.1.2.10)，iii)L-蛋白或二氢硫辛酰胺脱氢酶(EC1.8.1.4)和iv)称为H-蛋白的载体蛋白(含有硫辛酸的蛋白)。在一些实施方案中，具有甘氨酸脱羧酶活性的酶由与大肠杆菌gcvP具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在一些实施方案中，编码具有甘氨酸脱羧酶活性的酶的一种或多种核酸分子包含UniProt IDP33195中列出的氨基酸序列。在一个进一步的实施方案中，编码具有甘氨酸脱羧酶活性的酶的一种或多种核酸分子包含Gene ID 947394中列出的核酸序列。在一些实施方案中，具有氨甲基转移酶活性的酶由与大肠杆菌gcvT具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在一些实施方案中，编码具有氨甲基转移酶活性的酶的一种或多种核酸分子包含UniProt ID P27248中列出的氨基酸序列。在一个进一步的实施方案中，编码具有氨甲基转移酶活性的酶的一种或多种核酸分子包含Gene ID 947390中列出的核酸序列。在一些实施方案中，具有二氢硫辛酰胺脱氢酶活性的酶由与大肠杆菌lpd(lpdA，E3亚基)具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在一些实施方案中，编码具有二氢硫辛酰胺脱氢酶活性的酶的一种或多种核酸分子包含UniProt ID P0A9P0中列出的氨基酸序列。在一个进一步的实施方案中，编码具有二氢硫辛酰胺脱氢酶活性的酶的一种或多种核酸分子包含Gene ID 944854中列出的核酸序列。在一些实施方案中，H-蛋白由与大肠杆菌gcvH具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在一些实施方案中，编码H-蛋白的一种或多种核酸分子包含UniProt ID P0A6T9中列出的氨基酸序列。在一个进一步的实施方案中，编码H-蛋白的一种或多种核酸分子由Gene ID 947393中列出的核酸序列编码。

在一些实施方案中，具有乙醇酸脱氢酶活性的酶用于将乙醇酸转化为乙醛酸。在一些实施方案中，具有乙醇酸脱氢酶活性的酶由与选自以下的具有乙醇酸脱氢酶活性的酶具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码：大肠杆菌乙醇酸脱氢酶GLC和拟南芥乙醇酸脱氢酶。在一些实施方案中，编码与乙醇酸脱氢酶活性相关的酶或酶亚基的一种或多种核酸分子包含选自以下的氨基酸序列：UniProt ID P0AEP9、UniProt ID P52073、UniProt ID P52074和UniProt ID Q94AX4。在一个进一步的实施方案中，编码与乙醇酸脱氢酶活性相关的酶或酶亚基的一种或多种核酸分子包含选自以下的核酸序列：Gene ID 947353、Gene ID 2847718、Gene ID 2847717和GenBank登录号Y13245.1。

在一些实施方案中，具有丙氨酸-乙醛酸脱氢酶活性的酶用于将乙醛酸转化为甘氨酸。在一些实施方案中，具有丙氨酸-乙醛酸转氨酶活性的酶由与选自以下的具有丙氨酸-乙醛酸转氨酶活性的酶具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码：酿酒酵母AGX1、人AGXT2、拟南芥AOAT1和拟南芥AOAT2。在一些实施方案中，编码具有丙氨酸-乙醛酸转氨酶活性的酶的一种或多种核酸分子包含选自以下的氨基酸序列：UniProt ID P43567、UniProt ID Q9BYV1、UniProt IDQ9LR30和UniProt ID Q9S7E9。在一个进一步的实施方案中，编码具有丙氨酸-乙醛酸转氨酶活性的酶的一种或多种核酸分子包含选自以下的核酸序列：Gene ID 850514、Gene ID64902、TAIR登录号AT1G23310和TAIR登录号AT1G70580。

在一些实施方案中，具有丙氨酸转氨酶活性的酶用于由丙酮酸和谷氨酸重构丙氨酸。在一些实施方案中，具有丙氨酸转氨酶活性的酶由与选自以下的具有丙氨酸转氨酶活性的酶具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码：大肠杆菌谷氨酸-丙酮酸转氨酶alaA、大肠杆菌谷氨酸-丙酮酸转氨酶alaB、大肠杆菌谷氨酸-丙酮酸转氨酶alaC、人丙氨酸转氨酶1(GPT)、人丙氨酸转氨酶2(GPT2)、Arenicola marina丙氨酸转氨酶、拟南芥色氨酸转氨酶TAA1、拟南芥AOAT1、拟南芥AOAT2、Candida maltosa丙氨酸转氨酶、丙酸梭菌丙氨酸转氨酶、Pyrococcus furiosus丙氨酸转氨酶aat、Megathyrsus maximus丙氨酸转氨酶和黍丙氨酸转氨酶AlaAT-2。在一些实施方案中，编码具有丙氨酸转氨酶活性的酶的一种或多种核酸分子包含选自以下的氨基酸序列：UniProt ID P0A959、UniProt ID P77434、UniProt ID P24298、UniProt ID Q8TD30、UniProt ID Q9S7N2、UniProt ID Q9LR30、UniProt ID Q9S7E9、UniProt ID Q9P9M8和UniProt ID P34106。在一个进一步的实施方案中，编码具有丙氨酸转氨酶活性的酶的一种或多种核酸分子包含选自以下的核酸序列：Gene ID 946772、Gene ID 946850、Gene ID2875、Gene ID 84706、Gene ID 843393、TAIR登录号AT1G23310、TAIR登录号AT1G70580、GenBank登录号AF163769.1和GenBank登录号X69421.1。

在一些实施方案中，具有谷氨酸脱氢酶活性的酶用于由氨和2-氧代戊二酸重构谷氨酸。在一些实施方案中，具有谷氨酸脱氢酶活性的酶由与选自以下的具有谷氨酸脱氢酶活性的酶具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码：酿酒酵母NAD依赖性谷氨酸脱氢酶GDH2、拟南芥NAD依赖性谷氨酸脱氢酶GDH2、拟南芥NAD依赖性谷氨酸脱氢酶GDH1、不解糖嗜胨菌NAD依赖性谷氨酸脱氢酶gdhA、Halobacterium salinarum NAD依赖性谷氨酸脱氢酶gdhA、海栖热袍菌谷氨酸脱氢酶、人谷氨酸脱氢酶1(GLUD1)、人谷氨酸脱氢酶2(GLUD2)、枯草芽孢杆菌谷氨酸脱氢酶和番茄谷氨酸脱氢酶GDH1。在一些实施方案中，编码具有谷氨酸脱氢酶活性的酶的一种或多种核酸分子包含选自以下的氨基酸序列：UniProt ID P33327、UniProt ID Q38946、UniProt IDQ38946、UniProt ID P28997、UniProt ID P29051、UniProt ID P00367、UniProt IDP49448和UniProt ID P93541。在一个进一步的实施方案中，编码具有谷氨酸脱氢酶活性的酶的一种或多种核酸分子由选自以下的核酸序列编码：Gene ID 461927、TAIR登录号AT5G07440、TAIR登录号AT5G18170、GenBank登录号M76403.1、GenBank登录号X63837.1、Gene ID 2746、Gene ID 2747和GenBank登录号U48695.1。

单乙醇胺(MEA)的生产

可以通过Ser的脱羧或乙醇醛的氨基转移来生产MEA。

在一些优选的实施方案中，利用丝氨酸脱羧酶，因为该酶是天然存在的(即在植物的胆碱生物合成途径中)，并且乙醇醛中间体的转氨基使得MEG和MEA途径之间产生交流(cross talk)。

可选地，在另一个实施方案中，可以由乙醛和氨通过乙醇胺解氨酶(EC 4.3.1.7)形成MEA：

在这种情况下，MEA不通过Ser生物合成途径形成，而是由乙酰辅酶A及其通过乙醛脱氢酶还原为乙醛形成。虽然氧化还原情况没有改变，但与基于Ser的途径相比，该途径产生+1ATP。该途径也避免了有毒的中间体Ser，但具有有毒且易挥发的中间体乙醛。

在一些实施方案中，生产MEG(或乙醇酸)和MEA非常接近于热力学最大产率潜力，即使用一种或多种己糖无损转化为一种或多种戊糖-5-磷酸中间体，随后将一种或多种戊糖-5-磷酸中间体转化为一种或多种戊糖-1-磷酸和/或戊糖中间体，然后通过C2途径联产MEG(或乙醇酸)和通过C3途径由一种或多种戊糖-1-磷酸和/或戊糖中间体联产MEA。在一些实施方案中，与通过天然的或公开的类似途径由葡萄糖制造MEA的生产相比，通过本申请中公开的途径联产MEG(或乙醇酸)和MEA的热力学产率潜力高15％。

联产，Ser途径：己糖+NH₃->MEG(或乙醇酸)+MEA+0ATP

联产，乙醛途径：己糖+NH₃->MEG(或乙醇酸)+MEA+1ATP

Y(途径)＝(0.371+0.365)g/g＝0.736g(MEG(或乙醇酸)+MEA)/g(己糖+NH₃)，98％的Y(最大)(燃烧热)＝0.749g/g

标准途径：葡萄糖+2NH₃->2MEA+2NADH+0ATP

Y(途径)＝0.570g(MEA)/g(葡萄糖+2NH₃)，85％的Y(最大)(燃烧热)＝0.669g/g

在一些实施方案中，由一种或多种己糖原料联产MEG(或乙醇酸)和MEA如下：将一种或多种己糖原料无损转化为一种或多种戊糖-5-磷酸中间体，然后将一种或多种戊糖-5-磷酸中间体转化为一种或多种戊糖和/或戊糖-1-磷酸中间体，然后通过C2途径，将一种或多种戊糖和/或戊糖-1-磷酸中间体转化为MEG(或乙醇酸)和DHAP或丙酮酸，以及通过C3途径，将DHAP或丙酮酸转化为MEA。

在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[H]，用于生产MEA的C3途径包括实施方案[U]。在其他实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[H]，用于生产MEA的C3途径包括实施方案[V]。在其他实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[H]，用于生产MEA的C3途径包括实施方案[W]。在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[I]，用于生产MEA的C3途径包括实施方案[U]。在其他实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[I]，用于生产MEA的C3途径包括实施方案[V]。在其他实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[I]，用于生产MEA的C3途径包括实施方案[W]。在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[J]，用于生产MEA的C3途径包括实施方案[U]。在其他实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[J]，用于生产MEA的C3途径包括实施方案[V]。在其他实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[J]，用于生产MEA的C3途径包括实施方案[W]。

[U]在一个实施方案中，本申请涉及一种能够由一种或多种己糖原料和一种氮源联产单乙二醇(MEG)(或乙醇酸)和单乙醇胺(MEA)的重组微生物，其中来自实施方案[A]或来自实施方案[B](和任选地包括实施方案[C])并且另外包括实施方案[D]、[E]、[F]和[G]中的一个或多个、进一步包括实施方案[H]、[I]和[J]中的一个或多个的重组微生物进一步表达以下(a)至(i)中的一种或多种：

(i)至少一种内源性或外源性核酸分子，其编码具有丝氨酸脱羧酶活性的酶，该酶催化来自(f)和/或(h)的L-丝氨酸转化为MEA；

其中来自实施方案[H]和/或[I]的产生的中间体DHAP和/或来自实施方案[J]的丙酮酸分别通过微生物中的内源性糖酵解或糖异生转化为3-磷酸甘油酸和/或2-磷酸甘油酸，并且其中联产MEG(或乙醇酸)和MEA。

[V]在一个实施方案中，本申请涉及一种能够由一种或多种己糖原料和一种氮源联产单乙二醇(MEG)(或乙醇酸)和单乙醇胺(MEA)的重组微生物，其中来自实施方案[A]或来自实施方案[B](和任选地包括实施方案[C])并且另外包括实施方案[D]、[E]、[F]和[G]中的一个或多个、进一步包括实施方案[H]、[I]和[J]中的一个或多个的重组微生物进一步表达以下(a)至(f)中的一种或多种：

(d)至少一种内源性或外源性核酸分子，其编码具有丝氨酸-丙酮酸转氨酶或丝氨酸氧化还原酶(脱氨基)活性的酶，该酶催化L-丝氨酸转化为羟基丙酮酸；

(e)至少一种内源性或外源性核酸分子，其编码具有羟基丙酮酸脱羧酶活性的酶，该酶催化来自(c)和/或(d)的羟基丙酮酸转化为乙醇醛；

(f)至少一种内源性或外源性核酸分子，其编码具有转氨酶活性的酶，该酶催化来自(e)的乙醇醛转化为MEA；

[W]在一个实施方案中，本申请涉及一种能够由一种或多种己糖原料和一种氮源联产单乙二醇(MEG)(或乙醇酸)和单乙醇胺(MEA)的重组微生物，其中来自实施方案[A]或来自实施方案[B](和任选地包括实施方案[C])并且另外包括实施方案[D]、[E]、[F]和[G]中的一个或多个、进一步包括实施方案[H]、[I]和[J]中的一个或多个的重组微生物进一步表达以下(a)至(b)中的一种或多种：

(a)至少一种内源性或外源性核酸分子，其编码具有乙醛脱氢酶活性的酶，该酶催化乙酰辅酶A转化为乙醛；

(b)至少一种内源性或外源性核酸分子，其编码具有乙醇胺解氨酶活性的酶，该酶催化乙醛和氨转化为MEA；

其中来自实施方案[H]和/或[I]的产生的中间体DHAP和/或来自实施方案[J]的丙酮酸通过微生物中的内源性糖酵解转化为乙酰辅酶A，并且其中联产MEG(或乙醇酸)和MEA。

在一些实施方案中，具有乙醛脱氢酶活性的酶用于将乙酰辅酶A还原为乙醛。在一些实施方案中，具有乙醛脱氢酶活性的酶由与选自以下的具有乙醛脱氢酶活性的酶具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码：大肠杆菌mhpF、大肠杆菌AdhE、莱因衣藻ADH1、肠系膜明串珠菌辅酶A依赖性乙醛脱氢酶、Pelobacter acetylenicus乙醛脱氢酶、假单胞菌属物种dmpF、恶臭假单胞菌酰化乙醛脱氢酶todl、恶臭假单胞菌乙醛脱氢酶cmtH和丙酮丁醇梭菌醇/醛脱氢酶AdhE。在一些实施方案中，编码具有乙醛脱氢酶活性的酶的一种或多种核酸分子包含选自以下的氨基酸序列：UniProt ID P77580、UniProt P0A9Q7、UniProt ID A8JI07、UniProt ID Q52060、UniProt ID Q51949和UniProt ID P33744。在一个进一步的实施方案中，编码具有乙醛脱氢酶活性的酶的一种或多种核酸分子包含选自以下的核酸序列：Gene ID 945008、Gene ID945837、Gene ID 5729132、GenBank登录号X60835.1、GenBank登录号U09250.1和Gene ID1116167。

在一些实施方案中，具有乙醇胺解氨酶活性的酶用于将乙醛和氨转化为MEA。在一些实施方案中，具有乙醇胺解氨酶活性的酶由与大肠杆菌乙醇胺解氨酶具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在一些实施方案中，编码乙醇胺解氨酶亚基的一种或多种核酸分子包含选自UniProt ID P0AEJ6和UniProt ID P19636的氨基酸序列。在一个进一步的实施方案中，编码乙醇胺解氨酶亚基的一种或多种核酸分子由选自Gene ID 946924和Gene ID 946925的核酸序列编码。

乙二胺(EDA)的生产

可以通过WO 2014/049382中描述的任何途径A至E生产EDA，WO 2014/049382整体并入本文(图11)。

在一些实施方案中，由一种或多种己糖原料联产MEG(或乙醇酸)和EDA如下：将一种或多种己糖原料无损转化为一种或多种戊糖-5-磷酸中间体，然后将一种或多种戊糖-5-磷酸中间体转化为一种或多种戊糖和/或戊糖-1-磷酸中间体，然后通过C2途径，将一种或多种戊糖和/或戊糖-1-磷酸中间体转化为MEG(或乙醇酸)和DHAP或丙酮酸，以及通过C3途径，将DHAP或丙酮酸转化为EDA。

在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[H]，用于生产EDA的C3途径包括实施方案[X]。在其他实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[H]，用于生产EDA的C3途径包括实施方案[Y]。在其他实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[H]，用于生产EDA的C3途径包括实施方案[Z]。在进一步实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[H]，用于生产EDA的C3途径包括实施方案[AA]。在其他实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[H]，用于生产EDA的C3途径包括实施方案[BB]。

在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[I]，用于生产EDA的C3途径包括实施方案[X]。在其他实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[I]，用于生产EDA的C3途径包括实施方案[Y]。在其他实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[I]，用于生产EDA的C3途径包括实施方案[Z]。在进一步实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[I]，用于生产EDA的C3途径包括实施方案[AA]。在其他实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[I]，用于生产EDA的C3途径包括实施方案[BB]。

在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[J]，用于生产EDA的C3途径包括实施方案[X]。在其他实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[J]，用于生产EDA的C3途径包括实施方案[Y]。在其他实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[J]，用于生产EDA的C3途径包括实施方案[Z]。在其他实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[J]，用于生产EDA的C3途径包括实施方案[AA]。在其他实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[J]，用于生产EDA的C3途径包括实施方案[BB]。

[X]在一个实施方案中，本申请涉及一种能够由一种或多种己糖原料和一种氮源联产单乙二醇(MEG)(或乙醇酸)和乙二胺(EDA)的重组微生物，其中来自实施方案[A]或来自实施方案[B](和任选地包括实施方案[C])并且另外包括实施方案[D]、[E]、[F]和[G]中的一个或多个、进一步包括实施方案[H]、[I]和[J]中的一个或多个的重组微生物进一步表达以下(a)至(c)中的一种或多种：

(a)至少一种内源性或外源性核酸分子，其编码具有丝氨酸脱氢酶活性的酶，该酶催化L-丝氨酸转化为2-氨基丙二酸半醛；

(b)至少一种内源性或外源性核酸分子，其编码具有2-氨基丙二酸半醛脱羧酶活性的酶，该酶催化来自(a)的2-氨基丙二酸半醛转化为氨基乙醛；

(c)至少一种内源性或外源性核酸分子，其编码具有氨基乙醛转氨酶活性的酶，该酶催化来自(b)的氨基乙醛转化为EDA；

其中2-氨基丙二酸半醛可以任选地通过自发反应转化为氨基乙醛，并且其中联产MEG(或乙醇酸)和EDA。

根据本公开的这一方面，重组微生物过表达至少一种基因，其编码显示出丝氨酸脱氢酶和氨基乙醛转氨酶活性的酶。这些基因可以是内源性基因或外源性基因。

丝氨酸脱氢酶催化L-丝氨酸转化为2-氨基丙二酸半醛的第一反应。该酶属于醇脱氢酶的大型酶家族，醇脱氢酶也称为醛还原酶。已知数种酶表现出丝氨酸脱氢酶活性。在本公开的一个实施方案中，这些酶由选自本领域公知的基因列表中的基因编码(Chowdhury等人，1996,Yao等人，2010,Tchigvintsev等人，2012,Fujisawa等人，2003,Hawes等人，1996和Lokanath等人，2005)，包括但不限于此处列出的基因：来自恶臭假单胞菌、来自聚球藻(Synechococcus)PCC6301或来自蜡状芽孢杆菌(Bacillus cereus)的mmsB；来自恶臭假单胞菌E23的hibdh；来自铜绿假单胞菌的PA0743；来自大肠杆菌或来自短芽孢杆菌(Bacillusbrevis)或来自枯草芽孢杆菌的ydfG；来自根癌农杆菌(Agrobacterium tumefaciens)的sdh；来自大鼠(Rattus norvegicus)或来自嗜热栖热菌(Thermus thermophilus)HB8的hibadh；来自大肠杆菌的yiaY。

在本公开的一个优选的实施方案中，丝氨酸脱氢酶由来自大肠杆菌的ydfG、或来自恶臭假单胞菌的mmsB、或来自大肠杆菌的yiaY编码。优选地，通过突变编码基因来优化这些酶，以提高其将L-丝氨酸转化为2-氨基丙二酸半醛的催化效率。

在本公开的另一个实施方案中，通过进化酶获得丝氨酸脱氢酶，该进化是为了改变酶的底物特异性和/或其催化效率，以获得表现出对丝氨酸的特异性和丝氨酸脱氢酶的活性的酶。这些酶选自对化学性质与L-丝氨酸相似的底物具有相同类型催化活性的酶。优选地，这些酶可以选自3-羟基异丁酸脱氢酶和丝氨酸脱氢酶。更优选地，这些酶由选自本领域公知的基因列表中的基因编码，包括但不限于此处的基因：来自大肠杆菌或来自柠檬明串珠菌(Leuconostoc citreum)或来自Symbiobacterium thermophilum的gldA；来自大肠杆菌的yqhE；来自大肠杆菌的yafB；来自杜氏利什曼原虫(Leishmania donovani)的alr；来自聚球藻属物种(Synechococcus sp.)的sakR1；来自枯草芽孢杆菌的yhdN；来自枯草芽孢杆菌的ytbE；来自拟南芥的AKR4C9；来自大肠杆菌的fucO。可以使用与由这些基因编码的任何多肽具有至少90％序列同一性的任何多肽。

通过本领域技术人员熟知的手段和方法进行这些酶的进化，以获得对底物L-丝氨酸具有改进的特异性和/或能够以改进的活性将其转化为2-氨基丙二酸半醛的酶。通过在本公开的微生物中或体外表达进化酶，以L-丝氨酸为底物，并通过检测产物2-氨基丙二酸半醛来选择进化的酶。

2-氨基丙二酸半醛转化为氨基乙醛的第二反应在细胞中自发进行(Fujisawa等人，2003)。在本公开的另一个实施方案中，具有2-氨基丙二酸半醛脱羧酶活性的酶催化2-氨基丙二酸半醛转化为氨基乙醛的第二反应。这种酶不是自然遇到的。因此通过已知酶的进化或通过筛选宏基因组文库获得该酶。用进化的氨基酸脱羧酶或进化的酮酸脱羧酶行使2-氨基丙二酸半醛脱羧酶活性，该酶催化氨基酸或酮酸的脱羧。优选地，选择进化的氨基酸脱羧酶。更优选地，所述进化的氨基酸脱羧酶选自组氨酸脱羧酶、丝氨酸脱羧酶、天冬氨酸脱羧酶、二氨基丁酸脱羧酶和鸟氨酸脱羧酶。这些酶由从本领域众所周知的基因列表中选择的基因编码，包括但不限于此处列出的基因：来自拟南芥的sdc；来自Aquifex aeolicus或来自枯草芽孢杆菌的panD；来自拟南芥的GAD或GAD2或GAD3或GAD4或GAD5；来自牛(BosTaurus)的GAD或GAD2或OAZ1或ODC1；来自大肠杆菌的gadA或gadB或panD或speC或speF；来自天蓝色链霉菌(Streptomyces coelicolor)的SCC105.13；来自Mannheimiasucciniciproducens的gadB；来自沃氏富盐菌(Haloferax volcanii)的bdb；来自乳杆菌属物种(Lactobacillus sp.)的odc1；来自乳酸乳球菌乳酸亚种(Lactococcus lactissubsp.Lactis)的kivD；来自乳酸乳球菌的kdcA；来自牛的OAZ1或ODC1；来自大肠杆菌的speC或speF；来自酿酒酵母的SPE1。可以使用与由这些基因编码的任何多肽具有至少90％序列同一性的任何多肽。优选地，来自拟南芥的sdc基因用于获得2-氨基丙二酸半醛脱羧酶活性。

通过本领域技术人员熟知的手段和方法进行这些酶的进化，以获得对底物2-氨基丙二酸半醛具有特异性并能够将其转化为氨基乙醛的酶。通过在本发明的微生物中或体外表达进化酶，以2-氨基丙二酸半醛作为底物并通过定量产物氨基乙醛来选择进化酶。

氨基乙醛转氨酶催化氨基乙醛转化为乙二胺的最后一个反应。这种酶不是自然遇到的。因此通过已知酶的进化或通过筛选宏基因组文库获得该酶。在本发明的一个实施方案中，用进化的转氨酶(transaminase)或转氨酶(aminotransferase)行使氨基乙醛转氨酶活性，该酶催化一个分子的氨基基团与另一个分子上的氧代基团的交换。优选地，进化的转氨酶选自磷酸丝氨酸转氨酶或天冬氨酸转氨酶或谷氨酸转氨酶。更优选地，进化的转氨酶选自使用谷氨酸作为氨基基团供体的转氨酶。这些酶由从本领域众所周知的基因列表中选择的基因编码，包括但不限于此处列出的基因：来自大肠杆菌或来自枯草芽孢杆菌或来自谷氨酸棒杆菌(Corynebacterium glutamicum)的serC；来自野猪(Sus scrofa)的GOT1；来自大肠杆菌的patA；来自犬布鲁氏菌(Brucella canis)的ygjG；来自根瘤菌(Rhizobium)NGR 234或来自阿维链霉菌(Streptomyces avermitilis)的rocD；来自天蓝色链霉菌(Streptomyces coelicolor)的SCO1284；来自拟南芥的AGT或AGT2或AGT3或GGT1；来自牛的AGXT。可以使用与由这些基因编码的任何多肽具有至少90％序列同一性的任何多肽。优选地，来自大肠杆菌的serC或来自野猪的GOT1基因用于获得氨基乙醛转氨酶活性。

通过本领域技术人员熟知的手段和方法进行这些酶的进化，以获得对底物氨基乙醛具有特异性并能够将其转化为乙二胺的酶。通过在本发明的微生物中或体外表达进化酶，以氨基乙醛作为底物并通过检测产物乙二胺来选择进化酶。

在本公开的另一个实施方案中，可以从以乙二胺作为唯一碳源和氮源生长的株中分离氨基乙醛转氨酶。为此目的，在以乙二胺作为唯一氮源和碳源的基本介质上培养来自环境样品的乙二胺富集培养物。从这些培养物中生成宏基因组文库，并针对氨基乙醛转氨酶的存在进行筛选。这种方法允许分离对应于酶活性的基因，并且是本领域专业人员所熟知的。

根据本公开的一个具体方面，工程化来自实施方案[X]的微生物以过表达至少一种以下基因：ydfG基因或mmsB基因或yiaY基因，编码丝氨酸脱氢酶；和/或进化的serC基因或GOT1基因，编码氨基乙醛转氨酶活性。

[Y]在一个实施方案中，本申请涉及一种能够由一种或多种己糖原料和一种氮源联产单乙二醇(MEG)(或乙醇酸)和乙二胺(EDA)的重组微生物，其中来自实施方案[A]或来自实施方案[B](和任选地包括实施方案[C])并且另外包括实施方案[D]、[E]、[F]和[G]中的一个或多个、进一步包括实施方案[H]、[I]和[J]中的一个或多个的重组微生物进一步表达以下(a)至(c)中的一种或多种：

(b)至少一种内源性或外源性核酸分子，其编码具有2-氨基丙二酸半醛转氨酶活性的酶，该酶催化来自(a)的2-氨基丙二酸半醛转化为2,3-二氨基丙酸；

(c)至少一种内源性或外源性核酸分子，其编码具有2,3-二氨基丙酸脱羧酶活性的酶，该酶催化来自(b)的2,3-二氨基丙酸转化为EDA；

其中联产MEG(或乙醇酸)和EDA。

根据本公开的这一方面，重组微生物过表达至少一种基因，其编码显示出丝氨酸脱氢酶、2-氨基丙二酸半醛转氨酶和2,3-二氨基丙酸脱羧酶活性的酶。这些基因可以是内源性基因或外源性基因。

丝氨酸脱氢酶催化L-丝氨酸转化为2-氨基丙二酸半醛的第一反应。该酶属于醇脱氢酶的大型酶家族，醇脱氢酶也称为醛还原酶。已知数种酶表现出丝氨酸脱氢酶活性。在本公开的一个实施方案中，丝氨酸脱氢酶选自这些已知的酶。这些酶由选自本领域公知的基因列表中的基因编码(Chowdhury等人，1996,Yao等人，2010,Tchigvintsev等人，2012,Fujisawa等人，2003,Hawes等人，1996和Lokanath等人，2005)，包括但不限于此处列出的基因：来自恶臭假单胞菌、来自聚球藻(Synechococcus)PCC6301或来自蜡状芽孢杆菌(Bacillus cereus)的mmsB；来自恶臭假单胞菌E23的hibdh；来自铜绿假单胞菌的PA0743；来自大肠杆菌或来自短芽孢杆菌(Bacillus brevis)或来自枯草芽孢杆菌的ydfG；来自根癌农杆菌(Agrobacterium tumefaciens)的sdh；来自大鼠(Rattus norvegicus)或来自嗜热栖热菌(Thermus thermophilus)HB8的hibadh；来自大肠杆菌的yiaY。

2-氨基丙二酸半醛转氨酶催化2-氨基丙二酸半醛转化为2,3-二氨基丙酸的第二反应。这种酶不是自然遇到的。因此通过已知酶的进化或通过筛选宏基因组文库获得该酶。用进化的转氨酶(transaminase)或转氨酶(aminotransferase)行使2-氨基丙二酸半醛转氨酶活性，该酶催化一个分子的氨基基团与另一个分子上的氧代基团的交换。优选地，进化的转氨酶选自磷酸丝氨酸转氨酶或天冬氨酸转氨酶或谷氨酸转氨酶。更优选地，进化的转氨酶选自使用谷氨酸作为氨基基团供体的转氨酶。这些酶由从本领域众所周知的基因列表中选择的基因编码，包括但不限于此处列出的基因：来自大肠杆菌或来自枯草芽孢杆菌或来自谷氨酸棒杆菌(Corynebacterium glutamicum)的serC；来自野猪(Sus scrofa)的GOT1；来自大肠杆菌的patA；来自犬布鲁氏菌(Brucella canis)的ygjG；来自根瘤菌(Rhizobium)NGR 234或来自阿维链霉菌(Streptomyces avermitilis)的rocD；来自天蓝色链霉菌(Streptomyces coelicolor)的SCO1284；来自拟南芥的AGT或AGT2或AGT3或GGT1；来自牛的AGXT。可以使用与由这些基因编码的任何多肽具有至少90％序列同一性的任何多肽。优选地，来自大肠杆菌的serC或来自野猪的GOT1基因用于获得2-氨基丙二酸半醛转氨酶活性。

通过本领域技术人员熟知的手段和方法进行这些酶的进化，以获得对底物2-氨基丙二酸半醛具有改进的特异性和/或能够以改进的活性将其转化为2,3-二氨基丙酸的酶。通过在本发明的微生物中或体外表达进化酶，以2-氨基丙二酸半醛作为底物并通过定量产物2,3-二氨基丙酸来选择进化酶。

具有2,3-二氨基丙酸脱羧酶活性的酶催化2,3-二氨基丙酸转化为乙二胺的第三反应。这种酶不是自然遇到的。因此通过已知酶的进化或通过筛选宏基因组文库获得该酶。用进化的氨基酸脱羧酶或进化的酮酸脱羧酶行使2,3-二氨基丙酸脱羧酶活性，该酶催化氨基酸或酮酸的脱羧。优选地，选择进化的氨基酸脱羧酶。更优选地，所述进化的氨基酸脱羧酶选自组氨酸脱羧酶、丝氨酸脱羧酶、天冬氨酸脱羧酶、二氨基丁酸脱羧酶和鸟氨酸脱羧酶。这些酶由从本领域众所周知的基因列表中选择的基因编码，包括但不限于此处列出的基因：来自拟南芥的sdc；来自枯草芽孢杆菌的padC或yclB；来自空肠弯曲杆菌(Campylobacter jejuni)或大肠杆菌的ubiD；来自酿酒酵母的PAD1或GAD1或SPE1；来自Aquifex aeolicus或来自枯草芽孢杆菌的panD；来自拟南芥的GAD或GAD2或GAD3或GAD4或GAD5；来自牛(Bos Taurus)的GAD或GAD2或OAZ1或ODC1；来自大肠杆菌的gadA或gadB或panD或speC或speF；来自天蓝色链霉菌(Streptomyces coelicolor)的SCC105.13；来自Mannheimia succiniciproducens的gadB；来自沃氏富盐菌(Haloferax volcanii)的bdb；来自乳杆菌属物种(Lactobacillus sp.)的odc1；来自乳酸乳球菌乳酸亚种(Lactococcuslactis subsp.Lactis)的kivD；来自乳酸乳球菌的kdcA；来自牛的OAZ1或ODC1；来自大肠杆菌的speC或speF；来自酿酒酵母的SPE1。可以使用与由这些基因编码的任何多肽具有至少90％序列同一性的任何多肽。优选地，来自拟南芥的sdc基因用于获得2,3-二氨基丙酸脱羧酶活性。

通过本领域技术人员熟知的手段和方法进行这些酶的进化，以获得对底物2,3-二氨基丙酸具有改进的特异性和/或能够以改进的活性将其转化为乙二胺的酶。通过在本发明的微生物中或体外表达进化酶，以2,3-二氨基丙酸作为底物并通过定量产物乙二胺来选择进化酶。根据本公开的一个具体方面，工程化来自实施方案[Y]的微生物以过表达：ydfG基因、yiaY基因或mmsB基因，编码丝氨酸脱氢酶；和/或进化的serC基因或GOT1基因，编码2-氨基丙二酸半醛转氨酶活性；和/或进化的来自拟南芥的sdc基因，编码2,3-二氨基丙酸脱羧酶。

[Z]在一个实施方案中，本申请涉及一种能够由一种或多种己糖原料和一种氮源联产单乙二醇(MEG)(或乙醇酸)和乙二胺(EDA)的重组微生物，其中来自实施方案[A]或来自实施方案[B](和任选地包括实施方案[C])并且另外包括实施方案[D]、[E]、[F]和[G]中的一个或多个、进一步包括实施方案[H]、[I]和[J]中的一个或多个的重组微生物进一步表达以下(a)至(c)中的一种或多种：

(a)至少一种内源性或外源性核酸分子，其编码具有丝氨酸脱羧酶活性的酶，该酶催化L-丝氨酸转化为乙醇胺；

(b)至少一种内源性或外源性核酸分子，其编码具有乙醇胺脱氢酶活性的酶，该酶催化来自(a)的乙醇胺转化为氨基乙醛；

其中联产MEG(或乙醇酸)和EDA。

根据本公开的这一方面，重组微生物过表达至少一种基因，其编码显示出丝氨酸脱羧酶、乙醇胺脱氢酶和氨基乙醛转氨酶活性的酶。这些基因可以是内源性基因或外源性基因。

具有丝氨酸脱羧酶活性的酶催化L-丝氨酸转化为乙醇胺的第一反应。这组酶催化L-丝氨酸脱羧为乙醇胺。在本发明的一个优选的实施方案中，丝氨酸脱羧酶由来自拟南芥的sdc编码(Rontein等人，2001,W02007/144346)。由来自拟南芥的sdc编码的丝氨酸脱羧酶将L-丝氨酸转化为乙醇胺具体公开于专利申请WO2007/144364中，该专利申请通过引用并入本文。优选地，通过突变编码基因来优化这些酶，以提高其将L-丝氨酸转化为乙醇胺的转化效率。

在本公开的一个实施方案中，通过进化酶获得丝氨酸脱羧酶活性，该进化是为了改变酶的底物特异性和/或其催化效率，以获得表现出对丝氨酸的特异性和改进的丝氨酸脱羧酶活性的酶。这些酶选自对化学性质与乙醇胺相似的底物具有相同类型催化活性的酶。这些酶由从本领域众所周知的基因列表中选择的基因编码，包括但不限于此处列出的基因：来自酿酒酵母的GAD1或SPE1；来自Aquifex aeolicus或枯草芽孢杆菌的panD；来自拟南芥的GAD或GAD2或GAD3或GAD4或GAD5；来自牛(Bos Taurus)的GAD或GAD2或OAZ1或ODC1；来自大肠杆菌的gadA或gadB或panD或speC或speF；来自天蓝色链霉菌(Streptomycescoelicolor)的SCC105.13；来自Mannheimia succiniciproducens的gadB；来自沃氏富盐菌(Haloferax volcanii)的bdb；来自乳杆菌属物种(Lactobacillus sp.)的odc1；来自牛的OAZ1或ODC1；来自大肠杆菌的speC或speF；来自酿酒酵母的SPE1。可以使用与由这些基因编码的任何多肽具有至少90％序列同一性的任何多肽。

通过本领域技术人员熟知的手段和方法进行这些酶的进化，以获得对底物L-丝氨酸具有改进的特异性和能够以改进的活性将其转化为乙醇胺的酶。通过在本发明的微生物中或体外表达进化酶，以L-丝氨酸作为底物并通过定量产物乙醇胺来选择进化酶。

乙醇胺脱氢酶催化乙醇胺转化为氨基乙醛的第二反应。在现有技术中没有公开具有这种活性的天然酶；然而，有些酶具有低催化活性。因此，有利地将这些具有低催化活性的酶进化为具有改进活性的进化酶。也可以通过筛选宏基因组文库获得有用的酶。

在本公开的一个实施方案中，通过进化酶获得乙醇胺脱氢酶活性，该进化是为了改变酶的底物特异性和/或其催化效率，以获得表现出对乙醇胺的特异性和乙醇胺脱氢酶的活性的酶。这些酶选自对化学性质与乙醇胺相似的底物具有相同类型催化活性的酶。这些酶由从本领域众所周知的基因列表中选择的基因编码，包括但不限于此处列出的基因：来自恶臭假单胞菌、或来自聚球藻(Synechococcus)PCC6301、或来自蜡状芽孢杆菌(Bacillus cereus)的mmsB；来自恶臭假单胞菌E23的hibdh；来自铜绿假单胞菌的PA0743；来自大肠杆菌或来自短芽孢杆菌(Bacillus brevis)或来自枯草芽孢杆菌的ydfG；来自根癌农杆菌(Agrobacterium tumefaciens)的sdh；来自大鼠(Rattus norvegicus)或来自嗜热栖热菌(Thermus thermophilus)HB8的hibadh；来自大肠杆菌或来自柠檬明串珠菌(Leuconostoc citreum)或来自Symbiobacterium thermophilum的gldA；来自大肠杆菌的yqhE；来自大肠杆菌的yafB；来自产气肠杆菌(Enterobacter aerogenes)的aladh；来自杜氏利什曼原虫(Leishmania donovani)的alr；来自聚球藻属物种(Synechococcus sp.)的sakR1；来自枯草芽孢杆菌的yhdN；来自枯草芽孢杆菌的ytbE；来自大肠杆菌的yiaY；来自拟南芥的AKR4C9；来自大肠杆菌的fucO。可以使用与由这些基因编码的任何多肽具有至少90％序列同一性的任何多肽。优选地，来自大肠杆菌的fucO或来自大肠杆菌的yiaY基因用于获得乙醇胺脱氢酶活性。

通过本领域技术人员熟知的手段和方法进行这些酶的进化，以获得对底物乙醇胺具有改进的特异性和/或能够以改进的活性将其转化为氨基乙醛的酶。通过在本发明的微生物中或体外表达进化酶，以乙醇胺作为底物并通过定量产物氨基乙醛来选择进化酶。

氨基乙醛转氨酶催化氨基乙醛转化为乙二胺的最后反应。这种酶不是自然遇到的。因此通过已知酶的进化或通过筛选宏基因组文库获得该酶。在本公开的一个实施方案中，用进化的转氨酶(transaminase)或转氨酶(aminotransferase)行使氨基乙醛转氨酶活性，该酶催化一个分子的氨基基团与另一个分子上的氧代基团的交换。优选地，进化的转氨酶选自磷酸丝氨酸转氨酶或天冬氨酸转氨酶或谷氨酸转氨酶。更优选地，进化的转氨酶选自使用谷氨酸作为氨基基团供体的转氨酶。这些酶由从本领域众所周知的基因列表中选择的基因编码，包括但不限于此处列出的基因：来自大肠杆菌或来自枯草芽孢杆菌或来自谷氨酸棒杆菌(Corynebacterium glutamicum)的serC；来自野猪(Sus scrofa)的GOT1；来自大肠杆菌的patA；来自犬布鲁氏菌(Brucella canis)的ygjG；来自根瘤菌(Rhizobium)NGR234或来自阿维链霉菌(Streptomyces avermitilis)的rocD；来自天蓝色链霉菌(Streptomyces coelicolor)的SCO1284；来自拟南芥的AGT或AGT2或AGT3或GGT1；来自牛的AGXT。可以使用与由这些基因编码的任何多肽具有至少90％序列同一性的任何多肽。优选地，使用来自大肠杆菌的serC或来自野猪的GOT1基因。

通过本领域技术人员熟知的手段和方法进行这些酶的进化，以获得对底物氨基乙醛具有改进的特异性和/或能够以改进的活性将其转化为乙二胺的酶。通过在本发明的微生物中或体外表达进化酶，以氨基乙醛作为底物并通过检测产物乙二胺来选择进化酶。

根据本公开的一个具体方面，工程化来自实施方案[Z]的微生物以过表达：来自拟南芥的sdc基因，编码丝氨酸脱羧酶；和/或来自大肠杆菌的fucO或yiaY基因，编码乙醇胺脱氢酶活性；和/或进化的serC基因或GOT1基因，编码氨基乙醛转氨酶活性。

[AA]在一个实施方案中，本申请涉及一种能够由一种或多种己糖原料和一种氮源联产单乙二醇(MEG)(或乙醇酸)和乙二胺(EDA)的重组微生物，其中来自实施方案[A]或来自实施方案[B](和任选地包括实施方案[C])并且另外包括实施方案[D]、[E]、[F]和[G]中的一个或多个、进一步包括实施方案[H]、[I]和[J]中的一个或多个的重组微生物进一步表达以下(a)至(c)中的一种或多种：

(a)至少一种内源性或外源性核酸分子，其编码具有丝氨酸羟甲基转移酶活性的酶，该酶催化L-丝氨酸转化为甘氨酸；

(b)至少一种内源性或外源性核酸分子，其编码具有醛氧化酶活性的酶，该酶催化来自(a)的甘氨酸转化为氨基乙醛；

其中联产MEG(或乙醇酸)和EDA。

优选地，使用来自大肠杆菌的glyA基因以获得丝氨酸羟甲基转移酶活性。

通过进化酶获得醛氧化酶，该进化是为了改变酶的底物特异性和/或其催化效率，以获得表现出对甘氨酸的特异性和醛氧化酶的活性的酶。这些酶选自对化学性质与甘氨酸相似的底物具有相同类型催化活性的酶。这些酶由从本领域众所周知的基因列表中选择的基因编码，包括但不限于此处列出的基因：来自Aquifex aeolicus的aldH1；来自Anoxybacillus flavithermus的dhaS；来自西方蜜蜂(Apis mellifera)的Aldh；来自枯草芽孢杆菌的aldX、aldY、dhaS、ycbD、yfmT或ywdH；来自大肠杆菌的prr；来自酿酒酵母的ALD2、ALD3、ALD4、ALD5、ALD6；来自Roseobacter denitrificans的betB；来自金黄节杆菌(Arthrobacter aurescens)的AAur_0650。可以使用与由这些基因编码的任何多肽具有至少90％序列同一性的任何多肽。

通过具有氨基乙醛转氨酶活性的酶将氨基乙醛转化为乙二胺。通过进化酶获得该酶，该进化是为了改变酶的底物特异性和/或其催化效率，以获得表现出对氨基乙醛的特异性和转氨酶活性的酶。这些酶选自对化学性质与氨基乙醛相似的底物具有相同类型催化活性的酶。这些酶由从本领域众所周知的基因列表中选择的基因编码，包括但不限于此处列出的基因：来自大肠杆菌或来自枯草芽孢杆菌或来自谷氨酸棒杆菌(Corynebacteriumglutamicum)的serC；来自野猪(Sus scrofa)的GOT1；来自大肠杆菌的patA；来自犬布鲁氏菌(Brucella canis)的ygjG；来自根瘤菌(Rhizobium)NGR 234或来自阿维链霉菌(Streptomyces avermitilis)的rocD；来自天蓝色链霉菌(Streptomyces coelicolor)的SCO1284；来自拟南芥的AGT或AGT2或AGT3或GGT1；来自牛的AGXT。可以使用与由这些基因编码的任何多肽具有至少90％序列同一性的任何多肽。

根据本公开的一个具体的方面，工程化来自实施方案[AA]的微生物，以过表达进化的serC基因或GOT1基因，该基因编码氨基乙醛转氨酶活性。

[BB]在一个实施方案中，本申请涉及一种能够由一种或多种己糖原料和一种氮源联产单乙二醇(MEG)(或乙醇酸)和乙二胺(EDA)的重组微生物，其中来自实施方案[A]或来自实施方案[B](和任选地包括实施方案[C])并且另外包括实施方案[D]、[E]、[F]和[G]中的一个或多个、进一步包括实施方案[H]、[I]和[J]中的一个或多个的重组微生物进一步表达以下(a)至(e)中的一种或多种：

(a)至少一种内源性或外源性核酸分子，其编码具有氨基酸N-乙酰转移酶活性或O-乙酰转移酶活性的酶，该酶催化L-丝氨酸转化为N-乙酰丝氨酸；

(b)至少一种内源性或外源性核酸分子，其编码具有N-乙酰丝氨酸脱氢酶活性的酶，该酶催化来自(a)的N-乙酰丝氨酸转化为N-乙酰丙二酸半醛；

(c)至少一种内源性或外源性核酸分子，其编码具有转氨酶活性的酶，该酶催化来自(b)的N-乙酰丙二酸半醛转化为乙酰氨基丙酸；

(d)至少一种内源性或外源性核酸分子，其编码具有脱乙酰酶活性的酶，该酶催化来自(c)的乙酰氨基丙酸转化为2,3-二氨基丙酸；

(e)至少一种内源性或外源性核酸分子，其编码具有2,3-二氨基丙酸脱羧酶活性的酶，该酶催化来自(d)的2,3-二氨基丙酸转化为EDA；

其中联产MEG(或乙醇酸)和EDA。

实施方案[BB]的第一转化步骤可以是氨基酸N-乙酰转移酶活性或O-乙酰转移酶活性，因为O向N的转化是自发的。优选地，使用来自大肠杆菌的argA基因以获得氨基酸N-乙酰转移酶活性。

通过进化酶获得具有N-乙酰丝氨酸脱氢酶活性的酶，该进化是为了改变酶的底物特异性和/或其催化效率，以获得表现出对N-乙酰丝氨酸的特异性和N-乙酰丝氨酸脱氢酶活性的酶。这些酶选自对化学性质与N-乙酰丝氨酸相似的底物具有相同类型催化活性的酶。这些酶由从本领域众所周知的基因列表中选择的基因编码，包括但不限于此处列出的基因：来自恶臭假单胞菌、或来自聚球藻(Synechococcus)PCC6301、或来自蜡状芽孢杆菌(Bacillus cereus)的mmsB；来自恶臭假单胞菌E23的hibdh；来自铜绿假单胞菌的PA0743；来自大肠杆菌或来自短芽孢杆菌(Bacillus brevis)或来自枯草芽孢杆菌的ydfG；来自根癌农杆菌(Agrobacterium tumefaciens)的sdh；来自大鼠(Rattus norvegicus)或来自嗜热栖热菌(Thermus thermophilus)HB8的hibadh；来自大肠杆菌或来自柠檬明串珠菌(Leuconostoc citreum)或来自Symbiobacterium thermophilum的gldA；来自大肠杆菌的yqhE；来自大肠杆菌的yafB；来自产气肠杆菌(Enterobacter aerogenes)的aladh；来自杜氏利什曼原虫(Leishmania donovani)的alr；来自聚球藻属物种(Synechococcus sp.)的sakR1；来自枯草芽孢杆菌的yhdN；来自枯草芽孢杆菌的ytbE；来自大肠杆菌的yiaY；来自拟南芥的AKR4C9；来自大肠杆菌的fucO。可以使用与由这些基因编码的任何多肽具有至少90％序列同一性的任何多肽。

可以通过进化酶获得具有转氨酶活性、将N-乙酰丙二酸半醛转化为乙酰氨基丙酸的酶，该进化是为了改变酶的底物特异性和/或其催化效率，以获得表现出对N-乙酰丙二酸半醛的特异性和N-乙酰丙二酸半醛转氨酶的活性的酶。这些酶选自对化学性质与N-乙酰丙二酸半醛相似的底物具有相同类型催化活性的酶。这些酶由从本领域众所周知的基因列表中选择的基因编码，包括但不限于此处列出的基因：来自大肠杆菌或来自枯草芽孢杆菌或来自谷氨酸棒杆菌(Corynebacterium glutamicum)的serC；来自野猪(Sus scrofa)的GOT1；来自大肠杆菌的patA；来自犬布鲁氏菌(Brucella canis)的ygjG；来自根瘤菌(Rhizobium)NGR 234或来自阿维链霉菌(Streptomyces avermitilis)的rocD；来自天蓝色链霉菌(Streptomyces coelicolor)的2SCG18.31c；来自拟南芥的AGT或AGT2或AGT3或GGT1；来自牛的AGXT。可以使用与由这些基因编码的任何多肽具有至少90％序列同一性的任何多肽。

优选地，使用来自大肠杆菌的基因argE以获得将乙酰氨基丙酸转化为2,3-二氨基丙酸的脱乙酰酶活性。

可以通过进化酶来获得具有氨基酸脱羧酶活性或酮酸脱羧酶活性、以将2,3-二氨基丙酸转化为乙二胺的酶，该进化是为了改变其底物特异性和/或其催化效率，以获得表现出对2,3-二氨基丙酸的特异性和氨基酸脱羧酶或酮酸脱羧酶的活性的酶。这些酶选自对化学性质与2,3-二氨基丙酸相似的底物具有相同类型催化活性的酶。这些酶由从本领域众所周知的基因列表中选择的基因编码，包括但不限于此处列出的基因：来自拟南芥的sdc；来自枯草芽孢杆菌的padC或yclB；来自空肠弯曲杆菌(Campylobacter jejuni)或大肠杆菌的ubiD；来自酿酒酵母的PAD1或GAD1或SPE1；来自Aquifex aeolicus或来自枯草芽孢杆菌的panD；来自拟南芥的GAD或GAD2或GAD3或GAD4或GAD5；来自牛(Bos Taurus)的GAD或GAD2或OAZ1或ODC1；来自大肠杆菌的gadA或gadB或panD或speC或speF；来自天蓝色链霉菌(Streptomyces coelicolor)的SCC105.13；来自Mannheimia succiniciproducens的gadB；来自沃氏富盐菌(Haloferax volcanii)的bdb；来自乳杆菌属物种(Lactobacillus sp.)的odc1；来自乳酸乳球菌乳酸亚种(Lactococcus lactis subsp.Lactis)的kivD；来自乳酸乳球菌的kdcA；来自牛的OAZ1或ODC1；来自大肠杆菌的speC或speF；来自酿酒酵母的SPE1。可以使用与由这些基因编码的任何多肽具有至少90％序列同一性的任何多肽。

在本公开的一个进一步的实施方案中，用其中优化了丝氨酸生物合成的微生物执行该方法。专利申请WO 2007/144346中具体公开了这种优化，该申请通过引用并入本文。

可选地，在另一个实施方案中，可以通过以下过程生产EDA：可以通过丝氨酸氨基酶(EC 2.6.1.-)将Ser直接胺化为(S)-2,3-二氨基丙酸，然后例如通过来自L-2,4-二氨基丁酸或鸟氨酸脱羧酶家族的酶脱羧为EDA(图11)。然而，如果这种具有(S)-2,3-二氨基丙酸脱羧酶活性的酶不是特异性的，该酶也可能作用于其他氨基酸或丝氨酸本身。

在一些实施方案中，可以通过以下方法生产EDA：也可以通过使用(S)-2,3-二氨基丙酸解氨酶(EC 4.3.1.15)直接胺化丙酮酸来产生中间体(S)-2,3-二氨基丙酸(图11)：

在一些实施方案中，生产MEG(或乙醇酸)和EDA非常接近于热力学最大产率潜力，即使用一种或多种己糖无损转化为一种或多种戊糖-5-磷酸中间体，随后将一种或多种戊糖-5-磷酸中间体转化为一种或多种戊糖-1-磷酸和/或戊糖中间体，然后通过C2途径联产MEG(或乙醇酸)和通过C3途径由一种或多种戊糖-1-磷酸和/或戊糖中间体联产EDA。在一些实施方案中，与通过天然的或公开的类似途径由葡萄糖制造EDA的生产相比，通过本申请中公开的途径联产MEG(或乙醇酸)和EDA的热力学产率潜力高14％。

联产：己糖+2NH₃->MEG(或乙醇酸)+EDA+0ATP

Y(途径)＝(0.337+0.326)g/g＝0.663g(MEG(或乙醇酸)+EDA)/g(己糖+2NH₃)，97％的Y(最大)(燃烧热)＝0.687g/g

标准途径：葡萄糖+4NH₃->2EDA+2NADH+0ATP

Y(途径)＝0.484g(EDA)/g(葡萄糖+4NH₃)，85％的Y(最大)(燃烧热)＝0.571g/g

在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[H]，用于生产EDA的C3途径包括实施方案[CC]。在其他实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[H]，用于生产EDA的C3途径包括实施方案[DD]。在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[I]，用于生产EDA的C3途径包括实施方案[CC]。在其他实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[I]，用于生产EDA的C3途径包括实施方案[DD]。在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[J]，用于生产EDA的C3途径包括实施方案[CC]。在其他实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[J]，用于生产EDA的C3途径包括实施方案[DD]。

[CC]在一个实施方案中，本申请涉及一种能够由一种或多种己糖原料和一种氮源联产单乙二醇(MEG)(或乙醇酸)和乙二胺(EDA)的重组微生物，其中来自实施方案[A]或来自实施方案[B](和任选地包括实施方案[C])并且另外包括实施方案[D]、[E]、[F]和[G]中的一个或多个、进一步包括实施方案[H]、[I]和[J]中的一个或多个的重组微生物进一步表达以下(a)至(b)中的一种或多种：

(a)至少一种内源性或外源性核酸分子，其编码具有丝氨酸氨基酶活性的酶，该酶催化L-丝氨酸转化为(S)-2,3-二氨基丙酸；

(b)至少一种内源性或外源性核酸分子，其编码具有(S)-2,3-二氨基丙酸脱羧酶活性的酶，该酶催化来自(a)的(S)-2,3-二氨基丙酸转化为EDA；

其中联产MEG(或乙醇酸)和EDA。

[DD]在一个实施方案中，本申请涉及一种能够由一种或多种己糖原料和一种氮源联产单乙二醇(MEG)(或乙醇酸)和乙二胺(EDA)的重组微生物，其中来自实施方案[A]或来自实施方案[B](和任选地包括实施方案[C])并且另外包括实施方案[D]、[E]、[F]和[G]中的一个或多个、进一步包括实施方案[H]、[I]和[J]中的一个或多个的重组微生物进一步表达以下(a)至(b)中的一种或多种：

(a)至少一种内源性或外源性核酸分子，其编码具有(S)-2,3-二氨基丙酸解氨酶活性的酶，该酶催化丙酮酸和氨转化为(S)-2,3-二氨基丙酸；

(b至少一种内源性或外源性核酸分子，其编码具有(S)-2,3-二氨基丙酸脱羧酶活性的酶，该酶催化来自(a)的(S)-2,3-二氨基丙酸转化为EDA；

其中丙酮酸由内源性糖酵解生产，并且其中联产MEG(或乙醇酸)和EDA。

在一些实施方案中，具有2,3-二氨基丙酸解氨酶活性的酶用于将丙酮酸和铵转化为(S)-2,3-二氨基丙酸。在一些实施方案中，具有2,3-二氨基丙酸解氨酶活性的酶由与大肠杆菌2,3-二氨基丙酸解氨酶ygeX具有至少70％序列同一性、具有至少80％序列同一性或具有至少90％序列同一性的氨基酸序列编码。在其他实施方案中，具有2,3-二氨基丙酸解氨酶活性的酶是大肠杆菌ygeX。在一些实施方案中，编码具有2,3-二氨基丙酸解氨酶活性的酶的一种或多种核酸分子包含UniProt ID P66899中列出的氨基酸序列。在进一步的实施方案中，编码具有2,3-二氨基丙酸解氨酶活性的酶的一种或多种核酸分子由Gene ID947012中列出的核酸序列编码。

在以上公开的任何方面的一个实施方案中，具有乙醇醛还原酶活性的酶由获自微生物的一种或多种核酸分子编码，所述微生物选自大肠杆菌和酿酒酵母。在另一个实施方案中，所述一种或多种核酸分子选自gldA、GRE2、GRE3、yqhD、ydjG、fucO、yafB(dkgB)和/或yqhE(dkgA)，或其同源物。在另一个实施方案中，所述一种或多种核酸分子是yqhD。在一些实施方案中，yqhD包含G149E突变。在一个进一步的实施方案中，具有乙醇醛还原酶活性的酶包含选自SEQ ID NO：13、15、17、20、23、25、28、30和32的氨基酸序列。在一个仍进一步的实施方案中，具有乙醇醛还原酶活性的酶由选自SEQ ID NO：12、14、16、18、19、21、22、24、26、27、29和31的核酸序列编码。

在上述公开的任一个方面的一个实施方案中，具有硫解酶或乙酰辅酶A乙酰转移酶活性的酶由一种或多种获自微生物的核酸分子编码，所述微生物选自梭菌属物种、芽孢杆菌属物种、大肠杆菌、酵母属物种和海杆菌属物种。在一些实施方案中，具有硫解酶或乙酰辅酶A乙酰转移酶活性的酶由一种或多种获自微生物的核酸分子编码，所述微生物选自丙酮丁醇梭菌、热解糖梭菌(Clostridium thermosaccharolyticum)、蜡状芽孢杆菌(Bacillus cereus)、大肠杆菌、酿酒酵母和除烃海杆菌(Marinobacterhydrocarbonoclasticus)。在一些实施方案中，所述一种或多种核酸分子是thlA、atoB和/或ERG10，或其同源物。在一个进一步的实施方案中，具有硫解酶或乙酰辅酶A乙酰转移酶活性的酶包含选自SEQ ID NO：35、37和40的氨基酸序列。在一个仍进一步的实施方案中，具有硫解酶或乙酰辅酶A乙酰转移酶活性的酶由选自SEQ ID NO：33、34、36、38和39的核酸序列编码。

在以上公开的任何方面的一个实施方案中，具有乙酰辅酶A：乙酰乙酸辅酶A转移酶或乙酸：乙酰乙酰辅酶A水解酶活性的酶由一种或多种获自微生物的核酸分子编码，所述微生物选自梭菌属物种(Clostridium sp.)和大肠杆菌。在另一个实施方案中，具有乙酰辅酶A：乙酰乙酸辅酶A转移酶或乙酸：乙酰乙酰辅酶A水解酶活性的酶由获自大肠杆菌的一种或多种核酸分子编码。在一些实施方案中，编码具有乙酰辅酶A：乙酰乙酸辅酶A转移酶活性的酶的一种或多种核酸分子是atoA和/或atoD，或其同源物。在另一个实施方案中，具有乙酰辅酶A：乙酰乙酸辅酶A转移酶或乙酸：乙酰乙酰辅酶A水解酶活性的酶由一种或多种获自丙酮丁醇梭菌(Clostridium acetobutylicum)的核酸分子编码。在一些实施方案中，编码具有乙酸：乙酰乙酰辅酶A水解酶活性的酶的一种或多种核酸分子是ctfA和/或ctfB，或其同源物。在一个进一步的实施方案中，具有乙酰辅酶A：乙酰乙酸辅酶A转移酶或乙酸：乙酰乙酰辅酶A水解酶活性的酶包含选自SEQ ID NO：43、46、97、99、101和103的氨基酸序列。在一个仍进一步的实施方案中，具有乙酰辅酶A：乙酰乙酸辅酶A转移酶或乙酸：乙酰乙酰辅酶A水解酶活性的酶由选自SEQ ID NO：41、42、44、45、96、98、100和102的核酸序列编码。

在以上公开的任何方面的一个实施方案中，具有乙酰乙酸脱羧酶活性的酶由一种或多种获自微生物的核酸分子编码，所述微生物选自梭菌属物种、芽孢杆菌属物种、色杆菌属物种(Chromobacterium sp.)和假单胞菌属物种。在另一个实施方案中，具有乙酰乙酸脱羧酶活性的酶由一种或多种获自微生物的核酸分子编码，所述微生物选自丙酮丁醇梭菌、拜氏梭菌(Clostridium beijerinckii)、解纤维素梭菌(Clostridium cellulolyticum)、多粘芽孢杆菌(Bacillus polymyxa)、紫色色杆菌(Chromobacterium violaceum)和恶臭假单胞菌。在一些实施方案中，编码具有乙酰乙酸脱羧酶活性的酶的一种或多种核酸分子是adc，或其同源物。在一个进一步的实施方案中，具有乙酰乙酸脱羧酶活性的酶包含选自SEQID NO：49和52的氨基酸序列。在一个仍进一步的实施方案中，具有乙酰乙酸脱羧酶活性的酶由选自SEQ ID NO：47、48、50和51的核酸序列编码。

[EE]在另一个实施方案中，选自实施方案[H]、实施方案[I]和实施方案[J]的重组微生物任选地进一步包含一个或多个选自以下的修饰：

(i)编码木糖异构酶的基因中的缺失、插入或功能缺失突变，该酶催化D-木酮糖转化为D-木糖；

(ii)编码乙醇醛脱氢酶的基因中的缺失、插入或功能缺失突变，该酶催化乙醇醛转化为乙醇酸；和

(iii)编码乳酸脱氢酶的基因中的缺失、插入或功能缺失突变，该酶催化丙酮酸转化为乳酸。

在一些实施方案中，生产MEG(或乙醇酸)或任选MEG(或乙醇酸)和一种或多种联产品的重组微生物，在编码木糖异构酶的基因中包含缺失、插入或功能缺失突变，以防止D-木酮糖转化为D-木糖，而将反应分流至D-木酮糖转化为D-木酮糖-1-磷酸、D-木酮糖-5-磷酸或D-核酮糖。在一些实施方案中，木糖异构酶来自大肠杆菌。在一些实施方案中，木糖异构酶由xylA基因或其同源物编码。

在一些实施方案中，生产MEG(或乙醇酸)或任选MEG(或乙醇酸)和一种或多种联产品的重组微生物，在编码乙醇醛脱氢酶的基因中包含缺失、插入或功能缺失突变，以防止由乙醇醛生产乙醇酸，而将反应分流至乙醇醛转化为MEG。在一些实施方案中，乙醇醛脱氢酶来自大肠杆菌。在一些实施方案中，乙醇醛脱氢酶由aldA基因或其同源物编码。在一些实施方案中，编码乙醇醛脱氢酶的基因是部分缺失、插入或功能缺失突变的，其中仍然存在一些乙醇醛脱氢酶功能并且仍然生产一定量的乙醇酸。

在一些实施方案中，生产MEG(或乙醇酸)或任选MEG(或乙醇酸)和一种或多种联产品的重组微生物，在编码乳酸脱氢酶的基因中包含缺失、插入或功能缺失突变，以防止由丙酮酸生产乳酸，而将反应分流至生产一种或多种联产品。在一些实施方案中，乳酸脱氢酶来自大肠杆菌。在一些实施方案中，乳酸脱氢酶由ldhA基因或其同源物编码。

本文描述的任何重组微生物和方法的实施方案的非限制性组合被包括作为本公开的一部分。

重组微生物

本公开提供了可以工程化以表达各种内源性或外源性酶的微生物。

在本文所述的各种实施方案中，重组微生物是真核微生物。在一些实施方案中，所述真核微生物是酵母。在示例性的实施方案中，所述酵母是选自以下的属的成员：耶氏酵母属(Yarrowia)、念珠菌属(Candida)、酵母属(Saccharomyces)、毕赤酵母属(Pichia)、汉逊酵母属(Hansenula)、克鲁维酵母属(Kluyveromyces)、伊萨酵母属(Issatchenkia)、接合酵母属(Zygosaccharomyces)、德巴利酵母属(Debaryomyces)、裂殖酵母属(Schizosaccharomyces)、管囊酵母属(Pachysolen)、隐球菌属(Cryptococcus)、毛孢子菌属(Trichosporon)、红酵母属(Rhodotorula)和Myxozyma属。

在一些实施方案中，重组微生物是原核微生物。在示例性的实施方案中，所述原核微生物是选自以下的属的成员：埃希氏菌属(Escherichia)、梭菌属(Clostridium)、发酵单胞菌属(Zymomonas)、沙门氏菌属(Salmonella)、红球菌属(Rhodococcus)、假单胞菌属(Pseudomonas)、芽孢杆菌属(Bacillus)、乳杆菌属(Lactobacillus)、肠球菌属(Enterococcus)、产碱杆菌属(Alcaligenes)、克雷伯氏菌属(Klebsiella)、类芽孢杆菌属(Paenibacillus)、节杆菌属(Arthrobacter)、棒杆菌属(Corynebacterium)和短杆菌属(Brevibacterium)。

在一些实施方案中，重组微生物用于生产单乙二醇(MEG)或乙醇酸(GA)或任选MEG(或GA)和一种或多种本文公开的联产品。

因此，在另一方面，本发明提供了使用本文所述的重组微生物生产MEG或GA或任选MEG(或GA)和一种或多种联产品的方法。在一个实施方案中，该方法包括在含有提供碳源的原料的培养介质中培养重组微生物，直至产生MEG或GA或任选MEG(或GA)和一种或多种联产品。在一个进一步的实施方案中，回收MEG(或GA)或任选地MEG(或GA)和一种或多种联产品。可以通过本领域已知的方法回收，如蒸馏、基于膜的分离、气提(gas stripping)、溶剂萃取和膨胀床吸附(expanded bed adsorption)。

在一些实施方案中，所述原料包含碳源。在本文所述的各种实施方案中，所述碳源可以选自糖、甘油、醇、有机酸、烷烃、脂肪酸、木质纤维素、蛋白质、二氧化碳和一氧化碳。在一个示例性实施方案中，所述碳源是糖。在一个进一步的示例性实施方案中，所述糖是葡萄糖或葡萄糖的低聚物。在其他实施方案中，所述葡萄糖的低聚物选自果糖、蔗糖、淀粉、纤维二糖、麦芽糖、乳糖和纤维素。

使用重组微生物生物合成木糖醇或任选木糖醇和一种或多种联产品

一方面，本公开提供重组微生物，其包含一种或多种生化途径，所述生化途径由一种或多种己糖原料生产木糖醇。一方面，本公开提供重组微生物，其包含一种或多种生化途径以由己糖(如葡萄糖)通过PPP的非氧化分支(即，使用1)转酮醇酶、2)转醛醇酶、3)核酮糖-5P差向异构酶和4)核糖-5P异构酶)生产木糖醇。在另一方面，本公开优选地提供重组微生物，其具有降低或消除PPP氧化分支的至少一种酶的活性(即以下基因缺失或失活：大肠杆菌中编码葡萄糖-6-磷酸1-脱氢酶的基因“zwf”；和/或大肠杆菌中编码6-磷酸葡萄糖酸内酯酶的基因“pgl”；和/或大肠杆菌中编码6-磷酸葡萄糖酸脱氢酶(脱羧)的基因“gnd”)，以便减少碳损失，从而提高木糖醇的产率。在一个实施方案中，一种或多种联产品与木糖醇联产。

因此，在一个实施方案中，本申请涉及重组微生物，其包含一种或多种包含至少一种酶的生化途径，所述酶具有将一种或多种己糖原料无损转化为木糖醇的活性。

一方面，本公开的微生物能够将己糖或包含己糖的低聚物转化为作为单一终产物的木糖醇。一方面，本公开的微生物能够将己糖或包含己糖的低聚物转化为作为联产品的木糖醇。

一方面，本公开的微生物能够(1)将己糖(如葡萄糖)转化为D-核糖-5P和/或(2)D-木酮糖-5P和/或D-核酮糖-5P。一方面，本公开的微生物能够通过表达rpiA将D-核糖-5P转化为D-核酮糖-5P。一方面，本公开的微生物能够通过表达rpe将D-核酮糖-5P转化为D-木酮糖-5P。一方面，本公开的微生物能够通过表达rpe将D-木酮糖-5P转化为D-核酮糖-5P。一方面，本公开的微生物能够通过表达磷酸酶将D-木酮糖-5P转化为D-木酮糖。一方面，本公开的微生物包含对D-核酮糖-5P和/或D-木酮糖-5P具有高特异性和/或高活性的磷酸酶。

一方面，本公开的微生物能够通过表达磷酸酶将D-核酮糖-5P转化为D-核酮糖。一方面，本公开的微生物能够将D-核酮糖转化为D-木酮糖。一方面，本公开的微生物能够通过(但不限于)表达EC 1.1.1.9将D-木酮糖转化为木糖醇。在一些方面，本公开的微生物能够进行任何一种或多种上述反应。在一些方面，本公开的微生物能够进行图12中描述的任何一个或多个反应。在一些方面，本公开的微生物不具有作为代谢途径中间体的阿糖醇和/或木糖醇-5P。

一方面，本公开的微生物能够(1)将己糖(如葡萄糖)转化为D-核糖-5P和/或(2)D-木酮糖-5P和/或D-核酮糖-5P。一方面，本公开的微生物能够通过表达rpiA将D-核糖-5P转化为D-核酮糖-5P。一方面，本公开的微生物能够通过表达rpe将D-核酮糖-5P转化为D-木酮糖-5P。一方面，本公开的微生物能够通过表达rpe将D-木酮糖-5P转化为D-核酮糖-5P。一方面，本公开的微生物能够(1)通过表达ADP将D-核酮糖-5P转化为D-阿糖醇-5P，(2)通过表达ADP将D-阿糖醇-5P转化为D-木酮糖-1P，(3)通过表达ADP将木酮糖-5P转化为D-阿糖醇-1P，和/或(4)通过表达ADP将D-阿糖醇-1P转化为D-核酮糖-1P。一方面，本公开的微生物能够通过(但不限于)表达EC 3.1.3.-和/或EC 2.7.1.17将D-核酮糖-1P转化为D-核酮糖。一方面，本公开的微生物能够通过(但不限于)表达EC 5.1.3.30和/或EC 5.1.3.31将D-核酮糖转化为D-木酮糖。一方面，本公开的微生物能够通过(但不限于)表达EC 3.1.3.-和/或EC2.7.1.17将D-木酮糖-1P转化为D-木酮糖。一方面，本公开的微生物能够通过(但不限于)表达EC 1.1.1.9将D-木酮糖转化为木糖醇。在一些方面，本公开的微生物能够进行任何一种或多种上述反应。在一些方面，本公开的微生物能够进行图13中描述的任何一个或多个反应。

一方面，本公开的微生物能够(1)将己糖(如葡萄糖)转化为D-核糖-5P和/或(2)D-木酮糖-5P和/或D-核酮糖-5P。一方面，本公开的微生物能够通过表达rpiA将D-核糖-5P转化为D-核酮糖-5P。一方面，本公开的微生物能够通过表达rpe将D-核酮糖-5P转化为D-木酮糖-5P。一方面，本公开的微生物能够通过表达rpe将D-木酮糖-5P转化为D-核酮糖-5P。一方面，本公开的微生物能够通过表达PPM将D-核酮糖-5P转化为D-核酮糖-1P。一方面，本公开的微生物能够通过表达PPM将D-木酮糖-5P转化为D-木酮糖-1P。一方面，本公开的微生物能够通过(但不限于)表达EC 3.1.3.-和/或EC 2.7.1.17将D-核酮糖-1P转化为D-核酮糖。一方面，本公开的微生物能够通过(但不限于)表达EC 3.1.3.-和/或EC 2.7.1.17将D-木酮糖-1P转化为D-木酮糖。一方面，本公开的微生物能够通过(但不限于)表达EC 5.1.3.31和/或EC 5.1.3.30将D-核酮糖转化为D-木酮糖。一方面，本公开的微生物能够通过(但不限于)表达EC 1.1.1.9将D-木酮糖转化为木糖醇。在一些方面，本公开的微生物能够进行任何一种或多种上述反应。在一些方面，本公开的微生物能够进行图14中描述的任何一个或多个反应。

在一些方面，上述酶包括木糖醇氢化酶(EC 1.1.1.9)，其参与将D-木酮糖氢化为木糖醇。在一些方面，上述酶包括糖磷酸酶(EC 3.1.3-或EC 3.1.3.23)或木酮糖激酶(EC2.7.1.17)，其参与将D-木酮糖-1P转化为D-木酮糖和/或D-核酮糖-1P转化为D-核酮糖。在一些方面，上述酶包括D-阿洛酮糖3-差向异构酶(EC 5.1.3.30)或D-塔格糖3-差向异构酶(EC 5.1.3.31)，其参与将D-核酮糖转化为D-木酮糖。

在一些方面，一种或多种酶对于微生物是异源的。在一些方面，该酶中的一些对于微生物是异源的，而其他酶对于微生物是天然的。

生产或积累MEG(或乙醇酸)或任选MEG(或乙醇酸)和一种或多种联产品的重组微生物的生产方法

如上所述，一方面，本申请提供生产重组微生物的方法，所述重组微生物通过一种或多种戊糖-5-磷酸中间体由一种或多种外源己糖原料生产或积累MEG(或乙醇酸)，所述方法包括：在重组微生物中引入或表达一种或多种酶，其用于将一种或多种己糖原料转化为一种或多种戊糖-5-磷酸中间体；在重组微生物中引入或表达一种或多种酶，其用于将一种或多种戊糖-5-磷酸中间体转化为一种或多种戊糖或戊糖-1-磷酸中间体；在重组微生物中引入或表达C2途径，其包含一种或多种用于从乙醇醛生产MEG或GA的酶；在重组微生物中引入或表达C3途径，其包含一种或多种用于生产衍生自DHAP或丙酮酸的MEG或GA的酶；以及在含有一种或多种己糖原料的培养介质中培养重组微生物以生产或积累MEG或GA，其中乙醇醛和DHAP(或丙酮酸)是C2途径中生产的中间体，并且其中C2和C3两种途径中均生产MEG或GA。在一些实施方案中，乙醇醛由乙醇醛脱氢酶氧化为乙醇酸。

另一方面，本申请提供了生产重组微生物的方法，所述微生物通过一种或多种戊糖-5-磷酸中间体由一种或多种外源己糖原料生产或积累MEG(或乙醇酸)和一种或多种联产品，所述方法包括：在重组微生物中引入或表达一种或多种酶，其用于将一种或多种己糖原料转化为一种或多种戊糖-5-磷酸中间体；在重组微生物中引入或表达一种或多种酶，其用于将一种或多种戊糖-5-磷酸中间体转化为一种或多种戊糖或戊糖-1-磷酸中间体；在重组微生物中引入或表达C2途径，其包含一种或多种用于从乙醇醛生产MEG或GA的酶；在重组微生物中引入或表达C3途径，其包含一种或多种用于生产一种或多种衍生自DHAP或丙酮酸的联产品的酶；在含有一种或多种己糖原料的培养介质中培养重组微生物以生产或积累MEG或GA和一种或多种联产品，其中乙醇醛和DHAP(或丙酮酸)是C2途径中生产的中间体，其中C2途径中生产MEG或GA，并且C3途径中生产一种或多种联产品。在一些实施方案中，乙醇醛由乙醇醛脱氢酶氧化为乙醇酸。

在一些实施方案中，用于将一种或多种己糖原料转化为一种或多种戊糖-5-磷酸中间体的酶选自一种或多种具有以下活性的酶：转酮醇酶活性、转醛醇酶活性、核酮糖-5-磷酸3-差向异构酶活性和核糖-5-磷酸异构酶活性。在进一步的实施方案中，该方法进一步包括向重组微生物中引入一种或多种修饰，以降低或缺失一种或多种内源性酶的活性，所述内源性酶选自甘油醛3-磷酸脱氢酶(gapA)、磷酸甘油酸激酶(pgk)和磷酸甘油酸变位酶(gpmA和/或gpmM)。

在一些实施方案中，将一种或多种己糖原料转化为一种或多种戊糖-5-磷酸中间体的酶选自一种或多种具有以下活性的酶：果糖-6-磷酸磷酸酮醇酶活性、磷酸乙酰转移酶活性、转酮醇酶活性、转醛醇酶活性、核酮糖-5-磷酸3-差向异构酶活性和核糖-5-磷酸异构酶活性。在进一步的实施方案中，该方法进一步包括将一种或多种修饰引入重组微生物中，以减少或缺失内源性6-磷酸果糖激酶(pfkA和/或pfkB)酶的活性。

在仍进一步的实施方案中，该方法进一步包括：将一种或多种修饰引入重组微生物中，以缺失或减少一种或多种内源性酶的活性，所述内源性酶选自葡萄糖6-磷酸-1-脱氢酶、6-磷酸葡萄糖酸内酯酶和6-磷酸葡萄糖酸脱氢酶。在一些实施方案中，葡萄糖6-磷酸-1-脱氢酶是zwf，6-磷酸葡萄糖酸内酯酶是pgl，6-磷酸葡萄糖酸脱氢酶是gnd。

在一些实施方案中，用于将一种或多种戊糖-5-磷酸中间体转化为一种或多种戊糖或戊糖-1-磷酸中间体的一种或多种酶选自一种或多种具有以下活性的酶：戊糖磷酸酶活性、D-核酮糖-5-磷酸酶活性、D-核糖-5-磷酸酶活性、D-核糖异构酶活性、阿糖醇磷酸脱氢酶活性和磷酸戊糖变位酶活性。

在一些实施方案中，用于由C3途径中的DHAP或丙酮酸生产MEG或GA的一种或多种酶选自具有选自以下的活性的一种或多种酶：3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、丝氨酸转氨酶活性、羟基丙酮酸脱羧酶活性、3-磷酸羟基丙酮酸还原酶活性、乙醇醛还原酶活性、乙醇醛脱氢酶活性、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶活性、丝氨酸脱羧酶活性、乙醇胺转氨酶或乙醇胺氧化还原酶(脱氨基)活性、甘油酸脱羧酶活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性和甘油酸2-激酶活性。

在一些实施方案中，用于由C3途径中的DHAP或丙酮酸生产一种或多种联产品的一种或多种酶选自一种或多种具有选自以下的活性的酶：硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A：乙酰乙酸转移酶或乙酸：乙酰乙酰辅酶A水解酶活性和乙酰乙酸脱羧酶活性，并且一种或多种联产品包括丙酮。

在一些实施方案中，用于由C3途径中的DHAP或丙酮酸生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A：乙酰乙酸转移酶或乙酸：乙酰乙酰辅酶A水解酶活性、乙酰乙酸脱羧酶活性和仲醇脱氢酶活性，并且一种或多种联产品包含异丙醇。

在一些实施方案中，用于由C3途径中的DHAP或丙酮酸生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A：乙酰乙酸转移酶或乙酸：乙酰乙酰辅酶A水解酶活性、乙酰乙酸脱羧酶活性、仲醇脱氢酶活性和脱水酶活性，并且一种或多种联产品包含丙烯。

在一些实施方案中，用于由C3途径中的DHAP或丙酮酸生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A：乙酰乙酸转移酶或乙酸：乙酰乙酰辅酶A水解酶活性、乙酰乙酸脱羧酶活性、3-羟基异戊酸(3HIV)合酶活性、羟甲基戊二酰辅酶A合酶活性、甲基戊烯二酰辅酶A水合酶活性、甲基巴豆酰辅酶A羧化酶活性、甲基巴豆酰辅酶A水合酶活性、3-羟基异戊酰辅酶A硫酯酶活性、3HIV激酶活性、3HIV-3-磷酸脱羧酶活性和3HIV脱羧酶活性，并且一种或多种联产品包含异丁烯。

在一些实施方案中，用于由C3途径中的DHAP或丙酮酸生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性和甘油酸2-激酶活性，并且一种或多种联产品包含L-丝氨酸。

在一些实施方案中，用于由C3途径中的DHAP或丙酮酸生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：丝氨酸羟甲基转移酶活性、转移酶活性、甲醛脱氢酶活性、甲酸脱氢酶活性、与甘氨酸裂解系统相关的活性、3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、丝氨酸转氨酶活性、羟基丙酮酸脱羧酶活性、丝氨酸氧化还原酶(脱氨基)活性、丝氨酸脱羧酶活性、乙醇胺转氨酶或乙醇胺氧化还原酶(脱氨基)活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性、甘油酸2-激酶活性、乙醇醛脱氢酶活性、乙醇酸脱氢酶活性、丙氨酸-乙醛酸转氨酶活性、丙氨酸转氨酶活性和NAD(P)H依赖性谷氨酸脱氢酶活性，并且一种或多种联产品包含甘氨酸。在其他实施方案中，与甘氨酸裂解系统相关的活性包含选自以下的酶或蛋白：甘氨酸脱羧酶(P蛋白)、氨甲基转移酶(T蛋白)、二氢硫辛酰胺脱氢酶(L蛋白)和H蛋白。

在一些实施方案中，用于由C3途径中的DHAP或丙酮酸生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、转氨酶活性、羟基丙酮酸脱羧酶活性、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶活性、丝氨酸脱羧酶活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性、甘油酸2-激酶活性、乙醛脱氢酶活性和乙醇胺解氨酶活性，并且一种或多种联产品包含单乙醇胺(MEA)。

在一些实施方案中，用于由C3途径中的DHAP或丙酮酸生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：丝氨酸脱氢酶活性、2-氨基丙二酸半醛脱羧酶活性、氨基乙醛转氨酶活性、2-氨基丙二酸半醛转氨酶活性、2,3-二氨基丙酸脱羧酶活性、丝氨酸脱羧酶活性、乙醇胺脱氢酶活性、丝氨酸羟甲基转移酶活性、醛氧化酶活性、N-乙酰转移酶或O-乙酰转移酶活性、N-乙酰丝氨酸脱氢酶活性、转氨酶活性、脱乙酰酶活性、丝氨酸氨基酶活性和2,3-二氨基丙酸解氨酶活性，并且一种或多种联产品包含乙二胺(EDA)。

在一些实施方案中，用于在C2途径中生产MEG或GA的一种或多种酶选自具有选自以下的活性的一种或多种酶：D-塔格糖3-差向异构酶活性、D-核酮糖激酶活性、D-核酮糖-1-磷酸醛缩酶活性、D-木酮糖1-激酶活性、D-木酮糖-1-磷酸醛缩酶活性、木糖还原酶或醛糖还原酶活性、木糖醇脱氢酶活性、木糖异构酶活性、木糖脱氢酶活性、木糖酸内酯酶活性、木糖酸脱氢酶活性、2-酮-3-脱氧-D-戊酸醛缩酶活性、乙醇醛还原酶活性和乙醇醛脱氢酶活性。

在一些实施方案中，任何生产上述重组微生物的方法进一步包含：将一种或多种修饰引入重组微生物中，以减少或缺失乙醇醛脱氢酶、乳酸脱氢酶、木糖异构酶、木酮糖激酶或其组合的活性。

己糖至戊糖-5-磷酸的中间体

[mA]在一个实施方案中，本申请涉及能够由一种或多种己糖原料生产一种或多种戊糖-5-磷酸中间体的重组微生物的生产方法，包括向该重组微生物中引入和/或在该重组微生物中过表达以下(a)至(d)的一种或多种：

(a)至少一种内源性或外源性核酸分子，其编码具有转酮醇酶活性的酶，该酶催化果糖-6-磷酸和甘油醛-3-磷酸分别可逆转化为赤藓糖-4-磷酸和D-木酮糖-5-磷酸，和/或催化来自(b)的甘油醛-3-磷酸和来自(b)的景天庚酮糖-7-磷酸分别可逆转化D-核糖-5-磷酸和D-木酮糖-5-磷酸；

其中所述方法任选地进一步包括向编码甘油醛3-磷酸脱氢酶的基因中引入缺失、插入或功能缺失突变；

[mB]在另一个实施方案中，本申请涉及能够由一种或多种己糖原料生产一种或多种戊糖-5-磷酸中间体的重组微生物的生产方法，包括向该重组微生物中引入和/或在该重组微生物中过表达以下(a)至(f)的一种或多种：

其中所述方法任选地进一步包括向编码6-磷酸果糖激酶的基因中引入缺失、插入或功能缺失突变；

[mC]因此，在一个实施方案中，实施方案[mA]或实施方案[mB]的方法任选地进一步包含向重组微生物中引入一种或多种选自以下的修饰：

连接磷酸戊糖途径和MEG(或乙醇酸)生产途径

在另一方面，在实施方案[mA]或实施方案[mB](和任选地包括实施方案[mC])的方法中产生的戊糖-5-磷酸中间体可以通过戊糖磷酸酶与任何一种已知的C2MEG或乙醇酸生产途径连接。

[mD]因此，在一个实施方案中，本申请涉及能够由D-木酮糖-5-磷酸生产D-木酮糖的重组微生物的生产方法，其中所述方法包括向重组微生物中引入或在重组微生物中表达一种或多种戊糖-5-磷酸酶，其中D-木酮糖-5-磷酸通过磷酸戊糖途径的非氧化分支产生，且其中D-木酮糖可以用于生产MEG(或乙醇酸)和任选一种或多种联产品。

[mE]在一个实施方案中，本申请涉及能够由D-核酮糖-5-磷酸或由D-核糖-5-磷酸生产D-核酮糖的重组微生物的生产方法，其中所述方法进一步包括向重组微生物中引入或在重组微生物中表达以下(a)至(c)的一种或多种：

在另一方面，在实施方案[mA]或实施方案[mB](和任选地包括实施方案[mC])的方法中产生的戊糖-5-磷酸中间体可以通过阿糖醇磷酸脱氢酶与任何一种已知的C2 MEG或乙醇酸生产途径连接。

[mF]在一个实施方案中，本申请涉及能够由D-木酮糖-5-磷酸生产D-核酮糖-1-磷酸或由D-核酮糖-5-磷酸生产D-木酮糖-1-磷酸的重组微生物的生产方法，其中所述方法包括向重组微生物中引入或在重组微生物中表达一种或多种阿糖醇磷酸脱氢酶，且其中所述一种或多种阿糖醇磷酸脱氢酶催化以下(a)至(d)中的一种或多种：

(a)D-木酮糖-5-磷酸可逆转化为D-阿糖醇-1-磷酸；

(b)来自(a)的D-阿糖醇-1-磷酸可逆转化为D-核酮糖-1-磷酸；

(c)D-核酮糖-5-磷酸可逆转化为D-阿糖醇-5-磷酸；

(d)来自(c)的D-阿糖醇-5-磷酸可逆转化为D-木酮糖-1-磷酸，

在另一方面，在实施方案[mA]或实施方案[mB](和任选地包括实施方案[mC])的方法中产生的戊糖-5-磷酸中间体可以通过磷酸戊糖变位酶与任何一种已知的C2 MEG或乙醇酸生产途径连接。

[mG]在一个实施方案中，本申请涉及能够由D-木酮糖-5-磷酸生产D-木酮糖-1-磷酸或由D-核酮糖-5-磷酸生产D-核酮糖-1-磷酸的重组微生物的生产方法，其中所述方法包括向重组微生物中引入或在重组微生物中表达一种或多种磷酸戊糖变位酶，其中D-木酮糖-5-磷酸和/或D-核酮糖-5-磷酸通过磷酸戊糖途径的非氧化分支产生，且其中D-核酮糖-1-磷酸和/或D-木酮糖-1-磷酸可以用于生产MEG(或乙醇酸)和任选的一种或多种联产品。

MEG(或乙醇酸)或任选MEG(或乙醇酸)和一种或多种联产品的生产途径

在一些实施方案中，实施方案[mD]、[mE]、[mF]和[mG]中生产的戊糖或戊糖-1-磷酸中间体用于已知的MEG(或乙醇酸)C2生产途径中，该途径偶联至C3途径，如下所述，以联产额外的MEG(或乙醇酸)或一种或多种联产品。

[mH]在一个实施方案中，本申请涉及能够由一种或多种己糖原料生产单乙二醇(MEG)(或乙醇酸)的重组微生物的生产方法，其中实施方案[mA]或实施方案[mB](和任选地包括实施方案[mC])并且另外包括实施方案[mD]、[mF]和[mG]中的一个或多个的方法进一步包括向重组微生物中引入或在重组微生物中表达以下(a)至(d)中的一种或多种：

(a)至少一种内源性或外源性核酸分子，其编码具有D-木酮糖1-激酶活性的酶，该酶催化来自实施方案[mD]的D-木酮糖转化为D-木酮糖-1-磷酸；

(b)至少一种内源性或外源性核酸分子，其编码具有D-木酮糖-1-磷酸醛缩酶活性的酶，该酶催化来自(a)、来自实施方案[mF]和/或来自实施方案[mG]的D-木酮糖-1-磷酸转化为乙醇醛和磷酸二羟丙酮(DHAP)；

其中生产MEG(或乙醇酸)和DHAP。

[mI]在一个实施方案中，本申请涉及能够由一种或多种己糖原料生产单乙二醇(MEG)(或乙醇酸)的重组微生物的生产方法，其中实施方案[mA]或实施方案[mB](和任选地包括实施方案[mC])并且另外包括实施方案[mD]、[mE]、[mF]和[mG]中的一个或多个的方法进一步包括向重组微生物中引入或在重组微生物中表达以下(a)至(e)中的一种或多种：

(a)至少一种内源性或外源性核酸分子，其编码具有D-塔格糖3-差向异构酶活性的酶，该酶催化来自实施方案[mD]的D-木酮糖转化为D-核酮糖；

(b)至少一种内源性或外源性核酸分子，其编码具有D-核酮糖激酶活性的酶，该酶催化来自(a)和/或来自实施方案[mE]的D-核酮糖转化为D-核酮糖-1-磷酸；

(c)至少一种内源性或外源性核酸分子，其编码具有D-核酮糖-1-磷酸醛缩酶活性的酶，该酶催化来自(b)、来自实施方案[mF]和/或来自实施方案[mG]的D-核酮糖-1-磷酸转化为乙醇醛和磷酸二羟丙酮(DHAP)；

其中生产MEG(或乙醇酸)和DHAP。

[mJ]在一个实施方案中，本申请涉及能够由一种或多种己糖原料生产单乙二醇(MEG)(或乙醇酸)的重组微生物的生产方法，其中实施方案[mA]或实施方案[mB](和任选地包括实施方案[mC])并且另外包括实施方案[mD]的方法进一步包括向重组微生物中引入或在重组微生物中表达以下(a)至(d)中的一种或多种：

(a)至少一种内源性或外源性核酸分子，其编码具有木糖异构酶活性的酶，该酶催化来自实施方案[mD]的D-木酮糖转化为D-木糖；

其中所述方法进一步包括向重组微生物中引入或在重组微生物中表达以下(e)至(h)中的一种或多种：

其中生产MEG(或乙醇酸)和丙酮酸。

在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mH]，用于生产MEG(或乙醇酸)的C3途径包括实施方案[mK]。在其他实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mH]，用于生产MEG(或乙醇酸)的C3途径包括实施方案[mL]。在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mI]，用于生产MEG(或乙醇酸)的C3途径包括实施方案[mK]。在进一步的实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mI]，用于生产MEG(或乙醇酸)的C3途径包括实施方案[mL]。在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mJ]，用于生产MEG(或乙醇酸)的C3途径包括实施方案[mK]。在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mJ]，用于生产MEG(或乙醇酸)的C3途径包括实施方案[mL]。

[mK]在一个实施方案中，本申请涉及能够由一种或多种己糖原料生产单乙二醇(MEG)(或乙醇酸)的重组微生物的生产方法，其中实施方案[mA]或实施方案[mB](和任选地包括实施方案[mC])并且另外包括实施方案[mD]、[mE]、[mF]和[mG]中的一种或多种、进一步包括实施方案[mH]、[mI]和[mJ]中的一种或多种的方法进一步包括向重组微生物中引入和/或在重组微生物中表达以下(a)至(h)中的一种或多种：

其中来自实施方案[mH]和/或[mI]的产生的中间体DHAP和/或来自实施方案[mJ]的丙酮酸分别通过微生物中的内源性糖酵解或糖异生转化为3-磷酸甘油酸，并且其中生产MEG(或乙醇酸)。

[mL]在一个实施方案中，本申请涉及能够由一种或多种己糖原料生产单乙二醇(MEG)(或乙醇酸)的重组微生物的生产方法，其中实施方案[mA]或实施方案[mB](和任选地包括实施方案[mC])并且另外包括实施方案[mD]、[mE]、[mF]和[mG]中的一种或多种、进一步包括实施方案[mH]、[mI]和[mJ]中的一种或多种的方法进一步包括向重组微生物中引入和/或在重组微生物中表达以下(a)至(j)中的一种或多种：

其中来自实施方案[mH]和/或[mI]的产生的中间体DHAP和/或来自实施方案[mJ]的丙酮酸分别通过微生物中的内源性糖酵解或糖异生转化为3-磷酸甘油酸和/或2-磷酸甘油酸，并且其中生产MEG(或乙醇酸)。

在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mH]，用于生产丙酮的C3途径包括实施方案[mM]。在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mI]，用于生产丙酮的C3途径包括实施方案[mM]。在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mJ]，用于生产丙酮的C3途径包括实施方案[mM]。

[mM]在一个实施方案中，本申请涉及能够由一种或多种己糖原料联产单乙二醇(MEG)(或乙醇酸)和丙酮的重组微生物的生产方法，其中实施方案[mA]或实施方案[mB](和任选地包括实施方案[mC])并且另外包括实施方案[mD]、[mE]、[mF]和[mG]中的一种或多种、进一步包括实施方案[mH]、[mI]和[mJ]中的一种或多种的方法进一步包括向重组微生物中引入和/或在重组微生物中表达以下(a)至(c)中的一种或多种：

其中来自实施方案[mH]和/或[mI]的产生的中间体DHAP和/或来自实施方案[mJ]的丙酮酸通过微生物中的内源性糖酵解转化为乙酰辅酶A，并且其中联产MEG(或乙醇酸)和丙酮。

在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mH]，用于生产异丁烯的C3途径包括实施方案[mN]。在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mI]，用于生产异丁烯的C3途径包括实施方案[mN]。在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mJ]，用于生产异丁烯的C3途径包括实施方案[mN]。

[mN]在一些实施方案中，本申请涉及能够由一种或多种己糖原料通过丙酮或HMG-CoA联产单乙二醇(MEG)(或乙醇酸)和异丁烯的重组微生物的生产方法，其中实施方案[mA]或实施方案[mB](和任选地包括实施方案[mC])并且另外包括实施方案[mD]、[mE]、[mF]和[mG]中的一种或多种、进一步包括实施方案[mH]、[mI]和[mJ]中的一种或多种的方法进一步包括向重组微生物中引入和/或在重组微生物中表达以下(a)至(d)中的一种或多种：

或

其中所述方法包括向重组微生物中引入或在重组微生物中表达以下(e)至(j)中的一种或多种：

其中所述方法进一步向重组微生物中引入或在重组微生物中表达(a1)和(a2)和/或(b1)，选自：

其中来自实施方案[mH]和/或[mI]的产生的中间体DHAP和/或来自实施方案[mJ]的丙酮酸通过微生物中的内源性糖酵解转化为乙酰辅酶A，并且其中联产MEG(或乙醇酸)和异丁烯。

[mO]在一个实施方案中，实施方案[mM]和/或[mN](任选地包括实施方案[EE])的方法任选地进一步包括向重组微生物中引入和/或在重组微生物中表达至少一种内源性或外源性核酸分子，其编码具有仲醇脱氢酶活性的酶，该酶催化丙酮转化为异丙醇。

[mP]在另一个实施方案中，实施方案[mO](任选地包括实施方案[EE])的方法任选地进一步包括向重组微生物中引入和/或在重组微生物中表达至少一种内源性或外源性核酸分子，其编码具有脱水酶活性的酶，该酶催化异丙醇转化为丙烯。

在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mH]，用于生产丝氨酸的C3途径包括实施方案[mQ]。在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mI]，用于生产丝氨酸的C3途径包括实施方案[mQ]。在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mJ]，用于生产丝氨酸的C3途径包括实施方案[mQ]。

[mQ]在一个实施方案中，本申请涉及能够由一种或多种己糖原料和一种氮源联产单乙二醇(MEG)(或乙醇酸)和丝氨酸的重组微生物的生产方法，其中实施方案[mA]或实施方案[mB](和任选地包括实施方案[mC])并且另外包括实施方案[mD]、[mE]、[mF]和[mG]中的一种或多种、进一步包括实施方案[mH]、[mI]和[mJ]中的一种或多种的方法进一步包括向重组微生物中引入和/或在重组微生物中表达以下(a)至(h)中的一种或多种：

其中来自实施方案[mH]和/或[mI]的产生的中间体DHAP和/或来自实施方案[mJ]的丙酮酸分别通过微生物中的内源性糖酵解或糖异生转化为3-磷酸甘油酸和/或2-磷酸甘油酸，并且其中生产MEG(或乙醇酸)和丝氨酸。

在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mH]，用于生产甘氨酸的C3途径包括实施方案[mR]。在其他实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mH]，用于生产甘氨酸的C3途径包括实施方案[mS]。在进一步的实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mH]，用于生产甘氨酸的C3途径包括实施方案[mT]。在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mI]，用于生产甘氨酸的C3途径包括实施方案[mR]。在其他实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mI]，用于生产甘氨酸的C3途径包括实施方案[mS]。在进一步的实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mI]，用于生产甘氨酸的C3途径包括实施方案[mT]。在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mJ]，用于生产甘氨酸的C3途径包括实施方案[mR]。在其他实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mJ]，用于生产甘氨酸的C3途径包括实施方案[mS]。在进一步的实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mJ]，用于生产甘氨酸的C3途径包括实施方案[mT]。

[mR]在一个实施方案中，本申请涉及能够由一种或多种己糖原料和一种氮源生产单乙二醇(MEG)(或乙醇酸)和甘氨酸的重组微生物的生产方法，其中实施方案[mA]或实施方案[mB](和任选地包括实施方案[mC])并且另外包括实施方案[mD]、[mE]、[mF]和[mG]中的一种或多种、进一步包括实施方案[mH]、[mI]和[mJ]中的一种或多种的方法进一步包括向重组微生物中引入或在重组微生物中表达以下(a)至(e)中的一种或多种：

[mS]在一个实施方案中，本申请涉及能够由一种或多种己糖原料和一种氮源联产单乙二醇(MEG)(或乙醇酸)和甘氨酸的重组微生物的生产方法，其中实施方案[mA]或实施方案[mB](和任选地包括实施方案[mC])并且另外包括实施方案[mD]、[mE]、[mF]和[mG]中的一种或多种、进一步包括实施方案[mH]、[mI]和[mJ]中的一种或多种的方法进一步包括向重组微生物中引入或在重组微生物中表达以下(a)至(k)中的一种或多种：

其中来自实施方案[mH]和/或[mI]的产生的中间体DHAP和/或来自实施方案[mJ]的丙酮酸通过微生物中的内源性糖酵解或糖异生转化为3-磷酸甘油酸和/或2-磷酸甘油酸，其中用于步骤(i)的乙醛酸任选地来自该微生物中的乙醛酸旁路，其中丙氨酸和谷氨酸由步骤(j)和(k)重构，并且其中联产MEG(或乙醇酸)和甘氨酸。

[mT]在一个实施方案中，本申请涉及能够由一种或多种己糖原料和一种氮源联产单乙二醇(MEG)(或乙醇酸)和甘氨酸的重组微生物的生产方法，其中实施方案[A]或实施方案[B](和任选地包括实施方案[C])并且另外包括实施方案[D]、[E]、[F]和[G]中的一个或多个、进一步包括实施方案[H]、[I]和[J]中的一个或多个的方法进一步包括向重组微生物中引入或在重组微生物中表达以下(a)至(l)中的一种或多种：

其中来自实施方案[mH]和/或[mI]的产生的中间体DHAP和/或来自实施方案[mJ]的丙酮酸通过微生物中的内源性糖酵解或糖异生转化为3-磷酸甘油酸和/或2-磷酸甘油酸，其中用于步骤(j)的乙醛酸任选地来自该微生物中的乙醛酸旁路，其中丙氨酸和谷氨酸由步骤(k)和(l)重构，并且其中联产MEG(或乙醇酸)和甘氨酸。

在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mH]，用于生产MEA的C3途径包括实施方案[mU]。在其他实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mH]，用于生产MEA的C3途径包括实施方案[mV]。在进一步的实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mH]，用于生产MEA的C3途径包括实施方案[mW]。在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mI]，用于生产MEA的C3途径包括实施方案[mU]。在其他实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mI]，用于生产MEA的C3途径包括实施方案[mV]。在进一步的实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mI]，用于生产MEA的C3途径包括实施方案[mW]。在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mJ]，用于生产MEA的C3途径包括实施方案[mU]。在其他实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mJ]，用于生产MEA的C3途径包括实施方案[mV]。在其他实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mJ]，用于生产MEA的C3途径包括实施方案[mW]。

[mU]在一个实施方案中，本申请涉及能够由一种或多种己糖原料和一种氮源联产单乙二醇(MEG)(或乙醇酸)和单乙醇胺(MEA)的重组微生物的生产方法，其中实施方案[mA]或实施方案[mB](和任选地包括实施方案[mC])并且另外包括实施方案[mD]、[mE]、[mF]和[mG]中的一种或多种、进一步包括实施方案[mH]、[mI]和[mJ]中的一种或多种的方法进一步包括向重组微生物中引入或在重组微生物中表达以下(a)至(i)中的一种或多种：

其中来自实施方案[mH]和/或[mI]的产生的中间体DHAP和/或来自实施方案[mJ]的丙酮酸分别通过微生物中的内源性糖酵解或糖异生转化为3-磷酸甘油酸和/或2-磷酸甘油酸，并且其中联产MEG(或乙醇酸)和MEA。

[mV]在一个实施方案中，本申请涉及能够由一种或多种己糖原料和一种氮源联产单乙二醇(MEG)(或乙醇酸)和单乙醇胺(MEA)的重组微生物的生产方法，其中实施方案[mA]或实施方案[mB](和任选地包括实施方案[mC])并且另外包括实施方案[mD]、[mE]、[mF]和[mG]中的一种或多种、进一步包括实施方案[mH]、[mI]和[mJ]中的一种或多种的方法进一步包括向重组微生物中引入或在重组微生物中表达以下(a)至(f)中的一种或多种：

[mW]在一个实施方案中，本申请涉及能够由一种或多种己糖原料和一种氮源联产单乙二醇(MEG)(或乙醇酸)和单乙醇胺(MEA)的重组微生物的生产方法，其中实施方案[mA]或实施方案[mB](和任选地包括实施方案[mC])并且另外包括实施方案[mD]、[mE]、[mF]和[mG]中的一种或多种、进一步包括实施方案[mH]、[mI]和[mJ]中的一种或多种的方法进一步包括向重组微生物中引入或在重组微生物中表达以下(a)至(b)中的一种或多种：

其中来自实施方案[mH]和/或[mI]的产生的中间体DHAP和/或来自实施方案[mJ]的丙酮酸通过微生物中的内源性糖酵解转化为乙酰辅酶A，并且其中联产MEG(或乙醇酸)和MEA。

在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mH]，用于生产EDA的C3途径包括实施方案[mX]。在其他实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mH]，用于生产EDA的C3途径包括实施方案[mY]。在进一步的实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mH]，用于生产EDA的C3途径包括实施方案[mZ]。在仍进一步的实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mH]，用于生产EDA的C3途径包括实施方案[mAA]。在其他实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mH]，用于生产EDA的C3途径包括实施方案[mBB]。

在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mI]，用于生产EDA的C3途径包括实施方案[mX]。在其他实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mI]，用于生产EDA的C3途径包括实施方案[mY]。在进一步的实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mI]，用于生产EDA的C3途径包括实施方案[mZ]。在仍进一步的实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mI]，用于生产EDA的C3途径包括实施方案[mAA]。在其他实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mI]，用于生产EDA的C3途径包括实施方案[mBB]。

在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mJ]，用于生产EDA的C3途径包括实施方案[mX]。在其他实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mJ]，用于生产EDA的C3途径包括实施方案[mY]。在其他实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mJ]，用于生产EDA的C3途径包括实施方案[mZ]。在其他实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mJ]，用于生产EDA的C3途径包括实施方案[mAA]。在其他实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mJ]，用于生产EDA的C3途径包括实施方案[mBB]。

[mX]在一个实施方案中，本申请涉及能够由一种或多种己糖原料和一种氮源联产单乙二醇(MEG)(或乙醇酸)和乙二胺(EDA)的重组微生物的生产方法，其中实施方案[mA]或实施方案[mB](和任选地包括实施方案[mC])并且另外包括实施方案[mD]、[mE]、[mF]和[mG]中的一种或多种、进一步包括实施方案[mH]、[mI]和[mJ]中的一种或多种的方法进一步包括向重组微生物中引入或在重组微生物中表达以下(a)至(c)中的一种或多种：

[mY]在一个实施方案中，本申请涉及能够由一种或多种己糖原料和一种氮源联产单乙二醇(MEG)(或乙醇酸)和乙二胺(EDA)的重组微生物的生产方法，其中实施方案[mA]或实施方案[mB](和任选地包括实施方案[mC])并且另外包括实施方案[mD]、[mE]、[mF]和[mG]中的一种或多种、进一步包括实施方案[mH]、[mI]和[mJ]中的一种或多种的方法进一步包括向重组微生物中引入或在重组微生物中表达以下(a)至(c)中的一种或多种：

其中联产MEG(或乙醇酸)和EDA。

[mZ]在一个实施方案中，本申请涉及能够由一种或多种己糖原料和一种氮源联产单乙二醇(MEG)(或乙醇酸)和乙二胺(EDA)的重组微生物的生产方法，其中实施方案[mA]或实施方案[mB](和任选地包括实施方案[mC])并且另外包括实施方案[mD]、[mE]、[mF]和[mG]中的一种或多种、进一步包括实施方案[mH]、[mI]和[mJ]中的一种或多种的方法进一步包括向重组微生物中引入或在重组微生物中表达以下(a)至(c)中的一种或多种：

其中联产MEG(或乙醇酸)和EDA。

[mAA]在一个实施方案中，本申请涉及能够由一种或多种己糖原料和一种氮源联产单乙二醇(MEG)(或乙醇酸)和乙二胺(EDA)的重组微生物的生产方法，其中实施方案[mA]或实施方案[mB](和任选地包括实施方案[mC])并且另外包括实施方案[mD]、[mE]、[mF]和[mG]中的一种或多种、进一步包括实施方案[mH]、[mI]和[mJ]中的一种或多种的方法进一步包括向重组微生物中引入或在重组微生物中表达以下(a)至(c)中的一种或多种：

(b)至少一种内源性或外源性核酸分子，其编码具有醛氧化酶活性的酶，该酶催化来自(a)的甘氨酸转化为氨基乙醛；\

其中联产MEG(或乙醇酸)和EDA。

[mBB]在一个实施方案中，本申请涉及能够由一种或多种己糖原料和一种氮源联产单乙二醇(MEG)(或乙醇酸)和乙二胺(EDA)的重组微生物的生产方法，其中实施方案[mA]或实施方案[mB](和任选地包括实施方案[mC])并且另外包括实施方案[mD]、[mE]、[mF]和[mG]中的一种或多种、进一步包括实施方案[mH]、[mI]和[mJ]中的一种或多种的方法进一步包括向重组微生物中引入或在重组微生物中表达以下(a)至(e)中的一种或多种：

其中联产MEG(或乙醇酸)和EDA。

在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mH]，用于生产EDA的C3途径包括实施方案[mCC]。在其他实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mH]，用于生产EDA的C3途径包括实施方案[mDD]。在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mI]，用于生产EDA的C3途径包括实施方案[mCC]。在其他实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mI]，用于生产EDA的C3途径包括实施方案[mDD]。在一些实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mJ]，用于生产EDA的C3途径包括实施方案[mCC]。在其他实施方案中，用于生产MEG(或乙醇酸)的C2途径包括实施方案[mJ]，用于生产EDA的C3途径包括实施方案[mDD]。

[mCC]在一个实施方案中，本申请涉及能够由一种或多种己糖原料和一种氮源联产单乙二醇(MEG)(或乙醇酸)和乙二胺(EDA)的重组微生物的生产方法，其中实施方案[mA]或实施方案[mB](和任选地包括实施方案[mC])并且另外包括实施方案[mD]、[mE]、[mF]和[mG]中的一种或多种、进一步包括实施方案[mH]、[mI]和[mJ]中的一种或多种的方法进一步包括向重组微生物中引入或在重组微生物中表达以下(a)至(b)中的一种或多种：

其中联产MEG(或乙醇酸)和EDA。

[mDD]在一个实施方案中，本申请涉及能够由一种或多种己糖原料和一种氮源联产单乙二醇(MEG)(或乙醇酸)和乙二胺(EDA)的重组微生物的生产方法，其中实施方案[mA]或实施方案[mB](和任选地包括实施方案[mC])并且另外包括实施方案[mD]、[mE]、[mF]和[mG]中的一种或多种、进一步包括实施方案[mH]、[mI]和[mJ]中的一种或多种的方法进一步包括向重组微生物中引入或在重组微生物中表达以下(a)至(b)中的一种或多种：

[mEE]在另一个实施方案中，选自实施方案[mH]、实施方案[mI]和实施方案[mJ]的方法任选地进一步包含向重组微生物中引入一个或多个选自以下的修饰：

酶的工程化

可以工程化重组微生物中的酶，以改进底物到产物转化的一个或多个方面。可以进一步工程化以用于本公开的方法的酶的非限制性实例包括：转酮醇酶、转醛醇酶、戊糖-5-磷酸酶、阿糖醇磷酸脱氢酶、磷酸戊糖变位酶、醛还原酶、乙酰乙酰辅酶A水解酶、木糖异构酶、3-磷酸甘油酸脱氢酶、磷酸丝氨酸转氨酶、3-磷酸羟基丙酮酸磷酸酶、磷酸丝氨酸磷酸酶、丝氨酸转氨酶、羟基丙酮酸脱羧酶、3-磷酸羟基丙酮酸还原酶、乙醇醛脱氢酶、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶、丝氨酸脱羧酶、乙醇胺转氨酶或乙醇胺氧化还原酶(脱氨基)、甘油酸脱羧酶、羟基丙酮酸还原酶、3-磷酸甘油酸磷酸酶、2-磷酸甘油酸磷酸酶、甘油酸3-激酶、甘油酸2-激酶、甲羟戊酸二磷酸脱羧酶，及其组合。可以工程化这些酶以提高催化活性、提高选择性、提高稳定性、提高对各种发酵条件(温度、pH等)的耐受性、或提高对各种代谢底物、产物、副产物、中间体等的耐受性。如本文所用的关于特定酶活性的术语“改进的催化活性”是指比相对于可比较的非工程化酶测量的酶活性水平更高的酶活性。

定向进化是一个术语，用于描述允许在实验室中模拟自然进化过程的整个范围的分子生物学技术。对于酶，这通常涉及一个或多个起始基因的随机诱变，然后是筛选或选择步骤以分离或富集在一种或多种所需特性方面具有改进的酶变体。可以重复该过程，直到达到所需的变化水平，或者直到不会引发进一步的变化。二十多年来开发了各种工具和技术，将这一过程从自然界花费的数百万年缩短至实验室中的仅数周或数月。最常见的策略模仿自然界中发生的进化机制，如在DNA产物群体中引入随机点突变的易错PCR(error-prone PCR，epPCR)，以及允许通常在>70％同源性的亲本基因之间进行随机重组的DNA改组(DNA shuffling)技术。后来的技术通过针对预先选择的位点或随机分布的位点的饱和或盒式诱变，来接触更广泛的氨基酸，并使得非同源基因能够随机重组。进一步的技术可以创建密码子的随机插入和删除、改组结构域或外显子或环区域，并产生随机截短的库。

例如，已将工程化方法用于改变醛缩酶的稳定性、底物特异性和立体特异性，以生产用于生物催化过程的优异的酶。使用来自大肠杆菌和爱德华氏菌(Edwardsiellaictaluri)的fda基因的家族DNA改组，提高了果糖-1,6-二磷酸醛缩酶(FBP-醛缩酶)的热稳定性和溶剂耐受性。鉴定出了第四代变体，其显示出平均比任一亲本高280倍的在53℃的半衰期。相同的变体还在各种极性和非极性有机溶剂中显示出增强的活性(Hao和Berry 2004Protein Eng Des Sel 17：689-697)。

作为另一个例子，乙酰乙酰辅酶A水解酶可以将乙酰乙酰辅酶A转化为乙酰乙酸。然而，水解酶是非特异性的，因为其也与乙酰辅酶A发生相同数量级的反应，乙酰辅酶A是硫解酶形成乙酰乙酰辅酶A所需的底物。因此，为了创造更有效的乙酰乙酰辅酶A水解酶，通过替换酶β亚基中的数个对催化重要的谷氨酸残基(WO 2015/042588)，已将这些酶工程化以具有对乙酰乙酰辅酶A底物比对乙酰辅酶A底物高至少10倍的活性。

作为另一个例子，大肠杆菌YqhD酶是底物广泛的醛还原酶，对多于10种醛底物具有NADPH依赖性还原酶活性，并且是生产生物可再生燃料和化学品的有用的酶(Jarboe2010 Applied Microbiology and Biotechnology 89：249)。虽然YqhD酶活性通过清除有毒的醛而有益，但该酶也是NADPH依赖性的，并促进NADPH的消耗和生物体的生长抑制。对YqhD进行了易错PCR，以提高由3-羟基丙醛(3-HPA)生产1,3-丙二醇的产量。该定向工程化产生了两个突变体D99QN147H和Q202A，对于某些醛(特别是3-HPA)的Km降低、kcat增加(Li等人2008Prog.Nat.Sci.18(12)：1519-1524)。D99QN147H突变体的这种改进的催化活性与关于YqhD的结构已知的内容相一致(Sulzenbacher等人2004J.Mol.Biol.342(2)：489-502)，因为Asp99和Asn147残基均与NADPH相互作用。使用D99QN147H突变体使由3-HPA生产1,3-丙二醇的产量增加了2倍。WO 2011012697 A2中还描述了对NADPH具有增加的催化效率(增加的Kcat/Km)的突变YqhD酶，该专利全文并入本文。

作为另一个例子，木糖异构酶是金属依赖性酶，其催化醛糖和酮糖的相互转化，主要是在木糖至木酮糖和葡萄糖至果糖之间。该酶对来苏糖、阿拉伯糖和甘露糖的亲和力较低。糖的羟基基团可以定义糖异构酶的底物偏好。嗜热栖热菌(Thermus thermophilus)木糖异构酶残基256处的天冬氨酸被替换为精氨酸(Patel等人2012 Protein Engineering,Design&Selection vol.25 no.7pp.331–336)。该突变木糖异构酶表现出对D-来苏糖、L-阿拉伯糖和D-甘露糖的特异性增加。与野生型酶相比，D256R木糖异构酶突变体对这3种底物的催化效率也更高。假说是突变酶中残基256处的精氨酸可能在催化反应中起作用或影响底物取向的变化。

作为另一个例子，木糖醇脱氢酶与木糖还原酶一起在木糖的利用中起作用。木糖还原酶(XR)将木糖还原为木糖醇，然后木糖醇脱氢酶(XDH)将木糖醇再氧化为木酮糖。然而，由于XR偏好NADPH作为共底物，而XDH只使用NAD+作为共底物，因此遇到了共底物回收问题。一种解决方案是工程化XDH，使其共底物特异性从NAD+改变为NADP+(Ehrensberger等人2006 Structure 14：567-575)。氧化葡萄糖酸杆菌(Gluconobacter oxydans)全酶的晶体结构表明，Asp38主要负责XDH的NAD+特异性。Asp38与腺苷核糖的羟基相互作用，而Met39堆积在嘌呤环下方，也位于2'羟基附近。构建了双突变体(D38S/M39R)XDH，其只使用NADP+而不会损失酶活性。

作为另一个例子，甲羟戊酸二磷酸脱羧酶(MVD)是ATP依赖性酶，其在甲羟戊酸(MVA)途径中催化(R)-甲羟戊酸-5-二磷酸磷酸化/脱羧为异戊烯焦磷酸(IPP)。MVD催化经典MVA途径中的最后一步，在依赖于ATP的不可逆反应中，MVD由该步由(R)-甲羟戊酸-5-二磷酸(MVAPP)产生IPP。MVAPP首先被磷酸化，随后发生脱羧反应，同时释放无机磷酸。经典MVD也以相同的机制催化非磷酸化3-羟基异戊酸(3-HIV)转化为异丁烯。例如在WO2012052427和WO 2015004211中公开了在将3-膦酰氧基异戊酸转化为异丁烯中具有改进活性的甲羟戊酸二磷酸(MDP)脱羧酶变体，这些专利各自以其全文并入本文。

代谢工程——过度表达酶或下调/缺失酶以增加途径的流

在本文所述的各种实施方案中，可以过表达参与本文所述生物合成途径的重组微生物中的外源性和内源性酶。

术语“过表达(overexpressed)”或“过表达(overexpression)”是指与表达基础水平的mRNA或具有基础水平的蛋白质的类似的相应未修饰细胞相比，编码蛋白质的mRNA水平升高(例如，异常水平)和/或细胞中蛋白质水平升高。在具体的实施方案中，在工程化以表现出增加的基因mRNA、蛋白质和/或活性的微生物中，mRNA或蛋白质可以过表达至少2倍、3倍、4倍、5倍、6倍、8倍、10倍、12倍、15倍或更多倍。

在一些实施方案中，本公开的重组微生物生成自包含合成底物的酶能力的宿主，所述底物如D-木酮糖、D-核酮糖、D-核酮糖-1-磷酸、D-木酮糖-1-磷酸、D-核酮糖-5-磷酸、D-木酮糖-5-磷酸、D-木糖酸内酯、D-木糖酸、2-酮-3-脱氧-木糖酸、乙醇醛、DHAP、丙酮酸、乙酰乙酰辅酶A、乙酰乙酸或3-羟基异戊酸。在一些实施方案中，增加以下物质的合成或积累可用于增加MEG(或GA)或任选MEG(或GA)和一种或多种联产品的产量：例如D-木酮糖、D-核酮糖、D-核酮糖-1-磷酸、D-木酮糖-1-磷酸、D-核酮糖-5-磷酸、D-木酮糖-5-磷酸、D-核糖-5-磷酸、D-木糖酸内酯、D-木糖酸、2-酮-3-脱氧-木糖酸、乙醇醛、DHAP、丙酮酸、乙酰乙酰辅酶A、乙酰乙酸或3-羟基异戊酸。

在一些实施方案中，增加涉及MEG(或GA)或任选MEG(或GA)和一种或多种联产品的生物合成途径的内源性或外源性酶的表达，可用于增加来自以下物质的流：例如D-木酮糖、D-核酮糖、D-核酮糖-1-磷酸、D-木酮糖-1-磷酸、D-核酮糖-5-磷酸、D-木酮糖-5-磷酸、D-核糖-5-磷酸、D-木糖酸内酯、D-木糖酸、2-酮-3-脱氧-木糖酸、乙醇醛、DHAP、丙酮酸、乙酰乙酰辅酶A、乙酰乙酸或3-羟基异戊酸，从而导致MEG(或GA)或任选MEG(或GA)和一种或多种联产品的合成或积累增加。

可以通过例如过表达编码一种或多种上述MEG(或GA)或任选MEG(或GA)和一种或多种联产品的生物合成途径的酶的核酸，来增加合成或积累。可以例如通过增加内源基因的表达，或通过表达外源基因或增加外源基因的表达，使MEG(或GA)或任选MEG(或GA)和一种或多种联产品的生物合成途径的酶发生过表达。因此，可以通过过表达一种或多种编码MEG(或GA)或任选MEG(或GA)和一种或多种联产品的生物合成途径的酶的核酸分子，容易地修饰天然存在的生物体，以生成生产非天然MEG(或GA)或任选MEG(或GA)和一种或多种联产品的生物体。此外，可以通过内源基因的诱变生成非天然存在的生物体，该诱变导致MEG(或GA)或任选MEG(或GA)和一种或多种联产品的生物合成途径的酶的活性增加。

有了本公开，本领域技术人员将能够容易地构建本文所述的重组微生物，因为本公开内容的重组微生物可以使用本领域众所周知的方法构建，如上文示例，以外源表达至少一种编码MEG(或GA)或任选MEG(或GA)和一种或多种联产品的生物合成途径的酶的核酸，其量足以生产MEG(或GA)或任选MEG(或GA)和一种或多种联产品。

可以通过例如本领域公知的重组和检测方法，来实施构建和测试非天然存在的生产MEG(或GA)或任选生产MEG(或GA)和一种或多种联产品的宿主的表达水平的方法。这样的方法例如描述于Sambrook等人，Molecular Cloning：A Laboratory Manual,第三版,ColdSpring Harbor Laboratory,New York(2001)；Ausubo等人，Current Protocols inMolecular Biology,John Wiley and Sons,Baltimore,Md.(1999)中。

本领域已知的多种机制可以用于表达或过表达外源性或内源性基因。例如，可以构建一个或多个表达载体以包含一种或多种如本文示例的编码MEG(或GA)或任选MEG(或GA)和一种或多种联产品的生物合成途径的酶的核酸，其可操作连接至在宿主生物体中起作用的表达控制序列。适用于本发明微生物宿主生物的表达载体包括例如质粒、噬菌体载体、病毒载体、附加体(episome)和人工染色体，包括可操作的用于稳定整合至宿主染色体中的载体和选择序列或标记。还可以包括可选择的标记基因，例如，提供对抗生素或毒素的抗性、补充营养缺陷或提供不在培养介质中的关键营养物。表达控制序列可以包括本领域熟知的组成型和诱导型启动子、转录增强子、转录终止子等。当共表达两种或多种外源编码核酸时，可以将两种核酸插入例如单个表达载体中或分开的表达载体中。对于单个载体表达，编码核酸可以与一种共同的表达控制序列可操作连接，或与不同的表达控制序列连接，如一种诱导型启动子和一种组成型启动子。可以使用本领域公知的方法来确认参与代谢或合成途径的外源性核酸序列的转化。

本领域技术人员将理解，可以有利地修饰编码序列，以增强其在特定宿主中的表达。遗传密码是冗余的，有64个可能的密码子，但大多数生物体通常使用这些密码子的一个子集。一个物种中最常利用的密码子称为最佳密码子，那些不太经常利用的密码子分类为稀有或低使用(low-usage)密码子。可以替换密码子以反映宿主偏好的密码子使用，这一过程有时称为“密码子优化”或“物种密码子偏向性控制(controlling for species codonbias)”。

例如，可以制备包含特定原核或真核宿主偏好的密码子的优化编码序列(另见Murray等人(1989)Nucl.Acids Res.17：477-508)，以(与由非优化序列产生的转录物相比)提高翻译速度或产生具有所需特性(如更长的半衰期)的重组RNA转录物。还可以修饰翻译终止密码子，以反映宿主偏好。例如，酿酒酵母和哺乳动物的典型终止密码子分别是UAA和UGA。单子叶植物的典型终止密码子是UGA，而昆虫和大肠杆菌通常使用UAA作为终止密码子(Dalphin等人(1996)Nucl.Acids Res.24：216-218)。

本领域技术人员将认识到，由于遗传密码的简并性质，多种核酸序列可用于编码本公开的给定酶。在本文中引用的编码生物合成酶的核酸序列仅用于说明本公开的实施方案，本公开包括编码本公开的酶的多肽和蛋白质的氨基酸序列的任何核酸序列。以类似方式，多肽通常可以耐受其氨基酸序列中的一个或多个氨基酸取代、缺失和插入，而不会损失或显著损失所需活性。本公开内容包括具有与本文所述的特定蛋白质不同的氨基酸序列的此类多肽，只要修饰的或变体的多肽具有参照多肽的酶促合成代谢或分解代谢活性。此外，由本文所示核酸序列编码的氨基酸序列仅是说明本公开的实施方案。

表达控制序列是本领域已知的，包括例如启动子、增强子、聚腺苷酸化信号、转录终止子、内部核糖体进入位点(IRES)等，其为多核苷酸序列在宿主细胞中的表达作准备。表达控制序列与参与转录的细胞蛋白特异性地相互作用(Maniatis等人，Science,236：1237-1245(1987))。示例性表达控制序列描述于例如Goeddel,Gene Expression Technology：Methods in Enzymology,Vol.185,Academic Press,San Diego,Calif.(1990)中。

在各种实施方案中，表达控制序列可以与多核苷酸序列可操作连接。“可操作连接(operably linked)”是指多核苷酸序列和表达控制序列以这样一种方式连接，即当适当的分子(例如，转录激活因子蛋白)与表达控制序列结合时允许基因表达。就转录和翻译方向而言，可操作连接的启动子位于所选多核苷酸序列的上游。可操作连接的增强子可以位于所选多核苷酸的上游、内部或下游。

在一些实施方案中，操作重组微生物以缺失、破坏、突变和/或降低一种或多种内源性酶的活性，所述内源性酶催化与生物合成途径竞争产生MEG(或GA)或任选MEG(或GA)和一种或多种联产品的途径中的反应。

在一些实施方案中，操作重组微生物以缺失、破坏、突变和/或降低磷酸戊糖途径氧化分支中的一种或多种内源性酶的活性。在一些实施方案中，该操作阻止葡萄糖-6-磷酸通过磷酸戊糖途径的氧化分支转化，而是通过磷酸戊糖途径的非氧化分支分流葡萄糖-6-磷酸，以产生一种或多种生产MEG(或GA)或任选MEG(或GA)和一种或多种联产品所需的戊糖-5-磷酸中间体。在一些这类实施方案中，一种或多种内源性酶选自葡萄糖6-磷酸-1-脱氢酶、6-磷酸葡萄糖酸内酯酶和6-磷酸葡萄糖酸脱氢酶。在进一步的实施方案中，葡萄糖6-磷酸-1-脱氢酶是zwf，6-磷酸葡萄糖酸内酯酶是pgl，6-磷酸葡萄糖酸脱氢酶是gnd。

在一些实施方案中，操作重组微生物以缺失、破坏、突变和/或降低甘油醛3-磷酸脱氢酶和/或磷酸甘油酸激酶和/或磷酸甘油酸变位酶的活性。在一些实施方案中，该操作防止甘油醛3-磷酸转化为1,3-二磷酸-D-甘油酸和随后的中间体，而是通过转酮醇酶允许甘油醛3-磷酸转化为木酮糖-5-磷酸(同时果糖-6-磷酸转化为赤藓糖-4-磷酸)，从而产生生产MEG或任选MEG和一种或多种联产品所需的戊糖-5-磷酸中间体，并提供更多的赤藓糖-4-磷酸用于磷酸戊糖途径的非氧化分支，以进一步产生一种或多种戊糖-5-磷酸中间体。在一些实施方案中，甘油醛3-磷酸脱氢酶是gapA，磷酸甘油酸激酶是pgk，磷酸甘油酸变位酶是gpmA和/或gpmM。

在一些实施方案中，操作重组微生物以缺失、破坏、突变和/或降低6-磷酸果糖激酶的活性。在一些实施方案中，该操作阻止果糖-6-磷酸转化为1,6-二磷酸，而是允许果糖-6-磷酸通过果糖-6-磷酸磷酸酮醇酶转化为赤藓糖-4-磷酸和乙酰磷酸，并为磷酸戊糖途径的非氧化分支提供更多的赤藓糖-4-磷酸，以进一步产生一种或多种生产MEG(或GA)或任选MEG(或GA)和一种或多种联产品所需的戊糖-5-磷酸中间体。在一些实施方案中，6-磷酸果糖激酶是pfkA和/或pfkB。

在一些实施方案中，操作重组微生物以缺失、破坏、突变和/或降低一种或多种催化乙醇醛转化为乙醇酸的内源性酶的活性。在一些这类实施方案中，催化乙醇醛转化为乙醇酸的酶是乙醇醛脱氢酶。在一些实施方案中，乙醇醛脱氢酶来自大肠杆菌。在一些实施方案中，乙醇醛脱氢酶由aldA基因或其同源物编码。在一些实施方案中，该操作防止由乙醇醛产生乙醇酸，而是将反应分流向乙醇醛转化为MEG。在一些实施方案中，催化乙醇醛转化为乙醇酸的一种或多种内源性酶的活性是部分缺失、破坏、突变和/或降低的，其中仍然存在一些乙醇醛脱氢酶功能并且仍然生产一定量的乙醇酸。

在一些实施方案中，操作重组微生物以缺失、破坏、突变和/或降低一种或多种催化丙酮酸转化为乳酸的内源性酶的活性。在一些这类实施方案中，催化丙酮酸转化为乳酸的酶是乳酸脱氢酶。在一些实施方案中，乳酸脱氢酶来自大肠杆菌。在一些实施方案中，乳酸脱氢酶由ldhA基因或其同源物编码。在一些实施方案中，该操作防止由丙酮酸产生乳酸，而是将反应分流向生产异丁烯。

在一些实施方案中，操作重组微生物以缺失、破坏、突变和/或降低一种或多种催化D-木酮糖转化为D-木糖的内源性酶的活性。在一些这类实施方案中，催化D-木酮糖转化为D-木糖的酶是D-木糖异构酶。在一些实施方案中，D-木糖异构酶来自大肠杆菌。在一些实施方案中，D-木糖异构酶由xylA基因或其同源物编码。在一些实施方案中，该操作防止D-木酮糖转化为D-木糖，而是分流向D-木酮糖转化为D-木酮糖-1-磷酸、D-木酮糖-5-磷酸或D-核酮糖的反应。

实施例

实施例1

PGM3蛋白的体外酶促测定

通过在OD 340nm处监测NADP+还原为NADPH 10分钟，在葡萄糖-1,6-二磷酸存在下，以其天然底物核糖-1-磷酸和葡萄糖-1-磷酸对磷酸葡萄糖变位酶(其是磷酸戊糖变位酶，由ScPGM3(SEQ ID NO：255或SEQ ID NO：258)编码(来自酿酒酵母的PGM3))进行酶促测定(图15)。两种葡萄糖分子均购自Merck。反应混合物含有HEPES 60mM，pH 7.5、KCl 60mM、MgCl₂ 3mM、纯化的PGM3蛋白、NADP⁺0.5mM、葡萄糖-1,6-二磷酸5μM、葡萄糖-1-磷酸8mM和市售的葡萄糖-6-磷酸脱氢酶3U/mL(来自Merck)。

对戊糖-5P底物(核酮糖-5P和木酮糖-5)的活性根据图16中的方案确定。反应混合物含有HEPES 60mM，pH 7.5、KCl 60mM、MgCl₂ 3mM、NADH 0.25mM、葡萄糖-1,6-二磷酸5μM、戊糖(核酮糖或木酮糖)5mM、ATP 4mM、纯化的PGM3蛋白、纯化的核糖激酶或核酮糖激酶、和如前所述获得的aldoB(Cam Y.等人(2015)Engineering of a Synthetic MetabolicPathway for the Assimilation of(d)-Xylose into Value-Added Chemicals.ACSSynth Biol)、甘油-3-磷酸脱氢酶(GPDH)2U/mL(Merck)。结果表明，木酮糖-5P PGM3比活性约为0.015μmol min^-1mg^-1，而核酮糖-5P PGM3比活性约为0.016±0.002μmol min^-1mg^-1。

实施例2

PGM3蛋白的体内酶促测定

为了评估使用PGM3进行体内乙醇酸(GA)生产的可行性，基于使用具有基因型MG1655ΔtktA-ΔtktB的筛选株开发了一种测定方法。如图17所描述的，这类株由于缺失转酮醇酶基因tktA(GenBank Gene ID：947420)和tktB(GenBank Gene ID：945865)，本身不能以木糖生长。然而，表达活性PGM3蛋白的株可以使用在碳5上磷酸化的戊糖产生在碳1上磷酸化的戊糖，随后通过醛缩酶活性将戊糖-1P转化为乙醇醛和DHAP。乙醇醛和甘油醛-3-磷酸可以进入乙醛酸旁路和糖酵解，并支持株生长。因此，筛选株中的体内PGM3活性与细胞生长直接相关。

使用标准程序，用携带酿酒酵母PGM3和合适的醛缩酶(aldoB或fucA)的质粒，对筛选株PGM3(MG1655ΔtktA-ΔtktB)进行电穿孔转化(Woodall C.A.E.coli PlasmidVectors.Methods in Molecular Biology^TM.2003.vol 235)。所得株在M9木糖介质(20g/L木糖)中生长50小时。加入终浓度为100μg/mL的卡那霉素。通过OD600监测生长(图17)。

由于可以通过PPP途径由葡萄糖自然获得在碳5上磷酸化的戊糖中间体(如核酮糖-5P和木酮糖-5P)，以类似的方法，来自酿酒酵母的活性PGM3也适用于证明由葡萄糖体内生产乙醇酸。在没有PGM3.Sc过表达质粒的情况下，没有观察到大肠杆菌MG1655ΔtktA-ΔtktB的细胞生长。另一方面，当来自酿酒酵母的活性PGM3能够将D-木酮糖-5P和D-核酮糖-5P分别转化为D-木酮糖-1P和D-核酮糖-1P，从而戊糖-1P中间体通过醛缩酶活性(aldoB作用于D-木酮糖-1P，fucA作用于D-核酮糖-1P)转化为乙醇醛和G3P时，大肠杆菌MG1655ΔtktA-ΔtktB恢复了其以木糖生长的能力。

实施例3

根据图18中的方案，分别以其天然底物木酮糖-1P和核酮糖-1P，对D-木酮糖-1-磷酸醛缩酶(aldoB)(Maylay AD等人(2002)Arch Biochem Biophys,408：295-304)和D-核酮糖-1-磷酸醛缩酶(FucA)(Elsinghorst EA等人(1994)J Bacteriol,176：7223-7232)的活性进行了酶促测定。反应混合物含有HEPES 60mM，pH 7.5、KCl 60mM、MgCl₂ 3mM、NADH0.25mM、ATP 4mM、纯化的激酶和醛缩酶GPDH 2U/mL。另外，用于生产戊糖-1P的激酶是：fucK(SEQ ID NO：257)(LeBlanc DJ等人(1971)Metabolism of D-arabinose：origin of a D-ribulokinase activity in Escherichia coli.J Bacteriol,106：82-89)用于核酮糖-1P，而khk-C(SEQ ID NO：256)(Asipu A等人(2003)Properties of normal and mutantrecombinant human ketohexokinases and implications for the pathogenesis ofessential fructosuria.Diabetes,52：2426-2432)用于木酮糖-1P。如前所述检测两种蛋白质，以检测产生戊糖-5P的激酶。

HPLC分析。

使用配备RI检测器的Thermo Fisher Scientific系统(Courtaboeuf，法国)，使用205nm紫外检测器和Phenomenex柱(Rezex H+)，在50℃使用2.5mM H₂SO₄作为流动相，流速为0.5mL/min，通过高效液相色谱法确定戊糖、乙醇酸和甘油的定量。

本公开的编号实施方案

1.重组微生物，其包含一种或多种生化途径，所述生化途径由一种或多种己糖原料通过一种或多种戊糖-5-磷酸中间体生产单乙二醇(MEG)或乙醇酸(GA)。

2.根据前述实施方案中任一项所述的重组微生物，其中所述一种或多种联产品与MEG或GA联产。

3.根据前述实施方案中任一项所述的重组微生物，其中所述一种或多种戊糖-5-磷酸中间体是D-核糖-5-磷酸、D-木酮糖-5-磷酸或D-核酮糖-5-磷酸中的一种或多种。

4.根据前述实施方案中任一项所述的重组微生物，其中所述一种或多种生化途径包含至少一种具有转酮醇酶活性的酶。

5.根据前述实施方案中任一项所述的重组微生物，其中所述至少一种具有转酮醇酶活性的酶由与来自大肠杆菌的tktA或tktB具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码。

6.根据前述实施方案中任一项所述的重组微生物，其中所述至少一种具有转酮醇酶活性的酶包括来自大肠杆菌的tktA或tktB。

7.根据前述实施方案中任一项所述的重组微生物，其中所述一种或多种生化途径包含至少一种具有转醛醇酶活性的酶。

8.根据前述实施方案中任一项所述的重组微生物，其中所述至少一种具有转醛醇酶活性的酶由与来自大肠杆菌的talA或talB具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码。

9.根据前述实施方案中任一项所述的重组微生物，其中所述至少一种具有转醛醇酶活性的酶选自大肠杆菌talA和大肠杆菌talB。

10.根据前述实施方案中任一项所述的重组微生物，其中所述一种或多种生化途径包含至少一种具有核酮糖-5-磷酸3-差向异构酶活性的酶。

11.根据前述实施方案中任一项所述的重组微生物，其中所述至少一种具有核酮糖-5-磷酸3-差向异构酶活性的酶由与来自大肠杆菌的rpe具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码。

12.根据前述实施方案中任一项所述的重组微生物，其中所述至少一种具有核酮糖-5-磷酸3-差向异构酶活性的酶包括来自大肠杆菌的rpe。

13.根据实施方案1-12中任一项所述的重组微生物，其中所述一种或多种生化途径包含至少一种具有核糖-5-磷酸异构酶活性的酶。

14.根据前述实施方案中任一项所述的重组微生物，其中所述至少一种具有核糖-5-磷酸异构酶活性的酶由与来自大肠杆菌的rpiA或rpiB具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码。

15.根据前述实施方案中任一项所述的重组微生物，其中所述至少一种具有核糖-5-磷酸异构酶活性的酶包括来自大肠杆菌的rpiA或rpiB。

16.根据前述实施方案中任一项所述的重组微生物，其中所述重组微生物进一步包含一种或多种内源性酶的缺失或降低的活性，所述内源性酶选自甘油醛3-磷酸脱氢酶、磷酸甘油酸激酶和磷酸甘油酸变位酶。

17.根据前述实施方案中任一项所述的重组微生物，其中所述甘油醛3-磷酸脱氢酶是gapA，磷酸甘油酸激酶是pgk，磷酸甘油酸变位酶是gpmA和/或gpmM。

18.根据前述实施方案中任一项所述的重组微生物，其中所述一种或多种生化途径包含至少一种具有果糖-6-磷酸磷酸酮醇酶活性的酶。

19.根据前述实施方案中任一项所述的重组微生物，其中所述至少一种具有果糖-6-磷酸磷酸酮醇酶活性的酶由与选自以下的具有果糖-6-磷酸磷酸酮醇酶活性的酶具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码：齿双歧杆菌(Bifidobacterium dentium)BDP_1006、乳双歧杆菌(Bifidobacterium lactis)xfp、类植物乳杆菌(Lactobacillus paraplantarum)xpkA和短双歧杆菌(Bifidobacteriumbreve)xfp。

20.根据前述实施方案中任一项所述的重组微生物，其中所述至少一种具有果糖-6-磷酸磷酸酮醇酶活性的酶选自齿双歧杆菌BDP_1006、乳双歧杆菌xfp、类植物乳杆菌xpkA和短双歧杆菌xfp。

21.根据前述实施方案中任一项所述的重组微生物，其中所述一种或多种生化途径包含至少一种具有磷酸乙酰转移酶活性的酶。

22.根据前述实施方案中任一项所述的重组微生物，其中所述至少一种具有磷酸乙酰转移酶活性的酶由与选自以下的具有磷酸乙酰转移酶活性的酶具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码：大肠杆菌pta和丙酮丁醇梭菌(Clostridium acetobutylicum)pta。

23.根据前述实施方案中任一项所述的重组微生物，其中所述至少一种具有磷酸乙酰转移酶活性的酶选自大肠杆菌pta和丙酮丁醇梭菌pta。

24.根据前述实施方案或18-23中任一项所述的重组微生物，其中所述重组微生物进一步包含内源性酶6-磷酸果糖激酶的缺失或降低的活性。

25.根据前述实施方案中任一项所述的重组微生物，其中所述6-磷酸果糖激酶是pfkAB。

26.根据前述实施方案中任一项所述的重组微生物，其中所述一种或多种生化途径包含至少一种具有戊糖磷酸酶活性的酶。

27.根据前述实施方案中任一项所述的重组微生物，其中所述至少一种具有戊糖磷酸酶活性的酶选自以下一种或多种：具有D-戊糖-5-磷酸酶活性的酶、具有D-木酮糖-5-磷酸酶活性的酶、具有D-核糖-5-磷酸酶活性的酶和具有D-核酮糖-5-磷酸酶活性的酶。

28.根据前述实施方案中任一项所述的重组微生物，其中所述至少一种具有D-戊糖-5-磷酸酶活性的酶由与选自以下的具有D-戊糖-5-磷酸酶活性的酶具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码：大肠杆菌phoA、大肠杆菌yfbT和大肠杆菌yidA。

29.根据前述实施方案中任一项所述的重组微生物，其中所述至少一种具有D-戊糖-5-磷酸酶活性的酶选自大肠杆菌phoA、大肠杆菌yfbT和大肠杆菌yidA。

30.根据前述实施方案中任一项所述的重组微生物，其中所述至少一种具有D-木酮糖-5-磷酸酶活性的酶由与枯草芽孢杆菌araL具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码。

31.根据前述实施方案中任一项所述的重组微生物，其中所述至少一种具有D-木酮糖-5-磷酸酶活性的酶是枯草芽孢杆菌araL。

32.根据前述实施方案中任一项所述的重组微生物，其中所述至少一种具有D-核糖-5-磷酸酶活性的酶由与选自以下的具有D-核糖-5-磷酸酶活性的酶具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码：拟南芥SGPP、荧光假单胞菌(Pseudomonas fluorescens)PFLU_2693和大肠杆菌ybiV。

33.根据前述实施方案中任一项所述的重组微生物，其中所述至少一种具有D-核糖-5-磷酸酶活性的酶选自拟南芥SGPP、荧光假单胞菌(Pseudomonas fluorescens)PFLU_2693和大肠杆菌ybiV。

34.根据前述实施方案中任一项所述的重组微生物，其中所述至少一种具有D-核酮糖-5-磷酸酶活性的酶由与恶性疟原虫(Plasmodium falciparum)PF10_0325具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码。

35.根据前述实施方案中任一项所述的重组微生物，其中所述至少一种具有D-核酮糖-5-磷酸酶活性的酶是恶性疟原虫PF10_0325。

36.根据前述实施方案中任一项所述的重组微生物，其中所述一种或多种生化途径包含至少一种具有阿糖醇磷酸脱氢酶活性的酶。

37.根据前述实施方案中任一项所述的重组微生物，其中所述至少一种具有阿糖醇磷酸脱氢酶活性的酶选自以下一种或多种：具有D-阿糖醇1-磷酸4-脱氢酶活性的酶、具有D-阿糖醇5-磷酸2-脱氢酶活性的酶、具有D-阿糖醇1-磷酸2-脱氢酶活性的酶和具有D-阿糖醇5-磷酸4-脱氢酶活性的酶。

38.根据前述实施方案中任一项所述的重组微生物，其中所述至少一种具有D-阿糖醇1-磷酸4-脱氢酶活性的酶由与来自鸟肠球菌(Enterococcus avium)的APDH具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码。

39.根据前述实施方案中任一项所述的重组微生物，其中所述至少一种具有D-阿糖醇1-磷酸4-脱氢酶活性的酶是来自鸟肠球菌的APDH。

40.根据前述实施方案中任一项所述的重组微生物，其中所述至少一种具有D-阿糖醇5-磷酸2-脱氢酶活性的酶由与来自鸟肠球菌(Enterococcus avium)的APDH具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码。

41.根据前述实施方案中任一项所述的重组微生物，其中所述至少一种具有D-阿糖醇5-磷酸2-脱氢酶活性的酶是来自鸟肠球菌的APDH。

42.根据前述实施方案中任一项所述的重组微生物，其中所述至少一种具有D-阿糖醇1-磷酸2-脱氢酶活性的酶由与选自以下的具有D-阿糖醇1-磷酸2-脱氢酶活性的酶具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码：白色念珠菌(Candida albicans)ARD1、热带念珠菌(Candida tropicalis)ARD1、Scheffersomyces stipitis ARDH、枯草芽孢杆菌egsA(araM)、敏捷气热菌egsA、大肠杆菌gpsA和酿酒酵母GPD1。

43.根据前述实施方案中任一项所述的重组微生物，其中所述至少一种具有D-阿糖醇1-磷酸2-脱氢酶活性的酶选自白色念珠菌(Candida albicans)ARD1、热带念珠菌(Candida tropicalis)ARD1、Scheffersomyces stipitis ARDH、枯草芽孢杆菌egsA(araM)、敏捷气热菌egsA、大肠杆菌gpsA和酿酒酵母GPD1。

44.根据前述实施方案中任一项所述的重组微生物，其中所述至少一种具有D-阿糖醇5-磷酸4-脱氢酶活性的酶由与选自以下的具有D-阿糖醇5-磷酸4-脱氢酶活性的酶具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码：荧光假单胞菌mtlD、肺炎克雷伯氏菌(Klebsiella pneumoniae)dalD、茄科雷尔氏菌(Ralstonia solanacearum)dalD、枯草芽孢杆菌egsA(araM)、敏捷气热菌egsA、大肠杆菌gpsA和酿酒酵母GPD1。

45.根据前述实施方案中任一项所述的重组微生物，其中所述至少一种具有D-阿糖醇5-磷酸4-脱氢酶活性的酶选自荧光假单胞菌mtlD、肺炎克雷伯氏菌dalD、茄科雷尔氏菌dalD、枯草芽孢杆菌egsA(araM)、敏捷气热菌egsA、大肠杆菌gpsA和酿酒酵母GPD1。

46.根据前述实施方案中任一项所述的重组微生物，其中所述一种或多种生化途径包含至少一种具有磷酸戊糖变位酶活性的酶。

47.根据前述实施方案中任一项所述的重组微生物，其中所述至少一种具有磷酸戊糖变位酶活性的酶由与选自以下的具有磷酸戊糖变位酶活性的酶具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码：大肠杆菌deoB、大肠杆菌pgm、枯草芽孢杆菌pgcA、乳酸乳球菌(Lactococcus lactis)pgmB、大肠杆菌ycjU、铜绿假单胞菌(Pseudomonas aeruginosa)algC和大肠杆菌cpsG。

48.根据前述实施方案中任一项所述的重组微生物，其中所述至少一种具有磷酸戊糖变位酶活性的酶选自大肠杆菌deoB、大肠杆菌pgm、枯草芽孢杆菌pgcA、乳酸乳球菌(Lactococcus lactis)pgmB、大肠杆菌ycjU、铜绿假单胞菌(Pseudomonas aeruginosa)algC和大肠杆菌cpsG。

49.根据前述实施方案中任一项所述的重组微生物，其中所述重组微生物进一步包含一种或多种内源性酶的缺失或降低的活性，所述内源性酶选自葡萄糖6-磷酸-1-脱氢酶、6-磷酸葡萄糖酸内酯酶和6-磷酸葡萄糖酸脱氢酶。

50.根据前述实施方案中任一项所述的重组微生物，其中所述葡萄糖6-磷酸-1-脱氢酶是zwf，6-磷酸葡萄糖酸内酯酶是pgl，6-磷酸葡萄糖酸脱氢酶是gnd。

51.根据前述实施方案中任一项所述的重组微生物，其中所述一种或多种联产品选自丙酮、异丙醇、丙烯、异丁烯和一种或多种丝氨酸途径化合物。

52.根据前述实施方案中任一项所述的重组微生物，其中所述一种或多种丝氨酸途径化合物选自丝氨酸、甘氨酸、单乙醇胺(MEA)和乙二胺(EDA)。

53.根据前述实施方案中任一项所述的重组微生物，其中所述一种或多种己糖原料选自葡萄糖或葡萄糖的低聚物。

54.根据前述实施方案中任一项所述的重组微生物，其中所述葡萄糖的低聚物选自果糖、蔗糖、淀粉、纤维二糖、麦芽糖、乳糖和纤维素。

55.根据前述实施方案中任一项所述的重组微生物，其中所述具有转酮醇酶活性的酶或具有果糖-6-磷酸磷酸酮醇酶活性的酶的表达能够使一种或多种己糖原料无损转化为一种或多种戊糖-5-磷酸中间体。

56.根据前述实施方案中任一项所述的重组微生物，其中通过C2途径中乙醇醛的转化和C3途径中磷酸二羟丙酮(DHAP)或丙酮酸的转化，来生产MEG或GA。

57.根据前述实施方案中任一项所述的重组微生物，其中通过乙醇醛脱氢酶氧化乙醇醛生产GA。

58.根据前述实施方案中任一项所述的重组微生物，其中用于通过C3途径中DHAP或丙酮酸的转化生产MEG或GA的一种或多种酶选自具有选自以下的活性的一种或多种酶：3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、丝氨酸转氨酶活性、羟基丙酮酸脱羧酶活性、3-磷酸羟基丙酮酸还原酶活性、乙醇醛还原酶活性、乙醇醛脱氢酶活性、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶活性、丝氨酸脱羧酶活性、乙醇胺转氨酶或乙醇胺氧化还原酶(脱氨基)活性、甘油酸脱羧酶活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性和甘油酸2-激酶活性。

59.根据前述实施方案中任一项所述的重组微生物，其中通过C2途径中乙醇醛的转化生产MEG或GA，通过C3途径中磷酸二羟丙酮(DHAP)或丙酮酸的转化生产一种或多种联产品。

60.根据前述实施方案中任一项所述的重组微生物，其中用于通过C3途径中DHAP或丙酮酸的转化生产一种或多种联产品的一种或多种酶选自一种或多种具有选自以下的活性的酶：硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A：乙酰乙酸转移酶或乙酸：乙酰乙酰辅酶A水解酶活性和乙酰乙酸脱羧酶活性，并且其中所述一种或多种联产品包括丙酮。

61.根据前述实施方案中任一项所述的重组微生物，其中用于通过C3途径中DHAP或丙酮酸的转化生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A：乙酰乙酸转移酶或乙酸：乙酰乙酰辅酶A水解酶活性、乙酰乙酸脱羧酶活性和仲醇脱氢酶活性，并且其中所述一种或多种联产品包含异丙醇。

62.根据前述实施方案中任一项所述的重组微生物，其中用于通过C3途径中DHAP或丙酮酸的转化生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A：乙酰乙酸转移酶或乙酸：乙酰乙酰辅酶A水解酶活性、乙酰乙酸脱羧酶活性、仲醇脱氢酶活性和脱水酶活性，并且其中所述一种或多种联产品包含丙烯。

63.根据前述实施方案中任一项所述的方法，其中用于通过C3途径中DHAP或丙酮酸的转化生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A：乙酰乙酸转移酶或乙酸：乙酰乙酰辅酶A水解酶活性、乙酰乙酸脱羧酶活性、3-羟基异戊酸(3HIV)合酶活性、羟甲基戊二酰辅酶A合酶活性、甲基戊烯二酰辅酶A水合酶活性、甲基巴豆酰辅酶A羧化酶活性、甲基巴豆酰辅酶A水合酶活性、3-羟基异戊酰辅酶A硫酯酶活性、3HIV激酶活性、3HIV-3-磷酸脱羧酶活性和3HIV脱羧酶活性，并且其中所述一种或多种联产品包含异丁烯。

64.根据前述实施方案中任一项所述的方法，其中用于通过C3途径中DHAP或丙酮酸的转化生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性和甘油酸2-激酶活性，并且其中所述一种或多种联产品包含L-丝氨酸。

65.根据前述实施方案中任一项所述的方法，其中用于通过C3途径中DHAP或丙酮酸的转化生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：丝氨酸羟甲基转移酶活性、转移酶活性、甲醛脱氢酶活性、甲酸脱氢酶活性、与甘氨酸裂解系统相关的活性、3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、丝氨酸转氨酶活性、羟基丙酮酸脱羧酶活性、丝氨酸氧化还原酶(脱氨基)活性、丝氨酸脱羧酶活性、乙醇胺转氨酶或乙醇胺氧化还原酶(脱氨基)活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性、甘油酸2-激酶活性、乙醇醛脱氢酶活性、乙醇酸脱氢酶活性、丙氨酸-乙醛酸转氨酶活性、丙氨酸转氨酶活性和NAD(P)H依赖性谷氨酸脱氢酶活性，并且其中所述一种或多种联产品包含甘氨酸。

66.根据前述实施方案中任一项所述的方法，其中与甘氨酸裂解系统相关的活性包含选自以下的酶或蛋白：甘氨酸脱羧酶(P蛋白)、氨甲基转移酶(T蛋白)、二氢硫辛酰胺脱氢酶(L蛋白)和H蛋白。

67.根据前述实施方案中任一项所述的方法，其中用于通过C3途径中DHAP或丙酮酸的转化生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、转氨酶活性、羟基丙酮酸脱羧酶活性、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶活性、丝氨酸脱羧酶活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性、甘油酸2-激酶活性、乙醛脱氢酶活性和乙醇胺解氨酶活性，并且其中所述一种或多种联产品包含单乙醇胺(MEA)。

68.根据前述实施方案中任一项所述的方法，其中用于通过C3途径中DHAP或丙酮酸的转化生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：丝氨酸脱氢酶活性、2-氨基丙二酸半醛脱羧酶活性、氨基乙醛转氨酶活性、2-氨基丙二酸半醛转氨酶活性、2,3-二氨基丙酸脱羧酶活性、丝氨酸脱羧酶活性、乙醇胺脱氢酶活性、丝氨酸羟甲基转移酶活性、醛氧化酶活性、N-乙酰转移酶或O-乙酰转移酶活性、N-乙酰丝氨酸脱氢酶活性、转氨酶活性、脱乙酰酶活性、丝氨酸氨基酶活性和2,3-二氨基丙酸解氨酶活性，并且其中所述一种或多种联产品包含乙二胺(EDA)。

69.根据前述实施方案中任一项所述的重组微生物，其中用于在C2途径中由乙醇醛生产MEG或GA的一种或多种酶选自具有选自以下的活性的一种或多种酶：D-塔格糖3-差向异构酶活性、D-核酮糖激酶活性、D-核酮糖-1-磷酸醛缩酶活性、D-木酮糖1-激酶活性、D-木酮糖-1-磷酸醛缩酶活性、木糖还原酶或醛糖还原酶活性、木糖醇脱氢酶活性、木糖异构酶活性、木糖脱氢酶活性、木糖酸内酯酶活性、木糖酸脱氢酶活性、2-酮-3-脱氧-D-戊酸醛缩酶活性、乙醇醛还原酶活性和乙醇醛脱氢酶活性。

70.根据前述实施方案中任一项所述的重组微生物，其中所述重组微生物进一步包含一种或多种修饰，以减少或缺失乙醇醛脱氢酶、乳酸脱氢酶、木糖异构酶、木酮糖激酶或其组合的活性。

71.根据前述实施方案中任一项所述的重组微生物，其中至少一部分在C3途径中生产的过量NADH用作C2途径中还原当量的来源。

72.根据前述实施方案中任一项所述的重组微生物，其中至少一部分在C3途径中生产的过量NADH用于生产ATP。

73.根据前述实施方案中任一项所述的重组微生物，其中最小化过量的生物质形成，并且最大化MEG(或GA)或MEG(或GA)和一种或多种联产品的生产。

74.使用前述权利要求中任一项所述的重组微生物生产MEG或乙醇酸(GA)的方法，其中所述方法包括在含有提供碳源的一种或多种己糖原料的培养介质中培养重组微生物，直至生产MEG或GA。

75.根据前述实施方案中任一项所述的方法，其中所述一种或多种联产品与MEG或GA联产。

76.根据前述实施方案中任一项所述的方法，其中所述一种或多种联产品选自丙酮、异丙醇、丙烯、异丁烯和一种或多种丝氨酸途径化合物。

77.根据前述实施方案中任一项所述的方法，其中所述一种或多种丝氨酸途径化合物选自丝氨酸、甘氨酸、单乙醇胺(MEA)和乙二胺(EDA)。

78.生产重组微生物的方法，所述重组微生物由一种或多种外源己糖原料通过一种或多种戊糖-5-磷酸中间体生产或积累MEG或乙醇酸(GA)，所述方法包括：

向重组微生物中引入一种或多种酶，所述酶用于将一种或多种己糖原料转化为一种或多种戊糖-5-磷酸中间体；

向重组微生物中引入一种或多种酶，所述酶用于将一种或多种戊糖-5-磷酸中间体转化为一种或多种戊糖或戊糖-1-磷酸中间体；

向重组微生物中引入C2途径，所述途径包括一种或多种用于由乙醇醛生产MEG或GA的酶；和

向重组微生物中引入C3途径，所述途径包括一种或多种用于由DHAP或丙酮酸生产MEG或GA的酶；和

在含有一种或多种己糖原料的培养介质中培养所述重组微生物，以生产或积累MEG或GA，

其中乙醇醛和DHAP(或丙酮酸)是C2途径中产生的中间体，并且其中C2和C3途径中均生产MEG或GA。

79.生产重组微生物的方法，所述重组微生物由一种或多种外源己糖原料通过一种或多种戊糖-5-磷酸中间体生产或积累MEG或乙醇酸(GA)和一种或多种联产品，所述方法包括：

向重组微生物中引入C3途径，所述途径包括一种或多种用于由DHAP或丙酮酸生产一种或多种联产品的酶；和

在含有一种或多种己糖原料的培养介质中培养所述重组微生物，以生产或积累MEG或GA和一种或多种联产品，其中乙醇醛和DHAP(或丙酮酸)是C2途径中产生的中间体，其中C2途径中生产MEG或GA，C3途径中生产一种或多种联产品。

80.根据前述实施方案中任一项所述的方法，其中乙醇醛通过乙醇醛脱氢酶氧化为乙醇酸。

81.根据前述实施方案中任一项所述的方法，其中用于将一种或多种己糖原料转化为一种或多种戊糖-5-磷酸中间体的一种或多种酶选自一种或多种具有以下活性的酶：转酮醇酶活性、转醛醇酶活性、核酮糖-5-磷酸3-差向异构酶活性和核糖-5-磷酸异构酶活性。

82.根据前述实施方案中任一项所述的方法，其中所述方法进一步包括向重组微生物中引入一种或多种修饰，以降低或缺失一种或多种内源性酶的活性，所述内源性酶选自甘油醛3-磷酸脱氢酶(gapA)、磷酸甘油酸激酶(pgk)和磷酸甘油酸变位酶(gpmA和/或gpmM)。

83.根据前述实施方案中任一项所述的方法，其中将一种或多种己糖原料转化为一种或多种戊糖-5-磷酸中间体的一种或多种酶选自一种或多种具有以下活性的酶：果糖-6-磷酸磷酸酮醇酶活性、磷酸乙酰转移酶活性、转酮醇酶活性、转醛醇酶活性、核酮糖-5-磷酸3-差向异构酶活性和核糖-5-磷酸异构酶活性。

84.根据前述实施方案中任一项所述的方法，其中所述方法进一步包括将一种或多种修饰引入重组微生物中，以减少或缺失内源性酶6-磷酸果糖激酶(pfkAB)的活性。

85.根据前述实施方案中任一项所述的方法，其中所述方法进一步包括：将一种或多种修饰引入重组微生物中，以减少或缺失一种或多种内源性酶的活性，所述内源性酶选自葡萄糖6-磷酸-1-脱氢酶、6-磷酸葡萄糖酸内酯酶和6-磷酸葡萄糖酸脱氢酶。

86.根据前述实施方案中任一项所述的方法，其中所述葡萄糖6-磷酸-1-脱氢酶是zwf，6-磷酸葡萄糖酸内酯酶是pgl，6-磷酸葡萄糖酸脱氢酶是gnd。

87.根据前述实施方案中任一项所述的方法，其中用于将一种或多种戊糖-5-磷酸中间体转化为一种或多种戊糖或戊糖-1-磷酸中间体的一种或多种酶选自一种或多种具有以下活性的酶：戊糖磷酸酶活性、D-核酮糖-5-磷酸酶活性、D-核糖-5-磷酸酶活性、D-核糖异构酶活性、阿糖醇磷酸脱氢酶活性和磷酸戊糖变位酶活性。

88.根据前述实施方案中任一项所述的方法，其中用于由C3途径中的DHAP或丙酮酸生产MEG或GA的一种或多种酶选自具有选自以下的活性的一种或多种酶：3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、丝氨酸转氨酶活性、羟基丙酮酸脱羧酶活性、3-磷酸羟基丙酮酸还原酶活性、乙醇醛还原酶活性、乙醇醛脱氢酶活性、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶活性、丝氨酸脱羧酶活性、乙醇胺转氨酶或乙醇胺氧化还原酶(脱氨基)活性、甘油酸脱羧酶活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性和甘油酸2-激酶活性。

89.根据前述实施方案中任一项所述的方法，其中用于由C3途径中的DHAP或丙酮酸生产一种或多种联产品的一种或多种酶选自一种或多种具有选自以下的活性的酶：硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A：乙酰乙酸转移酶或乙酸：乙酰乙酰辅酶A水解酶活性和乙酰乙酸脱羧酶活性，并且其中所述一种或多种联产品包括丙酮。

90.根据前述实施方案中任一项所述的方法，其中用于由C3途径中的DHAP或丙酮酸生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A：乙酰乙酸转移酶或乙酸：乙酰乙酰辅酶A水解酶活性、乙酰乙酸脱羧酶活性和仲醇脱氢酶活性，并且其中所述一种或多种联产品包含异丙醇。

91.根据前述实施方案中任一项所述的方法，其中用于由C3途径中的DHAP或丙酮酸生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A：乙酰乙酸转移酶或乙酸：乙酰乙酰辅酶A水解酶活性、乙酰乙酸脱羧酶活性、仲醇脱氢酶活性和脱水酶活性，并且其中所述一种或多种联产品包含丙烯。

92.根据前述实施方案中任一项所述的方法，其中用于由C3途径中的DHAP或丙酮酸生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A：乙酰乙酸转移酶或乙酸：乙酰乙酰辅酶A水解酶活性、乙酰乙酸脱羧酶活性、3-羟基异戊酸(3HIV)合酶活性、羟甲基戊二酰辅酶A合酶活性、甲基戊烯二酰辅酶A水合酶活性、甲基巴豆酰辅酶A羧化酶活性、甲基巴豆酰辅酶A水合酶活性、3-羟基异戊酰辅酶A硫酯酶活性、3HIV激酶活性、3HIV-3-磷酸脱羧酶活性和3HIV脱羧酶活性，并且其中所述一种或多种联产品包含异丁烯。

93.根据前述实施方案中任一项所述的方法，其中用于由C3途径中的DHAP或丙酮酸生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性和甘油酸2-激酶活性，并且其中所述一种或多种联产品包含L-丝氨酸。

94.根据前述实施方案中任一项所述的方法，其中用于由C3途径中的DHAP或丙酮酸生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：丝氨酸羟甲基转移酶活性、转移酶活性、甲醛脱氢酶活性、甲酸脱氢酶活性、与甘氨酸裂解系统相关的活性、3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、丝氨酸转氨酶活性、羟基丙酮酸脱羧酶活性、丝氨酸氧化还原酶(脱氨基)活性、丝氨酸脱羧酶活性、乙醇胺转氨酶或乙醇胺氧化还原酶(脱氨基)活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性、甘油酸2-激酶活性、乙醇醛脱氢酶活性、乙醇酸脱氢酶活性、丙氨酸-乙醛酸转氨酶活性、丙氨酸转氨酶活性和NAD(P)H依赖性谷氨酸脱氢酶活性，并且其中所述一种或多种联产品包含甘氨酸。

95.根据前述实施方案中任一项所述的方法，其中与甘氨酸裂解系统相关的活性包含选自以下的酶或蛋白：甘氨酸脱羧酶(P蛋白)、氨甲基转移酶(T蛋白)、二氢硫辛酰胺脱氢酶(L蛋白)和H蛋白。

96.根据前述实施方案中任一项所述的方法，其中用于由C3途径中的DHAP或丙酮酸生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、转氨酶活性、羟基丙酮酸脱羧酶活性、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶活性、丝氨酸脱羧酶活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性、甘油酸2-激酶活性、乙醛脱氢酶活性和乙醇胺解氨酶活性，并且其中所述一种或多种联产品包含单乙醇胺(MEA)。

97.根据前述实施方案中任一项所述的方法，其中用于由C3途径中的DHAP或丙酮酸生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：丝氨酸脱氢酶活性、2-氨基丙二酸半醛脱羧酶活性、氨基乙醛转氨酶活性、2-氨基丙二酸半醛转氨酶活性、2,3-二氨基丙酸脱羧酶活性、丝氨酸脱羧酶活性、乙醇胺脱氢酶活性、丝氨酸羟甲基转移酶活性、醛氧化酶活性、N-乙酰转移酶或O-乙酰转移酶活性、N-乙酰丝氨酸脱氢酶活性、转氨酶活性、脱乙酰酶活性、丝氨酸氨基酶活性和2,3-二氨基丙酸解氨酶活性，并且其中所述一种或多种联产品包含乙二胺(EDA)。

98.根据前述实施方案中任一项所述的方法，其中用于在C2途径中生产MEG或GA的一种或多种酶选自具有选自以下的活性的一种或多种酶：D-塔格糖3-差向异构酶活性、D-核酮糖激酶活性、D-核酮糖-1-磷酸醛缩酶活性、D-木酮糖1-激酶活性、D-木酮糖-1-磷酸醛缩酶活性、木糖还原酶或醛糖还原酶活性、木糖醇脱氢酶活性、木糖异构酶活性、木糖脱氢酶活性、木糖酸内酯酶活性、木糖酸脱氢酶活性、2-酮-3-脱氧-D-戊酸醛缩酶活性、乙醇醛还原酶活性和乙醇醛脱氢酶活性。

99.根据前述实施方案中任一项所述的方法，其中所述方法进一步包括：向重组微生物中引入一种或多种修饰，以减少或缺失乙醇醛脱氢酶、乳酸脱氢酶、木糖异构酶、木酮糖激酶或其组合的活性。

100.重组微生物，其包含一种或多种生化途径，所述生化途径由一种或多种己糖原料通过一种或多种戊糖-5-磷酸中间体生产单乙二醇(MEG)或乙醇酸(GA)。

101.根据前述实施方案中任一项所述的重组微生物，其中一种或多种联产品与MEG或GA联产。

102.根据前述实施方案中任一项所述的重组微生物，其中一种或多种戊糖-5-磷酸中间体是D-核糖-5-磷酸、D-木酮糖-5-磷酸或D-核酮糖-5-磷酸中的一种或多种。

103.根据前述实施方案中任一项所述的重组微生物，其中所述一种或多种生化途径包含至少一种具有转酮醇酶活性的酶的表达。

104.根据前述实施方案中任一项所述的重组微生物，其中所述至少一种具有转酮醇酶活性的酶由与来自大肠杆菌的tktA tktB具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码。

105.根据前述实施方案中任一项所述的重组微生物，其中所述一种或多种生化途径包含至少一种具有转醛醇酶活性的酶的表达。

106.根据前述实施方案中任一项所述的重组微生物，其中所述至少一种具有转醛醇酶活性的酶由与来自大肠杆菌的talB或talB具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码。

107.根据前述实施方案中任一项所述的重组微生物，其中所述一种或多种生化途径包含至少一种具有核酮糖-5-磷酸3-差向异构酶活性的酶的表达。

108.根据前述实施方案中任一项所述的重组微生物，其中所述至少一种具有核酮糖-5-磷酸3-差向异构酶活性的酶由与来自大肠杆菌的rpe具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码。

109.根据前述实施方案中任一项所述的重组微生物，其中所述一种或多种生化途径包含至少一种具有核糖-5-磷酸异构酶活性的酶的表达。

110.根据前述实施方案中任一项所述的重组微生物，其中所述至少一种具有核糖-5-磷酸异构酶活性的酶由与来自大肠杆菌的rpiA或rpiB具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码。

111.根据前述实施方案中任一项所述的重组微生物，其中所述重组微生物进一步包含至少一种内源性酶的缺失或降低的活性，所述内源性酶选自甘油醛3-磷酸脱氢酶、磷酸甘油酸激酶和/或磷酸甘油酸变位酶。

112.根据前述实施方案中任一项所述的重组微生物，其中所述一种或多种生化途径包含至少一种具有果糖-6-磷酸磷酸酮醇酶活性的酶的表达。

113.根据前述实施方案中任一项所述的重组微生物，其中所述至少一种具有果糖-6-磷酸磷酸酮醇酶活性的酶由与选自以下的具有果糖-6-磷酸磷酸酮醇酶活性的酶具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码：齿双歧杆菌(Bifidobacterium dentium)BDP_1006、乳双歧杆菌(Bifidobacteriumlactis)xfp、类植物乳杆菌(Lactobacillus paraplantarum)xpkA和短双歧杆菌(Bifidobacterium breve)xfp。

114.根据前述实施方案中任一项所述的重组微生物，其中所述一种或多种生化途径包含至少一种具有磷酸乙酰转移酶活性的酶的表达。

115.根据前述实施方案中任一项所述的重组微生物，其中所述至少一种具有磷酸乙酰转移酶活性的酶由与选自以下的具有磷酸乙酰转移酶活性的酶具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性的氨基酸序列编码：大肠杆菌pta和丙酮丁醇梭菌(Clostridium acetobutylicum)pta。

116.根据前述实施方案中任一项所述的重组微生物，其中所述重组微生物进一步包含内源性酶6-磷酸果糖激酶的缺失或降低的活性。

117.根据前述实施方案中任一项所述的重组微生物，其中所述一种或多种生化途径包含至少一种具有戊糖磷酸酶活性的酶。

118.根据前述实施方案中任一项所述的重组微生物，其中所述至少一种具有戊糖磷酸酶活性的酶选自以下一种或多种：具有D-戊糖-5-磷酸酶活性的酶、具有D-木酮糖-5-磷酸酶活性的酶、具有D-核糖-5-磷酸酶活性的酶和具有D-核酮糖-5-磷酸酶活性的酶。

119.根据前述实施方案中任一项所述的重组微生物，其中所述一种或多种生化途径包含至少一种具有阿糖醇磷酸脱氢酶活性的酶。

120.根据前述实施方案中任一项所述的重组微生物，其中所述至少一种具有阿糖醇磷酸脱氢酶活性的酶选自以下一种或多种：具有D-阿糖醇1-磷酸4-脱氢酶活性的酶、具有D-阿糖醇5-磷酸2-脱氢酶活性的酶、具有D-阿糖醇1-磷酸2-脱氢酶活性的酶和具有D-阿糖醇5-磷酸4-脱氢酶活性的酶。

121.根据前述实施方案中任一项所述的重组微生物，其中所述一种或多种生化途径包含至少一种具有磷酸戊糖变位酶活性的酶。

122.根据前述实施方案中任一项所述的重组微生物，其中所述重组微生物进一步包含一种或多种内源性酶的缺失或降低的活性，所述内源性酶选自葡萄糖6-磷酸-1-脱氢酶、6-磷酸葡萄糖酸内酯酶和6-磷酸葡萄糖酸脱氢酶。

123.根据前述实施方案中任一项所述的重组微生物，其中所述一种或多种联产品选自丙酮、异丙醇、丙烯、异丁烯和一种或多种丝氨酸途径化合物。

124.根据前述实施方案中任一项所述的重组微生物，其中所述一种或多种丝氨酸途径化合物选自丝氨酸、甘氨酸、单乙醇胺(MEA)和乙二胺(EDA)。

125.根据前述实施方案中任一项所述的重组微生物，其中所述一种或多种己糖原料选自葡萄糖或葡萄糖的低聚物。

126.根据前述实施方案中任一项所述的重组微生物，其中所述葡萄糖的低聚物选自果糖、蔗糖、淀粉、纤维二糖、麦芽糖、乳糖和纤维素。

127.根据前述实施方案中任一项所述的重组微生物，其中所述具有转酮醇酶活性的酶或具有果糖-6-磷酸磷酸酮醇酶活性的酶的表达能够使一种或多种己糖原料无损转化为一种或多种戊糖-5-磷酸中间体。

128.根据前述实施方案中任一项所述的重组微生物，其中通过C2途径中乙醇醛的转化和C3途径中磷酸二羟丙酮(DHAP)或丙酮酸的转化，来生产MEG或GA。

129.根据前述实施方案中任一项所述的重组微生物，其中通过乙醇醛脱氢酶氧化乙醇醛生产GA。

130.根据前述实施方案中任一项所述的重组微生物，其中用于通过C3途径中DHAP或丙酮酸的转化生产MEG或GA的一种或多种酶选自具有选自以下的活性的一种或多种酶：3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、丝氨酸转氨酶活性、羟基丙酮酸脱羧酶活性、3-磷酸羟基丙酮酸还原酶活性、乙醇醛还原酶活性、乙醇醛脱氢酶活性、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶活性、丝氨酸脱羧酶活性、乙醇胺转氨酶或乙醇胺氧化还原酶(脱氨基)活性、甘油酸脱羧酶活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性和甘油酸2-激酶活性。

131.根据前述实施方案中任一项所述的重组微生物，其中通过C2途径中乙醇醛的转化生产MEG或GA，通过C3途径中磷酸二羟丙酮(DHAP)或丙酮酸的转化生产一种或多种联产品。

132.根据前述实施方案中任一项所述的重组微生物，其中用于通过C3途径中DHAP或丙酮酸的转化生产一种或多种联产品的一种或多种酶选自一种或多种具有选自以下的活性的酶：硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A：乙酰乙酸转移酶或乙酸：乙酰乙酰辅酶A水解酶活性和乙酰乙酸脱羧酶活性，并且其中所述一种或多种联产品包括丙酮。

133.根据前述实施方案中任一项所述的重组微生物，其中用于通过C3途径中DHAP或丙酮酸的转化生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A：乙酰乙酸转移酶或乙酸：乙酰乙酰辅酶A水解酶活性、乙酰乙酸脱羧酶活性和仲醇脱氢酶活性，并且其中所述一种或多种联产品包含异丙醇。

134.根据前述实施方案中任一项所述的重组微生物，其中用于通过C3途径中DHAP或丙酮酸的转化生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A：乙酰乙酸转移酶或乙酸：乙酰乙酰辅酶A水解酶活性、乙酰乙酸脱羧酶活性、仲醇脱氢酶活性和脱水酶-异构酶活性，并且其中所述一种或多种联产品包含丙烯。

135.根据前述实施方案中任一项所述的方法，其中用于通过C3途径中DHAP或丙酮酸的转化生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A：乙酰乙酸转移酶或乙酸：乙酰乙酰辅酶A水解酶活性、乙酰乙酸脱羧酶活性、3-羟基异戊酸(3HIV)合酶活性、羟甲基戊二酰辅酶A合酶活性、甲基戊烯二酰辅酶A水合酶活性、甲基巴豆酰辅酶A羧化酶活性、甲基巴豆酰辅酶A水合酶活性、3-羟基异戊酰辅酶A硫酯酶活性、3HIV激酶活性、3HIV-3-磷酸脱羧酶活性和3HIV脱羧酶活性，并且其中所述一种或多种联产品包含异丁烯。

136.根据前述实施方案中任一项所述的方法，其中用于通过C3途径中DHAP或丙酮酸的转化生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性和甘油酸2-激酶活性，并且其中所述一种或多种联产品包含L-丝氨酸。

137.根据前述实施方案中任一项所述的方法，其中用于通过C3途径中DHAP或丙酮酸的转化生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：丝氨酸羟甲基转移酶活性、转移酶活性、甲醛脱氢酶活性、甲酸脱氢酶活性、与甘氨酸裂解系统相关的活性、3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、丝氨酸转氨酶活性、羟基丙酮酸脱羧酶活性、丝氨酸氧化还原酶(脱氨基)活性、丝氨酸脱羧酶活性、乙醇胺转氨酶或乙醇胺氧化还原酶(脱氨基)活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性、甘油酸2-激酶活性、乙醇醛脱氢酶活性、乙醇酸脱氢酶活性、丙氨酸-乙醛酸转氨酶活性、丙氨酸转氨酶活性和NAD(P)H依赖性谷氨酸脱氢酶活性，并且其中所述一种或多种联产品包含甘氨酸。

138.根据前述实施方案中任一项所述的方法，其中与甘氨酸裂解系统相关的活性包含选自以下的酶或蛋白：甘氨酸脱羧酶(P蛋白)、氨甲基转移酶(T蛋白)、二氢硫辛酰胺脱氢酶(L蛋白)和H蛋白。

139.根据前述实施方案中任一项所述的方法，其中用于通过C3途径中DHAP或丙酮酸的转化生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、转氨酶活性、羟基丙酮酸脱羧酶活性、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶活性、丝氨酸脱羧酶活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性、甘油酸2-激酶活性、乙醛脱氢酶活性和乙醇胺解氨酶活性，并且其中所述一种或多种联产品包含单乙醇胺(MEA)。

140.根据前述实施方案中任一项所述的方法，其中用于通过C3途径中DHAP或丙酮酸的转化生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：丝氨酸脱氢酶活性、2-氨基丙二酸半醛脱羧酶活性、氨基乙醛转氨酶活性、2-氨基丙二酸半醛转氨酶活性、2,3-二氨基丙酸脱羧酶活性、丝氨酸脱羧酶活性、乙醇胺脱氢酶活性、丝氨酸羟甲基转移酶活性、醛氧化酶活性、N-乙酰转移酶或O-乙酰转移酶活性、N-乙酰丝氨酸脱氢酶活性、转氨酶活性、脱乙酰酶活性、丝氨酸氨基酶活性和2,3-二氨基丙酸解氨酶活性，并且其中所述一种或多种联产品包含乙二胺(EDA)。

141.根据前述实施方案中任一项所述的重组微生物，其中用于在C2途径中由乙醇醛生产MEG或GA的一种或多种酶选自具有选自以下的活性的一种或多种酶：D-塔格糖3-差向异构酶活性、D-核酮糖激酶活性、D-核酮糖-1-磷酸醛缩酶活性、D-木酮糖1-激酶活性、D-木酮糖-1-磷酸醛缩酶活性、木糖还原酶或醛糖还原酶活性、木糖醇脱氢酶活性、木糖异构酶活性、木糖脱氢酶活性、木糖酸内酯酶活性、木糖酸脱氢酶活性、2-酮-3-脱氧-D-戊酸醛缩酶活性、乙醇醛还原酶活性和乙醇醛脱氢酶活性。

142.根据前述实施方案中任一项所述的重组微生物，其中所述重组微生物进一步包含一种或多种修饰，以减少或缺失乙醇醛脱氢酶、乳酸脱氢酶、木糖异构酶、木酮糖激酶或其组合的活性。

143.根据前述实施方案中任一项所述的重组微生物，其中至少一部分在C3途径中生产的过量NADH用作C2途径中还原当量的来源。

144.根据前述实施方案中任一项所述的重组微生物，其中至少一部分在C3途径中生产的过量NADH用于生产ATP。

145.根据前述实施方案中任一项所述的重组微生物，其中最小化过量的生物质形成，并且最大化MEG(或GA)或MEG(或GA)和一种或多种联产品的生产。

146.使用前述实施方案中任一项所述的重组微生物生产MEG或乙醇酸(GA)的方法，其中所述方法包括在含有提供碳源的一种或多种己糖原料的培养介质中培养重组微生物，直至生产MEG或GA。

147.根据前述实施方案中任一项所述的方法，其中所述一种或多种联产品与MEG或GA联产。

148.根据前述实施方案中任一项所述的方法，其中所述一种或多种联产品选自丙酮、异丙醇、丙烯、异丁烯和一种或多种丝氨酸途径化合物。

149.根据前述实施方案中任一项所述的方法，其中所述一种或多种丝氨酸途径化合物选自丝氨酸、甘氨酸、单乙醇胺(MEA)和乙二胺(EDA)。

150.生产重组微生物的方法，所述重组微生物由一种或多种外源己糖原料通过一种或多种戊糖-5-磷酸中间体生产或积累MEG或乙醇酸(GA)，所述方法包括：

向重组微生物中引入或在重组微生物中表达一种或多种酶，所述酶用于将一种或多种己糖原料转化为一种或多种戊糖-5-磷酸中间体；

向重组微生物中引入或在重组微生物中表达一种或多种酶，所述酶用于将一种或多种戊糖-5-磷酸中间体转化为一种或多种戊糖或戊糖-1-磷酸中间体；

向重组微生物中引入或在重组微生物中表达C2途径，所述途径包括一种或多种用于由乙醇醛生产MEG或GA的酶；和

向重组微生物中引入或在重组微生物中表达C3途径，所述途径包括一种或多种用于由DHAP或丙酮酸生产MEG或GA的酶；和

151.生产重组微生物的方法，所述重组微生物由一种或多种外源己糖原料通过一种或多种戊糖-5-磷酸中间体生产或积累MEG或乙醇酸(GA)和一种或多种联产品，所述方法包括：

向重组微生物中引入或在重组微生物中表达C3途径，所述途径包括一种或多种用于由DHAP或丙酮酸生产一种或多种联产品的酶；和

152.根据前述实施方案中任一项所述的方法，其中乙醇醛通过乙醇醛脱氢酶氧化为乙醇酸。

153.根据前述实施方案中任一项所述的方法，其中用于将一种或多种己糖原料转化为一种或多种戊糖-5-磷酸中间体的一种或多种酶选自一种或多种具有以下活性的酶：转酮醇酶活性、转醛醇酶活性、核酮糖-5-磷酸3-差向异构酶活性和核糖-5-磷酸异构酶活性。

154.根据前述实施方案中任一项所述的方法，其中所述方法进一步包括向重组微生物中引入一种或多种修饰，以降低或缺失一种或多种内源性酶的活性，所述内源性酶选自甘油醛3-磷酸脱氢酶(gapA)、磷酸甘油酸激酶(pgk)和磷酸甘油酸变位酶(gpmA和/或gpmM)。

155.根据前述实施方案中任一项所述的方法，其中将一种或多种己糖原料转化为一种或多种戊糖-5-磷酸中间体的一种或多种酶选自一种或多种具有以下活性的酶：果糖-6-磷酸磷酸酮醇酶活性、磷酸乙酰转移酶活性、转酮醇酶活性、转醛醇酶活性、核酮糖-5-磷酸3-差向异构酶活性和核糖-5-磷酸异构酶活性。

156.根据前述实施方案中任一项所述的方法，其中所述方法进一步包括将一种或多种修饰引入重组微生物中，以减少或缺失内源性6-磷酸果糖激酶(pfkA和/或pfkB)酶的活性。

157.根据前述实施方案中任一项所述的方法，其中所述方法进一步包括：将一种或多种修饰引入重组微生物中，以减少或缺失一种或多种内源性酶的活性，所述内源性酶选自葡萄糖6-磷酸-1-脱氢酶、6-磷酸葡萄糖酸内酯酶和6-磷酸葡萄糖酸脱氢酶。

158.根据前述实施方案中任一项所述的方法，其中用于将一种或多种戊糖-5-磷酸中间体转化为一种或多种戊糖或戊糖-1-磷酸中间体的一种或多种酶选自一种或多种具有以下活性的酶：戊糖磷酸酶活性、D-核酮糖-5-磷酸酶活性、D-核糖-5-磷酸酶活性、D-核糖异构酶活性、阿糖醇磷酸脱氢酶活性和磷酸戊糖变位酶活性。

159.根据前述实施方案中任一项所述的方法，其中用于由C3途径中的DHAP或丙酮酸生产MEG或GA的一种或多种酶选自具有选自以下的活性的一种或多种酶：3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、丝氨酸转氨酶活性、羟基丙酮酸脱羧酶活性、3-磷酸羟基丙酮酸还原酶活性、乙醇醛还原酶活性、乙醇醛脱氢酶活性、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶活性、丝氨酸脱羧酶活性、乙醇胺转氨酶或乙醇胺氧化还原酶(脱氨基)活性、甘油酸脱羧酶活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性和甘油酸2-激酶活性。

160.根据前述实施方案中任一项所述的方法，其中用于由C3途径中的DHAP或丙酮酸生产一种或多种联产品的一种或多种酶选自一种或多种具有选自以下的活性的酶：硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A：乙酰乙酸转移酶或乙酸：乙酰乙酰辅酶A水解酶活性和乙酰乙酸脱羧酶活性，并且其中所述一种或多种联产品包括丙酮。

161.根据前述实施方案中任一项所述的方法，其中用于由C3途径中的DHAP或丙酮酸生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A：乙酰乙酸转移酶或乙酸：乙酰乙酰辅酶A水解酶活性、乙酰乙酸脱羧酶活性和仲醇脱氢酶活性，并且其中所述一种或多种联产品包含异丙醇。

162.根据前述实施方案中任一项所述的方法，其中用于由C3途径中的DHAP或丙酮酸生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A：乙酰乙酸转移酶或乙酸：乙酰乙酰辅酶A水解酶活性、乙酰乙酸脱羧酶活性、仲醇脱氢酶活性和脱水酶活性，并且其中所述一种或多种联产品包含丙烯。

163.根据前述实施方案中任一项所述的方法，其中用于由C3途径中的DHAP或丙酮酸生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A：乙酰乙酸转移酶或乙酸：乙酰乙酰辅酶A水解酶活性、乙酰乙酸脱羧酶活性、3-羟基异戊酸(3HIV)合酶活性、羟甲基戊二酰辅酶A合酶活性、甲基戊烯二酰辅酶A水合酶活性、甲基巴豆酰辅酶A羧化酶活性、甲基巴豆酰辅酶A水合酶活性、3-羟基异戊酰辅酶A硫酯酶活性、3HIV激酶活性、3HIV-3-磷酸脱羧酶活性和3HIV脱羧酶活性，并且其中所述一种或多种联产品包含异丁烯。

164.根据前述实施方案中任一项所述的方法，其中用于由C3途径中的DHAP或丙酮酸生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性和甘油酸2-激酶活性，并且其中所述一种或多种联产品包含L-丝氨酸。

165.根据前述实施方案中任一项所述的方法，其中用于由C3途径中的DHAP或丙酮酸生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：丝氨酸羟甲基转移酶活性、转移酶活性、甲醛脱氢酶活性、甲酸脱氢酶活性、与甘氨酸裂解系统相关的活性、3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、丝氨酸转氨酶活性、羟基丙酮酸脱羧酶活性、丝氨酸氧化还原酶(脱氨基)活性、丝氨酸脱羧酶活性、乙醇胺转氨酶或乙醇胺氧化还原酶(脱氨基)活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性、甘油酸2-激酶活性、乙醇醛脱氢酶活性、乙醇酸脱氢酶活性、丙氨酸-乙醛酸转氨酶活性、丙氨酸转氨酶活性和NAD(P)H依赖性谷氨酸脱氢酶活性，并且其中所述一种或多种联产品包含甘氨酸。

166.根据前述实施方案中任一项所述的方法，其中与甘氨酸裂解系统相关的活性包含选自以下的酶或蛋白：甘氨酸脱羧酶(P蛋白)、氨甲基转移酶(T蛋白)、二氢硫辛酰胺脱氢酶(L蛋白)和H蛋白。

167.根据前述实施方案中任一项所述的方法，其中用于由C3途径中的DHAP或丙酮酸生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、转氨酶活性、羟基丙酮酸脱羧酶活性、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶活性、丝氨酸脱羧酶活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性、甘油酸2-激酶活性、乙醛脱氢酶活性和乙醇胺解氨酶活性，并且其中所述一种或多种联产品包含单乙醇胺(MEA)。

168.根据前述实施方案中任一项所述的方法，其中用于由C3途径中的DHAP或丙酮酸生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：丝氨酸脱氢酶活性、2-氨基丙二酸半醛脱羧酶活性、氨基乙醛转氨酶活性、2-氨基丙二酸半醛转氨酶活性、2,3-二氨基丙酸脱羧酶活性、丝氨酸脱羧酶活性、乙醇胺脱氢酶活性、丝氨酸羟甲基转移酶活性、醛氧化酶活性、N-乙酰转移酶或O-乙酰转移酶活性、N-乙酰丝氨酸脱氢酶活性、转氨酶活性、脱乙酰酶活性、丝氨酸氨基酶活性和2,3-二氨基丙酸解氨酶活性，并且其中所述一种或多种联产品包含乙二胺(EDA)。

169.根据前述实施方案中任一项所述的方法，其中用于在C2途径中生产MEG或GA的一种或多种酶选自具有选自以下的活性的一种或多种酶：D-塔格糖3-差向异构酶活性、D-核酮糖激酶活性、D-核酮糖-1-磷酸醛缩酶活性、D-木酮糖1-激酶活性、D-木酮糖-1-磷酸醛缩酶活性、木糖还原酶或醛糖还原酶活性、木糖醇脱氢酶活性、木糖异构酶活性、木糖脱氢酶活性、木糖酸内酯酶活性、木糖酸脱氢酶活性、2-酮-3-脱氧-D-戊酸醛缩酶活性、乙醇醛还原酶活性和乙醇醛脱氢酶活性。

170.根据前述实施方案中任一项所述的方法，其中所述方法进一步包括：向重组微生物中引入一种或多种修饰，以减少或缺失乙醇醛脱氢酶、乳酸脱氢酶、木糖异构酶、木酮糖激酶或其组合的活性。

给出上述详细描述只是为了清楚理解，不应由此理解不必要的限制，因为修改对于本领域技术人员来说将是显而易见的。

虽然已经结合其具体实施方案描述了本公开，但将理解，本公开能够进一步修改，并且本申请旨在涵盖一般地遵循本公开的原理的本公开的任何变化、用途或调整，以及包括此类对本公开的偏离，只要它在本公开所属领域内的已知或惯常实践范围内，并且可应用上文所列出的和遵循所附权利要求的范围的基本特征。

本文引用的每项专利、专利申请和出版物的公开内容，包括权利要求、附图(figures)和/或附图(drawings)，均通过引用整体并入本文。

通过引用并入

本文引用的所有参考文献、文章、出版物、专利、专利公开和专利申请均出于所有目的通过引用整体并入。然而，此处引用的任何参考文献、文章、出版物、专利、专利公开和专利申请的提及不是也不应被视为承认或任何形式的暗示其构成有效的现有技术或构成世界上任何国家的公知常识的一部分。此外，以下参考文献通过引用并入本文。见PCT公开WO2001053306；美国专利No.7,226,761B2；和EPO公开No.EP2957640。

序列表

<110> 布拉斯科公司

<120> 用于由己糖生产含氧化合物的微生物和方法

<130> BRSK-004/02WO (331051-2064)

<150> 62/808,247

<151> 2019-02-20

<160> 258

<170> PatentIn version 3.5

<210> 1

<211> 873

<212> DNA

<213> 菊苣假单胞菌（Pseudomonas cichorii）

<400> 1

gtgaacaaag ttggcatgtt ctacacctac tggtcgactg agtggatggt cgactttccg 60

gcgactgcga agcgcattgc cgggctcggc ttcgacttaa tggaaatctc gctcggcgag 120

tttcacaatc tttccgacgc gaagaagcgt gagctaaaag ccgtggctga tgatctgggg 180

ctcacggtga tgtgctgtat cggactgaag tctgagtacg actttgcctc gccggacaag 240

agcgttcgtg atgccggcac ggaatatgtg aagcgcttgc tcgacgactg tcacctcctc 300

ggcgcgccgg tctttgctgg ccttacgttc tgcgcgtggc cccaatctcc gccgctggac 360

atgaaggata agcgccctta cgtcgaccgt gcaatcgaaa gcgttcgtcg tgttatcaag 420

gtagctgaag actacggcat tatttatgca ctggaagtgg tgaaccgatt cgagcagtgg 480

ctttgcaatg acgccaagga agcaattgcg tttgccgacg cggttgacag tccggcgtgc 540

aaggtccagc tcgacacatt ccacatgaat atcgaagaga cttccttccg cgatgcaatc 600

cttgcctgca agggcaagat gggccatttc catttgggcg aagcgaaccg tctgccgccg 660

ggcgagggtc gcctgccgtg ggatgaaata ttcggggcgc tgaaggaaat cggatatgac 720

ggcaccatcg ttatggaacc gttcatgcgc aagggcggct cggtcagccg cgcggtgggc 780

gtatggcggg atatgtcgaa cggtgcgacg gacgaagaga tggacgagcg cgctcgccgc 840

tcgttgcagt ttgttcgtga caagctggcc tga 873

<210> 2

<211> 873

<212> DNA

<213> 人工序列

<220>

<223> 密码子优化的菊苣假单胞菌序列

<400> 2

atgaacaaag tgggtatgtt ctatacgtac tggtccacgg aatggatggt tgactttccg 60

gcaaccgcga aacgtattgc gggcctgggc ttcgacctga tggaaatttc tctgggcgaa 120

tttcacaacc tgtccgatgc gaaaaagcgt gaactgaaag ccgttgccga cgatctgggt 180

ctgactgtga tgtgctgtat cggcctgaaa tctgaatacg atttcgcgag cccggataaa 240

agcgttcgcg acgccggtac tgaatatgtc aaacgtctgc tggatgactg tcacctgctg 300

ggcgcaccag tgttcgcggg tctgaccttc tgtgcgtggc cgcagtcccc accgctggac 360

atgaaggata aacgtccgta cgtggaccgt gccatcgaaa gcgtgcgccg cgtaatcaaa 420

gtcgctgaag attatggcat tatttacgct ctggaagttg ttaaccgttt cgaacagtgg 480

ctgtgcaacg acgcgaaaga ggccattgcc ttcgctgacg cggtggattc tccggcttgc 540

aaagttcagc tggacacttt ccatatgaac atcgaggaaa cctccttccg tgacgcgatc 600

ctggcttgca agggtaaaat gggccatttc catctgggcg aagcaaaccg cctgccgccg 660

ggcgaaggtc gtctgccgtg ggacgaaatt tttggcgctc tgaaggaaat cggctacgat 720

ggcacgattg ttatggagcc gttcatgcgc aaaggtggct ccgtttcccg tgcagttggt 780

gtttggcgtg atatgtctaa cggtgccacc gatgaagaaa tggacgaacg tgcacgtcgc 840

tccctgcaat tcgttcgcga taaactggcg taa 873

<210> 3

<211> 290

<212> PRT

<213> 菊苣假单胞菌

<400> 3

Met Asn Lys Val Gly Met Phe Tyr Thr Tyr Trp Ser Thr Glu Trp Met

1 5 10 15

Val Asp Phe Pro Ala Thr Ala Lys Arg Ile Ala Gly Leu Gly Phe Asp

20 25 30

Leu Met Glu Ile Ser Leu Gly Glu Phe His Asn Leu Ser Asp Ala Lys

35 40 45

Lys Arg Glu Leu Lys Ala Val Ala Asp Asp Leu Gly Leu Thr Val Met

50 55 60

Cys Cys Ile Gly Leu Lys Ser Glu Tyr Asp Phe Ala Ser Pro Asp Lys

65 70 75 80

Ser Val Arg Asp Ala Gly Thr Glu Tyr Val Lys Arg Leu Leu Asp Asp

85 90 95

Cys His Leu Leu Gly Ala Pro Val Phe Ala Gly Leu Thr Phe Cys Ala

100 105 110

Trp Pro Gln Ser Pro Pro Leu Asp Met Lys Asp Lys Arg Pro Tyr Val

115 120 125

Asp Arg Ala Ile Glu Ser Val Arg Arg Val Ile Lys Val Ala Glu Asp

130 135 140

Tyr Gly Ile Ile Tyr Ala Leu Glu Val Val Asn Arg Phe Glu Gln Trp

145 150 155 160

Leu Cys Asn Asp Ala Lys Glu Ala Ile Ala Phe Ala Asp Ala Val Asp

165 170 175

Ser Pro Ala Cys Lys Val Gln Leu Asp Thr Phe His Met Asn Ile Glu

180 185 190

Glu Thr Ser Phe Arg Asp Ala Ile Leu Ala Cys Lys Gly Lys Met Gly

195 200 205

His Phe His Leu Gly Glu Ala Asn Arg Leu Pro Pro Gly Glu Gly Arg

210 215 220

Leu Pro Trp Asp Glu Ile Phe Gly Ala Leu Lys Glu Ile Gly Tyr Asp

225 230 235 240

Gly Thr Ile Val Met Glu Pro Phe Met Arg Lys Gly Gly Ser Val Ser

245 250 255

Arg Ala Val Gly Val Trp Arg Asp Met Ser Asn Gly Ala Thr Asp Glu

260 265 270

Glu Met Asp Glu Arg Ala Arg Arg Ser Leu Gln Phe Val Arg Asp Lys

275 280 285

Leu Ala

290

<210> 4

<211> 888

<212> DNA

<213> 类球红细菌（Rhodobacter sphaeroides）

<400> 4

gtgaaaaatc ctgtcggcat catctcgatg cagttcatcc ggcccttcac ctcggagtcg 60

ctgcatttcc tgaagaagtc ccgggccctg ggcttcgatt tcatcgagct tctcgtgccc 120

gagcccgaag acgggctcga cgcggccgag gtgcggcgca tctgcgaggg cgaggggctg 180

ggcctcgttc tggccgcgcg cgtgaacctc cagcgctcga tcgcgagcga ggaggccgcg 240

gcgcgggccg gcgggcgcga ctatctgaaa tactgcatcg aggccgccga ggcgctcggc 300

gcgaccatcg tcggcggccc gctctatggc gagccgctgg tcttcgccgg ccgcccgccc 360

ttcccctgga cggccgagca gatcgccacc cgcgccgccc gcaccgtcga ggggctggcc 420

gaagtggccc cgctcgccgc gagcgcgggc aaggtcttcg ggctcgagcc gctgaaccgc 480

ttcgagaccg acatcgtgaa cacgaccgca caggccatcg aggtggtgga tgcggtgggc 540

tcgcccggtc tcggcgtcat gctcgacacg ttccacatga acatggagga acgctcgatc 600

cccgatgcga tccgcgccac aggcgcgcgc ctcgtccatt ttcaggccaa cgagaaccac 660

cgcggcttcc ccggcaccgg caccatggac tggacggcca tcgcgcgggc gctggggcag 720

gcgggctacg cgggtccggt ctcgctcgag cctttccggc gcgacgacga gcgcgtggcg 780

ctgcccatcg cccactggcg cgccccgcac gaggacgagg acgagaagct gcgcgcgggg 840

ctgggtctca tccgctccgc gatcaccctg gcggaggtga cccactga 888

<210> 5

<211> 295

<212> PRT

<213> 类球红细菌

<400> 5

Met Lys Asn Pro Val Gly Ile Ile Ser Met Gln Phe Ile Arg Pro Phe

1 5 10 15

Thr Ser Glu Ser Leu His Phe Leu Lys Lys Ser Arg Ala Leu Gly Phe

20 25 30

Asp Phe Ile Glu Leu Leu Val Pro Glu Pro Glu Asp Gly Leu Asp Ala

35 40 45

Ala Glu Val Arg Arg Ile Cys Glu Gly Glu Gly Leu Gly Leu Val Leu

50 55 60

Ala Ala Arg Val Asn Leu Gln Arg Ser Ile Ala Ser Glu Glu Ala Ala

65 70 75 80

Ala Arg Ala Gly Gly Arg Asp Tyr Leu Lys Tyr Cys Ile Glu Ala Ala

85 90 95

Glu Ala Leu Gly Ala Thr Ile Val Gly Gly Pro Leu Tyr Gly Glu Pro

100 105 110

Leu Val Phe Ala Gly Arg Pro Pro Phe Pro Trp Thr Ala Glu Gln Ile

115 120 125

Ala Thr Arg Ala Ala Arg Thr Val Glu Gly Leu Ala Glu Val Ala Pro

130 135 140

Leu Ala Ala Ser Ala Gly Lys Val Phe Gly Leu Glu Pro Leu Asn Arg

145 150 155 160

Phe Glu Thr Asp Ile Val Asn Thr Thr Ala Gln Ala Ile Glu Val Val

165 170 175

Asp Ala Val Gly Ser Pro Gly Leu Gly Val Met Leu Asp Thr Phe His

180 185 190

Met Asn Met Glu Glu Arg Ser Ile Pro Asp Ala Ile Arg Ala Thr Gly

195 200 205

Ala Arg Leu Val His Phe Gln Ala Asn Glu Asn His Arg Gly Phe Pro

210 215 220

Gly Thr Gly Thr Met Asp Trp Thr Ala Ile Ala Arg Ala Leu Gly Gln

225 230 235 240

Ala Gly Tyr Ala Gly Pro Val Ser Leu Glu Pro Phe Arg Arg Asp Asp

245 250 255

Glu Arg Val Ala Leu Pro Ile Ala His Trp Arg Ala Pro His Glu Asp

260 265 270

Glu Asp Glu Lys Leu Arg Ala Gly Leu Gly Leu Ile Arg Ser Ala Ile

275 280 285

Thr Leu Ala Glu Val Thr His

290 295

<210> 6

<211> 1422

<212> DNA

<213> 大肠杆菌（Escherichia coli）

<400> 6

atgatgaaac aagaagttat cctggtactc gactgtggcg cgaccaatgt cagggccatc 60

gcggttaatc ggcagggcaa aattgttgcc cgcgcctcaa cgcctaatgc cagcgatatc 120

gcgatggaaa acaacacctg gcaccagtgg tctttagacg ccattttgca acgctttgct 180

gattgctgtc ggcaaatcaa tagtgaactg actgaatgcc acatccgcgg tatcgccgtc 240

accacctttg gtgtggatgg cgctctggta gataagcaag gcaatctgct ctatccgatt 300

attagctgga aatgtccgcg aacagcagcg gttatggaca atattgaacg gttaatctcc 360

gcacagcggt tgcaggctat ttctggcgtc ggagccttta gtttcaatac gttatataag 420

ttggtgtggt tgaaagaaaa tcatccacaa ctgctggaac gcgcgcacgc ctggctcttt 480

atttcgtcgc tgattaacca ccgtttaacc ggcgaattca ctactgatat cacgatggcc 540

ggaaccagcc agatgctgga tatccagcaa cgcgatttca gtccgcaaat tttacaagcc 600

accggtattc cacgccgact cttccctcgt ctggtggaag cgggtgaaca gattggtacg 660

ctacagaaca gcgccgcagc aatgctcggc ttacccgttg gcataccggt gatttccgca 720

ggtcacgata cccagttcgc cctttttggc gctggtgctg aacaaaatga acccgtgctc 780

tcttccggta catgggaaat tttaatggtt cgcagcgccc aggttgatac ttcgctgtta 840

agtcagtacg ccggttccac ctgcgaactg gatagccagg cagggttgta taacccaggt 900

atgcaatggc tggcatccgg cgtgctggaa tgggtgagaa aactgttctg gacggctgaa 960

acaccctggc aaatgttgat tgaagaagct cgtctgatcg cgcctggcgc ggatggcgta 1020

aaaatgcagt gtgatttatt gtcgtgtcag aacgctggct ggcaaggagt gacgcttaat 1080

accacgcggg ggcatttcta tcgcgcggcg ctggaagggt taactgcgca attacagcgc 1140

aatctacaga tgctggaaaa aatcgggcac tttaaggcct ctgaattatt gttagtcggt 1200

ggaggaagtc gcaacacatt gtggaatcag attaaagcca atatgcttga tattccggta 1260

aaagttctcg acgacgccga aacgaccgtc gcaggagctg cgctgttcgg ttggtatggc 1320

gtaggggaat ttaacagccc ggaagaagcc cgcgcacaga ttcattatca gtaccgttat 1380

ttctacccgc aaactgaacc tgaatttata gaggaagtgt ga 1422

<210> 7

<211> 1422

<212> DNA

<213> 人工序列

<220>

<223> 密码子优化的大肠杆菌序列

<400> 7

atgatgaaac aagaagttat cctggtactc gactgtggcg cgaccaatgt cagggccatc 60

gcggttaatc ggcagggcaa aattgttgcc cgcgcctcaa cgcctaatgc cagcgatatc 120

gcgatggaaa acaacacctg gcaccagtgg tctttagacg ccattttgca acgctttgct 180

gattgctgtc ggcaaatcaa tagtgaactg actgaatgcc acatccgcgg tatcgccgtc 240

accacctttg gtgtggatgg cgctctggta gataagcaag gcaatctgct ctatccgatt 300

attagctgga aatgtccgcg aacagcagcg gttatggaca atattgaacg gttaatctcc 360

gcacagcggt tgcaggctat ttctggcgtc ggagccttta gtttcaatac gttatataag 420

ttggtgtggt tgaaagaaaa tcatccacaa ctgctggaac gcgcgcacgc ctggctcttt 480

atttcgtcgc tgattaacca ccgtttaacc ggcgaattca ctactgatat cacgatggcc 540

ggaaccagcc agatgctgga tatccagcaa cgcgatttca gtccgcaaat tttacaagcc 600

accggtattc cacgccgact cttccctcgt ctggtggaag cgggtgaaca gattggtacg 660

ctacagaaca gcgccgcagc aatgctcggc ttacccgttg gcataccggt gatttccgca 720

ggtcacgata cccagttcgc cctttttggc gctggtgctg aacaaaatga acccgtgctc 780

tcttccggta catgggaaat tttaatggtt cgcagcgccc aggttgatac ttcgctgtta 840

agtcagtacg ccggttccac ctgcgaactg gatagccagg cagggttgta taacccaggt 900

atgcaatggc tggcatccgg cgtgctggaa tgggtgagaa aactgttctg gacggctgaa 960

acaccctggc aaatgttgat tgaagaagct cgtctgatcg cgcctggcgc ggatggcgta 1020

aaaatgcagt gtgatttatt gtcgtgtcag aacgctggct ggcaaggagt gacgcttaat 1080

accacgcggg ggcatttcta tcgcgcggcg ctggaagggt taactgcgca attacagcgc 1140

aatctacaga tgctggaaaa aatcgggcac tttaaggcct ctgaattatt gttagtcggt 1200

ggaggaagtc gcaacacatt gtggaatcag attaaagcca atatgcttga tattccggta 1260

aaagttctcg acgacgccga aacgaccgtc gcaggagctg cgctgttcgg ttggtatggc 1320

gtaggggaat ttaacagccc ggaagaagcc cgcgcacaga ttcattatca gtaccgttat 1380

ttctacccgc aaactgaacc tgaatttata gaggaagtgt ga 1422

<210> 8

<211> 473

<212> PRT

<213> 大肠杆菌

<400> 8

Met Met Lys Gln Glu Val Ile Leu Val Leu Asp Cys Gly Ala Thr Asn

1 5 10 15

Val Arg Ala Ile Ala Val Asn Arg Gln Gly Lys Ile Val Ala Arg Ala

20 25 30

Ser Thr Pro Asn Ala Ser Asp Ile Ala Met Glu Asn Asn Thr Trp His

35 40 45

Gln Trp Ser Leu Asp Ala Ile Leu Gln Arg Phe Ala Asp Cys Cys Arg

50 55 60

Gln Ile Asn Ser Glu Leu Thr Glu Cys His Ile Arg Gly Ile Ala Val

65 70 75 80

Thr Thr Phe Gly Val Asp Gly Ala Leu Val Asp Lys Gln Gly Asn Leu

85 90 95

Leu Tyr Pro Ile Ile Ser Trp Lys Cys Pro Arg Thr Ala Ala Val Met

100 105 110

Asp Asn Ile Glu Arg Leu Ile Ser Ala Gln Arg Leu Gln Ala Ile Ser

115 120 125

Gly Val Gly Ala Phe Ser Phe Asn Thr Leu Tyr Lys Leu Val Trp Leu

130 135 140

Lys Glu Asn His Pro Gln Leu Leu Glu Arg Ala His Ala Trp Leu Phe

145 150 155 160

Ile Ser Ser Leu Ile Asn His Arg Leu Thr Gly Glu Phe Thr Thr Asp

165 170 175

Ile Thr Met Ala Gly Thr Ser Gln Met Leu Asp Ile Gln Gln Arg Asp

180 185 190

Phe Ser Pro Gln Ile Leu Gln Ala Thr Gly Ile Pro Arg Arg Leu Phe

195 200 205

Pro Arg Leu Val Glu Ala Gly Glu Gln Ile Gly Thr Leu Gln Asn Ser

210 215 220

Ala Ala Ala Met Leu Gly Leu Pro Val Gly Ile Pro Val Ile Ser Ala

225 230 235 240

Gly His Asp Thr Gln Phe Ala Leu Phe Gly Ala Gly Ala Glu Gln Asn

245 250 255

Glu Pro Val Leu Ser Ser Gly Thr Trp Glu Ile Leu Met Val Arg Ser

260 265 270

Ala Gln Val Asp Thr Ser Leu Leu Ser Gln Tyr Ala Gly Ser Thr Cys

275 280 285

Glu Leu Asp Ser Gln Ala Gly Leu Tyr Asn Pro Gly Met Gln Trp Leu

290 295 300

Ala Ser Gly Val Leu Glu Trp Val Arg Lys Leu Phe Trp Thr Ala Glu

305 310 315 320

Thr Pro Trp Gln Met Leu Ile Glu Glu Ala Arg Leu Ile Ala Pro Gly

325 330 335

Ala Asp Gly Val Lys Met Gln Cys Asp Leu Leu Ser Cys Gln Asn Ala

340 345 350

Gly Trp Gln Gly Val Thr Leu Asn Thr Thr Arg Gly His Phe Tyr Arg

355 360 365

Ala Ala Leu Glu Gly Leu Thr Ala Gln Leu Gln Arg Asn Leu Gln Met

370 375 380

Leu Glu Lys Ile Gly His Phe Lys Ala Ser Glu Leu Leu Leu Val Gly

385 390 395 400

Gly Gly Ser Arg Asn Thr Leu Trp Asn Gln Ile Lys Ala Asn Met Leu

405 410 415

Asp Ile Pro Val Lys Val Leu Asp Asp Ala Glu Thr Thr Val Ala Gly

420 425 430

Ala Ala Leu Phe Gly Trp Tyr Gly Val Gly Glu Phe Asn Ser Pro Glu

435 440 445

Glu Ala Arg Ala Gln Ile His Tyr Gln Tyr Arg Tyr Phe Tyr Pro Gln

450 455 460

Thr Glu Pro Glu Phe Ile Glu Glu Val

465 470

<210> 9

<211> 648

<212> DNA

<213> 大肠杆菌

<400> 9

atggaacgaa ataaacttgc tcgtcagatt attgacactt gcctggaaat gacccgcctg 60

ggactgaacc aggggacagc ggggaacgtc agtgtacgtt atcaggatgg gatgctgatt 120

acgcctacag gcattccata tgaaaaactg acggagtcgc atattgtctt tattgatggc 180

aacggtaaac atgaggaagg aaagctcccc tcaagcgaat ggcgtttcca tatggcagcc 240

tatcaaagca gaccggatgc caacgcggtt gttcacaatc atgccgttca ttgcacggca 300

gtttccattc ttaaccgatc gatccccgct attcactaca tgattgcggc ggctggcggt 360

aattctattc cttgcgcgcc ttatgcgacc tttggaacac gcgaactttc tgaacatgtt 420

gcgctggctc tcaaaaatcg taaggcaact ttgttacaac atcatgggct tatcgcttgt 480

gaggtgaatc tggaaaaagc gttatggctg gcgcatgaag ttgaagtgct ggcgcaactt 540

tacctgacga ccctggcgat tacggacccg gtgccagtgc tgagcgatga agagattgcc 600

gtagtgctgg agaaattcaa aacctatggg ttacgaattg aagagtaa 648

<210> 10

<211> 648

<212> DNA

<213> 大肠杆菌

<400> 10

atggaacgaa ataaacttgc tcgtcagatt attgacactt gcctggaaat gacccgcctg 60

ggactgaacc aggggacagc ggggaacgtc agtgtacgtt atcaggatgg gatgctgatt 120

acgcctacag gcattccata tgaaaaactg acggagtcgc atattgtctt tattgatggc 180

aacggtaaac atgaggaagg aaagctcccc tcaagcgaat ggcgtttcca tatggcagcc 240

tatcaaagca gaccggatgc caacgcggtt gttcacaatc atgccgttca ttgcacggca 300

gtttccattc ttaaccgatc gatccccgct attcactaca tgattgcggc ggctggcggt 360

aattctattc cttgcgcgcc ttatgcgacc tttggaacac gcgaactttc tgaacatgtt 420

gcgctggctc tcaaaaatcg taaggcaact ttgttacaac atcatgggct tatcgcttgt 480

gaggtgaatc tggaaaaagc gttatggctg gcgcatgaag ttgaagtgct ggcgcaactt 540

tacctgacga ccctggcgat tacggacccg gtgccagtgc tgagcgatga agagattgcc 600

gtagtgctgg agaaattcaa aacctatggg ttacgaattg aagagtaa 648

<210> 11

<211> 215

<212> PRT

<213> 大肠杆菌

<400> 11

Met Glu Arg Asn Lys Leu Ala Arg Gln Ile Ile Asp Thr Cys Leu Glu

1 5 10 15

Met Thr Arg Leu Gly Leu Asn Gln Gly Thr Ala Gly Asn Val Ser Val

20 25 30

Arg Tyr Gln Asp Gly Met Leu Ile Thr Pro Thr Gly Ile Pro Tyr Glu

35 40 45

Lys Leu Thr Glu Ser His Ile Val Phe Ile Asp Gly Asn Gly Lys His

50 55 60

Glu Glu Gly Lys Leu Pro Ser Ser Glu Trp Arg Phe His Met Ala Ala

65 70 75 80

Tyr Gln Ser Arg Pro Asp Ala Asn Ala Val Val His Asn His Ala Val

85 90 95

His Cys Thr Ala Val Ser Ile Leu Asn Arg Ser Ile Pro Ala Ile His

100 105 110

Tyr Met Ile Ala Ala Ala Gly Gly Asn Ser Ile Pro Cys Ala Pro Tyr

115 120 125

Ala Thr Phe Gly Thr Arg Glu Leu Ser Glu His Val Ala Leu Ala Leu

130 135 140

Lys Asn Arg Lys Ala Thr Leu Leu Gln His His Gly Leu Ile Ala Cys

145 150 155 160

Glu Val Asn Leu Glu Lys Ala Leu Trp Leu Ala His Glu Val Glu Val

165 170 175

Leu Ala Gln Leu Tyr Leu Thr Thr Leu Ala Ile Thr Asp Pro Val Pro

180 185 190

Val Leu Ser Asp Glu Glu Ile Ala Val Val Leu Glu Lys Phe Lys Thr

195 200 205

Tyr Gly Leu Arg Ile Glu Glu

210 215

<210> 12

<211> 1104

<212> DNA

<213> 大肠杆菌

<400> 12

atggaccgca ttattcaatc accgggtaaa tacatccagg gcgctgatgt gattaatcgt 60

ctgggcgaat acctgaagcc gctggcagaa cgctggttag tggtgggtga caaatttgtt 120

ttaggttttg ctcaatccac tgtcgagaaa agctttaaag atgctggact ggtagtagaa 180

attgcgccgt ttggcggtga atgttcgcaa aatgagatcg accgtctgcg tggcatcgcg 240

gagactgcgc agtgtggcgc aattctcggt atcggtggcg gaaaaaccct cgatactgcc 300

aaagcactgg cacatttcat gggtgttccg gtagcgatcg caccgactat cgcctctacc 360

gatgcaccgt gcagcgcatt gtctgttatc tacaccgatg agggtgagtt tgaccgctat 420

ctgctgttgc caaataaccc gaatatggtc attgtcgaca ccaaaatcgt cgctggcgca 480

cctgcacgtc tgttagcggc gggtatcggc gatgcgctgg caacctggtt tgaagcgcgt 540

gcctgctctc gtagcggcgc gaccaccatg gcgggcggca agtgcaccca ggctgcgctg 600

gcactggctg aactgtgcta caacaccctg ctggaagaag gcgaaaaagc gatgcttgct 660

gccgaacagc atgtagtgac tccggcgctg gagcgcgtga ttgaagcgaa cacctatttg 720

agcggtgttg gttttgaaag tggtggtctg gctgcggcgc acgcagtgca taacggcctg 780

accgctatcc cggacgcgca tcactattat cacggtgaaa aagtggcatt cggtacgctg 840

acgcagctgg ttctggaaaa tgcgccggtg gaggaaatcg aaaccgtagc tgcccttagc 900

catgcggtag gtttgccaat aactctcgct caactggata ttaaagaaga tgtcccggcg 960

aaaatgcgaa ttgtggcaga agcggcatgt gcagaaggtg aaaccattca caacatgcct 1020

ggcggcgcga cgccagatca ggtttacgcc gctctgctgg tagccgacca gtacggtcag 1080

cgtttcctgc aagagtggga ataa 1104

<210> 13

<211> 367

<212> PRT

<213> 大肠杆菌

<400> 13

Met Asp Arg Ile Ile Gln Ser Pro Gly Lys Tyr Ile Gln Gly Ala Asp

1 5 10 15

Val Ile Asn Arg Leu Gly Glu Tyr Leu Lys Pro Leu Ala Glu Arg Trp

20 25 30

Leu Val Val Gly Asp Lys Phe Val Leu Gly Phe Ala Gln Ser Thr Val

35 40 45

Glu Lys Ser Phe Lys Asp Ala Gly Leu Val Val Glu Ile Ala Pro Phe

50 55 60

Gly Gly Glu Cys Ser Gln Asn Glu Ile Asp Arg Leu Arg Gly Ile Ala

65 70 75 80

Glu Thr Ala Gln Cys Gly Ala Ile Leu Gly Ile Gly Gly Gly Lys Thr

85 90 95

Leu Asp Thr Ala Lys Ala Leu Ala His Phe Met Gly Val Pro Val Ala

100 105 110

Ile Ala Pro Thr Ile Ala Ser Thr Asp Ala Pro Cys Ser Ala Leu Ser

115 120 125

Val Ile Tyr Thr Asp Glu Gly Glu Phe Asp Arg Tyr Leu Leu Leu Pro

130 135 140

Asn Asn Pro Asn Met Val Ile Val Asp Thr Lys Ile Val Ala Gly Ala

145 150 155 160

Pro Ala Arg Leu Leu Ala Ala Gly Ile Gly Asp Ala Leu Ala Thr Trp

165 170 175

Phe Glu Ala Arg Ala Cys Ser Arg Ser Gly Ala Thr Thr Met Ala Gly

180 185 190

Gly Lys Cys Thr Gln Ala Ala Leu Ala Leu Ala Glu Leu Cys Tyr Asn

195 200 205

Thr Leu Leu Glu Glu Gly Glu Lys Ala Met Leu Ala Ala Glu Gln His

210 215 220

Val Val Thr Pro Ala Leu Glu Arg Val Ile Glu Ala Asn Thr Tyr Leu

225 230 235 240

Ser Gly Val Gly Phe Glu Ser Gly Gly Leu Ala Ala Ala His Ala Val

245 250 255

His Asn Gly Leu Thr Ala Ile Pro Asp Ala His His Tyr Tyr His Gly

260 265 270

Glu Lys Val Ala Phe Gly Thr Leu Thr Gln Leu Val Leu Glu Asn Ala

275 280 285

Pro Val Glu Glu Ile Glu Thr Val Ala Ala Leu Ser His Ala Val Gly

290 295 300

Leu Pro Ile Thr Leu Ala Gln Leu Asp Ile Lys Glu Asp Val Pro Ala

305 310 315 320

Lys Met Arg Ile Val Ala Glu Ala Ala Cys Ala Glu Gly Glu Thr Ile

325 330 335

His Asn Met Pro Gly Gly Ala Thr Pro Asp Gln Val Tyr Ala Ala Leu

340 345 350

Leu Val Ala Asp Gln Tyr Gly Gln Arg Phe Leu Gln Glu Trp Glu

355 360 365

<210> 14

<211> 1029

<212> DNA

<213> 酿酒酵母（Saccharomyces cerevisiae）

<400> 14

atgtcagttt tcgtttcagg tgctaacggg ttcattgccc aacacattgt cgatctcctg 60

ttgaaggaag actataaggt catcggttct gccagaagtc aagaaaaggc cgagaattta 120

acggaggcct ttggtaacaa cccaaaattc tccatggaag ttgtcccaga catatctaag 180

ctggacgcat ttgaccatgt tttccaaaag cacggcaagg atatcaagat agttctacat 240

acggcctctc cattctgctt tgatatcact gacagtgaac gcgatttatt aattcctgct 300

gtgaacggtg ttaagggaat tctccactca attaaaaaat acgccgctga ttctgtagaa 360

cgtgtagttc tcacctcttc ttatgcagct gtgttcgata tggcaaaaga aaacgataag 420

tctttaacat ttaacgaaga atcctggaac ccagctacct gggagagttg ccaaagtgac 480

ccagttaacg cctactgtgg ttctaagaag tttgctgaaa aagcagcttg ggaatttcta 540

gaggagaata gagactctgt aaaattcgaa ttaactgccg ttaacccagt ttacgttttt 600

ggtccgcaaa tgtttgacaa agatgtgaaa aaacacttga acacatcttg cgaactcgtc 660

aacagcttga tgcatttatc accagaggac aagataccgg aactatttgg tggatacatt 720

gatgttcgtg atgttgcaaa ggctcattta gttgccttcc aaaagaggga aacaattggt 780

caaagactaa tcgtatcgga ggccagattt actatgcagg atgttctcga tatccttaac 840

gaagacttcc ctgttctaaa aggcaatatt ccagtgggga aaccaggttc tggtgctacc 900

cataacaccc ttggtgctac tcttgataat aaaaagagta agaaattgtt aggtttcaag 960

ttcaggaact tgaaagagac cattgacgac actgcctccc aaattttaaa atttgagggc 1020

agaatataa 1029

<210> 15

<211> 342

<212> PRT

<213> 酿酒酵母

<400> 15

Met Ser Val Phe Val Ser Gly Ala Asn Gly Phe Ile Ala Gln His Ile

1 5 10 15

Val Asp Leu Leu Leu Lys Glu Asp Tyr Lys Val Ile Gly Ser Ala Arg

20 25 30

Ser Gln Glu Lys Ala Glu Asn Leu Thr Glu Ala Phe Gly Asn Asn Pro

35 40 45

Lys Phe Ser Met Glu Val Val Pro Asp Ile Ser Lys Leu Asp Ala Phe

50 55 60

Asp His Val Phe Gln Lys His Gly Lys Asp Ile Lys Ile Val Leu His

65 70 75 80

Thr Ala Ser Pro Phe Cys Phe Asp Ile Thr Asp Ser Glu Arg Asp Leu

85 90 95

Leu Ile Pro Ala Val Asn Gly Val Lys Gly Ile Leu His Ser Ile Lys

100 105 110

Lys Tyr Ala Ala Asp Ser Val Glu Arg Val Val Leu Thr Ser Ser Tyr

115 120 125

Ala Ala Val Phe Asp Met Ala Lys Glu Asn Asp Lys Ser Leu Thr Phe

130 135 140

Asn Glu Glu Ser Trp Asn Pro Ala Thr Trp Glu Ser Cys Gln Ser Asp

145 150 155 160

Pro Val Asn Ala Tyr Cys Gly Ser Lys Lys Phe Ala Glu Lys Ala Ala

165 170 175

Trp Glu Phe Leu Glu Glu Asn Arg Asp Ser Val Lys Phe Glu Leu Thr

180 185 190

Ala Val Asn Pro Val Tyr Val Phe Gly Pro Gln Met Phe Asp Lys Asp

195 200 205

Val Lys Lys His Leu Asn Thr Ser Cys Glu Leu Val Asn Ser Leu Met

210 215 220

His Leu Ser Pro Glu Asp Lys Ile Pro Glu Leu Phe Gly Gly Tyr Ile

225 230 235 240

Asp Val Arg Asp Val Ala Lys Ala His Leu Val Ala Phe Gln Lys Arg

245 250 255

Glu Thr Ile Gly Gln Arg Leu Ile Val Ser Glu Ala Arg Phe Thr Met

260 265 270

Gln Asp Val Leu Asp Ile Leu Asn Glu Asp Phe Pro Val Leu Lys Gly

275 280 285

Asn Ile Pro Val Gly Lys Pro Gly Ser Gly Ala Thr His Asn Thr Leu

290 295 300

Gly Ala Thr Leu Asp Asn Lys Lys Ser Lys Lys Leu Leu Gly Phe Lys

305 310 315 320

Phe Arg Asn Leu Lys Glu Thr Ile Asp Asp Thr Ala Ser Gln Ile Leu

325 330 335

Lys Phe Glu Gly Arg Ile

340

<210> 16

<211> 984

<212> DNA

<213> 酿酒酵母

<400> 16

atgtcttcac tggttactct taataacggt ctgaaaatgc ccctagtcgg cttagggtgc 60

tggaaaattg acaaaaaagt ctgtgcgaat caaatttatg aagctatcaa attaggctac 120

cgtttattcg atggtgcttg cgactacggc aacgaaaagg aagttggtga aggtatcagg 180

aaagccatct ccgaaggtct tgtttctaga aaggatatat ttgttgtttc aaagttatgg 240

aacaattttc accatcctga tcatgtaaaa ttagctttaa agaagacctt aagcgatatg 300

ggacttgatt atttagacct gtattatatt cacttcccaa tcgccttcaa atatgttcca 360

tttgaagaga aataccctcc aggattctat acgggcgcag atgacgagaa gaaaggtcac 420

atcaccgaag cacatgtacc aatcatagat acgtaccggg ctctggaaga atgtgttgat 480

gaaggcttga ttaagtctat tggtgtttcc aactttcagg gaagcttgat tcaagattta 540

ttacgtggtt gtagaatcaa gcccgtggct ttgcaaattg aacaccatcc ttatttgact 600

caagaacacc tagttgagtt ttgtaaatta cacgatatcc aagtagttgc ttactcctcc 660

ttcggtcctc aatcattcat tgagatggac ttacagttgg caaaaaccac gccaactctg 720

ttcgagaatg atgtaatcaa gaaggtctca caaaaccatc caggcagtac cacttcccaa 780

gtattgctta gatgggcaac tcagagaggc attgccgtca ttccaaaatc ttccaagaag 840

gaaaggttac ttggcaacct agaaatcgaa aaaaagttca ctttaacgga gcaagaattg 900

aaggatattt ctgcactaaa tgccaacatc agatttaatg atccatggac ctggttggat 960

ggtaaattcc ccacttttgc ctga 984

<210> 17

<211> 327

<212> PRT

<213> 酿酒酵母

<400> 17

Met Ser Ser Leu Val Thr Leu Asn Asn Gly Leu Lys Met Pro Leu Val

1 5 10 15

Gly Leu Gly Cys Trp Lys Ile Asp Lys Lys Val Cys Ala Asn Gln Ile

20 25 30

Tyr Glu Ala Ile Lys Leu Gly Tyr Arg Leu Phe Asp Gly Ala Cys Asp

35 40 45

Tyr Gly Asn Glu Lys Glu Val Gly Glu Gly Ile Arg Lys Ala Ile Ser

50 55 60

Glu Gly Leu Val Ser Arg Lys Asp Ile Phe Val Val Ser Lys Leu Trp

65 70 75 80

Asn Asn Phe His His Pro Asp His Val Lys Leu Ala Leu Lys Lys Thr

85 90 95

Leu Ser Asp Met Gly Leu Asp Tyr Leu Asp Leu Tyr Tyr Ile His Phe

100 105 110

Pro Ile Ala Phe Lys Tyr Val Pro Phe Glu Glu Lys Tyr Pro Pro Gly

115 120 125

Phe Tyr Thr Gly Ala Asp Asp Glu Lys Lys Gly His Ile Thr Glu Ala

130 135 140

His Val Pro Ile Ile Asp Thr Tyr Arg Ala Leu Glu Glu Cys Val Asp

145 150 155 160

Glu Gly Leu Ile Lys Ser Ile Gly Val Ser Asn Phe Gln Gly Ser Leu

165 170 175

Ile Gln Asp Leu Leu Arg Gly Cys Arg Ile Lys Pro Val Ala Leu Gln

180 185 190

Ile Glu His His Pro Tyr Leu Thr Gln Glu His Leu Val Glu Phe Cys

195 200 205

Lys Leu His Asp Ile Gln Val Val Ala Tyr Ser Ser Phe Gly Pro Gln

210 215 220

Ser Phe Ile Glu Met Asp Leu Gln Leu Ala Lys Thr Thr Pro Thr Leu

225 230 235 240

Phe Glu Asn Asp Val Ile Lys Lys Val Ser Gln Asn His Pro Gly Ser

245 250 255

Thr Thr Ser Gln Val Leu Leu Arg Trp Ala Thr Gln Arg Gly Ile Ala

260 265 270

Val Ile Pro Lys Ser Ser Lys Lys Glu Arg Leu Leu Gly Asn Leu Glu

275 280 285

Ile Glu Lys Lys Phe Thr Leu Thr Glu Gln Glu Leu Lys Asp Ile Ser

290 295 300

Ala Leu Asn Ala Asn Ile Arg Phe Asn Asp Pro Trp Thr Trp Leu Asp

305 310 315 320

Gly Lys Phe Pro Thr Phe Ala

325

<210> 18

<211> 1164

<212> DNA

<213> 大肠杆菌

<400> 18

atgaacaact ttaatctgca caccccaacc cgcattctgt ttggtaaagg cgcaatcgct 60

ggtttacgcg aacaaattcc tcacgatgct cgcgtattga ttacctacgg cggcggcagc 120

gtgaaaaaaa ccggcgttct cgatcaagtt ctggatgccc tgaaaggcat ggacgtgctg 180

gaatttggcg gtattgagcc aaacccggct tatgaaacgc tgatgaacgc cgtgaaactg 240

gttcgcgaac agaaagtgac tttcctgctg gcggttggcg gcggttctgt actggacggc 300

accaaattta tcgccgcagc ggctaactat ccggaaaata tcgatccgtg gcacattctg 360

caaacgggcg gtaaagagat taaaagcgcc atcccgatgg gctgtgtgct gacgctgcca 420

gcaaccggtt cagaatccaa cgcagaagcg gtgatctccc gtaaaaccac aggcgacaag 480

caggcgttcc attctgccca tgttcagccg gtatttgccg tgctcgatcc ggtttatacc 540

tacaccctgc cgccgcgtca ggtggctaac ggcgtagtgg acgcctttgt acacaccgtg 600

gaacagtatg ttaccaaacc ggttgatgcc aaaattcagg accgtttcgc agaaggcatt 660

ttgctgacgc taatcgaaga tggtccgaaa gccctgaaag agccagaaaa ctacgatgtg 720

cgcgccaacg tcatgtgggc ggcgactcag gcgctgaacg gtttgattgg cgctggcgta 780

ccgcaggact gggcaacgca tatgctgggc cacgaactga ctgcgatgca cggtctggat 840

cacgcgcaaa cactggctat cgtcctgcct gcactgtgga atgaaaaacg cgataccaag 900

cgcgctaagc tgctgcaata tgctgaacgc gtctggaaca tcactgaagg ttccgatgat 960

gagcgtattg acgccgcgat tgccgcaacc cgcaatttct ttgagcaatt aggcgtgccg 1020

acccacctct ccgactacgg tctggacggc agctccatcc cggctttgct gaaaaaactg 1080

gaagagcacg gcatgaccca actgggcgaa aatcatgaca ttacgttgga tgtcagccgc 1140

cgtatatacg aagccgcccg ctaa 1164

<210> 19

<211> 1167

<212> DNA

<213> 人工序列

<220>

<223> 密码子优化的大肠杆菌序列

<400> 19

atgaacaatt ttaatttgca tactccaact agaatattat ttggaaaagg tgcaattgca 60

ggtttaaggg aacaaatacc acatgatgca agggtattaa tcacatacgg tggtggttct 120

gtcaagaaaa ctggtgtatt ggatcaagta ttggatgctt taaagggtat ggatgtcttg 180

gaatttggag gaatcgaacc aaaccctgct tacgagactt taatgaatgc tgtcaaattg 240

gtcagagaac aaaaggtaac attcttattg gctgttggag gtggatcagt attagatggt 300

acaaagttca ttgctgctgc agcaaattat ccagaaaaca ttgatccatg gcatatattg 360

caaactggtg gtaaggaaat aaagtcagct atcccaatgg gatgtgtttt gacattgcct 420

gcaacaggat cagaatcaaa cgctgaagca gtcatctcaa gaaagactac aggtgacaaa 480

caggcattcc attctgccca tgtccaacct gtatttgctg ttttagaccc tgtatacact 540

tacacattac caccaaggca agtcgcaaat ggagttgtcg atgcctttgt tcacactgta 600

gaacagtacg tcaccaaacc agtcgatgca aagatccagg acaggtttgc agaaggtatt 660

ttattgacat taatcgaaga tggaccaaaa gcattgaaag agccagagaa ctatgacgtt 720

agggcaaatg ttatgtgggc tgctacccag gcattgaacg gtttaattgg tgcaggagtt 780

ccacaagatt gggctacaca catgttgggt cacgagttga ccgccatgca cggtttggac 840

catgcacaga ctttagccat tgttttgcct gccttatgga acgagaaaag agatactaag 900

agggctaagt tattacaata cgctgaaagg gtttggaata tcaccgaggg atctgatgat 960

gaaaggattg atgccgctat tgcagccact agaaacttct ttgaacaatt aggtgttcca 1020

actcacttgt ctgactatgg tttagatgga tcatctattc cagctttgtt gaagaaattg 1080

gaagagcacg gtatgaccca gttgggtgag aatcatgata taaccttaga tgtatctagg 1140

agaatctacg aggctgctag ataatga 1167

<210> 20

<211> 387

<212> PRT

<213> 大肠杆菌

<400> 20

Met Asn Asn Phe Asn Leu His Thr Pro Thr Arg Ile Leu Phe Gly Lys

1 5 10 15

Gly Ala Ile Ala Gly Leu Arg Glu Gln Ile Pro His Asp Ala Arg Val

20 25 30

Leu Ile Thr Tyr Gly Gly Gly Ser Val Lys Lys Thr Gly Val Leu Asp

35 40 45

Gln Val Leu Asp Ala Leu Lys Gly Met Asp Val Leu Glu Phe Gly Gly

50 55 60

Ile Glu Pro Asn Pro Ala Tyr Glu Thr Leu Met Asn Ala Val Lys Leu

65 70 75 80

Val Arg Glu Gln Lys Val Thr Phe Leu Leu Ala Val Gly Gly Gly Ser

85 90 95

Val Leu Asp Gly Thr Lys Phe Ile Ala Ala Ala Ala Asn Tyr Pro Glu

100 105 110

Asn Ile Asp Pro Trp His Ile Leu Gln Thr Gly Gly Lys Glu Ile Lys

115 120 125

Ser Ala Ile Pro Met Gly Cys Val Leu Thr Leu Pro Ala Thr Gly Ser

130 135 140

Glu Ser Asn Ala Glu Ala Val Ile Ser Arg Lys Thr Thr Gly Asp Lys

145 150 155 160

Gln Ala Phe His Ser Ala His Val Gln Pro Val Phe Ala Val Leu Asp

165 170 175

Pro Val Tyr Thr Tyr Thr Leu Pro Pro Arg Gln Val Ala Asn Gly Val

180 185 190

Val Asp Ala Phe Val His Thr Val Glu Gln Tyr Val Thr Lys Pro Val

195 200 205

Asp Ala Lys Ile Gln Asp Arg Phe Ala Glu Gly Ile Leu Leu Thr Leu

210 215 220

Ile Glu Asp Gly Pro Lys Ala Leu Lys Glu Pro Glu Asn Tyr Asp Val

225 230 235 240

Arg Ala Asn Val Met Trp Ala Ala Thr Gln Ala Leu Asn Gly Leu Ile

245 250 255

Gly Ala Gly Val Pro Gln Asp Trp Ala Thr His Met Leu Gly His Glu

260 265 270

Leu Thr Ala Met His Gly Leu Asp His Ala Gln Thr Leu Ala Ile Val

275 280 285

Leu Pro Ala Leu Trp Asn Glu Lys Arg Asp Thr Lys Arg Ala Lys Leu

290 295 300

Leu Gln Tyr Ala Glu Arg Val Trp Asn Ile Thr Glu Gly Ser Asp Asp

305 310 315 320

Glu Arg Ile Asp Ala Ala Ile Ala Ala Thr Arg Asn Phe Phe Glu Gln

325 330 335

Leu Gly Val Pro Thr His Leu Ser Asp Tyr Gly Leu Asp Gly Ser Ser

340 345 350

Ile Pro Ala Leu Leu Lys Lys Leu Glu Glu His Gly Met Thr Gln Leu

355 360 365

Gly Glu Asn His Asp Ile Thr Leu Asp Val Ser Arg Arg Ile Tyr Glu

370 375 380

Ala Ala Arg

385

<210> 21

<211> 1164

<212> DNA

<213> 大肠杆菌

<400> 21

atgaacaact ttaatctgca caccccaacc cgcattctgt ttggtaaagg cgcaatcgct 60

ggtttacgcg aacaaattcc tcacgatgct cgcgtattga ttacctacgg cggcggcagc 120

gtgaaaaaaa ccggcgttct cgatcaagtt ctggatgccc tgaaaggcat ggacgtgctg 180

gaatttggcg gtattgagcc aaacccggct tatgaaacgc tgatgaacgc cgtgaaactg 240

gttcgcgaac agaaagtgac tttcctgctg gcggttggcg gcggttctgt actggacggc 300

accaaattta tcgccgcagc ggctaactat ccggaaaata tcgatccgtg gcacattctg 360

caaacgggcg gtaaagagat taaaagcgcc atcccgatgg gctgtgtgct gacgctgcca 420

gcaaccggtt cagaatccaa cgcaggcgcg gtgatctccc gtaaaaccac aggcgacaag 480

caggcgttcc attctgccca tgttcagccg gtatttgccg tgctcgatcc ggtttatacc 540

tacaccctgc cgccgcgtca ggtggctaac ggcgtagtgg acgcctttgt acacaccgtg 600

gaacagtatg ttaccaaacc ggttgatgcc aaaattcagg accgtttcgc agaaggcatt 660

ttgctgacgc taatcgaaga tggtccgaaa gccctgaaag agccagaaaa ctacgatgtg 720

cgcgccaacg tcatgtgggc ggcgactcag gcgctgaacg gtttgattgg cgctggcgta 780

ccgcaggact gggcaacgca tatgctgggc cacgaactga ctgcgatgca cggtctggat 840

cacgcgcaaa cactggctat cgtcctgcct gcactgtgga atgaaaaacg cgataccaag 900

cgcgctaagc tgctgcaata tgctgaacgc gtctggaaca tcactgaagg ttccgatgat 960

gagcgtattg acgccgcgat tgccgcaacc cgcaatttct ttgagcaatt aggcgtgccg 1020

acccacctct ccgactacgg tctggacggc agctccatcc cggctttgct gaaaaaactg 1080

gaagagcacg gcatgaccca actgggcgaa aatcatgaca ttacgttgga tgtcagccgc 1140

cgtatatacg aagccgcccg ctaa 1164

<210> 22

<211> 1164

<212> DNA

<213> 人工序列

<220>

<223> 密码子优化的大肠杆菌序列

<400> 22

atgaacaact ttaatctgca caccccaacc cgcattctgt ttggtaaagg cgcaatcgct 60

ggtttacgcg aacaaattcc tcacgatgct cgcgtattga ttacctacgg cggcggcagc 120

gtgaaaaaaa ccggcgttct cgatcaagtt ctggatgccc tgaaaggcat ggacgtgctg 180

gaatttggcg gtattgagcc aaacccggct tatgaaacgc tgatgaacgc cgtgaaactg 240

gttcgcgaac agaaagtgac tttcctgctg gcggttggcg gcggttctgt actggacggc 300

accaaattta tcgccgcagc ggctaactat ccggaaaata tcgatccgtg gcacattctg 360

caaacgggcg gtaaagagat taaaagcgcc atcccgatgg gctgtgtgct gacgctgcca 420

gcaaccggtt cagaatccaa cgcaggcgcg gtgatctccc gtaaaaccac aggcgacaag 480

caggcgttcc attctgccca tgttcagccg gtatttgccg tgctcgatcc ggtttatacc 540

tacaccctgc cgccgcgtca ggtggctaac ggcgtagtgg acgcctttgt acacaccgtg 600

gaacagtatg ttaccaaacc ggttgatgcc aaaattcagg accgtttcgc agaaggcatt 660

ttgctgacgc taatcgaaga tggtccgaaa gccctgaaag agccagaaaa ctacgatgtg 720

cgcgccaacg tcatgtgggc ggcgactcag gcgctgaacg gtttgattgg cgctggcgta 780

ccgcaggact gggcaacgca tatgctgggc cacgaactga ctgcgatgca cggtctggat 840

cacgcgcaaa cactggctat cgtcctgcct gcactgtgga atgaaaaacg cgataccaag 900

cgcgctaagc tgctgcaata tgctgaacgc gtctggaaca tcactgaagg ttccgatgat 960

gagcgtattg acgccgcgat tgccgcaacc cgcaatttct ttgagcaatt aggcgtgccg 1020

acccacctct ccgactacgg tctggacggc agctccatcc cggctttgct gaaaaaactg 1080

gaagagcacg gcatgaccca actgggcgaa aatcatgaca ttacgttgga tgtcagccgc 1140

cgtatatacg aagccgcccg ctaa 1164

<210> 23

<211> 387

<212> PRT

<213> 大肠杆菌

<400> 23

Met Asn Asn Phe Asn Leu His Thr Pro Thr Arg Ile Leu Phe Gly Lys

1 5 10 15

Gly Ala Ile Ala Gly Leu Arg Glu Gln Ile Pro His Asp Ala Arg Val

20 25 30

Leu Ile Thr Tyr Gly Gly Gly Ser Val Lys Lys Thr Gly Val Leu Asp

35 40 45

Gln Val Leu Asp Ala Leu Lys Gly Met Asp Val Leu Glu Phe Gly Gly

50 55 60

Ile Glu Pro Asn Pro Ala Tyr Glu Thr Leu Met Asn Ala Val Lys Leu

65 70 75 80

Val Arg Glu Gln Lys Val Thr Phe Leu Leu Ala Val Gly Gly Gly Ser

85 90 95

Val Leu Asp Gly Thr Lys Phe Ile Ala Ala Ala Ala Asn Tyr Pro Glu

100 105 110

Asn Ile Asp Pro Trp His Ile Leu Gln Thr Gly Gly Lys Glu Ile Lys

115 120 125

Ser Ala Ile Pro Met Gly Cys Val Leu Thr Leu Pro Ala Thr Gly Ser

130 135 140

Glu Ser Asn Ala Gly Ala Val Ile Ser Arg Lys Thr Thr Gly Asp Lys

145 150 155 160

Gln Ala Phe His Ser Ala His Val Gln Pro Val Phe Ala Val Leu Asp

165 170 175

Pro Val Tyr Thr Tyr Thr Leu Pro Pro Arg Gln Val Ala Asn Gly Val

180 185 190

Val Asp Ala Phe Val His Thr Val Glu Gln Tyr Val Thr Lys Pro Val

195 200 205

Asp Ala Lys Ile Gln Asp Arg Phe Ala Glu Gly Ile Leu Leu Thr Leu

210 215 220

Ile Glu Asp Gly Pro Lys Ala Leu Lys Glu Pro Glu Asn Tyr Asp Val

225 230 235 240

Arg Ala Asn Val Met Trp Ala Ala Thr Gln Ala Leu Asn Gly Leu Ile

245 250 255

Gly Ala Gly Val Pro Gln Asp Trp Ala Thr His Met Leu Gly His Glu

260 265 270

Leu Thr Ala Met His Gly Leu Asp His Ala Gln Thr Leu Ala Ile Val

275 280 285

Leu Pro Ala Leu Trp Asn Glu Lys Arg Asp Thr Lys Arg Ala Lys Leu

290 295 300

Leu Gln Tyr Ala Glu Arg Val Trp Asn Ile Thr Glu Gly Ser Asp Asp

305 310 315 320

Glu Arg Ile Asp Ala Ala Ile Ala Ala Thr Arg Asn Phe Phe Glu Gln

325 330 335

Leu Gly Val Pro Thr His Leu Ser Asp Tyr Gly Leu Asp Gly Ser Ser

340 345 350

Ile Pro Ala Leu Leu Lys Lys Leu Glu Glu His Gly Met Thr Gln Leu

355 360 365

Gly Glu Asn His Asp Ile Thr Leu Asp Val Ser Arg Arg Ile Tyr Glu

370 375 380

Ala Ala Arg

385

<210> 24

<211> 981

<212> DNA

<213> 大肠杆菌

<400> 24

atgaaaaaga tacctttagg cacaacggat attacgcttt cgcgaatggg gttggggaca 60

tgggccattg gcggcggtcc tgcatggaat ggcgatctcg atcggcaaat atgtattgat 120

acgattcttg aagcccatcg ttgtggcatt aatctgattg atactgcgcc aggatataac 180

tttggcaata gtgaagttat cgtcggtcag gcgttaaaaa aactgccccg tgaacaggtt 240

gtagtagaaa ccaaatgcgg cattgtctgg gaacgaaaag gaagtttatt caacaaagtt 300

ggcgatcggc agttgtataa aaacctttcc ccggaatcta tccgcgaaga ggtagcagcg 360

agcttgcaac gtctgggtat tgattacatc gatatctaca tgacgcactg gcagtcggtg 420

ccgccatttt ttacgccgat cgctgaaact gtcgcagtgc ttaatgagtt aaagtctgaa 480

gggaaaattc gcgctatagg cgctgctaac gtcgatgctg accatatccg cgagtatctg 540

caatatggtg aactggatat tattcaggcg aaatacagta tcctcgaccg ggcaatggaa 600

aacgaactgc tgccactatg tcgtgataat ggcattgtgg ttcaggttta ttccccgcta 660

gagcagggat tgttgaccgg caccatcact cgtgattacg ttccgggcgg cgctcgggca 720

aataaagtct ggttccagcg tgaaaacatg ctgaaagtga ttgatatgct tgaacagtgg 780

cagccacttt gtgctcgtta tcagtgcaca attcccactc tggcactggc gtggatatta 840

aaacagagtg atttaatctc cattcttagt ggggctactg caccggaaca ggtacgcgaa 900

aatgtcgcgg cactgaatat caacttatcg gatgcagacg caacattgat gagggaaatg 960

gcagaggccc tggagcgtta a 981

<210> 25

<211> 326

<212> PRT

<213> 大肠杆菌

<400> 25

Met Lys Lys Ile Pro Leu Gly Thr Thr Asp Ile Thr Leu Ser Arg Met

1 5 10 15

Gly Leu Gly Thr Trp Ala Ile Gly Gly Gly Pro Ala Trp Asn Gly Asp

20 25 30

Leu Asp Arg Gln Ile Cys Ile Asp Thr Ile Leu Glu Ala His Arg Cys

35 40 45

Gly Ile Asn Leu Ile Asp Thr Ala Pro Gly Tyr Asn Phe Gly Asn Ser

50 55 60

Glu Val Ile Val Gly Gln Ala Leu Lys Lys Leu Pro Arg Glu Gln Val

65 70 75 80

Val Val Glu Thr Lys Cys Gly Ile Val Trp Glu Arg Lys Gly Ser Leu

85 90 95

Phe Asn Lys Val Gly Asp Arg Gln Leu Tyr Lys Asn Leu Ser Pro Glu

100 105 110

Ser Ile Arg Glu Glu Val Ala Ala Ser Leu Gln Arg Leu Gly Ile Asp

115 120 125

Tyr Ile Asp Ile Tyr Met Thr His Trp Gln Ser Val Pro Pro Phe Phe

130 135 140

Thr Pro Ile Ala Glu Thr Val Ala Val Leu Asn Glu Leu Lys Ser Glu

145 150 155 160

Gly Lys Ile Arg Ala Ile Gly Ala Ala Asn Val Asp Ala Asp His Ile

165 170 175

Arg Glu Tyr Leu Gln Tyr Gly Glu Leu Asp Ile Ile Gln Ala Lys Tyr

180 185 190

Ser Ile Leu Asp Arg Ala Met Glu Asn Glu Leu Leu Pro Leu Cys Arg

195 200 205

Asp Asn Gly Ile Val Val Gln Val Tyr Ser Pro Leu Glu Gln Gly Leu

210 215 220

Leu Thr Gly Thr Ile Thr Arg Asp Tyr Val Pro Gly Gly Ala Arg Ala

225 230 235 240

Asn Lys Val Trp Phe Gln Arg Glu Asn Met Leu Lys Val Ile Asp Met

245 250 255

Leu Glu Gln Trp Gln Pro Leu Cys Ala Arg Tyr Gln Cys Thr Ile Pro

260 265 270

Thr Leu Ala Leu Ala Trp Ile Leu Lys Gln Ser Asp Leu Ile Ser Ile

275 280 285

Leu Ser Gly Ala Thr Ala Pro Glu Gln Val Arg Glu Asn Val Ala Ala

290 295 300

Leu Asn Ile Asn Leu Ser Asp Ala Asp Ala Thr Leu Met Arg Glu Met

305 310 315 320

Ala Glu Ala Leu Glu Arg

325

<210> 26

<211> 1149

<212> DNA

<213> 大肠杆菌

<400> 26

atggctaaca gaatgattct gaacgaaacg gcatggtttg gtcggggtgc tgttggggct 60

ttaaccgatg aggtgaaacg ccgtggttat cagaaggcgc tgatcgtcac cgataaaacg 120

ctggtgcaat gcggcgtggt ggcgaaagtg accgataaga tggatgctgc agggctggca 180

tgggcgattt acgacggcgt agtgcccaac ccaacaatta ctgtcgtcaa agaagggctc 240

ggtgtattcc agaatagcgg cgcggattac ctgatcgcta ttggtggtgg ttctccacag 300

gatacttgta aagcgattgg cattatcagc aacaacccgg agtttgccga tgtgcgtagc 360

ctggaagggc tttccccgac caataaaccc agtgtaccga ttctggcaat tcctaccaca 420

gcaggtactg cggcagaagt gaccattaac tacgtgatca ctgacgaaga gaaacggcgc 480

aagtttgttt gcgttgatcc gcatgatatc ccgcaggtgg cgtttattga cgctgacatg 540

atggatggta tgcctccagc gctgaaagct gcgacgggtg tcgatgcgct cactcatgct 600

attgaggggt atattacccg tggcgcgtgg gcgctaaccg atgcactgca cattaaagcg 660

attgaaatca ttgctggggc gctgcgagga tcggttgctg gtgataagga tgccggagaa 720

gaaatggcgc tcgggcagta tgttgcgggt atgggcttct cgaatgttgg gttagggttg 780

gtgcatggta tggcgcatcc actgggcgcg ttttataaca ctccacacgg tgttgcgaac 840

gccatcctgt taccgcatgt catgcgttat aacgctgact ttaccggtga gaagtaccgc 900

gatatcgcgc gcgttatggg cgtgaaagtg gaaggtatga gcctggaaga ggcgcgtaat 960

gccgctgttg aagcggtgtt tgctctcaac cgtgatgtcg gtattccgcc acatttgcgt 1020

gatgttggtg tacgcaagga agacattccg gcactggcgc aggcggcact ggatgatgtt 1080

tgtaccggtg gcaacccgcg tgaagcaacg cttgaggata ttgtagagct ttaccatacc 1140

gcctggtaa 1149

<210> 27

<211> 1149

<212> DNA

<213> 人工序列

<220>

<223> 密码子优化的大肠杆菌序列

<400> 27

atggctaaca gaatgattct gaacgaaacg gcatggtttg gtcggggtgc tgttggggct 60

ttaaccgatg aggtgaaacg ccgtggttat cagaaggcgc tgatcgtcac cgataaaacg 120

ctggtgcaat gcggcgtggt ggcgaaagtg accgataaga tggatgctgc agggctggca 180

tgggcgattt acgacggcgt agtgcccaac ccaacaatta ctgtcgtcaa agaagggctc 240

ggtgtattcc agaatagcgg cgcggattac ctgatcgcta ttggtggtgg ttctccacag 300

gatacttgta aagcgattgg cattatcagc aacaacccgg agtttgccga tgtgcgtagc 360

ctggaagggc tttccccgac caataaaccc agtgtaccga ttctggcaat tcctaccaca 420

gcaggtactg cggcagaagt gaccattaac tacgtgatca ctgacgaaga gaaacggcgc 480

aagtttgttt gcgttgatcc gcatgatatc ccgcaggtgg cgtttattga cgctgacatg 540

atggatggta tgcctccagc gctgaaagct gcgacgggtg tcgatgcgct cactcatgct 600

attgaggggt atattacccg tggcgcgtgg gcgctaaccg atgcactgca cattaaagcg 660

attgaaatca ttgctggggc gctgcgagga tcggttgctg gtgataagga tgccggagaa 720

gaaatggcgc tcgggcagta tgttgcgggt atgggcttct cgaatgttgg gttagggttg 780

gtgcatggta tggcgcatcc actgggcgcg ttttataaca ctccacacgg tgttgcgaac 840

gccatcctgt taccgcatgt catgcgttat aacgctgact ttaccggtga gaagtaccgc 900

gatatcgcgc gcgttatggg cgtgaaagtg gaaggtatga gcctggaaga ggcgcgtaat 960

gccgctgttg aagcggtgtt tgctctcaac cgtgatgtcg gtattccgcc acatttgcgt 1020

gatgttggtg tacgcaagga agacattccg gcactggcgc aggcggcact ggatgatgtt 1080

tgtaccggtg gcaacccgcg tgaagcaacg cttgaggata ttgtagagct ttaccatacc 1140

gcctggtaa 1149

<210> 28

<211> 382

<212> PRT

<213> 大肠杆菌

<400> 28

Met Ala Asn Arg Met Ile Leu Asn Glu Thr Ala Trp Phe Gly Arg Gly

1 5 10 15

Ala Val Gly Ala Leu Thr Asp Glu Val Lys Arg Arg Gly Tyr Gln Lys

20 25 30

Ala Leu Ile Val Thr Asp Lys Thr Leu Val Gln Cys Gly Val Val Ala

35 40 45

Lys Val Thr Asp Lys Met Asp Ala Ala Gly Leu Ala Trp Ala Ile Tyr

50 55 60

Asp Gly Val Val Pro Asn Pro Thr Ile Thr Val Val Lys Glu Gly Leu

65 70 75 80

Gly Val Phe Gln Asn Ser Gly Ala Asp Tyr Leu Ile Ala Ile Gly Gly

85 90 95

Gly Ser Pro Gln Asp Thr Cys Lys Ala Ile Gly Ile Ile Ser Asn Asn

100 105 110

Pro Glu Phe Ala Asp Val Arg Ser Leu Glu Gly Leu Ser Pro Thr Asn

115 120 125

Lys Pro Ser Val Pro Ile Leu Ala Ile Pro Thr Thr Ala Gly Thr Ala

130 135 140

Ala Glu Val Thr Ile Asn Tyr Val Ile Thr Asp Glu Glu Lys Arg Arg

145 150 155 160

Lys Phe Val Cys Val Asp Pro His Asp Ile Pro Gln Val Ala Phe Ile

165 170 175

Asp Ala Asp Met Met Asp Gly Met Pro Pro Ala Leu Lys Ala Ala Thr

180 185 190

Gly Val Asp Ala Leu Thr His Ala Ile Glu Gly Tyr Ile Thr Arg Gly

195 200 205

Ala Trp Ala Leu Thr Asp Ala Leu His Ile Lys Ala Ile Glu Ile Ile

210 215 220

Ala Gly Ala Leu Arg Gly Ser Val Ala Gly Asp Lys Asp Ala Gly Glu

225 230 235 240

Glu Met Ala Leu Gly Gln Tyr Val Ala Gly Met Gly Phe Ser Asn Val

245 250 255

Gly Leu Gly Leu Val His Gly Met Ala His Pro Leu Gly Ala Phe Tyr

260 265 270

Asn Thr Pro His Gly Val Ala Asn Ala Ile Leu Leu Pro His Val Met

275 280 285

Arg Tyr Asn Ala Asp Phe Thr Gly Glu Lys Tyr Arg Asp Ile Ala Arg

290 295 300

Val Met Gly Val Lys Val Glu Gly Met Ser Leu Glu Glu Ala Arg Asn

305 310 315 320

Ala Ala Val Glu Ala Val Phe Ala Leu Asn Arg Asp Val Gly Ile Pro

325 330 335

Pro His Leu Arg Asp Val Gly Val Arg Lys Glu Asp Ile Pro Ala Leu

340 345 350

Ala Gln Ala Ala Leu Asp Asp Val Cys Thr Gly Gly Asn Pro Arg Glu

355 360 365

Ala Thr Leu Glu Asp Ile Val Glu Leu Tyr His Thr Ala Trp

370 375 380

<210> 29

<211> 804

<212> DNA

<213> 大肠杆菌

<400> 29

atggctatcc ctgcatttgg tttaggtact ttccgtctga aagacgacgt tgttatttca 60

tctgtgataa cggcgcttga acttggttat cgcgcaattg ataccgcaca aatctatgat 120

aacgaagccg cagtaggtca ggcgattgca gaaagtggcg tgccacgtca tgaactctac 180

atcaccacta aaatctggat tgaaaatctc agcaaagaca aattgatccc aagtctgaaa 240

gagagcctgc aaaaattgcg taccgattat gttgatctga cgctaatcca ctggccgtca 300

ccaaacgatg aagtctctgt tgaagagttt atgcaggcgc tgctggaagc caaaaaacaa 360

gggctgacgc gtgagatcgg tatttccaac ttcacgatcc cgttgatgga aaaagcgatt 420

gctgctgttg gtgctgaaaa catcgctact aaccagattg aactctctcc ttatctgcaa 480

aaccgtaaag tggttgcctg ggctaaacag cacggcatcc atattacttc ctatatgacg 540

ctggcgtatg gtaaggccct gaaagatgag gttattgctc gtatcgcagc taaacacaat 600

gcgactccgg cacaagtgat tctggcgtgg gctatggggg aaggttactc agtaattcct 660

tcttctacta aacgtaaaaa cctggaaagt aatcttaagg cacaaaattt acagcttgat 720

gccgaagata aaaaagcgat cgccgcactg gattgcaacg accgcctggt tagcccggaa 780

ggtctggctc ctgaatggga ttaa 804

<210> 30

<211> 267

<212> PRT

<213> 大肠杆菌

<400> 30

Met Ala Ile Pro Ala Phe Gly Leu Gly Thr Phe Arg Leu Lys Asp Asp

1 5 10 15

Val Val Ile Ser Ser Val Ile Thr Ala Leu Glu Leu Gly Tyr Arg Ala

20 25 30

Ile Asp Thr Ala Gln Ile Tyr Asp Asn Glu Ala Ala Val Gly Gln Ala

35 40 45

Ile Ala Glu Ser Gly Val Pro Arg His Glu Leu Tyr Ile Thr Thr Lys

50 55 60

Ile Trp Ile Glu Asn Leu Ser Lys Asp Lys Leu Ile Pro Ser Leu Lys

65 70 75 80

Glu Ser Leu Gln Lys Leu Arg Thr Asp Tyr Val Asp Leu Thr Leu Ile

85 90 95

His Trp Pro Ser Pro Asn Asp Glu Val Ser Val Glu Glu Phe Met Gln

100 105 110

Ala Leu Leu Glu Ala Lys Lys Gln Gly Leu Thr Arg Glu Ile Gly Ile

115 120 125

Ser Asn Phe Thr Ile Pro Leu Met Glu Lys Ala Ile Ala Ala Val Gly

130 135 140

Ala Glu Asn Ile Ala Thr Asn Gln Ile Glu Leu Ser Pro Tyr Leu Gln

145 150 155 160

Asn Arg Lys Val Val Ala Trp Ala Lys Gln His Gly Ile His Ile Thr

165 170 175

Ser Tyr Met Thr Leu Ala Tyr Gly Lys Ala Leu Lys Asp Glu Val Ile

180 185 190

Ala Arg Ile Ala Ala Lys His Asn Ala Thr Pro Ala Gln Val Ile Leu

195 200 205

Ala Trp Ala Met Gly Glu Gly Tyr Ser Val Ile Pro Ser Ser Thr Lys

210 215 220

Arg Lys Asn Leu Glu Ser Asn Leu Lys Ala Gln Asn Leu Gln Leu Asp

225 230 235 240

Ala Glu Asp Lys Lys Ala Ile Ala Ala Leu Asp Cys Asn Asp Arg Leu

245 250 255

Val Ser Pro Glu Gly Leu Ala Pro Glu Trp Asp

260 265

<210> 31

<211> 828

<212> DNA

<213> 大肠杆菌

<400> 31

atggctaatc caaccgttat taagctacag gatggcaatg tcatgcccca gctgggactg 60

ggcgtctggc aagcaagtaa tgaggaagta atcaccgcca ttcaaaaagc gttagaagtg 120

ggttatcgct cgattgatac cgccgcggcc tacaagaacg aagaaggtgt cggcaaagcc 180

ctgaaaaatg cctcagtcaa cagagaagaa ctgttcatca ccactaagct gtggaacgac 240

gaccacaagc gcccccgcga agccctgctc gacagcctga aaaaactcca gcttgattat 300

atcgacctct acttaatgca ctggcccgtt cccgctatcg accattatgt cgaagcatgg 360

aaaggcatga tcgaattgca aaaagaggga ttaatcaaaa gcatcggcgt gtgcaacttc 420

cagatccatc acctgcaacg cctgattgat gaaactggcg tgacgcctgt gataaaccag 480

atcgaacttc atccgctgat gcaacaacgc cagctacacg cctggaacgc gacacacaaa 540

atccagaccg aatcctggag cccattagcg caaggaggga aaggcgtttt cgatcagaaa 600

gtcattcgcg atctggcaga taaatacggc aaaaccccgg cgcagattgt tatccgctgg 660

catctggata gcggcctggt ggtgatcccg aaatcggtca caccttcacg tattgccgaa 720

aactttgatg tctgggattt ccgtctcgac aaagacgaac tcggcgaaat tgcaaaactc 780

gatcagggca agcgtctcgg tcccgatcct gaccagttcg gcggctaa 828

<210> 32

<211> 275

<212> PRT

<213> 大肠杆菌

<400> 32

Met Ala Asn Pro Thr Val Ile Lys Leu Gln Asp Gly Asn Val Met Pro

1 5 10 15

Gln Leu Gly Leu Gly Val Trp Gln Ala Ser Asn Glu Glu Val Ile Thr

20 25 30

Ala Ile Gln Lys Ala Leu Glu Val Gly Tyr Arg Ser Ile Asp Thr Ala

35 40 45

Ala Ala Tyr Lys Asn Glu Glu Gly Val Gly Lys Ala Leu Lys Asn Ala

50 55 60

Ser Val Asn Arg Glu Glu Leu Phe Ile Thr Thr Lys Leu Trp Asn Asp

65 70 75 80

Asp His Lys Arg Pro Arg Glu Ala Leu Leu Asp Ser Leu Lys Lys Leu

85 90 95

Gln Leu Asp Tyr Ile Asp Leu Tyr Leu Met His Trp Pro Val Pro Ala

100 105 110

Ile Asp His Tyr Val Glu Ala Trp Lys Gly Met Ile Glu Leu Gln Lys

115 120 125

Glu Gly Leu Ile Lys Ser Ile Gly Val Cys Asn Phe Gln Ile His His

130 135 140

Leu Gln Arg Leu Ile Asp Glu Thr Gly Val Thr Pro Val Ile Asn Gln

145 150 155 160

Ile Glu Leu His Pro Leu Met Gln Gln Arg Gln Leu His Ala Trp Asn

165 170 175

Ala Thr His Lys Ile Gln Thr Glu Ser Trp Ser Pro Leu Ala Gln Gly

180 185 190

Gly Lys Gly Val Phe Asp Gln Lys Val Ile Arg Asp Leu Ala Asp Lys

195 200 205

Tyr Gly Lys Thr Pro Ala Gln Ile Val Ile Arg Trp His Leu Asp Ser

210 215 220

Gly Leu Val Val Ile Pro Lys Ser Val Thr Pro Ser Arg Ile Ala Glu

225 230 235 240

Asn Phe Asp Val Trp Asp Phe Arg Leu Asp Lys Asp Glu Leu Gly Glu

245 250 255

Ile Ala Lys Leu Asp Gln Gly Lys Arg Leu Gly Pro Asp Pro Asp Gln

260 265 270

Phe Gly Gly

275

<210> 33

<211> 1179

<212> DNA

<213> 丙酮丁醇梭菌（Clostridium acetobutylicum）

<400> 33

atgaaagaag ttgtaatagc tagtgcagta agaacagcga ttggatctta tggaaagtct 60

cttaaggatg taccagcagt agatttagga gctacagcta taaaggaagc agttaaaaaa 120

gcaggaataa aaccagagga tgttaatgaa gtcattttag gaaatgttct tcaagcaggt 180

ttaggacaga atccagcaag acaggcatct tttaaagcag gattaccagt tgaaattcca 240

gctatgacta ttaataaggt ttgtggttca ggacttagaa cagttagctt agcagcacaa 300

attataaaag caggagatgc tgacgtaata atagcaggtg gtatggaaaa tatgtctaga 360

gctccttact tagcgaataa cgctagatgg ggatatagaa tgggaaacgc taaatttgtt 420

gatgaaatga tcactgacgg attgtgggat gcatttaatg attaccacat gggaataaca 480

gcagaaaaca tagctgagag atggaacatt tcaagagaag aacaagatga gtttgctctt 540

gcatcacaaa aaaaagctga agaagctata aaatcaggtc aatttaaaga tgaaatagtt 600

cctgtagtaa ttaaaggcag aaagggagaa actgtagttg atacagatga gcaccctaga 660

tttggatcaa ctatagaagg acttgcaaaa ttaaaacctg ccttcaaaaa agatggaaca 720

gttacagctg gtaatgcatc aggattaaat gactgtgcag cagtacttgt aatcatgagt 780

gcagaaaaag ctaaagagct tggagtaaaa ccacttgcta agatagtttc ttatggttca 840

gcaggagttg acccagcaat aatgggatat ggacctttct atgcaacaaa agcagctatt 900

gaaaaagcag gttggacagt tgatgaatta gatttaatag aatcaaatga agcttttgca 960

gctcaaagtt tagcagtagc aaaagattta aaatttgata tgaataaagt aaatgtaaat 1020

ggaggagcta ttgcccttgg tcatccaatt ggagcatcag gtgcaagaat actcgttact 1080

cttgtacacg caatgcaaaa aagagatgca aaaaaaggct tagcaacttt atgtataggt 1140

ggcggacaag gaacagcaat attgctagaa aagtgctag 1179

<210> 34

<211> 1179

<212> DNA

<213> 人工序列

<220>

<223> 密码子优化的丙酮丁醇梭菌序列

<400> 34

atgaaagaag ttgttattgc gagcgcggtt cgtaccgcga ttggcagcta tggcaagagc 60

ctgaaggatg ttccggcggt ggacctgggt gcgaccgcga tcaaagaggc ggttaagaaa 120

gcgggcatta aaccggagga tgtgaacgaa gttatcctgg gtaacgtgct gcaagcgggt 180

ctgggccaaa acccggcgcg tcaggcgagc ttcaaggcgg gcctgccggt tgaaatcccg 240

gcgatgacca ttaacaaagt ttgcggtagc ggcctgcgta ccgtgagcct ggcggcgcaa 300

atcattaagg cgggtgacgc ggatgttatc attgcgggtg gcatggagaa catgagccgt 360

gcgccgtacc tggcgaacaa cgcgcgttgg ggttatcgta tgggcaacgc gaaattcgtg 420

gacgaaatga ttaccgacgg tctgtgggat gcgtttaacg actaccacat gggcatcacc 480

gcggagaaca ttgcggaacg ttggaacatt agccgtgagg aacaagatga gttcgcgctg 540

gcgagccaga agaaagcgga ggaagcgatc aagagcggcc agtttaaaga cgaaatcgtt 600

ccggtggtta ttaagggtcg taagggtgaa accgtggtgg acaccgatga acacccgcgt 660

ttcggtagca ccattgaggg cctggcgaag ctgaaaccgg cgtttaagaa agatggcacc 720

gtgaccgcgg gtaacgcgag cggcctgaac gactgcgcgg cggtgctggt tatcatgagc 780

gcggagaagg cgaaagaact gggtgtgaag ccgctggcga aaattgttag ctacggtagc 840

gcgggtgtgg acccggcgat catgggttac ggcccgtttt atgcgaccaa ggcggcgatt 900

gagaaagcgg gttggaccgt ggacgaactg gatctgatcg agagcaacga agcgttcgcg 960

gcgcaaagcc tggcggtggc gaaggatctg aaatttgaca tgaacaaggt gaacgtgaac 1020

ggtggtgcga ttgcgctggg tcacccgatt ggtgcgagcg gcgcgcgtat cctggtgacc 1080

ctggttcacg cgatgcagaa acgtgacgcg aagaaaggtc tggcgaccct gtgcattggt 1140

ggtggtcaag gcaccgcgat tctgctggaa aagtgctaa 1179

<210> 35

<211> 392

<212> PRT

<213> 丙酮丁醇梭菌

<400> 35

Met Lys Glu Val Val Ile Ala Ser Ala Val Arg Thr Ala Ile Gly Ser

1 5 10 15

Tyr Gly Lys Ser Leu Lys Asp Val Pro Ala Val Asp Leu Gly Ala Thr

20 25 30

Ala Ile Lys Glu Ala Val Lys Lys Ala Gly Ile Lys Pro Glu Asp Val

35 40 45

Asn Glu Val Ile Leu Gly Asn Val Leu Gln Ala Gly Leu Gly Gln Asn

50 55 60

Pro Ala Arg Gln Ala Ser Phe Lys Ala Gly Leu Pro Val Glu Ile Pro

65 70 75 80

Ala Met Thr Ile Asn Lys Val Cys Gly Ser Gly Leu Arg Thr Val Ser

85 90 95

Leu Ala Ala Gln Ile Ile Lys Ala Gly Asp Ala Asp Val Ile Ile Ala

100 105 110

Gly Gly Met Glu Asn Met Ser Arg Ala Pro Tyr Leu Ala Asn Asn Ala

115 120 125

Arg Trp Gly Tyr Arg Met Gly Asn Ala Lys Phe Val Asp Glu Met Ile

130 135 140

Thr Asp Gly Leu Trp Asp Ala Phe Asn Asp Tyr His Met Gly Ile Thr

145 150 155 160

Ala Glu Asn Ile Ala Glu Arg Trp Asn Ile Ser Arg Glu Glu Gln Asp

165 170 175

Glu Phe Ala Leu Ala Ser Gln Lys Lys Ala Glu Glu Ala Ile Lys Ser

180 185 190

Gly Gln Phe Lys Asp Glu Ile Val Pro Val Val Ile Lys Gly Arg Lys

195 200 205

Gly Glu Thr Val Val Asp Thr Asp Glu His Pro Arg Phe Gly Ser Thr

210 215 220

Ile Glu Gly Leu Ala Lys Leu Lys Pro Ala Phe Lys Lys Asp Gly Thr

225 230 235 240

Val Thr Ala Gly Asn Ala Ser Gly Leu Asn Asp Cys Ala Ala Val Leu

245 250 255

Val Ile Met Ser Ala Glu Lys Ala Lys Glu Leu Gly Val Lys Pro Leu

260 265 270

Ala Lys Ile Val Ser Tyr Gly Ser Ala Gly Val Asp Pro Ala Ile Met

275 280 285

Gly Tyr Gly Pro Phe Tyr Ala Thr Lys Ala Ala Ile Glu Lys Ala Gly

290 295 300

Trp Thr Val Asp Glu Leu Asp Leu Ile Glu Ser Asn Glu Ala Phe Ala

305 310 315 320

Ala Gln Ser Leu Ala Val Ala Lys Asp Leu Lys Phe Asp Met Asn Lys

325 330 335

Val Asn Val Asn Gly Gly Ala Ile Ala Leu Gly His Pro Ile Gly Ala

340 345 350

Ser Gly Ala Arg Ile Leu Val Thr Leu Val His Ala Met Gln Lys Arg

355 360 365

Asp Ala Lys Lys Gly Leu Ala Thr Leu Cys Ile Gly Gly Gly Gln Gly

370 375 380

Thr Ala Ile Leu Leu Glu Lys Cys

385 390

<210> 36

<211> 1185

<212> DNA

<213> 大肠杆菌

<400> 36

atgaaaaatt gtgtcatcgt cagtgcggta cgtactgcta tcggtagttt taacggttca 60

ctcgcttcca ccagcgccat cgacctgggg gcgacagtaa ttaaagccgc cattgaacgt 120

gcaaaaatcg attcacaaca cgttgatgaa gtgattatgg gtaacgtgtt acaagccggg 180

ctggggcaaa atccggcgcg tcaggcactg ttaaaaagcg ggctggcaga aacggtgtgc 240

ggattcacgg tcaataaagt atgtggttcg ggtcttaaaa gtgtggcgct tgccgcccag 300

gccattcagg caggtcaggc gcagagcatt gtggcggggg gtatggaaaa tatgagttta 360

gccccctact tactcgatgc aaaagcacgc tctggttatc gtcttggaga cggacaggtt 420

tatgacgtaa tcctgcgcga tggcctgatg tgcgccaccc atggttatca tatggggatt 480

accgccgaaa acgtggctaa agagtacgga attacccgtg aaatgcagga tgaactggcg 540

ctacattcac agcgtaaagc ggcagccgca attgagtccg gtgcttttac agccgaaatc 600

gtcccggtaa atgttgtcac tcgaaagaaa accttcgtct tcagtcaaga cgaattcccg 660

aaagcgaatt caacggctga agcgttaggt gcattgcgcc cggccttcga taaagcagga 720

acagtcaccg ctgggaacgc gtctggtatt aacgacggtg ctgccgctct ggtgattatg 780

gaagaatctg cggcgctggc agcaggcctt acccccctgg ctcgcattaa aagttatgcc 840

agcggtggcg tgccccccgc attgatgggt atggggccag tacctgccac gcaaaaagcg 900

ttacaactgg cggggctgca actggcggat attgatctca ttgaggctaa tgaagcattt 960

gctgcacagt tccttgccgt tgggaaaaac ctgggctttg attctgagaa agtgaatgtc 1020

aacggcgggg ccatcgcgct cgggcatcct atcggtgcca gtggtgctcg tattctggtc 1080

acactattac atgccatgca ggcacgcgat aaaacgctgg ggctggcaac actgtgcatt 1140

ggcggcggtc agggaattgc gatggtgatt gaacggttga attaa 1185

<210> 37

<211> 394

<212> PRT

<213> 大肠杆菌

<400> 37

Met Lys Asn Cys Val Ile Val Ser Ala Val Arg Thr Ala Ile Gly Ser

1 5 10 15

Phe Asn Gly Ser Leu Ala Ser Thr Ser Ala Ile Asp Leu Gly Ala Thr

20 25 30

Val Ile Lys Ala Ala Ile Glu Arg Ala Lys Ile Asp Ser Gln His Val

35 40 45

Asp Glu Val Ile Met Gly Asn Val Leu Gln Ala Gly Leu Gly Gln Asn

50 55 60

Pro Ala Arg Gln Ala Leu Leu Lys Ser Gly Leu Ala Glu Thr Val Cys

65 70 75 80

Gly Phe Thr Val Asn Lys Val Cys Gly Ser Gly Leu Lys Ser Val Ala

85 90 95

Leu Ala Ala Gln Ala Ile Gln Ala Gly Gln Ala Gln Ser Ile Val Ala

100 105 110

Gly Gly Met Glu Asn Met Ser Leu Ala Pro Tyr Leu Leu Asp Ala Lys

115 120 125

Ala Arg Ser Gly Tyr Arg Leu Gly Asp Gly Gln Val Tyr Asp Val Ile

130 135 140

Leu Arg Asp Gly Leu Met Cys Ala Thr His Gly Tyr His Met Gly Ile

145 150 155 160

Thr Ala Glu Asn Val Ala Lys Glu Tyr Gly Ile Thr Arg Glu Met Gln

165 170 175

Asp Glu Leu Ala Leu His Ser Gln Arg Lys Ala Ala Ala Ala Ile Glu

180 185 190

Ser Gly Ala Phe Thr Ala Glu Ile Val Pro Val Asn Val Val Thr Arg

195 200 205

Lys Lys Thr Phe Val Phe Ser Gln Asp Glu Phe Pro Lys Ala Asn Ser

210 215 220

Thr Ala Glu Ala Leu Gly Ala Leu Arg Pro Ala Phe Asp Lys Ala Gly

225 230 235 240

Thr Val Thr Ala Gly Asn Ala Ser Gly Ile Asn Asp Gly Ala Ala Ala

245 250 255

Leu Val Ile Met Glu Glu Ser Ala Ala Leu Ala Ala Gly Leu Thr Pro

260 265 270

Leu Ala Arg Ile Lys Ser Tyr Ala Ser Gly Gly Val Pro Pro Ala Leu

275 280 285

Met Gly Met Gly Pro Val Pro Ala Thr Gln Lys Ala Leu Gln Leu Ala

290 295 300

Gly Leu Gln Leu Ala Asp Ile Asp Leu Ile Glu Ala Asn Glu Ala Phe

305 310 315 320

Ala Ala Gln Phe Leu Ala Val Gly Lys Asn Leu Gly Phe Asp Ser Glu

325 330 335

Lys Val Asn Val Asn Gly Gly Ala Ile Ala Leu Gly His Pro Ile Gly

340 345 350

Ala Ser Gly Ala Arg Ile Leu Val Thr Leu Leu His Ala Met Gln Ala

355 360 365

Arg Asp Lys Thr Leu Gly Leu Ala Thr Leu Cys Ile Gly Gly Gly Gln

370 375 380

Gly Ile Ala Met Val Ile Glu Arg Leu Asn

385 390

<210> 38

<211> 1197

<212> DNA

<213> 酿酒酵母

<400> 38

atgtctcaga acgtttacat tgtatcgact gccagaaccc caattggttc attccagggt 60

tctctatcct ccaagacagc agtggaattg ggtgctgttg ctttaaaagg cgccttggct 120

aaggttccag aattggatgc atccaaggat tttgacgaaa ttatttttgg taacgttctt 180

tctgccaatt tgggccaagc tccggccaga caagttgctt tggctgccgg tttgagtaat 240

catatcgttg caagcacagt taacaaggtc tgtgcatccg ctatgaaggc aatcattttg 300

ggtgctcaat ccatcaaatg tggtaatgct gatgttgtcg tagctggtgg ttgtgaatct 360

atgactaacg caccatacta catgccagca gcccgtgcgg gtgccaaatt tggccaaact 420

gttcttgttg atggtgtcga aagagatggg ttgaacgatg cgtacgatgg tctagccatg 480

ggtgtacacg cagaaaagtg tgcccgtgat tgggatatta ctagagaaca acaagacaat 540

tttgccatcg aatcctacca aaaatctcaa aaatctcaaa aggaaggtaa attcgacaat 600

gaaattgtac ctgttaccat taagggattt agaggtaagc ctgatactca agtcacgaag 660

gacgaggaac ctgctagatt acacgttgaa aaattgagat ctgcaaggac tgttttccaa 720

aaagaaaacg gtactgttac tgccgctaac gcttctccaa tcaacgatgg tgctgcagcc 780

gtcatcttgg tttccgaaaa agttttgaag gaaaagaatt tgaagccttt ggctattatc 840

aaaggttggg gtgaggccgc tcatcaacca gctgatttta catgggctcc atctcttgca 900

gttccaaagg ctttgaaaca tgctggcatc gaagacatca attctgttga ttactttgaa 960

ttcaatgaag ccttttcggt tgtcggtttg gtgaacacta agattttgaa gctagaccca 1020

tctaaggtta atgtatatgg tggtgctgtt gctctaggtc acccattggg ttgttctggt 1080

gctagagtgg ttgttacact gctatccatc ttacagcaag aaggaggtaa gatcggtgtt 1140

gccgccattt gtaatggtgg tggtggtgct tcctctattg tcattgaaaa gatatga 1197

<210> 39

<211> 1197

<212> DNA

<213> 人工序列

<220>

<223> 密码子优化的酿酒酵母序列

<400> 39

atgtctcaga acgtttacat tgtatcgact gccagaaccc caattggttc attccagggt 60

tctctatcct ccaagacagc agtggaattg ggtgctgttg ctttaaaagg cgccttggct 120

aaggttccag aattggatgc atccaaggat tttgacgaaa ttatttttgg taacgttctt 180

tctgccaatt tgggccaagc tccggccaga caagttgctt tggctgccgg tttgagtaat 240

catatcgttg caagcacagt taacaaggtc tgtgcatccg ctatgaaggc aatcattttg 300

ggtgctcaat ccatcaaatg tggtaatgct gatgttgtcg tagctggtgg ttgtgaatct 360

atgactaacg caccatacta catgccagca gcccgtgcgg gtgccaaatt tggccaaact 420

gttcttgttg atggtgtcga aagagatggg ttgaacgatg cgtacgatgg tctagccatg 480

ggtgtacacg cagaaaagtg tgcccgtgat tgggatatta ctagagaaca acaagacaat 540

tttgccatcg aatcctacca aaaatctcaa aaatctcaaa aggaaggtaa attcgacaat 600

gaaattgtac ctgttaccat taagggattt agaggtaagc ctgatactca agtcacgaag 660

gacgaggaac ctgctagatt acacgttgaa aaattgagat ctgcaaggac tgttttccaa 720

aaagaaaacg gtactgttac tgccgctaac gcttctccaa tcaacgatgg tgctgcagcc 780

gtcatcttgg tttccgaaaa agttttgaag gaaaagaatt tgaagccttt ggctattatc 840

aaaggttggg gtgaggccgc tcatcaacca gctgatttta catgggctcc atctcttgca 900

gttccaaagg ctttgaaaca tgctggcatc gaagacatca attctgttga ttactttgaa 960

ttcaatgaag ccttttcggt tgtcggtttg gtgaacacta agattttgaa gctagaccca 1020

tctaaggtta atgtatatgg tggtgctgtt gctctaggtc acccattggg ttgttctggt 1080

gctagagtgg ttgttacact gctatccatc ttacagcaag aaggaggtaa gatcggtgtt 1140

gccgccattt gtaatggtgg tggtggtgct tcctctattg tcattgaaaa gatatga 1197

<210> 40

<211> 398

<212> PRT

<213> 酿酒酵母

<400> 40

Met Ser Gln Asn Val Tyr Ile Val Ser Thr Ala Arg Thr Pro Ile Gly

1 5 10 15

Ser Phe Gln Gly Ser Leu Ser Ser Lys Thr Ala Val Glu Leu Gly Ala

20 25 30

Val Ala Leu Lys Gly Ala Leu Ala Lys Val Pro Glu Leu Asp Ala Ser

35 40 45

Lys Asp Phe Asp Glu Ile Ile Phe Gly Asn Val Leu Ser Ala Asn Leu

50 55 60

Gly Gln Ala Pro Ala Arg Gln Val Ala Leu Ala Ala Gly Leu Ser Asn

65 70 75 80

His Ile Val Ala Ser Thr Val Asn Lys Val Cys Ala Ser Ala Met Lys

85 90 95

Ala Ile Ile Leu Gly Ala Gln Ser Ile Lys Cys Gly Asn Ala Asp Val

100 105 110

Val Val Ala Gly Gly Cys Glu Ser Met Thr Asn Ala Pro Tyr Tyr Met

115 120 125

Pro Ala Ala Arg Ala Gly Ala Lys Phe Gly Gln Thr Val Leu Val Asp

130 135 140

Gly Val Glu Arg Asp Gly Leu Asn Asp Ala Tyr Asp Gly Leu Ala Met

145 150 155 160

Gly Val His Ala Glu Lys Cys Ala Arg Asp Trp Asp Ile Thr Arg Glu

165 170 175

Gln Gln Asp Asn Phe Ala Ile Glu Ser Tyr Gln Lys Ser Gln Lys Ser

180 185 190

Gln Lys Glu Gly Lys Phe Asp Asn Glu Ile Val Pro Val Thr Ile Lys

195 200 205

Gly Phe Arg Gly Lys Pro Asp Thr Gln Val Thr Lys Asp Glu Glu Pro

210 215 220

Ala Arg Leu His Val Glu Lys Leu Arg Ser Ala Arg Thr Val Phe Gln

225 230 235 240

Lys Glu Asn Gly Thr Val Thr Ala Ala Asn Ala Ser Pro Ile Asn Asp

245 250 255

Gly Ala Ala Ala Val Ile Leu Val Ser Glu Lys Val Leu Lys Glu Lys

260 265 270

Asn Leu Lys Pro Leu Ala Ile Ile Lys Gly Trp Gly Glu Ala Ala His

275 280 285

Gln Pro Ala Asp Phe Thr Trp Ala Pro Ser Leu Ala Val Pro Lys Ala

290 295 300

Leu Lys His Ala Gly Ile Glu Asp Ile Asn Ser Val Asp Tyr Phe Glu

305 310 315 320

Phe Asn Glu Ala Phe Ser Val Val Gly Leu Val Asn Thr Lys Ile Leu

325 330 335

Lys Leu Asp Pro Ser Lys Val Asn Val Tyr Gly Gly Ala Val Ala Leu

340 345 350

Gly His Pro Leu Gly Cys Ser Gly Ala Arg Val Val Val Thr Leu Leu

355 360 365

Ser Ile Leu Gln Gln Glu Gly Gly Lys Ile Gly Val Ala Ala Ile Cys

370 375 380

Asn Gly Gly Gly Gly Ala Ser Ser Ile Val Ile Glu Lys Ile

385 390 395

<210> 41

<211> 651

<212> DNA

<213> 大肠杆菌

<400> 41

atggatgcga aacaacgtat tgcgcgccgt gtggcgcaag agcttcgtga tggtgacatc 60

gttaacttag ggatcggttt acccacaatg gtcgccaatt atttaccgga gggtattcat 120

atcactctgc aatcggaaaa cggcttcctc ggtttaggcc cggtcacgac agcgcatcca 180

gatctggtga acgctggcgg gcaaccgtgc ggtgttttac ccggtgcagc catgtttgat 240

agcgccatgt catttgcgct aatccgtggc ggtcatattg atgcctgcgt gctcggcggt 300

ttgcaagtag acgaagaagc aaacctcgcg aactgggtag tgcctgggaa aatggtgccc 360

ggtatgggtg gcgcgatgga tctggtgacc gggtcgcgca aagtgatcat cgccatggaa 420

cattgcgcca aagatggttc agcaaaaatt ttgcgccgct gcaccatgcc actcactgcg 480

caacatgcgg tgcatatgct ggttactgaa ctggctgtct ttcgttttat tgacggcaaa 540

atgtggctca ccgaaattgc cgacgggtgt gatttagcca ccgtgcgtgc caaaacagaa 600

gctcggtttg aagtcgccgc cgatctgaat acgcaacggg gtgatttatg a 651

<210> 42

<211> 651

<212> DNA

<213> 人工序列

<220>

<223> 密码子优化的大肠杆菌序列

<400> 42

atggatgcga aacaacgtat tgcgcgccgt gtggcgcaag agcttcgtga tggtgacatc 60

gttaacttag ggatcggttt acccacaatg gtcgccaatt atttaccgga gggtattcat 120

atcactctgc aatcggaaaa cggcttcctc ggtttaggcc cggtcacgac agcgcatcca 180

gatctggtga acgctggcgg gcaaccgtgc ggtgttttac ccggtgcagc catgtttgat 240

agcgccatgt catttgcgct aatccgtggc ggtcatattg atgcctgcgt gctcggcggt 300

ttgcaagtag acgaagaagc aaacctcgcg aactgggtag tgcctgggaa aatggtgccc 360

ggtatgggtg gcgcgatgga tctggtgacc gggtcgcgca aagtgatcat cgccatggaa 420

cattgcgcca aagatggttc agcaaaaatt ttgcgccgct gcaccatgcc actcactgcg 480

caacatgcgg tgcatatgct ggttactgaa ctggctgtct ttcgttttat tgacggcaaa 540

atgtggctca ccgaaattgc cgacgggtgt gatttagcca ccgtgcgtgc caaaacagaa 600

gctcggtttg aagtcgccgc cgatctgaat acgcaacggg gtgatttatg a 651

<210> 43

<211> 216

<212> PRT

<213> 大肠杆菌

<400> 43

Met Asp Ala Lys Gln Arg Ile Ala Arg Arg Val Ala Gln Glu Leu Arg

1 5 10 15

Asp Gly Asp Ile Val Asn Leu Gly Ile Gly Leu Pro Thr Met Val Ala

20 25 30

Asn Tyr Leu Pro Glu Gly Ile His Ile Thr Leu Gln Ser Glu Asn Gly

35 40 45

Phe Leu Gly Leu Gly Pro Val Thr Thr Ala His Pro Asp Leu Val Asn

50 55 60

Ala Gly Gly Gln Pro Cys Gly Val Leu Pro Gly Ala Ala Met Phe Asp

65 70 75 80

Ser Ala Met Ser Phe Ala Leu Ile Arg Gly Gly His Ile Asp Ala Cys

85 90 95

Val Leu Gly Gly Leu Gln Val Asp Glu Glu Ala Asn Leu Ala Asn Trp

100 105 110

Val Val Pro Gly Lys Met Val Pro Gly Met Gly Gly Ala Met Asp Leu

115 120 125

Val Thr Gly Ser Arg Lys Val Ile Ile Ala Met Glu His Cys Ala Lys

130 135 140

Asp Gly Ser Ala Lys Ile Leu Arg Arg Cys Thr Met Pro Leu Thr Ala

145 150 155 160

Gln His Ala Val His Met Leu Val Thr Glu Leu Ala Val Phe Arg Phe

165 170 175

Ile Asp Gly Lys Met Trp Leu Thr Glu Ile Ala Asp Gly Cys Asp Leu

180 185 190

Ala Thr Val Arg Ala Lys Thr Glu Ala Arg Phe Glu Val Ala Ala Asp

195 200 205

Leu Asn Thr Gln Arg Gly Asp Leu

210 215

<210> 44

<211> 663

<212> DNA

<213> 大肠杆菌

<400> 44

atgaaaacaa aattgatgac attacaagac gccaccggct tctttcgtga cggcatgacc 60

atcatggtgg gcggatttat ggggattggc actccatccc gcctggttga agcattactg 120

gaatctggtg ttcgcgacct gacattgata gccaatgata ccgcgtttgt tgataccggc 180

atcggtccgc tcatcgtcaa tggtcgagtc cgcaaagtga ttgcttcaca tatcggcacc 240

aacccggaaa caggtcggcg catgatatct ggtgagatgg acgtcgttct ggtgccgcaa 300

ggtacgctaa tcgagcaaat tcgctgtggt ggagctggac ttggtggttt tctcacccca 360

acgggtgtcg gcaccgtcgt agaggaaggc aaacagacac tgacactcga cggtaaaacc 420

tggctgctcg aacgcccact gcgcgccgac ctggcgctaa ttcgcgctca tcgttgcgac 480

acacttggca acctgaccta tcaacttagc gcccgcaact ttaaccccct gatagccctt 540

gcggctgata tcacgctggt agagccagat gaactggtcg aaaccggcga gctgcaacct 600

gaccatattg tcacccctgg tgccgttatc gaccacatca tcgtttcaca ggagagcaaa 660

taa 663

<210> 45

<211> 663

<212> DNA

<213> 人工序列

<220>

<223> 密码子优化的大肠杆菌序列

<400> 45

atgaaaacaa aattgatgac attacaagac gccaccggct tctttcgtga cggcatgacc 60

atcatggtgg gcggatttat ggggattggc actccatccc gcctggttga agcattactg 120

gaatctggtg ttcgcgacct gacattgata gccaatgata ccgcgtttgt tgataccggc 180

atcggtccgc tcatcgtcaa tggtcgagtc cgcaaagtga ttgcttcaca tatcggcacc 240

aacccggaaa caggtcggcg catgatatct ggtgagatgg acgtcgttct ggtgccgcaa 300

ggtacgctaa tcgagcaaat tcgctgtggt ggagctggac ttggtggttt tctcacccca 360

acgggtgtcg gcaccgtcgt agaggaaggc aaacagacac tgacactcga cggtaaaacc 420

tggctgctcg aacgcccact gcgcgccgac ctggcgctaa ttcgcgctca tcgttgcgac 480

acacttggca acctgaccta tcaacttagc gcccgcaact ttaaccccct gatagccctt 540

gcggctgata tcacgctggt agagccagat gaactggtcg aaaccggcga gctgcaacct 600

gaccatattg tcacccctgg tgccgttatc gaccacatca tcgtttcaca ggagagcaaa 660

taa 663

<210> 46

<211> 220

<212> PRT

<213> 大肠杆菌

<400> 46

Met Lys Thr Lys Leu Met Thr Leu Gln Asp Ala Thr Gly Phe Phe Arg

1 5 10 15

Asp Gly Met Thr Ile Met Val Gly Gly Phe Met Gly Ile Gly Thr Pro

20 25 30

Ser Arg Leu Val Glu Ala Leu Leu Glu Ser Gly Val Arg Asp Leu Thr

35 40 45

Leu Ile Ala Asn Asp Thr Ala Phe Val Asp Thr Gly Ile Gly Pro Leu

50 55 60

Ile Val Asn Gly Arg Val Arg Lys Val Ile Ala Ser His Ile Gly Thr

65 70 75 80

Asn Pro Glu Thr Gly Arg Arg Met Ile Ser Gly Glu Met Asp Val Val

85 90 95

Leu Val Pro Gln Gly Thr Leu Ile Glu Gln Ile Arg Cys Gly Gly Ala

100 105 110

Gly Leu Gly Gly Phe Leu Thr Pro Thr Gly Val Gly Thr Val Val Glu

115 120 125

Glu Gly Lys Gln Thr Leu Thr Leu Asp Gly Lys Thr Trp Leu Leu Glu

130 135 140

Arg Pro Leu Arg Ala Asp Leu Ala Leu Ile Arg Ala His Arg Cys Asp

145 150 155 160

Thr Leu Gly Asn Leu Thr Tyr Gln Leu Ser Ala Arg Asn Phe Asn Pro

165 170 175

Leu Ile Ala Leu Ala Ala Asp Ile Thr Leu Val Glu Pro Asp Glu Leu

180 185 190

Val Glu Thr Gly Glu Leu Gln Pro Asp His Ile Val Thr Pro Gly Ala

195 200 205

Val Ile Asp His Ile Ile Val Ser Gln Glu Ser Lys

210 215 220

<210> 47

<211> 735

<212> DNA

<213> 丙酮丁醇梭菌

<400> 47

atgttaaagg atgaagtaat taaacaaatt agcacgccat taacttcgcc tgcatttcct 60

agaggaccct ataaatttca taatcgtgag tattttaaca ttgtatatcg tacagatatg 120

gatgcacttc gtaaagttgt gccagagcct ttagaaattg atgagccctt agtcaggttt 180

gaaattatgg caatgcatga tacgagtgga cttggttgtt atacagaaag cggacaggct 240

attcccgtaa gctttaatgg agttaaggga gattatcttc atatgatgta tttagataat 300

gagcctgcaa ttgcagtagg aagggaatta agtgcatatc ctaaaaagct cgggtatcca 360

aagctttttg tggattcaga tactttagta ggaactttag actatggaaa acttagagtt 420

gcgacagcta caatggggta caaacataaa gccttagatg ctaatgaagc aaaggatcaa 480

atttgtcgcc ctaattatat gttgaaaata atacccaatt atgatggaag ccctagaata 540

tgtgagctta taaatgcgaa aatcacagat gttaccgtac atgaagcttg gacaggacca 600

actcgactgc agttatttga tcacgctatg gcgccactta atgatttgcc agtaaaagag 660

attgtttcta gctctcacat tcttgcagat ataatattgc ctagagctga agttatatat 720

gattatctta agtaa 735

<210> 48

<211> 735

<212> DNA

<213> 人工序列

<220>

<223> 密码子优化的丙酮丁醇梭菌序列

<400> 48

atgctgaagg acgaggttat taagcagatt agcaccccgc tgaccagccc ggcgttcccg 60

cgtggtccgt acaagttcca taatcgcgaa tacttcaaca ttgtgtatcg taccgacatg 120

gatgcgctgc gtaaggtggt tccggagccg ctggaaattg acgagccgct ggttcgtttc 180

gaaatcatgg cgatgcacga taccagcggt ctgggctgct acaccgagag cggtcaggcg 240

attccggtga gctttaacgg tgttaaaggc gactacctgc acatgatgta tctggataac 300

gaaccggcga ttgcggtggg tcgtgagctg agcgcgtacc cgaagaaact gggctatccg 360

aagctgttcg tggacagcga taccctggtg ggcaccctgg actacggcaa actgcgtgtt 420

gcgaccgcga ccatgggcta taagcacaaa gcgctggacg cgaacgaagc gaaggatcag 480

atttgccgtc cgaactacat gctgaaaatc attccgaact atgacggtag cccgcgtatc 540

tgcgaactga ttaacgcgaa gatcaccgat gttaccgttc atgaggcgtg gaccggcccg 600

acccgtctgc aactgtttga ccacgcgatg gcgccgctga acgatctgcc ggtgaaagag 660

atcgttagca gcagccacat cctggcggac atcatcctgc cgcgtgcgga agttatctac 720

gattacctga agtaa 735

<210> 49

<211> 244

<212> PRT

<213> 丙酮丁醇梭菌

<400> 49

Met Leu Lys Asp Glu Val Ile Lys Gln Ile Ser Thr Pro Leu Thr Ser

1 5 10 15

Pro Ala Phe Pro Arg Gly Pro Tyr Lys Phe His Asn Arg Glu Tyr Phe

20 25 30

Asn Ile Val Tyr Arg Thr Asp Met Asp Ala Leu Arg Lys Val Val Pro

35 40 45

Glu Pro Leu Glu Ile Asp Glu Pro Leu Val Arg Phe Glu Ile Met Ala

50 55 60

Met His Asp Thr Ser Gly Leu Gly Cys Tyr Thr Glu Ser Gly Gln Ala

65 70 75 80

Ile Pro Val Ser Phe Asn Gly Val Lys Gly Asp Tyr Leu His Met Met

85 90 95

Tyr Leu Asp Asn Glu Pro Ala Ile Ala Val Gly Arg Glu Leu Ser Ala

100 105 110

Tyr Pro Lys Lys Leu Gly Tyr Pro Lys Leu Phe Val Asp Ser Asp Thr

115 120 125

Leu Val Gly Thr Leu Asp Tyr Gly Lys Leu Arg Val Ala Thr Ala Thr

130 135 140

Met Gly Tyr Lys His Lys Ala Leu Asp Ala Asn Glu Ala Lys Asp Gln

145 150 155 160

Ile Cys Arg Pro Asn Tyr Met Leu Lys Ile Ile Pro Asn Tyr Asp Gly

165 170 175

Ser Pro Arg Ile Cys Glu Leu Ile Asn Ala Lys Ile Thr Asp Val Thr

180 185 190

Val His Glu Ala Trp Thr Gly Pro Thr Arg Leu Gln Leu Phe Asp His

195 200 205

Ala Met Ala Pro Leu Asn Asp Leu Pro Val Lys Glu Ile Val Ser Ser

210 215 220

Ser His Ile Leu Ala Asp Ile Ile Leu Pro Arg Ala Glu Val Ile Tyr

225 230 235 240

Asp Tyr Leu Lys

<210> 50

<211> 741

<212> DNA

<213> 拜氏梭菌（Clostridium beijerinckii）

<400> 50

atgttagaaa gtgaagtatc taaacaaatt acaactccac ttgctgctcc agcgtttcct 60

agaggaccat ataggtttca caatagagaa tatctaaaca ttatttatcg aactgattta 120

gatgctcttc gaaaaatagt accagagcca cttgaattag atagagcata tgttagattt 180

gaaatgatgg ctatgcctga tacaaccgga ctaggctcat atacagaatg tggtcaagct 240

attccagtaa aatataatgg tgttaagggt gactacttgc atatgatgta tctagataat 300

gaacctgcta ttgctgttgg aagagaaagt agcgcttatc caaaaaagct tggctatcca 360

aagctatttg ttgattcaga tactttagtt gggacactta aatatggtac attaccagta 420

gctactgcaa caatgggata taagcacgag cctctagatc ttaaagaagc ctatgctcaa 480

attgcaagac ccaattttat gctaaaaatc attcaaggtt acgatggtaa gccaagaatt 540

tgtgaactaa tatgtgcaga aaatactgat ataactattc acggtgcttg gactggaagt 600

gcacgtctac aattatttag ccatgcacta gctcctcttg ctgatttacc tgtattagag 660

attgtatcag catctcatat cctcacagat ttaactcttg gaacacctaa ggttgtacat 720

gattatcttt cagtaaaata a 741

<210> 51

<211> 741

<212> DNA

<213> 人工序列

<220>

<223> 密码子优化的拜氏梭菌序列

<400> 51

atgctggaga gcgaagttag caaacaaatc accaccccgc tggcggcgcc ggcgttcccg 60

cgtggcccgt accgttttca taaccgtgag tacctgaaca tcatttatcg taccgacctg 120

gatgcgctgc gtaagattgt gccggagccg ctggaactgg accgtgcgta cgttcgtttc 180

gagatgatgg cgatgccgga taccaccggt ctgggcagct acaccgaatg cggtcaggcg 240

atcccggtga agtataacgg tgttaaaggc gactacctgc acatgatgta tctggataac 300

gagccggcga ttgcggtggg tcgtgaaagc agcgcgtacc cgaagaaact gggctatccg 360

aagctgtttg tggacagcga taccctggtg ggcaccctga aatatggcac cctgccggtt 420

gcgaccgcga ccatgggcta caagcacgag ccgctggacc tgaaagaagc gtatgcgcag 480

attgcgcgtc cgaacttcat gctgaagatc attcaaggtt atgacggcaa accgcgtatc 540

tgcgagctga tttgcgcgga aaacaccgat atcaccatcc atggtgcgtg gaccggcagc 600

gcgcgtctgc aactgtttag ccatgcgctg gcgccgctgg cggatctgcc ggtgctggaa 660

atcgttagcg cgagccacat tctgaccgat ctgaccctgg gcaccccgaa ggttgtgcat 720

gactatctga gcgtgaagta a 741

<210> 52

<211> 246

<212> PRT

<213> 拜氏梭菌

<400> 52

Met Leu Glu Ser Glu Val Ser Lys Gln Ile Thr Thr Pro Leu Ala Ala

1 5 10 15

Pro Ala Phe Pro Arg Gly Pro Tyr Arg Phe His Asn Arg Glu Tyr Leu

20 25 30

Asn Ile Ile Tyr Arg Thr Asp Leu Asp Ala Leu Arg Lys Ile Val Pro

35 40 45

Glu Pro Leu Glu Leu Asp Arg Ala Tyr Val Arg Phe Glu Met Met Ala

50 55 60

Met Pro Asp Thr Thr Gly Leu Gly Ser Tyr Thr Glu Cys Gly Gln Ala

65 70 75 80

Ile Pro Val Lys Tyr Asn Gly Val Lys Gly Asp Tyr Leu His Met Met

85 90 95

Tyr Leu Asp Asn Glu Pro Ala Ile Ala Val Gly Arg Glu Ser Ser Ala

100 105 110

Tyr Pro Lys Lys Leu Gly Tyr Pro Lys Leu Phe Val Asp Ser Asp Thr

115 120 125

Leu Val Gly Thr Leu Lys Tyr Gly Thr Leu Pro Val Ala Thr Ala Thr

130 135 140

Met Gly Tyr Lys His Glu Pro Leu Asp Leu Lys Glu Ala Tyr Ala Gln

145 150 155 160

Ile Ala Arg Pro Asn Phe Met Leu Lys Ile Ile Gln Gly Tyr Asp Gly

165 170 175

Lys Pro Arg Ile Cys Glu Leu Ile Cys Ala Glu Asn Thr Asp Ile Thr

180 185 190

Ile His Gly Ala Trp Thr Gly Ser Ala Arg Leu Gln Leu Phe Ser His

195 200 205

Ala Leu Ala Pro Leu Ala Asp Leu Pro Val Leu Glu Ile Val Ser Ala

210 215 220

Ser His Ile Leu Thr Asp Leu Thr Leu Gly Thr Pro Lys Val Val His

225 230 235 240

Asp Tyr Leu Ser Val Lys

245

<210> 53

<211> 770

<212> DNA

<213> 人（Homo sapiens）

<400> 53

atggaagaga agcagatcct gtgcgtgggg ctagtggtgc tggacgtcat cagcctggtg 60

gacaagtacc ctaaggagga ctcggagata aggtgtttgt cccagagatg gcagcgcgga 120

ggcaacgcgt ccaactcctg caccgttctc tccctgctcg gagccccctg tgccttcatg 180

ggctcaatgg ctcctggcca tgttgctgat tttgtcctgg atgacctccg ccgctattct 240

gtggacctac gctacacagt ctttcagacc acaggctccg tccccatcgc cacggtcatc 300

atcaacgagg ccagtggtag ccgcaccatc ctatactatg acaggagcct gccagatgtg 360

tctgctacag actttgagaa ggttgatctg acccagttca agtggatcca cattgagggc 420

cggaacgcat cggagcaggt gaagatgctg cagcggatag acgcacacaa caccaggcag 480

cctccagagc agaagatccg ggtgtccgtg gaggtggaga agccacgaga ggagctcttc 540

cagctgtttg gctacggaga cgtggtgttt gtcagcaaag atgtggccaa gcacttgggg 600

ttccagtcag cagaggaagc cttgaggggc ttgtatggtc gtgtgaggaa aggggctgtg 660

cttgtctgtg cctgggctga ggagggcgcc gacgccctgg gccctgatgg caaattgctc 720

cactcggatg ctttcccgcc accccgcgtg gtggatacac tgggagctgg 770

<210> 54

<211> 897

<212> DNA

<213> 人工序列

<220>

<223> 密码子优化的人序列

<400> 54

atggaggaaa agcaaattct gtgcgttggt ctggtggttc tggacgtgat tagcctggtt 60

gataagtacc cgaaagagga tagcgaaatc cgttgcctga gccagcgttg gcaacgtggt 120

ggcaacgcga gcaatagctg caccgttctg agcctgctgg gtgcgccgtg cgcgttcatg 180

ggtagcatgg cgccgggtca tgttgcggac ttcctggtgg cggattttcg tcgtcgtggt 240

gtggacgtta gccaggttgc gtggcaaagc aagggcgata ccccgagctc ctgctgcatc 300

attaacaaca gcaacggtaa ccgtaccatt gtgctgcacg acaccagcct gccggatgtt 360

agcgcgaccg acttcgagaa ggtggatctg acccagttta aatggattca cattgagggc 420

cgtaacgcga gcgaacaggt taaaatgctg caacgtattg atgcgcacaa cacccgtcag 480

ccgccggaac aaaagattcg tgtgagcgtt gaggtggaaa aaccgcgtga ggaactgttc 540

caactgtttg gttacggcga cgtggttttc gttagcaagg atgtggcgaa acacctgggt 600

tttcaaagcg cggaggaagc gctgcgtggt ctgtatggcc gtgtgcgtaa aggcgcggtt 660

ctggtgtgcg cgtgggcgga ggaaggcgcg gatgcgctgg gtccggatgg caaactgctg 720

cacagcgatg cgttcccgcc gccgcgtgtg gttgacaccc tgggtgcggg cgataccttc 780

aacgcgagcg ttatctttag cctgagccag ggccgtagcg tgcaagaggc gctgcgtttc 840

ggctgccaag ttgcgggtaa aaaatgcggt ctgcaaggct ttgacggtat cgtgtaa 897

<210> 55

<211> 298

<212> PRT

<213> 人

<400> 55

Met Glu Glu Lys Gln Ile Leu Cys Val Gly Leu Val Val Leu Asp Val

1 5 10 15

Ile Ser Leu Val Asp Lys Tyr Pro Lys Glu Asp Ser Glu Ile Arg Cys

20 25 30

Leu Ser Gln Arg Trp Gln Arg Gly Gly Asn Ala Ser Asn Ser Cys Thr

35 40 45

Val Leu Ser Leu Leu Gly Ala Pro Cys Ala Phe Met Gly Ser Met Ala

50 55 60

Pro Gly His Val Ala Asp Phe Leu Val Ala Asp Phe Arg Arg Arg Gly

65 70 75 80

Val Asp Val Ser Gln Val Ala Trp Gln Ser Lys Gly Asp Thr Pro Ser

85 90 95

Ser Cys Cys Ile Ile Asn Asn Ser Asn Gly Asn Arg Thr Ile Val Leu

100 105 110

His Asp Thr Ser Leu Pro Asp Val Ser Ala Thr Asp Phe Glu Lys Val

115 120 125

Asp Leu Thr Gln Phe Lys Trp Ile His Ile Glu Gly Arg Asn Ala Ser

130 135 140

Glu Gln Val Lys Met Leu Gln Arg Ile Asp Ala His Asn Thr Arg Gln

145 150 155 160

Pro Pro Glu Gln Lys Ile Arg Val Ser Val Glu Val Glu Lys Pro Arg

165 170 175

Glu Glu Leu Phe Gln Leu Phe Gly Tyr Gly Asp Val Val Phe Val Ser

180 185 190

Lys Asp Val Ala Lys His Leu Gly Phe Gln Ser Ala Glu Glu Ala Leu

195 200 205

Arg Gly Leu Tyr Gly Arg Val Arg Lys Gly Ala Val Leu Val Cys Ala

210 215 220

Trp Ala Glu Glu Gly Ala Asp Ala Leu Gly Pro Asp Gly Lys Leu Leu

225 230 235 240

His Ser Asp Ala Phe Pro Pro Pro Arg Val Val Asp Thr Leu Gly Ala

245 250 255

Gly Asp Thr Phe Asn Ala Ser Val Ile Phe Ser Leu Ser Gln Gly Arg

260 265 270

Ser Val Gln Glu Ala Leu Arg Phe Gly Cys Gln Val Ala Gly Lys Lys

275 280 285

Cys Gly Leu Gln Gly Phe Asp Gly Ile Val

290 295

<210> 56

<211> 1095

<212> DNA

<213> 人

<400> 56

atggcccacc gatttccagc cctcacccag gagcagaaga aggagctctc agaaattgcc 60

cagagcattg ttgccaatgg aaaggggatc ctggctgcag atgaatctgt aggtaccatg 120

gggaaccgcc tgcagaggat caaggtggaa aacactgaag agaaccgccg gcagttccga 180

gaaatcctct tctctgtgga cagttccatc aaccagagca tcgggggtgt gatccttttc 240

cacgagaccc tctaccagaa ggacagccag ggaaagctgt tcagaaacat cctcaaggaa 300

aaggggatcg tggtgggaat caagttagac caaggaggtg ctcctcttgc aggaacaaac 360

aaagaaacca ccattcaagg gcttgatggc ctctcagagc gctgtgctca gtacaagaaa 420

gatggtgttg actttgggaa gtggcgtgct gtgctgagga ttgccgacca gtgtccatcc 480

agcctcgcta tccaggaaaa cgccaacgcc ctggctcgct acgccagcat ctgtcagcag 540

aatggactgg tacctattgt tgaaccagag gtaattcctg atggagacca tgacctggaa 600

cactgccagt atgttactga gaaggtcctg gctgctgtct acaaggccct gaatgaccat 660

catgtttacc tggagggcac cctgctaaag cccaacatgg tgactgctgg acatgcctgc 720

accaagaagt atactccaga acaagtagct atggccaccg taacagctct ccaccgtact 780

gttcctgcag ctgttcctgg catctgcttt ttgtctggtg gcatgagtga agaggatgcc 840

actctcaacc tcaatgctat caacctttgc cctctaccaa agccctggaa actaagtttc 900

tcttatggac gggccctgca ggccagtgca ctggctgcct ggggtggcaa ggctgcaaac 960

aaggaggcaa cccaggaggc ttttatgaag cgggccatgg ctaactgcca ggcggccaaa 1020

ggacagtatg ttcacacggg ttcttctggg gctgcttcca cccagtcgct cttcacagcc 1080

tgctatacct actag 1095

<210> 57

<211> 1095

<212> DNA

<213> 人工序列

<220>

<223> 密码子优化的人序列

<400> 57

atggcgcacc gttttccggc gctgacccaa gagcagaaga aggagctgag cgagattgcg 60

cagagcatcg tggcgaatgg taaaggtatt ctggcggcgg atgagagcgt tggtaccatg 120

ggcaaccgtc tgcagcgtat taaggtggag aacaccgagg aaaaccgtcg tcaattccgt 180

gaaatcctgt ttagcgttga tagcagcatc aaccagagca ttggtggcgt gatcctgttc 240

cacgaaaccc tgtaccagaa ggacagccaa ggtaaactgt ttcgtaacat tctgaaggaa 300

aaaggtattg tggttggcat caagctggat caaggtggcg cgccgctggc gggcaccaac 360

aaggaaacca ccatccaggg tctggacggc ctgagcgaac gttgcgcgca atataagaaa 420

gatggtgttg acttcggcaa gtggcgtgcg gtgctgcgta ttgcggacca gtgcccgagc 480

agcctggcga tccaagaaaa cgcgaacgcg ctggcgcgtt acgcgagcat ctgccagcaa 540

aacggtctgg tgccgattgt tgagccggaa gttatcccgg acggcgatca cgacctggag 600

cactgccagt atgtgaccga aaaggttctg gcggcggtgt acaaagcgct gaacgatcac 660

cacgtttatc tggagggtac cctgctgaaa ccgaacatgg tgaccgcggg ccatgcgtgc 720

accaagaaat acaccccgga acaggtggcg atggcgaccg tgaccgcgct gcaccgtacc 780

gttccggcgg cggtgccggg tatttgcttt ctgagcggtg gcatgagcga agaggacgcg 840

accctgaacc tgaacgcgat caacctgtgc ccgctgccga agccgtggaa actgagcttc 900

agctacggcc gtgcgctgca ggcgagcgcg ctggcggcgt ggggtggcaa ggcggcgaac 960

aaagaggcga cccaagaagc gtttatgaag cgtgcgatgg cgaactgcca ggcggcgaaa 1020

ggtcaatatg tgcataccgg cagcagcggt gcggcgagca cccagagcct gtttaccgcg 1080

tgctatacct attaa 1095

<210> 58

<211> 364

<212> PRT

<213> 人

<400> 58

Met Ala His Arg Phe Pro Ala Leu Thr Gln Glu Gln Lys Lys Glu Leu

1 5 10 15

Ser Glu Ile Ala Gln Ser Ile Val Ala Asn Gly Lys Gly Ile Leu Ala

20 25 30

Ala Asp Glu Ser Val Gly Thr Met Gly Asn Arg Leu Gln Arg Ile Lys

35 40 45

Val Glu Asn Thr Glu Glu Asn Arg Arg Gln Phe Arg Glu Ile Leu Phe

50 55 60

Ser Val Asp Ser Ser Ile Asn Gln Ser Ile Gly Gly Val Ile Leu Phe

65 70 75 80

His Glu Thr Leu Tyr Gln Lys Asp Ser Gln Gly Lys Leu Phe Arg Asn

85 90 95

Ile Leu Lys Glu Lys Gly Ile Val Val Gly Ile Lys Leu Asp Gln Gly

100 105 110

Gly Ala Pro Leu Ala Gly Thr Asn Lys Glu Thr Thr Ile Gln Gly Leu

115 120 125

Asp Gly Leu Ser Glu Arg Cys Ala Gln Tyr Lys Lys Asp Gly Val Asp

130 135 140

Phe Gly Lys Trp Arg Ala Val Leu Arg Ile Ala Asp Gln Cys Pro Ser

145 150 155 160

Ser Leu Ala Ile Gln Glu Asn Ala Asn Ala Leu Ala Arg Tyr Ala Ser

165 170 175

Ile Cys Gln Gln Asn Gly Leu Val Pro Ile Val Glu Pro Glu Val Ile

180 185 190

Pro Asp Gly Asp His Asp Leu Glu His Cys Gln Tyr Val Thr Glu Lys

195 200 205

Val Leu Ala Ala Val Tyr Lys Ala Leu Asn Asp His His Val Tyr Leu

210 215 220

Glu Gly Thr Leu Leu Lys Pro Asn Met Val Thr Ala Gly His Ala Cys

225 230 235 240

Thr Lys Lys Tyr Thr Pro Glu Gln Val Ala Met Ala Thr Val Thr Ala

245 250 255

Leu His Arg Thr Val Pro Ala Ala Val Pro Gly Ile Cys Phe Leu Ser

260 265 270

Gly Gly Met Ser Glu Glu Asp Ala Thr Leu Asn Leu Asn Ala Ile Asn

275 280 285

Leu Cys Pro Leu Pro Lys Pro Trp Lys Leu Ser Phe Ser Tyr Gly Arg

290 295 300

Ala Leu Gln Ala Ser Ala Leu Ala Ala Trp Gly Gly Lys Ala Ala Asn

305 310 315 320

Lys Glu Ala Thr Gln Glu Ala Phe Met Lys Arg Ala Met Ala Asn Cys

325 330 335

Gln Ala Ala Lys Gly Gln Tyr Val His Thr Gly Ser Ser Gly Ala Ala

340 345 350

Ser Thr Gln Ser Leu Phe Thr Ala Cys Tyr Thr Tyr

355 360

<210> 59

<211> 747

<212> DNA

<213> 新月柄杆菌（Caulobacter crescentus）

<400> 59

atgtcctcag ccatctatcc cagcctgaag ggcaagcgcg tcgtcatcac cggcggcggc 60

tcgggcatcg gggccggcct caccgccggc ttcgcccgtc agggcgcgga ggtgatcttc 120

ctcgacatcg ccgacgagga ctccagggct cttgaggccg agctggccgg ctcgccgatc 180

ccgccggtct acaagcgctg cgacctgatg aacctcgagg cgatcaaggc ggtcttcgcc 240

gagatcggcg acgtcgacgt gctggtcaac aacgccggca atgacgaccg ccacaagctg 300

gccgacgtga ccggcgccta ttgggacgag cggatcaacg tcaacctgcg ccacatgctg 360

ttctgcaccc aggccgtcgc gccgggcatg aagaagcgtg gcggcggggc ggtgatcaac 420

ttcggttcga tcagctggca cctggggctt gaggacctcg tcctctacga aaccgccaag 480

gccggcatcg aaggcatgac ccgcgcgctg gcccgggagc tgggtcccga cgacatccgc 540

gtcacctgcg tggtgccggg caacgtcaag accaagcgcc aggagaagtg gtacacgccc 600

gaaggcgagg cccagatcgt ggcggcccaa tgcctgaagg gccgcatcgt cccggagaac 660

gtcgccgcgc tggtgctgtt cctggcctcg gatgacgcgt cgctctgcac cggccacgaa 720

tactggatcg acgccggctg gcgttga 747

<210> 60

<211> 747

<212> DNA

<213> 人工序列

<220>

<223> 密码子优化的新月柄杆菌序列

<400> 60

atgagcagcg cgatctaccc gagcctgaaa ggtaaacgtg tggtgattac cggcggcggc 60

agcggcattg gtgcgggcct gaccgcgggc ttcgcgcgtc agggtgcgga agtgatcttt 120

ctggacattg cggacgaaga tagccgtgcg ctggaggcgg aactggcggg cagcccgatc 180

ccgccggtgt acaagcgttg cgatctgatg aacctggagg cgatcaaagc ggttttcgcg 240

gaaattggcg acgtggatgt tctggtgaac aacgcgggta acgacgaccg tcacaagctg 300

gcggatgtga ccggtgcgta ttgggatgag cgtattaacg ttaacctgcg tcacatgctg 360

ttctgcaccc aggcggtggc gccgggtatg aagaaacgtg gtggcggtgc ggttatcaac 420

tttggcagca ttagctggca cctgggtctg gaggacctgg tgctgtacga aaccgcgaaa 480

gcgggcatcg agggtatgac ccgtgcgctg gcgcgtgaac tgggtccgga cgatattcgt 540

gtgacctgcg tggttccggg taacgttaag accaaacgtc aagagaagtg gtataccccg 600

gagggtgaag cgcagattgt tgcggcgcaa tgcctgaaag gtcgtattgt tccggaaaac 660

gtggcggcgc tggttctgtt tctggcgagc gatgatgcga gcctgtgcac cggccatgag 720

tattggattg atgcgggctg gcgttaa 747

<210> 61

<211> 248

<212> PRT

<213> 新月柄杆菌

<400> 61

Met Ser Ser Ala Ile Tyr Pro Ser Leu Lys Gly Lys Arg Val Val Ile

1 5 10 15

Thr Gly Gly Gly Ser Gly Ile Gly Ala Gly Leu Thr Ala Gly Phe Ala

20 25 30

Arg Gln Gly Ala Glu Val Ile Phe Leu Asp Ile Ala Asp Glu Asp Ser

35 40 45

Arg Ala Leu Glu Ala Glu Leu Ala Gly Ser Pro Ile Pro Pro Val Tyr

50 55 60

Lys Arg Cys Asp Leu Met Asn Leu Glu Ala Ile Lys Ala Val Phe Ala

65 70 75 80

Glu Ile Gly Asp Val Asp Val Leu Val Asn Asn Ala Gly Asn Asp Asp

85 90 95

Arg His Lys Leu Ala Asp Val Thr Gly Ala Tyr Trp Asp Glu Arg Ile

100 105 110

Asn Val Asn Leu Arg His Met Leu Phe Cys Thr Gln Ala Val Ala Pro

115 120 125

Gly Met Lys Lys Arg Gly Gly Gly Ala Val Ile Asn Phe Gly Ser Ile

130 135 140

Ser Trp His Leu Gly Leu Glu Asp Leu Val Leu Tyr Glu Thr Ala Lys

145 150 155 160

Ala Gly Ile Glu Gly Met Thr Arg Ala Leu Ala Arg Glu Leu Gly Pro

165 170 175

Asp Asp Ile Arg Val Thr Cys Val Val Pro Gly Asn Val Lys Thr Lys

180 185 190

Arg Gln Glu Lys Trp Tyr Thr Pro Glu Gly Glu Ala Gln Ile Val Ala

195 200 205

Ala Gln Cys Leu Lys Gly Arg Ile Val Pro Glu Asn Val Ala Ala Leu

210 215 220

Val Leu Phe Leu Ala Ser Asp Asp Ala Ser Leu Cys Thr Gly His Glu

225 230 235 240

Tyr Trp Ile Asp Ala Gly Trp Arg

245

<210> 62

<211> 1173

<212> DNA

<213> 沃氏富盐菌（Haloferax volcanii）

<400> 62

atgagccccg cccccaccga catcgtcgag gagttcacgc gccgcgactg gcagggagac 60

gacgtgacgg gcaccgtgcg ggtcgccatg atcggcctcg gctggtggac ccgcgacgag 120

gcgattcccg cggtcgaggc gtccgagttc tgcgagacga cggtcgtcgt cagcagttcg 180

aaggagaaag ccgagggcgc gacggcgttg accgagtcga taacccacgg cctcacctac 240

gacgagttcc acgagggggt cgccgccgac gcctacgacg cggtgtacgt cgtcacgccg 300

aacggtctgc atctcccgta cgtcgagacc gccgccgagt tggggaaggc ggtcctctgc 360

gagaaaccgc tggaagcgtc ggtcgagcgg gccgaaaagc tcgtcgccgc ctgcgaccgc 420

gccgacgtgc ccctgatggt cgcctatcgg atgcagaccg agccggccgt ccggcgcgcc 480

cgcgaactcg tcgaggccgg cgtcatcggc gagccggtgt tcgtccacgg ccacatgtcc 540

cagcgcctgc tcgacgaggt cgtccccgac cccgaccagt ggcggctcga ccccgaactc 600

tccggcggcg cgaccgtcat ggacatcggg ctctacccgc tgaacaccgc ccggttcgtc 660

ctcgacgccg accccgtccg cgtcagggcg accgcccgcg tcgacgacga ggcgttcgag 720

gccgtcggcg acgagcacgt cagtttcggc gtcgacttcg acgacggcac gctcgcggtc 780

tgcaccgcca gccagtcggc ttaccagttg agccacctcc gggtgaccgg caccgagggc 840

gaactcgaaa tcgagcccgc gttctacaac cgccaaaagc ggggattccg actgtcgtgg 900

ggggaccagt ccgccgacta cgacttcgag caggtaaacc agatgacgga ggagttcgac 960

tacttcgcgt cccggctcct gtcggattcc gaccccgcgc ccgacggcga ccacgcgctc 1020

gtggacatgc gcgcgatgga cgcgatttac gccgcggcgg agcgcgggac cgatgtcgcc 1080

gtcgacgccg ccgactccga ttccgccgac tccgattccg ccgacgctgc cgccgccaac 1140

cacgacgccg accccgattc cgacgggacg tag 1173

<210> 63

<211> 390

<212> PRT

<213> 沃氏富盐菌

<400> 63

Met Ser Pro Ala Pro Thr Asp Ile Val Glu Glu Phe Thr Arg Arg Asp

1 5 10 15

Trp Gln Gly Asp Asp Val Thr Gly Thr Val Arg Val Ala Met Ile Gly

20 25 30

Leu Gly Trp Trp Thr Arg Asp Glu Ala Ile Pro Ala Val Glu Ala Ser

35 40 45

Glu Phe Cys Glu Thr Thr Val Val Val Ser Ser Ser Lys Glu Lys Ala

50 55 60

Glu Gly Ala Thr Ala Leu Thr Glu Ser Ile Thr His Gly Leu Thr Tyr

65 70 75 80

Asp Glu Phe His Glu Gly Val Ala Ala Asp Ala Tyr Asp Ala Val Tyr

85 90 95

Val Val Thr Pro Asn Gly Leu His Leu Pro Tyr Val Glu Thr Ala Ala

100 105 110

Glu Leu Gly Lys Ala Val Leu Cys Glu Lys Pro Leu Glu Ala Ser Val

115 120 125

Glu Arg Ala Glu Lys Leu Val Ala Ala Cys Asp Arg Ala Asp Val Pro

130 135 140

Leu Met Val Ala Tyr Arg Met Gln Thr Glu Pro Ala Val Arg Arg Ala

145 150 155 160

Arg Glu Leu Val Glu Ala Gly Val Ile Gly Glu Pro Val Phe Val His

165 170 175

Gly His Met Ser Gln Arg Leu Leu Asp Glu Val Val Pro Asp Pro Asp

180 185 190

Gln Trp Arg Leu Asp Pro Glu Leu Ser Gly Gly Ala Thr Val Met Asp

195 200 205

Ile Gly Leu Tyr Pro Leu Asn Thr Ala Arg Phe Val Leu Asp Ala Asp

210 215 220

Pro Val Arg Val Arg Ala Thr Ala Arg Val Asp Asp Glu Ala Phe Glu

225 230 235 240

Ala Val Gly Asp Glu His Val Ser Phe Gly Val Asp Phe Asp Asp Gly

245 250 255

Thr Leu Ala Val Cys Thr Ala Ser Gln Ser Ala Tyr Gln Leu Ser His

260 265 270

Leu Arg Val Thr Gly Thr Glu Gly Glu Leu Glu Ile Glu Pro Ala Phe

275 280 285

Tyr Asn Arg Gln Lys Arg Gly Phe Arg Leu Ser Trp Gly Asp Gln Ser

290 295 300

Ala Asp Tyr Asp Phe Glu Gln Val Asn Gln Met Thr Glu Glu Phe Asp

305 310 315 320

Tyr Phe Ala Ser Arg Leu Leu Ser Asp Ser Asp Pro Ala Pro Asp Gly

325 330 335

Asp His Ala Leu Val Asp Met Arg Ala Met Asp Ala Ile Tyr Ala Ala

340 345 350

Ala Glu Arg Gly Thr Asp Val Ala Val Asp Ala Ala Asp Ser Asp Ser

355 360 365

Ala Asp Ser Asp Ser Ala Asp Ala Ala Ala Ala Asn His Asp Ala Asp

370 375 380

Pro Asp Ser Asp Gly Thr

385 390

<210> 64

<211> 1176

<212> DNA

<213> 未知

<220>

<223> 里氏木霉（Trichoderma reesei）序列

<400> 64

atggcgtctg gaaaccctta caccctgaaa tggggcatca tggccaccgg cggaatcgca 60

gagaccttct gcaaggatct cctgtgcaac cccgcgattc gaggcgccga tgatgtgcgc 120

cacgagattg tggccgtggc ctcttccagc agcagcaaga gagcagagga gttcctccag 180

agaatcgacg gtgcctttga cgccaagacg tacggatcat acccggaact tgtggcagac 240

cccaacgtcg acatcgtcta tgtggcaact ccccacagcc accacttcca gaacaccatg 300

ctggcgctgg aagccggcaa gaacgtcttg tgcgaaaagg ctttcaccgt gacggccgcg 360

caggcccgaa agctggttga gacggccaag gccaagaagc tcttcctgat ggaagctgtg 420

tggacacggt actttccgct gagtatcaag attcgagagc tcattgccgc cggcgagatt 480

ggcactgtct ttcgaacaat cgccgacttg tccatcaacg caaactcaga gcagggtcaa 540

gccctgaaat tcgcagactc acatcgaatg gtcaacccgg acctcgcagg cggtgccacc 600

ttggatctcg gagtctatcc cttgacctgg gtgttccaga ccctgtatca tttgcaaccg 660

gaggaagaca aggaggctcc caccgtggtt gcttccagca acaagtacac cactggcgca 720

gacgagaata ccgccatcat ctgcagcttc cctcgccaca acagcattgg aattgcttcg 780

acgacgatga gggcggacac cgaccccgag aaggacacca ttccggcggt ccgaattcaa 840

ggatccaagg gagaaatcca agtcttcttc ccgacctacc gaccgctcaa gtacaaggtg 900

gtgaagacga acggcgaggc gcagacggtt gactgcccca tccccggaga ccccgcgcgc 960

aagggctcgg gccacggaat gttctgggag gcggacgagt gtgctcgatg ccttcgcgat 1020

ggcaagttgg agagtgccac gttgccatgg aaggagagca ttgtcattat ggaaacgatg 1080

gaggaggcgc tgaggcaggg tggcgtcacg tatccggagc tgattaccac ggatgtctat 1140

gatcccaaga gccctctcaa cacggggaat cagtag 1176

<210> 65

<211> 391

<212> PRT

<213> 未知

<220>

<223> 里氏木霉序列

<400> 65

Met Ala Ser Gly Asn Pro Tyr Thr Leu Lys Trp Gly Ile Met Ala Thr

1 5 10 15

Gly Gly Ile Ala Glu Thr Phe Cys Lys Asp Leu Leu Cys Asn Pro Ala

20 25 30

Ile Arg Gly Ala Asp Asp Val Arg His Glu Ile Val Ala Val Ala Ser

35 40 45

Ser Ser Ser Ser Lys Arg Ala Glu Glu Phe Leu Gln Arg Ile Asp Gly

50 55 60

Ala Phe Asp Ala Lys Thr Tyr Gly Ser Tyr Pro Glu Leu Val Ala Asp

65 70 75 80

Pro Asn Val Asp Ile Val Tyr Val Ala Thr Pro His Ser His His Phe

85 90 95

Gln Asn Thr Met Leu Ala Leu Glu Ala Gly Lys Asn Val Leu Cys Glu

100 105 110

Lys Ala Phe Thr Val Thr Ala Ala Gln Ala Arg Lys Leu Val Glu Thr

115 120 125

Ala Lys Ala Lys Lys Leu Phe Leu Met Glu Ala Val Trp Thr Arg Tyr

130 135 140

Phe Pro Leu Ser Ile Lys Ile Arg Glu Leu Ile Ala Ala Gly Glu Ile

145 150 155 160

Gly Thr Val Phe Arg Thr Ile Ala Asp Leu Ser Ile Asn Ala Asn Ser

165 170 175

Glu Gln Gly Gln Ala Leu Lys Phe Ala Asp Ser His Arg Met Val Asn

180 185 190

Pro Asp Leu Ala Gly Gly Ala Thr Leu Asp Leu Gly Val Tyr Pro Leu

195 200 205

Thr Trp Val Phe Gln Thr Leu Tyr His Leu Gln Pro Glu Glu Asp Lys

210 215 220

Glu Ala Pro Thr Val Val Ala Ser Ser Asn Lys Tyr Thr Thr Gly Ala

225 230 235 240

Asp Glu Asn Thr Ala Ile Ile Cys Ser Phe Pro Arg His Asn Ser Ile

245 250 255

Gly Ile Ala Ser Thr Thr Met Arg Ala Asp Thr Asp Pro Glu Lys Asp

260 265 270

Thr Ile Pro Ala Val Arg Ile Gln Gly Ser Lys Gly Glu Ile Gln Val

275 280 285

Phe Phe Pro Thr Tyr Arg Pro Leu Lys Tyr Lys Val Val Lys Thr Asn

290 295 300

Gly Glu Ala Gln Thr Val Asp Cys Pro Ile Pro Gly Asp Pro Ala Arg

305 310 315 320

Lys Gly Ser Gly His Gly Met Phe Trp Glu Ala Asp Glu Cys Ala Arg

325 330 335

Cys Leu Arg Asp Gly Lys Leu Glu Ser Ala Thr Leu Pro Trp Lys Glu

340 345 350

Ser Ile Val Ile Met Glu Thr Met Glu Glu Ala Leu Arg Gln Gly Gly

355 360 365

Val Thr Tyr Pro Glu Leu Ile Thr Thr Asp Val Tyr Asp Pro Lys Ser

370 375 380

Pro Leu Asn Thr Gly Asn Gln

385 390

<210> 66

<211> 870

<212> DNA

<213> 新月柄杆菌

<400> 66

atgaccgctc aagtcacttg cgtatgggat ctgaaggcca cgttgggcga aggcccgatc 60

tggcatggcg acaccctgtg gttcgtcgac atcaagcagc gtaaaatcca caactaccac 120

cccgccaccg gcgagcgctt cagcttcgac gcgccggatc aggtgacctt cctcgcgccg 180

atcgtcggcg cgaccggctt tgtcgtcggt ctgaagaccg ggattcaccg cttccacccg 240

gccacgggct tcagcctgct gctcgaggtc gaggacgcgg cgctgaacaa ccgccccaac 300

gacgccacgg tcgacgcgca aggccgtctg tggttcggca ccatgcacga cggggaagag 360

aacaatagcg gctcgctcta tcggatggac ctcaccggcg tcgcccggat ggaccgcgac 420

atctgcatca ccaacggccc gtgcgtctcg cccgacggca agaccttcta ccacaccgac 480

accctggaaa agacgatcta cgccttcgac ctggccgagg acggcctgct gtcgaacaag 540

cgcgtcttcg tgcagttcgc cctgggcgac gatgtctatc cggacggttc ggtcgtcgat 600

tccgaaggct atctgtggac cgccctgtgg ggcggtttcg gcgcggtccg cttctcgccg 660

caaggcgacg ccgtgacgcg catcgaactg cccgccccca acgtcaccaa gccctgcttc 720

ggcgggcctg acctgaagac cctctatttc accaccgccc gcaagggcct gagcgacgag 780

accctggccc agtacccgct ggccggcggt gtgttcgccg ttccggtcga tgtggccggc 840

caaccccagc atgaggtccg ccttgtctaa 870

<210> 67

<211> 289

<212> PRT

<213> 新月柄杆菌

<400> 67

Met Thr Ala Gln Val Thr Cys Val Trp Asp Leu Lys Ala Thr Leu Gly

1 5 10 15

Glu Gly Pro Ile Trp His Gly Asp Thr Leu Trp Phe Val Asp Ile Lys

20 25 30

Gln Arg Lys Ile His Asn Tyr His Pro Ala Thr Gly Glu Arg Phe Ser

35 40 45

Phe Asp Ala Pro Asp Gln Val Thr Phe Leu Ala Pro Ile Val Gly Ala

50 55 60

Thr Gly Phe Val Val Gly Leu Lys Thr Gly Ile His Arg Phe His Pro

65 70 75 80

Ala Thr Gly Phe Ser Leu Leu Leu Glu Val Glu Asp Ala Ala Leu Asn

85 90 95

Asn Arg Pro Asn Asp Ala Thr Val Asp Ala Gln Gly Arg Leu Trp Phe

100 105 110

Gly Thr Met His Asp Gly Glu Glu Asn Asn Ser Gly Ser Leu Tyr Arg

115 120 125

Met Asp Leu Thr Gly Val Ala Arg Met Asp Arg Asp Ile Cys Ile Thr

130 135 140

Asn Gly Pro Cys Val Ser Pro Asp Gly Lys Thr Phe Tyr His Thr Asp

145 150 155 160

Thr Leu Glu Lys Thr Ile Tyr Ala Phe Asp Leu Ala Glu Asp Gly Leu

165 170 175

Leu Ser Asn Lys Arg Val Phe Val Gln Phe Ala Leu Gly Asp Asp Val

180 185 190

Tyr Pro Asp Gly Ser Val Val Asp Ser Glu Gly Tyr Leu Trp Thr Ala

195 200 205

Leu Trp Gly Gly Phe Gly Ala Val Arg Phe Ser Pro Gln Gly Asp Ala

210 215 220

Val Thr Arg Ile Glu Leu Pro Ala Pro Asn Val Thr Lys Pro Cys Phe

225 230 235 240

Gly Gly Pro Asp Leu Lys Thr Leu Tyr Phe Thr Thr Ala Arg Lys Gly

245 250 255

Leu Ser Asp Glu Thr Leu Ala Gln Tyr Pro Leu Ala Gly Gly Val Phe

260 265 270

Ala Val Pro Val Asp Val Ala Gly Gln Pro Gln His Glu Val Arg Leu

275 280 285

Val

<210> 68

<211> 1776

<212> DNA

<213> 新月柄杆菌

<400> 68

ttgtctaacc gcacgccccg ccggttccgg tcccgcgatt ggttcgataa ccccgaccat 60

atcgacatga ccgcgctcta tctggagcgc ttcatgaact acgggatcac gccggaggag 120

ctgcgcagcg gcaagccgat catcggcatc gcccagaccg gcagcgacat ctcgccctgc 180

aaccgcatcc acctggacct ggtccagcgg gtgcgggacg ggatccgcga cgccgggggc 240

atccccatgg agttcccggt ccatccgatc ttcgagaact gccgtcgccc gacggcggcg 300

ctggaccgga acctctcgta cctgggtctc gtcgagaccc tgcacggcta tccgatcgac 360

gccgtggttc tgaccaccgg ctgcgacaag accaccccgg ccgggatcat ggccgccacc 420

acggtcaata tcccggccat cgtgctgtcg ggcggcccga tgctggacgg ctggcacgag 480

aacgagctcg tgggctcggg caccgtgatc tggcgctcgc gccgcaagct ggcggccggc 540

gagatcaccg aggaagagtt catcgaccgc gccgccagct cggcgccgtc ggcgggccac 600

tgcaacacca tgggcacggc ctcgaccatg aacgccgtgg ccgaggcgct gggcctgtcg 660

ctgaccggct gcgcggccat ccccgccccc taccgcgagc gcggccagat ggcctacaag 720

accggccagc gcatcgtcga tctggcctat gacgacgtca aaccgctcga catcctgacc 780

aagcaagcct tcgagaacgc catcgccctg gtggcggcgg ccggcggctc gaccaacgcc 840

cagccgcaca tcgtggccat ggcccgtcac gccggcgtcg agatcaccgc cgacgactgg 900

cgcgcggcct atgacatccc gctgatcgtc aacatgcagc cggccggcaa gtatctgggc 960

gagcgcttcc accgagccgg cggcgcgccg gcggtgctgt gggagctgtt gcagcaaggc 1020

cgcctgcacg gcgacgtgct gaccgtcacc ggcaagacga tgagcgagaa cctgcaaggc 1080

cgcgaaacca gcgaccgcga ggtgatcttc ccgtaccacg agccgctggc cgagaaggcc 1140

gggttcctgg ttctcaaggg caacctcttc gacttcgcga tcatgaagtc cagcgtgatc 1200

ggcgaggagt tccgcaagcg ctacctgtcg cagcccggcc aggaaggcgt gttcgaagcc 1260

cgcgccatcg tgttcgacgg ctcggacgac tatcacaagc ggatcaacga tccggccctg 1320

gagatcgacg agcgctgcat cctggtgatc cgcggcgcgg gtccgatcgg ctggcccggc 1380

tcggccgagg tcgtcaacat gcagccgccg gatcaccttc tgaagaaggg gatcatgagc 1440

ctgcccaccc tgggcgatgg ccgtcagtcg ggcaccgccg acagcccctc gatcctgaac 1500

gcctcgcccg aaagcgcgat cggcggcggc ctgtcgtggc tgcgcaccgg cgacaccatc 1560

cgcatcgacc tcaacaccgg ccgctgcgac gccctggtcg acgaggcgac gatcgccgcg 1620

cgcaagcagg acggcatccc ggcggttccc gccaccatga cgccctggca ggaaatctac 1680

cgcgcccacg ccagtcagct cgacaccggc ggcgtgctgg agttcgcggt caagtaccag 1740

gacctggcgg ccaagctgcc ccgccacaac cactga 1776

<210> 69

<211> 591

<212> PRT

<213> 新月柄杆菌

<400> 69

Met Ser Asn Arg Thr Pro Arg Arg Phe Arg Ser Arg Asp Trp Phe Asp

1 5 10 15

Asn Pro Asp His Ile Asp Met Thr Ala Leu Tyr Leu Glu Arg Phe Met

20 25 30

Asn Tyr Gly Ile Thr Pro Glu Glu Leu Arg Ser Gly Lys Pro Ile Ile

35 40 45

Gly Ile Ala Gln Thr Gly Ser Asp Ile Ser Pro Cys Asn Arg Ile His

50 55 60

Leu Asp Leu Val Gln Arg Val Arg Asp Gly Ile Arg Asp Ala Gly Gly

65 70 75 80

Ile Pro Met Glu Phe Pro Val His Pro Ile Phe Glu Asn Cys Arg Arg

85 90 95

Pro Thr Ala Ala Leu Asp Arg Asn Leu Ser Tyr Leu Gly Leu Val Glu

100 105 110

Thr Leu His Gly Tyr Pro Ile Asp Ala Val Val Leu Thr Thr Gly Cys

115 120 125

Asp Lys Thr Thr Pro Ala Gly Ile Met Ala Ala Thr Thr Val Asn Ile

130 135 140

Pro Ala Ile Val Leu Ser Gly Gly Pro Met Leu Asp Gly Trp His Glu

145 150 155 160

Asn Glu Leu Val Gly Ser Gly Thr Val Ile Trp Arg Ser Arg Arg Lys

165 170 175

Leu Ala Ala Gly Glu Ile Thr Glu Glu Glu Phe Ile Asp Arg Ala Ala

180 185 190

Ser Ser Ala Pro Ser Ala Gly His Cys Asn Thr Met Gly Thr Ala Ser

195 200 205

Thr Met Asn Ala Val Ala Glu Ala Leu Gly Leu Ser Leu Thr Gly Cys

210 215 220

Ala Ala Ile Pro Ala Pro Tyr Arg Glu Arg Gly Gln Met Ala Tyr Lys

225 230 235 240

Thr Gly Gln Arg Ile Val Asp Leu Ala Tyr Asp Asp Val Lys Pro Leu

245 250 255

Asp Ile Leu Thr Lys Gln Ala Phe Glu Asn Ala Ile Ala Leu Val Ala

260 265 270

Ala Ala Gly Gly Ser Thr Asn Ala Gln Pro His Ile Val Ala Met Ala

275 280 285

Arg His Ala Gly Val Glu Ile Thr Ala Asp Asp Trp Arg Ala Ala Tyr

290 295 300

Asp Ile Pro Leu Ile Val Asn Met Gln Pro Ala Gly Lys Tyr Leu Gly

305 310 315 320

Glu Arg Phe His Arg Ala Gly Gly Ala Pro Ala Val Leu Trp Glu Leu

325 330 335

Leu Gln Gln Gly Arg Leu His Gly Asp Val Leu Thr Val Thr Gly Lys

340 345 350

Thr Met Ser Glu Asn Leu Gln Gly Arg Glu Thr Ser Asp Arg Glu Val

355 360 365

Ile Phe Pro Tyr His Glu Pro Leu Ala Glu Lys Ala Gly Phe Leu Val

370 375 380

Leu Lys Gly Asn Leu Phe Asp Phe Ala Ile Met Lys Ser Ser Val Ile

385 390 395 400

Gly Glu Glu Phe Arg Lys Arg Tyr Leu Ser Gln Pro Gly Gln Glu Gly

405 410 415

Val Phe Glu Ala Arg Ala Ile Val Phe Asp Gly Ser Asp Asp Tyr His

420 425 430

Lys Arg Ile Asn Asp Pro Ala Leu Glu Ile Asp Glu Arg Cys Ile Leu

435 440 445

Val Ile Arg Gly Ala Gly Pro Ile Gly Trp Pro Gly Ser Ala Glu Val

450 455 460

Val Asn Met Gln Pro Pro Asp His Leu Leu Lys Lys Gly Ile Met Ser

465 470 475 480

Leu Pro Thr Leu Gly Asp Gly Arg Gln Ser Gly Thr Ala Asp Ser Pro

485 490 495

Ser Ile Leu Asn Ala Ser Pro Glu Ser Ala Ile Gly Gly Gly Leu Ser

500 505 510

Trp Leu Arg Thr Gly Asp Thr Ile Arg Ile Asp Leu Asn Thr Gly Arg

515 520 525

Cys Asp Ala Leu Val Asp Glu Ala Thr Ile Ala Ala Arg Lys Gln Asp

530 535 540

Gly Ile Pro Ala Val Pro Ala Thr Met Thr Pro Trp Gln Glu Ile Tyr

545 550 555 560

Arg Ala His Ala Ser Gln Leu Asp Thr Gly Gly Val Leu Glu Phe Ala

565 570 575

Val Lys Tyr Gln Asp Leu Ala Ala Lys Leu Pro Arg His Asn His

580 585 590

<210> 70

<211> 1968

<212> DNA

<213> 大肠杆菌

<400> 70

atgtctgttc gcaatatttt tgctgacgag agccacgata tttacaccgt cagaacgcac 60

gccgatggcc cggacggcga actcccatta accgcagaga tgcttatcaa ccgcccgagc 120

ggggatctgt tcggtatgac catgaatgcc ggaatgggtt ggtctccgga cgagctggat 180

cgggacggta ttttactgct cagtacactc ggtggcttac gcggcgcaga cggtaaaccc 240

gtggcgctgg cgttgcacca ggggcattac gaactggaca tccagatgaa agcggcggcc 300

gaggttatta aagccaacca tgccctgccc tatgccgtgt acgtctccga tccttgtgac 360

gggcgtactc agggtacaac ggggatgttt gattcgctac cataccgaaa tgacgcatcg 420

atggtaatgc gccgccttat tcgctctctg cccgacgcga aagcagttat tggtgtggcg 480

agttgcgata aggggcttcc ggccaccatg atggcactcg ccgcgcagca caacatcgca 540

accgtgctgg tccccggcgg cgcgacgctg cccgcaaagg atggagaaga caacggcaag 600

gtgcaaacca ttggcgcacg cttcgccaat ggcgaattat ctctacagga cgcacgccgt 660

gcgggctgta aagcctgtgc ctcttccggc ggcggctgtc aatttttggg cactgccggg 720

acatctcagg tggtggccga aggattggga ctggcaatcc cacattcagc cctggcccct 780

tccggtgagc ctgtgtggcg ggagatcgcc agagcttccg cgcgagctgc gctgaacctg 840

agtcaaaaag gcatcaccac ccgggaaatt ctcaccgata aagcgataga gaatgcgatg 900

acggtccatg ccgcgttcgg tggttcaaca aacctgctgt tacacatccc ggcaattgct 960

caccaggcag gttgccatat cccgaccgtt gatgactgga tccgcatcaa caagcgcgtg 1020

ccccgactgg tgagcgtact gcctaatggc ccggtttatc atccaacggt caatgccttt 1080

atggcaggtg gtgtgccgga agtcatgttg catctgcgca gcctcggatt gttgcatgaa 1140

gacgttatga cggttaccgg cagcacgctg aaagaaaacc tcgactggtg ggagcactcc 1200

gaacggcgtc agcggttcaa gcaactcctg ctcgatcagg aacaaatcaa cgctgacgaa 1260

gtgatcatgt ctccgcagca agcaaaagcg cgcggattaa cctcaactat caccttcccg 1320

gtgggcaata ttgcgccaga aggttcggtg atcaaatcca ccgccattga cccctcgatg 1380

attgatgagc aaggtatcta ttaccataaa ggtgtggcga aggtttatct gtccgagaaa 1440

agtgcgattt acgatatcaa acatgacaag atcaaggcgg gcgatattct ggtcattatt 1500

ggcgttggac cttcaggtac agggatggaa gaaacctacc aggttaccag tgccctgaag 1560

catctgtcat acggtaagca tgtttcgtta atcaccgatg cacgtttctc gggcgtttct 1620

actggcgcgt gcatcggcca tgtggggcca gaagcgctgg ccggaggccc catcggtaaa 1680

ttacgcaccg gggatttaat tgaaattaaa attgattgtc gcgagcttca cggcgaagtc 1740

aatttcctcg gaacccgtag cgatgaacaa ttaccttcac aggaggaggc aactgcaata 1800

ttaaatgcca gacccagcca tcaggattta cttcccgatc ctgaattgcc agatgatacc 1860

cggctatggg caatgcttca ggccgtgagt ggtgggacat ggaccggttg tatttatgat 1920

gtaaacaaaa ttggcgcggc tttgcgcgat tttatgaata aaaactga 1968

<210> 71

<211> 1968

<212> DNA

<213> 人工序列

<220>

<223> 密码子优化的大肠杆菌序列

<400> 71

atgtctgttc gcaatatttt tgctgacgag agccacgata tttacaccgt cagaacgcac 60

gccgatggcc cggacggcga actcccatta accgcagaga tgcttatcaa ccgcccgagc 120

ggggatctgt tcggtatgac catgaatgcc ggaatgggtt ggtctccgga cgagctggat 180

cgggacggta ttttactgct cagtacactc ggtggcttac gcggcgcaga cggtaaaccc 240

gtggcgctgg cgttgcacca ggggcattac gaactggaca tccagatgaa agcggcggcc 300

gaggttatta aagccaacca tgccctgccc tatgccgtgt acgtctccga tccttgtgac 360

gggcgtactc agggtacaac ggggatgttt gattcgctac cataccgaaa tgacgcatcg 420

atggtaatgc gccgccttat tcgctctctg cccgacgcga aagcagttat tggtgtggcg 480

agttgcgata aggggcttcc ggccaccatg atggcactcg ccgcgcagca caacatcgca 540

accgtgctgg tccccggcgg cgcgacgctg cccgcaaagg atggagaaga caacggcaag 600

gtgcaaacca ttggcgcacg cttcgccaat ggcgaattat ctctacagga cgcacgccgt 660

gcgggctgta aagcctgtgc ctcttccggc ggcggctgtc aatttttggg cactgccggg 720

acatctcagg tggtggccga aggattggga ctggcaatcc cacattcagc cctggcccct 780

tccggtgagc ctgtgtggcg ggagatcgcc agagcttccg cgcgagctgc gctgaacctg 840

agtcaaaaag gcatcaccac ccgggaaatt ctcaccgata aagcgataga gaatgcgatg 900

acggtccatg ccgcgttcgg tggttcaaca aacctgctgt tacacatccc ggcaattgct 960

caccaggcag gttgccatat cccgaccgtt gatgactgga tccgcatcaa caagcgcgtg 1020

ccccgactgg tgagcgtact gcctaatggc ccggtttatc atccaacggt caatgccttt 1080

atggcaggtg gtgtgccgga agtcatgttg catctgcgca gcctcggatt gttgcatgaa 1140

gacgttatga cggttaccgg cagcacgctg aaagaaaacc tcgactggtg ggagcactcc 1200

gaacggcgtc agcggttcaa gcaactcctg ctcgatcagg aacaaatcaa cgctgacgaa 1260

gtgatcatgt ctccgcagca agcaaaagcg cgcggattaa cctcaactat caccttcccg 1320

gtgggcaata ttgcgccaga aggttcggtg atcaaatcca ccgccattga cccctcgatg 1380

attgatgagc aaggtatcta ttaccataaa ggtgtggcga aggtttatct gtccgagaaa 1440

agtgcgattt acgatatcaa acatgacaag atcaaggcgg gcgatattct ggtcattatt 1500

ggcgttggac cttcaggtac agggatggaa gaaacctacc aggttaccag tgccctgaag 1560

catctgtcat acggtaagca tgtttcgtta atcaccgatg cacgtttctc gggcgtttct 1620

actggcgcgt gcatcggcca tgtggggcca gaagcgctgg ccggaggccc catcggtaaa 1680

ttacgcaccg gggatttaat tgaaattaaa attgattgtc gcgagcttca cggcgaagtc 1740

aatttcctcg gaacccgtag cgatgaacaa ttaccttcac aggaggaggc aactgcaata 1800

ttaaatgcca gacccagcca tcaggattta cttcccgatc ctgaattgcc agatgatacc 1860

cggctatggg caatgcttca ggccgtgagt ggtgggacat ggaccggttg tatttatgat 1920

gtaaacaaaa ttggcgcggc tttgcgcgat tttatgaata aaaactga 1968

<210> 72

<211> 655

<212> PRT

<213> 大肠杆菌

<400> 72

Met Ser Val Arg Asn Ile Phe Ala Asp Glu Ser His Asp Ile Tyr Thr

1 5 10 15

Val Arg Thr His Ala Asp Gly Pro Asp Gly Glu Leu Pro Leu Thr Ala

20 25 30

Glu Met Leu Ile Asn Arg Pro Ser Gly Asp Leu Phe Gly Met Thr Met

35 40 45

Asn Ala Gly Met Gly Trp Ser Pro Asp Glu Leu Asp Arg Asp Gly Ile

50 55 60

Leu Leu Leu Ser Thr Leu Gly Gly Leu Arg Gly Ala Asp Gly Lys Pro

65 70 75 80

Val Ala Leu Ala Leu His Gln Gly His Tyr Glu Leu Asp Ile Gln Met

85 90 95

Lys Ala Ala Ala Glu Val Ile Lys Ala Asn His Ala Leu Pro Tyr Ala

100 105 110

Val Tyr Val Ser Asp Pro Cys Asp Gly Arg Thr Gln Gly Thr Thr Gly

115 120 125

Met Phe Asp Ser Leu Pro Tyr Arg Asn Asp Ala Ser Met Val Met Arg

130 135 140

Arg Leu Ile Arg Ser Leu Pro Asp Ala Lys Ala Val Ile Gly Val Ala

145 150 155 160

Ser Cys Asp Lys Gly Leu Pro Ala Thr Met Met Ala Leu Ala Ala Gln

165 170 175

His Asn Ile Ala Thr Val Leu Val Pro Gly Gly Ala Thr Leu Pro Ala

180 185 190

Lys Asp Gly Glu Asp Asn Gly Lys Val Gln Thr Ile Gly Ala Arg Phe

195 200 205

Ala Asn Gly Glu Leu Ser Leu Gln Asp Ala Arg Arg Ala Gly Cys Lys

210 215 220

Ala Cys Ala Ser Ser Gly Gly Gly Cys Gln Phe Leu Gly Thr Ala Gly

225 230 235 240

Thr Ser Gln Val Val Ala Glu Gly Leu Gly Leu Ala Ile Pro His Ser

245 250 255

Ala Leu Ala Pro Ser Gly Glu Pro Val Trp Arg Glu Ile Ala Arg Ala

260 265 270

Ser Ala Arg Ala Ala Leu Asn Leu Ser Gln Lys Gly Ile Thr Thr Arg

275 280 285

Glu Ile Leu Thr Asp Lys Ala Ile Glu Asn Ala Met Thr Val His Ala

290 295 300

Ala Phe Gly Gly Ser Thr Asn Leu Leu Leu His Ile Pro Ala Ile Ala

305 310 315 320

His Gln Ala Gly Cys His Ile Pro Thr Val Asp Asp Trp Ile Arg Ile

325 330 335

Asn Lys Arg Val Pro Arg Leu Val Ser Val Leu Pro Asn Gly Pro Val

340 345 350

Tyr His Pro Thr Val Asn Ala Phe Met Ala Gly Gly Val Pro Glu Val

355 360 365

Met Leu His Leu Arg Ser Leu Gly Leu Leu His Glu Asp Val Met Thr

370 375 380

Val Thr Gly Ser Thr Leu Lys Glu Asn Leu Asp Trp Trp Glu His Ser

385 390 395 400

Glu Arg Arg Gln Arg Phe Lys Gln Leu Leu Leu Asp Gln Glu Gln Ile

405 410 415

Asn Ala Asp Glu Val Ile Met Ser Pro Gln Gln Ala Lys Ala Arg Gly

420 425 430

Leu Thr Ser Thr Ile Thr Phe Pro Val Gly Asn Ile Ala Pro Glu Gly

435 440 445

Ser Val Ile Lys Ser Thr Ala Ile Asp Pro Ser Met Ile Asp Glu Gln

450 455 460

Gly Ile Tyr Tyr His Lys Gly Val Ala Lys Val Tyr Leu Ser Glu Lys

465 470 475 480

Ser Ala Ile Tyr Asp Ile Lys His Asp Lys Ile Lys Ala Gly Asp Ile

485 490 495

Leu Val Ile Ile Gly Val Gly Pro Ser Gly Thr Gly Met Glu Glu Thr

500 505 510

Tyr Gln Val Thr Ser Ala Leu Lys His Leu Ser Tyr Gly Lys His Val

515 520 525

Ser Leu Ile Thr Asp Ala Arg Phe Ser Gly Val Ser Thr Gly Ala Cys

530 535 540

Ile Gly His Val Gly Pro Glu Ala Leu Ala Gly Gly Pro Ile Gly Lys

545 550 555 560

Leu Arg Thr Gly Asp Leu Ile Glu Ile Lys Ile Asp Cys Arg Glu Leu

565 570 575

His Gly Glu Val Asn Phe Leu Gly Thr Arg Ser Asp Glu Gln Leu Pro

580 585 590

Ser Gln Glu Glu Ala Thr Ala Ile Leu Asn Ala Arg Pro Ser His Gln

595 600 605

Asp Leu Leu Pro Asp Pro Glu Leu Pro Asp Asp Thr Arg Leu Trp Ala

610 615 620

Met Leu Gln Ala Val Ser Gly Gly Thr Trp Thr Gly Cys Ile Tyr Asp

625 630 635 640

Val Asn Lys Ile Gly Ala Ala Leu Arg Asp Phe Met Asn Lys Asn

645 650 655

<210> 73

<211> 1968

<212> DNA

<213> 大肠杆菌

<400> 73

atgaccattg agaaaatttt caccccgcag gacgacgcgt tttatgcggt gatcacccac 60

gcggcggggc cgcagggcgc tctgccgctg accccgcaga tgctgatgga atctcccagc 120

ggcaacctgt tcggcatgac gcagaacgcc gggatgggct gggacgccaa caagctcacc 180

ggcaaagagg tgctgattat cggcactcag ggcggcatcc gcgccggaga cggacgccca 240

atcgcgctgg gctaccacac cgggcattgg gagatcggca tgcagatgca ggcggcggcg 300

aaggagatca cccgcaatgg cgggatcccg ttcgcggcct tcgtcagcga tccgtgcgac 360

gggcgctcgc agggcacgca cggtatgttc gattccctgc cgtaccgcaa cgacgcggcg 420

atcgtgtttc gccgcctgat ccgctccctg ccgacgcggc gggcggtgat cggcgtagcg 480

acctgcgata aagggctgcc cgccaccatg attgcgctgg ccgcgatgca cgacctgccg 540

actattctgg tgccgggcgg ggcgacgctg ccgccgaccg tcggggaaga cgcgggcaag 600

gtgcagacca tcggcgcgcg tttcgccaac cacgaactct ccctgcagga ggccgccgaa 660

ctgggctgtc gcgcctgcgc ctcgccgggc ggcgggtgtc agttcctcgg cacggcgggc 720

acctcgcagg tggtcgcgga ggcgctgggt ctggcgctgc cgcactccgc gctggcgccg 780

tccgggcagg cggtgtggct ggagatcgcc cgccagtcgg cgcgcgcggt cagcgagctg 840

gatagccgcg gcatcaccac gcgggatatc ctctccgata aagccatcga aaacgcgatg 900

gtgatccacg cggcgttcgg cggctccacc aatttactgc tgcacattcc ggccatcgcc 960

cacgcggcgg gctgcacgat cccggacgtt gagcactgga cgcgcatcaa ccgtaaagtg 1020

ccgcgtctgg tgagcgtgct gcccaacggc ccggactatc acccgaccgt gcgcgccttc 1080

ctcgcgggcg gcgtgccgga ggtgatgctc cacctgcgcg acctcggcct gctgcatctg 1140

gacgccatga ccgtgaccgg ccagacggtg ggcgagaacc ttgaatggtg gcaggcgtcc 1200

gagcgccggg cgcgcttccg ccagtgcctg cgcgagcagg acggcgtaga gccggatgac 1260

gtgatcctgc cgccggagaa ggcaaaagcg aaagggctga cctcgacggt ctgcttcccg 1320

acgggcaaca tcgctccgga aggttcggtg atcaaggcca cggcgatcga cccgtcggtg 1380

gtgggcgaag atggcgtata ccaccacacc ggccgggtgc gggtgtttgt ctcggaagcg 1440

caggcgatca aggcgatcaa gcgggaagag attgtgcagg gcgatatcat ggtggtgatc 1500

ggcggcgggc cgtccggcac cggcatggaa gagacctacc agctcacctc cgcgctaaag 1560

catatctcgt ggggcaagac ggtgtcgctc atcaccgatg cgcgcttctc gggcgtgtcg 1620

acgggcgcct gcttcggcca cgtgtcgccg gaggcgctgg cgggcgggcc gattggcaag 1680

ctgcgcgata acgacatcat cgagattgcc gtggatcgtc tgacgttaac tggcagcgtg 1740

aacttcatcg gcaccgcgga caacccgctg acgccggaag agggcgcgcg cgagctggcg 1800

cggcggcaga cgcacccgga cctgcacgcc cacgactttt tgccggacga cacccggctg 1860

tgggcggcac tgcagtcggt gagcggcggc acctggaaag gctgtattta tgacaccgat 1920

aaaattatcg aggtaattaa cgccggtaaa aaagcgctcg gaatttaa 1968

<210> 74

<211> 1968

<212> DNA

<213> 人工序列

<220>

<223> 密码子优化的大肠杆菌序列

<400> 74

atgaccattg agaaaatttt caccccgcag gacgacgcgt tttatgcggt gatcacccac 60

gcggcggggc cgcagggcgc tctgccgctg accccgcaga tgctgatgga atctcccagc 120

ggcaacctgt tcggcatgac gcagaacgcc gggatgggct gggacgccaa caagctcacc 180

ggcaaagagg tgctgattat cggcactcag ggcggcatcc gcgccggaga cggacgccca 240

atcgcgctgg gctaccacac cgggcattgg gagatcggca tgcagatgca ggcggcggcg 300

aaggagatca cccgcaatgg cgggatcccg ttcgcggcct tcgtcagcga tccgtgcgac 360

gggcgctcgc agggcacgca cggtatgttc gattccctgc cgtaccgcaa cgacgcggcg 420

atcgtgtttc gccgcctgat ccgctccctg ccgacgcggc gggcggtgat cggcgtagcg 480

acctgcgata aagggctgcc cgccaccatg attgcgctgg ccgcgatgca cgacctgccg 540

actattctgg tgccgggcgg ggcgacgctg ccgccgaccg tcggggaaga cgcgggcaag 600

gtgcagacca tcggcgcgcg tttcgccaac cacgaactct ccctgcagga ggccgccgaa 660

ctgggctgtc gcgcctgcgc ctcgccgggc ggcgggtgtc agttcctcgg cacggcgggc 720

acctcgcagg tggtcgcgga ggcgctgggt ctggcgctgc cgcactccgc gctggcgccg 780

tccgggcagg cggtgtggct ggagatcgcc cgccagtcgg cgcgcgcggt cagcgagctg 840

gatagccgcg gcatcaccac gcgggatatc ctctccgata aagccatcga aaacgcgatg 900

gtgatccacg cggcgttcgg cggctccacc aatttactgc tgcacattcc ggccatcgcc 960

cacgcggcgg gctgcacgat cccggacgtt gagcactgga cgcgcatcaa ccgtaaagtg 1020

ccgcgtctgg tgagcgtgct gcccaacggc ccggactatc acccgaccgt gcgcgccttc 1080

ctcgcgggcg gcgtgccgga ggtgatgctc cacctgcgcg acctcggcct gctgcatctg 1140

gacgccatga ccgtgaccgg ccagacggtg ggcgagaacc ttgaatggtg gcaggcgtcc 1200

gagcgccggg cgcgcttccg ccagtgcctg cgcgagcagg acggcgtaga gccggatgac 1260

gtgatcctgc cgccggagaa ggcaaaagcg aaagggctga cctcgacggt ctgcttcccg 1320

acgggcaaca tcgctccgga aggttcggtg atcaaggcca cggcgatcga cccgtcggtg 1380

gtgggcgaag atggcgtata ccaccacacc ggccgggtgc gggtgtttgt ctcggaagcg 1440

caggcgatca aggcgatcaa gcgggaagag attgtgcagg gcgatatcat ggtggtgatc 1500

ggcggcgggc cgtccggcac cggcatggaa gagacctacc agctcacctc cgcgctaaag 1560

catatctcgt ggggcaagac ggtgtcgctc atcaccgatg cgcgcttctc gggcgtgtcg 1620

acgggcgcct gcttcggcca cgtgtcgccg gaggcgctgg cgggcgggcc gattggcaag 1680

ctgcgcgata acgacatcat cgagattgcc gtggatcgtc tgacgttaac tggcagcgtg 1740

aacttcatcg gcaccgcgga caacccgctg acgccggaag agggcgcgcg cgagctggcg 1800

cggcggcaga cgcacccgga cctgcacgcc cacgactttt tgccggacga cacccggctg 1860

tgggcggcac tgcagtcggt gagcggcggc acctggaaag gctgtattta tgacaccgat 1920

aaaattatcg aggtaattaa cgccggtaaa aaagcgctcg gaatttaa 1968

<210> 75

<211> 655

<212> PRT

<213> 大肠杆菌

<400> 75

Met Thr Ile Glu Lys Ile Phe Thr Pro Gln Asp Asp Ala Phe Tyr Ala

1 5 10 15

Val Ile Thr His Ala Ala Gly Pro Gln Gly Ala Leu Pro Leu Thr Pro

20 25 30

Gln Met Leu Met Glu Ser Pro Ser Gly Asn Leu Phe Gly Met Thr Gln

35 40 45

Asn Ala Gly Met Gly Trp Asp Ala Asn Lys Leu Thr Gly Lys Glu Val

50 55 60

Leu Ile Ile Gly Thr Gln Gly Gly Ile Arg Ala Gly Asp Gly Arg Pro

65 70 75 80

Ile Ala Leu Gly Tyr His Thr Gly His Trp Glu Ile Gly Met Gln Met

85 90 95

Gln Ala Ala Ala Lys Glu Ile Thr Arg Asn Gly Gly Ile Pro Phe Ala

100 105 110

Ala Phe Val Ser Asp Pro Cys Asp Gly Arg Ser Gln Gly Thr His Gly

115 120 125

Met Phe Asp Ser Leu Pro Tyr Arg Asn Asp Ala Ala Ile Val Phe Arg

130 135 140

Arg Leu Ile Arg Ser Leu Pro Thr Arg Arg Ala Val Ile Gly Val Ala

145 150 155 160

Thr Cys Asp Lys Gly Leu Pro Ala Thr Met Ile Ala Leu Ala Ala Met

165 170 175

His Asp Leu Pro Thr Ile Leu Val Pro Gly Gly Ala Thr Leu Pro Pro

180 185 190

Thr Val Gly Glu Asp Ala Gly Lys Val Gln Thr Ile Gly Ala Arg Phe

195 200 205

Ala Asn His Glu Leu Ser Leu Gln Glu Ala Ala Glu Leu Gly Cys Arg

210 215 220

Ala Cys Ala Ser Pro Gly Gly Gly Cys Gln Phe Leu Gly Thr Ala Gly

225 230 235 240

Thr Ser Gln Val Val Ala Glu Ala Leu Gly Leu Ala Leu Pro His Ser

245 250 255

Ala Leu Ala Pro Ser Gly Gln Ala Val Trp Leu Glu Ile Ala Arg Gln

260 265 270

Ser Ala Arg Ala Val Ser Glu Leu Asp Ser Arg Gly Ile Thr Thr Arg

275 280 285

Asp Ile Leu Ser Asp Lys Ala Ile Glu Asn Ala Met Val Ile His Ala

290 295 300

Ala Phe Gly Gly Ser Thr Asn Leu Leu Leu His Ile Pro Ala Ile Ala

305 310 315 320

His Ala Ala Gly Cys Thr Ile Pro Asp Val Glu His Trp Thr Arg Ile

325 330 335

Asn Arg Lys Val Pro Arg Leu Val Ser Val Leu Pro Asn Gly Pro Asp

340 345 350

Tyr His Pro Thr Val Arg Ala Phe Leu Ala Gly Gly Val Pro Glu Val

355 360 365

Met Leu His Leu Arg Asp Leu Gly Leu Leu His Leu Asp Ala Met Thr

370 375 380

Val Thr Gly Gln Thr Val Gly Glu Asn Leu Glu Trp Trp Gln Ala Ser

385 390 395 400

Glu Arg Arg Ala Arg Phe Arg Gln Cys Leu Arg Glu Gln Asp Gly Val

405 410 415

Glu Pro Asp Asp Val Ile Leu Pro Pro Glu Lys Ala Lys Ala Lys Gly

420 425 430

Leu Thr Ser Thr Val Cys Phe Pro Thr Gly Asn Ile Ala Pro Glu Gly

435 440 445

Ser Val Ile Lys Ala Thr Ala Ile Asp Pro Ser Val Val Gly Glu Asp

450 455 460

Gly Val Tyr His His Thr Gly Arg Val Arg Val Phe Val Ser Glu Ala

465 470 475 480

Gln Ala Ile Lys Ala Ile Lys Arg Glu Glu Ile Val Gln Gly Asp Ile

485 490 495

Met Val Val Ile Gly Gly Gly Pro Ser Gly Thr Gly Met Glu Glu Thr

500 505 510

Tyr Gln Leu Thr Ser Ala Leu Lys His Ile Ser Trp Gly Lys Thr Val

515 520 525

Ser Leu Ile Thr Asp Ala Arg Phe Ser Gly Val Ser Thr Gly Ala Cys

530 535 540

Phe Gly His Val Ser Pro Glu Ala Leu Ala Gly Gly Pro Ile Gly Lys

545 550 555 560

Leu Arg Asp Asn Asp Ile Ile Glu Ile Ala Val Asp Arg Leu Thr Leu

565 570 575

Thr Gly Ser Val Asn Phe Ile Gly Thr Ala Asp Asn Pro Leu Thr Pro

580 585 590

Glu Glu Gly Ala Arg Glu Leu Ala Arg Arg Gln Thr His Pro Asp Leu

595 600 605

His Ala His Asp Phe Leu Pro Asp Asp Thr Arg Leu Trp Ala Ala Leu

610 615 620

Gln Ser Val Ser Gly Gly Thr Trp Lys Gly Cys Ile Tyr Asp Thr Asp

625 630 635 640

Lys Ile Ile Glu Val Ile Asn Ala Gly Lys Lys Ala Leu Gly Ile

645 650 655

<210> 76

<211> 906

<212> DNA

<213> 大肠杆菌

<400> 76

atgaaaaaat tcagcggcat tattccaccg gtatccagca cgtttcatcg tgacggaacc 60

cttgataaaa aggcaatgcg cgaagttgcc gacttcctga ttaataaagg ggtcgacggg 120

ctgttttatc tgggtaccgg tggtgaattt agccaaatga atacagccca gcgcatggca 180

ctcgccgaag aagctgtaac cattgtcgac gggcgagtgc cggtattgat tggcgtcggt 240

tccccttcca ctgacgaagc ggtcaaactg gcgcagcatg cgcaagccta cggcgctgat 300

ggtatcgtcg ccatcaaccc ctactactgg aaagtcgcac cacgaaatct tgacgactat 360

taccagcaga tcgcccgtag cgtcacccta ccggtgatcc tgtacaactt tccggatctg 420

acgggtcagg acttaacccc ggaaaccgtg acgcgtctgg ctctgcaaaa cgagaatatc 480

gttggcatca aagacaccat cgacagcgtt ggtcacttgc gtacgatgat caacacagtt 540

aagtcggtac gcccgtcgtt ttcggtattc tgcggttacg atgatcattt gctgaatacg 600

atgctgctgg gcggcgacgg tgcgataacc gccagcgcta actttgctcc ggaactctcc 660

gtcggcatct accgcgcctg gcgtgaaggc gatctggcga ccgctgcgac gctgaataaa 720

aaactactac aactgcccgc tatttacgcc ctcgaaacac cgtttgtctc actgatcaaa 780

tacagcatgc agtgtgtcgg gctgcctgta gagacatatt gcttaccacc gattcttgaa 840

gcatctgaag aagcaaaaga taaagtccac gtgctgctta ccgcgcaggg cattttacca 900

gtctga 906

<210> 77

<211> 906

<212> DNA

<213> 人工序列

<220>

<223> 密码子优化的大肠杆菌序列

<400> 77

atgaaaaaat tcagcggcat tattccaccg gtatccagca cgtttcatcg tgacggaacc 60

cttgataaaa aggcaatgcg cgaagttgcc gacttcctga ttaataaagg ggtcgacggg 120

ctgttttatc tgggtaccgg tggtgaattt agccaaatga atacagccca gcgcatggca 180

ctcgccgaag aagctgtaac cattgtcgac gggcgagtgc cggtattgat tggcgtcggt 240

tccccttcca ctgacgaagc ggtcaaactg gcgcagcatg cgcaagccta cggcgctgat 300

ggtatcgtcg ccatcaaccc ctactactgg aaagtcgcac cacgaaatct tgacgactat 360

taccagcaga tcgcccgtag cgtcacccta ccggtgatcc tgtacaactt tccggatctg 420

acgggtcagg acttaacccc ggaaaccgtg acgcgtctgg ctctgcaaaa cgagaatatc 480

gttggcatca aagacaccat cgacagcgtt ggtcacttgc gtacgatgat caacacagtt 540

aagtcggtac gcccgtcgtt ttcggtattc tgcggttacg atgatcattt gctgaatacg 600

atgctgctgg gcggcgacgg tgcgataacc gccagcgcta actttgctcc ggaactctcc 660

gtcggcatct accgcgcctg gcgtgaaggc gatctggcga ccgctgcgac gctgaataaa 720

aaactactac aactgcccgc tatttacgcc ctcgaaacac cgtttgtctc actgatcaaa 780

tacagcatgc agtgtgtcgg gctgcctgta gagacatatt gcttaccacc gattcttgaa 840

gcatctgaag aagcaaaaga taaagtccac gtgctgctta ccgcgcaggg cattttacca 900

gtctga 906

<210> 78

<211> 301

<212> PRT

<213> 大肠杆菌

<400> 78

Met Lys Lys Phe Ser Gly Ile Ile Pro Pro Val Ser Ser Thr Phe His

1 5 10 15

Arg Asp Gly Thr Leu Asp Lys Lys Ala Met Arg Glu Val Ala Asp Phe

20 25 30

Leu Ile Asn Lys Gly Val Asp Gly Leu Phe Tyr Leu Gly Thr Gly Gly

35 40 45

Glu Phe Ser Gln Met Asn Thr Ala Gln Arg Met Ala Leu Ala Glu Glu

50 55 60

Ala Val Thr Ile Val Asp Gly Arg Val Pro Val Leu Ile Gly Val Gly

65 70 75 80

Ser Pro Ser Thr Asp Glu Ala Val Lys Leu Ala Gln His Ala Gln Ala

85 90 95

Tyr Gly Ala Asp Gly Ile Val Ala Ile Asn Pro Tyr Tyr Trp Lys Val

100 105 110

Ala Pro Arg Asn Leu Asp Asp Tyr Tyr Gln Gln Ile Ala Arg Ser Val

115 120 125

Thr Leu Pro Val Ile Leu Tyr Asn Phe Pro Asp Leu Thr Gly Gln Asp

130 135 140

Leu Thr Pro Glu Thr Val Thr Arg Leu Ala Leu Gln Asn Glu Asn Ile

145 150 155 160

Val Gly Ile Lys Asp Thr Ile Asp Ser Val Gly His Leu Arg Thr Met

165 170 175

Ile Asn Thr Val Lys Ser Val Arg Pro Ser Phe Ser Val Phe Cys Gly

180 185 190

Tyr Asp Asp His Leu Leu Asn Thr Met Leu Leu Gly Gly Asp Gly Ala

195 200 205

Ile Thr Ala Ser Ala Asn Phe Ala Pro Glu Leu Ser Val Gly Ile Tyr

210 215 220

Arg Ala Trp Arg Glu Gly Asp Leu Ala Thr Ala Ala Thr Leu Asn Lys

225 230 235 240

Lys Leu Leu Gln Leu Pro Ala Ile Tyr Ala Leu Glu Thr Pro Phe Val

245 250 255

Ser Leu Ile Lys Tyr Ser Met Gln Cys Val Gly Leu Pro Val Glu Thr

260 265 270

Tyr Cys Leu Pro Pro Ile Leu Glu Ala Ser Glu Glu Ala Lys Asp Lys

275 280 285

Val His Val Leu Leu Thr Ala Gln Gly Ile Leu Pro Val

290 295 300

<210> 79

<211> 909

<212> DNA

<213> 大肠杆菌

<400> 79

atgccgcagt ccgcgttgtt cacgggaatc attccccctg tctccaccat ttttaccgcc 60

gacggccagc tcgataagcc gggcaccgcc gcgctgatcg acgatctgat caaagcaggc 120

gttgacggcc tgttcttcct gggcagcggt ggcgagttct cccagctcgg cgccgaagag 180

cgtaaagcca ttgcccgctt tgctatcgat catgtcgatc gtcgcgtgcc ggtgctgatc 240

ggcaccggcg gcaccaacgc ccgggaaacc atcgaactca gccagcacgc gcagcaggcg 300

ggcgcggacg gcatcgtggt gatcaacccc tactactgga aagtgtcgga agcgaacctg 360

atccgctatt tcgagcaggt ggccgacagc gtcacgctgc cggtgatgct ctataacttc 420

ccggcgctga ccgggcagga tctgactccg gcgctggtga aaaccctcgc cgactcgcgc 480

agcaatatta tcggcatcaa agacaccatc gactccgtcg cccacctgcg cagcatgatc 540

cataccgtca aaggtgccca tccgcacttc accgtgctct gcggctacga cgatcatctg 600

ttcaataccc tgctgctcgg cggcgacggg gcgatatcgg cgagcggcaa ctttgccccg 660

caggtgtcgg tgaatcttct gaaagcctgg cgcgacgggg acgtggcgaa agcggccggg 720

tatcatcaga ccttgctgca aattccgcag atgtatcagc tggatacgcc gtttgtgaac 780

gtgattaaag aggcgatcgt gctctgcggt cgtcctgtct ccacgcacgt gctgccgccc 840

gcctcgccgc tggacgagcc gcgcaaggcg cagctgaaaa ccctgctgca acagctcaag 900

ctttgctga 909

<210> 80

<211> 909

<212> DNA

<213> 人工序列

<220>

<223> 密码子优化的大肠杆菌序列

<400> 80

atgccgcagt ccgcgttgtt cacgggaatc attccccctg tctccaccat ttttaccgcc 60

gacggccagc tcgataagcc gggcaccgcc gcgctgatcg acgatctgat caaagcaggc 120

gttgacggcc tgttcttcct gggcagcggt ggcgagttct cccagctcgg cgccgaagag 180

cgtaaagcca ttgcccgctt tgctatcgat catgtcgatc gtcgcgtgcc ggtgctgatc 240

ggcaccggcg gcaccaacgc ccgggaaacc atcgaactca gccagcacgc gcagcaggcg 300

ggcgcggacg gcatcgtggt gatcaacccc tactactgga aagtgtcgga agcgaacctg 360

atccgctatt tcgagcaggt ggccgacagc gtcacgctgc cggtgatgct ctataacttc 420

ccggcgctga ccgggcagga tctgactccg gcgctggtga aaaccctcgc cgactcgcgc 480

agcaatatta tcggcatcaa agacaccatc gactccgtcg cccacctgcg cagcatgatc 540

cataccgtca aaggtgccca tccgcacttc accgtgctct gcggctacga cgatcatctg 600

ttcaataccc tgctgctcgg cggcgacggg gcgatatcgg cgagcggcaa ctttgccccg 660

caggtgtcgg tgaatcttct gaaagcctgg cgcgacgggg acgtggcgaa agcggccggg 720

tatcatcaga ccttgctgca aattccgcag atgtatcagc tggatacgcc gtttgtgaac 780

gtgattaaag aggcgatcgt gctctgcggt cgtcctgtct ccacgcacgt gctgccgccc 840

gcctcgccgc tggacgagcc gcgcaaggcg cagctgaaaa ccctgctgca acagctcaag 900

ctttgctga 909

<210> 81

<211> 302

<212> PRT

<213> 大肠杆菌

<400> 81

Met Pro Gln Ser Ala Leu Phe Thr Gly Ile Ile Pro Pro Val Ser Thr

1 5 10 15

Ile Phe Thr Ala Asp Gly Gln Leu Asp Lys Pro Gly Thr Ala Ala Leu

20 25 30

Ile Asp Asp Leu Ile Lys Ala Gly Val Asp Gly Leu Phe Phe Leu Gly

35 40 45

Ser Gly Gly Glu Phe Ser Gln Leu Gly Ala Glu Glu Arg Lys Ala Ile

50 55 60

Ala Arg Phe Ala Ile Asp His Val Asp Arg Arg Val Pro Val Leu Ile

65 70 75 80

Gly Thr Gly Gly Thr Asn Ala Arg Glu Thr Ile Glu Leu Ser Gln His

85 90 95

Ala Gln Gln Ala Gly Ala Asp Gly Ile Val Val Ile Asn Pro Tyr Tyr

100 105 110

Trp Lys Val Ser Glu Ala Asn Leu Ile Arg Tyr Phe Glu Gln Val Ala

115 120 125

Asp Ser Val Thr Leu Pro Val Met Leu Tyr Asn Phe Pro Ala Leu Thr

130 135 140

Gly Gln Asp Leu Thr Pro Ala Leu Val Lys Thr Leu Ala Asp Ser Arg

145 150 155 160

Ser Asn Ile Ile Gly Ile Lys Asp Thr Ile Asp Ser Val Ala His Leu

165 170 175

Arg Ser Met Ile His Thr Val Lys Gly Ala His Pro His Phe Thr Val

180 185 190

Leu Cys Gly Tyr Asp Asp His Leu Phe Asn Thr Leu Leu Leu Gly Gly

195 200 205

Asp Gly Ala Ile Ser Ala Ser Gly Asn Phe Ala Pro Gln Val Ser Val

210 215 220

Asn Leu Leu Lys Ala Trp Arg Asp Gly Asp Val Ala Lys Ala Ala Gly

225 230 235 240

Tyr His Gln Thr Leu Leu Gln Ile Pro Gln Met Tyr Gln Leu Asp Thr

245 250 255

Pro Phe Val Asn Val Ile Lys Glu Ala Ile Val Leu Cys Gly Arg Pro

260 265 270

Val Ser Thr His Val Leu Pro Pro Ala Ser Pro Leu Asp Glu Pro Arg

275 280 285

Lys Ala Gln Leu Lys Thr Leu Leu Gln Gln Leu Lys Leu Cys

290 295 300

<210> 82

<211> 957

<212> DNA

<213> 未知

<220>

<223> Scheffersomyces stipitis序列

<400> 82

atgccttcta ttaagttgaa ctctggttac gacatgccag ccgtcggttt cggctgttgg 60

aaagtcgacg tcgacacctg ttctgaacag atctaccgtg ctatcaagac cggttacaga 120

ttgttcgacg gtgccgaaga ttacgccaac gaaaagttag ttggtgccgg tgtcaagaag 180

gccattgacg aaggtatcgt caagcgtgaa gatttgttcc ttacctccaa gttgtggaac 240

aactaccacc acccagacaa cgtcgaaaag gccttgaaca gaaccctttc tgacttgcaa 300

gttgactacg ttgacttgtt cttgatccac ttcccagtca ccttcaagtt cgttccatta 360

gaagaaaagt acccaccagg attctactgt ggtaagggtg acaacttcga ctacgaagat 420

gttccaattt tagagacttg gaaggctctt gaaaagttgg tcaaggccgg taagatcaga 480

tctatcggtg tttctaactt cccaggtgct ttgctcttgg acttgttgag aggtgctacc 540

atcaagccat ctgtcttgca agttgaacac cacccatact tgcaacaacc aagattgatc 600

gaattcgctc aatcccgtgg tattgctgtc accgcttact cttcgttcgg tcctcaatct 660

ttcgttgaat tgaaccaagg tagagctttg aacacttctc cattgttcga gaacgaaact 720

atcaaggcta tcgctgctaa gcacggtaag tctccagctc aagtcttgtt gagatggtca 780

tcccaaagag gcattgccat cattccaaag tccaacactg tcccaagatt gttggaaaac 840

aaggacgtca acagcttcga cttggacgaa caagatttcg ctgacattgc caagttggac 900

atcaacttga gattcaacga cccatgggac tgggacaaga ttcctatctt cgtctaa 957

<210> 83

<211> 957

<212> DNA

<213> 人工序列

<220>

<223> 密码子优化的Scheffersomyces stipitis序列

<400> 83

atgccatcta tcaagttaaa ttccggttac gacatgcctg ctgttggttt cggttgctgg 60

aaggttgatg tcgatacttg ttccgagcaa atttaccgtg ctatcaagac tggttacaga 120

ttgttcgatg gtgctgaaga ctacgccaac gaaaagttag tcggtgctgg tgttaaaaag 180

gctatcgacg aaggtattgt taaaagagaa gacttgttct tgacttctaa gttgtggaac 240

aactaccacc atcctgataa cgtcgaaaaa gctttgaacc gtaccttgtc cgatttgcaa 300

gtcgattacg ttgatttgtt cttgattcat ttcccagtta ccttcaagtt cgttccattg 360

gaagagaagt atccaccagg tttctactgt ggtaagggtg ataacttcga ttacgaagat 420

gtcccaatct tagaaacctg gaaggcttta gaaaagttgg ttaaggctgg taagatcaga 480

tccatcggtg tttctaactt cccaggtgcc ttattgttag acttattgag aggtgctacc 540

attaagcctt ccgttttgca agttgaacat catccttact tgcaacaacc aagattgatc 600

gaattcgctc aatctagagg tatcgctgtt actgcctact cttccttcgg tccacaatct 660

ttcgttgagt tgaaccaagg tagagctttg aacacctctc cattgttcga aaacgaaact 720

attaaggcca ttgctgctaa gcatggtaag tctccagccc aagttttgtt gagatggtct 780

tctcaaagag gtatcgctat tatcccaaag tctaatactg tcccaagatt gttggaaaac 840

aaggacgtta actcctttga tttggatgaa caagactttg ctgacatcgc taaattggac 900

atcaacttga gattcaacga cccatgggac tgggacaaga ttccaatttt tgtttaa 957

<210> 84

<211> 318

<212> PRT

<213> 未知

<220>

<223> Scheffersomyces stipitis序列

<400> 84

Met Pro Ser Ile Lys Leu Asn Ser Gly Tyr Asp Met Pro Ala Val Gly

1 5 10 15

Phe Gly Cys Trp Lys Val Asp Val Asp Thr Cys Ser Glu Gln Ile Tyr

20 25 30

Arg Ala Ile Lys Thr Gly Tyr Arg Leu Phe Asp Gly Ala Glu Asp Tyr

35 40 45

Ala Asn Glu Lys Leu Val Gly Ala Gly Val Lys Lys Ala Ile Asp Glu

50 55 60

Gly Ile Val Lys Arg Glu Asp Leu Phe Leu Thr Ser Lys Leu Trp Asn

65 70 75 80

Asn Tyr His His Pro Asp Asn Val Glu Lys Ala Leu Asn Arg Thr Leu

85 90 95

Ser Asp Leu Gln Val Asp Tyr Val Asp Leu Phe Leu Ile His Phe Pro

100 105 110

Val Thr Phe Lys Phe Val Pro Leu Glu Glu Lys Tyr Pro Pro Gly Phe

115 120 125

Tyr Cys Gly Lys Gly Asp Asn Phe Asp Tyr Glu Asp Val Pro Ile Leu

130 135 140

Glu Thr Trp Lys Ala Leu Glu Lys Leu Val Lys Ala Gly Lys Ile Arg

145 150 155 160

Ser Ile Gly Val Ser Asn Phe Pro Gly Ala Leu Leu Leu Asp Leu Leu

165 170 175

Arg Gly Ala Thr Ile Lys Pro Ser Val Leu Gln Val Glu His His Pro

180 185 190

Tyr Leu Gln Gln Pro Arg Leu Ile Glu Phe Ala Gln Ser Arg Gly Ile

195 200 205

Ala Val Thr Ala Tyr Ser Ser Phe Gly Pro Gln Ser Phe Val Glu Leu

210 215 220

Asn Gln Gly Arg Ala Leu Asn Thr Ser Pro Leu Phe Glu Asn Glu Thr

225 230 235 240

Ile Lys Ala Ile Ala Ala Lys His Gly Lys Ser Pro Ala Gln Val Leu

245 250 255

Leu Arg Trp Ser Ser Gln Arg Gly Ile Ala Ile Ile Pro Lys Ser Asn

260 265 270

Thr Val Pro Arg Leu Leu Glu Asn Lys Asp Val Asn Ser Phe Asp Leu

275 280 285

Asp Glu Gln Asp Phe Ala Asp Ile Ala Lys Leu Asp Ile Asn Leu Arg

290 295 300

Phe Asn Asp Pro Trp Asp Trp Asp Lys Ile Pro Ile Phe Val

305 310 315

<210> 85

<211> 984

<212> DNA

<213> 酿酒酵母

<400> 85

atgtcttcac tggttactct taataacggt ctgaaaatgc ccctagtcgg cttagggtgc 60

tggaaaattg acaaaaaagt ctgtgcgaat caaatttatg aagctatcaa attaggctac 120

cgtttattcg atggtgcttg cgactacggc aacgaaaagg aagttggtga aggtatcagg 180

aaagccatct ccgaaggtct tgtttctaga aaggatatat ttgttgtttc aaagttatgg 240

aacaattttc accatcctga tcatgtaaaa ttagctttaa agaagacctt aagcgatatg 300

ggacttgatt atttagacct gtattatatt cacttcccaa tcgccttcaa atatgttcca 360

tttgaagaga aataccctcc aggattctat acgggcgcag atgacgagaa gaaaggtcac 420

atcaccgaag cacatgtacc aatcatagat acgtaccggg ctctggaaga atgtgttgat 480

gaaggcttga ttaagtctat tggtgtttcc aactttcagg gaagcttgat tcaagattta 540

ttacgtggtt gtagaatcaa gcccgtggct ttgcaaattg aacaccatcc ttatttgact 600

caagaacacc tagttgagtt ttgtaaatta cacgatatcc aagtagttgc ttactcctcc 660

ttcggtcctc aatcattcat tgagatggac ttacagttgg caaaaaccac gccaactctg 720

ttcgagaatg atgtaatcaa gaaggtctca caaaaccatc caggcagtac cacttcccaa 780

gtattgctta gatgggcaac tcagagaggc attgccgtca ttccaaaatc ttccaagaag 840

gaaaggttac ttggcaacct agaaatcgaa aaaaagttca ctttaacgga gcaagaattg 900

aaggatattt ctgcactaaa tgccaacatc agatttaatg atccatggac ctggttggat 960

ggtaaattcc ccacttttgc ctga 984

<210> 86

<211> 984

<212> DNA

<213> 人工序列

<220>

<223> 密码子优化的酿酒酵母序列

<400> 86

atgtcttcac tggttactct taataacggt ctgaaaatgc ccctagtcgg cttagggtgc 60

tggaaaattg acaaaaaagt ctgtgcgaat caaatttatg aagctatcaa attaggctac 120

cgtttattcg atggtgcttg cgactacggc aacgaaaagg aagttggtga aggtatcagg 180

aaagccatct ccgaaggtct tgtttctaga aaggatatat ttgttgtttc aaagttatgg 240

aacaattttc accatcctga tcatgtaaaa ttagctttaa agaagacctt aagcgatatg 300

ggacttgatt atttagacct gtattatatt cacttcccaa tcgccttcaa atatgttcca 360

tttgaagaga aataccctcc aggattctat acgggcgcag atgacgagaa gaaaggtcac 420

atcaccgaag cacatgtacc aatcatagat acgtaccggg ctctggaaga atgtgttgat 480

gaaggcttga ttaagtctat tggtgtttcc aactttcagg gaagcttgat tcaagattta 540

ttacgtggtt gtagaatcaa gcccgtggct ttgcaaattg aacaccatcc ttatttgact 600

caagaacacc tagttgagtt ttgtaaatta cacgatatcc aagtagttgc ttactcctcc 660

ttcggtcctc aatcattcat tgagatggac ttacagttgg caaaaaccac gccaactctg 720

ttcgagaatg atgtaatcaa gaaggtctca caaaaccatc caggcagtac cacttcccaa 780

gtattgctta gatgggcaac tcagagaggc attgccgtca ttccaaaatc ttccaagaag 840

gaaaggttac ttggcaacct agaaatcgaa aaaaagttca ctttaacgga gcaagaattg 900

aaggatattt ctgcactaaa tgccaacatc agatttaatg atccatggac ctggttggat 960

ggtaaattcc ccacttttgc ctga 984

<210> 87

<211> 327

<212> PRT

<213> 酿酒酵母

<400> 87

Met Ser Ser Leu Val Thr Leu Asn Asn Gly Leu Lys Met Pro Leu Val

1 5 10 15

Gly Leu Gly Cys Trp Lys Ile Asp Lys Lys Val Cys Ala Asn Gln Ile

20 25 30

Tyr Glu Ala Ile Lys Leu Gly Tyr Arg Leu Phe Asp Gly Ala Cys Asp

35 40 45

Tyr Gly Asn Glu Lys Glu Val Gly Glu Gly Ile Arg Lys Ala Ile Ser

50 55 60

Glu Gly Leu Val Ser Arg Lys Asp Ile Phe Val Val Ser Lys Leu Trp

65 70 75 80

Asn Asn Phe His His Pro Asp His Val Lys Leu Ala Leu Lys Lys Thr

85 90 95

Leu Ser Asp Met Gly Leu Asp Tyr Leu Asp Leu Tyr Tyr Ile His Phe

100 105 110

Pro Ile Ala Phe Lys Tyr Val Pro Phe Glu Glu Lys Tyr Pro Pro Gly

115 120 125

Phe Tyr Thr Gly Ala Asp Asp Glu Lys Lys Gly His Ile Thr Glu Ala

130 135 140

His Val Pro Ile Ile Asp Thr Tyr Arg Ala Leu Glu Glu Cys Val Asp

145 150 155 160

Glu Gly Leu Ile Lys Ser Ile Gly Val Ser Asn Phe Gln Gly Ser Leu

165 170 175

Ile Gln Asp Leu Leu Arg Gly Cys Arg Ile Lys Pro Val Ala Leu Gln

180 185 190

Ile Glu His His Pro Tyr Leu Thr Gln Glu His Leu Val Glu Phe Cys

195 200 205

Lys Leu His Asp Ile Gln Val Val Ala Tyr Ser Ser Phe Gly Pro Gln

210 215 220

Ser Phe Ile Glu Met Asp Leu Gln Leu Ala Lys Thr Thr Pro Thr Leu

225 230 235 240

Phe Glu Asn Asp Val Ile Lys Lys Val Ser Gln Asn His Pro Gly Ser

245 250 255

Thr Thr Ser Gln Val Leu Leu Arg Trp Ala Thr Gln Arg Gly Ile Ala

260 265 270

Val Ile Pro Lys Ser Ser Lys Lys Glu Arg Leu Leu Gly Asn Leu Glu

275 280 285

Ile Glu Lys Lys Phe Thr Leu Thr Glu Gln Glu Leu Lys Asp Ile Ser

290 295 300

Ala Leu Asn Ala Asn Ile Arg Phe Asn Asp Pro Trp Thr Trp Leu Asp

305 310 315 320

Gly Lys Phe Pro Thr Phe Ala

325

<210> 88

<211> 1092

<212> DNA

<213> 未知

<220>

<223> Scheffersomyces stipitis序列

<400> 88

atgactgcta acccttcctt ggtgttgaac aagatcgacg acatttcgtt cgaaacttac 60

gatgccccag aaatctctga acctaccgat gtcctcgtcc aggtcaagaa aaccggtatc 120

tgtggttccg acatccactt ctacgcccat ggtagaatcg gtaacttcgt tttgaccaag 180

ccaatggtct tgggtcacga atccgccggt actgttgtcc aggttggtaa gggtgtcacc 240

tctcttaagg ttggtgacaa cgtcgctatc gaaccaggta ttccatccag attctccgac 300

gaatacaaga gcggtcacta caacttgtgt cctcacatgg ccttcgccgc tactcctaac 360

tccaaggaag gcgaaccaaa cccaccaggt accttatgta agtacttcaa gtcgccagaa 420

gacttcttgg tcaagttgcc agaccacgtc agcttggaac tcggtgctct tgttgagcca 480

ttgtctgttg gtgtccacgc ctctaagttg ggttccgttg ctttcggcga ctacgttgcc 540

gtctttggtg ctggtcctgt tggtcttttg gctgctgctg tcgccaagac cttcggtgct 600

aagggtgtca tcgtcgttga cattttcgac aacaagttga agatggccaa ggacattggt 660

gctgctactc acaccttcaa ctccaagacc ggtggttctg aagaattgat caaggctttc 720

ggtggtaacg tgccaaacgt cgttttggaa tgtactggtg ctgaaccttg tatcaagttg 780

ggtgttgacg ccattgcccc aggtggtcgt ttcgttcaag tcggtaacgc tgctggtcca 840

gtcagcttcc caatcaccgt tttcgccatg aaggaattga ctttgttcgg ttctttcaga 900

tacggattca acgactacaa gactgctgtt ggaatctttg acactaacta ccaaaacggt 960

agagaaaatg ctccaattga ctttgaacaa ttgatcaccc acagatacaa gttcaaggac 1020

gctattgaag cctacgactt ggtcagagcc ggtaagggtg ctgtcaagtg tctcattgac 1080

ggccctgagt aa 1092

<210> 89

<211> 1092

<212> DNA

<213> 人工序列

<220>

<223> 密码子优化的Scheffersomyces stipitis

<400> 89

atgactgcta acccttcctt ggtgttgaac aagatcgacg acatttcgtt cgaaacttac 60

gatgccccag aaatctctga acctaccgat gtcctcgtcc aggtcaagaa aaccggtatc 120

tgtggttccg acatccactt ctacgcccat ggtagaatcg gtaacttcgt tttgaccaag 180

ccaatggtct tgggtcacga atccgccggt actgttgtcc aggttggtaa gggtgtcacc 240

tctcttaagg ttggtgacaa cgtcgctatc gaaccaggta ttccatccag attctccgac 300

gaatacaaga gcggtcacta caacttgtgt cctcacatgg ccttcgccgc tactcctaac 360

tccaaggaag gcgaaccaaa cccaccaggt accttatgta agtacttcaa gtcgccagaa 420

gatttcttgg tcaagttgcc agaccacgtc agcttggaac tcggtgctct tgttgagcca 480

ttgtctgttg gtgtccacgc ctctaagttg ggttccgttg ctttcggcga ctacgttgcc 540

gtctttggag caggtcctgt tggtcttttg gctgctgctg tcgccaagac cttcggtgct 600

aagggtgtca tcgtcgttga cattttcgac aacaagttga agatggccaa ggacattgga 660

gctgctactc acaccttcaa ctccaagacc ggtggttctg aagaattgat caaggctttc 720

ggtggtaacg tgccaaacgt cgttttggaa tgtacaggtg cagaaccttg tatcaagttg 780

ggtgttgacg ccattgcccc aggtggtcgt ttcgttcaag tcggtaacgc tgctggtcca 840

gtcagcttcc caatcaccgt tttcgccatg aaggaattga ctttgttcgg ttctttcaga 900

tacggattca acgactacaa gactgctgtt ggaatctttg acactaacta ccaaaacggt 960

agagaaaatg ctccaattga ctttgaacaa ttgatcaccc acagatacaa gttcaaggac 1020

gctattgaag cctacgactt ggtcagagcc ggtaagggtg ctgtcaagtg tctcattgac 1080

ggccctgagt aa 1092

<210> 90

<211> 363

<212> PRT

<213> 未知

<220>

<223> Scheffersomyces stipitis序列

<400> 90

Met Thr Ala Asn Pro Ser Leu Val Leu Asn Lys Ile Asp Asp Ile Ser

1 5 10 15

Phe Glu Thr Tyr Asp Ala Pro Glu Ile Ser Glu Pro Thr Asp Val Leu

20 25 30

Val Gln Val Lys Lys Thr Gly Ile Cys Gly Ser Asp Ile His Phe Tyr

35 40 45

Ala His Gly Arg Ile Gly Asn Phe Val Leu Thr Lys Pro Met Val Leu

50 55 60

Gly His Glu Ser Ala Gly Thr Val Val Gln Val Gly Lys Gly Val Thr

65 70 75 80

Ser Leu Lys Val Gly Asp Asn Val Ala Ile Glu Pro Gly Ile Pro Ser

85 90 95

Arg Phe Ser Asp Glu Tyr Lys Ser Gly His Tyr Asn Leu Cys Pro His

100 105 110

Met Ala Phe Ala Ala Thr Pro Asn Ser Lys Glu Gly Glu Pro Asn Pro

115 120 125

Pro Gly Thr Leu Cys Lys Tyr Phe Lys Ser Pro Glu Asp Phe Leu Val

130 135 140

Lys Leu Pro Asp His Val Ser Leu Glu Leu Gly Ala Leu Val Glu Pro

145 150 155 160

Leu Ser Val Gly Val His Ala Ser Lys Leu Gly Ser Val Ala Phe Gly

165 170 175

Asp Tyr Val Ala Val Phe Gly Ala Gly Pro Val Gly Leu Leu Ala Ala

180 185 190

Ala Val Ala Lys Thr Phe Gly Ala Lys Gly Val Ile Val Val Asp Ile

195 200 205

Phe Asp Asn Lys Leu Lys Met Ala Lys Asp Ile Gly Ala Ala Thr His

210 215 220

Thr Phe Asn Ser Lys Thr Gly Gly Ser Glu Glu Leu Ile Lys Ala Phe

225 230 235 240

Gly Gly Asn Val Pro Asn Val Val Leu Glu Cys Thr Gly Ala Glu Pro

245 250 255

Cys Ile Lys Leu Gly Val Asp Ala Ile Ala Pro Gly Gly Arg Phe Val

260 265 270

Gln Val Gly Asn Ala Ala Gly Pro Val Ser Phe Pro Ile Thr Val Phe

275 280 285

Ala Met Lys Glu Leu Thr Leu Phe Gly Ser Phe Arg Tyr Gly Phe Asn

290 295 300

Asp Tyr Lys Thr Ala Val Gly Ile Phe Asp Thr Asn Tyr Gln Asn Gly

305 310 315 320

Arg Glu Asn Ala Pro Ile Asp Phe Glu Gln Leu Ile Thr His Arg Tyr

325 330 335

Lys Phe Lys Asp Ala Ile Glu Ala Tyr Asp Leu Val Arg Ala Gly Lys

340 345 350

Gly Ala Val Lys Cys Leu Ile Asp Gly Pro Glu

355 360

<210> 91

<211> 1092

<212> DNA

<213> 未知

<220>

<223> 里氏木霉序列

<400> 91

atggcgactc aaacgatcaa caaggatgcg atcagcaacc tctccttcgt cctcaacaag 60

cccggcgacg tgacctttga ggagcggccg aagccgacca tcacggaccc caacgacgtc 120

ctcgtcgccg tcaactacac gggcatctgc ggctccgacg tgcactactg ggtgcacggc 180

gccatcgggc acttcgtcgt caaggacccg atggtgctgg gccacgagtc ggccggcacc 240

gtcgtcgagg tcggcccggc cgtcaagagc ctcaagcccg gcgaccgcgt cgccctcgag 300

cccggctacc cgtgccggcg gtgctccttc tgccgcgccg gcaaatacaa cctgtgcccg 360

gacatggtct tcgccgccac gccgccgtac cacggcaccc tgacgggcct gtgggcggcg 420

cccgccgact tctgctacaa gctgccggac ggcgtgtcgc tgcaggaggg cgcgctgatc 480

gagccgctgg ccgtggccgt ccacattgtc aagcaggccc gcgtccagcc gggccagtcc 540

gtcgtcgtca tgggcgccgg ccccgtcggc ctgctgtgcg ccgccgtggc caaggcgtac 600

ggcgcctcca ccattgtcag cgtcgacatc gtgcagtcca agctcgactt tgcgcgcggc 660

ttctgctcga cgcacacgta cgtctcgcag cgcatctcgg ctgaggacaa cgcaaaggcc 720

atcaaggagc tggcgggcct gcccggcggc gccgacgtcg tgattgacgc cagcggcgcg 780

gagccgtcga tccagacgag cattcacgtc gtccgcatgg gcggcacgta cgtccagggc 840

ggcatgggca agagcgacat cacgttcccc atcatggcca tgtgcctcaa ggaggtgacg 900

gtccggggct cgttccgcta cggcgccggc gactacgagc tggcggtcga gctggtccgg 960

acggggcggg tggacgtcaa gaagctgatt acgggcaccg tcagcttcaa gcaggcggag 1020

gaggcgttcc aaaaggtcaa gtctggggag gccatcaaga ttctgattgc cgggcccaac 1080

gagaaggtgt aa 1092

<210> 92

<211> 363

<212> PRT

<213> 未知

<220>

<223> 里氏木霉序列

<400> 92

Met Ala Thr Gln Thr Ile Asn Lys Asp Ala Ile Ser Asn Leu Ser Phe

1 5 10 15

Val Leu Asn Lys Pro Gly Asp Val Thr Phe Glu Glu Arg Pro Lys Pro

20 25 30

Thr Ile Thr Asp Pro Asn Asp Val Leu Val Ala Val Asn Tyr Thr Gly

35 40 45

Ile Cys Gly Ser Asp Val His Tyr Trp Val His Gly Ala Ile Gly His

50 55 60

Phe Val Val Lys Asp Pro Met Val Leu Gly His Glu Ser Ala Gly Thr

65 70 75 80

Val Val Glu Val Gly Pro Ala Val Lys Ser Leu Lys Pro Gly Asp Arg

85 90 95

Val Ala Leu Glu Pro Gly Tyr Pro Cys Arg Arg Cys Ser Phe Cys Arg

100 105 110

Ala Gly Lys Tyr Asn Leu Cys Pro Asp Met Val Phe Ala Ala Thr Pro

115 120 125

Pro Tyr His Gly Thr Leu Thr Gly Leu Trp Ala Ala Pro Ala Asp Phe

130 135 140

Cys Tyr Lys Leu Pro Asp Gly Val Ser Leu Gln Glu Gly Ala Leu Ile

145 150 155 160

Glu Pro Leu Ala Val Ala Val His Ile Val Lys Gln Ala Arg Val Gln

165 170 175

Pro Gly Gln Ser Val Val Val Met Gly Ala Gly Pro Val Gly Leu Leu

180 185 190

Cys Ala Ala Val Ala Lys Ala Tyr Gly Ala Ser Thr Ile Val Ser Val

195 200 205

Asp Ile Val Gln Ser Lys Leu Asp Phe Ala Arg Gly Phe Cys Ser Thr

210 215 220

His Thr Tyr Val Ser Gln Arg Ile Ser Ala Glu Asp Asn Ala Lys Ala

225 230 235 240

Ile Lys Glu Leu Ala Gly Leu Pro Gly Gly Ala Asp Val Val Ile Asp

245 250 255

Ala Ser Gly Ala Glu Pro Ser Ile Gln Thr Ser Ile His Val Val Arg

260 265 270

Met Gly Gly Thr Tyr Val Gln Gly Gly Met Gly Lys Ser Asp Ile Thr

275 280 285

Phe Pro Ile Met Ala Met Cys Leu Lys Glu Val Thr Val Arg Gly Ser

290 295 300

Phe Arg Tyr Gly Ala Gly Asp Tyr Glu Leu Ala Val Glu Leu Val Arg

305 310 315 320

Thr Gly Arg Val Asp Val Lys Lys Leu Ile Thr Gly Thr Val Ser Phe

325 330 335

Lys Gln Ala Glu Glu Ala Phe Gln Lys Val Lys Ser Gly Glu Ala Ile

340 345 350

Lys Ile Leu Ile Ala Gly Pro Asn Glu Lys Val

355 360

<210> 93

<211> 1314

<212> DNA

<213> 未知

<220>

<223> Pyromyces sp.序列

<400> 93

atggctaagg aatatttccc acaaattcaa aagattaagt tcgaaggtaa ggattctaag 60

aatccattag ccttccacta ctacgatgct gaaaaggaag tcatgggtaa gaaaatgaag 120

gattggttac gtttcgccat ggcctggtgg cacactcttt gcgccgaagg tgctgaccaa 180

ttcggtggag gtacaaagtc tttcccatgg aacgaaggta ctgatgctat tgaaattgcc 240

aagcaaaagg ttgatgctgg tttcgaaatc atgcaaaagc ttggtattcc atactactgt 300

ttccacgatg ttgatcttgt ttccgaaggt aactctattg aagaatacga atccaacctt 360

aaggctgtcg ttgcttacct caaggaaaag caaaaggaaa ccggtattaa gcttctctgg 420

agtactgcta acgtcttcgg tcacaagcgt tacatgaacg gtgcctccac taacccagac 480

tttgatgttg tcgcccgtgc tattgttcaa attaagaacg ccatagacgc cggtattgaa 540

cttggtgctg aaaactacgt cttctggggt ggtcgtgaag gttacatgag tctccttaac 600

actgaccaaa agcgtgaaaa ggaacacatg gccactatgc ttaccatggc tcgtgactac 660

gctcgttcca agggattcaa gggtactttc ctcattgaac caaagccaat ggaaccaacc 720

aagcaccaat acgatgttga cactgaaacc gctattggtt tccttaaggc ccacaactta 780

gacaaggact tcaaggtcaa cattgaagtt aaccacgcta ctcttgctgg tcacactttc 840

gaacacgaac ttgcctgtgc tgttgatgct ggtatgctcg gttccattga tgctaaccgt 900

ggtgactacc aaaacggttg ggatactgat caattcccaa ttgatcaata cgaactcgtc 960

caagcttgga tggaaatcat ccgtggtggt ggtttcgtta ctggtggtac caacttcgat 1020

gccaagactc gtcgtaactc tactgacctc gaagacatca tcattgccca cgtttctggt 1080

atggatgcta tggctcgtgc tcttgaaaac gctgccaagc tcctccaaga atctccatac 1140

accaagatga agaaggaacg ttacgcttcc ttcgacagtg gtattggtaa ggactttgaa 1200

gatggtaagc tcaccctcga acaagtttac gaatacggta agaagaacgg tgaaccaaag 1260

caaacttctg gtaagcaaga actctacgaa gctattgttg ccatgtacca ataa 1314

<210> 94

<211> 1314

<212> DNA

<213> 未知

<220>

<223> 密码子优化的Pyromyces sp.序列

<400> 94

atggccaagg aatacttccc acaaatccaa aagattaaat tcgaaggtaa agattccaag 60

aacccattgg cttttcacta ctacgatgct gagaaggaag ttatgggtaa gaagatgaag 120

gattggttga gattcgctat ggcttggtgg cacactttgt gcgctgaagg tgctgaccaa 180

ttcggtggtg gtactaagtc tttcccatgg aacgaaggta ctgatgctat tgaaatcgct 240

aagcaaaaag tcgatgctgg ttttgagatt atgcaaaaat tgggtatccc atactactgt 300

ttccacgacg tcgacttggt ttctgaaggt aattctatcg aagaatacga atctaatttg 360

aaggctgttg tcgcttactt aaaagaaaag caaaaggaga ctggtattaa gttgttgtgg 420

tccaccgcta acgtctttgg tcataaaaga tacatgaacg gtgcttccac caacccagac 480

ttcgatgtcg tcgccagagc tatcgttcaa attaaaaacg ccatcgacgc tggtattgaa 540

ttgggtgctg aaaattacgt cttttggggt ggtcgtgaag gttacatgtc tttgttgaac 600

actgaccaaa agagagaaaa agaacacatg gccactatgt tgaccatggc cagagattac 660

gccagatcta agggtttcaa gggtaccttc ttaattgaac caaaacctat ggaaccaact 720

aagcaccaat acgacgttga cactgaaact gctatcggtt ttttgaaggc tcacaacttg 780

gataaggatt ttaaagtcaa cattgaagtt aaccatgcta ctttggctgg tcacactttt 840

gaacatgaat tggcctgtgc tgttgatgct ggtatgttgg gttctatcga tgctaataga 900

ggtgactatc aaaacggttg ggacactgat caattcccaa tcgatcaata tgaattagtt 960

caagcttgga tggaaattat cagaggtggt ggtttcgtta ctggtggtac taacttcgat 1020

gctaagacca gaagaaactc tactgatttg gaagatatta tcattgccca cgtttccggt 1080

atggatgcca tggccagagc tttggaaaac gccgccaagt tattgcaaga gtccccatac 1140

accaagatga aaaaggaacg ttacgcttct ttcgactctg gtatcggtaa agacttcgaa 1200

gatggtaagt tgaccttgga acaagtttac gaatacggta agaagaacgg tgaacctaaa 1260

caaacctctg gtaaacaaga attgtatgaa gctattgttg ccatgtacca ataa 1314

<210> 95

<211> 437

<212> PRT

<213> 未知

<220>

<223> Pyromyces sp.序列

<400> 95

Met Ala Lys Glu Tyr Phe Pro Gln Ile Gln Lys Ile Lys Phe Glu Gly

1 5 10 15

Lys Asp Ser Lys Asn Pro Leu Ala Phe His Tyr Tyr Asp Ala Glu Lys

20 25 30

Glu Val Met Gly Lys Lys Met Lys Asp Trp Leu Arg Phe Ala Met Ala

35 40 45

Trp Trp His Thr Leu Cys Ala Glu Gly Ala Asp Gln Phe Gly Gly Gly

50 55 60

Thr Lys Ser Phe Pro Trp Asn Glu Gly Thr Asp Ala Ile Glu Ile Ala

65 70 75 80

Lys Gln Lys Val Asp Ala Gly Phe Glu Ile Met Gln Lys Leu Gly Ile

85 90 95

Pro Tyr Tyr Cys Phe His Asp Val Asp Leu Val Ser Glu Gly Asn Ser

100 105 110

Ile Glu Glu Tyr Glu Ser Asn Leu Lys Ala Val Val Ala Tyr Leu Lys

115 120 125

Glu Lys Gln Lys Glu Thr Gly Ile Lys Leu Leu Trp Ser Thr Ala Asn

130 135 140

Val Phe Gly His Lys Arg Tyr Met Asn Gly Ala Ser Thr Asn Pro Asp

145 150 155 160

Phe Asp Val Val Ala Arg Ala Ile Val Gln Ile Lys Asn Ala Ile Asp

165 170 175

Ala Gly Ile Glu Leu Gly Ala Glu Asn Tyr Val Phe Trp Gly Gly Arg

180 185 190

Glu Gly Tyr Met Ser Leu Leu Asn Thr Asp Gln Lys Arg Glu Lys Glu

195 200 205

His Met Ala Thr Met Leu Thr Met Ala Arg Asp Tyr Ala Arg Ser Lys

210 215 220

Gly Phe Lys Gly Thr Phe Leu Ile Glu Pro Lys Pro Met Glu Pro Thr

225 230 235 240

Lys His Gln Tyr Asp Val Asp Thr Glu Thr Ala Ile Gly Phe Leu Lys

245 250 255

Ala His Asn Leu Asp Lys Asp Phe Lys Val Asn Ile Glu Val Asn His

260 265 270

Ala Thr Leu Ala Gly His Thr Phe Glu His Glu Leu Ala Cys Ala Val

275 280 285

Asp Ala Gly Met Leu Gly Ser Ile Asp Ala Asn Arg Gly Asp Tyr Gln

290 295 300

Asn Gly Trp Asp Thr Asp Gln Phe Pro Ile Asp Gln Tyr Glu Leu Val

305 310 315 320

Gln Ala Trp Met Glu Ile Ile Arg Gly Gly Gly Phe Val Thr Gly Gly

325 330 335

Thr Asn Phe Asp Ala Lys Thr Arg Arg Asn Ser Thr Asp Leu Glu Asp

340 345 350

Ile Ile Ile Ala His Val Ser Gly Met Asp Ala Met Ala Arg Ala Leu

355 360 365

Glu Asn Ala Ala Lys Leu Leu Gln Glu Ser Pro Tyr Thr Lys Met Lys

370 375 380

Lys Glu Arg Tyr Ala Ser Phe Asp Ser Gly Ile Gly Lys Asp Phe Glu

385 390 395 400

Asp Gly Lys Leu Thr Leu Glu Gln Val Tyr Glu Tyr Gly Lys Lys Asn

405 410 415

Gly Glu Pro Lys Gln Thr Ser Gly Lys Gln Glu Leu Tyr Glu Ala Ile

420 425 430

Val Ala Met Tyr Gln

435

<210> 96

<211> 657

<212> DNA

<213> 丙酮丁醇梭菌

<400> 96

atgaactcta aaataattag atttgaaaat ttaaggtcat tctttaaaga tgggatgaca 60

attatgattg gaggtttttt aaactgtggc actccaacca aattaattga ttttttagtt 120

aatttaaata taaagaattt aacgattata agtaatgata catgttatcc taatacaggt 180

attggtaagt taatatcaaa taatcaagta aaaaagctta ttgcttcata tataggcagc 240

aacccagata ctggcaaaaa actttttaat aatgaacttg aagtagagct ctctccccaa 300

ggaactctag tggaaagaat acgtgcaggc ggatctggct taggtggtgt actaactaaa 360

acaggtttag gaactttgat tgaaaaagga aagaaaaaaa tatctataaa tggaacggaa 420

tatttgttag agctacctct tacagccgat gtagcattaa ttaaaggtag tattgtagat 480

gaggccggaa acaccttcta taaaggtact actaaaaact ttaatcccta tatggcaatg 540

gcagctaaaa ccgtaatagt tgaagctgaa aatttagtta gctgtgaaaa actagaaaag 600

gaaaaagcaa tgacccccgg agttcttata aattatatag taaaggagcc tgcataa 657

<210> 97

<211> 218

<212> PRT

<213> 丙酮丁醇梭菌

<400> 97

Met Asn Ser Lys Ile Ile Arg Phe Glu Asn Leu Arg Ser Phe Phe Lys

1 5 10 15

Asp Gly Met Thr Ile Met Ile Gly Gly Phe Leu Asn Cys Gly Thr Pro

20 25 30

Thr Lys Leu Ile Asp Phe Leu Val Asn Leu Asn Ile Lys Asn Leu Thr

35 40 45

Ile Ile Ser Asn Asp Thr Cys Tyr Pro Asn Thr Gly Ile Gly Lys Leu

50 55 60

Ile Ser Asn Asn Gln Val Lys Lys Leu Ile Ala Ser Tyr Ile Gly Ser

65 70 75 80

Asn Pro Asp Thr Gly Lys Lys Leu Phe Asn Asn Glu Leu Glu Val Glu

85 90 95

Leu Ser Pro Gln Gly Thr Leu Val Glu Arg Ile Arg Ala Gly Gly Ser

100 105 110

Gly Leu Gly Gly Val Leu Thr Lys Thr Gly Leu Gly Thr Leu Ile Glu

115 120 125

Lys Gly Lys Lys Lys Ile Ser Ile Asn Gly Thr Glu Tyr Leu Leu Glu

130 135 140

Leu Pro Leu Thr Ala Asp Val Ala Leu Ile Lys Gly Ser Ile Val Asp

145 150 155 160

Glu Ala Gly Asn Thr Phe Tyr Lys Gly Thr Thr Lys Asn Phe Asn Pro

165 170 175

Tyr Met Ala Met Ala Ala Lys Thr Val Ile Val Glu Ala Glu Asn Leu

180 185 190

Val Ser Cys Glu Lys Leu Glu Lys Glu Lys Ala Met Thr Pro Gly Val

195 200 205

Leu Ile Asn Tyr Ile Val Lys Glu Pro Ala

210 215

<210> 98

<211> 660

<212> DNA

<213> 丙酮丁醇梭菌

<400> 98

atgattaatg ataaaaacct agcgaaagaa ataatagcca aaagagttgc aagagaatta 60

aaaaatggtc aacttgtaaa cttaggtgta ggtcttccta ccatggttgc agattatata 120

ccaaaaaatt tcaaaattac tttccaatca gaaaacggaa tagttggaat gggcgctagt 180

cctaaaataa atgaggcaga taaagatgta gtaaatgcag gaggagacta tacaacagta 240

cttcctgacg gcacattttt cgatagctca gtttcgtttt cactaatccg tggtggtcac 300

gtagatgtta ctgttttagg ggctctccag gtagatgaaa agggtaatat agccaattgg 360

attgttcctg gaaaaatgct ctctggtatg ggtggagcta tggatttagt aaatggagct 420

aagaaagtaa taattgcaat gagacataca aataaaggtc aacctaaaat tttaaaaaaa 480

tgtacacttc ccctcacggc aaagtctcaa gcaaatctaa ttgtaacaga acttggagta 540

attgaggtta ttaatgatgg tttacttctc actgaaatta ataaaaacac aaccattgat 600

gaaataaggt ctttaactgc tgcagattta ctcatatcca atgaacttag acccatggct 660

<210> 99

<211> 221

<212> PRT

<213> 丙酮丁醇梭菌

<400> 99

Met Ile Asn Asp Lys Asn Leu Ala Lys Glu Ile Ile Ala Lys Arg Val

1 5 10 15

Ala Arg Glu Leu Lys Asn Gly Gln Leu Val Asn Leu Gly Val Gly Leu

20 25 30

Pro Thr Met Val Ala Asp Tyr Ile Pro Lys Asn Phe Lys Ile Thr Phe

35 40 45

Gln Ser Glu Asn Gly Ile Val Gly Met Gly Ala Ser Pro Lys Ile Asn

50 55 60

Glu Ala Asp Lys Asp Val Val Asn Ala Gly Gly Asp Tyr Thr Thr Val

65 70 75 80

Leu Pro Asp Gly Thr Phe Phe Asp Ser Ser Val Ser Phe Ser Leu Ile

85 90 95

Arg Gly Gly His Val Asp Val Thr Val Leu Gly Ala Leu Gln Val Asp

100 105 110

Glu Lys Gly Asn Ile Ala Asn Trp Ile Val Pro Gly Lys Met Leu Ser

115 120 125

Gly Met Gly Gly Ala Met Asp Leu Val Asn Gly Ala Lys Lys Val Ile

130 135 140

Ile Ala Met Arg His Thr Asn Lys Gly Gln Pro Lys Ile Leu Lys Lys

145 150 155 160

Cys Thr Leu Pro Leu Thr Ala Lys Ser Gln Ala Asn Leu Ile Val Thr

165 170 175

Glu Leu Gly Val Ile Glu Val Ile Asn Asp Gly Leu Leu Leu Thr Glu

180 185 190

Ile Asn Lys Asn Thr Thr Ile Asp Glu Ile Arg Ser Leu Thr Ala Ala

195 200 205

Asp Leu Leu Ile Ser Asn Glu Leu Arg Pro Met Ala Val

210 215 220

<210> 100

<211> 651

<212> DNA

<213> 大肠杆菌

<400> 100

atggatgcga aacaacgtat tgcgcgccgt gtggcgcaag agcttcgtga tggtgacatc 60

gttaacttag ggatcggttt acccacaatg gtcgccaatt atttaccgga gggtattcat 120

atcactctgc aatcggaaaa cggcttcctc ggtttaggcc cggtcacgac agcgcatcca 180

gatctggtga acgctggcgg gcaaccgtgc ggtgttttac ccggtgcagc catgtttgat 240

agcgccatgt catttgcgct aatccgtggc ggtcatattg atgcctgcgt gctcggcggt 300

ttgcaagtag acgaagaagc aaacctcgcg aactgggtag tgcctgggaa aatggtgccc 360

ggtatgggtg gcgcgatgga tctggtgacc gggtcgcgca aagtgatcat cgccatggaa 420

cattgcgcca aagatggttc agcaaaaatt ttgcgccgct gcaccatgcc actcactgcg 480

caacatgcgg tgcatatgct ggttactgaa ctggctgtct ttcgttttat tgacggcaaa 540

atgtggctca ccgaaattgc cgacgggtgt gatttagcca ccgtgcgtgc caaaacagaa 600

gctcggtttg aagtcgccgc cgatctgaat acgcaacggg gtgatttatg a 651

<210> 101

<211> 216

<212> PRT

<213> 大肠杆菌

<400> 101

Met Asp Ala Lys Gln Arg Ile Ala Arg Arg Val Ala Gln Glu Leu Arg

1 5 10 15

Asp Gly Asp Ile Val Asn Leu Gly Ile Gly Leu Pro Thr Met Val Ala

20 25 30

Asn Tyr Leu Pro Glu Gly Ile His Ile Thr Leu Gln Ser Glu Asn Gly

35 40 45

Phe Leu Gly Leu Gly Pro Val Thr Thr Ala His Pro Asp Leu Val Asn

50 55 60

Ala Gly Gly Gln Pro Cys Gly Val Leu Pro Gly Ala Ala Met Phe Asp

65 70 75 80

Ser Ala Met Ser Phe Ala Leu Ile Arg Gly Gly His Ile Asp Ala Cys

85 90 95

Val Leu Gly Gly Leu Gln Val Asp Glu Glu Ala Asn Leu Ala Asn Trp

100 105 110

Val Val Pro Gly Lys Met Val Pro Gly Met Gly Gly Ala Met Asp Leu

115 120 125

Val Thr Gly Ser Arg Lys Val Ile Ile Ala Met Glu His Cys Ala Lys

130 135 140

Asp Gly Ser Ala Lys Ile Leu Arg Arg Cys Thr Met Pro Leu Thr Ala

145 150 155 160

Gln His Ala Val His Met Leu Val Thr Glu Leu Ala Val Phe Arg Phe

165 170 175

Ile Asp Gly Lys Met Trp Leu Thr Glu Ile Ala Asp Gly Cys Asp Leu

180 185 190

Ala Thr Val Arg Ala Lys Thr Glu Ala Arg Phe Glu Val Ala Ala Asp

195 200 205

Leu Asn Thr Gln Arg Gly Asp Leu

210 215

<210> 102

<211> 663

<212> DNA

<213> 大肠杆菌

<400> 102

atgaaaacaa aattgatgac attacaagac gccaccggct tctttcgtga cggcatgacc 60

atcatggtgg gcggatttat ggggattggc actccatccc gcctggttga agcattactg 120

gaatctggtg ttcgcgacct gacattgata gccaatgata ccgcgtttgt tgataccggc 180

atcggtccgc tcatcgtcaa tggtcgagtc cgcaaagtga ttgcttcaca tatcggcacc 240

aacccggaaa caggtcggcg catgatatct ggtgagatgg acgtcgttct ggtgccgcaa 300

ggtacgctaa tcgagcaaat tcgctgtggt ggagctggac ttggtggttt tctcacccca 360

acgggtgtcg gcaccgtcgt agaggaaggc aaacagacac tgacactcga cggtaaaacc 420

tggctgctcg aacgcccact gcgcgccgac ctggcgctaa ttcgcgctca tcgttgcgac 480

acacttggca acctgaccta tcaacttagc gcccgcaact ttaaccccct gatagccctt 540

gcggctgata tcacgctggt agagccagat gaactggtcg aaaccggcga gctgcaacct 600

gaccatattg tcacccctgg tgccgttatc gaccacatca tcgtttcaca ggagagcaaa 660

taa 663

<210> 103

<211> 220

<212> PRT

<213> 大肠杆菌

<400> 103

Met Lys Thr Lys Leu Met Thr Leu Gln Asp Ala Thr Gly Phe Phe Arg

1 5 10 15

Asp Gly Met Thr Ile Met Val Gly Gly Phe Met Gly Ile Gly Thr Pro

20 25 30

Ser Arg Leu Val Glu Ala Leu Leu Glu Ser Gly Val Arg Asp Leu Thr

35 40 45

Leu Ile Ala Asn Asp Thr Ala Phe Val Asp Thr Gly Ile Gly Pro Leu

50 55 60

Ile Val Asn Gly Arg Val Arg Lys Val Ile Ala Ser His Ile Gly Thr

65 70 75 80

Asn Pro Glu Thr Gly Arg Arg Met Ile Ser Gly Glu Met Asp Val Val

85 90 95

Leu Val Pro Gln Gly Thr Leu Ile Glu Gln Ile Arg Cys Gly Gly Ala

100 105 110

Gly Leu Gly Gly Phe Leu Thr Pro Thr Gly Val Gly Thr Val Val Glu

115 120 125

Glu Gly Lys Gln Thr Leu Thr Leu Asp Gly Lys Thr Trp Leu Leu Glu

130 135 140

Arg Pro Leu Arg Ala Asp Leu Ala Leu Ile Arg Ala His Arg Cys Asp

145 150 155 160

Thr Leu Gly Asn Leu Thr Tyr Gln Leu Ser Ala Arg Asn Phe Asn Pro

165 170 175

Leu Ile Ala Leu Ala Ala Asp Ile Thr Leu Val Glu Pro Asp Glu Leu

180 185 190

Val Glu Thr Gly Glu Leu Gln Pro Asp His Ile Val Thr Pro Gly Ala

195 200 205

Val Ile Asp His Ile Ile Val Ser Gln Glu Ser Lys

210 215 220

<210> 104

<211> 1563

<212> DNA

<213> 小鼠（Mus musculus）

<400> 104

atgcctgggt cacttccttt gaatgcagag gcttgctggc caaaagatgt gggaatcgtt 60

gcccttgaaa tctactttcc ttctcaatat gtcgatcaag ctgagttgga aaaatacgat 120

ggtgtagatg ctggaaagta taccatcggc ctgggccagg ccaggatggg cttctgcacg 180

gatcgtgaag acatcaactc tctttgcctg actgtggttc agaaactgat ggagagacat 240

agcctttcct atgattgcat tgggcggcta gaagttggaa cagagacaat catcgacaaa 300

tcgaaatcag tgaagtctaa tttgatgcag ctgtttgagg agtctgggaa tacagatata 360

gaaggaatag atacaaccaa tgcatgctat gggggcacag ctgcagtctt caatgccgtg 420

aactgggtcg aatccagctc ttgggatgga cgatatgctc tggtagttgc aggagacatt 480

gctatatatg ccacaggaaa tgccagacct acaggtggag ttggagctgt ggccctgcta 540

attgggccaa acgctcctct aatttttgac cgagggctcc gtgggacaca catgcagcat 600

gcctatgact tttacaagcc tgacatgctc tccgagtacc ctgtggtcga cggaaagctc 660

tccatacagt gctacctcag cgccctggac cgctgctatt ctgtctaccg caaaaagatc 720

cgtgcccagt ggcagaaaga gggaaaggat aaagatttta ccctgaatga ttttggcttc 780

atgatctttc actcaccata ttgtaaactg gtgcagaaat ctctagctcg gatgttcctg 840

aatgactttc ttaatgatca aaacagagat aaaaacagta tttacagtgg actggaagcc 900

tttggggacg ttaaattaga agatacttac tttgacagag atgtagaaaa ggcatttatg 960

aaggctagtt ctgagctatt caaccagaaa acaaaggcgt ctttgcttgt gtctaatcag 1020

aatggaaata tgtacacatc ctctgtctat ggttccctgg cttctgtcct ggcacagtac 1080

tcacctcagc agttggcagg gaagagggtt ggagtgttct cttacggttc tggcttggct 1140

gccacgctgt actcccttaa agtcacacaa gacgccacac caggatctgc ccttgataaa 1200

ataacagcaa gtttatgtga ccttaaatca aggcttgact cgagaacttg tgtggcaccg 1260

gatgtctttg ctgaaaacat gaagctcaga gaggacacac atcacttagc caactatatt 1320

ccccagtgtt caatagactc actctttgaa ggaacgtggt atctggtcag agtggatgaa 1380

aaacacagaa ggacttacgc ccggcgcccc ttcacaaatg accacagttt ggatgaagga 1440

atggggctcg tgcatagtaa cacagcaaca gagcatattc caagccctgc taagaaagtg 1500

ccaagactcc ctgcaacctc ggccgaatct gaatcagctg tcatcagtaa cggggagcac 1560

tga 1563

<210> 105

<211> 520

<212> PRT

<213> 小鼠

<400> 105

Met Pro Gly Ser Leu Pro Leu Asn Ala Glu Ala Cys Trp Pro Lys Asp

1 5 10 15

Val Gly Ile Val Ala Leu Glu Ile Tyr Phe Pro Ser Gln Tyr Val Asp

20 25 30

Gln Ala Glu Leu Glu Lys Tyr Asp Gly Val Asp Ala Gly Lys Tyr Thr

35 40 45

Ile Gly Leu Gly Gln Ala Arg Met Gly Phe Cys Thr Asp Arg Glu Asp

50 55 60

Ile Asn Ser Leu Cys Leu Thr Val Val Gln Lys Leu Met Glu Arg His

65 70 75 80

Ser Leu Ser Tyr Asp Cys Ile Gly Arg Leu Glu Val Gly Thr Glu Thr

85 90 95

Ile Ile Asp Lys Ser Lys Ser Val Lys Ser Lys Leu Met Gln Leu Phe

100 105 110

Glu Glu Ser Gly Asn Thr Asp Ile Glu Gly Ile Asp Thr Thr Asn Ala

115 120 125

Cys Tyr Gly Gly Thr Ala Ala Val Phe Asn Ala Val Asn Trp Val Glu

130 135 140

Ser Ser Ser Trp Asp Gly Arg Tyr Ala Leu Val Val Ala Gly Asp Ile

145 150 155 160

Ala Ile Tyr Ala Thr Gly Asn Ala Arg Pro Thr Gly Gly Val Gly Ala

165 170 175

Val Ala Leu Leu Ile Gly Pro Asn Ala Pro Leu Ile Phe Asp Arg Gly

180 185 190

Leu Arg Gly Thr His Met Gln His Ala Tyr Asp Phe Tyr Lys Pro Asp

195 200 205

Met Leu Ser Glu Tyr Pro Val Val Asp Gly Lys Leu Ser Ile Gln Cys

210 215 220

Tyr Leu Ser Ala Leu Asp Arg Cys Tyr Ser Val Tyr Arg Lys Lys Ile

225 230 235 240

Arg Ala Gln Trp Gln Lys Glu Gly Lys Asp Lys Asp Phe Thr Leu Asn

245 250 255

Asp Phe Gly Phe Met Ile Phe His Ser Pro Tyr Cys Lys Leu Val Gln

260 265 270

Lys Ser Leu Ala Arg Met Phe Leu Asn Asp Phe Leu Asn Asp Gln Asn

275 280 285

Arg Asp Lys Asn Ser Ile Tyr Ser Gly Leu Glu Ala Phe Gly Asp Val

290 295 300

Lys Leu Glu Asp Thr Tyr Phe Asp Arg Asp Val Glu Lys Ala Phe Met

305 310 315 320

Lys Ala Ser Ser Glu Leu Phe Asn Gln Lys Thr Lys Ala Ser Leu Leu

325 330 335

Val Ser Asn Gln Asn Gly Asn Met Tyr Thr Ser Ser Val Tyr Gly Ser

340 345 350

Leu Ala Ser Val Leu Ala Gln Tyr Ser Pro Gln Gln Leu Ala Gly Lys

355 360 365

Arg Val Gly Val Phe Ser Tyr Gly Ser Gly Leu Ala Ala Thr Leu Tyr

370 375 380

Ser Leu Lys Val Thr Gln Asp Ala Thr Pro Gly Ser Ala Leu Asp Lys

385 390 395 400

Ile Thr Ala Ser Leu Cys Asp Leu Lys Ser Arg Leu Asp Ser Arg Thr

405 410 415

Cys Val Ala Pro Asp Val Phe Ala Glu Asn Met Lys Leu Arg Glu Asp

420 425 430

Thr His His Leu Ala Asn Tyr Ile Pro Gln Cys Ser Ile Asp Ser Leu

435 440 445

Phe Glu Gly Thr Trp Tyr Leu Val Arg Val Asp Glu Lys His Arg Arg

450 455 460

Thr Tyr Ala Arg Arg Pro Phe Thr Asn Asp His Ser Leu Asp Glu Gly

465 470 475 480

Met Gly Leu Val His Ser Asn Thr Ala Thr Glu His Ile Pro Ser Pro

485 490 495

Ala Lys Lys Val Pro Arg Leu Pro Ala Thr Ser Ala Glu Ser Glu Ser

500 505 510

Ala Val Ile Ser Asn Gly Glu His

515 520

<210> 106

<211> 770

<212> DNA

<213> 酿酒酵母

<400> 106

atgaaactct caactaaact ttgttggtgt ggtattaaag gaagacttag gccgcaaaag 60

caacaacaat tacacaatac aaacttgcaa atgactgaac taaaaaaaca aaagaccgct 120

gaacaaaaaa ccagacctca aaatgtcggt attaaaggta tccaaattta catcccaact 180

caatgtgtca accaatctga gctagagaaa tttgatggcg tttctcaagg taaatacaca 240

attggtctgg gccaaaccaa catgtctttt gtcaatgaca gagaagatat ctactcgatg 300

tccctaactg ttttgtctaa gttgatcaag agttacaaca tcgacaccaa caaaattggt 360

agattagaag tcggtactga aactctgatt gacaagtcca agtctgtcaa gtctgtcttg 420

atgcaattgt ttggtgaaaa cactgacgtc gaaggtattg acacgcttaa tgcctgttac 480

ggtggtacca acgcgttgtt caactctttg aactggattg aatctaacgc atgggatggt 540

agagacgcca ttgtagtttg cggtgatatt gccatctacg ataagggtgc cgcaagacca 600

accggtggtg ccggtactgt tgctatgtgg atcggtcctg atgctccaat tgtatttgac 660

tctgtaagag cttcttacat ggaacacgcc tacgattttt acaagccaga tttcaccagc 720

gaatatcctt acgtcgatgg tcatttttca ttaacttgtt acgtcaaggc 770

<210> 107

<211> 491

<212> PRT

<213> 酿酒酵母

<400> 107

Met Lys Leu Ser Thr Lys Leu Cys Trp Cys Gly Ile Lys Gly Arg Leu

1 5 10 15

Arg Pro Gln Lys Gln Gln Gln Leu His Asn Thr Asn Leu Gln Met Thr

20 25 30

Glu Leu Lys Lys Gln Lys Thr Ala Glu Gln Lys Thr Arg Pro Gln Asn

35 40 45

Val Gly Ile Lys Gly Ile Gln Ile Tyr Ile Pro Thr Gln Cys Val Asn

50 55 60

Gln Ser Glu Leu Glu Lys Phe Asp Gly Val Ser Gln Gly Lys Tyr Thr

65 70 75 80

Ile Gly Leu Gly Gln Thr Asn Met Ser Phe Val Asn Asp Arg Glu Asp

85 90 95

Ile Tyr Ser Met Ser Leu Thr Val Leu Ser Lys Leu Ile Lys Ser Tyr

100 105 110

Asn Ile Asp Thr Asn Lys Ile Gly Arg Leu Glu Val Gly Thr Glu Thr

115 120 125

Leu Ile Asp Lys Ser Lys Ser Val Lys Ser Val Leu Met Gln Leu Phe

130 135 140

Gly Glu Asn Thr Asp Val Glu Gly Ile Asp Thr Leu Asn Ala Cys Tyr

145 150 155 160

Gly Gly Thr Asn Ala Leu Phe Asn Ser Leu Asn Trp Ile Glu Ser Asn

165 170 175

Ala Trp Asp Gly Arg Asp Ala Ile Val Val Cys Gly Asp Ile Ala Ile

180 185 190

Tyr Asp Lys Gly Ala Ala Arg Pro Thr Gly Gly Ala Gly Thr Val Ala

195 200 205

Met Trp Ile Gly Pro Asp Ala Pro Ile Val Phe Asp Ser Val Arg Ala

210 215 220

Ser Tyr Met Glu His Ala Tyr Asp Phe Tyr Lys Pro Asp Phe Thr Ser

225 230 235 240

Glu Tyr Pro Tyr Val Asp Gly His Phe Ser Leu Thr Cys Tyr Val Lys

245 250 255

Ala Leu Asp Gln Val Tyr Lys Ser Tyr Ser Lys Lys Ala Ile Ser Lys

260 265 270

Gly Leu Val Ser Asp Pro Ala Gly Ser Asp Ala Leu Asn Val Leu Lys

275 280 285

Tyr Phe Asp Tyr Asn Val Phe His Val Pro Thr Cys Lys Leu Val Thr

290 295 300

Lys Ser Tyr Gly Arg Leu Leu Tyr Asn Asp Phe Arg Ala Asn Pro Gln

305 310 315 320

Leu Phe Pro Glu Val Asp Ala Glu Leu Ala Thr Arg Asp Tyr Asp Glu

325 330 335

Ser Leu Thr Asp Lys Asn Ile Glu Lys Thr Phe Val Asn Val Ala Lys

340 345 350

Pro Phe His Lys Glu Arg Val Ala Gln Ser Leu Ile Val Pro Thr Asn

355 360 365

Thr Gly Asn Met Tyr Thr Ala Ser Val Tyr Ala Ala Phe Ala Ser Leu

370 375 380

Leu Asn Tyr Val Gly Ser Asp Asp Leu Gln Gly Lys Arg Val Gly Leu

385 390 395 400

Phe Ser Tyr Gly Ser Gly Leu Ala Ala Ser Leu Tyr Ser Cys Lys Ile

405 410 415

Val Gly Asp Val Gln His Ile Ile Lys Glu Leu Asp Ile Thr Asn Lys

420 425 430

Leu Ala Lys Arg Ile Thr Glu Thr Pro Lys Asp Tyr Glu Ala Ala Ile

435 440 445

Glu Leu Arg Glu Asn Ala His Leu Lys Lys Asn Phe Lys Pro Gln Gly

450 455 460

Ser Ile Glu His Leu Gln Ser Gly Val Tyr Tyr Leu Thr Asn Ile Asp

465 470 475 480

Asp Lys Phe Arg Arg Ser Tyr Asp Val Lys Lys

485 490

<210> 108

<211> 1167

<212> DNA

<213> 卷曲乳杆菌（Lactobacillus crispatus）

<400> 108

atgcaagtag gtattgatca aattggactt tttacgccag acaagtacgt tgatatggtc 60

gatttggcga acgcaagaaa gcaagatcca aataagtttt tagttggcat tggtcaaaga 120

gagatgagtg ttgcggatat tacgcaagat gcagtttcaa tgggaattaa tgcgacttta 180

aagtttattg acaagattga taagaataaa gtcggtctat taatttttgg gactgaaagc 240

agtattgatc aatcaaagtc agcttcttta tttgtaaaaa cagccttaaa gttgaagcca 300

gaagtaagaa cttttgaagt aaaggaagct tgctttggtt taacggcagc cttaatgatg 360

gcacgtgatt ttgttcgggt acatcctgaa caaaccgcaa ttgtcatcgg tagtgatatt 420

gctcgctatg gtgttaatac tgctggtgag gtaacacaag gagccggtag cgtggcaatg 480

ctcatcaaag ctgacccaag cattttagcc ctaaataatg gtcattcagc ttacagcgaa 540

gatattaacg acttctggag accaaattat tctcgcaccg ctttagttga cggcaagtat 600

tcgactcaag tttacttgga tttcttcaag aagaccttta ctgattataa gaagcaaaaa 660

ggattgaaaa caagcgactt tgatgcgatt acttaccatt tgccatttac taagatgggg 720

atgaaggcta acaatattgc tattgagggg caagatcaag caacaatgat caagttggag 780

cgtagttttg cggctgctaa acaattatca agccgagtag gtaatatcta caccgcttca 840

ctttatatga gtttacttag tttgctagag aatggtgaat tacccgctgg ctcattaatt 900

ggcctgtttt catatggttc aggtgcaatg gctgagtttt atagtggcaa gttggttgaa 960

ggatatgaaa aacaaattga tcctacagct gatcaagcaa tgcttgatcg gcggaagaag 1020

ctgacagtta agcaatatga agacgtcttc aatacggctt tgttagatcc tgaggatggc 1080

ttagaattaa ctagcgacga tgaagtaggt acttggtatt ttgctggtac taaggatcat 1140

attcgtcaat accgcgtaaa agaataa 1167

<210> 109

<211> 388

<212> PRT

<213> 卷曲乳杆菌

<400> 109

Met Gln Val Gly Ile Asp Gln Ile Gly Leu Phe Thr Pro Asp Lys Tyr

1 5 10 15

Val Asp Met Val Asp Leu Ala Asn Ala Arg Lys Gln Asp Pro Asn Lys

20 25 30

Phe Leu Val Gly Ile Gly Gln Arg Glu Met Ser Val Ala Asp Ile Thr

35 40 45

Gln Asp Ala Val Ser Met Gly Ile Asn Ala Thr Leu Lys Phe Ile Asp

50 55 60

Lys Ile Asp Lys Asn Lys Val Gly Leu Leu Ile Phe Gly Thr Glu Ser

65 70 75 80

Ser Ile Asp Gln Ser Lys Ser Ala Ser Leu Phe Val Lys Thr Ala Leu

85 90 95

Lys Leu Lys Pro Glu Val Arg Thr Phe Glu Val Lys Glu Ala Cys Phe

100 105 110

Gly Leu Thr Ala Ala Leu Met Met Ala Arg Asp Phe Val Arg Val His

115 120 125

Pro Glu Gln Thr Ala Ile Val Ile Gly Ser Asp Ile Ala Arg Tyr Gly

130 135 140

Val Asn Thr Ala Gly Glu Val Thr Gln Gly Ala Gly Ser Val Ala Met

145 150 155 160

Leu Ile Lys Ala Asp Pro Ser Ile Leu Ala Leu Asn Asn Gly His Ser

165 170 175

Ala Tyr Ser Glu Asp Ile Asn Asp Phe Trp Arg Pro Asn Tyr Ser Arg

180 185 190

Thr Ala Leu Val Asp Gly Lys Tyr Ser Thr Gln Val Tyr Leu Asp Phe

195 200 205

Phe Lys Lys Thr Phe Thr Asp Tyr Lys Lys Gln Lys Gly Leu Lys Thr

210 215 220

Ser Asp Phe Asp Ala Ile Thr Tyr His Leu Pro Phe Thr Lys Met Gly

225 230 235 240

Met Lys Ala Asn Asn Ile Ala Ile Glu Gly Gln Asp Gln Ala Thr Met

245 250 255

Ile Lys Leu Glu Arg Ser Phe Ala Ala Ala Lys Gln Leu Ser Ser Arg

260 265 270

Val Gly Asn Ile Tyr Thr Ala Ser Leu Tyr Met Ser Leu Leu Ser Leu

275 280 285

Leu Glu Asn Gly Glu Leu Pro Ala Gly Ser Leu Ile Gly Leu Phe Ser

290 295 300

Tyr Gly Ser Gly Ala Met Ala Glu Phe Tyr Ser Gly Lys Leu Val Glu

305 310 315 320

Gly Tyr Glu Lys Gln Ile Asp Pro Thr Ala Asp Gln Ala Met Leu Asp

325 330 335

Arg Arg Lys Lys Leu Thr Val Lys Gln Tyr Glu Asp Val Phe Asn Thr

340 345 350

Ala Leu Leu Asp Pro Glu Asp Gly Leu Glu Leu Thr Ser Asp Asp Glu

355 360 365

Val Gly Thr Trp Tyr Phe Ala Gly Thr Lys Asp His Ile Arg Gln Tyr

370 375 380

Arg Val Lys Glu

385

<210> 110

<211> 660

<212> DNA

<213> 未知

<220>

<223> 食萘极地单胞菌（Polaromonas naphthalenivorans）序列

<400> 110

atgaccctgc atttaccttc cagagtcaag ctcgtcgatg tcggtccccg cgacggcctg 60

cagaacgaaa aatcgcccgt tcccgccgcc gtgaaaatcg aactcgtgca tcgcctgcag 120

gacgccggtc tcacggaaat cgaggtcacc agttacgttt cgcccaaatg ggtgccgcag 180

atggctgaca acgccgaagt catggccggc atccggcgca agcccggcgt gcgctattcg 240

gtgctgacgc ccaacatgca gggtctagag gcggcgatga agccagcgcc cgagttgtgg 300

cccgacgaga tcgtggtgtt cggcgcggcc agcgaagcct tcagccagcg caacatcaac 360

tgctcgattg ccgaaagcat cgagcgtttc cggccggtgg tggctgcggc ccgggccaac 420

aatatttatg ttcgcggcgc catttcctgc accgtcggct gcccctacga gggcgagatt 480

gcgccggagc gcgtcgaaat ggtggcgcgc ctgatgaagg acatcggcgt gcagcacatc 540

ggcgtggccg acacgattgg cgtcggcacg ccgctgaagg tgcagcgcgc cctggaagcg 600

gcgctgaagc attacgacct cgatggcgtg tcgggccatt tccatgacac ctacggccag 660

<210> 111

<211> 308

<212> PRT

<213> 未知

<220>

<223> 食萘极地单胞菌序列

<400> 111

Met Thr Leu His Leu Pro Ser Arg Val Lys Leu Val Asp Val Gly Pro

1 5 10 15

Arg Asp Gly Leu Gln Asn Glu Lys Ser Pro Val Pro Ala Ala Val Lys

20 25 30

Ile Glu Leu Val His Arg Leu Gln Asp Ala Gly Leu Thr Glu Ile Glu

35 40 45

Val Thr Ser Tyr Val Ser Pro Lys Trp Val Pro Gln Met Ala Asp Asn

50 55 60

Ala Glu Val Met Ala Gly Ile Arg Arg Lys Pro Gly Val Arg Tyr Ser

65 70 75 80

Val Leu Thr Pro Asn Met Gln Gly Leu Glu Ala Ala Met Lys Pro Ala

85 90 95

Pro Glu Leu Trp Pro Asp Glu Ile Val Val Phe Gly Ala Ala Ser Glu

100 105 110

Ala Phe Ser Gln Arg Asn Ile Asn Cys Ser Ile Ala Glu Ser Ile Glu

115 120 125

Arg Phe Arg Pro Val Val Ala Ala Ala Arg Ala Asn Asn Ile Tyr Val

130 135 140

Arg Gly Ala Ile Ser Cys Thr Val Gly Cys Pro Tyr Glu Gly Glu Ile

145 150 155 160

Ala Pro Glu Arg Val Glu Met Val Ala Arg Leu Met Lys Asp Ile Gly

165 170 175

Val Gln His Ile Gly Val Ala Asp Thr Ile Gly Val Gly Thr Pro Leu

180 185 190

Lys Val Gln Arg Ala Leu Glu Ala Ala Leu Lys His Tyr Asp Leu Asp

195 200 205

Gly Val Ser Gly His Phe His Asp Thr Tyr Gly Gln Ala Leu Ala Asn

210 215 220

Thr Leu Ala Ser Leu Gln Met Gly Val Trp Gln Phe Asp Thr Ser Val

225 230 235 240

Ala Gly Leu Gly Gly Cys Pro Tyr Ala Lys Gly Ala Thr Gly Asn Val

245 250 255

Ala Thr Glu Asp Val Val Tyr Leu Leu His Gly Met Gly Ile Glu Thr

260 265 270

Gly Ile Asp Leu Asp Lys Leu Ile Asp Ala Gly Lys Phe Ile Ser Asp

275 280 285

Phe Leu Gly Arg Gln Pro Asn Ser Arg Ala Ala Thr Ala Leu Leu Asn

290 295 300

Lys Arg Met Asn

305

<210> 112

<211> 770

<212> DNA

<213> 嗜酸热原体（Thermoplasma acidophilum）

<400> 112

atgacctaca gatcaatagg atcaactgct tatccaacga tcggcgttgt tctcctgggc 60

gggatagcaa atcccgtcac gaggacgccg ctgcatacct cggcagggat agcatacagt 120

gattcctgcg gatcgataag atccgagacc aggatatacg ccgatgaggc tacgcacata 180

tatttcaatg gtacggaatc gacagatgac aatagatccg tgaggcgtgt gcttgatcgt 240

tattcaagcg tcttcgagga ggcgttcggt acgaagactg tttcatattc ttcacagaac 300

ttcggcatac tgagcggcag ttccgatgct ggagcggcat cgataggcgc agctatattg 360

ggcctcaaac ccgatctgga tccgcacgat gttgaaaatg acctcagggc ggtctccgaa 420

agcgcaggca ggagcctctt cggcggctta acaataactt ggagcgatgg tttccatgca 480

tatacggaaa agattcttga tcctgaggca ttctccgggt attcgatcgt tgccttcgcg 540

tttgactatc agagaaatcc gtccgatgtc atacaccaga atatagtgag aagcgatctc 600

tatccggcca ggaagaagca tgccgatgaa catgcgcaca tgatcaagga gtacgcaaag 660

acaaacgaca taaagggcat atttgatctg gcccaggaag atacagagga ataccattcc 720

atacttcgtg gcgtgggcgt gaacgtgata agggagaaca tgcagaagct 770

<210> 113

<211> 318

<212> PRT

<213> 嗜酸热原体

<400> 113

Met Thr Tyr Arg Ser Ile Gly Ser Thr Ala Tyr Pro Thr Ile Gly Val

1 5 10 15

Val Leu Leu Gly Gly Ile Ala Asn Pro Val Thr Arg Thr Pro Leu His

20 25 30

Thr Ser Ala Gly Ile Ala Tyr Ser Asp Ser Cys Gly Ser Ile Arg Ser

35 40 45

Glu Thr Arg Ile Tyr Ala Asp Glu Ala Thr His Ile Tyr Phe Asn Gly

50 55 60

Thr Glu Ser Thr Asp Asp Asn Arg Ser Val Arg Arg Val Leu Asp Arg

65 70 75 80

Tyr Ser Ser Val Phe Glu Glu Ala Phe Gly Thr Lys Thr Val Ser Tyr

85 90 95

Ser Ser Gln Asn Phe Gly Ile Leu Ser Gly Ser Ser Asp Ala Gly Ala

100 105 110

Ala Ser Ile Gly Ala Ala Ile Leu Gly Leu Lys Pro Asp Leu Asp Pro

115 120 125

His Asp Val Glu Asn Asp Leu Arg Ala Val Ser Glu Ser Ala Gly Arg

130 135 140

Ser Leu Phe Gly Gly Leu Thr Ile Thr Trp Ser Asp Gly Phe His Ala

145 150 155 160

Tyr Thr Glu Lys Ile Leu Asp Pro Glu Ala Phe Ser Gly Tyr Ser Ile

165 170 175

Val Ala Phe Ala Phe Asp Tyr Gln Arg Asn Pro Ser Asp Val Ile His

180 185 190

Gln Asn Ile Val Arg Ser Asp Leu Tyr Pro Ala Arg Lys Lys His Ala

195 200 205

Asp Glu His Ala His Met Ile Lys Glu Tyr Ala Lys Thr Asn Asp Ile

210 215 220

Lys Gly Ile Phe Asp Leu Ala Gln Glu Asp Thr Glu Glu Tyr His Ser

225 230 235 240

Ile Leu Arg Gly Val Gly Val Asn Val Ile Arg Glu Asn Met Gln Lys

245 250 255

Leu Ile Ser Tyr Leu Lys Leu Ile Arg Lys Asp Tyr Trp Asn Ala Tyr

260 265 270

Ile Val Thr Gly Gly Ser Asn Val Tyr Val Ala Val Glu Ser Glu Asn

275 280 285

Ala Asp Arg Leu Phe Ser Ile Glu Asn Thr Phe Gly Ser Lys Lys Lys

290 295 300

Met Leu Arg Ile Val Gly Gly Ala Trp His Arg Arg Pro Glu

305 310 315

<210> 114

<211> 957

<212> DNA

<213> 嗜酸热原体

<400> 114

atgacctaca gatcaatagg atcaactgct tatccaacga tcggcgttgt tctcctgggc 60

gggatagcaa atcccgtcac gaggacgccg ctgcatacct cggcagggat agcatacagt 120

gattcctgcg gatcgataag atccgagacc aggatatacg ccgatgaggc tacgcacata 180

tatttcaatg gtacggaatc gacagatgac aatagatccg tgaggcgtgt gcttgatcgt 240

tattcaagcg tcttcgagga ggcgttcggt acgaagactg tttcatattc ttcacagaac 300

ttcggcatac tgagcggcag ttccgatgct ggagcggcat cgataggcgc agctatattg 360

ggcctcaaac ccgatctgga tccgcacgat gttgaaaatg acctcagggc ggtctccgaa 420

agcgcaggca ggagcctctt cggcggctta acaataactt ggagcgatgg tttccatgca 480

tatacggaaa agattcttga tcctgaggca ttctccgggt attcgatcgt tgccttcgcg 540

tttgactatc agagaaatcc gtccgatgtc atacaccaga atatagtgag aagcgatgag 600

tatccggcca ggaagaagca tgccgatgaa catgcgcaca tgatcaagga gtacgcaaag 660

acaaacgaca taaagggcat atttgatctg gcccaggaag atacagagga ataccattcc 720

atacttcgtg gcgtgggcgt gaacgtgata agggagaaca tgcagaagct catcagttac 780

ctgaagctga tcaggaagga ttactggaat gcctacatcg tgaccggcgg aagcaacgtc 840

tacgtggctg tagaaagcga gaatgcagat aggctgtttt cgatcgaaaa taccttcggt 900

tcaaaaaaga agatgctcag gatagttggc ggtgcctggc atagaagacc agagtga 957

<210> 115

<211> 318

<212> PRT

<213> 嗜酸热原体

<400> 115

Met Thr Tyr Arg Ser Ile Gly Ser Thr Ala Tyr Pro Thr Ile Gly Val

1 5 10 15

Val Leu Leu Gly Gly Ile Ala Asn Pro Val Thr Arg Thr Pro Leu His

20 25 30

Thr Ser Ala Gly Ile Ala Tyr Ser Asp Ser Cys Gly Ser Ile Arg Ser

35 40 45

Glu Thr Arg Ile Tyr Ala Asp Glu Ala Thr His Ile Tyr Phe Asn Gly

50 55 60

Thr Glu Ser Thr Asp Asp Asn Arg Ser Val Arg Arg Val Leu Asp Arg

65 70 75 80

Tyr Ser Ser Val Phe Glu Glu Ala Phe Gly Thr Lys Thr Val Ser Tyr

85 90 95

Ser Ser Gln Asn Phe Gly Ile Leu Ser Gly Ser Ser Asp Ala Gly Ala

100 105 110

Ala Ser Ile Gly Ala Ala Ile Leu Gly Leu Lys Pro Asp Leu Asp Pro

115 120 125

His Asp Val Glu Asn Asp Leu Arg Ala Val Ser Glu Ser Ala Gly Arg

130 135 140

Ser Leu Phe Gly Gly Leu Thr Ile Thr Trp Ser Asp Gly Phe His Ala

145 150 155 160

Tyr Thr Glu Lys Ile Leu Asp Pro Glu Ala Phe Ser Gly Tyr Ser Ile

165 170 175

Val Ala Phe Ala Phe Asp Tyr Gln Arg Asn Pro Ser Asp Val Ile His

180 185 190

Gln Asn Ile Val Arg Ser Asp Glu Tyr Pro Ala Arg Lys Lys His Ala

195 200 205

Asp Glu His Ala His Met Ile Lys Glu Tyr Ala Lys Thr Asn Asp Ile

210 215 220

Lys Gly Ile Phe Asp Leu Ala Gln Glu Asp Thr Glu Glu Tyr His Ser

225 230 235 240

Ile Leu Arg Gly Val Gly Val Asn Val Ile Arg Glu Asn Met Gln Lys

245 250 255

Leu Ile Ser Tyr Leu Lys Leu Ile Arg Lys Asp Tyr Trp Asn Ala Tyr

260 265 270

Ile Val Thr Gly Gly Ser Asn Val Tyr Val Ala Val Glu Ser Glu Asn

275 280 285

Ala Asp Arg Leu Phe Ser Ile Glu Asn Thr Phe Gly Ser Lys Lys Lys

290 295 300

Met Leu Arg Ile Val Gly Gly Ala Trp His Arg Arg Pro Glu

305 310 315

<210> 116

<211> 770

<212> DNA

<213> 未知

<220>

<223> 托氏嗜酸古菌（Picrophilus torridus）序列

<400> 116

atggaaaatt acaatgttaa gacaagggcg ttcccaacaa taggcataat actgcttggt 60

gggatctcgg ataaaaagaa caggataccg ctgcatacaa cggcaggcat agcatatact 120

ggtataaaca atgatgttta cactgagaca aagctttatg tatcaaaaga tgaaaaatgc 180

tatattgatg gaaaggaaat tgatttaaat tcagatagat caccatcgaa ggttattgat 240

aaattcaagc atgaaatact tatgagagta aatcttgatg atgaaaataa cctttcaatt 300

gattcaagga actttaatat attaagtggc agctcagatt ctggggccgc tgcactggga 360

gagtgcatag aatcaatttt tgaatacaat ataaatatat ttacatttga aaacgatctt 420

cagaggatat cagaaagtgt tggaagaagc ctttacggtg gtttaacagt aaactatgcc 480

aatggcaggg aatcattaac agagccatta cttgagcctg aggcatttaa taactttaca 540

ataattggtg cacattttaa cattgataga aaaccatcaa atgagattca tgaaaatatc 600

ataaaacatg aaaattacag ggaaagaata aaaagtgctg agagaaaggc gaaaaaactt 660

gaggagctat caaggaatgc aaacataaag ggtatctttg aacttgcaga atccgataca 720

gtggaatacc ataaaatgct ccatgatgtt ggcgttgaca taataaatga 770

<210> 117

<211> 324

<212> PRT

<213> 未知

<220>

<223> 托氏嗜酸古菌序列

<400> 117

Met Glu Asn Tyr Asn Val Lys Thr Arg Ala Phe Pro Thr Ile Gly Ile

1 5 10 15

Ile Leu Leu Gly Gly Ile Ser Asp Lys Lys Asn Arg Ile Pro Leu His

20 25 30

Thr Thr Ala Gly Ile Ala Tyr Thr Gly Ile Asn Asn Asp Val Tyr Thr

35 40 45

Glu Thr Lys Leu Tyr Val Ser Lys Asp Glu Lys Cys Tyr Ile Asp Gly

50 55 60

Lys Glu Ile Asp Leu Asn Ser Asp Arg Ser Pro Ser Lys Val Ile Asp

65 70 75 80

Lys Phe Lys His Glu Ile Leu Met Arg Val Asn Leu Asp Asp Glu Asn

85 90 95

Asn Leu Ser Ile Asp Ser Arg Asn Phe Asn Ile Leu Ser Gly Ser Ser

100 105 110

Asp Ser Gly Ala Ala Ala Leu Gly Glu Cys Ile Glu Ser Ile Phe Glu

115 120 125

Tyr Asn Ile Asn Ile Phe Thr Phe Glu Asn Asp Leu Gln Arg Ile Ser

130 135 140

Glu Ser Val Gly Arg Ser Leu Tyr Gly Gly Leu Thr Val Asn Tyr Ala

145 150 155 160

Asn Gly Arg Glu Ser Leu Thr Glu Pro Leu Leu Glu Pro Glu Ala Phe

165 170 175

Asn Asn Phe Thr Ile Ile Gly Ala His Phe Asn Ile Asp Arg Lys Pro

180 185 190

Ser Asn Glu Ile His Glu Asn Ile Ile Lys His Glu Asn Tyr Arg Glu

195 200 205

Arg Ile Lys Ser Ala Glu Arg Lys Ala Lys Lys Leu Glu Glu Leu Ser

210 215 220

Arg Asn Ala Asn Ile Lys Gly Ile Phe Glu Leu Ala Glu Ser Asp Thr

225 230 235 240

Val Glu Tyr His Lys Met Leu His Asp Val Gly Val Asp Ile Ile Asn

245 250 255

Asp Arg Met Glu Asn Leu Ile Glu Arg Val Lys Glu Met Lys Asn Asn

260 265 270

Phe Trp Asn Ser Tyr Ile Val Thr Gly Gly Pro Asn Val Phe Val Ile

275 280 285

Thr Glu Lys Lys Asp Val Asp Lys Ala Met Glu Gly Leu Asn Asp Leu

290 295 300

Cys Asp Asp Ile Arg Leu Leu Lys Val Ala Gly Lys Pro Gln Val Ile

305 310 315 320

Ser Lys Asn Phe

<210> 118

<211> 660

<212> DNA

<213> 缓症链球菌（Streptococcus mitis）

<400> 118

atggatagag agcctgtaac agtacgttcc tacgcaaata ttgccattat caaatactgg 60

ggaaagaaaa aagaaaaaga gatggttcct gctactagca gtatttctct gactttggaa 120

aatatgtaca cggagacgac cttgtcatct ctaccgacgg atgcgacagc tgatgcattt 180

tatatcaatg gtcagttaca aaatgaggca gagcatgtca agatgagtaa gattattgac 240

cgctaccgtc cagatggtga tggctttgtt cgtatcgata ctcaaaacag tatgcctacc 300

gcagcgggct tgtcatcaag ttctagtggt ttgtctgcct tggtcaaggc ttgtaatgct 360

tatttcaagc ttggtttgaa tcggagtcag ttggcacagg aggctaagtt tgcctcaggc 420

tcttcctctc ggagttttta tggaccactc ggtgcctggg ataaggatag cggagagatt 480

tacccggtag agacaggcct gaaactagct atgattatgt tggtgctaga agacaagaaa 540

aaaccaatct ctagccgtga tgggatgaaa ctttgtgtgg aaacttcgac gacctttgac 600

gactgggtgc gtcagtctga gaaggattat caggatatgc tggtttacct caaggcaaat 660

<210> 119

<211> 317

<212> PRT

<213> 缓症链球菌

<400> 119

Met Asp Arg Glu Pro Val Thr Val Arg Ser Tyr Ala Asn Ile Ala Ile

1 5 10 15

Ile Lys Tyr Trp Gly Lys Lys Lys Glu Lys Glu Met Val Pro Ala Thr

20 25 30

Ser Ser Ile Ser Leu Thr Leu Glu Asn Met Tyr Thr Glu Thr Thr Leu

35 40 45

Ser Ser Leu Pro Thr Asp Ala Thr Ala Asp Ala Phe Tyr Ile Asn Gly

50 55 60

Gln Leu Gln Asn Glu Ala Glu His Val Lys Met Ser Lys Ile Ile Asp

65 70 75 80

Arg Tyr Arg Pro Asp Gly Asp Gly Phe Val Arg Ile Asp Thr Gln Asn

85 90 95

Ser Met Pro Thr Ala Ala Gly Leu Ser Ser Ser Ser Ser Gly Leu Ser

100 105 110

Ala Leu Val Lys Ala Cys Asn Ala Tyr Phe Lys Leu Gly Leu Asn Arg

115 120 125

Ser Gln Leu Ala Gln Glu Ala Lys Phe Ala Ser Gly Ser Ser Ser Arg

130 135 140

Ser Phe Tyr Gly Pro Leu Gly Ala Trp Asp Lys Asp Ser Gly Glu Ile

145 150 155 160

Tyr Pro Val Glu Thr Gly Leu Lys Leu Ala Met Ile Met Leu Val Leu

165 170 175

Glu Asp Lys Lys Lys Pro Ile Ser Ser Arg Asp Gly Met Lys Leu Cys

180 185 190

Val Glu Thr Ser Thr Thr Phe Asp Asp Trp Val Arg Gln Ser Glu Lys

195 200 205

Asp Tyr Gln Asp Met Leu Val Tyr Leu Lys Ala Asn Asp Phe Ala Lys

210 215 220

Val Gly Glu Leu Thr Glu Lys Asn Ala Leu Ala Met His Ala Thr Thr

225 230 235 240

Lys Thr Ala Ser Pro Ala Phe Ser Tyr Leu Thr Asp Ala Ser Tyr Glu

245 250 255

Ala Met Asp Phe Val Arg Gln Leu Arg Glu Gln Gly Glu Ala Cys Tyr

260 265 270

Phe Thr Met Asp Ala Gly Pro Asn Val Lys Val Leu Cys Gln Glu Lys

275 280 285

Asp Leu Glu His Leu Ser Glu Ile Phe Gly Gln Arg Tyr Arg Leu Ile

290 295 300

Val Ser Lys Thr Lys Asp Leu Ser Gln Asp Gly Cys Cys

305 310 315

<210> 120

<211> 948

<212> DNA

<213> 戈登氏链球菌（Streptococcus gordonii）

<400> 120

atggatcgaa agcctgtaag tgtcaaatcc tatgccaata ttgcaattgt caaatattgg 60

ggcaagaaag atgcagaaaa gatgattccg tctacaagca gtatctcact gacactggaa 120

aatatgtata ccgagacgca gctgagtcct ttgccggata cagcgactgg tgatgagttt 180

tatattgacg gtcagctgca aagcccggca gaacatgcca aaatcagtaa aattattgac 240

cgttttcgct ctccagaaga tggttttgtc cgtgttgata ccagcaataa tatgccaaca 300

gcagcagggc tgtcttccag ctccagcggt ctatctgctc tggtcaaggc ttgcaatgct 360

tattttcaga caggctatca gacggaagaa ctggctcaac tggccaagtt tgcttcaggg 420

tcctctgctc ggtctttctt tggtccgcta gcggcctggg ataaggacag tggagccatc 480

tatccagtca agacggattt gaagctagcc atgattatgc tggttctgca cgatgagaaa 540

aagcccattt ccagccgcga cggtatggag ctctgtgcta aaacttccac aattttccca 600

gattggattg cccaatctgc cttggattat caggccatgc taggctattt gcaggacaat 660

gattttgcca aggttggtca actgacggaa gaaaatgccc ttcggatgca tgctacaaca 720

gaaaaagctt atccgccgtt ttcttatctg acagaggagt cttatcaggc tatggatgct 780

gtcagaaagc tacgggagca gggcgagcgt tgctacttta ccatggatgc ggggccaaat 840

gtcaaggtgc tctgcttgga ggaagatcta gaccatttgg ctgccatatt tgagaaggac 900

tatcgcctta ttgtctccaa aacaaaggac ttgtcagatg aaagctag 948

<210> 121

<211> 315

<212> PRT

<213> 戈登氏链球菌

<400> 121

Met Asp Arg Lys Pro Val Ser Val Lys Ser Tyr Ala Asn Ile Ala Ile

1 5 10 15

Val Lys Tyr Trp Gly Lys Lys Asp Ala Glu Lys Met Ile Pro Ser Thr

20 25 30

Ser Ser Ile Ser Leu Thr Leu Glu Asn Met Tyr Thr Glu Thr Gln Leu

35 40 45

Ser Pro Leu Pro Asp Thr Ala Thr Gly Asp Glu Phe Tyr Ile Asp Gly

50 55 60

Gln Leu Gln Ser Pro Ala Glu His Ala Lys Ile Ser Lys Ile Ile Asp

65 70 75 80

Arg Phe Arg Ser Pro Glu Asp Gly Phe Val Arg Val Asp Thr Ser Asn

85 90 95

Asn Met Pro Thr Ala Ala Gly Leu Ser Ser Ser Ser Ser Gly Leu Ser

100 105 110

Ala Leu Val Lys Ala Cys Asn Ala Tyr Phe Gln Thr Gly Tyr Gln Thr

115 120 125

Glu Glu Leu Ala Gln Leu Ala Lys Phe Ala Ser Gly Ser Ser Ala Arg

130 135 140

Ser Phe Phe Gly Pro Leu Ala Ala Trp Asp Lys Asp Ser Gly Ala Ile

145 150 155 160

Tyr Pro Val Lys Thr Asp Leu Lys Leu Ala Met Ile Met Leu Val Leu

165 170 175

His Asp Glu Lys Lys Pro Ile Ser Ser Arg Asp Gly Met Glu Leu Cys

180 185 190

Ala Lys Thr Ser Thr Ile Phe Pro Asp Trp Ile Ala Gln Ser Ala Leu

195 200 205

Asp Tyr Gln Ala Met Leu Gly Tyr Leu Gln Asp Asn Asp Phe Ala Lys

210 215 220

Val Gly Gln Leu Thr Glu Glu Asn Ala Leu Arg Met His Ala Thr Thr

225 230 235 240

Glu Lys Ala Tyr Pro Pro Phe Ser Tyr Leu Thr Glu Glu Ser Tyr Gln

245 250 255

Ala Met Asp Ala Val Arg Lys Leu Arg Glu Gln Gly Glu Arg Cys Tyr

260 265 270

Phe Thr Met Asp Ala Gly Pro Asn Val Lys Val Leu Cys Leu Glu Glu

275 280 285

Asp Leu Asp His Leu Ala Ala Ile Phe Glu Lys Asp Tyr Arg Leu Ile

290 295 300

Val Ser Lys Thr Lys Asp Leu Ser Asp Glu Ser

305 310 315

<210> 122

<211> 1476

<212> DNA

<213> 酿酒酵母

<400> 122

atgaaactct caactaaact ttgttggtgt ggtattaaag gaagacttag gccgcaaaag 60

caacaacaat tacacaatac aaacttgcaa atgactgaac taaaaaaaca aaagaccgct 120

gaacaaaaaa ccagacctca aaatgtcggt attaaaggta tccaaattta catcccaact 180

caatgtgtca accaatctga gctagagaaa tttgatggcg tttctcaagg taaatacaca 240

attggtctgg gccaaaccaa catgtctttt gtcaatgaca gagaagatat ctactcgatg 300

tccctaactg ttttgtctaa gttgatcaag agttacaaca tcgacaccaa caaaattggt 360

agattagaag tcggtactga aactctgatt gacaagtcca agtctgtcaa gtctgtcttg 420

atgcaattgt ttggtgaaaa cactgacgtc gaaggtattg acacgcttaa tgcctgttac 480

ggtggtacca acgcgttgtt caactctttg aactggattg aatctaacgc atgggatggt 540

agagacgcca ttgtagtttg cggtgatatt gccatctacg ataagggtgc cgcaagacca 600

accggtggtg ccggtactgt tgctatgtgg atcggtcctg atgctccaat tgtatttgac 660

tctgtaagag cttcttacat ggaacacgcc tacgattttt acaagccaga tttcaccagc 720

gaatatcctt acgtcgatgg tcatttttca ttaacttgtt acgtcaaggc tcttgatcaa 780

gtttacaaga gttattccaa gaaggctatt tctaaagggt tggttagcga tcccgctggt 840

tcggatgctt tgaacgtttt gaaatatttc gactacaacg ttttccatgt tccaacctgt 900

aaattggtca caaaatcata cggtagatta ctatataacg atttcagagc caatcctcaa 960

ttgttcccag aagttgacgc cgaattagct actcgcgatt atgacgaatc tttaaccgat 1020

aagaacattg aaaaaacttt tgttaatgtt gctaagccat tccacaaaga gagagttgcc 1080

caatctttga ttgttccaac aaacacaggt aacatgtaca ccgcatctgt ttatgccgcc 1140

tttgcatctc tattaaacta tgttggatct gacgacttac aaggcaagcg tgttggttta 1200

ttttcttacg gttccggttt agctgcatct ctatattctt gcaaaattgt tggtgacgtc 1260

caacatatta tcaaggaatt agatattact aacaaattag ccaagagaat caccgaaact 1320

ccaaaggatt acgaagctgc catcgaattg agagaaaatg cccatttgaa gaagaacttc 1380

aaacctcaag gttccattga gcatttgcaa agtggtgttt actacttgac caacatcgat 1440

gacaaattta gaagatctta cgatgttaaa aaataa 1476

<210> 123

<211> 491

<212> PRT

<213> 酿酒酵母

<400> 123

Met Lys Leu Ser Thr Lys Leu Cys Trp Cys Gly Ile Lys Gly Arg Leu

1 5 10 15

Arg Pro Gln Lys Gln Gln Gln Leu His Asn Thr Asn Leu Gln Met Thr

20 25 30

Glu Leu Lys Lys Gln Lys Thr Ala Glu Gln Lys Thr Arg Pro Gln Asn

35 40 45

Val Gly Ile Lys Gly Ile Gln Ile Tyr Ile Pro Thr Gln Cys Val Asn

50 55 60

Gln Ser Glu Leu Glu Lys Phe Asp Gly Val Ser Gln Gly Lys Tyr Thr

65 70 75 80

Ile Gly Leu Gly Gln Thr Asn Met Ser Phe Val Asn Asp Arg Glu Asp

85 90 95

Ile Tyr Ser Met Ser Leu Thr Val Leu Ser Lys Leu Ile Lys Ser Tyr

100 105 110

Asn Ile Asp Thr Asn Lys Ile Gly Arg Leu Glu Val Gly Thr Glu Thr

115 120 125

Leu Ile Asp Lys Ser Lys Ser Val Lys Ser Val Leu Met Gln Leu Phe

130 135 140

Gly Glu Asn Thr Asp Val Glu Gly Ile Asp Thr Leu Asn Ala Cys Tyr

145 150 155 160

Gly Gly Thr Asn Ala Leu Phe Asn Ser Leu Asn Trp Ile Glu Ser Asn

165 170 175

Ala Trp Asp Gly Arg Asp Ala Ile Val Val Cys Gly Asp Ile Ala Ile

180 185 190

Tyr Asp Lys Gly Ala Ala Arg Pro Thr Gly Gly Ala Gly Thr Val Ala

195 200 205

Met Trp Ile Gly Pro Asp Ala Pro Ile Val Phe Asp Ser Val Arg Ala

210 215 220

Ser Tyr Met Glu His Ala Tyr Asp Phe Tyr Lys Pro Asp Phe Thr Ser

225 230 235 240

Glu Tyr Pro Tyr Val Asp Gly His Phe Ser Leu Thr Cys Tyr Val Lys

245 250 255

Ala Leu Asp Gln Val Tyr Lys Ser Tyr Ser Lys Lys Ala Ile Ser Lys

260 265 270

Gly Leu Val Ser Asp Pro Ala Gly Ser Asp Ala Leu Asn Val Leu Lys

275 280 285

Tyr Phe Asp Tyr Asn Val Phe His Val Pro Thr Cys Lys Leu Val Thr

290 295 300

Lys Ser Tyr Gly Arg Leu Leu Tyr Asn Asp Phe Arg Ala Asn Pro Gln

305 310 315 320

Leu Phe Pro Glu Val Asp Ala Glu Leu Ala Thr Arg Asp Tyr Asp Glu

325 330 335

Ser Leu Thr Asp Lys Asn Ile Glu Lys Thr Phe Val Asn Val Ala Lys

340 345 350

Pro Phe His Lys Glu Arg Val Ala Gln Ser Leu Ile Val Pro Thr Asn

355 360 365

Thr Gly Asn Met Tyr Thr Ala Ser Val Tyr Ala Ala Phe Ala Ser Leu

370 375 380

Leu Asn Tyr Val Gly Ser Asp Asp Leu Gln Gly Lys Arg Val Gly Leu

385 390 395 400

Phe Ser Tyr Gly Ser Gly Leu Ala Ala Ser Leu Tyr Ser Cys Lys Ile

405 410 415

Val Gly Asp Val Gln His Ile Ile Lys Glu Leu Asp Ile Thr Asn Lys

420 425 430

Leu Ala Lys Arg Ile Thr Glu Thr Pro Lys Asp Tyr Glu Ala Ala Ile

435 440 445

Glu Leu Arg Glu Asn Ala His Leu Lys Lys Asn Phe Lys Pro Gln Gly

450 455 460

Ser Ile Glu His Leu Gln Ser Gly Val Tyr Tyr Leu Thr Asn Ile Asp

465 470 475 480

Asp Lys Phe Arg Arg Ser Tyr Asp Val Lys Lys

485 490

<210> 124

<211> 816

<212> DNA

<213> 恶臭假单胞菌（Pseudomonas putida）

<400> 124

atgagcgatt tcagcaccct cgaagtgatc cgcgacccgc gcggcttcgc caccctgtgg 60

ttaagccgtg aggacaagaa caacgccttc aatgcgcaga tgatccgcga gctgatcgtg 120

gccatcgacc agttggccga agacgccagc ctgcgctttg tgctgctgcg cggccgtggc 180

cggcacttca gcgccggtgc cgacctggcc tggatgcagc agtcggcgca actggacttc 240

aacaccaacc tggatgatgc ccacgaactg ggcgagctga tgtacgccct gcatcgcctc 300

aaggccccga ccctggccgt ggtgcaaggt gcagcctttg gcggcgcgct gggcctgatc 360

agctgctgcg acatggccat cggcgccgaa gacgcccaac tgtgcctgtc ggaagtacgc 420

atcggcctgg ccccggcggt catcagcccg ttcgtggtca aggccattgg cgaacgcgcc 480

gcgcgccgct acgccctcac cgccgagcgt ttcactggcg tgcgcgcacg cgagctgggc 540

ctgctggccg aggtgtaccc ggccagcgaa ctggacgacc acgtcgaagc ctgggtaagc 600

aacctgctgc agaacagccc gcaagcattg cgcgccacca aggacttgct gcgcgaagtg 660

gacgacggcg aactcagccc ggccctgcgc cgttactgcg aaaacaccat cgcccgtatc 720

cgcgtcagcg ccgaaggcca ggagggcctg cgcgctttcc tggaaaaacg ccgccctgcc 780

tggcaaaccg ttgacaagaa ggagccgcgc ccatga 816

<210> 125

<211> 271

<212> PRT

<213> 恶臭假单胞菌

<400> 125

Met Ser Asp Phe Ser Thr Leu Glu Val Ile Arg Asp Pro Arg Gly Phe

1 5 10 15

Ala Thr Leu Trp Leu Ser Arg Glu Asp Lys Asn Asn Ala Phe Asn Ala

20 25 30

Gln Met Ile Arg Glu Leu Ile Val Ala Ile Asp Gln Leu Ala Glu Asp

35 40 45

Ala Ser Leu Arg Phe Val Leu Leu Arg Gly Arg Gly Arg His Phe Ser

50 55 60

Ala Gly Ala Asp Leu Ala Trp Met Gln Gln Ser Ala Gln Leu Asp Phe

65 70 75 80

Asn Thr Asn Leu Asp Asp Ala His Glu Leu Gly Glu Leu Met Tyr Ala

85 90 95

Leu His Arg Leu Lys Ala Pro Thr Leu Ala Val Val Gln Gly Ala Ala

100 105 110

Phe Gly Gly Ala Leu Gly Leu Ile Ser Cys Cys Asp Met Ala Ile Gly

115 120 125

Ala Glu Asp Ala Gln Leu Cys Leu Ser Glu Val Arg Ile Gly Leu Ala

130 135 140

Pro Ala Val Ile Ser Pro Phe Val Val Lys Ala Ile Gly Glu Arg Ala

145 150 155 160

Ala Arg Arg Tyr Ala Leu Thr Ala Glu Arg Phe Thr Gly Val Arg Ala

165 170 175

Arg Glu Leu Gly Leu Leu Ala Glu Val Tyr Pro Ala Ser Glu Leu Asp

180 185 190

Asp His Val Glu Ala Trp Val Ser Asn Leu Leu Gln Asn Ser Pro Gln

195 200 205

Ala Leu Arg Ala Thr Lys Asp Leu Leu Arg Glu Val Asp Asp Gly Glu

210 215 220

Leu Ser Pro Ala Leu Arg Arg Tyr Cys Glu Asn Thr Ile Ala Arg Ile

225 230 235 240

Arg Val Ser Ala Glu Gly Gln Glu Gly Leu Arg Ala Phe Leu Glu Lys

245 250 255

Arg Arg Pro Ala Trp Gln Thr Val Asp Lys Lys Glu Pro Arg Pro

260 265 270

<210> 126

<211> 1608

<212> DNA

<213> 铜绿假单胞菌（Pseudomonas aeruginosa）

<400> 126

atggccatcc tgcacaccca gatcaatcca cgctccgccg agttcgcggc caacgccgcg 60

accatgctgg aacaggtcaa cgccctgcgc accctcctcg gccgcatcca cgaaggcggc 120

ggtagcgccg cccaggcccg gcacagcgcg cgcggcaagc tgctggtgcg cgaacgcatc 180

aaccgcctgc tcgaccccgg ctcgccgttc ctcgagcttt ccgccctcgc cgcccacgaa 240

gtctacggcg aagaggtcgc cgccgccggc atcgtcgccg ggatcggccg ggtcgaaggg 300

gtggaatgca tgatcgtcgg caacgatgcc acggtgaagg gcggcaccta ctatccgctg 360

accgtgaaga agcacctgcg ggcccaggcc atcgccctgg agaaccgcct gccatgcatc 420

tacctggtgg actctggcgg cgccaacctg ccgcgccagg acgaggtgtt ccccgaccgc 480

gagcacttcg gccggatctt cttcaaccag gccaacatga gtgcccgcgg catcccgcag 540

atcgccgtgg tcatgggctc ctgcaccgcc ggcggggcct acgtgccggc gatgtccgac 600

gaaaccgtga tggtgcgcga acaggccacc atcttcctcg ccgggccgcc gctggtgaag 660

gccgctaccg gcgaggtggt cagcgccgag gaacttggcg gcgccgacgt gcactgcaag 720

gtctcagggg tcgccgacca ctatgccgag gacgatgacc atgccctggc catcgcccgc 780

cgctgcgtcg ccaacctcaa ctggcgcaag cagggccagc tgcaatgccg tgcaccgcgc 840

gcgccgctgt accccgccga ggagctgtac ggggtgattc ccgccgacag caagcagccc 900

tacgacgtgc gcgaagtgat cgcacggctg gtggacggct ccgagttcga cgaattcaag 960

gcgctgttcg gcaccaccct ggtctgcggc ttcgcccacc tgcacggcta tccgatcgcc 1020

atcctggcca acaacgggat cctcttcgcc gaggccgcgc agaaaggcgc gcacttcatc 1080

gagttggcct gccagcgtgg catcccgctg ctgttcctgc agaacatcac cggtttcatg 1140

gtcggccaga agtacgaggc tggcggcatc gccaagcacg gcgccaagct ggtgaccgcg 1200

gtggcctgcg cgcgggtgcc gaagttcacc gtgctgatcg gcggcagctt cggcgccggc 1260

aactacggca tgtgcggacg cgcctacgac ccgcgcttcc tgtggatgtg gccgaacgcg 1320

aggatcggcg tgatgggcgg cgaacaggcc gccggggtgc tcgcccaggt caagcgcgag 1380

caggccgagc gcgccggcca gcagctcggc gtcgaagagg aggcgaagat caaggcgccg 1440

atcctcgagc agtacgagca ccagggccat ccctactact ccagcgcgcg actgtgggac 1500

gacggcgtga tcgatccggc gcagacccgc gaggtcctcg ccctggcgct ttccgccgcc 1560

ctcaacgccc ccatcgagcc gaccgccttc ggcgtgttcc gcatgtga 1608

<210> 127

<211> 535

<212> PRT

<213> 铜绿假单胞菌

<400> 127

Met Ala Ile Leu His Thr Gln Ile Asn Pro Arg Ser Ala Glu Phe Ala

1 5 10 15

Ala Asn Ala Ala Thr Met Leu Glu Gln Val Asn Ala Leu Arg Thr Leu

20 25 30

Leu Gly Arg Ile His Glu Gly Gly Gly Ser Ala Ala Gln Ala Arg His

35 40 45

Ser Ala Arg Gly Lys Leu Leu Val Arg Glu Arg Ile Asn Arg Leu Leu

50 55 60

Asp Pro Gly Ser Pro Phe Leu Glu Leu Ser Ala Leu Ala Ala His Glu

65 70 75 80

Val Tyr Gly Glu Glu Val Ala Ala Ala Gly Ile Val Ala Gly Ile Gly

85 90 95

Arg Val Glu Gly Val Glu Cys Met Ile Val Gly Asn Asp Ala Thr Val

100 105 110

Lys Gly Gly Thr Tyr Tyr Pro Leu Thr Val Lys Lys His Leu Arg Ala

115 120 125

Gln Ala Ile Ala Leu Glu Asn Arg Leu Pro Cys Ile Tyr Leu Val Asp

130 135 140

Ser Gly Gly Ala Asn Leu Pro Arg Gln Asp Glu Val Phe Pro Asp Arg

145 150 155 160

Glu His Phe Gly Arg Ile Phe Phe Asn Gln Ala Asn Met Ser Ala Arg

165 170 175

Gly Ile Pro Gln Ile Ala Val Val Met Gly Ser Cys Thr Ala Gly Gly

180 185 190

Ala Tyr Val Pro Ala Met Ser Asp Glu Thr Val Met Val Arg Glu Gln

195 200 205

Ala Thr Ile Phe Leu Ala Gly Pro Pro Leu Val Lys Ala Ala Thr Gly

210 215 220

Glu Val Val Ser Ala Glu Glu Leu Gly Gly Ala Asp Val His Cys Lys

225 230 235 240

Val Ser Gly Val Ala Asp His Tyr Ala Glu Asp Asp Asp His Ala Leu

245 250 255

Ala Ile Ala Arg Arg Cys Val Ala Asn Leu Asn Trp Arg Lys Gln Gly

260 265 270

Gln Leu Gln Cys Arg Ala Pro Arg Ala Pro Leu Tyr Pro Ala Glu Glu

275 280 285

Leu Tyr Gly Val Ile Pro Ala Asp Ser Lys Gln Pro Tyr Asp Val Arg

290 295 300

Glu Val Ile Ala Arg Leu Val Asp Gly Ser Glu Phe Asp Glu Phe Lys

305 310 315 320

Ala Leu Phe Gly Thr Thr Leu Val Cys Gly Phe Ala His Leu His Gly

325 330 335

Tyr Pro Ile Ala Ile Leu Ala Asn Asn Gly Ile Leu Phe Ala Glu Ala

340 345 350

Ala Gln Lys Gly Ala His Phe Ile Glu Leu Ala Cys Gln Arg Gly Ile

355 360 365

Pro Leu Leu Phe Leu Gln Asn Ile Thr Gly Phe Met Val Gly Gln Lys

370 375 380

Tyr Glu Ala Gly Gly Ile Ala Lys His Gly Ala Lys Leu Val Thr Ala

385 390 395 400

Val Ala Cys Ala Arg Val Pro Lys Phe Thr Val Leu Ile Gly Gly Ser

405 410 415

Phe Gly Ala Gly Asn Tyr Gly Met Cys Gly Arg Ala Tyr Asp Pro Arg

420 425 430

Phe Leu Trp Met Trp Pro Asn Ala Arg Ile Gly Val Met Gly Gly Glu

435 440 445

Gln Ala Ala Gly Val Leu Ala Gln Val Lys Arg Glu Gln Ala Glu Arg

450 455 460

Ala Gly Gln Gln Leu Gly Val Glu Glu Glu Ala Lys Ile Lys Ala Pro

465 470 475 480

Ile Leu Glu Gln Tyr Glu His Gln Gly His Pro Tyr Tyr Ser Ser Ala

485 490 495

Arg Leu Trp Asp Asp Gly Val Ile Asp Pro Ala Gln Thr Arg Glu Val

500 505 510

Leu Ala Leu Ala Leu Ser Ala Ala Leu Asn Ala Pro Ile Glu Pro Thr

515 520 525

Ala Phe Gly Val Phe Arg Met

530 535

<210> 128

<211> 1968

<212> DNA

<213> 铜绿假单胞菌

<400> 128

atgaacccgg actaccgcag catccagcgc ctcctggtcg ccaaccgcgg cgagatcgcc 60

tgccgggtga tgcgcagcgc gcgcgccctc ggcatcggca gcgtcgccgt gcacagcgac 120

atcgaccgcc acgcccgcca cgtcgccgaa gccgacatcg ccgtcgacct gggcggcgcc 180

aagcccgccg acagctacct gcgcggcgac aggatcatcg cagctgccct cgccagcggc 240

gcccaggcga tccaccccgg ctacggcttc ctctcggaga acgccgactt cgcccgcgcc 300

tgcgaggaag ccggcctgct cttcctcgga ccgccggcgg cggccatcga cgccatgggc 360

agcaagtcgg ccgccaaggc gctgatggaa gaagccggcg tgccgctggt gcccggctat 420

cacggcgaag cccaggacct cgagactttc cgccgggaag ccgggcgcat cggctacccg 480

gtgctgctca aggccgccgc tggcggcggc ggcaagggca tgaaggtggt ggagcgcgag 540

gccgagctgg ccgaggccct ttcctccgcc cagcgcgagg ccaaggccgc cttcggcgac 600

gcgcgtatgc tggtggagaa atacctgctg aagccgcgcc acgtggagat ccaggtattc 660

gccgaccgcc atggccactg cctgtacctc aacgaacgcg actgttcgat ccagcgccgc 720

caccagaagg tcgtcgagga agcccccgcc cccggtctcg gcgcggaact gcgccgggcc 780

atgggcgagg ccgcggtacg cgcggcgcag gcgatcggct acgtcggcgc cggtaccgtc 840

gaattcctcc tcgacgaacg cggccagttc ttcttcatgg aaatgaacac ccgcctgcag 900

gtggaacacc cggtcaccga ggccatcacc ggcctcgacc tggtcgcctg gcagatccgc 960

gtcgctcgcg gcgaggcgct accgctgacg caggaacagg taccgctgaa cggccacgcc 1020

atcgaagtac ggctctatgc ggaagacccc gagggcgact tcctccccgc cagcggccgc 1080

ctgatgctat accgcgaagc ggccgccggc cccggccggc gggtcgacag cggggtacgc 1140

gaaggcgacg aggtctcgcc gttctacgac ccgatgctgg ccaagctgat cgcctggggc 1200

gaaacccgcg aggaagcccg ccagcgcctg ctggcgatgc tggcggaaac ctcggtcggc 1260

ggcctgcgca ccaacctggc gttcctccgc cgcatcctcg gccatccggc gttcgccgcc 1320

gccgaactgg acaccgggtt catcgcgcgc caccaagacg acctgctgcc ggcgccgcaa 1380

gcgctgccgg agcatttctg gcaagccgcc gccgaagcct ggctgcagag cgaaccgggc 1440

caccgtcgcg acgacgaccc gcattcgccg tggagccgca acgacggctg gcgcagcgcc 1500

ctggcgcggg agtccgacct gatgctgcgc tgccgcgacg aacgccgctg cgtccgcctg 1560

cgccacgcca gccccagcca gtatcgcctc gacggcgacg acctggtcag ccgggtggac 1620

ggtgtcaccc gtcgctcggc ggcgttgcgc cgcggacgcc aattgttcct cgaatgggag 1680

ggcgaactgc tggccatcga agccgtcgac ccgatcgccg aggccgaggc cgcccatgcc 1740

caccagggcg gtttgagcgc gccgatgaac ggcagtatcg tgcgggtcct ggtcgagccc 1800

ggccagacgg tcgaagccgg cgccaccctg gtggtgctgg aggcgatgaa gatggaacac 1860

agcatccgcg cgccccacgc cggggtagtg aaggcgctgt attgcagcga gggcgaactg 1920

gtcgaggaag gcacgccgct ggtggagctg gacgagaacc aggcctga 1968

<210> 129

<211> 655

<212> PRT

<213> 铜绿假单胞菌

<400> 129

Met Asn Pro Asp Tyr Arg Ser Ile Gln Arg Leu Leu Val Ala Asn Arg

1 5 10 15

Gly Glu Ile Ala Cys Arg Val Met Arg Ser Ala Arg Ala Leu Gly Ile

20 25 30

Gly Ser Val Ala Val His Ser Asp Ile Asp Arg His Ala Arg His Val

35 40 45

Ala Glu Ala Asp Ile Ala Val Asp Leu Gly Gly Ala Lys Pro Ala Asp

50 55 60

Ser Tyr Leu Arg Gly Asp Arg Ile Ile Ala Ala Ala Leu Ala Ser Gly

65 70 75 80

Ala Gln Ala Ile His Pro Gly Tyr Gly Phe Leu Ser Glu Asn Ala Asp

85 90 95

Phe Ala Arg Ala Cys Glu Glu Ala Gly Leu Leu Phe Leu Gly Pro Pro

100 105 110

Ala Ala Ala Ile Asp Ala Met Gly Ser Lys Ser Ala Ala Lys Ala Leu

115 120 125

Met Glu Glu Ala Gly Val Pro Leu Val Pro Gly Tyr His Gly Glu Ala

130 135 140

Gln Asp Leu Glu Thr Phe Arg Arg Glu Ala Gly Arg Ile Gly Tyr Pro

145 150 155 160

Val Leu Leu Lys Ala Ala Ala Gly Gly Gly Gly Lys Gly Met Lys Val

165 170 175

Val Glu Arg Glu Ala Glu Leu Ala Glu Ala Leu Ser Ser Ala Gln Arg

180 185 190

Glu Ala Lys Ala Ala Phe Gly Asp Ala Arg Met Leu Val Glu Lys Tyr

195 200 205

Leu Leu Lys Pro Arg His Val Glu Ile Gln Val Phe Ala Asp Arg His

210 215 220

Gly His Cys Leu Tyr Leu Asn Glu Arg Asp Cys Ser Ile Gln Arg Arg

225 230 235 240

His Gln Lys Val Val Glu Glu Ala Pro Ala Pro Gly Leu Gly Ala Glu

245 250 255

Leu Arg Arg Ala Met Gly Glu Ala Ala Val Arg Ala Ala Gln Ala Ile

260 265 270

Gly Tyr Val Gly Ala Gly Thr Val Glu Phe Leu Leu Asp Glu Arg Gly

275 280 285

Gln Phe Phe Phe Met Glu Met Asn Thr Arg Leu Gln Val Glu His Pro

290 295 300

Val Thr Glu Ala Ile Thr Gly Leu Asp Leu Val Ala Trp Gln Ile Arg

305 310 315 320

Val Ala Arg Gly Glu Ala Leu Pro Leu Thr Gln Glu Gln Val Pro Leu

325 330 335

Asn Gly His Ala Ile Glu Val Arg Leu Tyr Ala Glu Asp Pro Glu Gly

340 345 350

Asp Phe Leu Pro Ala Ser Gly Arg Leu Met Leu Tyr Arg Glu Ala Ala

355 360 365

Ala Gly Pro Gly Arg Arg Val Asp Ser Gly Val Arg Glu Gly Asp Glu

370 375 380

Val Ser Pro Phe Tyr Asp Pro Met Leu Ala Lys Leu Ile Ala Trp Gly

385 390 395 400

Glu Thr Arg Glu Glu Ala Arg Gln Arg Leu Leu Ala Met Leu Ala Glu

405 410 415

Thr Ser Val Gly Gly Leu Arg Thr Asn Leu Ala Phe Leu Arg Arg Ile

420 425 430

Leu Gly His Pro Ala Phe Ala Ala Ala Glu Leu Asp Thr Gly Phe Ile

435 440 445

Ala Arg His Gln Asp Asp Leu Leu Pro Ala Pro Gln Ala Leu Pro Glu

450 455 460

His Phe Trp Gln Ala Ala Ala Glu Ala Trp Leu Gln Ser Glu Pro Gly

465 470 475 480

His Arg Arg Asp Asp Asp Pro His Ser Pro Trp Ser Arg Asn Asp Gly

485 490 495

Trp Arg Ser Ala Leu Ala Arg Glu Ser Asp Leu Met Leu Arg Cys Arg

500 505 510

Asp Glu Arg Arg Cys Val Arg Leu Arg His Ala Ser Pro Ser Gln Tyr

515 520 525

Arg Leu Asp Gly Asp Asp Leu Val Ser Arg Val Asp Gly Val Thr Arg

530 535 540

Arg Ser Ala Ala Leu Arg Arg Gly Arg Gln Leu Phe Leu Glu Trp Glu

545 550 555 560

Gly Glu Leu Leu Ala Ile Glu Ala Val Asp Pro Ile Ala Glu Ala Glu

565 570 575

Ala Ala His Ala His Gln Gly Gly Leu Ser Ala Pro Met Asn Gly Ser

580 585 590

Ile Val Arg Val Leu Val Glu Pro Gly Gln Thr Val Glu Ala Gly Ala

595 600 605

Thr Leu Val Val Leu Glu Ala Met Lys Met Glu His Ser Ile Arg Ala

610 615 620

Pro His Ala Gly Val Val Lys Ala Leu Tyr Cys Ser Glu Gly Glu Leu

625 630 635 640

Val Glu Glu Gly Thr Pro Leu Val Glu Leu Asp Glu Asn Gln Ala

645 650 655

<210> 130

<211> 1164

<212> DNA

<213> 大肠杆菌

<400> 130

atggaacagg ttgtcattgt cgatgcaatt cgcaccccga tgggccgttc gaagggcggt 60

gcttttcgta acgtgcgtgc agaagatctc tccgctcatt taatgcgtag cctgctggcg 120

cgtaacccgg cgctggaagc ggcggccctc gacgatattt actggggttg tgtgcagcag 180

acgctggagc agggttttaa tatcgcccgt aacgcggcgc tgctggcaga agtaccacac 240

tctgtcccgg cggttaccgt taatcgcttg tgtggttcat ccatgcaggc actgcatgac 300

gcagcacgaa tgatcatgac tggcgatgcg caggcatgtc tggttggcgg cgtggagcat 360

atgggccatg tgccgatgag tcacggcgtc gattttcacc ccggcctgag ccgcaatgtc 420

gccaaagcgg cgggcatgat gggcttaacg gcagaaatgc tggcgcgtat gcacggtatc 480

agccgtgaaa tgcaggatgc ctttgccgcg cggtcacacg cccgcgcctg ggccgccacg 540

cagtcggccg catttaaaaa tgaaatcatc ccgaccggtg gtcacgatgc cgacggcgtc 600

ctgaagcagt ttaattacga cgaagtgatt cgcccggaaa ccaccgtgga agccctcgcc 660

acgctgcgtc cggcgtttga tccagtaaac ggtatggtaa cggcgggcac atcttctgca 720

ctttccgatg gcgcagctgc catgctggtg atgagtgaaa gccgcgccca tgaattaggt 780

cttaagccgc gcgctcgtgt gcgttcgatg gcggtcgttg gttgtgaccc atcgattatg 840

ggttacggcc cggttccggc ctcgaaactg gcgctgaaaa aagcggggct ttctgccagc 900

gatatcggcg tgtttgaaat gaacgaagcc tttgccgcgc agatcctgcc atgtattaaa 960

gatctgggac taattgagca gattgacgag aagatcaacc tcaacggtgg cgcgatcgcg 1020

ctgggtcatc cgctgggttg ttccggtgcg cgtatcagca ccacgctgct gaatctgatg 1080

gaacgcaaag acgttcagtt tggtctggcg acgatgtgta tcggtctggg tcagggtatt 1140

gcgacggtgt ttgagcgggt ttaa 1164

<210> 131

<211> 387

<212> PRT

<213> 大肠杆菌

<400> 131

Met Glu Gln Val Val Ile Val Asp Ala Ile Arg Thr Pro Met Gly Arg

1 5 10 15

Ser Lys Gly Gly Ala Phe Arg Asn Val Arg Ala Glu Asp Leu Ser Ala

20 25 30

His Leu Met Arg Ser Leu Leu Ala Arg Asn Pro Ala Leu Glu Ala Ala

35 40 45

Ala Leu Asp Asp Ile Tyr Trp Gly Cys Val Gln Gln Thr Leu Glu Gln

50 55 60

Gly Phe Asn Ile Ala Arg Asn Ala Ala Leu Leu Ala Glu Val Pro His

65 70 75 80

Ser Val Pro Ala Val Thr Val Asn Arg Leu Cys Gly Ser Ser Met Gln

85 90 95

Ala Leu His Asp Ala Ala Arg Met Ile Met Thr Gly Asp Ala Gln Ala

100 105 110

Cys Leu Val Gly Gly Val Glu His Met Gly His Val Pro Met Ser His

115 120 125

Gly Val Asp Phe His Pro Gly Leu Ser Arg Asn Val Ala Lys Ala Ala

130 135 140

Gly Met Met Gly Leu Thr Ala Glu Met Leu Ala Arg Met His Gly Ile

145 150 155 160

Ser Arg Glu Met Gln Asp Ala Phe Ala Ala Arg Ser His Ala Arg Ala

165 170 175

Trp Ala Ala Thr Gln Ser Ala Ala Phe Lys Asn Glu Ile Ile Pro Thr

180 185 190

Gly Gly His Asp Ala Asp Gly Val Leu Lys Gln Phe Asn Tyr Asp Glu

195 200 205

Val Ile Arg Pro Glu Thr Thr Val Glu Ala Leu Ala Thr Leu Arg Pro

210 215 220

Ala Phe Asp Pro Val Asn Gly Met Val Thr Ala Gly Thr Ser Ser Ala

225 230 235 240

Leu Ser Asp Gly Ala Ala Ala Met Leu Val Met Ser Glu Ser Arg Ala

245 250 255

His Glu Leu Gly Leu Lys Pro Arg Ala Arg Val Arg Ser Met Ala Val

260 265 270

Val Gly Cys Asp Pro Ser Ile Met Gly Tyr Gly Pro Val Pro Ala Ser

275 280 285

Lys Leu Ala Leu Lys Lys Ala Gly Leu Ser Ala Ser Asp Ile Gly Val

290 295 300

Phe Glu Met Asn Glu Ala Phe Ala Ala Gln Ile Leu Pro Cys Ile Lys

305 310 315 320

Asp Leu Gly Leu Ile Glu Gln Ile Asp Glu Lys Ile Asn Leu Asn Gly

325 330 335

Gly Ala Ile Ala Leu Gly His Pro Leu Gly Cys Ser Gly Ala Arg Ile

340 345 350

Ser Thr Thr Leu Leu Asn Leu Met Glu Arg Lys Asp Val Gln Phe Gly

355 360 365

Leu Ala Thr Met Cys Ile Gly Leu Gly Gln Gly Ile Ala Thr Val Phe

370 375 380

Glu Arg Val

385

<210> 132

<211> 2190

<212> DNA

<213> 大肠杆菌

<400> 132

atgctttaca aaggcgacac cctgtacctt gactggctgg aagatggcat tgccgaactg 60

gtatttgatg ccccaggttc agttaataaa ctcgacactg cgaccgtcgc cagcctcggc 120

gaggccatcg gcgtgctgga acagcaatca gatctaaaag ggctgctgct gcgttcgaac 180

aaagcagcct ttatcgtcgg tgctgatatc accgaatttt tgtccctgtt cctcgttcct 240

gaagaacagt taagtcagtg gctgcacttt gccaatagcg tgtttaatcg cctggaagat 300

ctgccggtgc cgaccattgc tgccgtcaat ggctatgcgc tgggcggtgg ctgcgaatgc 360

gtgctggcga ccgattatcg tctggcgacg ccggatctgc gcatcggtct gccggaaacc 420

aaactgggca tcatgcctgg ctttggcggt tctgtacgta tgccacgtat gctgggcgct 480

gacagtgcgc tggaaatcat tgccgccggt aaagatgtcg gcgcggatca ggcgctgaaa 540

atcggtctgg tggatggcgt agtcaaagca gaaaaactgg ttgaaggcgc aaaggcggtt 600

ttacgccagg ccattaacgg cgacctcgac tggaaagcaa aacgtcagcc gaagctggaa 660

ccactaaaac tgagcaagat tgaagccacc atgagcttca ccatcgctaa agggatggtc 720

gcacaaacag cggggaaaca ttatccggcc cccatcaccg cagtaaaaac cattgaagct 780

gcggcccgtt ttggtcgtga agaagcctta aacctggaaa acaaaagttt tgtcccgctg 840

gcgcatacca acgaagcccg cgcactggtc ggcattttcc ttaacgatca atatgtaaaa 900

ggcaaagcga agaaactcac caaagacgtt gaaaccccga aacaggccgc ggtgctgggt 960

gcaggcatta tgggcggcgg catcgcttac cagtctgcgt ggaaaggcgt gccggttgtc 1020

atgaaagata tcaacgacaa gtcgttaacc ctcggcatga ccgaagccgc gaaactgctg 1080

aacaagcagc ttgagcgcgg caagatcgat ggtctgaaac tggctggcgt gatctccaca 1140

atccacccaa cgctcgacta cgccggattt gaccgcgtgg atattgtggt agaagcggtt 1200

gttgaaaacc cgaaagtgaa aaaagccgta ctggcagaaa ccgaacaaaa agtacgccag 1260

gataccgtgc tggcgtctaa cacttcaacc attcctatca gcgaactggc caacgcgctg 1320

gaacgcccgg aaaacttctg cgggatgcac ttctttaacc cggtccaccg aatgccgttg 1380

gtagaaatta ttcgcggcga gaaaagctcc gacgaaacca tcgcgaaagt tgtcgcctgg 1440

gcgagcaaga tgggcaagac gccgattgtg gttaacgact gccccggctt ctttgttaac 1500

cgcgtgctgt tcccgtattt cgccggtttc agccagctgc tgcgcgacgg cgcggatttc 1560

cgcaagatcg acaaagtgat ggaaaaacag tttggctggc cgatgggccc ggcatatctg 1620

ctggacgttg tgggcattga taccgcgcat cacgctcagg ctgtcatggc agcaggcttc 1680

ccgcagcgga tgcagaaaga ttaccgcgat gccatcgacg cgctgtttga tgccaaccgc 1740

tttggtcaga agaacggcct cggtttctgg cgttataaag aagacagcaa aggtaagccg 1800

aagaaagaag aagacgccgc cgttgaagac ctgctggcag aagtgagcca gccgaagcgc 1860

gatttcagcg aagaagagat tatcgcccgc atgatgatcc cgatggtcaa cgaagtggtg 1920

cgctgtctgg aggaaggcat tatcgccact ccggcggaag cggatatggc gctggtctac 1980

ggcctgggct tccctccgtt ccacggcggc gcgttccgct ggctggacac cctcggtagc 2040

gcaaaatacc tcgatatggc acagcaatat cagcacctcg gcccgctgta tgaagtgccg 2100

gaaggtctgc gtaataaagc gcgtcataac gaaccgtact atcctccggt tgagccagcc 2160

cgtccggttg gcgacctgaa aacggcttaa 2190

<210> 133

<211> 729

<212> PRT

<213> 大肠杆菌

<400> 133

Met Leu Tyr Lys Gly Asp Thr Leu Tyr Leu Asp Trp Leu Glu Asp Gly

1 5 10 15

Ile Ala Glu Leu Val Phe Asp Ala Pro Gly Ser Val Asn Lys Leu Asp

20 25 30

Thr Ala Thr Val Ala Ser Leu Gly Glu Ala Ile Gly Val Leu Glu Gln

35 40 45

Gln Ser Asp Leu Lys Gly Leu Leu Leu Arg Ser Asn Lys Ala Ala Phe

50 55 60

Ile Val Gly Ala Asp Ile Thr Glu Phe Leu Ser Leu Phe Leu Val Pro

65 70 75 80

Glu Glu Gln Leu Ser Gln Trp Leu His Phe Ala Asn Ser Val Phe Asn

85 90 95

Arg Leu Glu Asp Leu Pro Val Pro Thr Ile Ala Ala Val Asn Gly Tyr

100 105 110

Ala Leu Gly Gly Gly Cys Glu Cys Val Leu Ala Thr Asp Tyr Arg Leu

115 120 125

Ala Thr Pro Asp Leu Arg Ile Gly Leu Pro Glu Thr Lys Leu Gly Ile

130 135 140

Met Pro Gly Phe Gly Gly Ser Val Arg Met Pro Arg Met Leu Gly Ala

145 150 155 160

Asp Ser Ala Leu Glu Ile Ile Ala Ala Gly Lys Asp Val Gly Ala Asp

165 170 175

Gln Ala Leu Lys Ile Gly Leu Val Asp Gly Val Val Lys Ala Glu Lys

180 185 190

Leu Val Glu Gly Ala Lys Ala Val Leu Arg Gln Ala Ile Asn Gly Asp

195 200 205

Leu Asp Trp Lys Ala Lys Arg Gln Pro Lys Leu Glu Pro Leu Lys Leu

210 215 220

Ser Lys Ile Glu Ala Thr Met Ser Phe Thr Ile Ala Lys Gly Met Val

225 230 235 240

Ala Gln Thr Ala Gly Lys His Tyr Pro Ala Pro Ile Thr Ala Val Lys

245 250 255

Thr Ile Glu Ala Ala Ala Arg Phe Gly Arg Glu Glu Ala Leu Asn Leu

260 265 270

Glu Asn Lys Ser Phe Val Pro Leu Ala His Thr Asn Glu Ala Arg Ala

275 280 285

Leu Val Gly Ile Phe Leu Asn Asp Gln Tyr Val Lys Gly Lys Ala Lys

290 295 300

Lys Leu Thr Lys Asp Val Glu Thr Pro Lys Gln Ala Ala Val Leu Gly

305 310 315 320

Ala Gly Ile Met Gly Gly Gly Ile Ala Tyr Gln Ser Ala Trp Lys Gly

325 330 335

Val Pro Val Val Met Lys Asp Ile Asn Asp Lys Ser Leu Thr Leu Gly

340 345 350

Met Thr Glu Ala Ala Lys Leu Leu Asn Lys Gln Leu Glu Arg Gly Lys

355 360 365

Ile Asp Gly Leu Lys Leu Ala Gly Val Ile Ser Thr Ile His Pro Thr

370 375 380

Leu Asp Tyr Ala Gly Phe Asp Arg Val Asp Ile Val Val Glu Ala Val

385 390 395 400

Val Glu Asn Pro Lys Val Lys Lys Ala Val Leu Ala Glu Thr Glu Gln

405 410 415

Lys Val Arg Gln Asp Thr Val Leu Ala Ser Asn Thr Ser Thr Ile Pro

420 425 430

Ile Ser Glu Leu Ala Asn Ala Leu Glu Arg Pro Glu Asn Phe Cys Gly

435 440 445

Met His Phe Phe Asn Pro Val His Arg Met Pro Leu Val Glu Ile Ile

450 455 460

Arg Gly Glu Lys Ser Ser Asp Glu Thr Ile Ala Lys Val Val Ala Trp

465 470 475 480

Ala Ser Lys Met Gly Lys Thr Pro Ile Val Val Asn Asp Cys Pro Gly

485 490 495

Phe Phe Val Asn Arg Val Leu Phe Pro Tyr Phe Ala Gly Phe Ser Gln

500 505 510

Leu Leu Arg Asp Gly Ala Asp Phe Arg Lys Ile Asp Lys Val Met Glu

515 520 525

Lys Gln Phe Gly Trp Pro Met Gly Pro Ala Tyr Leu Leu Asp Val Val

530 535 540

Gly Ile Asp Thr Ala His His Ala Gln Ala Val Met Ala Ala Gly Phe

545 550 555 560

Pro Gln Arg Met Gln Lys Asp Tyr Arg Asp Ala Ile Asp Ala Leu Phe

565 570 575

Asp Ala Asn Arg Phe Gly Gln Lys Asn Gly Leu Gly Phe Trp Arg Tyr

580 585 590

Lys Glu Asp Ser Lys Gly Lys Pro Lys Lys Glu Glu Asp Ala Ala Val

595 600 605

Glu Asp Leu Leu Ala Glu Val Ser Gln Pro Lys Arg Asp Phe Ser Glu

610 615 620

Glu Glu Ile Ile Ala Arg Met Met Ile Pro Met Val Asn Glu Val Val

625 630 635 640

Arg Cys Leu Glu Glu Gly Ile Ile Ala Thr Pro Ala Glu Ala Asp Met

645 650 655

Ala Leu Val Tyr Gly Leu Gly Phe Pro Pro Phe His Gly Gly Ala Phe

660 665 670

Arg Trp Leu Asp Thr Leu Gly Ser Ala Lys Tyr Leu Asp Met Ala Gln

675 680 685

Gln Tyr Gln His Leu Gly Pro Leu Tyr Glu Val Pro Glu Gly Leu Arg

690 695 700

Asn Lys Ala Arg His Asn Glu Pro Tyr Tyr Pro Pro Val Glu Pro Ala

705 710 715 720

Arg Pro Val Gly Asp Leu Lys Thr Ala

725

<210> 134

<211> 861

<212> DNA

<213> 大肠杆菌

<400> 134

atgagtcagg cgctaaaaaa tttactgaca ttgttaaatc tggaaaaaat tgaggaagga 60

ctctttcgcg gccagagtga agatttaggt ttacgccagg tgtttggcgg ccaggtcgtg 120

ggtcaggcct tgtatgctgc aaaagagacc gtccctgaag agcggctggt acattcgttt 180

cacagctact ttcttcgccc tggcgatagt aagaagccga ttatttatga tgtcgaaacg 240

ctgcgtgacg gtaacagctt cagcgcccgc cgggttgctg ctattcaaaa cggcaaaccg 300

attttttata tgactgcctc tttccaggca ccagaagcgg gtttcgaaca tcaaaaaaca 360

atgccgtccg cgccagcgcc tgatggcctc ccttcggaaa cgcaaatcgc ccaatcgctg 420

gcgcacctgc tgccgccagt gctgaaagat aaattcatct gcgatcgtcc gctggaagtc 480

cgtccggtgg agtttcataa cccactgaaa ggtcacgtcg cagaaccaca tcgtcaggtg 540

tggatccgcg caaatggtag cgtgccggat gacctgcgcg ttcatcagta tctgctcggt 600

tacgcttctg atcttaactt cctgccggta gctctacagc cgcacggcat cggttttctc 660

gaaccgggga ttcagattgc caccattgac cattccatgt ggttccatcg cccgtttaat 720

ttgaatgaat ggctgctgta tagcgtggag agcacctcgg cgtccagcgc acgtggcttt 780

gtgcgcggtg agttttatac ccaagacggc gtactggttg cctcgaccgt tcaggaaggg 840

gtgatgcgta atcacaatta a 861

<210> 135

<211> 286

<212> PRT

<213> 大肠杆菌

<400> 135

Met Ser Gln Ala Leu Lys Asn Leu Leu Thr Leu Leu Asn Leu Glu Lys

1 5 10 15

Ile Glu Glu Gly Leu Phe Arg Gly Gln Ser Glu Asp Leu Gly Leu Arg

20 25 30

Gln Val Phe Gly Gly Gln Val Val Gly Gln Ala Leu Tyr Ala Ala Lys

35 40 45

Glu Thr Val Pro Glu Glu Arg Leu Val His Ser Phe His Ser Tyr Phe

50 55 60

Leu Arg Pro Gly Asp Ser Lys Lys Pro Ile Ile Tyr Asp Val Glu Thr

65 70 75 80

Leu Arg Asp Gly Asn Ser Phe Ser Ala Arg Arg Val Ala Ala Ile Gln

85 90 95

Asn Gly Lys Pro Ile Phe Tyr Met Thr Ala Ser Phe Gln Ala Pro Glu

100 105 110

Ala Gly Phe Glu His Gln Lys Thr Met Pro Ser Ala Pro Ala Pro Asp

115 120 125

Gly Leu Pro Ser Glu Thr Gln Ile Ala Gln Ser Leu Ala His Leu Leu

130 135 140

Pro Pro Val Leu Lys Asp Lys Phe Ile Cys Asp Arg Pro Leu Glu Val

145 150 155 160

Arg Pro Val Glu Phe His Asn Pro Leu Lys Gly His Val Ala Glu Pro

165 170 175

His Arg Gln Val Trp Ile Arg Ala Asn Gly Ser Val Pro Asp Asp Leu

180 185 190

Arg Val His Gln Tyr Leu Leu Gly Tyr Ala Ser Asp Leu Asn Phe Leu

195 200 205

Pro Val Ala Leu Gln Pro His Gly Ile Gly Phe Leu Glu Pro Gly Ile

210 215 220

Gln Ile Ala Thr Ile Asp His Ser Met Trp Phe His Arg Pro Phe Asn

225 230 235 240

Leu Asn Glu Trp Leu Leu Tyr Ser Val Glu Ser Thr Ser Ala Ser Ser

245 250 255

Ala Arg Gly Phe Val Arg Gly Glu Phe Tyr Thr Gln Asp Gly Val Leu

260 265 270

Val Ala Ser Thr Val Gln Glu Gly Val Met Arg Asn His Asn

275 280 285

<210> 136

<211> 1056

<212> DNA

<213> 拜氏梭菌

<400> 136

atgaaaggtt ttgcaatgct aggtattaat aagttaggat ggatcgaaaa agaaaggcca 60

gttgcgggtt catatgatgc tattgtacgc ccattagcag tatctccgtg tacatcagat 120

atacatactg tttttgaggg agctcttgga gataggaaga atatgatttt agggcatgaa 180

gctgtaggtg aagttgttga agtaggaagt gaagtgaagg attttaaacc tggtgacaga 240

gttatagttc cttgtacaac tccagattgg agatctttgg aagttcaagc tggttttcaa 300

cagcactcaa acggtatgct cgcaggatgg aaattttcaa atttcaagga tggagttttt 360

ggtgaatatt ttcatgtaaa tgatgcggat atgaatcttg cgattctacc taaagacatg 420

ccattagaaa atgctgttat gataacagat atgatgacta ctggatttca tggagcagaa 480

cttgcagata ttcaaatggg ttcaagtgtt gtggtaattg gcattggagc tgttggctta 540

atgggaatag caggtgctaa attacgtgga gcaggtagaa taattggagt ggggagcagg 600

ccgatttgtg ttgaggctgc aaaattttat ggagcaacag atattctaaa ttataaaaat 660

ggtcatatag ttgatcaagt tatgaaatta acgaatggaa aaggcgttga ccgcgtaatt 720

atggcaggcg gtggttctga aacattatcc caagcagtat ctatggttaa accaggagga 780

ataatttcta atataaatta tcatggaagt ggagatgctt tactaatacc acgtgtagaa 840

tggggatgtg gaatggctca caagactata aaaggaggtc tttgtcctgg gggacgtttg 900

agagcagaaa tgttaagaga tatggtagta tataatcgtg ttgatctaag taaattagtt 960

acacatgtat atcatggatt tgatcacata gaagaagcac tgttattaat gaaagacaag 1020

ccaaaagact taattaaagc agtagttata ttataa 1056

<210> 137

<211> 1056

<212> DNA

<213> 拜氏梭菌

<400> 137

atgaaagggt ttgccatgtt aggtatcaat aaactgggct ggattgaaaa agagcgcccg 60

gtggcgggtt catacgatgc aattgttcgt ccgctggccg tcagtccgtg caccagcgac 120

atccatacag tctttgaagg tgccctgggt gatcggaaaa acatgattct gggccatgaa 180

gccgtaggcg aagtagtgga agtgggcagc gaggtaaagg atttcaaacc gggtgatcgc 240

gtaattgttc cttgcacgac cccagattgg cgctcactgg aagttcaggc tggttttcag 300

cagcatagta acggtatgtt agcaggctgg aagtttagca attttaaaga cggggtgttc 360

ggggagtatt ttcatgtcaa cgatgcggac atgaatctgg ctattttacc taaagatatg 420

ccgctggaga acgcagtgat gattaccgac atgatgacga caggctttca cggtgcagaa 480

ctggctgaca tccaaatggg ctccagtgtg gtggttatcg gtattggtgc ggtcgggctg 540

atgggtatcg cgggcgcgaa attacggggc gctggtcgca tcatcggtgt cggcagccgt 600

ccaatttgcg ttgaagcagc taaattctat ggtgccacgg acattctgaa ctataaaaat 660

ggtcacatcg tcgatcaggt gatgaaactg accaatggca aaggtgtgga ccgcgtgatc 720

atggcgggcg gcggctcaga gactttatct caagcggtgt ctatggttaa acctgggggc 780

atcatttcta atattaacta tcatggctcc ggcgacgcat tactgatccc gcgtgttgaa 840

tggggctgtg ggatggccca caaaaccatt aaaggggggt tatgtccggg tggtcgcctg 900

cgtgccgaaa tgctgcgtga catggtggtt tacaaccgtg tggatctgtc caaactggta 960

actcacgtat accacggttt cgatcacatt gaagaggcgc tgctgctgat gaaggataag 1020

ccaaaggatc tgattaaggc ggttgttatc ctgtaa 1056

<210> 138

<211> 351

<212> PRT

<213> 拜氏梭菌

<400> 138

Met Lys Gly Phe Ala Met Leu Gly Ile Asn Lys Leu Gly Trp Ile Glu

1 5 10 15

Lys Glu Arg Pro Val Ala Gly Ser Tyr Asp Ala Ile Val Arg Pro Leu

20 25 30

Ala Val Ser Pro Cys Thr Ser Asp Ile His Thr Val Phe Glu Gly Ala

35 40 45

Leu Gly Asp Arg Lys Asn Met Ile Leu Gly His Glu Ala Val Gly Glu

50 55 60

Val Val Glu Val Gly Ser Glu Val Lys Asp Phe Lys Pro Gly Asp Arg

65 70 75 80

Val Ile Val Pro Cys Thr Thr Pro Asp Trp Arg Ser Leu Glu Val Gln

85 90 95

Ala Gly Phe Gln Gln His Ser Asn Gly Met Leu Ala Gly Trp Lys Phe

100 105 110

Ser Asn Phe Lys Asp Gly Val Phe Gly Glu Tyr Phe His Val Asn Asp

115 120 125

Ala Asp Met Asn Leu Ala Ile Leu Pro Lys Asp Met Pro Leu Glu Asn

130 135 140

Ala Val Met Ile Thr Asp Met Met Thr Thr Gly Phe His Gly Ala Glu

145 150 155 160

Leu Ala Asp Ile Gln Met Gly Ser Ser Val Val Val Ile Gly Ile Gly

165 170 175

Ala Val Gly Leu Met Gly Ile Ala Gly Ala Lys Leu Arg Gly Ala Gly

180 185 190

Arg Ile Ile Gly Val Gly Ser Arg Pro Ile Cys Val Glu Ala Ala Lys

195 200 205

Phe Tyr Gly Ala Thr Asp Ile Leu Asn Tyr Lys Asn Gly His Ile Val

210 215 220

Asp Gln Val Met Lys Leu Thr Asn Gly Lys Gly Val Asp Arg Val Ile

225 230 235 240

Met Ala Gly Gly Gly Ser Glu Thr Leu Ser Gln Ala Val Ser Met Val

245 250 255

Lys Pro Gly Gly Ile Ile Ser Asn Ile Asn Tyr His Gly Ser Gly Asp

260 265 270

Ala Leu Leu Ile Pro Arg Val Glu Trp Gly Cys Gly Met Ala His Lys

275 280 285

Thr Ile Lys Gly Gly Leu Cys Pro Gly Gly Arg Leu Arg Ala Glu Met

290 295 300

Leu Arg Asp Met Val Val Tyr Asn Arg Val Asp Leu Ser Lys Leu Val

305 310 315 320

Thr His Val Tyr His Gly Phe Asp His Ile Glu Glu Ala Leu Leu Leu

325 330 335

Met Lys Asp Lys Pro Lys Asp Leu Ile Lys Ala Val Val Ile Leu

340 345 350

<210> 139

<211> 2580

<212> DNA

<213> 未知

<220>

<223> 食碳梭菌（Clostridium carboxidivorans）序列

<400> 139

atgaaggtaa ctaatgttga agaactgatg aaaaaaatgc aggaagtgca aaatgctcaa 60

aaaaaatttg ggagttttac tcaggaacaa gtagatgaaa ttttcaggca agcagcacta 120

gcagctaaca gtgccagaat agatctagct aaaatggcag tggaagaaac taaaatggga 180

attgtagagg ataaggttat aaaaaatcat tttgttgcag aatacatata taataagtat 240

aaaaatgaaa aaacttgtgg gattttggaa gaagatgaag gctttggaat ggttaaaatt 300

gcagaacctg taggtgtgat tgcagcagta attccaacaa caaatccaac atctacagca 360

atatttaaag cattattagc tttgaaaaca agaaatggta taattttttc accacatcca 420

agagcaaaaa agtgtactat tgcagcagct aagttagttc ttgatgctgc agttaaagca 480

ggtgctccta aaggaattat aggttggata gatgaacctt ctattgaact ttcacagata 540

gtaatgaaag aagctgatat aatccttgca acaggtggtc caggtatggt taaagcagct 600

tattcttcag gtaaacctgc tataggggtt ggtcctggta acacacctgc tttaattgat 660

gaaagtgctg atattaaaat ggcagtaaat tcaatacttc tttccaaaac ttttgataat 720

ggtatgattt gtgcttcaga gcagtcggta gtagttgtag attcaatata tgaagaagtt 780

aagaaagaat ttgctcatag aggagcttat attttaagta aggatgaaac aactaaagtt 840

ggaaaaatac tcttagttaa tggtacatta aatgctggta tcgttggtca gagtgcttat 900

aaaatagcag aaatggcagg agttaaagtt ccagaagatg ctaaagttct tataggagaa 960

gtaaaatcag tggagcattc agaagagcca ttttcacatg aaaagttatc tccagtttta 1020

gctatgtata gagctaaaaa ttttgatgaa gctcttttaa aagctggaag attagttgaa 1080

ctcggtggaa tgggtcatac atctgtatta tatgtaaatg caataactga aaaagtaaaa 1140

gtagaaaaat ttagagaaac tatgaagact ggtagaacat taataaatat gccttcagca 1200

caaggtgcta taggagacat atataacttt aaactagctc cttcattaac attaggttgt 1260

ggttcatggg gaggaaactc cgtatcagaa aatgttggac ctaaacactt attaaatata 1320

aaaagtgttg ctgagaggag agaaaatatg ctttggttta gagttcctga aaaggtttat 1380

tttaaatatg gtagtcttgg agttgcatta aaagaattag atattttgga taagaaaaaa 1440

gtatttatag taacagataa agttctttat caattaggtt atatagatag agttacaaag 1500

attcttgaag aattgaaaat ttcatataaa atatttacag atgtagaacc agatccaacc 1560

ctagctacag ctaaaaaagg tgcagaagaa ttgttatcat ttaatccaga tactattata 1620

gcagttggtg gtggttcagc aatggatgct gctaagatta tgtgggtaat gtatgaacat 1680

ccggaagtaa gatttgaaga tttagctatg agatttatgg atataagaaa gagagtatat 1740

acttttccta agatgggtga aaaagcaatg atgatttctg ttgcaacatc agcaggaaca 1800

ggatcagaag taacaccttt tgcagtaatt actgatgaaa aaacaggagc taaatatcca 1860

ttagctgatt atgaattaac tccaaatatg gctataattg atgctgaact tatgatgggt 1920

atgccaaaag gattaacagc agcttcagga atagatgcac taactcatgc aatagaagct 1980

tatgtatcaa taatggcttc agaatatact aatggattag cgttagaagc aataagattg 2040

atatttaagt atttaccaat agcttacagt gaaggaacaa caagtataaa ggcaagagaa 2100

aaaatggcgc atgcttcaac aatagctggt atggcatttg ctaatgcatt tttaggagta 2160

tgtcattcaa tggcacataa attaggatca actcatcacg taccacatgg cattgccaat 2220

gcactactta taaatgaagt tataaaattt aatgcagtag aaaatccaag aaaacaagct 2280

gcatttccac aatataagta tccaaatata aaaaagagat atgctagaat agcagattac 2340

cttaacttag gtgggtcaac agacgatgaa aaagtacaat tattaataaa tgctatagat 2400

gaattaaaag ctaagataaa tattccagaa agtattaaag aagcaggagt aacagaagaa 2460

aaattttatg ctactttaga taaaatgtca gaattagctt ttgatgatca atgtacaggt 2520

gcaaacccta gatatccatt aataagtgaa ataaaacaaa tgtatgtaaa tgcattttaa 2580

<210> 140

<211> 859

<212> PRT

<213> 未知

<220>

<223> 食碳梭菌序列

<400> 140

Met Lys Val Thr Asn Val Glu Glu Leu Met Lys Lys Met Gln Glu Val

1 5 10 15

Gln Asn Ala Gln Lys Lys Phe Gly Ser Phe Thr Gln Glu Gln Val Asp

20 25 30

Glu Ile Phe Arg Gln Ala Ala Leu Ala Ala Asn Ser Ala Arg Ile Asp

35 40 45

Leu Ala Lys Met Ala Val Glu Glu Thr Lys Met Gly Ile Val Glu Asp

50 55 60

Lys Val Ile Lys Asn His Phe Val Ala Glu Tyr Ile Tyr Asn Lys Tyr

65 70 75 80

Lys Asn Glu Lys Thr Cys Gly Ile Leu Glu Glu Asp Glu Gly Phe Gly

85 90 95

Met Val Lys Ile Ala Glu Pro Val Gly Val Ile Ala Ala Val Ile Pro

100 105 110

Thr Thr Asn Pro Thr Ser Thr Ala Ile Phe Lys Ala Leu Leu Ala Leu

115 120 125

Lys Thr Arg Asn Gly Ile Ile Phe Ser Pro His Pro Arg Ala Lys Lys

130 135 140

Cys Thr Ile Ala Ala Ala Lys Leu Val Leu Asp Ala Ala Val Lys Ala

145 150 155 160

Gly Ala Pro Lys Gly Ile Ile Gly Trp Ile Asp Glu Pro Ser Ile Glu

165 170 175

Leu Ser Gln Ile Val Met Lys Glu Ala Asp Ile Ile Leu Ala Thr Gly

180 185 190

Gly Pro Gly Met Val Lys Ala Ala Tyr Ser Ser Gly Lys Pro Ala Ile

195 200 205

Gly Val Gly Pro Gly Asn Thr Pro Ala Leu Ile Asp Glu Ser Ala Asp

210 215 220

Ile Lys Met Ala Val Asn Ser Ile Leu Leu Ser Lys Thr Phe Asp Asn

225 230 235 240

Gly Met Ile Cys Ala Ser Glu Gln Ser Val Val Val Val Asp Ser Ile

245 250 255

Tyr Glu Glu Val Lys Lys Glu Phe Ala His Arg Gly Ala Tyr Ile Leu

260 265 270

Ser Lys Asp Glu Thr Thr Lys Val Gly Lys Ile Leu Leu Val Asn Gly

275 280 285

Thr Leu Asn Ala Gly Ile Val Gly Gln Ser Ala Tyr Lys Ile Ala Glu

290 295 300

Met Ala Gly Val Lys Val Pro Glu Asp Ala Lys Val Leu Ile Gly Glu

305 310 315 320

Val Lys Ser Val Glu His Ser Glu Glu Pro Phe Ser His Glu Lys Leu

325 330 335

Ser Pro Val Leu Ala Met Tyr Arg Ala Lys Asn Phe Asp Glu Ala Leu

340 345 350

Leu Lys Ala Gly Arg Leu Val Glu Leu Gly Gly Met Gly His Thr Ser

355 360 365

Val Leu Tyr Val Asn Ala Ile Thr Glu Lys Val Lys Val Glu Lys Phe

370 375 380

Arg Glu Thr Met Lys Thr Gly Arg Thr Leu Ile Asn Met Pro Ser Ala

385 390 395 400

Gln Gly Ala Ile Gly Asp Ile Tyr Asn Phe Lys Leu Ala Pro Ser Leu

405 410 415

Thr Leu Gly Cys Gly Ser Trp Gly Gly Asn Ser Val Ser Glu Asn Val

420 425 430

Gly Pro Lys His Leu Leu Asn Ile Lys Ser Val Ala Glu Arg Arg Glu

435 440 445

Asn Met Leu Trp Phe Arg Val Pro Glu Lys Val Tyr Phe Lys Tyr Gly

450 455 460

Ser Leu Gly Val Ala Leu Lys Glu Leu Asp Ile Leu Asp Lys Lys Lys

465 470 475 480

Val Phe Ile Val Thr Asp Lys Val Leu Tyr Gln Leu Gly Tyr Ile Asp

485 490 495

Arg Val Thr Lys Ile Leu Glu Glu Leu Lys Ile Ser Tyr Lys Ile Phe

500 505 510

Thr Asp Val Glu Pro Asp Pro Thr Leu Ala Thr Ala Lys Lys Gly Ala

515 520 525

Glu Glu Leu Leu Ser Phe Asn Pro Asp Thr Ile Ile Ala Val Gly Gly

530 535 540

Gly Ser Ala Met Asp Ala Ala Lys Ile Met Trp Val Met Tyr Glu His

545 550 555 560

Pro Glu Val Arg Phe Glu Asp Leu Ala Met Arg Phe Met Asp Ile Arg

565 570 575

Lys Arg Val Tyr Thr Phe Pro Lys Met Gly Glu Lys Ala Met Met Ile

580 585 590

Ser Val Ala Thr Ser Ala Gly Thr Gly Ser Glu Val Thr Pro Phe Ala

595 600 605

Val Ile Thr Asp Glu Lys Thr Gly Ala Lys Tyr Pro Leu Ala Asp Tyr

610 615 620

Glu Leu Thr Pro Asn Met Ala Ile Ile Asp Ala Glu Leu Met Met Gly

625 630 635 640

Met Pro Lys Gly Leu Thr Ala Ala Ser Gly Ile Asp Ala Leu Thr His

645 650 655

Ala Ile Glu Ala Tyr Val Ser Ile Met Ala Ser Glu Tyr Thr Asn Gly

660 665 670

Leu Ala Leu Glu Ala Ile Arg Leu Ile Phe Lys Tyr Leu Pro Ile Ala

675 680 685

Tyr Ser Glu Gly Thr Thr Ser Ile Lys Ala Arg Glu Lys Met Ala His

690 695 700

Ala Ser Thr Ile Ala Gly Met Ala Phe Ala Asn Ala Phe Leu Gly Val

705 710 715 720

Cys His Ser Met Ala His Lys Leu Gly Ser Thr His His Val Pro His

725 730 735

Gly Ile Ala Asn Ala Leu Leu Ile Asn Glu Val Ile Lys Phe Asn Ala

740 745 750

Val Glu Asn Pro Arg Lys Gln Ala Ala Phe Pro Gln Tyr Lys Tyr Pro

755 760 765

Asn Ile Lys Lys Arg Tyr Ala Arg Ile Ala Asp Tyr Leu Asn Leu Gly

770 775 780

Gly Ser Thr Asp Asp Glu Lys Val Gln Leu Leu Ile Asn Ala Ile Asp

785 790 795 800

Glu Leu Lys Ala Lys Ile Asn Ile Pro Glu Ser Ile Lys Glu Ala Gly

805 810 815

Val Thr Glu Glu Lys Phe Tyr Ala Thr Leu Asp Lys Met Ser Glu Leu

820 825 830

Ala Phe Asp Asp Gln Cys Thr Gly Ala Asn Pro Arg Tyr Pro Leu Ile

835 840 845

Ser Glu Ile Lys Gln Met Tyr Val Asn Ala Phe

850 855

<210> 141

<211> 1401

<212> DNA

<213> 大肠杆菌

<400> 141

atgccacatt cctacgatta cgatgccata gtaataggtt ccggccccgg cggcgaaggc 60

gctgcaatgg gcctggttaa gcaaggtgcg cgcgtcgcag ttatcgagcg ttatcaaaat 120

gttggcggcg gttgcaccca ctggggcacc atcccgtcga aagctctccg tcacgccgtc 180

agccgcatta tagaattcaa tcaaaaccca ctttacagcg accattcccg actgctccgc 240

tcttcttttg ccgatatcct taaccatgcc gataacgtga ttaatcaaca aacgcgcatg 300

cgtcagggat tttacgaacg taatcactgt gaaatattgc agggaaacgc tcgctttgtt 360

gacgagcata cgttggcgct ggattgcccg gacggcagcg ttgaaacact aaccgctgaa 420

aaatttgtta ttgcctgcgg ctctcgtcca tatcatccaa cagatgttga tttcacccat 480

ccacgcattt acgacagcga ctcaattctc agcatgcacc acgaaccgcg ccatgtactt 540

atctatggtg ctggagtgat cggctgtgaa tatgcgtcga tcttccgcgg tatggatgta 600

aaagtggatc tgatcaacac ccgcgatcgc ctgctggcat ttctcgatca agagatgtca 660

gattctctct cctatcactt ctggaacagt ggcgtagtga ttcgtcacaa cgaagagtac 720

gagaagatcg aaggctgtga cgatggtgtg atcatgcatc tgaagtcggg taaaaaactg 780

aaagctgact gcctgctcta tgccaacggt cgcaccggta ataccgattc gctggcgtta 840

cagaacattg ggctagaaac tgacagccgc ggacagctga aggtcaacag catgtatcag 900

accgcacagc cacacgttta cgcggtgggc gacgtgattg gttatccgag cctggcgtcg 960

gcggcctatg accaggggcg cattgccgcg caggcgctgg taaaaggcga agccaccgca 1020

catctgattg aagatatccc taccggtatt tacaccatcc cggaaatcag ctctgtgggc 1080

aaaaccgaac agcagctgac cgcaatgaaa gtgccatatg aagtgggccg cgcccagttt 1140

aaacatctgg cacgcgcaca aatcgtcggc atgaacgtgg gcacgctgaa aattttgttc 1200

catcgggaaa caaaagagat tctgggtatt cactgctttg gcgagcgcgc tgccgaaatt 1260

attcatatcg gtcaggcgat tatggaacag aaaggtggcg gcaacactat tgagtacttc 1320

gtcaacacca cctttaacta cccgacgatg gcggaagcct atcgggtagc tgcgttaaac 1380

ggtttaaacc gcctgtttta a 1401

<210> 142

<211> 466

<212> PRT

<213> 大肠杆菌

<400> 142

Met Pro His Ser Tyr Asp Tyr Asp Ala Ile Val Ile Gly Ser Gly Pro

1 5 10 15

Gly Gly Glu Gly Ala Ala Met Gly Leu Val Lys Gln Gly Ala Arg Val

20 25 30

Ala Val Ile Glu Arg Tyr Gln Asn Val Gly Gly Gly Cys Thr His Trp

35 40 45

Gly Thr Ile Pro Ser Lys Ala Leu Arg His Ala Val Ser Arg Ile Ile

50 55 60

Glu Phe Asn Gln Asn Pro Leu Tyr Ser Asp His Ser Arg Leu Leu Arg

65 70 75 80

Ser Ser Phe Ala Asp Ile Leu Asn His Ala Asp Asn Val Ile Asn Gln

85 90 95

Gln Thr Arg Met Arg Gln Gly Phe Tyr Glu Arg Asn His Cys Glu Ile

100 105 110

Leu Gln Gly Asn Ala Arg Phe Val Asp Glu His Thr Leu Ala Leu Asp

115 120 125

Cys Pro Asp Gly Ser Val Glu Thr Leu Thr Ala Glu Lys Phe Val Ile

130 135 140

Ala Cys Gly Ser Arg Pro Tyr His Pro Thr Asp Val Asp Phe Thr His

145 150 155 160

Pro Arg Ile Tyr Asp Ser Asp Ser Ile Leu Ser Met His His Glu Pro

165 170 175

Arg His Val Leu Ile Tyr Gly Ala Gly Val Ile Gly Cys Glu Tyr Ala

180 185 190

Ser Ile Phe Arg Gly Met Asp Val Lys Val Asp Leu Ile Asn Thr Arg

195 200 205

Asp Arg Leu Leu Ala Phe Leu Asp Gln Glu Met Ser Asp Ser Leu Ser

210 215 220

Tyr His Phe Trp Asn Ser Gly Val Val Ile Arg His Asn Glu Glu Tyr

225 230 235 240

Glu Lys Ile Glu Gly Cys Asp Asp Gly Val Ile Met His Leu Lys Ser

245 250 255

Gly Lys Lys Leu Lys Ala Asp Cys Leu Leu Tyr Ala Asn Gly Arg Thr

260 265 270

Gly Asn Thr Asp Ser Leu Ala Leu Gln Asn Ile Gly Leu Glu Thr Asp

275 280 285

Ser Arg Gly Gln Leu Lys Val Asn Ser Met Tyr Gln Thr Ala Gln Pro

290 295 300

His Val Tyr Ala Val Gly Asp Val Ile Gly Tyr Pro Ser Leu Ala Ser

305 310 315 320

Ala Ala Tyr Asp Gln Gly Arg Ile Ala Ala Gln Ala Leu Val Lys Gly

325 330 335

Glu Ala Thr Ala His Leu Ile Glu Asp Ile Pro Thr Gly Ile Tyr Thr

340 345 350

Ile Pro Glu Ile Ser Ser Val Gly Lys Thr Glu Gln Gln Leu Thr Ala

355 360 365

Met Lys Val Pro Tyr Glu Val Gly Arg Ala Gln Phe Lys His Leu Ala

370 375 380

Arg Ala Gln Ile Val Gly Met Asn Val Gly Thr Leu Lys Ile Leu Phe

385 390 395 400

His Arg Glu Thr Lys Glu Ile Leu Gly Ile His Cys Phe Gly Glu Arg

405 410 415

Ala Ala Glu Ile Ile His Ile Gly Gln Ala Ile Met Glu Gln Lys Gly

420 425 430

Gly Gly Asn Thr Ile Glu Tyr Phe Val Asn Thr Thr Phe Asn Tyr Pro

435 440 445

Thr Met Ala Glu Ala Tyr Arg Val Ala Ala Leu Asn Gly Leu Asn Arg

450 455 460

Leu Phe

465

<210> 143

<211> 1323

<212> DNA

<213> 大肠杆菌

<400> 143

atgcaagcct attttgacca gctcgatcgc gttcgttatg aaggctcaaa atcctcaaac 60

ccgttagcat tccgtcacta caatcccgac gaactggtgt tgggtaagcg tatggaagag 120

cacttgcgtt ttgccgcctg ctactggcac accttctgct ggaacggggc ggatatgttt 180

ggtgtggggg cgtttaatcg tccgtggcag cagcctggtg aggcactggc gttggcgaag 240

cgtaaagcag atgtcgcatt tgagtttttc cacaagttac atgtgccatt ttattgcttc 300

cacgatgtgg atgtttcccc tgagggcgcg tcgttaaaag agtacatcaa taattttgcg 360

caaatggttg atgtcctggc aggcaagcaa gaagagagcg gcgtgaagct gctgtgggga 420

acggccaact gctttacaaa ccctcgctac ggcgcgggtg cggcgacgaa cccagatcct 480

gaagtcttca gctgggcggc aacgcaagtt gttacagcga tggaagcaac ccataaattg 540

ggcggtgaaa actatgtcct gtggggcggt cgtgaaggtt acgaaacgct gttaaatacc 600

gacttgcgtc aggagcgtga acaactgggc cgctttatgc agatggtggt tgagcataaa 660

cataaaatcg gtttccaggg cacgttgctt atcgaaccga aaccgcaaga accgaccaaa 720

catcaatatg attacgatgc cgcgacggtc tatggcttcc tgaaacagtt tggtctggaa 780

aaagagatta aactgaacat tgaagctaac cacgcgacgc tggcaggtca ctctttccat 840

catgaaatag ccaccgccat tgcgcttggc ctgttcggtt ctgtcgacgc caaccgtggc 900

gatgcgcaac tgggctggga caccgaccag ttcccgaaca gtgtggaaga gaatgcgctg 960

gtgatgtatg aaattctcaa agcaggcggt ttcaccaccg gtggtctgaa cttcgatgcc 1020

aaagtacgtc gtcaaagtac tgataaatat gatctgtttt acggtcatat cggcgcgatg 1080

gatacgatgg cactggcgct gaaaattgca gcgcgcatga ttgaagatgg cgagctggat 1140

aaacgcatcg cgcagcgtta ttccggctgg aatagcgaat tgggccagca aatcctgaaa 1200

ggccaaatgt cactggcaga tttagccaaa tatgctcagg aacatcattt gtctccggtg 1260

catcagagtg gtcgccagga acaactggaa aatctggtaa accattatct gttcgacaaa 1320

taa 1323

<210> 144

<211> 440

<212> PRT

<213> 大肠杆菌

<400> 144

Met Gln Ala Tyr Phe Asp Gln Leu Asp Arg Val Arg Tyr Glu Gly Ser

1 5 10 15

Lys Ser Ser Asn Pro Leu Ala Phe Arg His Tyr Asn Pro Asp Glu Leu

20 25 30

Val Leu Gly Lys Arg Met Glu Glu His Leu Arg Phe Ala Ala Cys Tyr

35 40 45

Trp His Thr Phe Cys Trp Asn Gly Ala Asp Met Phe Gly Val Gly Ala

50 55 60

Phe Asn Arg Pro Trp Gln Gln Pro Gly Glu Ala Leu Ala Leu Ala Lys

65 70 75 80

Arg Lys Ala Asp Val Ala Phe Glu Phe Phe His Lys Leu His Val Pro

85 90 95

Phe Tyr Cys Phe His Asp Val Asp Val Ser Pro Glu Gly Ala Ser Leu

100 105 110

Lys Glu Tyr Ile Asn Asn Phe Ala Gln Met Val Asp Val Leu Ala Gly

115 120 125

Lys Gln Glu Glu Ser Gly Val Lys Leu Leu Trp Gly Thr Ala Asn Cys

130 135 140

Phe Thr Asn Pro Arg Tyr Gly Ala Gly Ala Ala Thr Asn Pro Asp Pro

145 150 155 160

Glu Val Phe Ser Trp Ala Ala Thr Gln Val Val Thr Ala Met Glu Ala

165 170 175

Thr His Lys Leu Gly Gly Glu Asn Tyr Val Leu Trp Gly Gly Arg Glu

180 185 190

Gly Tyr Glu Thr Leu Leu Asn Thr Asp Leu Arg Gln Glu Arg Glu Gln

195 200 205

Leu Gly Arg Phe Met Gln Met Val Val Glu His Lys His Lys Ile Gly

210 215 220

Phe Gln Gly Thr Leu Leu Ile Glu Pro Lys Pro Gln Glu Pro Thr Lys

225 230 235 240

His Gln Tyr Asp Tyr Asp Ala Ala Thr Val Tyr Gly Phe Leu Lys Gln

245 250 255

Phe Gly Leu Glu Lys Glu Ile Lys Leu Asn Ile Glu Ala Asn His Ala

260 265 270

Thr Leu Ala Gly His Ser Phe His His Glu Ile Ala Thr Ala Ile Ala

275 280 285

Leu Gly Leu Phe Gly Ser Val Asp Ala Asn Arg Gly Asp Ala Gln Leu

290 295 300

Gly Trp Asp Thr Asp Gln Phe Pro Asn Ser Val Glu Glu Asn Ala Leu

305 310 315 320

Val Met Tyr Glu Ile Leu Lys Ala Gly Gly Phe Thr Thr Gly Gly Leu

325 330 335

Asn Phe Asp Ala Lys Val Arg Arg Gln Ser Thr Asp Lys Tyr Asp Leu

340 345 350

Phe Tyr Gly His Ile Gly Ala Met Asp Thr Met Ala Leu Ala Leu Lys

355 360 365

Ile Ala Ala Arg Met Ile Glu Asp Gly Glu Leu Asp Lys Arg Ile Ala

370 375 380

Gln Arg Tyr Ser Gly Trp Asn Ser Glu Leu Gly Gln Gln Ile Leu Lys

385 390 395 400

Gly Gln Met Ser Leu Ala Asp Leu Ala Lys Tyr Ala Gln Glu His His

405 410 415

Leu Ser Pro Val His Gln Ser Gly Arg Gln Glu Gln Leu Glu Asn Leu

420 425 430

Val Asn His Tyr Leu Phe Asp Lys

435 440

<210> 145

<211> 1455

<212> DNA

<213> 大肠杆菌

<400> 145

atgtatatcg ggatagatct tggcacctcg ggcgtaaaag ttattttgct caacgagcag 60

ggtgaggtgg ttgctgcgca aacggaaaag ctgaccgttt cgcgcccgca tccactctgg 120

tcggaacaag acccggaaca gtggtggcag gcaactgatc gcgcaatgaa agctctgggc 180

gatcagcatt ctctgcagga cgttaaagca ttgggtattg ccggccagat gcacggagca 240

accttgctgg atgctcagca acgggtgtta cgccctgcca ttttgtggaa cgacgggcgc 300

tgtgcgcaag agtgcacttt gctggaagcg cgagttccgc aatcgcgggt gattaccggc 360

aacctgatga tgcccggatt tactgcgcct aaattgctat gggttcagcg gcatgagccg 420

gagatattcc gtcaaatcga caaagtatta ttaccgaaag attacttgcg tctgcgtatg 480

acgggggagt ttgccagcga tatgtctgac gcagctggca ccatgtggct ggatgtcgca 540

aagcgtgact ggagtgacgt catgctgcag gcttgcgact tatctcgtga ccagatgccc 600

gcattatacg aaggcagcga aattactggt gctttgttac ctgaagttgc gaaagcgtgg 660

ggtatggcga cggtgccagt tgtcgcaggc ggtggcgaca atgcagctgg tgcagttggt 720

gtgggaatgg ttgatgctaa tcaggcaatg ttatcgctgg ggacgtcggg ggtctatttt 780

gctgtcagcg aagggttctt aagcaagcca gaaagcgccg tacatagctt ttgccatgcg 840

ctaccgcaac gttggcattt aatgtctgtg atgctgagtg cagcgtcgtg tctggattgg 900

gccgcgaaat taaccggcct gagcaatgtc ccagctttaa tcgctgcagc tcaacaggct 960

gatgaaagtg ccgagccagt ttggtttctg ccttatcttt ccggcgagcg tacgccacac 1020

aataatcccc aggcgaaggg ggttttcttt ggtttgactc atcaacatgg ccccaatgaa 1080

ctggcgcgag cagtgctgga aggcgtgggt tatgcgctgg cagatggcat ggatgtcgtg 1140

catgcctgcg gtattaaacc gcaaagtgtt acgttgattg ggggcggggc gcgtagtgag 1200

tactggcgtc agatgctggc ggatatcagc ggtcagcagc tcgattaccg tacggggggg 1260

gatgtggggc cagcactggg cgcagcaagg ctggcgcaga tcgcggcgaa tccagagaaa 1320

tcgctcattg aattgttgcc gcaactaccg ttagaacagt cgcatctacc agatgcgcag 1380

cgttatgccg cttatcagcc acgacgagaa acgttccgtc gcctctatca gcaacttctg 1440

ccattaatgg cgtaa 1455

<210> 146

<211> 484

<212> PRT

<213> 大肠杆菌

<400> 146

Met Tyr Ile Gly Ile Asp Leu Gly Thr Ser Gly Val Lys Val Ile Leu

1 5 10 15

Leu Asn Glu Gln Gly Glu Val Val Ala Ala Gln Thr Glu Lys Leu Thr

20 25 30

Val Ser Arg Pro His Pro Leu Trp Ser Glu Gln Asp Pro Glu Gln Trp

35 40 45

Trp Gln Ala Thr Asp Arg Ala Met Lys Ala Leu Gly Asp Gln His Ser

50 55 60

Leu Gln Asp Val Lys Ala Leu Gly Ile Ala Gly Gln Met His Gly Ala

65 70 75 80

Thr Leu Leu Asp Ala Gln Gln Arg Val Leu Arg Pro Ala Ile Leu Trp

85 90 95

Asn Asp Gly Arg Cys Ala Gln Glu Cys Thr Leu Leu Glu Ala Arg Val

100 105 110

Pro Gln Ser Arg Val Ile Thr Gly Asn Leu Met Met Pro Gly Phe Thr

115 120 125

Ala Pro Lys Leu Leu Trp Val Gln Arg His Glu Pro Glu Ile Phe Arg

130 135 140

Gln Ile Asp Lys Val Leu Leu Pro Lys Asp Tyr Leu Arg Leu Arg Met

145 150 155 160

Thr Gly Glu Phe Ala Ser Asp Met Ser Asp Ala Ala Gly Thr Met Trp

165 170 175

Leu Asp Val Ala Lys Arg Asp Trp Ser Asp Val Met Leu Gln Ala Cys

180 185 190

Asp Leu Ser Arg Asp Gln Met Pro Ala Leu Tyr Glu Gly Ser Glu Ile

195 200 205

Thr Gly Ala Leu Leu Pro Glu Val Ala Lys Ala Trp Gly Met Ala Thr

210 215 220

Val Pro Val Val Ala Gly Gly Gly Asp Asn Ala Ala Gly Ala Val Gly

225 230 235 240

Val Gly Met Val Asp Ala Asn Gln Ala Met Leu Ser Leu Gly Thr Ser

245 250 255

Gly Val Tyr Phe Ala Val Ser Glu Gly Phe Leu Ser Lys Pro Glu Ser

260 265 270

Ala Val His Ser Phe Cys His Ala Leu Pro Gln Arg Trp His Leu Met

275 280 285

Ser Val Met Leu Ser Ala Ala Ser Cys Leu Asp Trp Ala Ala Lys Leu

290 295 300

Thr Gly Leu Ser Asn Val Pro Ala Leu Ile Ala Ala Ala Gln Gln Ala

305 310 315 320

Asp Glu Ser Ala Glu Pro Val Trp Phe Leu Pro Tyr Leu Ser Gly Glu

325 330 335

Arg Thr Pro His Asn Asn Pro Gln Ala Lys Gly Val Phe Phe Gly Leu

340 345 350

Thr His Gln His Gly Pro Asn Glu Leu Ala Arg Ala Val Leu Glu Gly

355 360 365

Val Gly Tyr Ala Leu Ala Asp Gly Met Asp Val Val His Ala Cys Gly

370 375 380

Ile Lys Pro Gln Ser Val Thr Leu Ile Gly Gly Gly Ala Arg Ser Glu

385 390 395 400

Tyr Trp Arg Gln Met Leu Ala Asp Ile Ser Gly Gln Gln Leu Asp Tyr

405 410 415

Arg Thr Gly Gly Asp Val Gly Pro Ala Leu Gly Ala Ala Arg Leu Ala

420 425 430

Gln Ile Ala Ala Asn Pro Glu Lys Ser Leu Ile Glu Leu Leu Pro Gln

435 440 445

Leu Pro Leu Glu Gln Ser His Leu Pro Asp Ala Gln Arg Tyr Ala Ala

450 455 460

Tyr Gln Pro Arg Arg Glu Thr Phe Arg Arg Leu Tyr Gln Gln Leu Leu

465 470 475 480

Pro Leu Met Ala

<210> 147

<211> 1992

<212> DNA

<213> 大肠杆菌

<400> 147

atgtcctcac gtaaagagct tgccaatgct attcgtgcgc tgagcatgga cgcagtacag 60

aaagccaaat ccggtcaccc gggtgcccct atgggtatgg ctgacattgc cgaagtcctg 120

tggcgtgatt tcctgaaaca caacccgcag aatccgtcct gggctgaccg tgaccgcttc 180

gtgctgtcca acggccacgg ctccatgctg atctacagcc tgctgcacct caccggttac 240

gatctgccga tggaagaact gaaaaacttc cgtcagctgc actctaaaac tccgggtcac 300

ccggaagtgg gttacaccgc tggtgtggaa accaccaccg gtccgctggg tcagggtatt 360

gccaacgcag tcggtatggc gattgcagaa aaaacgctgg cggcgcagtt taaccgtccg 420

ggccacgaca ttgtcgacca ctacacctac gccttcatgg gcgacggctg catgatggaa 480

ggcatctccc acgaagtttg ctctctggcg ggtacgctga agctgggtaa actgattgca 540

ttctacgatg acaacggtat ttctatcgat ggtcacgttg aaggctggtt caccgacgac 600

accgcaatgc gtttcgaagc ttacggctgg cacgttattc gcgacatcga cggtcatgac 660

gcggcatcta tcaaacgcgc agtagaagaa gcgcgcgcag tgactgacaa accttccctg 720

ctgatgtgca aaaccatcat cggtttcggt tccccgaaca aagccggtac ccacgactcc 780

cacggtgcgc cgctgggcga cgctgaaatt gccctgaccc gcgaacaact gggctggaaa 840

tatgcgccgt tcgaaatccc gtctgaaatc tatgctcagt gggatgcgaa agaagcaggc 900

caggcgaaag aatccgcatg gaacgagaaa ttcgctgctt acgcgaaagc ttatccgcag 960

gaagccgctg aatttacccg ccgtatgaaa ggcgaaatgc cgtctgactt cgacgctaaa 1020

gcgaaagagt tcatcgctaa actgcaggct aatccggcga aaatcgccag ccgtaaagcg 1080

tctcagaatg ctatcgaagc gttcggtccg ctgttgccgg aattcctcgg cggttctgct 1140

gacctggcgc cgtctaacct gaccctgtgg tctggttcta aagcaatcaa cgaagatgct 1200

gcgggtaact acatccacta cggtgttcgc gagttcggta tgaccgcgat tgctaacggt 1260

atctccctgc acggtggctt cctgccgtac acctccacct tcctgatgtt cgtggaatac 1320

gcacgtaacg ccgtacgtat ggctgcgctg atgaaacagc gtcaggtgat ggtttacacc 1380

cacgactcca tcggtctggg cgaagacggc ccgactcacc agccggttga gcaggtcgct 1440

tctctgcgcg taaccccgaa catgtctaca tggcgtccgt gtgaccaggt tgaatccgcg 1500

gtcgcgtgga aatacggtgt tgagcgtcag gacggcccga ccgcactgat cctctcccgt 1560

cagaacctgg cgcagcagga acgaactgaa gagcaactgg caaacatcgc gcgcggtggt 1620

tatgtgctga aagactgcgc cggtcagccg gaactgattt tcatcgctac cggttcagaa 1680

gttgaactgg ctgttgctgc ctacgaaaaa ctgactgccg aaggcgtgaa agcgcgcgtg 1740

gtgtccatgc cgtctaccga cgcatttgac aagcaggatg ctgcttaccg tgaatccgta 1800

ctgccgaaag cggttactgc acgcgttgct gtagaagcgg gtattgctga ctactggtac 1860

aagtatgttg gcctgaacgg tgctatcgtc ggtatgacca ccttcggtga atctgctccg 1920

gcagagctgc tgtttgaaga gttcggcttc actgttgata acgttgttgc gaaagcaaaa 1980

gaactgctgt aa 1992

<210> 148

<211> 663

<212> PRT

<213> 大肠杆菌

<400> 148

Met Ser Ser Arg Lys Glu Leu Ala Asn Ala Ile Arg Ala Leu Ser Met

1 5 10 15

Asp Ala Val Gln Lys Ala Lys Ser Gly His Pro Gly Ala Pro Met Gly

20 25 30

Met Ala Asp Ile Ala Glu Val Leu Trp Arg Asp Phe Leu Lys His Asn

35 40 45

Pro Gln Asn Pro Ser Trp Ala Asp Arg Asp Arg Phe Val Leu Ser Asn

50 55 60

Gly His Gly Ser Met Leu Ile Tyr Ser Leu Leu His Leu Thr Gly Tyr

65 70 75 80

Asp Leu Pro Met Glu Glu Leu Lys Asn Phe Arg Gln Leu His Ser Lys

85 90 95

Thr Pro Gly His Pro Glu Val Gly Tyr Thr Ala Gly Val Glu Thr Thr

100 105 110

Thr Gly Pro Leu Gly Gln Gly Ile Ala Asn Ala Val Gly Met Ala Ile

115 120 125

Ala Glu Lys Thr Leu Ala Ala Gln Phe Asn Arg Pro Gly His Asp Ile

130 135 140

Val Asp His Tyr Thr Tyr Ala Phe Met Gly Asp Gly Cys Met Met Glu

145 150 155 160

Gly Ile Ser His Glu Val Cys Ser Leu Ala Gly Thr Leu Lys Leu Gly

165 170 175

Lys Leu Ile Ala Phe Tyr Asp Asp Asn Gly Ile Ser Ile Asp Gly His

180 185 190

Val Glu Gly Trp Phe Thr Asp Asp Thr Ala Met Arg Phe Glu Ala Tyr

195 200 205

Gly Trp His Val Ile Arg Asp Ile Asp Gly His Asp Ala Ala Ser Ile

210 215 220

Lys Arg Ala Val Glu Glu Ala Arg Ala Val Thr Asp Lys Pro Ser Leu

225 230 235 240

Leu Met Cys Lys Thr Ile Ile Gly Phe Gly Ser Pro Asn Lys Ala Gly

245 250 255

Thr His Asp Ser His Gly Ala Pro Leu Gly Asp Ala Glu Ile Ala Leu

260 265 270

Thr Arg Glu Gln Leu Gly Trp Lys Tyr Ala Pro Phe Glu Ile Pro Ser

275 280 285

Glu Ile Tyr Ala Gln Trp Asp Ala Lys Glu Ala Gly Gln Ala Lys Glu

290 295 300

Ser Ala Trp Asn Glu Lys Phe Ala Ala Tyr Ala Lys Ala Tyr Pro Gln

305 310 315 320

Glu Ala Ala Glu Phe Thr Arg Arg Met Lys Gly Glu Met Pro Ser Asp

325 330 335

Phe Asp Ala Lys Ala Lys Glu Phe Ile Ala Lys Leu Gln Ala Asn Pro

340 345 350

Ala Lys Ile Ala Ser Arg Lys Ala Ser Gln Asn Ala Ile Glu Ala Phe

355 360 365

Gly Pro Leu Leu Pro Glu Phe Leu Gly Gly Ser Ala Asp Leu Ala Pro

370 375 380

Ser Asn Leu Thr Leu Trp Ser Gly Ser Lys Ala Ile Asn Glu Asp Ala

385 390 395 400

Ala Gly Asn Tyr Ile His Tyr Gly Val Arg Glu Phe Gly Met Thr Ala

405 410 415

Ile Ala Asn Gly Ile Ser Leu His Gly Gly Phe Leu Pro Tyr Thr Ser

420 425 430

Thr Phe Leu Met Phe Val Glu Tyr Ala Arg Asn Ala Val Arg Met Ala

435 440 445

Ala Leu Met Lys Gln Arg Gln Val Met Val Tyr Thr His Asp Ser Ile

450 455 460

Gly Leu Gly Glu Asp Gly Pro Thr His Gln Pro Val Glu Gln Val Ala

465 470 475 480

Ser Leu Arg Val Thr Pro Asn Met Ser Thr Trp Arg Pro Cys Asp Gln

485 490 495

Val Glu Ser Ala Val Ala Trp Lys Tyr Gly Val Glu Arg Gln Asp Gly

500 505 510

Pro Thr Ala Leu Ile Leu Ser Arg Gln Asn Leu Ala Gln Gln Glu Arg

515 520 525

Thr Glu Glu Gln Leu Ala Asn Ile Ala Arg Gly Gly Tyr Val Leu Lys

530 535 540

Asp Cys Ala Gly Gln Pro Glu Leu Ile Phe Ile Ala Thr Gly Ser Glu

545 550 555 560

Val Glu Leu Ala Val Ala Ala Tyr Glu Lys Leu Thr Ala Glu Gly Val

565 570 575

Lys Ala Arg Val Val Ser Met Pro Ser Thr Asp Ala Phe Asp Lys Gln

580 585 590

Asp Ala Ala Tyr Arg Glu Ser Val Leu Pro Lys Ala Val Thr Ala Arg

595 600 605

Val Ala Val Glu Ala Gly Ile Ala Asp Tyr Trp Tyr Lys Tyr Val Gly

610 615 620

Leu Asn Gly Ala Ile Val Gly Met Thr Thr Phe Gly Glu Ser Ala Pro

625 630 635 640

Ala Glu Leu Leu Phe Glu Glu Phe Gly Phe Thr Val Asp Asn Val Val

645 650 655

Ala Lys Ala Lys Glu Leu Leu

660

<210> 149

<211> 2004

<212> DNA

<213> 大肠杆菌

<400> 149

atgtcccgaa aagaccttgc caatgcgatt cgcgcactca gtatggatgc ggtacaaaaa 60

gccaactctg gtcatcccgg cgcgccgatg ggcatggctg atattgccga agtgctgtgg 120

aacgattttc ttaaacataa ccctaccgac ccaacctggt atgatcgcga ccgctttatt 180

ctttccaacg gtcacgcgtc gatgctgctc tacagtttgc tacatctgac cggttacgac 240

ctgccgctgg aagaactgaa gaacttccgt cagttgcatt cgaaaacccc aggccacccg 300

gagattggct atacgccagg cgttgaaacc accaccggcc cgcttggaca aggtttggcg 360

aacgccgtcg ggctggcgat agcagagcgt acactggcgg cgcagtttaa ccagccagac 420

catgagatcg tcgatcactt cacctatgtg tttatgggcg acggctgcct gatggaaggt 480

atttcccacg aagtctgttc gctggcaggc acgctgggac tgggcaagct gattggtttt 540

tacgatcaca acggtatttc catcgacggt gaaacagaag gctggtttac cgacgatacg 600

gcaaaacgtt ttgaagccta tcactggcat gtgatccatg aaatcgacgg tcacgatccg 660

caggcggtga aggaagcgat ccttgaagcg caaagcgtga aagataagcc gtcgctgatt 720

atctgccgta cggtgattgg ctttggttcg ccgaataaag caggtaagga agaggcgcac 780

ggcgcaccac tgggggaaga agaagtggcg ctggcacggc aaaaactggg ctggcaccat 840

ccgccatttg agatccctaa agagatttat cacgcctggg atgcccgtga aaaaggcgaa 900

aaagcgcagc agagctggaa tgagaagttt gccgcctata aaaaggctca tccgcaactg 960

gcagaagagt ttacccgacg gatgagcggt ggtttaccga aggactggga gaaaacgact 1020

cagaaatata tcaatgagtt acaggcaaat ccggcgaaaa tcgctacccg taaggcttcg 1080

caaaatacgc ttaacgctta cgggccgatg ctgcctgagt tgctcggcgg ttcggcggat 1140

ctggctccca gcaacctgac catctggaaa ggttctgttt cgctgaagga agatccagcg 1200

ggcaactaca ttcactacgg ggtgcgtgaa tttggcatga ccgctatcgc caacggcatc 1260

gcgcaccacg gcggctttgt gccgtatacc gcgacgttcc tgatgtttgt tgaatacgcc 1320

cgtaacgccg cgcggatggc ggcactgatg aaagcgcggc agattatggt ttatacccac 1380

gactcaattg gcctgggcga agatggtccg acgcaccagg ctgttgagca actggccagc 1440

ctgcgcttaa cgccaaattt cagcacctgg cgaccgtgcg atcaggtgga agcggcggtg 1500

ggctggaagc tggcggttga gcgccacaac ggaccgacgg cactgatcct ctcaaggcag 1560

aatctggccc aggtggaacg tacgccggat caggttaaag agattgctcg tggcggttat 1620

gtgctgaaag acagcggcgg taagccagat attattctga ttgccaccgg ttcagagatg 1680

gaaattaccc tgcaagcggc agagaaatta gcaggagaag gtcgcaatgt acgcgtagtt 1740

tccctgccct cgaccgatat tttcgacgcc caggatgagg aatatcggga gtcggtgttg 1800

ccttctaacg ttgcggctcg cgtggcggtg gaagcaggta ttgccgatta ctggtacaag 1860

tatgttggtc tgaaaggggc aattgtcggg atgacgggtt acggggaatc tgctccggcg 1920

gataagctgt tcccgttctt tggctttacc gccgagaata ttgtggcaaa agcgcataag 1980

gtgctgggag tgaaaggtgc ctga 2004

<210> 150

<211> 667

<212> PRT

<213> 大肠杆菌

<400> 150

Met Ser Arg Lys Asp Leu Ala Asn Ala Ile Arg Ala Leu Ser Met Asp

1 5 10 15

Ala Val Gln Lys Ala Asn Ser Gly His Pro Gly Ala Pro Met Gly Met

20 25 30

Ala Asp Ile Ala Glu Val Leu Trp Asn Asp Phe Leu Lys His Asn Pro

35 40 45

Thr Asp Pro Thr Trp Tyr Asp Arg Asp Arg Phe Ile Leu Ser Asn Gly

50 55 60

His Ala Ser Met Leu Leu Tyr Ser Leu Leu His Leu Thr Gly Tyr Asp

65 70 75 80

Leu Pro Leu Glu Glu Leu Lys Asn Phe Arg Gln Leu His Ser Lys Thr

85 90 95

Pro Gly His Pro Glu Ile Gly Tyr Thr Pro Gly Val Glu Thr Thr Thr

100 105 110

Gly Pro Leu Gly Gln Gly Leu Ala Asn Ala Val Gly Leu Ala Ile Ala

115 120 125

Glu Arg Thr Leu Ala Ala Gln Phe Asn Gln Pro Asp His Glu Ile Val

130 135 140

Asp His Phe Thr Tyr Val Phe Met Gly Asp Gly Cys Leu Met Glu Gly

145 150 155 160

Ile Ser His Glu Val Cys Ser Leu Ala Gly Thr Leu Gly Leu Gly Lys

165 170 175

Leu Ile Gly Phe Tyr Asp His Asn Gly Ile Ser Ile Asp Gly Glu Thr

180 185 190

Glu Gly Trp Phe Thr Asp Asp Thr Ala Lys Arg Phe Glu Ala Tyr His

195 200 205

Trp His Val Ile His Glu Ile Asp Gly His Asp Pro Gln Ala Val Lys

210 215 220

Glu Ala Ile Leu Glu Ala Gln Ser Val Lys Asp Lys Pro Ser Leu Ile

225 230 235 240

Ile Cys Arg Thr Val Ile Gly Phe Gly Ser Pro Asn Lys Ala Gly Lys

245 250 255

Glu Glu Ala His Gly Ala Pro Leu Gly Glu Glu Glu Val Ala Leu Ala

260 265 270

Arg Gln Lys Leu Gly Trp His His Pro Pro Phe Glu Ile Pro Lys Glu

275 280 285

Ile Tyr His Ala Trp Asp Ala Arg Glu Lys Gly Glu Lys Ala Gln Gln

290 295 300

Ser Trp Asn Glu Lys Phe Ala Ala Tyr Lys Lys Ala His Pro Gln Leu

305 310 315 320

Ala Glu Glu Phe Thr Arg Arg Met Ser Gly Gly Leu Pro Lys Asp Trp

325 330 335

Glu Lys Thr Thr Gln Lys Tyr Ile Asn Glu Leu Gln Ala Asn Pro Ala

340 345 350

Lys Ile Ala Thr Arg Lys Ala Ser Gln Asn Thr Leu Asn Ala Tyr Gly

355 360 365

Pro Met Leu Pro Glu Leu Leu Gly Gly Ser Ala Asp Leu Ala Pro Ser

370 375 380

Asn Leu Thr Ile Trp Lys Gly Ser Val Ser Leu Lys Glu Asp Pro Ala

385 390 395 400

Gly Asn Tyr Ile His Tyr Gly Val Arg Glu Phe Gly Met Thr Ala Ile

405 410 415

Ala Asn Gly Ile Ala His His Gly Gly Phe Val Pro Tyr Thr Ala Thr

420 425 430

Phe Leu Met Phe Val Glu Tyr Ala Arg Asn Ala Ala Arg Met Ala Ala

435 440 445

Leu Met Lys Ala Arg Gln Ile Met Val Tyr Thr His Asp Ser Ile Gly

450 455 460

Leu Gly Glu Asp Gly Pro Thr His Gln Ala Val Glu Gln Leu Ala Ser

465 470 475 480

Leu Arg Leu Thr Pro Asn Phe Ser Thr Trp Arg Pro Cys Asp Gln Val

485 490 495

Glu Ala Ala Val Gly Trp Lys Leu Ala Val Glu Arg His Asn Gly Pro

500 505 510

Thr Ala Leu Ile Leu Ser Arg Gln Asn Leu Ala Gln Val Glu Arg Thr

515 520 525

Pro Asp Gln Val Lys Glu Ile Ala Arg Gly Gly Tyr Val Leu Lys Asp

530 535 540

Ser Gly Gly Lys Pro Asp Ile Ile Leu Ile Ala Thr Gly Ser Glu Met

545 550 555 560

Glu Ile Thr Leu Gln Ala Ala Glu Lys Leu Ala Gly Glu Gly Arg Asn

565 570 575

Val Arg Val Val Ser Leu Pro Ser Thr Asp Ile Phe Asp Ala Gln Asp

580 585 590

Glu Glu Tyr Arg Glu Ser Val Leu Pro Ser Asn Val Ala Ala Arg Val

595 600 605

Ala Val Glu Ala Gly Ile Ala Asp Tyr Trp Tyr Lys Tyr Val Gly Leu

610 615 620

Lys Gly Ala Ile Val Gly Met Thr Gly Tyr Gly Glu Ser Ala Pro Ala

625 630 635 640

Asp Lys Leu Phe Pro Phe Phe Gly Phe Thr Ala Glu Asn Ile Val Ala

645 650 655

Lys Ala His Lys Val Leu Gly Val Lys Gly Ala

660 665

<210> 151

<211> 951

<212> DNA

<213> 大肠杆菌

<400> 151

atgaacgagt tagacggcat caaacagttc accactgtcg tggcagacag cggcgatatt 60

gagtccattc gccattatca tccccaggat gccaccacca atccttcgct gttactcaaa 120

gctgccggat tatcacaata tgagcattta atagacgatg ctatcgcctg gggtaaaaaa 180

aatggcaaga cccaggaaca acaggtggtc gcagcgtgtg acaaactggc ggtcaatttc 240

ggtgctgaaa tcctcaaaat cgtacccggt cgcgtgtcaa cagaagttga tgcacgcctc 300

tcttttgata aagaaaagag tattgagaag gcgcgccatc tggtggactt gtatcagcaa 360

caaggcgttg agaaatcacg cattctgatc aagctggctt cgacctggga aggaattcgc 420

gcggcagaag agctggaaaa agaaggtatt aactgcaacc tgacgctgct gttttctttt 480

gcacaggcac gggcctgtgc ggaagcaggc gtttttctga tttcgccgtt tgtcgggcgt 540

atttatgact ggtatcaggc acgcaagccg atggacccgt atgtggtgga agaagatccg 600

ggcgttaaat cggtgcgcaa tatctacgac tactataagc aacaccacta tgaaaccatt 660

gtgatgggcg cgagcttccg tcgcaccgaa caaatcctcg ccttaaccgg ctgcgatcga 720

ctgactatcg caccgaattt actgaaggag ctgcaggaaa aagtttcgcc agtggtacgt 780

aaattaatcc caccttctca gacgttccca cgcccagctc ccatgagcga agcggagttc 840

cgttgggagc acaatcagga tgcgatggcg gtagaaaaac tgtctgaagg cattcgtctg 900

ttcgccgttg atcaacgcaa actggaagat cttcttgccg ccaaactata a 951

<210> 152

<211> 316

<212> PRT

<213> 大肠杆菌

<400> 152

Met Asn Glu Leu Asp Gly Ile Lys Gln Phe Thr Thr Val Val Ala Asp

1 5 10 15

Ser Gly Asp Ile Glu Ser Ile Arg His Tyr His Pro Gln Asp Ala Thr

20 25 30

Thr Asn Pro Ser Leu Leu Leu Lys Ala Ala Gly Leu Ser Gln Tyr Glu

35 40 45

His Leu Ile Asp Asp Ala Ile Ala Trp Gly Lys Lys Asn Gly Lys Thr

50 55 60

Gln Glu Gln Gln Val Val Ala Ala Cys Asp Lys Leu Ala Val Asn Phe

65 70 75 80

Gly Ala Glu Ile Leu Lys Ile Val Pro Gly Arg Val Ser Thr Glu Val

85 90 95

Asp Ala Arg Leu Ser Phe Asp Lys Glu Lys Ser Ile Glu Lys Ala Arg

100 105 110

His Leu Val Asp Leu Tyr Gln Gln Gln Gly Val Glu Lys Ser Arg Ile

115 120 125

Leu Ile Lys Leu Ala Ser Thr Trp Glu Gly Ile Arg Ala Ala Glu Glu

130 135 140

Leu Glu Lys Glu Gly Ile Asn Cys Asn Leu Thr Leu Leu Phe Ser Phe

145 150 155 160

Ala Gln Ala Arg Ala Cys Ala Glu Ala Gly Val Phe Leu Ile Ser Pro

165 170 175

Phe Val Gly Arg Ile Tyr Asp Trp Tyr Gln Ala Arg Lys Pro Met Asp

180 185 190

Pro Tyr Val Val Glu Glu Asp Pro Gly Val Lys Ser Val Arg Asn Ile

195 200 205

Tyr Asp Tyr Tyr Lys Gln His His Tyr Glu Thr Ile Val Met Gly Ala

210 215 220

Ser Phe Arg Arg Thr Glu Gln Ile Leu Ala Leu Thr Gly Cys Asp Arg

225 230 235 240

Leu Thr Ile Ala Pro Asn Leu Leu Lys Glu Leu Gln Glu Lys Val Ser

245 250 255

Pro Val Val Arg Lys Leu Ile Pro Pro Ser Gln Thr Phe Pro Arg Pro

260 265 270

Ala Pro Met Ser Glu Ala Glu Phe Arg Trp Glu His Asn Gln Asp Ala

275 280 285

Met Ala Val Glu Lys Leu Ser Glu Gly Ile Arg Leu Phe Ala Val Asp

290 295 300

Gln Arg Lys Leu Glu Asp Leu Leu Ala Ala Lys Leu

305 310 315

<210> 153

<211> 954

<212> DNA

<213> 大肠杆菌

<400> 153

atgacggaca aattgacctc ccttcgtcag tacaccaccg tagtggccga cactggggac 60

atcgcggcaa tgaagctgta tcaaccgcag gatgccacaa ccaacccttc tctcattctt 120

aacgcagcgc agattccgga ataccgtaag ttgattgatg atgctgtcgc ctgggcgaaa 180

cagcagagca acgatcgcgc gcagcagatc gtggacgcga ccgacaaact ggcagtaaat 240

attggtctgg aaatcctgaa actggttccg ggccgtatct caactgaagt tgatgcgcgt 300

ctttcctatg acaccgaagc gtcaattgcg aaagcaaaac gcctgatcaa actctacaac 360

gatgctggta ttagcaacga tcgtattctg atcaaactgg cttctacctg gcagggtatc 420

cgtgctgcag aacagctgga aaaagaaggc atcaactgta acctgaccct gctgttctcc 480

ttcgctcagg ctcgtgcttg tgcggaagcg ggcgtgttcc tgatctcgcc gtttgttggc 540

cgtattcttg actggtacaa agcgaatacc gataagaaag agtacgctcc ggcagaagat 600

ccgggcgtgg tttctgtatc tgaaatctac cagtactaca aagagcacgg ttatgaaacc 660

gtggttatgg gcgcaagctt ccgtaacatc ggcgaaattc tggaactggc aggctgcgac 720

cgtctgacca tcgcaccggc actgctgaaa gagctggcgg agagcgaagg ggctatcgaa 780

cgtaaactgt cttacaccgg cgaagtgaaa gcgcgtccgg cgcgtatcac tgagtccgag 840

ttcctgtggc agcacaacca ggatccaatg gcagtagata aactggcgga aggtatccgt 900

aagtttgcta ttgaccagga aaaactggaa aaaatgatcg gcgatctgct gtaa 954

<210> 154

<211> 317

<212> PRT

<213> 大肠杆菌

<400> 154

Met Thr Asp Lys Leu Thr Ser Leu Arg Gln Tyr Thr Thr Val Val Ala

1 5 10 15

Asp Thr Gly Asp Ile Ala Ala Met Lys Leu Tyr Gln Pro Gln Asp Ala

20 25 30

Thr Thr Asn Pro Ser Leu Ile Leu Asn Ala Ala Gln Ile Pro Glu Tyr

35 40 45

Arg Lys Leu Ile Asp Asp Ala Val Ala Trp Ala Lys Gln Gln Ser Asn

50 55 60

Asp Arg Ala Gln Gln Ile Val Asp Ala Thr Asp Lys Leu Ala Val Asn

65 70 75 80

Ile Gly Leu Glu Ile Leu Lys Leu Val Pro Gly Arg Ile Ser Thr Glu

85 90 95

Val Asp Ala Arg Leu Ser Tyr Asp Thr Glu Ala Ser Ile Ala Lys Ala

100 105 110

Lys Arg Leu Ile Lys Leu Tyr Asn Asp Ala Gly Ile Ser Asn Asp Arg

115 120 125

Ile Leu Ile Lys Leu Ala Ser Thr Trp Gln Gly Ile Arg Ala Ala Glu

130 135 140

Gln Leu Glu Lys Glu Gly Ile Asn Cys Asn Leu Thr Leu Leu Phe Ser

145 150 155 160

Phe Ala Gln Ala Arg Ala Cys Ala Glu Ala Gly Val Phe Leu Ile Ser

165 170 175

Pro Phe Val Gly Arg Ile Leu Asp Trp Tyr Lys Ala Asn Thr Asp Lys

180 185 190

Lys Glu Tyr Ala Pro Ala Glu Asp Pro Gly Val Val Ser Val Ser Glu

195 200 205

Ile Tyr Gln Tyr Tyr Lys Glu His Gly Tyr Glu Thr Val Val Met Gly

210 215 220

Ala Ser Phe Arg Asn Ile Gly Glu Ile Leu Glu Leu Ala Gly Cys Asp

225 230 235 240

Arg Leu Thr Ile Ala Pro Ala Leu Leu Lys Glu Leu Ala Glu Ser Glu

245 250 255

Gly Ala Ile Glu Arg Lys Leu Ser Tyr Thr Gly Glu Val Lys Ala Arg

260 265 270

Pro Ala Arg Ile Thr Glu Ser Glu Phe Leu Trp Gln His Asn Gln Asp

275 280 285

Pro Met Ala Val Asp Lys Leu Ala Glu Gly Ile Arg Lys Phe Ala Ile

290 295 300

Asp Gln Glu Lys Leu Glu Lys Met Ile Gly Asp Leu Leu

305 310 315

<210> 155

<211> 954

<212> DNA

<213> 大肠杆菌

<400> 155

atgacggaca aattgacctc ccttcgtcag tacaccaccg tagtggccga cactggggac 60

atcgcggcaa tgaagctgta tcaaccgcag gatgccacaa ccaacccttc tctcattctt 120

aacgcagcgc agattccgga ataccgtaag ttgattgatg atgctgtcgc ctgggcgaaa 180

cagcagagca acgatcgcgc gcagcagatc gtggacgcga ccgacaaact ggcagtaaat 240

attggtctgg aaatcctgaa actggttccg ggccgtatct caactgaagt tgatgcgcgt 300

ctttcctatg acaccgaagc gtcaattgcg aaagcaaaac gcctgatcaa actctacaac 360

gatgctggta ttagcaacga tcgtattctg atcaaactgg cttctacctg gcagggtatc 420

cgtgctgcag aacagctgga aaaagaaggc atcaactgta acctgaccct gctgttctcc 480

ttcgctcagg ctcgtgcttg tgcggaagcg ggcgtgttcc tgatctcgcc gtttgttggc 540

cgtattcttg actggtacaa agcgaatacc gataagaaag agtacgctcc ggcagaagat 600

ccgggcgtgg tttctgtatc tgaaatctac cagtactaca aagagcacgg ttatgaaacc 660

gtggttatgg gcgcaagctt ccgtaacatc ggcgaaattc tggaactggc aggctgcgac 720

cgtctgacca tcgcaccggc actgctgaaa gagctggcgg agagcgaagg ggctatcgaa 780

cgtaaactgt cttacaccgg cgaagtgaaa gcgcgtccgg cgcgtatcac tgagtccgag 840

ttcctgtggc agcacaacca ggatccaatg gcagtagata aactggcgga aggtatccgt 900

aagtttgcta ttgaccagga aaaactggaa aaaatgatcg gcgatctgct gtaa 954

<210> 156

<211> 317

<212> PRT

<213> 大肠杆菌

<400> 156

Met Thr Asp Lys Leu Thr Ser Leu Arg Gln Tyr Thr Thr Val Val Ala

1 5 10 15

Asp Thr Gly Asp Ile Ala Ala Met Lys Leu Tyr Gln Pro Gln Asp Ala

20 25 30

Thr Thr Asn Pro Ser Leu Ile Leu Asn Ala Ala Gln Ile Pro Glu Tyr

35 40 45

Arg Lys Leu Ile Asp Asp Ala Val Ala Trp Ala Lys Gln Gln Ser Asn

50 55 60

Asp Arg Ala Gln Gln Ile Val Asp Ala Thr Asp Lys Leu Ala Val Asn

65 70 75 80

Ile Gly Leu Glu Ile Leu Lys Leu Val Pro Gly Arg Ile Ser Thr Glu

85 90 95

Val Asp Ala Arg Leu Ser Tyr Asp Thr Glu Ala Ser Ile Ala Lys Ala

100 105 110

Lys Arg Leu Ile Lys Leu Tyr Asn Asp Ala Gly Ile Ser Asn Asp Arg

115 120 125

Ile Leu Ile Lys Leu Ala Ser Thr Trp Gln Gly Ile Arg Ala Ala Glu

130 135 140

Gln Leu Glu Lys Glu Gly Ile Asn Cys Asn Leu Thr Leu Leu Phe Ser

145 150 155 160

Phe Ala Gln Ala Arg Ala Cys Ala Glu Ala Gly Val Phe Leu Ile Ser

165 170 175

Pro Phe Val Gly Arg Ile Leu Asp Trp Tyr Lys Ala Asn Thr Asp Lys

180 185 190

Lys Glu Tyr Ala Pro Ala Glu Asp Pro Gly Val Val Ser Val Ser Glu

195 200 205

Ile Tyr Gln Tyr Tyr Lys Glu His Gly Tyr Glu Thr Val Val Met Gly

210 215 220

Ala Ser Phe Arg Asn Ile Gly Glu Ile Leu Glu Leu Ala Gly Cys Asp

225 230 235 240

Arg Leu Thr Ile Ala Pro Ala Leu Leu Lys Glu Leu Ala Glu Ser Glu

245 250 255

Gly Ala Ile Glu Arg Lys Leu Ser Tyr Thr Gly Glu Val Lys Ala Arg

260 265 270

Pro Ala Arg Ile Thr Glu Ser Glu Phe Leu Trp Gln His Asn Gln Asp

275 280 285

Pro Met Ala Val Asp Lys Leu Ala Glu Gly Ile Arg Lys Phe Ala Ile

290 295 300

Asp Gln Glu Lys Leu Glu Lys Met Ile Gly Asp Leu Leu

305 310 315

<210> 157

<211> 678

<212> DNA

<213> 大肠杆菌

<400> 157

atgaaacagt atttgattgc cccctcaatt ctgtcggctg attttgcccg cctgggtgaa 60

gataccgcaa aagccctggc agctggcgct gatgtcgtgc attttgacgt catggataac 120

cactatgttc ccaatctgac gattgggcca atggtgctga aatccttgcg taactatggc 180

attaccgccc ctatcgacgt acacctgatg gtgaaacccg tcgatcgcat tgtgcctgat 240

ttcgctgccg ctggtgccag catcattacc tttcatccag aagcctccga gcatgttgac 300

cgcacgctgc aactgattaa agaaaatggc tgtaaagcgg gtctggtatt taacccggcg 360

acacctctga gctatctgga ttacgtgatg gataagctgg atgtgatcct gctgatgtcc 420

gtcaaccctg gtttcggcgg tcagtctttc attcctcaaa cactggataa actgcgcgaa 480

gtacgtcgcc gtatcgacga gtctggcttt gacattcgac tagaagtgga cggtggcgtg 540

aaggtgaaca acattggcga aatcgctgcg gcgggcgcgg atatgttcgt cgccggttcg 600

gcaatcttcg accagccaga ctacaaaaaa gtcattgatg aaatgcgcag tgaactggca 660

aaggtaagtc atgaataa 678

<210> 158

<211> 225

<212> PRT

<213> 大肠杆菌

<400> 158

Met Lys Gln Tyr Leu Ile Ala Pro Ser Ile Leu Ser Ala Asp Phe Ala

1 5 10 15

Arg Leu Gly Glu Asp Thr Ala Lys Ala Leu Ala Ala Gly Ala Asp Val

20 25 30

Val His Phe Asp Val Met Asp Asn His Tyr Val Pro Asn Leu Thr Ile

35 40 45

Gly Pro Met Val Leu Lys Ser Leu Arg Asn Tyr Gly Ile Thr Ala Pro

50 55 60

Ile Asp Val His Leu Met Val Lys Pro Val Asp Arg Ile Val Pro Asp

65 70 75 80

Phe Ala Ala Ala Gly Ala Ser Ile Ile Thr Phe His Pro Glu Ala Ser

85 90 95

Glu His Val Asp Arg Thr Leu Gln Leu Ile Lys Glu Asn Gly Cys Lys

100 105 110

Ala Gly Leu Val Phe Asn Pro Ala Thr Pro Leu Ser Tyr Leu Asp Tyr

115 120 125

Val Met Asp Lys Leu Asp Val Ile Leu Leu Met Ser Val Asn Pro Gly

130 135 140

Phe Gly Gly Gln Ser Phe Ile Pro Gln Thr Leu Asp Lys Leu Arg Glu

145 150 155 160

Val Arg Arg Arg Ile Asp Glu Ser Gly Phe Asp Ile Arg Leu Glu Val

165 170 175

Asp Gly Gly Val Lys Val Asn Asn Ile Gly Glu Ile Ala Ala Ala Gly

180 185 190

Ala Asp Met Phe Val Ala Gly Ser Ala Ile Phe Asp Gln Pro Asp Tyr

195 200 205

Lys Lys Val Ile Asp Glu Met Arg Ser Glu Leu Ala Lys Val Ser His

210 215 220

Glu

225

<210> 159

<211> 1416

<212> DNA

<213> 大肠杆菌

<400> 159

gtgaaacaaa gcactattgc actggcactc ttaccgttac tgtttacccc tgtgacaaaa 60

gcccggacac cagaaatgcc tgttctggaa aaccgggctg ctcagggcga tattactgca 120

cccggcggtg ctcgccgttt aacgggtgat cagactgccg ctctgcgtga ttctcttagc 180

gataaacctg caaaaaatat tattttgctg attggcgatg ggatggggga ctcggaaatt 240

actgccgcac gtaattatgc cgaaggtgcg ggcggctttt ttaaaggtat agatgcctta 300

ccgcttaccg ggcaatacac tcactatgcg ctgaataaaa aaaccggcaa accggactac 360

gtcaccgact cggctgcatc agcaaccgcc tggtcaaccg gtgtcaaaac ctataacggc 420

gcgctgggcg tcgatattca cgaaaaagat cacccaacga ttctggaaat ggcaaaagcc 480

gcaggtctgg cgaccggtaa cgtttctacc gcagagttgc aggatgccac gcccgctgcg 540

ctggtggcac atgtgacctc gcgcaaatgc tacggtccga gcgcgaccag tgaaaaatgt 600

ccgggtaacg ctctggaaaa aggcggaaaa ggatcgatta ccgaacagct gcttaacgct 660

cgtgccgacg ttacgcttgg cggcggcgca aaaacctttg ctgaaacggc aaccgctggt 720

gaatggcagg gaaaaacgct gcgtgaacag gcacaggcgc gtggttatca gttggtgagc 780

gatgctgcct cactgaattc ggtgacggaa gcgaatcagc aaaaacccct gcttggcctg 840

tttgctgacg gcaatatgcc agtgcgctgg ctaggaccga aagcaacgta ccatggcaat 900

atcgataagc ccgcagtcac ctgtacgcca aatccgcaac gtaatgacag tgtaccaacc 960

ctggcgcaga tgaccgacaa agccattgaa ttgttgagta aaaatgagaa aggctttttc 1020

ctgcaagttg aaggtgcgtc aatcgataaa caggatcatg ctgcgaatcc ttgtgggcaa 1080

attggcgaga cggtcgatct cgatgaagcc gtacaacggg cgctggaatt cgctaaaaag 1140

gagggtaaca cgctggtcat agtcaccgct gatcacgccc acgccagcca gattgttgcg 1200

ccggatacca aagctccggg cctcacccag gcgctaaata ccaaagatgg cgcagtgatg 1260

gtgatgagtt acgggaactc cgaagaggat tcacaagaac ataccggcag tcagttgcgt 1320

attgcggcgt atggcccgca tgccgccaat gttgttggac tgaccgacca gaccgatctc 1380

ttctacacca tgaaagccgc tctggggctg aaataa 1416

<210> 160

<211> 471

<212> PRT

<213> 大肠杆菌

<400> 160

Met Lys Gln Ser Thr Ile Ala Leu Ala Leu Leu Pro Leu Leu Phe Thr

1 5 10 15

Pro Val Thr Lys Ala Arg Thr Pro Glu Met Pro Val Leu Glu Asn Arg

20 25 30

Ala Ala Gln Gly Asp Ile Thr Ala Pro Gly Gly Ala Arg Arg Leu Thr

35 40 45

Gly Asp Gln Thr Ala Ala Leu Arg Asp Ser Leu Ser Asp Lys Pro Ala

50 55 60

Lys Asn Ile Ile Leu Leu Ile Gly Asp Gly Met Gly Asp Ser Glu Ile

65 70 75 80

Thr Ala Ala Arg Asn Tyr Ala Glu Gly Ala Gly Gly Phe Phe Lys Gly

85 90 95

Ile Asp Ala Leu Pro Leu Thr Gly Gln Tyr Thr His Tyr Ala Leu Asn

100 105 110

Lys Lys Thr Gly Lys Pro Asp Tyr Val Thr Asp Ser Ala Ala Ser Ala

115 120 125

Thr Ala Trp Ser Thr Gly Val Lys Thr Tyr Asn Gly Ala Leu Gly Val

130 135 140

Asp Ile His Glu Lys Asp His Pro Thr Ile Leu Glu Met Ala Lys Ala

145 150 155 160

Ala Gly Leu Ala Thr Gly Asn Val Ser Thr Ala Glu Leu Gln Asp Ala

165 170 175

Thr Pro Ala Ala Leu Val Ala His Val Thr Ser Arg Lys Cys Tyr Gly

180 185 190

Pro Ser Ala Thr Ser Glu Lys Cys Pro Gly Asn Ala Leu Glu Lys Gly

195 200 205

Gly Lys Gly Ser Ile Thr Glu Gln Leu Leu Asn Ala Arg Ala Asp Val

210 215 220

Thr Leu Gly Gly Gly Ala Lys Thr Phe Ala Glu Thr Ala Thr Ala Gly

225 230 235 240

Glu Trp Gln Gly Lys Thr Leu Arg Glu Gln Ala Gln Ala Arg Gly Tyr

245 250 255

Gln Leu Val Ser Asp Ala Ala Ser Leu Asn Ser Val Thr Glu Ala Asn

260 265 270

Gln Gln Lys Pro Leu Leu Gly Leu Phe Ala Asp Gly Asn Met Pro Val

275 280 285

Arg Trp Leu Gly Pro Lys Ala Thr Tyr His Gly Asn Ile Asp Lys Pro

290 295 300

Ala Val Thr Cys Thr Pro Asn Pro Gln Arg Asn Asp Ser Val Pro Thr

305 310 315 320

Leu Ala Gln Met Thr Asp Lys Ala Ile Glu Leu Leu Ser Lys Asn Glu

325 330 335

Lys Gly Phe Phe Leu Gln Val Glu Gly Ala Ser Ile Asp Lys Gln Asp

340 345 350

His Ala Ala Asn Pro Cys Gly Gln Ile Gly Glu Thr Val Asp Leu Asp

355 360 365

Glu Ala Val Gln Arg Ala Leu Glu Phe Ala Lys Lys Glu Gly Asn Thr

370 375 380

Leu Val Ile Val Thr Ala Asp His Ala His Ala Ser Gln Ile Val Ala

385 390 395 400

Pro Asp Thr Lys Ala Pro Gly Leu Thr Gln Ala Leu Asn Thr Lys Asp

405 410 415

Gly Ala Val Met Val Met Ser Tyr Gly Asn Ser Glu Glu Asp Ser Gln

420 425 430

Glu His Thr Gly Ser Gln Leu Arg Ile Ala Ala Tyr Gly Pro His Ala

435 440 445

Ala Asn Val Val Gly Leu Thr Asp Gln Thr Asp Leu Phe Tyr Thr Met

450 455 460

Lys Ala Ala Leu Gly Leu Lys

465 470

<210> 161

<211> 1858

<212> DNA

<213> 拟南芥（Arabidopsis thaliana）

<400> 161

cacgtggcga agaatagtcc ccgaatcttc ctctgacgac catttgatac ttttttttct 60

tcagtttgtt ggttttgtcc tcttaacaaa atattcttca aactctctct gttgtttgtt 120

tgttgacaaa tctctcaaaa ccatttgttt tgcaatcgca gatccgtttt tcttcgggtc 180

tcatcacaat gaatggcttc tctgatctta atccttctga gaggtacgct ttgtctgatc 240

atcaatgatg cttataataa tctcatttat acatgatctt gcctctatat atttgttcat 300

cttagtaatc ttcggtctca gcttccattt tcgtctccca ctatgtttct aggattttgt 360

gttacttttg ttagaaaact gcgatttttg tgctagtgtt tgtttctcca agatcaatgg 420

aactcgttgc ctaaaattcc tgattatagt tacataaaca tcaaatggtt ctaattggtc 480

tttgatctta aacccatttg attatggtat ctaaagtttg atccttttga tgcactctca 540

tcgcagtttc tcgtgatttt aatattattg aactcttttg atttgtggtg aagcaaacct 600

tctctgtcac aactagctcc attagaagcc attctgtttg atgttgatgg aacactctgt 660

gactcagatc ccatccacct tattgccttc caagaactgc ttcaagaggt tccttgcttt 720

ttttaatgtc attataactt ccaaatttac aacaagactt tagaaaactg tgaataatat 780

gctatggaac cttgctatta ctcagtttca agctctcgtg tcaatcaatt ttgtttcttt 840

ctatcattcg cagattggtt ttaacaatgg tgtcccaatc gatgagaaat tctttgttga 900

gaacattgct ggaaaacaca attctgaaat tgctctactt ctgttccctg atgatgtttc 960

aagagggtta aaattctgtg atgaaaagga agctctttac cgcaagtaag ctatttttct 1020

gtgtttcctc cattctttta atgtcacaaa ctcttttcag gtctgagttc atttggagta 1080

actttgtttt gttctttttt cttgatgatt agaattgttg cagagaagat aaagccactt 1140

gatgggctta taaaactgac caaatggatc gaagatcgtg gattgaaacg agctgcggta 1200

acaaacgctc caaaagaaaa cgcagagctc atgatatcga aacttggtct gactgatttc 1260

tttcaagcag tgattcttgg ctctgaatgt gaatttccca aaccacaccc tggaccttac 1320

ttgaaggctc ttgaagtgct taacgtgtca aaggagcaca cgctagtttt cgaagactcg 1380

atctctggga taaaagctgg agttgcagct ggaatgccag tgattggact gactacaggg 1440

aatccagcaa gcctgcttat gcaagcaaaa cccgcttttc tcatcgagaa ctatgcggat 1500

ccaaaactgt gggctgtgtt ggaagaactt gataacaagt cttaagtctc acttgtttgg 1560

cttatggaaa cccacacatg catgagcagc ctctgaagtt taccttatgt cttagatgat 1620

cattgttgaa taattcattg ggagtttatg acaatgggag ctttcaaata tctgattatt 1680

ttgtattgat acatgcacaa tgctagattt gtatccagga gatagttgca taaaccaata 1740

tactataccc tcggatctta gcttattttc attgatatct tgttgttttg tgctgtaaac 1800

atatcagctt ttgaatacat ttggtccatg gcgcaaaata agactttttt tttttttt 1858

<210> 162

<211> 244

<212> PRT

<213> 拟南芥

<400> 162

Met Asn Gly Phe Ser Asp Leu Asn Pro Ser Glu Ser Lys Pro Ser Leu

1 5 10 15

Ser Gln Leu Ala Pro Leu Glu Ala Ile Leu Phe Asp Val Asp Gly Thr

20 25 30

Leu Cys Asp Ser Asp Pro Ile His Leu Ile Ala Phe Gln Glu Leu Leu

35 40 45

Gln Glu Ile Gly Phe Asn Asn Gly Val Pro Ile Asp Glu Lys Phe Phe

50 55 60

Val Glu Asn Ile Ala Gly Lys His Asn Ser Glu Ile Ala Leu Leu Leu

65 70 75 80

Phe Pro Asp Asp Val Ser Arg Gly Leu Lys Phe Cys Asp Glu Lys Glu

85 90 95

Ala Leu Tyr Arg Lys Ile Val Ala Glu Lys Ile Lys Pro Leu Asp Gly

100 105 110

Leu Ile Lys Leu Thr Lys Trp Ile Glu Asp Arg Gly Leu Lys Arg Ala

115 120 125

Ala Val Thr Asn Ala Pro Lys Glu Asn Ala Glu Leu Met Ile Ser Lys

130 135 140

Leu Gly Leu Thr Asp Phe Phe Gln Ala Val Ile Leu Gly Ser Glu Cys

145 150 155 160

Glu Phe Pro Lys Pro His Pro Gly Pro Tyr Leu Lys Ala Leu Glu Val

165 170 175

Leu Asn Val Ser Lys Glu His Thr Leu Val Phe Glu Asp Ser Ile Ser

180 185 190

Gly Ile Lys Ala Gly Val Ala Ala Gly Met Pro Val Ile Gly Leu Thr

195 200 205

Thr Gly Asn Pro Ala Ser Leu Leu Met Gln Ala Lys Pro Ala Phe Leu

210 215 220

Ile Glu Asn Tyr Ala Asp Pro Lys Leu Trp Ala Val Leu Glu Glu Leu

225 230 235 240

Asp Asn Lys Ser

<210> 163

<211> 819

<212> DNA

<213> 枯草芽孢杆菌（Bacillus subtilis）

<400> 163

atgcgtatta tggccagtca tgatacgcct gtgtcaccgg ctggcattct gattgacttg 60

gacggtactg tattcagagg aaatgagttg atcgaaggag caagagaagc gatcaaaacg 120

cttaggagaa tgggaaagaa aatcgtcttt ttaagcaacc gggggaatat ctcccgtgcc 180

atgtgcagaa aaaaacttct tggcgcgggg attgaaacgg acgtaaacga cattgttctg 240

tcatcaagcg tgacagcggc ttttctgaaa aaacattatc gtttttcaaa ggtatgggtg 300

cttggggagc aaggcttggt tgacgagctg aggctggccg gtgtgcagaa cgcgagcgaa 360

ccgaaggaag cggattggct cgtgatctcc cttcatgaaa cgctcacgta cgacgattta 420

aatcaagcct ttcaagcggc tgccggcggc gctcgtatta tcgctacaaa caaagaccgc 480

tcttttccga acgaagacgg aaatgccatt gatgtggccg gaatgatcgg ggcaattgag 540

acttctgcac aagcgaagac tgaacttgtt gtcggaaaac cgtcatggct gatggcggag 600

gctgcctgta cagcaatggg gctgtccgca catgaatgca tgattatagg agacagcatt 660

gaatctgaca ttgcgatggg gaagctttat ggcatgaaaa gcgccttagt gctaactggt 720

tctgcgaaac agggtgaaca gcgtttgtac acgccggatt atgtgctgga ttctattaag 780

gatgtaacca aattggctga ggaggggatt ctgatatga 819

<210> 164

<211> 272

<212> PRT

<213> 枯草芽孢杆菌

<400> 164

Met Arg Ile Met Ala Ser His Asp Thr Pro Val Ser Pro Ala Gly Ile

1 5 10 15

Leu Ile Asp Leu Asp Gly Thr Val Phe Arg Gly Asn Glu Leu Ile Glu

20 25 30

Gly Ala Arg Glu Ala Ile Lys Thr Leu Arg Arg Met Gly Lys Lys Ile

35 40 45

Val Phe Leu Ser Asn Arg Gly Asn Ile Ser Arg Ala Met Cys Arg Lys

50 55 60

Lys Leu Leu Gly Ala Gly Ile Glu Thr Asp Val Asn Asp Ile Val Leu

65 70 75 80

Ser Ser Ser Val Thr Ala Ala Phe Leu Lys Lys His Tyr Arg Phe Ser

85 90 95

Lys Val Trp Val Leu Gly Glu Gln Gly Leu Val Asp Glu Leu Arg Leu

100 105 110

Ala Gly Val Gln Asn Ala Ser Glu Pro Lys Glu Ala Asp Trp Leu Val

115 120 125

Ile Ser Leu His Glu Thr Leu Thr Tyr Asp Asp Leu Asn Gln Ala Phe

130 135 140

Gln Ala Ala Ala Gly Gly Ala Arg Ile Ile Ala Thr Asn Lys Asp Arg

145 150 155 160

Ser Phe Pro Asn Glu Asp Gly Asn Ala Ile Asp Val Ala Gly Met Ile

165 170 175

Gly Ala Ile Glu Thr Ser Ala Gln Ala Lys Thr Glu Leu Val Val Gly

180 185 190

Lys Pro Ser Trp Leu Met Ala Glu Ala Ala Cys Thr Ala Met Gly Leu

195 200 205

Ser Ala His Glu Cys Met Ile Ile Gly Asp Ser Ile Glu Ser Asp Ile

210 215 220

Ala Met Gly Lys Leu Tyr Gly Met Lys Ser Ala Leu Val Leu Thr Gly

225 230 235 240

Ser Ala Lys Gln Gly Glu Gln Arg Leu Tyr Thr Pro Asp Tyr Val Leu

245 250 255

Asp Ser Ile Lys Asp Val Thr Lys Leu Ala Glu Glu Gly Ile Leu Ile

260 265 270

<210> 165

<211> 825

<212> DNA

<213> 荧光假单胞菌（Pseudomonas fluorescens）

<400> 165

atgagtgacg cagcgattca tcccatccgt tttatcctca gtgacgtgga cggcaccttg 60

ctgcatcccg atcatagcct cagccaacgc accgccgacg cggtgcgcgc cttgcgcgaa 120

gccggagtgt tgttcagcct ggccagcggg cgcccgccca aggccatgct gcacctgatc 180

gaaacctttg ggatcgatgt gccggtggcg ggcttcaatg gcggtacctt gatcaacccg 240

gatggcagca tcctggttgc ccatcatctg ccggcggaag cggcgctggt taccctggcg 300

ctgttttcag cggagccgga ggtggaagtg tgggtgtttg ccgatggcga ctggctgcgc 360

cgtgacccgt cagggccgat ggagccgcgc gaggcgaatg gcctgggcta tgggccggtg 420

gtggtggaga gtttcgagcc ctacctggac cgggtcgaca agatcgtcgc cgcgagtcac 480

aacacgcaat tattggtaga gctggaggcg cgattgcaac ccaaggtgca ggggctggcc 540

caggtgtcgc gttcgcaacc ggtgtacttg gacgtgaccg cgatgctggc caacaagggc 600

gaggccttga agaccttggc ggcacacctg ggtgtgccca tggagcaaac ggcggcgatt 660

ggcgatggtg gcaatgaccc ggcgatgttt caggtggccg ggttgtcgat tgccatgggg 720

caggcggaag aaaccgtcaa gcgccaggcc agtgtggtga cgggcagcaa catcgaagat 780

ggcgccgccg aagcaatcga acggtttatt ctcgcggcac cttaa 825

<210> 166

<211> 274

<212> PRT

<213> 荧光假单胞菌

<400> 166

Met Ser Asp Ala Ala Ile His Pro Ile Arg Phe Ile Leu Ser Asp Val

1 5 10 15

Asp Gly Thr Leu Leu His Pro Asp His Ser Leu Ser Gln Arg Thr Ala

20 25 30

Asp Ala Val Arg Ala Leu Arg Glu Ala Gly Val Leu Phe Ser Leu Ala

35 40 45

Ser Gly Arg Pro Pro Lys Ala Met Leu His Leu Ile Glu Thr Phe Gly

50 55 60

Ile Asp Val Pro Val Ala Gly Phe Asn Gly Gly Thr Leu Ile Asn Pro

65 70 75 80

Asp Gly Ser Ile Leu Val Ala His His Leu Pro Ala Glu Ala Ala Leu

85 90 95

Val Thr Leu Ala Leu Phe Ser Ala Glu Pro Glu Val Glu Val Trp Val

100 105 110

Phe Ala Asp Gly Asp Trp Leu Arg Arg Asp Pro Ser Gly Pro Met Glu

115 120 125

Pro Arg Glu Ala Asn Gly Leu Gly Tyr Gly Pro Val Val Val Glu Ser

130 135 140

Phe Glu Pro Tyr Leu Asp Arg Val Asp Lys Ile Val Ala Ala Ser His

145 150 155 160

Asn Thr Gln Leu Leu Val Glu Leu Glu Ala Arg Leu Gln Pro Lys Val

165 170 175

Gln Gly Leu Ala Gln Val Ser Arg Ser Gln Pro Val Tyr Leu Asp Val

180 185 190

Thr Ala Met Leu Ala Asn Lys Gly Glu Ala Leu Lys Thr Leu Ala Ala

195 200 205

His Leu Gly Val Pro Met Glu Gln Thr Ala Ala Ile Gly Asp Gly Gly

210 215 220

Asn Asp Pro Ala Met Phe Gln Val Ala Gly Leu Ser Ile Ala Met Gly

225 230 235 240

Gln Ala Glu Glu Thr Val Lys Arg Gln Ala Ser Val Val Thr Gly Ser

245 250 255

Asn Ile Glu Asp Gly Ala Ala Glu Ala Ile Glu Arg Phe Ile Leu Ala

260 265 270

Ala Pro

<210> 167

<211> 651

<212> DNA

<213> 大肠杆菌

<400> 167

gtgcggtgca aaggttttct gtttgatctt gatggaacgc tggtggattc cctgcctgcg 60

gtagaacggg cgtggagcaa ctgggccaga cgtcatgggt tagcgccgga agaggtgctg 120

gctttcattc acggtaaaca ggcgatcacc tctctgcgcc attttatggc gggcaaatcc 180

gaggctgata ttgccgccga gtttacgcgt ctggagcaca tcgaggccac ggaaaccgaa 240

ggtattaccg cgcttccggg ggcaatcgcc ttactcagtc atttgaataa agcaggtatt 300

ccgtgggcca ttgtgacttc tggctccatg ccggtagcgc gagcgcgcca taaaatagct 360

gggcttcccg caccagaggt gtttgtaacc gctgagcgag tgaagcgcgg aaaaccagaa 420

cctgatgcgt atctgttagg cgcgcagctg ctggggcttg cgccgcagga gtgtgtggtg 480

gtggaagatg ctcccgctgg cgtgctttct ggcctggcgg cgggttgtca tgtcattgcg 540

gttaacgctc cggcagatac cccgcgcctg aatgaggtcg atttggtcct ccacagtctg 600

gagcaaatta ctgtgaccaa acagccaaat ggcgatgtta ttattcagtg a 651

<210> 168

<211> 216

<212> PRT

<213> 大肠杆菌

<400> 168

Met Arg Cys Lys Gly Phe Leu Phe Asp Leu Asp Gly Thr Leu Val Asp

1 5 10 15

Ser Leu Pro Ala Val Glu Arg Ala Trp Ser Asn Trp Ala Arg Arg His

20 25 30

Gly Leu Ala Pro Glu Glu Val Leu Ala Phe Ile His Gly Lys Gln Ala

35 40 45

Ile Thr Ser Leu Arg His Phe Met Ala Gly Lys Ser Glu Ala Asp Ile

50 55 60

Ala Ala Glu Phe Thr Arg Leu Glu His Ile Glu Ala Thr Glu Thr Glu

65 70 75 80

Gly Ile Thr Ala Leu Pro Gly Ala Ile Ala Leu Leu Ser His Leu Asn

85 90 95

Lys Ala Gly Ile Pro Trp Ala Ile Val Thr Ser Gly Ser Met Pro Val

100 105 110

Ala Arg Ala Arg His Lys Ile Ala Gly Leu Pro Ala Pro Glu Val Phe

115 120 125

Val Thr Ala Glu Arg Val Lys Arg Gly Lys Pro Glu Pro Asp Ala Tyr

130 135 140

Leu Leu Gly Ala Gln Leu Leu Gly Leu Ala Pro Gln Glu Cys Val Val

145 150 155 160

Val Glu Asp Ala Pro Ala Gly Val Leu Ser Gly Leu Ala Ala Gly Cys

165 170 175

His Val Ile Ala Val Asn Ala Pro Ala Asp Thr Pro Arg Leu Asn Glu

180 185 190

Val Asp Leu Val Leu His Ser Leu Glu Gln Ile Thr Val Thr Lys Gln

195 200 205

Pro Asn Gly Asp Val Ile Ile Gln

210 215

<210> 169

<211> 816

<212> DNA

<213> 大肠杆菌

<400> 169

atgagcgtaa aagttatcgt cacagacatg gacggtactt ttcttaacga cgccaaaacg 60

tacaaccaac cacgttttat ggcgcaatat caggaactga aaaagcgcgg cattaagttc 120

gttgttgcca gcggtaatca gtattaccag cttatttcat tctttcctga gctaaaggat 180

gagatctctt ttgtcgcgga aaacggcgca ctggtttacg aacatggcaa gcagttgttc 240

cacggcgaac tgacccgaca tgaatcgcgg attgttattg gcgagttgct aaaagataag 300

caactcaatt ttgtcgcctg cggtctgcaa agtgcatatg tcagcgaaaa tgcccccgaa 360

gcatttgtcg cactgatggc aaaacactac catcgcctga aacctgtaaa agattatcag 420

gagattgacg acgtactgtt caagttttcg ctcaacctgc cggatgaaca aatcccgtta 480

gtgatcgaca aactgcacgt agcgctcgat ggcattatga aacccgttac cagtggtttt 540

ggctttatcg acctgattat tcccggtcta cataaagcaa acggtatttc gcggttactg 600

aaacgctggg atctgtcacc gcaaaatgtg gtagcgattg gcgacagcgg taacgatgcg 660

gagatgctga aaatggcgcg ttattccttt gcgatgggca atgctgcgga aaacattaaa 720

caaatcgccc gttacgctac cgatgataat aatcatgaag gcgcgctgaa tgtgattcag 780

gcggtgctgg ataacacatc cccttttaac agctga 816

<210> 170

<211> 271

<212> PRT

<213> 大肠杆菌

<400> 170

Met Ser Val Lys Val Ile Val Thr Asp Met Asp Gly Thr Phe Leu Asn

1 5 10 15

Asp Ala Lys Thr Tyr Asn Gln Pro Arg Phe Met Ala Gln Tyr Gln Glu

20 25 30

Leu Lys Lys Arg Gly Ile Lys Phe Val Val Ala Ser Gly Asn Gln Tyr

35 40 45

Tyr Gln Leu Ile Ser Phe Phe Pro Glu Leu Lys Asp Glu Ile Ser Phe

50 55 60

Val Ala Glu Asn Gly Ala Leu Val Tyr Glu His Gly Lys Gln Leu Phe

65 70 75 80

His Gly Glu Leu Thr Arg His Glu Ser Arg Ile Val Ile Gly Glu Leu

85 90 95

Leu Lys Asp Lys Gln Leu Asn Phe Val Ala Cys Gly Leu Gln Ser Ala

100 105 110

Tyr Val Ser Glu Asn Ala Pro Glu Ala Phe Val Ala Leu Met Ala Lys

115 120 125

His Tyr His Arg Leu Lys Pro Val Lys Asp Tyr Gln Glu Ile Asp Asp

130 135 140

Val Leu Phe Lys Phe Ser Leu Asn Leu Pro Asp Glu Gln Ile Pro Leu

145 150 155 160

Val Ile Asp Lys Leu His Val Ala Leu Asp Gly Ile Met Lys Pro Val

165 170 175

Thr Ser Gly Phe Gly Phe Ile Asp Leu Ile Ile Pro Gly Leu His Lys

180 185 190

Ala Asn Gly Ile Ser Arg Leu Leu Lys Arg Trp Asp Leu Ser Pro Gln

195 200 205

Asn Val Val Ala Ile Gly Asp Ser Gly Asn Asp Ala Glu Met Leu Lys

210 215 220

Met Ala Arg Tyr Ser Phe Ala Met Gly Asn Ala Ala Glu Asn Ile Lys

225 230 235 240

Gln Ile Ala Arg Tyr Ala Thr Asp Asp Asn Asn His Glu Gly Ala Leu

245 250 255

Asn Val Ile Gln Ala Val Leu Asp Asn Thr Ser Pro Phe Asn Ser

260 265 270

<210> 171

<211> 813

<212> DNA

<213> 大肠杆菌

<400> 171

atggctatta aactcattgc tatcgatatg gatggcaccc ttctgctgcc cgatcacacc 60

atttcacccg ccgttaaaaa tgcgattgcc gcagctcgcg cccgtggcgt gaatgtcgtg 120

ctaacgacgg gtcgcccgta tgcaggtgtg cacaactacc tgaaagagct gcatatggaa 180

cagccgggcg actactgcat tacttataac ggcgcgctgg tacagaaggc cgctgatggt 240

agcaccgtgg cgcaaactgc tctcagctat gacgactatc gtttcctgga aaaactctct 300

cgcgaagtcg gttctcattt ccacgccctg gaccgcacca cgctgtacac cgccaaccgt 360

gatatcagct actacacggt gcatgaatcc ttcgttgcca ccattccgct ggtgttctgc 420

gaagcggaga aaatggaccc caatacccag ttcctgaaag tgatgatgat tgatgaaccc 480

gccatcctcg accaggctat cgcgcgtatt ccgcaggaag tgaaagagaa atataccgtg 540

ctgaaaagtg cgccgtactt cctcgaaatc ctcgataaac gcgttaacaa aggtacgggg 600

gtgaaatcac tggccgacgt gttaggtatt aaaccggaag aaatcatggc gattggcgat 660

caggaaaacg atatcgcaat gattgaatat gcaggcgtcg gtgtggcgat ggataacgct 720

attccttcag tgaaagaagt ggcgaacttt gtcaccaaat ctaaccttga agatggcgtg 780

gcgtttgcta ttgagaagta tgtgctgaat taa 813

<210> 172

<211> 270

<212> PRT

<213> 大肠杆菌

<400> 172

Met Ala Ile Lys Leu Ile Ala Ile Asp Met Asp Gly Thr Leu Leu Leu

1 5 10 15

Pro Asp His Thr Ile Ser Pro Ala Val Lys Asn Ala Ile Ala Ala Ala

20 25 30

Arg Ala Arg Gly Val Asn Val Val Leu Thr Thr Gly Arg Pro Tyr Ala

35 40 45

Gly Val His Asn Tyr Leu Lys Glu Leu His Met Glu Gln Pro Gly Asp

50 55 60

Tyr Cys Ile Thr Tyr Asn Gly Ala Leu Val Gln Lys Ala Ala Asp Gly

65 70 75 80

Ser Thr Val Ala Gln Thr Ala Leu Ser Tyr Asp Asp Tyr Arg Phe Leu

85 90 95

Glu Lys Leu Ser Arg Glu Val Gly Ser His Phe His Ala Leu Asp Arg

100 105 110

Thr Thr Leu Tyr Thr Ala Asn Arg Asp Ile Ser Tyr Tyr Thr Val His

115 120 125

Glu Ser Phe Val Ala Thr Ile Pro Leu Val Phe Cys Glu Ala Glu Lys

130 135 140

Met Asp Pro Asn Thr Gln Phe Leu Lys Val Met Met Ile Asp Glu Pro

145 150 155 160

Ala Ile Leu Asp Gln Ala Ile Ala Arg Ile Pro Gln Glu Val Lys Glu

165 170 175

Lys Tyr Thr Val Leu Lys Ser Ala Pro Tyr Phe Leu Glu Ile Leu Asp

180 185 190

Lys Arg Val Asn Lys Gly Thr Gly Val Lys Ser Leu Ala Asp Val Leu

195 200 205

Gly Ile Lys Pro Glu Glu Ile Met Ala Ile Gly Asp Gln Glu Asn Asp

210 215 220

Ile Ala Met Ile Glu Tyr Ala Gly Val Gly Val Ala Met Asp Asn Ala

225 230 235 240

Ile Pro Ser Val Lys Glu Val Ala Asn Phe Val Thr Lys Ser Asn Leu

245 250 255

Glu Asp Gly Val Ala Phe Ala Ile Glu Lys Tyr Val Leu Asn

260 265 270

<210> 173

<211> 867

<212> DNA

<213> 恶性疟原虫（Plasmodium falciparum）

<400> 173

atgcacgaaa ttgtagataa gaatggtaag aaagttcaaa agaataattt gaatgatgaa 60

ataaaaataa tctttacgga tttagatgga acattgttaa atagtgagaa taaggtttca 120

gaacagaatt tggagagttt aataagagct caagaaaaag gcataaaggt tgttatagca 180

acaggtagat ctatattttc tgtagagaat gttataggag agcatgtaaa aaagaataga 240

ataagtttat taccagggat atatatgaat ggatgtgtaa catttgatga aaaaggttca 300

agggtgatag ataggattat gaacaatgac ttgaaaatgg agatacatga attttctaaa 360

caaataaata tatcaaaata tgctatatgg ttttgtttag aaaaaacata ttgttttgaa 420

ataaatgatt gtatacgtga atatatggag gttgaagcat taaatcctga tgttattgaa 480

gataatatgt tagaaggttt gacagtatat aaagtattat tttcattacc agaaaatata 540

ttagaaaata cgttaaaatt atgtagagag aaattttctc atcgtattaa tgtagctaat 600

acttttcaaa gttatgttga attatttcat caacatacta ataaattcga aggtgtaaaa 660

gaaatttgta aatattataa tataagtcta aacaatgcgc tagctatggg agatggagaa 720

aatgatattg aaatgttaag tggtttaaca cattcagtgg gtgtacataa tgcttcagaa 780

aaagtaaaaa attcagctgc ttatgttgga ccttcgaata atgaacatgc tatatctcat 840

gtcttgaaga cattctgtga catataa 867

<210> 174

<211> 288

<212> PRT

<213> 恶性疟原虫

<400> 174

Met His Glu Ile Val Asp Lys Asn Gly Lys Lys Val Gln Lys Asn Asn

1 5 10 15

Leu Asn Asp Glu Ile Lys Ile Ile Phe Thr Asp Leu Asp Gly Thr Leu

20 25 30

Leu Asn Ser Glu Asn Lys Val Ser Glu Gln Asn Leu Glu Ser Leu Ile

35 40 45

Arg Ala Gln Glu Lys Gly Ile Lys Val Val Ile Ala Thr Gly Arg Ser

50 55 60

Ile Phe Ser Val Glu Asn Val Ile Gly Glu His Val Lys Lys Asn Arg

65 70 75 80

Ile Ser Leu Leu Pro Gly Ile Tyr Met Asn Gly Cys Val Thr Phe Asp

85 90 95

Glu Lys Gly Ser Arg Val Ile Asp Arg Ile Met Asn Asn Asp Leu Lys

100 105 110

Met Glu Ile His Glu Phe Ser Lys Gln Ile Asn Ile Ser Lys Tyr Ala

115 120 125

Ile Trp Phe Cys Leu Glu Lys Thr Tyr Cys Phe Glu Ile Asn Asp Cys

130 135 140

Ile Arg Glu Tyr Met Glu Val Glu Ala Leu Asn Pro Asp Val Ile Glu

145 150 155 160

Asp Asn Met Leu Glu Gly Leu Thr Val Tyr Lys Val Leu Phe Ser Leu

165 170 175

Pro Glu Asn Ile Leu Glu Asn Thr Leu Lys Leu Cys Arg Glu Lys Phe

180 185 190

Ser His Arg Ile Asn Val Ala Asn Thr Phe Gln Ser Tyr Val Glu Leu

195 200 205

Phe His Gln His Thr Asn Lys Phe Glu Gly Val Lys Glu Ile Cys Lys

210 215 220

Tyr Tyr Asn Ile Ser Leu Asn Asn Ala Leu Ala Met Gly Asp Gly Glu

225 230 235 240

Asn Asp Ile Glu Met Leu Ser Gly Leu Thr His Ser Val Gly Val His

245 250 255

Asn Ala Ser Glu Lys Val Lys Asn Ser Ala Ala Tyr Val Gly Pro Ser

260 265 270

Asn Asn Glu His Ala Ile Ser His Val Leu Lys Thr Phe Cys Asp Ile

275 280 285

<210> 175

<211> 1059

<212> DNA

<213> 鸟肠球菌（Enterococcus avium）

<400> 175

atgagtaaaa caatgaaggg tgtttccaag caggcacccg gttatgacca aatggcattt 60

atcgatttat ctgttccaga agcaacagat gacaaggtct tgattaaagt cgcttataca 120

ggtatttgcg gatcagatat ccatacgttt aaaggtgaat acaaaaatcc cactactccc 180

gtcgtcctag gacatgaatt ttctgggcag gtagttgaag tcggagccaa tgtaccaaag 240

gtcaaggttg gtgatcgggt aaccagtgag acgacctttt atgtctgcgg cgaatgcgat 300

tattgcaagg aaaagcagta taatttgtgt ccccatcgaa aaggaatcgg cacgcagcaa 360

aatggctcca tggcgaacta tgtgttggct cgagaagaaa gcattcattt actgccggat 420

catttaagct atgaaggtgc ggcgatgagc gaaccattag cgtgctgtgt ccacgcgatg 480

tatcaaaaga gtcacttgga attaaaagac acgatcatta tcatgggccc tggaccaatc 540

ggactgtatc ttttgcagat tgccaaggaa attggagcct tcgtcattat gacggggatc 600

acaaaagatg ctcatcgctt agcattagca aaaaaactag gcgcggatgt gatcgttgat 660

acgatgaagg aagatctagc gaaagtcgtc aatgagatca cggatggcta cggtgtcgat 720

aaagtgtatg atgcctcagg agcagttcct gctgttaatg ctagtctgcc attgattcgc 780

aagcaggggc aatttattca agtaggcttg ttcgctaata aaatggtgga tttagacact 840

gaatcgatca ttcaacgaga gatcgaatac atcggcagtc gttcacagaa cccttatgac 900

tggccgattg cgatccactt attagcgaaa ggtgcgatca atatcgatga gatgattacg 960

aaaaaatacc cgttgactga atggcgggaa gcctttgata aagtgatgga aggcaatgaa 1020

atcaaggtaa tgatcgaatc caatccagaa gaattttaa 1059

<210> 176

<211> 352

<212> PRT

<213> 鸟肠球菌

<400> 176

Met Ser Lys Thr Met Lys Gly Val Ser Lys Gln Ala Pro Gly Tyr Asp

1 5 10 15

Gln Met Ala Phe Ile Asp Leu Ser Val Pro Glu Ala Thr Asp Asp Lys

20 25 30

Val Leu Ile Lys Val Ala Tyr Thr Gly Ile Cys Gly Ser Asp Ile His

35 40 45

Thr Phe Lys Gly Glu Tyr Lys Asn Pro Thr Thr Pro Val Val Leu Gly

50 55 60

His Glu Phe Ser Gly Gln Val Val Glu Val Gly Ala Asn Val Pro Lys

65 70 75 80

Val Lys Val Gly Asp Arg Val Thr Ser Glu Thr Thr Phe Tyr Val Cys

85 90 95

Gly Glu Cys Asp Tyr Cys Lys Glu Lys Gln Tyr Asn Leu Cys Pro His

100 105 110

Arg Lys Gly Ile Gly Thr Gln Gln Asn Gly Ser Met Ala Asn Tyr Val

115 120 125

Leu Ala Arg Glu Glu Ser Ile His Leu Leu Pro Asp His Leu Ser Tyr

130 135 140

Glu Gly Ala Ala Met Ser Glu Pro Leu Ala Cys Cys Val His Ala Met

145 150 155 160

Tyr Gln Lys Ser His Leu Glu Leu Lys Asp Thr Ile Ile Ile Met Gly

165 170 175

Pro Gly Pro Ile Gly Leu Tyr Leu Leu Gln Ile Ala Lys Glu Ile Gly

180 185 190

Ala Phe Val Ile Met Thr Gly Ile Thr Lys Asp Ala His Arg Leu Ala

195 200 205

Leu Ala Lys Lys Leu Gly Ala Asp Val Ile Val Asp Thr Met Lys Glu

210 215 220

Asp Leu Ala Lys Val Val Asn Glu Ile Thr Asp Gly Tyr Gly Val Asp

225 230 235 240

Lys Val Tyr Asp Ala Ser Gly Ala Val Pro Ala Val Asn Ala Ser Leu

245 250 255

Pro Leu Ile Arg Lys Gln Gly Gln Phe Ile Gln Val Gly Leu Phe Ala

260 265 270

Asn Lys Met Val Asp Leu Asp Thr Glu Ser Ile Ile Gln Arg Glu Ile

275 280 285

Glu Tyr Ile Gly Ser Arg Ser Gln Asn Pro Tyr Asp Trp Pro Ile Ala

290 295 300

Ile His Leu Leu Ala Lys Gly Ala Ile Asn Ile Asp Glu Met Ile Thr

305 310 315 320

Lys Lys Tyr Pro Leu Thr Glu Trp Arg Glu Ala Phe Asp Lys Val Met

325 330 335

Glu Gly Asn Glu Ile Lys Val Met Ile Glu Ser Asn Pro Glu Glu Phe

340 345 350

<210> 177

<211> 846

<212> DNA

<213> 白色念珠菌（Candida albicans）

<400> 177

atggattccg catactggtc atacgataac atagtcccaa gcttccgttt ggatggaaaa 60

ctagtcatat taaccggtgg ctctggtggt ttggctgccg tggtatcaag agctttatta 120

gccaaaggtg ccgatgttgc attagtcgat atgaacttgg aaagaacaca acaagctgct 180

agagacgtct tacaatgggg cgaagagcaa atgaaaggta aatacgaatc accaatcggt 240

caggtgagtg cttggtcatg taatattggc gatgctgaag ctgtcgactt gacattcaaa 300

gccatcaacg aacaccacgg caaaatctca agtgtcttgg tcaacactgc cggttacgct 360

gaaaacttcc cagctgaaga gtacccagcc aagaacgctg aaaaccttat gaaagttaac 420

gggttggggt cattctacgt ttcccaagct tttgctagac cattaatcca aaacaacatg 480

accggatcga tcattttgat cgggtcaatg tccggtacca tcgtcaacga cccacaacca 540

caatgcatgt acaacatgtc caaagccggt gtcattcatt tagccagatc attggcctgt 600

gaatgggcta aatacaatat cagagtcaac acattgtcgc cagggtacat cttaacccca 660

ttgacaagaa acgttattag tggacacacc gaaatgaaga cagaatggga atcaaagatc 720

ccaatgaaga gaatggcaga accaaaagag tttgttggtt ctatcttata cttggcctca 780

gaatctgctt catcatacac tactggtcac aacttggtcg ttgacggggg ttacgagtgc 840

tggtaa 846

<210> 178

<211> 281

<212> PRT

<213> 白色念珠菌

<400> 178

Met Asp Ser Ala Tyr Trp Ser Tyr Asp Asn Ile Val Pro Ser Phe Arg

1 5 10 15

Leu Asp Gly Lys Leu Val Ile Leu Thr Gly Gly Ser Gly Gly Leu Ala

20 25 30

Ala Val Val Ser Arg Ala Leu Leu Ala Lys Gly Ala Asp Val Ala Leu

35 40 45

Val Asp Met Asn Leu Glu Arg Thr Gln Gln Ala Ala Arg Asp Val Leu

50 55 60

Gln Trp Gly Glu Glu Gln Met Lys Gly Lys Tyr Glu Ser Pro Ile Gly

65 70 75 80

Gln Val Ser Ala Trp Ser Cys Asn Ile Gly Asp Ala Glu Ala Val Asp

85 90 95

Leu Thr Phe Lys Ala Ile Asn Glu His His Gly Lys Ile Ser Ser Val

100 105 110

Leu Val Asn Thr Ala Gly Tyr Ala Glu Asn Phe Pro Ala Glu Glu Tyr

115 120 125

Pro Ala Lys Asn Ala Glu Asn Leu Met Lys Val Asn Gly Leu Gly Ser

130 135 140

Phe Tyr Val Ser Gln Ala Phe Ala Arg Pro Leu Ile Gln Asn Asn Met

145 150 155 160

Thr Gly Ser Ile Ile Leu Ile Gly Ser Met Ser Gly Thr Ile Val Asn

165 170 175

Asp Pro Gln Pro Gln Cys Met Tyr Asn Met Ser Lys Ala Gly Val Ile

180 185 190

His Leu Ala Arg Ser Leu Ala Cys Glu Trp Ala Lys Tyr Asn Ile Arg

195 200 205

Val Asn Thr Leu Ser Pro Gly Tyr Ile Leu Thr Pro Leu Thr Arg Asn

210 215 220

Val Ile Ser Gly His Thr Glu Met Lys Thr Glu Trp Glu Ser Lys Ile

225 230 235 240

Pro Met Lys Arg Met Ala Glu Pro Lys Glu Phe Val Gly Ser Ile Leu

245 250 255

Tyr Leu Ala Ser Glu Ser Ala Ser Ser Tyr Thr Thr Gly His Asn Leu

260 265 270

Val Val Asp Gly Gly Tyr Glu Cys Trp

275 280

<210> 179

<211> 849

<212> DNA

<213> 热带念珠菌（Candida tropicalis）

<400> 179

atggactcct catcatactg gtcatacgac aacattgttc caagttttag attggatgga 60

aaattagtaa ttatcactgg tggttctggt ggtttgtccg ctgttgtttc cagagccttg 120

ttagcaaaag gtgctgatat tgctttgatt gatatgaact tggaaagaac ccaacaagcc 180

gcaagagatg ttttacaatg gggtgaagaa caaatgaaag gaaaacacga atctccaatt 240

ggtcaagtca gtgcttggtc ctgtaacatt ggtgatgctg aagctgttga attgacattc 300

aaagccatca acgaacacca cggtaaagtt gccagtgttt tgattaacac agctggttat 360

gctgaaaatt tccctgctga agaataccca gccaagaatg ccgaaaatat catgaaggtc 420

aatggtttag gatcctttta cgtctcacaa gctttcgcca gacctttgat tcaaaataac 480

atgactggct ctattatctt gattggttct atgtctggta ccattgtcaa cgatccacaa 540

ccacaatgta tgtacaacat gtccaaagct ggtgtcattc acttggccag atctttagca 600

tgtgaatggg ccaaatacaa catcagagtc aataccttgt ccccaggtta tattttgact 660

ccattgacaa gaaatgttat tagtggtcac actgaaatga agacagaatg ggaatccaag 720

attccaatga agagaatggc cgagccaaaa gaatttgtcg gttctatttt gtacttggct 780

tctgattctg cctcttccta cactactggt cacaatttgg tagtggatgg tggttacgaa 840

tgttggtaa 849

<210> 180

<211> 282

<212> PRT

<213> 热带念珠菌

<400> 180

Met Asp Ser Ser Ser Tyr Trp Ser Tyr Asp Asn Ile Val Pro Ser Phe

1 5 10 15

Arg Leu Asp Gly Lys Leu Val Ile Ile Thr Gly Gly Ser Gly Gly Leu

20 25 30

Ser Ala Val Val Ser Arg Ala Leu Leu Ala Lys Gly Ala Asp Ile Ala

35 40 45

Leu Ile Asp Met Asn Leu Glu Arg Thr Gln Gln Ala Ala Arg Asp Val

50 55 60

Leu Gln Trp Gly Glu Glu Gln Met Lys Gly Lys His Glu Ser Pro Ile

65 70 75 80

Gly Gln Val Ser Ala Trp Ser Cys Asn Ile Gly Asp Ala Glu Ala Val

85 90 95

Glu Leu Thr Phe Lys Ala Ile Asn Glu His His Gly Lys Val Ala Ser

100 105 110

Val Leu Ile Asn Thr Ala Gly Tyr Ala Glu Asn Phe Pro Ala Glu Glu

115 120 125

Tyr Pro Ala Lys Asn Ala Glu Asn Ile Met Lys Val Asn Gly Leu Gly

130 135 140

Ser Phe Tyr Val Ser Gln Ala Phe Ala Arg Pro Leu Ile Gln Asn Asn

145 150 155 160

Met Thr Gly Ser Ile Ile Leu Ile Gly Ser Met Ser Gly Thr Ile Val

165 170 175

Asn Asp Pro Gln Pro Gln Cys Met Tyr Asn Met Ser Lys Ala Gly Val

180 185 190

Ile His Leu Ala Arg Ser Leu Ala Cys Glu Trp Ala Lys Tyr Asn Ile

195 200 205

Arg Val Asn Thr Leu Ser Pro Gly Tyr Ile Leu Thr Pro Leu Thr Arg

210 215 220

Asn Val Ile Ser Gly His Thr Glu Met Lys Thr Glu Trp Glu Ser Lys

225 230 235 240

Ile Pro Met Lys Arg Met Ala Glu Pro Lys Glu Phe Val Gly Ser Ile

245 250 255

Leu Tyr Leu Ala Ser Asp Ser Ala Ser Ser Tyr Thr Thr Gly His Asn

260 265 270

Leu Val Val Asp Gly Gly Tyr Glu Cys Trp

275 280

<210> 181

<211> 1158

<212> DNA

<213> 未知

<220>

<223> Scheffersomyces stipitis序列

<400> 181

aatttctata gattggtaca aatcatagaa tagagaatcc caatagcaca agctcctgat 60

ttccttgcat tatttgcccg cgctcaagta ttttttagac tgagtcttcc atacttcgta 120

ctgatataaa caaatattgc acaaactact actagtgaat tactaatagt ttccaccaaa 180

tacagccact acacactaca tatactacaa tggactactc atacgctaac gttgttccca 240

acttcagatt ggacggaaga ttggctatta ttaccggagg ttctggtggt ttggccgcag 300

tcatttcgcg tgccttgttg gcccagggcg ctgatgttgc tctcattgac atgaacttgg 360

aaagaaccaa gtccgctgcc aaagaagttt tgggctgggg tgaagagacg ttgaagggtg 420

aacacgcttc agccatcggc caagtttccg cctggtcctg caacattggg gatgctgagg 480

cagtagacgc tactttcagc tccatcaacg aacaccacgg caagatcgct gacttgttga 540

ttaacaccgc tggatactgt gaaaacttcc ctgccgaaac gtacccggct actaacgctg 600

aaagcatcat gaaggtgaac ggtttgggct cattctacgt ttcgcaatcg ttcgctagac 660

cattgatcca gaacaacttg agaggctcta tcatcttgat tggctcaatg tctggaacaa 720

ttgtcaacga cccacaaccc caatgtatgt acaacatgtc caaggctgga gtgatccact 780

tggtcagatc gttggcctgc gaatgggcca agtacaacat cagagtcaac accttatcac 840

caggctatat tttgactcct ttaaccagaa acgtgatttc tggccacaca gagatgaagg 900

aagcctggga atccaagatc cccatgaaga gaatggccga acccaaggaa ttcgtggggt 960

ccatcttata cttggcaagc gagactgctt cttcctacac tacgggccac aatttggttg 1020

tggacggagg atatgaatgc tggtagatac cgctcccatt ttaatgaaac gaccacgata 1080

cgacccacag tttaatttca caagtataaa gtttatatgt cgctactgtt ttatagagaa 1140

agccaaaatt gacgaaac 1158

<210> 182

<211> 278

<212> PRT

<213> 未知

<220>

<223> Scheffersomyces stipitis序列

<400> 182

Met Asp Tyr Ser Tyr Ala Asn Val Val Pro Asn Phe Arg Leu Asp Gly

1 5 10 15

Arg Leu Ala Ile Ile Thr Gly Gly Ser Gly Gly Leu Ala Ala Val Ile

20 25 30

Ser Arg Ala Leu Leu Ala Gln Gly Ala Asp Val Ala Leu Ile Asp Met

35 40 45

Asn Leu Glu Arg Thr Lys Ser Ala Ala Lys Glu Val Leu Gly Trp Gly

50 55 60

Glu Glu Thr Leu Lys Gly Glu His Ala Ser Ala Ile Gly Gln Val Ser

65 70 75 80

Ala Trp Ser Cys Asn Ile Gly Asp Ala Glu Ala Val Asp Ala Thr Phe

85 90 95

Ser Ser Ile Asn Glu His His Gly Lys Ile Ala Asp Leu Leu Ile Asn

100 105 110

Thr Ala Gly Tyr Cys Glu Asn Phe Pro Ala Glu Thr Tyr Pro Ala Thr

115 120 125

Asn Ala Glu Ser Ile Met Lys Val Asn Gly Leu Gly Ser Phe Tyr Val

130 135 140

Ser Gln Ser Phe Ala Arg Pro Leu Ile Gln Asn Asn Leu Arg Gly Ser

145 150 155 160

Ile Ile Leu Ile Gly Ser Met Ser Gly Thr Ile Val Asn Asp Pro Gln

165 170 175

Pro Gln Cys Met Tyr Asn Met Ser Lys Ala Gly Val Ile His Leu Val

180 185 190

Arg Ser Leu Ala Cys Glu Trp Ala Lys Tyr Asn Ile Arg Val Asn Thr

195 200 205

Leu Ser Pro Gly Tyr Ile Leu Thr Pro Leu Thr Arg Asn Val Ile Ser

210 215 220

Gly His Thr Glu Met Lys Glu Ala Trp Glu Ser Lys Ile Pro Met Lys

225 230 235 240

Arg Met Ala Glu Pro Lys Glu Phe Val Gly Ser Ile Leu Tyr Leu Ala

245 250 255

Ser Glu Thr Ala Ser Ser Tyr Thr Thr Gly His Asn Leu Val Val Asp

260 265 270

Gly Gly Tyr Glu Cys Trp

275

<210> 183

<211> 1482

<212> DNA

<213> 荧光假单胞菌

<400> 183

atgaaactga ataagcagaa cctcacccag ctggcgcccg aagtgaaatt gccagcctat 60

acgcttgccg acacacgcca gggcatcgcc catatcggcg tcggcggctt ccatcgcgcg 120

caccaggcgt attacaccga tgcgctgatg aataccggcg agggcctgga ctggagcatc 180

tgcggcgttg gcctgcgcag cgaggaccgc aaggcccgcg atgacctggc cggccaggac 240

tacctgttca ccctgtacga actgggcgac accgacgaca ccgaagtgcg cgtgatcggc 300

tcgatcagcg acatgctgct ggccgaagac agcgcccagg cattgatcga taaactggcc 360

agccccgaga ttcgcatcgt ctcgctgacc atcaccgaag gcggctactg catcgacgac 420

agcaacggcg aattcatggc ccacttgccg cagatccagc acgacctggc tcatccgtcg 480

tcgccaaaaa ccgtgttcgg ctttatctgc gcggcattga cccagcgccg cgcggccggc 540

atcccggcgt ttaccgtgat gtcctgcgat aacctgcccc acaatggcgc tgtcacgcgc 600

aaggcactgc tggcgttcgc cgccctgcac aacgccgagc tgcatgactg gatcaaggcc 660

catgtgagct tcccgaacgc catggtcgac cgcatcacgc cgatgaccag caccgcccac 720

cgcctgcaac tgcacgatga acacggcatc gacgatgcct ggccagttgt ttgcgaaccc 780

tttgtgcagt gggtactgga agacaaattc gtcaacggcc gcccggcgtg ggaaaaggtt 840

ggcgtgcagt tcaccgacga tgtgacaccc tatgaagaga tgaagatcgg cttgctcaac 900

ggcagccacc tggccctgac ctacctgggt tttctcaagg gctatcggtt tgtgcacgag 960

accatgaacg acccgctgtt cgtggcctac atgcgcgcct acatggacct cgacgtcacg 1020

ccaaacctcg cgccggtacc gggcatcgac ctgaccgact acaagcagac cctggtggac 1080

cgcttctcca accaggcgat tgccgaccag ttggaacggg tgtgttcgga tggctcgtcg 1140

aagtttccca agttcaccgt gccgaccatc aaccgcctga ttgccgacgg ccgtgagacc 1200

gagcgtgcag cactggtcgt cgcggcctgg gccttgtatt tgaagggtgt ggatgagaat 1260

ggcgtgagct acacaatccc cgatccgcgc gccgagttct gccaggggct ggtgagtgac 1320

gatgcactga tcagccagcg gttgctggca gtggaagaga ttttcggtac ggctattccc 1380

aactcgcctg agtttgtggc agcgttcgag cggtgctatg ggagcctgcg tgataacggc 1440

gtcaccacta ccctgaagca cctcctgaag aaaccggttt aa 1482

<210> 184

<211> 493

<212> PRT

<213> 荧光假单胞菌

<400> 184

Met Lys Leu Asn Lys Gln Asn Leu Thr Gln Leu Ala Pro Glu Val Lys

1 5 10 15

Leu Pro Ala Tyr Thr Leu Ala Asp Thr Arg Gln Gly Ile Ala His Ile

20 25 30

Gly Val Gly Gly Phe His Arg Ala His Gln Ala Tyr Tyr Thr Asp Ala

35 40 45

Leu Met Asn Thr Gly Glu Gly Leu Asp Trp Ser Ile Cys Gly Val Gly

50 55 60

Leu Arg Ser Glu Asp Arg Lys Ala Arg Asp Asp Leu Ala Gly Gln Asp

65 70 75 80

Tyr Leu Phe Thr Leu Tyr Glu Leu Gly Asp Thr Asp Asp Thr Glu Val

85 90 95

Arg Val Ile Gly Ser Ile Ser Asp Met Leu Leu Ala Glu Asp Ser Ala

100 105 110

Gln Ala Leu Ile Asp Lys Leu Ala Ser Pro Glu Ile Arg Ile Val Ser

115 120 125

Leu Thr Ile Thr Glu Gly Gly Tyr Cys Ile Asp Asp Ser Asn Gly Glu

130 135 140

Phe Met Ala His Leu Pro Gln Ile Gln His Asp Leu Ala His Pro Ser

145 150 155 160

Ser Pro Lys Thr Val Phe Gly Phe Ile Cys Ala Ala Leu Thr Gln Arg

165 170 175

Arg Ala Ala Gly Ile Pro Ala Phe Thr Val Met Ser Cys Asp Asn Leu

180 185 190

Pro His Asn Gly Ala Val Thr Arg Lys Ala Leu Leu Ala Phe Ala Ala

195 200 205

Leu His Asn Ala Glu Leu His Asp Trp Ile Lys Ala His Val Ser Phe

210 215 220

Pro Asn Ala Met Val Asp Arg Ile Thr Pro Met Thr Ser Thr Ala His

225 230 235 240

Arg Leu Gln Leu His Asp Glu His Gly Ile Asp Asp Ala Trp Pro Val

245 250 255

Val Cys Glu Pro Phe Val Gln Trp Val Leu Glu Asp Lys Phe Val Asn

260 265 270

Gly Arg Pro Ala Trp Glu Lys Val Gly Val Gln Phe Thr Asp Asp Val

275 280 285

Thr Pro Tyr Glu Glu Met Lys Ile Gly Leu Leu Asn Gly Ser His Leu

290 295 300

Ala Leu Thr Tyr Leu Gly Phe Leu Lys Gly Tyr Arg Phe Val His Glu

305 310 315 320

Thr Met Asn Asp Pro Leu Phe Val Ala Tyr Met Arg Ala Tyr Met Asp

325 330 335

Leu Asp Val Thr Pro Asn Leu Ala Pro Val Pro Gly Ile Asp Leu Thr

340 345 350

Asp Tyr Lys Gln Thr Leu Val Asp Arg Phe Ser Asn Gln Ala Ile Ala

355 360 365

Asp Gln Leu Glu Arg Val Cys Ser Asp Gly Ser Ser Lys Phe Pro Lys

370 375 380

Phe Thr Val Pro Thr Ile Asn Arg Leu Ile Ala Asp Gly Arg Glu Thr

385 390 395 400

Glu Arg Ala Ala Leu Val Val Ala Ala Trp Ala Leu Tyr Leu Lys Gly

405 410 415

Val Asp Glu Asn Gly Val Ser Tyr Thr Ile Pro Asp Pro Arg Ala Glu

420 425 430

Phe Cys Gln Gly Leu Val Ser Asp Asp Ala Leu Ile Ser Gln Arg Leu

435 440 445

Leu Ala Val Glu Glu Ile Phe Gly Thr Ala Ile Pro Asn Ser Pro Glu

450 455 460

Phe Val Ala Ala Phe Glu Arg Cys Tyr Gly Ser Leu Arg Asp Asn Gly

465 470 475 480

Val Thr Thr Thr Leu Lys His Leu Leu Lys Lys Pro Val

485 490

<210> 185

<211> 1368

<212> DNA

<213> 肺炎克雷伯氏菌（Klebsiella pneumoniae）

<400> 185

ttagttaatc agcgtgtaaa cggcggcgac tttctcgcgc atcagcgcca ggaaatccgc 60

gttgttggcg agatcaccaa acagggcttt atcacgggcg aagacagcca ccggatcctg 120

agcctcgaac atctcatgca ccgcctgcgc atccaggatg ccgtcctggt actgatatgg 180

cagagttccc ttgtgccact gctccataaa gacgaagaac agcgccggca gcatggcggt 240

cgcttccggg cggacgccgc gctggtagca ctcctgcaag gttggcgcga tcatcgccgg 300

aattttcgag aagccgtcgg cggcgacgcg ctggttggtg tcctggatat aggggttggt 360

aaagcgctta agcaccacat cccggtaggt cggcagatca atgccgttgt cgccgagaca 420

cggaataacg tcctccgtaa cgtagcggtc ggcaatggcg tagataacat cggtcagcgt 480

gctttcatga atatactgct ggccgattaa ggttcccgcc caggcaatgc agctgtgcga 540

cgcgttcaaa atacggattt tcgcctcttc atacgggatg accgactcca ccatctccac 600

gccgactgcc tccagattcg ggcggacatc gcggaagttg ttctccacta cccactggat 660

aaaggtctcc cccatcaccg gcgctttgtc atcaattccg gcttgcgctt tgatgcgggc 720

cggcagatcg gccgccggac gcggggtgat gcggtccacc atggtgttcg gacaggtggt 780

attggccgcc atccagtcaa tcaccgcctg tttgccggtg agctgcagga actcgaccat 840

accgtcgtgg aaacgctcgc cgttatggcg cacgttatcg cagttgagca gggtcagcgg 900

cccggcgttg tcggccatgc gcttttccag gatccgcgcg agggtgccgt aaatggtttt 960

gcactcgcct tgcaggtcgg cctgcagatc ggggttgctg gtttccagcc gatggcgagt 1020

gttcaggtag tacccccctt ccgtcacggt aaaggcgata actttggtct gcgggtttgc 1080

cccttcgtta atcagcggct gtagcccggc ctgccacggt agcagtttct ggattgaggt 1140

gatctcttca tattcgcgct ccccttccgg gctgacggtc tcgaggacgt aacgtcctcc 1200

ctgcgccgcc agcgcctgga ccacctgctc ggcgtcgttg cgaatattcc ccgccgcgat 1260

gcgccagcga ttatccccgg aagcaatcag acgatgcaga taccacgcct gatgcgcgcg 1320

atgaaaagaa cccagaccga tatgaagcca tgtgaattga ttgttcat 1368

<210> 186

<211> 455

<212> PRT

<213> 肺炎克雷伯氏菌

<400> 186

Met Asn Asn Gln Phe Thr Trp Leu His Ile Gly Leu Gly Ser Phe His

1 5 10 15

Arg Ala His Gln Ala Trp Tyr Leu His Arg Leu Ile Ala Ser Gly Asp

20 25 30

Asn Arg Trp Arg Ile Ala Ala Gly Asn Ile Arg Asn Asp Ala Glu Gln

35 40 45

Val Val Gln Ala Leu Ala Ala Gln Gly Gly Arg Tyr Val Leu Glu Thr

50 55 60

Val Ser Pro Glu Gly Glu Arg Glu Tyr Glu Glu Ile Thr Ser Ile Gln

65 70 75 80

Lys Leu Leu Pro Trp Gln Ala Gly Leu Gln Pro Leu Ile Asn Glu Gly

85 90 95

Ala Asn Pro Gln Thr Lys Val Ile Ala Phe Thr Val Thr Glu Gly Gly

100 105 110

Tyr Tyr Leu Asn Thr Arg His Arg Leu Glu Thr Ser Asn Pro Asp Leu

115 120 125

Gln Ala Asp Leu Gln Gly Glu Cys Lys Thr Ile Tyr Gly Thr Leu Ala

130 135 140

Arg Ile Leu Glu Lys Arg Met Ala Asp Asn Ala Gly Pro Leu Thr Leu

145 150 155 160

Leu Asn Cys Asp Asn Val Arg His Asn Gly Glu Arg Phe His Asp Gly

165 170 175

Met Val Glu Phe Leu Gln Leu Thr Gly Lys Gln Ala Val Ile Asp Trp

180 185 190

Met Ala Ala Asn Thr Thr Cys Pro Asn Thr Met Val Asp Arg Ile Thr

195 200 205

Pro Arg Pro Ala Ala Asp Leu Pro Ala Arg Ile Lys Ala Gln Ala Gly

210 215 220

Ile Asp Asp Lys Ala Pro Val Met Gly Glu Thr Phe Ile Gln Trp Val

225 230 235 240

Val Glu Asn Asn Phe Arg Asp Val Arg Pro Asn Leu Glu Ala Val Gly

245 250 255

Val Glu Met Val Glu Ser Val Ile Pro Tyr Glu Glu Ala Lys Ile Arg

260 265 270

Ile Leu Asn Ala Ser His Ser Cys Ile Ala Trp Ala Gly Thr Leu Ile

275 280 285

Gly Gln Gln Tyr Ile His Glu Ser Thr Leu Thr Asp Val Ile Tyr Ala

290 295 300

Ile Ala Asp Arg Tyr Val Thr Glu Asp Val Ile Pro Cys Leu Gly Asp

305 310 315 320

Asn Gly Ile Asp Leu Pro Thr Tyr Arg Asp Val Val Leu Lys Arg Phe

325 330 335

Thr Asn Pro Tyr Ile Gln Asp Thr Asn Gln Arg Val Ala Ala Asp Gly

340 345 350

Phe Ser Lys Ile Pro Ala Met Ile Ala Pro Thr Leu Gln Glu Cys Tyr

355 360 365

Gln Arg Gly Val Arg Pro Glu Ala Thr Ala Met Leu Pro Ala Leu Phe

370 375 380

Phe Val Phe Met Glu Gln Trp His Lys Gly Thr Leu Pro Tyr Gln Tyr

385 390 395 400

Gln Asp Gly Ile Leu Asp Ala Gln Ala Val His Glu Met Phe Glu Ala

405 410 415

Gln Asp Pro Val Ala Val Phe Ala Arg Asp Lys Ala Leu Phe Gly Asp

420 425 430

Leu Ala Asn Asn Ala Asp Phe Leu Ala Leu Met Arg Glu Lys Val Ala

435 440 445

Ala Val Tyr Thr Leu Ile Asn

450 455

<210> 187

<211> 1398

<212> DNA

<213> 茄科雷尔氏菌（Ralstonia solanacearum）

<400> 187

atgacgcggt cgtccctcgc gcgtgcgcca gtgctgctgc atattggcgc cggatctttc 60

catcgtgcgc accaggcgtg gtatctgcat cgcgtcaacg cggccgtgcc tcccggcgag 120

cgctggacgc tgacggtcgg gaacattcgc gacgacatgc acgcgacact cgccgcgctg 180

gccgcgcagc agggtgccta cacgctcgag accgtcacgc cgcaaggcga gcgtgcgtat 240

gagacgatcc gctcgatcgc gcgggtgctg ccctggtccg ccgatcttgc cgcgctcatc 300

aatacgggcg ccgatcccgc gtgccggatc gtgtcgttta cggtcaccga aggcgggtat 360

tacctcgacg agcacgatcg tctcgatgtc acgcatcccg atctcgcggc cgacctgcgg 420

ggcgcccgct cgacgctata cggcgcattg gccgcgttgc tcgccgagcg ccgccagcgc 480

ggagccgggc cgctcacgct gcagagttgc gacaatctgc gcagcaacgg cgcgcgtttt 540

cgcgcgggca tgcgcgcgtt cctcgcgctg cgcggcgacg cagcgctcct cgcgtggttc 600

gatgccaacg tatcgtgccc gagcgcgatg gtcgaccgga tcacgccgcg gccgaccgac 660

gacgtccgca cgcgcgtgca cgcggccacc ggcgtcgacg accgctgccc ggtcatgggc 720

gaatccttca tccaatgggt gatcgaggac aacttcatcg ccggccggcc ggcatgggag 780

atcgcgggcg cggagatcgt cgccgatgtg catccgtacg aagaggcgaa gatccggatc 840

ctgaatgcga cgcacagctg catcgcctgg gcgggcacgc tcgcgggact cacctacatt 900

cacgaaggga tgcgtgatgc ggccatttat cgcttcgcct acgactacgt caccgacgac 960

gtgattccct gcctgacgcc gagcccgctg gatctcgagc gctatcggga cgtcgtgctc 1020

gagcgcttcg gcaatccgta cgtgctcgac accaaccagc gtgtcgccgc cgatggcttc 1080

tcgaaaatcc ccggcttcat cgcaccgacg ctcgccgaat gctttgcgcg cggcgccgat 1140

ccggtcgcga ccgcggtgtt gccggcgctg tttctgggct tccttgaagg ttgggcgcgc 1200

ggcaccttgc cctacgtata ccaggacggc gtgatggatg gcgccgccgc acgcagcatc 1260

gtcgaggctc cggattccgt tgccgcgttc tgttcagatc gccaattgtg gggttcgctt 1320

gcgggccgcg acgcgcttgt ccaggcggtg cgtgcgggac gcgcgcgcgt tgaagcatgg 1380

cgagccgcac gccgctga 1398

<210> 188

<211> 465

<212> PRT

<213> 茄科雷尔氏菌

<400> 188

Met Thr Arg Ser Ser Leu Ala Arg Ala Pro Val Leu Leu His Ile Gly

1 5 10 15

Ala Gly Ser Phe His Arg Ala His Gln Ala Trp Tyr Leu His Arg Val

20 25 30

Asn Ala Ala Val Pro Pro Gly Glu Arg Trp Thr Leu Thr Val Gly Asn

35 40 45

Ile Arg Asp Asp Met His Ala Thr Leu Ala Ala Leu Ala Ala Gln Gln

50 55 60

Gly Ala Tyr Thr Leu Glu Thr Val Thr Pro Gln Gly Glu Arg Ala Tyr

65 70 75 80

Glu Thr Ile Arg Ser Ile Ala Arg Val Leu Pro Trp Ser Ala Asp Leu

85 90 95

Ala Ala Leu Ile Asn Thr Gly Ala Asp Pro Ala Cys Arg Ile Val Ser

100 105 110

Phe Thr Val Thr Glu Gly Gly Tyr Tyr Leu Asp Glu His Asp Arg Leu

115 120 125

Asp Val Thr His Pro Asp Leu Ala Ala Asp Leu Arg Gly Ala Arg Ser

130 135 140

Thr Leu Tyr Gly Ala Leu Ala Ala Leu Leu Ala Glu Arg Arg Gln Arg

145 150 155 160

Gly Ala Gly Pro Leu Thr Leu Gln Ser Cys Asp Asn Leu Arg Ser Asn

165 170 175

Gly Ala Arg Phe Arg Ala Gly Met Arg Ala Phe Leu Ala Leu Arg Gly

180 185 190

Asp Ala Ala Leu Leu Ala Trp Phe Asp Ala Asn Val Ser Cys Pro Ser

195 200 205

Ala Met Val Asp Arg Ile Thr Pro Arg Pro Thr Asp Asp Val Arg Thr

210 215 220

Arg Val His Ala Ala Thr Gly Val Asp Asp Arg Cys Pro Val Met Gly

225 230 235 240

Glu Ser Phe Ile Gln Trp Val Ile Glu Asp Asn Phe Ile Ala Gly Arg

245 250 255

Pro Ala Trp Glu Ile Ala Gly Ala Glu Ile Val Ala Asp Val His Pro

260 265 270

Tyr Glu Glu Ala Lys Ile Arg Ile Leu Asn Ala Thr His Ser Cys Ile

275 280 285

Ala Trp Ala Gly Thr Leu Ala Gly Leu Thr Tyr Ile His Glu Gly Met

290 295 300

Arg Asp Ala Ala Ile Tyr Arg Phe Ala Tyr Asp Tyr Val Thr Asp Asp

305 310 315 320

Val Ile Pro Cys Leu Thr Pro Ser Pro Leu Asp Leu Glu Arg Tyr Arg

325 330 335

Asp Val Val Leu Glu Arg Phe Gly Asn Pro Tyr Val Leu Asp Thr Asn

340 345 350

Gln Arg Val Ala Ala Asp Gly Phe Ser Lys Ile Pro Gly Phe Ile Ala

355 360 365

Pro Thr Leu Ala Glu Cys Phe Ala Arg Gly Ala Asp Pro Val Ala Thr

370 375 380

Ala Val Leu Pro Ala Leu Phe Leu Gly Phe Leu Glu Gly Trp Ala Arg

385 390 395 400

Gly Thr Leu Pro Tyr Val Tyr Gln Asp Gly Val Met Asp Gly Ala Ala

405 410 415

Ala Arg Ser Ile Val Glu Ala Pro Asp Ser Val Ala Ala Phe Cys Ser

420 425 430

Asp Arg Gln Leu Trp Gly Ser Leu Ala Gly Arg Asp Ala Leu Val Gln

435 440 445

Ala Val Arg Ala Gly Arg Ala Arg Val Glu Ala Trp Arg Ala Ala Arg

450 455 460

Arg

465

<210> 189

<211> 1185

<212> DNA

<213> 枯草芽孢杆菌

<400> 189

atgaatcgta tcgcagctga cgttcagcgt gcttttgaaa acgccggaga aaagacgttg 60

cctataaaag ttgaagaaat tgttctcggt aagcaagcag ctgattcgct tttggattat 120

gtaaaacgaa aaaacaatca acatattgtc cttgtctgcg acgcgaatac acaccgcatt 180

gcaggaattg atttagaaaa ccgactgaat caagaaggat ttcaggccga gtgcctgatc 240

attccagaaa atgaagccgg agatgtgaca gctgatgaac gatcgctcat tcatgtgctg 300

atccatacga aacaaccaac ggatgtcatg atcgcagtcg gttcgggcac gattcatgat 360

atcgtccgct ttgcggcgtt tcaaagagat ttgccgttta tttcttatcc gactgctcca 420

tctgtagacg gttttacatc agccggtgcg ccgattattt tatacggcac gaaaacaacc 480

attcaaacga aggccccatc tgcgctgttc gctgatctgg atctattaaa agcggcaccg 540

cagtcaatgg tggcggctgg ctttggtgac atgctcggta aaatcacgtc tttagcagat 600

tgggaaatat cccggcatct tgccggtgag ccttattcgc ctgcaggagc taagatcgtt 660

caggaggcgc ttgctgcctg cattgaacac acagaagaca ttgcgatgaa aacggaaact 720

ggcatacggg ttttgatgga gtctttactt gtatcggggc ttgtcatgct ggcattagat 780

cattcccgac cggcatcagg cggcgagcat catatttcac attggattga aatggagtta 840

atggagaaaa aacggcctca gattcttcat ggggcaaagg tgggctgtgc cgctgtttta 900

ttaactgaca catacagaaa gctcgctcag gatgacgggc tgaacgaatt ttcaccaagc 960

cgccgggaag ccatccaatc ggcttatcaa acactcccga gaggagaagt gctggctgat 1020

tggctgagat cagccggagg ccctgcgtat tttgacgaaa tcggtgtcgg gcaggattcc 1080

gtcaaaaatg ccttcagaca cgcgcacacc ttaagagacc gatgcaccgg attaagaatc 1140

atcaatgaaa acaaaacgct gatcaaccat ggtctatatg aatag 1185

<210> 190

<211> 394

<212> PRT

<213> 枯草芽孢杆菌

<400> 190

Met Asn Arg Ile Ala Ala Asp Val Gln Arg Ala Phe Glu Asn Ala Gly

1 5 10 15

Glu Lys Thr Leu Pro Ile Lys Val Glu Glu Ile Val Leu Gly Lys Gln

20 25 30

Ala Ala Asp Ser Leu Leu Asp Tyr Val Lys Arg Lys Asn Asn Gln His

35 40 45

Ile Val Leu Val Cys Asp Ala Asn Thr His Arg Ile Ala Gly Ile Asp

50 55 60

Leu Glu Asn Arg Leu Asn Gln Glu Gly Phe Gln Ala Glu Cys Leu Ile

65 70 75 80

Ile Pro Glu Asn Glu Ala Gly Asp Val Thr Ala Asp Glu Arg Ser Leu

85 90 95

Ile His Val Leu Ile His Thr Lys Gln Pro Thr Asp Val Met Ile Ala

100 105 110

Val Gly Ser Gly Thr Ile His Asp Ile Val Arg Phe Ala Ala Phe Gln

115 120 125

Arg Asp Leu Pro Phe Ile Ser Tyr Pro Thr Ala Pro Ser Val Asp Gly

130 135 140

Phe Thr Ser Ala Gly Ala Pro Ile Ile Leu Tyr Gly Thr Lys Thr Thr

145 150 155 160

Ile Gln Thr Lys Ala Pro Ser Ala Leu Phe Ala Asp Leu Asp Leu Leu

165 170 175

Lys Ala Ala Pro Gln Ser Met Val Ala Ala Gly Phe Gly Asp Met Leu

180 185 190

Gly Lys Ile Thr Ser Leu Ala Asp Trp Glu Ile Ser Arg His Leu Ala

195 200 205

Gly Glu Pro Tyr Ser Pro Ala Gly Ala Lys Ile Val Gln Glu Ala Leu

210 215 220

Ala Ala Cys Ile Glu His Thr Glu Asp Ile Ala Met Lys Thr Glu Thr

225 230 235 240

Gly Ile Arg Val Leu Met Glu Ser Leu Leu Val Ser Gly Leu Val Met

245 250 255

Leu Ala Leu Asp His Ser Arg Pro Ala Ser Gly Gly Glu His His Ile

260 265 270

Ser His Trp Ile Glu Met Glu Leu Met Glu Lys Lys Arg Pro Gln Ile

275 280 285

Leu His Gly Ala Lys Val Gly Cys Ala Ala Val Leu Leu Thr Asp Thr

290 295 300

Tyr Arg Lys Leu Ala Gln Asp Asp Gly Leu Asn Glu Phe Ser Pro Ser

305 310 315 320

Arg Arg Glu Ala Ile Gln Ser Ala Tyr Gln Thr Leu Pro Arg Gly Glu

325 330 335

Val Leu Ala Asp Trp Leu Arg Ser Ala Gly Gly Pro Ala Tyr Phe Asp

340 345 350

Glu Ile Gly Val Gly Gln Asp Ser Val Lys Asn Ala Phe Arg His Ala

355 360 365

His Thr Leu Arg Asp Arg Cys Thr Gly Leu Arg Ile Ile Asn Glu Asn

370 375 380

Lys Thr Leu Ile Asn His Gly Leu Tyr Glu

385 390

<210> 191

<211> 1059

<212> DNA

<213> 敏捷气热菌（Aeropyrum pernix）

<400> 191

ttgtatacct cgttccacag gatagacctc ccgaggacta tagtagtcgg cggaggcgtt 60

ctcgacaagg cgggcggcta tgtatctggg gtggctcagc gaggcagcta tgtgctcgtc 120

gtatccggcc caacggtgtc ctcgaaatac ttcgagaggc ttagagccag cctcgaggcc 180

gagggcctta cagtcggcct gaagataatc agggacgcca cggttgagac tgctgaggag 240

gtggcccgtg aggctcttga gagcaggata gaggttgtgg cgggcctggg aggtgggaag 300

tcgatagacg ttgctaagta cgcttcaaaa agggcgggct cggttttcgt cagcataccc 360

accgtggcta gccacgacgg gataacatcg ccattctcaa gcctgaaggg gttcgacaag 420

cctatatcga ggcccgctaa ggctccggag gcgataatta tagatgtgga tgtgatagcg 480

gaggctccca ggcgctacaa catcgctggc ttcggagacc tgataggcaa gtatactgca 540

gtcctcgact ggaggctggc ccacaagctc aggctggaat actatggcga atacgccgcc 600

agtctcgccc tcctgagcgc caaacatgtg agccagtacg ccgaggagat agcgctgggt 660

acgagggagg gctatagagt gctgctggag gctctcgtga gcagcggggt gtcgatgtgt 720

atagccggta gcacgaggcc tgcaagcggc agtgaacacc tcttcgccca cgccctccac 780

atagtcgcta ggaacaagcc tctccacggc gaggcggttg gggtggggac tataatgatg 840

gcctacctcc acggtaagaa ctggaggagg ataaggggcc tgctgaagac ggtcggcgcc 900

cccactaacg ccaaggagct tggtgtcgag gatgatgagg ttgttgaggc cctcactata 960

gcagccagga tcagaccgga gaggtacacc atactaggtg aaaaggggct cacgagagag 1020

gcggctgagg cgctggcgcg caagacgggc gttatatag 1059

<210> 192

<211> 352

<212> PRT

<213> 敏捷气热菌

<400> 192

Met Tyr Thr Ser Phe His Arg Ile Asp Leu Pro Arg Thr Ile Val Val

1 5 10 15

Gly Gly Gly Val Leu Asp Lys Ala Gly Gly Tyr Val Ser Gly Val Ala

20 25 30

Gln Arg Gly Ser Tyr Val Leu Val Val Ser Gly Pro Thr Val Ser Ser

35 40 45

Lys Tyr Phe Glu Arg Leu Arg Ala Ser Leu Glu Ala Glu Gly Leu Thr

50 55 60

Val Gly Leu Lys Ile Ile Arg Asp Ala Thr Val Glu Thr Ala Glu Glu

65 70 75 80

Val Ala Arg Glu Ala Leu Glu Ser Arg Ile Glu Val Val Ala Gly Leu

85 90 95

Gly Gly Gly Lys Ser Ile Asp Val Ala Lys Tyr Ala Ser Lys Arg Ala

100 105 110

Gly Ser Val Phe Val Ser Ile Pro Thr Val Ala Ser His Asp Gly Ile

115 120 125

Thr Ser Pro Phe Ser Ser Leu Lys Gly Phe Asp Lys Pro Ile Ser Arg

130 135 140

Pro Ala Lys Ala Pro Glu Ala Ile Ile Ile Asp Val Asp Val Ile Ala

145 150 155 160

Glu Ala Pro Arg Arg Tyr Asn Ile Ala Gly Phe Gly Asp Leu Ile Gly

165 170 175

Lys Tyr Thr Ala Val Leu Asp Trp Arg Leu Ala His Lys Leu Arg Leu

180 185 190

Glu Tyr Tyr Gly Glu Tyr Ala Ala Ser Leu Ala Leu Leu Ser Ala Lys

195 200 205

His Val Ser Gln Tyr Ala Glu Glu Ile Ala Leu Gly Thr Arg Glu Gly

210 215 220

Tyr Arg Val Leu Leu Glu Ala Leu Val Ser Ser Gly Val Ser Met Cys

225 230 235 240

Ile Ala Gly Ser Thr Arg Pro Ala Ser Gly Ser Glu His Leu Phe Ala

245 250 255

His Ala Leu His Ile Val Ala Arg Asn Lys Pro Leu His Gly Glu Ala

260 265 270

Val Gly Val Gly Thr Ile Met Met Ala Tyr Leu His Gly Lys Asn Trp

275 280 285

Arg Arg Ile Arg Gly Leu Leu Lys Thr Val Gly Ala Pro Thr Asn Ala

290 295 300

Lys Glu Leu Gly Val Glu Asp Asp Glu Val Val Glu Ala Leu Thr Ile

305 310 315 320

Ala Ala Arg Ile Arg Pro Glu Arg Tyr Thr Ile Leu Gly Glu Lys Gly

325 330 335

Leu Thr Arg Glu Ala Ala Glu Ala Leu Ala Arg Lys Thr Gly Val Ile

340 345 350

<210> 193

<211> 1020

<212> DNA

<213> 大肠杆菌

<400> 193

atgaaccaac gtaatgcttc aatgactgtg atcggtgccg gctcgtacgg caccgctctt 60

gccatcaccc tggcaagaaa tggccacgag gttgtcctct ggggccatga ccctgaacat 120

atcgcaacgc ttgaacgcga ccgctgtaac gccgcgtttc tccccgatgt gccttttccc 180

gatacgctcc atcttgaaag cgatctcgcc actgcgctgg cagccagccg taatattctc 240

gtcgtcgtac ccagccatgt ctttggtgaa gtgctgcgcc agattaaacc actgatgcgt 300

cctgatgcgc gtctggtgtg ggcgaccaaa gggctggaag cggaaaccgg acgtctgtta 360

caggacgtgg cgcgtgaggc cttaggcgat caaattccgc tggcggttat ctctggccca 420

acgtttgcga aagaactggc ggcaggttta ccgacagcta tttcgctggc ctcgaccgat 480

cagacctttg ccgatgatct ccagcagctg ctgcactgcg gcaaaagttt ccgcgtttac 540

agcaatccgg atttcattgg cgtgcagctt ggcggcgcgg tgaaaaacgt tattgccatt 600

ggtgcgggga tgtccgacgg tatcggtttt ggtgcgaatg cgcgtacggc gctgatcacc 660

cgtgggctgg ctgaaatgtc gcgtcttggt gcggcgctgg gtgccgaccc tgccaccttt 720

atgggcatgg cggggcttgg cgatctggtg cttacctgta ccgacaacca gtcgcgtaac 780

cgccgttttg gcatgatgct cggtcagggc atggatgtac aaagcgcgca ggagaagatt 840

ggtcaggtgg tggaaggcta ccgcaatacg aaagaagtcc gcgaactggc gcatcgcttc 900

ggcgttgaaa tgccaataac cgaggaaatt tatcaagtat tatattgcgg aaaaaacgcg 960

cgcgaggcag cattgacttt actaggtcgt gcacgcaagg acgagcgcag cagccactaa 1020

<210> 194

<211> 339

<212> PRT

<213> 大肠杆菌

<400> 194

Met Asn Gln Arg Asn Ala Ser Met Thr Val Ile Gly Ala Gly Ser Tyr

1 5 10 15

Gly Thr Ala Leu Ala Ile Thr Leu Ala Arg Asn Gly His Glu Val Val

20 25 30

Leu Trp Gly His Asp Pro Glu His Ile Ala Thr Leu Glu Arg Asp Arg

35 40 45

Cys Asn Ala Ala Phe Leu Pro Asp Val Pro Phe Pro Asp Thr Leu His

50 55 60

Leu Glu Ser Asp Leu Ala Thr Ala Leu Ala Ala Ser Arg Asn Ile Leu

65 70 75 80

Val Val Val Pro Ser His Val Phe Gly Glu Val Leu Arg Gln Ile Lys

85 90 95

Pro Leu Met Arg Pro Asp Ala Arg Leu Val Trp Ala Thr Lys Gly Leu

100 105 110

Glu Ala Glu Thr Gly Arg Leu Leu Gln Asp Val Ala Arg Glu Ala Leu

115 120 125

Gly Asp Gln Ile Pro Leu Ala Val Ile Ser Gly Pro Thr Phe Ala Lys

130 135 140

Glu Leu Ala Ala Gly Leu Pro Thr Ala Ile Ser Leu Ala Ser Thr Asp

145 150 155 160

Gln Thr Phe Ala Asp Asp Leu Gln Gln Leu Leu His Cys Gly Lys Ser

165 170 175

Phe Arg Val Tyr Ser Asn Pro Asp Phe Ile Gly Val Gln Leu Gly Gly

180 185 190

Ala Val Lys Asn Val Ile Ala Ile Gly Ala Gly Met Ser Asp Gly Ile

195 200 205

Gly Phe Gly Ala Asn Ala Arg Thr Ala Leu Ile Thr Arg Gly Leu Ala

210 215 220

Glu Met Ser Arg Leu Gly Ala Ala Leu Gly Ala Asp Pro Ala Thr Phe

225 230 235 240

Met Gly Met Ala Gly Leu Gly Asp Leu Val Leu Thr Cys Thr Asp Asn

245 250 255

Gln Ser Arg Asn Arg Arg Phe Gly Met Met Leu Gly Gln Gly Met Asp

260 265 270

Val Gln Ser Ala Gln Glu Lys Ile Gly Gln Val Val Glu Gly Tyr Arg

275 280 285

Asn Thr Lys Glu Val Arg Glu Leu Ala His Arg Phe Gly Val Glu Met

290 295 300

Pro Ile Thr Glu Glu Ile Tyr Gln Val Leu Tyr Cys Gly Lys Asn Ala

305 310 315 320

Arg Glu Ala Ala Leu Thr Leu Leu Gly Arg Ala Arg Lys Asp Glu Arg

325 330 335

Ser Ser His

<210> 195

<211> 1176

<212> DNA

<213> 酿酒酵母

<400> 195

atgtctgctg ctgctgatag attaaactta acttccggcc acttgaatgc tggtagaaag 60

agaagttcct cttctgtttc tttgaaggct gccgaaaagc ctttcaaggt tactgtgatt 120

ggatctggta actggggtac tactattgcc aaggtggttg ccgaaaattg taagggatac 180

ccagaagttt tcgctccaat agtacaaatg tgggtgttcg aagaagagat caatggtgaa 240

aaattgactg aaatcataaa tactagacat caaaacgtga aatacttgcc tggcatcact 300

ctacccgaca atttggttgc taatccagac ttgattgatt cagtcaagga tgtcgacatc 360

atcgttttca acattccaca tcaatttttg ccccgtatct gtagccaatt gaaaggtcat 420

gttgattcac acgtcagagc tatctcctgt ctaaagggtt ttgaagttgg tgctaaaggt 480

gtccaattgc tatcctctta catcactgag gaactaggta ttcaatgtgg tgctctatct 540

ggtgctaaca ttgccaccga agtcgctcaa gaacactggt ctgaaacaac agttgcttac 600

cacattccaa aggatttcag aggcgagggc aaggacgtcg accataaggt tctaaaggcc 660

ttgttccaca gaccttactt ccacgttagt gtcatcgaag atgttgctgg tatctccatc 720

tgtggtgctt tgaagaacgt tgttgcctta ggttgtggtt tcgtcgaagg tctaggctgg 780

ggtaacaacg cttctgctgc catccaaaga gtcggtttgg gtgagatcat cagattcggt 840

caaatgtttt tcccagaatc tagagaagaa acatactacc aagagtctgc tggtgttgct 900

gatttgatca ccacctgcgc tggtggtaga aacgtcaagg ttgctaggct aatggctact 960

tctggtaagg acgcctggga atgtgaaaag gagttgttga atggccaatc cgctcaaggt 1020

ttaattacct gcaaagaagt tcacgaatgg ttggaaacat gtggctctgt cgaagacttc 1080

ccattatttg aagccgtata ccaaatcgtt tacaacaact acccaatgaa gaacctgccg 1140

gacatgattg aagaattaga tctacatgaa gattag 1176

<210> 196

<211> 391

<212> PRT

<213> 酿酒酵母

<400> 196

Met Ser Ala Ala Ala Asp Arg Leu Asn Leu Thr Ser Gly His Leu Asn

1 5 10 15

Ala Gly Arg Lys Arg Ser Ser Ser Ser Val Ser Leu Lys Ala Ala Glu

20 25 30

Lys Pro Phe Lys Val Thr Val Ile Gly Ser Gly Asn Trp Gly Thr Thr

35 40 45

Ile Ala Lys Val Val Ala Glu Asn Cys Lys Gly Tyr Pro Glu Val Phe

50 55 60

Ala Pro Ile Val Gln Met Trp Val Phe Glu Glu Glu Ile Asn Gly Glu

65 70 75 80

Lys Leu Thr Glu Ile Ile Asn Thr Arg His Gln Asn Val Lys Tyr Leu

85 90 95

Pro Gly Ile Thr Leu Pro Asp Asn Leu Val Ala Asn Pro Asp Leu Ile

100 105 110

Asp Ser Val Lys Asp Val Asp Ile Ile Val Phe Asn Ile Pro His Gln

115 120 125

Phe Leu Pro Arg Ile Cys Ser Gln Leu Lys Gly His Val Asp Ser His

130 135 140

Val Arg Ala Ile Ser Cys Leu Lys Gly Phe Glu Val Gly Ala Lys Gly

145 150 155 160

Val Gln Leu Leu Ser Ser Tyr Ile Thr Glu Glu Leu Gly Ile Gln Cys

165 170 175

Gly Ala Leu Ser Gly Ala Asn Ile Ala Thr Glu Val Ala Gln Glu His

180 185 190

Trp Ser Glu Thr Thr Val Ala Tyr His Ile Pro Lys Asp Phe Arg Gly

195 200 205

Glu Gly Lys Asp Val Asp His Lys Val Leu Lys Ala Leu Phe His Arg

210 215 220

Pro Tyr Phe His Val Ser Val Ile Glu Asp Val Ala Gly Ile Ser Ile

225 230 235 240

Cys Gly Ala Leu Lys Asn Val Val Ala Leu Gly Cys Gly Phe Val Glu

245 250 255

Gly Leu Gly Trp Gly Asn Asn Ala Ser Ala Ala Ile Gln Arg Val Gly

260 265 270

Leu Gly Glu Ile Ile Arg Phe Gly Gln Met Phe Phe Pro Glu Ser Arg

275 280 285

Glu Glu Thr Tyr Tyr Gln Glu Ser Ala Gly Val Ala Asp Leu Ile Thr

290 295 300

Thr Cys Ala Gly Gly Arg Asn Val Lys Val Ala Arg Leu Met Ala Thr

305 310 315 320

Ser Gly Lys Asp Ala Trp Glu Cys Glu Lys Glu Leu Leu Asn Gly Gln

325 330 335

Ser Ala Gln Gly Leu Ile Thr Cys Lys Glu Val His Glu Trp Leu Glu

340 345 350

Thr Cys Gly Ser Val Glu Asp Phe Pro Leu Phe Glu Ala Val Tyr Gln

355 360 365

Ile Val Tyr Asn Asn Tyr Pro Met Lys Asn Leu Pro Asp Met Ile Glu

370 375 380

Glu Leu Asp Leu His Glu Asp

385 390

<210> 197

<211> 1224

<212> DNA

<213> 大肠杆菌

<400> 197

atgaaacgtg catttattat ggtgctggac tcattcggca tcggcgctac agaagatgca 60

gaacgctttg gtgacgtcgg ggctgacacc ctgggtcata tcgcagaagc ttgtgccaaa 120

ggcgaagctg ataacggtcg taaaggcccg ctcaatctgc caaatctgac ccgtctgggg 180

ctggcgaaag cacacgaagg ttctaccggt ttcattccgg cgggaatgga cggcaacgct 240

gaagttatcg gcgcgtacgc atgggcgcac gaaatgtcat ccggtaaaga taccccgtct 300

ggtcactggg aaattgccgg tgtcccggtt ctgtttgagt ggggatattt ctccgatcac 360

gaaaacagct tcccgcaaga gctgctggat aaactggtcg aacgcgctaa tctgccgggt 420

tacctcggta actgccactc ttccggtacg gtcattctgg atcaactggg cgaagagcac 480

atgaaaaccg gcaagccgat tttctatacc tccgctgact ccgtgttcca gattgcctgc 540

catgaagaaa ctttcggtct ggataaactc tacgaactgt gcgaaatcgc ccgtgaagag 600

ctgaccaacg gcggctacaa tatcggtcgt gttatcgctc gtccgtttat cggcgacaaa 660

gccggtaact tccagcgtac cggtaaccgt cacgacctgg ctgttgagcc gccagcaccg 720

accgtgctgc agaaactggt tgatgaaaaa cacggccagg tggtttctgt cggtaaaatt 780

gcggacatct acgccaactg cggtatcacc aaaaaagtga aagcgactgg cctggacgcg 840

ctgtttgacg ccaccatcaa agagatgaaa gaagcgggtg ataacaccat cgtcttcacc 900

aacttcgttg acttcgactc ttcctggggc caccgtcgcg acgtcgccgg ttatgccgcg 960

ggtctggaac tgttcgaccg ccgtctgccg gagctgatgt ctctgctgcg cgatgacgac 1020

atcctgatcc tcaccgctga ccacggttgc gatccgacct ggaccggtac tgaccacacg 1080

cgtgaacaca ttccggtact ggtatatggc ccgaaagtaa aaccgggctc actgggtcat 1140

cgtgaaacct tcgcggatat cggccagact ctggcaaaat attttggtac ttctgatatg 1200

gaatatggca aagccatgtt ctga 1224

<210> 198

<211> 407

<212> PRT

<213> 大肠杆菌

<400> 198

Met Lys Arg Ala Phe Ile Met Val Leu Asp Ser Phe Gly Ile Gly Ala

1 5 10 15

Thr Glu Asp Ala Glu Arg Phe Gly Asp Val Gly Ala Asp Thr Leu Gly

20 25 30

His Ile Ala Glu Ala Cys Ala Lys Gly Glu Ala Asp Asn Gly Arg Lys

35 40 45

Gly Pro Leu Asn Leu Pro Asn Leu Thr Arg Leu Gly Leu Ala Lys Ala

50 55 60

His Glu Gly Ser Thr Gly Phe Ile Pro Ala Gly Met Asp Gly Asn Ala

65 70 75 80

Glu Val Ile Gly Ala Tyr Ala Trp Ala His Glu Met Ser Ser Gly Lys

85 90 95

Asp Thr Pro Ser Gly His Trp Glu Ile Ala Gly Val Pro Val Leu Phe

100 105 110

Glu Trp Gly Tyr Phe Ser Asp His Glu Asn Ser Phe Pro Gln Glu Leu

115 120 125

Leu Asp Lys Leu Val Glu Arg Ala Asn Leu Pro Gly Tyr Leu Gly Asn

130 135 140

Cys His Ser Ser Gly Thr Val Ile Leu Asp Gln Leu Gly Glu Glu His

145 150 155 160

Met Lys Thr Gly Lys Pro Ile Phe Tyr Thr Ser Ala Asp Ser Val Phe

165 170 175

Gln Ile Ala Cys His Glu Glu Thr Phe Gly Leu Asp Lys Leu Tyr Glu

180 185 190

Leu Cys Glu Ile Ala Arg Glu Glu Leu Thr Asn Gly Gly Tyr Asn Ile

195 200 205

Gly Arg Val Ile Ala Arg Pro Phe Ile Gly Asp Lys Ala Gly Asn Phe

210 215 220

Gln Arg Thr Gly Asn Arg His Asp Leu Ala Val Glu Pro Pro Ala Pro

225 230 235 240

Thr Val Leu Gln Lys Leu Val Asp Glu Lys His Gly Gln Val Val Ser

245 250 255

Val Gly Lys Ile Ala Asp Ile Tyr Ala Asn Cys Gly Ile Thr Lys Lys

260 265 270

Val Lys Ala Thr Gly Leu Asp Ala Leu Phe Asp Ala Thr Ile Lys Glu

275 280 285

Met Lys Glu Ala Gly Asp Asn Thr Ile Val Phe Thr Asn Phe Val Asp

290 295 300

Phe Asp Ser Ser Trp Gly His Arg Arg Asp Val Ala Gly Tyr Ala Ala

305 310 315 320

Gly Leu Glu Leu Phe Asp Arg Arg Leu Pro Glu Leu Met Ser Leu Leu

325 330 335

Arg Asp Asp Asp Ile Leu Ile Leu Thr Ala Asp His Gly Cys Asp Pro

340 345 350

Thr Trp Thr Gly Thr Asp His Thr Arg Glu His Ile Pro Val Leu Val

355 360 365

Tyr Gly Pro Lys Val Lys Pro Gly Ser Leu Gly His Arg Glu Thr Phe

370 375 380

Ala Asp Ile Gly Gln Thr Leu Ala Lys Tyr Phe Gly Thr Ser Asp Met

385 390 395 400

Glu Tyr Gly Lys Ala Met Phe

405

<210> 199

<211> 1641

<212> DNA

<213> 大肠杆菌

<400> 199

atggcaatcc acaatcgtgc aggccaacct gcacaacaga gtgatttgat taacgtcgcc 60

caactgacgg cgcaatatta tgtactgaaa ccagaagcag ggaatgcgga gcacgcggtg 120

aaattcggta cttccggtca ccgtggcagt gcagcgcgcc acagctttaa cgagccgcac 180

attctggcga tcgctcaggc aattgctgaa gaacgtgcga aaaacggcat cactggccct 240

tgctatgtgg gtaaagatac tcacgccctg tccgaacctg cattcatttc cgttctggaa 300

gtgctggcag cgaacggcgt tgatgtcatt gtgcaggaaa acaatggctt caccccgacg 360

cctgccgttt ccaatgccat cctggttcac aataaaaaag gtggcccgct ggcagacggt 420

atcgtgatta caccgtccca taacccgccg gaagatggtg gaatcaaata caatccgcca 480

aatggtggcc cggctgatac caacgtcact aaagtggtgg aagacagggc caacgcactg 540

ctggccgatg gcctgaaagg cgtgaagcgt atctccctcg acgaagcgat ggcatccggt 600

catgtgaaag agcaggatct ggtgcagccg ttcgtggaag gtctggccga tatcgttgat 660

atggccgcga ttcagaaagc gggcctgacg ctgggcgttg atccgctggg cggttccggt 720

atcgaatact ggaagcgtat tggcgagtat tacaacctca acctgactat cgttaacgat 780

caggtcgatc aaaccttccg ctttatgcac cttgataaag acggcgcgat ccgtatggac 840

tgctcctccg agtgtgcgat ggcgggcctg ctggcactgc gtgataagtt cgatctggcg 900

tttgctaacg acccggatta tgaccgtcac ggtatcgtca ctccggcagg tttgatgaat 960

ccgaaccact acctggcggt ggcaatcaat tacctgttcc agcatcgtcc gcagtggggc 1020

aaagatgttg ccgtcggtaa aacgctggtt tcatctgcga tgatcgaccg tgtggtcaac 1080

gacttgggcc gtaaactggt agaagtcccg gtaggtttca aatggtttgt cgatggtctg 1140

ttcgacggca gcttcggctt tggcggcgaa gagagtgcag gggcttcctt cctgcgtttc 1200

gacggcacgc cgtggtccac cgacaaagac ggcatcatca tgtgtctgct ggcggcggaa 1260

atcaccgctg tcaccggtaa gaacccgcag gaacactaca acgaactggc aaaacgcttt 1320

ggtgcgccga gctacaaccg tttgcaggca gctgcgactt ccgcacaaaa agcggcgctg 1380

tctaagctgt ctccggaaat ggtgagcgcc agcaccctgg caggtgaccc gatcaccgcg 1440

cgcctgactg ctgctccggg caacggtgct tctattggcg gtctgaaagt gatgactgac 1500

aacggctggt tcgccgcgcg tccgtcaggc acggaagacg catataagat ctactgcgaa 1560

agcttcctcg gtgaagaaca tcgcaagcag attgagaaag aagcggttga gattgttagc 1620

gaagttctga aaaacgcgta a 1641

<210> 200

<211> 546

<212> PRT

<213> 大肠杆菌

<400> 200

Met Ala Ile His Asn Arg Ala Gly Gln Pro Ala Gln Gln Ser Asp Leu

1 5 10 15

Ile Asn Val Ala Gln Leu Thr Ala Gln Tyr Tyr Val Leu Lys Pro Glu

20 25 30

Ala Gly Asn Ala Glu His Ala Val Lys Phe Gly Thr Ser Gly His Arg

35 40 45

Gly Ser Ala Ala Arg His Ser Phe Asn Glu Pro His Ile Leu Ala Ile

50 55 60

Ala Gln Ala Ile Ala Glu Glu Arg Ala Lys Asn Gly Ile Thr Gly Pro

65 70 75 80

Cys Tyr Val Gly Lys Asp Thr His Ala Leu Ser Glu Pro Ala Phe Ile

85 90 95

Ser Val Leu Glu Val Leu Ala Ala Asn Gly Val Asp Val Ile Val Gln

100 105 110

Glu Asn Asn Gly Phe Thr Pro Thr Pro Ala Val Ser Asn Ala Ile Leu

115 120 125

Val His Asn Lys Lys Gly Gly Pro Leu Ala Asp Gly Ile Val Ile Thr

130 135 140

Pro Ser His Asn Pro Pro Glu Asp Gly Gly Ile Lys Tyr Asn Pro Pro

145 150 155 160

Asn Gly Gly Pro Ala Asp Thr Asn Val Thr Lys Val Val Glu Asp Arg

165 170 175

Ala Asn Ala Leu Leu Ala Asp Gly Leu Lys Gly Val Lys Arg Ile Ser

180 185 190

Leu Asp Glu Ala Met Ala Ser Gly His Val Lys Glu Gln Asp Leu Val

195 200 205

Gln Pro Phe Val Glu Gly Leu Ala Asp Ile Val Asp Met Ala Ala Ile

210 215 220

Gln Lys Ala Gly Leu Thr Leu Gly Val Asp Pro Leu Gly Gly Ser Gly

225 230 235 240

Ile Glu Tyr Trp Lys Arg Ile Gly Glu Tyr Tyr Asn Leu Asn Leu Thr

245 250 255

Ile Val Asn Asp Gln Val Asp Gln Thr Phe Arg Phe Met His Leu Asp

260 265 270

Lys Asp Gly Ala Ile Arg Met Asp Cys Ser Ser Glu Cys Ala Met Ala

275 280 285

Gly Leu Leu Ala Leu Arg Asp Lys Phe Asp Leu Ala Phe Ala Asn Asp

290 295 300

Pro Asp Tyr Asp Arg His Gly Ile Val Thr Pro Ala Gly Leu Met Asn

305 310 315 320

Pro Asn His Tyr Leu Ala Val Ala Ile Asn Tyr Leu Phe Gln His Arg

325 330 335

Pro Gln Trp Gly Lys Asp Val Ala Val Gly Lys Thr Leu Val Ser Ser

340 345 350

Ala Met Ile Asp Arg Val Val Asn Asp Leu Gly Arg Lys Leu Val Glu

355 360 365

Val Pro Val Gly Phe Lys Trp Phe Val Asp Gly Leu Phe Asp Gly Ser

370 375 380

Phe Gly Phe Gly Gly Glu Glu Ser Ala Gly Ala Ser Phe Leu Arg Phe

385 390 395 400

Asp Gly Thr Pro Trp Ser Thr Asp Lys Asp Gly Ile Ile Met Cys Leu

405 410 415

Leu Ala Ala Glu Ile Thr Ala Val Thr Gly Lys Asn Pro Gln Glu His

420 425 430

Tyr Asn Glu Leu Ala Lys Arg Phe Gly Ala Pro Ser Tyr Asn Arg Leu

435 440 445

Gln Ala Ala Ala Thr Ser Ala Gln Lys Ala Ala Leu Ser Lys Leu Ser

450 455 460

Pro Glu Met Val Ser Ala Ser Thr Leu Ala Gly Asp Pro Ile Thr Ala

465 470 475 480

Arg Leu Thr Ala Ala Pro Gly Asn Gly Ala Ser Ile Gly Gly Leu Lys

485 490 495

Val Met Thr Asp Asn Gly Trp Phe Ala Ala Arg Pro Ser Gly Thr Glu

500 505 510

Asp Ala Tyr Lys Ile Tyr Cys Glu Ser Phe Leu Gly Glu Glu His Arg

515 520 525

Lys Gln Ile Glu Lys Glu Ala Val Glu Ile Val Ser Glu Val Leu Lys

530 535 540

Asn Ala

545

<210> 201

<211> 1746

<212> DNA

<213> 枯草芽孢杆菌

<400> 201

atgacttgga gaaagagcta tgaacgctgg aaacagacag aacatttaga tctggaatta 60

aaagagcgcc ttattgaatt agagggagat gaacaggccc ttgaggactg tttctataaa 120

gaccttgaat tcggtaccgg cggaatgcgc ggggaaatcg gcgccgggac aaatcggatg 180

aatatttaca ctgtgcgcaa agcatcggcc gggtttgcgg catacatctc gaagcaaggt 240

gaggaagcga aaaaacgggg cgttgtcatt gcttatgatt cccgccataa gtctccggag 300

ttcgcgatgg aagcggcaaa aacacttgcg acacaaggca tccaaacata cgtgtttgat 360

gagcttcgcc cgacgccaga gctgtcattc gctgttagac agctgaacgc ttatggtgga 420

attgtggtaa cggcaagcca taacccgcct gaatataacg gctacaaagt atacggggat 480

gatggcggcc agctgcctcc aaaggaagcg gacatcgtca ttgagcaggt aaacgcgatt 540

gaaaatgagc tgacgatcac agtggacgaa gaaaataagt taaaagaaaa aggcttaatc 600

aaaatcatcg gtgaagatat tgataaagtt tatacagaaa aactgacgtc catttctgta 660

catcctgaat tatcggaaga agtagatgta aaggttgttt tcacaccgct gcatggaact 720

gcaaataaac cggtcagacg cggtcttgaa gcactcggct acaaaaatgt aacggttgtc 780

aaagaacagg aactgccgga ttcaaacttc tccactgtta catcgccgaa cccggaagag 840

catgcggcat tcgaatatgc cattaagctt ggggaggagc agaatgcaga tattctcatc 900

gcgacagatc ctgatgctga ccgcctcggc atcgcggtga aaaacgatca aggcaaatat 960

acagtgctga caggaaacca aaccggagcg ttgctgcttc attacctgct ttctgaaaag 1020

aaaaaacaag gcatcctgcc tgataacggt gttgttctca aaacgatcgt cacaagcgaa 1080

atcggccgtg ctgtagcttc ttcattcggc cttgatacga ttgatacgct gacaggcttt 1140

aagtttatcg gtgaaaagat taaggaatac gaagcatcag gccagtatac cttccaattc 1200

ggttatgaag agagctacgg ttatttaatc ggggattttg cccgcgataa ggacgccatt 1260

caggctgcgc ttttggcagt tgaagtttgc gcgttctata aaaaacaggg aatgtcattg 1320

tatgaggcgc tcatcaatct ctttaacgaa tatggttttt atcgtgaagg gctgaaatcc 1380

ctgacgctga aaggcaaaca aggagcagag caaattgaag cgattcttgc ttccttcaga 1440

caaaatccgc cgcagaaaat ggcgggcaaa caggttgtca cagcagaaga ttacgctgta 1500

agcaaacgga cgcttctgac tgaaagcaaa gaagaagcca tcgacttgcc aaaatcaaat 1560

gtattgaaat acttcctgga agacgggtct tggttctgtc tccgtccttc tggaactgag 1620

ccgaaggtta aattttattt cgccgtaaaa gggtcatctt tggaagacag tgaaaagcga 1680

cttgccgtcc tttctgaaga tgtaatgaag acggtggatg aaattgttga gtcaacagca 1740

aaataa 1746

<210> 202

<211> 581

<212> PRT

<213> 枯草芽孢杆菌

<400> 202

Met Thr Trp Arg Lys Ser Tyr Glu Arg Trp Lys Gln Thr Glu His Leu

1 5 10 15

Asp Leu Glu Leu Lys Glu Arg Leu Ile Glu Leu Glu Gly Asp Glu Gln

20 25 30

Ala Leu Glu Asp Cys Phe Tyr Lys Asp Leu Glu Phe Gly Thr Gly Gly

35 40 45

Met Arg Gly Glu Ile Gly Ala Gly Thr Asn Arg Met Asn Ile Tyr Thr

50 55 60

Val Arg Lys Ala Ser Ala Gly Phe Ala Ala Tyr Ile Ser Lys Gln Gly

65 70 75 80

Glu Glu Ala Lys Lys Arg Gly Val Val Ile Ala Tyr Asp Ser Arg His

85 90 95

Lys Ser Pro Glu Phe Ala Met Glu Ala Ala Lys Thr Leu Ala Thr Gln

100 105 110

Gly Ile Gln Thr Tyr Val Phe Asp Glu Leu Arg Pro Thr Pro Glu Leu

115 120 125

Ser Phe Ala Val Arg Gln Leu Asn Ala Tyr Gly Gly Ile Val Val Thr

130 135 140

Ala Ser His Asn Pro Pro Glu Tyr Asn Gly Tyr Lys Val Tyr Gly Asp

145 150 155 160

Asp Gly Gly Gln Leu Pro Pro Lys Glu Ala Asp Ile Val Ile Glu Gln

165 170 175

Val Asn Ala Ile Glu Asn Glu Leu Thr Ile Thr Val Asp Glu Glu Asn

180 185 190

Lys Leu Lys Glu Lys Gly Leu Ile Lys Ile Ile Gly Glu Asp Ile Asp

195 200 205

Lys Val Tyr Thr Glu Lys Leu Thr Ser Ile Ser Val His Pro Glu Leu

210 215 220

Ser Glu Glu Val Asp Val Lys Val Val Phe Thr Pro Leu His Gly Thr

225 230 235 240

Ala Asn Lys Pro Val Arg Arg Gly Leu Glu Ala Leu Gly Tyr Lys Asn

245 250 255

Val Thr Val Val Lys Glu Gln Glu Leu Pro Asp Ser Asn Phe Ser Thr

260 265 270

Val Thr Ser Pro Asn Pro Glu Glu His Ala Ala Phe Glu Tyr Ala Ile

275 280 285

Lys Leu Gly Glu Glu Gln Asn Ala Asp Ile Leu Ile Ala Thr Asp Pro

290 295 300

Asp Ala Asp Arg Leu Gly Ile Ala Val Lys Asn Asp Gln Gly Lys Tyr

305 310 315 320

Thr Val Leu Thr Gly Asn Gln Thr Gly Ala Leu Leu Leu His Tyr Leu

325 330 335

Leu Ser Glu Lys Lys Lys Gln Gly Ile Leu Pro Asp Asn Gly Val Val

340 345 350

Leu Lys Thr Ile Val Thr Ser Glu Ile Gly Arg Ala Val Ala Ser Ser

355 360 365

Phe Gly Leu Asp Thr Ile Asp Thr Leu Thr Gly Phe Lys Phe Ile Gly

370 375 380

Glu Lys Ile Lys Glu Tyr Glu Ala Ser Gly Gln Tyr Thr Phe Gln Phe

385 390 395 400

Gly Tyr Glu Glu Ser Tyr Gly Tyr Leu Ile Gly Asp Phe Ala Arg Asp

405 410 415

Lys Asp Ala Ile Gln Ala Ala Leu Leu Ala Val Glu Val Cys Ala Phe

420 425 430

Tyr Lys Lys Gln Gly Met Ser Leu Tyr Glu Ala Leu Ile Asn Leu Phe

435 440 445

Asn Glu Tyr Gly Phe Tyr Arg Glu Gly Leu Lys Ser Leu Thr Leu Lys

450 455 460

Gly Lys Gln Gly Ala Glu Gln Ile Glu Ala Ile Leu Ala Ser Phe Arg

465 470 475 480

Gln Asn Pro Pro Gln Lys Met Ala Gly Lys Gln Val Val Thr Ala Glu

485 490 495

Asp Tyr Ala Val Ser Lys Arg Thr Leu Leu Thr Glu Ser Lys Glu Glu

500 505 510

Ala Ile Asp Leu Pro Lys Ser Asn Val Leu Lys Tyr Phe Leu Glu Asp

515 520 525

Gly Ser Trp Phe Cys Leu Arg Pro Ser Gly Thr Glu Pro Lys Val Lys

530 535 540

Phe Tyr Phe Ala Val Lys Gly Ser Ser Leu Glu Asp Ser Glu Lys Arg

545 550 555 560

Leu Ala Val Leu Ser Glu Asp Val Met Lys Thr Val Asp Glu Ile Val

565 570 575

Glu Ser Thr Ala Lys

580

<210> 203

<211> 666

<212> DNA

<213> 乳酸乳球菌（Lactococcus lactis）

<400> 203

atgtttaaag cagtattgtt tgatttagat ggtgtaatta cagataccgc agagtatcat 60

tttagagctt ggaaagcttt ggctgaagaa attggcatta atggtgttga ccgccaattt 120

aatgagcaat taaaaggggt ctcacgagaa gactcgcttc agaaaattct agatttagct 180

gataaaaaag tatcagctga ggaatttaaa gaacttgcta agagaaaaaa tgataactat 240

gtgaaaatga ttcaggatgt gtcgccagcc gatgtctatc ctggaatttt acaattactc 300

aaagatttac gttcaaataa aatcaaaatt gctttagcat cggcttctaa gaatggtcca 360

tttttattag agaaaatgaa tttaactgga tattttgatg caattgctga tccggctgaa 420

gttgcagcat caaaaccagc accagatatt tttattgcag cagcacatgc agtgggtgtt 480

gccccctctg aatcaattgg gttagaggat tctcaagctg gaattcaagc catcaaagat 540

tcaggggctt taccaattgg tgtagggcgc ccagaagatt tgggagatga tatcgtcatt 600

gtgcctgata cttcatacta tacattagaa tttttgaaag aagtttggct tcaaaagcaa 660

aaatga 666

<210> 204

<211> 221

<212> PRT

<213> 乳酸乳球菌

<400> 204

Met Phe Lys Ala Val Leu Phe Asp Leu Asp Gly Val Ile Thr Asp Thr

1 5 10 15

Ala Glu Tyr His Phe Arg Ala Trp Lys Ala Leu Ala Glu Glu Ile Gly

20 25 30

Ile Asn Gly Val Asp Arg Gln Phe Asn Glu Gln Leu Lys Gly Val Ser

35 40 45

Arg Glu Asp Ser Leu Gln Lys Ile Leu Asp Leu Ala Asp Lys Lys Val

50 55 60

Ser Ala Glu Glu Phe Lys Glu Leu Ala Lys Arg Lys Asn Asp Asn Tyr

65 70 75 80

Val Lys Met Ile Gln Asp Val Ser Pro Ala Asp Val Tyr Pro Gly Ile

85 90 95

Leu Gln Leu Leu Lys Asp Leu Arg Ser Asn Lys Ile Lys Ile Ala Leu

100 105 110

Ala Ser Ala Ser Lys Asn Gly Pro Phe Leu Leu Glu Lys Met Asn Leu

115 120 125

Thr Gly Tyr Phe Asp Ala Ile Ala Asp Pro Ala Glu Val Ala Ala Ser

130 135 140

Lys Pro Ala Pro Asp Ile Phe Ile Ala Ala Ala His Ala Val Gly Val

145 150 155 160

Ala Pro Ser Glu Ser Ile Gly Leu Glu Asp Ser Gln Ala Gly Ile Gln

165 170 175

Ala Ile Lys Asp Ser Gly Ala Leu Pro Ile Gly Val Gly Arg Pro Glu

180 185 190

Asp Leu Gly Asp Asp Ile Val Ile Val Pro Asp Thr Ser Tyr Tyr Thr

195 200 205

Leu Glu Phe Leu Lys Glu Val Trp Leu Gln Lys Gln Lys

210 215 220

<210> 205

<211> 660

<212> DNA

<213> 大肠杆菌

<400> 205

atgaaactgc aaggggtaat tttcgatctg gatggtgtaa tcaccgatac cgcgcatctg 60

catttccagg cgtggcagca gattgccgct gaaattggca tcagcattga tgcgcagttt 120

aacgaatccc taaaagggat cagccgcgat gagtctctgc ggcgcattct gcaacacggg 180

ggcaaagagg gcgactttaa ctcgcaggag agggcgcaac tggcgtatcg caaaaatctg 240

ctctatgtcc actcactacg cgagttgacg gtcaacgctg ttctacccgg cattcgctct 300

ttgctggcag atctccgtgc acagcagatc tcggttgggc tggcttctgt ctccctgaat 360

gcgccgacga ttttagcggc gctggagctg cgcgagtttt tcaccttctg cgcggatgct 420

tcccaactta aaaactcgaa accggacccg gaaatctttc tcgccgcctg tgcagggctg 480

ggcgtgccgc cgcaggcatg tatcggcatt gaagatgcgc aggcgggcat tgacgccatt 540

aacgccagcg gtatgcgctc ggtggggatc ggcgcgggct taaccggggc gcaattactg 600

ttgccttcaa cggaatcact cacctggccg cggttatcgg ccttctggca aaacgtatag 660

<210> 206

<211> 219

<212> PRT

<213> 大肠杆菌

<400> 206

Met Lys Leu Gln Gly Val Ile Phe Asp Leu Asp Gly Val Ile Thr Asp

1 5 10 15

Thr Ala His Leu His Phe Gln Ala Trp Gln Gln Ile Ala Ala Glu Ile

20 25 30

Gly Ile Ser Ile Asp Ala Gln Phe Asn Glu Ser Leu Lys Gly Ile Ser

35 40 45

Arg Asp Glu Ser Leu Arg Arg Ile Leu Gln His Gly Gly Lys Glu Gly

50 55 60

Asp Phe Asn Ser Gln Glu Arg Ala Gln Leu Ala Tyr Arg Lys Asn Leu

65 70 75 80

Leu Tyr Val His Ser Leu Arg Glu Leu Thr Val Asn Ala Val Leu Pro

85 90 95

Gly Ile Arg Ser Leu Leu Ala Asp Leu Arg Ala Gln Gln Ile Ser Val

100 105 110

Gly Leu Ala Ser Val Ser Leu Asn Ala Pro Thr Ile Leu Ala Ala Leu

115 120 125

Glu Leu Arg Glu Phe Phe Thr Phe Cys Ala Asp Ala Ser Gln Leu Lys

130 135 140

Asn Ser Lys Pro Asp Pro Glu Ile Phe Leu Ala Ala Cys Ala Gly Leu

145 150 155 160

Gly Val Pro Pro Gln Ala Cys Ile Gly Ile Glu Asp Ala Gln Ala Gly

165 170 175

Ile Asp Ala Ile Asn Ala Ser Gly Met Arg Ser Val Gly Ile Gly Ala

180 185 190

Gly Leu Thr Gly Ala Gln Leu Leu Leu Pro Ser Thr Glu Ser Leu Thr

195 200 205

Trp Pro Arg Leu Ser Ala Phe Trp Gln Asn Val

210 215

<210> 207

<211> 1392

<212> DNA

<213> 铜绿假单胞菌

<400> 207

atgagcactg taaaagcacc gacgctgccc gccagcatct tccgcgccta cgacatccgt 60

cgcgtggtag gcgataccct caccgccgag accgcctact ggatcggtcg cgccatcggc 120

tcggaaagcc tcgcccgcgg cgaaccgtgc gtcgctgtcg gccgcgatgg ccgcctgtcc 180

ggtcccgagc tggtcaagca gctgatccag ggcctggtgg actgcggttg ccaggtcagc 240

gacgtgggca tggtgcctac cccggtgctg tactacgcgg ccaacgtgct cgagggcaag 300

tccggggtga tgctgaccgg cagccacaat ccgccggact acaacggctt caagatcgtg 360

gtcgccggcg agaccctggc caacgagcag atccaggccc tgcgcgagcg catcgagaaa 420

aacgacctgg catccggcgt cggcagcgta gagcaggtcg acatcctgcc gcgctacttc 480

aagcagatcc gcgacgacat cgccatggcc aagccgatga aggtggtggt cgactgcggc 540

aacggcgtgg ccggggtgat cgccccgcag ttgatcgagg ccctgggctg cagcgtgatc 600

ccgctgtact gcgaggtcga cggcaacttc ccgaaccacc atccggaccc gggcaagccg 660

gagaacctga aggacctgat cgccaaggtc aaggccgaga acgccgacct gggcctggcc 720

ttcgacggcg acggcgatcg cgtcggcgtg gtcaccaata ccggtaccat catctatccg 780

gaccgtctgc tgatgctgtt cgccaaggac gtggtctcgc gcaacccggg ggccgacatc 840

atcttcgacg tcaagtgcac ccgccgtctg atcgccctga tcagcggcta cggcggccgt 900

ccggtgatgt ggaagaccgg ccactcgctg atcaagaaga agatgaagga aaccggcgcc 960

ctgctggctg gcgagatgag cggccacgtg ttcttcaagg agcgctggtt cggcttcgac 1020

gatggcatct acagcgccgc ccgcctgctg gaaatcctca gccaggatca gcgtgacagc 1080

gagcacgtgt tctcggcctt cccgagcgac atttccaccc cggaaatcaa catcaccgtc 1140

accgaggaca gcaagttcgc catcatcgag gcgctgcaac gcgacgccca atggggcgaa 1200

ggcaacatca ccaccctcga cggcgtgcgg gtcgactacc ccaaaggctg gggcctggta 1260

cgcgcctcca acaccactcc cgtgctggtc ctgcgcttcg aagcggaccc cgaggaagag 1320

ctggagcgca tcaagaccgt cttccgtaac caactgaagg cagtggattc ctcgctgccc 1380

gtgcccttct ga 1392

<210> 208

<211> 463

<212> PRT

<213> 铜绿假单胞菌

<400> 208

Met Ser Thr Ala Lys Ala Pro Thr Leu Pro Ala Ser Ile Phe Arg Ala

1 5 10 15

Tyr Asp Ile Arg Gly Val Val Gly Asp Thr Leu Thr Ala Glu Thr Ala

20 25 30

Tyr Trp Ile Gly Arg Ala Ile Gly Ser Glu Ser Leu Ala Arg Gly Glu

35 40 45

Pro Cys Val Ala Val Gly Arg Asp Gly Arg Leu Ser Gly Pro Glu Leu

50 55 60

Val Lys Gln Leu Ile Gln Gly Leu Val Asp Cys Gly Cys Gln Val Ser

65 70 75 80

Asp Val Gly Met Val Pro Thr Pro Val Leu Tyr Tyr Ala Ala Asn Val

85 90 95

Leu Glu Gly Lys Ser Gly Val Met Leu Thr Gly Ser His Asn Pro Pro

100 105 110

Asp Tyr Asn Gly Phe Lys Ile Val Val Ala Gly Glu Thr Leu Ala Asn

115 120 125

Glu Gln Ile Gln Ala Leu Arg Glu Arg Ile Glu Lys Asn Asp Leu Ala

130 135 140

Ser Gly Val Gly Ser Val Glu Gln Val Asp Ile Leu Pro Arg Tyr Phe

145 150 155 160

Lys Gln Ile Arg Asp Asp Ile Ala Met Ala Lys Pro Met Lys Val Val

165 170 175

Val Asp Cys Gly Asn Gly Val Ala Gly Val Ile Ala Pro Gln Leu Ile

180 185 190

Glu Ala Leu Gly Cys Ser Val Ile Pro Leu Tyr Cys Glu Val Asp Gly

195 200 205

Asn Phe Pro Asn His His Pro Asp Pro Gly Lys Pro Glu Asn Leu Lys

210 215 220

Asp Leu Ile Ala Lys Val Lys Ala Glu Asn Ala Asp Leu Gly Leu Ala

225 230 235 240

Phe Asp Gly Asp Gly Asp Arg Val Gly Val Val Thr Asn Thr Gly Thr

245 250 255

Ile Ile Tyr Pro Asp Arg Leu Leu Met Leu Phe Ala Lys Asp Val Val

260 265 270

Ser Arg Asn Pro Gly Ala Asp Ile Ile Phe Asp Val Lys Cys Thr Arg

275 280 285

Arg Leu Ile Ala Leu Ile Ser Gly Tyr Gly Gly Arg Pro Val Met Trp

290 295 300

Lys Thr Gly His Ser Leu Ile Lys Lys Lys Met Lys Glu Thr Gly Ala

305 310 315 320

Leu Leu Ala Gly Glu Met Ser Gly His Val Phe Phe Lys Glu Arg Trp

325 330 335

Phe Gly Phe Asp Asp Gly Ile Tyr Ser Ala Ala Arg Leu Leu Glu Ile

340 345 350

Leu Ser Gln Asp Gln Arg Asp Ser Glu His Val Phe Ser Ala Phe Pro

355 360 365

Ser Asp Ile Ser Thr Pro Glu Ile Asn Ile Thr Val Thr Glu Asp Ser

370 375 380

Lys Phe Ala Ile Ile Glu Ala Leu Gln Arg Asp Ala Gln Trp Gly Glu

385 390 395 400

Gly Asn Ile Thr Thr Leu Asp Gly Val Arg Val Asp Tyr Pro Lys Gly

405 410 415

Trp Gly Leu Val Arg Ala Ser Asn Thr Thr Pro Val Leu Val Leu Arg

420 425 430

Phe Glu Ala Asp Thr Glu Glu Glu Leu Glu Arg Ile Lys Thr Val Phe

435 440 445

Arg Asn Gln Leu Lys Ala Val Asp Ser Ser Leu Pro Val Pro Phe

450 455 460

<210> 209

<211> 1371

<212> DNA

<213> 大肠杆菌

<400> 209

atgaaaaaat taacctgctt taaagcctat gatattcgcg ggaaattagg cgaagaactg 60

aatgaagata tcgcctggcg cattggtcgc gcctatggcg aatttctcaa accgaaaacc 120

attgtgttag gcggtgatgt ccgcctcacc agcgaaacct taaaactggc gctggcgaaa 180

ggtttacagg atgcgggcgt tgacgtgctg gatattggta tgtccggcac cgaagagatc 240

tatttcgcca cgttccatct cggcgtggat ggcggcattg aagttaccgc cagccataat 300

ccgatggatt ataacggcat gaagctggtt cgcgaggggg ctcgcccgat cagcggagat 360

accggactgc gcgacgtcca gcgtctggct gaagccaacg actttcctcc cgtcgatgaa 420

accaaacgcg gtcgctatca gcaaatcaac ctgcgtgacg cttacgttga tcacctgttc 480

ggttatatca atgtcaaaaa cctcacgccg ctcaagctgg tgatcaactc cgggaacggc 540

gcagcgggtc cggtggtgga cgccattgaa gcccgcttta aagccctcgg cgcgcccgtg 600

gaattaatca aagtgcacaa cacgccggac ggcaatttcc ccaacggtat tcctaaccca 660

ctactgccgg aatgccgcga cgacacccgc aatgcggtca tcaaacacgg cgcggatatg 720

ggcattgctt ttgatggcga ttttgaccgc tgtttcctgt ttgacgaaaa agggcagttt 780

attgagggct actacattgt cggcctgttg gcagaagcat tcctcgaaaa aaatcccggc 840

gcgaagatca tccacgatcc acgtctctcc tggaacaccg ttgatgtggt gactgccgca 900

ggtggcacgc cggtaatgtc gaaaaccgga cacgccttta ttaaagaacg tatgcgcaag 960

gaagacgcca tctatggtgg cgaaatgagc gcccaccatt acttccgtga tttcgcttac 1020

tgcgacagcg gcatgatccc gtggctgctg gtcgccgaac tggtgtgcct gaaagataaa 1080

acgctgggcg aactggtacg cgaccggatg gcggcgtttc cggcaagcgg tgagatcaac 1140

agcaaactgg cgcaacccgt tgaggcgatt aaccgcgtgg aacagcattt tagccgtgag 1200

gcgctggcgg tggatcgcac cgatggcatc agcatgacct ttgccgactg gcgctttaac 1260

ctgcgcacct ccaataccga accggtggtg cgcctgaatg tggaatcgcg cggtgatgtg 1320

ccgctgatgg aagcgcgaac gcgaactctg ctgacgttgc tgaacgagta a 1371

<210> 210

<211> 456

<212> PRT

<213> 大肠杆菌

<400> 210

Met Lys Lys Leu Thr Cys Phe Lys Ala Tyr Asp Ile Arg Gly Lys Leu

1 5 10 15

Gly Glu Glu Leu Asn Glu Asp Ile Ala Trp Arg Ile Gly Arg Ala Tyr

20 25 30

Gly Glu Phe Leu Lys Pro Lys Thr Ile Val Leu Gly Gly Asp Val Arg

35 40 45

Leu Thr Ser Glu Thr Leu Lys Leu Ala Leu Ala Lys Gly Leu Gln Asp

50 55 60

Ala Gly Val Asp Val Leu Asp Ile Gly Met Ser Gly Thr Glu Glu Ile

65 70 75 80

Tyr Phe Ala Thr Phe His Leu Gly Val Asp Gly Gly Ile Glu Val Thr

85 90 95

Ala Ser His Asn Pro Met Asp Tyr Asn Gly Met Lys Leu Val Arg Glu

100 105 110

Gly Ala Arg Pro Ile Ser Gly Asp Thr Gly Leu Arg Asp Val Gln Arg

115 120 125

Leu Ala Glu Ala Asn Asp Phe Pro Pro Val Asp Glu Thr Lys Arg Gly

130 135 140

Arg Tyr Gln Gln Ile Asn Leu Arg Asp Ala Tyr Val Asp His Leu Phe

145 150 155 160

Gly Tyr Ile Asn Val Lys Asn Leu Thr Pro Leu Lys Leu Val Ile Asn

165 170 175

Ser Gly Asn Gly Ala Ala Gly Pro Val Val Asp Ala Ile Glu Ala Arg

180 185 190

Phe Lys Ala Leu Gly Ala Pro Val Glu Leu Ile Lys Val His Asn Thr

195 200 205

Pro Asp Gly Asn Phe Pro Asn Gly Ile Pro Asn Pro Leu Leu Pro Glu

210 215 220

Cys Arg Asp Asp Thr Arg Asn Ala Val Ile Lys His Gly Ala Asp Met

225 230 235 240

Gly Ile Ala Phe Asp Gly Asp Phe Asp Arg Cys Phe Leu Phe Asp Glu

245 250 255

Lys Gly Gln Phe Ile Glu Gly Tyr Tyr Ile Val Gly Leu Leu Ala Glu

260 265 270

Ala Phe Leu Glu Lys Asn Pro Gly Ala Lys Ile Ile His Asp Pro Arg

275 280 285

Leu Ser Trp Asn Thr Val Asp Val Val Thr Ala Ala Gly Gly Thr Pro

290 295 300

Val Met Ser Lys Thr Gly His Ala Phe Ile Lys Glu Arg Met Arg Lys

305 310 315 320

Glu Asp Ala Ile Tyr Gly Gly Glu Met Ser Ala His His Tyr Phe Arg

325 330 335

Asp Phe Ala Tyr Cys Asp Ser Gly Met Ile Pro Trp Leu Leu Val Ala

340 345 350

Glu Leu Val Cys Leu Lys Asp Lys Thr Leu Gly Glu Leu Val Arg Asp

355 360 365

Arg Met Ala Ala Phe Pro Ala Ser Gly Glu Ile Asn Ser Lys Leu Ala

370 375 380

Gln Pro Val Glu Ala Ile Asn Arg Val Glu Gln His Phe Ser Arg Glu

385 390 395 400

Ala Leu Ala Val Asp Arg Thr Asp Gly Ile Ser Met Thr Phe Ala Asp

405 410 415

Trp Arg Phe Asn Leu Arg Thr Ser Asn Thr Glu Pro Val Val Arg Leu

420 425 430

Asn Val Glu Ser Arg Gly Asp Val Pro Leu Met Glu Ala Arg Thr Arg

435 440 445

Thr Leu Leu Thr Leu Leu Asn Glu

450 455

<210> 211

<211> 2478

<212> DNA

<213> 齿双歧杆菌（Bifidobacterium dentium）

<400> 211

atgacgagtc ctgttattgg caccccttgg aagaagctga acgctccggt ttccgaggaa 60

gctatcgaag gtgtggataa gtactggcgt gcagccaact acctctccat cggccagatc 120

tatctgcgta gcaacccgct gatgaaggag cccttcaccc gcgaagacgt caagcaccgt 180

ctggtcggcc actggggcac caccccgggc ctgaacttcc tcatcggcca catcaaccgt 240

ctcatcgctg atcaccagca gaacaccgtg atcatcatgg gcccgggcca cggcggcccg 300

gctggtaccg ctcagtccta cctggacggc acctacaccg agtacttccc gaacatcacc 360

aaggatgaag ctggcctgca gaagttcttc cgccagttct cctacccggg cggcatcccg 420

tcccactacg ctccggagac cccgggctcc atccacgaag gtggcgagct gggttacgcc 480

ctgtcccacg cctatggcgc tgtgatgaac aacccgagcc tgttcgttcc ggccatcgtc 540

ggcgacggcg aagccgagac cggcccgctg gccaccggct ggcagtccaa caagctcgtc 600

aacccgcgca ccgacggtat cgtgctgccg atcctgcacc tcaatggcta caagatcgcc 660

aacccgacca tcctgtcccg catctccgac gaagagctgc acgagttctt ccacggcatg 720

ggctatgagc cgtatgagtt cgtcgccggc ttcgacaacg aggatcacct gtcgatccac 780

cgtcgtttcg ccgagttgtt cgagaccgtc ttcgacgaga tctgcgacat caaggccgcc 840

gctcagactg acgacatgac tcgtccgttc tacccgatga tcatcttccg caccccgaag 900

ggctggacct gcccgaagtt catcgacggc aagaagaccg aaggttcctg gcgctcccac 960

caggttccgc tggcttccgc ccgcgatacc gaggctcact tcgaggtcct caagaactgg 1020

ctcgagtcct acaagccgga agagctgttc gacgccaacg gcgccgtgaa gccggaagtc 1080

accgccttca tgccgaccgg cgaactgcgc atcggtgaga acccgaacgc caacggtggc 1140

cgcatccgcg aagagctgaa cctgccggcc ctcgaggact acgaggtcaa ggaagtcgcc 1200

gagtacggcc acggctgggg ccagctcgag gccacccgtc gtctgggcgt ctacacccgc 1260

gacatcatca agaacaaccc ggactccttc cgtatcttcg gaccggacga gaccgcttcc 1320

aaccgtctgc aggccgcata cgacgtcacc aacaagcagt gggacgccgg ctacctgtcc 1380

gctcaggttg atgagcacat ggccgtcacc ggtcaggtca ccgagcagct ctccgagcac 1440

cagatggaag gcttcctcga ggcctacctg ctcaccggcc gtcacggcat ctggagctcc 1500

tacgagtcct tcgtgcacgt gatcgactcc atgctgaacc agcacgccaa gtggctcgag 1560

gctaccgtcc gcgagatccc gtggcgcaag ccgatctcct ccatgaacct gctcgtctcc 1620

tcccacgtgt ggcgtcagga tcacaacggc ttctcccacc aggatccggg tgtcacctcc 1680

gtcctgctga acaagtgctt caacaacgat cacgtgatcg gcatctactt cccggtggat 1740

tccaacatgc tgctcgccgt ggctgagaag tgctacaagt ccaccgacat gatcaacgcc 1800

atcatcgccg gcaagcagcc ggccgccacc tggctgaccc tggacgaagc tcgcgccgag 1860

ctcgagaagg gtgccgccga gtgggagtgg gcctccaccg ccaagtccaa cgacgaagca 1920

cagatcgtgc tcgcctccgc tggcgatgtc ccggctcagg agatcatggc cgctgccgac 1980

aagctcgatg ccatgggcat caagttcaag gtcgtcaacg ttgtggatct ggtcaagctg 2040

cagtccacca aggagaatga cgaagccatc tccgacgccg acttcgctga cctgttcacc 2100

gaggacaagc cggtcctgtt cgcctaccac tcctatgccc gcgacgtgcg tggtctgatc 2160

tacgatcgcc cgaaccacga caacttcaac gtccacggct acgaggagca gggctccacc 2220

accaccccgt acgacatggt gcgcgtgaac aacatcgatc gctacgagct cgttgccgaa 2280

gctctgcgca tgatcgacgc tgacaagtac gccgacaaga tcgacgagct cgaggccttc 2340

cgcaaggaag ccttccagtt cgcagtcgac aacggctacg atcacccgga ttacaccgac 2400

tgggtgtact ccggcgtcaa caccaacaag cagggtgctg tctccgctac cgccgcaacc 2460

gccggcgata acgagtga 2478

<210> 212

<211> 825

<212> PRT

<213> 齿双歧杆菌

<400> 212

Met Thr Ser Pro Val Ile Gly Thr Pro Trp Lys Lys Leu Asn Ala Pro

1 5 10 15

Val Ser Glu Glu Ala Ile Glu Gly Val Asp Lys Tyr Trp Arg Ala Ala

20 25 30

Asn Tyr Leu Ser Ile Gly Gln Ile Tyr Leu Arg Ser Asn Pro Leu Met

35 40 45

Lys Glu Pro Phe Thr Arg Glu Asp Val Lys His Arg Leu Val Gly His

50 55 60

Trp Gly Thr Thr Pro Gly Leu Asn Phe Leu Ile Gly His Ile Asn Arg

65 70 75 80

Leu Ile Ala Asp His Gln Gln Asn Thr Val Ile Ile Met Gly Pro Gly

85 90 95

His Gly Gly Pro Ala Gly Thr Ala Gln Ser Tyr Leu Asp Gly Thr Tyr

100 105 110

Thr Glu Tyr Phe Pro Asn Ile Thr Lys Asp Glu Ala Gly Leu Gln Lys

115 120 125

Phe Phe Arg Gln Phe Ser Tyr Pro Gly Gly Ile Pro Ser His Tyr Ala

130 135 140

Pro Glu Thr Pro Gly Ser Ile His Glu Gly Gly Glu Leu Gly Tyr Ala

145 150 155 160

Leu Ser His Ala Tyr Gly Ala Val Met Asn Asn Pro Ser Leu Phe Val

165 170 175

Pro Ala Ile Val Gly Asp Gly Glu Ala Glu Thr Gly Pro Leu Ala Thr

180 185 190

Gly Trp Gln Ser Asn Lys Leu Val Asn Pro Arg Thr Asp Gly Ile Val

195 200 205

Leu Pro Ile Leu His Leu Asn Gly Tyr Lys Ile Ala Asn Pro Thr Ile

210 215 220

Leu Ser Arg Ile Ser Asp Glu Glu Leu His Glu Phe Phe His Gly Met

225 230 235 240

Gly Tyr Glu Pro Tyr Glu Phe Val Ala Gly Phe Asp Asn Glu Asp His

245 250 255

Leu Ser Ile His Arg Arg Phe Ala Glu Leu Phe Glu Thr Val Phe Asp

260 265 270

Glu Ile Cys Asp Ile Lys Ala Ala Ala Gln Thr Asp Asp Met Thr Arg

275 280 285

Pro Phe Tyr Pro Met Ile Ile Phe Arg Thr Pro Lys Gly Trp Thr Cys

290 295 300

Pro Lys Phe Ile Asp Gly Lys Lys Thr Glu Gly Ser Trp Arg Ser His

305 310 315 320

Gln Val Pro Leu Ala Ser Ala Arg Asp Thr Glu Ala His Phe Glu Val

325 330 335

Leu Lys Asn Trp Leu Glu Ser Tyr Lys Pro Glu Glu Leu Phe Asp Ala

340 345 350

Asn Gly Ala Val Lys Pro Glu Val Thr Ala Phe Met Pro Thr Gly Glu

355 360 365

Leu Arg Ile Gly Glu Asn Pro Asn Ala Asn Gly Gly Arg Ile Arg Glu

370 375 380

Glu Leu Asn Leu Pro Ala Leu Glu Asp Tyr Glu Val Lys Glu Val Ala

385 390 395 400

Glu Tyr Gly His Gly Trp Gly Gln Leu Glu Ala Thr Arg Arg Leu Gly

405 410 415

Val Tyr Thr Arg Asp Ile Ile Lys Asn Asn Pro Asp Ser Phe Arg Ile

420 425 430

Phe Gly Pro Asp Glu Thr Ala Ser Asn Arg Leu Gln Ala Ala Tyr Asp

435 440 445

Val Thr Asn Lys Gln Trp Asp Ala Gly Tyr Leu Ser Ala Gln Val Asp

450 455 460

Glu His Met Ala Val Thr Gly Gln Val Thr Glu Gln Leu Ser Glu His

465 470 475 480

Gln Met Glu Gly Phe Leu Glu Ala Tyr Leu Leu Thr Gly Arg His Gly

485 490 495

Ile Trp Ser Ser Tyr Glu Ser Phe Val His Val Ile Asp Ser Met Leu

500 505 510

Asn Gln His Ala Lys Trp Leu Glu Ala Thr Val Arg Glu Ile Pro Trp

515 520 525

Arg Lys Pro Ile Ser Ser Met Asn Leu Leu Val Ser Ser His Val Trp

530 535 540

Arg Gln Asp His Asn Gly Phe Ser His Gln Asp Pro Gly Val Thr Ser

545 550 555 560

Val Leu Leu Asn Lys Cys Phe Asn Asn Asp His Val Ile Gly Ile Tyr

565 570 575

Phe Pro Val Asp Ser Asn Met Leu Leu Ala Val Ala Glu Lys Cys Tyr

580 585 590

Lys Ser Thr Asp Met Ile Asn Ala Ile Ile Ala Gly Lys Gln Pro Ala

595 600 605

Ala Thr Trp Leu Thr Leu Asp Glu Ala Arg Ala Glu Leu Glu Lys Gly

610 615 620

Ala Ala Glu Trp Glu Trp Ala Ser Thr Ala Lys Ser Asn Asp Glu Ala

625 630 635 640

Gln Ile Val Leu Ala Ser Ala Gly Asp Val Pro Ala Gln Glu Ile Met

645 650 655

Ala Ala Ala Asp Lys Leu Asp Ala Met Gly Ile Lys Phe Lys Val Val

660 665 670

Asn Val Val Asp Leu Val Lys Leu Gln Ser Thr Lys Glu Asn Asp Glu

675 680 685

Ala Ile Ser Asp Ala Asp Phe Ala Asp Leu Phe Thr Glu Asp Lys Pro

690 695 700

Val Leu Phe Ala Tyr His Ser Tyr Ala Arg Asp Val Arg Gly Leu Ile

705 710 715 720

Tyr Asp Arg Pro Asn His Asp Asn Phe Asn Val His Gly Tyr Glu Glu

725 730 735

Gln Gly Ser Thr Thr Thr Pro Tyr Asp Met Val Arg Val Asn Asn Ile

740 745 750

Asp Arg Tyr Glu Leu Val Ala Glu Ala Leu Arg Met Ile Asp Ala Asp

755 760 765

Lys Tyr Ala Asp Lys Ile Asp Glu Leu Glu Ala Phe Arg Lys Glu Ala

770 775 780

Phe Gln Phe Ala Val Asp Asn Gly Tyr Asp His Pro Asp Tyr Thr Asp

785 790 795 800

Trp Val Tyr Ser Gly Val Asn Thr Asn Lys Gln Gly Ala Val Ser Ala

805 810 815

Thr Ala Ala Thr Ala Gly Asp Asn Glu

820 825

<210> 213

<211> 2478

<212> DNA

<213> 乳双歧杆菌（Bifidobacterium lactis）

<400> 213

atgactaatc ctgttattgg taccccatgg cagaagctgg atcgtccggt ttccgaagag 60

gccatcgaag gcatggacaa gtactggcgc gtcgccaact acatgtctat cggccagatc 120

tacctgcgta gcaacccgct gatgaaggag cccttcaccc gcgatgacgt gaagcaccgt 180

ctggtcggcc actggggcac caccccgggc ctgaacttcc ttctcgccca catcaaccgc 240

ctgatcgccg atcaccagca gaacaccgtg ttcatcatgg gtcctggcca cggcggccct 300

gcaggtaccg ctcagtccta catcgacggc acctacaccg agtactaccc gaacatcacc 360

aaggacgaag ctggcctgca gaagttcttc cgccagttct cctacccggg tggcattcct 420

tcccacttcg ctccggagac gccgggctcc atccacgaag gcggcgagct gggctacgcc 480

ctgtcgcacg cctacggcgc gatcatggac aacccgagcc tcttcgtccc gtgcatcatc 540

ggtgacggcg aagccgagac cggccctctg gccaccggct ggcagtccaa caagctcgtc 600

aacccgcgca ccgacggcat cgtcctgccg atcctgcacc tcaacggcta caagatcgcc 660

aacccgacga tcctcgcccg catctccgac gaggagctgc acgacttctt ccgcggcatg 720

ggttaccacc cgtacgagtt cgtcgccggc ttcgacaacg aggatcacct gtcgatccac 780

cgtcgcttcg ccgagctctt cgagaccatc ttcgacgaga tctgcgatat caaggctgcg 840

gctcagaccg acgacatgac ccgtccgttc tacccgatgc tcatcttccg caccccgaag 900

ggctggacct gcccgaagtt catcgacggc aagaagaccg aaggctcctg gcgtgcacac 960

caggtcccgc tggcttccgc ccgcgacacc gaggcccact tcgaagtcct caagggctgg 1020

atggaatcct acaagccgga ggagctcttc aacgccgacg gctccatcaa ggaggacgtc 1080

accgcattca tgcctaaggg cgaactgcgc atcggcgcca acccgaatgc caacggcggc 1140

cgcatccgcg aggatctgaa gctccctgag ctcgatcagt acgagatcac cggcgtcaag 1200

gaatacggcc acggttgggg ccaggtcgag gctccgcgtt ccctcggcgc gtactgccgc 1260

gacatcatca agaacaaccc ggattcgttc cgcgtcttcg gacctgacga gaccgcgtcc 1320

aaccgtctga acgcgaccta cgaggtcacc aagaagcagt gggacaacgg atacctctcg 1380

gctctcgtcg acgagaacat ggccgtcacc ggccaggttg tcgagcagct ctccgagcat 1440

cagtgcgaag gcttcctcga ggcctacctg ctcaccggcc gtcacggcat ctggagctcc 1500

tacgagtcct tcgtgcacgt gatcgactcc atgctgaacc agcatgcgaa gtggctcgag 1560

gccaccgtcc gcgagatccc gtggcgtaag ccgatctcct cggtgaacct cctggtctcc 1620

tcgcacgtgt ggcgtcagga tcacaacggc ttctcgcacc aggatccggg tgtgacctcc 1680

gtcctgctga acaagacgtt caacaacgac cacgtgacga acatctactt cgcgaccgat 1740

gccaacatgc tgctggccat cgccgagaag tgcttcaagt ccaccaacaa gatcaacgca 1800

atcttcgccg gcaagcagcc ggccgcgacg tggatcaccc tcgacgaggt acgcgccgag 1860

ctcgaggctg gtgccgccga gtggaagtgg gcttccaacg ccaagagcaa cgacgaggtc 1920

caggttgtcc tcgccgccgc cggcgacgtc ccgacccagg agatcatggc cgcttccgat 1980

gccctcaaca agatgggcat caagttcaag gtcgtcaacg tcgtggacct catcaagctg 2040

cagtcctcga aggagaacga cgaggccatg tctgacgagg acttcgccga cctgttcacc 2100

gcggacaagc cggtcctctt cgcctaccac tcctatgccc aggacgttcg tggcctcatc 2160

tacgaccgcc cgaaccacga caacttcacc gttgtcggat acaaggagca gggctccacg 2220

acgacgccgt tcgacatggt gcgtgtcaac gacatggatc gctacgccct tcaggccaag 2280

gccctcgagc tcatcgacgc cgacaagtat gccgacaaga tcaacgagct caacgagttc 2340

cgcaagaccg cgttccagtt cgccgtcgac aatggctatg acattcctga gttcaccgat 2400

tgggtgtacc cggatgtcaa ggtcgacgag acctccatgc tctccgccac cgccgcgacc 2460

gccggcgaca acgagtga 2478

<210> 214

<211> 825

<212> PRT

<213> 乳双歧杆菌

<400> 214

Met Thr Asn Pro Val Ile Gly Thr Pro Trp Gln Lys Leu Asp Arg Pro

1 5 10 15

Val Ser Glu Glu Ala Ile Glu Gly Met Asp Lys Tyr Trp Arg Val Ala

20 25 30

Asn Tyr Met Ser Ile Gly Gln Ile Tyr Leu Arg Ser Asn Pro Leu Met

35 40 45

Lys Glu Pro Phe Thr Arg Asp Asp Val Lys His Arg Leu Val Gly His

50 55 60

Trp Gly Thr Thr Pro Gly Leu Asn Phe Leu Leu Ala His Ile Asn Arg

65 70 75 80

Leu Ile Ala Asp His Gln Gln Asn Thr Val Phe Ile Met Gly Pro Gly

85 90 95

His Gly Gly Pro Ala Gly Thr Ala Gln Ser Tyr Ile Asp Gly Thr Tyr

100 105 110

Thr Glu Tyr Tyr Pro Asn Ile Thr Lys Asp Glu Ala Gly Leu Gln Lys

115 120 125

Phe Phe Arg Gln Phe Ser Tyr Pro Gly Gly Ile Pro Ser His Phe Ala

130 135 140

Pro Glu Thr Pro Gly Ser Ile His Glu Gly Gly Glu Leu Gly Tyr Ala

145 150 155 160

Leu Ser His Ala Tyr Gly Ala Ile Met Asp Asn Pro Ser Leu Phe Val

165 170 175

Pro Cys Ile Ile Gly Asp Gly Glu Ala Glu Thr Gly Pro Leu Ala Thr

180 185 190

Gly Trp Gln Ser Asn Lys Leu Val Asn Pro Arg Thr Asp Gly Ile Val

195 200 205

Leu Pro Ile Leu His Leu Asn Gly Tyr Lys Ile Ala Asn Pro Thr Ile

210 215 220

Leu Ala Arg Ile Ser Asp Glu Glu Leu His Asp Phe Phe Arg Gly Met

225 230 235 240

Gly Tyr His Pro Tyr Glu Phe Val Ala Gly Phe Asp Asn Glu Asp His

245 250 255

Leu Ser Ile His Arg Arg Phe Ala Glu Leu Phe Glu Thr Ile Phe Asp

260 265 270

Glu Ile Cys Asp Ile Lys Ala Ala Ala Gln Thr Asp Asp Met Thr Arg

275 280 285

Pro Phe Tyr Pro Met Leu Ile Phe Arg Thr Pro Lys Gly Trp Thr Cys

290 295 300

Pro Lys Phe Ile Asp Gly Lys Lys Thr Glu Gly Ser Trp Arg Ala His

305 310 315 320

Gln Val Pro Leu Ala Ser Ala Arg Asp Thr Glu Ala His Phe Glu Val

325 330 335

Leu Lys Gly Trp Met Glu Ser Tyr Lys Pro Glu Glu Leu Phe Asn Ala

340 345 350

Asp Gly Ser Ile Lys Glu Asp Val Thr Ala Phe Met Pro Lys Gly Glu

355 360 365

Leu Arg Ile Gly Ala Asn Pro Asn Ala Asn Gly Gly Arg Ile Arg Glu

370 375 380

Asp Leu Lys Leu Pro Glu Leu Asp Gln Tyr Glu Ile Thr Gly Val Lys

385 390 395 400

Glu Tyr Gly His Gly Trp Gly Gln Val Glu Ala Pro Arg Ser Leu Gly

405 410 415

Ala Tyr Cys Arg Asp Ile Ile Lys Asn Asn Pro Asp Ser Phe Arg Val

420 425 430

Phe Gly Pro Asp Glu Thr Ala Ser Asn Arg Leu Asn Ala Thr Tyr Glu

435 440 445

Val Thr Lys Lys Gln Trp Asp Asn Gly Tyr Leu Ser Ala Leu Val Asp

450 455 460

Glu Asn Met Ala Val Thr Gly Gln Val Val Glu Gln Leu Ser Glu His

465 470 475 480

Gln Cys Glu Gly Phe Leu Glu Ala Tyr Leu Leu Thr Gly Arg His Gly

485 490 495

Ile Trp Ser Ser Tyr Glu Ser Phe Val His Val Ile Asp Ser Met Leu

500 505 510

Asn Gln His Ala Lys Trp Leu Glu Ala Thr Val Arg Glu Ile Pro Trp

515 520 525

Arg Lys Pro Ile Ser Ser Val Asn Leu Leu Val Ser Ser His Val Trp

530 535 540

Arg Gln Asp His Asn Gly Phe Ser His Gln Asp Pro Gly Val Thr Ser

545 550 555 560

Val Leu Leu Asn Lys Thr Phe Asn Asn Asp His Val Thr Asn Ile Tyr

565 570 575

Phe Ala Thr Asp Ala Asn Met Leu Leu Ala Ile Ala Glu Lys Cys Phe

580 585 590

Lys Ser Thr Asn Lys Ile Asn Ala Ile Phe Ala Gly Lys Gln Pro Ala

595 600 605

Ala Thr Trp Ile Thr Leu Asp Glu Val Arg Ala Glu Leu Glu Ala Gly

610 615 620

Ala Ala Glu Trp Lys Trp Ala Ser Asn Ala Lys Ser Asn Asp Glu Val

625 630 635 640

Gln Val Val Leu Ala Ala Ala Gly Asp Val Pro Thr Gln Glu Ile Met

645 650 655

Ala Ala Ser Asp Ala Leu Asn Lys Met Gly Ile Lys Phe Lys Val Val

660 665 670

Asn Val Val Asp Leu Ile Lys Leu Gln Ser Ser Lys Glu Asn Asp Glu

675 680 685

Ala Met Ser Asp Glu Asp Phe Ala Asp Leu Phe Thr Ala Asp Lys Pro

690 695 700

Val Leu Phe Ala Tyr His Ser Tyr Ala Gln Asp Val Arg Gly Leu Ile

705 710 715 720

Tyr Asp Arg Pro Asn His Asp Asn Phe Thr Val Val Gly Tyr Lys Glu

725 730 735

Gln Gly Ser Thr Thr Thr Pro Phe Asp Met Val Arg Val Asn Asp Met

740 745 750

Asp Arg Tyr Ala Leu Gln Ala Lys Ala Leu Glu Leu Ile Asp Ala Asp

755 760 765

Lys Tyr Ala Asp Lys Ile Asn Glu Leu Asn Glu Phe Arg Lys Thr Ala

770 775 780

Phe Gln Phe Ala Val Asp Asn Gly Tyr Asp Ile Pro Glu Phe Thr Asp

785 790 795 800

Trp Val Tyr Pro Asp Val Lys Val Asp Glu Thr Ser Met Leu Ser Ala

805 810 815

Thr Ala Ala Thr Ala Gly Asp Asn Glu

820 825

<210> 215

<211> 2367

<212> DNA

<213> 未知

<220>

<223> 类植物乳杆菌（Lactobacillus paraplantarum）序列

<220>

<221> misc_feature

<222> (75)..(75)

<223> n是a、c、g或t

<400> 215

atgacaacag attactcatc accagcatat ttgcaaaaag ttgataagta ctggcgggca 60

gccaactact tatcngttgg gcaactttat ttaaaagatt atccattatt acaacagcca 120

ttgaaggcca gtgacgttaa ggttcatcca atttgtcact gggggacgat tgccggtcaa 180

aactctatct acgcgcacct taaccgggtt attaacaagt acggtttgaa gatgttctac 240

gttgaaggtc caggtcatgg tggtcaagtg atggtttcaa actcttatct tgacggtact 300

tacaccgata tttatccaga aattacgcag gatgttgaag gaatgcagaa actcttcaag 360

caattctcat tcccaggtgg ggttgcttcc catgcggcac ctgaaacacc tggttcaatc 420

cacgaaggtg gcgaactagg ttactcaatt tcacacgggg ttggggcaat tcttgacaat 480

cctgacgaaa ttgcagcggt cgttgttggt gatggggaat ccgaaacggg tccattagca 540

acttcatggc aatcaacgaa gttcattaac ccaatcaatg acggggcagt gttaccaatc 600

ttgaacttaa atggttttaa gatttctaac ccaacgattt ttggtcggac ttctgatgct 660

aagattaagg aatacttcga aagcatgagc tgggaaccaa tcttcgttga aggtgacgat 720

cctgaaaagg ttcacccagt cttagctaaa gccatggatg aagccgttga aaagatcaag 780

gcaatccaga agcatgctcg tgaaaatgac gatgcgacgt tgccagtatg gccaatgatc 840

gttttccgtg cacctaaggg ctggactggt cctaagtcat gggacggcga taagattgaa 900

ggttcattcc gggcccatca aattccgatt cctgttgatc aaaatgacat ggaacatgcg 960

gacgctttag ttgattggct tgaatcatat caaccaaagg aactcttcaa tgaagatggt 1020

tctttgaagg atgatattaa agaaattatt cctactgggg acagtcggat ggcagctaac 1080

ccaatcacca atggtggggt tgatccgaaa gccttgaact taccaaactt ccgggattat 1140

gcggtcgata cgtccaagga aggcgcgaat gttaagcaag atatgcttgt ttggtcagac 1200

tatttgcggg atgtcatcaa gaagaatcct gataacttcc ggttgttcgg acctgatgaa 1260

accatgtcta accgcttata tggtgtcttc gaaaccacta atcgtcaatg gatggaagac 1320

attcatcccg atagtgacca atatgaagct gcagctggcc gggtcttaga tgctcagtta 1380

tctgaacacc aagctgaagg ttggttagaa ggttacgtct taactggacg tcatgggtta 1440

tttgccagtt atgaagcctt cctacgcgtt gtggactcaa tgttgacgca acacttcaag 1500

tggttacgta aggccaatga acttgattgg cgtaaaaagt acccatcact taacattatc 1560

gcggcttcaa ctgtattcca acaagaccat aatggttaca cccaccaaga tccaggtgcg 1620

ttgactcatt tggccgaaaa gaaaccagaa tacattcgcg aatatttacc agccgatgcc 1680

aacacgttat tagctgtcgg tgacgtcatt ttccggagcc aagaaaagat caactacgtg 1740

gttacgtcaa aacacccacg tcaacaatgg ttcagcattg aagaagctaa acaattagtt 1800

gacaatggtc ttggtatcat tgactgggca agcacggatc aaggtagcga accagacatc 1860

gtctttgcag ctgctgggac ggaaccaacg cttgaaacgt tggctgccat ccaattacta 1920

cacgacagtt tcccagagat gaagattcgt ttcgtgaacg tggtcgacat cttgaagtta 1980

cgtagtcctg aaaaggatcc acggggcttg tcagatgctg aatttgacca ttactttact 2040

aaggacaaac cagtggtctt tgctttccac ggttacgaag atttagttcg tgacatcttc 2100

ttcgatcgtc acaaccataa cttatacgtc cacggttacc gtgaaaatgg tgatattacc 2160

acaccattcg acgtacgggt catgaaccaa atggatcgtt tcgacttagc taagacggcg 2220

attgcggcgc aaccagcaat ggaaaacacc ggtgcggcct ttgttcaatc catggataac 2280

atgcttgcta aacacaatgc atacattcgg gatgccggaa ccgacttgcc agaagttaac 2340

gactggcaat ggaaaggttt gaaataa 2367

<210> 216

<211> 788

<212> PRT

<213> 未知

<220>

<223> 类植物乳杆菌序列

<400> 216

Met Thr Thr Asp Tyr Ser Ser Pro Ala Tyr Leu Gln Lys Val Asp Lys

1 5 10 15

Tyr Trp Arg Ala Ala Asn Tyr Leu Ser Val Gly Gln Leu Tyr Leu Lys

20 25 30

Asp Tyr Pro Leu Leu Gln Gln Pro Leu Lys Ala Ser Asp Val Lys Val

35 40 45

His Pro Ile Cys His Trp Gly Thr Ile Ala Gly Gln Asn Ser Ile Tyr

50 55 60

Ala His Leu Asn Arg Val Ile Asn Lys Tyr Gly Leu Lys Met Phe Tyr

65 70 75 80

Val Glu Gly Pro Gly His Gly Gly Gln Val Met Val Ser Asn Ser Tyr

85 90 95

Leu Asp Gly Thr Tyr Thr Asp Ile Tyr Pro Glu Ile Thr Gln Asp Val

100 105 110

Glu Gly Met Gln Lys Leu Phe Lys Gln Phe Ser Phe Pro Gly Gly Val

115 120 125

Ala Ser His Ala Ala Pro Glu Thr Pro Gly Ser Ile His Glu Gly Gly

130 135 140

Glu Leu Gly Tyr Ser Ile Ser His Gly Val Gly Ala Ile Leu Asp Asn

145 150 155 160

Pro Asp Glu Ile Ala Ala Val Val Val Gly Asp Gly Glu Ser Glu Thr

165 170 175

Gly Pro Leu Ala Thr Ser Trp Gln Ser Thr Lys Phe Ile Asn Pro Ile

180 185 190

Asn Asp Gly Ala Val Leu Pro Ile Leu Asn Leu Asn Gly Phe Lys Ile

195 200 205

Ser Asn Pro Thr Ile Phe Gly Arg Thr Ser Asp Ala Lys Ile Lys Glu

210 215 220

Tyr Phe Glu Ser Met Ser Trp Glu Pro Ile Phe Val Glu Gly Asp Asp

225 230 235 240

Pro Glu Lys Val His Pro Val Leu Ala Lys Ala Met Asp Glu Ala Val

245 250 255

Glu Lys Ile Lys Ala Ile Gln Lys His Ala Arg Glu Asn Asp Asp Ala

260 265 270

Thr Leu Pro Val Trp Pro Met Ile Val Phe Arg Ala Pro Lys Gly Trp

275 280 285

Thr Gly Pro Lys Ser Trp Asp Gly Asp Lys Ile Glu Gly Ser Phe Arg

290 295 300

Ala His Gln Ile Pro Ile Pro Val Asp Gln Asn Asp Met Glu His Ala

305 310 315 320

Asp Ala Leu Val Asp Trp Leu Glu Ser Tyr Gln Pro Lys Glu Leu Phe

325 330 335

Asn Glu Asp Gly Ser Leu Lys Asp Asp Ile Lys Glu Ile Ile Pro Thr

340 345 350

Gly Asp Ser Arg Met Ala Ala Asn Pro Ile Thr Asn Gly Gly Val Asp

355 360 365

Pro Lys Ala Leu Asn Leu Pro Asn Phe Arg Asp Tyr Ala Val Asp Thr

370 375 380

Ser Lys Glu Gly Ala Asn Val Lys Gln Asp Met Leu Val Trp Ser Asp

385 390 395 400

Tyr Leu Arg Asp Val Ile Lys Lys Asn Pro Asp Asn Phe Arg Leu Phe

405 410 415

Gly Pro Asp Glu Thr Met Ser Asn Arg Leu Tyr Gly Val Phe Glu Thr

420 425 430

Thr Asn Arg Gln Trp Met Glu Asp Ile His Pro Asp Ser Asp Gln Tyr

435 440 445

Glu Ala Ala Ala Gly Arg Val Leu Asp Ala Gln Leu Ser Glu His Gln

450 455 460

Ala Glu Gly Trp Leu Glu Gly Tyr Val Leu Thr Gly Arg His Gly Leu

465 470 475 480

Phe Ala Ser Tyr Glu Ala Phe Leu Arg Val Val Asp Ser Met Leu Thr

485 490 495

Gln His Phe Lys Trp Leu Arg Lys Ala Asn Glu Leu Asp Trp Arg Lys

500 505 510

Lys Tyr Pro Ser Leu Asn Ile Ile Ala Ala Ser Thr Val Phe Gln Gln

515 520 525

Asp His Asn Gly Tyr Thr His Gln Asp Pro Gly Ala Leu Thr His Leu

530 535 540

Ala Glu Lys Lys Pro Glu Tyr Ile Arg Glu Tyr Leu Pro Ala Asp Ala

545 550 555 560

Asn Thr Leu Leu Ala Val Gly Asp Val Ile Phe Arg Ser Gln Glu Lys

565 570 575

Ile Asn Tyr Val Val Thr Ser Lys His Pro Arg Gln Gln Trp Phe Ser

580 585 590

Ile Glu Glu Ala Lys Gln Leu Val Asp Asn Gly Leu Gly Ile Ile Asp

595 600 605

Trp Ala Ser Thr Asp Gln Gly Ser Glu Pro Asp Ile Val Phe Ala Ala

610 615 620

Ala Gly Thr Glu Pro Thr Leu Glu Thr Leu Ala Ala Ile Gln Leu Leu

625 630 635 640

His Asp Ser Phe Pro Glu Met Lys Ile Arg Phe Val Asn Val Val Asp

645 650 655

Ile Leu Lys Leu Arg Ser Pro Glu Lys Asp Pro Arg Gly Leu Ser Asp

660 665 670

Ala Glu Phe Asp His Tyr Phe Thr Lys Asp Lys Pro Val Val Phe Ala

675 680 685

Phe His Gly Tyr Glu Asp Leu Val Arg Asp Ile Phe Phe Asp Arg His

690 695 700

Asn His Asn Leu Tyr Val His Gly Tyr Arg Glu Asn Gly Asp Ile Thr

705 710 715 720

Thr Pro Phe Asp Val Arg Val Met Asn Gln Met Asp Arg Phe Asp Leu

725 730 735

Ala Lys Thr Ala Ile Ala Ala Gln Pro Ala Met Glu Asn Thr Gly Ala

740 745 750

Ala Phe Val Gln Ser Met Asp Asn Met Leu Ala Lys His Asn Ala Tyr

755 760 765

Ile Arg Asp Ala Gly Thr Asp Leu Pro Glu Val Asn Asp Trp Gln Trp

770 775 780

Lys Gly Leu Lys

785

<210> 217

<211> 2478

<212> DNA

<213> 短双歧杆菌（Bifidobacterium breve）

<400> 217

atgacaaatc ctgttattgg caccccgtgg cagaagctgg atcgcccggt ttccgaagaa 60

gccatcgaag gcatggacaa gtattggcgc gtcaccaact acatgtccat cggccagatc 120

tatctgcgta gcaacccgct gatgaaggaa cccttcaccc gcgatgacgt gaagcaccgt 180

ctggtcggcc actggggcac caccccgggc ctgaacttcc ttctcgccca catcaaccgc 240

ctcatcgctg accaccagca gaacaccgtg ttcatcatgg gcccgggcca cggcggcccg 300

gctggcacct cccagtctta cgttgacggc acgtacaccg agtactaccc gaacatcacc 360

aaggacgaag ctggcctgca gaagttcttc cgccagttct cctacccggg cggcatcccg 420

tcgcacttcg ccccggagac cccgggatcg atccacgaag gtggcgagct tggctacgcg 480

ctctcccacg catacggcgc cgtgatgaac aacccgagcc tgttcgtgcc gtgcatcatc 540

ggcgacggcg aggccgagac cggcccgctc gccaccggct ggcagtccaa caagctcgtc 600

aacccgcgca ccgacggcat cgtgctgccg atcctgcacc tcaacggcta caagatcgcc 660

aacccgacca tcctcgctcg tatctccgac gaagagctgc atgacttctt ccgcggcatg 720

ggctaccacc cgtacgagtt cgttgccggc ttcgacaacg aggaccacat gtcgatccac 780

cgtcgtttcg ccgagctgtt cgagacgatc ttcgacgaga tctgcgacat caaggctgcg 840

gcccagaccg acgacatgac ccgtccgttc tacccgatgc tcatcttccg caccccgaag 900

ggctggacct gcccgaagtt catcgacggc aagaagaccg aaggctcctg gcgtgcgcac 960

caggtcccgc tggcttccgc ccgcgacacc gaagagcact tcgaagtcct caagggctgg 1020

atggaatcct acaagccgga agagctcttc aacgccgacg gctccatcaa ggatgacgtc 1080

accgcgttca tgccgaaggg cgagctccgc atcggcgcca acccgaacgc caacggtggt 1140

gtgatccgcg aggacctgaa gctccccgag ctcgaccagt acgaggtcac cggcgtcaag 1200

gagtacggcc atggctgggg ccaggtcgag gctccgcgtg ccctcggtgc atactgccgc 1260

gacatcatca agaacaaccc ggattcgttc cgcatcttcg gaccggacga gaccgcttcc 1320

aaccgcctga acgcgaccta cgaggtcacc gacaagcagt gggacaacgg ctacctttcg 1380

ggtctcgtcg acgagcacat ggcggtcacc ggtcaggtca ccgagcagct ctccgagcac 1440

cagtgcgagg gcttcctcga ggcgtacctc ctcaccggcc gccacggcat ctggagctcc 1500

tacgagtcct tcgtccacgt catcgactcg atgctcaacc agcatgcgaa gtggctcgag 1560

gccaccgtcc gcgagatccc gtggcgcaag ccgatctcct cggtgaacct cctcgtctcc 1620

tcgcacgtgt ggcgtcagga tcacaacggc ttctcgcacc aggatccggg tgtcacctcg 1680

ctcctgatca acaagacgtt caacaacgat cacgtgacga acatctactt cgcgaccgac 1740

gcgaacatgc tgctcgcgat ctccgagaag tgcttcaagt ccaccaacaa gatcaatgcg 1800

atcttcgccg gcaagcagcc tgctccgacg tgggtcacgc tcgatgaggc ccgcgccgag 1860

ctcgaagccg gcgccgctga gtggaagtgg gcttccaacg ccgagaacaa cgatgaggtc 1920

caggtcgtcc tcgcttccgc tggcgatgtg ccgacccagg agctcatggc cgcctccgat 1980

gccctcaaca agatgggcat caagttcaag gtcgtcaacg ttgttgacct cctgaagctg 2040

cagtcccgcg agaacaacga cgaggccctc acggacgagg agttcaccga actcttcacc 2100

gccgacaagc cggttctgtt cgcataccac tcctacgctc aggatgttcg cggcctcatc 2160

tacgaccgcc cgaaccacga caacttccac gtcgtcggct acaaggagca gggctccacg 2220

accacgccgt tcgacatggt ccgcgtcaac gacatggatc gctatgcgct ccaggccgct 2280

gccctcaagc tgatcgatgc cgacaagtac gccgacaaga tcgacgagct caacgcgttc 2340

cgcaagaagg cgttccagtt cgctgtcgac aacggctacg acatcccgga gttcaccgac 2400

tgggtgtacc cggatgtcaa ggtcgacgag acgcagatgc tttccgcgac cgcggcgacc 2460

gcaggcgaca acgagtga 2478

<210> 218

<211> 825

<212> PRT

<213> 短双歧杆菌

<400> 218

Met Thr Asn Pro Val Ile Gly Thr Pro Trp Gln Lys Leu Asp Arg Pro

1 5 10 15

Val Ser Glu Glu Ala Ile Glu Gly Met Asp Lys Tyr Trp Arg Val Thr

20 25 30

Asn Tyr Met Ser Ile Gly Gln Ile Tyr Leu Arg Ser Asn Pro Leu Met

35 40 45

Lys Glu Pro Phe Thr Arg Asp Asp Val Lys His Arg Leu Val Gly His

50 55 60

Trp Gly Thr Thr Pro Gly Leu Asn Phe Leu Leu Ala His Ile Asn Arg

65 70 75 80

Leu Ile Ala Asp His Gln Gln Asn Thr Val Phe Ile Met Gly Pro Gly

85 90 95

His Gly Gly Pro Ala Gly Thr Ser Gln Ser Tyr Val Asp Gly Thr Tyr

100 105 110

Thr Glu Tyr Tyr Pro Asn Ile Thr Lys Asp Glu Ala Gly Leu Gln Lys

115 120 125

Phe Phe Arg Gln Phe Ser Tyr Pro Gly Gly Ile Pro Ser His Phe Ala

130 135 140

Pro Glu Thr Pro Gly Ser Ile His Glu Gly Gly Glu Leu Gly Tyr Ala

145 150 155 160

Leu Ser His Ala Tyr Gly Ala Val Met Asn Asn Pro Ser Leu Phe Val

165 170 175

Pro Cys Ile Ile Gly Asp Gly Glu Ala Glu Thr Gly Pro Leu Ala Thr

180 185 190

Gly Trp Gln Ser Asn Lys Leu Val Asn Pro Arg Thr Asp Gly Ile Val

195 200 205

Leu Pro Ile Leu His Leu Asn Gly Tyr Lys Ile Ala Asn Pro Thr Ile

210 215 220

Leu Ala Arg Ile Ser Asp Glu Glu Leu His Asp Phe Phe Arg Gly Met

225 230 235 240

Gly Tyr His Pro Tyr Glu Phe Val Ala Gly Phe Asp Asn Glu Asp His

245 250 255

Met Ser Ile His Arg Arg Phe Ala Glu Leu Phe Glu Thr Ile Phe Asp

260 265 270

Glu Ile Cys Asp Ile Lys Ala Ala Ala Gln Thr Asp Asp Met Thr Arg

275 280 285

Pro Phe Tyr Pro Met Leu Ile Phe Arg Thr Pro Lys Gly Trp Thr Cys

290 295 300

Pro Lys Phe Ile Asp Gly Lys Lys Thr Glu Gly Ser Trp Arg Ala His

305 310 315 320

Gln Val Pro Leu Ala Ser Ala Arg Asp Thr Glu Glu His Phe Glu Val

325 330 335

Leu Lys Gly Trp Met Glu Ser Tyr Lys Pro Glu Glu Leu Phe Asn Ala

340 345 350

Asp Gly Ser Ile Lys Asp Asp Val Thr Ala Phe Met Pro Lys Gly Glu

355 360 365

Leu Arg Ile Gly Ala Asn Pro Asn Ala Asn Gly Gly Val Ile Arg Glu

370 375 380

Asp Leu Lys Leu Pro Glu Leu Asp Gln Tyr Glu Val Thr Gly Val Lys

385 390 395 400

Glu Tyr Gly His Gly Trp Gly Gln Val Glu Ala Pro Arg Ala Leu Gly

405 410 415

Ala Tyr Cys Arg Asp Ile Ile Lys Asn Asn Pro Asp Ser Phe Arg Ile

420 425 430

Phe Gly Pro Asp Glu Thr Ala Ser Asn Arg Leu Asn Ala Thr Tyr Glu

435 440 445

Val Thr Asp Lys Gln Trp Asp Asn Gly Tyr Leu Ser Gly Leu Val Asp

450 455 460

Glu His Met Ala Val Thr Gly Gln Val Thr Glu Gln Leu Ser Glu His

465 470 475 480

Gln Cys Glu Gly Phe Leu Glu Ala Tyr Leu Leu Thr Gly Arg His Gly

485 490 495

Ile Trp Ser Ser Tyr Glu Ser Phe Val His Val Ile Asp Ser Met Leu

500 505 510

Asn Gln His Ala Lys Trp Leu Glu Ala Thr Val Arg Glu Ile Pro Trp

515 520 525

Arg Lys Pro Ile Ser Ser Val Asn Leu Leu Val Ser Ser His Val Trp

530 535 540

Arg Gln Asp His Asn Gly Phe Ser His Gln Asp Pro Gly Val Thr Ser

545 550 555 560

Leu Leu Ile Asn Lys Thr Phe Asn Asn Asp His Val Thr Asn Ile Tyr

565 570 575

Phe Ala Thr Asp Ala Asn Met Leu Leu Ala Ile Ser Glu Lys Cys Phe

580 585 590

Lys Ser Thr Asn Lys Ile Asn Ala Ile Phe Ala Gly Lys Gln Pro Ala

595 600 605

Pro Thr Trp Val Thr Leu Asp Glu Ala Arg Ala Glu Leu Glu Ala Gly

610 615 620

Ala Ala Glu Trp Lys Trp Ala Ser Asn Ala Glu Asn Asn Asp Glu Val

625 630 635 640

Gln Val Val Leu Ala Ser Ala Gly Asp Val Pro Thr Gln Glu Leu Met

645 650 655

Ala Ala Ser Asp Ala Leu Asn Lys Met Gly Ile Lys Phe Lys Val Val

660 665 670

Asn Val Val Asp Leu Leu Lys Leu Gln Ser Arg Glu Asn Asn Asp Glu

675 680 685

Ala Leu Thr Asp Glu Glu Phe Thr Glu Leu Phe Thr Ala Asp Lys Pro

690 695 700

Val Leu Phe Ala Tyr His Ser Tyr Ala Gln Asp Val Arg Gly Leu Ile

705 710 715 720

Tyr Asp Arg Pro Asn His Asp Asn Phe His Val Val Gly Tyr Lys Glu

725 730 735

Gln Gly Ser Thr Thr Thr Pro Phe Asp Met Val Arg Val Asn Asp Met

740 745 750

Asp Arg Tyr Ala Leu Gln Ala Ala Ala Leu Lys Leu Ile Asp Ala Asp

755 760 765

Lys Tyr Ala Asp Lys Ile Asp Glu Leu Asn Ala Phe Arg Lys Lys Ala

770 775 780

Phe Gln Phe Ala Val Asp Asn Gly Tyr Asp Ile Pro Glu Phe Thr Asp

785 790 795 800

Trp Val Tyr Pro Asp Val Lys Val Asp Glu Thr Gln Met Leu Ser Ala

805 810 815

Thr Ala Ala Thr Ala Gly Asp Asn Glu

820 825

<210> 219

<211> 2145

<212> DNA

<213> 大肠杆菌

<400> 219

gtgtcccgta ttattatgct gatccctacc ggaaccagcg tcggtctgac cagcgtcagc 60

cttggcgtga tccgtgcaat ggaacgcaaa ggcgttcgtc tgagcgtttt caaacctatc 120

gctcagccgc gtaccggtgg cgatgcgccc gatcagacta cgactatcgt gcgtgcgaac 180

tcttccacca cgacggccgc tgaaccgctg aaaatgagct acgttgaagg tctgctttcc 240

agcaatcaga aagatgtgct gatggaagag atcgtcgcaa actaccacgc taacaccaaa 300

gacgctgaag tcgttctggt tgaaggtctg gtcccgacac gtaagcacca gtttgcccag 360

tctctgaact acgaaatcgc taaaacgctg aatgcggaaa tcgtcttcgt tatgtctcag 420

ggcactgaca ccccggaaca gctgaaagag cgtatcgaac tgacccgcaa cagcttcggc 480

ggtgccaaaa acaccaacat caccggcgtt atcgttaaca aactgaacgc accggttgat 540

gaacagggtc gtactcgccc ggatctgtcc gagattttcg acgactcttc caaagctaaa 600

gtaaacaatg ttgatccggc gaagctgcaa gaatccagcc cgctgccggt tctcggcgct 660

gtgccgtgga gctttgacct gatcgcgact cgtgcgatcg atatggctcg ccacctgaat 720

gcgaccatca tcaacgaagg cgacatcaat actcgccgcg ttaaatccgt cactttctgc 780

gcacgcagca ttccgcacat gctggagcac ttccgtgccg gttctctgct ggtgacttcc 840

gcagaccgtc ctgacgtgct ggtggccgct tgcctggcag ccatgaacgg cgtagaaatc 900

ggtgccctgc tgctgactgg cggttacgaa atggacgcgc gcatttctaa actgtgcgaa 960

cgtgctttcg ctaccggcct gccggtattt atggtgaaca ccaacacctg gcagacctct 1020

ctgagcctgc agagcttcaa cctggaagtt ccggttgacg atcacgaacg tatcgagaaa 1080

gttcaggaat acgttgctaa ctacatcaac gctgactgga tcgaatctct gactgccact 1140

tctgagcgca gccgtcgtct gtctccgcct gcgttccgtt atcagctgac tgaacttgcg 1200

cgcaaagcgg gcaaacgtat cgtactgccg gaaggtgacg aaccgcgtac cgttaaagca 1260

gccgctatct gtgctgaacg tggtatcgca acttgcgtac tgctgggtaa tccggcagag 1320

atcaaccgtg ttgcagcgtc tcagggtgta gaactgggtg cagggattga aatcgttgat 1380

ccagaagtgg ttcgcgaaag ctatgttggt cgtctggtcg aactgcgtaa gaacaaaggc 1440

atgaccgaaa ccgttgcccg cgaacagctg gaagacaacg tggtgctcgg tacgctgatg 1500

ctggaacagg atgaagttga tggtctggtt tccggtgctg ttcacactac cgcaaacacc 1560

atccgtccgc cgctgcagct gatcaaaact gcaccgggca gctccctggt atcttccgtg 1620

ttcttcatgc tgctgccgga acaggtttac gtttacggtg actgtgcgat caacccggat 1680

ccgaccgctg aacagctggc agaaatcgcg attcagtccg ctgattccgc tgcggccttc 1740

ggtatcgaac cgcgcgttgc tatgctctcc tactccaccg gtacttctgg tgcaggtagc 1800

gacgtagaaa aagttcgcga agcaactcgt ctggcgcagg aaaaacgtcc tgacctgatg 1860

atcgacggtc cgctgcagta cgacgctgcg gtaatggctg acgttgcgaa atccaaagcg 1920

ccgaactctc cggttgcagg tcgcgctacc gtgttcatct tcccggatct gaacaccggt 1980

aacaccacct acaaagcggt acagcgttct gccgacctga tctccatcgg gccgatgctg 2040

cagggtatgc gcaagccggt taacgacctg tcccgtggcg cactggttga cgatatcgtc 2100

tacaccatcg cgctgactgc gattcagtct gcacagcagc agtaa 2145

<210> 220

<211> 714

<212> PRT

<213> 大肠杆菌

<400> 220

Met Ser Arg Ile Ile Met Leu Ile Pro Thr Gly Thr Ser Val Gly Leu

1 5 10 15

Thr Ser Val Ser Leu Gly Val Ile Arg Ala Met Glu Arg Lys Gly Val

20 25 30

Arg Leu Ser Val Phe Lys Pro Ile Ala Gln Pro Arg Thr Gly Gly Asp

35 40 45

Ala Pro Asp Gln Thr Thr Thr Ile Val Arg Ala Asn Ser Ser Thr Thr

50 55 60

Thr Ala Ala Glu Pro Leu Lys Met Ser Tyr Val Glu Gly Leu Leu Ser

65 70 75 80

Ser Asn Gln Lys Asp Val Leu Met Glu Glu Ile Val Ala Asn Tyr His

85 90 95

Ala Asn Thr Lys Asp Ala Glu Val Val Leu Val Glu Gly Leu Val Pro

100 105 110

Thr Arg Lys His Gln Phe Ala Gln Ser Leu Asn Tyr Glu Ile Ala Lys

115 120 125

Thr Leu Asn Ala Glu Ile Val Phe Val Met Ser Gln Gly Thr Asp Thr

130 135 140

Pro Glu Gln Leu Lys Glu Arg Ile Glu Leu Thr Arg Asn Ser Phe Gly

145 150 155 160

Gly Ala Lys Asn Thr Asn Ile Thr Gly Val Ile Val Asn Lys Leu Asn

165 170 175

Ala Pro Val Asp Glu Gln Gly Arg Thr Arg Pro Asp Leu Ser Glu Ile

180 185 190

Phe Asp Asp Ser Ser Lys Ala Lys Val Asn Asn Val Asp Pro Ala Lys

195 200 205

Leu Gln Glu Ser Ser Pro Leu Pro Val Leu Gly Ala Val Pro Trp Ser

210 215 220

Phe Asp Leu Ile Ala Thr Arg Ala Ile Asp Met Ala Arg His Leu Asn

225 230 235 240

Ala Thr Ile Ile Asn Glu Gly Asp Ile Asn Thr Arg Arg Val Lys Ser

245 250 255

Val Thr Phe Cys Ala Arg Ser Ile Pro His Met Leu Glu His Phe Arg

260 265 270

Ala Gly Ser Leu Leu Val Thr Ser Ala Asp Arg Pro Asp Val Leu Val

275 280 285

Ala Ala Cys Leu Ala Ala Met Asn Gly Val Glu Ile Gly Ala Leu Leu

290 295 300

Leu Thr Gly Gly Tyr Glu Met Asp Ala Arg Ile Ser Lys Leu Cys Glu

305 310 315 320

Arg Ala Phe Ala Thr Gly Leu Pro Val Phe Met Val Asn Thr Asn Thr

325 330 335

Trp Gln Thr Ser Leu Ser Leu Gln Ser Phe Asn Leu Glu Val Pro Val

340 345 350

Asp Asp His Glu Arg Ile Glu Lys Val Gln Glu Tyr Val Ala Asn Tyr

355 360 365

Ile Asn Ala Asp Trp Ile Glu Ser Leu Thr Ala Thr Ser Glu Arg Ser

370 375 380

Arg Arg Leu Ser Pro Pro Ala Phe Arg Tyr Gln Leu Thr Glu Leu Ala

385 390 395 400

Arg Lys Ala Gly Lys Arg Ile Val Leu Pro Glu Gly Asp Glu Pro Arg

405 410 415

Thr Val Lys Ala Ala Ala Ile Cys Ala Glu Arg Gly Ile Ala Thr Cys

420 425 430

Val Leu Leu Gly Asn Pro Ala Glu Ile Asn Arg Val Ala Ala Ser Gln

435 440 445

Gly Val Glu Leu Gly Ala Gly Ile Glu Ile Val Asp Pro Glu Val Val

450 455 460

Arg Glu Ser Tyr Val Gly Arg Leu Val Glu Leu Arg Lys Asn Lys Gly

465 470 475 480

Met Thr Glu Thr Val Ala Arg Glu Gln Leu Glu Asp Asn Val Val Leu

485 490 495

Gly Thr Leu Met Leu Glu Gln Asp Glu Val Asp Gly Leu Val Ser Gly

500 505 510

Ala Val His Thr Thr Ala Asn Thr Ile Arg Pro Pro Leu Gln Leu Ile

515 520 525

Lys Thr Ala Pro Gly Ser Ser Leu Val Ser Ser Val Phe Phe Met Leu

530 535 540

Leu Pro Glu Gln Val Tyr Val Tyr Gly Asp Cys Ala Ile Asn Pro Asp

545 550 555 560

Pro Thr Ala Glu Gln Leu Ala Glu Ile Ala Ile Gln Ser Ala Asp Ser

565 570 575

Ala Ala Ala Phe Gly Ile Glu Pro Arg Val Ala Met Leu Ser Tyr Ser

580 585 590

Thr Gly Thr Ser Gly Ala Gly Ser Asp Val Glu Lys Val Arg Glu Ala

595 600 605

Thr Arg Leu Ala Gln Glu Lys Arg Pro Asp Leu Met Ile Asp Gly Pro

610 615 620

Leu Gln Tyr Asp Ala Ala Val Met Ala Asp Val Ala Lys Ser Lys Ala

625 630 635 640

Pro Asn Ser Pro Val Ala Gly Arg Ala Thr Val Phe Ile Phe Pro Asp

645 650 655

Leu Asn Thr Gly Asn Thr Thr Tyr Lys Ala Val Gln Arg Ser Ala Asp

660 665 670

Leu Ile Ser Ile Gly Pro Met Leu Gln Gly Met Arg Lys Pro Val Asn

675 680 685

Asp Leu Ser Arg Gly Ala Leu Val Asp Asp Ile Val Tyr Thr Ile Ala

690 695 700

Leu Thr Ala Ile Gln Ser Ala Gln Gln Gln

705 710

<210> 221

<211> 1002

<212> DNA

<213> 丙酮丁醇梭菌

<400> 221

atggatttaa tagaaagcat atgggagtgt gctaagcaag acaaaaaaag gataatatta 60

gctgaaggtg aagaaaaaag aaatctaatt gccgcagata aaattatcaa agagggatta 120

gcagagcttg ttcttgtagg tgatgaaaat aaaattaaag aaaaagcaag tgagttgaat 180

cttgacattt cgaaggctga aataatggat ccagagacat cactaaaaac agaaacatat 240

gctagagatt tttatgaact tagaaaacac aaaggaatga ctattgaaaa atctgaaaaa 300

atggtaagag atcctcttta ttttgcaaca atggctttaa aagatggcta tgttgatgga 360

atggtttcag gagctgttca cacaactgga gatttattaa gaccaggact tcaaattata 420

aaaactgcac caggagttaa aatagtatca ggattctttg ttatgataat acctgactgc 480

gattatggtg aagagggtct tttattattt gcagattgtg ctgtaaatcc taacccaaca 540

tcagatgaac tagctgatat tgctataact acagctgaaa cagctagaaa attatgtaac 600

gtagagccta aagttgcgat gctttcattc tcaactatgg gaagtgcaaa aggcgaaatg 660

gtagataagg ttaaaaatgc tgttgaaatc acaaagaaat tcagaccgga tcttgctatt 720

gatggtgagc ttcagcttga tgctgcaata gatagtgaag tagcggcttt aaaagcacct 780

tctagtaatg ttgcaggaaa tgcaaatgtt cttgtattcc cagatcttca aacaggaaac 840

attgggtaca agcttgttca aagatttgca aaagcaaaag caataggacc tatatgtcaa 900

ggatttgcaa aacctattaa tgatttatca agaggctgta gctcagagga tatagtaaat 960

gttgttgcta taactgttgt tcaggctcaa agaggtatat aa 1002

<210> 222

<211> 333

<212> PRT

<213> 丙酮丁醇梭菌

<400> 222

Met Asp Leu Ile Glu Ser Ile Trp Glu Cys Ala Lys Gln Asp Lys Lys

1 5 10 15

Arg Ile Ile Leu Ala Glu Gly Glu Glu Lys Arg Asn Leu Ile Ala Ala

20 25 30

Asp Lys Ile Ile Lys Glu Gly Leu Ala Glu Leu Val Leu Val Gly Asp

35 40 45

Glu Asn Lys Ile Lys Glu Lys Ala Ser Glu Leu Asn Leu Asp Ile Ser

50 55 60

Lys Ala Glu Ile Met Asp Pro Glu Thr Ser Leu Lys Thr Glu Thr Tyr

65 70 75 80

Ala Arg Asp Phe Tyr Glu Leu Arg Lys His Lys Gly Met Thr Ile Glu

85 90 95

Lys Ser Glu Lys Met Val Arg Asp Pro Leu Tyr Phe Ala Thr Met Ala

100 105 110

Leu Lys Asp Gly Tyr Val Asp Gly Met Val Ser Gly Ala Val His Thr

115 120 125

Thr Gly Asp Leu Leu Arg Pro Gly Leu Gln Ile Ile Lys Thr Ala Pro

130 135 140

Gly Val Lys Ile Val Ser Gly Phe Phe Val Met Ile Ile Pro Asp Cys

145 150 155 160

Asp Tyr Gly Glu Glu Gly Leu Leu Leu Phe Ala Asp Cys Ala Val Asn

165 170 175

Pro Asn Pro Thr Ser Asp Glu Leu Ala Asp Ile Ala Ile Thr Thr Ala

180 185 190

Glu Thr Ala Arg Lys Leu Cys Asn Val Glu Pro Lys Val Ala Met Leu

195 200 205

Ser Phe Ser Thr Met Gly Ser Ala Lys Gly Glu Met Val Asp Lys Val

210 215 220

Lys Asn Ala Val Glu Ile Thr Lys Lys Phe Arg Pro Asp Leu Ala Ile

225 230 235 240

Asp Gly Glu Leu Gln Leu Asp Ala Ala Ile Asp Ser Glu Val Ala Ala

245 250 255

Leu Lys Ala Pro Ser Ser Asn Val Ala Gly Asn Ala Asn Val Leu Val

260 265 270

Phe Pro Asp Leu Gln Thr Gly Asn Ile Gly Tyr Lys Leu Val Gln Arg

275 280 285

Phe Ala Lys Ala Lys Ala Ile Gly Pro Ile Cys Gln Gly Phe Ala Lys

290 295 300

Pro Ile Asn Asp Leu Ser Arg Gly Cys Ser Ser Glu Asp Ile Val Asn

305 310 315 320

Val Val Ala Ile Thr Val Val Gln Ala Gln Arg Gly Ile

325 330

<210> 223

<211> 1647

<212> DNA

<213> 乳酸乳球菌

<400> 223

atgtatacag taggagatta cctattagac cgattacacg agttaggaat tgaagaaatt 60

tttggagtcc ctggagacta taacttacaa tttttagatc aaattatttc ccacaaggat 120

atgaaatggg tcggaaatgc taatgaatta aatgcttcat atatggctga tggctatgct 180

cgtactaaaa aagctgccgc atttcttaca acctttggag taggtgaatt gagtgcagtt 240

aatggattag caggaagtta cgccgaaaat ttaccagtag tagaaatagt gggatcacct 300

acatcaaaag ttcaaaatga aggaaaattt gttcatcata cgctggctga cggtgatttt 360

aaacacttta tgaaaatgca cgaacctgtt acagcagctc gaactttact gacagcagaa 420

aatgcaaccg ttgaaattga ccgagtactt tctgcactat taaaagaaag aaaacctgtc 480

tatatcaact taccagttga tgttgctgct gcaaaagcag agaaaccctc actccctttg 540

aaaaaggaaa actcaacttc aaatacaagt gaccaagaaa ttttgaacaa aattcaagaa 600

agcttgaaaa atgccaaaaa accaatcgtg attacaggac atgaaataat tagttttggc 660

ttagaaaaaa cagtcactca atttatttca aagacaaaac tacctattac gacattaaac 720

tttggtaaaa gttcagttga tgaagccctc ccttcatttt taggaatcta taatggtaca 780

ctctcagagc ctaatcttaa agaattcgtg gaatcagccg acttcatctt gatgcttgga 840

gttaaactca cagactcttc aacaggagcc ttcactcatc atttaaatga aaataaaatg 900

atttcactga atatagatga aggaaaaata tttaacgaaa gaatccaaaa ttttgatttt 960

gaatccctca tctcctctct cttagaccta agcgaaatag aatacaaagg aaaatatatc 1020

gataaaaagc aagaagactt tgttccatca aatgcgcttt tatcacaaga ccgcctatgg 1080

caagcagttg aaaacctaac tcaaagcaat gaaacaatcg ttgctgaaca agggacatca 1140

ttctttggcg cttcatcaat tttcttaaaa tcaaagagtc attttattgg tcaaccctta 1200

tggggatcaa ttggatatac attcccagca gcattaggaa gccaaattgc agataaagaa 1260

agcagacacc ttttatttat tggtgatggt tcacttcaac ttacagtgca agaattagga 1320

ttagcaatca gagaaaaaat taatccaatt tgctttatta tcaataatga tggttataca 1380

gtcgaaagag aaattcatgg accaaatcaa agctacaatg atattccaat gtggaattac 1440

tcaaaattac cagaatcgtt tggagcaaca gaagatcgag tagtctcaaa aatcgttaga 1500

actgaaaatg aatttgtgtc tgtcatgaaa gaagctcaag cagatccaaa tagaatgtac 1560

tggattgagt taattttggc aaaagaaggt gcaccaaaag tactgaaaaa aatgggcaaa 1620

ctatttgctg aacaaaataa atcataa 1647

<210> 224

<211> 548

<212> PRT

<213> 乳酸乳球菌

<400> 224

Met Tyr Thr Val Gly Asp Tyr Leu Leu Asp Arg Leu His Glu Leu Gly

1 5 10 15

Ile Glu Glu Ile Phe Gly Val Pro Gly Asp Tyr Asn Leu Gln Phe Leu

20 25 30

Asp Gln Ile Ile Ser His Lys Asp Met Lys Trp Val Gly Asn Ala Asn

35 40 45

Glu Leu Asn Ala Ser Tyr Met Ala Asp Gly Tyr Ala Arg Thr Lys Lys

50 55 60

Ala Ala Ala Phe Leu Thr Thr Phe Gly Val Gly Glu Leu Ser Ala Val

65 70 75 80

Asn Gly Leu Ala Gly Ser Tyr Ala Glu Asn Leu Pro Val Val Glu Ile

85 90 95

Val Gly Ser Pro Thr Ser Lys Val Gln Asn Glu Gly Lys Phe Val His

100 105 110

His Thr Leu Ala Asp Gly Asp Phe Lys His Phe Met Lys Met His Glu

115 120 125

Pro Val Thr Ala Ala Arg Thr Leu Leu Thr Ala Glu Asn Ala Thr Val

130 135 140

Glu Ile Asp Arg Val Leu Ser Ala Leu Leu Lys Glu Arg Lys Pro Val

145 150 155 160

Tyr Ile Asn Leu Pro Val Asp Val Ala Ala Ala Lys Ala Glu Lys Pro

165 170 175

Ser Leu Pro Leu Lys Lys Glu Asn Ser Thr Ser Asn Thr Ser Asp Gln

180 185 190

Glu Ile Leu Asn Lys Ile Gln Glu Ser Leu Lys Asn Ala Lys Lys Pro

195 200 205

Ile Val Ile Thr Gly His Glu Ile Ile Ser Phe Gly Leu Glu Lys Thr

210 215 220

Val Thr Gln Phe Ile Ser Lys Thr Lys Leu Pro Ile Thr Thr Leu Asn

225 230 235 240

Phe Gly Lys Ser Ser Val Asp Glu Ala Leu Pro Ser Phe Leu Gly Ile

245 250 255

Tyr Asn Gly Thr Leu Ser Glu Pro Asn Leu Lys Glu Phe Val Glu Ser

260 265 270

Ala Asp Phe Ile Leu Met Leu Gly Val Lys Leu Thr Asp Ser Ser Thr

275 280 285

Gly Ala Phe Thr His His Leu Asn Glu Asn Lys Met Ile Ser Leu Asn

290 295 300

Ile Asp Glu Gly Lys Ile Phe Asn Glu Arg Ile Gln Asn Phe Asp Phe

305 310 315 320

Glu Ser Leu Ile Ser Ser Leu Leu Asp Leu Ser Glu Ile Glu Tyr Lys

325 330 335

Gly Lys Tyr Ile Asp Lys Lys Gln Glu Asp Phe Val Pro Ser Asn Ala

340 345 350

Leu Leu Ser Gln Asp Arg Leu Trp Gln Ala Val Glu Asn Leu Thr Gln

355 360 365

Ser Asn Glu Thr Ile Val Ala Glu Gln Gly Thr Ser Phe Phe Gly Ala

370 375 380

Ser Ser Ile Phe Leu Lys Ser Lys Ser His Phe Ile Gly Gln Pro Leu

385 390 395 400

Trp Gly Ser Ile Gly Tyr Thr Phe Pro Ala Ala Leu Gly Ser Gln Ile

405 410 415

Ala Asp Lys Glu Ser Arg His Leu Leu Phe Ile Gly Asp Gly Ser Leu

420 425 430

Gln Leu Thr Val Gln Glu Leu Gly Leu Ala Ile Arg Glu Lys Ile Asn

435 440 445

Pro Ile Cys Phe Ile Ile Asn Asn Asp Gly Tyr Thr Val Glu Arg Glu

450 455 460

Ile His Gly Pro Asn Gln Ser Tyr Asn Asp Ile Pro Met Trp Asn Tyr

465 470 475 480

Ser Lys Leu Pro Glu Ser Phe Gly Ala Thr Glu Asp Arg Val Val Ser

485 490 495

Lys Ile Val Arg Thr Glu Asn Glu Phe Val Ser Val Met Lys Glu Ala

500 505 510

Gln Ala Asp Pro Asn Arg Met Tyr Trp Ile Glu Leu Ile Leu Ala Lys

515 520 525

Glu Gly Ala Pro Lys Val Leu Lys Lys Met Gly Lys Leu Phe Ala Glu

530 535 540

Gln Asn Lys Ser

545

<210> 225

<211> 2802

<212> DNA

<213> 大肠杆菌

<400> 225

atgcagaaca gcgctttgaa agcctggttg gactcttctt acctctctgg cgcaaaccag 60

agctggatag aacagctcta tgaagacttc ttaaccgatc ctgactcggt tgacgctaac 120

tggcgttcga cgttccagca gttacctggt acgggagtca aaccggatca attccactct 180

caaacgcgtg aatatttccg ccgcctggcg aaagacgctt cacgttactc ttcaacgatc 240

tccgaccctg acaccaatgt gaagcaggtt aaagtcctgc agctcattaa cgcataccgc 300

ttccgtggtc accagcatgc gaatctcgat ccgctgggac tgtggcagca agataaagtg 360

gccgatctgg atccgtcttt ccacgatctg accgaagcag acttccagga gaccttcaac 420

gtcggttcat ttgccagcgg caaagaaacc atgaaactcg gcgagctgct ggaagccctc 480

aagcaaacct actgcggccc gattggtgcc gagtatatgc acattaccag caccgaagaa 540

aaacgctgga tccaacagcg tatcgagtct ggtcgcgcga ctttcaatag cgaagagaaa 600

aaacgcttct taagcgaact gaccgccgct gaaggtcttg aacgttacct cggcgcaaaa 660

ttccctggcg caaaacgctt ctcgctggaa ggcggtgacg cgttaatccc gatgcttaaa 720

gagatgatcc gccacgctgg caacagcggc acccgcgaag tggttctcgg gatggcgcac 780

cgtggtcgtc tgaacgtgct ggtgaacgtg ctgggtaaaa aaccgcaaga cttgttcgac 840

gagttcgccg gtaaacataa agaacacctc ggcacgggtg acgtgaaata ccacatgggc 900

ttctcgtctg acttccagac cgatggcggc ctggtgcacc tggcgctggc gtttaacccg 960

tctcaccttg agattgtaag cccggtagtt atcggttctg ttcgtgcccg tctggacaga 1020

cttgatgagc cgagcagcaa caaagtgctg ccaatcacca tccacggtga cgccgcagtg 1080

accgggcagg gcgtggttca ggaaaccctg aacatgtcga aagcgcgtgg ttatgaagtt 1140

ggcggtacgg tacgtatcgt tatcaacaac caggttggtt tcaccacctc taatccgctg 1200

gatgcccgtt ctacgccgta ctgtactgat atcggtaaga tggttcaggc cccgattttc 1260

cacgttaacg cggacgatcc ggaagccgtt gcctttgtga cccgtctggc gctcgatttc 1320

cgtaacacct ttaaacgtga tgtcttcatc gacctggtgt gctaccgccg tcacggccac 1380

aacgaagccg acgagccgag cgcaacccag ccgctgatgt atcagaaaat caaaaaacat 1440

ccgacaccgc gcaaaatcta cgctgacaag ctggagcagg aaaaagtggc gacgctggaa 1500

gatgccaccg agatggttaa cctgtaccgc gatgcgctgg atgctggcga ttgcgtagtg 1560

gcagagtggc gtccgatgaa catgcactct ttcacctggt cgccgtacct caaccacgaa 1620

tgggacgaag agtacccgaa caaagttgag atgaagcgcc tgcaggagct ggcgaaacgc 1680

atcagcacgg tgccggaagc agttgaaatg cagtctcgcg ttgccaagat ttatggcgat 1740

cgccaggcga tggctgccgg tgagaaactg ttcgactggg gcggtgcgga aaacctcgct 1800

tacgccacgc tggttgatga aggcattccg gttcgcctgt cgggtgaaga ctccggtcgc 1860

ggtaccttct tccaccgcca cgcggtgatc cacaaccagt ctaacggttc cacttacacg 1920

ccgctgcaac atatccataa cgggcagggc gcgttccgtg tctgggactc cgtactgtct 1980

gaagaagcag tgctggcgtt tgaatatggt tatgccaccg cagaaccacg cactctgacc 2040

atctgggaag cgcagttcgg tgacttcgcc aacggtgcgc aggtggttat cgaccagttc 2100

atctcctctg gcgaacagaa atggggccgg atgtgtggtc tggtgatgtt gctgccgcac 2160

ggttacgaag ggcaggggcc ggagcactcc tccgcgcgtc tggaacgtta tctgcaactt 2220

tgtgctgagc aaaacatgca ggtttgcgta ccgtctaccc cggcacaggt ttaccacatg 2280

ctgcgtcgtc aggcgctgcg cgggatgcgt cgtccgctgg tcgtgatgtc gccgaaatcc 2340

ctgctgcgtc atccgctggc ggtttccagc ctcgaagaac tggcgaacgg caccttcctg 2400

ccagccatcg gtgaaatcga cgagcttgat ccgaagggcg tgaagcgcgt agtgatgtgt 2460

tctggtaagg tttattacga cctgctggaa cagcgtcgta agaacaatca acacgatgtc 2520

gccattgtgc gtatcgagca actctacccg ttcccgcata aagcgatgca ggaagtgttg 2580

cagcagtttg ctcacgtcaa ggattttgtc tggtgccagg aagagccgct caaccagggc 2640

gcatggtact gcagccagca tcatttccgt gaagtgattc cgtttggggc ttctctgcgt 2700

tatgcaggcc gcccggcctc cgcctctccg gcggtagggt atatgtccgt tcaccagaaa 2760

cagcaacaag atctggttaa tgacgcgctg aacgtcgaat aa 2802

<210> 226

<211> 933

<212> PRT

<213> 大肠杆菌

<400> 226

Met Gln Asn Ser Ala Leu Lys Ala Trp Leu Asp Ser Ser Tyr Leu Ser

1 5 10 15

Gly Ala Asn Gln Ser Trp Ile Glu Gln Leu Tyr Glu Asp Phe Leu Thr

20 25 30

Asp Pro Asp Ser Val Asp Ala Asn Trp Arg Ser Thr Phe Gln Gln Leu

35 40 45

Pro Gly Thr Gly Val Lys Pro Asp Gln Phe His Ser Gln Thr Arg Glu

50 55 60

Tyr Phe Arg Arg Leu Ala Lys Asp Ala Ser Arg Tyr Ser Ser Thr Ile

65 70 75 80

Ser Asp Pro Asp Thr Asn Val Lys Gln Val Lys Val Leu Gln Leu Ile

85 90 95

Asn Ala Tyr Arg Phe Arg Gly His Gln His Ala Asn Leu Asp Pro Leu

100 105 110

Gly Leu Trp Gln Gln Asp Lys Val Ala Asp Leu Asp Pro Ser Phe His

115 120 125

Asp Leu Thr Glu Ala Asp Phe Gln Glu Thr Phe Asn Val Gly Ser Phe

130 135 140

Ala Ser Gly Lys Glu Thr Met Lys Leu Gly Glu Leu Leu Glu Ala Leu

145 150 155 160

Lys Gln Thr Tyr Cys Gly Pro Ile Gly Ala Glu Tyr Met His Ile Thr

165 170 175

Ser Thr Glu Glu Lys Arg Trp Ile Gln Gln Arg Ile Glu Ser Gly Arg

180 185 190

Ala Thr Phe Asn Ser Glu Glu Lys Lys Arg Phe Leu Ser Glu Leu Thr

195 200 205

Ala Ala Glu Gly Leu Glu Arg Tyr Leu Gly Ala Lys Phe Pro Gly Ala

210 215 220

Lys Arg Phe Ser Leu Glu Gly Gly Asp Ala Leu Ile Pro Met Leu Lys

225 230 235 240

Glu Met Ile Arg His Ala Gly Asn Ser Gly Thr Arg Glu Val Val Leu

245 250 255

Gly Met Ala His Arg Gly Arg Leu Asn Val Leu Val Asn Val Leu Gly

260 265 270

Lys Lys Pro Gln Asp Leu Phe Asp Glu Phe Ala Gly Lys His Lys Glu

275 280 285

His Leu Gly Thr Gly Asp Val Lys Tyr His Met Gly Phe Ser Ser Asp

290 295 300

Phe Gln Thr Asp Gly Gly Leu Val His Leu Ala Leu Ala Phe Asn Pro

305 310 315 320

Ser His Leu Glu Ile Val Ser Pro Val Val Ile Gly Ser Val Arg Ala

325 330 335

Arg Leu Asp Arg Leu Asp Glu Pro Ser Ser Asn Lys Val Leu Pro Ile

340 345 350

Thr Ile His Gly Asp Ala Ala Val Thr Gly Gln Gly Val Val Gln Glu

355 360 365

Thr Leu Asn Met Ser Lys Ala Arg Gly Tyr Glu Val Gly Gly Thr Val

370 375 380

Arg Ile Val Ile Asn Asn Gln Val Gly Phe Thr Thr Ser Asn Pro Leu

385 390 395 400

Asp Ala Arg Ser Thr Pro Tyr Cys Thr Asp Ile Gly Lys Met Val Gln

405 410 415

Ala Pro Ile Phe His Val Asn Ala Asp Asp Pro Glu Ala Val Ala Phe

420 425 430

Val Thr Arg Leu Ala Leu Asp Phe Arg Asn Thr Phe Lys Arg Asp Val

435 440 445

Phe Ile Asp Leu Val Cys Tyr Arg Arg His Gly His Asn Glu Ala Asp

450 455 460

Glu Pro Ser Ala Thr Gln Pro Leu Met Tyr Gln Lys Ile Lys Lys His

465 470 475 480

Pro Thr Pro Arg Lys Ile Tyr Ala Asp Lys Leu Glu Gln Glu Lys Val

485 490 495

Ala Thr Leu Glu Asp Ala Thr Glu Met Val Asn Leu Tyr Arg Asp Ala

500 505 510

Leu Asp Ala Gly Asp Cys Val Val Ala Glu Trp Arg Pro Met Asn Met

515 520 525

His Ser Phe Thr Trp Ser Pro Tyr Leu Asn His Glu Trp Asp Glu Glu

530 535 540

Tyr Pro Asn Lys Val Glu Met Lys Arg Leu Gln Glu Leu Ala Lys Arg

545 550 555 560

Ile Ser Thr Val Pro Glu Ala Val Glu Met Gln Ser Arg Val Ala Lys

565 570 575

Ile Tyr Gly Asp Arg Gln Ala Met Ala Ala Gly Glu Lys Leu Phe Asp

580 585 590

Trp Gly Gly Ala Glu Asn Leu Ala Tyr Ala Thr Leu Val Asp Glu Gly

595 600 605

Ile Pro Val Arg Leu Ser Gly Glu Asp Ser Gly Arg Gly Thr Phe Phe

610 615 620

His Arg His Ala Val Ile His Asn Gln Ser Asn Gly Ser Thr Tyr Thr

625 630 635 640

Pro Leu Gln His Ile His Asn Gly Gln Gly Ala Phe Arg Val Trp Asp

645 650 655

Ser Val Leu Ser Glu Glu Ala Val Leu Ala Phe Glu Tyr Gly Tyr Ala

660 665 670

Thr Ala Glu Pro Arg Thr Leu Thr Ile Trp Glu Ala Gln Phe Gly Asp

675 680 685

Phe Ala Asn Gly Ala Gln Val Val Ile Asp Gln Phe Ile Ser Ser Gly

690 695 700

Glu Gln Lys Trp Gly Arg Met Cys Gly Leu Val Met Leu Leu Pro His

705 710 715 720

Gly Tyr Glu Gly Gln Gly Pro Glu His Ser Ser Ala Arg Leu Glu Arg

725 730 735

Tyr Leu Gln Leu Cys Ala Glu Gln Asn Met Gln Val Cys Val Pro Ser

740 745 750

Thr Pro Ala Gln Val Tyr His Met Leu Arg Arg Gln Ala Leu Arg Gly

755 760 765

Met Arg Arg Pro Leu Val Val Met Ser Pro Lys Ser Leu Leu Arg His

770 775 780

Pro Leu Ala Val Ser Ser Leu Glu Glu Leu Ala Asn Gly Thr Phe Leu

785 790 795 800

Pro Ala Ile Gly Glu Ile Asp Glu Leu Asp Pro Lys Gly Val Lys Arg

805 810 815

Val Val Met Cys Ser Gly Lys Val Tyr Tyr Asp Leu Leu Glu Gln Arg

820 825 830

Arg Lys Asn Asn Gln His Asp Val Ala Ile Val Arg Ile Glu Gln Leu

835 840 845

Tyr Pro Phe Pro His Lys Ala Met Gln Glu Val Leu Gln Gln Phe Ala

850 855 860

His Val Lys Asp Phe Val Trp Cys Gln Glu Glu Pro Leu Asn Gln Gly

865 870 875 880

Ala Trp Tyr Cys Ser Gln His His Phe Arg Glu Val Ile Pro Phe Gly

885 890 895

Ala Ser Leu Arg Tyr Ala Gly Arg Pro Ala Ser Ala Ser Pro Ala Val

900 905 910

Gly Tyr Met Ser Val His Gln Lys Gln Gln Gln Asp Leu Val Asn Asp

915 920 925

Ala Leu Asn Val Glu

930

<210> 227

<211> 1233

<212> DNA

<213> 大肠杆菌

<400> 227

atggcaaagg tatcgctgga gaaagacaag attaagtttc tgctggtaga aggcgtgcac 60

caaaaggcgc tggaaagcct tcgtgcagct ggttacacca acatcgaatt tcacaaaggc 120

gcgctggatg atgaacaatt aaaagaatcc atccgcgatg cccacttcat cggcctgcga 180

tcccgtaccc atctgactga agacgtgatc aacgccgcag aaaaactggt cgctattggc 240

tgtttctgta tcggaacaaa ccaggttgat ctggatgcgg cggcaaagcg cgggatcccg 300

gtatttaacg caccgttctc aaatacgcgc tctgttgcgg agctggtgat tggcgaactg 360

ctgctgctat tgcgcggcgt gccggaagcc aatgctaaag cgcaccgtgg cgtgtggaac 420

aaactggcgg cgggttcttt tgaagcgcgc ggcaaaaagc tgggtatcat cggctacggt 480

catattggta cgcaattggg cattctggct gaatcgctgg gaatgtatgt ttacttttat 540

gatattgaaa ataaactgcc gctgggcaac gccactcagg tacagcatct ttctgacctg 600

ctgaatatga gcgatgtggt gagtctgcat gtaccagaga atccgtccac caaaaatatg 660

atgggcgcga aagaaatttc actaatgaag cccggctcgc tgctgattaa tgcttcgcgc 720

ggtactgtgg tggatattcc ggcgctgtgt gatgcgctgg cgagcaaaca tctggcgggg 780

gcggcaatcg acgtattccc gacggaaccg gcgaccaata gcgatccatt tacctctccg 840

ctgtgtgaat tcgacaacgt ccttctgacg ccacacattg gcggttcgac tcaggaagcg 900

caggagaata tcggcctgga agttgcgggt aaattgatca agtattctga caatggctca 960

acgctctctg cggtgaactt cccggaagtc tcgctgccac tgcacggtgg gcgtcgtctg 1020

atgcacatcc acgaaaaccg tccgggcgtg ctaactgcgc tgaacaaaat cttcgccgag 1080

cagggcgtca acatcgccgc gcaatatctg caaacttccg cccagatggg ttatgtggtt 1140

attgatattg aagccgacga agacgttgcc gaaaaagcgc tgcaggcaat gaaagctatt 1200

ccgggtacca ttcgcgcccg tctgctgtac taa 1233

<210> 228

<211> 410

<212> PRT

<213> 大肠杆菌

<400> 228

Met Ala Lys Val Ser Leu Glu Lys Asp Lys Ile Lys Phe Leu Leu Val

1 5 10 15

Glu Gly Val His Gln Lys Ala Leu Glu Ser Leu Arg Ala Ala Gly Tyr

20 25 30

Thr Asn Ile Glu Phe His Lys Gly Ala Leu Asp Asp Glu Gln Leu Lys

35 40 45

Glu Ser Ile Arg Asp Ala His Phe Ile Gly Leu Arg Ser Arg Thr His

50 55 60

Leu Thr Glu Asp Val Ile Asn Ala Ala Glu Lys Leu Val Ala Ile Gly

65 70 75 80

Cys Phe Cys Ile Gly Thr Asn Gln Val Asp Leu Asp Ala Ala Ala Lys

85 90 95

Arg Gly Ile Pro Val Phe Asn Ala Pro Phe Ser Asn Thr Arg Ser Val

100 105 110

Ala Glu Leu Val Ile Gly Glu Leu Leu Leu Leu Leu Arg Gly Val Pro

115 120 125

Glu Ala Asn Ala Lys Ala His Arg Gly Val Trp Asn Lys Leu Ala Ala

130 135 140

Gly Ser Phe Glu Ala Arg Gly Lys Lys Leu Gly Ile Ile Gly Tyr Gly

145 150 155 160

His Ile Gly Thr Gln Leu Gly Ile Leu Ala Glu Ser Leu Gly Met Tyr

165 170 175

Val Tyr Phe Tyr Asp Ile Glu Asn Lys Leu Pro Leu Gly Asn Ala Thr

180 185 190

Gln Val Gln His Leu Ser Asp Leu Leu Asn Met Ser Asp Val Val Ser

195 200 205

Leu His Val Pro Glu Asn Pro Ser Thr Lys Asn Met Met Gly Ala Lys

210 215 220

Glu Ile Ser Leu Met Lys Pro Gly Ser Leu Leu Ile Asn Ala Ser Arg

225 230 235 240

Gly Thr Val Val Asp Ile Pro Ala Leu Cys Asp Ala Leu Ala Ser Lys

245 250 255

His Leu Ala Gly Ala Ala Ile Asp Val Phe Pro Thr Glu Pro Ala Thr

260 265 270

Asn Ser Asp Pro Phe Thr Ser Pro Leu Cys Glu Phe Asp Asn Val Leu

275 280 285

Leu Thr Pro His Ile Gly Gly Ser Thr Gln Glu Ala Gln Glu Asn Ile

290 295 300

Gly Leu Glu Val Ala Gly Lys Leu Ile Lys Tyr Ser Asp Asn Gly Ser

305 310 315 320

Thr Leu Ser Ala Val Asn Phe Pro Glu Val Ser Leu Pro Leu His Gly

325 330 335

Gly Arg Arg Leu Met His Ile His Glu Asn Arg Pro Gly Val Leu Thr

340 345 350

Ala Leu Asn Lys Ile Phe Ala Glu Gln Gly Val Asn Ile Ala Ala Gln

355 360 365

Tyr Leu Gln Thr Ser Ala Gln Met Gly Tyr Val Val Ile Asp Ile Glu

370 375 380

Ala Asp Glu Asp Val Ala Glu Lys Ala Leu Gln Ala Met Lys Ala Ile

385 390 395 400

Pro Gly Thr Ile Arg Ala Arg Leu Leu Tyr

405 410

<210> 229

<211> 1089

<212> DNA

<213> 大肠杆菌

<400> 229

atggctcaaa tcttcaattt tagttctggt ccggcaatgc taccggcaga ggtgcttaaa 60

caggctcaac aggaactgcg cgactggaac ggtcttggta cgtcggtgat ggaagtgagt 120

caccgtggca aagagttcat tcaggttgca gaggaagccg agaaggattt tcgcgatctt 180

cttaatgtcc cctccaacta caaggtatta ttctgccatg gcggtggtcg cggtcagttt 240

gctgcggtac cgctgaatat tctcggtgat aaaaccaccg cagattatgt tgatgccggt 300

tactgggcgg caagtgccat taaagaagcg aaaaaatact gcacgcctaa tgtctttgac 360

gccaaagtga ctgttgatgg tctgcgcgcg gttaagccaa tgcgtgaatg gcaactctct 420

gataatgctg cttatatgca ttattgcccg aatgaaacca tcgatggtat cgccatcgac 480

gaaacgccag acttcggcgc agatgtggtg gtcgccgctg acttctcttc aaccattctt 540

tcccgtccga ttgacgtcag ccgttatggt gtaatttacg ctggcgcgca gaaaaatatc 600

ggcccggctg gcctgacaat cgtcatcgtt cgtgaagatt tgctgggcaa agcgaatatc 660

gcgtgtccgt cgattctgga ttattccatc ctcaacgata acggctccat gtttaacacg 720

ccgccgacat ttgcctggta tctatctggt ctggtcttta aatggctgaa agcgaacggc 780

ggtgtagctg aaatggataa aatcaatcag caaaaagcag aactgctata tggggtgatt 840

gataacagcg atttctaccg caatgacgtg gcgaaagcta accgttcgcg gatgaacgtg 900

ccgttccagt tggcggacag tgcgcttgac aaattgttcc ttgaagagtc ttttgctgct 960

ggccttcatg cactgaaagg tcaccgtgtg gtcggcggaa tgcgcgcttc tatttataac 1020

gccatgccgc tggaaggcgt taaagcgctg acagacttca tggttgagtt cgaacgccgt 1080

cacggttaa 1089

<210> 230

<211> 362

<212> PRT

<213> 大肠杆菌

<400> 230

Met Ala Gln Ile Phe Asn Phe Ser Ser Gly Pro Ala Met Leu Pro Ala

1 5 10 15

Glu Val Leu Lys Gln Ala Gln Gln Glu Leu Arg Asp Trp Asn Gly Leu

20 25 30

Gly Thr Ser Val Met Glu Val Ser His Arg Gly Lys Glu Phe Ile Gln

35 40 45

Val Ala Glu Glu Ala Glu Lys Asp Phe Arg Asp Leu Leu Asn Val Pro

50 55 60

Ser Asn Tyr Lys Val Leu Phe Cys His Gly Gly Gly Arg Gly Gln Phe

65 70 75 80

Ala Ala Val Pro Leu Asn Ile Leu Gly Asp Lys Thr Thr Ala Asp Tyr

85 90 95

Val Asp Ala Gly Tyr Trp Ala Ala Ser Ala Ile Lys Glu Ala Lys Lys

100 105 110

Tyr Cys Thr Pro Asn Val Phe Asp Ala Lys Val Thr Val Asp Gly Leu

115 120 125

Arg Ala Val Lys Pro Met Arg Glu Trp Gln Leu Ser Asp Asn Ala Ala

130 135 140

Tyr Met His Tyr Cys Pro Asn Glu Thr Ile Asp Gly Ile Ala Ile Asp

145 150 155 160

Glu Thr Pro Asp Phe Gly Ala Asp Val Val Val Ala Ala Asp Phe Ser

165 170 175

Ser Thr Ile Leu Ser Arg Pro Ile Asp Val Ser Arg Tyr Gly Val Ile

180 185 190

Tyr Ala Gly Ala Gln Lys Asn Ile Gly Pro Ala Gly Leu Thr Ile Val

195 200 205

Ile Val Arg Glu Asp Leu Leu Gly Lys Ala Asn Ile Ala Cys Pro Ser

210 215 220

Ile Leu Asp Tyr Ser Ile Leu Asn Asp Asn Gly Ser Met Phe Asn Thr

225 230 235 240

Pro Pro Thr Phe Ala Trp Tyr Leu Ser Gly Leu Val Phe Lys Trp Leu

245 250 255

Lys Ala Asn Gly Gly Val Ala Glu Met Asp Lys Ile Asn Gln Gln Lys

260 265 270

Ala Glu Leu Leu Tyr Gly Val Ile Asp Asn Ser Asp Phe Tyr Arg Asn

275 280 285

Asp Val Ala Lys Ala Asn Arg Ser Arg Met Asn Val Pro Phe Gln Leu

290 295 300

Ala Asp Ser Ala Leu Asp Lys Leu Phe Leu Glu Glu Ser Phe Ala Ala

305 310 315 320

Gly Leu His Ala Leu Lys Gly His Arg Val Val Gly Gly Met Arg Ala

325 330 335

Ser Ile Tyr Asn Ala Met Pro Leu Glu Gly Val Lys Ala Leu Thr Asp

340 345 350

Phe Met Val Glu Phe Glu Arg Arg His Gly

355 360

<210> 231

<211> 579

<212> DNA

<213> 大肠杆菌

<400> 231

gtggaatacc gtagcctgac gcttgatgat tttttatcgc gctttcaact tttgcgcccg 60

caaattaacc gggaaaccct aaatcatcgt caggctgctg tgttaatccc catcgtccgt 120

cgaccgcaac cggggttgtt gctgactcag cgttcgattc atctgcgtaa acacgctgga 180

caagtggcat tccctggagg tgcagtcgat gacacggacg catcagctat cgccgccgcg 240

ctgcgcgaag ctgaagaaga ggtcgctata ccgccttccg ccgttgaagt tatcggcgtg 300

ctgccgcccg tcgatagcgt cactggctac caggtaaccc cagtggtcgg cattatcccg 360

cccgatctgc cgtatcgcgc cagtgaagat gaagtctcgg cggtgtttga aatgccgctc 420

gcccaggcat tacatctggg tcgttatcac cctttagata tctaccgccg tggtgattca 480

catcgggtat ggctgtcctg gtacgaacag tattttgtat ggggaatgac cgcaggcata 540

attcgtgagc tggcgctgca aattggtgtg aaaccctga 579

<210> 232

<211> 192

<212> PRT

<213> 大肠杆菌

<400> 232

Met Glu Tyr Arg Ser Leu Thr Leu Asp Asp Phe Leu Ser Arg Phe Gln

1 5 10 15

Leu Leu Arg Pro Gln Ile Asn Arg Glu Thr Leu Asn His Arg Gln Ala

20 25 30

Ala Val Leu Ile Pro Ile Val Arg Arg Pro Gln Pro Gly Leu Leu Leu

35 40 45

Thr Gln Arg Ser Ile His Leu Arg Lys His Ala Gly Gln Val Ala Phe

50 55 60

Pro Gly Gly Ala Val Asp Asp Thr Asp Ala Ser Ala Ile Ala Ala Ala

65 70 75 80

Leu Arg Glu Ala Glu Glu Glu Val Ala Ile Pro Pro Ser Ala Val Glu

85 90 95

Val Ile Gly Val Leu Pro Pro Val Asp Ser Val Thr Gly Tyr Gln Val

100 105 110

Thr Pro Val Val Gly Ile Ile Pro Pro Asp Leu Pro Tyr Arg Ala Ser

115 120 125

Glu Asp Glu Val Ser Ala Val Phe Glu Met Pro Leu Ala Gln Ala Leu

130 135 140

His Leu Gly Arg Tyr His Pro Leu Asp Ile Tyr Arg Arg Gly Asp Ser

145 150 155 160

His Arg Val Trp Leu Ser Trp Tyr Glu Gln Tyr Phe Val Trp Gly Met

165 170 175

Thr Ala Gly Ile Ile Arg Glu Leu Ala Leu Gln Ile Gly Val Lys Pro

180 185 190

<210> 233

<211> 969

<212> DNA

<213> 大肠杆菌

<400> 233

atgcctaaca ttacctggtg cgacctgcct gaagatgtct ctttatggcc gggtctgcct 60

ctttcattaa gtggtgatga agtgatgcca ctggattacc acgcaggtcg tagcggctgg 120

ctgctgtatg gtcgtgggct ggataaacaa cgtctgaccc aataccagag caaactgggt 180

gcggcgatgg tgattgttgc cgcctggtgc gtggaagatt atcaggtgat tcgtctggca 240

ggttcactca ccgcacgggc tacacgcctg gcccacgaag cgcagctgga tgtcgccccg 300

ctggggaaaa tcccgcacct gcgcacgccg ggtttgctgg tgatggatat ggactccacc 360

gccatccaga ttgaatgtat tgatgaaatt gccaaactgg ccggaacggg cgagatggtg 420

gcggaagtaa ccgaacgggc gatgcgcggc gaactcgatt ttaccgccag cctgcgcagc 480

cgtgtggcga cgctgaaagg cgctgacgcc aatattctgc aacaggtgcg tgaaaatctg 540

ccgctgatgc caggcttaac gcaactggtg ctcaagctgg aaacgctggg ctggaaagtg 600

gcgattgcct ccggcggctt tactttcttt gctgaatacc tgcgcgacaa gctgcgcctg 660

accgccgtgg tagccaatga actggagatc atggacggta aatttaccgg caatgtgatc 720

ggcgacatcg tagacgcgca gtacaaagcg aaaactctga ctcgcctcgc gcaggagtat 780

gaaatcccgc tggcgcagac cgtggcgatt ggcgatggag ccaatgacct gccgatgatc 840

aaagcggcag ggctggggat tgcctaccat gccaagccaa aagtgaatga aaaggcggaa 900

gtcaccatcc gtcacgctga cctgatgggg gtattctgca tcctctcagg cagcctgaat 960

cagaagtaa 969

<210> 234

<211> 322

<212> PRT

<213> 大肠杆菌

<400> 234

Met Pro Asn Ile Thr Trp Cys Asp Leu Pro Glu Asp Val Ser Leu Trp

1 5 10 15

Pro Gly Leu Pro Leu Ser Leu Ser Gly Asp Glu Val Met Pro Leu Asp

20 25 30

Tyr His Ala Gly Arg Ser Gly Trp Leu Leu Tyr Gly Arg Gly Leu Asp

35 40 45

Lys Gln Arg Leu Thr Gln Tyr Gln Ser Lys Leu Gly Ala Ala Met Val

50 55 60

Ile Val Ala Ala Trp Cys Val Glu Asp Tyr Gln Val Ile Arg Leu Ala

65 70 75 80

Gly Ser Leu Thr Ala Arg Ala Thr Arg Leu Ala His Glu Ala Gln Leu

85 90 95

Asp Val Ala Pro Leu Gly Lys Ile Pro His Leu Arg Thr Pro Gly Leu

100 105 110

Leu Val Met Asp Met Asp Ser Thr Ala Ile Gln Ile Glu Cys Ile Asp

115 120 125

Glu Ile Ala Lys Leu Ala Gly Thr Gly Glu Met Val Ala Glu Val Thr

130 135 140

Glu Arg Ala Met Arg Gly Glu Leu Asp Phe Thr Ala Ser Leu Arg Ser

145 150 155 160

Arg Val Ala Thr Leu Lys Gly Ala Asp Ala Asn Ile Leu Gln Gln Val

165 170 175

Arg Glu Asn Leu Pro Leu Met Pro Gly Leu Thr Gln Leu Val Leu Lys

180 185 190

Leu Glu Thr Leu Gly Trp Lys Val Ala Ile Ala Ser Gly Gly Phe Thr

195 200 205

Phe Phe Ala Glu Tyr Leu Arg Asp Lys Leu Arg Leu Thr Ala Val Val

210 215 220

Ala Asn Glu Leu Glu Ile Met Asp Gly Lys Phe Thr Gly Asn Val Ile

225 230 235 240

Gly Asp Ile Val Asp Ala Gln Tyr Lys Ala Lys Thr Leu Thr Arg Leu

245 250 255

Ala Gln Glu Tyr Glu Ile Pro Leu Ala Gln Thr Val Ala Ile Gly Asp

260 265 270

Gly Ala Asn Asp Leu Pro Met Ile Lys Ala Ala Gly Leu Gly Ile Ala

275 280 285

Tyr His Ala Lys Pro Lys Val Asn Glu Lys Ala Glu Val Thr Ile Arg

290 295 300

His Ala Asp Leu Met Gly Val Phe Cys Ile Leu Ser Gly Ser Leu Asn

305 310 315 320

Gln Lys

<210> 235

<211> 2233

<212> DNA

<213> 拟南芥

<400> 235

cgaaagggca aaaaccaaaa agagaatcaa attttgcctc ttctatataa atcaaatcaa 60

cgacgaagcg tcgctctcgt tttctgtgtg tctctctctt tgtcccacca ttttcaccgc 120

ttctcctcca atcactcaga tctacagatt cctttaaaac aacaatggtt ggatctttgg 180

aatctgatca aactctttca atggccacct taatcgaaaa actcgacatc ttatctgacg 240

acttcgatcc aaccgccgta gtcaccgaac cgttacctcc tccggtaact aatggaatcg 300

gagctgataa aggaggagga ggaggagaaa gagagatggt tctcggtagg aatatacaca 360

caacgtcact cgctgtaacg gaaccggagg ttaacgatga attcaccgga gataaagaag 420

cttatatggc tagtgttctt gctcgttacc ggaaaacttt ggttgaacga accaaaaacc 480

atttaggtaa aatttgatct gatctgatct ttttttttga atcggaatcg gaatctgaat 540

cggaatctgg tgtaggttat ccttataact tggatttcga ctatggtgcg cttggtcagt 600

tacaacattt ttcgattaat aatcttggag atccgtttat tgaaagtaac tatggtgtac 660

actcaagacc ttttgaagtt ggtgtgttgg attggtttgc tcgtctttgg gagattgaga 720

gagatgatta ttggggttac attaccaatt gtggtactga aggcaacctt catggcattt 780

tagtcgggta cgtttttcga aaatcatcgg tgttttgatt cattcgaaaa accgaaaaaa 840

aacggtgttt gatttgatgt gtgtttgtag gagggagatg tttccggatg ggatattgta 900

tgcgtcgcgt gaatcgcatt actcggtgtt taaagctgct cgaatgtatc gaatggagtg 960

tgagaaggtt gatacgctta tgtcagggga gattgattgt gatgatttga ggaagaagtt 1020

gttggctaat aaagataaac cggcgattct taatgttaac ataggttggt ttatgtttta 1080

gtactttggc tttgtttgtt gtgttaggat tggtgctaat ggttgaaatc ttgttttctt 1140

taggaacgac ggttaaagga gctgttgatg atcttgacct tgttatcaaa actcttgaag 1200

agtgtggttt ctcacatgat aggttctata ttcattgtga tggagctttg tttggactta 1260

tgatgccttt tgtcaaacgt gtaagtgtat agtcttcagt ctaagcgaaa tcgttatgat 1320

aatctttgtt ctgctctgag atttgttgtt ttatctcctc tgtaggcacc gaaagtgacg 1380

tttaataaac cgatagggag tgtgagtgta tcgggccaca aatttgtcgg gtgtccaatg 1440

ccatgtggtg ttcagataac aagaatggaa catatcaaag tcctctccag taacgttgag 1500

taccttgctt caagggatgc aacaatcatg ggaagtcgta acgggcatgc tcctttgttc 1560

ctctggtaca ccttaaacag gaaaggttac aaaggattcc agaaagaagt tcagaaatgc 1620

ttgagaaacg cgcattacct caaagaccga cttcgtgaag ctgggattag cgccatgctt 1680

aatgagctta gcagcactgt ggtctttgaa cggcctaaag atgaagagtt tgttagaagg 1740

tggcagcttg cttgccaagg tgatatagct catgtggtgg ttatgccaag tgttacaatc 1800

gagaagcttg ataatttcct gaaagacctt gtcaaacaca gattgatctg gtacgaggat 1860

ggatctcagc ctccttgcct tgcatcggag gtaggaacca acaactgcat ctgtccagct 1920

cacaagtgac ggcaccattt ctcatttgtt ggtattgttg ttttctagta agccacatct 1980

agtttaaatt cctcatcact gtattcctga acttggtttc aatcatcgta aaattttgtc 2040

agtttctctt atttacaagt taaggtttca aacagtgttt acaatttgta gctcaatctg 2100

gagcatgatc aaccttcact tcgtcgttcg caatcgttta ccgagtttta gcattatcgt 2160

aacagcaagt atgtgcctta agccgctgat ttagctgcgt gtttgatgat cggtgcttaa 2220

tgcctaggaa aag 2233

<210> 236

<211> 482

<212> PRT

<213> 拟南芥

<400> 236

Met Val Gly Ser Leu Glu Ser Asp Gln Thr Leu Ser Met Ala Thr Leu

1 5 10 15

Ile Glu Lys Leu Asp Ile Leu Ser Asp Asp Phe Asp Pro Thr Ala Val

20 25 30

Val Thr Glu Pro Leu Pro Pro Pro Val Thr Asn Gly Ile Gly Ala Asp

35 40 45

Lys Gly Gly Gly Gly Gly Glu Arg Glu Met Val Leu Gly Arg Asn Ile

50 55 60

His Thr Thr Ser Leu Ala Val Thr Glu Pro Glu Val Asn Asp Glu Phe

65 70 75 80

Thr Gly Asp Lys Glu Ala Tyr Met Ala Ser Val Leu Ala Arg Tyr Arg

85 90 95

Lys Thr Leu Val Glu Arg Thr Lys Asn His Leu Gly Tyr Pro Tyr Asn

100 105 110

Leu Asp Phe Asp Tyr Gly Ala Leu Gly Gln Leu Gln His Phe Ser Ile

115 120 125

Asn Asn Leu Gly Asp Pro Phe Ile Glu Ser Asn Tyr Gly Val His Ser

130 135 140

Arg Pro Phe Glu Val Gly Val Leu Asp Trp Phe Ala Arg Leu Trp Glu

145 150 155 160

Ile Glu Arg Asp Asp Tyr Trp Gly Tyr Ile Thr Asn Cys Gly Thr Glu

165 170 175

Gly Asn Leu His Gly Ile Leu Val Gly Arg Glu Met Phe Pro Asp Gly

180 185 190

Ile Leu Tyr Ala Ser Arg Glu Ser His Tyr Ser Val Phe Lys Ala Ala

195 200 205

Arg Met Tyr Arg Met Glu Cys Glu Lys Val Asp Thr Leu Met Ser Gly

210 215 220

Glu Ile Asp Cys Asp Asp Leu Arg Lys Lys Leu Leu Ala Asn Lys Asp

225 230 235 240

Lys Pro Ala Ile Leu Asn Val Asn Ile Gly Thr Thr Val Lys Gly Ala

245 250 255

Val Asp Asp Leu Asp Leu Val Ile Lys Thr Leu Glu Glu Cys Gly Phe

260 265 270

Ser His Asp Arg Phe Tyr Ile His Cys Asp Gly Ala Leu Phe Gly Leu

275 280 285

Met Met Pro Phe Val Lys Arg Ala Pro Lys Val Thr Phe Asn Lys Pro

290 295 300

Ile Gly Ser Val Ser Val Ser Gly His Lys Phe Val Gly Cys Pro Met

305 310 315 320

Pro Cys Gly Val Gln Ile Thr Arg Met Glu His Ile Lys Val Leu Ser

325 330 335

Ser Asn Val Glu Tyr Leu Ala Ser Arg Asp Ala Thr Ile Met Gly Ser

340 345 350

Arg Asn Gly His Ala Pro Leu Phe Leu Trp Tyr Thr Leu Asn Arg Lys

355 360 365

Gly Tyr Lys Gly Phe Gln Lys Glu Val Gln Lys Cys Leu Arg Asn Ala

370 375 380

His Tyr Leu Lys Asp Arg Leu Arg Glu Ala Gly Ile Ser Ala Met Leu

385 390 395 400

Asn Glu Leu Ser Ser Thr Val Val Phe Glu Arg Pro Lys Asp Glu Glu

405 410 415

Phe Val Arg Arg Trp Gln Leu Ala Cys Gln Gly Asp Ile Ala His Val

420 425 430

Val Val Met Pro Ser Val Thr Ile Glu Lys Leu Asp Asn Phe Leu Lys

435 440 445

Asp Leu Val Lys His Arg Leu Ile Trp Tyr Glu Asp Gly Ser Gln Pro

450 455 460

Pro Cys Leu Ala Ser Glu Val Gly Thr Asn Asn Cys Ile Cys Pro Ala

465 470 475 480

His Lys

<210> 237

<211> 2274

<212> DNA

<213> 大肠杆菌

<400> 237

atgggaagcc cctctctgta ttctgcccgt aaaacaaccc tggcgttggc agtcgcctta 60

agtttcgcct ggcaagcgcc ggtatttgcc cacggtggtg aagcgcatat ggtgccaatg 120

gataaaacgc ttaaagaatt tggtgccgat gtgcagtggg acgactacgc ccagctcttt 180

accctgatta aagatggcgc gtacgtgaaa gtgaagcctg gtgcgcaaac agcaattgtt 240

aatggtcagc ctctggcact gcaagtaccg gtagtgatga aagacaataa agcctgggtt 300

tctgacacct ttattaacga tgttttccag tccgggctgg atcaaacctt tcaggtagaa 360

aagcgccctc acccacttaa tgcgctaact gcggacgaaa ttaaacaggc cgttgaaatt 420

gttaaagctt ccgcggactt caaacccaat acccgtttta ctgagatctc cctgctaccg 480

ccagataaag aagctgtctg ggcgtttgcg ctggaaaaca aaccggttga ccagccgcgc 540

aaagccgacg tcattatgct cgacggcaaa catatcatcg aagcggtggt ggatctgcaa 600

aacaacaaac tgctctcctg gcaacccatt aaagacgccc acggtatggt gttgctggat 660

gatttcgcca gtgtgcagaa cattattaac aacagtgaag aatttgccgc tgccgtgaag 720

aaacgcggta ttactgatgc gaaaaaagtg attaccacgc cgctgaccgt aggttatttc 780

gatggtaaag atggcctgaa acaagatgcc cggttgctca aagtcatcag ctatcttgat 840

gtcggtgatg gcaactactg ggcacatccc atcgaaaacc tggtggcggt cgttgattta 900

gaacagaaaa aaatcgttaa gattgaagaa ggtccggtag ttccggtgcc aatgaccgca 960

cgcccatttg atggccgtga ccgcgttgct ccggcagtta agcctatgca aatcattgag 1020

cctgaaggta aaaattacac cattactggc gatatgattc actggcggaa ctgggatttt 1080

cacctcagca tgaactctcg cgtcgggccg atgatctcca ccgtgactta taacgacaat 1140

ggcaccaaac gcaaagtcat gtacgaaggt tctctcggcg gcatgattgt gccttacggt 1200

gatcctgata ttggctggta ctttaaagcg tatctggact ctggtgacta cggtatgggc 1260

acgctaacct caccaattgc tcgtggtaaa gatgccccgt ctaacgcagt gctccttaat 1320

gaaaccatcg ccgactacac tggcgtgccg atggagatcc ctcgcgctat cgcggtattt 1380

gaacgttatg ccgggccgga gtataagcat caggaaatgg gccagcccaa cgtcagtacc 1440

gaacgccggg agttagtggt gcgctggatc agtacagtgg gtaactatga ctacattttt 1500

gactggatct tccatgaaaa cggcactatt ggcatcgatg ccggtgctac gggcatcgaa 1560

gcggtgaaag gtgttaaagc gaaaaccatg cacgatgaga cggcgaaaga tgacacgcgc 1620

tacggcacgc ttatcgatca caatatcgtg ggtactacac accaacatat ttataatttc 1680

cgcctcgatc tggatgtaga tggcgagaat aacagcctgg tggcgatgga cccagtggta 1740

aaaccgaata ctgccggtgg cccacgcacc agtaccatgc aagttaatca gtacaacatc 1800

ggcaatgaac aggatgccgc acagaaattt gatccgggca cgattcgtct gttgagtaac 1860

ccgaacaaag agaaccgcat gggcaatccg gtttcctatc aaattattcc ttatgcaggt 1920

ggtactcacc cggtagcaaa aggtgcccag ttcgcgccgg acgagtggat ctatcatcgt 1980

ttaagcttta tggacaagca gctctgggta acgcgttatc atcctggcga gcgtttcccg 2040

gaaggcaaat atccgaaccg ttctactcat gacaccggtc ttggacaata cagtaaggat 2100

aacgagtcgc tggacaacac cgacgccgtt gtctggatga ccaccggcac cacacatgtg 2160

gcccgcgccg aagagtggcc gattatgccg accgaatggg tacatactct gctgaaacca 2220

tggaacttct ttgacgaaac gccaacgcta ggggcgctga agaaagataa gtga 2274

<210> 238

<211> 757

<212> PRT

<213> 大肠杆菌

<400> 238

Met Gly Ser Pro Ser Leu Tyr Ser Ala Arg Lys Thr Thr Leu Ala Leu

1 5 10 15

Ala Val Ala Leu Ser Phe Ala Trp Gln Ala Pro Val Phe Ala His Gly

20 25 30

Gly Glu Ala His Met Val Pro Met Asp Lys Thr Leu Lys Glu Phe Gly

35 40 45

Ala Asp Val Gln Trp Asp Asp Tyr Ala Gln Leu Phe Thr Leu Ile Lys

50 55 60

Asp Gly Ala Tyr Val Lys Val Lys Pro Gly Ala Gln Thr Ala Ile Val

65 70 75 80

Asn Gly Gln Pro Leu Ala Leu Gln Val Pro Val Val Met Lys Asp Asn

85 90 95

Lys Ala Trp Val Ser Asp Thr Phe Ile Asn Asp Val Phe Gln Ser Gly

100 105 110

Leu Asp Gln Thr Phe Gln Val Glu Lys Arg Pro His Pro Leu Asn Ala

115 120 125

Leu Thr Ala Asp Glu Ile Lys Gln Ala Val Glu Ile Val Lys Ala Ser

130 135 140

Ala Asp Phe Lys Pro Asn Thr Arg Phe Thr Glu Ile Ser Leu Leu Pro

145 150 155 160

Pro Asp Lys Glu Ala Val Trp Ala Phe Ala Leu Glu Asn Lys Pro Val

165 170 175

Asp Gln Pro Arg Lys Ala Asp Val Ile Met Leu Asp Gly Lys His Ile

180 185 190

Ile Glu Ala Val Val Asp Leu Gln Asn Asn Lys Leu Leu Ser Trp Gln

195 200 205

Pro Ile Lys Asp Ala His Gly Met Val Leu Leu Asp Asp Phe Ala Ser

210 215 220

Val Gln Asn Ile Ile Asn Asn Ser Glu Glu Phe Ala Ala Ala Val Lys

225 230 235 240

Lys Arg Gly Ile Thr Asp Ala Lys Lys Val Ile Thr Thr Pro Leu Thr

245 250 255

Val Gly Tyr Phe Asp Gly Lys Asp Gly Leu Lys Gln Asp Ala Arg Leu

260 265 270

Leu Lys Val Ile Ser Tyr Leu Asp Val Gly Asp Gly Asn Tyr Trp Ala

275 280 285

His Pro Ile Glu Asn Leu Val Ala Val Val Asp Leu Glu Gln Lys Lys

290 295 300

Ile Val Lys Ile Glu Glu Gly Pro Val Val Pro Val Pro Met Thr Ala

305 310 315 320

Arg Pro Phe Asp Gly Arg Asp Arg Val Ala Pro Ala Val Lys Pro Met

325 330 335

Gln Ile Ile Glu Pro Glu Gly Lys Asn Tyr Thr Ile Thr Gly Asp Met

340 345 350

Ile His Trp Arg Asn Trp Asp Phe His Leu Ser Met Asn Ser Arg Val

355 360 365

Gly Pro Met Ile Ser Thr Val Thr Tyr Asn Asp Asn Gly Thr Lys Arg

370 375 380

Lys Val Met Tyr Glu Gly Ser Leu Gly Gly Met Ile Val Pro Tyr Gly

385 390 395 400

Asp Pro Asp Ile Gly Trp Tyr Phe Lys Ala Tyr Leu Asp Ser Gly Asp

405 410 415

Tyr Gly Met Gly Thr Leu Thr Ser Pro Ile Ala Arg Gly Lys Asp Ala

420 425 430

Pro Ser Asn Ala Val Leu Leu Asn Glu Thr Ile Ala Asp Tyr Thr Gly

435 440 445

Val Pro Met Glu Ile Pro Arg Ala Ile Ala Val Phe Glu Arg Tyr Ala

450 455 460

Gly Pro Glu Tyr Lys His Gln Glu Met Gly Gln Pro Asn Val Ser Thr

465 470 475 480

Glu Arg Arg Glu Leu Val Val Arg Trp Ile Ser Thr Val Gly Asn Tyr

485 490 495

Asp Tyr Ile Phe Asp Trp Ile Phe His Glu Asn Gly Thr Ile Gly Ile

500 505 510

Asp Ala Gly Ala Thr Gly Ile Glu Ala Val Lys Gly Val Lys Ala Lys

515 520 525

Thr Met His Asp Glu Thr Ala Lys Asp Asp Thr Arg Tyr Gly Thr Leu

530 535 540

Ile Asp His Asn Ile Val Gly Thr Thr His Gln His Ile Tyr Asn Phe

545 550 555 560

Arg Leu Asp Leu Asp Val Asp Gly Glu Asn Asn Ser Leu Val Ala Met

565 570 575

Asp Pro Val Val Lys Pro Asn Thr Ala Gly Gly Pro Arg Thr Ser Thr

580 585 590

Met Gln Val Asn Gln Tyr Asn Ile Gly Asn Glu Gln Asp Ala Ala Gln

595 600 605

Lys Phe Asp Pro Gly Thr Ile Arg Leu Leu Ser Asn Pro Asn Lys Glu

610 615 620

Asn Arg Met Gly Asn Pro Val Ser Tyr Gln Ile Ile Pro Tyr Ala Gly

625 630 635 640

Gly Thr His Pro Val Ala Lys Gly Ala Gln Phe Ala Pro Asp Glu Trp

645 650 655

Ile Tyr His Arg Leu Ser Phe Met Asp Lys Gln Leu Trp Val Thr Arg

660 665 670

Tyr His Pro Gly Glu Arg Phe Pro Glu Gly Lys Tyr Pro Asn Arg Ser

675 680 685

Thr His Asp Thr Gly Leu Gly Gln Tyr Ser Lys Asp Asn Glu Ser Leu

690 695 700

Asp Asn Thr Asp Ala Val Val Trp Met Thr Thr Gly Thr Thr His Val

705 710 715 720

Ala Arg Ala Glu Glu Trp Pro Ile Met Pro Thr Glu Trp Val His Thr

725 730 735

Leu Leu Lys Pro Trp Asn Phe Phe Asp Glu Thr Pro Thr Leu Gly Ala

740 745 750

Leu Lys Lys Asp Lys

755

<210> 239

<211> 1218

<212> DNA

<213> 大肠杆菌

<400> 239

atgtccccca ttgaaaaatc cagcaaatta gagaatgtct gttatgacat ccgtggtccg 60

gtgctgaaag aagcaaaacg cctggaagaa gaaggtaaca aggtactgaa actgaacatc 120

ggcaacccag ccccgttcgg ttttgacgcg ccagatgaaa tcctcgttga cgtgatacgc 180

aacctgccta ccgctcaagg gtattgcgat tccaaaggtc tttactccgc gcgtaaagcc 240

atcatgcagc actaccaggc tcgtggcatg cgtgatgtta ccgtggaaga tatttacatc 300

ggcaatggtg tatcggagct tatcgttcag gcaatgcagg cattgctgaa cagcggggac 360

gaaatgttgg ttcctgcacc agattaccca ctctggaccg cggcggtttc gctttccagc 420

ggtaaagcgg tgcattatct ttgcgatgaa tcctctgact ggttcccgga cctcgatgat 480

attcgcgcta aaattacgcc tcgtacgcgt gggatcgtta ttatcaaccc aaataaccca 540

accggcgcgg tatattccaa agagctttta atggagattg tggagattgc acgtcagcat 600

aatctcatta tcttcgccga tgaaatttat gacaaaattc tctacgacga cgctgagcat 660

cactcaattg cgccgctggc acctgacctg ctgaccatta cctttaacgg actgtcgaaa 720

acgtaccgcg ttgcaggctt ccgtcagggg tggatggtgt tgaacgggcc gaaaaaacac 780

gccaaaggct acatcgaagg tctggaaatg ctggcttcaa tgcgcctgtg tgctaacgtt 840

cctgcgcaac acgccattca gaccgcgcta ggtggttatc agagcatcag tgaatttatt 900

acccctggcg gtcgtcttta tgagcagcgt aaccgcgcgt gggaactgat caacgatatt 960

ccgggcgttt cctgcgtgaa acctcgtggt gcgctgtata tgttcccgaa aatcgacgcc 1020

aaacgcttta acattcacga cgatcagaaa atggtgttgg atttcctgtt gcaggaaaaa 1080

gttctgttgg tgcaagggac ggcattcaac tggccgtggc cggatcactt ccgcattgtc 1140

acgctaccgc gtgtcgatga tatcgagctg tctttgagca agttcgcgcg tttcctttct 1200

ggttatcatc agctgtaa 1218

<210> 240

<211> 405

<212> PRT

<213> 大肠杆菌

<400> 240

Met Ser Pro Ile Glu Lys Ser Ser Lys Leu Glu Asn Val Cys Tyr Asp

1 5 10 15

Ile Arg Gly Pro Val Leu Lys Glu Ala Lys Arg Leu Glu Glu Glu Gly

20 25 30

Asn Lys Val Leu Lys Leu Asn Ile Gly Asn Pro Ala Pro Phe Gly Phe

35 40 45

Asp Ala Pro Asp Glu Ile Leu Val Asp Val Ile Arg Asn Leu Pro Thr

50 55 60

Ala Gln Gly Tyr Cys Asp Ser Lys Gly Leu Tyr Ser Ala Arg Lys Ala

65 70 75 80

Ile Met Gln His Tyr Gln Ala Arg Gly Met Arg Asp Val Thr Val Glu

85 90 95

Asp Ile Tyr Ile Gly Asn Gly Val Ser Glu Leu Ile Val Gln Ala Met

100 105 110

Gln Ala Leu Leu Asn Ser Gly Asp Glu Met Leu Val Pro Ala Pro Asp

115 120 125

Tyr Pro Leu Trp Thr Ala Ala Val Ser Leu Ser Ser Gly Lys Ala Val

130 135 140

His Tyr Leu Cys Asp Glu Ser Ser Asp Trp Phe Pro Asp Leu Asp Asp

145 150 155 160

Ile Arg Ala Lys Ile Thr Pro Arg Thr Arg Gly Ile Val Ile Ile Asn

165 170 175

Pro Asn Asn Pro Thr Gly Ala Val Tyr Ser Lys Glu Leu Leu Met Glu

180 185 190

Ile Val Glu Ile Ala Arg Gln His Asn Leu Ile Ile Phe Ala Asp Glu

195 200 205

Ile Tyr Asp Lys Ile Leu Tyr Asp Asp Ala Glu His His Ser Ile Ala

210 215 220

Pro Leu Ala Pro Asp Leu Leu Thr Ile Thr Phe Asn Gly Leu Ser Lys

225 230 235 240

Thr Tyr Arg Val Ala Gly Phe Arg Gln Gly Trp Met Val Leu Asn Gly

245 250 255

Pro Lys Lys His Ala Lys Gly Tyr Ile Glu Gly Leu Glu Met Leu Ala

260 265 270

Ser Met Arg Leu Cys Ala Asn Val Pro Ala Gln His Ala Ile Gln Thr

275 280 285

Ala Leu Gly Gly Tyr Gln Ser Ile Ser Glu Phe Ile Thr Pro Gly Gly

290 295 300

Arg Leu Tyr Glu Gln Arg Asn Arg Ala Trp Glu Leu Ile Asn Asp Ile

305 310 315 320

Pro Gly Val Ser Cys Val Lys Pro Arg Gly Ala Leu Tyr Met Phe Pro

325 330 335

Lys Ile Asp Ala Lys Arg Phe Asn Ile His Asp Asp Gln Lys Met Val

340 345 350

Leu Asp Phe Leu Leu Gln Glu Lys Val Leu Leu Val Gln Gly Thr Ala

355 360 365

Phe Asn Trp Pro Trp Pro Asp His Phe Arg Ile Val Thr Leu Pro Arg

370 375 380

Val Asp Asp Ile Glu Leu Ser Leu Ser Lys Phe Ala Arg Phe Leu Ser

385 390 395 400

Gly Tyr His Gln Leu

405

<210> 241

<211> 975

<212> DNA

<213> 大肠杆菌

<400> 241

atgaagccgt ccgttatcct ctacaaagcc ttacctgatg atttactgca acgcctgcaa 60

gagcatttca ccgttcacca ggtggcaaac ctcagcccac aaaccgtcga acaaaatgca 120

gcaatttttg ccgaagctga aggtttactg ggttcaaacg agaatgtaaa tgccgcattg 180

ctggaaaaaa tgccgaaact gcgtgccaca tcaacgatct ccgtcggcta tgacaatttt 240

gatgtcgatg cgcttaccgc ccgaaaaatt ctgctgatgc acacgccaac cgtattaaca 300

gaaaccgtcg ccgatacgct gatggcgctg gtgttgtcta ccgctcgtcg ggttgtggag 360

gtagcagaac gggtaaaagc aggcgaatgg accgcgagca taggcccgga ctggtacggc 420

actgacgttc accataaaac actgggcatt gtcgggatgg gacggatcgg catggcgctg 480

gcacaacgtg cgcactttgg cttcaacatg cccatcctct ataacgcgcg ccgccaccat 540

aaagaagcag aagaacgctt caacgcccgc tactgcgatt tggatactct gttacaagag 600

tcagatttcg tttgcctgat cctgccgtta actgatgaga cgcatcatct gtttggcgca 660

gaacaattcg ccaaaatgaa atcctccgcc attttcatta atgccggacg tggcccggtg 720

gttgacgaaa atgcactgat cgcagcattg cagaaaggcg aaattcacgc tgccgggctg 780

gatgtcttcg aacaagagcc actgtccgta gattcgccgt tgctctcaat ggccaacgtc 840

gtcgcagtac cgcatattgg atctgccacc catgagacgc gttatggcat ggccgcctgt 900

gccgtggata atttgattga tgcgttacaa ggaaaggttg agaagaactg tgtgaatccg 960

cacgtcgcgg actaa 975

<210> 242

<211> 324

<212> PRT

<213> 大肠杆菌

<400> 242

Met Lys Pro Ser Val Ile Leu Tyr Lys Ala Leu Pro Asp Asp Leu Leu

1 5 10 15

Gln Arg Leu Gln Glu His Phe Thr Val His Gln Val Ala Asn Leu Ser

20 25 30

Pro Gln Thr Val Glu Gln Asn Ala Ala Ile Phe Ala Glu Ala Glu Gly

35 40 45

Leu Leu Gly Ser Asn Glu Asn Val Asn Ala Ala Leu Leu Glu Lys Met

50 55 60

Pro Lys Leu Arg Ala Thr Ser Thr Ile Ser Val Gly Tyr Asp Asn Phe

65 70 75 80

Asp Val Asp Ala Leu Thr Ala Arg Lys Ile Leu Leu Met His Thr Pro

85 90 95

Thr Val Leu Thr Glu Thr Val Ala Asp Thr Leu Met Ala Leu Val Leu

100 105 110

Ser Thr Ala Arg Arg Val Val Glu Val Ala Glu Arg Val Lys Ala Gly

115 120 125

Glu Trp Thr Ala Ser Ile Gly Pro Asp Trp Tyr Gly Thr Asp Val His

130 135 140

His Lys Thr Leu Gly Ile Val Gly Met Gly Arg Ile Gly Met Ala Leu

145 150 155 160

Ala Gln Arg Ala His Phe Gly Phe Asn Met Pro Ile Leu Tyr Asn Ala

165 170 175

Arg Arg His His Lys Glu Ala Glu Glu Arg Phe Asn Ala Arg Tyr Cys

180 185 190

Asp Leu Asp Thr Leu Leu Gln Glu Ser Asp Phe Val Cys Leu Ile Leu

195 200 205

Pro Leu Thr Asp Glu Thr His His Leu Phe Gly Ala Glu Gln Phe Ala

210 215 220

Lys Met Lys Ser Ser Ala Ile Phe Ile Asn Ala Gly Arg Gly Pro Val

225 230 235 240

Val Asp Glu Asn Ala Leu Ile Ala Ala Leu Gln Lys Gly Glu Ile His

245 250 255

Ala Ala Gly Leu Asp Val Phe Glu Gln Glu Pro Leu Ser Val Asp Ser

260 265 270

Pro Leu Leu Ser Met Ala Asn Val Val Ala Val Pro His Ile Gly Ser

275 280 285

Ala Thr His Glu Thr Arg Tyr Gly Met Ala Ala Cys Ala Val Asp Asn

290 295 300

Leu Ile Asp Ala Leu Gln Gly Lys Val Glu Lys Asn Cys Val Asn Pro

305 310 315 320

His Val Ala Asp

<210> 243

<211> 1179

<212> DNA

<213> 人

<400> 243

atggcctctc acaagctgct ggtgaccccc cccaaggccc tgctcaagcc cctctccatc 60

cccaaccagc tcctgctggg gcctggtcct tccaacctgc ctcctcgcat catggcagcc 120

ggggggctgc agatgatcgg gtccatgagc aaggatatgt accagatcat ggacgagatc 180

aaggaaggca tccagtacgt gttccagacc aggaacccac tcacactggt catctctggc 240

tcgggacact gtgccctgga ggccgccctg gtcaatgtgc tggagcctgg ggactccttc 300

ctggttgggg ccaatggcat ttgggggcag cgagccgtgg acatcgggga gcgcatagga 360

gcccgagtgc acccgatgac caaggaccct ggaggccact acacactgca ggaggtggag 420

gagggcctgg cccagcacaa gccagtgctg ctgttcttaa cccacgggga gtcgtccacc 480

ggcgtgctgc agccccttga tggcttcggg gaactctgcc acaggtacaa gtgcctgctc 540

ctggtggatt cggtggcatc cctgggcggg accccccttt acatggaccg gcaaggcatc 600

gacatcctgt actcgggctc ccagaaggcc ctgaacgccc ctccagggac ctcgctcatc 660

tccttcagtg acaaggccaa aaagaagatg tactcccgca agacgaagcc cttctccttc 720

tacctggaca tcaagtggct ggccaacttc tggggctgtg acgaccagcc caggatgtac 780

catcacacaa tccccgtcat cagcctgtac agcctgagag agagcctggc cctcattgcg 840

gaacagggcc tggagaacag ctggcgccag caccgcgagg ccgcggcgta tctgcatggg 900

cgcctgcagg cactggggct gcagctcttc gtgaaggacc cggcgctccg gcttcccaca 960

gtcaccactg tggctgtacc cgctggctat gactggagag acatcgtcag ctacgtcata 1020

gaccacttcg acattgagat catgggtggc cttgggccct ccacggggaa ggtgctgcgg 1080

atcggcctgc tgggctgcaa tgccacccgc gagaatgtgg accgcgtgac ggaggccctg 1140

agggcggccc tgcagcactg ccccaagaag aagctgtga 1179

<210> 244

<211> 392

<212> PRT

<213> 人

<400> 244

Met Ala Ser His Lys Leu Leu Val Thr Pro Pro Lys Ala Leu Leu Lys

1 5 10 15

Pro Leu Ser Ile Pro Asn Gln Leu Leu Leu Gly Pro Gly Pro Ser Asn

20 25 30

Leu Pro Pro Arg Ile Met Ala Ala Gly Gly Leu Gln Met Ile Gly Ser

35 40 45

Met Ser Lys Asp Met Tyr Gln Ile Met Asp Glu Ile Lys Glu Gly Ile

50 55 60

Gln Tyr Val Phe Gln Thr Arg Asn Pro Leu Thr Leu Val Ile Ser Gly

65 70 75 80

Ser Gly His Cys Ala Leu Glu Ala Ala Leu Val Asn Val Leu Glu Pro

85 90 95

Gly Asp Ser Phe Leu Val Gly Ala Asn Gly Ile Trp Gly Gln Arg Ala

100 105 110

Val Asp Ile Gly Glu Arg Ile Gly Ala Arg Val His Pro Met Thr Lys

115 120 125

Asp Pro Gly Gly His Tyr Thr Leu Gln Glu Val Glu Glu Gly Leu Ala

130 135 140

Gln His Lys Pro Val Leu Leu Phe Leu Thr His Gly Glu Ser Ser Thr

145 150 155 160

Gly Val Leu Gln Pro Leu Asp Gly Phe Gly Glu Leu Cys His Arg Tyr

165 170 175

Lys Cys Leu Leu Leu Val Asp Ser Val Ala Ser Leu Gly Gly Thr Pro

180 185 190

Leu Tyr Met Asp Arg Gln Gly Ile Asp Ile Leu Tyr Ser Gly Ser Gln

195 200 205

Lys Ala Leu Asn Ala Pro Pro Gly Thr Ser Leu Ile Ser Phe Ser Asp

210 215 220

Lys Ala Lys Lys Lys Met Tyr Ser Arg Lys Thr Lys Pro Phe Ser Phe

225 230 235 240

Tyr Leu Asp Ile Lys Trp Leu Ala Asn Phe Trp Gly Cys Asp Asp Gln

245 250 255

Pro Arg Met Tyr His His Thr Ile Pro Val Ile Ser Leu Tyr Ser Leu

260 265 270

Arg Glu Ser Leu Ala Leu Ile Ala Glu Gln Gly Leu Glu Asn Ser Trp

275 280 285

Arg Gln His Arg Glu Ala Ala Ala Tyr Leu His Gly Arg Leu Gln Ala

290 295 300

Leu Gly Leu Gln Leu Phe Val Lys Asp Pro Ala Leu Arg Leu Pro Thr

305 310 315 320

Val Thr Thr Val Ala Val Pro Ala Gly Tyr Asp Trp Arg Asp Ile Val

325 330 335

Ser Tyr Val Ile Asp His Phe Asp Ile Glu Ile Met Gly Gly Leu Gly

340 345 350

Pro Ser Thr Gly Lys Val Leu Arg Ile Gly Leu Leu Gly Cys Asn Ala

355 360 365

Thr Arg Glu Asn Val Asp Arg Val Thr Glu Ala Leu Arg Ala Ala Leu

370 375 380

Gln His Cys Pro Lys Lys Lys Leu

385 390

<210> 245

<211> 10

<212> DNA

<213> 大肠杆菌

<400> 245

aaaaaaaaaa 10

<210> 246

<211> 6

<212> PRT

<213> 大肠杆菌

<400> 246

Leu Ala Asn Phe Trp Gly

1 5

<210> 247

<211> 10

<212> DNA

<213> 拟南芥

<400> 247

aaaaaaaaaa 10

<210> 248

<211> 5

<212> PRT

<213> 拟南芥

<400> 248

Phe Val Lys Asp Pro

1 5

<210> 249

<211> 1146

<212> DNA

<213> 大肠杆菌

<400> 249

atgaagattg tcattgcgcc agactctttt aaagagagct taagtgcaga aaaatgttgt 60

caggcaatta aagccgggtt ttcgaccctc tttcccgatg cgaactatat ctgtttgccg 120

atagcggatg gcggcgaagg gacggtggat gcgatggtcg ccgcgacggg cggcaacatc 180

gtgacgcttg aagtctgcgg gccgatgggc gaaaaagtga atgcttttta tggccttacc 240

ggcgacggga aaacggcggt gattgagatg gcggcagcaa gtggcctgat gctggtcgcg 300

cctgaaaagc gtaatccgtt gctggcctcc agttttggta cgggggagtt aattcgtcat 360

gcgctggata acgacattcg ccatattatt ctcggcattg gcggcagtgc gacggtcgac 420

ggcggtatgg gcatggcgca ggcgctcggt gtgcgtttcc ttgatgccga cggtcaggcg 480

ctggcggcaa acggtggtaa tttagcgcgc gtggcaagca ttgagatgga tgaatgcgat 540

ccgcgtctgg cgaattgcca tattgaagta gcatgtgacg ttgataaccc gctggtaggg 600

gcacgcggcg cggcggcggt gtttggcccg caaaaagggg caacgccgga gatggtcgaa 660

gaacttgaac aggggctgca aaattacgcc cgtgttttac aacagcaaac tgaaattaat 720

gtctgccaga tggcgggcgg cggcgctgcg ggcggtatgg gtattgcggc ggcggtattt 780

ctcaatgcgg atattaaacc gggcattgaa attgtgttga atgcggtcaa tcttgcgcag 840

gcagtgcagg gcgcagcact ggtgattacc ggggaagggc gcatcgactc gcaaacggca 900

ggcggtaaag cgccgctggg tgtggcgtcg gtggcgaagc agtttaatgt accggtgatt 960

gggattgctg gcgtattggg tgatggcgtg gaagtggtgc accagtacgg cattgacgcg 1020

gtattcagca ttttgcctcg tctggcacct ttagccgaag tgctcgccag cggtgaaacc 1080

aatctcttca acagcgcgcg aaatattgcc tgcgccatta aaataggtca gggaattaaa 1140

aactaa 1146

<210> 250

<211> 381

<212> PRT

<213> 大肠杆菌

<400> 250

Met Lys Ile Val Ile Ala Pro Asp Ser Phe Lys Glu Ser Leu Ser Ala

1 5 10 15

Glu Lys Cys Cys Gln Ala Ile Lys Ala Gly Phe Ser Thr Leu Phe Pro

20 25 30

Asp Ala Asn Tyr Ile Cys Leu Pro Ile Ala Asp Gly Gly Glu Gly Thr

35 40 45

Val Asp Ala Met Val Ala Ala Thr Gly Gly Asn Ile Val Thr Leu Glu

50 55 60

Val Cys Gly Pro Met Gly Glu Lys Val Asn Ala Phe Tyr Gly Leu Thr

65 70 75 80

Gly Asp Gly Lys Thr Ala Val Ile Glu Met Ala Ala Ala Ser Gly Leu

85 90 95

Met Leu Val Ala Pro Glu Lys Arg Asn Pro Leu Leu Ala Ser Ser Phe

100 105 110

Gly Thr Gly Glu Leu Ile Arg His Ala Leu Asp Asn Asp Ile Arg His

115 120 125

Ile Ile Leu Gly Ile Gly Gly Ser Ala Thr Val Asp Gly Gly Met Gly

130 135 140

Met Ala Gln Ala Leu Gly Val Arg Phe Leu Asp Ala Asp Gly Gln Ala

145 150 155 160

Leu Ala Ala Asn Gly Gly Asn Leu Ala Arg Val Ala Ser Ile Glu Met

165 170 175

Asp Glu Cys Asp Pro Arg Leu Ala Asn Cys His Ile Glu Val Ala Cys

180 185 190

Asp Val Asp Asn Pro Leu Val Gly Ala Arg Gly Ala Ala Ala Val Phe

195 200 205

Gly Pro Gln Lys Gly Ala Thr Pro Glu Met Val Glu Glu Leu Glu Gln

210 215 220

Gly Leu Gln Asn Tyr Ala Arg Val Leu Gln Gln Gln Thr Glu Ile Asn

225 230 235 240

Val Cys Gln Met Ala Gly Gly Gly Ala Ala Gly Gly Met Gly Ile Ala

245 250 255

Ala Ala Val Phe Leu Asn Ala Asp Ile Lys Pro Gly Ile Glu Ile Val

260 265 270

Leu Asn Ala Val Asn Leu Ala Gln Ala Val Gln Gly Ala Ala Leu Val

275 280 285

Ile Thr Gly Glu Gly Arg Ile Asp Ser Gln Thr Ala Gly Gly Lys Ala

290 295 300

Pro Leu Gly Val Ala Ser Val Ala Lys Gln Phe Asn Val Pro Val Ile

305 310 315 320

Gly Ile Ala Gly Val Leu Gly Asp Gly Val Glu Val Val His Gln Tyr

325 330 335

Gly Ile Asp Ala Val Phe Ser Ile Leu Pro Arg Leu Ala Pro Leu Ala

340 345 350

Glu Val Leu Ala Ser Gly Glu Thr Asn Leu Phe Asn Ser Ala Arg Asn

355 360 365

Ile Ala Cys Ala Ile Lys Ile Gly Gln Gly Ile Lys Asn

370 375 380

<210> 251

<211> 1146

<212> DNA

<213> 大肠杆菌

<400> 251

atgaaaatcg taatcgcccc agactcttat aaagaaagtt tatctgccag cgaggttgcg 60

caggcgatag aaaaaggatt tcgggaaatt tttcctgatg cacagtacgt ttctgttccg 120

gttgccgacg gtggcgaagg aacggtggaa gcgatgattg cagccaccca gggggctgaa 180

cgtcacgcct gggttacagg gccgctgggc gagaaagtga atgccagttg ggggatctcc 240

ggcgatggca aaaccgcgtt tattgaaatg gcggcggcca gtgggctgga gctggtacct 300

gcggaaaaac gcgatccact cgtgaccact tcacgcggca caggcgagtt aatcctgcag 360

gcgctggaga gcggtgcgac aaacattatt atcggcattg gcggcagcgc tacaaatgat 420

ggcggcgcag gcatggtaca ggcgctgggg gcgaaattat gcgacgccaa cggcaatgaa 480

attggttttg gcggcggtag tcttaatact ctgaatgata ttgatatttc cggcctcgat 540

ccgcgcttaa aagattgcgt cattcgcgtc gcttgtgatg tcaccaatcc gctggtgggc 600

gataacggcg catcgcgcat ctttggccca caaaagggag ccagtgaagc gatgattgtt 660

gagctggaca ataacctctc tcactatgcc gaggtcatta aaaaagcgct gcatgttgat 720

gtgaaagatg tccccggtgc aggagctgcg ggtggtatgg gcgcggcgct aatggcgttt 780

cttggtgcgg aactgaaaag tggtattgaa atcgtcacta cggcgctgaa tctggaggaa 840

catattcacg attgtacgct ggtgatcacc ggtgaagggc gtattgacag ccagagtatt 900

cacgggaagg taccgattgg tgtcgcaaac gtggcgaaga agtaccataa accggtgatt 960

ggcattgcgg gtagcctgac cgatgatgtt ggcgttgtac atcagcatgg cattgatgcg 1020

gtcttcagcg tattgaccag cataggtacg ttggacgaag cattccgcgg ggcttatgac 1080

aatatctgcc gtgcttcacg taatatcgcc gcgacactgg cgattggaat gcgcaacgcg 1140

gggtga 1146

<210> 252

<211> 381

<212> PRT

<213> 大肠杆菌

<400> 252

Met Lys Ile Val Ile Ala Pro Asp Ser Tyr Lys Glu Ser Leu Ser Ala

1 5 10 15

Ser Glu Val Ala Gln Ala Ile Glu Lys Gly Phe Arg Glu Ile Phe Pro

20 25 30

Asp Ala Gln Tyr Val Ser Val Pro Val Ala Asp Gly Gly Glu Gly Thr

35 40 45

Val Glu Ala Met Ile Ala Ala Thr Gln Gly Ala Glu Arg His Ala Trp

50 55 60

Val Thr Gly Pro Leu Gly Glu Lys Val Asn Ala Ser Trp Gly Ile Ser

65 70 75 80

Gly Asp Gly Lys Thr Ala Phe Ile Glu Met Ala Ala Ala Ser Gly Leu

85 90 95

Glu Leu Val Pro Ala Glu Lys Arg Asp Pro Leu Val Thr Thr Ser Arg

100 105 110

Gly Thr Gly Glu Leu Ile Leu Gln Ala Leu Glu Ser Gly Ala Thr Asn

115 120 125

Ile Ile Ile Gly Ile Gly Gly Ser Ala Thr Asn Asp Gly Gly Ala Gly

130 135 140

Met Val Gln Ala Leu Gly Ala Lys Leu Cys Asp Ala Asn Gly Asn Glu

145 150 155 160

Ile Gly Phe Gly Gly Gly Ser Leu Asn Thr Leu Asn Asp Ile Asp Ile

165 170 175

Ser Gly Leu Asp Pro Arg Leu Lys Asp Cys Val Ile Arg Val Ala Cys

180 185 190

Asp Val Thr Asn Pro Leu Val Gly Asp Asn Gly Ala Ser Arg Ile Phe

195 200 205

Gly Pro Gln Lys Gly Ala Ser Glu Ala Met Ile Val Glu Leu Asp Asn

210 215 220

Asn Leu Ser His Tyr Ala Glu Val Ile Lys Lys Ala Leu His Val Asp

225 230 235 240

Val Lys Asp Val Pro Gly Ala Gly Ala Ala Gly Gly Met Gly Ala Ala

245 250 255

Leu Met Ala Phe Leu Gly Ala Glu Leu Lys Ser Gly Ile Glu Ile Val

260 265 270

Thr Thr Ala Leu Asn Leu Glu Glu His Ile His Asp Cys Thr Leu Val

275 280 285

Ile Thr Gly Glu Gly Arg Ile Asp Ser Gln Ser Ile His Gly Lys Val

290 295 300

Pro Ile Gly Val Ala Asn Val Ala Lys Lys Tyr His Lys Pro Val Ile

305 310 315 320

Gly Ile Ala Gly Ser Leu Thr Asp Asp Val Gly Val Val His Gln His

325 330 335

Gly Ile Asp Ala Val Phe Ser Val Leu Thr Ser Ile Gly Thr Leu Asp

340 345 350

Glu Ala Phe Arg Gly Ala Tyr Asp Asn Ile Cys Arg Ala Ser Arg Asn

355 360 365

Ile Ala Ala Thr Leu Ala Ile Gly Met Arg Asn Ala Gly

370 375 380

<210> 253

<211> 450

<212> DNA

<213> 大肠杆菌

<400> 253

atgaaaaaga ttgcatttgg ctgtgatcat gtcggtttca ttttaaaaca tgaaatagtg 60

gcacatttag ttgagcgtgg cgttgaagtg attgataaag gaacctggtc gtcagagcgt 120

actgattatc cacattacgc cagtcaagtc gcactggctg ttgctggcgg agaggttgat 180

ggcgggattt tgatttgtgg tactggcgtc ggtatttcga tagcggcgaa caagtttgcc 240

ggaattcgcg cggtcgtctg tagcgaacct tattccgcgc aactttcgcg gcagcataac 300

gacaccaacg tgctggcttt tggttcacga gtggttggcc tcgaactggc aaaaatgatt 360

gtggatgcgt ggctgggcgc acagtacgaa ggcggtcgtc atcaacaacg cgtggaggcg 420

attacggcaa tagagcagcg gagaaattga 450

<210> 254

<211> 149

<212> PRT

<213> 大肠杆菌

<400> 254

Met Lys Lys Ile Ala Phe Gly Cys Asp His Val Gly Phe Ile Leu Lys

1 5 10 15

His Glu Ile Val Ala His Leu Val Glu Arg Gly Val Glu Val Ile Asp

20 25 30

Lys Gly Thr Trp Ser Ser Glu Arg Thr Asp Tyr Pro His Tyr Ala Ser

35 40 45

Gln Val Ala Leu Ala Val Ala Gly Gly Glu Val Asp Gly Gly Ile Leu

50 55 60

Ile Cys Gly Thr Gly Val Gly Ile Ser Ile Ala Ala Asn Lys Phe Ala

65 70 75 80

Gly Ile Arg Ala Val Val Cys Ser Glu Pro Tyr Ser Ala Gln Leu Ser

85 90 95

Arg Gln His Asn Asp Thr Asn Val Leu Ala Phe Gly Ser Arg Val Val

100 105 110

Gly Leu Glu Leu Ala Lys Met Ile Val Asp Ala Trp Leu Gly Ala Gln

115 120 125

Tyr Glu Gly Gly Arg His Gln Gln Arg Val Glu Ala Ile Thr Ala Ile

130 135 140

Glu Gln Arg Arg Asn

145

<210> 255

<211> 1869

<212> DNA

<213> 酿酒酵母PGM3

<400> 255

atgttgcaag gaattttaga aaccgtacca tctgacttga aagatccgat atcattatgg 60

tttaagcaag accgcaaccc aaaaactata gaagaggtca ccgctctctg caaaaaatcc 120

gactggaatg agttacacaa aagatttgat tctagaattc agtttggcac tgctggttta 180

agatcgcaaa tgcaagctgg ctttagcagg atgaatactt tagtagtcat acaagcgtct 240

cagggattgg caacttatgt aagacaacag tttccagaca atttggtagc tgttgtggga 300

cacgatcata gattccattc taaggagttc gctagagcta ctgctgctgc atttctttta 360

aaaggattta aggtacatta tttgaatcct gaccacgaat ttgttcatac ccctttagtt 420

ccctttgcag tggataagct aaaggcctcc gttggcgtaa tgataacagc aagtcacaac 480

ccaaaaatgg ataatggata taaagtatac tattccaatg gatgccaaat cattccacct 540

cacgatcatg ccatctctga ttccattgac gcaaatttag aaccatgggc caatgtgtgg 600

gatttcgacg atgttctaaa taaggctctc aaacaaggga aattgatgta ttccagagaa 660

gaaatgctga agttatattt agaggaggtt tctaaaaatc tggtagaaat caacccatta 720

aagcttgaag taaaagccaa accttggttc gtttacactc caatgcatgg ggttggattt 780

gacattttca gcaccatcgt aaaaaaaaca ctgtgcctgg tagaaggtaa ggattaccta 840

tgtgttcctg aacaacaaaa tccagatcct tctttcccaa ctgttggatt tcctaaccct 900

gaagaaaaag gtgctttaga cattggtata aacttggctg aaaaacatga cattgactta 960

cttgttgcca acgaccctga cgctgataga ttctctgttg ctgttaaaga tatgcagtca 1020

ggcgaatggc gacaactaac aggtaacgaa atcggttttc tttttgcatt ttatgaatat 1080

cagaaatata aaagtatgga caaagaattt cagcacgttc atccgttggc tatgttaaat 1140

tcaacagtgt cttcacaaat gataaaaaaa atggcagaaa tagaagggtt ccattatgag 1200

gatacattaa caggatttaa gtggatcgga aatcgtgcca tactcttgga aaagaaaggc 1260

tattacgttc cttttggatt cgaggaagca ataggctaca tgtttccagc aatggagcat 1320

gataaggatg gtatcagtgc atccattgtc ttcttgcaag cctactgtaa gtggaaaata 1380

gaccacaatt tggacccgct aaatgtctta gaaaatggct tcaaaaaata tggcgtgttc 1440

aaagagtaca atggctatta tgtcgttcca aatccaactg ttacaaaaga tatatttgac 1500

tacatcagga atgtctacac tcctgagggc gcgtcatatc cttcatctat tggtgaagaa 1560

atcgaagtac tttactatcg agatttaacc actggttacc aatcggatac cataaatcat 1620

aaacctactc tacccgtcga tcctacatca caaatgataa cagtatctgc tagaccaagt 1680

aacggtagtg agaatgagca tatccgcttc actattcgcg ggtccggaac agaaccaaaa 1740

cttaaagtat atattgaagc ttgcgcaaat gaagaacaaa gagcctcttt cttggcgaaa 1800

ttgacttgga atgtgctgag acgtgaatgg tttagaccag atgaaatgaa tatagttaca 1860

aaattttga 1869

<210> 256

<211> 897

<212> DNA

<213> 人cDNA khkC

<400> 256

atggtggaag agaagcagat cctgtgcgtg gggctagtgg tgctggacgt catcagcctg 60

gtggacaagt accctaagga ggactcggag ataaggtgtt tgtcccagag atggcagcgc 120

ggaggcaacg cgtccaactc ctgcaccgtt ctctccctgc tcggagcccc ctgtgccttc 180

atgggctcaa tggctcctgg ccatgttgct gacttcctgg tggccgactt caggcggcgg 240

ggcgtggacg tgtctcaggt ggcctggcag agcaaggggg acacccccag ctcctgctgc 300

atcatcaaca actccaatgg caaccgtacc attgtgctcc atgacacgag cctgccagat 360

gtgtctgcta cagactttga gaaggttgat ctgacccagt tcaagtggat ccacattgag 420

ggccggaacg catcggagca ggtgaagatg ctgcagcgga tagacgcaca caacaccagg 480

cagcctccag agcagaagat ccgggtgtcc gtggaggtgg agaagccacg agaggagctc 540

ttccagctgt ttggctacgg agacgtggtg tttgtcagca aagatgtggc caagcacttg 600

gggttccagt cagcagagga agccttgagg ggcttgtatg gtcgtgtgag gaaaggggct 660

gtgcttgtct gtgcctgggc tgaggagggc gccgacgccc tgggccctga tggcaaattg 720

ctccactcgg atgctttccc gccaccccgc gtggtggata cactgggagc tggagacacc 780

ttcaatgcct ccgtcatctt cagcctctcc caggggagga gcgtgcagga agcactgaga 840

ttcgggtgcc aggtggccgg caagaagtgt ggcctgcagg gctttgatgg catcgtg 897

<210> 257

<211> 1419

<212> DNA

<213> 大肠杆菌fucK

<400> 257

atgaaacaag aagttatcct ggtactcgac tgtggcgcga ccaatgtcag ggccatcgcg 60

gttaatcggc agggcaaaat tgttgcccgc gcctcaacgc ctaatgccag cgatatcgcg 120

atggaaaaca acacctggca ccagtggtct ttagacgcca ttttgcaacg ctttgctgat 180

tgctgtcggc aaatcaatag tgaactgact gaatgccaca tccgcggtat cgccgtcacc 240

acctttggtg tggatggcgc tctggtagat aagcaaggca atctgctcta tccgattatt 300

agctggaaat gtccgcgaac agcagcggtt atggacaata ttgaacggtt aatctccgca 360

cagcggttgc aggctatttc tggcgtcgga gcctttagtt tcaatacgtt atataagttg 420

gtgtggttga aagaaaatca tccacaactg ctggaacgcg cgcacgcctg gctctttatt 480

tcgtcgctga ttaaccaccg tttaaccggc gaattcacta ctgatatcac gatggccgga 540

accagccaga tgctggatat ccagcaacgc gatttcagtc cgcaaatttt acaagccacc 600

ggtattccac gccgactctt ccctcgtctg gtggaagcgg gtgaacagat tggtacgcta 660

cagaacagcg ccgcagcaat gctcggctta cccgttggca taccggtgat ttccgcaggt 720

cacgataccc agttcgccct ttttggcgct ggtgctgaac aaaatgaacc cgtgctctct 780

tccggtacat gggaaatttt aatggttcgc agcgcccagg ttgatacttc gctgttaagt 840

cagtacgccg gttccacctg cgaactggat agccaggcag ggttgtataa cccaggtatg 900

caatggctgg catccggcgt gctggaatgg gtgagaaaac tgttctggac ggctgaaaca 960

ccctggcaaa tgttgattga agaagctcgt ctgatcgcgc ctggcgcgga tggcgtaaaa 1020

atgcagtgtg atttattgtc gtgtcagaac gctggctggc aaggagtgac gcttaatacc 1080

acgcgggggc atttctatcg cgcggcgctg gaagggttaa ctgcgcaatt acagcgcaat 1140

ctacagatgc tggaaaaaat cgggcacttt aaggcctctg aattattgtt agtcggtgga 1200

ggaagtcgca acacattgtg gaatcagatt aaagccaata tgcttgatat tccggtaaaa 1260

gttctcgacg acgccgaaac gaccgtcgca ggagctgcgc tgttcggttg gtatggcgta 1320

ggggaattta acagcccgga agaagcccgc gcacagattc attatcagta ccgttatttc 1380

tacccgcaaa ctgaacctga atttatagag gaagtgtga 1419

<210> 258

<211> 622

<212> PRT

<213> 酿酒酵母PGM3

<400> 258

Met Leu Gln Gly Ile Leu Glu Thr Val Pro Ser Asp Leu Lys Asp Pro

1 5 10 15

Ile Ser Leu Trp Phe Lys Gln Asp Arg Asn Pro Lys Thr Ile Glu Glu

20 25 30

Val Thr Ala Leu Cys Lys Lys Ser Asp Trp Asn Glu Leu His Lys Arg

35 40 45

Phe Asp Ser Arg Ile Gln Phe Gly Thr Ala Gly Leu Arg Ser Gln Met

50 55 60

Gln Ala Gly Phe Ser Arg Met Asn Thr Leu Val Val Ile Gln Ala Ser

65 70 75 80

Gln Gly Leu Ala Thr Tyr Val Arg Gln Gln Phe Pro Asp Asn Leu Val

85 90 95

Ala Val Val Gly His Asp His Arg Phe His Ser Lys Glu Phe Ala Arg

100 105 110

Ala Thr Ala Ala Ala Phe Leu Leu Lys Gly Phe Lys Val His Tyr Leu

115 120 125

Asn Pro Asp His Glu Phe Val His Thr Pro Leu Val Pro Phe Ala Val

130 135 140

Asp Lys Leu Lys Ala Ser Val Gly Val Met Ile Thr Ala Ser His Asn

145 150 155 160

Pro Lys Met Asp Asn Gly Tyr Lys Val Tyr Tyr Ser Asn Gly Cys Gln

165 170 175

Ile Ile Pro Pro His Asp His Ala Ile Ser Asp Ser Ile Asp Ala Asn

180 185 190

Leu Glu Pro Trp Ala Asn Val Trp Asp Phe Asp Asp Val Leu Asn Lys

195 200 205

Ala Leu Lys Gln Gly Lys Leu Met Tyr Ser Arg Glu Glu Met Leu Lys

210 215 220

Leu Tyr Leu Glu Glu Val Ser Lys Asn Leu Val Glu Ile Asn Pro Leu

225 230 235 240

Lys Leu Glu Val Lys Ala Lys Pro Trp Phe Val Tyr Thr Pro Met His

245 250 255

Gly Val Gly Phe Asp Ile Phe Ser Thr Ile Val Lys Lys Thr Leu Cys

260 265 270

Leu Val Glu Gly Lys Asp Tyr Leu Cys Val Pro Glu Gln Gln Asn Pro

275 280 285

Asp Pro Ser Phe Pro Thr Val Gly Phe Pro Asn Pro Glu Glu Lys Gly

290 295 300

Ala Leu Asp Ile Gly Ile Asn Leu Ala Glu Lys His Asp Ile Asp Leu

305 310 315 320

Leu Val Ala Asn Asp Pro Asp Ala Asp Arg Phe Ser Val Ala Val Lys

325 330 335

Asp Met Gln Ser Gly Glu Trp Arg Gln Leu Thr Gly Asn Glu Ile Gly

340 345 350

Phe Leu Phe Ala Phe Tyr Glu Tyr Gln Lys Tyr Lys Ser Met Asp Lys

355 360 365

Glu Phe Gln His Val His Pro Leu Ala Met Leu Asn Ser Thr Val Ser

370 375 380

Ser Gln Met Ile Lys Lys Met Ala Glu Ile Glu Gly Phe His Tyr Glu

385 390 395 400

Asp Thr Leu Thr Gly Phe Lys Trp Ile Gly Asn Arg Ala Ile Leu Leu

405 410 415

Glu Lys Lys Gly Tyr Tyr Val Pro Phe Gly Phe Glu Glu Ala Ile Gly

420 425 430

Tyr Met Phe Pro Ala Met Glu His Asp Lys Asp Gly Ile Ser Ala Ser

435 440 445

Ile Val Phe Leu Gln Ala Tyr Cys Lys Trp Lys Ile Asp His Asn Leu

450 455 460

Asp Pro Leu Asn Val Leu Glu Asn Gly Phe Lys Lys Tyr Gly Val Phe

465 470 475 480

Lys Glu Tyr Asn Gly Tyr Tyr Val Val Pro Asn Pro Thr Val Thr Lys

485 490 495

Asp Ile Phe Asp Tyr Ile Arg Asn Val Tyr Thr Pro Glu Gly Ala Ser

500 505 510

Tyr Pro Ser Ser Ile Gly Glu Glu Ile Glu Val Leu Tyr Tyr Arg Asp

515 520 525

Leu Thr Thr Gly Tyr Gln Ser Asp Thr Ile Asn His Lys Pro Thr Leu

530 535 540

Pro Val Asp Pro Thr Ser Gln Met Ile Thr Val Ser Ala Arg Pro Ser

545 550 555 560

Asn Gly Ser Glu Asn Glu His Ile Arg Phe Thr Ile Arg Gly Ser Gly

565 570 575

Thr Glu Pro Lys Leu Lys Val Tyr Ile Glu Ala Cys Ala Asn Glu Glu

580 585 590

Gln Arg Ala Ser Phe Leu Ala Lys Leu Thr Trp Asn Val Leu Arg Arg

595 600 605

Glu Trp Phe Arg Pro Asp Glu Met Asn Ile Val Thr Lys Phe

610 615 620

Claims

2.根据权利要求1所述的重组微生物，其中与MEG或GA联产一种或多种联产品。

3.根据权利要求1或2所述的重组微生物，其中所述一种或多种戊糖-5-磷酸中间体是D-核糖-5-磷酸、D-木酮糖-5-磷酸或D-核酮糖-5-磷酸中的一种或多种。

4.根据权利要求1-3中任一项所述的重组微生物，其中所述一种或多种生化途径包含至少一种具有转酮醇酶活性的酶的表达。

5.根据权利要求4所述的重组微生物，其中所述至少一种具有转酮醇酶活性的酶由氨基酸序列编码，所述氨基酸序列与来自大肠杆菌的tktA tktB具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性。

6.根据权利要求1-5中任一项所述的重组微生物，其中所述一种或多种生化途径包含至少一种具有转醛醇酶活性的酶的表达。

7.根据权利要求6所述的重组微生物，其中所述至少一种具有转醛醇酶活性的酶由氨基酸序列编码，所述氨基酸序列与来自大肠杆菌的talB或talB具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性。

8.根据权利要求1-7中任一项所述的重组微生物，其中所述一种或多种生化途径包含至少一种具有核酮糖-5-磷酸3-差向异构酶活性的酶的表达。

9.根据权利要求8所述的重组微生物，其中所述至少一种具有核酮糖-5-磷酸3-差向异构酶活性的酶由氨基酸序列编码，所述氨基酸序列与来自大肠杆菌的rpe具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性。

10.根据权利要求1-9中任一项所述的重组微生物，其中所述一种或多种生化途径包含至少一种具有核糖-5-磷酸异构酶活性的酶的表达。

11.根据权利要求10所述的重组微生物，其中所述至少一种具有核糖-5-磷酸异构酶活性的酶由氨基酸序列编码，所述氨基酸序列与来自大肠杆菌的rpiA或rpiB具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性。

12.根据权利要求1-11中任一项所述的重组微生物，其中所述重组微生物进一步包含至少一种内源性酶的缺失或降低的活性，所述内源性酶选自甘油醛3-磷酸脱氢酶、磷酸甘油酸激酶和/或磷酸甘油酸变位酶。

13.根据权利要求1-11中任一项所述的重组微生物，其中所述一种或多种生化途径包含至少一种具有果糖-6-磷酸磷酸酮醇酶活性的酶的表达。

14.根据权利要求13所述的重组微生物，其中所述至少一种具有果糖-6-磷酸磷酸酮醇酶活性的酶由氨基酸序列编码，所述氨基酸序列与具有果糖-6-磷酸磷酸酮醇酶活性的酶具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性，所述具有果糖-6-磷酸磷酸酮醇酶活性的酶选自：齿双歧杆菌Bifidobacterium dentium BDP_1006、乳双歧杆菌Bifidobacterium lactis xfp、类植物乳杆菌Lactobacillus paraplantarum xpkA和短双歧杆菌Bifidobacterium breve xfp。

15.根据权利要求13所述的重组微生物，其中所述一种或多种生化途径包含至少一种具有磷酸乙酰转移酶活性的酶的表达。

16.根据权利要求15所述的重组微生物，其中所述至少一种具有磷酸乙酰转移酶活性的酶由氨基酸序列编码，所述氨基酸序列与具有磷酸乙酰转移酶活性的酶具有至少70％序列同一性、至少80％序列同一性或至少90％序列同一性，所述具有磷酸乙酰转移酶活性的酶选自：大肠杆菌E.coli pta和丙酮丁醇梭菌Clostridium acetobutylicum pta。

17.根据权利要求1-11或13-16中任一项所述的重组微生物，其中所述重组微生物进一步包含内源性酶6-磷酸果糖激酶的缺失或降低的活性。

18.根据权利要求1-17中任一项所述的重组微生物，其中所述一种或多种生化途径包含至少一种具有戊糖磷酸酶活性的酶。

19.根据权利要求18所述的重组微生物，其中所述至少一种具有戊糖磷酸酶活性的酶选自以下一种或多种：具有D-戊糖-5-磷酸酶活性的酶、具有D-木酮糖-5-磷酸酶活性的酶、具有D-核糖-5-磷酸酶活性的酶和具有D-核酮糖-5-磷酸酶活性的酶。

20.根据权利要求1-19中任一项所述的重组微生物，其中所述一种或多种生化途径包含至少一种具有阿糖醇磷酸脱氢酶活性的酶。

21.根据权利要求20所述的重组微生物，其中所述至少一种具有阿糖醇磷酸脱氢酶活性的酶选自以下一种或多种：具有D-阿糖醇1-磷酸4-脱氢酶活性的酶、具有D-阿糖醇5-磷酸2-脱氢酶活性的酶、具有D-阿糖醇1-磷酸2-脱氢酶活性的酶和具有D-阿糖醇5-磷酸4-脱氢酶活性的酶。

22.根据权利要求1-21中任一项所述的重组微生物，其中所述一种或多种生化途径包含至少一种具有磷酸戊糖变位酶活性的酶。

23.根据权利要求1-22中任一项所述的重组微生物，其中所述重组微生物进一步包含一种或多种内源性酶的缺失或降低的活性，所述内源性酶选自葡萄糖6-磷酸-1-脱氢酶、6-磷酸葡萄糖酸内酯酶和6-磷酸葡萄糖酸脱氢酶。

24.根据权利要求1-23中任一项所述的重组微生物，其中所述一种或多种联产品选自丙酮、异丙醇、丙烯、异丁烯和一种或多种丝氨酸途径化合物。

25.根据权利要求24所述的重组微生物，其中所述一种或多种丝氨酸途径化合物选自丝氨酸、甘氨酸、单乙醇胺(MEA)和乙二胺(EDA)。

26.根据权利要求1-25中任一项所述的重组微生物，其中所述一种或多种己糖原料选自葡萄糖或葡萄糖的低聚物。

27.根据权利要求26所述的重组微生物，其中所述葡萄糖的低聚物选自果糖、蔗糖、淀粉、纤维二糖、麦芽糖、乳糖和纤维素。

28.根据权利要求1-27中任一项所述的重组微生物，其中所述具有转酮醇酶活性的酶或具有果糖-6-磷酸磷酸酮醇酶活性的酶的表达能够使一种或多种己糖原料无损转化为一种或多种戊糖-5-磷酸中间体。

29.根据权利要求1-28中任一项所述的重组微生物，其中通过C2途径中乙醇醛的转化和C3途径中磷酸二羟丙酮(DHAP)或丙酮酸的转化，来生产MEG或GA。

30.根据权利要求29所述的重组微生物，其中通过乙醇醛脱氢酶氧化乙醇醛生产GA。

31.根据权利要求29所述的重组微生物，其中用于通过C3途径中DHAP或丙酮酸的转化生产MEG或GA的一种或多种酶选自具有选自以下的活性的一种或多种酶：3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、丝氨酸转氨酶活性、羟基丙酮酸脱羧酶活性、3-磷酸羟基丙酮酸还原酶活性、乙醇醛还原酶活性、乙醇醛脱氢酶活性、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶活性、丝氨酸脱羧酶活性、乙醇胺转氨酶或乙醇胺氧化还原酶(脱氨基)活性、甘油酸脱羧酶活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性和甘油酸2-激酶活性。

32.根据权利要求1-31中任一项所述的重组微生物，其中通过C2途径中乙醇醛的转化生产MEG或GA，通过C3途径中磷酸二羟丙酮(DHAP)或丙酮酸的转化生产一种或多种联产品。

33.根据权利要求32所述的重组微生物，其中用于通过C3途径中DHAP或丙酮酸的转化生产一种或多种联产品的一种或多种酶选自一种或多种具有选自以下的活性的酶：硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A：乙酰乙酸转移酶或乙酸：乙酰乙酰辅酶A水解酶活性和乙酰乙酸脱羧酶活性，并且其中所述一种或多种联产品包括丙酮。

34.根据权利要求32所述的重组微生物，其中用于通过C3途径中DHAP或丙酮酸的转化生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A：乙酰乙酸转移酶或乙酸：乙酰乙酰辅酶A水解酶活性、乙酰乙酸脱羧酶活性和仲醇脱氢酶活性，并且其中所述一种或多种联产品包含异丙醇。

35.根据权利要求32所述的重组微生物，其中用于通过C3途径中DHAP或丙酮酸的转化生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A：乙酰乙酸转移酶或乙酸：乙酰乙酰辅酶A水解酶活性、乙酰乙酸脱羧酶活性、仲醇脱氢酶活性和脱水酶-异构酶活性，并且其中所述一种或多种联产品包含丙烯。

36.根据权利要求32所述的方法，其中用于通过C3途径中DHAP或丙酮酸的转化生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A：乙酰乙酸转移酶或乙酸：乙酰乙酰辅酶A水解酶活性、乙酰乙酸脱羧酶活性、3-羟基异戊酸(3HIV)合酶活性、羟甲基戊二酰辅酶A合酶活性、甲基戊烯二酰辅酶A水合酶活性、甲基巴豆酰辅酶A羧化酶活性、甲基巴豆酰辅酶A水合酶活性、3-羟基异戊酰辅酶A硫酯酶活性、3HIV激酶活性、3HIV-3-磷酸脱羧酶活性和3HIV脱羧酶活性，并且其中所述一种或多种联产品包含异丁烯。

37.根据权利要求32所述的方法，其中用于通过C3途径中DHAP或丙酮酸的转化生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性和甘油酸2-激酶活性，并且其中所述一种或多种联产品包含L-丝氨酸。

38.根据权利要求32所述的方法，其中用于通过C3途径中DHAP或丙酮酸的转化生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：丝氨酸羟甲基转移酶活性、转移酶活性、甲醛脱氢酶活性、甲酸脱氢酶活性、与甘氨酸裂解系统相关的活性、3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、丝氨酸转氨酶活性、羟基丙酮酸脱羧酶活性、丝氨酸氧化还原酶(脱氨基)活性、丝氨酸脱羧酶活性、乙醇胺转氨酶或乙醇胺氧化还原酶(脱氨基)活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性、甘油酸2-激酶活性、乙醇醛脱氢酶活性、乙醇酸脱氢酶活性、丙氨酸-乙醛酸转氨酶活性、丙氨酸转氨酶活性和NAD(P)H依赖性谷氨酸脱氢酶活性，并且其中所述一种或多种联产品包含甘氨酸。

39.根据权利要求38所述的方法，其中与甘氨酸裂解系统相关的活性包含选自以下的酶或蛋白：甘氨酸脱羧酶(P蛋白)、氨甲基转移酶(T蛋白)、二氢硫辛酰胺脱氢酶(L蛋白)和H蛋白。

40.根据权利要求32所述的方法，其中用于通过C3途径中DHAP或丙酮酸的转化生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、转氨酶活性、羟基丙酮酸脱羧酶活性、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶活性、丝氨酸脱羧酶活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性、甘油酸2-激酶活性、乙醛脱氢酶活性和乙醇胺解氨酶活性，并且其中所述一种或多种联产品包含单乙醇胺(MEA)。

41.根据权利要求32所述的方法，其中用于通过C3途径中DHAP或丙酮酸的转化生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：丝氨酸脱氢酶活性、2-氨基丙二酸半醛脱羧酶活性、氨基乙醛转氨酶活性、2-氨基丙二酸半醛转氨酶活性、2,3-二氨基丙酸脱羧酶活性、丝氨酸脱羧酶活性、乙醇胺脱氢酶活性、丝氨酸羟甲基转移酶活性、醛氧化酶活性、N-乙酰转移酶或O-乙酰转移酶活性、N-乙酰丝氨酸脱氢酶活性、转氨酶活性、脱乙酰酶活性、丝氨酸氨基酶活性和2,3-二氨基丙酸解氨酶活性，并且其中所述一种或多种联产品包含乙二胺(EDA)。

42.根据权利要求29-41中任一项所述的重组微生物，其中用于在C2途径中由乙醇醛生产MEG或GA的一种或多种酶选自具有选自以下的活性的一种或多种酶：D-塔格糖3-差向异构酶活性、D-核酮糖激酶活性、D-核酮糖-1-磷酸醛缩酶活性、D-木酮糖1-激酶活性、D-木酮糖-1-磷酸醛缩酶活性、木糖还原酶或醛糖还原酶活性、木糖醇脱氢酶活性、木糖异构酶活性、木糖脱氢酶活性、木糖酸内酯酶活性、木糖酸脱氢酶活性、2-酮-3-脱氧-D-戊酸醛缩酶活性、乙醇醛还原酶活性和乙醇醛脱氢酶活性。

43.根据权利要求1-42中任一项所述的重组微生物，其中所述重组微生物进一步包含一种或多种修饰，以减少或缺失乙醇醛脱氢酶、乳酸脱氢酶、木糖异构酶、木酮糖激酶或其组合的活性。

44.根据权利要求1-43中任一项所述的重组微生物，其中至少一部分在C3途径中生产的过量NADH用作C2途径中还原当量的来源。

45.根据权利要求1-43中任一项所述的重组微生物，其中至少一部分在C3途径中生产的过量NADH用于生产ATP。

46.根据权利要求1-45中任一项所述的重组微生物，其中最小化过量的生物质形成，并且最大化MEG(或GA)或MEG(或GA)和一种或多种联产品的生产。

47.使用前述权利要求中任一项所述的重组微生物生产MEG或乙醇酸(GA)的方法，其中所述方法包括在含有提供碳源的一种或多种己糖原料的培养介质中培养重组微生物，直至生产MEG或GA。

48.根据权利要求47所述的方法，其中所述一种或多种联产品与MEG或GA联产。

49.根据权利要求48所述的方法，其中所述一种或多种联产品选自丙酮、异丙醇、丙烯、异丁烯和一种或多种丝氨酸途径化合物。

50.根据权利要求49所述的方法，其中所述一种或多种丝氨酸途径化合物选自丝氨酸、甘氨酸、单乙醇胺(MEA)和乙二胺(EDA)。

51.生产重组微生物的方法，所述重组微生物由一种或多种外源己糖原料通过一种或多种戊糖-5-磷酸中间体生产或积累MEG或乙醇酸(GA)，所述方法包括：

52.生产重组微生物的方法，所述重组微生物由一种或多种外源己糖原料通过一种或多种戊糖-5-磷酸中间体生产或积累MEG或乙醇酸(GA)和一种或多种联产品，所述方法包括：

53.根据权利要求51或52所述的方法，其中乙醇醛通过乙醇醛脱氢酶氧化为乙醇酸。

54.根据权利要求51-53中任一项所述的方法，其中用于将一种或多种己糖原料转化为一种或多种戊糖-5-磷酸中间体的一种或多种酶选自一种或多种具有以下活性的酶：转酮醇酶活性、转醛醇酶活性、核酮糖-5-磷酸3-差向异构酶活性和核糖-5-磷酸异构酶活性。

55.根据权利要求51-54中任一项所述的方法，其中所述方法进一步包括向重组微生物中引入一种或多种修饰，以降低或缺失一种或多种内源性酶的活性，所述内源性酶选自甘油醛3-磷酸脱氢酶(gapA)、磷酸甘油酸激酶(pgk)和磷酸甘油酸变位酶(gpmA和/或gpmM)。

56.根据权利要求51-53中任一项所述的方法，其中将一种或多种己糖原料转化为一种或多种戊糖-5-磷酸中间体的一种或多种酶选自一种或多种具有以下活性的酶：果糖-6-磷酸磷酸酮醇酶活性、磷酸乙酰转移酶活性、转酮醇酶活性、转醛醇酶活性、核酮糖-5-磷酸3-差向异构酶活性和核糖-5-磷酸异构酶活性。

57.根据权利要求56所述的方法，其中所述方法进一步包括将一种或多种修饰引入重组微生物中，以减少或缺失内源性6-磷酸果糖激酶(pfkA和/或pfkB)酶的活性。

58.根据权利要求51-57中任一项所述的方法，其中所述方法进一步包括：将一种或多种修饰引入重组微生物中，以减少或缺失一种或多种内源性酶的活性，所述内源性酶选自葡萄糖6-磷酸-1-脱氢酶、6-磷酸葡萄糖酸内酯酶和6-磷酸葡萄糖酸脱氢酶。

59.根据权利要求51-58中任一项所述的方法，其中用于将一种或多种戊糖-5-磷酸中间体转化为一种或多种戊糖或戊糖-1-磷酸中间体的一种或多种酶选自一种或多种具有以下活性的酶：戊糖磷酸酶活性、D-核酮糖-5-磷酸酶活性、D-核糖-5-磷酸酶活性、D-核糖异构酶活性、阿糖醇磷酸脱氢酶活性和磷酸戊糖变位酶活性。

60.根据权利要求51所述的方法，其中用于由C3途径中的DHAP或丙酮酸生产MEG或GA的一种或多种酶选自具有选自以下的活性的一种或多种酶：3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、丝氨酸转氨酶活性、羟基丙酮酸脱羧酶活性、3-磷酸羟基丙酮酸还原酶活性、乙醇醛还原酶活性、乙醇醛脱氢酶活性、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶活性、丝氨酸脱羧酶活性、乙醇胺转氨酶或乙醇胺氧化还原酶(脱氨基)活性、甘油酸脱羧酶活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性和甘油酸2-激酶活性。

61.根据权利要求52所述的方法，其中用于由C3途径中的DHAP或丙酮酸生产一种或多种联产品的一种或多种酶选自一种或多种具有选自以下的活性的酶：硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A：乙酰乙酸转移酶或乙酸：乙酰乙酰辅酶A水解酶活性和乙酰乙酸脱羧酶活性，并且其中所述一种或多种联产品包括丙酮。

62.根据权利要求52所述的方法，其中用于由C3途径中的DHAP或丙酮酸生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A：乙酰乙酸转移酶或乙酸：乙酰乙酰辅酶A水解酶活性、乙酰乙酸脱羧酶活性和仲醇脱氢酶活性，并且其中所述一种或多种联产品包含异丙醇。

63.根据权利要求52所述的方法，其中用于由C3途径中的DHAP或丙酮酸生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A：乙酰乙酸转移酶或乙酸：乙酰乙酰辅酶A水解酶活性、乙酰乙酸脱羧酶活性、仲醇脱氢酶活性和脱水酶活性，并且其中所述一种或多种联产品包含丙烯。

64.根据权利要求52所述的方法，其中用于由C3途径中的DHAP或丙酮酸生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A：乙酰乙酸转移酶或乙酸：乙酰乙酰辅酶A水解酶活性、乙酰乙酸脱羧酶活性、3-羟基异戊酸(3HIV)合酶活性、羟甲基戊二酰辅酶A合酶活性、甲基戊烯二酰辅酶A水合酶活性、甲基巴豆酰辅酶A羧化酶活性、甲基巴豆酰辅酶A水合酶活性、3-羟基异戊酰辅酶A硫酯酶活性、3HIV激酶活性、3HIV-3-磷酸脱羧酶活性和3HIV脱羧酶活性，并且其中所述一种或多种联产品包含异丁烯。

65.根据权利要求52所述的方法，其中用于由C3途径中的DHAP或丙酮酸生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性和甘油酸2-激酶活性，并且其中所述一种或多种联产品包含L-丝氨酸。

66.根据权利要求52所述的方法，其中用于由C3途径中的DHAP或丙酮酸生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：丝氨酸羟甲基转移酶活性、转移酶活性、甲醛脱氢酶活性、甲酸脱氢酶活性、与甘氨酸裂解系统相关的活性、3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、丝氨酸转氨酶活性、羟基丙酮酸脱羧酶活性、丝氨酸氧化还原酶(脱氨基)活性、丝氨酸脱羧酶活性、乙醇胺转氨酶或乙醇胺氧化还原酶(脱氨基)活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性、甘油酸2-激酶活性、乙醇醛脱氢酶活性、乙醇酸脱氢酶活性、丙氨酸-乙醛酸转氨酶活性、丙氨酸转氨酶活性和NAD(P)H依赖性谷氨酸脱氢酶活性，并且其中所述一种或多种联产品包含甘氨酸。

67.根据权利要求66所述的方法，其中与甘氨酸裂解系统相关的活性包含选自以下的酶或蛋白：甘氨酸脱羧酶(P蛋白)、氨甲基转移酶(T蛋白)、二氢硫辛酰胺脱氢酶(L蛋白)和H蛋白。

68.根据权利要求52所述的方法，其中用于由C3途径中的DHAP或丙酮酸生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、转氨酶活性、羟基丙酮酸脱羧酶活性、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶活性、丝氨酸脱羧酶活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性、甘油酸2-激酶活性、乙醛脱氢酶活性和乙醇胺解氨酶活性，并且其中所述一种或多种联产品包含单乙醇胺(MEA)。

69.根据权利要求52所述的方法，其中用于由C3途径中的DHAP或丙酮酸生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶：丝氨酸脱氢酶活性、2-氨基丙二酸半醛脱羧酶活性、氨基乙醛转氨酶活性、2-氨基丙二酸半醛转氨酶活性、2,3-二氨基丙酸脱羧酶活性、丝氨酸脱羧酶活性、乙醇胺脱氢酶活性、丝氨酸羟甲基转移酶活性、醛氧化酶活性、N-乙酰转移酶或O-乙酰转移酶活性、N-乙酰丝氨酸脱氢酶活性、转氨酶活性、脱乙酰酶活性、丝氨酸氨基酶活性和2,3-二氨基丙酸解氨酶活性，并且其中所述一种或多种联产品包含乙二胺(EDA)。

70.根据权利要求51-69中任一项所述的方法，其中用于在C2途径中生产MEG或GA的一种或多种酶选自具有选自以下的活性的一种或多种酶：D-塔格糖3-差向异构酶活性、D-核酮糖激酶活性、D-核酮糖-1-磷酸醛缩酶活性、D-木酮糖1-激酶活性、D-木酮糖-1-磷酸醛缩酶活性、木糖还原酶或醛糖还原酶活性、木糖醇脱氢酶活性、木糖异构酶活性、木糖脱氢酶活性、木糖酸内酯酶活性、木糖酸脱氢酶活性、2-酮-3-脱氧-D-戊酸醛缩酶活性、乙醇醛还原酶活性和乙醇醛脱氢酶活性。

71.根据权利要求51-70中任一项所述的方法，其中所述方法进一步包括：向重组微生物中引入一种或多种修饰，以减少或缺失乙醇醛脱氢酶、乳酸脱氢酶、木糖异构酶、木酮糖激酶或其组合的活性。