CN111705028A

CN111705028A - 制造4-羟基丁酸酯、1，4-丁二醇和相关化合物的微生物和方法

Info

Publication number: CN111705028A
Application number: CN202010532775.9A
Authority: CN
Inventors: 普里蒂·法克雅; A·P·博加德; S·J·万殿; 罗宾·E·奥斯特豪特; 约翰·D·特拉威克; 迈克尔·P·库钦斯卡斯; 布莱恩·斯蒂尔; M·J·伯克
Original assignee: Genomatica Inc
Current assignee: Genomatica Inc
Priority date: 2012-06-04
Filing date: 2013-06-03
Publication date: 2020-09-25
Also published as: US11085015B2; TW201410865A; US20230065295A1; US20140030779A1; SI2855687T1; EP3831951A3; WO2013184602A2; AR093753A1; WO2013184602A3; EP2855687B1; EP2855687A2; US20150148513A1; CN104685058A; US11932845B2; EP3831951A2; EP2855687A4; BR112014030202A2; CN104685058B; US9677045B2; US20170362565A1

Abstract

本发明提供具有4‑羟基丁酸酯、1,4‑丁二醇或其它产物途径且能够产生4‑羟基丁酸酯、1,4‑丁二醇或其它产物的非天然微生物，其中所述微生物包含一或多种遗传修饰。本发明另外提供使用所述微生物产生4‑羟基丁酸酯、1,4‑丁二醇或其它产物或相关产物的方法。

Description

制造4-羟基丁酸酯、1，4-丁二醇和相关化合物的微生物和方法

本申请是申请日为2013年6月3日、申请号为201380039811.6、名称为“制造4-羟基丁酸酯、1，4-丁二醇和相关化合物的微生物和方法”的发明申请的分案。

本发明申请案含有已经由EFS-Web以ASCII格式提交的序列表且其全部内容以引用方式并入本文中。于2013年5月29日创建的所述ASCII拷贝命名为871943-228191_SL.txt且大小为242,819个字节。

本申请案主张2012年6月4日申请的美国临时申请案第61/655,429号的优先权的权益，其全部内容以引用方式并入本文中。

技术领域

本发明大概来说涉及生物体的计算机的设计和生物体的改造，所述生物体更特定来说为具有1，4-丁二醇、4-羟基丁酰基-CoA、4-羟基丁醛或腐胺生物合成能力的生物体。

背景技术

化合物4-羟基丁酸(4-羟基丁酸酯(4-hydroxybutanoate)、4-羟基丁酸酯(4-hydroxybutyrate)、4-HB)是具有作为各种商品和特殊化学品的结构单元的工业潜力的4-碳羧酸。特定来说，4-HB具有用作进入1，4-丁二醇化学品家族的新进入点的潜力，所述家族包括溶剂、树脂、聚合物前体和特殊化学品。1，4-丁二醇(BDO)是聚合物中间体和工业溶剂，全球市场为约30亿lb/年。BDO目前是从石油化学前体(主要为乙炔、马来酸酐和环氧丙烷)产生。

例如，使乙炔与2分子甲醛在Reppe合成反应中反应(克罗斯威克斯(Kroschwitz)和格兰特(Grant)，化学工业技术百科全书(Encyclopedia of Chem.Tech.)，约翰威利父子公司(John Wiley and Sons，Inc.)，纽约(1999))，之后进行催化氢化以形成1，4-丁二醇。据估计，美国生产的乙炔90％用于生产丁二醇。或者，其可通过源自丁烷的马来酸酐的酯化和催化氢化来形成。在下游，可进一步转化丁二醇；例如，通过氧化转化成γ-丁内酯，γ-丁内酯可进一步转变为吡咯烷酮和N-甲基-吡咯烷酮，或者通过氢解而转变为四氢呋喃。所述化合物具有作为聚合物中间体、溶剂和添加剂的各种应用，并且总市场近20亿lb/年。需要研发通过替代手段产生所述化学品的方法，所述替代手段不仅代替用于基于石油的原料的可再生品，并且还使用能量和资本较不密集的工艺。

因此，相关技艺需要用于有效地产生商业量的1，4-丁二醇和其化学前体的替代手段。本发明满足这种需要且还提供相关优点。

发明内容

本发明提供具有4-羟基丁酸酯、1，4-丁二醇或其它产物途径且能够产生4-羟基丁酸酯、1，4-丁二醇或其它产物的非天然微生物，其中所述微生物包含一或多种遗传修饰。本发明另外提供使用所述微生物产生4-羟基丁酸酯、1，4-丁二醇或其它产物或相关产物的方法。

附图说明

图1是显示产生4-羟基丁酸酯(4-HB)和1，4-丁二醇的生物化学途径的示意图。前5个步骤是大肠杆菌(E.coli)的内源性步骤，而其余步骤可异源表达。催化生物合成反应的酶是：(1)琥珀酰基-CoA合成酶；(2)非CoA依赖性琥珀酸半醛脱氢酶；(3)α-酮戊二酸脱氢酶；(4)谷氨酸：琥珀酸半醛转氨酶；(5)谷氨酸脱羧酶；(6)CoA依赖性琥珀酸半醛脱氢酶；(7)4-羟基丁酸脱氢酶；(8)α-酮戊二酸脱羧酶；(9)4-羟基丁酰基CoA：乙酰基-CoA转移酶；(10)丁酸激酶；(11)磷酸转丁酰基酶；(12)醛脱氢酶；(13)醇脱氢酶。

图2是显示大肠杆菌中的高丝氨酸生物合成的示意图。

图3显示使用具有表达4-HB途径基因的各种组合的质粒的大肠杆菌菌株在葡萄糖最低培养基中产生4-HB。(a)培养液中的4-HB浓度；(b)培养液中的琥珀酸酯浓度；(c)在600nm下测量的培养物OD。条形簇代表24小时、48小时和72小时(如果测量)时间点。沿x轴的代码指示所用菌株/质粒组合。第一索引是指宿主菌株：1，MG1655 lacI^Q；2，MG1655 ΔgabDlacI^Q；3，MG1655 ΔgabD ΔaldA lacI^Q。第二索引是指所用质粒组合：1，pZE13-0004-0035与pZA33-0036；2，pZE13-0004-0035与pZA33-0010n；3，pZE13-0004-0008与pZA33-0036；4，pZE13-0004-0008与pZA33-0010n；5，对照载体pZE13与pZA33。

图4显示在表达来自结核分枝杆菌(Mycobacterium tuberculosis)的α-酮戊二酸脱羧酶的大肠杆菌菌株中从葡萄糖产生4-HB。菌株1-3含有pZE13-0032和pZA33-0036。菌株4仅表达空载体pZE13和pZA33。宿主菌株如下：1和4，MG1655 lacI^Q；2，MG1655 ΔgabDlacI^Q；3，MG1655 ΔgabD ΔaldA lacI^Q。条形是指在24小时和48小时的浓度。

图5显示在重组大肠杆菌菌株中从10mM 4-HB产生BDO。编号位置对应于使用MG1655 lacI^Q的实验，其含有表达来自牙龈卟啉单胞菌(P.gingivalis)的cat2的pZA33-0024和在pZE13上表达的以下基因：1，无(对照)；2，0002；3，0003；4，0003n；5，0011；6，0013；7，0023；8，0025；9，0008n；10，0035。基因编号定义于表6中。对于各位置来说，条形分别是指好氧性条件、微好氧性条件和厌氧性条件。微好氧性条件是通过密封培养管但不将其抽空来产生。

图6显示由在补加有4g/L未经标记葡萄糖(a、c、e和g)、均匀标记¹³C-葡萄糖(b、d、f和h)的M9最低培养基中生长的MG1655 lacI^Q pZE13-0004-0035-0002 pZA33-0034-0036产生的4-HB和BDO的质谱图。(a)和(b)，衍生化BDO的质量116特征片段，其含有2个碳原子；(c)和(d)，衍生化BDO的质量177特征片段，其含有1个碳原子；(e)和(f)，衍生化4-HB的质量117特征片段，其含有2个碳原子；(g)和(h)，衍生化4-HB的质量233特征片段，其含有4个碳原子。

图7是用于产生γ-丁内酯的生物工艺的示意性工艺流程图。图(a)图解说明利用分批分离的分批补料发酵且图(b)图解说明利用连续分离的分批补料发酵。

图8A和8B显示实例性1，4-丁二醇(BDO)途径。图8A显示始于琥珀酰基-CoA的BDO途径。图8B显示始于α-酮戊二酸酯的BDO途径。

图9A-9C显示实例性BDO途径。图9A和9B显示始于4-氨基丁酸酯的途径。图9C显示从乙酰乙酰基-CoA到4-氨基丁酸酯的途径。

图10显示始于α-酮戊二酸酯的实例性BDO途径。

图11显示始于谷氨酸酯的实例性BDO途径。

图12显示始于乙酰乙酰基-CoA的实例性BDO途径。

图13显示始于高丝氨酸的实例性BDO途径。

图14显示大肠杆菌琥珀酰基-CoA合成酶的核苷酸和氨基酸序列。图14A显示大肠杆菌sucCD操纵子的核苷酸序列(SEQ ID NO：46)。图14B(SEQ ID NO：47)和14C(SEQ ID NO：48)显示由sucCD操纵子编码的琥珀酰基-CoA合成酶亚单元的氨基酸序列。

图15显示牛分枝杆菌(Mycobacterium bovis)α-酮戊二酸脱羧酶的核苷酸和氨基酸序列。图15A显示牛分枝杆菌sucA基因的核苷酸序列(SEQ ID NO：49)。图15B显示牛分枝杆菌α-酮戊二酸脱羧酶的氨基酸序列(SEQ ID NO：50)。

图16显示大肠杆菌在厌氧性(微好氧性)条件下在最低培养基中经由α-酮戊二酸酯从葡萄糖生物合成4-羟基丁酸酯。宿主菌株是ECKh-401。实验基于存在于质粒pZA33上的如下上游途径基因来标记：1)4hbd-sucA；2)sucCD-sucD-4hbd；3)sucCD-sucD-4hbd-suc4。

图17显示大肠杆菌在最低培养基中经由琥珀酸酯和α-酮戊二酸酯从葡萄糖生物合成4-羟基丁酸酯。宿主菌株是野生型MG1655。实验基于存在于质粒pZE13和pZA33上的如下基因来标记：1)空对照载体；2)空pZE13、pZA33-4hbd；3)pZE13-sucA、pZA33-4hbd。

图18A显示来自牙龈卟啉单胞菌的CoA依赖性琥珀酸半醛脱氢酶(sucD)的核苷酸序列(SEQ ID NO：51)，并且图18B显示所编码氨基酸序列(SEQ ID NO：52)。

图19A显示来自牙龈卟啉单胞菌的4-羟基丁酸脱氢酶(4hbd)的核苷酸序列(SEQID NO：53)，并且图19B显示所编码氨基酸序列(SEQ ID NO：54)。

图20A显示来自牙龈卟啉单胞菌的4-羟基丁酸CoA转移酶(cat2)的核苷酸序列(SEQ ID NO：55)，并且图20B显示所编码氨基酸序列(SEQ ID NO：56)。

图21A显示来自丙酮丁醇梭菌(Clostridium acetobutylicum)的磷酸转丁酰基酶(ptb)的核苷酸序列(SEQ ID NO：57)，并且图21B显示所编码氨基酸序列(SEQ ID NO：58)。

图22A显示来自丙酮丁醇梭菌的丁酸激酶(buk1)的核苷酸序列(SEQ ID NO：59)，并且图22B显示所编码氨基酸序列(SEQ ID NO：60)。

图23显示丙酮丁醇梭菌020(磷酸转丁酰基酶)的替代核苷酸序列，其相对于丙酮丁醇梭菌天然序列将密码子改变为更常见的大肠杆菌密码子。图23A-23D(020A-020D，分别为SEQ ID NO：61-64)所含序列中经更常见密码子置换的罕见大肠杆菌密码子的数目递增(A＜B＜C＜D)。

图24显示丙酮丁醇梭菌021(丁酸激酶)的替代核苷酸序列，其相对于丙酮丁醇梭菌天然序列将密码子改变为更常见的大肠杆菌密码子。图24A-24D(021A-021B，分别为SEQID NO：65-68)所含序列中经更常见密码子置换的罕见大肠杆菌密码子的数目递增(A＜B＜C＜D)。

图25显示丁酸激酶(BK)和磷酸转丁酰基酶(PTB)的经改良表达，其密码子经优化以供在大肠杆菌中表达。图25A显示用考马斯蓝(Coomassie blue)对蛋白质染色的十二烷基硫酸钠聚丙烯酰胺凝胶电泳(SDS-PAGE)；泳道1，无插入的对照载体；泳道2，丙酮丁醇梭菌天然序列在大肠杆菌中的表达；泳道3，020B-021B密码子优化PTB-BK的表达；泳道4，020C-021C密码子优化PTB-BK的表达。显示BK和PTB的位置。图25B显示天然丙酮丁醇梭菌序列(2021n)相较于密码子优化020B-021B(2021B)和020C-021C(2021C)的BK和PTB活性。

图26显示BDO和γ-丁内酯(GBL)在以下各种表达BDO产生酶的菌株中的产生：Cat2(034)；2021n；2021B；2021C。

图27A显示天然拜氏梭菌(Clostridium beijerinckii)ald基因(025n)的核苷酸序列(SEQ ID NO：69)，并且图27B显示所编码氨基酸序列(SEQ ID NO：70)。

图28A-28D显示拜氏梭菌ald基因的替代基因序列(025A-025D，分别为SEQ ID NO：71-74)，其中经更常见密码子置换的罕见密码子的数目递增(A＜B＜C＜D)。

图29显示天然拜氏梭菌ald基因和密码子优化变体的表达：无插入(无插入对照)、025n、025A、025B、025C、025D。

图30显示不同菌株中的BDO或BDO和乙醇产生。图30显示含有天然拜氏梭菌ald基因(025n)的菌株或密码子经优化以供在大肠杆菌中表达的变体(025A-025D)中的BDO产生。图30B显示相较于密码子优化变体025B表达丙酮丁醇梭菌AdhE2酶(002C)的菌株中的乙醇和BDO产生。第三组显示牙龈卟啉单胞菌sucD(035)的表达。在所有情况下，还表达牙龈卟啉单胞菌Cat2(034)。

图31A显示来自热葡糖苷酶地芽胞杆菌(Geobacillus thermoglucosidasius)的adh1基因的核苷酸序列(SEQ ID NO：75)，并且图31B显示所编码氨基酸序列(SEQ ID NO：76)。

图32A显示热葡糖苷酶地芽胞杆菌adh1基因在大肠杆菌中的表达。通过SDS-PAGE分析全部细胞溶解物或上清液并用考马斯蓝对无插入质粒、具有083(头状地霉(Geotrichum capitatum)N-苯甲基-3-吡咯烷醇脱氢酶)插入的质粒和具有084(热葡糖苷酶地芽胞杆菌adh1)插入的质粒染色。图32B显示具有丁醛(菱形)或4-羟基丁醛(正方形)作为底物的084的活性。

图33显示BDO在不同菌株中的产生：无插入质粒；025B；025B-026n；025B-026A；025B-026B；025B-026C；025B-050；025B-052；025B-053；025B-055；025B-057；025B-058；025B-071；025B-083；025B-084；PTSlacO-025B；PTSlacO-025B-026n。

图34显示载体pRE118-V2的质粒图谱。

图35显示涵盖aceF和lpdA基因的ECKh-138区的序列(SEQ ID NO：77)。肺炎克雷伯氏菌(K.pneumonia)lpdA基因加下划线，并且Glu354Lys突变体中改变的密码子带阴影。

图36显示天然大肠杆菌lpdA(SEQ ID NO：78)与突变肺炎克雷伯氏菌lpdA(SEQ IDNO：79)的蛋白质序列比较。

图37显示菌株AB3、MG1655 ΔldhA和ECKh-138中的4-羟基丁酸酯(左条形)和BDO(右条形)产生。所有菌株都表达中等拷贝质粒pZA33上的大肠杆菌sucCD、牙龈卟啉单胞菌sucD、牙龈卟啉单胞菌4hbd和高拷贝质粒pZE13上的牙龈卟啉单胞菌Cat2、丙酮丁醇梭菌AdhE2。

图38显示融合到pflB-p6启动子和核糖体结合位点(RBS)的aceE基因的5’末端的核苷酸序列(SEQ ID NO：80)。5’斜体序列显示在与pdh操纵子相反的方向上转录的aroP基因的起点。3’斜体序列显示aceE基因的起点。大写体：pflB RBS。加下划线：FNR结合位点。粗体：pflB-p6启动子序列。

图39显示菌株ECKh-456中aceF-lpdA区的核苷酸序列(SEQ ID NO：81)。

图40显示菌株ECKh-439、ECKh-455和ECKh-456中的每一者的4-羟基丁酸酯、BDO和丙酮酸酯的产生(分别为从左到右的条形)。

图41A显示用于缺失mdh基因的重组位点的示意图。图41B显示氯霉素(chloramphenico1)抗性基因(CAT)的扩增的PCR产物的核苷酸序列(SEQ ID NO：82)和所编码氨基酸序列(SEQ ID NO：83)，所述抗性基因侧接来自质粒pKD3的mdh基因的FRT位点和同源区。

图42显示菌株ECKh-401中arc4缺失区的序列(SEQ ID NO：84)。

图43显示涵盖菌株ECKh-422的突变gltA基因的区域的序列(SEQ ID NO：85)。

图44显示野生型gltA基因产物和R163L突变体的柠檬酸合成酶活性。在0.4mMNADH不存在(菱形)或存在(正方形)下进行分析。

图45显示菌株ECKh-401和ECKh-422中的4-羟基丁酸酯(左条形)和BDO(右条形)产生，所述两个菌株都在质粒上表达完整BDO途径的基因。

图46显示来自代谢标记实验的中心代谢通量和相关95％信赖区间。各值是正规化成1mmol/hr的葡萄糖吸收速率的摩尔通量。结果指示，碳通量在氧化方向上途经柠檬酸合成酶，并且多数碳进入BDO途径，而非完成TCA循环。

图47显示菌株ECKh-138和ECKh-422的细胞外产物形成，所述两个菌株都在质粒上表达整个BDO途径。所测量产物是乙酸酯(Ace)、丙酮酸酯(Pyr)、4-羟基丁酸酯(4HB)、1，4-丁二醇(BDO)、乙醇(EtOH)和其它产物，其包括γ-丁内酯(GBL)、琥珀酸酯和乳酸酯。

图48显示由流感嗜血杆菌(H.influenzae)磷酸烯醇丙酮酸酯羧基激酶(pepck)置换PEP羧化酶(ppc)后的所述区的序列(SEQ ID NO：86)。pepck编码区加下划线。

图49显示含有50mMNaHCO₃的最低培养基中生长的进化pepCK菌株的生长。

图50显示在质粒pZS*13上表达牙龈卟啉单胞菌Cat2和拜氏梭菌Ald的菌株ECKh-453中的产物形成。所测量产物是1，4-丁二醇(BDO)、丙酮酸酯、4-羟基丁酸酯(4HB)、乙酸酯、γ-丁内酯(GBL)和乙醇。

图51显示两个菌株ECKh-453和ECKh-432的BDO产生。两者都含有表达牙龈卟啉单胞菌Cat2和拜氏梭菌A1d的质粒pZS*13。使培养物在微好氧性条件下生长，其中用27或18号针刺穿容器，如所指示。

图52显示菌株ECKh-426的基因组DNA在插入含有启动子、sucCD基因、sucD基因、4hbd基因和终止子序列的多顺反子DNA片段的区中的核苷酸序列(SEQ ID NO：87)。

图53显示菌株ECKh-432的染色体区在插入含有启动子、sucA基因、克氏羧菌(C.kluyveri)4hbd基因和终止子序列的多顺反子序列的区中的核苷酸序列(SEQ ID NO：88)。

图54显示在最低培养基中在ECKh-432菌株中从葡萄糖合成BDO，所述菌株具有整合到染色体中的编码上游BDO途径的基因且含有具有下游BDO途径基因的质粒。

图55显示含有侧接与rrnC区同源的区的非磷酸转移酶(非PTS)蔗糖利用基因的PCR产物(SEQ ID NO：89)。

图56显示rrnC操纵子中的整合位点的示意图。

图57显示在葡萄糖上生长的菌株ECKh-432和蔗糖上生长的菌株ECKh-463生长48小时后正规化成培养物OD600的平均产物浓度。两者都含有表达牙龈卟啉单胞菌Cat2和拜氏梭菌Ald的质粒pZS*13。数据涉及各菌株的6个相同培养物。所测量产物是1，4-丁二醇(BDO)、4-羟基丁酸酯(4HB)、γ-丁内酯(GBL)、丙酮酸酯(PYR)和乙酸酯(ACE)(分别为从左到右的条形)。

图58显示从琥珀酰基-CoA和α-酮戊二酸酯产生1，4-丁二醇的实例性途径。缩写：A)琥珀酰基-CoA还原酶(形成醛)，B)α-酮戊二酸脱羧酶，C)4-羟基丁酸脱氢酶，D)4-羟基丁酸还原酶，E)1，4-丁二醇脱氢酶。

图59A显示来自伊文思奴卡菌(Nocardia iowensis)的羧酸还原酶(GNM_720)的核苷酸序列(SEQ ID NO：90)，并且图59B显示所编码氨基酸序列(SEQ ID NO：91)。

图60A显示密码子优化磷酸泛酰巯基乙胺转移酶的核苷酸序列(SEQ ID NO：92)，并且图60B显示所编码氨基酸序列(SEQ ID NO：93)。

图61显示质粒pZS*-13S-720721opt的质粒图谱。

图62A和62B显示从琥珀酸酯、琥珀酰基-CoA和α-酮戊二酸酯产生1，4-丁二醇的途径。缩写：A)琥珀酰基-CoA还原酶(形成醛)，B)α-酮戊二酸脱羧酶，C)4-羟基丁酸脱氢酶，D)4-羟基丁酸还原酶，E)1，4-丁二醇脱氢酶，F)琥珀酸还原酶，G)琥珀酰基-CoA转移酶，H)琥珀酰基-CoA水解酶，I)琥珀酰基-CoA合成酶(或琥珀酰基-CoA连接酶)，J)谷氨酸脱氢酶，K)谷氨酸转氨酶，L)谷氨酸脱羧酶，M)4-氨基丁酸脱氢酶，N)4-氨基丁酸转氨酶，O)4-羟基丁酸激酶，P)磷酸转-4-羟基丁酰基酶，Q)4-羟基丁酰基-CoA还原酶(形成醛)，R)4-羟基丁酰基-磷酸酯还原酶，S)琥珀酰基-CoA还原酶(形成醇)，T)4-羟基丁酰基-CoA转移酶，U)4-羟基丁酰基-CoA水解酶，V)4-羟基丁酰基-CoA合成酶(或4-羟基丁酰基-CoA连接酶)，W)4-羟基丁酰基-CoA还原酶(形成醇)，X)α-酮戊二酸还原酶，Y)5-羟基-2-氧代戊酸脱氢酶，Z)5-羟基-2-氧代戊酸脱羧酶，AA)5-羟基-2-氧代戊酸脱氢酶(脱羧)。

图63显示从琥珀酸酯、琥珀酰基-CoA和α-酮戊二酸酯产生腐胺的途径。缩写：A)琥珀酰基-CoA还原酶(形成醛)，B)α-酮戊二酸脱羧酶，C)4-氨基丁酸还原酶，D)腐胺脱氢酶，E)腐胺转氨酶，F)琥珀酸还原酶，G)琥珀酰基-CoA转移酶，H)琥珀酰基-CoA水解酶，I)琥珀酰基-CoA合成酶(或琥珀酰基-CoA连接酶)，J)谷氨酸脱氢酶，K)谷氨酸转氨酶，L)谷氨酸脱羧酶，M)4-氨基丁酸脱氢酶，N)4-氨基丁酸转氨酶，O)α-酮戊二酸还原酶，P)5-氨基-2-氧代戊酸脱氢酶，Q)5-氨基-2-氧代戊酸转氨酶，R)5-氨基-2-氧代戊酸脱羧酶，S)鸟氨酸脱氢酶，T)鸟氨酸转氨酶，U)鸟氨酸脱羧酶。

图64A显示来自耻垢分枝杆菌(Mycobacterium smegmatis)mc(2)155(命名为890)的羧酸还原酶的核苷酸序列(SEQ ID NO：94)，并且图64B显示所编码氨基酸序列(SEQ IDNO：95)。

图65A显示来自鸟分枝杆菌副结核亚种K-10(Mycobacterium avium subspeciesparatuberculosis K-10)(命名为891)的羧酸还原酶的核苷酸序列(SEQ ID NO：96)，并且图65B显示所编码氨基酸序列(SEQ ID NO：97)。

图66A显示来自海栖分枝杆菌M(Mycobacterium marinum M)(命名为892)的羧酸还原酶的核苷酸序列(SEQ ID NO：98)，并且图66B显示所编码氨基酸序列(SEQ ID NO：99)。

图67显示大肠杆菌MG1655染色体在核苷酸760928与765930之间的示意图。

图68A-68E显示用于构筑sucCD缺失的序列和寡核苷酸的示意图。

图69显示实例性BDO途径。各编号步骤的酶名称如下：(1)α-酮戊二酸脱羧酶；(2)CoA依赖性琥珀酸半醛脱氢酶；(3)4-羟基丁酸脱氢酶；(4)4-羟基丁酰基-CoA转移酶；(5)4-羟基丁酰基-CoA还原酶；(6)4-羟基丁醛还原酶。

图70显示从葡萄糖形成BDO的实例性途径。缩写：G6P-葡萄糖-6-磷酸酯、PEP-磷酸烯醇丙酮酸酯、PYR-丙酮酸酯、OA-草酰乙酸酯、ACCOA-乙酰基-CoA、CIT-柠檬酸酯、ICIT-异柠檬酸酯、AKG-α-酮戊二酸酯、SUCCOA-琥珀酰基-CoA、SUCSAL-琥珀酸半醛、4HB-4-羟基丁酸酯、4HBCoA-4-羟基丁酰基-CoA、4HBALD-4羟基丁醛、BDO-1，4-丁二醇、GBL-γ-丁内酯。所关注基因：ppc-PEP羧化酶、sucCD-琥珀酰基-CoA合成酶、sucAB-lpdA-AKG脱氢酶复合物的亚单元、ybgC、tesB-酰基-辅酶A硫酯酶。

图71显示相较于对照菌株的4个重复的相应平均值，来自基因ppc过表达的产生4HB的宿主菌株的4个重复的平均BDO和4HB数量。

图72显示相较于对照，来自ppc过表达的菌株的4个重复的平均乙醇数量的降低。

图73显示相较于来自对照菌株的4个重复的对应平均值，来自在pZS*上过表达基因sucAB和突变lpdA的产生4HB的宿主菌株的4个重复的平均BDO和4HB数量。ALD和ADH是在质粒pPZSX23R上表达。

图74显示来自基因sucAB和突变lpdA在pZS*上过表达且相较于那些来自对照者的菌株的4个重复的平均谷氨酸酯数量的降低。

图75显示4-HB内酯化成GBL的表观平衡常数随pH的变化(在22℃下)(来自埃费(Efe)等人，生物技术与生物工程(Biotechnol.Bioeng.)99：1392-1406(2008))。

图76显示相较于来自对照菌株(2237)的4个重复的相应平均值，来自整合有酯酶的能够产生4-羟基丁酰基-CoA的宿主菌株(2387)的4个重复的平均BDO和4HB数量。

图77显示相较于来自对照菌株(2237)的4个重复的相应平均值，来自整合有酯酶的宿主菌株(2387)的4个重复的平均GBL数量。整合有酯酶的菌株观察到较低GBL。

图78显示相较于来自4个对照菌株(4070)重复的相应平均值，来自缺失基因sucCD的4个宿主菌株(4269)重复的BDO和4HB平均数。

图79显示相较于来自对照菌株(1136)的3个重复的相应平均值，来自缺失基因ybgC和tesB的宿主菌株(1197)的3个重复的BDO和4HB平均数。

图80显示相较于来自对照菌株(1136)的3个重复的相应平均值，来自缺失基因ybgC和tesB的宿主菌株(1197)的3个重复的GBL平均数。

图81显示各部分的阴离子交换洗脱、回流(backflux)活性以及SDS page的概况。

图82显示各部分的分子大小筛选色谱、回流活性以及SDS page的概况。

图83显示分子大小筛选管柱和SDS page的回流活性。

图84显示，利用抗生蛋白链菌素标签克隆yjgB基因，使其表达并纯化以表征其性质。纯化结果是经由SDS-PAGE获得。

图85显示在100mM BDO中的yjgB活性。

图86显示菌株1872相对于菌株1889的平均BDO、4HB和GBL数量。

图87显示菌株956相对于菌株879的平均BDO、4HB和GBL数量。

图88显示菌株1889、2424、2611和2471的平均BDO、4HB和GBL数量。

图89A显示耶氏杆菌属(Yersinia)基因(基因座yinte0001_13710)的核苷酸序列(SEQ ID NO：177)，并且图89B显示所编码氨基酸序列(SEQ ID NO：179)。

图90A显示来自根癌土壤杆菌(Agrobacterium tumefaciens)的基因的核苷酸序列(SEQ ID NO：178)，并且图90B显示所编码氨基酸序列(SEQ ID NO：180)。

图91显示对应于以下的代谢修饰的实例性组合：(A)增加磷酸烯醇丙酮酸羧化酶表达的遗传修饰；(B)增加α-酮戊二酸脱氢酶表达的遗传修饰；(C)增加非磷酸转移酶(PTS)葡萄糖吸收系统表达的遗传修饰；(D)增加γ-丁内酯酯酶表达的遗传修饰；(E)降低琥珀酰基-CoA合成酶表达的遗传修饰；(F)降低酰基辅酶A硫酯酶表达的遗传修饰；(G)降低醇脱氢酶表达的遗传修饰；(H)降低非产能NADH脱氢酶表达的遗传修饰；(I)降低细胞色素氧化酶表达的遗传修饰；(J)增加丙酮酸脱氢酶表达的遗传修饰；(K)降低好氧性呼吸控制调节系统表达的遗传修饰；(L)增加对NADH不敏感的柠檬酸合成酶表达的遗传修饰；(M)降低苹果酸脱氢酶表达的遗传修饰；(N)降低乳酸脱氢酶表达的遗传修饰；(O)降低醇脱氢酶表达的遗传修饰；和(P)降低丙酮酸甲酸裂解酶表达的遗传修饰。

具体实施方式

本发明涉及具有4-羟基丁酸(4-HB)、γ-丁内酯、1，4-丁二醇(BDO)、4-羟基丁醛(4-HBal)、4-羟基丁酰基-CoA(4-HBCoA)和/或腐胺的生物合成产生能力的细胞和生物体的设计和产生。特定来说，本发明涉及通过引入一或多个编码BDO、4-HBal、4-HBCoA和/或腐胺途径酶的核酸能够产生BDO、4-HBal、4-HBCoA和/或腐胺的微生物的设计。

在一个实施例中，本发明利用大肠杆菌代谢的计算机化学计量模型，其鉴别用于4-羟基丁酸(4-HB)、1，4-丁二醇(BDO)、4-HBal、4-HBCoA和/或腐胺的生物合成产生的代谢设计。本文所述结果指示，代谢途径可经设计并重组改造以在大肠杆菌和其它细胞或生物体中生物合成4-HBal、4-HBCoA或4-HB和下游产物，例如1，4-丁二醇或腐胺。生物合成产生用于(例如)计算机设计的4-HB、4-HBal、4-HBCoA、BDO和/或腐胺可通过构筑具有所设计代谢基因型的菌株来确认。所述代谢改造细胞或生物体还可经过适应性进化以进一步增进4-HB、4-HBal、4-HBCoA、BDO和/或腐胺生物合成，包括在接近理论最大生长的条件下。

在某些实施例中，所设计菌株的4-HB、4-HBal、4-HBCoA、BDO和/或腐胺生物合成特性使其遗传稳定且特别可用于连续生物工艺。通过向大肠杆菌或其它宿主生物体中纳入不同的非天然或异源反应能力来鉴别单独菌株设计策略，从而从非CoA依赖性琥珀酸半醛脱氢酶、琥珀酰基-CoA合成酶和CoA依赖性琥珀酸半醛脱氢酶或谷氨酸酯：琥珀酸半醛转氨酶获得产生4-HB和1，4-丁二醇的代谢途径。鉴别在大肠杆菌与酵母菌物种二者中从所述代谢途径中的每一者生物合成4-HB的计算机代谢设计。1，4-丁二醇中间体γ-丁内酯可在pH＜7.5的条件下，尤其在酸性条件下，例如低于pH 5.5，例如，pH＜7，pH＜6.5，pH＜6，并且尤其在pH＜5.5或更低下在培养中通过自发环化生成。

经由平台的计算组件鉴别的菌株可通过遗传改造生物合成产生4-HB、1，4-丁二醇或其它中间体和/或下游产物的任一预测代谢改变来实际地产生。在另一实施例中，展现生物合成产生所述化合物的菌株可进一步经过适应性进化以进一步增进产物生物合成。适应性进化后的产物生物合成产量还可通过系统的计算组件预测。

在其它具体实施例中，构筑微生物以表达编码从琥珀酸酯到4-HB和到4-HB-CoA的酶促步骤的4-HB生物合成途径。相较于缺乏4-HB生物合成途径的宿主微生物，在宿主微生物中共表达琥珀酸酯辅酶A转移酶、CoA依赖性琥珀酸半醛脱氢酶、NAD-依赖性4-羟基丁酸脱氢酶和4-羟基丁酸酯辅酶A转移酶显着产生4-HB。在其它具体实施例中，通过引入编码α-酮戊二酸脱羧酶和依赖NAD的4-羟基丁酸脱氢酶的核酸来生成利用α-酮戊二酸酯作为底物的产生4-HB的微生物。

在另一具体实施例中，构筑含有1，4-丁二醇(BDO)生物合成途径的微生物，在4-HB存在下培养时，其生物合成BDO。BDO生物合成途径是由编码多官能醛/醇脱氢酶的核酸或编码醛脱氢酶和醇脱氢酶的核酸组成。为了支持在4-HB底物上生长，所述产生BDO的微生物还表达4-羟基丁酸CoA转移酶或4-丁酸激酶以及磷酸转移羟基丁酰基酶。在另一具体实施例中，生成经由外源性表达编码功能性4-HB生物合成途径和功能性BDO生物合成途径的核酸来合成BDO的微生物。4-HB生物合成途径是由琥珀酸酯辅酶A转移酶、CoA依赖性琥珀酸半醛脱氢酶、依赖NAD的4-羟基丁酸脱氢酶和4-羟基丁酸酯辅酶A转移酶组成。BDO途径是由多官能醛/醇脱氢酶组成。本文进一步描述用于产生BDO的其它途径(参见图8-13)。

在又一实施例中，本文描述在4-羟基丁醛、4-羟基丁酰基-CoA或1，4-丁二醇代谢途径中发挥功能的羧酸还原酶的克隆和表达。采用羧酸还原酶而非酰基-CoA还原酶来形成4-羟基丁醛(4-羟基丁醛)的优点包括伴随BDO产生的较低乙醇和GBL副产物形成。本文还揭示，应用羧酸还原酶作为其它诸多途径中的一部分从三羧酸(TCA)循环代谢物(例如，琥珀酸酯、琥珀酰基-CoA和/或α-酮戊二酸酯)产生1，4-丁二醇和腐胺。

本文所用术语“非天然”在参考本发明微生物或微生物使用时打算意指，微生物具有至少一个并非通常在参考物种的天然菌株(包括参考物种的野生型菌株)中发现的遗传改变。遗传改变包括(例如)引入编码代谢多肽的可表达核酸的修饰、其它核酸添加、核酸缺失和/或对微生物的遗传材料的其它功能破坏。所述修饰包括(例如)与参考物种异源、同源或异源和同源的多肽的编码区和其功能片段。其它修饰包括(例如)修饰改变基因或操纵子的表达的非编码调节区。实例性代谢多肽包括4-HB、4-HBal、4-HBCoA、BDO或腐胺家族化合物生物合成途径内的酶或蛋白质。

代谢修饰是指从天然状态改变的生物化学反应。因此，非天然微生物可具有对编码代谢多肽或其功能片段的核酸的遗传修饰。本文揭示实例性代谢修饰。

本文所用术语“经分离”在参考微生物使用时，打算意指实质上不含在自然界中发现参考微生物时所存在的至少一种组分的生物体。所述术语包括从在微生物天然环境中发现其时所存在的一些或全部组分移出的微生物。所述术语还包括从在非天然环境中发现微生物时所存在的一些或所有组分移出的微生物。因此，经分离微生物与在自然界中发现其时或当其在非天然环境中生长、储存或存活时所存在的其它物质部分或完全分开。经分离微生物的具体实例包括部分纯的微生物、实质上纯的微生物和在非天然培养基中培养的微生物。

本文所用术语“微生物(microbial)”、“微生物(microbial organism)”或“微生物(microorganism)”打算意指包括在古细菌域、细菌域或真核生物域内作为显微细胞存在的任何生物体。因此，所述术语打算涵盖具有微观大小的原核或真核细胞或生物体且包括所有物种的细菌、古细菌和真细菌以及真核微生物，例如酵母菌和真菌。所述术语还包括可经培养用于产生生物化学物质的任一物种的细胞培养物。

本文所用术语“4-羟基丁酸”打算意指丁酸的4-羟基衍生物，其具有化学式C₄H₈O₃且分子质量为104.11g/mol(126.09g/mol，对于其钠盐来说)。化学化合物4-羟基丁酸在相关技艺还称为4-HB、4-羟基丁酸酯、γ-羟基丁酸或GHB。所述术语在本文中使用时，打算包括化合物的各种盐形式中的任一者且包括(例如)4-羟基丁酸盐(4-hydroxybutanoate)和4-羟基丁酸盐(4-hydroxybutyrate)。4-HB的盐形式的具体实例包括4-HB钠和4-HB钾。因此，术语4-羟基丁酸、4-HB、4-羟基丁酸酯(4-hydroxybutyrate)、4-羟基丁酸酯(4-hydroxybutanoate)、γ-羟基丁酸和GHB以及其它相关技艺认可的名称在本文中作为同义词使用。

本文所用术语“单体”在参考4-HB使用时，打算意指呈非聚合或未衍生化形式的4-HB。聚合4-HB的具体实例包括聚-4-羟基丁酸和例如4-HB与3-HB的共聚物。4-HB的衍生化形式的具体实例是4-HB-CoA。4-HB的其它聚合4-HB形式和其它衍生化形式也为相关技艺已知。

本文所用术语“γ-丁内酯”打算意指具有化学式C₄H₆O₂且分子质量为86.089g/mol的内酯。化学化合物γ-丁内酯在相关技艺还称为GBL、丁内酯、1，4-内酯、4-丁内酯、4-羟基丁酸内酯和γ-羟基丁酸内酯。所述术语当其在本文中使用时，打算包括所述化合物的各种盐形式中的任一者。

本文所用术语“1，4-丁二醇”打算意指丁烷的携带有两个羟基的醇衍生物，其具有化学式C₄H₁₀O₂且分子质量为90.12g/mol。化学化合物1，4-丁二醇在相关技艺还称为BDO且是在本文中称作BDO化合物家族的化合物家族的化学中间体或前体。

本文所用术语“4-羟基丁醛”打算意指具有化学式C₄H₈O₂且分子质量为88.10512g/mol的醛。化学化合物4-羟基丁醛(4-HBal)在相关技艺还称为4-羟基丁醛。

本文所用术语“腐胺”打算意指具有化学式C₄H₁₂N₂且分子质量为88.15148g/mol的二胺。化学化合物腐胺在相关技艺还称为1，4-丁二胺、1，4-二氨基丁烷、亚丁基二胺、四亚甲基二胺、四甲基二胺和1，4-亚丁基二胺。

本文所用术语“四氢呋喃”打算意指对应于芳香族化合物呋喃的完全氢化类似物的杂环有机化合物，其具有化学式C₄H₈O且分子质量为72.11g/mol。化学化合物四氢呋喃在相关技艺还称为THF、四氢呋喃、1，4-环氧丁烷、环氧丁烷、氧化环四亚甲基、氧杂环戊烷、氧化二亚乙基、氧戊环、呋喃烷(furanidine)、氢呋喃、氧化四亚甲基。所述术语当其在本文中使用时，打算包括所述化合物的各种盐形式中的任一者。

本文所用术语“CoA”或“辅酶A”打算意指有机辅因子或辅基(酶的非蛋白质部分)，其存在为许多酶(脱辅基酶)形成活性酶系统的活性所需。辅酶A在某些缩合酶中发挥功能，在乙酰基或其它酰基转移以及脂肪酸合成和氧化、丙酮酸酯氧化以及其它乙酰基化中起作用。

本文所用术语“实质性厌氧性”在参考培养或生长条件使用时，打算意指氧量小于液体培养基中饱和溶解氧的约10％。所述术语还打算包括利用小于约1％氧的气氛维持的液体或固体培养基的密封室。

本发明的非天然微生物可含有稳定遗传改变，这是指可培养大于5代而不损失所述改变的微生物。通常，稳定遗传改变包括持续存在大于10代的修饰，特定来说，稳定修饰将持续存在超过约25代，并且更特定来说，稳定遗传修饰将大于50代，包括无限代。

在基因破坏的情况下，特别有用的稳定遗传改变是基因缺失。使用基因缺失来引入稳定遗传改变特别可用于降低在遗传改变前表型发生逆转的可能性。例如，如果需要，生物化学物质的稳定生长偶合性产生可通过(例如)缺失一组代谢修饰内编码催化一或多个反应的酶的基因来实现。生长偶合产生生物化学物质的稳定性可进一步经由多个显着降低针对各受破坏活性发生多个补偿逆转的可能性的缺失来增强。

所属领域技术人员应理解，遗传改变(包括本文所例示代谢修饰)是参考以下来描述：适宜来源或宿主生物体(例如大肠杆菌、酵母菌或本文所揭示其它生物体和其相应代谢反应)或所需遗传材料(例如编码所需代谢途径的相应代谢反应的酶的基因)的适宜来源生物体。然而，鉴于已对众多种生物体进行完全基因组定序且极其熟习基因组学领域，所属领域技术人员应能够容易地将本文所提供的教示和指导应用于基本上所有其它生物体。例如，可通过纳入来自除参考物种外的物种的相同或类似编码核酸容易地将本文所例示的大肠杆菌代谢改变应用于其它物种。所述遗传改变包括(例如)物种同源物的遗传改变，一般来说且特定来说为直系同源物、旁系同源物或非直系同源基因替换。

直系同源物是一或多个因垂直传递(vertical descent)而相关且在不同生物体中负责实质上相同或一致的功能的基因。例如，可将小鼠环氧化物水解酶和人类环氧化物水解酶视为水解环氧化物的生物功能的直系同源物。当例如基因共有足以指示其同源的量的序列相似性时，其是因垂直传递而相关，或其是因从共同祖先进化而相关。如果基因共有三维结构但未必共有足以指示其已从共同祖先进化到不可鉴别主要序列相似性的程度的量的序列相似性，那么还可将其视为直系同源物。直系同源基因可编码具有约25％到100％氨基酸序列一致性的序列相似性的蛋白质。如果编码共有小于25％的氨基酸相似性的蛋白质的基因的三维结构也显示相似性，那么还可将其视为是通过垂直传递产生。将丝氨酸蛋白酶家族成员(包括组织纤维蛋白溶酶原活化剂和弹性蛋白酶)视为是因垂直传递从共同祖先产生。

直系同源物包括结构或总体活性经由(例如)进化已有差异的基因或其所编码基因产物。例如，如果一个物种编码展现两种功能的基因产物且如果所述功能已在第二个物种中分离成不同基因，那么将所述三种基因和其相应产物视为直系同源物。对于生物化学产物的产生(包括生长偶合产生)来说，所属领域技术人员应理解，将选择具有要引入或破坏的代谢活性的直系同源基因来构筑非天然微生物。展现可分离活性的直系同源物的实例是其中不同活性已在两个或更多个物种之间或在单一物种内分离成不同基因产物。具体实例是弹性蛋白酶蛋白质水解和纤维蛋白溶酶原蛋白质水解分离(两种类型的丝氨酸蛋白酶活性)分离成作为纤维蛋白溶酶原活化剂和弹性蛋白酶的不同分子。第二个实例是霉浆菌5’-3’外切核酸酶和果蝇(Drosophila)DNA聚合酶III活性的分离。可将来自第一个物种的DNA聚合酶与来自第二个物种之外切核酸酶或聚合酶中的任一者或二者视为直系同源物，并且反之亦然。

相比之下，旁系同源物是通过(例如)重复、之后进化趋异而相关的同源物且具有相似或共同但不相同的功能。旁系同源物可起源于或源自(例如)相同物种或不同物种。例如，可将微粒体环氧化物水解酶(环氧化物水解酶I)和可溶性环氧化物水解酶(环氧化物水解酶II)视为旁系同源物，这是因为其代表在同一物种中催化不同反应且具有不同功能的两种从共同祖先共进化的不同酶。旁系同源物是彼此具有显着序列相似性的来自同一物种的蛋白质，从而表明其同源，或因从共同祖先共进化而相关。旁系同源性蛋白质家族群组包括HipA同源物、荧光素酶基因、肽酶和其它。

非直系同源基因替换是来自一个物种的非直系同源基因可取代不同物种中的参考基因功能。取代包括(例如)相较于不同物种中的参考功能能够在起源物种中进行实质上相同或相似的功能。尽管通常可将非直系同源基因替换鉴别为与编码参考功能的已知基因在结构上相关，但结构上较不相关但功能相似的基因和其相应基因产物将仍属于所述术语在本文中使用时的含义内。相较于编码寻求取代的功能的基因，功能相似性需要(例如)在非直系同源基因产物的活性位点或结合区具有至少一些结构相似性。因此，非直系同源基因包括(例如)旁系同源物或无关基因。

因此，在鉴别和构筑具有4-HB、GBL、4-HBal、4-HBCoA、BDO和/或腐胺生物合成能力的本发明的非天然微生物时，所属领域技术人员通过将本文所提供的教示和指导应用于特定物种应理解，代谢修饰的鉴别可包括直系同源物的鉴别和纳入或不活化。如果旁系同源物和/或非直系同源基因替换存在于参考微生物中且编码催化相似或实质上相似的代谢反应的酶，那么所属领域技术人员还可利用所述在进化上相关的基因。相似地，对于基因破坏来说，在进化上相关的基因还可在宿主微生物中受到破坏或缺失以降低或消除靶向破坏的酶促活性的功能冗余。

直系同源物、旁系同源物和非直系同源基因替换可通过所属领域技术人员所熟知的方法测定。例如，对核酸序列或两条多肽的氨基酸序列的检查可揭示比较序列之间的序列一致性和相似性。基于所述相似性，所属领域技术人员可测定相似性是否高到足以指示蛋白质因从共同祖先进化而相关。所属领域技术人员所熟知的算法(例如Align、BLAST、Clustal W和其它算法)比较并测定原始序列相似性或一致性，并且还测定序列中可指配权重或评分的空位的存在或显着性。所述算法也为相关技艺已知且同样可适用于测定核苷酸序列相似性或一致性。确定相关性的足够相似性的参数是基于计算统计学相似性(或在随机多肽中找到相似匹配的机率)和所测定匹配的显着性的熟知方法来计算。如果需要，所属领域技术人员还可对两个或更多个序列的计算机比较进行视觉优化。可预计，相关基因产物或蛋白质具有高度相似性，例如，25％到100％序列一致性。如果扫描足够大小的数据库，那么无关蛋白质的一致性可基本上等同于预计为偶然发生的机率(约5％)。介于5％与24％之间的序列可代表或可不代表足以断定所比较序列相关的同源性。考虑到数据集大小，可进行用以测定所述匹配的显着性的其它统计学分析来确定所述序列的相关性。

用于使用(例如)BLAST算法测定两个或更多个序列的相关性的实例性参数可如下文所述。简单来说，氨基酸序列比对可使用BLASTP 2.0.8版(1999年1月5日)和以下参数来进行：矩阵：0BLOSUM62；空位开放：11；空位延伸：1；x降低：50；预期：10.0；字长：3；过滤器：开。核酸序列比对可使用BLASTN 2.0.6版(1998年9月16日)和以下参数来进行：匹配：1；错配：-2；空位开放：5；空位延伸：2；x_降低：50；预期：10.0；字长：11；过滤器：关。所属领域技术人员应了解，可对上述参数进行修改以例如增加或降低比较严格性，并测定两个或更多个序列的相关性。

特定序列的“保守氨基酸取代”或简单地“保守变异”是指用基本上一致的氨基酸序列置换一个氨基酸或一系列氨基酸。所属领域技术人员应认识到，改变、添加或缺失所编码序列中的单一氨基酸或一定百分比氨基酸的个别取代、缺失或添加导致“保守变异”，其中所述改变导致氨基酸缺失、氨基酸添加或氨基酸经功能相似氨基酸取代。所属领域技术人员还应认识到，本文所揭示指特定变体的个别取代、缺失或添加(例如甘氨酸残基34经组氨酸取代(G34H))可包括在与本文所揭示相同的残基处进行的保守取代，例如代替组氨酸在残基34处被取代，可取代精氨酸(R)或赖氨酸(K)。

提供功能相似氨基酸的保守取代表为相关技艺所熟知。保守氨基酸取代包括一个氨基酸经具有相同类型的功能基团或侧链极性、大小、形状或电荷的另一氨基酸(例如，脂肪族、芳香族、带正电、带负电、极性、非极性、正极性、负极性、不带电极性、非极性疏水性、可电离酸性、可电离碱性或含有硫残基)置换。

作为非限制性实例，以下6个群组各自含有可为彼此的保守取代的氨基酸：

1)丙氨酸(A)、丝氨酸(S)、苏氨酸(T)；

2)天冬氨酸(D)、谷氨酸(E)；

3)天冬酰胺(N)、谷氨酰胺(Q)；

4)精氨酸(R)、赖氨酸(K)、组氨酸(H)；

5)异亮氨酸(I)、亮氨酸(L)、甲硫氨酸(M)、缬氨酸(V)；和

6)苯丙氨酸(F)、酪氨酸(Y)、色氨酸(W)。

因此，本文所揭示多肽序列的保守氨基酸取代可包括诸如小于1％、5％或10％等百分比的多肽序列氨基酸经相同保守取代基团的经保守选择的氨基酸的取代。另外，本文所揭示多肽序列的保守取代变异可含有经相同保守取代基团的保守取代变异的不超过1个、2个、3个、4个、5个、10个、20个、30个、50个或100个取代。

还应理解，不改变核酸分子的所编码多肽活性的核酸序列的添加或取代(例如非功能或非编码序列的添加)是核酸序列的保守变异。所属领域技术人员应了解，所揭示核酸分子的许多保守变异产生功能相同的多肽。例如，由于遗传密码的简并性，因此沉默取代(即，核酸序列中不会导致所编码多肽改变的取代)是编码氨基酸的每一核酸序列的隐含特征。相似地，氨基酸序列中一或多个氨基酸的保守氨基酸取代可经具有高度相似性质的不同氨基酸取代，还可容易地鉴别为与所揭示构筑体高度相似。各所揭示序列的所述保守变异是本文所揭示多肽的特征。

特定多肽的非保守修饰是那些取代未表征为保守取代的任一氨基酸者。例如，超出上文所述6个群组的界限的任一取代。所述包括碱性或酸性氨基酸取代为中性氨基酸(例如，天冬氨酸(D)、谷氨酸(E)、天冬酰胺(N)或谷氨酰胺(Q)取代为缬氨酸(V)、异亮氨酸(I)、亮氨酸(L)或甲硫氨酸(M))、芳香族氨基酸取代为碱性或酸性氨基酸(例如，苯丙氨酸(F)、酪氨酸(Y)或色氨酸(W)取代为天冬氨酸(D)、天冬酰胺(N)、谷氨酸(E)或谷氨酰胺(Q))或不用类似氨基酸置换氨基酸的任一其它取代。

本文揭示非天然微生物生物催化剂或微生物，包括具有4-羟基丁酸(4-HB)生物合成途径的微生物，所述途径包括至少一种编码以下酶的外源性核酸：4-羟基丁酸脱氢酶、非CoA依赖性琥珀酸半醛脱氢酶，琥珀酰基-CoA合成酶、CoA依赖性琥珀酸半醛脱氢酶、谷氨酸酯：琥珀酸半醛转氨酶、α-酮戊二酸脱羧酶或谷氨酸脱羧酶，其中所述外源性核酸是以足以产生单体4-羟基丁酸(4-HB)的量来表达。4-羟基丁酸脱氢酶还称作4-羟基丁酸脱氢酶或4-HB脱氢酶。琥珀酰基-CoA合成酶还称作琥珀酰基-CoA合成酶或琥珀酰基-CoA连接酶。

本文还揭示非天然微生物生物催化剂或微生物，包括具有4-羟基丁酸(4-HB)生物合成途径的微生物，所述途径具有至少一种编码以下酶的外源性核酸：4-羟基丁酸脱氢酶、琥珀酰基-CoA合成酶、CoA依赖性琥珀酸半醛脱氢酶或α-酮戊二酸脱羧酶，其中所述外源性核酸是以足以产生单体4-羟基丁酸(4-HB)的量来表达。

非天然微生物生物催化剂或微生物可包括采用代谢反应的组合生物合成产生本发明化合物的微生物。生物合成化合物可在细胞内产生和/或分泌到培养基中。由非天然微生物产生的实例性化合物包括(例如)4-羟基丁酸、1，4-丁二醇和γ-丁内酯。

在一个实施例中，非天然微生物经改造以产生4-HB。这种化合物是进入1，4-丁二醇化合物家族的可用进入点者。用于从琥珀酸酯、从琥珀酸酯经由琥珀酰基-CoA或从α-酮戊二酸酯形成4-HB的生物化学反应示于图1的步骤1-8中。

应理解，可使用BDO、4-HB、4-HBal、4-HBCoA和/或腐胺途径的合适酶的任一组合，只要实现从起始组分转变为BDO、4-HBal、4-HBCoA和/或腐胺产物即可。因此，应理解，可利用本文所揭示任一代谢途径，并且所属领域技术人员应非常理解，如何选择合适酶来实现所需途径，如本文所揭示。

在另一实施例中，本文揭示非天然微生物，包含具有1，4-丁二醇(BDO)途径的微生物，所述途径包含至少一种编码BDO途径酶的外源性核酸，所述外源性核酸以足以产生BDO的量来表达，所述BDO途径包含4-氨基丁酸CoA转移酶、4-氨基丁酰基-CoA水解酶、4-氨基丁酸酯-CoA连接酶、4-氨基丁酰基-CoA氧化还原酶(脱氨)、4-氨基丁酰基-CoA转氨酶或4-羟基丁酰基-CoA脱氢酶(参见实例VII表17)。BDO途径可进一步包含4-羟基丁酰基-CoA还原酶(形成醇)、4-羟基丁酰基-CoA还原酶或1，4-丁二醇脱氢酶。

所属领域技术人员应理解，可利用所述途径的各种组合，如本文所揭示。例如，在非天然微生物中，所述核酸可编码4-氨基丁酸CoA转移酶、4-氨基丁酰基-CoA水解酶或4-氨基丁酸酯-CoA连接酶；4-氨基丁酰基-CoA氧化还原酶(脱氨)或4-氨基丁酰基-CoA转氨酶；和4-羟基丁酰基-CoA脱氢酶。其它实例性组合具体描述于下文中且进一步可参见图8-13。例如，BDO途径可进一步包含4-羟基丁酰基-CoA还原酶(形成醇)、4-羟基丁酰基-CoA还原酶或1，4-丁二醇脱氢酶。

本文另外揭示非天然微生物，包含具有BDO途径的微生物，所述BDO途径包含至少一种编码BDO途径酶的外源性核酸，所述外源性核酸以足以产生BDO的量来表达，所述BDO途径包含4-氨基丁酸CoA转移酶、4-氨基丁酰基-CoA水解酶、4-氨基丁酸酯-CoA连接酶、4-氨基丁酰基-CoA还原酶(形成醇)、4-氨基丁酰基-CoA还原酶、4-氨基丁-1-醇脱氢酶、4-氨基丁-1-醇氧化还原酶(脱氨)或4-氨基丁-1-醇转氨酶(参见实例VII和表18)，并且可进一步包含1，4-丁二醇脱氢酶。例如，外源性核酸可编码4-氨基丁酸CoA转移酶、4-氨基丁酰基-CoA水解酶或4-氨基丁酸酯-CoA连接酶；4-氨基丁酰基-CoA还原酶(形成醇)；和4-氨基丁-1-醇氧化还原酶(脱氨)或4-氨基丁-1-醇转氨酶。另外，所述核酸可编码4-氨基丁酸CoA转移酶、4-氨基丁酰基-CoA水解酶或4-氨基丁酸酯-CoA连接酶；4-氨基丁酰基-CoA还原酶；4-氨基丁-1-醇脱氢酶；和4-氨基丁-1-醇氧化还原酶(脱氨)或4-氨基丁-1-醇转氨酶。

本文还揭示非天然微生物，包含具有BDO途径的微生物，所述BDO途径包含至少一种编码BDO途径酶的外源性核酸，所述外源性核酸以足以产生BDO的量来表达，所述BDO途径包含4-氨基丁酸激酶、4-氨基丁醛脱氢酶(磷酸化)、4-氨基丁-1-醇脱氢酶、4-氨基丁-1-醇氧化还原酶(脱氨)、4-氨基丁-1-醇转氨酶、[(4-氨基丁酰基)氧基]膦酸氧化还原酶(脱氨)、[(4-氨基丁酰基)氧基]膦酸转氨酶、4-羟基丁酰基-磷酸酯脱氢酶或4-羟基丁醛脱氢酶(磷酸化)(参见实例VII和表19)。例如，外源性核酸可编码4-氨基丁酸激酶；4-氨基丁醛脱氢酶(磷酸化)；4-氨基丁-1-醇脱氢酶；和4-氨基丁-1-醇氧化还原酶(脱氨)或4-氨基丁-1-醇转氨酶。或者，外源性核酸可编码4-氨基丁酸激酶；[(4-氨基丁酰基)氧基]膦酸氧化还原酶(脱氨)或[(4-氨基丁酰基)氧基]膦酸转氨酶；4-羟基丁酰基-磷酸酯脱氢酶；和4-羟基丁醛脱氢酶(磷酸化)。

本文另外揭示非天然微生物，包含具有BDO途径的微生物，所述BDO途径包含至少一种编码BDO途径酶的外源性核酸，所述外源性核酸以足以产生BDO的量来表达，所述BDO途径包含α-酮戊二酸酯5-激酶、2，5-二氧代戊酸半醛脱氢酶(磷酸化)、2，5-二氧代戊酸还原酶、α-酮戊二酸CoA转移酶、α-酮戊二酰基-CoA水解酶、α-酮戊二酰基-CoA连接酶、α-酮戊二酰基-CoA还原酶、5-羟基-2-氧代戊酸脱氢酶、α-酮戊二酰基-CoA还原酶(形成醇)、5-羟基-2-氧代戊酸脱羧酶或5-羟基-2-氧代戊酸脱氢酶(脱羧)(参见实例VIII和表20)。BDO途径可进一步包含4-羟基丁酰基-CoA还原酶(形成醇)、4-羟基丁酰基-CoA还原酶或1，4-丁二醇脱氢酶。例如，外源性核酸可编码α-酮戊二酸酯5-激酶；2，5-二氧代戊酸半醛脱氢酶(磷酸化)；2，5-二氧代戊酸还原酶；和5-羟基-2-氧代戊酸脱羧酶。或者，外源性核酸可编码α-酮戊二酸酯5-激酶；2，5-二氧代戊酸半醛脱氢酶(磷酸化)；2，5-二氧代戊酸还原酶；和5-羟基-2-氧代戊酸脱氢酶(脱羧)。或者，外源性核酸可编码α-酮戊二酸CoA转移酶、α-酮戊二酰基-CoA水解酶或α-酮戊二酰基-CoA连接酶；α-酮戊二酰基-CoA还原酶、5-羟基-2-氧代戊酸脱氢酶；和5-羟基-2-氧代戊酸脱羧酶。在另一实施例中，外源性核酸可编码α-酮戊二酸CoA转移酶、α-酮戊二酰基-CoA水解酶或α-酮戊二酰基-CoA连接酶；α-酮戊二酰基-CoA还原酶、5-羟基-2-氧代戊酸脱氢酶和5-羟基-2-氧代戊酸脱氢酶(脱羧)。或者，外源性核酸可编码α-酮戊二酸CoA转移酶、α-酮戊二酰基-CoA水解酶或α-酮戊二酰基-CoA连接酶；α-酮戊二酰基-CoA还原酶(形成醇)；和5-羟基-2-氧代戊酸脱羧酶。在另一实施例中，外源性核酸可编码α-酮戊二酸CoA转移酶、α-酮戊二酰基-CoA水解酶或α-酮戊二酰基-CoA连接酶；α-酮戊二酰基-CoA还原酶(形成醇)；和5-羟基-2-氧代戊酸脱氢酶(脱羧)。

本文进一步揭示非天然微生物，包含具有BDO途径的微生物，所述BDO途径包含至少一种编码BDO途径酶的外源性核酸，所述外源性核酸以足以产生BDO的量来表达，所述BDO途径包含谷氨酸CoA转移酶、谷氨酰基-CoA水解酶、谷氨酰基-CoA连接酶、谷氨酸酯5-激酶、谷氨酸酯-5-半醛脱氢酶(磷酸化)、谷氨酰基-CoA还原酶、谷氨酸酯-5-半醛还原酶、谷氨酰基-CoA还原酶(形成醇)、2-氨基-5-羟基戊酸氧化还原酶(脱氨)、2-氨基-5-羟基戊酸转氨酶、5-羟基-2-氧代戊酸脱羧酶、5-羟基-2-氧代戊酸脱氢酶(脱羧)(参见实例IX和表21)。例如，外源性核酸可编码谷氨酸CoA转移酶、谷氨酰基-CoA水解酶或谷氨酰基-CoA连接酶；谷氨酰基-CoA还原酶；谷氨酸酯-5-半醛还原酶；2-氨基-5-羟基戊酸氧化还原酶(脱氨)或2-氨基-5-羟基戊酸转氨酶；和5-羟基-2-氧代戊酸脱羧酶或5-羟基-2-氧代戊酸脱氢酶(脱羧)。或者，外源性核酸可编码谷氨酸酯5-激酶；谷氨酸酯-5-半醛脱氢酶(磷酸化)；谷氨酸酯-5-半醛还原酶；2-氨基-5-羟基戊酸氧化还原酶(脱氨)或2-氨基-5-羟基戊酸转氨酶；和5-羟基-2-氧代戊酸脱羧酶或5-羟基-2-氧代戊酸脱氢酶(脱羧)。在又一实施例中，外源性核酸可编码谷氨酸CoA转移酶、谷氨酰基-CoA水解酶或谷氨酰基-CoA连接酶；谷氨酰基-CoA还原酶(形成醇)；2-氨基-5-羟基戊酸氧化还原酶(脱氨)或2-氨基-5-羟基戊酸转氨酶；和5-羟基-2-氧代戊酸脱羧酶或5-羟基-2-氧代戊酸脱氢酶(脱羧)。在另一实施例中，外源性核酸可编码谷氨酸酯5-激酶；谷氨酸酯-5-半醛脱氢酶(磷酸化)；2-氨基-5-羟基戊酸氧化还原酶(脱氨)或2-氨基-5-羟基戊酸转氨酶；和5-羟基-2-氧代戊酸脱羧酶或5-羟基-2-氧代戊酸脱氢酶(脱羧)。

本文还揭示非天然微生物，包含具有BDO途径的微生物，所述BDO途径包含至少一种编码BDO途径酶的外源性核酸，所述外源性核酸以足以产生BDO的量来表达，所述BDO途径包含3-羟基丁酰基-CoA脱氢酶、3-羟基丁酰基-CoA脱水酶、乙烯基乙酰基-CoAΔ-异构酶或4-羟基丁酰基-CoA脱水酶(参见实例X和表22)。例如，外源性核酸可编码3-羟基丁酰基-CoA脱氢酶；3-羟基丁酰基-CoA脱水酶；乙烯基乙酰基-CoAΔ-异构酶；和4-羟基丁酰基-CoA脱水酶。

本文进一步揭示非天然微生物，包含具有BDO途径的微生物，所述BDO途径包含至少一种编码BDO途径酶的外源性核酸，所述外源性核酸以足以产生BDO的量来表达，所述BDO途径包含高丝氨酸脱氨酶、高丝氨酸CoA转移酶、高丝氨酸-CoA水解酶、高丝氨酸-CoA连接酶、高丝氨酸-CoA脱氨酶、4-羟基丁-2-烯酰基-CoA转移酶、4-羟基丁-2-烯酰基-CoA水解酶、4-羟基丁-2-烯酰基-CoA连接酶、4-羟基丁-2-烯酸酯还原酶、4-羟基丁酰基-CoA转移酶、4-羟基丁酰基-CoA水解酶、4-羟基丁酰基-CoA连接酶或4-羟基丁-2-烯酰基-CoA还原酶(参见实例XI和表23)。例如，外源性核酸可编码高丝氨酸脱氨酶；4-羟基丁-2-烯酰基-CoA转移酶、4-羟基丁-2-烯酰基-CoA水解酶、4-羟基丁-2-烯酰基-CoA连接酶；4-羟基丁-2-烯酰基-CoA还原酶。或者，外源性核酸可编码高丝氨酸CoA转移酶、高丝氨酸-CoA水解酶或高丝氨酸-CoA连接酶；高丝氨酸-CoA脱氨酶；和4-羟基丁-2-烯酰基-CoA还原酶。在又一实施例中，外源性核酸可编码高丝氨酸脱氨酶；4-羟基丁-2-烯酸酯还原酶；和4-羟基丁酰基-CoA转移酶、4-羟基丁酰基-CoA水解酶或4-羟基丁酰基-CoA连接酶。或者，外源性核酸可编码高丝氨酸CoA转移酶、高丝氨酸-CoA水解酶或高丝氨酸-CoA连接酶；高丝氨酸-CoA脱氨酶；和4-羟基丁-2-烯酰基-CoA还原酶。

本文进一步揭示非天然微生物，包含具有BDO途径的微生物，所述BDO途径包含至少一种编码BDO途径酶的外源性核酸，所述外源性核酸以足以产生BOD的量来表达，所述BDO途径包含琥珀酰基-CoA还原酶(形成醇)、4-羟基丁酰基-CoA水解酶、4-羟基丁酰基-CoA连接酶、4-羟基丁醛脱氢酶(磷酸化)(参见表15)。所述途径可进一步包含琥珀酰基-CoA还原酶、4-羟基丁酸脱氢酶、4-羟基丁酰基-CoA转移酶、4-羟基丁酸激酶、磷酸转-4-羟基丁酰基酶、4-羟基丁酰基-CoA还原酶、4-羟基丁酰基-CoA还原酶(形成醇)或1，4-丁二醇脱氢酶。

本文另外揭示非天然微生物，包含具有BDO途径的微生物，所述BDO途径包含至少一种编码BDO途径酶的外源性核酸，所述外源性核酸以足以产生BDO的量来表达，所述BDO途径包含谷氨酸脱氢酶、4-氨基丁酸酯氧化还原酶(脱氨)、4-氨基丁酸转氨酶、谷氨酸脱羧酶、4-羟基丁酰基-CoA水解酶、4-羟基丁酰基-CoA连接酶、4-羟基丁醛脱氢酶(磷酸化)(参见表16)。所述BDO途径可进一步包含α-酮戊二酸脱羧酶、4-羟基丁酸脱氢酶、4-羟基丁酰基-CoA转移酶、4-羟基丁酸激酶、磷酸转-4-羟基丁酰基酶、4-羟基丁酰基-CoA还原酶、4-羟基丁酰基-CoA还原酶(形成醇)或1，4-丁二醇脱氢酶。

上述途径仅具有实例性。所属领域技术人员可视需要容易地从那些本文所揭示的途径选择合适途径来获得适宜BDO途径或其它代谢途径。

本发明提供经遗传修饰的生物体，其通过增加产物或减少不需要的副产物来允许诸如BDO等所需产物的改良产生。如本文所揭示，本发明提供非天然微生物，包含具有1，4-丁二醇(BDO)途径的微生物，所述途径包含至少一种编码BDO途径酶的外源性核酸，所述外源性核酸以足以产生BDO的量来表达。在一个实施例中，微生物经遗传修饰以表达外源性琥珀酰基-CoA合成酶(参见实例XII)。例如，琥珀酰基-CoA合成酶可由大肠杆菌sucCD基因编码。

在另一实施例中，微生物经遗传修饰以表达外源性α-酮戊二酸脱羧酶(参见实例XIII)。例如，α-酮戊二酸脱羧酶可由牛分枝杆菌sucA基因编码。在又一实施例中，微生物经遗传修饰以表达外源性琥珀酸半醛脱氢酶和4-羟基丁酸脱氢酶和任选地4-羟基丁酰基-CoA/乙酰基-CoA转移酶(参见实例XIII)。例如，琥珀酸半醛脱氢酶(CoA依赖性)、4-羟基丁酸脱氢酶和4-羟基丁酰基-CoA/乙酰基-CoA转移酶可由牙龈卟啉单胞菌W83基因编码。在另一实施例中，微生物经遗传修饰以表达外源性丁酸激酶和磷酸转丁酰基酶(参见实例XIII)。例如，丁酸激酶和磷酸转丁酰基酶可由丙酮丁醇梭菌buk1和ptb基因编码。

在另一实施例中，微生物经遗传修饰以表达外源性4-羟基丁酰基-CoA还原酶(参见实例XIII)。例如，4-羟基丁酰基-CoA还原酶可由拜氏梭菌ald基因编码。另外，在本发明实施例中，微生物经遗传修饰以表达外源性4-羟基丁醛还原酶(参见实例XIII)。例如，4-羟基丁醛还原酶可由热葡糖苷酶地芽孢杆菌adh1基因编码。在另一实施例中，微生物经遗传修饰以表达外源性丙酮酸脱氢酶亚单元(参见实例XIV)。例如，外源性丙酮酸脱氢酶可对NADH不敏感。丙酮酸脱氢酶亚单元可由肺炎克雷伯氏菌lpdA基因编码。在一特定实施例中，微生物的丙酮酸脱氢酶亚单元基因可在丙酮酸甲酸裂解酶启动子的控制下。

在又一实施例中，微生物经遗传修饰以破坏编码好氧性呼吸控制调节系统的基因(参见实例XV)。例如，破坏可针对arcA基因。所述生物体可进一步包含破坏编码苹果酸脱氢酶的基因。在又一实施例中，微生物经遗传修饰以表达对NADH不敏感的外源性柠檬酸合成酶(参见实例XV)。例如，对NADH不敏感的柠檬酸合成酶可由gltA(例如gltA的R163L突变体)编码。在又一实施例中，微生物经遗传修饰以表达外源性磷酸烯醇丙酮酸酯羧基激酶(参见实例XVI)。例如，磷酸烯醇丙酮酸酯羧基激酶可由流感嗜血杆菌磷酸烯醇丙酮酸酯羧基激酶基因编码。

在另一实施例中，本发明提供具有4-羟基丁酸酯途径且能够产生4-羟基丁酸酯的非天然微生物，其中所述微生物包含增加磷酸烯醇丙酮酸羧化酶表达的遗传修饰(参见实例XXXI)。在增加磷酸烯醇丙酮酸酯表达的实施例中，微生物可相对于不存在遗传修饰的亲本微生物展现乙醇、乙酸酯、丙酮酸酯或丙氨酸或其组合的产生减少。如本文所揭示，磷酸烯醇丙酮酸酯(PEP)羧化酶的过表达导致较多磷酸烯醇丙酮酸酯转变为草酰乙酸酯，由此减少从PEP到丙酮酸酯中且随后到乙酰基-CoA中的通量(实例XXXI)。减少从PEP到丙酮酸酯和乙酰基-CoA的通量增加到TCA循环和随后4HB或BDO途径中的通量。

在另一实施例中，本发明提供具有4-羟基丁酸酯途径且能够产生4-羟基丁酸酯的非天然微生物，其中所述微生物包含增加α-酮戊二酸脱氢酶表达的遗传修饰(参见实例XXXII)。相对于不存在遗传修饰的亲本微生物，α-酮戊二酸脱氢酶的表达增加可导致谷氨酸酯的产生减少。所述微生物相对于不存在遗传修饰的亲本微生物还可展现乙醇、乙酸酯、丙酮酸酯或丙氨酸或其组合的产生减少。如本文所揭示，谷氨酸酯的形成可导致碳损失和产率降低。因此，α-酮戊二酸脱氢酶的表达增加可减少谷氨酸酯以及其它副产物，例如乙醇、乙酸酯、丙氨酸和/或丙酮酸酯。

在又一实施例中，本发明提供具有4-羟基丁酸酯途径且能够产生4-羟基丁酸酯的非天然微生物，其中所述微生物包含增加非磷酸转移酶(PTS)葡萄糖吸收系统表达的遗传修饰(参见实例XXXIII)。在所述实施例中，遗传修饰可包含增加通透酶、葡萄糖激酶或葡萄糖促进剂(glucose facilitator)或其组合的表达。另外，所述微生物相对于不存在遗传修饰的亲本微生物可展现乙醇、乙酸酯、丙酮酸酯或丙氨酸或其组合的产生减少。非PTS蔗糖吸收系统的引入先前已描述于美国公开案2011/0045575中，其作为一种方式用以在利用蔗糖作为碳源的微生物中减少丙酮酸酯形成。相比之下，利用如本文所述非PTS葡萄糖吸收系统旨在于可用草酰乙酸酯之间提供相较于乙酰基-CoA更优选的平衡(参见实例XXXIII)。

在另一实施例中，本发明提供具有4-羟基丁酸酯途径且能够产生4-羟基丁酸酯的非天然微生物，其中所述微生物包含增加γ-丁内酯酯酶表达的遗传修饰(实例XXXIV)。所述微生物相对于不存在遗传修饰的亲本微生物可展现γ-丁内酯的产生减少。如本文所揭示，γ-丁内酯是在糖到1，4-丁二醇发酵期间形成的副产物。γ-丁内酯可从不稳定途径中间体4-羟基丁酰基-CoA以及4-羟基丁酸酯的自发内酯化形成。如本文所揭示，γ-丁内酯的表达可加速γ-丁内酯水解成BDO，由此改良BDO产物产率并消除副产物(参见实例XXXIV)。

在本文所揭示的其它实施例中，遗传修饰可包括基因破坏或缺失以减少酶的表达。例如，在又一实施例中，本发明提供具有4-羟基丁酸酯途径且能够产生4-羟基丁酸酯的非天然微生物，其中所述微生物包含减少琥珀酰基-CoA合成酶表达的遗传修饰(实例XXXV)。在所述实施例中，微生物相对于不存在遗传修饰的亲本微生物可展现4-羟基丁酸酯的产生增加。如本文所述，经过TCA循环的重复轮通量导致碳作为CO₂损失。琥珀酰基-CoA合成酶缺失阻断琥珀酰基-CoA下游的TCA循环，由此减少CO₂损失(参见实例XXXV)。

在又一实施例中，本发明提供具有4-羟基丁酸酯途径且能够产生4-羟基丁酸酯的非天然微生物，其中所述微生物包含降低酰基辅酶A硫酯酶表达的遗传修饰(参见实例XXXVI)。在所述实施例中，微生物相对于不存在遗传修饰的亲本微生物可展现γ-丁内酯的产生减少。在另一实施例中，所述微生物可包含至少两种降低至少两种酰基辅酶A硫酯酶表达的遗传修饰。如本文所揭示，BDO途径中间体4-羟基丁酰基-CoA自发地且以酶促方式环化以形成γ-丁内酯(GBL)。通过缺失酰基辅酶-A硫酯酶，减少副产物GBL的形成(参见实例XXXVI)。

在另一实施例中，本发明提供具有4-羟基丁酸酯途径且能够产生4-羟基丁酸酯的非天然微生物，其中所述微生物包含降低醇脱氢酶表达的遗传修饰(参见实例XXXVII)。在所述实施例中，微生物相对于不存在所述遗传修饰的亲本微生物可展现来自4-羟基丁酸酯途径的下游产物的回流减少。在高效价BDO(来自4-羟基丁酸酯的下游产物)下，高浓度产物可导致途径内或经由副反应的回流，由此导致产物产率降低和/或诸如醛等毒性副产物形成增加。如本文所述，发现若干内源性醇脱氢酶促成回流，而缺失一或多种内源性醇脱氢酶减少回流，但不会减少4-羟基丁酸酯或BDO的产生，并且实际上增加BDO形成(参见实例XXXVII)。

在又一实施例中，本发明提供具有4-羟基丁酸酯途径且能够产生4-羟基丁酸酯的非天然微生物，其中所述微生物包含降低非产能NADH脱氢酶表达的遗传修饰(参见实例XXXVIII)。非产能NADH脱氢酶的表达降低抑制由非产能NADH脱氢酶的活性所致NADH库的消耗。另外，微生物相对于不存在遗传修饰的亲本微生物展现微生物的能量效率增加。如本文所述，电子传递链具有将质子转位的能力不同的多种NADH脱氢酶和细胞色素氧化酶。一些NADH脱氢酶消耗NADH而不将所述消耗与质子转位和能量产生关联，并且将所述NADH脱氢酶视为非产能NADH脱氢酶。一个实例性非产能NADH脱氢酶是大肠杆菌的NADH II(参见实例XXXVIII)。编码具有非产能NAD(P)H脱氢酶活性的酶的其它基因包括wrbA、yieF和kefF。所属领域技术人员将容易地理解，非产能NADH脱氢酶的含义为不将NADH氧化与电子传递和质子转位以及ATP形成偶合者。通过降低非产能NADH脱氢酶的表达，抑制细胞内NADH库的消耗，由此使细胞更能量有效和/或允许NADH以所需合成途径利用。

在又一实施例中，本发明提供具有4-羟基丁酸酯途径且能够产生4-羟基丁酸酯的非天然微生物，其中所述微生物包含降低细胞色素氧化酶表达的遗传修饰(参见实例XXXIX)。在所述实施例中，微生物相对于不存在遗传修饰的亲本微生物可展现能量效率增加。如本文所揭示，参与电子传递链的细胞色素氧化酶具有不同的节能效率。通过降低一或多种细胞色素氧化酶的表达，可增加细胞的能量效率(参见实例XXXIX)。即使在某些条件下未观察到产物产率增加的情况下(参见实例XXXIX)，所述遗传修饰仍可有利地提供对一系列氧浓度范围的较大耐受性，特定来说在大型发酵器中更有效地产生产物，其中所述发酵器内的可用氧有所变化。通过改良微生物的能量效率，生物体可耐受较低氧条件，这是因为降低对来自电子传递链的能量产生的需要。因此，在本发明的特定实施例中，微生物相对于不存在所述遗传修饰的亲本微生物可展现对一系列氧浓度范围的耐受性增加。

因此，本发明提供具有4-羟基丁酸酯途径且能够产生4-羟基丁酸酯的非天然微生物，其中所述微生物包含遗传修饰，所述遗传修饰选自：(A)增加磷酸烯醇丙酮酸羧化酶表达的遗传修饰；(B)增加α-酮戊二酸脱氢酶表达的遗传修饰；(C)增加非磷酸转移酶(PTS)葡萄糖吸收系统表达的遗传修饰；(D)增加γ-丁内酯酯酶表达的遗传修饰；(E)降低琥珀酰基-CoA合成酶表达的遗传修饰；(F)降低酰基辅酶A硫酯酶表达的遗传修饰；(G)降低醇脱氢酶表达的遗传修饰；(H)降低非产能NADH脱氢酶表达的遗传修饰；(I)降低细胞色素氧化酶表达的遗传修饰；和(J)以下的组合：(A)-(I)项的遗传修饰中的两种或更多种，例如，三种或更多种、四种或更多种、五种或更多种、六种或更多种、七种或更多种、八种或更多种或全部九种。在其它特定实施例中，(K)(A)、(B)或(C)项的微生物相对于不存在所述遗传修饰的亲本微生物，乙醇、乙酸酯、丙酮酸酯或丙氨酸或其组合的产生减少；(L)(B)项的微生物相对于不存在所述遗传修饰的亲本微生物，谷氨酸酯的产生减少；(M)(C)项的微生物具有包含通透酶、葡萄糖激酶或葡萄糖促进剂或其组合的表达增加的遗传修饰；(N)(D)项的微生物相对于不存在所述遗传修饰的亲本微生物，γ-丁内酯的产生减少；(O)(E)项的微生物相对于不存在所述遗传修饰的亲本微生物，4-羟基丁酸酯的产生增加；(P)(F)项的微生物相对于不存在所述遗传修饰的亲本微生物，γ-丁内酯的产生减少；(Q)(F)项的微生物具有包含至少两种降低至少两种酰基辅酶A硫酯酶表达的遗传修饰的遗传修饰；(R)(G)项的微生物相对于不存在所述遗传修饰的亲本微生物，从4-羟基丁酸酯途径的下游产物的回流减少；(S)(H)项的微生物相对于不存在所述遗传修饰的亲本微生物，NADH库消耗受到抑制或微生物中的能量效率增加或其组合；(T)(I)项的微生物相对于不存在所述遗传修饰的亲本微生物，能量效率增加；或(U)(I)项的微生物相对于不存在所述遗传修饰的亲本微生物，一系列氧浓度范围的耐受性增加。在又一实施例中，本发明提供微生物，其中(D)或(F)项的微生物进一步包含4-羟基丁酰基-CoA途径。本发明进一步提供利用所述微生物产生4-羟基丁酸酯的方法。应理解，所述遗传修饰包括(但不限于)实例XXIV-XXXIX中所述的具体描述的基因添加和破坏。应理解，本文所述遗传修饰可视需要单独使用或与其它遗传修饰、尤其那些本文所揭示者组合使用，以提供产生菌株的所需特性。在基因破坏的情况下，应理解，所述破坏涉及破坏编码要降低活性的相应基因产物的内源性基因。

尽管上文刚刚描述的途径涉及4-HB途径，但应理解，如本文所揭示，4-HB是诸如1，4-丁二醇(BDO)等下游产物的前体。此外，如本文所揭示，具有4-HB途径的微生物可视需要进一步包括将4-HB转变为诸如BDO等下游产物的酶。另外，即使还揭示途径中的其它步骤，本文所述产生4-HB的任一途径仍应理解为提供4-HB途径，这是因为所述途径产生4-HB。因此，本发明提供包含4-HB途径或BDO途径的微生物以及使用所述生物体产生4-HB和/或BDO的方法，其中所述生物体包含本文所揭示的一或多种遗传修饰且产生4-HB、4-HB-CoA或BDO。应进一步理解，遗传修饰可单独使用或与一或多种遗传修饰进行各种组合使用，如本文所揭示(参见实例)。另外，应理解，遗传修饰可产生所需效应，包括(但不限于)增加产物产率、减少副产物、尤其毒性或生长抑制性副产物(例如，醛)产生、改良菌株培养物生长或发酵特性、改良分离或纯化所需产物的能力等等。此外，应理解，下游产物(例如，BDO)的产生增加可指示上游产物(例如，途径中间体，例如4HB)的产生增加，其中下游产物的产生增加指示经过上游产物的通量增加。所属领域技术人员可容易地理解，本发明微生物用于产生所需途径产物或中间体的所述或其它所需特性。因此，使用本文所揭示方法和那些为相关技艺所熟知者，所属领域技术人员可纳入各种代谢修饰，纳入合适表达控制组件和/或方法和/或变体酶来提供具有优化产生性质的微生物。应进一步理解，所述优化产生性质可由所属领域技术人员容易地测定，包括增加或降低特定分子的表达水平，包括4-HB、4-HBal、4-HBCoA、BDO或腐胺途径的代谢修饰和/或酶或蛋白质。

本文所用术语“亲本微生物”当用于遗传修饰的情况下时，应理解为意指未进行特定遗传修饰但以其它方式具有相同遗传组成的亲本生物体或菌株。例如，如果使用微生物菌株来实现增加基因产物表达的遗传修饰，那么亲本菌株将为其中引入异源基因的起始菌株。相似地，已进行遗传修饰(例如基因破坏或基因缺失)以降低表达的生物体的亲本微生物，亲本微生物将具有除基因破坏或缺失外相同的遗传背景。然而，应理解，亲本微生物可相差一种以上遗传修饰(基因添加和/或破坏)，此取决于考虑单一抑或多种遗传修饰。所属领域技术人员应容易地理解所述亲本微生物的含义，这是因为将所述微生物视为用于观察一或多种遗传修饰的效应的合适对照，如相关技艺所理解。

另外，所属领域技术人员应理解，遗传修饰(例如那些本文所揭示者)可增加产物产率，减少副产物形成和/或改良微生物的特性。所述改良特性包括(但不限于)改良细胞生长、增加能量效率、增加对一系列氧浓度范围的耐受性，尤其在按比例放大的生产工艺中(例如在大型发酵器中)显示时。当与亲本微生物比较时，可用遗传修饰可并不仅仅展现可容易地在给定组的条件下测量的效应。然而，如果可用遗传修饰本身在一组给定条件下和/或与一或多种其它遗传修饰组合时有益于微生物的生长和/或产生特性，那么所述修饰可能有利。

应理解，增加所需酶表达的遗传修饰通常通过将编码所需酶的异源核酸引入微生物中来进行。然而，应理解，如本文所述，增加表达的代谢修饰可包括修饰内源性基因的调节区，例如启动子和/或增强子。另外，降低所需酶表达的遗传修饰通常会涉及基因破坏或缺失，但还可利用对调节的修饰以降低表达，如本文所揭示。

应进一步理解，如本文所揭示诸多遗传修饰中的任一者可单独使用或与本文所揭示一或多种遗传修饰进行各种组合以增加产生BDO的微生物中BDO的产生。在一特定实施例中，微生物可经遗传修饰以纳入增加BDO产生的任何且最多所有遗传修饰。在一特定实施例中，含有BDO途径的微生物可经遗传修饰以表达外源性琥珀酰基-CoA合成酶；以表达外源性α-酮戊二酸脱羧酶；以表达外源性琥珀酸半醛脱氢酶和4-羟基丁酸脱氢酶且任选地4-羟基丁酰基-CoA/乙酰基-CoA转移酶；以表达外源性丁酸激酶和磷酸转丁酰基酶；以表达外源性4-羟基丁酰基-CoA还原酶；和以表达外源性4-羟基丁醛还原酶；以表达外源性丙酮酸脱氢酶；以破坏编码好氧性呼吸控制调节系统的基因；以表达对NADH不敏感的外源性柠檬酸合成酶；和表达外源性磷酸烯醇丙酮酸酯羧基激酶。所述用于改良产生的菌株描述于实例XII-XIX中。因此，应理解，除上述修饰以外，所述菌株另外可包括本文所揭示的其它修饰。所述修饰包括(但不限于)内源性乳酸脱氢酶(ldhA)、醇脱氢酶(adhE)和/或丙酮酸甲酸裂解酶(pflB)的缺失(参见实例XII-XIX和表28)。可引入微生物中的其它遗传修饰包括那些单独或组合(包括与本文所揭示其它遗传修饰组合)描述于实例XXIV-XXXIX中者。

本发明另外提供除上述(A)-(J)的一或多种代谢修饰以外还任选地进一步包含选自以下的代谢修饰的微生物：(i)增加丙酮酸脱氢酶表达的遗传修饰；(ii)降低好氧性呼吸控制调节系统表达的遗传修饰；(iii)增加对NADH不敏感的柠檬酸合成酶表达的遗传修饰；(iv)降低苹果酸脱氢酶表达的遗传修饰；(v)降低乳酸脱氢酶表达的遗传修饰；(vi)降低醇脱氢酶表达的遗传修饰；(vii)降低丙酮酸甲酸裂解酶表达的遗传修饰；和(viii)(i)-(vii)项的遗传修饰的两种或更多种、三种或更多种、四种或更多种、五种或更多种、六种或更多种或全部的组合。

本文描述代谢修饰的实例性组合。如本文所揭示，任一数目的代谢修饰组合都可包括在本发明微生物中。对于正下方的表62和63以及图91中列示的组合来说，使用以下字母表示法：(A)增加磷酸烯醇丙酮酸羧化酶表达的遗传修饰；(B)增加α-酮戊二酸脱氢酶表达的遗传修饰；(C)增加非磷酸转移酶(PTS)葡萄糖吸收系统表达的遗传修饰；(D)增加γ-丁内酯酯酶表达的遗传修饰；(E)降低琥珀酰基-CoA合成酶表达的遗传修饰；(F)降低酰基辅酶A硫酯酶表达的遗传修饰；(G)降低醇脱氢酶表达的遗传修饰(H)降低非产能NADH脱氢酶表达的遗传修饰；(I)降低细胞色素氧化酶表达的遗传修饰；(J)增加丙酮酸脱氢酶表达的遗传修饰；(K)降低好氧性呼吸控制调节系统表达的遗传修饰；(L)增加对NADH不敏感的柠檬酸合成酶表达的遗传修饰；(M)降低苹果酸脱氢酶表达的遗传修饰；(N)降低乳酸脱氢酶表达的遗传修饰；(O)降低醇脱氢酶表达的遗传修饰；和(P)降低丙酮酸甲酸裂解酶表达的遗传修饰。

代谢修饰的实例性组合命名为(例如)A-B，意指，微生物包含代谢修饰A(增加磷酸烯醇丙酮酸羧化酶表达的遗传修饰)和B(增加α-酮戊二酸脱氢酶表达的遗传修饰)。代谢修饰A-I的实例性组合示于表62中。

表62.代谢修饰的实例性组合(以方括号表示).

代谢修饰J-P的实例性组合示于表63中。

表63.代谢修饰的实例性组合(以方括号表示).

应理解，示于表62和63中的各种代谢修饰组合中的任一者都可彼此组合或与个别代谢修饰A-P组合，以生成其它组合。例如，组合A-B可与P组合以生成组合[A-B-P]；C与J-L-O组合以生成组合[C-J-L-O]；组合A-C-D-E-G与J-K组合以生成组合[A-C-D-E-G-J-K]等等。所述其它组合仅仅具有实例性，并且所属领域技术人员可容易地利用熟知方法和本文提供的教示来生成本文所揭示各种所需的代谢修饰组合。表62和62的代谢修饰(代谢修饰A-P)的其它实例性组合示于图91中。因此，本发明提供包含选自示于表62、表63或图91中的代谢修饰组合的代谢修饰的微生物。

另外提供一或多个编码外源性表达酶的基因整合到宿主生物体的fimD基因座中的微生物(参见实例XVII)。例如，一或多个编码BDO、4-HB、4-HBal、4-HBCoA和/或腐胺途径酶的基因可整合到用于增加BDO、4-HB、4-HBal、4-HBCoA和/或腐胺产生的fimD基因座中。进一步提供表达增加BDO产生的非磷酸转移酶蔗糖吸收系统的微生物。

尽管本文所揭示经遗传修饰的微生物例示为含有特定BDO、4-HB、4-HBal、4-HBCoA和/或腐胺途径酶的微生物，但应理解，所述修饰可纳入具有BDO、4-HB、4-HBal、4-HBCoA和/或腐胺途径的任一微生物中，所述途径适于增强本文所揭示任何途径在所述遗传修饰存在下的产生。因此，本发明微生物可具有本文所揭示BDO、4-HB、4-HBal、4-HBCoA和/或腐胺途径中的任一者(例如，参见图1、8-13、58、62和63)。例如，如果所描绘途径显示BDO途径，而4-羟基丁酸酯是BDO途径的中间体，那么应理解，如本文所揭示，如果需要，还提供实现4-羟基丁酸酯的途径。因此，本文所述途径可产生所描绘途径的最终产物或所描绘途径的所需中间体，如本文所述。

在本发明实施例中，提供包含实现所需产物(例如BDO、4-HB、4-HBal、4-HBCoA和/或腐胺)的代谢修饰和途径的微生物。本文揭示实例性途径且其包括绘示于图1、8-13、58、62和63中的途径。在一个实施例中，所述微生物包含4-羟基丁酸(4-HB)和/或1，4-丁二醇(1，4-BDO)生物合成途径，所述生物合成途径包含α-酮戊二酸脱羧酶或α-酮戊二酸脱氢酶和CoA依赖性琥珀酸半醛脱氢酶或谷氨酸：琥珀酸半醛转氨酶和谷氨酸脱羧酶；4-羟基丁酸脱氢酶；4-羟基丁酰基-CoA：乙酰基-CoA转移酶或丁酸激酶和磷酸转丁酰基酶；醛脱氢酶；和醇脱氢酶。

在另一实施例中，微生物可包含4-HB和/或BDO途径，所述途径包含α-酮戊二酸脱羧酶或α-酮戊二酸脱氢酶和CoA依赖性琥珀酸半醛脱氢酶或谷氨酸：琥珀酸半醛转氨酶和谷氨酸脱羧酶；4-羟基丁酸脱氢酶；4-羟基丁酰基-CoA转移酶或4-羟基丁酸激酶和磷酸转-4-羟基丁酰基酶；4-羟基丁酰基-CoA还原酶；和4-羟基丁醛还原酶或醛/醇脱氢酶。在又一实施例中，微生物可包含4-HB和/或BDO途径，所述途径包含α-酮戊二酸脱羧酶或琥珀酰基-CoA合成酶和CoA依赖性琥珀酸半醛脱氢酶；4-羟基丁酸脱氢酶；4-羟基丁酰基-CoA转移酶或4-羟基丁酸激酶和磷酸转-4-羟基丁酰基酶；和醛脱氢酶；和醇脱氢酶或醛/醇脱氢酶。在另一实施例中，微生物可包含4-HB和/或BDO途径，所述途径包含α-酮戊二酸脱羧酶或谷氨酸脱氢酶和谷氨酸脱羧酶和脱氨4-氨基丁酸酯氧化还原酶或4-氨基丁酸转氨酶或α-酮戊二酸脱氢酶和CoA依赖性琥珀酸半醛脱氢酶；4-羟基丁酸脱氢酶；和4-羟基丁酸激酶和磷酸转-4-羟基丁酰基酶和4-羟基丁酰基-CoA还原酶和4-羟基丁醛还原酶或4-羟基丁酸激酶和磷酸化4-羟基丁醛脱氢酶和4-羟基丁醛还原酶或4-羟基丁酸激酶和磷酸转-4-羟基丁酰基酶和形成醇的4-羟基丁酰基-CoA还原酶或4-羟基丁酰基-CoA转移酶或4-羟基丁酰基-CoA水解酶或4-羟基丁酰基-CoA连接酶和4-羟基丁酰基-CoA还原酶和4-羟基丁醛还原酶或4-羟基丁酰基-CoA转移酶或4-羟基丁酰基-CoA水解酶或4-羟基丁酰基-CoA连接酶和形成醇的4-羟基丁酰基-CoA还原酶。在另一实施例中，微生物可包含BDO途径，所述途径包含谷氨酸CoA转移酶或谷氨酰基-CoA水解酶或谷氨酰基-CoA连接酶和谷氨酰基-CoA还原酶和谷氨酸酯-5-半醛还原酶或谷氨酸CoA转移酶或谷氨酰基-CoA水解酶或谷氨酰基-CoA连接酶和形成醇的谷氨酰基-CoA还原酶或谷氨酸酯5-激酶和磷酸化谷氨酸酯-5-半醛脱氢酶和谷氨酸酯-5-半醛还原酶；脱氨2-氨基-5-羟基戊酸氧化还原酶或2-氨基-5-羟基戊酸转氨酶；和5-羟基-2-氧代戊酸脱羧酶和4-羟基丁醛还原酶或脱羧5-羟基-2-氧代戊酸脱氢酶和4-羟基丁酰基-CoA还原酶和4-羟基丁醛还原酶；或脱羧5-羟基-2-氧代戊酸脱氢酶和形成醇的4-羟基丁酰基-CoA还原酶。

在本发明的又一实施例中，微生物可包含4-HB和/或BDO途径，所述途径包含3-羟基丁酰基-CoA脱氢酶；3-羟基丁酰基-CoA脱水酶；乙烯基乙酰基-CoAΔ-异构酶；4-羟基丁酰基-CoA脱水酶；和4-羟基丁酰基-CoA还原酶(形成醇)；或4-羟基丁酰基-CoA还原酶和1，4-丁二醇脱氢酶。

在本发明的另一实施例中，微生物可包含4-HB和/或BDO途径，所述途径包含谷氨酸CoA转移酶；谷氨酰基-CoA水解酶；谷氨酰基-CoA连接酶；谷氨酸酯5-激酶；谷氨酸酯-5-半醛脱氢酶(磷酸化；谷氨酰基-CoA还原酶；谷氨酸酯-5-半醛还原酶；谷氨酰基-CoA还原酶(形成醇)；2-氨基-5-羟基戊酸氧化还原酶(脱氨)；2-氨基-5-羟基戊酸转氨酶；5-羟基-2-氧代戊酸脱羧酶；和5-羟基-2-氧代戊酸脱氢酶(脱羧)；和任选地4-羟基丁酰基-CoA还原酶(形成醇)、4-羟基丁酰基-CoA还原酶或1，4-丁二醇脱氢酶。在另一实施例中，微生物可包含4-HB和/或BDO途径，所述途径包含谷氨酸CoA转移酶；谷氨酰基-CoA水解酶；谷氨酰基-CoA连接酶；谷氨酸酯5-激酶；谷氨酸酯-5-半醛脱氢酶(磷酸化)；谷氨酰基-CoA还原酶；谷氨酸酯-5-半醛还原酶；谷氨酰基-CoA还原酶(形成醇)；2-氨基-5-羟基戊酸氧化还原酶(脱氨)；2-氨基-5-羟基戊酸转氨酶；5-羟基-2-氧代戊酸脱羧酶；和5-羟基-2-氧代戊酸脱氢酶(脱羧)；和任选地4-羟基丁酰基-CoA还原酶(形成醇)、4-羟基丁酰基-CoA还原酶或1，4-丁二醇脱氢酶。

在本发明的另一实施例中，微生物可包含4-HB和/或BDO途径，所述途径包含谷氨酸脱氢酶；谷氨酸脱羧酶；4-氨基丁酸酯氧化还原酶(脱氨)；和4-羟基丁酸脱氢酶；且进一步包含(a)4-羟基丁酸激酶；磷酸转-4-羟基丁酰基酶；4-羟基丁酰基-CoA还原酶；和1，4-丁二醇脱氢酶；(b)4-羟基丁酰基-CoA转移酶、4-羟基丁酰基-CoA水解酶，或4-羟基丁酰基-CoA连接酶；4-羟基丁酰基-CoA还原酶；和1，4-丁二醇脱氢酶；(c)4-羟基丁酰基-CoA转移酶、4-羟基丁酰基-CoA水解酶或4-羟基丁酰基-CoA连接酶；和4-羟基丁酰基-CoA还原酶(形成醇)；(d)4-羟基丁酸激酶；4-羟基丁醛脱氢酶(磷酸化)；或(e)4-羟基丁酸激酶；磷酸转-4-羟基丁酰基酶；和4-羟基丁酰基-CoA还原酶(形成醇)。在又一实施例中，微生物可包含4-HB和/或BDO途径，所述途径包含α-酮戊二酸脱羧酶或谷氨酸脱氢酶和谷氨酸脱羧酶和4-氨基丁酸转氨酶；和4-羟基丁酸脱氢酶；且进一步包含(a)4-羟基丁酰基-CoA连接酶；4-羟基丁酰基-CoA还原酶；和1，4-丁二醇脱氢酶；(b)4-羟基丁酰基-CoA转移酶、4-羟基丁酰基-CoA水解酶或4-羟基丁酰基-CoA连接酶；和4-羟基丁酰基-CoA还原酶(形成醇)；(c)4-羟基丁酸激酶；4-羟基丁醛脱氢酶(磷酸化)；和1，4-丁二醇脱氢酶；或(d)4-羟基丁酸激酶；磷酸转-4-羟基丁酰基酶；和4-羟基丁酰基-CoA还原酶(形成醇)。在另一实施例中，微生物可包含4-HB和/或BDO途径，所述途径包含α-酮戊二酸脱氢酶；CoA依赖性琥珀酸半醛脱氢酶；和4-羟基丁酸脱氢酶；且进一步包含(a)4-羟基丁酰基-CoA连接酶；4-羟基丁酰基-CoA还原酶；和1，4-丁二醇脱氢酶；(b)4-羟基丁酰基-CoA转移酶、4-羟基丁酰基-CoA水解酶或4-羟基丁酰基-CoA连接酶；和4-羟基丁酰基-CoA还原酶(形成醇)；(c)4-羟基丁酸激酶；4-羟基丁醛脱氢酶(磷酸化)；和1，4-丁二醇脱氢酶；或(d)4-羟基丁酸激酶；磷酸转-4-羟基丁酰基酶；和4-羟基丁酰基-CoA还原酶(形成醇)。

在又一实施例中，微生物可包含4-HB和/或4-羟基丁醛和/或BDO途径，所述途径包含琥珀酰基-CoA还原酶(形成醛)；4-羟基丁酸脱氢酶；和4-羟基丁酸还原酶，在本文中还称作羧酸还原酶。在另一实施例中，微生物可包含4-HB和/或4-羟基丁醛和/或BDO途径，所述途径包含α-酮戊二酸脱羧酶；4-羟基丁酸脱氢酶；和4-羟基丁酸还原酶，在本文中还称作羧酸还原酶。

在另一实施例中，BDO途径可包含4-羟基丁酸脱氢酶、琥珀酰基-CoA合成酶、CoA依赖性琥珀酸半醛脱氢酶、4-羟基丁酸酯：CoA转移酶、4-丁酸激酶、磷酸转丁酰基酶、α-酮戊二酸脱羧酶、醛脱氢酶、醇脱氢酶或醛/醇脱氢酶(参见图1)。或者，BDO途径可包含4-氨基丁酸CoA转移酶、4-氨基丁酰基-CoA水解酶、4-氨基丁酸酯-CoA连接酶、4-氨基丁酰基-CoA氧化还原酶(脱氨)、4-氨基丁酰基-CoA转氨酶或4-羟基丁酰基-CoA脱氢酶(参见表17)。所述BDO途径可进一步包含4-羟基丁酰基-CoA还原酶(形成醇)、4-羟基丁酰基-CoA还原酶或1，4-丁二醇脱氢酶。

另外，BDO途径可包含4-氨基丁酸CoA转移酶、4-氨基丁酰基-CoA水解酶、4-氨基丁酸酯-CoA连接酶、4-氨基丁酰基-CoA还原酶(形成醇)、4-氨基丁酰基-CoA还原酶、4-氨基丁-1-醇脱氢酶、4-氨基丁-1-醇氧化还原酶(脱氨)或4-氨基丁-1-醇转氨酶(参见表18)。此外，BDO途径可包含4-氨基丁酸激酶、4-氨基丁醛脱氢酶(磷酸化)、4-氨基丁-1-醇脱氢酶、4-氨基丁-1-醇氧化还原酶(脱氨)、4-氨基丁-1-醇转氨酶、[(4-氨基丁酰基)氧基]膦酸氧化还原酶(脱氨)、[(4-氨基丁酰基)氧基]膦酸转氨酶、4-羟基丁酰基-磷酸酯脱氢酶或4-羟基丁醛脱氢酶(磷酸化)(参见表19)。所述途径可进一步包含1，4-丁二醇脱氢酶。

BDO途径还可包含α-酮戊二酸酯5-激酶、2，5-二氧代戊酸半醛脱氢酶(磷酸化)、2，5-二氧代戊酸还原酶、α-酮戊二酸CoA转移酶、α-酮戊二酰基-CoA水解酶、α-酮戊二酰基-CoA连接酶、α-酮戊二酰基-CoA还原酶、5-羟基-2-氧代戊酸脱氢酶、α-酮戊二酰基-CoA还原酶(形成醇)、5-羟基-2-氧代戊酸脱羧酶或5-羟基-2-氧代戊酸脱氢酶(脱羧)(参见表20)。所述BDO途径可进一步包含4-羟基丁酰基-CoA还原酶(形成醇)、4-羟基丁酰基-CoA还原酶或1，4-丁二醇脱氢酶。另外，BDO途径可包含谷氨酸CoA转移酶、谷氨酰基-CoA水解酶、谷氨酰基-CoA连接酶、谷氨酸酯5-激酶、谷氨酸酯-5-半醛脱氢酶(磷酸化)、谷氨酰基-CoA还原酶、谷氨酸酯-5-半醛还原酶、谷氨酰基-CoA还原酶(形成醇)、2-氨基-5-羟基戊酸氧化还原酶(脱氨)、2-氨基-5-羟基戊酸转氨酶、5-羟基-2-氧代戊酸脱羧酶、5-羟基-2-氧代戊酸脱氢酶(脱羧)(参见表21)。所述BDO途径可进一步包含4-羟基丁酰基-CoA还原酶(形成醇)、4-羟基丁酰基-CoA还原酶或1，4-丁二醇脱氢酶。

另外，BDO途径可包含3-羟基丁酰基-CoA脱氢酶、3-羟基丁酰基-CoA脱水酶、乙烯基乙酰基-CoAΔ-异构酶或4-羟基丁酰基-CoA脱水酶(参见表22)。此外，BDO途径可包含高丝氨酸脱氨酶、高丝氨酸CoA转移酶、高丝氨酸-CoA水解酶、高丝氨酸-CoA连接酶、高丝氨酸-CoA脱氨酶、4-羟基丁-2-烯酰基-CoA转移酶、4-羟基丁-2-烯酰基-CoA水解酶、4-羟基丁-2-烯酰基-CoA连接酶、4-羟基丁-2-烯酸酯还原酶、4-羟基丁酰基-CoA转移酶、4-羟基丁酰基-CoA水解酶、4-羟基丁酰基-CoA连接酶或4-羟基丁-2-烯酰基-CoA还原酶(参见表23)。所述BDO途径可进一步包含4-羟基丁酰基-CoA还原酶(形成醇)、4-羟基丁酰基-CoA还原酶或1，4-丁二醇脱氢酶。

BDO途径另外可包含琥珀酰基-CoA还原酶(形成醇)、4-羟基丁酰基-CoA水解酶、4-羟基丁酰基-CoA连接酶或4-羟基丁醛脱氢酶(磷酸化)(参见表15)。所述途径可进一步包含琥珀酰基-CoA还原酶、4-羟基丁酸脱氢酶、4-羟基丁酰基-CoA转移酶、4-羟基丁酸激酶、磷酸转-4-羟基丁酰基酶、4-羟基丁酰基-CoA还原酶、4-羟基丁酰基-CoA还原酶(形成醇)或1，4-丁二醇脱氢酶。此外，BDO途径可包含谷氨酸脱氢酶、4-氨基丁酸酯氧化还原酶(脱氨)、4-氨基丁酸转氨酶、谷氨酸脱羧酶、4-羟基丁酰基-CoA水解酶、4-羟基丁酰基-CoA连接酶或4-羟基丁醛脱氢酶(磷酸化)(参见表16)。所述BDO途径可进一步包含α-酮戊二酸脱羧酶、4-羟基丁酸脱氢酶、4-羟基丁酰基-CoA转移酶、4-羟基丁酸激酶、磷酸转-4-羟基丁酰基酶、4-羟基丁酰基-CoA还原酶、4-羟基丁酰基-CoA还原酶(形成醇)或1，4-丁二醇脱氢酶。

本发明另外提供包含4-羟基丁醛途径的非天然微生物，所述途径包含至少一种编码4-羟基丁醛途径酶的外源性核酸，所述外源性核酸以足以产生4-羟基丁醛的量来表达，所述4-羟基丁醛途径包含琥珀酰基-CoA还原酶(形成醛)；4-羟基丁酸脱氢酶；和4-羟基丁酸还原酶(参见图58，步骤A-C-D)。本发明还提供包含4-羟基丁醛途径的非天然微生物，所述途径包含至少一种编码4-羟基丁醛途径酶的外源性核酸，所述外源性核酸以足以产生4-羟基丁醛的量来表达，所述4-羟基丁醛途径包含α-酮戊二酸脱羧酶；4-羟基丁酸脱氢酶；和4-羟基丁酸还原酶(图58，步骤B-C-D)。

本发明进一步提供包含4-羟基丁醛途径的非天然微生物，所述途径包含至少一种编码4-羟基丁醛途径酶的外源性核酸，所述外源性核酸以足以产生4-羟基丁醛的量来表达，所述4-羟基丁醛途径包含琥珀酸还原酶；4-羟基丁酸脱氢酶；和4-羟基丁酸还原酶(参见图62，步骤F-C-D)。在另一实施例中，本发明提供包含4-羟基丁醛途径的非天然微生物，所述途径包含至少一种编码4-羟基丁醛途径酶的外源性核酸，所述外源性核酸以足以产生4-羟基丁醛的量来表达，所述4-羟基丁醛途径包含α-酮戊二酸脱羧酶或谷氨酸脱氢酶或谷氨酸转氨酶和谷氨酸脱羧酶和4-氨基丁酸脱氢酶或4-氨基丁酸转氨酶；4-羟基丁酸脱氢酶；和4-羟基丁酸还原酶(参见图62，步骤B或((J或K)-L-(M或N))-C-D)。

本发明还提供包含4-羟基丁醛途径的非天然微生物，所述途径包含至少一种编码4-羟基丁醛途径酶的外源性核酸，所述外源性核酸以足以产生4-羟基丁醛的量来表达，所述4-羟基丁醛途径包含α-酮戊二酸还原酶；5-羟基-2-氧代戊酸脱氢酶；和5-羟基-2-氧代戊酸脱羧酶(参见图62，步骤X-Y-Z)。在另一实施例中，本发明提供包含4-羟基丁酰基-CoA途径的非天然微生物，所述途径包含至少一种编码4-羟基丁酰基-CoA途径酶的外源性核酸，所述外源性核酸以足以产生4-羟基丁酰基-CoA的量来表达，所述4-羟基丁酰基-CoA途径包含α-酮戊二酸还原酶；5-羟基-2-氧代戊酸脱氢酶；和5-羟基-2-氧代戊酸脱氢酶(脱羧)(参见图62，步骤X-Y-AA)。

本发明另外提供包含腐胺途径的非天然微生物，所述途径包含至少一种编码腐胺途径酶的外源性核酸，所述外源性核酸以足以产生腐胺的量来表达，所述腐胺途径包含琥珀酸还原酶；4-氨基丁酸脱氢酶或4-氨基丁酸转氨酶；4-氨基丁酸还原酶；和腐胺脱氢酶或腐胺转氨酶(参见图63，步骤F-M/N-C-D/E)。在又一实施例中，本发明提供包含腐胺途径的非天然微生物，所述途径包含至少一种编码腐胺途径酶的外源性核酸，所述外源性核酸以足以产生腐胺的量来表达，所述腐胺途径包含α-酮戊二酸脱羧酶；4-氨基丁酸脱氢酶或4-氨基丁酸转氨酶；4-氨基丁酸还原酶；和腐胺脱氢酶或腐胺转氨酶(参见图63，步骤B-M/N-C-D/E)。本发明另外提供包含腐胺途径的非天然微生物，所述途径包含至少一种编码腐胺途径酶的外源性核酸，所述外源性核酸以足以产生腐胺的量来表达，所述腐胺途径包含谷氨酸脱氢酶或谷氨酸转氨酶；谷氨酸脱羧酶；4-氨基丁酸还原酶；和腐胺脱氢酶或腐胺转氨酶(参见图63，步骤J/K-L-C-D/E)。

本发明在另一实施例中提供包含腐胺途径的非天然微生物，所述途径包含至少一种编码腐胺途径酶的外源性核酸，所述外源性核酸以足以产生腐胺的量来表达，所述腐胺途径包含α-酮戊二酸还原酶；5-氨基-2-氧代戊酸脱氢酶或5-氨基-2-氧代戊酸转氨酶；5-氨基-2-氧代戊酸脱羧酶；和腐胺脱氢酶或腐胺转氨酶(参见图63，步骤O-P/Q-R-D/E)。还提供包含腐胺途径的非天然微生物，所述途径包含至少一种编码腐胺途径酶的外源性核酸，所述外源性核酸以足以产生腐胺的量来表达，所述腐胺途径包含α-酮戊二酸还原酶；5-氨基-2-氧代戊酸脱氢酶或5-氨基-2-氧代戊酸转氨酶；鸟氨酸脱氢酶或鸟氨酸转氨酶；和鸟氨酸脱羧酶(参见图63，步骤O-P/Q-S/T-U)。

在另一实施例中，本发明提供具有4-HB、4-HBal、4-HBCoA、BDO或腐胺途径的非天然微生物，其中所述非天然微生物包含至少一种编码转变本文所揭示任一途径的底物的酶或蛋白质的外源性核酸(例如，参见实例和图1、8-13、58、62和63)。在用于产生BDO的实例性实施例中，微生物可将底物转变为产物，所述转变选自由以下组成的群组：琥珀酸酯转变为琥珀酰基-CoA；琥珀酰基-CoA转变为琥珀酸半醛；琥珀酸半醛转变为4-羟基丁酸酯；4-羟基丁酸酯转变为4-羟基丁酰基-磷酸酯；4-羟基丁酰基-磷酸酯转变为4-羟基丁酰基-CoA；4-羟基丁酰基-CoA转变为4-羟基丁醛；和4-羟基丁醛转变为1，4-丁二醇。在用于产生4-HBal的途径中，微生物可(例如)将琥珀酸酯转变为琥珀酸半醛；琥珀酸半醛转变为4-羟基丁酸酯；和4-羟基丁酸酯转变为4-羟基丁醛。所述生物体另外可包括将4-羟基丁醛转变为1，4-丁二醇以产生BDO的活性。用于产生4-HBal的又一途径可为(例如)α-酮戊二酸酯到琥珀酸半醛；琥珀酸半醛到4-羟基丁酸酯；和4-羟基丁酸酯到4-羟基丁醛。用于产生4-HBal的替代途径可为(例如)α-酮戊二酸酯到2，5-二氧代戊酸；2，5-二氧代戊酸到5-羟基-2-氧代戊酸；和5-羟基-2-氧代戊酸到4-羟基丁醛。实例性4-羟基丁酰基-CoA途径可为(例如)α-酮戊二酸酯到2，5-二氧代戊酸；2，5-二氧代戊酸到5-羟基-2-氧代戊酸；和5-羟基-2-氧代戊酸到4-羟基丁酰基-CoA。实例性腐胺途径可为(例如)琥珀酸酯到琥珀酰基-CoA；琥珀酰基-CoA到琥珀酸半醛；琥珀酸半醛到4-氨基丁酸酯；4-氨基丁酸酯到4-氨基丁醛；和4-氨基丁醛到腐胺。替代腐胺途径可为(例如)琥珀酸酯到琥珀酸半醛；琥珀酸半醛到4-氨基丁酸酯；4-氨基丁酸酯到4-氨基丁醛；和4-氨基丁醛到腐胺。所属领域技术人员应理解，所述仅仅具有实例性且本文所揭示适于产生所需产物且合适活性可用于转变的任一底物-产物对可容易地由所属领域技术人员基于本文中的教示测定。因此，本发明提供含有至少一种编码酶或蛋白质的外源性核酸的非天然微生物，其中所述酶或蛋白质转变途径的底物和产物(参见图1、8-13、58、62和63)。

尽管本文通常描述为含有4-HB、4-HBal、4-HBCoA、BDO或腐胺途径的微生物，但应理解，本发明另外提供包含至少一种编码4-HB、4-HBal、4-HBCoA、BDO或腐胺途径酶或蛋白质的外源性核酸的非天然微生物，所述外源性核酸以足以产生4-HB、4-HBal、4-HBCoA、BDO或腐胺途径中间体的量来表达。例如，如本文所揭示，4-HB、4-HBal、4-HBCoA、BDO和腐胺途径例示于图1、8-13、58、62和63中。因此，除含有(例如)产生BDO的BDO途径的微生物以外，本发明另外提供包含至少一种编码BDO途径酶的外源性核酸的非天然微生物，其中所述微生物产生BDO途径中间体作为所述途径的产物而非中间体。例如，在如图62中所示的一个实例性实施例中，本发明提供产生琥珀酰基-CoA、琥珀酸半醛、4-羟基丁酸酯、4-羟基丁酰基-磷酸酯、4-羟基丁酰基-CoA或4-羟基丁醛作为产物而非中间体的微生物。另一实例性实施例包括(例如)产生α-酮戊二酸酯、2，5-二氧代戊酸、5-羟基-2-氧代戊酸或4-羟基丁醛作为产物而非中间体的微生物。腐胺途径中的实例性实施例包括(例如)产生谷氨酸酯、4-氨基丁酸酯或4-氨基丁醛作为产物而非中间体的微生物。腐胺途径中的替代实施例可为(例如)产生2，5-二氧代戊酸酯、5-氨基-2-氧代戊酸酯或鸟氨酸作为产物而非中间体的微生物。

应理解，可视需要利用本文所揭示、如实例中所述和图中所例示的任何途径(包括图1、8-13、58、62和63的途径)来生成产生任一途径中间体或产物的非天然微生物。如本文所揭示，产生中间体的所述微生物可与表达下游途径酶的另一微生物组合使用以产生所需产物。然而，应理解，可利用产生4-HB、4-HBal、4-HBCoA、BDO或腐胺途径中间体的非天然微生物来产生中间体作为所需产物。

本发明一般地参考代谢反应、其反应物或产物，或特定地参考一或多个编码与所参考代谢反应、反应物或产物相关或催化所参考代谢反应、反应物或产物的酶的核酸或基因描述于本文中。除非本文另有明确说明，否则所属领域技术人员应理解，对反应的参考还构成对反应的反应物和产物的参考。相似地，除非本文另有明确说明，否则对反应物或产物的参考还参考反应且对所述代谢组分中任一者的参考还参考一或多个编码催化所参考反应的酶、反应物或产物的基因。同样，考虑到代谢生物化学、酶学和基因组学的熟知领域，本文对基因或编码核酸的参考还构成对相应所编码酶和其催化的反应以及所述反应的反应物和产物的参考。

如本文所揭示，产物4-羟基丁酸酯以及其它中间体是羧酸，其可以各种电离形式(包括完全质子化、部分质子化和完全去质子化形式)出现。因此，后缀“-酸酯”或酸形式可互换用于描述游离酸形式以及任一去质子化形式二者，尤其由于已知离子化形式取决于发现所述化合物的pH。应理解，羧酸酯产物或中间体包括羧酸酯产物或途径中间体的酯形式，例如O-羧酸酯和S-羧酸酯。O-和S-羧酸酯可包括低碳烷基(也就是C1到C6)、具支链或直链羧酸酯。一些所述O-或S-羧酸酯包括(但不限于)O-或S-羧酸甲酯、O-或S-羧酸乙酯、O-或S-羧酸正丙酯、O-或S-羧酸正丁酯、O-或S-羧酸异丙酯、O-或S-羧酸仲丁基酯和叔丁基酯、O-或S-羧酸戊酯、O-或S-羧酸己酯，所述酯中的任一者都可进一步具有不饱和性，以提供(例如)O-或S-羧酸丙烯酯、O-或S-羧酸丁烯酯、O-或S-羧酸戊烯酯和O-或S-羧酸己烯酯。O-羧酸酯可为生物合成途径产物。经由生物合成途径获取的实例性O-羧酸酯可包括(但不限于)4-羟基丁酸甲酯、4-羟基丁酸乙酯和4-羟基丁酸正丙酯。其它以生物合成方式获取的O-羧酸酯可包括源自诸如以下等脂肪醇的中链到长链基团(也就是C7-C22)的O-羧酸酯：庚醇、辛醇、壬醇、癸醇、十一醇、月桂醇、十三醇、肉桂醇、十五醇、鲸蜡醇、棕榈醇、十七醇、硬脂醇、十九醇、二十醇、二十一醇和山嵛醇，所述酯中的任一者都可任选地具支链和/或含有不饱和性。O-羧酸酯还可经由生物化学或化学工艺(例如游离羧酸产物的酯化或O-或S-羧酸酯的转酯化)获取。S-羧酸酯例示为CoA S-酯、半胱氨酸S-酯、烷基硫酯以及各种芳基和杂芳基硫酯。

使用本发明微生物经由生物合成模式产生4-HB特别有用，这是因为其可产生单体4-HB。本发明的非天然微生物和其对4-HB和BDO家族化合物的生物合成也特别有用，这是因为4-HB产物可(1)被分泌；(2)可没有诸如辅酶A等任何衍生形式；(3)避免生物合成期间的热力学变化；(4)允许BDO的直接生物合成，和(5)允许在酸性pH介质中4-HB到γ-丁内酯(GBL)的自发化学转变。例如，此后一特性也特别可用于诸如1，4-丁二醇和/或四氢呋喃(THF)等BDO家族化合物的有效化学合成或生物合成。

微生物通常缺乏合成4-HB的能力，且因此缺乏合成本文所揭示在1，4-丁二醇化合物家族内或所属领域技术人员已知在1，4-丁二醇化合物家族内的任一化合物的能力。此外，已知具有所有必需的代谢酶促能力的生物体不会从所述酶和本文所例示生物化学途径产生4-HB。相反，除了下文进一步描述的几种厌氧性微生物可能例外，具有酶促能力的微生物都使用4-HB作为底物来产生(例如)琥珀酸酯。相比之下，本发明的非天然微生物可生成4-HB、4-HBal、4-HBCoA、BDO和/或腐胺作为产物。如上文所述，以单体形式生物合成4-HB不仅特别可用于化学合成BDO化合物家族，并且其还允许进一步生物合成BDO化合物家族并避免完全化学合成程序。

可产生4-HB、4-HBal、4-HBCoA、BDO和/或腐胺的本发明的非天然微生物是通过确保宿主微生物包括完全生物化学合成本发明的4-HB、4-HBal、4-HBCoA、BDO和/或腐胺生物合成途径中的至少一者的功能能力来产生。确保至少一种必需的4-HB、4-HBal、4-HBCoA或BDO生物合成途径使宿主微生物具有4-HB生物合成能力。

若干4-HB生物合成途径例示于本文中且出于图解说明的目的示于图1中。其它4-HB和BDO途径描述于图8-13中。一种4-HB生物合成途径包括从琥珀酸酯生物合成4-HB(琥珀酸酯途径)。参与此4-HB途径的酶包括非CoA依赖性琥珀酸半醛脱氢酶和4-羟基丁酸脱氢酶。在这个途径中，非CoA依赖性琥珀酸半醛脱氢酶催化逆向示于图1中的箭头的反应。另一4-HB生物合成途径包括经由琥珀酰基-CoA从琥珀酸酯的生物合成(琥珀酰基-CoA途径)。参与这个4-HB途径的酶包括琥珀酰基-CoA合成酶、CoA依赖性琥珀酸半醛脱氢酶和4-羟基丁酸脱氢酶。三种其它4-HB生物合成途径包括从α-酮戊二酸酯生物合成4-HB(α-酮戊二酸酯途径)。因此，第三种4-HB生物合成途径是经由谷氨酸酯：琥珀酸半醛转氨酶、谷氨酸脱羧酶和4-羟基丁酸脱氢酶生物合成琥珀酸半醛。第四种4-HB生物合成途径还包括从α-酮戊二酸酯生物合成4-HB，但利用α-酮戊二酸脱羧酶来催化琥珀酸半醛合成。4-羟基丁酸脱氢酶催化琥珀酸半醛转变为4-HB。第五种4-HB生物合成途径包括经由琥珀酰基-CoA从α-酮戊二酸酯的生物合成且利用α-酮戊二酸脱氢酶来产生琥珀酰基-CoA，所述琥珀酰基-CoA流入上述琥珀酰基-CoA途径中。所述4-HB生物合成途径、其底物、反应物和产物中的每一者进一步描述于下文实例中。如本文所述，可通过纳入用以产生BDO的合适酶将4-HB进一步以生物合成方式转变为BDO(参见实例)。因此，应理解，4-HB途径可与用于将4-HB转变为BDO的酶一起使用以生成BDO途径。

本发明的非天然微生物可通过引入编码一或多种参与一或多种4-HB、4-HBal、4-HBCoA、BDO或腐胺生物合成途径的酶的可表达核酸来产生。根据选择用于生物合成的宿主微生物而定，可表达用于一些或全部特定4-HB、4-HBal、4-HBCoA、BDO或腐胺生物合成途径中的核酸。例如，如果所选宿主缺乏所需生物合成途径(例如，琥珀酸酯到4-HB途径)中的一或多种酶，那么将可表达缺乏所述酶(例如，这个实例中的非CoA依赖性琥珀酸半醛脱氢酶与4-羟基丁酸脱氢酶二者)的核酸引入宿主中，用于随后外源性表达。或者，如果所选宿主展现内源性表达一些途径酶，但缺乏其它酶，那么需要编码所述缺乏酶的核酸，以实现4-HB、4-HBal、4-HBCoA、BDO或腐胺的生物合成。例如，如果所选宿主展现内源性非CoA依赖性琥珀酸半醛脱氢酶，但缺乏4-羟基丁酸脱氢酶，那么需要编码这种酶的核酸，以实现4-HB的生物合成。因此，本发明的非天然微生物可通过引入外源性酶或蛋白质活性来产生，以获得所需生物合成途径，或所需生物合成途径可通过引入一或多种外源性酶或蛋白质活性来产生，所述生物合成途径与一或多种内源性酶或蛋白质一起产生所需产物，例如4-HB、4-HBal、4-HBCoA、BDO和/或腐胺。

依同样方式，如果4-HB生物合成经选择经由琥珀酸酯到琥珀酰基-CoA途径(琥珀酰基-CoA途径)发生，那么使针对宿主所缺乏琥珀酰基-CoA合成酶、CoA依赖性琥珀酸半醛脱氢酶和/或4-羟基丁酸脱氢酶的编码核酸在受体宿主中外源性表达。选择经由α-酮戊二酸酯到琥珀酸半醛途径(α-酮戊二酸酯途径)生物合成4-HB时，可利用缺乏一或多种谷氨酸酯：琥珀酸半醛转氨酶、谷氨酸脱羧酶和/或4-羟基丁酸脱氢酶或α-酮戊二酸脱羧酶和4-羟基丁酸脱氢酶的宿主的外源性表达。所属领域技术人员很容易就可决定用于产生4-HB或BDO的途径酶，如本文所揭示。

根据所选宿主微生物的4-HB、4-HBal、4-HBCoA、BDO或腐胺生物合成途径组分而定，本发明的非天然微生物将包括至少一种外源性表达的4-HB、4-HB、4-HBCoA、BDO或腐胺途径编码核酸和一或多种4-HB或BDO生物合成途径的最多全部编码核酸。例如，可经由相应编码核酸的外源性表达在缺乏途径酶或蛋白质的宿主中建立4-HB、4-HBal、4-HBCoA、BDO或腐胺生物合成。在缺乏4-HB、4-HB、4-HBCoA、BDO或腐胺途径的全部酶或蛋白质的宿主中，可包括所述途径中全部酶或蛋白质的外源性表达，但应理解，即使宿主含有至少一种途径酶或蛋白质，仍可表达途径的全部酶或蛋白质。如果需要，可包括用于产生4-HB、4-HB、4-HBCoA、BDO或腐胺的途径中全部酶或蛋白质的外源性表达。例如，可在缺乏4-羟基丁酸脱氢酶的宿主中经由4-羟基丁酸脱氢酶编码核酸的外源性表达从全部五种途径建立4-HB生物合成。相比之下，可在缺乏全部八种酶的宿主中经由全部八种非CoA依赖性琥珀酸半醛脱氢酶、琥珀酰基-CoA合成酶、CoA依赖性琥珀酸半醛脱氢酶、谷氨酸酯：琥珀酸半醛转氨酶、谷氨酸脱羧酶、α-酮戊二酸脱羧酶、α-酮戊二酸脱氢酶和4-羟基丁酸脱氢酶的外源性表达从全部五种途径建立4-HB生物合成。

鉴于本文所提供的教示和指导，所属领域技术人员应理解，以可表达形式引入的编码核酸数至少应与所选择宿主微生物的4-HB、4-HBal、4-HBCoA、BDO或腐胺途径缺乏相应。因此，本发明的非天然微生物可具有一种、两种、三种、四种、六种、七种、八种或最多全部编码本文所揭示酶的核酸，所述酶构成一或多种4-HB、4-HBal、4-HBCoA、BDO或腐胺生物合成途径。在一些实施例中，非天然微生物还可包括促进或优化4-HB、4-HBal、4-HBCoA、BDO或腐胺生物合成或使宿主微生物具有有用功能的其它遗传修饰。一种所述其它功能可包括(例如)增进诸如以下等4-HB途径前体中一或多者的合成：琥珀酸酯、琥珀酰基-CoA、α-酮戊二酸酯、4-氨基丁酸酯、谷氨酸酯、乙酰乙酰基-CoA和/或高丝氨酸。

通常，宿主微生物经选择以使其产生4-HB、4-HBal、4-HBCoA、BDO或腐胺途径的前体，作为天然产生的分子或作为经改造产物，以从头产生所需前体或增加由宿主微生物天然产生的前体的产生。例如，在诸如大肠杆菌等宿主生物体中天然产生琥珀酰基-CoA、α-酮戊二酸酯、4-氨基丁酸酯、谷氨酸酯、乙酰乙酰基-CoA和高丝氨酸。宿主生物体可经改造以增加前体的产生，如本文所揭示。另外，已经改造以产生所需前体的微生物可用作宿主生物体并经进一步改造以表达4-HB、4-HBal、4-HBCoA、BDO或腐胺途径的酶或蛋白质。

在一些实施例中，从含有合成4-HB、4-HBal、4-HBCoA、BDO或腐胺的酶促能力的宿主生成本发明的非天然微生物。在这个具体实施例中，其可用于增加4-HB、4-HBal、4-HBCoA、BDO或腐胺途径产物的合成或累积以(例如)驱动4-HB、4-HBal、4-HBCoA、BDO或腐胺途径反应向4-HB、4-HBal、4-HBCoA、BDO或腐胺产生进行。可通过(例如)编码本文所揭示4-HB、4-HBal、4-HBCoA、BDO或腐胺途径酶中一或多者的核酸的过表达来增加合成或累积。4-HB、4-HBal、4-HBCoA、BDO或腐胺途径酶或酶的过表达可(例如)经由一或多种内源性基因的外源性表达或经由一或多种异源基因的外源性表达发生。因此，天然生物体可经由一种、两种、三种、四种、五种、六种等等到最多全部编码4-HB、4-HBal、4-HBCoA、BDO或腐胺生物合成途径酶的核酸的过表达容易地生成为产生非天然4-HB、4-HBal、4-HBCoA、BDO或腐胺的本发明微生物。另外，非天然生物体可通过导致4-HB、4-HBal、4-HBCoA、BDO或腐胺生物合成途径中的酶活性增加的内源性基因的诱变生成。

在特别有用的实施例中，采用编码核酸的外源性表达。外源性表达赋予宿主和应用定制表达和/或调节组件的能力，以实现由使用者控制的所需表达水平。然而，还可通过(例如)去除负调节效应子或当连接到诱导型启动子或另一调节组件时诱导基因的启动子，在其它实施例中利用内源性表达。因此，具有天然诱导型启动子的内源性基因可通过提供合适的诱导剂来上调，或内源性基因的调节区可经改造以纳入诱导型调节组件，由此允许在所需时间调节内源性基因的增加表达。相似地，可包括诱导型启动子作为引入非天然微生物中的外源性基因的调节组件(参见实例)。

本文所用“外源”打算意指将参考分子或参考活性引入宿主微生物中。例如，可通过将编码核酸引入宿主遗传材料中来引入分子，例如通过整合到宿主染色体中或作为非染色体遗传材料(例如质粒)。因此，在参考编码核酸的表达使用所述术语时，其是指以可表达形式将编码核酸引入微生物中。在参考生物合成活性使用所述术语时，其是指引入宿主参考生物体中的活性。来源可为(例如)在引入宿主微生物中后可表达参考活性的同源或异源编码核酸。因此，术语“内源”是指在宿主中存在的参考分子或活性。相似地，在参考编码核酸的表达使用时，所述术语是指微生物内所含编码核酸的表达。术语“异源”是指源自除所参考物种外的来源的分子或活性，而“同源”是指源自宿主微生物的分子或活性。因此，本发明编码核酸之外源表达可利用异源或同源编码核酸中的任一者或二者。

应理解，当微生物中包括一个以上外源性核酸时，所述一个以上外源性核酸是指所参考编码核酸或生物合成活性，如上文所论述。应进一步理解，如本文所揭示，所述一个以上外源性核酸可以单独核酸分子、以多顺反子核酸分子或其组合引入宿主微生物中，并且仍视为一个以上外源性核酸。例如，如本文所揭示微生物可经改造以表达两个或更多个编码所需途径酶或蛋白质的外源性核酸。在将两个编码所需活性的外源性核酸引入宿主微生物中的情况下，应理解，所述两个外源性核酸可作为单一核酸(例如，在单一质粒上，在单独质粒上)引入，可于单一位点或多个位点整合到宿主染色体中，并且仍视为两个外源性核酸。相似地，应理解，两个以上外源性核酸可以任一所需组合(例如，在单一质粒上，在单独质粒上)引入宿主生物体中，可于单一位点或多个位点整合到宿主染色体中，并且仍视为两个或更多个外源性核酸，例如三个外源性核酸。因此，所参考外源性核酸或生物合成活性的数量是指编码核酸的数量或生物合成活性的数量，而非引入宿主生物体中的单独核酸的数量。

本文所用术语“基因破坏”或其语法等效内容打算意指使所编码基因产物无活性或衰减的遗传改变。遗传改变可为(例如)整个基因的缺失、转录或转译所需调节序列的缺失、一部分导致截短基因产物的基因的缺失或使所编码基因产物不活化的各种突变策略中的任一者。一种特别有用的基因破坏方法是完全基因缺失，这是因为其减少或消除了本发明非天然微生物中遗传回复的发生。基因破坏还包括无效突变，其是指基因或含有基因的区内导致所述基因未转录成RNA和/或转译成功能基因产物的突变。所述无效突变可起因于许多类型的突变，包括(例如)不活化点突变、一部分基因的缺失、整个基因的缺失或染色体区段的缺失。

本文所用术语“衰减”或其语法等效内容打算意指减弱、降低或减小酶或蛋白质的活性或量。如果衰减引起活性或量下降到低于给定途径发挥功能所需的临界水平，那么酶或蛋白质活性或量的衰减可模拟完全破坏。然而，模拟一种途径的完全破坏的酶或蛋白质的活性或量的衰减仍可足以使单独途径持续发挥功能。例如，内源性酶或蛋白质的衰减可足以模拟用于产生本发明4-HB、4-HBal、4-HBCoA、BDO或腐胺的相同酶或蛋白质的完全破坏，但酶或蛋白质的残留活性或量仍可足以维持其它途径，例如对于宿主微生物存活、繁殖或生长至关重要的途径。酶或蛋白质的衰减还可以足以增加本发明4-HB、4-HBal、4-HBCoA、BDO或腐胺的产率的量减弱、降低或减小酶或蛋白质的活性或量，但未必模拟酶或蛋白质的完全破坏。

本文所用术语“生长偶合”在参考生物化学产物的产生使用时，打算意指所参考生物化学产物的生物合成是在微生物生长阶段期间产生。在一特定实施例中，生长偶合产生可任选地为专性的，意指所参考生物化学的生物合成是在微生物生长阶段期间产生的专性产物。

4-HB、4-HBal、4-HBCoA、BDO或腐胺途径酶的编码核酸的来源可包括(例如)所编码基因产物能够催化所参考反应的任何物种。所述物种包括原核与真核生物体二者，包括(但不限于)细菌，包括古细菌和真细菌；和真核生物，包括酵母菌、植物、昆虫、动物和哺乳动物，包括人类。所述来源的实例性物种包括(例如)大肠杆菌、啤酒酵母菌(Saccharomycescerevisiae)、克氏酵母菌(Saccharomyces kluyveri)、克氏梭菌、丙酮丁醇梭菌、拜氏梭菌、糖乙酸多丁醇梭菌(Clostridium saccharoperbutylacetonicum)、产气荚膜梭菌(Clostridium perfringens)、难辨梭菌(Clostridium difficile)、肉毒梭菌(Clostridium botulinum)、酪丁酸梭菌(Clostridium tyrobutyricum)、假破伤风梭菌(Clostridium tetanomorphum)、破伤风梭菌(Clostridium tetani)、丙酸梭菌(Clostridium propionicum)、氨基丁酸梭菌(Clostridium aminobutyricum)、近端梭菌(Clostridium subterminale)、史迪克兰梭菌(Clostridium sticklandii)、富养产碱菌(Ralstonia eutropha)、牛分枝杆菌、结核分枝杆菌、牙龈卟啉单胞菌、拟南芥(Arabidopsis thaliana)、嗜热栖热菌(Thermus thermophilus)、假单胞菌(Pseudomonasspecies)(包括绣色假单胞菌(Pseudomonas aeruginosa)、恋臭假单胞菌(Pseudomonasputida)、施氏假单胞菌(Pseudomonas stutzeri)、荧光假单胞菌(Pseudomonasfluorescens))、智人(Homo sapiens)、穴兔(Oryctolagus cuniculus)、类球红杆菌(Rhodobacter spaeroides)、布氏嗜热厌氧性杆菌(Thermoanaerobacter brockii)、瑟杜生金属球菌(Metallosphaera sedula)、肠膜样明串珠菌(Leuconostoc mesenteroides)、嗜热光合绿曲菌(Chloroflexus aurantiacus)、凯斯特玫瑰弯菌(Roseiflexuscastenholzii)、赤杆菌属(Erythrobacter)、蜡黄杨(Simmondsia chinensis)、不动杆菌(Acinetobacter species)(包括乙酸钙不动杆菌(Acinetobacter calcoaceticus)和贝氏不动杆菌(Acinetobacter baylyi))、牙龈卟啉单胞菌、托克达硫化叶菌(Sulfolobustokodaii)、硫磺矿硫化叶菌(Sulfolobus solfataricus)、嗜酸热硫化叶菌(Sulfolobusacidocaldarius)、枯草芽胞杆菌(Bacillus subtilis)、仙人掌芽胞杆菌(Bacilluscereus)、巨大芽胞杆菌(Bacillus megaterium)、短芽胞杆菌(Bacillus brevis)、短小芽胞杆菌(Bacillus pumilus)、褐鼠(Rattus norvegicus)、肺炎克雷伯氏菌(Klebsiellapneumonia)、奥克西托克雷白杆菌(Klebsiella oxytoca)、纤细裸藻(Euglena gracilis)、齿垢密螺旋体(Treponema denticola)、热乙酸尔氏菌(Moorella thermoacetica)、海栖热袍菌(Thermotoga maritima)、嗜盐杆菌(Halobacterium salinarum)、嗜热脂肪地芽孢杆菌(Geobacillus stearothermophilus)、敏捷气热菌(Aeropyrum pernix)、野猪(Susscrofa)、秀丽隐杆线虫(Caenorhabdiris elegans)、谷氨酸棒杆菌(Corynebacteriumglutamicum)、发酵氨基酸球菌(Acidaminococcus fermentans)、乳酸乳球菌(Lactococcuslactis)、胚芽乳酸杆菌(Lactobacillus plantarum)、嗜热链球菌(Streptococcusthermophilus)、产气肠杆菌(Enterobacter aerogenes)、假丝酵母菌属(Candida)、土曲霉(Aspergillus terreus)、戊糖片球菌(Pediococcus pentosaceus)、运动发酵单胞菌(Zymomonas mobilis)、巴斯德醋酸杆菌(Acetobacter pasteurians)、乳酸克氏酵母菌(Kluyveromyces lactis)、巴克氏真细菌(Eubacterium barkeri)、多毛拟杆菌(Bacteroides capillosus)、科氏厌氧性躯干菌(Anaerotruncus colihominis)、嗜热盐碱厌氧性菌(Natranaerobius thermophilus)、空肠曲杆菌(Campylobacterjejuni)、流感嗜血杆菌、粘质沙雷氏菌(Serratia marcescens)、无丙二酸柠檬酸杆菌(Citrobacteramalonaticus)、黄色粘球菌(Myxococcus xanthus)、具核梭杆菌(Fusobacteriumnucleatum)、产黄青霉(Penicillium chrysogenum)、海洋γ变形菌(marine gammaproteobacterium)、丁酸产生菌(butyrate-producing bacterium)、伊文思奴卡菌、皮疽奴卡菌(Nocardia farcinica)、灰色链霉菌(Streptomyces griseus)、粟酒裂殖酵母菌(Schizosaccharomyces pombe)、热葡糖苷酶地芽孢杆菌、鼠伤寒沙门氏菌(Salmonellatyphimurium)、霍乱弧菌(Vibrio cholera)、幽门螺旋杆菌(Helicobacter pylori)、烟草(Nicotiana tabacum)、水稻(Oryza sativa)、地中海极嗜酯菌(Haloferaxmediterranei)、根癌土壤杆菌、反硝化无色杆菌(Achromobacter denitrificans)、具核梭杆菌、棒状链霉菌(Streptomyces clavuligerus)、鲍氏不动杆菌(Acinetobacterbaumanii)、家鼷鼠(Mus musculus)、克氏酵母菌(Lachancea kluyveri)、阴道滴虫(Trichomonas vaginalis)、布鲁氏锥虫(Trypanosoma brucei)、施氏假单胞菌、大豆根瘤菌(Bradyrhizobium japonicum)、百脉根中慢生根瘤菌(Mesorhizobium loti)、欧洲牛(Bos taurus)、粘性烟草(Nicotiana glutinosa)、创伤弧菌(Vibrio vulnificus)、反刍月形单胞菌(Selenomonas ruminantium)、肠炎弧菌(Vibrio parahaemolyticus)、闪烁古球菌(Archaeoglobus fulgidus)、死海嗜盐古细菌(Haloarcula marismortui)、嗜气热棒菌(Pyrobaculum aerophilum)、耻垢分枝杆菌MC2 155、鸟分枝杆菌副结核亚种K-10、海栖分枝杆菌M、微变冢村氏菌DSM 20162(Tsukamurella paurometabola DSM 20162)、蓝菌属PCC7001(Cyanobium PCC7001)、盘基网柄菌AX4(Dictyostelium discoideum AX4)，以及本文所揭示的其它物种(参见实例)。例如，具有4-HB、4-HBal、4-HBCoA、BDO或腐胺生物合成产生的微生物参考大肠杆菌和酵母菌宿主例示于本文中。然而，对于可用于目前超过550个物种(其中所述物种中超过一半可在诸如NCBI等公共数据库上获得)的完全基因组序列，包括395个微生物基因组和多种酵母菌、真菌、植物和哺乳动物基因组，在相关或远缘物种中的一或多个基因(包括(例如)已知基因的同源物、直系同源物、旁系同源物和非直系同源基因替换和生物体之间的遗传改变的互换)中鉴别编码必需的4-HB、4-HBal、4-HBCoA、BDO或腐胺生物合成活性的基因为相关技艺常规程序且熟知。因此，可将允许参考诸如大肠杆菌或酵母菌等特定生物体生物合成本文所述本发明4-HB、4-HBal、4-HBCoA、BDO或腐胺和其它化合物的代谢改变容易地应用于其它微生物，同样包括原核和真核生物体。鉴于本文所提供的教示和指导，所属领域技术人员应了解，以一种生物体例示的代谢改变同样可适用于其它生物体。

在一些情况下，例如在无关物种中存在替代4-HB、4-HBal、BDO或腐胺生物合成途径时，可通过(例如)外源性表达来自无关物种的一或多种旁系同源物使宿主物种具有4-HB、4-HBal、BDO或腐胺生物合成，所述旁系同源物催化类似但并不相同的代谢反应以置换所参考反应。由于在不同生物体之间存在某些代谢网络间差异，因此所属领域技术人员应理解，不同生物体之间的实际基因使用可能有所不同。然而，鉴于本文所提供的教示和指导，所属领域技术人员还应理解，本发明的教示和方法可应用于所有微生物，其中使用与那些本文所例示的代谢改变同类者在所关注物种中构筑将合成4-HB(例如单体4-HB)、4-HBal、BDO或腐胺的微生物。

宿主微生物可选自(例如)细菌、酵母菌、真菌或多种可适用于发酵工艺的其它微生物中的任一者和其中生成的非天然微生物生成。实例性细菌包括选自以下的任一物种：肠杆菌目(Enterobacteriales)，肠杆菌科(Enterobacteriaceae)，包括大肠杆菌属和克雷伯氏菌属；气单胞菌目(Aeromonadales)，琥珀酸弧菌科(Succinivibrionaceae)，包括厌氧性螺菌属(Anaerobiospirillum)；巴斯德菌目(Pasteurellales)，巴斯德菌科(Pasteurellaceae)，包括放线杆菌属(Actinobacillus)和曼氏杆菌属(Mannheimia)；根瘤菌目(Rhizobiales)，慢生根瘤菌科(Bradyrhizobiaceae)，包括根瘤菌属(Rhizobium)；芽孢杆菌目(Bacillales)，芽孢杆菌目科(Bacillaceae)，包括芽孢杆菌属；放线菌目(Actinomycetales)，棒杆菌科(Corynebacteriaceae)和链霉菌科(Streptomycetaceae)，分别包括棒杆菌属和链霉菌属(Streptomyces)；红螺菌目(Rhodospirillales)，乙酸杆菌科(Acetobacteraceae)，包括葡萄杆菌属(Gluconobacter)；鞘脂单胞菌目(Sphingomonadales)，鞘脂单胞菌科(Sphingomonadaceae)，包括发酵单胞菌属(Zymomonas)；乳酸杆菌目(Lactobacillales)，乳酸杆菌科(Lactobacillaceae)和链球菌科(Streptococcaceae)，分别包括乳酸杆菌属(Lactobacillus)和乳球菌属(Lactococcus)；梭菌目(Clostridiales)，梭菌科(Clostridiaceae)，梭菌属(Clostridium)；和假单胞菌目(Pseudomonadales)，假单胞菌科(Pseudomonadaceae)，包括假单胞菌属。宿主细菌的非限制性物种包括大肠杆菌、奥克西托克雷白杆菌、产琥珀酸厌氧性螺菌(Anaerobiospirillum succiniciproducens)、琥珀酸放线杆菌(Actinobacillussuccinogenes)、产琥珀酸曼氏杆菌(Mannheimiasucciniciproducens)、埃特里根瘤菌(Rhizobium etli)、枯草芽孢杆菌、谷氨酸棒杆菌、氧化葡萄杆菌(Gluconobacteroxydans)、运动发酵单胞菌、乳酸乳球菌、胚芽乳酸杆菌、天蓝色链霉菌(Streptomycescoelicolor)、丙酮丁醇梭菌、荧光假单胞菌和恋臭假单胞菌。

相似地，酵母菌或真菌的实例性物种包括选自以下的任何物种：酵母菌目(Saccharomycetales)，酵母菌科(Saccaromycetaceae)，包括酵母菌属(Saccharomyces)、克氏酵母菌(Kluyveromyces)和毕赤酵母菌属(Pichia)；酵母菌目，双足囊菌科(Dipodascaceae)，包括亚罗酵母菌属(Yarrowia)；裂殖酵母菌目(Schizosaccharomycetales)，裂殖酵母菌科(Schizosaccaromycetaceae)，包括裂殖酵母菌属(Schizosaccharomyces)；散囊菌目(Eurotiales)，发菌科(Trichocomaceae)，包括曲霉属(Aspergillus)；和毛霉菌目(Mucorales)，毛霉菌科(Mucoraceae)，包括根霉菌属(Rhizopus)。宿主酵母菌或真菌的非限制性物种包括啤酒酵母菌、粟酒裂殖酵母菌、乳酸克氏酵母菌、马克思克鲁维酵母菌(Kluyveromyces marxianus)、土曲霉、黑曲霉(Aspergillus niger)、巴斯德毕赤酵母菌(Pichia pastoris)、须根霉菌(Rhizopusarrhizus)、米根霉(Rhizopus oryzae)、解脂亚罗酵母菌(Yarrowia lipolytica)等等。大肠杆菌是特别有用的宿主生物体，这是因为其是经充分表征的适于遗传改造的微生物。其它特别有用的宿主生物体包括诸如啤酒酵母菌等酵母菌。应理解，可使用任一适宜的微生物宿主生物体来引入代谢和/或遗传修饰以产生所需产物。

可通过(例如)相关技艺所熟知的重组和检测方法来进行构筑和测试产生非天然4-HB、4-HBal、4-HBCoA、BDO或腐胺的宿主的表达水平的方法。所述方法可发现描述于例如桑布鲁克(Sambrook)等人，分子克隆：实验室手册，第三版，冷泉港实验室，纽约(2001)；奥苏贝尔(Ausubel)等人，分子生物学现行规范，约翰威利父子公司，巴尔的摩，马里兰州(1999)。4-HB和GBL可通过(例如)HPLC使用Spherisorb 5 ODS1管柱以及70％10mM磷酸酯缓冲液(pH＝7)和30％甲醇的移动相分离，并使用UV检测器在215nm下检测(轩尼诗(Hennessy)等人2004，法医学杂志(J.Forensic Sci.)46(6)：1-9)。BDO是通过气相色谱或通过HPLC和折射率检测器使用Aminex HPX-87H管柱和0.5mM硫酸的移动相检测(冈萨雷斯-帕胡埃洛(Gonzalez-Pajuelo)等人，代谢工程(Met.Eng.)7：329-336(2005))。

可使用相关技艺熟知技术将参与用于产生4-HB、4-HBal、4-HBCoA、BDO或腐胺的途径的外源性核酸序列稳定地或瞬时地引入宿主细胞中，所述技术包括(但不限于)偶联、电穿孔、化学转化、转导、转染和超声波转化。对于大肠杆菌或其它原核细胞中的外源性表达来说，真核核酸中的基因或cDNA的一些核酸序列可编码靶向信号，例如N端线粒体或另一靶向信号，如果需要，所述信号可在转化到原核宿主细胞中之前予以去除。例如，去除线粒体前导序列导致在大肠杆菌中的表达增加(霍夫迈斯特(Hoffmeister)等人，生物化学杂志280：4329-4338(2005))。对于酵母菌或其它真核细胞中的外源性表达来说，基因可在细胞溶胶中表达而不添加前导序列，或可通过添加适于宿主细胞的适宜靶向序列(例如线粒体靶向或分泌信号)靶向线粒体或其它细胞器，或靶向分泌。因此，应理解，可将核酸序列的用以去除或包括靶向序列的合适修饰纳入外源性核酸序列中以赋予所需性质。此外，可利用相关技艺熟知技术使基因经过密码子优化以实现蛋白质的优化表达。

一或多种表达载体可经构筑而具有一或多种4-HB、4-HBal、4-HBCoA、BDO或腐胺生物合成途径和/或如本文所例示一或多种生物合成编码核酸，所述核酸可操作地连接到在宿主生物体中具有功能的表达控制序列。表达载体可适用于本发明微生物宿主生物体，包括(例如)质粒、噬菌体载体、病毒载体、附加体和人工染色体，包括可操作用于稳定整合到宿主染色体中的载体和选择序列或标记物。另外，表达载体可包括一或多种可选标记物基因和合适的表达控制序列。还可包括可选标记物基因，其例如提供对抗生素或毒素的抗性，补充营养缺陷型不足，或供给培养基没有的关键营养素。表达控制序列可包括组成型和诱导型启动子、转录增强子、转录终止子等等为相关技艺所熟知者。当要共表达两种或更多种外源性编码核酸时，可将两种核酸插入(例如)单一表达载体或单独表达载体中。对于单一载体表达来说，编码核酸可以可操作地连接到一种常见表达控制序列或连接到不同表达控制序列，例如一种诱导型启动子和一种组成型启动子。参与代谢或合成途径的外源性核酸序列的转化可使用相关技艺熟知方法确认。所述方法包括(例如)对mRNA的核酸分析，例如北方墨点(Northern blot)或聚合酶链反应(PCR)扩增，或用于基因产物表达的免疫墨点法，或用以测试所引入核酸序列的表达或其对应基因产物的其它适宜分析方法。所属领域技术人员应理解，外源性核酸是以足以产生所需产物的量表达，并且应进一步理解，表达水平可使用为相关技艺熟知和如本文所揭示的方法经优化以获得足够表达。

使用如本文所例示为相关技艺熟知的方法来构筑本发明的非天然微生物以便以足以产生4-HB(例如单体4-HB)、4-HBal、4-HBCoA、BDO或腐胺的量外源性地表达至少一种编码4-HB、4-HBal、4-HBCoA、BDO或腐胺途径酶的核酸。应理解，在足以产生4-HB、4-HBal、4-HBCoA、BDO或腐胺的条件下培养本发明微生物。用于各途径中的4-HB、4-HBal、4-HBCoA、BDO或腐胺酶的实例性表达水平进一步描述于下文实例中。依照本文提供的教示和指导，本发明的非天然微生物可实现4-HB(例如单体4-HB)、4-HBal、4-HBCoA、BDO或腐胺的生物合成，从而使细胞内浓度介于约0.1-200mM或更高(例如，0.1-25mM或更高)之间。通常，4-HB(例如单体4-HB)、4-HBal、4-HBCoA、BDO或腐胺的细胞内浓度介于约3-150mM或更高(尤其约5-125mM或更高)之间，并且更特定来说介于约8-100mM(例如，约3-20mM)之间，尤其介于约5-15mM之间且更特定来说介于约8-12mM之间，包括约10mM、20mM、50mM、80mM或更高。介于所述实例性范围中每一者之间和高于所述范围的细胞内浓度还可从本发明的非天然微生物实现。在特定实施例中，本发明微生物、尤其诸如那些本文所揭示菌株等菌株(参见实例XII-XIX和表28)可通过增加4-HB、4-HBal、4-HBCoA、BDO或腐胺的产生和/或减少不需要的副产物来改良诸如4-HB、4-HBal、4-HBCoA、BDO或腐胺等所需产物的产生。所述产生量包括(但不限于)那些本文所揭示者且包括每升约1克到约25克，例如每升约2克、3克、4克、5克、6克、7克、8克、9克、10克、11克、12克、13克、14克、15克、16克、17克、18克、19克、20克、21克、22克、23克、24克或甚至更高量的产物。

除本文所揭示的培养和发酵条件以外，用于生物合成BDO、4-HB、4-HBCoA、4-HBal和/或腐胺的生长条件可包括将渗透保护剂添加到培养条件。在某些实施例中，本发明的非天然微生物可在渗透保护剂存在下如本文所述维持、培养或发酵。简单来说，渗透保护剂是指用作渗透物且有助于如本文所述微生物在渗透应力下存活的化合物。渗透保护剂包括(但不限于)甜菜碱、氨基酸和海藻糖。所述保护剂的非限制性实例是甘氨酸甜菜碱、果仁糖甜菜碱、二甲基噻亭、二甲基锍基丙酸酯、3-二甲基锍基-2-甲基丙酸酯、哌可酸(pipecolicacid)、二甲基锍基乙酸酯、胆碱、L-肉碱和四氢嘧啶(ectoine)。在一个方面中，渗透保护剂是甘氨酸甜菜碱。所属领域技术人员应理解，适于保护本文所述微生物对抗渗透应力的渗透保护剂的量和类型将取决于所用微生物。培养条件中的渗透保护剂的量可为(例如)不超过约0.1mM，不超过约0.5mM，不超过约1.0mM，不超过约1.5mM，不超过约2.0mM，不超过约2.5mM，不超过约3.0mM，不超过约5.0mM，不超过约7.0mM，不超过约10mM，不超过约50mM，不超过约100mM或不超过约500mM。

在一些实施例中，培养条件包括厌氧性或实质性厌氧性生长或维持条件。先前已描述实例性厌氧性条件且其为相关技艺所熟知。用于发酵工艺的实例性厌氧性条件描述于本文中且描述于例如2007年8月10日申请的美国公开案2009/0047719中。所述条件中的任一者都可与非天然微生物以及相关技艺熟知的其它厌氧性条件一起采用。在所述厌氧性条件或实质性厌氧性条件下，4-HB、4-HBal、4-HBCoA、BDO或腐胺产生者可以5-10mM或更高的细胞内浓度以及本文所例示的全部其它浓度合成4-HB、4-HBal、4-HBCoA、BDO或腐胺。应理解，即使上述说明是指细胞内浓度，4-HB、4-HBal、4-HBCoA、BDO或腐胺产生微生物仍可在细胞内产生4-HB、4-HBal、4-HBCoA、BDO或腐胺和/或将产物分泌到培养基中。

实例性发酵工艺包括(但不限于)分批补料发酵和分批分离；分批补料发酵和连续分离；以及连续发酵和连续分离。在实例性分批发酵方案中，使产生生物体在用合适气体吹扫的适宜大小的生物反应器中生长。在厌氧性条件下，用惰性气体或气体组合(例如，氮、N₂/CO₂混合物、氩、氦等等)吹扫培养物。当细胞生长并利用碳源时，以大约平衡碳源和/或营养素消耗的速率将额外碳源和/或其它营养素进料到生物反应器中。生物反应器的温度维持在所需温度下，通常在22-37℃范围内，但所述温度可维持在更高或更低温度下，这取决于产生生物体的生长特性和/或用于发酵工艺的所需条件。生长持续所需时期以实现发酵器中的培养物的所需特性，例如，细胞密度、产物浓度等等。在分批发酵工艺中，发酵时期通常在若干小时到若干天范围内，例如，8小时到24小时或1天、2天、3天、4天或5天，或最长一周，此取决于所需培养条件。可视需要控制或不控制pH，在这种情况下，不控制pH的培养物到运行结束时通常会降低到pH 3-6。在完成培养期后，可使发酵器内容物经过细胞分离单元，例如，离心机、过滤单元等等，以去除细胞和细胞碎片。在细胞内表达所需产物的情况下，可视需要在自发酵液分离细胞之前和之后以酶促或化学方式裂解或破坏细胞，以释放额外产物。可将发酵液转移到产物分离单元。通过相关技艺所用从稀水溶液分离所需产物的标准分离程序来分离产物。所述方法包括(但不限于)使用水不混溶有机溶剂(例如，甲苯或其它适宜溶剂，包括(但不限于)二乙醚、乙酸乙酯、四氢呋喃(THF)、二氯甲烷、氯仿、苯、戊烷、己烷、庚烷、石油醚、甲基叔丁基醚(MTBE)、二恶烷、二甲基甲酰胺(DMF)、二甲基亚砜(DMSO)等等)提供产物的有机溶液的液液萃取、标准蒸馏方法(如果合适)等等，这取决于发酵工艺产物的化学特性。

在实例性完全连续发酵方案中，通常首先使产生生物体以分批模式成长以实现所需细胞密度。当碳源和/或其它营养素耗尽时，以所需速率连续供应相同组成的进料培养基，并以相同速率取出发酵液。在所述条件下，生物反应器中的产物浓度以及细胞密度通常保持恒定。发酵器的温度维持在所需温度，如上文所论述。在连续发酵阶段期间，通常需要维持适宜pH范围以进行优化产生。可使用常规方法监测并维持pH，包括添加适宜酸或碱以维持所需pH范围。若视情况和需要，连续地操作生物反应器达延长时期，通常至少一周到若干周且最长一个月或更长。视需要周期性地监测(包括最多每天取样)发酵液和/或培养物，以确保产物浓度和/或细胞密度的一致性。在连续模式中，当供应新进料培养基时，不断地去除发酵器内容物。通常使含有细胞、培养基和产物的排出流经过连续产物分离程序，视需要去除或不去除细胞和细胞碎片。可使用相关技艺所用连续分离方法从稀水溶液分离产物，所述方法包括(但不限于)使用水不混溶有机溶剂(例如，甲苯或其它适宜溶剂，包括(但不限于)二乙醚、乙酸乙酯、四氢呋喃(THF)、二氯甲烷、氯仿、苯、戊烷、己烷、庚烷、石油醚、甲基叔丁基醚(MTBE)、二恶烷、二甲基甲酰胺(DMF)、二甲基亚砜(DMSO)等等)的连续液液萃取、标准连续蒸馏方法等等或相关技艺所熟知的其它方法。

在一些实施例中，碳原料和其它细胞吸收来源(例如磷酸酯、氨、硫酸酯、氯化物和其它卤素)可经选择以改变存在于4-HB、4-HBal、4-HBCoA、BDO或腐胺或任一4-HB、4-HBal、4-HBCoA、BDO或腐胺途径中间体中的原子的同位素分布。上文所列举的各种碳原料和其它吸收来源在本文中将统称为“吸收来源”。吸收来源可为存在于产物4-HB、4-HBal、4-HBCoA、BDO或腐胺或4-HB、4-HBal、4-HBCoA、BDO或腐胺途径中间体(包括于任一点偏离所述途径生成的任何4-HB、4-HBal、4-HBCoA、BDO或腐胺杂质)中的任一原子提供同位素富集。可实现任一靶原子的同位素富集，所述靶原子包括(例如)碳、氢、氧、氮、硫、硫、氯或其它卤素。

在一些实施例中，吸收来源可经选择以改变碳-12、碳-13和碳-14的比率。在一些实施例中，吸收来源可经选择以改变氧-16、氧-17和氧-18的比率。在一些实施例中，吸收来源可经选择以改变氢、氘和氚的比率。在一些实施例中，吸收来源可经选择改变氮-14和氮-15的比率。在一些实施例中，吸收来源可经选择以改变硫-32、硫-33、硫-34和硫-35的比率。在一些实施例中，吸收来源可经选择以改变磷-31、磷-32和磷-33的比率。在一些实施例中，吸收来源可经选择以改变氯-35、氯-36和氯-37的比率。

在一些实施例中，可通过选择一或多个吸收来源将靶原子的同位素比率变成所需比率。吸收来源可源自如在自然界中发现的天然来源或源自人造来源，并且所属领域技术人员可选择天然来源、人造来源或其组合，以实现靶原子的所需同位素比率。人造吸收来源的实例包括(例如)至少部分地源自化学合成反应的吸收来源。所述经同位素富集的吸收来源可商购或在实验室中制备和/或任选地与吸收来源的天然来源混合以实现所需的同位素比率。在一些实施例中，吸收来源的靶原子同位素比率可通过选择如在自然界中发现的所需吸收来源来实现。例如，如本文所论述，天然来源可为源自生物体或由其合成的生物性来源或诸如基于石油的产物或大气等来源。在一些所述实施例中，例如，碳源可选自化石燃料源碳源，其可相对缺乏碳-14；或环境或大气碳源，例如CO₂，其可比其石油源对等部分具有更大量的碳-14。

不稳定碳同位素碳-14或放射性碳大约占地球大气中碳原子的1/10¹²且具有约5700年的半衰期。通过涉及宇宙射线和普通氮(¹⁴N)的核反应来重新补足上层大气中的碳原料。化石燃料不含有碳-14，这是因为其在很早以前已衰变。燃烧化石燃料降低大气碳-14分数，也就是所谓的“苏斯效应(Suess effect)”。

测定化合物中原子的同位素比率的方法为所属领域技术人员所熟知。同位素富集可容易地通过质谱使用相关技艺已知技术评价，例如加速质谱(AMS)、稳定同位素比率质谱(SIRMS)和位点特异性天然同位素分馏-核磁共振(SNIF-NMR)。所述质谱技术可与诸如液相色谱(LC)、高效液相色谱(HPLC)和/或气相色谱等等等分离技术整合。

在碳的情况下，在美国由美国测试与材料协会(ASTM)国际(American Societyfor Testing and Materials(ASTM)International)研发ASTM D6866作为使用放射性碳定年来测定固体、液体和气体试样的生物性含量的标准化分析方法。所述标准是基于使用放射性碳定年来测定产物的生物性含量。ASTM D6866于2004年首次公布，并且所述标准的现行版本是ASTM D6866-11(2011年4月1日生效)。放射性碳定年技术为所属领域技术人员所熟知，包括那些本文所述者。

通过碳-14(¹⁴C)对碳-12(¹²C)的比率来估计化合物的生物性含量。具体来说，从以下表达式计算现代分数(Fraction Modern)(Fm)：Fm＝(S-B)/(M-B)，其中B、S和M分别代表空白、试样和现代参考的¹⁴C/¹²C比率。现代分数是试样的¹⁴C/¹²C比率与“现代”的偏差的量度。现代定义为正规化成6¹³C_VPDB＝-19/密耳的国家标准局(National Bureau ofStandards，NBS)草酸I(即，标准参考材料(SRM)4990b)的95％放射性碳浓度(AD 1950)。奥尔森(Olsson)，草酸作为标准品的使用(The use of Oxalic acid as a Standard.)，放射性碳变异和绝对年代(Radiocarbon Variations and Absolute Chronology)，诺贝尔研讨会(Nobel Symposium)，第12届，约翰威利父子公司，纽约(1970)。使用国际上商定的为正规化成6¹³C_VPDB＝-19/密耳的NBS草酸I(SRM 4990b)的比活性的0.95倍的定义来计算通过(例如)ASM测量的质谱结果。这等效于1.176±0.010×10^-12的绝对(AD 1950)¹⁴C/¹²C比率(卡伦(Karlen)等人，地球物理档案(Arkiv Geofysik)，4：465-471(1968))。标准计算考虑一种同位素相对于另一种的差异吸收，例如，生物系统优先吸收C¹²，其次是C¹³，再次是C¹⁴，并且这些校正反映为针对δ¹³校正的Fm。

草酸标准品(SRM 4990b或HOx 1)是从1955糖用甜菜(sugar beet)作物制得。尽管制得1000lbs，但这种草酸标准品不再能够商购。草酸II标准品(HOx 2；N.I.S.T名称SRM4990 C)是从1977法国甜菜糖蜜作物制得。在1980年代早期，12个实验室的团队测量了两个标准品的比率。草酸II对草酸I的活性比率是1.2933±0.001(加权平均值)。HOx II的同位素比率是千分之-17.8。ASTM D6866-11提出使用可得草酸II标准品SRM 4990C(Hox2)用于现代标准品(参见曼恩(Mann)，放射性碳(Radiocarbon)，25(2)：519-527(1983)中对原始草酸标准品对当前可用草酸标准品的论述)。Fm＝0％代表材料中完全缺乏碳-14原子，因此指示为化石(例如，基于石油)碳源。在针对1950年后注入核弹测试气氛中的碳-14进行校正后，Fm＝100％指示完全现代碳源。如本文所述，所述“现代”来源包括生物性来源。

如ASTM D6866中所述，由于导致碳-14显着富集于大气中的1950年代核测试计划的效应持续并减小，现代碳百分比(pMC)可大于100％，如ASTM D6866-11中所述。由于所有试样的碳-14活性都参照“投弹前”标准，并且由于几乎所有新生物性产物都是在投弹后环境中产生，因此所有pMC值(在针对同位素分数校正后)都必须乘以0.95(截至2010年)以更好地反映试样的真实生物性含量。生物性含量大于103％表明存在分析误差或生物性碳来源于若干年前。

ASTM D6866相对于材料的总有机物含量对生物性含量进行定量且不考虑存在的无机碳和其它不含碳物质。例如，基于ASTM D6866，50％基于淀粉的材料且50％水的产物会被视为生物性含量＝100％(50％有机物含量是100％生物性)。在另一实例中，50％基于淀粉的材料、25％基于石油和25％水的产物的生物性含量＝66.7％(75％有机物含量，但仅50％产物为生物性)。在另一实例中，50％是有机碳且是基于石油的产物的产物将被视为生物性含量＝0％(50％有机碳，但来自化石来源)。因此，基于用于测定化合物或材料的生物性含量的熟知方法和已知标准，所属领域技术人员可容易地测定生物性含量和/或利用具有所需生物性含量的本发明制备下游产物。

应用碳-14定年技术对材料的生物性含量进行定量为相关技艺已知(柯里(Currie)等人，物理学研究中的核仪器和方法B部分(Nuclear Instruments and Methodsin Physics Research B)，172：281-287(2000))。例如，碳-14定年已用于对含有对苯二甲酸酯的材料中的生物性含量进行定量(科隆纳(Colonna)等人，绿色化学(GreenChemistry)，13：2543-2548(2011))。值得注意地，源自可再生1，3-丙二醇和石油源对苯二甲酸的聚对苯二甲酸丙二酯(PPT)聚合物产生接近30％的Fm值(即，由于3/11的聚合碳源自可再生1，3-丙二醇且8/11来自化石终末成员对苯二甲酸)(柯里等人，见上文，2000)。相比之下，源自可再生1，4-丁二醇与可再生对苯二甲酸二者的聚对苯二甲酸丁二酯聚合物产生超过90％的生物性含量(科隆纳等人，见上文，2011)。

因此，在一些实施例中，本发明提供4-HB、4-HBal、4-HBCoA、BDO或腐胺或4-HB中间体、4-HBal中间体、4-HBCoA中间体、BDO中间体或腐胺中间体，其具有反映大气碳吸收来源的碳-12、碳-13和碳-14比率。例如，在一些方面中，4-HB、4-HBal、4-HBCoA、BDO或腐胺或4-HB中间体、4-HBal中间体、4-HBCoA中间体、BDO中间体或腐胺中间体的Fm值可为至少10％、至少15％、至少20％、至少25％、至少30％、至少35％、至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少98％或多达100％。在一些所述实施例中，吸收来源是CO₂。在一些实施例中，本发明提供4-HB、4-HBal、4-HBCoA、BDO或腐胺或4-HB中间体、4-HBal中间体、4-HBCoA中间体、BDO中间体或腐胺中间体，其具有反映基于石油的碳吸收来源的碳-12、碳-13和碳-14比率。在这个方面中，4-HB、4-HBal、4-HBCoA、BDO或腐胺或4-HB中间体、4-HBal中间体、4-HBCoA中间体、BDO中间体或腐胺中间体的Fm值可小于95％、小于90％、小于85％、小于80％、小于75％、小于70％、小于65％、小于60％、小于55％、小于50％、小于45％、小于40％、小于35％、小于30％、小于25％、小于20％、小于15％、小于10％、小于5％、小于2％或小于1％。在一些实施例中，本发明提供4-HB、4-HBal、4-HBCoA、BDO或腐胺或4-HB中间体、4-HBal中间体、4-HBCoA中间体、BDO中间体或腐胺中间体，其具有通过大气碳吸收来源与基于石油的吸收来源的组合获得的碳-12、碳-13和碳-14比率。使用吸收来源的所述组合是一种可改变碳-12、碳-13和碳-14比率的方式，并且相应比率将反映吸收来源的比例。

此外，本发明涉及以生物方式产生的如本文所揭示4-HB、4-HBal、4-HBCoA、BDO或腐胺或4-HB中间体、4-HBal中间体、4-HBCoA中间体、BDO中间体或腐胺中间体，并且涉及源自其的产物，其中4-HB、4-HBal、4-HBCoA、BDO或腐胺或4-HB中间体、4-HBal中间体、4-HBCoA中间体、BDO中间体或腐胺中间体具有与存于环境中的CO₂大致相同的值的碳-12、碳-13和碳-14同位素比率。例如，在一些方面中，本发明提供：生物衍生的4-HB、4-HBal、4-HBCoA、BDO或腐胺或生物衍生的4-HB中间体、4-HBal中间体、4-HBCoA中间体、BDO中间体或腐胺中间体，其具有与存于环境中的CO₂大致相同的值的碳-12对碳-13对碳-14同位素比率，或本文所揭示的任何其它比率。应理解，如本文所揭示，产物可具有与存于环境中的CO₂大致相同的值的碳-12对碳-13对碳-14同位素比率，或本文所揭示的任何比率，其中所述产物是从如本文所揭示生物衍生的4-HB、4-HBal、4-HBCoA、BDO或腐胺或生物衍生的4-HB中间体、4-HBal中间体、4-HBCoA中间体、BDO中间体或腐胺中间体生成，其中所述生物衍生的产物经化学修饰以生成最终产物。化学修饰4-HB、4-HBal、4-HBCoA、BDO或腐胺或其中间体的生物衍生的产物以生成所需产物的方法为所属领域技术人员所熟知，如本文所述。本发明进一步提供具有与存于环境中的CO₂大致相同的值的碳-12对碳-13对碳-14同位素比率的塑料、弹性纤维、聚氨酯、聚酯(包括聚羟基烷酸酯，例如聚-4-羟基丁酸酯(P4HB)或其共聚物)、聚(四亚甲基醚)二醇(PTMEG)(还称作PTMO、聚四亚甲基氧化物)、聚对苯二甲酸丁二酯(PBT)和聚氨酯-聚脲共聚物(称作spandex、elastane或Lycra^TM)、尼龙(nylon)等等，其中所述塑料、弹性纤维、聚氨酯、聚酯(包括聚羟基烷酸酯，例如聚-4-羟基丁酸酯(P4HB)或其共聚物)、聚(四亚甲基醚)二醇(PTMEG)(还称作PTMO、聚四亚甲基氧化物)、聚对苯二甲酸丁二酯(PBT)和聚氨酯-聚脲共聚物(称作spandex、elastane或Lycra^TM)和尼龙是直接从以下生成或与其组合：如本文所揭示的生物衍生的4-HB、4-HBal、4-HBCoA、BDO或腐胺或生物衍生的4-HB中间体、4-HBal中间体、4-HBCoA中间体、BDO中间体或腐胺中间体。

产物4-HB、4-HBal、4-HBCoA、BDO或腐胺是通常用于许多商业和工业应用的化学品。所述应用的非限制性实例包括产生塑料、弹性纤维、聚氨酯、聚酯(包括聚羟基烷酸酯，例如聚-4-羟基丁酸酯(P4HB)或其共聚物)、聚(四亚甲基醚)二醇(PTMEG)(还称作PTMO、聚四亚甲基氧化物)、聚对苯二甲酸丁二酯(PBT)和聚氨酯-聚脲共聚物(称作spandex、elastane或Lycra^TM)和尼龙。此外，4-HB、4-HBal、4-HBCoA、BDO或腐胺还用作产生众多种产物的原材料，所述产物包括塑料、弹性纤维、聚氨酯、聚酯(包括聚羟基烷酸酯，例如聚-4-羟基丁酸酯(P4HB)或其共聚物)、聚(四亚甲基醚)二醇(PTMEG)(还称作PTMO、聚四亚甲基氧化物)、聚对苯二甲酸丁二酯(PBT)和聚氨酯-聚脲共聚物(称作spandex、elastane或Lycra^TM)、尼龙。因此，在一些实施例中，本发明提供生物性塑料、弹性纤维、聚氨酯、聚酯(包括聚羟基烷酸酯，例如聚-4-羟基丁酸酯(P4HB)或其共聚物)、聚(四亚甲基醚)二醇(PTMEG)(还称作PTMO、聚四亚甲基氧化物)、聚对苯二甲酸丁二酯(PBT)和聚氨酯-聚脲共聚物(称作spandex、elastane或Lycra^TM)、尼龙，其包含一或多种由本发明非天然微生物产生或使用本文所揭示方法产生的生物衍生的4-HB、4-HBal、4-HBCoA、BDO或腐胺或生物衍生的4-HB中间体、4-HBal中间体、4-HBCoA中间体、BDO中间体或腐胺中间体。

本文所用术语“生物衍生的”意指源自生物体或由其合成，且因其可由生物体生成而可被视为可再生来源。所述生物体、尤其本文所揭示本发明微生物可利用从农业、植物、细菌或动物来源获得的原料或生物质，例如糖或碳水化合物。或者，生物体可利用大气碳。本文所用术语“生物性”意指完全或部分地由本发明生物衍生的化合物构成的上述产物。生物性或生物衍生的产物与石油源产物(其中所述产物是源自石油或石油化学原料或从其合成)不同。

在一些实施例中，本发明提供塑料、弹性纤维、聚氨酯、聚酯(包括聚羟基烷酸酯，例如聚-4-羟基丁酸酯(P4HB)或其共聚物)、聚(四亚甲基醚)二醇(PTMEG)(还称作PTMO、聚四亚甲基氧化物)、聚对苯二甲酸丁二酯(PBT)和聚氨酯-聚脲共聚物(称作spandex、elastane或Lycra^TM)、尼龙，其包含生物衍生的4-HB、4-HBal、4-HBCoA、BDO或腐胺或生物衍生的4-HB中间体、4-HBal中间体、4-HBCoA中间体、BDO中间体或腐胺中间体，其中所述生物衍生的4-HB、4-HBal、4-HBCoA、BDO或腐胺或生物衍生的4-HB中间体、4-HBal中间体、4-HBCoA中间体、BDO中间体或腐胺中间体包括用于产生塑料、弹性纤维、聚氨酯、聚酯(包括聚羟基烷酸酯，例如聚-4-羟基丁酸酯(P4HB)或其共聚物)、聚(四亚甲基醚)二醇(PTMEG)(还称作PTMO、聚四亚甲基氧化物)、聚对苯二甲酸丁二酯(PBT)和聚氨酯-聚脲共聚物(称作spandex、elastane或Lycra^TM)和尼龙的4-HB、4-HBal、4-HBCoA、BDO或腐胺或4-HB中间体、4-HBal中间体、4-HBCoA中间体、BDO中间体或腐胺中间体的全部或一部分。因此，在一些方面中，本发明提供生物性塑料、弹性纤维、聚氨酯、聚酯(包括聚羟基烷酸酯，例如聚-4-羟基丁酸酯(P4HB)或其共聚物)、聚(四亚甲基醚)二醇(PTMEG)(还称作PTMO、聚四亚甲基氧化物)、聚对苯二甲酸丁二酯(PBT)和聚氨酯-聚脲共聚物(称作spandex、elastane或Lycra^TM)和尼龙，其包含至少2％、至少3％、至少5％、至少10％、至少15％、至少20％、至少25％、至少30％、至少35％、至少40％、至少50％、至少60％、至少70％、至少80％、至少90％、至少95％、至少98％或100％如本文所揭示的生物衍生的4-HB、4-HBal、4-HBCoA、BDO或腐胺或生物衍生的4-HB中间体、4-HBal中间体、4-HBCoA中间体、BDO中间体或腐胺中间体。另外，在一些方面中，本发明提供生物性塑料、弹性纤维、聚氨酯、聚酯(包括聚羟基烷酸酯，例如聚-4-羟基丁酸酯(P4HB)或其共聚物)、聚(四亚甲基醚)二醇(PTMEG)(还称作PTMO、聚四亚甲基氧化物)、聚对苯二甲酸丁二酯(PBT)和聚氨酯-聚脲共聚物(称作spandex、elastane或Lycra^TM)和尼龙，其中用于其产生中的4-HB、4-HBal、4-HBCoA、BDO或腐胺或4-HB中间体、4-HBal中间体、4-HBCoA中间体、BDO中间体或腐胺中间体是生物衍生的与石油源4-HB、4-HBal、4-HBCoA、BDO或腐胺或4-HB中间体、4-HBal中间体、4-HBCoA中间体、BDO中间体或腐胺中间体的组合。例如，生物性塑料、弹性纤维、聚氨酯、聚酯(包括聚羟基烷酸酯，例如聚-4-羟基丁酸酯(P4HB)或其共聚物)、聚(四亚甲基醚)二醇(PTMEG)(还称作PTMO、聚四亚甲基氧化物)、聚对苯二甲酸丁二酯(PBT)和聚氨酯-聚脲共聚物(称作spandex、elastane或Lycra^TM)和尼龙可使用50％生物衍生的4-HB、4-HBal、4-HBCoA、BDO或腐胺和50％石油源4-HB、4-HBal、4-HBCoA、BDO或腐胺或其它所需比率(例如60％/40％、70％/30％、80％/20％、90％/10％、95％/5％、100％/0％、40％/60％、30％/70％、20％/80％、10％/90％的生物衍生的/石油源前体)产生，只要至少一部分产物包含由本文所揭示微生物产生的生物衍生的产物即可。应理解，使用本发明的生物衍生的4-HB、4-HBal、4-HBCoA、BDO或腐胺或生物衍生的4-HB中间体、4-HBal中间体、4-HBCoA中间体、BDO中间体或腐胺中间体产生塑料、弹性纤维、聚氨酯、聚酯(包括聚羟基烷酸酯，例如聚-4-羟基丁酸酯(P4HB)或其共聚物)、聚(四亚甲基醚)二醇(PTMEG)(还称作PTMO、聚四亚甲基氧化物)、聚对苯二甲酸丁二酯(PBT)和聚氨酯-聚脲共聚物(称作spandex、elastane或Lycra^TM)和尼龙的方法为相关技艺所熟知。

本发明另外提供培养基，其可为发酵液，包含生物衍生的4-羟基丁酸酯或1，4-丁二醇或本文所揭示其它产物，例如，4-HB、4-HBal、4-HBCoA、BDO或腐胺，其中所述生物衍生的产物具有反映大气二氧化碳吸收来源的碳-12、碳-13和碳-14同位素比率。所述培养基可包含由如本文所揭示的本发明微生物产生的生物衍生的产物，例如4-HB、4-HBal、4-HBCoA、BDO或腐胺。在一特定实施例中，可将培养基与具有4-HB、4-HBal、4-HBCoA、BDO或腐胺途径(例如，4-羟基丁酸酯或1，4-丁二醇途径)的非天然微生物分离。在另一实施例中，本发明提供由(例如)本发明微生物产生的生物衍生的4-HB、4-HBal、4-HBCoA、BDO或腐胺，例如，4-羟基丁酸酯或1，4-丁二醇，其具有反映大气二氧化碳吸收来源的碳-12、碳-13和碳-14同位素比率。在一特定实施例中，技术方案4的生物衍生的4-HB、4-HBal、4-HBCoA、BDO或腐胺(例如，4-羟基丁酸酯或1，4-丁二醇)的Fm值可为至少80％、至少85％、至少90％、至少95％或至少98％。本发明的所述生物衍生的产物可由如本文所揭示本发明的微生物或方法产生。

本发明进一步提供包含以下物质的组合物：生物衍生的4-HB、4-HBal、4-HBCoA、BDO或腐胺(例如，4-羟基丁酸酯或1，4-丁二醇)和除生物衍生的4-HB、4-HBal、4-HBCoA、BDO或腐胺(例如，4-羟基丁酸酯或1，4-丁二醇)以外的化合物。除生物衍生的产物以外的化合物可为具有4-HB、4-HBal、4-HBCoA、BDO或腐胺途径(例如，4-羟基丁酸酯或1，4-丁二醇途径)的本发明非天然微生物的细胞部分(例如，痕量细胞部分)，或在所述非天然微生物存在下产生的发酵液或培养基或其经纯化或部分纯化的部分。如本文所揭示，当由副产物形成减少的生物体产生时，所述组合物可包含(例如)减少量的副产物。所述组合物可包含(例如)生物衍生的4-HB、4-HBal、4-HBCoA、BDO或腐胺(例如，4-羟基丁酸酯或1，4-丁二醇)或本发明微生物的细胞溶解物或培养物上清液。

本发明另外提供包含生物性4-HB、4-HBal、4-HBCoA、BDO或腐胺的生物性产物，其中所述生物性产物是塑料、弹性纤维、聚氨酯、聚酯、聚羟基烷酸酯、聚-4-羟基丁酸酯(P4HB)或其共聚物、聚(四亚甲基醚)二醇(PTMEG)、聚对苯二甲酸丁二酯(PBT)、聚氨酯-聚脲共聚物或尼龙。在一个实施例中，生物性产物可包含至少5％、至少10％、至少20％、至少30％、至少40％或至少50％生物衍生的4-HB、4-HBal、4-HBCoA、BDO或腐胺，例如，4-羟基丁酸酯或1，4-丁二醇。在另一实施例中，一部分生物性产物可单独或与其它单体单元组合包含生物衍生的4-HB、4-HBal、4-HBCoA、BDO或腐胺(例如4-羟基丁酸酯或1，4-丁二醇)作为重复单元，以形成聚合物。在另一实施例中，本发明提供通过对诸如以下等生物性产物进行模制获得的模制产物：塑料、弹性纤维、聚氨酯、聚酯、聚羟基烷酸酯、聚-4-羟基丁酸酯(P4HB)或其共聚物、聚(四亚甲基醚)二醇(PTMEG)、聚对苯二甲酸丁二酯(PBT)、聚氨酯-聚脲共聚物或尼龙或如本文所揭示的其它产物。本发明进一步提供产生生物性产物的方法，其是通过使生物衍生的4-HB、4-HBal、4-HBCoA、BDO或腐胺(例如，4-羟基丁酸酯或1，4-丁二醇)与本身或另一化合物在产生所述生物性产物的反应中发生化学反应来实现。本发明的所述生物衍生的产物可由如本文所揭示本发明的微生物或方法产生。

培养条件可包括(例如)液体培养程序以及发酵和其它大规模培养程序。如本文所述，本发明生物合成产物的特别有用的产率可在厌氧性或实质性厌氧性培养条件下获得。

如本文所述，一种用于实现4-HB、4-HBal、4-HBCoA、BDO或腐胺的生物合成的实例性生长条件包括厌氧性培养或发酵条件。在某些实施例中，本发明的非天然微生物可在厌氧性或实质性厌氧性条件下维持、培养或发酵。简单来说，厌氧性条件是指无氧环境。实质性厌氧性条件包括(例如)使得培养基中的溶解氧浓度保持在介于0与10％饱和之间的培养、分批发酵或连续发酵。实质性厌氧性条件还包括在维持有小于1％氧的气氛的密封室内部在液体培养基中或在固体琼脂上生长或静置细胞。氧的百分比可通过(例如)用N₂/CO₂混合物或一或多种其它适宜的非氧气体吹扫培养物来维持。

本发明还提供非天然微生物生物催化剂，包括具有4-羟基丁酸(4-HB)和1，4-丁二醇(BDO)生物合成途径的微生物，所述途径包括至少一种编码以下酶的外源性核酸：4-羟基丁酸脱氢酶、非CoA依赖性琥珀酸半醛脱氢酶、琥珀酰基-CoA合成酶、CoA依赖性琥珀酸半醛脱氢酶、4-羟基丁酸酯：CoA转移酶、谷氨酸酯：琥珀酸半醛转氨酶、谷氨酸脱羧酶、非CoA依赖性醛脱氢酶、CoA依赖性醛脱氢酶或醇脱氢酶，其中所述外源性核酸是以足以产生1，4-丁二醇(BDO)的量来表达。4-羟基丁酸酯：CoA转移酶还称为4-羟基丁酰基CoA：乙酰基-CoA转移酶。本文还揭示其它4-HB或BDO途径酶(参见实例和图8-13)。

本发明进一步提供非天然微生物生物催化剂，包括具有4-羟基丁酸(4-HB)和1，4-丁二醇(BDO)生物合成途径的微生物，所述途径包括至少一种编码以下酶的外源性核酸：4-羟基丁酸脱氢酶、琥珀酰基-CoA合成酶、CoA依赖性琥珀酸半醛脱氢酶、4-羟基丁酸酯：CoA转移酶、4-丁酸激酶、磷酸转丁酰基酶、α-酮戊二酸脱羧酶、醛脱氢酶、醇脱氢酶或醛/醇脱氢酶，其中所述外源性核酸是以足以产生1，4-丁二醇(BDO)的量来表达。

还可生成生物合成BDO的非天然微生物。与本发明的产生4-HB的微生物一样，产生BDO的微生物还可在细胞内产生或将BDO分泌到培养基中。依照先前提供用于构筑合成4-HB的微生物的教示和指导，可将其它BDO途径纳入产生4-HB的微生物中以生成还合成BDO和其它BDO家族化合物的生物体。已知BDO和其下游产物的化学合成。能够进行BDO生物合成的本发明的非天然微生物使用4-HB作为如图1中所图解说明的进入点避开所述化学合成。如下文所进一步描述，例如，还可使用4-HB产生者来将4-HB化学转变为GBL且随后转变为BDO或THF。或者，4-HB产生者可经进一步遗传修饰以包括将4-HB和/或GBL转变为BDO的生物合成能力。

引入4-HB产生者的其它BDO途径包括(例如)在图1步骤9-13中例示的一或多种酶在宿主缺陷背景中的外源性表达或过表达。一种所述途径包括(例如)进行如图1中的步骤9、12和13所示的反应所必需的酶活性，其中醛脱氢酶和醇脱氢酶可为单独酶或具有醛脱氢酶和醇脱氢酶活性二者的多功能酶。另一所述途径包括(例如)进行如图1中步骤10、11、12和13所示的反应所必需的酶活性，同样其中醛脱氢酶和醇脱氢酶可为单独酶或具有醛脱氢酶和醇脱氢酶活性二者的多功能酶。因此，要引入4-HB产生者中的其它BDO途径包括(例如)以下一或多种酶在宿主缺陷背景中的外源性表达或过表达：4-羟基丁酸酯：CoA转移酶、丁酸激酶、磷酸转丁酰基酶、非CoA依赖性醛脱氢酶、CoA依赖性醛脱氢酶或醇脱氢酶。在不存在能够修饰4-HB的内源性酰基-CoA合成酶时，产生BDO的非天然微生物可进一步包括对4-HB具有选择性的外源性酰基-CoA合成酶或具有多种将4-HB转变为4-HB-CoA作为净反应的酶的组合。如下文实例中所进一步例示，丁酸激酶和磷酸转丁酰基酶展现BDO途径活性且催化图1中所图解说明对4-HB底物的转变。因此，这些酶在本文中还可分别称作4-羟基丁酸激酶和磷酸转羟基丁酰基酶。

可用于所述从4-HB活体内转变为BDO的实例性醇脱氢酶和醛脱氢酶列示于下表1中。

表1.用于将4-HB转变为BDO的醇脱氢酶和醛脱氢酶.

本文揭示其它实例性酶和途径(参见实例)。此外，应理解，可利用酶来进行底物并非天然底物的反应。尽管非天然底物的活性可低于天然底物，但应理解，可以天然形式或使用定向进化或适应性进化修饰的形式利用所述酶，如本文所揭示(也参见实例)。

经由本文所揭示任一途径的BDO产生部分地基于对用于将前体转变为BDO的合适酶的鉴别。已鉴别出诸多用于若干反应步骤的特异性酶。对于那些未鉴别出对反应前体具有特异性的酶的转化来说，已鉴别出最适于催化反应步骤的酶候选物。已显示，酶对众多种底物起作用，如下文所论述。另外，即使并非天然底物，蛋白质改造领域的进展也使得改变酶以有效地作用于底物仍然可行。下文描述来自多种类别的适于BDO途径的广谱特异性酶以及已用于进化酶以作用于非天然底物的方法的若干实例。

BDO途径中关键酶类别是使酮或醛与醇互变的氧化还原酶(1.1.1)。这个类别中的诸多实例性酶可对众多种底物起作用。据显示，从土壤细菌短杆菌(Brevibacterium sp)KU1309纯化的醇脱氢酶(1.1.1.1)(希拉诺(Hirano)等人，生物科学与生物工程杂志(J.Biosc.Bioeng.)100：318-322(2005))以高活性对众多脂肪族醇以及芳香醇起作用。表2显示所述酶对不同醇的活性和其K_m。所述酶是可逆的且还对若干醛具有极高活性(表3)。

表2.来自短杆菌KU的醇脱氢酶氧化各种醇的相对活性.

*以对应于19.2U/mg的2-苯基乙醇的活性为100％。

表3.来自短杆菌KU 1309的醇脱氢酶还原各种羰基化合物的相对活性.

来自富养产碱菌的乳酸脱氢酶(1.1.1.27)是已证实对若干2-氧代酸(例如2-氧代丁酸酯、2-氧代戊酸酯和2-氧代戊二酸酯(C5化合物，类似于2-氧代己二酸酯))具有高活性的另一酶(斯泰因比歇尔(Steinbuchel)和施莱格尔(Schlegel)，欧洲生物化学杂志130：329-334(1983))。表4中的第2栏显示来自富养产碱菌(以前为A.eutrophus)的ldhA对不同底物的活性(斯泰因比歇尔和施莱格尔，见上文，1983)。

表4.富养产碱菌ldhA对不同底物的活体外活性(斯泰因比歇尔和施莱格尔，见上文，1983)且与对丙酮酸酯的活性进行比较.

已显示可将2-氧代酸转变为其酰基-CoA对等部分(1.2.1)的氧化还原酶还可接受多种底物。例如，支链2-酮酸脱氢酶复合物(BCKAD，还称作2-氧代异戊酸脱氢酶(1.2.1.25))参与支链氨基酸降解途径，将缬氨酸、亮氨酸和异亮氨酸的2-氧代酸衍生物转变为其酰基-CoA衍生物和CO₂。在包括褐鼠(帕克斯顿(Paxton)等人，生物化学杂志(Biochem.J.)234：295-303(1986))和啤酒酵母菌(辛克莱(Sinclair)等人，国际生物化学与分子生物学(Biochem.Mol Biol.Int.)32：911-922(1993)在内的一些有机体中，已显示，这种复合物具有宽受质范围，包括直链氧代酸，例如2-氧代丁酸酯和α-酮戊二酸酯，以及支链氨基酸前体。

已报道，另一酶类别(也就是氨基转移酶(2.6.1))的成员作用于多种底物。已从强烈火球菌(Pyrococcus fursious)鉴别出天冬氨酸酯氨基转移酶(aspAT)，使其在大肠杆菌中表达并对重组蛋白质进行表征以证实所述酶对天冬氨酸酯和α-酮戊二酸酯具有最高活性，而对丙氨酸、谷氨酸酯和芳香族氨基酸具有较低但仍显着的活性(沃德(Ward)等人，古细菌(Archaea)133-141(2002))。在另一情况下，报道从墨西哥利什曼原虫(Leishmaniamexicana)鉴别且在大肠杆菌中表达的氨基转移酶(弗纳尔(Vernal)等人，欧洲微生物学会联合会微生物学快报(FEMS Microbiol.Lett.)229：217-222(2003))分别对酪氨酸(对酪氨酸的活性视为100％)、苯丙氨酸(90％)、色氨酸(85％)、天冬氨酸酯(30％)、亮氨酸(25％)和甲硫氨酸(25％)具有广泛底物特异性(弗纳尔等人，分子与生化寄生虫学(Mol.Biochem.Parasitol)96：83-92(1998))。已报道来自克鲁斯锥虫(Trypanosomacruzi)的酪氨酸氨基转移酶的相似的广谱特异性，即使这些酶都仅具有6％的序列同源性。后一酶可接受亮氨酸、甲硫氨酸以及酪氨酸、苯基丙氨酸、色氨酸和丙氨酸作为有效氨基供体(诺维茨基(Nowicki)等人，生物化学与生物物理学报(Biochim.Biophys.Acta)1546：268-281(2001))。

已显示，CoA转移酶(2.8.3)具有作用于一种以上底物的能力。具体来说，CoA转移酶是从丙酮丁醇梭菌纯化且报道其对乙酸酯、丙酸酯和丁酸酯具有最高活性。其对戊酸酯、异丁酸酯和巴豆酸酯也具有显着活性(魏森博恩(Wiesenborn)等人，应用与环境微生物学(Appl.Environ.Microbiol.)55：323-329(1989))。在另一研究中，已显示，大肠杆菌酶酰基-CoA：乙酸酯-CoA转移酶(还称作乙酸酯-CoA转移酶(EC 2.8.3.8))将CoA从多种具支链和直链酰基-CoA底物部分转移到乙酸酯，所述底物包括异丁酸酯(马蒂斯(Matthies)和申克(Schink)，应用与环境微生物学58：1435-1439(1992))、戊酸酯(范德温克尔(Vanderwinkel)等人，生物化学与生物物理学研究通讯(Biochem.Biophys.Res Commun.)33：902-908(1968b))和丁酸酯(范德温克尔等人，生物化学与生物物理学研究通讯33：902-908(1968a)。

其它酶类别另外支持酶的广泛底物特异性。还已证明，一些异构酶(5.3.3)对多种底物起作用。例如，来自施氏假单胞菌的L-鼠李糖异构酶催化各种醛糖与酮糖之间的异构化(吉田(Yoshida)等人，分子生物学杂志365：1505-1516(2007))。这些异构化包括以下糖之间的异构化：L-鼠李糖与L-鼠李树胶糖、L-甘露糖与L-果糖、L-木糖与L-木酮糖、D-核糖与D-核酮糖以及D-阿洛糖与D-阿洛酮糖。

在另一酶类别中，发现磷酸转移酶(2.7.1)(来自大肠杆菌的高丝氨酸激酶(2.7.1.39)将L-高丝氨酸转变为L-高丝氨酸磷酸酯)将诸多高丝氨酸类似物磷酸化。在这些底物中，R位的羧基官能团已由酯或由羟基甲基置换(霍(Huo)和维奥拉(Viola)，生物化学35：16180-16185(1996))。表5显示这种激酶的广泛底物特异性。

表5.高丝氨酸激酶的底物特异性.

可用于BDO途径的另一酶类别是酸-硫醇连接酶(6.2.1)。与其它类别中的酶一样，已确定这个类别中的某些酶具有广泛底物特异性。例如，已证实来自恋臭假单胞菌的酰基CoA连接酶对若干脂肪族底物(包括乙酸、丙酸、丁酸、戊酸、己酸、庚酸和辛酸)且对诸如苯乙酸和苯氧乙酸等芳香族化合物起作用(费尔南德斯-瓦沃德(Fernandez-Valverde)等人，应用与环境微生物学59：1149-1154(1993))。来自三叶草根瘤菌(Rhizobium trifolii)的相关酶丙二酰基CoA合成酶(6.3.4.9)可将若干二酸(也就是丙二酸乙酯、丙二酸丙基酯、丙二酸烯丙基酯、丙二酸异丙基酯、丙二酸二甲酯、丙二酸环丙基酯、丙二酸环丙基亚甲基酯、丙二酸环丁基酯和丙二酸苯甲基酯)转变为其相应单硫酯(波尔(Pohl)等人，美国化学学会会志(J.Am.Chem.Soc.)123：5822-5823(2001))。相似地，还已发现脱羧酶(4.1.1)具有宽底物范围。丙酮酸酯脱羧酶(PDC)(还称为酮酸脱羧酶)是醇发酵中的关键酶，催化丙酮酸酯脱羧成乙醛。从啤酒酵母菌分离的酶对包括2-酮丁酸酯、2-酮戊酸酯和2-苯基丙酮酸酯在内的脂肪族2-酮酸具有宽底物范围(李(Li)和乔丹(Jordan)，生物化学38：10004-10012(1999))。相似地，苯甲酰基甲酸酯脱羧酶具有宽底物范围且已成为酶改造研究的目标。已对来自恋臭假单胞菌的酶进行深入研究，并且可获得这种酶的晶体结构(波洛夫尼科娃(Polovnikova)等人，生物化学42：1820-1830(2003)；哈森(Hasson)等人，生物化学37：9918-9930(1998))。已显示，支链α-酮酸脱羧酶(BCKA)作用于链长度在3到6个碳之间变化的多种化合物(奥(Oku)和金田(Kaneda)，生物化学杂志263：18386-18396(1998)；斯米茨(Smit)等人，应用与环境微生物学71：303-311(2005b))。已就多种具支链和直链底物对乳酸乳球菌中的酶进行表征，所述底物包括2-氧代丁酸酯、2-氧代己酸酯、2-氧代戊酸酯、3-甲基-2-氧代丁酸酯、4-甲基-2-氧代丁酸酯和异己酸酯(斯米茨等人，应用与环境微生物学71：303-311(2005a)。

有趣的是，还已报道，已知具有一种主导活性的酶催化极不相同的功能。例如，已知，来自嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)和枯草芽孢杆菌的依赖辅因子的磷酸甘油酸酯变位酶(5.4.2.1)还作为磷酸酶发挥功能(里格登(Rigden)等人，蛋白质科学10：1835-1846(2001))。已知，来自嗜热脂肪芽孢杆菌的酶对若干底物具有活性，所述底物包括3-磷酸甘油酸酯、α-萘基磷酸酯、对硝基苯基磷酸酯、AMP、果糖-6-磷酸酯、核糖-5-磷酸酯和CMP。

与这些其中酶天然具有广泛底物特异性的实例不同，已使用定向进化对诸多酶进行修饰以拓宽其对其非天然底物的特异性。或者，还已使用定向进化来改变酶的底物偏好。因此，改造给定酶对天然底物(例如，改良效率)或非天然底物(例如，增加效率)的有效功能是可行的。例如，已报道，显着改良来自绣色假单胞菌的脂肪酶的对映选择性(雷茨(Reetz)等人，应用化学国际英文版(Agnew.Chem.Int.Ed Engl.)36：2830-2832(1997))。这种酶水解仅具有2％有利于(S)-酸的对映异构体过量(ee)的2-甲基癸酸对硝基苯基酯。然而，在4轮易错诱变和筛选后，产生催化具有81％ee的必需反应的变体(雷茨等人，应用化学国际英文版36：2830-2832(1997))。

已使用定向进化方法来修饰酶以对非天然底物阵列发挥功能。通过对活性位点附近的氨基酸残基进行随机处理来拓宽绣色假单胞菌中的脂肪酶的底物特异性。这允许这种酶接受α-取代羧酸酯(雷茨等人，应用化学国际英文版44：4192-4196(2005))。在对酶的另一成功的修饰中，采用DNA改组来产生接受β-支链底物的大肠杆菌氨基转移酶，所述底物不太为野生型酶所接受(矢野(Yano)等人，美国国家科学院院刊(Proc.Nat.Acad.Sci.US.A.)95：5511-5515(1998))。具体来说，在4轮改组结束时，天冬氨酸酯氨基转移酶对缬氨酸和2-氧代缬氨酸的活性增加最多5个数量级，而对天然底物天冬氨酸酯的活性降低最少29/30。最近，使用算法来设计可用于催化非天然和非生物底物4-羟基-4-(6-甲氧基-2-萘基)-2-丁酮中的碳-碳键断裂的逆醛缩酶(江(Jiang)等人，科学319：1387-1391(2008))。这些算法使用4个不同催化基序的不同组合来设计新酶，并且所选用于实验表征的设计中有20个相对于未催化反应具有4倍改良率(江等人，科学319：1387-1391(2008))。因此，所述改造方式不仅能够扩大酶可作用的底物阵列，并且其还允许设计并构筑极有效的酶。例如，据报道，DNA改组方法(在瞬时模板或RACHITT上进行随机嵌合生长(chimeragenesis))产生对复合物底物的脱硫率有所改良且对非天然底物的转变快20倍的经改造单加氧酶(科科(Coco)等人，自然生物技术(Nat.Biotechnol.)19：354-359(2001))。相似地，迟钝型突变磷酸丙糖异构酶的比活性从1.3倍改良最多19倍(赫尔墨斯(Hermes)等人，美国国家科学院院刊87：696-700 1990))。比活性的这种增强是通过在全长蛋白质内使用随机诱变来实现且可将改良追溯到6个氨基酸残基中的突变。

还已在若干研究中证实蛋白质改造方式改变酶对所需底物的底物特异性的有效性。通过改变靠近活性位点的残基来修饰来自嗜热栖热菌的异丙基苹果酸脱氢酶，以使得其现在可作用于作为底物的苹果酸酯和D-乳酸酯(藤田(Fujita)等人，生物科学、生物技术与生物化学(Biosci.Biotechnol.Biochem.)65：2695-2700(2001))。在这个研究以及其它研究中，已指出，一或几个残基可经遗传修饰以改变底物特异性。例如，改变假定底物结合区中的单一氨基酸的二氢黄酮醇4-还原酶可优先还原二氢山萘酚(约翰逊(Johnson)等人，植物杂志(Plant.J.)25：325-333(2001))。通过改变活性位点中的一个残基使来自大肠杆菌的极特异性异柠檬酸酯脱氢酶的底物特异性从异柠檬酸酯变成异丙基苹果酸酯(多伊勒(Doyle)等人，生物化学40：4234-4241(2001))。相似地，通过改变几个靠近N末端的残基将依赖NAD⁺的1，5-羟基前列腺素脱氢酶的辅因子特异性变成NADP⁺(曹(Cho)等人，生物化学与生物物理学文献(Arch.Biochem.Biophys.)419：139-146(2003))。使用序列分析和分子建模分析来鉴别修饰的关键残基，进一步通过定点诱变来研究所述关键残基。

存在横跨多种酶类别的诸多实例，其中改变酶的功能以相对于所述酶的天然底物偏好一种非天然底物。通过DNA改组和筛选在大肠杆菌中从半乳糖苷酶进化岩藻糖苷酶(张(Zhang)等人，美国国家科学院院刊94：4504-4509(1997))。相似地，使用同源性建模和定点诱变将来自大肠杆菌的天冬氨酸酯氨基转移酶转变为酪氨酸氨基转移酶(奥努佛(Onuffer)和基尔希(Kirsch)，蛋白质科学，4：1750-1757(1995))。据报道，来自恋臭假单胞菌的苯甲酰基甲酸酯脱羧酶的两个残基活性位点的定点诱变改变对天然和非天然底物的亲和力(Km)(西格特(Siegert)等人，蛋白质工程、设计与选择(Protein Eng Des Sel)18：345-357(2005))。使来自啤酒酵母菌的细胞色素c过氧化物酶(CCP)经过定向分子进化以生成对经典过氧化物酶底物愈创木酚的活性增加的突变体，由此将CCP的底物特异性从蛋白质细胞色素c变成小有机分子。在3轮DNA改组和筛选后，分离出相对于对天然底物对愈创木酚的活性增加300倍且对此底物的特异性增加最多1000倍的突变体(伊夫兰德(Iffland)等人，生物化学39：10790-10798(2000))。

在一些情况下，已获得底物偏好不同于任一亲本酶的酶。例如，通过改组来自两种细菌类产碱假单胞菌(Pseudomonas pseudoalcaligenes)和洋葱伯霍尔德杆菌(Burkholderia cepacia)的基因来改良联苯双加氧酶介导的多氯化联苯的降解(隈丸(Kumamaru)等人，自然生物技术16：663-666(1998))。所得嵌合联苯加氧酶显示不同于两种亲本酶的底物偏好，并且增强对原本为所述酶的差底物的相关联苯化合物和单一芳香族环烃(例如甲苯和苯)的降解活性。

除改变酶特异性以外，还可增强对底物的活性，所述酶天然对所述受体具有低活性。一项研究证实，可通过随机诱变显着改良具有广泛底物特异性(尤其对赖氨酸、精氨酸、丙氨酸、丝氨酸、甲硫氨酸、半胱氨酸、亮氨酸和组氨酸)，但对色氨酸活性较低的来自恋臭假单胞菌的氨基酸消旋酶(基诺(Kino)等人，应用微生物学与生物技术(Appl.Microbiol.Biotechnol.)73：1299-1305(2007))。相似地，牛BCKAD的活性位点经改造以偏好替代底物乙酰基-CoA(孟(Meng)和庄(Chuang)，生物化学33：12879-12885(1994))。这些方式的一个有趣方面是即使已应用随机方法来生成这些具有有效活性的突变酶，仍可鉴别赋予活性改良的确切突变或结构改变。例如，在上述研究中，将促进改良对色氨酸的活性的突变追溯到两个不同位置。

还已使用定向进化来表达难以表达的蛋白质。例如，通过使辣根过氧化物酶经过随机诱变和基因重组，鉴别出活性为野生型14倍以上的突变体(林(Lin)等人，生物技术进展(Biotechnol.Prog.)15：467-471(1999))。

定向进化的另一实例显示酶可接受为了实现一范围的所需功能的广泛修饰。使来自嗜热脂肪芽孢杆菌的酶乳酸脱氢酶经过定点诱变，并且于相信决定对不同羟酸的特异性的位点进行3个氨基酸取代(克拉克(Clarke)等人，生物化学与生物物理学研究通讯(Biochem.Biophys.Res.Commun.)148：15-23(1987))。在所述突变后，相对于丙酮酸酯对草酰乙酸酯的特异性增加到500，这与野生型酶不同，所述野生型酶相对于草酰乙酸酯对丙酮酸酯的催化特异性为1000。使用定点诱变进一步改造这种酶以对支链取代的丙酮酸酯具有活性(威尔克斯(Wilks)等人，生物化学29：8587-8591(1990))。具体来说，所述酶对α-酮异己酸酯的K_cat改良55倍。在相同酶中进行三种结构修饰以将其底物特异性从乳酸酯变成苹果酸酯。所述酶对苹果酸酯具有高活性和特异性(威尔克斯等人，科学242：1541-1544(1988))。随后对来自嗜热脂肪芽孢杆菌的相同酶进行改造以对具有带正电侧链的α-酮酸(例如那些含有铵基者)具有高催化活性(霍根(Hogan)等人，生物化学34：4225-4230(1995))。于所述酶的102位引入酸性氨基酸的突变体偏好结合所述侧链铵基。所得结果证明，所述突变体显示对ω-氨基-α-酮酸底物的k_cat/K_m值改良最高25倍。有趣的是，这种酶还在结构上经遗传修饰以作为苯基乳酸脱氢酶代替乳酸脱氢酶发挥功能(威尔克斯等人，生物化学31：7802-78061992)。将限制位点引入所述酶的基因中，所述酶允许切除所述基因区域。这个区域编码多肽的移动表面环(残基98-110)，所述环通常密封活性位点隔绝大量溶剂且是底物特异性的主要决定因素。插入长度和序列可变的环，以生成具有改变的底物特异性的羟酸脱氢酶。通过构成一个更长的环，对丙酮酸酯的活性降低到百万分之一，但对苯基丙酮酸酯的活性基本上没有改变。实现390,000倍的特异性转换(k_cat/K_m)。这种酶对苯基丙酮酸酯相对于丙酮酸酯的1700∶1选择性是苯基乳酸脱氢酶中所需。上述研究指示，可使用各种酶改造方式来获得用于如本文所揭示BDO途径的酶。

如本文所揭示，可利用从诸多中心代谢中间体实现1，4-丁二醇的生物合成途径，所述中间体包括乙酰基-CoA、琥珀酰基-CoA、α-酮戊二酸酯、谷氨酸酯、4-氨基丁酸酯和高丝氨酸。乙酰基-CoA、琥珀酰基-CoA和α-酮戊二酸酯是三羧酸(TCA)循环的常见中间体，所述循环是以整体形式存在于利用氧进行细胞呼吸的几乎所有活细胞中且以截短形式存在于诸多厌氧性生物体中的一系列反应。谷氨酸酯是经由谷氨酸脱氢酶或诸多转氨反应中的任一者源自α-酮戊二酸酯的氨基酸(参见图8B)。4-氨基丁酸酯可通过谷氨酸酯的脱羧(参见图8B)或从乙酰乙酰基-CoA经由图9C中所揭示途径形成。乙酰乙酰基-CoA是借助乙酰基-辅酶A乙酰基转移酶或等效地乙酰乙酰基-辅酶A硫解酶源自两个乙酰基-CoA分子的缩合。高丝氨酸是苏氨酸和甲硫氨酸代谢中的中间体，其是经由天冬氨酸酯从草酰乙酸酯形成。草酰乙酸酯转变为高丝氨酸需要一个NADH、两个NADPH和一个ATP。

还可采用除那些上文所例示途径外的途径在非天然微生物中生成BDO的生物合成。在一个实施例中，生物合成可使用实现BDO途径的L-高丝氨酸实现(参见图13)。这种途径具有0.90mol/mol葡萄糖的摩尔产率，其似乎受还原当量的利用率限制。第二种途径从乙酰乙酰基-CoA合成BDO且能够实现1.091mol/mol葡萄糖的最大理论产率(参见图9)。任一途径的实施方案都可通过将两种外源性酶引入诸如大肠杆菌等宿主生物体中来实现，并且两种途径都可另外经由琥珀酰基-CoA来补充BDO产生。下文进一步描述途径酶、热力学、理论产率和总体可行性。

高丝氨酸途径还可经改造以生成产生BDO的微生物。高丝氨酸是苏氨酸和甲硫氨酸代谢中的中间体，其是经由天冬氨酸酯从草酰乙酸酯形成。草酰乙酸酯转变为高丝氨酸需要一个NADH、两个NADPH和一个ATP(图2)。在形成后，高丝氨酸进料到用于苏氨酸与甲硫氨酸二者的生物合成途径中。在多数生物体中，高水平的苏氨酸或甲硫氨酸反馈而阻抑高丝氨酸生物合成途径(卡斯皮(Caspi)等人，核酸研究(Nucleic Acids Res.)34：D511-D516(1990))。

高丝氨酸转化成4-羟基丁酸酯(4-HB)可在如本文所述两个酶促步骤中实现。这个途径的第一步骤是通过推定氨裂解酶将高丝氨酸脱氨。在步骤2中，由推定还原酶以一个NADH的代价将产物烯烃4-羟基丁-2-烯酸酯还原成4-HB。然后可将4-HB转变为BDO。

本文揭示可用于催化上述转化的酶。例如，所述途径的步骤1中的氨裂解酶极其类似于天冬氨酸酯氨裂解酶(天冬氨酸酶)的化学性质。天冬氨酸酶是广泛分布于微生物中的酶，并且已进行深入表征(维奥拉，R.E.，分子生物学(Mol.Biol.)74：295-341(2008))。已解析大肠杆菌天冬氨酸酶的晶体结构(史(Shi)等人，生物化学36：9136-9144(1997))，因此，可直接改造所述酶的活性位点的突变，这会改变其底物特异性以包括高丝氨酸。在大肠杆菌TCA循环中，步骤2中的氧化还原酶具有类似于若干充分表征的酶(包括延胡索酸酯还原酶)的化学性质。由于此反应的热力学高度有利，因此具有广泛底物特异性的内源性还原酶将可能能够还原4-羟基丁-2-烯酸酯。这个途径在厌氧性条件下的产率是0.9mol BDO/mol葡萄糖。

发现，琥珀酰基-CoA途径因其更能量有效的事实而具有更高产率。一个草酰乙酸酯分子经由高丝氨酸途径转变为BDO将需要消耗2当量ATP。由于假定PEP羧基激酶可逆，将葡萄糖转变为两个草酰乙酸酯分子可生成最多3个ATP分子，因此葡萄糖经由高丝氨酸总体转变为BDO具有负能量产率。如所预计，如果假定可经由呼吸生成能量，那么高丝氨酸途径的最大产率增加到1.05mol/mol葡萄糖，这是琥珀酰基-CoA途径产率的96％。琥珀酰基-CoA途径可引导一些碳通量经过丙酮酸脱氢酶和TCA循环的氧化支路以生成还原当量与琥珀酰基-CoA二者，而不消耗能量。因此，其由于并未将全部通量都引导经过草酰乙酸酯到琥珀酰基-CoA到BDO，而不会遇到与高丝氨酸途径相同的能量困难。总之，高丝氨酸途径显示实现BDO的高产率路径。

乙酰乙酸酯途径还可经改造以生成产生BDO的微生物。乙酰乙酸酯可通过参与脂肪酸代谢的酶(包括乙酰基-CoA乙酰基转移酶和乙酰乙酰基-CoA转移酶)从乙酰基-CoA形成。经由乙酰乙酸酯的生物合成路径也特别可用于可代谢诸如一氧化碳、二氧化碳或甲醇等单碳化合物的微生物以形成乙酰基-CoA。

可使用从乙酰乙酰基-CoA到4-氨基丁酸酯的三步骤路径(参见图9C)经由乙酰乙酰基-CoA合成BDO。可将4-氨基丁酸酯转变为琥珀酸半醛，如图8B中所示。可在三个还原步骤后将琥珀酸半醛(其是一个从琥珀酰基-CoA去除的还原步骤或一个从α-酮戊二酸酯去除的脱羧步骤)转变为BDO(图1)。简单来说，这个途径的步骤1涉及通过(例如)由atoA和atoD基因编码的大肠杆菌乙酰乙酰基-CoA转移酶将乙酰乙酰基-CoA转变为乙酰乙酸酯(哈奈(Hanai)等人，应用与环境微生物学73：7814-7818(2007))。乙酰乙酰基-CoA生物途径的步骤2需要通过ω-氨基转移酶将乙酰乙酸酯转变为3-氨基丁酸酯。使来自反硝化产碱杆菌(Alcaligens denitrificans)的ω-氨基酸：丙酮酸酯氨基转移酶(ω-APT)在大肠杆菌中过表达且其显示在活体外对3-氨基丁酸酯具有高活性(尹(Yun)等人，应用与环境微生物学70：2529-2534(2004))。

在步骤2中，推定氨基变位酶将氨基从碳主链的3位移位到4位。对3-氨基丁酸酯进行这种功能的氨基变位酶尚未进行表征，但来自史迪克兰梭菌的酶具有极相似的机制。D-赖氨酸-5，6-氨基变位酶参与赖氨酸生物合成。

从乙酰乙酰基-CoA到BDO的合成路径经过4-氨基丁酸酯，即大肠杆菌中通常从谷氨酸酯脱羧形成的代谢物。在形成后，可通过4-氨基丁酸转氨酶(2.6.1.19)(即已进行生物化学表征的酶)将4-氨基丁酸酯转变为琥珀酸半醛。

关于选择这个途径中的候选酶的一个考虑因素是参与步骤2和3的酶的立体选择性。反硝化产碱杆菌中的ω-ABT对3-氨基丁酸酯的L-立体异构物具有特异性，而D-赖氨酸-5，6-氨基变位酶可能需要D-立体异构物。如果最初并未发现或改造具有互补立体选择性的酶，那么可将第三种酶添加到所述途径，所述第三种酶具有可将L-3-氨基丁酸酯转变为D-3-氨基丁酸酯的消旋酶活性。尽管氨基酸消旋酶分布广泛，但不了解所述酶是否可对ω-氨基酸发挥功能。

这个途径在厌氧性条件下的最大理论摩尔产率是1.091mol/mol葡萄糖。为了生成从乙酰乙酰基-CoA到BDO的通量，必需假定，乙酰基-CoA：乙酰乙酰基-CoA转移酶是可逆的。这种酶在大肠杆菌中的功能是通过首先将短链脂肪酸转变为硫酯来代谢所述短链脂肪酸。

尽管乙酰基-CoA：乙酰乙酰基-CoA转移酶在消耗乙酸酯的方向上的运作尚未在大肠杆菌中进行实验证实，但对其它生物体中相似酶的研究支持此反应不可逆的假定。肠道微生物罗氏菌(Roseburia sp.)和普拉梭菌(F.prasnitzii)中的酶丁酰基-CoA：乙酸酯：CoA转移酶在乙酸酯利用方向上作用以产生丁酸酯(邓肯(Duncan)等人，应用与环境微生物学68：5186-5190(2002))。布鲁氏锥虫中另一极相似的酶乙酰基：琥珀酸CoA-转移酶还在乙酸酯利用方向上作用。此反应具有接近平衡的Δ_rxnG，因此高浓度乙酸酯可以目标方向驱动反应。在1.09mol/mol葡萄糖的最大理论BDO生产率下，模拟预测，大肠杆菌可生成1.098molATP/mol葡萄糖，而无发酵副产物。此ATP产率对于细胞生长、维持和产生应足够。乙酰乙酰基-CoA生物途径是从乙酰基-CoA实现BDO的高产率路径。

因此，除先前所例示用于在所选宿主中建立4-HB生物合成的各种修饰中的任一者外，产生BDO的微生物还可包括4-HB途径代谢修饰的任一先前组合和排列，以及非CoA依赖性醛脱氢酶、CoA依赖性醛脱氢酶或醇脱氢酶或本文所揭示用以生成GBL和/或BDO的生物合成途径的其它酶的表达的任一组合。因此，本发明的BDO产生者可具有(例如)对应于本文所揭示任一4-HB途径酶和/或任一者BDO途径酶的一种、两种、三种、四种、五种、六种、七种、八种、九种或最多全部酶的外源性表达。

经遗传修饰的微生物的设计和构筑是使用实现足以产生BDO的表达量的相关技艺熟知的方法来进行。特定来说，本发明的非天然微生物可实现BDO的生物合成，使细胞内浓度介于约0.1-200mM或更高之间，介于例如约0.1-25mM或更高之间，如上文所论述。例如，BDO的细胞内浓度介于约3-20mM之间，尤其介于约5-15mM之间且更特定来说介于约8-12mM之间，包括约10mM或更高。介于所述实例性范围中每一者之间和高于其的细胞内浓度还可从本发明的非天然微生物实现。与4-HB产生者一样，BDO产生者还可在厌氧性条件下维持、培养或发酵。

本发明进一步提供产生4-HB的方法。所述方法包括在实质性厌氧性条件下将具有4-羟基丁酸(4-HB)生物合成途径的非天然微生物培养足以产生单体4-羟基丁酸(4-HB)的时间，所述途径包含至少一种编码以下酶的外源性核酸：4-羟基丁酸脱氢酶、非CoA依赖性琥珀酸半醛脱氢酶、琥珀酰基-CoA合成酶、CoA依赖性琥珀酸半醛脱氢酶、谷氨酸酯：琥珀酸半醛转氨酶、α-酮戊二酸脱羧酶或谷氨酸脱羧酶。所述方法另外可包括(例如)4-HB到GBL和到BDO或THF的化学转变。

另外提供产生4-HB的方法。所述方法包括在实质性厌氧性条件下将具有4-羟基丁酸(4-HB)生物合成途径的非天然微生物培养足以产生单体4-羟基丁酸(4-HB)的时间，所述途径包括至少一种编码以下酶的外源性核酸：4-羟基丁酸脱氢酶、琥珀酰基-CoA合成酶、CoA依赖性琥珀酸半醛脱氢酶或α-酮戊二酸脱羧酶。4-HB产物可分泌到培养基中。

进一步提供产生BDO的方法。所述方法包括将非天然微生物生物催化剂或微生物培养足以产生1，4-丁二醇(BDO)的时间，所述微生物包含具有4-羟基丁酸(4-HB)和1，4-丁二醇(BDO)生物合成途径的微生物，所述途径包括至少一种编码以下酶的外源性核酸：4-羟基丁酸脱氢酶、琥珀酰基-CoA合成酶、CoA依赖性琥珀酸半醛脱氢酶、4-羟基丁酸酯：CoA转移酶、4-羟基丁酸激酶、磷酸转羟基丁酰基酶、α-酮戊二酸脱羧酶、醛脱氢酶、醇脱氢酶或醛/醇脱氢酶。BDO产物可分泌到培养基中。

另外提供通过培养本发明的具有BDO途径的非天然微生物来产生BDO的方法。所述BDO途径可包含至少一种编码BDO途径酶的外源性核酸，所述外源性核酸以足以产生BDO的量来表达，所述表达是在一定条件下进行足以产生BDO的时间，所述BDO途径包含4-氨基丁酸CoA转移酶、4-氨基丁酰基-CoA水解酶、4-氨基丁酸酯-CoA连接酶、4-氨基丁酰基-CoA氧化还原酶(脱氨)、4-氨基丁酰基-CoA转氨酶或4-羟基丁酰基-CoA脱氢酶(参见实例VII和表17)。

或者，BDO途径可包含至少一种编码BDO途径酶的外源性核酸，所述外源性核酸以足以产生BDO的量来表达，所述表达是在一定条件下进行足以产生BDO的时间，所述BDO途径包含4-氨基丁酸CoA转移酶、4-氨基丁酰基-CoA水解酶、4-氨基丁酸酯-CoA连接酶、4-氨基丁酰基-CoA还原酶(形成醇)、4-氨基丁酰基-CoA还原酶、4-氨基丁-1-醇脱氢酶、4-氨基丁-1-醇氧化还原酶(脱氨)或4-氨基丁-1-醇转氨酶(参见实例VII和表18)。

另外，本发明提供产生BDO的方法，包含将具有BDO途径的非天然微生物在条件下培养足以产生BDO的时间，所述途径包含至少一种编码BDO途径酶的外源性核酸，所述外源性核酸以足以产生BDO的量来表达，所述BDO途径包含4-氨基丁酸激酶、4-氨基丁醛脱氢酶(磷酸化)、4-氨基丁-1-醇脱氢酶、4-氨基丁-1-醇氧化还原酶(脱氨)、4-氨基丁-1-醇转氨酶、[(4-氨基丁酰基)氧基]膦酸氧化还原酶(脱氨)、[(4-氨基丁酰基)氧基]膦酸转氨酶、4-羟基丁酰基-磷酸酯脱氢酶或4-羟基丁醛脱氢酶(磷酸化)(参见实例VII和表19)。

本发明进一步提供产生BDO的方法，包含将具有BDO途径的非天然微生物在条件下培养足以产生BDO的时间，所述途径包含至少一种编码BDO途径酶的外源性核酸，所述外源性核酸以足以产生BDO的量来表达，所述BDO途径包含α-酮戊二酸酯5-激酶、2，5-二氧代戊酸半醛脱氢酶(磷酸化)、2，5-二氧代戊酸还原酶、α-酮戊二酸CoA转移酶、α-酮戊二酰基-CoA水解酶、α-酮戊二酰基-CoA连接酶、α-酮戊二酰基-CoA还原酶、5-羟基-2-氧代戊酸脱氢酶、α-酮戊二酰基-CoA还原酶(形成醇)、5-羟基-2-氧代戊酸脱羧酶或5-羟基-2-氧代戊酸脱氢酶(脱羧)(参见实例VIII和表20)。

本发明另外提供产生BDO的方法，包含将具有BDO途径的非天然微生物在条件下培养足以产生BDO的时间，所述途径包含至少一种编码BDO途径酶的外源性核酸，所述外源性核酸以足以产生BDO的量来表达，所述BDO途径包含谷氨酸CoA转移酶、谷氨酰基-CoA水解酶、谷氨酰基-CoA连接酶，谷氨酸酯5-激酶、谷氨酸酯-5-半醛脱氢酶(磷酸化)、谷氨酰基-CoA还原酶，谷氨酸酯-5-半醛还原酶、谷氨酰基-CoA还原酶(形成醇)、2-氨基-5-羟基戊酸氧化还原酶(脱氨)、2-氨基-5-羟基戊酸转氨酶、5-羟基-2-氧代戊酸脱羧酶、5-羟基-2-氧代戊酸脱氢酶(脱羧)(参见实例IX和表21)。

本发明另外包括产生BDO的方法，包含将具有BDO途径的非天然微生物在条件下培养足以产生BDO的时间，所述途径包含至少一种编码BDO途径酶的外源性核酸，所述外源性核酸以足以产生BDO的量来表达，所述BDO途径包含3-羟基丁酰基-CoA脱氢酶、3-羟基丁酰基-CoA脱水酶、乙烯基乙酰基-CoAΔ-异构酶或4-羟基丁酰基-CoA脱水酶(参见实例X和表22)。

还提供产生BDO的方法，包含将具有BDO途径的非天然微生物在条件下培养足以产生BDO的时间，所述途径包含至少一种编码BDO途径酶的外源性核酸，所述外源性核酸以足以产生BDO的量来表达，所述BDO途径包含高丝氨酸脱氨酶、高丝氨酸CoA转移酶、高丝氨酸-CoA水解酶、高丝氨酸-CoA连接酶、高丝氨酸-CoA脱氨酶、4-羟基丁-2-烯酰基-CoA转移酶、4-羟基丁-2-烯酰基-CoA水解酶、4-羟基丁-2-烯酰基-CoA连接酶、4-羟基丁-2-烯酸酯还原酶、4-羟基丁酰基-CoA转移酶、4-羟基丁酰基-CoA水解酶、4-羟基丁酰基-CoA连接酶或4-羟基丁-2-烯酰基-CoA还原酶(参见实例XI和表23)。

本发明另外提供产生BDO的方法，包含将具有BDO途径的非天然微生物在条件下培养足以产生BDO的时间，所述途径包含至少一种编码BDO途径酶的外源性核酸，所述外源性核酸以足以产生BDO的量来表达，所述BDO途径包含琥珀酰基-CoA还原酶(形成醇)、4-羟基丁酰基-CoA水解酶、4-羟基丁酰基-CoA连接酶、4-羟基丁醛脱氢酶(磷酸化)。所述途径可进一步包含琥珀酰基-CoA还原酶、4-羟基丁酸脱氢酶、4-羟基丁酰基-CoA转移酶、4-羟基丁酸激酶、磷酸转-4-羟基丁酰基酶、4-羟基丁酰基-CoA还原酶、4-羟基丁酰基-CoA还原酶(形成醇)或1，4-丁二醇脱氢酶。

还提供产生BDO的方法，包含将具有BDO途径的非天然微生物在条件下培养足以产生BDO的时间，所述途径包含至少一种编码BDO途径酶的外源性核酸，所述外源性核酸以足以产生BDO的量来表达，所述BDO途径包含谷氨酸脱氢酶、4-氨基丁酸酯氧化还原酶(脱氨)、4-氨基丁酸转氨酶、谷氨酸脱羧酶、4-羟基丁酰基-CoA水解酶、4-羟基丁酰基-CoA连接酶、4-羟基丁醛脱氢酶(磷酸化)。

本发明另外提供使用本文所揭示经遗传修饰的生物体产生所需产物的方法，所述生物体允许通过增加产物或减少不需要的副产物来改良产生例如BDO等所需产物。因此，本发明提供产生1，4-丁二醇(BDO)的方法，包含将本文所揭示的非天然微生物在条件下培养足以产生BDO的时间。在一个实施例中，本发明提供使用非天然微生物(包含具有1，4-丁二醇(BDO)途径的微生物)产生BDO的方法，所述途径包含至少一个编码BDO途径酶的外源性核酸，所述外源性核酸以足以产生BDO的量来表达。在一个实施例中，微生物经遗传修饰以表达外源性琥珀酰基-CoA合成酶(参见实例XII)。例如，琥珀酰基-CoA合成酶可由大肠杆菌sucCD基因编码。

在又一实施例中，微生物经遗传修饰以破坏编码好氧性呼吸控制调节系统的基因(参见实例XV)。例如，破坏可针对arcA基因。所述生物体可进一步包含破坏编码苹果酸脱氢酶的基因。在又一实施例中，微生物经遗传修饰以表达对NADH不敏感的外源性柠檬酸合成酶(参见实例XV)。例如，对NADH不敏感的柠檬酸合成酶可由gltA(例如gltA的R163L突变体)编码。在又一实施例中，微生物经遗传修饰以表达外源性磷酸烯醇丙酮酸酯羧基激酶(参见实例XVI)。例如，磷酸烯醇丙酮酸酯羧基激酶可由流感嗜血杆菌磷酸烯醇丙酮酸酯羧基激酶基因编码。应理解，可类似地使用具有合适修饰的本文所例示用于改良BDO产生的菌株，以产生其它所需产物，例如，4-羟基丁酸酯或本文所揭示其它所需产物。

本发明另外提供通过培养包含4-羟基丁醛途径的非天然微生物来产生4-羟基丁醛的方法，所述途径包含至少一种编码4-羟基丁醛途径酶的外源性核酸，所述外源性核酸以足以产生4-羟基丁醛的量来表达，所述4-羟基丁醛途径包含琥珀酰基-CoA还原酶(形成醛)；4-羟基丁酸脱氢酶；和4-羟基丁酸还原酶(参见图58，步骤A-C-D)。本发明还提供通过培养包含4-羟基丁醛途径的非天然微生物来产生4-羟基丁醛的方法，所述途径包含至少一种编码4-羟基丁醛途径酶的外源性核酸，所述外源性核酸以足以产生4-羟基丁醛的量来表达，所述4-羟基丁醛途径包含α-酮戊二酸脱羧酶；4-羟基丁酸脱氢酶；和4-羟基丁酸还原酶(图58，步骤B-C-D)。

本发明进一步提供通过培养包含4-羟基丁醛途径的非天然微生物来产生4-羟基丁醛的方法，所述途径包含至少一种编码4-羟基丁醛途径酶的外源性核酸，所述外源性核酸以足以产生4-羟基丁醛的量来表达，所述4-羟基丁醛途径包含琥珀酸还原酶；4-羟基丁酸脱氢酶和4-羟基丁酸还原酶(参见图62，步骤F-C-D)。在另一实施例中，本发明提供通过培养包含4-羟基丁醛途径的非天然微生物来产生4-羟基丁醛的方法，所述途径包含至少一种编码4-羟基丁醛途径酶的外源性核酸，所述外源性核酸以足以产生4-羟基丁醛的量来表达，所述4-羟基丁醛途径包含α-酮戊二酸脱羧酶或谷氨酸脱氢酶或谷氨酸转氨酶和谷氨酸脱羧酶和4-氨基丁酸脱氢酶或4-氨基丁酸转氨酶；4-羟基丁酸脱氢酶；和4-羟基丁酸还原酶(参见图62，步骤B或((J或K)-L-(M或N))-C-D)。

本发明还提供通过培养包含4-羟基丁醛途径的非天然微生物来产生4-羟基丁醛的方法，所述途径包含至少一种编码4-羟基丁醛途径酶的外源性核酸，所述外源性核酸以足以产生4-羟基丁醛的量来表达，所述4-羟基丁醛途径包含α-酮戊二酸还原酶；5-羟基-2-氧代戊酸脱氢酶；和5-羟基-2-氧代戊酸脱羧酶(参见图62，步骤X-Y-Z)。本发明进一步提供通过培养包含4-羟基丁酰基-CoA途径的非天然微生物来产生4-羟基丁酰基-CoA的方法，所述途径包含至少一种编码4-羟基丁酰基-CoA途径酶的外源性核酸，所述外源性核酸以足以产生4-羟基丁酰基-CoA的量来表达，所述4-羟基丁酰基-CoA途径包含α-酮戊二酸还原酶；5-羟基-2-氧代戊酸脱氢酶；和5-羟基-2-氧代戊酸脱氢酶(脱羧)(参见图62，步骤X-Y-AA)。

本发明另外提供通过培养包含腐胺途径的非天然微生物来产生腐胺的方法，所述途径包含至少一种编码腐胺途径酶的外源性核酸，所述外源性核酸以足以产生腐胺的量来表达，所述腐胺途径包含琥珀酸还原酶；4-氨基丁酸脱氢酶或4-氨基丁酸转氨酶；4-氨基丁酸还原酶；和腐胺脱氢酶或腐胺转氨酶(参见图63，步骤F-M/N-C-D/E)。在又一实施例中，本发明提供通过培养包含腐胺途径的非天然微生物来产生腐胺的方法，所述途径包含至少一种编码腐胺途径酶的外源性核酸，所述外源性核酸以足以产生腐胺的量来表达，所述腐胺途径包含α-酮戊二酸脱羧酶；4-氨基丁酸脱氢酶或4-氨基丁酸转氨酶；4-氨基丁酸还原酶；和腐胺脱氢酶或腐胺转氨酶(参见图63，步骤B-M/N-C-D/E)。本发明另外提供通过培养包含腐胺途径的非天然微生物来产生腐胺的方法，所述途径包含至少一种编码腐胺途径酶的外源性核酸，所述外源性核酸以足以产生腐胺的量来表达，所述腐胺途径包含谷氨酸脱氢酶或谷氨酸转氨酶；谷氨酸脱羧酶；4-氨基丁酸还原酶；和腐胺脱氢酶或腐胺转氨酶(参见图63，步骤J/K-L-C-D/E)。

本发明在另一实施例中提供一种通过培养包含腐胺途径的非天然微生物来产生腐胺的方法，所述途径包含至少一种编码腐胺途径酶的外源性核酸，所述外源性核酸以足以产生腐胺的量来表达，所述腐胺途径包含α-酮戊二酸还原酶；5-氨基-2-氧代戊酸脱氢酶或5-氨基-2-氧代戊酸转氨酶；5-氨基-2-氧代戊酸脱羧酶；和腐胺脱氢酶或腐胺转氨酶(参见图63，步骤O-P/Q-R-D/E)。还提供一种通过培养包含腐胺途径的非天然微生物来产生腐胺的方法，所述途径包含至少一种编码腐胺途径酶的外源性核酸，所述外源性核酸以足以产生腐胺的量来表达，所述腐胺途径包含α-酮戊二酸还原酶；5-氨基-2-氧代戊酸脱氢酶或5-氨基-2-氧代戊酸转氨酶；鸟氨酸脱氢酶或鸟氨酸转氨酶；和鸟氨酸脱羧酶(参见图63，步骤O-P/Q-S/T-U)。应理解，可使用包含本文所揭示任一途径的微生物来产生所需产物或中间体，包括4-HB、4-HBal、BDO或腐胺。

应理解，在本发明方法中，可将一或多种外源性核酸中的任一者引入微生物中以产生本发明的非天然微生物。可引入核酸以使微生物具有(例如)4-HB、BDO、THF或GBL生物合成途径。或者，可引入编码核酸以产生具有生物合成能力的中间体微生物以催化一些所需反应以赋予4-HB、BDO、THF或GBL生物合成能力。例如，具有4-HB生物合成途径的非天然微生物可包含至少两种编码所需酶的外源性核酸，所需酶是(例如)以下的组合：4-羟基丁酸脱氢酶和α-酮戊二酸脱羧酶；4-羟基丁酸脱氢酶和非CoA依赖性琥珀酸半醛脱氢酶；4-羟基丁酸脱氢酶和CoA依赖性琥珀酸半醛脱氢酶；CoA依赖性琥珀酸半醛脱氢酶和琥珀酰基-CoA合成酶；琥珀酰基-CoA合成酶和谷氨酸脱羧酶等等。因此，应理解，在本发明的非天然微生物中可包括两种或更多种生物合成途径酶的任一组合。相似地，应理解，在本发明的非天然微生物中可视需要包括三种或更多种生物合成途径酶的任一组合，例如，4-羟基丁酸脱氢酶、α-酮戊二酸脱羧酶和CoA依赖性琥珀酸半醛脱氢酶；非CoA依赖性琥珀酸半醛脱氢酶和琥珀酰基-CoA合成酶；4-羟基丁酸脱氢酶、CoA依赖性琥珀酸半醛脱氢酶和谷氨酸酯：琥珀酸半醛转氨酶等等，只要所需生物合成途径酶的组合可产生相应所需产物即可。

相似地，例如，对于任一或多种经引入以赋予BDO产生的外源性核酸来说，具有BDO生物合成途径的非天然微生物可包含至少两种编码所需酶的外源性核酸，所需酶是(例如)以下的组合：4-羟基丁酸脱氢酶和α-酮戊二酸脱羧酶；4-羟基丁酸脱氢酶和4-羟基丁酰基CoA：乙酰基-CoA转移酶；4-羟基丁酸脱氢酶和丁酸激酶；4-羟基丁酸脱氢酶和磷酸转丁酰基酶；4-羟基丁酰基CoA：乙酰基-CoA转移酶和醛脱氢酶；4-羟基丁酰基CoA：乙酰基-CoA转移酶和醇脱氢酶；4-羟基丁酰基CoA：乙酰基-CoA转移酶和醛/醇脱氢酶、4-氨基丁酸酯-CoA转移酶和4-氨基丁酰基-CoA转氨酶；4-氨基丁酸激酶和4-氨基丁-1-醇氧化还原酶(脱氨)等等。因此，应理解，在本发明的非天然微生物中可包括两种或更多种生物合成途径酶的任一组合。相似地，应理解，在本发明的非天然微生物中可包括三种或更多种生物合成途径酶的任一组合，例如，4-羟基丁酸脱氢酶、α-酮戊二酸脱羧酶和4-羟基丁酰基CoA：乙酰基-CoA转移酶；4-羟基丁酸脱氢酶，丁酸激酶和磷酸转丁酰基酶；4-羟基丁酸脱氢酶、4-羟基丁酰基CoA：乙酰基-CoA转移酶和醛脱氢酶；4-羟基丁酰基CoA：乙酰基-CoA转移酶、醛脱氢酶和醇脱氢酶；丁酸激酶，磷酸转丁酰基酶和醛/醇脱氢酶；4-氨基丁酰基-CoA水解酶、4-氨基丁酰基-CoA还原酶和4-氨基丁-1-醇转氨酶；3-羟基丁酰基-CoA脱氢酶、3-羟基丁酰基-CoA脱水酶和4-羟基丁酰基-CoA脱水酶等等。相似地，在本发明的非天然微生物中可视需要包括如本文所揭示四种、五种或更多种生物合成途径酶的任一组合，只要所需生物合成途径酶的组合可产生相应所需产物即可。

本文所述任一非天然微生物可经培养以产生和/或分泌本发明的生物合成产物。例如，4-HB产生者可经培养用于生物合成产生4-HB。4-HB可如下文所述经分离或处理以生成GBL、THF和/或BDO。相似地，BDO产生者可经培养用于生物合成产生BDO。BDO可经分离或经过进一步处理用于化学合成BDO家族化合物，如本文所揭示。因此，本发明提供使用本发明微生物产生所需产物(例如4-HB、4-HBal、4-HBCoA、BDO或腐胺，例如，4-HB或BDO)的方法。任选地，可应用纯化或分离步骤，例如蒸馏，以纯化诸如4-HB、4-HBal、4-HBCoA、BDO或腐胺等产物，例如，4-羟基丁酸酯或1，4-丁二醇。因此，本发明还提供通过以下步骤产生诸如4-HB、4-HBal、4-HBCoA、BDO或腐胺等经分离或纯化产物(例如，4-羟基丁酸酯或1，4-丁二醇)的方法：将本发明的非天然微生物在条件下培养足以产生诸如4-HB、4-HBal、4-HBCoA、BDO或腐胺等产物(例如，4-羟基丁酸酯或1，4-丁二醇)的时间，和分离或纯化所述产物。分离或纯化可包含诸如蒸馏等步骤。

生长培养基可包括(例如)可向非天然微生物供给碳源的任一碳水化合物来源。所述来源包括(例如)糖，例如葡萄糖、蔗糖、木糖、阿拉伯糖、半乳糖、甘露糖、果糖和淀粉；或甘油，并且应理解，碳源可单独用作唯一碳源或与本文所述或相关技艺已知其它碳源组合使用。其它碳水化合物来源包括(例如)可再生原料和生物质。可在本发明方法中用作原料的生物质的实例性类型包括纤维素生物质、半纤维素生物质和木质素原料或部分原料。所述生物质原料含有(例如)可用作诸如以下碳源的碳水化合物底物：葡萄糖、蔗糖、木糖、阿拉伯糖、半乳糖、甘露糖、果糖和淀粉。鉴于本文所提供的教示和指导，所属领域技术人员应理解，还可使用除那些上文所例示者外的可再生原料和生物质来培养本发明微生物用于产生本发明的4-HB、4-HBal、4-HBCoA、BDO或腐胺和其它化合物。

因此，鉴于本文所提供的教示和指导，所属领域技术人员应理解，可产生在诸如碳水化合物等碳源上生长时分泌本发明的生物合成化合物的非天然微生物。所述化合物包括(例如)4-HB、4-HBal、4-HBCoA、BDO或腐胺途径和/或经组合4-HB、4-HBal、4-HBCoA、BDO或腐胺途径中的4-HB、4-HBal、4-HBCoA、BDO或腐胺以及任一中间代谢物。所需要的只是以图1中所示的一或多种酶活性进行改造以实现所需化合物或中间体的生物合成，包括(例如)纳入一些或全部4-HB、4-HBal、4-HBCoA、BDO或腐胺生物合成途径。因此，本发明提供非天然微生物，其在碳水化合物上生长时分泌4-HB，在碳水化合物上生长时分泌BDO和/或在碳水化合物上生长时分泌图1、8-13、58、62或63中所示的任一中间代谢物。本发明的产生BDO的微生物可起始于(例如)琥珀酸酯、琥珀酰基-CoA、α-酮戊二酸酯、琥珀酸半醛、4-HB、4-羟基丁酰基磷酸酯、4-羟基丁酰基-CoA(4-HB-CoA)和/或4-羟基丁醛的合成。

在一些实施例中，培养条件包括厌氧性或实质性厌氧性生长或维持条件。实例性厌氧性条件先前已进行描述且为相关技艺所熟知。用于发酵工艺的实例性厌氧性条件描述于下文实例中。所述条件中的任一者都可与非天然微生物以及相关技艺熟知的其它厌氧性条件一起采用。在所述厌氧性条件下，4-HB、4-HBal、4-HBCoA、BDO或腐胺产生者可以5-10mM或更高的细胞内浓度以及先前所例示的全部其它浓度分别合成单体4-HB、4-HBal、4-HBCoA、BDO或腐胺。

还可生成诸多下游化合物用于本发明的产生的4-HB、4-HBal、4-HBCoA、BDO或腐胺的非天然微生物。对于本发明的产生4-HB的微生物来说，单体4-HB和GBL平衡存在于培养基中。4-HB转变为GBL可通过(例如)在酸性pH培养基中培养微生物有效地实现。小于或等于7.5(尤其在pH 5.5下或低于pH5.5)的pH自发地将4-HB转变为GBL。

可使用相关技艺所熟知的多种方法将所得GBL与培养物中的4-HB和其它组分分离。所述分离方法包括(例如)实例以及方法中例示的萃取程序，其包括连续液液萃取、渗透蒸发、膜过滤、膜分离、逆渗透、电透析、蒸馏、结晶、离心、萃取过滤、离心交换色谱、分子大小筛选色谱、吸附色谱和超滤。所有上述方法都为相关技艺所熟知。所分离GBL可进一步通过(例如)蒸馏纯化。

可从本发明的产生4-HB的非天然微生物产生的另一下游化合物包括(例如)BDO。这种化合物可通过(例如)GBL的化学氢化合成。化学氢化反应为相关技艺所熟知。一个实例性程序包括使用异相或均相氢化催化剂连同氢，或以化学计量方式或催化方式使用的基于氢化物的还原剂将源自培养物的4-HB和/或GBL或所述两种组分的混合物化学还原，以产生1，4-丁二醇。

相关技艺所熟知的其它程序同样可适用于上述化学反应且包括(例如)WO第82/03854号(布拉德利(Bradley)等人)，其描述气相中γ-丁内酯经由氧化铜和氧化锌催化剂的氢解。英国专利第1,230,276号，其描述使用氧化铜-氧化铬催化剂氢化γ-丁内酯。氢化在液相中进行。还例示具有高总反应器压力的分批反应。反应器中的反应物和产物分压远高于相应露点。英国专利第1,314,126号，其描述在液相中经由镍-钴-钍氧化物催化剂氢化γ-丁内酯。分批反应例示为具有高总压力和远高于相应组分露点的组分分压。英国专利第1,344,557号，其描述在液相中经由氧化铜-氧化铬催化剂氢化γ-丁内酯。气相或含蒸气混合相指示为在一些情况下适宜。例示使用高总反应器压力的连续流动管状反应器。英国专利第1,512,751号，其描述在液相中经由氧化铜-氧化铬催化剂将γ-丁内酯氢化为1，4-丁二醇。例示具有高总反应器压力的分批反应，并且其中可测定反应物和产物分压远高于相应露点。美国专利第4,301,077号，其描述经由Ru-Ni-Co-Zn催化剂将γ-丁内酯氢化为1，4-丁二醇。所述反应可在液相或气相中或在混合液-气相中进行。例示高总反应器压力和相对较低的反应器生产率下的连续流动液相反应。美国专利第4,048,196号，其描述通过经由氧化铜-氧化锌催化剂液相氢化γ-丁内酯来产生1，4-丁二醇。进一步例示在高总反应器压力以及高反应物和产物分压下操作的连续流动管状反应器。和美国专利第4,652,685号，其描述将内酯氢化为二醇。

可从本发明的产生4-HB的微生物产生的又一下游化合物包括(例如)THF。这种化合物可通过(例如)GBL的化学氢化合成。一个相关技艺所熟知可适用于将GBL转变为THF的实例性程序包括(例如)使用异相或均相氢化催化剂连同氢，或以化学计量方式或催化方式使用的基于氢化物的还原剂将源自培养物的4-HB和/或GBL或所述两种组分的混合物化学还原，以产生四氢呋喃。相关技艺所熟知的其它程序同样可适用于上述化学反应且包括(例如)美国专利第6,686,310号，其描述高表面积溶胶-凝胶路径制备的氢化催化剂。还描述将马来酸还原成四氢呋喃(THF)和1，4-丁二醇(BDO)以及将γ丁内酯还原成四氢呋喃和1，4-丁二醇的方法。

培养条件可包括(例如)液体培养程序以及发酵和其它大规模培养程序。如下文实例中所进一步描述，本发明生物合成产物的特别有用的产率可在厌氧性或实质性厌氧性培养条件下获得。

用以测试4-HB、4-HBal、4-HBCoA、BDO或腐胺的产生的适宜纯化和/或分析可使用熟知方法进行。对于要测试的各改造菌株，可使诸如一式三份培养物等适宜重复生长。例如，可监测经改造产生宿主中的产物和副产物形成。最终产物和中间体以及其它有机化合物可通过诸如HPLC(高效液相色谱)、GC-MS(气相色谱-质谱)和LC-MS(液相色谱-质谱)等方法或其它适宜分析方法使用相关技艺所熟知的常规程序来分析。还可利用培养物上清液来测试发酵液中的产物的释放。副产物和残余葡萄糖可通过HPLC使用(例如)用于葡萄糖和醇的折射率检测器和用于有机酸的UV检测器(林等人，生物技术与生物工程90：775-779(2005))或相关技艺所熟知的其它适宜分析和检测方法来定量。来自外源性DNA序列的个别酶或蛋白质活性还可使用相关技艺所熟知的方法分析。

可使用相关技艺所熟知的多种方法将4-HB、4-HBal、4-HBCoA、BDO或腐胺产物与培养物中的其它组分分离。所述分离方法包括(例如)萃取程序以及方法，包括连续液液萃取、渗透蒸发、膜过滤、膜分离、逆渗透、电透析、蒸馏、结晶、离心、萃取过滤、离心交换色谱、分子大小筛选色谱、吸附色谱和超滤。所有上述方法都为相关技艺所熟知。

本发明进一步提供制造4-HB的方法。所述方法包括在实质性厌氧性条件下使具有4-羟基丁酸(4-HB)生物合成途径的非天然微生物发酵足以产生单体4-羟基丁酸(4-HB)的时间，所述途径包含至少一种编码以下酶的外源性核酸：4-羟基丁酸脱氢酶、非CoA依赖性琥珀酸半醛脱氢酶、琥珀酰基-CoA合成酶、CoA依赖性琥珀酸半醛脱氢酶、谷氨酸酯：琥珀酸半醛转氨酶、α-酮戊二酸脱羧酶或谷氨酸脱羧酶，所述工艺包含分批补料发酵和分批分离；分批补料发酵和连续分离或连续发酵和连续分离。

上述培养和化学氢化还可连续按比例放大并生长，用于制造4-HB、4-HBal、4-HBCoA、GBL、BDO和/或THF或腐胺。实例性生长程序包括(例如)分批补料发酵和分批分离；分批补料发酵和连续分离或连续发酵和连续分离。所有所述工艺都为相关技艺所熟知。采用4-HB产生者允许通过同时采用上述氢化程序与诸如发酵等连续培养方法同时进行4-HB生物合成和化学转变为GBL、BDO和/或THF。其它氢化程序也为相关技艺所熟知且可同样应用于本发明方法。

发酵程序特别可用于生物合成产生商业量的4-HB、4-HBal、4-HBCoA、BDO或腐胺。通常，并且与非连续培养程序一样，4-HB、4-HBal、4-HBCoA、BDO或腐胺的连续和/或接近连续产生将包括在充足营养素和培养基中培养本发明的产生4-HB、4-HBal、4-HBCoA、BDO或腐胺的非天然生物体以维持和/或接近维持指数期内的生长。在所述条件下的连续培养可包括(例如)生长或培养1天、2天、3天、4天、5天、6天或7天或更长。另外，连续培养可包括1周、2周、3周、4周或5周或更久且长达数月的较长时期。或者，如果适于特定应用，那么本发明生物体可培养数小时。应理解，连续和/或接近连续培养条件还可包括所述实例性时期之间的所有时间间隔。应进一步理解，培养本发明微生物的时间是足以产生足量的用于所需目的的产物的时间。

发酵程序为相关技艺所熟知。简单来说，用于生物合成产生本发明的4-HB、4-HBal、4-HBCoA、BDO或腐胺或其它4-HB、4-HBal、4-HBCoA、BDO或腐胺源产物(包括中间体)的发酵可用于(例如)分批补料发酵和分批分离；分批补料发酵和连续分离或连续发酵和连续分离。相关技艺所熟知的分批和连续发酵程序的实例进一步例示于下文实例中。

除了上述使用本发明的4-HB、4-HBal、4-HBCoA、BDO或腐胺产生者分别连续产生大量4-HB、4-HBal、4-HBCoA、BDO或腐胺(包括单体4-HB)的发酵程序外，4-HB产生者还可(例如)同时经过化学合成程序以将产物转变为其它化合物或如先前所述用于将单体4-HB化学转变为(例如)GBL、BDO和/或THF的产物。相似地，BDO产生者可(例如)同时经过如先前针对BDO到(例如)THF、GBL、吡咯烷酮和/或其它BDO家族化合物的化学转变所述的化学合成程序。另外，如果需要，可自发酵培养物分离4-HB、4-HBal、4-HBCoA、BDO或腐胺产生者的产物且使其依序经过化学或酶促转变以将产物转变为其它化合物，如本文所揭示。

简单来说，发酵液中的GBL的氢化可如弗罗斯特(Frost)等人，生物技术进展(Biotechnology Progress)18：201-211(2002)所描述来进行。在发酵期间用于氢化的另一程序包括(例如)描述于(例如)美国专利第5,478,952号中的方法。这种方法进一步例示于下文实例中。

因此，本发明另外提供制造γ-丁内酯(GBL)、四氢呋喃(THF)或1，4-丁二醇(BDO)的方法。所述方法包括在实质性厌氧性条件下使具有4-羟基丁酸(4-HB)和/或1，4-丁二醇(BDO)生物合成途径的非天然微生物发酵足以产生1，4-丁二醇(BDO)、GBL或THF的时间，所述途径包含至少一种编码以下酶的外源性核酸：4-羟基丁酸脱氢酶、非CoA依赖性琥珀酸半醛脱氢酶、琥珀酰基-CoA合成酶、CoA依赖性琥珀酸半醛脱氢酶、4-羟基丁酸酯：CoA转移酶、谷氨酸酯：琥珀酸半醛转氨酶、α-酮戊二酸脱羧酶、谷氨酸脱羧酶、4-羟基丁酸激酶、磷酸转丁酰基酶、CoA依赖性1，4-丁二醇半醛脱氢酶、CoA依赖性1，4-丁二醇半醛脱氢酶、CoA依赖性1，4-丁二醇醇脱氢酶或CoA依赖性1，4-丁二醇醇脱氢酶，所述发酵包含分批补料发酵和分批分离；分批补料发酵和连续分离或连续发酵和连续分离。

除如本文所述本发明的4-HB、4-HBal、4-HBCoA、BDO或腐胺和其它产物的生物合成外，本发明的非天然微生物和方法还可彼此和/或与相关技艺所熟知的其它微生物和方法进行各种组合利用以通过其它路径实现产物生物合成。例如，一种除使用4-HB产生者和化学步骤外或除使用BDO产生者外产生BDO的替代方式是直接经由添加能够将本文所例示4-HB或4-HB产物转变为BDO的另一微生物。

一种此类程序包括(例如)使本发明的产生4-HB的微生物发酵以产生4-HB，如上文和下文所述。然后，4-HB可用作第二种微生物的底物，其将4-HB转变为(例如)BDO、GBL和/或THF。可直接将4-HB添加到第二生物体的另一培养物，或可通过(例如)细胞分离耗尽4-HB产生者的原始培养物中的所述微生物，并且然后可将第二生物体添加到发酵液中以不经中间纯化步骤即产生最终产物。具有以生物化学方式利用4-HB作为用于转变为BDO的底物的能力的一种实例性第二生物体是(例如)丙酮丁醇梭菌(例如，参见朱厄尔(Jewell)等人，当代微生物学(Current Microbiology)，13：215-19(1986))。

因此，所述程序包括(例如)产生4-HB、4-HBal、4-HBCoA、BDO或腐胺途径中间体的微生物的发酵。然后，4-HB、4-HBal、4-HBCoA、BDO或腐胺途径中间体可用作用于将4-HB、4-HBal、4-HBCoA、BDO或腐胺途径中间体转变为4-HB、4-HBal、4-HBCoA、BDO或腐胺的第二种微生物的底物。可直接将4-HB、4-HBal、4-HBCoA、BDO或腐胺途径中间体添加到第二生物体的另一培养物，或可通过(例如)细胞分离耗尽4-HB、4-HBal、4-HBCoA、BDO或腐胺途径中间体产生者的原始培养物中的所述微生物，并且然后可将第二生物体添加到发酵液中以不经中间纯化步骤即产生最终产物。

在其它实施例中，本发明的非天然微生物和方法可以众多种亚途径组装以实现(例如)如本文所述4-HB和/或BDO的生物合成。在所述实施例中，用于本发明所需产物的生物合成途径可分隔在不同微生物中且不同微生物可经共培养以产生最终产物。在所述生物合成方案中，一种微生物的产物是第二种微生物的底物，直到合成最终产物为止。例如，BDO的生物合成可如先前所述通过构筑含有用于将一种途径中间体转变为另一途径中间体或产物的生物合成途径的微生物来实现，例如，诸如内源性琥珀酸酯等底物经由4-HB到最终产物BDO。或者，BDO还可经由使用两种生物体在相同容器中共培养或共发酵从微生物以生物合成方式产生。第一种微生物为具有从琥珀酸产生4-HB的基因的4-HB产生者，并且第二种微生物为具有将4-HB转变为BDO的基因的BDO产生者。例如，4-HB、4-HBal、4-HBCoA、BDO或腐胺的生物合成可通过构筑含有用于将一种途径中间体转变为另一途径中间体或产物的生物合成途径的微生物来实现。或者，4-HB、4-HBal、4-HBCoA、BDO或腐胺还可经由使用两种生物体在相同容器中共培养或共发酵从微生物以生物合成方式产生，其中第一种微生物产生4-HB中间体、4-HBal中间体、4-HBCoA中间体、BDO中间体或腐胺中间体且第二种微生物将所述中间体转变为4-HB、4-HBal、4-HBCoA、BDO或腐胺。

鉴于本文所提供的教示和指导，所属领域技术人员应理解，本发明的非天然微生物和方法连同其它微生物、具有亚途径的其它非天然微生物的共培养物和相关技艺所熟知用以产生本发明的4-HB、4-HBal、BDO、GBL、THF和腐胺产物的其它化学和/或生物化学程序的组合存在众多种组合和排列。

相似地，所属领域技术人员应理解，可基于用于引入一或多个基因破坏以增加4-HB、4-HBal、4-HBCoA、BDO或腐胺的产生的所需特性来选择宿主生物体。因此，应理解，如果要将遗传修饰引入宿主生物体中以破坏基因，那么可以相似方式破坏催化相似但不相同的代谢反应的任何同源物、直系同源物或旁系同源物，以确保充分破坏所需代谢反应。由于在不同生物体的代谢网络内存在某些差异，因此所属领域技术人员应理解，给定生物体中受到破坏的实际基因可在生物体之间有所不同。然而，鉴于本文所提供的教示和指导，所属领域技术人员还应理解，本发明方法可应用于任何适宜宿主微生物以鉴别在所关注物种中构筑将增加4-HB、4-HBal、4-HBCoA、BDO或腐胺生物合成的生物体所需的同类代谢改变。在一特定实施例中，如果需要且如本文所揭示，产生增加将4-HB、4-HBal、4-HBCoA、BDO或腐胺的生物合成与生物体的生长偶合，并且可专性地将4-HB、4-HBal、4-HBCoA、BDO或腐胺的产生与生物体的生长偶合。

应理解，在本发明方法中，可将一或多种外源性核酸中的任一者引入微生物中以产生本发明的非天然微生物。可引入核酸以使微生物具有(例如)4-HB、4-HBal、4-HBCoA、BDO或腐胺生物合成途径。或者，可引入编码核酸以产生具有生物合成能力的中间体微生物以催化一些所需反应以赋予4-HB、4-HBal、4-HBCoA、BDO或腐胺生物合成能力。例如，具有4-HB、4-HBal、4-HBCoA、BDO或腐胺生物合成途径的非天然微生物可包含至少两种编码所需酶或蛋白质(例如如本文所揭示酶的组合(参见实例和图1、8-13、58、62和63)等等)的外源性核酸。因此，应理解，在本发明的非天然微生物中可包括两种或更多种生物合成途径酶或蛋白质的任一组合。相似地，应理解，例如，在本发明的非天然微生物中可视需要和本文所揭示包括三种或更多种生物合成途径酶或蛋白质的任一组合，等等，只要所需生物合成途径酶和/或蛋白质的组合可产生相应所需产物即可。相似地，在本发明的非天然微生物中可视需要包括如本文所揭示四种或更多种生物合成途径酶或蛋白质的任一组合，只要所需生物合成途径酶和/或蛋白质的组合可产生相应所需产物即可。

如本文所揭示，利用酯酶将γ-丁内酯转变为4-羟基丁酸酯。实例性酯酶包括(但不限于)来自中间耶氏杆菌(Yersinia intermedia)29909(基因座yinte0001_13710)和根癌土壤杆菌菌株C58的酯酶(卡利耶(Carlier)等人，植物与微生物分子相互作用(Mol.Plant Microbe Interact.)17(9)：951-957(2004))(参见实例XXXIV)。耶氏杆菌属基因(基因座yinte0001_13710)的核苷酸序列和氨基酸序列示于图89中(也参见基因库(GenBank)ZP_04636075.1；GI：238792441)。来自根癌土壤杆菌的基因的核苷酸和氨基酸序列示于图90中。另外，实例性酯酶包括大肠杆菌KTE10的AttM(基因库ZP_19612688.1，GI：432369596)和非共生发光杆菌(Photorhabdus asymbiotica)的attM(基因库YP_003039319.1GI：253987963)。

本发明另外提供通过在细胞中表达γ-丁内酯酯酶来减少细胞或细胞培养物中的γ-丁内酯产生的方法。γ-丁内酯酯酶可为(例如)耶氏杆菌属的γ-丁内酯酯酶或与耶氏杆菌属的γ-丁内酯酯酶具有至少90％一致性的多肽。在一特定实施例中，γ-丁内酯酯酶是由编码氨基酸序列SEQ ID NO：179的核酸或编码与SEQ ID NO：179具有至少90％一致性的多肽的核酸编码。本发明进一步提供利用γ-丁内酯酯酶来降低活体外试样中γ-丁内酯的量。

在某些方面中，编码本文所揭示氨基酸序列的核酸分子(例如，编码本发明的4-HB、GBL、4-HBal、4-HBCoA、BDO和/或腐胺途径酶或蛋白质的核酸分子)可与本文所揭示核苷酸序列具有至少一定一致性。因此，在一些实施例中，核酸分子的核苷酸序列可与本文所揭示核苷酸序列具有至少65％一致性、至少70％一致性、至少75％一致性、至少80％一致性、至少85％一致性、至少90％一致性、至少91％一致性、至少92％一致性、至少93％一致性、至少94％一致性、至少95％一致性、至少96％一致性、至少97％一致性、至少98％一致性或至少99％一致性。在其它方面中，编码氨基酸序列的核酸分子可编码与本文所揭示氨基酸序列具有至少65％一致性、至少70％一致性、至少75％一致性、至少80％一致性、至少85％一致性、至少90％一致性、至少91％一致性、至少92％一致性、至少93％一致性、至少94％一致性、至少95％一致性、至少96％一致性、至少97％一致性、至少98％一致性或至少99％一致性的氨基酸序列。因此，在本发明的一些方面中，编码4-HB、GBL、4-HBal、4-HBCoA、BDO和/或腐胺途径酶或蛋白质的核酸分子的核苷酸序列与本文由SEQ ID NO、基因库和/或GI编号所揭示的核酸或与本文由SEQ ID NO、基因库和/或GI编号所揭示编码氨基酸序列的核酸分子杂交的核酸分子具有至少65％一致性、至少70％一致性、至少75％一致性、至少80％一致性、至少85％一致性、至少90％一致性、至少91％一致性、至少92％一致性、至少93％一致性、至少94％一致性、至少95％一致性、至少96％一致性、至少97％一致性、至少98％一致性或至少99％一致性。

可在含有本文所揭示核酸分子的载体中提供所述核酸分子。在一些方面中，载体可为如本文所揭示的表达载体。在宿主细胞中可含有载体。在一些方面中，宿主细胞可为具有产生4-HB、GBL、4-HBal、4-HBCoA、BDO和/或腐胺的途径的非天然微生物。含于宿主细胞中的核酸分子可使用所属领域技术人员所熟知的方法(例如使用允许核酸分子在所需宿主细胞中表达的启动子和/或增强子)表达。多种诱导型启动子或增强子中的任一者还可包括在载体中用于调节核酸分子的表达。

本发明宿主细胞可具有整合到宿主染色体中的核酸分子。核酸分子的整合可使用所属领域技术人员所熟知的方法(例如那些本文所揭示者)进行。例如，用于将核酸整合到本文所述宿主染色体中的方法并不限于所整合的精确核酸分子。应理解，所属领域技术人员应能够应用所述相同方法于宿主细胞基因组内的相同或替代位点整合所需核酸。在一些方面中，本发明核酸分子的整合可具有位点特异性。在一些方面中，位点特异性整合将针对最低量的核酸分子，例如所需多肽的编码区，其可由内源性宿主启动子表达。位点特异性整合方法为所属领域技术人员所熟知，可使用任一数目的所述方法来生成本发明宿主细胞。或者，核酸分子可在细胞中表达，其中所述核酸分子并未整合到宿主染色体中，例如，从质粒或另一载体在细胞中表达，如本文所揭示。

在一些实施例中，本发明宿主细胞是能够发酵的微生物物种。本文描述能够发酵的实例性微生物。此外，在一些实施例中，本发明提供具有本发明一或多种宿主细胞的培养基。在一些方面中，培养基可在培养用于产生4-HB、GBL、4-HBal、4-HBCoA、BDO和/或腐胺的宿主细胞后从本发明宿主细胞纯化或实质上纯化。纯化或实质上纯化培养基的方法为所属领域技术人员所熟知且可使用其任一者来生成本发明培养基，包括那些本文所揭示的方法。

在一些实施例中，本发明提供宿主菌株、构筑宿主菌株的方法或利用宿主菌株发酵以产生4-HB、GBL、4-HBal、4-HBCoA、BDO和/或腐胺的方法，其中所述宿主菌株包括使一或多个、最多全部天然宿主基因的表达或活性衰减的缺失和/或修饰，所述天然宿主基因编码催化本文所揭示4-HB、GBL、4-HBal、4-HBCoA、BDO和/或腐胺途径中的相同反应的多肽(酶)。在一些方面中，宿主菌株相较于缺失和/或修饰之前的亲本菌株提供发酵中的4-HB、GBL、4-HBal、4-HBCoA、BDO和/或腐胺的改良产率。

“同源性”或“一致性”或“相似性”是指两条多肽之间或两个核酸分子之间的序列相似性。同源性可通过比较各序列中的位置来测定，所述序列可出于比较目的经比对。当比较序列中的位置由相同碱基或氨基酸占据时，分子在所述位置处同源。序列间的同源性程度随序列所共有的匹配或同源位置的数目而变化。

多肽或多肽区(或多核苷酸或多核苷酸区)与另一序列具有某一百分比(例如，65％、70％、75％、80％、85％、90％、95％、98％或99％)的“序列一致性”意指，在所比较两个序列经比对时，所述百分比的氨基酸(或核苷酸碱基)是相同的。序列一致性(还称作同源性或相似性)是指两个核酸分子之间或两条多肽之间的序列相似性。一致性可通过比较各序列中的位置来测定，所述序列可出于比较目的经比对。当比较序列中的位置由相同碱基或氨基酸占据时，分子在所述位置处一致。序列间的一致性程度随序列所共有的匹配或同源位置的数目而变化。所述比对和同源性或序列一致性百分比可使用相关技艺已知软件程序(例如那些描述于奥苏贝尔等人(见上文)中者)测定。可使用预设参数进行比对。一种相关技艺熟知的比对程序是BLAST，其可与预设参数一起使用。特定来说，程序是BLASTN和BLASTP，使用以下预设参数：遗传密码＝标准；筛选＝无；链＝两条；截止值＝60；预期＝10；矩阵＝BLOSUM62；描述＝50个序列；分类依据＝高评分；数据库＝非冗余，基因库+EMBL+DDBJ+PDB+基因库CDS转译+SwissProtein+SPupdate+PIR。这些程序的细节可参见国家生物技术信息中心(NCBI)。

编码本发明的4-HB、GBL、4-HBal、4-HBCoA、BDO和/或腐胺途径酶或蛋白质的核酸分子还可包括与本文由SEQ ID NO、基因库和/或GI编号所揭示核酸杂交的核酸分子或与本文由SEQ ID NO、基因库和/或GI编号所揭示编码氨基酸序列的核酸分子杂交的核酸分子。杂交条件可包括为所属领域技术人员所熟知的高度严格、中度严格或低严格性杂交条件，例如那些本文所述者。相似地，可用于本发明中的核酸分子可描述为与本文由SEQ ID NO、基因库和/或GI编号所揭示的核酸或与本文由SEQ ID NO、基因库和/或GI编号所揭示编码氨基酸序列的核酸分子杂交的核酸分子具有某一序列一致性百分比。例如，核酸分子可与本文所述核酸具有至少65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％序列一致性。

严格杂交是指经杂交多核苷酸稳定的条件。如所属领域技术人员已知，经杂交多核苷酸的稳定性以杂合体的解链温度(Tm)反映。一般来说，经杂交多核苷酸的稳定性随盐浓度(例如，钠离子浓度)和温度而变化。杂交反应可在较低严格性的条件下进行，之后进行不同但较高严格性的洗涤。提到杂交严格性时是指所述洗涤条件。高度严格的杂交包括仅允许那些在65℃下在0.018M NaCl中形成稳定杂交多核苷酸的核酸序列杂交的条件，例如，如果杂合体在65℃下在0.018M NaCl中不稳定，那么其在高严格性条件下将不稳定，如本文所预期。可通过(例如)以下方式提供高严格性条件：在42℃下在50％甲酰胺、5×登哈特氏溶液(Denhart′s solution)、5×SSPE、0.2％SDS中杂交，之后在65℃下在0.1×SSPE和0.1％SDS中洗涤。还可使用除高度严格杂交条件以外的杂交条件来描述本文所揭示的核酸序列。例如，词组中度严格杂交是指等效于以下的条件：在42℃下在50％甲酰胺、5×登哈特氏溶液、5×SSPE、0.2％SDS中杂交，之后在42℃下在0.2×SSPE、0.2％SDS中洗涤。词组低严格性杂交是指等效于以下的条件：在22℃下在10％甲酰胺、5×登哈特氏溶液、6×SSPE、0.2％SDS中杂交，之后在37℃下在1×SSPE、0.2％SDS中洗涤。登哈特氏溶液含有1％Ficoll、1％聚乙烯基吡咯烷酮和1％牛血清白蛋白(BSA)。20×SSPE(氯化钠、磷酸钠、乙二胺四乙酸(EDTA))含有3M氯化钠、0.2M磷酸钠和0.025M(EDTA)。其它适宜的低度、中度和高严格性杂交缓冲液和条件为所属领域技术人员所熟知且描述于(例如)以下文献中：桑布鲁克等人，分子克隆：实验室手册，第三版，冷泉港实验室，纽约(2001)；和奥苏贝尔等人，分子生物学现行规范，约翰威利父子公司，巴尔的摩，马里兰州(1999)。

如果需要，所编码多肽可通过相关技艺所熟知的多种方法分离，所述方法是(例如)重组表达系统、沉淀、凝胶过滤、离子交换、反相和亲和色谱等等。其它熟知方法描述于多伊彻(Deutscher)等人，蛋白质纯化指南：酶学方法(Guide to Protein Purification：Methods in Enzymology)，第182卷(学术出版社，(1990))中。或者，本发明的所分离多肽可使用熟知重组方法获得(例如，参见桑布鲁克等人，见上文，1989；奥苏贝尔等人，见上文，1999)。用于本发明多肽的生物化学纯化的方法和条件可由所属领域技术人员选择，并且可通过(例如)功能分析来监测纯化。

制备多肽的方法的一个非限制性实例是使用相关技艺所熟知的方法在适宜宿主细胞(例如细菌细胞、酵母菌细胞或另一适宜细胞)中表达编码多肽的核酸和再次使用熟知纯化方法回收所表达多肽，如本文所述。多肽可直接从已经如本文所述表达载体转化的细胞分离。重组表达多肽还可表达为与合适亲和力标签(例如谷胱甘肽S转移酶(GST)或聚His)融合的蛋白质，并且如果需要可经亲和纯化。因此，多肽可由宿主细胞产生，如本文所揭示。多肽还可使用所属领域技术人员所熟知的多肽合成方法通过化学合成产生。

在一些实施例中，本发明提供使用本文所揭示多肽作为生物催化剂。本文所用“生物催化剂”是指起始化学反应或修改所述化学反应的速率的生物物质。生物催化剂可为酶。可使用多肽来增加底物到产物的转变率，如本文所揭示。在工业反应的情况下，可使用不存在宿主细胞的多肽，来改良生成4-HB、GBL、4-HBal、4-HBCoA、BDO和/或腐胺的反应，例如，使用活体外方法实现。

在一些实施例中，本发明提供构筑宿主菌株的方法，其尤其可包括将本文所揭示载体引入能够发酵的宿主细胞中的步骤。可使用相关技艺所熟知的技术将载体稳定或瞬时地引入宿主细胞中，所述技术包括(但不限于)偶联、电穿孔、化学转化、转导、转染和超声波转化。本文揭示其它方法，其任一者都可用于本发明方法中。

为了生成更佳产生者，可利用代谢建模来优化生长条件。还可使用建模来设计另外优化途径利用的基因敲除(例如，参见美国专利公开案US 2002/0012939、US 2003/0224363、US 2004/0029149、US 2004/0072723、US 2003/0059792、US 2002/0168654和US2004/0009466以及美国专利第7,127,379号)。建模分析允许可靠预测使代谢向更有效地产生4-HB、4-HBal、4-HBCoA、BDO或腐胺转变对细胞生长的效应。

一种鉴别和设计有助于所需产物生物合成的代谢改变的计算方法是OptKnock计算框架(布加德(Burgard)等人，生物技术与生物工程84：647-657(2003))。OptKnock是代谢建模和模拟程序，其提出得到过度产生靶产物的遗传稳定微生物的基因缺失或破坏策略。具体来说，所述框架检查微生物的完整代谢和/或生物化学网络以促成迫使所需生物化学变成细胞生长的专性副产物的遗传操纵。通过经由策略性地放置的基因缺失或其它功能基因破坏将生物化学产生与细胞生长偶合，在生物反应器中经过长时期后施加于经改造菌株的生长选择压力可因强制性生长偶合性生物化学产生而改良性能。最后，当构筑基因缺失时，所设计菌株回复到其野生型状态的可能性是可忽略的，这是因为将从基因组完全去除通过OptKnock选择的基因。因此，这种计算方法可用于鉴别生物合成所需产物的替代途径或结合非天然微生物使用，用于将所需产物的生物合成进一步优化。

简单来说，OptKnock是在本文中用于指用于对细胞代谢建模的计算方法和系统的术语。OptKnock程序是指将特定约束条件纳入通量平衡分析(FBA)模型中的模型和方法的框架。所述约束条件包括(例如)定性动力学信息、定性调节信息和/或DNA微阵列实验数据。OptKnock还通过(例如)以下方式来计算各种代谢问题的解决方案：紧缩经由通量平衡模型获得的通量边界且随后探测在基因添加或缺失存在下代谢网络的性能限制。OptKnock计算框架允许构筑允许有效查询代谢网络的性能限制的模型制定且提供对所得混合整数线性程序化问题求解的方法。本文中称作OptKnock的代谢建模和模拟方法描述于(例如)2002年1月10日申请的美国公开案2002/0168654、2002年1月10日申请的国际专利第PCT/US02/00660号和2007年8月10日申请的美国公开案2009/0047719中。

鉴别和设计有助于产物生物合成产生的代谢改变的另一计算方法是称为

的代谢建模和模拟系统。这种计算方法和系统描述于(例如)2002年6月14申请的美国公开案2003/0233218和2003年6月13日申请的国际专利申请案第PCT/US03/18838号中。

是可用于产生计算机的网络模型和用于模拟经过生物系统的化学反应的质量、能量或电荷的通量的计算系统，用以界定含有所述系统中的化学反应的任何和所有可能功能性的解空间，由此测定所述生物系统的所允许活性范围。这种方式称作基于约束条件的建模，这是因为解空间是通过诸如以下等约束条件界定：所包括反应的已知化学计量以及与经过反应的最大通量相关的反应热力学和能力约束条件。通过所述约束条件界定的空间可经外推以测定生物系统或其生物化学组分的表型能力和性质。

所述计算方式与生物真实性一致，这是因为生物系统具有灵活性且可以许多不同方式实现相同结果。生物系统是经由已受到所有活系统必须面对的基本约束条件限制的进化机制来设计。因此，基于约束条件的建模策略涵盖所述一般真实性。此外，经由紧缩约束条件对网络模型连续施加进一步限制的能力可减小解空间的大小，由此增强可预测生理性能或表型的精确度。

鉴于本文所提供的教示和指导，所属领域技术人员应能够应用用于代谢建模和模拟的各种计算框架来设计并实施所需化合物在宿主微生物中的生物合成。所述代谢建模和模拟方法包括(例如)上文例示为

和OptKnock的计算系统。在说明本发明时，本文参考用于建模和模拟的OptKnock计算框架来描述一些方法。所属领域技术人员应了解，如何将使用OptKnock鉴别、设计和实施代谢改变应用于相关技艺所熟知的所述其它代谢建模和模拟计算框架和方法中的任一者。

上述方法将提供一组要破坏的代谢反应。所述组内每一反应的消除或代谢修饰可产生作为生物体生长阶段期间的专性产物的所需产物。由于已知所述反应，因此双重OptKnock问题的解决方案还将提供一或多种编码一或多种催化所述反应组内每一反应的酶的相关基因。一组反应和其编码参与每一反应的酶的相应基因的鉴别通常为经由分析所述反应与具有酶与编码基因间的关系的反应数据库的相关性来实现的自动工艺。

在鉴别后，通过在功能上破坏至少一种编码所述组内每一代谢反应的基因，在靶细胞或生物体中实施要经破坏以实现所需产物的产生的所述组反应。一种用以实现反应组的功能破坏的特别有用的手段是各编码基因的缺失。然而，在一些情况下，通过其它遗传畸变破坏反应可能有益，所述畸变包括(例如)诸如启动子或调节因子的顺式结合位点等调节区的突变、缺失或诸多位置中任一者处的编码序列的截短。例如，当需要对产物的偶合进行快速评价时或当不太可能发生遗传回复时，产生小于完全缺失的基因集的所述较后畸变可能有用。

为了鉴别上述双重OptKnock问题的其它富有成效的解决方案(所述方案产生其它要破坏的反应组或可导致所需产物的生物合成(包括生长偶合性生物合成)的代谢修饰)，可实施称为整数分割(integer cut)的优化方法。这种方法通过于每次迭代纳入称作整数分割的另一约束条件对上文所例示的OptKnock问题迭代求解来进行。整数切割约束条件有效地防止求解程序选择在专性地将产物生物合成与生长偶合的任一先前迭代中鉴别的完全相同的反应组。例如，如果先前所鉴别的生长偶合性代谢修饰指定要破坏反应1、2和3，那么以下约束条件防止在随后求解中同时考虑相同反应。整数分割方法为相关技艺所熟知且可发现描述于例如布加德等人，生物技术进展17：791-797(2001)中。与所有本文参考与用于代谢建模和模拟的OptKnock计算框架组合使用的方法一样，减少迭代计算分析冗余的整数分割方法还可与相关技艺所熟知的其它计算框架(包括例如

)一起应用。

本文所例示方法允许构筑生物合成产生所需产物的细胞和生物体，包括将靶生物化学产物的产生与经改造而具有所鉴别遗传改变的细胞或生物体的生长专性地偶合。因此，本文所述计算方法允许鉴别和实施通过选自OptKnock或

的计算机方法鉴别的代谢修饰。所述代谢修饰组可包括(例如)一或多种生物合成途径酶的添加和/或一或多种代谢反应的功能破坏，包括(例如)通过基因缺失的破坏。

如上文所论述，OptKnock方法是基于以下前提研发：当经过长期生长选择时，突变微生物网络可向其以计算方式预测的最大生长表型进化。换句话说，所述方式利用生物体在选择压力下自我优化的能力。OptKnock框架允许基于网络化学计量穷尽性枚举迫使生物化学产生与细胞生长之间的偶合的基因缺失组合。最佳基因/反应敲除的鉴别需要双重优化问题的解决方案，其选择活性反应组以使得所得网络的最佳生长溶液过度产生所关注生物化学品(布加德等人，生物技术与生物工程84：647-657(2003))。

可采用大肠杆菌代谢的计算机化学计量模型来鉴别用于如先前所例示和(例如)以下专利中所述的代谢途径的基本基因：美国专利公开案US 2002/0012939、US 2003/0224363、US 2004/0029149、US 2004/0072723、US 2003/0059792、US 2002/0168654和US2004/0009466和美国专利第7,127,379号。如本文所揭示，可应用OptKnock数据框架来准确找到产生所需产物的生长偶合性产生的基因缺失。此外，双重OptKnock问题的解决方案仅提供一组缺失。为枚举所有有意义的解决方案，也就是，所有导致生长偶合性产生形成的敲除组，可实施称为整数分割的优化技术。这需要通过于每一迭代纳入称作整数分割的另一约束条件对OptKnock问题迭代求解，如上文所论述。

上文所例示和下文实例中进一步说明的方法允许构筑生物合成产生的细胞和生物体，包括将靶生物化学产物的产生与经改造而具有所鉴别遗传改变的细胞或生物体的生长专性地偶合。就此来说，已鉴别出可生物合成4-HB和1，4-丁二醇的代谢改变。经构筑具有所鉴别代谢改变的微生物菌株相较于未经修饰微生物产生升高水平的4-HB、4-HBal、4-HBCoA、BDO或腐胺。所述菌株可不经过负选择压力在(例如)连续发酵工艺中有益地用于商业产生4-HB、BDO、THF、GBL、4-HBal、4-HBCoA或腐胺。

因此，本文所述计算方法允许鉴别和实施通过选自OptKnock或

应理解，不会实质上影响本发明各实施例的作用的修改也包含于本文所提供的本发明定义内。因此，以下实例打算说明但并不限制本发明。

本文所述任一非天然微生物可经培养以产生和/或分泌本发明的生物合成产物。例如，4-HB、4-HBal、4-HBCoA、BDO或腐胺产生者可经培养用于生物合成产生4-HB、4-HBal、4-HBCoA、BDO或腐胺。因此，在一些实施例中，本发明提供具有本文所述4-HB、4-HBal、4-HBCoA、BDO或腐胺或4-HB、4-HBal、4-HBCoA、BDO或腐胺途径中间体的培养基。在一些方面中，还可将培养基与产生4-HB、4-HBal、4-HBCoA、BDO或腐胺或4-HB、4-HBal、4-HBCoA、BDO或腐胺途径中间体的本发明的非天然微生物分离。从培养基分离微生物的方法为相关技艺所熟知。实例性方法包括过滤、絮凝、沉淀、离心、沉降等等。

对于4-HB、4-HBal、4-HBCoA、BDO或腐胺的产生来说，在具有碳源和其它必需营养素的培养基中培养重组菌株。有时且可能非常需要维持发酵器中的厌氧性条件以降低总工艺的成本。可通过(例如)首先用氮吹扫培养基且然后用带有隔膜和卷边的盖密封烧瓶获得所述条件。对于未观察到厌氧性生长的菌株来说，可通过将隔膜穿孔成带有小孔用于有限通气来施用微好氧性或实质性厌氧性条件。实例性厌氧性条件先前已描述且为相关技艺所熟知。实例性好氧性和厌氧性条件描述于(例如)2007年3月10日申请的美国公开案2009/0047719中。发酵可以分批、分批补料或连续方式进行，如本文所揭示。如果需要，发酵还可分两个阶段进行。第一个阶段可为好氧性以允许高度生长和因此允许高生产率，之后为高4-HB、4-HBal、4-HBCoA、BDO或腐胺产率的厌氧性阶段。

如果需要，可视需要通过添加碱(例如NaOH或其它碱)或酸将培养基的pH维持在所需pH，尤其中性pH，例如约7的pH，以将培养基维持在所需pH。可通过使用分光亮度计(600nm)测量光密度来测定生长速率，并且可通过随时间监测碳源消耗来测定葡萄糖吸收速率。

除可再生原料(例如那些上文所例示者)以外，本发明的产生4-HB、4-HBal、4-HBCoA、BDO或腐胺的微生物还可经修饰用于在作为其碳源的合成气上生长。在此具体实施例中，使一或多种蛋白质或酶在4-HB、4-HBal、4-HBCoA、BDO或腐胺产生生物体中表达以提供利用合成气或另一气体碳源的代谢途径。

合成气体(还称作合成气或产生气)是煤和含碳材料(诸如生物质材料，包括农业作物和残余物)气化的主要产物。合成气是主要为H₂和CO的混合物且可从任一有机原料的气化获得，所述有机原料包括(但不限于)煤、煤油、天然气、生物质和废弃有机物质。气化通常在高燃料对氧的比例下进行。尽管主要为H₂和CO，但合成气还可包括较小量的CO₂和其它气体。因此，合成气体提供成本有效的气体碳来源，例如CO和另外CO₂。

伍德-扬达尔(Wood-Ljungdahl)途径催化CO和H₂转变为乙酰基-CoA和其它产物，例如乙酸酯。能够利用CO和合成气的生物体还通常具有经由伍德-扬达尔途径涵盖的相同基本酶组和转化利用CO₂和CO₂/H₂混合物的能力。在揭示CO还可由相同生物体使用且涉及相同途径之前很久，即已识别出微生物的依赖H₂的CO₂转变为乙酸酯。已显示，许多产乙酸菌在CO₂存在下生长并产生诸如乙酸酯等化合物，只要存在氢以供给必需还原当量即可(例如，参见德雷克(Drake)，产乙酸作用(Acetogenesis)，第3-60页，查普曼(Chapman)和霍尔(Hall)，纽约，(1994))。这可汇总为以下反应式：

2CO₂+4H₂+n ADP+n Pi→CH₃COOH+2H₂O+n ATP。

因此，具有伍德-扬达尔途径的非天然微生物还可利用CO₂和H₂混合物来产生乙酰基-CoA和其它所需产物。

伍德-扬达尔途径为相关技艺所熟知且由12个反应组成，所述反应可分成两个支路：(1)甲基支路和(2)羰基支路。甲基支路将合成气转变为甲基-四氢叶酸酯(甲基-THF)，而羰基支路将甲基-THF转变为乙酰基-CoA。甲基支路中的反应按顺序由以下酶或蛋白质催化：铁氧化还原蛋白氧化还原酶、甲酸酯脱氢酶、甲酰基四氢叶酸酯合成酶、次甲基四氢叶酸酯环化脱水酶、亚甲基四氢叶酸酯脱氢酶和亚甲基四氢叶酸酯还原酶。羰基支路中的反应按顺序由以下酶或蛋白质催化：甲基四氢叶酸酯：类咕啉蛋白质甲基转移酶(例如，AcsE)、类咕啉铁-硫蛋白质、镍-蛋白质组装蛋白质(例如，AcsF)、铁氧化还原蛋白、乙酰基-CoA合成酶、一氧化碳脱氢酶和镍-蛋白质组装蛋白质(例如，CooC)。依照本文所提供用于引入足量编码核酸以生成4-HB、4-HBal、4-HBCoA、BDO或腐胺途径的教示和指导，所属领域技术人员应理解，还可针对至少引入编码不存在于宿主生物体中的伍德-扬达尔酶或蛋白质的核酸进行相同改造设计。因此，将一或多种编码核酸引入本发明微生物中以使得所修饰生物体含有完整伍德-扬达尔途径将赋予合成气利用能力。

另外，还可使用与一氧化碳脱氢酶和/或氢化酶活性偶合的还原性(反向)三羧酸循环将CO、CO₂和/或H₂转变为乙酰基-CoA和其它产物，例如乙酸酯。能够经由还原性TCA途径固定碳的生物体可利用一或多种以下酶：ATP柠檬酸酯裂解酶、柠檬酸酯裂解酶、顺乌头酸酶、异柠檬酸酯脱氢酶、α-酮戊二酸酯：铁氧化还原蛋白氧化还原酶、琥珀酰基-CoA合成酶、琥珀酰基-CoA转移酶、延胡索酸酯还原酶、延胡索酸酶、苹果酸脱氢酶、NAD(P)H：铁氧化还原蛋白氧化还原酶、一氧化碳脱氢酶和氢化酶。具体来说，利用由一氧化碳脱氢酶和氢化酶从CO和/或H₂萃取的还原当量经由还原性TCA循环将CO₂固定成乙酰基-CoA或乙酸酯。可通过诸如乙酰基-CoA转移酶、乙酸酯激酶/磷酸转乙酰基酶和乙酰基-CoA合成酶等酶将乙酸酯转变为乙酰基-CoA。可通过丙酮酸酯：铁氧化还原蛋白氧化还原酶和葡萄糖新生酶将乙酰基-CoA转变为4-HB、4-HBal、4-HBCoA、BDO或腐胺前体、甘油醛-3-磷酸酯、磷酸烯醇丙酮酸酯和丙酮酸酯。依照本文所提供用于引入足量编码核酸以生成4-HB、4-HBal、4-HBCoA、BDO或腐胺途径的教示和指导，所属领域技术人员应理解，还可针对至少引入编码不存在于宿主生物体中的还原性TCA途径酶或蛋白质的核酸进行相同改造设计。因此，将一或多种编码核酸引入本发明微生物中以使得所修饰生物体含有完整还原性TCA途径将赋予合成气利用能力。

因此，鉴于本文所提供的教示和指导，所属领域技术人员应理解，可产生在诸如碳水化合物等碳源上生长时分泌本发明的生物合成化合物的非天然微生物。所述化合物包括(例如)4-HB、4-HBal、4-HBCoA、BDO或腐胺途径中的4-HB、4-HBal、4-HBCoA、BDO或腐胺以及任一中间代谢物。所需要的只是以一或多种所需酶或蛋白质活性进行改造以实现所需化合物或中间体的生物合成，包括(例如)纳入一些或全部4-HB、4-HBal、4-HBCoA、BDO或腐胺生物合成途径。因此，本发明提供非天然微生物，其在碳水化合物或另一碳源上生长时产生和/或分泌4-HB、4-HBal、4-HBCoA、BDO或腐胺，并且在碳水化合物或另一碳源上生长时产生和/或分泌4-HB、4-HBal、4-HBCoA、BDO或腐胺途径中所示的任一中间代谢物。本发明的4-HB、4-HBal、4-HBCoA、BDO或腐胺产生微生物可起始于4-HB、4-HBal、4-HBCoA、BDO或腐胺途径中的中间体的合成，如本文所揭示。

一种鉴别和设计有助于所需产物生物合成的代谢改变的计算方法是OptKnock计算框架(布加德等人，生物技术与生物工程84：647-657(2003))。OptKnock是提议导致过度产生靶产物的遗传稳定微生物的基因缺失策略的代谢建模和模拟程序。具体来说，所述框架检查微生物的完整代谢和/或生物化学网络以促成迫使所需生物化学变成细胞生长的专性副产物的遗传操纵。通过经由策略性地放置的基因缺失或其它功能基因破坏将生物化学产生与细胞生长偶合，在生物反应器中经过长时期后施加于经改造菌株的生长选择压力可因强制性生长偶合性生物化学产生而改良性能。最后，当构筑基因缺失时，所设计菌株回复到其野生型状态的可能性是可忽略的，这是因为将从基因组完全去除通过OptKnock选择的基因。因此，这种计算方法可用于鉴别生物合成所需产物的替代途径或结合非天然微生物使用，用于将所需产物的生物合成进一步优化。

的代谢建模和模拟系统。这种计算方法和系统描述于(例如)2002年6月14申请的美国公开案2003/0233218和2003年6月13日申请的国际专利申请案第PCT/US03/18838号(WO/2003/106998)中。

是可用于产生计算机网络模型和用于模拟经过生物系统的化学反应的质量、能量或电荷的通量的计算系统，用以界定含有所述系统中的化学反应的任何和所有可能功能性的解空间，借此测定所述生物系统的所允许活性范围。这种方式称作基于约束条件的建模，这是因为解空间是通过诸如以下等约束条件界定：所包括反应的已知化学计量以及与经过反应的最大通量相关的反应热力学和能力约束条件。通过所述约束条件界定的空间可经外推以测定生物系统或其生物化学组分的表型能力和性质。

在鉴别后，通过在功能上破坏至少一种编码所述组内每一代谢反应的基因在靶细胞或生物体中实施要经破坏以实现所需产物的产生的所述组反应。一种用以实现反应组的功能破坏的特别有用的手段是各编码基因的缺失。然而，在一些情况下，通过其它遗传畸变破坏反应可能有益，所述畸变包括(例如)诸如启动子或调节因子的顺式结合位点等调节区的突变、缺失或诸多位置中任一者处的编码序列的截短。例如，当需要对产物的偶合进行快速评价时或当不太可能发生遗传回复时，产生小于完全缺失的基因集的所述较后畸变可能有用。

为了鉴别上述双重OptKnock问题的其它富有成效的解决方案，所述方案产生其它组要破坏的反应或可产生所需产物的生物合成(包括生长偶合性生物合成)的代谢修饰，可实施称为整数分割的优化方法。这种方法通过于每次迭代纳入称作整数分割的另一约束条件对上文所例示的OptKnock问题迭代求解来进行。整数切割约束条件有效地防止求解程序选择在专性地将产物生物合成与生长偶合的任一先前迭代中鉴别的完全相同的反应组。例如，如果先前所鉴别的生长偶合性代谢修饰指定要破坏反应1、2和3，那么以下约束条件防止在随后求解中同时考虑相同反应。整数分割方法为相关技艺所熟知且可发现描述于例如布加德等人，生物技术进展17：791-797(2001)中。与所有本文参考与用于代谢建模和模拟的OptKnock计算框架组合使用的方法一样，减少迭代计算分析冗余的整数分割方法还可与相关技艺所熟知的其它计算框架(包括例如

)一起应用。

采用上文和本文所例示的方法，本发明方法允许构筑增加所需产物产生的细胞和生物体，例如，通过将所需产物的产生与经改造而具有所鉴别遗传改变的细胞或生物体的生长偶合来实现。如本文所揭示，已鉴别出将4-HB、4-HBal、4-HBCoA、BDO或腐胺的产生与生物体的生长偶合的代谢改变。经构筑具有所鉴别代谢改变的微生物菌株相对于不存在代谢改变的菌株在指数生长阶段期间产生升高水平的4-HB、4-HBal、4-HBCoA、BDO或腐胺。所述菌株有利于在没有先前所述负选择压力下，可在连续发酵工艺中用于商业生产4-HB、4-HBal、4-HBCoA、BDO或腐胺。尽管本文例示为赋予4-HB、4-HBal、4-HBCoA、BDO或腐胺的生长偶合性产生的代谢改变、尤其一或多个基因破坏，但应理解，可视需要将增加4-HB、4-HBal、4-HBCoA、BDO或腐胺产生的任一基因破坏引入宿主微生物中。

因此，本发明方法提供一组通过诸如OptKnock等计算机方法鉴别的代谢修饰。所述代谢修饰组可包括一或多种代谢反应的功能破坏，包括(例如)通过基因缺失的破坏。对于4-HB、4-HBal、4-HBCoA、BDO或腐胺产生来说，代谢修饰可选自一组本文(包括实例)所述的代谢修饰。

还提供产生具有4-HB、4-HBal、4-HBCoA、BDO或腐胺的稳定生长偶合性产生的非天然微生物的方法。所述方法可包括在计算机鉴别一组增加4-HB、4-HBal、4-HBCoA、BDO或腐胺产生(例如，增加指数生长期间的产生)的代谢修饰；对生物体进行遗传修饰以含有增加4-HB、4-HBal、4-HBCoA、BDO或腐胺产生的所述代谢修饰组；和培养所述经遗传修饰的生物体。如果需要，培养可包括在需要产生4-HB、4-HBal、4-HBCoA、BDO或腐胺的条件下适应性地进化经遗传修饰的生物体。本发明方法可适用于细菌、酵母菌和真菌以及多种其它细胞和微生物，如本文所揭示。

因此，本发明提供包含一或多个增加4-HB、4-HBal、4-HBCoA、BDO或腐胺产生的基因破坏的非天然微生物。在一个实施例中，一或多个基因破坏赋予4-HB、4-HBal、4-HBCoA、BDO或腐胺的生长偶合性产生，并且可例如赋予4-HB、4-HBal、4-HBCoA、BDO或腐胺的稳定生长偶合性产生。在另一实施例中，一或多个基因破坏可将4-HB、4-HBal、4-HBCoA、BDO或腐胺产生与微生物的生长专性地偶合。所述一或多个基因破坏降低相应的一或多种所编码酶的活性。

非天然微生物可具有一或多个包括在如本文所述代谢修饰中的基因破坏。如本文所揭示，可缺失一或多个基因破坏。本发明的所述非天然微生物包括细菌、酵母菌、真菌或多种可适用于发酵工艺的其它微生物中的任一者，如本文所揭示。

因此，本发明提供包含一或多个基因破坏的非天然微生物，其中所述一或多个基因破坏发生于编码蛋白质或酶的基因中，其中所述一或多个基因破坏增加生物体中4-HB、4-HBal、4-HBCoA、BDO或腐胺的产生。4-HB、4-HBal、4-HBCoA、BDO或腐胺的产生可与生长偶合或不与生长偶合。在一特定实施例中，4-HB、4-HBal、4-HBCoA、BDO或腐胺的产生可与生物体的生长专性地偶合，如本文所揭示。

本发明提供具有增加4-HB、4-HBal、4-HBCoA、BDO或腐胺的产生(例如，4-HB、4-HBal、4-HBCoA、BDO或腐胺的生长偶合性产生)的遗传改变(例如基因破坏)的非天然微生物。可(例如)通过遗传改变细胞的代谢途径将产物产生与微生物的指数生长阶段专性地关联，如本文所揭示。遗传改变可增加所需产物的产生或甚至使所需产物成为生长阶段期间的专性产物。本文描述使4-HB、4-HBal、4-HBCoA、BDO或腐胺生物的产生增加和合成水平升高的数组代谢改变或转化。一组内的各改变对应于应进行功能破坏的必需代谢反应。各组内所有反应的功能破坏可使生长阶段期间经改造菌株对4-HB、4-HBal、4-HBCoA、BDO或腐胺的产生增加。.

本文描述诸多包括基因破坏的代谢修饰。所属领域技术人员应理解，一或多种代谢修饰(包括基因破坏)可经组合以增加4-HB、4-HBal、4-HBCoA、BDO或腐胺或以其它方式改良本发明微生物的特性。相较于不含有所述代谢改变的菌株，在合适培养条件下，所述非天然改变中的每一者都可(例如)在微生物的指数生长阶段期间增加4-HB、4-HBal、4-HBCoA、BDO或腐胺的产生且提高其产生量，或以其它方式改良产生4-HB、4-HBal、4-HBCoA、BDO或腐胺的微生物的生长或产生特性。合适条件包括(例如)那些本文所揭示者，包括诸如特定碳源或反应物利用率和/或适应性进化等条件。

鉴于本文所提供的教示和指导，所属领域技术人员应理解，为了引入诸如酶或酶促反应的破坏或衰减等代谢改变，可能需要破坏一或多种参与所述反应的酶的催化活性。或者，代谢改变可包括破坏酶活性或最大活性所必需的调节蛋白质或辅因子的表达。此外，酶促反应所必需的辅因子的遗传损失还可与编码所述酶的基因的破坏具有相同的效应。破坏可通过多种方法发生，包括(例如)在一或多个编码基因序列中缺失编码基因或纳入遗传改变。靶向破坏的编码基因可为一个、一些或全部编码参与催化活性的酶的基因。例如，如果单一酶参与所靶向催化活性，那么破坏可通过降低或消除所编码基因产物的催化活性的遗传改变发生。相似地，如果单一酶是多聚物，包括杂聚物，那么破坏可通过降低或破坏所编码基因产物的一个或全部亚单元的功能的遗传改变发生。活性的破坏可通过损失形成活性复合物所需一或多个亚单元的结合活性、通过破坏多聚复合物的催化亚单元或通过二者实现。还可靶向多聚蛋白质缔合和活性的其它功能以破坏本发明的代谢反应。所述其它功能为所属领域技术人员所熟知。相似地，可通过破坏修饰和/或活化靶酶的蛋白质或酶(例如，将脱辅基酶转变为全酶所需的分子)的表达来降低或消除靶酶活性。此外，可根据本发明破坏单一多肽或多聚复合物的一些或全部功能以降低或废除一或多种参与本发明反应或代谢修饰的酶的催化活性。相似地，可破坏参与本发明反应或代谢修饰的一些或全部酶，只要减少或消除所靶向反应即可。

鉴于本文所提供的教示和指导，所属领域技术人员还应理解，可通过减少或消除由常见基因和/或由所述基因的一或多种展现相似或实质上相同的活性的直系同源物编码的反应来破坏酶促反应。减少常见基因与全部直系同源物二者可完成废除所靶向反应的任何催化活性。然而，破坏常见基因或一或多种直系同源物可降低所靶向反应的足以促进生长与产物生物合成偶合的催化活性。本文例示编码多种代谢修饰的催化活性的常见基因以及其直系同源物。所属领域技术人员应理解，编码所靶向代谢反应的酶的一些或全部基因的破坏可在本发明方法中进行且纳入本发明的非天然微生物中以实现4-HB、4-HBal、4-HBCoA、BDO或腐胺的增加产生或生长偶合性产物产生。

鉴于本文所提供的教示和指导，所属领域技术人员还应理解，可使用熟知方法使酶促活性或表达衰减。如果降低引起酶活性下降到低于途径发挥功能通常所需的临界水平，那么酶活性或量的降低可模拟基因的完全破坏。通过各种不使用基因破坏的技术来降低酶促活性可能对于生物体的活力较为重要。降低酶促活性从而导致基因破坏的相似或相同效应的方法包括(但不限于)：减少基因转录或转译；使mRNA、蛋白质或催化性RNA去稳定；和使影响酶活性或动力学的基因突变(参见桑布鲁克等人，分子克隆：实验室手册，第三版，冷泉港实验室，纽约(2001)；和奥苏贝尔等人，分子生物学现行规范，约翰威利父子公司，巴尔的摩，马里兰州(1999))。天然或施加的调节控制还可实现酶衰减，包括：启动子置换(参见王(Wang)等人，分子生物技术(Mol.Biotechnol.)52(2)：300-308(2012))；损失或改变转录因子(迪特里克(Dietrick)等人，生物化学年鉴(Annu.Rev.Biochem.)79：563-590(2010)；和西米赛维克(Simicevic)等人，分子生物系统(Mol.Biosyst.)6(3)：462-468(2010))；引入抑制性RNA或肽，例如siRNA、反义RNA、RNA或肽/小分子结合适配体、核酶、适配体酶和核开关(威兰德(Wieland)等人，方法(Methods)56(3)：351-357(2012)；奥沙利文(O’Sullivan)，分析和生物分析化学(Anal.Bioanal.Chem.)372(1)：44-48(2002)；和李(Lee)等人，生物技术当前述评(Curr.Opin.Biotechnol.)14(5)：505-511(2003))；和添加降低或破坏酶促活性的药物或其它化学品，例如酶抑制剂、抗生素或靶特异性药物。

所属领域技术人员还应理解并认识到，酶的衰减可于各个水平进行。例如，在基因水平，可使用引起部分或完全无效表型的突变(例如基因破坏)或引起遮蔽基因产物活性的上位遗传效应的突变(美子(Miko)，自然教育(Nature Education)1(1)(2008))来衰减酶。在基因表达水平，衰减方法包括：在产生阶段期间将转录与诸如异丙基硫基-b-半乳糖苷(IPTG)等内源性或外源性诱导物偶合，然后添加低量诱导物或不添加诱导物(唐诺万(Donovan)等人，工业微生物学杂志(J.Ind.Microbiol.)16(3)：145-154(1996)；和汉森(Hansen)等人，当代微生物学(Curr.Microbiol.)36(6)：341-347(1998))；引入或修改基因的正或负调节物；修改真核染色体区中整合有基因的区中的组蛋白乙酰基化/脱乙酰基化(杨(Yang)等人，遗传学与发育新见(Curr.Opin.Genet.Dev.)13(2)：143-153(2003)和库尔迪斯坦尼(Kurdistani)等人，自然综述-分子细胞生物学(Nat.Rev.Mol.Cell Biol.)4(4)：276-284(2003))；引入转位以破坏启动子或调节基因(布雷卡斯顿-布鲁斯汉斯(Bleykasten-Brosshans)等人，法国科学院报告：生物学(C.R.Biol.)33(8-9)：679-686(2011)；和麦库(McCue)等人，公共科学图书馆-遗传学(PLoS Genet.)8(2)：e1002474(2012))；转换可转位组件或启动子区的定向以调节毗邻基因的基因表达(王等人，遗传学(Genetics)120(4)：875-885(1988)；海耶斯(Hayes)，遗传学年鉴(Annu.Rev.Genet.)37：3-29(2003)；在二倍体生物体中，缺失一个等位基因，从而导致异型接合性损失(大学(Daigaku)等人，突变研究/诱变原理和分子机制(Mutation Research/Fundamental andMolecular Mechanisms of Mutagenesis)600(1-2)177-183(2006))；引入增加RNA降解的核酸(豪斯利(Houseley)等人，细胞(Cell)，136(4)：763-776(2009)；或在细菌中，例如，引入转移信使RNA(tmRNA)标签，这可导致RNA降解和核糖体失速(春原(Sunohara)等人，RNA10(3)：378-386(2004)；和春原等人，生物化学杂志279：15368-15375(2004))。在转译水平，衰减可包括：引入罕见密码子以限制转译(安国(Angov)，生物技术杂志(Biotechnol.J.)6(6)：650-659(2011))；引入阻断转译的RNA干扰分子(卡斯特尔(Castel)等人，自然综述-遗传学(Nat.Rev.Genet.)14(2)：100-112(2013)；和川崎(Kawasaki)等人，分子治疗学新见(Curr.Opin.Mol.Ther.)7(2)：125-131(2005)；修改编码序列外侧的区，例如将二级结构引入非转译区(UTR)以阻断转译或降低转译效率(林纳(Ringnér)等人，公共科学图书馆-计算生物学(PLoS Comput.Biol.)1(7)：e72(2005))；添加用于快速转录物降解的RNAase位点(帕斯奎内利(Pasquinelli)，自然综述-遗传学13(4)：271-282(2012)；和阿拉亚诺(Arraiano)等人，欧洲微生物学会联合会微生物学评论(FEMS Microbiol.Rev.)34(5)：883-932(2010)；引入反义RNA寡聚物或反义转录物(梨沢(Nashizawa)等人，生物科学前沿(Front.Biosci.)17：938-958(2012))；引入RNA或肽适配体、核酶、适配体酶、核开关(威兰德等人，方法56(3)：351-357(2012)；奥沙利文，分析和生物分析化学372(1)：44-48(2002)；和李等人，生物技术当前述评14(5)：505-511(2003))；或引入涉及RNA结构的转译调节组件，其可防止或减少可通过小分子的存在或不存在控制的转译(阿劳霍(Araujo)等人，比较功能基因组学(Comparative and Functional Genomics)，论文编号475731，8页(2012))。在酶定位和/或寿命水平，酶衰减可包括：添加用于较快蛋白质转换的降解标签(霍赫斯特拉塞尔(Hochstrasser)，遗传学年鉴(Annual Rev.Genet.)30：405-439(1996)；和袁(Yuan)等人，公共科学图书馆-综合(PLoS One)8(4)：e62529(2013))；或添加使酶分泌或定位于真核细胞中的亚细胞隔室的定位标签，其中所述酶将不能够与其正常底物反应(中井(Nakai)等人，基因组学(Genomics)14(4)：897-911(1992)；和罗素(Russell)等人，细菌学杂志(J.Bact.)189(21)7581-7585(2007))。在转译后调节水平，酶衰减可包括：增加已知抑制剂的细胞内浓度；或修改转译后修饰位点(曼恩等人，自然生物技术21：255-261(2003))。在酶活性水平，酶衰减可包括：添加内源性或外源性抑制剂，例如酶抑制剂、抗生素或靶特异性药物，以降低酶活性；限制诸如维生素B12等必需辅因子对需要所述辅因子的酶的利用率；螯合酶活性所需的金属离子；或引入显性负突变。用于上述衰减的技术的适用性可取决于给定宿主微生物为原核抑或真核，并且应理解，所属领域技术人员可容易地测定用于给定宿主的合适技术。

在一些实施例中，可基于所需产物的生长偶合性形成来使用微好氧性设计。为了对此进行检查，可通过以网络中可行的不同生物质形成速率将产物产率首先最大化且随后最小化来构筑各策略的产生锥(production cone)。如果突变网络的所有可能表型的最右边界是单点，那么其暗示，在网络中可能的最大生物质形成速率下存在产物的独特最优选产率。在其它情况下，可行表型的最右边界是垂直线，指示在最大生物质的点处，网络可制备计算范围内任一量(包括垂直线的最低点处的最低量)的产物。所述设计具有低优先权。

通过本文所揭示方法(例如OptKnock框架)鉴别的4-HB、4-HBal、4-HBCoA、BDO或腐胺产生策略通常是基于其(i)理论产率和任选地(ii)生长偶合的4-HB、4-HBal、4-HBCoA、BDO或腐胺形成特性来分级。

因此，本发明还提供具有一组代谢修饰的非天然微生物，所述代谢修饰增加4-HB、4-HBal、4-HBCoA、BDO或腐胺的产率(任选地将4-HB、4-HBal、4-HBCoA、BDO或腐胺产生与生物体的生长偶合)，或以其它方式改良产生4-HB、4-HBal、4-HBCoA、BDO或腐胺的微生物的特性，其中所述代谢修饰组包括如本文所述一或多个基因的破坏。

如果测定菌株设计不充分地增加4-HB、4-HBal、4-HBCoA、BDO或腐胺的产生和/或不充分地将产物的形成与生物质形成偶合，那么可向各菌株补加其它缺失。或者，已知在生长条件下不具有显着活性的一些其它酶可因适应性进化或随机诱变而变得具有活性。还可敲除所述活性。然而，本文所揭示基因缺失组列表允许构筑展现4-HB、4-HBal、4-HBCoA、BDO或腐胺的高产率产生(包括4-HB、4-HBal、4-HBCoA、BDO或腐胺的生长偶合性产生)的菌株。

4-HB、4-HBal、4-HBCoA、BDO或腐胺可在微生物培养期间(例如，在连续和/或接近连续培养期中)的任一时间点收获或分离，如本文所揭示。通常，微生物在连续和/或接近连续生长阶段中维持越长，可产生4-HB、4-HBal、4-HBCoA、BDO或腐胺的量的比例越大。

因此，本发明另外提供产生4-HB、4-HBal、4-HBCoA、BDO或腐胺的方法，包括培养具有一或多个基因破坏的非天然微生物，如本文所揭示。当一或多个编码增加4-HB、4-HBal、4-HBCoA、BDO或腐胺产生的酶的基因的破坏降低或消除所述酶的活性时，破坏可发生于所述基因，包括任选地将4-HB、4-HBal、4-HBCoA、BDO或腐胺产生与微生物的生长偶合。例如，破坏可使非天然微生物具有4-HB、4HBal、4-HBCoA、BDO或腐胺的稳定生长偶合性产生。

在一些实施例中，基因破坏可包括完全缺失基因。在一些实施例中，用以破坏基因的其它方法包括(例如)通过遗漏或添加寡核苷酸或通过使基因不可操作的突变实现的移码。然而，所属领域技术人员应认识到基因缺失的优点，其使非天然生物体稳定且不会回复到未发生基因破坏的亲本表型。特定来说，基因破坏选自如本文所揭示的基因集。

一旦通过计算或其它方式预测破坏一或多个基因集会增加4-HB、4-HBal、4-HBCoA、BDO或腐胺的产生，那么可构筑、进化并测试菌株。通过相关技艺所熟知的方法将基因破坏(包括基因缺失)引入宿主生物体中。特别可用于基因破坏的方法是通过同源重组，如本文所揭示。

经改造菌株可通过测量生长速率、底物吸收速率和/或产物/副产物分泌速率来描述。可使培养物生长并用作在指数生长期间进行测量的新鲜分批培养用接种物。可通过使用分光亮度计(A600)测量光密度来测定生长速率。培养物上清液中葡萄糖和其它有机酸副产物的浓度可通过如本文所揭示熟知方法(例如HPLC、GC-MS或适于分析所需产物的其它熟知分析方法)测定，并且用于计算吸收和分泌速率。

含有基因破坏的菌株可展现次最佳生长速率，直到其代谢网络已调节到其失去的功能性。为了辅助此调节，可使菌株适应性地进化。通过使菌株经过适应性进化，细胞生长速率成为主要选择压力且迫使突变细胞重新分配其代谢通量以提高其生长速率。最近已证实若干大肠杆菌突变体的此代谢再程序化，所述突变体已在各种底物上适应性地进化而达到通过计算机模型先验预测的生长速率(方(Fong)和帕尔松(Palsson)，自然遗传学(Nat.Genet.)36：1056-1058(2004))。通过适应性进化引起的生长改良可伴有4-HB、4-HBal、4-HBCoA、BDO或腐胺生产率的提高。菌株可任选地以平行运行的一式两份适应性地进化，以解释宿主生物体可展现的进化模式差异(方和帕尔松，自然遗传学36：1056-1058(2004)；方等人，细菌学杂志(J.Bacteriol.)185：6400-6408(2003)；伊瓦拉(Ibarra)等人，自然420：186-189(2002))，所述差异可潜在地导致一种菌株的产生质量优于其它菌株。进化可运行一段时期，通常为2-6周，这取决于所得生长速率改良。一般来说，在获得稳定表型后终止进化。

在适应性进化工艺后，再次通过测量生长速率、底物吸收速率和产物/副产物分泌速率来表征新菌株。通过绘制实际生长和产生产率以及来自代谢建模的产生概况来比较所述结果与理论预测。选择最成功的设计/进化组合进行进一步研究，并且其特征在于实验室规模的分批和连续发酵。支持本文所揭示方法(例如OptKnock方式)的生长偶合性生物化学产生概念还应可生成遗传稳定过度产生者。因此，将培养物以连续模式维持延长时期(例如，一个月或更长)，以评估长期稳定性。可定期取样以确保维持产率和生产率。

适应性进化是可用于增加在非天然环境条件下生长的突变体或经改造微生物菌株或野生型菌株的生长速率的强大技术。其特别可用于经由诸如可使生长偶合性产物形成的OptKnock等方法设计的菌株。因此，向最佳生长菌株进化还将间接地使产生优化。经由基因敲除和适应性进化产生大肠杆菌K-12 MG1655的独特菌株。(方和帕尔松，自然遗传学36：1056-1058(2004))。在此工作中，通过在实现静止期之前将分批培养物连续传代到新鲜培养基中使所有适应性进化培养物维持在延长的指数生长，由此使生长速率成为主要选择压力。在补加有不同碳底物(各敲除菌株有4个)的最低培养基上构筑并进化敲除菌株。以一式两份或一式三份进行进化培养，得到总共50个进化敲除菌株。使进化培养物维持在指数生长直到实现稳定生长速率。计算预测可准确(在10％内)预测所检查50例中的38例中敲除菌株的进化后生长速率。此外，OptKnock设计与适应性进化的组合已改良乳酸产生菌株。(方等人，生物技术与生物工程91：643-648(2005))。相似方法可应用于本文所揭示菌株并应用于各种宿主菌株。

存在诸多用于进行适应性进化的经研发技术。本文揭示实例性方法。在一些实施例中，本发明非天然生物体的优化包括利用适应性进化技术来增加产生菌株的4-HB、4-HBal、4-HBCoA、BDO或腐胺产生和/或稳定性。

连续培养涉及将小体积的生长培养物重复转移到含有新鲜生长培养基的大得多的容器中。当所培养生物体已在新容器中生长到饱和时，重复所述工艺。已在明确显示数年时期内繁殖率一致改良的实验中在文献(连斯基(Lenski)和曲拉维萨诺(Travisano)，美国国家科学院院刊91：6808-6814(1994))中使用这种方法实现最长的持续培养显示。通常，培养物的转移一般是在指数期期间进行，因此每天精确地计算转移体积以维持下一个24小时时期内的指数生长。手工连续稀释便宜且易于平行设置。

在连续培养中，细胞在恒化器中的生长代表极端稀释情形，其中保持极高部分的细胞群体。当培养物生长并变得饱和时，用新鲜培养基更换一小部分生长培养物，从而允许培养物以接近其最大群体大小连续生长。恒化器已用于证实繁殖率的短期快速改良(戴克慧珍(Dykhuizen)，酶学方法(Methods Enzymol.)613-631(1993))。尽管已认识到所述装置的潜在有用性，但传统恒化器而因非故意地选择抗稀释(固定)变体而不能长期持续选择增加繁殖率。所述变体能够通过粘附到恒化器表面来对抗稀释，并且由此胜过较少粘附的个体，包括那些具有较高繁殖率者，因此消除所述装置的预期目的(赵(Chao)和拉姆斯德尔(Ramsdell)，普通微生物学杂志(J.Gen.Microbiol)20：132-138(1985))。一种克服此缺陷的可能方式是具有两个生长室的装置的实施方案，所述实施方案周期性地经历瞬时灭菌阶段，如先前所述(马利埃(Marliere)和梅素(Mutzel)，美国专利第6，686，194号)。

Evolugator^TM是由埃沃鲁盖特LLC(Evolugate，LLC)(盖恩斯维尔，佛罗里达州)研发的连续培养装置且相对于传统进化技术显着节省时间和精力(德克雷西(de Crecy)等人，应用微生物学与生物技术77：489-496(2007))。通过在达到静止期之前将分批培养物连续传代到新鲜培养基中使细胞维持延长的指数生长。通过使光密度测量和液体处置自动化，Evolugator^TM可使用大培养体积进行高速率连续转移，因此在细胞适合度的进化中接近恒化器的效率。例如，将缺乏转译设备组件且生长严重受阻的不动杆菌属ADPI突变体在200代内进化到野生型生长速率的80％。然而，与在单一容器中维持细胞的恒化器不同，所述机器通过在管道圈的细分区中从一个“反应器”移动到下一个反应器来操作，由此消除对壁生长的任何选择。转移体积可调节，并且通常设定为约50％。这种装置的缺陷是其较大且成本高，因此平行运行大量进化是不实际的。此外，对气体添加的调节不良，并且利用现行装置配置不能维持严格厌氧性条件。然而，这是适应性地进化产生菌株的替代方法。

如本文所揭示，可将编码4-HB、4-HBal、4-HBCoA、BDO或腐胺途径的所需活性的核酸引入宿主生物体中。在一些情况下，可能需要修改4-HB、4-Hbal、4-HBCoA BDO或腐胺途径酶或蛋白质的活性以增加4-HB、4-Hbal、4-HBCoA BDO或腐胺的产生。例如，可将增加蛋白质或酶的活性的已知突变引入编码核酸分子中。另外，可应用优化方法来增加酶或蛋白质的活性和/或降低抑制活性，例如，降低负调节物的活性。

一种此类优化方法是定向进化。定向进化是涉及引入靶向特定基因的突变以改良和/或改变酶的性质的强大方式。经改良和/或改变酶可经由研发和实施允许自动化筛选许多酶变体(例如，＞10⁴)的灵敏高通量筛选分析来鉴别。通常进行迭代轮次的诱变和筛选以提供具有优化性质的酶。还已研发出可帮助鉴别基因的诱变用区域的计算算法且其可显着减少需要生成和筛选的酶变体的数量。已研发出诸多定向进化技术(综述参见希伯特(Hibbert)等人，生物分子工程(Biomol.Eng)22：11-19(2005)；胡伊斯曼(Huisman)和拉隆德(Lalonde)，制药与生物技术产业中的生物催化(Biocatalysis in the pharmaceuticaland biotechnology industries pgs.)，第717-742页(2007)，帕特尔(Patel)(编辑)，化学橡胶公司出版社；奥滕(Otten)和夸克斯(Quax).生物分子工程22：1-9(2005)；和森(Sen)等人，应用生物化学与生物技术(Appl Biochem.Biotechnol)143：212-223(2007))，以有效地建立多样变体文库，并且已将所述方法成功地应用于改良许多酶类别的众多种性质。已通过定向进化技术改良和/或改变的酶特性包括(例如)：选择性/特异性，用于转变非天然底物；温度稳定性，用于稳健高温处理；pH稳定性，用于在较低或较高pH条件下的生物处理；底物或产物耐受性，以使得可实现高产物效价；结合(K_m)，包括拓宽底物结合，以包括非天然底物；抑制(K_i)，以去除产物、受用质或关键中间体的抑制；活性(kcat)，用以增加酶促反应速率，从而实现所需通量；表达水平，用以增加蛋白质产率和总体途径通量；氧稳定性，用于在好氧性条件下操作空气敏感性酶；和厌氧性活性，用于在氧不存在下操作好氧性酶。

已研发出诸多实例性方法用于基因的诱变和多样化以靶向特异性酶的所需性质。所述方法为所属领域技术人员所熟知。这些方法中的任一者都可用于改变和/或优化4-HB、4-HBal、4-HBCoA、BDO或腐胺途径酶或蛋白质的活性。所述方法包括(但不限于)EpPCR，其通过降低DNA聚合酶在PCR反应中的忠实性来引入随机点突变(普里乍得(Pritchard)等人，理论生物学杂志(J Theor.Biol.)234：497-509(2005))；易错滚环扩增(epRCA)，其与epPCR相似，只是使用完整环形质粒作为模板且使用在最后2个核苷酸上具有抗外切核酸酶的硫代磷酸酯连接的随机六聚物来扩增质粒，之后转化到细胞中，其中所述质粒以串联重复再环化(Fujii等人，核酸研究32：e145(2004)；和藤井(Fujii)等人，自然-实验手册(Nat.Protoc.)1：2493-2497(2006))；DNA或家族改组，其通常涉及用诸如Dnase I或Endo V等核酸酶消化两个或更多个变体基因以生成随机片段库，在DNA聚合酶存在下通过数次退火和延伸循环来再组装所述库，以产生嵌合基因文库(施特默尔(Stemmer)，美国国家科学院院刊91：10747-10751(1994)；和施特默尔，自然370：389-391(1994))；交错延伸(步骤)，其需要模板引发，之后重复具有变性和极短退火/伸延持续时间(短到5sec)的2步PCR循环(赵(Zhao)等人，自然生物技术16：258-261(1998))；随机引发重组(RPR)，其中使用随机序列引物来生成许多与模板的不同区段互补的短DNA片段(邵(Shao)等人，核酸研究26：681-683(1998))。

其它方法包括异源双链重组，其中使用线性化质粒DNA形成通过错配修复来修复的异源双链(沃尔科夫(Volkov)等人，核酸研究27：e18(1999)；和沃尔科夫等人，酶学方法328：456-463(2000))；瞬时模板上的随机嵌合生长(RACHITT)，其采用单链DNA(ssDNA)的Dnase I片段化和大小分级(科科等人，自然生物技术19：354-359(2001))；截短模板上的重组延伸(RETT)，其使得需要来自引物的单向生长链在用作模板库的单向ssDNA片段存在下的模板转换(李等人，分子催化杂志(J.Molec.Catalysis)26：119-129(2003))；简并寡核苷酸基因改组(DOGS)，其中使用简并引物来控制分子间的重组(伯奎斯特(Bergquist)和吉布斯(Gibbs)，分子生物学方法(Methods Mol.Biol)352：191-204(2007)；伯奎斯特等人，生物分子工程22：63-72(2005)；吉布斯等人，基因271：13-20(2001))；用于产生杂交酶的增量截短(ITCHY)，其产生具有所关注基因或基因片段的1个碱基对缺失的组合文库(欧斯特迈耶(Ostermeier)等人，美国国家科学院院刊96：3562-3567(1999)；和欧斯特迈耶等人，自然生物技术17：1205-1209(1999))；用于产生杂交酶的硫-增量截短(THIO-ITCHY)，其与ITCHY相似，只是使用硫代磷酸酯dNTP来生成截短(鲁茨(Lutz)等人，核酸研究29：E16(2001))；SCRATCHY，其组合两种用于组合基因的方法ITCHY和DNA改组(鲁茨等人，美国国家科学院院刊98：11248-11253(2001))；随机漂移诱变(RNDM)，其中经由epPCR产生突变，之后筛选/选择那些保持可用活性者(伯奎斯特等人，生物分子工程(Biomol.Eng.)22：63-72(2005))；序列饱和诱变(SeSaM)，一种随机诱变方法，其通过随机纳入硫代磷酸酯核苷酸和断裂来生成随机长度片段库，所述库用作模板以在诸如肌苷等“通用”碱基存在下延伸，并且含肌苷补体的复制随机纳入碱基，且随后诱变(黄(Wong)等人，生物技术杂志3：74-82(2008)；黄等人，核酸研究32：e26(2004)；和黄等人，分析生物化学(Anal.Biochem.)341：187-189(2005))；合成改组，其使用经设计用以编码“靶标中的所有遗传多样性”的重叠寡核苷酸且允许经改组子代具有极高多样性(内斯(Ness)等人，自然生物技术20：1251-1255(2002))；核苷酸交换和切除技术Next，其组合dUTP纳入、之后依次用尿嘧啶DNA糖基化酶和哌啶处理以进行端点DNA片段化(穆勒(Muller)等人，核酸研究33：e117(2005))。

其它方法包括非序列同源依赖性蛋白质重组(SHIPREC)，其中使用连接体来促进两个关系较远或无关基因间的融合，并且生成一系列所述两个基因之间的嵌合体，从而产生单交换杂合体文库(西贝尔(Sieber)等人，自然生物技术19：456-460(2001))；基因位点饱和诱变^TM(GSSM^TM)，其中起始材料包括含有插入和两个引物的超螺旋双链DNA(dsDNA)质粒，所述引物是在所需突变位点简并(克雷茨(Kretz)等人，酶学方法388：3-11(2004))；组合式盒诱变(CCM)，其涉及使用短寡核苷酸盒来置换具有大量可能氨基酸序列改变的限制区(雷达尔-奥尔森(Reidhaar-Olson)等人，酶学方法208：564-586(1991)；和雷达尔-奥尔森等人，科学241：53-57(1988))；组合式多盒诱变(CMCM)，其与CCM基本上相似且使用高突变率epPCR来鉴别热点和热区且然后通过CMCM延伸以覆盖蛋白质序列空间的界定区(雷茨等人，应用化学国际英文版40：3589-3591(2001))；突变体菌株技术，其中条件ts突变体质粒利用编码DNA聚合酶III的突变体亚单元的mutD5基因，以允许在选择期间随机和天然突变频率增加20×到4000×，且在无需选择时阻断有害突变累积(夏利弗诺瓦(Selifbnova)等人，应用与环境微生物学67：3645-3649(2001))；刘(Low)等人，分子生物学杂志260：359-3680(1996))。

其它实例性方法包括彻查型(Look-Through)诱变(LTM)，其是评价和优化所选氨基酸的组合式突变的多维诱变方法(拉吉帕(Rajpal)等人，美国国家科学院院刊102：8466-8471(2005))；基因重新组装，其是可一次应用于多个基因或用以产生单一基因的大嵌合体文库(多个突变)的DNA改组方法(由威锐内姆(Verenium)公司供应的可调基因重组装(Tunable GeneReassembly)^TM(TGR^TM)技术)；计算机蛋白质设计自动化(PDA)，其是锚定具有特定折叠的结构界定蛋白质主链的优化算法，并搜索用于氨基酸取代的可稳定折叠和总体蛋白质通量学的序列空间，并且通常对具有已知三维结构的蛋白质的作用最有效(海耶斯等人，美国国家科学院院刊99：15926-15931(2002))；和迭代饱和诱变(ISM)，其涉及利用结构/功能知识来选择可能的酶改良用位点，使用诸如Stratagene QuikChange(斯多塔金；圣地亚哥，加利福尼亚州)等诱变方法在所选位点进行饱和诱变，筛选/选择所需性质，和使用改良克隆于另一位点开始，并持续重复直到实现所需活性为止(雷茨等人，自然-实验手册2：891-903(2007)；和雷茨等人，应用化学国际英文版45：7745-7751(2006))。

上述诱变方法中的任一者可单独使用或以任一组合使用。另外，定向进化方法中的任一者或组合可结合适应性进化技术使用，如本文所述。

应理解，不会实质上影响本发明各个实施例的活性的修改也提供于本文所提供的本发明的定义内。因此，以下实例打算说明但并不限制本发明。

实例I

4-羟基丁酸的生物合成

这个实例描述用于4-HB产生的实例性生物化学途径。

微生物中的4-HB合成的先前报道集中于这种化合物作为生物可降解塑料聚羟基烷酸酯(PHA)的产生中的中间体(美国专利第6,117,658号)。相对于聚-3-羟基丁酸酯聚合物(PHB)，使用4-HB/3-HB共聚物可产生脆性较小的塑料(斋藤(Saito)和土肥(Doi)，国际生物高分子杂志(Intl.J.Biol.Macromol.)16：99-104(1994))。本文所述单体4-HB的产生出于若干原因是根本不同的工艺：(1)所述产物是分泌的，这与PHA相反，其是在细胞内产生且保留在细胞内；(2)对于产生羟基丁酸酯聚合物的生物体来说，不产生游离4-HB，而是由聚羟基烷酸酯合成酶使用辅酶A衍生物；(3)在聚合物的情况下，粒状产物的形成改变热力学；和(4)细胞外pH并非产生聚合物的问题，而其将影响4-HB是以游离酸抑或共轭碱状态存在，并且还影响4-HB与GBL之间的平衡。

4-HB可在两个酶促还原步骤中以琥珀酸半醛作为中间体从TCA循环的中心代谢物琥珀酸酯产生(图1)。这些酶中的第一种琥珀酸半醛脱氢酶为包括大肠杆菌在内的许多生物体所固有，其中已发现依赖NADH和NADPH二者的酶(唐纳利(Donnelly)和库珀(Cooper)，欧洲生物化学杂志113：555-561(1981)；唐纳利和库珀，细菌学杂志145：1425-1427(1981)；马雷克(Marek)和亨森(Henson)，细菌学杂志170：991-994(1988))。还有证据支持啤酒酵母菌中的琥珀酸半醛脱氢酶活性(拉莫斯(Ramos)等人，欧洲生物化学杂志149：401-404(1985))，并且已通过序列同源性鉴别推定基因。然而，多数报道指示，这种酶在琥珀酸酯合成的方向上进行，如图1中所示(唐纳利和库珀，见上文；卢克-埃弗斯洛(Lutke-Eversloh)和斯泰因比歇尔，欧洲微生物学会联合会微生物学快报181：63-71(1999))，参与4-HB和γ-氨基丁酸酯的降解途径。琥珀酸半醛还由诸如大肠杆菌等某些微生物经由TCA循环中间体α-酮戊二酸酯经由两种酶(谷氨酸酯：琥珀酸半醛转氨酶和谷氨酸脱羧酶)的作用天然地产生。由专性厌氧性菌克氏羧菌用于降解琥珀酸酯的替代途径将琥珀酸酯活化成琥珀酰基-CoA，然后使用已知在此方向上发挥功能的替代性琥珀酸半醛脱氢酶将琥珀酰基-CoA转变为琥珀酸半醛(淑玲(Sohling)和戈特沙尔克(Gottschalk)，欧洲生物化学杂志212：121-127(1993))。然而，此路径具有将琥珀酸酯转变为琥珀酰基-CoA所需ATP的能量成本。

所述途径的第二种酶4-羟基丁酸脱氢酶并非大肠杆菌或酵母菌所固有，而是在诸如克氏羧菌和富养产碱菌等各种细菌中发现(卢克-埃弗斯洛和斯泰因比歇尔，见上文；淑玲和戈特沙尔克，细菌学杂志178：871-880(1996)；瓦伦丁(Valentin)等人，欧洲生物化学杂志227：43-60(1995)；沃尔夫(Wolff)和基尼利(Kenealy)，蛋白质的表达和纯化(ProteinExpr.Purif.)6：206-212(1995))。已知所述酶依赖NADH，但还存在依赖NADPH的形式。在大肠杆菌中显示使聚(4-羟基丁酸)累积的从α-酮戊二酸酯实现4-HB的另一途径(宋(Song)等人，微生物学报(Wei Sheng Wu Xue.Bao.)45：382-386(2005))。重组菌株需要三个异源基因(PHA合成酶(富养产碱菌)、4-羟基丁酸脱氢酶(富养产碱菌)和4-羟基丁酸酯：CoA转移酶(克氏羧菌))连同两个天然大肠杆菌基因(谷氨酸酯：琥珀酸半醛转氨酶和谷氨酸脱羧酶)一起过表达。或者，图1中的步骤4和5可由α-酮戊二酸脱羧酶(例如在纤细裸藻中鉴别者)来进行(重冈(Shigeoka)等人，生物化学杂志282(Pt2)：319-323(1992)；重冈和中野(Nakano)，生物化学与生物物理学文献288：22-28(1991)；重冈和中野，生物化学杂志(Biochem J.)292(Pt2)：463-467(1993))。然而，先前尚未应用这种酶来影响任一生物体中4-HB或相关聚合物的产生。

使用各生物体的计算机代谢模型在两种微生物(大肠杆菌和啤酒酵母菌)中探索微生物产生4-羟基丁酸酯的能力。实现4-HB的潜在途径经由琥珀酸酯、琥珀酰基-CoA或α-酮戊二酸酯中间体进行，如图1中所示。

从琥珀酸酯产生4-HB的途径中的第一步骤涉及经由依赖NADH或NADPH的琥珀酸半醛脱氢酶将琥珀酸酯转变为琥珀酸半醛。在大肠杆菌中，gabD是依赖NADP的琥珀酸半醛脱氢酶且是参与4-氨基丁酸酯吸收和降解的基因簇的一部分(尼格曼(Niegemann)等人，微生物学档案(Arch.Microbiol.)160：454-460(1993)；施耐德(Schneider)等人，细菌学杂志184：6976-6986(2002))。人们认为sad编码依赖NAD的琥珀酸半醛脱氢酶活性的酶(马雷克和亨森，见上文)。啤酒酵母菌仅含有推定地指配为UGA2的依赖NADPH的琥珀酸半醛脱氢酶，其定位到细胞溶胶(于(Huh)等人，自然425：686-691(2003))。假定在大肠杆菌与啤酒酵母菌二者中实现4-HB的琥珀酸酯途径的最大产率计算仅需要假定，已将非天然4-HB脱氢酶添加到其代谢网络。

从琥珀酰基-CoA到4-羟基丁酸酯的途径描述于美国专利第6,117,658号中，作为制备包含4-羟基丁酸酯单体单位的聚羟基烷酸酯的工艺的一部分。克氏羧菌是一个已知具有CoA依赖性琥珀酸半醛脱氢酶活性的实例性生物体(淑玲和戈特沙尔克，见上文；淑玲和戈特沙尔克，见上文)。在这个研究中，假定来自克氏酵母菌或另一生物体的这种酶是连同非天然或异源4-HB脱氢酶一起在大肠杆菌或啤酒酵母菌中表达以完成从琥珀酰基-CoA到4-HB的途径。在大肠杆菌中证实使聚(4-羟基丁酸)累积到30％干细胞重量的从α-酮戊二酸酯到4-HB的途径(宋等人，见上文)。由于大肠杆菌和啤酒酵母菌天然地或内源性地具有谷氨酸酯：琥珀酸半醛转氨酶与谷氨酸脱羧酶二者(科莱曼(Coleman)等人，生物化学杂志276：244-250(2001))，因此可通过仅假定存在非天然4-HB脱氢酶在两种生物体中完成从AKG到4-HB的途径。

实例II

从琥珀酸酯和α-酮戊二酸酯生物合成1，4-丁二醇

这个实例说明从微生物构筑和生物合成产生4-HB和BDO。本文揭示用于4-HB和BDO的途径。

存在若干可用于上述途径中的替代酶。用于将琥珀酸酯转变为琥珀酰基-CoA(图1中的步骤1)的天然或内源性酶可由CoA转移酶(例如由cat1基因克氏羧菌所编码者)置换(淑玲和戈特沙尔克，欧洲生物化学杂志(Eur.JBiochem.)212：121-127(1993))，所述CoA转移酶以与步骤9相似的方式发挥功能。然而，由这种酶产生乙酸酯可能并非最佳，这是因为其可能被分泌而非转变回乙酰基-CoA。就此来说，消除步骤9中的乙酸酯形成还可能有益。作为此CoA转移酶的一个替代，可采用以下机制：首先通过ATP将4-HB磷酸化且随后将其转变为CoA衍生物，这与大肠杆菌中用于将乙酸酯转变为乙酰基-CoA的乙酸酯激酶/磷酸转乙酰基酶途径相似。此路径的净成本是一个ATP，这与从乙酸酯再生乙酰基-CoA所需要相同。已知磷酸转丁酰基酶(ptb)和丁酸激酶(bk)对用于在丙酮丁醇梭菌中产生丁酸酯的非羟基化分子进行所述步骤(凯利(Cary)等人，应用与环境微生物学56：1576-1583(1990)；瓦伦丁，R.C.和R.S.乌尔夫(R.S.Wolfe)，生物化学杂志(J Biol Chem.)235：1948-1952(1960))。这些酶是可逆的，允许合成在4-HB的方向上进行。

BDO还可经由α-酮戊二酸酯以及或代替经由琥珀酸酯产生。如先前所述和下文所进一步例示，一种实现产物生物合成的途径是使用内源性酶经由α-酮戊二酸酯产生琥珀酸半醛(图1，步骤4-5)。替代方式是使用可在一个步骤中进行此转变的α-酮戊二酸脱羧酶(图1，步骤8；田(Tian)等人，美国国家科学院院刊102：10670-10675(2005))。

为了构筑产生BDO的微生物的不同菌株，组装一系列适用基因以供确证。简单来说，使用可用文献来源、NCBI遗传数据库和同源性搜索来鉴别图1中所示完整BDO产生途径的各步骤中4-HB和/或BDO生物合成途径内的一或多个基因。此研究中克隆和评价的基因连同多肽序列的合适参考文献和URL引述一起呈现于下表6中。如下文所进一步论述，合成一些基因用于密码子优化，而其它则经由PCR从天然或野生型生物体的基因组DNA克隆。对于一些基因来说，使用两种方式，并且在这种情况下，当用于实验中时，天然基因指示为基因标识号的“n”后缀。注意，仅DNA序列不同；蛋白质是相同的。

表6.产生BDO的宿主微生物中表达的基因.

¹淑玲和戈特沙尔克，欧洲生物化学杂志212：121-127(1993)；淑玲和戈特沙尔克，细菌学杂志178：871-880(1996)

²诺林(Nolling)等人，细菌学杂志183：4823-4838(2001)

³波尔曼(Pohlmann)等人，自然生物技术24：1257-1262(2006)

⁴小坂(Kosaka)等人，生物科学、生物技术与生物化学71：58-68(2007)

⁵布罗施(Brosch)等人，美国国家科学院院刊104：5596-5601(2007)

⁶埃纳(Henne)等人，应用与环境微生物学65：3901-3907(1999)

用于BDO途径的表达载体构筑。载体主链和一些菌株是从伊克斯普拉希斯(Expressys)(expressys.de/)的罗尔夫鲁茨(Rolf Lutz)博士获得。载体和菌株是基于由罗尔夫鲁茨博士和赫尔曼比雅尔(Hermann Bujard)教授研发的pZ表达系统(鲁茨，R.和H.比雅尔，核酸研究25：1203-1210(1997))。所得载体是pZE13luc、pZA33luc、pZS*13luc和pZE22luc且含有荧光素酶基因作为填充片段。为了用侧接有合适限制酶位点的lacZ-α片段置换荧光素酶填充片段，首先通过用EcoRI和XbaI消化从各载体去除荧光素酶填充片段。利用以下引物从pUC19通过PCR扩增lacZ-α片段：

lacZα-RI

lacZα 3′BB

此生成5’末端具有EcoRI位点、NheI位点、核糖体结合位点、SalI位点和起始密码子的片段。在所述片段的3’末端上含有终止密码子、XbaI位点、HindIII位点和AvrII位点。用EcoRI和AvrII消化PCR产物且将其连结到用EcoRI和XbaI消化的基础载体中(XbaI和AvrII具有兼容末端且生成非位点)。由于NheI和XbaI限制酶位点生成可连接在一起的相容末端(但生成不被任一酶消化的NheI/XbaI非位点)，因此克隆到载体中的基因可以“生物砖围砌(Biobrick)”在一起(openwetware.org/wiki/Synthetic_Biology：BioBricks)。简单来说，这种方法允许使用2个相同的限制位点将无限数量的基因接合到载体中(只要所述位点不出现在所述基因内部即可)，这是因为在每次添加后会破坏所述基因之间的位点。

所有载体都依次具有指示复制起点、抗生素抗性标记物和启动子/调节单元的pZ标号以及字母和数字。复制起点是第二个字母且基于起点表示为：E(对于ColE1来说)、A(对于p15A来说)和S(对于pSC101来说)。第一个数字代表抗生素抗性标记物(1为氨苄青霉素(Ampicillin)，2为康霉素(Kanamycin)，3为氯霉素，4为观霉素(Spectinomycin)且5为四环素(Tetracycline))。最后数字界定调节所关注基因的启动子(1为P_LtetO-1，2为P_LlacO-1，3为P_A1lacO-1且4为P_lac/ara-1)。MCS和所关注基因紧随其后。对于本文所论述的工作，采用两种针对如上文所论述生物砖插入进行修改的基础载体pZA33和pZE13。在已将所关注基因克隆到其中后，使用表6中给出的4数字基因代码(例如，pZA33-XXXX-YYYY-...)指示所得质粒。

宿主菌株构筑。本文所述所有研究中的亲本菌株都是大肠杆菌K-12菌株MG1655。由第三方依照服务合同使用redET方法构筑缺失adhE、gabD和aldA的无标记物菌株(迪杜森克，K.A.(Datsenko，K.A.)和B.L.万纳(B.L.Wanner)，美国国家科学院院刊97：6640-6645(2000))。经由噬菌体P1介导的转导构筑后续菌株(米勒，J.(Miller，J.)分子遗传学实验(Experiments in Molecular Genetics)，冷泉港实验室，纽约(1973))。从伊克斯普拉希斯获得菌株C600Z1(laci^q、PN25-tetR、Sp^R、lacY1、leuB6、mcrB+、supE44、thi-1、thr-1、tonA21)且将其用作lacI^q等位基因来源以供P1转导。使噬菌体Plvir在观霉素抗性基因连接到lacI^q的C600Z1大肠杆菌菌株上生长。使用在C600Z1上生长的P1裂解物来感染MG1655以选择观霉素抗性。然后通过测定转导子阻抑连接到P_A1lacO-1启动子的基因表达的能力来针对所连接lacI^q筛选观霉素抗性菌落。所得菌株命名为MG1655 lacI^q。使用相似程序将lacI^Q引入缺失菌株中。

从琥珀酸酯产生4-HB。为了从琥珀酸酯构筑4-HB产生者，将编码从琥珀酸酯到4-HB和4-HB-CoA的步骤(图1中的1、6、7和9)的基因组装到pZA33和pZE13载体上，如下文所述。评价各种基因组合，以及带有不完全途径作为对照的构筑体(表7和8)。然后将质粒转化到含有lacI^Q的宿主菌株中，所述菌株允许通过添加异丙基β-D-1-半乳糖硫吡喃糖苷(IPTG)进行诱导型表达。测试野生型与缺失编码天然琥珀酸半醛脱氢酶(图1中的步骤2)的基因的宿主二者。

首先在活体外分析使用菌株MG1655 lacI^Q作为含有途径基因的质粒构筑体的宿主测试异源酶的活性。使细胞在含有用于各构筑体的合适抗生素的LB培养基(迪福科(Difco))中在好氧性下生长，并且当光密度(OD600)达到约0.5时通过添加1mM IPTG进行诱导。在6小时后收获细胞，并且如下文所论述进行酶分析。

活体外酶分析。为了获得用于活性分析的粗制萃取物，通过以4,500rpm离心(Beckman-Coulter，Allegera X-15R)10min来收获细胞。将沉淀再悬浮于0.3mL含有Benzonase核酸酶和溶菌酶的BugBuster(诺瓦根(Novagen))试剂中，并且在室温下轻轻振荡的同时进行15分钟裂解。通过在4℃下以14,000rpm离心(Eppendorf离心机5402)30min获得无细胞裂解物。使用布拉德福德(Bradfbrd)等人，分析生物化学72：248-254(1976)的方法测定试样中的细胞蛋白质，并且如下文所述进行特定酶分析。活性报告为单位数/mg蛋白质，其中活性单位定义为在室温下在1min内转变1μmol底物所需酶量。一般来说，报告值是至少3个重复分析的平均值。

通过依照先前所述程序监测乙酰基-CoA从琥珀酰基-CoA和乙酸酯的形成来测定琥珀酰基-CoA转移酶(Cat1)活性(淑玲和戈特沙尔克，细菌学杂志178：871-880(1996))。通过依照在ATP存在下琥珀酰基-CoA从琥珀酸酯和CoA的形成来测定琥珀酰基-CoA合成酶(SucCD)活性。实验依照车(Cha)和帕克斯(Parks)，生物化学杂志239：1961-1967(1964)所述的程序。通过依照在琥珀酸半醛和CoA存在下在340nm下NAD转变为NADH来测定CoA依赖性琥珀酸半醛脱氢酶(SucD)活性(淑玲和戈特沙尔克，欧洲生物化学杂志212：121-127(1993))。通过在琥珀酸半醛存在下在340nm下监测NADH到NAD的氧化来测定4-HB脱氢酶(4-HBd)酶活性。所述实验依照已公布程序(格哈特(Gerhardt)等人，微生物学档案174：189-199(2000).使用来自舍夫(Scherf)和比凯尔(Buckel)，应用与环境微生物学57：2699-2702(1991)的经修改程序来测定4-HB CoA转移酶(Cat2)活性。使用HPLC测定从乙酰基-CoA和4-HB或丁酸酯形成4-HB-CoA或丁酰基-CoA的形成。

在还原方向上使用从若干文献来源调整的程序分析醇(ADH)和醛(ALD)脱氢酶(杜瑞尔(Durre)等人，欧洲微生物学会联合会微生物学评论17：251-262(1995)；帕拉索里(Palosaari)和罗杰斯(Rogers)，细菌学杂志170：2971-2976(1988)和韦尔奇(Welch)等人，生物化学与生物物理学文献273：309-318(1989)。在使NADH氧化后，在室温下每4秒读取340nM下的吸亮度，总共240秒。在100mM MOPS(用KOH调节到pH 7.5)、0.4mM NADH和1到50μl细胞萃取物中进行还原分析。通过添加以下试剂开始反应：100μl100mM乙醛或丁醛(对于ADH来说)或100μl 1mM乙酰基-CoA或丁酰基-CoA(对于ALD来说)。快速使分光亮度计变为空白且随后开始动力学读数。所得每分钟340nM下的吸亮度降低的斜率连同340nM下的NAD(P)H的摩尔消光系数(6000)和萃取物的蛋白质浓度可用于测定比活性。

PTB的酶活性是在丁酰基-CoA到丁酰基-磷酸酯方向上测量，如凯利等人，细菌学杂志170：4613-4618(1988)中所述。其提供转变用无机磷酸酯，并且利用试剂5，5’-二硫代双-(2-硝基苯甲酸)或DTNB来追踪游离CoA的增加。DTNB迅速与诸如CoA等硫醇基反应而释放黄色2-硝基-5-巯基苯甲酸(TNB)，TNB在412nm下吸光，并且摩尔消光系数为14，140M cm^-1。分析缓冲液含有150mM磷酸钾(pH 7.4)、0.1mM DTNB和0.2mM丁酰基-CoA，并且通过添加2μL到50μL细胞萃取物开始反应。在丁酸酯到丁酰基-磷酸酯形成方向上以ATP为代价测量BK的酶活性。所述程序与先前由罗斯(Rose)等人，生物化学杂志211：737-756(1954)所述用于乙酸酯激酶的分析相似。然而，已发现，由西格玛(Sigma)提供的另一乙酸酯激酶分析方案更为有用且灵敏。此分析将以下转变关联：ATP由乙酸酯激酶转变为ADP，与ADP和磷酸烯醇丙酮酸酯(PEP)由丙酮酸酯激酶关联转变为ATP和丙酮酸酯，之后丙酮酸酯和NADH由乳酸脱氢酶转变为乳酸酯和NAD+。用丁酸酯取代乙酸酯是允许分析追踪BK酶活性的唯一重要修饰。分析混合物含有80mM三乙醇胺缓冲液(pH 7.6)、200mM丁酸钠、10mM MgCl2、0.1mMNADH、6.6mM ATP、1.8mM磷酸烯醇丙酮酸酯。根据制造商说明书添加丙酮酸酯激酶、乳酸脱氢酶和肌激酶。通过添加2μL到50μL细胞萃取物开始反应，并且基于指示NADH氧化的340nm下的吸亮度降低来监测反应。

通过HPLC分析CoA衍生物。研发基于HPLC的分析来监测涉及辅酶A(CoA)转移的酶促反应。所研发方法允许通过定量测定存在于活体外反应混合物中的CoA、乙酰基CoA(AcCoA)、丁酰基CoA(BuCoA)和4-羟基丁酸CoA(4-HBCoA)进行酶活性表征。实现低到低μM的灵敏度，以及所有所关注CoA衍生物的极佳解析。

化学品和试样制备进行如下。简单来说，CoA、AcCoA、BuCoA和所有其它化学品都从西格玛-奥德里奇(Sigma-Aldrich)获得。溶剂、甲醇和乙腈为HPLC级。标准校准曲线在0.01-1mg/mL浓度范围内展现极佳线性度。酶促反应混合物含有100mM Tris HCl缓冲液(pH7)，在不同时间点取等分试样，用甲酸(0.04％最终浓度)淬灭且直接通过HPLC分析。

使用配备有二元泵、除气器、恒温自动进样器和管柱隔室的安捷伦(Agilent)1100HPLC系统进行HPLC分析，并使用二极管阵列检测器(DAD)进行所述分析。采用反相管柱Kromasil1005um C18，4.6×150mm(皮克科技(Peeke Scientific))。使用25mM磷酸钾(pH7)和甲醇或乙腈作为水性和有机溶剂，流速为1mL/min。研发出两种方法：短时方法，其具有较快梯度，用于分析经充分解析的CoA、AcCoA和BuCoA；和较长时方法，其用于区分密切洗脱的AcCoA与4-HBCoA。短时方法采用乙腈梯度(0min-5％、6min-30％、6.5min-5％、10min-5％)且使CoA、AcCoA和BuCoA的滞留时间分别为2.7min、4.1min和5.5min。在长时方法中，使用甲醇与以下线性梯度：0min-5％、20min-35％、20.5min-5％、25min-5％。CoA、AcCoA、4-HBCoA和BuCoA的滞留时间分别为5.8min、8.4min、9.2min和16.0min。注射体积是5μL，管柱温度为30℃，并且在260nm下监测UV吸亮度。

结果显示4个途径步骤中每一者的活性(表7)，但活性明确地取决于基因来源、基因在载体中的位置和与其一起表达的其它基因的情况。例如，基因0035所编码琥珀酸半醛脱氢酶的活性强于由0008所编码者，并且0036和0010n是活性强于0009的4-HB脱氢酶基因。在相同操纵子上在基因之前存在另一基因时，还似乎存在更优选4-HB脱氢酶活性。

表7.来自MG1655 lacI^Q的细胞萃取物中的活体外酶活性，所述MG1655 lacI^Q含有表达4-HB-CoA途径中的基因的质粒.活性报告为单位数/mg蛋白质，其中活性单位定义为在室温下在1min内转变1μmol底物所需酶量。

	pZE13(a)	pZA33(b)	OD600		Cat1	SucD	4HBd	Cat2
									1	cat1(0004)		2.71	6.43	1.232	0.00
2	cat1(0004)-sucD(0035)		2.03	5.00	0.761	2.57
									3	cat1(0004)-sucD(0008)		1.04	3.01	0.783	0.01
4	sucD(0035)		2.31	6.94		2.32
									5	sucD(0008)		1.10	4.16		0.05
6		4hbd(0009)	2.81	7.94	0.003		0.25
									7		4hbd(0036)	2.63	7.84			3.31
8		4hbd(0010n)	2.00	5.08			2.57
									9	cat1(0004)-sucD(0035)	4hbd(0009)	2.07	5.04	0.600	1.85	0.01
10	cat1(0004)-sucD(0035)	4hbd(0036)	2.08	5.40	0.694	1.73	0.41
									11	cat1(0004)-sucD(0035)	4hbd(0010n)	2.44	4.73	0.679	2.28	0.37
12	cat1(0004)-sucD(0008)	4hbd(0009)	1.08	3.99	0.572	-0.01	0.02
									13	cat1(0004)-sucD(0008)	4hbd(0036)	0.77	2.60	0.898	-0.01	0.04
14	cat1(0004)-sucD(0008)	4hbd(0010n)	0.63	2.47	0.776	0.00	0.00
									15		cat2(0034)	2.56	7.86				1.283
16		cat2(0034)-4hbd(0036)	3.13	8.04			24.86	0.993
									17		cat2(0034)-4hbd(0010n)	2.38	7.03			7.45	0.675
18		4hbd(0036)-cat2(0034)	2.69	8.26			2.15	7.490
									19		4hbd(0010n)-cat2(0034)	2.44	6.59			0.59	4.101

从pZE13上的Plac表达的基因，pZE13是具有colE1起点和氨苄青霉素抗性的高拷贝质粒。基因标识号如表6中所给出

从pZA33上的Plac表达的基因，pZA33是具有pACYC起点和氯霉素抗性的中等拷贝质粒。

(c)细胞蛋白质以mg蛋白质/mL萃取物给出。

然后评估含有4-HB途径中的基因的重组菌株在活体内从中心代谢中间体产生4-HB的能力。使细胞在LB培养基中在厌氧性下生长到OD600为约0.4，然后利用1mM IPTG进行诱导。1小时后，琥珀酸钠添加到10mM，并且在另外24小时和48小时后，取样进行分析。通过GC-MS分析培养液中的4-HB，如下文所述。结果指示，在24小时后，重组菌株可产生超过2mM的4-HB，相比之下，对照菌株中基本上为0(表8)。

表8.在具有表达4-HB途径基因的各种组合的质粒的大肠杆菌菌株中从琥珀酸酯产生4-HB。

(a)正规化4-HB浓度，μM/OD600单位

使用CoA转移酶(cat1)从琥珀酸酯产生琥珀酰基-CoA的替代方式是使用编码琥珀酰基-CoA合成酶的天然大肠杆菌sucCD基因。将此基因簇连同用于实现4-HB的其余步骤的基因候选物一起克隆到pZE13上以产生pZE13-0038-0035-0036。

从葡萄糖产生4-HB。尽管上述实验显示从中心代谢中间体(琥珀酸酯)实现4-HB的功能途径，但工业工艺将需要从诸如葡萄糖或蔗糖等低成本碳水化合物原料产生化学品。因此，下一组实验的目的在于测定细胞在葡萄糖上生长期间产生的内源性琥珀酸酯是否可向4-HB途径供给燃料。使细胞在补加有20g/L葡萄糖、100mM用以改良缓冲能力的3-(N-吗啉基)丙磺酸(MOPS)、10μg/mL硫胺素和合适抗生素的M9最低培养基(6.78g/L Na₂HPO₄、3.0g/LKH₂PO₄、0.5g/L NaCl、1.0g/L NH₄Cl、1mM MgSO₄、0.1mM CaCl₂)中在厌氧性下生长。当OD600达到约0.2时，添加0.25mM IPTG，并且在诱导后每24小时取样进行4-HB分析。在所有情况下，4-HB在24小时后达到平稳，其中最优选菌株中最大为约1mM(图3a)，而琥珀酸酯浓度持续上升(图3b)。这指示，向所述途径供给琥珀酸酯可能不受限制，并且瓶颈可在于酶本身的活性或NADH利用率。0035和0036分别明确地是CoA依赖性琥珀酸半醛脱氢酶和4-HB脱氢酶的最优选基因候选物。消除编码已知(gabD)或推定(aldA)的天然琥珀酸半醛脱氢酶的基因中一者或二者对性能几乎没有影响。最终，应注意，细胞在产生4-HB的菌株中生长实现的OD远远低于在对照中所实现者(图3c)。

从葡萄糖产生4-HB的替代途径是经由α-酮戊二酸酯。吾人探索了使用来自结核分枝杆菌的α-酮戊二酸脱羧酶(田等人，美国国家科学院院刊102：10670-10675(2005))从α-酮戊二酸酯直接产生琥珀酸半醛(图1中的步骤8)。为了证实此基因(0032)在活体内具有功能，吾人使其在与pZA33上的4-HB脱氢酶(基因0036)相同的宿主中在pZE13上表达。此菌株能够在用1mM IPTG诱导后24小时内产生超过1.0mM的4-HB(图4)。由于此菌株不表达CoA依赖性琥珀酸半醛脱氢酶，因此消除经由琥珀酰基-CoA产生琥珀酸半醛的可能性。负责产生琥珀酸半醛的天然基因还可能在这个途径中发挥功能(图1中的步骤4和5)；然而，当宿主不包括pZE13-0032质粒时所产生4-HB的量是可忽略的。

从4-HB产生BDO。从4-HB产生BDO需要两个由脱氢酶催化的还原步骤。醇脱氢酶和醛脱氢酶(分别为ADH和ALD)是依赖NAD+/H和/或NADP+/H的酶，其可一起将分子上的羧酸基还原为醇基，或相反，可将醇氧化为羧酸。已在野生型丙酮丁醇梭菌中证实此生物转化(朱厄尔等人，当代微生物学，13：215-19(1986))，但未鉴别出相关酶与相关基因。另外，尚不了解，是否首先需要活化成4-HB-CoA(图1中的步骤9)，或是否醛脱氢酶(步骤12)可直接作用于4-HB。吾人基于对4-HB的非羟基化类似物和途径中间体的已知活性或通过与所述经表征基因(表6)的相似性研发了来自丙酮丁醇梭菌和相关生物体的候选酶列表。由于一些候选物是多官能脱氢酶，因此其可潜在地催化依赖NAD(P)H的酸(或衍生自CoA)到醛的还原和醛到醇的还原。在开始在大肠杆菌中处理所述基因之前，吾人首先使用丙酮丁醇梭菌ATCC824验证上文引用的结果。在30℃下使细胞在补加有10mM 4-HB的舍德勒(Schaedler)培养液(埃库米迪亚(Accumedia)，蓝辛，密执安州)中在10％CO₂、10％H₂和80％N₂的厌氧性大气中生长。取周期性培养试样，进行离心，并且通过GC-MS分析培养液的BDO，如下文所述。分别在1天、2天和7天培育后检测到0.1mM、0.9mM和1.5mM的BDO浓度。在未添加4-HB的生长培养物中未检测到BDO。为了证实所产生BDO是源自葡萄糖，使产生BDO的最优选菌株MG1655lacI^Q pZE13-0004-0035-0002pZA33-0034-0036在补加有4g/L均匀标记¹³C-葡萄糖的M9最低培养基中生长。利用1mM IPTG在0.67的OD下诱导细胞，并且在24小时后取样。通过质谱进行对培养物上清液的分析。

接下来测试4-HB到BDO转变途径的基因候选物在大肠杆菌宿主MG1655 lacI^Q中表达时的活性。在37℃下使含有pZA33上表达的各基因候选物的重组菌株在0.25mM IPTG存在下生长4小时以完全诱导酶的表达。在诱导后4小时，收获细胞并分析ADH和ALD活性，如上文所述。由于4-HB-CoA和4-羟基丁醛未在市场上销售，因此使用非羟基化底物(表9)进行分析。丙酮丁醇梭菌adhE2(0002)和大肠杆菌adhE(0011)的4-碳底物与2-碳底物之间的活性比率与那些先前于文献(渥美(Atsumi)等人，生物化学与生物物理学报.1207：1-11(1994))中所报道者相似。

表9.来自含有表达醛脱氢酶和醇脱氢酶的基因候选物的pZA33的MG1655 lacI^Q的细胞萃取物中的活体外酶活性.活性表示为μmol min^-1mg细胞蛋白质^-1。N.D.，未测定。

对于BDO产生实验来说，在用于将4-HB转变为4-HB-CoA的pZA33上包括来自牙龈卟啉单胞菌W83的cat2(基因0034)，而使候选脱氢酶基因在pZE13上表达。宿主菌株是MG1655lacI^Q。因底物的相似性，因此还连同醇脱氢酶和醛脱氢酶候选物一起，测试CoA依赖性琥珀酸半醛脱氢酶(sucD)在此步骤中发挥功能的能力。使细胞在补加有10mM 4-HB的LB培养基中生长到约0.5的OD，用1mM IPTG诱导，并且在24小时后取培养液试样并分析BDO，如下文所述。使用来自丙酮丁醇梭菌的adhE2、来自克氏羧菌的sucD或来自牙龈卟啉单胞菌的sucD时出现最优选BDO产生(图5)。有趣的是，所产生BDO的绝对量在好氧性条件下较高；然而，这主要归因于在厌氧性培养中实现的较低细胞密度。当正规化成细胞OD时，BDO产生/单位生物质在厌氧性条件下较高(表10)。

表10.表达来自丙酮丁醇梭菌的adhE2、来自克氏羧菌的sucD或来自牙龈卟啉单胞菌的sucD的细胞培养物的绝对和正规化BDO浓度(图3中的来自实验2、9和10的数据)，以及阴性对照(实验1)。

如上文所论述，可有利地使用用于将4-HB转变为4-HB-CoA的路径，所述路径不生成乙酸酯作为副产物。为实现此目标，测试使用来自丙酮丁醇梭菌的磷酸转丁酰基酶(ptb)和丁酸激酶(bk)经由图1中的步骤10和11进行此转变。在pZA33中克隆并表达来自丙酮丁醇梭菌的天然ptb/bk操纵子(基因0020和0021)。获取来自含有所得构筑体的细胞的萃取物且分析两种酶活性，如本文所述。BK的比活性是约65U/mg，而PTB的比活性是约5U/mg。一单位(U)活性定义为在1分钟内在室温下转变1μM底物。最终，测试构筑体在4-HB转变为BDO中的参与。用所述pZA33-0020-0021构筑体和pZE13-0002转化宿主菌株，并且将其与cat2在使用图5中的上文所用好氧性程序产生BDO中的使用比较。BK/PTB菌株产生1mM BDO，相比之下，当使用cat2时，产生2mM(表11)。有趣的是，结果取决于宿主菌株是否含有天然adhE基因缺失。

表11.来自表达pZE13中的来自丙酮丁醇梭菌的adhE2以及pZA33上的来自牙龈卟啉单胞菌的cat2(0034)或来自丙酮丁醇梭菌的PTB/BK基因的细胞培养物的绝对和正规化BDO浓度。宿主菌株是MG1655 lacI^Q或MG1655ΔadhE lacI^Q。

从葡萄糖产生BDO。途径确证的最终步骤是表达大肠杆菌中的途径的4-HB与BDO区段二者且显示在葡萄糖最低培养基中产生BDO。构筑新质粒以将所有所需基因都装配于两种质粒上。一般来说，cat1、adhE和sucD基因是从pZE13表达，并且cat2和4-HBd是从pZA33表达。在MG1655lacI^Q背景中测试基因来源和基因顺序的各种组合。使细胞在补加有20g/L葡萄糖、100mM用以改良缓冲能力的3-(N-吗啉基)丙磺酸(MOPS)、10μg/mL硫胺素和合适抗生素的M9最低培养基(6.78g/L Na₂HPO₄、3.0g/L KH₂PO₄、0.5g/L NaCl、1.0g/L NH₄Cl、1 mMMgSO₄、0.1mM CaCl₂)中在厌氧性下生长。在接种后约15小时添加0.25mM IPTG，并且在诱导后24小时和48小时取培养物上清液试样进行BDO、4-HB和琥珀酸酯分析。BDO的产生似乎显示对基因顺序的依赖性(表12)。利用在pZA33上首先表达cat2、之后表达4-HBd和在pZE13上表达cat1、之后表达牙龈卟啉单胞菌sucD获得超过0.5mM的最高BDO产生。在pZE13上的最后位置添加丙酮丁醇梭菌adhE2产生轻微改良。还产生较高浓度的4-HB和琥珀酸酯。

表12.在补加有20g/L葡萄糖的最低培养基中生长且表达BDO途径基因的组合的重组大肠杆菌菌株中BDO、4-HB和琥珀酸酯的产生。浓度以mM给出。

通过GCMS对BDO、4-HB和琥珀酸酯的分析。发酵和细胞培养试样中的BDO、4-HB和琥珀酸酯通过硅烷基化衍生化且使用从文献报道调整的方法通过GCMS进行定量分析((西蒙诺夫(Simonov)等人，分析化学杂志(J.Anal Chem.)59：965-971(2004))。所研发方法显示低到1μM的良好灵敏度、最高至少25mM的线性度，以及极佳选择性和重现性。

如下进行试样制备：在环境温度下在Speed Vac浓缩器(Savant SVC-100H)中将100μL过滤(0.2μm或0.45μm针筒过滤器)试样(例如发酵液、细胞培养物或标准溶液)干燥约1小时，之后添加20μL 10mM环己醇的二甲基甲酰胺溶液作为内标。在水浴(Branson 3510)中对混合物进行涡旋和声波处理15min以确保均质性。添加100μL硅烷基化衍生化试剂(即具有1％三甲基氯硅烷的N，O-双(三甲基硅烷基)三氟-乙酰胺(BSTFA))，在70℃下将混合物培育30min。将衍生化试样离心5min，并将透明溶液直接注入GCMS中。除了BDO购自J.T.贝克尔(J.T.Baker)之外，所有化学品和试剂都来自西格玛-奥德里奇。

在安捷伦气相色谱仪6890N上进行GCMS，其已界面连接到以电子冲击电离(EI)模式操作的质量选择性检测器(MSD)5973N已用于分析。使用30m×0.25mm内径×0.25μm膜厚度的DB-5MS毛细管管柱(J&W科技(J&W Scientific)，安捷伦科技(AgilentTechnologies))。GC是以分流注射模式操作，以20∶1分流比引入1μL试样。注射口温度是250℃。使用氦作为载气，并且流速维持在1.0mL/min。优化温度梯度程序以确保对所关注分析物的良好分辨率和最低基质干扰。首先使烘箱在80℃下保持1min，然后以2℃/min斜升到120℃，之后以100℃/min快速斜升到320℃且最终在320℃下保持6min。MS界面转移线维持在280℃。使用‘轻质’MS调整设定和30-400m/z质量范围扫描获取数据。总分析时间是29min，包括3min溶剂延迟。BSTFA-衍生化环己醇、BDO、4-HB和琥珀酸酯的滞留时间分别对应于5.2min、10.5min、14.0min和18.2min。对于定量分析而定，选择以下比质量片段(萃取离子色谱图)：m/z 157(对于内标环己醇)，m/z 116(对于BDO)和m/z 147(对于4-HB和琥珀酸酯二者)。在相应细胞培养或发酵培养基中使用分析物溶液构筑标准校准曲线以尽可能接近地匹配试样矩阵。使用环境数据分析(Environmental Data Analysis)ChemStation软件(安捷伦科技)处理GCMS数据。

结果指示，所产生多数4-HB和BDO经¹³C标记(图6，右侧)。显示在未经标记葡萄糖中生长的平行培养物的质谱用于比较(图6，左侧)。注意，所见到的峰属于来自代谢物的含有不同碳原子数的衍生化分子片段。由于衍生化试剂还贡献天然标记分布的一些碳原子和硅原子，因此结果并非严格定量。

使用替代途径从4-HB产生BDO。还测试各种替代途径的BDO产生。此包括使用天然大肠杆菌SucCD酶将琥珀酸酯转变为琥珀酰基-CoA(表13，第2-3行)，使用α-酮戊二酸酯途径中的α-酮戊二酸脱羧酶(表13，第4行)，和使用PTB/BK作为生成4HB的CoA衍生物的替代手段(表13，第1行)。构筑含有表达表13中所示基因的质粒的菌株，其涵盖这些变体。结果显示，在所有情况下，都可产生4-HB和BDO(表13)。

表13.在不同BDO途径变体的重组大肠杆菌菌株基因中的BDO、4-HB和琥珀酸酯产生，其在补加有20g/L葡萄糖的最低培养基中在厌氧性下生长，且在用0.1mM IPTG后诱导24小时收获。浓度以mM给出。

实例III

4-羟基丁酸、γ-丁内酯和1，4-丁二醇的生物合成

这个实例描述使用发酵和其它生物工艺生物合成产生4-羟基丁酸、γ-丁内酯和1，4-丁二醇。

下文描述将4-HB发酵步骤整合到用于产生经纯化GBL、1，4-丁二醇(BDO)和四氢呋喃(THF)的完整工艺中的方法。由于4-HB和GBL处于平衡状态，因此发酵液将含有两种化合物。在低pH下，此平衡经转移而有利于GBL。因此，发酵可在pH 7.5或更低(通常为pH 5.5或更低)下操作。在去除生物质后，产物流进入分离步骤中，其中去除GBL且使富集4-HB的剩余流再循环。最终，蒸馏GBL以去除任何杂质。所述工艺以三种方式中的一者操作：1)分批补料发酵和分批分离；2)分批补料发酵和连续分离；3)连续发酵和连续分离。这些模式中之前两种示意性地示于图7中。本发明的产生BDO的细胞还使用下文描述的整合发酵程序来生物合成BDO以及后续BDO家族产物。

用以产生4-HB/GBL的发酵方案(分批)：使产生生物体在用N₂/CO₂混合物吹扫的10L生物反应器中生长，其中使用含有5g/L磷酸钾、2.5g/L氯化铵、0.5g/L硫酸镁和30g/L玉米浸液且初始葡萄糖浓度为20g/L的5L培养液。当细胞生长并利用葡萄糖时，以大致平衡葡萄糖消耗的速率将额外70％葡萄糖进料到生物反应器中。生物反应器的温度维持在30℃。生长持续约24小时，直到4-HB达到介于20-200g/L之间的浓度，并且细胞密度介于5g/L与10g/L之间。pH不受控制，并且到运行结束时通常将降低到pH3-6。在培养期完成后，使发酵器内容物经过细胞分离单元(例如，离心机)以去除细胞和细胞碎片，并且将发酵液转移到产物分离单元。4-HB和/或GBL的分离将通过相关技艺所用从稀水溶液分离有机产物的标准分离程序发生，例如使用水不混溶有机溶剂(例如，甲苯)进行液液萃取以提供4-HB/GBL的有机溶液。然后使所得溶液经过标准蒸馏方法以去除和再循环有机溶剂并提供作为经纯化液体分离的GBL(沸点为204-205℃)。

产生4-HB/GBL的发酵方案(完全连续)：首先使用上述设备和培养基组成使产生生物体以分批模式成长，但初始葡萄糖浓度改为30-50g/L。当葡萄糖耗尽时，以介于0.5L/hr与1L/hr之间的速率连续供应相同组成的进料培养基，并且以相同速率取出液体。生物反应器中的4-HB浓度保持恒定在30-40g/L，并且细胞密度保持恒定介于3-5g/L之间。温度维持在30℃，并且视需要使用浓NaOH和HCl使pH维持在4.5。将生物反应器连续操作一个月，其中每天取样，以确保4-HB保持恒定浓度。在连续模式中，当供应新进料培养基时，应不断排除发酵器内容物。然后在去除或不去除细胞和细胞碎片的情况下使含有细胞、培养基和产物4-HB和/或GBL的排出流经过连续产物分离程序，其作法为通过相关技艺所采用的标准连续分离方法，从稀水溶液中分离有机产物，例如使用水不混溶有机溶剂(例如，甲苯)进行连续液液萃取，以提供4-HB/GBL的有机溶液。随后使所得溶液经过标准连续蒸馏方法，以去除和再循环有机溶剂，并提供作为纯化液体分离的GBL(沸点为204℃-205℃)。

GBL还原法：一旦如上文所述分离并纯化GBL后，即可接着进行还原法，例如相关技艺所熟知者(参见所引用参考文献)，以产生1，4-丁二醇或四氢呋喃(THF)或其混合物。相关技艺熟知，在氢压力下，异相或均相氢化催化剂与GBL的组合可提供产物1，4-丁二醇或四氢呋喃(THF)或其混合物。重要的是应注意，如上文所述自发酵液分离的4-HB/GBL产物混合物可能在GBL分离和纯化之前直接进行所述相同还原法，产生产物1，4-丁二醇或四氢呋喃或其混合物。然后通过相关技艺所熟知的程序分离并纯化所得产物1，4-丁二醇和THF。

用以直接产生BDO或THF的发酵和氢化方案(分批)：

使细胞在用N₂/CO₂混合物吹扫的10L生物反应器中生长，其中使用含有5g/L磷酸钾、2.5g/L氯化铵、0.5g/L硫酸镁和30g/L玉米浸液且初始葡萄糖浓度为20g/L的5L培养液。当细胞生长并利用葡萄糖时，以大致平衡葡萄糖消耗的速率将额外70％葡萄糖进料到生物反应器中。生物反应器的温度维持在30℃。生长持续约24小时，直到4-HB达到介于20-200g/L之间的浓度，并且细胞密度介于5g/L与10g/L之间。不控制pH，并且到运行结束时通常将降低到pH 3-6。在培养期完成后，使发酵器内容物经过细胞分离单元(例如，离心机)以去除细胞和细胞碎片，并且将发酵液转移到还原单元(例如，氢化容器)，其中将混合物4-HB/GBL直接还原成1，4-丁二醇或THF或其混合物。在还原程序完成后，将反应器内容物转移到产物分离单元。1，4-丁二醇和/或THF的分离将通过相关技艺所用从稀水溶液分离有机产物的标准分离程序发生，例如使用水不混溶有机溶剂(例如，甲苯)进行液液萃取以提供1，4-丁二醇和/或THF的有机溶液。然后使所得溶液经过标准蒸馏方法以去除和再循环有机溶剂并提供1，4-丁二醇和/或THF，所述1，4-丁二醇和/或THF作为经纯化液体分离。

用以直接产生BDO或THF的发酵和氢化方案(完全连续)：首先使用上述设备和培养基组成使细胞以分批模式成长，只是初始葡萄糖浓度为30-50g/L。当葡萄糖耗尽时，以介于0.5L/hr与1L/hr之间的速率连续供应相同组成的进料培养基，并且以相同速率取出液体。生物反应器中的4-HB浓度保持恒定在30-40g/L，并且细胞密度保持恒定介于3-5g/L之间。温度维持在30℃，并且视需要使用浓NaOH和HCl使pH维持在4.5。将生物反应器连续地操作一个月，其中每天取样以确保4-HB浓度的一致性。在连续模式中，当供应新进料培养基时，不断地去除发酵器内容物。然后使含有细胞、培养基和产物4-HB和/或GBL的排出流经过细胞分离单元(例如，离心机)以去除细胞和细胞碎片，并且将发酵液转移到连续还原单元(例如，氢化容器)，其中将混合物4-HB/GBL直接还原成1，4-丁二醇或THF或其混合物。在还原程序完成后，将反应器内容物转移到连续产物分离单元。1，4-丁二醇和/或THF的分离将通过相关技艺所用从稀水溶液分离有机产物的标准连续分离程序发生，例如使用水不混溶有机溶剂(例如，甲苯)进行液液萃取以提供1，4-丁二醇和/或THF的有机溶液。然后使所得溶液经过标准连续蒸馏方法以去除和再循环有机溶剂并提供1，4-丁二醇和/或THF，所述1，4-丁二醇和/或THF作为经纯化液体分离。

用以直接产生BDO的发酵方案(分批)：使产生生物体在用N₂/CO₂混合物吹扫的10L生物反应器中生长，其中使用含有5g/L磷酸钾、2.5g/L氯化铵、0.5g/L硫酸镁和30g/L玉米浸液且初始葡萄糖浓度为20g/L的5L培养液。当细胞生长并利用葡萄糖时，以大致平衡葡萄糖消耗的速率将额外70％葡萄糖进料到生物反应器中。生物反应器的温度维持在30℃。生长持续约24小时，直到BDO达到介于20-200g/L之间的浓度，其中细胞密度通常介于5g/L与10g/L之间。在培养期完成后，使发酵器内容物经过细胞分离单元(例如，离心机)以去除细胞和细胞碎片，并且将发酵液转移到产物分离单元。BDO的分离将通过相关技艺所用从稀水溶液分离有机产物的标准分离程序发生，例如使用水不混溶有机溶剂(例如，甲苯)进行液液萃取以提供BDO的有机溶液。然后使所得溶液经过标准蒸馏方法以去除和再循环有机溶剂并提供BDO(沸点为228-229℃)，所述BDO作为经纯化液体分离。

用以直接产生BDO的发酵方案(完全连续)：首先使用上述设备和培养基组成使产生生物体以分批模式成长，只是初始葡萄糖浓度为30-50g/L。当葡萄糖耗尽时，以介于0.5L/hr与1L/hr之间的速率连续供应相同组成的进料培养基，并且以相同速率取出液体。生物反应器中的BDO浓度保持恒定在30-40g/L，并且细胞密度保持恒定介于3-5g/L之间。温度维持在30℃，并且视需要使用浓NaOH和HCl使pH维持在4.5。将生物反应器连续地操作一个月，其中每天取样以确保BDO浓度的一致性。在连续模式中，当供应新进料培养基时，不断地去除发酵器内容物。然后在去除或不去除细胞和细胞碎片的情况下使含有细胞、培养基和产物BDO的排出流经过连续产物分离程序，并且将通过相关技艺所用从稀水溶液分离有机产物的标准连续分离方法发生，例如使用水不混溶有机溶剂(例如，甲苯)进行连续液液萃取以提供BDO的有机溶液。随后使所得溶液经过标准连续蒸馏方法以去除和再循环有机溶剂并提供BDO(沸点为228-229℃)，所述BDO作为经纯化液体分离(mpt为20℃)。

实例IV

实例性BDO途径

这个实例描述用于1，4-丁二醇(BDO)合成途径的实例性酶和相应基因。

实例性BDO合成途径示于图8-13中。绘示于图8-13中的途径是来自实现1，4-丁二醇的常见中心代谢中间体。绘示于图8-13中的所有转化属于示于表14中的18个一般转化类别。下文描述各类别中的诸多以生物化学方式表征的基因候选物。具体来说，列示可应用于在宿主生物体中克隆和表达时催化图9-13中的合适转化的基因。图9-13中各关键步骤的前三个实例性基因提供于表15-23中(参见下文)。本文描述提供用于绘示于图8中的途径的实例性基因。

表14.将常见中心代谢中间体转变为1，4-丁二醇所需的酶类型.各标记的前三个数字对应于前三个酶学委员会(Enzyme Commission)编号数字，其表示独立于底物特异性的转化的一般类型。

标记	功能
		1.1.1.a	氧化还原酶(酮到羟基或醛到醇)
1.1.1.c	氧化还原酶(2步，酰基-CoA到醇)
		1.2.1.b	氧化还原酶(酰基-CoA到醛)
1.2.1.c	氧化还原酶(2-氧代酸到酰基-CoA，脱羧)
		1.2.1.d	氧化还原酶(磷酸化/去磷酸化)
1.3.1.a	对CH-CH供体操作的氧化还原酶
		1.4.1.a	对氨基酸操作的氧化还原酶
2.3.1.a	酰基转移酶(转移磷酸基团)
		2.6.1.a	氨基转移酶
2.7.2.a	磷酸转移酶，羧基受体
		2.8.3.a	辅酶-A转移酶
3.1.2.a	硫醇酯水解酶(CoA特异性)
		4.1.1.a	羧基-裂解酶
4.2.1.a	水裂解酶
		4.3.1.a	氨裂解酶
5.3.3.a	异构酶
		5.4.3.a	氨基变位酶
6.2.1.a	酸-硫醇连接酶

1.1.1.a-氧化还原酶(醛到醇或酮到羟基)

醛到醇。编码催化醛转变为醇的酶(也就是，醇脱氢酶或等效醛还原酶)的实例性基因包括编码C2-C14中链醇脱氢酶的alrA(塔尼(Tani)等人，应用与环境微生物学66：5231-5235(2000))、来自啤酒酵母菌的ADH₂(渥美等人，自然451：86-89(2008))、来自对长于C(3)的分子具有偏好的大肠杆菌的yqhD(苏尔岑巴赫(Sulzenbacher)等人，分子生物学杂志(Journal of Molecular Biology)342：489-502(2004))和来自将丁醛转变为丁醇的丙酮丁醇梭菌的bdh I和bdh II(沃尔特(Walter)等人，细菌学杂志(Journal ofBacteriology)174：7149-7158(1992))。如果可用，那么所述实例性基因产物中每一者的蛋白质序列可使用以下基因库登录号找到：

基因	登录号	GI号	生物体
				alrA	BAB12273.1	9967138	不动杆菌属菌株M-1
ADH2	NP_014032.1	6323961	啤酒酵母菌
				yqhD	NP_417484.1	16130909	大肠杆菌(Escherichia coli)
bdh I	NP_349892.1	15896543	丙酮丁醇梭菌
				bdh II	NP_349891.1	15896542	丙酮丁醇梭菌

展现4-羟基丁酸脱氢酶活性的酶(EC 1.1.1.61)也属于这个类别。所述酶已在富养产碱菌(布拉沃(Bravo)等人，法医学杂志49：379-387(2004)、克氏羧菌(沃尔夫等人，蛋白质的表达和纯化6：206-212(1995))和拟南芥(布雷特刘兹(Breitkreuz)等人，生物化学杂志278：41552-41556(2003))中进行表征。

基因	登录号	GI号	生物体
				4hbd	YP_726053.1	113867564	富养产碱菌H16
4hbd	L21902.1	146348486	克氏羧菌DSM 555
				4hbd	Q94B07	75249805	拟南芥

另一实例性酶是催化3-羟基异丁酸酯可逆氧化为甲基丙二酸酯半醛的3-羟基异丁酸酯脱氢酶。这种酶参与缬氨酸、亮氨酸和异亮氨酸降解且已在细菌、真核生物和哺乳动物中鉴别到。由来自嗜热栖热菌HB8的P84067编码的酶已在结构上进行表征(洛卡纳特(Lokanath)等人，J Mol Biol352：905-17(2005))。使用同位素标记的底物证实人类3-羟基异丁酸酯脱氢酶的可逆性(曼宁(Manning)等人，生物化学杂志231：481-484(1985))。编码这种酶的其它基因包括智人(霍斯(Hawes)等人，酶学方法324：218-228(2000))和穴兔(乔杜里(Chowdhury)等人，生物科学、生物技术与生物化学60：2043-2047(1996)；霍斯等人，酶学方法324：218-228(2000))中的3hidh、绣色假单胞菌中的mmsb和恋臭假单胞菌中的dhat(埃伯哈特(Aberhart)等人，化学协会会刊(J Chem.Soc.)[珀金(Perkin)1]6：1404-1406(1979)；乔杜里等人，生物科学、生物技术与生物化学67：438-441(2003)；乔杜里等人，生物科学、生物技术与生物化学60：2043-2047(1996))。

还已显示，若干3-羟基异丁酸酯脱氢酶将丙二酸半醛转变为3-羟基丙酸(3-HP)。三种展现此活性的基因候选物是来自绣色假单胞菌PAO1(62)的mmsB、来自恋臭假单胞菌KT2440的mmsB(廖(Liao)等人，美国公开案2005/0221466)和来自恋臭假单胞菌E23的mmsB(乔杜里等人，生物科学、生物技术与生物化学60：2043-2047(1996))。还已在粪产碱杆菌(Alcaligenes faecalis)M3A中鉴别出具有3-羟基丁酸脱氢酶活性的酶(高坎姆(Gokam)等人，美国专利第7,393,676号；廖等人，美国公开案第2005/0221466号)。来自其它生物体(包括类球红杆菌)的其它基因候选物可通过序列相似性推测。

基因	登录号	GI号	生物体
				mmsB	AAA25892.1	151363	绣色假单胞菌
mmsB	NP_252259.1	15598765	绣色假单胞菌PAO1
				mmsB	NP_746775.1	26991350	恋臭假单胞菌KT2440
mmsB	JC7926	60729613	恋臭假单胞菌E23
				orfB1	AAL26884	16588720	类球红杆菌

丙二酸半醛转变为3-HP还可通过两种其它酶实现：依赖NADH的3-羟基丙酸酯脱氢酶和依赖NADPH的丙二酸酯半醛还原酶。认为依赖NADH的3-羟基丙酸酯脱氢酶参与细菌和植物中从丙酸酯的β-丙氨酸生物合成途径(拉西纳萨巴帕西，B.(Rathinasabapathi，B.)植物病理学杂志(Journal of Plant Pathology)159：671-674(2002)；施塔特曼，E.R.(Stadtman，E.R.)美国化学学会会志77：5765-5766(1955))。迄今尚未将这种酶与任一生物体中的基因相关。依赖NADPH的丙二酸酯半醛还原酶催化自养CO₂-固定细菌中的逆反应。尽管已在瑟杜生金属球菌中检测到所述酶活性，但对基因一致性不了解(阿尔贝(Alber)等人，细菌学杂志188：8551-8559(2006))。

酮到羟基。存在若干将酮转变为羟基官能团的实例性醇脱氢酶。来自大肠杆菌的两种所述酶是由苹果酸脱氢酶(mdh)和乳酸脱氢酶(ldhA)编码。另外，已显示，来自富养产碱菌的乳酸脱氢酶对不同链长的底物(例如乳酸酯、2-氧代丁酸酯、2-氧代戊酸酯和2-氧代戊二酸酯)显示高活性(斯泰因比歇尔和施莱格尔，欧洲生物化学杂志130：329-334(1983))。可由2-酮己二酸酯还原酶催化将α-酮己二酸酯转变为α-羟基己二酸酯，所述酶被报道在大鼠和人类胎盘中发现(须田(Suda)等人，生物化学与生物物理学文献176：610-620(1976)；须田等人，生物化学与生物物理学研究通讯77：586-591(1977))。用于此步骤的另一候选物是已经克隆和表征的来自人类心脏的线粒体3-羟基丁酸脱氢酶(bdh)(马克斯(Marks)等人，生物化学杂志267：15459-15463(1992))。这种酶是作用于3-羟酸的脱氢酶。另一实例性醇脱氢酶将丙酮转变为异丙醇，如拜氏梭菌(伊斯梅尔(Ismaiel)等人，细菌学杂志175：5097-5105(1993))和布氏嗜热厌氧性杆菌(拉尼德(Lamed)等人，生物化学杂志195：183-190(1981)；佩雷茨(Peretz)和伯斯坦(Burstein)生物化学28：6549-6555(1989))中所示。

基因	登录号	GI号	生物体
				mdh	AAC76268.1	1789632	大肠杆菌
ldhA	NP_415898.1	16129341	大肠杆菌
				ldh	YP_725182.1	113866693	富养产碱菌
bdh	AAA58352.1	177198	智人
				adh	AAA23199.2	60592974	天然拜氏梭菌NRRL B593
adh	P14941.1	113443	布氏嗜热厌氧性杆菌HTD4

将乙酰乙酰基-CoA转变为3-羟基丁酰基-CoA的实例性3-羟基酰基脱氢酶包括来自丙酮丁醇梭菌的hbd(博因顿(Boynton)等人，细菌学杂志178：3015-3024(1996))、来自拜氏梭菌的hbd(科尔比(Colby)等人，应用与环境微生物学58：3297-3302(1992))和诸多来自瑟杜生金属球菌的相似酶(博格(Berg)等人，古细菌.科学318：1782-1786(2007))。

基因	登录号	GI号	生物体
				hbd	NP_349314.1	15895965	丙酮丁醇梭菌
hbd	AAM14586.1	20162442	天然拜氏梭菌
				Msed_1423	YP_001191505	146304189	瑟杜生金属球菌
Msed_0399	YP_001190500	146303184	瑟杜生金属球菌
				Msed_0389	YP_001190490	146303174	瑟杜生金属球菌
Msed_1993	YP_001192057	146304741	瑟杜生金属球菌

1.1.1.c-氧化还原酶(2步，酰基-CoA到醇)

将酰基-CoA转变为醇的实例性2步氧化还原酶包括那些转化诸如以下等底物者：乙酰基-CoA到乙醇(例如，来自大肠杆菌的adhE(凯斯勒(Kessler)等人，欧洲生物化学学会联合会快报281：59-63(1991))和丁酰基-CoA到丁醇(例如，来自丙酮丁醇梭菌的adhE2(方丹(Fontaine)等人，细菌学杂志184：821-830(2002))。除将乙酰基-CoA还原成乙醇外，还已显示，由肠膜样明串珠菌中的adhE编码的酶将支链化合物异丁醛氧化成异丁酰基-CoA(风早(Kazahaya)等人，普通和应用微生物学杂志(J.Gen.Appl.Microbiol.)18：43-55(1972)；古(Koo)等人，生物技术通讯(Biotechnol Lett.)27：505-510(2005))。

基因	登录号	GI号	生物体
				adhE	NP_415757.1	16129202	大肠杆菌
adhE2	AAK09379.1	12958626	丙酮丁醇梭菌
				adhE	AAV66076.1	55818563	肠膜样明串珠菌

另一实例性酶可将丙二酰基-CoA转变为3-HP。具有此活性的依赖NADPH的酶已在嗜热光合绿曲菌中进行表征，其中其参与3-羟基丙酸酯循环(赫格勒(Hugler)等人，细菌学杂志184：2404-2410(2002)；斯特劳斯(Strauss)和富克斯(Fuchs)，欧洲生物化学杂志215：633-643(1993))。这种酶的质量为300kDa，具有高度底物特异性且几乎不显示与其它已知氧化还原酶的序列相似性(赫格勒等人，细菌学杂志184：2404-2410(2002))。已显示，其它生物体中的酶都不催化此特异性反应；然而，有生物信息学证据表明，其它生物体可具有相似途径(克拉特(Klatt)等人，环境微生物学(Environ.Microbiol.)9：2067-2078(2007))。其它生物体(包括凯斯特玫瑰弯菌、赤杆菌NAP1和海洋γ变形菌HTCC2080)中的酶候选物可通过序列相似性推测。NAP1和海洋γ变形菌HTCC2080可通过序列相似性推测。

基因	登录号	GI号	生物体
				mcr	AAS20429.1	42561982	嗜热光合绿曲菌
Rcas_2929	YP_001433009.1	156742880	凯斯特玫瑰弯菌
				NAP1_02720	ZP_01039179.1	85708113	赤杆菌属NAP1
MGP2080_00535	ZP_01626393.1	119504313	海洋γ变形菌HTCC2080

较长链酰基-CoA分子可由诸如编码形成醇的脂肪酰基-CoA还原酶的荷荷巴(jojoba)(蜡黄杨)FAR等酶还原。其在大肠杆菌中的过表达产生FAR活性和脂肪醇累积(梅斯(Metz)等人，植物生理学(Plant Physiology)122：635-644(2000))。

基因	登录号	GI号	生物体
				FAR	AAD38039.1	5020215	蜡黄杨

1.2.1.b-氧化还原酶(酰基-CoA到醛)

若干酰基-CoA脱氢酶能够将酰基-CoA还原成其对应醛。编码所述酶的实例性基因包括编码脂肪酰基-CoA还原酶的乙酸钙不动杆菌acr1(赖泽尔(Reiscr)和萨莫维尔(Somerville)，细菌学杂志179：2969-2975(1997))、不动杆菌M-1脂肪酰基-CoA还原酶(石毛(Ishige)等人，应用与环境微生物学68：1192-1195(2002))和由克氏羧菌中的sucD基因编码的CoA依赖性和NADP依赖性的琥珀酸半醛脱氢酶(淑玲和戈特沙尔克，细菌学杂志178：871-80(1996)；淑玲和戈特沙尔克，细菌学杂志178：871-880(1996))。牙龈卟啉单胞菌的SucD是另一琥珀酸半醛脱氢酶(高桥(Takahashi)等人，细菌学杂志182：4704-4710(2000))。假单孢菌中的由bphG编码的酰化乙醛脱氢酶是另一酶，这是因为已显示其氧化并酰化乙醛、丙醛、丁醛、异丁醛和甲醛(帕洛斯基(Powlowski)等人，细菌学杂志175：377-385(1993))。

将酰基-CoA转变为其对应醛的另一酶类型是丙二酰基-CoA还原酶，其将丙二酰基-CoA转化成丙二酸半醛。丙二酰基-CoA还原酶是嗜热嗜酸古细菌中经由3-羟基丙酸酯循环进行自养碳固定中的关键酶(博格等人，科学318：1782-1786(2007)；陶厄尔，R.K.(Thauer，R.K.)科学318：1732-1733(2007))。所述酶利用NADPH作为辅因子且已在金属球菌和硫化叶菌中进行表征(阿尔贝等人，细菌学杂志188：8551-8559(2006)；赫格勒等人，细菌学杂志184：2404-2410(2002))。所述酶是由瑟杜生金属球菌中的Msed_0709编码(阿尔贝等人，细菌学杂志188：8551-8559(2006)；博格等人，科学318：1782-1786(2007))。将编码来自托克达硫化叶菌的丙二酰基-CoA还原酶的基因克隆于大肠杆菌中并使其在其中异源表达(阿尔贝等人，细菌学杂志188：8551-8559(2006))。尽管所述酶的醛脱氢酶功能与来自嗜热光合绿曲菌的双功能脱氢酶相似，但几乎没有序列相似性。两种丙二酰基-CoA还原酶候选物都与天冬氨酸酯-半醛脱氢酶具有高度序列相似性，所述酶催化天冬氨酰基-4-磷酸酯到天冬氨酸半醛的还原和同时去磷酸化。其它基因候选物可通过与其它生物体(包括硫磺矿硫化叶菌和嗜酸热硫化叶菌)中的蛋白质的序列同源性发现。

基因	登录号	GI号	生物体
				Msed_0709	YP_001190808.1	146303492	瑟杜生金属球菌
mcr	NP_378167.1	15922498	托克达硫化叶菌
				asd-2	NP_343563.1	15898958	硫磺矿硫化叶菌
Saci_2370	YP_256941.1	70608071	嗜酸热硫化叶菌

1.2.1.c-氧化还原酶(2-氧代酸到酰基-CoA，脱羧)

此家族中的酶包括1)支链2-酮酸脱氢酶、2)α-酮戊二酸脱氢酶和3)丙酮酸脱氢酶多酶复合物(PDHC)。所述酶是催化一系列导致2-酮酸酰化氧化脱羧的部分反应的多酶复合物。各2-酮酸脱氢酶复合物都占据中间代谢中的关键位置，并且酶活性通常受到严格调节(弗里斯(Fries)等人，生物化学42：6996-7002(2003))。所述酶共有由以下三种催化组分的多拷贝构成的复杂但常见的结构：α-酮酸脱羧酶(E1)、二氢硫辛酰胺酰基转移酶(E2)和二氢硫辛酰胺脱氢酶(E3)。生物体中所有2-酮酸脱氢酶复合物都共有E3组分，而E1和E2组分是由不同基因编码。酶组分以诸多拷贝存在于复合物中且利用多个辅因子经由底物沟道效应催化定向序列反应。所述脱氢酶复合物的总体大小极大，且分子质量介于4百万Da与1千万Da之间(也就是，大于核糖体)。

在大肠杆菌中的厌氧性条件下，2-酮酸脱氢酶家族中的酶的活性通常较低或有限。增加NADH(或NADPH)的产生可导致氧化还原失衡，并且NADH本身用作酶功能抑制剂。改造努力已增加大肠杆菌丙酮酸脱氢酶复合物的厌氧性活性(金(Kim)等人，应用与环境微生物学73：1766-1771(2007)；金等人，细菌学杂志190：3851-3858(2008)；周(Zhou)等人，生物技术通讯30：335-342(2008))。例如，NADH的抑制效应可通过改造E3组分中的H322Y突变来克服(金等人，细菌学杂志190：3851-3858(2008))。对个别组分的结构研究和其如何在复合物中一起作用有助于深刻理解此家族中的酶的催化机制和架构(沙瓦臣(Aevarsson)等人，自然结构生物学(Nat.Struct.Biol.)6：785-792(1999)；周等人，美国国家科学院院刊98：14802-14807(2001))。脱氢酶复合物的底物特异性在不同生物体中有所不同，但支链酮酸脱氢酶通常具有最广泛的底物范围。

α-酮戊二酸脱氢酶(AKGD)将α-酮戊二酸酯转变为琥珀酰基-CoA且是经过TCA循环的代谢通量的主要控制位点(汉斯福德，R.G.(Hansford，R.G.)生物能学当前课题(Curr.Top.Bioenerg.)10：217-278(1980))。由大肠杆菌中的基因sucA、sucB和lpd编码的AKGD基因表达在厌氧性条件下且在葡萄糖上生长期间下调(帕克(Park)等人，分子微生物学(Mol.Microbiol.)15：473-482(1995))。尽管AKGD的底物范围较窄，但对E2组分的催化核心的结构研究准确找到负责底物特异性的特定残基(纳普(Knapp)等人，分子生物学杂志280：655-668(1998))。由odhAB(E1和E2)和pdhD(E3，共有结构域)编码的枯草芽孢杆菌AKGD是在转录水平上调节，并且依赖于碳源和生物体的生长阶段(瑞斯尼可夫(Resnekov)等人，分子和普通遗传学(Mol.Gen.Genet.)234：285-296(1992))。在酵母菌中，编码E3组分的LPD1基因是在转录水平上由葡萄糖调节(罗伊(Roy)和道斯(Dawes)，普通微生物学杂志(J.Gen.Microbiol.)133：925-933(1987))。由KGD1编码的E1组分也是由葡萄糖调节且由HAP2与HAP3的产物活化(雷佩托(Repetto)和扎果洛夫(Tzagoloff)，分子细胞生物学(Mol.CellBiol.)9：2695-2705(1989))。已在哺乳动物系统中对受产物NADH和琥珀酰基-CoA抑制的AKGD酶复合物进行充分研究，这是因为已将受损功能与若干神经疾病关联(特雷特(Tretter)和丹-维齐(dam-Vizi)，伦敦皇家学会哲学汇刊，B辑：生物科学(Philos.Trans.R.Soc.Lond B Biol.Sci.)360：2335-2345(2005))。

支链2-酮酸脱氢酶复合物(BCKAD)，还称作2-氧代异戊酸脱氢酶，参与支链氨基酸降解途径，将缬氨酸、亮氨酸和异亮氨酸的2-酮酸衍生物转变为其酰基-CoA衍生物和CO₂。已在许多生物体中研究所述复合物，所述生物体包括枯草芽孢杆菌(王等人，欧洲生物化学杂志213：1091-1099(1993))、褐鼠(难波(Namba)等人，生物化学杂志244：4437-4447(1969))和恋臭假单胞菌(索加兹(Sokatch)，细菌学杂志148：647-652(1981))。在枯草芽孢杆菌中，所述酶是由基因pdhD(E3组分)、bfmBB(E2组分)、bfmBAA和bfmBAB(E1组分)编码(王等人，欧洲生物化学杂志213：1091-1099(1993))。在哺乳动物中，所述复合物是通过特定磷酸酶和蛋白质激酶磷酸化来调节。已在大鼠肝细胞中研究所述复合物(基科(Chicco)等人，生物化学杂志269：19427-19434(1994))且其是由基因Bckdha(E1 α)、Bckdhb(E1β)、Dbt(E2)和Dld(E3)编码。已使恋臭假单胞菌BCKAD复合物的E1和E3组分结晶(沙瓦臣等人，自然结构生物学6：785-792(1999)；迈特威(Mattevi)，科学255：1544-1550(1992))且已对酶复合物进行研究(索加兹等人，细菌学杂志148：647-652(1981))。恋臭假单胞菌BCKAD基因的转录是由bkdR的基因产物活化(赫丝特(Hester)等人，欧洲生物化学杂志233：828-836(1995))。在包括褐鼠(帕克斯顿等人，生物化学杂志234：295-303(1986))和啤酒酵母菌(辛克莱等人，国际生物化学与分子生物学31：911-922(1993))在内的一些生物体中，已显示，此复合物具有宽底物范围，所述范围除包括支链氨基酸前体以外，还包括诸如2-氧代丁酸酯和α-酮戊二酸酯等直链氧代酸。牛BCKAD的活性位点经改造以偏好替代底物乙酰基-CoA(孟和庄，生物化学33：12879-12885(1994))。

还已深入研究催化丙酮酸酯转变为乙酰基-CoA的丙酮酸脱氢酶复合物。在大肠杆菌酶中，E1组分中的特定残基负责底物特异性(比斯瓦根，H.(Bisswanger，H.)生物化学杂志256：815-822(1981)；布雷默，J.(Bremer，J.)，欧洲生物化学杂志8：535-540(1969)；贡(Gong)等人，生物化学杂志275：13645-13653(2000))。如先前所述，酶改造努力已改良厌氧性条件下的大肠杆菌PDH酶活性(金等人，应用与环境微生物学73：1766-1771(2007)；金，细菌学杂志190：3851-3858(2008)；周等人，生物技术通讯30：335-342(2008))。与大肠杆菌PDH不同，枯草芽胞杆菌复合物在厌氧性条件下具有活性且是生长所需(中野，细菌学杂志179：6749-6755(1997))。在甘油上生长期间表征的肺炎克雷伯氏菌PDH在厌氧性条件下也具有活性(门泽尔(Menzel)等人，生物技术杂志56：135-142(1997))。可获得来自牛肾的酶复合物(周等人，美国国家科学院院刊98：14802-14807(2001))和来自棕色固氮菌(Azotobacter vinelandii)的E2催化结构域(迈特威等人，科学255：1544-1550(1992))的晶体结构。一些哺乳动物PDH酶复合物可对诸如2-氧代丁酸酯等替代底物起反应，但褐鼠PDH和BCKAD的比较动力学指示，BCKAD对作为底物的2-氧代丁酸酯具有更高活性(帕克斯顿等人，生物化学杂志234：295-303(1986))。

基因	登录号	GI号	生物体
				aceE	NP_414656.1	16128107	大肠杆菌菌株K12亚株MG1655
aceF	NP_414657.1	16128108	大肠杆菌菌株K12亚株MG1655
				lpd	NP_414658.1	16128109	大肠杆菌菌株K12亚株MG1655
pdhA	P21881.1	3123238	枯草芽胞杆菌
				pdhB	P21882.1	129068	枯草芽胞杆菌
pdhC	P21883.2	129054	枯草芽胞杆菌
				pdhD	P21880.1	118672	枯草芽胞杆菌
aceE	YP_001333808.1	152968699	肺炎克雷伯氏菌MGH78578
				aceF	YP_001333809.1	152968700	肺炎壳雷伯氏菌MGH78578
lpdA	YP_001333810.1	152968701	肺炎克雷伯氏菌MGH78578
				Pdhal	NP_001004072.2	124430510	褐鼠
Pdha2	NP_446446.1	16758900	褐鼠
				Dlat	NP_112287.1	78365255	褐鼠
Dld	NP_955417.1	40786469	褐鼠

作为上述大的多酶2-酮酸脱氢酶复合物的替代，一些厌氧性生物体利用2-酮酸氧化还原酶家族(OFOR)中的酶来催化2-酮酸的酰化氧化脱羧。与脱氢酶复合物不同，所述酶含有铁-硫簇，利用不同辅因子，并且使用铁氧化还原蛋白或黄素氧化还原蛋白作为电子受体替代NAD(P)H。尽管此家族中的多数酶特异性对丙酮酸酯作为底物(POR)，但已显示，一些2-酮酸：铁氧化还原蛋白氧化还原酶接受众多种2-酮酸作为底物，包括α-酮戊二酸酯和2-氧代丁酸酯(福田(Fukuda)和若木(Wakagi)，生物化学与生物物理学报1597：74-80(2002)；张等人，生物化学杂志120587-599(1996))。一种此类酶是来自嗜热嗜酸古细菌托克达硫化叶菌7的OFOR，其含有由基因ST230编码的α和β亚单元(福田和若木，生物化学与生物物理学报1597：74-80(2002)；张等人，生物化学杂志120：587-599(1996))。已研发基于质粒的表达系统用于在大肠杆菌中有效表达此蛋白质(福田等人，欧洲生物化学杂志268：5639-5646(2001))并测定参与底物特异性的残基(福田和若木，生物化学与生物物理学报1597：74-80(2002))。最近还已将两种来自敏捷气热菌菌株K1的OFOR克隆到大肠杆菌中，进行表征，且发现其与众多种2-氧代酸反应(西泽(Nishizawa)等人，欧洲生物化学学会联合会快报579：2319-2322(2005))。可获得所述OFOR候选物的基因序列，但迄今尚未对其指配基因库标识符。有生物信息学证据表明，在所有古细菌、一些厌氧性细菌和线粒体真核生物中存在相似酶(福田和若木，生物化学与生物物理学报1597：74-80(2005))。此类酶还从能量角度引人关注，这是因为可使用经还原铁氧化还原蛋白通过铁氧化还原蛋白-NAD还原酶生成NADH(珀蒂德芒热(Petitdemange)等人，生物化学与生物物理学报421：334-337(1976))。此外，由于多数酶经设计以在厌氧性条件下作用，因此对于厌氧性环境中的活性来说，可能相对于2-酮酸脱氢酶复合物家族中的酶需要更少酶改造。

基因	登录号	GI号	生物体
				ST2300	NP_378302.1	15922633	托克达硫化叶菌7

1.2.1.d-氧化还原酶(磷酸化/去磷酸化)

此类中的实例性酶包括将甘油醛-3-磷酸酯转变为D-甘油酸酯1，3-双磷酸酯的甘油醛3-磷酸酯脱氢酶(例如，大肠杆菌gapA(布朗朗(Branlant)和布朗朗，欧洲生物化学杂志150：61-66(1985))、将L-天冬氨酸酯-4-半醛转变为L-4-天冬氨酰基-磷酸酯的天冬氨酸酯-半醛脱氢酶(例如，大肠杆菌asd(比尔曼(Biellmann)等人，欧洲生物化学杂志104：53-58(1980))、将N-乙酰基-L-谷氨酸酯-5-半醛转变为N-乙酰基-L-谷氨酰基-5-磷酸酯的N-乙酰基-γ-谷氨酰基-磷酸酯还原酶(例如，大肠杆菌argC(帕尔索(Parsot)等人，基因68：275-283(1988))和将L-谷氨酸酯-5-半醛转变为L-谷氨酰基-5-磷酸酯的谷氨酸酯-5-半醛脱氢酶(例如，大肠杆菌proA(史密斯(Smith)等人，细菌学杂志157：545-551(1984))。

基因	登录号	GI号	生物体
				gapA	P0A9B2.2	71159358	大肠杆菌
asd	NP_417891.1	16131307	大肠杆菌
				argC	NP_418393.1	16131796	大肠杆菌
proA	NP_414778.1	16128229	大肠杆菌

1.3.1.a-对CH-CH供体作用的氧化还原酶

实例性烯酰基-CoA还原酶是来自丙酮丁醇梭菌的bcd的基因产物(渥美等人，代谢工程(2007)；博因顿等人，细菌学杂志178：3015-3024(1996)，其天然催化巴豆酰基-CoA到丁酰基-CoA的还原。这种酶的活性可通过结合编码电子转移黄素蛋白的丙酮丁醇梭菌etfAB基因的表达使bcd表达来增强。烯酰基-CoA还原酶步骤的另一候选物是来自纤细裸藻的线粒体烯酰基-CoA还原酶(霍夫迈斯特等人，生物化学杂志(Journal of BiologicalChemistry)280：4329-4338(2005))。将去除线粒体靶向前导序列后从此序列获得的构筑体克隆于大肠杆菌中，从而产生活性酶(霍夫迈斯特等人，见上文，(2005))。这种方式为那些熟习表达原核生物体中的原核基因(尤其那些具有可使基因产物靶向特定细胞内区室的前导序列者)的技术者所熟知。来自原核齿垢密螺旋体的此基因的亲密同源物TDE0597代表已在大肠杆菌中克隆和表达的第三种烯酰基-CoA还原酶(图齐(Tucci)和马丁(Martin)，欧洲生物化学学会联合会快报(FEBS Letters)581：1561-1566(2007))。

基因	登录号	GI号	生物体
				bcd	NP_349317.1	15895968	丙酮丁醇梭菌
etfA	NP_349315.1	15895966	丙酮丁醇梭菌
				etfB	NP_349316.1	15895967	丙酮丁醇梭菌
TER	Q5EU90.1	62287512	纤细裸藻
				TDE0597	NP_971211.1	42526113	齿垢密螺旋体

已知实例性2-烯酸酯还原酶(EC 1.3.1.31)催化对众多种α，β-不饱和羧酸和醛的依赖NADH的还原(罗迪希(Rohdich)等人，生物化学杂志276：5779-5787(2001))。2-烯酸酯还原酶是由若干梭菌中的enr编码(吉塞尔(Giesel)和西蒙(Simon)，微生物学档案(ArchMicrobiol.)135(1)：第51-57页(2001)，所述梭菌包括酪丁酸梭菌和热乙酸梭菌(C.thermoaceticum)(现在称为热乙酸尔氏菌)(罗迪希等人，见上文，(2001))。在最近公开的基因组序列克氏羧菌中，已报道烯酸酯还原酶的9个编码序列，其中之一已进行表征(泽多夫(Seedorf)等人，美国国家科学院院刊105(6)：2128-33(2008))。已对来自酪丁酸梭菌与热乙酸梭菌二者的enr基因进行克隆和定序且其彼此显示59％一致性。还发现，前一基因与克氏羧菌中的所表征基因具有约75％相似性(吉塞尔和西蒙，微生物学档案135(1)：51-57(1983))。已基于所述序列结果报道，enr与大肠杆菌中的二烯酰基CoA还原酶(fadH)极其相似(163罗迪希等人，见上文(2001))。还已使热乙酸梭菌enr基因以酶促活性形式在大肠杆菌中表达(163罗迪希等人，见上文(2001))。

基因	登录号	GI号	生物体
				fadH	NP_417552.1	16130976	大肠杆菌
enr	ACA54153.1	169405742	肉毒梭菌A3菌株
				enr	CAA71086.1	2765041	酪丁酸梭菌
enr	CAA76083.1	3402834	克氏羧菌
				enr	YP_430895.1	83590886	热乙酸尔氏菌

1.4.1.a-对氨基酸作用的氧化还原酶

作用于氨基酸的多数氧化还原酶以NAD+或NADP+作为受体催化α-氨基酸的氧化脱氨。作用于氨基酸的实例性氧化还原酶包括由gdhA编码的谷氨酸脱氢酶(脱氨)、由ldh编码的亮氨酸脱氢酶(脱氨)和由nadX编码的天冬氨酸酯脱氢酶(脱氨)。来自大肠杆菌的gdhA基因产物(科尔贝(Korber)等人，分子生物学杂志234：1270-1273(1993)；麦克弗森(McPherson)和伍顿(Wootton)，核酸研究11：5257-5266(1983))、来自海栖热袍菌的gdh(科特(Kort)等人，极端微生物(Extremophiles)1：52-60(1997)；莱宾克(Lebbink)等人，分子生物学杂志280：287-296(1998))；莱宾克等人，分子生物学杂志289：357-369(1999))和来自嗜盐杆菌的gdhA1(英戈尔兹比(Ingoldsby)等人，基因349：237-244(2005))催化谷氨酸酯可逆互变为2-氧代戊二酸酯和氨，同时分别偏好NADP(H)、NAD(H)或二者。仙人掌芽孢杆菌的ldh基因编码具有宽范围底物的LeuDH蛋白质，所述底物包括亮氨酸、异亮氨酸、缬氨酸和2-氨基丁酸酯(安索奇(Ansorge)和库拉(Kula)，生物技术与生物工程68：557-562(2000)；斯托扬(Stoyan)等人，生物技术杂志54：77-80(1997))。来自海栖热袍菌的编码天冬氨酸酯脱氢酶的nadX基因参与NAD的生物合成(杨等人，生物化学杂志278：8804-8808(2003))。

由lysDH基因编码的赖氨酸6-脱氢酶(脱氨)催化L-赖氨酸的ε-氨基的氧化脱氨以形成2-氨基己二酸酯-6-半醛，所述半醛进而以非酶促方式环化以形成Δ1-哌啶-6-羧酸酯(御园(Misono)和长崎(Nagasaki)，细菌学杂志150：398-401(1982))。来自嗜热脂肪地芽孢杆菌的lysDH基因编码依赖NAD的嗜热性赖氨酸6-脱氢酶(埃达里(Heydari)等人，应用与环境微生物学70：937-942(2004))。另外，从基因组计划经由同源性鉴别来自敏捷气热菌K1的lysDH基因。

基因	登录号	GI号	生物体
				lysDH	AB052732	13429872	嗜热脂肪地芽孢杆菌
lvsDH	NP_147035.1	14602185	敏捷气热菌K1
				ldh	P0A393	61222614	仙人掌芽胞杆菌

2.3.1.a-酰基转移酶(转移磷酸酯基)

实例性磷酸酯转移性酰基转移酶包括由pta编码的磷酸转乙酰基酶和由ptb编码的磷酸转丁酰基酶。来自大肠杆菌的pta基因编码可将乙酰基-CoA转变为乙酰基-磷酸酯的酶，并且反之亦然(铃木，T.(Suzuki，T.)，生物化学与生物物理学报191：559-569(1969))。这种酶还可利用丙酰基-CoA代替乙酰基-CoA在此工艺中形成丙酸酯(赫斯林格尔(Hesslinger)等人，分子微生物学27：477-492(1998))。相似地，来自丙酮丁醇梭菌的ptb基因编码可将丁酰基-CoA转变为丁酰基-磷酸酯的酶(沃尔特等人，基因134(1)：第107-11页(1993))；黄(Huang)等人，分子微生物学与生物技术杂志(J Mol Microbiol Biotechnol)2(1)：第33-38页(2000)。其它ptb基因可在丁酸产生菌L2-50(刘易斯(Louis)等人，细菌学杂志186：2099-2106(2004))和巨大芽孢杆菌(巴斯克斯(Vazquez)等人，当代微生物学42：345-349(2001))中发现。

基因	登录号	GI号	生物体
				pta	NP_416800.1	16130232	大肠杆菌
ptb	NP_349676	15896327	丙酮丁醇梭菌
				ptb	AAR19757.1	38425288	丁酸产生菌L2-50
ptb	CAC07932.1	10046659	巨大芽胞杆菌

2.6.1.a-氨基转移酶

天冬氨酸酯氨基转移酶将氨基从天冬氨酸酯转移到α-酮戊二酸酯，形成谷氨酸酯和草酰乙酸酯。此转变是由(例如)以下基因的基因产物催化：来自大肠杆菌的aspC(八木(Yagi)等人，欧洲生物化学学会联合会快报100：81-84(1979)；八木等人，酶学方法113：83-89(1985))、来自啤酒酵母菌的AAT2(八木等人，生物化学杂志92：35-43(1982))和来自拟南芥的ASP5(48，108，22548.德拉(de la)等人，植物学杂志(Plant J)46：414-425(2006)；郭(Kwok)和汉森(Hanson)实验植物学杂志(J Exp.Bot.)55：595-604(2004)；威尔基(Wilkie)和华伦(Warren)，蛋白质的表达和纯化12：381-389(1998))。缬氨酸氨基转移酶催化缬氨酸和丙酮酸酯转变为2-酮异戊酸酯和丙氨酸。大肠杆菌基因avtA编码一种此类酶(惠伦(Whalen)和博格，细菌学杂志150：739-746(1982))。此基因产物还催化α-酮丁酸酯的氨化以生成α-氨基丁酸酯，但尚未鉴别出此反应中的氨供体(惠伦和博格，细菌学杂志158：571-574(1984))。大肠杆菌serC的基因产物催化两种反应，即磷酸丝氨酸氨基转移酶和磷酸羟基苏氨酸氨基转移酶(拉姆(Lam)和温克勒(Winkler)，细菌学杂志172：6518-6528(1990))，并且不能检测到对非磷酸化底物的活性(德瑞克(Drewke)等人，欧洲生物化学学会联合会快报390：179-182(1996))。

基因	登录号	GI号	生物体
				aspC	NP_415448.1	16128895	大肠杆菌
AAT2	P23542.3	1703040	啤酒酵母菌
				ASP5	P46248.2	20532373	拟南芥
avtA	YP_026231.1	49176374	大肠杆菌
				serC	NP_415427.1	16128874	大肠杆菌

卡吉尔(Cargill)已研发出用于经由丙二酰基-半醛从β-丙氨酸产生3-HP的β-丙氨酸/α-酮戊二酸酯氨基转移酶(PCT/US2007/076252(杰森(Jessen)等人))。还显示，克氏酵母菌中的SkPYD4的基因产物优先使用β-丙氨酸作为氨基供体(安德森(Andersen)等人，欧洲生物化学学会联合会会刊(FEBS.J.)274：1804-1817(2007))。SkUGA1编码啤酒酵母菌GABA氨基转移酶UGA1的同源物(拉莫斯等人，欧洲生物化学杂志149：401-404(1985))，而SkPYD4编码参与β-丙氨酸与GABA转氨二者的酶(安德森等人，欧洲生物化学学会联合会会刊274：1804-1817(2007))。3-氨基-2-甲基丙酸酯转氨酶催化从甲基丙二酸酯半醛转化为3-氨基-2-甲基丙酸酯。所述酶已在褐鼠和野猪中进行表征且是由Abat编码(柿本(Kakimoto)等人，生物化学与生物物理学报156：374-380(1968)；玉木(Tamaki)等人，酶学方法324：376-389(2000))。其它生物体中的与3-氨基-2-甲基丙酸酯转氨酶具有高序列同源性的酶候选物包括秀丽隐杆线虫中的Gta-1和枯草芽孢杆菌中的gabT。另外，已显示，大肠杆菌中的由基因gabT编码的天然GABA氨基转移酶中的一者具有广泛底物特异性(刘(Liu)等人，生物化学43：10896-10905(2004)；舒尔茨(Schulz)等人，应用与环境微生物学56：1-6(1990))。puuE的基因产物催化大肠杆菌中的另一4-氨基丁酸转氨酶(果原(Kurihara)等人，生物化学杂志280：4602-4608(2005))。

已报道未结合和结合到抑制剂的大肠杆菌4-氨基丁酸转氨酶的X射线晶体结构(刘等人，生物化学43：10896-10905(2004))。研究并表明底物结合和底物特异性。通过定点诱变和X射线结晶学来研究活性位点残基的作用(刘等人，生物化学44：2982-2992(2005))。基于结构信息，尝试改造具有新颖酶促活性的大肠杆菌4-氨基丁酸转氨酶。所述研究提供进化用于BDO途径的转氨酶活性的基础。

2.7.2.a-磷酸转移酶羧基受体

实例性激酶包括由ackA编码的大肠杆菌乙酸酯激酶(斯卡尔斯泰特(Skarstedt)和希尔弗斯坦(Silverstein)，生物化学杂志251：6775-6783(1976))、由buk1和buk2编码的丙酮丁醇梭菌丁酸激酶(沃尔特等人，基因134(1)：107-111(1993)(黄等人，分子微生物学与生物技术杂志2(1)：33-38(2000)]和由proB编码的大肠杆菌γ-谷氨酰基激酶(史密斯等人，细菌学杂志157：545-551(1984))。所述酶分别将乙酸酯、丁酸酯和谷氨酸酯磷酸化。来自大肠杆菌的ackA基因产物还将丙酸酯磷酸化(赫斯林格尔等人，分子微生物学27：477-492(1998))。

基因	登录号	GI号	生物体
				ackA	NP_416799.1	16130231	大肠杆菌
buk1	NP_349675	15896326	丙酮丁醇梭菌
				buk2	Q97II1	20137415	丙酮丁醇梭菌
proB	NP_414777.1	16128228	大肠杆菌

2.8.3.a-辅酶-A转移酶

在CoA-转移酶家族中，已显示，大肠杆菌酶酰基-CoA：乙酸酯-CoA转移酶(还称作乙酸酯-CoA转移酶(EC 2.8.3.8))将CoA部分从多种具支链和直链酰基-CoA底物转移到乙酸酯，所述底物包括异丁酸酯(马蒂斯和申克，应用与环境微生物学58：1435-1439(1992))、戊酸酯(范德温克尔等人，生物化学与生物物理学研究通讯33：902-908(1968))和丁酸酯(范德温克尔，见上文(1968))。这种酶是由大肠杆菌K12中的atoA(α次单元)和atoD(β次单元)(科罗廖夫(Korolev)等人，结晶学报，D辑：生物结晶学(Acta Crystallogr.D BiolCrystallogr.)58：2116-2121(2002)；范德温克尔，见上文(1968))和谷氨酸棒杆菌ATCC13032中的actA和cg0592(邓肯等人，应用与环境微生物学68：5186-5190(2002))编码。通过序列同源性发现的其它基因包括大肠杆菌UT189中的atoD和atoA。

基因	登录号	GI号	生物体
				atoA	P76459.1	2492994	大肠杆菌K12
atoD	P76458.1	2492990	大肠杆菌K12
				actA	YP_226809.1	62391407	谷氨酸棒杆菌ATCC 13032
cg0592	YP_224801.1	62389399	谷氨酸棒杆菌ATCC 13032
				atoA	ABE07971.1	91073090	大肠杆菌UT189
atoD	ABE07970.1	91073089	大肠杆菌UT189

克氏羧菌的cat1、cat2和cat3的基因产物催化相似转化，已显示，所述基因产物分别展现琥珀酰基-CoA、4-羟基丁酰基-CoA和丁酰基-CoA乙酰基转移酶活性(泽多夫等人，美国国家科学院院刊105(6)：2128-2133(2008)；淑玲和戈特沙尔克，细菌学杂志178(3)：871-880(1996)]。

基因	登录号	GI号	生物体
				cat1	P38946.1	729048	克氏羧菌
cat2	P38942.2	1705614	克氏羧菌
				cat3	EDK35586.1	146349050	克氏羧菌

来自厌氧性细菌发酵氨基酸球菌的戊烯二酸酯-CoA-转移酶(EC 2.8.3.12)与二酸戊烯二酰基-CoA和3-丁烯酰基-CoA反应(麦克(Mack)和比凯尔，欧洲生物化学学会联合会快报405：209-212(1997))。编码这种酶的基因是gctA和gctB。这种酶对其它CoA衍生物具有降低但可检测的活性，其它CoA衍生物包括戊二酰基-CoA、2-羟基戊二酰基-CoA、己二酰基-CoA和丙烯酰基-CoA(比凯尔等人，欧洲生物化学杂志118：315-321(1981))。已在大肠杆菌中克隆并表达所述酶(麦克(Mac)等人，欧洲生物化学杂志226：41-51(1994))。

基因	登录号	GI号	生物体
				gctA	CAA57199.1	559392	发酵氨基酸球菌
gctB	CAA57200.1	559393	发酵氨基酸球菌

3.1.2.a-硫醇酯水解酶(CoA特异性)

在CoA水解酶家族中，酶3-羟基异丁酰基-CoA水解酶对3-HIBCoA具有特异性且已描述其可在缬氨酸降解期间有效地催化所需转化(下村(Shimomura)等人，生物化学杂志269：14248-14253(1994))。编码这种酶的基因包括褐鼠(下村等人，见上文(1994)；下村等人，酶学方法324：229-240(2000))和智人(下村等人，见上文，2000)的hibch。通过序列同源性确定的基因候选物包括啤酒酵母菌的hibch和仙人掌芽孢杆菌的BC_2292。

基因	登录号	GI号	生物体
				hibch	Q5XIE6.2	146324906	褐鼠
hibch	Q6NVY1.2	146324905	智人
				hibch	P28817.2	2506374	啤酒酵母菌

己二酰基-CoA转变为己二酸酯可通过酰基-CoA水解酶或等效硫酯酶进行。最高大肠杆菌基因候选物是tesB(埃盖特(Naggert)等人，生物化学杂志266(17)：11044-11050(1991))，其与对己二酰基-CoA具有活性的二羧酸乙酰基转移酶的人类acot8显示高度相似性(韦斯廷(Westin)等人，生物化学杂志280(46)：38125-38132(2005)。此活性还已在大鼠肝中进行表征(德亚娜(Deana)，国际生物化学(Biochem Int.)26(4)：第767-773页(1992))。

基因	登录号	GI号	生物体
				tesB	NP_414986	16128437	大肠杆菌
acot8	CAA15502	3191970	智人
				acot8	NP_570112	51036669	褐鼠

其它潜在大肠杆菌硫醇酯水解酶包括以下基因的基因产物：tesA(邦纳(Bonner)和布洛赫(Bloch)，生物化学杂志，247(10)：3123-3133(1972))、ybgC(库兹涅佐娃(Kuznetsova)等人，欧洲微生物学会联合会微生物学评论29(2)：263-279(2005)；庄(Zhuang)等人，欧洲生物化学学会联合会快报，516(1-3)：161-163(2002))、paaI(宋等人，生物化学杂志，281(16)：11028-11038(2006))和ybdB(莱杜克(Leduc)等人，细菌学杂志189(19)：7112-7126(2007))。

基因	登录号	GI号	生物体
				tesA	NP_415027	16128478	大肠杆菌
ybgC	NP_415264	16128711	大肠杆菌
				paaI	NP_415914	16129357	大肠杆菌
vbdB	NP_415129	16128580	大肠杆菌

若干真核乙酰基-CoA水解酶(EC 3.1.2.1)具有广泛底物特异性。来自褐鼠脑的酶(鲁滨逊(Robinson)等人，生物化学与生物物理学研究通讯71：959-965(1976))可与丁酰基-CoA、己酰基-CoA和丙二酰基-CoA反应。

基因	登录号	GI号	生物体
				acot12	NP_570103.1	18543355	褐鼠

4.1.1.a-羧基-裂解酶

实例性羧基-裂解酶是参与柠檬酸酯分解代谢和支链氨基酸生物合成的乙酰乳酸酯脱羧酶，其将2-乙酰乳酸酯转变为乙偶姻。在乳酸乳球菌中，所述酶是由基因aldB编码的6个亚单元构成，并且是由缬氨酸、亮氨酸和异亮氨酸活化(古皮(Goupil)等人，应用与环境微生物学62：2636-2640(1996)；古皮-弗耶拉(Goupil-Feuillerat)等人，细菌学杂志182：5399-5408(2000))。这种酶已在大肠杆菌中过表达并表征(法利普(Phalip)等人，欧洲生物化学学会联合会快报351：95-99(1994))。在其它生物体中，所述酶是由以下基因编码的二聚体：嗜热链球菌中的aldC(莫奈(Monnet)等人，应用微生物学通讯(Lett.Appl.Microbiol.)36：399-405(2003))、短芽孢杆菌中的aldB(迪德里奇森(Diderichsen)等人，细菌学杂志172：4315-4321(1990)；纳木丁(Najmudin)等人，结晶学报，D辑：生物结晶学59：1073-1075(2003))和来自产气肠杆菌的budA(迪德里奇森等人，细菌学杂志172：4315-4321(1990))。在枯草芽孢杆菌中克隆来自短芽孢杆菌的酶并使其在其中过表达且进行结晶学表征(纳木丁等人，结晶学报，D辑：生物结晶学59：1073-1075(2003))。另外，已对来自乳酸明串珠菌(Leuconostoc lactis)的酶进行纯化并表征，但尚未分离出所述基因(奥沙利文等人，欧洲微生物学会联合会微生物学快报194：245-249(2001))。

基因	登录号	GI号	生物体
				aldB	NP_267384.1	15673210	乳酸乳球菌
aldC	Q8L208	75401480	嗜热链球菌
				aldB	P23616.1	113592	短芽胞杆菌
budA	P05361.1	113593	产气肠杆菌

乌头酸酯脱羧酶催化假丝酵母菌属菌株以及丝状真菌土曲霉中的衣康酸酯生物合成中的最终步骤(博纳姆(Bonnarme)等人，细菌学杂志177：3573-3578(1995)；维尔克(Willke)和沃尔洛普(Vorlop)，应用微生物学与生物技术56：289-295(2001))。尽管衣康酸酯是引起生物技术关注的化合物，但迄今尚未报道乌头酸酯脱羧酶基因或蛋白质序列。

已从诸多生物体分离并表征4-草酰巴豆酸酯脱羧酶。编码这种酶的基因包括假单胞菌属(菌株600)中的dmpH和dmpE(欣格勒(Shingler)等人，细菌学杂志174：711-724(1992))、来自恋臭假单胞菌的xylII和xylIII(加藤(Kato)和浅野(Asano)，微生物学档案168：457-463(1997)；连(Lian)和惠特曼(Whitman)，美国化学学会会志116：10403-10411(1994)；史坦利(Stanley)等人，生物化学39：3514(2000))以及来自富养产碱菌JMP134的Reut_B5691和Reut_B5692(休斯(Hughes)等人，细菌学杂志158：79-83(1984))。已在大肠杆菌中克隆并表达来自假单胞菌属(菌株600)的编码所述酶的基因(欣格勒等人，细菌学杂志174：711-724(1992))。

已对另一类脱羧酶进行表征，其催化肉桂酸酯(丙烯酸苯酯)和取代肉桂酸酯衍生物转变为对应苯乙烯衍生物。所述酶在多种生物体中常见且编码所述酶的已在大肠杆菌中克隆和表达的特定基因是：来自啤酒酵母菌的pad 1(克劳森(Clausen)等人，基因142：107-112(1994))、来自胚芽乳酸杆菌的pdc(巴塞尔麦博(Barthelmebs)等人，应用与环境微生物学67：1063-1069(2001)；齐(Qi)等人，代谢工程9：268-276(2007)；罗德里格斯(Rodriguez)等人，农业与食品化学杂志(J.Agric.Food Chem.)56：3068-3072(2008))、来自奥克西托克雷白杆菌(桥床(Hashidoko)等人，生物科学、生物技术与生物化学58：217-218(1994)；内山(Uchiyama)等人，生物科学、生物技术与生物化学72：116-123(2008))、戊糖片球菌(巴塞尔麦博等人，应用与环境微生物学67：1063-1069(2001))的的pofK(pad)和来自枯草芽孢杆菌和短小芽孢杆菌的padC(林根(Lingen)等人，蛋白质工程15：585-593(2002))。还已对来自荧光假单胞菌的阿魏酸脱羧酶进行纯化和表征(黄等人，细菌学杂志176：5912-5918(1994))。重要地，已显示，此类酶是稳定的且无需外源性或内部结合的辅因子，因此使所述酶理想地适于生物转化(萨瑞斯拉尼(Sariaslani)，微生物学年评(Annu.Rev.Microbiol.)61：51-69(2007))。

其它脱羧酶可从α-酮戊二酸酯形成琥珀酸半醛。这些包括来自纤细裸藻(重冈等人，生物化学杂志282(Pt2)：319-323(1992)；重冈和中野，生物化学与生物物理学文献288：22-28(1991)；重冈和中野，生物化学杂志292(Pt2)：463-467(1993))(其对应基因序列有待测定)和来自结核分枝杆菌(田等人，美国国家科学院院刊102：10670-10675(2005))的α-酮戊二酸脱羧酶。另外，谷氨酸脱羧酶可将谷氨酸酯转变为4-氨基丁酸酯，例如大肠杆菌gadA和gadB基因的产物(迪拜瑟(De Biase)等人，蛋白质表达与纯化(Protein.Expr.Purif.)8：430-438(1993))。

基因	登录号	GI号	生物体
				kgd	O50463.4	160395583	结核分枝杆菌
gadA	NP_417974	16131389	大肠杆菌
				gadB	NP_416010	16129452	大肠杆菌

酮酸脱羧酶

丙酮酸酯脱羧酶(PDC，EC 4.1.1.1)(还称为酮酸脱羧酶)是醇发酵中的关键酶，催化丙酮酸酯脱羧成乙醛。这种酶对脂肪族2-酮酸具有宽底物范围，包括2-酮丁酸酯、2-酮戊酸酯、3-羟基丙酮酸酯和2-苯基丙酮酸酯(博格等人，科学318：1782-1786(2007))。由pdc编码的来自运动发酵单胞菌的PDC已成为改变对不同底物的亲和力的定向改造研究的主题(西格特等人，蛋白质工程、设计与选择18：345-357(2005))。还已对来自啤酒酵母菌的PDC进行深入研究，针对其经改变活性进行改造，并且使其在大肠杆菌中进行菜单达(基兰贝-雅布斯(Killenberg-Jabs)等人，欧洲生物化学杂志268：1698-1704(2001)；李和乔丹，生物化学38：10004-10012(1999)；特舒勒(ter Schurc)等人，应用与环境微生物学64：1303-1307(1998))。可获得这种酶的晶体结构(基兰贝-雅布斯，欧洲生物化学杂志268：1698-1704(2001))。其它经充分表征的PDC候选物包括来自巴斯德醋酸杆菌(钱德拉(Chandra)等人微生物学档案176：443-451(2001))和乳酸克氏酵母菌(克里格(Krieger)等人，欧洲生物化学杂志269：3256-3263(2002))的酶。

与PDC一样，苯甲酰基甲酸酯脱羧酶(EC 4.1.1.7)具有宽底物范围且已成为酶改造研究的目标。已对来自恋臭假单胞菌的酶进行深入研究且可获得这种酶的晶体结构(哈森等人，生物化学37：9918-9930(1998)；波洛夫尼科娃等人，生物化学42：1820-1830(2003))。恋臭假单胞菌酶的活性位点中两个残基的定点诱变改变对天然和非天然底物的亲和力(Km)(西格特，蛋白质工程、设计与选择18：345-357(2005))。这种酶的性质已通过定向改造进一步修改(林根等人，蛋白质工程15：585-593(2002))；林根，生物化学(Chembiochem)4：721-726(2003))。由mdlC编码的来自绣色假单胞菌的酶还已以实验方式进行表征(巴罗曼(Barrowman)等人，欧洲微生物学会联合会微生物学快报34：57-60(1986))。来自施氏假单胞菌、荧光假单胞菌和其它生物体的其它基因候选物可通过序列同源性推测或使用在恋臭假单胞菌中产生的生长选择系统鉴别(亨宁(Henning)等人，应用与环境微生物学72：7510-7517(2006))。

基因	登录号	GI号	生物体
				mdlC	P20906.2	3915757	恋臭假单胞菌
mdlC	Q9HUR2.1	81539678	绣色假单胞菌
				dpgB	ABN80423.1	126202187	施氏假单胞菌
ilvB-1	YP_260581.1	70730840	荧光假单胞菌

4.2.1.a-水裂解酶

巴克氏真细菌的2-(羟基甲基)戊二酸酯脱水酶是实例性水裂解酶。已在烟酸酯分解代谢的情况下研究这种酶且其是由hmd编码(阿尔哈帕(Alhapel)等人，美国国家科学院院刊103：12341-12346(2006))。在多毛拟杆菌、科氏厌氧性躯干菌和嗜热盐碱厌氧性菌中发现具有高度序列同源性的相似酶。

第二个实例性水裂解酶是延胡索酸酯水合酶，所述酶催化苹果酸酯到延胡索酸酯的脱水。可获得关于这种酶的大量结构信息且研究者已成功地改造所述酶以改变活性、抑制和定位(韦弗，T.(Weaver，T.)，结晶学报，D辑：生物结晶学61：1395-1401(2005))。其它延胡索酸酯水合酶包括那些由以下基因编码者：来自大肠杆菌(埃斯特韦斯(Estevez)等人，蛋白质科学11：1552-1557(2002)；洪(Hong)和李，生物技术与生物加工工程(Biotechnol.Bioprocess Eng.)9：252-255(2004)；罗斯和韦弗，美国国家科学院院刊101：3393-3397(2004))、空肠曲杆菌(史密斯等人，国际生物化学与细胞生物学杂志(Int.JBiochem.Cell Biol)31：961-975(1999))和嗜热栖热菌(沟端(Mizobata)等人，生物化学与生物物理学文献355：49-55(1998))的fumC和来自褐鼠的fumH(小林(Kobayashi)等人，生物化学杂志89：1923-1931(1981))。具有高度序列同源性的相似酶包括来自拟南芥的fum1和来自谷氨酸棒杆菌的fumC。

柠苹酸酯水解酶(还称为2-甲基苹果酸酯脱水酶)将2-甲基苹果酸酯转变为中康酸酯。在谷氨酸酯降解VI途径的情况下在假破伤风梭菌、摩氏摩根菌(Morganellamorganii)、无丙二酸柠檬酸杆菌中检测到2-甲基苹果酸酯脱水酶活性(加藤和浅野，微生物学档案168：457-463(1997))；然而，迄今尚未对编码这种酶的基因定序。

来自丙酮丁醇梭菌的crt的基因产物催化3-羟基丁酰基-CoA到巴豆酰基-CoA的脱水(渥美等人，代谢工程；29(2007))；博因顿等人，细菌学杂志178：3015-3024(1996))。相信恋臭假单胞菌的烯酰基-CoA水合酶(phaA和phaB)在乙酸苯基酯分解代谢期间进行对双键的羟基化(奥利维拉(Olivera)等人，美国国家科学院院刊95(11)：6419-6424(1998))。来自荧光假单胞菌的paaA和paaB催化类似转化(14奥利维拉等人，见上文，1998)。最后，已显示，诸多大肠杆菌基因显示烯酰基-CoA水合酶功能，包括maoC(帕克和李，细菌学杂志185(18)：5391-5397(2003))、paaF(帕克和李，生物技术与生物工程86(6)：681-686(2004a))；帕克和李，应用生物化学与生物技术113-116：335-346(2004b))；伊斯梅尔(Ismail)等人，欧洲生物化学杂志270(14)：第3047-3054页(2003)和paaG(帕克和李，见上文，2004；帕克和李，见上文，2004b；伊斯梅尔等人，见上文，2003)。

基因	登录号	GI号	生物体
				maoC	NP_415905.1	16129348	大肠杆菌
paaF	NP_415911.1	16129354	大肠杆菌
				paaG	NP_415912.1	16129355	大肠杆菌
crt	NP_349318.1	15895969	丙酮丁醇梭菌
				paaA	NP_745427.1	26990002	恋臭假单胞菌
paaB	NP_745426.1	26990001	恋臭假单胞菌
				phaA	ABF82233.1	106636093	荧光假单胞菌
phaB	ABF82234.1	106636094	荧光假单胞菌

大肠杆菌基因fadA和fadB编码展现酮酰基-CoA硫解酶、3-羟基酰基-CoA脱氢酶和烯酰基-CoA水合酶活性的多酶复合物(杨等人，生物化学30(27)：第6788-6795页(1991)；杨等人，生物化学杂志265(18)：第10424-10429页(1990)；杨等人，生物化学杂志266(24)：第16255页(1991)；中东(Nakahigashi)和井口(Inokuchi)，核酸研究18(16)：第4937页(1990))。fadI和fadJ基因编码相似功能且仅在厌氧性下天然表达(坎贝尔(Campbell)等人，分子微生物学47(3)：第793-805页(2003)。先前已描述在大肠杆菌中产生聚[(R)-3-羟基丁酸酯]的方法，其涉及活化fadB(通过敲除负调节物，fadR)和共表达非天然酮硫解酶(来自富养产碱菌的phaA)(佐藤(Sato)等人，生物科学与生物工程杂志103(1)：38-44(2007))。此研究明确地证实，β-氧化酶、尤其编码3-羟基酰基-CoA脱氢酶和烯酰基-CoA水合酶活性二者的fadB的基因产物可作为用以从乙酰基-CoA前体产生较长链分子的途径的一部分发挥功能。

基因	登录号	GI号	生物体
				fad4	YP_026272.1	49176430	大肠杆菌
fadB	NP_418288.1	16131692	大肠杆菌
				fad	NP_416844.1	16130275	大肠杆菌
fadJ	NP_416843.1	16130274	大肠杆菌
				fadR	NP_415705.1	16129150	大肠杆菌

4.3.1.a-氨-裂解酶

催化天冬氨酸酯到延胡索酸酯的脱氨的天冬氨酸酶(EC 4.3.1.1)是广泛分布于微生物中的酶，并且已进行深入表征(维奥拉，R.E.，酶学与分子生物学相关领域的进展(Adv.Enzymol.Relat Areas Mol.Biol)74295-341(2000))。已解析由aspA编码的大肠杆菌天冬氨酸酶的晶体结构(史等人，生物化学369136-9144(1997))。还已显示，大肠杆菌酶与替代底物天冬氨酸苯基甲基酯、天冬酰胺、苯甲基-天冬氨酸酯和苹果酸酯反应(Ma等人，纽约科学院年志(Ann N.Y.Acad Sci)67260-65(1992))。在单独研究中，已对这种酶采用定向进化来改变底物特异性(浅野等人，生物分子工程22：95-101(2005))。具有天冬氨酸酶功能的酶还已在流感嗜血杆菌(舍斯特伦(Sjostrom)等人，生物化学与生物物理学报1324：182-190(1997))、荧光假单胞菌(高木(Takagi)等人，生物化学杂志96：545-552(1984))、枯草芽孢杆菌(舍斯特伦等人，生物化学与生物物理学报1324：182-190(1997))和粘质沙雷氏菌(高木和来住(Kisumi)，细菌学杂志161：1-6(1985))。

基因	登录号	GI号	生物体
				aspA	NP_418562	90111690	大肠杆菌K12亚种MG1655
aspA	P44324.1	1168534	流感嗜血杆菌
				aspA	P07346.1	114273	荧光假单胞菌
ansB	P26899.1	114271	枯草芽孢杆菌
				aspA	P33109.1	416661	粘质沙雷氏菌

3-甲基天冬氨酸酶(EC 4.3.1.2)(还称作β-甲基天冬氨酸酶或3-甲基天冬氨酸酯氨-裂解酶)催化苏-3-甲基天冬氨酸酯到中康酸酯的脱氨。来自假破伤风梭菌的3-甲基天冬氨酸酶已在大肠杆菌中克隆，进行菜单达，并结晶(亚松森(Asuncion)等人，结晶学报，D辑：生物结晶学57：731-733(2001)；亚松森等人，生物化学杂志277：8306-8311(2002)；博廷(Botting)等人，生物化学27：2953-2955(1988)；戈达(Goda)等人，生物化学31：10747-10756(1992)。在无丙二酸柠檬酸杆菌中，这种酶是由BAA28709编码(加藤和浅野，微生物学档案168：457-463(1997))。还已使3-甲基天冬氨酸酶从大肠杆菌YG1002结晶(浅野和加藤，欧洲微生物学会联合会微生物学快报118：255-258(1994))，但蛋白质序列于诸如基因库等公开数据库中未有列示。可使用序列同源性来鉴别其它基因候选物，包括破伤风梭菌中的CTC_02563和大肠杆菌O157：H7中的ECs0761。

基因	登录号	GI号	生物体
				MAL	AAB24070.1	259429	假破伤风梭菌
BAA28709	BAA28709.1	3184397	无丙二酸柠檬酸杆菌
				CTC_02563	NP_783085.1	28212141	破伤风梭菌
ECs0761	BAB34184.1	13360220	大肠杆菌O157：H7菌株酒井(Sakai)

形成烯酰基-CoA产物的氨-裂解酶候选物包括β-丙氨酰基-CoA氨-裂解酶(EC4.3.1.6)，其将β-丙氨酰基-CoA和3-氨基丁酰基-CoA氨-裂解酶脱脱氨(EC 4.3.1.14)。两种β-丙氨酰基-CoA氨裂解酶已在丙酸梭菌中进行鉴别并表征(Herrmann等人，欧洲生物化学学会联合会会刊272：813-821(2005))。迄今尚未对其它β-丙氨酰基-CoA氨裂解酶进行研究，但基因候选物可通过序列相似性鉴别。一种所述候选物是黄色粘球菌中的MXAN_4385。

基因	登录号	GI号	生物体
				ac12	CAG29275.1	47496504	丙酸梭菌
acll	CAG29274.1	47496502	丙酸梭菌
				MXAN_4385	YP_632558.1	108756898	黄色粘球菌

5.3.3.a-异构酶

来自氨基丁酸梭菌和克氏羧菌二者的4-羟基丁酰基-CoA脱水酶催化4-羟基丁酰基-CoA到巴豆酰基-CoA的可逆转变且具有固有乙烯基乙酰基-CoAΔ-异构酶活性(舍夫和比凯尔，欧洲生物化学杂志215：421-429(1993)；舍夫等人，微生物学档案161：239-245(1994))。对两种天然酶进行纯化和表征，包括N端氨基酸序列(舍夫和比凯尔，见上文，1993；舍夫等人，见上文，1994)。来自氨基丁酸梭菌和克氏羧菌的abfD基因与所述N端氨基酸序列完全匹配，因此编码4-羟基丁酰基-CoA脱水酶/乙烯基乙酰基-CoAΔ-异构酶。另外，从基因组计划经由同源性来鉴别来自牙龈卟啉单胞菌ATCC 33277的abfD基因。

5.4.3.a-氨基变位酶

赖氨酸2，3-氨基变位酶(EC 5.4.3.2)是将赖氨酸转变为(3S)-3，6-二氨基己酸酯的实例性氨基变位酶，其将氨基从2位移位到3位。在将赖氨酸发酵成乙酸酯和丁酸酯的细菌中发现所述酶，所述细菌包括例如具核梭杆菌(kamA)(巴克(Barker)等人，细菌学杂志152：201-207(1982))和近端梭菌(kamA)(奇尔皮克(Chirpich)等人，生物化学杂志245：1778-1789(1970))。已使来自近端梭菌的酶结晶(莱波雷(Lepore)等人，美国国家科学院院刊102：13819-13824(2005))。编码这种功能的酶还由枯草芽孢杆菌中的yodO编码(陈(Chen)等人，生物化学杂志348Pt 3：539-549(2000))。所述酶利用吡多醛5’-磷酸酯作为辅因子，需要由S-腺苷甲硫氨酸活化，并且具有立体选择性，与仅与L-赖氨酸反应。尚未显示，所述酶与替代底物反应。

基因	登录号	GI号	生物体
				yodO	O34676.1	4033499	枯草芽孢杆菌
kamA	Q9XBQ8.1	75423266	近端梭菌
				kamA	Q8RHX4	81485301	具核梭杆菌具核亚种

第二种氨基变位酶β-赖氨酸5，6-氨基变位酶(EC 5.4.3.3)催化赖氨酸发酵成乙酸酯和丁酸酯的下一步骤，其将(3S)-3，6-二氨基己酸酯转化成(3S，5S)-3，5-二氨基己酸酯，将末端氨基从6位移位到5位。这种酶还催化赖氨酸转变为2，5-二氨基己酸酯且还称为赖氨酸-5，6-氨基变位酶(EC 5.4.3.4)。已在史迪克兰梭菌(kamD，kamE)中使所述酶结晶(贝尔科维奇(Berkovitch)等人，美国国家科学院院刊101：15870-15875(2004))。还已对来自牙龈卟啉单胞菌的酶进行表征(唐(Tang)等人，生物化学41：8767-8776(2002))。

基因	登录号	GI号	生物体
				kamD	AAC79717.1	3928904	史迪克兰梭菌
kamE	AAC79718.1	3928905	史迪克兰梭菌
				kamD	NC_002950.2	34539880，34540809	牙龈卟啉单胞菌W83
kamE	NC_002950.2	34539880，34540810	牙龈卟啉单胞菌W83

鸟氨酸4，5-氨基变位酶(EC 5.4.3.5)将D-鸟氨酸转变为2，4-二氨基戊酸酯，还将末端胺移位到毗邻碳。来自史迪克兰梭菌的酶是由两个基因oraE和oraS编码，并且已经克隆，定序且在大肠杆菌中表达(陈等人，生物化学杂志276：44744-44750(2001))。迄今尚未在其它生物体中对这种酶进行表征。

酪氨酸2，3-氨基变位酶(EC 5.4.3.6)参与酪氨酸生物合成，通过将氨从2位移位到3位将酪氨酸可逆地转变为3-氨基-3-(4-羟基苯基)丙酸酯。在球孢链霉菌(Streptomyces globisporus)中，还已显示，所述酶与酪氨酸衍生物反应(克里斯滕松(Christenson)等人，生物化学42：12708-12718(2003))。无法获得序列信息。

在亮氨酸降解和生物合成期间，亮氨酸2，3-氨基变位酶(EC 5.4.3.7)将L-亮氨酸转变为β-亮氨酸。用于亮氨酸2，3-氨基变位酶的分析检测许多生物体中的活性(波斯顿，J.M.(Poston，J.M.)，酶学方法166：130-135(1988))，但尚未迄今鉴别出编码所述酶的基因。

卡吉尔已研发出将L-丙氨酸转变为β-丙氨酸的新颖2，3-氨基变位酶，由此产生在4个生物化学步骤中从丙酮酸酯到3-HP的途径(廖等人，美国公开案第2005-0221466号)。

6.2.1.a-酸-硫醇连接酶

实例性酸-硫醇连接酶是大肠杆菌的sucCD的基因产物，其一起催化从琥珀酸酯形成琥珀酰基-CoA，同时消耗一个ATP，所述反应在活体内是可逆的(巴克(Buck)等人，生物化学24(22)：第6245-6252页(1985))。其它实例性CoA-连接酶包括尚未表征序列的大鼠二羧酸酯-CoA连接酶(魏美克(Vamecq)等人，生物化学杂志230(3)：第683-693页(1985))、来自产黄青霉的两种经表征乙酸苯基酯-CoA连接酶中的任一者(拉马斯-马塞拉斯(Lamas-Maceiras)等人，生物化学杂志395(1)：147-155(2006)；王等人，生物化学与生物物理学通讯，360(2)：453-458(2007))、来自恋臭假单胞菌的乙酸苯基酯-CoA连接酶(马丁内斯-布兰科(Martinez-Blanco)等人，生物化学杂志265(12)：7084-7090(1990))和来自枯草芽孢杆菌的6-羧基己酸酯-CoA连接酶(鲍尔(Bower)等人，细菌学杂志178(14)：4122-4130(1996))。

实例V

从琥珀酰基-CoA的实例性BDO途径

这个实例描述从琥珀酰基-CoA的实例性BDO途径。

从琥珀酰基-CoA的BDO途径描述于本文中且先前已描述(参见2008年3月14日申请的美国申请案第12/049,256号和2008年3月14日申请的PCT申请案第US08/57168号，其各自以引用方式并入本文中)。其它途径示于图8A中。所述实例性BDO途径的酶连同编码所述酶的实例性基因一起列示于表15中。

简单来说，可通过琥珀酰基-CoA还原酶(或琥珀酸半醛脱氢酶)(EC1.2.1.b)将琥珀酰基-CoA转变为琥珀酸半醛。可通过如先前所述4-羟基丁酸脱氢酶(EC 1.1.1.a)将琥珀酸半醛转变为4-羟基丁酸酯。或者，可通过琥珀酰基-CoA还原酶(形成醇)(EC 1.1.1.c)将琥珀酰基-CoA转变为4-羟基丁酸酯。可通过如先前所述4-羟基丁酰基-CoA转移酶(EC2.8.3.a)或通过4-羟基丁酰基-CoA水解酶(EC 3.1.2.a)或4-羟基丁酰基-CoA连接酶(或4-羟基丁酰基-CoA合成酶)(EC 6.2.1.a)将4-羟基丁酸酯转变为4-羟基丁酰基-CoA。或者，可通过如先前所述4-羟基丁酸激酶(EC 2.7.2.a)将4-羟基丁酸酯转变为4-羟基丁酰基-磷酸酯。可通过如先前所述磷酸转-4-羟基丁酰基酶(EC 2.3.1.a)将4-羟基丁酰基-磷酸酯转变为4-羟基丁酰基-CoA。或者，可通过4-羟基丁醛脱氢酶(磷酸化)(EC 1.2.1.d)将4-羟基丁酰基-磷酸酯转变为4-羟基丁醛。可通过4-羟基丁酰基-CoA还原酶(或4-羟基丁醛脱氢酶)(EC 1.2.1.b)将4-羟基丁酰基-CoA转变为4-羟基丁醛。或者，可通过4-羟基丁酰基-CoA还原酶(形成醇)(EC 1.1.1.c)将4-羟基丁酰基-CoA转变为1，4-丁二醇。可通过如先前所述1，4-丁二醇脱氢酶(EC 1.1.1.a)将4-羟基丁醛转变为1，4-丁二醇。

实例VI

从α-酮戊二酸酯的其它实例性BDO途径

这个实例描述从α-酮戊二酸酯的实例性BDO途径。

从琥珀酰基-CoA的BDO途径描述于本文中且先前已描述(参见2008年3月14日申请的美国申请案第12/049,256号和2008年3月14日申请的PCT申请案第US08/57168号，其各自以引用方式并入本文中)。其它途径示于图8B中。所述实例性BDO途径的酶连同编码所述酶的实例性基因一起列示于表16中。

简单来说，可通过如先前所述α-酮戊二酸脱羧酶(EC 4.1.1.a)将α-酮戊二酸酯转变为琥珀酸半醛。或者，可通过谷氨酸脱氢酶(EC 1.4.1.a)将α-酮戊二酸酯转变为谷氨酸酯。可通过4-氨基丁酸酯氧化还原酶(脱氨)(EC 1.4.1.a)或4-氨基丁酸转氨酶(EC2.6.1.a)将4-氨基丁酸酯转变为琥珀酸半醛。可通过谷氨酸脱羧酶(EC 4.1.1.a)将谷氨酸酯转变为4-氨基丁酸酯。可通过如先前所述4-羟基丁酸脱氢酶(EC 1.1.1.a)将琥珀酸半醛转变为4-羟基丁酸酯。可通过如先前所述4-羟基丁酰基-CoA转移酶(EC 2.8.3.a)或通过4-羟基丁酰基-CoA水解酶(EC 3.1.2.a)或4-羟基丁酰基-CoA连接酶(或4-羟基丁酰基-CoA合成酶)(EC 6.2.1.a)将4-羟基丁酸酯转变为4-羟基丁酰基-CoA。可通过4-羟基丁酸激酶(EC2.7.2.a)将4-羟基丁酸酯转变为4-羟基丁酰基-磷酸酯。可通过如先前所述磷酸转-4-羟基丁酰基酶(EC 2.3.1.a)将4-羟基丁酰基-磷酸酯转变为4-羟基丁酰基-CoA。或者，可通过4-羟基丁醛脱氢酶(磷酸化)(EC 1.2.1.d)将4-羟基丁酰基-磷酸酯转变为4-羟基丁醛。可通过如先前所述4-羟基丁酰基-CoA还原酶(或4-羟基丁醛脱氢酶)(EC 1.2.1.b)将4-羟基丁酰基-CoA转变为4-羟基丁醛。可通过4-羟基丁酰基-CoA还原酶(形成醇)(EC 1.1.1.c)将4-羟基丁酰基-CoA转变为1，4-丁二醇。可通过如先前所述1，4-丁二醇脱氢酶(EC1.1.1.a)将4-羟基丁醛转变为1，4-丁二醇。

实例VII

从4-氨基丁酸酯的BDO途径

这个实例描述从4-氨基丁酸酯的实例性BDO途径。

图9A绘示将4-氨基丁酸酯转变为BDO的实例性BDO途径。所述实例性BDO途径的酶连同编码所述酶的实例性基因一起列示于表17中。

简单来说，可通过4-氨基丁酸CoA转移酶(EC 2.8.3.a)、4-氨基丁酰基-CoA水解酶(EC 3.1.2.a)或4-氨基丁酸酯-CoA连接酶(或4-氨基丁酰基-CoA合成酶)(EC 6.2.1.a)将4-氨基丁酸酯转变为4-氨基丁酰基-CoA。可通过4-氨基丁酰基-CoA氧化还原酶(脱氨)(EC1.4.1.a)或4-氨基丁酰基-CoA转氨酶(EC 2.6.1.a)将4-氨基丁酰基-CoA转变为4-氧代丁酰基-CoA。可通过4-羟基丁酰基-CoA脱氢酶(EC 1.1.1.a)将4-氧代丁酰基-CoA转变为4-羟基丁酰基-CoA。可通过4-羟基丁酰基-CoA还原酶(形成醇)(EC 1.1.1.c)将4-羟基丁酰基-CoA转变为1，4-丁二醇。或者，可通过4-羟基丁酰基-CoA还原酶(或4-羟基丁醛脱氢酶)(EC1.2.1.b)将4-羟基丁酰基-CoA转变为4-羟基丁醛。可通过1，4-丁二醇脱氢酶(EC 1.1.1.a)将4-羟基丁醛转变为1，4-丁二醇。

用于将4-氨基丁酸酯转变为BDO的另一实例性BDO途径的酶示于图9A中。所述实例性BDO途径的酶连同编码所述酶的实例性基因一起列示于表18中。

简单来说，可通过4-氨基丁酸CoA转移酶(EC 2.8.3.a)、4-氨基丁酰基-CoA水解酶(EC 3.1.2.a)或4-氨基丁酸酯-CoA连接酶(或4-氨基丁酰基-CoA合成酶)(EC 6.2.1.a)将4-氨基丁酸酯转变为4-氨基丁酰基-CoA。可通过4-氨基丁酰基-CoA还原酶(形成醇)(EC1.1.1.c)将4-氨基丁酰基-CoA转变为4-氨基丁-1-醇。或者，可通过4-氨基丁酰基-CoA还原酶(或4-氨基丁醛脱氢酶)(EC 1.2.1.b)将4-氨基丁酰基-CoA转变为4-氨基丁醛，并且可通过4-氨基丁-1-醇脱氢酶(EC 1.1.1.a)将4-氨基丁醛转变为4-氨基丁-1-醇。可通过4-氨基丁-1-醇氧化还原酶(脱氨)(EC 1.4.1.a)或4-氨基丁-1-醇转氨酶(EC 2.6.1.a)将4-氨基丁-1-醇转变为4-羟基丁醛。可通过1，4-丁二醇脱氢酶(EC 1.1.1.a)将4-羟基丁醛转变为1，4-丁二醇。

图9B绘示将4-氨基丁酸酯转变为BDO的实例性BDO途径。所述实例性BDO途径的酶连同编码所述酶的实例性基因一起列示于表19中。

简单来说，可通过4-氨基丁酸激酶(EC 2.7.2.a)将4-氨基丁酸酯转变为[(4-氨基丁酰基)氧基]膦酸。可通过4-氨基丁醛脱氢酶(磷酸化)(EC 1.2.1.d)将[(4-氨基丁酰基)氧基]膦酸转变为4-氨基丁醛。可通过4-氨基丁-1-醇脱氢酶(EC 1.1.1.a)将4-氨基丁醛转变为4-氨基丁-1-醇。可通过4-氨基丁-1-醇氧化还原酶(脱氨)(EC 1.4.1.a)或4-氨基丁-1-醇转氨酶(EC 2.6.1.a)将4-氨基丁-1-醇转变为4-羟基丁醛。或者，可通过[(4-氨基丁酰基)氧基]膦酸氧化还原酶(脱氨)(EC 1.4.1.a)或[(4-氨基丁酰基)氧基]膦酸转氨酶(EC2.6.1.a)将[(4-氨基丁酰基)氧基]膦酸转变为[(4-氧代丁酰基)氧基]膦酸。可通过4-羟基丁酰基-磷酸酯脱氢酶(EC 1.1.1.a)将[(4-氧代丁酰基)氧基]膦酸转变为4-羟基丁酰基-磷酸酯。可通过4-羟基丁醛脱氢酶(磷酸化)(EC 1.2.1.d)将4-羟基丁酰基-磷酸酯转变为4-羟基丁醛。可通过1，4-丁二醇脱氢酶(EC 1.1.1.a)将4-羟基丁醛转变为1，4-丁二醇。

图9C显示经由乙酰乙酸酯的实例性途径。

实例VIII

从α-酮戊二酸酯的实例性BDO途径

这个实例描述从α-酮戊二酸酯的实例性BDO途径。

图10绘示将α-酮戊二酸酯转变为BDO的实例性BDO途径。所述实例性BDO途径的酶连同编码所述酶的实例性基因一起列示于表20中。

简单来说，可通过α-酮戊二酸酯5-激酶(EC 2.7.2.a)将α-酮戊二酸酯转变为α-酮戊二酸磷酸酯。可通过2，5-二氧代戊酸半醛脱氢酶(磷酸化)(EC1.2.1.d)将α-酮戊二酸磷酸酯转变为2，5-二氧代戊酸。可通过2，5-二氧代戊酸还原酶(EC 1.1.1.a)将2，5-二氧代戊酸转变为5-羟基-2-氧代戊酸。或者，可通过α-酮戊二酸CoA转移酶(EC 2.8.3.a)、α-酮戊二酰基-CoA水解酶(EC 3.1.2.a)或α-酮戊二酰基-CoA连接酶(或α-酮戊二酰基-CoA合成酶)(EC 6.2.1.a)将α-酮戊二酸酯转变为α-酮戊二酰基-CoA。可通过α-酮戊二酰基-CoA还原酶(或2，5-二氧代戊酸脱氢酶)(EC 1.2.1.b)将α-酮戊二酰基-CoA转变为2，5-二氧代戊酸。可通过5-羟基-2-氧代戊酸脱氢酶将2，5-二氧代戊酸转变为5-羟基-2-氧代戊酸。或者，可通过α-酮戊二酰基-CoA还原酶(形成醇)(EC 1.1.1.c)将α-酮戊二酰基-CoA转变为5-羟基-2-氧代戊酸。可通过5-羟基-2-氧代戊酸脱羧酶(EC 4.1.1.a)将5-羟基-2-氧代戊酸转变为4-羟基丁醛。可通过1，4-丁二醇脱氢酶(EC 1.1.1.a)将4-羟基丁醛转变为1，4-丁二醇。可通过5-羟基-2-氧代戊酸脱氢酶(脱羧)(EC 1.2.1.c)将5-羟基-2-氧代戊酸转变为4-羟基丁酰基-CoA。

实例IX

从谷氨酸酯的实例性BDO途径

这个实例描述从谷氨酸酯的实例性BDO途径。

图11绘示将谷氨酸酯转变为BDO的实例性BDO途径。所述实例性BDO途径的酶连同编码所述酶的实例性基因一起列示于表21中。

简单来说，可通过谷氨酸CoA转移酶(EC 2.8.3.a)、谷氨酰基-CoA水解酶(EC3.1.2.a)或谷氨酰基-CoA连接酶(或谷氨酰基-CoA合成酶)(EC 6.2.1.a)将谷氨酸酯转变为谷氨酰基-CoA。或者，可通过谷氨酸酯5-激酶(EC 2.7.2.a)将谷氨酸酯转变为谷氨酸酯-5-磷酸酯。可通过谷氨酸酯-5-半醛脱氢酶(磷酸化)(EC 1.2.1.d)将谷氨酸酯-5-磷酸酯转变为谷氨酸酯-5-半醛。可通过谷氨酰基-CoA还原酶(或谷氨酸酯-5-半醛脱氢酶)(EC1.2.1.b)将谷氨酰基-CoA转变为谷氨酸酯-5-半醛。可通过谷氨酸酯-5-半醛还原酶(EC1.1.1.a)将谷氨酸酯-5-半醛转变为2-氨基-5-羟基戊酸。或者，可通过谷氨酰基-CoA还原酶(形成醇)(EC 1.1.1.c)将谷氨酰基-CoA转变为2-氨基-5-羟基戊酸。可通过2-氨基-5-羟基戊酸氧化还原酶(脱氨)(EC 1.4.1.a)或2-氨基-5-羟基戊酸转氨酶(EC2.6.1.a)将2-氨基-5-羟基戊酸转变为5-羟基-2-氧代戊酸。可通过5-羟基-2-氧代戊酸脱羧酶(EC4.1.1.a)将5-羟基-2-氧代戊酸转变为4-羟基丁醛。可通过1，4-丁二醇脱氢酶(EC1.1.1.a)将4-羟基丁醛转变为1，4-丁二醇。或者，可通过5-羟基-2-氧代戊酸脱氢酶(脱羧)(EC 1.2.1.c)将5-羟基-2-氧代戊酸转变为4-羟基丁酰基-CoA。

实例X

从乙酰乙酰基-CoA的实例性BDo

这个实例描述从乙酰乙酰基-CoA的实例性BDO途径。

图12绘示将乙酰乙酰基-CoA转变为BDO的实例性BDO途径。所述实例性BDO途径的酶连同编码所述酶的实例性基因一起列示于表22中。

简单来说，可通过3-羟基丁酰基-CoA脱氢酶(EC 1.1.1.a)将乙酰乙酰基-CoA转变为3-羟基丁酰基-CoA。可通过3-羟基丁酰基-CoA脱水酶(EC 4.2.1.a)将3-羟基丁酰基-CoA转变为巴豆酰基-CoA。可通过乙烯基乙酰基-CoAΔ-异构酶(EC 5.3.3.3)将巴豆酰基-CoA转变为乙烯基乙酰基-CoA。可通过4-羟基丁酰基-CoA脱水酶(EC 4.2.1.a)将乙烯基乙酰基-CoA转变为4-羟基丁酰基-CoA。可通过4-羟基丁酰基-CoA还原酶(形成醇)(EC 1.1.1.c)将4-羟基丁酰基-CoA转变为1，4-丁二醇。或者，可通过4-羟基丁酰基-CoA还原酶(或4-羟基丁醛脱氢酶)(EC 1.2.1.b)将4-羟基丁酰基-CoA转变为4-羟基丁醛。可通过1，4-丁二醇脱氢酶(EC 1.1.1.a)将4-羟基丁醛转变为1，4-丁二醇。

实例XI

从高丝氨酸的实例性BDO途径

这个实例描述从高丝氨酸的实例性BDO途径。

图13绘示将高丝氨酸转变为BDO的实例性BDO途径。所述实例性BDO途径的酶连同编码所述酶的实例性基因一起列示于表23中。

简单来说，可通过高丝氨酸脱氨酶(EC 4.3.1.a)将高丝氨酸转变为4-羟基丁-2-烯酸酯。或者，可通过高丝氨酸CoA转移酶(EC 2.8.3.a)、高丝氨酸-CoA水解酶(EC3.1.2.a)或高丝氨酸-CoA连接酶(或高丝氨酸-CoA合成酶)(EC 6.2.1.a)将高丝氨酸转变为高丝氨酸-CoA。可通过高丝氨酸-CoA脱氨酶(EC 4.3.1.a)将高丝氨酸-CoA转变为4-羟基丁-2-烯酰基-CoA。可通过4-羟基丁-2-烯酰基-CoA转移酶(EC 2.8.3.a)、4-羟基丁-2-烯酰基-CoA水解酶(EC 3.1.2.a)或4-羟基丁-2-烯酰基-CoA连接酶(或4-羟基丁-2-烯酰基-CoA合成酶)(EC 6.2.1.a)将4-羟基丁-2-烯酸酯转变为4-羟基丁-2-烯酰基-CoA。或者，可通过4-羟基丁-2-烯酸酯还原酶(EC 1.3.1.a)将4-羟基丁-2-烯酸酯转变为4-羟基丁酸酯。可通过4-羟基丁酰基-CoA转移酶(EC 2.8.3.a)、4-羟基丁酰基-CoA水解酶(EC 3.1.2.a)或4-羟基丁酰基-CoA连接酶(或4-羟基丁酰基-CoA合成酶)(EC 6.2.1.a)将4-羟基丁酸酯转变为4-羟基丁酰基-coA。可通过4-羟基丁-2-烯酰基-CoA还原酶(EC 1.3.1.a)将4-羟基丁-2-烯酰基-CoA转变为4-羟基丁酰基-CoA。可通过4-羟基丁酰基-CoA还原酶(形成醇)(EC1.1.1.c)将4-羟基丁酰基-CoA转变为1，4-丁二醇。或者，可通过4-羟基丁酰基-CoA还原酶(或4-羟基丁醛脱氢酶)(EC 1.2.1.b)将4-羟基丁酰基-CoA转变为4-羟基丁醛。可通过1，4-丁二醇脱氢酶(EC 1.1.1.a)将4-羟基丁醛转变为1，4-丁二醇。

实例XII

表达琥珀酰基-CoA合成酶的产生BDO的菌株

这个实例描述BDO在表达琥珀酰基-CoA合成酶的产生BDO的菌株中的增加产生。

如上文所论述，琥珀酸酯可为通过转变为琥珀酰基-CoA用于产生BDO的前体(也参见WO2008/115840、WO 2009/023493、美国公开案2009/0047719、美国公开案2009/0075351)。因此，宿主菌株经遗传修饰以过表达编码琥珀酰基-CoA合成酶的大肠杆菌sucCD基因。大肠杆菌sucCD操纵子的核苷酸序列示于图14A中，并且所编码琥珀酰基-CoA合成酶亚单元的氨基酸序列示于图14B和14C中。简单来说，使用标准分子生物学程序通过PCR从大肠杆菌染色体DNA克隆大肠杆菌sucCD基因且将其引入PA1lacO-1启动子后的多拷贝质粒pZS*13、pZA13和pZE33中(鲁茨和比雅尔，核酸研究25：1203-1210(1997))。

使编码琥珀酰基-CoA合成酶的大肠杆菌sucCD基因过表达。结果显示，向菌株中引入sucCD以表达琥珀酰基-CoA合成酶相较于cat1的天然表达水平或表达改良各种菌株中的BDO产生，cat1是琥珀酰基-CoA/乙酰基-CoA转移酶。因此，通过过表达编码琥珀酰基-CoA合成酶的天然大肠杆菌sucCD基因改良BDO产生。

实例XIII

编码BDO途径酶的异源基因的表达

这个实例描述各种非天然途径酶的表达以改良BDO的产生。

α-酮戊二酸脱羧酶。使编码α-酮戊二酸脱羧酶的牛分枝杆菌sucA基因在宿主菌株中表达。牛分枝杆菌sucA的过表达改良BDO产生(也参见WO2008/115840、WO 2009/023493、美国公开案2009/0047719、美国公开案2009/0075351)。牛分枝杆菌sucA的核苷酸和氨基酸序列和所编码α-酮戊二酸脱羧酶示于图15中。

为了构筑牛分枝杆菌sucA表达菌株，使用下文所示引物从牛分枝杆菌BCG(ATCC19015；美国典型培养物保藏中心(美国典型培养物保藏中心)，马纳萨斯，弗吉尼亚州)的基因组DNA扩增编码α-酮戊二酸脱羧酶的sucA基因片段。通过4个扩增DNA片段的连接反应来组装全长基因，并且将其克隆到P_A1laco-1启动子的表达载体pZS*13和pZE23中(鲁茨和比雅尔，核酸研究25：1203-1210(1997))。通过DNA定序来验证所组装基因的核苷酸序列。

用于片段1的引物：

用于片段2的引物：

用于片段3的引物：

用于片段4的引物：

使用活体外分析与活体内分析二者来证实α-酮戊二酸脱羧酶的菜单达。通过依照先前所报道的方法来测量SucA酶活性(田等人，美国国家科学院院刊102：10670-10675(2005))。反应混合物含有50mM磷酸钾缓冲液(pH 7.0)、0.2mM焦磷酸硫胺素、1mM MgCl₂、0.8mM铁氰化物、1mMα-酮戊二酸酯和细胞粗制裂解物。通过铁氰化物的还原在430nm下监测酶活性。使用大肠杆菌全细胞培养物来验证SucA酶的活体内功能。将经编码SucA酶和4-羟基丁酸脱氢酶(4Hbd)的质粒转化的大肠杆菌MG1655lacI^q单菌落接种到含有合适抗生素的5mL LB培养基中。在37℃下将所述细胞好氧性培养过夜。将200μL此过夜培养物引入补加有20g/L葡萄糖、100mM用以改良缓冲能力的3-(N-吗啉基)丙磺酸(MOPS)、10μg/mL硫胺素和合适抗生素的8mL M9最低培养基(6.78g/L Na₂HPO₄、3.0g/L KH₂PO₄、0.5g/L NaCl、1.0g/LNH₄Cl、1mM MgSO₄、0.1mM CaCl₂)中。通过在接种后首先用氮将加盖厌氧性瓶冲洗5分钟、然后用23G针刺穿隔膜来建立微好氧性条件。在生长期间使针保持在瓶中以允许少量空气进入瓶中。当培养物达到对数生长中期时，用0.2mM异丙基β-D-1-半乳糖硫吡喃糖苷(IPTG)诱导蛋白质表达。作为对照，在相同条件下培养用仅编码4-羟基丁酸脱氢酶的质粒和仅空载体转化的大肠杆菌MG1655 lacI^q菌株(参见表23)。使用LCMS方法监测培养基中4-羟基丁酸酯(4HB)的累积。仅表达分枝杆菌α-酮戊二酸脱羧酶的大肠杆菌菌株产生大量4HB(参见图16)。

表24. 3个含有各种质粒对照且编码sucA和4-羟基丁酸脱氢酶的菌株。

单独实验证实，α-酮戊二酸脱羧酶途径独立于还原性TCA循环发挥功能。使用大肠杆菌菌株ECKh-401(ΔadhE ΔldhA ΔpflB ΔlpdA：：K.p.lpdA322Δmdh ΔarcA)作为宿主菌株(参见表25)。所有3种构筑体都含有编码4HB脱氢酶(4Hbd)的基因。构筑体1还含有编码α-酮戊二酸脱羧酶的基因(sucA)。构筑体2含有编码琥珀酰基-CoA合成酶(sucCD)和CoA依赖性琥珀酸半醛脱氢酶(sucD)的基因，所述酶是经由还原性TCA循环合成4HB所需的。构筑体3含有来自1和2的所有基因。在与上文所述相同的条件下培养所述3种大肠杆菌菌株，只是第二种培养是在微好氧性条件下进行。通过表达SucA酶，构筑体3产生比构筑体2更多的4HB，构筑体2依赖于还原性TCA循环来合成4HB(参见图17)。

通过通量分析实验来提供α-酮戊二酸脱羧酶对于4HB和BDO产生的贡献的进一步支持。使在染色体上含有sucCD-sucD和sucA的ECKh-432的培养物在含有1-13C-葡萄糖(60％)和U-13C-葡萄糖(40％)的混合物的M9最低培养基中生长。收获生物质，分离蛋白质并将其水解成氨基酸，并且通过气相色谱-质谱(GCMS)分析氨基酸的标记分布，如先前所述(菲舍尔(Fischer)和索尔(Sauer)，欧洲生物化学杂志270：880-891(2003))。另外，通过GCMS分析所分泌4HB和BDO的标记分布，如WO2008115840A2中所述。使用此数据利用既定方法来计算细胞内通量分布(苏瑟斯(Suthers)等人，代谢工程9：387-405(2007))。结果指示，介于56％与84％之间的α-酮戊二酸酯引导经过α-酮戊二酸脱羧酶到BDO的途径。其余部分由α-酮戊二酸脱氢酶氧化，随后经由琥珀酰基-CoA路径进入BDO。

所述结果证实含有在质粒上表达的来自牛分枝杆菌BCG的suc4基因的4-羟基丁酸酯产生菌株。当编码此基因的质粒不存在时，当sucD(CoA依赖性琥珀酸半醛脱氢酶)不表达时，4-羟基丁酸酯产生是可忽略的。牛分枝杆菌基因是先前已表征酶产物的结核分枝杆菌基因的亲密同源物(田等人，见上文，2005)。

琥珀酸半醛脱氢酶(CoA依赖性)、4-羟基丁酸脱氢酶和4-羟基丁酰基-CoA/乙酰基-CoA转移酶。来自牙龈卟啉单胞菌W83的基因可为1，4-丁二醇产生用途径的有效组分(也参见WO2008/115840、WO 2009/023493、美国公开案2009/0047719、美国公开案2009/0075351)。来自牙龈卟啉单胞菌的CoA依赖性琥珀酸半醛脱氢酶(sucD)的核苷酸序列示于图18A中，并且所编码氨基酸序列示于图18B中。来自牙龈卟啉单胞菌的4-羟基丁酸脱氢酶(4hbd)的核苷酸序列示于图19A中，并且所编码氨基酸序列示于图19B中。来自牙龈卟啉单胞菌的4-羟基丁酸CoA转移酶(cat2)的核苷酸序列示于图20A中，并且所编码氨基酸序列示于图20B中。

简单来说，使用标准分子生物学程序通过PCR从牙龈卟啉单胞菌染色体DNA克隆来自牙龈卟啉单胞菌W83的编码琥珀酸半醛脱氢酶(CoA依赖性)和4-羟基丁酸脱氢酶且在一些情况下另外4-羟基丁酰基-CoA/乙酰基-CoA的基因，并且将其引入PA1lacO-1启动子后的多拷贝质粒pZS*13、pZA13和pZE33中(鲁茨和比雅尔，核酸研究25：1203-1210(1997))。然后将所述质粒引入宿主菌株中。

将牙龈卟啉单胞菌W83基因引入产生菌株中，如上文所述。一些菌株仅包括琥珀酸半醛脱氢酶(CoA依赖性)和4-羟基丁酸脱氢酶，而无4-羟基丁酰基-CoA/乙酰基-CoA转移酶。

丁酸激酶和磷酸转丁酰基酶。可利用丁酸激酶(BK)和磷酸转丁酰基酶(PTB)来产生4-羟基丁酰基-CoA(也参见WO2008/115840、WO 2009/023493、美国公开案2009/0047719、美国公开案2009/0075351)。特定来说，可利用丙酮丁醇梭菌基因bukl和ptb作为功能BDO途径的一部分。

初始实验涉及天然丙酮丁醇梭菌PTB(020)和BK(021)基因在大肠杆菌中的克隆和表达。如果需要，那么将各基因的起始密码子和终止密码子分别修饰为“ATG”和“TAA”，以供在大肠杆菌中进行最佳表达。丙酮丁醇梭菌基因序列(020N和021N)和其相应经转译肽序列示于图21和22中。

PTB和BK基因作为操纵子存在于丙酮丁醇梭菌中，其中PTB(020)基因首先表达。所述两个基因由序列“atta aagttaagtg gaggaatgtt aac”(SEQ ID NO：11)连结，所述序列包括下游BK(021)基因的再起始核糖体结合位点。在这种情况下，所述两个基因融合到表达载体中的由lac控制的启动子用于在大肠杆菌中表达(鲁茨和比雅尔，核酸研究25：1203-1210(1997))。

发现，两种来自所述载体构筑体的蛋白质的表达因在大肠杆菌中仅极少出现的密码子在丙酮丁醇梭菌基因中大量出现而低于其它外源表达基因。因此，预测新020和021基因将罕见密码子改变为于大肠杆菌基因序列中更常呈现的替代密码子。此密码子优化方法依照先前所述的算法(西瓦拉曼(Sivaraman)等人，核酸研究36：e16(2008))。这种方法基于在任一侧侧接有某些密码子时的出现频率预测密码子置换。测定020(图23)和021(图24)的替代基因序列，其中基于罕见密码子在邻近密码子情况中的发生率，经更常见密码子置换的所述罕见密码子的数目递增(A＜B＜C＜D)。相较于天然020和021肽序列，所述预测序列的实际肽序列中未引入变化。

因密码子优化所致BK和PTB蛋白质的表达改良示于图25A中。天然基因序列的表达示于泳道2中，而020B-021B和020C-021C的表达分别示于泳道3和4中。相较于等效表达的大肠杆菌粗制萃取物中的天然操纵子(2021n)，密码子优化操纵子020B-021B(2021B)和020C-021C(2021C)的更高蛋白质表达水平还可增加活性(图25B)。

密码子优化操纵子是在菌株ECKh-432(ΔadhE ΔldhA ΔpflB ΔlpdA：：K.p.lpdA322 Δmdh ΔarcA gltAR163L fimD：：大肠杆菌sucCD、牙龈卟啉单胞菌sucD、牙龈卟啉单胞菌4hbd fimD：：牛分枝杆菌sucA、克氏羧菌4hbd)的质粒上连同丙酮丁醇梭菌醛脱氢酶一起表达以提供完整BDO途径。在含有20g/L葡萄糖的M9最低培养基中培养细胞，使用23G针来维持微好氧性条件，如上文所述。测量葡萄糖到最终产物BDO的所得转变。还测量γ-丁内酯(GBL)的累积，所述γ-丁内酯是源自PTB-BK酶对的直接产物4Hb-CoA的自发重排分子。图26显示，天然2021n操纵子的表达产生与替代酶功能Cat2(034)相当的BDO量，所述Cat2(034)能够将4HB和游离CoA转变为4HB-CoA。034的GBL量显着高于2021n，表明前一酶比从天然基因表达的PTB-BK具有更高活性。然而，当密码子优化变体2021B和2021C表达时，BDO和GBL二者的量高于034或2021n，指示PTB和BK的基因的密码子优化显着增加其对在大肠杆菌中的BDO合成的贡献。

所述结果证实，可采用丁酸激酶(BK)和磷酸转丁酰基酶(PTB)酶将4-羟基丁酸酯转变为4-羟基丁酰基-CoA。此消除对诸如4-羟基丁酰基-CoA/乙酰基-CoA转移酶等转移酶的需要，所述转移酶可生成1摩尔乙酸酯/mol所产生4-羟基丁酰基-CoA。来自丙酮丁醇梭菌的酶存在于用于BDO产生的诸多经改造菌株中。

4-羟基丁酰基-CoA还原酶。可利用拜氏梭菌ald基因作为功能BDO途径的一部分(也参见WO2008/115840、WO 2009/023493、美国公开案2009/0047719、美国公开案2009/0075351)。拜氏梭菌ald还可用于降低BDO产生菌株中的乙醇产生。另外，发现特定密码子优化ald变体(GNM0025B)改良BDO产生。

所述酶的天然拜氏梭菌ald基因(025n)和所预测蛋白质序列示于图27中。如丙酮丁醇梭菌PTB和BK基因所发现，天然拜氏梭菌ald基因在大肠杆菌中的表达极低。因此，预测到此基因的4种密码子优化变体。图28A-28D显示025的替代基因序列，其中增加数目的罕见密码子基于在邻近密码子的发生率(25A，P＝0.05；25B，P＝0.1；25C，P＝0.15；25D，P＝1)经更常见密码子置换(A＜B＜C＜D)。实际肽序列相较于天然025肽序列没有变化引入所述预测中。密码子优化显着增加拜氏梭菌ald的表达(参见图29)，此导致表达整个BDO途径的细胞中葡萄糖显着较高转变为BDO(图30A)。

使天然和密码子优化基因连同牙龈卟啉单胞菌Cat2一起在宿主菌株ECKh-432(ΔadhE ΔldhA ΔpflB ΔlpdA：：K.p.lpdA322 Δmdh ΔarcA gltAR163L ΔackA fimD：：大肠杆菌sucCD，牙龈卟啉单胞菌sucD，牙龈卟啉单胞菌4hbd fimD：：牛分枝杆菌sucA，克氏羧菌4hbd)中的质粒上表达，由此含有完整BDO途径。在含有20g/L葡萄糖的M9最低培养基中微好氧性培养细胞，如上文所述。比较拜氏梭菌A1d酶(从密码子优化变体基因025B表达)与丙酮丁醇梭菌AdhE2酶于BDO和乙醇的相对产生(参见图30B)。丙酮丁醇梭菌AdhE2酶(002C)产生较BDO多接近4倍的乙醇。相比之下，拜氏梭菌Ald(025B)(结合内源性ADH活性)产生等量BDO，但相较于002C，这种酶的BDO对乙醇的产生比率相反。此表明，拜氏梭菌Ald与丙酮丁醇梭菌AdhE2相比对4HB-CoA的特异性高于乙酰基-coA，因此前者是纳入BDO途径中的优选酶。

测试拜氏梭菌ald基因(托特(Toth)等人，应用与环境微生物学65：4973-4980(1999))作为催化4-羟基丁酰基-CoA转变为4-羟基丁醛的候选物。筛选超过50种醛脱氢酶催化4-羟基丁酰基-CoA转变为4-羟基丁醛的能力。选择拜氏梭菌ald基因用于BDO-产生菌株中实施，因为相对于乙酰基-CoA，这种酶偏好4-羟基丁酰基-CoA作为底物。这是重要的，因为大多数具有醛脱氢酶功能的其它酶(例如丙酮丁醇梭菌的adhE2(方丹等人，细菌学杂志184：821-830(2002))优先将乙酰基-CoA转变为乙醛，所述乙醛进而转变为乙醇。利用所述拜氏梭菌基因可产生BDO的生物体中降低成为副产物的乙醇产量。此外，此基因的密码子优化形式在大肠杆菌中极佳表达(西瓦拉曼等人，核酸研究36：e16(2008))。

4-羟基丁醛还原酶。利用来自热葡糖苷酶地芽孢杆菌(M10EXG)的adh1的4-羟基丁醛还原酶活性。这可通过相对于内源性量增加4-羟基丁醛还原酶活性来改良BDO产生。

筛选多种醇脱氢酶催化4-羟基丁醛还原成BDO的能力。多数对丁醛具有高活性的醇脱氢酶展现显着较低的对4-羟基丁醛的活性。一个显着例外是来自热葡糖苷酶地芽孢杆菌M10EXG的adh1基因(全(Jeon)等人，生物技术杂志(J.Biotechnol.)135：127-133(2008))(GNM0084)，其对4-羟基丁醛与丁醛二者都展现高活性。

来自热葡糖苷酶地芽孢杆菌的adh1基因的天然基因序列和所编码蛋白质序列示于图31中。使热葡糖苷酶地芽胞杆菌ald1基因在大肠杆菌中表达。

Adh1酶(084)在大肠杆菌中从其天然基因极佳表达(参见图32A)。在ADH酶分析中，当使用丁醛或4HB-醛作为底物时，大肠杆菌表达的酶显示极高还原活性(参见图32B)。所测定对所述底物的Km值分别是1.2mM和4.0mM。所述活性值显示，Adh1酶是对所有所测试候选物中的4HB-醛的还原活性最强。

测试084酶在与拜氏梭菌ald偶合时增强BDO产生的能力。在拜氏梭菌ald变体025B基因后面插入084基因以产生使两个基因偶合表达的合成操纵子。相似构筑体将025B与其它ADH基因候选物连接，并测试包括各ADH与025B对BDO产生的效应。所用宿主菌株是ECKh-459(ΔadhE 1dhA ΔpflB ΔlpdA：：fnr-pflB6-K.p.lpdA322 Δmdh ΔarcA gltAR163LfimD：：大肠杆菌sucCD，牙龈卟啉单胞菌sucD，牙龈卟啉单胞菌4hbd fimD：：牛分枝杆菌sucA，克氏羧菌4hbd fimD：：丙酮丁醇梭菌buk1，丙酮丁醇梭菌ptb)，其在染色体上含有BDO途径的其余部分。当相较于仅025B(图33中的左箭头)且结合内源性ADH功能时，结合025B表达的084ADH显示最高BDO量(图33中的右箭头)。当与025B配对时，其还产生多于其它ADH酶的BDO，其它ADH酶指示如下：026A-C，丙酮丁醇梭菌丁醇脱氢酶的密码子优化变体；050，运动发酵单胞菌醇脱氢酶I；052，弗氏柠檬酸杆菌(Citrobacter freundii)1，3-丙二醇脱氢酶；053，短乳酸杆菌(Lactobacillus brevis)1，3-丙二醇脱氢酶；057，脆弱拟杆菌(Bacteroides fragilis)乳醛还原酶；058，大肠杆菌1，3-丙二醇脱氢酶；071，枯草芽孢杆菌168α-酮戊二酸酯半醛脱氢酶。标记“PT5lacO”的构筑体是那些基因由PT5lacO启动子驱动者。在所有其它情况下，使用PA1lacO-1启动子。此显示，在BDO途径中纳入084ADH增加BDO产生。

实例XIV

表达丙酮酸脱氢酶的BDO产生菌株

这个实例描述利用丙酮酸脱氢酶(PDH)来增强BDO产生。使用肺炎克雷伯氏菌lpdA基因的异源表达来增强BDO产生。

通过计算，需要丙酮酸酯到乙酰基-CoA的生成NADH的转变来实现1，4-丁二醇的最大理论产率(也参见WO2008/115840、WO 2009/023493、美国公开案2009/0047719、美国公开案2009/0075351；WO 2008/018930；金等人，应用与环境微生物学73：1766-1771(2007)；金等人，细菌学杂志190：3851-3858(2008)；门泽尔等人，生物技术杂志56：135-142(1997))。据显示，缺乏PDH活性将BDO的最大厌氧性理论产率降低11％(如果不能获得磷酸烯醇丙酮酸酯羧基激酶(PEPCK)活性)和3％(如果可获得PEPCK活性)。然而，更重要地，如果不存在或存在PEPCK活性，那么439号OptKnock菌株(描述于WO 2009/023493和美国公开案2009/0047719中，已敲除ADHEr、ASPT、LDH_D、MDH和PFLi)中不存在PDH活性可将BDO的最大厌氧性产率分别降低54％或43％。在存在外部电子受体时，假定不存在或存在PEPCK活性，那么缺乏PDH活性可将敲除菌株的最大产率分别降低10％或3％。

PDH是最复杂的中心代谢酶之一且由24拷贝丙酮酸酯脱羧酶(E1)和12分子二氢硫辛酰基脱氢酶(E3)构成，所述分子结合到二氢硫辛酰基转乙酰基酶(E2)核心外部。PDH受高NADH/NAD、ATP/ADP和乙酰基-CoA/CoA比率抑制。在诸如大肠杆菌等生物体中的氧受限或厌氧性条件下，所述酶主要因由lpdA编码的E3的NADH敏感性而天然展现极低活性。为此，对来自肺炎克雷伯氏菌的lpdA基因的NADH不敏感形式进行克隆和表达以增加在预计NADH/NAD比率较高的条件下PDH的活性。

天然lpdA的置换。肺炎克雷伯氏菌的丙酮酸脱氢酶操纵子在核苷酸水平与大肠杆菌的等效操纵子具有介于78％与95％之间一致。先前显示，肺炎克雷伯氏菌具有在甘油存在下在厌氧性下生长的能力(门泽尔等人，生物技术杂志56：135-142(1997)；门泽尔等人，生物技术与生物工程60：617-626(1998))。还已显示，大肠杆菌操纵子的lpdA基因中的两个突变可增强其在厌氧性下生长的能力(金等人，应用与环境微生物学73：1766-1771(2007)；金等人，细菌学杂志190：3851-3858(2008))。通过PCR使用基因组DNA(ATCC700721D)作为模板和引物KP-lpdA-Bam(5’-acacgcggatccaacgtcccgg-3’)(SEQ ID NO：12)和KP-lpdA-Nhe(5’-agcggctccgctagccgcttatg-3’)(SEQ ID NO：13)来扩增肺炎克雷伯氏菌的lpdA基因。将所得片段克隆到载体pCR-BluntII-TOPO(英杰；卡尔斯巴德，加利福尼亚州)中，从而产生质粒pCR-KP-lpdA。

使用非复制质粒和来自枯草芽孢杆菌的sacB基因作为反选择手段进行染色体基因置换(盖伊(Gay)等人，细菌学杂志153：1424-1431(1983))。所用载体是缺失oriT和IS序列的pRE118(ATCC87693)，其大小为3.6kb且携带康霉素抗性基因。确认所述序列，并且将所述载体称为pRE118-V2(参见图34)。

通过PCR使用以下引物组合来扩增侧接lpdA基因的大肠杆菌片段：EC-aceF-Pst(5’-aagccgttgctgcagctcttgagc-3’)(SEQ ID NO：14)+EC-aceF-Bam2(5’-atctccggcggtcggatccgtcg-3’)(SEQ ID NO：15)和EC-yacH-Nhe(5’-aaagcggctagccacgccgc-3’)(SEQ ID NO：16)+EC-yacH-Kpn(5’-attacacgaggtacccaacg-3’)(SEQ ID NO：17)。从质粒pCR-KP-lpdA分离含有肺炎克雷伯氏菌的lpdA基因的BamHI-XbaI片段且然后将其连接到分别用PstI+BamHI和NheI-KpnI消化的上述大肠杆菌片段和用KpnI和PstI消化的pRE118-V2质粒。使所得质粒(称为pRE118-M2.1 lpdA yac)经过使用以下组合的定点诱变(SDM)：引物KP-lpdA-HisTyr-F(5’-atgctggcgtacaaaggtgtcc-3’)(SEQID NO：18)和(5’-ggacacctttgtacgccagcat-3’)(SEQ ID NO：19)，用于使His 322残基突变成Tyr残基；或引物KP-lpdA-GluLys-F(5’-atcgcctacactaaaccagaagtgg-3’)(SEQ ID NO：20)和KP-lpdA-G1uLys-R(5’-ccacttctggtttagtgtaggcgat-3’)(SEQ ID NO：21)，用于使残基Glu 354突变成Lys残基。利用Polymerase Pfu Turbo(斯多塔金；圣地亚哥，加利福尼亚州)进行PCR。验证整个片段的序列以及仅所需突变的存在。通过转化将所得质粒引入大肠杆菌ΔadhE：：Frt-ΔldhA：：Frt的电感受态细胞中。染色体中的第一个整合事件是在含有康霉素(25或50mg/L)的LB琼脂板上进行选择。通过PCR使用以下2个引物来验证正确插入：一个定位于插入区外部且一个在康霉素基因中(5’-aggcagttccataggatggc-3’)(SEQ IDNO：22)。选择具有正确插入的克隆用于解析。在普通液体LB中在所需温度下将其继代培养两次且将连续稀释物平铺于LB-无盐-蔗糖10％板上。筛选在含有蔗糖的板上生长的克隆在LB-低盐琼脂培养基上的康霉素抗性基因的损失，并且通过涵盖区的PCR和定序来验证lpdA基因置换。验证插入区的序列，并且其是如下文所述。选择一个具有突变Glu354Lys的克隆(称为4-4-P1)。然后用大肠杆菌ΔPflB：：Frt的P1裂解物转导此克隆，产生菌株ECKh-138(ΔadhE ΔldhA ΔpflB ΔlpdA：：K.p.lpdA322)。

涵盖aceF和lpdA基因的ECKh-138区的序列示于图35中。肺炎克雷伯氏菌lpdA基因加下划线，并且Glu354Lys突变体中改变的密码子带阴影。天然大肠杆菌lpdA与突变肺炎克雷伯氏菌lpdA的蛋白质序列比较示于图36中。

为了评估在BDO产生菌株中使用肺炎克雷伯氏菌lpdA的益处，用从强诱导型启动子表达整个BDO途径的质粒转化宿主菌株AB3和ECKh-138。具体来说，在中等拷贝质粒pZA33上表达大肠杆菌sucCD、牙龈卟啉单胞菌sucD、牙龈卟啉单胞菌4hbd，并且在高拷贝质粒pZE13上表达牙龈卟啉单胞菌Cat2和丙酮丁醇梭菌AdhE2。所述质粒已描述于文献(鲁茨和H.比雅尔，核酸研究25：1203-1210(1997))中，并且其用于BDO途径表达的用途描述于实例XIII和WO2008/115840中。

在37℃下使细胞在补加有20g/L葡萄糖、100mM用以改良缓冲能力的3-(N-吗啉基)丙磺酸(MOPS)、10μg/mL硫胺素和合适抗生素的M9最低培养基(6.78g/L Na₂HPO₄、3.0g/LKH₂PO₄、0.5g/L NaCl、1.0g/L NH₄Cl、1mM MgSO₄、0.1mM CaCl₂)中在厌氧性下生长。通过在接种后首先用氮将加盖厌氧性瓶冲洗5分钟、然后用23G针刺穿隔膜来建立微好氧性条件。在生长期间使针保持在瓶中以允许少量空气进入瓶中。当OD600达到约0.2时，添加0.25mMIPTG以诱导途径基因，并且在诱导后每24小时取试样进行分析。分析培养物上清液的BDO、4HB和其它副产物，如实例II和WO2008/115840中所述。在48小时后，ECKh-138中的BDO和4HB产生显着高于AB3或用于先前工作的宿主MG1655 ΔldhA中的产生(图37)。

PDH启动子置换。先前显示，由含有Fnr结合位点、一个pfllB启动子和其核糖体结合位点(RBS)的转录融合物置换pdhR阻抑子，由此通过厌氧性启动子使aceEF-lpd操纵子表达，应可在厌氧性下增加pdh活性(周等人，生物技术通讯30：335-342(2008))。通过重叠PCR构筑含有Fnr结合位点、pflB-p6启动子和RBS结合位点的融合物。扩增两个片段，一个使用引物aceE-上游-RC(5’-tgacatgtaacacctaccttctgtgcctgtgccagtggttgctgtgatatagaag-3’)(SEQ ID NO：23)和pflBp6-Up-Nde(5’-ataataatacatatgaaccatgcgagttacgggcctataagccaggcg-3’)(SEQ ID NO：24)且另一个使用引物aceE-EcoRV-EC(5’-agtttttcgatatctgcatcagacaccggcacattgaaacgg-3’)(SEQ ID NO：25)和aceE-上游(5’-ctggcacaggcacagaaggtaggtgttacatgtcagaacgtttacacaatgacgtggatc-3’)(SEQ ID NO：26)。通过重叠PCR组装tw片段，并且用限制酶NdeI和BamHI消化最终DNA片段。随后使用如上文所述pRE118-V2将此片段引入大肠杆菌操纵子的aceE基因上游。在菌株ECKh-138和ECKh-422中进行置换。验证涵盖aceE基因的5’区的核苷酸序列且示于图37中。图37显示融合到pflB-p6启动子和核糖体结合位点(RBS)的aceE基因的5’末端的核苷酸序列。5’斜体序列显示在与pdh操纵子相反的方向上转录的aroP基因的起点。3’斜体序列显示aceE基因的起点。大写体：pflB RBS。加下划线：FNR结合位点。粗体：pflB-p6启动子序列。

lpdA启动子置换。通过PCR使用染色体DNA模板以及引物aceF-pflBp6-fwd(5’-agacaaatcggttgccgtttgttaagccaggcgagatatgatctatatc-3’)(SEQ ID NO：27)和lpdA-RBS-B-rev(5’-gagttttgatttcagtactcatcatgtaacacctaccttcttgctgtgatatag-3’)(SEQ IDNO：28)扩增含有fnr结合位点、pflB-p6启动子和pflB基因的RBS的启动子区。通过PCR使用引物B-RBS-lpdA fwd(5’-ctatatcacagcaagaaggtaggtgttacatgatgagtactgaaatcaaaactc-3’)(SEQ ID NO：29)和pflBp6-aceF-rev(5’-gatatagatcatatctcgcctggcttaacaaacggcaaccgatttgtct-3’)(SEQ ID NO：30)扩增质粒2-4a。使用BPS克隆试剂盒(BPS生物科技(BPSBioscience)；圣地亚哥，加利福尼亚州)来组装两个所得片段。对所得构筑体定序，验证并使用上述pRE118-V2方法将其引入菌株ECKh-439中。涵盖所得菌株ECKh-456中的aceF-lpdA区的核苷酸序列示于图39中。

测试宿主菌株ECKh-439(ΔadhE ΔldhA ΔpflB ΔlpdA：：K.p.lpdA322 ΔmdhΔarcA gltAR163L ackA fimD：：大肠杆菌sucCD，牙龈卟啉单胞菌sucD，牙龈卟啉单胞菌4hbd fimD：：牛分枝杆菌sucA，克氏羧菌4hbd)(其构筑描述于下文中)以及pdhR和lpdA启动子置换衍生物ECKh-455和ECKh-456的BDO产生。用含有牙龈卟啉单胞菌Cat2和拜氏梭菌Ald的pZS*13转化所述菌株以提供完整BDO途径。在补加有20g/L葡萄糖的M9最低培养基中培养细胞，如上文所述。在用0.2mM IPTG诱导后48小时，BDO、4HB和丙酮酸酯的浓度如图40中所示。启动子置换菌株产生比同基因型亲本略多的BDO。

所述结果证实，丙酮酸脱氢酶的表达增加BDO产生菌株中BDO的产生。

实例XV

表达柠檬酸合成酶和顺乌头酸酶的BDO产生菌株

这个实例描述增加柠檬酸合成酶和顺乌头酸酶的活性以增加BDO产生。发现R163L突变成gltA改良BDO产生。另外，使用arcA敲除来改良BDO产生。

通过计算测定，需要经过柠檬酸合成酶(CS)和顺乌头酸酶(ACONT)的通量以实现1，4-丁二醇的最大理论产率(也参见WO2008/115840、WO 2009/023493、美国公开案2009/0047719、美国公开案2009/0075351)。在厌氧性条件下，缺乏CS或ACONT活性可将最大理论产率降低14％。在外部电子受体存在下，假定不存在或存在PEPCK活性，那么最大产率分别降低9％或6％，且无经过CS或ACONT的通量。与丙酮酸脱氢酶(PDH)一样，在敲除ADHEr、ASPT、LDH_D、MDH和PFLi的敲除菌株背景下，CS和ACONT的重要性显着增大(439号设计)(参见WO 2009/023493和美国公开案2009/0047719，其以引用方式并入本文中)。

除ECKh-138外，描述于WO 2009/023493和美国公开案2009/0047719中的最小OptKnock菌株设计具有一个额外缺失，即编码苹果酸脱氢酶的mdh基因。此基因的缺失打算防止经由还原性TCA循环到琥珀酸酯的通量。使用λred同源重组方法进行mdh缺失(迪杜森克和万纳，美国国家科学院院刊97：6640-6645(2000))。使用以下寡核苷酸来PCR扩增侧接有来自pKD3的FRT位点的氯霉素抗性基因(CAT)：

加下划线区指示与pKD3质粒的同源性且粗体序列是指mdh ORF上游和下游的序列同源性。纯化后，将PCR产物电穿孔到ECKh-138电感受态细胞中，所述ECKh-138电感受态细胞已经pRedET(tet)转化且根据制造商说明书制得(www.genebridges.com/gb/pdf/K001％20Q％20E％20BAC％20Modification％20K it-version2.6-2007-screen.pdf)。设计PCR产物以将其整合到ECKh-138基因组中的mdh基因上游区中，如图41中所示。

针对氯霉素抗性选择重组体且进行划线纯化。通过诊断PCR验证mdh基因的损失和CAT的插入。为了去除CAT基因，在30℃下将含有FLP重组酶的温度敏感性质粒pCP20(迪杜森克和万纳，美国国家科学院院刊97：6640-6645(2000))转化到细胞中且针对氨苄青霉素抗性(AMP)进行选择。在42℃下使转化体非选择性地生长过夜以热诱导FLP合成并引起质粒损失。然后划线纯化培养物，并且测试个别菌落的所有抗生素抗性的损失。大多数同时损失FRT侧接的抗性基因和FLP辅助质粒。还存在“FRT”疤痕残留物。所得菌株称为ECKh-172。

CS和ACONT在厌氧性条件下不具有高活性或无高表达。为此，使编码TCA循环的全局调节物的arcA基因缺失。ArcA在微好氧性条件下起作用以诱导基因产物aceE、pflB和adhE的表达，从而使中心代谢酶活性对低氧量敏感。据显示，就微好氧性来说，缺失arcA/arcB增加ldh、icd、gltA、mdh和gdh基因的比活性(萨蒙(Salmon)等人，生物化学杂志280：15084-15096(2005)；沙尔-莱瓦农(Shalel-Levanon)等人，生物技术与生物工程92(2)：147-159(2005)。通过PCR分别使用以下引物扩增大肠杆菌MG1655的arcA基因的上游和下游区：具有ArcA-上游-KpnI(5’-tattattatggtaccaatatcatgcagcaaacggtgcaacattgccg-3’)(SEQ ID NO：34)的ArcA-上游-EcoRI(5’-ataataatagaattcgtttgctacctaaattgccaactaaatcgaaacagg-3’)(SEQ ID NO：33)和具有ArcA-下游-PstI(5’-ataaaaccctgcagcggaaacgaagttttatccatttttggttacctg-3’)(SEQ ID NO：36)的ArcA-下游-EcoRI(5’-tgatctggaagaattcatcggctttaccaccgtcaaaaaaaacggcg-3’)(SEQ ID NO：35)。随后用限制酶EcoRI和KpnI(上游片段)和EcoRI和PstI(下游)消化这些片段。然后将其连接到pRE118-V2质粒并用PstI和KpnI消化，从而产生质粒pRE118-ΔarcA。验证质粒pRE118-ΔarcA的序列。将pRE118-ΔarcA引入大肠杆菌菌株ECKh-172(ΔadhE ΔldhA ΔpflB ΔlpdA：：K.p.lpdA322 Δmdh)的电感受态细胞中。在如上文所述对LB-无盐-蔗糖板进行整合和解析后，通过定序验证所得菌株ECKh-401的染色体中arcA基因的缺失且将其示于图42中。

大肠杆菌的gltA基因编码柠檬酸合成酶。先前显示，此基因受NADH异位抑制，并且已鉴别参与此抑制的氨基酸(佩雷拉(Pereira)等人，生物化学杂志269(1)：412-417(1994)；斯托克(Stokell)等人，生物化学杂志278(37)：35435-35443(2003))。通过PCR使用引物gltA-上游(5’-ggaagagaggctggtacccagaagccacagcagga-3’)(SEQ ID NO：37)和gltA-PstI(5’-gtaatcactgcgtaagcgccatgccccggcgttaattc-3’)(SEQ ID NO：38)来扩增大肠杆菌MG1655的gltA基因。将经扩增片段在用KpnI和PstI消化后克隆到pRE118-V2中。所得质粒称为pRE118-gltA。然后使此质粒经过使用引物R163L-f(5’-attgccgcgttcctcctgctgtcga-3’)(SEQ ID NO：39)和R163L-r(5’-cgacagcaggaggaacgcggcaat-3’)(SEQ ID NO：40)的定点诱变(SDM)以将残基Arg 163变成Lys残基。通过定序来验证整个片段的序列。使用λred同源重组方法的变化形式(迪杜森克和万纳，美国国家科学院院刊97：6640-6645(2000))用R163L突变体等位基因置换天然gltA基因，而不留下Frt疤痕。一般重组程序与用于造成上述mdh缺失者相同。首先，通过使用λred同源重组方法引入rpsL无效突变使菌株ECKh-172具有链霉素抗性。接下来，进行重组以用包括康霉素抗性基因(kanR)和大肠杆菌rpsL基因野生型拷贝的盒置换此菌株中的整个野生型gltA编码区。当引入具有rpsL无效突变的大肠杆菌菌株中时，所述盒使细胞从对药物链霉素的抗性变成链霉素敏感性。然后引入包括gltA基因的各突变形式以及合适同源末端的DNA片段，并且在链霉素存在下测试所致菌落生长。此选择kanR/rpsL盒已由突变gltA基因置换的菌株。通过PCR和DNA定序分析来确认正确基因座中突变基因的插入。所得菌株称为ECKh-422，并且具有基因型ΔadhE ΔldhA ΔpflBΔlpdA：：K.p.lpdA322 Δmdh ΔarcA gltAR163L。通过定序验证涵盖菌株ECKh-422的突变gltA基因的区，如图43中所示。

然后评估菌株ECKh-401和gltAR163L突变ECKh-422的粗制萃取物的柠檬酸合成酶活性。通过以4,500rpm离心(Beckman-Coulter，Allegera X-15R；富勒顿，加利福尼亚州)10min来收获细胞。将沉淀再悬浮于0.3mL具有benzonase核酸酶和溶菌酶的BugBuster(诺瓦根/EMD；圣地亚哥，加利福尼亚州)试剂中，并且在室温下轻轻振荡的同时进行15分钟裂解。通过在4℃下以14,000rpm离心(Eppendorf离心机5402；汉堡，德国)30min获得无细胞裂解物。使用布拉德福德的方法(布拉德福德，分析生物化学72：248-254(1976))来测定试样中的细胞蛋白质。

通过依照从乙酰基-CoA与草酰乙酸酯的反应释放的游离辅酶A(HS-CoA)的形成来测定柠檬酸合成酶活性。HS-CoA的游离硫醇基与5，5’-二硫代双-(2-硝基苯甲酸)(DTNB)反应以形成5-硫代-2-硝基苯甲酸(TNB)。然后通过测量410nm下的吸亮度(在412nm下最大)以分光亮度计测量方式监测TNB的浓度。分析混合物含有100mM Tris/HCl缓冲液(pH 7.5)、20mM乙酰基-CoA、10mM DTNB和20mM草酰乙酸酯。对于NADH抑制的评估来说，还将0.4mMNADH添加到反应。通过添加5微升细胞萃取物来开始分析，并且通过依照吸亮度随时间的变化来测量反应速率。比活性单位定义为每分钟每mg蛋白质所转变产物的μmol数。

图44显示野生型gltA基因产物和R163L突变体的柠檬酸合成酶活性。在不存在或存在0.4mM NADH下进行分析。

用表达整个BDO途径的质粒转化菌株ECKh-401和ECKh-422。在低度拷贝质粒pZS*13上表达大肠杆菌sucCD、牙龈卟啉单胞菌sucD、牙龈卟啉单胞菌4hbd和牛分枝杆菌sucA，并且在中等拷贝质粒pZE23上表达牙龈卟啉单胞菌Cat2和丙酮丁醇梭菌AdhE2。使所述菌株的培养物在补加有20g/L葡萄糖和合适抗生素的M9最低培养基中在微好氧性下生长，如上文所述。两种相同培养物在诱导后48小时的4HB平均浓度和BDO平均浓度示于图45中。ECKh-422中的4HB平均浓度和BDO平均浓度都高于ECKh-401，从而证实因gltA突变所致柠檬酸合成酶活性增强可增加到BDO途径的通量。

此部分中所述宿主菌株修饰打算重新引导经过氧化TCA循环的碳通量，这与描述于WO 2009/023493和美国公开案2009/0047719中的OptKnock菌株设计一致。为了证实通量实际上途经此路径，使用菌株进行¹³C通量分析，所述ECKh-432是ECKh-422的上游途径整合到染色体中的形式(如实例XVII中所述)。为了完成BDO途径，从pZS*13表达牙龈卟啉单胞菌Cat2和拜氏梭菌Ald。使4种平行培养物在含有以下4种不同标记比率(^1-13C，葡萄糖分子中仅第一个碳原子经¹³C标记；均匀-¹³C，所有碳原子都为¹³C)的4g/L总葡萄糖的M9最低培养基(6.78g/L Na₂HPO₄、3.0g/L KH₂PO₄、0.5g/L NaCl、1.0g/L NH₄Cl、1mM MgSO₄、0.1mM CaCl₂)中生长：

1.80mol％未经标记，20mol％均匀-¹³C

2.10mol％未经标记，90mol％均匀-¹³C

3.90mol％^1-13C，10mol％均匀-¹³C

4.40mol％^1-13C，60mol％均匀-¹³C

使未经标记平行培养物一式两份生长，从其频繁地取样以评估生长速率、葡萄糖吸收速率和产物形成速率。在指数期晚期，收获经标记培养物，分离蛋白质并将其水解成氨基酸，并且通过气相色谱-质谱(GCMS)分析氨基酸的标记分布，如先前所述(菲舍尔和索尔，欧洲生物化学杂志270：880-891(2003))。另外，通过GCMS分析来自经标记培养物的培养液中所分泌4HB和BDO的标记分布，如WO2008115840中所述。全体地使用此数据利用既定方法来计算细胞内通量分布(苏瑟斯等人，代谢工程9：387-405(2007))。所得中心代谢通量和相关95％信赖区间示于图46中。值是正规化成1mmol/hr的葡萄糖吸收速率的摩尔通量。结果指示，碳通量在氧化方向上途经柠檬酸合成酶，并且多数碳进入BDO途径，而非完成TCA循环。此外，其证实，在苹果酸酯与草酰乙酸酯之间因此菌株中缺失mdh基本上而不存在通量。

可通过比较ECKh-422的典型发酵概况与原始菌株ECKh-138(其中经由还原性TCA循环从琥珀酸酯产生BDO)观察使用敲除菌株(例如使用OptKnock设计的菌株)用于BDO产生的优点(参见WO 2009/023493和美国公开案2009/0047719)(参见图47)。利用1L初始培养体积在2L Biostat B+生物反应器(莎多利斯(Sartorius)；企业特投(Cedex)，法国)中使用补加有20g/L葡萄糖的M9最低培养基进行发酵。温度控制在37℃，并且使用2M NH₄OH或Na₂CO₃将pH控制在7.0。使细胞在好氧性下生长到约10的OD600，此时用0.2mM IPTG诱导培养物。在诱导后1小时，对于微好氧性条件来说，将空气流速降到.02标准升/分钟。将搅拌速率设定在700rpm。进料浓缩葡萄糖以维持容器中的葡萄糖浓度介于0.5g/L与10g/L之间。用带有整个BDO途径的质粒转化两种菌株，如上文实例中所述。在ECKh-138中，乙酸酯、丙酮酸酯和4HB在发酵中占优势，而对于ECKh-422来说，BDO是主要产物。

实例XVI

表达磷酸烯醇丙酮酸酯羧基激酶的BDO菌株

这个实例描述利用磷酸烯醇丙酮酸酯羧基激酶(PEPCK)来增强BDO产生。使用流感嗜血杆菌PEPCK基因进行异源表达。

通过计算证实，需要草酰乙酸酯到磷酸烯醇丙酮酸酯的生成ATP的转变以实现1，4-丁二醇的最大理论产率(也参见WO2008/115840、WO 2009/023493、美国公开案2009/0047719、美国公开案2009/0075351)。据显示，缺乏PEPCK活性将BDO的最大理论产率降低12％(假定为厌氧性条件)和3％(假定存在诸如硝酸根或氧等外部电子受体)。

在诸如大肠杆菌等生物体中，PEPCK在从草酰乙酸酯向磷酸烯醇丙酮酸酯的葡萄糖异生性和消耗ATP的方向上作用。已假设，大肠杆菌的PEPCK的动力学限制阻止其有效地催化从PEP形成草酰乙酸酯。大肠杆菌天然地利用PEP羧化酶(PPC)(其不生成ATP但是有效生长所需)以从磷酸烯醇丙酮酸酯形成草酰乙酸酯。因此，测试三种非天然PEPCK酶(表26)补充大肠杆菌的PPC突变菌株在葡萄糖最低培养基中的生长的能力。

表26.磷酸烯醇丙酮酸酯羧基激酶序列来源.

PEPCK来源菌株	登录号，基因库参照序列
		流感嗜血杆菌	NC_000907.1
琥珀酸放线杆菌	YP_001343536.1
		产琥珀酸曼氏杆菌	YP_089485.1

生长补充研究涉及在从Keio集合的获得的Δppc突变体大肠杆菌JW3978中基因候选物的基于质粒的表达(巴巴(Baba)等人，分子系统生物学(Molecular Systems Biology)2：2006.0008(2006))。在PA1lacO-1启动子后将所述基因克隆于表达载体pZA23(中等拷贝)和pZE13(高拷贝)中。先前已描述所述质粒(鲁茨和比雅尔，核酸研究25：1203-1210(1997))，并且其在表达BDO途径基因中的用途先前已描述于WO2008115840中。

使预培养物在具有4g/L葡萄糖的M9最低培养基中进行好氧性生长。向所有预培养物补加天冬氨酸酯(2mM)以向Appc突变体提供用于独立于PEPCK表达生成TCA循环中间体的来源。还将M9最低培养基用于具有4g/L葡萄糖的测试条件中，但未添加天冬氨酸酯且将IPTG添加到0.5mM。

表27显示生长补充研究的结果。

表27.当从载体pZA23或pZE13表达时，用来自流感嗜血杆菌、琥珀酸放线杆菌和产琥珀酸曼氏杆菌的PEPCK补充Δppc突变体。

PEPCK来源菌株	载体	时间(h)	OD<sub>600</sub>
				流感嗜血杆菌	pZA23BB	40	0.950
Δppc对照	pZA23BB	40	0.038
				琥珀酸放线杆菌	pZA23BB	40	0.055
产琥珀酸曼氏杆菌	pZA23BB	40	0.214
				琥珀酸放线杆菌	pZE13BB	40	0.041
产琥珀酸曼氏杆菌	pZE13BB	40	0.024
				Δppc对照	pZE13BB	40	0.042

发现在基于质粒的筛选中测试的基因中，流感嗜血杆菌PEPCK最好地补充Δppc突变大肠杆菌中的生长。然后使用SacB反选择方法利用上述pRE118-V2将此基因整合到野生型大肠杆菌(MG1655)的PPC基因座中(盖伊等人，细菌学杂志153：1424-1431(1983))。保持大肠杆菌天然PPC启动子但利用非天然PEPCK终止子来整合PEPCK。在由流感嗜血杆菌pepck置换ppc后，这个区域的序列示于图48中。pepck编码区加下划线。

应用用于适应性进化的技术来改良大肠杆菌突变体(Δppc：：H.infpepCK)的生长速率。使用具有4g/L葡萄糖和50mM碳酸氢钠的M9最低培养基在厌氧性环境中培养并进化此菌株。利用高碳酸氢钠浓度来驱动向草酰乙酸酯形成的PEPCK反应的平衡。为了维持指数生长，在实现0.5的OD600时将培养物稀释2倍。在经3周适应性进化约100代后，厌氧性生长速率相对于野生型从约8h改良到约2h。在进化后，分离个别菌落，并且比较其与初始突变和野生型菌株在厌氧性瓶中的生长(参见图49)。使用具有4g/L葡萄糖和50mM碳酸氢钠的M9培养基。

然后重复上述ppc/pepck基因置换程序，此时使用BDO-产生菌株ECKh-432(ΔadhEΔldhA ΔpflB ΔlpdA：：K.p.lpdA322 Δmdh ΔarcA gltAR163L ΔackA fimD：：大肠杆菌sucCD，牙龈卟啉单胞菌sucD，牙龈卟啉单胞菌4hbd fimD：：牛分枝杆菌sucA，克氏羧菌4hbd)和ECKh-439作为宿主。所述菌株含有上述TCA循环增强以及整合在染色体中的上游途径。ECKh-439是缺乏编码乙酸酯激酶的ackA基因的ECKh-432衍生物。使用上述sacB反选择方法进行此缺失。

在发酵中运行ECKh-439的Δppc：：H.infpepCK衍生物(称为ECKh-453)。通过含有牙龈卟啉单胞菌Cat2和拜氏梭菌Ald的pZS*13供应下游BDO途径。这是利用1L初始培养体积在2L Biostat B+生物反应器(莎多利斯)中使用补加有20g/L葡萄糖和50mM NaHCO₃的M9最低培养基中进行。温度控制在37℃，并且使用2M NH₄OH或Na₂CO₃将pH控制在7.0。使细胞在好氧性下生长到约2的OD600，此时用0.2mM IPTG诱导培养物。在诱导后1小时，对于微好氧性条件来说，将空气流速降到0.01标准升/分钟。将搅拌速率初始设定在700rpm。当培养密度增加时，在整个发酵期间逐渐增加通气速率。进料浓缩葡萄糖溶液以将容器中的葡萄糖浓度维持在介于0.5g/L与10g/L之间。产物概况示于图50中。观察到的以约1对1摩尔比产生BDO和乙酸酯的表型与WO 2009/023493中针对439号设计(ADHEr、ASPT、LDH_D、MDH、PFLi)所预测者高度相似。认为无需靶向ASPT反应的缺失，这是因为经过天冬氨酸酯氨-裂解酶的天然通量较低。

OptKnock菌株的关键特征在于所关注代谢物的产生通常与生长偶合且进一步在于产生应发生在指数生长期间以及静止期。通过在微好氧性瓶中生长同时在指数期期间频繁地取样来评估ECKh-432和ECKh-453的生长偶合潜力。使用含有4g/L葡萄糖和10mMNaHCO₃(对于ECKh-432来说)或50mM NaHCO₃(对于ECKh-453来说)的M9培养基，并且从接种包括0.2mM IPTG。使用18G针进行ECKh-432的微好氧性生长，而对于ECKh-453来说，测试18G针与27G针二者。较高号针产生较少通气。如图51中所示，ECKh-432直到5g/L葡萄糖已消耗才开始产生BDO，对应于静止期起始。在整个实验内，ECKh-453都更均匀地产生BDO。另外，当培养物通气减少时，改良生长偶合。

实例XVII

编码BDO途径的基因于特定整合位点的整合

这个实例描述将各种BDO途径基因整合到fimD基因座中以提供更有效的表达和稳定性。

产生4HB的整个上游BDO途径已于fimD基因座处整合到大肠杆菌染色体中。使用λred同源重组方法将上游途径的琥珀酸酯支路整合到大肠杆菌染色体中(迪杜森克和万纳，美国国家科学院院刊97：6640-6645(2000))。受体大肠杆菌菌株是ECKh-422(ΔadhE ΔldhA ΔpflB ΔlpdA：：K.p.lpdA322 Δmdh ΔarcA gltAR163L)。将含有启动子、sucCD基因、sucD基因和4hbd基因和终止子序列的多顺反子DNA片段插入pKD3质粒的AflIII位点中。使用以下引物来扩增来自质粒的操纵子以及氯霉素标记物。加下划线序列与靶插入位点同源。

在DpnI处理和DNA电泳后，使用经纯化PCR产物来转化具有质粒pKD46的大肠杆菌菌株。在含有氯霉素的板上选择候选菌株。纯化候选菌株的基因组DNA。扩增插入序列且通过DNA定序确认。通过翻转酶从染色体去除抗氯霉素标记物。插入和去除标记物后的区的核苷酸序列示于图52中。

通过同源重组将上游途径的α-酮戊二酸酯支路整合到染色体中。用于此修饰中的质粒源自载体pRE118-V2，如实例XIV中所提到，所述载体含有抗康霉素基因、编码聚果糖蔗糖酶的基因(sacB)和R6K条件复制起点。整合质粒还含有具有启动子、sucA基因、克氏羧菌4hbd基因和终止子的多顺反子序列，所述序列插入两个与靶插入位点的侧接区同源的1.5-kb DNA片段之间。使用所得质粒来转化大肠杆菌菌株。在含有康霉素的板上选择整合候选物。通过PCR来验证正确整合位点。为了解析来自染色体的抗生素标记物，选择细胞用于在含有蔗糖的培养基上生长。通过PCR和DNA定序来验证最终菌株。插入和去除标记物后的染色体区的核苷酸序列示于图53中。

用具有下游途径基因的质粒转化所得上游途径整合菌株ECKh-432。构筑体能够在最低培养基中从葡萄糖产生BDO(参见图54)。

实例XVIII

使用非磷酸转移酶蔗糖吸收系统来减少丙酮酸酯副产物形成

这个实例描述利用非磷酸转移酶(PTS)蔗糖吸收系统来减少蔗糖转变为BDO中作为副产物的丙酮酸酯。

经改造用于经由磷酸转移酶(PTS)系统利用蔗糖的菌株产生大量作为副产物的丙酮酸酯。因此，使用非PTS蔗糖系统可用来减少丙酮酸酯形成，这是因为输入蔗糖不会伴有磷酸烯醇丙酮酸酯(PEP)转化成丙酮酸酯。此将增加PEP库和经过PPC或PEPCK到草酰乙酸酯的通量。

将非PTS蔗糖操纵子插入rrnC区中。为生成含有侧接有与rrnC区同源的区的非PTS蔗糖基因的PCR产物，使用两个寡核苷酸来PCR扩增来自Mach1^TM(英杰，卡尔斯巴德，加利福尼亚州)的csc基因。此菌株是W菌株的派生物，W菌株是已知能够使蔗糖分解代谢的大肠杆菌菌株(奥伦西奥-特雷霍(Orencio-Trejo)等人，生物技术与生物燃料(BiotechnologyBiofuels)1：8(2008))。所述序列源自大肠杆菌W菌株KO11(登录号AY314757)(舒克拉(Shukla)等人，生物技术通讯26：689-693(2004))且包括编码蔗糖通透酶(cscB)、D-果糖激酶(cscK)、蔗糖水解酶(cscA)和LacI相关性蔗糖特异性阻制子(cscR)的基因。通过置放AS引物来有效去除cscR的前53个氨基酸。寡核苷酸的序列为：rrnC 23S del S-CSC 5’-TGTGAG TGA AAG TCA CCT GCC TTA ATA TCT CAA AAC TCA TCT TCG GGT GAC GAA ATA TGG CGT GAC TCG ATA C-3′(SEQ ID NO：43)和rrnC 23S del AS-CSC 5’-TCT GTA TCA GGCTGA AAA TCT TCT CTC ATC CGC CAA AAC AGC TTC GGC GTT AAG ATG CGC GCT CAA GGA C-3’(SEQ ID NO：44)。加下划线区指示与csc操纵子的同源性，并且粗体序列是指序列rrnC区的上游和下游同源性。整个PCR产物的序列示于图55中。

纯化后，将PCR产物电穿孔到MG1655电感受态细胞中，所述MG1655电感受态细胞已经pRedET(tet)转化且根据制造商说明书制得(www.genebridges.com/gb/pdf/K001％20Q％20E％20BAC％20Modification％20Ki t-version2.6-2007-screen.pdf)。设计PCR产物以将其整合到染色体基因组的rrnC区域中。其有效地缺失rrlC(23S rRNA)上游的191个核苷酸、所有rrlC rRNA基因和rrlC下游的3个核苷酸并用蔗糖操纵子将其置换，如图56中所示。

使转化体在具有0.4％蔗糖的M9最低盐培养基上生长，并通过诊断PCR测试个别菌落中蔗糖操纵子的存在。通过P1转导将整个rrnC：：crcAKB区转移到BDO宿主菌株ECKh-432中(桑布鲁克等人，分子克隆：实验室手册，第三版，冷泉港实验室，纽约(2001))，从而得到ECKh-463(ΔadhE ΔldhA ΔpflB ΔlpdA：：K.p.lpdA322 Δmdh ΔarcA gltAR163LfimD：：大肠杆菌sucCD，牙龈卟啉单胞菌sucD，牙龈卟啉单胞菌4hbd fimD：：牛分枝杆菌sucA，克氏羧菌4hbdrrnC：：cscAKB)。通过在蔗糖上生长来选择重组体且通过诊断PCR来验证。

用含有牙龈卟啉单胞菌Cat2和拜氏梭菌Ald的pZS*13转化ECKh-463以提供完整BDO途径。在补加有10g/L蔗糖的M9最低培养基(6.78g/L Na₂HPO₄、3.0g/L KH₂PO₄、0.5g/LNaCl、1.0g/L NH₄Cl、1mM MgSO₄、0.1mM CaCl₂)中培养细胞。从开始培养物中即存在0.2mMIPTG。使用具有23G针的瓶维持厌氧性条件。作为对照，在相同培养基上培养含有相同质粒的ECKh-432，只是用10g/L葡萄糖代替蔗糖。图57显示生长48小时后正规化成培养物OD600的平均产物浓度。数据涉及各菌株的6个相同培养物。此证实，在蔗糖上来自ECKh-463的BDO产生与蔗糖上的亲本菌株的BDO产生相似。

实例XIX

BDO产生菌株的汇总

这个实例描述各种BDO产生菌株。

表28汇总上文实例XII-XVIII中所揭示的各种BDO产生菌株。

表28.各种BDO产生菌株的总汇.

表28中汇总的菌株如下。菌株1：大肠杆菌MG1655的单缺失衍生物，其中缺失内源性ldhA；质粒表达大肠杆菌sucCD、牙龈卟啉单胞菌sucD、牙龈卟啉单胞菌4hbd、牙龈卟啉单胞菌Cat2、丙酮丁醇梭菌adhE 2。菌株2：宿主菌株AB3，其是产生琥珀酸酯的菌株，是大肠杆菌MG1655的衍生物，其中缺失内源性adhEldhA pflB；质粒表达大肠杆菌sucCD、牙龈卟啉单胞菌sucD、牙龈卟啉单胞菌4hbd、牙龈卟啉单胞菌Cat2、丙酮丁醇梭菌adhE2。

菌株3：宿主菌株ECKh-138，缺失内源性adhE、ldhA、pflB，缺失内源性lpdA且在lpdA基因座处染色体插入具有Glu354Lys突变的肺炎克雷伯氏菌lpdA；质粒表达大肠杆菌sucCD、牙龈卟啉单胞菌sucD、牙龈卟啉单胞菌4hbd、牙龈卟啉单胞菌Cat2、丙酮丁醇梭菌adhE2；菌株提供lpdA的改良以增加丙酮酸脱氢酶通量。菌株4：宿主菌株ECKh-138，缺失内源性adhE、ldhA、pflB和lpdA，染色体插入具有Glu354Lys突变的肺炎克雷伯氏菌lpdA；质粒表达大肠杆菌sucCD、牙龈卟啉单胞菌sucD、牙龈卟啉单胞菌4hbd、丙酮丁醇梭菌buk1、丙酮丁醇梭菌ptb、丙酮丁醇梭菌adhE2。

菌株5：宿主菌株ECKh-401，缺失内源性adhE、ldhA、pflB，缺失内源性lpdA且在lpdA基因座处染色体插入具有Glu354Lys突变的肺炎克雷伯氏菌lpdA，缺失内源性mdh和arcA；质粒表达大肠杆菌sucCD、牙龈卟啉单胞菌sucD、牙龈卟啉单胞菌4hbd、牙龈卟啉单胞菌Cat2、丙酮丁醇梭菌adhE2；菌株缺失mdh和arcA以引导经过氧化性TCA循环的通量。菌株6：宿主菌株ECKh-401，缺失内源性adhE、ldhA、pflB，缺失内源性lpdA且在lpdA基因座处染色体插入具有Glu354Lys突变的肺炎克雷伯氏菌lpdA，缺失内源性mdh和arcA；质粒表达牛分枝杆菌sucA、大肠杆菌sucCD、牙龈卟啉单胞菌sucD、牙龈卟啉单胞菌4hbd、牙龈卟啉单胞菌Cat2、丙酮丁醇梭菌adhE2。

菌株7：宿主菌株ECKh-422，缺失内源性adhE、ldhA、pflB，缺失内源性lpdA且在lpdA基因座处染色体插入具有Glu354Lys突变的肺炎克雷伯氏菌lpdA，缺失内源mdh和arcA，gltA用gltA Arg163Leu突变体进行染色体置换；质粒表达大肠杆菌sucCD、牙龈卟啉单胞菌sucD、牙龈卟啉单胞菌4hbd、牙龈卟啉单胞菌Cat2、丙酮丁醇梭菌adhE2；菌株在柠檬酸合成酶中存在突变以改良厌氧性活性。菌株8：菌株ECKh-422，缺失内源性adhE、ldhA、pflB，缺失内源性lpdA且在lpdA基因座处染色体插入具有Glu354Lys突变的肺炎克雷伯氏菌lpdA，缺失内源性mdh和arcA，gltA用gltA Arg163Leu突变体进行染色体置换；质粒表达牛分枝杆菌sucA、大肠杆菌sucCD、牙龈卟啉单胞菌sucD、牙龈卟啉单胞菌4hbd、牙龈卟啉单胞菌Cat2、丙酮丁醇梭菌adhE2。菌株9：宿主菌株ECKh-422，缺失内源性adhE、ldhA、pflB，缺失内源性lpdA且在lpdA基因座处染色体插入具有Glu354Lys突变的肺炎克雷伯氏菌lpdA，缺失内源性mdh和arcA，使用gltA Arg163Leu突变体染色体置换gltA；质粒表达牛分枝杆菌sucA、大肠杆菌sucCD、牙龈卟啉单胞菌sucD、牙龈卟啉单胞菌4hbd、牙龈卟啉单胞菌Cat2、拜氏梭菌Ald。

菌株10：宿主菌株ECKh-426，缺失内源性adhE、ldhA、pflB，缺失内源性lpdA且在lpdA基因座处染色体插入具有Glu354Lys突变的肺炎克雷伯氏菌lpdA，缺失内源性mdh和arcA，gltA用gltA Arg163Leu突变体进行染色体置换，在fimD基因座处染色体插入大肠杆菌sucCD、牙龈卟啉单胞菌sucD、牙龈卟啉单胞菌4hbd；质粒表达牙龈卟啉单胞菌Cat2、拜氏梭菌Ald；菌株在fimD基因座处具有整合到菌株ECKh-422中的上游途径的琥珀酸酯支路。菌株11：宿主菌株ECKh-432，缺失内源性adhE、ldhA、pflB，缺失内源性lpdA且在lpdA基因座处染色体插入具有Glu354Lys突变的肺炎克雷伯氏菌lpdA，缺失内源性mdh和arcA，gltA用gltA Arg163Leu突变体进行染色体置换，在fimD基因座处染色体插入大肠杆菌sucCD、牙龈卟啉单胞菌sucD、牙龈卟啉单胞菌4hbd，在fimD基因座处染色体插入牛分枝杆菌sucA、克氏羧菌4hbd；质粒表达牙龈卟啉单胞菌Cat2、拜氏梭菌Ald；菌株具有整合到ECKh-422中的琥珀酸酯和α-酮戊二酸酯上游路径分支。菌株12：宿主菌株ECKh-432，缺失内源性adhE、ldhA、pflB，缺失内源性lpdA且在lpdA基因座处染色体插入具有Glu354Lys突变的肺炎克雷伯氏菌lpdA，缺失内源性mdh和arcA，gltA用gltA Arg163Leu突变体进行染色体置换，在fimD基因座处染色体插入大肠杆菌sucCD、牙龈卟啉单胞菌sucD、牙龈卟啉单胞菌4hbd，在fimD基因座处染色体插入牛分枝杆菌sucA、克氏羧菌4hbd；质粒表达丙酮丁醇梭菌buk1、丙酮丁醇梭菌ptb、拜氏梭菌Ald。

菌株13：宿主菌株ECKh-439，缺失内源性adhE、ldhA、pflB，缺失内源性lpdA且在lpdA基因座处染色体插入具有Glu354Lys突变的肺炎克雷伯氏菌lpdA，缺失内源性mdh和arcA，gltA用gltA Arg163Leu突变体进行染色体置换，缺失内源性ackA，在fimD基因座处染色体插入大肠杆菌sucCD、牙龈卟啉单胞菌sucD、牙龈卟啉单胞菌4hbd，在fimD基因座处染色体插入牛分枝杆菌sucA、克氏羧菌4hbd；质粒表达牙龈卟啉单胞菌Cat2、拜氏梭菌Ald；菌株使菌株ECKh-432中的乙酸激酶缺失。菌株14：宿主菌株ECKh-453，缺失内源性adhE、ldhA、pflB，缺失内源性lpdA且在lpdA基因座处染色体插入具有Glu354Lys突变的肺炎克雷伯氏菌lpdA，缺失内源性mdh和arcA，gltA用gltA Arg163Leu突变体进行染色体置换，缺失内源性ackA，缺失内源性ppc且在ppc基因座处插入流感嗜血杆菌ppck，在fimD基因座处染色体插入大肠杆菌sucCD、牙龈卟啉单胞菌sucD、牙龈卟啉单胞菌4hbd，在fimD基因座处染色体插入牛分枝杆菌sucA、克氏羧菌4hbd；质粒表达牙龈卟啉单胞菌Cat2、拜氏梭菌Ald；菌株具有菌株ECKh-432中的乙酸激酶缺失和PPC/PEPCK置换。

菌株15：宿主菌株ECKh-456，缺失内源性adhE、ldhA、pflB，缺失内源性lpdA且在lpdA基因座处染色体插入具有Glu354Lys突变的肺炎克雷伯氏菌lpdA，缺失内源性mdh和arcA，gltA用gltA Arg163Leu突变体进行染色体置换，在fimD基因座处染色体插入大肠杆菌sucCD、牙龈卟啉单胞菌sucD、牙龈卟啉单胞菌4hbd，在fimD基因座处染色体插入牛分枝杆菌sucA、克氏羧菌4hbd，使用fnr结合位点、pflB-p6启动子和pflB的RBS置换lpdA启动子；质粒表达牙龈卟啉单胞菌Cat2、拜氏梭菌Ald；菌株使用菌株ECKh-432中的厌氧性启动子置换lpdA启动子。菌株16：宿主菌株ECKh-455，缺失内源性adhE、ldhA、pflB，缺失内源性lpdA且在lpdA基因座处染色体插入具有Glu354Lys突变的肺炎克雷伯氏菌lpdA，缺失内源性mdh和arcA，gltA用gltA Arg163Leu突变体进行染色体置换，在fimD基因座处染色体插入大肠杆菌sucCD、牙龈卟啉单胞菌sucD、牙龈卟啉单胞菌4hbd，在fimD基因座处染色体插入牛分枝杆菌sucA、克氏羧菌4hbdI，使用fnr结合位点、pflB-p6启动子和pflB的RBS置换pdhR和aceEF启动子；质粒表达牙龈卟啉单胞菌Cat2、拜氏梭菌Ald；菌株使用ECKh-432中的厌氧性启动子置换pdhR和aceEF启动子。

菌株17：宿主菌株ECKh-459，缺失内源性adhE、ldhA、pflB，缺失内源性lpdA且在lpdA基因座处染色体插入具有Glu354Lys突变的肺炎克雷伯氏菌lpdA，缺失内源性mdh和arcA，gltA用gltAArg163Leu突变体进行染色体置换，在fimD基因座处染色体插入大肠杆菌sucCD、牙龈卟啉单胞菌sucD、牙龈卟啉单胞菌4hbd，在fimD基因座处染色体插入牛分枝杆菌sucA、克氏羧菌4hbd，在fimD基因座处染色体插入丙酮丁醇梭菌buk1、丙酮丁醇梭菌ptb；质粒表达拜氏梭菌Ald；菌株使BK/PTB整合到菌株ECKh-432中。菌株18：宿主菌株ECKh-459，缺失内源性adhE、ldhA、pflB，缺失内源性lpdA且在lpdA基因座处染色体插入具有Glu354Lys突变的肺炎克雷伯氏菌lpdA，缺失内源性mdh和arcA，gltA用gltA Arg163Leu突变体进行染色体置换，在fimD基因座处染色体插入大肠杆菌sucCD、牙龈卟啉单胞菌sucD、牙龈卟啉单胞菌4hbd，在fimD基因座处染色体插入牛分枝杆菌sucA、克氏羧菌4hbd，在fimD基因座处染色体插入丙酮丁醇梭菌buk1、丙酮丁醇梭菌ptb；质粒表达拜氏梭菌Ald、热葡糖苷酶地芽孢杆菌adh1。

菌株19：宿主菌株ECKh-463，缺失内源性adhE、ldhA、pflB，缺失内源性lpdA且在lpdA基因座处染色体插入具有Glu354Lys突变的肺炎克雷伯氏菌lpdA，缺失内源性mdh和arcA，gltA用gltA Arg163Leu突变体进行染色体置换，在fimD基因座处染色体插入大肠杆菌sucCD、牙龈卟啉单胞菌sucD、牙龈卟啉单胞菌4hbd，在fimD基因座处染色体插入牛分枝杆菌sucA、克氏羧菌4hbd，在rrnC基因座处插入非PTS蔗糖操纵子基因蔗糖通透酶(cscB)、D-果糖激酶(cscK)、蔗糖水解酶(cscA)和LacI相关性蔗糖特异性阻抑子(cscR)；质粒表达牙龈卟啉单胞菌Cat2、拜氏梭菌Ald；菌株具有插入到菌株ECKh-432中的非PTS蔗糖基因。菌株20：宿主菌株ECKh-463，缺失内源性adhE、ldhA、pflB，缺失内源性lpdA且在lpdA基因座处染色体插入具有Glu354Lys突变的肺炎克雷伯氏菌lpdA，缺失内源性mdh和arcA，gltA用gltA Arg163Leu突变体进行染色体置换，在fimD基因座处染色体插入大肠杆菌sucCD、牙龈卟啉单胞菌sucD、牙龈卟啉单胞菌4hbd，在fimD基因座处染色体插入牛分枝杆菌sucA、克氏羧菌4hbd，在rrnC基因座处插入非PTS蔗糖操纵子；质粒表达丙酮丁醇梭菌buk1、丙酮丁醇梭菌ptb、拜氏梭菌Ald。

应理解，除本文所揭示的BDO产生菌株(包括那些表28中所揭示者)以外，还可纳入进一步增加BDO的产生和/或降低不需要的副产物的其它修饰。例如，BDO产生菌株或表28的菌株可纳入其它敲除以进一步增加BDO的产生或减少不需要的副产物。先前已描述实例性敲除(参见美国公开案2009/0047719)。所述敲除菌株包括(但不限于)一或多个选自以下的基因：ADHEr、NADH6；ADHEr、PPCK；ADHEr、SUCD4；ADHEr、ATPS4r；ADHEr、FUM；ADHEr、MDH；ADHEr、PFLi、PPCK；ADHEr、PFLi、SUCD4；ADHEr、ACKr、NADH6；ADHEr、NADH6、PFLi；ADHEr、ASPT、MDH；ADHEr、NADH6、PPCK；ADHEr、PPCK、THD2；ADHEr、ATPS4r、PPCK；ADHEr、MDH、THD2；ADHEr、FUM、PFLi；ADHEr、PPCK、SUCD4；ADHEr、GLCpts、PPCK；ADHEr、GLUDy、MDH；ADHEr、GLUDy、PPCK；ADHEr、FUM、PPCK；ADHEr、MDH、PPCK；ADHEr、FUM、GLUDy；ADHEr、FUM、HEX1；ADHEr、HEX1、PFLi；ADHEr、HEX1、THD2；ADHEr、FRD2、LDH_D、MDH；ADHEr、FRD2、LDH_D、ME2；ADHEr、MDH、PGL、THD2；ADHEr、G6PDHy、MDH、THD2；ADHEr、PFLi、PPCK、THD2；ADHEr、ACKr、AKGD、ATPS4r；ADHEr、GLCpts、PFLi、PPCK；ADHEr、ACKr、ATPS4r、SUCOAS；ADHEr、GLUDy、PFLi、PPCK；ADHEr、ME2、PFLi、SUCD4；ADHEr、GLUDy、PFLi、SUCD4；ADHEr、ATPS4r、LDH_D、SUCD4；ADHEr、FUM、HEX1、PFLi；ADHEr、MDH、NADH6、THD2；ADHEr、ATPS4r、MDH、NADH6；ADHEr、ATPS4r、FUM、NADH6；ADHEr、ASPT、MDH、NADH6；ADHEr、ASPT、MDH、THD2；ADHEr、ATPS4r、GLCpts、SUCD4；ADHEr、ATPS4r、GLUDy、MDH；ADHEr、ATPS4r、MDH、PPCK；ADHEr、ATPS4r、FUM、PPCK；ADHEr、ASPT、GLCpts、MDH；ADHEr、ASPT、GLUDy、MDH；ADHEr、ME2、SUCD4、THD2；ADHEr、FUM、PPCK、THD2；ADHEr、MDH、PPCK、THD2；ADHEr、GLUDy、MDH、THD2；ADHEr、HEX1、PFLi、THD2；ADHEr、ATPS4r、G6PDHy、MDH；ADHEr、ATPS4r、MDH、PGL；ADHEr、ACKr、FRD2、LDH_D；ADHEr、ACKr、LDH_D、SUCD4；ADHEr、ATPS4r、FUM、GLUDy；ADHEr、ATPS4r、FUM、HEX1；ADHEr、ATPS4r、MDH、THD2；ADHEr、ATPS4r、FRD2、LDH_D；ADHEr、ATPS4r、MDH、PGDH；ADHEr、GLCpts、PPCK、THD2；ADHEr、GLUDy、PPCK、THD2；ADHEr、FUM、HEX1、THD2；ADHEr、ATPS4r、ME2、THD2；ADHEr、FUM、ME2、THD2；ADHEr、GLCpts、GLUDy、PPCK；ADHEr、ME2、PGL、THD2；ADHEr、G6PDHy、ME2、THD2；ADHEr、ATPS4r、FRD2、LDH_D、ME2；ADHEr、ATPS4r、FRD2、LDH_D、MDH；ADHEr、ASPT、LDH_D、MDH、PFLi；ADHEr、ATPS4r、GLCpts、NADH6、PFLi；ADHEr、ATPS4r、MDH、NADH6、PGL；ADHEr、ATPS4r、G6PDHy、MDH、NADH6；ADHEr、ACKr、FUM、GLUDy、LDH_D；ADHEr、ACKr、GLUDy、LDH_D、SUCD4；ADHEr、ATPS4r、G6PDHy、MDH、THD2；ADHEr、ATPS4r、MDH、PGL、THD2；ADHEr、ASPT、G6PDHy、MDH、PYK；ADHEr、ASPT、MDH、PGL、PYK；ADHEr、ASPT、LDH_D、MDH、SUCOAS；ADHEr、ASPT、FUM、LDH_D、MDH；ADHEr、ASPT、LDH_D、MALS、MDH；ADHEr、ASPT、ICL、LDH_D、MDH；ADHEr、FRD2、GLUDy、LDH_D、PPCK；ADHEr、FRD2、LDH_D、PPCK、THD2；ADHEr、ACKr、ATPS4r、LDH_D、SUCD4；ADHEr、ACKr、ACS、PPC、PPCK；ADHEr、GLUDy、LDH_D、PPC、PPCK；ADHEr、LDH_D、PPC、PPCK、THD2；ADHEr、ASPT、ATPS4r、GLCpts、MDH；ADHEr、G6PDHy、MDH、NADH6、THD2；ADHEr、MDH、NADH6、PGL、THD2；ADHEr、ATPS4r、G6PDHy、GLCpts、MDH；ADHEr、ATPS4r、GLCpts、MDH、PGL；ADHEr、ACKr、LDH_D、MDH、SUCD4。

表29显示要从诸如大肠杆菌等宿主生物体敲除的对应基因的反应。对应于表29中的缩写的对应代谢物示于表30中。

表29.要敲除以阻止大肠杆菌中发生特定反应的对应基因.

表30.对应于表29中所用缩写的代谢物名称.

实例XX

用于产生BDO的实例性途径

这个实例描述使用羧酸还原酶作为BDO途径酶产生4-羟基丁醛(4-HBal)和/或BDO的实例性途径。

用于产生BDO的实例性途径包括使用NAD+或NADP+芳基醛脱氢酶(E.C.：1.2.1.29和1.2.1.30)将4-羟基丁酸酯转变为4-羟基丁醛和使用醇脱氢酶将4-羟基丁醛转变为1，4-丁二醇。4-羟基丁酸酯可源自三羧酸循环中间体琥珀酰基-CoA和/或α-酮戊二酸酯，如图58中所述。

芳基醛脱氢酶(或羧酸还原酶)。芳基醛脱氢酶或等效地羧酸还原酶可在伊文思奴卡菌中发现。羧酸还原酶催化羧酸依赖镁、ATP和NADPH还原为其对应醛(文卡塔萨布拉曼尼亚(Venkitasubramanian)等人，生物化学杂志282：478-485(2007))且能够催化4-羟基丁酸酯转变为4-羟基丁醛。使由car编码的这种酶在大肠杆菌中克隆并进行菜单达(文卡塔萨布拉曼尼亚等人，生物化学杂志282：478-485(2007))。npt基因产物的表达经由转录后修饰改良酶的活性。npt基因编码将无活性脱辅基酶转变为活性全酶的特异性磷酸泛酰巯基乙胺转移酶(PPTase)。这种酶的天然底物是香草酸，并且所述酶展现对芳香族和脂肪族底物的广泛接受性(文卡塔萨布拉曼尼亚等人，制药与生物技术产业中的生物催化(Biocatalysisin the Pharmaceutical and Biotechnology Industires)，R.N.帕特尔编辑，第15章，第425-440页，化学橡胶公司出版社LLC，博卡拉顿，佛罗里达州(2006))。

基因名称	GI号	登录号	生物体
				car	40796035	AAR91681.1	伊文思奴卡菌(NRRL 5646种)
npt	114848891	ABI83656.1	伊文思奴卡菌(NRRL 5646种)

可基于序列同源性鉴别其它car和npt基因。

在灰色链霉菌发现的另一酶候选物是由griC和griD基因编码。相信这种酶将3-氨基-4-羟基苯甲酸转变为3-氨基-4-羟基苯甲酸代谢的分路产物3-氨基-4-羟基苯甲醛，这是因为缺失griC或griD导致细胞外3-乙酰基氨基-4-羟基苯甲酸累积(铃木等人，抗生素杂志(J.Antibiot.)60(6)：380-387(2007))。griC和griD与SGR_665(序列与伊文思奴卡菌npt相似的酶)共表达可能有益。

具有相似特性的酶α-氨基己二酸酯还原酶(AAR，EC 1.2.1.31)参与一些真菌物种中的赖氨酸生物合成途径。这种酶天然将α-氨基己二酸酯还原成α-氨基己二酸酯半醛。羧基首先经由腺苷酸酯的依赖ATP的形成来活化，其随后由NAD(P)H还原，生成醛和AMP。与CAR一样，这种酶利用镁且需要由PPTase活化。在啤酒酵母菌(莫里斯(Morris)等人，基因98：141-145(1991))、白色假丝酵母菌(郭(Guo)等人，分子遗传学与基因组学(Mol.Genet.Genomics)269：271-279(2003))和粟酒裂殖酵母菌(福特(Ford)等人，当代遗传学(Curr.Genet.)28：131-137(1995))中发现AAR的酶候选物和其对应PPTase。在大肠杆菌中表达时，来自粟酒裂殖酵母菌的AAR展现显着活性(郭等人，酵母菌(Yeast)21：1279-1288(2004))。来自产黄青霉的AAR接受S-羧基甲基-L-半胱氨酸作为替代底物，但不与己二酸酯、L-谷氨酸酯或二氨基庚二酸酯反应(伊哈鲁维亚(Hijarrubia)等人，生物化学杂志278：8250-8256(2003))。迄今尚未鉴别编码产黄青霉PPTase的基因。

使用羧酸还原酶用于BDO产生存在若干优点。相较于经由酰基-CoA或酰基-磷酸酯还原酶从4-羟基丁酸酯的活化形式(例如，4-羟基丁酰基-CoA、4-羟基丁酰基-Pi)形成4-羟基丁醛，经由羧酸还原酶从4-羟基丁酸酯形成4-羟基丁醛存在至少两个优点。首先，显着减少作为副产物的γ-丁内酯(GBL)的形成。人们相信，4-羟基丁酸酯的活化形式比未经活化的4-羟基丁酸酯更容易环化成GBL。羧酸还原酶的使用消除对经过游离活化的4-羟基丁酸酯中间体的需要，因此减少伴随BDO产生作为副产物的GBL的形成。其次，显着减少作为副产物的乙醇的形成。当分别使用形成醛或醇的4-羟基丁酰基-CoA还原酶将4-羟基丁酰基-CoA转变为4-羟基丁醛或1，4-丁二醇时，经常形成不同量的乙醇。这是因为多数(如果并非全部)形成醛或醇的4-羟基丁酰基-CoA还原酶除可接受4-羟基丁酰基-CoA外还可接受乙酰基-CoA作为底物。例如，形成醛的酶经常催化乙酰基-CoA转变为乙醛，所述乙醛随后由天然或非天然醇脱氢酶还原成乙醇。接受乙酰基-CoA作为底物的形成醇的4-羟基丁酰基-CoA还原酶可将乙酰基-CoA直接转变为乙醇。羧酸还原酶对乙酰基-CoA的活性似乎远小于形成醛或醇的酰基-CoA还原酶对乙酰基-CoA的活性，并且因此其应用于BDO产生获得最少乙醇副产物形成(参见下文)。

实例XXI

使用A羧酸还原酶生物合成1，4-丁二醇

这个实例描述使用羧酸还原酶产生1，4-丁二醇的微生物的生成。

使用大肠杆菌作为靶生物体来改造描述于图58中的用于1，4-丁二醇合成的途径。大肠杆菌提供用于生成能够产生1，4-丁二醇的非天然微生物的良好宿主。大肠杆菌适于遗传操纵且已知能够在各种含氧条件下有效地产生各种产物，如乙醇、乙酸、甲酸、乳酸和琥珀酸。

将4-羟基丁酸酯途径基因整合到染色体中：ECKh-432的构筑。在命名为ECKh-432的大肠杆菌菌株中表达羧酸还原酶，ECKh-432的构筑描述于实例XVII中。此菌株含有产生4HB的BDO途径的组分，所述途径于fimD基因座处整合到大肠杆菌的染色体中。

如实例XVII中所述，使用λred同源重组方法将上游途径的琥珀酸酯支路整合到大肠杆菌染色体中(迪杜森克和万纳，美国国家科学院院刊97：6640-6645(2000))。将含有启动子、大肠杆菌的编码琥珀酰基-CoA连接酶的sucCD基因、牙龈卟啉单胞菌的编码琥珀酰基-CoA还原酶(形成醛)(图58的步骤A)的sucD基因、牙龈卟啉单胞菌的编码4-羟基丁酸脱氢酶(图58的步骤C)的4hbd基因和终止子序列的多顺反子DNA片段插入pKD3质粒的AflIII位点中。

如实例XVII中所述，通过同源重组将上游途径的α-酮戊二酸酯支路整合到染色体中。用于此修饰中的质粒是pRE118-V2(缺失oriT和IS序列的pRE118(ATCC87693))，其含有抗康霉素基因、编码聚果糖蔗糖酶的基因(sacB)和R6K条件复制起点。整合质粒还含有具有启动子、来自牛分枝杆菌的编码α-酮戊二酸脱羧酶(图58的步骤B)的sucA基因、编码4-羟基丁酸脱氢酶(图58的步骤C)的克氏羧菌4hbd基因和终止子的多顺反子序列，所述序列插入两个与靶插入位点的侧接区同源的1.5-kb DNA片段之间。使用所得质粒来转化大肠杆菌菌株。在含有康霉素的板上选择整合候选物。通过PCR来验证正确整合位点。为了解析来自染色体的抗生素标记物，选择细胞用于在含有蔗糖的培养基上生长。通过PCR和DNA定序来验证最终菌株。

受体大肠杆菌菌株是ECKh-422(ΔadhE ΔldhA ΔpflB ΔlpdA：：K.p.lpdA322Δmdh ΔarcA gltAR163L)，其构筑描述于实例XV中。ECKh-422含有突变gltAR163L，从而产生由gltA编码的柠檬酸合成酶的对NADH不敏感性。其进一步含有来自肺炎克雷伯氏菌的如上文所述整合到染色体中的lpdA基因的NADH不敏感形式。

天然lpdA的置换是用来自肺炎克雷伯氏菌的NADH不敏感lpdA置换，如实例XIV中所述。所得载体命名为pRE118-V2(参见图34)。

羧酸还原酶和PPTase的克隆和表达。为了生成经改造以产生1，4-丁二醇的大肠杆菌菌株，使用熟知分子生物学技术(例如，参见桑布鲁克，见上文，2001；奥苏贝尔见上文，1999)在大肠杆菌中表达编码羧酸还原酶和磷酸泛酰巯基乙胺转移酶的核酸。特定来说，根据PA1/lacO启动子将car(AAR91681.1)和npt(ABI83656.1)基因克隆到pZS*13载体(伊克斯普拉希斯，卢兹海姆，德国)中。通过PCR从奴卡菌属基因组DNA克隆car基因(GNM_720)。其核酸和蛋白质序列分别示于图59A和59B中。

通过GeneArt(里根斯堡，德国)合成npt基因(GNM_721)的密码子优化形式。其核酸和蛋白质序列分别示于图60A和60B中。将GNM_720和GNM_721克隆到pZS*13中所得载体示于图61中。

将质粒转化到ECKh-432中以表达1，4-丁二醇产生所需蛋白质和酶。还构筑含有仅GNM_720和仅GNM_721的质粒的替代形式。

使用羧酸还原酶的1，4-BDO产生的证实。使用大肠杆菌全细胞培养物来证实1，4-丁二醇途径的菜单达。将经含有GNM_720与GNM_721二者的pZS*13质粒转化的大肠杆菌ECKh-432单菌落接种到5mL含有合适抗生素的LB培养基中。相似地，将经含有GNM_720或GNM_721的pZS*13质粒转化的大肠杆菌ECKh-432单菌落接种到含有合适抗生素的LB培养基的额外5mL等分试样中。通过用1％最早培养物接种含有合适抗生素的新鲜最低活体内转变培养基(参见下文)来开始10mL微好氧性培养物。

最低活体内转变培养基的配方(对于1000mL来说)如下：

通过在接种后首先用氮将加盖厌氧性瓶冲洗5分钟，然后用G针刺穿隔膜来建立微好氧性条件。在生长期间使针保持在瓶中以允许少量空气进入瓶中。当培养物达到对数生长中期时，用0.2mM IPTG诱导蛋白质表达。将此视为：时间＝0hr。分析培养物上清液的BDO、4HB和其它副产物，如上文和WO2008115840中所述(参见表31)。

表31.不同菌株中的BDO、4-HB和其它产物的产生.

PA＝丙酮酸酯，SA＝琥珀酸酯，LA＝乳酸酯，4HB＝4-羟基丁酸酯，BDO＝1，4-丁二醇，GBL＝γ-丁内酯，Etoh＝乙醇，LLOQ＝定量下限

所述结果证实，羧酸还原酶基因GNM_720是ECKh-432中的BDO形成所需，并且当其与PPTase GNM_721共表达时，增加其有效性。在表达GNM_720本身或与GNM_721的组合的菌株中，GBL和乙醇的产生量远小于BDO。

采用羧酸还原酶的实现BDO的其它途径。预计，羧酸还原酶可作为从TCA循环代谢物：琥珀酸酯、琥珀酰基-CoA和α-酮戊二酸酯实现1，4-丁二醇的许多途径的组分发挥功能。所述途径中的若干揭示于图62中。假定葡萄糖作为碳源，那么所有路径可产生大于或等于1mol/mol的理论BDO产率。可从尤其包括蔗糖、木糖、阿拉伯糖、合成气体的其它底物获得相似的高理论产率。预计，羧酸还原酶(也就是，用以催化图62的步骤F和D)单独或与PPTase组合的表达对于从琥珀酸酯产生1，4-丁二醇足够，前提为，存在足够内源性醇脱氢酶活性来催化图62的步骤C和E。图62的步骤A到Z的候选酶描述于部分XXIII中。

实例XXII

采用羧酸还原酶的实现腐胺的途径

这个实例描述利用羧酸还原酶的实例性腐胺途径。

腐胺还称作1，4-二氨基丁烷或丁二胺，是式NH₂(CH₂)₄NH₂的有机化学化合物。其可与己二酸反应反应以生成聚酰胺尼龙-4，6，所述聚酰胺尼龙-4，6由DSM(海尔伦，荷兰)以商品名Stanyl^TM出售。腐胺是通过(例如)活的和死亡生物体中氨基酸的天然降解来天然产生。大肠杆菌已经改造以通过过表达天然鸟氨酸生物合成机器以及鸟氨酸脱羧酶来产生腐胺(钱(Qian)等人，生物技术与生物工程104(4)：651-662(2009))。

图63描述诸多其它生物合成途径，其可从琥珀酸酯、琥珀酰基-CoA或α-酮戊二酸酯产生腐胺且采用羧酸还原酶。注意，所述途径都不需要形成4-氨基丁酸酯的活化形式(例如4-氨基丁酰基-CoA)，其可由酰基-CoA还原酶还原成4-氨基丁醛，并且还可容易地环化成其内酰胺2-吡咯烷酮(大杉(Ohsugi)等人，生物化学杂志256：7642-7651(1981))。假定葡萄糖作为碳源，那么所有路径可产生大于或等于1mol/mol的理论腐胺产率。可从尤其包括蔗糖、木糖、阿拉伯糖、合成气体的其它底物获得相似的高理论产率。图63的步骤A到U的候选酶描述于实例XXIII中。

实例XXIII

用于产生C4化合物的实例性酶

这个实例描述用于产生诸如1，4-丁二醇、4-羟基丁醛和腐胺等C4化合物的实例性酶。

酶类别。绘示于图58、62和63中的所有转化属于示于表32中的一般转化类别。这个实例描述各类别中的诸多以化学方式表征的基因。具体来说，列示可应用于在克隆并表达时催化图58、62和63中的合适转化的基因。各标记的前三个数字对应于前三个酶学委员会编号数字，其表示独立于底物特异性的转化的一般类型。

表32.绘示于图58、62和63中的酶转化的类别.

1.1.1.a氧化还原酶(酮到醇)

醛到醇。描述于图58、62和63中的三种转化涉及醛转变为醇。所述是4-羟基丁酸脱氢酶(步骤C，图58和62)、1，4-丁二醇脱氢酶(步骤E，图58和62)和5-羟基-2-戊酸(步骤Y，图62)。编码催化醛转变为醇的酶(也就是，醇脱氢酶或等效醛还原酶)的实例性基因包括编码C2-C14中链醇脱氢酶的alrA(塔尼等人，应用与环境微生物学66：5231-5235(2000))、来自啤酒酵母菌的ADH2(渥美等人，自然451：86-89(2008))、来自大肠杆菌的yqhD(其对长于C(3)的分子具有偏好)(苏尔岑巴赫等人，分子生物学杂志342：489-502(2004))和来自丙酮丁醇梭菌的bdh I和bdh II(其将丁醛转变为丁醇)(沃尔特等人，细菌学杂志174：7149-7158(1992))。各实例性基因产物的蛋白质序列可使用以下基因库登录号找到：

基因	登录号	GI号	生物体
				alrA	BAB12273.1	9967138	不动杆菌属菌株M-1
ADH2	NP_014032.1	6323961	啤酒酵母菌
				yqhD	NP_417484.1	16130909	大肠杆菌
bdh I	NP_349892.1	15896543	丙酮丁醇梭菌
				bdh II	NP_349891.1	15896542	丙酮丁醇梭菌

展现4-羟基丁酸脱氢酶活性的酶(EC 1.1.1.61)也属于这个类别。所述酶已在富养产碱菌(布拉沃等人，法医学杂志49：379-387(2004))、克氏羧菌(沃尔夫等人，蛋白质的表达和纯化6：206-212(1995))和拟南芥(布雷特刘兹等人，生物化学杂志278：41552-41556(2003))中表征。

显示，来自热葡糖苷酶地芽孢杆菌M10EXG的adh1基因(全等人，生物技术杂志135：127-133(2008))对4-羟基丁醛与丁醛二者展现高活性(参见上文)。因此，这种酶展现1，4-丁二醇脱氢酶活性。

基因	登录号	GI号	生物体
				adh1	AAR91477.1	40795502	热葡糖苷酶地芽胞杆菌M10EXG

另一实例性酶是催化3-羟基异丁酸酯可逆氧化为甲基丙二酸酯半醛的3-羟基异丁酸酯脱氢酶。这种酶参与缬氨酸、亮氨酸和异亮氨酸降解且已在细菌、真核生物和哺乳动物中进行鉴别。由来自嗜热栖热菌HB8的P84067编码的酶已在结构上进行表征(洛卡纳特等人，分子生物学杂志352：905-17(2005))。使用同位素标记的底物证实人类3-羟基异丁酸酯脱氢酶的可逆性(曼宁等人，生物化学杂志231：481-484(1985)。编码这种酶的其它基因包括智人(霍斯等人，酶学方法，324：218-228(2000))和穴兔(乔杜里等人，生物科学、生物技术与生物化学60：2043-2047(1996)；霍斯等人，酶学方法324：218-228(2000))中的3hidh、绣色假单胞菌中的mmsb和恋臭假单胞菌中的dhat(埃伯哈特等人，化学协会会刊[珀金1]6：1404-1406(1979)；乔杜里等人，生物科学、生物技术与生物化学67：438-441(2003)；乔杜里等人，生物科学、生物技术与生物化学60：2043-2047(1996))。

基因	登录号	GI号	生物体
				P84067	P84067	75345323	嗜热栖热菌
mmsb	P28811.1	127211	绣色假单胞菌
				dhat	Q59477.1	2842618	恋臭假单胞菌
3hidh	P31937.2	12643395	智人
				3hidh	P32185.1	416872	穴兔

还已显示，若干3-羟基异丁酸酯脱氢酶将丙二酸半醛转变为3-羟基丙酸(3-HP)。三种展现此活性的基因候选物是来自绣色假单胞菌PAO1(62)的mmsB、来自恋臭假单胞菌KT2440的mmsB(廖等人，美国公开案2005/0221466)和来自恋臭假单胞菌E23的mmsB(乔杜里等人，生物科学、生物技术与生物化学60：2043-2047(1996))。还已在粪产碱杆菌(Alcaligenes faecalis)M3A中鉴别出具有3-羟基丁酸脱氢酶活性的酶(高坎姆等人，美国专利第7,393,676号；廖等人，美国公开案第2005/0221466号)。来自其它生物体(包括类球红杆菌)的其它基因候选物可通过序列相似性推测。

丙二酸半醛转变为3-HP还可通过两种其它酶实现：依赖NADH的3-羟基丙酸酯脱氢酶和依赖NADPH的丙二酸酯半醛还原酶。认为NADH依赖性3-羟基丙酸酯脱氢酶参与细菌和植物中从丙酸酯的β-丙氨酸生物合成途径(拉西纳萨巴帕西，植物病理学杂志(J.PlantPathol.)159：671-674(2002)；施塔特曼，美国化学学会会志77：5765-5766(1955))。迄今尚未将这种酶与任一生物体中的基因相关。依赖NADPH的丙二酸酯半醛还原酶催化自养CO₂-固定细菌中的逆反应。尽管已在瑟杜生金属球菌中检测到所述酶活性，但对基因一致性不了解(阿尔贝等人，细菌学杂志188：8551-8559(2006))。

1.1.1.c氧化还原酶(2步骤，酰基-CoA到醇).

图62的步骤S和W绘示可分别形成4-羟基丁酸酯和1，4-丁二醇的双功能还原酶。将酰基-CoA转变为醇的实例性2步氧化还原酶包括那些转化诸如以下等底物者：乙酰基-CoA到乙醇(例如，来自大肠杆菌的adhE(凯斯勒等人，欧洲生物化学学会联合会快报281：59-63(1991))和丁酰基-CoA到丁醇(例如，来自丙酮丁醇梭菌的adhE2(方丹等人，细菌学杂志184：821-830(2002))。据显示，丙酮丁醇梭菌adhE2基因将4-羟基丁酰基-CoA转变为1，4-丁二醇(参见上文)。除将乙酰基-CoA还原成乙醇外，还已显示，由肠膜样明串珠菌中的adhE编码的酶将支链化合物异丁醛氧化成异丁酰基-CoA(风早等人，普通和应用微生物学杂志18：43-55(1972)；古等人，生物技术通讯27：505-510(2005))。

另一实例性酶可将丙二酰基-CoA转变为3-HP。具有此活性的依赖NADPH的酶已在嗜热光合绿曲菌中进行表征，其中其参与3-羟基丙酸酯循环(赫格勒等人，细菌学杂志184：2404-2410(2002)；斯特劳斯和富克斯，欧洲生物化学杂志215：633-643(1993))。这种酶的质量为300kDa，具有高度底物特异性且显示与其它已知氧化还原酶的微小序列相似性(赫格勒等人，细菌学杂志184：2404-2410(2002))。已显示，其它生物体中的酶都不催化此特异性反应；然而，有生物信息学证据表明，其它生物体可具有相似途径(克拉特等人，环境微生物学9：2067-2078(2007))。其它生物体(包括凯斯特玫瑰弯菌、赤杆菌NAP1和海洋γ变形菌HTCC2080)中的酶候选物可通过序列相似性推测。NAP1和海洋γ变形菌HTCC2080可通过序列相似性推测。

较长链酰基-CoA分子可由诸如编码形成醇的脂肪酰基-CoA还原酶的荷荷巴(蜡黄杨)FAR等酶还原。其在大肠杆菌中的过表达产生FAR活性和脂肪醇累积(梅斯等人，植物生理学122：635-644(2000))。

基因	登录号	GI号	生物体
				FAR	AAD38039.1	5020215	蜡黄杨

1.2.1.b氧化还原酶(酰基-CoA到醛)。

图58、62和63的步骤A涉及由形成醛的琥珀酰基-CoA还原酶将琥珀酰基-CoA转变为琥珀酸半醛。图62的步骤Q绘示由形成醛的4-羟基丁酰基-CoA还原酶将4-羟基丁酰基-CoA转变为4-羟基丁醛。若干酰基-CoA脱氢酶能够将酰基-CoA还原成其对应醛。编码所述酶的实例性基因包括编码脂肪酰基-CoA还原酶的乙酸钙不动杆菌acr1(赖泽尔和萨莫维尔，细菌学杂志179：2969-2975(1997))、不动杆菌M-1脂肪酰基-CoA还原酶(石毛等人，应用与环境微生物学68：1192-1195(2002))和由克氏羧菌中的sucD基因编码的CoA依赖性和NADP依赖性的琥珀酸半醛脱氢酶(淑玲和戈特沙尔克，细菌学杂志178：871-80(1996)；淑玲和戈特沙尔克，细菌学杂志178：871-880(1996))。牙龈卟啉单胞菌的SucD是另一形成醛的琥珀酰基-CoA还原酶(高桥等人，细菌学杂志182：4704-4710(2000))。假单孢菌中的由bphG编码的酰化乙醛脱氢酶是另一酶，这是因为已显示其氧化并酰化乙醛、丙醛、丁醛、异丁醛和甲醛(帕洛斯基等人，细菌学杂志175：377-385(1993))。除将乙酰基-CoA还原成乙醇外，还已显示，由肠膜样明串珠菌中的adhE编码的酶将支链化合物异丁醛氧化成异丁酰基-CoA(古等人，生物技术通讯27：505-510(2005))。丁醛脱氢酶在诸如糖乙酸多丁醇梭菌等产溶剂生物体中催化丁酰基-CoA转变为丁醛的相似反应(小坂等人，生物科学、生物技术与生物化学71：58-68(2007))。

将酰基-CoA转变为其对应醛的另一酶类型是丙二酰基-CoA还原酶，其将丙二酰基-CoA转化成丙二酸半醛。丙二酰基-CoA还原酶是嗜热嗜酸古细菌中经由3-羟基丙酸酯循环进行自养碳固定中的关键酶(博格等人，科学318：1782-1786(2007)；陶厄尔，科学318：1732-1733(2007))。所述酶利用NADPH作为辅因子且已在金属球菌和硫化叶菌中进行表征(阿尔贝等人，细菌学杂志188：8551-8559(2006)；赫格勒等人，细菌学杂志184：2404-2410(2002))。所述酶是由瑟杜生金属球菌中的Msed_0709编码(阿尔贝等人，细菌学杂志188：8551-8559(2006)；博格等人，科学318：1782-1786(2007))。克隆编码来自托克达硫化叶菌的丙二酰基-CoA还原酶的基因并使其在大肠杆菌中异源表达(阿尔贝等人，细菌学杂志188：8551-8559(2006))。尽管所述酶的醛脱氢酶功能与来自嗜热光合绿曲菌的双功能脱氢酶相似，但几乎没有序列相似性。两种丙二酰基-CoA还原酶候选物都与天冬氨酸酯-半醛脱氢酶具有高度序列相似性，所述酶催化天冬氨酰基-4-磷酸酯到天冬氨酸半醛的还原和同时去磷酸化。其它基因候选物可通过与其它生物体(包括硫磺矿硫化叶菌和嗜酸热硫化叶菌)中的蛋白质的序列同源性发现。CoA-酰化醛脱氢酶的另一候选物是来自拜氏梭菌的ald基因(托特等人，应用与环境微生物学65：4973-4980(1999))。已报道，这种酶将乙酰基-CoA和丁酰基-CoA还原成其对应醛。此基因与编码鼠伤寒沙门氏菌和大肠杆菌的乙醛脱氢酶的eutE极为相似(托特等人，应用与环境微生物学65：4973-4980(1999))。

基因	登录号	GI号	生物体
				Msed_0709	YP_001190808.1	146303492	瑟杜生金属球菌
mcr	NP_378167.1	15922498	托克达硫化叶菌
				asd-2	NP_343563.1	15898958	硫磺矿硫化叶菌
Saci_2370	YP_256941.1	70608071	嗜酸热硫化叶菌
				Ald	AAT66436	49473535	天然拜氏梭菌
eutE	AAA80209	687645	鼠伤寒沙门氏菌
				eutE	P77445	2498347	大肠杆菌

1.2.1.c氧化还原酶(2-氧代酸到酰基-CoA，脱羧)。

图62中的步骤AA绘示5-羟基-2-氧代戊酸转变为4-羟基丁酰基-CoA。用于此转化的候选酶包括1)支链2-酮酸脱氢酶、2)α-酮戊二酸脱氢酶和3)丙酮酸脱氢酶多酶复合物(PDHC)。所述酶是催化一系列导致2-酮酸酰化氧化脱羧的部分反应的多酶复合物。2-酮酸脱氢酶复合物中的每一者都占据中间代谢中的关键位置，并且酶活性通常受到严格调节(弗里斯等人，生物化学42：6996-7002(2003))。所述酶共有由以下三种催化组分的多拷贝构成的复杂但常见的结构：α-酮酸脱羧酶(E1)、二氢硫辛酰胺酰基转移酶(E2)和二氢硫辛酰胺脱氢酶(E3)。生物体中所有2-酮酸脱氢酶复合物都共有E3组分，而E1和E2组分是由不同基因编码。酶组分以诸多拷贝存在于复合物中且利用多个辅因子经由底物沟道效应催化定向序列反应。所述脱氢酶复合物的总体大小极大，其中分子质量介于4百万Da与1千万Da之间(也就是，大于核糖体)。

在大肠杆菌中的厌氧性条件下，2-酮酸脱氢酶家族中的酶的活性通常较低或有限。增加NADH(或NADPH)的产生可导致氧化还原失衡，并且NADH本身用作酶功能抑制剂。改造努力已增加大肠杆菌丙酮酸脱氢酶复合物的厌氧性活性(金等人，应用与环境微生物学73：1766-1771(2007)；金等人，细菌学杂志190：3851-3858(2008)；周等人，生物技术通讯30：335-342(2008))。例如，NADH的抑制效应可通过改造E3组分中的H322Y突变来克服(金等人，细菌学杂志190：3851-3858(2008))。对个别组分的结构研究和其如何在复合物中一起作用有助于深刻理解此家族中的酶的催化机制和架构(沙瓦臣等人，自然结构生物学6：785-792(1999)；周等人，美国国家科学院院刊98：14802-14807(2001))。脱氢酶复合物的底物特异性在不同生物体中有所不同，但支链酮酸脱氢酶通常具有最广泛的底物范围。

α-酮戊二酸脱氢酶(AKGD)将α-酮戊二酸酯转变为琥珀酰基-CoA且是经过TCA循环的代谢通量的主要控制位点(汉斯福德，R.G.，生物能学当前课题10：217-278(1980))。由大肠杆菌中的基因sucA、sucB和lpd编码的AKGD基因表达在厌氧性条件下且在葡萄糖上生长期间下调(帕克等人，分子微生物学15：473-482(1995))。尽管AKGD的底物范围较窄，但对E2组分的催化核心的结构研究准确找到负责底物特异性的特定残基(纳普等人，分子生物学杂志280：655-668(1998))。由odhAB(E1和E2)和pdhD(E3，共有结构域)编码的枯草芽孢杆菌AKGD是在转录水平上调节，并且依赖于碳源和生物体的生长阶段(瑞斯尼可夫等人，分子和普通遗传学234：285-296(1992))。在酵母菌中，编码E3组分的LPD1基因是在转录水平上由葡萄糖调节(罗伊和道斯，普通微生物学杂志133：925-933(1987))。由KGD1编码的E1组分也是由葡萄糖调节且由HAP2与HAP3的产物活化(雷佩托和扎果洛夫，分子细胞生物学9：2695-2705(1989))。已在哺乳动物系统中对受产物NADH和琥珀酰基-CoA抑制的AKGD酶复合物进行充分研究，这是因为受损功能已与若干神经疾病关联(特雷特和丹-维齐，伦敦皇家学会哲学汇刊，B辑：生物科学360：2335-2345(2005))。

支链2-酮酸脱氢酶复合物(BCKAD)，还称作2-氧代异戊酸脱氢酶，参与支链氨基酸降解途径，将缬氨酸、亮氨酸和异亮氨酸的2-酮酸衍生物转变为其酰基-CoA衍生物和CO₂。已在许多生物体中研究所述复合物，所述生物体包括枯草芽孢杆菌(王等人，欧洲生物化学杂志213：1091-1099(1993))、褐鼠(难波等人，生物化学杂志244：4437-4447(1969))和恋臭假单胞菌(索加兹，细菌学杂志148：647-652(1981))。在枯草芽孢杆菌中，所述酶是由基因pdhD(E3组分)、bfmBB(E2组分)、bfmBAA和bfmBAB(E1组分)编码(王等人，欧洲生物化学杂志213：1091-1099(1993))。在哺乳动物中，所述复合物是通过特定磷酸酶和蛋白质激酶磷酸化来调节。已在大鼠肝细胞中研究所述复合物(基科等人，生物化学杂志269：19427-19434(1994))且其是由基因Bckdha(E1α)、Bckdhb(E1β)、Dbt(E2)和Dld(E3)编码。已使恋臭假单胞菌BCKAD复合物的E1和E3组分结晶(沙瓦臣等人，自然结构生物学6：785-792(1999)；迈特威，科学255：1544-1550(1992))且已对酶复合物进行研究(索加兹等人，细菌学杂志148：647-652(1981))。恋臭假单胞菌BCKAD基因的转录是由bkdR的基因产物活化(赫丝特等人，欧洲生物化学杂志233：828-836(1995))。在包括褐鼠(帕克斯顿等人，生物化学杂志234：295-303(1986))和啤酒酵母菌(辛克莱等人，国际生物化学与分子生物学31：911-922(1993))在内的一些生物体中，已显示，此复合物具有宽底物范围，所述范围除包括支链氨基酸前体以外，还包括诸如2-氧代丁酸酯和α-酮戊二酸酯等直链氧代酸。牛BCKAD的活性位点经改造以偏好替代底物乙酰基-CoA(孟和庄，生物化学33：12879-12885(1994))。

还已深入研究催化丙酮酸酯转变为乙酰基-CoA的丙酮酸脱氢酶复合物。在大肠杆菌酶中，E1组分中的特定残基负责底物特异性(比斯瓦根，H.生物化学杂志，256：815-822(1981)；布雷默，J.，欧洲生物化学杂志8：535-540(1969)；贡等人，生物化学杂志275：13645-13653(2000))。如先前所述，酶改造努力已改良厌氧性条件下的大肠杆菌PDH酶活性(金等人，应用与环境微生物学73：1766-1771(2007)；金，细菌学杂志190：3851-3858(2008)；周等人，生物技术通讯30：335-342(2008))。与大肠杆菌PDH不同，枯草芽胞杆菌复合物在厌氧性条件下具有活性且是生长所需(中野，细菌学杂志179：6749-6755(1997))。在甘油上生长期间表征的肺炎克雷伯氏菌PDH在厌氧性条件下也具有活性(门泽尔等人，生物技术杂志56：135-142(1997))。可获得来自牛肾的酶复合物(周等人，美国国家科学院院刊98：14802-14807(2001))和来自棕色固氮菌(Azotobacter vinelandii)的E2催化结构域(迈特威等人，科学255：1544-1550(1992))的晶体结构。一些哺乳动物PDH酶复合物可对诸如2-氧代丁酸酯等替代底物起反应，但褐鼠PDH和BCKAD的比较动力学指示，BCKAD对作为底物的2-氧代丁酸酯具有更高活性(帕克斯顿等人，生物化学杂志234：295-303(1986))。

作为上述大的多酶2-酮酸脱氢酶复合物的替代，一些厌氧性生物体利用2-酮酸氧化还原酶家族(OFOR)中的酶来催化2-酮酸的酰化氧化脱羧。与脱氢酶复合物不同，所述酶含有铁-硫簇，利用不同辅因子，并且使用铁氧化还原蛋白或黄素氧化还原蛋白作为电子受体替代NAD(P)H。尽管此家族中的多数酶特异性对丙酮酸酯作为底物(POR)，但已显示，一些2-酮酸：铁氧化还原蛋白氧化还原酶接受众多种2-酮酸作为底物，包括α-酮戊二酸酯和2-氧代丁酸酯(福田和若木，生物化学与生物物理学报1597：74-80(2002)；张等人，生物化学杂志120：587-599(1996))。一种此类酶是来自嗜热嗜酸古细菌托克达硫化叶菌7的OFOR，其含有由基因ST2300编码的α和β亚单元(福田和若木，生物化学与生物物理学报1597：74-80(2002)；张等人，生物化学杂志120：587-599(1996))。已研发基于质粒的表达系统用于在大肠杆菌中有效表达此蛋白质(福田等人，欧洲生物化学杂志268：5639-5646(2001))并测定参与底物特异性的残基(福田和若木，生物化学与生物物理学报1597：74-80(2002))。最近还已将两种来自敏捷气热菌菌株K1的OFOR克隆到大肠杆菌中，进行表征，且发现其与众多种2-氧代酸反应(西泽等人，欧洲生物化学学会联合会快报579：2319-2322(2005))。可获得这些OFOR候选物的基因序列，但迄今尚未对其指配基因库标识符。有生物信息学证据表明，在所有古细菌、一些厌氧性细菌和线粒体真核生物中存在相似酶(福田和若木，生物化学与生物物理学报1597：74-80(2005))。此类酶从能量角度还引人关注，这是因为可使用经还原铁氧化还原蛋白通过铁氧化还原蛋白-NAD还原酶生成NADH(珀蒂德芒热等人，生物化学与生物物理学报421：334-337(1976))。此外，由于多数酶经设计以在厌氧性条件下作用，因此对于厌氧性环境中的活性来说，可能相对于2-酮酸脱氢酶复合物家族中的酶需要更少酶改造。

1.2.1.d氧化还原酶(膦酸盐还原酶)。

4-羟基丁酰基-磷酸酯转变为4-羟基丁醛可通过EC类别1.2.1中的氧化还原酶催化。天冬氨酸半醛脱氢酶(ASD，EC 1.2.1.11)催化4-天冬氨酰基磷酸酯到天冬氨酸酯-4-半醛的依赖NADPH的还原。ASD参与氨基酸生物合成且最近已作为抗微生物靶进行研究(哈德菲尔德(Hadfield)等人，生物化学40：14475-14483(2001)。已对大肠杆菌ASD结构进行解析(哈德菲尔德等人，分子生物学杂志289：991-1002(1999))且已显示，所述酶接受替代底物β-3-甲基天冬氨酰基磷酸酯(沙梅斯(Shames)等人，生物化学杂志259：15331-15339(1984))。流感嗜血杆菌酶已成为改变活性位点的底物结合亲和力的酶改造研究的主题(布兰科等人，结晶学报，D辑：生物结晶学60：1388-1395(2004)；布兰科等人，结晶学报，D辑：生物结晶学60：1808-1815(2004))。其它ASD候选物发现于结核分枝杆菌(莎菲雅尼(Shafiani)等人，应用微生物学杂志(J.Appl.Microbiol.)98：832-838(2005)、詹氏甲烷球菌(Methanococcus jannaschii)(法恩勒(Faehnle)等人，分子生物学杂志353：1055-1068(2005))和传染性微生物霍乱弧菌和幽门螺旋杆菌(摩尔(Moore)等人，蛋白质的表达和纯化25：189-194(2002))中。相关酶候选物是在啤酒酵母菌(保韦尔斯(Pauwels)等人，欧洲生物化学杂志270：1014-1024(2003)、枯草芽胞杆菌(奥赖利(O′Reilly)和迪瓦恩(Devine)，微生物学(Microbiology)140(Pt 5)：1023-1025(1994))和其它生物体中发现的乙酰基谷氨酰基磷酸酯还原酶(EC 1.2.1.38)，所述酶将乙酰基谷氨酰基磷酸酯天然还原成乙酰基谷氨酸酯-5-半醛。

基因	登录号	GI号	生物体
				asd	NP_417891.1	16131307	大肠杆菌
asd	YP_248335.1	68249223	流感嗜血杆菌
				asd	AAB49996	1899206	结核分枝杆菌
VC2036	NP_231670	15642038	霍乱弧菌
				asd	YP_002301787.1	210135348	幽门螺旋杆菌
ARG5，6	NP_010992.1	6320913	啤酒酵母菌
				argC	NP_389001.1	16078184	枯草芽胞杆菌

这个类别中发现的其它实例性酶包括将甘油醛-3-磷酸酯转变为D-甘油酸酯1，3-双磷酸酯的甘油醛3-磷酸酯脱氢酶(例如，大肠杆菌gapA(布朗朗和布朗朗，欧洲生物化学杂志150：61-66(1985))、将N-乙酰基-L-谷氨酸酯-5-半醛转变为N-乙酰基-L-谷氨酰基-5-磷酸酯的N-乙酰基-γ-谷氨酰基-磷酸酯还原酶(例如，大肠杆菌argC(帕尔索等人，基因68：275-283(1988))和将L-谷氨酸酯-5-半醛转变为L-谷氨酰基-5-磷酸酯的谷氨酸酯-5-半醛脱氢酶(例如，大肠杆菌proA(史密斯等人，细菌学杂志157：545-551(1984))。在大肠杆菌中克隆并表达编码来自鼠伤寒沙门氏菌(马汉(Mahan)和琼卡(Csonka)，细菌学杂志156：1249-1262(1983))和空肠曲杆菌(路易(Louie)和陈(Chan)，分子和普通遗传学240：29-35(1993))的谷氨酸酯-5-半醛脱氢酶的基因。

1.2.1.e酸还原酶.

图58、62和63中的若干步骤绘示由酸还原酶将未经活化的酸转变为醛。所述分别包括4-羟基丁酸酯、琥珀酸酯、α-酮戊二酸酯和4-氨基丁酸酯转变为4-羟基丁醛琥珀酸半醛、2，5-二氧代戊酸酯和4-氨基丁醛。一种显着的羧酸还原酶可在伊文思奴卡菌中发现，其催化羧酸到其对应醛的依赖镁、ATP和NADPH的还原(文卡塔萨布拉曼尼亚等人，生物化学杂志282：478-485(2007))。这种酶是由car基因编码且使其在大肠杆菌中克隆并进行菜单达(文卡塔萨布拉曼尼亚等人，生物化学杂志282：478-485(2007))。npt基因产物的表达经由转录后修饰改良酶的活性。npt基因编码将无活性脱辅基酶转变为活性全酶的特异性磷酸泛酰巯基乙胺转移酶(PPTase)。这种酶的天然底物是香草酸，并且所述酶展现对芳香族和脂肪族底物的广泛接受性(文卡塔萨布拉曼尼亚等人，制药与生物技术产业中的生物催化，R.N.帕特尔编辑，第15章，第425-440页，化学橡胶公司出版社LLC，博卡拉顿，佛罗里达州(2006))。

基因	登录号	GI号	生物体
				car	AAR91681.1	40796035	伊文思奴卡菌(NRRL 5646种)
npt	ABI83656.1	114848891	伊文思奴卡菌(NRRL 5646种)

可基于序列同源性鉴别其它car和npt基因。

基因	登录号	GI号	生物体
				fadD9	YP_978699.1	121638475	牛分枝杆菌BCG
BCG_2812c	YP_978898.1	121638674	牛分枝杆菌BCG
				nfa20150	YP_118225.1	54023983	皮疽奴卡菌IFM 10152
nfa40540	YP_120266.1	54026024	皮疽奴卡菌IFM 10152
				SGR_6790	YP_001828302.1	182440583	灰色链霉菌灰色亚种NBRC 13350
SGR_665	YP_001822177.1	182434458	灰色链霉菌灰色亚种NBRC 13350

在灰色链霉菌发现的另一酶候选物是由griC和griD基因编码。相信这种酶将3-氨基-4-羟基苯甲酸转变为3-氨基-4-羟基苯甲酸代谢的分路产物3-氨基-4-羟基苯甲醛，这是因为缺失griC或griD导致细胞外3-乙酰基氨基-4-羟基苯甲酸累积(铃木等人，抗生素杂志60(6)：380-387(2007))。griC和griD与SGR_665(序列与伊文思奴卡菌npt相似的酶)共表达可能有益。

具有相似特性的酶α-氨基己二酸酯还原酶(AAR，EC 1.2.1.31)参与一些真菌物种中的赖氨酸生物合成途径。这种酶天然将α-氨基己二酸酯还原成α-氨基己二酸酯半醛。羧基首先经由腺苷酸酯的依赖ATP的形成来活化，其随后由NAD(P)H还原，生成醛和AMP。与CAR一样，这种酶利用镁且需要由PPTase活化。在啤酒酵母菌(莫里斯等人，基因98：141-145(1991))、白色假丝酵母菌(郭等人，分子遗传学与基因组学269：271-279(2003))和粟酒裂殖酵母菌(福特等人，当代遗传学28：131-137(1995))中发现AAR的酶候选物和其对应PPTase。在大肠杆菌中表达时，来自粟酒裂殖酵母菌的AAR展现显着活性(郭等人，酵母菌21：1279-1288(2004))。来自产黄青霉的AAR接受S-羧基甲基-L-半胱氨酸作为替代底物，但不与己二酸酯、L-谷氨酸酯或二氨基庚二酸酯反应(伊哈鲁维亚等人，生物化学杂志278：8250-8256(2003))。迄今尚未鉴别编码产黄青霉PPTase的基因。

基因	登录号	GI号	生物体
				LYS2	AAA34747.1	171867	啤酒酵母菌
LYS5	P50113.1	1708896	啤酒酵母菌
				LYS2	AAC02241.1	2853226	白色假丝酵母菌
LYS5	AAO26020.1	28136195	白色假丝酵母菌
				Lys1p	P40976.3	13124791	粟酒裂殖酵母菌
Lys7p	Q10474.1	1723561	粟酒裂殖酵母菌
				Lys2	CAA74300.1	3282044	产黄青霉

1.4.1.a氧化还原酶(氨化)。

谷氨酸脱氢酶(步骤J，图62和63)、4-氨基丁酸脱氢酶(步骤M，图62和63)、腐胺脱氢酶(步骤D，图63)、5-氨基-2-氧代戊酸脱氢酶(步骤P，图63)和鸟氨酸脱氢酶(步骤S，图63)可由氨化氧化还原酶催化。此EC类别中的酶以NAD+或NADP+作为受体催化氧化α-氨基酸的脱氨，并且反应通常可逆。作用于氨基酸的实例性氧化还原酶包括由gdhA编码的谷氨酸脱氢酶(脱氨)、由ldh编码的亮氨酸脱氢酶(脱氨)和由nadX编码的天冬氨酸酯脱氢酶(脱氨)。来自大肠杆菌的gdhA基因产物(科尔贝等人，分子生物学杂志234：1270-1273(1993)；麦克弗森和伍顿，核酸研究11：5257-5266(1983))、来自海栖热袍菌的gdh(科特等人，极端微生物1：52-60(1997)；莱宾克等人，分子生物学杂志280：287-296(1998)；莱宾克等人，分子生物学杂志289：357-369(1999))和来自嗜盐杆菌的gdhA1(英戈尔兹比等人，基因349：237-244(2005))催化谷氨酸酯到2-氧代戊二酸酯和氨的可逆互变，同时分别偏好NADP(H)、NAD(H)或二者。仙人掌芽孢杆菌的ldh基因编码具有宽范围底物的LeuDH蛋白质，所述底物包括亮氨酸、异亮氨酸、缬氨酸和2-氨基丁酸酯(安索奇和库拉，生物技术与生物工程68：557-562(2000)；斯托扬等人，生物技术杂志54：77-80(1997))。来自海栖热袍菌的编码天冬氨酸酯脱氢酶的nadX基因参与NAD的生物合成(杨等人，生物化学杂志278：8804-8808(2003))。

基因	登录号	GI号	生物体
				gdhA	P00370	118547	大肠杆菌
gdh	P96110.4	6226595	海栖热袍菌
				gdhA1	NP_279651.1	15789827	嗜盐杆菌
ldh	P0A393	61222614	仙人掌芽胞杆菌
				nadX	NP_229443.1	15644391	海栖热袍菌

其它谷氨酸脱氢酶基因候选物发现于枯草芽胞杆菌(卡恩(Khan)等人，生物科学、生物技术与生物化学69：1861-1870(2005))、烟草(珀内尔(Purnell)等人，植物(Planta)222：167-180(2005))、水稻(我孙子(Abiko)等人，植物与细胞生理学(PlantCellPhysiol.)46：1724-1734(2005))、地中海极嗜酯菌(迪亚兹(Diaz)等人，极端微生物10：105-115(2006))和嗜盐杆菌(海登(Hayden)等人，欧洲微生物学会联合会微生物学快报211：37-41(2002))中。烟草酶是由gdh1和gdh2编码的α和β亚单元构成(珀内尔等人，植物222：167-180(2005))。发现，依赖NADH的谷氨酸脱氢酶的过表达改良啤酒酵母菌的经改造菌株中的乙醇产生(罗卡(Roca)等人，应用与环境微生物学69：4732-4736(2003))。

用于催化醛转变为其相应伯胺的实例性酶是由lysDH基因编码的赖氨酸6-脱氢酶(EC 1.4.1.18)。由lysDH基因编码的赖氨酸6-脱氢酶(脱氨)催化L-赖氨酸的ε-氨基的氧化脱氨基以形成2-氨基己二酸酯-6-半醛，所述半醛进而以非酶促方式环化以形成Δ1-哌啶-6-羧酸酯(御园和长崎，细菌学杂志150：398-401(1982))。来自嗜热脂肪地芽孢杆菌的lysDH基因编码依赖NAD的嗜热性赖氨酸6-脱氢酶(埃达里等人，应用与环境微生物学70：937-942(2004))。经由来自基因组计划的同源性鉴别来自敏捷气热菌K1的lysDH基因。可在根癌土壤杆菌(桥本(Hashimoto)等人，生物化学杂志106：76-80(1989)；御园和长崎，细菌学杂志150：398-401(1982))和反硝化无色杆菌(鲁迪库萨隆(Ruldeekulthamrong)等人，BMB报告(BMB.Rep.)41：790-795(2008))中发现其它酶。

基因	登录号	GI号	生物体
				lysDH	BAB39707	13429872	嗜热脂肪地芽孢杆菌
lysDH	NP_147035.1	14602185	敏捷气热菌K1
				lysDH	NP_353966	15888285	根癌土壤杆菌
lysDH	AAZ94428	74026644	反硝化无色杆菌

将3-氧代酸转变为3-氨基酸的酶是3，5-二氨基己酸酯脱氢酶(EC 1.4.1.11)，所述酶在使赖氨酸发酵的生物体中发现。最近在具核梭杆菌中鉴别出编码这种酶的基因kdd(克赖迈尔(Kreimeyer)等人，生物化学杂志282：7191-7197(2007))。所述酶已在其它生物体中进行纯化并表征(贝克尔(Baker)等人，生物化学杂志247：7724-7734(1972)；贝克尔和范德瑞夫特(van der Drift)，生物化学13：292-299(1974))，但不了解与所述酶相关的基因。黄色粘球菌、牙龈卟啉单胞菌W83和其它经定序生物体中的候选物可通过序列同源性推测。

基因	登录号	GI号	生物体
				kdd	AAL93966.1	19713113	具核梭杆菌
mxan_4391	ABF87267.1	108462082	黄色粘球菌
				pg_1069	AAQ66183.1	34397119	牙龈卟啉单胞菌

2.3.1.a酰基转移酶(转移磷酸酯基到CoA).

图62的步骤P绘示4-羟基丁酰基-CoA到4-羟基丁酰基-Pi的转化。实例性磷酸酯转移性酰基转移酶包括由pta编码的磷酸转乙酰基酶和由ptb编码的磷酸转丁酰基酶。来自大肠杆菌的pta基因编码可将乙酰基-CoA转变为乙酰基-磷酸酯的酶，并且反之亦然(铃木，生物化学与生物物理学报191：559-569(1969))。这种酶还可利用丙酰基-CoA代替乙酰基-CoA在此工艺中形成丙酸酯(赫斯林格尔等人，分子微生物学27：477-492(1998))。相似地，来自丙酮丁醇梭菌的ptb基因编码可将丁酰基-CoA转变为丁酰基-磷酸酯的酶(沃尔特等人，基因134：107-111(1993))；黄等人，分子微生物学与生物技术杂志2：33-38(2000)。其它ptb基因可在丁酸产生菌L2-50(刘易斯等人，细菌学杂志186：2099-2106(2004))和巨大芽孢杆菌(巴斯克斯等人，当代微生物学42：345-349(2001))中发现。

2.6.1.氨基转移酶.

氨基转移酶将醛或酮可逆地转变为氨基。常见氨基供体/受体组合包括谷氨酸酯/α-酮戊二酸酯、丙氨酸/丙酮酸酯和天冬氨酸酯/草酰乙酸酯。已显示，若干酶将醛转变为伯胺，并且反之亦然，例如4-氨基丁酸酯、腐胺和5-氨基-2-氧代戊酸酯。所述酶尤其非常适于进行以下转化：图62和63中的步骤N，图63中的步骤E和Q。赖氨酸-6-氨基转移酶(EC2.6.1.36)是一种能够形成伯胺的实例性酶。已在酵母菌和细菌中证实这种酶将赖氨酸转变为α-氨基己二酸酯半醛的功能。已对来自高蛋白假丝酵母菌(Candida utilis)(哈默(Hammer)和博德(Bode)，基础微生物学杂志(J.Basic Microbiol.)32：21-27(1992))、泥色黄杆菌(Flavobacterium lutescens)(藤井等人，生物化学杂志128：391-397(2000))和棒状链霉菌(罗梅罗(Romero)等人，工业微生物学与生物技术杂志(J.Ind.Microbiol.Biotechnol.)18：241-246(1997))的候选物进行表征。使来自棒状链霉菌的重组赖氨酸-6-氨基转移酶在大肠杆菌中进行菜单达(托宾(Tobin)等人，细菌学杂志173：6223-6229(1991))。泥色黄杆菌酶对作为氨基受体的α-酮戊二酸酯具有特异性(索达(Soda)和御园，生物化学7：4110-4119(1968))。将醛转变为末端胺的其它酶包括鲍氏不动杆菌中编码2，4-二氨基丁酸酯：2-酮戊二酸酯4-转氨酶的dat基因产物(井贝(Ikai)和山本(Yamamoto)，细菌学杂志179：5118-5125(1997))。除其天然底物外，2，4-二氨基丁酸酯(DAT)还促进赖氨酸、4-氨基丁酸酯和鸟氨酸的末端胺的转氨。

基因	登录号	GI号	生物体
				lat	BAB13756.1	10336502	泥色黄杆菌
lat	AAA26777.1	153343	棒状链霉菌
				dat	P56744.1	6685373	鲍氏不动杆菌

醛转变为末端胺还可通过γ-氨基丁酸转氨酶(GABA转氨酶或4-氨基丁酸转氨酶)催化。这种酶使琥珀酸半醛和谷氨酸酯天然互变成4-氨基丁酸酯和α-酮戊二酸酯且已知其具有宽底物范围(刘等人，生物化学43：10896-109052004)；舒尔茨等人，应用与环境微生物学56：1-6(1990))。大肠杆菌中的两种GABA转氨酶是由gabT(巴奇(Bartsch)等人，细菌学杂志172：7035-7042(1990))和puuE(果原等人，生物化学杂志280：4602-4608.(2005))编码。已显示，家鼷鼠、荧光假单胞菌和野猪中的GABA转氨酶与一系列替代底物(包括6-氨基己酸)反应(库珀，酶学方法113：80-82(1985)；斯科特(Scott)和雅各布比(Jakoby)，生物化学杂志234：932-936(1959))。

基因	登录号	GI号	生物体
				gabT	NP_417148.1	16130576	大肠杆菌
puuE	NP_415818.1	16129263	大肠杆菌
				abat	NP_766549.2	37202121	家鼷鼠
gabT	YP_257332.1	70733692	荧光假单胞菌
				abat	NP_999428.1	47523600	野猪

用于使醛和伯胺互变的其它酶候选物是腐胺转氨酶或其它二胺氨基转移酶。大肠杆菌腐胺氨基转移酶是由ygjG基因编码，并且经纯化酶还能够促进尸胺和精脒转氨(参孙(Samsonova)等人，BMC微生物学(BMC Microbiol.)3：2(2003))。另外，这种酶对1，7-二氨基庚烷和对除2-氧代戊二酸酯以外的氨基受体(例如，丙酮酸酯、2-氧代丁酸酯)的活性已有报道(金，生物化学杂志239：783-786(1964)；参孙等人，BMC微生物学3：2(2003))。对作为氨基受体的丙酮酸酯的活性高于对α-酮戊二酸酯的活性的腐胺氨基转移酶是绣色假单胞菌的spuC基因(鲁(Lu)等人，细菌学杂志184：3765-3773(2002))。

基因	登录号	GI号	生物体
				ygjG	NP_417544	145698310	大肠杆菌
spuC	AAG03688	9946143	绣色假单胞菌

促进3-氧代酸转氨的酶包括GABA氨基转移酶(如上文所述)、β-丙氨酸/α-酮戊二酸酯氨基转移酶和3-氨基-2-甲基丙酸酯氨基转移酶。β-丙氨酸/α-酮戊二酸酯氨基转移酶(WO08027742)与β-丙氨酸反应，形成丙二酸半醛3-氧代酸。据显示，克氏酵母菌中的SkPYD4的基因产物优先使用β-丙氨酸作为氨基供体(安德森和汉森，基因124：105-109(1993))。SkUGA1编码啤酒酵母菌GABA氨基转移酶UGA1的同源物(拉莫斯等人，欧洲生物化学杂志149：401-404(1985))，而SkPYD4编码参与β-丙氨酸与GABA转氨二者的酶(安德森和汉森，基因124：105-109(1993))。3-氨基-2-甲基丙酸酯转氨酶催化从甲基丙二酸酯半醛到3-氨基-2-甲基丙酸酯的转化。所述酶已在褐鼠和野猪中进行表征且是由Abat编码(柿本等人，生物化学与生物物理学报156：374-380(1968)；玉木等人，酶学方法324：376-389(2000))。

基因	登录号	GI号	生物体
				SkyPYD4	ABF58893.1	98626772	克氏酵母菌
SkUGA1	ABF58894.1	98626792	克氏酵母菌
				UGA1	NP_011533.1	6321456	啤酒酵母菌
Abat	P50554.3	122065191	褐鼠
				Abat	P80147.2	120968	野猪

若干氨基转移酶促进氨基酸的氨基转氨以形成2-氧代酸。天冬氨酸酯氨基转移酶是将氧代基从草酰乙酸酯天然转移到谷氨酸酯从而形成α-酮戊二酸酯和天冬氨酸酯的酶。天冬氨酸酯在结构上与OHED和2-AHD相似。天冬氨酸酯氨基转移酶活性是由(例如)以下基因的基因产物催化：来自大肠杆菌的aspC的基因产物(八木等人，欧洲生物化学学会联合会快报100：81-84(1979)；八木等人，酶学方法113：83-89(1985))、来自啤酒酵母菌的AAT2(八木等人，生物化学杂志92：35-43(1982))和来自拟南芥的ASP5(德拉托雷(dela Torre)等人，植物学杂志46：414-425(2006)；郭和汉森，实验植物学杂志55：595-604(2004)；威尔基和华伦，蛋白质的表达和纯化12：381-389(1998))。已显示，来自褐鼠的酶促进诸如2-氨基己烷二元酸和2，4-二氨基丁酸等替代底物转氨(雷加森斯(Recasens)等人，生物化学19：4583-4589(1980))。作用于其它氨基酸底物的氨基转移酶还能够催化此转化。缬氨酸氨基转移酶催化缬氨酸和丙酮酸酯转变为2-酮异戊酸酯和丙氨酸。大肠杆菌基因avtA编码一种此类酶(惠伦和博格，细菌学杂志150：739-746(1982))。此基因产物还催化α-酮丁酸酯的转氨以生成α-氨基丁酸酯，但尚未鉴别出此反应中的氨供体(惠伦和博格，细菌学杂志158：571-5741984))。大肠杆菌serC的基因产物催化两种反应，即磷酸丝氨酸氨基转移酶和磷酸羟基苏氨酸氨基转移酶(拉姆和温克勒，细菌学杂志172：6518-6528(1990))，并且不能检测到对非磷酸化底物的活性(德瑞克等人，欧洲生物化学学会联合会快报390：179-182(1996))。

基因	登录号	GI号	生物体
				aspC	NP_415448.1	16128895	大肠杆菌
AAT2	P23542.3	1703040	啤酒酵母菌
				ASP5	P46248.2	20532373	拟南芥
Got2	P00507	112987	褐鼠
				avtA	YP_026231.1	49176374	大肠杆菌
serC	NP_415427.1	16128874	大肠杆菌

另一酶候选物是α-氨基己二酸酯氨基转移酶(EC 2.6.1.39)，所述酶参与一些生物体中的赖氨酸生物合成和降解。这种酶使用α-酮戊二酸酯作为氨基受体使2-氨基己二酸酯和2-氧代己二酸酯互变。在智人(奥野(Okuno)等人，酶与蛋白质(Enzyme Protein)47：136-148(1993))和嗜热栖热菌(宫崎(Miyazaki)等人，微生物学150：2327-2334(2004))中发现基因候选物。由lysN编码的嗜热栖热菌酶对若干替代底物(包括草酰乙酸酯、2-氧代异己酸酯、2-氧代异戊酸酯和2-氧代-3-甲基戊酸酯)具有活性。

基因	登录号	GI号	生物体
				lysN	BAC76939.1	31096548	嗜热栖热菌
AadAT-II	Q8N5Z0.2	46395904	智人

2.7.2.a磷酸转移酶(羧基受体).

EC类别2.7.2中的磷酸转移酶将羧酸转化成膦酸，同时水解一个ATP。图62的步骤O涉及通过所述酶将4-羟基丁酸酯转变为4-羟基丁酰基-磷酸酯。丁酸激酶(EC 2.7.2.7)在丙酮丁醇梭菌产酸期间进行丁酰基-磷酸酯到丁酸酯的可逆转变(凯利等人，应用与环境微生物学56：1576-1583(1990))。这种酶是由两种buk基因产物中的任一者编码(黄等人，分子微生物学与生物技术杂志2：33-38(2000))。在丁酸梭菌(C.butyricum)和假破伤风梭菌中发现其它丁酸激酶(特沃罗格(Twarog)和乌尔夫，细菌学杂志86：112-117(1963))。还已在大肠杆菌中表达来自海栖热袍菌的相关酶异丁酸激酶并进行结晶(刁(Diao)等人，结晶学报，D辑：生物结晶学59：1100-1102(2003)；刁和哈森，细菌学杂志191：2521-2529(2009))。天冬氨酸激酶催化天冬氨酸酯的依赖ATP的磷酸化且参与若干氨基酸的合成。大肠杆菌中由lysC编码的天冬氨酸激酶III酶具有宽底物范围，并且已阐明参与底物特异性的催化残基(庚(Keng)和维奥拉，生物化学与生物物理学文献335：73-81(1996))。大肠杆菌中的两种其它激酶也是良好候选物：乙酸酯激酶和γ-谷氨酰基激酶。由ackA编码的大肠杆菌乙酸酯激酶(斯卡尔斯泰特和希尔弗斯坦，生物化学杂志251：6775-6783(1976))除将乙酸酯磷酸化外还将丙酸酯磷酸化(赫斯林格尔等人，分子微生物学27：477-492(1998))。由proB编码的大肠杆菌γ-谷氨酰基激酶(史密斯等人，细菌学杂志157：545-551(1984))将谷氨酸酯的γ碳酸基磷酸化。

基因	登录号	GI号	生物体
				buk1	NP_349675	15896326	丙酮丁醇梭菌
buk2	Q97II1	20137415	丙酮丁醇梭菌
				buk2	Q9X278.1	6685256	海栖热袍菌
lysC	NP_418448.1	16131850	大肠杆菌
				ackA	NP_416799.1	16130231	大肠杆菌
proB	NP_414777.1	16128228	大肠杆菌

乙酰基谷氨酸酯激酶在精氨酸生物合成期间将乙酰基化谷氨酸酯磷酸化。已知这种酶不接受替代底物；然而，已通过定点诱变阐明参与底物结合和磷酸化的大肠杆菌酶的若干残基(马可-马林(Marco-Marin)等人，分子生物学杂志334：459-476(2003)；雷蒙-迈克斯(Ramon-Maiques)等人，结构(Structure)10：329-342(2002))。所述酶是由枯草芽孢杆菌和大肠杆菌中的argB(帕尔索等人，基因68：275-283(1988))和啤酒酵母菌中的ARG5，6(保韦尔斯等人，欧洲生物化学杂志270：1014-1024(2003))编码。啤酒酵母菌的ARG5，6基因编码聚蛋白质前体，所述前体在线粒体基质中成熟而成为乙酰基谷氨酸酯激酶和乙酰基谷氨酰基磷酸酯还原酶。

基因	登录号	GI号	生物体
				argB	NP_418394.3	145698337	大肠杆菌
argB	NP_389003.1	16078186	枯草芽胞杆菌
				ARG5，6	NP_010992.1	6320913	啤酒酵母菌

2.8.3.a CoA转移酶.

已显示，克氏羧菌的cat1、cat2和cat3的基因产物分别展现琥珀酰基-CoA(步骤G，图62和63)、4-羟基丁酰基-CoA(步骤T，图62)和丁酰基-CoA乙酰基转移酶活性(泽多夫等人，美国国家科学院院刊105：2128-2133(2008)；淑玲和戈特沙尔克，细菌学杂志178：871-880(1996))。相似CoA转移酶活性还存在于阴道滴虫(范格林斯文(van Grinsven)等人，生物化学杂志283：1411-1418(2008))和布鲁氏锥虫(里维埃(Riviere)等人，生物化学杂志279：45337-45346(2004))中。

基因	登录号	GI号	生物体
				cat1	P38946.1	729048	克氏羧菌
cat2	P38942.2	1705614	克氏羧菌
				cat3	EDK35586.1	146349050	克氏羧菌
TVAG_395550	XP_001330176	123975034	阴道滴虫G3
				Tb11.02.0290	XP_828352	71754875	布鲁氏锥虫

可用于此类型转化的酶是酰基-CoA：乙酸酯-CoA转移酶，还称作乙酸酯-CoA转移酶(EC 2.8.3.8)，已显示，其将CoA部分从多种具支链和直链酰基-CoA底物转移到乙酸酯，所述底物包括异丁酸酯(马蒂斯和申克，应用与环境微生物学58：1435-1439(1992))、戊酸酯(范德温克尔等人，生物化学与生物物理学研究通讯33：902-908(1968))和丁酸酯(范德温克尔，见上文(1968))。这种酶是由大肠杆菌K12中的atoA(α次单元)和atoD(β次单元)编码(科罗廖夫等人，结晶学报，D辑：生物结晶学58：2116-2121(2002)；范德温克尔，见上文(1968))。相似酶存在于谷氨酸棒杆菌ATCC 13032(邓肯等人，应用与环境微生物学68：5186-5190(2002))、丙酮丁醇梭菌(凯利等人，应用与环境微生物学56：1576-1583(1990)；魏森博恩等人，应用与环境微生物学55：323-329(1989))和糖乙酸多丁醇梭菌(小坂等人，生物科学、生物技术与生物化学71：58-68(2007))中。

基因	登录号	GI号	生物体
				atoA	P76459.1	2492994	大肠杆菌K12
atoD	P76458.1	2492990	大肠杆菌K12
				actA	YP_226809.1	62391407	谷氨酸棒杆菌
cg0592	YP_224801.1	62389399	谷氨酸棒杆菌
				ctfA	NP_149326.1	15004866	丙酮丁醇梭菌
ctfB	NP_149327.1	15004867	丙酮丁醇梭菌
				ctfA	AAP42564.1	31075384	糖乙酸多丁醇梭菌
ctfB	AAP42565.1	31075385	糖乙酸多丁醇梭菌

来自厌氧性细菌发酵氨基酸球菌的戊烯二酸酯-CoA-转移酶(EC 2.8.3.12)与二酸戊烯二酰基-CoA和3-丁烯酰基-CoA反应(麦克和比凯尔，欧洲生物化学学会联合会快报405：209-212(1997))。编码这种酶的基因是gctA和gctB。这种酶对其它CoA衍生物具有降低但可检测的活性，其它CoA衍生物包括戊二酰基-CoA、2-羟基戊二酰基-CoA、己二酰基-CoA和丙烯酰基-CoA(比凯尔等人，欧洲生物化学杂志118：315-321(1981))。已在大肠杆菌中克隆并表达所述酶(麦克等人，欧洲生物化学杂志226：41-51(1994))。

3.1.2.a CoA水解酶.

3.1.2家族中的酶将酰基-CoA分子水解成其对应酸。然而，如果偶合到诸如质子泵或直接ATP水解等能量来源，那么所述酶可经遗传修饰以赋予CoA-连接酶或合成酶功能。若干真核乙酰基-CoA水解酶(EC 3.1.2.1)具有广泛底物特异性。例如，来自褐鼠脑的酶(鲁滨逊等人，生物化学与生物物理学研究通讯71：959-965(1976))可与丁酰基-CoA、己酰基-CoA和丙二酰基-CoA反应。尽管来自豌豆叶的线粒体的酶的序列尚未报道，但其也具有广泛底物特异性，对乙酰基-CoA、丙酰基-CoA、丁酰基-CoA、棕榈酰基-CoA、油酰基-CoA、琥珀酰基-CoA和巴豆酰基-CoA显示活性(扎赫尔(Zeiher)和兰德尔(Randall)，植物生理学94：20-27(1990))。来自啤酒酵母菌的乙酰基-CoA水解酶ACH1代表另一候选物水解酶(布欧(Buu)等人，生物化学杂志278：17203-17209(2003))。

基因	登录号	GI号	生物体
				acot12	NP_570103.1	18543355	褐鼠
ACH1	NP_009538	6319456	啤酒酵母菌

另一候选物水解酶是对戊二酰基-CoA、己二酰基-CoA、环庚基-CoA、癸二酰基-CoA和十二烷二酰基-CoA展现活性的人类二羧酸硫酯酶acot8(韦斯廷等人，生物化学杂志280：38125-38132(2005))和还可水解众多种CoA硫酯的最近大肠杆菌同源物tesB(埃盖特等人，生物化学杂志266：11044-11050(1991))。相似酶还已在大鼠肝中进行表征(德亚娜，国际生物化学26：767-773(1992))。其它潜在大肠杆菌硫酯水解酶包括以下基因的基因产物：tesA(邦纳和布洛赫，生物化学杂志247：3123-3133(1972))、ybgC(库兹涅佐娃等人，欧洲微生物学会联合会微生物学评论29：263-279(2005)；庄等人，欧洲生物化学学会联合会快报516：161-163(2002))、paaI(宋等人，生物化学杂志281：11028-11038(2006))和ybdB(莱杜克等人，细菌学杂志189：7112-7126(2007))。

基因	登录号	GI号	生物体
				acot8	CAA15502	3191970	智人
tesB	NP_414986	16128437	大肠杆菌
				acot8	NP_570112	51036669	褐鼠
tesA	NP_415027	16128478	大肠杆菌
				ybgC	NP_415264	16128711	大肠杆菌
paaI	NP_415914	16129357	大肠杆菌
				vbdB	NP_415129	16128580	大肠杆菌

另一候选物水解酶是来自发酵氨基酸球菌的戊烯二酸CoA-转移酶。通过定点诱变将这种酶转化成对戊二酰基-CoA乙酰基-CoA和3-丁烯酰基-CoA具有活性的酰基-CoA水解酶(麦克和比凯尔，欧洲生物化学学会联合会快报405：209-212(1997))。这指示，编码琥珀酰基-CoA：3-酮酸-CoA转移酶和乙酰乙酰基-CoA：乙酰基-CoA转移酶的酶还可用作用于此反应步骤中的候选物，但可能会需要某些突变来改变其功能。

其它水解酶包括3-羟基异丁酰基-CoA水解酶，已描述其在缬氨酸降解期间将3-羟基异丁酰基-CoA有效地催化转变为3-羟基异丁酸酯(下村等人，生物化学杂志269：14248-14253(1994))。编码这种酶的基因包括褐鼠(下村等人，见上文(1994)；下村等人，酶学方法324：229-240(2000))和智人(下村等人，见上文(1994))的hibch。通过序列同源性确定的基因候选物包括啤酒酵母菌的hibch和仙人掌芽孢杆菌的BC_2292。

基因	登录号	GI号	生物体
				hibch	Q5XIE6.2	146324906	褐鼠
hibch	Q6NVY1.2	146324905	智人
				hibch	P28817.2	2506374	啤酒酵母菌
BC_2292	AP09256	29895975	仙人掌芽胞杆菌

4.1.1.a羧基-裂解酶.

α-酮酸的脱羧。α-酮戊二酸脱羧酶(步骤B，图58、62和63)、5-羟基-2-氧代戊酸脱羧酶(步骤Z，图62)和5-氨基-2-氧代戊酸脱羧酶(步骤R，图63)全部参与α-酮酸的脱羧。酮酸的脱羧是由具有不同底物特异性的多种酶催化，包括丙酮酸酯脱羧酶(EC 4.1.1.1)、苯甲酰基甲酸酯脱羧酶(EC 4.1.1.7)、α-酮戊二酸脱羧酶和支链α-酮酸脱羧酶。

丙酮酸酯脱羧酶(PDC)(还称为酮酸脱羧酶)是醇发酵中的关键酶，催化丙酮酸酯脱羧成乙醛。来自啤酒酵母菌的酶对包括2-酮丁酸酯、2-酮戊酸酯、3-羟基丙酮酸酯和2-苯基丙酮酸酯在内的脂肪族2-酮酸具有广泛底物范围(戴维(Davie)等人，生物化学杂志267：16601-16606(1992))。已对这种酶进行深入研究，针对其经改变活性进行改造，并且使其在大肠杆菌中进行菜单达(基兰贝-雅布斯等人，欧洲生物化学杂志268：1698-1704(2001)；李和乔丹，生物化学38：10004-10012(1999)；特舒勒等人，应用与环境微生物学64：1303-1307(1998))。由pdc编码的来自运动发酵单胞菌的PDC还具有宽底物范围且已成为改变对不同底物的亲和力的定向改造研究的主题(西格特等人，蛋白质工程、设计与选择18：345-357(2005))。可获得这种酶的晶体结构(基兰贝-雅布斯等人，欧洲生物化学杂志268：1698-1704(2001))。其它经充分表征的PDC候选物包括来自巴斯德醋酸杆菌(钱德拉等人，微生物学档案176：443-451(2001))和乳酸克氏酵母菌(克里格等人，欧洲生物化学杂志269：3256-3263(2002))的酶。

基因	登录号	GI号	生物体
				pdc	P06672.1	118391	运动发酵单胞菌
pdc1	P06169	30923172	啤酒酵母菌
				pdc	AM21208	20385191	巴斯德醋酸杆菌
pdcl	Q12629	52788279	乳酸克氏酵母菌

与PDC一样，苯甲酰基甲酸酯脱羧酶(EC 4.1.1.7)具有宽底物范围且已成为酶改造研究的目标。已对来自恋臭假单胞菌的酶进行深入研究，并且可获得这种酶的晶体结构(哈森等人，生物化学37：9918-9930(1998)；波洛夫尼科娃等人，生物化学42：1820-1830(2003))。恋臭假单胞菌酶的活性位点中两个残基的定点诱变改变对天然和非天然底物的亲和力(Km)(西格特等人，蛋白质工程、设计与选择18：345-357(2005))。这种酶的性质已通过定向改造进一步修改(林根等人，蛋白质工程.15：585-593(2002)；林根等人，生物化学4：721-726(2003))。由mdlC编码的来自绣色假单胞菌的酶还已以实验方式进行表征(巴罗曼等人，欧洲微生物学会联合会微生物学快报34：57-60(1986))。来自施氏假单胞菌、荧光假单胞菌和其它生物体的其它基因候选物可通过序列同源性推测或使用在恋臭假单胞菌中产生的生长选择系统鉴别(亨宁等人，应用与环境微生物学72：7510-7517(2006))。

能够将2-氧代酸脱羧的第三种酶是α-酮戊二酸脱羧酶(KGD)。迄今尚未对这个类别酶的底物范围进行研究。已对来自结核分枝杆菌的KDC(田等人，美国国家科学院院刊102：10670-10675(2005))进行克隆和菜单达。然而，其并非用于菌株改造的理想候选物，这是因为其较大(约130kD)且富含GC。已在包括大豆根瘤菌和百脉根中慢生根瘤菌在内的若干根瘤菌物种中检测到KDC酶活性(格林(Green)等人，细菌学杂志182：2838-2844(2000)。尽管尚未在所述生物体中分离出KDC编码基因，但可获得基因组序列，并且将各基因组中的若干基因注释为推定KDC。还已对来自纤细裸藻的KDC进行表征，但迄今尚未鉴别出与此活性相关的基因(重冈和中野，生物化学与生物物理学文献288：22-28(1991))。对从N端起始的前20个氨基酸定序(MTYKAPVKDVKFLLDKVFKV；SEQ ID NO：45)(重冈和中野，生物化学与生物物理学文献288：22-28(1991))。所述基因可通过测试含有此N端序列的基因候选物的KDC活性来鉴别。

基因	登录号	GI号	生物体
				kgd	O50463.4	160395583	结核分枝杆菌
kgd	NP_767092.1	27375563	大豆根瘤菌
				kgd	NP_105204.1	13473636	百脉根中慢生根瘤菌

用于催化此反应的第4种候选酶是支链α-酮酸脱羧酶(BCKA)。已显示，这个类别酶作用于链长度在3到6个碳之间变化的多种化合物(奥和金田，生物化学杂志263：18386-18396(1988)；斯米茨等人，B.A.、J.E.希尔卡玛弗里格(J.E.Hylckama Vlieg)、W.J.恩格斯(W.J.Engels)、L.梅耶尔(L.Meijer)、J.T.武泰(J.T.Wouters)和G.斯米茨，风味形成中所涉及的乳酸乳球菌支链α-酮酸脱羧酶的鉴别、克隆和表征(Identification，cloning，andcharacterization of a Lactococcus lactis branched-chain alpha-keto aciddecarboxylase involved in flavor formation)，应用与环境微生物学71：303-311(2005))。已就多种具支链和直链底物对乳酸乳球菌中的酶进行表征，所述底物包括2-氧代丁酸酯、2-氧代己酸酯、2-氧代戊酸酯、3-甲基-2-氧代丁酸酯、4-甲基-2-氧代丁酸酯和异己酸酯(斯米茨等人，应用与环境微生物学71：303-311(2005)。已在结构上对所述酶进行表征(博格等人，科学318：1782-1786(2007))。乳酸乳球菌酶与运动发酵单胞菌的丙酮酸酯脱羧酶之间的序列比对指示，催化和底物识别残基几乎相同(西格特等人，蛋白质工程、设计与选择18：345-357(2005))，因此这种酶可为用于定向改造的有前景的候选物。在枯草芽孢杆菌中检测到BCKA对α-酮戊二酸酯的脱羧；然而，此活性相对于对其它支链底物的活性较低(5％)(奥和金田，枯草芽胞杆菌中支链脂肪酸的生物合成(Biosynthesis ofbranched-chain fatty acids in Bacillus subtilis)。脱羧酶为支链脂肪酸合成酶所必需(Adecarboxylase is essential for branched-chain fatty acid synthetase).生物化学杂志263：18386-18396(1988))，并且迄今尚未鉴别出编码这种酶的基因。其它BCKA基因候选物可通过与乳酸乳球菌蛋白质序列的同源性来鉴别。将这种酶的许多高评分BLASTp命中(hit)注释为吲哚丙酮酸酯脱羧酶(EC 4.1.1.74)。吲哚丙酮酸酯脱羧酶(IPDA)是在植物和植物细菌中催化吲哚丙酮酸酯到吲哚乙醛的脱羧的酶。

基因	登录号	GI号	生物体
				kdcA	AAS49166.1	44921617	乳酸乳球菌

源自智人和欧洲牛线粒体支链酮酸脱氢酶复合物的E1亚单元的重组支链α-酮酸脱羧酶已在大肠杆菌中克隆并进行菜单达(戴维等人，生物化学杂志267：16601-166061992)；韦恩(Wynn)等人，生物化学杂志267：1881-1887(1992)；韦恩等人，生物化学杂志267：12400-12403(1992))。在所述研究中，作者发现，伴护蛋白(chaperonin)GroEL与GroES的共表达将脱羧酶的比活性增强500倍(韦恩等人，生物化学杂志267：12400-12403(1992))。所述酶是由两个α亚单元和两个β亚单元构成。

基因	登录号	GI号	生物体
				BCKDHB	NP_898871.1	34101272	智人
BCKDHA	NP_000700.1	11386135	智人
				BCKDHB	P21839	115502434	欧洲牛
BCKDHA	P11178	129030	欧洲牛

α-酮酸的脱羧。若干鸟氨酸脱羧酶(步骤U，图63)还展现对赖氨酸和其它相似化合物的活性。所述酶发现于粘性烟草(李和曹，生物化学杂志360：657-665(2001))、乳酸杆菌30a(吉拉尔(Guirard)和什内尔(Snell)，生物化学杂志255：5960-5964(1980))和创伤弧菌(李等人，生物化学杂志282：27115-27125(2007))中。已使来自乳酸杆菌30a(莫马尼(Momany)等人，分子生物学杂志252：643-655(1995))和创伤弧菌的酶结晶。创伤弧菌酶有效地催化赖氨酸脱羧，并且已阐明参与底物特异性的残基(李等人，生物化学杂志282：27115-27125(2007))。相似酶已在阴道滴虫中进行表征，但不了解编码这种酶的基因(耶莱特(Yarlett)等人，生物化学杂志293(Pt 2)：487-493(1993))。

还对谷氨酸脱羧酶(步骤L，图62和63)进行充分表征。实例性谷氨酸脱羧酶可在大肠杆菌(迪拜瑟等人，蛋白质的表达和纯化8：430-438(1996))、啤酒酵母菌(科莱曼等人，生物化学杂志276：244-250(2001))和智人(布(Bu)等人，美国国家科学院院刊89：2115-2119(1992)；布和托宾，基因组学21：222-228(1994))中发现。

基因	登录号	GI号	生物体
				GAD1	NP_000808	58331246	智人
GAD2	NP_001127838	197276620	智人
				gadA	NP_417974	16131389	大肠杆菌
gadB	NP_416010	16129452	大肠杆菌
				GAD1	NP_013976	6323905	啤酒酵母菌

赖氨酸脱羧酶(EC 4.1.1.18)催化赖氨酸到尸胺的脱羧。这种酶的两种同功酶在大肠杆菌基因组中是由基因cadA和ldcC编码。CadA与耐酸性有关且受到cadC基因产物的正调节(勒莫尼耶(Lemonnier)和莱恩(Lane)，微生物学144(Pt 3)：751-760(1998))。CadC接受羟基赖氨酸和S-氨基乙基半胱氨酸作为替代底物，并且2-氨基庚二酸酯和6-ACA用作这种酶的竞争性抑制剂(萨博(Sabo)等人，生物化学13：662-670(1974))。可利用定向进化或其它酶改造方法来增强这种酶将2-氨基庚二酸酯脱羧的活性。组成型表达的ldc基因产物的活性小于CadA(勒莫尼耶和莱恩，微生物学144(Pt 3)：751-760(1998))。最近在肠炎弧菌中鉴别出与CadA类似的赖氨酸脱羧酶(田中(Tanaka)等人，应用微生物学杂志104：1283-1293(2008))。由ldc编码的来自反刍月形单胞菌的赖氨酸脱羧酶与真核鸟氨酸脱羧酶具有序列相似性，并且接受L-赖氨酸与L-鸟氨酸二者作为底物(高冢(Takatsuka)等人，生物科学、生物技术与生物化学63：1843-1846(1999))。对活性位点残基进行鉴别和改造以改变所述酶的底物特异性(高冢等人，细菌学杂志182：6732-6741(2000))。

基因	登录号	GI号	生物体
				cadA	AAA23536.1	145458	大肠杆菌
ldcC	AAC73297.1	1786384	大肠杆菌
				ldc	O50657.1	13124043	反刍月形单胞菌
cadA	AB124819.1	44886078	肠炎弧菌

6.2.1.a CoA合成酶.

CoA合成酶或连接酶反应是图62和63的步骤I和图62的步骤V所需。琥珀酸酯或4-羟基丁酸酯是所需底物。编码可能进行所述转化的酶的实例性基因包括大肠杆菌的suCCD基因，其天然形成琥珀酰基-CoA合成酶复合物。这种酶复合物天然催化从琥珀酸酯形成琥珀酰基-CoA，同时消耗一个ATP，所述反应活体内是可逆的(巴克等人，生物化学(Biochem.)24：6245-6252(1985))。

基因	登录号	GI号	生物体
				sucC	NP_415256.1	16128703	大肠杆菌
sucD	AAC73823.1	1786949	大肠杆菌

其它实例性CoA-连接酶包括尚未表征序列的大鼠二羧酸酯-CoA连接酶(魏美克等人，生物化学杂志230：683-693(1985))、来自产黄青霉的两种经表征乙酸苯基酯-CoA连接酶中的任一者(拉马斯-马塞拉斯等人，生物化学杂志395：147-155(2005)；王等人，生物化学与生物物理学研究通讯360(2)：453-458(2007))、来自恋臭假单胞菌的乙酸苯基酯-CoA连接酶(马丁内斯-布兰科等人，生物化学杂志265：7084-7090(1990))和来自枯草芽孢杆菌的6-羧基己酸酯-CoA连接酶(鲍尔等人，细菌学杂志178(14)：4122-4130(1996))。其它候选酶是来自家鼷鼠(长谷川(Hasegawa)等人，生物化学与生物物理学报1779：414-419(2008))和智人(大神(Ohgami)等人，生物化学药理学(Biochem.Pharmacol.)65：989-994(2003))的乙酰乙酰基-CoA合成酶，其天然催化乙酰乙酸酯依赖ATP转变为乙酰乙酰基-CoA。已在瑟杜生金属球菌中证实4-羟基丁酰基-CoA合成酶活性(博格等人，科学318：1782-1786(2007))。已试验性地将这种功能指配给Msed_1422基因。

基因	登录号	GI号	生物体
				phl	CAJl5517.1	77019264	产黄青霉
phlB	ABS19624.1	152002983	产黄青霉
				paaF	AAC24333.2	22711873	恋臭假单胞菌
bioW	NP_3909022	50812281	枯草芽胞杆菌
				AACS	NP_084486.1	21313520	家鼷鼠
AACS	NP_076417.2	31982927	智人
				Msed_1422	YP_001191504	146304188	瑟杜生金属球菌

形成ADP的乙酰基-CoA合成酶(ACD，EC 6.2.1.13)是将酰基-CoA酯转变为其相应酸与ATP的同时合成偶合的另一候选酶。已在文献中描述具有广泛底物特异性的若干酶。据显示，由AF1211编码的来自闪烁古球菌的ACD I对多种直链和支链底物起作用，所述底物包括乙酰基-CoA、丙酰基-CoA、丁酰基-CoA、乙酸酯、丙酸酯、丁酸酯、异丁酸酯、异戊酸酯、琥珀酸酯、延胡索酸酯、乙酸苯基酯、吲哚乙酸酯(莫斯菲尔德(Musfeldt)等人，细菌学杂志184：636-644(2002))。来自死海嗜盐古细菌的酶(注释为琥珀酰基-CoA合成酶)接受丙酸酯、丁酸酯和支链酸(异戊酸酯和异丁酸酯)作为底物，并且显示在正向和反向上起作用(布拉森(Brasen)等人，微生物学档案182：277-287(2004))。由来自超嗜热泉生古细菌(crenarchaeon)嗜气热棒菌的PAE3250编码的ACD在所有经表征ACD内显示最宽的底物范围，与乙酰基-CoA、异丁酰基-CoA(优选底物)和苯基乙酰基-CoA反应(布拉森等人，见上文(2004))。来自闪烁古球菌、死海嗜盐古细菌和嗜气热棒菌的酶全部已在大肠杆菌中进行克隆，菜单达和表征(莫斯菲尔德等人，见上文；布拉森等人，见上文(2004))。

基因	登录号	GI号	生物体
				AF1211	NP_070039.1	11498810	闪烁古球菌DSM4304
scs	YP_135572.1	55377722	死海嗜盐古细菌ATCC 43049
				PAE3250	NP_560604.1	18313937	嗜气热棒菌菌株IM2

实例XXIII

利用羧酸还原酶产生BDO

将4-羟基丁酸酯途径基因整合到染色体中：ECKh-432的构筑.在命名为ECKh-761的大肠杆菌菌株中表达羧酸还原酶，所述菌株是ECKh-432的额外缺失编码琥珀酸半醛脱氢酶的sad和gabD基因的派生物。此菌株含有产生4HB的BDO途径的组分，所述途径于fimD基因座处整合到大肠杆菌的染色体中，如实例XXI中所述。

羧酸还原酶和PPTase的克隆和表达。为了生成经改造以产生1，4-丁二醇的大肠杆菌菌株，使用熟知分子生物学技术(例如，参见桑布鲁克，见上文，2001；奥苏贝尔见上文，1999)在大肠杆菌中表达编码羧酸还原酶和磷酸泛酰巯基乙胺转移酶的核酸。特定来说，在PA1/lacO启动子控制下将来自伊文思奴卡菌(命名为720)、耻垢分枝杆菌mc(2)155(命名为890)、鸟分枝杆菌副结核亚种K-10(命名为891)和海栖分枝杆菌M(命名为892)的car基因克隆到pZS*13载体(伊克斯普拉希斯，卢兹海姆，德国)中。在与那些用于pZS*13中相似的启动子和核糖体结合位点控制下将npt(ABI83656.1)基因(即，721)克隆到原始微型F质粒载体PML31的衍生物pKJL33S载体中。

通过PCR从奴卡菌属基因组DNA克隆Car基因(GNM_720)。其核酸和蛋白质序列分别示于图59A和59B中。通过GeneArt(里根斯堡，德国)合成npt基因(GNM_721)的密码子优化形式。其核酸和蛋白质序列分别示于图60A和60B中。耻垢分枝杆菌mc(2)155(命名为890)、鸟分枝杆菌副结核亚种K-10(命名为891)和海栖分枝杆菌M(命名为892)基因和酶的核酸和蛋白质序列可分别在图64、65和66中发现。将质粒转化到ECKh-761中以表达1，4-丁二醇产生所需蛋白质和酶。

使用羧酸还原酶的1，4-BDO产生的证实。使用大肠杆菌全细胞培养物来证实1，4-丁二醇途径的菜单达。将经分别含有car基因和GNM_721的pZS*13和pKJL33S质粒转化的大肠杆菌ECKh-761单菌落接种到5mL含有合适抗生素的LB培养基中。相似地，将经含有car的无插入pZS*13质粒和pKJL33S质粒转化的大肠杆菌ECKh-761单菌落接种到含有合适抗生素的LB培养基的额外5mL等分试样中。通过用1.5％最早培养物接种含有合适抗生素的新鲜最低活体内转变培养基(参见下文)来开始10mL微好氧性培养物。

最低活体内转变培养基的配方(对于1000mL来说)如下：

通过在接种后首先用氮将加盖厌氧性瓶冲洗5分钟、然后用G针刺穿隔膜来建立微好氧性条件。在生长期间使针保持在瓶中以允许少量空气进入瓶中。当培养物达到对数生长中期时，用0.2mM IPTG诱导蛋白质表达。将此视为：时间＝0hr。分析培养物上清液的BDO、4HB和其它副产物，如上文和WO2008115840中所述(参见表31)。

表33显示表达不同羧酸还原酶的菌株中不同产物的产生，包括BDO的产生。

表33.表达不同羧酸还原酶的菌株中不同产物的产生.

所述结果显示，不同羧酸还原酶可在BDO途径中发挥功能以产生BDO。

实例XXIV

用以改良经改造微生物特性的代谢修饰

这个实例描述用以改良经改造微生物的特性的其它代谢修饰。所述经改良特性包括(但不限于)增加产物产率、减少副产物产生、改良经改造微生物的生长特性，包括改良用于按比例放大产生的特性等等。

瓶用培养条件。在补加有10mM NaHCO₃、20g/L D-葡萄糖和100mM用以改良缓冲能力的MOPS、10μg/ml硫胺素和用于质粒维持的合适抗生素的M9最低盐培养基(6.78g/LNa₂HPO₄、3.0g/L KH₂PO₄、0.5g/L NaCl、1.0g/L NH₄Cl、1mM MgSO₄、0.1mM CaCl₂)中进行20毫升用于代谢物产生或生物转变的瓶培养。使大肠杆菌菌株MG1655 lacIQ+在厌氧性下生长，并且通过用氮将加盖厌氧性瓶冲洗至少5min来获得厌氧性条件。将微好氧性条件用于所有其它菌株，所述微好氧性条件是通过在接种后首先用氮将加盖厌氧性瓶冲洗5min，然后用23G针(必帝(Becton-Dickenson))刺穿隔膜来建立。在生长期间使针保持在瓶中以允许少量空气进入。除非文中另有说明，否则当培养物达到对数生长中期时，用0.2mM IPTG诱导蛋白质表达。

用于96孔板的培养条件。使96孔板中的所有培养物在具有MOPS和合适抗生素的1.2ml M9培养基(上文提供组成)中生长。还添加呈5％葡萄糖形式的碳源。通过用两个透气性粘着密封件覆盖板来获得微好氧性条件。对密封件边缘进行压胶以使蒸发最小化。使所有培养物在37℃下生长。

细菌菌株和质粒。根据制造商说明书利用PureLink Genomic DNA Mini Kit(英杰)分离来自细菌菌株的基因组DNA。如所述进行重组DNA操纵(桑布鲁克等人，T.分子克隆：实验室手册，冷泉港实验室，冷泉港，纽约，(1989)。使用高忠实性KOD DNA聚合酶(EMD化学(EMD Chemicals)；比尔里卡，马萨诸塞州)从合适基因组DNA模板扩增研究中的基因和开放阅读框。根据标准分子生物学方案利用Taq聚合酶(Promega)进行用于基因分型和定序的分析型PCR实验。DNA定序由金唯智(Genewiz)(南平原镇，新泽西州)提供。

用于遗传操纵的程序。用于BDO途径的表达载体的研发。载体主链是从罗尔夫鲁茨博士伊克斯普拉希斯(expressys.de)获得。载体和菌株是基于先前所述的pZ表达系统(鲁茨和比雅尔，核酸研究25：1203-1210(1997))。所得载体是pZE13luc、pZA33luc、pZS*13luc和pZE22luc且含有荧光素酶基因作为填充片段。为了用侧接有合适限制酶位点的lacZ-α片段置换荧光素酶填充片段，首先通过用EcoRI和XbaI消化从各载体去除荧光素酶填充片段。利用以下引物从pUC19通过PCR扩增lacZ-α片段：

lacZα-RI

lacZα3′BB

此生成5’末端具有EcoRI位点、NheI位点、核糖体结合位点、SalI位点和起始密码子的片段。在所述片段的3’末端含有终止密码子、XbaI位点、HindIII位点和AvrII位点。用EcoRI和AvrII消化PCR产物且将其连结到用EcoRI和XbaI消化的基础载体中(XbaI和AvrII具有兼容末端且生成非位点)。由于NheI和XbaI限制酶位点生成可连结在一起的相容末端(但在连接后生成不被任一酶消化的位点)，因此克隆到载体中的基因可以“生物砖围砌”在一起(openwetware.org/wiki/Synthetic_Biology：BioBricks)。简单来说，这种方法允许使用2个相同的限制位点将无限数量的基因接合到载体中(只要所述位点不出现在所述基因内部即可)，这是因为在每次添加后会破坏所述基因之间的位点。首先，来自所述载体的表达较低，并且随后使用

定点诱变试剂盒(NEB，伊普斯威奇，马萨诸塞州)对其进行修饰以将间隔子序列AATTAA插入EcoRI与NheI位点之间。此消除RNA中结合RBS和起始密码子的推定茎环结构。

所有载体都依次具有指示复制起点、抗生素抗性标记物和启动子/调节单元的pZ标号以及字母和数字。复制起点是第二个字母且基于起点表示为E(对于ColE1来说)、A(对于p15A来说)和S(对于pSC101来说)(以及命名为S*的pSC101的更低拷贝数形式)。第一个数字代表抗生素抗性标记物(1为氨苄青霉素，2为康霉素，3为氯霉素)。最后数字界定调节所关注基因的启动子(1为PLtetO-1，2为PLlacO-1且3为PA1lacO-1)且所述启动子中的每一者都通过其对应诱导物分子而变得活化(pLtetO可通过四环素诱导；pLlacO-1和pA1lacO-1可通过IPTG诱导)。然后设计并构筑三种基础载体pZS*13S、pZA33S和pZE13S以用作“诱导型”质粒载体。

除上述“诱导型”启动子以外，还从域通联达(Registry)(partsregistry.org)对一组“组成型”启动子取样。然后经由李和艾丽德(Eledge)(自然方法(Nature Methods)2007，4：251-256)描述的不依赖序列和连接的克隆(SLIC)方法将这些“组成型”启动子中的每一者引入pZS*13S载体主链中以置换pA1lacO-1诱导型启动子。在这些取样的“组成型”启动子(p100、p104、p105、p107、p108、p111、p115和p119)中，进行实验以确定通过蛋白质表达水平验证的启动子强度的顺序。对于这些实验来说，采用“诱导型”和“组成型”质粒载体二者，针对生物砖和SLIC插入进行修饰，如上文所论述。为了进一步微调一些过度表达蛋白质的蛋白质表达水平，因此使用RBS计算器(salis.psu.edu/software/)对启动子与基因编码序列之间的核糖体结合位点(RBS)进行修饰。

用于将一系列基因插入pZS*13S载体主链中的SLIC引物列示于下文中。小写体标记退火到载体主链的序列，而大字体标记退火到基因的编码区的序列。

1.ppc 525

正向SLIC引物：

反向SLIC引物：

2.sucAB-lpdA

正向SLIC引物：

反向SLIC引物：

3.galP 1120

正向SLIC引物：

反向SLIC引物：

4.glk 1123

正向SLIC引物：

反向SLIC引物：

5.glf1786

正向SLIC引物：

反向SLIC引物：

对于下文所论述的工作，采用三种针对如上文所论述生物砖插入进行修改的基础载体pZS*13S、pZA33S和pZE13S。

以下技术描述incW质粒pPSX13和pPSX23R的构筑。原始incW质粒主链(pPSX)是从约翰M.彭伯顿(John M.Pemberton)博士(泽尔维奇(Sarovich)和彭伯顿，质粒(Plasmid)57：306-313(2007))获得。pPSX质粒经遗传修饰以将氨苄青霉素标记物(bla基因，命名为pPSX13)插入BamHI限制酶位点中或将康霉素标记物和R6k复制起点(命名为pPSX23R)插入BamHI与SacI限制酶位点之间。还构筑两种相似incW质粒以包括从pZS*13S-ald-adh扩增的ald-adh基因盒。对于pPSX13-ald-adh抗氨苄青霉素质粒来说，将bla-ald-adh基因盒插入pPSX13的BamHI限制酶位点中。为了构筑pPSX23R-ald-adh抗康霉素质粒，在pPSX23R的XhoI与SacI限制酶位点之间用“康霉素标记物-R6k复制起点”盒置换氨苄青霉素标记物(bla基因)。

如下将基因033B、1210和956插入微型F-质粒主链pKLJ33S中：设计PCR引物以从合适模板扩增基因033B(033BFOR和033BREV)、1210C(1210CFOR和1210CREV)和956(956FOR和956REV)。所述引物包括如以大写体表示的各基因的最接近5’(FOR)和3’(REV)末端。各引物还包括与质粒pZA33S的启动子区(FOR)和终止子区(REV)直接同源的尾。使用引物pZ-5’和pZ-3’和作为模板的环形pZA33S扩增在任一最末端具有启动子区和终止子区的pZA33S线性片段。将pZA33S线性片段与033B、1210C和956基因片段中的每一者组合且使用不依赖序列和连接的克隆将其接合以形成对应质粒pZA33S-033B、pZA33S-1210C和pZA33S-956。

使用引物034Cmfor和034Cmrev从合适的pZA33S质粒背景扩增033B、1210C和956基因。设计所述引物以从质粒pZA33S(序列以大写体表示)扩增氯霉素抗性基因、pA1启动子、所关注特定基因和终止子组件，而尾序列(以小写体表示)对应于侧接但不包括微型F-质粒pKLJ12的氨苄青霉素抗性基因、阿拉伯糖反应性启动子和终止子序列的区(琼斯(Jones)和基思林(Keasling)，生物技术与生物工程59：659-665(1998))。

将含有质粒pKLJ12和温度敏感性Red/ET辅助质粒pREDET(Tet)的大肠杆菌DP10B菌株(基因桥GmbH(GeneBridges GmbH)，海德堡，德国)接种到含有10μg/ml四环素和100μg/ml最终浓度的氨苄青霉素的LB培养基中且在30℃下在振荡的同时培育3小时直到细胞混浊。将用以诱导Red/ET重组菜单达的阿拉伯糖添加到最终浓度为0.3％，将温度转换为37℃且在振荡的同时将细胞再培育1小时。在通过于冰冷无菌双蒸馏水中重复离心和再悬浮来实现电感受态后，在1mm比色皿中将这些细胞与来自pZA33S-033B、pZA33S-1210C或pZA33S-956质粒的034Cmfor/034Cmrev PCR扩增物混合且然后使其在1800kV、25μF、200Ω下进行电穿孔。然后将电穿孔细胞添加到SOC生长培养基，在不振荡的情况下在37℃下进行培育，并且然后在含有10μg/ml最终浓度的氯霉素的LB固体培养基上铺开且在37℃下培育18到24小时。然后对所得抗氯霉素单菌落在含有10μg/ml四环素或100μg/ml氨苄青霉素的固体LB培养基上的生长进行评分。通过PCR和DNA定序验证显示具有氯霉素抗性、四环素敏感性和氨苄青霉素敏感性的菌落含有新型微型F-质粒，所述质粒已通过RED/ET介导的同源重组用pZA33S的氯霉素抗性基因/PA1启动子/所关注基因/终止子完全交换pKLJ12的氨苄青霉素抗性基因/阿拉伯糖反应性启动子/终止子，从而产生新型微型F-质粒pKLJ33S-033B、pKLJ33S-1210C、pKLJ33S-956。

使用sacB基因对基因进行染色体置换。用于在大肠杆菌染色体中插入或缺失基因的主要方法是基于来自枯草芽孢杆菌的sacB基因的利用(盖伊等人，细菌学杂志153：1424-1431(1983))。所用载体是缺失oriT和IS序列的pRE118(ATCC87693)。对所得载体(大小为3.6kb且携带康霉素抗性基因)定序且将其称为pRE118-V2。除非说明，否则片段的所有克隆都是在pRE118-V2的限制位点KpnI和PstI中进行。所有PCR扩增都使用来自大肠杆菌MG1655(ATCC47076)的基因组DNA作为DNA模板。染色体中的第一个整合事件是在含有康霉素(25或50mg/L)的LB琼脂板上进行选择。通过PCR使用以下2个引物来验证正确插入：一个定位于插入区外部且一个在康霉素基因中(5’-aggcagttccataggatggc-3’)(SEQ ID NO：118)。选择具有正确插入的克隆用于解析。在普通液体LB中在所需温度下将其继代培养两次且将连续稀释物平铺于LB-无盐-蔗糖10％板上。筛选在含有蔗糖的板上生长的克隆在LB-低盐琼脂培养基上的康霉素抗性基因的损失，并且通过涵盖区的PCR和定序验证所关注片段的缺失/插入。

使用这种方法利用以下引物使appCB缺失：

因此，缺失以下核苷酸：1，036，963-＞1，039，655。

还利用上述pRE-sacB-Kan载体使tesB和ybgC缺失。用于实现缺失的引物是：(5’-3’)

因此缺失的核苷酸是：

tesB：473，525＜-474，385

ybgC：773，975-＞774，379

还利用标准pRE-sacB-Kan载体实现ndh缺失。用于实现缺失的引物是：(5’-3’)

因缺失而缺失的核苷酸是1，165，308-＞1，166，612。

利用标准pRE-sacB-Kan载体引入yjgB、yqhD、yahK和adhP的缺失。用于实现缺失的引物是：(5’-3’)

由于这些缺失中每一者而缺失的核苷酸是：ygjB：4，493，213＜-4，494，232，yqhD：3，153，377-＞3，154，540，yahK：342，108-＞343，157，adhP：1，550，852＜-1，551，862。

使用λ-red介导的组合的基因缺失：通过Red介导的重组使天然基因cyoABCD从染色体缺失(ncbi.nlm.nih.gov/pubmed/10829079)。

对于cyoABCD缺失来说，使用以下引物分别从pKD3或pKD4(ncbi.nlm.nih.gov/pubmed/10829079)扩增氯霉素或康霉素抗性基因，并且使所述引物侧接FRT位点且与cyoABCD同源：

LK-cyo-IO-下游

LK-cyo-IO-上游

在30℃下使携带Red辅助质粒pKD46的大肠杆菌K-12MG1655在100ml具有氨苄青霉素和1mM L-阿拉伯糖的LB培养基中生长到0.3的OD600，并且如别处所述制备电穿孔-感受态细胞(桑布鲁克等人，分子克隆：实验室手册，冷泉港实验室，冷泉港，纽约(1989))。在冰冷0.1cm比色皿(伯乐(Bio-Rad)公司，赫尔克里士，加利福尼亚州，美国)中将测量为50μl的感受态细胞与400ng PCR片段混合。在1.8kV下以25mF和200Ω将细胞电穿孔，随后立即添加具有1mM L-阿拉伯糖的1ml SOC培养基(2％Bacto胰蛋白胨(迪福科)、0.5％酵母菌提取物(迪福科)、10mM NaCl、2.5mM KCl、10mM MgCl₂、10mM MgSO₄、20mM葡萄糖)。在37℃下培育2h后，将1/10部分扩散到琼脂板上以在37℃下选择氯霉素R或康霉素R转化体。然后使用P1vir且选择合适抗生素将个别缺失转导到新宿主菌株中(希尔豪维(Silhavy)等人，基因融合实验(Experiments with gene fusions)，冷泉港实验室，冷泉港，纽约(1984))。然后用温度敏感性质粒pCP20转化抗氯霉素或康霉素菌落，并且在30℃下将其平铺于氨苄青霉素(100μg/ml)板上。pCP20含有酵母菌Flp重组酶基因、抗氯霉素和氨苄青霉素基因和温度敏感性复制。在42℃下使菌落在无抗生素LB培养基中生长过夜且将其划线平铺于预热LB琼脂板中且在42℃下生长。测试个别克隆对氨苄青霉素和氯霉素或康霉素的敏感性以分离已损失pCP20质粒且经由Flp重组酶损失氯霉素或康霉素抗性基因的克隆。缺失cyoABCD的阳性克隆含有单一FRT“疤痕”且通过PCR使用侧接相应基因的引物来验证。

因cyoABCD缺失而缺失的核苷酸是：449，887-＞447，270。

利用上述标准pRed技术将来自中间耶氏杆菌的酯酶整合于染色体中。用于实现插入的引物是：(5’-3’)

于gabD基因座(ORF交换)处插入的序列是：

sucC和sucD的无标记物缺失。使用两步骤双交换同源重组方法实现从染色体缺失天然大肠杆菌sucC(基因2)和sucD(基因3)(图67)。经由来自pRED-Amp(基因桥，海德堡，德国)的λ噬菌体Red基因的表达来催化重组。将编码聚果糖蔗糖酶(基因6)和康霉素抗性(基因7)的基因整合到染色体中，置换sueC(基因2)和sucD(基因3)的大部分。使用康霉素来选择成功整合体。在第二个双交换同源重组步骤中，用缺乏sucC(基因2)和sucD(基因3)的大部分的合适DNA序列置换含有聚果糖蔗糖酶基因(基因6)和康霉素抗性基因(基因7)的经整合序列，并且选择耐蔗糖克隆。

经由标准分子生物学技术构筑用于上述两个同源重组步骤的线性双链DNA序列。为了实现用于初始整合步骤中的序列，通过PCR从大肠杆菌MG1655基因组DNA使用寡核苷酸1和寡核苷酸3扩增从sucB(基因1)内直到sucC(基因2)的第69个碱基对的1100bp序列(图68a)。通过PCR从质粒pRE-118DNA使用寡核苷酸5和寡核苷酸6扩增编码聚果糖蔗糖酶(基因6)和康霉素抗性(基因7)的基因(图68b)。通过PCR从大肠杆菌MG1655基因组DNA使用寡核苷酸4和寡核苷酸2扩增从sucD(基因3)的第811个bp横跨mngR(基因4)和部分mngA(基因5)的另一1100bp序列(图68a)。20bp寡核苷酸3与寡核苷酸5重叠且20bp寡核苷酸6与寡核苷酸4重叠，使得三种重叠PCR产物可使用标准程序组合并扩增(图68c)。同样，用于使sucCD缺失的第二重组的线性双链DNA序列是通过组合并扩增两种重叠PCR产物实现。通过PCR从大肠杆菌MG1655基因组DNA使用寡核苷酸1和寡核苷酸8扩增从sucB(基因1)内直到sucC(基因2)的第69个碱基对的1100bp序列(图68d)。通过PCR从大肠杆菌MG1655基因组DNA使用寡核苷酸7和寡核苷酸2扩增从sucD(基因3)的第811个bp横跨mngR(基因4)和部分mngA(基因5)的另一1100bp序列(图68d)。寡核苷酸7与寡核苷酸8重叠，使得两个重叠PCR产物可使用标准程序组合并扩增(图68e)。因sucCD缺失而缺失的核苷酸是来自：762，306-＞764，320。

分析程序：采用HPLC、LCMS/MS和GCMS来分析细胞培养物和发酵试样。两种技术之间的良好相关性(变异在10％内)提供方法交叉验证且确保数据精确性。

通过配备有二极管阵列和折射率(RI)检测器的HPLC(安捷伦1100)，使用离子排除Carbomix H-NP5管柱(Sepax)以5mM硫酸作为移动相在0.6mL/min流速和55℃管柱温度下测量有机酸、乙酸酯、丙酮酸酯、乳酸酯和琥珀酸酯以及BDO。在210nm下的UV吸收与折射率二者的检测器中监测有机酸，同时仅使用RI来测量BDO、乙醇和单糖。所有化学品和试剂都来自西格玛-奥德里奇(圣刘易斯，密苏里州，美国)。

在与安捷伦1200HPLC界面连接的API3200三相四极系统(AB Sciex，生命技术(Life Technologies)，卡尔斯巴德，加利福尼亚州)上利用基于电喷雾电离和MRM的获取方法进行LCMS/MS分析。以正电离模式监测BDO、4HB、GBL、Glu、Ala和GABA和内标(将¹³C同位素标记类似物分别用于各分析物，以补偿基质效应并确保线性度)。在需要时，使用负电离来定量酸性分析物，例如，丙酮酸酯、乳酸酯、琥珀酸酯和4HB。在Zorbax Eclipse XDB C18(4.6×30mm，1.8μM粒径)上进行色谱分离，维持管柱在45℃、流速0.7mL/min。注射体积是5μL。洗脱剂是由具有0.1％甲酸的水和具有0.1％甲酸的甲醇组成，在5％甲醇的等度条件下、之后分级梯度到95％甲醇来洗脱所关注分析物，产生2min长时LCMS方法。在含有内标的水中稀释过滤试样，稀释因数根据所关注代谢物的浓度从200到10，000之间变化。在水中进行100倍或更大的稀释不会导致对于用于大肠杆菌中的1，4-丁二醇产生中的培养基组成和条件所观察到的离子抑制效应(严(Yim)等人，自然化学生物学(Nature Chemical Biology)7，445-452，(2011))。BDO和其它分析物的定量动态范围是0.05-200uM。使用Analyst软件进行定量。LCMS/MS方式因其允许进行高通量操作的快速周转时间而是用于监测BDO、4HB、GBL、Glu、Ala和GABA的优选方法。

以GCMS方式，通过三甲基硅烷基化将培养液试样中的BDO、4HB、乳酸酯和琥珀酸酯衍生化且通过GCMS使用从文献调整且带有一些修改的程序进行定量分析。研发方法显示低到低μM量的灵敏度、在0.05-15mM范围内的线性度以及良好重现性。在环境温度下在speedvac浓缩器中将100μL过滤试样干燥约1小时，之后添加20μL 10mM环己醇的二甲基甲酰胺溶液作为内标。添加100μL具有1％三甲基氯硅烷的N，O-双(三甲基硅烷基)三氟-乙酰胺(BSTFA)，并且在70℃下将所述混合物培育30min。将衍生化试样离心5min并直接注入GCMS(安捷伦6890N/5973N)中。使用Rtx-5SIL MS毛细管管柱(瑞斯泰克(Restek)，30m×0.25mm ID×0.25μm膜厚度)。GC以分流注射模式操作，以20∶1分流比引入1μL试样。注射口温度是250℃。使用氦作为载气，并且流速维持在1.0mL/min。将温度梯度程序优化以确保对所关注分析物的良好解析和最低基质干扰。首先使烘箱在80℃下保持1.5min，然后以10℃/min斜升到140℃并保持3min，之后以100℃/min快速斜升到300℃并最终保持5min。MS界面转移线维持在280℃下。总分析时间是17min，包括4min溶剂延迟。在相应细胞培养或发酵培养基中使用分析物溶液构筑标准校准曲线以尽可能接近地匹配试样矩阵。在甲醇中稀释试样后，还使用HP-InnoWax毛细管管柱(30m，0.25mm ID，0.25μm膜厚度)通过GCMS分析乙醇。使用ChemStation软件(安捷伦)处理GCMS数据。

使用YSI仪器或HPLC-UV-RI测量发酵试样中的残余葡萄糖。通过YSI或GCMS测量乙醇。

应用本文所述代谢改造策略来增加大肠杆菌中的1，4-丁二醇产生或以其它方式改良经改造微生物的特性。用于所述研究的1，4-丁二醇途径绘示于图69中。针对示于图69中的6个步骤中每一者测试的基因描述于表34、38、40、42、46和49中。

实例XXV

在编码α-酮戊二酸脱羧酶的基因表达后4-羟基丁酸酯和1，4-丁二醇的产生

这个实例描述在经改造以表达编码α-酮戊二酸脱羧酶的基因的细胞中产生4-羟基丁酸酯(4HB或4hb)和1，4-丁二醇(BDO)。

在大肠杆菌中从pZS*-13S质粒表达若干异源α-酮戊二酸脱羧酶基因(表34)以允许从α-酮戊二酸酯到4-羟基丁酸酯和1，4-丁二醇的功能途径。宿主菌株包括3125、2869和3812。所述宿主菌株是基于构筑描述于上文和US20110045575中的菌株ECKh-432。显着修饰包括adhE、ldhA、pflB、mdh和arcA的缺失。菌株ECKh-432还含有以下基因的染色体整合拷贝：来自牙龈卟啉单胞菌的sucD(编码CoA依赖性琥珀酸半醛脱氢酶)、来自牛分枝杆菌的sucA(编码α-酮戊二酸脱羧酶)、来自牙龈卟啉单胞菌的4hbd(编码4-羟基丁酸脱氢酶)和来自克氏羧菌的4hbd(编码4-羟基丁酸脱氢酶)。对于此研究来说，牛分枝杆菌sucA和牙龈卟啉单胞菌sucD基因在菌株3125、2869和3812中缺失。另外，菌株3125、2869和3812各自于attB基因座处含有从pA启动子表达的4-羟基丁酰基-CoA转移酶的染色体整合拷贝。利用从pPSX23R质粒表达的4-羟基丁酰基-CoA还原酶和4-羟基丁醛还原酶测试菌株2869和3812。表35、36和37显示，相对于表示为“pZS*13S”的对照，异源α-酮戊二酸脱羧酶基因的表达分别增强菌株3125、2869和3812中的4hb和/或BDO产生。使用先前所述的96孔板方案培养细胞。

表34.编码功能α-酮戊二酸脱羧酶的基因.

表35.含有若干替代α-酮戊二酸脱羧酶质粒构筑体的大肠杆菌宿主菌株3125的BDO和4-羟基丁酸酯(4HB)产生。仅表示为“pZS*13S”的质粒构筑体不含有α-酮戊二酸脱羧酶基因。表示为pZS*13S与之后一数字的质粒构筑体表达所述数字表示的α-酮戊二酸脱羧酶基因。BDO和4HB浓度以mM表示。

			LCMS-19h	LCMS-19h
					宿主菌株	质粒	OD 19h	4HB	BDO
3125	pZS*13S	3.61	0.208	0.327
					3125	pZS*13S	2.01	0.259	0.082
3125	pZS*13S	3.39	0.208	0.359
					3125	pZS*13S	3.38	0.178	0.352
3125	pZS*13S	3.84	0.277	0.478
					3125	pZS*13S	4.01	0.253	0.479
3125	pZS*13S	3.88	0.283	0.422
					3125	pZS*13S	3.54	0.192	0.499
3125	pZS*13S-1717	4.30	17.300	1.520
					3125	pZS*13S-1717	3.52	17.400	1.280
3125	pZS*13S-1717	3.79	17.700	1.540
					3125	pZS*13S-1717	3.53	17.800	1.550
3125	pZS*13S-1720	2.92	3.940	0.196
					3125	pZS*13S-1720	1.58	2.140	0.037
3125	pZS*13S-1720	1.97	2.600	0.072
					3125	pZS*13S-1720	3.11	3.870	0.261
3125	pZS*13S-1727	12.05	2.330	0.694
					3125	pZS*13S-1727	3.23	3.040	1.320
3125	pZS*13S-1727	3.19	3.490	1.560
					3125	pZS*13S-1727	4.86	2.500	0.657
3125	pZS*13S-1715	3.89	14.900	1.880
					3125	pZS*13S-1715	4.14	15.600	1.950
3125	pZS*13S-1715	4.07	15.700	1.910
					3125	pZS*13S-1715	3.03	14.300	1.600
3125	pZS*13S-1718	2.36	4.020	0.277
					3125	pZS*13S-1718	1.82	4.630	0.406
3125	pZS*13S-1718	2.37	3.690	0.265
					3125	pZS*13S-1718	2.26	3.940	0.273
3125	pZS*13S-1718	2.04	4.890	0.389
					3125	pZS*13S-1718	2.42	4.720	0.338
3125	pZS*13S-1718	2.16	4.530	0.377
					3125	pZS*13S-1718	2.43	5.190	0.517

表36.含有若干替代α-酮戊二酸脱羧酶质粒构筑体的大肠杆菌宿主菌株2869的BDO和4-羟基丁酸酯(4HB)产生。仅表示为“pZS*13S”的质粒构筑体不含有α-酮戊二酸脱羧酶基因。表示为pZS*13S与之后一数字的质粒构筑体表达所述数字表示的α-酮戊二酸脱羧酶基因。BDO和4HB浓度以mM表示。

表37.含有若干替代α-酮戊二酸脱羧酶质粒构筑体的大肠杆菌宿主菌株3812的BDO和4-羟基丁酸酯(4HB)产生。仅表示为“pZS*13S”的质粒构筑体不含有α-酮戊二酸脱羧酶基因。表示为pZS*13S与之后一数字的质粒构筑体表达所述数字表示的α-酮戊二酸脱羧酶基因。BDO和4HB浓度以mM表示。

实例XXVI

在表达编码CoA依赖性琥珀酸半醛脱氢酶的基因后4HB和BDO的产生

这个实例描述在表达编码CoA依赖性琥珀酸半醛脱氢酶的基因后4HB和BDO的产生。

在大肠杆菌中从pZS*-13S质粒表达若干异源性CoA依赖性琥珀酸半醛脱氢酶基因(表38)以允许从琥珀酰基-CoA到4-羟基丁酸酯和1，4-丁二醇的功能途径。宿主菌株3744是基于构筑描述于上文和US20110045575中的菌株ECKh-432。显着修饰包括adhE、ldhA、pflB、mdh和arcA的缺失。菌株ECKh-432还含有以下基因的染色体整合拷贝：来自牙龈卟啉单胞菌的sucD(编码CoA依赖性琥珀酸半醛脱氢酶)、来自牛分枝杆菌的sucA(编码α-酮戊二酸脱羧酶)、来自牙龈卟啉单胞菌的4hbd(编码4-羟基丁酸脱氢酶)和来自克氏羧菌的4hbd(编码4-羟基丁酸脱氢酶)。对于此研究来说，牛分枝杆菌sucA和牙龈卟啉单胞菌sucD基因在菌株3744中缺失。另外，菌株3744于attB基因座处含有从pA启动子表达的4-羟基丁酰基-CoA转移酶的染色体整合拷贝。其还含有表达4-羟基丁酰基-CoA还原酶和4-羟基丁醛还原酶的pPSX23R质粒。表39显示，相对于表示为“pZS*13S”的对照，异源性CoA依赖性琥珀酸半醛脱氢酶基因的表达增强菌株3744中的4hb和/或BDO产生。使用先前所述的96孔板方案培养细胞。

表38.编码功能性CoA依赖性琥珀酸半醛脱氢酶的基因

表39.含有若干替代性CoA依赖性琥珀酸半醛脱氢酶质粒构筑体的大肠杆菌宿主菌株3744的BDO和4-羟基丁酸酯(4HB)产生。仅表示为“pZS*13S”的质粒构筑体不含有CoA依赖性琥珀酸半醛脱氢酶基因。表示为pZS*13S与之后一数字的质粒构筑体表达所述数字表示的CoA依赖性琥珀酸半醛脱氢酶基因。BDO和4HB浓度以mM表示。

实例XXVII

在表达编码4-羟基丁酸脱氢酶的基因后4HB和BDO的产生

这个实例描述在表达编码4-羟基丁酸脱氢酶的基因后4HB和BDO的产生。

在大肠杆菌中从pZS*-13S质粒表达若干异源4-羟基丁酸脱氢酶基因(表40)以允许从琥珀酰基-CoA和α-酮戊二酸酯到4-羟基丁酸酯和1，4-丁二醇的功能途径。宿主菌株3891是基于构筑描述于上文和US20110045575中的菌株ECKh-432。显着修饰包括adhE、ldhA、pflB、mdh和arcA的缺失。菌株ECKh-432还含有以下基因的染色体整合拷贝：来自牙龈卟啉单胞菌的sucD(编码CoA依赖性琥珀酸半醛脱氢酶)、来自牛分枝杆菌的sucA(编码α-酮戊二酸脱羧酶)、来自牙龈卟啉单胞菌的4hbd(编码4-羟基丁酸脱氢酶)和来自克氏羧菌的4hbd(编码4-羟基丁酸脱氢酶)。对于此研究来说，牙龈卟啉单胞菌和克氏羧菌4hbd基因在菌株3891中缺失。另外，菌株3891于attB基因座处含有从pA启动子表达的4-羟基丁酰基-CoA转移酶的染色体整合拷贝。其还含有表达4-羟基丁酰基-CoA还原酶和4-羟基丁醛还原酶的pPSX23R质粒。表41显示，相对于表示为“pZS*13S”的对照，异源4-羟基丁酸脱氢酶基因的表达增强菌株3891中的4hb和/或BDO产生。使用先前所述的96孔板方案培养细胞。

表40.编码功能4-羟基丁酸脱氢酶的基因.

表41.含有若干替代4-羟基丁酸脱氢酶质粒构筑体的大肠杆菌宿主菌株3891的BDO和4-羟基丁酸酯(4HB)产生。仅表示为“pZS*13S”的质粒构筑体不含有4-羟基丁酸脱氢酶基因。表示为pZS*13S与之后一数字的质粒构筑体表达所述数字表示的4-羟基丁酸脱氢酶基因。BDO和4HB浓度以mM表示。

实例XXVIII

在表达编码4-羟基丁酸酯转移酶的基因后4HB和BDO的产生

这个实例描述在表达编码4-羟基丁酸酯转移酶的基因后4hb和BDO的产生。

在大肠杆菌中从pZS*-13S或F’质粒表达若干异源4-羟基丁酸酯转移酶基因(表42)以允许从α-酮戊二酸酯和琥珀酰基-CoA到1，4-丁二醇的功能途径。宿主菌株包括1269、2731 Δcat2和1654。所述宿主菌株是基于构筑描述于上文和US20110045575中的菌株ECKh-432。显着修饰包括adhE、ldhA、pflB、mdh和arcA的缺失。菌株ECKh-432还含有以下基因的染色体整合拷贝：来自牙龈卟啉单胞菌的sucD(编码CoA依赖性琥珀酸半醛脱氢酶)、来自牛分枝杆菌的sucA(编码α-酮戊二酸脱羧酶)、来自牙龈卟啉单胞菌的4hbd(编码4-羟基丁酸脱氢酶)和来自克氏羧菌的4hbd(编码4-羟基丁酸脱氢酶)。利用从pZS*-13S质粒表达的4-羟基丁酰基-CoA还原酶和4-羟基丁醛还原酶测试全部菌株1269、2731 Δcat2和1654。表43、44和45显示，异源4-羟基丁酸酯转移酶基因的表达允许分别在菌株1269、2731 Δcat2和1654中产生BDO。使用先前所述的96孔板方案培养细胞。

表42.编码功能4-羟基丁酸酯转移酶的基因.

1210C和033B的核苷酸序列提供于下文，由于所述序列经密码子优化以供在大肠杆菌中表达。

33B：

1210C：

表43.含有两种替代4-羟基丁酸酯转移酶质粒构筑体的大肠杆菌宿主菌株1269的BDO、GBL和4-羟基丁酸酯(4HB)产生。仅表示为“pZA33S(空)”的质粒构筑体不含有4-羟基丁酸酯转移酶基因。表示为F’与之后一数字的质粒构筑体表达所述数字表示的4-羟基丁酸酯转移酶基因。BDO和4HB浓度以mM表示。

			LCMS-24h	LCMS-24h	LCMS-24h
						宿主菌株	质粒	OD 24h	4HB	BDO	GBL
1269	pZA33S(空)	2.92	27.60	0.00	0.00
						1269	pZA33S(空)	2.12	23.80	0.59	0.07
1269	pZA33S(空)	2.72	28.80	2.13	0.03
						1269	pZA33S(空)	2.32	30.50	0.14	0.00
1269	F′34	1.76	2.42	22.20	0.87
						1269	F′34	1.70	2.34	21.00	0.88
1269	F′34	2.09	3.23	23.50	1.21
						1269	F′34	3.83	2.77	51.30	5.01
1269	F′1210C	1.99	2.84	28.20	1.73
						1269	F′1210C	1.64	2.73	27.30	1.61
1269	F′1210C	1.89	4.28	32.30	2.59
						1269	F′1210C	3.47	3.76	56.38	7.22

表44.含有两种替代4-羟基丁酸酯转移酶质粒构筑体的大肠杆菌宿主菌株2731Δcat2的BDO、GBL和4-羟基丁酸酯(4HB)产生。表示为pZS*13S与之后一数字的质粒构筑体表达所述数字表示的4-羟基丁酸酯转移酶基因。pZS*13S-主链还表达功能4-羟基丁酰基-CoA还原酶和4-羟基丁醛脱氢酶基因。BDO和4HB浓度以mM表示。

表45.含有替代4-羟基丁酸酯转移酶质粒构筑体的大肠杆菌宿主菌株1654的BDO、GBL和4-羟基丁酸酯(4HB)产生。表示为pZS*13S与之后一数字的质粒构筑体表达所述数字表示的4-羟基丁酸酯转移酶基因。pZS*13S-主链还表达功能4-羟基丁酰基-CoA还原酶和4-羟基丁醛脱氢酶基因。BDO和4HB浓度以mM表示。

实例XXIX

在表达编码4-羟基丁酰基-CoA还原酶的基因后4HB和BDO的产生

这个实例描述在表达编码4-羟基丁酰基-CoA还原酶的基因后4hb和BDO的产生。

在大肠杆菌中从pZS*-13S质粒表达若干异源4-羟基丁酰基-CoA还原酶基因(表46)以允许从琥珀酰基-CoA和α-酮戊二酸酯到1，4-丁二醇的功能途径。宿主菌株1889是基于构筑描述于上文和US20110045575中的菌株ECKh-432。显着修饰包括adhE、1dhA、pflB、mdh和arcA的缺失。菌株ECKh-432还含有以下基因的染色体整合拷贝：来自牙龈卟啉单胞菌的sucD(编码CoA依赖性琥珀酸半醛脱氢酶)、来自牛分枝杆菌的sucA(编码α-酮戊二酸脱羧酶)、来自牙龈卟啉单胞菌的4hbd(编码4-羟基丁酸脱氢酶)和来自克氏羧菌的4hbd(编码4-羟基丁酸脱氢酶)。菌株1889含有天然醇脱氢酶基因adhP、yqhD、yahK和yjgB的缺失。另外，菌株1889于attB基因座处含有从pA启动子表达的4-羟基丁酰基-CoA转移酶的染色体整合拷贝。菌株1889含有表达功能4-羟基丁醛还原酶基因的F’质粒。菌株4269于hemN基因座处含有在p119启动子控制下的4-羟基丁醛还原酶基因的染色体整合拷贝。表47和48显示，相对于表示为“pZS*13S”的对照，异源4-羟基丁酰基-CoA还原酶基因的表达分别增强菌株1889和4269中的BDO产生。使用先前所述的96孔板方案培养细胞。

表46.编码功能4-羟基丁酰基-CoA还原酶的基因.

表47.含有若干替代4-羟基丁酰基-CoA还原酶质粒构筑体的大肠杆菌宿主菌株1889的BDO和4-羟基丁酸酯(4HB)产生。仅表示为“pZS*13S”的质粒构筑体不含有4-羟基丁酰基-CoA还原酶基因。表示为pZS*13S与之后一数字的质粒构筑体表达所述数字表示的4-羟基丁酰基-CoA还原酶基因。BDO和4HB浓度以mM表示。

表48.不含有异源4-羟基丁酰基-CoA还原酶基因(即，pZS*13S)或表达来自在p100启动子控制下的pZS*质粒的4-羟基丁酰基-CoA还原酶基因1993的大肠杆菌宿主菌株4269的BDO和4-羟基丁酸酯(4HB)产生。1993的基因序列提供于所述表的底栏中。BDO和4HB浓度以mM表示。

实例XXX

在表达编码4-羟基丁醛还原酶的基因后4HB和BDO的产生

这个实例描述在表达编码4-羟基丁醛还原酶的基因后4hb和BDO的产生。

在大肠杆菌中从pZS*-13S质粒表达若干异源4-羟基丁醛还原酶基因(表49)以允许从琥珀酰基-CoA和α-酮戊二酸酯到1，4-丁二醇的功能途径。宿主菌株1889是基于构筑描述于上文和US20110045575中的菌株ECKh-432。显着修饰包括adhE、1dhA、pflB、mdh和arcA的缺失。菌株ECKh-432还含有以下基因的染色体整合拷贝：来自牙龈卟啉单胞菌的sucD(编码CoA依赖性琥珀酸半醛脱氢酶)、来自牛分枝杆菌的sucA(编码α-酮戊二酸脱羧酶)、来自牙龈卟啉单胞菌的4hbd(编码4-羟基丁酸脱氢酶)和来自克氏羧菌的4hbd(编码4-羟基丁酸脱氢酶)。菌株1889含有天然醇脱氢酶基因adhP、yqhD、yahK和yjgB的缺失。另外，菌株1889于attB基因座处含有从pA启动子表达的4-羟基丁酰基-CoA转移酶的染色体整合拷贝。表50显示，相对于表示为“pZS*13S”的对照，异源4-羟基丁醛还原酶基因的表达增强菌株1889中的BDO产生。使用先前所述的96孔板方案培养细胞。

表49.编码功能4-羟基丁醛还原酶的基因.

表50.含有若干替代4-羟基丁醛还原酶质粒构筑体的大肠杆菌宿主菌株1889的BDO和4-羟基丁酸酯(4HB)产生。仅表示为“pZS*13S-”的质粒构筑体不含有4-羟基丁醛还原酶基因，但表达4-羟基丁酰基-CoA还原酶基因。表示为pZS*13S-与之后一数字的质粒构筑体表达所述数字表示的4-羟基丁酰基-CoA还原酶与4-羟基丁醛还原酶基因二者。BDO和4HB浓度以mM表示。

在下文实例中，描述在宿主菌株中进行的其它遗传操纵以改良葡萄糖上的BDO的产率。缺失和过表达用关键基因示于图70中。

从TCA循环中间体α-酮戊二酸酯(AKG)开始，有两种方式将通量引导到BDO途径中。第一种方式包含α-酮酸脱羧酶，其将AKG脱羧成琥珀酸半醛且随后将其还原成4-羟基丁酸酯(4HB)。获得4HB的替代方式是经由将AKG转化成琥珀酰基-CoA的AKG脱氢酶。然后经由琥珀酸半醛脱氢酶将此还原成琥珀酸半醛且然后还原成4HB。然后可经由从乙酰基-CoA转移CoA的转移酶将4HB活化成4-羟基丁酰基-CoA(4-HBCoA)。经由醛脱氢酶(ALD)将4-HBCoA还原成4-羟基丁醛。使用醇脱氢酶(ADH)将所述醛最终还原成1，4-丁二醇(BDO)。

实例XXXI

磷酸烯醇丙酮酸羧化酶的过表达

这个实例描述磷酸烯醇丙酮酸酯(PEP)羧化酶的过表达。

ppc是指编码磷酸烯醇丙酮酸酯(PEP)羧化酶活性的基因。净反应涉及PEP和碳酸氢酯转变为草酰乙酸酯和磷酸酯。PEP羧化酶的过表达导致更多磷酸烯醇丙酮酸酯(PEP)转变为OAA，由此减少从PEP到丙酮酸酯且随后到乙酰基-CoA的通量。此导致到TCA循环中且因此到所述途径中的通量增加。此外，此过表达还减少乙醇形成酶可作用的细胞内乙酰基-CoA库，由此减少乙醇和乙酸酯的形成。对草酰乙酸酯通量增加还有助于减少丙酮酸酯和丙氨酸分泌。另外，草酰乙酸酯的利用率增加可降低细胞呼吸需要以及作为CO2的碳损失量。在质粒pZS*-13S上克隆基因ppc，如上文所述。

表51显示96孔板中从来自菌株3162的4个重复的BDO产生。如上文所述在pZS*上利用pA启动子过表达基因ppc(525号)且产生RBK变体5K。宿主菌株3162是基于构筑描述于上文和US20110045575中的菌株ECKh-432。显着修饰包括adhE、ldhA、pflB、mdh和arcA的缺失。菌株ECKh-432还含有以下基因的染色体整合拷贝：来自牙龈卟啉单胞菌的sucD(编码CoA依赖性琥珀酸半醛脱氢酶)、来自牛分枝杆菌的sucA(编码α-酮戊二酸脱羧酶)、来自牙龈卟啉单胞菌的4hbd(编码4-羟基丁酸脱氢酶)和来自克氏羧菌的4hbd(编码4-羟基丁酸脱氢酶)。菌株3162含有天然醇脱氢酶基因adhP、yqhD、yahK和yjgB的缺失。另外，菌株3162于attB基因座处含有从pA启动子表达的4-羟基丁酰基-CoA转移酶的染色体整合拷贝。其还具有细胞色素氧化酶cyoABCD和appBC的缺失。在pPSX23R质粒表达用于将4-羟基丁酰基-CoA转变为4-羟基丁醛且随后转移成1，4-丁二醇(BDO)的醛脱氢酶和醇脱氢酶基因。业已描述用于所述酶步骤的基因候选物。图71显示培养物的平均BDO和4HB且比较其与来自对照菌株3162的4个重复。在图72中对乙醇数量进行相同比较。在ppc过表达的细胞中观察到较高BDO和4HB。如所预计，见到较低乙醇数量。

表51.基因ppc在pZS*上过表达的产生4HB的4个重复在96孔板中24小时培养时间后的BDO、4-羟基丁酸酯(4HB)和乙醇数据。前4行显示对照培养物的一式两份数据。所有浓度都是以mM表示。

实例XXXII

α-酮戊二酸脱氢酶的过表达

这个实例描述α-酮戊二酸脱氢酶的过表达。

这种酶复合物是由大肠杆菌中的sucA、sucB和lpdA形成。其将α-酮戊二酸酯转变为琥珀酰基-CoA，随后将所述琥珀酰基-CoA引导到BDO途径中。这个途径的限制，包括α-酮戊二酸脱氢酶的能力的任何限制，可使得经由(例如)谷氨酸脱氢酶(gdhA)形成谷氨酸酯。此导致碳损失和产率降低。在产生BDO的菌株中表达额外拷贝的sucAB和lpdA有助于大量减少谷氨酸酯。其还可牵引通量经过TCA循环且有助于减少其它C2(乙醇和乙酸酯)和C3副产物(丙氨酸、丙酮酸酯)。在pA启动子下在pZS*质粒上克隆sucAB和lpdA，如上文所述。在pPSX23R上表达BDO产生所需的ALD和ADH，如前文所述。

表52显示菌株3933的4个重复在96孔板中在24小时培养时间后的4HB和BDO产生。宿主菌株3933是基于构筑描述于上文和US20110045575中的菌株ECKh-432。显着修饰包括adhE、ldhA、pflB、mdh和arcA的缺失。菌株ECKh-432还含有以下基因的染色体整合拷贝：来自牙龈卟啉单胞菌的sucD(编码CoA依赖性琥珀酸半醛脱氢酶)、来自牛分枝杆菌的sucA(编码α-酮戊二酸脱羧酶)、来自牙龈卟啉单胞菌的4hbd(编码4-羟基丁酸脱氢酶)和来自克氏羧菌的4hbd(编码4-羟基丁酸脱氢酶)。其含有天然醇脱氢酶基因adhP、yqhD、yahK和yjgB的缺失。所述菌株于attB基因座处含有从pA启动子表达的4-羟基丁酰基-CoA转移酶的染色体整合拷贝。其还具有细胞色素氧化酶cyoABCD和appBC的缺失，并且adh于hemN基因座处整合于在启动子p119控制下的染色体上。

表52.在质粒上过表达基因sucAB-lpdA的菌株3933的产生4HB的4个重复的BDO、4HB和乙醇数据。底部4行显示宿主菌株3933的对照培养物的一式两份数据。所有浓度都是以mM表示且是在96孔板中24小时培养时间后测量。1438是指天然sucA基因(b0726)，1439是指天然野生型sucB基因(b0727)，pZS*上的生物砖中的最一个基因是于前文实例XIV所述lpdA的突变形式(b0116)。此基因是大肠杆菌中的丙酮酸脱氢酶复合物的亚单元且已经修饰以使得丙酮酸脱氢酶不受NADH抑制。突变是如严等人，自然化学生物学7：445-452(2011))中所述进行。

宿主	质粒_1 1	OD	4HB	BDO	谷氨酸酯
						3933	pZS*13S_1438-1439-160D345K-lpdA-KP	2.91	6.27	35.00	0.03
3933	pZS*135_1438-1439-160D345K-IpdA-KP	2.89	6.37	33.50	0.03
						3933	pZS*13S_1438-1439-160D345K-IpdA-KP	2.94	6.52	32.40	0.04
3933	pZS*13S-1438-1439-160D345K-IpdA-KP	2.96	5.76	31.10	0.04
						3933	pZS*13S	3.06	6.44	38.30	2.68
3933	pZS*135	3.05	5.42	36.40	2.20
						3933	pZS*13S	3.22	5.36	36.40	2.21
3933	pZS*13S	3.12	4.95	35.00	2.08

图73显示相较于来自对照菌株的4个重复的对应平均值，来自在pZS*上过表达基因sucAB和突变lpdA的产生4HB的宿主菌株的4个重复的平均BDO和4HB数量。ALD和ADH是在质粒pPZSX23R上表达。图74显示来自基因sucAB和突变lpdA在pZS*上过表达且相较于那些来自对照者的菌株的4个重复的平均谷氨酸酯数量的降低。所述结果显示，sucAB的表达使所产生谷氨酸酯的量显着降低且不会不利地影响BDO或4HB的产生。

实例XXXIII

非磷酸转移酶糖吸收系统的过表达

这个实例描述作为非磷酸转移酶(PTS)糖吸收系统的代表的葡萄糖激酶galP和/或glf的过表达。

宿主菌株中葡萄糖吸收的主要模式是PTS系统。经由此系统转变为葡萄糖-6-磷酸酯(G6P)的每一葡萄糖分子都伴有一分子PEP转变为丙酮酸酯。注意，PEP经由菌株中的PEP羧化酶转变为草酰乙酸酯。另外，PEP还转变为丙酮酸酯(由PTS系统以及丙酮酸酯激酶)且随后由菌株中的丙酮酸脱氢酶转变为乙酰基-CoA。BDO途径形成每一摩尔BDO需要等摩尔量的草酰乙酸酯和乙酰基-CoA。与PTS系统相关的固定化学计量破坏此平衡，从而导致乙酰基-CoA相对于草酰乙酸酯的比率较高。然后这会导致细胞中产生乙醇和乙酸酯。非PTS模式的糖吸收的过表达有助于缓解此问题且平衡相较于乙酰基-CoA可用草酰乙酸酯的量，由此增加经过BDO途径的通量，减少C2副产物乙酸酯和乙醇，并且减少C3副产物丙酮酸酯和丙氨酸。

非PTS葡萄糖吸收的主要机制是经由用以输入糖的诸如galP等通透酶和随后其经由glk编码的激酶的依赖ATP的磷酸化。吸收葡萄糖的替代方式是经由葡萄糖促进剂glf。尽管大肠杆菌不具有此促进剂，但将其从运动发酵单胞菌克隆并引入大肠杆菌中(帕克(Parker)等人，分子微生物学15(5)：795-802(1995))。

实例XXXIV

γ-丁内酯酯酶的表达

这个实例描述γ-丁内酯酯酶的表达。

γ-丁内酯(GBL)是在糖到1，4-丁二醇(BDO)发酵期间形成的副产物。其是从不稳定途径中间体4-羟基丁酰基-CoA形成。在较小程度内，其还可通过4-羟基丁酸酯的自发内酯化形成。

羟酸和其相应内酯彼此以依赖pH的平衡存在。内酯化是由酸催化且在低pH下有利。在碱性条件下，平衡驱向开链羟基羧酸根阴离子。在通常为7.4的细胞质pH下，有利于GBL内酯水解(图75)。在具有GBL酯酶活性的酶存在下可加速GBL到4-HB的水解，由此改良产率并消除可使产物的下游分离变得复杂的副产物。

鉴别来自中间耶氏杆菌29909和根癌土壤杆菌菌株C58的酯酶(卡利耶等人，植物与微生物分子相互作用17(9)：951-957(2004))且选择其作为实例性酯酶基因。耶氏杆菌属基因(基因座yinte0001_13710)的核苷酸序列示于图89中(也参见基因库ZP_04636075.1；GI：238792441)。来自根癌土壤杆菌的基因的核苷酸序列示于图90中。所述基因还可命名为ahlK。另外实例性酯酶包括大肠杆菌KTE10的AttM(基因库ZP_19612688.1，GI：432369596)和非共生发光杆菌的attM(基因库YP_003039319.1GI：253987963)。

表53显示来自整合有酯酶且与无酯酶对照(菌株2237)比较的菌株(菌株2387)的4个重复的96孔板的BDO、4HB和GBL数据。宿主菌株2237是基于构筑描述于上文和US20110045575中的菌株ECKh-432。显着修饰包括adhE、ldhA、pflB、mdh和arcA的缺失。菌株ECKh-432还含有以下基因的染色体整合拷贝：来自牙龈卟啉单胞菌的sucD(编码CoA依赖性琥珀酸半醛脱氢酶)、来自牛分枝杆菌的sucA(编码α-酮戊二酸脱羧酶)、来自牙龈卟啉单胞菌的4hbd(编码4-羟基丁酸脱氢酶)和来自克氏羧菌的4hbd(编码4-羟基丁酸脱氢酶)。菌株2237含有天然醇脱氢酶基因adhP、yqhD、yahK和yjgB的缺失。其于attB基因座处含有从pA启动子表达的4-羟基丁酰基-CoA转移酶的染色体整合拷贝。还引入poxB中的另一缺失。

表53.来自整合有酯酶且与无酯酶对照(菌株2237)比较的菌株(菌株2387)的4个重复的96孔板的BDO、4HB和GBL数据。所有浓度都是以mM表示且是在19小时培养时间后测量。

宿主	OD	4HB	BDO	GBL
					2237	3.56	2.50	27.70	4.54
2237	3.43	2.54	32.20	5.00
					2237	3.37	2.44	27.10	4.34
2237	3.54	2.19	22.60	3.26
					2387	3.80	0.00	23.60	0.00
2387	3.87	2.59	24.70	0.65
					2387	4.00	2.62	27.70	0.59
2387	4.30	3.20	29.00	0.68

图76显示相较于来自对照菌株(2237)的4个重复的相应平均值，来自整合有酯酶的能够产生4-羟基丁酰基-CoA的宿主菌株(2387)的4个重复的平均BDO和4HB数量。图77显示相较于来自对照菌株(2237)的4个重复的相应平均值，来自整合有酯酶的宿主菌株(2387)的4个重复的平均GBL数量。整合有酯酶的菌株观察到较低GBL。所述结果证实具有γ-丁内酯酯酶活性的酶的表达，并且不会不利地影响BDO或4HB的产生。

实例XXXV

琥珀酰基-CoA合成酶的缺失

这个实例描述琥珀酰基-CoA合成酶的缺失。

琥珀酰基-CoA合成酶是由大肠杆菌中的sucCD编码。arcA缺失显着上调所述基因(和整个sdh-suc操纵子)在细胞中的表达。经过TCA循环的重复轮通量导致碳作为CO₂损失。sucCD缺失阻断琥珀酰基-CoA下游的TCA循环，从而将CO₂损失减少约70％且使BDO效价和产率相应增加。

在宿主菌株4070中引入sucCD缺失。此菌株是基于构筑描述于上文和US20110045575中的菌株ECKh-432。显着修饰包括adhE、ldhA、pflB、mdh和arcA的缺失。菌株ECKh-432还含有以下基因的染色体整合拷贝：来自牙龈卟啉单胞菌的sucD(编码CoA依赖性琥珀酸半醛脱氢酶)、来自牛分枝杆菌的sucA(编码α-酮戊二酸脱羧酶)、来自牙龈卟啉单胞菌的4hbd(编码4-羟基丁酸脱氢酶)和来自克氏羧菌的4hbd(编码4-羟基丁酸脱氢酶)。菌株4070含有天然醇脱氢酶基因adhP、yqhD、yahK和yjgB的缺失。另外，此菌株于attB基因座处含有从p119启动子表达的4-羟基丁酰基-CoA转移酶的染色体整合拷贝。其还具有细胞色素氧化酶cyoABCD和appBC的缺失。adh于hemN基因座处整合于在启动子p119控制下的染色体上。

表54.相较于无缺失对照(菌株4070)，来自缺失sucCD基因的4-HB产生菌株(菌株4269)的4个重复的96孔板的BDO和4HB数据。对于缺失sucCD的菌株观察到较高4HB。所有浓度都是以mM表示且是在24小时培养时间后测量。

宿主	质粒_1	OD	4HB	BDO

4070	pZS*13S-p100-ALD	3.62	0.289	37.2
					4070	pZS*3S-p100-ALD	3.58	0.777	41.4
4070	pZS*13S-p100-ALD	3.33	0.377	28.5
					4070	pZS*13S-p100-ALD	3.75	0.792	54.4
4269	pZS*13S-p100-ALD	2.95	8.93	50.5
					4269	pZS*13S-p100-ALD	2.68	8.07	50.5
4269	pZS*13S-p100-ALD	3.34	8.65	50.1
					4269	pZS*13S-p100-ALD	2.94	8.55	51.8

图78显示相较于来自4个对照菌株(4070)重复的相应平均值，来自缺失基因sucCD的4个宿主菌株(4269)重复的BDO和4HB平均数。所述结果证实，缺失sucCD使BDO和4HB的产率增加。

实例XXXVI

酰基辅酶A硫酯酶的缺失

这个实例描述酰基辅酶A硫酯酶ybgC和tesB的缺失。

BDO途径中的一种中间体是4-羟基丁酰基-CoA。这种化合物可自发地或以酶促方式获得环化而形成GBL(γ-丁酰基-内酯)。大肠杆菌具有一些据报道对C4到C6基团的CoA底物具有广泛底物特异性的可逆CoA硫酯酶。所述基因候选物的缺失消除约50％经由所述途径形成的GBL。所述活性可类似地在其它生物体中发现。

tesB和ybgC的缺失是在宿主菌株1136中进行。此菌株是基于构筑描述于上文和US20110045575中的菌株ECKh-432。显着修饰包括adhE、ldhA、pflB、mdh和arcA的缺失。菌株ECKh-432还含有以下基因的染色体整合拷贝：来自牙龈卟啉单胞菌的sucD(编码CoA依赖性琥珀酸半醛脱氢酶)、来自牛分枝杆菌的sucA(编码α-酮戊二酸脱羧酶)、来自牙龈卟啉单胞菌的4hbd(编码4-羟基丁酸脱氢酶)和来自克氏羧菌的4hbd(编码4-羟基丁酸脱氢酶)。菌株1136具有ndh(NADH脱氢酶II)和琥珀酸半醛脱氢酶编码基因sad和gabD的其它缺失。

表55.能够产生4-羟基丁酰基-CoA且缺乏tesB与ybgC二者且与不具有所述缺失的对照(宿主1136)相比的菌株(1197)的4个重复的OD、BDO、4HB和GBL数量。所有浓度都是以mM表示且是在20mL瓶中40小时培养时间后测量。

图80显示相较于来自对照菌株(1136)的3个重复的相应平均值，来自缺失基因ybgC和tesB的宿主菌株(1197)的3个重复的GBL平均数。所述结果证实，一或多个酰基辅酶A硫酯酶的缺失减少γ-丁内酯产生，增加BDO产生且对4HB的产生不具有不利影响。

实例XXXVII

用以阻止或减少回流到途径中的缺失

这个实例描述用以阻止回流到途径中的缺失。

在培养物中1，4-丁二醇(BDO)的高效价下，其开始再输入细胞中。在进入细胞内后，其经由TCA循环代谢。为了阻止此BDO回流到细胞中，使鉴别为反向流的候选物的醇脱氢酶缺失。通过两种方式鉴别候选物，首先，基于底物特异性列示并优先化所有醇脱氢酶。进行微阵列以测定其中的每一者表达程度有多高。基于此，从约35个adh候选物的列表生成5个候选物的短列表。之后，从在MM9培养基中在微好氧性下生长的菌株1427(去除由yqhD编码的醇脱氢酶且不存在下游途径，细胞累积4HB但不产生BDO)分离具有内源性回流活性(依赖NADP+的BDO转变为4-羟基丁醛)的蛋白质部分。在追踪到回流活性时，将试样纯化。所用策略概述于下文中。

基于早期实验，发现内源性ADH活性主要依赖NADPH且在高(＞35％)硫酸铵下盐析。使用微型流化床以15,000psi裂解来自在好氧性下生长过夜的2L LB制备物的1427细胞的新鲜试样。然后经由硫酸铵将试样分级分离。35％沉淀几乎不含有ADH活性且不进行进一步处理，而60％沉淀含有具有显着回流活性的活性ADH且对其继续进行进一步纯化。

阴离子交换纯化。将60％硫酸铵沉淀再悬浮于低盐缓冲液中并进行透析过夜以去除残余硫酸铵。将试样加载到5ml Q-琼脂糖管柱(强阴离子交换)上且经由缓慢增加的盐梯度洗脱。各部分的阴离子交换洗脱、回流活性以及SDS page的概况示于下文图81中。

示于左侧的第一个大峰超出正常范围且对应于不结合管柱的蛋白质。所述峰具有低回流活性。示于色谱图中间的下一个峰具有显着回流活性。对此峰运行SDS-PAGE且其指示需要进一步纯化以分离所关注蛋白质。

分子大小筛选色谱。汇集并浓缩来自阴离子交换的峰回流活性以允许施加到S200sephacryl分子大小筛选管柱。所述管柱从试样成功地去除杂质且结果示于下文(图82)。

分级管柱的结果指示，所关注蛋白质表达为中范围MW蛋白质，为约50kDa。然而，尚不清楚蛋白质的性质，但将其缩窄到凝胶上约20个条带。进行进一步色谱以尝试在质谱分析前提纯试样。

疏水性相互作用色谱。从分子大小筛选管柱汇集具有最高回流活性的峰并将其加载于苯基琼脂糖管柱(疏水性相互作用管柱)上。增加试样的离子强度以促进与树脂的结合。结果示于下文(图83)。

通过质谱分析示于SDS-PAGE上的试样以鉴别导致回流的蛋白质。从凝胶，在少量背景蛋白质(约5种)旁边存在5个显着条带。

通过质谱分析分析经纯化试样，并获得30种蛋白质的列表。在这个列表中所选基因是：

登录	名称	基因
			gi\|170083708	Zn依赖性/NAD(P)结合醇脱氢酶	yjgB

利用抗生蛋白链菌素标签克隆yjgB基因，使其表达并进行纯化，以表征其性质。如通过SDS-PAGE所分析的纯化结果示于图84中。蛋白质表达充分，并获得经纯化蛋白质的可接受的产率。在NADP+存在下进行以BDO作为底物进行的初始表征并确认稳健活性(参见图85)。

基于蛋白质分级分离和微阵列结果，选择4个基因且使其于彼此顶部缺失以从1872获得菌株1889。所述基因是yqhD(b3011；基因库NP_417484.1，GI：16130909)、yjgB(b4269；基因库NP_418690.4，GI：90111716)、yahK(b0325；基因库NP_414859.1，GI：16128310)和adhP(b1478；基因库NP_415995.4，GI：90111280)。

在菌株1872中引入所述4种醇脱氢酶的缺失。此菌株是基于构筑描述于上文和US20110045575中的菌株ECKh-432。显着修饰包括adhE、ldhA、pflB、mdh和arcA的缺失。菌株ECKh-432还含有以下基因的染色体整合拷贝：来自牙龈卟啉单胞菌的sucD(编码CoA依赖性琥珀酸半醛脱氢酶)、来自牛分枝杆菌的sucA(编码α-酮戊二酸脱羧酶)、来自牙龈卟啉单胞菌的4hbd(编码4-羟基丁酸脱氢酶)和来自克氏羧菌的4hbd(编码4-羟基丁酸脱氢酶)。菌株1872于attB基因座处含有从pA启动子表达的4-羟基丁酰基-CoA转移酶的染色体整合拷贝。

表56.缺失所有4种鉴别为携带回流的醇脱氢酶的菌株(1889)的4个重复相较于不具有所述缺失的对照(宿主1872)的OD、BDO、4HB和GBL数量。在F’上表达用于将4HB转变为4-羟基丁酰基-CoA的基因cat2，而在pZS*-13S上表达ALD和ADH，如上文已描述。所有浓度都是以mM表示且是在96孔板中24小时培养时间后测量。

宿主	OD	4HB	BDO	GBL
					1872	4.61	3.3	60.8	12.5
1872	6.09	3.6	90.2	15.3
					1872	5.88	3.1	84.4	17.3
1872	5.84	2.9	96.3	15.9
					1889	5.94	3.6	92.6	14.0
1889	6.59	3.3	88.9	13.1
					1889	6.59	3.3	82.4	13.4
1889	6.58	3.6	89.4	14.4

图86显示菌株1872对菌株1889的平均BDO、4HB和GBL数量。所述结果证实，减少回流的代谢修饰使BDO的产率增加且对4HB的产生不具有不利影响。

实例XXXVIII

用以改良氧化磷酸化的能量效率的缺失

这个实例描述用以改良氧化磷酸化的能量效率的缺失。

大肠杆菌的电子传递链具有将质子转位的能力不同的多种NADH脱氢酶和细胞色素氧化酶。例如，大肠杆菌中的NADH脱氢酶II是不与质子转位关联的NADH消耗系统(H+/2e-＝0)，而据报道，由nuo编码的NADH脱氢酶I对于每对电子转位4个质子。Ndh-II的主要作用是氧化NADH和将电子提供给呼吸链(尹等人，应用微生物学杂志99：1404-1412(2005))。NdhII对NADH的亲和力相对较低(林(Hayashi)等人，生物化学与生物物理学报977：62-69(1989))。已表明，NdhII可独立于能量生成起作用以调节NADH库且可能在细菌生成能量的能力超过要求时较为重要。已显示，ndh基因以下述方式受fhr基因产物阻抑：在高氧浓度的条件下表达最佳。因此，ndh的缺失将有助于改良细胞的能量效率。相似地，存在已知不转位任何质子且因此无助于ATP产生的若干其它NADH脱氢酶，例如，大肠杆菌中的wrbA、yieF和kefF。所述的同源物可在其它生物体中发现且可经消除以改良每单位耗氧的ATP产生。

宿主菌株879(用于ndh缺失的亲本菌株)是基于构筑描述于上文和US20110045575中的菌株ECKh-432。显着修饰包括adhE、ldhA、pflB、mdh和arcA的缺失。菌株ECKh-432还含有以下基因的染色体整合拷贝：来自牙龈卟啉单胞菌的sucD(编码CoA依赖性琥珀酸半醛脱氢酶)、来自牛分枝杆菌的sucA(编码α-酮戊二酸脱羧酶)、来自牙龈卟啉单胞菌的4hbd(编码4-羟基丁酸脱氢酶)和来自克氏羧菌的4hbd(编码4-羟基丁酸脱氢酶)。菌株879还具有琥珀酸半醛脱氢酶基因sad和gabD的缺失。

表57.相较于具有完整ndh的宿主菌株(879)的重复，缺失ndh的菌株的3个重复的BDO、4HB和GBL产生。如方案中所述在20mL瓶中进行实验。质粒pZS*上存在ALD和ADH以允许将4-HB CoA转变为4-HB醛且随后转变为BDO。所有浓度都是以mM表示且是在24小时培养时间后测量。

图87显示菌株956对菌株879的平均BDO、4HB和GBL数量。所述结果证实，改良氧化磷酸化的能量效率的缺失增加BDO的产率且对4HB产生不具有不利影响。

实例XXXIX

细胞色素氧化酶的缺失

这个实例描述细胞色素氧化酶的缺失。

在电子传递链的电子输出侧，存在多种具有不同节能效率的细胞色素氧化酶。由cyo操纵子编码的细胞色素bo复合物主动地泵送膜上的电子并产生4的H+/2e-化学计量。细胞色素bd-I复合物不会主动地泵送质子，但由于膜周质侧上醌醇的氧化和随后从膜的细胞质侧吸收质子(用于形成水)，因此净电子转移产生2的H+/2e-化学计量。这是由cyd操纵子编码。直到最近，仍不了解由appBC编码的细胞色素bd-II氧化酶的质子转位化学计量，但现已确定，此氧化酶可产生电(鲍里索夫(Borisov)等人，美国国家科学院院刊108：17320-17324(2011))。所述基因通常在进入静止期后或在匮乏碳和磷酸酯的条件下受到诱导(阿特朗(Atlung)等人，细菌学杂志179：2141-2146(1997))。

细胞色素氧化酶的性质和丰度：cyd操纵子是由fnr和arcA以依赖氧的方式调节且在微好氧性条件下表达最佳(卡尔霍恩(Calhoun)等人，细菌学杂志175：3020-3025(1993))。当大肠杆菌在高氧张力下生长时，bo-型氧化酶占优势。cyo操纵子还由arcA与fnr二者调节。文献研究指示，在好氧性生长细胞中，细胞色素o氧化酶以每个细胞约304个分子的量存在且细胞色素d氧化酶以每个细胞204个分子的量存在(箕原(Minohara)等人，生物科学与生物工程杂志93(5)：464-469(2002))。在厌氧性条件下，细胞色素d氧化酶占优势且以每个细胞约606个分子存在，这与每细胞的细胞色素o氧化酶仅2个分子不同。细胞色素bd氧化酶对O₂的Km远低于细胞色素bo氧化酶(箕原等人，见上文，2002)。前者具有10nM的Km，并且细胞色素bo氧化酶具有约1μM的Km。

表58.来自大肠杆菌的细胞色素-bd氧化酶的酶促特性(来自贝克(Bekker)等人，细菌学杂志191：5510-5517(2009))。

在尝试测定好氧性生长大肠杆菌中的P/O比率的研究(野口(Noguchi)等人，生物化学杂志136：509-515(2004))中，测定在标准进料和限制进料的葡萄糖下，NDH-1形成占优势的NADH脱氢酶。然而，发现细胞色素bd氧化酶以高于细胞色素bo氧化酶的浓度存在。下表阐释关于各种NADH脱氢酶和细胞色素氧化酶的发现。

表59.利用不同葡萄糖进料策略在好氧性生长条件下NADH脱氢酶和细胞色素氧化酶的浓度(来自野口等人，见上文，2004)。

缺失细胞色素氧化酶的效应：已报道恒化器研究用于理解缺乏电子传递链的不同组分的菌株在介于0.1/hr与0.7/hr的稀释速率之间的氧比消耗速率的比率(卡尔霍恩等人，见上文，1993)。局限于使用bd型氧化酶的菌株相较于那些仅使用细胞色素bo氧化酶者将氧消耗速率增加到1.45-1.13倍。缺失ndh与cyo二者的菌株相较于仅缺失ndh的菌株的氧消耗速率的比率在介于1.46与1.39之间。卡尔霍恩等人(见上文，1993)的作者推断，bd型氧化酶的效率低于bo型氧化酶，但仍偶合。

在另一研究中，已报道，含有细胞色素bo型和bd型末端氧化酶二者的大肠杆菌野生型细胞以4.5-4.9的H+/O比率泵送质子，但缺失细胞色素bo氧化酶的突变体显示3.5-4.1的比率且具有细胞色素bd氧化酶的突变体显示4.8-5.6的比率(箕原等人，见上文，2002)。缺乏cyo和cyd操纵子二者的突变体不能在好氧性条件下生长，但那些过表达细胞色素bo氧化酶者和那些过表达细胞色素bd氧化酶者与亲本W3110菌株一样生长。所述菌株中每一者的细胞产率与其H+/O比率成比例。有趣的是，缺失cydAB的菌株最初显示极差细胞产率。然而，在细胞色素bo氧化酶过表达后，细胞产率显着改良。作者箕原等人(见上文，2002)已假设，cyd突变菌株中的较低细胞产率可能归因于cyd突变体中的膜的高H+渗透性。其相信，缺乏高亲和力氧还原性细胞色素bd的突变细胞中细胞色素bo的量可能不足以在低浓度下还原氧分子，并且因此细胞膜会受到活性氧物种损害且变得可部分透过。可通过过表达细胞色素bo氧化酶来缓解此细胞应激(箕原等人，见上文，2002)。

表60.在稀释速率为0.15/hr的葡萄糖受限恒化器培养物中生长的各种大肠杆菌突变体的性质.圆括号内所示细胞色素是活性细胞色素氧化酶。所述菌株中的每一者还具有nuo缺失(来自贝克等人，见上文，2002)。

最近论文(贝克等人，细菌学杂志191：5510-5517(2009))研究了缺失细胞色素bd-II氧化酶的效应。缺乏细胞色素bd-II氧化酶的突变菌株的表型包括在葡萄糖过量条件下生长时的较小泛醌库。在葡萄糖受限恒化器条件下，此菌株还具有降低的氧通量。所述结果表明，细胞色素bd-II氧化酶显着地促成了总体呼吸电子通量。野生型大肠杆菌MG1655细胞的比呼吸速率比缺少appBC的突变菌株高约46％(8.7mmol/gDCW.hr对5.9mmol/gDCW.hr)。在稀释速率为0.2/hr的葡萄糖受限恒化器中测量所述比呼吸速率。为了改良细胞的能量效率，在菌株(宿主菌株2424)中敲除appBC，并且另外敲除cydAB(菌株2611)或cyoABCD(菌株2471)。下表显示用于在具有所述菌株中每一者的96孔板中产生C4代谢物的数据。缺失两种细胞色素氧化酶(由appBC和cyoABCD编码)和ndh的另一优点是其使得所述细胞相对于较大发酵器中的一系列氧转移速率稳健。由于cydAB具有固定的化学计量用于质子转位且nuo(NADH脱氢酶I)也是如此，因此P/O比率相当恒定且发酵器不同部分中的生物质比也是如此。

表61.菌株1889和2471的三个重复中的BDO、4HB和GBL产生。质粒pZS*上存在ALD和ADH以允许4-HB COA转变为4-HB醛且随后转变为BDO。所有浓度都是以mM表示且是在96孔板中24小时培养时间后测量。

宿主	OD	4HB	BDO	GBL
					1889	3.63	5.71	57.20	4.48
1889	3.05	5.65	50.60	3.49
					1889	3.40	4.14	51.90	3.90
1889	3.19	4.23	53.10	3.69
					2424	3.33	3.58	39.60	2.46
2424	3.03	4.93	46.00	2.86
					2424	2.61	2.89	44.30	2.19
2424	1.99	3.10	34.90	2.05
					2611	2.35	1.22	31.60	1.59
2611	1.84	0.61	17.70	0.84
					2611	2.16	0.54	22.60	O.91
2611	2.76	1.52	28.70	1.48
					2471	3.56	5.62	64.20	4.80
2471	2.96	5.73	53.30	2.75
					2471	3.07	5.39	42.80	2.67
2471	3.11	4.01	45.90	2.66

图88分别显示菌株1889(参见上文)、2424、26ll和247l的BDO、4HB和GBL平均数量。所述结果证实，细胞色素氧化酶的缺失导致appBC缺失，从而使BDO和4HB产生减少，但仍产生大量BDO和4HB二者，并且预计所述细胞展现可在按比例放大的发酵条件下有利的经改良能量效率。

本文所揭示的结果证实所需产物(例如4-HB、4-HBal、4-HBCOA、BDO或腐胺，特定来说BDO)的高产率。已证实，所述修饰增加BDO的产物产率。所述有益修饰(包括增加和降低酶表达)使CO₂损失降低，减少副产物(例如乙醇、乙酸酯、丙酮酸酯、丙氨酸、谷氨酸酯和GBL)形成。其它修饰减少从诸如BDO等所需产物到途径中间体或前体(例如TCA循环中的那些)的回流。已通过以下步骤进行其它改良：鉴别更有效地进行所需途径反应的酶和任选地使所述酶经过进化以生成具有经改良特性(例如转变为产物的底物、稳定性等增加)的变体。所述酶包括cat2、醛脱氢酶和醛脱氢酶，如本文所揭示。另外，已测试各种启动子来鉴别使基因更有效转录的启动子变体。另外，如本文所揭示，各种回流和副产物反应可降低所需途径中产物形成的效率。在一些情况下，如果途径酶的较高表达导致副产物形成增加，那么可通过降低途径酶的表达来增加产物产率。例如，已对醛脱氢酶观察到所述结果，其中较低表达减少乙醇产生，而不减少BDO产生。

在本申请案通篇内，已引用了各种出版物。所述出版物的揭示内容的全部内容(包括基因库和GI编号出版物)都以引用方式并入本申请案中，以便更全面地描述本发明所属的最新技术状态。尽管已参考上文提供的实例描述本发明，但应理解，可作出各种修改，这并不背离本发明的精神。

序列表

<110> 基诺麦迪卡公司

<120> 制造4-羟基丁酸酯、1,4-丁二醇和相关化合物的微生物和方法

<130> 871943-228191

<140>

<141>

<150> 61/655,429

<151> 2012-06-04

<160> 180

<170> PatentIn version 3.5

<210> 1

<211> 59

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 1

gacgaattcg ctagcaagag gagaagtcga catgtccaat tcactggccg tcgttttac 59

<210> 2

<211> 47

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 2

gaccctagga agctttctag agtcgaccta tgcggcatca gagcaga 47

<210> 3

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 3

atgtaccgca agttccgc 18

<210> 4

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 4

caatttgccg atgcccag 18

<210> 5

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 5

gctgaccact gaagactttg 20

<210> 6

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 6

gatcagggct tcggtgtag 19

<210> 7

<211> 27

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 7

ttggtgcggg ccaagcagga tctgctc 27

<210> 8

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 8

tcagccgaac gcctcgtcga ggatctcctg 30

<210> 9

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 9

tggccaacat aagttcacca ttcgggcaaa ac 32

<210> 10

<211> 29

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 10

tctcttcaac cagccattcg ttttgcccg 29

<210> 11

<211> 27

<212> DNA

<213> 丙酮丁醇梭菌

<400> 11

attaaagtta agtggaggaa tgttaac 27

<210> 12

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 12

acacgcggat ccaacgtccc gg 22

<210> 13

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 13

agcggctccg ctagccgctt atg 23

<210> 14

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 14

aagccgttgc tgcagctctt gagc 24

<210> 15

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 15

atctccggcg gtcggatccg tcg 23

<210> 16

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 16

aaagcggcta gccacgccgc 20

<210> 17

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 17

attacacgag gtacccaacg 20

<210> 18

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 18

atgctggcgt acaaaggtgt cc 22

<210> 19

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 19

ggacaccttt gtacgccagc at 22

<210> 20

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 20

atcgcctaca ctaaaccaga agtgg 25

<210> 21

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 21

ccacttctgg tttagtgtag gcgat 25

<210> 22

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 22

aggcagttcc ataggatggc 20

<210> 23

<211> 55

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 23

tgacatgtaa cacctacctt ctgtgcctgt gccagtggtt gctgtgatat agaag 55

<210> 24

<211> 48

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 24

ataataatac atatgaacca tgcgagttac gggcctataa gccaggcg 48

<210> 25

<211> 42

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 25

agtttttcga tatctgcatc agacaccggc acattgaaac gg 42

<210> 26

<211> 60

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 26

ctggcacagg cacagaaggt aggtgttaca tgtcagaacg tttacacaat gacgtggatc 60

<210> 27

<211> 49

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 27

agacaaatcg gttgccgttt gttaagccag gcgagatatg atctatatc 49

<210> 28

<211> 54

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 28

gagttttgat ttcagtactc atcatgtaac acctaccttc ttgctgtgat atag 54

<210> 29

<211> 54

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 29

ctatatcaca gcaagaaggt aggtgttaca tgatgagtac tgaaatcaaa actc 54

<210> 30

<211> 49

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 30

gatatagatc atatctcgcc tggcttaaca aacggcaacc gatttgtct 49

<210> 31

<211> 70

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成寡核苷酸

<400> 31

tattgtgcat acagatgaat ttttatgcaa acagtcagcc ctgaagaagg gtgtaggctg 60

gagctgcttc 70

<210> 32

<211> 70

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成寡核苷酸

<400> 32

caaaaaaccg gagtctgtgc tccggttttt tattatccgc taatcaatta catatgaata 60

tcctccttag 70

<210> 33

<211> 51

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 33

ataataatag aattcgtttg ctacctaaat tgccaactaa atcgaaacag g 51

<210> 34

<211> 47

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 34

tattattatg gtaccaatat catgcagcaa acggtgcaac attgccg 47

<210> 35

<211> 47

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 35

tgatctggaa gaattcatcg gctttaccac cgtcaaaaaa aacggcg 47

<210> 36

<211> 48

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 36

ataaaaccct gcagcggaaa cgaagtttta tccatttttg gttacctg 48

<210> 37

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 37

ggaagagagg ctggtaccca gaagccacag cagga 35

<210> 38

<211> 38

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 38

gtaatcactg cgtaagcgcc atgccccggc gttaattc 38

<210> 39

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 39

attgccgcgt tcctcctgct gtcga 25

<210> 40

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 40

cgacagcagg aggaacgcgg caat 24

<210> 41

<211> 75

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 41

gtttgcacgc tatagctgag gttgttgtct tccagcaacg taccgtatac aataggcgta 60

tcacgaggcc ctttc 75

<210> 42

<211> 70

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 42

gctacagcat gtcacacgat ctcaacggtc ggatgaccaa tctggctggt atgggaatta 60

gccatggtcc 70

<210> 43

<211> 73

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成寡核苷酸

<400> 43

tgtgagtgaa agtcacctgc cttaatatct caaaactcat cttcgggtga cgaaatatgg 60

cgtgactcga tac 73

<210> 44

<211> 70

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成寡核苷酸

<400> 44

tctgtatcag gctgaaaatc ttctctcatc cgccaaaaca gcttcggcgt taagatgcgc 60

gctcaaggac 70

<210> 45

<211> 20

<212> PRT

<213> 纤细裸藻

<400> 45

Met Thr Tyr Lys Ala Pro Val Lys Asp Val Lys Phe Leu Leu Asp Lys

1 5 10 15

Val Phe Lys Val

20

<210> 46

<211> 2036

<212> DNA

<213> 大肠杆菌

<400> 46

atgaacttac atgaatatca ggcaaaacaa ctttttgccc gctatggctt accagcaccg 60

gtgggttatg cctgtactac tccgcgcgaa gcagaagaag ccgcttcaaa aatcggtgcc 120

ggtccgtggg tagtgaaatg tcaggttcac gctggtggcc gcggtaaagc gggcggtgtg 180

aaagttgtaa acagcaaaga agacatccgt gcttttgcag aaaactggct gggcaagcgt 240

ctggtaacgt atcaaacaga tgccaatggc caaccggtta accagattct ggttgaagca 300

gcgaccgata tcgctaaaga gctgtatctc ggtgccgttg ttgaccgtag ttcccgtcgt 360

gtggtcttta tggcctccac cgaaggcggc gtggaaatcg aaaaagtggc ggaagaaact 420

ccgcacctga tccataaagt tgcgcttgat ccgctgactg gcccgatgcc gtatcaggga 480

cgcgagctgg cgttcaaact gggtctggaa ggtaaactgg ttcagcagtt caccaaaatc 540

ttcatgggcc tggcgaccat tttcctggag cgcgacctgg cgttgatcga aatcaacccg 600

ctggtcatca ccaaacaggg cgatctgatt tgcctcgacg gcaaactggg cgctgacggc 660

aacgcactgt tccgccagcc tgatctgcgc gaaatgcgtg accagtcgca ggaagatccg 720

cgtgaagcac aggctgcaca gtgggaactg aactacgttg cgctggacgg taacatcggt 780

tgtatggtta acggcgcagg tctggcgatg ggtacgatgg acatcgttaa actgcacggc 840

ggcgaaccgg ctaacttcct tgacgttggc ggcggcgcaa ccaaagaacg tgtaaccgaa 900

gcgttcaaaa tcatcctctc tgacgacaaa gtgaaagccg ttctggttaa catcttcggc 960

ggtatcgttc gttgcgacct gatcgctgac ggtatcatcg gcgcggtagc agaagtgggt 1020

gttaacgtac cggtcgtggt acgtctggaa ggtaacaacg ccgaactcgg cgcgaagaaa 1080

ctggctgaca gcggcctgaa tattattgca gcaaaaggtc tgacggatgc agctcagcag 1140

gttgttgccg cagtggaggg gaaataatgt ccattttaat cgataaaaac accaaggtta 1200

tctgccaggg ctttaccggt agccagggga ctttccactc agaacaggcc attgcatacg 1260

gcactaaaat ggttggcggc gtaaccccag gtaaaggcgg caccacccac ctcggcctgc 1320

cggtgttcaa caccgtgcgt gaagccgttg ctgccactgg cgctaccgct tctgttatct 1380

acgtaccagc accgttctgc aaagactcca ttctggaagc catcgacgca ggcatcaaac 1440

tgattatcac catcactgaa ggcatcccga cgctggatat gctgaccgtg aaagtgaagc 1500

tggatgaagc aggcgttcgt atgatcggcc cgaactgccc aggcgttatc actccgggtg 1560

aatgcaaaat cggtatccag cctggtcaca ttcacaaacc gggtaaagtg ggtatcgttt 1620

cccgttccgg tacactgacc tatgaagcgg ttaaacagac cacggattac ggtttcggtc 1680

agtcgacctg tgtcggtatc ggcggtgacc cgatcccggg ctctaacttt atcgacattc 1740

tcgaaatgtt cgaaaaagat ccgcagaccg aagcgatcgt gatgatcggt gagatcggcg 1800

gtagcgctga agaagaagca gctgcgtaca tcaaagagca cgttaccaag ccagttgtgg 1860

gttacatcgc tggtgtgact gcgccgaaag gcaaacgtat gggccacgcg ggtgccatca 1920

ttgccggtgg gaaagggact gcggatgaga aattcgctgc tctggaagcc gcaggcgtga 1980

aaaccgttcg cagcctggcg gatatcggtg aagcactgaa aactgttctg aaataa 2036

<210> 47

<211> 388

<212> PRT

<213> 大肠杆菌

<400> 47

Met Asn Leu His Glu Tyr Gln Ala Lys Gln Leu Phe Ala Arg Tyr Gly

1 5 10 15

Leu Pro Ala Pro Val Gly Tyr Ala Cys Thr Thr Pro Arg Glu Ala Glu

20 25 30

Glu Ala Ala Ser Lys Ile Gly Ala Gly Pro Trp Val Val Lys Cys Gln

35 40 45

Val His Ala Gly Gly Arg Gly Lys Ala Gly Gly Val Lys Val Val Asn

50 55 60

Ser Lys Glu Asp Ile Arg Ala Phe Ala Glu Asn Trp Leu Gly Lys Arg

65 70 75 80

Leu Val Thr Tyr Gln Thr Asp Ala Asn Gly Gln Pro Val Asn Gln Ile

85 90 95

Leu Val Glu Ala Ala Thr Asp Ile Ala Lys Glu Leu Tyr Leu Gly Ala

100 105 110

Val Val Asp Arg Ser Ser Arg Arg Val Val Phe Met Ala Ser Thr Glu

115 120 125

Gly Gly Val Glu Ile Glu Lys Val Ala Glu Glu Thr Pro His Leu Ile

130 135 140

His Lys Val Ala Leu Asp Pro Leu Thr Gly Pro Met Pro Tyr Gln Gly

145 150 155 160

Arg Glu Leu Ala Phe Lys Leu Gly Leu Glu Gly Lys Leu Val Gln Gln

165 170 175

Phe Thr Lys Ile Phe Met Gly Leu Ala Thr Ile Phe Leu Glu Arg Asp

180 185 190

Leu Ala Leu Ile Glu Ile Asn Pro Leu Val Ile Thr Lys Gln Gly Asp

195 200 205

Leu Ile Cys Leu Asp Gly Lys Leu Gly Ala Asp Gly Asn Ala Leu Phe

210 215 220

Arg Gln Pro Asp Leu Arg Glu Met Arg Asp Gln Ser Gln Glu Asp Pro

225 230 235 240

Arg Glu Ala Gln Ala Ala Gln Trp Glu Leu Asn Tyr Val Ala Leu Asp

245 250 255

Gly Asn Ile Gly Cys Met Val Asn Gly Ala Gly Leu Ala Met Gly Thr

260 265 270

Met Asp Ile Val Lys Leu His Gly Gly Glu Pro Ala Asn Phe Leu Asp

275 280 285

Val Gly Gly Gly Ala Thr Lys Glu Arg Val Thr Glu Ala Phe Lys Ile

290 295 300

Ile Leu Ser Asp Asp Lys Val Lys Ala Val Leu Val Asn Ile Phe Gly

305 310 315 320

Gly Ile Val Arg Cys Asp Leu Ile Ala Asp Gly Ile Ile Gly Ala Val

325 330 335

Ala Glu Val Gly Val Asn Val Pro Val Val Val Arg Leu Glu Gly Asn

340 345 350

Asn Ala Glu Leu Gly Ala Lys Lys Leu Ala Asp Ser Gly Leu Asn Ile

355 360 365

Ile Ala Ala Lys Gly Leu Thr Asp Ala Ala Gln Gln Val Val Ala Ala

370 375 380

Val Glu Gly Lys

385

<210> 48

<211> 289

<212> PRT

<213> 大肠杆菌

<400> 48

Met Ser Ile Leu Ile Asp Lys Asn Thr Lys Val Ile Cys Gln Gly Phe

1 5 10 15

Thr Gly Ser Gln Gly Thr Phe His Ser Glu Gln Ala Ile Ala Tyr Gly

20 25 30

Thr Lys Met Val Gly Gly Val Thr Pro Gly Lys Gly Gly Thr Thr His

35 40 45

Leu Gly Leu Pro Val Phe Asn Thr Val Arg Glu Ala Val Ala Ala Thr

50 55 60

Gly Ala Thr Ala Ser Val Ile Tyr Val Pro Ala Pro Phe Cys Lys Asp

65 70 75 80

Ser Ile Leu Glu Ala Ile Asp Ala Gly Ile Lys Leu Ile Ile Thr Ile

85 90 95

Thr Glu Gly Ile Pro Thr Leu Asp Met Leu Thr Val Lys Val Lys Leu

100 105 110

Asp Glu Ala Gly Val Arg Met Ile Gly Pro Asn Cys Pro Gly Val Ile

115 120 125

Thr Pro Gly Glu Cys Lys Ile Gly Ile Gln Pro Gly His Ile His Lys

130 135 140

Pro Gly Lys Val Gly Ile Val Ser Arg Ser Gly Thr Leu Thr Tyr Glu

145 150 155 160

Ala Val Lys Gln Thr Thr Asp Tyr Gly Phe Gly Gln Ser Thr Cys Val

165 170 175

Gly Ile Gly Gly Asp Pro Ile Pro Gly Ser Asn Phe Ile Asp Ile Leu

180 185 190

Glu Met Phe Glu Lys Asp Pro Gln Thr Glu Ala Ile Val Met Ile Gly

195 200 205

Glu Ile Gly Gly Ser Ala Glu Glu Glu Ala Ala Ala Tyr Ile Lys Glu

210 215 220

His Val Thr Lys Pro Val Val Gly Tyr Ile Ala Gly Val Thr Ala Pro

225 230 235 240

Lys Gly Lys Arg Met Gly His Ala Gly Ala Ile Ile Ala Gly Gly Lys

245 250 255

Gly Thr Ala Asp Glu Lys Phe Ala Ala Leu Glu Ala Ala Gly Val Lys

260 265 270

Thr Val Arg Ser Leu Ala Asp Ile Gly Glu Ala Leu Lys Thr Val Leu

275 280 285

Lys

<210> 49

<211> 3696

<212> DNA

<213> 牛分枝杆菌

<400> 49

atggccaaca taagttcacc attcgggcaa aacgaatggc tggttgaaga gatgtaccgc 60

aagttccgcg acgacccctc ctcggtcgat cccagctggc acgagttcct ggttgactac 120

agccccgaac ccacctccca accagctgcc gaaccaaccc gggttacctc gccactcgtt 180

gccgagcggg ccgctgcggc cgccccgcag gcacccccca agccggccga caccgcggcc 240

gcgggcaacg gcgtggtcgc cgcactggcc gccaaaactg ccgttccccc gccagccgaa 300

ggtgacgagg tagcggtgct gcgcggcgcc gccgcggccg tcgtcaagaa catgtccgcg 360

tcgttggagg tgccgacggc gaccagcgtc cgggcggtcc cggccaagct actgatcgac 420

aaccggatcg tcatcaacaa ccagttgaag cggacccgcg gcggcaagat ctcgttcacg 480

catttgctgg gctacgccct ggtgcaggcg gtgaagaaat tcccgaacat gaaccggcac 540

tacaccgaag tcgacggcaa gcccaccgcg gtcacgccgg cgcacaccaa tctcggcctg 600

gcgatcgacc tgcaaggcaa ggacgggaag cgttccctgg tggtggccgg catcaagcgg 660

tgcgagacca tgcgattcgc gcagttcgtc acggcctacg aagacatcgt acgccgggcc 720

cgcgacggca agctgaccac tgaagacttt gccggcgtga cgatttcgct gaccaatccc 780

ggaaccatcg gcaccgtgca ttcggtgccg cggctgatgc ccggccaggg cgccatcatc 840

ggcgtgggcg ccatggaata ccccgccgag tttcaaggcg ccagcgagga acgcatcgcc 900

gagctgggca tcggcaaatt gatcactttg acctccacct acgaccaccg catcatccag 960

ggcgcggaat cgggcgactt cctgcgcacc atccacgagt tgctgctctc ggatggcttc 1020

tgggacgagg tcttccgcga actgagcatc ccatatctgc cggtgcgctg gagcaccgac 1080

aaccccgact cgatcgtcga caagaacgct cgcgtcatga acttgatcgc ggcctaccgc 1140

aaccgcggcc atctgatggc cgataccgac ccgctgcggt tggacaaagc tcggttccgc 1200

agtcaccccg acctcgaagt gctgacccac ggcctgacgc tgtgggatct cgatcgggtg 1260

ttcaaggtcg acggctttgc cggtgcgcag tacaagaaac tgcgcgacgt gctgggcttg 1320

ctgcgcgatg cctactgccg ccacatcggc gtggagtacg cccatatcct cgaccccgaa 1380

caaaaggagt ggctcgaaca acgggtcgag accaagcacg tcaaacccac tgtggcccaa 1440

cagaaataca tcctcagcaa gctcaacgcc gccgaggcct ttgaaacgtt cctacagacc 1500

aagtacgtcg gccagaagcg gttctcgctg gaaggcgccg aaagcgtgat cccgatgatg 1560

gacgcggcga tcgaccagtg cgctgagcac ggcctcgacg aggtggtcat cgggatgccg 1620

caccggggcc ggctcaacgt gctggccaac atcgtcggca agccgtactc gcagatcttc 1680

accgagttcg agggcaacct gaatccgtcg caggcgcacg gctccggtga cgtcaagtac 1740

cacctgggcg ccaccgggct gtacctgcag atgttcggcg acaacgacat tcaggtgtcg 1800

ctgaccgcca acccgtcgca tctggaggcc gtcgacccgg tgctggaggg attggtgcgg 1860

gccaagcagg atctgctcga ccacggaagc atcgacagcg acggccaacg ggcgttctcg 1920

gtggtgccgc tgatgttgca tggcgatgcc gcgttcgccg gtcagggtgt ggtcgccgag 1980

acgctgaacc tggcgaatct gccgggctac cgcgtcggcg gcaccatcca catcatcgtc 2040

aacaaccaga tcggcttcac caccgcgccc gagtattcca ggtccagcga gtactgcacc 2100

gacgtcgcaa agatgatcgg ggcaccgatc tttcacgtca acggcgacga cccggaggcg 2160

tgtgtctggg tggcgcggtt ggcggtggac ttccgacaac ggttcaagaa ggacgtcgtc 2220

atcgacatgc tgtgctaccg ccgccgcggg cacaacgagg gtgacgaccc gtcgatgacc 2280

aacccctaca tgtacgacgt cgtcgacacc aagcgcgggg cccgcaaaag ctacaccgaa 2340

gccctgatcg gacgtggcga catctcgatg aaggaggccg aggacgcgct gcgcgactac 2400

cagggccagc tggaacgggt gttcaacgaa gtgcgcgagc tggagaagca cggtgtgcag 2460

ccgagcgagt cggtcgagtc cgaccagatg attcccgcgg ggctggccac tgcggtggac 2520

aagtcgctgc tggcccggat cggcgatgcg ttcctcgcct tgccgaacgg cttcaccgcg 2580

cacccgcgag tccaaccggt gctggagaag cgccgggaga tggcctatga aggcaagatc 2640

gactgggcct ttggcgagct gctggcgctg ggctcgctgg tggccgaagg caagctggtg 2700

cgcttgtcgg ggcaggacag ccgccgcggc accttctccc agcggcattc ggttctcatc 2760

gaccgccaca ctggcgagga gttcacacca ctgcagctgc tggcgaccaa ctccgacggc 2820

agcccgaccg gcggaaagtt cctggtctac gactcgccac tgtcggagta cgccgccgtc 2880

ggcttcgagt acggctacac tgtgggcaat ccggacgccg tggtgctctg ggaggcgcag 2940

ttcggcgact tcgtcaacgg cgcacagtcg atcatcgacg agttcatcag ctccggtgag 3000

gccaagtggg gccaattgtc caacgtcgtg ctgctgttac cgcacgggca cgaggggcag 3060

ggacccgacc acacttctgc ccggatcgaa cgcttcttgc agttgtgggc ggaaggttcg 3120

atgaccatcg cgatgccgtc gactccgtcg aactacttcc acctgctacg ccggcatgcc 3180

ctggacggca tccaacgccc gctgatcgtg ttcacgccca agtcgatgtt gcgtcacaag 3240

gccgccgtca gcgaaatcaa ggacttcacc gagatcaagt tccgctcagt gctggaggaa 3300

cccacctatg aggacggcat cggagaccgc aacaaggtca gccggatcct gctgaccagt 3360

ggcaagctgt attacgagct ggccgcccgc aaggccaagg acaaccgcaa tgacctcgcg 3420

atcgtgcggc ttgaacagct cgccccgctg cccaggcgtc gactgcgtga aacgctggac 3480

cgctacgaga acgtcaagga gttcttctgg gtccaagagg aaccggccaa ccagggtgcg 3540

tggccgcgat tcgggctcga actacccgag ctgctgcctg acaagttggc cgggatcaag 3600

cgaatctcgc gccgggcgat gtcagccccg tcgtcaggct cgtcgaaggt gcacgccgtc 3660

gaacagcagg agatcctcga cgaggcgttc ggctaa 3696

<210> 50

<211> 1231

<212> PRT

<213> 牛分枝杆菌

<400> 50

Met Ala Asn Ile Ser Ser Pro Phe Gly Gln Asn Glu Trp Leu Val Glu

1 5 10 15

Glu Met Tyr Arg Lys Phe Arg Asp Asp Pro Ser Ser Val Asp Pro Ser

20 25 30

Trp His Glu Phe Leu Val Asp Tyr Ser Pro Glu Pro Thr Ser Gln Pro

35 40 45

Ala Ala Glu Pro Thr Arg Val Thr Ser Pro Leu Val Ala Glu Arg Ala

50 55 60

Ala Ala Ala Ala Pro Gln Ala Pro Pro Lys Pro Ala Asp Thr Ala Ala

65 70 75 80

Ala Gly Asn Gly Val Val Ala Ala Leu Ala Ala Lys Thr Ala Val Pro

85 90 95

Pro Pro Ala Glu Gly Asp Glu Val Ala Val Leu Arg Gly Ala Ala Ala

100 105 110

Ala Val Val Lys Asn Met Ser Ala Ser Leu Glu Val Pro Thr Ala Thr

115 120 125

Ser Val Arg Ala Val Pro Ala Lys Leu Leu Ile Asp Asn Arg Ile Val

130 135 140

Ile Asn Asn Gln Leu Lys Arg Thr Arg Gly Gly Lys Ile Ser Phe Thr

145 150 155 160

His Leu Leu Gly Tyr Ala Leu Val Gln Ala Val Lys Lys Phe Pro Asn

165 170 175

Met Asn Arg His Tyr Thr Glu Val Asp Gly Lys Pro Thr Ala Val Thr

180 185 190

Pro Ala His Thr Asn Leu Gly Leu Ala Ile Asp Leu Gln Gly Lys Asp

195 200 205

Gly Lys Arg Ser Leu Val Val Ala Gly Ile Lys Arg Cys Glu Thr Met

210 215 220

Arg Phe Ala Gln Phe Val Thr Ala Tyr Glu Asp Ile Val Arg Arg Ala

225 230 235 240

Arg Asp Gly Lys Leu Thr Thr Glu Asp Phe Ala Gly Val Thr Ile Ser

245 250 255

Leu Thr Asn Pro Gly Thr Ile Gly Thr Val His Ser Val Pro Arg Leu

260 265 270

Met Pro Gly Gln Gly Ala Ile Ile Gly Val Gly Ala Met Glu Tyr Pro

275 280 285

Ala Glu Phe Gln Gly Ala Ser Glu Glu Arg Ile Ala Glu Leu Gly Ile

290 295 300

Gly Lys Leu Ile Thr Leu Thr Ser Thr Tyr Asp His Arg Ile Ile Gln

305 310 315 320

Gly Ala Glu Ser Gly Asp Phe Leu Arg Thr Ile His Glu Leu Leu Leu

325 330 335

Ser Asp Gly Phe Trp Asp Glu Val Phe Arg Glu Leu Ser Ile Pro Tyr

340 345 350

Leu Pro Val Arg Trp Ser Thr Asp Asn Pro Asp Ser Ile Val Asp Lys

355 360 365

Asn Ala Arg Val Met Asn Leu Ile Ala Ala Tyr Arg Asn Arg Gly His

370 375 380

Leu Met Ala Asp Thr Asp Pro Leu Arg Leu Asp Lys Ala Arg Phe Arg

385 390 395 400

Ser His Pro Asp Leu Glu Val Leu Thr His Gly Leu Thr Leu Trp Asp

405 410 415

Leu Asp Arg Val Phe Lys Val Asp Gly Phe Ala Gly Ala Gln Tyr Lys

420 425 430

Lys Leu Arg Asp Val Leu Gly Leu Leu Arg Asp Ala Tyr Cys Arg His

435 440 445

Ile Gly Val Glu Tyr Ala His Ile Leu Asp Pro Glu Gln Lys Glu Trp

450 455 460

Leu Glu Gln Arg Val Glu Thr Lys His Val Lys Pro Thr Val Ala Gln

465 470 475 480

Gln Lys Tyr Ile Leu Ser Lys Leu Asn Ala Ala Glu Ala Phe Glu Thr

485 490 495

Phe Leu Gln Thr Lys Tyr Val Gly Gln Lys Arg Phe Ser Leu Glu Gly

500 505 510

Ala Glu Ser Val Ile Pro Met Met Asp Ala Ala Ile Asp Gln Cys Ala

515 520 525

Glu His Gly Leu Asp Glu Val Val Ile Gly Met Pro His Arg Gly Arg

530 535 540

Leu Asn Val Leu Ala Asn Ile Val Gly Lys Pro Tyr Ser Gln Ile Phe

545 550 555 560

Thr Glu Phe Glu Gly Asn Leu Asn Pro Ser Gln Ala His Gly Ser Gly

565 570 575

Asp Val Lys Tyr His Leu Gly Ala Thr Gly Leu Tyr Leu Gln Met Phe

580 585 590

Gly Asp Asn Asp Ile Gln Val Ser Leu Thr Ala Asn Pro Ser His Leu

595 600 605

Glu Ala Val Asp Pro Val Leu Glu Gly Leu Val Arg Ala Lys Gln Asp

610 615 620

Leu Leu Asp His Gly Ser Ile Asp Ser Asp Gly Gln Arg Ala Phe Ser

625 630 635 640

Val Val Pro Leu Met Leu His Gly Asp Ala Ala Phe Ala Gly Gln Gly

645 650 655

Val Val Ala Glu Thr Leu Asn Leu Ala Asn Leu Pro Gly Tyr Arg Val

660 665 670

Gly Gly Thr Ile His Ile Ile Val Asn Asn Gln Ile Gly Phe Thr Thr

675 680 685

Ala Pro Glu Tyr Ser Arg Ser Ser Glu Tyr Cys Thr Asp Val Ala Lys

690 695 700

Met Ile Gly Ala Pro Ile Phe His Val Asn Gly Asp Asp Pro Glu Ala

705 710 715 720

Cys Val Trp Val Ala Arg Leu Ala Val Asp Phe Arg Gln Arg Phe Lys

725 730 735

Lys Asp Val Val Ile Asp Met Leu Cys Tyr Arg Arg Arg Gly His Asn

740 745 750

Glu Gly Asp Asp Pro Ser Met Thr Asn Pro Tyr Met Tyr Asp Val Val

755 760 765

Asp Thr Lys Arg Gly Ala Arg Lys Ser Tyr Thr Glu Ala Leu Ile Gly

770 775 780

Arg Gly Asp Ile Ser Met Lys Glu Ala Glu Asp Ala Leu Arg Asp Tyr

785 790 795 800

Gln Gly Gln Leu Glu Arg Val Phe Asn Glu Val Arg Glu Leu Glu Lys

805 810 815

His Gly Val Gln Pro Ser Glu Ser Val Glu Ser Asp Gln Met Ile Pro

820 825 830

Ala Gly Leu Ala Thr Ala Val Asp Lys Ser Leu Leu Ala Arg Ile Gly

835 840 845

Asp Ala Phe Leu Ala Leu Pro Asn Gly Phe Thr Ala His Pro Arg Val

850 855 860

Gln Pro Val Leu Glu Lys Arg Arg Glu Met Ala Tyr Glu Gly Lys Ile

865 870 875 880

Asp Trp Ala Phe Gly Glu Leu Leu Ala Leu Gly Ser Leu Val Ala Glu

885 890 895

Gly Lys Leu Val Arg Leu Ser Gly Gln Asp Ser Arg Arg Gly Thr Phe

900 905 910

Ser Gln Arg His Ser Val Leu Ile Asp Arg His Thr Gly Glu Glu Phe

915 920 925

Thr Pro Leu Gln Leu Leu Ala Thr Asn Ser Asp Gly Ser Pro Thr Gly

930 935 940

Gly Lys Phe Leu Val Tyr Asp Ser Pro Leu Ser Glu Tyr Ala Ala Val

945 950 955 960

Gly Phe Glu Tyr Gly Tyr Thr Val Gly Asn Pro Asp Ala Val Val Leu

965 970 975

Trp Glu Ala Gln Phe Gly Asp Phe Val Asn Gly Ala Gln Ser Ile Ile

980 985 990

Asp Glu Phe Ile Ser Ser Gly Glu Ala Lys Trp Gly Gln Leu Ser Asn

995 1000 1005

Val Val Leu Leu Leu Pro His Gly His Glu Gly Gln Gly Pro Asp

1010 1015 1020

His Thr Ser Ala Arg Ile Glu Arg Phe Leu Gln Leu Trp Ala Glu

1025 1030 1035

Gly Ser Met Thr Ile Ala Met Pro Ser Thr Pro Ser Asn Tyr Phe

1040 1045 1050

His Leu Leu Arg Arg His Ala Leu Asp Gly Ile Gln Arg Pro Leu

1055 1060 1065

Ile Val Phe Thr Pro Lys Ser Met Leu Arg His Lys Ala Ala Val

1070 1075 1080

Ser Glu Ile Lys Asp Phe Thr Glu Ile Lys Phe Arg Ser Val Leu

1085 1090 1095

Glu Glu Pro Thr Tyr Glu Asp Gly Ile Gly Asp Arg Asn Lys Val

1100 1105 1110

Ser Arg Ile Leu Leu Thr Ser Gly Lys Leu Tyr Tyr Glu Leu Ala

1115 1120 1125

Ala Arg Lys Ala Lys Asp Asn Arg Asn Asp Leu Ala Ile Val Arg

1130 1135 1140

Leu Glu Gln Leu Ala Pro Leu Pro Arg Arg Arg Leu Arg Glu Thr

1145 1150 1155

Leu Asp Arg Tyr Glu Asn Val Lys Glu Phe Phe Trp Val Gln Glu

1160 1165 1170

Glu Pro Ala Asn Gln Gly Ala Trp Pro Arg Phe Gly Leu Glu Leu

1175 1180 1185

Pro Glu Leu Leu Pro Asp Lys Leu Ala Gly Ile Lys Arg Ile Ser

1190 1195 1200

Arg Arg Ala Met Ser Ala Pro Ser Ser Gly Ser Ser Lys Val His

1205 1210 1215

Ala Val Glu Gln Gln Glu Ile Leu Asp Glu Ala Phe Gly

1220 1225 1230

<210> 51

<211> 1356

<212> DNA

<213> 牙龈卟啉单胞菌

<400> 51

atggaaatca aagaaatggt gagccttgca cgcaaggctc agaaggagta tcaagctacc 60

cataaccaag aagcagttga caacatttgc cgagctgcag caaaagttat ttatgaaaat 120

gcagctattc tggctcgcga agcagtagac gaaaccggca tgggcgttta cgaacacaaa 180

gtggccaaga atcaaggcaa atccaaaggt gtttggtaca acctccacaa taaaaaatcg 240

attggtatcc tcaatataga cgagcgtacc ggtatgatcg agattgcaaa gcctatcgga 300

gttgtaggag ccgtaacgcc gacgaccaac ccgatcgtta ctccgatgag caatatcatc 360

tttgctctta agacctgcaa tgccatcatt attgcccccc accccagatc caaaaaatgc 420

tctgcacacg cagttcgtct gatcaaagaa gctatcgctc cgttcaacgt accggaaggt 480

atggttcaga tcatcgaaga acccagcatc gagaagacgc aggaactcat gggcgccgta 540

gacgtagtag ttgctacggg tggtatgggc atggtgaagt ctgcatattc ttcaggaaag 600

ccttctttcg gtgttggagc cggtaacgtt caggtgatcg tggatagcaa catcgatttc 660

gaagctgctg cagaaaaaat catcaccggt cgtgctttcg acaacggtat catctgctca 720

ggcgaacaga gcatcatcta caacgaggct gacaaggaag cagttttcac agcattccgc 780

aaccacggtg catatttctg tgacgaagcc gaaggagatc gggctcgtgc agctatcttc 840

gaaaatggag ccatcgcgaa agatgtagta ggtcagagcg ttgccttcat tgccaagaaa 900

gcaaacatca atatccccga gggtacccgt attctcgttg ttgaagctcg cggcgtagga 960

gcagaagacg ttatctgtaa ggaaaagatg tgtcccgtaa tgtgcgccct cagctacaag 1020

cacttcgaag aaggtgtaga aatcgcacgt acgaacctcg ccaacgaagg taacggccac 1080

acctgtgcta tccactccaa caatcaggca cacatcatcc tcgcaggatc agagctgacg 1140

gtatctcgta tcgtagtgaa tgctccgagt gccactacag caggcggtca catccaaaac 1200

ggtcttgccg taaccaatac gctcggatgc ggatcatggg gtaataactc tatctccgag 1260

aacttcactt acaagcacct cctcaacatt tcacgcatcg caccgttgaa ttcaagcatt 1320

cacatccccg atgacaaaga aatctgggaa ctctaa 1356

<210> 52

<211> 451

<212> PRT

<213> 牙龈卟啉单胞菌

<400> 52

Met Glu Ile Lys Glu Met Val Ser Leu Ala Arg Lys Ala Gln Lys Glu

1 5 10 15

Tyr Gln Ala Thr His Asn Gln Glu Ala Val Asp Asn Ile Cys Arg Ala

20 25 30

Ala Ala Lys Val Ile Tyr Glu Asn Ala Ala Ile Leu Ala Arg Glu Ala

35 40 45

Val Asp Glu Thr Gly Met Gly Val Tyr Glu His Lys Val Ala Lys Asn

50 55 60

Gln Gly Lys Ser Lys Gly Val Trp Tyr Asn Leu His Asn Lys Lys Ser

65 70 75 80

Ile Gly Ile Leu Asn Ile Asp Glu Arg Thr Gly Met Ile Glu Ile Ala

85 90 95

Lys Pro Ile Gly Val Val Gly Ala Val Thr Pro Thr Thr Asn Pro Ile

100 105 110

Val Thr Pro Met Ser Asn Ile Ile Phe Ala Leu Lys Thr Cys Asn Ala

115 120 125

Ile Ile Ile Ala Pro His Pro Arg Ser Lys Lys Cys Ser Ala His Ala

130 135 140

Val Arg Leu Ile Lys Glu Ala Ile Ala Pro Phe Asn Val Pro Glu Gly

145 150 155 160

Met Val Gln Ile Ile Glu Glu Pro Ser Ile Glu Lys Thr Gln Glu Leu

165 170 175

Met Gly Ala Val Asp Val Val Val Ala Thr Gly Gly Met Gly Met Val

180 185 190

Lys Ser Ala Tyr Ser Ser Gly Lys Pro Ser Phe Gly Val Gly Ala Gly

195 200 205

Asn Val Gln Val Ile Val Asp Ser Asn Ile Asp Phe Glu Ala Ala Ala

210 215 220

Glu Lys Ile Ile Thr Gly Arg Ala Phe Asp Asn Gly Ile Ile Cys Ser

225 230 235 240

Gly Glu Gln Ser Ile Ile Tyr Asn Glu Ala Asp Lys Glu Ala Val Phe

245 250 255

Thr Ala Phe Arg Asn His Gly Ala Tyr Phe Cys Asp Glu Ala Glu Gly

260 265 270

Asp Arg Ala Arg Ala Ala Ile Phe Glu Asn Gly Ala Ile Ala Lys Asp

275 280 285

Val Val Gly Gln Ser Val Ala Phe Ile Ala Lys Lys Ala Asn Ile Asn

290 295 300

Ile Pro Glu Gly Thr Arg Ile Leu Val Val Glu Ala Arg Gly Val Gly

305 310 315 320

Ala Glu Asp Val Ile Cys Lys Glu Lys Met Cys Pro Val Met Cys Ala

325 330 335

Leu Ser Tyr Lys His Phe Glu Glu Gly Val Glu Ile Ala Arg Thr Asn

340 345 350

Leu Ala Asn Glu Gly Asn Gly His Thr Cys Ala Ile His Ser Asn Asn

355 360 365

Gln Ala His Ile Ile Leu Ala Gly Ser Glu Leu Thr Val Ser Arg Ile

370 375 380

Val Val Asn Ala Pro Ser Ala Thr Thr Ala Gly Gly His Ile Gln Asn

385 390 395 400

Gly Leu Ala Val Thr Asn Thr Leu Gly Cys Gly Ser Trp Gly Asn Asn

405 410 415

Ser Ile Ser Glu Asn Phe Thr Tyr Lys His Leu Leu Asn Ile Ser Arg

420 425 430

Ile Ala Pro Leu Asn Ser Ser Ile His Ile Pro Asp Asp Lys Glu Ile

435 440 445

Trp Glu Leu

450

<210> 53

<211> 1116

<212> DNA

<213> 牙龈卟啉单胞菌

<400> 53

atgcaacttt tcaaactcaa gagtgtaaca catcactttg acacttttgc agaatttgcc 60

aaggaattct gtcttggaga acgcgacttg gtaattacca acgagttcat ctatgaaccg 120

tatatgaagg catgccagct cccctgccat tttgttatgc aggagaaata tgggcaaggc 180

gagccttctg acgaaatgat gaataacatc ttggcagaca tccgtaatat ccagttcgac 240

cgcgtaatcg gtatcggagg aggtacggtt attgacatct ctaaactttt cgttctgaaa 300

ggattaaatg atgtactcga tgcattcgac cgcaaaatac ctcttatcaa agagaaagaa 360

ctgatcattg tgcccacaac atgcggaacg ggtagcgagg tgacgaacat ttctatcgca 420

gaaatcaaaa gccgtcacac caaaatggga ttggctgacg atgccattgt tgcagaccat 480

gccatcatca tacctgaact tctgaagagc ttgcctttcc acttctacgc atgcagtgca 540

atcgatgctc ttatccatgc catcgagtca tacgtatctc ctaaagccag tccatattct 600

cgtctgttca gtgaggcggc ttgggacatt atcctggaag tattcaagaa aatcgccgaa 660

cacggccctg aataccgctt cgaaaagctg ggagaaatga tcatggccag caactatgcc 720

ggtatagcct tcggaaatgc aggagtagga gccgtccacg cactatccta cccgttggga 780

ggcaactatc acgtgccgca tggagaagca aactatcagt tcttcacaga ggtattcaaa 840

gtataccaaa agaagaatcc tttcggctat atagtcgaac tcaactggaa gctctccaag 900

atactgaact gccagcccga atacgtatat ccgaagctgg atgaacttct cggatgcctt 960

cttaccaaga aacctttgca cgaatacggc atgaaggacg aagaggtaag aggctttgcg 1020

gaatcagtgc ttaagacaca gcaaagattg ctcgccaaca actacgtaga gcttactgta 1080

gatgagatcg aaggtatcta cagaagactc tactaa 1116

<210> 54

<211> 371

<212> PRT

<213> 牙龈卟啉单胞菌

<400> 54

Met Gln Leu Phe Lys Leu Lys Ser Val Thr His His Phe Asp Thr Phe

1 5 10 15

Ala Glu Phe Ala Lys Glu Phe Cys Leu Gly Glu Arg Asp Leu Val Ile

20 25 30

Thr Asn Glu Phe Ile Tyr Glu Pro Tyr Met Lys Ala Cys Gln Leu Pro

35 40 45

Cys His Phe Val Met Gln Glu Lys Tyr Gly Gln Gly Glu Pro Ser Asp

50 55 60

Glu Met Met Asn Asn Ile Leu Ala Asp Ile Arg Asn Ile Gln Phe Asp

65 70 75 80

Arg Val Ile Gly Ile Gly Gly Gly Thr Val Ile Asp Ile Ser Lys Leu

85 90 95

Phe Val Leu Lys Gly Leu Asn Asp Val Leu Asp Ala Phe Asp Arg Lys

100 105 110

Ile Pro Leu Ile Lys Glu Lys Glu Leu Ile Ile Val Pro Thr Thr Cys

115 120 125

Gly Thr Gly Ser Glu Val Thr Asn Ile Ser Ile Ala Glu Ile Lys Ser

130 135 140

Arg His Thr Lys Met Gly Leu Ala Asp Asp Ala Ile Val Ala Asp His

145 150 155 160

Ala Ile Ile Ile Pro Glu Leu Leu Lys Ser Leu Pro Phe His Phe Tyr

165 170 175

Ala Cys Ser Ala Ile Asp Ala Leu Ile His Ala Ile Glu Ser Tyr Val

180 185 190

Ser Pro Lys Ala Ser Pro Tyr Ser Arg Leu Phe Ser Glu Ala Ala Trp

195 200 205

Asp Ile Ile Leu Glu Val Phe Lys Lys Ile Ala Glu His Gly Pro Glu

210 215 220

Tyr Arg Phe Glu Lys Leu Gly Glu Met Ile Met Ala Ser Asn Tyr Ala

225 230 235 240

Gly Ile Ala Phe Gly Asn Ala Gly Val Gly Ala Val His Ala Leu Ser

245 250 255

Tyr Pro Leu Gly Gly Asn Tyr His Val Pro His Gly Glu Ala Asn Tyr

260 265 270

Gln Phe Phe Thr Glu Val Phe Lys Val Tyr Gln Lys Lys Asn Pro Phe

275 280 285

Gly Tyr Ile Val Glu Leu Asn Trp Lys Leu Ser Lys Ile Leu Asn Cys

290 295 300

Gln Pro Glu Tyr Val Tyr Pro Lys Leu Asp Glu Leu Leu Gly Cys Leu

305 310 315 320

Leu Thr Lys Lys Pro Leu His Glu Tyr Gly Met Lys Asp Glu Glu Val

325 330 335

Arg Gly Phe Ala Glu Ser Val Leu Lys Thr Gln Gln Arg Leu Leu Ala

340 345 350

Asn Asn Tyr Val Glu Leu Thr Val Asp Glu Ile Glu Gly Ile Tyr Arg

355 360 365

Arg Leu Tyr

370

<210> 55

<211> 1296

<212> DNA

<213> 牙龈卟啉单胞菌

<400> 55

atgaaagacg tattagcgga atatgcctcc cgaattgttt cggccgaaga agccgtaaaa 60

catatcaaaa atggagaacg ggtagctttg tcacatgctg ccggagttcc tcagagttgt 120

gttgatgcac tggtacaaca ggccgacctt ttccagaatg tcgaaattta tcacatgctt 180

tgtctcggcg aaggaaaata tatggcacct gaaatggccc ctcacttccg acacataacc 240

aattttgtag gtggtaattc tcgtaaagca gttgaggaaa atagagccga cttcattccg 300

gtattctttt atgaagtgcc atcaatgatt cgcaaagaca tccttcacat agatgtcgcc 360

atcgttcagc tttcaatgcc tgatgagaat ggttactgta gttttggagt atcttgcgat 420

tatagcaaac cggcagcaga aagcgctcat ttagttatag gggaaatcaa ccgtcaaatg 480

ccatatgtac atggcgacaa cttgattcac atatcgaagt tggattacat cgtgatggca 540

gactacccta tctattctct tgcaaagccc aaaatcggag aagtagaaga agctatcggg 600

cgtaattgtg ccgagcttat tgaagatggt gccacactcc aactcggtat cggcgcgatt 660

cctgatgcag ccctgttatt cctcaaggac aaaaaagatc tggggatcca taccgagatg 720

ttctccgatg gtgttgtcga attagttcgc agtggagtaa ttacaggaaa gaaaaagaca 780

cttcaccccg gaaagatggt cgcaaccttc ttaatgggaa gcgaagacgt atatcatttc 840

atcgacaaaa atcccgatgt agaactttat ccggtagatt acgtcaatga tccgcgagta 900

atcgctcaaa atgataatat ggtcagcatc aatagctgta tcgaaatcga tcttatggga 960

caagtcgtgt ccgaatgtat aggaagcaag caattcagcg gaaccggcgg tcaagtagat 1020

tatgttcgtg gagcagcatg gtctaaaaac ggcaaaagca tcatggcaat tccctcaaca 1080

gccaaaaacg gtactgcatc tcgaattgta cctataattg cagagggagc tgctgtaaca 1140

accctccgca acgaagtcga ttacgttgta accgaatacg gtatagcaca actcaaagga 1200

aagagtttgc gccagcgagc agaagctctt attgccatag cccacccgga tttcagagag 1260

gaactaacga aacatctccg caaacgtttc ggataa 1296

<210> 56

<211> 431

<212> PRT

<213> 牙龈卟啉单胞菌

<400> 56

Met Lys Asp Val Leu Ala Glu Tyr Ala Ser Arg Ile Val Ser Ala Glu

1 5 10 15

Glu Ala Val Lys His Ile Lys Asn Gly Glu Arg Val Ala Leu Ser His

20 25 30

Ala Ala Gly Val Pro Gln Ser Cys Val Asp Ala Leu Val Gln Gln Ala

35 40 45

Asp Leu Phe Gln Asn Val Glu Ile Tyr His Met Leu Cys Leu Gly Glu

50 55 60

Gly Lys Tyr Met Ala Pro Glu Met Ala Pro His Phe Arg His Ile Thr

65 70 75 80

Asn Phe Val Gly Gly Asn Ser Arg Lys Ala Val Glu Glu Asn Arg Ala

85 90 95

Asp Phe Ile Pro Val Phe Phe Tyr Glu Val Pro Ser Met Ile Arg Lys

100 105 110

Asp Ile Leu His Ile Asp Val Ala Ile Val Gln Leu Ser Met Pro Asp

115 120 125

Glu Asn Gly Tyr Cys Ser Phe Gly Val Ser Cys Asp Tyr Ser Lys Pro

130 135 140

Ala Ala Glu Ser Ala His Leu Val Ile Gly Glu Ile Asn Arg Gln Met

145 150 155 160

Pro Tyr Val His Gly Asp Asn Leu Ile His Ile Ser Lys Leu Asp Tyr

165 170 175

Ile Val Met Ala Asp Tyr Pro Ile Tyr Ser Leu Ala Lys Pro Lys Ile

180 185 190

Gly Glu Val Glu Glu Ala Ile Gly Arg Asn Cys Ala Glu Leu Ile Glu

195 200 205

Asp Gly Ala Thr Leu Gln Leu Gly Ile Gly Ala Ile Pro Asp Ala Ala

210 215 220

Leu Leu Phe Leu Lys Asp Lys Lys Asp Leu Gly Ile His Thr Glu Met

225 230 235 240

Phe Ser Asp Gly Val Val Glu Leu Val Arg Ser Gly Val Ile Thr Gly

245 250 255

Lys Lys Lys Thr Leu His Pro Gly Lys Met Val Ala Thr Phe Leu Met

260 265 270

Gly Ser Glu Asp Val Tyr His Phe Ile Asp Lys Asn Pro Asp Val Glu

275 280 285

Leu Tyr Pro Val Asp Tyr Val Asn Asp Pro Arg Val Ile Ala Gln Asn

290 295 300

Asp Asn Met Val Ser Ile Asn Ser Cys Ile Glu Ile Asp Leu Met Gly

305 310 315 320

Gln Val Val Ser Glu Cys Ile Gly Ser Lys Gln Phe Ser Gly Thr Gly

325 330 335

Gly Gln Val Asp Tyr Val Arg Gly Ala Ala Trp Ser Lys Asn Gly Lys

340 345 350

Ser Ile Met Ala Ile Pro Ser Thr Ala Lys Asn Gly Thr Ala Ser Arg

355 360 365

Ile Val Pro Ile Ile Ala Glu Gly Ala Ala Val Thr Thr Leu Arg Asn

370 375 380

Glu Val Asp Tyr Val Val Thr Glu Tyr Gly Ile Ala Gln Leu Lys Gly

385 390 395 400

Lys Ser Leu Arg Gln Arg Ala Glu Ala Leu Ile Ala Ile Ala His Pro

405 410 415

Asp Phe Arg Glu Glu Leu Thr Lys His Leu Arg Lys Arg Phe Gly

420 425 430

<210> 57

<211> 906

<212> DNA

<213> 丙酮丁醇梭菌

<400> 57

atgattaaga gttttaatga aattatcatg aaggtaaaga gcaaagaaat gaaaaaagtt 60

gctgttgctg tagcacaaga cgagccagta cttgaagcag taagagatgc taagaaaaat 120

ggtattgcag atgctattct tgttggagac catgacgaaa tcgtgtcaat cgcgcttaaa 180

ataggaatgg atgtaaatga ttttgaaata gtaaacgagc ctaacgttaa gaaagctgct 240

ttaaaggcag tagagcttgt atcaactgga aaagctgata tggtaatgaa gggacttgta 300

aatacagcaa ctttcttaag atctgtatta aacaaagaag ttggacttag aacaggaaaa 360

actatgtctc acgttgcagt atttgaaact gagaaatttg atagactatt atttttaaca 420

gatgttgctt tcaatactta tcctgaatta aaggaaaaaa ttgatatagt aaacaattca 480

gttaaggttg cacatgcaat aggaattgaa aatccaaagg ttgctccaat ttgtgcagtt 540

gaggttataa accctaaaat gccatcaaca cttgatgcag caatgctttc aaaaatgagt 600

gacagaggac aaattaaagg ttgtgtagtt gacggacctt tagcacttga tatagcttta 660

tcagaagaag cagcacatca taagggagta acaggagaag ttgctggaaa agctgatatc 720

ttcttaatgc caaacataga aacaggaaat gtaatgtata agactttaac atatacaact 780

gattcaaaaa atggaggaat cttagttgga acttctgcac cagttgtttt aacttcaaga 840

gctgacagcc atgaaacaaa aatgaactct atagcacttg cagctttagt tgcaggcaat 900

aaataa 906

<210> 58

<211> 301

<212> PRT

<213> 丙酮丁醇梭菌

<400> 58

Met Ile Lys Ser Phe Asn Glu Ile Ile Met Lys Val Lys Ser Lys Glu

1 5 10 15

Met Lys Lys Val Ala Val Ala Val Ala Gln Asp Glu Pro Val Leu Glu

20 25 30

Ala Val Arg Asp Ala Lys Lys Asn Gly Ile Ala Asp Ala Ile Leu Val

35 40 45

Gly Asp His Asp Glu Ile Val Ser Ile Ala Leu Lys Ile Gly Met Asp

50 55 60

Val Asn Asp Phe Glu Ile Val Asn Glu Pro Asn Val Lys Lys Ala Ala

65 70 75 80

Leu Lys Ala Val Glu Leu Val Ser Thr Gly Lys Ala Asp Met Val Met

85 90 95

Lys Gly Leu Val Asn Thr Ala Thr Phe Leu Arg Ser Val Leu Asn Lys

100 105 110

Glu Val Gly Leu Arg Thr Gly Lys Thr Met Ser His Val Ala Val Phe

115 120 125

Glu Thr Glu Lys Phe Asp Arg Leu Leu Phe Leu Thr Asp Val Ala Phe

130 135 140

Asn Thr Tyr Pro Glu Leu Lys Glu Lys Ile Asp Ile Val Asn Asn Ser

145 150 155 160

Val Lys Val Ala His Ala Ile Gly Ile Glu Asn Pro Lys Val Ala Pro

165 170 175

Ile Cys Ala Val Glu Val Ile Asn Pro Lys Met Pro Ser Thr Leu Asp

180 185 190

Ala Ala Met Leu Ser Lys Met Ser Asp Arg Gly Gln Ile Lys Gly Cys

195 200 205

Val Val Asp Gly Pro Leu Ala Leu Asp Ile Ala Leu Ser Glu Glu Ala

210 215 220

Ala His His Lys Gly Val Thr Gly Glu Val Ala Gly Lys Ala Asp Ile

225 230 235 240

Phe Leu Met Pro Asn Ile Glu Thr Gly Asn Val Met Tyr Lys Thr Leu

245 250 255

Thr Tyr Thr Thr Asp Ser Lys Asn Gly Gly Ile Leu Val Gly Thr Ser

260 265 270

Ala Pro Val Val Leu Thr Ser Arg Ala Asp Ser His Glu Thr Lys Met

275 280 285

Asn Ser Ile Ala Leu Ala Ala Leu Val Ala Gly Asn Lys

290 295 300

<210> 59

<211> 1068

<212> DNA

<213> 丙酮丁醇梭菌

<400> 59

atgtatagat tactaataat caatcctggc tcgacctcaa ctaaaattgg tatttatgac 60

gatgaaaaag agatatttga gaagacttta agacattcag ctgaagagat agaaaaatat 120

aacactatat ttgatcaatt tcaattcaga aagaatgtaa ttttagatgc gttaaaagaa 180

gcaaacatag aagtaagttc tttaaatgct gtagttggaa gaggcggact cttaaagcca 240

atagtaagtg gaacttatgc agtaaatcaa aaaatgcttg aagaccttaa agtaggagtt 300

caaggtcagc atgcgtcaaa tcttggtgga attattgcaa atgaaatagc aaaagaaata 360

aatgttccag catacatagt tgatccagtt gttgtggatg agcttgatga agtttcaaga 420

atatcaggaa tggctgacat tccaagaaaa agtatattcc atgcattaaa tcaaaaagca 480

gttgctagaa gatatgcaaa agaagttgga aaaaaatacg aagatcttaa tttaatcgta 540

gtccacatgg gtggaggtac ttcagtaggt actcataaag atggtagagt aatagaagtt 600

aataatacac ttgatggaga aggtccattc tcaccagaaa gaagtggtgg agttccaata 660

ggagatcttg taagattgtg cttcagcaac aaatatactt atgaagaagt aatgaaaaag 720

ataaacggca aaggcggagt tgttagttac ttaaatacta tcgattttaa ggctgtagtt 780

gataaagctc ttgaaggaga taagaaatgt gcacttatat atgaagcttt cacattccag 840

gtagcaaaag agataggaaa atgttcaacc gttttaaaag gaaatgtaga tgcaataatc 900

ttaacaggcg gaattgcgta caacgagcat gtatgtaatg ccatagagga tagagtaaaa 960

ttcatagcac ctgtagttag atatggtgga gaagatgaac ttcttgcact tgcagaaggt 1020

ggacttagag ttttaagagg agaagaaaaa gctaaggaat acaaataa 1068

<210> 60

<211> 355

<212> PRT

<213> 丙酮丁醇梭菌

<400> 60

Met Tyr Arg Leu Leu Ile Ile Asn Pro Gly Ser Thr Ser Thr Lys Ile

1 5 10 15

Gly Ile Tyr Asp Asp Glu Lys Glu Ile Phe Glu Lys Thr Leu Arg His

20 25 30

Ser Ala Glu Glu Ile Glu Lys Tyr Asn Thr Ile Phe Asp Gln Phe Gln

35 40 45

Phe Arg Lys Asn Val Ile Leu Asp Ala Leu Lys Glu Ala Asn Ile Glu

50 55 60

Val Ser Ser Leu Asn Ala Val Val Gly Arg Gly Gly Leu Leu Lys Pro

65 70 75 80

Ile Val Ser Gly Thr Tyr Ala Val Asn Gln Lys Met Leu Glu Asp Leu

85 90 95

Lys Val Gly Val Gln Gly Gln His Ala Ser Asn Leu Gly Gly Ile Ile

100 105 110

Ala Asn Glu Ile Ala Lys Glu Ile Asn Val Pro Ala Tyr Ile Val Asp

115 120 125

Pro Val Val Val Asp Glu Leu Asp Glu Val Ser Arg Ile Ser Gly Met

130 135 140

Ala Asp Ile Pro Arg Lys Ser Ile Phe His Ala Leu Asn Gln Lys Ala

145 150 155 160

Val Ala Arg Arg Tyr Ala Lys Glu Val Gly Lys Lys Tyr Glu Asp Leu

165 170 175

Asn Leu Ile Val Val His Met Gly Gly Gly Thr Ser Val Gly Thr His

180 185 190

Lys Asp Gly Arg Val Ile Glu Val Asn Asn Thr Leu Asp Gly Glu Gly

195 200 205

Pro Phe Ser Pro Glu Arg Ser Gly Gly Val Pro Ile Gly Asp Leu Val

210 215 220

Arg Leu Cys Phe Ser Asn Lys Tyr Thr Tyr Glu Glu Val Met Lys Lys

225 230 235 240

Ile Asn Gly Lys Gly Gly Val Val Ser Tyr Leu Asn Thr Ile Asp Phe

245 250 255

Lys Ala Val Val Asp Lys Ala Leu Glu Gly Asp Lys Lys Cys Ala Leu

260 265 270

Ile Tyr Glu Ala Phe Thr Phe Gln Val Ala Lys Glu Ile Gly Lys Cys

275 280 285

Ser Thr Val Leu Lys Gly Asn Val Asp Ala Ile Ile Leu Thr Gly Gly

290 295 300

Ile Ala Tyr Asn Glu His Val Cys Asn Ala Ile Glu Asp Arg Val Lys

305 310 315 320

Phe Ile Ala Pro Val Val Arg Tyr Gly Gly Glu Asp Glu Leu Leu Ala

325 330 335

Leu Ala Glu Gly Gly Leu Arg Val Leu Arg Gly Glu Glu Lys Ala Lys

340 345 350

Glu Tyr Lys

355

<210> 61

<211> 906

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成多核苷酸

<400> 61

atgattaaga gttttaatga aattatcatg aaggtaaaga gcaaagaaat gaaaaaagtt 60

gctgttgctg tagcacaaga cgagccagta cttgaagcag tacgcgatgc taagaaaaat 120

ggtattgcag atgctattct tgttggcgac catgacgaaa tcgtgtcaat cgcgcttaaa 180

ataggcatgg atgtaaatga ttttgaaata gtaaacgagc ctaacgttaa gaaagctgct 240

ttaaaggcag tagagctggt atcaactgga aaagctgata tggtaatgaa gggacttgta 300

aatacagcaa ctttcttacg ctctgtatta aacaaagaag ttggactgag aacaggaaaa 360

actatgtctc acgttgcagt atttgaaact gagaaatttg atcgtctgtt atttttaaca 420

gatgttgctt tcaatactta tcctgaatta aaggaaaaaa ttgatatcgt aaacaattca 480

gttaaggttg cacatgcaat aggtattgaa aatccaaagg ttgctccaat ttgtgcagtt 540

gaggttataa accctaaaat gccatcaaca cttgatgcag caatgctttc aaaaatgagt 600

gacagaggac aaattaaagg ttgtgtagtt gacggaccgt tagcacttga tatcgcttta 660

tcagaagaag cagcacatca taagggcgta acaggagaag ttgctggaaa agctgatatc 720

ttcttaatgc caaacattga aacaggaaat gtaatgtata agactttaac atatacaact 780

gatagcaaaa atggcggaat cttagttgga acttctgcac cagttgtttt aacttcacgc 840

gctgacagcc atgaaacaaa aatgaactct attgcacttg cagctttagt tgcaggcaat 900

aaataa 906

<210> 62

<211> 906

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成多核苷酸

<400> 62

atgattaaga gttttaatga aattatcatg aaggtaaaga gcaaagaaat gaaaaaagtt 60

gctgttgctg tagcacaaga cgagccagta cttgaagcag tacgcgatgc taagaaaaat 120

ggtattgccg atgctattct ggttggcgac catgacgaaa tcgtgtctat cgcgctgaaa 180

ataggcatgg atgtaaatga ttttgaaatt gttaacgagc ctaacgttaa gaaagctgcg 240

ttaaaggcag tagagctggt atcaactgga aaagctgata tggtaatgaa gggactggta 300

aataccgcaa ctttcttacg ctctgtatta aacaaagaag ttggtctgcg tacaggaaaa 360

accatgtctc acgttgcagt atttgaaact gagaaatttg atcgtctgtt atttttaaca 420

gatgttgctt tcaatactta tcctgaatta aaggaaaaaa ttgatatcgt taacaatagc 480

gttaaggttg cacatgccat tggtattgaa aatccaaagg ttgctccaat ttgtgcagtt 540

gaggttatta acccgaaaat gccatcaaca cttgatgcag caatgctttc aaaaatgagt 600

gaccgcggac aaattaaagg ttgtgtagtt gacggaccgc tggcacttga tatcgcttta 660

tcagaagaag cagcacatca taaaggcgta acaggagaag ttgctggaaa agctgatatc 720

ttcttaatgc caaacattga aacaggaaat gtaatgtata agacgttaac ctataccact 780

gatagcaaaa atggcggcat cctggttgga acttctgcac cagttgtttt aacttcacgc 840

gctgacagcc atgaaacaaa aatgaactct attgcactgg cagcgctggt tgcaggcaat 900

aaataa 906

<210> 63

<211> 906

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成多核苷酸

<400> 63

atgattaaga gttttaatga aattatcatg aaggtaaaga gcaaagaaat gaaaaaagtt 60

gctgttgctg ttgcacaaga cgagccggta ctggaagcgg tacgcgatgc taagaaaaat 120

ggtattgccg atgctattct ggttggcgac catgacgaaa tcgtctctat cgcgctgaaa 180

attggcatgg atgttaatga ttttgaaatt gttaacgagc ctaacgttaa gaaagctgcg 240

ctgaaggcgg tagagctggt ttccaccgga aaagctgata tggtaatgaa agggctggtg 300

aataccgcaa ctttcttacg cagcgtactg aacaaagaag ttggtctgcg taccggaaaa 360

accatgagtc acgttgcggt atttgaaact gagaaatttg atcgtctgct gtttctgacc 420

gatgttgctt tcaatactta tcctgaatta aaagaaaaaa ttgatatcgt taacaatagc 480

gttaaggttg cgcatgccat tggtattgaa aatccaaagg ttgctccaat ttgtgcagtt 540

gaggttatta acccgaaaat gccatcaaca cttgatgccg caatgcttag caaaatgagt 600

gaccgcggac aaattaaagg ttgtgtggtt gacggcccgc tggcactgga tatcgcgtta 660

agcgaagaag cggcacatca taaaggcgta accggcgaag ttgctggaaa agctgatatc 720

ttcctgatgc caaacattga aacaggcaat gtaatgtata aaacgttaac ctataccact 780

gatagcaaaa atggcggcat cctggttgga acttctgcac cagttgtttt aacctcacgc 840

gctgacagcc atgaaaccaa aatgaacagc attgcactgg cagcgctggt tgcaggcaat 900

aaataa 906

<210> 64

<211> 906

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成多核苷酸

<400> 64

atgattaaaa gttttaacga aattatcatg aaagtgaaaa gcaaagagat gaaaaaagtg 60

gcggttgcgg ttgcgcagga tgaaccggtg ctggaagcgg tgcgcgatgc caaaaaaaac 120

ggtattgccg atgccattct ggtgggcgat cacgatgaaa ttgtctctat tgcgctgaaa 180

attggcatgg atgttaacga ttttgaaatt gttaatgaac cgaacgtgaa aaaagcggcg 240

ctgaaagcgg ttgaactggt ttccaccggt aaagccgata tggtgatgaa agggctggtg 300

aataccgcaa ccttcctgcg cagcgtgctg aataaagaag tgggtctgcg taccggtaaa 360

accatgagtc atgttgcggt gtttgaaacc gaaaaatttg accgtctgct gtttctgacc 420

gatgttgcgt ttaataccta tccggaactg aaagagaaaa ttgatatcgt taataacagc 480

gtgaaagtgg cgcatgccat tggtattgaa aacccgaaag tggcgccgat ttgcgcggtt 540

gaagtgatta acccgaaaat gccgtcaacg ctggatgccg cgatgctcag caaaatgagc 600

gatcgcggtc aaatcaaagg ctgtgtggtt gatggcccgc tggcgctgga tatcgcgctt 660

agcgaagaag cggcgcatca taaaggcgtg accggcgaag tggccggtaa agccgatatt 720

ttcctgatgc cgaatattga aaccggcaac gtgatgtata aaacgctgac ctataccacc 780

gacagcaaaa acggcggcat tctggtgggt accagcgcgc cggtggtgct gacctcgcgc 840

gccgacagcc atgaaaccaa aatgaacagc attgcgctgg cggcgctggt ggccggtaat 900

aaataa 906

<210> 65

<211> 1068

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成多核苷酸

<400> 65

atgtatcgtt tactgattat caatcctggc tcgacctcaa ctaaaattgg tatttatgac 60

gatgaaaaag agatatttga gaagacttta cgtcattcag ctgaagagat agaaaaatat 120

aacactatat ttgatcaatt tcagttcaga aagaatgtaa ttctcgatgc gttaaaagaa 180

gcaaacattg aagtaagttc tttaaatgct gtagttggac gcggcggact gttaaagcca 240

atagtaagtg gaacttatgc agtaaatcaa aaaatgcttg aagaccttaa agtaggcgtt 300

caaggtcagc atgcgtcaaa tcttggtgga attattgcaa atgaaatagc aaaagaaata 360

aatgttccag catacatcgt tgatccagtt gttgtggatg agcttgatga agtttcacgt 420

atatcaggaa tggctgacat tccacgtaaa agtatattcc atgcattaaa tcaaaaagca 480

gttgctagac gctatgcaaa agaagttgga aaaaaatacg aagatcttaa tttaatcgtg 540

gtccacatgg gtggcggtac ttcagtaggt actcataaag atggtagagt aattgaagtt 600

aataatacac ttgatggaga aggtccattc tcaccagaaa gaagtggtgg cgttccaata 660

ggcgatcttg tacgtttgtg cttcagcaac aaatatactt atgaagaagt aatgaaaaag 720

ataaacggca aaggcggcgt tgttagttac ttaaatacta tcgattttaa ggctgtagtt 780

gataaagctc ttgaaggcga taagaaatgt gcacttatat atgaagcttt cacattccag 840

gtagcaaaag agataggaaa atgttcaacc gttttaaaag gaaatgtaga tgcaataatc 900

ttaacaggcg gaattgcgta caacgagcat gtatgtaatg ccatagagga tagagtaaaa 960

ttcattgcac ctgtagttcg ttatggtgga gaagatgaac ttcttgcact tgcagaaggt 1020

ggactgcgcg ttttacgcgg agaagaaaaa gctaaggaat acaaataa 1068

<210> 66

<211> 1068

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成多核苷酸

<400> 66

atgtatcgtt tactgattat caatcctggc tcgacctcaa ctaaaattgg tatttatgac 60

gatgaaaaag agatatttga gaagacgtta cgtcattcag ctgaagagat tgaaaaatat 120

aacactatat ttgatcaatt tcagttccgc aagaatgtga ttctcgatgc gttaaaagaa 180

gcaaacattg aagtcagttc tttaaatgct gtagttggac gcggcggact gttaaagcca 240

attgtcagtg gaacttatgc agtaaatcaa aaaatgcttg aagaccttaa agtgggcgtt 300

caaggtcagc atgccagcaa tcttggtggc attattgcca atgaaatcgc aaaagaaatc 360

aatgttccag catacatcgt tgatccggtt gttgtggatg agcttgatga agttagccgt 420

ataagcggaa tggctgacat tccacgtaaa agtatattcc atgcattaaa tcaaaaagca 480

gttgctcgtc gctatgcaaa agaagttggt aaaaaatacg aagatcttaa tttaatcgtg 540

gtccacatgg gtggcggtac ttcagtaggt actcataaag atggtcgcgt gattgaagtt 600

aataatacac ttgatggcga aggtccattc tcaccagaac gtagtggtgg cgttccaatt 660

ggcgatctgg tacgtttgtg cttcagcaac aaatatactt atgaagaagt gatgaaaaag 720

ataaacggca aaggcggcgt tgttagttac ctgaatacta tcgattttaa ggctgtagtt 780

gataaagcgc ttgaaggcga taagaaatgt gcactgattt atgaagcttt caccttccag 840

gtagcaaaag agattggtaa atgttcaacc gttttaaaag gaaatgttga tgccattatc 900

ttaacaggcg gcattgctta caacgagcat gtatgtaatg ccattgagga tcgcgtaaaa 960

ttcattgcac ctgtagttcg ttatggtggc gaagatgaac tgctggcact ggcagaaggt 1020

ggactgcgcg ttttacgcgg cgaagaaaaa gcgaaggaat acaaataa 1068

<210> 67

<211> 1068

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成多核苷酸

<400> 67

atgtatcgtc tgctgattat caatcctggc tcgacctcaa ctaaaattgg tatttatgac 60

gatgaaaaag agatatttga gaaaacgtta cgtcatagcg ctgaagagat tgaaaaatat 120

aacactattt ttgatcaatt tcagttccgc aagaatgtga ttctcgatgc gctgaaagaa 180

gcaaacattg aagtcagttc gctgaatgcg gtagttggtc gcggcggtct gctgaagcca 240

attgtcagcg gcacttatgc ggtaaatcaa aaaatgctgg aagacctgaa agtgggcgtt 300

caggggcagc atgccagcaa tcttggtggc attattgcca atgaaatcgc caaagaaatc 360

aatgttccgg catacatcgt tgatccggtt gttgtggatg agctggatga agttagccgt 420

atcagcggaa tggctgacat tccacgtaaa agtattttcc atgcactgaa tcaaaaagcg 480

gttgcgcgtc gctatgcaaa agaagttggt aaaaaatacg aagatcttaa tctgatcgtg 540

gtgcatatgg gtggcggtac tagcgtcggt actcataaag atggtcgcgt gattgaagtt 600

aataatacac ttgatggcga aggtccattc tcaccagaac gtagcggtgg cgttccaatt 660

ggcgatctgg tacgtttgtg cttcagcaac aaatatacct atgaagaagt gatgaaaaag 720

ataaacggca aaggcggcgt tgttagttac ctgaatacta tcgattttaa ggcggtagtt 780

gataaagcgc tggaaggcga taagaaatgt gcactgattt atgaagcgtt caccttccag 840

gtggcaaaag agattggtaa atgttcaacc gttctgaaag gcaatgttga tgccattatc 900

ctgaccggcg gcattgctta caacgagcat gtttgtaatg ccattgagga tcgcgtaaaa 960

ttcattgcac ctgtggttcg ttatggtggc gaagatgaac tgctggcact ggcagaaggt 1020

ggtctgcgcg ttttacgcgg cgaagaaaaa gcgaaagaat acaaataa 1068

<210> 68

<211> 1068

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成多核苷酸

<400> 68

atgtatcgtc tgctgattat caacccgggc agcacctcaa ccaaaattgg tatttacgac 60

gatgaaaaag agatttttga aaaaacgctg cgtcacagcg cagaagagat tgaaaaatac 120

aacaccattt tcgatcagtt ccagttccgc aaaaacgtga ttctcgatgc gctgaaagaa 180

gccaatattg aagtctcctc gctgaatgcg gtggtcggtc gcggcggtct gctgaaaccg 240

attgtcagcg gcacttatgc ggttaatcag aaaatgctgg aagatctgaa agtgggcgtg 300

caggggcagc atgccagcaa tctcggcggc attatcgcca atgaaatcgc caaagagatc 360

aacgtgccgg cttatatcgt cgatccggtg gtggttgatg aactggatga agtcagccgt 420

atcagcggca tggcggatat tccgcgtaaa agcattttcc atgcgctgaa tcagaaagcg 480

gttgcgcgtc gctatgccaa agaagtgggt aaaaaatatg aagatctcaa tctgattgtg 540

gtgcatatgg gcggcggcac cagcgtcggt acgcataaag atggtcgcgt gattgaagtg 600

aataacacgc tggatggcga agggccgttc tcgccggaac gtagcggcgg cgtgccgatt 660

ggcgatctgg tgcgtctgtg tttcagcaat aaatacacct acgaagaagt gatgaaaaaa 720

atcaacggca aaggcggcgt ggttagctat ctgaatacca tcgattttaa agcggtggtt 780

gataaagcgc tggaaggcga taaaaaatgc gcgctgattt atgaagcgtt taccttccag 840

gtggcgaaag agattggtaa atgttcaacc gtgctgaaag gcaacgttga tgccattatt 900

ctgaccggcg gcattgctta taacgaacat gtttgtaatg ccattgaaga tcgcgtgaaa 960

tttattgcgc cggtggtgcg ttacggcggc gaagatgaac tgctggcgct ggcggaaggc 1020

ggtctgcgcg tgctgcgcgg cgaagaaaaa gcgaaagagt acaaataa 1068

<210> 69

<211> 1407

<212> DNA

<213> 拜氏梭菌

<400> 69

atgaataaag acacactaat acctacaact aaagatttaa aagtaaaaac aaatggtgaa 60

aacattaatt taaagaacta caaggataat tcttcatgtt tcggagtatt cgaaaatgtt 120

gaaaatgcta taagcagcgc tgtacacgca caaaagatat tatcccttca ttatacaaaa 180

gagcaaagag aaaaaatcat aactgagata agaaaggccg cattacaaaa taaagaggtc 240

ttggctacaa tgattctaga agaaacacat atgggaagat atgaggataa aatattaaaa 300

catgaattgg tagctaaata tactcctggt acagaagatt taactactac tgcttggtca 360

ggtgataatg gtcttacagt tgtagaaatg tctccatatg gtgttatagg tgcaataact 420

ccttctacga atccaactga aactgtaata tgtaatagca taggcatgat agctgctgga 480

aatgctgtag tatttaacgg acacccatgc gctaaaaaat gtgttgcctt tgctgttgaa 540

atgataaata aggcaattat ttcatgtggc ggtcctgaaa atctagtaac aactataaaa 600

aatccaacta tggagtctct agatgcaatt attaagcatc cttcaataaa acttctttgc 660

ggaactgggg gtccaggaat ggtaaaaacc ctcttaaatt ctggtaagaa agctataggt 720

gctggtgctg gaaatccacc agttattgta gatgatactg ctgatataga aaaggctggt 780

aggagcatca ttgaaggctg ttcttttgat aataatttac cttgtattgc agaaaaagaa 840

gtatttgttt ttgagaatgt tgcagatgat ttaatatcta acatgctaaa aaataatgct 900

gtaattataa atgaagatca agtatcaaaa ttaatagatt tagtattaca aaaaaataat 960

gaaactcaag aatactttat aaacaaaaaa tgggtaggaa aagatgcaaa attattctta 1020

gatgaaatag atgttgagtc tccttcaaat gttaaatgca taatctgcga agtaaatgca 1080

aatcatccat ttgttatgac agaactcatg atgccaatat tgccaattgt aagagttaaa 1140

gatatagatg aagctattaa atatgcaaag atagcagaac aaaatagaaa acatagtgcc 1200

tatatttatt ctaaaaatat agacaaccta aatagatttg aaagagaaat agatactact 1260

atttttgtaa agaatgctaa atcttttgct ggtgttggtt atgaagcaga aggatttaca 1320

actttcacta ttgctggatc tactggtgag ggaataacct ctgcaaggaa ttttacaaga 1380

caaagaagat gtgtacttgc cggctaa 1407

<210> 70

<211> 468

<212> PRT

<213> 拜氏梭菌

<400> 70

Met Asn Lys Asp Thr Leu Ile Pro Thr Thr Lys Asp Leu Lys Val Lys

1 5 10 15

Thr Asn Gly Glu Asn Ile Asn Leu Lys Asn Tyr Lys Asp Asn Ser Ser

20 25 30

Cys Phe Gly Val Phe Glu Asn Val Glu Asn Ala Ile Ser Ser Ala Val

35 40 45

His Ala Gln Lys Ile Leu Ser Leu His Tyr Thr Lys Glu Gln Arg Glu

50 55 60

Lys Ile Ile Thr Glu Ile Arg Lys Ala Ala Leu Gln Asn Lys Glu Val

65 70 75 80

Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu Asp

85 90 95

Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu

100 105 110

Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val

115 120 125

Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn

130 135 140

Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly

145 150 155 160

Asn Ala Val Val Phe Asn Gly His Pro Cys Ala Lys Lys Cys Val Ala

165 170 175

Phe Ala Val Glu Met Ile Asn Lys Ala Ile Ile Ser Cys Gly Gly Pro

180 185 190

Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Met Glu Ser Leu Asp

195 200 205

Ala Ile Ile Lys His Pro Ser Ile Lys Leu Leu Cys Gly Thr Gly Gly

210 215 220

Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly

225 230 235 240

Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile

245 250 255

Glu Lys Ala Gly Arg Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn

260 265 270

Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala

275 280 285

Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn

290 295 300

Glu Asp Gln Val Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn

305 310 315 320

Glu Thr Gln Glu Tyr Phe Ile Asn Lys Lys Trp Val Gly Lys Asp Ala

325 330 335

Lys Leu Phe Leu Asp Glu Ile Asp Val Glu Ser Pro Ser Asn Val Lys

340 345 350

Cys Ile Ile Cys Glu Val Asn Ala Asn His Pro Phe Val Met Thr Glu

355 360 365

Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu

370 375 380

Ala Ile Lys Tyr Ala Lys Ile Ala Glu Gln Asn Arg Lys His Ser Ala

385 390 395 400

Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu

405 410 415

Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val

420 425 430

Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr

435 440 445

Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys

450 455 460

Val Leu Ala Gly

465

<210> 71

<211> 1407

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成多核苷酸

<400> 71

atgaataaag acacactaat acctacaact aaagatttaa aagtaaaaac aaatggtgaa 60

aacattaatt taaagaacta caaggataat tcttcatgtt tcggcgtatt cgaaaatgtt 120

gaaaatgcta taagcagcgc tgtacacgca caaaagatat tatcccttca ttatacaaaa 180

gagcaacgtg aaaaaatcat aactgagata agaaaggccg cattacaaaa taaagaggtc 240

ttggctacaa tgattctgga agaaacacat atgggacgtt atgaggataa aatattaaaa 300

catgaattgg tagctaaata tactcctggt acagaagatt taactactac tgcctggtca 360

ggtgataatg gtctgacagt tgtagaaatg tctccatatg gtgttattgg tgcaataact 420

ccttctacga atccaactga aactgtaata tgtaatagca taggcatgat tgctgctgga 480

aatgctgtag tatttaacgg acacccatgc gctaaaaaat gtgttgcctt tgctgttgaa 540

atgataaata aggcaattat ttcatgtggc ggtcctgaaa atctggtaac aactataaaa 600

aatccaacca tggagtctct ggatgcaatt attaagcatc cttcaataaa acttctttgc 660

ggaactgggg gtccaggaat ggtaaaaacc ctgttaaatt ctggtaagaa agctataggt 720

gctggtgctg gaaatccacc agttattgtc gatgatactg ctgatataga aaaggctggt 780

cgtagcatca ttgaaggctg ttcttttgat aataatttac cttgtattgc agaaaaagaa 840

gtatttgttt ttgagaatgt tgcagatgat ttaatatcta acatgctaaa aaataatgct 900

gtaattataa atgaagatca agtatcaaaa ttaatcgatt tagtattaca aaaaaataat 960

gaaactcaag aatactttat aaacaaaaaa tgggtaggaa aagatgcaaa attattcctc 1020

gatgaaatag atgttgagtc tccttcaaat gttaaatgca taatctgcga agtaaatgca 1080

aatcatccat ttgttatgac agaactgatg atgccaatat tgccaattgt acgcgttaaa 1140

gatatcgatg aagctattaa atatgcaaag atagcagaac aaaatagaaa acatagtgcc 1200

tatatttatt ctaaaaatat cgacaacctg aatcgctttg aacgtgaaat agatactact 1260

atttttgtaa agaatgctaa atcttttgct ggtgttggtt atgaagcaga aggatttaca 1320

actttcacta ttgctggatc tactggtgag ggaataacct ctgcacgtaa ttttacacgc 1380

caacgtcgct gtgtacttgc cggctaa 1407

<210> 72

<211> 1407

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成多核苷酸

<400> 72

atgaataaag acacactgat ccctacaact aaagatttaa aagtaaaaac aaatggtgaa 60

aacattaatt taaagaacta caaagataat agcagttgtt tcggcgtatt cgaaaatgtt 120

gaaaatgcta tcagcagcgc tgtacacgca caaaagatat tatcgctgca ttatacaaaa 180

gagcaacgtg aaaaaatcat cactgagata cgtaaggccg cattacaaaa taaagaggtg 240

ctggctacaa tgattctgga agaaacacat atgggacgtt atgaggataa aatattaaaa 300

catgaactgg tagctaaata tactcctggt acagaagatt taactactac tgcctggagc 360

ggtgataatg gtctgacagt tgtagaaatg tctccatatg gtgttattgg tgcaataact 420

ccttctacca atccaactga aactgtaatt tgtaatagca ttggcatgat tgctgctgga 480

aatgctgtag tatttaacgg acacccatgc gctaaaaaat gtgttgcctt tgctgttgaa 540

atgatcaata aggcaattat tagctgtggc ggtccggaaa atctggtaac aactataaaa 600

aatccaacca tggagtctct ggatgccatt attaagcatc cttcaataaa actgctttgc 660

ggaactggcg gtccaggaat ggtaaaaacc ctgttaaatt ctggtaagaa agctattggt 720

gctggtgctg gaaatccacc agttattgtc gatgatactg ctgatattga aaaggctggt 780

cgtagcatca ttgaaggctg ttcttttgat aataatttac cttgtattgc agaaaaagaa 840

gtatttgttt ttgagaatgt tgcagatgat ttaatatcta acatgctgaa aaataatgct 900

gtaattatca atgaagatca ggtatcaaaa ttaatcgatt tagtattaca aaaaaataat 960

gaaactcaag aatactttat caacaaaaaa tgggtaggta aagatgcaaa attattcctc 1020

gatgaaatcg atgttgagtc tccttcaaat gttaaatgca ttatctgcga agtgaatgcc 1080

aatcatccat ttgttatgac agaactgatg atgccaatat tgccaattgt gcgcgttaaa 1140

gatatcgatg aagctattaa atatgcaaag attgcagaac aaaatagaaa acatagtgcc 1200

tatatttata gcaaaaatat cgacaacctg aatcgctttg aacgtgaaat cgatactact 1260

atttttgtaa agaatgctaa atcttttgct ggtgttggtt atgaagcaga aggatttacc 1320

actttcacta ttgctggatc tactggtgag ggcataacct ctgcacgtaa ttttacccgc 1380

caacgtcgct gtgtactggc cggctaa 1407

<210> 73

<211> 1407

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成多核苷酸

<400> 73

atgaataaag acacgctgat cccgacaact aaagatctga aagtaaaaac caatggtgaa 60

aacattaatc tgaagaacta caaagataat agcagttgtt tcggcgtatt cgaaaatgtt 120

gaaaatgcta tcagcagcgc ggtacacgca caaaagatac tctcgctgca ttataccaaa 180

gagcaacgtg aaaaaatcat cactgagatc cgtaaggccg cattacaaaa taaagaggtg 240

ctggcaacaa tgattctgga agaaacacat atgggacgtt atgaggataa aatactgaaa 300

catgaactgg tggcgaaata tacgcctggt actgaagatt taaccaccac tgcctggagc 360

ggtgataatg gtctgaccgt tgtggaaatg tcgccttatg gtgttattgg tgcaattacg 420

ccttcaacca atccaactga aacggtaatt tgtaatagca ttggcatgat tgctgctgga 480

aatgcggtag tatttaacgg tcacccctgc gctaaaaaat gtgttgcctt tgctgttgaa 540

atgatcaata aagcgattat tagctgtggc ggtccggaaa atctggtaac cactataaaa 600

aatccaacca tggagtcgct ggatgccatt attaagcatc cttcaatcaa actgctgtgc 660

ggcactggcg gtccaggaat ggtgaaaacc ctgctgaata gcggtaagaa agcgattggt 720

gctggtgctg gaaatccacc agttattgtc gatgatactg ctgatattga aaaagcgggt 780

cgtagcatca ttgaaggctg ttcttttgat aataatttac cttgtattgc agaaaaagaa 840

gtatttgttt ttgagaatgt tgccgatgat ctgatctcta acatgctgaa aaataatgcg 900

gtgattatca atgaagatca ggttagcaaa ctgatcgatc tggtattaca aaaaaataat 960

gaaactcaag aatactttat caacaaaaaa tgggtaggta aagatgcaaa actgttcctc 1020

gatgaaatcg atgttgagtc gccttcaaat gttaaatgca ttatctgcga agtgaatgcc 1080

aatcatccat ttgtgatgac cgaactgatg atgccaattt tgccgattgt gcgcgttaaa 1140

gatatcgatg aagcgattaa atatgcaaag attgcagaac aaaatcgtaa acatagtgcc 1200

tatatttata gcaaaaatat cgacaacctg aatcgctttg aacgtgaaat cgataccact 1260

atttttgtga agaatgctaa atcttttgct ggtgttggtt atgaagcaga aggttttacc 1320

actttcacta ttgctggaag caccggtgaa ggcattacct ctgcacgtaa ttttacccgc 1380

caacgtcgct gtgtactggc cggctaa 1407

<210> 74

<211> 1407

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成多核苷酸

<400> 74

atgaataaag atacgctgat cccgaccacc aaagatctga aagtgaaaac caacggcgaa 60

aatatcaacc tgaaaaacta taaagataac agcagttgct ttggcgtgtt tgaaaacgtt 120

gaaaacgcca tctccagcgc ggtgcatgcg caaaaaattc tctcgctgca ttacaccaaa 180

gagcagcgtg aaaaaattat caccgaaatc cgtaaagcgg cgctgcaaaa caaagaagtg 240

ctggcaacca tgatcctgga agaaacgcat atggggcgtt atgaagataa aattctgaaa 300

catgaactgg tggcgaaata cacgccgggc actgaagatc tgaccaccac cgcctggagc 360

ggcgataacg gcctgaccgt ggtggagatg tcgccttatg gcgtgattgg cgcgattacg 420

ccgtcaacca acccgaccga aacggtgatt tgtaacagca ttggcatgat tgccgcgggt 480

aatgcggtgg tgtttaacgg tcatccctgc gcgaaaaaat gtgtggcgtt tgccgttgag 540

atgatcaaca aagcgattat cagctgcggc ggcccggaaa atctggtgac caccatcaaa 600

aatccgacca tggaatcgct ggatgccatt atcaaacatc cttccatcaa actgctgtgc 660

ggcaccggcg gcccgggcat ggtgaaaacg ctgctgaaca gcggtaaaaa agcgattggc 720

gcgggcgcgg gtaacccgcc ggtgattgtc gatgacaccg ccgatattga aaaagcgggg 780

cgtagcatta ttgaaggctg ttcttttgat aacaacctgc cctgcattgc cgaaaaagaa 840

gtgtttgtct ttgaaaacgt cgccgatgat ctgatcagca atatgctgaa aaacaacgcg 900

gtgattatca atgaagatca ggttagcaaa ctgatcgatc tggtgctgca aaaaaacaac 960

gaaacgcagg aatattttat caacaaaaaa tgggttggta aagatgccaa actgtttctc 1020

gatgaaatcg atgttgaatc gccgtctaac gtgaaatgta ttatctgcga agtgaacgcc 1080

aaccatccgt ttgtgatgac cgaactgatg atgccgattc tgccgattgt gcgcgtgaaa 1140

gatatcgatg aagcgattaa atatgccaaa attgccgaac aaaaccgtaa acacagcgcc 1200

tatatttaca gcaaaaatat cgataacctg aaccgctttg aacgtgaaat cgataccacc 1260

atttttgtga aaaatgccaa aagttttgcc ggcgttggtt atgaagcgga aggttttacc 1320

acctttacca ttgccggtag caccggcgaa ggcattacca gcgcccgtaa ttttacccgc 1380

cagcgtcgct gcgtgctggc gggctaa 1407

<210> 75

<211> 1023

<212> DNA

<213> 热葡糖苷酶地芽胞杆菌

<400> 75

atgaaagctg cagtagtaga gcaatttaag gaaccattaa aaattaaaga agtggaaaag 60

ccatctattt catatggcga agtattagtc cgcattaaag catgcggtgt atgccatacg 120

gacttgcacg ccgctcatgg cgattggcca gtaaaaccaa aacttccttt aatccctggc 180

catgaaggag tcggaattgt tgaagaagtc ggtccggggg taacccattt aaaagtggga 240

gaccgcgttg gaattccttg gttatattct gcgtgcggcc attgcgaata ttgtttaagc 300

ggacaagaag cattatgtga acatcaacaa aacgccggct actcagtcga cgggggttat 360

gcagaatatt gcagagctgc gccagattat gtggtgaaaa ttcctgacaa cttatcgttt 420

gaagaagctg ctcctatttt ctgcgccgga gttactactt ataaagcgtt aaaagtcaca 480

ggtacaaaac cgggagaatg ggtagcgatc tatggcatcg gcggccttgg acatgttgcc 540

gtccagtatg cgaaagcgat ggggcttcat gttgttgcag tggatatcgg cgatgagaaa 600

ctggaacttg caaaagagct tggcgccgat cttgttgtaa atcctgcaaa agaaaatgcg 660

gcccaattta tgaaagagaa agtcggcgga gtacacgcgg ctgttgtgac agctgtatct 720

aaacctgctt ttcaatctgc gtacaattct atccgcagag gcggcacgtg cgtgcttgtc 780

ggattaccgc cggaagaaat gcctattcca atctttgata cggtattaaa cggaattaaa 840

attatcggtt ccattgtcgg cacgcggaaa gacttgcaag aagcgcttca gttcgctgca 900

gaaggtaaag taaaaaccat tattgaagtg caacctcttg aaaaaattaa cgaagtattt 960

gacagaatgc taaaaggaga aattaacgga cgggttgttt taacgttaga aaataataat 1020

taa 1023

<210> 76

<211> 340

<212> PRT

<213> 热葡糖苷酶地芽胞杆菌

<400> 76

Met Lys Ala Ala Val Val Glu Gln Phe Lys Glu Pro Leu Lys Ile Lys

1 5 10 15

Glu Val Glu Lys Pro Ser Ile Ser Tyr Gly Glu Val Leu Val Arg Ile

20 25 30

Lys Ala Cys Gly Val Cys His Thr Asp Leu His Ala Ala His Gly Asp

35 40 45

Trp Pro Val Lys Pro Lys Leu Pro Leu Ile Pro Gly His Glu Gly Val

50 55 60

Gly Ile Val Glu Glu Val Gly Pro Gly Val Thr His Leu Lys Val Gly

65 70 75 80

Asp Arg Val Gly Ile Pro Trp Leu Tyr Ser Ala Cys Gly His Cys Glu

85 90 95

Tyr Cys Leu Ser Gly Gln Glu Ala Leu Cys Glu His Gln Gln Asn Ala

100 105 110

Gly Tyr Ser Val Asp Gly Gly Tyr Ala Glu Tyr Cys Arg Ala Ala Pro

115 120 125

Asp Tyr Val Val Lys Ile Pro Asp Asn Leu Ser Phe Glu Glu Ala Ala

130 135 140

Pro Ile Phe Cys Ala Gly Val Thr Thr Tyr Lys Ala Leu Lys Val Thr

145 150 155 160

Gly Thr Lys Pro Gly Glu Trp Val Ala Ile Tyr Gly Ile Gly Gly Leu

165 170 175

Gly His Val Ala Val Gln Tyr Ala Lys Ala Met Gly Leu His Val Val

180 185 190

Ala Val Asp Ile Gly Asp Glu Lys Leu Glu Leu Ala Lys Glu Leu Gly

195 200 205

Ala Asp Leu Val Val Asn Pro Ala Lys Glu Asn Ala Ala Gln Phe Met

210 215 220

Lys Glu Lys Val Gly Gly Val His Ala Ala Val Val Thr Ala Val Ser

225 230 235 240

Lys Pro Ala Phe Gln Ser Ala Tyr Asn Ser Ile Arg Arg Gly Gly Thr

245 250 255

Cys Val Leu Val Gly Leu Pro Pro Glu Glu Met Pro Ile Pro Ile Phe

260 265 270

Asp Thr Val Leu Asn Gly Ile Lys Ile Ile Gly Ser Ile Val Gly Thr

275 280 285

Arg Lys Asp Leu Gln Glu Ala Leu Gln Phe Ala Ala Glu Gly Lys Val

290 295 300

Lys Thr Ile Ile Glu Val Gln Pro Leu Glu Lys Ile Asn Glu Val Phe

305 310 315 320

Asp Arg Met Leu Lys Gly Glu Ile Asn Gly Arg Val Val Leu Thr Leu

325 330 335

Glu Asn Asn Asn

340

<210> 77

<211> 4090

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成多核苷酸

<400> 77

atggctatcg aaatcaaagt accggacatc ggggctgatg aagttgaaat caccgagatc 60

ctggtcaaag tgggcgacaa agttgaagcc gaacagtcgc tgatcaccgt agaaggcgac 120

aaagcctcta tggaagttcc gtctccgcag gcgggtatcg ttaaagagat caaagtctct 180

gttggcgata aaacccagac cggcgcactg attatgattt tcgattccgc cgacggtgca 240

gcagacgctg cacctgctca ggcagaagag aagaaagaag cagctccggc agcagcacca 300

gcggctgcgg cggcaaaaga cgttaacgtt ccggatatcg gcagcgacga agttgaagtg 360

accgaaatcc tggtgaaagt tggcgataaa gttgaagctg aacagtcgct gatcaccgta 420

gaaggcgaca aggcttctat ggaagttccg gctccgtttg ctggcaccgt gaaagagatc 480

aaagtgaacg tgggtgacaa agtgtctacc ggctcgctga ttatggtctt cgaagtcgcg 540

ggtgaagcag gcgcggcagc tccggccgct aaacaggaag cagctccggc agcggcccct 600

gcaccagcgg ctggcgtgaa agaagttaac gttccggata tcggcggtga cgaagttgaa 660

gtgactgaag tgatggtgaa agtgggcgac aaagttgccg ctgaacagtc actgatcacc 720

gtagaaggcg acaaagcttc tatggaagtt ccggcgccgt ttgcaggcgt cgtgaaggaa 780

ctgaaagtca acgttggcga taaagtgaaa actggctcgc tgattatgat cttcgaagtt 840

gaaggcgcag cgcctgcggc agctcctgcg aaacaggaag cggcagcgcc ggcaccggca 900

gcaaaagctg aagccccggc agcagcacca gctgcgaaag cggaaggcaa atctgaattt 960

gctgaaaacg acgcttatgt tcacgcgact ccgctgatcc gccgtctggc acgcgagttt 1020

ggtgttaacc ttgcgaaagt gaagggcact ggccgtaaag gtcgtatcct gcgcgaagac 1080

gttcaggctt acgtgaaaga agctatcaaa cgtgcagaag cagctccggc agcgactggc 1140

ggtggtatcc ctggcatgct gccgtggccg aaggtggact tcagcaagtt tggtgaaatc 1200

gaagaagtgg aactgggccg catccagaaa atctctggtg cgaacctgag ccgtaactgg 1260

gtaatgatcc cgcatgttac tcacttcgac aaaaccgata tcaccgagtt ggaagcgttc 1320

cgtaaacagc agaacgaaga agcggcgaaa cgtaagctgg atgtgaagat caccccggtt 1380

gtcttcatca tgaaagccgt tgctgcagct cttgagcaga tgcctcgctt caatagttcg 1440

ctgtcggaag acggtcagcg tctgaccctg aagaaataca tcaacatcgg tgtggcggtg 1500

gataccccga acggtctggt tgttccggta ttcaaagacg tcaacaagaa aggcatcatc 1560

gagctgtctc gcgagctgat gactatttct aagaaagcgc gtgacggtaa gctgactgcg 1620

ggcgaaatgc agggcggttg cttcaccatc tccagcatcg gcggcctggg tactacccac 1680

ttcgcgccga ttgtgaacgc gccggaagtg gctatcctcg gcgtttccaa gtccgcgatg 1740

gagccggtgt ggaatggtaa agagttcgtg ccgcgtctga tgctgccgat ttctctctcc 1800

ttcgaccacc gcgtgatcga cggtgctgat ggtgcccgtt tcattaccat cattaacaac 1860

acgctgtctg acattcgccg tctggtgatg taagtaaaag agccggccca acggccggct 1920

tttttctggt aatctcatga atgtattgag gttattagcg aatagacaaa tcggttgccg 1980

tttgttgttt aaaaattgtt aacaattttg taaaataccg acggatagaa cgacccggtg 2040

gtggttaggg tattacttca cataccctat ggatttctgg gtgcagcaag gtagcaagcg 2100

ccagaatccc caggagctta cataagtaag tgactggggt gagggcgtga agctaacgcc 2160

gctgcggcct gaaagacgac gggtatgacc gccggagata aatatataga ggtcatgatg 2220

agtactgaaa tcaaaactca ggtcgtggta cttggggcag gccccgcagg ttactccgct 2280

gccttccgtt gcgctgattt aggtctggaa accgtaatcg tagaacgtta caacaccctt 2340

ggcggtgttt gtctgaacgt gggttgtatc ccttctaaag cgctgctgca cgtggcaaaa 2400

gttatcgaag aagcgaaagc gctggccgaa cacggcatcg ttttcggcga accgaaaact 2460

gacattgaca agatccgcac ctggaaagaa aaagtcatca ctcagctgac cggtggtctg 2520

gctggcatgg ccaaaggtcg taaagtgaag gtggttaacg gtctgggtaa atttaccggc 2580

gctaacaccc tggaagtgga aggcgaaaac ggcaaaaccg tgatcaactt cgacaacgcc 2640

atcatcgcgg cgggttcccg tccgattcag ctgccgttta tcccgcatga agatccgcgc 2700

gtatgggact ccaccgacgc gctggaactg aaatctgtac cgaaacgcat gctggtgatg 2760

ggcggcggta tcatcggtct ggaaatgggt accgtatacc atgcgctggg ttcagagatt 2820

gacgtggtgg aaatgttcga ccaggttatc ccggctgccg acaaagacgt ggtgaaagtc 2880

ttcaccaaac gcatcagcaa gaaatttaac ctgatgctgg aagccaaagt gactgccgtt 2940

gaagcgaaag aagacggtat ttacgtttcc atggaaggta aaaaagcacc ggcggaagcg 3000

cagcgttacg acgcagtgct ggtcgctatc ggccgcgtac cgaatggtaa aaacctcgat 3060

gcaggtaaag ctggcgtgga agttgacgat cgcggcttca tccgcgttga caaacaaatg 3120

cgcaccaacg tgccgcacat ctttgctatc ggcgatatcg tcggtcagcc gatgctggcg 3180

cacaaaggtg tccatgaagg ccacgttgcc gcagaagtta tctccggtct gaaacactac 3240

ttcgatccga aagtgatccc atccatcgcc tacactaaac cagaagtggc atgggtcggt 3300

ctgaccgaga aagaagcgaa agagaaaggc atcagctacg aaaccgccac cttcccgtgg 3360

gctgcttccg gccgtgctat cgcttctgac tgcgcagatg gtatgaccaa actgatcttc 3420

gacaaagaga cccaccgtgt tatcggcggc gcgattgtcg gcaccaacgg cggcgagctg 3480

ctgggtgaga tcggcctggc tatcgagatg ggctgtgacg ctgaagacat cgccctgacc 3540

atccacgctc acccgactct gcacgagtcc gttggcctgg cggcggaagt gttcgaaggc 3600

agcatcaccg acctgccaaa cgccaaagcg aagaaaaagt aactttttct ttcaggaaaa 3660

aagcataagc ggctccggga gccgcttttt ttatgcctga tgtttagaac tatgtcactg 3720

ttcataaacc gctacacctc atacatactt taagggcgaa ttctgcagat atccatcaca 3780

ctggcggccg ctcgagcatg catctagcac atccggcaat taaaaaagcg gctaaccacg 3840

ccgctttttt tacgtctgca atttaccttt ccagtcttct tgctccacgt tcagagagac 3900

gttcgcatac tgctgaccgt tgctcgttat tcagcctgac agtatggtta ctgtcgttta 3960

gacgttgtgg gcggctctcc tgaactttct cccgaaaaac ctgacgttgt tcaggtgatg 4020

ccgattgaac acgctggcgg gcgttatcac gttgctgttg attcagtggg cgctgctgta 4080

ctttttcctt 4090

<210> 78

<211> 475

<212> PRT

<213> 大肠杆菌

<400> 78

Met Met Ser Thr Glu Ile Lys Thr Gln Val Val Val Leu Gly Ala Gly

1 5 10 15

Pro Ala Gly Tyr Ser Ala Ala Phe Arg Cys Ala Asp Leu Gly Leu Glu

20 25 30

Thr Val Ile Val Glu Arg Tyr Asn Thr Leu Gly Gly Val Cys Leu Asn

35 40 45

Val Gly Cys Ile Pro Ser Lys Ala Leu Leu His Val Ala Lys Val Ile

50 55 60

Glu Glu Ala Lys Ala Leu Ala Glu His Gly Ile Val Phe Gly Glu Pro

65 70 75 80

Lys Thr Asp Ile Asp Lys Ile Arg Thr Trp Lys Glu Lys Val Ile Asn

85 90 95

Gln Leu Thr Gly Gly Leu Ala Gly Met Ala Lys Gly Arg Lys Val Lys

100 105 110

Val Val Asn Gly Leu Gly Lys Phe Thr Gly Ala Asn Thr Leu Glu Val

115 120 125

Glu Gly Glu Asn Gly Lys Thr Val Ile Asn Phe Asp Asn Ala Ile Ile

130 135 140

Ala Ala Gly Ser Arg Pro Ile Gln Leu Pro Phe Ile Pro His Glu Asp

145 150 155 160

Pro Arg Ile Trp Asp Ser Thr Asp Ala Leu Glu Leu Lys Glu Val Pro

165 170 175

Glu Arg Leu Leu Val Met Gly Gly Gly Ile Ile Gly Leu Glu Met Gly

180 185 190

Thr Val Tyr His Ala Leu Gly Ser Gln Ile Asp Val Val Glu Met Phe

195 200 205

Asp Gln Val Ile Pro Ala Ala Asp Lys Asp Ile Val Lys Val Phe Thr

210 215 220

Lys Arg Ile Ser Lys Lys Phe Asn Leu Met Leu Glu Thr Lys Val Thr

225 230 235 240

Ala Val Glu Ala Lys Glu Asp Gly Ile Tyr Val Thr Met Glu Gly Lys

245 250 255

Lys Ala Pro Ala Glu Pro Gln Arg Tyr Asp Ala Val Leu Val Ala Ile

260 265 270

Gly Arg Val Pro Asn Gly Lys Asn Leu Asp Ala Gly Lys Ala Gly Val

275 280 285

Glu Val Asp Asp Arg Gly Phe Ile Arg Val Asp Lys Gln Leu Arg Thr

290 295 300

Asn Val Pro His Ile Phe Ala Ile Gly Asp Ile Val Gly Gln Pro Met

305 310 315 320

Leu Ala His Lys Gly Val His Glu Gly His Val Ala Ala Glu Val Ile

325 330 335

Ala Gly Lys Lys His Tyr Phe Asp Pro Lys Val Ile Pro Ser Ile Ala

340 345 350

Tyr Thr Glu Pro Glu Val Ala Trp Val Gly Leu Thr Glu Lys Glu Ala

355 360 365

Lys Glu Lys Gly Ile Ser Tyr Glu Thr Ala Thr Phe Pro Trp Ala Ala

370 375 380

Ser Gly Arg Ala Ile Ala Ser Asp Cys Ala Asp Gly Met Thr Lys Leu

385 390 395 400

Ile Phe Asp Lys Glu Ser His Arg Val Ile Gly Gly Ala Ile Val Gly

405 410 415

Thr Asn Gly Gly Glu Leu Leu Gly Glu Ile Gly Leu Ala Ile Glu Met

420 425 430

Gly Cys Asp Ala Glu Asp Ile Ala Leu Thr Ile His Ala His Pro Thr

435 440 445

Leu His Glu Ser Val Gly Leu Ala Ala Glu Val Phe Glu Gly Ser Ile

450 455 460

Thr Asp Leu Pro Asn Pro Lys Ala Lys Lys Lys

465 470 475

<210> 79

<211> 475

<212> PRT

<213> 肺炎克雷伯氏菌

<400> 79

Met Met Ser Thr Glu Ile Lys Thr Gln Val Val Val Leu Gly Ala Gly

1 5 10 15

Pro Ala Gly Tyr Ser Ala Ala Phe Arg Cys Ala Asp Leu Gly Leu Glu

20 25 30

Thr Val Ile Val Glu Arg Tyr Ser Thr Leu Gly Gly Val Cys Leu Asn

35 40 45

Val Gly Cys Ile Pro Ser Lys Ala Leu Leu His Val Ala Lys Val Ile

50 55 60

Glu Glu Ala Lys Ala Leu Ala Glu His Gly Ile Val Phe Gly Glu Pro

65 70 75 80

Lys Thr Asp Ile Asp Lys Ile Arg Thr Trp Lys Glu Lys Val Ile Thr

85 90 95

Gln Leu Thr Gly Gly Leu Ala Gly Met Ala Lys Gly Arg Lys Val Lys

100 105 110

Val Val Asn Gly Leu Gly Lys Phe Thr Gly Ala Asn Thr Leu Glu Val

115 120 125

Glu Gly Glu Asn Gly Lys Thr Val Ile Asn Phe Asp Asn Ala Ile Ile

130 135 140

Ala Ala Gly Ser Arg Pro Ile Gln Leu Pro Phe Ile Pro His Glu Asp

145 150 155 160

Pro Arg Val Trp Asp Ser Thr Asp Ala Leu Glu Leu Lys Ser Val Pro

165 170 175

Lys Arg Met Leu Val Met Gly Gly Gly Ile Ile Gly Leu Glu Met Gly

180 185 190

Thr Val Tyr His Ala Leu Gly Ser Glu Ile Asp Val Val Glu Met Phe

195 200 205

Asp Gln Val Ile Pro Ala Ala Asp Lys Asp Val Val Lys Val Phe Thr

210 215 220

Lys Arg Ile Ser Lys Lys Phe Asn Leu Met Leu Glu Ala Lys Val Thr

225 230 235 240

Ala Val Glu Ala Lys Glu Asp Gly Ile Tyr Val Ser Met Glu Gly Lys

245 250 255

Lys Ala Pro Ala Glu Ala Gln Arg Tyr Asp Ala Val Leu Val Ala Ile

260 265 270

Gly Arg Val Pro Asn Gly Lys Asn Leu Asp Ala Gly Lys Ala Gly Val

275 280 285

Glu Val Asp Asp Arg Gly Phe Ile Arg Val Asp Lys Gln Met Arg Thr

290 295 300

Asn Val Pro His Ile Phe Ala Ile Gly Asp Ile Val Gly Gln Pro Met

305 310 315 320

Leu Ala His Lys Gly Val His Glu Gly His Val Ala Ala Glu Val Ile

325 330 335

Ser Gly Leu Lys His Tyr Phe Asp Pro Lys Val Ile Pro Ser Ile Ala

340 345 350

Tyr Thr Lys Pro Glu Val Ala Trp Val Gly Leu Thr Glu Lys Glu Ala

355 360 365

Lys Glu Lys Gly Ile Ser Tyr Glu Thr Ala Thr Phe Pro Trp Ala Ala

370 375 380

Ser Gly Arg Ala Ile Ala Ser Asp Cys Ala Asp Gly Met Thr Lys Leu

385 390 395 400

Ile Phe Asp Lys Glu Thr His Arg Val Ile Gly Gly Ala Ile Val Gly

405 410 415

Thr Asn Gly Gly Glu Leu Leu Gly Glu Ile Gly Leu Ala Ile Glu Met

420 425 430

Gly Cys Asp Ala Glu Asp Ile Ala Leu Thr Ile His Ala His Pro Thr

435 440 445

Leu His Glu Ser Val Gly Leu Ala Ala Glu Val Phe Glu Gly Ser Ile

450 455 460

Thr Asp Leu Pro Asn Ala Lys Ala Lys Lys Lys

465 470 475

<210> 80

<211> 347

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成多核苷酸

<400> 80

ataataatac atatgaacca tgcgagttac gggcctataa gccaggcgag atatgatcta 60

tatcaatttc tcatctataa tgctttgtta gtatctcgtc gccgacttaa taaagagaga 120

gttagtgtga aagctgacaa cccttttgat cttttacttc ctgctgcaat ggccaaagtg 180

gccgaagagg cgggtgtcta taaagcaacg aaacatccgc ttaagacttt ctatctggcg 240

attaccgccg gtgttttcat ctcaatcgca ttcaccactg gcacaggcac agaaggtagg 300

tgttacatgt cagaacgttt acacaatgac gtggatccta ttattat 347

<210> 81

<211> 4678

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成多核苷酸

<400> 81

aagaggtaaa agaataatgg ctatcgaaat caaagtaccg gacatcgggg ctgatgaagt 60

tgaaatcacc gagatcctgg tcaaagtggg cgacaaagtt gaagccgaac agtcgctgat 120

caccgtagaa ggcgacaaag cctctatgga agttccgtct ccgcaggcgg gtatcgttaa 180

agagatcaaa gtctctgttg gcgataaaac ccagaccggc gcactgatta tgattttcga 240

ttccgccgac ggtgcagcag acgctgcacc tgctcaggca gaagagaaga aagaagcagc 300

tccggcagca gcaccagcgg ctgcggcggc aaaagacgtt aacgttccgg atatcggcag 360

cgacgaagtt gaagtgaccg aaatcctggt gaaagttggc gataaagttg aagctgaaca 420

gtcgctgatc accgtagaag gcgacaaggc ttctatggaa gttccggctc cgtttgctgg 480

caccgtgaaa gagatcaaag tgaacgtggg tgacaaagtg tctaccggct cgctgattat 540

ggtcttcgaa gtcgcgggtg aagcaggcgc ggcagctccg gccgctaaac aggaagcagc 600

tccggcagcg gcccctgcac cagcggctgg cgtgaaagaa gttaacgttc cggatatcgg 660

cggtgacgaa gttgaagtga ctgaagtgat ggtgaaagtg ggcgacaaag ttgccgctga 720

acagtcactg atcaccgtag aaggcgacaa agcttctatg gaagttccgg cgccgtttgc 780

aggcgtcgtg aaggaactga aagtcaacgt tggcgataaa gtgaaaactg gctcgctgat 840

tatgatcttc gaagttgaag gcgcagcgcc tgcggcagct cctgcgaaac aggaagcggc 900

agcgccggca ccggcagcaa aagctgaagc cccggcagca gcaccagctg cgaaagcgga 960

aggcaaatct gaatttgctg aaaacgacgc ttatgttcac gcgactccgc tgatccgccg 1020

tctggcacgc gagtttggtg ttaaccttgc gaaagtgaag ggcactggcc gtaaaggtcg 1080

tatcctgcgc gaagacgttc aggcttacgt gaaagaagct atcaaacgtg cagaagcagc 1140

tccggcagcg actggcggtg gtatccctgg catgctgccg tggccgaagg tggacttcag 1200

caagtttggt gaaatcgaag aagtggaact gggccgcatc cagaaaatct ctggtgcgaa 1260

cctgagccgt aactgggtaa tgatcccgca tgttactcac ttcgacaaaa ccgatatcac 1320

cgagttggaa gcgttccgta aacagcagaa cgaagaagcg gcgaaacgta agctggatgt 1380

gaagatcacc ccggttgtct tcatcatgaa agccgttgct gcagctcttg agcagatgcc 1440

tcgcttcaat agttcgctgt cggaagacgg tcagcgtctg accctgaaga aatacatcaa 1500

catcggtgtg gcggtggata ccccgaacgg tctggttgtt ccggtattca aagacgtcaa 1560

caagaaaggc atcatcgagc tgtctcgcga gctgatgact atttctaaga aagcgcgtga 1620

cggtaagctg actgcgggcg aaatgcaggg cggttgcttc accatctcca gcatcggcgg 1680

cctgggtact acccacttcg cgccgattgt gaacgcgccg gaagtggcta tcctcggcgt 1740

ttccaagtcc gcgatggagc cggtgtggaa tggtaaagag ttcgtgccgc gtctgatgct 1800

gccgatttct ctctccttcg accaccgcgt gatcgacggt gctgatggtg cccgtttcat 1860

taccatcatt aacaacacgc tgtctgacat tcgccgtctg gtgatgtaag taaaagagcc 1920

ggcccaacgg ccggcttttt tctggtaatc tcatgaatgt attgaggtta ttagcgaata 1980

gacaaatcgg ttgccgtttg ttaagccagg cgagatatga tctatatcaa tttctcatct 2040

ataatgcttt gttagtatct cgtcgccgac ttaataaaga gagagttagt cttctatatc 2100

acagcaagaa ggtaggtgtt acatgatgag tactgaaatc aaaactcagg tcgtggtact 2160

tggggcaggc cccgcaggtt actctgcagc cttccgttgc gctgatttag gtctggaaac 2220

cgtcatcgta gaacgttaca gcaccctcgg tggtgtttgt ctgaacgtgg gttgtatccc 2280

ttctaaagcg ctgctgcacg tggcaaaagt tatcgaagaa gcgaaagcgc tggccgaaca 2340

cggcatcgtt ttcggcgaac cgaaaactga cattgacaag atccgcacct ggaaagaaaa 2400

agtcatcact cagctgaccg gtggtctggc tggcatggcc aaaggtcgta aagtgaaggt 2460

ggttaacggt ctgggtaaat ttaccggcgc taacaccctg gaagtggaag gcgaaaacgg 2520

caaaaccgtg atcaacttcg acaacgccat catcgcggcg ggttcccgtc cgattcagct 2580

gccgtttatc ccgcatgaag atccgcgcgt atgggactcc accgacgcgc tggaactgaa 2640

atctgtaccg aaacgcatgc tggtgatggg cggcggtatc atcggtctgg aaatgggtac 2700

cgtataccat gcgctgggtt cagagattga cgtggtggaa atgttcgacc aggttatccc 2760

ggctgccgac aaagacgtgg tgaaagtctt caccaaacgc atcagcaaga aatttaacct 2820

gatgctggaa gccaaagtga ctgccgttga agcgaaagaa gacggtattt acgtttccat 2880

ggaaggtaaa aaagcaccgg cggaagcgca gcgttacgac gcagtgctgg tcgctatcgg 2940

ccgcgtaccg aatggtaaaa acctcgatgc aggtaaagct ggcgtggaag ttgacgatcg 3000

cggcttcatc cgcgttgaca aacaaatgcg caccaacgtg ccgcacatct ttgctatcgg 3060

cgatatcgtc ggtcagccga tgctggcgca caaaggtgtc catgaaggcc acgttgccgc 3120

agaagttatc tccggtctga aacactactt cgatccgaaa gtgatcccat ccatcgccta 3180

cactaaacca gaagtggcat gggtcggtct gaccgagaaa gaagcgaaag agaaaggcat 3240

cagctacgaa accgccacct tcccgtgggc tgcttccggc cgtgctatcg cttctgactg 3300

cgcagatggt atgaccaaac tgatcttcga caaagagacc caccgtgtta tcggcggcgc 3360

gattgtcggc accaacggcg gcgagctgct gggtgagatc ggcctggcta tcgagatggg 3420

ctgtgacgct gaagacatcg ccctgaccat ccacgctcac ccgactctgc acgagtccgt 3480

tggcctggcg gcggaagtgt tcgaaggcag catcaccgac ctgccaaacg ccaaagcgaa 3540

gaaaaagtaa ctttttcttt caggaaaaaa gcataagcgg ctccgggagc cgcttttttt 3600

atgcctgatg tttagaacta tgtcactgtt cataaaccgc tacacctcat acatacttta 3660

agggcgaatt ctgcagatat ccatcacact ggcggccgct cgagcatgca tctagcacat 3720

ccggcaatta aaaaagcggc taaccacgcc gcttttttta cgtctgcaat ttacctttcc 3780

agtcttcttg ctccacgttc agagagacgt tcgcatactg ctgaccgttg ctcgttattc 3840

agcctgacag tatggttact gtcgtttaga cgttgtgggc ggctctcctg aactttctcc 3900

cgaaaaacct gacgttgttc aggtgatgcc gattgaacac gctggcgggc gttatcacgt 3960

tgctgttgat tcagtgggcg ctgctgtact ttttccttaa acacctggcg ctgctctggt 4020

gatgcggact gaatacgctc acgcgctgcg tctcttcgct gctggttctg cgggttagtc 4080

tgcattttct cgcgaaccgc ctggcgctgc tcaggcgagg cggactgaat gcgctcacgc 4140

gctgcctctc ttcgctgctg gatcttcggg ttagtctgca ttctctcgcg aactgcctgg 4200

cgctgctcag gcgaggcgga ctgataacgc tgacgagcgg cgtccttttg ttgctgggtc 4260

agtggttggc gacggctgaa gtcgtggaag tcgtcatagc tcccatagtg ttcagcttca 4320

ttaaaccgct gtgccgctgc ctgacgttgg gtacctcgtg taatgactgg tgcggcgtgt 4380

gttcgttgct gaaactgatt tgctgccgcc tgacgctggc tgtcgcgcgt tggggcaggt 4440

aattgcgtgg cgctcattcc gccgttgaca tcggtttgat gaaaccgctt tgccatatcc 4500

tgatcatgat agggcacacc attacggtag tttggattgt gccgccatgc catattctta 4560

tcagtaagat gctcaccggt gatacggttg aaattgttga cgtcgatatt gatgttgtcg 4620

ccgttgtgtt gccagccatt accgtcacga tgaccgccat cgtggtgatg ataatcat 4678

<210> 82

<211> 1114

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成多核苷酸

<220>

<221> CDS

<222> (323)..(958)

<400> 82

caaaaaaccg gagtctgtgc tccggttttt tattatccgc taatcaatta catatgaata 60

tcctccttag ttcctattcc gaagttccta ttctctagaa agtataggaa cttcggcgcg 120

cctacctgtg acggaagatc acttcgcaga ataaataaat cctggtgtcc ctgttgatac 180

cgggaagccc tgggccaact tttggcgaaa atgagacgtt gatcggcacg taagaggttc 240

caactttcac cataatgaaa taagatcact accgggcgta ttttttgagt tgtcgagatt 300

ttcaggagct aaggaagcta aa atg gag aaa aaa atc act gga tat acc acc 352

Met Glu Lys Lys Ile Thr Gly Tyr Thr Thr

1 5 10

gtt gat ata tcc caa tgg cat cgt aaa gaa cat ttt gag gca ttt cag 400

Val Asp Ile Ser Gln Trp His Arg Lys Glu His Phe Glu Ala Phe Gln

15 20 25

tca gtt gct caa tgt acc tat aac cag acc gtt cag ctg gat att acg 448

Ser Val Ala Gln Cys Thr Tyr Asn Gln Thr Val Gln Leu Asp Ile Thr

30 35 40

gcc ttt tta aag acc gta aag aaa aat aag cac aag ttt tat ccg gcc 496

Ala Phe Leu Lys Thr Val Lys Lys Asn Lys His Lys Phe Tyr Pro Ala

45 50 55

ttt att cac att ctt gcc cgc ctg atg aat gct cat ccg gaa tta cgt 544

Phe Ile His Ile Leu Ala Arg Leu Met Asn Ala His Pro Glu Leu Arg

60 65 70

atg gca atg aaa gac ggt gag ctg gtg ata tgg gat agt gtt cac cct 592

Met Ala Met Lys Asp Gly Glu Leu Val Ile Trp Asp Ser Val His Pro

75 80 85 90

tgt tac acc gtt ttc cat gag caa act gaa acg ttt tca tcg ctc tgg 640

Cys Tyr Thr Val Phe His Glu Gln Thr Glu Thr Phe Ser Ser Leu Trp

95 100 105

agt gaa tac cac gac gat ttc cgg cag ttt cta cac ata tat tcg caa 688

Ser Glu Tyr His Asp Asp Phe Arg Gln Phe Leu His Ile Tyr Ser Gln

110 115 120

gat gtg gcg tgt tac ggt gaa aac ctg gcc tat ttc cct aaa ggg ttt 736

Asp Val Ala Cys Tyr Gly Glu Asn Leu Ala Tyr Phe Pro Lys Gly Phe

125 130 135

att gag aat atg ttt ttc gtc tca gcc aat ccc tgg gtg agt ttc acc 784

Ile Glu Asn Met Phe Phe Val Ser Ala Asn Pro Trp Val Ser Phe Thr

140 145 150

agt ttt gat tta aac gtg gcc aat atg gac aac ttc ttc gcc ccc gtt 832

Ser Phe Asp Leu Asn Val Ala Asn Met Asp Asn Phe Phe Ala Pro Val

155 160 165 170

ttc acc atg ggc aaa tat tat acg caa ggc gac aag gtg ctg atg ccg 880

Phe Thr Met Gly Lys Tyr Tyr Thr Gln Gly Asp Lys Val Leu Met Pro

175 180 185

ctg gcg att cag gtt cat cat gcc gtt tgt gat ggc ttc cat gtc ggc 928

Leu Ala Ile Gln Val His His Ala Val Cys Asp Gly Phe His Val Gly

190 195 200

aga tgc tta atg aat aca aca gta ctg cga tgagtggcag ggcggggcgt 978

Arg Cys Leu Met Asn Thr Thr Val Leu Arg

205 210

aaggcgcgcc atttaaatga agttcctatt ccgaagttcc tattctctag aaagtatagg 1038

aacttcgaag cagctccagc ctacaccctt cttcagggct gactgtttgc ataaaaattc 1098

atctgtatgc acaata 1114

<210> 83

<211> 212

<212> PRT

<213> 人工序列

<220>

<223> 人工序列说明：合成多肽

<400> 83

Met Glu Lys Lys Ile Thr Gly Tyr Thr Thr Val Asp Ile Ser Gln Trp

1 5 10 15

His Arg Lys Glu His Phe Glu Ala Phe Gln Ser Val Ala Gln Cys Thr

20 25 30

Tyr Asn Gln Thr Val Gln Leu Asp Ile Thr Ala Phe Leu Lys Thr Val

35 40 45

Lys Lys Asn Lys His Lys Phe Tyr Pro Ala Phe Ile His Ile Leu Ala

50 55 60

Arg Leu Met Asn Ala His Pro Glu Leu Arg Met Ala Met Lys Asp Gly

65 70 75 80

Glu Leu Val Ile Trp Asp Ser Val His Pro Cys Tyr Thr Val Phe His

85 90 95

Glu Gln Thr Glu Thr Phe Ser Ser Leu Trp Ser Glu Tyr His Asp Asp

100 105 110

Phe Arg Gln Phe Leu His Ile Tyr Ser Gln Asp Val Ala Cys Tyr Gly

115 120 125

Glu Asn Leu Ala Tyr Phe Pro Lys Gly Phe Ile Glu Asn Met Phe Phe

130 135 140

Val Ser Ala Asn Pro Trp Val Ser Phe Thr Ser Phe Asp Leu Asn Val

145 150 155 160

Ala Asn Met Asp Asn Phe Phe Ala Pro Val Phe Thr Met Gly Lys Tyr

165 170 175

Tyr Thr Gln Gly Asp Lys Val Leu Met Pro Leu Ala Ile Gln Val His

180 185 190

His Ala Val Cys Asp Gly Phe His Val Gly Arg Cys Leu Met Asn Thr

195 200 205

Thr Val Leu Arg

210

<210> 84

<211> 2521

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成多核苷酸

<400> 84

ttatttggtg atattggtac caatatcatg cagcaaacgg tgcaacattg ccgtgtctcg 60

ttgctctaaa agccccaggc gttgttgtaa ccagtcgacc agttttatgt catctgccac 120

tgccagagtc gtcagcaatg tcatggctcg ttcgcgtaaa gcttgcagtt gatgttggtc 180

tgccgttgca tcacttttcg ccggttgttg tattaatgtt gctaattgat agcaatagac 240

catcaccgcc tgccccagat tgagcgaagg ataatccgcc accatcggca caccagtaag 300

aacgtcagcc aacgctaact cttcgttagt caacccggaa tcttcgcgac caaacaccag 360

cgcggcatgg ctcatccatg aagatttttc ctctaacagc ggcaccagtt caactggcgt 420

ggcgtagtaa tgatatttcg cccgactgcg cgcagtggtg gcgacagtga aatcgacatc 480

gtgtaacgat tcagccaatg tcgggaaaac tttaatatta tcaataatat caccagatcc 540

atgtgcgacc cagcgggtgg ctggctccag gtgtgcctga ctatcgacaa tccgcagatc 600

gctaaacccc atcgttttca ttgcccgcgc cgctgcccca atattttctg ctctggcggg 660

tgcgaccaga ataatcgtta tacgcatatt gccactcttc ttgatcaaat aaccgcgaac 720

cgggtgatca ctgtcaactt attacgcggt gcgaatttac aaattcttaa cgtaagtcgc 780

agaaaaagcc ctttacttag cttaaaaaag gctaaactat ttcctgactg tactaacggt 840

tgagttgtta aaaaatgcta catatccttc tgtttactta ggataatttt ataaaaaata 900

aatctcgaca attggattca ccacgtttat tagttgtatg atgcaactag ttggattatt 960

aaaataatgt gacgaaagct agcatttaga tacgatgatt tcatcaaact gttaacgtgc 1020

tacaattgaa cttgatatat gtcaacgaag cgtagtttta ttgggtgtcc ggcccctctt 1080

agcctgttat gttgctgtta aaatggttag gatgacagcc gtttttgaca ctgtcgggtc 1140

ctgagggaaa gtacccacga ccaagctaat gatgttgttg acgttgatgg aaagtgcatc 1200

aagaacgcaa ttacgtactt tagtcatgtt acgccgatca tgttaatttg cagcatgcat 1260

caggcaggtc agggactttt gtacttcctg tttcgattta gttggcaatt taggtagcaa 1320

acgaattcat cggctttacc accgtcaaaa aaaacggcgc tttttagcgc cgtttttatt 1380

tttcaacctt atttccagat acgtaactca tcgtccgttg taacttcttt actggctttc 1440

attttcggca gtgaaaacgc ataccagtcg atattacggg tcacaaacat catgccggcc 1500

agcgccacca ccagcacact ggttcccaac aacagcgcgc tatcggcaga gttgagcagt 1560

ccccacatca caccatccag caacaacagc gcgagggtaa acaacatgct gttgcaccaa 1620

cctttcaata ccgcttgcaa ataaataccg ttcattatcg ccccaatcag actggcgatt 1680

atccatgcca cggtaaaacc ggtatgttca gaaagcgcca gcaagagcaa ataaaacatc 1740

accaatgaaa gccccaccag caaatattgc attgggtgta aacgttgcgc ggtgagcgtt 1800

tcaaaaacaa agaacgccat aaaagtcagt gcaatcagca gaatggcgta cttagtcgcc 1860

cggtcagtta attggtattg atcggctggc gtcgttactg cgacgctaaa cgccgggaag 1920

ttttcccagc cggtatcatt gcctgaagca aaacgctcac cgagattatt agcaaaccag 1980

ctgctttgcc agtgcgcctg aaaacctgac tcgctaactt cccgtttggc tggtagaaaa 2040

tcacctaaaa aactgggatg cggccagttg ctggttaagg tcatttcgct attacgcccg 2100

ccaggcacca cagaaagatc gccggtaccg cttaaattca gggccatatt cagcttcagg 2160

ttctgcttcc gccagtcccc ttcaggtaaa gggatatgca cgccctgccc gccttgctct 2220

aacccggtgc cgggttcaat ggtcagcgcc gttccgttaa cttcaggcgc tttcaccaca 2280

ccaataccac gcgcatcccc gacgctaatc acaataaatg gcttgcctaa ggtgatattt 2340

ggcgcgttga gttcgctaag acgcgaaaca tcgaaatcgg cttttaacgt taaatcactg 2400

tgccagacct gaccggtata aatccctatc ttgcgttctt ccacgttctg attgccatca 2460

accatcaatg actcaggtaa ccaaaaatgg ataaaacttc gtttccgctg cagggtttta 2520

t 2521

<210> 85

<211> 3010

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成多核苷酸

<400> 85

aagccacagc aggatgccca ctgcaacaaa ggtgatcaca ccggaaacgc gatggagaat 60

ggacgctatc gccgtgatgg ggaaccggat ggtctgtagg tccagattaa caggtctttg 120

ttttttcaca tttcttatca tgaataacgc ccacatgctg ttcttattat tccctgggga 180

ctacgggcac agaggttaac tttctgttac ctggagacgt cgggatttcc ttcctccggt 240

ctgcttgcgg gtcagacagc gtcctttcta taactgcgcg tcatgcaaaa cactgcttcc 300

agatgcgaaa acgacacgtt acaacgctgg gtggctcggg attgcagggt gttccggaga 360

cctggcggca gtataggctg ttcacaaaat cattacaatt aacctacata tagtttgtcg 420

ggttttatcc tgaacagtga tccaggtcac gataacaaca tttatttaat ttttaatcat 480

ctaatttgac aatcattcaa caaagttgtt acaaacatta ccaggaaaag catataatgc 540

gtaaaagtta tgaagtcggt atttcaccta agattaactt atgtaacagt gtggaagtat 600

tgaccaattc attcgggaca gttattagtg gtagacaagt ttaataattc ggattgctaa 660

gtacttgatt cgccatttat tcgtcatcaa tggatccttt acctgcaagc gcccagagct 720

ctgtacccag gttttcccct ctttcacaga gcggcgagcc aaataaaaaa cgggtaaagc 780

caggttgatg tgcgaaggca aatttaagtt ccggcagtct tacgcaataa ggcgctaagg 840

agaccttaaa tggctgatac aaaagcaaaa ctcaccctca acggggatac agctgttgaa 900

ctggatgtgc tgaaaggcac gctgggtcaa gatgttattg atatccgtac tctcggttca 960

aaaggtgtgt tcacctttga cccaggcttc acttcaaccg catcctgcga atctaaaatt 1020

acttttattg atggtgatga aggtattttg ctgcaccgcg gtttcccgat cgatcagctg 1080

gcgaccgatt ctaactacct ggaagtttgt tacatcctgc tgaatggtga aaaaccgact 1140

caggaacagt atgacgaatt taaaactacg gtgacccgtc ataccatgat ccacgagcag 1200

attacccgtc tgttccatgc tttccgtcgc gactcgcatc caatggcagt catgtgtggt 1260

attaccggcg cgctggcggc gttctatcac gactcgctgg atgttaacaa tcctcgtcac 1320

cgtgaaattg ccgcgttcct cctgctgtcg aaaatgccga ccatggccgc gatgtgttac 1380

aagtattcca ttggtcagcc atttgtttac ccgcgcaacg atctctccta cgccggtaac 1440

ttcctgaata tgatgttctc cacgccgtgc gaaccgtatg aagttaatcc gattctggaa 1500

cgtgctatgg accgtattct gatcctgcac gctgaccatg aacagaacgc ctctacctcc 1560

accgtgcgta ccgctggctc ttcgggtgcg aacccgtttg cctgtatcgc agcaggtatt 1620

gcttcactgt ggggacctgc gcacggcggt gctaacgaag cggcgctgaa aatgctggaa 1680

gaaatcagct ccgttaaaca cattccggaa tttgttcgtc gtgcgaaaga caaaaatgat 1740

tctttccgcc tgatgggctt cggtcaccgc gtgtacaaaa attacgaccc gcgcgccacc 1800

gtaatgcgtg aaacctgcca tgaagtgctg aaagagctgg gcacgaagga tgacctgctg 1860

gaagtggcta tggagctgga aaacatcgcg ctgaacgacc cgtactttat cgagaagaaa 1920

ctgtacccga acgtcgattt ctactctggt atcatcctga aagcgatggg tattccgtct 1980

tccatgttca ccgtcatttt cgcaatggca cgtaccgttg gctggatcgc ccactggagc 2040

gaaatgcaca gtgacggtat gaagattgcc cgtccgcgtc agctgtatac aggatatgaa 2100

aaacgcgact ttaaaagcga tatcaagcgt taatggttga ttgctaagtt gtaaatattt 2160

taacccgccg ttcatatggc gggttgattt ttatatgcct aaacacaaaa aattgtaaaa 2220

ataaaatcca ttaacagacc tatatagata tttaaaaaga atagaacagc tcaaattatc 2280

agcaacccaa tactttcaat taaaaacttc atggtagtcg catttataac cctatgaaaa 2340

tgacgtctat ctataccccc ctatatttta ttcatcatac aacaaattca tgataccaat 2400

aatttagttt tgcatttaat aaaactaaca atatttttaa gcaaaactaa aaactagcaa 2460

taatcaaata cgatattctg gcgtagctat acccctattc tatatcctta aaggactctg 2520

ttatgtttaa aggacaaaaa acattggccg cactggccgt atctctgctg ttcactgcac 2580

ctgtttatgc tgctgatgaa ggttctggcg aaattcactt taagggggag gttattgaag 2640

caccttgtga aattcatcca gaagatattg ataaaaacat agatcttgga caagtcacga 2700

caacccatat aaaccgggag catcatagca ataaagtggc cgtcgacatt cgcttgatca 2760

actgtgatct gcctgcttct gacaacggta gcggaatgcc ggtatccaaa gttggcgtaa 2820

ccttcgatag cacggctaag acaactggtg ctacgccttt gttgagcaac accagtgcag 2880

gcgaagcaac tggggtcggt gtacgactga tggacaaaaa tgacggtaac atcgtattag 2940

gttcagccgc gccagatctt gacctggatg caagctcatc agaacagacg ctgaactttt 3000

tcgcctggat 3010

<210> 86

<211> 4180

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成多核苷酸

<400> 86

cgcgatgtcg acgtcacgaa actgaaaaaa ccgctctaca ttctggcgac tgctgatgaa 60

gaaaccagta tggccggagc gcgttatttt gccgaaacta ccgccctgcg cccggattgc 120

gccatcattg gcgaaccgac gtcactacaa ccggtacgcg cacataaagg tcatatctct 180

aacgccatcc gtattcaggg ccagtcgggg cactccagcg atccagcacg cggagttaac 240

gctatcgaac taatgcacga cgccatcggg catattttgc aattgcgcga taacctgaaa 300

gaacgttatc actacgaagc gtttaccgtg ccatacccta cgctcaacct cgggcatatt 360

cacggtggcg acgcttctaa ccgtatttgc gcttgctgtg agttgcatat ggatattcgt 420

ccgctgcctg gcatgacact caatgaactt aatggtttgc tcaacgatgc attggctccg 480

gtgagcgaac gctggccggg tcgtctgacg gtcgacgagc tgcatccgcc gatccctggc 540

tatgaatgcc caccgaatca tcaactggtt gaagtggttg agaaattgct cggagcaaaa 600

accgaagtgg tgaactactg taccgaagcg ccgtttattc aaacgttatg cccgacgctg 660

gtgttggggc ctggctcaat taatcaggct catcaacctg atgaatatct ggaaacacgg 720

tttatcaagc ccacccgcga actgataacc caggtaattc accatttttg ctggcattaa 780

aacgtaggcc ggataaggcg ctcgcgccgc atccggcgct gttgccaaac tccagtgccg 840

caataatgtc ggatgcgatg cttgcgcatc ttatccgacc tacagtgact caaacgatgc 900

ccaaccgtag gccggataag gcgctcgcgc cgcatccggc actgttgcca aactccagtg 960

ccgcaataat gtcggatgcg atacttgcgc atcttatccg accgacagtg actcaaacga 1020

tgcccaactg taggccggat aaggcgctcg cgccgcatcc ggcactgttg ccaaactcca 1080

gtgccgcaat aatgtcggat gcgatacttg cgcatcttat ccgacctaca cctttggtgt 1140

tacttggggc gattttttaa catttccata agttacgctt atttaaagcg tcgtgaattt 1200

aatgacgtaa attcctgcta tttattcgtt tgctgaagcg atttcgcagc atttgacgtc 1260

accgctttta cgtggcttta taaaagacga cgaaaagcaa agcccgagca tattcgcgcc 1320

aatgctagca agaggagaag tcgacatgac agacttaaat aaagtggtaa aagaacttga 1380

agctcttggt atttatgacg taaaagaagt tgtttacaat ccaagctacg agcaattgtt 1440

cgaagaagaa actaaaccag gtttagaagg ctttgaaaaa ggtactttaa ctacgactgg 1500

tgcagtggca gtagatacag gtatcttcac aggtcgttct ccaaaagata aatatatcgt 1560

gttagatgaa aaaaccaaag atactgtttg gtggacatct gaaacagcaa aaaacgacaa 1620

caagccaatg aaccaagcta catggcaaag cttaaaagac ttggtaacca accagctttc 1680

tcgtaaacgc ttatttgtag ttgatggttt ctgtggtgcg agcgaacacg accgtattgc 1740

agtacgtatt gtcactgaag tagcgtggca agcacatttt gtaaaaaata tgtttattcg 1800

cccaactgaa gaacaactca aaaattttga accagatttc gttgtaatga atggttctaa 1860

agtaaccaat ccaaactgga aagaacaagg tttaaattca gaaaactttg ttgctttcaa 1920

cttgactgaa cgcattcaat taatcggtgg tacttggtac ggcggtgaaa tgaaaaaagg 1980

tatgttctca atcatgaact acttcctacc acttaaaggt gttggtgcaa tgcactgctc 2040

agctaacgtt ggtaaagatg gcgatgtagc aatcttcttc ggcttatctg gcacaggtaa 2100

aacaaccctt tcaacggatc caaaacgtga attaatcggt gacgatgaac acggctggga 2160

tgatgtgggt atctttaact ttgaaggtgg ttgctatgcg aaaaccattc acctttcaga 2220

agaaaatgaa ccagatattt accgcgctat ccgtcgcgac gcattattag aaaacgtggt 2280

tgttcgtgca gatggttctg ttgatttcga tgatggttca aaaacagaaa atactcgcgt 2340

gtcttaccca atttatcaca ttgataacat tgtaaaacca gtttctcgtg caggtcacgc 2400

aactaaagtg attttcttaa ctgcagatgc atttggcgta ttaccaccag tatctaaatt 2460

gacaccagaa caaactaaat actacttctt atctggtttc acagcaaaat tagcaggtac 2520

tgaacgtggt attactgaac caactccaac tttctcagca tgtttcggtg ctgcgttctt 2580

aacccttcac ccaactcaat atgcagaagt gttagtaaaa cgtatgcaag cagtgggtgc 2640

tgaagcttac ttagtaaata ctggttggaa tggcacaggc aaacgtatct caatcaaaga 2700

tactcgcgga atcattgatg caatcttaga tggctcaatt gaaaaagctg aaatgggcga 2760

attaccaatc tttaacttag ccattcctaa agcattacca ggtgtagatt ctgcaatctt 2820

agatcctcgc gatacttacg cagataaagc acaatggcaa tcaaaagctg aagacttagc 2880

aggtcgtttt gtgaaaaact ttgttaaata tgcaactaac gaagaaggca aagctttaat 2940

tgcagctggt cctaaagctt aatctagaaa gcttcctaga ggcatcaaat aaaacgaaag 3000

gctcagtcga aagactgggc ctttcgtttt atctgttgtt tgtcggtgaa cgctctcctg 3060

agtaggacga attcacttct gttctaacac cctcgttttc aatatatttc tgtctgcatt 3120

ttattcaaat tctgaatata ccttcagata tccttaagga attgtcgtta cattcggcga 3180

tattttttca agacaggttc ttactatgca ttccacagaa gtccaggcta aacctctttt 3240

tagctggaaa gccctgggtt gggcactgct ctacttttgg tttttctcta ctctgctaca 3300

ggccattatt tacatcagtg gttatagtgg cactaacggc attcgcgact cgctgttatt 3360

cagttcgctg tggttgatcc cggtattcct ctttccgaag cggattaaaa ttattgccgc 3420

agtaatcggc gtggtgctat gggcggcctc tctggcggcg ctgtgctact acgtcatcta 3480

cggtcaggag ttctcgcaga gcgttctgtt tgtgatgttc gaaaccaaca ccaacgaagc 3540

cagcgagtat ttaagccagt atttcagcct gaaaattgtg cttatcgcgc tggcctatac 3600

ggcggtggca gttctgctgt ggacacgcct gcgcccggtc tatattccaa agccgtggcg 3660

ttatgttgtc tcttttgccc tgctttatgg cttgattctg catccgatcg ccatgaatac 3720

gtttatcaaa aacaagccgt ttgagaaaac gttggataac ctggcctcgc gtatggagcc 3780

tgccgcaccg tggcaattcc tgaccggcta ttatcagtat cgtcagcaac taaactcgct 3840

aacaaagtta ctgaatgaaa ataatgcctt gccgccactg gctaatttca aagatgaatc 3900

gggtaacgaa ccgcgcactt tagtgctggt gattggcgag tcgacccagc gcggacgcat 3960

gagtctgtac ggttatccgc gtgaaaccac gccggagctg gatgcgctgc ataaaaccga 4020

tccgaatctg accgtgttta ataacgtagt tacgtctcgt ccgtacacca ttgaaatcct 4080

gcaacaggcg ctgacctttg ccaatgaaaa gaacccggat ctgtatctga cgcagccgtc 4140

gctgatgaac atgatgaaac aggcgggtta taaaaccttc 4180

<210> 87

<211> 4960

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成多核苷酸

<400> 87

aataggcgta tcacgaggcc ctttcgtctt cacctcgaga attgtgagcg gataacaatt 60

gacattgtga gcggataaca agatactgag cacatcagca ggacgcactg accgaattca 120

attaagctag caagaggaga agtcgagatg aacttacatg aatatcaggc aaaacaactt 180

tttgcccgct atggcttacc agcaccggtg ggttatgcct gtactactcc gcgcgaagca 240

gaagaagccg cttcaaaaat cggtgccggt ccgtgggtag tgaaatgtca ggttcacgct 300

ggtggccgcg gtaaagcggg cggtgtgaaa gttgtaaaca gcaaagaaga catccgtgct 360

tttgcagaaa actggctggg caagcgtctg gtaacgtatc aaacagatgc caatggccaa 420

ccggttaacc agattctggt tgaagcagcg accgatatcg ctaaagagct gtatctcggt 480

gccgttgttg accgtagttc ccgtcgtgtg gtctttatgg cctccaccga aggcggcgtg 540

gaaatcgaaa aagtggcgga agaaactccg cacctgatcc ataaagttgc gcttgatccg 600

ctgactggcc cgatgccgta tcagggacgc gagctggcgt tcaaactggg tctggaaggt 660

aaactggttc agcagttcac caaaatcttc atgggcctgg cgaccatttt cctggagcgc 720

gacctggcgt tgatcgaaat caacccgctg gtcatcacca aacagggcga tctgatttgc 780

ctcgacggca aactgggcgc tgacggcaac gcactgttcc gccagcctga tctgcgcgaa 840

atgcgtgacc agtcgcagga agatccgcgt gaagcacagg ctgcacagtg ggaactgaac 900

tacgttgcgc tggacggtaa catcggttgt atggttaacg gcgcaggtct ggcgatgggt 960

acgatggaca tcgttaaact gcacggcggc gaaccggcta acttccttga cgttggcggc 1020

ggcgcaacca aagaacgtgt aaccgaagcg ttcaaaatca tcctctctga cgacaaagtg 1080

aaagccgttc tggttaacat cttcggcggt atcgttcgtt gcgacctgat cgctgacggt 1140

atcatcggcg cggtagcaga agtgggtgtt aacgtaccgg tcgtggtacg tctggaaggt 1200

aacaacgccg aactcggcgc gaagaaactg gctgacagcg gcctgaatat tattgcagca 1260

aaaggtctga cggatgcagc tcagcaggtt gttgccgcag tggaggggaa ataatgtcca 1320

ttttaatcga taaaaacacc aaggttatct gccagggctt taccggtagc caggggactt 1380

tccactcaga acaggccatt gcatacggca ctaaaatggt tggcggcgta accccaggta 1440

aaggcggcac cacccacctc ggcctgccgg tgttcaacac cgtgcgtgaa gccgttgctg 1500

ccactggcgc taccgcttct gttatctacg taccagcacc gttctgcaaa gactccattc 1560

tggaagccat cgacgcaggc atcaaactga ttatcaccat cactgaaggc atcccgacgc 1620

tggatatgct gaccgtgaaa gtgaagctgg atgaagcagg cgttcgtatg atcggcccga 1680

actgcccagg cgttatcact ccgggtgaat gcaaaatcgg tatccagcct ggtcacattc 1740

acaaaccggg taaagtgggt atcgtttccc gttccggtac actgacctat gaagcggtta 1800

aacagaccac ggattacggt ttcggtcagt cgacctgtgt cggtatcggc ggtgacccga 1860

tcccgggctc taactttatc gacattctcg aaatgttcga aaaagatccg cagaccgaag 1920

cgatcgtgat gatcggtgag atcggcggta gcgctgaaga agaagcagct gcgtacatca 1980

aagagcacgt taccaagcca gttgtgggtt acatcgctgg tgtgactgcg ccgaaaggca 2040

aacgtatggg ccacgcgggt gccatcattg ccggtgggaa agggactgcg gatgagaaat 2100

tcgctgctct ggaagccgca ggcgtgaaaa ccgttcgcag cctggcggat atcggtgaag 2160

cactgaaaac tgttctgaaa taatctagca agaggagaag tcgacatgga aatcaaagaa 2220

atggtgagcc ttgcacgcaa ggctcagaag gagtatcaag ctacccataa ccaagaagca 2280

gttgacaaca tttgccgagc tgcagcaaaa gttatttatg aaaatgcagc tattctggct 2340

cgcgaagcag tagacgaaac cggcatgggc gtttacgaac acaaagtggc caagaatcaa 2400

ggcaaatcca aaggtgtttg gtacaacctc cacaataaaa aatcgattgg tatcctcaat 2460

atagacgagc gtaccggtat gatcgagatt gcaaagccta tcggagttgt aggagccgta 2520

acgccgacga ccaacccgat cgttactccg atgagcaata tcatctttgc tcttaagacc 2580

tgcaatgcca tcattattgc cccccacccc agatccaaaa aatgctctgc acacgcagtt 2640

cgtctgatca aagaagctat cgctccgttc aacgtaccgg aaggtatggt tcagatcatc 2700

gaagaaccca gcatcgagaa gacgcaggaa ctcatgggcg ccgtagacgt agtagttgct 2760

acgggtggta tgggcatggt gaagtctgca tattcttcag gaaagccttc tttcggtgtt 2820

ggagccggta acgttcaggt gatcgtggat agcaacatcg atttcgaagc tgctgcagaa 2880

aaaatcatca ccggtcgtgc tttcgacaac ggtatcatct gctcaggcga acagagcatc 2940

atctacaacg aggctgacaa ggaagcagtt ttcacagcat tccgcaacca cggtgcatat 3000

ttctgtgacg aagccgaagg agatcgggct cgtgcagcta tcttcgaaaa tggagccatc 3060

gcgaaagatg tagtaggtca gagcgttgcc ttcattgcca agaaagcaaa catcaatatc 3120

cccgagggta cccgtattct cgttgttgaa gctcgcggcg taggagcaga agacgttatc 3180

tgtaaggaaa agatgtgtcc cgtaatgtgc gccctcagct acaagcactt cgaagaaggt 3240

gtagaaatcg cacgtacgaa cctcgccaac gaaggtaacg gccacacctg tgctatccac 3300

tccaacaatc aggcacacat catcctcgca ggatcagagc tgacggtatc tcgtatcgta 3360

gtgaatgctc cgagtgccac tacagcaggc ggtcacatcc aaaacggtct tgccgtaacc 3420

aatacgctcg gatgcggatc atggggtaat aactctatct ccgagaactt cacttacaag 3480

cacctcctca acatttcacg catcgcaccg ttgaattcaa gcattcacat ccccgatgac 3540

aaagaaatct gggaactcta atctagcaag aggagaagtc gacatgcaac ttttcaaact 3600

caagagtgta acacatcact ttgacacttt tgcagaattt gccaaggaat tctgtcttgg 3660

agaacgcgac ttggtaatta ccaacgagtt catctatgaa ccgtatatga aggcatgcca 3720

gctcccctgc cattttgtta tgcaggagaa atatgggcaa ggcgagcctt ctgacgaaat 3780

gatgaataac atcttggcag acatccgtaa tatccagttc gaccgcgtaa tcggtatcgg 3840

aggaggtacg gttattgaca tctctaaact tttcgttctg aaaggattaa atgatgtact 3900

cgatgcattc gaccgcaaaa tacctcttat caaagagaaa gaactgatca ttgtgcccac 3960

aacatgcgga acgggtagcg aggtgacgaa catttctatc gcagaaatca aaagccgtca 4020

caccaaaatg ggattggctg acgatgccat tgttgcagac catgccatca tcatacctga 4080

acttctgaag agcttgcctt tccacttcta cgcatgcagt gcaatcgatg ctcttatcca 4140

tgccatcgag tcatacgtat ctcctaaagc cagtccatat tctcgtctgt tcagtgaggc 4200

ggcttgggac attatcctgg aagtattcaa gaaaatcgcc gaacacggcc ctgaataccg 4260

cttcgaaaag ctgggagaaa tgatcatggc cagcaactat gccggtatag ccttcggaaa 4320

tgcaggagta ggagccgtcc acgcactatc ctacccgttg ggaggcaact atcacgtgcc 4380

gcatggagaa gcaaactatc agttcttcac agaggtattc aaagtatacc aaaagaagaa 4440

tcctttcggc tatatagtcg aactcaactg gaagctctcc aagatactga actgccagcc 4500

cgaatacgta tatccgaagc tggatgaact tctcggatgc cttcttacca agaaaccttt 4560

gcacgaatac ggcatgaagg acgaagaggt aagaggcttt gcggaatcag tgcttaagac 4620

acagcaaaga ttgctcgcca acaactacgt agagcttact gtagatgaga tcgaaggtat 4680

ctacagaaga ctctactaat ctagaaagct tcctagaggc atcaaataaa acgaaaggct 4740

cagtcgaaag actgggcctt tcgttttatc tgttgtttgt cggtgaacgc tctcctgagt 4800

aggacaaatc cgccgcccta gacctaggcg ttcggctgcg acacgtcttg agcgattgtg 4860

taggctggag ctgcttcgaa gttcctatac tttctagaga ataggaactt cggaatagga 4920

actaaggagg atattcatat ggaccatggc taattcccat 4960

<210> 88

<211> 5083

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成多核苷酸

<400> 88

tcgagaaatt tatcaaaaag agtgttgact tgtgagcgga taacaatgat acttagattc 60

aattgtgagc ggataacaat ttcacacaga attcaattaa gctagcaaga ggagaagtcg 120

acatggccaa cataagttca ccattcgggc aaaacgaatg gctggttgaa gagatgtacc 180

gcaagttccg cgacgacccc tcctcggtcg atcccagctg gcacgagttc ctggttgact 240

acagccccga acccacctcc caaccagctg ccgaaccaac ccgggttacc tcgccactcg 300

ttgccgagcg ggccgctgcg gccgccccgc aggcaccccc caagccggcc gacaccgcgg 360

ccgcgggcaa cggcgtggtc gccgcactgg ccgccaaaac tgccgttccc ccgccagccg 420

aaggtgacga ggtagcggtg ctgcgcggcg ccgccgcggc cgtcgtcaag aacatgtccg 480

cgtcgttgga ggtgccgacg gcgaccagcg tccgggcggt cccggccaag ctactgatcg 540

acaaccggat cgtcatcaac aaccagttga agcggacccg cggcggcaag atctcgttca 600

cgcatttgct gggctacgcc ctggtgcagg cggtgaagaa attcccgaac atgaaccggc 660

actacaccga agtcgacggc aagcccaccg cggtcacgcc ggcgcacacc aatctcggcc 720

tggcgatcga cctgcaaggc aaggacggga agcgttccct ggtggtggcc ggcatcaagc 780

ggtgcgagac catgcgattc gcgcagttcg tcacggccta cgaagacatc gtacgccggg 840

cccgcgacgg caagctgacc actgaagact ttgccggcgt gacgatttcg ctgaccaatc 900

ccggaaccat cggcaccgtg cattcggtgc cgcggctgat gcccggccag ggcgccatca 960

tcggcgtggg cgccatggaa taccccgccg agtttcaagg cgccagcgag gaacgcatcg 1020

ccgagctggg catcggcaaa ttgatcactt tgacctccac ctacgaccac cgcatcatcc 1080

agggcgcgga atcgggcgac ttcctgcgca ccatccacga gttgctgctc tcggatggct 1140

tctgggacga ggtcttccgc gaactgagca tcccatatct gccggtgcgc tggagcaccg 1200

acaaccccga ctcgatcgtc gacaagaacg ctcgcgtcat gaacttgatc gcggcctacc 1260

gcaaccgcgg ccatctgatg gccgataccg acccgctgcg gttggacaaa gctcggttcc 1320

gcagtcaccc cgacctcgaa gtgctgaccc acggcctgac gctgtgggat ctcgatcggg 1380

tgttcaaggt cgacggcttt gccggtgcgc agtacaagaa actgcgcgac gtgctgggct 1440

tgctgcgcga tgcctactgc cgccacatcg gcgtggagta cgcccatatc ctcgaccccg 1500

aacaaaagga gtggctcgaa caacgggtcg agaccaagca cgtcaaaccc actgtggccc 1560

aacagaaata catcctcagc aagctcaacg ccgccgaggc ctttgaaacg ttcctacaga 1620

ccaagtacgt cggccagaag cggttctcgc tggaaggcgc cgaaagcgtg atcccgatga 1680

tggacgcggc gatcgaccag tgcgctgagc acggcctcga cgaggtggtc atcgggatgc 1740

cgcaccgggg ccggctcaac gtgctggcca acatcgtcgg caagccgtac tcgcagatct 1800

tcaccgagtt cgagggcaac ctgaatccgt cgcaggcgca cggctccggt gacgtcaagt 1860

accacctggg cgccaccggg ctgtacctgc agatgttcgg cgacaacgac attcaggtgt 1920

cgctgaccgc caacccgtcg catctggagg ccgtcgaccc ggtgctggag ggattggtgc 1980

gggccaagca ggatctgctc gaccacggaa gcatcgacag cgacggccaa cgggcgttct 2040

cggtggtgcc gctgatgttg catggcgatg ccgcgttcgc cggtcagggt gtggtcgccg 2100

agacgctgaa cctggcgaat ctgccgggct accgcgtcgg cggcaccatc cacatcatcg 2160

tcaacaacca gatcggcttc accaccgcgc ccgagtattc caggtccagc gagtactgca 2220

ccgacgtcgc aaagatgatc ggggcaccga tctttcacgt caacggcgac gacccggagg 2280

cgtgtgtctg ggtggcgcgg ttggcggtgg acttccgaca acggttcaag aaggacgtcg 2340

tcatcgacat gctgtgctac cgccgccgcg ggcacaacga gggtgacgac ccgtcgatga 2400

ccaaccccta catgtacgac gtcgtcgaca ccaagcgcgg ggcccgcaaa agctacaccg 2460

aagccctgat cggacgtggc gacatctcga tgaaggaggc cgaggacgcg ctgcgcgact 2520

accagggcca gctggaacgg gtgttcaacg aagtgcgcga gctggagaag cacggtgtgc 2580

agccgagcga gtcggtcgag tccgaccaga tgattcccgc ggggctggcc actgcggtgg 2640

acaagtcgct gctggcccgg atcggcgatg cgttcctcgc cttgccgaac ggcttcaccg 2700

cgcacccgcg agtccaaccg gtgctggaga agcgccggga gatggcctat gaaggcaaga 2760

tcgactgggc ctttggcgag ctgctggcgc tgggctcgct ggtggccgaa ggcaagctgg 2820

tgcgcttgtc ggggcaggac agccgccgcg gcaccttctc ccagcggcat tcggttctca 2880

tcgaccgcca cactggcgag gagttcacac cactgcagct gctggcgacc aactccgacg 2940

gcagcccgac cggcggaaag ttcctggtct acgactcgcc actgtcggag tacgccgccg 3000

tcggcttcga gtacggctac actgtgggca atccggacgc cgtggtgctc tgggaggcgc 3060

agttcggcga cttcgtcaac ggcgcacagt cgatcatcga cgagttcatc agctccggtg 3120

aggccaagtg gggccaattg tccaacgtcg tgctgctgtt accgcacggg cacgaggggc 3180

agggacccga ccacacttct gcccggatcg aacgcttctt gcagttgtgg gcggaaggtt 3240

cgatgaccat cgcgatgccg tcgactccgt cgaactactt ccacctgcta cgccggcatg 3300

ccctggacgg catccaacgc ccgctgatcg tgttcacgcc caagtcgatg ttgcgtcaca 3360

aggccgccgt cagcgaaatc aaggacttca ccgagatcaa gttccgctca gtgctggagg 3420

aacccaccta tgaggacggc atcggagacc gcaacaaggt cagccggatc ctgctgacca 3480

gtggcaagct gtattacgag ctggccgccc gcaaggccaa ggacaaccgc aatgacctcg 3540

cgatcgtgcg gcttgaacag ctcgccccgc tgcccaggcg tcgactgcgt gaaacgctgg 3600

accgctacga gaacgtcaag gagttcttct gggtccaaga ggaaccggcc aaccagggtg 3660

cgtggccgcg attcgggctc gaactacccg agctgctgcc tgacaagttg gccgggatca 3720

agcgaatctc gcgccgggcg atgtcagccc cgtcgtcagg ctcgtcgaag gtgcacgccg 3780

tcgaacagca ggagatcctc gacgaggcgt tcggctaatc tagcaagagg agaagtcgac 3840

atgaagttat taaaattggc acctgatgtt tataaatttg atactgcaga ggagtttatg 3900

aaatacttta aggttggaaa aggtgacttt atacttacta atgaattttt atataaacct 3960

ttccttgaga aattcaatga tggtgcagat gctgtatttc aggagaaata tggactcggt 4020

gaaccttctg atgaaatgat aaacaatata attaaggata ttggagataa acaatataat 4080

agaattattg ctgtaggggg aggatctgta atagatatag ccaaaatcct cagtcttaag 4140

tatactgatg attcattgga tttgtttgag ggaaaagtac ctcttgtaaa aaacaaagaa 4200

ttaattatag ttccaactac atgtggaaca ggttcagaag ttacaaatgt atcagttgca 4260

gaattaaaga gaagacatac taaaaaagga attgcttcag acgaattata tgcaacttat 4320

gcagtacttg taccagaatt tataaaagga cttccatata agttttttgt aaccagctcc 4380

gtagatgcct taatacatgc aacagaagct tatgtatctc caaatgcaaa tccttatact 4440

gatatgttta gtgtaaaagc tatggagtta attttaaatg gatacatgca aatggtagag 4500

aaaggaaatg attacagagt tgaaataatt gaggattttg ttataggcag caattatgca 4560

ggtatagctt ttggaaatgc aggagtggga gcggttcacg cactctcata tccaataggc 4620

ggaaattatc atgtgcctca tggagaagca aattatctgt tttttacaga aatatttaaa 4680

acttattatg agaaaaatcc aaatggcaag attaaagatg taaataaact attagcaggc 4740

atactaaaat gtgatgaaag tgaagcttat gacagtttat cacaactttt agataaatta 4800

ttgtcaagaa aaccattaag agaatatgga atgaaagagg aagaaattga aacttttgct 4860

gattcagtaa tagaaggaca gcagagactg ttggtaaaca attatgaacc tttttcaaga 4920

gaagacatag taaacacata taaaaagtta tattaatcta gaaagcttcc tagaggcatc 4980

aaataaaacg aaaggctcag tcgaaagact gggcctttcg ttttatctgt tgtttgtcgg 5040

tgaacgctct cctgagtagg acaaatccgc cgccctagac cta 5083

<210> 89

<211> 5097

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成多核苷酸

<400> 89

tctgtatcag gctgaaaatc ttctctcatc cgccaaaaca gcttcggcgt taagatgcgc 60

gctcaaggac gtaagccgtc gactctcgcc gtgctggcgc aggacacggc taccactcct 120

ttctctgttg atattctgct tgccattgag caaaccgcca gcgagttcgg ctggaatagt 180

tttttaatca atattttttc tgaagatgac gctgcccgcg cggcacgtca gctgcttgcc 240

caccgtccgg atggcattat ctatactaca atggggctgc gacatatcac gctgcctgag 300

tctctgtatg gtgaaaatat tgtattggcg aactgtgtgg cggatgaccc agcgttaccc 360

agttatatcc ctgatgatta cactgcacaa tatgaatcaa cacagcattt gctcgcggcg 420

ggctatcgtc aaccgttatg cttctggcta ccggaaagtg cgttggcaac agggtatcgt 480

cggcagggat ttgagcaggc ctggcgtgat gctggacgag atctggctga ggtgaaacaa 540

tttcacatgg caacaggtga tgatcactac accgatctcg caagtttact caatgcccac 600

ttcaaaccgg gcaaaccaga ttttgatgtt ctgatatgtg gtaacgatcg cgcagccttt 660

gtggcttatc aggttcttct ggcgaagggg gtacgaatcc cgcaggatgt cgccgtaatg 720

ggctttgata atctggttgg cgtcgggcat ctgtttttac cgccgctgac cacaattcag 780

cttccacatg acattatcgg gcgggaagct gcattgcata ttattgaagg tcgtgaaggg 840

ggaagagtga cgcggatccc ttgcccgctg ttgatccgtt gttccacctg atattatgtt 900

aacccagtag ccagagtgct ccatgttgca gcacagccac tccgtgggag gcataaagcg 960

acagttcccg ttcttctggc tgcggataga ttcgactact catcaccgct tccccgtcgt 1020

taataaatac ttccacggat gatgtatcga taaatatcct tagggcgagc gtgtcacgct 1080

gcgggagggg aatactacgg tagccgtcta aattctcgtg tgggtaatac cgccacaaaa 1140

caagtcgctc agattggtta tcaatataca gccgcattcc agtgccgagc tgtaatccgt 1200

aatgttcggc atcactgttc ttcagcgccc actgcaactg aatctcaact gcttgcgcgt 1260

tttcctgcaa aacatattta ttgctgattg tgcggggaga gacagattga tgctgctggc 1320

gtaacgactc agcttcgtgt accgggcgtt gtagaagttt gccattgctc tctgatagct 1380

cgcgcgccag cgtcatgcag cctgcccatc cttcacgttt tgagggcatt ggcgattccc 1440

acatatccat ccagccgata acaatacgcc gaccatcctt cgctaaaaag ctttgtggtg 1500

cataaaagtc atgcccgtta tcaagttcag taaaatgccc ggattgtgca aaaagtcgtc 1560

ctggcgacca cattccgggt attacgccac tttgaaagcg atttcggtaa ctgtatccct 1620

cggcattcat tccctgcggg gaaaacatca gataatgctg atcgccaagg ctgaaaaagt 1680

ccggacattc ccacatatag ctttcacccg catcagcgtg ggccagtacg cgatcgaagg 1740

tccattcacg caacgaactg ccgcgataaa gcaggatctg ccccgtgttg cctggatctt 1800

tcgccccgac taccatccac catgtgtcgg cttcacgcca cactttagga tcgcggaagt 1860

gcatgattcc ttctggtgga gtgaggatca caccctgttt ctcgaaatga ataccatccc 1920

gactggtagc cagacattgt acttcgcgaa ttgcatcgtc attacctgca ccatcgagcc 1980

agacgtgtcc ggtgtagata agtgagagga caccattgtc atcgacagca ctacctgaaa 2040

aacacccgtc tttgtcatta tcgtctcctg gcgctagcgc aataggctca tgctgccagt 2100

ggatcatatc gtcgctggtg gcatgtcccc agtgcattgg cccccagtgt tcgctcatcg 2160

gatgatgttg ataaaacgcg tgataacgat cgttaaacca gatcaggccg tttggatcgt 2220

tcatccaccc ggcaggaggc gcgaggtgaa aatggggata gaaagtgtta ccccggtgct 2280

catgaagttt tgctagggcg ttttgcgccg catgcaatcg agattgcgtc attttaatca 2340

tcctggttaa gcaaatttgg tgaattgtta acgttaactt ttataaaaat aaagtccctt 2400

actttcataa atgcgatgaa tatcacaaat gttaacgtta actatgacgt tttgtgatcg 2460

aatatgcatg ttttagtaaa tccatgacga ttttgcgaaa aagaggttta tcactatgcg 2520

taactcagat gaatttaagg gaaaaaaatg tcagccaaag tatgggtttt aggggatgcg 2580

gtcgtagatc tcttgccaga atcagacggg cgcctactgc cttgtcctgg cggcgcgcca 2640

gctaacgttg cggtgggaat cgccagatta ggcggaacaa gtgggtttat aggtcgggtg 2700

ggggatgatc cttttggtgc gttaatgcaa agaacgctgc taactgaggg agtcgatatc 2760

acgtatctga agcaagatga atggcaccgg acatccacgg tgcttgtcga tctgaacgat 2820

caaggggaac gttcatttac gtttatggtc cgccccagtg ccgatctttt tttagagacg 2880

acagacttgc cctgctggcg acatggcgaa tggttacatc tctgttcaat tgcgttgtct 2940

gccgagcctt cgcgtaccag cgcatttact gcgatgacgg cgatccggca tgccggaggt 3000

tttgtcagct tcgatcctaa tattcgtgaa gatctatggc aagacgagca tttgctccgc 3060

ttgtgtttgc ggcaggcgct acaactggcg gatgtcgtca agctctcgga agaagaatgg 3120

cgacttatca gtggaaaaac acagaacgat caggatatat gcgccctggc aaaagagtat 3180

gagatcgcca tgctgttggt gactaaaggt gcagaagggg tggtggtctg ttatcgagga 3240

caagttcacc attttgctgg aatgtctgtg aattgtgtcg atagcacggg ggcgggagat 3300

gcgttcgttg ccgggttact cacaggtctg tcctctacgg gattatctac agatgagaga 3360

gaaatgcgac gaattatcga tctcgctcaa cgttgcggag cgcttgcagt aacggcgaaa 3420

ggggcaatga cagcgctgcc atgtcgacaa gaactggaat agtgagaagt aaacggcgaa 3480

gtcgctctta tctctaaata ggacgtgaat tttttaacga caggcaggta attatggcac 3540

tgaatattcc attcagaaat gcgtactatc gttttgcatc cagttactca tttctctttt 3600

ttatttcctg gtcgctgtgg tggtcgttat acgctatttg gctgaaagga catctagggt 3660

tgacagggac ggaattaggt acactttatt cggtcaacca gtttaccagc attctattta 3720

tgatgttcta cggcatcgtt caggataaac tcggtctgaa gaaaccgctc atctggtgta 3780

tgagtttcat cctggtcttg accggaccgt ttatgattta cgtttatgaa ccgttactgc 3840

aaagcaattt ttctgtaggt ctaattctgg gggcgctatt ttttggcttg gggtatctgg 3900

cgggatgcgg tttgcttgat agcttcaccg aaaaaatggc gcgaaatttt catttcgaat 3960

atggaacagc gcgcgcctgg ggatcttttg gctatgctat tggcgcgttc tttgccggca 4020

tattttttag tatcagtccc catatcaact tctggttggt ctcgctattt ggcgctgtat 4080

ttatgatgat caacatgcgt tttaaagata aggatcacca gtgcgtagcg gcagatgcgg 4140

gaggggtaaa aaaagaggat tttatcgcag ttttcaagga tcgaaacttc tgggttttcg 4200

tcatatttat tgtggggacg tggtctttct ataacatttt tgatcaacaa ctttttcctg 4260

tcttttattc aggtttattc gaatcacacg atgtaggaac gcgcctgtat ggttatctca 4320

actcattcca ggtggtactc gaagcgctgt gcatggcgat tattcctttc tttgtgaatc 4380

gggtagggcc aaaaaatgca ttacttatcg gagttgtgat tatggcgttg cgtatccttt 4440

cctgcgcgct gttcgttaac ccctggatta tttcattagt gaagttgtta catgccattg 4500

aggttccact ttgtgtcata tccgtcttca aatacagcgt ggcaaacttt gataagcgcc 4560

tgtcgtcgac gatctttctg attggttttc aaattgccag ttcgcttggg attgtgctgc 4620

tttcaacgcc gactgggata ctctttgacc acgcaggcta ccagacagtt ttcttcgcaa 4680

tttcgggtat tgtctgcctg atgttgctat ttggcatttt cttcttgagt aaaaaacgcg 4740

agcaaatagt tatggaaacg cctgtacctt cagcaatata gacgtaaact ttttccggtt 4800

gttgtcgata gctctatatc cctcaaccgg aaaataataa tagtaaaatg cttagccctg 4860

ctaataatcg cctaatccaa acgcctcatt catgttctgg tacagtcgct caaatgtact 4920

tcagatgcgc ggttcgctga tttccaggac attgtcgtca ttcagtgacc tgtcccgtgt 4980

atcacggtcc tgcgaattca tcaaggaatg cattgcggag tgaagtatcg agtcacgcca 5040

tatttcgtca cccgaagatg agttttgaga tattaaggca ggtgactttc actcaca 5097

<210> 90

<211> 3525

<212> DNA

<213> 伊文思奴卡菌

<400> 90

atggcagtgg attcaccgga tgagcggcta cagcgccgca ttgcacagtt gtttgcagaa 60

gatgagcagg tcaaggccgc acgtccgctc gaagcggtga gcgcggcggt gagcgcgccc 120

ggtatgcggc tggcgcagat cgccgccact gttatggcgg gttacgccga ccgcccggcc 180

gccgggcagc gtgcgttcga actgaacacc gacgacgcga cgggccgcac ctcgctgcgg 240

ttacttcccc gattcgagac catcacctat cgcgaactgt ggcagcgagt cggcgaggtt 300

gccgcggcct ggcatcatga tcccgagaac cccttgcgcg caggtgattt cgtcgccctg 360

ctcggcttca ccagcatcga ctacgccacc ctcgacctgg ccgatatcca cctcggcgcg 420

gttaccgtgc cgttgcaggc cagcgcggcg gtgtcccagc tgatcgctat cctcaccgag 480

acttcgccgc ggctgctcgc ctcgaccccg gagcacctcg atgcggcggt cgagtgccta 540

ctcgcgggca ccacaccgga acgactggtg gtcttcgact accaccccga ggacgacgac 600

cagcgtgcgg ccttcgaatc cgcccgccgc cgccttgccg acgcgggcag cttggtgatc 660

gtcgaaacgc tcgatgccgt gcgtgcccgg ggccgcgact taccggccgc gccactgttc 720

gttcccgaca ccgacgacga cccgctggcc ctgctgatct acacctccgg cagcaccgga 780

acgccgaagg gcgcgatgta caccaatcgg ttggccgcca cgatgtggca ggggaactcg 840

atgctgcagg ggaactcgca acgggtcggg atcaatctca actacatgcc gatgagccac 900

atcgccggtc gcatatcgct gttcggcgtg ctcgctcgcg gtggcaccgc atacttcgcg 960

gccaagagcg acatgtcgac actgttcgaa gacatcggct tggtacgtcc caccgagatc 1020

ttcttcgtcc cgcgcgtgtg cgacatggtc ttccagcgct atcagagcga gctggaccgg 1080

cgctcggtgg cgggcgccga cctggacacg ctcgatcggg aagtgaaagc cgacctccgg 1140

cagaactacc tcggtgggcg cttcctggtg gcggtcgtcg gcagcgcgcc gctggccgcg 1200

gagatgaaga cgttcatgga gtccgtcctc gatctgccac tgcacgacgg gtacgggtcg 1260

accgaggcgg gcgcaagcgt gctgctcgac aaccagatcc agcggccgcc ggtgctcgat 1320

tacaagctcg tcgacgtgcc cgaactgggt tacttccgca ccgaccggcc gcatccgcgc 1380

ggtgagctgt tgttgaaggc ggagaccacg attccgggct actacaagcg gcccgaggtc 1440

accgcggaga tcttcgacga ggacggcttc tacaagaccg gcgatatcgt ggccgagctc 1500

gagcacgatc ggctggtcta tgtcgaccgt cgcaacaatg tgctcaaact gtcgcagggc 1560

gagttcgtga ccgtcgccca tctcgaggcc gtgttcgcca gcagcccgct gatccggcag 1620

atcttcatct acggcagcag cgaacgttcc tatctgctcg cggtgatcgt ccccaccgac 1680

gacgcgctgc gcggccgcga caccgccacc ttgaaatcgg cactggccga atcgattcag 1740

cgcatcgcca aggacgcgaa cctgcagccc tacgagattc cgcgcgattt cctgatcgag 1800

accgagccgt tcaccatcgc caacggactg ctctccggca tcgcgaagct gctgcgcccc 1860

aatctgaagg aacgctacgg cgctcagctg gagcagatgt acaccgatct cgcgacaggc 1920

caggccgatg agctgctcgc cctgcgccgc gaagccgccg acctgccggt gctcgaaacc 1980

gtcagccggg cagcgaaagc gatgctcggc gtcgcctccg ccgatatgcg tcccgacgcg 2040

cacttcaccg acctgggcgg cgattccctt tccgcgctgt cgttctcgaa cctgctgcac 2100

gagatcttcg gggtcgaggt gccggtgggt gtcgtcgtca gcccggcgaa cgagctgcgc 2160

gatctggcga attacattga ggcggaacgc aactcgggcg cgaagcgtcc caccttcacc 2220

tcggtgcacg gcggcggttc cgagatccgc gccgccgatc tgaccctcga caagttcatc 2280

gatgcccgca ccctggccgc cgccgacagc attccgcacg cgccggtgcc agcgcagacg 2340

gtgctgctga ccggcgcgaa cggctacctc ggccggttcc tgtgcctgga atggctggag 2400

cggctggaca agacgggtgg cacgctgatc tgcgtcgtgc gcggtagtga cgcggccgcg 2460

gcccgtaaac ggctggactc ggcgttcgac agcggcgatc ccggcctgct cgagcactac 2520

cagcaactgg ccgcacggac cctggaagtc ctcgccggtg atatcggcga cccgaatctc 2580

ggtctggacg acgcgacttg gcagcggttg gccgaaaccg tcgacctgat cgtccatccc 2640

gccgcgttgg tcaaccacgt ccttccctac acccagctgt tcggccccaa tgtcgtcggc 2700

accgccgaaa tcgtccggtt ggcgatcacg gcgcggcgca agccggtcac ctacctgtcg 2760

accgtcggag tggccgacca ggtcgacccg gcggagtatc aggaggacag cgacgtccgc 2820

gagatgagcg cggtgcgcgt cgtgcgcgag agttacgcca acggctacgg caacagcaag 2880

tgggcggggg aggtcctgct gcgcgaagca cacgatctgt gtggcttgcc ggtcgcggtg 2940

ttccgttcgg acatgatcct ggcgcacagc cggtacgcgg gtcagctcaa cgtccaggac 3000

gtgttcaccc ggctgatcct cagcctggtc gccaccggca tcgcgccgta ctcgttctac 3060

cgaaccgacg cggacggcaa ccggcagcgg gcccactatg acggcttgcc ggcggacttc 3120

acggcggcgg cgatcaccgc gctcggcatc caagccaccg aaggcttccg gacctacgac 3180

gtgctcaatc cgtacgacga tggcatctcc ctcgatgaat tcgtcgactg gctcgtcgaa 3240

tccggccacc cgatccagcg catcaccgac tacagcgact ggttccaccg tttcgagacg 3300

gcgatccgcg cgctgccgga aaagcaacgc caggcctcgg tgctgccgtt gctggacgcc 3360

taccgcaacc cctgcccggc ggtccgcggc gcgatactcc cggccaagga gttccaagcg 3420

gcggtgcaaa cagccaaaat cggtccggaa caggacatcc cgcatttgtc cgcgccactg 3480

atcgataagt acgtcagcga tctggaactg cttcagctgc tctaa 3525

<210> 91

<211> 1174

<212> PRT

<213> 伊文思奴卡菌

<400> 91

Met Ala Val Asp Ser Pro Asp Glu Arg Leu Gln Arg Arg Ile Ala Gln

1 5 10 15

Leu Phe Ala Glu Asp Glu Gln Val Lys Ala Ala Arg Pro Leu Glu Ala

20 25 30

Val Ser Ala Ala Val Ser Ala Pro Gly Met Arg Leu Ala Gln Ile Ala

35 40 45

Ala Thr Val Met Ala Gly Tyr Ala Asp Arg Pro Ala Ala Gly Gln Arg

50 55 60

Ala Phe Glu Leu Asn Thr Asp Asp Ala Thr Gly Arg Thr Ser Leu Arg

65 70 75 80

Leu Leu Pro Arg Phe Glu Thr Ile Thr Tyr Arg Glu Leu Trp Gln Arg

85 90 95

Val Gly Glu Val Ala Ala Ala Trp His His Asp Pro Glu Asn Pro Leu

100 105 110

Arg Ala Gly Asp Phe Val Ala Leu Leu Gly Phe Thr Ser Ile Asp Tyr

115 120 125

Ala Thr Leu Asp Leu Ala Asp Ile His Leu Gly Ala Val Thr Val Pro

130 135 140

Leu Gln Ala Ser Ala Ala Val Ser Gln Leu Ile Ala Ile Leu Thr Glu

145 150 155 160

Thr Ser Pro Arg Leu Leu Ala Ser Thr Pro Glu His Leu Asp Ala Ala

165 170 175

Val Glu Cys Leu Leu Ala Gly Thr Thr Pro Glu Arg Leu Val Val Phe

180 185 190

Asp Tyr His Pro Glu Asp Asp Asp Gln Arg Ala Ala Phe Glu Ser Ala

195 200 205

Arg Arg Arg Leu Ala Asp Ala Gly Ser Leu Val Ile Val Glu Thr Leu

210 215 220

Asp Ala Val Arg Ala Arg Gly Arg Asp Leu Pro Ala Ala Pro Leu Phe

225 230 235 240

Val Pro Asp Thr Asp Asp Asp Pro Leu Ala Leu Leu Ile Tyr Thr Ser

245 250 255

Gly Ser Thr Gly Thr Pro Lys Gly Ala Met Tyr Thr Asn Arg Leu Ala

260 265 270

Ala Thr Met Trp Gln Gly Asn Ser Met Leu Gln Gly Asn Ser Gln Arg

275 280 285

Val Gly Ile Asn Leu Asn Tyr Met Pro Met Ser His Ile Ala Gly Arg

290 295 300

Ile Ser Leu Phe Gly Val Leu Ala Arg Gly Gly Thr Ala Tyr Phe Ala

305 310 315 320

Ala Lys Ser Asp Met Ser Thr Leu Phe Glu Asp Ile Gly Leu Val Arg

325 330 335

Pro Thr Glu Ile Phe Phe Val Pro Arg Val Cys Asp Met Val Phe Gln

340 345 350

Arg Tyr Gln Ser Glu Leu Asp Arg Arg Ser Val Ala Gly Ala Asp Leu

355 360 365

Asp Thr Leu Asp Arg Glu Val Lys Ala Asp Leu Arg Gln Asn Tyr Leu

370 375 380

Gly Gly Arg Phe Leu Val Ala Val Val Gly Ser Ala Pro Leu Ala Ala

385 390 395 400

Glu Met Lys Thr Phe Met Glu Ser Val Leu Asp Leu Pro Leu His Asp

405 410 415

Gly Tyr Gly Ser Thr Glu Ala Gly Ala Ser Val Leu Leu Asp Asn Gln

420 425 430

Ile Gln Arg Pro Pro Val Leu Asp Tyr Lys Leu Val Asp Val Pro Glu

435 440 445

Leu Gly Tyr Phe Arg Thr Asp Arg Pro His Pro Arg Gly Glu Leu Leu

450 455 460

Leu Lys Ala Glu Thr Thr Ile Pro Gly Tyr Tyr Lys Arg Pro Glu Val

465 470 475 480

Thr Ala Glu Ile Phe Asp Glu Asp Gly Phe Tyr Lys Thr Gly Asp Ile

485 490 495

Val Ala Glu Leu Glu His Asp Arg Leu Val Tyr Val Asp Arg Arg Asn

500 505 510

Asn Val Leu Lys Leu Ser Gln Gly Glu Phe Val Thr Val Ala His Leu

515 520 525

Glu Ala Val Phe Ala Ser Ser Pro Leu Ile Arg Gln Ile Phe Ile Tyr

530 535 540

Gly Ser Ser Glu Arg Ser Tyr Leu Leu Ala Val Ile Val Pro Thr Asp

545 550 555 560

Asp Ala Leu Arg Gly Arg Asp Thr Ala Thr Leu Lys Ser Ala Leu Ala

565 570 575

Glu Ser Ile Gln Arg Ile Ala Lys Asp Ala Asn Leu Gln Pro Tyr Glu

580 585 590

Ile Pro Arg Asp Phe Leu Ile Glu Thr Glu Pro Phe Thr Ile Ala Asn

595 600 605

Gly Leu Leu Ser Gly Ile Ala Lys Leu Leu Arg Pro Asn Leu Lys Glu

610 615 620

Arg Tyr Gly Ala Gln Leu Glu Gln Met Tyr Thr Asp Leu Ala Thr Gly

625 630 635 640

Gln Ala Asp Glu Leu Leu Ala Leu Arg Arg Glu Ala Ala Asp Leu Pro

645 650 655

Val Leu Glu Thr Val Ser Arg Ala Ala Lys Ala Met Leu Gly Val Ala

660 665 670

Ser Ala Asp Met Arg Pro Asp Ala His Phe Thr Asp Leu Gly Gly Asp

675 680 685

Ser Leu Ser Ala Leu Ser Phe Ser Asn Leu Leu His Glu Ile Phe Gly

690 695 700

Val Glu Val Pro Val Gly Val Val Val Ser Pro Ala Asn Glu Leu Arg

705 710 715 720

Asp Leu Ala Asn Tyr Ile Glu Ala Glu Arg Asn Ser Gly Ala Lys Arg

725 730 735

Pro Thr Phe Thr Ser Val His Gly Gly Gly Ser Glu Ile Arg Ala Ala

740 745 750

Asp Leu Thr Leu Asp Lys Phe Ile Asp Ala Arg Thr Leu Ala Ala Ala

755 760 765

Asp Ser Ile Pro His Ala Pro Val Pro Ala Gln Thr Val Leu Leu Thr

770 775 780

Gly Ala Asn Gly Tyr Leu Gly Arg Phe Leu Cys Leu Glu Trp Leu Glu

785 790 795 800

Arg Leu Asp Lys Thr Gly Gly Thr Leu Ile Cys Val Val Arg Gly Ser

805 810 815

Asp Ala Ala Ala Ala Arg Lys Arg Leu Asp Ser Ala Phe Asp Ser Gly

820 825 830

Asp Pro Gly Leu Leu Glu His Tyr Gln Gln Leu Ala Ala Arg Thr Leu

835 840 845

Glu Val Leu Ala Gly Asp Ile Gly Asp Pro Asn Leu Gly Leu Asp Asp

850 855 860

Ala Thr Trp Gln Arg Leu Ala Glu Thr Val Asp Leu Ile Val His Pro

865 870 875 880

Ala Ala Leu Val Asn His Val Leu Pro Tyr Thr Gln Leu Phe Gly Pro

885 890 895

Asn Val Val Gly Thr Ala Glu Ile Val Arg Leu Ala Ile Thr Ala Arg

900 905 910

Arg Lys Pro Val Thr Tyr Leu Ser Thr Val Gly Val Ala Asp Gln Val

915 920 925

Asp Pro Ala Glu Tyr Gln Glu Asp Ser Asp Val Arg Glu Met Ser Ala

930 935 940

Val Arg Val Val Arg Glu Ser Tyr Ala Asn Gly Tyr Gly Asn Ser Lys

945 950 955 960

Trp Ala Gly Glu Val Leu Leu Arg Glu Ala His Asp Leu Cys Gly Leu

965 970 975

Pro Val Ala Val Phe Arg Ser Asp Met Ile Leu Ala His Ser Arg Tyr

980 985 990

Ala Gly Gln Leu Asn Val Gln Asp Val Phe Thr Arg Leu Ile Leu Ser

995 1000 1005

Leu Val Ala Thr Gly Ile Ala Pro Tyr Ser Phe Tyr Arg Thr Asp

1010 1015 1020

Ala Asp Gly Asn Arg Gln Arg Ala His Tyr Asp Gly Leu Pro Ala

1025 1030 1035

Asp Phe Thr Ala Ala Ala Ile Thr Ala Leu Gly Ile Gln Ala Thr

1040 1045 1050

Glu Gly Phe Arg Thr Tyr Asp Val Leu Asn Pro Tyr Asp Asp Gly

1055 1060 1065

Ile Ser Leu Asp Glu Phe Val Asp Trp Leu Val Glu Ser Gly His

1070 1075 1080

Pro Ile Gln Arg Ile Thr Asp Tyr Ser Asp Trp Phe His Arg Phe

1085 1090 1095

Glu Thr Ala Ile Arg Ala Leu Pro Glu Lys Gln Arg Gln Ala Ser

1100 1105 1110

Val Leu Pro Leu Leu Asp Ala Tyr Arg Asn Pro Cys Pro Ala Val

1115 1120 1125

Arg Gly Ala Ile Leu Pro Ala Lys Glu Phe Gln Ala Ala Val Gln

1130 1135 1140

Thr Ala Lys Ile Gly Pro Glu Gln Asp Ile Pro His Leu Ser Ala

1145 1150 1155

Pro Leu Ile Asp Lys Tyr Val Ser Asp Leu Glu Leu Leu Gln Leu

1160 1165 1170

Leu

<210> 92

<211> 669

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成多核苷酸

<400> 92

atgattgaaa ccattctgcc tgcaggcgtt gaaagcgcag aactgctgga atatccggaa 60

gatctgaaag cacatccggc agaagaacat ctgattgcca aaagcgttga aaaacgtcgt 120

cgtgatttta ttggtgcacg tcattgtgca cgtctggcac tggcagaact gggtgaacct 180

ccggttgcaa ttggtaaagg tgaacgtggt gcaccgattt ggcctcgtgg tgttgttggt 240

agcctgaccc attgtgatgg ttatcgtgca gcagcagttg cacataaaat gcgctttcgc 300

agcattggta ttgatgcaga accgcatgca accctgccgg aaggtgttct ggatagcgtt 360

agcctgccgc cggaacgtga atggctgaaa accaccgata gcgcactgca tctggatcgt 420

ctgctgtttt gtgcaaaaga agccacctat aaagcctggt ggccgctgac agcacgttgg 480

ctgggttttg aagaagccca tattaccttt gaaattgaag atggtagcgc agatagcggt 540

aatggcacct ttcatagcga actgctggtt ccgggtcaga ccaatgatgg tggtacaccg 600

ctgctgagct ttgatggtcg ttggctgatt gcagatggtt ttattctgac cgcaattgcc 660

tatgcctaa 669

<210> 93

<211> 222

<212> PRT

<213> 人工序列

<220>

<223> 人工序列说明：合成多肽

<400> 93

Met Ile Glu Thr Ile Leu Pro Ala Gly Val Glu Ser Ala Glu Leu Leu

1 5 10 15

Glu Tyr Pro Glu Asp Leu Lys Ala His Pro Ala Glu Glu His Leu Ile

20 25 30

Ala Lys Ser Val Glu Lys Arg Arg Arg Asp Phe Ile Gly Ala Arg His

35 40 45

Cys Ala Arg Leu Ala Leu Ala Glu Leu Gly Glu Pro Pro Val Ala Ile

50 55 60

Gly Lys Gly Glu Arg Gly Ala Pro Ile Trp Pro Arg Gly Val Val Gly

65 70 75 80

Ser Leu Thr His Cys Asp Gly Tyr Arg Ala Ala Ala Val Ala His Lys

85 90 95

Met Arg Phe Arg Ser Ile Gly Ile Asp Ala Glu Pro His Ala Thr Leu

100 105 110

Pro Glu Gly Val Leu Asp Ser Val Ser Leu Pro Pro Glu Arg Glu Trp

115 120 125

Leu Lys Thr Thr Asp Ser Ala Leu His Leu Asp Arg Leu Leu Phe Cys

130 135 140

Ala Lys Glu Ala Thr Tyr Lys Ala Trp Trp Pro Leu Thr Ala Arg Trp

145 150 155 160

Leu Gly Phe Glu Glu Ala His Ile Thr Phe Glu Ile Glu Asp Gly Ser

165 170 175

Ala Asp Ser Gly Asn Gly Thr Phe His Ser Glu Leu Leu Val Pro Gly

180 185 190

Gln Thr Asn Asp Gly Gly Thr Pro Leu Leu Ser Phe Asp Gly Arg Trp

195 200 205

Leu Ile Ala Asp Gly Phe Ile Leu Thr Ala Ile Ala Tyr Ala

210 215 220

<210> 94

<211> 3522

<212> DNA

<213> 耻垢分枝杆菌

<400> 94

atgaccagcg atgttcacga cgccacagac ggcgtcaccg aaaccgcact cgacgacgag 60

cagtcgaccc gccgcatcgc cgagctgtac gccaccgatc ccgagttcgc cgccgccgca 120

ccgttgcccg ccgtggtcga cgcggcgcac aaacccgggc tgcggctggc agagatcctg 180

cagaccctgt tcaccggcta cggtgaccgc ccggcgctgg gataccgcgc ccgtgaactg 240

gccaccgacg agggcgggcg caccgtgacg cgtctgctgc cgcggttcga caccctcacc 300

tacgcccagg tgtggtcgcg cgtgcaagcg gtcgccgcgg ccctgcgcca caacttcgcg 360

cagccgatct accccggcga cgccgtcgcg acgatcggtt tcgcgagtcc cgattacctg 420

acgctggatc tcgtatgcgc ctacctgggc ctcgtgagtg ttccgctgca gcacaacgca 480

ccggtcagcc ggctcgcccc gatcctggcc gaggtcgaac cgcggatcct caccgtgagc 540

gccgaatacc tcgacctcgc agtcgaatcc gtgcgggacg tcaactcggt gtcgcagctc 600

gtggtgttcg accatcaccc cgaggtcgac gaccaccgcg acgcactggc ccgcgcgcgt 660

gaacaactcg ccggcaaggg catcgccgtc accaccctgg acgcgatcgc cgacgagggc 720

gccgggctgc cggccgaacc gatctacacc gccgaccatg atcagcgcct cgcgatgatc 780

ctgtacacct cgggttccac cggcgcaccc aagggtgcga tgtacaccga ggcgatggtg 840

gcgcggctgt ggaccatgtc gttcatcacg ggtgacccca cgccggtcat caacgtcaac 900

ttcatgccgc tcaaccacct gggcgggcgc atccccattt ccaccgccgt gcagaacggt 960

ggaaccagtt acttcgtacc ggaatccgac atgtccacgc tgttcgagga tctcgcgctg 1020

gtgcgcccga ccgaactcgg cctggttccg cgcgtcgccg acatgctcta ccagcaccac 1080

ctcgccaccg tcgaccgcct ggtcacgcag ggcgccgacg aactgaccgc cgagaagcag 1140

gccggtgccg aactgcgtga gcaggtgctc ggcggacgcg tgatcaccgg attcgtcagc 1200

accgcaccgc tggccgcgga gatgagggcg ttcctcgaca tcaccctggg cgcacacatc 1260

gtcgacggct acgggctcac cgagaccggc gccgtgacac gcgacggtgt gatcgtgcgg 1320

ccaccggtga tcgactacaa gctgatcgac gttcccgaac tcggctactt cagcaccgac 1380

aagccctacc cgcgtggcga actgctggtc aggtcgcaaa cgctgactcc cgggtactac 1440

aagcgccccg aggtcaccgc gagcgtcttc gaccgggacg gctactacca caccggcgac 1500

gtcatggccg agaccgcacc cgaccacctg gtgtacgtgg accgtcgcaa caacgtcctc 1560

aaactcgcgc agggcgagtt cgtggcggtc gccaacctgg aggcggtgtt ctccggcgcg 1620

gcgctggtgc gccagatctt cgtgtacggc aacagcgagc gcagtttcct tctggccgtg 1680

gtggtcccga cgccggaggc gctcgagcag tacgatccgg ccgcgctcaa ggccgcgctg 1740

gccgactcgc tgcagcgcac cgcacgcgac gccgaactgc aatcctacga ggtgccggcc 1800

gatttcatcg tcgagaccga gccgttcagc gccgccaacg ggctgctgtc gggtgtcgga 1860

aaactgctgc ggcccaacct caaagaccgc tacgggcagc gcctggagca gatgtacgcc 1920

gatatcgcgg ccacgcaggc caaccagttg cgcgaactgc ggcgcgcggc cgccacacaa 1980

ccggtgatcg acaccctcac ccaggccgct gccacgatcc tcggcaccgg gagcgaggtg 2040

gcatccgacg cccacttcac cgacctgggc ggggattccc tgtcggcgct gacactttcg 2100

aacctgctga gcgatttctt cggtttcgaa gttcccgtcg gcaccatcgt gaacccggcc 2160

accaacctcg cccaactcgc ccagcacatc gaggcgcagc gcaccgcggg tgaccgcagg 2220

ccgagtttca ccaccgtgca cggcgcggac gccaccgaga tccgggcgag tgagctgacc 2280

ctggacaagt tcatcgacgc cgaaacgctc cgggccgcac cgggtctgcc caaggtcacc 2340

accgagccac ggacggtgtt gctctcgggc gccaacggct ggctgggccg gttcctcacg 2400

ttgcagtggc tggaacgcct ggcacctgtc ggcggcaccc tcatcacgat cgtgcggggc 2460

cgcgacgacg ccgcggcccg cgcacggctg acccaggcct acgacaccga tcccgagttg 2520

tcccgccgct tcgccgagct ggccgaccgc cacctgcggg tggtcgccgg tgacatcggc 2580

gacccgaatc tgggcctcac acccgagatc tggcaccggc tcgccgccga ggtcgacctg 2640

gtggtgcatc cggcagcgct ggtcaaccac gtgctcccct accggcagct gttcggcccc 2700

aacgtcgtgg gcacggccga ggtgatcaag ctggccctca ccgaacggat caagcccgtc 2760

acgtacctgt ccaccgtgtc ggtggccatg gggatccccg acttcgagga ggacggcgac 2820

atccggaccg tgagcccggt gcgcccgctc gacggcggat acgccaacgg ctacggcaac 2880

agcaagtggg ccggcgaggt gctgctgcgg gaggcccacg atctgtgcgg gctgcccgtg 2940

gcgacgttcc gctcggacat gatcctggcg catccgcgct accgcggtca ggtcaacgtg 3000

ccagacatgt tcacgcgact cctgttgagc ctcttgatca ccggcgtcgc gccgcggtcg 3060

ttctacatcg gagacggtga gcgcccgcgg gcgcactacc ccggcctgac ggtcgatttc 3120

gtggccgagg cggtcacgac gctcggcgcg cagcagcgcg agggatacgt gtcctacgac 3180

gtgatgaacc cgcacgacga cgggatctcc ctggatgtgt tcgtggactg gctgatccgg 3240

gcgggccatc cgatcgaccg ggtcgacgac tacgacgact gggtgcgtcg gttcgagacc 3300

gcgttgaccg cgcttcccga gaagcgccgc gcacagaccg tactgccgct gctgcacgcg 3360

ttccgcgctc cgcaggcacc gttgcgcggc gcacccgaac ccacggaggt gttccacgcc 3420

gcggtgcgca ccgcgaaggt gggcccggga gacatcccgc acctcgacga ggcgctgatc 3480

gacaagtaca tacgcgatct gcgtgagttc ggtctgatct aa 3522

<210> 95

<211> 1173

<212> PRT

<213> 耻垢分枝杆菌

<400> 95

Met Thr Ser Asp Val His Asp Ala Thr Asp Gly Val Thr Glu Thr Ala

1 5 10 15

Leu Asp Asp Glu Gln Ser Thr Arg Arg Ile Ala Glu Leu Tyr Ala Thr

20 25 30

Asp Pro Glu Phe Ala Ala Ala Ala Pro Leu Pro Ala Val Val Asp Ala

35 40 45

Ala His Lys Pro Gly Leu Arg Leu Ala Glu Ile Leu Gln Thr Leu Phe

50 55 60

Thr Gly Tyr Gly Asp Arg Pro Ala Leu Gly Tyr Arg Ala Arg Glu Leu

65 70 75 80

Ala Thr Asp Glu Gly Gly Arg Thr Val Thr Arg Leu Leu Pro Arg Phe

85 90 95

Asp Thr Leu Thr Tyr Ala Gln Val Trp Ser Arg Val Gln Ala Val Ala

100 105 110

Ala Ala Leu Arg His Asn Phe Ala Gln Pro Ile Tyr Pro Gly Asp Ala

115 120 125

Val Ala Thr Ile Gly Phe Ala Ser Pro Asp Tyr Leu Thr Leu Asp Leu

130 135 140

Val Cys Ala Tyr Leu Gly Leu Val Ser Val Pro Leu Gln His Asn Ala

145 150 155 160

Pro Val Ser Arg Leu Ala Pro Ile Leu Ala Glu Val Glu Pro Arg Ile

165 170 175

Leu Thr Val Ser Ala Glu Tyr Leu Asp Leu Ala Val Glu Ser Val Arg

180 185 190

Asp Val Asn Ser Val Ser Gln Leu Val Val Phe Asp His His Pro Glu

195 200 205

Val Asp Asp His Arg Asp Ala Leu Ala Arg Ala Arg Glu Gln Leu Ala

210 215 220

Gly Lys Gly Ile Ala Val Thr Thr Leu Asp Ala Ile Ala Asp Glu Gly

225 230 235 240

Ala Gly Leu Pro Ala Glu Pro Ile Tyr Thr Ala Asp His Asp Gln Arg

245 250 255

Leu Ala Met Ile Leu Tyr Thr Ser Gly Ser Thr Gly Ala Pro Lys Gly

260 265 270

Ala Met Tyr Thr Glu Ala Met Val Ala Arg Leu Trp Thr Met Ser Phe

275 280 285

Ile Thr Gly Asp Pro Thr Pro Val Ile Asn Val Asn Phe Met Pro Leu

290 295 300

Asn His Leu Gly Gly Arg Ile Pro Ile Ser Thr Ala Val Gln Asn Gly

305 310 315 320

Gly Thr Ser Tyr Phe Val Pro Glu Ser Asp Met Ser Thr Leu Phe Glu

325 330 335

Asp Leu Ala Leu Val Arg Pro Thr Glu Leu Gly Leu Val Pro Arg Val

340 345 350

Ala Asp Met Leu Tyr Gln His His Leu Ala Thr Val Asp Arg Leu Val

355 360 365

Thr Gln Gly Ala Asp Glu Leu Thr Ala Glu Lys Gln Ala Gly Ala Glu

370 375 380

Leu Arg Glu Gln Val Leu Gly Gly Arg Val Ile Thr Gly Phe Val Ser

385 390 395 400

Thr Ala Pro Leu Ala Ala Glu Met Arg Ala Phe Leu Asp Ile Thr Leu

405 410 415

Gly Ala His Ile Val Asp Gly Tyr Gly Leu Thr Glu Thr Gly Ala Val

420 425 430

Thr Arg Asp Gly Val Ile Val Arg Pro Pro Val Ile Asp Tyr Lys Leu

435 440 445

Ile Asp Val Pro Glu Leu Gly Tyr Phe Ser Thr Asp Lys Pro Tyr Pro

450 455 460

Arg Gly Glu Leu Leu Val Arg Ser Gln Thr Leu Thr Pro Gly Tyr Tyr

465 470 475 480

Lys Arg Pro Glu Val Thr Ala Ser Val Phe Asp Arg Asp Gly Tyr Tyr

485 490 495

His Thr Gly Asp Val Met Ala Glu Thr Ala Pro Asp His Leu Val Tyr

500 505 510

Val Asp Arg Arg Asn Asn Val Leu Lys Leu Ala Gln Gly Glu Phe Val

515 520 525

Ala Val Ala Asn Leu Glu Ala Val Phe Ser Gly Ala Ala Leu Val Arg

530 535 540

Gln Ile Phe Val Tyr Gly Asn Ser Glu Arg Ser Phe Leu Leu Ala Val

545 550 555 560

Val Val Pro Thr Pro Glu Ala Leu Glu Gln Tyr Asp Pro Ala Ala Leu

565 570 575

Lys Ala Ala Leu Ala Asp Ser Leu Gln Arg Thr Ala Arg Asp Ala Glu

580 585 590

Leu Gln Ser Tyr Glu Val Pro Ala Asp Phe Ile Val Glu Thr Glu Pro

595 600 605

Phe Ser Ala Ala Asn Gly Leu Leu Ser Gly Val Gly Lys Leu Leu Arg

610 615 620

Pro Asn Leu Lys Asp Arg Tyr Gly Gln Arg Leu Glu Gln Met Tyr Ala

625 630 635 640

Asp Ile Ala Ala Thr Gln Ala Asn Gln Leu Arg Glu Leu Arg Arg Ala

645 650 655

Ala Ala Thr Gln Pro Val Ile Asp Thr Leu Thr Gln Ala Ala Ala Thr

660 665 670

Ile Leu Gly Thr Gly Ser Glu Val Ala Ser Asp Ala His Phe Thr Asp

675 680 685

Leu Gly Gly Asp Ser Leu Ser Ala Leu Thr Leu Ser Asn Leu Leu Ser

690 695 700

Asp Phe Phe Gly Phe Glu Val Pro Val Gly Thr Ile Val Asn Pro Ala

705 710 715 720

Thr Asn Leu Ala Gln Leu Ala Gln His Ile Glu Ala Gln Arg Thr Ala

725 730 735

Gly Asp Arg Arg Pro Ser Phe Thr Thr Val His Gly Ala Asp Ala Thr

740 745 750

Glu Ile Arg Ala Ser Glu Leu Thr Leu Asp Lys Phe Ile Asp Ala Glu

755 760 765

Thr Leu Arg Ala Ala Pro Gly Leu Pro Lys Val Thr Thr Glu Pro Arg

770 775 780

Thr Val Leu Leu Ser Gly Ala Asn Gly Trp Leu Gly Arg Phe Leu Thr

785 790 795 800

Leu Gln Trp Leu Glu Arg Leu Ala Pro Val Gly Gly Thr Leu Ile Thr

805 810 815

Ile Val Arg Gly Arg Asp Asp Ala Ala Ala Arg Ala Arg Leu Thr Gln

820 825 830

Ala Tyr Asp Thr Asp Pro Glu Leu Ser Arg Arg Phe Ala Glu Leu Ala

835 840 845

Asp Arg His Leu Arg Val Val Ala Gly Asp Ile Gly Asp Pro Asn Leu

850 855 860

Gly Leu Thr Pro Glu Ile Trp His Arg Leu Ala Ala Glu Val Asp Leu

865 870 875 880

Val Val His Pro Ala Ala Leu Val Asn His Val Leu Pro Tyr Arg Gln

885 890 895

Leu Phe Gly Pro Asn Val Val Gly Thr Ala Glu Val Ile Lys Leu Ala

900 905 910

Leu Thr Glu Arg Ile Lys Pro Val Thr Tyr Leu Ser Thr Val Ser Val

915 920 925

Ala Met Gly Ile Pro Asp Phe Glu Glu Asp Gly Asp Ile Arg Thr Val

930 935 940

Ser Pro Val Arg Pro Leu Asp Gly Gly Tyr Ala Asn Gly Tyr Gly Asn

945 950 955 960

Ser Lys Trp Ala Gly Glu Val Leu Leu Arg Glu Ala His Asp Leu Cys

965 970 975

Gly Leu Pro Val Ala Thr Phe Arg Ser Asp Met Ile Leu Ala His Pro

980 985 990

Arg Tyr Arg Gly Gln Val Asn Val Pro Asp Met Phe Thr Arg Leu Leu

995 1000 1005

Leu Ser Leu Leu Ile Thr Gly Val Ala Pro Arg Ser Phe Tyr Ile

1010 1015 1020

Gly Asp Gly Glu Arg Pro Arg Ala His Tyr Pro Gly Leu Thr Val

1025 1030 1035

Asp Phe Val Ala Glu Ala Val Thr Thr Leu Gly Ala Gln Gln Arg

1040 1045 1050

Glu Gly Tyr Val Ser Tyr Asp Val Met Asn Pro His Asp Asp Gly

1055 1060 1065

Ile Ser Leu Asp Val Phe Val Asp Trp Leu Ile Arg Ala Gly His

1070 1075 1080

Pro Ile Asp Arg Val Asp Asp Tyr Asp Asp Trp Val Arg Arg Phe

1085 1090 1095

Glu Thr Ala Leu Thr Ala Leu Pro Glu Lys Arg Arg Ala Gln Thr

1100 1105 1110

Val Leu Pro Leu Leu His Ala Phe Arg Ala Pro Gln Ala Pro Leu

1115 1120 1125

Arg Gly Ala Pro Glu Pro Thr Glu Val Phe His Ala Ala Val Arg

1130 1135 1140

Thr Ala Lys Val Gly Pro Gly Asp Ile Pro His Leu Asp Glu Ala

1145 1150 1155

Leu Ile Asp Lys Tyr Ile Arg Asp Leu Arg Glu Phe Gly Leu Ile

1160 1165 1170

<210> 96

<211> 3522

<212> DNA

<213> 鸟分枝杆菌

<400> 96

atgtcgactg ccacccatga cgaacgactc gaccgtcgcg tccacgaact catcgccacc 60

gacccgcaat tcgccgccgc ccaacccgac ccggcgatca ccgccgccct cgaacagccc 120

gggctgcggc tgccgcagat catccgcacc gtgctcgacg gctacgccga ccggccggcg 180

ctgggacagc gcgtggtgga gttcgtcacg gacgccaaga ccgggcgcac gtcggcgcag 240

ctgctccccc gcttcgagac catcacgtac agcgaagtag cgcagcgtgt ttcggcgctg 300

ggccgcgccc tgtccgacga cgcggtgcac cccggcgacc gggtgtgcgt gctgggcttc 360

aacagcgtcg actacgccac catcgacatg gcgctgggcg ccatcggcgc cgtctcggtg 420

ccgctgcaga ccagcgcggc aatcagctcg ctgcagccga tcgtggccga gaccgagccc 480

accctgatcg cgtccagcgt gaaccagctg tccgacgcgg tgcagctgat caccggcgcc 540

gagcaggcgc ccacccggct ggtggtgttc gactaccacc cgcaggtcga cgaccagcgc 600

gaggccgtcc aggacgccgc ggcgcggctg tccagcaccg gcgtggccgt ccagacgctg 660

gccgagctgc tggagcgcgg caaggacctg cccgccgtcg cggagccgcc cgccgacgag 720

gactcgctgg ccctgctgat ctacacctcc gggtccaccg gcgcccccaa gggcgcgatg 780

tacccacaga gcaacgtcgg caagatgtgg cgccgcggca gcaagaactg gttcggcgag 840

agcgccgcgt cgatcaccct gaacttcatg ccgatgagcc acgtgatggg ccgaagcatc 900

ctctacggca cgctgggcaa cggcggcacc gcctacttcg ccgcccgcag cgacctgtcc 960

accctgcttg aggacctcga gctggtgcgg cccaccgagc tcaacttcgt cccgcggatc 1020

tgggagacgc tgtacggcga attccagcgt caggtcgagc ggcggctctc cgaggccggg 1080

gacgccggcg aacgtcgcgc cgtcgaggcc gaggtgctgg ccgagcagcg ccagtacctg 1140

ctgggcgggc ggttcacctt cgcgatgacg ggctcggcgc ccatctcgcc ggagctgcgc 1200

aactgggtcg agtcgctgct cgaaatgcac ctgatggacg gctacggctc caccgaggcc 1260

ggaatggtgt tgttcgacgg ggagattcag cgcccgccgg tgatcgacta caagctggtc 1320

gacgtgccgg acctgggcta cttcagcacc gaccggccgc atccgcgcgg cgagctgctg 1380

ctgcgcaccg agaacatgtt cccgggctac tacaagcggg ccgaaaccac cgcgggcgtc 1440

ttcgacgagg acggctacta ccgcaccggc gacgtgttcg ccgagatcgc cccggaccgg 1500

ctggtctacg tcgaccgccg caacaacgtg ctcaagctgg cgcagggcga attcgtcacg 1560

ctggccaagc tggaggcggt gttcggcaac agcccgctga tccgccagat ctacgtctac 1620

ggcaacagcg cccagcccta cctgctggcg gtcgtggtgc ccaccgagga ggcgctggcc 1680

tcgggtgacc ccgagacgct caagcccaag atcgccgact cgctgcagca ggtcgccaag 1740

gaggccggcc tgcagtccta cgaggtgccg cgcgacttca tcatcgagac caccccgttc 1800

agcctggaaa acggtctgct gaccgggatc cggaagctgg cgtggccgaa actgaagcag 1860

cactacgggg aacggctgga gcagatgtac gccgacctgg ccgccggaca ggccaacgag 1920

ctggccgagc tgcgccgcaa cggtgcccag gcgccggtgt tgcagaccgt gagccgcgcc 1980

gcgggcgcca tgctgggttc ggccgcctcc gacctgtccc ccgacgccca cttcaccgat 2040

ctgggcggag actcgttgtc ggcgttgaca ttcggcaacc tgctgcgcga gatcttcgac 2100

gtcgacgtgc cggtaggcgt gatcgtcagc ccggccaacg acctggcggc catcgcgagc 2160

tacatcgagg ccgagcggca gggcagcaag cgcccgacgt tcgcctcggt gcacggccgg 2220

gacgcgaccg tggtgcgcgc cgccgacctg acgctggaca agttcctcga cgccgagacg 2280

ctggccgccg cgccgaacct gcccaagccg gccaccgagg tgcgcaccgt gctgctgacc 2340

ggcgccaccg gcttcctggg ccgctacctg gccctggaat ggctggagcg gatggacatg 2400

gtggacggca aggtcatcgc cctggtccgg gcccgctccg acgaggaggc acgcgcccgg 2460

ctggacaaga ccttcgacag cggcgacccg aaactgctcg cgcactacca gcagctggcc 2520

gccgatcacc tggaggtcat cgccggcgac aagggcgagg ccaatctggg cctgggccaa 2580

gacgtttggc aacgactggc cgacacggtc gacgtgatcg tcgaccccgc cgcgctggtc 2640

aaccacgtgt tgccgtacag cgagctgttc gggcccaacg ccctgggcac cgcggagctg 2700

atccggctgg cgctgacgtc caagcagaag ccgtacacct acgtgtccac catcggcgtg 2760

ggcgaccaga tcgagccggg caagttcgtc gagaacgccg acatccggca gatgagcgcc 2820

acccgggcga tcaacgacag ctacgccaac ggctatggca acagcaagtg ggccggcgag 2880

gtgctgctgc gcgaggcgca cgacctgtgc gggctgcccg tcgcggtgtt ccgctgcgac 2940

atgatcctgg ccgacaccac gtatgccggg cagctcaacc tgccggacat gttcacccgg 3000

ctgatgctga gcctggtggc caccgggatc gcgcccggct cgttctacga gctcgacgcc 3060

gacggcaacc ggcagcgggc gcactacgac ggcctgccgg tcgagttcat cgccgcggcg 3120

atctcgacgc tgggttcgca gatcaccgac agcgacaccg gcttccagac ctaccacgtg 3180

atgaacccct acgatgacgg cgtcggtctg gacgagtacg tcgattggct ggtggacgcc 3240

ggctattcga tcgagcggat cgccgactac tccgaatggc tgcggcggtt cgagacctcg 3300

ctgcgggccc tgccggaccg gcagcgccag tactcgctgc tgccgctgct gcacaactac 3360

cgcacgccgg agaagccgat caacgggtcg atagctccca ccgacgtgtt ccgggcagcg 3420

gtgcaggagg cgaaaatcgg ccccgacaaa gacattccgc acgtgtcgcc gccggtcatc 3480

gtcaagtaca tcaccgacct gcagctgctc gggctgctct aa 3522

<210> 97

<211> 1173

<212> PRT

<213> 鸟分枝杆菌

<400> 97

Met Ser Thr Ala Thr His Asp Glu Arg Leu Asp Arg Arg Val His Glu

1 5 10 15

Leu Ile Ala Thr Asp Pro Gln Phe Ala Ala Ala Gln Pro Asp Pro Ala

20 25 30

Ile Thr Ala Ala Leu Glu Gln Pro Gly Leu Arg Leu Pro Gln Ile Ile

35 40 45

Arg Thr Val Leu Asp Gly Tyr Ala Asp Arg Pro Ala Leu Gly Gln Arg

50 55 60

Val Val Glu Phe Val Thr Asp Ala Lys Thr Gly Arg Thr Ser Ala Gln

65 70 75 80

Leu Leu Pro Arg Phe Glu Thr Ile Thr Tyr Ser Glu Val Ala Gln Arg

85 90 95

Val Ser Ala Leu Gly Arg Ala Leu Ser Asp Asp Ala Val His Pro Gly

100 105 110

Asp Arg Val Cys Val Leu Gly Phe Asn Ser Val Asp Tyr Ala Thr Ile

115 120 125

Asp Met Ala Leu Gly Ala Ile Gly Ala Val Ser Val Pro Leu Gln Thr

130 135 140

Ser Ala Ala Ile Ser Ser Leu Gln Pro Ile Val Ala Glu Thr Glu Pro

145 150 155 160

Thr Leu Ile Ala Ser Ser Val Asn Gln Leu Ser Asp Ala Val Gln Leu

165 170 175

Ile Thr Gly Ala Glu Gln Ala Pro Thr Arg Leu Val Val Phe Asp Tyr

180 185 190

His Pro Gln Val Asp Asp Gln Arg Glu Ala Val Gln Asp Ala Ala Ala

195 200 205

Arg Leu Ser Ser Thr Gly Val Ala Val Gln Thr Leu Ala Glu Leu Leu

210 215 220

Glu Arg Gly Lys Asp Leu Pro Ala Val Ala Glu Pro Pro Ala Asp Glu

225 230 235 240

Asp Ser Leu Ala Leu Leu Ile Tyr Thr Ser Gly Ser Thr Gly Ala Pro

245 250 255

Lys Gly Ala Met Tyr Pro Gln Ser Asn Val Gly Lys Met Trp Arg Arg

260 265 270

Gly Ser Lys Asn Trp Phe Gly Glu Ser Ala Ala Ser Ile Thr Leu Asn

275 280 285

Phe Met Pro Met Ser His Val Met Gly Arg Ser Ile Leu Tyr Gly Thr

290 295 300

Leu Gly Asn Gly Gly Thr Ala Tyr Phe Ala Ala Arg Ser Asp Leu Ser

305 310 315 320

Thr Leu Leu Glu Asp Leu Glu Leu Val Arg Pro Thr Glu Leu Asn Phe

325 330 335

Val Pro Arg Ile Trp Glu Thr Leu Tyr Gly Glu Phe Gln Arg Gln Val

340 345 350

Glu Arg Arg Leu Ser Glu Ala Gly Asp Ala Gly Glu Arg Arg Ala Val

355 360 365

Glu Ala Glu Val Leu Ala Glu Gln Arg Gln Tyr Leu Leu Gly Gly Arg

370 375 380

Phe Thr Phe Ala Met Thr Gly Ser Ala Pro Ile Ser Pro Glu Leu Arg

385 390 395 400

Asn Trp Val Glu Ser Leu Leu Glu Met His Leu Met Asp Gly Tyr Gly

405 410 415

Ser Thr Glu Ala Gly Met Val Leu Phe Asp Gly Glu Ile Gln Arg Pro

420 425 430

Pro Val Ile Asp Tyr Lys Leu Val Asp Val Pro Asp Leu Gly Tyr Phe

435 440 445

Ser Thr Asp Arg Pro His Pro Arg Gly Glu Leu Leu Leu Arg Thr Glu

450 455 460

Asn Met Phe Pro Gly Tyr Tyr Lys Arg Ala Glu Thr Thr Ala Gly Val

465 470 475 480

Phe Asp Glu Asp Gly Tyr Tyr Arg Thr Gly Asp Val Phe Ala Glu Ile

485 490 495

Ala Pro Asp Arg Leu Val Tyr Val Asp Arg Arg Asn Asn Val Leu Lys

500 505 510

Leu Ala Gln Gly Glu Phe Val Thr Leu Ala Lys Leu Glu Ala Val Phe

515 520 525

Gly Asn Ser Pro Leu Ile Arg Gln Ile Tyr Val Tyr Gly Asn Ser Ala

530 535 540

Gln Pro Tyr Leu Leu Ala Val Val Val Pro Thr Glu Glu Ala Leu Ala

545 550 555 560

Ser Gly Asp Pro Glu Thr Leu Lys Pro Lys Ile Ala Asp Ser Leu Gln

565 570 575

Gln Val Ala Lys Glu Ala Gly Leu Gln Ser Tyr Glu Val Pro Arg Asp

580 585 590

Phe Ile Ile Glu Thr Thr Pro Phe Ser Leu Glu Asn Gly Leu Leu Thr

595 600 605

Gly Ile Arg Lys Leu Ala Trp Pro Lys Leu Lys Gln His Tyr Gly Glu

610 615 620

Arg Leu Glu Gln Met Tyr Ala Asp Leu Ala Ala Gly Gln Ala Asn Glu

625 630 635 640

Leu Ala Glu Leu Arg Arg Asn Gly Ala Gln Ala Pro Val Leu Gln Thr

645 650 655

Val Ser Arg Ala Ala Gly Ala Met Leu Gly Ser Ala Ala Ser Asp Leu

660 665 670

Ser Pro Asp Ala His Phe Thr Asp Leu Gly Gly Asp Ser Leu Ser Ala

675 680 685

Leu Thr Phe Gly Asn Leu Leu Arg Glu Ile Phe Asp Val Asp Val Pro

690 695 700

Val Gly Val Ile Val Ser Pro Ala Asn Asp Leu Ala Ala Ile Ala Ser

705 710 715 720

Tyr Ile Glu Ala Glu Arg Gln Gly Ser Lys Arg Pro Thr Phe Ala Ser

725 730 735

Val His Gly Arg Asp Ala Thr Val Val Arg Ala Ala Asp Leu Thr Leu

740 745 750

Asp Lys Phe Leu Asp Ala Glu Thr Leu Ala Ala Ala Pro Asn Leu Pro

755 760 765

Lys Pro Ala Thr Glu Val Arg Thr Val Leu Leu Thr Gly Ala Thr Gly

770 775 780

Phe Leu Gly Arg Tyr Leu Ala Leu Glu Trp Leu Glu Arg Met Asp Met

785 790 795 800

Val Asp Gly Lys Val Ile Ala Leu Val Arg Ala Arg Ser Asp Glu Glu

805 810 815

Ala Arg Ala Arg Leu Asp Lys Thr Phe Asp Ser Gly Asp Pro Lys Leu

820 825 830

Leu Ala His Tyr Gln Gln Leu Ala Ala Asp His Leu Glu Val Ile Ala

835 840 845

Gly Asp Lys Gly Glu Ala Asn Leu Gly Leu Gly Gln Asp Val Trp Gln

850 855 860

Arg Leu Ala Asp Thr Val Asp Val Ile Val Asp Pro Ala Ala Leu Val

865 870 875 880

Asn His Val Leu Pro Tyr Ser Glu Leu Phe Gly Pro Asn Ala Leu Gly

885 890 895

Thr Ala Glu Leu Ile Arg Leu Ala Leu Thr Ser Lys Gln Lys Pro Tyr

900 905 910

Thr Tyr Val Ser Thr Ile Gly Val Gly Asp Gln Ile Glu Pro Gly Lys

915 920 925

Phe Val Glu Asn Ala Asp Ile Arg Gln Met Ser Ala Thr Arg Ala Ile

930 935 940

Asn Asp Ser Tyr Ala Asn Gly Tyr Gly Asn Ser Lys Trp Ala Gly Glu

945 950 955 960

Val Leu Leu Arg Glu Ala His Asp Leu Cys Gly Leu Pro Val Ala Val

965 970 975

Phe Arg Cys Asp Met Ile Leu Ala Asp Thr Thr Tyr Ala Gly Gln Leu

980 985 990

Asn Leu Pro Asp Met Phe Thr Arg Leu Met Leu Ser Leu Val Ala Thr

995 1000 1005

Gly Ile Ala Pro Gly Ser Phe Tyr Glu Leu Asp Ala Asp Gly Asn

1010 1015 1020

Arg Gln Arg Ala His Tyr Asp Gly Leu Pro Val Glu Phe Ile Ala

1025 1030 1035

Ala Ala Ile Ser Thr Leu Gly Ser Gln Ile Thr Asp Ser Asp Thr

1040 1045 1050

Gly Phe Gln Thr Tyr His Val Met Asn Pro Tyr Asp Asp Gly Val

1055 1060 1065

Gly Leu Asp Glu Tyr Val Asp Trp Leu Val Asp Ala Gly Tyr Ser

1070 1075 1080

Ile Glu Arg Ile Ala Asp Tyr Ser Glu Trp Leu Arg Arg Phe Glu

1085 1090 1095

Thr Ser Leu Arg Ala Leu Pro Asp Arg Gln Arg Gln Tyr Ser Leu

1100 1105 1110

Leu Pro Leu Leu His Asn Tyr Arg Thr Pro Glu Lys Pro Ile Asn

1115 1120 1125

Gly Ser Ile Ala Pro Thr Asp Val Phe Arg Ala Ala Val Gln Glu

1130 1135 1140

Ala Lys Ile Gly Pro Asp Lys Asp Ile Pro His Val Ser Pro Pro

1145 1150 1155

Val Ile Val Lys Tyr Ile Thr Asp Leu Gln Leu Leu Gly Leu Leu

1160 1165 1170

<210> 98

<211> 3525

<212> DNA

<213> 海栖分枝杆菌

<400> 98

atgtcgccaa tcacgcgtga agagcggctc gagcgccgca tccaggacct ctacgccaac 60

gacccgcagt tcgccgccgc caaacccgcc acggcgatca ccgcagcaat cgagcggccg 120

ggtctaccgc taccccagat catcgagacc gtcatgaccg gatacgccga tcggccggct 180

ctcgctcagc gctcggtcga attcgtgacc gacgccggca ccggccacac cacgctgcga 240

ctgctccccc acttcgaaac catcagctac ggcgagcttt gggaccgcat cagcgcactg 300

gccgacgtgc tcagcaccga acagacggtg aaaccgggcg accgggtctg cttgttgggc 360

ttcaacagcg tcgactacgc cacgatcgac atgactttgg cgcggctggg cgcggtggcc 420

gtaccactgc agaccagcgc ggcgataacc cagctgcagc cgatcgtcgc cgagacccag 480

cccaccatga tcgcggccag cgtcgacgca ctcgctgacg ccaccgaatt ggctctgtcc 540

ggtcagaccg ctacccgagt cctggtgttc gaccaccacc ggcaggttga cgcacaccgc 600

gcagcggtcg aatccgcccg ggagcgcctg gccggctcgg cggtcgtcga aaccctggcc 660

gaggccatcg cgcgcggcga cgtgccccgc ggtgcgtccg ccggctcggc gcccggcacc 720

gatgtgtccg acgactcgct cgcgctactg atctacacct cgggcagcac gggtgcgccc 780

aagggcgcga tgtacccccg acgcaacgtt gcgaccttct ggcgcaagcg cacctggttc 840

gaaggcggct acgagccgtc gatcacgctg aacttcatgc caatgagcca cgtcatgggc 900

cgccaaatcc tgtacggcac gctgtgcaat ggcggcaccg cctacttcgt ggcgaaaagc 960

gatctctcca ccttgttcga agacctggcg ctggtgcggc ccaccgagct gaccttcgtg 1020

ccgcgcgtgt gggacatggt gttcgacgag tttcagagtg aggtcgaccg ccgcctggtc 1080

gacggcgccg accgggtcgc gctcgaagcc caggtcaagg ccgagatacg caacgacgtg 1140

ctcggtggac ggtataccag cgcactgacc ggctccgccc ctatctccga cgagatgaag 1200

gcgtgggtcg aggagctgct cgacatgcat ctggtcgagg gctacggctc caccgaggcc 1260

gggatgatcc tgatcgacgg agccattcgg cgcccggcgg tactcgacta caagctggtc 1320

gatgttcccg acctgggtta cttcctgacc gaccggccac atccgcgggg cgagttgctg 1380

gtcaagaccg atagtttgtt cccgggctac taccagcgag ccgaagtcac cgccgacgtg 1440

ttcgatgctg acggcttcta ccggaccggc gacatcatgg ccgaggtcgg ccccgaacag 1500

ttcgtgtacc tcgaccgccg caacaacgtg ttgaagctgt cgcagggcga gttcgtcacc 1560

gtctccaaac tcgaagcggt gtttggcgac agcccactgg tacggcagat ctacatctac 1620

ggcaacagcg cccgtgccta cctgttggcg gtgatcgtcc ccacccagga ggcgctggac 1680

gccgtgcctg tcgaggagct caaggcgcgg ctgggcgact cgctgcaaga ggtcgcaaag 1740

gccgccggcc tgcagtccta cgagatcccg cgcgacttca tcatcgaaac aacaccatgg 1800

acgctggaga acggcctgct caccggcatc cgcaagttgg ccaggccgca gctgaaaaag 1860

cattacggcg agcttctcga gcagatctac acggacctgg cacacggcca ggccgacgaa 1920

ctgcgctcgc tgcgccaaag cggtgccgat gcgccggtgc tggtgacggt gtgccgtgcg 1980

gcggccgcgc tgttgggcgg cagcgcctct gacgtccagc ccgatgcgca cttcaccgat 2040

ttgggcggcg actcgctgtc ggcgctgtcg ttcaccaacc tgctgcacga gatcttcgac 2100

atcgaagtgc cggtgggcgt catcgtcagc cccgccaacg acttgcaggc cctggccgac 2160

tacgtcgagg cggctcgcaa acccggctcg tcacggccga ccttcgcctc ggtccacggc 2220

gcctcgaatg ggcaggtcac cgaggtgcat gccggtgacc tgtccctgga caaattcatc 2280

gatgccgcaa ccctggccga agctccccgg ctgcccgccg caaacaccca agtgcgcacc 2340

gtgctgctga ccggcgccac cggcttcctc gggcgctacc tggccctgga atggctggag 2400

cggatggacc tggtcgacgg caaactgatc tgcctggtcc gggccaagtc cgacaccgaa 2460

gcacgggcgc ggctggacaa gacgttcgac agcggcgacc ccgaactgct ggcccactac 2520

cgcgcactgg ccggcgacca cctcgaggtg ctcgccggtg acaagggcga agccgacctc 2580

ggactggacc ggcagacctg gcaacgcctg gccgacacgg tcgacctgat cgtcgacccc 2640

gcggccctgg tcaaccacgt actgccatac agccagctgt tcgggcccaa cgcgctgggc 2700

accgccgagc tgctgcggct ggcgctcacc tccaagatca agccctacag ctacacctcg 2760

acaatcggtg tcgccgacca gatcccgccg tcggcgttca ccgaggacgc cgacatccgg 2820

gtcatcagcg ccacccgcgc ggtcgacgac agctacgcca atggctactc gaacagcaag 2880

tgggccggcg aggtgctgtt gcgcgaggcg catgacctgt gtggcctgcc ggttgcggtg 2940

ttccgctgcg acatgatcct ggccgacacc acatgggcgg gacagctcaa tgtgccggac 3000

atgttcaccc ggatgatcct gagcctggcg gccaccggta tcgcgccggg ttcgttctat 3060

gagcttgcgg ccgacggcgc ccggcaacgc gcccactatg acggtctgcc cgtcgagttc 3120

atcgccgagg cgatttcgac tttgggtgcg cagagccagg atggtttcca cacgtatcac 3180

gtgatgaacc cctacgacga cggcatcgga ctcgacgagt tcgtcgactg gctcaacgag 3240

tccggttgcc ccatccagcg catcgctgac tatggcgact ggctgcagcg cttcgaaacc 3300

gcactgcgcg cactgcccga tcggcagcgg cacagctcac tgctgccgct gttgcacaac 3360

tatcggcagc cggagcggcc cgtccgcggg tcgatcgccc ctaccgatcg cttccgggca 3420

gcggtgcaag aggccaagat cggccccgac aaagacattc cgcacgtcgg cgcgccgatc 3480

atcgtgaagt acgtcagcga cctgcgccta ctcggcctgc tctaa 3525

<210> 99

<211> 1174

<212> PRT

<213> 海栖分枝杆菌

<400> 99

Met Ser Pro Ile Thr Arg Glu Glu Arg Leu Glu Arg Arg Ile Gln Asp

1 5 10 15

Leu Tyr Ala Asn Asp Pro Gln Phe Ala Ala Ala Lys Pro Ala Thr Ala

20 25 30

Ile Thr Ala Ala Ile Glu Arg Pro Gly Leu Pro Leu Pro Gln Ile Ile

35 40 45

Glu Thr Val Met Thr Gly Tyr Ala Asp Arg Pro Ala Leu Ala Gln Arg

50 55 60

Ser Val Glu Phe Val Thr Asp Ala Gly Thr Gly His Thr Thr Leu Arg

65 70 75 80

Leu Leu Pro His Phe Glu Thr Ile Ser Tyr Gly Glu Leu Trp Asp Arg

85 90 95

Ile Ser Ala Leu Ala Asp Val Leu Ser Thr Glu Gln Thr Val Lys Pro

100 105 110

Gly Asp Arg Val Cys Leu Leu Gly Phe Asn Ser Val Asp Tyr Ala Thr

115 120 125

Ile Asp Met Thr Leu Ala Arg Leu Gly Ala Val Ala Val Pro Leu Gln

130 135 140

Thr Ser Ala Ala Ile Thr Gln Leu Gln Pro Ile Val Ala Glu Thr Gln

145 150 155 160

Pro Thr Met Ile Ala Ala Ser Val Asp Ala Leu Ala Asp Ala Thr Glu

165 170 175

Leu Ala Leu Ser Gly Gln Thr Ala Thr Arg Val Leu Val Phe Asp His

180 185 190

His Arg Gln Val Asp Ala His Arg Ala Ala Val Glu Ser Ala Arg Glu

195 200 205

Arg Leu Ala Gly Ser Ala Val Val Glu Thr Leu Ala Glu Ala Ile Ala

210 215 220

Arg Gly Asp Val Pro Arg Gly Ala Ser Ala Gly Ser Ala Pro Gly Thr

225 230 235 240

Asp Val Ser Asp Asp Ser Leu Ala Leu Leu Ile Tyr Thr Ser Gly Ser

245 250 255

Thr Gly Ala Pro Lys Gly Ala Met Tyr Pro Arg Arg Asn Val Ala Thr

260 265 270

Phe Trp Arg Lys Arg Thr Trp Phe Glu Gly Gly Tyr Glu Pro Ser Ile

275 280 285

Thr Leu Asn Phe Met Pro Met Ser His Val Met Gly Arg Gln Ile Leu

290 295 300

Tyr Gly Thr Leu Cys Asn Gly Gly Thr Ala Tyr Phe Val Ala Lys Ser

305 310 315 320

Asp Leu Ser Thr Leu Phe Glu Asp Leu Ala Leu Val Arg Pro Thr Glu

325 330 335

Leu Thr Phe Val Pro Arg Val Trp Asp Met Val Phe Asp Glu Phe Gln

340 345 350

Ser Glu Val Asp Arg Arg Leu Val Asp Gly Ala Asp Arg Val Ala Leu

355 360 365

Glu Ala Gln Val Lys Ala Glu Ile Arg Asn Asp Val Leu Gly Gly Arg

370 375 380

Tyr Thr Ser Ala Leu Thr Gly Ser Ala Pro Ile Ser Asp Glu Met Lys

385 390 395 400

Ala Trp Val Glu Glu Leu Leu Asp Met His Leu Val Glu Gly Tyr Gly

405 410 415

Ser Thr Glu Ala Gly Met Ile Leu Ile Asp Gly Ala Ile Arg Arg Pro

420 425 430

Ala Val Leu Asp Tyr Lys Leu Val Asp Val Pro Asp Leu Gly Tyr Phe

435 440 445

Leu Thr Asp Arg Pro His Pro Arg Gly Glu Leu Leu Val Lys Thr Asp

450 455 460

Ser Leu Phe Pro Gly Tyr Tyr Gln Arg Ala Glu Val Thr Ala Asp Val

465 470 475 480

Phe Asp Ala Asp Gly Phe Tyr Arg Thr Gly Asp Ile Met Ala Glu Val

485 490 495

Gly Pro Glu Gln Phe Val Tyr Leu Asp Arg Arg Asn Asn Val Leu Lys

500 505 510

Leu Ser Gln Gly Glu Phe Val Thr Val Ser Lys Leu Glu Ala Val Phe

515 520 525

Gly Asp Ser Pro Leu Val Arg Gln Ile Tyr Ile Tyr Gly Asn Ser Ala

530 535 540

Arg Ala Tyr Leu Leu Ala Val Ile Val Pro Thr Gln Glu Ala Leu Asp

545 550 555 560

Ala Val Pro Val Glu Glu Leu Lys Ala Arg Leu Gly Asp Ser Leu Gln

565 570 575

Glu Val Ala Lys Ala Ala Gly Leu Gln Ser Tyr Glu Ile Pro Arg Asp

580 585 590

Phe Ile Ile Glu Thr Thr Pro Trp Thr Leu Glu Asn Gly Leu Leu Thr

595 600 605

Gly Ile Arg Lys Leu Ala Arg Pro Gln Leu Lys Lys His Tyr Gly Glu

610 615 620

Leu Leu Glu Gln Ile Tyr Thr Asp Leu Ala His Gly Gln Ala Asp Glu

625 630 635 640

Leu Arg Ser Leu Arg Gln Ser Gly Ala Asp Ala Pro Val Leu Val Thr

645 650 655

Val Cys Arg Ala Ala Ala Ala Leu Leu Gly Gly Ser Ala Ser Asp Val

660 665 670

Gln Pro Asp Ala His Phe Thr Asp Leu Gly Gly Asp Ser Leu Ser Ala

675 680 685

Leu Ser Phe Thr Asn Leu Leu His Glu Ile Phe Asp Ile Glu Val Pro

690 695 700

Val Gly Val Ile Val Ser Pro Ala Asn Asp Leu Gln Ala Leu Ala Asp

705 710 715 720

Tyr Val Glu Ala Ala Arg Lys Pro Gly Ser Ser Arg Pro Thr Phe Ala

725 730 735

Ser Val His Gly Ala Ser Asn Gly Gln Val Thr Glu Val His Ala Gly

740 745 750

Asp Leu Ser Leu Asp Lys Phe Ile Asp Ala Ala Thr Leu Ala Glu Ala

755 760 765

Pro Arg Leu Pro Ala Ala Asn Thr Gln Val Arg Thr Val Leu Leu Thr

770 775 780

Gly Ala Thr Gly Phe Leu Gly Arg Tyr Leu Ala Leu Glu Trp Leu Glu

785 790 795 800

Arg Met Asp Leu Val Asp Gly Lys Leu Ile Cys Leu Val Arg Ala Lys

805 810 815

Ser Asp Thr Glu Ala Arg Ala Arg Leu Asp Lys Thr Phe Asp Ser Gly

820 825 830

Asp Pro Glu Leu Leu Ala His Tyr Arg Ala Leu Ala Gly Asp His Leu

835 840 845

Glu Val Leu Ala Gly Asp Lys Gly Glu Ala Asp Leu Gly Leu Asp Arg

850 855 860

Gln Thr Trp Gln Arg Leu Ala Asp Thr Val Asp Leu Ile Val Asp Pro

865 870 875 880

Ala Ala Leu Val Asn His Val Leu Pro Tyr Ser Gln Leu Phe Gly Pro

885 890 895

Asn Ala Leu Gly Thr Ala Glu Leu Leu Arg Leu Ala Leu Thr Ser Lys

900 905 910

Ile Lys Pro Tyr Ser Tyr Thr Ser Thr Ile Gly Val Ala Asp Gln Ile

915 920 925

Pro Pro Ser Ala Phe Thr Glu Asp Ala Asp Ile Arg Val Ile Ser Ala

930 935 940

Thr Arg Ala Val Asp Asp Ser Tyr Ala Asn Gly Tyr Ser Asn Ser Lys

945 950 955 960

Trp Ala Gly Glu Val Leu Leu Arg Glu Ala His Asp Leu Cys Gly Leu

965 970 975

Pro Val Ala Val Phe Arg Cys Asp Met Ile Leu Ala Asp Thr Thr Trp

980 985 990

Ala Gly Gln Leu Asn Val Pro Asp Met Phe Thr Arg Met Ile Leu Ser

995 1000 1005

Leu Ala Ala Thr Gly Ile Ala Pro Gly Ser Phe Tyr Glu Leu Ala

1010 1015 1020

Ala Asp Gly Ala Arg Gln Arg Ala His Tyr Asp Gly Leu Pro Val

1025 1030 1035

Glu Phe Ile Ala Glu Ala Ile Ser Thr Leu Gly Ala Gln Ser Gln

1040 1045 1050

Asp Gly Phe His Thr Tyr His Val Met Asn Pro Tyr Asp Asp Gly

1055 1060 1065

Ile Gly Leu Asp Glu Phe Val Asp Trp Leu Asn Glu Ser Gly Cys

1070 1075 1080

Pro Ile Gln Arg Ile Ala Asp Tyr Gly Asp Trp Leu Gln Arg Phe

1085 1090 1095

Glu Thr Ala Leu Arg Ala Leu Pro Asp Arg Gln Arg His Ser Ser

1100 1105 1110

Leu Leu Pro Leu Leu His Asn Tyr Arg Gln Pro Glu Arg Pro Val

1115 1120 1125

Arg Gly Ser Ile Ala Pro Thr Asp Arg Phe Arg Ala Ala Val Gln

1130 1135 1140

Glu Ala Lys Ile Gly Pro Asp Lys Asp Ile Pro His Val Gly Ala

1145 1150 1155

Pro Ile Ile Val Lys Tyr Val Ser Asp Leu Arg Leu Leu Gly Leu

1160 1165 1170

Leu

<210> 100

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 100

gaggagaagt cgacatgaac gaacaatatt ccgcattgcg 40

<210> 101

<211> 39

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 101

ggaagctttc tagattagcc ggtattacgc atacctgcc 39

<210> 102

<211> 47

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 102

taagctagca agaggagaag tcgacatgca gaacagcgct ttgaaag 47

<210> 103

<211> 43

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 103

gcctctagga agctttctag attacttttt cttcgctttg gcg 43

<210> 104

<211> 49

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 104

ctagcaagag gagaagtcga catgcctgac gctaaaaaac aggggcggt 49

<210> 105

<211> 48

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 105

ctaggaagct ttctagagtc gttaatcgtg agcgcctatt tcgcgcag 48

<210> 106

<211> 51

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 106

ctagcaagag gagaagtcga catgacaaag tatgcattag tcggtgatgt g 51

<210> 107

<211> 54

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 107

ctaggaagct ttctagagtc gttacagaat gtgacctaag gtctggcgta aatg 54

<210> 108

<211> 51

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 108

ctagcaagag gagaagtcga catgagttct gaaagtagtc agggtctagt c 51

<210> 109

<211> 45

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 109

ctaggaagct ttctagagtc gttacttctg ggagcgccac atctc 45

<210> 110

<211> 45

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 110

tagcaagagg agaagtcgac atggactgga agaagatcta tgaag 45

<210> 111

<211> 39

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 111

cctctaggaa gctttctaga ttagaatgcc gcgttgaag 39

<210> 112

<211> 42

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 112

tagcaagagg agaagtcgac atgagctggc aagaactgta tc 42

<210> 113

<211> 47

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 113

cctctaggaa gctttctaga ttaatatttc tctttaaagc gcttttc 47

<210> 114

<211> 43

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 114

tagcaagagg agaagtcgac atggcacgtt ttactttacc aag 43

<210> 115

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 115

cctctaggaa gctttctaga ttacaaatta actttagttc catagtatgt gc 52

<210> 116

<211> 100

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 116

accggtaaac gactcagcag cctgacgcac tggcgatatt attttgcctt ctcctcacca 60

cagaatgttc tgccacctga cgatatcaaa ttacgccccg 100

<210> 117

<211> 104

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 117

tgcttatcca caacattttg cgcacggtta tgtggacaaa atacctggtt acccaggccg 60

tgccggcacg ttaaccgggc cctaggtcta gggcggcgga tttg 104

<210> 118

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 118

aggcagttcc ataggatggc 20

<210> 119

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 119

ataataatag gtaccggcgg cgctggcgca gcttgctgcg 40

<210> 120

<211> 41

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 120

tattattatg gatccaaccc gataatggta gatctccctc t 41

<210> 121

<211> 41

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 121

ataataatag gatccggagc agaaacaatg tggtatttac t 41

<210> 122

<211> 43

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 122

tattattatc tgcagatgct cttttttatg cattacaaac tgc 43

<210> 123

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 123

taataataag gtaccaactg ggcttgcttc actgg 35

<210> 124

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 124

taataataaa gatctgcctc gaccgttcag gaagg 35

<210> 125

<211> 38

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 125

taataataaa gatcttaact ctccagtaac aaagctgc 38

<210> 126

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 126

taataataac tgcaggctat gtcaccactt acgg 34

<210> 127

<211> 37

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 127

tattattatt cctgcaggcg tctttgttct tccgtcc 37

<210> 128

<211> 38

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 128

tattattatc ttcggtacct ttagcatctg cttcggcc 38

<210> 129

<211> 39

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 129

tattattatg gatcccggta atgcaacaaa agttagagc 39

<210> 130

<211> 48

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 130

tattattatg gatccaaagt gactgacatg aatatccttg atttgttc 48

<210> 131

<211> 39

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 131

taataataag gatcctacac tggcggatgt ggcataaac 39

<210> 132

<211> 39

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 132

taataatttg gtacccattc acagtcacca ggtacaacg 39

<210> 133

<211> 39

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 133

taataataag gatccgagaa taacatgaat ggtgcattg 39

<210> 134

<211> 39

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 134

taataatatc tgcagatcca caaaaagccc tggcaattg 39

<210> 135

<211> 31

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 135

gataatcccc cctgcaggga gcggtaaata g 31

<210> 136

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 136

tattattttg gatccttctc tggtgttgtt tggg 34

<210> 137

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 137

tattattatg gatccgcgtg gtgttgaaag ccg 33

<210> 138

<211> 38

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 138

tattataaag gtaccgcctc ttccaggtca gtgaaggg 38

<210> 139

<211> 36

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 139

taataataag gtacccagtt ttggctatgc cttaag 36

<210> 140

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 140

taataatcat taagcttgct ccctttgctg ggcc 34

<210> 141

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 141

taataataat aagcttttta cgcctcaaac tttcg 35

<210> 142

<211> 41

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 142

taataataaa ttgccctgca gcgtaagatt gtcgttcagg g 41

<210> 143

<211> 31

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 143

tattattatt gtttggtacc tctgtgccgc t 31

<210> 144

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 144

aatgttccac tctgcaggga tgataataag ggg 33

<210> 145

<211> 29

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 145

atcggatcca atcgcacact aacagactg 29

<210> 146

<211> 38

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 146

acagctttgg atcctcattg tgtttactcc tgattagc 38

<210> 147

<211> 42

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 147

ataataatat ctagagcagc aagccgcgcg gcaggtggtc ag 42

<210> 148

<211> 42

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 148

tattattatc tgcagacgcc atcctgatcc atatgtatat gg 42

<210> 149

<211> 42

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 149

tattattatg gatccagttc ctccttttcg gatgatgttc tg 42

<210> 150

<211> 42

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 150

ataataatag gatccgaggc ctttgctgcg actgccatgt tc 42

<210> 151

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 151

cgccacaacc agtgacaccc 20

<210> 152

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 152

ggggttttag tcgccctttc tggc 24

<210> 153

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 153

cgggatctgg tggcgtttaa agtg 24

<210> 154

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 154

tgacggcgtt tgtcttcacc g 21

<210> 155

<211> 53

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 155

acgctatgga actgcaggat gagagcatga aatggaacgg atgcgcgcct tat 53

<210> 156

<211> 53

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 156

acgctatgga actgcaggat gagagcatct gccccagatc gttggctttt tgc 53

<210> 157

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 157

tttgaaaaca ggatgtagcg atgaccgata ttcgcttgta 40

<210> 158

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 158

tacaagcgaa tatcggtcat cgctacatcc tgttttcaaa 40

<210> 159

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 159

cgcctgaata ctacgattga ctggagaatg cgaatgaaca 40

<210> 160

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 160

tgttcattcg cattctccag tcaatcgtag tattcaggcg 40

<210> 161

<211> 39

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 161

tttgaaaaca ggatgtagcg gcccgtagtc tgcaaatcc 39

<210> 162

<211> 39

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 162

ggatttgcag actacgggcc gctacatcct gttttcaaa 39

<210> 163

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 163

gcattacgct gacttgacgg ctggagaatg cgaatgaaca 40

<210> 164

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成引物

<400> 164

tgttcattcg cattctccag ccgtcaagtc agcgtaatgc 40

<210> 165

<211> 200

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成多核苷酸

<400> 165

actggagaat gcgaatgaac agcaataaag agttaatgca gcgccgcagt caggcgattc 60

cccgtggcgt tgggcaaatt cacccgattt tcgctgaccg cgcggaaaac tgccgggtgt 120

gggacgttga aggccgtgag tatcttgatt tcgcgggcgg gattgcggtg ctcaataccg 180

ggcacctgca tccgaaggtg 200

<210> 166

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成寡核苷酸

<400> 166

ggcgaaagag tctgctccgg c 21

<210> 167

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成寡核苷酸

<400> 167

cattcagaca caacgcatcg cgg 23

<210> 168

<211> 43

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成寡核苷酸

<400> 168

ggcttaccag caccggtggg ttatgcccgt agtctgcaaa tcc 43

<210> 169

<211> 42

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成寡核苷酸

<400> 169

gcattacgct gacttgacgg gtgaaaaccg ttcgcagcct gg 42

<210> 170

<211> 43

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成寡核苷酸

<400> 170

ggcttaccag caccggtggg ttatgcccgt agtctgcaaa tcc 43

<210> 171

<211> 42

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成寡核苷酸

<400> 171

ccaggctgcg aacggttttc acccgtcaag tcagcgtaat gc 42

<210> 172

<211> 46

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成寡核苷酸

<400> 172

ggcttaccag caccggtggg ttatgtgaaa accgttcgca gcctgg 46

<210> 173

<211> 46

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成寡核苷酸

<400> 173

ccaggctgcg aacggttttc acataaccca ccggtgctgg taagcc 46

<210> 174

<211> 1317

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成多核苷酸

<400> 174

atggactgga agaagatcta tgaagacaga acctgcactg cagatgaagc agtaaagagc 60

attaagtcag gtgaccgcgt gctgtttgcg cactgtgttg ctgaaccgcc agttctggta 120

gaagcaatgg ttgcgaatgc agctgcatac aagaatgtca cggtttcaca catggttacc 180

cttggtaagg gtgaatactc aaaaccagaa tataaagaaa actttacttt tgaaggttgg 240

tttaccagcc cttcaacacg tggatccatt gcagaaggac acggacagtt tgtccctgta 300

ttcttccacg aggtaccatc tttaatccgt aaagacattt tccatgttga tgtattcatg 360

gtaatggtat ccccgccaga tcataacggt ttctgctgtg tgggtgtatc ttctgactat 420

accatgcagg ctatcaaatc agcaaaaatt gtactggctg aagtgaatga tcaggtacct 480

gtagtttatg gcgatacctt tgttcacgtt agtgaaatcg acaagttcgt tgaaacttca 540

catccactgc cagaaatcgg tctgccgaag atcggtgaag tagaagctgc tattggtaag 600

cactgcgctt cgctgatcga agatggttcc acattacagc ttggtatcgg cgctattccg 660

gatgctgtac tttcacagct taaggacaag aaacaccttg gtatccactc tgaaatgatt 720

tccgacggtg ttgttgatct ttacgaagca ggcgttattg actgcagcca aaagtctatc 780

gacaaaggca aaatggcaat aacattctta atgggaacga agcgtcttta tgatttcgct 840

gcaaacaatc caaaggttga attaaagccg gttgactaca tcaatcatcc atctgtagtt 900

gcacagtgca gcaaaatggt ttgcatcaat gcttgcttgc aagttgattt tatgggtcag 960

attgtctccg atagtattgg cacaaagcag ttctccggcg taggcggtca ggttgacttc 1020

gtacgcggtg catccatgtc tattgacggc aaaggtaaag cgatcatcgc gatgccttcc 1080

gttgcaaaga agaaagatgg cagtatgatt tcgaagatcg ttccattcat cgatcacggt 1140

gcagctgtaa ctacatcccg taacgatgcg gactatgtcg taacggaata tggtattgct 1200

gaaatgaagg gtaagtcgtt acaggaccgc gcacgcgcgt taatcaatat tgcccaccct 1260

gatttcaaag atgaattaaa ggctgaattt gaaaagcgct tcaacgcggc attctaa 1317

<210> 175

<211> 1308

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成多核苷酸

<400> 175

atgagctggc aagaactgta tcaaagtaaa ttatgttcag ccacagaagc ggtaaaacag 60

attaaaaacg gtgataccgt ggtatttgcc cattgtgtag gtgaaccgcc tgcactggtg 120

gaggcgatga ttgaaaatgc tgaacaatat aaagatgttg agattaaaca tatggttagc 180

ctgggtagtg gtggttatac tgcgaaaggg atggaagcgc attttcgcgt aaatccaatg 240

tttgtcagcg gcaatgtacg taaggcgatt gaaaatggcg atggtgattt tacacctgca 300

ttcttccatg aagtaccaaa gttgctgcgt gaaaaacgtc tgaaatgtga tgttgttctg 360

gcacaggtaa cgccaccaga tgaacatggt tattgttcgc tgggaacaag cgttgattat 420

acctatgaag ccattaaaac cgcgcgcacc gtaattgttc aggtgaatga ccagtttcct 480

cgcacctatg gtgaggtggt gcatgtcagc gagtttgact atatcgttga aaaatcacaa 540

ccgctgtttg aactgcaacc tgcaaagatt ggcgaagttg aagaagcgat tggtaaaaat 600

tgtgcctcgc tgattgaaga tggtagcacg ttacagctgg ggattggtgg gattccggat 660

gcggtgatgt tatttctgac tgataaaaaa gatttaggga ttcatagcga aatgattagc 720

gatggcacgc tggcgcttta tgaaaaaggt gttattaatg gtaaatataa aaattttgat 780

aaagaaaaaa tgacggttac cttcctgatg ggtactaaaa aactgtatga ctttgccaat 840

aataacccgg cagtagaggt aaaaccggta gactatgtga atcatccggc aattatcatg 900

aaacaacata agatggtttc tattaatagc gccattcagg ttgatttaat ggggcaggtg 960

gttgcagagg cgatgggact gcgccaattt tccggtgttg gcggtcaggt tgactttatt 1020

cgtggcgtgt cgatgggtga agatggcaag gcgattatcg cgatgccttc aatcactaca 1080

aaaaaagatg gtacggtaat tagcaaaatc gtctctattg tcgatgaagg tgcaccgatt 1140

accacctcac gtaatgatgt tgattatatt gtcacagaat acggtattgc agaattaaaa 1200

ggcaaatcgc tgcgtgaacg cgcacgtaat ctgattaata ttgctcatcc atcggtacgt 1260

gaatcgctgg cagtagaatt tgaaaagcgc tttaaagaga aatattaa 1308

<210> 176

<211> 1539

<212> DNA

<213> 人工序列

<220>

<223> 人工序列说明：合成多核苷酸

<400> 176

atggatttga agctgaccga tgcggacgtt gaggcaatcg tagcgcaagt catggctaac 60

attgagcgcc gtctgggtag cgcggaagcg ggcagcgcag catccgctgc gtcgccggca 120

ccggctgcgc cggttcgtac cgctccgggt ggcagcccgg cagccagccc gcgtccggag 180

tacggtgttt ttgatcgtgc ggaggatgca gtcgccgctg ccgccgaagc tcaggaagcc 240

ttcctgcgcc agtgtcgtct gcaagaccgt gagcgcattc tgcgtgccat ccgtgaagag 300

actctggcac gcaaggaaga attggcacgc ctgatttggg aggaaacgaa gctgggtcgc 360

ttggaacaca aaattgcaaa gctggaattg acggcgctga aaaccccggg tacggaggat 420

ctgcgcaccg aggcatttag cggcgacaac ggcctgacca tcgtcgaaca tgcgccgtac 480

ggtgtgattg gcgcggttac cccggttacg aaccctgcgg agactattat caacaacgcg 540

atcggcatgc tggcaagcgg taatgcagtg gtgttcaacg tgcaccctag cgctaaacgt 600

tgctccgcgt ataccgtcca gatgatcaat aaagcagtga tggcagcggg tggtccgccg 660

aatctggtta cgatggttcg cgagccgacc atggaaaccc tgaatgcgat catccgcagc 720

ccgagcgtga agctgctggt gggcaccggc ggtccgggtc tggttagcac cctgctgcgc 780

tctggtaaga aagcgattgg tgcgggtgcg ggcaatccgc cggtcgttgt ggatgatacc 840

gccgacctgg agcatgcggc aaaggaaatc atcaaaggcg cgtcctttga caacaatatt 900

ctgtgtattg cggagaaaga ggtttttgtg gttgataaag cggccgacgg tctgatctat 960

cacatgctgg ataacggcgc atacatgctg ggtcgtgacg agctggagaa ggtgatgcaa 1020

ttcgcgctga ccgcggacga aagccagggc ggtgcgggtt gctctattga tccgcgtcgt 1080

gcgtggcatg tgactaagga gtgggtgggc aaagatgcgc gcttgttcct ggagaagatt 1140

ggtgtcaaga ctgaccgtcc ggttgacttg ctgttgtgcg aggttgactt tgaccacccg 1200

ttcgtgcagc tggaacaaat gatgccagta ctgccgattg ttcgtgtccg tgacctggat 1260

gaagccatcg gtatggccgt ccgtgcggag cacggcaatc gtcacaccgc aattatgcat 1320

agccgtaacg tggacaatct gacccgtttt gcccgtgcca ttgccacgac catcttcgtc 1380

aaaaacgcaa gcagcttggc gggtgttggt tatggcggtg aaggttttac caccatgacg 1440

atcgccggtc caacgggcga gggtctgacg tcggctcgta cgttcacgcg caaagtccgc 1500

tgtgtcctgg cggacggcgg tttccgtatc gttggttaa 1539

<210> 177

<211> 792

<212> DNA

<213> 中间耶氏杆菌

<400> 177

atgaccgata ttcgcttgta tatgtttcaa actggctcgc tgaagtgcaa agtccacaat 60

atcaaaatga atcaaggagg tggagcggat tatgaaatcc ctgtcccgtt cttcctgctg 120

acccatcctg atggtcacac gctgattgat ggcgggaatg ctgtcgaaac cgccactgat 180

cccaaagggt attggggcgg gattaccgag gtttattggc cggtaatgcg tgaagatgag 240

ggctgtgtag cgcagcttaa aaaaatgggg atcaatcccg aagatatccg gtatgtcttg 300

cagtcgcact tgcatcttga tcataccggt gcgattggcc gattccccaa tgcgacacac 360

atcgttcagc gccgtgagta cgagtatgcc tttactcctg actggtttgc tgcgggaggc 420

tatatcagaa acgactttga ccggccgggt ctgaaatggg cgtttctgga aggcgaaaac 480

aatgattttt atgatatcta tggcgacggt acgctgaaaa cagtatttac acccggccat 540

tcgcctgggc atcagtcaat actggtcacc ttgcccaact caggtccgat gctactgact 600

attgatgcag catacaccac ggatcactgg gaagaaaaag ctctgccagg atttatgtcc 660

tcagccgttg agacggtgcg ttcggtgcag aagatgcgca tgttggctag ccgcacaagt 720

gcgcaagtgg tgacaggcca tgacccggat gcctggcaaa cgttcaggca cgcgcctgaa 780

tactacgatt ga 792

<210> 178

<211> 771

<212> DNA

<213> 根癌土壤杆菌

<400> 178

atgcttcagt cgggtacgct gaaatgcaag gtacacaaca ttaagatgaa ccaggggaac 60

ggtgcagact atgagatccc cgttccgttt ttcctgatta cccatccggc cgggcacacc 120

gtgatcgacg gcggcaacgc gattgaagtt gcaacagatc cgcgtggcca ttggggcggc 180

atctgcgatg tctattggcc agtactggac aaggaccagg gctgcgttga ccagatcaag 240

gcgcttggtt tcgatccggc cgatgtcaaa tatgttgtgc agtcgcacct gcatctcgat 300

cataccggcg ccatcggtcg cttccccaac gcaacccaca tcgtgcagcg ctctgaatat 360

gaatatgcct ttacgcccga ctggtttgct ggcggcggct atatccgcaa ggacttcgac 420

aagccgggtc tgaagtggca gttcctcaac ggtgcgcagg acgattatta cgatgtttac 480

ggcgacggca cgctcaccac gatcttcacg cccggtcatg cgcccggcca ccagtccttc 540

ctggtgcgcc tgccaaacag caaaccgctt ctcctgacga tcgatgctgc ctacacactg 600

gaccactggg aagagaaggc tttgcctggc ttccttgcct cgaccgttga cacggtccgt 660

tctgttcaga agctccgcac ctatgccgaa aagcatgatg cgacagtcgt caccggccat 720

gaccctgacg cctgggcgaa cttcaagaag gctcccgaat tttacgcgta a 771

<210> 179

<211> 263

<212> PRT

<213> 中间耶氏杆菌

<400> 179

Met Thr Asp Ile Arg Leu Tyr Met Phe Gln Thr Gly Ser Leu Lys Cys

1 5 10 15

Lys Val His Asn Ile Lys Met Asn Gln Gly Gly Gly Ala Asp Tyr Glu

20 25 30

Ile Pro Val Pro Phe Phe Leu Leu Thr His Pro Asp Gly His Thr Leu

35 40 45

Ile Asp Gly Gly Asn Ala Val Glu Thr Ala Thr Asp Pro Lys Gly Tyr

50 55 60

Trp Gly Gly Ile Thr Glu Val Tyr Trp Pro Val Met Arg Glu Asp Glu

65 70 75 80

Gly Cys Val Ala Gln Leu Lys Lys Met Gly Ile Asn Pro Glu Asp Ile

85 90 95

Arg Tyr Val Leu Gln Ser His Leu His Leu Asp His Thr Gly Ala Ile

100 105 110

Gly Arg Phe Pro Asn Ala Thr His Ile Val Gln Arg Arg Glu Tyr Glu

115 120 125

Tyr Ala Phe Thr Pro Asp Trp Phe Ala Ala Gly Gly Tyr Ile Arg Asn

130 135 140

Asp Phe Asp Arg Pro Gly Leu Lys Trp Ala Phe Leu Glu Gly Glu Asn

145 150 155 160

Asn Asp Phe Tyr Asp Ile Tyr Gly Asp Gly Thr Leu Lys Thr Val Phe

165 170 175

Thr Pro Gly His Ser Pro Gly His Gln Ser Ile Leu Val Thr Leu Pro

180 185 190

Asn Ser Gly Pro Met Leu Leu Thr Ile Asp Ala Ala Tyr Thr Thr Asp

195 200 205

His Trp Glu Glu Lys Ala Leu Pro Gly Phe Met Ser Ser Ala Val Glu

210 215 220

Thr Val Arg Ser Val Gln Lys Met Arg Met Leu Ala Ser Arg Thr Ser

225 230 235 240

Ala Gln Val Val Thr Gly His Asp Pro Asp Ala Trp Gln Thr Phe Arg

245 250 255

His Ala Pro Glu Tyr Tyr Asp

260

<210> 180

<211> 256

<212> PRT

<213> 根癌土壤杆菌

<400> 180

Met Leu Gln Ser Gly Thr Leu Lys Cys Lys Val His Asn Ile Lys Met

1 5 10 15

Asn Gln Gly Asn Gly Ala Asp Tyr Glu Ile Pro Val Pro Phe Phe Leu

20 25 30

Ile Thr His Pro Ala Gly His Thr Val Ile Asp Gly Gly Asn Ala Ile

35 40 45

Glu Val Ala Thr Asp Pro Arg Gly His Trp Gly Gly Ile Cys Asp Val

50 55 60

Tyr Trp Pro Val Leu Asp Lys Asp Gln Gly Cys Val Asp Gln Ile Lys

65 70 75 80

Ala Leu Gly Phe Asp Pro Ala Asp Val Lys Tyr Val Val Gln Ser His

85 90 95

Leu His Leu Asp His Thr Gly Ala Ile Gly Arg Phe Pro Asn Ala Thr

100 105 110

His Ile Val Gln Arg Ser Glu Tyr Glu Tyr Ala Phe Thr Pro Asp Trp

115 120 125

Phe Ala Gly Gly Gly Tyr Ile Arg Lys Asp Phe Asp Lys Pro Gly Leu

130 135 140

Lys Trp Gln Phe Leu Asn Gly Ala Gln Asp Asp Tyr Tyr Asp Val Tyr

145 150 155 160

Gly Asp Gly Thr Leu Thr Thr Ile Phe Thr Pro Gly His Ala Pro Gly

165 170 175

His Gln Ser Phe Leu Val Arg Leu Pro Asn Ser Lys Pro Leu Leu Leu

180 185 190

Thr Ile Asp Ala Ala Tyr Thr Leu Asp His Trp Glu Glu Lys Ala Leu

195 200 205

Pro Gly Phe Leu Ala Ser Thr Val Asp Thr Val Arg Ser Val Gln Lys

210 215 220

Leu Arg Thr Tyr Ala Glu Lys His Asp Ala Thr Val Val Thr Gly His

225 230 235 240

Asp Pro Asp Ala Trp Ala Asn Phe Lys Lys Ala Pro Glu Phe Tyr Ala

245 250 255

Claims

1.一种非天然微生物，所述微生物具有4-羟基丁酸酯途径且能够产生4-羟基丁酸酯，其中所述微生物包含遗传修饰，所述遗传修饰选自：

(A)增加磷酸烯醇丙酮酸羧化酶表达的遗传修饰；

(B)增加α-酮戊二酸脱氢酶表达的遗传修饰；

(C)增加非磷酸转移酶PTS葡萄糖吸收系统表达的遗传修饰；

(D)增加γ-丁内酯酯酶表达的遗传修饰；

(E)降低琥珀酰基-CoA合成酶表达的遗传修饰；

(F)降低酰基辅酶A硫酯酶表达的遗传修饰；

(G)降低醇脱氢酶表达的遗传修饰；

(H)降低非产能NADH脱氢酶表达的遗传修饰；

(I)降低细胞色素氧化酶表达的遗传修饰；和

(J)(A)到(I)项的所述遗传修饰中的两种或更多种、三种或更多种、四种或更多种、五种或更多种、六种或更多种、七种或更多种、八种或更多种或全部的组合。

2.一种减少细胞或细胞培养物中的γ-丁内酯产生的方法，其包含在所述细胞中表达编码γ-丁内酯酯酶的核酸。