CN107384846B

CN107384846B - 生产1,4-丁二醇的微生物和相关方法

Info

Publication number: CN107384846B
Application number: CN201710711482.5A
Authority: CN
Inventors: S·J·万殿; A·P·博加德; 罗伯特·哈瑟尔贝克; 凯瑟琳·J·普若尔-巴克斯利; 牛巍; 约翰·D·特拉威克; 哈里·伊姆; M·J·伯克; 罗宾·E·奥斯特豪特; 孙军
Original assignee: Genomatica Inc
Current assignee: Genomatica Inc
Priority date: 2009-06-04
Filing date: 2010-06-04
Publication date: 2021-08-10
Anticipated expiration: 2030-06-04
Also published as: EP3392340A1; KR102041627B1; JP5964747B2; US9434964B2; JP2012529267A; US20110045575A1; WO2010141920A3; MY195387A; CN102498215A; US10273508B2; US20190376095A1; EP4056706A1; SI3392340T1; CA2764379A1; AU2010256428B2; CN107384846A; EP2438178A2; SG176656A1; JP2022031648A; US8129169B2

Abstract

本发明提供非天然存在的包含1,4‑丁二醇(BDO)途径的微生物体，该途径包含编码BDO途径酶的至少一种外源核酸，所述核酸以足以产生BDO的量表达，并且为BDO的表达被进一步优化。本发明另外提供利用所述微生物体生产BDO的方法。

Description

生产1,4-丁二醇的微生物和相关方法

本申请是申请日为2010年06月04日、申请号为201080034821.7、名称为“生产1,4-丁二醇的微生物和相关方法”的发明申请的分案。

发明背景

本申请要求2009年6月4日提交的美国临时申请No.61/184，311的优先权，所述全部内容在此通过引用引入。

本发明总体上涉及生物体的计算机(in silico)设计和生物体的工程改造，更具体而言，涉及具有1,4-丁二醇生物合成能力的生物体。

化合物4-羟基丁酸(4-HB)是4-碳羧酸，其具有作为各种日用品和特种化学品的构造单元的工业潜力。具体而言，4-HB具有充当进入1,4-丁二醇家族化学品的新切入点的潜力，所述1,4-丁二醇家族化学品包括溶剂、树脂、聚合物前体和特种化学品。1,4-丁二醇(BDO)是聚合物中间体和工业溶剂，全球每年销售约30亿磅。BDO目前从石油化学前体、初级乙炔(primarily acetylene)、马来酸酐和环氧丙烷生产。

例如，乙炔与2分子甲醛以Reppe合成反应进行反应(Kroschwitz和Grant，Encyclopedia of Chem.Tech.，John Wiley and Sons，Inc.，New York(1999))，然后通过催化氢化形成1,4-丁二醇。据估计美国生产的90％的乙炔被消耗用于丁二醇生产。可选地，其可以通过源自丁烷的马来酸酐的酯化和催化氢化形成。在下游，丁二醇可以通过例如氧化进一步被转化成γ-丁内酯--其可以进一步转化成吡咯烷酮和N-甲基-吡咯烷酮，或通过例如氢解进一步被转化成四氢呋喃。这些化合物作为聚合物中间体、溶剂和添加剂具有各种用途以及具有每年约20亿磅的组合销路。

期望通过可选的手段开发生产这些化学品的方法，该手段不仅用可再生物代替石油基原料，而且使用较少的能源和资金集约型工艺。能源部已经提议1，4-二酸，以及特别是琥珀酸，作为关键的生物学生产的中间体，用于生产丁二醇家族产物(DOE Report，“TopValue-Added Chemicals from Biomass”，2004)。然而，琥珀酸的分离和纯化昂贵并且催化还原成丁二醇要求高温和高压。

因此，对有效生产商业数量的1,4-丁二醇和其化学前体的可选方法存在需求。本发明满足了这种需求并且还提供相关的优势。

发明概述

本发明提供包含1,4-丁二醇(BDO)途径的非天然存在的微生物体，该途径包含编码BDO途径酶的至少一种外源核酸，所述核酸以足以产生BDO的量表达，并且为BDO的表达被进一步优化。本发明还提供利用所述微生物体生产BDO的方法。

附图简述

图1是显示4-羟基丁酸(4-HB)和1,4-丁二醇生产的生物化学途径的示意图。前5个步骤对于大肠杆菌是内源性的，而其余步骤可以异源表达。催化生物合成反应的酶是：(1)琥珀酰-CoA合成酶；(2)CoA-非依赖性琥珀酸半醛脱氢酶；(3)α-酮戊二酸脱氢酶；(4)谷氨酸：琥珀酸半醛转氨酶；(5)谷氨酸脱羧酶；(6)CoA-依赖性琥珀酸半醛脱氢酶；(7)4-羟基丁酸脱氢酶；(8)α-酮戊二酸脱羧酶；(9)4-羟基丁酰CoA：乙酰-CoA转移酶；(10)丁酸激酶；(11)磷酸转丁酰酶；(12)醛脱氢酶；(13)醇脱氢酶。

图2是显示在大肠杆菌(E.coli)中高丝氨酸生物合成的示意图。

图3显示使用含有表达各种组合的4-HB途径基因质粒的大肠杆菌菌株在葡萄糖基本培养基中生产4-HB。(a)在培养液中的4-HB浓度；(b)在培养液中的琥珀酸浓度；(c)在600nm处测量的培养物OD。条形图组表示24小时、48小时和72小时(如果测量)时间点。沿X轴的编码表示使用的菌株/质粒组合。第一个标记指宿主菌株：1，MG1655lacIQ；2，MG1655ΔgabD lacIQ；3，MG1655ΔgabDΔaldA lacIQ。第二个标记指使用的质粒组合：1，pZE13-0004-0035和pZA33-0036；2，pZE13-0004-0035和pZA33-0010n；3，pZE13-0004-0008和pZA33-0036；4，pZE13-0004-0008和pZA33-0010n；5，对照载体pZE13和pZA33。

图4显示在表达来自结核分支杆菌(Mycobacterium tuberculosis)的α-酮戊二酸脱羧酶的大肠杆菌菌株中从葡萄糖生产4-HB。菌株1-3包含pZE13-0032和pZA33-0036。菌株4仅表达空载体pZE13和pZA33。宿主菌株如下：1和4，MG1655lacIQ；2，MG1655ΔgabD lacIQ；3，MG1655ΔgabDΔaldA lacIQ。条形图指在24和48小时时的浓度。

图5显示在重组大肠杆菌菌株中从10mM4-HB生产BDO。编号的位置与实验对应，其中MG1655lacIQ包含pZA33-0024，表达来自牙龈卟啉单胞菌(P.gingivalis)的cat2，以及下列基因在pZE13上表达：1，没有(对照)；2，0002；3，0003；4，0003n；5，0011；6，0013；7，0023；8，0025；9，0008n；10，0035。基因编号在表6中定义。对于每个位置，条形图分别指需氧条件、微需氧条件和厌氧条件。微需氧条件通过密封培养管但不排空它们来建立。

图6显示由MG1655lacIQ pZE13-0004-0035-0002pZA33-0034-0036产生的4-HB和BDO的质谱，MG1655lacIQ pZE13-0004-0035-0002 pZA33-0034-0036生长在补充有4g/L未标记的葡萄糖(a、c、e和g)、均匀标记的13C-葡萄糖(b、d、f和h)的M9基本培养基中。(a)和(b)，衍生BDO的质量116特征碎片，包含2个碳原子；(c)和(d)，衍生BDO的质量177特征碎片，包含1个碳原子；(e)和(f)，衍生4-HB的质量117特征碎片，包含2个碳原子；(g)和(h)，衍生4-HB的质量233特征碎片，包含4个碳原子。

图7是生产γ-丁内酯的生物过程的示意性工艺流程图。图(a)图解了伴随分批分离的补料分批发酵，图(b)图解了伴随连续分离的补料分批发酵。

图8A和8B显示示例性的1,4-丁二醇(BDO)途径。图8A显示来自琥珀酰-CoA的BDO途径。图8B显示来自α-酮戊二酸的BDO途径。

图9A-9C显示示例性的BDO途径。图9A和9B显示来自4-氨基丁酸的途径。图9C显示来自乙酰-CoA至4-氨基丁酸的途径。

图10显示示例性的来自α-酮戊二酸的BDO途径。

图11显示示例性的来自谷氨酸的BDO途径。

图12显示示例性的来自乙酰-CoA的BDO途径。

图13显示示例性的来自高丝氨酸的BDO途径。

图14显示大肠杆菌琥珀酰-CoA合成酶的核苷酸和氨基酸序列。图14A显示大肠杆菌sucCD操纵子的核苷酸序列(SEQ ID NO：)。图14B(SEQ ID NO：)和14C(SEQ ID NO：)显示由sucCD操纵子编码的珀酰-CoA合成酶亚单位的氨基酸序列。

图15显示牛分枝杆菌α-酮戊二酸脱羧酶的核苷酸和氨基酸序列。图15A显示牛分枝杆菌sucA基因的核苷酸序列(SEQ ID NO：)。图15B显示牛分支杆菌α-酮戊二酸脱羧酶的氨基酸序列(SEQ ID NO：)。

图16显示大肠杆菌中厌氧(微需氧)条件下4-羟基丁酸从基本培养基中的葡萄糖经过α-酮戊二酸的生物合成。所述宿主菌株是ECKh-401。所述实验以质粒pZA33上存在的如下上游途径基因为基础进行标记：1)4hbd-sucA；2)sucCD-sucD-4hbd；3)sucCD-sucD-4hbd-sucA。

图17显示大肠杆菌中4-羟基丁酸从基本培养基中的葡萄糖经过琥珀酸和α-酮戊二酸的生物合成。所述宿主菌株是野生型MG1655。所述实验以质粒pZE13和pZA33上存在的如下基因为基础进行标记：1)空对照质粒；2)空pZE13、pZA33-4hbd；3)pZE13-sucA、pZA33-4hbd。

图18A显示来自牙龈卟啉单胞菌的oA-依赖性琥珀酸半醛脱氢酶(sucD)的核苷酸序列(SEQ ID NO：)，图18B显示编码的氨基酸序列(SEQ ID NO：)。

图19A显示来自牙龈卟啉单胞菌的4-羟基丁酸脱氢酶(4hbd)的核苷酸序列(SEQID NO：)，图19B显示编码的氨基酸序列(SEQ ID NO：)。

图20A显示来自牙龈卟啉单胞菌的4-羟基丁酸CoA移转酶(cat2)的核苷酸序列(SEQ ID NO：)，图20B显示编码的氨基酸序列(SEQ ID NO：)。

图21A显示来自丙酮丁醇梭菌的磷酸转丁酰酶(iptb)的核苷酸序列(SEQ IDNO：)，图21B显示编码的氨基酸序列(SEQ ID NO：)。

图22A显示来自丙酮丁醇梭菌的丁酸激酶(bukl)的核苷酸序列(SEQ ID NO：)，图22B显示编码的氨基酸序列(SEQ ID NO：)。

图23显示为了相对于丙酮丁醇梭菌的天然序列具有更多优势大肠杆菌密码子而具有改变的密码子的丙酮丁醇梭菌020(磷酸转丁酰酶)替代核苷酸序列。图23A-23D(分别为020A-020D，SEQ ID NOS：)包含具有大量稀有大肠杆菌密码子由更多优势密码子(A<B<C<D)替代的序列。

图24显示为了相对于丙酮丁醇梭菌的天然序列具有更多优势大肠杆菌密码子而具有改变的密码子的丙酮丁醇梭菌021(丁酸激酶)替代核苷酸序列。图24A-24D(分别为021A-021B，SEQ ID NOS：)包含具有大量稀有大肠杆菌密码子由更多优势密码子(A<B<C<D)替代的序列。

图25显示具有用于大肠杆菌中表达的优化密码子的丁酸激酶(BK)和磷酸转丁酰酶(PTB)的提高表达。图25A显示蛋白质用考马斯蓝染色的十二烷基磺酸钠聚丙烯酰胺凝胶电泳(SDS-PAGE)；泳道1，无插入物的对照质粒；泳道2，大肠杆菌中丙酮丁醇梭菌天然序列的表达；泳道3，020B-021B密码子优化的PTB-BK的表达；泳道4，020C-021C密码子优化的PTB-BK的表达。显示BK和PTB的位置。图25B显示相比于密码子优化的020B-021B(2021B)和020C-021C(2021C)，天然丙酮丁醇梭菌序列(2021n)的BK和PTB活性。

图26显示表达BDO产生酶：Cat2(034)；2021n；2021B；2021C的不同菌株中BDO和γ-丁内酯(GBL)和生产。

图27A显示天然拜氏梭菌Ald基因(025n)的核苷酸序列(SEQ ID NO：)，图27B显示编码的氨基酸序列(SEQ ID NO：)。

图28A-28D显示拜氏梭菌Ald基因(分别为025A-025D，SEQ ID NOS：)的替代基因序列，其中增加的稀有密码子量由更多的优势密码子替代(A<B<C<D)。

图29显示天然的拜氏梭菌Ald基因和密码子优化的变体的表达；无插入物(对照无插入物)、025n、025A、025B、025C、025D。

图30显示不同的菌株中BDO或BDO和乙醇的产生。图30显示包含天然拜氏梭菌Ald基因(025n)或具有用于大肠杆菌中表达的优化密码子的变体(025A-025D)的菌株中BDO的产生。图30B显示相比密码子优化的变体025B，表达丙酮丁醇梭菌AdhE2酶(002C)的菌株中乙醇和BDO的产生。第三组显示牙龈卟啉单胞菌sucD(035)的表达。所有情况下均表达牙龈卟啉单胞菌Cat2(034)。

图31A显示来自热葡糖苷酶地芽孢杆菌(Geobacillus thermoglucosidasius)的adhl基因核苷酸序列SEQ ID NO：)，图31B显示编码的氨基酸序列(SEQ ID NO：)。

图32A显示大肠杆菌中热葡糖苷酶地芽孢杆菌adhl基因的表达。通过SDS-PAGE且考马斯蓝染色分析无插入物的质粒、具有083插入物(头状地霉N-苄基-3-吡咯烷醇脱氢酶)的质粒和具有084插入物(热葡糖苷酶地芽孢杆菌adhl)的质粒的全部细胞溶解产物或上清液。图32B显示丁醛(菱形)或4-羟基丁醛(正方形)作为底物的084的活性。

图33显示各种菌株中BDO的生产：无插入物的质粒；025B，025B-026n；025B-026A；025B-026B；025B-026C；025B-050；025B-052；025B-053；025B-055；025B-057；025B-058；025B-071；025B-083；025B-084；PTSlacO-025B；PTSlacO-025B-026n。

图34显示载体pREl 19-V2的质粒图。

图35显示包含aceF和lpdA基因的ECKh-138区域的序列。肺炎克雷伯菌lpdA基因为下划线的，Glu354Lys突变体中改变的密码子为阴影的。

图36显示天然大肠杆菌lpdA和突变体肺炎克雷伯菌lpdA的蛋白质序列对比。

图37显示菌株AB3，MG1655AldhA和ECKh-138中4-羟基丁酸(左条形图)和BDO(右条形图)的产生。所有菌株表达中拷贝质粒pZA33上的大肠杆菌sucCD，牙龈卟啉单胞菌sucD，牙龈卟啉单胞菌4hbd，以及高拷贝质粒pZE13上的牙龈卟啉单胞菌Cat2，丙酮丁醇梭菌AdhE2。

图38显示融合至pflB-p6启动子和核糖体结合位点(RBS)的aceE基因5’末端的核苷酸序列。5’斜体序列显示aroP基因的起始点，其与pdh操纵子相反的方向转录。3’斜体序列显示aceE基因的起始点。大写体：pflB RBS。下划线：FNR结合位点。粗体：pflB-p6启动子序列。

图39显示菌株ECKh-456中aceF-lpdA区域的核苷酸序列(SEQ ID NO：)。

图40显示各个菌株ECKh-439，ECKh-455和ECKh-456 4-羟基丁酸，BDO和内酮酸盐的产生(分别为从左至右的条形图)。

图41A显示用于缺失mdh基因的重组位点的图解。图41B显示来自质粒pKD3的FRT位点和mdh基因同源区侧翼的抗氯霉素基因(CAT)PCR扩增产物的序列。

图42显示菌株ECKh-401中arc A缺失区域的序列。

图43显示包含菌株ECKh-422突变gltA基因的区域的序列。

图44显示野生型gltA基因产物和R163L突变体的柠檬酸合成酶活性。在无(菱形)或存在0.4mMNADH(正方形)时进行测定。

图45显示菌株ECKh-401和ECKh-422中4-羟基丁酸(左条形图)和BDO(右条形图)的产生，两者均表达质粒上用于完成BDO途径的基因。

图46显示来自代谢标记实验的中心代谢量和相关的95％置信区间。数值为标准化至1mMol/h葡萄糖摄入率的摩尔量。结果表明碳量通过柠檬酸合成酶进入氧化方向并且大部分碳进入BDO途径而不是完成三羧酸循环。

图47显示菌株ECKh-138和ECKh-422的胞外产物形成，两者均表达质粒上的完整BDO途径。所测定的产物为乙酸盐(Ace)，内酮酸盐(Pyr)，4-羟基丁酸(4HB)，1,4-丁二醇(BDO)，乙醇(EtOH)和其他产物，其包括γ-丁内酯(GBL)，琥珀酸和乳酸盐。

图48显示通过流感嗜血杆菌磷酸烯醇丙酮酸羧激酶(pepck)替换PEP羧化酶(ppc)后区域的序列。pepck编码区为下划线的。

图49显示在含有50mMNaHCO3的基本培养基中培养的发展pepCK菌株的生长。

图50显示表达质粒pZS*13上的牙龈卟啉单胞菌Cat2和拜氏梭菌Ald的菌株ECKh-453中产物的形成。所测定的产物为1,4-丁二醇(BDO)，内酮酸盐，4-羟基丁酸(4HB)，乙酸盐，γ-丁内酯(GBL)和乙醇。

图51显示两种菌株ECKh-453和ECKh-432的BDO生产。两者均包含表达牙龈卟啉单胞菌Cat2和拜氏梭菌Ald的质粒pZS*13。如所显示的，培养物在用27或18号规格的针穿孔的容器中微需氧条件下培养。

图52显示在包含启动子，sucCD基因，sucD基因，4hbd基因和终止子序列的多顺反子DNA片断插入区域的菌株ECKh-426基因组DNA的核苷酸序列。

图53显示在包含启动子，sucA基因，克氏梭菌4hbd基因和终止子序列的多顺反子序列插入区域的菌株ECKh-432染色体区域的核苷酸序列。

图54显示具有整合入染色体的上游BDO途径编码基因并且包含含有下游BDO途径基因的ECKh-432菌株在基本培养基中从葡萄糖合成BDO。

图55显示包含与rrnC区域同源的区域侧翼的非-磷酸转移酶(非-PTS)蔗糖利用基因的PCR产物。

图56显示rrnC操纵子中整合位点的示意图。

图57显示菌株ECKh-432在葡萄糖上培养以及菌株ECKh-463在蔗糖上培养生长48小时后，标准化至培养物OD600的平均产物浓缩。两者均含有表达牙龈卟啉单胞菌Cat2和拜氏梭菌Ald的质粒pZS*13。所述数据为每种菌株的6次重复培养物。所测定的产物为1,4-丁二醇(BDO)，4-羟基丁酸(4HB)，γ-丁内酯(GBL)，内酮酸盐(PYR)和乙酸盐(ACE)(分别为从左至右的条形图)。

发明详述

本发明涉及设计和生产具有4-羟基丁酸(4-HB)、γ-丁内酯和1,4-丁二醇生物合成生产能力的细胞和生物体。本发明尤其涉及通过导入编码BDO途径酶的一种或多种核酸能够生产BDO的微生物体的设计。

在一个实施方式中，本发明利用大肠杆菌新陈代谢的计算机化学计算模型，该模型鉴定生物合成生产4-羟基丁酸(4-HB)和1,4-丁二醇(BDO)的代谢设计。本文所述的结果表明，在大肠杆菌和其它细胞或生物体中可以设计和重组改造代谢途径，以实现4-HB和下游产物诸如1,4-丁二醇的生物合成。4-HB的生物合成生产，例如，对于计算机设计，可以通过构建具有已设计的代谢基因型的菌株确认。这些代谢改造的细胞或生物体也可以经历适应进化以进一步增加4-HB生物合成，包括在一些条件下接近理论最大生长。

在某些实施方式中，设计菌株的4-HB生物合成特征使得它们是遗传稳定的并且在连续的生物过程中特别有用。单独菌株设计策略通过如下鉴定：将不同的非自然的或异源的反应能力掺入大肠杆菌中，以导致从CoA-非依赖性琥珀酸半醛脱氢酶、琥珀酰-CoA合成酶和CoA-依赖性琥珀酸半醛脱氢酶或谷氨酸：琥珀酸半醛转氨酶产生4-HB和1,4-丁二醇的代谢途径。鉴定计算机代谢设计，其在大肠杆菌和酵母种中从这些代谢途径的每一种导致4-HB的生物合成。1,4-丁二醇中间体γ-丁内酯可在pH＜7.5的条件下通过自发环化在培养物中产生，特别是在酸性条件下，诸如pH 5.5以下，例如，pH＜7、pH＜6.5、pH＜6以及特别是pH＜5.5或更低。

经由平台的计算组分鉴定的菌株可通过基因改造任意预测的代谢变化而被投入实际生产中，该代谢变化导致4-HB、1,4-丁二醇或其它中间体和/或下游产物的生物合成生产。在另一进一步的实施方式中，显示出这些化合物的生物合成生产的菌株可进一步经受适应进化，以进一步增加产物的生物合成。适应进化后产物生物合成产率的水平也可以通过系统的计算组分预测。

在其它具体实施方式中，微生物体被构建以表达4-HB生物合成途径，该途径编码从琥珀酸至4-HB以及至4-HB-CoA的酶促步骤。琥珀酸辅酶A转移酶、CoA-依赖性琥珀酸半醛脱氢酶、NAD-依赖性4-羟基丁酸脱氢酶和4-羟基丁酸辅酶A转移酶在宿主微生物体中的共表达，与缺乏4-HB生物合成途径的宿主微生物体相比，导致显著的4-HB产生。在进一步的具体实施方式中，产生4-HB的微生物体被生产，通过引入编码α-酮戊二酸脱羧酶和NAD-依赖性4-羟基丁酸脱氢酶的核酸，该微生物体利用α-酮戊二酸作为底物。

在另一具体实施方式中，包含1,4-丁二醇(BDO)生物合成途径的微生物体被构建，当该微生物体在4-HB存在的情况下培养时其生物合成BDO。BDO生物合成途径由编码多功能醛/醇脱氢酶的核酸或编码醛脱氢酶(dehydrogenawse)和醇脱氢酶的核酸组成。为了维持在4-HB底物上生长，这些产生BDO的微生物体也表达4-羟基丁酸CoA转移酶或4-丁酸激酶以及磷酸转羟基丁酰酶。在另一进一步的具体实施方式中，微生物体被生产，其通过编码功能性4-HB生物合成途径和功能性BDO生物合成途径的核酸的外源表达来合成BDO。4-HB生物合成途径由琥珀酸辅酶A转移酶、CoA-依赖性琥珀酸半醛脱氢酶、NAD-依赖性4-羟基丁酸脱氢酶和4-羟基丁酸辅酶A转移酶组成。BDO途径由多功能的醛/醇脱氢酶组成。此处进一步的描述为生产BDO的另外的途径(参见图8-13)。

如本文所用，术语“非自然存在的”，当用于指本发明的微生物体或微生物时，意欲指该微生物体具有至少一个在所述物种的自然存在的菌株中通常未发现的遗传变化，包括所述物种的野生型菌株。遗传变化包括，例如，引入编码代谢多肽的可表达核酸的修饰、其它核酸加成、核酸缺失和/或微生物遗传物质的其它功能破坏。这些修饰包括，例如，所述物种的异源多肽、同源多肽或异源和同源多肽的编码区和其功能片段。另外的修饰包括，例如，非编码调控区，其中修饰改变基因或操纵子的表达。

示例性的代谢多肽包括在4-HB生物合成途径中的酶和在BDO化合物家族的生物合成途径中的酶。

代谢修饰是指从其自然存在的状态被改变的生物化学反应。因此，非自然存在的微生物具有对编码代谢多肽或其功能片段的核酸的遗传修饰。针对大肠杆菌和酵母菌微生物体，示例性的代谢修饰将在下面进一步描述。

如本文所用，术语“分离的”，当用于指微生物体时，意欲指基本上不含至少一种当所述微生物体在自然界中发现时的组分的生物体。该术语包括从在其自然环境中被发现时的一些或全部组分中移出的微生物体。该术语还包括从微生物体在其非自然存在环境中被发现时的一些或全部组分中移出的微生物体。因此，分离的微生物体部分或完全与其在自然界中发现时或其在非自然存在的环境中生长、保藏、生存时的其它物质分离。分离的微生物体的具体实例包括部分纯的微生物、基本上纯的微生物和在非自然存在的培养基中培养的微生物。

如本文所用，术语“微生物的(microbial)”、“微生物体(microbial organism)”或“微生物(microorganism)”意欲指是作为微观细胞存在的任意生物，其包括在古细菌、细菌或真核生物的范围内。因此，该术语意欲包括原核或真核细胞或具有微观大小的生物以及包括所有物种的细菌、古细菌和真细菌以及真核微生物诸如酵母和真菌。该术语还包括任意物种的细胞培养物，所述物种可培养用于生产生物化学物质。

如本文所用，术语“4-羟基丁酸”意欲指是丁酸的4-羟基衍生物，其具有化学式C₄H₈O₃和104.11g/mol(其钠盐为126.09g/mol)的分子量。化合物4-羟基丁酸(4-hydroxybutanoic acid)在本领域中也被称为4-HB、4-羟基丁酸(4-hydroxybutyrate)、γ-羟基丁酸或GHB。本文使用的术语拟包括该化合物的各种盐形式的任一个并且包括，例如，4-羟基丁酸盐(4-hydroxybutanoate)和4-羟基丁酸酯(4-hydroxybutyrate)。4-HB盐形式的具体实例包括4-HB钠和4-HB钾。因此，术语4-羟基丁酸、4-HB、4-羟基丁酸盐、4-羟基丁酸酯、γ-羟基丁酸和GHB以及其它的本领域公认的名称在本文中同义使用。

如本文所用，术语“单体的”，当用于指4-HB时，意欲指是非聚合或非衍生形式的4-HB。聚合4-HB的具体实例包括聚-4-羟基丁酸和例如4-HB和3-HB的共聚物。4-HB的衍生形式的具体实例是4-HB-CoA。其它聚合4-HB形式和其它4-HB衍生形式在本领域也是已知的。

如本文所用，术语“γ-丁内酯”意欲指是具有化学式C4H6O2和分子量为86.089g/mol的内酯。化合物γ-丁内酯在本领域也被称为GBL、丁内酯、1，4-内酯、4-丁内酯、4-羟基丁酸内酯和γ-羟基丁酸内酯。本文使用的术语拟包括该化合物的各种盐形式的任一种。

如本文所用，术语“1,4-丁二醇”意欲指是链烷丁烷的醇衍生物，其带有两个羟基，具有化学式C4H10O2和90.12g/mol的分子量。化合物1,4-丁二醇在本领域也称为BDO并且是本文中被称为BDO化合物家族的化合物家族的化学中间体或前体。

如本文所用，术语“四氢呋喃”意欲指与芳香化合物呋喃的完全氢化类似物对应的杂环有机化合物，其具有化学式C4H8O和72.11g/mol的分子量。化合物四氢呋喃在本领域也被称为THF、四氢呋喃、1，4-环氧丁烷、环氧丁烷、环四氢呋喃(cyclotetramethyleneoxide)、噁环戊烷、二亚乙基氧、四氢呋喃(oxolane)、呋喃烷、氢化呋喃、四亚甲基氧(tetramethylene oxide)。本文使用的术语拟包括该化合物的各种盐形式的任一种。

如本文所用，术语“CoA”或“辅酶A”意欲指有机辅助因子或辅基(酶的非蛋白质部分)，其存在是许多酶(脱辅基酶蛋白)的活性所必需的，以形成活性酶系统。辅酶A在某些缩合酶中起作用，在乙酰基或其它酰基转移以及在脂肪酸合成和氧化、丙酮酸氧化以及在其它乙酰化中产生影响。

如本文所用，术语“基本上厌氧的”，当用于指培养物或生长条件时，意欲指对于在液体培养基中的溶解氧而言氧的量小于饱和状态的约10％。该术语还拟包括液体或固体培养基的密封室被保持在小于约1％氧的空气下。

本发明的非自然存在的微生物可包含稳定的遗传变化，其指可被培养成五代以上而不失去所述变化的微生物。一般而言，稳定的遗传变化包括持续10代以上的修饰，特别稳定的修饰将持续约25代以上，以及更特别稳定的遗传修饰将是50代以上，包括无限地。

本领域的技术人员应当理解，包括本文示例的代谢修饰在内的遗传变化是参考大肠杆菌和酵母基因以及它们相应的代谢反应进行描述的。然而，假定许多生物的基因组测序完整以及基因组学领域的技能水平高，本领域的技术人员可容易地将本文提供的教导和指导应用于基本上所有的其它生物。例如，本文示例的大肠杆菌代谢变化可通过掺入来自除所述物种之外的物种的相同或相似的编码核酸而容易地应用于其它物种。这些遗传变化一般而言包括例如物种同源物的遗传变化，以及具体而言，直向同源物、种内同源物或非直向同源基因置换。

直向同源物通过垂直传递(vertical descent)相关并且在不同生物中负责基本上相同或同一功能的一个基因或多个基因。例如，小鼠环氧化物水解酶和人环氧化物水解酶对于环氧化物的水解生物学功能而言可被认为是直向同源物。例如，当基因共享数量足以表明它们是同源的序列相似性时，所述基因通过垂直传递相关，或基因通过从共同的祖先进化而相关。如果基因共享三维结构，但不一定共享足以表明它们从共同的祖先进化而来的量--其程度为一级序列相似性不可鉴定--的序列相似性，则所述基因也可以被认为直向同源物。为直向同源的基因可以编码具有约25％序列相似性至100％氨基酸序列同源性的蛋白质。编码共享小于25％的氨基酸相似性的蛋白质的基因，如果它们的三维结构也显示相似性，也可以被认为通过垂直传递产生。酶的丝氨酸蛋白酶家族成员--包括组织纤溶酶原激活物和弹性蛋白酶，被认为从共同的祖先通过垂直传递产生。

直向同源物包括基因或它们编码的基因产物，其通过例如进化在结构或总体活性方面已经偏离。例如，在一种物种编码显示两种功能的基因产物并且这些功能在第二种物种中已经被分成不同的基因的情况下，三个基因和它们的相应的产物被认为是直向同源物。对于生物化学产物的生长相关的生产(growth-coupled production)，本领域的技术人员应当理解，包埋待被破坏的代谢活性的直向同源基因要进行选择用以构建非自然存在的微生物。显示可分离活性的直向同源物的实例是其中不同的活性已经在两种或更多种物种之间或在单一物种内被分成不同的基因产物的情况。具体实例是将弹性蛋白酶蛋白酶解和纤维蛋白溶酶原蛋白酶解--两种类型的丝氨酸蛋白酶活性--作为纤溶酶原激活物和弹性蛋白酶分成不同的分子。第二个实例是支原体5’-3’外切核酸酶和果蝇DNA聚合酶III活性的分离。来自第一物种的DNA聚合酶可以被认为是来自第二物种的外切核酸酶或聚合酶中任一种或两者的直向同源物，反之亦然。

相反，种内同源基因是通过例如进化趋异所伴随的复制相关的同源物，并且其具有类似或共同的但不是同样的功能。种内同源基因可以起源或源自例如相同的物种或不同的物种。例如，微粒体环氧化物水解酶(环氧化物水解酶I)和可溶性环氧化物水解酶(环氧化物水解酶II)可以被认为是种内同源基因，这是因为它们代表两种不同的酶--其从共同的祖先共同进化而来，所述酶催化不同的反应并且在相同的物种中具有不同的功能。种内同源基因是来自相同物种的、彼此具有明显的序列相似性的蛋白质，这表明它们是同源的或通过从共同的祖先共同进化而相关。种内同源蛋白质家族群包括Hip A同源物、荧光素酶基因、肽酶以及其它。非直向同源基因置换是来自一种物种的非直向同源基因，其可以取代不同物种中的相关基因功能。取代包括，例如，与不同物种的相关功能相比，能够在起源的物种中完成基本上相同或类似的功能。尽管一般而言，非直向同源基因置换可以鉴定为结构上与编码相关功能的已知基因有关，但是结构上较不相关但功能上类似的基因和它们相应的基因产物，仍将落入本文所使用的术语的含义中。功能相似性要求，例如，与编码要求取代的功能的基因相比，在非直向同源基因的活性部位或结合区域上至少有一些结构相似性。因此，非直向同源基因包括例如种内同源基因(paralog)或不相关的基因。

因此，在鉴定和构建具有4-HB、GBL和/或BDO生物合成能力的本发明的非自然存在的微生物体中，本领域技术人员应当理解，通过将本文提供的教导和指导应用到具体的物种，代谢修饰的鉴定可以包括直向同源物的鉴定以及引入或失活。就种内同源基因和/或非直向同源基因置换存在于编码催化相似或基本上相似的代谢反应的酶的相关微生物中的程度，本领域的技术人员还可以利用这些进化相关的基因。

直向同源物、种内同源基因和非直向同源基因置换可以通过本领域的技术人员熟知的方法确定。例如，检查两种多肽的核酸或氨基酸序列将揭示在所比较的序列之间的序列同源性和相似性。基于这些相似性，本领域技术人员可以确定相似性是否足够高，以表明蛋白质通过从共同的祖先进化而相关。本领域的技术人员熟知的算法，诸如Align、BLAST、Clustal W以及其它算法，比较和测定未处理的序列相似性或同源性，并且还测定序列中空位(gap)的存在和显著性，所述空位可以被标记重量或分数。这些算法在本领域也是已知的并且可类似地应用于确定核苷酸序列相似性或同源性。确定相关性的足够相似性的参数基于熟知的方法计算，所述方法用于计算统计学的相似性或在随机多肽中发现相似匹配的机会和所确定的匹配的显著性。如果期望，两个或更多个序列的计算机比较也可以由本领域技术人员进行视觉优化。相关的基因产物或蛋白质可以期望具有高度相似性，例如，25％至100％序列同源性。如果细察足够大小的数据库(约5％)，不相关的蛋自质可以具有一定同源性，所述同源性与期望偶然出现的基本相同。在5％和24％之间的序列可以或不可以代表足够的同源性，以推断所比较的序列是相关的。根据数据集的大小，可以实施确定这些匹配的显著性的另外的统计学分析，以确定这些序列的相关性。

使用BLAST算法确定两个或更多个序列的相关性的示例性参数例如可以是如下所示。简言之，氨基酸序列比对可以使用BLASTP2.0.8版(1999年1月5日)和如下参数完成：Matrix：0BLOSUM62；gap open：11；gap extension：1；x_dropoff：50；expect：10.0；wordsize：3；filter：on。核酸序列比对可以使用BLASTN 2.0.6版(1998年9月16日)和如下参数完成：Match：1；mismatch：-2；gap open：5；gap extension：2；x_dropoff：50；expect：10.0；wordsize：11；filter：off。本领域的技术人员了解对上述参数可以进行何种修改以增加或减少例如比较的严格性和测定两个或更多个序列的相关性。

本发明提供非自然存在的微生物生物催化剂，其包括具有4-羟基丁酸(4-HB)生物合成途径的微生物体，所述生物合成途径包含至少一种外源核酸，该外源核酸编码4-羟基丁酸脱氢酶、CoA-非依赖性琥珀酸半醛脱氢酶、琥珀酰-CoA合成酶、CoA-依赖性琥珀酸半醛脱氢酶、谷氨酸：琥珀酸半醛转氨酶、α-酮戊二酸脱羧酶或谷氨酸脱羧酶，其中外源核酸以足够产生单体4-羟基丁酸(4-HB)的量表达。4-羟基丁酸脱氢酶也称为4-羟基丁酸脱氢酶或4-HB脱氢酶。琥珀酰-CoA合成酶也称为琥珀酰-CoA合成酶或琥珀酰-CoA连接酶。

也提供非自然存在的微生物生物催化剂，其包括具有4-羟基丁酸(4-HB)生物合成途径的微生物体，所述途径具有至少一种外源核酸，该外源核酸编码4-羟基丁酸脱氢酶、琥珀酰-CoA合成酶、CoA-依赖性琥珀酸半醛脱氢酶或α-酮戊二酸脱羧酶，其中外源核酸以足够产生单体4-羟基丁酸(4-HB)的量表达。

本发明的非自然存在的微生物生物催化剂包括微生物体，其采用代谢反应的组合以生物合成生产本发明化合物。生物合成的化合物可以胞内产生和/或分泌到培养基中。由非自然存在的微生物产生的示例性化合物包括，例如，4-羟基丁酸、1,4-丁二醇和γ-丁内酯。

在一个实施方式中，非自然存在的微生物体被基因工程改造以产生4-HB。该化合物是一个进入1,4-丁二醇化合物家族的有用切入点。从琥珀酸、通过琥珀酰-CoA从琥珀酸或从α-酮戊二酸形成4-HB的生物化学反应在图1的步骤1-8中示出。

当然只要能实现起始成分转变为BDO产物，可以利用BDO途径酶的任何合适的组合。因此，可以理解的是可以利用本文公开的任何代谢途径，且本领域技术人员很清楚为了实现本文公开的所需途径如何选择合适的酶。

在另一实施方案中，本文公开了非天然存在的微生物体，包括具有1,4-丁二醇(BDO)途径的微生物体，该途径包括编码以足够量表达而生产BDO的BDO途径酶的至少一种外源核酸，所述BDO途径包括4-氨基丁酸CoA移转酶，4-氨基丁酰-CoA水解酶，4-氨基丁酸-CoA连接酶，4-氨基丁酰-CoA氧化还原酶(去氨基)，4氨基丁酰-CoA氨基转移酶或4-β-羟丁酰CoA消旋酶(参见实施例VII表17)。所述BDO途径可进一步包括4-羟基丁酰-CoA还原酶(醇形成)，4-羟基丁酰-CoA还原酶或1,4-丁二醇脱氢酶。

本领域技术人员知晓可利用本文公开的各种途径的组合。例如，在非天然发生的微生物体中，核酸可编码4-氨基丁酸CoA移转酶，4-氨基丁酰-CoA水解酶或4-氨基丁酸-CoA连接酶；4-氨基丁酰-CoA氧化还原酶(去氨基)或4-氨基丁酰-CoA氨基转移酶；以及4-β-羟丁酰CoA消旋酶。其他示例性的组合如下具体描述并且可在图8-13中找到。例如，BDO途径可进一步包括4-羟基丁酰-CoA还原酶(醇形成)，4-羟基丁酰-CoA还原酶或1,4-丁二醇脱氢酶。

本文另外公开的是非天然存在的微生物体，包括具有BDO途径的微生物体，该途径包括编码以足够量表达而生产BDO的BDO途径酶的至少一种外源核酸，所述BDO途径包括4-氨基丁酸CoA移转酶，4-氨基丁酰-CoA水解酶，4-氨基丁酸-CoA连接酶，4-氨基丁酰-CoA还原酶(醇形成)，4-氨基丁酰-CoA还原酶，4-氨基丁-l-醇脱氢酶，4-氨基丁-l-醇氧化还原酶(去氨基)或4-氨基丁-l-醇氨基转移酶(参见实施例VII和表18)，并且可进一步包括1,4-丁二醇脱氢酶。例如，外源核酸可编码4-氨基丁酸CoA移转酶，4-氨基丁酰-CoA水解酶或4-氨基丁酸-CoA连接酶；4-氨基丁酰-CoA还原酶(醇形成)；以及4-氨基丁-l-醇氧化还原酶(去氨基)或4-氨基丁-l-醇氨基转移酶。另外，外源核酸可编码4-氨基丁酸CoA移转酶，4-氨基丁酰-CoA水解酶或4-氨基丁酸-CoA连接酶；4-氨基丁酰-CoA还原酶；4-氨基丁-l-醇脱氢酶；以及4-氨基丁-l-醇氧化还原酶(去氨基)或4-氨基丁-l-醇氨基转移酶。

本文还公开非天然存在的微生物体，包括具有BDO途径的微生物体，该途径包括编码以足够量表达而生产BDO的BDO途径酶的至少一种外源核酸，所述BDO途径包括4-氨基丁酸激酶，4-氨基丁醛脱氢酶(磷酸化)，4-氨基丁-l-醇脱氢酶，4氨基丁-l-醇氧化还原酶(去氨基)，4-氨基丁-l-醇氨基转移酶，[(4-氨基丁醇基)氧]膦酸氧化还原酶(去氨基)，[(4-氨基丁醇基)氧]膦酸氨基转移酶，4-羟基丁酰-磷酸脱氢酶，或4-脱氢酶(磷酸化)(参见实施例VII和表19)。例如，外源核酸可编码4-氨基丁酸激酶；4-氨基丁酰-脱氢酶(磷酸化)；4-氨基丁-l-醇脱氢酶；以及4-氨基丁-l-醇氧化还原酶(去氨基)或4-氨基丁-l-醇氨基转移酶。或者，外源核酸可编码4-氨基丁酸激酶；[(4-氨基丁醇基)氧]膦酸氧化还原酶(去氨基)或[(4-氨基丁醇基)氧]膦酸氨基转移酶；4-羟基丁酰-磷酸脱氢酶；以及4-羟基丁醛脱氢酶(磷酸化)。

本文另外公开的是非天然存在的微生物体，包括具有BDO途径的微生物体，该途径包括编码以足够量表达而生产BDO的BDO途径酶的至少一种外源核酸，所述BDO途径包括α-酮戊二酸-激酶，2，5-二氧代戊酸半醛脱氢酶(磷酸化)，2，5-二氧代戊酸脱氢酶，α-酮戊二酸基-CoA还原酶(醇形成)，5-羟基-2-氧代戊酸脱羧酶或5-羟基-2-氧代戊酸脱氢酶(脱羧)(参见实施例VIII和表20)。所述BDO途径可进一步包括4-羟基丁酰-CoA还原酶(醇形成)，4-羟基丁酰-CoA还原酶或1,4-丁二醇脱氢酶。例如：，所述外源的核酸可编码α-酮戊二酸-激酶；2，5-二氧代戊酸半醛脱氢酶(磷酸化)；2，5-二氧代戊酸还原酶；以及5-羟基-2-氧代戊酸脱羧酶。或者，外源核酸可编码α-酮戊二酸-激酶；2，5-二氧代戊酸半醛脱氢酶(磷酸化)；2，5-二氧代戊酸还原酶；以及5-羟基-2-氧代戊酸脱氢酶(脱羧)。或者，所述外源核酸可编码α-酮戊二酸CoA移转酶，α-酮戊二酸基-CoA水解酶，或α-酮戊二酸基-CoA连接酶；α-酮戊二酸基-CoA还原酶，5-羟基-2-氧代戊酸脱氢酶；以及5-羟基-2-氧代戊酸脱羧酶。在另一实施方案中，所述外源核酸可编码α-酮戊二酸CoA移转酶，α-酮戊二酸基-CoA水解酶或α-酮戊二酸基-CoA连接酶；α-酮戊二酸基-CoA还原酶，5-羟基-2-氧代戊酸脱氢酶，以及5-羟基-2-氧代戊酸脱氢酶(脱羧)。或者，所述外源核酸可编码α-酮戊二酸CoA移转酶，α-酮戊二酸基-CoA水解酶或α-酮戊二酸基-CoA连接酶；α-酮戊二酸基-CoA还原酶(醇形成)；以及5-羟基-2-氧代戊酸脱羧酶。又一个实施方案中，所述外源核酸可编码α-酮戊二酸CoA移转酶，α-酮戊二酸基-CoA水解酶或α-酮戊二酸基-CoA连接酶；α-酮戊二酸基-CoA还原酶(醇形成)；以及5-羟基-2-氧代戊酸脱氢酶(脱羧)。

本文另外公开的是非天然存在的微生物体，包括具有BDO途径的微生物体，该途径包括编码以足够量表达而生产BDO的BDO途径酶的至少一种外源核酸，所述BDO途径包括谷氨酸CoA移转酶，谷氨酰基-CoA水解酶，谷氨酰基-CoA连接酶，谷氨酸5-激酶，谷氨酸-5-半醛脱氢酶(磷酸化)，谷氨酰基-CoA还原酶，谷氨酸-5-半醛还原酶，谷氨酰基-CoA还原酶(醇形成)，2-氨基-5-羟基戊酸氧化还原酶(去氨基)，2-氨基-5-羟基戊酸氨基转移酶，5-羟基-2氧代戊酸脱羧酶，5-羟基-2-氧代戊酸脱氢酶(脱羧)(参见实施例IX和表21)。例如，所述外源核酸可编码谷氨酸CoA移转酶，谷氨酰基-CoA水解酶或谷氨酰基-CoA连接酶；谷氨酰基-CoA还原酶；谷氨酸-5-半醛还原酶；2-氨基-5-羟基戊酸氧化还原酶(去氨基)或2-氨基-5-羟基戊酸氨基转移酶；和5-羟基-2-氧代戊酸脱羧酶或5-羟基-2-氧代戊酸脱氢酶(脱羧)。或者，所述外源核酸可编码谷氨酸5-激酶；谷氨酸-5-半醛脱氢酶(磷酸化)；谷氨酸-5-半醛还原酶；2-氨基-5-羟基戊酸氧化还原酶(去氨基)或2-氨基-5-羟基戊酸氨基转移酶；和5-羟基-2-氧代戊酸脱羧酶或5-羟基-2-氧代戊酸脱氢酶(脱羧)。另外的实施方案中，所述外源核酸可编码谷氨酸CoA移转酶，谷氨酰基-CoA水解酶或谷氨酰基-CoA连接酶；谷氨酰基-CoA还原酶(醇形成)；2-氨基-5-羟基戊酸氧化还原酶(去氨基)或2-氨基-5-羟基戊酸氨基转移酶；和5-羟基-2-氧代戊酸脱羧酶或5-羟基-2-氧代戊酸脱氢酶(脱羧)。另一实施方案中，所述外源核酸可编码谷氨酸5-激酶；谷氨酸-5-半醛脱氢酶(磷酸化)；2-氨基-5-羟基戊酸氧化还原酶(去氨基)或2-氨基-5-羟基戊酸氨基转移酶；和5-羟基-2-氧代戊酸脱羧酶或5-羟基-2-氧代戊酸脱氢酶(脱羧)。

本文还非天然存在的微生物体，包括具有BDO途径的微生物体，该途径包括编码以足够量表达而生产BDO的BDO途径酶的至少一种外源核酸，所述BDO途径包括3-羟丁酰CoA消旋酶，3-羟基丁酰-CoA脱水酶，乙烯基乙酰基-CoA A-异构酶或4-羟基丁酰-CoA脱水酶(参见实施例X和表22)。例如，外源核酸可编码3-羟丁酰-CoA消旋酶；3-羟基丁酰-CoA脱水酶；乙烯基乙酰基-CoA A-异构酶；以及4-羟基丁酰-CoA脱水酶。

本文另外公开的是非天然存在的微生物体，包括具有BDO途径的微生物体，该途径包括编码以足够量表达而生产BDO的BDO途径酶的至少一种外源核酸，所述BDO途径包括高丝氨酸脱氨酶，高丝氨酸CoA移转酶，高丝氨酸-CoA水解酶，高丝氨酸-CoA连接酶，高丝氨酸-CoA脱氨酶，4-羟基丁-2-烯酰基-CoA移转酶，4-羟基丁-2-烯酰基-CoA水解酶，4-羟基丁-2-烯酰基-CoA连接酶，4-羟基丁-2-烯酸酯还原酶，4-羟基丁酰-CoA移转酶，4-羟基丁酰-CoA水解酶，4-羟基丁酰-CoA连接酶或4-羟基丁-2-烯酰基-CoA还原酶(参见实施例XI和表23)。例如，所述外源核酸可编码高丝氨酸脱氨酶；4-羟基丁-2-烯酰基-CoA移转酶，4-羟基丁-2-烯酰基-CoA水解酶，4-羟基丁-2-烯酰基-CoA连接酶；4-羟基丁-2-烯酰基-CoA还原酶。或者，所述外源核酸可编码高丝氨酸CoA移转酶，高丝氨酸-CoA水解酶，或高丝氨酸-CoA连接酶；高丝氨酸-CoA脱氨酶；以及4-羟基丁-2-烯酰基-CoA还原酶。另外的实施方案中，所述外源核酸可编码高丝氨酸脱氨酶；4-羟基丁-2-烯酸酯还原酶；以及4-羟基丁酰-CoA移转酶，4-羟基丁酰-CoA水解酶或4-羟基丁酰-CoA连接酶。或者，所述外源核酸可编码高丝氨酸CoA移转酶，高丝氨酸-CoA水解酶，或高丝氨酸-CoA连接酶；高丝氨酸-CoA脱氨酶；以及4-羟基丁-2-烯酰基-CoA还原酶。

本文另外公开非天然存在的微生物体，包括具有BDO途径的微生物体，该途径包括编码以足够量表达而生产BDO的BDO途径酶的至少一种外源核酸，所述BDO途径包括琥珀酰-CoA还原酶(醇形成)，4-羟基丁酰-CoA水解酶，4-羟基丁酰-CoA连接酶，4-羟基丁醛脱氢酶(磷酸化)(参见表15)。所述BDO途径可另外包括琥珀酰-CoA还原酶，4-羟基丁酸脱氢酶，4-羟基丁酰-CoA移转酶，4-羟基丁酸激酶，磷酸转-4-羟基丁酰酶，4-羟基丁酰-CoA还原酶，4-羟基丁酰-CoA还原酶(醇形成)或1,4-丁二醇脱氢酶。

本文另外公开了非天然存在的微生物体，包括具有BDO途径的微生物体，该途径包括编码以足够量表达而生产BDO的BDO途径酶的至少一种外源核酸，所述BDO途径包括谷氨酸脱氢酶，4-氨基丁酸氧化还原酶(去氨基)，4-氨基丁酸氨基转移酶，谷氨酸脱羧酶，4-羟基丁酰-CoA水解酶，4-羟基丁酰-CoA连接酶，4-羟基丁醛脱氢酶(磷酸化)(参见表16)。所述BDO途径可另外包括α-酮戊二酸脱羧酶，4-羟基丁酸脱氢酶，4-羟基丁酰-CoA移转酶，4-羟基丁酸激酶，磷酸转-4-羟基丁酰酶，4-羟基丁酰-CoA还原酶，4-羟基丁酰-CoA还原酶(醇形成)或1,4-丁二醇脱氢酶。

如上所述途径仅为示例性的。本领域技术人员可根据需要，很容易从本文公开的那些选择合适的途径以获得合适的BDO途径或其他代谢途径。

本发明提供遗传修饰的生物体，其允许通过增加产物或减少不需要的副产品而提高所需产物例如BDO的生产。如本文公开的，本发明提供非天然存在微生物体，包括具有1,4-丁二醇(BDO)途径的微生物体，该途径包含编码以足够量表达以生产BDO的BDO途径酶的至少一种外源核酸。在一实施方案中，所述微生物体经遗传修饰以表达外源琥珀酰-CoA合成酶(参见实施例XII)。例如，所述琥珀酰-CoA合成酶可通过大肠杆菌sucCD基因编码。

在另一实施方案中，所述微生物体经遗传修饰以表达外源α-酮戊二酸脱羧酶(参见实施例XIII)。例如，α-酮戊二酸脱羧酶可通过牛分枝杆菌sucA基因编码。还另外的实施方案中，所述微生物体经遗传修饰以表达外源琥珀酸半醛脱氢酶和4-羟基丁酸脱氢酶并且任选地表达4-羟基丁酰-CoA/乙酰-CoA移转酶(参见实施例XIII)。例如，所述琥珀酸半醛脱氢酶(CoA-依赖的)，4-羟基丁酸脱氢酶和4-羟基丁酰-CoA/乙酰-CoA移转酶可通过牙龈卟啉单胞菌W83基因编码。另外的实施方案中，所述微生物体经遗传修饰以表达外源丁酸激酶和磷酸转丁酰酶(参见实施例XIII)。例如，所述丁酸激酶和磷酸转丁酰酶可通过丙酮丁醇梭菌bukl和ptb基因编码。

另一实施方案中，所述微生物体经遗传修饰以表达外源4-羟基丁酰-CoA还原酶(参见实施例XIII)。例如，所述4-羟基丁酰-CoA还原酶可通过拜氏梭菌Ald基因编码。另外，本发明的实施方案中，所述微生物体经遗传修饰以表达外源4-羟基丁醛还原酶(参见实施例XIII)。例如，所述4-羟基丁醛还原酶可通过热葡糖苷酶地芽孢杆菌adhl基因编码。在另一实施方案中，所述微生物体经遗传修饰以表达外源丙酮酸脱氢酶亚基(参见实施例XIV)。例如，所述外源丙酮酸脱氢酶可以是NADH不敏感的。所述丙酮酸脱氢酶亚单位可以通过克雷伯氏肺炎杆菌IpdA基因编码。具体的实施方案中，所述微生物体的丙酮酸脱氢酶亚单位基因可受丙酮酸甲酸盐裂解酶启动子调控。

另外的实施方案中，所述微生物体经遗传修饰以破坏编码需氧呼吸控制调节系统的基因(参见实施例XV)。例如，可以破坏arcA基因。所述生物体可进一步包含编码苹果酸脱氢酶的基因的破坏。另外的实施方案中，所述微生物体经遗传修饰以表达外源NADH不敏感的柠檬酸合成酶(参见实施例XV)。例如，所述NADH不敏感的柠檬酸合成酶可通过gltA，例如gltA的R163L突变体编码。在另一实施方案中，所述微生物体经遗传修饰以表达外源磷酸烯醇丙酮酸羧激酶(参见实施例XVI)。例如，所述磷酸烯醇丙酮酸羧激酶可通过流感嗜血杆菌磷酸烯醇丙酮酸羧激酶基因编码。

可以理解的是如本文公开的任何数目的遗传修饰可单独使用或以一种或多种本文公开的所述遗传修饰的不同组合使用以提高产BDO的微生物体中BDO的生产。具体的实施方案中，所述微生物体可经遗传修饰以引入任何且至所有遗传修饰以提高BDO的生产。具体的实施方案中，包含BDO途径的微生物体可经遗传修饰以表达外源琥珀酰-CoA合成酶；表达外源α-酮戊二酸脱羧酶；表达外源琥珀酸半醛脱氢酶和4-羟基丁酸脱氢酶以及选择性地4-羟基丁酰-CoA/乙酰-CoA移转酶；表达外源丁酸激酶和磷酸转丁酰酶；表达外源4-羟基丁酰-CoA还原酶；并且表达外源4-羟基丁醛还原酶；表达外源丙酮酸脱氢酶；破坏编码需氧呼吸控制调节系统的基因；表达外源NADH不敏感的柠檬酸合成酶；以及表达外源磷酸烯醇丙酮酸羧激酶。用于提高生产的所述菌株在实施例XII-XIX中描述。因此可理解的是除了如上所述的修饰，所述菌株可另外包括本文公开的其他修饰。所述修饰包括，但不限于内源乳酸脱氢酶(IdhA)，醇脱氢酶(adhE)和/或丙酮酸甲酸盐裂解酶(pflB)的缺失(参见实施例XII-XIX和表28)。

另外提供一种微生物体，其中编码外源表达酶的一种或多种基因整合入宿主生物体的fimD基因座(参见实施例XVII)。例如，编码BDO途径酶的一种或多种基因可整合入用于提高BDO生产的fimD基因座。另外提供表达提高BDO生产的非-磷酸转移酶蔗糖摄取系统的微生物体。

虽然本文公开的遗传修饰的微生物体以含有特定BDO途径酶的微生物体举例说明，可以理解的是所述修饰可以整合入具有在所述遗传修饰存在时提高生产的BDO途径的任何微生物体。本发明的微生物体可因此具有本文公开的任何BDO途径。例如，所述BDO途径可包含4-羟基丁酸脱氢酶，琥珀酰-CoA合成酶，CoA-依赖的琥珀酸半醛脱氢酶，4-羟基丁酸：CoA移转酶，4-丁酸激酶，磷酸转丁酰酶，α-酮戊二酸脱羧酶，醛脱氢酶，醇脱氢酶或醛/醇脱氢酶(参见图1)。或者，所述BDO途径可包含4-氨基丁酸CoA移转酶，4-氨基丁酰-CoA水解酶，4-氨基丁酸-CoA连接酶，4-氨基丁酰-CoA氧化还原酶(去氨基)，4-氨基丁酰-CoA氨基转移酶或4-羟基丁酰-CoA脱氢酶(参见表17)。所述BDO途径可进一步包括4-羟基丁酰-CoA还原酶(醇形成)，4-羟基丁酰-CoA还原酶或1,4-丁二醇脱氢酶。

另外，所述BDO途径可包含4-氨基丁酸CoA移转酶，4-氨基丁酰-CoA水解酶，4-氨基丁酸-CoA连接酶；4-氨基丁酰-CoA还原酶(醇形成)，4-氨基丁酰-CoA还原酶，4-氨基丁-l-醇脱氢酶，4-氨基丁-l-醇氧化还原酶(去氨基)或4-氨基丁-l-醇氨基转移酶(参见表18)。此外，所述BDO途径可包含4-氨基丁酸激酶，4-氨基丁醛脱氢酶(磷酸化)，4-氨基丁-l-醇脱氢酶，4-氨基丁-l-醇氧化还原酶(去氨基)，4-氨基丁-l-醇氨基转移酶，[(4-氨基丁醇基)氧]膦酸氧化还原酶(去氨基)，[(4-氨基丁醇基)氧]膦酸氨基转移酶，4-羟基丁酰-磷酸脱氢酶或4-羟基丁醛脱氢酶(磷酸化)(参见表19)。所述途径可进一步包含1,4-丁二醇脱氢酶。

所述BDO途径还可以包含α-酮戊二酸5-激酶，2，5-二氧代戊酸半醛脱氢酶(磷酸化)，2，5-二氧代戊酸还原酶，α-酮戊二酸CoA移转酶，α-酮戊二酸基-CoA水解酶，α-酮戊二酸基-CoA连接酶，α-酮戊二酸基-CoA还原酶，5-羟基-2-氧代戊酸脱氢酶，α-酮戊二酸基-CoA还原酶(醇形成)，5-羟基-2-氧代戊酸脱羧酶，或5-羟基-2-氧代戊酸脱氢酶(脱羧)(参见表20)。所述BDO途径可进一步包括4-羟基丁酰-CoA还原酶(醇形成)，4-羟基丁酰-CoA还原酶或1,4-丁二醇脱氢酶。另外，所述BDO途径可包含谷氨酸CoA移转酶，谷氨酰基-CoA水解酶，谷氨酰基-CoA连接酶，谷氨酸5-激酶，谷氨酸-5-半醛脱氢酶(磷酸化)，谷氨酰基-CoA还原酶，谷氨酸-5-半醛还原酶，谷氨酰基-CoA还原酶(醇形成)，2-氨基-5-羟基戊酸氧化还原酶(去氨基)，2-氨基-5-羟基戊酸氨基转移酶，5-羟基-2氧代戊酸脱羧酶，5-羟基-2-氧代戊酸脱氢酶(脱羧)(参见表21)。所述BDO途径可进一步包括4-羟基丁酰-CoA还原酶(醇形成)，4-羟基丁酰-CoA还原酶或1,4-丁二醇脱氢酶。

另外，所述BDO途径可包含3-羟基丁酰-CoA脱氢酶，3羟基丁酰-CoA脱水酶，乙烯基乙酰基-CoA A-异构酶或4羟基丁酰-CoA脱水酶(参见表22)。此外，所述BDO途径可包括高丝氨酸脱氨酶，高丝氨酸CoA移转酶，高丝氨酸-CoA水解酶，高丝氨酸-CoA连接酶，高丝氨酸-CoA脱氨酶，4-羟基丁-2-烯酰基-CoA移转酶，4-羟基丁-2-烯酰基-CoA水解酶，4-羟基丁-2-烯酰基-CoA连接酶，4-羟基丁-2-烯酸酯还原酶，4-羟基丁酰-CoA移转酶，4-羟基丁酰-CoA水解酶，4-羟基丁酰-CoA连接酶或4-羟基丁-2-烯酰基-CoA还原酶(参见表23)。所述BDO途径可进一步包括4-羟基丁酰-CoA还原酶(醇形成)，4-羟基丁酰-CoA还原酶或1,4-丁二醇脱氢酶。

所述BDO途径可另外包括琥珀酰-CoA还原酶(醇形成)，4-羟基丁酰-CoA水解酶，4-羟基丁酰-CoA连接酶或4-羟基丁醛脱氢酶(磷酸化)(参见表15)。所述BDO途径可进一步包括琥珀酰-CoA还原酶，4-羟基丁酸脱氢酶，4-羟基丁酰-CoA移转酶，4-羟基丁酸激酶，磷酸转-4-羟基丁酰酶，4-羟基丁酰-CoA还原酶，4-羟基丁酰-CoA还原酶(醇形成)或1,4-丁二醇脱氢酶。此外，所述BDO途径可包括谷氨酸脱氢酶，4-氨基丁酸氧化还原酶(去氨基)，4-氨基丁酸氨基转移酶，谷氨酸脱羧酶，4-羟基丁酰-CoA水解酶，4-羟基丁酰-CoA连接酶或4-羟基丁醛脱氢酶(磷酸化)(参见表16)。所述BDO途径可进一步包括α-酮戊二酸脱羧酶，4-羟基丁酸脱氢酶，4-羟基丁酰-CoA移转酶，4-羟基丁酸激酶，磷酸转-4-羟基丁酰酶，4-羟基丁酰-CoA还原酶，4-羟基丁酰-CoA还原酶(醇形成)或1,4-丁二醇脱氢酶。

本文一般参考代谢反应、反应物或其产物，或具体参考一个或更多个核酸或基因对本发明进行描述，所述核酸或基因编码与所述代谢反应、反应物或产物相关或催化所述代谢反应、反应物或产物的酶。除非本文另外明确说明，本领域的技术人员应当理解，描述反应也等同于描述反应物和反应产物。类似地，除非本文另外明确说明，描述反应物或产物也涉及反应，以及描述任意的这些代谢成分也涉及编码催化所指代的反应、反应物或产物的酶的一个基因或多个基因。同样地，假定熟知的代谢生物化学、酶学和基因组学领域，本文对基因或编码核酸的讨论也等同于对对应的编码酶和其催化的反应以及该反应的反应物和产物的讨论。

使用本发明的微生物体通过生物合成方式生产4-HB是特别有用的，这是因为它能生产单体4-HB。本发明的非天然存在的微生物体和它们的4-HB和BDO家族化合物的生物合成也是特别有用的，这是因为4-HB产物：(1)被分泌；(2)可以没有任何衍生化诸如辅酶A；(3)避免生物合成期间的热力学改变；(4)允许直接生物合成BDO，以及(5)在酸性pH培养基中允许自发地将4-HB化学转化为γ-丁内酯(GBL)。后面的特性例如对于有效地化学合成或生物合成BDO家族化合物诸如1,4-丁二醇和/或四氢呋喃(THF)也是特别有用的。

微生物体一般缺乏合成4-HB的能力，因此，本文公开的任意化合物已知在1,4-丁二醇家族化合物内，或本领域技术人员已知是在1,4-丁二醇家族化合物内此外，已知具有所有必要的代谢酶能力的生物不从所述的酶和本文所示例的生物化学途径产生4-HB。更确切地，可能不包括下面进一步描述的少数厌氧微生物，具有酶能力的微生物使用4-HB作为底物以生产例如琥珀酸。相反，本发明的非自然存在的微生物体产生4-HB或BDO作为产物。如上所述，以其单体形式生物合成4-HB不仅在化学合成BDO家族化合物中特别有用，而且它还允许进一步生物合成BDO家族化合物并且完全避免化学合成步骤。

本发明的可以生产4-HB的非天然存在的微生物体通过确保宿主微生物体包括完全地生物化学合成至少一种本发明的4-HB生物合成途径的功能能力而产生。确保至少一种必要的4-HB或BDO生物合成途径将4-HB生物合成能力赋予宿主微生物体。

为了图1的说明，五种必要的4-HB生物合成途径在本文中被示例和显示。另外的4-HB和BDO途径在图8-13中描述。一种4-HB生物合成途径包括从琥珀酸生物合成4-HB(琥珀酸途径)。参与该4-HB途径的酶包括CoA-非依赖性琥珀酸半醛脱氢酶和4-羟基丁酸脱氢酶。在该途径中，CoA-非依赖性琥珀酸半醛脱氢酶催化与图1显示的箭头相反的反应。另一4-HB生物合成途径包括通过琥珀酰-CoA从琥珀酸进行生物合成(琥珀酰-CoA途径)。参与该4-HB途径的酶包括琥珀酰-CoA合成酶、CoA-依赖性琥珀酸半醛脱氢酶和4-羟基丁酸脱氢酶。三种其它4-HB生物合成途径包括从α-酮戊二酸生物合成4-HB(α-酮戊二酸途径)。因此，第三种4-HB生物合成途径是通过谷氨酸：琥珀酸半醛转氨酶、谷氨酸脱羧酶和4-羟基丁酸脱氢酶生物合成琥珀酸半醛。第四种4-HB生物合成途径还包括从α-酮戊二酸生物合成4-HB，但利用α-酮戊二酸脱羧酶催化琥珀酸半醛合成。4-羟基丁酸脱氢酶催化琥珀酸半醛向4-HB的转化。第五种4-HB生物合成途径包括通过琥珀酰-CoA从α-酮戊二酸进行的生物合成并且利用α-酮戊二酸脱氢酶产生琥珀酰-CoA，其进入上述的琥珀酰-CoA途径。这些4-HB生物合成途径的每一种、它们的底物、反应物和产物在下面的实施例中进一步描述。如本文所述，4-HB可进一步通过包含适于生产BDO的酶而生物合成转变成BDO(参见实施例)。因此，可以理解的是4-HB途径可与用于将4-HB转变为BDO以生成BDO途径的酶一起使用。

本发明的非自然存在的微生物体可以通过引入可表达的核酸产生，该核酸编码一种或更多种参与一种或多种4-HB或BDO生物合成途径的酶。根据选择用于生物合成的宿主微生物体，可以表达用于一些或所有特定的4-HB或BDO生物合成途径的核酸。例如，如果选择的宿主缺乏琥珀酸至4-HB途径中的一种或多种酶并且该途径被选择用于4-HB生物合成，则例如在该实施例中将CoA-非依赖性琥珀酸半醛脱氢酶和4-羟基丁酸脱氢酶的可表达核酸引入宿主中，用于随后的外源性表达。可选地，如果选择的宿主表现出一些途径酶的内源表达，但是缺乏其它的途径酶，则需要所述有缺陷的酶的编码核酸以实现4-HB或BDO生物合成。例如，如果所选的宿主表现出内源CoA-非依赖性琥珀酸半醛脱氢酶，但是缺乏4-羟基丁酸脱氢酶，则需要该酶的编码核酸以实现4-HB生物合成。因此，本发明非天然存在的微生物体可通过引入外源酶或蛋白质活性以获得所需的生物合成途径而产生或可通过将一种或多种外源酶或蛋白质活性与一种或多种内源酶或蛋白质一起引入获得所需的生物合成途径，生产所需的产物例如4-HB或BDO。

以同样的方式，在4-HB生物合成被选择通过琥珀酸至琥珀酰-CoA途径(琥珀酰-CoA途径)发生的情况中，对于缺乏下述酶的宿主：琥珀酰-CoA合成酶、CoA-依赖性琥珀酸半醛脱氢酶和/或4-羟基丁酸脱氢酶，编码核酸将在受体宿主中外源表达。

选择通过α-酮戊二酸至琥珀酸半醛途径(α-酮戊二酸途径)的4-HB生物合成，对于缺乏一种或更多种下述酶的宿主而言可以利用外源表达：谷氨酸：琥珀酸半醛转氨酶、谷氨酸脱羧酶和/或4-羟基丁酸脱氢酶或α-酮戊二酸脱羧酶和4-羟基丁酸脱氢酶。本领域技术人员可很容易确定用于生产4-HB或BDO的，如本文公开的途径酶。

根据已选择的宿主微生物体的4-HB或BDO生物合成途径的组成，本发明的非自然存在的微生物体包括至少一种外源表达的4-HB或BDO途径的编码核酸和针对一个或更多个4-HB或BDO生物合成途径的多达所有的编码核酸。例如，通过相应编码核酸的外源表达，在缺乏途径酶或蛋白质的宿主中，可以建立4-HB或BDO生物合成。在缺乏4-HB或BDO途径所有酶或蛋白质的宿主中，可包括所述途径中所有酶或蛋白质的外源表达，虽然可以理解即使所述宿主包含至少一种途径酶或蛋白质，也可以表达该途径的所有酶或蛋白质。例如，通过4-羟基丁酸脱氢酶编码核酸的外源表达，在缺乏4-羟基丁酸脱氢酶的宿主中，可以从所有五个途径建立4-HB生物合成。相反，通过所有八种下述酶的外源表达，在缺乏所有八种酶的宿主中，可以从所有五个途径建立4-HB生物合成：CoA-非依赖性琥珀酸半醛脱氢酶、琥珀酰-CoA合成酶、CoA-依赖性琥珀酸半醛脱氢酶、谷氨酸：琥珀酸半醛转氨酶、谷氨酸脱羧酶、α-酮戊二酸脱羧酶、α-酮戊二酸脱氢酶和4-羟基丁酸脱氢酶。

在本文提供的教导和指导下，本领域的技术人员将理解，以可表达方式引入的编码核酸的数量至少与已选择的宿主微生物体的4-HB或BDO途径缺乏相对应。因此，本发明的非天然存在的微生物体可以具有一个、二个、三个、四个、五个、六个、七个或八个核酸，其编码组成一个或多个4-HB或BDO生物合成途径的上述酶。在一些实施方式中，非天然存在的微生物体还可以包括其它遗传修饰，其促进或优化4-HB或BDO生物合成或对宿主微生物体赋予其它有用的功能。一种这样的其它功能可以包括，例如，增加一个或多个4-HB途径前体的合成，诸如琥珀酸、琥珀酰-CoA，α-酮戊二酸，4-氨基丁酸，谷氨酸，乙酰-CoA和/或高丝氨酸。

一般，选择宿主微生物体使得其生产4-HB或BDO途径的前体，或者作为提供所需前体从头产生或提高通过宿主微生物体自然产生的前体产量的自然产生分子或基因工程改造产物。例如宿主生物体例如大肠杆菌中自然产生琥珀酰-CoA，α-酮戊二酸，4-氨基丁酸，谷氨酸，乙酰-CoA和高丝氨酸。如本文公开的宿主生物体可经改造以提高前体产量。另外，已经改造生产所需前体的微生物体可用作宿主生物体并且进一步改造以表达4-HB或BDO途径的酶或蛋白质。

在某些实施方式中，本发明的非天然存在的微生物体从包含合成4-HB或BDO的酶能力的宿主产生。在该具体的实施方式中，增加4-HB或BDO途径产物的合成或累积可以是有用的，以便例如向着4-HB或BDO生产方向推动4-HB或BDO途径反应。增加的合成或累积可通过例如编码一种或更多种上述4-HB或BDO途径酶的核酸的过量表达完成。4-HB或BDO途径一种酶或多种酶的过量表达可以通过例如一个或多个内源基因的外源表达发生，或通过一个或多个异源基因的外源表达发生。因此，自然存在的生物通过一种，两种，三种，四种，五种，六种等直至所有编码4-HB或BDO生物合成途径酶的核酸的过量表达可以容易地产生而成为本发明的非自然的产生4-HB或BDO的微生物体。另外，非自然存在的生物可以通过内源基因的突变产生，所述突变引起4-HB或BDO生物合成途径中的酶活性增加。

在特别有用的实施方式中，采用编码核酸的外源表达。外源表达赋予宿主定制表达和/或调控元件的能力和实现由使用者控制的期望的表达水平的应用。然而，在其它实施方式中，也可以利用内源表达，诸如当连接到诱导型启动子或其它调控元件时，通过除去负调控效应物或诱导基因的启动子。因此，具有自然存在的诱导型启动子的内源基因通过提供适当的诱导剂可以增量调节，或内源基因的调控区可以进行基因工程以掺入诱导型调控元件，从而允许在期望的时间调控内源基因的增加的表达。类似地，对于引入非自然存在的微生物体中的外源基因，诱导型启动子可以作为调控元件被包括(参见实施例)。

本文所使用的“外源的”意欲指是相关分子或相关活性被引入宿主微生物体中。所述分子可例如通过诸如整合进入宿主染色体中或作为非染色体遗传物质诸如质粒而将编码核酸引入宿主遗传物质中。因此，当用于指编码核酸的表达时，该术语指将编码核酸以可表达的形式引入微生物体中。当用于指生物合成活性时，该术语指被引入至宿主相关生物中的活性。来源可以是例如同源的或异源的编码核酸，其引入至宿主微生物体后表达相关的活性。因此，术语“内源的”指在宿主中存在的相关分子或活性。类似地，当用于指编码核酸的表达时，该术语指在微生物体中含有的编码核酸的表达。术语“异源的”指源自相关物种之外的来源的分子或活性，而“同源的”指源自宿主微生物体的分子或活性。因此，本发明编码核酸的外源表达可以利用异源的或同源的编码核酸中的任一种或两者。

4-HB或BDO途径酶的编码核酸的来源可以包括，例如，其中编码的基因产物能够催化相关反应的任意物种。这些物种包括原核和真核生物，包括但不限于，细菌--包括古细菌和真细菌，以及真核细胞--包括酵母、植物、昆虫、动物和包括人在内的哺乳动物。这些来源的示例性物种包括，例如，大肠杆菌、酿酒酵母菌、克氏酵母、克氏梭状芽胞杆菌、丙酮丁醇梭菌、拜氏梭菌、糖多丁醇乙酸梭菌、产气荚膜梭菌、艰难梭菌、肉毒梭菌、酪丁酸梭菌、破伤风形梭状芽胞杆菌、破伤风杆菌、丙酸梭菌、氨基丁酸梭菌、近端梭菌、斯氏梭菌、真氧产碱杆菌、牛分枝杆菌、结核分枝杆菌、牙龈卟啉单胞菌、拟南芥、嗜热栖热菌、假单胞菌属，包括绿脓杆菌、恶臭假单胞菌、施氏假单胞菌、荧光假单胞菌，人类、兔、球形红细菌、布氏热厌氧杆菌、勤奋金属球菌、明串珠菌、橙色绿屈挠菌、卡氏玫瑰弯菌、赤细菌属、加州希蒙得木、不动杆菌属，包括醋酸钙不动杆菌和鲍氏不动杆菌、牙龈卟啉单胞菌、超嗜热古菌硫化叶菌、硫磺矿硫化叶菌、嗜酸热硫化叶菌、枯草杆菌、蜡样芽胞杆菌、巨大杆状菌、短芽孢杆菌、短小芽胞杆菌、褐鼠、肺炎克雷伯氏菌、产酸克雷伯氏菌、纤细裸藻、齿垢密螺旋体、热醋穆尔氏菌、海栖热袍菌、盐沼盐杆菌、嗜热脂肪芽孢杆菌、敏捷气热菌、野猪、秀丽隐杆线虫、谷氨酸棒杆菌、发酵氨基酸球菌、乳酸乳球菌、植物乳杆菌、嗜热链球菌、产气肠杆菌、假丝酵母、土曲霉、戊糖片球菌、运动发酵单胞菌、巴氏醋杆菌、乳酸克卢费氏酵母、巴氏真细菌、多毛拟杆菌、Anaerotruncus colihominis、Natranaerobius thermophilusm、空肠弯曲杆菌、流感嗜血杆菌、灵杆菌、无丙二酸柠檬酸杆菌、黄色粘球菌、具核梭杆菌、产黄青霉、海洋γ蛋白菌、产丁酸细菌，及其他本文公开的(参见实施例)。例如，具有4-HB或BDO生物合成产生的微生物体在本文参考大肠杆菌和酵母宿主进行示例。然而，由于目前可获得550个物种以上的全基因组序列(这些中一半以上可在公共数据库上获得，诸如NCBI)，包括395种微生物基因组以及多种酵母、真菌、植物和哺乳动物基因组，对于在相关或远缘物种中一个或更多个基因，包括例如已知基因的同源染色体、直向同源物、种内同源基因和非直向同源基因置换，以及生物间遗传变化的互换，对编码必要的4-HB或BDO生物合成活性的基因的鉴定，在本领域中是常规的和熟知的。因此，本文参考具体生物诸如大肠杆菌或酵母描述的能够生物合成本发明的4-HB或BDO和其它化合物的代谢变化可以容易地应用于其它微生物，包括原核和真核生物等。在本文提供的教导和指导下，本领域技术人员知道在一种生物中示例的代谢变化可以同样应用于其它生物。

在某些情况中，诸如当可选的4-HB或BDO生物合成途径存在于不相关的物种中时，4-HB或BDO生物合成可以通过例如外源表达来自不相关物种的一个或多个种内同源基因而被赋予给宿主物种，所述外源表达催化类似的但不相同的代谢反应，以替换相关的反应。因为不同的生物间存在某些代谢网络之间的差异，所以本领域技术人员应当理解，在不同的生物之间实际的基因应用可以不同。然而，在本文提供的教导和指导下，本领域的技术人员也应当理解，本发明的教导和方法可以使用与本文示例的那些的关联代谢变化而被应用于所有微生物体，以在感兴趣物种中构建合成4-HB诸如单体4-HB或BDO的微生物体。

宿主微生物体可以选自例如细菌、酵母、真菌或可用于发酵过程的多种其它微生物的任一种，并且非自然存在的微生物体在它们中产生。示例性细菌包括选自以下的物种：大肠杆菌、产酸克雷伯氏菌、产琥珀酸厌氧螺菌、琥珀酸放线杆菌、Mannheimiasucciniciproducens、豆根瘤菌、枯草杆菌、谷氨酸棒杆菌、结核分支杆菌、运动发酵单胞菌、乳酸乳球菌、植物乳杆菌、天蓝色链霉菌、丙酮丁醇梭菌、荧光假单胞菌和恶臭假单胞菌。示例性酵母或真菌包括选自以下的物种：酿酒酵母、粟酒裂殖酵母、乳酸克鲁维斯酵母、马克斯克鲁维酵母、土曲霉、黑曲霉和毕赤酵母。由于其为适于遗传工程的很好表征的微生物体，大肠杆菌为特别有用的宿主生物体。其他特别有用的宿主生物体包括酵母诸如酿酒酵母。

构建和检测非自然存在的产生4-HB或BDO的宿主的表达水平的方法可以通过例如本领域中熟知的重组和检测方法完成。可以发现这些方法描述在例如Sambrook等，Molecular Cloning：A Laboratory Manual，Third Ed.，Cold Spring HarborLaboratory，New York(2001)；Ausubel等，Current Protocols in Molecular Biology，John Wiley and Sons，Baltimore，MD(1999)中。4-HB和GBL可以通过例如使用Spherisorb5ODS1柱以及70％10mM磷酸盐缓冲液(pH＝7)和30％甲醇的流动相的HPLC分离，并使用UV检测器在215nm处检测(Hennessy等2004，J.Forensic Sci.46(6)：1-9)。通过气相色谱或通过HPLC和折光率检测器检测BDO，其使用Aminex HPX-87H柱和0.5mM硫酸的流动相(Gonzalez-Pajuelo等，Met.Eng.7：329-336(2005))。

参与产生4-HB或BDO的途径的外源核酸序列可利用本领域熟知的技术稳定或瞬时导入宿主细胞中，所述技术包括但不限于，接合，电穿孔，化学转变，转导，转染和超声转变。对于大肠杆菌或其他原核细胞中的外源表达，如果需要，一些基因中的核酸序列或真核核酸的cDNA可编码靶信号诸如N-末端线粒体或其他的靶信号，其可在转入原核宿主细胞之前除去。例如，线粒体前导序列的除去导致大肠杆菌中表达提高(Hoffmeister等，J.Biol.Chem.280：4329-4338(2005))。对于酵母或其他真核细胞中的外源表达，基因可在不添加前导序列时在胞液中表达，或可通过添加合适的靶序列诸如适于宿主细胞的线粒体靶向或分泌信号而靶向至线粒体或其他的细胞器官，或靶向分泌。因此，可以理解的是对核酸序列的合适的修饰以除去或包含靶序列可引入外源核酸序列中以赋予其合乎需要的特性。此外，基因可用本领域熟知的技术进行密码子优化以实现蛋白质的优化表达。

可以构建一个或多个表达载体，以含有本文所示例的一种或多种4-HB生物合成途径和/或一种或多种BDO生物合成编码核酸，其被有效连接到在宿主生物中起作用的表达调控序列。适用于本发明的宿主微生物体的表达载体包括例如质粒、噬菌体载体、病毒载体、附加体和人造染色体，包括可操作稳定整合进入宿主染色体中的载体和选择序列或标记。另外，所述表达载体可包含一种或多种筛选标记基因和合适的表达调控序列。可选择的标记基因也可以被包括，其例如提供抗生素或毒素抗性，补充营养缺陷型缺乏，或供给培养基中没有的关键营养物。表达调控序列可以包括本领域熟知的组成型和诱导型启动子、转录增强子、转录终止子等。当两种或更多种外源编码核酸共同表达时，可以将两种核酸插入到例如单一表达载体中或分离的表达载体中。对于单一载体表达，编码核酸可以可操作地连接到一个共同的表达调控序列或连接到不同的表达调控序列，诸如一个诱导型启动子和一个组成型启动子。参与代谢或合成途径的外源核酸序列的转化可以使用本领域中熟知的方法证实。所述方法包括例如，核酸分析诸如Northern印迹或mRNA的聚合酶链反应(PCR)扩增，或用于基因产物表达的免疫印迹，或检测导入的核酸序列表达或其相应基因产物的其他合适的分析方法。本领域技术人员可知外源核酸以产生所需产物的足够量表达，且进一步可知可利用本领域熟知的和本文公开的方法优化表达水平以获得充分的表达。

使用上述示例的本领域中熟知的方法构建本发明的非自然存在的微生物体，以足以产生4-HB诸如单体4-HB，或BDO的量外源表达至少一种编码4-HB或BDO途径酶的核酸。当然本发明的微生物体在足以产生4-HB或BDO的条件下培养。每个途径中4-HB酶的示例性表达水平在下面的实施例中将进一步描述。按照本文提供的教导和指导，本发明的非自然存在的微生物体可以实现4-HB诸如单体4-HB，或BDO的生物合成，其产生的胞内浓度在大约0.1至200mM之间或以上，例如0.1至25mM之间或以上。一般而言，4-HB诸如单体4-HB，或BDO的胞内浓度是在大约3至150mM之间或以上，特别在大约5至125mM之间或以上，以及更特别在大约8至100mM之间，例如，大约3-20mM，尤其在大约5至15mM之间且更特别在大约8至12mM之间，包括大约10mM、20mM、50mM、80mM或更高。在这些示例性范围的每一个之间和之上的胞内浓度也可由从本发明的非自然存在的微生物体实现。具体的实施方案中，本发明的微生物体尤其是诸如此处公开的菌株(参见实施例XII-XIX和表28)，可通过增加BDO的产生和/或降低不合需要的副产品而提供所需产物诸如BDO的生产。所述产量水平包括但不限于，此处公开的那些并且包括从大约每升1克至大约25克，例如大约每升2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24克或甚至更高量的产物。

一些实施方案中，培养条件包括厌氧或基本上厌氧的生长或保持条件。示例性的厌氧条件之前已经描述过并且为本领域所熟知。用于发酵过程的示例性的厌氧条件在本文描述并且例如在2007年8月10日提交的美国专利申请系列No.11/891，602中描述。与本领域熟知的其他厌氧条件一样，任何这些条件可用于非天然发生的微生物体。在所述厌氧条件下，4-HB或BDO生产者可以与本文示例的所有其他浓度一样，以5-10mM或更高的胞内浓度合成4-HB或BDO。当然，即使上述描述指胞内浓度，4-HB或BDO产生微生物体可在胞内和/或将产物分泌入培养基而生产4-HB或BDO。

与发酵和其他大规模培养过程一样，所述培养条件可包括例如液体培养过程。如本文所述，在厌氧或基本上厌氧的培养条件下可获得特别有用的本发明生物合成产物的产出。

如本文所述，用于实现4-HB或BDO生物合成的一种示例性的培养条件包括厌氧培养或发酵条件。在某些实施方式中，本发明的非自然存在的微生物体可以在厌氧或基本上厌氧的条件下维持、培养或发酵。简言之，厌氧条件指没有氧的环境。基本上厌氧的条件包括例如培养、分批发酵或连续发酵，以便培养基中的溶解氧浓度保持在饱和状态的0和10％之间。基本上厌氧的条件还包括在液体培养基中或在固体琼脂上培养或静止细胞，所述液体培养基或固体琼脂处于维持在小于1％氧的气氛下的密封室中。氧的百分比可以通过例如用N₂/CO₂混合物或其它适合的一种或多种非氧气体喷射培养物来维持。

本发明还提供非自然存在的微生物生物催化剂，其包括具有4-羟基丁酸(4-HB)和1,4-丁二醇(BDO)生物合成途径的微生物体，所述途径包括至少一种外源核酸，该核酸编码4-羟基丁酸脱氢酶、CoA-非依赖性琥珀酸半醛脱氢酶、琥珀酰-CoA合成酶、CoA-依赖性琥珀酸半醛脱氢酶、4-羟基丁酸：CoA转移酶、谷氨酸：琥珀酸半醛转氨酶、谷氨酸脱羧酶、CoA-非依赖性醛脱氢酶、CoA-依赖性醛脱氢酶或醇脱氢酶，其中外源核酸以足以产生1,4-丁二醇(BDO)的量表达。4-羟基丁酸：CoA转移酶也被称为4-羟基丁酰CoA：乙酰-CoA转移酶。本文还公开了另外的4-HB或BDO途径酶(参见实施例和图8-13)。

本发明进一步提供非自然存在的微生物生物催化剂，其包括具有4-羟基丁酸(4-HB)和1,4-丁二醇(BDO)生物合成途径的微生物体，所述途径包括至少一种外源核酸，所述核酸编码4-羟基丁酸脱氢酶、琥珀酰-CoA合成酶、CoA-依赖性琥珀酸半醛脱氢酶、4-羟基丁酸：CoA转移酶、4-丁酸激酶、磷酸转丁酰酶、α-酮戊二酸脱羧酶、醛脱氢酶、醇脱氢酶或醛/醇脱氢酶，其中外源核酸以足以产生1,4-丁二醇(BDO)的量表达。

也可以产生生物合成BDO的非自然存在的微生物体。如同本发明的产生4-HB的微生物体，产生BDO的微生物体也可在胞内产生BDO或分泌BDO到培养基中。按照先前提供的用于构建合成4-HB的微生物体的教导和指导，可以将另外的BDO途径掺入产生4-HB的微生物体中，以产生也合成BDO和其它BDO家族化合物的生物。BDO的化学合成和其下游产品是已知的。能够进行BDO生物合成的本发明的非自然存在的微生物体避免了使用4-HB作为切入点的这些化学合成，如图1中所示。如下面进一步所描述，4-HB生产者例如也可以被用于将4-HB化学转化为GBL以及然后转化为BDO或THF。可选地，4-HB生产者可以被进一步修饰，以包含将4-HB和/或GBL转化为BDO的生物合成能力。

另外的引入4-HB生产者中的BDO途径包括，例如，在宿主缺乏的背景下外源表达或过量表达一种或更多种在图1中步骤9-13示例的酶。一种这种途径包括，例如，实施如图1中步骤9、12和13显示的反应所必需的酶活性，其中醛和醇脱氢酶可以是具有醛和醇脱氢酶活性的分离酶或多功能酶。另一个这样的途径包括，例如，实施如图1中步骤10、11、12和13中显示的反应所必需的酶活性，同样，其中醛和醇脱氢酶可以是具有醛和醇脱氢酶活性的分离酶或多功能酶。因此，引入至4-HB生产者的另外的BDO途径包括，例如，在宿主缺乏的背景下外源表达或过量表达4-羟基丁酸：CoA转移酶、丁酸激酶、磷酸转丁酰酶、CoA-非依赖性醛脱氢酶、CoA-依赖性醛脱氢酶或醇脱氢酶中的一种或更多种。在不存在能够修饰4-HB的内源酰基-CoA合成酶的情况下，非自然存在的产生BDO的微生物体可进一步包括选择用于4-HB的外源酰基-CoA合成酶，或多种酶的组合，所述多种酶具有将4-HB转化成4-HB-CoA净反应。如下面在实施例中进一步所示例，丁酸激酶和磷酸转丁酰酶展示出BDO途径活性并且用4-HB底物催化图1中示例的转化。因此，这些酶在本文中也可以分别称为4-羟基丁酸激酶和磷酸转羟基丁酰酶。

可以用于这些4-HB向BDO的体内转化的示例性醇和醛脱氢酶在下面的表1中列出。

表1.用于将4-HB转化为BDO的醇和醛脱氢酶

醇脱氢酶

丁醇脱氢酶

醛脱氢酶

其他示例性的酶和途径在此处公开(参见实施例)。此外，可以理解的是可利用酶用于完成底物不是自然底物的反应。虽然对于非自然底物的活性低于自然底物，可以理解的是可利用所述酶，无论其是自然存在的或利用如本文公开的直接进化或适应进化修饰的(也参见实施例)。

通过本文公开的任何途径的BDO产生在某种程度上以用于前体转化至BDO的合适酶的鉴定为基础。已经鉴定了许多用于一些反应阶段的特异性酶。对于其中尚未鉴定对反应前体酶特异性的那些转化，已确定最适于催化所述反应步骤的酶候选物。如下所论述的，已显示酶对大量底物起作用。另外，蛋白质工程领域的进展也使得改变酶以有效作用于底物是可行的，即使其不是自然底物。如下所述的为适于BDO途径以及已用于开发酶以作用于非自然底物的方法而来自不同类别的广-特异性酶。

BDO途径的关键酶类为氧化还原酶，其相互转变酮或醛与醇(1.1.1)。该类中许多示例性的酶可对大量底物起作用。纯化自短杆菌属土壤菌KU1309(Hirano等，J.Biosc.Bioeng.100：318-322(2005))的醇脱氢酶(1.1.1.1)显示对脂族以及芳香醇的过剩以高活性起作用。表2显示所述酶的活性和其对不同醇的Km。所述酶是可逆的且对一些醛也具有很高的活性(表3)。

表2.来自短杆菌属KU的醇脱氢酶对氧化各种醇的相对活性

*2-苯基乙醇的活性，对应于19.2U/mg，作为100％。

表3.来自短杆菌属KU 1309的醇脱氢酶还原各种羰基化合物的相对活性

来自真氧产碱杆菌的乳酸脱氢酶(1.1.1.27)为已证实对一些2-酮酸诸如2氧代丁酰，2-氧代戊酸和2-酮戊二酸(2-氧代己二酸的C5化合物)具有高活性的另外的酶(Steinbuchel和Schlegel，Eur.J.Biochem.130：329-334(1983))。表4列2表明来自罗尔斯通氏菌(旧名真养产碱菌)的IdhA对不同底物的活性(Steinbuchel和Schlegel，上文，1983)。

表4.罗尔斯通氏菌IdhA(Steinbuchel和Schlegel，上文，1983)对不同底物的体外活性及其与对丙酮酸的体外活性的比较

可转换2-酮酸至其酰基-CoA配对物(1.2.1)的氧化还原酶也显示接受多种底物。例如，支链2-酮酸脱氢酶复合物(BCKAD)，亦称2-氧代异戊酸脱氢酶(1.2.1.25)，参与支链氨基酸降解途径，转换缬氨酸、亮氨酸和异亮氨酸的2-酮酸类衍生物至其酰基-CoA衍生物和CO2。在包括褐鼠(Paxton等，Biochem.J.234：295-303(1986))和酿酒酵母(Sinclair等，Biochem.Mol Biol.Int.32：911-922(1993)的一些生物体中，该复合物显示具有宽的底物范围，除了支链氨基酸前体外，包括线性氧代-酸类诸如2-氧代丁酸和α-酮戊二酸。

已报道另一类酶的成员，即氨基转移酶(2.6.1)作用于多种底物。已鉴定了来自激烈热球菌的天冬氨酸转氨酶(aspAT)，其在大肠杆菌中表达，重组蛋白质表征表明所述酶对天冬氨酸和α-酮戊二酸具有最高的活性，而对丙氨酸、谷氨酸和芳香族氨基酸具有较低但仍显著的活性(Ward等，Archaea 133-141(2002))。另一种情况中，已报道从墨西哥利什曼原虫鉴定且在大肠杆菌中表达的氨基转移酶(Vernal等，FEMS Microbiol.Lett.229：217-222(2003))分别对酪氨酸(对酪氨酸的活性为100％)、苯丙氨酸(90％)、色氨酸(85％)、天冬氨酸(30％)、亮氨酸(25％)和蛋氨酸(25％)具有宽的底物特异性(Vernal等，Mol.Biochem.Parasitol 96：83-92(1998))。已报道来自克氏锥虫的酪氨酸氨基移换酶的类似的宽特异性，即使这两种酶仅具有6％序列同源性。后者酶可接受亮氨酸、蛋氨酸以及酪氨酸、苯丙氨酸、色氨酸和丙氨酸作为有效的氨基供体(Nowicki等，Biochim.Biophys.Acta 1546：268-281(2001))。

已表明CoA转移酶(2.8.3)具有作用于超过一种以上底物的能力。具体地，CoA移转酶纯化自丙酮丁醇棱菌并且报道其对乙酸盐、丙酸盐和丁酸盐具有最高的活性。其对戊酸盐、异丁酸盐和巴豆酸酯也具有显著的活性(Wiesenborn等，Appl.Environ.Microbiol.1055：323-329(1989))。另一研究中，大肠杆菌酶酰基-CoA：乙酸盐-CoA移转酶，亦称乙酸盐-CoA移转酶(EC 2.8.3.8)，已显示从多种支链和线性酰基-CoA底物传送CoA部分至乙酸盐，包括异丁酸盐(Matthies和Schink，App.Environm.Microbiol.58：1435-1439(1992))、戊酸盐(Vanderwinkel等，Biochem.Biophys.Res Commun.33：902-908(1968b))和丁酸酯(Vanderwinkel等，Biochem.Biophys.Res Commun.33：902-908(1968a)。

另有其他的酶类支持酶的宽底物特异性。一些异构酶(5.3.3)也证实对多种底物起作用。例如，来自施氏假单胞菌的L-鼠李糖异构酶催化各种醛糖和酮糖之间的异构化(Yoshida等，J.Mol.Biol.365：1505-1516(2007))。这些包括L-鼠李糖和L-鼠李树胶糖、L-甘露糖和L-果糖、L-木糖和L-木酮糖、D-核糖和D-核酮糖以及D-阿洛糖和D-阿洛酮糖之间的异构化。

在又一类酶中，发现将L-高丝氨酸转变至L-高丝氨酸磷酸盐的来自大肠杆菌的磷酸转移酶(2.7.1)，高丝氨酸激酶(2.7.1.39)磷酸化许多高丝氨酸类似物。这些底物中，R-位点的羧基功能基团已由酯取代或由羟甲基取代(Huo和Viola，Biochemistry 35：16180-16185(1996))。表5显示该激酶得宽底物特异性。

表5.高丝氨酸激酶的底物特异性

底物	K<sub>催化</sub>	％k<sub>催化</sub>	K<sub>m</sub>(mM)	k<sub>催化</sub>/K<sub>m</sub>
					L-高丝氨酸	18.3±0.1	100	0.14±0.04	184±17
D-高丝氨酸	8.3±1.1	32	31.8±7.2	0.26±0.03
					L-天冬氨酸β-半醛	2.1±0.1	8.2	0.28±0.02	7.5±0.3
L-2-氨基-1,4-丁二醇	2.0±0.5	7.9	11.6±6.5	0.17±0.06
					L-2-氨基-5-羟基戊酸酯	2.5±0.4	9.9	1.1±0.5	2.3±0.3
L-高丝氨酸甲酯	14.7±2.6	80	4.9±2.0	3.0±0.6
					L-高丝氨酸乙酯	13.6±0.8	74	1.9±0.5	7.2±1.7
L-高丝氨酸异丙酯	13.6±1.4	74	1.2±0.5	11.3±1.1
					L-高丝氨酸正丙酯	14.0±0.4	76	3.5±0.4	4.0±1.2
L-高丝氨酸异丁酯	16.4±0.8	84	6.9±1.1	2.4±0.3
					L-高丝氨酸正丁酯	29.1±1.2	160	5.8±0.8	5.0±0.5

BDO途径中有用的另一类酶为酸-硫羟连接酶(6.2.1)。类似于其他类的酶，已确定该类中的某些酶具有宽的底物特异性。例如，已表明来自恶臭假单胞菌的酰基CoA连接酶作用于一些脂族底物，包括酸、丙酸、酪酸、缬草酸、己酸、庚酸和辛酸并且作用于芳族化合物诸如苯乙酸和苯氧乙酸类(Fernandez-Valverde等，Appl.Environ.Microbiol.59：1149-1154(1993))。相关的酶，来自三叶草根瘤菌的丙二酰CoA合成酶(6.3.4.9)可将一些二酸，即乙基-、丙基-、烯丙基-、异丙基-、二甲基-、环丙基-、环丙基亚甲基-、环丁基-和苄基-丙二酸盐转化为其相应的硫代酯(Pohl等，J.Am.Chem.Soc.123：5822-5823(2001))。同样地，也已发现脱羧酶(4.1.1)具有宽的底物范围。丙酮酸脱羧酶(PDC)，也称为酮酸脱羧酶，为酒精发酵、催化丙酮酸脱羧至乙醛的关键酶。分离自酿酒酵母的酶对脂族2-酮酸类，包括2-丁酮酸、2-戊酮酸、2-苯丙酮酸具有宽的底物范围(Li和Jordan，Biochemistry 38：10004-10012(1999))。同样地，苯甲酰甲酸脱羧酶具有宽的底物范围并且已成为酶工程研究的靶标。已广泛研究了来自恶臭假单胞菌的酶并且可得到该酶的晶体结构(Polovnikova等，Biochemistry42：1820-1830(2003)；Hasson等，Biochemistry 37：9918-9930(1998))。已表明支链α-酮酸脱羧酶(BCKA)作用于链长为3至6碳的多种化合物(Oku和Kaneda，J.Biol.Chem.263：18386-18396(1998)；Smit等，Appl.Environ.Microbiol.71：303-311(2005b))。乳酸乳球菌中的酶已用多种支链和线性底物包括2-氧代丁酸、2-氧代己酸、2-氧代戊酸、3-甲基-2-氧代丁酸、4-甲基-2--氧代丁酸和异己酸表征(Smit等，Appl.Environ.Microbiol.71：303-311(2005a))。

有趣的是，已知具有一种主要活性的酶还报道催化非常不同的功能。例如，来自嗜热脂肪芽孢杆菌和枯草杆菌的辅因子-依赖性磷酸甘油酸变位酶(5.4.2.1)也已知作为磷酸酶起作用(Rigden等，Protein Sci.10：1835-1846(2001))。已知来自嗜热脂肪芽胞杆菌的酶对一些底物具有活性，包括3-磷酸甘油酸、α-萘基磷酸盐、对硝基苯磷酸盐、AMP、果糖-6-磷酸、核糖-5-磷酸和CMP。

与其中所述酶天然具有宽的底物特异性的实施例相反，已利用直接进化修饰许多酶以扩大其对非自然底物的特异性。或者，利用直接进化还改变了所述酶的底物偏爱。因此，对于对自然底物的有效作用，例如改善的效率，或对非自然底物的有效作用，例如提高的效率而工程设计给定的酶是可行的。例如，已报道来自绿脓杆菌的脂肪酶的拮抗选择性被显著改善(Reetz等，Agnew.Chem.Int.Ed Engl.36：2830-2832(1997))。该酶以利于(S)-酸的仅2％对映体剩余(ee)水解对硝基苯基2-甲基癸酸酯。然而，在连续四轮易错诱变和筛选后，产生以81％ee催化必需反应的变体(Reetz等，Agnew.Chem.Int.Ed Engl.36：2830-2832(1997))。

直接进化方法常用于修饰酶以作用于大量非自然的底物。铜绿假单胞菌中脂肪酶的底物特异性通过活性中心附近氨基酸残基的随机化而扩大。此允许接受该酶的α-取代羧酸酯(Reetz等，Agnew.Chem.Int.Ed Engl.44：4192-4196(2005))。在另一个成功的酶中，采用DNA改组以产生大肠杆菌氨基转移酶，其接受β支链底物，而该底物被野生型酶很难接受(Yano等，Proc.Nat.Acad.Sci.U.S.A.95：5511-5515(1998))。具体地，在四轮改组结束时，天冬氨酸转氨酶对缬氨酸和2-氧代缬氨酸的活性提高了五个数量级，虽然其对自然底物天冬氨酸的活性降低了30倍。近来，一种算法用于设计逆醛缩酶，其可用于催化非自然和非-生物学底物，4-羟基-4-(6-甲氧基-2-萘基)-2-丁酮中的碳-碳链断裂(Jiang等，Science319：1387-1391(2008))。这些算法使用四种不同催化基序的组合以设计新酶，并且用于实验表征的所选择设计的20种具有超过非催化反应四倍提高的速率(Jiang等，Science 319：1387-1391(2008))。因此，这些基因工程方法不仅能够扩大酶可以作用的系列底物，而且其允许设计和构建非常有效的酶。例如，已报道DNA改组方法(对瞬时模板或RACHITT的随意嵌合发生)产生基因工程改造的单加氧酶，其对复杂底物的脱硫作用具有改善的速率以及对非自然底物有快20倍的转化(Coco等，Nat.Biotechnol.19：354-359(2001))。同样地，惰性突变体磷酸丙糖异构化酶的比活性从1.3倍提高至19倍(Hermes等，Proc.Nat.Acad.Sci.U.S.A.87：696-700(1990))。该比活性的提高通过利用全长蛋白质的随机诱变实现，并且所述改进可追溯到六个氨基酸残基的突变。

改变酶对所需底物的底物特异性的蛋白质工程方法的有效性也在一些研究中证实。来自嗜热栖热菌的异丙基苹果酸脱氢酶通过改变活性中心附近的残基而修饰，使得其现在可以以苹果酸盐和D-乳酸作为作用底物(Fujita等，Biosci.Biotechnol.Biochem.65：2695-2700(2001))。在该研究以及其它研究中，有人指出一个或一些残基可经修饰改变底物特异性。例如，其中在假定的底物-结合区域中单个氨基酸改变的黄烷酮醇4-还原酶可优先还原二氢山奈酚(Johnson等，Plant.J.25：325-333(2001))。来自大肠杆菌的非常特异的异柠檬酸脱氢酶的底物特异性通过改变活性中心中的一个残基而改变，将异柠檬酸形成异丙基苹果酸(Doyle等，Biochemistry40：4234-4241(2001))。同样地，NAD+-依赖性的1，5-羟前列腺素脱氢酶的辅因子特异性通过改变N-末端附近的一些残基而改变至NADP+依赖性的(Cho等，Arch.Biochem.Biophys.419：139-146(2003))。

序列分析和分子模型分析用于鉴定用于修饰的关键残基，其进一步通过定点诱变研究。

各种类别的酶存在于许多实例中，其中酶的作用被改变至对酶的非自然底物比对自然底物更有利。通过DNA改组和筛选从大肠杆菌半乳糖苷酶发展岩藻糖苷酶(Zhang等，Proc.Natl Acad.Sci.U.S.A.94：4504-4509(1997))。同样地，来自大肠杆菌的天冬氨酸转氨酶利用同源模型和定点诱变转化成酪氨酸转氨酶(Onuffer和Kirsch，Protein Sci.，4：1750-1757(1995))。据报道来自恶臭假单胞菌苯甲酰甲酸脱羧酶活性中心中两个残基的定点诱变改变了对自然和非自然底物的亲和力(Km)(Siegert等，Protein Eng Des Sel 18：345-357(2005))。来自酿酒酵母的细胞色素C过氧化物酶(CCP)经过直接分子演化以生成具有对标准的过氧化物酶底物甲基儿茶酚提高的活性的突变体，由此改变来自蛋白质细胞色素C的CCP对小有机分子的底物特异性。三轮DNA改组和筛选后，分离突变体，其相对于自然底物，拥有对甲基儿茶酚300倍提高的活性以及1000倍提高的特异性(Iffland等，Biochemistry 39：10790-10798(2000))。

一些情形中，已经获得比任何一个亲本酶更具有不同底物偏爱的酶。例如，联苯-二氧化酶-介导的多氯化联苯的降解通过改组来自两种细菌类产碱假单胞菌和洋葱假单胞菌的基因而改进(Kumamaru等，Nat.Biotechnol.16：663-666(1998))。得到的嵌合联苯加氧酶显示与两种亲本酶不同的底物偏爱，以及对原为所述酶不适底物的有关联苯化合物和单芳环烃类诸如甲苯和纯苯提高的降解活性。

除了改变酶的特异性，还可以增强对所述酶本来低活性的底物的活性。一个研究表明来自恶臭假单胞菌的氨基酸消旋酶，其具有宽的底物特异性(对赖氨酸、精氨酸、丙氨酸、丝氨酸、蛋氨酸、半胱氨酸、亮氨酸和组氨酸等)但具有对色氨酸的低活性，可通过随机诱变显著改进(Kino等，Appl.Microbiol.Biotechnol.73：1299-1305(2007))。同样地，牛BCKAD活性中心设计为有利于替代的底物乙酰CoA(Meng和Chuang，Biochemistry 33：12879-12885(1994))。这些方法有意思的方面是即使随机方法已应用于生成这些具有有效活性的突变酶，还是可以确定赋予活性改善的所述精确的突变或结构变化。例如，上述研究中，促进对色氨酸提高的活性的突变被追溯至两个不同的位点。

直接进化还用于表达难以表达的蛋白质。例如，辣根过氧物酶经过随机诱变和基因重组，鉴定出具有比野生型超过14倍活性的突变体(Lin等，Biotechnol.Prog.15：467-471(1999))。

直接进化的另一个实例显示广泛的修饰，酶可以经此而获得所需功能。来自嗜热脂肪芽孢杆菌的乳酸脱氢酶经过定点诱变，在被认为决定对不同醇酸特异性的位点生成三个氨基酸取代(Clarke等，Biochem.Biophys.Res.Commun.148：15-23(1987))。这些突变后，草酰乙酸比丙酮酸的特异性增至500，而相反，野生型酶具有1000的丙酮酸比草酰乙酸的催化特异性。该酶利用定点诱变进一步设计以对支链被取代的丙酮酸具有活性(Wilks等，Biochemistry 29：8587-8591(1990))。具体地，所述酶对α-酮异己酸的Kcat具有55倍的改进。同样的酶中生成三个结构修饰以改变从乳酸至苹果酸的底物特异性。所述酶对苹果酸高效且特异(Wilks等，Science 242：1541-1544(1988))。来自嗜热脂肪芽胞杆菌的同样的酶随后设计为对具有正电荷侧链的α-酮酸类具有高催化活性，诸如包含铵基的那些(Hogan等，Biochemistry 34：4225-4230(1995))。所述酶102引入酸性氨基酸的突变体有利于所述侧链铵基的结合。获得的结果证实所述突变体呈现对ω-氨基-α-酮酸底物25倍的kcat/Km值改进。有趣的是，该酶还在结构上修饰以代替乳酸脱氢酶而作为苯乳酸脱氢酶起作用(Wilks等，Biochemistry 31：7802-7806 1992)。限制酶切位点被引入该酶的基因中，其允许所述基因区域被切除。该区域编码活动的多肽表面环(残基98-110)，其通常封闭来自大体积溶剂的活性位点并且为底物特异性的主要决定簇。插入可变长度和序列的环使得产生具有改变的底物特异性的醇酸脱氢酶。对于具有一个更长环的构建体，对丙酮酸的活性降低100万倍但对苯丙酮酸的活性基本不变。获得了390，000倍的特异性转换(kcat/Km)。该酶对苯丙酮酸比丙酮酸得1700：1选择性是苯乳酸脱氢酶所需要的。上述研究表明酶工程的各种方法可用于获得用于本文公开的BDO途径的酶。

如本文公开的，可利用从许多中心代谢中间产物至1,4-丁二醇的生物合成途径，包括乙酰-CoA、琥珀酰-CoA、α-酮戊二酸、谷氨酸、4-氨基丁酸和高丝氨酸。乙酰-CoA、琥珀酰-CoA和α-酮戊二酸为三羧酸(TCA)循环的共同中间体，三羧酸循环为存在于利用氧进行细胞呼吸的几乎所有活细胞中的一系列反应，并且以截短形式存在于许多厌氧生物中。谷氨酸为源自α-酮戊二酸经过谷氨酸脱氢酶或任何许多氨基转移反应的氨基酸(参见图8B)。4-氨基丁酸可通过谷氨酸的脱羧作用形成或经过图9C中公开的途径而来自乙酰乙酰基-CoA。

乙酰乙酰基-CoA源自于两个乙酰-CoA分子经由酶，乙酰-辅酶A乙酰转移酶或相等地，乙酰乙酰基-辅酶A硫基裂解酶的缩合。高丝氨酸为苏氨酸和蛋氨酸新陈代谢中的中间体，由草酰乙酸经过天冬氨酸形成。草酰乙酸转化至高丝氨酸需要一个NADH，两个NADPH和一个ATP。

还可采用不同于以上所实例那些的途径以在非天然存在的微生物体中产生BDO的生物合成。在一实施方案中，可利用L-高丝氨酸至BDO途径实现生物合成(参见图13)。该途径具有0.90mol/mol葡萄糖的摩尔产量，其似乎受还原当量有效性的限制。第二种途径从乙酰乙酰基-CoA合成BDO并且能够实现1.091mol/mol葡萄糖的最大理论收率(参见图9)。任一途径的进行均可通过两种外源酶引入宿主生物体诸如大肠杆菌中而实现，并且两种途径可途经琥珀酰-CoA另外补充BDO的产生。途径酶、热动力学、理论收率和总可行性如下进一步描述。

高丝氨酸途径还可设计以产生BDO-生产的微生物体。高丝氨酸为苏氨酸和蛋氨酸新陈代谢中的中间体，由草酰乙酸经过天冬氨酸形成。草酰乙酸转化至高丝氨酸需要一个NADH，两个NADPH和一个ATP(图2)。一旦形成，高丝氨酸就进入苏氨酸和甲硫氨酸的生物合成途径。在大部分生物体中，高水平的苏氨酸或甲硫氨酸反馈抑制高丝氨酸生物合成途径(Caspi等，Nucleic Acids Res.34：D511-D516(1990))。

高丝氨酸向4-羟基丁酸(4-HB)的转化可以在本文所述的两个酶步骤中完成。该途径的第一个步骤是通过推定脱氨酶使高丝氨酸脱氨基。在步骤2中，产物烯烃--4-羟基丁-2-烯酸通过假定的还原酶消耗一个NADH被还原为4-HB。4-HB能因此转变成BDO。

可用于催化上述转化的酶在本文公开。例如，在途径的步骤1中的脱氨酶非常类似于天冬氨酸脱氨酶(天冬氨酸酶)的化学性质。天冬氨酸酶是微生物中分布广泛的酶，并且已经被充分表征(Viola，R.E.，Mol.Biol.74：295-341(2008))。大肠杆菌天冬氨酸酶的晶体结构已被解析(Shi等，，Biochemistry 36：9136-9144(1997))，因此，有可能直接改造酶活性部位中的突变，这使其底物特异性改变，以包含高丝氨酸。步骤2中的氧化还原酶具有类似于几种充分表征酶的化学性质，所述充分表征酶包括大肠杆菌TCA循环中的延胡索酸还原酶。因为该反应的热力学非常有利，所以具有广泛底物特异性的内源还原酶有可能能够还原4-羟基丁-2-烯酸。在厌氧条件下该途径的产量是0.9molBDO/mol葡萄糖。

琥珀酰-CoA途径被发现具有更高的产量，这是由于其在能量上更加有效的事实。一个草酰乙酸分子经过高丝氨酸途径转化成BDO将需要消耗2个ATP当量。因为假定PEP羧激酶是可逆的，葡萄糖转化成两个草酰乙酸分子可以产生最多3个ATP分子，因此葡萄糖经过高丝氨酸全部转化成BDO具有负的能量产量。如所期望，如果我们假定能量可以通过呼吸作用产生，则高丝氨酸途径的最大产量增加至1.05mol/mol葡萄糖，其是琥珀酰-CoA途径产量的96％。琥珀酰-CoA途径可以引导一些碳通量(carbon flux)通过丙酮酸脱氢酶和TCA循环的氧化支路，产生还原当量和琥珀酰-CoA，而没有能量消耗。因而，它不会遭遇与高丝氨酸途径相同的能量问题，因为并不是所有的通量都通过草酰乙酸至琥珀酰-CoA引导至BDO。总之，高丝氨酸途径证实是得到BDO的适当高产量的路线。

乙酰乙酸途径也可以被改造成以产生产BDO的微生物体。在大肠杆菌中，乙酰乙酸由丙酮和亮氨酸降解产生。乙酰乙酸也可以通过参与脂肪酸代谢的酶从乙酰-CoA形成，所述酶包括乙酰-CoA乙酰转移酶和乙酰乙酰-CoA转移酶(图7)。通过乙酰乙酸的生物合成路线在可以代谢单碳化合物诸如一氧化碳，二氧化碳或甲醇以形成乙酰-CoA的微生物体中也特别有用。

从乙酰乙酸到琥珀酸半醛的三个步骤的路线(参见图9C)可以用于通过乙酰乙酸合成BDO。如图8B所示4-氨基丁酸可转变成琥珀酸半醛。琥珀酸半醛是一个从琥珀酰-CoA去除的还原步骤或是一个从α-酮戊二酸去除的脱羧步骤，其经过三个还原步骤后(图1)可以转化成BDO。简言之，该途径的步骤1涉及乙酰乙酰基-CoA通过例如atoA和atoD基因编码的大肠杆菌乙酰乙酰基-CoA移转酶转化成乙酰乙酸(Hanai等，Appl.Environ.Microbiol.73：7814-7818(2007))。乙酰乙酰基-CoA生物途径的步骤2必须使乙酰乙酸通过ω-转氨酶转化为3-氨基丁酸。来自反硝化产碱菌(Alcaligens denitrificans)的ω-氨基酸：丙酮酸转氨酶(ω-APT)在大肠杆菌中过量表达并且显示具有高的针对3-氨基丁酸的体外活性(Yun等，Appl.Environ.Microbiol.70：2529-2534(2004))。

在步骤2中，假定的氨基变位酶将胺基团从碳骨架的3-位转移至4-位。在3-氨基丁酸上执行该功能的氨基变位酶没有被表征，但来自斯蒂克兰德氏梭菌(Clostridiumsticklandii)的酶具有非常相似的机理(图9)。酶--D-赖氨酸-5，6-氨基变位酶--参与赖氨酸生物合成。

自乙酰乙酰基-CoA到BDO的合成路线经过4-氨基丁酸，其是大肠杆菌中的代谢物，通常由谷氨酸脱羧形成。一旦形成，4-氨基丁酸可以通过4-氨基丁酸转氨酶(2.6.1.19)转化成琥珀酸半醛，4-氨基丁酸转氨酶是已经被生物化学表征的酶。

在该途径中选择候选酶的一种考虑是参与步骤2和3的酶的立体选择性。反硝化产碱菌的ω-ABT对3-氨基丁酸的L-立体异构体是特异的，而D-赖氨酸-5，6-氨基变位酶有可能需要D-立体异构体。如果不能找到或改造具有互补立体选择性的酶，则必需加入第三个酶至该途径，所述酶具有消旋酶活性，可以将L-3-氨基丁酸转化成D-3-氨基丁酸。尽管氨基酸消旋酶分布广泛，但这些酶是否可以对ω-氨基酸起作用并不知道。

在厌氧条件下该途径的最大理论摩尔产量是1.091mol/mol葡萄糖。为了产生从乙酰乙酸至BDO的通量，必需假定乙酰-CoA：乙酰乙酰-CoA转移酶是可逆的。该酶在大肠杆菌中的功能是通过首先将短链脂肪酸转化为硫酯而使其代谢。

虽然在消耗乙酸的方向上进行乙酰-CoA：乙酰乙酰-CoA转移酶操作在大肠杆菌中还没有实验证实，但对其它生物中相似的酶的研究支持该反应是可逆的这种假设。消化道微生物罗尔斯通氏菌属某种(Roseburia sp.)和F.prasnitzii中的酶--丁酰-CoA：乙酸：CoA转移酶，在利用乙酸的方向上操作，以产生丁酸(Duncan等，Appl.Environ.Microbiol68：5186-5190(2002))。布氏锥虫(Trypanosoma brucei)中的另一非常相似的酶--乙酰：琥珀酸CoA-转移酶，也在利用乙酸的方向上操作。该反应具有接近于平衡状态的Δrxn G，因此高浓度的乙酸有可能能够将反应在感兴趣的方向推动。在1.09mol/mol葡萄糖的最大理论BDO生产速率下，模拟预测大肠杆菌可以产生1.098mol ATP/mol葡萄糖，而没有发酵副产物。该ATP产量对于细胞生长、维持和生产应当是足够的。乙酰乙酰基-CoA生物途径是一种从乙酰-CoA到BDO的高产量路线。

因此，除了先前示例的用于在选择宿主中建立4-HB生物合成的各种修饰的任一个之外，产生BDO的微生物体可以包括4-HB途径代谢修饰的任意先前组合和变换以及CoA-非依赖性醛脱氢酶、CoA-依赖性醛脱氢酶或醇脱氢酶的任意表达组合，以产生GBL和/或BDO的生物合成途径。因此，本发明的BDO生产者可以具有例如1种、2种、3种、4种、5种、6种、7种、8种、9种或所有酶的外源表达，所述酶对应于4-HB途径酶的任一种和/或本文公开的BDO途径酶的任一种。

设计和构建遗传修饰微生物体使用本领域中熟知的方法进行，以达到足以产生BDO的表达量。具体而言，本发明的非自然存在的微生物体可以实现BDO的生物合成，其产生在大约0.1至200mM之间或更多的胞内浓度，诸如上述的大约0.1至25mM或更多。例如，BDO胞内浓度在大约3-20mM之间，特别地在大约5-15mM之间以及更特别地在大约8-12mM之间，包括大约10mM或更多。在这些示例性范围中的每一个之间和以上的胞内浓度也可从本发明的非自然存在的微生物体实现。与4-HB生产者一样，BDO生产者也可以在厌氧条件下被维持、培养或发酵。

本发明进一步提供生产4-HB的方法。该方法包括在基本上厌氧的条件下将具有4-羟基丁酸(4-HB)生物合成途径的、非自然存在的微生物体培养足够的时间期间以产生单体4-羟基丁酸(4-HB)，所述途径包含至少一种外源核酸，所述核酸编码4-羟基丁酸脱氢酶、CoA-非依赖性琥珀酸半醛脱氢酶、琥珀酰-CoA合成酶、CoA-依赖性琥珀酸半醛脱氢酶、谷氨酸：琥珀酸半醛转氨酶、α-酮戊二酸脱羧酶或谷氨酸脱羧酶。该方法另外可以包括例如将4-HB化学转化成GBL以及转化成BDO或THF。

另外提供生产4-HB的方法。该方法包括在基本上厌氧的条件下将具有4-羟基丁酸(4-HB)生物合成途径的、非自然存在的微生物体培养足够的时间期间以产生单体4-羟基丁酸(4-HB)，所述途径包括至少一种外源核酸，该核酸编码4-羟基丁酸脱氢酶、琥珀酰-CoA合成酶、CoA-依赖性琥珀酸半醛脱氢酶或α-酮戊二酸脱羧酶。4-HB产物可以分泌进入培养基中。

进一步提供生产BDO的方法。该方法包括将非自然存在的微生物生物催化剂或微生物体培养足够的时间期间以产生1,4-丁二醇(BDO)，该生物催化剂或生物体包含具有4-羟基丁酸(4-HB)和1,4-丁二醇(BDO)生物合成途径的微生物体，该途径包含至少一种外源核酸，其编码4-羟基丁酸脱氢酶、琥珀酰-CoA合成酶、CoA-依赖性琥珀酸半醛脱氢酶、4-羟基丁酸：CoA转移酶、4-羟基丁酸激酶、磷酸转羟基丁酰酶、α-酮戊二酸脱羧酶、醛脱氢酶、醇脱氢酶或醛/醇脱氢酶。BDO产物可以分泌进入培养基中。

另外提供通过培养具有本发明BDO途径的非天然存在的微生物体而生产BDO的方法。所述BDO途径包括编码在一定条件下以足够量表达而生产BDO并且表达足够的时间以产生BDO的BDO途径酶的至少一种外源核酸，所述BDO途径包括4-氨基丁酸CoA移转酶，4-氨基丁酰-CoA水解酶，4-氨基丁酸-CoA连接酶，4-氨基丁酰-CoA氧化还原酶(去氨基)，4-氨基丁酰-CoA氨基转移酶或4-羟基丁酰-CoA脱氢酶(参见实施例VII和表17)。

或者，所述BDO途径包括编码在一定条件下以足够量表达而生产BDO并且表达足够的时间以产生BDO的BDO途径酶的至少一种外源核酸，所述BDO途径包括4-氨基丁酸-CoA移转酶，4-氨基丁酰-CoA水解酶，4-氨基丁酸-CoA连接酶，4-氨基丁酰-CoA还原酶(醇形成)，4-氨基丁酰-CoA还原酶，4-氨基丁-l-醇脱氢酶，4-氨基丁-l-醇氧化还原酶(去氨基)或4-氨基丁-l-醇氨基转移酶(参见实施例VII和表18)。

另外，本文提供用于生产BDO的方法，包括培养具有BDO途径的非天然存在的微生物体，该途径包括编码在一定条件下以足够量表达而生产BDO并且表达足够的时间以产生BDO的BDO途径酶的至少一种外源核酸，所述BDO途径包括4-氨基丁酸激酶，4-氨基丁醛脱氢酶(磷酸化)，4-氨基丁-l-醇脱氢酶，4氨基丁-l-醇氧化还原酶(去氨基)，4-氨基丁-l-醇氨基转移酶，[(4-氨基丁醇基)氧]膦酸氧化还原酶(去氨基)，[(4-氨基丁醇基)氧]膦酸氨基转移酶，4-羟基丁酰-磷酸脱氢酶，或4-脱氢酶(磷酸化)(参见实施例VII和表19)。

本发明进一步提供用于生产BDO的方法，包括培养具有BDO途径的非天然存在的微生物体，该途径包括编码在一定条件下以足够量表达而生产BDO并且表达足够的时间以产生BDO的BDO途径酶的至少一种外源核酸，所述BDO途径包括α-酮戊二酸5-激酶，2，5-二氧代戊酸半醛脱氢酶(磷酸化)，2，5-二氧代戊酸还原酶，α-酮戊二酸CoA移转酶，α-酮戊二酸基-CoA水解酶，α-酮戊二酸基-CoA连接酶，α-酮戊二酸基-CoA还原酶，5-羟基-2-氧代戊酸脱氢酶，α-酮戊二酸基-CoA还原酶(醇形成)，5羟基-2-氧代戊酸脱羧酶，或5-羟基-2-氧代戊酸脱氢酶(脱羧)(参见实施例VIII和表20)。

本发明另外提供用于生产BDO的方法，包括培养具有BDO途径的非天然存在的微生物体，该途径包括编码在一定条件下以足够量表达而生产BDO并且表达足够的时间以产生BDO的BDO途径酶的至少一种外源核酸，所述BDO途径包括谷氨酸CoA移转酶，谷氨酰基-CoA水解酶，谷氨酰基-CoA连接酶，谷氨酸5-激酶，谷氨酸-5-半醛脱氢酶(磷酸化)，谷氨酰基-CoA还原酶，谷氨酸-5-半醛还原酶，谷氨酰基-CoA还原酶(醇形成)，2-氨基-5-羟基戊酸氧化还原酶(去氨基)，2-氨基-5-羟基戊酸氨基转移酶，5-羟基-2氧代戊酸脱羧酶，5-羟基-2-氧代戊酸脱氢酶(脱羧)(参见实施例IX和表21)。

本发明另外包括用于生产BDO的方法，包括培养具有BDO途径的非天然存在的微生物体，该途径包括编码在一定条件下以足够量表达而生产BDO并且表达足够的时间以产生BDO的BDO途径酶的至少一种外源核酸，所述BDO途径包括3-羟基丁酰-CoA脱氢酶，3-羟基丁酰-CoA脱水酶，乙烯基乙酰基-CoAα-异构酶或4-羟基丁酰-CoA脱水酶(参见实施例X和表22)。

还提供用于生产BDO的方法，包括培养具有BDO途径的非天然存在的微生物体，该途径包括编码在一定条件下以足够量表达而生产BDO并且表达足够的时间以产生BDO的BDO途径酶的至少一种外源核酸，所述BDO途径包括高丝氨酸脱氨酶，高丝氨酸CoA移转酶，高丝氨酸-CoA水解酶，高丝氨酸-CoA连接酶，高丝氨酸-CoA脱氨酶，4-羟基丁-2-烯酰基-CoA移转酶，4-羟基丁-2-烯酰基-CoA水解酶，4-羟基丁-2-烯酰基-CoA连接酶，4-羟基丁-2-烯酸酯还原酶，4-羟基丁酰-CoA移转酶，4-羟基丁酰-CoA水解酶，4-羟基丁酰-CoA连接酶或4-羟基丁-2-烯酰基-CoA还原酶(参见实施例XI和表23)。

本发明提供用于生产BDO的方法，包括培养具有BDO途径的非天然存在的微生物体，该途径包括编码在一定条件下以足够量表达而生产BDO并且表达足够的时间以产生BDO的BDO途径酶的至少一种外源核酸，所述BDO途径包括琥珀酰-CoA还原酶(醇形成)，4-羟基丁酰-CoA水解酶，4-羟基丁酰-CoA连接酶，4-羟基丁醛脱氢酶(磷酸化)。

所述BDO途径可另外包括琥珀酰-CoA还原酶，4-羟基丁酸脱氢酶，4-羟基丁酰-CoA移转酶，4-羟基丁酸激酶，磷酸转-4-羟基丁酰酶，4-羟基丁酰-CoA还原酶，4-羟基丁酰-CoA还原酶(醇形成)或1,4-丁二醇脱氢酶。

还提供用于生产BDO的方法，包括培养具有BDO途径的非天然存在的微生物体，该途径包括编码在一定条件下以足够量表达而生产BDO并且表达足够的时间以产生BDO的BDO途径酶的至少一种外源核酸，所述BDO途径包括谷氨酸脱氢酶，4-氨基丁酸氧化还原酶(去氨基)，4-氨基丁酸氨基转移酶，谷氨酸脱羧酶，4-羟基丁酰-CoA水解酶，4-羟基丁酰-CoA连接酶，4-羟基丁醛脱氢酶(磷酸化)。

本发明另外提供利用本文公开的遗传修饰的生物体生产所需产物的方法，其允许通过增加产物或减少不需要的副产品而提高所需产物例如BDO的生产。因此，本发明提供用于生产1,4-丁二醇(BDO)的方法，包括在一定条件下和以培养足够的时间培养本文公开的非天然存在的微生物体以生产BDO。在一实施方案中，本发明提供利用非天然存在的微生物体生产BDO的方法，所述生物体包括具有1,4-丁二醇(BDO)途径的微生物体，该途径包含编码以足够量表达以生产BDO的BDO途径酶的至少一种外源核酸。在一实施方案中，所述微生物体经遗传修饰以表达外源琥珀酰-CoA合成酶(参见实施例XII)。例如，所述琥珀酰-CoA合成酶可通过大肠杆菌sucCD基因编码。

在另一实施方案中，所述微生物体经遗传修饰以表达外源α-酮戊二酸脱羧酶(参见实施例XIII)。例如，α-酮戊二酸脱羧酶可通过牛分枝杆菌sucA基因编码。还另外的实施方案中，所述微生物体经遗传修饰以表达外源琥珀酸半醛脱氢酶和4-羟基丁酸脱氢酶并且任选地表达4-羟基丁酰-CoA/乙酰-CoA移转酶(参见实施例XIII)。例如，所述琥珀酸半醛脱氢酶(CoA-依赖性)，4-羟基丁酸脱氢酶和4-羟基丁酰-CoA/乙酰-CoA移转酶可通过牙龈卟啉单胞菌W83基因编码。另外的实施方案中，所述微生物体经遗传修饰以表达外源丁酸激酶和磷酸转丁酰酶(参见实施例XIII)。例如，所述丁酸激酶和磷酸转丁酰酶可通过丙酮丁醇梭菌bukl和ptb基因编码。

另外的实施方案中，所述微生物体经遗传修饰以破坏编码需氧呼吸控制调节系统的基因(参见实施例XV)。例如，可以破坏arcA基因。所述生物体可进一步包含破坏编码苹果酸脱氢酶的基因。另外的实施方案中，所述微生物体经遗传修饰以表达外源NADH不敏感的柠檬酸合成酶(参见实施例XV)。例如，所述NADH不敏感的柠檬酸合成酶可通过gltA，例如gltA的R163L突变体编码。在另一实施方案中，所述微生物体经遗传修饰以表达外源磷酸烯醇丙酮酸羧激酶(参见实施例XVI)。例如，所述磷酸烯醇丙酮酸羧激酶可通过流感嗜血杆菌磷酸烯醇丙酮酸羧激酶基因编码。可以理解的是同样可使用用于提高BDO生产的本文示例的菌株，进行合适的修饰以生产其他所需的产物，例如4-羟基丁酸或本文公开的其他所需的产物。

应当理解，在本发明的方法中，任意一种或更多种外源核酸可以被引入微生物体，以产生本发明的非自然存在的微生物体。核酸可以被引入，以便对微生物体赋予例如4-HB、BDO、THF或GBL生物合成途径。可选地，编码核酸可以被引入，以产生具有生物合成能力的中间微生物体，从而催化一些所需的反应，以赋予4-HB、BDO、THF或GBL生物合成能力。例如，具有4-HB生物合成途径的非自然存在的微生物体可以包含至少两种外源核酸，所述外源核酸编码期望的酶，诸如4-羟基丁酸脱氢酶和α-酮戊二酸脱羧酶的组合；4-羟基丁酸脱氢酶和CoA-非依赖性琥珀酸半醛脱氢酶的组合；4羟基丁酸脱氢酶和CoA-依赖性琥珀酸半醛脱氢酶的组合；CoA-依赖性琥珀酸半醛脱氢酶和琥珀酰-CoA合成酶的组合；琥珀酰-CoA合成酶和谷氨酸脱羧酶的组合等。因此，应当理解，生物合成途径的两种或更多种酶的任意组合可以包括在本发明的非自然存在的微生物体中。类似地，应当理解，如所期望，生物合成途径的三种或更多种酶的任意组合可以包括在本发明的非自然存在的微生物体中，例如，4-羟基丁酸脱氢酶、α-酮戊二酸脱羧酶和CoA-依赖性琥珀酸半醛脱氢酶；CoA-非依赖性琥珀酸半醛脱氢酶和琥珀酰-CoA合成酶；4-羟基丁酸脱氢酶、CoA-依赖性琥珀酸半醛脱氢酶和谷氨酸：琥珀酸半醛转氨酶，等，只要期望的生物合成途径的酶的组合导致相应的期望产物产生。

类似地，例如，就任意一种或更多种被引入以赋予BDO生产的外源核酸而言，具有BDO生物合成途径的非自然存在的微生物体可以包含至少两种编码期望酶的外源核酸，所述酶诸如4-羟基丁酸脱氢酶和α-酮戊二酸脱羧酶的组合；4-羟基丁酸脱氢酶和4-羟基丁酰CoA：乙酰-CoA转移酶的组合；4-羟基丁酸脱氢酶和丁酸激酶的组合；4-羟基丁酸脱氢酶和磷酸转丁酰酶的组合；4-羟基丁酰CoA：乙酰-CoA转移酶和醛脱氢酶的组合；4-羟基丁酰CoA：乙酰-CoA转移酶和醇脱氢酶的组合；4-羟基丁酰CoA：乙酰-CoA转移酶和醛/醇脱氢酶；4-氨基丁酸激酶和4-氨基丁-l-醇氧化还原酶(去氨基)的组合等。因此，应当理解，生物合成途径的两种或更多种酶的任意组合可以包括在本发明的非自然存在的微生物体中。类似地，应当理解，生物合成途径的三种或更多种酶的任意组合可以包含在本发明的非自然存在的微生物体中，例如，4-羟基丁酸脱氢酶、α-酮戊二酸脱羧酶和4-羟基丁酰CoA：乙酰-CoA转移酶；4-羟基丁酸脱氢酶、丁酸激酶和磷酸转丁酰酶；4-羟基丁酸脱氢酶、4-羟基丁酰CoA：乙酰-CoA转移酶和醛脱氢酶；4-羟基丁酰CoA：乙酰-CoA转移酶、醛脱氢酶和醇脱氢酶；丁酸激酶、磷酸转丁酰酶和醛/醇脱氢酶；4-氨基丁酰-CoA水解酶，4-氨基丁酰-CoA还原酶和4-氨基丁-l-醇氨基转移酶；3-羟基丁酰-CoA脱氢酶，3-羟基丁酰-CoA脱水酶和4-羟基丁酰-CoA脱水酶等。类似地，如所期望的，本文公开的生物合成途径的四种、五种或更多种酶的任意组合可以包含在本发明的非自然存在的微生物体中，只要期望的生物合成途径酶的组合引起相应的期望产物产生。

先前描述的非自然存在的微生物体的任一种可以被培养以产生和/或分泌本发明的生物合成产物。例如，4-HB生产者可以被培养用以生物合成产生4-HB。4-HB可以如下所述被分离或处理，以产生GBL、THF和/或BDO。类似地，BDO生产者可以被培养用以生物合成产生BDO。BDO可以被分离或经进一步处理，用于化学合成如本文公开的BDO家族化合物。

生长培养基例如可以是能够向非自然存在的微生物提供碳源的任意碳水化合物来源。这类来源包括例如糖，诸如葡萄糖、木糖、阿拉伯糖、半乳糖、甘露糖、果糖和淀粉。其它碳水化合物来源包括，例如，可再生的原料和生物质。在本发明的方法中可以用作原料的生物质的示例性种类包括纤维素生物质、半纤维素生物质和木质素原料或部分原料。这些生物质原料包含，例如，用作碳源的碳水化合物底物，诸如葡萄糖、木糖、阿拉伯糖、半乳糖、甘露糖、果糖和淀粉。在本文提供的教导和指导下，本领域技术人员将理解，除上述示例的那些之外的可再生原料和生物质也可以用于培养本发明的微生物体，以产生本发明的4-HB或BDO和其它化合物。

因此，在本文提供的教导和指导下，本领域技术人员将理解，当在诸如碳水化合物的碳源上生长时，非自然存在的微生物体可以被产生，其分泌本发明的生物合成的化合物。这些化合物包括，例如，4-HB、BDO和在4-HB途径、BDO途径和/或组合的4-HB和BDO途径中的任意中间代谢物。所需要的全部即是改造一种或更多种图1中显示的酶活性，以实现期望化合物或中间体的生物合成，这包括例如引入4-HB和/或BDO生物合成途径的一些或全部。因此，本发明提供非自然存在的微生物体，其当在碳水化合物上生长时分泌4-HB，当在碳水化合物上生长时分泌BDO，和/或当在碳水化合物上生长时分泌图1中显示的任意中间代谢物。本发明的产生BDO的微生物体可以从例如琥珀酸、琥珀酰-CoA、α-酮戊二酸、琥珀酸半醛、4-HB、4-羟基丁酰磷酸、4-羟基丁酰-CoA(4-HB-CoA)和/或4-羟基丁醛开始合成。

在一些实施方式中，培养条件包括厌氧或基本上厌氧的生长或维持条件。示例性的厌氧条件先前已经进行了描述并且其在本领域是熟知的。用于发酵过程的示例性厌氧条件在下面的实施例中进行描述。所有这些条件以及本领域熟知的其它厌氧条件都可以用于非自然存在的微生物体。在这些厌氧的条件下，4-HB和BDO生产者可以分别合成单体4-HB和BDO，其胞内浓度为5-10mM或更高以及先前示例的所有其它浓度。

对于本发明的产生4-HB和BDO的非自然存在的微生物体而言，也可以产生许多下游化合物。对于本发明的产生4-HB的微生物体，单体4-HB和GBL以平衡状态存在于培养基中。4-HB向GBL的转化可以通过例如将微生物体在酸性pH培养基中培养而有效地完成。小于或等于7.5的pH，特别是处于或低于5.5的pH，自发地将4-HB转化成GBL。

使用本领域中熟知的各种方法，可以将所产生的GBL与4-HB和培养物中的其它组分分离。这些分离方法包括例如在实施例中示例的萃取方法以及包括连续液-液萃取、全蒸发、膜式过滤、膜分离、反渗透、电渗析、蒸馏、结晶、离心、萃取过滤、离子交换色谱、空间排阻色谱、吸附色谱和超滤的方法。所有上述方法在本领域中都是熟知的。分离的GBL可以通过例如蒸馏进行进一步纯化。

可以由本发明的产生4-HB的非自然存在的微生物体产生的另一个下游化合物包括例如BDO。该化合物可以通过例如GBL的化学氢化来合成。化学氢化反应在本领域是熟知的。一个示例性的方法包括将4-HB和/或GBL或源自培养物的这两种组分的混合物化学还原以产生1,4-丁二醇，其使用多相或均相氢化催化剂和氢，或化学计量或催化使用的氢化物基还原剂进行。

在本领域熟知的其它方法可同样应用于上述化学反应，并且其包括例如WO第82/03854号(Bradley等)，其描述了在氧化铜和氧化锌催化剂上在蒸汽相中的γ-丁内酯的氢解。英国专利第1，230，276号描述了使用氧化铜-氧化铬催化剂使γ-丁内酯氢化。氢化在液相中进行。也示例了具有高的总反应器压力的间歇式反应。反应器中反应物和产物分压完全在各自的露点以上。英国专利第1，314，126号描述了在镍-钴-钍氧化物催化剂上在液相中的γ-丁内酯的氢化。间歇式反应被示例，其具有高的总压力并且组分分压完全在各组分的露点以上。英国专利第1，344，557号描述了在氧化铜-氧化铬催化剂上在液相中的γ-丁内酯的氢化。汽相或含有蒸汽的混合相显示在一些情况中适用。示例了使用高的总反应器压力的连续流动管状反应器。英国专利第1，512，751号描述了在氧化铜-氧化铬催化剂上在液相中γ-丁内酯氢化为1,4-丁二醇。具有高的总反应器压力的间歇式反应被示例，并且在可测定的情况下，反应物和产物分压完全在各自的露点以上。美国专利第4，301，077号描述了在Ru-Ni-Co-Zn催化剂上γ-丁内酯氢化成1,4-丁二醇。该反应可以在液相或气相中或在混合的液-气相中进行。示例了在高的总反应器压力和相对低的反应器产率下的连续流动的液相反应。美国专利第4，048，196号描述了通过在氧化铜-氧化锌催化剂上液相氢化γ-丁内酯而产生1,4-丁二醇。进一步示例了在高的总反应器压力和高的反应物和产物分压下操作的连续流动管状反应器。以及美国专利第4，652，685号描述了内酯氢化成乙二醇。

可以由本发明的产4-HB微生物体产生的另外的下游化合物包括例如THF。该化合物可以通过例如GBL的化学氢化来合成。适于将GBL转化成THF的本领域熟知的一个示例性的方法包括，例如，将4-HB和/或GBL或源自培养物的这两个组分的混合物化学还原以产生四氢呋喃，其使用多相或均相氢化催化剂和氢，或化学计量或催化使用的氢化物基还原剂进行。在本领路熟知的其它方法同样适用于上述化学反应并且包括例如美国专利第6，686，310号，其描述了高表面积溶胶-凝胶路线制备的氢化催化剂。也描述了将马来酸还原成四氢呋喃(THF)和1,4-丁二醇(BDO)以及将γ-丁内酯还原成四氢呋喃和1,4-丁二醇的方法。

培养条件可以包括例如液体培养方法以及发酵和其它大规模培养方法。如下面的实施例中进一步所述，具体地，本发明的生物合成产物的特别有用的收率可以在厌氧或基本上厌氧的培养条件下获得。

可利用熟知的方法完成合适的纯化和/或测定以检测4-HB或BDO的生产。可对每种改造的菌株培养合适的重复诸如三次重复培养用以检测。例如，可在设计的生产宿主中监测产物和副产品的形成。最终产物和中间体以及其他有机化合物可通过利用本领域熟知的常规流程的方法分析，诸如HPLC(高效液相色谱法)，GC-MS(气相色谱分析-质谱分析)和LC-MS(液相色谱法-质谱分析)或其他合适的分析方法。还可以用培养上清液检测发酵液中产物的释放。副产品和残留的葡萄糖可通过利用例如用于葡萄糖和醇的折射指数检测器和用于有机酸类的UV检测器的HPLC，或其他本领域熟知的合适的测定法和检测方法定量(Lin等，Biotechnol.Bioeng.90：775-779(2005))。还可利用本领域熟知的方法测定来自外源DNA序列的单一酶或蛋白质活性。

4-HB或BDO产物可利用本领域熟知的多种方法与培养物中的其他组分分离。所述分离方法包括，例如萃取方法以及包括连续液-液萃取、全蒸发、膜式过滤、膜分离、反渗透、电渗析、蒸馏、结晶、离心、萃取过滤、离子交换色谱、空间排阻色谱、吸附色谱和超滤的方法。上述所有方法为本领域所熟知。

本发明进一步提供制造4-HB的方法。该方法包括使具有4-羟基丁酸(4-HB)生物合成途径的、非自然存在的微生物体在基本上厌氧的条件下发酵足够的时间以产生单体4-羟基丁酸(4-HB)，该途径包含至少一种外源核酸，其编码4-羟基丁酸脱氢酶、CoA-非依赖性琥珀酸半醛脱氢酶、琥珀酰-CoA合成酶、CoA-依赖性琥珀酸半醛脱氢酶、谷氨酸：琥珀酸半醛转氨酶、α-酮戊二酸脱羧酶或谷氨酸脱羧酶，该方法包括补料分批发酵和分批分离；补料分批发酵和连续分离，或连续发酵和连续分离。

上述培养和化学氢化也可以扩大规模并连续生长以生产4-HB、GBL、BDO和/或THF。示例性的生长方法包括，例如，补料分批发酵和分批分离；补料分批发酵和连续分离；或连续发酵和连续分离。所有这些方法在本领域都是熟知的。使用4-HB生产者允许同时进行4-HB生物合成和化学转化成GBL、BDO和/或THF，采用上述氢化方法同时使用连续培养方法诸如发酵进行。其它氢化方法在本领域也是熟知的并且可以同样用于本发明的方法。

发酵方法对于生物合成生产商业数量的4-HB和/或BDO特别有用。一般而言，如同非连续培养方法，连续和/或接近连续生产4-HB或BDO包括将本发明的非自然存在的产生4-HB或BDO的生物在充足的养分和培养基中培养，以维持和/或接近维持指数期的生长。在这些条件下的连续培养可以包括例如1天、2天、3天、4天、5天、6天或7天或更多。

另外，连续培养可以包括1周、2周、3周、4周或5周或更多周以及直至数月。可选地，如果适合具体应用，本发明的生物可以培养数小时。应当理解，连续的和/或接近连续的培养条件还可以包括在这些示例性时期之间的所有时间间隔。可进一步理解的是培养本发明微生物体的时间为生产足够量期望目的的产物的足够时间。

发酵方法在本领域中是熟知的。简言之，用于生物合成产生本发明的4-HB、BDO或其它4-HB衍生产物的发酵可以用于例如补料分批发酵和分批分离；补料分批发酵和连续分离，或连续发酵和连续分离。本领域中熟知的分批和连续发酵方法的实例在下面的实施例中进一步示例。

除了使用本发明的4-HB或BDO生产者用以分别连续生产大量的单体4-HB和BDO的上述发酵方法之外，4-HB生产者例如也可以同时经历如先前所述将单体4-HB化学转化成例如GBL、BDO和/或THF的化学合成方法。BDO生产者例如类似地也可以同时经历如先前所述将BDO化学转化成例如THF、GBL、吡咯烷酮和/或其它BDO家族化合物的化学合成方法。另外，4-HB和BDO生产者的产物可以从发酵培养物中分离并且继续进行化学转化，如本文所公开。

简言之，在发酵培养液中可以如Frost等，Biotechnology Progress 18：201-211(2002)所述完成GBL的氢化。在发酵期间氢化的另一个方法包括例如在例如美国专利第5,478,952号中描述的方法。该方法在下面的实施例中进一步示例。

因此，本发明另外提供生产γ-丁内酯(GBL)、四氢呋喃(THF)或1,4-丁二醇(BDO)的方法。所述方法包括在基本上厌氧的条件下将非自然存在的微生物体发酵足够的时间以产生1,4-丁二醇(BDO)、GBL或THF，所述生物体具有4-羟基丁酸(4-HB)和/或1,4-丁二醇(BDO)生物合成途径，该途径包含至少一种外源核酸，其编码4-羟基丁酸脱氢酶、CoA-非依赖性琥珀酸半醛脱氢酶、琥珀酰-CoA合成酶、CoA-依赖性琥珀酸半醛脱氢酶、4-羟基丁酸：CoA转移酶、谷氨酸：琥珀酸半醛转氨酶、α-酮戊二酸脱羧酶、谷氨酸脱羧酶、4-羟基丁酸激酶、磷酸转丁酰酶、CoA-非依赖性1,4-丁二醇半醛脱氢酶、CoA-依赖性1,4-丁二醇半醛脱氢酶、CoA-非依赖性1,4-丁二醇醇脱氢酶或CoA-依赖性1,4-丁二醇醇脱氢酶，所述发酵包括补料分批发酵和分批分离；补料分批发酵和连续分离，或连续发酵和连续分离。

除本文所述的本发明的4-HB、BDO和其它产物的生物合成之外，本发明的非自然存在的微生物体和方法也可以彼此以各种组合来使用以及与本领域熟知的其它微生物体和方法的各种组合来使用，以通过其它路线实现产物生物合成。例如，除使用4-HB生产者和化学步骤之外或除直接使用BDO生产者之外，一种产生BDO的可选方法是添加另一种微生物体，其能够将本文示例的4-HB或4-HB产物转化成BDO。

一种这样的方法包括例如将本发明的产生4-HB的微生物体发酵以产生4-HB，如上面和下面所述。4-HB然后可以用作第二微生物体的底物，该第二微生物体将4-HB转化成例如BDO、GBL和/或THF。4-HB可以被直接加入至第二生物体的另一培养物，或4-HB生产者的原始培养物可以通过例如细胞分离而除去这些微生物体，然后将第二生物体接着添加至发酵培养液可以用于产生终产物，无需中间纯化步骤。一种能够利用4-HB作为底物生物化学转化成BDO的示例性第二生物体例如是丙酮丁醇梭菌(参见例如，Jewell等，CurrentMicrobiology，13：215-19(1986))。

在其它实施方式中，本发明的非自然存在的微生物体和方法可以以许多种亚途径(subpathway)组合，以实现例如所述的4-HB和/或BDO的生物合成。在这些实施方式中，本发明的期望产物的生物合成途径可以分离到不同的微生物体中，并且不同的微生物体可以共同培养以产生终产物。在这种生物合成方案中，一种微生物体的产物是第二微生物体的底物，直至合成终产物。例如，BDO的生物合成可以如先前所述通过构建微生物体完成，该微生物体包含将底物诸如内源性琥珀酸通过4-HB转化成终产物BDO的生物合成途径。可选地，BDO也可以在同一容器中使用两种生物通过共同培养或共同发酵由微生物体生物合成产生。第一微生物体是4-HB生产者，其具有从琥珀酸产生4-HB的基因，以及第二微生物体是BDO生产者，其具有将4-HB转化成BDO的基因。

在本文提供的教导和指导下，本领域的技术人员应当理解，对于本发明的非自然存在的微生物体和方法以及其它微生物体、其它具有亚途径的非自然存在的微生物体的共同培养物以及本领域中熟知的其它化学和/或生物化学方法的组合，存在许多种组合和变换，以产生本发明的4-HB、BDO、GBL和THF产物。

为了产生更好的生产者，可利用代谢模型优化生长条件。模型还可以用于设计另外优化所述途径的应用的基因敲除(参见，例如美国专利公开US 2002/0012939，US 2003/0224363，US 2004/0029149，US 2004/0072723，US 2003/0059792，US 2002/0168654和US2004/0009466，以及美国专利号7,127,379)。模拟分析允许获得对将新陈代谢朝着更有效生产BDO的方向改变的细胞培养的可靠的结果预测。

一种用于鉴定和设计有助于产物生物合成的代谢变化的计算方法是OptKnock计算框架，Burgard等，Biotechnol Bioeng，84：647-57(2003)。OptKnock是一种提出基因缺失策略的代谢模型化和模拟程序，该基因缺失策略产生遗传稳定的微生物，所述微生物大量产生目标产物。具体而言，该框架检查微生物的完整代谢和/或生物化学网络，以提出迫使期望的生物化学变成细胞生长的专性副产物的基因操作。通过将生物化学生产与细胞生长经由策略性设置的基因缺失或其它功能性基因破坏偶联，在生物反应器中经历长时间之后，施加给改造菌株的生长选择压力，作为强迫性生长相关的生物化学生产的结果，引起性能的改进。最后，当构建基因缺失时，设计的菌株恢复到它们的野生型状态的可能性很微小，这是因为通过OptKnock选择的基因被完全从基因组除去。因此，该计算方法可以用于鉴定引起所需产物生物合成的可选途径，或与非自然存在的微生物体结合使用，用以进一步优化所需产物的生物合成。

简言之，OptKnock是在本文用于指模拟细胞代谢的计算方法和系统的术语。OptKnock程序涉及模型框架和方法，所述方法将具体的约束引入通量平衡分析(FBA)模型中。这些约束包括，例如，定性动力学信息、定性调控信息和/或DNA微阵列实验数据。OptKnock也计算各种代谢问题的解，其通过例如紧缩(tightening)由通量平衡模型产生的通量边界(flux boundary)以及随后在存在基因加成或缺失的情况下探究代谢网络的性能极限。OptKnock计算框架允许构建模型公式，该公式能够有效查询代谢网络的性能极限并且提供解决所产生的混合整数线性规划问题的方法。本文称为OptKnock的代谢模型化和模拟方法描述在例如2002年1月10日提交的美国公开2002/0168654，2002年1月10日提交的国际专利号PCT/US02/00660和2007年8月10日提交的美国专利申请序列号11/891,602中。

鉴定和设计促成产物的生物合成产生的代谢变化的另一计算方法是称为

的代谢模型化和模拟系统。该计算方法和系统描述在例如2002年6月14日提交的美国公开2003/0233218和2003年6月13日提交的国际专利申请No.PCT/US03/18838中。

是一种计算系统，其可以用于产生在计算机芯片上的网络模型和模拟经过生物系统的化学反应的质量、能量或电荷通量，以限定包含该系统中化学反应的任意和全部可能功能性的解空间，从而确定该生物系统的允许活性范围。该方法被称为基于约束的模拟，这是因为解空间由约束限定，所述约束诸如所包含反应的已知化学计量学以及与通过反应的最大通量相关的反应热力学和容量约束。由这些约束限定的空间可以被询问以确定生物系统或其生物化学组分的表型性能和行为。

这些计算方法与生物事实一致，这是因为生物系统是灵活的并且可以以许多不同的方式达到相同的结果。通过进化机理设计生物系统，该进化机理受所有生命系统必须面对的基础约束制约。因此，基于约束的模拟策略包含这些一般事实。进一步，通过紧缩约束对网络模型连续施加更多限制的能力引起解空间大小减小，从而提高用于预测生理学性能或表型的精确性。

在本文提供的教导和指导下，本领域技术人员能够应用代谢模型化和模拟的各种计算框架，以设计和实施宿主微生物体中所需化合物的生物合成。这些代谢模型化和模拟方法包括例如上述示例的

和OptKnock计算系统。为了说明本发明，本文参考OptKnock模型化和模拟计算框架描述了一些方法。本领域技术人员知道如何使用OptKnock将代谢变化的鉴定、设计和实施应用于本领域中熟知的任何此类其它的代谢模型化和模拟计算框架和方法。

上述方法将提供一组破坏的代谢反应。在该组中的每个反应或代谢修饰的消除可以在生物体的生长期产生所需产物作为专性产物。因为反应是已知的，双层OptKnock问题的解也会提供编码一种或多种酶的相关基因或多种基因，所述酶催化该组反应中的每个反应。对该组反应和其相应的编码参与每个反应的酶的基因的鉴定通常是一个自动的过程，通过关联反应与具有酶和编码基因之间关系的反应数据库来完成。

一旦鉴定，待被破坏以实现所需产物生产的反应组在目标细胞或者生物中通过至少一种编码该组中的每一代谢反应的基因的功能破坏来实施。一种实现反应组功能破坏的特别有用的方法是通过每个编码基因的缺失。然而，在一些情况下，通过其它遗传畸变--例如包括诸如启动子或者调节因子的顺式结合部位的调节区的突变、缺失，或者通过在多个位置的任一处截短编码序列可以有利于破坏反应。例如当期望快速评估琥珀酸连接时，或者当遗传回复突变(genetic reversion)较不可能出现时，这些后面的畸变--产生小于基因组全部缺失--可以是有用的。

为了确定上述双层OptKnock问题的另外多产的解--其导致了更多破坏反应组或者代谢修饰，所述反应组或代谢修饰可引起包括所需产物的生长相关生物合成在内的生物合成，可以实施被称为整数切割(integer cuts)的最优化方法。通过迭代求解上面示例的OptKnock问题，在每一次迭代引入被称为整数切割的另外约束，进行该方法。整数切割约束有效地防止求解过程选择在任意先前迭代所鉴定(确定)的完全相同的反应组，该反应组专性连接产物生物合成与生长。例如，如果先前确定的生长相关的代谢修饰指定反应1、2和3用于破坏，那么随后的约束防止相同的反应同时在随后的解中被考虑。整数切割方法在本领域是熟知的，并且可以发现描述于例如Burgard等，Biotechnol Prog，17：791-797(2001)中。如同本文描述的所有方法参考其与OptKnock代谢模型化和模拟的计算框架结合使用，在迭代计算分析中减少冗余的整数切割方法也可以与本领域熟知的其它计算框架一起应用，所述计算框架包括例如

以上示例的方法使得能够构建进行生物合成生产的细胞和生物，包括目标生物化学产物与被改造以含有已鉴定遗传变化的细胞或生物生长的专性偶联生产。因此，本文描述的计算方法能够进行代谢修饰的鉴定和实施，该代谢修饰通过利用选自OptKnock或

的计算机方法来鉴定。代谢修饰组可以包括例如一种或者多种生物合成途径酶的添加和/或一种或者多种代谢反应的功能破坏，其包括例如通过基因缺失的破坏。

如上文所讨论，OptKnock方法的开发是基于突变型微生物网络当经历长期生长选择时可朝向其以计算机预测的最大生长表型进化这一前提。换句话说，所述方法调节生物体在选择性压力下自我优化的能力。OptKnock框架允许对基于网络化学计量迫使生物化学生产与细胞生长偶联的基因缺失组合进行穷举。对于最佳基因/反应剔除的鉴别需要对双层优化问题求解，所述问题选择活性反应组，使得所得网络的最佳生长答案过量产生目的生物化学物(Burgard等，Biotechnol.Bioeng.84：647-657(2003))。

大肠杆菌代谢的硅中化学计量模型可用于鉴别先前示例的代谢途径的必需基因，且描述于例如美国专利公开US2002/0012939、US2003/0224363、US2004/0029149、US2004/0072723、US2003/0059792、US2002/0168654和US2004/0009466，以及美国专利号7,127,379中。如本文所公开，OptKnock数学框架可用于定位导致期望产物的生长偶联型生产的基因缺失。此外，双层OptKnock问题的解决方案仅提供一组缺失。为了列举所有有意义的解决方案、即导致生长偶联型生产形成的所有剔除集合，可实施被称作整数切割的优化技术。这要求对OptKnock问题迭代求解，其中在每次迭代时引入被称为整数切割的另外约束，如上文所讨论。

以上示例且在以下实施例中进一步举例说明的方法使得能够构建进行生物合成生产的细胞和生物，包括目标生物化学产物与被改造以含有已鉴定遗传变化的细胞或生物生长的专性偶联生产。在这点上，已经鉴定了引起4-HB和1,4-丁二醇生物合成的代谢改变。同未修饰的微生物体相比较，用已鉴定的代谢变化构建的微生物菌株产生了提高水平的4-HB或BDO。这些菌株可以有利地用于商业生成4-HB、BDO、THF和GBL，例如，以连续发酵过程，而无需经历阴性选择压力。

因此，本文描述的计算方法能够进行代谢修饰的鉴定和实施，该代谢修饰通过利用选自OptKnock或

的使能够机方法来鉴定。代谢修饰组可以包括例如一种或者多种生物合成途径酶的添加和/或一种或者多种代谢反应的功能破坏，其包括例如通过基因缺失的破坏。

应当理解，基本上不影响本发明各种实施方式的活性的修改也包括在本文提供的本发明的定义中。因此，以下实施例是用来举例说明而不是限制本发明。

先前描述的非自然存在的微生物体的任一种可以被培养以产生和/或分泌本发明的生物合成产物。例如，BDO生产者可以被培养用以生物合成产生BDO。

为了产生BDO，在具有碳源以及其它必需营养物培养基中培养重组菌株。非常需要在发酵罐中维持厌氧条件以降低全过程的成本。所述条件可例如通过首先用氮气喷射培养基，然后用隔膜和螺旋盖密封烧瓶来获得。对于在厌氧条件下未观察到生长的菌株，可通过在隔膜上打出用于有限通气的小孔来应用微氧条件。示例性的厌氧条件先前已有描述且为本领域所熟知。例如2007年8月10日提交的美国专利申请2009/0047719描述了示例性需氧和厌氧条件。发酵可如本文所公开以分批、补料分批或连续方式进行。

必要时，可通过根据需要添加碱(例如NaOH或其它碱)或酸使培养基维持在所需pH下而使培养基的pH维持在期望pH，尤其中性pH，例如约7的pH。生长速率可通过使用分光光度计(600nm)测量光学密度来测定，且葡萄糖摄取速率可通过监测碳源随时间的消耗来测定。

除了诸如以上举例说明的那些可再生原料外，本发明生产BDO的微生物体还可经修饰用于在作为其碳源的合成气上培养。该具体的实施方案中，生产BDO的生物体中表达一种或多种蛋白质或酶以提供用于合成气或其他气体碳源应用的代谢途径。

合成气体，亦称合成气或炉煤气，为煤和含碳材料诸如生物质材料，包括农作物和残渣的主要气化产物。合成气是主要由H ₂和CO组成的混合物，可经由气化任何有机进料，包括但不限于煤、煤油、天然气、生物质或有机废物来获得。气化通常在高的燃料和氧气比率下进行。

虽然合成气主要是H₂和CO，但也可包含少量的CO₂和其它气体。因此合成气提供一种节省成本的气态碳源，例如CO和另外如CO₂。

Wood-Ljungdahl途径催化CO和H₂转化为乙酰-CoA和其它产物，例如乙酸。能利用CO和合成气的生物体一般也具有经由Wood-Ljungdahl途径所涵盖的相同的一组基础酶和转化作用利用CO₂和CO₂/H₂混合物的能力。微生物依赖于H₂将CO₂转化为乙酸早在CO也可被相同的微生物利用且涉及相同的途径揭示之前已被公认。已显示许多产乙酸菌可在CO₂存在下生长且产生例如乙酸等化合物，只要存在氢以便供应必需的还原当量即可(参见例如Drake，Acetogenesis，pp.3-60，Chapman and Hall，New York，(1994))。这可由以下等式概括：

2CO₂+4H₂+nADP+nPi→CH₃COOH+2H₂O+nATP

因此，具有Wood-Ljungdahl途径的非天然存在的微生物也可利用CO₂与H₂的混合物来产生乙酰-CoA和其它期望产物。

Wood-Ljungdahl途径在本领域中为人所熟知，且由可分为2个分支的12个反应组成：(1)甲基分支和(2)羰基分支。甲基分支将合成气转化为甲基四氢叶酸(甲基-THF)，而羰基分支则将甲基-THF转化为乙酰-CoA。甲基分支中的反应是由以下酶或蛋白质依次催化：铁氧还蛋白氧化还原酶、甲酸脱氢酶、甲酰四氢叶酸合成酶、次甲基四氢叶酸环化脱水酶、亚甲基四氢叶酸脱氢酶和亚甲基四氢叶酸还原酶。羰基分支中的反应是由以下酶或蛋白质依次催化：甲基四氢叶酸：类咕啉蛋白甲基转移酶(例如AcsE)、类咕啉铁硫蛋白、镍蛋白装配蛋白(例如AcsF)、铁氧还蛋白、乙酰-CoA合成酶、一氧化碳脱氢酶和镍蛋白装配蛋白(例如CooC)。按照本文提供的关于引入足够数量的编码核酸以便产生乙酰-CoA途径方面的教导和指导，所属领域技术人员将了解，也可实施同样的工程设计导入宿主生物体中没有的编码Wood-Ljungdahl酶或蛋白质的核酸。因此，将一种或多种编码核酸引入本发明的微生物体中，以致经修饰的生物体含有一个分支或完全Wood-Ljungdahl途径，这会赋予合成气利用能力。

因此，在本文提供的教导和指导下，本领域技术人员将理解，当在诸如碳水化合物的碳源上生长时，非自然存在的微生物体可以被产生，其分泌本发明的生物合成的化合物。所述化合物包括，例如BDO和BDO途径中的任何中间代谢物。所需要的全部即是改造一种或更多种所需要的酶或蛋白质活性，以实现期望化合物或中间体的生物合成，这包括例如引入BDO生物合成途径的一些或全部。因此，本发明提供非天然存在的微生物体，其当在碳水化合物或其他碳源上生长时产生和/或分泌BDO，当在碳水化合物或其他碳源上生长时产生和/或分泌BDO途径中呈现的任意中间代谢物。如本文公开的，本发明产生BDO的微生物体可起始BDO途径中来自中间体的合成。

为了产生更好的生产者，可利用代谢模型优化生长条件。

模型还可以用于设计另外优化所述途径的应用的基因敲除(参见，例如美国专利公开US 2002/0012939，US 2003/0224363，US 2004/0029149，US 2004/0072723，US 2003/0059792，US 2002/0168654和US 2004/0009466，以及美国专利No.7，127，379)。模拟分析允许获得对将新陈代谢朝着更有效生产BDO的方向改变的细胞培养的可靠的结果预测。

的代谢模型化和模拟系统。该计算方法和系统描述在例如2002年6月14日提交的美国公开2003/0233218和2003年6月13日提交的国际专利申请号PCT/US03/18838中。

这些计算方法与生物事实一致，这是因为生物系统是灵活的并且可以以许多不同的方式达到相同的结果。通过进化机理设计生物生物系统，该进化机理受所有生命系统必须面对的基础约束制约。因此，基于约束的模拟策略包含这些一般事实。进一步，通过紧缩约束对网络模型连续施加更多限制的能力引起解空间大小减小，从而提高用于预测生理学性能或表型的精确性。

上述方法将提供一组破坏的代谢反应。在该组中的每个反应或代谢修饰的消除可以在生物体的生长期产生所需产物作为专性产物。因为反应是已知的，双层OptKnock问题的解也会提供编码一种或多种酶的相关基因或多种基因，所述酶催化该组反应中的每个反应。对该组反应和其相应编码参与每个反应的酶的基因鉴定通常是一个自动的过程，通过关联反应与具有酶和编码基因之间关系的反应数据库来完成。

如上文所讨论，OptKnock方法的开发是基于突变型微生物网络当经历长期生长选择时可朝向其以计算机预测的最大生长表型进化这一前提。换句话说，所述方法调节生物体在选择性压力下自我优化的能力。OptKnock框架允许对基于网络化学计量迫使生物化学生产与细胞生长偶联的基因缺失组合进行穷举。对于最佳基因/反应剔除的鉴别需要对二层优化问题求解，所述问题选择活性反应组，使得所得网络的最佳生长答案过量产生目的生物化学物(Burgard等，Biotechnol.Bioeng.84：647-657(2003))。

大肠杆菌代谢的硅中化学计量模型可用于鉴别先前示例的代谢途径的必需基因，且描述于例如美国专利公开US2002/0012939、US2003/0224363、US2004/0029149、US2004/0072723、US2003/0059792、US2002/0168654和US2004/0009466，以及美国专利号7，127，379中。如本文所公开，OptKnock数学框架可用于定位导致期望产物的生长偶联型生产的基因缺失。此外，双层OptKnock问题的解决方案仅提供一组缺失。为了列举所有有意义的解决方案、即导致生长偶联型生产形成的所有剔除集合，可实施被称作整数分割的优化技术。这要求对OptKnock问题迭代求解，其中在每次迭代时引入被称为整数切割的另外约束，如上文所讨论。

实施例I

4-羟基丁酸的生物合成

该实施例描述了4-HB生产的示例性生物化学途径。

在微生物中4-HB合成的先前报道集中在该化合物作为在生物可降解塑料聚羟链烷酸酯(PHA)(美国专利号6,117,658)生产中的中间体。超过聚3-羟基丁酸聚合物(PHB)的4-HB/3-HB共聚物的应用可以产生脆性较小的塑料(Saito and Doi，Intl.J.Biol.Macromol.16：99-104(1994))。本文描述的单体4-HB生产由于以下数个原因是根本不同的过程：(1)产物被分泌，这与PHA相反，PHA胞内产生并保留在细胞中；(2)对于产生羟基丁酸聚合物的生物而言，没有产生游离的4-HB，相反，辅酶A衍生物为聚羟链烷酸酯合成酶所用；(3)在聚合物的情况下，颗粒状产物的形成改变了热力学；和(4)胞外pH对于聚合物的产生不是问题，然而它会影响4-HB是以游离酸存在还是以结合碱的状态存在，并且同时影响了4-HB和GBL之间的平衡。

4-HB可以在两个酶还原步骤中从琥珀酸产生，琥珀酸是TCA循环的中心代谢物，其中琥珀酸半醛作为中间体(图1)。这些酶中的第一种，酶琥珀酸半醛脱氢酶，在包括大肠杆菌在内的多种生物中是天然的，在大肠杆菌中已经发现了NADH-和NADPH-依赖性酶(Donnelly and Cooper，Eur.J.Biochem.113：555-561(1981)；Donnelly and Cooper，J.Bacteriol.145：1425-1427(1981)；Marek and Henson，J.Bacteriol.170：991-994(1988))。也有证据支持在酿酒酵母(S.cerevisiae)中的琥珀酸半醛脱氢酶活性(Ramos等，Eur.J.Biochem.149：401-404(1985))，并且推定基因通过序列同源性已经鉴定。然而，大部分报告指出该酶在琥珀酸合成的方向进行，如在图1中显示(Donnelly and Cooper，同上；Lutke-Eversloh and Steinbuchel，FEMS Microbiol.Lett.181：63-71(1999))，其参与4-HB和γ-氨基丁酸的降解途径。

琥珀酸半醛同时由某些微生物体如大肠杆菌通过TCA循环中间体α-酮戊二酸经过两种酶--谷氨酸：琥珀酸半醛转氨酶和谷氨酸脱羧酶--的作用自然产生。专性厌氧菌克氏梭状芽胞杆菌所用的降解琥珀酸的可选途径将琥珀酸活化为琥珀酰-CoA，然后使用已知在该方向起作用的可选的琥珀酸半醛脱氢酶，将琥珀酰-CoA转化为琥珀酸半醛(Sohling andGottschalk，Eur.J.Biochem.212：121-127(1993))。然而，该路径具有将琥珀酸转化为琥珀酰-CoA所需的ATP能量损失。

该途径的第二种酶--4-羟基丁酸脱氢酶--不是大肠杆菌或者酵母天然的，但是可见于各种不同的细菌中，如克氏梭状芽胞杆菌和富养罗尔斯通氏菌(Ralstonia eutropha)(Lutke-Eversloh和Steinbuchel，同上；Sohling和Gottschalk，J.Bacteriol.178：871-880(1996)；Valentin等，Eur.J.Biochem.227：43-60(1995)；Wolff和Kenealy，proteinExpr.Purif.6：206-212(1995))。已知这些酶是NADH-依赖性的，虽然NADPH-依赖性形式也存在。从α-酮戊二酸到4-HB的另外途径在大肠杆菌中予以证实，其引起聚(4-羟基丁酸)聚积(Song等，Wei Sheng Wu Xue.Bao.45：382-386(2005))。重组菌株需要三种异源基因--PHA合成酶(富养罗尔斯通氏菌(R.eutropha))、4-羟基丁酸脱氢酶(富养罗尔斯通氏菌(R.eutropha))和4-羟基丁酸：CoA转移酶(克氏梭状芽胞杆菌(C.kluyveri))--连同两种天然大肠杆菌基因--谷氨酸：琥珀酸半醛转氨酶和谷氨酸脱羧酶--的过量表达。在图1中的步骤4和5可以可选地通过α-酮戊二酸脱羧酶如在薄肌眼虫(Euglena gracilis)中鉴定的α-酮戊二酸脱羧酶实施(Shigeoka等，Biochem.J.282(Pt2)：319-323(1992)；Shigeoka andNakano，Arch.Biochem.Biophys.288：22-28(1991)；Shigeoka and Nakano，Biochem J.292(Pt 2)：463-467(1993))。然而，该酶以前未被用来影响在任何生物体中的4-HB或者相关聚合物的生产。

4-羟基丁酸的微生物生产能力在两种微生物大肠杆菌和酿酒酵母中进行了研究，其使用每种生物的计算机代谢模型。到4-HB的潜在途径经由琥珀酸、琥珀酰-CoA或者α-酮戊二酸作为中间体进行，如在图1中显示。

从琥珀酸开始的4-HB生产途径中的第一个步骤包括了琥珀酸经由NADH-或者NADPH-依赖性琥珀酸半醛脱氢酶转化为琥珀酸半醛。在大肠杆菌中，gabD是NADP-依赖性琥珀酸半醛脱氢酶并且是参与4-氨基丁酸摄入和降解的基因簇的一部分(Niegemann等，Arch.Microbiol.160：454-460(1993)；Schneider等，J.Bacteriol.184：6976-6986(2002))。

sad被认为编码NAD-依赖性琥珀酸半醛脱氢酶活性的酶(上述Marek andHenson)。酿酒酵母只含有NADPH-依赖性琥珀酸半醛脱氢酶，推定标记为UGA2，其定位到胞质溶胶(Huh等，Nature 425：686-691(2003))。假定在大肠杆菌和酿酒酵母中琥珀酸途径到4-HB的最大产量计算仅需要假定非天然4-HB脱氢酶已经被加入到它们代谢网络中。

从琥珀酰-CoA到4-羟基丁酸的途径在美国专利No.6，117，658中进行了描述，其作为制造包含4-羟基丁酸单体单元的聚羟链烷酸酯过程的一部分。克氏梭状芽胞杆菌(Clostridium kluyveri)是一种已知具有CoA-依赖性琥珀酸半醛脱氢酶活性的样本生物(前述Sohling and Gottschalk；前述Sohling and Gottschalk)。在该研究中，假定来自于克氏梭状芽胞杆菌或者另外一种生物的酶是在大肠杆菌或酿酒酵母中与非自然的或者异源的4-HB脱氢酶一起表达，以完成从琥珀酰-CoA到4-HB的途径。从α-酮戊二酸到4-HB的途径在大肠杆菌中进行了说明，其产生达到干细胞重30％的聚(4-羟基丁酸)积聚(前述Song等)。因为大肠杆菌和酿酒酵母自然或者内源地具有谷氨酸：琥珀酸半醛转氨酶和谷氨酸脱羧酶两者(Coleman等，J.Biol.Chem.276：244-250(2001))，因此仅通过假定非自然4-HB脱氢酶是存在的，则可以在两种生物中完成从AKG到4-HB的途径。

实施例II

来自琥珀酸和α-酮戊二酸的1,4-丁二醇的生物合成

该实施例说明了来自于微生物体的4-HB和BDO的构建和生物合成生产。在此公开了4-HB和BDO途径。

有数种在上述路径中可以使用的可选的酶。用于将琥珀酸转化为琥珀酰-CoA(图1中的步骤1)的天然或者内源酶可以由CoA转移酶取代，如由克氏梭状芽胞杆菌cat1基因编码的CoA转移酶(Sohling，B.和G.Gottschalk，Eur.J Biochem.212：121-127(1993))，其以类似于步骤9的方式起作用。然而，由该酶生产乙酸可能不是最佳的，因为它可能被分泌而不是被转化回乙酰-CoA。在这方面，它也可有益于消除在步骤9中的乙酸形成。作为这种CoA转移酶的一种可选方案，可以利用在其中4-HB首先通过ATP磷酸化然后转化为CoA衍生物的机制，其类似于在大肠杆菌中转化乙酸为乙酰-CoA的乙酸激酶/磷酸转乙酰酶途径。该路径的净消耗是一个ATP，其与从乙酸再生乙酰-CoA所需的相同。磷酸转丁酰酶(ptb)和丁酸激酶(bk)已知在非羟基化分子上实施这些步骤，用于在丙酮丁醇梭菌中产生丁酸(Cary等，Appl Environ Microbiol 56：1576-1583(1990)；Valentine，R.C.and R.S.Wolfe，J BiolChem.235：1948-1952(I960))。这些酶是可逆的，这允许合成在4-HB的方向进行。

除了通过琥珀酸之外或者代替经由琥珀酸，BDO也可以经由α-酮戊二酸产生。如先前描述并在下面进一步示例的，完成产物生物合成的一种途径是借助使用内源酶经由α-酮戊二酸产生的琥珀酸半醛(图1，步骤4-5)。可选方案是使用能够以一步实现该转化的α-酮戊二酸脱羧酶(图2，步骤8；Tian等，Proc Natl Acad Sci U S.A102：10670-10675(2005))。

对于不同的产生BDO的微生物体菌株的构建，装配一系列适用的基因进行证实。简单地说，对于图1中显示的完整BDO-生产途径的每个步骤，使用可利用的文献资料、NCBI遗传资料库和同源性搜索，鉴定在4-HB和/或BDO生物合成途径中的一种或者多种基因。在该研究中克隆和评估的基因与适当指代(reference)和多肽序列的URL引用一起呈现在以下的表6中。如以下进一步讨论的，一些基因被合成以实现密码子优化，而其它则从天然或者野生型生物的基因组DNA通过PCR进行克隆。对于一些基因两种方法都可以使用，在该情况下，当在试验中使用时，天然基因通过基因识别号的后缀″n″标明。需要注意的是，仅DNA序列不同；而蛋白质是相同的。

表6.在产生BDO的微生物体宿主中表达的基因

¹Sohling和Gottschalk，Eur.J.Biochem.212：121-127(1993)；Sohling和Gottschalk，J.Bacteriol.178：871-880(1996)

²Nolling等，J.，J.Bacteriol.183：4823-4838(2001)5

³Pohlmann等，Nat.Biotechnol.24：1257-1262(2006)

⁴Kosaka等，Biosci.Biotechnol.Biochem.71：58-68(2007)

⁵Brosch等，Proc.Natl.Acad.Sci.U.S.A.104：5596-5601(2007)

⁶Henne等，Appl.Environ.Microbiol.65：3901-3907(1999)

BDO途径表达载体的构建。从Dr.Rolf Lutz of Expressys(www.expressys.de/)获得载体骨架和一些菌株。载体和菌株基于由Dr.Rolf Lutz和Prof.Hermann Bujard(Lutz，R.and H.Bujard，Nucleic AcidsRes 25：1203-1210(1997))开发的pZ表达系统。获得的载体是pZE13luc、pZA33luc、pZS*13luc和pZE22luc，并含有荧光素酶基因作为填充片段。为了用适当的限制酶位点侧面的lacZ-α片段代替荧光素酶填充片段，首先从每个载体中通过用EcoRI和XbaI消化除去荧光素酶填充片段。用以下引物，从pUC19PCR扩增lacZ-α片段：

lacZα-RI

5’GACGAATTCGCTAGCAAGAGGAGAAGTCGACATGTCCAATTCACTGGCCGTCGTTTTAC3’

lacZα3’BB

5’-GACCCTAGGAAGCTTTCTAGAGTCGACCTATGCGGCATCAGAGCAGA-3’。

这产生了带有EcoRI位点、NheI位点、核糖体结合位点、SalI位点和起始密码子的5’端的片段。在该片段的3’端上含有终止密码子、XbaI、HindIII和AvrII位点。PCR产物用EcoRI和AvrII消化并连接到用EcoRI和XbaI消化的基载体(base vectors)中(XbaI和AvrII有相容端和产生了非位点)。因为NheI和XbaI限制酶位点产生了可以连接在一起的相容端(但是产生了任一种酶都不消化的NheI/XbaI非位点)，因此克隆到载体中的基因可能被“生物砖块围砌”(“Biobricked”)在一起(http：//openwetware.Org/wiki/S ynthetic_Biology：BioBricks)。简单地说，该方法使用相同的2个限制位点使得能够将无限数量的基因连接到载体中(只要所述位点没有出现在所述基因内部)，因为在每次加成之后，在基因之间的位点被破坏。

所有载体具有pZ设计，其后面有字母和数字指示复制起点、抗生素抗性标记和启动子/调节单元。复制起点是第二个字母，并且用E表示ColE1、用A表示p15A和用S表示pSC101-基础的起点来指出。第一个数字代表了抗生素抗性标记(1代表氨苄青霉素、2代表卡那霉素、3代表氯霉素、4代表放线壮观素和5代表四环素)。最后的数字定义了调节感兴趣基因的启动子(1代表PLtetO-1、2代表PLlacO-1、3代表PA1lacO-1和4代表Plac/ara-1)。MCS和感兴趣的基因紧随其后。对于这里所讨论的工作，我们使用了两种基载体，pZA33和pZE13，其被修饰用于以上所讨论的生物砖块插入。一旦感兴趣的基因(或多个)已经克隆进入它们之中，所生成的质粒利用在表6中给出的四数字基因编码表示；例如pZA33-XXXX-YYYY-...。

宿主菌株构建。在本文描述的所有研究中的亲株是大肠杆菌K-12菌株MG1655。在服务合同的情况下，通过第三方使用redET方法，在adhE、gabD和aldA中构建了无标记(Markerless)缺失菌株(Datsenko，K.A.and B.L.Wanner，Proc Natl Acad Sci U S.A97：6640-6645(2000))。经过噬菌体P1介导的转导构建随后的菌株(Miller，J.Experiments inMolecular Genetics,Cold Spring Harbor Laboratories，New York(1973))。从Expressys获得菌株C600Z1(laci^q、PN25-tetR、Sp^R、lacY1、leuB6、mcrB+、supE44、thi-1、thr-1、tonA21)，并且其被用作P1转导的lacI^q等位基因来源。噬菌体P1vir在C600Z1大肠杆菌菌株上生长，该菌株具有连接到lacI^q的放线壮观素抗性基因。在C600Z1上生长的P1溶解产物用于利用放线壮观素抗性选择性侵染MG1655。随后通过测定转导子抑制与P_A1lacO-1启动子连接的基因表达的能力，筛查放线壮观素抗性菌落的连锁lacI^q。生成的菌株命名为MG1655lacI^q。使用类似的过程将lacI^Q引入缺失菌株。

从琥珀酸生产4-HB。对于从琥珀酸构建4-HB生产者，从琥珀酸到4-HB和4-HB-CoA的基因编码步骤(在图2中的1、6、7和9)如下描述被装配到pZA3及pZE13载体。评估各种基因组合以及具有不完整途径作为对照的构建物(表7和8)。随后质粒被转化到含有lacI^Q的宿主菌株中，其通过异丙基β-D-1-硫代半乳糖苷(IPTG)的加成允许诱导型表达。测试了野生型和在编码天然琥珀酸半醛脱氢酶的基因中具有缺失的宿主(在图1中的步骤2)。

使用菌株MG1655lacI^Q作为含有途径基因的质粒构建物的宿主，首先在体外测定中测试异源酶的活性。细胞在含有每种构建物的适当抗生素的LB培养基(Difco)中进行需氧生长，并且当光密度(OD600)达到大约0.5时，通过加入1mM的IPTG来诱导。在6个小时后收获细胞，并且如下讨论的进行酶测定。

体外酶测定。为了获得用于活性测定的粗提物，通过以4，500rpm离心(Beckman-Coulter，Allegera X-15R)10分钟收获细胞。沉淀重悬浮在含有Benzonase和溶菌酶的0.3mL BugBuster(Novagen)试剂中，并在室温轻摇下进行15分钟的溶胞。通过在4℃以14，000rpm离心(Eppendorf centrifuge 5402)30分钟，得到没有细胞的溶胞产物。使用Bradford等，Anal.Biochem.72：248-254(1976)的方法测定在样品中细胞蛋白质，并如以下描述进行具体酶测定。以单位/毫克蛋白质来报告活性，其中活性单位被定义为在室温在1分钟内转化1μmol底物所需的酶的数量。一般而言，报告的值是至少3次重复测定的平均值。

依照先前描述的过程，Sohling和Gottschalk，J.Bacteriol.178：871-880(1996)，通过监测自琥珀酰-CoA和乙酸形成乙酰-CoA，测定琥珀酰-CoA转移酶(Cat1)的活性。通过在ATP存在的情况下，依照自琥珀酸和CoA的琥珀酰-CoA的形成，测定琥珀酰-CoA合成酶(SucCD)的活性。试验依照由Cha and Parks，J.Biol.Chem.239：1961-1967(1964)描述的方法。通过在琥珀酸半醛和CoA存在的情况下，在340nm，依照NAD向NADH的转化来测定CoA-依赖性琥珀酸半醛脱氢酶(SucD)的活性(Sohling and Gottschalk，Eur.J.Biochem.212：121-127(1993))。通过在琥珀酸半醛存在的情况下，在340nm，监测NADH氧化为NAD，测定4-HB脱氢酶(4-HBd)的酶活性。试验依照公开的方法：Gerhardt等，Arch.Microbiol.174：189-199(2000)。使用来自于Scherf and Buckel，Appl.Environ.Microbiol.57：2699-2702(1991)的修改方法来测定4-HB辅酶A转移酶(Cat2)的活性。使用HPLC测定从乙酰-CoA和4-HB或者丁酸开始的4-HB-CoA形成或者丁酰-CoA形成。

使用改编自数个文献来源的方法(Durre等，FEMS Microbiol.Rev.17：251-262(1995)；Palosaari和Rogers，J.Bacteriol.170：2971-2976(1988)；和Welch等，Arch.Biochem.Biophys.273：309-318(1989))，测定在还原方向上的醇(ADH)和醛(ALD)脱氢酶。NADH氧化，紧跟着在室温下每4秒读取340nM处的吸光度，总计240秒。在100mM MOPS(用KOH调节为pH 7.5)、0.4mM NADH和1到50μl的细胞提取物中进行还原测定。反应通过加入以下反应物开始：对于ADH为100μl的100mM的乙醛或者丁醛，或者对于ALD为100μl的1mM乙酰-CoA或者丁酰辅酶A。使分光光度计快速成为空白，随后开始动态读数。在340nM处每分钟吸光度减少所形成的斜率以及NAD(P)H在340nM(6000)的摩尔消光系数和提取物的蛋白质浓度，可以用于测定比活性。

PTB酶活性如在Cary等，J.Bacteriol.170：4613-4618(1988)中所述在丁酰辅酶A到丁酰-磷酸的方向测量。它提供了无机磷酸盐用于转化，并跟踪游离辅酶A及反应物5，5’-二硫代双-(2-硝基苯甲酸)或DTNB的增加。DTNB迅速与巯基基团如游离辅酶A反应以释放黄颜色的2-硝基-5-巯基苯甲酸(TNB)，其在412nm处有吸收，具有14，140M cm^-1的摩尔消光系数。测定缓冲液含有150mM pH 7.4的磷酸钾、0.1mM DTNB和0.2mM丁酰辅酶A，而反应通过加入2到50μL的细胞提取物来开始。在丁酸到丁酰-磷酸形成的方向在消耗ATP的情况下测量BK的酶活性。该过程类似于Rose等，J.Biol.Chem.211：737-756(1954)先前描述的乙酸激酶测定。然而，我们已经发现了另一种乙酸激酶酶测定方案，该方案由Sigma提供，其更有用且更灵敏。该测定将通过乙酸激酶进行的ATP向ADP的转化与通过丙酮酸激酶进行的ADP和磷酸烯醇丙酮酸(PEP)向ATP和丙酮酸的转化连接起来，接着是通过乳酸脱氢酶进行的丙酮酸和NADH向乳酸和NAD+的转化。用丁酸取代乙酸是唯一的主要修改，以便能够实施测定而跟踪BK酶活性。测定混合物含有80mM pH 7.6的三乙醇胺缓冲液、200mM丁酸钠、10mM MgCl₂、0.1mM NADH、6.6mM ATP、1.8mM磷酸烯醇丙酮酸。丙酮酸激酶、乳酸脱氢酶和肌激酶依照制造商的说明书加入。反应通过加入2到50μL细胞提取物开始，基于表示NADH氧化的340nm处的吸光度减少来监测反应。

通过HPLC分析辅酶A衍生物。开发了基于HPLC的测定，以监测涉及辅酶A(CoA)转移的酶反应。通过定量测定存在于体外反应混合物中的辅酶A、乙酰辅酶A(AcCoA)、丁酰辅酶A(BuCoA)和4-羟基丁酸辅酶A(4-HBCoA)，所开发的方法能够进行酶活性表征。获得低至低μM的灵敏度，以及所有感兴趣辅酶A衍生物的良好分辨率。

如下进行化学品和样品制备。简单地说，CoA、AcCoA、BuCoA和所有其它化学品从Sigma-Aldrich获得。溶剂甲醇和乙腈属于HPLC级。标准校准曲线在0.01-1mg/mL浓度范围内显示了良好的线性。酶反应混合物含有100mM Tris盐酸缓冲液(pH 7)，等分试样在不同的时间点获取，用乙酸(终浓度为0.04％)猝灭并通过HPLC直接分析。

使用Agilent 1100HPLC系统进行HPLC分析，Agilent 1100HPLC系统装备有二元泵、脱气装置、恒温自动取样器和柱室，并且二极管阵列检测器(DAD)用于分析。使用反相柱Kromasil 1005um C18，4.6×150mm(Peeke Scientific)。25mM磷酸钾(pH 7)和甲醇或者乙腈用作水相和有机溶剂，流速1mL/min。开发了两种方法：具有较快梯度的短时方法用于分析充分分离的CoA、AcCoA和BuCoA，而较长(长时)的方法用于区分洗脱接近AcCoA和4-HBCoA。短时方法应用乙腈梯度(0分钟-5％，6分钟-30％，6.5分钟-5％，10分钟-5％)，对于CoA、AcCoA和BuCoA各自产生了2.7、4.1和5.5分钟的保留时间。在较长方法中，甲醇以以下的线性梯度使用：0分钟-5％、20分钟-35％、20.5分钟-5％、25分钟-5％。CoA、AcCoA、4-HBCoA和BuCoA的保留时间分别是5.8、8.4、9.2和16.0分钟。注射体积是5μL，柱温度是30℃，在260nm处监测UV吸收。

结果说明了四种途径步骤中的每一种的活性(表7)，尽管活性明显取决于在载体中的基因来源、基因在载体中的位置和与被表达的基因在一起的其它基因的环境。例如，基因0035编码比由基因0008编码的琥珀酸半醛脱氢酶更有活性的琥珀酸半醛脱氢酶，而0036和0010n是比0009更有活性的4-HB脱氢酶基因。当在相同的操纵子上有另外一个在它前面的基因时，也显示出更好的4-HB脱氢酶活性。

表7.在来自MG1655lacI^Q的细胞提取物中的体外酶活性，MG1655lacI^Q含有表达4-HB-CoA途径中的基因的质粒。以单位/毫克蛋白质报告活性，其中活性单位定义为在室温下1分钟内转化1μmol底物所需的酶的数量。

样品#	pZE13(a)	pZA33(b)	OD600	细胞蛋白(c)	Cat1	SucD	4HBd	Cat2
									1	cat1(0004)		2.71	6.43	1.232	0.00
2	cat1(0004)-sucD(0035)		2.03	5.00	0.761	2.57
									3	cat1(0004)-sucD(0008)		1.04	3.01	0.783	0.01
4	sucD(0035)		2.31	6.94		2.32
									5	sucD(0008)		1.10	4.16		0.05
6		4hbd(0009)	2.81	7.94	0.003		0.25
									7		4hbd(0036)	2.63	7.84			3.31
8		4hbd(0010n)	2.00	5.08			2.57
									9	cat1(0004)-sucD(0035)	4hbd(0009)	2.07	5.04	0.600	1.85	0.01
10	cat1(0004)-sucD(0035)	4hbd(0036)	2.08	5.40	0.694	1.73	0.41
									11	cat1(0004)-sucD(0035)	4hbd(0010n)	2.44	4.73	0.679	2.28	0.37
12	cat1(0004)-sucD(0008)	4hbd(0009)	1.08	3.99	0.572	-0.01	0.02
									13	cat1(0004)-sucD(0008)	4hbd(0036)	0.77	2.60	0.898	-0.01	0.04
14	cat1(0004)-sucD(0008)	4hbd(0010n)	0.63	2.47	0.776	0.00	0.00
									15		cat2(0034)	2.56	7.86				1.283
16		cat2(0034)-4hbd(0036)	3.13	8.04			24.86	0.993
									17		cat2(0034)-4hbd(0010n)	2.38	7.03			7.45	0.675
18		4hbd(0036)-cat2(0034)	2.69	8.26			2.15	7.490
									19		4hbd(0010n)-cat2(0034)	2.44	6.59			0.59	4.101

基因表达自pZE13上的Plac，pZE13是具有colE1起点和氨苄青霉素抗性的高拷贝质粒。

基因识别号与表6中相同。基因表达自pZA33上的Plac，pZA33是具有pACYC起点和氯霉素抗性的中等拷贝质粒。

(c)细胞蛋白以毫克蛋白质/毫升提取物给出。

随后评估了含有4-HB途径中基因的重组菌株在体内从中心代谢中间体生产4-HB的能力。细胞在LB培养基中进行厌氧生长到OD600约为0.4，随后用1mM IPTG诱导。1小时后，加入琥珀酸钠至10mM，在另外24和48小时后取样进行分析。如下所述，在培养液中的4-HB通过GC-MS来分析。结果表明，与在对照菌株中基本为零相比较，重组菌株在24小时后可以产生超过2mM的4-HB(表8)。

表8.在大肠杆菌菌株中从琥珀酸生产4-HB，大肠杆菌菌株包埋了表达各种4-HB途径基因组合的质粒。

(a)归一化的4-HB浓度，μM/OD600单位

使用辅酶A转移酶(cat1)从琥珀酸生产琥珀酰辅酶A的可选方案是使用编码琥珀酰-CoA合成酶的天然大肠杆菌sucCD基因。该基因簇与用于生成4-HB的剩余步骤的候选基因一起克隆到pZE13上，以产生pZE13-0038-0035-0036。

从葡萄糖生产4-HB。虽然以上实验说明了从中心代谢中间体(琥珀酸)到4-HB的起作用途径，但是工业方法会要求从来自于低成本的碳水化合物原料如葡萄糖或蔗糖进行化学品的产生。因此，下面一组实验目的是确定由细胞在葡萄糖上生长期间产生的内源性琥珀酸是否能够给4-HB途径供燃料。细胞在M9基本培养基(6.78g/LNa₂HPO₄、3.0g/L KH₂PO₄、0.5g/L NaCl、1.0g/L NH₄Cl、1mMMgSO₄、0.1mM CaCl₂)中进行厌氧生长，M9基本培养基补充有20g/L葡萄糖、100mM可提高缓冲能力的3-(N-吗啉基)丙磺酸(MOPS)、10μg/mL硫胺和适当的抗生素。当OD600达到约0.2时，加入0.25mM IPTG，并且在诱导后每24小时取样用于4-HB分析。在所有的情况中，在24小时后，4-HB到达平台期，在最好的菌株中最大量约为1mM(图3a)，而琥珀酸浓度继续上升(图3b)。这表明琥珀酸到该途径的供应可能不是有限的，瓶颈可能是在于这些酶自身的活性或者在于NADH的可用性。0035和0036明显分别是CoA-依赖性琥珀酸半醛脱氢酶和4-HB脱氢酶的最佳候选基因。编码已知(gabD)或者推定(aldA)天然琥珀酸半醛脱氢酶的一个或两个基因的消除对性能有很小的影响。最后，应该注意，细胞在产生4-HB的菌株中比在对照中增长至低得多的OD(图3c)。

从葡萄糖产生4-HB的可选途径是经由a-酮戊二酸。我们研究使用来自结核分支杆菌(Mycobacterium tuberculosis)的α-酮戊二酸脱羧酶--Tian等，Proc.Natl.Acad.SciUSA 102：10670-10675(2005)，以直接从α-酮戊二酸生产琥珀酸半醛(在图1中的步骤8)。为了证实这个基因(0032)在体内是起作用的，我们在pZE13上表达它，其在与pZA33上4-HB脱氢酶(基因0036)相同的宿主中。该菌株在用1mMIPTG诱导后的24小时内能够产生超过1.0mM4-HB(图4)。由于该菌株不表达辅酶A依赖性琥珀酸半醛脱氢酶，因此消除经由琥珀酰-CoA进行的琥珀酸半醛生产的可能性。也可能是，负责产生琥珀酸半醛的天然基因可能在该途径中起作用(在图1中步骤4和5)；然而，当pZE13-0032质粒从宿主中省去时，产生的4-HB量是可忽略不计的。

从4-HB产生BDO。从4-HB产生BDO要求两个还原步骤，其通过脱氢酶催化。醇和醛脱氢酶(分别是ADH和ALD)是NAD+/H和/或NADP+/H-依赖性酶，其一起可以将分子上的羧酸基团还原为醇基团，或者反之可以进行氧化醇为羧酸。该生物转化在野生型丙酮丁醇梭菌中已经显示(Jewell等，Current Microbiology，13：215-19(1986))，但是负责的酶和负责的基因都没被鉴定。另外，还不知道活化为4-HB-CoA是否是首先必需的(在图1中的步骤9)，或者是否醛脱氢酶(步骤12)可以直接作用在4-HB上。基于非羟基化类似物到4-HB和途径中间体的已知活性，或者通过与这些表征基因(表6)的相似性，我们开发了一系列来自于丙酮丁醇梭菌和相关生物的候选酶。因为一些候选酶是多功能的脱氢酶，它们可能潜在催化酸(或者辅酶A衍生物)到醛的NAD(P)H-依赖性还原以及催化醛到醇的NAD(P)H-依赖性还原。在利用在大肠杆菌中的这些基因开始工作之前，我们首先确证了上面所述的使用丙酮丁醇梭菌ATCC 824的相关结果。细胞在补充了10mM 4-HB的Schaedler培养液(Accumedia，Lansing，MI)中，在10％CO₂、10％H₂和80％N₂的厌氧气氛下于30℃下生长。定期获取培养样品，离心，并如下所述通过GC-MS分析培养液中的BDO。在1天、2天和7天温育后，分别检测到0.1mM、0.9mM和1.5mM的BDO浓度。在没有加入4-HB而生长的培养物中没有检测到BDO。为了说明产生的BDO源自葡萄糖，我们在补充有4g/L均匀标记的¹³C-葡萄糖的M9基本培养中生长出最好的产生BDO的菌株MG1655 lacI^Q pZE13-0004-0035-0002pZA33-0034-0036。在OD为0.67时用1mMIPTG诱导细胞，并在24小时后取样。通过质谱进行培养上清液的分析。

当在大肠杆菌宿主MG1655lacI^Q中表达时，接下来测试了用于4-HB到BDO转化途径的候选基因的活性。含有在pZA33上表达的每种候选基因的重组菌株在0.25mM IPTG存在下在37℃生长4小时，以完全诱导酶的表达。在诱导后4小时，收获细胞和测定ADH和ALD活性，如上所述。因为4-HB-CoA和4-羟基丁醛不是商业可得的，因此使用非羟基化底物进行测定(表9)。丙酮丁醇梭菌adhE2(0002)和大肠杆菌adhE(0011)的4-碳和2-碳底物之间的活性比率类似于之前在文献Atsumi等，Biochim.Biophys.Acta.1207：1-11(1994)中所报告的那些。

表9.在来自MG1655 lacI^Q的细胞提取物中的体外酶活性，MG1655 lacI^Q含有表达醛和醇脱氢酶的候选基因的pZA33。活性以μmol每分钟每毫克细胞蛋白质来表示，N.D.：未测定。

对于BDO生产试验，来自于牙龈卟啉单胞菌W83的cat2(基因0034)被包含在pZA33上，用于转化4-HB为4-HB-CoA，而候选的脱氢酶基因在pZE13上表达。宿主菌株是MG1655lacI^Q。连同候选的醇和醛脱氢酶一起，由于底物的相似性，我们也测试了辅酶A依赖性琥珀酸半醛脱氢酶(sucD)在这个步骤中起作用的能力。细胞在补充有10mM 4-HB的LB培养基中生长到OD为大约0.5，用1mM IPTG诱导，并在24个小时后获取培养液样品，并如以下描述分析BDO。最佳BDO生产出现在使用来自于丙酮丁醇梭菌的adhE2、来自于克氏梭状芽胞杆菌的sucD或者来自于牙龈卟啉单胞菌的sucD的情况(图5)。有趣的是，在需氧条件下生产的BDO绝对数量较高；然而，这主要由于在厌氧培养物中获得了较低的细胞密度。当归一化细胞OD时，每单元生物质的BDO生产在厌氧条件下更高(表10)。

表10.表达来自丙酮丁醇梭菌的adhE2、来自克氏梭状芽胞杆菌的sucD或者来自牙龈卟啉单胞菌sucD的细胞培养物(数据来自于在图3中的实验2、9和10)以及阴性对照(实验1)的绝对和归一化BDO浓度

如上所述，使用不产生乙酸作为副产物的转化4-HB到4-HB-CoA的路径可以是有利的。为了这个目的，我们测试了使用来自丙酮丁醇梭菌的磷酸转丁酰酶(ptb)和丁酸激酶(bk)经过在图1中的步骤10和11实现该转化。克隆了来自丙酮丁醇梭菌(基因0020和0021)的天然ptb/bk操纵子并使其在pZA33中表达。获取含有生成构建物的细胞提取物并如在本文所述测定两种酶的活性。BK的比活性大约是65U/mg，而PTB的比活性大约是5U/mg。一个单位(U)活性定义为1μM底物在室温下在1分钟内的转化。最后，测试了参与4-HB到BDO转化的构建物。宿主菌株用所述的pZA33-0020-0021构建物和pZE13-0002转化，并与利用在上面图5中使用的需氧过程的cat2在BDO生产中的应用进行比较。与当使用cat2时的2mM比较，BK/PTB菌株产生1mM BDO(表11)。有趣的是，结果取决于宿主菌株在天然adhE基因中是否含有缺失。

表11.细胞培养物的绝对和归一化BDO浓度，所述细胞表达了在pZE13中的来自丙酮丁醇梭菌的adhE2，以及在pZA33上的来自牙龈卟啉单胞菌的cat2(0034)或者来自丙酮丁醇梭菌的PTB/BK基因。宿主菌株是MG1655 lacI^Q或者MG 1655ΔadhE lacI^Q。

来自于葡萄糖的BDO产生。途径证实的最后步骤是在大肠杆菌中表达途径的4-HB和BDO片段和在葡萄糖基本培养基中显示BDO的产生。构建新质粒，使得所有所需的基因装配在两种质粒上。一般而言，从pZE13表达cat1、adhEh和sucD基因，和从pZA33表达cat2和4-HBd。在MG 1655lacI^Q背景中测试了基因来源和基因次序的各种组合。细胞在M9基本培养基(6.78g/L Na₂HPO₄、3.0g/L KH₂PO₄、0.5g/L NaCl、1.0g/L NH₄Cl、1mM MgSO₄、0.1mM CaCl₂)中厌氧生长，M9基本培养基补充有20g/L葡萄糖、100mM 3-(N-吗啉基)丙磺酸(MOPS)--以提高缓冲能力、10μg/mL硫胺和适当的抗生素。在接种后大约15小时加入0.25mM IPTG，在诱导后24和48小时获取用于BDO、4-HB和琥珀酸分析的培养上清液样品。BDO生产似乎显示出依赖基因次序(表12)。超过了0.5mM的最高BDO生产首先利用所表达的cat2获得，接着是在pZA33上4-HBd，然后由在pZE13上的牙龈卟啉单胞菌sucD的cat1。在pZE13上的最后位置添加丙酮丁醇梭菌adhE2引起轻微提高。也产生了较高浓度的4-HB和琥珀酸。

表12.在补充有20g/L葡萄糖的基本培养基中生长的、表达BDO途径基因组合的重组大肠杆菌菌株中的BDO、4-HB和琥珀酸的生产。浓度是以mM给出。

通过GCMS分析BDO、4-HB和琥珀酸。在发酵和细胞培养样品中的BDO、4-HB和琥珀酸通过硅烷化来衍生并使用改编自文献报道的方法((Simonov等，J.Anal Chem.59：965-971(2004))通过GCMS进行定量分析。开发的方法显示了低至1μM的良好灵敏性、达到至少25mM的线性以及优良的选择性和再现性。

如下进行样品制备：100μL过滤的(0.2μm或0.45μm针筒式滤器)样品，如发酵培养液、细胞培养物或者标准溶液，在Speed VacConcentrator(Savant SVC-IOOH)在环境温度下干燥大约1小时，随后加入在二甲基甲酰胺中的20μL 10mM环己醇溶液作为内标。涡旋混合物，在水浴(Branson 3510)经声波处理15分钟，确保均一性。加入100μL硅烷化衍生反应物--含有1％三甲基氯硅烷的N，O-双(三甲基甲硅烷基)三氟-乙酰胺(BSTFA)，然后混合物在70℃温育30分钟。衍生的样品离心5分钟，将透明(澄清)的溶液直接注射入GCMS中。除了从J.T.Baker购买的BDO外，所有的化学品和试剂来自Sigma-Aldrich。

在Agilent气相色谱仪6890N上进行GCMS，其连接于以电子轰击离子化(EI)模式操作的质量选择性检测器(MSD)5973N用于分析。使用30m×0.25mm内径(i.d.)×0.25μm膜厚的DB-5MS毛细管柱(J&W Scientific，Agilent Technologies)。GC以分流注入模式以20∶1的分流比引入1μL样品进行操作。注入口温度是250℃。氦气用作载气和流速维持在1.0mL/min。优化温度梯度程序，确保感兴趣分析物充分分离和最小的基质干扰。烘箱开始维持在80℃，1分钟，然后以2℃/min斜线上升到120℃，接着以100℃/min快速斜线上升到320℃，最后在320℃维持6分钟。MS接口传递线(interface transfer line)维持在280℃。使用′低质量′MS调准设置(MS tune settings)和30-400m/z质量范围扫描获得这些数据。总分析时间是29分钟，包括3分钟溶解的延迟。对于BSTFA衍生的环己醇、BDO、4-HB和琥珀酸，保留时间分别对应于5.2、10.5、14.0和18.2分钟。对于定量分析，选择以下具体质量片段(萃取的离子色谱)：内标环己醇的m/z为157、BDO的m/z为116，而4-HB和琥珀酸两者的m/z为147。为了尽可能接近地与样品基质相配，使用在相应的细胞培养物或发酵培养基中的分析物溶液建立标准校准曲线。使用环境数据分析化学工作站软件(Environmental Data AnalysisChemStation software(AgilentTechnologies))处理GCMS数据。

结果表明所产生的大部分4-HB和BDO是用13C标记的(图6，右侧)。显示在未标记葡萄糖中生长的平行培养物的质谱用于比较(图6，左侧)。需要注意的是，所观察的峰是含有来自代谢物的不同数目碳原子的衍生分子的片段的峰。衍生化反应物也贡献了一些天然存在标记分布的碳原子和硅原子，因此结果不是严格定量的。

使用可选的途径从4-HB产生BDO。也测试了用于产生BDO的各种可选途径。这包括使用天然大肠杆菌SucCD酶以将琥珀酸转化为琥珀酰-CoA(表13，行2-3)、使用在α-酮戊二酸途径中的α-酮戊二酸脱羧酶(表13，行4)和使用PTB/BK作为可选方法以产生4-HB的辅酶A衍生物(表13，行1)。构建含有表达表13中所示基因的质粒的菌株，其包含这些变体。结果显示在所有情况下，出现4-HB和BDO生产(表13)。

表13.在不同BDO途径变体的重组大肠杆菌菌株基因中的BDO、4-HB和琥珀酸的生产，重组的大肠杆菌菌株基因在补充有20g/L葡萄糖的基本培养基中厌氧生长，并在用0.1mM IPTG诱导后24小时收获。浓度以mM给出。

pZE13上的基因	pZA33上的基因	琥珀酸	4-HB	BDO
					0002+0004+0035	0020n-0021n-0036	0.336	2.91	0.230
0038+0035	0034-0036	0.814	2.81	0.126
					0038+0035	0036-0034	0.741	2.57	0.114
0035+0032	0034-0036	5.01	0.538	0.154

实施例III

4-羟基丁酸、γ-丁内酯和1,4-丁二醇的生物合成

该实施例描述了使用发酵和其它生物过程生物合成生产4-羟基丁酸、γ-丁内酯和1,4-丁二醇。以下描述了使4-HB发酵步骤结合到生产纯化的GBL、1,4-丁二醇(BDO)和四氢呋喃(THF)的完整过程中的方法。因为4-HB和GBL处于平衡，发酵培养液会含有两种化合物。在低pH，该平衡向有利于GBL移动。因此，该发酵可以在pH 7.5或更低下操作(运转)，通常在pH 5.5或者更低下操作。在除去生物质后，产物流进入了除去GBL的分离步骤，并且富集4-HB的剩余产物流被再循环。最后，蒸馏GBL以除去任何杂质。该过程以三种方式中的一种操作：1)料分批发酵和分批分离；2)补料分批发酵和连续分离；3)连续发酵和连续分离。这些模式中的前两种在图7中图解显示。下述结合的发酵过程也用于本发明的产BDO细胞，用于BDO和随后BDO家族产物的生物合成。

产生4-HB/GBL的发酵方案(分批)：生产生物在用N₂/CO₂混合物喷射(喷雾)的10L生物反应器中生长，使用含有5g/L硫酸钾、2.5g/L氯化铵、0.5g/L硫酸镁和30g/L玉米浆的5L培养液和20g/L的起始葡萄糖浓度。随着细胞生长和利用葡萄糖，另外70％的葡萄糖以大致平衡葡萄糖消耗的速度进料到生物反应器中。生物反应器的温度维持在30℃。生长继续大约24小时，直到4-HB达到20-200g/L之间的浓度，其中细胞密度在5与10g/L之间。pH不受控制，并且到试验结束时其一般会减小到pH 3-6。在培养期完成时，使发酵罐内含物经过细胞分离装置(例如离心机)以除去细胞和细胞碎片，而发酵培养液被转移到产物分离装置。4-HB和/或GBL的分离通过本领域从稀释水溶液中分离有机产物使用的标准分离方法进行，如使用水不混溶有机溶剂(例如甲苯)的液-液萃取，以提供4-HB/GBL的有机溶液。生成的溶液随后经受标准蒸馏方法以移出和再循环有机溶剂以及提供作为纯化液体分离的GBL(沸点204-205℃)。

产生4-HB/GBL的发酵方案(完全连续)：生产生物首先使用上述装置和培养基组成以分批模式长大，除了起始的葡萄糖浓度是30-50g/L之外。当葡萄糖被耗尽时，相同组成的饲养培养基以0.5L/hr和1L/hr之间的速度连续地提供，并且以相同的速度收回液体。在生物反应器中的4-HB浓度保持稳定在30-40g/L和细胞密度保持稳定在3-5g/L之间。温度维持在30℃，并根据需要使用浓NaOH和HCl将pH维持在4.5。生物反应器连续运转一个月，每天取样，以保证4-HB浓度一致性。在连续模式中，随着新饲养培养基被供应，发酵罐内含物被恒定地移出。含有细胞、培养基和产物4-HB和/或GBL的出口流随后经历连续产物分离过程，去除或者不去除细胞和细胞碎片，并且通过本领域从稀释水溶液中分离有机产物使用的标准连续分离方法进行，如使用水不混溶有机溶剂(例如甲苯)的连续液-液萃取，以提供4-HB/GBL的有机溶液。生成的溶液随后经受标准连续蒸馏方法以移出和再循环有机溶剂以及提供作为纯化液体分离的GBL(沸点204-205℃)。

GBL还原方案：一旦如上所述分离和纯化GBL，它随后会经历本领域(引用的参考文献)熟知的那些还原方案以生产1,4-丁二醇或者四氢呋喃(THF)或者它们的混合物。熟知在氢气压下多相或者均相氢化催化剂与GBL结合可提供产物1,4-丁二醇或者四氢呋喃(THF)或者它们的混合物。重要的是要注意，如上述从发酵培养液中分离的4-HB/GBL产物混合物可以在GBL分离和纯化之前直接经历这些相同的还原方案，以提供产物1,4-丁二醇或者四氢呋喃(THF)或者它们的混合物。随后通过本领域熟知的方法分离和纯化生成的产物1,4-丁二醇和THF。

直接产生BDO或THF的发酵和氢化方案(分批)：细胞在用N₂/CO₂混合物喷射的10L生物反应器中生长，使用含有5g/L硫酸钾、2.5g/L氯化铵、0.5g/L硫酸镁和30g/L玉米浆的5L培养液和20g/L的起始葡萄糖浓度。随着细胞生长和利用葡萄糖，另外70％的葡萄糖以大致平衡葡萄糖消耗的速度进料到生物反应器中。生物反应器的温度维持在30℃。生长继续大约24小时，直到4-HB达到20-200g/L之间的浓度，其中细胞密度在5与10g/L之间。pH不受控制，并且到试验结束时其一般会减小到pH 3-6。在培养期完成时，使发酵罐内含物经过细胞分离装置(例如离心机)以除去细胞和细胞碎片，而发酵培养液被转移到还原装置(例如，氢化容器)，在那里混合物4-HB/GBL被直接还原为1,4-丁二醇或THF或它们的混合物。在完成还原步骤之后，反应器内含物被转移至产物分离装置。1,4-丁二醇和/或THF的分离通过本领域从稀释水溶液中分离有机产物使用的标准分离方法进行，如使用水不混溶有机溶剂(例如甲苯)的液-液萃取，以提供1,4-丁二醇和/或THF的有机溶液。生成的溶液随后经受标准蒸馏方法以移出和再循环有机溶剂以及提供作为纯化液体分离的1,4-丁二醇和/或THF。

直接产生BDO或者THF发酵和氢化方案(完全连续)：细胞首先使用上述装置和培养基组成以分批模式长大，除了起始的葡萄糖浓度是30-50g/L之外。当葡萄糖被耗尽时，相同组成的饲养培养基以0.5L/hr和1L/hr之间的速度连续地提供，并且以相同的速度收回液体。在生物反应器中的4-HB浓度保持稳定在30-40g/L和细胞密度保持稳定在3-5g/L之间。温度维持在30℃，并根据需要使用浓NaOH和HCl将pH维持在4.5。生物反应器连续运转一个月，每天取样，以保证4-HB浓度一致性。在连续模式中，随着新饲养培养基被供应，发酵罐内含物被恒定地移出。含有细胞、培养基和产物4-HB和/或GBL的出口流随后经过细胞分离装置(例如离心机)以除去细胞和细胞碎片，而发酵培养液被转移到连续的还原装置(例如，氢化容器)，在那里混合物4-HB/GBL被直接还原为1,4-丁二醇或THF或其混合物。在完成还原步骤之后，反应器内含物被转移至连续的产物分离装置。1,4-丁二醇和/或THF的分离通过本领域从稀释水溶液中分离有机产物使用的标准连续分离方法进行，如使用水不混溶有机溶剂(例如甲苯)的液-液萃取，以提供1,4-丁二醇和/或THF的有机溶液。生成的溶液随后经受标准蒸馏方法以移出和再循环有机溶剂以及提供作为纯化液体分离的1,4-丁二醇和/或THF。

直接产生BDO的发酵方案(分批)：生产生物在用N₂/CO₂混合物喷射的10L生物反应器中生长，使用含有5g/L硫酸钾、2.5g/L氯化铵、0.5g/L硫酸镁和30g/L玉米浆的5L培养液和20g/L的起始葡萄糖浓度。随着细胞生长和利用葡萄糖，另外70％的葡萄糖以大致平衡葡萄糖消耗的速度进料到生物反应器中。生物反应器的温度维持在30℃。生长继续大约24小时，直到BDO达到20-200g/L之间的浓度，其中细胞密度通常在5与10g/L之间。在培养期完成时，使发酵罐内含物经过细胞分离装置(例如离心机)以除去细胞和细胞碎片，而发酵培养液被转移到产物分离装置。BDO的分离通过本领域从稀释水溶液中分离有机产物使用的标准分离方法进行，如使用水不混溶有机溶剂(例如甲苯)的液-液萃取，以提供BDO的有机溶液。生成的溶液随后经受标准蒸馏方法以移出和再循环有机溶剂以及提供作为纯化液体分离的BDO(沸点228-229℃)。

直接产生BDO的发酵方案(完全连续)：生产生物首先使用上述装置和培养基组成以分批模式长大，除了起始的葡萄糖浓度是30-50g/L之外。当葡萄糖被耗尽时，相同组成的饲养培养基以0.5L/hr和1L/hr之间的速度连续地提供，并且以相同的速度收回液体。在生物反应器中的BDO浓度保持稳定在30-40g/L和细胞密度保持稳定在3-5g/L之间。温度维持在30℃，并根据需要使用浓NaOH和HCl将pH维持在4.5。生物反应器连续运转一个月，每天取样，以保证BDO浓度一致性。在连续模式中，随着新饲养培养基被供应，发酵罐内含物被恒定地移出。含有细胞、培养基和产物BDO的出口流随后经历连续产物分离过程，去除或者不去除细胞和细胞碎片，并且通过本领域从稀释水溶液中分离有机产物使用的标准连续分离方法进行，如使用水不混溶有机溶剂(例如甲苯)的连续液-液萃取，以提供BDO的有机溶液。生成的溶液随后经受标准连续蒸馏方法以移出和再循环有机溶剂以及提供作为纯化液体(mpt20℃)分离的BDO(沸点228-229℃)。

实施例IV示例性的BDO途径

该实施例描述了用于1,4-丁二醇(BDO)合成途径的示例性酶和相应的基因。

示例性的BDO合成途径在图8-13中呈现。图8-13中描述的途径为从共同的中心代谢中间产物至1,4-丁二醇。图8-13中描述的所有转化分为表14中所示的18种普通转化类别。以下描述了每一类别中大量已生化表征的候选基因。具体所列的为当在宿主生物体中克隆和表达时可用于催化图9-13中合适的转化的那些基因。用于图9-13中每一关键步骤的主要的三个示例性基因在表15-23中提供(见下文)。在此描述了提供用于图8中所述途径的示例性的基因。

表14.转化共同的中心代谢中间产物至1,4-丁二醇所需的酶类型。每一标记的前三个数字与酶委员会编号前三个数字相对应，其代表不依赖底物特异性的总转化类型。

l.l.l.a-氧化还原酶(醛至醇或酮至羟基)

醛至醇。编码催化醛转化为醇的酶(即醇脱氢酶，或等同地称作醛还原酶)的示例性基因包括：编码C2-C14的中链醇脱氢酶的alrA(Tani等人，Appl.Environ.Microbiol.66：5231-5235(2000))；来自酿酒酵母的ADH2(Atsumi等人，Nature 451：86-89(2008))；来自大肠杆菌的yqhD，其偏好长于C(3)的分子(Sulzenbacher等人，Journalof Molecular Biology 342：489-502(2004))；和来自丙酮丁醇梭菌的bdhI和bdhII，其将丁醛转化为丁醇(Walter等人，Journal of Bacteriology174：7149-7158(1992))。用于每种这些示例性基因产物的蛋白质序列如果是可得到的话，可用下列GenBank登录号找到：

展现4-羟基丁酸脱氢酶活性的酶(EC 1.1.1.61)也属于此范畴。所述酶已在真氧产碱杆菌(Ralstonia eutropha)(Bravo等人，J.Forensic Sci.49：379-387(2004))、克氏梭菌(Wolff和Kenealy，Protein Expr.Purif.6：206-212(1995))和拟南芥(Arabidopsisthaliana)(Breitkreuz等人，J.Biol.Chem.278：41552-41556(2003))中得到表征。

4hbd YP_726053.1 真氧产碱杆菌H16

4hbd L21902.1 克氏梭菌DSM 555

4hbd Q94B07 拟南芥

另一个示例性的酶为3-羟基异丁酸盐脱氢酶，其催化3-羟基异丁酸盐至甲基丙二酸半醛的可逆氧化。该酶参与缬氨酸，亮氨酸和异亮氨酸降解并且已在细菌，真核生物和哺乳动物中鉴定。由来自嗜热栖热菌HB8的P84067编码的该酶已在结构上进行了表征(Lokanath等，J Mol Biol 352：905-17(2005))。人3-羟基异丁酸盐脱氢酶的可逆性利用同位素-标记底物显示(Manning等，Biochem J 231：481-484(1985))。编码该酶的另外的基因包括人类(Hawes等，Methods Enzymol.324：218-228(2000))和兔(Chowdhury等，Biosci.Biotechnol Biochem.60：2043-2047(1996)；Hawes等，Methods enzymol.324：218(2000)))中的3hidh，绿脓杆菌中的mmsb和恶臭假单胞菌中的dhat(Aberhart等，JChem.Soc.[Perkin 1]6：1404-1406(1979)；Chowdhury等，Biosci.BiotechnolBiochem.67：438-441(2003)；Chowdhury等，Biosci.Biotechnol Biochem.60：2043-2047(1996))。

一些3-羟基异丁酸盐脱氢酶还显示将丙二酸半醛转化至3-羟基丙酸(3-HP)。表现出该活性的三个候选基因为来自绿脓杆菌PA01(62)的mmsB，来自恶臭假单胞菌KT2440的mmsB(Liao等，美国公开2005/0221466)和来自恶臭假单胞菌E23的mmsB(Chowdhury等，Biosci.Biotechnol.Biochem.60：2043-2047(1996))。还鉴定了粪产碱菌M3A中具有3-羟基丁酸脱氢酶活性的酶(Gokam等，美国专利No.7，393，676；辽河等，美国公开No.2005/0221466)。来自其他生物体包括球形红细菌得另外的候选基因可通过序列相似性推断。

丙二酸半醛转化至3-HP还可以通过两种其他的酶完成：NADH-依赖性3-羟基丙酸脱氢酶和NADPH-依赖性丙二酸半醛还原酶。NADH-依赖性3-羟基丙酸脱氢酶被认为参与来自细菌和植物中丙酸盐的β-丙氨酸生物合成途径(Rathinasabapathi，B.Journal ofPlant Pathology 159：671-674(2002)；Stadtman，E.R.J.Am.Chem.Soc.77：5765-5766(1955))。该酶迄今为止与任何生物体中的基因无关。NADPH-依赖性丙二酸半醛还原酶催化自养性CO2-固定细菌中的逆反应。虽然已经检测了勤奋金属球菌中的酶活性，但该基因本身仍未知(Alber等，J.Bacteriol.188：8551-8559(2006))。

酮至羟基。存在一些示例性的醇脱氢酶，其将酮转化至羟基官能团。来自大肠杆菌的两种所述酶由苹果酸脱氢酶(mdh)和乳酸脱氢酶(IdhA)编码。另外，已表明来自真氧产碱杆菌的乳酸脱氢酶对各种链长的底物显示高活性，诸如乳酸，2-氧代丁酰，2-氧代戊酸和2-酮戊二酸(Steinbuchel，A.and H.G.Schlegel Eur.J.Biochem.130：329-334(1983))。α-酮己二酸转化为α-羟己二酸可由2-酮己二酸还原酶催化，其为已报道发现于鼠和人胎盘中的酶(Suda等，Arch.Biochem.Biophys.176：610-620(1976)；Suda等，Biochem.Biophys.Res.Commun.77：586-591(1977))。用于该步骤的另外的候选物为来自人心脏的线粒体3-羟基丁酸脱氢酶(bdh)，其已被克隆和表征(Marks等，J.Biol.Chem.267：15459-15463(1992))。该酶为作用于3-醇酸的脱氢酶。如拜氏梭菌(Ismaiel等，J.Bacteriol.175：5097-5105(1993))和布氏热厌氧杆菌(Lamed等，Biochem.J.195：183-190(1981)；Peretz and Burstein Biochemistry 28：6549-6555 1989))中所示的，另一种示例性的醇脱氢酶将丙酮转化至异丙醇。

将乙酰乙酰基-CoA转化为3-羟基丁酰-CoA的示例性的3-羟酰脱氢酶包括来自丙酮丁醇梭菌的hbd(Boynton等，Journal of Bacteriology 178：3015-3024(1996))，来自拜氏梭菌的hbd(Colby等，Appl Environ.Microbiol 58：3297-3302(1992))，和来自勤奋金属球菌的许多类似酶(Berg等，Archaea.Science.318：1782-1786(2007))。

1.1.l.c氧化还原酶(2步，酰基-CoA至醇)

将酰基-CoA转化为醇的示例性2步氧化还原酶包括那些将例如乙酰-CoA等底物转化为乙醇(例如大肠杆菌的adhE)(Kessler等人，FEBS.Let t.281：59-63(1991))和将丁酰-CoA转化为丁醇(例如丙酮丁醇梭菌的adhE2)(Fontaine等人，J.Bacteriol.184：821-830(2002))的氧化还原酶。除了将乙酰-CoA还原为乙醇外，肠膜明串珠菌(Leuconostocmesenteroides)的adhE所编码的酶已显示可将支链化合物异丁醛氧化为异丁酰-CoA(Kazahaya等，J.Gen.Appl.Microbiol.18：43-55(1972)；Koo等人，Biotechnol Let t.27：505-510(2005))。

adhE NP_415757.1 大肠杆菌

adhE2 AAK09379.1 丙酮丁醇梭菌

adhE AAV66076.1 肠膜明串珠菌

另一种示例性酶可将丙二酰辅酶A转化为3-HP。具有此活性的NADPH依赖性酶已在橙色绿屈挠菌(Chloroflexus aurantiacus)中得到表征，其中所述酶参与3-羟基丙酸循环(Hugler等人，J.Bacteriol.184：2404-2410(2000)；Straus s和Fuchs，Eur.J.Biochem.215：633-643(1993))。所述酶的质量为300kDa，其具有高度的底物特异性且与其它已知的氧化还原酶显示很小的序列相似性(Hugler等人，J.Bacteriol.184：2404-2410(2002))。没有显示其它生物体中的酶可催化所述特异性反应；然而，存在生物信息学证据证明其它生物体可能具有类似的途径(Klatt等人，Environ.Microbiol.9：2067-2078(2007))。可通过序列相似性推断包括卡氏玫瑰弯菌(Roseiflexus castenholzii)、赤细菌属(Erythrobacter)NAP1和海洋γ变形杆菌(marine gamma proteobacterium)HTCC2080的其它生物体中的候选酶。

更长链的酰基-CoA分子可由酶诸如希蒙得木(加州希蒙得木)FAR还原，其编码醇-形成的脂肪酰基-CoA还原酶。其在大肠杆菌中过表达产生FAR活性和脂族醇的累积(Metz等，Plant Physiology 122：635-644(2000))。

FAR AAD38039.1 加州希蒙得木

1.2.l.b氧化还原酶(酰基-CoA至醛)

一些酰基-CoA脱氢酶能够将酰基-CoA还原为其对应的醛。编码所述酶的示例性基因包括：醋酸钙不动杆菌(Acinetobacter calcoaceticus)acr1，其编码脂肪酰辅酶A还原酶(Reiser和Somerville，Journal ofBacteriology 179：2969-2975(1997))；不动杆菌属(Acinetobacter sp.)M-1脂肪酰辅酶A还原酶(Ishige等人，Appl.Environ.Microbiol.68：1192-1195(2002))；和克氏梭菌sucD基因，其编码辅酶A-和NADP-依赖性琥珀酸半醛脱氢酶(Sohling和Gottschalk，J Bacteriol.178：871-880(1996))。牙龈卟啉菌的SucD是另一种琥珀酸半醛脱氢酶(Takahashi等人，J.Bacteri ol.182：4704-4710(2000))。假单胞菌属中由bphG编码的使乙醛脱氢酶酰化的酶是另一种有用的酶，因为其已被证实可氧化乙醛、丙醛、丁醛、异丁醛和甲醛并使其酰化(Powlowski等人，J Bacteriol.175：377-385(1993))。

将酰基辅酶A转化为其对应醛的另一种类型的酶是丙二酰辅酶A还原酶，其将丙二酰辅酶A转化为丙二酸半醛。丙二酰辅酶A还原酶是嗜热嗜酸古菌中经由3-羟基丙酸循环的自养碳固定中的关键酶(Berg等人，Science318：1782-1786(2007)；Thauer，R.K.Science318：1732-1733(2007))。所述酶利用NADPH作为辅因子且已在金属球菌和硫化叶菌(Sulfolobus spp)中得到表征(Alber等人，J.Bacteriol.188：8551-8559(2006)；Hugler等人，J.Bacteriol.184：2404-2410(2002))。所述酶在勤奋金属球菌中是由Msed_0709编码(Alber等人，J.Bacteriol.188：8551-8559(2006)；Berg等人，Science 318：1782-1786(2007))。将来自托氏硫化叶菌(Sulfolobustokodaii)的编码丙二酰辅酶A还原酶的基因在大肠杆菌中克隆并异源表达(Alber等人，J.Bacteriol.188：8551-8559(2006))。虽然这些酶的醛脱氢酶功能类似于来自橙色绿屈挠菌的双功能脱氢酶，但是其序列相似性却很小。这两种丙二酰辅酶A还原酶候选物与天门冬氨酸半醛脱氢酶具有高度的序列相似性，天门冬氨酸半醛脱氢酶是一种催化天冬氨酰-4-磷酸还原且同时脱磷酸成天门冬氨酸半醛的酶。可在包括硫磺矿硫化叶菌(Sulfolobus solfataricus)和嗜酸热硫化叶菌(Sulfolobusacidocaldarius)的其它生物体中通过与蛋白质的序列同源性来发现其它候选基因。

1.2.l.c-氧化还原酶(2-含氧酸至酰基-CoA，脱羧作用)

该家族的酶包括1)支链2-酮酸脱氢酶，2)α-酮戊二醛脱氢酶，和3)丙酮酸脱氢酶多酶复合物(PDHC)。这些酶为多酶复合物，其催化引起2-酮酸类酰化氧化脱羧的一系列不完全反应。每一2-酮酸脱氢酶复合物占据中间代谢的关键位置，且酶活性通常受紧密调节(Fries等，Biochemistry 42：6996-7002(2003))。该酶共有由三个催化组分的多拷贝组成的复杂但共同的结构：α-酮酸脱羧酶(El)，二氢硫辛酰胺酰基转移酶(E2)和二氢硫辛酰胺脱氢酶(E3)。E3组分在所有生物体2-酮酸脱氢酶复合物中共有，而El和E2组分由不同的基因编码。该酶组分以多拷贝存在于复合物中并且利用多种辅因子经底物通道催化直接的反应顺序。这些脱氢酶复合物的总的规模非常大，具有400和1000Da之间的分子质量(即大于核糖体)。

大肠杆菌中缺氧状态下2-酮酸脱氢酶家族中的酶活性通常较低或有限。提高的NADH(或NADPH)产生可导致氧化还原-不平衡，并且NADH本身用作酶功能的抑制剂。基因工程工作提高了大肠杆菌丙酮酸脱氢酶复合物的厌氧活性(Kim等，Appl.Environ.Microbiol.73：1766-1771(2007)；Kim等，J.Bacteriol.190：3851-3858)2008)；Zhou等，Biotechnol.Lett.30：335-342(2008))。例如，NADH的抑制作用可通过在E3组分中设计H322Y突变而克服(Kim等，J.Bacteriol.190：3851-3858(2008))。单一组分和其如何在复合物中合作的结构研究提供了对该家族酶的催化机理和构造的了解(Aevarsson等，Nat.Struct.Biol.6：785-792(1999)；Zhou等，Proc.Natl.Acad.Sci.U.S.A.98：14802-14807(2001))。脱氢酶复合物的底物特异性在不同生物体中不同，但通常支链酮酸脱氢酶具有最宽的底物范围。

α-酮戊二醛脱氢酶(AKGD)将α-酮戊二酸转化为琥珀酰-CoA并且是通过三羧酸循环的代谢量控制的第一位置(Hansford，R.G.Curr.Top.Bioenerg.10：217-278(1980))。由大肠杆菌中基因sucA，sucB和Ipd编码，AKGD基因表达在缺氧状态下以及在葡萄糖上培养期间下调(Park等，Mol.Microbiol.15：473-482(1995))。虽然AKGD的底物范围有限，E2组分催化核心的结构研究精确定位了负责底物特异性得具体残基(Knapp等，J.Mol.Biol.280：655-668(1998))。枯草杆菌AKGD，由odhAB(El和E2)和pdhD(E3，共有域)编码，在转录水平受调节并且依赖于碳源和生物体的生长期(Resnekov等，Mol.Gen.Genet.234：285-296(1992))。酵母中，编码E3组分的LPD1基因在转录水平受葡萄糖调节(Roy和DawesJ.Gen.Microbiol.133：925-933(1987))。由KGD1编码的El组分，也受葡萄糖调节并且由HAP2和HAP3的产物激活(Repetto和Tzagoloff,Mol.Cell Biol.9：2695-2705 25(1989))。受产物NADH和琥珀酰-CoA抑制的AKGD酶复合物在哺乳动物系统中得到了很好的研究，如其受损的功能与一些神经学疾病相关联(Tretter and dam-Vizi Philos.Trans.R.Soc.LondB Biol.Sci.360：2335-2345(2005))。

支链2-酮酸脱氢酶复合物(BCKAD)，亦称2-氧代异戊酸脱氢酶，参与支链氨基酸降解途径，将缬氨酸，亮氨酸和异亮氨酸的2-酮酸类衍生物转化为其酰基-CoA衍生物和CO2。已在许多生物体中研究了该复合物，包括枯草杆菌(Wang等，Eur.J.Biochem.213：1091-1099(1993))，褐鼠(Namba等，J.Biol.Chem.244：4437-4447(1969))和恶臭假单胞菌(Sokatch J.Bacteriol.148：647-652(1981))。枯草杆菌中该酶由基因pdhD(E3组分)，bfmBB(E2组分)bfmBAA和bfinBAB(El组分)编码(Wang等，Eur.J.Biochem.213：1091-1099(1993))。哺乳动物中，该复合物通过特定的磷酸酶和蛋白质激酶磷酸化而调节。已在鼠肝细胞中研究了该复合物(Chicco等，J.Biol.Chem.269：19427-19434(1994))以及其由基因Bckdha(Elα)，Bckdhb(Elβ)，Dbt(El)和Did(E3)编码。恶臭假单胞菌BCKAD复合物的El和E3组分已被结晶(Aevarsson等，Nat.Struct.Biol.6：785-792(1999)；Mattevi Science 255：1544-1550(1992))并且已研究了该酶复合物(Sokatch等，J.Bacteriol.148：647-652(1981))。恶臭假单胞菌BCKAD基因的转录由bkdR的基因产物激活(Hester等，Eur.J.Biochem.233：828-836(1995))。一些生物体包括褐鼠(Paxton等，Biochem.J.234：295-303(1986))和酿酒酵母(Sinclair等，Biochem.Mol.Biol.Int.31：911-922(1993))中，已显示该复合物具有广泛的底物范围，除了支链氨基酸前体外，包括线性氧代-酸类诸如2-氧代丁酸和α-酮戊二酸。牛BCKAD活性中心设计为有利于替代的底物乙酰CoA(Meng和Chuang，Biochemistry 33：12879-12885(1994))。

催化丙酮酸转化为乙酰-CoA的丙酮酸脱氢酶复合物也已进行了广泛研究。大肠杆菌酶中，El组分中特定的残基负责底物特异性(Bisswanger，H.J Biol Chem.256：815-822(1981)；Eur.J Biochem.8：535-540(1969)；Gong等，J Biol Chem.275：13645-13653(2000))。如前所提及的，酶工程工作改善了缺氧状态下大肠杆菌PDH的酶活性(Kim等，Appl.Environ.Microbiol.73：1766-1771(2007)；Kim等，J.Bacteriol.190：3851-3858)2008)；Zhou等，Biotechnol.Lett.30：335-342(2008))。与大肠杆菌PDH相反，枯草杆菌复合物在缺氧状态下有活性并且必需在缺氧状态下培养(Nakano J.Bacteriol.179：6749-6755(1997))。在甘油上培养期间表征的肺炎克雷伯氏菌PDH在缺氧状态下也有活性(Menzel等，J.Biotechnol.56：135-142(1997))。来自牛肾地酶复合物的晶体结构(Zhou等，Proc.Natl.Acad.Sci.U.S.A.98：14802-14807(2001))和来自棕色固氮菌的E2催化域是可得到的(Mattevi等，Science 255：1544-1550(1992))。一些哺乳动物PDH酶复合物可对替代底物诸如2-氧代丁酸起作用，虽然褐鼠PDH和BCKAD的比较动力学表明BCKAD对作为底物的2-氧代丁酸具有更高的活性(Paxton等，Biochem.J.234：295-303(1986))。

作为以上所述大的多酶2-酮酸脱氢酶复合物的替代，一些厌氧生物利用2-酮酸氧化还原酶家族(OFOR)中的酶催化2-酮酸类的酰化氧化脱羧。不同于脱氢酶复合物，这些酶包含铁-硫簇，利用不同的辅因子，并且使用铁氧还蛋白或黄素氧还蛋白作为电子受体代替NAD(P)H。虽然该家族的大多数酶以丙酮酸作为特异性底物(POR)一些2酮酸：铁氧还蛋白氧化还原酶已显示接受大量2-酮酸作为底物，包括α-酮戊二酸和2-氧代丁酸(Fukuda andWakagi Biochim.Biophys.Acta 1597：74-80(2002)；Zhang等，J.Biochem.120：587-599(1996))。一种所述酶为来自嗜酸热两面菌超嗜热古菌硫化叶菌7的OFOR，其包含由基因ST2300编码的α和β亚基(Fukuda and Wakagi Biochim.Biophys.Acta 1597：74-80(2002)；Zhang等，J.Biochem.120：587-599(1996))。基于质粒的表达系统已发展用于在大肠杆菌中有效表达该蛋白质(Fukuda等，Eur.J.Biochem.268：5639-5646(2001))并且测定了参与底物特异性的残基(Fukuda和Wakagi Biochim.Biophys.Acta 1597：74-80(2002))。来自嗜热泉生古细菌菌株K1的两种OFOR近来也被克隆入大肠杆菌，进行表征并且发现与大量2-酮酸反应(Nishizawa等，FEBS Lett.579：2319-2322(2005))。这些候选OFOR的基因序列为可得到的，虽然其至今不具有指定GenBank标识符。生物信息证据表明类似的酶存在于所有古细菌、一些厌氧细菌和无线粒体真核中(Fukuda和Wakagi Biochim.Biophys.Acta 1597：74-80(2005))。因为还原的铁氧还蛋白可用于通过铁氧还蛋白-NAD还原酶产生NADH，这类酶从能量观点上是令人感兴趣的(Petitdemange等，Biochim.Biophys.Acta 421：334-337(1976))。同时，由于大部分酶设计成能在缺氧状态下起作用，相对于2-酮酸脱氢酶复合物家族中的酶在缺氧环境中的活性，仅需要少量酶工程设计。

ST2300 NP_378302.1 超嗜热古菌硫化叶菌7

1.2.1.d-氧化还原酶(磷酸化/去磷酸)

该类示例性的酶包括3-磷酸甘油醛脱氢酶，其将甘油醛-3-磷酸转化为D-甘油酸1,3-二磷酸盐(例如，大肠杆菌gapA(Branlant and Branlant Eur.J.Biochem.150：61-66(1985)，天冬氨酸-半醛脱氢酶，其将L-天冬氨酸-4-半醛转化为L-4-天冬氨酰-磷酸盐(例如，大肠杆菌asd(Biellmann等，Eur.J.Biochem.104：53-58(1980))，N-乙酰-γ-谷氨酰基-磷酸盐还原酶，其将N-乙酰-L-谷氨酸-5-半醛转化为N-乙酰-L-谷氨酰基-5-磷酸盐(例如大肠杆菌argC(Parsot等，Gene 68：275-283(1988))，以及谷氨酸-5-半醛脱氢酶，其将L-谷氨酸-5-半醛转化为L-谷氨酰基-5-磷酸盐(例如，大肠杆菌proA(Smith等，J.Bacteriol.157：545-551(1984))。

1.3.1.a-氧化还原酶作用于CH-CH供体

示例性的烯酰基-CoA还原酶为来自丙酮丁醇梭菌的bed基因产物(Atsumi等，Metab Eng(2007)；Boynton等，Journal of Bacteriology 178：3015-3024(1996)，其天然催化丁烯酰辅酶A还原为丁酰辅酶A。该酶的活性可通过bed与丙酮丁醇梭菌etfAB基因一起表达而增强，etfAB基因编码电子传递黄素蛋白。烯酰基-辅酶A还原酶步骤的另外的候选物为来自纤细裸藻的线粒体烯酰基-辅酶A还原酶(Hoffmeister等，Journal of BiologicalChemistry280：4329-4338(2005))。源自该序列的构建体在除去其线粒体靶向前导序列后克隆入大肠杆菌中产生有活性的酶(Hoffmeister等，上文，(2005))。该方法为表达真核基因领域的技术人员所熟知，尤其是具有可以将基因产物靶向至原核生物特定胞内区室的前导序列的那些。来自原核类齿垢密螺旋体的该基因的紧密同系物TDE0597代表第三种烯酰基-辅酶A还原酶，其已被克隆并在大肠杆菌中表达(Tucci and Martin FEBS Letters581：1561-1566(2007))。

示例性的2-烯酸酯还原酶(EC 1.3.1.31)已知催化多种α，β-不饱和羧酸类和醛类的NADH-依赖性还原(Rohdich等，J.Biol.Chem.276：5779-5787(2001))。2-烯酸酯还原酶由一些梭状芽孢杆菌种类中的enr编码(Giesel and Simon Arch Microbiol.135(1)：p.51-57(2001)，包括酪丁酸梭菌和热乙酸梭菌(现在称为热乙酸穆尔氏菌)(Rohdich等，上文，(2001))。在近来公开的克氏梭菌基因组序列中，已报道了9种烯酸酯还原酶编码序列，其中之一已被表征(Seedorf等，Proc Natl Acad Sci U.S.A.105(6)：2128-33(2008))。来自酪丁酸梭菌和热乙酸梭菌的enr基因已被克隆和测序并且彼此呈现59％同一性。还发现前者基因与克氏梭菌中已表征的基因具有大约75％相似性(Giesel and Simon ArchMicrobiol 135(l)：51-57(1983))。已报道基于这些测序结果，enr非常类似于大肠杆菌中的双烯酰辅酶A还原酶(fadH)(163Rohdich等，上文(2001))。热乙酸梭菌enr基因还以酶切活性形式在大肠杆菌中表达(163Rohdich等，上文(2001))。

1.4.1.a作用于氨基酸的氧化还原酶

作用于氨基酸的大多数氧化还原酶以NAD+或NADP+作为受体催化α-氨基酸的氧化脱氨。作用于氨基酸的示例性的氧化还原酶包括谷氨酸脱氢酶(去氨基)，由gdhA编码，亮氨酸脱氢酶(去氨基)，由Idh编码，以及天冬氨酸脱氢酶(去氨基)，由nadX编码。来自大肠杆菌的gdhA基因产物(Korber等，J.Mol.Biol.234：1270-1273(1993)；McPherson and WoottonNucleic.Acids Res.11：5257-5266(1983))，来自海栖热袍菌的gdh(Kort等，Extremophiles 1：52-60(1997)；Lebbink，等，J.Mol.Biol.280：287-296(1998))；Lebbink等，J.Mol.Biol.289：357-369(1999))，以及来自盐沼盐杆菌的gdhAl(Ingoldsby等，Gene349：237-244(2005))催化谷氨酸至2-酮戊二酸和氨的可逆转换，同时分别或一起促成NADP(H)，NAD(H)。蜡样芽胞杆菌的Idh基因编码LeuDH蛋白，其具有宽的底物范围，包括亮氨酸，异亮氨酸，缬氨酸和2-氨基丁酸(Ansorge and Kula Biotechnol Bioeng.68：557-562(2000)；Stoyan等，J.Biotechnol 54：77-80(1997))。编码天冬氨酸脱氢酶的来自海栖热袍菌的nadX基因参与NAD的生物合成(Yang等，J.Biol.Chem.278：8804-8808(2003))。

由lysDH基因编码的赖氨酸6-脱氢酶(脱氨基)催化L-赖氨酸的ε氨基氧化脱氨以形成2-氨基己二酸-6-半醛，其随后非酶促循环以形成Δl-哌啶-6-羧酸盐(Misono andNagasaki J.Bacteriol.150：398-401(1982))。来自嗜热脂肪芽孢杆菌的lysDH基因编码嗜热的NAD-依赖的性赖氨酸6-脱氢酶(Heydari等，Appl Environ.Microbiol 70：937-942(2004))。另外，来自嗜热泉生古细菌K1的lysDH基因通过基因组计划的同源性鉴定。

lysDH AB052732 嗜热脂肪芽孢杆菌

lysDH NP_147035.1 敏捷气热菌K1

ldh P0A393 蜡样芽胞杆菌

2.3.1.a-酰基转移酶(转移磷酸基)

示例性的磷酸盐转移酰基转移酶包括磷酸转乙酰酶，由pta编码，以及磷酸转丁酰酶，由ptb编码。来自大肠杆菌的pta基因编码可将乙酰-CoA转化为乙酰磷酸盐，反之亦然的酶(Suzuki，T.Biochim.Biophys.Acta 191：559-569(1969))。该过程中该酶还可以利用丙酰基-CoA代替乙酰-CoA以形成丙酸盐(Hesslinger等，Mol.Microbiol 27：477-492(1998))。类似地，来自丙酮丁醇梭菌的ptb基因编码可将丁酰CoA转化为丁酰磷酸盐的酶(Walter等，Gene 134(1)：p.107-11(1993))；Huang等，J Mol Microbiol Biotechnol 2(1)：p.33-38(2000))。可在产丁酸盐细菌L2-50(Louis等，J.Bacteriol.186：2099-2106(2004))和巨大芽孢杆菌(Vazquez等，Curr.Microbiol 42：345-349(2001))中发现另外的ptb基因。

2.6.1.a-氨基转移酶

天冬氨酸转氨酶将来自天冬氨酸的氨基转移至α-酮戊二酸，形成谷氨酸和草酰乙酸。该转化由例如来自大肠杆菌的aspC(Yagi等，FEBS Lett.100：81-84(1979))；Yagi等，Methods Enzymol.113：83-89(1985))，来自酿酒酵母的AAT2(Yagi等，J Biochem.92：35-43(1982))和来自拟南芥的ASP5(48，108，225 48.de la等，Plant J 46：414-425(2006)；Kwokand Hanson J Exp.Bot.55：595-604(2004)；Wilkie and Warren ProteinExpr.Purif.12：381-389(1998))的基因产物催化。缬氨酸转氨酶催化缬氨酸和丙酮酸转化为2-酮异戊酸和丙氨酸。大肠杆菌基因avtA编码一种所述的酶(Whalen and BergJ.Bacteriol.150：739-746(1982))。该基因产物还催化α-丁酮酸的胺化以产生α-氨基丁酸，虽然该反应中的胺供体尚未鉴定(Whalen and Berg J.Bacteriol.158：571-574(1984))。大肠杆菌serC的基因产物催化两种反应，磷酸丝氨酸氨基转移酶和磷酸羟苏氨酸氨基转移酶(Lam and Winkler J.Bacteriol.172：6518-6528(1990))，并且不能检测到对非-磷酸化底物的活性(Drewke等，FEBS.Lett.390：179-182(1996))。

Cargill已开发了β-丙氨酸/α-酮戊二酸氨基转移酶用于从β-丙氨酸经丙二酰基半醛生产3-HP(PCT/US2007/076252(Jessen等，))。克氏酵母中SkPYD4的基因产物也表现出优先使用β-丙氨酸作为氨基供体(Andersen等，FEBS.J.274：1804-1817(2007))。SkUGAl编码酿酒酵母GABA氨基转移酶的同源物UGA1(Ramos等Eur.J.Biochem.149：401-404(1985))，而SkPYD4编码参与β-丙氨酸和GABA氨基转移的酶(Andersen等，FEBS.J.274：1804-1817(2007))。3-氨基-2-丙酸甲酯氨基转移酶催化甲基丙二酸半醛转化为3-氨基-2-丙酸甲酯。该酶已在褐鼠和野猪中表征并且由Abat编码(Kakimoto等，Biochim.Biophys.Acta 156：374-380(1968)；Tamaki等，Methods Enzymol.324：376-389(2000))。与3-氨基-2-丙酸甲酯氨基转移酶具有高序列同源性的其他生物中的候选酶包括线虫中的Gta-1和芽孢杆菌中的gabT。另外，由基因gabT编码的大肠杆菌中的一种天然GABA氨基转移酶已显示具有宽的底物特异性(Liu等，Biochemistry 43：10896-10905(2004)；Schulz等，Appl EnvironMicrobiol 56：1-6(1990))。puuE的基因产物催化大肠杆菌中的另一种4-氨基丁酸氨基转移酶(Kurihara等，J.Biol.Chem.280：4602-4608(2005))。

已报道了大肠杆菌4-氨基丁酸氨基转移酶未结合和结合抑制剂的X射线晶体结构(Liu等，Biochemistry 43：10896-10905(2004))。已研究和提示了该底物结合和底物特异性。通过定点诱变和X-射线晶体衍射研究了活性位点残基的作用(Liu等，Biochemistry44：2982-2992(2005))。基于该结构信息，尝试设计大肠杆菌4-氨基丁酸氨基转移酶使其具有新的酶活性。蒂斯研究提供了开发用于BDO途径的氨基转移酶活性的基础。

2.7.2.a-磷酸转移酶，羧基受体

示例性的激酶包括大肠杆菌乙酰激酶，由ackA编码(Skarstedt and SilversteinJ.Biol.Chem.251：6775-6783(1976))，丙酮丁醇梭菌丁酸激酶，由bukl和buk2编码(Walter等，Gene 134(1)：107-111(1993)(Huang等，JMol Microbiol Biotechnol 2(l)：33-38(2000))，和大肠杆菌γ-谷氨酰基激酶，由proB编码(Smith等，J.Bacteriol.157：545-551(1984))。该酶分别磷酸化乙酸盐，丁酸盐和谷氨酸盐。来自大肠杆菌的ackA基因产物还磷酸化丙酸盐(Hesslinger等，Mol.Microbiol 27：477-492(1998))。

2.8.3.a-辅酶-A移转酶

辅酶A-移转酶家族中，大肠杆菌酶酰基-CoA：乙酸盐-CoA移转酶，亦称乙酸盐-CoA移转酶(EC 2.8.3.8)，已显示从多种支链和线性酰基-CoA底物转移CoA部分至乙酸盐，包括异丁酸盐(Matthies and Schink，App.Environ.Microbiol.58：1435-1439(1992))、戊酸盐(Vanderwinkel等，Biochem.Biophys.Res Commun.33：902-908(1968))和丁酸酯(Vanderwinkel等，上文(1968a))。该酶由大肠杆菌K12的atoA(α亚基)和atoD(β亚基)(Korolev等，Acta Crystallogr.D Biol Crystallogr.58：2116-2121(2002)；Vanderwinkel，上文(1968))和谷氨酸棒杆菌ATCC 13032中的actA和cg0592(Duncan等，Appl Environ Microbiol 68：5186-5190(2002))编码。通过序列同源性发现的另外的基因包括大肠杆菌UT189中的atoD和atoA。

类似的转化由克氏梭菌的catl，cat2和cat3基因产物催化，其显示分别表现出琥珀酰-CoA，4-羟基丁酰-CoA和丁酰CoA乙酰基转移酶活性(Seedorf等，Proc Natl Acad SciU.S.A.105(6)：2128-2133(2008)；Sohling and Gottschalk/Bacteriol 178(3)：871-880(1996))。

cat1 P38946.1 克氏梭菌

cat2 P38942.2 克氏梭菌

cat3 EDK35586.1 克氏梭菌

来自厌氧菌发酵氨基酸球菌的戊烯二酸-CoA-移转酶(EC 2.8.3.12)与二酸戊烯二酰CoA和3-丁烯酰基-CoA反应(Mack and Buckel FEBSLett.405：209-212(1997))。编码该酶的基因为gctA和gctB。该酶对其他的CoA衍生物具有降低的但可检测的活性，包括戊二酰CoA，2-羟戊二基-CoA，-CoA和丙烯酰-CoA(Buckel等，Eur.J.Biochem.118：315-321(1981))。该酶已在大肠杆菌中克隆和表达(Mac等，Eur.J.Biochem.226：41-51(1994))。

gctA CAA57199.1 发酵氨基酸球菌

gctB CAA57200.1 发酵氨基酸球菌

3.1.2.a-硫羟酸酯水解酶(CoA特异性的)

在辅酶A水解酶家族中，酶3-羟异丁酰基-辅酶A水解酶对3-HIBCoA特异并且已描述其有效催化缬氨酸降解期间的所需转化(Shimomura等，J Biol Chem 269：14248-14253(1994))。编码该酶的基因包括褐鼠(Shimomura等，上文(1994)；Shimomura等，MethodsEnzymol.324：229-240(2000)和人类(Shimomura等，上文，2000)的hibch。

具有序列同源性的候选基因包括酿酒酵母的hibch和蜡样芽胞杆菌的BC_2292。

己二酰-辅酶A转化为己二酸酯可通过酰基-辅酶A水解酶或对等的硫酯酶进行。主要的大肠杆菌候选基因为tesB(Naggert等，J Biol Chem.266(17)：11044-11050(1991))，其呈现与人acoiH的高相似性，而acoiH为对己二酰-辅酶A具有活性的二羧酸乙酰基转移酶(Westin等，J Biol Chem 280(46)：38125-38132(2005))。该活性还在鼠肝脏中被表征(Deana，Biochem Int.26(4)：p.767-773(1992))。

tesB NP_414986 大肠杆菌

acot8 CAA15502 人类

acot8 NP_570112 褐鼠

其他潜在的大肠杆菌硫羟酸酯水解酶包括tesA(Bonner and Bloch，J BiolChem.247(10)：3123-3133(1972))，ybgC(Kuznetsova等，FEMS Microbiol Rev.29(2)：263-279(2005)；Zhuang等，FEBS Lett.516(1-3)：161-163 2002))，paal(Song等，J BiolChem.281(16)：11028-11038(2006))以及ybdB(Leduc等，J Bacteriol.189(19)：7112-7126(2007))的基因产物。

一些真核的乙酰-CoA水解酶(EC 3.1.2.1)具有宽的底物特异性。来自褐鼠脑的酶(Robinson等，Biochem.Biophys.Res.Commun.71：959-15 965(1976))可与丁酰辅酶A，己酰-辅酶A和丙二酰基辅酶A反应。

acot12 NP_570103.1 褐鼠

4.1.1.a-羰基裂解酶

示例性的羰基裂解酶为乙酰乳酸脱羧酶，其参与柠檬酸盐分解代谢和支链氨基酸生物合成，将2-乙酰乳酸转化为3-羟基丁酮。乳酸乳球菌的该酶由六个亚基组成，其由基因aldB编码，并且由缬氨酸，亮氨酸和异亮氨酸激活(Goupil等，Appl.Environ.Microbiol.62：2636-2640(1996)；Goupil-Feuillerat等，J.Bacteriol.182：5399-5408(2000))。该酶已在大肠杆菌中过表达且表征(Phalip等，FEBSLett.351：95-99(1994))。其他生物中该酶为二聚物，由嗜热链球菌中的aldC(Monnet等，Lett.Appl.Microbiol.36：399-405(2003))，短芽孢杆菌中的aldB(Diderichsen等，J.Bacteriol.172：4315-4321(1990)；Najmudin等，Acta Crystallogr.D.Biol.Crystallogr.59：1073-1075(2003))以及来自产气肠杆菌的budA(Diderichsen等，J.Bacteriol.172：4315-4321(1990))编码。来自短芽孢杆菌的该酶已在枯草杆菌中克隆和过表达并且已经过晶体表征(Najmudin等，Acta Crystallogr.D.Biol.Crystallogr.59：1073-30 1075(2003))。另外，已纯化和表征了来自乳酸明串珠菌的酶但没有分离该基因(O'Sullivan等，FEMS Microbiol.Lett.194：245-249(2001))。

乌头酸脱羧酶催化假丝酵母菌株以及丝状真菌土曲霉中衣康酸生物合成中的最后一步(Bonnarme等，J Bacteriol.177：3573-3578(1995)；Willke and Vorlop ApplMicrobiol Biotechnol 56：289-295(2001))。虽然衣康酸为生物技术目的化合物，但至今尚未报道乌头酸脱羧酶的基因或蛋白序列。

已从许多生物分离且表征了4-草酰巴豆酸酯脱羧酶。

编码该酶的基因包括假单胞菌属(菌株600)中的dmpH和dmpE(Shingler等，JBacteriol.174：711-724(1992))，来自恶臭假单胞菌的xylll和xyllll(Kato和AsanoArch.Microbiol 168：457-463(1997)；Lian和Whitman，J.Am.Chem.Soc.116：10403-10411(1994)；Stanley等，Biochemistry 39：3514(2000))和来自真氧产碱杆菌JMP134的Reut_B5691和Reut_B5692(Hughes等，J Bacteriol.158：79-83(1984))。已克隆并在大肠杆菌中表达了来自假单胞菌属(菌株600)的编码该酶的基因(Shingler等，J Bacteriol.174：711-724(1992))。

已表征了另外的脱羧酶类，其催化肉桂酸盐(苯基丙烯酸盐)和替代的肉桂酸盐衍生物转化为对应的苯乙烯衍生物。这些酶在多种生物中为共同的且已克隆且在大肠杆菌中表达的那些酶的特定基因为：来自酿酒酵母的pad 1(Clausen等，Gene 142：107-112(1994))，来自植物乳杆菌的pdc(Barthelmebs等，Appl Environ Microbiol 67：1063-1069(2001)；Qi等，Metab Eng 9：268-27630(2007)；Rodriguez等，J.Agric.Food Chem.56：3068-3072(2008))，来自产酸克雷伯氏菌(Hashidoko等，Biosci.Biotech.Biochem.58：217-218(1994)；Uchiyama等，Biosci.Biotechnol.Biochem.72：116-123(2008))，戊糖片球菌的pofK(pad)(Barthelmebs等，Appl Environ Microbiol 67：1063-1069(2001))，和来自枯草杆菌和短小芽胞杆菌的padC(Lingen等，Protein Eng 15：585-593(2002))。还纯化和表征了来自荧光假单胞菌的阿魏酸脱羧酶(Huang等，J.Bacteriol.176：5912-5918(1994))。重要地，已显示该类酶是稳定的且不需要外源或内源结合辅因子，由此使得这些酶理论上适于生物转化(Sariaslani，Annu.Rev.Microbiol.61：51-69(2007))。

另外的脱羧酶可从α-酮戊二酸形成琥珀酸半醛。这些包括来自纤细裸藻的α-酮戊二酸脱羧酶(Shigeoka等，Biochem.J.282(Pt 2)：319-323(1992)；Shigeoka and NakanoArch.Biochem.Biophys.288：22-28(1991)；Shigeoka and Nakano Biochem.J.292(Pt 2)：463-467(1993))，其相应的基因序列还有待于测定，以及来自结核分枝杆菌的α-酮戊二酸脱羧酶(Tian等，Proc Natl Acad Sci U.S.A.102：10670-10675(2005))。另外，谷氨酸脱羧酶可将谷氨酸盐转化为4-氨基丁酸，诸如大肠杆菌gadA和gadB基因的产物(De Biase等，Protein.Expr.Purif.8：430-438(1993))。

kgd O50463.4 结核分枝杆菌

gadA NP_417974 大肠杆菌

gadB NP_416010 大肠杆菌

酮酸脱羧酶

丙酮酸脱羧酶(PDC，EC 4.1.1.1)，也称为酮酸脱羧酶，为酒精发酵、催化丙酮酸脱羧至乙醛的关键酶。该酶对脂族2-酮酸类，包括2-丁酮酸、2-戊酮酸、3-羟基丙酮酸和2-苯丙酮酸具有宽的底物范围(Berg等，Science 318：1782-1786 25(2007))。来自运动发酵单胞菌的PDC由pdc编码，已成为直接设计研究以改变对不同底物亲和力的主题(Siegert等，Protein Eng Des Sel 18：345-357(2005))。也对来自酿酒酵母的PDC进行了广泛研究，设计以改变活性，并且在大肠杆菌中功能性地表达(Killenberg-Jabs等，Eur.J.Biochem.268：1698-1704(2001)；Li and Jordan Biochemistry 38：10004-10012(1999)；ter Schure等，Appl.Environ.Microbiol.64：1303-1307(1998))。该酶的晶体结构是可得到的(Killenberg-Jabs Eur.J.Biochem.268：1698-1704(2001))。其他更好地表征的候选PDC包括来自巴氏醋杆菌(Chandra等，Arch.Microbiol.176：443-451(2001))和乳酸克卢费氏酵母(Krieger等，Eur.J.Biochem.269：3256-3263(2002))的酶。

如PDC，苯甲酰甲酸脱羧酶(EC 4.1.1.7)具有宽的底物范围并且已成为酶工程研究的靶标。已广泛研究了来自恶臭假单胞菌的酶并且可得到该酶的晶体结构(Hasson等，Biochemistry 37：9918-9930(1998)；Polovnikova等，Biochemistry 42：1820-1830(2003))。来自恶臭假单胞菌酶活性中心中两个残基的定点诱变改变了对自然和非自然存在底物的亲和力(Km)(Siegert等，Protein Eng Des Sel 18：345-357(2005))。该酶的性质进一步通过定点设计修饰(Lingen等，Protein Eng 15：585-593(2002))；LingenChembiochem 4：721-726(2003))。来自绿脓杆菌的该酶由mdlC编码，也经过了实验表征(Barrowman等，FEMS Microbiology Letters 34：57-60(1986))。来自施氏假单胞菌，荧光假单胞菌和其他生物的另外的候选基因可通过序列同源性推断或利用恶臭假单胞菌中开发的培养选择系统鉴定(Henning等，Appl.Environ.Microbiol.72：7510-7517(2006))。

4.2.1.a-水裂解酶

巴氏真细菌的2-(羟甲基)戊二酸脱水酶为示例性的水裂解酶。该酶已在烟酸盐分解代谢的内容中研究并且由hmd编码(Alhapel等，Proc Natl Acad Sci USA 103：12341-12346(2006))。具有高序列同源性的类似的酶在多毛拟杆菌，Anaerotruncus colihominis和Natranaerobius thermophilius中发现。

第二种示例性的水裂解酶为延胡索酸水化酶，其催化苹果酸盐至延胡索酸盐的脱水。该酶有很多现有的结构信息并且研究人员已成功设计该酶以改变活性，抑制作用和局限性(Weaver，T.Acta Crystallogr.D Biol Crystallogr.61：1395-1401(2005))。另外的延胡索酸盐水化酶包括由来自大肠杆菌(Estevez等，Protein Sci.11：1552-1557(2002)；Hong and Lee Biotechnol.Bioprocess Eng.9：252-255(2004)；Rose and Weaver ProcNatl Acad Sci U S.A 101：3393-3397(2004))，空肠弯曲杆菌(Smith等，Int.JBiochem.CellBiol 31：961-975(1999))和嗜热栖热菌(Mizobata等，Arch.Biochem.Biophys.355：49-55(1998))的fumC，以及来自褐鼠的fumH(Kobayashi等，JBiochem.89：1923-1931(1981))编码的那些。具有高序列同源性的类似的酶包括来自拟南芥的fuml和来自谷氨酸棒杆菌的fumC。

柠苹酸水合酶，也称为2-苹果酸脱水酶，将2-苹果酸盐转化为中康酸盐。2-苹果酸脱水酶活性在谷氨酸盐降解VI途径环境中在破伤风形梭状芽胞杆菌，摩氏摩根氏菌，无丙二酸柠檬酸杆菌中检测(Kato and Asano Arch.Microbiol 168：457-463(1997))；然而编码该酶的基因至今没有测序。

来自丙酮丁醇梭菌的crt基因产物催化3-羟基丁酰-CoA脱水为丁酰辅酶A(Atsumi等，Metab Eng 29(2007)；Boynton等，Journal of Bacteriology 3-3024(1996))。恶臭假单胞菌的烯酰基-辅酶A水化酶，phaA和phaB被认为在苯乙酸盐分解代谢期间进行双链的羟基化；(Olivera等，Proc Natl Acad Sci USA 95(11)：6419-6424(1998))。来自荧光假单胞菌的paaA和paaB催化类似的转化(14Olivera等，上文，1998))。最后，已显示许多大肠杆菌基因表现出烯酰CoA水合酶功能，包括maoC(Park and Lee J Bacteriol 185(18)：5391-5397((2003))，paaF(Park and Lee Biotechnol Bioeng.86(6)：681-686(2004a))；Parkand Lee Appl Biochem Biotechnol.113-116：30335-346(2004b))；Ismail等，Eur JBiochem 270(14)：p.3047-3054(2003)，以及paaG(Park和Lee，上文，2004；Park和Lee上文，2004b；Ismail等，上文，2003)。

大肠杆菌基因fadA和fadB编码多酶复合物，其表现出酮脂酰-辅酶A硫基裂解酶，3-羟酰-辅酶A脱氢酶和烯酰CoA水合酶活性(Yang等，Biochemistry 30(27)：p.6788-6795(1991)；Yang等，J Biol Chem 265(18)：p.10424-10429(1990)；Yang等，J Biol Chem 266(24)：p.16255(1991)；Nakahigashi and Inokuchi Nucleic Acids Res 18(16)：p.4937(1990))。fadI和fadJ基因编码类似的功能并且仅厌氧自然表达(Campbell等，MolMicrobiol 47(3)：p.793-805(2003))。之前已经描述了用于在大肠杆菌中生产聚[(R)-3-羟基丁酸]的方法，其涉及激活fadB(通过基因敲除阴性调节者fadR)和共-表达非-天然的酮硫解酶(来自真氧产碱杆菌的phaA)(Sato等，J Biosci Bioeng 103(1)：38-44(2007))。该工作清楚地表明β-氧化还原酶，尤其是编码3-羟酰-辅酶A脱氢酶和烯酰CoA水合酶活性的fadB的基因产物可作为途径的一部分起作用以从乙酰-CoA前体产生更长链的分子。

4.3.1.a-氨-裂解酶

催化天冬氨酸至延胡索酸去氨基的天冬氨酸酶(EC 4.3.1.1)为微生物中广泛分布的酶，并且已经广泛表征(Viola，R.E.Adv.Enzymol.Relat Areas Mol.Biol 74：295-341(2000))。已经解析了由aspA编码的大肠杆菌天冬氨酸酶的晶体结构(Shi等，Biochemistry36：9136-9144(1997))。大肠杆菌酶也显示与替代的底物天冬氨酸苯甲酯，天冬酰胺，苄基-天冬氨酸和苹果酸盐反应(Ma等，Ann N.Y.Acad Sci 672：60-65(1992))。在各个研究中，对该酶采用定向进化以改变底物特异性(Asano等，Biomol.Eng 22：95-101(2005))。还在流感嗜血杆菌(Sjostrom等，Biochim.Biophys.Acta 1324：182-190(1997))，荧光假单胞菌(Takagi等，J.Biochem.96：545-552(1984))，芽孢杆菌(Sjostrom等，Biochim.Biophys.Acta 1324：182-190(1997))和灵杆菌(Takagi和Kisumi JBacteriol.161：1-6(1985))中表征了具有天冬氨酸酶功能的酶。

3-甲基天冬氨酸酶(EC 4.3.1.2)，亦称β-甲基天冬氨酸酶或3-甲基天冬氨酸氨-裂解酶，催化对映-3-甲基天冬氨酸去氨基为中康酸盐。已经克隆了来自破伤风形梭状芽胞杆菌的3-甲基天冬氨酸酶，在大肠杆菌中功能性表达，并且结晶(Asuncion等，ActaCrystallogr.D Biol Crystallogr.57：731-733(2001)；Asuncion等，Biol Chem.277：8306-8311(2002)；Botting等，Biochemistry 27：2953-2955(1988)；Goda等，Biochemistry31：10747-10756(1992)。无丙二酸柠檬酸杆菌中，该酶由BAA28709编码(Kato和AsanoArch.Microbiol 168：457-463(1997))。还从大肠杆菌YG1002结晶3-甲基天冬氨酸酶(Asano和Kato FEMS Microbiol Lett.118：255-258(1994))，虽然该蛋白质的序列没有登记在公共数据库诸如GenBank中。序列同源性可用于鉴定另外的候选基因，包括破伤风梭菌中的CTC_02563和大肠杆菌0157：H7中的ECs0761。

形成烯酰基-辅酶A产物的候选氨-裂解酶包括β-丙氨酰辅酶A氨-裂解酶(EC4.3.1.6)，其脱去β-丙氨酰辅酶A的氨基，以及3-氨基丁酰-辅酶A氨-裂解酶(EC4.3.1.14)。已经在丙酸梭菌中鉴定和表征了两种β-丙氨酰辅酶A氨裂解酶(Herrmann等，FEBS J.272：813-821(2005))。至今尚未研究其他的β-丙氨酰辅酶A氨裂解酶，但可通过序列相似性鉴定候选基因。一种所述候选物为黄色粘球菌的MXAN_4385。

ac12 CAG29275.1 丙酸梭菌

acl1 CAG29274.1 丙酸梭菌

MXAN_4385 YP_632558.1 黄色粘球菌

5.3.3.a-异构酶

来自氨基丁酸梭菌和克氏梭菌的4-羟基丁酰-辅酶A脱水酶催化4-羟基丁酰-辅酶A与丁烯酰辅酶A的可逆转化并且具有内在的乙烯基乙酰基-辅酶A△异构酶活性(Scherfand Buckel Eur.J Biochem.215：421-429(1993)；Scherf等，Arch.Microbiol 161：239-245(1994))。纯化和表征了两种天然的酶，包括N-末端氨基酸序列(Scherf and Buckel，上文，1993；Scherf等，上文，1994)。来自氨基丁酸梭菌和克氏梭菌的abfD基因与这些N-末端氨基酸序列精确匹配，因此编码4-羟基丁酰-辅酶A脱水酶/乙烯基乙酰基-辅酶A△异构酶。另外，通过基因组计划的同源性鉴定了来自牙龈卟啉单胞菌ATCC 33277的abfD基因。

abfD YP_001396399.1 克氏梭菌DSM 555

abfD P55792 氨基丁酸梭菌

abfD YP_001928843 牙龈卟啉单胞菌ATCC 33277

5.4.3.a-氨基变位酶

赖氨酸2，3-氨基变位酶(EC 5.4.3.2)为将赖氨酸转化为(3S)-3，6-二氨基己酸酯的示例性的氨基变位酶，其将胺基从2位转移至3位。该酶在将赖氨酸发酵至乙酸和丁酸盐的那些细菌中发现，包括如具核梭杆菌(kamA)(Barker等，J.Bacteriol.152：201-207(1982))和近端梭菌(kamA)(Chirpich等，J.Biol.Chem.245：1778-1789(1970))。已经结晶了来自近端梭菌的该酶(Lepore等，Proc.Natl.Acad.Sci.U.S.A 102：13819-13824(2005))。编码该功能的酶也由芽孢杆菌的yodO编码(Chen等，Biochem.J.348Pt 3：539-549(2000))。该酶利用吡哆醛5’-磷酸盐作为辅因子，需要通过S-腺苷甲硫氨酸激活，并且仅立体选择性地与L-赖氨酸反应。该酶尚未显示与替代底物反应。

yodO O34676.1 芽孢杆菌

kamA Q9XBQ8.1 近端梭菌

kamA Q8RHX4 具核梭杆菌亚株nuleatum

第二种氨基变位酶，β-赖氨酸5，6-氨基变位酶(EC 5.4.3.3)催化赖氨酸发酵至乙酸和丁酸盐的下一步，其将(3S)-3，6-二氨基己酸酯转化为(3S，5S)-3，5-二氨基己酸酯，将末端胺基从6位点转移至5位。该酶还催化催化赖氨酸转化为2，5-二氨基己酸酯并且也称为赖氨酸-5，6-氨基变位酶(EC 5.4.3.4)。该酶已在斯氏梭菌中结晶(kamD，kamE)(Berkovitch等，Proc.Natl.Acad.Sci.U.S.A101：15870-15875(2004))。还表征了来自牙龈卟啉单胞菌的该酶(Tang等，Biochemistry 41：8767-8776(2002))。

鸟氨酸4，5-氨基变位酶(EC 5.4.3.5)将D-鸟氨酸转化为2，4-二氨基戊酸，还将末端胺转移至邻近的碳。来自斯氏梭菌的该酶由两种基因oraE和oraS编码，并且已经被克隆，测序且在大肠杆菌中表达(Chen等，J.Biol.Chem.276：44744-44750(2001))。至今尚未在其他生物中表征该酶。

oraE AAK72502 斯氏梭菌

oraS AAK72501 斯氏梭菌

酪氨酸2，3-氨基变位酶(EC 5.4.3.6)参与酪氨酸的生物合成，通过将胺从2位转移至3位而可逆转化酪氨酸为3-氨基-3-(4-羟苯基)丙酸酯。球孢链霉菌中该酶还显示与酪氨酸衍生物反应(Christenson等，Biochemistry 42：12708-12718(2003))。目前没有序列信息。

亮氨酸2，3-氨基变位酶(EC 5.4.3.7)在亮氨酸降解和生物合成期间将L-亮氨酸转化为β-亮氨酸。用于亮氨酸2，3-氨基变位酶的测定法检测了许多生物中的活性(Poston，J.M.Methods Enzymol.166：130-135(1988))，但编码该酶的基因至今没有鉴定。

Cargill已开发了新的2，3-氨基变位酶以将L-丙氨酸转化为P-丙氨酸，由此产生从丙酮酸至3-HP的四个生物化学步骤的途径(Liao等，美国公开No.2005-0221466)。

6.2.1.a-酸-硫羟连接酶

示例性的酸-硫羟连接酶为大肠杆菌sucCD的基因产物，其在消耗一个ATP时共同催化从琥珀酸形成琥珀酰-辅酶A，其为体内可逆反应(Buck等，Biochemistry 24(22)：p.6245-6252(1985))。另外示例性的CoA-连接酶包括鼠乙基酯-辅酶A连接酶，其序列仍未表征(Vamecq等，Biochem J.230(3)：p.683-693(1985))，来自产黄青霉的两个已表征苯乙酸盐-辅酶A连接酶的任何一个(Lamas-Maceiras等，Biochem J 395(1)：147-155(2006)；Wang等，Biochem Biophys Res Commun，360(2)：453-458(2007))，来自恶臭假单胞菌的苯乙酸盐-辅酶A连接酶(Martinez-Bianco等，J Biol Chem.265(12)：7084-7090(1990))和来自枯草杆菌的6-羰基己酸-辅酶A连接酶(Bower等，J Bacteriol 178(14)：4122-4130(1996))。

实施例V来自琥珀酰-辅酶A的示例性的BDO途径

该实施例描述了来自琥珀酰-辅酶A的示例性的BDO途径。

来自琥珀酰-辅酶A的BDO途径在本文描述并且之前已被描述(参见2008年3月14日提交的美国申请系列No.12/049，256和2008年3月14日提交的PCT申请系列No.US08/57168，每篇在此作为参考引入)。另外的途径在图8A中显示。所述示例性的BDO途径的酶与编码这些酶的基因一起列于表15中。

简要地，琥珀酰-辅酶A可通过琥珀酰-辅酶A还原酶(或琥珀酸半醛脱氢酶)(EC1.2.1.b)转化为琥珀酸半醛。如前所述，琥珀酸半醛可通过4-羟基丁酸脱氢酶(ECl.l.l.a)转变为4-羟基丁酸。或者，琥珀酰-辅酶A可通过琥珀酰-辅酶A还原酶(醇形成)(EC1.1.1.c)转化为4-羟基丁酸。如前所述，4-羟基丁酸可通过4-羟基丁酰-辅酶A移转酶(EC2.8.3.a)，或通过4-羟基丁酰-辅酶A水解酶(EC 3.1.2.a)或4-羟基丁酰-辅酶A连接酶(或4-羟基丁酰-辅酶A合成酶)(EC 6.2.l.a)转化为4-羟基丁酰-辅酶A。或者，如前所述4-羟基丁酸可通过4-羟基丁酸激酶(EC 2.7.2.a)转化为4-羟基丁酰-磷酸盐。如前所述，4-羟基丁酰-磷酸盐可通过磷酸转-4-羟基丁酰酶(EC 2.3.l.a)转化为4-羟基丁酰-辅酶A。或者，4-羟基丁酰-磷酸盐可通过4-羟基丁醛脱氢酶(磷酸化)(EC 1.2.l.d)转化为4-羟基丁醛。4-羟基丁酰-辅酶A可通过4-羟基丁酰-辅酶A还原酶(或4-羟基丁醛脱氢酶)(EC 1.2.1.b)转化为4-羟基丁醛。或者，4-羟基丁酰-辅酶A可通过4-羟基丁酰-辅酶A还原酶(醇形成)(1.1.l.c)转化为1,4-丁二醇。如前所述，4-羟基丁醛可通过1,4-丁二醇脱氢酶(ECl.l.l.a)转化为1,4-丁二醇。

实施例VI

另外来自α-酮戊二酸的示例性BDO途径

该实施例描述了来自α-酮戊二酸的示例性的BDO途径。

来自琥珀酰-辅酶A的BDO途径在本文描述并且之前已被描述(参见2008年3月14日提交的美国申请系列No.12/049，256和2008年3月14日提交的PCT申请系列No.US08/57168，每篇在此作为参考引入)。另外的途径在图8B中显示。所述示例性的BDO途径的酶与编码这些酶的基因一起列于表16中。

简要地，如前所述，α-酮戊二酸可通过α-酮戊二酸脱羧酶(EC 4.1.1.a)转化为琥珀酸半醛。或者，α-酮戊二酸可通过谷氨酸脱氢酶(EC 1.4.l.a)转化为谷氨酸盐。4-氨基丁酸可通过4-氨基丁酸氧化还原酶(去氨基)(EC 1.4.1.a)或4-氨基丁酸氨基转移酶(EC2.6.1.a)转化为琥珀酸半醛。谷氨酸盐可通过谷氨酸脱羧酶(EC 4.1.l.a)转化为4-氨基丁酸。如前所述，琥珀酸半醛可通过4-羟基丁酸脱氢酶(EC l.l.l.a)转化为4-羟基丁酸。如前所述，4-羟基丁酸可通过4-羟基丁酰-辅酶A移转酶(EC 2.8.3.a)或通过4-羟基丁酰-辅酶A水解酶(EC 3.1.2.a)，或4-羟基丁酰-辅酶A连接酶(或4-羟基丁酰-辅酶A合成酶(EC6.2.1.a)转化为4-羟基丁酰-辅酶A。4-羟基丁酸可通过4-羟基丁酸激酶(EC 2.7.2.a)转化为4-羟基丁酰-磷酸盐。如前所述，4-羟基丁酰-磷酸盐可通过磷酸转-4-羟基丁酰酶(EC2.3.l.a)转化为4-羟基丁酰-辅酶A。或者，4-羟基丁酰-磷酸盐可通过4-羟基丁醛脱氢酶(磷酸化)(EC 1.2.l.d)转化为4-羟基丁醛。如前所述，4-羟基丁酰-辅酶A可通过4-羟基丁酰-辅酶A还原酶(或4-羟基丁醛脱氢酶)(EC 1.2.1.b)转化为4-羟基丁醛。4-羟基丁酰-辅酶A可通过4-羟基丁酰-辅酶A还原酶(醇形成)(EC 1.1.l.c)转化为1,4-丁二醇。如前所述，4-羟基丁醛可通过1,4-丁二醇脱氢酶(EC l.l.l.a)转化为1,4-丁二醇。

实施例VII来自4-氨基丁酸的BDO途径

该实施例描述了来自4-氨基丁酸的示例性的BDO途径。

图9A描述了示例性的BDO途径，其中4-氨基丁酸转化为BDO。所述示例性的BDO途径的酶与编码这些酶的基因一起列于表17中。

简要地，4-羟基丁酸可通过4-氨基丁酸辅酶A移转酶(EC 2.8.3.a)，4-氨基丁酰-辅酶A水解酶(EC 3.1.2.a)或4-4-氨基丁酸-辅酶A连接酶(或4-氨基丁酰-辅酶A合成酶)(EC 6.2.l.a)转化为4-氨基丁酰-辅酶A。4-氨基丁酰-辅酶A可通过4-氨基丁酰-辅酶A氧化还原酶(去氨基)(EC 1.4.1.a)或4-氨基丁酰-辅酶A氨基转移酶(EC 2.6.1.a)转化为4-氧代丁酰-辅酶A。4-氧代丁酰-辅酶A可通过4-氧代丁酰-辅酶A脱氢酶(EC 1.1.l.a)转化为4-羟基丁酰-辅酶A。4-羟基丁酰-辅酶A可通过4-羟基丁酰-辅酶A还原酶(醇形成)(EC1.1.l.c)转化为1,4-丁二醇。或者，4-羟基丁酰-辅酶A可通过4-羟基丁酰-辅酶A还原酶(或4-羟基丁醛脱氢酶)(EC 1.2.1.b)转化为4-羟基丁醛。4-羟基丁醛可通过1,4-丁二醇脱氢酶(EC 1.1.l.a)转化为1,4-丁二醇。

图9A中显示用于将4-氨基丁酸转化为BDO的另一种示例性的BDO途径的酶。所述示例性的BDO途径的酶与编码这些酶的基因一起列于表18中。

简要地，4-羟基丁酸可通过4-氨基丁酸辅酶A移转酶(EC 2.8.3.a)，4-氨基丁酰-辅酶A水解酶(EC 3.1.2.a)或4-氨基丁酸-辅酶A连接酶(或4-氨基丁酰-辅酶A合成酶)(EC6.2.1.a)转化为4-氨基丁酰-辅酶A。4-氨基丁酰-辅酶A可通过4-氨基丁酰-辅酶A还原酶(醇形成)(EC 1.1.1.c)转化为4-氨基丁-l-醇。或者，4-氨基丁酰-辅酶A可通过4-氨基丁酰-辅酶A还原酶(或4-氨基丁脱氢酶)(EC 1.2.1.b)转化为4-氨基丁，并且4-氨基丁通过4-氨基丁-l-醇脱氢酶(EC 1.1.1.a)转化为4-氨基丁-l-醇。4-氨基丁-l-醇可通过4-氨基丁-l-醇氧化还原酶(去氨基)(EC 1.4.1.a)或4-氨基丁-l-醇氨基转移酶(EC 2.6.1.a)转化为4-羟基丁醛。4-羟基丁醛可通过1,4-丁二醇脱氢酶(EC 1.1.1.a)转化为1,4-丁二醇。

图9B描述了示例性的BDO途径，其中4-氨基丁酸转化为BDO。所述示例性的BDO途径的酶与编码这些酶的基因一起列于表19中。

简要地，4-氨基丁酸可通过4-氨基丁酸激酶(EC 2.7.2.a)转化为[(4-氨基丁醇基)氧]膦酸。[[4-氨基丁醇基)氧]膦酸可通过4-氨基丁醛脱氢酶(磷酸化)(EC 1.2.1.d)转化为4-氨基丁醛。4-氨基丁醛可通过4-氨基丁-l-醇脱氢酶(EC 1.1.l.a)转化为4-氨基丁-l-醇。4-氨基丁-l-醇可通过4-氨基丁-l-醇氧化还原酶(去氨基)(EC 1.4.1.a)或4-氨基丁-l-醇氨基转移酶(EC 2.6.1.a)转化为4-羟基丁醛。或者，[(4-氧代丁醇基)氧]膦酸可通过[(4-氧代丁醇基)氧]膦酸氧化还原酶(去氨基)(EC 1.4.1.a)或[(4-氨基丁醇基)氧]膦酸氨基转移酶(EC 2.6.1.a)转化为[(4-氧代丁醇基)氧]膦酸。[(4-氧代丁醇基)氧]膦酸可通过4-羟基丁酰-磷酸盐脱氢酶(EC 1.1.1.a)转化为4-羟基丁酰-磷酸盐。4-羟基丁酰-磷酸盐可通过4-羟基丁醛脱氢酶(磷酸化)(EC 1.2.1.d)转化为4-羟基丁醛。4-羟基丁醛可通过1,4-丁二醇脱氢酶(EC 1.1.l.a)转化为1,4-丁二醇。

图9C显示通过乙酰乙酸的示例性的途径。

实施例VIII来自α-酮戊二酸的示例性的BDO途径

该实施例描述了来自α-酮戊二酸的示例性的BDO途径。

图10描述了示例性的BDO途径，其中α-酮戊二酸转化为BDO。所述示例性的BDO途径的酶与编码这些酶的基因一起列于表20中。

简要地，α-酮戊二酸可通过α-酮戊二酸5-激酶(EC 2.7.2.a)转化为α-酮戊二酸基-磷酸盐。α-酮戊二酸基-磷酸盐可通过2，5-二氧代戊酸半醛脱氢酶(磷酸化)(EC1.2.1.d)转化为2，5-二氧代戊酸。2，5-二氧代戊酸可通过2，5-二氧代戊酸还原酶(EC1.1.1.a)转化为5-羟基-2-氧代戊酸。或者，α-酮戊二酸可通过α-酮戊二酸辅酶A移转酶(EC2.8.3.a)，α-酮戊二酸基-辅酶A水解酶(EC 3.1.2.a)或α-酮戊二酸基-辅酶A连接酶(或α-酮戊二酸基-辅酶A合成酶)(EC 6.2.1.a)转化为α-酮戊二酸基-辅酶A。α-酮戊二酸基-辅酶A可通过α-酮戊二酸基-辅酶A还原酶(或2，5-二氧代戊酸脱氢酶)(EC 1.2.1.b)转化为2，5-二氧代戊酸。2，5-二氧代戊酸可通过5-羟基-2-氧代戊酸脱氢酶转化为5-羟基-2-氧代戊酸。或者，α-羟基丁酰-辅酶A可通过α-酮戊二酸基-辅酶A还原酶(醇形成)(EC 1.1.1.c)转化为5-羟基-2-氧代戊酸。5-羟基-2-氧代戊酸可通过5-羟基-2-氧代戊酸脱羧酶(EC4.1.1.a)转化为4-羟基丁醛。4-羟基丁醛可通过1,4-丁二醇脱氢酶(EC 1.1.l.a)转化为1,4-丁二醇。5-羟基-2-氧代戊酸可通过5-羟基-2-氧代戊酸脱氢酶(脱羧)(EC 1.2.1.c)转化为4-羟基丁酰-辅酶A。

实施例IX来自谷氨酸盐的示例性的BDO途径

该实施例描述了来自谷氨酸盐的示例性的BDO途径。

图11描述了其中谷氨酸盐转化为BDO的示例性的BDO途径。所述示例性的BDO途径的酶与编码这些酶的基因一起列于表21中。

简要地，谷氨酸盐可通过谷氨酸盐辅酶A移转酶(EC 2.8.3.a)，谷氨酰基辅酶A辅酶A水解酶(EC 3.1.2.a)或谷氨酰基-辅酶A连接酶(或谷氨酰基-辅酶A合成酶)(EC6.2.1.a)转化为谷氨酰基辅酶A。或者，谷氨酸盐可通过谷氨酸盐5-激酶(EC 2.7.2.a)转化为谷氨酸盐-5-磷酸盐。谷氨酸盐-5-磷酸盐可通过谷氨酸盐-5-半醛脱氢酶(磷酸化)(EC1.2.1.d)转化为谷氨酸盐-5-半醛。谷氨酰基辅酶A可通过谷氨酰基-辅酶A还原酶(或谷氨酸盐-5-半醛脱氢酶)(EC 1.2.1.b)转化为谷氨酸盐-5-半醛。谷氨酸盐-5-半醛可通过谷氨酸盐-5-半醛还原酶(EC 1.1.1.a)转化为2-氨基-5-羟基戊酸。或者，谷氨酰基-辅酶A可通过谷氨酰基-辅酶A还原酶(醇形成)(1.1.1.c)转化为2-氨基-5-羟基戊酸。2-氨基-5-羟基戊酸可通过2-氨基-5-羟基戊酸氧化还原酶(去氨基)(EC 1.4.1.a)或2-氨基-5-羟基戊酸氨基转移酶(EC 2.6.1.a)转化为5-羟基-2-氧代戊酸。5-羟基-2-氧代戊酸可通过5-羟基-2-氧代戊酸脱羧酶(EC 4.1.1.a)转化为4-羟基丁醛。4-羟基丁醛可通过1,4-丁二醇脱氢酶(EC 1.1.1.a)转化为1,4-丁二醇。或者，5-羟基-2-氧代戊酸可通过5-羟基-2-氧代戊酸脱氢酶(脱羧)(EC 1.2.1.c)转化为4-羟基丁酰-辅酶A。

实施例X来自乙酰乙酰基-CoA的示例性的BDO

该实施例描述了来自乙酰乙酰基-CoA的示例性的BDO途径。

图12描述了其中乙酰乙酰基-CoA转化为BDO的示例性的BDO途径。所述示例性的BDO途径的酶与编码这些酶的基因一起列于表22中。

简要地，乙酰乙酰基-CoA可通过3-羟基丁酰-辅酶A脱氢酶(EC 1.1.1.a)转化为3-羟基丁酰-辅酶A。3-羟基丁酰-辅酶A可通过3-羟基丁酰-辅酶A脱水酶(EC 4.2.1.a)转化为巴豆酰-辅酶A。巴豆酰-辅酶A可通过乙烯基乙酰基-辅酶A△异构酶(EC 5.3.3.3)转化为乙烯基乙酰基-辅酶A。乙烯基乙酰基-辅酶A可通过4-羟基丁酰-辅酶A脱水酶(EC 4.2.1.a)转化为4-羟基丁酰-辅酶A。4-羟基丁酰-辅酶A可通过4-羟基丁酰-辅酶A还原酶(醇形成)(EC1.1.l.c)转化为1,4-丁二醇。或者，4-羟基丁酰-辅酶A可通过4-羟基丁酰-辅酶A还原酶(或4-羟基丁醛脱氢酶)(EC 1.2.1.b)转化为4-羟基丁醛。4-羟基丁醛可通过1,4-丁二醇脱氢酶(EC 1.1.1.a)转化为1,4-丁二醇。

实施例XI来自高丝氨酸的示例性的BDO途径

该实施例描述了来自高丝氨酸的示例性的BDO途径。

图13描述了其中高丝氨酸转化为BDO的示例性的BDO途径。所述示例性的BDO途径的酶与编码这些酶的基因一起列于表23中。

简要地，高丝氨酸可通过高丝氨酸脱氨酶(EC 4.3.1.a)转化为4-羟基丁-2-烯酸酯。或者，高丝氨酸可通过高丝氨酸辅酶A移转酶(EC 2.8.3.a)，高丝氨酸-氨基丁酰-辅酶A水解酶(EC 3.1.2.a)或高丝氨酸-辅酶A连接酶(或高丝氨酸-辅酶A合成酶)(EC 6.2.1.a)转化为高丝氨酸-辅酶A。高丝氨酸-辅酶A可通过高丝氨酸-辅酶A脱氨酶(EC 4.3.1.a)转化为4-羟基丁-2-烯酰基-辅酶A。4-羟基丁-2-烯酸酯可通过4-羟基丁-2-烯酰基-辅酶A移转酶(EC 2.8.3.a)，4-羟基丁-2-烯酰基-辅酶A水解酶(EC 3.1.2.a)或4-羟基丁-2-烯酰基-辅酶A连接酶(或4-羟基丁-2-烯酰基-辅酶A合成酶)(EC 6.2.1.a)转化为4-羟基丁-2-烯酰基-辅酶A。或者，4-羟基丁-2-烯酸酯可通过4-羟基丁-2-烯酸酯还原酶(EC 1.3.1.a)转化为4-羟基丁酸。4-羟基丁酸可通过4-羟基丁酰-辅酶A移转酶(EC 2.8.3.a)，4-羟基丁酰-辅酶A水解酶(EC 3.1.2.a)或4-羟基丁酰-辅酶A连接酶(或4-羟基丁酰-辅酶A合成酶)(EC6.2.1.a)转化为4-羟基丁酰-辅酶A。4-羟基丁-2-烯酰基-辅酶A可通过4-羟基丁-2-烯酰基-辅酶A还原酶(EC 1.3.1.a)转化为4-羟基丁酰-辅酶A。4-羟基丁酰-辅酶A可通过4-羟基丁酰-辅酶A还原酶(醇形成)(EC 1.1.l.c)转化为1,4-丁二醇。或者，4-羟基丁酰-辅酶A可通过4-羟基丁酰-辅酶A还原酶(或4-羟基丁醛脱氢酶)(EC 1.2.1.b)转化为4-羟基丁醛。4-羟基丁醛可通过1,4-丁二醇脱氢酶(EC 1.1.1.a)转化为1,4-丁二醇。

实施例XII

表达琥珀酰-辅酶A合成酶的产BDO菌株

该实施例描述了在表达琥珀酰-辅酶A合成酶的产BDO菌株中增加的BDO生产。

如上所述，琥珀酸可通过转化为琥珀酰-辅酶A而用于BDO生产的前体(也参见W02008/115840，WO 2009/023493，美国公开2009/0047719，美国公开2009/0075351)。因此，宿主菌株经遗传修饰以过表达大肠杆菌sucCD基因，其编码琥珀酰-辅酶A合成酶。大肠杆菌sucCD操纵子的核苷酸序列显示在图14A中，用于编码琥珀酰-辅酶A合成酶亚基的氨基酸序列显示在图14B和14C中。简要地，大肠杆菌sucCD基因通过从大肠杆菌染色体DNA PCR而克隆并且利用标准的分子生物学方法导入多拷贝质粒pZS*13，pZA13和pZE33的PAllacO-1启动子后(Lutz and Bujard，Nucleic Acids Res.25：1203-1210(1997))。

过表达编码琥珀酰-辅酶A合成酶的大肠杆菌sucCD基因。结果表明相比天然表达水平或琥珀酰-CoA/乙酰-辅酶A移转酶catl的表达，导入菌株sucCD以表达琥珀酰-辅酶A合成酶提高了各种菌株中BDO的产生。因此，通过过表达编码琥珀酰-辅酶A合成酶的天然大肠杆菌sucCD基因提高了BDO的产生。

实施例XIII

编码BDO途径酶的异源基因的表达

该实施例描述了各种外源途径酶的表达以提供改进的BDO生产。

α-酮戊二酸脱羧酶。在宿主菌株中表达编码α-酮戊二酸脱羧酶的牛分枝杆菌sucA基因。牛分支杆菌sucA的过表达改进了BDO的生产(也参见W02008/115840，WO 2009/023493，美国公开2009/0047719，美国公开2009/0075351)。牛分支杆菌sueA的核苷酸和氨基酸序列以及编码的α-酮戊二酸脱羧酶在图15中显示。

为了构建牛分支杆菌sucA表达菌株，利用如下所示引物从牛分枝杆菌BCG的基因组DNA(ATCC 19015；American Type Culture Collection，Manassas VA)扩增编码α-酮戊二酸脱羧酶的sucA基因片断。通过四个扩增DNA片断的连接反应组装全长基因，并且克隆入表达载体pZS*13和pZE23的Pal lacO-l启动子后(Lutz and Bujard，Nucleic AcidsRes.25：1203-1210(1997))。组装基因的核苷酸序列通过DNA测序验证。

用于片断1的引物：

5'-ATGTACCGCAAGTTCCGC-3'(SEQ ID NO：)

5'-CAATTTGCCGATGCCCAG-3'(SEQ ID NO：)

用于片断2的引物：

5'-GCTGACCACTGAAGACTTTG-3'(SEQ ID NO：)

5'-GATCAGGGCTTCGGTGTAG-3'(SEQ ID NO：)

用于片断3的引物：

5'-TTGGTGCGGGCCAAGCAGGATCTGCTC-3'(SEQ ID NO：)

5'-TCAGCCGAACGCCTCGTCGAGGATCTCCTG-3'(SEQ ID NO：)

用于片断4的引物：

5'-TGGCCAACATAAGTTCACCATTCGGGCAAAAC-3'(SEQ ID NO：)

5'-TCTCTTCAACCAGCCATTCGTTTTGCCCG-3'(SEQ ID NO：)

利用体外和体内测定法证实了α-酮戊二酸脱羧酶的功能性表达。随后通过之前报道的方法测定SueA酶活性(Tian等，Proc.Natl.Acad.Sci.USA 102：10670-10675(2005))。该反应混合物包含50mM磷酸钾缓冲液，pH 7.0，0.2mM硫胺焦磷酸盐，1mMMgCl₂，0.8mM铁氰化物，1mMα-酮戊二酸和细胞粗裂解物。通过铁氰化物在430nm的还原监测酶活性。利用大肠杆菌全细胞培养物验证SucA酶的体内功能。用编码SucA酶和4-羟基丁酸脱氢酶(4Hbd)的质粒转化的大肠杆菌MG1655laclq的单克隆接种入含有合适抗生素的5mL LB培养基中。细胞在37℃有氧培养整夜。200μl过夜培养物引入补充20g/L葡萄糖，100mM 3-(N-吗啉代)丙磺酸(MOPS)以改善缓冲能力，以及10μg/mL硫胺和合适的抗生素的8mL M9基本培养基中(6.78g/L Na2HP04，3.0g/L KH₂PO₄，0.5g/L NaCl，1.0g/L NH4C1，1mMmgS04，0.1mM CaCl₂)。通过用氮气冲洗加盖的无氧瓶5分钟，接种后用23G针刺穿隔膜而建立微需氧条件。培养期间针保持在瓶中以允许少量空气进入瓶中。当培养达到中对数生长期时用0.2mM异丙基P-D-l-硫代吡喃半乳糖苷(IPTG)诱导蛋白质表达。作为对照，在同样的条件下培养仅用编码4-羟基丁酸脱氢酶的质粒和仅空载体转化的大肠杆菌MG1655laclq菌株(参见表23)。利用LCMS方法监测培养基中4-羟基丁酸(4HB)的累积。仅表达分支杆菌α-酮戊二酸脱羧酶的大肠杆菌菌株产生显著量的4HB(参见图16)。

表24.包含各种对照和编码sucA以及4-羟基丁酸脱氢酶的质粒的三个菌株。

单独的实验表明α-酮戊二酸脱羧酶途径功能与还原的三羧酸循环无关。大肠杆菌菌株ECKh-401(△adhE△ldhA△pflB△lpdA：：K.p.lpdA322△mdh△arcA)用作宿主菌株(参见表25)。所有三个构建体包含编码4HB脱氢酶(4Hbd)的基因。构建体1还包含编码α-酮戊二酸脱羧酶(sucA)的基因。构建体2包含编码琥珀酰-辅酶A合成酶的基因(sucCD)和辅酶A-依赖性琥珀酸半醛脱氢酶基因(sucD)，其为4HB经还原的三羧酸循环而合成所必需的。构建体3包含所有1和2的基因。除了第二个在微需氧条件下培养外，这三个大肠杆菌菌株在如上所述同样的条件下培养。通过表达SucA酶，构建体3比构建体2产生更多的4HB，其依赖于用于4HB合成的还原的三羧酸循环(参见图17)。

通过流量分析实验提供α-酮戊二酸脱羧酶在4HB和BDO生产中贡献的进一步支持。染色体上包含sucCD-sucD和sucA的ECKh-432培养物在含有l-13C-葡萄糖(60％)和U-13C-葡萄糖(40％)混合物的M9基本培养基中培养。收集生物质，蛋白质分离且水解为氨基酸，通过如前所述的气相色谱-质谱分析法(GCMS)分析氨基酸的标记分布(Fischer and Sauer，Eur.J.Biochem.270：880-891(2003))。另外，通过W02008115840A2中所述的GCMS分析分泌的4HB和BDO的标记分布。该数据用于利用已建立的方法计算胞内流量分布(Suthers等，Metab.Eng.9：387-405(2007))。结果表明56％和84％之间的α-酮戊二酸通过α-酮戊二酸脱羧酶途径进入BDO途径。其余的由α-酮戊二酸脱氢酶氧化，随后经过琥珀酰-辅酶A路径进入BDO。

这些结果证实了包含在质粒上表达的来自牛分枝杆菌BCG的sucA基因的产4-羟基丁酸菌株。当编码该基因的质粒不存在时，没有表达sucD(辅酶A-依赖性琥珀酸半醛脱氢酶)时可以忽略4-羟基丁酸的产生。牛分支杆菌基因为结核分枝杆菌基因的紧密同系物，其酶产物之前已经表征(Tian等，上文，2005)。

琥珀酸半醛脱氢酶(辅酶A-依赖性)，4-羟基丁酸脱氢酶和4-羟基丁酰-辅酶A/乙酰-辅酶A移转酶。来自牙龈卟啉单胞菌W83的基因可以是1,4-丁二醇生产途径的有效组分(也参见W02008/115840，WO 2009/023493，美国公开2009/0047719，美国公开2009/0075351)。来自牙龈卟啉单胞菌的辅酶A-依赖性琥珀酸半醛脱氢酶(sucD)的核苷酸序列在图18A中显示，其编码的氨基酸序列在图18B中显示。来自牙龈卟啉单胞菌的4-羟基丁酸脱氢酶(4hbd)的核苷酸序列在图19A中显示，其编码的氨基酸序列在图19B中显示。来自牙龈卟啉单胞菌的4-羟基丁酸辅酶A移转酶(cat2)的核苷酸序列在图20A中显示，其编码的氨基酸序列在图20B中显示。

简要地，编码琥珀酸半醛脱氢酶(辅酶A-依赖性)和4-羟基丁酸脱氢酶，并且有时另外编码4-羟基丁酰-CoA/乙酰-辅酶A的来自牙龈卟啉单胞菌W83的基因通过从牙龈卟啉单胞菌染色体DNAPCR克隆并且利用标准的分子生物学方法导入多拷贝质粒pZS*13，pZA13和pZE33的PAllacO-1启动子后(Lutz and Bujard，Nucleic Acids Res.25：1203-1210(1997))。这些质粒随后被导入宿主菌株中。

牙龈卟啉单胞菌W83基因被导入如上所述的生产菌株中。一些菌株仅包含琥珀酸半醛脱氢酶(辅酶A-依赖性)和4-羟基丁酸脱氢酶而没有4-羟基丁酰-辅酶A/乙酰-辅酶A移转酶。

丁酸激酶和磷酸转丁酰酶。丁酸激酶(BK)和磷酸转丁酰酶(PTB)可用于产生4-羟基丁酰-辅酶A(也参见W02008/115840，WO 2009/023493，美国公开2009/0047719，美国公开2009/0075351)。尤其，丙酮丁醇棱菌基因bukl和ptb可用于功能性BDO途径的一部分。

最初的实验涉及天然丙酮丁醇梭菌PTB(020)和BK(021)基因的克隆和在中的表达。其中需要时，每个基因的起始密码子和终止密码子分别修饰为"ATG"和"TAA"，用于大肠杆菌中的更优化表达。丙酮丁醇梭菌基因序列(020N和021N)和其相应的翻译肽序列在图21和22中显示。

PTB和BK基因在丙酮丁醇梭菌中作为操纵子存在，PTB(020)基因先表达。两个基因通过序列"atta aagttaagtg gaggaatgtt aac"(SEQ ID NO：)连接，其包括用于下游BK(021)基因的重-起始核醣体结合位点。在这里两个基因融合至用于大肠杆菌中表达的表达载体中的lac-控制的启动子(Lutz and Bujard，Nucleic Acids Res.25：1203-1210(1997))。

由于丙酮丁醇梭菌基因中密码子的高频率，而其在大肠杆菌中很少存在，发现来自这些载体构建体的两个蛋白质比其他的外源表达基因的表达要低。因此预测新的020和021基因改变了稀有密码子而替代以在大肠杆菌基因序列中更高频出现的密码子。该密码子优化方法遵循之前所述的算法(Sivaraman等，Nucleic Acids Res.36：el6(2008))。该方法根据在其两侧均有某些密码子时其出现频率的情况而预测密码子替换。

测定用于020(图23)和021(图)的替代基因序列，其中基于其相邻密码子环境的发生率更多稀有密码子由更优势的密码子取代(A<B<C<D)。这些预测的序列中并未引入相比天然020和021肽序列在实际肽序列上的变化。

由密码子优化引起的BK和PTB蛋白质表达的改进在图25A中显示。天然基因序列的表达在泳道2中显示，而020B-021B和020C-021C的表达分别在泳道3和4中显示。密码子-优化操纵子020B-021B(2021B)和020C-021C(2021C)中更高水平的蛋白质表达还导致在同等-表达的大肠杆菌粗提取液中相比天然的操纵子(2021n)活性的提高(图25B)。

密码子优化的操纵子在菌株ECKh-432(△adhE△ldhA△pflB△lpdA：：K.p.lpdA322△mdh△arcA gltAR163L fimD：：大肠杆菌sucCD，牙龈卟啉单胞菌sucD，牙龈卟啉单胞菌4hbd fimD；；牛分支杆菌sucA，克氏梭菌4hbd)中的质粒上与丙酮丁醇梭菌醛脱氢酶一起表达以提供完全的BDO途径。在包含20g/L葡萄糖的M9基本培养基中培养细胞，如上所述利用23G针维持微需氧条件。测定得到的葡萄糖至最终产物BDO的转化。还测定了γ-丁内酯(GBL)的累积，其为源自4Hb-CoA的自发重排分子，PTB-BK酶对的直接产物。图26显示产生可比较BDO水平的替代酶功能Cat2(034)的天然2021n操纵子的表达，其能够将4HB和游离的辅酶A转化为4HB-辅酶A。034的GBL水平显著高于2021n，提示前者酶比来自天然基因表达的PTB-BK具有更多活性。然而当表达密码子-优化的变体2021B和2021C时BDO和GBL的水平高于034或2021n，表明用于PTB和BK的基因密码子优化显著提高其在大肠杆菌BDO合成中的贡献。

这些结果证实丁酸激酶(BK)和磷酸转丁酰酶(PTB)可用于将4-羟基丁酸转化为4-羟基丁酰-辅酶A。这排除了对移转酶诸如4-羟基丁酰-辅酶A/乙酰辅酶A移转酶的需要，其在产生每摩尔4-羟基丁酰-辅酶A时产生一摩尔乙酸盐。来自丙酮丁醇棱菌的该酶存在于许多用于BDO生产的工程设计菌株中。

4-羟基丁酰-辅酶A还原酶。拜氏梭菌Ald基因可用作功能性BDO途径的一部分(也参见W02008/115840，WO 2009/023493，美国公开2009/0047719，美国公开2009/0075351)。拜氏梭菌Ald还可以用以降低产BDO菌株中的乙醇产生。另外，发现了特定的密码子-优化Ald变体(GNM0025B)以改进BDO生产。

天然的拜氏梭菌Ald基因(025n)和该酶预测的蛋白质序列在图27中显示。如所见到的丙酮丁醇棱菌PTB和BK基因，该天然拜氏梭菌Ald基因在大肠杆菌中的表达极低。因此，预测了该基因的四个密码子-优化变体。图28A-28D显示了025的替代基因序列，其中基于其相邻密码子环境的发生率，更多的稀有密码子由更优势的密码子取代(A<B<C<D)(25A，P＝0.05；25B，P＝0.1；25C，P＝0.15；25D，P＝1)。这些预测的序列中并未引入相比天然025肽序列在实际肽序列上的变化。密码子优化显著提高拜氏梭菌Ald的表达(参见图29)，其引起在表达完整BDO途径的细胞中明显更高的葡萄糖转化为BDO(图30A)。

在宿主菌株ECKh-432(△adhE△ldhA△pflB△lpdA：：K.p.lpdA322△mdh△arcAgltAR163L△ackA fimD：：大肠杆菌sucCD，牙龈卟啉单胞菌sucD，牙龈卟啉单胞菌4hbdfimD：：牛分支杆菌sucA，克氏梭菌4hbd)中，该天然的和密码子-优化的基因与牙龈卟啉单胞菌Cat2一起在质粒上表达，由此包含了完全的BDO途径。如上所述细胞在含有20g/L葡萄糖的M9基本培养基中微需氧培养。通过拜氏梭菌Ald酶(表达自密码子-优化的变体基因025B)的BDO和乙醇相对产量与丙酮丁醇梭菌AdhE2酶相比较(参见图30B)。丙酮丁醇梭菌AdhE2酶(002C)产生几乎4倍于BDO的乙醇。比较起来，拜氏梭菌Ald(025B)(与内源的ADH活性联合)产生同等量的BDO，然而相比002C，该酶的BDO与乙醇产量的比率相反。此提示拜氏梭菌Ald比丙酮丁醇梭菌AdhE2对4HB-辅酶A及乙酰-CoA更特异，因此前者为BDO途径中所含的更优选的酶。

拜氏梭菌Ald基因(Toth等，Appl.Environ.Microbiol.65：4973-4980(1999))检测用于催化4-羟基丁酰-辅酶A转化为4-羟基丁醛的候选基因。筛选超过五十种醛脱氢酶的催化4-羟基丁酰-辅酶A转化为4-羟基丁醛的能力。选择拜氏梭菌Ald基因用于引入BDO-生产菌株中，因为与乙酰-CoA相反，该酶偏爱4-羟基丁酰-辅酶A作为底物。这很重要，因为大多数具有醛脱氢酶功能的其他酶(例如，来自丙酮丁醇梭菌的adhE2(Fontaine等，JBacteriol.184：821-830(2002))优选转化乙酰-CoA为乙醛，其随后转化为乙醇。拜氏梭菌基因的应用降低了产BDO生物中作为副产品产生的乙醇的量。此外，该基因的密码子-优化型在大肠杆菌中很好地表达(Sivaraman等，Nucleic Acids Res.36：el6(2008))。

4-羟基丁醛还原酶。利用来自热葡糖苷酶地芽孢杆菌(M10EXG)的adhl的4-羟基丁醛还原酶活性。此通过提高4-羟基丁醛还原酶活性超过内源水平而改进BDO的生产。

筛选多个醇脱氢酶催化4-羟基丁醛还原为BDO的能力。对丁醛具有高活性的大多数醇脱氢酶对4-羟基丁醛表现出更低的活性。一个显著的例外为来自热葡糖苷酶地芽孢杆菌M10EXG的adhl基因(Jeon等，J.Biotechnol.135：127-133(2008))(GNM0084)，其对4-羟基丁醛和丁醛均表现出高活性。

来自热葡糖苷酶地芽孢杆菌的adhl基因的天然基因序列和编码的蛋白质序列在图31中显示。在大肠杆菌中表达热葡糖苷酶地芽孢杆菌aldl基因。

该Adhl酶(084)在大肠杆菌中根据其天然基因很好地表达(参见图32A)。在ADH酶测定中，当丁醛或4HB-醛用作底物时大肠杆菌表达显示很高还原活性的酶(参见图32B)。测定的这些底物的Km值分别为1.2mM和4.0mM。这些活性值表明在所有检测的候选酶中Adhl酶对4HB-醛还原具有最高的活性。

检测084酶与拜氏梭菌Ald联合时促进BDO生产的能力。084基因插入拜氏梭菌Ald变体025B基因后以产生引起两个基因偶联表达的合成操纵子。类似的构建体将025B与其他的ADH候选基因连接，并且检测了包括每个ADH与025B对BDO生产的作用。所用的宿主菌株为ECKh-459(△adhE ldhA△pflB△lpdA：：fnr-pflB6-K.p.lpdA322△mdh△arcA gltAR163LfimD：：大肠杆菌sucCD，牙龈卟啉单胞菌sucD，牙龈卟啉单胞菌4hbd fimD：：牛分支杆菌sueA，克氏梭菌4hbd fimD：：丙酮丁醇梭菌bukl，丙酮丁醇梭菌ptb)，其染色体上包含BDO途径其余的基因。当与仅025B(图33的左箭头)和与内源ADH功能偶联相比较时，与025B偶联表达的084ADH显示最高的BDO量(图33的右箭头)。当与025B配对时，其比其他的ADH酶产生更多的BDO，表示如下：026A-C，丙酮丁醇棱菌丁醇脱氢酶的密码子-优化变体；050，运动发酵单胞菌醇脱氢酶I；052，弗氏柠檬细菌1，3-丙二醇脱氢酶；053，短乳杆菌1，3-丙二醇脱氢酶；057，脆弱拟杆菌乳醛还原酶；058，大肠杆菌1，3-丙二醇脱氢酶；071，枯草杆菌168α-酮戊二酸半醛脱氢酶。标记为"PT5lacO"的构建体为其中基因由PT5lacO启动子驱动的那些。所有其他的情况中，使用PAllacO-1启动子。这表明BDO途径中包含084ADH提高了BDO的生产。

实施例XIV表达丙酮酸脱氢酶的产BDO菌株

该实施例描述了丙酮酸脱氢酶(PDH)的使用以增强BDO的生产。肺炎克雷伯氏杆菌lpdA基因的异源表达用于增强BDO的生产。

理论计算上，生成NADH的丙酮酸转化为乙酰-CoA要求达到1,4-丁二醇的最大理论收率(也参见W02008/115840，WO 2009/023493，美国公开2009/0047719，美国公开2009/0075351；WO 2008/018930；Kim等，Appl.Environ.Microbiol.73：1766-1771(2007)；Kim等，J.Bacteriol.190：3851-3858(2008)；Menzel等，J.Biotechnol.56：135-142(1997))。缺乏PDH活性表现出降低BDO的最大无氧理论收率，如果不能获得磷酸烯醇丙酮酸羧激酶(PEPCK)的活性则降低11％，如果可以获得PEPCK的活性则降低3％。然而更重要的是，在OptKnock菌株#_439中，描述于WO 2009/023493和美国公开2009/0047719中，其敲除了ADHEr，ASPT，LDH_D，MDH和PFLi，缺乏PDH活性将降低最大无氧BDO产率，有或没有PEPCK活性时分别降低54％或43％。在存在外部电子受体时，PDH活性缺乏将降低敲除菌株的最高产量，假定有或没有PEPCK活性时分别降低10％或3％。

PDH为中心代谢最复杂的酶的一种，并且由24个丙酮酸脱羧酶拷贝(El)和12个二氢硫辛酸脱氢酶(E3)组成，其结合二氢硫辛酸转乙酰酶(E2)核的外部。PDH受高NADH/NAD，ATP/ADP和乙酰辅酶A/辅酶A比率的抑制。该酶在诸如大肠杆菌的生物中有限氧或缺氧状态下自然表现出非常低的活性很大程度是由于由lpdA编码的E3对NADH的敏感导致的。为此，克隆和表达了来自肺炎克雷伯氏杆菌的NADH-不敏感的lpdA基因型以在NADH/NAD比率预计比较高的条件下提高PDH活性。

天然lpdA的替换。肺炎克雷伯氏菌的丙酮酸脱氢酶操纵子与大肠杆菌的同等的操纵子在核苷酸水平有78和95％之间的同一性。之前显示肺炎克雷伯氏菌具有在存在甘油时厌氧培养的能力(Menzel等，J.Biotechnol.56：135-142(1997)；Menzel等，Biotechnol.Bioeng.60：617-626(1998))。此外还显示大肠杆菌操纵子lpdA基因中的两个突变提高其厌氧培养的能力(Kim等，Appl.Environ.Microbiol.73：1766-1771(2007)；Kim等，Bacteriol.190：3851-3858(2008))。利用基因组DNA(ATCC700721D)作为模板以及引物KP-lpdA-Bam(5’-acacgcggatccaacgtcccgg-3’)(SEQ ID NO：)和KP-lpdA-Nhe(5’-agcggctccgctagccgcttatg-3’)(SEQ ID NO：)通过PCR扩增肺炎克雷伯菌的IpdA基因。得到的片断克隆入载体pCR-Bluntll-TOPO(Invitrogen；Carlsbad CA)，产生质粒pCR-KP-lpdA。

利用非-复制型质粒和来自枯草杆菌的sacB基因作为反选择工具进行染色体的基因替换(Gay等，J.Bacteriol.153：1424-1431(1983))。使用的载体为缺失了oriT和IS序列的pRE118(ATCC87693)，其大小为3.6kb并且携带有卡那霉素抗性基因。确定序列，并且该载体称为pREl 18-V2(参见图34)。

利用引物组合：EC-aceF-Pst(5’-aagccgttgctgcagctcttgagc-3’)(SEQ ID NO：)+EC-aceF-Bam2(5’-atctccggcggtcggatccgtcg-3’)(SEQ ID NO：)和EC-yacH-Nhe(5’-aaagcggctagccacgccgc-3’)(SEQ ID NO：)+EC-yacH-Kpn(5’-attacacgaggtacccaacg-3’)(SEQ ID NO：)通过PCR扩增大肠杆菌IpdA基因侧翼片断。从质粒pCR-KP-lpdA分离包含肺炎克雷伯菌IpdA基因的BamHI-Xbal片断并且随后连接至分别用PstI+BamHI和Nhel-Kpnl酶切的上述大肠杆菌片断以及用Kpnl和PstI酶切的pREl 18-V2质粒。得到的质粒(称为pREl18-M2.1IpdA yac)利用用于将His 322残基突变为Tyr残基的引物KP-lpdA-HisTyr-F(5’-atgctggcgtacaaaggtgtcc-3’)(SEQ ID NO：)和(5’-ggacacctttgtacgccagcat-3’)(SEQ IDNO：)或用于将Glu 354残基突变为Lys残基的引物KP-lpdA-GluLys-F(5’-atcgcctacactaaaccagaagtgg-3’)SEQ ID NO：)和KP-lpdA-GluLys-R(5’-ccacttctggtttagtgtaggcgat-3’)(SEQ ID NO：)组合进行定点诱变(SDM)。用聚合酶PfuTurbo(Stratagene；San Diego CA)进行PCR。验证完整以及仅存在所需突变的片断序列。得到的质粒通过转化导入大肠杆菌AadhE：：Frt-AldhA：：Frt电感受态细胞中。在包含卡那霉素(25或50mg/L)的LB琼脂平板上选择染色体中的第一个整合事件。利用2条引物通过PCR验证正确的插入，一条定位于插入区域的外部而一条定位于卡那霉素基因(5’-aggcagttccataggatggc-3’)(SEQ ID NO：)。选择具有正确插入的克隆用于溶解。其在平板液体LB中在所需温度下亚培养两次并且在无盐-蔗糖10％平皿上进行平板系列稀释。在LB-低盐琼脂培养基上筛选在含有蔗糖的平板上培养的克隆中卡那霉素抗性基因的损失，并且通过PCR和所含区域的测序验证IpdA基因的替换。

验证插入区域的序列，且如下所述。选择具有Glu354Lys突变的一个克隆(命名4-4-Pl)。该克隆随后用产生ECKh-138菌株(△adhE△ldhA△ApflB△lpdA：：K.p.lpdA322)的大肠杆菌APflB：：Frt的PI裂解物转染。

包含aceF和lpdA基因的ECKh-138区域的序列在图5中显示。肺炎克雷伯菌lpdA基因加下划线，Glu354Lys突变体中改变的密码子加阴影。天然大肠杆菌lpdA和突变体肺炎克雷伯菌lpdA的蛋白质序列对比在图36中显示。

为了评价在产BDO菌株中利用肺炎克雷伯氏菌lpdA的益处，宿主菌株AB3和ECKh-138用从强的诱导型启动子表达完整BDO途径的质粒转化。具体地，大肠杆菌sucCD，牙龈卟啉单胞菌sucD，牙龈卟啉单胞菌4hbd在中拷贝质粒pZA33上表达，而牙龈卟啉单胞菌Cat2和丙酮丁醇梭菌AdhE2在高拷贝质粒pZE13上表达。这些质粒已在文献中描述(Lutz和H.Bujard，Nucleic Acids Res 25：1203-1210(1997))，并且其用于BDO途径表达的用途在实施例XIII和W02008/115840中描述。

在补充的20g/L葡萄糖，100mM 3-(N-吗啉代)丙磺酸(MOPS)以改进缓冲能力，以及10ug/mL硫胺和合适的抗生素的M9基本培养基(6.78g/L Na2HP04，3.0g/L KH2P04，0.5g/LNaCl，1.0g/L NH4C1，1mMmgS04，0.1mM CaCl₂)中37℃下厌氧培养细胞。通过用氮气冲洗加盖的无氧瓶5分钟，接种后用23G针刺穿隔膜而建立微需氧条件。培养期间针保持在瓶中以允许少量空气进入瓶中。当OD600达到大约0.2时添加0.25mM IPTG以诱导该途径基因，并且在诱导后每24小时分析样品。如实施例II和W02008/115840中所述分析培养物上清液的BDO，4HB和其他副产品。ECKh-138中的BDO和4HB产生48小时后显著高于AB3中的或上述工作所用的宿主MG1655AldhA中的(图37)。

PDH启动子替代。之前已表明pdhR阻遏物通过包含Fnr结合位点，一个pflB启动子和其核糖体结合位点(RBS)的转录融合蛋白替代，由此导致aceEF-lpd操纵子由厌氧启动子表达，应当提高pdh的厌氧活性(Zhou等，Biotechnol.Lett.30：335-342(2008))。通过重叠PCR构建包含Fnr结合位点，pflB-p6启动子和RBS结合位点的融合蛋白。扩增两个片断，一个利用引物aceE-上游-RC(5’-tgacatgtaacacctaccttctgtgcctgtgccagtggttgctgtgatatagaag-3’)(SEQ ID NO：)和pflBp6-上游-Nde(5’-ataataatacatatgaaccatgcgagttacgggcctataagccaggcg-3’)(SEQ ID NO：)，另一个利用引物aceE-EcoRV-EC(5’-agtttttcgatatctgcatcagacaccggcacattgaaacgg-3’)(SEQ ID NO：)和aceE-上游(5’-ctggcacaggcacagaaggtaggtgttacatgtcagaacgtttacacaatgacgtggatc-3’)(SEQ ID NO：)。通过重叠PCR组装这两片断，最终的DNA片断用限制酶Ndel和BamHI酶切。该片断随后利用如前所述的pREl 18-V2导入大肠杆菌操纵子aceE基因的上游。在菌株ECKh-138和ECKh-422完成该替代。验证包含aceE基因5’区域的核苷酸序列并且在图37中显示。图37显示融合至pflB-p6启动子和核糖体结合位点(RBS)的aceE基因的5’末端核苷酸序列。5’斜体序列显示aroP基因的起始点，其与pdh操纵子相反的方向转录。3’斜体序列显示aceE基因的起始点。大写体：pflB RBS。下划线：FNR结合位点。粗体：pflB-p6启动子序列。

IpdA启动子替代。利用染色体DNA模板和引物aceF-pflBp6-正向(5’-agacaaatcggttgccgtttgttaagccaggcgagatatgatctatatc-3’)(SEQ ID NO：)和lpdA-RBS-B-反向(5’-gagttttgatttcagtactcatcatgtaacacctaccttcttgctgtgatatag-3’)(SEQ ID NO：)通过PCR扩增包含fnr结合位点，pflB-p6启动子和pflB基因RBS的启动子区域。利用引物B-RBS-lpdA正向(5’-20ctatatcacagcaagaaggtaggtgttacatgatgagtactgaaatcaaaactc-3’)(SEQ IDNO：)和pflBp6-aceF-反向(5’-gatatagatcatatctcgcctggcttaacaaacggcaaccgatttgtct-3’)(SEQ ID NO：)通过PCR扩增质粒2-4a。利用BPS克隆试剂盒(BPS Bioscience；San DiegoCA)组装两个得到的片断。测序验证得到的构建体并且利用如上所述的pRE118-V2方法导入菌株ECKh-439中。产生的菌株ECKh-456中包含aceF-lpdA区域的核苷酸序列在图39中显示。

宿主菌株ECKh-439(△adhE△ldhA△pflB△lpdA：：K.p.lpdA322△mdh△arcAgltAR163L ackA fimD：：大肠杆菌sucCD，牙龈卟啉单胞菌sucD，牙龈卟啉单胞菌4hbdfimD：：牛分支杆菌sueA，克氏梭菌4hbd)，其构建描述如下，并且检测pdhR和IpdA启动子的替代衍生物ECKh-455和ECKh-456的BDO生产。菌株用含有牙龈卟啉单胞菌Cat2和拜氏梭菌Ald的pZS*13转化以提供完全的BDO途径。如上所述细胞在补充的20g/L葡萄糖的M9基本培养基中培养。用0.2mM IPTG诱导后48小时，BDO，4HB和丙酮酸的浓度在图40中显示。启动子替代的菌株比同基因的亲本产生稍微更多的BDO。

这些结果表明产BDO菌株中丙酮酸脱氢酶的表达提高BDO的生产。

实施例XV

表达柠檬酸合成酶和乌头酸酶的产BDO菌株

该实施例描述了提高柠檬酸合成酶和乌头酸酶的活性以提高BDO的生产。发现gltA中R163L突变改进BDO的生产。另外，arcA敲除用于改进BDO生产。

理论计算上，确定了通过柠檬酸合成酶(CS)和乌头酸酶(ACONT)的流量要求达到1,4-丁二醇的最大理论收率(也参见W02008/115840，WO2009/023493，美国公开2009/0047719，美国公开2009/0075351)。缺氧状态下CS或ACONT活性缺乏将降低14％地最大理论收率。存在外部电子受体时，假定存在或缺少PEPCK活性时，没有流经CS或ACONT时，最大产率分别减少了9％或6％。如同丙酮酸脱氢酶(PDH)一样，在其中ADHEr，ASPT，LDH_D，MDH和PFLi被敲除的敲除菌株背景中CS和ACONT的重要性被极大地放大(参见WO2009/023493和美国公开2009/0047719，其在此通过引用引入)。

WO2009/023493和美国公开2009/0047719中所述的最小的OptKnock菌株设计除了ECKh-138外具有另外的缺失，编码苹果酸脱氢酶的mdh基因。该基因的缺失用来防止经过还原的三羧酸循环流向琥珀酸。利用λ红同源重组方法(Datsenko and Wanner，Proc.Natl.Acad.Sci.USA 97：6640-6645(2000))进行mdh缺失。下列寡核苷酸用于从pKD3PCR扩增侧翼为FRT位点的抗氯霉素基因(CAT)：

S-mdh-Kan 5’-

G TGT AGG CTG GAG CTG CTT C-3’(SEQ ID NO：)

AS-mdh-Kan 5’-

ATA TGA ATA TCC TCC TTA G–3’(SEQ ID NO:)。

下划线区域表明与pKD3质粒的同源性而粗体序列指mdh ORF的上游和下游序列同源性。纯化后，PCR产物电穿孔入已用pRedET(tet)转化的ECKh-138电感受态细胞中并且按照厂家说明制备(www.genebridges.com/gb/pdf/K001％20Q％20E％20BAC％20Modification％20K it-version2.6-2007-screen.pdf)。如图41所示，设计PCR产物以使其整合入ECKh-138基因组的mdh基因上游区域。

选择氯霉素抗性重组体并且薄层纯化。通过诊断PCR验证mdh基因的缺失和CAT的插入。为了除去CAT基因，包含FLP重组酶(Datsenko and Wanner，Proc.Natl.Acad.Sci.USA97：6640-6645(2000))的热敏质粒pCP20在30℃转化入该细胞并且选择氨苄青霉素抗性(AMP)。转化体在42℃过夜无选择性地培养以热诱导FLP合成并且导致质粒丢失。随后薄层纯化培养物，检测单一克隆的所有抗生素抗性丧失。大多数同时丧失FRT-侧翼的抗性基因和FLP辅助质粒。还存在"FRT"创痕残留物。得到的菌株命名为ECKh-172。

CS和ACONT在缺氧状态下没有高活性或高表达。为此，缺失编码三羧酸循环全程调节剂的arcA基因。ArcA在微需氧条件下作用以诱导基因产物表达，其提供中心代谢酶的活性，该酶对低氧含量，aceE，pflB和adhE敏感。显示微需氧时arcAJarcB缺失提高Idh，icd，gltA，mdh和gdh基因的特异性活性(Salmon等，J.Biol.Chem.280：15084-15096(2005)；Shalel-Levanon等，Biotechnol.Bioeng.92(2)：147-159(2005))。分别利用引物ArcA-上游-EcoRI(5’-ataataatagaattcgtttgctacctaaattgccaactaaatcgaaacagg-3’)(SEQ IDNO：)与ArcA-上游-Kpnl(5’-tattattatggtaccaatatcatgcagcaaacggtgcaacattgccg-3’)(SEQ ID NO：)和ArcA-下游-EcoRI(5’-tgatctggaagaattcatcggctttaccaccgtcaaaaaaaacggcg-3’)(SEQ ID NO：)与ArcA-下游-Pstl(5’-ataaaaccctgcagcggaaacgaagttttatccatttttggttacctg-3’)(SEQ ID NO：)通过PCR扩增大肠杆菌MG1655的arc A基因的上游和下游区。这些片断随后用限制性酶EcoRI和Kpnl(上游片断)以及EcoRI和PstI(下游)酶切。其随后连接入用PstI和Kpnl酶切的pRE118-V2质粒，产生质粒pRE118-AarcA。验证质粒pREl 18-AarcA的序列。pREl 18-AarcA导入大肠杆菌菌株ECKh-172(△adhE△ldhA△pflB△lpdA：：K.p.lpdA322△mdh)的电感受态细胞中。如上所述在整合和溶解于LB-无盐-蔗糖平板上后，通过测序验证得到的菌株ECKh-401染色体中arc A基因的缺失并且显示在图42中。

大肠杆菌gltA基因编码柠檬酸合成酶。之前已表明该基因由NADH别构抑制，并且已经鉴定了参与该抑制作用的氨基酸(Pereira等，J.Biol.Chem.269(1)：412-417(1994)；Stokell等，Biol.Chem.278(37)：35435-35443(2003))。利用引物gltA-上游(5’-ggaagagaggctggtacccagaagccacagcagga-3’)(SEQ ID NO：)和gltA-Pstl(5’-gtaatcactgcgtaagcgccatgccccggcgttaattc-3’)(SEQ ID NO：)通过PCR扩增大肠杆菌MG1655的gltA基因。扩增片断用Kpnl和PstI酶切后克隆入pREl 18-V2。得到的质粒称为pREl 18-gltA。质粒随后利用引物R163L-正向(5’-attgccgcgttcctcctgctgtcga-3’)(SEQ ID NO：)和R163L-反向(5’-cgacagcaggaggaacgcggcaat-3’)(SEQ ID NO：)经定点诱变(SDM)以将Arg 163残基改变为Lys残基。通过测序验证完整片断的序列。λ红同源重组方法的变型(Datsenko and Wanner，Proc.Natl.Acad.Sci.USA 97：6640-6645(2000))用于用R163L突变体等位基因取代天然的gltA基因而不留Frt创痕。常规重组方法与如上所述用于产生mdh缺失的相同。首先，菌株ECKh-172通过利用λ红同源重组方法引入rpsL null突变而具有链霉素抗性。然后，用由卡那霉素抗性基因(kanR)和大肠杆菌rpsL基因的野生型拷贝组成的盒完成重组以取代该菌株中全部的野生型gltA编码区。当引入具有rpsL null突变的大肠杆菌菌株时，该盒造成细胞对抗链霉素药物向链霉素敏感的改变。包括gltA基因每一突变体型的DNA片断随后与合适的同源末端一起引入，并且在存在链霉素时检测得到的克隆培养物。此选择其中kanR/rpsL盒已由突变体gltA基因取代的菌株。通过PCR和DNA测序分析确定突变基因插入正确的基因座中。得到的菌株称为ECKh-422，并且具有基因型△adhE△ldhA△pflB△lpdA：：K.p.lpdA322△mdh△arcA gltAR163L。如图43所示，通过测序验证包含菌株ECKh-422gltA基因突变的区域。

随后评价菌株ECKh-401和gltAR163L突变体ECKh-422粗提取液的柠檬酸合成酶活性。通过在4，500rpm离心10min收集细胞(Beckman-Coulter，Allegera X-15R；FullertonCA)。片状沉淀物重悬浮于具有benzonase和溶菌酶的0.3mL BugBuster(Novagen/EMD；SanDiego CA)试剂中，且在室温下温和振荡15分钟进行裂解。通过在4℃，14，000rpm离心30min获得无细胞裂解物(Eppendorf centrifuge 5402；Hamburg Germany)。利用Bradford方法测定样品中的细胞蛋白质(Bradford，Anal.Biochem.72：248-254(1976))。

通过形成游离辅酶A后(HS-CoA)测定柠檬酸合成酶活性，游离的辅酶A与草酰乙酸释放自乙酰-CoA反应。游离的HS-辅酶A硫醇基与5，5’-二硫双-(2-硝基苯甲酸)(DTNB)反应以形成5-硫代-2-硝基苯甲酸(TNB)。随后通过分光光度测定410nm的吸光率(最大在412nm)监测TNB的浓度。测定混合物包含100mM Tris/HCl缓冲液(pH 7.5)，20mM乙酰-CoA，10mMDTNB，以及20mM草酰乙酸。为了评价NADH抑制作用，还添加0.4mM NADH至该反应。通过添加5微升细胞提取物起始该测定，并且通过随时间变化的吸光率测定反应速度。单位比活性定义为每毫克蛋白质每分钟转化的μ摩尔产物。

图44显示野生型gltA基因产物和R163L突变体的柠檬酸合成酶活性。在没有或存在0.4mM NADH时进行该测定。

菌株ECKh-401和ECKh-422用表达全部BDO途经的质粒转化。大肠杆菌sucCD，牙龈卟啉单胞菌sucD，牙龈卟啉单胞菌4hbd和牛分支杆菌sucA在低拷贝质粒pZS*13上表达，牙龈卟啉单胞菌Cat2和丙酮丁醇梭菌AdhE2在中拷贝质粒pZE23上表达。这些菌株的培养物在如上所述补充20g/L葡萄糖和合适的抗生素的M9基本培养基中微需氧培养。来自重复培养物平均数的诱导后48小时的4HB和BDO浓度在图45中显示。ECKh-422中的浓度均比ECKh-401高，表明因gltA突变产生的增强的柠檬酸合成酶活性导致BDO途径流量的提高。

本节所述的宿主菌株变体用来重定向经过氧化三羧酸循环的碳通量，其与WO2009/023493和美国公开2009/0047719中所述的OptKnock菌株设计一致。为了证实通量确实通过该途径，利用菌株ECKh-432进行¹³C通量分析，其为ECKh-422型，其中上游途径整合入染色体中(如实施例XVII所述)。为了完成BDO途径，从pZS*13表达牙龈卟啉单胞菌Cat2和拜氏梭菌Ald。四个平行培养物在含有四种不同标记比率(1_¹³C，仅葡萄糖分子的第一个碳原子用¹³C标记；统一的-¹³C，所有碳原子为¹³C)的4g/L总葡萄糖的M9基本培养基中培养(6.78g/L Na2HP04，3.0g/L KH2P04，0.5g/L NaCl，1.0g/L NH4C1，1mM MgS04，0.1mMCaCl2)：

1. 80mol％未标记的，20mol％统一的-¹³C

2. 10mol％未标记的，90mol％统一的-¹³C

3. 90mol％1-¹³C，10mol％统一的-¹³C

4. 40mol％1-¹³C，60mol％统一的-¹³C

双份培养平行的未标记培养物，从其定时取样以评价生长速率，葡萄糖摄入率和产物形成率。晚期对数生长期中，收集标记的培养物，蛋白质分离且水解为氨基酸，通过如前所述的气相色谱-质谱分析法(GCMS)分析氨基酸的标记分布(Fischer and Sauer，Eur.J.Biochem.270：880-891(2003))。另外，通过W02008115840中所述的GCMS分析来自标记培养物的发酵液中分泌的4HB和BDO的标记分布。该数据用于利用已建立的方法计算胞内流量分布(Suthers等，Metab.Eng.9：387-405(2007))。得到的中心代谢流量和相关的95％置信区间在图46中显示。数值为标准化至1mmol/h葡萄糖摄入率的摩尔量。结果表明碳量通过柠檬酸合成酶进入氧化方向并且大部分碳进入BDO途径而不是完成三羧酸循环。

此外，由于该菌株中缺失mdh，证实基本上无苹果酸和草酰乙酸之间的流量。

通过将ECKh-422的典型发酵方面与原始菌株ECKh-138的相比较观察利用敲除菌株诸如利用OptKnock设计用于BDO生产的菌株(参见WO2009/023493和美国公开2009/0047719)的优势，其中BDO经过还原的三羧酸循环从琥珀酸产生(参见图47)。利用补充20g/L葡萄糖的M9基本培养基在2L Biostat B+生物反应器(Sartorius；Cedex France)中以1L初始培养体积进行发酵。温度控制在37℃，pH利用2M NH₄OH或Na₂CO₃控制在7.0。细胞有氧培养至大约10的OD600，期间用0.2mM IPTG诱导培养物。诱导后一小时，空气流量降至0.02标准升/分种用于微需氧条件。搅拌速率设定为700rpm。给予浓缩的葡萄糖以维持容器中0.5和10g/L之间的葡萄糖浓度。如以上实施例所述两个菌株用包含完整BDO途径的质粒转化。ECKh-138中，乙酸盐，丙酮酸和4HB在发酵中占优势，而ECKh-422中BDO为主要产物。

实施例XVI

表达磷酸烯醇丙酮酸羧激酶的BDO菌株

该实施例描述了利用磷酸烯醇丙酮酸羧激酶(PEPCK)以增强BDO的生产。流感嗜血杆菌PEPCK基因用于异源表达。

理论计算上，确定了生成ATP的草酰乙酸至磷酸烯醇丙酮酸的转化要求达到1,4-丁二醇的最大理论收率(也参见W02008/115840，WO2009/023493，美国公开2009/0047719，美国公开2009/0075351)。显示缺乏PEPCK活性降低BDO的最大的理论收率，假定为缺氧状态时降低12％而假定存在外部电子受体诸如硝酸盐或氧时降低3％。

在诸如大肠杆菌的生物中，PEPCK以糖原异生和消耗ATP的草酰乙酸向磷酸烯醇丙酮酸的方向起作用。已假设大肠杆菌PEPCK的动力学限制阻止其有效催化从PEP形成草酰乙酸。PEP羧化酶(PPC)，其不产生ATP但为有效培养所必需，由大肠杆菌自然利用以从磷酸烯醇丙酮酸形成草酰乙酸。因此，检测三个非天然PEPCK酶(Table 26)的大肠杆菌PPC突变菌株在葡萄糖基本培养基中补充培养的能力。

表26.磷酸烯醇丙酮酸羧激酶序列的来源

PEPCK来源菌株	登录号，GenBank参考序列
		流感嗜血杆菌	NC_000907.1
琥珀酸放线杆菌	YP_001343536.1
		产琥珀酸曼氏杆菌	YP_089485.1

互补培养研究了获自Keio收集物的Δppc突变体大肠杆菌中候选基因表达的相关质粒(Baba等，Molecular Systems Biology 2：2006.0008(2006))。该基因克隆于表达载体pZA23(中拷贝)和pZE13(高拷贝)的PAllacO-1启动子后。之前已描述了这些质粒(Lutz andH.Bujard，Nucleic Acids Res 25：1203-1210(1997))，并且其用于表达BDO途径基因的用途之前已在W02008/115840中描述。

预培养物在具有4g/L葡萄糖的M9基本培养基中有氧培养。所有预培养物补充天冬氨酸(2mM)以提供Δppc突变体不依赖PEPCK的表达而生成三羧酸循环中间体的来源。具有4g/L葡萄糖的M9基本培养基也用于该检测条件中，但不添加天冬氨酸并且IPTG添加至0.5mM。表27显示互补培养研究的结果。

表27.具有来自流感嗜血杆菌、产琥珀酸放线杆菌和产琥珀酸曼氏杆菌的PEPCK的Δppc突变体从载体pZA23或pZE13表达时的互补

PEPCK来源菌株	载体	时间(h)	OD<sub>600</sub>
				流感嗜血杆菌	pZA23BB	40	0.950
Δppc对照	pZA23BB	40	0.038
				产琥珀酸放线杆菌	pZA23BB	40	0.055
产琥珀酸曼氏杆菌	pZA23BB	40	0.214
				产琥珀酸放线杆菌	pZE13BB	40	0.041
产琥珀酸曼氏杆菌	pZE13BB	40	0.024
				Δppc对照	pZE13BB	40	0.042

发现在基于筛选的质粒中所检测的基因之中，Δppc突变体大肠杆菌中流感嗜血杆菌PEPCK补充培养最好。随后利用用上述pRE118-V2的SacB反选择方法将该基因整合入野生型大肠杆菌(MG1655)的PPC基因座(Gay等，J.Bacteriol.153：1424-1431(1983))。PEPCK整合保留大肠杆菌天然PPC启动子，但利用外源PEPCK终止子。ppc由流感嗜血杆菌pepck替代后的该区域序列在图48中显示。pepck编码区为下划线的。

用于适应性进化的技术被用于提高大肠杆菌突变体(Δppc：：H.inf pepCK)的生长速率。具有4g/L葡萄糖和50mM碳酸氢钠的M9基本培养基用于在缺氧环境中培养和进化该菌株。高碳酸氢钠浓度用于推动PEPCK反应向草酰乙酸形成的平衡状态。为了维持指数生长，每当达到0.5的OD600时培养物稀释2倍。3个星期适应进化的大约100世代后，厌氧生长速率从大约8h提高至野生型的大约2h。进化后，分离单一克隆，比较初始突变体和野生型菌株的厌氧瓶中的培养(参见图49)。使用具有4g/L葡萄糖和50mM碳酸氢钠的M9培养基。

随后重复如上所述的ppc/pepck基因替代方法，这次利用产BDO菌株ECKh-432(△adhE△ldhA△pflB△lpdA：：K.p.lpdA322△mdh△arcA gltAR163L△ackA fimD：：大肠杆菌sucCD，牙龈卟啉单胞菌sucD，牙龈卟啉单胞菌4hbd fimD：：牛分支杆菌sucA，克氏梭菌4hbd)和ECKh-439作为宿主。这些菌株包含上述增强的三羧酸循环且上游途径整合入染色体中。ECKh-439为ECKh-432的衍生物，其具有编码乙酰激酶的ackA基因缺失。利用如上所述的sacB反选择方法进行该缺失。

对ECKh-439的△ppc：：H.inf pepCK衍生物，称为ECKh-453进行发酵。下游BDO途径由包含牙龈卟啉单胞菌Cat2和拜氏梭菌Ald的pZS*13提供。利用补充20g/L葡萄糖和50mMNaHC03的M9基本培养基在2L Biostat B+bioreactors(Sartorius；Cedex France)中以1L初始培养体积进行该发酵。温度控制在37℃，pH利用2M NH₄OH或Na₂CO₃控制在7.0。细胞有氧培养至大约2的OD600，期间用0.2mM IPTG诱导培养物。诱导后一小时，空气流量降至0.01标准升/分种用于微需氧条件。搅拌速率最初设定为700rpm。培养物密度增加时整个发酵期间曝气率逐渐提高。给予浓缩的葡萄糖溶液以维持容器中0.5和10g/L之间的葡萄糖浓度。产品分布显示在图50中。其中BDO和乙酸盐以大约一比一的摩尔比产生的观察的表型与WO2009/023493中用于设计#_439的所预测的非常类似(ADHEr，ASPT，LDH_D，MDH，PFLi)。靶向ASPT反应的缺失被认为是没必要的，因为经过天冬氨酸氨-裂解酶的自然流量较低。

OptKnock菌株的关键特性为目的代谢产物的产生通常与生长相关联，且进一步的，在指数生长和静止期均应存在代谢产物的产生。通过在微需氧瓶中培养而在对数生长期常取样而评价ECKh-432和ECKh-453的生长联合潜力。使用包含4g/L葡萄糖和10mMNaHC03(用于ECKh-432)或50mM NaHC03(用于ECKh-453)的M9培养基，并且接种培养时包括0.2mM IPTG。18G针用于ECKh-432的微需氧培养，而18G和27G针均用于ECKh-453的检测。更高尺寸的针引起更少的通风。如图51所示，在已经消耗了5g/L葡萄糖时，即相当于静止期开始时，ECKh-432不再开始产生BDO。ECKh-453在整个实验期间更均匀地产生BDO。另外，由于培养通风减少，培养联合提高。

实施例XVII

BDO途径编码基因在特定整合位置的整合

该实施例描述了各种BDO途径基因整合入fimD基因座以提供更有效的表达和稳定性。

产生4HB的完整的上游BDO途径已整合入大肠杆菌染色体的fimD基因座。利用λ红同源重组方法将上游途径的琥珀酸分支整合入大肠杆菌染色体中(Datsenko and Wanner，Proc.Natl.Acad.Sci.USA 97：6640-6645(2000))。受体大肠杆菌菌株为ECKh-422(△adhE△ldhA△pflB△lpdA：：K.p.lpdA322△mdh△arcA gltAR163L)。包含启动子，sucCD基因，sucD基因和4hbd基因以及终止子序列的多顺反子DNA片断插入pKD3质粒的Afllll位置中。下列引物用于一起扩增操纵子和来自质粒的氯霉素标志物。下划线序列与靶标插入位置的序列同源。

5’-GTTTGCACGCTATAGCTGAGGTTGTTGTCTTCCAGCAACGTACCGTATACAATAGGCGTATCACGAGGCCCTTTC-3’(SEQ ID NO:)

5’-GCTACAGCATGTCACACGATCTCAACGGTCGGATGACCAATCTGGCTGGTATGGGAATTAGCCATGGTCC-3’(SEQ ID NO:)

Dpnl处理和DNA电泳后，纯化的PCR产物用于转化含有质粒pKD46的大肠杆菌菌株。在包含氯霉素的平板上选择候选菌株。纯化候选菌株的基因组DNA。扩增插入序列并且通过DNA测序确认。通过翻转酶从染色体除去氯霉素-抗性标志。插入物和标志除去后的该区域核苷酸序列在图52中显示。

上游途径的α-酮戊二酸分支通过同源重组整合入染色体中。如实施例XIV中引用的，该变体中所用的质粒源自载体pRE118-V2，其包含卡那霉素-抗性基因，编码果聚糖蔗糖酶的基因(sacB)和R6K条件复制起始点。该整合质粒还包含具有启动子，sucA基因，克氏梭菌4hbd基因和插入两个1.5-kb DNA片断之间的终止子的多顺反子序列，该两个DNA片断与靶标插入物位置的侧翼区同源。得到的质粒用于转化大肠杆菌菌株。在包含卡那霉素的平板上选择整合的候选菌株。通过PCR验证正确的整合位置。为了从染色体消除抗生素标志，在包含蔗糖的培养基上培养而选择细胞。通过PCR和DNA测序验证最终的菌株。插入物和标志除去后的染色体区域的核苷酸序列在图53中显示。

得到的上游途径整合菌株ECKh-432用含有下游途径基因的质粒转化。该构建体能够在基本培养基中从葡萄糖生产BDO(参见图54)。

实施例XVIII

使用非-磷酸转移酶蔗糖摄取系统降低丙酮酸副产品的形成

该实施例描述了利用非-磷酸转移酶(PTS)蔗糖摄取系统降低蔗糖转化为BDO中作为副产品的丙酮酸。

设计用于经过磷酸转移酶(PTS)系统利用蔗糖的菌株产生显著量的副产品丙酮酸。因此，利用非-PTS蔗糖系统可用于减少丙酮酸的形成，因为蔗糖的输入不会伴随磷酸烯醇丙酮酸(PEP)转化为丙酮酸。这将通过PPC或PEPCK提高PEP库和向草酰乙酸的流量。

将非-PTS蔗糖操纵子插入rrnC区域。为了产生包含侧翼为与rrnC区域同源的区域的非-PTS蔗糖基因的PCR产物，两个寡核苷酸用于PCR扩增来自MachlTM的csc基因(Invitrogen，Carlsbad，CA)。该菌株为已知能够分解代谢蔗糖的大肠杆菌菌株W菌株的后代(Orencio-Trejo等，Biotechnology Biofuels 1：8(2008))。该序列源自大肠杆菌W菌株KOll(登录号AY314757)(Shukla等，Biotechnol.Lett.26：689-693(2004))并且包括编码蔗糖透膜酶(cscB)，D-果糖激酶(cscK)，蔗糖水解酶(cscA)和Lacl-相关的蔗糖-特异性阻遏物(cscR)的基因。cscR的前53个氨基酸通过AS引物除去。该寡核苷酸的序列为：rrnC 23Sdel S–CSC 5’-

C GAA ATA TGG CGT GAC TCG ATA C-3'(SEQ ID NO:)and rrnC 23S del AS–CSC 5’-

T AAG ATG CGC GCT CAA GGA C-3’(SEQ ID NO:)。下划线区域表明与csc操纵子的同源性而粗体序列指rrnc区域ORF的上游和下游序列同源性。完整的PCR产物的序列在图55中显示。

纯化后，PCR产物电穿孔入已用pRedET(tet)转化的MG1655电感受态细胞中并且按照厂家说明制备(www.genebridges.com/gb/pdf/K001％20Q％20E％20BAC％20Modification％20Kit-version2.6-2007-screen.pdf)。设计PCR产物使得其整合入基因组染色体的rrnC区域。如图56所示，其有效缺失rrlC上游的191个核苷酸(23S rRNA)，所有rrlC rRNA gene和3个rrlC下游核苷酸，并且用蔗糖操纵子取代。

转化体在具有0.4％蔗糖的M9基本盐培养基上培养并且通过诊断PCR在存在蔗糖时检测单一克隆。完整的rrnC：：crcAKB区域通过PI转导(Sambrook等，Molecular Cloning：A Laboratory Manual，Third Ed.，Cold Spring Harbor Laboratory，New York(2001)转移入BDO宿主菌株ECKh-432中，产生ECKh-463(△adhE△ldhA△pflB△lpdA：：K.p.lpdA322△mdh△arcA gltAR163L fimD：：大肠杆菌sucCD，牙龈卟啉单胞菌sucD，牙龈卟啉单胞菌4hbd fimD：：牛分支杆菌sucA，克氏梭菌4hbd rrnC：：cscAKB)。通过在蔗糖上培养选择重组体并且通过诊断PCR验证。

ECKh-463用含有牙龈卟啉单胞菌Cat2和拜氏梭菌Ald的pZS*13转化以提供完全的BDO途径。在补充20g/L葡萄糖M9基本培养基(6.78g/L Na2HP04，3.0g/L KH2P04，0.5g/LNaCl，1.0g/L NH4C1，1mM MgS04，0.1mM CaCl2)中培养细胞。培养开始时培养物中存在0.2mM IPTG。利用具有23G针的瓶维持缺氧状态。作为对照，包含同样质粒的ECKh-432在同样的培养基上培养，除了用10g/L葡萄糖代替蔗糖。图57显示培养48小时后的平均产物浓度，标准化至培养物OD600。所述数据为每种菌株的6次重复培养物。这表明ECKh-463在蔗糖上生产BDO与亲本在蔗糖上的类似。

实施例XIX

产BDO菌株的概要

这实施例描述了各种产BDO菌株。

表28概述了以上实施例XII-XVIII中公开的各种产BDO菌株。

表28.各种产BDO菌株的总结

表28中总结的菌株如下。菌株1：大肠杆菌MG1655的单个缺失衍生物，具有内源IdhA；表达大肠杆菌sucCD，牙龈卟啉单胞菌sucD，牙龈卟啉单胞菌4hbd，牙龈卟啉单胞菌Cat2，丙酮丁醇梭菌AdhE2的质粒。菌株2：宿主菌株AB3，产琥珀酸菌株，大肠杆菌MG2655的衍生物，具有内源adhE，IdhA，pflB的缺失；表达大肠杆菌sucCD，牙龈卟啉单胞菌sucD，牙龈卟啉单胞菌4hbd，牙龈卟啉单胞菌Cat2，丙酮丁醇梭菌AdhE2的质粒。

菌株3：宿主菌株ECKh-138，内源adhE，IdhA，pflB的缺失，内源lpdA的缺失以及在lpdA基因座具有Glu354Lys突变的肺炎克雷伯氏菌lpdA的染色体插入；表达大肠杆菌sucCD，牙龈卟啉单胞菌sucD，牙龈卟啉单胞菌4hbd，牙龈卟啉单胞菌Cat2，丙酮丁醇梭菌AdhE2的质粒；菌株提供lpdA的改进以提高丙酮酸脱氢酶流量。菌株4：宿主菌株ECKh-148，内源adhE，IdhA，pflB的缺失，内源lpdA的缺失以及具有Glu454Lys突变的肺炎克雷伯氏菌lpdA的染色体插入；表达大肠杆菌sucCD，牙龈卟啉单胞菌sucD，牙龈卟啉单胞菌4hbd，丙酮丁醇梭菌bukl，丙酮丁醇梭菌ptb，丙酮丁醇梭菌AdhE2的质粒。

菌株5：宿主菌株ECKh-401，内源adhE，IdhA，pflB的缺失，内源lpdA的缺失以及在lpdA基因座具有Glu554Lys突变的肺炎克雷伯氏菌lpdA的染色体插入，内源mdh和arcA的缺失；表达大肠杆菌sucCD，牙龈卟啉单胞菌sucD，牙龈卟啉单胞菌4hbd，牙龈卟啉单胞菌Cat2，丙酮丁醇梭菌AdhE2的质粒；菌株具有mdh和arcA的缺失以引导流量经过氧化的三羧酸循环。菌株6：宿主菌株ECKh-401，内源adhE，IdhA，pflB的缺失，内源lpdA的缺失以及在lpdA基因座具有Glu664Lys突变的肺炎克雷伯氏菌lpdA的染色体插入，内源mdh和arcA的缺失；表达牛分支杆菌sueA，大肠杆菌sucCD，牙龈卟啉单胞菌sucD，牙龈卟啉单胞菌4hbd，牙龈卟啉单胞菌Cat2，丙酮丁醇梭菌AdhE2的质粒。

菌株7：宿主菌株ECKh-422，内源adhE，IdhA，pflB的突变，内源lpdA的突变以及在lpdA基因座具有Glu774Lys突变的肺炎克雷伯氏菌lpdA的染色体插入，内源mdh和arcA的缺失，gltA以gltA Argl63Leu突变的染色体替代；表达大肠杆菌sucCD，牙龈卟啉单胞菌sucD，牙龈卟啉单胞菌4hbd，牙龈卟啉单胞菌Cat2，丙酮丁醇梭菌AdhE2的质粒；菌株在柠檬酸合成酶中具有突变以提高厌氧活性。菌株8：宿主菌株ECKh-422，内源adhE，IdhA，pflB的突变，内源lpdA的缺失以及在lpdA基因座具有Glu884Lys突变的肺炎克雷伯氏菌lpdA的染色体插入，内源mdh和arcA的缺失，gltA以gltA Argl63Leu突变的染色体替代；表达牛分支杆菌sucA，大肠杆菌sucCD，牙龈卟啉单胞菌sucD，牙龈卟啉单胞菌4hbd，牙龈卟啉单胞菌Cat2，丙酮丁醇梭菌AdhE2的质粒。宿主菌株9：宿主宿主菌株ECKh-422，内源adhE，IdhA，pflB的突变，内源lpdA的缺失以及在lpdA基因座具有Glu994Lys突变的肺炎克雷伯氏菌lpdA的染色体插入，内源mdh和arcA的缺失，gltA以gltA Argl63Leu突变的染色体替代；表达牛分支杆菌sucA，大肠杆菌sucCD，牙龈卟啉单胞菌sucD，牙龈卟啉单胞菌4hbd，牙龈卟啉单胞菌Cat2，拜氏梭菌Ald的质粒。

菌株10：宿主菌株ECKh-426，内源adhE，IdhA，pflB的缺失，内源lpdA的缺失以及在lpdA基因座具有Glu354Lys突变的肺炎克雷伯氏菌lpdA的染色体插入，内源mdh和arcA的缺失，gltA以gltA Argl63Leu突变的染色体替代，大肠杆菌sucCD，牙龈卟啉单胞菌sucD，牙龈卟啉单胞菌4hbd在fimD基因座的染色体插入表达牙龈卟啉单胞菌Cat2，拜氏梭菌Ald的质粒；菌株具有整合入菌株ECKh-422fimD基因座的琥珀酸分支上游途径。菌株11：宿主菌株ECKh-432，内源adhE，IdhA，pflB的缺失，内源lpdA的缺失以及在lpdA基因座具有Glu354Lys突变的肺炎克雷伯氏菌lpdA的染色体插入，内源mdh和arcA的缺失，gltA以gltA Argl63Leu突变的染色体替代，大肠杆菌sucCD，牙龈卟啉单胞菌sucD，牙龈卟啉单胞菌4hbd在fimD基因座的染色体插入，牛分支杆菌sue A，克氏梭菌4hbd在fimD基因座的染色体插入；表达牙龈卟啉单胞菌Cat2，拜氏梭菌Ald的质粒；菌株具有整合入菌株ECKh-422的琥珀酸和α-酮戊二酸上游途径分支。宿主菌株12：宿主菌株ECKh-432，内源adhE，IdhA，pflB的突变，内源lpdA的缺失以及在lpdA基因座具有Glu354Lys突变的肺炎克雷伯氏菌lpdA的染色体插入，内源mdh和arcA的缺失，gltA以gltA Argl63Leu突变的染色体替代；大肠杆菌sucCD，牙龈卟啉单胞菌sucD，牙龈卟啉单胞菌4hbd在fimD基因座的染色体插入，牛分支杆菌sue A，克氏梭菌4hbd在fimD基因座的染色体插入；表达丙酮丁醇梭菌bukl，丙酮丁醇梭菌ptb，拜氏梭菌Ald的质粒。

菌株13：宿主菌株ECKh-439，内源adhE，IdhA，pflB的缺失，内源lpdA的缺失以及在lpdA基因座具有Glu354Lys突变的肺炎克雷伯氏菌lpdA的染色体插入，内源mdh和arcA的缺失，gltA以gltA Argl63Leu突变的染色体替代，内源ackA的缺失，大肠杆菌sucCD，牙龈卟啉单胞菌sucD，牙龈卟啉单胞菌4hbd在fimD基因座的染色体插入，牛分支杆菌sue A，克氏梭菌4hbd在fimD基因座的染色体插入；表达牙龈卟啉单胞菌Cat2，拜氏梭菌Ald的质粒；菌株具有菌株ECKh-432中的乙酰激酶缺失。菌株14：宿主菌株ECKh-453，内源adhE，IdhA，pflB的缺失，内源lpdA的缺失以及在lpdA基因座具有Glu354Lys突变的肺炎克雷伯氏菌lpdA的染色体插入，内源mdh和arcA的缺失，gltA以gltA Argl63Leu突变的染色体替代，内源ackA的缺失，内源ppc的缺失和流感嗜血杆菌ppck在ppc基因座的插入，大肠杆菌sucCD，牙龈卟啉单胞菌sucD，牙龈卟啉单胞菌4hbd在fimD基因座的染色体插入，牛分支杆菌sucA，克氏梭菌4hbd在fimD基因座的染色体插入；表达牙龈卟啉单胞菌Cat2，拜氏梭菌Ald的质粒；菌株具有菌株ECKh-432中的乙酰激酶缺失和PPC/PEPCK替代。

菌株15：宿主菌株ECKh-456，内源adhE，IdhA，pflB的缺失，内源lpdA的缺失以及在lpdA基因座具有Glu354Lys突变的肺炎克雷伯氏菌lpdA的染色体插入，内源mdh和arcA的缺失，gltA以gltA Argl63Leu突变的染色体替代，大肠杆菌sucCD，牙龈卟啉单胞菌sucD，牙龈卟啉单胞菌4hbd在fimD基因座的染色体插入，牛分支杆菌sue A，克氏梭菌4hbd在fimD基因座的染色体插入，IpdA启动子以fnr结合位点，pflB-p6启动子和pflB的RBS的替代，表达牙龈卟啉单胞菌Cat2，拜氏梭菌Ald的质粒；菌株具有菌株ECKh-432中的IpdA启动子以厌氧启动子的替代。菌株16：宿主菌株ECKh-455，内源adhE，IdhA，pflB的缺失，内源lpdA的缺失以及在lpdA基因座具有Glu354Lys突变的肺炎克雷伯氏菌lpdA的染色体插入，内源mdh和arcA的缺失，gltA以gltA Argl63Leu突变的染色体替代，大肠杆菌sucCD，牙龈卟啉单胞菌sucD，牙龈卟啉单胞菌4hbd在fimD基因座的染色体插入，牛分支杆菌sue A，克氏梭菌4hbd在fimD基因座的染色体插入，pdhR和aceEF启动子以fnr结合位点，pflB-p6启动子和pflB的RBS的替代，表达牙龈卟啉单胞菌Cat2，拜氏梭菌Ald的质粒；菌株具有菌株ECKh-432中的pdhR和aceEF启动子以厌氧启动子的替代。

宿主菌株17：宿主菌株ECKh-459，内源adhE，IdhA，pflB的突变，内源lpdA的缺失以及在lpdA基因座具有Glu354Lys突变的肺炎克雷伯氏菌lpdA的染色体插入，内源mdh和arcA的缺失，gltA以gltA Argl63Leu突变的染色体替代；大肠杆菌sucCD，牙龈卟啉单胞菌sucD，牙龈卟啉单胞菌4hbd在fimD基因座的染色体插入，牛分支杆菌sue A，克氏梭菌4hbd在fimD基因座的染色体插入；丙酮丁醇梭菌bukl，丙酮丁醇梭菌ptb在fimD基因座的染色体插入，表达拜氏梭菌Ald的质粒；菌株具有菌株ECKh-432中BK/PTB的整合。宿主菌株18：宿主菌株ECKh-459，内源adhE，IdhA，pflB的突变，内源lpdA的缺失以及在lpdA基因座具有Glu354Lys突变的肺炎克雷伯氏菌lpdA的染色体插入，内源mdh和arcA的缺失，gltA以gltA Argl63Leu突变的染色体替代；大肠杆菌sucCD，牙龈卟啉单胞菌sucD，牙龈卟啉单胞菌4hbd在fimD基因座的染色体插入，牛分支杆菌sue A，克氏梭菌4hbd在fimD基因座的染色体插入；丙酮丁醇梭菌bukl，丙酮丁醇梭菌ptb在fimD基因座的染色体插入，表达的拜氏梭菌Ald，热葡糖苷酶地芽孢杆菌adhl的质粒。

菌株19：宿主菌株ECKh-463，内源adhE，IdhA，pflB的缺失，内源lpdA的缺失以及在lpdA基因座具有Glu354Lys突变的肺炎克雷伯氏菌lpdA的染色体插入，内源mdh和arcA的缺失，gltA以gltA Argl63Leu突变的染色体替代，大肠杆菌sucCD，牙龈卟啉单胞菌sucD，牙龈卟啉单胞菌4hbd在fimD基因座的染色体插入，牛分支杆菌sue A，克氏梭菌4hbd在fimD基因座的染色体插入，非-PTS蔗糖操纵子基因蔗糖透膜酶(icscB)，D-果糖激酶(cscK)，蔗糖水解酶(cscA)和Lacl-相关的蔗糖-特异性阻遏物(cscR)在rrnC基因座的插入；表达牙龈卟啉单胞菌Cat2，拜氏梭菌Ald的质粒；菌株具有菌株ECKh-432中非-PTS蔗糖基因的插入。宿主菌株20：宿主菌株ECKh-463，内源adhE，IdhA，pflB的缺失，内源lpdA的缺失以及在lpdA基因座具有Glu354Lys突变的肺炎克雷伯氏菌lpdA的染色体插入，内源mdh和arcA的缺失，gltA以gltA Argl63Leu突变的染色体替代；大肠杆菌sucCD，牙龈卟啉单胞菌sucD，牙龈卟啉单胞菌4hbd在fimD基因座的染色体插入，牛分支杆菌sue A，克氏梭菌4hbd在fimD基因座的染色体插入，非-PTS蔗糖操纵子在rrnC基因座的插入；表达丙酮丁醇梭菌bukl，丙酮丁醇梭菌ptb，拜氏梭菌Ald的质粒。

除了本文公开的产BDO菌株，包括表28中公开的那些外，可以理解的是可引入另外的变体以进一步提高BDO的生产和/或降低不合需要的副产品。例如，产BDO菌株或表28的菌株可引入另外的敲除以进一步提高BDO的生产或降低不合需要的副产品。示例性的敲除之前已经描述(参见美国公开2009/0047719)。所述敲除菌株包括，但不限于，ADHEr,NADH6；ADHEr,PPCK；ADHEr,SUCD4；ADHEr,ATPS4r；ADHEr,FUM；ADHEr,MDH；ADHEr,PFLi,PPCK；ADHEr,PFLi,SUCD4；ADHEr,ACKr,NADH6；ADHEr,NADH6,PFLi；ADHEr,ASPT,MDH；ADHEr,NADH6,PPCK；ADHEr,PPCK,THD2；ADHEr,ATPS4r,PPCK；ADHEr,MDH,THD2；ADHEr,FUM,PFLi；ADHEr,PPCK,SUCD4；ADHEr,GLCpts,PPCK；ADHEr,GLUDy,MDH；ADHEr,GLUDy,PPCK；ADHEr,FUM,PPCK；ADHEr,MDH,PPCK；ADHEr,FUM,GLUDy；ADHEr,FUM,HEX1；ADHEr,HEX1,PFLi；ADHEr,HEX1,THD2；ADHEr,FRD2,LDH_D,MDH；ADHEr,FRD2,LDH_D,ME2；ADHEr,MDH,PGL,THD2；ADHEr,G6PDHy,MDH,THD2；ADHEr,PFLi,PPCK,THD2；ADHEr,ACKr,AKGD,ATPS4r；ADHEr,GLCpts,PFLi,PPCK；ADHEr,ACKr,ATPS4r,SUCOAS；ADHEr,GLUDy,PFLi,PPCK；ADHEr,ME2,PFLi,SUCD4；ADHEr,GLUDy,PFLi,SUCD4；ADHEr,ATPS4r,LDH_D,SUCD4；ADHEr,FUM,HEX1,PFLi；ADHEr,MDH,NADH6,THD2；ADHEr,ATPS4r,MDH,NADH6；ADHEr,ATPS4r,FUM,NADH6；ADHEr,ASPT,MDH,NADH6；ADHEr,ASPT,MDH,THD2；ADHEr,ATPS4r,GLCpts,SUCD4；ADHEr,ATPS4r,GLUDy,MDH；ADHEr,ATPS4r,MDH,PPCK；ADHEr,ATPS4r,FUM,PPCK；ADHEr,ASPT,GLCpts,MDH；ADHEr,ASPT,GLUDy,MDH；ADHEr,ME2,SUCD4,THD2；ADHEr,FUM,PPCK,THD2；ADHEr,MDH,PPCK,THD2；ADHEr,GLUDy,MDH,THD2；ADHEr,HEX1,PFLi,THD2；ADHEr,ATPS4r,G6PDHy,MDH；ADHEr,ATPS4r,MDH,PGL；ADHEr,ACKr,FRD2,LDH_D；ADHEr,ACKr,LDH_D,SUCD4；ADHEr,ATPS4r,FUM,GLUDy；ADHEr,ATPS4r,FUM,HEX1；ADHEr,ATPS4r,MDH,THD2；ADHEr,ATPS4r,FRD2,LDH_D；ADHEr,ATPS4r,MDH,PGDH；ADHEr,GLCpts,PPCK,THD2；ADHEr,GLUDy,PPCK,THD2；ADHEr,FUM,HEX1,THD2；ADHEr,ATPS4r,ME2,THD2；ADHEr,FUM,ME2,THD2；ADHEr,GLCpts,GLUDy,PPCK；ADHEr,ME2,PGL,THD2；ADHEr,G6PDHy,ME2,THD2；ADHEr,ATPS4r,FRD2,LDH_D,ME2；ADHEr,ATPS4r,FRD2,LDH_D,MDH；ADHEr,ASPT,LDH_D,MDH,PFLi；ADHEr,ATPS4r,GLCpts,NADH6,PFLi；ADHEr,ATPS4r,MDH,NADH6,PGL；ADHEr,ATPS4r,G6PDHy,MDH,NADH6；ADHEr,ACKr,FUM,GLUDy,LDH_D；ADHEr,ACKr,GLUDy,LDH_D,SUCD4；ADHEr,ATPS4r,G6PDHy,MDH,THD2；ADHEr,ATPS4r,MDH,PGL,THD2；ADHEr,ASPT,G6PDHy,MDH,PYK；ADHEr,ASPT,MDH,PGL,PYK；ADHEr,ASPT,LDH_D,MDH,SUCOAS；ADHEr,ASPT,FUM,LDH_D,MDH；ADHEr,ASPT,LDH_D,MALS,MDH；ADHEr,ASPT,ICL,LDH_D,MDH；ADHEr,FRD2,GLUDy,LDH_D,PPCK；ADHEr,FRD2,LDH_D,PPCK,THD2；ADHEr,ACKr,ATPS4r,LDH_D,SUCD4；ADHEr,ACKr,ACS,PPC,PPCK；ADHEr,GLUDy,LDH_D,PPC,PPCK；ADHEr,LDH_D,PPC,PPCK,THD2；ADHEr,ASPT,ATPS4r,GLCpts,MDH；ADHEr,G6PDHy,MDH,NADH6,THD2；ADHEr,MDH,NADH6,PGL,THD2；ADHEr,ATPS4r,G6PDHy,GLCpts,MDH；ADHEr,ATPS4r,GLCpts,MDH,PGL；ADHEr,ACKr,LDH_D,MDH,SUCD4。

表29显示诸如大肠杆菌的宿主生物敲除相应的基因的反应。对应表29中缩写的相应的代谢产物在表30中显示。

表29.敲除的相应基因以阻止大肠杆菌中存在的特定反应。

表30.对应于表29中所用缩写的代谢产物名称

整个申请中参考各种公开出版物。这些出版物的公开内容在此通过引用全部引入本申请以更充分地描述本发明所属领域的状况。虽然本发明已经描述了以上提供的实施例，但很清楚可在不背离本发明精神下进行各种改变。

序列表

<110> 基因组股份公司

<120> 生产1,4-丁二醇的微生物和相关方法

<130> 066662-0311

<140> PCT/US2010/037544

<141> 2010-06-04

<150> 61/184,311

<151> 2009-06-04

<160> 88

<170> PatentIn 第3.5版

<210> 1

<211> 59

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成引物

<400> 1

gacgaattcg ctagcaagag gagaagtcga catgtccaat tcactggccg tcgttttac 59

<210> 2

<211> 47

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成引物

<400> 2

gaccctagga agctttctag agtcgaccta tgcggcatca gagcaga 47

<210> 3

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成引物

<400> 3

atgtaccgca agttccgc 18

<210> 4

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成引物

<400> 4

caatttgccg atgcccag 18

<210> 5

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成引物

<400> 5

gctgaccact gaagactttg 20

<210> 6

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成引物

<400> 6

gatcagggct tcggtgtag 19

<210> 7

<211> 27

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成引物

<400> 7

ttggtgcggg ccaagcagga tctgctc 27

<210> 8

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成引物

<400> 8

tcagccgaac gcctcgtcga ggatctcctg 30

<210> 9

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成引物

<400> 9

tggccaacat aagttcacca ttcgggcaaa ac 32

<210> 10

<211> 29

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成引物

<400> 10

tctcttcaac cagccattcg ttttgcccg 29

<210> 11

<211> 27

<212> DNA

<213> 丙酮丁醇梭菌

<400> 11

attaaagtta agtggaggaa tgttaac 27

<210> 12

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成引物

<400> 12

acacgcggat ccaacgtccc gg 22

<210> 13

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成引物

<400> 13

agcggctccg ctagccgctt atg 23

<210> 14

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成引物

<400> 14

aagccgttgc tgcagctctt gagc 24

<210> 15

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成引物

<400> 15

atctccggcg gtcggatccg tcg 23

<210> 16

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成引物

<400> 16

aaagcggcta gccacgccgc 20

<210> 17

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成引物

<400> 17

attacacgag gtacccaacg 20

<210> 18

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成引物

<400> 18

atgctggcgt acaaaggtgt cc 22

<210> 19

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成引物

<400> 19

ggacaccttt gtacgccagc at 22

<210> 20

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成引物

<400> 20

atcgcctaca ctaaaccaga agtgg 25

<210> 21

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成引物

<400> 21

ccacttctgg tttagtgtag gcgat 25

<210> 22

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成引物

<400> 22

aggcagttcc ataggatggc 20

<210> 23

<211> 55

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成引物

<400> 23

tgacatgtaa cacctacctt ctgtgcctgt gccagtggtt gctgtgatat agaag 55

<210> 24

<211> 48

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成引物

<400> 24

ataataatac atatgaacca tgcgagttac gggcctataa gccaggcg 48

<210> 25

<211> 42

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成引物

<400> 25

agtttttcga tatctgcatc agacaccggc acattgaaac gg 42

<210> 26

<211> 60

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成引物

<400> 26

ctggcacagg cacagaaggt aggtgttaca tgtcagaacg tttacacaat gacgtggatc 60

<210> 27

<211> 49

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成引物

<400> 27

agacaaatcg gttgccgttt gttaagccag gcgagatatg atctatatc 49

<210> 28

<211> 54

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成引物

<400> 28

gagttttgat ttcagtactc atcatgtaac acctaccttc ttgctgtgat atag 54

<210> 29

<211> 54

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成引物

<400> 29

ctatatcaca gcaagaaggt aggtgttaca tgatgagtac tgaaatcaaa actc 54

<210> 30

<211> 49

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成引物

<400> 30

gatatagatc atatctcgcc tggcttaaca aacggcaacc gatttgtct 49

<210> 31

<211> 70

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成寡核苷酸

<400> 31

tattgtgcat acagatgaat ttttatgcaa acagtcagcc ctgaagaagg gtgtaggctg 60

gagctgcttc 70

<210> 32

<211> 70

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成寡核苷酸

<400> 32

caaaaaaccg gagtctgtgc tccggttttt tattatccgc taatcaatta catatgaata 60

tcctccttag 70

<210> 33

<211> 51

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成引物

<400> 33

ataataatag aattcgtttg ctacctaaat tgccaactaa atcgaaacag g 51

<210> 34

<211> 47

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成引物

<400> 34

tattattatg gtaccaatat catgcagcaa acggtgcaac attgccg 47

<210> 35

<211> 47

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成引物

<400> 35

tgatctggaa gaattcatcg gctttaccac cgtcaaaaaa aacggcg 47

<210> 36

<211> 48

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成引物

<400> 36

ataaaaccct gcagcggaaa cgaagtttta tccatttttg gttacctg 48

<210> 37

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成引物

<400> 37

ggaagagagg ctggtaccca gaagccacag cagga 35

<210> 38

<211> 38

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成引物

<400> 38

gtaatcactg cgtaagcgcc atgccccggc gttaattc 38

<210> 39

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成引物

<400> 39

attgccgcgt tcctcctgct gtcga 25

<210> 40

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成引物

<400> 40

cgacagcagg aggaacgcgg caat 24

<210> 41

<211> 75

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成引物

<400> 41

gtttgcacgc tatagctgag gttgttgtct tccagcaacg taccgtatac aataggcgta 60

tcacgaggcc ctttc 75

<210> 42

<211> 70

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成引物

<400> 42

gctacagcat gtcacacgat ctcaacggtc ggatgaccaa tctggctggt atgggaatta 60

gccatggtcc 70

<210> 43

<211> 73

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成寡核苷酸

<400> 43

tgtgagtgaa agtcacctgc cttaatatct caaaactcat cttcgggtga cgaaatatgg 60

cgtgactcga tac 73

<210> 44

<211> 70

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成寡核苷酸

<400> 44

tctgtatcag gctgaaaatc ttctctcatc cgccaaaaca gcttcggcgt taagatgcgc 60

gctcaaggac 70

<210> 45

<211> 2036

<212> DNA

<213> 大肠杆菌

<400> 45

atgaacttac atgaatatca ggcaaaacaa ctttttgccc gctatggctt accagcaccg 60

gtgggttatg cctgtactac tccgcgcgaa gcagaagaag ccgcttcaaa aatcggtgcc 120

ggtccgtggg tagtgaaatg tcaggttcac gctggtggcc gcggtaaagc gggcggtgtg 180

aaagttgtaa acagcaaaga agacatccgt gcttttgcag aaaactggct gggcaagcgt 240

ctggtaacgt atcaaacaga tgccaatggc caaccggtta accagattct ggttgaagca 300

gcgaccgata tcgctaaaga gctgtatctc ggtgccgttg ttgaccgtag ttcccgtcgt 360

gtggtcttta tggcctccac cgaaggcggc gtggaaatcg aaaaagtggc ggaagaaact 420

ccgcacctga tccataaagt tgcgcttgat ccgctgactg gcccgatgcc gtatcaggga 480

cgcgagctgg cgttcaaact gggtctggaa ggtaaactgg ttcagcagtt caccaaaatc 540

ttcatgggcc tggcgaccat tttcctggag cgcgacctgg cgttgatcga aatcaacccg 600

ctggtcatca ccaaacaggg cgatctgatt tgcctcgacg gcaaactggg cgctgacggc 660

aacgcactgt tccgccagcc tgatctgcgc gaaatgcgtg accagtcgca ggaagatccg 720

cgtgaagcac aggctgcaca gtgggaactg aactacgttg cgctggacgg taacatcggt 780

tgtatggtta acggcgcagg tctggcgatg ggtacgatgg acatcgttaa actgcacggc 840

ggcgaaccgg ctaacttcct tgacgttggc ggcggcgcaa ccaaagaacg tgtaaccgaa 900

gcgttcaaaa tcatcctctc tgacgacaaa gtgaaagccg ttctggttaa catcttcggc 960

ggtatcgttc gttgcgacct gatcgctgac ggtatcatcg gcgcggtagc agaagtgggt 1020

gttaacgtac cggtcgtggt acgtctggaa ggtaacaacg ccgaactcgg cgcgaagaaa 1080

ctggctgaca gcggcctgaa tattattgca gcaaaaggtc tgacggatgc agctcagcag 1140

gttgttgccg cagtggaggg gaaataatgt ccattttaat cgataaaaac accaaggtta 1200

tctgccaggg ctttaccggt agccagggga ctttccactc agaacaggcc attgcatacg 1260

gcactaaaat ggttggcggc gtaaccccag gtaaaggcgg caccacccac ctcggcctgc 1320

cggtgttcaa caccgtgcgt gaagccgttg ctgccactgg cgctaccgct tctgttatct 1380

acgtaccagc accgttctgc aaagactcca ttctggaagc catcgacgca ggcatcaaac 1440

tgattatcac catcactgaa ggcatcccga cgctggatat gctgaccgtg aaagtgaagc 1500

tggatgaagc aggcgttcgt atgatcggcc cgaactgccc aggcgttatc actccgggtg 1560

aatgcaaaat cggtatccag cctggtcaca ttcacaaacc gggtaaagtg ggtatcgttt 1620

cccgttccgg tacactgacc tatgaagcgg ttaaacagac cacggattac ggtttcggtc 1680

agtcgacctg tgtcggtatc ggcggtgacc cgatcccggg ctctaacttt atcgacattc 1740

tcgaaatgtt cgaaaaagat ccgcagaccg aagcgatcgt gatgatcggt gagatcggcg 1800

gtagcgctga agaagaagca gctgcgtaca tcaaagagca cgttaccaag ccagttgtgg 1860

gttacatcgc tggtgtgact gcgccgaaag gcaaacgtat gggccacgcg ggtgccatca 1920

ttgccggtgg gaaagggact gcggatgaga aattcgctgc tctggaagcc gcaggcgtga 1980

aaaccgttcg cagcctggcg gatatcggtg aagcactgaa aactgttctg aaataa 2036

<210> 46

<211> 388

<212> PRT

<213> 大肠杆菌

<400> 46

Met Asn Leu His Glu Tyr Gln Ala Lys Gln Leu Phe Ala Arg Tyr Gly

1 5 10 15

Leu Pro Ala Pro Val Gly Tyr Ala Cys Thr Thr Pro Arg Glu Ala Glu

20 25 30

Glu Ala Ala Ser Lys Ile Gly Ala Gly Pro Trp Val Val Lys Cys Gln

35 40 45

Val His Ala Gly Gly Arg Gly Lys Ala Gly Gly Val Lys Val Val Asn

50 55 60

Ser Lys Glu Asp Ile Arg Ala Phe Ala Glu Asn Trp Leu Gly Lys Arg

65 70 75 80

Leu Val Thr Tyr Gln Thr Asp Ala Asn Gly Gln Pro Val Asn Gln Ile

85 90 95

Leu Val Glu Ala Ala Thr Asp Ile Ala Lys Glu Leu Tyr Leu Gly Ala

100 105 110

Val Val Asp Arg Ser Ser Arg Arg Val Val Phe Met Ala Ser Thr Glu

115 120 125

Gly Gly Val Glu Ile Glu Lys Val Ala Glu Glu Thr Pro His Leu Ile

130 135 140

His Lys Val Ala Leu Asp Pro Leu Thr Gly Pro Met Pro Tyr Gln Gly

145 150 155 160

Arg Glu Leu Ala Phe Lys Leu Gly Leu Glu Gly Lys Leu Val Gln Gln

165 170 175

Phe Thr Lys Ile Phe Met Gly Leu Ala Thr Ile Phe Leu Glu Arg Asp

180 185 190

Leu Ala Leu Ile Glu Ile Asn Pro Leu Val Ile Thr Lys Gln Gly Asp

195 200 205

Leu Ile Cys Leu Asp Gly Lys Leu Gly Ala Asp Gly Asn Ala Leu Phe

210 215 220

Arg Gln Pro Asp Leu Arg Glu Met Arg Asp Gln Ser Gln Glu Asp Pro

225 230 235 240

Arg Glu Ala Gln Ala Ala Gln Trp Glu Leu Asn Tyr Val Ala Leu Asp

245 250 255

Gly Asn Ile Gly Cys Met Val Asn Gly Ala Gly Leu Ala Met Gly Thr

260 265 270

Met Asp Ile Val Lys Leu His Gly Gly Glu Pro Ala Asn Phe Leu Asp

275 280 285

Val Gly Gly Gly Ala Thr Lys Glu Arg Val Thr Glu Ala Phe Lys Ile

290 295 300

Ile Leu Ser Asp Asp Lys Val Lys Ala Val Leu Val Asn Ile Phe Gly

305 310 315 320

Gly Ile Val Arg Cys Asp Leu Ile Ala Asp Gly Ile Ile Gly Ala Val

325 330 335

Ala Glu Val Gly Val Asn Val Pro Val Val Val Arg Leu Glu Gly Asn

340 345 350

Asn Ala Glu Leu Gly Ala Lys Lys Leu Ala Asp Ser Gly Leu Asn Ile

355 360 365

Ile Ala Ala Lys Gly Leu Thr Asp Ala Ala Gln Gln Val Val Ala Ala

370 375 380

Val Glu Gly Lys

385

<210> 47

<211> 289

<212> PRT

<213> 大肠杆菌

<400> 47

Met Ser Ile Leu Ile Asp Lys Asn Thr Lys Val Ile Cys Gln Gly Phe

1 5 10 15

Thr Gly Ser Gln Gly Thr Phe His Ser Glu Gln Ala Ile Ala Tyr Gly

20 25 30

Thr Lys Met Val Gly Gly Val Thr Pro Gly Lys Gly Gly Thr Thr His

35 40 45

Leu Gly Leu Pro Val Phe Asn Thr Val Arg Glu Ala Val Ala Ala Thr

50 55 60

Gly Ala Thr Ala Ser Val Ile Tyr Val Pro Ala Pro Phe Cys Lys Asp

65 70 75 80

Ser Ile Leu Glu Ala Ile Asp Ala Gly Ile Lys Leu Ile Ile Thr Ile

85 90 95

Thr Glu Gly Ile Pro Thr Leu Asp Met Leu Thr Val Lys Val Lys Leu

100 105 110

Asp Glu Ala Gly Val Arg Met Ile Gly Pro Asn Cys Pro Gly Val Ile

115 120 125

Thr Pro Gly Glu Cys Lys Ile Gly Ile Gln Pro Gly His Ile His Lys

130 135 140

Pro Gly Lys Val Gly Ile Val Ser Arg Ser Gly Thr Leu Thr Tyr Glu

145 150 155 160

Ala Val Lys Gln Thr Thr Asp Tyr Gly Phe Gly Gln Ser Thr Cys Val

165 170 175

Gly Ile Gly Gly Asp Pro Ile Pro Gly Ser Asn Phe Ile Asp Ile Leu

180 185 190

Glu Met Phe Glu Lys Asp Pro Gln Thr Glu Ala Ile Val Met Ile Gly

195 200 205

Glu Ile Gly Gly Ser Ala Glu Glu Glu Ala Ala Ala Tyr Ile Lys Glu

210 215 220

His Val Thr Lys Pro Val Val Gly Tyr Ile Ala Gly Val Thr Ala Pro

225 230 235 240

Lys Gly Lys Arg Met Gly His Ala Gly Ala Ile Ile Ala Gly Gly Lys

245 250 255

Gly Thr Ala Asp Glu Lys Phe Ala Ala Leu Glu Ala Ala Gly Val Lys

260 265 270

Thr Val Arg Ser Leu Ala Asp Ile Gly Glu Ala Leu Lys Thr Val Leu

275 280 285

Lys

<210> 48

<211> 3696

<212> DNA

<213> 牛分枝杆菌

<400> 48

atggccaaca taagttcacc attcgggcaa aacgaatggc tggttgaaga gatgtaccgc 60

aagttccgcg acgacccctc ctcggtcgat cccagctggc acgagttcct ggttgactac 120

agccccgaac ccacctccca accagctgcc gaaccaaccc gggttacctc gccactcgtt 180

gccgagcggg ccgctgcggc cgccccgcag gcacccccca agccggccga caccgcggcc 240

gcgggcaacg gcgtggtcgc cgcactggcc gccaaaactg ccgttccccc gccagccgaa 300

ggtgacgagg tagcggtgct gcgcggcgcc gccgcggccg tcgtcaagaa catgtccgcg 360

tcgttggagg tgccgacggc gaccagcgtc cgggcggtcc cggccaagct actgatcgac 420

aaccggatcg tcatcaacaa ccagttgaag cggacccgcg gcggcaagat ctcgttcacg 480

catttgctgg gctacgccct ggtgcaggcg gtgaagaaat tcccgaacat gaaccggcac 540

tacaccgaag tcgacggcaa gcccaccgcg gtcacgccgg cgcacaccaa tctcggcctg 600

gcgatcgacc tgcaaggcaa ggacgggaag cgttccctgg tggtggccgg catcaagcgg 660

tgcgagacca tgcgattcgc gcagttcgtc acggcctacg aagacatcgt acgccgggcc 720

cgcgacggca agctgaccac tgaagacttt gccggcgtga cgatttcgct gaccaatccc 780

ggaaccatcg gcaccgtgca ttcggtgccg cggctgatgc ccggccaggg cgccatcatc 840

ggcgtgggcg ccatggaata ccccgccgag tttcaaggcg ccagcgagga acgcatcgcc 900

gagctgggca tcggcaaatt gatcactttg acctccacct acgaccaccg catcatccag 960

ggcgcggaat cgggcgactt cctgcgcacc atccacgagt tgctgctctc ggatggcttc 1020

tgggacgagg tcttccgcga actgagcatc ccatatctgc cggtgcgctg gagcaccgac 1080

aaccccgact cgatcgtcga caagaacgct cgcgtcatga acttgatcgc ggcctaccgc 1140

aaccgcggcc atctgatggc cgataccgac ccgctgcggt tggacaaagc tcggttccgc 1200

agtcaccccg acctcgaagt gctgacccac ggcctgacgc tgtgggatct cgatcgggtg 1260

ttcaaggtcg acggctttgc cggtgcgcag tacaagaaac tgcgcgacgt gctgggcttg 1320

ctgcgcgatg cctactgccg ccacatcggc gtggagtacg cccatatcct cgaccccgaa 1380

caaaaggagt ggctcgaaca acgggtcgag accaagcacg tcaaacccac tgtggcccaa 1440

cagaaataca tcctcagcaa gctcaacgcc gccgaggcct ttgaaacgtt cctacagacc 1500

aagtacgtcg gccagaagcg gttctcgctg gaaggcgccg aaagcgtgat cccgatgatg 1560

gacgcggcga tcgaccagtg cgctgagcac ggcctcgacg aggtggtcat cgggatgccg 1620

caccggggcc ggctcaacgt gctggccaac atcgtcggca agccgtactc gcagatcttc 1680

accgagttcg agggcaacct gaatccgtcg caggcgcacg gctccggtga cgtcaagtac 1740

cacctgggcg ccaccgggct gtacctgcag atgttcggcg acaacgacat tcaggtgtcg 1800

ctgaccgcca acccgtcgca tctggaggcc gtcgacccgg tgctggaggg attggtgcgg 1860

gccaagcagg atctgctcga ccacggaagc atcgacagcg acggccaacg ggcgttctcg 1920

gtggtgccgc tgatgttgca tggcgatgcc gcgttcgccg gtcagggtgt ggtcgccgag 1980

acgctgaacc tggcgaatct gccgggctac cgcgtcggcg gcaccatcca catcatcgtc 2040

aacaaccaga tcggcttcac caccgcgccc gagtattcca ggtccagcga gtactgcacc 2100

gacgtcgcaa agatgatcgg ggcaccgatc tttcacgtca acggcgacga cccggaggcg 2160

tgtgtctggg tggcgcggtt ggcggtggac ttccgacaac ggttcaagaa ggacgtcgtc 2220

atcgacatgc tgtgctaccg ccgccgcggg cacaacgagg gtgacgaccc gtcgatgacc 2280

aacccctaca tgtacgacgt cgtcgacacc aagcgcgggg cccgcaaaag ctacaccgaa 2340

gccctgatcg gacgtggcga catctcgatg aaggaggccg aggacgcgct gcgcgactac 2400

cagggccagc tggaacgggt gttcaacgaa gtgcgcgagc tggagaagca cggtgtgcag 2460

ccgagcgagt cggtcgagtc cgaccagatg attcccgcgg ggctggccac tgcggtggac 2520

aagtcgctgc tggcccggat cggcgatgcg ttcctcgcct tgccgaacgg cttcaccgcg 2580

cacccgcgag tccaaccggt gctggagaag cgccgggaga tggcctatga aggcaagatc 2640

gactgggcct ttggcgagct gctggcgctg ggctcgctgg tggccgaagg caagctggtg 2700

cgcttgtcgg ggcaggacag ccgccgcggc accttctccc agcggcattc ggttctcatc 2760

gaccgccaca ctggcgagga gttcacacca ctgcagctgc tggcgaccaa ctccgacggc 2820

agcccgaccg gcggaaagtt cctggtctac gactcgccac tgtcggagta cgccgccgtc 2880

ggcttcgagt acggctacac tgtgggcaat ccggacgccg tggtgctctg ggaggcgcag 2940

ttcggcgact tcgtcaacgg cgcacagtcg atcatcgacg agttcatcag ctccggtgag 3000

gccaagtggg gccaattgtc caacgtcgtg ctgctgttac cgcacgggca cgaggggcag 3060

ggacccgacc acacttctgc ccggatcgaa cgcttcttgc agttgtgggc ggaaggttcg 3120

atgaccatcg cgatgccgtc gactccgtcg aactacttcc acctgctacg ccggcatgcc 3180

ctggacggca tccaacgccc gctgatcgtg ttcacgccca agtcgatgtt gcgtcacaag 3240

gccgccgtca gcgaaatcaa ggacttcacc gagatcaagt tccgctcagt gctggaggaa 3300

cccacctatg aggacggcat cggagaccgc aacaaggtca gccggatcct gctgaccagt 3360

ggcaagctgt attacgagct ggccgcccgc aaggccaagg acaaccgcaa tgacctcgcg 3420

atcgtgcggc ttgaacagct cgccccgctg cccaggcgtc gactgcgtga aacgctggac 3480

cgctacgaga acgtcaagga gttcttctgg gtccaagagg aaccggccaa ccagggtgcg 3540

tggccgcgat tcgggctcga actacccgag ctgctgcctg acaagttggc cgggatcaag 3600

cgaatctcgc gccgggcgat gtcagccccg tcgtcaggct cgtcgaaggt gcacgccgtc 3660

gaacagcagg agatcctcga cgaggcgttc ggctaa 3696

<210> 49

<211> 1231

<212> PRT

<213> 牛分枝杆菌

<400> 49

Met Ala Asn Ile Ser Ser Pro Phe Gly Gln Asn Glu Trp Leu Val Glu

1 5 10 15

Glu Met Tyr Arg Lys Phe Arg Asp Asp Pro Ser Ser Val Asp Pro Ser

20 25 30

Trp His Glu Phe Leu Val Asp Tyr Ser Pro Glu Pro Thr Ser Gln Pro

35 40 45

Ala Ala Glu Pro Thr Arg Val Thr Ser Pro Leu Val Ala Glu Arg Ala

50 55 60

Ala Ala Ala Ala Pro Gln Ala Pro Pro Lys Pro Ala Asp Thr Ala Ala

65 70 75 80

Ala Gly Asn Gly Val Val Ala Ala Leu Ala Ala Lys Thr Ala Val Pro

85 90 95

Pro Pro Ala Glu Gly Asp Glu Val Ala Val Leu Arg Gly Ala Ala Ala

100 105 110

Ala Val Val Lys Asn Met Ser Ala Ser Leu Glu Val Pro Thr Ala Thr

115 120 125

Ser Val Arg Ala Val Pro Ala Lys Leu Leu Ile Asp Asn Arg Ile Val

130 135 140

Ile Asn Asn Gln Leu Lys Arg Thr Arg Gly Gly Lys Ile Ser Phe Thr

145 150 155 160

His Leu Leu Gly Tyr Ala Leu Val Gln Ala Val Lys Lys Phe Pro Asn

165 170 175

Met Asn Arg His Tyr Thr Glu Val Asp Gly Lys Pro Thr Ala Val Thr

180 185 190

Pro Ala His Thr Asn Leu Gly Leu Ala Ile Asp Leu Gln Gly Lys Asp

195 200 205

Gly Lys Arg Ser Leu Val Val Ala Gly Ile Lys Arg Cys Glu Thr Met

210 215 220

Arg Phe Ala Gln Phe Val Thr Ala Tyr Glu Asp Ile Val Arg Arg Ala

225 230 235 240

Arg Asp Gly Lys Leu Thr Thr Glu Asp Phe Ala Gly Val Thr Ile Ser

245 250 255

Leu Thr Asn Pro Gly Thr Ile Gly Thr Val His Ser Val Pro Arg Leu

260 265 270

Met Pro Gly Gln Gly Ala Ile Ile Gly Val Gly Ala Met Glu Tyr Pro

275 280 285

Ala Glu Phe Gln Gly Ala Ser Glu Glu Arg Ile Ala Glu Leu Gly Ile

290 295 300

Gly Lys Leu Ile Thr Leu Thr Ser Thr Tyr Asp His Arg Ile Ile Gln

305 310 315 320

Gly Ala Glu Ser Gly Asp Phe Leu Arg Thr Ile His Glu Leu Leu Leu

325 330 335

Ser Asp Gly Phe Trp Asp Glu Val Phe Arg Glu Leu Ser Ile Pro Tyr

340 345 350

Leu Pro Val Arg Trp Ser Thr Asp Asn Pro Asp Ser Ile Val Asp Lys

355 360 365

Asn Ala Arg Val Met Asn Leu Ile Ala Ala Tyr Arg Asn Arg Gly His

370 375 380

Leu Met Ala Asp Thr Asp Pro Leu Arg Leu Asp Lys Ala Arg Phe Arg

385 390 395 400

Ser His Pro Asp Leu Glu Val Leu Thr His Gly Leu Thr Leu Trp Asp

405 410 415

Leu Asp Arg Val Phe Lys Val Asp Gly Phe Ala Gly Ala Gln Tyr Lys

420 425 430

Lys Leu Arg Asp Val Leu Gly Leu Leu Arg Asp Ala Tyr Cys Arg His

435 440 445

Ile Gly Val Glu Tyr Ala His Ile Leu Asp Pro Glu Gln Lys Glu Trp

450 455 460

Leu Glu Gln Arg Val Glu Thr Lys His Val Lys Pro Thr Val Ala Gln

465 470 475 480

Gln Lys Tyr Ile Leu Ser Lys Leu Asn Ala Ala Glu Ala Phe Glu Thr

485 490 495

Phe Leu Gln Thr Lys Tyr Val Gly Gln Lys Arg Phe Ser Leu Glu Gly

500 505 510

Ala Glu Ser Val Ile Pro Met Met Asp Ala Ala Ile Asp Gln Cys Ala

515 520 525

Glu His Gly Leu Asp Glu Val Val Ile Gly Met Pro His Arg Gly Arg

530 535 540

Leu Asn Val Leu Ala Asn Ile Val Gly Lys Pro Tyr Ser Gln Ile Phe

545 550 555 560

Thr Glu Phe Glu Gly Asn Leu Asn Pro Ser Gln Ala His Gly Ser Gly

565 570 575

Asp Val Lys Tyr His Leu Gly Ala Thr Gly Leu Tyr Leu Gln Met Phe

580 585 590

Gly Asp Asn Asp Ile Gln Val Ser Leu Thr Ala Asn Pro Ser His Leu

595 600 605

Glu Ala Val Asp Pro Val Leu Glu Gly Leu Val Arg Ala Lys Gln Asp

610 615 620

Leu Leu Asp His Gly Ser Ile Asp Ser Asp Gly Gln Arg Ala Phe Ser

625 630 635 640

Val Val Pro Leu Met Leu His Gly Asp Ala Ala Phe Ala Gly Gln Gly

645 650 655

Val Val Ala Glu Thr Leu Asn Leu Ala Asn Leu Pro Gly Tyr Arg Val

660 665 670

Gly Gly Thr Ile His Ile Ile Val Asn Asn Gln Ile Gly Phe Thr Thr

675 680 685

Ala Pro Glu Tyr Ser Arg Ser Ser Glu Tyr Cys Thr Asp Val Ala Lys

690 695 700

Met Ile Gly Ala Pro Ile Phe His Val Asn Gly Asp Asp Pro Glu Ala

705 710 715 720

Cys Val Trp Val Ala Arg Leu Ala Val Asp Phe Arg Gln Arg Phe Lys

725 730 735

Lys Asp Val Val Ile Asp Met Leu Cys Tyr Arg Arg Arg Gly His Asn

740 745 750

Glu Gly Asp Asp Pro Ser Met Thr Asn Pro Tyr Met Tyr Asp Val Val

755 760 765

Asp Thr Lys Arg Gly Ala Arg Lys Ser Tyr Thr Glu Ala Leu Ile Gly

770 775 780

Arg Gly Asp Ile Ser Met Lys Glu Ala Glu Asp Ala Leu Arg Asp Tyr

785 790 795 800

Gln Gly Gln Leu Glu Arg Val Phe Asn Glu Val Arg Glu Leu Glu Lys

805 810 815

His Gly Val Gln Pro Ser Glu Ser Val Glu Ser Asp Gln Met Ile Pro

820 825 830

Ala Gly Leu Ala Thr Ala Val Asp Lys Ser Leu Leu Ala Arg Ile Gly

835 840 845

Asp Ala Phe Leu Ala Leu Pro Asn Gly Phe Thr Ala His Pro Arg Val

850 855 860

Gln Pro Val Leu Glu Lys Arg Arg Glu Met Ala Tyr Glu Gly Lys Ile

865 870 875 880

Asp Trp Ala Phe Gly Glu Leu Leu Ala Leu Gly Ser Leu Val Ala Glu

885 890 895

Gly Lys Leu Val Arg Leu Ser Gly Gln Asp Ser Arg Arg Gly Thr Phe

900 905 910

Ser Gln Arg His Ser Val Leu Ile Asp Arg His Thr Gly Glu Glu Phe

915 920 925

Thr Pro Leu Gln Leu Leu Ala Thr Asn Ser Asp Gly Ser Pro Thr Gly

930 935 940

Gly Lys Phe Leu Val Tyr Asp Ser Pro Leu Ser Glu Tyr Ala Ala Val

945 950 955 960

Gly Phe Glu Tyr Gly Tyr Thr Val Gly Asn Pro Asp Ala Val Val Leu

965 970 975

Trp Glu Ala Gln Phe Gly Asp Phe Val Asn Gly Ala Gln Ser Ile Ile

980 985 990

Asp Glu Phe Ile Ser Ser Gly Glu Ala Lys Trp Gly Gln Leu Ser Asn

995 1000 1005

Val Val Leu Leu Leu Pro His Gly His Glu Gly Gln Gly Pro Asp

1010 1015 1020

His Thr Ser Ala Arg Ile Glu Arg Phe Leu Gln Leu Trp Ala Glu

1025 1030 1035

Gly Ser Met Thr Ile Ala Met Pro Ser Thr Pro Ser Asn Tyr Phe

1040 1045 1050

His Leu Leu Arg Arg His Ala Leu Asp Gly Ile Gln Arg Pro Leu

1055 1060 1065

Ile Val Phe Thr Pro Lys Ser Met Leu Arg His Lys Ala Ala Val

1070 1075 1080

Ser Glu Ile Lys Asp Phe Thr Glu Ile Lys Phe Arg Ser Val Leu

1085 1090 1095

Glu Glu Pro Thr Tyr Glu Asp Gly Ile Gly Asp Arg Asn Lys Val

1100 1105 1110

Ser Arg Ile Leu Leu Thr Ser Gly Lys Leu Tyr Tyr Glu Leu Ala

1115 1120 1125

Ala Arg Lys Ala Lys Asp Asn Arg Asn Asp Leu Ala Ile Val Arg

1130 1135 1140

Leu Glu Gln Leu Ala Pro Leu Pro Arg Arg Arg Leu Arg Glu Thr

1145 1150 1155

Leu Asp Arg Tyr Glu Asn Val Lys Glu Phe Phe Trp Val Gln Glu

1160 1165 1170

Glu Pro Ala Asn Gln Gly Ala Trp Pro Arg Phe Gly Leu Glu Leu

1175 1180 1185

Pro Glu Leu Leu Pro Asp Lys Leu Ala Gly Ile Lys Arg Ile Ser

1190 1195 1200

Arg Arg Ala Met Ser Ala Pro Ser Ser Gly Ser Ser Lys Val His

1205 1210 1215

Ala Val Glu Gln Gln Glu Ile Leu Asp Glu Ala Phe Gly

1220 1225 1230

<210> 50

<211> 1356

<212> DNA

<213> 牙龈卟啉单胞菌

<400> 50

atggaaatca aagaaatggt gagccttgca cgcaaggctc agaaggagta tcaagctacc 60

cataaccaag aagcagttga caacatttgc cgagctgcag caaaagttat ttatgaaaat 120

gcagctattc tggctcgcga agcagtagac gaaaccggca tgggcgttta cgaacacaaa 180

gtggccaaga atcaaggcaa atccaaaggt gtttggtaca acctccacaa taaaaaatcg 240

attggtatcc tcaatataga cgagcgtacc ggtatgatcg agattgcaaa gcctatcgga 300

gttgtaggag ccgtaacgcc gacgaccaac ccgatcgtta ctccgatgag caatatcatc 360

tttgctctta agacctgcaa tgccatcatt attgcccccc accccagatc caaaaaatgc 420

tctgcacacg cagttcgtct gatcaaagaa gctatcgctc cgttcaacgt accggaaggt 480

atggttcaga tcatcgaaga acccagcatc gagaagacgc aggaactcat gggcgccgta 540

gacgtagtag ttgctacggg tggtatgggc atggtgaagt ctgcatattc ttcaggaaag 600

ccttctttcg gtgttggagc cggtaacgtt caggtgatcg tggatagcaa catcgatttc 660

gaagctgctg cagaaaaaat catcaccggt cgtgctttcg acaacggtat catctgctca 720

ggcgaacaga gcatcatcta caacgaggct gacaaggaag cagttttcac agcattccgc 780

aaccacggtg catatttctg tgacgaagcc gaaggagatc gggctcgtgc agctatcttc 840

gaaaatggag ccatcgcgaa agatgtagta ggtcagagcg ttgccttcat tgccaagaaa 900

gcaaacatca atatccccga gggtacccgt attctcgttg ttgaagctcg cggcgtagga 960

gcagaagacg ttatctgtaa ggaaaagatg tgtcccgtaa tgtgcgccct cagctacaag 1020

cacttcgaag aaggtgtaga aatcgcacgt acgaacctcg ccaacgaagg taacggccac 1080

acctgtgcta tccactccaa caatcaggca cacatcatcc tcgcaggatc agagctgacg 1140

gtatctcgta tcgtagtgaa tgctccgagt gccactacag caggcggtca catccaaaac 1200

ggtcttgccg taaccaatac gctcggatgc ggatcatggg gtaataactc tatctccgag 1260

aacttcactt acaagcacct cctcaacatt tcacgcatcg caccgttgaa ttcaagcatt 1320

cacatccccg atgacaaaga aatctgggaa ctctaa 1356

<210> 51

<211> 451

<212> PRT

<213> 牙龈卟啉单胞菌

<400> 51

Met Glu Ile Lys Glu Met Val Ser Leu Ala Arg Lys Ala Gln Lys Glu

1 5 10 15

Tyr Gln Ala Thr His Asn Gln Glu Ala Val Asp Asn Ile Cys Arg Ala

20 25 30

Ala Ala Lys Val Ile Tyr Glu Asn Ala Ala Ile Leu Ala Arg Glu Ala

35 40 45

Val Asp Glu Thr Gly Met Gly Val Tyr Glu His Lys Val Ala Lys Asn

50 55 60

Gln Gly Lys Ser Lys Gly Val Trp Tyr Asn Leu His Asn Lys Lys Ser

65 70 75 80

Ile Gly Ile Leu Asn Ile Asp Glu Arg Thr Gly Met Ile Glu Ile Ala

85 90 95

Lys Pro Ile Gly Val Val Gly Ala Val Thr Pro Thr Thr Asn Pro Ile

100 105 110

Val Thr Pro Met Ser Asn Ile Ile Phe Ala Leu Lys Thr Cys Asn Ala

115 120 125

Ile Ile Ile Ala Pro His Pro Arg Ser Lys Lys Cys Ser Ala His Ala

130 135 140

Val Arg Leu Ile Lys Glu Ala Ile Ala Pro Phe Asn Val Pro Glu Gly

145 150 155 160

Met Val Gln Ile Ile Glu Glu Pro Ser Ile Glu Lys Thr Gln Glu Leu

165 170 175

Met Gly Ala Val Asp Val Val Val Ala Thr Gly Gly Met Gly Met Val

180 185 190

Lys Ser Ala Tyr Ser Ser Gly Lys Pro Ser Phe Gly Val Gly Ala Gly

195 200 205

Asn Val Gln Val Ile Val Asp Ser Asn Ile Asp Phe Glu Ala Ala Ala

210 215 220

Glu Lys Ile Ile Thr Gly Arg Ala Phe Asp Asn Gly Ile Ile Cys Ser

225 230 235 240

Gly Glu Gln Ser Ile Ile Tyr Asn Glu Ala Asp Lys Glu Ala Val Phe

245 250 255

Thr Ala Phe Arg Asn His Gly Ala Tyr Phe Cys Asp Glu Ala Glu Gly

260 265 270

Asp Arg Ala Arg Ala Ala Ile Phe Glu Asn Gly Ala Ile Ala Lys Asp

275 280 285

Val Val Gly Gln Ser Val Ala Phe Ile Ala Lys Lys Ala Asn Ile Asn

290 295 300

Ile Pro Glu Gly Thr Arg Ile Leu Val Val Glu Ala Arg Gly Val Gly

305 310 315 320

Ala Glu Asp Val Ile Cys Lys Glu Lys Met Cys Pro Val Met Cys Ala

325 330 335

Leu Ser Tyr Lys His Phe Glu Glu Gly Val Glu Ile Ala Arg Thr Asn

340 345 350

Leu Ala Asn Glu Gly Asn Gly His Thr Cys Ala Ile His Ser Asn Asn

355 360 365

Gln Ala His Ile Ile Leu Ala Gly Ser Glu Leu Thr Val Ser Arg Ile

370 375 380

Val Val Asn Ala Pro Ser Ala Thr Thr Ala Gly Gly His Ile Gln Asn

385 390 395 400

Gly Leu Ala Val Thr Asn Thr Leu Gly Cys Gly Ser Trp Gly Asn Asn

405 410 415

Ser Ile Ser Glu Asn Phe Thr Tyr Lys His Leu Leu Asn Ile Ser Arg

420 425 430

Ile Ala Pro Leu Asn Ser Ser Ile His Ile Pro Asp Asp Lys Glu Ile

435 440 445

Trp Glu Leu

450

<210> 52

<211> 1116

<212> DNA

<213> 牙龈卟啉单胞菌

<400> 52

atgcaacttt tcaaactcaa gagtgtaaca catcactttg acacttttgc agaatttgcc 60

aaggaattct gtcttggaga acgcgacttg gtaattacca acgagttcat ctatgaaccg 120

tatatgaagg catgccagct cccctgccat tttgttatgc aggagaaata tgggcaaggc 180

gagccttctg acgaaatgat gaataacatc ttggcagaca tccgtaatat ccagttcgac 240

cgcgtaatcg gtatcggagg aggtacggtt attgacatct ctaaactttt cgttctgaaa 300

ggattaaatg atgtactcga tgcattcgac cgcaaaatac ctcttatcaa agagaaagaa 360

ctgatcattg tgcccacaac atgcggaacg ggtagcgagg tgacgaacat ttctatcgca 420

gaaatcaaaa gccgtcacac caaaatggga ttggctgacg atgccattgt tgcagaccat 480

gccatcatca tacctgaact tctgaagagc ttgcctttcc acttctacgc atgcagtgca 540

atcgatgctc ttatccatgc catcgagtca tacgtatctc ctaaagccag tccatattct 600

cgtctgttca gtgaggcggc ttgggacatt atcctggaag tattcaagaa aatcgccgaa 660

cacggccctg aataccgctt cgaaaagctg ggagaaatga tcatggccag caactatgcc 720

ggtatagcct tcggaaatgc aggagtagga gccgtccacg cactatccta cccgttggga 780

ggcaactatc acgtgccgca tggagaagca aactatcagt tcttcacaga ggtattcaaa 840

gtataccaaa agaagaatcc tttcggctat atagtcgaac tcaactggaa gctctccaag 900

atactgaact gccagcccga atacgtatat ccgaagctgg atgaacttct cggatgcctt 960

cttaccaaga aacctttgca cgaatacggc atgaaggacg aagaggtaag aggctttgcg 1020

gaatcagtgc ttaagacaca gcaaagattg ctcgccaaca actacgtaga gcttactgta 1080

gatgagatcg aaggtatcta cagaagactc tactaa 1116

<210> 53

<211> 371

<212> PRT

<213> 牙龈卟啉单胞菌

<400> 53

Met Gln Leu Phe Lys Leu Lys Ser Val Thr His His Phe Asp Thr Phe

1 5 10 15

Ala Glu Phe Ala Lys Glu Phe Cys Leu Gly Glu Arg Asp Leu Val Ile

20 25 30

Thr Asn Glu Phe Ile Tyr Glu Pro Tyr Met Lys Ala Cys Gln Leu Pro

35 40 45

Cys His Phe Val Met Gln Glu Lys Tyr Gly Gln Gly Glu Pro Ser Asp

50 55 60

Glu Met Met Asn Asn Ile Leu Ala Asp Ile Arg Asn Ile Gln Phe Asp

65 70 75 80

Arg Val Ile Gly Ile Gly Gly Gly Thr Val Ile Asp Ile Ser Lys Leu

85 90 95

Phe Val Leu Lys Gly Leu Asn Asp Val Leu Asp Ala Phe Asp Arg Lys

100 105 110

Ile Pro Leu Ile Lys Glu Lys Glu Leu Ile Ile Val Pro Thr Thr Cys

115 120 125

Gly Thr Gly Ser Glu Val Thr Asn Ile Ser Ile Ala Glu Ile Lys Ser

130 135 140

Arg His Thr Lys Met Gly Leu Ala Asp Asp Ala Ile Val Ala Asp His

145 150 155 160

Ala Ile Ile Ile Pro Glu Leu Leu Lys Ser Leu Pro Phe His Phe Tyr

165 170 175

Ala Cys Ser Ala Ile Asp Ala Leu Ile His Ala Ile Glu Ser Tyr Val

180 185 190

Ser Pro Lys Ala Ser Pro Tyr Ser Arg Leu Phe Ser Glu Ala Ala Trp

195 200 205

Asp Ile Ile Leu Glu Val Phe Lys Lys Ile Ala Glu His Gly Pro Glu

210 215 220

Tyr Arg Phe Glu Lys Leu Gly Glu Met Ile Met Ala Ser Asn Tyr Ala

225 230 235 240

Gly Ile Ala Phe Gly Asn Ala Gly Val Gly Ala Val His Ala Leu Ser

245 250 255

Tyr Pro Leu Gly Gly Asn Tyr His Val Pro His Gly Glu Ala Asn Tyr

260 265 270

Gln Phe Phe Thr Glu Val Phe Lys Val Tyr Gln Lys Lys Asn Pro Phe

275 280 285

Gly Tyr Ile Val Glu Leu Asn Trp Lys Leu Ser Lys Ile Leu Asn Cys

290 295 300

Gln Pro Glu Tyr Val Tyr Pro Lys Leu Asp Glu Leu Leu Gly Cys Leu

305 310 315 320

Leu Thr Lys Lys Pro Leu His Glu Tyr Gly Met Lys Asp Glu Glu Val

325 330 335

Arg Gly Phe Ala Glu Ser Val Leu Lys Thr Gln Gln Arg Leu Leu Ala

340 345 350

Asn Asn Tyr Val Glu Leu Thr Val Asp Glu Ile Glu Gly Ile Tyr Arg

355 360 365

Arg Leu Tyr

370

<210> 54

<211> 1296

<212> DNA

<213> 牙龈卟啉单胞菌

<400> 54

atgaaagacg tattagcgga atatgcctcc cgaattgttt cggccgaaga agccgtaaaa 60

catatcaaaa atggagaacg ggtagctttg tcacatgctg ccggagttcc tcagagttgt 120

gttgatgcac tggtacaaca ggccgacctt ttccagaatg tcgaaattta tcacatgctt 180

tgtctcggcg aaggaaaata tatggcacct gaaatggccc ctcacttccg acacataacc 240

aattttgtag gtggtaattc tcgtaaagca gttgaggaaa atagagccga cttcattccg 300

gtattctttt atgaagtgcc atcaatgatt cgcaaagaca tccttcacat agatgtcgcc 360

atcgttcagc tttcaatgcc tgatgagaat ggttactgta gttttggagt atcttgcgat 420

tatagcaaac cggcagcaga aagcgctcat ttagttatag gggaaatcaa ccgtcaaatg 480

ccatatgtac atggcgacaa cttgattcac atatcgaagt tggattacat cgtgatggca 540

gactacccta tctattctct tgcaaagccc aaaatcggag aagtagaaga agctatcggg 600

cgtaattgtg ccgagcttat tgaagatggt gccacactcc aactcggtat cggcgcgatt 660

cctgatgcag ccctgttatt cctcaaggac aaaaaagatc tggggatcca taccgagatg 720

ttctccgatg gtgttgtcga attagttcgc agtggagtaa ttacaggaaa gaaaaagaca 780

cttcaccccg gaaagatggt cgcaaccttc ttaatgggaa gcgaagacgt atatcatttc 840

atcgacaaaa atcccgatgt agaactttat ccggtagatt acgtcaatga tccgcgagta 900

atcgctcaaa atgataatat ggtcagcatc aatagctgta tcgaaatcga tcttatggga 960

caagtcgtgt ccgaatgtat aggaagcaag caattcagcg gaaccggcgg tcaagtagat 1020

tatgttcgtg gagcagcatg gtctaaaaac ggcaaaagca tcatggcaat tccctcaaca 1080

gccaaaaacg gtactgcatc tcgaattgta cctataattg cagagggagc tgctgtaaca 1140

accctccgca acgaagtcga ttacgttgta accgaatacg gtatagcaca actcaaagga 1200

aagagtttgc gccagcgagc agaagctctt attgccatag cccacccgga tttcagagag 1260

gaactaacga aacatctccg caaacgtttc ggataa 1296

<210> 55

<211> 431

<212> PRT

<213> 牙龈卟啉单胞菌

<400> 55

Met Lys Asp Val Leu Ala Glu Tyr Ala Ser Arg Ile Val Ser Ala Glu

1 5 10 15

Glu Ala Val Lys His Ile Lys Asn Gly Glu Arg Val Ala Leu Ser His

20 25 30

Ala Ala Gly Val Pro Gln Ser Cys Val Asp Ala Leu Val Gln Gln Ala

35 40 45

Asp Leu Phe Gln Asn Val Glu Ile Tyr His Met Leu Cys Leu Gly Glu

50 55 60

Gly Lys Tyr Met Ala Pro Glu Met Ala Pro His Phe Arg His Ile Thr

65 70 75 80

Asn Phe Val Gly Gly Asn Ser Arg Lys Ala Val Glu Glu Asn Arg Ala

85 90 95

Asp Phe Ile Pro Val Phe Phe Tyr Glu Val Pro Ser Met Ile Arg Lys

100 105 110

Asp Ile Leu His Ile Asp Val Ala Ile Val Gln Leu Ser Met Pro Asp

115 120 125

Glu Asn Gly Tyr Cys Ser Phe Gly Val Ser Cys Asp Tyr Ser Lys Pro

130 135 140

Ala Ala Glu Ser Ala His Leu Val Ile Gly Glu Ile Asn Arg Gln Met

145 150 155 160

Pro Tyr Val His Gly Asp Asn Leu Ile His Ile Ser Lys Leu Asp Tyr

165 170 175

Ile Val Met Ala Asp Tyr Pro Ile Tyr Ser Leu Ala Lys Pro Lys Ile

180 185 190

Gly Glu Val Glu Glu Ala Ile Gly Arg Asn Cys Ala Glu Leu Ile Glu

195 200 205

Asp Gly Ala Thr Leu Gln Leu Gly Ile Gly Ala Ile Pro Asp Ala Ala

210 215 220

Leu Leu Phe Leu Lys Asp Lys Lys Asp Leu Gly Ile His Thr Glu Met

225 230 235 240

Phe Ser Asp Gly Val Val Glu Leu Val Arg Ser Gly Val Ile Thr Gly

245 250 255

Lys Lys Lys Thr Leu His Pro Gly Lys Met Val Ala Thr Phe Leu Met

260 265 270

Gly Ser Glu Asp Val Tyr His Phe Ile Asp Lys Asn Pro Asp Val Glu

275 280 285

Leu Tyr Pro Val Asp Tyr Val Asn Asp Pro Arg Val Ile Ala Gln Asn

290 295 300

Asp Asn Met Val Ser Ile Asn Ser Cys Ile Glu Ile Asp Leu Met Gly

305 310 315 320

Gln Val Val Ser Glu Cys Ile Gly Ser Lys Gln Phe Ser Gly Thr Gly

325 330 335

Gly Gln Val Asp Tyr Val Arg Gly Ala Ala Trp Ser Lys Asn Gly Lys

340 345 350

Ser Ile Met Ala Ile Pro Ser Thr Ala Lys Asn Gly Thr Ala Ser Arg

355 360 365

Ile Val Pro Ile Ile Ala Glu Gly Ala Ala Val Thr Thr Leu Arg Asn

370 375 380

Glu Val Asp Tyr Val Val Thr Glu Tyr Gly Ile Ala Gln Leu Lys Gly

385 390 395 400

Lys Ser Leu Arg Gln Arg Ala Glu Ala Leu Ile Ala Ile Ala His Pro

405 410 415

Asp Phe Arg Glu Glu Leu Thr Lys His Leu Arg Lys Arg Phe Gly

420 425 430

<210> 56

<211> 906

<212> DNA

<213> 丙酮丁醇梭菌

<400> 56

atgattaaga gttttaatga aattatcatg aaggtaaaga gcaaagaaat gaaaaaagtt 60

gctgttgctg tagcacaaga cgagccagta cttgaagcag taagagatgc taagaaaaat 120

ggtattgcag atgctattct tgttggagac catgacgaaa tcgtgtcaat cgcgcttaaa 180

ataggaatgg atgtaaatga ttttgaaata gtaaacgagc ctaacgttaa gaaagctgct 240

ttaaaggcag tagagcttgt atcaactgga aaagctgata tggtaatgaa gggacttgta 300

aatacagcaa ctttcttaag atctgtatta aacaaagaag ttggacttag aacaggaaaa 360

actatgtctc acgttgcagt atttgaaact gagaaatttg atagactatt atttttaaca 420

gatgttgctt tcaatactta tcctgaatta aaggaaaaaa ttgatatagt aaacaattca 480

gttaaggttg cacatgcaat aggaattgaa aatccaaagg ttgctccaat ttgtgcagtt 540

gaggttataa accctaaaat gccatcaaca cttgatgcag caatgctttc aaaaatgagt 600

gacagaggac aaattaaagg ttgtgtagtt gacggacctt tagcacttga tatagcttta 660

tcagaagaag cagcacatca taagggagta acaggagaag ttgctggaaa agctgatatc 720

ttcttaatgc caaacataga aacaggaaat gtaatgtata agactttaac atatacaact 780

gattcaaaaa atggaggaat cttagttgga acttctgcac cagttgtttt aacttcaaga 840

gctgacagcc atgaaacaaa aatgaactct atagcacttg cagctttagt tgcaggcaat 900

aaataa 906

<210> 57

<211> 301

<212> PRT

<213> 丙酮丁醇梭菌

<400> 57

Met Ile Lys Ser Phe Asn Glu Ile Ile Met Lys Val Lys Ser Lys Glu

1 5 10 15

Met Lys Lys Val Ala Val Ala Val Ala Gln Asp Glu Pro Val Leu Glu

20 25 30

Ala Val Arg Asp Ala Lys Lys Asn Gly Ile Ala Asp Ala Ile Leu Val

35 40 45

Gly Asp His Asp Glu Ile Val Ser Ile Ala Leu Lys Ile Gly Met Asp

50 55 60

Val Asn Asp Phe Glu Ile Val Asn Glu Pro Asn Val Lys Lys Ala Ala

65 70 75 80

Leu Lys Ala Val Glu Leu Val Ser Thr Gly Lys Ala Asp Met Val Met

85 90 95

Lys Gly Leu Val Asn Thr Ala Thr Phe Leu Arg Ser Val Leu Asn Lys

100 105 110

Glu Val Gly Leu Arg Thr Gly Lys Thr Met Ser His Val Ala Val Phe

115 120 125

Glu Thr Glu Lys Phe Asp Arg Leu Leu Phe Leu Thr Asp Val Ala Phe

130 135 140

Asn Thr Tyr Pro Glu Leu Lys Glu Lys Ile Asp Ile Val Asn Asn Ser

145 150 155 160

Val Lys Val Ala His Ala Ile Gly Ile Glu Asn Pro Lys Val Ala Pro

165 170 175

Ile Cys Ala Val Glu Val Ile Asn Pro Lys Met Pro Ser Thr Leu Asp

180 185 190

Ala Ala Met Leu Ser Lys Met Ser Asp Arg Gly Gln Ile Lys Gly Cys

195 200 205

Val Val Asp Gly Pro Leu Ala Leu Asp Ile Ala Leu Ser Glu Glu Ala

210 215 220

Ala His His Lys Gly Val Thr Gly Glu Val Ala Gly Lys Ala Asp Ile

225 230 235 240

Phe Leu Met Pro Asn Ile Glu Thr Gly Asn Val Met Tyr Lys Thr Leu

245 250 255

Thr Tyr Thr Thr Asp Ser Lys Asn Gly Gly Ile Leu Val Gly Thr Ser

260 265 270

Ala Pro Val Val Leu Thr Ser Arg Ala Asp Ser His Glu Thr Lys Met

275 280 285

Asn Ser Ile Ala Leu Ala Ala Leu Val Ala Gly Asn Lys

290 295 300

<210> 58

<211> 1068

<212> DNA

<213> 丙酮丁醇梭菌

<400> 58

atgtatagat tactaataat caatcctggc tcgacctcaa ctaaaattgg tatttatgac 60

gatgaaaaag agatatttga gaagacttta agacattcag ctgaagagat agaaaaatat 120

aacactatat ttgatcaatt tcaattcaga aagaatgtaa ttttagatgc gttaaaagaa 180

gcaaacatag aagtaagttc tttaaatgct gtagttggaa gaggcggact cttaaagcca 240

atagtaagtg gaacttatgc agtaaatcaa aaaatgcttg aagaccttaa agtaggagtt 300

caaggtcagc atgcgtcaaa tcttggtgga attattgcaa atgaaatagc aaaagaaata 360

aatgttccag catacatagt tgatccagtt gttgtggatg agcttgatga agtttcaaga 420

atatcaggaa tggctgacat tccaagaaaa agtatattcc atgcattaaa tcaaaaagca 480

gttgctagaa gatatgcaaa agaagttgga aaaaaatacg aagatcttaa tttaatcgta 540

gtccacatgg gtggaggtac ttcagtaggt actcataaag atggtagagt aatagaagtt 600

aataatacac ttgatggaga aggtccattc tcaccagaaa gaagtggtgg agttccaata 660

ggagatcttg taagattgtg cttcagcaac aaatatactt atgaagaagt aatgaaaaag 720

ataaacggca aaggcggagt tgttagttac ttaaatacta tcgattttaa ggctgtagtt 780

gataaagctc ttgaaggaga taagaaatgt gcacttatat atgaagcttt cacattccag 840

gtagcaaaag agataggaaa atgttcaacc gttttaaaag gaaatgtaga tgcaataatc 900

ttaacaggcg gaattgcgta caacgagcat gtatgtaatg ccatagagga tagagtaaaa 960

ttcatagcac ctgtagttag atatggtgga gaagatgaac ttcttgcact tgcagaaggt 1020

ggacttagag ttttaagagg agaagaaaaa gctaaggaat acaaataa 1068

<210> 59

<211> 355

<212> PRT

<213> 丙酮丁醇梭菌

<400> 59

Met Tyr Arg Leu Leu Ile Ile Asn Pro Gly Ser Thr Ser Thr Lys Ile

1 5 10 15

Gly Ile Tyr Asp Asp Glu Lys Glu Ile Phe Glu Lys Thr Leu Arg His

20 25 30

Ser Ala Glu Glu Ile Glu Lys Tyr Asn Thr Ile Phe Asp Gln Phe Gln

35 40 45

Phe Arg Lys Asn Val Ile Leu Asp Ala Leu Lys Glu Ala Asn Ile Glu

50 55 60

Val Ser Ser Leu Asn Ala Val Val Gly Arg Gly Gly Leu Leu Lys Pro

65 70 75 80

Ile Val Ser Gly Thr Tyr Ala Val Asn Gln Lys Met Leu Glu Asp Leu

85 90 95

Lys Val Gly Val Gln Gly Gln His Ala Ser Asn Leu Gly Gly Ile Ile

100 105 110

Ala Asn Glu Ile Ala Lys Glu Ile Asn Val Pro Ala Tyr Ile Val Asp

115 120 125

Pro Val Val Val Asp Glu Leu Asp Glu Val Ser Arg Ile Ser Gly Met

130 135 140

Ala Asp Ile Pro Arg Lys Ser Ile Phe His Ala Leu Asn Gln Lys Ala

145 150 155 160

Val Ala Arg Arg Tyr Ala Lys Glu Val Gly Lys Lys Tyr Glu Asp Leu

165 170 175

Asn Leu Ile Val Val His Met Gly Gly Gly Thr Ser Val Gly Thr His

180 185 190

Lys Asp Gly Arg Val Ile Glu Val Asn Asn Thr Leu Asp Gly Glu Gly

195 200 205

Pro Phe Ser Pro Glu Arg Ser Gly Gly Val Pro Ile Gly Asp Leu Val

210 215 220

Arg Leu Cys Phe Ser Asn Lys Tyr Thr Tyr Glu Glu Val Met Lys Lys

225 230 235 240

Ile Asn Gly Lys Gly Gly Val Val Ser Tyr Leu Asn Thr Ile Asp Phe

245 250 255

Lys Ala Val Val Asp Lys Ala Leu Glu Gly Asp Lys Lys Cys Ala Leu

260 265 270

Ile Tyr Glu Ala Phe Thr Phe Gln Val Ala Lys Glu Ile Gly Lys Cys

275 280 285

Ser Thr Val Leu Lys Gly Asn Val Asp Ala Ile Ile Leu Thr Gly Gly

290 295 300

Ile Ala Tyr Asn Glu His Val Cys Asn Ala Ile Glu Asp Arg Val Lys

305 310 315 320

Phe Ile Ala Pro Val Val Arg Tyr Gly Gly Glu Asp Glu Leu Leu Ala

325 330 335

Leu Ala Glu Gly Gly Leu Arg Val Leu Arg Gly Glu Glu Lys Ala Lys

340 345 350

Glu Tyr Lys

355

<210> 60

<211> 906

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成多核苷酸

<400> 60

atgattaaga gttttaatga aattatcatg aaggtaaaga gcaaagaaat gaaaaaagtt 60

gctgttgctg tagcacaaga cgagccagta cttgaagcag tacgcgatgc taagaaaaat 120

ggtattgcag atgctattct tgttggcgac catgacgaaa tcgtgtcaat cgcgcttaaa 180

ataggcatgg atgtaaatga ttttgaaata gtaaacgagc ctaacgttaa gaaagctgct 240

ttaaaggcag tagagctggt atcaactgga aaagctgata tggtaatgaa gggacttgta 300

aatacagcaa ctttcttacg ctctgtatta aacaaagaag ttggactgag aacaggaaaa 360

actatgtctc acgttgcagt atttgaaact gagaaatttg atcgtctgtt atttttaaca 420

gatgttgctt tcaatactta tcctgaatta aaggaaaaaa ttgatatcgt aaacaattca 480

gttaaggttg cacatgcaat aggtattgaa aatccaaagg ttgctccaat ttgtgcagtt 540

gaggttataa accctaaaat gccatcaaca cttgatgcag caatgctttc aaaaatgagt 600

gacagaggac aaattaaagg ttgtgtagtt gacggaccgt tagcacttga tatcgcttta 660

tcagaagaag cagcacatca taagggcgta acaggagaag ttgctggaaa agctgatatc 720

ttcttaatgc caaacattga aacaggaaat gtaatgtata agactttaac atatacaact 780

gatagcaaaa atggcggaat cttagttgga acttctgcac cagttgtttt aacttcacgc 840

gctgacagcc atgaaacaaa aatgaactct attgcacttg cagctttagt tgcaggcaat 900

aaataa 906

<210> 61

<211> 906

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成多核苷酸

<400> 61

atgattaaga gttttaatga aattatcatg aaggtaaaga gcaaagaaat gaaaaaagtt 60

gctgttgctg tagcacaaga cgagccagta cttgaagcag tacgcgatgc taagaaaaat 120

ggtattgccg atgctattct ggttggcgac catgacgaaa tcgtgtctat cgcgctgaaa 180

ataggcatgg atgtaaatga ttttgaaatt gttaacgagc ctaacgttaa gaaagctgcg 240

ttaaaggcag tagagctggt atcaactgga aaagctgata tggtaatgaa gggactggta 300

aataccgcaa ctttcttacg ctctgtatta aacaaagaag ttggtctgcg tacaggaaaa 360

accatgtctc acgttgcagt atttgaaact gagaaatttg atcgtctgtt atttttaaca 420

gatgttgctt tcaatactta tcctgaatta aaggaaaaaa ttgatatcgt taacaatagc 480

gttaaggttg cacatgccat tggtattgaa aatccaaagg ttgctccaat ttgtgcagtt 540

gaggttatta acccgaaaat gccatcaaca cttgatgcag caatgctttc aaaaatgagt 600

gaccgcggac aaattaaagg ttgtgtagtt gacggaccgc tggcacttga tatcgcttta 660

tcagaagaag cagcacatca taaaggcgta acaggagaag ttgctggaaa agctgatatc 720

ttcttaatgc caaacattga aacaggaaat gtaatgtata agacgttaac ctataccact 780

gatagcaaaa atggcggcat cctggttgga acttctgcac cagttgtttt aacttcacgc 840

gctgacagcc atgaaacaaa aatgaactct attgcactgg cagcgctggt tgcaggcaat 900

aaataa 906

<210> 62

<211> 906

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成多核苷酸

<400> 62

atgattaaga gttttaatga aattatcatg aaggtaaaga gcaaagaaat gaaaaaagtt 60

gctgttgctg ttgcacaaga cgagccggta ctggaagcgg tacgcgatgc taagaaaaat 120

ggtattgccg atgctattct ggttggcgac catgacgaaa tcgtctctat cgcgctgaaa 180

attggcatgg atgttaatga ttttgaaatt gttaacgagc ctaacgttaa gaaagctgcg 240

ctgaaggcgg tagagctggt ttccaccgga aaagctgata tggtaatgaa agggctggtg 300

aataccgcaa ctttcttacg cagcgtactg aacaaagaag ttggtctgcg taccggaaaa 360

accatgagtc acgttgcggt atttgaaact gagaaatttg atcgtctgct gtttctgacc 420

gatgttgctt tcaatactta tcctgaatta aaagaaaaaa ttgatatcgt taacaatagc 480

gttaaggttg cgcatgccat tggtattgaa aatccaaagg ttgctccaat ttgtgcagtt 540

gaggttatta acccgaaaat gccatcaaca cttgatgccg caatgcttag caaaatgagt 600

gaccgcggac aaattaaagg ttgtgtggtt gacggcccgc tggcactgga tatcgcgtta 660

agcgaagaag cggcacatca taaaggcgta accggcgaag ttgctggaaa agctgatatc 720

ttcctgatgc caaacattga aacaggcaat gtaatgtata aaacgttaac ctataccact 780

gatagcaaaa atggcggcat cctggttgga acttctgcac cagttgtttt aacctcacgc 840

gctgacagcc atgaaaccaa aatgaacagc attgcactgg cagcgctggt tgcaggcaat 900

aaataa 906

<210> 63

<211> 906

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成多核苷酸

<400> 63

atgattaaaa gttttaacga aattatcatg aaagtgaaaa gcaaagagat gaaaaaagtg 60

gcggttgcgg ttgcgcagga tgaaccggtg ctggaagcgg tgcgcgatgc caaaaaaaac 120

ggtattgccg atgccattct ggtgggcgat cacgatgaaa ttgtctctat tgcgctgaaa 180

attggcatgg atgttaacga ttttgaaatt gttaatgaac cgaacgtgaa aaaagcggcg 240

ctgaaagcgg ttgaactggt ttccaccggt aaagccgata tggtgatgaa agggctggtg 300

aataccgcaa ccttcctgcg cagcgtgctg aataaagaag tgggtctgcg taccggtaaa 360

accatgagtc atgttgcggt gtttgaaacc gaaaaatttg accgtctgct gtttctgacc 420

gatgttgcgt ttaataccta tccggaactg aaagagaaaa ttgatatcgt taataacagc 480

gtgaaagtgg cgcatgccat tggtattgaa aacccgaaag tggcgccgat ttgcgcggtt 540

gaagtgatta acccgaaaat gccgtcaacg ctggatgccg cgatgctcag caaaatgagc 600

gatcgcggtc aaatcaaagg ctgtgtggtt gatggcccgc tggcgctgga tatcgcgctt 660

agcgaagaag cggcgcatca taaaggcgtg accggcgaag tggccggtaa agccgatatt 720

ttcctgatgc cgaatattga aaccggcaac gtgatgtata aaacgctgac ctataccacc 780

gacagcaaaa acggcggcat tctggtgggt accagcgcgc cggtggtgct gacctcgcgc 840

gccgacagcc atgaaaccaa aatgaacagc attgcgctgg cggcgctggt ggccggtaat 900

aaataa 906

<210> 64

<211> 1068

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成多核苷酸

<400> 64

atgtatcgtt tactgattat caatcctggc tcgacctcaa ctaaaattgg tatttatgac 60

gatgaaaaag agatatttga gaagacttta cgtcattcag ctgaagagat agaaaaatat 120

aacactatat ttgatcaatt tcagttcaga aagaatgtaa ttctcgatgc gttaaaagaa 180

gcaaacattg aagtaagttc tttaaatgct gtagttggac gcggcggact gttaaagcca 240

atagtaagtg gaacttatgc agtaaatcaa aaaatgcttg aagaccttaa agtaggcgtt 300

caaggtcagc atgcgtcaaa tcttggtgga attattgcaa atgaaatagc aaaagaaata 360

aatgttccag catacatcgt tgatccagtt gttgtggatg agcttgatga agtttcacgt 420

atatcaggaa tggctgacat tccacgtaaa agtatattcc atgcattaaa tcaaaaagca 480

gttgctagac gctatgcaaa agaagttgga aaaaaatacg aagatcttaa tttaatcgtg 540

gtccacatgg gtggcggtac ttcagtaggt actcataaag atggtagagt aattgaagtt 600

aataatacac ttgatggaga aggtccattc tcaccagaaa gaagtggtgg cgttccaata 660

ggcgatcttg tacgtttgtg cttcagcaac aaatatactt atgaagaagt aatgaaaaag 720

ataaacggca aaggcggcgt tgttagttac ttaaatacta tcgattttaa ggctgtagtt 780

gataaagctc ttgaaggcga taagaaatgt gcacttatat atgaagcttt cacattccag 840

gtagcaaaag agataggaaa atgttcaacc gttttaaaag gaaatgtaga tgcaataatc 900

ttaacaggcg gaattgcgta caacgagcat gtatgtaatg ccatagagga tagagtaaaa 960

ttcattgcac ctgtagttcg ttatggtgga gaagatgaac ttcttgcact tgcagaaggt 1020

ggactgcgcg ttttacgcgg agaagaaaaa gctaaggaat acaaataa 1068

<210> 65

<211> 1068

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成多核苷酸

<400> 65

atgtatcgtt tactgattat caatcctggc tcgacctcaa ctaaaattgg tatttatgac 60

gatgaaaaag agatatttga gaagacgtta cgtcattcag ctgaagagat tgaaaaatat 120

aacactatat ttgatcaatt tcagttccgc aagaatgtga ttctcgatgc gttaaaagaa 180

gcaaacattg aagtcagttc tttaaatgct gtagttggac gcggcggact gttaaagcca 240

attgtcagtg gaacttatgc agtaaatcaa aaaatgcttg aagaccttaa agtgggcgtt 300

caaggtcagc atgccagcaa tcttggtggc attattgcca atgaaatcgc aaaagaaatc 360

aatgttccag catacatcgt tgatccggtt gttgtggatg agcttgatga agttagccgt 420

ataagcggaa tggctgacat tccacgtaaa agtatattcc atgcattaaa tcaaaaagca 480

gttgctcgtc gctatgcaaa agaagttggt aaaaaatacg aagatcttaa tttaatcgtg 540

gtccacatgg gtggcggtac ttcagtaggt actcataaag atggtcgcgt gattgaagtt 600

aataatacac ttgatggcga aggtccattc tcaccagaac gtagtggtgg cgttccaatt 660

ggcgatctgg tacgtttgtg cttcagcaac aaatatactt atgaagaagt gatgaaaaag 720

ataaacggca aaggcggcgt tgttagttac ctgaatacta tcgattttaa ggctgtagtt 780

gataaagcgc ttgaaggcga taagaaatgt gcactgattt atgaagcttt caccttccag 840

gtagcaaaag agattggtaa atgttcaacc gttttaaaag gaaatgttga tgccattatc 900

ttaacaggcg gcattgctta caacgagcat gtatgtaatg ccattgagga tcgcgtaaaa 960

ttcattgcac ctgtagttcg ttatggtggc gaagatgaac tgctggcact ggcagaaggt 1020

ggactgcgcg ttttacgcgg cgaagaaaaa gcgaaggaat acaaataa 1068

<210> 66

<211> 1068

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成多核苷酸

<400> 66

atgtatcgtc tgctgattat caatcctggc tcgacctcaa ctaaaattgg tatttatgac 60

gatgaaaaag agatatttga gaaaacgtta cgtcatagcg ctgaagagat tgaaaaatat 120

aacactattt ttgatcaatt tcagttccgc aagaatgtga ttctcgatgc gctgaaagaa 180

gcaaacattg aagtcagttc gctgaatgcg gtagttggtc gcggcggtct gctgaagcca 240

attgtcagcg gcacttatgc ggtaaatcaa aaaatgctgg aagacctgaa agtgggcgtt 300

caggggcagc atgccagcaa tcttggtggc attattgcca atgaaatcgc caaagaaatc 360

aatgttccgg catacatcgt tgatccggtt gttgtggatg agctggatga agttagccgt 420

atcagcggaa tggctgacat tccacgtaaa agtattttcc atgcactgaa tcaaaaagcg 480

gttgcgcgtc gctatgcaaa agaagttggt aaaaaatacg aagatcttaa tctgatcgtg 540

gtgcatatgg gtggcggtac tagcgtcggt actcataaag atggtcgcgt gattgaagtt 600

aataatacac ttgatggcga aggtccattc tcaccagaac gtagcggtgg cgttccaatt 660

ggcgatctgg tacgtttgtg cttcagcaac aaatatacct atgaagaagt gatgaaaaag 720

ataaacggca aaggcggcgt tgttagttac ctgaatacta tcgattttaa ggcggtagtt 780

gataaagcgc tggaaggcga taagaaatgt gcactgattt atgaagcgtt caccttccag 840

gtggcaaaag agattggtaa atgttcaacc gttctgaaag gcaatgttga tgccattatc 900

ctgaccggcg gcattgctta caacgagcat gtttgtaatg ccattgagga tcgcgtaaaa 960

ttcattgcac ctgtggttcg ttatggtggc gaagatgaac tgctggcact ggcagaaggt 1020

ggtctgcgcg ttttacgcgg cgaagaaaaa gcgaaagaat acaaataa 1068

<210> 67

<211> 1068

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成多核苷酸

<400> 67

atgtatcgtc tgctgattat caacccgggc agcacctcaa ccaaaattgg tatttacgac 60

gatgaaaaag agatttttga aaaaacgctg cgtcacagcg cagaagagat tgaaaaatac 120

aacaccattt tcgatcagtt ccagttccgc aaaaacgtga ttctcgatgc gctgaaagaa 180

gccaatattg aagtctcctc gctgaatgcg gtggtcggtc gcggcggtct gctgaaaccg 240

attgtcagcg gcacttatgc ggttaatcag aaaatgctgg aagatctgaa agtgggcgtg 300

caggggcagc atgccagcaa tctcggcggc attatcgcca atgaaatcgc caaagagatc 360

aacgtgccgg cttatatcgt cgatccggtg gtggttgatg aactggatga agtcagccgt 420

atcagcggca tggcggatat tccgcgtaaa agcattttcc atgcgctgaa tcagaaagcg 480

gttgcgcgtc gctatgccaa agaagtgggt aaaaaatatg aagatctcaa tctgattgtg 540

gtgcatatgg gcggcggcac cagcgtcggt acgcataaag atggtcgcgt gattgaagtg 600

aataacacgc tggatggcga agggccgttc tcgccggaac gtagcggcgg cgtgccgatt 660

ggcgatctgg tgcgtctgtg tttcagcaat aaatacacct acgaagaagt gatgaaaaaa 720

atcaacggca aaggcggcgt ggttagctat ctgaatacca tcgattttaa agcggtggtt 780

gataaagcgc tggaaggcga taaaaaatgc gcgctgattt atgaagcgtt taccttccag 840

gtggcgaaag agattggtaa atgttcaacc gtgctgaaag gcaacgttga tgccattatt 900

ctgaccggcg gcattgctta taacgaacat gtttgtaatg ccattgaaga tcgcgtgaaa 960

tttattgcgc cggtggtgcg ttacggcggc gaagatgaac tgctggcgct ggcggaaggc 1020

ggtctgcgcg tgctgcgcgg cgaagaaaaa gcgaaagagt acaaataa 1068

<210> 68

<211> 1407

<212> DNA

<213> 拜氏梭菌

<400> 68

atgaataaag acacactaat acctacaact aaagatttaa aagtaaaaac aaatggtgaa 60

aacattaatt taaagaacta caaggataat tcttcatgtt tcggagtatt cgaaaatgtt 120

gaaaatgcta taagcagcgc tgtacacgca caaaagatat tatcccttca ttatacaaaa 180

gagcaaagag aaaaaatcat aactgagata agaaaggccg cattacaaaa taaagaggtc 240

ttggctacaa tgattctaga agaaacacat atgggaagat atgaggataa aatattaaaa 300

catgaattgg tagctaaata tactcctggt acagaagatt taactactac tgcttggtca 360

ggtgataatg gtcttacagt tgtagaaatg tctccatatg gtgttatagg tgcaataact 420

ccttctacga atccaactga aactgtaata tgtaatagca taggcatgat agctgctgga 480

aatgctgtag tatttaacgg acacccatgc gctaaaaaat gtgttgcctt tgctgttgaa 540

atgataaata aggcaattat ttcatgtggc ggtcctgaaa atctagtaac aactataaaa 600

aatccaacta tggagtctct agatgcaatt attaagcatc cttcaataaa acttctttgc 660

ggaactgggg gtccaggaat ggtaaaaacc ctcttaaatt ctggtaagaa agctataggt 720

gctggtgctg gaaatccacc agttattgta gatgatactg ctgatataga aaaggctggt 780

aggagcatca ttgaaggctg ttcttttgat aataatttac cttgtattgc agaaaaagaa 840

gtatttgttt ttgagaatgt tgcagatgat ttaatatcta acatgctaaa aaataatgct 900

gtaattataa atgaagatca agtatcaaaa ttaatagatt tagtattaca aaaaaataat 960

gaaactcaag aatactttat aaacaaaaaa tgggtaggaa aagatgcaaa attattctta 1020

gatgaaatag atgttgagtc tccttcaaat gttaaatgca taatctgcga agtaaatgca 1080

aatcatccat ttgttatgac agaactcatg atgccaatat tgccaattgt aagagttaaa 1140

gatatagatg aagctattaa atatgcaaag atagcagaac aaaatagaaa acatagtgcc 1200

tatatttatt ctaaaaatat agacaaccta aatagatttg aaagagaaat agatactact 1260

atttttgtaa agaatgctaa atcttttgct ggtgttggtt atgaagcaga aggatttaca 1320

actttcacta ttgctggatc tactggtgag ggaataacct ctgcaaggaa ttttacaaga 1380

caaagaagat gtgtacttgc cggctaa 1407

<210> 69

<211> 468

<212> PRT

<213> 拜氏梭菌

<400> 69

Met Asn Lys Asp Thr Leu Ile Pro Thr Thr Lys Asp Leu Lys Val Lys

1 5 10 15

Thr Asn Gly Glu Asn Ile Asn Leu Lys Asn Tyr Lys Asp Asn Ser Ser

20 25 30

Cys Phe Gly Val Phe Glu Asn Val Glu Asn Ala Ile Ser Ser Ala Val

35 40 45

His Ala Gln Lys Ile Leu Ser Leu His Tyr Thr Lys Glu Gln Arg Glu

50 55 60

Lys Ile Ile Thr Glu Ile Arg Lys Ala Ala Leu Gln Asn Lys Glu Val

65 70 75 80

Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu Asp

85 90 95

Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu

100 105 110

Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val

115 120 125

Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn

130 135 140

Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly

145 150 155 160

Asn Ala Val Val Phe Asn Gly His Pro Cys Ala Lys Lys Cys Val Ala

165 170 175

Phe Ala Val Glu Met Ile Asn Lys Ala Ile Ile Ser Cys Gly Gly Pro

180 185 190

Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Met Glu Ser Leu Asp

195 200 205

Ala Ile Ile Lys His Pro Ser Ile Lys Leu Leu Cys Gly Thr Gly Gly

210 215 220

Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly

225 230 235 240

Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile

245 250 255

Glu Lys Ala Gly Arg Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn

260 265 270

Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala

275 280 285

Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn

290 295 300

Glu Asp Gln Val Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn

305 310 315 320

Glu Thr Gln Glu Tyr Phe Ile Asn Lys Lys Trp Val Gly Lys Asp Ala

325 330 335

Lys Leu Phe Leu Asp Glu Ile Asp Val Glu Ser Pro Ser Asn Val Lys

340 345 350

Cys Ile Ile Cys Glu Val Asn Ala Asn His Pro Phe Val Met Thr Glu

355 360 365

Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu

370 375 380

Ala Ile Lys Tyr Ala Lys Ile Ala Glu Gln Asn Arg Lys His Ser Ala

385 390 395 400

Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu

405 410 415

Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val

420 425 430

Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr

435 440 445

Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys

450 455 460

Val Leu Ala Gly

465

<210> 70

<211> 1407

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成多核苷酸

<400> 70

atgaataaag acacactaat acctacaact aaagatttaa aagtaaaaac aaatggtgaa 60

aacattaatt taaagaacta caaggataat tcttcatgtt tcggcgtatt cgaaaatgtt 120

gaaaatgcta taagcagcgc tgtacacgca caaaagatat tatcccttca ttatacaaaa 180

gagcaacgtg aaaaaatcat aactgagata agaaaggccg cattacaaaa taaagaggtc 240

ttggctacaa tgattctgga agaaacacat atgggacgtt atgaggataa aatattaaaa 300

catgaattgg tagctaaata tactcctggt acagaagatt taactactac tgcctggtca 360

ggtgataatg gtctgacagt tgtagaaatg tctccatatg gtgttattgg tgcaataact 420

ccttctacga atccaactga aactgtaata tgtaatagca taggcatgat tgctgctgga 480

aatgctgtag tatttaacgg acacccatgc gctaaaaaat gtgttgcctt tgctgttgaa 540

atgataaata aggcaattat ttcatgtggc ggtcctgaaa atctggtaac aactataaaa 600

aatccaacca tggagtctct ggatgcaatt attaagcatc cttcaataaa acttctttgc 660

ggaactgggg gtccaggaat ggtaaaaacc ctgttaaatt ctggtaagaa agctataggt 720

gctggtgctg gaaatccacc agttattgtc gatgatactg ctgatataga aaaggctggt 780

cgtagcatca ttgaaggctg ttcttttgat aataatttac cttgtattgc agaaaaagaa 840

gtatttgttt ttgagaatgt tgcagatgat ttaatatcta acatgctaaa aaataatgct 900

gtaattataa atgaagatca agtatcaaaa ttaatcgatt tagtattaca aaaaaataat 960

gaaactcaag aatactttat aaacaaaaaa tgggtaggaa aagatgcaaa attattcctc 1020

gatgaaatag atgttgagtc tccttcaaat gttaaatgca taatctgcga agtaaatgca 1080

aatcatccat ttgttatgac agaactgatg atgccaatat tgccaattgt acgcgttaaa 1140

gatatcgatg aagctattaa atatgcaaag atagcagaac aaaatagaaa acatagtgcc 1200

tatatttatt ctaaaaatat cgacaacctg aatcgctttg aacgtgaaat agatactact 1260

atttttgtaa agaatgctaa atcttttgct ggtgttggtt atgaagcaga aggatttaca 1320

actttcacta ttgctggatc tactggtgag ggaataacct ctgcacgtaa ttttacacgc 1380

caacgtcgct gtgtacttgc cggctaa 1407

<210> 71

<211> 1407

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成多核苷酸

<400> 71

atgaataaag acacactgat ccctacaact aaagatttaa aagtaaaaac aaatggtgaa 60

aacattaatt taaagaacta caaagataat agcagttgtt tcggcgtatt cgaaaatgtt 120

gaaaatgcta tcagcagcgc tgtacacgca caaaagatat tatcgctgca ttatacaaaa 180

gagcaacgtg aaaaaatcat cactgagata cgtaaggccg cattacaaaa taaagaggtg 240

ctggctacaa tgattctgga agaaacacat atgggacgtt atgaggataa aatattaaaa 300

catgaactgg tagctaaata tactcctggt acagaagatt taactactac tgcctggagc 360

ggtgataatg gtctgacagt tgtagaaatg tctccatatg gtgttattgg tgcaataact 420

ccttctacca atccaactga aactgtaatt tgtaatagca ttggcatgat tgctgctgga 480

aatgctgtag tatttaacgg acacccatgc gctaaaaaat gtgttgcctt tgctgttgaa 540

atgatcaata aggcaattat tagctgtggc ggtccggaaa atctggtaac aactataaaa 600

aatccaacca tggagtctct ggatgccatt attaagcatc cttcaataaa actgctttgc 660

ggaactggcg gtccaggaat ggtaaaaacc ctgttaaatt ctggtaagaa agctattggt 720

gctggtgctg gaaatccacc agttattgtc gatgatactg ctgatattga aaaggctggt 780

cgtagcatca ttgaaggctg ttcttttgat aataatttac cttgtattgc agaaaaagaa 840

gtatttgttt ttgagaatgt tgcagatgat ttaatatcta acatgctgaa aaataatgct 900

gtaattatca atgaagatca ggtatcaaaa ttaatcgatt tagtattaca aaaaaataat 960

gaaactcaag aatactttat caacaaaaaa tgggtaggta aagatgcaaa attattcctc 1020

gatgaaatcg atgttgagtc tccttcaaat gttaaatgca ttatctgcga agtgaatgcc 1080

aatcatccat ttgttatgac agaactgatg atgccaatat tgccaattgt gcgcgttaaa 1140

gatatcgatg aagctattaa atatgcaaag attgcagaac aaaatagaaa acatagtgcc 1200

tatatttata gcaaaaatat cgacaacctg aatcgctttg aacgtgaaat cgatactact 1260

atttttgtaa agaatgctaa atcttttgct ggtgttggtt atgaagcaga aggatttacc 1320

actttcacta ttgctggatc tactggtgag ggcataacct ctgcacgtaa ttttacccgc 1380

caacgtcgct gtgtactggc cggctaa 1407

<210> 72

<211> 1407

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成多核苷酸

<400> 72

atgaataaag acacgctgat cccgacaact aaagatctga aagtaaaaac caatggtgaa 60

aacattaatc tgaagaacta caaagataat agcagttgtt tcggcgtatt cgaaaatgtt 120

gaaaatgcta tcagcagcgc ggtacacgca caaaagatac tctcgctgca ttataccaaa 180

gagcaacgtg aaaaaatcat cactgagatc cgtaaggccg cattacaaaa taaagaggtg 240

ctggcaacaa tgattctgga agaaacacat atgggacgtt atgaggataa aatactgaaa 300

catgaactgg tggcgaaata tacgcctggt actgaagatt taaccaccac tgcctggagc 360

ggtgataatg gtctgaccgt tgtggaaatg tcgccttatg gtgttattgg tgcaattacg 420

ccttcaacca atccaactga aacggtaatt tgtaatagca ttggcatgat tgctgctgga 480

aatgcggtag tatttaacgg tcacccctgc gctaaaaaat gtgttgcctt tgctgttgaa 540

atgatcaata aagcgattat tagctgtggc ggtccggaaa atctggtaac cactataaaa 600

aatccaacca tggagtcgct ggatgccatt attaagcatc cttcaatcaa actgctgtgc 660

ggcactggcg gtccaggaat ggtgaaaacc ctgctgaata gcggtaagaa agcgattggt 720

gctggtgctg gaaatccacc agttattgtc gatgatactg ctgatattga aaaagcgggt 780

cgtagcatca ttgaaggctg ttcttttgat aataatttac cttgtattgc agaaaaagaa 840

gtatttgttt ttgagaatgt tgccgatgat ctgatctcta acatgctgaa aaataatgcg 900

gtgattatca atgaagatca ggttagcaaa ctgatcgatc tggtattaca aaaaaataat 960

gaaactcaag aatactttat caacaaaaaa tgggtaggta aagatgcaaa actgttcctc 1020

gatgaaatcg atgttgagtc gccttcaaat gttaaatgca ttatctgcga agtgaatgcc 1080

aatcatccat ttgtgatgac cgaactgatg atgccaattt tgccgattgt gcgcgttaaa 1140

gatatcgatg aagcgattaa atatgcaaag attgcagaac aaaatcgtaa acatagtgcc 1200

tatatttata gcaaaaatat cgacaacctg aatcgctttg aacgtgaaat cgataccact 1260

atttttgtga agaatgctaa atcttttgct ggtgttggtt atgaagcaga aggttttacc 1320

actttcacta ttgctggaag caccggtgaa ggcattacct ctgcacgtaa ttttacccgc 1380

caacgtcgct gtgtactggc cggctaa 1407

<210> 73

<211> 1407

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成多核苷酸

<400> 73

atgaataaag atacgctgat cccgaccacc aaagatctga aagtgaaaac caacggcgaa 60

aatatcaacc tgaaaaacta taaagataac agcagttgct ttggcgtgtt tgaaaacgtt 120

gaaaacgcca tctccagcgc ggtgcatgcg caaaaaattc tctcgctgca ttacaccaaa 180

gagcagcgtg aaaaaattat caccgaaatc cgtaaagcgg cgctgcaaaa caaagaagtg 240

ctggcaacca tgatcctgga agaaacgcat atggggcgtt atgaagataa aattctgaaa 300

catgaactgg tggcgaaata cacgccgggc actgaagatc tgaccaccac cgcctggagc 360

ggcgataacg gcctgaccgt ggtggagatg tcgccttatg gcgtgattgg cgcgattacg 420

ccgtcaacca acccgaccga aacggtgatt tgtaacagca ttggcatgat tgccgcgggt 480

aatgcggtgg tgtttaacgg tcatccctgc gcgaaaaaat gtgtggcgtt tgccgttgag 540

atgatcaaca aagcgattat cagctgcggc ggcccggaaa atctggtgac caccatcaaa 600

aatccgacca tggaatcgct ggatgccatt atcaaacatc cttccatcaa actgctgtgc 660

ggcaccggcg gcccgggcat ggtgaaaacg ctgctgaaca gcggtaaaaa agcgattggc 720

gcgggcgcgg gtaacccgcc ggtgattgtc gatgacaccg ccgatattga aaaagcgggg 780

cgtagcatta ttgaaggctg ttcttttgat aacaacctgc cctgcattgc cgaaaaagaa 840

gtgtttgtct ttgaaaacgt cgccgatgat ctgatcagca atatgctgaa aaacaacgcg 900

gtgattatca atgaagatca ggttagcaaa ctgatcgatc tggtgctgca aaaaaacaac 960

gaaacgcagg aatattttat caacaaaaaa tgggttggta aagatgccaa actgtttctc 1020

gatgaaatcg atgttgaatc gccgtctaac gtgaaatgta ttatctgcga agtgaacgcc 1080

aaccatccgt ttgtgatgac cgaactgatg atgccgattc tgccgattgt gcgcgtgaaa 1140

gatatcgatg aagcgattaa atatgccaaa attgccgaac aaaaccgtaa acacagcgcc 1200

tatatttaca gcaaaaatat cgataacctg aaccgctttg aacgtgaaat cgataccacc 1260

atttttgtga aaaatgccaa aagttttgcc ggcgttggtt atgaagcgga aggttttacc 1320

acctttacca ttgccggtag caccggcgaa ggcattacca gcgcccgtaa ttttacccgc 1380

cagcgtcgct gcgtgctggc gggctaa 1407

<210> 74

<211> 1023

<212> DNA

<213> 热葡糖苷酶地芽孢杆菌

<400> 74

atgaaagctg cagtagtaga gcaatttaag gaaccattaa aaattaaaga agtggaaaag 60

ccatctattt catatggcga agtattagtc cgcattaaag catgcggtgt atgccatacg 120

gacttgcacg ccgctcatgg cgattggcca gtaaaaccaa aacttccttt aatccctggc 180

catgaaggag tcggaattgt tgaagaagtc ggtccggggg taacccattt aaaagtggga 240

gaccgcgttg gaattccttg gttatattct gcgtgcggcc attgcgaata ttgtttaagc 300

ggacaagaag cattatgtga acatcaacaa aacgccggct actcagtcga cgggggttat 360

gcagaatatt gcagagctgc gccagattat gtggtgaaaa ttcctgacaa cttatcgttt 420

gaagaagctg ctcctatttt ctgcgccgga gttactactt ataaagcgtt aaaagtcaca 480

ggtacaaaac cgggagaatg ggtagcgatc tatggcatcg gcggccttgg acatgttgcc 540

gtccagtatg cgaaagcgat ggggcttcat gttgttgcag tggatatcgg cgatgagaaa 600

ctggaacttg caaaagagct tggcgccgat cttgttgtaa atcctgcaaa agaaaatgcg 660

gcccaattta tgaaagagaa agtcggcgga gtacacgcgg ctgttgtgac agctgtatct 720

aaacctgctt ttcaatctgc gtacaattct atccgcagag gcggcacgtg cgtgcttgtc 780

ggattaccgc cggaagaaat gcctattcca atctttgata cggtattaaa cggaattaaa 840

attatcggtt ccattgtcgg cacgcggaaa gacttgcaag aagcgcttca gttcgctgca 900

gaaggtaaag taaaaaccat tattgaagtg caacctcttg aaaaaattaa cgaagtattt 960

gacagaatgc taaaaggaga aattaacgga cgggttgttt taacgttaga aaataataat 1020

taa 1023

<210> 75

<211> 340

<212> PRT

<213> 热葡糖苷酶地芽孢杆菌

<400> 75

Met Lys Ala Ala Val Val Glu Gln Phe Lys Glu Pro Leu Lys Ile Lys

1 5 10 15

Glu Val Glu Lys Pro Ser Ile Ser Tyr Gly Glu Val Leu Val Arg Ile

20 25 30

Lys Ala Cys Gly Val Cys His Thr Asp Leu His Ala Ala His Gly Asp

35 40 45

Trp Pro Val Lys Pro Lys Leu Pro Leu Ile Pro Gly His Glu Gly Val

50 55 60

Gly Ile Val Glu Glu Val Gly Pro Gly Val Thr His Leu Lys Val Gly

65 70 75 80

Asp Arg Val Gly Ile Pro Trp Leu Tyr Ser Ala Cys Gly His Cys Glu

85 90 95

Tyr Cys Leu Ser Gly Gln Glu Ala Leu Cys Glu His Gln Gln Asn Ala

100 105 110

Gly Tyr Ser Val Asp Gly Gly Tyr Ala Glu Tyr Cys Arg Ala Ala Pro

115 120 125

Asp Tyr Val Val Lys Ile Pro Asp Asn Leu Ser Phe Glu Glu Ala Ala

130 135 140

Pro Ile Phe Cys Ala Gly Val Thr Thr Tyr Lys Ala Leu Lys Val Thr

145 150 155 160

Gly Thr Lys Pro Gly Glu Trp Val Ala Ile Tyr Gly Ile Gly Gly Leu

165 170 175

Gly His Val Ala Val Gln Tyr Ala Lys Ala Met Gly Leu His Val Val

180 185 190

Ala Val Asp Ile Gly Asp Glu Lys Leu Glu Leu Ala Lys Glu Leu Gly

195 200 205

Ala Asp Leu Val Val Asn Pro Ala Lys Glu Asn Ala Ala Gln Phe Met

210 215 220

Lys Glu Lys Val Gly Gly Val His Ala Ala Val Val Thr Ala Val Ser

225 230 235 240

Lys Pro Ala Phe Gln Ser Ala Tyr Asn Ser Ile Arg Arg Gly Gly Thr

245 250 255

Cys Val Leu Val Gly Leu Pro Pro Glu Glu Met Pro Ile Pro Ile Phe

260 265 270

Asp Thr Val Leu Asn Gly Ile Lys Ile Ile Gly Ser Ile Val Gly Thr

275 280 285

Arg Lys Asp Leu Gln Glu Ala Leu Gln Phe Ala Ala Glu Gly Lys Val

290 295 300

Lys Thr Ile Ile Glu Val Gln Pro Leu Glu Lys Ile Asn Glu Val Phe

305 310 315 320

Asp Arg Met Leu Lys Gly Glu Ile Asn Gly Arg Val Val Leu Thr Leu

325 330 335

Glu Asn Asn Asn

340

<210> 76

<211> 4090

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成多核苷酸

<400> 76

atggctatcg aaatcaaagt accggacatc ggggctgatg aagttgaaat caccgagatc 60

ctggtcaaag tgggcgacaa agttgaagcc gaacagtcgc tgatcaccgt agaaggcgac 120

aaagcctcta tggaagttcc gtctccgcag gcgggtatcg ttaaagagat caaagtctct 180

gttggcgata aaacccagac cggcgcactg attatgattt tcgattccgc cgacggtgca 240

gcagacgctg cacctgctca ggcagaagag aagaaagaag cagctccggc agcagcacca 300

gcggctgcgg cggcaaaaga cgttaacgtt ccggatatcg gcagcgacga agttgaagtg 360

accgaaatcc tggtgaaagt tggcgataaa gttgaagctg aacagtcgct gatcaccgta 420

gaaggcgaca aggcttctat ggaagttccg gctccgtttg ctggcaccgt gaaagagatc 480

aaagtgaacg tgggtgacaa agtgtctacc ggctcgctga ttatggtctt cgaagtcgcg 540

ggtgaagcag gcgcggcagc tccggccgct aaacaggaag cagctccggc agcggcccct 600

gcaccagcgg ctggcgtgaa agaagttaac gttccggata tcggcggtga cgaagttgaa 660

gtgactgaag tgatggtgaa agtgggcgac aaagttgccg ctgaacagtc actgatcacc 720

gtagaaggcg acaaagcttc tatggaagtt ccggcgccgt ttgcaggcgt cgtgaaggaa 780

ctgaaagtca acgttggcga taaagtgaaa actggctcgc tgattatgat cttcgaagtt 840

gaaggcgcag cgcctgcggc agctcctgcg aaacaggaag cggcagcgcc ggcaccggca 900

gcaaaagctg aagccccggc agcagcacca gctgcgaaag cggaaggcaa atctgaattt 960

gctgaaaacg acgcttatgt tcacgcgact ccgctgatcc gccgtctggc acgcgagttt 1020

ggtgttaacc ttgcgaaagt gaagggcact ggccgtaaag gtcgtatcct gcgcgaagac 1080

gttcaggctt acgtgaaaga agctatcaaa cgtgcagaag cagctccggc agcgactggc 1140

ggtggtatcc ctggcatgct gccgtggccg aaggtggact tcagcaagtt tggtgaaatc 1200

gaagaagtgg aactgggccg catccagaaa atctctggtg cgaacctgag ccgtaactgg 1260

gtaatgatcc cgcatgttac tcacttcgac aaaaccgata tcaccgagtt ggaagcgttc 1320

cgtaaacagc agaacgaaga agcggcgaaa cgtaagctgg atgtgaagat caccccggtt 1380

gtcttcatca tgaaagccgt tgctgcagct cttgagcaga tgcctcgctt caatagttcg 1440

ctgtcggaag acggtcagcg tctgaccctg aagaaataca tcaacatcgg tgtggcggtg 1500

gataccccga acggtctggt tgttccggta ttcaaagacg tcaacaagaa aggcatcatc 1560

gagctgtctc gcgagctgat gactatttct aagaaagcgc gtgacggtaa gctgactgcg 1620

ggcgaaatgc agggcggttg cttcaccatc tccagcatcg gcggcctggg tactacccac 1680

ttcgcgccga ttgtgaacgc gccggaagtg gctatcctcg gcgtttccaa gtccgcgatg 1740

gagccggtgt ggaatggtaa agagttcgtg ccgcgtctga tgctgccgat ttctctctcc 1800

ttcgaccacc gcgtgatcga cggtgctgat ggtgcccgtt tcattaccat cattaacaac 1860

acgctgtctg acattcgccg tctggtgatg taagtaaaag agccggccca acggccggct 1920

tttttctggt aatctcatga atgtattgag gttattagcg aatagacaaa tcggttgccg 1980

tttgttgttt aaaaattgtt aacaattttg taaaataccg acggatagaa cgacccggtg 2040

gtggttaggg tattacttca cataccctat ggatttctgg gtgcagcaag gtagcaagcg 2100

ccagaatccc caggagctta cataagtaag tgactggggt gagggcgtga agctaacgcc 2160

gctgcggcct gaaagacgac gggtatgacc gccggagata aatatataga ggtcatgatg 2220

agtactgaaa tcaaaactca ggtcgtggta cttggggcag gccccgcagg ttactccgct 2280

gccttccgtt gcgctgattt aggtctggaa accgtaatcg tagaacgtta caacaccctt 2340

ggcggtgttt gtctgaacgt gggttgtatc ccttctaaag cgctgctgca cgtggcaaaa 2400

gttatcgaag aagcgaaagc gctggccgaa cacggcatcg ttttcggcga accgaaaact 2460

gacattgaca agatccgcac ctggaaagaa aaagtcatca ctcagctgac cggtggtctg 2520

gctggcatgg ccaaaggtcg taaagtgaag gtggttaacg gtctgggtaa atttaccggc 2580

gctaacaccc tggaagtgga aggcgaaaac ggcaaaaccg tgatcaactt cgacaacgcc 2640

atcatcgcgg cgggttcccg tccgattcag ctgccgttta tcccgcatga agatccgcgc 2700

gtatgggact ccaccgacgc gctggaactg aaatctgtac cgaaacgcat gctggtgatg 2760

ggcggcggta tcatcggtct ggaaatgggt accgtatacc atgcgctggg ttcagagatt 2820

gacgtggtgg aaatgttcga ccaggttatc ccggctgccg acaaagacgt ggtgaaagtc 2880

ttcaccaaac gcatcagcaa gaaatttaac ctgatgctgg aagccaaagt gactgccgtt 2940

gaagcgaaag aagacggtat ttacgtttcc atggaaggta aaaaagcacc ggcggaagcg 3000

cagcgttacg acgcagtgct ggtcgctatc ggccgcgtac cgaatggtaa aaacctcgat 3060

gcaggtaaag ctggcgtgga agttgacgat cgcggcttca tccgcgttga caaacaaatg 3120

cgcaccaacg tgccgcacat ctttgctatc ggcgatatcg tcggtcagcc gatgctggcg 3180

cacaaaggtg tccatgaagg ccacgttgcc gcagaagtta tctccggtct gaaacactac 3240

ttcgatccga aagtgatccc atccatcgcc tacactaaac cagaagtggc atgggtcggt 3300

ctgaccgaga aagaagcgaa agagaaaggc atcagctacg aaaccgccac cttcccgtgg 3360

gctgcttccg gccgtgctat cgcttctgac tgcgcagatg gtatgaccaa actgatcttc 3420

gacaaagaga cccaccgtgt tatcggcggc gcgattgtcg gcaccaacgg cggcgagctg 3480

ctgggtgaga tcggcctggc tatcgagatg ggctgtgacg ctgaagacat cgccctgacc 3540

atccacgctc acccgactct gcacgagtcc gttggcctgg cggcggaagt gttcgaaggc 3600

agcatcaccg acctgccaaa cgccaaagcg aagaaaaagt aactttttct ttcaggaaaa 3660

aagcataagc ggctccggga gccgcttttt ttatgcctga tgtttagaac tatgtcactg 3720

ttcataaacc gctacacctc atacatactt taagggcgaa ttctgcagat atccatcaca 3780

ctggcggccg ctcgagcatg catctagcac atccggcaat taaaaaagcg gctaaccacg 3840

ccgctttttt tacgtctgca atttaccttt ccagtcttct tgctccacgt tcagagagac 3900

gttcgcatac tgctgaccgt tgctcgttat tcagcctgac agtatggtta ctgtcgttta 3960

gacgttgtgg gcggctctcc tgaactttct cccgaaaaac ctgacgttgt tcaggtgatg 4020

ccgattgaac acgctggcgg gcgttatcac gttgctgttg attcagtggg cgctgctgta 4080

ctttttcctt 4090

<210> 77

<211> 475

<212> PRT

<213> 大肠杆菌

<400> 77

Met Met Ser Thr Glu Ile Lys Thr Gln Val Val Val Leu Gly Ala Gly

1 5 10 15

Pro Ala Gly Tyr Ser Ala Ala Phe Arg Cys Ala Asp Leu Gly Leu Glu

20 25 30

Thr Val Ile Val Glu Arg Tyr Asn Thr Leu Gly Gly Val Cys Leu Asn

35 40 45

Val Gly Cys Ile Pro Ser Lys Ala Leu Leu His Val Ala Lys Val Ile

50 55 60

Glu Glu Ala Lys Ala Leu Ala Glu His Gly Ile Val Phe Gly Glu Pro

65 70 75 80

Lys Thr Asp Ile Asp Lys Ile Arg Thr Trp Lys Glu Lys Val Ile Asn

85 90 95

Gln Leu Thr Gly Gly Leu Ala Gly Met Ala Lys Gly Arg Lys Val Lys

100 105 110

Val Val Asn Gly Leu Gly Lys Phe Thr Gly Ala Asn Thr Leu Glu Val

115 120 125

Glu Gly Glu Asn Gly Lys Thr Val Ile Asn Phe Asp Asn Ala Ile Ile

130 135 140

Ala Ala Gly Ser Arg Pro Ile Gln Leu Pro Phe Ile Pro His Glu Asp

145 150 155 160

Pro Arg Ile Trp Asp Ser Thr Asp Ala Leu Glu Leu Lys Glu Val Pro

165 170 175

Glu Arg Leu Leu Val Met Gly Gly Gly Ile Ile Gly Leu Glu Met Gly

180 185 190

Thr Val Tyr His Ala Leu Gly Ser Gln Ile Asp Val Val Glu Met Phe

195 200 205

Asp Gln Val Ile Pro Ala Ala Asp Lys Asp Ile Val Lys Val Phe Thr

210 215 220

Lys Arg Ile Ser Lys Lys Phe Asn Leu Met Leu Glu Thr Lys Val Thr

225 230 235 240

Ala Val Glu Ala Lys Glu Asp Gly Ile Tyr Val Thr Met Glu Gly Lys

245 250 255

Lys Ala Pro Ala Glu Pro Gln Arg Tyr Asp Ala Val Leu Val Ala Ile

260 265 270

Gly Arg Val Pro Asn Gly Lys Asn Leu Asp Ala Gly Lys Ala Gly Val

275 280 285

Glu Val Asp Asp Arg Gly Phe Ile Arg Val Asp Lys Gln Leu Arg Thr

290 295 300

Asn Val Pro His Ile Phe Ala Ile Gly Asp Ile Val Gly Gln Pro Met

305 310 315 320

Leu Ala His Lys Gly Val His Glu Gly His Val Ala Ala Glu Val Ile

325 330 335

Ala Gly Lys Lys His Tyr Phe Asp Pro Lys Val Ile Pro Ser Ile Ala

340 345 350

Tyr Thr Glu Pro Glu Val Ala Trp Val Gly Leu Thr Glu Lys Glu Ala

355 360 365

Lys Glu Lys Gly Ile Ser Tyr Glu Thr Ala Thr Phe Pro Trp Ala Ala

370 375 380

Ser Gly Arg Ala Ile Ala Ser Asp Cys Ala Asp Gly Met Thr Lys Leu

385 390 395 400

Ile Phe Asp Lys Glu Ser His Arg Val Ile Gly Gly Ala Ile Val Gly

405 410 415

Thr Asn Gly Gly Glu Leu Leu Gly Glu Ile Gly Leu Ala Ile Glu Met

420 425 430

Gly Cys Asp Ala Glu Asp Ile Ala Leu Thr Ile His Ala His Pro Thr

435 440 445

Leu His Glu Ser Val Gly Leu Ala Ala Glu Val Phe Glu Gly Ser Ile

450 455 460

Thr Asp Leu Pro Asn Pro Lys Ala Lys Lys Lys

465 470 475

<210> 78

<211> 475

<212> PRT

<213> 肺炎克雷伯菌

<400> 78

Met Met Ser Thr Glu Ile Lys Thr Gln Val Val Val Leu Gly Ala Gly

1 5 10 15

Pro Ala Gly Tyr Ser Ala Ala Phe Arg Cys Ala Asp Leu Gly Leu Glu

20 25 30

Thr Val Ile Val Glu Arg Tyr Ser Thr Leu Gly Gly Val Cys Leu Asn

35 40 45

Val Gly Cys Ile Pro Ser Lys Ala Leu Leu His Val Ala Lys Val Ile

50 55 60

Glu Glu Ala Lys Ala Leu Ala Glu His Gly Ile Val Phe Gly Glu Pro

65 70 75 80

Lys Thr Asp Ile Asp Lys Ile Arg Thr Trp Lys Glu Lys Val Ile Thr

85 90 95

Gln Leu Thr Gly Gly Leu Ala Gly Met Ala Lys Gly Arg Lys Val Lys

100 105 110

Val Val Asn Gly Leu Gly Lys Phe Thr Gly Ala Asn Thr Leu Glu Val

115 120 125

Glu Gly Glu Asn Gly Lys Thr Val Ile Asn Phe Asp Asn Ala Ile Ile

130 135 140

Ala Ala Gly Ser Arg Pro Ile Gln Leu Pro Phe Ile Pro His Glu Asp

145 150 155 160

Pro Arg Val Trp Asp Ser Thr Asp Ala Leu Glu Leu Lys Ser Val Pro

165 170 175

Lys Arg Met Leu Val Met Gly Gly Gly Ile Ile Gly Leu Glu Met Gly

180 185 190

Thr Val Tyr His Ala Leu Gly Ser Glu Ile Asp Val Val Glu Met Phe

195 200 205

Asp Gln Val Ile Pro Ala Ala Asp Lys Asp Val Val Lys Val Phe Thr

210 215 220

Lys Arg Ile Ser Lys Lys Phe Asn Leu Met Leu Glu Ala Lys Val Thr

225 230 235 240

Ala Val Glu Ala Lys Glu Asp Gly Ile Tyr Val Ser Met Glu Gly Lys

245 250 255

Lys Ala Pro Ala Glu Ala Gln Arg Tyr Asp Ala Val Leu Val Ala Ile

260 265 270

Gly Arg Val Pro Asn Gly Lys Asn Leu Asp Ala Gly Lys Ala Gly Val

275 280 285

Glu Val Asp Asp Arg Gly Phe Ile Arg Val Asp Lys Gln Met Arg Thr

290 295 300

Asn Val Pro His Ile Phe Ala Ile Gly Asp Ile Val Gly Gln Pro Met

305 310 315 320

Leu Ala His Lys Gly Val His Glu Gly His Val Ala Ala Glu Val Ile

325 330 335

Ser Gly Leu Lys His Tyr Phe Asp Pro Lys Val Ile Pro Ser Ile Ala

340 345 350

Tyr Thr Lys Pro Glu Val Ala Trp Val Gly Leu Thr Glu Lys Glu Ala

355 360 365

Lys Glu Lys Gly Ile Ser Tyr Glu Thr Ala Thr Phe Pro Trp Ala Ala

370 375 380

Ser Gly Arg Ala Ile Ala Ser Asp Cys Ala Asp Gly Met Thr Lys Leu

385 390 395 400

Ile Phe Asp Lys Glu Thr His Arg Val Ile Gly Gly Ala Ile Val Gly

405 410 415

Thr Asn Gly Gly Glu Leu Leu Gly Glu Ile Gly Leu Ala Ile Glu Met

420 425 430

Gly Cys Asp Ala Glu Asp Ile Ala Leu Thr Ile His Ala His Pro Thr

435 440 445

Leu His Glu Ser Val Gly Leu Ala Ala Glu Val Phe Glu Gly Ser Ile

450 455 460

Thr Asp Leu Pro Asn Ala Lys Ala Lys Lys Lys

465 470 475

<210> 79

<211> 347

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成多核苷酸

<400> 79

ataataatac atatgaacca tgcgagttac gggcctataa gccaggcgag atatgatcta 60

tatcaatttc tcatctataa tgctttgtta gtatctcgtc gccgacttaa taaagagaga 120

gttagtgtga aagctgacaa cccttttgat cttttacttc ctgctgcaat ggccaaagtg 180

gccgaagagg cgggtgtcta taaagcaacg aaacatccgc ttaagacttt ctatctggcg 240

attaccgccg gtgttttcat ctcaatcgca ttcaccactg gcacaggcac agaaggtagg 300

tgttacatgt cagaacgttt acacaatgac gtggatccta ttattat 347

<210> 80

<211> 4678

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成多核苷酸

<400> 80

aagaggtaaa agaataatgg ctatcgaaat caaagtaccg gacatcgggg ctgatgaagt 60

tgaaatcacc gagatcctgg tcaaagtggg cgacaaagtt gaagccgaac agtcgctgat 120

caccgtagaa ggcgacaaag cctctatgga agttccgtct ccgcaggcgg gtatcgttaa 180

agagatcaaa gtctctgttg gcgataaaac ccagaccggc gcactgatta tgattttcga 240

ttccgccgac ggtgcagcag acgctgcacc tgctcaggca gaagagaaga aagaagcagc 300

tccggcagca gcaccagcgg ctgcggcggc aaaagacgtt aacgttccgg atatcggcag 360

cgacgaagtt gaagtgaccg aaatcctggt gaaagttggc gataaagttg aagctgaaca 420

gtcgctgatc accgtagaag gcgacaaggc ttctatggaa gttccggctc cgtttgctgg 480

caccgtgaaa gagatcaaag tgaacgtggg tgacaaagtg tctaccggct cgctgattat 540

ggtcttcgaa gtcgcgggtg aagcaggcgc ggcagctccg gccgctaaac aggaagcagc 600

tccggcagcg gcccctgcac cagcggctgg cgtgaaagaa gttaacgttc cggatatcgg 660

cggtgacgaa gttgaagtga ctgaagtgat ggtgaaagtg ggcgacaaag ttgccgctga 720

acagtcactg atcaccgtag aaggcgacaa agcttctatg gaagttccgg cgccgtttgc 780

aggcgtcgtg aaggaactga aagtcaacgt tggcgataaa gtgaaaactg gctcgctgat 840

tatgatcttc gaagttgaag gcgcagcgcc tgcggcagct cctgcgaaac aggaagcggc 900

agcgccggca ccggcagcaa aagctgaagc cccggcagca gcaccagctg cgaaagcgga 960

aggcaaatct gaatttgctg aaaacgacgc ttatgttcac gcgactccgc tgatccgccg 1020

tctggcacgc gagtttggtg ttaaccttgc gaaagtgaag ggcactggcc gtaaaggtcg 1080

tatcctgcgc gaagacgttc aggcttacgt gaaagaagct atcaaacgtg cagaagcagc 1140

tccggcagcg actggcggtg gtatccctgg catgctgccg tggccgaagg tggacttcag 1200

caagtttggt gaaatcgaag aagtggaact gggccgcatc cagaaaatct ctggtgcgaa 1260

cctgagccgt aactgggtaa tgatcccgca tgttactcac ttcgacaaaa ccgatatcac 1320

cgagttggaa gcgttccgta aacagcagaa cgaagaagcg gcgaaacgta agctggatgt 1380

gaagatcacc ccggttgtct tcatcatgaa agccgttgct gcagctcttg agcagatgcc 1440

tcgcttcaat agttcgctgt cggaagacgg tcagcgtctg accctgaaga aatacatcaa 1500

catcggtgtg gcggtggata ccccgaacgg tctggttgtt ccggtattca aagacgtcaa 1560

caagaaaggc atcatcgagc tgtctcgcga gctgatgact atttctaaga aagcgcgtga 1620

cggtaagctg actgcgggcg aaatgcaggg cggttgcttc accatctcca gcatcggcgg 1680

cctgggtact acccacttcg cgccgattgt gaacgcgccg gaagtggcta tcctcggcgt 1740

ttccaagtcc gcgatggagc cggtgtggaa tggtaaagag ttcgtgccgc gtctgatgct 1800

gccgatttct ctctccttcg accaccgcgt gatcgacggt gctgatggtg cccgtttcat 1860

taccatcatt aacaacacgc tgtctgacat tcgccgtctg gtgatgtaag taaaagagcc 1920

ggcccaacgg ccggcttttt tctggtaatc tcatgaatgt attgaggtta ttagcgaata 1980

gacaaatcgg ttgccgtttg ttaagccagg cgagatatga tctatatcaa tttctcatct 2040

ataatgcttt gttagtatct cgtcgccgac ttaataaaga gagagttagt cttctatatc 2100

acagcaagaa ggtaggtgtt acatgatgag tactgaaatc aaaactcagg tcgtggtact 2160

tggggcaggc cccgcaggtt actctgcagc cttccgttgc gctgatttag gtctggaaac 2220

cgtcatcgta gaacgttaca gcaccctcgg tggtgtttgt ctgaacgtgg gttgtatccc 2280

ttctaaagcg ctgctgcacg tggcaaaagt tatcgaagaa gcgaaagcgc tggccgaaca 2340

cggcatcgtt ttcggcgaac cgaaaactga cattgacaag atccgcacct ggaaagaaaa 2400

agtcatcact cagctgaccg gtggtctggc tggcatggcc aaaggtcgta aagtgaaggt 2460

ggttaacggt ctgggtaaat ttaccggcgc taacaccctg gaagtggaag gcgaaaacgg 2520

caaaaccgtg atcaacttcg acaacgccat catcgcggcg ggttcccgtc cgattcagct 2580

gccgtttatc ccgcatgaag atccgcgcgt atgggactcc accgacgcgc tggaactgaa 2640

atctgtaccg aaacgcatgc tggtgatggg cggcggtatc atcggtctgg aaatgggtac 2700

cgtataccat gcgctgggtt cagagattga cgtggtggaa atgttcgacc aggttatccc 2760

ggctgccgac aaagacgtgg tgaaagtctt caccaaacgc atcagcaaga aatttaacct 2820

gatgctggaa gccaaagtga ctgccgttga agcgaaagaa gacggtattt acgtttccat 2880

ggaaggtaaa aaagcaccgg cggaagcgca gcgttacgac gcagtgctgg tcgctatcgg 2940

ccgcgtaccg aatggtaaaa acctcgatgc aggtaaagct ggcgtggaag ttgacgatcg 3000

cggcttcatc cgcgttgaca aacaaatgcg caccaacgtg ccgcacatct ttgctatcgg 3060

cgatatcgtc ggtcagccga tgctggcgca caaaggtgtc catgaaggcc acgttgccgc 3120

agaagttatc tccggtctga aacactactt cgatccgaaa gtgatcccat ccatcgccta 3180

cactaaacca gaagtggcat gggtcggtct gaccgagaaa gaagcgaaag agaaaggcat 3240

cagctacgaa accgccacct tcccgtgggc tgcttccggc cgtgctatcg cttctgactg 3300

cgcagatggt atgaccaaac tgatcttcga caaagagacc caccgtgtta tcggcggcgc 3360

gattgtcggc accaacggcg gcgagctgct gggtgagatc ggcctggcta tcgagatggg 3420

ctgtgacgct gaagacatcg ccctgaccat ccacgctcac ccgactctgc acgagtccgt 3480

tggcctggcg gcggaagtgt tcgaaggcag catcaccgac ctgccaaacg ccaaagcgaa 3540

gaaaaagtaa ctttttcttt caggaaaaaa gcataagcgg ctccgggagc cgcttttttt 3600

atgcctgatg tttagaacta tgtcactgtt cataaaccgc tacacctcat acatacttta 3660

agggcgaatt ctgcagatat ccatcacact ggcggccgct cgagcatgca tctagcacat 3720

ccggcaatta aaaaagcggc taaccacgcc gcttttttta cgtctgcaat ttacctttcc 3780

agtcttcttg ctccacgttc agagagacgt tcgcatactg ctgaccgttg ctcgttattc 3840

agcctgacag tatggttact gtcgtttaga cgttgtgggc ggctctcctg aactttctcc 3900

cgaaaaacct gacgttgttc aggtgatgcc gattgaacac gctggcgggc gttatcacgt 3960

tgctgttgat tcagtgggcg ctgctgtact ttttccttaa acacctggcg ctgctctggt 4020

gatgcggact gaatacgctc acgcgctgcg tctcttcgct gctggttctg cgggttagtc 4080

tgcattttct cgcgaaccgc ctggcgctgc tcaggcgagg cggactgaat gcgctcacgc 4140

gctgcctctc ttcgctgctg gatcttcggg ttagtctgca ttctctcgcg aactgcctgg 4200

cgctgctcag gcgaggcgga ctgataacgc tgacgagcgg cgtccttttg ttgctgggtc 4260

agtggttggc gacggctgaa gtcgtggaag tcgtcatagc tcccatagtg ttcagcttca 4320

ttaaaccgct gtgccgctgc ctgacgttgg gtacctcgtg taatgactgg tgcggcgtgt 4380

gttcgttgct gaaactgatt tgctgccgcc tgacgctggc tgtcgcgcgt tggggcaggt 4440

aattgcgtgg cgctcattcc gccgttgaca tcggtttgat gaaaccgctt tgccatatcc 4500

tgatcatgat agggcacacc attacggtag tttggattgt gccgccatgc catattctta 4560

tcagtaagat gctcaccggt gatacggttg aaattgttga cgtcgatatt gatgttgtcg 4620

ccgttgtgtt gccagccatt accgtcacga tgaccgccat cgtggtgatg ataatcat 4678

<210> 81

<211> 1114

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成多核苷酸

<220>

<221> CDS

<222> (323)..(958)

<400> 81

caaaaaaccg gagtctgtgc tccggttttt tattatccgc taatcaatta catatgaata 60

tcctccttag ttcctattcc gaagttccta ttctctagaa agtataggaa cttcggcgcg 120

cctacctgtg acggaagatc acttcgcaga ataaataaat cctggtgtcc ctgttgatac 180

cgggaagccc tgggccaact tttggcgaaa atgagacgtt gatcggcacg taagaggttc 240

caactttcac cataatgaaa taagatcact accgggcgta ttttttgagt tgtcgagatt 300

ttcaggagct aaggaagcta aa atg gag aaa aaa atc act gga tat acc acc 352

Met Glu Lys Lys Ile Thr Gly Tyr Thr Thr

1 5 10

gtt gat ata tcc caa tgg cat cgt aaa gaa cat ttt gag gca ttt cag 400

Val Asp Ile Ser Gln Trp His Arg Lys Glu His Phe Glu Ala Phe Gln

15 20 25

tca gtt gct caa tgt acc tat aac cag acc gtt cag ctg gat att acg 448

Ser Val Ala Gln Cys Thr Tyr Asn Gln Thr Val Gln Leu Asp Ile Thr

30 35 40

gcc ttt tta aag acc gta aag aaa aat aag cac aag ttt tat ccg gcc 496

Ala Phe Leu Lys Thr Val Lys Lys Asn Lys His Lys Phe Tyr Pro Ala

45 50 55

ttt att cac att ctt gcc cgc ctg atg aat gct cat ccg gaa tta cgt 544

Phe Ile His Ile Leu Ala Arg Leu Met Asn Ala His Pro Glu Leu Arg

60 65 70

atg gca atg aaa gac ggt gag ctg gtg ata tgg gat agt gtt cac cct 592

Met Ala Met Lys Asp Gly Glu Leu Val Ile Trp Asp Ser Val His Pro

75 80 85 90

tgt tac acc gtt ttc cat gag caa act gaa acg ttt tca tcg ctc tgg 640

Cys Tyr Thr Val Phe His Glu Gln Thr Glu Thr Phe Ser Ser Leu Trp

95 100 105

agt gaa tac cac gac gat ttc cgg cag ttt cta cac ata tat tcg caa 688

Ser Glu Tyr His Asp Asp Phe Arg Gln Phe Leu His Ile Tyr Ser Gln

110 115 120

gat gtg gcg tgt tac ggt gaa aac ctg gcc tat ttc cct aaa ggg ttt 736

Asp Val Ala Cys Tyr Gly Glu Asn Leu Ala Tyr Phe Pro Lys Gly Phe

125 130 135

att gag aat atg ttt ttc gtc tca gcc aat ccc tgg gtg agt ttc acc 784

Ile Glu Asn Met Phe Phe Val Ser Ala Asn Pro Trp Val Ser Phe Thr

140 145 150

agt ttt gat tta aac gtg gcc aat atg gac aac ttc ttc gcc ccc gtt 832

Ser Phe Asp Leu Asn Val Ala Asn Met Asp Asn Phe Phe Ala Pro Val

155 160 165 170

ttc acc atg ggc aaa tat tat acg caa ggc gac aag gtg ctg atg ccg 880

Phe Thr Met Gly Lys Tyr Tyr Thr Gln Gly Asp Lys Val Leu Met Pro

175 180 185

ctg gcg att cag gtt cat cat gcc gtt tgt gat ggc ttc cat gtc ggc 928

Leu Ala Ile Gln Val His His Ala Val Cys Asp Gly Phe His Val Gly

190 195 200

aga tgc tta atg aat aca aca gta ctg cga tgagtggcag ggcggggcgt 978

Arg Cys Leu Met Asn Thr Thr Val Leu Arg

205 210

aaggcgcgcc atttaaatga agttcctatt ccgaagttcc tattctctag aaagtatagg 1038

aacttcgaag cagctccagc ctacaccctt cttcagggct gactgtttgc ataaaaattc 1098

atctgtatgc acaata 1114

<210> 82

<211> 212

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述: 合成多肽

<400> 82

Met Glu Lys Lys Ile Thr Gly Tyr Thr Thr Val Asp Ile Ser Gln Trp

1 5 10 15

His Arg Lys Glu His Phe Glu Ala Phe Gln Ser Val Ala Gln Cys Thr

20 25 30

Tyr Asn Gln Thr Val Gln Leu Asp Ile Thr Ala Phe Leu Lys Thr Val

35 40 45

Lys Lys Asn Lys His Lys Phe Tyr Pro Ala Phe Ile His Ile Leu Ala

50 55 60

Arg Leu Met Asn Ala His Pro Glu Leu Arg Met Ala Met Lys Asp Gly

65 70 75 80

Glu Leu Val Ile Trp Asp Ser Val His Pro Cys Tyr Thr Val Phe His

85 90 95

Glu Gln Thr Glu Thr Phe Ser Ser Leu Trp Ser Glu Tyr His Asp Asp

100 105 110

Phe Arg Gln Phe Leu His Ile Tyr Ser Gln Asp Val Ala Cys Tyr Gly

115 120 125

Glu Asn Leu Ala Tyr Phe Pro Lys Gly Phe Ile Glu Asn Met Phe Phe

130 135 140

Val Ser Ala Asn Pro Trp Val Ser Phe Thr Ser Phe Asp Leu Asn Val

145 150 155 160

Ala Asn Met Asp Asn Phe Phe Ala Pro Val Phe Thr Met Gly Lys Tyr

165 170 175

Tyr Thr Gln Gly Asp Lys Val Leu Met Pro Leu Ala Ile Gln Val His

180 185 190

His Ala Val Cys Asp Gly Phe His Val Gly Arg Cys Leu Met Asn Thr

195 200 205

Thr Val Leu Arg

210

<210> 83

<211> 2521

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成多核苷酸

<400> 83

ttatttggtg atattggtac caatatcatg cagcaaacgg tgcaacattg ccgtgtctcg 60

ttgctctaaa agccccaggc gttgttgtaa ccagtcgacc agttttatgt catctgccac 120

tgccagagtc gtcagcaatg tcatggctcg ttcgcgtaaa gcttgcagtt gatgttggtc 180

tgccgttgca tcacttttcg ccggttgttg tattaatgtt gctaattgat agcaatagac 240

catcaccgcc tgccccagat tgagcgaagg ataatccgcc accatcggca caccagtaag 300

aacgtcagcc aacgctaact cttcgttagt caacccggaa tcttcgcgac caaacaccag 360

cgcggcatgg ctcatccatg aagatttttc ctctaacagc ggcaccagtt caactggcgt 420

ggcgtagtaa tgatatttcg cccgactgcg cgcagtggtg gcgacagtga aatcgacatc 480

gtgtaacgat tcagccaatg tcgggaaaac tttaatatta tcaataatat caccagatcc 540

atgtgcgacc cagcgggtgg ctggctccag gtgtgcctga ctatcgacaa tccgcagatc 600

gctaaacccc atcgttttca ttgcccgcgc cgctgcccca atattttctg ctctggcggg 660

tgcgaccaga ataatcgtta tacgcatatt gccactcttc ttgatcaaat aaccgcgaac 720

cgggtgatca ctgtcaactt attacgcggt gcgaatttac aaattcttaa cgtaagtcgc 780

agaaaaagcc ctttacttag cttaaaaaag gctaaactat ttcctgactg tactaacggt 840

tgagttgtta aaaaatgcta catatccttc tgtttactta ggataatttt ataaaaaata 900

aatctcgaca attggattca ccacgtttat tagttgtatg atgcaactag ttggattatt 960

aaaataatgt gacgaaagct agcatttaga tacgatgatt tcatcaaact gttaacgtgc 1020

tacaattgaa cttgatatat gtcaacgaag cgtagtttta ttgggtgtcc ggcccctctt 1080

agcctgttat gttgctgtta aaatggttag gatgacagcc gtttttgaca ctgtcgggtc 1140

ctgagggaaa gtacccacga ccaagctaat gatgttgttg acgttgatgg aaagtgcatc 1200

aagaacgcaa ttacgtactt tagtcatgtt acgccgatca tgttaatttg cagcatgcat 1260

caggcaggtc agggactttt gtacttcctg tttcgattta gttggcaatt taggtagcaa 1320

acgaattcat cggctttacc accgtcaaaa aaaacggcgc tttttagcgc cgtttttatt 1380

tttcaacctt atttccagat acgtaactca tcgtccgttg taacttcttt actggctttc 1440

attttcggca gtgaaaacgc ataccagtcg atattacggg tcacaaacat catgccggcc 1500

agcgccacca ccagcacact ggttcccaac aacagcgcgc tatcggcaga gttgagcagt 1560

ccccacatca caccatccag caacaacagc gcgagggtaa acaacatgct gttgcaccaa 1620

cctttcaata ccgcttgcaa ataaataccg ttcattatcg ccccaatcag actggcgatt 1680

atccatgcca cggtaaaacc ggtatgttca gaaagcgcca gcaagagcaa ataaaacatc 1740

accaatgaaa gccccaccag caaatattgc attgggtgta aacgttgcgc ggtgagcgtt 1800

tcaaaaacaa agaacgccat aaaagtcagt gcaatcagca gaatggcgta cttagtcgcc 1860

cggtcagtta attggtattg atcggctggc gtcgttactg cgacgctaaa cgccgggaag 1920

ttttcccagc cggtatcatt gcctgaagca aaacgctcac cgagattatt agcaaaccag 1980

ctgctttgcc agtgcgcctg aaaacctgac tcgctaactt cccgtttggc tggtagaaaa 2040

tcacctaaaa aactgggatg cggccagttg ctggttaagg tcatttcgct attacgcccg 2100

ccaggcacca cagaaagatc gccggtaccg cttaaattca gggccatatt cagcttcagg 2160

ttctgcttcc gccagtcccc ttcaggtaaa gggatatgca cgccctgccc gccttgctct 2220

aacccggtgc cgggttcaat ggtcagcgcc gttccgttaa cttcaggcgc tttcaccaca 2280

ccaataccac gcgcatcccc gacgctaatc acaataaatg gcttgcctaa ggtgatattt 2340

ggcgcgttga gttcgctaag acgcgaaaca tcgaaatcgg cttttaacgt taaatcactg 2400

tgccagacct gaccggtata aatccctatc ttgcgttctt ccacgttctg attgccatca 2460

accatcaatg actcaggtaa ccaaaaatgg ataaaacttc gtttccgctg cagggtttta 2520

t 2521

<210> 84

<211> 3010

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成多核苷酸

<400> 84

aagccacagc aggatgccca ctgcaacaaa ggtgatcaca ccggaaacgc gatggagaat 60

ggacgctatc gccgtgatgg ggaaccggat ggtctgtagg tccagattaa caggtctttg 120

ttttttcaca tttcttatca tgaataacgc ccacatgctg ttcttattat tccctgggga 180

ctacgggcac agaggttaac tttctgttac ctggagacgt cgggatttcc ttcctccggt 240

ctgcttgcgg gtcagacagc gtcctttcta taactgcgcg tcatgcaaaa cactgcttcc 300

agatgcgaaa acgacacgtt acaacgctgg gtggctcggg attgcagggt gttccggaga 360

cctggcggca gtataggctg ttcacaaaat cattacaatt aacctacata tagtttgtcg 420

ggttttatcc tgaacagtga tccaggtcac gataacaaca tttatttaat ttttaatcat 480

ctaatttgac aatcattcaa caaagttgtt acaaacatta ccaggaaaag catataatgc 540

gtaaaagtta tgaagtcggt atttcaccta agattaactt atgtaacagt gtggaagtat 600

tgaccaattc attcgggaca gttattagtg gtagacaagt ttaataattc ggattgctaa 660

gtacttgatt cgccatttat tcgtcatcaa tggatccttt acctgcaagc gcccagagct 720

ctgtacccag gttttcccct ctttcacaga gcggcgagcc aaataaaaaa cgggtaaagc 780

caggttgatg tgcgaaggca aatttaagtt ccggcagtct tacgcaataa ggcgctaagg 840

agaccttaaa tggctgatac aaaagcaaaa ctcaccctca acggggatac agctgttgaa 900

ctggatgtgc tgaaaggcac gctgggtcaa gatgttattg atatccgtac tctcggttca 960

aaaggtgtgt tcacctttga cccaggcttc acttcaaccg catcctgcga atctaaaatt 1020

acttttattg atggtgatga aggtattttg ctgcaccgcg gtttcccgat cgatcagctg 1080

gcgaccgatt ctaactacct ggaagtttgt tacatcctgc tgaatggtga aaaaccgact 1140

caggaacagt atgacgaatt taaaactacg gtgacccgtc ataccatgat ccacgagcag 1200

attacccgtc tgttccatgc tttccgtcgc gactcgcatc caatggcagt catgtgtggt 1260

attaccggcg cgctggcggc gttctatcac gactcgctgg atgttaacaa tcctcgtcac 1320

cgtgaaattg ccgcgttcct cctgctgtcg aaaatgccga ccatggccgc gatgtgttac 1380

aagtattcca ttggtcagcc atttgtttac ccgcgcaacg atctctccta cgccggtaac 1440

ttcctgaata tgatgttctc cacgccgtgc gaaccgtatg aagttaatcc gattctggaa 1500

cgtgctatgg accgtattct gatcctgcac gctgaccatg aacagaacgc ctctacctcc 1560

accgtgcgta ccgctggctc ttcgggtgcg aacccgtttg cctgtatcgc agcaggtatt 1620

gcttcactgt ggggacctgc gcacggcggt gctaacgaag cggcgctgaa aatgctggaa 1680

gaaatcagct ccgttaaaca cattccggaa tttgttcgtc gtgcgaaaga caaaaatgat 1740

tctttccgcc tgatgggctt cggtcaccgc gtgtacaaaa attacgaccc gcgcgccacc 1800

gtaatgcgtg aaacctgcca tgaagtgctg aaagagctgg gcacgaagga tgacctgctg 1860

gaagtggcta tggagctgga aaacatcgcg ctgaacgacc cgtactttat cgagaagaaa 1920

ctgtacccga acgtcgattt ctactctggt atcatcctga aagcgatggg tattccgtct 1980

tccatgttca ccgtcatttt cgcaatggca cgtaccgttg gctggatcgc ccactggagc 2040

gaaatgcaca gtgacggtat gaagattgcc cgtccgcgtc agctgtatac aggatatgaa 2100

aaacgcgact ttaaaagcga tatcaagcgt taatggttga ttgctaagtt gtaaatattt 2160

taacccgccg ttcatatggc gggttgattt ttatatgcct aaacacaaaa aattgtaaaa 2220

ataaaatcca ttaacagacc tatatagata tttaaaaaga atagaacagc tcaaattatc 2280

agcaacccaa tactttcaat taaaaacttc atggtagtcg catttataac cctatgaaaa 2340

tgacgtctat ctataccccc ctatatttta ttcatcatac aacaaattca tgataccaat 2400

aatttagttt tgcatttaat aaaactaaca atatttttaa gcaaaactaa aaactagcaa 2460

taatcaaata cgatattctg gcgtagctat acccctattc tatatcctta aaggactctg 2520

ttatgtttaa aggacaaaaa acattggccg cactggccgt atctctgctg ttcactgcac 2580

ctgtttatgc tgctgatgaa ggttctggcg aaattcactt taagggggag gttattgaag 2640

caccttgtga aattcatcca gaagatattg ataaaaacat agatcttgga caagtcacga 2700

caacccatat aaaccgggag catcatagca ataaagtggc cgtcgacatt cgcttgatca 2760

actgtgatct gcctgcttct gacaacggta gcggaatgcc ggtatccaaa gttggcgtaa 2820

ccttcgatag cacggctaag acaactggtg ctacgccttt gttgagcaac accagtgcag 2880

gcgaagcaac tggggtcggt gtacgactga tggacaaaaa tgacggtaac atcgtattag 2940

gttcagccgc gccagatctt gacctggatg caagctcatc agaacagacg ctgaactttt 3000

tcgcctggat 3010

<210> 85

<211> 4180

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成多核苷酸

<400> 85

cgcgatgtcg acgtcacgaa actgaaaaaa ccgctctaca ttctggcgac tgctgatgaa 60

gaaaccagta tggccggagc gcgttatttt gccgaaacta ccgccctgcg cccggattgc 120

gccatcattg gcgaaccgac gtcactacaa ccggtacgcg cacataaagg tcatatctct 180

aacgccatcc gtattcaggg ccagtcgggg cactccagcg atccagcacg cggagttaac 240

gctatcgaac taatgcacga cgccatcggg catattttgc aattgcgcga taacctgaaa 300

gaacgttatc actacgaagc gtttaccgtg ccatacccta cgctcaacct cgggcatatt 360

cacggtggcg acgcttctaa ccgtatttgc gcttgctgtg agttgcatat ggatattcgt 420

ccgctgcctg gcatgacact caatgaactt aatggtttgc tcaacgatgc attggctccg 480

gtgagcgaac gctggccggg tcgtctgacg gtcgacgagc tgcatccgcc gatccctggc 540

tatgaatgcc caccgaatca tcaactggtt gaagtggttg agaaattgct cggagcaaaa 600

accgaagtgg tgaactactg taccgaagcg ccgtttattc aaacgttatg cccgacgctg 660

gtgttggggc ctggctcaat taatcaggct catcaacctg atgaatatct ggaaacacgg 720

tttatcaagc ccacccgcga actgataacc caggtaattc accatttttg ctggcattaa 780

aacgtaggcc ggataaggcg ctcgcgccgc atccggcgct gttgccaaac tccagtgccg 840

caataatgtc ggatgcgatg cttgcgcatc ttatccgacc tacagtgact caaacgatgc 900

ccaaccgtag gccggataag gcgctcgcgc cgcatccggc actgttgcca aactccagtg 960

ccgcaataat gtcggatgcg atacttgcgc atcttatccg accgacagtg actcaaacga 1020

tgcccaactg taggccggat aaggcgctcg cgccgcatcc ggcactgttg ccaaactcca 1080

gtgccgcaat aatgtcggat gcgatacttg cgcatcttat ccgacctaca cctttggtgt 1140

tacttggggc gattttttaa catttccata agttacgctt atttaaagcg tcgtgaattt 1200

aatgacgtaa attcctgcta tttattcgtt tgctgaagcg atttcgcagc atttgacgtc 1260

accgctttta cgtggcttta taaaagacga cgaaaagcaa agcccgagca tattcgcgcc 1320

aatgctagca agaggagaag tcgacatgac agacttaaat aaagtggtaa aagaacttga 1380

agctcttggt atttatgacg taaaagaagt tgtttacaat ccaagctacg agcaattgtt 1440

cgaagaagaa actaaaccag gtttagaagg ctttgaaaaa ggtactttaa ctacgactgg 1500

tgcagtggca gtagatacag gtatcttcac aggtcgttct ccaaaagata aatatatcgt 1560

gttagatgaa aaaaccaaag atactgtttg gtggacatct gaaacagcaa aaaacgacaa 1620

caagccaatg aaccaagcta catggcaaag cttaaaagac ttggtaacca accagctttc 1680

tcgtaaacgc ttatttgtag ttgatggttt ctgtggtgcg agcgaacacg accgtattgc 1740

agtacgtatt gtcactgaag tagcgtggca agcacatttt gtaaaaaata tgtttattcg 1800

cccaactgaa gaacaactca aaaattttga accagatttc gttgtaatga atggttctaa 1860

agtaaccaat ccaaactgga aagaacaagg tttaaattca gaaaactttg ttgctttcaa 1920

cttgactgaa cgcattcaat taatcggtgg tacttggtac ggcggtgaaa tgaaaaaagg 1980

tatgttctca atcatgaact acttcctacc acttaaaggt gttggtgcaa tgcactgctc 2040

agctaacgtt ggtaaagatg gcgatgtagc aatcttcttc ggcttatctg gcacaggtaa 2100

aacaaccctt tcaacggatc caaaacgtga attaatcggt gacgatgaac acggctggga 2160

tgatgtgggt atctttaact ttgaaggtgg ttgctatgcg aaaaccattc acctttcaga 2220

agaaaatgaa ccagatattt accgcgctat ccgtcgcgac gcattattag aaaacgtggt 2280

tgttcgtgca gatggttctg ttgatttcga tgatggttca aaaacagaaa atactcgcgt 2340

gtcttaccca atttatcaca ttgataacat tgtaaaacca gtttctcgtg caggtcacgc 2400

aactaaagtg attttcttaa ctgcagatgc atttggcgta ttaccaccag tatctaaatt 2460

gacaccagaa caaactaaat actacttctt atctggtttc acagcaaaat tagcaggtac 2520

tgaacgtggt attactgaac caactccaac tttctcagca tgtttcggtg ctgcgttctt 2580

aacccttcac ccaactcaat atgcagaagt gttagtaaaa cgtatgcaag cagtgggtgc 2640

tgaagcttac ttagtaaata ctggttggaa tggcacaggc aaacgtatct caatcaaaga 2700

tactcgcgga atcattgatg caatcttaga tggctcaatt gaaaaagctg aaatgggcga 2760

attaccaatc tttaacttag ccattcctaa agcattacca ggtgtagatt ctgcaatctt 2820

agatcctcgc gatacttacg cagataaagc acaatggcaa tcaaaagctg aagacttagc 2880

aggtcgtttt gtgaaaaact ttgttaaata tgcaactaac gaagaaggca aagctttaat 2940

tgcagctggt cctaaagctt aatctagaaa gcttcctaga ggcatcaaat aaaacgaaag 3000

gctcagtcga aagactgggc ctttcgtttt atctgttgtt tgtcggtgaa cgctctcctg 3060

agtaggacga attcacttct gttctaacac cctcgttttc aatatatttc tgtctgcatt 3120

ttattcaaat tctgaatata ccttcagata tccttaagga attgtcgtta cattcggcga 3180

tattttttca agacaggttc ttactatgca ttccacagaa gtccaggcta aacctctttt 3240

tagctggaaa gccctgggtt gggcactgct ctacttttgg tttttctcta ctctgctaca 3300

ggccattatt tacatcagtg gttatagtgg cactaacggc attcgcgact cgctgttatt 3360

cagttcgctg tggttgatcc cggtattcct ctttccgaag cggattaaaa ttattgccgc 3420

agtaatcggc gtggtgctat gggcggcctc tctggcggcg ctgtgctact acgtcatcta 3480

cggtcaggag ttctcgcaga gcgttctgtt tgtgatgttc gaaaccaaca ccaacgaagc 3540

cagcgagtat ttaagccagt atttcagcct gaaaattgtg cttatcgcgc tggcctatac 3600

ggcggtggca gttctgctgt ggacacgcct gcgcccggtc tatattccaa agccgtggcg 3660

ttatgttgtc tcttttgccc tgctttatgg cttgattctg catccgatcg ccatgaatac 3720

gtttatcaaa aacaagccgt ttgagaaaac gttggataac ctggcctcgc gtatggagcc 3780

tgccgcaccg tggcaattcc tgaccggcta ttatcagtat cgtcagcaac taaactcgct 3840

aacaaagtta ctgaatgaaa ataatgcctt gccgccactg gctaatttca aagatgaatc 3900

gggtaacgaa ccgcgcactt tagtgctggt gattggcgag tcgacccagc gcggacgcat 3960

gagtctgtac ggttatccgc gtgaaaccac gccggagctg gatgcgctgc ataaaaccga 4020

tccgaatctg accgtgttta ataacgtagt tacgtctcgt ccgtacacca ttgaaatcct 4080

gcaacaggcg ctgacctttg ccaatgaaaa gaacccggat ctgtatctga cgcagccgtc 4140

gctgatgaac atgatgaaac aggcgggtta taaaaccttc 4180

<210> 86

<211> 4960

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成多核苷酸

<400> 86

aataggcgta tcacgaggcc ctttcgtctt cacctcgaga attgtgagcg gataacaatt 60

gacattgtga gcggataaca agatactgag cacatcagca ggacgcactg accgaattca 120

attaagctag caagaggaga agtcgagatg aacttacatg aatatcaggc aaaacaactt 180

tttgcccgct atggcttacc agcaccggtg ggttatgcct gtactactcc gcgcgaagca 240

gaagaagccg cttcaaaaat cggtgccggt ccgtgggtag tgaaatgtca ggttcacgct 300

ggtggccgcg gtaaagcggg cggtgtgaaa gttgtaaaca gcaaagaaga catccgtgct 360

tttgcagaaa actggctggg caagcgtctg gtaacgtatc aaacagatgc caatggccaa 420

ccggttaacc agattctggt tgaagcagcg accgatatcg ctaaagagct gtatctcggt 480

gccgttgttg accgtagttc ccgtcgtgtg gtctttatgg cctccaccga aggcggcgtg 540

gaaatcgaaa aagtggcgga agaaactccg cacctgatcc ataaagttgc gcttgatccg 600

ctgactggcc cgatgccgta tcagggacgc gagctggcgt tcaaactggg tctggaaggt 660

aaactggttc agcagttcac caaaatcttc atgggcctgg cgaccatttt cctggagcgc 720

gacctggcgt tgatcgaaat caacccgctg gtcatcacca aacagggcga tctgatttgc 780

ctcgacggca aactgggcgc tgacggcaac gcactgttcc gccagcctga tctgcgcgaa 840

atgcgtgacc agtcgcagga agatccgcgt gaagcacagg ctgcacagtg ggaactgaac 900

tacgttgcgc tggacggtaa catcggttgt atggttaacg gcgcaggtct ggcgatgggt 960

acgatggaca tcgttaaact gcacggcggc gaaccggcta acttccttga cgttggcggc 1020

ggcgcaacca aagaacgtgt aaccgaagcg ttcaaaatca tcctctctga cgacaaagtg 1080

aaagccgttc tggttaacat cttcggcggt atcgttcgtt gcgacctgat cgctgacggt 1140

atcatcggcg cggtagcaga agtgggtgtt aacgtaccgg tcgtggtacg tctggaaggt 1200

aacaacgccg aactcggcgc gaagaaactg gctgacagcg gcctgaatat tattgcagca 1260

aaaggtctga cggatgcagc tcagcaggtt gttgccgcag tggaggggaa ataatgtcca 1320

ttttaatcga taaaaacacc aaggttatct gccagggctt taccggtagc caggggactt 1380

tccactcaga acaggccatt gcatacggca ctaaaatggt tggcggcgta accccaggta 1440

aaggcggcac cacccacctc ggcctgccgg tgttcaacac cgtgcgtgaa gccgttgctg 1500

ccactggcgc taccgcttct gttatctacg taccagcacc gttctgcaaa gactccattc 1560

tggaagccat cgacgcaggc atcaaactga ttatcaccat cactgaaggc atcccgacgc 1620

tggatatgct gaccgtgaaa gtgaagctgg atgaagcagg cgttcgtatg atcggcccga 1680

actgcccagg cgttatcact ccgggtgaat gcaaaatcgg tatccagcct ggtcacattc 1740

acaaaccggg taaagtgggt atcgtttccc gttccggtac actgacctat gaagcggtta 1800

aacagaccac ggattacggt ttcggtcagt cgacctgtgt cggtatcggc ggtgacccga 1860

tcccgggctc taactttatc gacattctcg aaatgttcga aaaagatccg cagaccgaag 1920

cgatcgtgat gatcggtgag atcggcggta gcgctgaaga agaagcagct gcgtacatca 1980

aagagcacgt taccaagcca gttgtgggtt acatcgctgg tgtgactgcg ccgaaaggca 2040

aacgtatggg ccacgcgggt gccatcattg ccggtgggaa agggactgcg gatgagaaat 2100

tcgctgctct ggaagccgca ggcgtgaaaa ccgttcgcag cctggcggat atcggtgaag 2160

cactgaaaac tgttctgaaa taatctagca agaggagaag tcgacatgga aatcaaagaa 2220

atggtgagcc ttgcacgcaa ggctcagaag gagtatcaag ctacccataa ccaagaagca 2280

gttgacaaca tttgccgagc tgcagcaaaa gttatttatg aaaatgcagc tattctggct 2340

cgcgaagcag tagacgaaac cggcatgggc gtttacgaac acaaagtggc caagaatcaa 2400

ggcaaatcca aaggtgtttg gtacaacctc cacaataaaa aatcgattgg tatcctcaat 2460

atagacgagc gtaccggtat gatcgagatt gcaaagccta tcggagttgt aggagccgta 2520

acgccgacga ccaacccgat cgttactccg atgagcaata tcatctttgc tcttaagacc 2580

tgcaatgcca tcattattgc cccccacccc agatccaaaa aatgctctgc acacgcagtt 2640

cgtctgatca aagaagctat cgctccgttc aacgtaccgg aaggtatggt tcagatcatc 2700

gaagaaccca gcatcgagaa gacgcaggaa ctcatgggcg ccgtagacgt agtagttgct 2760

acgggtggta tgggcatggt gaagtctgca tattcttcag gaaagccttc tttcggtgtt 2820

ggagccggta acgttcaggt gatcgtggat agcaacatcg atttcgaagc tgctgcagaa 2880

aaaatcatca ccggtcgtgc tttcgacaac ggtatcatct gctcaggcga acagagcatc 2940

atctacaacg aggctgacaa ggaagcagtt ttcacagcat tccgcaacca cggtgcatat 3000

ttctgtgacg aagccgaagg agatcgggct cgtgcagcta tcttcgaaaa tggagccatc 3060

gcgaaagatg tagtaggtca gagcgttgcc ttcattgcca agaaagcaaa catcaatatc 3120

cccgagggta cccgtattct cgttgttgaa gctcgcggcg taggagcaga agacgttatc 3180

tgtaaggaaa agatgtgtcc cgtaatgtgc gccctcagct acaagcactt cgaagaaggt 3240

gtagaaatcg cacgtacgaa cctcgccaac gaaggtaacg gccacacctg tgctatccac 3300

tccaacaatc aggcacacat catcctcgca ggatcagagc tgacggtatc tcgtatcgta 3360

gtgaatgctc cgagtgccac tacagcaggc ggtcacatcc aaaacggtct tgccgtaacc 3420

aatacgctcg gatgcggatc atggggtaat aactctatct ccgagaactt cacttacaag 3480

cacctcctca acatttcacg catcgcaccg ttgaattcaa gcattcacat ccccgatgac 3540

aaagaaatct gggaactcta atctagcaag aggagaagtc gacatgcaac ttttcaaact 3600

caagagtgta acacatcact ttgacacttt tgcagaattt gccaaggaat tctgtcttgg 3660

agaacgcgac ttggtaatta ccaacgagtt catctatgaa ccgtatatga aggcatgcca 3720

gctcccctgc cattttgtta tgcaggagaa atatgggcaa ggcgagcctt ctgacgaaat 3780

gatgaataac atcttggcag acatccgtaa tatccagttc gaccgcgtaa tcggtatcgg 3840

aggaggtacg gttattgaca tctctaaact tttcgttctg aaaggattaa atgatgtact 3900

cgatgcattc gaccgcaaaa tacctcttat caaagagaaa gaactgatca ttgtgcccac 3960

aacatgcgga acgggtagcg aggtgacgaa catttctatc gcagaaatca aaagccgtca 4020

caccaaaatg ggattggctg acgatgccat tgttgcagac catgccatca tcatacctga 4080

acttctgaag agcttgcctt tccacttcta cgcatgcagt gcaatcgatg ctcttatcca 4140

tgccatcgag tcatacgtat ctcctaaagc cagtccatat tctcgtctgt tcagtgaggc 4200

ggcttgggac attatcctgg aagtattcaa gaaaatcgcc gaacacggcc ctgaataccg 4260

cttcgaaaag ctgggagaaa tgatcatggc cagcaactat gccggtatag ccttcggaaa 4320

tgcaggagta ggagccgtcc acgcactatc ctacccgttg ggaggcaact atcacgtgcc 4380

gcatggagaa gcaaactatc agttcttcac agaggtattc aaagtatacc aaaagaagaa 4440

tcctttcggc tatatagtcg aactcaactg gaagctctcc aagatactga actgccagcc 4500

cgaatacgta tatccgaagc tggatgaact tctcggatgc cttcttacca agaaaccttt 4560

gcacgaatac ggcatgaagg acgaagaggt aagaggcttt gcggaatcag tgcttaagac 4620

acagcaaaga ttgctcgcca acaactacgt agagcttact gtagatgaga tcgaaggtat 4680

ctacagaaga ctctactaat ctagaaagct tcctagaggc atcaaataaa acgaaaggct 4740

cagtcgaaag actgggcctt tcgttttatc tgttgtttgt cggtgaacgc tctcctgagt 4800

aggacaaatc cgccgcccta gacctaggcg ttcggctgcg acacgtcttg agcgattgtg 4860

taggctggag ctgcttcgaa gttcctatac tttctagaga ataggaactt cggaatagga 4920

actaaggagg atattcatat ggaccatggc taattcccat 4960

<210> 87

<211> 5083

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成多核苷酸

<400> 87

tcgagaaatt tatcaaaaag agtgttgact tgtgagcgga taacaatgat acttagattc 60

aattgtgagc ggataacaat ttcacacaga attcaattaa gctagcaaga ggagaagtcg 120

acatggccaa cataagttca ccattcgggc aaaacgaatg gctggttgaa gagatgtacc 180

gcaagttccg cgacgacccc tcctcggtcg atcccagctg gcacgagttc ctggttgact 240

acagccccga acccacctcc caaccagctg ccgaaccaac ccgggttacc tcgccactcg 300

ttgccgagcg ggccgctgcg gccgccccgc aggcaccccc caagccggcc gacaccgcgg 360

ccgcgggcaa cggcgtggtc gccgcactgg ccgccaaaac tgccgttccc ccgccagccg 420

aaggtgacga ggtagcggtg ctgcgcggcg ccgccgcggc cgtcgtcaag aacatgtccg 480

cgtcgttgga ggtgccgacg gcgaccagcg tccgggcggt cccggccaag ctactgatcg 540

acaaccggat cgtcatcaac aaccagttga agcggacccg cggcggcaag atctcgttca 600

cgcatttgct gggctacgcc ctggtgcagg cggtgaagaa attcccgaac atgaaccggc 660

actacaccga agtcgacggc aagcccaccg cggtcacgcc ggcgcacacc aatctcggcc 720

tggcgatcga cctgcaaggc aaggacggga agcgttccct ggtggtggcc ggcatcaagc 780

ggtgcgagac catgcgattc gcgcagttcg tcacggccta cgaagacatc gtacgccggg 840

cccgcgacgg caagctgacc actgaagact ttgccggcgt gacgatttcg ctgaccaatc 900

ccggaaccat cggcaccgtg cattcggtgc cgcggctgat gcccggccag ggcgccatca 960

tcggcgtggg cgccatggaa taccccgccg agtttcaagg cgccagcgag gaacgcatcg 1020

ccgagctggg catcggcaaa ttgatcactt tgacctccac ctacgaccac cgcatcatcc 1080

agggcgcgga atcgggcgac ttcctgcgca ccatccacga gttgctgctc tcggatggct 1140

tctgggacga ggtcttccgc gaactgagca tcccatatct gccggtgcgc tggagcaccg 1200

acaaccccga ctcgatcgtc gacaagaacg ctcgcgtcat gaacttgatc gcggcctacc 1260

gcaaccgcgg ccatctgatg gccgataccg acccgctgcg gttggacaaa gctcggttcc 1320

gcagtcaccc cgacctcgaa gtgctgaccc acggcctgac gctgtgggat ctcgatcggg 1380

tgttcaaggt cgacggcttt gccggtgcgc agtacaagaa actgcgcgac gtgctgggct 1440

tgctgcgcga tgcctactgc cgccacatcg gcgtggagta cgcccatatc ctcgaccccg 1500

aacaaaagga gtggctcgaa caacgggtcg agaccaagca cgtcaaaccc actgtggccc 1560

aacagaaata catcctcagc aagctcaacg ccgccgaggc ctttgaaacg ttcctacaga 1620

ccaagtacgt cggccagaag cggttctcgc tggaaggcgc cgaaagcgtg atcccgatga 1680

tggacgcggc gatcgaccag tgcgctgagc acggcctcga cgaggtggtc atcgggatgc 1740

cgcaccgggg ccggctcaac gtgctggcca acatcgtcgg caagccgtac tcgcagatct 1800

tcaccgagtt cgagggcaac ctgaatccgt cgcaggcgca cggctccggt gacgtcaagt 1860

accacctggg cgccaccggg ctgtacctgc agatgttcgg cgacaacgac attcaggtgt 1920

cgctgaccgc caacccgtcg catctggagg ccgtcgaccc ggtgctggag ggattggtgc 1980

gggccaagca ggatctgctc gaccacggaa gcatcgacag cgacggccaa cgggcgttct 2040

cggtggtgcc gctgatgttg catggcgatg ccgcgttcgc cggtcagggt gtggtcgccg 2100

agacgctgaa cctggcgaat ctgccgggct accgcgtcgg cggcaccatc cacatcatcg 2160

tcaacaacca gatcggcttc accaccgcgc ccgagtattc caggtccagc gagtactgca 2220

ccgacgtcgc aaagatgatc ggggcaccga tctttcacgt caacggcgac gacccggagg 2280

cgtgtgtctg ggtggcgcgg ttggcggtgg acttccgaca acggttcaag aaggacgtcg 2340

tcatcgacat gctgtgctac cgccgccgcg ggcacaacga gggtgacgac ccgtcgatga 2400

ccaaccccta catgtacgac gtcgtcgaca ccaagcgcgg ggcccgcaaa agctacaccg 2460

aagccctgat cggacgtggc gacatctcga tgaaggaggc cgaggacgcg ctgcgcgact 2520

accagggcca gctggaacgg gtgttcaacg aagtgcgcga gctggagaag cacggtgtgc 2580

agccgagcga gtcggtcgag tccgaccaga tgattcccgc ggggctggcc actgcggtgg 2640

acaagtcgct gctggcccgg atcggcgatg cgttcctcgc cttgccgaac ggcttcaccg 2700

cgcacccgcg agtccaaccg gtgctggaga agcgccggga gatggcctat gaaggcaaga 2760

tcgactgggc ctttggcgag ctgctggcgc tgggctcgct ggtggccgaa ggcaagctgg 2820

tgcgcttgtc ggggcaggac agccgccgcg gcaccttctc ccagcggcat tcggttctca 2880

tcgaccgcca cactggcgag gagttcacac cactgcagct gctggcgacc aactccgacg 2940

gcagcccgac cggcggaaag ttcctggtct acgactcgcc actgtcggag tacgccgccg 3000

tcggcttcga gtacggctac actgtgggca atccggacgc cgtggtgctc tgggaggcgc 3060

agttcggcga cttcgtcaac ggcgcacagt cgatcatcga cgagttcatc agctccggtg 3120

aggccaagtg gggccaattg tccaacgtcg tgctgctgtt accgcacggg cacgaggggc 3180

agggacccga ccacacttct gcccggatcg aacgcttctt gcagttgtgg gcggaaggtt 3240

cgatgaccat cgcgatgccg tcgactccgt cgaactactt ccacctgcta cgccggcatg 3300

ccctggacgg catccaacgc ccgctgatcg tgttcacgcc caagtcgatg ttgcgtcaca 3360

aggccgccgt cagcgaaatc aaggacttca ccgagatcaa gttccgctca gtgctggagg 3420

aacccaccta tgaggacggc atcggagacc gcaacaaggt cagccggatc ctgctgacca 3480

gtggcaagct gtattacgag ctggccgccc gcaaggccaa ggacaaccgc aatgacctcg 3540

cgatcgtgcg gcttgaacag ctcgccccgc tgcccaggcg tcgactgcgt gaaacgctgg 3600

accgctacga gaacgtcaag gagttcttct gggtccaaga ggaaccggcc aaccagggtg 3660

cgtggccgcg attcgggctc gaactacccg agctgctgcc tgacaagttg gccgggatca 3720

agcgaatctc gcgccgggcg atgtcagccc cgtcgtcagg ctcgtcgaag gtgcacgccg 3780

tcgaacagca ggagatcctc gacgaggcgt tcggctaatc tagcaagagg agaagtcgac 3840

atgaagttat taaaattggc acctgatgtt tataaatttg atactgcaga ggagtttatg 3900

aaatacttta aggttggaaa aggtgacttt atacttacta atgaattttt atataaacct 3960

ttccttgaga aattcaatga tggtgcagat gctgtatttc aggagaaata tggactcggt 4020

gaaccttctg atgaaatgat aaacaatata attaaggata ttggagataa acaatataat 4080

agaattattg ctgtaggggg aggatctgta atagatatag ccaaaatcct cagtcttaag 4140

tatactgatg attcattgga tttgtttgag ggaaaagtac ctcttgtaaa aaacaaagaa 4200

ttaattatag ttccaactac atgtggaaca ggttcagaag ttacaaatgt atcagttgca 4260

gaattaaaga gaagacatac taaaaaagga attgcttcag acgaattata tgcaacttat 4320

gcagtacttg taccagaatt tataaaagga cttccatata agttttttgt aaccagctcc 4380

gtagatgcct taatacatgc aacagaagct tatgtatctc caaatgcaaa tccttatact 4440

gatatgttta gtgtaaaagc tatggagtta attttaaatg gatacatgca aatggtagag 4500

aaaggaaatg attacagagt tgaaataatt gaggattttg ttataggcag caattatgca 4560

ggtatagctt ttggaaatgc aggagtggga gcggttcacg cactctcata tccaataggc 4620

ggaaattatc atgtgcctca tggagaagca aattatctgt tttttacaga aatatttaaa 4680

acttattatg agaaaaatcc aaatggcaag attaaagatg taaataaact attagcaggc 4740

atactaaaat gtgatgaaag tgaagcttat gacagtttat cacaactttt agataaatta 4800

ttgtcaagaa aaccattaag agaatatgga atgaaagagg aagaaattga aacttttgct 4860

gattcagtaa tagaaggaca gcagagactg ttggtaaaca attatgaacc tttttcaaga 4920

gaagacatag taaacacata taaaaagtta tattaatcta gaaagcttcc tagaggcatc 4980

aaataaaacg aaaggctcag tcgaaagact gggcctttcg ttttatctgt tgtttgtcgg 5040

tgaacgctct cctgagtagg acaaatccgc cgccctagac cta 5083

<210> 88

<211> 5097

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述: 合成多核苷酸

<400> 88

tctgtatcag gctgaaaatc ttctctcatc cgccaaaaca gcttcggcgt taagatgcgc 60

gctcaaggac gtaagccgtc gactctcgcc gtgctggcgc aggacacggc taccactcct 120

ttctctgttg atattctgct tgccattgag caaaccgcca gcgagttcgg ctggaatagt 180

tttttaatca atattttttc tgaagatgac gctgcccgcg cggcacgtca gctgcttgcc 240

caccgtccgg atggcattat ctatactaca atggggctgc gacatatcac gctgcctgag 300

tctctgtatg gtgaaaatat tgtattggcg aactgtgtgg cggatgaccc agcgttaccc 360

agttatatcc ctgatgatta cactgcacaa tatgaatcaa cacagcattt gctcgcggcg 420

ggctatcgtc aaccgttatg cttctggcta ccggaaagtg cgttggcaac agggtatcgt 480

cggcagggat ttgagcaggc ctggcgtgat gctggacgag atctggctga ggtgaaacaa 540

tttcacatgg caacaggtga tgatcactac accgatctcg caagtttact caatgcccac 600

ttcaaaccgg gcaaaccaga ttttgatgtt ctgatatgtg gtaacgatcg cgcagccttt 660

gtggcttatc aggttcttct ggcgaagggg gtacgaatcc cgcaggatgt cgccgtaatg 720

ggctttgata atctggttgg cgtcgggcat ctgtttttac cgccgctgac cacaattcag 780

cttccacatg acattatcgg gcgggaagct gcattgcata ttattgaagg tcgtgaaggg 840

ggaagagtga cgcggatccc ttgcccgctg ttgatccgtt gttccacctg atattatgtt 900

aacccagtag ccagagtgct ccatgttgca gcacagccac tccgtgggag gcataaagcg 960

acagttcccg ttcttctggc tgcggataga ttcgactact catcaccgct tccccgtcgt 1020

taataaatac ttccacggat gatgtatcga taaatatcct tagggcgagc gtgtcacgct 1080

gcgggagggg aatactacgg tagccgtcta aattctcgtg tgggtaatac cgccacaaaa 1140

caagtcgctc agattggtta tcaatataca gccgcattcc agtgccgagc tgtaatccgt 1200

aatgttcggc atcactgttc ttcagcgccc actgcaactg aatctcaact gcttgcgcgt 1260

tttcctgcaa aacatattta ttgctgattg tgcggggaga gacagattga tgctgctggc 1320

gtaacgactc agcttcgtgt accgggcgtt gtagaagttt gccattgctc tctgatagct 1380

cgcgcgccag cgtcatgcag cctgcccatc cttcacgttt tgagggcatt ggcgattccc 1440

acatatccat ccagccgata acaatacgcc gaccatcctt cgctaaaaag ctttgtggtg 1500

cataaaagtc atgcccgtta tcaagttcag taaaatgccc ggattgtgca aaaagtcgtc 1560

ctggcgacca cattccgggt attacgccac tttgaaagcg atttcggtaa ctgtatccct 1620

cggcattcat tccctgcggg gaaaacatca gataatgctg atcgccaagg ctgaaaaagt 1680

ccggacattc ccacatatag ctttcacccg catcagcgtg ggccagtacg cgatcgaagg 1740

tccattcacg caacgaactg ccgcgataaa gcaggatctg ccccgtgttg cctggatctt 1800

tcgccccgac taccatccac catgtgtcgg cttcacgcca cactttagga tcgcggaagt 1860

gcatgattcc ttctggtgga gtgaggatca caccctgttt ctcgaaatga ataccatccc 1920

gactggtagc cagacattgt acttcgcgaa ttgcatcgtc attacctgca ccatcgagcc 1980

agacgtgtcc ggtgtagata agtgagagga caccattgtc atcgacagca ctacctgaaa 2040

aacacccgtc tttgtcatta tcgtctcctg gcgctagcgc aataggctca tgctgccagt 2100

ggatcatatc gtcgctggtg gcatgtcccc agtgcattgg cccccagtgt tcgctcatcg 2160

gatgatgttg ataaaacgcg tgataacgat cgttaaacca gatcaggccg tttggatcgt 2220

tcatccaccc ggcaggaggc gcgaggtgaa aatggggata gaaagtgtta ccccggtgct 2280

catgaagttt tgctagggcg ttttgcgccg catgcaatcg agattgcgtc attttaatca 2340

tcctggttaa gcaaatttgg tgaattgtta acgttaactt ttataaaaat aaagtccctt 2400

actttcataa atgcgatgaa tatcacaaat gttaacgtta actatgacgt tttgtgatcg 2460

aatatgcatg ttttagtaaa tccatgacga ttttgcgaaa aagaggttta tcactatgcg 2520

taactcagat gaatttaagg gaaaaaaatg tcagccaaag tatgggtttt aggggatgcg 2580

gtcgtagatc tcttgccaga atcagacggg cgcctactgc cttgtcctgg cggcgcgcca 2640

gctaacgttg cggtgggaat cgccagatta ggcggaacaa gtgggtttat aggtcgggtg 2700

ggggatgatc cttttggtgc gttaatgcaa agaacgctgc taactgaggg agtcgatatc 2760

acgtatctga agcaagatga atggcaccgg acatccacgg tgcttgtcga tctgaacgat 2820

caaggggaac gttcatttac gtttatggtc cgccccagtg ccgatctttt tttagagacg 2880

acagacttgc cctgctggcg acatggcgaa tggttacatc tctgttcaat tgcgttgtct 2940

gccgagcctt cgcgtaccag cgcatttact gcgatgacgg cgatccggca tgccggaggt 3000

tttgtcagct tcgatcctaa tattcgtgaa gatctatggc aagacgagca tttgctccgc 3060

ttgtgtttgc ggcaggcgct acaactggcg gatgtcgtca agctctcgga agaagaatgg 3120

cgacttatca gtggaaaaac acagaacgat caggatatat gcgccctggc aaaagagtat 3180

gagatcgcca tgctgttggt gactaaaggt gcagaagggg tggtggtctg ttatcgagga 3240

caagttcacc attttgctgg aatgtctgtg aattgtgtcg atagcacggg ggcgggagat 3300

gcgttcgttg ccgggttact cacaggtctg tcctctacgg gattatctac agatgagaga 3360

gaaatgcgac gaattatcga tctcgctcaa cgttgcggag cgcttgcagt aacggcgaaa 3420

ggggcaatga cagcgctgcc atgtcgacaa gaactggaat agtgagaagt aaacggcgaa 3480

gtcgctctta tctctaaata ggacgtgaat tttttaacga caggcaggta attatggcac 3540

tgaatattcc attcagaaat gcgtactatc gttttgcatc cagttactca tttctctttt 3600

ttatttcctg gtcgctgtgg tggtcgttat acgctatttg gctgaaagga catctagggt 3660

tgacagggac ggaattaggt acactttatt cggtcaacca gtttaccagc attctattta 3720

tgatgttcta cggcatcgtt caggataaac tcggtctgaa gaaaccgctc atctggtgta 3780

tgagtttcat cctggtcttg accggaccgt ttatgattta cgtttatgaa ccgttactgc 3840

aaagcaattt ttctgtaggt ctaattctgg gggcgctatt ttttggcttg gggtatctgg 3900

cgggatgcgg tttgcttgat agcttcaccg aaaaaatggc gcgaaatttt catttcgaat 3960

atggaacagc gcgcgcctgg ggatcttttg gctatgctat tggcgcgttc tttgccggca 4020

tattttttag tatcagtccc catatcaact tctggttggt ctcgctattt ggcgctgtat 4080

ttatgatgat caacatgcgt tttaaagata aggatcacca gtgcgtagcg gcagatgcgg 4140

gaggggtaaa aaaagaggat tttatcgcag ttttcaagga tcgaaacttc tgggttttcg 4200

tcatatttat tgtggggacg tggtctttct ataacatttt tgatcaacaa ctttttcctg 4260

tcttttattc aggtttattc gaatcacacg atgtaggaac gcgcctgtat ggttatctca 4320

actcattcca ggtggtactc gaagcgctgt gcatggcgat tattcctttc tttgtgaatc 4380

gggtagggcc aaaaaatgca ttacttatcg gagttgtgat tatggcgttg cgtatccttt 4440

cctgcgcgct gttcgttaac ccctggatta tttcattagt gaagttgtta catgccattg 4500

aggttccact ttgtgtcata tccgtcttca aatacagcgt ggcaaacttt gataagcgcc 4560

tgtcgtcgac gatctttctg attggttttc aaattgccag ttcgcttggg attgtgctgc 4620

tttcaacgcc gactgggata ctctttgacc acgcaggcta ccagacagtt ttcttcgcaa 4680

tttcgggtat tgtctgcctg atgttgctat ttggcatttt cttcttgagt aaaaaacgcg 4740

agcaaatagt tatggaaacg cctgtacctt cagcaatata gacgtaaact ttttccggtt 4800

gttgtcgata gctctatatc cctcaaccgg aaaataataa tagtaaaatg cttagccctg 4860

ctaataatcg cctaatccaa acgcctcatt catgttctgg tacagtcgct caaatgtact 4920

tcagatgcgc ggttcgctga tttccaggac attgtcgtca ttcagtgacc tgtcccgtgt 4980

atcacggtcc tgcgaattca tcaaggaatg cattgcggag tgaagtatcg agtcacgcca 5040

tatttcgtca cccgaagatg agttttgaga tattaaggca ggtgactttc actcaca 5097

Claims

1.具有1,4-丁二醇(BDO)途径的非天然存在的微生物体，该途径包括编码在一定条件下以足够量表达而生产BDO的BDO途径酶的至少一种外源核酸，其中所述微生物体经遗传修饰以表达外源的4-羟基丁酰-辅酶A还原酶；以表达外源的琥珀酰-辅酶A合成酶；以表达外源的α-酮戊二酸脱羧酶；以表达外源的琥珀酸半醛脱氢酶和4-羟基丁酸脱氢酶并且任选地表达4-羟基丁酰-辅酶A/乙酰-辅酶A移转酶；以表达外源的丁酸激酶和磷酸转丁酰酶；以表达外源的4-羟基丁醛还原酶；以表达外源的丙酮酸脱氢酶；以破坏编码需氧的呼吸控制调节系统的基因；以表达外源的NADH不敏感的柠檬酸合成酶；和以表达外源的磷酸烯醇丙酮酸羧激酶。

2.如权利要求1所述的非天然存在的微生物体，其中所述琥珀酰-辅酶A合成酶由大肠杆菌sucCD基因编码。

3.如权利要求1所述的非天然存在的微生物体，其中所述α-酮戊二酸脱羧酶由牛分枝杆菌sucA基因编码。

4.如权利要求1所述的非天然存在的微生物体，其中所述琥珀酸半醛脱氢酶是辅酶A-依赖性的，并且所述琥珀酸半醛脱氢酶、4-羟基丁酸脱氢酶和4-羟基丁酰-辅酶A/乙酰-辅酶A移转酶由牙龈卟啉单胞菌W83基因编码。

5.如权利要求1所述的非天然存在的微生物体，其中所述丁酸激酶和磷酸转丁酰酶由丙酮丁醇梭菌buk1和ptb基因编码。

6.如权利要求1所述的非天然存在的微生物体，其中所述4-羟基丁酰-辅酶A还原酶由拜氏梭菌Ald基因编码。

7.如权利要求1所述的非天然存在的微生物体，其中所述4-羟基丁醛还原酶由热葡糖苷酶地芽孢杆菌adh1基因编码。

8.如权利要求1所述的非天然存在的微生物体，其中所述外源的丙酮酸脱氢酶是NADH不敏感的。

9.如权利要求1所述的非天然存在的微生物体，其中所述外源的丙酮酸脱氢酶由肺炎克雷伯氏杆菌lpdA基因编码。

10.如权利要求1所述的非天然存在的微生物体，其中所述微生物体的一种或多种所述丙酮酸脱氢酶亚基基因在丙酮酸甲酸酯裂解酶启动子的调控下。

11.如权利要求1所述的非天然存在的微生物体，其中所述需氧呼吸控制调节系统的破坏是对arcA基因的破坏。

12.如权利要求1所述的非天然存在的微生物体，进一步包括对编码苹果酸脱氢酶的基因的破坏。

13.如权利要求1所述的非天然存在的微生物体，其中所述NADH不敏感的柠檬酸合成酶由gltA编码。

14.如权利要求1所述的非天然存在的微生物体，其中所述NADH不敏感的柠檬酸合成酶由gltA的R163L突变体编码。

15.如权利要求1所述的非天然存在的微生物体，其中所述磷酸烯醇丙酮酸羧激酶由流感嗜血杆菌磷酸烯醇丙酮酸羧激酶基因编码。

16.如权利要求1所述的非天然存在的微生物体，其中编码所述外源表达酶的一种或多种基因整合入宿主生物体的fimD基因座中。

17.如权利要求1所述的非天然存在的微生物体，其中所述生物体表达非-磷酸转移酶蔗糖摄取系统。

18.如权利要求1所述的非天然存在的微生物体，其中所述生物体进一步包括对内源的乳酸脱氢酶、醇脱氢酶和丙酮酸甲酸酯裂解酶的破坏。

19.如权利要求1所述的非天然存在的微生物体，其中所述BDO途径包括4-羟基丁酸脱氢酶、琥珀酰-辅酶A合成酶、辅酶A-依赖性的琥珀酸半醛脱氢酶、4-羟基丁酰：辅酶A移转酶、4-丁酸激酶、磷酸转丁酰酶、α-酮戊二酸脱羧酶、醛脱氢酶、醇脱氢酶或醛/醇脱氢酶。

20.如权利要求1所述的非天然存在的微生物体，其中所述BDO途径包括4-氨基丁酸辅酶A移转酶、4-氨基丁酰-辅酶A水解酶、4-氨基丁酸-辅酶A连接酶、用于去氨基的4-氨基丁酰-辅酶A氧化还原酶、4-氨基丁酰-辅酶A氨基转移酶或4-羟基丁酰-辅酶A脱氢酶。

21.如权利要求20所述的非天然存在的微生物体，其中所述BDO途径进一步包括用于醇形成的4-羟基丁酰-辅酶A还原酶、4-羟基丁酰-辅酶A还原酶或1,4-丁二醇脱氢酶。

22.如权利要求1所述的非天然存在的微生物体，其中所述BDO途径包括4-氨基丁酸辅酶A移转酶、4-氨基丁酰-辅酶A水解酶、4-氨基丁酸-辅酶A连接酶、用于醇形成的4-氨基丁酰-辅酶A还原酶、4-氨基丁酰-辅酶A还原酶、4-氨基丁-1-醇脱氢酶、用于去氨基的4-氨基丁-1-醇氧化还原酶或4-氨基丁-1-醇氨基转移酶。

23.如权利要求1所述的非天然存在的微生物体，其中所述BDO途径包括4-氨基丁酸激酶、用于磷酸化的4-氨基丁醛脱氢酶、4-氨基丁-1-醇脱氢酶、用于去氨基的4-氨基丁-1-醇氧化还原酶、4-氨基丁-1-醇氨基转移酶、用于去氨基的[(4-氨基丁醇基)氧]膦酸氧化还原酶、[(4-氨基丁醇基)氧]膦酸氨基转移酶、用于磷酸化的4-羟基丁酰-磷酸盐脱氢酶或4-羟基丁醛脱氢酶。

24.如权利要求23所述的非天然存在的微生物体，其中所述BDO途径进一步包括1,4-丁二醇脱氢酶。

25.如权利要求1所述的非天然存在的微生物体，其中所述BDO途径包括α-酮戊二酸5-激酶、用于磷酸化的2,5-二氧代戊酸半醛脱氢酶、2,5-二氧代戊酸还原酶、α-酮戊二酸辅酶A移转酶、α-酮戊二酸基-辅酶A水解酶、α-酮戊二酸基-辅酶A连接酶、α-酮戊二酸基-辅酶A还原酶、5-羟基-2-氧代戊酸脱氢酶、用于醇形成的α-酮戊二酸基-辅酶A还原酶、5-羟基-2-氧代戊酸脱羧酶或用于脱羧的5-羟基-2-氧代戊酸脱氢酶。

26.如权利要求25所述的非天然存在的微生物体，其中所述BDO途径进一步包括用于醇形成的4-羟基丁酰-辅酶A还原酶、4-羟基丁酰-辅酶A还原酶或1,4-丁二醇脱氢酶。

27.如权利要求1所述的非天然存在的微生物体，其中所述BDO途径包括谷氨酸辅酶A移转酶、谷氨酰基-辅酶A水解酶、谷氨酰基-辅酶A连接酶、谷氨酸5-激酶、用于磷酸化的谷氨酸-5-半醛脱氢酶、谷氨酰基-辅酶A还原酶、谷氨酸-5-半醛还原酶、用于醇形成的谷氨酰基-辅酶A还原酶、用于去氨基的2-氨基-5-羟基戊酸氧化还原酶、2-氨基-5-羟基戊酸氨基转移酶、5-羟基-2-氧代戊酸脱羧酶、用于脱羧的5-羟基-2-氧代戊酸脱氢酶。

28.如权利要求27所述的非天然存在的微生物体，其中所述BDO途径进一步包括用于醇形成的4-羟基丁酰-辅酶A还原酶、4-羟基丁酰-辅酶A还原酶或1,4-丁二醇脱氢酶。

29.如权利要求1所述的非天然存在的微生物体，其中所述BDO途径包括3-羟基丁酰-辅酶A脱氢酶、3-羟基丁酰-辅酶A脱水酶、乙烯乙酰基-辅酶△-异构酶或4-羟基丁酰-辅酶A脱水酶。

30.如权利要求1所述的非天然存在的微生物体，其中所述BDO途径包括高丝氨酸脱氨酶、高丝氨酸-辅酶A移转酶、高丝氨酸-辅酶A水解酶、高丝氨酸-辅酶A连接酶、高丝氨酸-辅酶A脱氨酶、4-羟基丁-2-烯酰基-辅酶A移转酶、4-羟基丁-2-烯酰基-辅酶A水解酶、4-羟基丁-2-烯酰基-辅酶A连接酶、4-羟基丁-2-烯酸酯还原酶、4-羟基丁酰-辅酶A移转酶、4-羟基丁酰-辅酶A水解酶、4-羟基丁酰-辅酶A连接酶或4-羟基丁-2-烯酰基-辅酶A还原酶。

31.如权利要求30所述的非天然存在的微生物体，其中所述BDO途径进一步包括用于醇形成的4-羟基丁酰-辅酶A还原酶、4-羟基丁酰-辅酶A还原酶或1,4-丁二醇脱氢酶。

32.如权利要求1所述的非天然存在的微生物体，其中所述BDO途径包括用于醇形成的琥珀酰-辅酶A还原酶、4-羟基丁酰-辅酶A水解酶、4-羟基丁酰-辅酶A连接酶或用于磷酸化的4-羟基丁醛脱氢酶。

33.如权利要求32所述的非天然存在的微生物体，其中所述BDO途径进一步包括琥珀酰-辅酶A还原酶、4-羟基丁酸脱氢酶、4-羟基丁酰-辅酶A移转酶、4-羟基丁酸激酶、磷酸转-4-羟基丁酰酶、4-羟基丁酰-辅酶A还原酶、用于醇形成的4-羟基丁酰-辅酶A还原酶或1,4-丁二醇脱氢酶。

34.如权利要求1所述的非天然存在的微生物体，其中所述BDO途径包括谷氨酸脱氢酶、用于去氨基的4-氨基丁酸氧化还原酶、4-氨基丁酸氨基转移酶、谷氨酸脱羧酶、4-羟基丁酰-辅酶A水解酶、4-羟基丁酰-辅酶A连接酶或用于磷酸化的4-羟基丁醛脱氢酶。

35.如权利要求34所述的非天然存在的微生物体，其中所述BDO途径进一步包括α-酮戊二酸脱羧酶、4-羟基丁酸脱氢酶、4-羟基丁酰-辅酶A移转酶、4-羟基丁酸激酶、磷酸转-4-羟基丁酰酶、4-羟基丁酰-辅酶A还原酶、用于醇形成的4-羟基丁酰-辅酶A还原酶或1,4-丁二醇脱氢酶。

36.用于生产1,4-丁二醇(BDO)的方法，包括在一定条件下和以足够的时间培养权利要求1-35中任一项所述的非天然存在的微生物体以生产BDO。