CN110621691A - 从ci碳制备1,4-丁二醇及其衍生物的方法和微生物 - Google Patents

从ci碳制备1,4-丁二醇及其衍生物的方法和微生物 Download PDF

Info

Publication number
CN110621691A
CN110621691A CN201880031815.2A CN201880031815A CN110621691A CN 110621691 A CN110621691 A CN 110621691A CN 201880031815 A CN201880031815 A CN 201880031815A CN 110621691 A CN110621691 A CN 110621691A
Authority
CN
China
Prior art keywords
gene
seq
dehydrogenase
cases
nucleotide sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201880031815.2A
Other languages
English (en)
Inventor
赵新华
T·胡应
J·奥斯
L·Y·赵
J·基莱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Intel Rexton Co Ltd
Precigen Inc
Original Assignee
Intel Rexton Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Intel Rexton Co Ltd filed Critical Intel Rexton Co Ltd
Publication of CN110621691A publication Critical patent/CN110621691A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N11/00Carrier-bound or immobilised enzymes; Carrier-bound or immobilised microbial cells; Preparation thereof
    • C12N11/14Enzymes or microbial cells immobilised on or in an inorganic carrier
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/30Fuel from waste, e.g. synthetic alcohol or diesel

Abstract

公开了具有将碳底物转化成化学产物如1,4‑BDO的能力的经遗传修饰的微生物。例如,公开了能够从甲烷源以高效价产生1,4‑BDO的经遗传修饰的甲烷氧化菌。还公开了制备这些经遗传修饰的微生物的方法和使用它们的方法。

Description

从CI碳制备1,4-丁二醇及其衍生物的方法和微生物
交叉引用
本申请要求2017年3月14日提交的美国临时申请号62/470,953的优先权,其通过引用全文纳入本文。
序列表
本申请包含以ASCII格式电子提交的序列表,并通过引用全文纳入本文。ASCII副本于2018年2月20日创建,名为INX00386_SL.txt,大小为201,062字节。
背景技术
为了控制化石燃料的使用,人们对于通过微生物发酵产生燃料和化学物质非常关注。一种这样感兴趣的化学物质是1,4-丁二醇(1,4-BDO)。1,4-BDO目前是由石化前体(主要是乙炔、马来酸酐和环氧丙烷)生产的。
1,4-BDO也称为BD;1,4-丁二醇;1,4-二羟基丁烷;BDO;丁二醇;和1,4-四亚甲基二醇,且IUPAC名称是丁烷-1,4-二醇。其化学式是C4H10O2。CAS号是110-63-4。
1,4-BDO具有大量的工业应用。例如,1,4-BDO可以用作单体,例如丙烯腈丁二烯苯乙烯(ABS)共聚物和聚氨酯(PU),且可以转化为四氢呋喃,其可用作氨纶纤维(例如聚四亚甲基醚二醇(PTMEG))的原料。
并不知晓任何微生物会产生1,4-BDO。1,4-BDO只能借助新的、工程改造的代谢途径或通过化学合成来生产。参见例如Adkins,J.,"工程改造微生物化工厂以生产可再生的'生物单体'(Engineering microbial chemical factories to produce renewable'biomonomers')",Front.Microbiology(2012)。
本发明人公开了一种利用经遗传修饰的微生物例如甲烷氧化菌(methanotroph)以从CI碳原料生产1,4-BDO的方式。
通过引用纳入
所有发表物、专利或专利申请通过引用纳入本文,就好像将各篇单独的发表物或专利申请具体和单独地通过引用纳入本文那样。如果本文的术语与并入的参考文献中的术语之间存在冲突,则以本文中的术语为准。
发明内容
本文公开了多种经遗传修饰的微生物,其能够从含单个碳的烃分子(如甲烷)起始,产生所需的有机化合物。公开了各种生产所需有机化合物的方法,其包括使用经遗传修饰的微生物。
例如,本文公开了能够将CI碳源转化为多碳产物的经遗传修饰的微生物。可以对经遗传修饰的微生物进行遗传修饰以产生不同的多碳产物,例如1,4-丁二醇。在一些情况下,经遗传修饰的微生物可包含一种或多种异源基因。一种或多种异源基因可以是丙酮酸脱氢酶(aceEF),柠檬酸合酶(gltA),乌头酸水合酶1(acnA)或异柠檬酸脱氢酶(icdA)中的一种或多种。在一些情况下,经遗传修饰的微生物将具有上述所有基因,但是,所述基因中至少一种是微生物内源性的。在一些情况下,这些基因均可与该微生物异源。在一些实施方式中,微生物还可包含来自α-酮戊二酸脱羧酶(kgd),4-羟丁酸脱氢酶(4hbD),4-羟基丁酰-CoA转移酶(Cat2),醛脱氢酶(Aid)或醇脱氢酶(Adh)中的一种或多种基因。这些其它基因可以是一种或多种内源基因或一种或多种异源基因。在其它实施方式中,微生物还可包含来自琥珀酰-CoA合成酶(SucC),CoA依赖性琥珀酸半醛脱氢酶(SucD),4-羟丁酸脱氢酶(4hbD),4-羟基丁酰-CoA转移酶(Cat2),醛脱氢酶(Aid)或醇脱氢酶(Adh)的一种或多种基因。这些其它基因可以是一种或多种内源基因或一种或多种异源基因。在其它实施方式中,所述微生物还可包含来自α-酮戊二酸脱羧酶(kgd),琥珀酰-CoA合成酶(SucC),CoA依赖性琥珀酸半醛脱氢酶(SucD),4-羟丁酸脱氢酶(4hbD),4-羟基丁酰-CoA转移酶(Cat2),醛脱氢酶(Aid)或醇脱氢酶(Adh)的一种或多种基因。这些其它基因可以是一种或多种内源基因或一种或多种异源基因。
本文还公开了一种经遗传修饰的微生物,其具有来自α-酮戊二酸脱羧酶(kgd),4-羟丁酸脱氢酶(4hbD),4-羟基丁酰-CoA转移酶(Cat2),醛脱氢酶(Aid)或醇脱氢酶(Adh)的一个或多个异源基因。在一些情况下,经遗传修饰的微生物将具有所有这些基因,但是,所述基因中至少一种是微生物内源性的。在一些情况下,这些基因均可与该微生物异源。
本文还公开了一种经遗传修饰的微生物,其具有来自琥珀酰CoA合成酶(SucC),CoA依赖性琥珀酸半醛脱氢酶(SucD),4-羟丁酸脱氢酶(4hbD),4-羟基丁酰CoA转移酶(Cat2),醛脱氢酶(Aid)或醇脱氢酶(Adh)的一种或多种异源基因。在一些情况下,经遗传修饰的微生物将具有所有这些基因,但是,所述基因中至少一种是微生物内源性的。在一些情况下,这些基因均可与该微生物异源。
本文还公开了一种经遗传修饰的微生物,其具有来自α-酮戊二酸脱羧酶(kgd),琥珀酰-CoA合成酶(SucC),CoA依赖性琥珀酸半醛脱氢酶(SucD),4-羟丁酸脱氢酶(4hbD),4-羟基丁酰CoA转移酶(Cat2),醛脱氢酶(Aid)或醇脱氢酶(Adh)的一种或多种异源基因。在一些情况下,经遗传修饰的微生物将具有所有这些基因,但是,所述基因中至少一种是微生物内源性的。在一些情况下,这些基因均可与该微生物异源。
在一些情况下,全文中公开的经遗传修饰的微生物还可包含一种或多种基因,其为延胡索酸水合酶(fum)和/或延胡索酸还原酶(frd)。
本文公开的基因可以过表达,包括异源和内源基因。
本文公开的经遗传修饰的微生物能将CI碳转化为多碳产物(例如1,4-BDO),其包含一种或多种异源基因,其中所述异源基因编码可增加从琥珀酸盐或酯(succinate)到1,4-BDO的总碳流量的酶。另外,本文公开的经遗传修饰的微生物能够将CI碳转化为多碳产物(例如1,4-BDO),其包含一种或多种异源基因,其中所述异源基因编码可增加从α-酮戊二酸盐或酯(α-ketoglutarate)到1,4-BDO的总碳流量的酶。本文还公开了一种能够将CI碳转化为多碳产物的遗传修饰微生物,其包含一种或多种异源基因,其中所述异源基因编码可增加从草酰乙酸盐或酯(oxaloacetate)到琥珀酸盐或酯(succinate)的总碳流量的酶。
在一些情况下,遗传修饰的微生物是甲基氧化菌,例如甲烷氧化菌(methanotroph)。甲烷氧化菌可来自多种属,例如甲基杆菌(Methylobacter)、甲基微菌(Methylomicrobium)、甲基单胞菌(Methylomonas)、甲基暖菌(Methylocaldum)、甲基球菌(Methylococcus)、甲基苏玛菌(Methylosoma)、甲基八叠球菌(Methylosarcina)、甲基热菌(Methylothermus)、甲基盐菌(Methylohalobius)、甲基盖亚菌(Methylogaea)、甲基卵菌(Methylovulum)、泉发菌(Crenothrix)、细枝发菌(Clonothrix)、甲基球形菌(Methylosphaera)、甲基帽菌(Methylocapsa)、甲基细胞菌(Methylocella)、甲基弯曲菌(Methylosinus)、甲基孢囊菌(Methylocystis)、甲基阿魏菌(Methyloferula)、甲基海洋菌(Methylomarinum)或甲基嗜酸菌(Methylacidiphilum)。一种可用的种是荚膜甲基球菌(Methylococcus capsulatus)。
本文还公开了载体。载体可包含以下中的任何两种或更多种基因:丙酮酸脱氢酶(aceEF)基因、柠檬酸合酶(gltA)基因、乌头酸水合酶1(acnA)基因、异柠檬酸脱氢酶(icdA)基因、α-酮戊二酸脱羧酶(kgd)基因、琥珀酰-CoA合成酶(sucC)基因、CoA依赖性琥珀酸半醛脱氢酶(sucD)基因、4-羟丁酸脱氢酶(4hbD)基因,4-羟基丁酰-CoA转移酶(cat2)基因,醛脱氢酶(aid)和/或醇脱氢酶(adh)基因。例如,本文公开的载体可包含以下两种或更多种基因:丙酮酸脱氢酶(aceEF)基因、柠檬酸合酶(gltA)基因、乌头酸水合酶1(acnA)基因和异柠檬酸脱氢酶(icdA)基因。本文公开的载体还可包含两种或更多种基因:α-酮戊二酸脱羧酶(kgd)基因、4-羟丁酸脱氢酶(4hbD)基因、4-羟基丁酰-CoA转移酶(cat2)基因、醛脱氢酶(aid)和/或醇脱氢酶(adh)基因。本文公开的载体还可包含两种或更多种基因:琥珀酰-CoA合成酶(sucC)基因,CoA依赖性琥珀酸半醛脱氢酶(sucD)基因,4-羟丁酸脱氢酶(4hbD)基因,4-羟基丁酰-CoA转移酶(cat2)基因,醛脱氢酶(aid)基因和/或醇脱氢酶(adh)基因。在一些情况下,载体可包含延胡索酸水合酶和/或延胡索酸还原酶。
本文进一步公开了分离的多核酸。例如,分离的多核酸可以是与SEQ ID NO.2至少85%相同的核苷酸序列。在一些情况下,所述核苷酸序列可编码具有2-氧戊二酸脱羧酶活性的蛋白质。本文还公开了一种分离的多核酸,其包含与SEQ ID NO.4至少85%相同的核苷酸序列和/或与SEQ ID NO.6至少87%相同的核苷酸序列。所述核苷酸序列可编码具有α-酮戊二酸脱羧酶活性的蛋白质。还公开了分离的多核酸,其包含与SEQ ID NO.8至少86%>相同的核苷酸序列。该核苷酸序列可编码具有2-氧戊二酸脱氢酶E1组分活性的蛋白质。本文进一步公开了分离的多核酸,其包含与SEQ ID NO.10至少79%相同的核苷酸序列。所述核苷酸序列可编码具有氧化还原酶活性的蛋白质。还公开了分离的多核酸,其包含与SEQ IDNO.12或14至少60%相同的核苷酸序列。所述核苷酸序列可编码具有4-羟丁酸脱氢酶活性的蛋白质。本文还公开了一种分离的多核酸,其包含与SEQ ID NO.16至少60%>相同的核苷酸序列;与SEQ ID NO.18至少80%>相同的核苷酸序列;和/或与SEQ ID NO.20至少60%>相同的核苷酸序列。所述核苷酸序列可编码具有4-羟丁酸CoA转移酶活性的蛋白质。本文还公开了分离的多核酸,其包含与SEQ ID NO.22至少60%>相同的核苷酸序列;与SEQ ID NO.24至少84%相同的核苷酸序列;是SEQ ID NO.26的核苷酸序列;与SEQ ID NO.28至少60%>相同的核苷酸序列;与SEQ ID NO.30至少60%>相同的核苷酸序列;与SEQ ID NO.32至少60%>相同的核苷酸序列;和/或与SEQ ID NO.36至少82%)相同的核苷酸序列。所述核苷酸序列可编码具有醛脱氢酶和/或醇脱氢酶活性的蛋白质。本文进一步公开了分离的多核酸,其包含与SEQ ID NO.34至少60%>相同的核苷酸序列。所述核苷酸序列可编码具有ATP依赖性渗透酶活性的蛋白质。本文还公开了分离的多核酸,其包含与SEQ ID NO.38至少86%>相同的核苷酸序列。所述核苷酸序列可编码具有琥珀酰CoA合酶β亚基活性的蛋白质。本文进一步公开了一种分离的多核酸,其包含与SEQ ID NO.40至少86%>相同的核苷酸序列;与SEQ IDNO.42至少60%>相同的核苷酸序列;和/或与SEQ ID NO.44至少81%>相同的核苷酸序列。所述核苷酸序列可编码具有琥珀酰CoA合酶α亚基活性的蛋白质。本文还公开了一种分离的多核酸,其包含与SEQ ID NO.48至少60%>相同的核苷酸序列和/或与SEQ ID NO.50至少60%相同的核苷酸序列。所述核苷酸序列可编码具有延胡索酸水合酶活性的蛋白质。本文还公开了一种分离的多核酸,其包含与SEQ ID NO.52至少83%相同的核苷酸序列;与SEQID NO.54至少84%相同的核苷酸序列;与SEQ ID NO.56至少60%相同的核苷酸序列;和/或与SEQ ID NO.58至少81%相同的核苷酸序列。所述核苷酸序列可编码具有延胡索酸还原酶活性的蛋白质。
本文还公开了一种制备能够将CI碳转化为多碳产物(例如1,4-BDO)的经遗传修饰的微生物的方法,该方法包括使微生物与表达或能够表达来自以下的至少一种异源基因的核酸接触:i)aceEF、ii)lpdA、iii)gltA、iv)acnA、v)icdA、vi)kgd、vii)sucC、viii)sucD、ix)4hbD、x)Cat2、xi)Aid、xii)Adh、xiii)Fum、xiv)Frd,或xv)其任何组合。在一些情况下,可以用至少两种,三种,四种或五种异源基因转化该微生物。
本文还公开了一种制备1,4-BDO的方法,该方法包括,(a)使CI碳与能够将CI碳转化为多碳产物(例如1,4-BDO)的经遗传修饰的微生物接触,其中所述微生物包括至少一种异源基因,所述至少一种异源基因编码:i)aceEF、ii)lpdA、iii)gltA、iv)acnA、v)icdA、vi)kgd、vii)sucC、viii)sucD、ix)4hbD、x)Cat2、xi)Aid、xii)Adh、xiii)Fum、xiv)Frd,或xv)其任何组合;和(b)使该微生物生长以产生所述多碳产物。多碳产物可以是1,4-BDO。在一些情况下,生长的微生物可以补充有外源性GHB和/或外源性α-酮戊二酸盐或酯(α-ketoglutarate)和/或外源性琥珀酸盐或酯(succinate)。在产生多碳产物(例如1,4-BDO)之后,可以回收该多碳产物。
在一些情况下,贯穿本文所述的微生物可经发酵或培养至少96小时。
产生的多碳产物(例如1,4-BDO)可以进一步加工成其它有用的产物,例如四氢呋喃(THF)。由本文公开的方法所制得的1,4-BDO可被转化为THF,通过将该1,4-BDO与催化剂接触以生产THF。1,4-BDO可被分离,然后使其与催化剂接触以形成THF。所使用的催化剂可以是酸催化剂,氧化铝催化剂,二氧化硅-氧化铝催化剂,氧化铝负载的氧化钨催化剂,杂多酸催化剂或硫酸锆催化剂。通过该方法生产的THF可以是基本上纯的,并且该方法还可以包括回收THF。回收的THF也可经进一步加工。
由本文所述方法产生的多碳产物(例如1,4-BDO)也可进一步加工成化学品,例如聚氨酯。由本文所述方法制备的1,4-BDO可通过将1,4-BDO与二羧酸/酸酐缩合而转化为聚氨酯。在与二羧酸/酸酐缩合之前,可以将1,4-BDO分离。在一些情况下,二羧酸/酸酐可以是脂族或芳族的。产生的聚氨酯可以是基本上纯的。通过这种方法生产的聚氨酯可被回收并任选地进一步加工。
由本文所述的方法产生的多碳产物(例如1,4-BDO)也可经进一步加工成化学品,例如聚对苯二酸丁二醇酯(PBT)。由本文所述的方法制得的1,4-BDO可通过1,4-BDO的酯交换转化为PBT。可以在酯交换反应之前分离1,4-BDO。在一些情况下,可以通过使1,4-BDO与对苯二酸二甲酯(DMT)接触来进行酯交换反应。产生的PBT可以是基本上纯的。通过该方法生产的PBT可经回收并任选地进行进一步加工。
本文还公开了一种经遗传修饰的微生物,其能够将CI碳源转化为多碳产物(例如1,4-BDO),所述经遗传修饰的微生物包含一个或多个异源基因,其中所述一个或多个异源基因来自于以下组中之一或多个:第1组:丙酮酸脱氢酶(aceEF),柠檬酸合酶(gltA),乌头酸水合酶1(acnA),异柠檬酸脱氢酶(icdA);延胡索酸水合酶(fum);和/或延胡索酸还原酶(fird);第2组:α-酮戊二酸脱羧酶(kgd),4-羟丁酸脱氢酶(4hbD),4-羟基丁酰-CoA转移酶(Cat2),醛脱氢酶(Aid)和/或醇脱氢酶(Adh);或第3组:琥珀酰CoA合成酶(SucC),CoA依赖性琥珀酸半醛脱氢酶(SucD),4-羟丁酸脱氢酶(4hbD),4-羟基丁酰CoA转移酶(Cat2),醛脱氢酶(Aid)和/或醇脱氢酶(Adh)。异源基因可以过表达。在一些情况下,所述基因或基因的组中一个或多个对于所述微生物而言可以是内源的。例如,在一种情况下,第1组中的一个或多个基因可以是异源的,并且该微生物包含属于第2组,第3组或第2和3组的内源基因。在另一种情况下,来自第2组的一个或多个基因可以是异源的,并且该微生物包含属于第1组,第3组或第1和3组的内源基因。在另一个示例中,来自第3组的一个或多个基因可以是异源的,并且该微生物包含属于第1组,第2组或第1和2组的内源基因。在另一个示例中,来自第1和2组的一个或多个基因可以是异源的,而来自第3组的一个或多个基因可以是内源的。在其它情况下,来自第1和3组的一个或多个基因可以是异源的,其中来自第2组的一个或多个基因可以是内源的。在其它情况下,来自第1、2和3组的一个或多个基因可以是异源的。即使存在来自任何组的一个或多个异源基因,这并不意味着该微生物不包含来自同一组的内源基因。例如,微生物可以同时具有来自第1组的异源和内源基因。
本文还公开了制备琥珀酸盐或酯的方法,该方法包括:(a)使CI碳与经遗传修饰的微生物接触,其中所述经遗传修饰的微生物包含异源延胡索酸水合酶,延胡索酸还原酶或其任意组合;和(b)使所述经遗传修饰的微生物生长以产生琥珀酸盐或酯。在一些情况下,经遗传修饰的微生物可包含丙酮酸脱氢酶(aceEF),柠檬酸合酶(gltA),乌头酸水合酶1(acnA)和/或异柠檬酸脱氢酶(icdA)。在一些情况下,来自(b)的琥珀酸盐或酯是分离的。在一些情况下,琥珀酸盐或酯转化为1,4-BDO。
在一些情况下,经遗传修饰的微生物生长至少96小时。
附图简要说明
所附权利要求书中具体说明了本发明的新特征。可参考以下详述更好地理解本发明的特征和优点,这些详述列出利用本发明原理的说明性实施方式和附图:
图1显示了从甲烷(CH4)到1,4-BDO的代谢途径。圆圈部分显示了从丙酮酸盐或酯到α-酮戊二酸盐或酯的途径,这对于α-酮戊二酸盐或酯到1,4-BDO途径和琥珀酸盐或酯到1,4-BDO途径都是共同的。负责将丙酮酸盐或酯转化为α-酮戊二酸盐或酯的酶的组在全文中称为第1组。第1组包含至少以下酶:丙酮酸脱氢酶(aceEF),柠檬酸合酶(gltA),乌头酸水合酶1(acnA)和异柠檬酸脱氢酶(icdA)。
图2显示了α-酮戊二酸盐或酯到1,4-BDO的途径,α-酮戊二酸盐或酯通过α-酮戊二酸脱羧酶(kgd)转化为琥珀酸半醛。然后,琥珀酸半醛通过4-羟丁酸脱氢酶(4hbD)转化为γ-羟丁酸盐或酯(GUB)。然后,GUB通过4-羟丁酸CoA转移酶(cat2)转化为4-羟基丁酰CoA。然后,4-羟基丁酰CoA由醛脱氢酶(Aid)通过利用NAD(P)H转化为4-羟基丁醛。通过利用NAD(P)H,醇脱氢酶将4-羟基丁醛转化为1,4-BDO。负责将α-酮戊二酸盐或酯转化为1,4-BDO的酶的组在全文中称为第2组。
图3显示了琥珀酸盐或酯到1,4-BDO的途径。琥珀酸盐或酯通过琥珀酰CoA合成酶β亚基(sucC)转化为琥珀酰CoA。然后,琥珀酰CoA合成酶α亚基(sucD)将琥珀酰CoA转化为琥珀酸半醛。然后通过利用4-羟丁酸脱氢酶(4hbD)将琥珀酸半醛转化为γ-羟丁酸盐或酯(ghb)。然后,GHB通过4-羟丁酸CoA转移酶(cat2)转化为4-羟基丁酰CoA。然后,4-羟基丁酰CoA由醛脱氢酶(aid)通过利用NAD(P)H转化为4-羟基丁醛。通过利用NAD(P)H,醇脱氢酶将4-羟基丁醛转化为1,4-BDO。负责将琥珀酸盐或酯转化为1,4-BDO的酶的组在全文中称为第3组。
图4显示了由菌株XZ76产生1,4-BDO。当补充400mg/L的α-酮戊二酸盐或酯和50mg/L的GHB时,菌株XZ76会产生超过100C^g/L的1,4-BDO。仅向培养基补充400mg/L的α-酮戊二酸盐或酯产生约10C^g/L的1,4-BDO,而没有补充则不会产生任何1,4-BDO。
图5显示了来自过表达丙酮酸脱氢酶(aceEF),柠檬酸合酶(gltA),乌头酸水合酶1(acnA)或异柠檬酸脱氢酶(icdA)的不同菌株的α-酮戊二酸盐或酯生产。icdA的过表达导致α-酮戊二酸盐或酯产量的大幅增加。
图6显示了由两种顶级(top)菌株XZ79和XZ344在有或没有α-酮戊二酸盐或酯或琥珀酸盐或酯存在(统称为“供给”)的情况下的1,4-BDO生产。XZ79和XZ344在摇瓶实验中均能直接从甲烷产生可检测的1,4BDO。XZ79和XZ344均直接从甲烷产生可检测量的1,4BDO,而向培养基中补充供给则可提高1,4BDO的生产力。
图7显示了从甲烷(CH4)到1,4-BDO的代谢途径。带圆圈的部分显示了从草酰乙酸盐或酯和苹果酰-CoA(malyl-CoA)到琥珀酸盐或酯的途径,其中该转化由延胡索酸水合酶(fum)和延胡索酸还原酶(frd)部分促进。
图8显示了在不同启动子的控制下表达Frd基因的甲烷氧化菌。MBC1960菌株在pmxaF启动子的控制下表达异源大肠杆菌FrdA,FrdB,FrdC和FrdD。MBC1970菌株表达相同的基因,不过它们受J23 111启动子控制,而MBC1985表达受J23 100启动子控制的基因。MBC1970和MBC1985菌株比其亲本对照菌株产生显著更多的琥珀酸盐或酯。
发明详述
以下描述和实施例详细说明了本发明的实施方式。应理解,本发明不限于本文所述的特定实施方式,因此可以改变。本领域技术人员将认识到,本发明有许多变化和修改形式,它们都包含在本发明范围内。
1,4-BDO是一种高价值化学品,目前主要从石油来源生产。然而,近年来,人们对通过发酵生产1,4-BDO感兴趣。发酵通常涉及获取碳源(通常为糖)并利用能够将碳源转化为所需产物的微生物将其发酵。
通过发酵生产化学品(例如1,4-BDO)的成本通常取决于所用碳源的成本。糖通常是成本较高的碳源,也会导致食物供应减少。目前,极具成本效益且资源丰富的一种碳源是天然气。天然气中碳的主要来源是甲烷,一种CI碳。通过使用廉价的碳源如甲烷,可经济地生产1,4-BDO。然而,挑战在于工程化发酵方法和微生物,以利用发酵过程将廉价的碳源(例如甲烷)高效地转化为1,4-BDO。
如上所述,已知没有任何微生物天然产生1,4-BDO。因此,需要严格而广泛的遗传工程改造来生产1,4-BDO。
本文描述了可以将CI碳底物(例如甲烷)转化为所需产物的经遗传修饰的微生物,例如甲基氧化菌,例如甲烷氧化菌。本文公开的一些经遗传修饰的微生物已经设计和改变以高效地产生1,4-BDO,比预期产生数倍更多。例如,通常不会产生1,4-BDO的甲烷氧化菌可经遗传工程改造以高效地产生大量的1,4-BDO。另外,本文公开的一些经遗传修饰的微生物可用于将CI碳底物转化为1,4-BDO,然后转化为聚氨酯,四氢呋喃(THF),聚对苯二酸丁二醇酯(PBT)或其它所需产物。这些经遗传修饰的微生物和发酵新方法及其应用描述于本文中。
定义
与本文所用的参考数值相关的术语“约”及其语法等同形式可包括数值本身和从该数值加上或减去10%的值的范围。例如,“约10”的量包括10和9-11的任何量。例如,与参考数值相关的术语“约”还可以包括由该值加或减10%,9%,8%,7%,6%,5%,4%,3%,2%或1%的值的范围。在某些情况下,即使没有特别提及术语“约”,贯穿本公开所用的数值也可以是“约”该数值。
本文使用的术语“遗传修饰”或“经遗传修饰的”及其语法等同形式可指核酸(例如微生物基因组内的核酸)的一种或多种改变。例如,遗传修饰可指核酸的改变、添加和/或缺失(例如,整个基因或基因片段)。
本文使用的术语“破坏”及其语法等同形式可指(例如通过缺失、插入、突变、重排或其任何组合)改变基因的过程。例如,基因可以被敲除破坏。破坏基因可以部分减少或完全抑制基因的表达(例如,mRNA和/或蛋白质表达)。破坏还可以包括抑制技术,例如shRNA,siRNA,微小RNA,显性失活或抑制基因或蛋白质的功能或表达的任何其它手段。
本文使用的术语“基因编辑”及其语法等同形式可指基因工程,其中一个或多个核苷酸被插入、替换或从基因组中移除。例如,可使用核酸酶(例如,天然存在的核酸酶或人工工程化的核酸酶)进行基因编辑。
本文使用的术语“和/或”及“其任何组合”及其语法等同形式可以互换使用。这些术语可表达任何组合均是特别考虑的。仅出于说明性目的,以下短语“A、B和/或C”或“A、B、C或其任何组合”可以表示“单独的A;单独的B;单独的C;A和B;B和C;A和C;和,A、B和C”。
本文所用的术语“基本上纯的”及其语法等同形式可指不含大部分另一种物质的特定物质。例如,“基本上纯的1,4-BDO”可以表示至少90%的1,4-BDO。在某些情况下,“基本上纯的1,4-BDO”可表示至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%、99.99%、99.999%或99.9999%的1,4-BDO。例如,基本上纯的1,4-BDO可表示至少70%的1,4-BDO。在一些情况下,基本上纯的1,4-BDO可以表示至少75%的1,4-BDO。在一些情况下,基本上纯的1,4-BDO可以表示至少80%的1,4-BDO。在一些情况下,基本上纯的1,4-BDO可以表示至少85%的1,4-BDO。在一些情况下,基本上纯的1,4-BDO可以表示至少90%的1,4-BDO。在一些情况下,基本上纯的1,4-BDO可以表示至少91%的1,4-BDO。在一些情况下,基本上纯的1,4-BDO可以表示至少92%的1,4-BDO。在一些情况下,基本上纯的1,4-BDO可以表示至少93%的1,4-BDO。在一些情况下,基本上纯的1,4-BDO可以表示至少94%的1,4-BDO。在一些情况下,基本上纯的1,4-BDO可以表示至少95%的1,4-BDO。在一些情况下,基本上纯的1,4-BDO可以表示至少96%)的1,4-BDO。在一些情况下,基本上纯的1,4-BDO可以表示至少97%的1,4-BDO。在一些情况下,基本上纯的1,4-BDO可以表示至少98%的1,4-BDO。在一些情况下,基本上纯的1,4-BDO可以表示至少99%的1,4-BDO。
如本文中所使用的,术语“异源的”及其语法等同形式可表示“源自不同物种”。例如,“异源基因”可以意指来自不同物种的基因。在一些情况下,“含有异源基因的甲烷氧化菌”可以表示该甲烷氧化菌含有不来自相同甲烷氧化菌的基因。该基因可以来自不同的微生物,例如酵母,或来自不同的物种,例如不同的甲烷氧化菌菌种。
在本文中参照另一序列所用的术语“基本上相似”及其语法等同形式可表示至少50%相同。在一些情况下,术语“基本上相似”是指55%相同的序列。在一些情况下,术语“基本上相似”是指60%相同的序列。在一些情况下,术语“基本上相似”是指65%相同的序列。在一些情况下,术语“基本上相似”是指70%相同的序列。在一些情况下,术语“基本上相似”是指75%)相同的序列。在一些情况下,术语“基本上相似”是指80%)相同的序列。在其它情况下,术语“基本上相似”是指81%相同的序列。在其它情况下,术语“基本上相似”是指82%相同的序列。在其它情况下,术语“基本上相似”是指83%相同的序列。在其它情况下,术语“基本上相似”是指84%相同的序列。在其它情况下,术语“基本上相似”是指85%相同的序列。在其它情况下,术语“基本上相似”是指86%相同的序列。在其它情况下,术语“基本上相似”是指87%相同的序列。在其它情况下,术语“基本上相似”是指88%相同的序列。在其它情况下,术语“基本上相似”是指89%相同的序列。在其它情况下,术语“基本上相似”是指90%相同的序列。在其它情况下,术语“基本上相似”是指91%相同的序列。在其它情况下,术语“基本上相似”是指92%相同的序列。在其它情况下,术语“基本上相似”是指93%相同的序列。在其它情况下,术语“基本上相似”是指94%相同的序列。在其它情况下,术语“基本上相似”是指95%相同的序列。在其它情况下,术语“基本上相似”是指96%相同的序列。在其它情况下,术语“基本上相似”是指97%相同的序列。在其它情况下,术语“基本上相似”是指98%相同的序列。在其它情况下,术语“基本上相似”是指99%相同的序列。在其它情况下,术语“基本上相似”是指100%相同的序列。为了确定两个序列之间的相同性百分比,使用例如Needleman和Wunsch(J.Mol.Biol.,1970,48:443)的比对方法(由Smith和Waterman(Adv.Appl.Math.,1981,2:482)修订)来比对两个序列,从而在两个序列之间获得最高级匹配,并确定两个序列之间的相同氨基酸/核苷酸的数目。例如,计算两个氨基酸序列之间的百分比相同性的方法通常是本领域公认的,包括例如Carillo和Lipton(SIAM J.AppliedMath.,1988,48:1073)中描述的那些,和《计算分子生物学(Computational MolecularBiology)》,Lesk编,牛津大学出版社,纽约,1988,生物计算:信息学和基因组学项目(Biocomputing:Informatics and Genomics Projects)中描述的那些。通常,使用计算机程序进行这种计算。可以在这方面使用的计算机程序包括但不限于GCG(Devereux等,Nucleic Acids Res.,1984,12:387)BLASTP、BLASTN和FASTA(Altschul等,J.Molec.Biol.,1990:215:403)。用于确定两种多肽之间的百分比相同性的特别优选的方法涉及Clustal W算法(Thompson,J D,Higgines,D G和Gibson T J,1994,Nucleic Acid Res 22(22):4673-4680以及BLOSUM 62评分矩阵(Henikoff S和Henikoff,J G,1992,Proc.Natl.Acad.Sci.USA 89:10915-10919),采用10的空位开放罚分和0.1的空位延伸罚分,从而在两个序列之间获得最高级匹配,其中两个序列之一的总长度的至少50%参与比对。
本文所用的术语“C1碳”或“C1碳底物”及其语法等同形式可互换使用,并且可表示任何包含单个碳原子的有机化合物。实例可以包括但不限于CO,CH4和/或CO2
I.经遗传修饰的微生物及其制备方法
已知没有任何生物体能天然产生1,4-BDO。但是,本申请公开了可以产生1,4-BDO并且可以高水平产生1,4-BDO的经遗传修饰的微生物。例如,本文公开的是不天然产生1,4-BDO但可以被遗传修饰以合成1,4-BDO的微生物,包括在商业上可行的水平。
微生物
本文所述的微生物可从CI碳底物(例如但不限于CO,CO2和CH4)产生多碳产物。但是,这并不意味着这些微生物仅使用CI碳。可以使本文公开的某些微生物利用其它碳底物,包括该微生物自然使用的除其它碳底物以外的碳底物。
本文公开的微生物可以是原核生物或真核生物。此外,可使用其它微生物,例如细菌、酵母或藻类。
一些微生物可使用CI碳来生成所需的产物。例如,可以将CI碳底物转化成所需产物的微生物中的一些可以是能够利用天然气作为碳底物的微生物。在一些情况下,微生物可利用天然气中所含的甲烷作为碳源来生产所需的产物。使用CI碳底物形成所需有机化合物的一种类型的微生物是甲基氧化菌,例如甲烷氧化菌。特别有用的甲烷氧化菌可包括来自以下属的甲烷氧化菌:甲基杆菌(Methylobacter)、甲基微菌(Methylomicrobium),甲基单胞菌(Methylomonas),甲基暖菌(Methylocaldum),甲基球菌(Methylococcus),甲基苏玛菌(Methylosoma),甲基八叠球菌(Methylosarcina),甲基热菌(Methylothermus),甲基盐菌(Methylohalobius),甲基盖亚菌(Methylogaea),甲基卵菌(Methylovulum),泉发菌(Crenothrix),细枝发菌(Clonothrix),甲基球形菌(Methylosphaera),甲基帽菌(Methylocapsa),甲基细胞菌(Methylocella),甲基弯曲菌(Methylosinus),甲基孢囊菌(Methylocystis),甲基阿魏菌(Methyloferula),甲基海洋菌(Methylomarinum)或甲基嗜酸菌(Methyloacidophilum),或其任何组合。来自甲基球菌属的甲烷氧化菌可能特别有用。当使用来自甲基球菌属的甲烷氧化菌时,可使用来自荚膜甲基球菌(Methylococcuscapsulatus)种的甲烷氧化菌。
一些微生物是能够利用CO2作为碳底物的微生物。例如,微生物可以是产甲烷菌(methanogen)。能够利用CO2作为底物的微生物可含有叶绿素。利用CO2形成所需有机化合物的一种微生物是藻类。可利用CO2作为底物的另一种微生物是蓝细菌(cyanobacterium)。
可以将CI碳底物转化为所需产物的某些微生物可以是能够将CO用作碳底物的微生物。厌氧微生物通常可以处理CO,因此可以在本文中使用。一种利用CO形成所需有机化合物的微生物是细菌,例如梭菌(Clostridium)。这些微生物可以被遗传修饰以生成大量的1,4-BDO。
为了遗传工程改造某些微生物以产生某些有用的产物,例如1,4-BDO,可用编码特定酶的一种或多种基因转化微生物。这些基因可以与该微生物异源。
还设想本文公开的任何和所有基因都可以过表达。这可以导致基因的过表达,但是也导致实际多肽水平的增加。例如,当微生物或载体包含基因(例如,异源基因)时,该基因可以过表达。通常通过使用高度表达的启动子或插入基因的多个拷贝来完成此操作。
例如,经遗传修饰的微生物可包含编码能够催化以下反应中一种或多种的酶的一种或多种核酸:i)甲烷到甲醇;ii)甲醇到甲醛;iii)甲醛到丙酮酸;iv)丙酮酸到乙酰CoA;v)乙酰CoA到柠檬酸盐或酯;vi)柠檬酸盐或酯到异柠檬酸盐或酯;vii)异柠檬酸盐或酯到α-酮戊二酸盐或酯;viii)α-酮戊二酸盐或酯到琥珀酰CoA;ix)琥珀酸CoA到琥珀酸盐或酯;x)草酰乙酸盐或酯和/或苹果酰CoA到L-苹果酸盐或酯;xi)L-苹果酸盐或酯到延胡索酸盐或酯;和/或xii)延胡索酸盐或酯到琥珀酸盐或酯。例如,经遗传修饰的微生物可包含一种或多种基因,包括但不限于:丙酮酸脱氢酶(aceEF),柠檬酸合酶(gltA),乌头酸水合酶1(acnA)和异柠檬酸脱氢酶(icdA),α-酮戊二酸脱氢酶,琥珀酰CoA合成酶;延胡索酸水合酶(fum);延胡索酸还原酶(frd);或其任何组合。取决于所用的底物,该途径的任何产物可以通过增加或减少促进所需产物形成的酶的表达来制备。一些核酸对于微生物而言可以是内源的,而一些核酸对于微生物来说可以是异源的。
此外,为了产生可以产生多碳产物(例如1,4-BDO)的微生物,可以将一种或多种基因(例如异源基因)(瞬时地或稳定地)转化/转染(即插入)到微生物中。可使用以下任一组中的至少一种基因来以高效水平产生多碳底物例如1,4-BDO:i)第2组:酮戊二酸盐或酯到1,4-BDO(参见例如图2),和ii)第3组:琥珀酸盐或酯到1,4-BDO途径(参见例如图3)。可以将包含来自所述一个或两个途径的一种或多种基因的微生物置于微生物内部,以产生多碳底物,例如1,4-BDO。例如,可使用来自第2组的基因(α-酮戊二酸盐或酯到1,4-BDO途径),以从微生物生产多碳底物,例如1,4-BDO。或者,可使用来自第3组的基因(琥珀酸盐或酯到1,4-BDO途径),以从微生物产生多碳底物,例如1,4-BDO。从微生物生产多碳底物(例如1,4-BDO)的另一种方法可以是表达第2组(α-酮戊二酸盐或酯到1,4-BDO途径)和第3组(琥珀酸盐或酯到1,4-BDO途径)的一种或多种基因。在一些情况下,可使用第2组的所有基因。在其它情况下,可使用第3组的所有基因。在其它情况下,可使用第2组和第3组的所有基因。在一些情况下,微生物可包含延胡索酸水合酶(fum)和/或延胡索酸还原酶(frd)。在一些情况下,这些组中的某些基因可以是内源基因。
在一些情况下,当微生物利用α-酮戊二酸盐或酯到1,4-BDO途径时,微生物可包含α-酮戊二酸脱羧酶(kgd),其是能够将α-酮戊二酸盐或酯转化为琥珀酸半醛的酶。在一些情况下,微生物可包含4-羟丁酸脱氢酶(4hbD),其是将琥珀酸半醛转化为γ-羟丁酸盐或酯(GUB)的酶。在一些情况下,微生物可包含4-羟丁酸CoA转移酶(cat2),其是将γ-羟丁酸盐或酯(GUB)转化为4-羟基丁酰CoA的酶。在一些情况下,微生物可包含醛脱氢酶(aid),其是将4-羟基丁酰CoA转化为4-羟基丁醛的酶。在一些情况下,微生物可包含醇脱氢酶(adh),其是将4-羟基丁醛转化为1,4-BDO的酶。在一些情况下,可使用从α-酮戊二酸盐或酯到1,4-BDO途径的所有酶。这些酶中的一种或多种可以是微生物内源的。
本文描述的是用于从CI碳(例如甲烷)制造多碳产物(例如1,4-BDO)的微生物。在一些情况下,本文的微生物可以用编码以下一种或多种的基因转化:i)α-酮戊二酸脱羧酶(kgd);ii)4-羟丁酸脱氢酶(4hbD);iii)4-羟丁酸CoA转移酶(cat2);(iv)醛脱氢酶(aid);(v)醇脱氢酶(adh);或(vi)其任何组合。这些基因可以与该微生物异源。所述基因还可编码可以进行如上所述的化学转化的酶。例如,醛脱氢酶(Aid)可以是将4-羟基丁酰CoA转化为4-羟基丁醛的酶,而醇脱氢酶(adh)可以是将4-羟基丁醛转化成1,4-BDO的酶。
在一些情况下,微生物可包含延胡索酸水合酶(fum),其是将L-苹果酸盐或酯转化为延胡索酸盐或酯的酶。在一些情况下,微生物可包含延胡索酸还原酶(frd),其是将延胡索酸盐或酯转化为琥珀酸盐或酯的酶。
当使用α-酮戊二酸脱羧酶(kgd)时,α-酮戊二酸脱羧酶可以来自细菌(例如,革兰氏阳性细菌或既非革兰氏阳性也非革兰氏阴性的细菌),例如来自分枝杆菌(Mycobacterium)属,棒状杆菌(Corynebacterium)属和/或红球菌(Rhodococcus)属。例如,α-酮戊二酸脱羧酶(kgd)可来自牛分枝杆菌(Mycobacterium bovis),结核分枝杆菌(Mycobacterium tuberculosis),解萜烯棒杆菌(Corynebacterium terpenotabidum)和/或久提红球菌(Rhbodococcus jostii)种。
α-酮戊二酸脱羧酶(kgd)可包含与SEQ ID NO.1、3、5或7中任一者基本相似的氨基酸序列。例如,α-酮戊二酸脱羧酶可包含与SEQ ID NO.1、3、5或7中任一者至少60%相同的氨基酸序列。例如,α-酮戊二酸脱羧酶可包含与SEQ ID NO.1、3、5或7中任一者至少65%相同的氨基酸序列。例如,α-酮戊二酸脱羧酶可包含与SEQ ID NO.1、3、5或7中任一者至少70%相同的氨基酸序列。例如,α-酮戊二酸脱羧酶可包含与SEQ ID NO.1、3、5或7中任一者至少75%相同的氨基酸序列。例如,α-酮戊二酸脱羧酶可包含与SEQ ID NO.1、3、5或7中任一者至少80%相同的氨基酸序列。例如,α-酮戊二酸脱羧酶可包含与SEQ ID NO.1、3、5或7中任一者至少85%>相同的氨基酸序列。在一些情况中,α-酮戊二酸脱羧酶可包含与SEQ IDNO.1、3、5或7中任一者至少90%>相同的氨基酸序列。在一些情况中,α-酮戊二酸脱羧酶可包含与SEQ ID NO.1、3、5或7中任一者至少91%>相同的氨基酸序列。在一些情况中,α-酮戊二酸脱羧酶可包含与SEQ ID NO.1、3、5或7中任一者至少92%>相同的氨基酸序列。在一些情况中,α-酮戊二酸脱羧酶可包含与SEQ ID NO.1、3、5或7中任一者至少93%相同的氨基酸序列。在一些情况中,α-酮戊二酸脱羧酶可包含与SEQ ID NO.1、3、5或7中任一者至少94%相同的氨基酸序列。在一些情况中,α-酮戊二酸脱羧酶可包含与SEQ ID NO.1、3、5或7中任一者至少95%相同的氨基酸序列。在一些情况中,α-酮戊二酸脱羧酶可包含与SEQ IDNO.1、3、5或7中任一者至少96%相同的氨基酸序列。在一些情况中,α-酮戊二酸脱羧酶可包含与SEQ ID NO.1、3、5或7中任一者至少97%相同的氨基酸序列。例如,α-酮戊二酸脱羧酶可包含与SEQ ID NO.1、3、5或7中任一者至少98%)相同的氨基酸序列。在一些情况中,α-酮戊二酸脱羧酶可包含与SEQ ID NO.1、3、5或7中任一者至少99%相同的氨基酸序列。在一些情况中,α-酮戊二酸脱羧酶可包含氨基酸序列,该氨基酸序列为SEQ ID NO.1、3、5或7中任一者。
当期望使用4-羟丁酸脱氢酶(4hbD)时,4-羟丁酸脱氢酶可来自细菌(例如革兰氏阴性或阳性细菌),例如来自埃希氏杆菌(Escherichia)属,卟啉单胞菌(Porphyromonas)属和/或梭菌(Clostridium)属。例如,4-羟丁酸脱氢酶可来自大肠杆菌(Escherichia coli),齿龈卟啉单胞菌(Porphyromonas gingivalis)和/或克鲁维氏梭菌(Clostridiumkluyveri)种。
4-羟丁酸脱氢酶可包含与SEQ ID NO.11或13基本相似的氨基酸序列。例如,4-羟丁酸脱氢酶可包含与SEQ ID NO.11或13至少60%相同的氨基酸序列。例如,4-羟丁酸脱氢酶可包含与SEQ ID NO.11或13至少65%)相同的氨基酸序列。在一些情况中,4-羟丁酸脱氢酶可包含与SEQ ID NO.11或13至少70%相同的氨基酸序列。例如,4-羟丁酸脱氢酶可包含与SEQ ID NO.11或13至少75%)相同的氨基酸序列。在一些情况中,4-羟丁酸脱氢酶可包含与SEQ ID NO.11或13至少80%相同的氨基酸序列。例如,4-羟丁酸脱氢酶可包含与SEQ IDNO.11或13至少85%)相同的氨基酸序列。在一些情况中,4-羟丁酸脱氢酶可包含与SEQ IDNO.11或13至少90%相同的氨基酸序列。在一些情况中,4-羟丁酸脱氢酶可包含与SEQ IDNO.11或13至少91%)相同的氨基酸序列。在一些情况中,4-羟丁酸脱氢酶可包含与SEQ IDNO.11或13至少92%相同的氨基酸序列。在一些情况中,4-羟丁酸脱氢酶可包含与SEQ IDNO.11或13至少93%相同的氨基酸序列。在一些情况中,4-羟丁酸脱氢酶可包含与SEQ IDNO.11或13至少94%相同的氨基酸序列。在一些情况中,4-羟丁酸脱氢酶可包含与SEQ IDNO.11或13至少95%相同的氨基酸序列。在一些情况中,4-羟丁酸脱氢酶可包含与SEQ IDNO.11或13至少96%相同的氨基酸序列。在一些情况中,4-羟丁酸脱氢酶可包含与SEQ IDNO.11或13至少97%)相同的氨基酸序列。在一些情况中,4-羟丁酸脱氢酶可包含与SEQ IDNO.11或13至少98%相同的氨基酸序列。在一些情况中,4-羟丁酸脱氢酶可包含与SEQ IDNO.11或13至少99%)相同的氨基酸序列。在一些情况中,4-羟丁酸脱氢酶可包含氨基酸序列,该氨基酸序列是SEQ ID NO.11或13。
当期望使用4-羟丁酸CoA转移酶(Cat2)时,4-羟丁酸CoA转移酶可来自细菌(例如革兰氏阴性或阳性细菌),例如来自卟啉单胞菌(Porphyromonas)属和/或梭菌(Clostridium)属。例如,4-羟丁酸CoA转移酶可以来自齿龈卟啉单胞菌(Porphyromonasgingivalis)和/或丙酮丁醇梭菌(Clostridium acetobutylicum)种。
4-羟丁酸CoA转移酶可包含与SEQ ID NO.15、17或19中任一者基本相似的氨基酸序列。例如,4-羟丁酸CoA转移酶可包含与SEQ ID NO.15、17或19中任一者至少60%>相同的氨基酸序列。例如,4-羟丁酸CoA转移酶可包含与SEQ ID NO.15、17或19中任一者至少65%>相同的氨基酸序列。在一些情况中,4-羟丁酸CoA转移酶可包含与SEQ ID NO.15、17或19中任一者至少70%)相同的氨基酸序列。例如,4-羟丁酸CoA转移酶可包含与SEQ ID NO.15、17或19中任一者至少75%相同的氨基酸序列。在一些情况中,4-羟丁酸CoA转移酶可包含与SEQ ID NO.15、17或19中任一者至少80%>相同的氨基酸序列。例如,4-羟丁酸CoA转移酶可包含与SEQ ID NO.15、17或19中任一者至少85%>相同的氨基酸序列。在一些情况中,4-羟丁酸CoA转移酶可包含与SEQ ID NO.15、17或19中任一者至少90%相同的氨基酸序列。在一些情况中,4-羟丁酸CoA转移酶可包含与SEQ ID NO.15、17或19中任一者至少91%相同的氨基酸序列。在一些情况中,4-羟丁酸CoA转移酶可包含与SEQ ID NO.15、17或19中任一者至少92%相同的氨基酸序列。在一些情况中,4-羟丁酸CoA转移酶可包含与SEQ ID NO.15、17或19中任一者至少93%相同的氨基酸序列。在一些情况中,4-羟丁酸CoA转移酶可包含与SEQ ID NO.15、17或19中任一者至少94%相同的氨基酸序列。在一些情况中,4-羟丁酸CoA转移酶可包含与SEQ ID NO.15、17或19中任一者至少95%相同的氨基酸序列。在一些情况中,4-羟丁酸CoA转移酶可包含与SEQ ID NO.15、17或19中任一者至少96%相同的氨基酸序列。在一些情况中,4-羟丁酸CoA转移酶可包含与SEQ ID NO.15、17或19中任一者至少97%相同的氨基酸序列。在一些情况中,4-羟丁酸CoA转移酶可包含与SEQ ID NO.15、17或19中任一者至少98%相同的氨基酸序列。在一些情况中,4-羟丁酸CoA转移酶可包含与SEQ IDNO.15、17或19中任一者至少99%相同的氨基酸序列。在一些情况中,4-羟丁酸CoA转移酶可包含氨基酸序列,该氨基酸序列为SEQ ID NO.15、17或19中任一者。
当需要使用醛脱氢酶(Aid)和/或醇脱氢酶(Adh)时,醛脱氢酶和/或醇脱氢酶可来自细菌(例如革兰氏阴性或阳性细菌),例如来自埃希氏杆菌属,不动杆菌(Acinetobacter)属,卟啉单胞菌属和/或梭菌属,或来自酵母,例如来自酵母(Saccharomyces)属。例如,4-羟丁酸CoA转移酶可来自大肠杆菌,百利不动杆菌(Acinetobacter baylyi),齿龈卟啉单胞菌,丙酮丁醇梭菌和/或酿酒酵母(Saccharomyces cerevisiae)。在一些情况下,可使用多于一种的醛脱氢酶和/或醇脱氢酶。
醛脱氢酶和/或醇脱氢酶可包含与SEQ ID NO.21、23、25、27、29、31、33或35中任一者基本相似的氨基酸序列。例如,醛脱氢酶和/或醇脱氢酶可包含与SEQ ID NO.21、23、25、27、29、31、33或35中任一者至少60%相同的氨基酸序列。例如,醛脱氢酶和/或醇脱氢酶可包含与SEQ ID NO.21、23、25、27、29、31、33或35中任一者至少65%相同的氨基酸序列。在一些情况中,醛脱氢酶和/或醇脱氢酶可包含与SEQ ID NO.21、23、25、27、29、31、33或35中任一者至少70%相同的氨基酸序列。例如,醛脱氢酶和/或醇脱氢酶可包含与SEQ ID NO.21、23、25、27、29、31、33或35中任一者至少75%相同的氨基酸序列。在一些情况中,醛脱氢酶和/或醇脱氢酶可包含与SEQ ID NO.21、23、25、27、29、31、33或35中任一者至少80%相同的氨基酸序列。例如,醛脱氢酶和/或醇脱氢酶可包含与SEQ ID NO.21、23、25、27、29、31、33或35中任一者至少85%相同的氨基酸序列。在一些情况中,醛脱氢酶和/或醇脱氢酶可包含与SEQ ID NO.21、23、25、27、29、31、33或35中任一者至少90%相同的氨基酸序列。在一些情况中,醛脱氢酶和/或醇脱氢酶可包含与SEQ ID NO.21、23、25、27、29、31、33或35中任一者至少91%相同的氨基酸序列。在一些情况中,醛脱氢酶和/或醇脱氢酶可包含与SEQ IDNO.21、23、25、27、29、31、33或35中任一者至少92%相同的氨基酸序列。在一些情况中,醛脱氢酶和/或醇脱氢酶可包含与SEQ ID NO.21、23、25、27、29、31、33或35中任一者至少93%相同的氨基酸序列。在一些情况中,醛脱氢酶和/或醇脱氢酶可包含与SEQ ID NO.21、23、25、27、29、31、33或35中任一者至少94%相同的氨基酸序列。在一些情况中,醛脱氢酶和/或醇脱氢酶可包含与SEQ ID NO.21、23、25、27、29、31、33或35中任一者至少95%相同的氨基酸序列。在一些情况中,醛脱氢酶和/或醇脱氢酶可包含与SEQ ID NO.21、23、25、27、29、31、33或35中任一者至少96%相同的氨基酸序列。在一些情况中,醛脱氢酶和/或醇脱氢酶可包含与SEQ ID NO.21、23、25、27、29、31、33或35中任一者至少97%相同的氨基酸序列。在一些情况中,醛脱氢酶和/或醇脱氢酶可包含与SEQ ID NO.21、23、25、27、29、31、33或35中任一者至少98%相同的氨基酸序列。在一些情况中,醛脱氢酶和/或醇脱氢酶可包含与SEQ IDNO.21、23、25、27、29、31、33或35中任一者至少99%相同的氨基酸序列。在一些情况中,醛脱氢酶和/或醇脱氢酶可包含氨基酸序列,该氨基酸序列为SEQ ID NO.21、23、25、27、29、31、33或35中任一者。
或者,可将α-酮戊二酸盐或酯推向琥珀酸盐或酯途径,可通过使用α-酮戊二酸脱氢酶复合物将α-酮戊二酸盐或酯转化为琥珀酰CoA。琥珀酰CoA可通过使用琥珀酰CoA合成酶转化为琥珀酸盐或酯。一旦形成琥珀酸盐或酯,即可将琥珀酸盐或酯引向1,4-BDO途径。
琥珀酸盐或酯可转化为多碳产物,例如1,4-BDO。在一些情况下,当微生物利用琥珀酸盐或酯至1,4-BDO途径时,微生物可包含琥珀酰CoA合成酶β亚基(SucC),其为能够将琥珀酸盐或酯转化为琥珀酸CoA的酶。在一些情况下,微生物可包含琥珀酰CoA合成酶α亚基(SucD),其为将琥珀酰CoA转化为琥珀酸半醛的酶。在一些情况下,微生物可包含4-羟丁酸脱氢酶(4hbD),其为将琥珀酸半醛转化为γ-羟丁酸盐或酯(GHB)的酶。在一些情况下,微生物可包含4-羟丁酸CoA转移酶(cat2),其是将γ-羟丁酸盐或酯(GHB)转化为4-羟基丁酰CoA的酶。在一些情况下,微生物可以包含醛脱氢酶(aid),其是将4-羟基丁酰CoA转化为4-羟基丁醛的酶。在一些情况下,微生物可以包含醇脱氢酶(adh),其是将4-羟基丁醛转化为1,4-BDO的酶。这些酶中的一种或多种可以是微生物异源的。或者,这些酶中的一种或多种可以是微生物内源的。
本文描述了用于由CI碳(例如甲烷)制备1,4-BDO的微生物。在一些情况下,本文的微生物可以用编码以下一种或多种的基因转化:i)琥珀酰CoA合成酶β亚基(sucC);ii)琥珀酰CoA合成酶α亚基(sucD);iii)4-羟丁酸脱氢酶(4hbD);iv)4-羟丁酸CoA转移酶(Cat2);(v)醛脱氢酶(Aid);(vi)醇脱氢酶(adh);或(vii)其任何组合。这些基因可以与该微生物异源。所述基因还可编码可以进行如上所述的化学转化的酶。例如,醛脱氢酶(aid)可以是将4-羟基丁酰CoA转化为4-羟基丁醛的酶,而醇脱氢酶(adh)可以是将4-羟基丁醛转化成1,4-BDO的酶。
当使用琥珀酰CoA合成酶β亚基(SucC)时,琥珀酰CoA合成酶β亚基可以来自细菌(例如革兰氏阴性细菌),例如来自埃希氏杆菌属。例如,琥珀酰CoA合成酶β亚基可以来自大肠杆菌种。
琥珀酰CoA合成酶β亚基可包含与SEQ ID NO.37基本相似的氨基酸序列。例如,琥珀酰CoA合成酶β亚基可包含与SEQ ID NO.37至少60%相同的氨基酸序列。例如,琥珀酰CoA合成酶β亚基可包含与SEQ ID NO.37至少65%相同的氨基酸序列。在一些情况中,琥珀酰CoA合成酶β亚基可包含与SEQ ID NO.37至少70%相同的氨基酸序列。例如,琥珀酰CoA合成酶β亚基可包含与SEQ ID NO.37至少75%相同的氨基酸序列。在一些情况中,琥珀酰CoA合成酶β亚基可包含与SEQ ID NO.37至少80%相同的氨基酸序列。例如,琥珀酰CoA合成酶β亚基可包含与SEQ ID NO.37至少85%相同的氨基酸序列。在一些情况中,琥珀酰CoA合成酶β亚基可包含与SEQ ID NO.37至少90%相同的氨基酸序列。在一些情况中,琥珀酰CoA合成酶β亚基可包含与SEQ ID NO.37至少91%相同的氨基酸序列。在一些情况中,琥珀酰CoA合成酶β亚基可包含与SEQ ID NO.37至少92%相同的氨基酸序列。在一些情况中,琥珀酰CoA合成酶β亚基可包含与SEQ ID NO.37至少93%相同的氨基酸序列。在一些情况中,琥珀酰CoA合成酶β亚基可包含与SEQ ID NO.37至少94%相同的氨基酸序列。在一些情况中,琥珀酰CoA合成酶β亚基可包含与SEQ ID NO.37至少95%相同的氨基酸序列。在一些情况中,琥珀酰CoA合成酶β亚基可包含与SEQ ID NO.37至少96%相同的氨基酸序列。在一些情况中,琥珀酰CoA合成酶β亚基可包含与SEQ ID NO.37至少97%相同的氨基酸序列。在一些情况中,琥珀酰CoA合成酶β亚基可包含与SEQ ID NO.37至少98%相同的氨基酸序列。在一些情况中,琥珀酰CoA合成酶β亚基可包含与SEQ ID NO.37至少99%相同的氨基酸序列。在一些情况中,琥珀酰CoA合成酶β亚基可包含氨基酸序列,该氨基酸序列为SEQ ID NO.37。
当使用琥珀酰CoA合成酶α亚基(SucD)时,琥珀酰CoA合成酶α亚基可以来自细菌(例如革兰氏阴性或革兰氏阳性细菌),例如来自埃希氏杆菌属,梭菌属或卟啉单胞菌属。例如,琥珀酰CoA合成酶α亚基可以来自大肠杆菌,克鲁维氏梭菌,齿龈卟啉单胞菌种。
琥珀酰CoA合成酶α亚基(sucD)可包含与SEQ ID NO.39、41或43中任一者基本相似的氨基酸序列。例如,琥珀酰CoA合成酶α亚基可包含与SEQ ID NO.39、41或43中任一者至少60%相同的氨基酸序列。在一些情况中,琥珀酰CoA合成酶α亚基可包含与SEQ ID NO.39、41或43中任一者至少65%相同的氨基酸序列。在一些情况中,琥珀酰CoA合成酶α亚基可包含与SEQ ID NO.39、41或43中任一者至少70%相同的氨基酸序列。例如,琥珀酰CoA合成酶α亚基可包含与SEQ ID NO.39、41或43中任一者至少75%相同的氨基酸序列。在一些情况中,琥珀酰CoA合成酶α亚基可包含与SEQ ID NO.39、41或43中任一者至少80%相同的氨基酸序列。在一些情况中,琥珀酰CoA合成酶α亚基可包含与SEQ ID NO.39、41或43中任一者至少85%相同的氨基酸序列。在一些情况中,琥珀酰CoA合成酶α亚基可包含与SEQ ID NO.39、41或43中任一者至少90%相同的氨基酸序列。在一些情况中,琥珀酰CoA合成酶α亚基可包含与SEQ ID NO.39、41或43中任一者至少91%相同的氨基酸序列。在一些情况中,琥珀酰CoA合成酶α亚基可包含与SEQ ID NO.39、41或43中任一者至少92%相同的氨基酸序列。在一些情况中,琥珀酰CoA合成酶α亚基可包含与SEQ ID NO.39、41或43中任一者至少93%相同的氨基酸序列。在一些情况中,琥珀酰CoA合成酶α亚基可包含与SEQ ID NO.39、41或43中任一者至少94%相同的氨基酸序列。在一些情况中,琥珀酰CoA合成酶α亚基可包含与SEQ IDNO.39、41或43中任一者至少95%相同的氨基酸序列。在一些情况中,琥珀酰CoA合成酶α亚基可包含与SEQ ID NO.39、41或43中任一者至少96%相同的氨基酸序列。在一些情况中,琥珀酰CoA合成酶α亚基可包含与SEQ ID NO.39、41或43中任一者至少97%相同的氨基酸序列。在一些情况中,琥珀酰CoA合成酶α亚基可包含与SEQ ID NO.39、41或43中任一者至少98%相同的氨基酸序列。在一些情况中,琥珀酰CoA合成酶α亚基可包含与SEQ ID NO.39、41或43中任一者至少99%相同的氨基酸序列。在一些情况中,琥珀酰CoA合成酶α亚基可包含氨基酸序列,该氨基酸序列为SEQ ID NO.39、41或43中任一者。
琥珀酸盐或酯到1,4-BDO途径的其余四种酶与最后四种α-酮戊二酸盐或酯到1,4-BDO途径的酶相同。因此,当需要使用4-羟丁酸脱氢酶(4hbD),4-羟丁酸CoA转移酶(cat2),醛脱氢酶(aid)和/或醇脱氢酶(adh)时,可使用对于α-酮戊二酸盐或酯到1,4-BDO途径公开的相应酶。
此外,在一些情况下,到1,4-BDO的途径可以从草酰乙酸/苹果酸-CoA推至琥珀酸盐或酯,然后再从琥珀酸盐或酯到1,4-BDO。在这些情况下,可使用延胡索酸水合酶(fum)和/或延胡索酸还原酶(frd)。
当使用延胡索酸水合酶(fum)时,延胡索酸水合酶可以来自细菌(例如革兰氏阳性或革兰氏阴性的细菌),例如来自甲基球菌属,埃希氏杆菌属和/或分枝杆菌属。例如,延胡索酸水合酶(fum)可以来自荚膜甲基球菌,大肠杆菌和/或结核分枝杆菌种。
延胡索酸水合酶(fum)可包含与SEQ ID NO.45、47或49中任一者基本相似的氨基酸序列。例如,延胡索酸水合酶可包含与SEQ ID NO.45、47或49中任一者至少60%相同的氨基酸序列。例如,延胡索酸水合酶可包含与SEQ ID NO.45、47或49中任一者至少65%>相同的氨基酸序列。在一些情况下,延胡索酸水合酶可包含与SEQ ID NO.45、47或49中任一者至少70%相同的氨基酸序列。例如,延胡索酸水合酶可包含与SEQ ID NO.45、47或49中任一者至少75%相同的氨基酸序列。在一些情况下,延胡索酸水合酶可包含与SEQ ID NO.45、47或49中任一者至少80%相同的氨基酸序列。例如,延胡索酸水合酶可包含与SEQ ID NO.45、47或49中任一者至少85%相同的氨基酸序列。在一些情况下,延胡索酸水合酶可包含与SEQID NO.45、47或49中任一者至少90%相同的氨基酸序列。在一些情况下,延胡索酸水合酶可包含与SEQ ID NO.45、47或49中任一者至少91%相同的氨基酸序列。在一些情况下,延胡索酸水合酶可包含与SEQ ID NO.45、47或49中任一者至少92%相同的氨基酸序列。在一些情况下,延胡索酸水合酶可包含与SEQ ID NO.45、47或49中任一者至少93%相同的氨基酸序列。在一些情况下,延胡索酸水合酶可包含与SEQ ID NO.45、47或49中任一者至少94%相同的氨基酸序列。在一些情况下,延胡索酸水合酶可包含与SEQ ID NO.45、47或49中任一者至少95%相同的氨基酸序列。在一些情况下,延胡索酸水合酶可包含与SEQ ID NO.45、47或49中任一者至少96%相同的氨基酸序列。在一些情况下,延胡索酸水合酶可包含与SEQ IDNO.45、47或49中任一者至少97%相同的氨基酸序列。在一些情况下,延胡索酸水合酶可包含与SEQ ID NO.45、47或49中任一者至少98%相同的氨基酸序列。在一些情况下,延胡索酸水合酶可包含与SEQ ID NO.45、47或49中任一者至少99%相同的氨基酸序列。在一些情况下,延胡索酸水合酶可包含氨基酸序列,该氨基酸序列为SEQ ID NO.45、47或49中任一者。
当使用延胡索酸还原酶(fird)时,延胡索酸还原酶可来自细菌(例如革兰氏阴性细菌),例如来自埃希氏杆菌属。例如,延胡索酸还原酶(frd)可以来自大肠杆菌种。
延胡索酸还原酶(frd)可包含与SEQ ID NO.51、53、55或57中任一者基本相似的氨基酸序列。例如,延胡索酸还原酶可包含与SEQ ID NO.51、53、55或57中任一者至少60%相同的氨基酸序列。例如,延胡索酸还原酶可包含与SEQ ID NO.51、53、55或57中任一者至少65%相同的氨基酸序列。在一些情况下,延胡索酸还原酶可包含与SEQ ID NO.51、53、55或57中任一者至少70%相同的氨基酸序列。例如,延胡索酸还原酶可包含与SEQ ID NO.51、53、55或57中任一者至少75%)相同的氨基酸序列。在一些情况下,延胡索酸还原酶可包含与SEQ ID NO.51、53、55或57中任一者至少80%>相同的氨基酸序列。例如,延胡索酸还原酶可包含与SEQ ID NO.51、53、55或57中任一者至少85%>相同的氨基酸序列。在一些情况下,延胡索酸还原酶可包含与SEQ ID NO.51、53、55或57中任一者至少90%>相同的氨基酸序列。在一些情况下,延胡索酸还原酶可包含与SEQ ID NO.51、53、55或57中任一者至少91%>相同的氨基酸序列。在一些情况下,延胡索酸还原酶可包含与SEQ ID NO.51、53、55或57中任一者至少92%>相同的氨基酸序列。在一些情况下,延胡索酸还原酶可包含与SEQ IDNO.51、53、55或57中任一者至少93%>相同的氨基酸序列。在一些情况下,延胡索酸还原酶可包含与SEQ ID NO.51、53、55或57中任一者至少94%>相同的氨基酸序列。在一些情况下,延胡索酸还原酶可包含与SEQ ID NO.51、53、55或57中任一者至少95%>相同的氨基酸序列。在一些情况下,延胡索酸还原酶可包含与SEQ ID NO.51、53、55或57中任一者至少96%>相同的氨基酸序列。在一些情况下,延胡索酸还原酶可包含与SEQ ID NO.51、53、55或57中任一者至少97%>相同的氨基酸序列。在一些情况下,延胡索酸还原酶可包含与SEQ IDNO.51、53、55或57中任一者至少98%)相同的氨基酸序列。在一些情况下,延胡索酸还原酶可包含与SEQ ID NO.51、53、55或57中任一者至少99%>相同的氨基酸序列。在一些情况下,延胡索酸还原酶可包含氨基酸序列,该氨基酸序列为SEQ ID NO.51、53、55或57中任一者。
可以将其它酶置于微生物内,以通过发酵制备其它所需的最终产物。
氨基酸序列也可以基于将要表达该酶的微生物进行优化。换言之,可基于相应微生物是否典型地利用特定氨基酸或者在微生物中可使用多少该特定氨基酸来进行保守氨基酸取代。
另外,在一些情况下,可以在微生物内使用催化连续反应的两种或更多种酶。例如,催化连续反应的两种酶可以是α-酮戊二酸脱氢酶和4-羟丁酸脱氢酶。可使用连续酶的任何组合,并且其可见于图1、2、3和7。在一些情况下,可以在微生物内使用催化连续反应的三种或更多种酶。在一些情况下,可以在微生物内使用催化连续反应的四种或更多种酶。在一些情况下,可以在微生物内使用催化连续反应的五种或更多种酶。在一些情况下,可以在微生物内使用催化连续反应的六种或更多种酶。在一些情况下,可以在微生物内使用催化连续反应的七种或更多种酶。在一些情况下,可以在微生物内使用催化连续反应的八种或更多种酶。在一些情况下,可以在微生物内使用催化连续反应的九种或更多种酶。在一些情况下,可以在微生物内使用催化连续反应的十种或更多种酶。
载体
制备用于引入原核或真核宿主中的多核苷酸构建体通常但并非总是包含包括编码所需多肽的期望多核苷酸片段的宿主识别的复制系统(即载体),并且也可以但不一定包括与多肽编码区段操作性连接的转录和翻译起始调控序列。表达系统(例如表达载体)可包括,例如,复制起点或自主复制序列(ARS)和表达控制序列,启动子,增强子和必需的加工信息位点,例如核糖体结合位点,RNA剪接位点,多腺苷酸化位点,转录终止子序列,mRNA稳定序列,与宿主染色体DNA同源的核苷酸序列,和/或多克隆位点。在适当的情况下,也可以包括信号肽,优选来自相同或相关物种的分泌多肽,其允许蛋白质穿过和/或停留在细胞膜中或从细胞分泌。
载体可以使用标准方法构建(参见例如,Sambrook等,《分子生物学:实验室手册(Molecular Biology:A Laboratory Manual)》,冷泉港(Cold Spring Harbor),纽约州,1989;和Ausubel等,《新编分子生物学方案(Current Protocols in MolecularBiology)》,格林出版公司(Greene Publishing,Co.),纽约州,1995)。
编码本文公开的酶的多核苷酸的操作通常在重组载体中进行。许多载体是公众可获得的,包括细菌质粒,噬菌体,人工染色体,附加型载体和基因表达载体,它们都可使用。可以选择载体以适应编码所需大小的蛋白质的多核苷酸。在重组修饰选择的载体后,用载体转染或转化合适的宿主细胞(例如,本文所述的微生物)。每种载体含有各种功能组分,其通常包括克隆位点,复制起点和至少一种选择标志物基因。载体还可具有以下元件中的一种或多种:增强子,启动子和转录终止和/或其它信号序列。此类序列元件可针对所选宿主物种进行优化。这些序列元件可以位于克隆位点附近,从而它们与编码预选酶的基因操作性地连接。
载体,包括克隆和表达载体,可含有使载体能够在一种或多种选定的微生物中复制的核酸序列。例如,该序列可以是使载体能够独立于宿主染色体DNA复制的序列,并且可以包括复制起点或自主复制序列。这些序列对于各种细菌,酵母和病毒是众所周知的。例如,质粒pBR322的复制起点适用于大多数革兰氏阴性细菌,2微米质粒起点适用于酵母,而各种病毒起点(如SV40,腺病毒)可用于克隆载体。
克隆或表达载体可含有选择基因(也称为选择标志物)。该基因编码在选择性培养基中转化微生物的存活或生长所必需的蛋白质。因此,未用含有选择基因的载体转化的微生物无法在培养基中存活。典型的选择基因编码提供针对抗生素及其它毒素(例如,氨苄西林,新霉素,甲氨蝶呤,潮霉素,硫链丝菌肽,安普霉素或四环素)的抗性的蛋白质,补充营养缺陷,或提供生长培养基中不可获得的关键营养素。
载体的复制可以在大肠杆菌中进行。可使用E.co/z选择标志物,例如提供抗生素氨苄青霉素的抗性的β-内酰胺酶基因。这些选择标志物可获自大肠杆菌质粒,例如pBR322或pUC质粒,例如pUC 18或pUC 19,或pUC 119。
启动子
载体可含有被宿主微生物识别的启动子。启动子可以与感兴趣的编码序列操作性地连接。这种启动子可以是诱导型或组成型的。当多核苷酸处于允许它们以其预期方式起作用的关系时,多核苷酸被操作性地连接。
不同的启动子可用于驱动基因的表达。例如,如果需要临时基因表达(即,非组成型表达),表达可以由诱导型启动子驱动。
在一些情况中,所公开的基因中的一些可临时性表达。换言之,这些基因不组成型表达。基因的表达可以由诱导型或抑制型启动子驱动。例如,可用的诱导型或抑制型启动子包括但不限于:(a)糖,例如阿拉伯糖和乳糖(或不可代谢的类似物,例如异丙基β-D-1-硫代吡喃半乳糖苷(IPTG));(b)金属,如镧(或其它稀土金属)、铜、钙;(c)温度;(d)氮源;(e)氧;(f)细胞状态(生长或静止);(g)代谢物,如磷酸盐;(h)CRISPRi;(i)jun;(j)fos,(k)金属硫蛋白和/或(l)热休克。这些启动子可用于甲烷氧化菌系统。例如,可在甲烷氧化菌中使用的诱导型启动子的一个实例是pBAD或pMxaF启动子。
组成型表达的启动子也可用于本文的载体系统中。例如,可以通过组成型活性启动子控制全文公开的一些基因的表达。例如,可使用的启动子包括但不限于p.Bba.J23111、J23111和J23100。
适用于原核宿主的启动子可包括,例如,α-内酰胺酶和乳糖启动子系统,碱性磷酸酶,色氨酸(trp)启动子系统,红霉素启动子,阿普拉霉素启动子,潮霉素启动子,亚甲基霉素启动子和杂合启动子如tac启动子。用于细菌系统的启动子通常还含有与编码序列可操作地连接的Shine-Dalgarno序列。
一般可以使用强启动子来提供所需产物的高水平转录和表达。
转录单元的一个或多个启动子可以是诱导型启动子。例如,GFP可以从组成型启动子表达,而诱导型启动子驱动编码本文公开的一种或多种酶的基因和/或可扩增的选择标志物的转录。
一些载体可含有促进载体在细菌中繁衍的原核序列。因此,载体可以具有其它组分,例如复制起点(例如,使载体能够在一种或多种选定的微生物中复制的核酸序列),用于在细菌中选择的抗生素抗性基因,和/或琥珀终止密码子(可通过密码子允许翻译至阅读)。还可以掺入其它一种或多种选择性基因。在克隆载体中,复制起点通常是使载体能够独立于宿主染色体DNA复制的复制起点,并且包括复制起点或自主复制序列。此类序列可包括细菌中的ColE1复制起点或其它已知序列。
基因
基因载体可包含能够催化以下一种或多种反应的一种或多种酶的核酸序列:i)甲烷到甲醇;ii)甲醇到甲醛;iii)甲醛到丙酮酸盐或酯;iv)丙酮酸盐或酯到乙酰CoA;v)乙酰CoA到柠檬酸盐或酯;vi)柠檬酸盐或酯到异柠檬酸盐或酯;vii)异柠檬酸盐或酯到α-酮戊二酸盐或酯;viii)α-酮戊二酸盐或酯到琥珀酸CoA;ix)琥珀酸CoA到琥珀酸盐或酯;x)草酰乙酸和/或苹果酰CoA到L-苹果酸盐或酯;xi)L-苹果酸盐或酯到延胡索酸盐或酯;和/或xii)延胡索酸盐或酯到琥珀酸盐或酯。
在一些情况下,载体可包含α-酮戊二酸盐或酯到1,4-BDO途径的一种或多种以下基因:i)α-酮戊二酸脱羧酶(kgd);ii)4-羟丁酸脱氢酶(4hbD);iii)4-羟丁酸CoA转移酶(Cat2);(iv)醛脱氢酶(Aid);(v)醇脱氢酶(adh);或(vi)其任何组合。
在一些情况下,载体可包含琥珀酸盐或酯到1,4-BDO途径的一种或多种以下基因:i)琥珀酰CoA合成酶β亚基(sucC);ii)琥珀酰CoA合成酶α亚基(sucD);iii)4-羟丁酸脱氢酶(4hbD);iv)4-羟丁酸CoA转移酶(Cat2);(v)醛脱氢酶(Aid);(vi)醇脱氢酶(adh);或(vii)其任何组合。
在一些情况下,载体可包含延胡索酸水合酶和/或延胡索酸还原酶。
一种或多种基因可以与载体接触(并最终用其转化)的微生物异源。
还设想本文公开的任何和所有基因都可以过表达。例如,当微生物或载体包含基因(例如,异源基因)时,该基因可以过表达。通常通过使用高度表达的启动子或插入基因的多个拷贝来完成此操作。
当使用α-酮戊二酸脱羧酶(kgd)基因时,α-酮戊二酸脱羧酶基因可以来自细菌(例如,革兰氏阳性细菌或既非革兰氏阳性也非革兰氏阴性的细菌),例如来自分枝杆菌(Mycobacterium)属,棒状杆菌(Corynebacterium)属和/或红球菌(Rhodococcus)属。例如,α-酮戊二酸脱羧酶(kgd)基因可来自牛分枝杆菌(Mycobacterium bovis),结核分枝杆菌(Mycobacterium tuberculosis),解萜烯棒杆菌(Corynebacterium terpenotabidum)和/或久提红球菌(Rhodococcus jostii)种。
α-酮戊二酸脱羧酶(kgd)可包含与SEQ ID NO.2、4、6或8中任一者基本相似的核酸序列。例如,α-酮戊二酸脱羧酶可包含与SEQ ID NO.2、4、6或8中任一者至少60%相同的核酸序列。在一些情况中,α-酮戊二酸脱羧酶可包含与SEQ ID NO.2、4、6或8中任一者至少65%相同的核酸序列。在一些情况中,α-酮戊二酸脱羧酶可包含与SEQ ID NO.2、4、6或8中任一者至少70%相同的核酸序列。在一些情况中,α-酮戊二酸脱羧酶可包含与SEQ IDNO.2、4、6或8中任一者至少75%相同的核酸序列。在一些情况中,α-酮戊二酸脱羧酶可包含与SEQ ID NO.2、4、6或8中任一者至少80%)相同的核酸序列。在一些情况中,α-酮戊二酸脱羧酶可包含与SEQ ID NO.2、4、6或8中任一者至少85%相同的核酸序列。在一些情况中,α-酮戊二酸脱羧酶可包含与SEQ ID NO.2、4、6或8中任一者至少90%相同的核酸序列。在一些情况中,α-酮戊二酸脱羧酶可包含与SEQ ID NO.2、4、6或8中任一者至少91%相同的核酸序列。在一些情况中,α-酮戊二酸脱羧酶可包含与SEQ ID NO.2、4、6或8中任一者至少92%相同的核酸序列。在一些情况中,α-酮戊二酸脱羧酶可包含与SEQ ID NO.2、4、6或8中任一者至少93%)相同的核酸序列。在一些情况中,α-酮戊二酸脱羧酶可包含与SEQ ID NO.2、4、6或8中任一者至少94%相同的核酸序列。在一些情况中,α-酮戊二酸脱羧酶可包含与SEQ IDNO.2、4、6或8中任一者至少95%相同的核酸序列。在一些情况中,α-酮戊二酸脱羧酶可包含与SEQ ID NO.2、4、6或8中任一者至少96%相同的核酸序列。在一些情况中,α-酮戊二酸脱羧酶可包含与SEQ ID NO.2、4、6或8中任一者至少97%相同的核酸序列。在一些情况中,α-酮戊二酸脱羧酶可包含与SEQ ID NO.2、4、6或8中任一者至少98%)相同的核酸序列。在一些情况中,α-酮戊二酸脱羧酶可包含与SEQ ID NO.2、4、6或8中任一者至少99%相同的核酸序列。在一些情况中,α-酮戊二酸脱羧酶可包含核酸序列,该核酸序列为SEQ ID NO.2、4、6或8中任一者。
当期望使用4-羟丁酸脱氢酶(4hbD)基因时,4-羟丁酸脱氢酶基因可来自细菌(例如革兰氏阴性或阳性细菌),例如来自埃希氏杆菌(Escherichia)属,卟啉单胞菌(Porphyromonas)属和/或梭菌(Clostridium)属。例如,4-羟丁酸脱氢酶基因可来自大肠杆菌(Escherichia coli),齿龈卟啉单胞菌(Porphyromonas gingivalis)和/或克鲁维氏梭菌(Clostridium kluyveri)种。
4-羟丁酸脱氢酶基因可包含与SEQ ID NO.12或14基本相似的核酸序列。例如,4-羟丁酸脱氢酶基因可包含与SEQ ID NO.12或14至少60%相同的核酸序列。例如,4-羟丁酸脱氢酶基因可包含与SEQ ID NO.12或14至少65%相同的核酸序列。在一些情况下,4-羟丁酸脱氢酶基因可包含与SEQ ID NO.12或14至少70%相同的核酸序列。例如,4-羟丁酸脱氢酶基因可包含与SEQ ID NO.12或14至少75%相同的核酸序列。在一些情况下,4-羟丁酸脱氢酶基因可包含与SEQ ID NO.12或14至少80%相同的核酸序列。例如,4-羟丁酸脱氢酶基因可包含与SEQ ID NO.12或14至少85%相同的核酸序列。在一些情况下,4-羟丁酸脱氢酶基因可包含与SEQ ID NO.12或14至少90%)相同的核酸序列。在一些情况下,4-羟丁酸脱氢酶基因可包含与SEQ ID NO.12或14至少91%相同的核酸序列。在一些情况下,4-羟丁酸脱氢酶基因可包含与SEQ ID NO.12或14至少92%相同的核酸序列。在一些情况下,4-羟丁酸脱氢酶基因可包含与SEQ ID NO.12或14至少93%相同的核酸序列。在一些情况下,4-羟丁酸脱氢酶基因可包含与SEQ ID NO.12或14至少94%相同的核酸序列。在一些情况下,4-羟丁酸脱氢酶基因可包含与SEQ ID NO.12或14至少95%相同的核酸序列。在一些情况下,4-羟丁酸脱氢酶基因可包含与SEQ ID NO.12或14至少96%相同的核酸序列。在一些情况下,4-羟丁酸脱氢酶基因可包含与SEQ ID NO.12或14至少97%)相同的核酸序列。在一些情况下,4-羟丁酸脱氢酶基因可包含与SEQ ID NO.12或14至少98%相同的核酸序列。在一些情况下,4-羟丁酸脱氢酶基因可包含与SEQ ID NO.12或14至少99%相同的核酸序列。在一些情况中,4-羟丁酸脱氢酶基因可包含核酸序列,该核酸序列是SEQ ID NO.12或14。
当期望使用4-羟丁酸CoA转移酶(cat2)基因时,4-羟丁酸CoA转移酶基因可来自细菌(例如革兰氏阴性或阳性细菌),例如来自卟啉单胞菌(Porphyromonas)属和/或梭菌(Clostridium)属。例如,4-羟丁酸CoA转移酶基因可以来自齿龈卟啉单胞菌(Porphyromonas gingivalis)和/或丙酮丁醇梭菌(Clostridium acetobutylicum)种。
4-羟丁酸CoA转移酶基因可包含与SEQ ID NO.16、18或20中任一者基本相似的核酸序列。例如,4-羟丁酸CoA转移酶基因可包含与SEQ ID NO.16、18或20中任一者至少60%相同的核酸序列。例如,4-羟丁酸CoA转移酶基因可包含与SEQ ID NO.16、18或20中任一者至少65%相同的核酸序列。在一些情况中,4-羟丁酸CoA转移酶基因可包含与SEQ IDNO.16、18或20中任一者至少70%相同的核酸序列。例如,4-羟丁酸CoA转移酶基因可包含与SEQ ID NO.16、18或20中任一者至少75%相同的核酸序列。在一些情况中,4-羟丁酸CoA转移酶基因可包含与SEQ ID NO.16、18或20中任一者至少80%相同的核酸序列。例如,4-羟丁酸CoA转移酶基因可包含与SEQ ID NO.16、18或20中任一者至少85%相同的核酸序列。在一些情况中,4-羟丁酸CoA转移酶基因可包含与SEQ ID NO.16、18或20中任一者至少90%相同的核酸序列。在一些情况中,4-羟丁酸CoA转移酶基因可包含与SEQ ID NO.16、18或20中任一者至少91%相同的核酸序列。在一些情况中,4-羟丁酸CoA转移酶基因可包含与SEQ IDNO.16、18或20中任一者至少92%相同的核酸序列。在一些情况中,4-羟丁酸CoA转移酶基因可包含与SEQ ID NO.16、18或20中任一者至少93%相同的核酸序列。在一些情况中,4-羟丁酸CoA转移酶基因可包含与SEQ ID NO.16、18或20中任一者至少94%相同的核酸序列。在一些情况中,4-羟丁酸CoA转移酶基因可包含与SEQ ID NO.16、18或20中任一者至少95%相同的核酸序列。在一些情况中,4-羟丁酸CoA转移酶基因可包含与SEQ ID NO.16、18或20中任一者至少96%相同的核酸序列。在一些情况中,4-羟丁酸CoA转移酶基因可包含与SEQ IDNO.16、18或20中任一者至少97%相同的核酸序列。在一些情况中,4-羟丁酸CoA转移酶基因可包含与SEQ ID NO.16、18或20中任一者至少98%相同的核酸序列。在一些情况中,4-羟丁酸CoA转移酶基因可包含与SEQ ID NO.16、18或20中任一者至少99%相同的核酸序列。在一些情况中,4-羟丁酸CoA转移酶基因可包含核酸序列,该核酸序列为SEQ ID NO.16、18或20中任一者。
当需要使用醛脱氢酶(aid)基因和/或醇脱氢酶(adh)基因时,醛脱氢酶基因和/或醇脱氢酶基因可来自细菌(例如革兰氏阴性或阳性细菌),例如来自埃希氏杆菌属,不动杆菌(Acinetobacter)属,卟啉单胞菌属和/或梭菌属,或来自酵母,例如来自酵母(Saccharomyces)属。例如,醛脱氢酶基因和/或醇脱氢酶基因可以来自大肠杆菌,百利不动杆菌,齿龈卟啉单胞菌,丙酮丁醇梭菌和/或酿酒酵母种。在一些情况下,可使用多于一种的醛脱氢酶基因和/或醇脱氢酶基因。
醛脱氢酶基因和/或醇脱氢酶基因可包含与SEQ ID NO.22、24、26、28、30、32、34或36中任一者基本相似的核酸序列。例如,醛脱氢酶基因和/或醇脱氢酶基因可包含与SEQ IDNO.22、24、26、28、30、32、34或36中任一者至少60%相同的核酸序列。例如,醛脱氢酶基因和/或醇脱氢酶基因可包含与SEQ ID NO.22、24、26、28、30、32、34或36中任一者至少65%相同的核酸序列。例如,醛脱氢酶基因和/或醇脱氢酶基因可包含与SEQ ID NO.22、24、26、28、30、32、34或36中任一者至少70%相同的核酸序列。例如,醛脱氢酶基因和/或醇脱氢酶基因可包含与SEQ ID NO.22、24、26、28、30、32、34或36中任一者至少75%相同的核酸序列。例如,醛脱氢酶基因和/或醇脱氢酶基因可包含与SEQ ID NO.22、24、26、28、30、32、34或36中任一者至少80%相同的核酸序列。例如,醛脱氢酶基因和/或醇脱氢酶基因可包含与SEQ IDNO.22、24、26、28、30、32、34或36中任一者至少85%相同的核酸序列。例如,醛脱氢酶基因和/或醇脱氢酶基因可包含与SEQ ID NO.22、24、26、28、30、32、34或36中任一者至少90%相同的核酸序列。例如,醛脱氢酶基因和/或醇脱氢酶基因可包含与SEQ ID NO.22、24、26、28、30、32、34或36中任一者至少91%相同的核酸序列。例如,醛脱氢酶基因和/或醇脱氢酶基因可包含与SEQ ID NO.22、24、26、28、30、32、34或36中任一者至少92%相同的核酸序列。例如,醛脱氢酶基因和/或醇脱氢酶基因可包含与SEQ ID NO.22、24、26、28、30、32、34或36中任一者至少93%相同的核酸序列。例如,醛脱氢酶基因和/或醇脱氢酶基因可包含与SEQ IDNO.22、24、26、28、30、32、34或36中任一者至少94%相同的核酸序列。例如,醛脱氢酶基因和/或醇脱氢酶基因可包含与SEQ ID NO.22、24、26、28、30、32、34或36中任一者至少95%相同的核酸序列。例如,醛脱氢酶基因和/或醇脱氢酶基因可包含与SEQ ID NO.22、24、26、28、30、32、34或36中任一者至少96%相同的核酸序列。例如,醛脱氢酶基因和/或醇脱氢酶基因可包含与SEQ ID NO.22、24、26、28、30、32、34或36中任一者至少97%相同的核酸序列。例如,醛脱氢酶基因和/或醇脱氢酶基因可包含与SEQ ID NO.22、24、26、28、30、32、34或36中任一者至少98%相同的核酸序列。例如,醛脱氢酶基因和/或醇脱氢酶基因可包含与SEQ IDNO.22、24、26、28、30、32、34或36中任一者至少99%相同的核酸序列。例如,醛脱氢酶基因和/或醇脱氢酶基因可包含核酸序列,该核酸序列为SEQ ID NO.22、24、26、28、30、32、34或36中任一者。
当使用琥珀酰CoA合成酶β亚基(sucC)基因时,琥珀酰CoA合成酶β亚基基因可以来自细菌(例如革兰氏阴性细菌),例如来自埃希氏杆菌属。例如,琥珀酰CoA合成酶β亚基基因可以来自大肠杆菌种。
琥珀酰CoA合成酶β亚基基因可包含与SEQ ID NO.38基本相似的核酸序列。例如,琥珀酰CoA合成酶β亚基基因可包含与SEQ ID NO.38至少60%相同的核酸序列。例如,琥珀酰CoA合成酶β亚基基因可包含与SEQ ID NO.38至少65%)相同的核酸序列。在一些情况中,琥珀酰CoA合成酶β亚基基因可包含与SEQ ID NO.38至少70%相同的核酸序列。例如,琥珀酰CoA合成酶β亚基基因可包含与SEQ ID NO.38至少75%相同的核酸序列。在一些情况中,琥珀酰CoA合成酶β亚基基因可包含与SEQ ID NO.38至少80%相同的核酸序列。例如,琥珀酰CoA合成酶β亚基基因可包含与SEQ ID NO.38至少85%相同的核酸序列。在一些情况中,琥珀酰CoA合成酶β亚基基因可包含与SEQ ID NO.38至少90%相同的核酸序列。在一些情况中,琥珀酰CoA合成酶β亚基基因可包含与SEQ ID NO.38至少91%)相同的核酸序列。在一些情况中,琥珀酰CoA合成酶β亚基基因可包含与SEQ ID NO.38至少92%相同的核酸序列。在一些情况中,琥珀酰CoA合成酶β亚基基因可包含与SEQ ID NO.38至少93%)相同的核酸序列。在一些情况中,琥珀酰CoA合成酶β亚基基因可包含与SEQ ID NO.38至少94%相同的核酸序列。在一些情况中,琥珀酰CoA合成酶β亚基基因可包含与SEQ ID NO.38至少95%)相同的核酸序列。在一些情况中,琥珀酰CoA合成酶β亚基基因可包含与SEQ ID NO.38至少96%相同的核酸序列。在一些情况中,琥珀酰CoA合成酶β亚基基因可包含与SEQ ID NO.38至少97%)相同的核酸序列。在一些情况中,琥珀酰CoA合成酶β亚基基因可包含与SEQ ID NO.38至少98%相同的核酸序列。在一些情况中,琥珀酰CoA合成酶β亚基基因可包含与SEQ IDNO.38至少99%)相同的核酸序列。在一些情况中,琥珀酰CoA合成酶β亚基基因可包含核酸序列,该核酸序列为SEQ ID NO.38。
当使用琥珀酰CoA合成酶α亚基(sucD)基因时,琥珀酰CoA合成酶α亚基基因可以来自细菌(例如革兰氏阴性或革兰氏阳性细菌),例如来自埃希氏杆菌属,梭菌属或卟啉单胞菌属。例如,琥珀酰CoA合成酶α亚基基因可以来自大肠杆菌,克鲁维氏梭菌,齿龈卟啉单胞菌种。
琥珀酰CoA合成酶α亚基基因可包含与SEQ ID NO.40、43或44中任一者基本相似的核酸序列。例如,琥珀酰CoA合成酶α亚基基因可包含与SEQ ID NO.40、43或44中任一者至少60%相同的核酸序列。例如,琥珀酰CoA合成酶α亚基基因可包含与SEQ ID NO.40、43或44中任一者至少65%相同的核酸序列。例如,琥珀酰CoA合成酶α亚基基因可包含与SEQ IDNO.40、43或44中任一者至少70%相同的核酸序列。例如,琥珀酰CoA合成酶α亚基基因可包含与SEQ ID NO.40、43或44中任一者至少75%)相同的核酸序列。例如,琥珀酰CoA合成酶α亚基基因可包含与SEQ ID NO.40、43或44中任一者至少80%>相同的核酸序列。例如,琥珀酰CoA合成酶α亚基基因可包含与SEQ ID NO.40、43或44中任一者至少85%>相同的核酸序列。例如,琥珀酰CoA合成酶α亚基基因可包含与SEQ ID NO.40、43或44中任一者至少90%相同的核酸序列。例如,琥珀酰CoA合成酶α亚基基因可包含与SEQ ID NO.40、43或44中任一者至少91%相同的核酸序列。例如,琥珀酰CoA合成酶α亚基基因可包含与SEQ ID NO.40、43或44中任一者至少92%相同的核酸序列。例如,琥珀酰CoA合成酶α亚基基因可包含与SEQ IDNO.40、43或44中任一者至少93%相同的核酸序列。例如,琥珀酰CoA合成酶α亚基基因可包含与SEQ ID NO.40、43或44中任一者至少94%相同的核酸序列。例如,琥珀酰CoA合成酶α亚基基因可包含与SEQ ID NO.40、43或44中任一者至少95%相同的核酸序列。例如,琥珀酰CoA合成酶α亚基基因可包含与SEQ ID NO.40、43或44中任一者至少96%相同的核酸序列。例如,琥珀酰CoA合成酶α亚基基因可包含与SEQ ID NO.40、43或44中任一者至少97%相同的核酸序列。例如,琥珀酰CoA合成酶α亚基基因可包含与SEQ ID NO.40、43或44中任一者至少98%)相同的核酸序列。例如,琥珀酰CoA合成酶α亚基基因可包含与SEQ ID NO.40、43或44中任一者至少99%相同的核酸序列。例如,琥珀酰CoA合成酶α亚基基因可包含核酸序列,该核酸序列为SEQ ID NO.40、43或44中任一者。
琥珀酸盐或酯到1,4-BDO途径的其余四种酶与最后四种α-酮戊二酸盐或酯到1,4-BDO途径的酶相同。因此,当需要使用4-羟丁酸脱氢酶基因,4-羟丁酸CoA转移酶基因,醛脱氢酶基因和/或醇脱氢酶基因时,可使用对于α-酮戊二酸盐或酯到1,4-BDO途径公开的相应基因。
此外,在一些情况下,到1,4-BDO的途径可以从草酰乙酸/苹果酸-CoA推至琥珀酸盐或酯,然后再从琥珀酸盐或酯到1,4-BDO。在这些情况下,可使用延胡索酸水合酶(fum)和/或延胡索酸还原酶(frd)。
当使用延胡索酸水合酶(fum)基因时,延胡索酸水合酶基因可以来自细菌(例如革兰氏阳性或革兰氏阴性的细菌),例如来自甲基球菌属,埃希氏杆菌属和/或分枝杆菌属。例如,延胡索酸水合酶(fum)基因可以来自荚膜甲基球菌,大肠杆菌和/或结核分枝杆菌种。
延胡索酸水合酶(fum)基因可包含与SEQ ID NO.46、48或50中任一者基本相似的核酸序列。例如,延胡索酸水合酶基因可包含与SEQ ID NO.46、48或50中任一者至少60%相同的核酸序列。例如,延胡索酸水合酶基因可包含与SEQ ID NO.46、48或50中任一者至少65%)相同的核酸序列。在一些情况中,延胡索酸水合酶基因可包含与SEQ ID NO.46、48或50中任一者至少70%相同的核酸序列。例如,延胡索酸水合酶基因可包含与SEQ ID NO.46、48或50中任一者至少75%)相同的核酸序列。在一些情况中,延胡索酸水合酶基因可包含与SEQ ID NO.46、48或50中任一者至少80%>相同的核酸序列。例如,延胡索酸水合酶基因可包含与SEQ ID NO.46、48或50中任一者至少85%>相同的核酸序列。在一些情况中,延胡索酸水合酶基因可包含与SEQ ID NO.46、48或50中任一者至少90%相同的核酸序列。在一些情况中,延胡索酸水合酶基因可包含与SEQ ID NO.46、48或50中任一者至少91%相同的核酸序列。在一些情况中,延胡索酸水合酶基因可包含与SEQ ID NO.46、48或50中任一者至少92%相同的核酸序列。在一些情况中,延胡索酸水合酶基因可包含与SEQ ID NO.46、48或50中任一者至少93%相同的核酸序列。在一些情况中,延胡索酸水合酶基因可包含与SEQ IDNO.46、48或50中任一者至少94%相同的核酸序列。在一些情况中,延胡索酸水合酶基因可包含与SEQ ID NO.46、48或50中任一者至少95%相同的核酸序列。在一些情况中,延胡索酸水合酶基因可包含与SEQ ID NO.46、48或50中任一者至少96%)相同的核酸序列。在一些情况中,延胡索酸水合酶基因可包含与SEQ ID NO.46、48或50中任一者至少97%相同的核酸序列。在一些情况中,延胡索酸水合酶基因可包含与SEQ ID NO.46、48或50中任一者至少98%)相同的核酸序列。在一些情况中,延胡索酸水合酶基因可包含与SEQ ID NO.46、48或50中任一者至少99%相同的核酸序列。在一些情况中,延胡索酸水合酶基因可包含核酸序列,该核酸序列为SEQ ID NO.46、48或50中任一者。
当使用延胡索酸还原酶(frd)基因时,延胡索酸还原酶基因可来自细菌(例如革兰氏阴性细菌),例如来自埃希氏杆菌属。例如,延胡索酸还原酶(frd)基因可以来自大肠杆菌种。
延胡索酸还原酶(frd)基因可包含与SEQ ID NO.52、54、56或58中任一者基本相似的核酸序列。例如,延胡索酸还原酶基因可包含与SEQ ID NO.52、54、56或58中任一者至少60%>相同的核酸序列。例如,延胡索酸还原酶基因可包含与SEQ ID NO.52、54、56或58中任一者至少65%)相同的核酸序列。在一些情况中,延胡索酸还原酶基因可包含与SEQ IDNO.52、54、56或58中任一者至少70%相同的核酸序列。例如,延胡索酸还原酶基因可包含与SEQ ID NO.52、54、56或58中任一者至少75%相同的核酸序列。在一些情况中,延胡索酸还原酶基因可包含与SEQ ID NO.52、54、56或58中任一者至少80%相同的核酸序列。例如,延胡索酸还原酶基因可包含与SEQ ID NO.52、54、56或58中任一者至少85%相同的核酸序列。在一些情况中,延胡索酸还原酶基因可包含与SEQ ID NO.52、54、56或58中任一者至少90%相同的核酸序列。在一些情况中,延胡索酸还原酶基因可包含与SEQ ID NO.52、54、56或58中任一者至少91%相同的核酸序列。在一些情况中,延胡索酸还原酶基因可包含与SEQ IDNO.52、54、56或58中任一者至少92%相同的核酸序列。在一些情况中,延胡索酸还原酶基因可包含与SEQ ID NO.52、54、56或58中任一者至少93%相同的核酸序列。在一些情况中,延胡索酸还原酶基因可包含与SEQ ID NO.52、54、56或58中任一者至少94%相同的核酸序列。在一些情况中,延胡索酸还原酶基因可包含与SEQ ID NO.52、54、56或58中任一者至少95%相同的核酸序列。在一些情况中,延胡索酸还原酶基因可包含与SEQ ID NO.52、54、56或58中任一者至少96%相同的核酸序列。在一些情况中,延胡索酸还原酶基因可包含与SEQ IDNO.52、54、56或58中任一者至少97%相同的核酸序列。在一些情况中,延胡索酸还原酶基因可包含与SEQ ID NO.52、54、56或58中任一者至少98%相同的核酸序列。在一些情况中,延胡索酸还原酶基因可包含与SEQ ID NO.52、54、56或58中任一者至少99%相同的核酸序列。在一些情况中,延胡索酸还原酶基因可包含核酸序列,该核酸序列为SEQ ID NO.52、54、56或58中任一者。
可以将其它基因置于微生物内,以通过发酵制备其它所需的最终产物。
可以基于其中将要表达核苷酸序列的微生物来优化核苷酸序列(或更具体地,由核苷酸序列编码的密码子)。可以基于各个体微生物内可用的tRNA的量对核苷酸序列进行密码子优化。换言之,可以基于相应的微生物是否通常使用特定密码子或微生物内有多少特定tRNA可用来进行保守密码子取代。
另外,在一些情况下,可以在微生物内表达编码两种或更多种催化连续反应的酶的基因。例如,编码催化连续反应的酶的两种或更多种基因可以是α-酮戊二酸脱氢酶基因和4-羟丁酸脱氢酶基因。可表达连续酶的任何组合,并且其可见于图1、2、3和7。在一些情况下,可以在微生物中表达编码三种或更多种催化连续反应的酶的基因。在一些情况下,可以在微生物中表达编码四种或更多种催化连续反应的酶的基因。在一些情况下,可以在微生物中表达编码五种或更多种催化连续反应的酶的基因。在一些情况下,可以在微生物中表达编码六种或更多种催化连续反应的酶的基因。在一些情况下,可以在微生物中表达编码七种或更多种催化连续反应的酶的基因。在一些情况下,可以在微生物中表达编码八种或更多种催化连续反应的酶的基因。在一些情况下,可以在微生物中表达编码九种或更多种催化连续反应的酶的基因。在一些情况下,可以在微生物中表达编码十种或更多种催化连续反应的酶的基因。
分离的核酸
本文描述的基因可以是分离的多核酸的形式。换言之,基因可以是从染色体中分离的自然界中不存在的形式。分离的多核酸可包含以下基因中一种或多种的核酸序列:i)α-酮戊二酸脱羧酶(kgd);ii)4-羟丁酸脱氢酶(4hbD);iii)琥珀酰CoA合成酶β亚基(sucC);iv)琥珀酰CoA合成酶α亚基(sucD);v)4-羟丁酸CoA转移酶(cat2);(vi)醛脱氢酶(aid);(vii)醇脱氢酶(adh);(viii)延胡索酸水合酶;和/或(ix)延胡索酸还原酶。例如,分离的多核酸可包含α-酮戊二酸脱羧酶基因。分离的多核酸可包含4-羟丁酸脱氢酶基因。分离的多核酸可包含琥珀酰CoA合成酶β亚基基因。分离的多核酸可包含琥珀酰CoA合成酶α亚基基因。在一些情况下,分离的多核酸可包含4-羟丁酸CoA转移酶基因。在其它情况下,分离的多核酸可包含醛脱氢酶基因。在一些情况下,分离的多核酸可包含醇脱氢酶基因。
在一些情况下,分离的多核酸可编码α-酮戊二酸脱羧酶基因。例如,分离的多核酸可包含与SEQ ID NO:2、4、6或8中任一者基本相似的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:2、4、6或8中任一者至少60%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:2、4、6或8中任一者至少65%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:2、4、6或8中任一者至少70%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:2、4、6或8中任一者至少75%)相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:2、4、6或8中任一者至少80%>相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:2、4、6或8中任一者至少81%)相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:2、4、6或8中任一者至少82%>相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ IDNO:2、4、6或8中任一者至少83%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:2、4、6或8中任一者至少84%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:2、4、6或8中任一者至少85%)相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:2、4、6或8中任一者至少86%>相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:2、4、6或8中任一者至少87%)相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:2、4、6或8中任一者至少88%>相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:2、4、6或8中任一者至少89%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:2、4、6或8中任一者至少90%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:2、4、6或8中任一者至少91%)相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:2、4、6或8中任一者至少92%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQID NO:2、4、6或8中任一者至少93%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:2、4、6或8中任一者至少94%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:2、4、6或8中任一者至少95%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:2、4、6或8中任一者至少96%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:2、4、6或8中任一者至少97%)相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:2、4、6或8中任一者至少98%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:2、4、6或8中任一者至少99%)相同的核苷酸序列。在一些情况下,分离的多核酸可包含核苷酸序列,该核苷酸序列为SEQ ID NO:2、4、6或8中任一者。
在一些情况下,分离的多核酸可编码4-羟丁酸脱氢酶。例如,分离的多核酸可包含与SEQ ID NO:12或14基本相似的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQID NO:12或14至少60%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ IDNO:12或14至少65%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:12或14至少70%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:12或14至少75%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:12或14至少80%)相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:12或14至少81%>相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:12或14至少82%>相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:12或14至少83%>相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:12或14至少84%>相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:12或14至少85%)相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:12或14至少86%>相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:12或14至少87%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:12或14至少88%>相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:12或14至少89%>相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:12或14至少90%)相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:12或14至少91%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:12或14至少92%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:12或14至少93%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:12或14至少94%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:12或14至少95%)相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:12或14至少96%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:12或14至少97%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:12或14至少98%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:12或14至少99%相同的核苷酸序列。在一些情况下,分离的多核酸可包含核苷酸序列,该核苷酸序列与SEQ ID NO:12或14相同。
在一些情况下,分离的多核酸可包含编码4-羟丁酸CoA转移酶的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:16、18或20中任一者基本相似的核苷酸序列。例如,分离的多核酸可包含与SEQ ID NO:16、18或20中任一者至少60%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:16、18或20中任一者至少65%>相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:16、18或20中任一者至少70%)相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:16、18或20中任一者至少75%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:16、18或20中任一者至少80%)相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQID NO:16、18或20中任一者至少81%>相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:16、18或20中任一者至少82%>相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:16、18或20中任一者至少83%>相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:16、18或20中任一者至少84%>相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:16、18或20中任一者至少85%>相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:16、18或20中任一者至少86%>相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:16、18或20中任一者至少87%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:16、18或20中任一者至少88%>相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQID NO:16、18或20中任一者至少89%)相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:16、18或20中任一者至少90%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:16、18或20中任一者至少91%)相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:16、18或20中任一者至少92%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:16、18或20中任一者至少93%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:16、18或20中任一者至少94%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:16、18或20中任一者至少95%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:16、18或20中任一者至少96%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:16、18或20中任一者至少97%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQID NO:16、18或20中任一者至少98%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:16、18或20中任一者至少99%相同的核苷酸序列。在一些情况下,分离的多核酸可包含核苷酸序列,该核苷酸序列与SEQ ID NO:16、18或20中任一者相同。
在一些情况下,分离的多核酸可包含编码醛脱氢酶和/或醇脱氢酶的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:22、24、26、28、30、32、34或36中任一者基本相似的核苷酸序列。例如,分离的多核酸可包含与SEQ ID NO:22、24、26、28、30、32、34或36中任一者至少60%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ IDNO:22、24、26、28、30、32、34或36中任一者至少65%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:22、24、26、28、30、32、34或36中任一者至少70%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:22、24、26、28、30、32、34或36中任一者至少75%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:22、24、26、28、30、32、34或36中任一者至少80%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:22、24、26、28、30、32、34或36中任一者至少81%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:22、24、26、28、30、32、34或36中任一者至少82%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:22、24、26、28、30、32、34或36中任一者至少83%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:22、24、26、28、30、32、34或36中任一者至少84%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:22、24、26、28、30、32、34或36中任一者至少85%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:22、24、26、28、30、32、34或36中任一者至少86%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:22、24、26、28、30、32、34或36中任一者至少87%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:22、24、26、28、30、32、34或36中任一者至少88%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:22、24、26、28、30、32、34或36中任一者至少89%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ IDNO:22、24、26、28、30、32、34或36中任一者至少90%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:22、24、26、28、30、32、34或36中任一者至少91%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:22、24、26、28、30、32、34或36中任一者至少92%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:22、24、26、28、30、32、34或36中任一者至少93%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:22、24、26、28、30、32、34或36中任一者至少94%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:22、24、26、28、30、32、34或36中任一者至少95%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:22、24、26、28、30、32、34或36中任一者至少96%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:22、24、26、28、30、32、34或36中任一者至少97%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:22、24、26、28、30、32、34或36中任一者至少98%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:22、24、26、28、30、32、34或36中任一者至少99%相同的核苷酸序列。在一些情况下,分离的多核酸可包含核苷酸序列,该核苷酸序列与SEQ ID NO:22、24、26、28、30、32、34或36中任一者相同。
在一些情况下,分离的多核酸可包含编码琥珀酰CoA合成酶β亚基的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:38基本相似的核苷酸序列。例如,分离的多核酸可包含与SEQ ID NO.38至少60%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:38至少65%)相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:38至少70%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQID NO:38至少75%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:38至少80%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:38至少81%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:38至少82%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:38至少83%)相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:38至少84%>相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:38至少85%>相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:38至少86%)相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:38至少87%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:38至少88%>相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:38至少89%)相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:38至少90%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:38至少91%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ IDNO:38至少92%)相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:38至少93%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:38至少94%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:38至少95%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:38至少96%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:38至少97%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:38至少98%)相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:38至少99%相同的核苷酸序列。在一些情况下,分离的多核酸可包含核苷酸序列,其与SEQ ID NO:38相同。
在一些情况下,分离的多核酸可包含编码琥珀酰CoA合成酶α亚基的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:40、43或44中任一者基本相似的核苷酸序列。例如,分离的多核酸可包含与SEQ ID NO:40、43或44中任一者至少60%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:40、43或44中任一者至少65%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:40、43或44中任一者至少70%)相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:40、43或44中任一者至少75%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:40、43或44中任一者至少80%>相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQID NO:40、43或44中任一者至少81%>相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:40、43或44中任一者至少82%>相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:40、43或44中任一者至少83%>相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:40、43或44中任一者至少84%>相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:40、43或44中任一者至少85%>相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:40、43或44中任一者至少86%>相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:40、43或44中任一者至少87%)相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:40、43或44中任一者至少88%>相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:40、43或44中任一者至少89%)相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:40、43或44中任一者至少90%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:40、43或44中任一者至少91%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:40、43或44中任一者至少92%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:40、43或44中任一者至少93%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:40、43或44中任一者至少94%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:40、43或44中任一者至少95%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:40、43或44中任一者至少96%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ IDNO:40、43或44中任一者至少97%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:40、43或44中任一者至少98%)相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:40、43或44中任一者至少99%相同的核苷酸序列。在一些情况下,分离的多核酸可包含核苷酸序列,该核苷酸序列与SEQ ID NO:40、43或44中任一者相同。
在一些情况下,分离的多核酸可包含编码延胡索酸水合酶的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:46、48或50中任一者基本相似的核苷酸序列。例如,分离的多核酸可包含与SEQ ID NO:46、48或50中任一者至少60%>相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:46、48或50中任一者至少65%>相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:46、48或50中任一者至少70%相同的核苷酸序列。例如,分离的多核酸可包含与SEQ ID NO:46、48或50中任一者至少75%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:46、48或50中任一者至少80%相同的核苷酸序列。例如,分离的多核酸可包含与SEQ ID NO:46、48或50中任一者至少85%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:46、48或50中任一者至少90%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:46、48或50中任一者至少91%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:46、48或50中任一者至少92%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:46、48或50中任一者至少93%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:46、48或50中任一者至少94%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:46、48或50中任一者至少95%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:46、48或50中任一者至少96%)相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:46、48或50中任一者至少97%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:46、48或50中任一者至少98%相同的核苷酸序列。在一些情况中,分离的多核酸可包含与SEQ ID NO:46、48或50中任一者至少99%相同的核苷酸序列。在一些情况下,分离的多核酸可包含核苷酸序列,该核苷酸序列为SEQ ID NO:46、48或50中任一者。
在一些情况下,分离的多核酸可包含编码延胡索酸还原酶的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:52、54、56或58中任一者基本相似的核苷酸序列。例如,分离的多核酸可包含与SEQ ID NO:52、54、56或58中任一者至少60%相同的核苷酸序列。例如,分离的多核酸可包含与SEQ ID NO:52、54、56或58中任一者至少65%相同的核苷酸序列。在一些示例中,分离的多核酸可包含与SEQ ID NO:52、54、56或58中任一者至少70%相同的核苷酸序列。例如,分离的多核酸可包含与SEQ ID NO:52、54、56或58中任一者至少75%相同的核苷酸序列。在一些示例中,分离的多核酸可包含与SEQ ID NO:52、54、56或58中任一者至少80%)相同的核苷酸序列。例如,分离的多核酸可包含与SEQ ID NO:52、54、56或58中任一者至少85%相同的核苷酸序列。在一些示例中,分离的多核酸可包含与SEQ ID NO:52、54、56或58中任一者至少90%相同的核苷酸序列。在一些示例中,分离的多核酸可包含与SEQ ID NO:52、54、56或58中任一者至少91%相同的核苷酸序列。在一些示例中,分离的多核酸可包含与SEQ ID NO:52、54、56或58中任一者至少92%相同的核苷酸序列。在一些示例中,分离的多核酸可包含与SEQ ID NO:52、54、56或58中任一者至少93%相同的核苷酸序列。在一些示例中,分离的多核酸可包含与SEQ ID NO:52、54、56或58中任一者至少94%相同的核苷酸序列。在一些示例中,分离的多核酸可包含与SEQ ID NO:52、54、56或58中任一者至少95%相同的核苷酸序列。在一些示例中,分离的多核酸可包含与SEQID NO:52、54、56或58中任一者至少96%相同的核苷酸序列。在一些示例中,分离的多核酸可包含与SEQ ID NO:52、54、56或58中任一者至少97%相同的核苷酸序列。在一些示例中,分离的多核酸可包含与SEQ ID NO:52、54、56或58中任一者至少98%相同的核苷酸序列。在一些示例中,分离的多核酸可包含与SEQ ID NO:52、54、56或58中任一者至少99%相同的核苷酸序列。在一些情况下,分离的多核酸可包含编码延胡索酸水合酶的核苷酸序列。在一些情况下,分离的多核酸可包含核苷酸序列,该核苷酸序列为SEQ ID NO:52、54、56或58中任一者。
II.制备经遗传修饰的微生物的方法
上述经遗传修饰的微生物可以通过多种方式制备。微生物可通过任何方法修饰(例如,遗传工程改造)以包含和/或表达一种或多种多核苷酸,所述一种或多种多核苷酸编码催化将可发酵碳源(例如,CI碳)转化为用于生产多碳产物例如1,4-BDO的途径中的一种或多种中间体的途径中的酶。所述酶可包括图1、2、3或7中所示的那些酶中的任何或全部。例如,可以将上述任何基因中的一种或多种插入微生物中。基因可通过表达载体插入。所述一种或多种基因也可稳定地整合到微生物的基因组中。
该方法中使用的微生物可以是上述任何微生物,包括但不限于原核生物。可以使用其它微生物,例如细菌、酵母或藻类。特别感兴趣的一种微生物是甲烷氧化菌,例如来自以下属的甲烷氧化菌:甲基杆菌(Methylobacter)、甲基微菌(Methylomicrobium),甲基单胞菌(Methylomonas),甲基暖菌(Methylocaldum),甲基球菌(Methylococcus),甲基苏玛菌(Methylosoma),甲基八叠球菌(Methylosarcina),甲基热菌(Methylothermus),甲基盐菌(Methylohalobius),甲基盖亚菌(Methylogaea),甲基卵菌(Methylovulum),泉发菌(Crenothrix),细枝发菌(Clonothrix),甲基球形菌(Methylosphaera),甲基帽菌(Methylocapsa),甲基细胞菌(Methylocella),甲基弯曲菌(Methylosinus),甲基孢囊菌(Methylocystis),甲基阿魏菌(Methyloferula),甲基海洋菌(Methylomarinum)或甲基嗜酸菌(Methyloacidophilum)。一种期望的物种可包括荚膜甲基球菌(Methylococcuscapsulatus)。
制备本文公开的经遗传修饰的微生物的示例性方法是使微生物与表达来自以下组的至少一种异源基因的核酸接触(或用其转化):第1组、第2组和/或第3组。例如,这些基因可包括:i)酮戊二酸脱羧酶(kgd);ii)4-羟丁酸脱氢酶(4hbD);iii)4-羟丁酸CoA转移酶(cat2);(iv)醛脱氢酶(aid);(v)醇脱氢酶(adh);(vi)琥珀酰CoA合成酶β亚基(sucC);(vii)琥珀酰CoA合成酶α亚基(sucD);或(viii)其任何组合。该基因还可包括延胡索酸水合酶或延胡索酸还原酶。微生物可以是能够将CI碳转化为多碳产物的任何微生物。在一些情况下,多碳产物是1,4-BDO。微生物可以是本专利申请全文中描述的任何一种微生物。
插入微生物中的一种或多种基因可以与微生物本身异源。例如,如果微生物是甲烷氧化菌,则插入的一种或多种基因可来自酵母,细菌或甲烷氧化菌的不同种。此外,一种或多种基因可以是微生物基因组的内源性部分。
遗传修饰技术
本文公开的微生物可以通过使用经典的微生物技术进行遗传工程改造。一些这样的技术一般公开于,例如,Sambrook等,1989,《分子克隆:实验室手册(Molecular Cloning:A Laboratory Manual)》,冷泉港实验室出版社(Cold Spring Harbor Labs Press)。
本文公开的经遗传修饰的微生物可包括已经插入、缺失或修饰(即,突变;例如通过插入、缺失、取代和/或转化核苷酸)的多核苷酸,于是这样的修饰提供本文提供的一种或多种酶在微生物中的所需表达(例如,过表达)效果。导致基因表达或功能增加的遗传修饰可以称为基因的扩增、过量产生、过表达、活化、增强、添加或上调。添加基因以增加基因表达可包括使基因保持在复制质粒上或将克隆的基因整合到生产微生物的基因组中。此外,增加所需基因的表达可包括将克隆的基因操作性地连接到天然或异源转录控制元件。
需要时,本文提供的一种或多种酶的表达处于调节序列的控制之下,所述调节序列在发酵过程中以时间依赖性方式直接或间接控制酶表达。诱导型启动子可用于实现这一目标。
在一些情况下,用遗传载剂转化或转染微生物,例如本文提供的包含编码酶的异源多核苷酸序列的表达载体。
为了便于来自构建体和表达载体的编码本文所述的酶的不同基因的插入和表达,可设计具有至少一个克隆位点的构建体,用于插入编码本文公开的任何酶的任何基因。克隆位点可以是多克隆位点,例如含有多个限制性位点。
转染
可采用标准转染技术将基因插入微生物中。如本文所用,术语“转染”或“转化”可指外源核酸或多核苷酸插入宿主细胞中。外源核酸或多核苷酸可以非整合型载体形式维持,例如质粒,或者可以整合到宿主细胞基因组中。术语转染(transfecting)或转染(transfection)旨在涵盖用于将核酸或多核苷酸引入微生物的所有常规技术。转染技术的示例包括但不限于磷酸钙沉淀,DEAE-葡聚糖介导的转染,脂质转染,电穿孔,显微注射,氯化铷或聚阳离子介导的转染,原生质体融合和超声处理。提供构建体在特定宿主细胞系和类型中的最佳转染频率和表达的转染方法是有利的。对于稳定的转染子,构建体经整合以便稳定地保持在宿主染色体内。在一些情况下,优选的转染是稳定的转染。
转化
可以通过许多合适的方法中的任何一种将表达载体或其它核酸引入选定的微生物中。例如,可以通过许多质粒载体转化方法中的任何一种将载体构建体引入适当的细胞。标准的氯化钙介导的细菌转化仍常用于将裸DNA引入细菌(参见例如,Sambrook等,1989,《分子克隆,实验室手册(Molecular Cloning,A Laboratory Manual),冷泉港实验室出版社(Cold Spring Harbor Laboratory Press),冷泉港,纽约州),但也可以使用电穿孔和偶联(参见例如,Ausubel等,1988,《新编分子生物学方案(Current Protocols in MolecularBiology)》,约翰威利父子出版公司(John Wiley&Sons,Inc.),纽约,纽约州)。
为了将载体构建体引入酵母或其它真菌细胞,可以使用化学转化方法(例如,Rose等,1990,《酵母遗传学方法(Methods in Yeast Genetics)》,冷泉港实验室出版社(ColdSpring Harbor Laboratory Press),冷泉港,纽约州)。可以在适合于所用选择标志物的选择性培养基上分离转化细胞。或者或另外,可以扫描平板或从平板上升起的滤器的GFP荧光以鉴定转化的克隆。
为了将包含差异表达序列的载体引入某些类型的细胞,所用的方法可取决于载体的形式。质粒载体可以通过许多转染方法中的任何一种引入,包括例如脂质介导的转染(“脂质转染(lipofection)”),DEAE-葡聚糖介导的转染,电穿孔或磷酸钙沉淀(参见例如,Ausubel等,1988,《新编分子生物学方案(Current Protocols in Molecular Biology)》,约翰威利父子出版公司(John Wiley&Sons,Inc.),纽约州,纽约)。
适用于瞬时转染多种转化和未转化或原代细胞的脂质转染试剂和方法是广泛可得的,使得脂质转染成为将构建体引入真核细胞,特别是培养中的哺乳动物细胞的有吸引力的方法。许多公司提供此类转染的试剂盒和方法。
宿主细胞能够表达编码所需蛋白质的构建体,加工蛋白质并将分泌的蛋白质运输到细胞表面进行分泌。加工包括共翻译和翻译后修饰,例如前导肽切割,GPI附着,糖基化,泛素化和二硫键形成。
微生物可以用上文所述的用于产生本文公开的一种或多种酶的表达或载体或用编码本文公开的一种或多种酶的多核苷酸转化或转染,并在针对特定微生物进行了适当改良的营养培养基中培养,以诱导启动子,选择转化子或扩增编码所需序列的基因。
例如,在甲烷氧化菌的情况下,电穿孔方法可以用于递送表达载体。
载体(和载体中包含的基因)的表达可以通过表达测定,例如qPCR或通过测量RNA的水平来验证。表达水平也可指示拷贝数。例如,如果表达水平非常高,这可表明基因的多于一个拷贝被整合到基因组中。或者,高表达可表明基因整合在高度转录的区域中,例如,在高度表达的启动子附近。还可以通过测量蛋白质水平来验证表达,例如通过蛋白质印迹。
CRISPR/cas系统
需要本文所述任何基因的方法可利用基因的精确插入或基因(或部分基因)的缺失。本文所述的方法可利用CRISPR/cas系统。例如,可使用CRISPR/cas系统(例如II型CRISPR/cas系统)产生双链断裂(DSB)。本文公开的方法中使用的Cas酶可以是Cas9,其催化DNA切割。源自化脓链球菌的Cas9或任何密切相关的Cas9的酶促作用可在靶位点序列处产生双链断裂,其与指导序列的20个核苷酸杂交并且在靶序列的20个核苷酸之后具有原型间隔区-邻近基序(PAM)。
载体可以与编码CRISPR酶,例如Cas蛋白的酶编码序列可操作地连接。可用的Cas蛋白包括1类和2类。Cas蛋白的非限制性示例包括Casl、CaslB、Cas2、Cas3、Cas4、Cas5、Cas5d、Cas5t、Cas5h、Cas5a、Cas6、Cas7、Cas8、Cas9(也称为Csnl或Csxl2)、CaslO、Csyl、Csy2、Csy3、Csy4、Csel、Cse2、Cse3、Cse4、Cse5e、Cscl、Csc2、Csa5、Csnl、Csn2、Csml、Csm2、Csm3、Csm4、Csm5、Csm6、Cmrl、Cmr3、Cmr4、Cmr5、Cmr6、Csbl、Csb2、Csb3、Csxl7、Csxl4、CsxlO、Csxl6、CsaX、Csx3、Csxl、Csxl S、Csfl、Csf2、CsO、Csf4、Csdl、Csd2、Cstl、Cst2、Cshl、Csh2、Csal、Csa2、Csa3、Csa4、Csa5、C2cl、C2c2、C2c3、Cpfl、CARF、DinG、其同源物或其经修饰形式。未修饰的CRISPR酶可具有DNA切割活性,例如Cas9。CRISPR酶可指导靶序列上的一条或两条链的切割,例如靶序列内和/或靶序列的互补序列内。例如,CRISPR酶可指导在距离靶序列的第一或最后核苷酸的约1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500或更多碱基对内切割一条或两条链。可采用编码相对于相应的野生型酶突变的CRISPR酶的载体,从而突变的CRISPR酶缺乏切割含有靶序列的靶多核苷酸的一条或两条链的能力。
可以使用编码包含一个或多个核定位序列(NLS)的CRISPR酶的载体。例如,可使用或可使用约1、2、3、4、5、6、7、8、9、10个NLS。CRISPR酶可包含位于氨基末端处或附近的NLS,位于羧基末端处或附近的约为或大于约1、2、3、4、5、6、7、8、9、10个NLS,或这些的任何组合(例如,氨基末端处的一个或多个NLS和羧基末端处的一个或多个NLS)。当存在多于一个NLS时,可以独立地选择每个NLS,从而单个NLS可以存在于多于一个拷贝中和/或与一个或多个拷贝中存在的一个或多个其它NLS组合。
该方法中使用的CRISPR酶可包含至多6个NLS。当NLS的最近氨基酸处于沿来自N-或C-末端的多肽链的约50个氨基酸(例如,处于1、2、3、4、5、10、15、20、25、30、40或50个氨基酸)内时,认为NLS在N-或C-末端附近。
指导RNA
如本文所用,术语“指导RNA”及其语法等同形式可指可以对靶DNA具有特异性并且可与Cas蛋白形成复合物的RNA。RNA/Cas复合物可协助将Cas蛋白“引导”到靶DNA。
本文公开的方法还可包括向细胞或胚胎引入至少一种指导RNA或核酸,例如编码至少一种指导RNA的DNA。指导RNA可以与RNA引导的内切核酸酶相互作用以将内切核酸酶引导至特定的靶位点,在该位点,指导RNA碱基的5'末端与染色体序列中的特定原型间隔区序列配对。
指导RNA可包含两种RNA,例如CRISPR RNA(crRNA)和反式激活crRNA(tracrRNA)。指导RNA有时可包含单链RNA,或通过融合crRNA和tracrRNA的一部分(例如,功能部分)形成的单指导RNA(sgRNA)。指导RNA也可以是包含crRNA和tracrRNA的双RNA。此外,crRNA可与靶DNA杂交。
如上所述,指导RNA可以是表达产物。例如,编码指导RNA的DNA可以是包含编码指导RNA的序列的载体。通过用分离的指导RNA或包含编码指导RNA和启动子的序列的质粒DNA转染细胞或微生物,可以将指导RNA转移到细胞或微生物中。还可以其它方式(例如使用病毒介导的基因递送)将指导RNA转移到细胞或微生物中。
可以分离指导RNA。例如,指导RNA可以分离的RNA的形式转染到细胞或微生物中。可以使用本领域已知的任何体外转录系统通过体外转录制备指导RNA。指导RNA可以以分离的RNA的形式转移到细胞中,而不是以包含指导RNA的编码序列的质粒的形式转移到细胞中。
指导RNA可包含三个区域:5'末端的第一区域,其可与染色体序列中的靶位点互补,可形成茎环结构的第二内部区域,和第三3'区域,其可为单链。每个指导RNA的第一区域也可以是不同的,使得每个指导RNA将融合蛋白引导至特定的靶位点。此外,每个指导RNA的第二和第三区域在所有指导RNA中可以是相同的。
指导RNA的第一区域可以与染色体序列中的靶位点处的序列互补,从而指导RNA的第一区域可以与靶位点碱基配对。在一些情况中,指导RNA的第一区域可包含或包含约10个核苷酸-25个核苷酸(即,10nt-25nt;或约10nt-约25nt;或10nt-约25nt;或约10nt-25nt)或更多。例如,指导RNA的第一区域和染色体序列中的靶位点之间的碱基配对区域可以是或可以约是10、11、12、13、14、15、16、17、18、19、20、22、23、24、25或更多个核苷酸长。有时,指导RNA的第一区域长度可以是或可以约是19、20或21个核苷酸。
指导RNA还可包含形成二级结构的第二区域。例如,由指导RNA形成的二级结构可包含茎(或发夹)和环。环和茎的长度可以变化。例如,环的长度可以是或可以是约3-10个核苷酸,并且茎的长度可以是或可以是约6-20个碱基对。茎可包含1-10个或1-约10个核苷酸的一个或多个突出。第二区域的总长度的可以在或可以在约16-60个核苷酸的长度范围内。例如,环的长度可以是或可以是约4个核苷酸,茎的长度可以是或可以是约12个碱基对。
指导RNA还可包含3'末端的第三区域,其可以基本上是单链的。例如,第三区域有时不与感兴趣的细胞中的任何染色体序列互补,并且有时不与指导RNA的其余部分互补。此外,第三区域的长度可变化。第三区域的长度可以大于或大于约4个核苷酸。例如,第三区域的长度可以在或可以在约5-60个核苷酸的长度范围内。
可将指导RNA作为RNA分子引入细胞或胚胎中。例如,RNA分子可在体外转录和/或可化学合成。RNA可从合成的DNA分子转录,例如基因片段。然后可以将指导RNA作为RNA分子引入细胞或胚胎中。指导RNA还可以非RNA核酸分子(例如DNA分子)的形式引入细胞或胚胎中。例如,编码指导RNA的DNA可以与启动子控制序列可操作地连接,用于在感兴趣的细胞或胚胎中表达指导RNA。RNA编码序列可以与RNA聚合酶III(Pol III)识别的启动子序列可操作地连接。可用于表达指导RNA的质粒载体包括但不限于px330载体和px333载体。在一些情况下,质粒载体(例如,px333载体)可包含两个编码指导RNA的DNA序列。
编码指导RNA的DNA序列也可以是载体的一部分。此外,载体可包含其它表达控制序列(例如,增强子序列,Kozak序列,多腺苷酸化序列,转录终止序列等),选择标志物序列(例如抗生素抗性基因),复制起点等。编码指导RNA的DNA分子也可以是线性的。编码指导RNA的DNA分子也可以是环状的。
当将编码RNA引导的核酸内切酶和指导RNA的DNA序列引入细胞时,每个DNA序列可以是分开的分子的部分(例如,含有RNA引导的核酸内切酶编码序列的一个载体和含有指导RNA编码序列的第二载体),或两者可以是同一分子的部分(例如,含有RNA引导的核酸内切酶和指导RNA两者的编码(和调节)序列的一个载体)。
位点特异性插入
在本文公开的任何方法中,一个或多个基因的插入可以是位点特异性的。例如,可以在启动子附近插入一个或多个基因。
通过将DNA引入微生物可产生微生物的靶向的基因座的修饰,其中DNA与靶基因座具有同源性。DNA可包括标志物基因,允许选择包含整合的构建体的细胞。靶载体中的同源DNA可与靶基因座处的DNA重组。标志物基因的两侧可侧接同源DNA序列、3'重组臂和5'重组臂。
多种酶可催化外源DNA插入微生物基因组。例如,位点特异性重组酶可以簇集成具有不同生物化学特性的两个蛋白质家族,即酪氨酸重组酶(其中DNA与酪氨酸残基共价连接)和丝氨酸重组酶(其中共价连接发生在丝氨酸残基处)。在一些情况下,重组酶可包含Cre,Φ31整合酶(源自链霉菌噬菌体Φ31的丝氨酸重组酶),或噬菌体衍生的位点特异性重组酶(包括Flp,λ整合酶,噬菌体HK022重组酶,噬菌体R4整合酶和噬菌体TP9011整合酶)。
CRISPR/Cas系统可用于进行位点特异性插入。例如,可通过CRISPR/cas制备基因组中插入位点上的切口(nick),以促进转基因在插入位点的插入。
本文所述的方法可利用可用于允许DNA或RNA构建体进入宿主细胞的技术,其包括但不限于,磷酸钙/DNA共沉淀、将DNA显微注射到细胞核中、电穿孔、与完整细胞的细菌原生质体融合、转染、脂质转染、感染、颗粒轰击,精子介导的基因转移或任何其它技术。
本文公开的某些方面可以利用载体(包括上述载体)。可以使用任何质粒和载体,只要它们在选定的宿主微生物中可复制和存活即可。可以将本领域已知的载体和可商购的载体(及其变体或衍生物)改造成包括用于该方法的一个或多个重组位点。可以使用的载体包括但不限于真核表达载体,例如pFastBac,pFastBacHT,pFastBacDUAL,pSFV,和pTet-Splice(Invitrogen),pEUK-Cl,pPUR,pMAM,pMAMneo,pBHOl,pBI121,pDR2,pCMVEBNA,和pYACneo(Clontech),pSVK3,pSVL,pMSG,pCHl lO,和pKK232-8(Pharmacia公司),pXTl,pSG5,pPbac,pMbac,pMClneo,和pOG44(Stratagene公司),和pYES2,pAC360,pBlueBa-cHisA、B和C,pVL1392,pBlueBaclll,pCDM8,pcDNAl,pZeoSV,pcDNA3,pREP4,pCEP4,和pEBVHis(Invitrogen公司),及其变体或衍生物。
这些载体可用于表达感兴趣的基因或基因的部分。可通过使用已知方法插入基因或基因的部分,例如基于限制酶的技术。
III.其它方法
制备有用化学品
本文所述的经遗传修饰的微生物可用于制备有用的化学品和其它产品,包括但不限于,α-酮戊二酸盐或酯,琥珀酸盐或酯,柠檬酸盐或酯和异柠檬酸盐或酯,γ-羟丁酸盐或酯,4-羟基丁醛,1,4-BDO,四氢呋喃(THF),聚对苯二酸丁二醇酯(PBT)和聚氨酯。
微生物可以是贯穿全文讨论的任何微生物,包括但不限于原核生物,例如甲烷氧化菌。
碳底物可以是贯穿全文讨论的任何碳底物,包括但不限于CI碳底物,例如甲烷。
α-酮戊二酸盐或酯(α-ketoglutarate)
关于α-酮戊二酸盐或酯,本文公开的一种方法是制备α-酮戊二酸盐或酯的方法,其包括:(a)使经遗传修饰的微生物与碳底物(例如,CI碳底物)接触,其中所述微生物包含编码异柠檬酸脱氢酶(icdA)的至少一种异源基因;和(b)使微生物生长以产生α-酮戊二酸盐或酯。所述微生物可以是能够将CI碳转化为多碳产物的微生物。例如,可使用甲烷氧化菌。此外,可使用全文描述的任何经遗传修饰的微生物。产生的α-酮戊二酸盐或酯可以是基本上纯的。可以回收产生的α-酮戊二酸盐或酯。另外,也可以回收非α-酮戊二酸盐或酯产物(即副产物)。
α-酮戊二酸盐或酯可由同一微生物、不同微生物或在微生物外部(即体外)通过α-酮戊二酸脱羧酶(kgd)和/或α-酮戊二酸脱氢酶进一步加工。相同的微生物可包含α-酮戊二酸脱羧酶(kgd)和/或α-酮戊二酸脱氢酶。在其它情况下,不同的微生物可包含α-酮戊二酸脱羧酶(kgd)和/或α-酮戊二酸脱氢酶或从细胞分离α-酮戊二酸脱羧酶(kgd)和/或α-酮戊二酸脱氢酶。如果α-酮戊二酸脱羧酶(kgd)和/或α-酮戊二酸脱氢酶位于不同的微生物中或从细胞中分离出来,则该微生物/分离的酶可以转化培养基中的α-酮戊二酸盐或酯(通过补充添加或通过由产生α-酮戊二酸盐或酯的微生物分泌)。α-酮戊二酸脱羧酶(kgd)转化α-酮戊二酸盐或酯可产生琥珀酸半醛。α-酮戊二酸脱氢酶对α-酮戊二酸盐或酯的转化可产生琥珀酸CoA。
琥珀酸半醛或琥珀酸CoA进一步转化为各种产物,例如γ-羟丁酸盐或酯,或琥珀酸半醛可通过不同的发酵过程或通过不同的催化转化而发生。
琥珀酸盐或酯(succinate)
关于琥珀酸盐或酯,本文公开的一种方法是制备琥珀酸盐或酯的方法,该方法包括:(a)使经遗传修饰的微生物与碳底物(例如,CI碳底物)接触,其中所述微生物包含编码琥珀酰CoA合成酶的异源基因;和(b)使微生物生长以产生琥珀酸盐或酯。本文公开的另一种方法是制备琥珀酸盐或酯的方法,该方法包括:(a)使经遗传修饰的微生物与碳底物(例如,CI碳底物)接触,其中所述微生物包含编码延胡索酸还原酶的异源基因;和(b)使微生物生长以产生琥珀酸盐或酯。所述微生物可以是能够将CI碳转化为多碳产物的微生物。例如,可使用甲烷氧化菌。此外,可使用全文描述的任何经遗传修饰的微生物。产生的琥珀酸盐或酯可以是基本上纯的。可以回收产生的琥珀酸盐或酯。另外,也可以回收非琥珀酸盐或酯产物(即副产物)。
琥珀酸可以由同一微生物、不同微生物或在微生物外部(即体外)通过琥珀酰CoA合成酶β亚基(SucC)进一步加工。相同的微生物可包含琥珀酰CoA合成酶β亚基。在其它情况下,不同的微生物可包含琥珀酰CoA合成酶β亚基或从细胞分离出琥珀酰CoA合成酶β亚基。如果琥珀酰CoA合成酶β亚基在不同的微生物中或从细胞中分离,则微生物/分离的酶可以转化培养基中的琥珀酸盐或酯(通过补充添加或通过产生琥珀酸盐或酯的微生物分泌)。琥珀酰CoA合成酶β亚基对琥珀酸盐或酯的转化可产生琥珀酰CoA。
琥珀酰CoA向各种产物的进一步转化可以通过不同的发酵过程或通过不同的催化转化进行。
延胡索酸盐或酯(fumarate)
关于延胡索酸盐或酯,本文公开的一种方法是制备延胡索酸盐或酯的方法,其包括:(a)使经遗传修饰的微生物与碳底物(例如,CI碳底物)接触,其中所述微生物包含编码延胡索酸水合酶的异源基因;和(b)使微生物生长以产生延胡索酸盐或酯。所述微生物可以是能够将CI碳转化为多碳产物的微生物。例如,可使用甲烷氧化菌。此外,可使用全文描述的任何经遗传修饰的微生物。产生的延胡索酸盐或酯可以是基本上纯的。可以回收产生的延胡索酸盐或酯。另外,还可以回收非延胡索酸盐或酯产物(即副产物)。
延胡索酸盐或酯可以由相同的微生物、不同的微生物或在微生物外部(即,体外)通过延胡索酸还原酶进一步加工。相同的微生物可包含延胡索酸还原酶。在其它情况下,不同的微生物可包含延胡索酸还原酶,或者延胡索酸还原酶是从细胞中分离出来的。如果延胡索酸还原酶在不同的微生物中或从细胞中分离出来,则微生物/分离的酶可以转化培养基中的延胡索酸盐或酯(通过补充添加或通过产生延胡索酸盐或酯的微生物分泌)。延胡索酸还原酶对延胡索酸盐或酯的转化产生琥珀酸盐或酯。
琥珀酸盐或酯向各种产物的进一步转化可以通过不同的发酵过程或通过不同的催化转化而发生。
柠檬酸盐或酯(citrate)
关于柠檬酸盐或酯,本文公开的一种方法是制备柠檬酸盐或酯的方法,其包括:(a)使经遗传修饰的微生物与碳底物(例如,CI碳底物)接触,其中所述微生物包含编码柠檬酸合酶的异源基因;和(b)使微生物生长以产生柠檬酸盐或酯。所述微生物可以是能够将CI碳转化为多碳产物的微生物。例如,可使用甲烷氧化菌。此外,可使用全文描述的任何经遗传修饰的微生物。产生的柠檬酸盐或酯可以是基本上纯的。可以回收产生的柠檬酸盐或酯。另外,也可以回收非柠檬酸盐或酯产物(即,副产物)。
柠檬酸盐或酯可由相同的微生物、不同的微生物或在微生物外部(即体外)通过乌头酸水合酶1进一步加工。同一微生物可包含乌头酸水合酶1。在其它情况下,不同的微生物可包括乌头酸水合酶1,或乌头酸水合酶1可从细胞分离。如果乌头酸水合酶1在不同的微生物中或从细胞中分离,则该微生物/分离的酶可以转化培养基中的柠檬酸盐或酯(通过补充添加或通过产生柠檬酸盐或酯的微生物分泌)。乌头酸水合酶1转化柠檬酸盐或酯可产生异柠檬酸盐或酯。
异柠檬酸盐或酯向各种产物的进一步转化可以通过不同的发酵过程或通过不同的催化转化而发生。
异柠檬酸盐或酯(isocitrate)
关于异柠檬酸盐或酯,本文公开的一种方法是制备异柠檬酸盐或酯的方法,其包括:(a)使经遗传修饰的微生物与碳底物(例如,CI碳底物)接触,其中所述微生物包含编码乌头酸水合酶1的异源基因;和(b)使微生物生长以产生异柠檬酸盐或酯。所述微生物可以是能够将CI碳转化为多碳产物的微生物。例如,可使用甲烷氧化菌。此外,可使用全文描述的任何经遗传修饰的微生物。产生的异柠檬酸盐或酯可以是基本上纯的。可以回收产生的异柠檬酸盐或酯。另外,还可以回收非异柠檬酸盐或酯产物(即副产物)。
异柠檬酸盐或酯可以由相同的微生物、不同的微生物或在微生物外部(即体外)通过异柠檬酸脱氢酶进一步加工。相同的微生物可包含异柠檬酸脱氢酶。在其它情况下,不同的微生物可包含异柠檬酸脱氢酶或从细胞分离出异柠檬酸脱氢酶。如果异柠檬酸脱氢酶在不同的微生物中或从细胞中分离出来,则微生物/分离的酶可以转化培养基中的异柠檬酸盐或酯(通过补充添加或通过产生异柠檬酸盐或酯的微生物分泌)。通过异柠檬酸脱氢酶转化异柠檬酸盐或酯可以产生α-酮戊二酸盐或酯。
通过不同的发酵过程或通过不同的催化转化,可以进一步将α-酮戊二酸盐或酯转化为各种产物。
y-羟丁酸盐或酯(y-hydroxybutyrate)
关于γ-羟丁酸盐或酯,本文公开的一种方法是制备γ-羟丁酸盐或酯的方法,其包括:(a)使经遗传修饰的微生物与碳底物(例如,CI碳底物)接触,其中所述微生物包含编码4-羟丁酸脱氢酶(4hbD)的异源基因;和(b)使微生物生长以产生γ-羟丁酸盐或酯。所述微生物可以是能够将CI碳转化为多碳产物的微生物。例如,可使用甲烷氧化菌。此外,可使用全文描述的任何经遗传修饰的微生物。产生的γ-羟丁酸盐或酯可以是基本上纯的。可以回收产生的γ-羟丁酸盐或酯。另外,还可以回收非γ-羟丁酸盐或酯产物(即,副产物)。
γ-羟丁酸盐或酯可以由相同的微生物、不同的微生物或在微生物外部(即,体外)通过4-羟丁酸CoA转移酶(Cat2)进一步加工。相同的微生物可包含4-羟丁酸CoA转移酶。在其它情况下,不同的微生物可包含4-羟丁酸CoA转移酶,或者从细胞中分离出4-羟丁酸CoA转移酶。如果4-羟丁酸CoA转移酶在不同的微生物中或从细胞中分离出来,则微生物/分离的酶可以转化培养基中的γ-羟丁酸盐或酯(通过补充添加或通过产生γ-羟丁酸盐或酯的微生物分泌))。由4-羟丁酸CoA转移酶转化γ-羟丁酸盐或酯可产生4-羟基丁酰CoA。
通过不同的发酵过程或通过不同的催化转化,可以将4-羟基丁酰CoA进一步转化为各种产物。
4-羟基丁醛
关于4-羟基丁醛,本文公开的一种方法是制备4-羟基丁醛的方法,其包括:(a)使经遗传修饰的微生物与碳底物(例如,CI碳底物)接触,其中所述微生物包含编码醛脱氢酶的异源基因;和(b)使微生物生长以产生4-羟基丁醛。所述微生物可以是能够将CI碳转化为多碳产物的微生物。例如,可使用甲烷氧化菌。此外,可使用全文描述的任何经遗传修饰的微生物。产生的4-羟基丁醛可以是基本上纯的。可以回收产生的4-羟基丁醛。另外,还可以回收非4-羟基丁醛产物(即副产物)。
4-羟基丁醛可由相同的微生物,不同的微生物或在微生物外部(即,体外)通过醇脱氢酶进一步加工。相同的微生物可包含醇脱氢酶。在其它情况下,不同的微生物可包含醇脱氢酶或从细胞分离出醇脱氢酶。如果醇脱氢酶在不同的微生物中或从细胞中分离出来,则微生物/分离的酶可以转化培养基中的4-羟基丁醛(通过补充添加或通过产生4-羟基丁醛的微生物分泌)。醇脱氢酶转化4-羟基丁醛可产生4-羟基丁酰CoA。
通过不同的发酵过程或通过不同的催化转化,可以将4-羟基丁酰CoA进一步转化为各种产物。
1,4-BDO
关于1,4-BDO,本文公开的一种方法是制备1,4-BDO的方法,其包括(a)使经遗传修饰的微生物与碳底物(例如,CI碳底物)接触,其中所述微生物包括编码以下物质的至少一种异源基因:(i)丙酮酸脱氢酶(aceEF);(ii)二氢脂酰脱氢酶(lpdA);(iii)柠檬酸合酶(gltA);(iv)乌头酸水合酶1(acnA);(v)异柠檬酸脱氢酶(icdA);(vi)kgd;(vii)4-羟丁酸脱氢酶(4hbD);(viii)4-羟丁酸CoA转移酶(cat2);(ix)醛脱氢酶(aid);(x)醇脱氢酶(adh);(xi)琥珀酰CoA合成酶β亚基(sucC);(xii)琥珀酰CoA合成酶α亚基(sucD);(xiii)延胡索酸水合酶(fum);(xiv)延胡索酸还原酶(frd);或(xv)其任何组合;和(b)使微生物生长以产生1,4-BDO。
所述微生物可以是能够将CI碳转化为多碳产物的微生物。例如,可使用甲烷氧化菌。此外,可使用全文描述的任何经遗传修饰的微生物。
用该方法生产的1,4-BDO可以是基本上纯的。可以回收产生的1,4-BDO。另外,也可以回收非1,4-BDO产物(即副产物)。
四氢呋喃(THF)
THF可以通过使用催化剂来制备。例如,另一种制备THF的方法是包括以下步骤的方法:(a)使经遗传修饰的微生物与碳底物(例如,CI碳底物)接触,其中所述微生物包含编码以下物质的至少一种异源基因:(i)丙酮酸脱氢酶(aceEF);(ii)二氢脂酰脱氢酶(lpdA);(iii)柠檬酸合酶(gltA);(iv)乌头酸水合酶1(acnA);(v)异柠檬酸脱氢酶(icdA);(vi)kgd;(vii)4-羟丁酸脱氢酶(4hbD);(viii)4-羟丁酸CoA转移酶(Cat2);(ix)醛脱氢酶(Aid);(x)醇脱氢酶(Adh);(xi)琥珀酰CoA合成酶β亚基(SucC);(xii)琥珀酰CoA合成酶α亚基(SucD);(xiii)延胡索酸水合酶(fum);(xiv)延胡索酸还原酶(frd);或(xv)其任何组合;和(b)使微生物生长以产生1,4-BDO,(c)使来自(b)的1,4-BDO与催化剂接触以产生THF。在一些情况下,可以在进行(c)之前分离或纯化1,4-BDO。
所述微生物可以是能够将CI碳转化为多碳产物的微生物。例如,可使用甲烷氧化菌。此外,可使用全文描述的任何经遗传修饰的微生物。
催化剂可以是酶催化剂或非酶催化剂。催化剂可包括能够产生THF的任何催化剂。例如,THF可通过在酸性催化剂例如硫酸存在下使1,4-BDO脱水来获得(参见例如,美国专利号7,465,816)。已经使用其它催化剂(例如氧化铝催化剂,二氧化硅-氧化铝催化剂,氧化铝负载的氧化钨催化剂,杂多酸催化剂或硫酸锆催化剂)使1,4-BDO脱水以形成THF。
THF一经转化即可分离和/或纯化。THF可以是基本上纯的。
聚对苯二酸丁二醇酯(PBT)
PBT可以通过使用催化剂来制备。例如,另一种制备PBT的方法是包括以下步骤的方法:(a)使经遗传修饰的微生物与碳底物(例如,CI碳底物)接触,其中所述微生物包含编码以下物质的至少一种异源基因:(i)丙酮酸脱氢酶(aceEF);(ii)二氢脂酰脱氢酶(lpdA);(iii)柠檬酸合酶(gltA);(iv)乌头酸水合酶1(acnA);(v)异柠檬酸脱氢酶(icdA);(vi)kgd;(vii)4-羟丁酸脱氢酶(4hbD);(viii)4-羟丁酸CoA转移酶(Cat2);(ix)醛脱氢酶(Aid);(x)醇脱氢酶(Adh);(xi)琥珀酰CoA合成酶β亚基(SucC);(xii)琥珀酰CoA合成酶α亚基(SucD);(xiii)延胡索酸水合酶(fum);(xiv)延胡索酸还原酶(frd);或(xv)其任何组合;和(b)使微生物生长以产生1,4-BDO,(c)使来自(b)的1,4-BDO酯交换以产生PBT。酯交换(transesterification)可使用对苯二酸二甲酯(DMT)进行。在一些情况下,该方法还可包括(d)当1,4-BDO与DMT(例如,(c)的产物)接触时,酯交换产物的缩聚。
所述微生物可以是能够将CI碳转化为多碳产物的微生物。例如,可使用甲烷氧化菌。此外,可使用全文描述的任何经遗传修饰的微生物。
其它方法可包括PBT的连续生产过程,其中1,4-BDO与DMT进行酯交换后,进行预聚合过程。随后进行缩聚。
在一些情况下,可以在进行酯交换反应之前分离或纯化1,4-BDO。
PBT一经产生即可分离和/或纯化。PBT可以是基本上纯的。
聚氨酯
聚氨酯可以通过将1,4-BDO与二羧酸/酸酐缩合来制备。例如,另一种制备聚氨酯的方法是包括以下步骤的方法:(a)使经遗传修饰的微生物与碳底物(例如,CI碳底物)接触,其中所述微生物包含编码以下物质的至少一种异源基因:(i)丙酮酸脱氢酶(aceEF);(ii)二氢脂酰脱氢酶(lpdA);(iii)柠檬酸合酶(gltA);(iv)乌头酸水合酶1(acnA);(v)异柠檬酸脱氢酶(icdA);(vi)kgd;(vii)4-羟丁酸脱氢酶(4hbD);(viii)4-羟丁酸CoA转移酶(Cat2);(ix)醛脱氢酶(Aid);(x)醇脱氢酶(Adh);(xi)琥珀酰CoA合成酶β亚基(SucC);(xii)琥珀酰CoA合成酶α亚基(SucD);(xiii)延胡索酸水合酶(fum);(xiv)延胡索酸还原酶(frd);或(xv)其任何组合;和(b)使微生物生长以产生1,4-BDO,(c)使来自(b)的1,4-BDO与二羧酸/酸酐缩合以产生聚氨酯。在一些情况下,二羧酸/酸酐可以是脂族或芳族的。
所述微生物可以是能够将CI碳转化为多碳产物的微生物。例如,可使用甲烷氧化菌。此外,可使用全文描述的任何经遗传修饰的微生物。
在一些情况下,可以在进行缩合工艺之前分离或纯化1,4-BDO。
聚氨酯一经制成即可分离和/或纯化。聚氨酯可以是基本上纯的。
应当理解,本发明的方法可以与用于由PBT、THF和/或聚氨酯生产下游产物的一种或多种方法整合或相关联。例如,所述方法可以将PBT、THF和/或聚氨酯直接或间接地供给到足以转化或生产其它有用的化学产物的化学过程或反应中。在一些实施方式中,如前所述,可以直接通过中间体化合物PBT、THF和/或聚氨酯将1,4-BDO转化为一种或多种化学产物,而无需在所述一种或多种化学产物产生的后续应用之前回收来自所述方法的PBT、THF和/或聚氨酯。可以由1,4-BDO、PBT、THF和/或聚氨酯制成的一些与商业相关的产品包括但不限于氨纶(Spandex)。
IV.发酵
通常,本文公开的微生物应当用于适合将CI碳(例如甲烷)转化为1,4-BDO(或其它所需产物)的发酵条件。应考虑的反应条件包括温度,介质流速,pH,孵育时间,介质氧化还原电位,搅拌速率(如果使用连续搅拌釜反应器),接种物水平,最大底物浓度和底物引入生物反应器的速率,以确保底物水平不会成为限制性因素,以及最大产物浓度,以避免产物抑制。
最佳反应条件部分取决于所用的特定微生物。然而,通常优选在高于环境压力的压力下进行发酵。在升高的压力下操作允许显著增加CI碳从气相转移到液相的速率,在该速率下,CI碳可以被微生物吸收,作为生产1,4-BDO的碳源。这进而意味着当生物反应器保持在高压而不是大气压下时,保留时间(定义为生物反应器中的液体体积除以输入气体流速)可以减小。
加压系统的使用可大大减少所需生物反应器的体积,并因此大大降低发酵设备的资金成本。在一些情况下,反应器体积可以与反应器操作压力的增加成线性比例降低,即在10个大气压下操作的生物反应器仅需要是在1个大气压下操作的生物反应器的体积的十分之一。
还希望含有气态底物的CI-碳底物(如甲烷)的引入速率能确保液相中CI-碳底物(如甲烷)的浓度不会受到限制。这是因为CI-碳底物(例如甲烷)限制条件的结果可能是培养物消耗1,4-BDO产物(或其它所需产物)。
发酵条件
可以基于所用微生物优化pH。例如,在甲烷氧化菌发酵甲烷至所需产物的过程中所用pH可为4-10。在其它情况下,pH可以是5-9;6-8;6.1-7.9;6.2-7.8;6.3-7.7;6.4-7.6;或6.5-7.5。例如,pH可以为6.6至7.4。在一些情况下,pH可以为5至9。在一些情况下,pH可以为6至8。在一些情况下,pH可以为6.1至7.9。在一些情况下,pH可以为6.2至7.8。在一些情况下,pH可以为6.3至7.7。在一些情况下,pH可以为6.4至7.6。在一些情况下,pH可以为6.5至7.5。在一些情况下,用于甲烷氧化菌发酵的pH可以大于6。
还可以基于使用的微生物调节温度。例如,在甲烷氧化菌发酵甲烷至所需产物的过程中所用温度可为30℃至45℃。在其它情况下,发酵温度可以为30℃至45℃;31℃至44℃;32℃至43℃;33℃至42℃;34℃至41℃;35℃至40℃。例如,温度可以是36℃至39℃(例如,36℃,37℃,38℃或39℃)。在一些情况下,温度可以是30℃至45℃。在一些情况下,温度可以是31℃至44℃。在一些情况下,温度可以是32℃至43℃。在一些情况下,温度可以是33℃至42℃。在一些情况下,温度可以是34℃至41℃。在一些情况下,温度可以是35℃至40℃。
氧气和其它气体如气态CI碳底物(如甲烷)的可用性会影响产量和发酵速率。例如,当考虑氧气可用性时,发酵培养基中溶解氧(DO)的百分比可为1%至40%。在一些情况下,DO浓度可为1.5%至35%;2%至30%;2.5%至25%;3%至20%;4%至19%;5%至18%;6%至17%;7%至16%;8%至15%;9%至14%;10%至13%;或11%至12%。例如,在一些情况下,DO浓度可为2%至30%。在其它情况下,DO可为3%至20%。在一些情况下,DO可为4%至10%。在一些情况下,DO可为1.5%至35%。在一些情况下,DO可为2.5%至25%。在一些情况下,DO可为4%至19%。在一些情况下,DO可为5%至18%。在一些情况下,DO可为6%至17%。在一些情况下,DO可为7%至16%。在一些情况下,DO可为8%至15%。在一些情况下,DO可为9%至14%。在一些情况下,DO可为10%至13%。在一些情况下,DO可为11%至12%。在一些情况下,DO浓度可低于1%。例如,DO可以是0%至1%。
当使用甲烷氧化菌时,甲烷物质的类型会对产量和发酵速率产生影响。例如,可以使用天然气,其通常具有高于85%(例如,高于90%)甲烷的甲烷含量。天然气中的其它组分可包括但不限于乙烷,丙烷,异丁烷,正丁烷,异戊烷,正戊烷,己烷加(hexanes plus),氮,二氧化碳,氧,氢和硫化氢。
也可以使用“纯”甲烷。在这些情况下,甲烷通常来自罐(tank)。这些罐中包含的甲烷的甲烷含量范围为90%或更高,剩余的气体为其它气体(如二氧化碳)。例如,在发酵过程中可以使用甲烷含量大于90%的气体。在一些情况下,甲烷浓度可以大于90%;91%;92%;93%;94%;95%;96%;97%;98%;99%;或99.9%。在一些情况下,甲烷浓度可为90%甲烷,10%是其它气体(例如二氧化碳)。在其它情况下,甲烷浓度可为91%甲烷,9%是其它气体(例如二氧化碳)。在一些情况下,甲烷浓度可为92%甲烷,8%是其它气体(例如二氧化碳)。在一些情况下,甲烷浓度可为93%甲烷,7%是其它气体(例如二氧化碳)。在一些情况下,甲烷浓度可为94%甲烷,6%是其它气体(例如二氧化碳)。在一些情况下,甲烷浓度可为95%甲烷,5%是其它气体(例如二氧化碳)。在其它情况下,甲烷浓度可为96%甲烷,4%是其它气体(例如二氧化碳)。在一些情况下,甲烷浓度可为97%甲烷,3%是其它气体(例如二氧化碳)。在一些情况下,甲烷浓度可为98%甲烷,2%是其它气体(例如二氧化碳)。在一些情况下,甲烷浓度可为99%甲烷,1%是其它气体(例如二氧化碳)。在一些情况下,甲烷浓度可为99.9%甲烷,0.1%是其它气体(例如二氧化碳)。
孵育时间长短可对1,4-BDO(或其它产品)效价产生重大影响。例如,在72小时之前,微生物(例如甲烷氧化菌)可产生的产物很少或没有。在这些情况下,可能需要将微生物孵育72小时以上。因此,在一些情况下,可以将全文公开的微生物发酵至少73小时、74小时、75小时、76小时、77小时、78小时、79小时、80小时、81小时、82小时、83小时、84小时、85小时、86小时、87小时、89小时、90小时、91小时、92小时、93小时、94小时、95小时、96小时、97小时、98小时、99小时、100小时、101小时、102小时、103小时、104小时、105小时、106小时、107小时、108小时、109小时、110小时、111小时、112小时、113小时、114小时、115小时、116小时、117小时、118小时、119小时、120小时、121小时、122小时、123小时、124小时、125小时、126小时、127小时、128小时、129小时、130小时、131小时、132小时、133小时、134小时、135小时或136小时。在一些情况下,全文公开的微生物可发酵至少84小时。在一些情况下,全文公开的微生物可发酵至少96小时。在一些情况下,全文公开的微生物可发酵至少108小时。在一些情况下,全文公开的微生物可发酵至少120小时。在一些情况下,全文公开的微生物可发酵至少132小时。在一些情况下,全文公开的微生物可发酵至少144小时。在一些情况下,全文公开的微生物可发酵至少156小时。
生物反应器
发酵反应可以在任何合适的生物反应器中进行。在本发明的一些实施方式中,生物反应器可以包括第一生长反应器(其中培养微生物),和第二发酵反应器(向其中供给来自生长反应器的发酵液,且在其中产生大部分发酵产物(例如1,4-BDO))。
产物回收
本文公开的微生物的发酵可在营养培养基中产生包含所需产物(例如1,4-BDO、THF、PBT和/或聚氨酯)和/或一种或多种副产物以及微生物(例如,经遗传修饰的甲烷氧化菌)的发酵液。
本文的微生物和方法可以惊人的高效率生产1,4-BDO,比其它已知的1,4-BDO发酵方法更高。例如,本文公开的微生物和方法可以大于50%的产率转化CI碳底物(例如甲烷)。这意味着系统中至少50%的CI碳被转化为产物,例如1,4-BDO。在一些情况下,CI碳底物向1,4-BDO的转化率可为至少60%,70%,80%,81%,83%,84%,85%,86%,87%,88%,89%,90%,91%,93%,94%,95%,96%,97%,98%或99%。在一些情况下,CI碳底物向1,4-BDO的转化率可至少为60%。在一些情况下,CI碳底物向1,4-BDO的转化率可至少为70%。在一些情况下,CI碳底物向1,4-BDO的转化率可至少为80%。在一些情况下,CI碳底物向1,4-BDO的转化率可至少为81%。在一些情况下,CI碳底物向1,4-BDO的转化率可至少为82%。在一些情况下,CI碳底物向1,4-BDO的转化率可至少为83%。在一些情况下,CI碳底物向1,4-BDO的转化率可至少为84%。在一些情况下,CI碳底物向1,4-BDO的转化率可至少为85%。在一些情况下,CI碳底物向1,4-BDO的转化率可至少为86%。在一些情况下,CI碳底物向1,4-BDO的转化率可至少为87%。在一些情况下,CI碳底物向1,4-BDO的转化率可至少为88%。在一些情况下,CI碳底物向1,4-BDO的转化率可至少为89%。在一些情况下,CI碳底物向1,4-BDO的转化率可至少为90%。在一些情况下,CI碳底物向1,4-BDO的转化率可至少为91%。在一些情况下,CI碳底物向1,4-BDO的转化率可至少为92%。在一些情况下,CI碳底物向1,4-BDO的转化率可至少为93%。在一些情况下,CI碳底物向1,4-BDO的转化率可至少为94%。在一些情况下,CI碳底物向1,4-BDO的转化率可至少为95%。在一些情况下,CI碳底物向1,4-BDO的转化率可至少为96%。在一些情况下,CI碳底物向1,4-BDO的转化率可至少为97%。在一些情况下,CI碳底物向1,4-BDO的转化率可至少为98%。在一些情况下,CI碳底物向1,4-BDO的转化率可至少为99%。
在某些方法中,当生产1,4-BDO时,发酵液中1,4-BDO的浓度为至少1g/L。例如,发酵液中产生的1,4-BDO的浓度可为1g/L-5g/L、2g/L-6g/L、3g/L-7g/L、4g/L-8g/L、5g/L-9g/L或6g/L-10g/L。在一些情况下,1,4-BDO的浓度可为至少9g/L。在一些情况下,1,4-BDO的浓度可为1g/L至5g/L。在一些情况下,1,4-BDO的浓度可为2g/L至6g/L。在一些情况下,1,4-BDO的浓度可为3g/L至7g/L。在一些情况下,1,4-BDO的浓度可为4g/L至8g/L。在一些情况下,1,4-BDO的浓度可为5g/L至9g/L。在一些情况下,1,4-BDO的浓度可为6g/L至10g/L。
在其它情况下,当使用一般产生至少一些1,4-BDO的微生物时,在遗传修饰和发酵后,经遗传修饰的微生物可以产生浓度为正常产生量(例如,不使用任何经遗传修饰的微生物)的至少1.1倍的1,4-BDO。在一些情况下,经遗传修饰的微生物的产量可为一般生产量的至少2倍,3倍,4倍,5倍,10倍,25倍,50倍和/或100倍。在一些情况下,经遗传修饰的微生物可产生一般生产量的至少2倍。在一些情况下,经遗传修饰的微生物可产生一般生产量的至少3倍。在一些情况下,经遗传修饰的微生物可产生一般生产量的至少4倍。在一些情况下,经遗传修饰的微生物可产生一般生产量的至少5倍。在一些情况下,经遗传修饰的微生物可产生一般生产量的至少10倍。在一些情况下,经遗传修饰的微生物可产生一般生产量的至少25倍。在一些情况下,经遗传修饰的微生物可产生一般生产量的至少50倍。在一些情况下,经遗传修饰的微生物可产生一般生产量的至少100倍。
如上所述,在一些实施方式中,发酵反应中产生的1,4-BDO直接从发酵液转化为PBT、THF和/或聚氨酯(或其它产物)。在其它实施方式中,首先从发酵液中回收1,4-BDO,然后将其转化为PBT、THF和/或聚氨酯。
在一些情况下,1,4-BDO可从发酵液的部分连续移出,并回收为纯化的1,4-BDO。在特定实施方式中,1,4-BDO的回收包括将移出的含有1,4-BDO的发酵液部分通过分离单元以将微生物(例如,经遗传修饰的甲烷氧化菌)从发酵液中分离,以产生无细胞的含1,4-BDO的透过物,并使微生物返回生物反应器。然后可储存无细胞的含1,4-BDO的渗透物,或将其用于随后转化为PBT、THF和/或聚氨酯(或其它所需产物)。
发酵反应中产生的1,4-BDO和/或一种或多种其它产物或副产物的回收可包括,连续地移出部分发酵液并从该移出的发酵液部分分别回收1,4-BDO和一种或多种其它产物。在一些实施方式中,1,4-BDO和/或一种或多种其它产物的回收包括,使移出的含有1,4-BDO和/或一种或多种其它产物的发酵液部分通过分离单元,以从1,4-BDO和/或一种或多种其它产物分离微生物,以产生无细胞含1,4-BDO和一种或多种其它产物的透过物,并且使微生物返回生物反应器。
在上述实施方式中,1,4-BDO和一种或多种其它产物的回收可包括,首先从无细胞透过物中移出1,4-BDO,然后从无细胞透过物移出一种或多种其它产物。然后可使无细胞透过物返回生物反应器。
可从发酵液回收1,4-BDO或含有1,4-BDO的混合产物流。例如,可用的方法可包括但不限于,分馏或蒸发、渗透蒸发和提取发酵。进一步的示例包括:使用来自全发酵液的蒸汽进行回收(Wheat等,1948);反渗透结合蒸馏(Sridhar1989);涉及溶剂萃取1,4-BDO的液-液萃取技术(Othmer等,1945;Tsao 1978;Eiteman和Gainer 1989);PEG/葡聚糖体系中水性双相1,4-BDO萃取(Ghosh和Swaminathan 2003);使用醇或酯(例如乙酸乙酯,磷酸三丁酯,二乙醚,^-丁醇,十二烷醇,油醇和乙醇/磷酸盐系统)的溶剂萃取(Bo Jianga 2009);包含亲水性溶剂和无机盐的水性双相系统(Zhigang等,2010)。
先前在乙醇和丁醇发酵中使用的渗透蒸发或真空膜蒸馏可用于将1,4-BDO浓缩(Qureshi等,1994)在水中作为来自发酵液的提取物。微孔聚四氟乙烯(PTFE)膜用于整合过程,而有机硅膜通常用于渗透蒸发乙醇或丁醇发酵。
还可以使用本领域已知的方法从发酵液中回收副产物,例如包括乙酸盐和丁酸盐的酸。例如,可以使用涉及活性炭过滤器或电渗析的吸附系统。
在本发明的某些实施方式中,通过从生物反应器中连续移出部分发酵液,从发酵液中分离微生物细胞(例如通过过滤),和从发酵液中回收1,4-BDO和任选的其它醇和酸来从发酵液中回收1,4-BDO和副产物。可以方便地例如通过蒸馏回收醇,并且可例如通过在活性炭上吸附来回收酸。优选地使分离的微生物细胞返回发酵生物反应器。还优选使移去醇和酸之后剩余的无细胞透过物返回发酵生物反应器。可以向无细胞透过物添加其它营养物,以在营养培养基返回生物反应器之前补充营养培养基。
此外,如果在回收1,4-BDO和/或副产物期间调节发酵液的pH,则应将pH重新调节至与发酵生物反应器中的发酵液相似的pH,然后再返回生物反应器。
在一些实施方式中,从发酵液或生物反应器连续回收1,4-BDO,并直接供给以化学转化为TUF、PBT和/或聚氨酯中的一种或多种。例如,可以通过导管将1,4-BDO直接供给入适合于化学合成TFIF、PBT、聚氨酯或其它下游化学产品中的一种或多种的一个或多个容器。
虽然本文已经示出并描述了一些实施方式,但是这些实施方式仅作为示例提供。本领域技术人员在不背离本发明的情况下可以作出多种改变、变化和替代。应理解,本文所述的本发明实施方式的各种替代形式可用于实施本发明。
实施例
实施例1:遗传工程改造微生物以从α-酮戊二酸盐或酯产生1,4-BDO途径
为了在微生物中工程改造α-酮戊二酸盐或酯至1,4-BDO途径(见图2),我们从甲烷氧化菌(具体地,荚膜甲基球菌(M.capsulatus))开始,并测试了来自不同细菌和酵母菌的几种基因。下表1显示测试的基因和基因来源。
表1:
产生了几种菌株(如下表2所示),并在补充有外源α-酮戊二酸盐或酯的细胞培养基中培养。使菌株在微量滴定板中于37℃培养总共7天。在这总共7天中,诱导前完成了3天,诱导后完成了4天。测试了菌株的γ-羟丁酸盐或酯(“GHB”)和1,4-BDO的形成。下表2显示了不同菌株的各种产量。XZ79菌株产生最高量的GHB和1,4-BDO。该菌株表达了牛分枝杆菌Kgd,克鲁维氏梭菌4hbD,齿龈卟啉单胞菌Cat2,丙酮丁醇梭菌Aid和百利不动杆菌Adh。
表2:
对XZ76菌株进行了进一步测试。该菌株在与上述相同的培养基和时间范围内培养,但是补充有外源性α-酮戊二酸盐或酯(400mg/L)和外源性GHB(50mg/L)。测试了由这些菌株产生的1,4-BDO。如图4所示,采用单独α-酮戊二酸盐或酯观察到大于100μg/L水平的1,4-BDO的产生。然而,令人吃惊的是,当培养基中补充有外源性GHB时,1,4-BDO的产量比单独α-酮戊二酸盐或酯的情况高(spike)约11倍。
实施例2:遗传工程改造微生物以从琥珀酸盐或酯产生1,4-BDO
进一步对甲烷氧化菌进行遗传工程改造以表达琥珀酸盐或酯到1,4-BDO途径的酶。用来自不同细菌和酵母的不同基因转化甲烷氧化菌。下表3显示测试的基因和基因来源。
表3:
产生了几种菌株(如下表4所示),并在补充有外源琥珀酸的IM5培养基中培养。将菌株在微量滴定板中培养相同的时间(7天:诱导前3天,在37℃诱导4天),并测试GHB和1,4-BDO的形成。下表4显示了不同菌株的各种产量。菌株XZ440产生最高量的GHB。菌株XZ440表达大肠杆菌(Escherichia coli)SucD;齿龈卟啉单胞菌(Porphyromonas gingivalis)SucD;齿龈卟啉单胞菌(Porphyromonas gingivalis)4hbD;齿龈卟啉单胞菌(Porphyromonas gingivalis)Cat2.abfT-2,丙酮丁醇梭菌(Clostridiumacetobutylicum)adhe2;和百利不动杆菌(Acinetobacter baylyi)ADP1。菌株XZ438产生最高量的1,4-BDO。该菌株表达大肠杆菌SucD;齿龈卟啉单胞菌SucD;齿龈卟啉单胞菌4hbD;齿龈卟啉单胞菌Cat2.abfT-l,丙酮丁醇梭菌adhe2;和百利不动杆菌ADP1。
表4:
实施例3:遗传工程改造以产生较高水平α-酮戊二酸盐或酯
发现可以惊人地大量且非常高效地产生1,4-BDO后,我们将注意力集中在该途径的丙酮酸盐或酯到α-酮戊二酸盐或酯部分上。图1(带圆圈)显示了从丙酮酸盐或酯到α-酮戊二酸盐或酯的途径。我们试图增加我们系统中产生的α-酮戊二酸盐或酯的总量。为此,我们过表达了该途径中的四个基因:aceEF,gltA,acnA或IcdA。图5显示了该研究的结果。
aceEF,gltA和acnA的过表达仅导致α-酮戊二酸盐或酯的小量产量。然而,IcdA(异柠檬酸脱氢酶)的过表达显著增加了总的α-酮戊二酸盐或酯水平。α-酮戊二酸盐或酯的最高产生者是菌株XZ259,其中α-酮戊二酸盐或酯的水平超过1400μg/L。
实施例4:在微量滴定板中直接由甲烷生产1,4-BDO。
我们分别从α-酮戊二酸盐或酯和琥珀酸盐或酯途径产生了78个和48个不同的广泛宿主质粒,这些质粒包含5基因1,4BDO途径的变异,并将上述质粒转化进入转化感受态甲烷氧化菌菌株RL83 A,并评估了112个和60个所得菌株(包括生物复制菌株)在采用甲烷为碳源的小规模微量滴定板发酵中的1,4BDO生产。对于这些实验,将起始培养物接种到含有500μl培养基的微量滴定板中。给微量滴定板供给甲烷,阿拉伯糖,酮戊二酸盐或酯或琥珀酸盐或酯的来源,并在振荡器上于37℃孵育96小时。96小时后测试样品。
下表5(α-酮戊二酸盐或酯途径)和表6(琥珀酸盐或酯途径)提供了每种菌株的基因型。
表5:测试了α-酮戊二酸盐或酯途径的微生物的基因型
表6:测试了琥珀酸盐或酯途径的微生物的基因型
几个顶级工程改造菌株XZ79(p.BAD>Mbo.SucA>Ckl.4hbD>Pgi.abft-l>Cac.adhe2>Aba.ADPl)和XZ344(p.BAD>Eco.SucD>Pgi.SucD>Pgi.4hbD>Pgi.abft-l>Cac.adhe2>Aba.ADPl)基于小规模微量滴定板分析的结果选择。这些菌株能够产生可检测的1,4BDO,而无需供给中间体α-酮戊二酸盐或酯或琥珀酸。为了确定XZ79和XZ344能否在摇瓶实验中直接从甲烷产生可检测的1,4BDO,我们在添加和不添加中间体的培养基中测试了XZ79和XZ344。如图6所示,XZ79和XZ344都直接从甲烷产生可检测量的1,4-BDO。供给α-酮戊二酸盐或酯或琥珀酸可提高1,4BDO的生产率。
实施例5:在摇瓶中直接由甲烷生产1,4-BDO。
我们分别测试了来自α-酮戊二酸盐或酯和琥珀酸盐或酯途径的35个和15个不同的广泛宿主质粒,这些质粒包含5-基因1,4-BDO途径的变异,并将上述质粒转化进入转化感受态甲烷氧化菌菌株RL83A,并使用甲烷作为碳源,在摇瓶中评估了该菌株的1,4BDO产量。对于这些实验,将起始培养物接种到装有10ml培养基的125ml摇瓶中。向瓶中供给甲烷源,并在37℃的振荡器中孵育72小时。72小时后,向培养物供给1%的阿拉伯糖和α-酮戊二酸盐或酯或琥珀酸盐或酯。96小时后收集样品并进行测试。
下表7(α-酮戊二酸盐或酯途径)和表8(琥珀酸盐或酯途径)提供了每种菌株的基因型和相关的生产效价。对于利用α-酮戊二酸盐或酯途径的菌株的发酵,向瓶中所含的培养基补充400mg/L的α-酮戊二酸盐或酯。对于利用琥珀酸盐或酯途径的菌株的发酵,向瓶中所含的培养基补充200mg/L的琥珀酸盐或酯。
表7:测试了α-酮戊二酸盐或酯途径的微生物的基因型
表8:测试了琥珀酸盐或酯通路的微生物的基因型
实施例6:增加的琥珀酸盐或酯产量
为了增加1,4-BDO效价,在延胡索酸还原酶(fird)基因存在或不存在的情况下测量上游产物琥珀酸盐或酯的产量。参见图7。产生了58个荚膜甲烷氧化菌甲烷氧化菌菌株,其包含具有不同启动子的大肠杆菌FrdA,大肠杆菌FrdB,大肠杆菌FrdC,大肠杆菌FrdD。将各菌株接种到含有10ml培养基的125ml摇瓶中,以开始培养。然后将起始培养物以0.1的初始OD值接种到摇瓶中。摇瓶在过量甲烷存在下于37℃孵育96小时。然后测量琥珀酸盐或酯效价。
所有菌株MBC1960,MBC1970和MBC1985均表达异源大肠杆菌FrdA,FrdB,FrdC和FrdD,但在不同启动子(分别为pmxaF,J23111和J23100)的控制下。参见图8。如图8所示,MBC1970和MBC1985菌株相比其亲本对照菌株(RL83)产生显著更多的琥珀酸盐或酯。
序列表
<110> 赵新华(ZHAO, Xinhua)
J·基莱(KEALEY, James)
T·胡应(HUYNH, Tina)
<120> 从CI碳制备1,4-丁二醇及其衍生物的方法和微生物
<130> INX00386
<160> 58
<170> PatentIn version 3.5
<210> 1
<211> 1231
<212> PRT
<213> 牛分枝杆菌(Mycobacterium bovis)
<400> 1
Met Ala Asn Ile Ser Ser Pro Phe Gly Gln Asn Glu Trp Leu Val Glu
1 5 10 15
Ala Met Tyr Arg Lys Phe Arg Asp Asp Pro Ser Ser Val Asp Pro Ser
20 25 30
Trp His Glu Phe Leu Val Asp Tyr Ser Pro Glu Pro Thr Ser Gln Pro
35 40 45
Ala Ala Glu Pro Thr Arg Val Thr Ser Pro Leu Val Ala Glu Arg Ala
50 55 60
Ala Ala Ala Ala Pro Gln Ala Pro Pro Lys Pro Ala Asp Thr Ala Ala
65 70 75 80
Ala Gly Asn Gly Val Val Ala Ala Leu Ala Ala Lys Thr Ala Val Pro
85 90 95
Pro Pro Ala Glu Gly Asp Glu Val Ala Val Leu Arg Gly Ala Ala Ala
100 105 110
Ala Val Val Lys Asn Met Ser Ala Ser Leu Glu Val Pro Thr Ala Thr
115 120 125
Ser Val Arg Ala Val Pro Ala Lys Leu Leu Ile Asp Asn Arg Ile Val
130 135 140
Ile Asn Asn Gln Leu Lys Arg Thr Arg Gly Gly Lys Ile Ser Phe Thr
145 150 155 160
His Leu Leu Gly Tyr Ala Leu Val Gln Ala Val Lys Lys Phe Pro Asn
165 170 175
Met Asn Arg His Tyr Thr Glu Val Asp Gly Lys Pro Thr Ala Val Thr
180 185 190
Pro Ala His Thr Asn Leu Gly Leu Ala Ile Asp Leu Gln Gly Lys Asp
195 200 205
Gly Lys Arg Ser Leu Val Val Ala Gly Ile Lys Arg Cys Glu Thr Met
210 215 220
Arg Phe Ala Gln Phe Val Thr Ala Tyr Glu Asp Ile Val Arg Arg Ala
225 230 235 240
Arg Asp Gly Lys Leu Thr Thr Glu Asp Phe Ala Gly Val Thr Ile Ser
245 250 255
Leu Thr Asn Pro Gly Thr Ile Gly Thr Val His Ser Val Pro Arg Leu
260 265 270
Met Pro Gly Gln Gly Ala Ile Ile Gly Val Gly Ala Met Glu Tyr Pro
275 280 285
Ala Glu Phe Gln Gly Ala Ser Glu Glu Arg Ile Ala Glu Leu Gly Ile
290 295 300
Gly Lys Leu Ile Thr Leu Thr Ser Thr Tyr Asp His Arg Ile Ile Gln
305 310 315 320
Gly Ala Glu Ser Gly Asp Phe Leu Arg Thr Ile His Glu Leu Leu Leu
325 330 335
Ser Asp Gly Phe Trp Asp Glu Val Phe Arg Glu Leu Ser Ile Pro Tyr
340 345 350
Leu Pro Val Arg Trp Ser Thr Asp Asn Pro Asp Ser Ile Val Asp Lys
355 360 365
Asn Ala Arg Val Met Asn Leu Ile Ala Ala Tyr Arg Asn Arg Gly His
370 375 380
Leu Met Ala Asp Thr Asp Pro Leu Arg Leu Asp Lys Ala Arg Phe Arg
385 390 395 400
Ser His Pro Asp Leu Glu Val Leu Thr His Gly Leu Thr Leu Trp Asp
405 410 415
Leu Asp Arg Val Phe Lys Val Asp Gly Phe Ala Gly Ala Gln Tyr Lys
420 425 430
Lys Leu Arg Asp Val Leu Gly Leu Leu Arg Asp Ala Tyr Cys Arg His
435 440 445
Ile Gly Val Glu Tyr Ala His Ile Leu Asp Pro Glu Gln Lys Glu Trp
450 455 460
Leu Glu Gln Arg Val Glu Thr Lys His Val Lys Pro Thr Val Ala Gln
465 470 475 480
Gln Lys Tyr Ile Leu Ser Lys Leu Asn Ala Ala Glu Ala Phe Glu Thr
485 490 495
Phe Leu Gln Thr Lys Tyr Val Gly Gln Lys Arg Phe Ser Leu Glu Gly
500 505 510
Ala Glu Ser Val Ile Pro Met Met Asp Ala Ala Ile Asp Gln Cys Ala
515 520 525
Glu His Gly Leu Asp Glu Val Val Ile Gly Met Pro His Arg Gly Arg
530 535 540
Leu Asn Val Leu Ala Asn Ile Val Gly Lys Pro Tyr Ser Gln Ile Phe
545 550 555 560
Thr Glu Phe Glu Gly Asn Leu Asn Pro Ser Gln Ala His Gly Ser Gly
565 570 575
Asp Val Lys Tyr His Leu Gly Ala Thr Gly Leu Tyr Leu Gln Met Phe
580 585 590
Gly Asp Asn Asp Ile Gln Val Ser Leu Thr Ala Asn Pro Ser His Leu
595 600 605
Glu Ala Val Asp Pro Val Leu Glu Gly Leu Val Arg Ala Lys Gln Asp
610 615 620
Leu Leu Asp His Gly Ser Ile Asp Ser Asp Gly Gln Arg Ala Phe Ser
625 630 635 640
Val Val Pro Leu Met Leu His Gly Asp Ala Ala Phe Ala Gly Gln Gly
645 650 655
Val Val Ala Glu Thr Leu Asn Leu Ala Asn Leu Pro Gly Tyr Arg Val
660 665 670
Gly Gly Thr Ile His Ile Ile Val Asn Asn Gln Ile Gly Phe Thr Thr
675 680 685
Ala Pro Glu Tyr Ser Arg Ser Ser Glu Tyr Cys Thr Asp Val Ala Lys
690 695 700
Met Ile Gly Ala Pro Ile Phe His Val Asn Gly Asp Asp Pro Glu Ala
705 710 715 720
Cys Val Trp Val Ala Arg Leu Ala Val Asp Phe Arg Gln Arg Phe Lys
725 730 735
Lys Asp Val Val Ile Asp Met Leu Cys Tyr Arg Arg Arg Gly His Asn
740 745 750
Glu Gly Asp Asp Pro Ser Met Thr Asn Pro Tyr Met Tyr Asp Val Val
755 760 765
Asp Thr Lys Arg Gly Ala Arg Lys Ser Tyr Thr Glu Ala Leu Ile Gly
770 775 780
Arg Gly Asp Ile Ser Met Lys Glu Ala Glu Asp Ala Leu Arg Asp Tyr
785 790 795 800
Gln Gly Gln Leu Glu Arg Val Phe Asn Glu Val Arg Glu Leu Glu Lys
805 810 815
His Gly Val Gln Pro Ser Glu Ser Val Glu Ser Asp Gln Met Ile Pro
820 825 830
Ala Gly Leu Ala Thr Ala Val Asp Lys Ser Leu Leu Ala Arg Ile Gly
835 840 845
Asp Ala Phe Leu Ala Leu Pro Asn Gly Phe Thr Ala His Pro Arg Val
850 855 860
Gln Pro Val Leu Glu Lys Arg Arg Glu Met Ala Tyr Glu Gly Lys Ile
865 870 875 880
Asp Trp Ala Phe Gly Glu Leu Leu Ala Leu Gly Ser Leu Val Ala Glu
885 890 895
Gly Lys Leu Val Arg Leu Ser Gly Gln Asp Ser Arg Arg Gly Thr Phe
900 905 910
Ser Gln Arg His Ser Val Leu Ile Asp Arg His Thr Gly Glu Glu Phe
915 920 925
Thr Pro Leu Gln Leu Leu Ala Thr Asn Ser Asp Gly Ser Pro Thr Gly
930 935 940
Gly Lys Phe Leu Val Tyr Asp Ser Pro Leu Ser Glu Tyr Ala Ala Val
945 950 955 960
Gly Phe Glu Tyr Gly Tyr Thr Val Gly Asn Pro Asp Ala Val Val Leu
965 970 975
Trp Glu Ala Gln Phe Gly Asp Phe Val Asn Gly Ala Gln Ser Ile Ile
980 985 990
Asp Glu Phe Ile Ser Ser Gly Glu Ala Lys Trp Gly Gln Leu Ser Asn
995 1000 1005
Val Val Leu Leu Leu Pro His Gly His Glu Gly Gln Gly Pro Asp
1010 1015 1020
His Thr Ser Ala Arg Ile Glu Arg Phe Leu Gln Leu Trp Ala Glu
1025 1030 1035
Gly Ser Met Thr Ile Ala Met Pro Ser Thr Pro Ser Asn Tyr Phe
1040 1045 1050
His Leu Leu Arg Arg His Ala Leu Asp Gly Ile Gln Arg Pro Leu
1055 1060 1065
Ile Val Phe Thr Pro Lys Ser Met Leu Arg His Lys Ala Ala Val
1070 1075 1080
Ser Glu Ile Lys Asp Phe Thr Glu Ile Lys Phe Arg Ser Val Leu
1085 1090 1095
Glu Glu Pro Thr Tyr Glu Asp Gly Ile Gly Asp Arg Asn Lys Val
1100 1105 1110
Ser Arg Ile Leu Leu Thr Ser Gly Lys Leu Tyr Tyr Glu Leu Ala
1115 1120 1125
Ala Arg Lys Ala Lys Asp Asn Arg Asn Asp Leu Ala Ile Val Arg
1130 1135 1140
Leu Glu Gln Leu Ala Pro Leu Pro Arg Arg Arg Leu Arg Glu Thr
1145 1150 1155
Leu Asp Arg Tyr Glu Asn Val Lys Glu Phe Phe Trp Val Gln Glu
1160 1165 1170
Glu Pro Ala Asn Gln Gly Ala Trp Pro Arg Phe Gly Leu Glu Leu
1175 1180 1185
Pro Glu Leu Leu Pro Asp Lys Leu Ala Gly Ile Lys Arg Ile Ser
1190 1195 1200
Arg Arg Ala Met Ser Ala Pro Ser Ser Gly Ser Ser Lys Val His
1205 1210 1215
Ala Val Glu Gln Gln Glu Ile Leu Asp Glu Ala Phe Gly
1220 1225 1230
<210> 2
<211> 3696
<212> DNA
<213> 牛分枝杆菌(Mycobacterium bovis)
<400> 2
atggccaata tctcgtcccc gttcggccag aacgagtggc tcgtggaggc catgtatcgg 60
aagttccggg acgacccgtc cagcgtcgac ccgtcctggc acgagttcct cgtggactac 120
tcccccgagc cgaccagcca gccggcggcc gagccgaccc gggtcacgtc gccgctcgtc 180
gccgaacggg ccgccgccgc cgccccccag gcgcccccca agccggccga cacggccgcc 240
gccggcaacg gcgtggtggc ggccctggcc gccaagaccg ccgtgccgcc cccggccgaa 300
ggcgacgaag tcgccgtcct ccggggcgcg gcggcggcgg tcgtgaagaa catgagcgcg 360
tccctggagg tgccgaccgc cacgtcggtc cgggccgtcc ccgcgaaact cctcatcgac 420
aaccgcatcg tcatcaataa ccagctgaag cggacgcggg gcggcaagat ctcgttcacg 480
cacctcctcg gctacgcgct cgtgcaggcc gtcaagaagt tcccgaacat gaaccggcac 540
tacacggaag tggacggcaa acccacggcc gtcacccccg cccatacgaa cctcggcctg 600
gccatcgacc tgcagggcaa ggacggcaag cggtcgctgg tggtcgccgg catcaagcgc 660
tgcgagacga tgcgcttcgc gcagttcgtc acggcctatg aagacatcgt ccgccgggcc 720
cgggacggca agctcaccac ggaagatttc gcgggcgtca ccatctcgct caccaatccc 780
ggcacgatcg gcaccgtcca tagcgtgccg cgcctgatgc ccggccaggg cgcgatcatc 840
ggcgtcggcg cgatggaata ccccgccgag ttccagggcg cgtccgagga gcggatcgcg 900
gaactgggca tcggcaagct catcaccctc accagcacgt atgaccaccg catcatccag 960
ggcgccgagt cgggcgactt cctccggacg atccatgagc tgctgctgag cgacggcttc 1020
tgggatgagg tgttccggga actgtccatc ccgtatctgc cggtccggtg gagcacggac 1080
aaccccgata gcatcgtgga caaaaacgcc cgcgtgatga acctcatcgc cgcctaccgc 1140
aaccgcggcc acctgatggc cgacaccgat ccgctgcggc tcgacaaagc ccgcttccgg 1200
agccatcccg acctggaagt cctgacccac ggcctcaccc tgtgggatct ggatcgggtc 1260
ttcaaggtcg acggcttcgc cggcgcccag tacaagaagc tgcgcgatgt gctcggcctg 1320
ctgcgggacg cctattgccg ccacatcggc gtggagtacg cgcacatcct cgacccggaa 1380
cagaaagaat ggctggaaca gcgcgtcgaa accaagcatg tgaagcccac ggtggcgcag 1440
cagaagtaca tcctgtcgaa gctgaatgcg gccgaagcct tcgaaacctt cctgcagacc 1500
aagtacgtcg gccagaagcg cttctccctg gaaggcgccg agtccgtcat cccgatgatg 1560
gatgccgcga tcgaccagtg cgccgaacac ggcctggacg aagtcgtgat cggcatgccc 1620
catcgcggcc ggctcaacgt cctcgcgaac atcgtcggca agccgtactc gcagatcttc 1680
acggagttcg aaggcaacct gaacccctcc caggcccacg gcagcggcga cgtgaaatat 1740
cacctgggcg ccaccggcct gtatctgcag atgttcggcg acaacgacat ccaggtcagc 1800
ctgaccgcca acccctcgca tctggaagcc gtcgaccccg tcctggaagg cctggtccgc 1860
gcgaagcagg acctcctgga ccacggcagc atcgatagcg acggccagcg ggccttctcc 1920
gtggtgcccc tcatgctgca cggcgacgcc gccttcgccg gccagggcgt ggtcgccgag 1980
acgctcaacc tggcgaacct gcccggctac cgcgtcggcg gcacgatcca catcatcgtc 2040
aacaatcaga tcggcttcac caccgccccc gagtactccc gcagctcgga atactgcacc 2100
gatgtggcga aaatgatcgg cgccccgatc ttccatgtca atggcgatga tccggaagcg 2160
tgcgtgtggg tggcccgcct ggcggtggat ttccgccagc ggttcaagaa ggatgtggtg 2220
atcgacatgc tgtgctaccg ccgccggggc cataatgaag gcgacgatcc ctccatgacc 2280
aacccctaca tgtacgatgt cgtggacacg aagcgcggcg cccgcaagtc ctataccgag 2340
gccctcatcg gccggggcga tatcagcatg aaagaagccg aggatgcgct ccgcgactat 2400
cagggccagc tggaacgggt gttcaacgag gtgcgggaac tcgaaaaaca cggcgtccag 2460
ccgtccgaga gcgtggagtc cgatcagatg atcccggcgg gcctcgccac ggcggtcgat 2520
aagtccctgc tggcccggat cggcgatgcc ttcctggccc tccccaatgg cttcacggcg 2580
cacccgcggg tgcagccggt gctcgaaaaa cgccgggaaa tggcctacga aggcaagatc 2640
gactgggcct tcggcgagct gctggcgctg ggctccctgg tggccgaagg caaactggtg 2700
cgcctgtccg gccaggactc gcgccgcggc accttctccc agcgccactc ggtcctgatc 2760
gatcgccata ccggcgagga gttcaccccg ctccagctcc tggccacgaa ctccgacggc 2820
tcgcccaccg gcggcaagtt cctggtgtat gacagccccc tgagcgagta tgcggcggtc 2880
ggcttcgagt acggctacac cgtcggcaat cccgacgccg tcgtcctgtg ggaagcgcag 2940
ttcggcgact tcgtcaatgg cgcccagtcg atcatcgacg agttcatctc gtcgggcgag 3000
gccaaatggg gccagctctc gaacgtcgtg ctgctgctcc cgcacggcca cgaaggccag 3060
ggcccggatc acacctccgc ccggatcgaa cggttcctgc agctctgggc cgagggctcc 3120
atgacgatcg ccatgcccag caccccgtcc aactatttcc acctcctgcg gcgccatgcg 3180
ctcgacggca tccagcggcc cctgatcgtc ttcacgccga agagcatgct gcgccataag 3240
gccgccgtct cggagatcaa ggacttcacc gagatcaaat tccggtcggt gctggaagaa 3300
ccgacctatg aagatggcat cggcgaccgc aataaggtgt cgcgcatcct gctgacctcg 3360
ggcaagctgt actacgagct ggccgcccgc aaggccaaag acaaccggaa cgacctggcc 3420
atcgtccggc tggagcagct ggcgcccctc ccgcgccggc gcctgcgcga aaccctggat 3480
cgctatgaga acgtcaagga gttcttctgg gtgcaggagg aacccgcgaa tcagggcgcc 3540
tggccccgct tcggcctgga gctgccggag ctgctccccg acaagctggc cggcatcaag 3600
cggatcagcc gccgcgcgat gtcggccccg agctcgggct ccagcaaggt ccatgcggtc 3660
gagcagcagg agatcctgga tgaagcgttc ggctga 3696
<210> 3
<211> 1231
<212> PRT
<213> 结核分枝杆菌(Mycobacterium tuberculosis)
<400> 3
Met Ala Asn Ile Ser Ser Pro Phe Gly Gln Asn Glu Trp Leu Val Glu
1 5 10 15
Glu Met Tyr Arg Lys Phe Arg Asp Asp Pro Ser Ser Val Asp Pro Ser
20 25 30
Trp His Glu Phe Leu Val Asp Tyr Ser Pro Glu Pro Thr Ser Gln Pro
35 40 45
Ala Ala Glu Pro Thr Arg Val Thr Ser Pro Leu Val Ala Glu Arg Ala
50 55 60
Ala Ala Ala Ala Pro Gln Ala Pro Pro Lys Pro Ala Asp Thr Ala Ala
65 70 75 80
Ala Gly Asn Gly Val Val Ala Ala Leu Ala Ala Lys Thr Ala Val Pro
85 90 95
Pro Pro Ala Glu Gly Asp Glu Val Ala Val Leu Arg Gly Ala Ala Ala
100 105 110
Ala Val Val Lys Asn Met Ser Ala Ser Leu Glu Val Pro Thr Ala Thr
115 120 125
Ser Val Arg Ala Val Pro Ala Lys Leu Leu Ile Asp Asn Arg Ile Val
130 135 140
Ile Asn Asn Gln Leu Lys Arg Thr Arg Gly Gly Lys Ile Ser Phe Thr
145 150 155 160
His Leu Leu Gly Tyr Ala Leu Val Gln Ala Val Lys Lys Phe Pro Asn
165 170 175
Met Asn Arg His Tyr Thr Glu Val Asp Gly Lys Pro Thr Ala Val Thr
180 185 190
Pro Ala His Thr Asn Leu Gly Leu Ala Ile Asp Leu Gln Gly Lys Asp
195 200 205
Gly Lys Arg Ser Leu Val Val Ala Gly Ile Lys Arg Cys Glu Thr Met
210 215 220
Arg Phe Ala Gln Phe Val Thr Ala Tyr Glu Asp Ile Val Arg Arg Ala
225 230 235 240
Arg Asp Gly Lys Leu Thr Thr Glu Asp Phe Ala Gly Val Thr Ile Ser
245 250 255
Leu Thr Asn Pro Gly Thr Ile Gly Thr Val His Ser Val Pro Arg Leu
260 265 270
Met Pro Gly Gln Gly Ala Ile Ile Gly Val Gly Ala Met Glu Tyr Pro
275 280 285
Ala Glu Phe Gln Gly Ala Ser Glu Glu Arg Ile Ala Glu Leu Gly Ile
290 295 300
Gly Lys Leu Ile Thr Leu Thr Ser Thr Tyr Asp His Arg Ile Ile Gln
305 310 315 320
Gly Ala Glu Ser Gly Asp Phe Leu Arg Thr Ile His Glu Leu Leu Leu
325 330 335
Ser Asp Gly Phe Trp Asp Glu Val Phe Arg Glu Leu Ser Ile Pro Tyr
340 345 350
Leu Pro Val Arg Trp Ser Thr Asp Asn Pro Asp Ser Ile Val Asp Lys
355 360 365
Asn Ala Arg Val Met Asn Leu Ile Ala Ala Tyr Arg Asn Arg Gly His
370 375 380
Leu Met Ala Asp Thr Asp Pro Leu Arg Leu Asp Lys Ala Arg Phe Arg
385 390 395 400
Ser His Pro Asp Leu Glu Val Leu Thr His Gly Leu Thr Leu Trp Asp
405 410 415
Leu Asp Arg Val Phe Lys Val Asp Gly Phe Ala Gly Ala Gln Tyr Lys
420 425 430
Lys Leu Arg Asp Val Leu Gly Leu Leu Arg Asp Ala Tyr Cys Arg His
435 440 445
Ile Gly Val Glu Tyr Ala His Ile Leu Asp Pro Glu Gln Lys Glu Trp
450 455 460
Leu Glu Gln Arg Val Glu Thr Lys His Val Lys Pro Thr Val Ala Gln
465 470 475 480
Gln Lys Tyr Ile Leu Ser Lys Leu Asn Ala Ala Glu Ala Phe Glu Thr
485 490 495
Phe Leu Gln Thr Lys Tyr Val Gly Gln Lys Arg Phe Ser Leu Glu Gly
500 505 510
Ala Glu Ser Val Ile Pro Met Met Asp Ala Ala Ile Asp Gln Cys Ala
515 520 525
Glu His Gly Leu Asp Glu Val Val Ile Gly Met Pro His Arg Gly Arg
530 535 540
Leu Asn Val Leu Ala Asn Ile Val Gly Lys Pro Tyr Ser Gln Ile Phe
545 550 555 560
Thr Glu Phe Glu Gly Asn Leu Asn Pro Ser Gln Ala His Gly Ser Gly
565 570 575
Asp Val Lys Tyr His Leu Gly Ala Thr Gly Leu Tyr Leu Gln Met Phe
580 585 590
Gly Asp Asn Asp Ile Gln Val Ser Leu Thr Ala Asn Pro Ser His Leu
595 600 605
Glu Ala Val Asp Pro Val Leu Glu Gly Leu Val Arg Ala Lys Gln Asp
610 615 620
Leu Leu Asp His Gly Ser Ile Asp Ser Asp Gly Gln Arg Ala Phe Ser
625 630 635 640
Val Val Pro Leu Met Leu His Gly Asp Ala Ala Phe Ala Gly Gln Gly
645 650 655
Val Val Ala Glu Thr Leu Asn Leu Ala Asn Leu Pro Gly Tyr Arg Val
660 665 670
Gly Gly Thr Ile His Ile Ile Val Asn Asn Gln Ile Gly Phe Thr Thr
675 680 685
Ala Pro Glu Tyr Ser Arg Ser Ser Glu Tyr Cys Thr Asp Val Ala Lys
690 695 700
Met Ile Gly Ala Pro Ile Phe His Val Asn Gly Asp Asp Pro Glu Ala
705 710 715 720
Cys Val Trp Val Ala Arg Leu Ala Val Asp Phe Arg Gln Arg Phe Lys
725 730 735
Lys Asp Val Val Ile Asp Met Leu Cys Tyr Arg Arg Arg Gly His Asn
740 745 750
Glu Gly Asp Asp Pro Ser Met Thr Asn Pro Tyr Val Tyr Asp Val Val
755 760 765
Asp Thr Lys Arg Gly Ala Arg Lys Ser Tyr Thr Glu Ala Leu Ile Gly
770 775 780
Arg Gly Asp Ile Ser Met Lys Glu Ala Glu Asp Ala Leu Arg Asp Tyr
785 790 795 800
Gln Gly Gln Leu Glu Arg Val Phe Asn Glu Val Arg Glu Leu Glu Lys
805 810 815
His Gly Val Gln Pro Ser Glu Ser Val Glu Ser Asp Gln Met Ile Pro
820 825 830
Ala Gly Leu Ala Thr Ala Val Asp Lys Ser Leu Leu Ala Arg Ile Gly
835 840 845
Asp Ala Phe Leu Ala Leu Pro Asn Gly Phe Thr Ala His Pro Arg Val
850 855 860
Gln Pro Val Leu Glu Lys Arg Arg Glu Met Ala Tyr Glu Gly Lys Ile
865 870 875 880
Asp Trp Ala Phe Gly Glu Leu Leu Ala Leu Gly Ser Leu Val Ala Glu
885 890 895
Gly Lys Leu Val Arg Leu Ser Gly Gln Asp Ser Arg Arg Gly Thr Phe
900 905 910
Ser Gln Arg His Ser Val Leu Ile Asp Arg His Thr Gly Glu Glu Phe
915 920 925
Thr Pro Leu Gln Leu Leu Ala Thr Asn Ser Asp Gly Ser Pro Thr Gly
930 935 940
Gly Lys Phe Leu Val Tyr Asp Ser Pro Leu Ser Glu Tyr Ala Ala Val
945 950 955 960
Gly Phe Glu Tyr Gly Tyr Thr Val Gly Asn Pro Asp Ala Val Val Leu
965 970 975
Trp Glu Ala Gln Phe Gly Asp Phe Val Asn Gly Ala Gln Ser Ile Ile
980 985 990
Asp Glu Phe Ile Ser Ser Gly Glu Ala Lys Trp Gly Gln Leu Ser Asn
995 1000 1005
Val Val Leu Leu Leu Pro His Gly His Glu Gly Gln Gly Pro Asp
1010 1015 1020
His Thr Ser Ala Arg Ile Glu Arg Phe Leu Gln Leu Trp Ala Glu
1025 1030 1035
Gly Ser Met Thr Ile Ala Met Pro Ser Thr Pro Ser Asn Tyr Phe
1040 1045 1050
His Leu Leu Arg Arg His Ala Leu Asp Gly Ile Gln Arg Pro Leu
1055 1060 1065
Ile Val Phe Thr Pro Lys Ser Met Leu Arg His Lys Ala Ala Val
1070 1075 1080
Ser Glu Ile Lys Asp Phe Thr Glu Ile Lys Phe Arg Ser Val Leu
1085 1090 1095
Glu Glu Pro Thr Tyr Glu Asp Gly Ile Gly Asp Arg Asn Lys Val
1100 1105 1110
Ser Arg Ile Leu Leu Thr Ser Gly Lys Leu Tyr Tyr Glu Leu Ala
1115 1120 1125
Ala Arg Lys Ala Lys Asp Asn Arg Asn Asp Leu Ala Ile Val Arg
1130 1135 1140
Leu Glu Gln Leu Ala Pro Leu Pro Arg Arg Arg Leu Arg Glu Thr
1145 1150 1155
Leu Asp Arg Tyr Glu Asn Val Lys Glu Phe Phe Trp Val Gln Glu
1160 1165 1170
Glu Pro Ala Asn Gln Gly Ala Trp Pro Arg Phe Gly Leu Glu Leu
1175 1180 1185
Pro Glu Leu Leu Pro Asp Lys Leu Ala Gly Ile Lys Arg Ile Ser
1190 1195 1200
Arg Arg Ala Met Ser Ala Pro Ser Ser Gly Ser Ser Lys Val His
1205 1210 1215
Ala Val Glu Gln Gln Glu Ile Leu Asp Glu Ala Phe Gly
1220 1225 1230
<210> 4
<211> 3696
<212> DNA
<213> 结核分枝杆菌(Mycobacterium tuberculosis)
<400> 4
atggccaaca tcagcagccc cttcggccag aatgaatggc tcgtggagga gatgtaccgg 60
aagttccggg atgatcccag ctcggtcgat ccgtcgtggc acgagttcct ggtcgactat 120
agccccgaac ccacctccca gccggcggcc gagcccacgc gggtgacctc cccgctggtc 180
gcggaacgcg ccgcggcggc ggccccccag gccccgccga aacccgccga tacggccgcc 240
gcgggcaacg gcgtcgtcgc ggccctggcc gcgaagaccg ccgtgccccc ccccgccgag 300
ggcgacgagg tggcggtgct ccggggcgcc gccgcggccg tggtcaagaa catgagcgcc 360
tccctcgaag tgccgaccgc caccagcgtc cgggcggtgc cggccaagct gctgatcgat 420
aatcggatcg tcatcaacaa tcagctgaaa cggacccgcg gcggcaagat cagcttcacc 480
catctgctcg gctatgcgct ggtccaggcc gtgaagaagt tccccaacat gaatcgccac 540
tataccgaag tcgacggcaa acccaccgcc gtgaccccgg cgcacacgaa cctcggcctg 600
gcgatcgacc tgcagggcaa ggacggcaag cggagcctcg tggtggccgg catcaaacgg 660
tgcgagacga tgcggttcgc gcagttcgtg acggcctatg aggatatcgt gcgccgcgcc 720
cgggacggca aactgaccac cgaagacttc gccggcgtca cgatctcgct gaccaacccg 780
ggcaccatcg gcacggtcca ttcggtcccg cgcctcatgc cgggccaggg cgccatcatc 840
ggcgtgggcg cgatggaata tcccgccgag ttccagggcg cctccgagga gcggatcgcc 900
gagctgggca tcggcaaact catcacgctg acctccacgt atgaccaccg catcatccag 960
ggcgcggaaa gcggcgactt cctccggacg atccatgagc tgctgctctc cgacggcttc 1020
tgggatgaag tgttccgcga gctgtcgatc ccctatctcc cggtgcgctg gagcaccgac 1080
aacccggact cgatcgtgga caaaaacgcc cgcgtcatga atctgatcgc cgcgtaccgc 1140
aatcggggcc acctcatggc ggacacggac cccctgcggc tcgataaggc ccggttccgc 1200
tcccaccccg acctcgaagt cctgacccac ggcctgaccc tgtgggacct ggatcgcgtc 1260
ttcaaggtcg atggcttcgc cggcgcccag tataagaagc tgcgcgatgt gctgggcctg 1320
ctccgcgatg cctattgccg gcatatcggc gtggagtacg cccacatcct ggaccccgag 1380
cagaaagaat ggctggaaca gcgcgtcgaa acgaagcacg tcaagcccac cgtcgcgcag 1440
cagaaataca tcctcagcaa actcaacgcc gccgaagcgt tcgaaacgtt cctccagacg 1500
aagtacgtgg gccagaaacg cttcagcctg gaaggcgcgg agagcgtcat ccccatgatg 1560
gacgccgcca tcgaccagtg cgccgaacac ggcctggatg aagtggtcat cggcatgccg 1620
caccgcggcc ggctcaacgt cctggccaat atcgtgggca agccctacag ccagatcttc 1680
accgagttcg aaggcaacct gaacccgtcg caggcgcacg gctcgggcga tgtcaagtac 1740
catctcggcg ccacgggcct gtatctgcag atgttcggcg acaacgacat ccaggtgtcc 1800
ctgacggcga accccagcca cctggaggcg gtcgatcccg tcctggaagg cctggtgcgg 1860
gccaagcagg atctcctcga ccacggctcg atcgactccg atggccagcg ggcgttcagc 1920
gtggtgcccc tcatgctgca tggcgacgcg gcgttcgcgg gccagggcgt ggtggcggaa 1980
accctcaacc tcgcgaacct cccgggctat cgggtgggcg gcaccatcca tatcatcgtg 2040
aacaaccaga tcggcttcac cacggcgccg gaatattccc ggagctcgga atattgcacg 2100
gacgtggcca agatgatcgg cgccccgatc ttccacgtca atggcgatga cccggaggcc 2160
tgtgtgtggg tcgcccggct ggccgtcgat ttccgccagc gcttcaaaaa agatgtggtc 2220
atcgacatgc tctgctaccg ccgccggggc cataatgagg gcgacgaccc ctccatgacg 2280
aacccgtacg tctacgacgt ggtcgacacc aagcgcggcg cccgcaagtc ctatacggag 2340
gcgctcatcg gccgcggcga catctcgatg aaggaagcgg aagacgcgct ccgcgactac 2400
cagggccagc tggagcgcgt cttcaacgaa gtgcgggaac tcgaaaagca tggcgtgcag 2460
ccctccgaat cggtggagag cgatcagatg atcccggccg gcctggccac cgccgtcgat 2520
aaaagcctgc tcgcccgcat cggcgacgcc ttcctggccc tgccgaacgg cttcacggcc 2580
catccccgcg tccagccggt gctggagaaa cgccgcgaaa tggcctacga gggcaagatc 2640
gattgggcct tcggcgagct gctggcgctc ggcagcctgg tggccgaagg caagctcgtg 2700
cggctctccg gccaggactc gcggcgcggc acgttctcgc agcgccattc cgtgctgatc 2760
gaccggcaca ccggcgaaga gttcaccccc ctccagctgc tggccaccaa ttcggacggc 2820
agcccgacgg gcggcaagtt cctggtctat gactccccgc tgagcgagta tgccgccgtc 2880
ggcttcgagt atggctacac cgtcggcaat ccggacgcgg tcgtgctgtg ggaagcgcag 2940
ttcggcgact tcgtgaacgg cgcccagtcg atcatcgatg agttcatctc gtcgggcgaa 3000
gccaagtggg gccagctcag caacgtggtg ctcctgctcc cgcacggcca cgagggccag 3060
ggcccggatc atacgagcgc ccgcatcgag cggttcctgc agctgtgggc cgagggctcc 3120
atgacgatcg cgatgccctc gacgccgtcc aactacttcc acctgctgcg ccggcacgcg 3180
ctggacggca tccagcgccc gctgatcgtc ttcaccccca agagcatgct ccggcacaaa 3240
gccgccgtgt ccgagatcaa ggacttcacg gagatcaaat tccggagcgt gctggaggag 3300
cccacgtacg aggacggcat cggcgaccgc aacaaggtgt cccgcatcct cctgacgagc 3360
ggcaagctgt actacgagct cgccgcccgc aaggccaagg ataaccggaa cgacctggcc 3420
atcgtgcgcc tcgaacagct ggccccgctg ccgcgccgcc ggctgcggga aaccctggac 3480
cgctacgaga acgtcaaaga gttcttctgg gtccaggaag aaccggccaa ccagggcgcg 3540
tggccgcgct tcggcctgga actgcccgag ctcctgccgg acaagctggc cggcatcaag 3600
cgcatctcgc ggcgggcgat gagcgccccg tcgagcggct cctccaaggt gcatgccgtg 3660
gagcagcagg aaatcctgga cgaggcgttc ggctga 3696
<210> 5
<211> 1245
<212> PRT
<213> 解萜烯棒杆菌(Corynebacterium terpenotabidum)
<400> 5
Met Asn Ser Thr Asn Phe Gly Ser Asn Gly Trp Leu Val Asp Gln Met
1 5 10 15
His Gln Gln Phe Lys Glu Asp Pro Gln Ser Val Asp Lys Glu Trp Arg
20 25 30
Asp Phe Phe Thr Ala Gly Ser Ala Ser Gly Pro Asp Ala Pro Glu Thr
35 40 45
Thr Ala Pro Thr Thr Thr Ala Ala Thr Thr Thr Thr Ala Thr Thr Ser
50 55 60
Ala Ala Pro Ala Thr Ala Gln Thr Ser Gly Val Ala Val Pro Ser Thr
65 70 75 80
Ala Gly Thr Thr His Arg Ala Ser Ala Ala Ala Thr Val Ala Ser Asn
85 90 95
Val Ala Leu Ser Ala Asn Pro Ile Pro Glu Arg Val Ala Pro Pro Ala
100 105 110
Pro Lys Asp Ala Ala Glu Pro Leu Thr Pro Gly Glu Ala Ala Leu Lys
115 120 125
Gly Ala Gln Arg Ala Ile Ala Lys Asn Met Asp Ala Ser Leu Asp Ile
130 135 140
Pro Thr Ala Thr Thr Val Arg Asp Met Pro Ala Lys Leu Met Phe Glu
145 150 155 160
Asn Arg Ala Met Ile Asn Asn His Leu Arg Ser Gln Gly Arg Gly Lys
165 170 175
Ile Ser Phe Thr His Ile Leu Gly Trp Ala Met Val Asn Ala Val Lys
180 185 190
Ala His Pro Thr Met Asn Asn Asn Tyr Lys Val Ile Asp Gly Lys Pro
195 200 205
Ser Val Val Thr Pro Glu His Ile Asn Leu Gly Leu Ala Ile Asp Leu
210 215 220
Val Ser Lys Asn Gly Ser Arg Asn Leu Val Val Ala Ala Ile Arg Ala
225 230 235 240
Cys Glu Thr Phe Asp Phe Glu Gly Phe Val Asp Ala Tyr Glu Asp Ile
245 250 255
Val Val Arg Ala Arg Lys Gly Lys Leu Thr Met Asp Asp Phe Ser Gly
260 265 270
Val Thr Ile Gln Leu Thr Asn Pro Gly Gly Ile Gly Thr Arg His Ser
275 280 285
Val Pro Arg Leu Thr His Gly Gln Gly Ala Ile Ile Gly Val Gly Ala
290 295 300
Met Asp Tyr Pro Ala Glu Phe Ala Gly Ala Ser Glu Asp Arg Leu Ala
305 310 315 320
Asp Leu Gly Val Gly Lys Leu Val Thr Ile Thr Ser Thr Tyr Asp His
325 330 335
Arg Ile Ile Gln Gly Ala Glu Ser Gly Glu Phe Leu Arg Asp Met Ser
340 345 350
Arg Gln Leu Ile Asp Asp Gly Phe Trp Asp Gly Ile Tyr Ala Ser Leu
355 360 365
Lys Val Pro Tyr Ala Pro Val Arg Trp Ser Gln Asp Val Pro Asn Thr
370 375 380
Gly Val Asp Lys Ser Thr Arg Val Met Gln Leu Ile Glu Ala Tyr Arg
385 390 395 400
Ser Arg Gly His Leu Ile Ala Asp Ile Asp Pro Leu His Trp Thr Gln
405 410 415
Pro Gly Leu Pro Val Pro Asp His Ser Asp Leu Asp Ile Glu Ser His
420 425 430
Gly Leu Thr Leu Trp Asp Phe Asp Arg Arg Phe His Val Gly Gly Phe
435 440 445
Ala Gly Arg Glu Ser Met Thr Leu Arg Glu Val Leu Ala Thr Leu Arg
450 455 460
Lys Ala Tyr Thr Leu Lys Val Gly Ser Glu Tyr Thr His Ile Leu Asp
465 470 475 480
Lys Asp Glu Arg Leu Trp Leu Gln Glu His Ile Glu Ala Gly Gln Gln
485 490 495
Lys Leu Ser Asn Pro Glu Gln Lys Tyr Leu Leu Gln Thr Leu Asn Ser
500 505 510
Ala Glu Ala Phe Glu Asn Phe Leu Gln Thr Lys Tyr Ile Gly Gln Lys
515 520 525
Arg Phe Ser Leu Glu Gly Ala Glu Ala Leu Ile Pro Leu Leu Asp Ala
530 535 540
Ala Ala Asp Gln Ala Ala Glu Gln Gly Leu Glu Glu Val Val Ile Gly
545 550 555 560
Met Pro His Arg Gly Arg Leu Asn Val Leu Ala Asn Ile Val Gly Lys
565 570 575
Pro Tyr Ser Thr Ile Phe Gly Glu Phe Glu Gly Asn Ile Glu Pro Ala
580 585 590
Ala Ala Gly Gly Ser Gly Asp Val Lys Tyr His Leu Gly Ala Glu Gly
595 600 605
Val Tyr Thr Gln Met Phe Gly Asp Asn Asp Ile Lys Val Thr Leu Thr
610 615 620
Ala Asn Pro Ser His Leu Glu Ala Val Asn Pro Val Met Glu Gly Leu
625 630 635 640
Ala Arg Ala His Gln Asp Ile Ser Pro Arg Ala Glu Asp Arg Pro Ile
645 650 655
Met Pro Ile Leu Met His Gly Asp Ala Ala Phe Thr Gly Leu Gly Ile
660 665 670
Val Pro Glu Thr Ile Asn Met Ala Gln Leu Arg Gly Tyr Ser Val Gly
675 680 685
Gly Thr Val His Val Val Val Asn Asn Gln Ile Gly Phe Thr Thr Thr
690 695 700
Pro Asp Arg Gly Arg Ser Thr His Tyr Ala Thr Asp Ile Ala Lys Gly
705 710 715 720
Phe Asp Cys Pro Val Phe His Val Asn Gly Asp Asp Pro Glu Ala Val
725 730 735
Val Trp Val Ala Arg Leu Ala Val Glu Tyr Arg Arg Arg Phe Gly Lys
740 745 750
Asp Val Phe Ile Asp Leu Val Cys Tyr Arg Arg Arg Gly His Asn Glu
755 760 765
Ala Asp Asp Pro Ser Met Thr Gln Pro Glu Leu Tyr Ser Ile Ile Glu
770 775 780
Ser Arg Pro Thr Val Arg Ser Leu Tyr His Asp Thr Leu Val Gly Arg
785 790 795 800
Gly Asp Ile Thr Ala Glu Asp Ala Gln Arg Ala Ala Asp Asp Phe His
805 810 815
Gly Gln Leu Glu Ser Val Phe Asn Gln Val Lys Glu Gly Val Lys Gly
820 825 830
Val Thr Pro Ala Ala Gln Thr Gly Ile Ala Gly Gly Gln Asp Leu Ser
835 840 845
Thr Gly Leu Asp Thr Ser Ile Thr Ala Asp Val Ile Ala Glu Ile Gly
850 855 860
Asp Ser Tyr Thr Val Asp Ala Pro Glu Asp Phe Asn Val His Gln Arg
865 870 875 880
Val Lys Pro Val Val Lys Arg Arg His Gln Met Ser Arg Gln Gly Lys
885 890 895
Ile Asp Trp Ala Phe Gly Glu Leu Leu Ala Phe Gly Ser Leu Ala Arg
900 905 910
Glu Gly Arg Leu Val Arg Leu Ala Gly Glu Asp Ser Gln Arg Gly Thr
915 920 925
Phe Thr Gln Arg His Ala Ile Leu Phe Asp Ser Thr Thr Asn Lys Pro
930 935 940
Phe Ser Pro Leu Glu Met Val Ala Arg Asn Ser Gly Asn Gly Gly Ser
945 950 955 960
Phe Arg Ala Phe Asn Ser Pro Leu Thr Glu Tyr Ala Gly Met Gly Phe
965 970 975
Glu Tyr Gly Tyr Ser Val Gly Asn Leu Asp Ala Val Val Ala Trp Glu
980 985 990
Ala Gln Phe Gly Asp Phe Ala Asp Gly Ala Gln Thr Ile Ile Asp Glu
995 1000 1005
Tyr Ile Ser Ser Gly Glu Ala Lys Trp Gly Gln Leu Ser Ser Val
1010 1015 1020
Ile Leu Leu Leu Pro His Gly Tyr Glu Gly Gln Gly Pro Asp His
1025 1030 1035
Ser Ser Ala Arg Ile Glu Arg Tyr Leu Gln Met Ala Ala Glu Gly
1040 1045 1050
Ser Met Thr Ile Ala Gln Pro Ser Thr Pro Ala Asn His Phe His
1055 1060 1065
Leu Leu Arg Arg His Ala Leu Gly Thr Met Arg Arg Pro Leu Val
1070 1075 1080
Val Phe Thr Pro Lys Ser Met Leu Arg Asn Lys Ala Ala Val Ser
1085 1090 1095
Ser Val Glu Asp Phe Thr Glu Val Thr Lys Phe Arg Ser Val Leu
1100 1105 1110
Asp Asp Pro Arg Phe Ala Asp Gly Thr Ala Asp Arg Ser Gly Val
1115 1120 1125
Lys Thr Val Leu Met Cys Ser Gly Lys Ile Tyr Tyr Asp Leu Glu
1130 1135 1140
Lys Lys Arg Ala Glu Asp Gly Arg Asp Asp Ile Ala Ile Val Arg
1145 1150 1155
Val Glu Met Leu His Pro Ile Pro His Asn Arg Ile Arg Glu Thr
1160 1165 1170
Val Val Glu Gly Tyr Pro Gly Ala Glu Val Arg Trp Val Gln Asp
1175 1180 1185
Glu Pro Ala Asn Gln Gly Ala Trp Pro Phe Leu Ala Leu Asn Leu
1190 1195 1200
Pro Glu Arg Ile Pro Gly Phe Thr Met Lys Arg Val Ser Arg Arg
1205 1210 1215
Ala Gln Ser Ser Thr Ala Thr Gly Val Ala Lys Val His His Leu
1220 1225 1230
Glu Gln Glu Thr Leu Leu Thr Glu Ala Phe Ala Thr
1235 1240 1245
<210> 6
<211> 3738
<212> DNA
<213> 解萜烯棒杆菌(Corynebacterium terpenotabidum)
<400> 6
atgaactcga ccaacttcgg cagcaatggc tggctggtcg accagatgca ccagcagttc 60
aaggaagatc cgcagtcggt cgacaaggaa tggcgcgact tcttcaccgc cggctcggcg 120
tccggcccgg atgccccgga aacgaccgcc ccgacgacca ccgccgccac gaccacgacc 180
gcgaccacga gcgcggcccc cgccaccgcg cagaccagcg gcgtggccgt cccgtccacc 240
gcgggcacca cccaccgggc ctcggccgcc gcgaccgtgg cctcgaacgt ggccctgagc 300
gcgaacccga tccccgaacg ggtcgccccc ccggccccga aggacgcggc cgagccgctg 360
accccgggcg aggccgccct gaaaggcgcc cagcgggcga tcgccaaaaa catggacgcc 420
agcctggata tccccaccgc gacgacggtc cgcgacatgc cggccaaact catgttcgaa 480
aaccgggcca tgatcaacaa ccatctgcgc agccagggcc ggggcaagat ctcgttcacc 540
cacatcctgg gctgggcgat ggtcaacgcc gtgaaagccc accccaccat gaataacaat 600
tacaaggtca tcgacggcaa gccgtcggtc gtgacccccg aacatatcaa tctcggcctc 660
gccatcgatc tggtcagcaa aaacggctcg cggaacctgg tcgtggccgc catccgcgcg 720
tgcgaaacct tcgacttcga gggcttcgtg gacgcctacg aggacatcgt ggtccgcgcc 780
cggaagggca aactgacgat ggacgacttc agcggcgtca ccatccagct gaccaacccg 840
ggcggcatcg gcacccgcca ctccgtcccg cgcctgacgc acggccaggg cgcgatcatc 900
ggcgtgggcg cgatggacta cccggcggag ttcgccggcg cctcggaaga ccgcctcgcg 960
gacctgggcg tgggcaaact ggtgaccatc acgagcacgt atgaccaccg gatcatccag 1020
ggcgccgagt cgggcgagtt cctgcgcgac atgagccgcc agctcatcga cgatggcttc 1080
tgggacggca tctacgccag cctgaaagtc ccgtatgcgc ccgtgcggtg gtcgcaggac 1140
gtgcccaaca ccggcgtcga caagagcacc cgcgtcatgc agctcatcga ggcgtaccgc 1200
tcccgcggcc acctgatcgc cgacatcgac ccgctgcatt ggacccagcc cggcctgccg 1260
gtgccggacc atagcgacct ggacatcgaa tcccacggcc tgaccctgtg ggacttcgac 1320
cggcgcttcc acgtcggcgg cttcgccggc cgcgaatcga tgaccctgcg ggaagtgctg 1380
gccacgctgc ggaaggcgta tacgctgaag gtcggctccg aatataccca tatcctcgac 1440
aaggacgaac gcctctggct ccaggagcac atcgaggccg gccagcagaa gctcagcaac 1500
cccgaacaga agtatctgct gcagacgctg aactccgccg aggcgttcga aaacttcctg 1560
cagaccaaat atatcggcca gaagcgcttc agcctggaag gcgccgaagc cctgatcccg 1620
ctgctcgatg ccgccgcgga tcaggccgcc gaacagggcc tcgaagaggt ggtgatcggc 1680
atgccgcatc gcggccggct gaatgtcctc gcgaacatcg tcggcaaacc gtacagcacc 1740
atcttcggcg agttcgaggg caacatcgag ccggccgccg cgggcggctc cggcgatgtc 1800
aaataccatc tgggcgccga gggcgtgtat acgcagatgt tcggcgacaa cgacatcaag 1860
gtgacgctga ccgccaaccc ctcccacctg gaagcggtca atcccgtcat ggagggcctc 1920
gcgcgggcgc atcaggatat ctcgccccgg gcggaggatc ggccgatcat gccgatcctg 1980
atgcacggcg acgccgcctt caccggcctg ggcatcgtcc cggaaacgat caacatggcc 2040
cagctgcggg gctactccgt gggcggcacg gtgcatgtgg tggtcaacaa ccagatcggc 2100
ttcaccacga cgccggatcg cggccggtcc acgcactacg cgacggacat cgcgaagggc 2160
ttcgattgcc ccgtcttcca cgtcaacggc gacgatccgg aggccgtcgt ctgggtcgcc 2220
cggctcgccg tggaataccg gcgccgcttc ggcaaagacg tgttcatcga cctggtgtgt 2280
tatcggcgcc gcggccataa tgaagccgat gaccccagca tgacccagcc cgaactgtac 2340
agcatcatcg agagccggcc gacggtccgg agcctgtatc atgacacgct ggtcggccgg 2400
ggcgacatca cggcggaaga cgcccagcgg gccgccgacg acttccacgg ccagctggaa 2460
agcgtcttca accaggtcaa ggaaggcgtg aagggcgtga ccccggcggc ccagaccggc 2520
atcgccggcg gccaggacct gtccaccggc ctcgacacca gcatcaccgc ggatgtgatc 2580
gccgagatcg gcgattccta taccgtggat gcccccgaag acttcaatgt ccaccagcgc 2640
gtgaagcccg tggtcaaacg gcggcaccag atgtcgcgcc agggcaagat cgattgggcg 2700
ttcggcgaac tcctcgcgtt cggctcgctg gcccgggaag gccggctggt ccggctcgcc 2760
ggcgaggact cgcagcgggg caccttcacc cagcggcacg ccatcctgtt cgacagcacc 2820
accaacaagc ccttcagccc cctggaaatg gtcgcgcgga actccggcaa cggcggctcg 2880
ttccgggcct tcaattcccc gctgacggaa tatgcgggca tgggcttcga gtatggctac 2940
tcggtgggca acctggatgc cgtggtggcc tgggaggcgc agttcggcga cttcgcggac 3000
ggcgcccaga cgatcatcga cgagtacatc tcctccggcg aggccaaatg gggccagctg 3060
tcgagcgtga tcctgctgct cccgcacggc tacgagggcc agggcccgga ccactcctcc 3120
gcccgcatcg aacgctacct gcagatggcc gccgaaggct cgatgaccat cgcgcagccg 3180
tcgacgcccg ccaaccactt ccacctgctc cgccgccacg ccctgggcac catgcggcgc 3240
ccgctggtcg tcttcacccc gaagtccatg ctgcgcaaca aggcggccgt ctcctcggtc 3300
gaagacttca cggaagtcac caagttccgg agcgtcctgg atgacccccg gttcgcggat 3360
ggcaccgccg accggagcgg cgtcaagacg gtgctgatgt gttccggcaa gatctactat 3420
gatctggaga agaagcgggc ggaagacggc cgcgacgata tcgccatcgt ccgcgtcgaa 3480
atgctgcatc ccatcccgca taaccgcatc cgcgaaacgg tcgtggaggg ctaccccggc 3540
gcggaggtgc gctgggtgca ggacgagccc gccaaccagg gcgcctggcc gttcctggcc 3600
ctcaacctcc ccgagcgcat ccccggcttc accatgaagc gcgtcagccg ccgggcccag 3660
agcagcaccg ccacgggcgt ggccaaggtc caccatctgg agcaggagac gctgctgacc 3720
gaagccttcg ccacctga 3738
<210> 7
<211> 1258
<212> PRT
<213> 久提红球菌(Rhodococcus jostii)
<400> 7
Met Ser Ser Ser Ser Thr Ser Gln Phe Gly Gln Asn Gln Trp Leu Val
1 5 10 15
Asp Glu Met Tyr Gln Arg Phe Gln Asp Asp Pro Ser Ser Val Asp Ala
20 25 30
Ser Trp His Glu Phe Leu Thr Asp Tyr Ser Pro Asp Ala Ala Ala Lys
35 40 45
Ala Gly Ala Ala Asn Gly His Gly Thr Asn Gly Thr Thr Thr Ala Ala
50 55 60
Pro Ala Ala Ala Pro Ser Ala Lys Ala Ala Thr Pro Pro Val Pro Glu
65 70 75 80
Ser Glu Thr Ala Pro Lys Pro Gln Thr Lys Thr Ala Asn Gly Ala Ala
85 90 95
Pro Lys Ala Ala Pro Asn Gly Ala Ala Pro Lys Ala Ala Ala Pro Lys
100 105 110
Thr Glu Ala Pro Lys Lys Ala Ala Pro Ala Lys Glu Thr Ala Ala Thr
115 120 125
Asp Ala Lys Ala Ser Ala Pro Ala Pro Ala Val Glu Glu Ser Lys Val
130 135 140
Leu Arg Gly Ala Ala Ala Ala Val Ala Lys Asn Met Ser Ala Ser Leu
145 150 155 160
Ala Ile Pro Thr Ala Thr Ser Val Arg Ala Ile Pro Ala Lys Leu Met
165 170 175
Phe Asp Asn Arg Ile Val Ile Asn Asn His Leu Ala Arg Thr Arg Gly
180 185 190
Gly Lys Ile Ser Phe Thr His Leu Leu Gly Tyr Ala Ile Val Gln Ala
195 200 205
Val Lys Ala Phe Pro Asn Met Asn Arg His Phe Ala Glu Ile Asp Gly
210 215 220
Lys Pro Asn Ala Val Thr Pro Ala His Thr Asn Leu Gly Leu Ala Ile
225 230 235 240
Asp Leu Pro Gly Lys Asp Gly Ser Arg Ser Leu Val Val Ala Ala Ile
245 250 255
Lys Asn Thr Asp Thr His Asn Phe Thr Gln Phe Tyr Ser Ala Tyr Glu
260 265 270
Asp Ile Val Arg Arg Ala Arg Asp Gly Lys Leu Thr Ala Glu Asp Phe
275 280 285
Ser Gly Val Thr Ile Ser Leu Thr Asn Pro Gly Gly Ile Gly Thr Val
290 295 300
His Ser Val Pro Arg Leu Met Asn Gly Gln Gly Ala Ile Ile Gly Ala
305 310 315 320
Gly Ala Met Glu Tyr Pro Ala Glu Phe Gln Gly Ala Ser Asp Glu Arg
325 330 335
Leu Ala Glu Ile Gly Val Gly Lys Leu Met Thr Leu Thr Ser Thr Tyr
340 345 350
Asp His Arg Ile Ile Gln Gly Ala Glu Ser Gly Asp Phe Leu Arg Thr
355 360 365
Ile His Asn Leu Leu Ile Ser Asp Glu Phe Tyr Asp Glu Ile Phe His
370 375 380
Ala Leu His Ile Pro Tyr Glu Pro Val Arg Trp Arg Lys Asp Val Pro
385 390 395 400
Glu Gly Ala Val Asp Lys Asn Thr Arg Val Leu Glu Leu Ile Ala Ala
405 410 415
Tyr Arg Asn Arg Gly His Leu Met Ala Asp Thr Asp Pro Leu Gln Phe
420 425 430
Val Lys Asp Lys Phe Arg Ser His Pro Asp Leu Asp Val Arg Thr His
435 440 445
Asp Leu Thr Leu Trp Asp Leu Asp Arg Glu Phe Lys Val Gly Gly Phe
450 455 460
His Gly Gln Glu Lys Met Lys Leu Arg Asp Val Leu Ser Val Leu Arg
465 470 475 480
Asp Ala Tyr Cys Arg His Val Gly Val Glu Tyr Thr His Ile Leu Glu
485 490 495
Pro Glu Gln Gln Gln Trp Leu Gln Asp Arg Val Glu Ala His His Val
500 505 510
Lys Pro Thr Val Ala Gln Gln Lys Tyr Ile Leu Ser Lys Leu Asn Ala
515 520 525
Ala Glu Ala Phe Glu Thr Phe Leu Gln Thr Lys Tyr Val Gly Gln Lys
530 535 540
Arg Phe Ser Leu Glu Gly Ala Glu Ser Val Ile Pro Met Met Asp Ala
545 550 555 560
Val Ile Asp Gln Ala Ala Glu His Gln Leu Asp Glu Val Val Ile Gly
565 570 575
Met Pro His Arg Gly Arg Leu Asn Val Leu Ala Asn Ile Val Gly Lys
580 585 590
Pro Tyr Ser Lys Ile Phe Thr Glu Phe Glu Gly Asn Met Asn Pro Ala
595 600 605
Ala Ala His Gly Ser Gly Asp Val Lys Tyr His Leu Gly Ala Glu Gly
610 615 620
Thr Tyr Ile Gln Met Phe Gly Asp Asn Asp Ile Thr Val Ser Leu Thr
625 630 635 640
Ala Asn Pro Ser His Leu Glu Ala Val Asp Pro Val Leu Glu Gly Leu
645 650 655
Val Arg Ala Lys Gln Asp Ile Leu Asp Lys Gly Glu Asp Gly Phe Thr
660 665 670
Val Leu Pro Leu Met Leu His Gly Asp Ala Ala Phe Ala Gly Gln Gly
675 680 685
Val Val Ala Glu Thr Leu Asn Leu Ala Leu Leu Arg Gly Tyr Arg Thr
690 695 700
Gly Gly Thr Val His Ile Val Val Asn Asn Gln Val Gly Phe Thr Thr
705 710 715 720
Ala Pro Glu Tyr Ser Arg Ser Ser Glu Tyr Cys Thr Asp Val Ala Lys
725 730 735
Met Ile Gly Ala Pro Ile Phe His Val Asn Gly Asp Asp Pro Glu Ala
740 745 750
Cys Val Trp Val Ala Gln Leu Ala Val Asp Phe Arg Glu Lys Phe Gln
755 760 765
Lys Asp Val Val Ile Asp Met Ile Cys Tyr Arg Arg Arg Gly His Asn
770 775 780
Glu Gly Asp Asp Pro Ser Met Thr Gln Pro Ala Met Tyr Asp Val Ile
785 790 795 800
Asp Thr Lys Arg Ser Val Arg Lys Ser Tyr Thr Glu Ser Leu Ile Gly
805 810 815
Arg Gly Asp Ile Ser Leu Lys Glu Ala Glu Asp Ala Leu Arg Asp Tyr
820 825 830
Gln Gly Gln Leu Glu Arg Val Phe Asn Glu Val Arg Glu Leu Glu Lys
835 840 845
Tyr Thr Pro Glu Pro Ser Glu Ser Val Glu Leu Asp Gln Val Leu Pro
850 855 860
Thr Lys Leu Lys Thr Ser Val Asp Glu Ser Val Leu Glu Arg Ile Gly
865 870 875 880
Asp Ala Phe Val Asn Val Pro Glu Gly Phe Thr Val His Pro Arg Val
885 890 895
Lys Pro Val Ile Glu Lys Arg Arg Glu Met Ser Arg Glu Gly Lys Ile
900 905 910
Asp Trp Ala Phe Ala Glu Leu Leu Ala Phe Gly Ser Leu Val Asp Gln
915 920 925
Gly Lys Met Val Arg Leu Ser Gly Gln Asp Ser Lys Arg Gly Thr Phe
930 935 940
Thr Gln Arg His Ser Val Leu Ile Asp Arg Lys Thr Gly Ala Glu Tyr
945 950 955 960
Thr Pro Leu Gln Asn Leu Gly Ser Glu Asn Pro Gly Lys Phe Leu Val
965 970 975
Tyr Asp Ser Ala Leu Ser Glu Phe Ala Ala Val Gly Phe Glu Tyr Gly
980 985 990
Tyr Ser Val Gly Asn Pro Asp Ala Leu Val Leu Trp Glu Ala Gln Phe
995 1000 1005
Gly Asp Phe Val Asn Gly Ala Gln Ser Ile Ile Asp Glu Phe Ile
1010 1015 1020
Ser Ser Gly Glu Ala Lys Trp Gly Gln Leu Ser Asp Val Val Leu
1025 1030 1035
Leu Leu Pro His Gly His Glu Gly Gln Gly Pro Asp His Thr Ser
1040 1045 1050
Gly Arg Ile Glu Arg Phe Leu Gln Leu Cys Ala Glu Gly Ser Met
1055 1060 1065
Thr Val Ala Val Pro Ser Thr Pro Ala Ser Tyr Phe His Leu Leu
1070 1075 1080
Arg Arg His Ser Leu Asp Gly Ile Arg Arg Pro Leu Val Val Phe
1085 1090 1095
Thr Pro Lys Ser Met Leu Arg Asn Lys Ala Ala Val Ser Asp Val
1100 1105 1110
Glu Asp Phe Thr Thr Gly Lys Phe Arg Ser Val Phe Glu Glu Pro
1115 1120 1125
Thr Tyr Glu Thr Gly Asp Ala Glu Arg Asp Lys Val Arg Arg Val
1130 1135 1140
Leu Leu Val Ser Gly Lys Leu Tyr Trp Glu Leu Leu Ala Lys Lys
1145 1150 1155
Gln Lys Asp Asn Arg Glu Asp Ile Ala Ile Val Arg Ile Glu Gln
1160 1165 1170
Leu Tyr Pro Val Pro Ser Arg Arg Leu Arg Glu Thr Leu Asp Arg
1175 1180 1185
Tyr Pro Asn Ala Thr Glu Phe Arg Trp Val Gln Glu Glu Pro Ala
1190 1195 1200
Asn Gln Gly Ala Trp Pro Phe Phe Gly Leu Ala Leu Pro Glu Leu
1205 1210 1215
Leu Pro Asp Lys Leu Ser Gly Ile Lys Arg Ile Ser Arg Arg Ser
1220 1225 1230
Met Ser Ala Pro Ser Ser Gly Ser Ser Lys Val His Ala Val Glu
1235 1240 1245
Gln Gln Glu Ile Ile Asp Glu Ala Phe Gly
1250 1255
<210> 8
<211> 3777
<212> DNA
<213> 久提红球菌(Rhodococcus jostii)
<400> 8
atgagctcgt cctcgacctc ccagttcggc cagaaccagt ggctcgtgga tgaaatgtac 60
cagcgcttcc aggatgatcc gtcgtccgtg gacgcctcct ggcatgagtt cctgacggac 120
tatagccccg acgccgccgc caaggcgggc gcggcgaacg gccacggcac caacggcacc 180
accacggcgg cgccggcggc ggcgccgtcc gccaaagccg cgaccccccc ggtccccgag 240
agcgagacgg ccccgaaacc ccagaccaag acggcgaacg gcgcggcgcc gaaagccgcg 300
cccaacggcg cggcgccgaa ggccgcggcc cccaagaccg aggcccccaa gaaggccgcc 360
cccgcgaagg aaacggccgc gacggacgcg aaagcctcgg ccccggcccc cgccgtggag 420
gaatccaagg tgctgcgggg cgccgccgcc gccgtcgcca agaatatgtc cgcgtcgctc 480
gccatcccga ccgccacctc cgtccgggcc atcccggcga agctgatgtt cgacaaccgc 540
atcgtcatca acaaccacct ggcgcggacc cggggcggca agatctcgtt cacccatctg 600
ctgggctacg cgatcgtgca ggccgtgaaa gcgttcccca acatgaaccg ccacttcgcg 660
gagatcgatg gcaagcccaa tgcggtgacc cccgcccata ccaatctggg cctcgcgatc 720
gatctgccgg gcaaagatgg cagccgctcg ctggtcgtcg cggccatcaa gaacaccgat 780
acgcacaatt tcacccagtt ctatagcgcc tacgaggata tcgtgcgccg ggcgcgggac 840
ggcaaactga ccgccgaaga cttcagcggc gtcacgatct cgctgaccaa cccgggcggc 900
atcggcaccg tccattccgt cccgcgcctg atgaacggcc agggcgccat catcggcgcg 960
ggcgcgatgg agtacccggc cgagttccag ggcgcctcgg acgagcggct ggccgaaatc 1020
ggcgtcggca agctgatgac cctcacgagc acctacgatc atcggatcat ccagggcgcc 1080
gaatccggcg acttcctccg gacgatccat aatctgctca tcagcgacga gttctacgac 1140
gaaatcttcc atgccctgca tatcccctat gaacccgtcc ggtggcgcaa agacgtgccc 1200
gaaggcgccg tggataagaa cacccgggtc ctggagctca tcgccgccta ccggaaccgc 1260
ggccacctga tggcggacac cgacccgctg cagttcgtga aggacaagtt ccggtcgcac 1320
ccggacctcg acgtgcgcac ccatgatctg acgctctggg acctggatcg ggagttcaaa 1380
gtgggcggct tccacggcca ggagaagatg aagctgcgcg atgtcctgtc ggtgctgcgc 1440
gatgcgtatt gtcgccatgt cggcgtggag tatacccaca tcctggagcc ggagcagcag 1500
cagtggctgc aggatcgcgt cgaggcccac cacgtcaaac cgacggtcgc ccagcagaag 1560
tatatcctgt ccaaactgaa cgccgccgag gccttcgaga cgttcctgca gacgaagtat 1620
gtcggccaga aacgcttctc gctggagggc gcggagagcg tgatccccat gatggacgcc 1680
gtcatcgacc aggccgccga gcatcagctg gacgaggtgg tgatcggcat gccgcatcgg 1740
ggccgcctga atgtcctggc gaacatcgtg ggcaagccgt attccaagat cttcaccgag 1800
ttcgagggca acatgaaccc ggcggcggcc cacggcagcg gcgacgtgaa gtatcacctg 1860
ggcgccgaag gcacgtatat ccagatgttc ggcgataacg acatcaccgt ctcgctcacc 1920
gcgaacccga gccatctgga agccgtggac ccggtgctgg agggcctggt ccgggccaag 1980
caggacatcc tcgacaaggg cgaagacggc ttcacggtgc tccccctcat gctccacggc 2040
gacgcggcct tcgccggcca gggcgtggtc gccgagacgc tcaacctcgc cctgctgcgc 2100
ggctaccgga ccggcggcac cgtgcacatc gtggtgaaca accaggtcgg cttcacgacc 2160
gcccccgagt atagccgctc cagcgagtac tgcacggatg tggcgaagat gatcggcgcc 2220
cccatcttcc acgtcaacgg cgatgacccc gaggcgtgcg tgtgggtggc ccagctggcg 2280
gtggacttcc gcgagaagtt ccagaaggac gtggtcatcg acatgatctg ttatcggcgg 2340
cggggccata atgagggcga cgatccgagc atgacccagc ccgcgatgta cgacgtgatc 2400
gacacgaaac gctccgtccg caaatcctat accgagtcgc tgatcggccg cggcgacatc 2460
tcgctgaagg aagcggagga cgccctgcgc gactatcagg gccagctgga acgggtcttc 2520
aatgaggtgc gcgagctgga gaagtacacg cccgaaccga gcgagagcgt cgagctggac 2580
caggtcctgc ccacgaagct gaaaacctcc gtcgatgaat cggtgctgga gcgcatcggc 2640
gatgccttcg tgaacgtccc ggagggcttc acggtccatc cgcgggtgaa gccggtgatc 2700
gaaaagcgcc gcgagatgag ccgcgaaggc aagatcgact gggccttcgc cgagctgctg 2760
gccttcggct ccctggtgga tcagggcaag atggtgcgcc tctccggcca ggacagcaag 2820
cgcggcacgt tcacccagcg ccactcggtc ctcatcgacc gcaaaaccgg cgccgaatat 2880
acccccctcc agaacctggg cagcgaaaac ccgggcaagt tcctggtcta cgattccgcg 2940
ctgagcgagt tcgcggcggt cggcttcgag tacggctata gcgtcggcaa ccccgacgcg 3000
ctggtgctgt gggaagccca gttcggcgat ttcgtgaatg gcgcccagag catcatcgac 3060
gagttcatct cgtcgggcga agccaaatgg ggccagctga gcgacgtggt cctgctgctg 3120
ccccacggcc acgaaggcca gggcccggac catacgtccg gccgcatcga acggttcctc 3180
cagctgtgtg ccgaaggctc catgaccgtg gcggtcccca gcacgccggc ctcgtacttc 3240
cacctgctgc gccggcatag cctcgacggc atccgccggc cgctcgtcgt gttcaccccc 3300
aaaagcatgc tgcgcaacaa agccgccgtg agcgacgtgg aagacttcac gaccggcaag 3360
ttccggagcg tcttcgagga gcccacctac gagacgggcg atgccgagcg ggacaaggtg 3420
cgccgggtcc tcctggtgtc gggcaagctg tactgggagc tgctggccaa gaagcagaag 3480
gataaccgcg aggacatcgc catcgtgcgc atcgaacagc tgtaccccgt cccctcgcgg 3540
cggctccgcg agacgctgga ccgctacccc aacgccaccg agttccgctg ggtgcaggag 3600
gagcccgcca accagggcgc ctggcccttc ttcggcctcg cgctgcccga actgctgccc 3660
gacaaactgt cgggcatcaa gcgcatcagc cgccggtcca tgtcggcccc gtcctccggc 3720
tcgtccaagg tgcacgcggt cgaacagcag gaaatcatcg acgaggcctt cggctga 3777
<210> 9
<211> 298
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 9
Met Ala Ala Ile Ala Phe Ile Gly Leu Gly Gln Met Gly Ser Pro Met
1 5 10 15
Ala Ser Asn Leu Leu Gln Gln Gly His Gln Leu Arg Val Phe Asp Val
20 25 30
Asn Ala Glu Ala Val Arg His Leu Val Asp Lys Gly Ala Thr Pro Ala
35 40 45
Ala Asn Pro Ala Gln Ala Ala Lys Asp Ala Glu Phe Ile Ile Thr Met
50 55 60
Leu Pro Asn Gly Asp Leu Val Arg Asn Val Leu Phe Gly Glu Asn Gly
65 70 75 80
Val Cys Glu Gly Leu Ser Thr Asp Ala Leu Val Ile Asp Met Ser Thr
85 90 95
Ile His Pro Leu Gln Thr Asp Lys Leu Ile Ala Asp Met Gln Ala Lys
100 105 110
Gly Phe Ser Met Met Asp Val Pro Val Gly Arg Thr Ser Ala Asn Ala
115 120 125
Ile Thr Gly Thr Leu Leu Leu Leu Ala Gly Gly Thr Ala Glu Gln Val
130 135 140
Glu Arg Ala Thr Pro Ile Leu Met Ala Met Gly Ser Glu Leu Ile Asn
145 150 155 160
Ala Gly Gly Pro Gly Met Gly Ile Arg Val Lys Leu Ile Asn Asn Tyr
165 170 175
Met Ser Ile Ala Leu Asn Ala Leu Ser Ala Glu Ala Ala Val Leu Cys
180 185 190
Glu Ala Leu Asn Leu Pro Phe Asp Val Ala Val Lys Val Met Ser Gly
195 200 205
Thr Ala Ala Gly Lys Gly His Phe Thr Thr Ser Trp Pro Asn Lys Val
210 215 220
Leu Ser Gly Asp Leu Ser Pro Ala Phe Met Ile Asp Leu Ala His Lys
225 230 235 240
Asp Leu Gly Ile Ala Leu Asp Val Ala Asn Gln Leu His Val Pro Met
245 250 255
Pro Leu Gly Ala Ala Ser Arg Glu Val Tyr Ser Gln Ala Arg Ala Ala
260 265 270
Gly Arg Gly Arg Gln Asp Trp Ser Ala Ile Leu Glu Gln Val Arg Val
275 280 285
Ser Ala Gly Met Thr Ala Lys Val Lys Met
290 295
<210> 10
<211> 897
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 10
atggcggcga tcgcgttcat cggcctcggc cagatgggct ccccgatggc cagcaacctc 60
ctgcagcagg gccatcagct ccgggtgttc gacgtgaacg cggaggcggt ccggcatctg 120
gtggacaaag gcgcgacccc ggccgccaac cccgcccagg cggccaagga cgcggagttc 180
atcatcacca tgctccccaa cggcgacctc gtccgcaatg tgctgttcgg cgagaacggc 240
gtgtgtgagg gcctgtcgac cgacgccctc gtcatcgaca tgagcaccat ccacccgctg 300
cagacggata agctcatcgc cgacatgcag gcgaagggct tcagcatgat ggatgtcccc 360
gtcggccgca cctccgcgaa cgcgatcacc ggcaccctgc tgctcctggc cggcggcacc 420
gccgagcagg tggagcgggc cacgcccatc ctgatggcga tgggctccga actcatcaac 480
gcgggcggcc ccggcatggg catccgcgtc aagctcatca acaactacat gtcgatcgcg 540
ctgaatgccc tctccgcgga agcggcggtg ctgtgcgaag cgctgaatct gccgttcgat 600
gtggcggtga aagtcatgag cggcaccgcg gcgggcaagg gccacttcac cacctcctgg 660
ccgaacaagg tgctgtccgg cgacctgagc ccggcgttca tgatcgatct ggcccacaag 720
gatctgggca tcgcgctcga cgtggccaac cagctgcacg tcccgatgcc gctcggcgcc 780
gcctcccggg aagtgtattc ccaggcccgc gccgccggcc gcggccggca ggattggtcc 840
gccatcctgg agcaggtgcg cgtcagcgcc ggcatgaccg cgaaggtgaa gatgtga 897
<210> 11
<211> 371
<212> PRT
<213> 齿龈卟啉单胞菌(Porphyromonas gingivalis)
<400> 11
Met Gln Leu Phe Lys Leu Lys Ser Val Thr His His Phe Asp Thr Phe
1 5 10 15
Ala Glu Phe Ala Lys Glu Phe Cys Leu Gly Glu Arg Asp Leu Val Ile
20 25 30
Thr Asn Glu Phe Ile Tyr Glu Pro Tyr Met Lys Ala Cys Gln Leu Pro
35 40 45
Cys His Phe Val Met Gln Glu Lys Tyr Gly Gln Gly Glu Pro Ser Asp
50 55 60
Glu Met Met Asn Asn Ile Leu Ala Asp Ile Arg Asn Ile Gln Phe Asp
65 70 75 80
Arg Val Ile Gly Ile Gly Gly Gly Thr Val Ile Asp Ile Ser Lys Leu
85 90 95
Phe Val Leu Lys Gly Leu Asn Asp Val Leu Asp Ala Phe Asp Arg Lys
100 105 110
Ile Pro Leu Ile Lys Glu Lys Glu Leu Ile Ile Val Pro Thr Thr Cys
115 120 125
Gly Thr Gly Ser Glu Val Thr Asn Ile Ser Ile Ala Glu Ile Lys Ser
130 135 140
Arg His Thr Lys Met Gly Leu Ala Asp Asp Ala Ile Val Ala Asp His
145 150 155 160
Ala Ile Ile Ile Pro Glu Leu Leu Lys Ser Leu Pro Phe His Phe Tyr
165 170 175
Ala Cys Ser Ala Ile Asp Ala Leu Ile His Ala Ile Glu Ser Tyr Val
180 185 190
Ser Pro Lys Ala Ser Pro Tyr Ser Arg Leu Phe Ser Glu Ala Ala Trp
195 200 205
Asp Ile Ile Leu Glu Val Phe Lys Lys Ile Ala Glu His Gly Pro Glu
210 215 220
Tyr Arg Phe Glu Lys Leu Gly Glu Met Ile Met Ala Ser Asn Tyr Ala
225 230 235 240
Gly Ile Ala Phe Gly Asn Ala Gly Val Gly Ala Val His Ala Leu Ser
245 250 255
Tyr Pro Leu Gly Gly Asn Tyr His Val Pro His Gly Glu Ala Asn Tyr
260 265 270
Gln Phe Phe Thr Glu Val Phe Lys Val Tyr Gln Lys Lys Asn Pro Phe
275 280 285
Gly Tyr Ile Val Glu Leu Asn Trp Lys Leu Ser Lys Ile Leu Asn Cys
290 295 300
Gln Pro Glu Tyr Val Tyr Pro Lys Leu Asp Glu Leu Leu Gly Cys Leu
305 310 315 320
Leu Thr Lys Lys Pro Leu His Glu Tyr Gly Met Lys Asp Glu Glu Val
325 330 335
Arg Gly Phe Ala Glu Ser Val Leu Lys Thr Gln Gln Arg Leu Leu Ala
340 345 350
Asn Asn Tyr Val Glu Leu Thr Val Asp Glu Ile Glu Gly Ile Tyr Arg
355 360 365
Arg Leu Tyr
370
<210> 12
<211> 1116
<212> DNA
<213> 齿龈卟啉单胞菌(Porphyromonas gingivalis)
<400> 12
atgcagctgt tcaaactcaa aagcgtgacg caccacttcg atacgttcgc ggagttcgcc 60
aaggagttct gcctcggcga gcgggacctg gtcatcacca atgagttcat ctacgagccc 120
tatatgaagg cgtgccagct cccgtgccac ttcgtcatgc aggaaaagta cggccagggc 180
gaaccgtcgg atgagatgat gaacaacatc ctggcggata tccggaacat ccagttcgac 240
cgggtcatcg gcatcggcgg cggcaccgtc atcgacatct ccaaactgtt cgtcctgaaa 300
ggcctcaacg acgtgctgga cgccttcgac cgcaaaatcc cgctcatcaa ggagaaggag 360
ctcatcatcg tgcccacgac ctgcggcacc ggctcggaag tgaccaacat ctcgatcgcc 420
gagatcaagt cgcgccacac caagatgggc ctggcggatg acgcgatcgt ggccgaccat 480
gccatcatca tccccgagct gctgaagagc ctgccgttcc acttctatgc gtgctccgcc 540
atcgatgccc tgatccacgc catcgagagc tacgtctcgc cgaaggcctc cccgtacagc 600
cggctgttca gcgaggcggc ctgggacatc atcctggaag tcttcaagaa gatcgccgag 660
cacggccccg aatatcggtt cgaaaagctc ggcgagatga tcatggccag caattacgcc 720
ggcatcgcct tcggcaacgc cggcgtcggc gccgtccacg ccctgtcgta cccgctgggc 780
ggcaattatc atgtgccgca tggcgaagcg aattaccagt tcttcaccga ggtgttcaag 840
gtctatcaga agaaaaaccc gttcggctac atcgtcgagc tgaactggaa gctgtcgaag 900
atcctgaact gccagccgga gtatgtgtat cccaagctgg atgaactcct gggctgcctg 960
ctgaccaaaa agccgctgca tgaatatggc atgaaggacg aagaggtgcg gggcttcgcc 1020
gaatcggtgc tgaagaccca gcagcgcctg ctcgccaaca actacgtgga gctgaccgtc 1080
gacgaaatcg aaggcatcta ccgccggctg tactga 1116
<210> 13
<211> 371
<212> PRT
<213> 克鲁维氏梭菌(Clostridium kluyveri)
<400> 13
Met Lys Leu Leu Lys Leu Ala Pro Asp Val Tyr Lys Phe Asp Thr Ala
1 5 10 15
Glu Glu Phe Met Lys Tyr Phe Lys Val Gly Lys Gly Asp Phe Ile Leu
20 25 30
Thr Asn Glu Phe Leu Tyr Lys Pro Phe Leu Glu Lys Phe Asn Asp Gly
35 40 45
Ala Asp Ala Val Phe Gln Glu Lys Tyr Gly Leu Gly Glu Pro Ser Asp
50 55 60
Glu Met Ile Asn Asn Ile Ile Lys Asp Ile Gly Asp Lys Gln Tyr Asn
65 70 75 80
Arg Ile Ile Ala Val Gly Gly Gly Ser Val Ile Asp Ile Ala Lys Ile
85 90 95
Leu Ser Leu Lys Tyr Thr Asp Asp Ser Leu Asp Leu Phe Glu Gly Lys
100 105 110
Val Pro Leu Val Lys Asn Lys Glu Leu Ile Ile Val Pro Thr Thr Cys
115 120 125
Gly Thr Gly Ser Glu Val Thr Asn Val Ser Val Ala Glu Leu Lys Arg
130 135 140
Arg His Thr Lys Lys Gly Ile Ala Ser Asp Glu Leu Tyr Ala Thr Tyr
145 150 155 160
Ala Val Leu Val Pro Glu Phe Ile Lys Gly Leu Pro Tyr Lys Phe Phe
165 170 175
Val Thr Ser Ser Val Asp Ala Leu Ile His Ala Thr Glu Ala Tyr Val
180 185 190
Ser Pro Asn Ala Asn Pro Tyr Thr Asp Met Phe Ser Val Lys Ala Met
195 200 205
Glu Leu Ile Leu Asn Gly Tyr Met Gln Met Val Glu Lys Gly Asn Asp
210 215 220
Tyr Arg Val Glu Ile Ile Glu Asp Phe Val Ile Gly Ser Asn Tyr Ala
225 230 235 240
Gly Ile Ala Phe Gly Asn Ala Gly Val Gly Ala Val His Ala Leu Ser
245 250 255
Tyr Pro Ile Gly Gly Asn Tyr His Val Pro His Gly Glu Ala Asn Tyr
260 265 270
Leu Phe Phe Thr Glu Ile Phe Lys Thr Tyr Tyr Glu Lys Asn Pro Asn
275 280 285
Gly Lys Ile Lys Asp Val Asn Lys Leu Leu Ala Gly Ile Leu Lys Cys
290 295 300
Asp Glu Ser Glu Ala Tyr Asp Ser Leu Ser Gln Leu Leu Asp Lys Leu
305 310 315 320
Leu Ser Arg Lys Pro Leu Arg Glu Tyr Gly Met Lys Glu Glu Glu Ile
325 330 335
Glu Thr Phe Ala Asp Ser Val Ile Glu Gly Gln Gln Arg Leu Leu Val
340 345 350
Asn Asn Tyr Glu Pro Phe Ser Arg Glu Asp Ile Val Asn Thr Tyr Lys
355 360 365
Lys Leu Tyr
370
<210> 14
<211> 1116
<212> DNA
<213> 克鲁维氏梭菌(Clostridium kluyveri)
<400> 14
atgaagctcc tgaagctggc cccggatgtg tacaaattcg ataccgccga ggagttcatg 60
aagtatttca aggtcggcaa gggcgacttc atcctgacga acgagttcct ctataaaccc 120
ttcctggaaa agttcaatga tggcgccgac gccgtgttcc aggaaaagta cggcctgggc 180
gagccgtccg acgaaatgat caacaacatc atcaaggata tcggcgacaa acagtacaat 240
cggatcatcg cggtgggcgg cggcagcgtc atcgatatcg ccaaaatcct gtcgctgaaa 300
tacacggacg attccctgga cctgttcgaa ggcaaggtcc cgctggtgaa gaataaagag 360
ctcatcatcg tcccgaccac ctgcggcacc ggctcggaag tgacgaatgt ctcggtcgcc 420
gaactgaagc ggcgccatac gaagaaaggc atcgcctccg acgaactcta tgcgacgtac 480
gcggtcctgg tgcccgagtt catcaaaggc ctgccctata agttcttcgt gacgagctcc 540
gtcgacgccc tcatccatgc gaccgaggcc tacgtgtcgc cgaacgccaa cccctacacc 600
gacatgttct cggtcaaggc gatggaactg atcctgaacg gctacatgca gatggtggag 660
aagggcaacg attatcgcgt ggaaatcatc gaggatttcg tgatcggctc caactacgcg 720
ggcatcgcgt tcggcaacgc gggcgtcggc gcggtccatg ccctcagcta ccccatcggc 780
ggcaactacc atgtcccgca tggcgaagcc aactacctct tcttcacgga gatcttcaag 840
acctactacg agaagaaccc gaatggcaag atcaaggacg tgaataagct cctggcgggc 900
atcctcaagt gcgatgagtc cgaggcgtac gattcgctct cgcagctgct ggacaaactg 960
ctctcgcgca agccgctgcg cgagtacggc atgaaggagg aagagatcga aaccttcgcc 1020
gacagcgtga tcgaaggcca gcagcggctg ctggtcaaca actacgagcc cttcagccgc 1080
gaggatatcg tcaacaccta caaaaagctc tactga 1116
<210> 15
<211> 431
<212> PRT
<213> 齿龈卟啉单胞菌(Porphyromonas gingivalis)
<400> 15
Met Lys Asp Val Leu Ala Glu Tyr Ala Ser Arg Ile Val Ser Ala Glu
1 5 10 15
Glu Ala Val Lys His Ile Lys Asn Gly Glu Arg Val Ala Leu Ser His
20 25 30
Ala Ala Gly Val Pro Gln Ser Cys Val Asp Ala Leu Val Gln Gln Ala
35 40 45
Asp Leu Phe Gln Asn Val Glu Ile Tyr His Met Leu Cys Leu Gly Glu
50 55 60
Gly Lys Tyr Met Ala Pro Glu Met Ala Pro His Phe Arg His Ile Thr
65 70 75 80
Asn Phe Val Gly Gly Asn Ser Arg Lys Ala Val Glu Glu Asn Arg Ala
85 90 95
Asp Phe Ile Pro Val Phe Phe Tyr Glu Val Pro Ser Met Ile Arg Lys
100 105 110
Asp Ile Leu His Ile Asp Val Ala Ile Val Gln Leu Ser Met Pro Asp
115 120 125
Glu Asn Gly Tyr Cys Ser Phe Gly Val Ser Cys Asp Tyr Ser Lys Pro
130 135 140
Ala Ala Glu Ser Ala His Leu Val Ile Gly Glu Ile Asn Arg Gln Met
145 150 155 160
Pro Tyr Val His Gly Asp Asn Leu Ile His Ile Ser Lys Leu Asp Tyr
165 170 175
Ile Val Met Ala Asp Tyr Pro Ile Tyr Ser Leu Ala Lys Pro Lys Ile
180 185 190
Gly Glu Val Glu Glu Ala Ile Gly Arg Asn Cys Ala Glu Leu Ile Glu
195 200 205
Asp Gly Ala Thr Leu Gln Leu Gly Ile Gly Ala Ile Pro Asp Ala Ala
210 215 220
Leu Leu Phe Leu Lys Asp Lys Lys Asp Leu Gly Ile His Thr Glu Met
225 230 235 240
Phe Ser Asp Gly Val Val Glu Leu Val Arg Ser Gly Val Ile Thr Gly
245 250 255
Lys Lys Lys Thr Leu His Pro Gly Lys Met Val Ala Thr Phe Leu Met
260 265 270
Gly Ser Glu Asp Val Tyr His Phe Ile Asp Lys Asn Pro Asp Val Glu
275 280 285
Leu Tyr Pro Val Asp Tyr Val Asn Asp Pro Arg Val Ile Ala Gln Asn
290 295 300
Asp Asn Met Val Ser Ile Asn Ser Cys Ile Glu Ile Asp Leu Met Gly
305 310 315 320
Gln Val Val Ser Glu Cys Ile Gly Ser Lys Gln Phe Ser Gly Thr Gly
325 330 335
Gly Gln Val Asp Tyr Val Arg Gly Ala Ala Trp Ser Lys Asn Gly Lys
340 345 350
Ser Ile Met Ala Ile Pro Ser Thr Ala Lys Asn Gly Thr Ala Ser Arg
355 360 365
Ile Val Pro Ile Ile Ala Glu Gly Ala Ala Val Thr Thr Leu Arg Asn
370 375 380
Glu Val Asp Tyr Val Val Thr Glu Tyr Gly Ile Ala Gln Leu Lys Gly
385 390 395 400
Lys Ser Leu Arg Gln Arg Ala Glu Ala Leu Ile Ala Ile Ala His Pro
405 410 415
Asp Phe Arg Glu Glu Leu Thr Lys His Leu Arg Lys Arg Phe Gly
420 425 430
<210> 16
<211> 1296
<212> DNA
<213> 齿龈卟啉单胞菌(Porphyromonas gingivalis)
<400> 16
atgaaggacg tgctggccga gtacgcctcg cgcatcgtct cggcggaaga agcggtcaag 60
cacatcaaga acggcgagcg cgtcgcgctc tcgcatgccg ccggcgtccc gcagtcctgc 120
gtcgatgccc tggtccagca ggccgatctc ttccagaatg tcgaaatcta ccatatgctc 180
tgcctgggcg agggcaagta catggccccc gagatggcgc cgcatttccg ccatatcacg 240
aatttcgtcg gcggcaactc gcggaaagcc gtggaggaga accgggccga cttcatcccc 300
gtgttcttct acgaggtccc cagcatgatc cgcaaagata tcctccacat cgacgtggcg 360
atcgtgcagc tgagcatgcc ggatgagaac ggctactgca gcttcggcgt gagctgtgac 420
tacagcaagc cggccgccga atccgcccac ctcgtcatcg gcgagatcaa ccggcagatg 480
ccgtacgtcc acggcgacaa cctgatccac atcagcaagc tggactacat cgtcatggcc 540
gactatccga tctatagcct ggcgaaaccc aagatcggcg aggtcgagga ggccatcggc 600
cggaactgcg ccgagctgat cgaagacggc gccaccctcc agctgggcat cggcgccatc 660
ccggacgccg ccctgctctt cctgaaagac aagaaagacc tgggcatcca caccgaaatg 720
ttcagcgacg gcgtcgtcga actggtccgg agcggcgtca tcaccggcaa gaaaaaaacc 780
ctgcacccgg gcaaaatggt cgcgacgttc ctgatgggct ccgaagatgt ctatcatttc 840
atcgacaaga accccgacgt ggagctctac ccggtggact atgtgaacga cccgcgcgtc 900
atcgcccaga acgacaacat ggtcagcatc aactcctgta tcgagatcga cctcatgggc 960
caggtcgtga gcgaatgtat cggctccaag cagttctcgg gcacgggcgg ccaggtggac 1020
tacgtccgcg gcgcggcgtg gtcgaagaac ggcaagtcga tcatggccat cccctccacc 1080
gccaagaacg gcaccgcctc gcgcatcgtg ccgatcatcg cggagggcgc cgcggtgacg 1140
accctgcgga acgaagtgga ttacgtggtc acggagtatg gcatcgccca gctgaagggc 1200
aagtcgctcc gccagcgggc ggaagcgctg atcgcgatcg cgcacccgga cttccgggag 1260
gagctgacca aacacctgcg gaaacggttc ggctga 1296
<210> 17
<211> 431
<212> PRT
<213> 齿龈卟啉单胞菌(Porphyromonas gingivalis)
<400> 17
Met Gln Trp Gln Glu Leu Tyr Arg Gln Arg Val Cys Ser Ala Asp Glu
1 5 10 15
Ala Val Val Asp Ser Leu Lys Pro Gly Thr Lys Val Val Phe Gly His
20 25 30
Ala Ala Ala Ala Pro Val Arg Phe Ser Gln Ala Met Tyr Arg Gln Arg
35 40 45
Glu Lys Leu Glu Asn Ile Thr Val Phe His Met Leu Tyr Phe Gly Asp
50 55 60
Ala Pro His Leu Ala Pro Glu Met Arg Ser His Val His Pro Thr Leu
65 70 75 80
Asn Phe Leu Glu Gly Asn Ser Arg Pro Ala Ser Arg Asp Arg Arg Val
85 90 95
Asp Phe Ile Pro Cys His Phe His Glu Val Pro Glu Leu Phe Arg Gln
100 105 110
Gly Phe Phe Pro Leu Asp Val Ala Val Val Gln Val Ser Thr Pro Asn
115 120 125
Glu Glu Gly Tyr Cys Ser Phe Gly Val Ser Cys Asp Tyr Thr Lys Ala
130 135 140
Ala Ala Glu Cys Ala Pro Val Val Val Ala Glu Val Asn Lys Gln Met
145 150 155 160
Pro Phe Ile Gly Gly Glu Asn Leu Ile His Ile Ser Lys Leu Thr His
165 170 175
Ile Ile Glu Val Asp Glu Pro Ile Ala Glu Val Leu Pro Pro Ala Ile
180 185 190
Ser Asp Leu Glu Leu Arg Ile Gly Gln Asn Cys Ala Ser Leu Ile Lys
195 200 205
Asp Gly Asp Thr Leu Gln Leu Gly Ile Gly Gly Ile Pro Asp Ala Val
210 215 220
Leu Arg Ala Leu Glu Gly His Lys Asp Leu Gly Ile His Thr Glu Met
225 230 235 240
Phe Thr Asp Gly Val Met Arg Met Ile Arg Lys Gly Ile Ile Asn Gly
245 250 255
Lys Lys Lys Thr Leu His Pro Glu Lys Val Val Thr Ser Leu Ile Phe
260 265 270
Gly Ser Lys Glu Leu Tyr Asp Phe Val Asn Asn Asn Pro Val Ile Glu
275 280 285
Cys Tyr Pro Val Asp Tyr Ile Asn Asn Pro Asp Val Ile Gly Lys Asn
290 295 300
Asp Arg Met Val Ser Ile Asn Ser Cys Leu Glu Met Asp Leu Met Gly
305 310 315 320
Gln Ala Ala Ser Glu Ser Ile Gly Tyr Glu Gln Phe Ser Gly Ser Gly
325 330 335
Gly Gln Val Asp Phe Leu Arg Gly Ala Lys Arg Ser Lys Gly Gly Ile
340 345 350
Ser Ile Met Ala Phe Pro Ser Thr Ala Lys Lys Gly Thr Glu Ser Arg
355 360 365
Ile Val Pro Ile Leu Lys Glu Gly Ala Cys Val Thr Thr Gly Arg Asn
370 375 380
Glu Val Asp Tyr Val Val Thr Glu Tyr Gly Val Ala Arg Leu Arg Gly
385 390 395 400
Ala Thr Leu Arg Gln Arg Ala Glu Ala Leu Thr Ala Ile Ala His Pro
405 410 415
Asp Phe Arg Pro Ala Leu Glu Glu Glu Ile Arg Arg Arg Phe Glu
420 425 430
<210> 18
<211> 1296
<212> DNA
<213> 齿龈卟啉单胞菌(Porphyromonas gingivalis)
<400> 18
atgcagtggc aggaactcta ccggcagcgc gtgtgctccg cggatgaagc cgtcgtggat 60
agcctgaagc ccggcaccaa ggtggtcttc ggccatgccg ccgccgcgcc cgtgcggttc 120
tcgcaggcca tgtatcgcca gcgcgaaaag ctcgaaaaca tcaccgtgtt ccatatgctc 180
tatttcggcg atgcccccca cctggccccc gaaatgcgct cccatgtcca cccgacgctc 240
aacttcctgg aaggcaatag ccgccccgcg tcgcgggatc ggcgcgtgga tttcatcccc 300
tgccacttcc acgaagtgcc cgagctgttc cgccagggct tcttccccct cgacgtggcg 360
gtggtgcagg tgtcgacccc gaacgaggag ggctattgta gcttcggcgt ctcgtgtgac 420
tatacgaagg ccgcggccga atgtgccccg gtcgtggtgg ccgaggtgaa caagcagatg 480
ccgttcatcg gcggcgagaa cctgatccat atctccaagc tgacccatat catcgaagtg 540
gatgagccga tcgccgaggt gctgcccccc gcgatcagcg acctggagct gcgcatcggc 600
cagaactgcg cgtccctcat caaggacggc gatacgctcc agctgggcat cggcggcatc 660
ccggacgcgg tgctgcgggc cctggaaggc cataaagacc tcggcatcca cacggagatg 720
ttcaccgacg gcgtgatgcg gatgatccgg aagggcatca tcaacggcaa gaaaaagacc 780
ctgcacccgg aaaaagtggt gaccagcctg atcttcggca gcaaagaact gtacgacttc 840
gtcaacaaca acccggtgat cgagtgctat ccggtcgatt atatcaacaa tccggatgtc 900
atcggcaaga acgaccgcat ggtgagcatc aactcctgcc tggaaatgga cctgatgggc 960
caggccgcga gcgaaagcat cggctacgaa cagttctccg gctcgggcgg ccaggtggat 1020
ttcctgcggg gcgcgaagcg gtccaaaggc ggcatcagca tcatggcctt cccctccacg 1080
gccaagaagg gcacggagtc ccgcatcgtg cccatcctga aggagggcgc gtgcgtcacg 1140
accggccgca atgaggtgga ttacgtcgtc accgagtacg gcgtcgcccg cctccggggc 1200
gccaccctcc ggcagcgggc cgaggccctg acggccatcg cccatcccga cttccgcccc 1260
gccctggagg aagagatccg ccggcgcttc gagtga 1296
<210> 19
<211> 438
<212> PRT
<213> 氨基酪酸梭菌(Clostridium aminobutyricum)
<400> 19
Met Asp Trp Lys Lys Ile Tyr Glu Asp Arg Thr Cys Thr Ala Asp Glu
1 5 10 15
Ala Val Lys Ser Ile Lys Ser Gly Asp Arg Val Leu Phe Ala His Cys
20 25 30
Val Ala Glu Pro Pro Val Leu Val Glu Ala Met Val Ala Asn Ala Ala
35 40 45
Ala Tyr Lys Asn Val Thr Val Ser His Met Val Thr Leu Gly Lys Gly
50 55 60
Glu Tyr Ser Lys Pro Glu Tyr Lys Glu Asn Phe Thr Phe Glu Gly Trp
65 70 75 80
Phe Thr Ser Pro Ser Thr Arg Gly Ser Ile Ala Glu Gly His Gly Gln
85 90 95
Phe Val Pro Val Phe Phe His Glu Val Pro Ser Leu Ile Arg Lys Asp
100 105 110
Ile Phe His Val Asp Val Phe Met Val Met Val Ser Pro Pro Asp His
115 120 125
Asn Gly Phe Cys Cys Val Gly Val Ser Ser Asp Tyr Thr Met Gln Ala
130 135 140
Ile Lys Ser Ala Lys Ile Val Leu Ala Glu Val Asn Asp Gln Val Pro
145 150 155 160
Val Val Tyr Gly Asp Thr Phe Val His Val Ser Asn Ile Asp Lys Phe
165 170 175
Val Glu Thr Ser His Pro Leu Pro Glu Ile Gly Leu Pro Lys Ile Gly
180 185 190
Glu Val Glu Ala Ala Ile Gly Lys His Cys Ala Ser Leu Ile Glu Asp
195 200 205
Gly Ser Thr Leu Gln Leu Gly Ile Gly Ala Ile Pro Asp Ala Val Leu
210 215 220
Ser Gln Leu Lys Asp Lys Lys His Leu Gly Ile His Ser Glu Met Ile
225 230 235 240
Ser Asp Gly Val Val Asp Leu Tyr Glu Ala Gly Val Ile Asp Cys Ser
245 250 255
Gln Lys Ser Ile Asp Lys Gly Lys Met Ala Ile Thr Phe Leu Met Gly
260 265 270
Thr Lys Arg Leu Tyr Asp Phe Ala Ala Asn Asn Pro Lys Val Glu Leu
275 280 285
Lys Thr Val Asp Tyr Ile Asn His Pro Ser Val Val Ala Gln Cys Ser
290 295 300
Lys Met Val Cys Ile Asn Ala Cys Leu Gln Val Asp Phe Met Gly Gln
305 310 315 320
Ile Val Ser Asp Ser Ile Gly Thr Lys Arg Phe Ser Gly Val Gly Gly
325 330 335
Gln Val Asp Phe Val Arg Gly Ala Ser Met Ser Ile Asp Gly Lys Gly
340 345 350
Lys Ala Ile Ile Ala Met Pro Ser Val Ala Lys Lys Lys Asp Gly Ser
355 360 365
Met Ile Ser Lys Ile Val Pro Phe Ile Asp His Gly Ala Ala Val Thr
370 375 380
Thr Ser Arg Asn Asp Ala Asp Tyr Val Val Thr Glu Tyr Gly Ile Ala
385 390 395 400
Glu Met Lys Gly Lys Ser Leu Gln Asp Arg Ala Arg Ala Leu Ile Asn
405 410 415
Ile Ala His Pro Asp Phe Lys Asp Glu Leu Lys Ala Glu Phe Glu Lys
420 425 430
Arg Phe Asn Ala Ala Phe
435
<210> 20
<211> 1317
<212> DNA
<213> 氨基酪酸梭菌(Clostridium aminobutyricum)
<400> 20
atggattgga aaaagatcta cgaagatcgc acctgcaccg ccgatgaagc cgtcaagtcc 60
atcaagtccg gcgaccgcgt cctgttcgcc cactgtgtcg ccgaaccccc ggtgctggtc 120
gaagcgatgg tggccaacgc cgcggcgtac aagaacgtca ccgtgagcca tatggtgacc 180
ctgggcaagg gcgaatatag caagcccgag tacaaggaga acttcacgtt cgagggctgg 240
ttcacctccc cgtcgacgcg gggctcgatc gcggagggcc acggccagtt cgtgcccgtg 300
ttcttccatg aggtgccgtc cctgatccgc aaggatatct tccacgtcga cgtgttcatg 360
gtcatggtgt ccccgcccga tcataacggc ttctgctgtg tcggcgtcag cagcgactac 420
acgatgcagg ccatcaagtc ggccaagatc gtgctggcgg aagtcaacga ccaggtgccc 480
gtggtgtatg gcgatacgtt cgtgcatgtc tcgaacatcg ataagttcgt ggaaacctcg 540
catccgctcc cggaaatcgg cctgccgaaa atcggcgagg tggaagcggc catcggcaaa 600
cactgtgcct ccctgatcga agacggctcg acgctgcagc tgggcatcgg cgccatcccc 660
gacgccgtgc tcagccagct gaaagacaag aagcacctgg gcatccactc ggagatgatc 720
tccgacggcg tcgtggacct gtatgaggcg ggcgtgatcg actgctccca gaagtcgatc 780
gacaagggca aaatggcgat caccttcctg atgggcacca agcgcctgta cgacttcgcg 840
gcgaacaatc cgaaggtgga gctgaaaacg gtggactaca tcaaccatcc gtcggtggtg 900
gcccagtgct ccaagatggt gtgcatcaac gcctgcctgc aggtggattt catgggccag 960
atcgtgagcg acagcatcgg caccaagcgc ttctcgggcg tgggcggcca ggtcgacttc 1020
gtgcggggcg cctccatgag catcgacggc aagggcaagg cgatcatcgc catgccgtcg 1080
gtcgccaaga agaaggacgg cagcatgatc tcgaaaatcg tccccttcat cgatcacggc 1140
gccgccgtga ccacctcgcg gaacgacgcc gattatgtgg tcacggagta cggcatcgcc 1200
gagatgaaag gcaagtccct ccaggaccgg gcccgggcgc tcatcaacat cgcgcacccg 1260
gatttcaagg atgagctgaa ggcggagttc gagaagcggt tcaacgcggc gttctga 1317
<210> 21
<211> 858
<212> PRT
<213> 丙酮丁醇梭菌(Clostridium acetobutylicum)
<400> 21
Met Lys Val Thr Asn Gln Lys Glu Leu Lys Gln Lys Leu Asn Glu Leu
1 5 10 15
Arg Glu Ala Gln Lys Lys Phe Ala Thr Tyr Thr Gln Glu Gln Val Asp
20 25 30
Lys Ile Phe Lys Gln Cys Ala Ile Ala Ala Ala Lys Glu Arg Ile Asn
35 40 45
Leu Ala Lys Leu Ala Val Glu Glu Thr Gly Ile Gly Leu Val Glu Asp
50 55 60
Lys Ile Ile Lys Asn His Phe Ala Ala Glu Tyr Ile Tyr Asn Lys Tyr
65 70 75 80
Lys Asn Glu Lys Thr Cys Gly Ile Ile Asp His Asp Asp Ser Leu Gly
85 90 95
Ile Thr Lys Val Ala Glu Pro Ile Gly Ile Val Ala Ala Ile Val Pro
100 105 110
Thr Thr Asn Pro Thr Ser Thr Ala Ile Phe Lys Ser Leu Ile Ser Leu
115 120 125
Lys Thr Arg Asn Ala Ile Phe Phe Ser Pro His Pro Arg Ala Lys Lys
130 135 140
Ser Thr Ile Ala Ala Ala Lys Leu Ile Leu Asp Ala Ala Val Lys Ala
145 150 155 160
Gly Ala Pro Lys Asn Ile Ile Gly Trp Ile Asp Glu Pro Ser Ile Glu
165 170 175
Leu Ser Gln Asp Leu Met Ser Glu Ala Asp Ile Ile Leu Ala Thr Gly
180 185 190
Gly Pro Ser Met Val Lys Ala Ala Tyr Ser Ser Gly Lys Pro Ala Ile
195 200 205
Gly Val Gly Ala Gly Asn Thr Pro Ala Ile Ile Asp Glu Ser Ala Asp
210 215 220
Ile Asp Met Ala Val Ser Ser Ile Ile Leu Ser Lys Thr Tyr Asp Asn
225 230 235 240
Gly Val Ile Cys Ala Ser Glu Gln Ser Ile Leu Val Met Asn Ser Ile
245 250 255
Tyr Glu Lys Val Lys Glu Glu Phe Val Lys Arg Gly Ser Tyr Ile Leu
260 265 270
Asn Gln Asn Glu Ile Ala Lys Ile Lys Glu Thr Met Phe Lys Asn Gly
275 280 285
Ala Ile Asn Ala Asp Ile Val Gly Lys Ser Ala Tyr Ile Ile Ala Lys
290 295 300
Met Ala Gly Ile Glu Val Pro Gln Thr Thr Lys Ile Leu Ile Gly Glu
305 310 315 320
Val Gln Ser Val Glu Lys Ser Glu Leu Phe Ser His Glu Lys Leu Ser
325 330 335
Pro Val Leu Ala Met Tyr Lys Val Lys Asp Phe Asp Glu Ala Leu Lys
340 345 350
Lys Ala Gln Arg Leu Ile Glu Leu Gly Gly Ser Gly His Thr Ser Ser
355 360 365
Leu Tyr Ile Asp Ser Gln Asn Asn Lys Asp Lys Val Lys Glu Phe Gly
370 375 380
Leu Ala Met Lys Thr Ser Arg Thr Phe Ile Asn Met Pro Ser Ser Gln
385 390 395 400
Gly Ala Ser Gly Asp Leu Tyr Asn Phe Ala Ile Ala Pro Ser Phe Thr
405 410 415
Leu Gly Cys Gly Thr Trp Gly Gly Asn Ser Val Ser Gln Asn Val Glu
420 425 430
Pro Lys His Leu Leu Asn Ile Lys Ser Val Ala Glu Arg Arg Glu Asn
435 440 445
Met Leu Trp Phe Lys Val Pro Gln Lys Ile Tyr Phe Lys Tyr Gly Cys
450 455 460
Leu Arg Phe Ala Leu Lys Glu Leu Lys Asp Met Asn Lys Lys Arg Ala
465 470 475 480
Phe Ile Val Thr Asp Lys Asp Leu Phe Lys Leu Gly Tyr Val Asn Lys
485 490 495
Ile Thr Lys Val Leu Asp Glu Ile Asp Ile Lys Tyr Ser Ile Phe Thr
500 505 510
Asp Ile Lys Ser Asp Pro Thr Ile Asp Ser Val Lys Lys Gly Ala Lys
515 520 525
Glu Met Leu Asn Phe Glu Pro Asp Thr Ile Ile Ser Ile Gly Gly Gly
530 535 540
Ser Pro Met Asp Ala Ala Lys Val Met His Leu Leu Tyr Glu Tyr Pro
545 550 555 560
Glu Ala Glu Ile Glu Asn Leu Ala Ile Asn Phe Met Asp Ile Arg Lys
565 570 575
Arg Ile Cys Asn Phe Pro Lys Leu Gly Thr Lys Ala Ile Ser Val Ala
580 585 590
Ile Pro Thr Thr Ala Gly Thr Gly Ser Glu Ala Thr Pro Phe Ala Val
595 600 605
Ile Thr Asn Asp Glu Thr Gly Met Lys Tyr Pro Leu Thr Ser Tyr Glu
610 615 620
Leu Thr Pro Asn Met Ala Ile Ile Asp Thr Glu Leu Met Leu Asn Met
625 630 635 640
Pro Arg Lys Leu Thr Ala Ala Thr Gly Ile Asp Ala Leu Val His Ala
645 650 655
Ile Glu Ala Tyr Val Ser Val Met Ala Thr Asp Tyr Thr Asp Glu Leu
660 665 670
Ala Leu Arg Ala Ile Lys Met Ile Phe Lys Tyr Leu Pro Arg Ala Tyr
675 680 685
Lys Asn Gly Thr Asn Asp Ile Glu Ala Arg Glu Lys Met Ala His Ala
690 695 700
Ser Asn Ile Ala Gly Met Ala Phe Ala Asn Ala Phe Leu Gly Val Cys
705 710 715 720
His Ser Met Ala His Lys Leu Gly Ala Met His His Val Pro His Gly
725 730 735
Ile Ala Cys Ala Val Leu Ile Glu Glu Val Ile Lys Tyr Asn Ala Thr
740 745 750
Asp Cys Pro Thr Lys Gln Thr Ala Phe Pro Gln Tyr Lys Ser Pro Asn
755 760 765
Ala Lys Arg Lys Tyr Ala Glu Ile Ala Glu Tyr Leu Asn Leu Lys Gly
770 775 780
Thr Ser Asp Thr Glu Lys Val Thr Ala Leu Ile Glu Ala Ile Ser Lys
785 790 795 800
Leu Lys Ile Asp Leu Ser Ile Pro Gln Asn Ile Ser Ala Ala Gly Ile
805 810 815
Asn Lys Lys Asp Phe Tyr Asn Thr Leu Asp Lys Met Ser Glu Leu Ala
820 825 830
Phe Asp Asp Gln Cys Thr Thr Ala Asn Pro Arg Tyr Pro Leu Ile Ser
835 840 845
Glu Leu Lys Asp Ile Tyr Ile Lys Ser Phe
850 855
<210> 22
<211> 2577
<212> DNA
<213> 丙酮丁醇梭菌(Clostridium acetobutylicum)
<400> 22
atgaaggtga ccaaccagaa agaactgaag cagaaactga acgaactgcg ggaggcgcag 60
aaaaagttcg ccacctatac ccaggagcag gtggacaaaa tcttcaagca gtgtgcgatc 120
gccgccgcca aagaacggat caacctggcg aaactcgccg tcgaagaaac cggcatcggc 180
ctcgtggagg acaagatcat caaaaatcac ttcgccgccg aatatatcta taacaaatac 240
aagaacgaga agacctgcgg catcatcgac catgacgact cgctgggcat caccaaagtc 300
gccgagccca tcggcatcgt ggccgcgatc gtgcccacca ccaacccgac gagcaccgcc 360
atcttcaagt cgctgatctc cctgaagacg cgcaatgcga tcttcttcag cccccatccg 420
cgggccaaaa agtcgacgat cgcggcggcc aaactgatcc tggacgccgc ggtcaaggcc 480
ggcgccccga aaaatatcat cggctggatc gacgaaccgt ccatcgagct gtcccaggac 540
ctcatgtccg aagccgacat catcctggcg accggcggcc cgagcatggt gaaggccgcc 600
tattccagcg gcaaaccggc catcggcgtc ggcgccggca acacccccgc gatcatcgac 660
gagtccgccg acatcgacat ggccgtctcc tcgatcatcc tgagcaagac ctacgataac 720
ggcgtcatct gcgcgtcgga acagagcatc ctggtcatga actccatcta tgaaaaggtc 780
aaggaagagt tcgtgaagcg cggctcgtat atcctgaacc agaatgaaat cgcgaagatc 840
aaggagacga tgttcaagaa cggcgccatc aacgccgaca tcgtcggcaa gagcgcctat 900
atcatcgcga agatggccgg catcgaagtg ccgcagacca ccaagatcct gatcggcgaa 960
gtccagtccg tcgaaaagtc cgaactgttc tcccacgaaa agctgagccc ggtgctcgcc 1020
atgtacaaag tcaaagactt cgacgaggcc ctcaaaaagg cgcagcggct catcgaactg 1080
ggcggcagcg gccatacctc gtcgctgtac atcgatagcc agaacaacaa ggacaaagtc 1140
aaagagttcg gcctggcgat gaagacgagc cgcaccttca tcaacatgcc gagcagccag 1200
ggcgcgtccg gcgacctgta caacttcgcc atcgccccga gcttcacgct cggctgcggc 1260
acctggggcg gcaattcggt gtcgcagaac gtggaaccga aacatctgct gaacatcaaa 1320
tccgtcgcgg agcgccgcga aaatatgctc tggttcaagg tcccgcagaa gatctatttc 1380
aaatatggct gcctgcgctt cgccctcaaa gaactgaaag acatgaataa gaaacgcgcc 1440
ttcatcgtca ccgataaaga tctgttcaag ctgggctacg tgaacaaaat cacgaaggtc 1500
ctggatgaga tcgatatcaa gtacagcatc ttcaccgaca tcaagtccga tcccaccatc 1560
gactccgtca agaagggcgc caaagagatg ctcaacttcg aaccggacac catcatcagc 1620
atcggcggcg gctcgccgat ggacgcggcc aaggtcatgc atctgctcta tgaatatccg 1680
gaggccgaga tcgaaaacct ggccatcaac ttcatggaca tccggaaacg catctgcaac 1740
ttcccgaagc tcggcacgaa agccatcagc gtggccatcc ccacgaccgc gggcaccggc 1800
tcggaagcca cgccgttcgc ggtcatcacg aatgacgaaa ccggcatgaa ataccccctg 1860
acctcctacg agctcacccc caatatggcc atcatcgaca cggagctcat gctcaacatg 1920
ccgcggaagc tcaccgccgc caccggcatc gatgccctgg tgcacgccat cgaagcctac 1980
gtgagcgtga tggcgaccga ctataccgat gagctggccc tccgggccat caagatgatc 2040
ttcaagtatc tgccgcgggc ctacaaaaac ggcacgaatg acatcgaggc ccgcgaaaag 2100
atggcgcatg cgagcaacat cgcgggcatg gccttcgcga acgccttcct gggcgtgtgc 2160
catagcatgg cgcacaaact gggcgcgatg catcacgtcc cgcatggcat cgcctgtgcc 2220
gtcctgatcg aggaggtcat caagtacaac gccacggatt gtccgaccaa acagaccgcc 2280
ttcccgcagt acaagtcccc gaacgcgaag cggaaatacg cggagatcgc ggagtacctg 2340
aatctgaaag gcaccagcga caccgaaaaa gtcacggccc tcatcgaagc catctcgaaa 2400
ctgaaaatcg atctgagcat cccccagaac atctccgcgg ccggcatcaa taagaaggat 2460
ttctataaca cgctggacaa gatgagcgag ctggcgttcg atgaccagtg cacgaccgcc 2520
aacccccggt atccgctgat ctccgaactc aaggacatct acatcaagtc cttctga 2577
<210> 23
<211> 891
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 23
Met Ala Val Thr Asn Val Ala Glu Leu Asn Ala Leu Val Glu Arg Val
1 5 10 15
Lys Lys Ala Gln Arg Glu Tyr Ala Ser Phe Thr Gln Glu Gln Val Asp
20 25 30
Lys Ile Phe Arg Ala Ala Ala Leu Ala Ala Ala Asp Ala Arg Ile Pro
35 40 45
Leu Ala Lys Met Ala Val Ala Glu Ser Gly Met Gly Ile Val Glu Asp
50 55 60
Lys Val Ile Lys Asn His Phe Ala Ser Glu Tyr Ile Tyr Asn Ala Tyr
65 70 75 80
Lys Asp Glu Lys Thr Cys Gly Val Leu Ser Glu Asp Asp Thr Phe Gly
85 90 95
Thr Ile Thr Ile Ala Glu Pro Ile Gly Ile Ile Cys Gly Ile Val Pro
100 105 110
Thr Thr Asn Pro Thr Ser Thr Ala Ile Phe Lys Ser Leu Ile Ser Leu
115 120 125
Lys Thr Arg Asn Ala Ile Ile Phe Ser Pro His Pro Arg Ala Lys Asp
130 135 140
Ala Thr Asn Lys Ala Ala Asp Ile Val Leu Gln Ala Ala Ile Ala Ala
145 150 155 160
Gly Ala Pro Lys Asp Leu Ile Gly Trp Ile Asp Gln Pro Ser Val Glu
165 170 175
Leu Ser Asn Ala Leu Met His His Pro Asp Ile Asn Leu Ile Leu Ala
180 185 190
Thr Gly Gly Pro Gly Met Val Lys Ala Ala Tyr Ser Ser Gly Lys Pro
195 200 205
Ala Ile Gly Val Gly Ala Gly Asn Thr Pro Val Val Ile Asp Glu Thr
210 215 220
Ala Asp Ile Lys Arg Ala Val Ala Ser Val Leu Met Ser Lys Thr Phe
225 230 235 240
Asp Asn Gly Val Ile Cys Ala Ser Glu Gln Ser Val Val Val Val Asp
245 250 255
Ser Val Tyr Asp Ala Val Arg Glu Arg Phe Ala Thr His Gly Gly Tyr
260 265 270
Leu Leu Gln Gly Lys Glu Leu Lys Ala Val Gln Asp Val Ile Leu Lys
275 280 285
Asn Gly Ala Leu Asn Ala Ala Ile Val Gly Gln Pro Ala Tyr Lys Ile
290 295 300
Ala Glu Leu Ala Gly Phe Ser Val Pro Glu Asn Thr Lys Ile Leu Ile
305 310 315 320
Gly Glu Val Thr Val Val Asp Glu Ser Glu Pro Phe Ala His Glu Lys
325 330 335
Leu Ser Pro Thr Leu Ala Met Tyr Arg Ala Lys Asp Phe Glu Asp Ala
340 345 350
Val Glu Lys Ala Glu Lys Leu Val Ala Met Gly Gly Ile Gly His Thr
355 360 365
Ser Cys Leu Tyr Thr Asp Gln Asp Asn Gln Pro Ala Arg Val Ser Tyr
370 375 380
Phe Gly Gln Lys Met Lys Thr Ala Arg Ile Leu Ile Asn Thr Pro Ala
385 390 395 400
Ser Gln Gly Gly Ile Gly Asp Leu Tyr Asn Phe Lys Leu Ala Pro Ser
405 410 415
Leu Thr Leu Gly Cys Gly Ser Trp Gly Gly Asn Ser Ile Ser Glu Asn
420 425 430
Val Gly Pro Lys His Leu Ile Asn Lys Lys Thr Val Ala Lys Arg Ala
435 440 445
Glu Asn Met Leu Trp His Lys Leu Pro Lys Ser Ile Tyr Phe Arg Arg
450 455 460
Gly Ser Leu Pro Ile Ala Leu Asp Glu Val Ile Thr Asp Gly His Lys
465 470 475 480
Arg Ala Leu Ile Val Thr Asp Arg Phe Leu Phe Asn Asn Gly Tyr Ala
485 490 495
Asp Gln Ile Thr Ser Val Leu Lys Ala Ala Gly Val Glu Thr Glu Val
500 505 510
Phe Phe Glu Val Glu Ala Asp Pro Thr Leu Ser Ile Val Arg Lys Gly
515 520 525
Ala Glu Leu Ala Asn Ser Phe Lys Pro Asp Val Ile Ile Ala Leu Gly
530 535 540
Gly Gly Ser Pro Met Asp Ala Ala Lys Ile Met Trp Val Met Tyr Glu
545 550 555 560
His Pro Glu Thr His Phe Glu Glu Leu Ala Leu Arg Phe Met Asp Ile
565 570 575
Arg Lys Arg Ile Tyr Lys Phe Pro Lys Met Gly Val Lys Ala Lys Met
580 585 590
Ile Ala Val Thr Thr Thr Ser Gly Thr Gly Ser Glu Val Thr Pro Phe
595 600 605
Ala Val Val Thr Asp Asp Ala Thr Gly Gln Lys Tyr Pro Leu Ala Asp
610 615 620
Tyr Ala Leu Thr Pro Asp Met Ala Ile Val Asp Ala Asn Leu Val Met
625 630 635 640
Asp Met Pro Lys Ser Leu Cys Ala Phe Gly Gly Leu Asp Ala Val Thr
645 650 655
His Ala Met Glu Ala Tyr Val Ser Val Leu Ala Ser Glu Phe Ser Asp
660 665 670
Gly Gln Ala Leu Gln Ala Leu Lys Leu Leu Lys Glu Tyr Leu Pro Ala
675 680 685
Ser Tyr His Glu Gly Ser Lys Asn Pro Val Ala Arg Glu Arg Val His
690 695 700
Ser Ala Ala Thr Ile Ala Gly Ile Ala Phe Ala Asn Ala Phe Leu Gly
705 710 715 720
Val Cys His Ser Met Ala His Lys Leu Gly Ser Gln Phe His Ile Pro
725 730 735
His Gly Leu Ala Asn Ala Leu Leu Ile Cys Asn Val Ile Arg Tyr Asn
740 745 750
Ala Asn Asp Asn Pro Thr Lys Gln Thr Ala Phe Ser Gln Tyr Asp Arg
755 760 765
Pro Gln Ala Arg Arg Arg Tyr Ala Glu Ile Ala Asp His Leu Gly Leu
770 775 780
Ser Ala Pro Gly Asp Arg Thr Ala Ala Lys Ile Glu Lys Leu Leu Ala
785 790 795 800
Trp Leu Glu Thr Leu Lys Ala Glu Leu Gly Ile Pro Lys Ser Ile Arg
805 810 815
Glu Ala Gly Val Gln Glu Ala Asp Phe Leu Ala Asn Val Asp Lys Leu
820 825 830
Ser Glu Asp Ala Phe Asp Asp Gln Cys Thr Gly Ala Asn Pro Arg Tyr
835 840 845
Pro Leu Ile Ser Glu Leu Lys Gln Ile Leu Leu Asp Thr Tyr Tyr Gly
850 855 860
Arg Asp Tyr Val Glu Gly Glu Thr Ala Ala Lys Lys Glu Ala Ala Pro
865 870 875 880
Ala Lys Ala Glu Lys Lys Ala Lys Lys Ser Ala
885 890
<210> 24
<211> 2676
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 24
atggcggtga cgaacgtcgc cgaactgaac gccctcgtcg aacgggtgaa aaaggcgcag 60
cgggagtacg cctcgttcac gcaggagcag gtggataaaa tcttccgcgc cgccgccctg 120
gccgcggccg acgcccgcat cccgctcgcc aaaatggcgg tggccgagtc cggcatgggc 180
atcgtggagg acaaggtcat caagaaccat ttcgcctccg agtacatcta caacgcctac 240
aaggacgaga agacctgcgg cgtcctgtcg gaggacgata ccttcggcac catcacgatc 300
gccgagccca tcggcatcat ctgcggcatc gtcccgacca ccaatcccac ctccaccgcc 360
atcttcaaaa gcctcatctc cctgaaaacc cgcaatgcga tcatcttcag cccccatccc 420
cgcgccaaag acgccacgaa caaggcggcc gacatcgtcc tccaggccgc catcgcggcc 480
ggcgccccca aagacctgat cggctggatc gaccagccgt cggtggagct gtccaacgcc 540
ctcatgcatc acccggacat caatctcatc ctggccacgg gcggcccggg catggtgaag 600
gccgcctact ccagcggcaa gccggcgatc ggcgtgggcg cgggcaacac gcccgtggtc 660
atcgacgaaa cggccgatat caaacgcgcc gtcgcctccg tgctcatgag caagaccttc 720
gacaacggcg tgatctgcgc gtcggaacag tcggtcgtgg tcgtcgactc cgtgtacgac 780
gcggtgcgcg agcgcttcgc cacgcatggc ggctacctgc tgcagggcaa ggagctgaaa 840
gccgtgcagg acgtgatcct caaaaacggc gccctgaacg ccgccatcgt cggccagccc 900
gcgtataaga tcgcggagct ggccggcttc tcggtcccgg agaacacgaa gatcctgatc 960
ggcgaggtca cggtcgtcga cgagagcgaa cccttcgccc acgagaagct gtccccgacc 1020
ctggcgatgt accgggcgaa agacttcgaa gacgcggtcg agaaggccga gaaactggtg 1080
gcgatgggcg gcatcggcca tacgagctgt ctgtacaccg accaggacaa tcagcccgcc 1140
cgcgtgtcct acttcggcca gaaaatgaag accgcccgca tcctcatcaa tacgcccgcg 1200
agccagggcg gcatcggcga tctctacaat ttcaagctcg cgccgtcgct gaccctcggc 1260
tgcggctcct ggggcggcaa ctccatctcc gagaacgtgg gcccgaaaca cctcatcaac 1320
aagaagaccg tggccaagcg ggcggagaac atgctgtggc ataagctgcc caagtcgatc 1380
tacttccgcc ggggctcgct gcccatcgcg ctggacgaag tcatcacgga cggccacaag 1440
cgggcgctga tcgtgacgga ccgcttcctg ttcaataacg gctacgccga ccagatcacc 1500
tccgtcctga aggccgcggg cgtcgaaacg gaagtcttct tcgaagtcga agccgacccg 1560
accctctcca tcgtccggaa gggcgccgag ctggccaatt ccttcaagcc ggatgtcatc 1620
atcgcgctgg gcggcggctc gccgatggac gccgccaaaa tcatgtgggt gatgtacgag 1680
caccccgaaa cgcacttcga agaactggcg ctgcgcttca tggatatccg caagcggatc 1740
tacaaattcc cgaaaatggg cgtgaaagcg aagatgatcg cggtgacgac caccagcggc 1800
acgggctccg aggtgacgcc gttcgcggtc gtcaccgatg atgccaccgg ccagaaatac 1860
cccctggccg actacgccct gacccccgac atggccatcg tggacgccaa tctcgtgatg 1920
gacatgccga agagcctctg cgccttcggc ggcctggatg ccgtgacgca tgcgatggag 1980
gcgtatgtca gcgtgctggc gtccgagttc tcggacggcc aggcgctgca ggccctgaag 2040
ctgctgaagg agtacctgcc ggcctcctac cacgagggct ccaaaaaccc ggtggcccgg 2100
gagcgggtcc actcggcggc caccatcgcg ggcatcgcct tcgcgaacgc cttcctcggc 2160
gtgtgccatt cgatggccca caagctgggc tcccagttcc atatccccca cggcctggcg 2220
aacgcgctgc tgatctgtaa cgtcatccgg tacaacgcga acgataaccc gaccaaacag 2280
accgccttct cccagtatga ccgcccccag gcccggcgcc gctatgcgga aatcgccgac 2340
catctcggcc tgtcggcccc gggcgaccgc accgccgcca agatcgagaa gctgctggcc 2400
tggctcgaaa cgctgaaggc cgaactgggc atcccgaagt cgatccgcga agccggcgtc 2460
caggaagcgg acttcctggc gaatgtggat aaactgagcg aggacgcctt cgatgaccag 2520
tgcacgggcg ccaacccgcg ctacccgctc atcagcgagc tgaaacagat cctgctcgac 2580
acctattatg gccgcgatta cgtcgagggc gaaaccgccg cgaagaagga ggccgccccg 2640
gccaaagccg aaaagaaggc caagaaaagc gcctga 2676
<210> 25
<211> 387
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 25
Met Asn Asn Phe Asn Leu His Thr Pro Thr Arg Ile Leu Phe Gly Lys
1 5 10 15
Gly Ala Ile Ala Gly Leu Arg Glu Gln Ile Pro His Asp Ala Arg Val
20 25 30
Leu Ile Thr Tyr Gly Gly Gly Ser Val Lys Lys Thr Gly Val Leu Asp
35 40 45
Gln Val Leu Asp Ala Leu Lys Gly Met Asp Val Leu Glu Phe Gly Gly
50 55 60
Ile Glu Pro Asn Pro Ala Tyr Glu Thr Leu Met Asn Ala Val Lys Leu
65 70 75 80
Val Arg Glu Gln Lys Val Thr Phe Leu Leu Ala Val Gly Gly Gly Ser
85 90 95
Val Leu Asp Gly Thr Lys Phe Ile Ala Ala Ala Ala Asn Tyr Pro Glu
100 105 110
Asn Ile Asp Pro Trp His Ile Leu Gln Thr Gly Gly Lys Glu Ile Lys
115 120 125
Ser Ala Ile Pro Met Gly Cys Val Leu Thr Leu Pro Ala Thr Gly Ser
130 135 140
Glu Ser Asn Ala Gly Ala Val Ile Ser Arg Lys Thr Thr Gly Asp Lys
145 150 155 160
Gln Ala Phe His Ser Ala His Val Gln Pro Val Phe Ala Val Leu Asp
165 170 175
Pro Val Tyr Thr Tyr Thr Leu Pro Pro Arg Gln Val Ala Asn Gly Val
180 185 190
Val Asp Ala Phe Val His Thr Val Glu Gln Tyr Val Thr Lys Pro Val
195 200 205
Asp Ala Lys Ile Gln Asp Arg Phe Ala Glu Gly Ile Leu Leu Thr Leu
210 215 220
Ile Glu Asp Gly Pro Lys Ala Leu Lys Glu Pro Glu Asn Tyr Asp Val
225 230 235 240
Arg Ala Asn Val Met Trp Gly Ala Thr Gln Ala Leu Asn Gly Leu Ile
245 250 255
Gly Ala Gly Val Pro Gln Asp Trp Ala Thr His Met Leu Gly His Glu
260 265 270
Leu Thr Ala Met His Gly Leu Asp His Ala Gln Thr Leu Ala Ile Val
275 280 285
Leu Pro Ala Leu Trp Asn Glu Lys Arg Glu Thr Lys Arg Ala Lys Leu
290 295 300
Leu Gln Tyr Ala Glu Arg Val Trp Asn Ile Thr Glu Gly Ser Asp Asp
305 310 315 320
Glu Arg Ile Asp Ala Ala Ile Ala Ala Thr Arg Asn Phe Phe Glu Gln
325 330 335
Leu Gly Val Pro Thr His Leu Ser Asp Tyr Gly Leu Asp Gly Ser Ser
340 345 350
Ile Pro Ala Leu Leu Lys Lys Leu Glu Glu His Gly Met Thr Gln Leu
355 360 365
Gly Glu Asn His Asp Ile Thr Leu Asp Val Ser Arg Arg Ile Tyr Glu
370 375 380
Ala Ala Arg
385
<210> 26
<211> 1164
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 26
atgaacaact ttaatctgca caccccaacc cgcattctgt ttggtaaagg cgcaatcgct 60
ggtttacgcg aacaaattcc tcacgatgct cgcgtattga ttacctacgg cggcggcagc 120
gtgaaaaaaa ccggcgttct cgatcaagtt ctggatgccc tgaaaggcat ggacgtgctg 180
gaatttggcg gtattgagcc aaacccggct tatgaaacgc tgatgaacgc cgtgaaactg 240
gttcgcgaac agaaagtgac tttcctgctg gcggttggcg gcggttctgt actggacggc 300
accaaattta tcgccgcagc ggctaactat ccggaaaata tcgatccgtg gcacattctg 360
caaacgggcg gtaaagagat taaaagcgcc atcccgatgg gctgtgtgct gacgctgcca 420
gcaaccggtt cagaatccaa cgcaggcgcg gtgatctccc gtaaaaccac aggcgacaag 480
caggcgttcc attctgccca tgttcagccg gtatttgccg tgctcgatcc ggtttatacc 540
tacaccctgc cgccgcgtca ggtggctaac ggcgtagtgg acgcctttgt acacaccgtg 600
gaacagtatg ttaccaaacc ggttgatgcc aaaattcagg accgtttcgc agaaggcatt 660
ttgctgacgc taatcgaaga tggtccgaaa gccctgaaag agccagaaaa ctacgatgtg 720
cgcgccaacg tcatgtgggc ggcgactcag gcgctgaacg gtttgattgg cgctggcgta 780
ccgcaggact gggcaacgca tatgctgggc cacgaactga ctgcgatgca cggtctggat 840
cacgcgcaaa cactggctat cgtcctgcct gcactgtgga atgaaaaacg cgataccaag 900
cgcgctaagc tgctgcaata tgctgaacgc gtctggaaca tcactgaagg ttccgatgat 960
gagcgtattg acgccgcgat tgccgcaacc cgcaatttct ttgagcaatt aggcgtgccg 1020
acccacctct ccgactacgg tctggacggc agctccatcc cggctttgct gaaaaaactg 1080
gaagagcacg gcatgaccca actgggcgaa aatcatgaca ttacgttgga tgtcagccgc 1140
cgtatatacg aagccgcccg ctaa 1164
<210> 27
<211> 383
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 27
Met Met Ala Asn Arg Met Ile Leu Asn Glu Thr Ala Trp Phe Gly Arg
1 5 10 15
Gly Ala Val Gly Ala Leu Thr Asp Glu Val Lys Arg Arg Gly Tyr Gln
20 25 30
Lys Ala Leu Ile Val Thr Asp Lys Thr Leu Val Gln Cys Gly Val Val
35 40 45
Ala Lys Val Thr Asp Lys Met Asp Ala Ala Gly Leu Ala Trp Ala Ile
50 55 60
Tyr Asp Gly Val Val Pro Asn Pro Thr Ile Thr Val Val Lys Glu Gly
65 70 75 80
Leu Asp Val Phe Gln Asn Ser Gly Ala Asp Tyr Leu Ile Ala Ile Gly
85 90 95
Gly Gly Ser Pro Gln Asp Thr Cys Lys Ala Ile Gly Ile Ile Ser Asn
100 105 110
Asn Pro Glu Phe Ala Asp Val Arg Ser Leu Glu Gly Leu Ser Pro Thr
115 120 125
Asn Lys Pro Ser Val Pro Ile Leu Ala Ile Pro Thr Thr Ala Gly Thr
130 135 140
Ala Ala Glu Val Thr Ile Asn Tyr Val Ile Thr Asp Glu Glu Lys Arg
145 150 155 160
Arg Lys Phe Val Cys Val Asp Pro His Asp Ile Pro Gln Val Ala Phe
165 170 175
Ile Asp Ala Asp Met Met Asp Gly Met Pro Pro Ala Leu Lys Ala Ala
180 185 190
Thr Gly Val Asp Ala Leu Thr His Ala Ile Glu Gly Tyr Ile Thr Arg
195 200 205
Gly Ala Trp Ala Leu Thr Asp Ala Leu His Ile Lys Ala Ile Glu Ile
210 215 220
Ile Ala Gly Ala Leu Arg Gly Ser Val Ala Gly Asp Lys Asp Ala Gly
225 230 235 240
Glu Glu Met Ala Leu Gly Gln Tyr Val Ala Gly Met Gly Phe Ser Asn
245 250 255
Val Gly Leu Gly Leu Val His Gly Met Ala His Pro Leu Gly Ala Phe
260 265 270
Tyr Asn Thr Pro His Gly Val Ala Asn Ala Ile Leu Leu Pro His Val
275 280 285
Met Arg Tyr Asn Ala Asp Phe Thr Asp Glu Lys Tyr Arg Asp Ile Ala
290 295 300
Arg Val Met Gly Val Lys Val Glu Gly Met Ser Leu Glu Glu Ala Arg
305 310 315 320
Asn Ala Ala Val Glu Ala Val Phe Ala Leu Asn Arg Asp Val Gly Ile
325 330 335
Pro Pro His Leu Arg Asp Val Gly Val Arg Lys Glu Asp Ile Pro Ala
340 345 350
Leu Ala Gln Ala Ala Leu Asp Asp Val Cys Thr Gly Gly Asn Pro Arg
355 360 365
Glu Ala Thr Leu Glu Asp Ile Val Glu Leu Tyr His Thr Ala Trp
370 375 380
<210> 28
<211> 1149
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 28
atggcgaatc ggatgatcct caatgaaacg gcctggttcg gccgcggcgc ggtcggcgcc 60
ctcaccgatg aggtcaagcg gcggggctac cagaaggccc tgatcgtcac ggataaaacc 120
ctggtgcagt gcggcgtcgt cgccaaggtg accgacaaga tggatgcggc cggcctggcc 180
tgggcgatct acgacggcgt ggtgcccaac cccaccatca ccgtggtgaa ggaaggcctg 240
ggcgtgttcc agaactcggg cgcggattat ctcatcgcga tcggcggcgg cagcccccag 300
gacacctgca aggccatcgg catcatctcg aacaaccccg agttcgcgga cgtgcgctcc 360
ctggagggcc tgtcgccgac gaacaagccc tccgtcccga tcctcgccat cccgacgacg 420
gccggcaccg cggccgaggt gaccatcaat tacgtcatca ccgacgagga aaagcggcgc 480
aagttcgtgt gtgtggaccc ccatgacatc ccccaggtcg ccttcatcga cgccgacatg 540
atggatggca tgccccccgc cctcaaggcc gcgacgggcg tggacgcgct gacgcatgcc 600
atcgaaggct acatcacccg gggcgcctgg gccctgacgg atgccctgca tatcaaggcc 660
atcgaaatca tcgccggcgc cctgcgcggc tccgtggccg gcgacaagga tgcgggcgag 720
gagatggcgc tgggccagta cgtggccggc atgggcttct ccaatgtggg cctgggcctg 780
gtgcatggca tggcccatcc gctcggcgcc ttctacaaca cgccgcatgg cgtcgcgaac 840
gcgatcctcc tgccgcatgt catgcgctac aatgcggact tcacgggcga gaaataccgc 900
gatatcgccc gggtcatggg cgtgaaggtc gagggcatgt cgctggaaga ggcgcggaac 960
gccgcggtcg aagccgtctt cgccctgaac cgggatgtgg gcatcccgcc gcacctgcgc 1020
gatgtcggcg tccgcaagga agacatcccc gcgctggcgc aggccgccct ggacgatgtg 1080
tgcaccggcg gcaacccccg cgaggcgacg ctggaagaca tcgtcgaact ctaccatacc 1140
gcgtggtga 1149
<210> 29
<211> 860
<212> PRT
<213> 拜氏梭菌(Clostridium beijerinckii)
<400> 29
Met Arg Val Thr Asn Pro Glu Glu Leu Thr Lys Arg Ile Glu Gln Ile
1 5 10 15
Arg Glu Ala Gln Arg Glu Phe Ala Lys Phe Ser Gln Glu Glu Val Asp
20 25 30
Glu Ile Phe Arg Gln Ala Ala Met Ala Ala Asn Asp Ala Arg Ile Thr
35 40 45
Leu Ala Lys Met Ala Val Glu Glu Ser Gly Met Gly Ile Val Glu Asp
50 55 60
Lys Val Ile Lys Asn His Phe Ala Ala Glu Tyr Ile Tyr Asn Gln Tyr
65 70 75 80
Lys Asp Thr Lys Thr Cys Gly Val Ile Glu Arg Asp Glu Met Phe Gly
85 90 95
Ile Thr His Ile Ala Glu Pro Ile Gly Val Ile Ala Ala Ile Val Pro
100 105 110
Thr Thr Asn Pro Thr Ser Thr Ala Ile Phe Lys Thr Leu Ile Ala Leu
115 120 125
Lys Thr Arg Asn Gly Ile Ile Ile Ser Pro His Pro Arg Ala Lys Asn
130 135 140
Ser Thr Ile Ala Ala Ala Lys Ile Val Leu Glu Ala Ala Glu Arg Ala
145 150 155 160
Gly Ala Pro Lys Gly Ile Ile Gly Trp Ile Asp Glu Pro Ser Ile Glu
165 170 175
Leu Ser Arg Asn Val Met Ser Glu Ser Asp Ile Ile Leu Ala Thr Gly
180 185 190
Gly Pro Gly Met Val Arg Ala Ala Tyr Ser Ser Gly Lys Pro Ala Ile
195 200 205
Gly Val Gly Ala Gly Asn Thr Pro Ala Ile Ile Asp Asp Thr Ala His
210 215 220
Ile Lys Met Ala Val Asn Ser Ile Leu Leu Ser Lys Thr Phe Asp Asn
225 230 235 240
Gly Val Val Cys Ala Ser Glu Gln Ser Ile Ile Ala Met Glu Ser Val
245 250 255
Tyr Asp Glu Val Arg Lys Glu Leu Asp Glu Arg Gly Ala Tyr Ile Leu
260 265 270
Lys Gly Asp Glu Val Asp Lys Val Arg Ser Ile Ile Leu Asp Pro Lys
275 280 285
Gly Ser Leu Asn Ser Glu Ile Val Gly Gln Ser Ala Tyr Lys Ile Ala
290 295 300
Lys Met Ala Gly Val Glu Val Ser Glu Ala Val Lys Val Leu Ile Gly
305 310 315 320
Glu Val Glu Ser Pro Glu Leu Glu Glu Pro Phe Ser His Glu Lys Leu
325 330 335
Ser Pro Ile Leu Gly Met Tyr Lys Ala Lys Thr Phe Asp Asp Ala Leu
340 345 350
Arg Leu Ala Ser Arg Met Ile Glu Leu Gly Gly Phe Gly His Thr Ser
355 360 365
Ile Leu Tyr Thr Asn Gln Val Glu Ser Val Asp Arg Ile Glu Lys Phe
370 375 380
Gly Val Ala Met Lys Thr Ala Arg Thr Leu Ile Asn Met Pro Ala Ser
385 390 395 400
Gln Gly Ala Ile Gly Asp Ile Tyr Asn Phe Lys Leu Ala Pro Ser Leu
405 410 415
Thr Leu Gly Cys Gly Ser Trp Gly Gly Asn Ser Ile Ser Glu Asn Val
420 425 430
Gly Pro Lys His Leu Ile Asn Val Lys Arg Ile Ala Glu Arg Arg Glu
435 440 445
Asn Met Leu Trp Phe Arg Val Pro Asp Lys Ile Tyr Phe Lys Phe Gly
450 455 460
Cys Leu Pro Ile Ala Leu Glu Glu Leu Asn Ala Met Lys Lys Lys Arg
465 470 475 480
Ala Phe Ile Val Thr Asp Arg Val Leu Phe Asp Leu Gly Tyr Thr His
485 490 495
Lys Ile Thr Asp Ile Leu Ser Glu Asn His Ile Glu Tyr Lys Ile Phe
500 505 510
Ser Asp Val Glu Pro Asp Pro Thr Leu Lys Ala Ala Lys Leu Gly Ala
515 520 525
Asp Ala Met Arg Asp Phe Asn Pro Asp Val Ile Ile Ala Ile Gly Gly
530 535 540
Gly Ser Pro Met Asp Ala Ala Lys Ile Met Trp Val Met Tyr Glu His
545 550 555 560
Pro Asp Val Arg Phe Glu Asp Leu Ala Met Arg Phe Met Asp Ile Arg
565 570 575
Lys Arg Val Tyr Glu Phe Pro Pro Met Gly Glu Arg Ala Ile Leu Val
580 585 590
Ala Ile Pro Thr Ser Ala Gly Thr Gly Ser Glu Val Thr Pro Phe Ala
595 600 605
Val Ile Thr Asp Gln Gln Thr Gly Val Lys Tyr Pro Leu Ala Asp Tyr
610 615 620
Ala Leu Thr Pro Asn Met Ala Ile Ile Asp Ala Glu Leu Met Met Ser
625 630 635 640
Met Pro Lys Gly Leu Thr Ala Ala Ser Gly Ile Asp Ala Leu Val His
645 650 655
Ala Ile Glu Ala Tyr Val Ser Val Leu Ala Ser Glu Tyr Thr Asn Gly
660 665 670
Leu Ala Leu Glu Ala Ile Arg Leu Thr Phe Lys Tyr Leu Pro Asp Ala
675 680 685
Tyr Asn Gly Gly Thr Thr Asn Ile Lys Ala Arg Glu Lys Met Ala His
690 695 700
Ala Ser Ser Val Ala Gly Met Ala Phe Ala Asn Ala Phe Leu Gly Ile
705 710 715 720
Cys His Ser Met Ala His Lys Leu Gly Ala Phe His His Val Pro His
725 730 735
Gly Ile Ala Asn Ala Leu Leu Ile Asp Glu Val Ile Arg Phe Asn Ala
740 745 750
Thr Asp Ala Pro Arg Lys Gln Ala Ala Phe Pro Gln Tyr Lys Tyr Pro
755 760 765
Asn Ala Gly Trp Arg Tyr Ala Arg Ile Ala Asp Tyr Leu Asn Leu Gly
770 775 780
Gly Asn Thr Glu Glu Glu Lys Val Glu Leu Leu Ile Lys Ala Ile Asp
785 790 795 800
Asp Leu Lys Val Lys Val Arg Ile Pro Lys Ser Ile Lys Glu Phe Gly
805 810 815
Val Ser Glu Glu Lys Phe Tyr Asp Ser Met Asp Glu Met Val Glu Gln
820 825 830
Ala Phe Asp Asp Gln Cys Thr Gly Ala Asn Pro Arg Tyr Pro Leu Met
835 840 845
Ser Glu Ile Lys Glu Met Tyr Ile Lys Ser Tyr Asn
850 855 860
<210> 30
<211> 1407
<212> DNA
<213> 拜氏梭菌(Clostridium beijerinckii)
<400> 30
atgaacaagg acacgctgat ccccaccacg aaagacctca aggtgaagac caacggcgag 60
aacatcaacc tgaaaaacta caaggacaac agcagctgct tcggcgtgtt cgaaaacgtc 120
gaaaacgcca tcagctcggc ggtgcatgcc cagaaaatcc tcagcctgca ctatacgaag 180
gaacagcgcg aaaagatcat caccgaaatc cgcaaggccg cgctccagaa caaagaggtg 240
ctggccacga tgatcctgga ggaaacccat atgggccgct acgaagataa aatcctgaag 300
cacgagctgg tggcgaaata cacgcccggc accgaagacc tgacgaccac cgcctggagc 360
ggcgataacg gcctgacggt ggtggagatg tcgccgtatg gcgtgatcgg cgcgatcacc 420
ccgtccacca acccgaccga aacggtcatc tgtaactcga tcggcatgat cgcggccggc 480
aacgcggtcg tgttcaatgg ccacccgtgc gccaagaagt gcgtcgcctt cgccgtcgag 540
atgatcaaca aggccatcat ctcctgcggc ggcccggaga acctcgtgac gacgatcaaa 600
aacccgacga tggagtccct ggatgccatc atcaagcacc cgtccatcaa gctgctctgc 660
ggcaccggcg gcccgggcat ggtcaaaacg ctgctgaact ccggcaaaaa agccatcggc 720
gcgggcgcgg gcaacccccc cgtcatcgtg gatgacaccg ccgacatcga gaaagccggc 780
cggtcgatca tcgaaggctg ctccttcgac aataacctcc cgtgcatcgc cgagaaagag 840
gtcttcgtct tcgagaacgt cgcggacgat ctgatctcca acatgctgaa gaacaacgcc 900
gtcatcatca acgaagacca ggtgtccaag ctgatcgacc tcgtgctgca gaagaacaat 960
gaaacccagg agtacttcat caacaagaag tgggtcggca aggacgcgaa gctgttcctg 1020
gacgaaatcg atgtggagtc cccgagcaat gtgaagtgca tcatctgcga ggtcaacgcg 1080
aaccacccct tcgtcatgac cgagctcatg atgccgatcc tgccgatcgt gcgggtgaag 1140
gatatcgacg aagccatcaa gtacgcgaaa atcgcggaac agaatcggaa gcattcggcc 1200
tatatctaca gcaagaacat cgataacctc aaccgcttcg aacgggagat cgacaccacc 1260
atcttcgtca agaacgccaa atccttcgcc ggcgtgggct atgaggcgga aggcttcacc 1320
accttcacga tcgccggctc caccggcgag ggcatcacct ccgcccggaa cttcacccgc 1380
cagcgccgct gcgtgctggc gggctga 1407
<210> 31
<211> 360
<212> PRT
<213> 酿酒酵母(Saccharomyces cerevisiae)
<400> 31
Met Ser Tyr Pro Glu Lys Phe Glu Gly Ile Ala Ile Gln Ser His Glu
1 5 10 15
Asp Trp Lys Asn Pro Lys Lys Thr Lys Tyr Asp Pro Lys Pro Phe Tyr
20 25 30
Asp His Asp Ile Asp Ile Lys Ile Glu Ala Cys Gly Val Cys Gly Ser
35 40 45
Asp Ile His Cys Ala Ala Gly His Trp Gly Asn Met Lys Met Pro Leu
50 55 60
Val Val Gly His Glu Ile Val Gly Lys Val Val Lys Leu Gly Pro Lys
65 70 75 80
Ser Asn Ser Gly Leu Lys Val Gly Gln Arg Val Gly Val Gly Ala Gln
85 90 95
Val Phe Ser Cys Leu Glu Cys Asp Arg Cys Lys Asn Asp Asn Glu Pro
100 105 110
Tyr Cys Thr Lys Phe Val Thr Thr Tyr Ser Gln Pro Tyr Glu Asp Gly
115 120 125
Tyr Val Ser Gln Gly Gly Tyr Ala Asn Tyr Val Arg Val His Glu His
130 135 140
Phe Val Val Pro Ile Pro Glu Asn Ile Pro Ser His Leu Ala Ala Pro
145 150 155 160
Leu Leu Cys Gly Gly Leu Thr Val Tyr Ser Pro Leu Val Arg Asn Gly
165 170 175
Cys Gly Pro Gly Lys Lys Val Gly Ile Val Gly Leu Gly Gly Ile Gly
180 185 190
Ser Met Gly Thr Leu Ile Ser Lys Ala Met Gly Ala Glu Thr Tyr Val
195 200 205
Ile Ser Arg Ser Ser Arg Lys Arg Glu Asp Ala Met Lys Met Gly Ala
210 215 220
Asp His Tyr Ile Ala Thr Leu Glu Glu Gly Asp Trp Gly Glu Lys Tyr
225 230 235 240
Phe Asp Thr Phe Asp Leu Ile Val Val Cys Ala Ser Ser Leu Thr Asp
245 250 255
Ile Asp Phe Asn Ile Met Pro Lys Ala Met Lys Val Gly Gly Arg Ile
260 265 270
Val Ser Ile Ser Ile Pro Glu Gln His Glu Met Leu Ser Leu Lys Pro
275 280 285
Tyr Gly Leu Lys Ala Val Ser Ile Ser Tyr Ser Ala Leu Gly Ser Ile
290 295 300
Lys Glu Leu Asn Gln Leu Leu Lys Leu Val Ser Glu Lys Asp Ile Lys
305 310 315 320
Ile Trp Val Glu Thr Leu Pro Val Gly Glu Ala Gly Val His Glu Ala
325 330 335
Phe Glu Arg Met Glu Lys Gly Asp Val Arg Tyr Arg Phe Thr Leu Val
340 345 350
Gly Tyr Asp Lys Glu Phe Ser Asp
355 360
<210> 32
<211> 1083
<212> DNA
<213> 酿酒酵母(Saccharomyces cerevisiae)
<400> 32
atgagctatc ccgagaagtt cgaggggatc gccatccaga gccacgagga ctggaagaac 60
ccgaaaaaga ccaagtatga tccgaagccc ttctacgatc acgacatcga catcaagatc 120
gaggcctgcg gcgtctgcgg cagcgatatc cattgtgcgg ctggccactg gggcaacatg 180
aagatgccgt tggtcgtcgg ccacgagatc gtgggcaagg tcgtgaagtt aggcccgaaa 240
agcaacagcg gcttgaaggt gggccagcgc gtgggtgtgg gtgcgcaggt cttcagctgt 300
ctggagtgcg accgttgcaa gaacgacaac gaaccgtact gcaccaagtt cgtcaccacc 360
tactcgcagc cctacgagga cggctacgtc tcgcagggcg gttacgccaa ctatgtccga 420
gtccacgaac acttcgtggt gcccatcccg gaaaatatcc ccagccatct ggcggctccc 480
ctgctgtgcg gtggcttgac cgtctacagc cccctcgtcc gcaatggctg cggtcccggc 540
aagaaggtgg gtatcgtggg cctcggcggt ataggctcta tgggcacgct gatctcgaaa 600
gcgatgggcg cagaaacgta cgtgatctcg cgttcctcgc gcaagcgcga ggatgcgatg 660
aagatgggtg cggaccacta catcgccacg ctggaggagg gtgactgggg tgagaagtac 720
ttcgacacgt tcgacctcat cgtggtgtgc gcgagttccc tgacggacat cgacttcaat 780
atcatgccca aggcgatgaa ggtcggaggg cgcatcgtct ccatctcgat cccggagcag 840
cacgaaatgc tgtcgctgaa gccctacggc ctgaaagccg tctccattag ctactcggcg 900
ctcggtagta tcaaggagct caaccagctg ttgaagttgg tttccgaaaa ggacatcaag 960
atctgggtgg aaacgctccc ggtgggcgaa gccggtgtgc acgaggcctt tgagcggatg 1020
gagaaggggg atgtccgtta tcggtttaca ctcgtcggct acgataaaga gttctcggat 1080
taa 1083
<210> 33
<211> 340
<212> PRT
<213> 百利不动杆菌(Acinetobacter baylyi)
<400> 33
Met Thr Thr Asn Val Ile His Ala Tyr Ala Ala Met Gln Ala Gly Glu
1 5 10 15
Ala Leu Val Pro Tyr Ser Phe Asp Ala Gly Glu Leu Gln Pro His Gln
20 25 30
Val Glu Val Lys Val Glu Tyr Cys Gly Leu Cys His Ser Asp Val Ser
35 40 45
Val Leu Asn Asn Glu Trp His Ser Ser Val Tyr Pro Val Val Ala Gly
50 55 60
His Glu Val Ile Gly Thr Ile Thr Gln Leu Gly Ser Glu Ala Lys Gly
65 70 75 80
Leu Lys Ile Gly Gln Arg Val Gly Ile Gly Trp Thr Ala Glu Ser Cys
85 90 95
Gln Ala Cys Asp Gln Cys Ile Ser Gly Gln Gln Val Leu Cys Thr Gly
100 105 110
Glu Asn Thr Ala Thr Ile Ile Gly His Ala Gly Gly Phe Ala Asp Lys
115 120 125
Val Arg Ala Gly Trp Gln Trp Val Ile Pro Leu Pro Asp Glu Leu Asp
130 135 140
Pro Thr Ser Ala Gly Pro Leu Leu Cys Gly Gly Ile Thr Val Phe Asp
145 150 155 160
Pro Ile Leu Lys His Gln Ile Gln Ala Ile His His Val Ala Val Ile
165 170 175
Gly Ile Gly Gly Leu Gly His Met Ala Ile Lys Leu Leu Lys Ala Trp
180 185 190
Gly Cys Glu Ile Thr Ala Phe Ser Ser Asn Pro Asn Lys Thr Asp Glu
195 200 205
Leu Lys Ala Met Gly Ala Asp His Val Val Asn Ser Arg Asp Asp Ala
210 215 220
Glu Ile Lys Ser Gln Gln Gly Lys Phe Asp Leu Leu Leu Ser Thr Val
225 230 235 240
Asn Val Pro Leu Asn Trp Asn Ala Tyr Leu Asn Thr Leu Ala Pro Asn
245 250 255
Gly Thr Phe His Phe Leu Gly Val Val Met Glu Pro Ile Pro Val Pro
260 265 270
Val Gly Ala Leu Leu Gly Gly Ala Lys Ser Leu Thr Ala Ser Pro Thr
275 280 285
Gly Ser Pro Ala Ala Leu Arg Lys Leu Leu Glu Phe Ala Ala Arg Lys
290 295 300
Asn Ile Ala Pro Gln Ile Glu Met Tyr Pro Met Ser Glu Leu Asn Glu
305 310 315 320
Ala Ile Glu Arg Leu His Ser Gly Gln Ala Arg Tyr Arg Ile Val Leu
325 330 335
Lys Ala Asp Phe
340
<210> 34
<211> 1023
<212> DNA
<213> 百利不动杆菌(Acinetobacter baylyi)
<400> 34
atgacgacca acgtcatcca tgcctatgcg gccatgcagg ccggcgaggc gctggtgccg 60
tatagcttcg acgcgggcga gctccagccg catcaggtcg aggtgaaggt ggaatactgc 120
ggcctgtgtc attccgatgt gtcggtcctg aataacgaat ggcactcctc cgtctatccg 180
gtggtcgccg gccacgaggt catcggcacg atcacccagc tgggcagcga agccaagggc 240
ctgaagatcg gccagcgcgt cggcatcggc tggacggccg agagctgcca ggcctgcgat 300
cagtgcatct ccggccagca ggtgctgtgc accggcgaga acaccgccac catcatcggc 360
catgccggcg gcttcgcgga taaagtgcgg gccggctggc agtgggtgat cccgctcccg 420
gatgagctcg atcccacgag cgccggcccg ctgctgtgtg gcggcatcac cgtgttcgac 480
ccgatcctga agcaccagat ccaggccatc caccatgtcg ccgtgatcgg catcggcggc 540
ctgggccaca tggcgatcaa gctgctcaag gcctggggct gtgaaatcac cgccttcagc 600
agcaatccca acaagaccga cgaactgaag gcgatgggcg ccgaccatgt ggtcaactcc 660
cgcgatgacg cggaaatcaa gagccagcag ggcaagttcg acctgctgct gtcgacggtg 720
aatgtccccc tcaactggaa cgcctacctg aataccctgg ccccgaacgg cacgttccac 780
ttcctgggcg tcgtcatgga gccgatcccg gtgccggtgg gcgccctcct gggcggcgcg 840
aaaagcctga ccgcctcgcc cacgggcagc cccgccgccc tccgcaagct gctggagttc 900
gccgcccgca agaacatcgc gccccagatc gaaatgtatc ccatgagcga gctgaacgaa 960
gccatcgagc gcctgcatag cggccaggcc cgctatcgga tcgtgctcaa agcggacttc 1020
tga 1023
<210> 35
<211> 339
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 35
Met Ser Met Ile Lys Ser Tyr Ala Ala Lys Glu Ala Gly Gly Glu Leu
1 5 10 15
Glu Val Tyr Glu Tyr Asp Pro Gly Glu Leu Arg Pro Gln Asp Val Glu
20 25 30
Val Gln Val Asp Tyr Cys Gly Ile Cys His Ser Asp Leu Ser Met Ile
35 40 45
Asp Asn Glu Trp Gly Phe Ser Gln Tyr Pro Leu Val Ala Gly His Glu
50 55 60
Val Ile Gly Arg Val Val Ala Leu Gly Ser Ala Ala Gln Asp Lys Gly
65 70 75 80
Leu Gln Val Gly Gln Arg Val Gly Ile Gly Trp Thr Ala Arg Ser Cys
85 90 95
Gly His Cys Asp Ala Cys Ile Ser Gly Asn Gln Ile Asn Cys Glu Gln
100 105 110
Gly Ala Val Pro Thr Ile Met Asn Arg Gly Gly Phe Ala Glu Lys Leu
115 120 125
Arg Ala Asp Trp Gln Trp Val Ile Pro Leu Pro Glu Asn Ile Asp Ile
130 135 140
Glu Ser Ala Gly Pro Leu Leu Cys Gly Gly Ile Thr Val Phe Lys Pro
145 150 155 160
Leu Leu Met His His Ile Thr Ala Thr Ser Arg Val Gly Val Ile Gly
165 170 175
Ile Gly Gly Leu Gly His Ile Ala Ile Lys Leu Leu His Ala Met Gly
180 185 190
Cys Glu Val Thr Ala Phe Ser Ser Asn Pro Ala Lys Glu Gln Glu Val
195 200 205
Leu Ala Met Gly Ala Asp Lys Val Val Asn Ser Arg Asp Pro Gln Ala
210 215 220
Leu Lys Ala Leu Ala Gly Gln Phe Asp Leu Ile Ile Asn Thr Val Asn
225 230 235 240
Val Ser Leu Asp Trp Gln Pro Tyr Phe Glu Ala Leu Thr Tyr Gly Gly
245 250 255
Asn Phe His Thr Val Gly Ala Val Leu Thr Pro Leu Ser Val Pro Ala
260 265 270
Phe Thr Leu Ile Ala Gly Asp Arg Ser Val Ser Gly Ser Ala Thr Gly
275 280 285
Thr Pro Tyr Glu Leu Arg Lys Leu Met Arg Phe Ala Ala Arg Ser Lys
290 295 300
Val Ala Pro Thr Thr Glu Leu Phe Pro Met Ser Lys Ile Asn Asp Ala
305 310 315 320
Ile Gln His Val Arg Asp Gly Lys Ala Arg Tyr Arg Val Val Leu Lys
325 330 335
Ala Asp Phe
<210> 36
<211> 1020
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 36
atgtccatga tcaaaagcta cgccgcgaaa gaggcgggcg gcgagctgga ggtgtatgag 60
tatgacccgg gcgagctgcg gccccaggac gtggaagtgc aggtcgacta ctgcggcatc 120
tgccattcgg acctctcgat gatcgataac gagtggggct tcagccagta ccccctggtg 180
gccggccacg aggtgatcgg ccgcgtggtc gccctgggct cggccgcgca ggataaaggc 240
ctgcaggtcg gccagcgcgt cggcatcggc tggacggccc gcagctgcgg ccattgcgat 300
gcctgcatca gcggcaatca gatcaattgc gaacagggcg cggtcccgac catcatgaac 360
cggggcggct tcgccgaaaa gctgcgggcc gattggcagt gggtgatccc gctgccggag 420
aacatcgata tcgagtcggc cggccccctg ctgtgcggcg gcatcaccgt cttcaagccg 480
ctcctgatgc atcatatcac ggcgaccagc cgggtcggcg tgatcggcat cggcggcctc 540
ggccacatcg cgatcaaact gctgcacgcg atgggctgcg aggtcaccgc gttctcctcg 600
aaccccgcca aggagcagga agtgctggcg atgggcgccg ataaagtcgt gaactcgcgc 660
gacccccagg ccctcaaagc cctggccggc cagttcgatc tcatcatcaa cacggtgaac 720
gtgtcgctgg actggcagcc ctacttcgaa gccctgacct atggcggcaa cttccatacc 780
gtcggcgccg tgctgacccc gctgtccgtc ccggccttca ccctgatcgc cggcgaccgc 840
agcgtgtccg gcagcgccac cggcacgccg tatgagctgc gcaagctgat gcgcttcgcc 900
gcccgcagca aggtcgcccc gaccaccgag ctgttcccca tgtccaagat caatgacgcg 960
atccagcatg tccgggacgg caaggcccgc tatcgcgtcg tcctcaaggc ggacttctga 1020
<210> 37
<211> 388
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 37
Met Asn Leu His Glu Tyr Gln Ala Lys Gln Leu Phe Ala Arg Tyr Gly
1 5 10 15
Leu Pro Ala Pro Val Gly Tyr Ala Cys Thr Thr Pro Arg Glu Ala Glu
20 25 30
Glu Ala Ala Ser Lys Ile Gly Ala Gly Pro Trp Val Val Lys Cys Gln
35 40 45
Val His Ala Gly Gly Arg Gly Lys Ala Gly Gly Val Lys Val Val Asn
50 55 60
Ser Lys Glu Asp Ile Arg Ala Phe Ala Glu Asn Trp Leu Gly Lys Arg
65 70 75 80
Leu Val Thr Tyr Gln Thr Asp Ala Asn Gly Gln Pro Val Asn Gln Ile
85 90 95
Leu Val Glu Ala Ala Thr Asp Ile Ala Lys Glu Leu Tyr Leu Gly Ala
100 105 110
Val Val Asp Arg Ser Ser Arg Arg Val Val Phe Met Ala Ser Thr Glu
115 120 125
Gly Gly Val Glu Ile Glu Lys Val Ala Glu Glu Thr Pro His Leu Ile
130 135 140
His Lys Val Ala Leu Asp Pro Leu Thr Gly Pro Met Pro Tyr Gln Gly
145 150 155 160
Arg Glu Leu Ala Phe Lys Leu Gly Leu Glu Gly Lys Leu Val Gln Gln
165 170 175
Phe Thr Lys Ile Phe Met Gly Leu Ala Thr Ile Phe Leu Glu Arg Asp
180 185 190
Leu Ala Leu Ile Glu Ile Asn Pro Leu Val Ile Thr Lys Gln Gly Asp
195 200 205
Leu Ile Cys Leu Asp Gly Lys Leu Gly Ala Asp Gly Asn Ala Leu Phe
210 215 220
Arg Gln Pro Asp Leu Arg Glu Met Arg Asp Gln Ser Gln Glu Asp Pro
225 230 235 240
Arg Glu Ala Gln Ala Ala Gln Trp Glu Leu Asn Tyr Val Ala Leu Asp
245 250 255
Gly Asn Ile Gly Cys Met Val Asn Gly Ala Gly Leu Ala Met Gly Thr
260 265 270
Met Asp Ile Val Lys Leu His Gly Gly Glu Pro Ala Asn Phe Leu Asp
275 280 285
Val Gly Gly Gly Ala Thr Lys Glu Arg Val Thr Glu Ala Phe Lys Ile
290 295 300
Ile Leu Ser Asp Asp Lys Val Lys Ala Val Leu Val Asn Ile Phe Gly
305 310 315 320
Gly Ile Val Arg Cys Asp Leu Ile Ala Asp Gly Ile Ile Gly Ala Val
325 330 335
Ala Glu Val Gly Val Asn Val Pro Val Val Val Arg Leu Glu Gly Asn
340 345 350
Asn Ala Glu Leu Gly Ala Lys Lys Leu Ala Asp Ser Gly Leu Asn Ile
355 360 365
Ile Ala Ala Lys Gly Leu Thr Asp Ala Ala Gln Gln Val Val Ala Ala
370 375 380
Val Glu Gly Lys
385
<210> 38
<211> 1167
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 38
atgaacctgc atgaatatca ggccaagcag ctgttcgcgc ggtatggcct cccggcgccg 60
gtcggctacg cctgtacgac cccgcgggaa gcggaggagg ccgcctccaa gatcggcgcc 120
ggcccgtggg tggtcaaatg ccaggtgcat gcgggcggcc ggggcaaggc gggcggcgtg 180
aaggtcgtca actccaagga ggacatccgc gccttcgccg agaactggct gggcaagcgg 240
ctggtgacct atcagacgga cgccaatggc cagcccgtca atcagatcct ggtcgaggcg 300
gccacggaca tcgcgaaaga actgtacctc ggcgccgtcg tggaccggag cagccggcgg 360
gtggtgttca tggcgtccac cgagggcggc gtggaaatcg aaaaagtggc cgaggaaacc 420
ccgcacctga tccataaagt cgcgctggac ccgctgaccg gccccatgcc gtatcagggc 480
cgggaactcg cgttcaagct cggcctggag ggcaagctgg tgcagcagtt cacgaaaatc 540
ttcatgggcc tggcgaccat cttcctggag cgcgacctgg ccctgatcga aatcaacccg 600
ctggtcatca cgaagcaggg cgacctgatc tgcctggacg gcaagctcgg cgccgacggc 660
aacgccctgt tccgccagcc ggacctgcgg gaaatgcgcg atcagtcgca ggaggacccc 720
cgggaggccc aggcggccca gtgggagctg aattatgtgg cgctcgatgg caatatcggc 780
tgcatggtca atggcgcggg cctggcgatg ggcacgatgg acatcgtgaa gctgcatggc 840
ggcgagcccg ccaacttcct ggacgtgggc ggcggcgcga ccaaagagcg ggtgacggaa 900
gcgttcaaga tcatcctgag cgacgataaa gtcaaggccg tgctggtcaa catcttcggc 960
ggcatcgtcc gctgcgacct gatcgccgac ggcatcatcg gcgcggtggc ggaggtcggc 1020
gtcaatgtgc cggtcgtggt ccgcctggag ggcaacaacg ccgaactggg cgccaagaag 1080
ctggccgatt ccggcctgaa catcatcgcg gcgaagggcc tgaccgatgc cgcgcagcag 1140
gtcgtggccg ccgtcgaggg caagtga 1167
<210> 39
<211> 289
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 39
Met Ser Ile Leu Ile Asp Lys Asn Thr Lys Val Ile Cys Gln Gly Phe
1 5 10 15
Thr Gly Ser Gln Gly Thr Phe His Ser Glu Gln Ala Ile Ala Tyr Gly
20 25 30
Thr Lys Met Val Gly Gly Val Thr Pro Gly Lys Gly Gly Thr Thr His
35 40 45
Leu Gly Leu Pro Val Phe Asn Thr Val Arg Glu Ala Val Ala Ala Thr
50 55 60
Gly Ala Thr Ala Ser Val Ile Tyr Val Pro Ala Pro Phe Cys Lys Asp
65 70 75 80
Ser Ile Leu Glu Ala Ile Asp Ala Gly Ile Lys Leu Ile Ile Thr Ile
85 90 95
Thr Glu Gly Ile Pro Thr Leu Asp Met Leu Thr Val Lys Val Lys Leu
100 105 110
Asp Glu Ala Gly Val Arg Met Ile Gly Pro Asn Cys Pro Gly Val Ile
115 120 125
Thr Pro Gly Glu Cys Lys Ile Gly Ile Gln Pro Gly His Ile His Lys
130 135 140
Pro Gly Lys Val Gly Ile Val Ser Arg Ser Gly Thr Leu Thr Tyr Glu
145 150 155 160
Ala Val Lys Gln Thr Thr Asp Tyr Gly Phe Gly Gln Ser Thr Cys Val
165 170 175
Gly Ile Gly Gly Asp Pro Ile Pro Gly Ser Asn Phe Ile Asp Ile Leu
180 185 190
Glu Met Phe Glu Lys Asp Pro Gln Thr Glu Ala Ile Val Met Ile Gly
195 200 205
Glu Ile Gly Gly Ser Ala Glu Glu Glu Ala Ala Ala Tyr Ile Lys Glu
210 215 220
His Val Thr Lys Pro Val Val Gly Tyr Ile Ala Gly Val Thr Ala Pro
225 230 235 240
Lys Gly Lys Arg Met Gly His Ala Gly Ala Ile Ile Ala Gly Gly Lys
245 250 255
Gly Thr Ala Asp Glu Lys Phe Ala Ala Leu Glu Ala Ala Gly Val Lys
260 265 270
Thr Val Arg Ser Leu Ala Asp Ile Gly Glu Ala Leu Lys Thr Val Leu
275 280 285
Lys
<210> 40
<211> 870
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 40
atgtccatcc tcatcgacaa gaacaccaag gtgatctgcc agggcttcac cggctcccag 60
ggcaccttcc acagcgagca ggcgatcgcc tacggcacca agatggtggg cggcgtcacc 120
cccggcaagg gcggcaccac ccatctcggc ctcccggtgt tcaatacggt gcgggaagcc 180
gtggcggcca ccggcgcgac cgccagcgtc atctatgtgc ccgcgccgtt ctgcaaggac 240
tccatcctgg aagccatcga cgccggcatc aagctcatca tcaccatcac cgagggcatc 300
cccaccctcg acatgctgac ggtgaaagtc aagctggacg aggcgggcgt ccggatgatc 360
ggccccaact gcccgggcgt catcaccccc ggcgagtgca aaatcggcat ccagccgggc 420
cacatccaca aaccgggcaa ggtgggcatc gtctcgcgct ccggcaccct cacctatgaa 480
gccgtcaagc agaccaccga ctatggcttc ggccagtcga cctgcgtcgg catcggcggc 540
gaccccatcc cgggctcgaa cttcatcgac atcctggaga tgttcgagaa agacccccag 600
accgaggcca tcgtgatgat cggcgagatc ggcggctcgg cggaggagga ggcggcggcg 660
tacatcaaag agcatgtgac caagccggtc gtgggctata tcgcgggcgt gacggcgccc 720
aagggcaagc gcatgggcca tgcgggcgcc atcatcgcgg gcggcaaagg caccgcggat 780
gagaagttcg ccgccctgga ggccgccggc gtcaagaccg tccgcagcct cgccgatatc 840
ggcgaagccc tgaagaccgt gctcaagtga 870
<210> 41
<211> 453
<212> PRT
<213> 克鲁维氏梭菌(Clostridium kluyveri)
<400> 41
Met Ser Asn Glu Val Ser Ile Lys Glu Leu Ile Glu Lys Ala Lys Val
1 5 10 15
Ala Gln Lys Lys Leu Glu Ala Tyr Ser Gln Glu Gln Val Asp Val Leu
20 25 30
Val Lys Ala Leu Gly Lys Val Val Tyr Asp Asn Ala Glu Met Phe Ala
35 40 45
Lys Glu Ala Val Glu Glu Thr Glu Met Gly Val Tyr Glu Asp Lys Val
50 55 60
Ala Lys Cys His Leu Lys Ser Gly Ala Ile Trp Asn His Ile Lys Asp
65 70 75 80
Lys Lys Thr Val Gly Ile Ile Lys Glu Glu Pro Glu Arg Ala Leu Val
85 90 95
Tyr Val Ala Lys Pro Lys Gly Val Val Ala Ala Thr Thr Pro Ile Thr
100 105 110
Asn Pro Val Val Thr Pro Met Cys Asn Ala Met Ala Ala Ile Lys Gly
115 120 125
Arg Asn Thr Ile Ile Val Ala Pro His Pro Lys Ala Lys Lys Val Ser
130 135 140
Ala His Thr Val Glu Leu Met Asn Ala Glu Leu Lys Lys Leu Gly Ala
145 150 155 160
Pro Glu Asn Ile Ile Gln Ile Val Glu Ala Pro Ser Arg Glu Ala Ala
165 170 175
Lys Glu Leu Met Glu Ser Ala Asp Val Val Ile Ala Thr Gly Gly Ala
180 185 190
Gly Arg Val Lys Ala Ala Tyr Ser Ser Gly Arg Pro Ala Tyr Gly Val
195 200 205
Gly Pro Gly Asn Ser Gln Val Ile Val Asp Lys Gly Tyr Asp Tyr Asn
210 215 220
Lys Ala Ala Gln Asp Ile Ile Thr Gly Arg Lys Tyr Asp Asn Gly Ile
225 230 235 240
Ile Cys Ser Ser Glu Gln Ser Val Ile Ala Pro Ala Glu Asp Tyr Asp
245 250 255
Lys Val Ile Ala Ala Phe Val Glu Asn Gly Ala Phe Tyr Val Glu Asp
260 265 270
Glu Glu Thr Val Glu Lys Phe Arg Ser Thr Leu Phe Lys Asp Gly Lys
275 280 285
Ile Asn Ser Lys Ile Ile Gly Lys Ser Val Gln Ile Ile Ala Asp Leu
290 295 300
Ala Gly Val Lys Val Pro Glu Gly Thr Lys Val Ile Val Leu Lys Gly
305 310 315 320
Lys Gly Ala Gly Glu Lys Asp Val Leu Cys Lys Glu Lys Met Cys Pro
325 330 335
Val Leu Val Ala Leu Lys Tyr Asp Thr Phe Glu Glu Ala Val Glu Ile
340 345 350
Ala Met Ala Asn Tyr Met Tyr Glu Gly Ala Gly His Thr Ala Gly Ile
355 360 365
His Ser Asp Asn Asp Glu Asn Ile Arg Tyr Ala Gly Thr Val Leu Pro
370 375 380
Ile Ser Arg Leu Val Val Asn Gln Pro Ala Thr Thr Ala Gly Gly Ser
385 390 395 400
Phe Asn Asn Gly Phe Asn Pro Thr Thr Thr Leu Gly Cys Gly Ser Trp
405 410 415
Gly Arg Asn Ser Ile Ser Glu Asn Leu Thr Tyr Glu His Leu Ile Asn
420 425 430
Val Ser Arg Ile Gly Tyr Phe Asn Lys Glu Ala Lys Val Pro Ser Tyr
435 440 445
Glu Glu Ile Trp Gly
450
<210> 42
<211> 1362
<212> DNA
<213> 克鲁维氏梭菌(Clostridium kluyveri)
<400> 42
atgtcgaatg aagtctcgat caaggaactg atcgaaaagg cgaaggtggc ccagaagaaa 60
ctggaagcct actcgcagga gcaggtggat gtcctggtca aggccctggg caaggtcgtg 120
tatgataacg cggagatgtt cgccaaagaa gcggtggaag aaacggaaat gggcgtgtac 180
gaggacaagg tggcgaagtg ccacctgaaa tccggcgcca tctggaacca tatcaaggac 240
aagaaaaccg tgggcatcat caaggaagag ccggagcggg ccctggtcta cgtcgccaag 300
cccaagggcg tggtggccgc caccacgccc atcaccaacc ccgtcgtcac gccgatgtgt 360
aatgcgatgg ccgcgatcaa gggccgcaat acgatcatcg tggccccgca ccccaaagcg 420
aaaaaggtgt ccgcccacac cgtcgagctg atgaacgccg agctgaagaa gctgggcgcc 480
ccggagaaca tcatccagat cgtggaagcg ccctcgcggg aggcggcgaa ggaactcatg 540
gagagcgccg acgtggtcat cgccaccggc ggcgcgggcc gggtgaaggc cgcctactcg 600
tccggccgcc ccgcgtacgg cgtcggcccg ggcaactcgc aggtcatcgt cgacaagggc 660
tatgactaca acaaggccgc gcaggacatc atcaccggcc gcaagtatga caacggcatc 720
atctgctcct ccgagcagag cgtgatcgcg cccgccgaag actatgacaa ggtgatcgcc 780
gccttcgtcg agaatggcgc gttctacgtg gaggatgaag aaaccgtgga aaagttccgc 840
tccaccctgt tcaaagacgg caagatcaat tccaagatca tcggcaagag cgtccagatc 900
atcgccgacc tggcgggcgt caaggtcccc gagggcacga aggtcatcgt gctgaagggc 960
aagggcgcgg gcgagaagga tgtcctgtgc aaggaaaaga tgtgcccggt gctggtggcc 1020
ctgaagtacg acaccttcga agaggccgtc gaaatcgcga tggccaacta tatgtatgaa 1080
ggcgccggcc acaccgccgg catccattcg gacaacgacg agaacatccg ctacgcgggc 1140
accgtgctcc ccatcagccg cctcgtggtg aaccagccgg ccaccaccgc cggcggcagc 1200
ttcaataacg gcttcaaccc caccaccacc ctgggctgcg gcagctgggg ccgcaacagc 1260
atctcggaaa acctcacgta cgaacatctc atcaacgtct cccgcatcgg ctatttcaac 1320
aaggaagcga aggtgccctc ctatgaagag atctggggct ga 1362
<210> 43
<211> 451
<212> PRT
<213> 齿龈卟啉单胞菌(Porphyromonas gingivalis)
<400> 43
Met Glu Ile Lys Glu Met Val Ser Leu Ala Arg Lys Ala Gln Lys Glu
1 5 10 15
Tyr Gln Ala Thr His Asn Gln Glu Ala Val Asp Asn Ile Cys Arg Ala
20 25 30
Ala Ala Lys Val Ile Tyr Glu Asn Ala Ala Ile Leu Ala Arg Glu Ala
35 40 45
Val Asp Glu Thr Gly Met Gly Val Tyr Glu His Lys Val Ala Lys Asn
50 55 60
Gln Gly Lys Ser Lys Gly Val Trp Tyr Asn Leu His Asn Lys Lys Ser
65 70 75 80
Ile Gly Ile Leu Asn Ile Asp Glu Arg Thr Gly Met Ile Glu Ile Ala
85 90 95
Lys Pro Ile Gly Val Val Gly Ala Val Thr Pro Thr Thr Asn Pro Ile
100 105 110
Val Thr Pro Met Ser Asn Ile Ile Phe Ala Leu Lys Thr Cys Asn Ala
115 120 125
Ile Ile Ile Ala Pro His Pro Arg Ser Lys Lys Cys Ser Ala His Ala
130 135 140
Val Arg Leu Ile Lys Glu Ala Ile Ala Pro Phe Asn Val Pro Glu Gly
145 150 155 160
Met Val Gln Ile Ile Glu Glu Pro Ser Ile Glu Lys Thr Gln Glu Leu
165 170 175
Met Gly Ala Val Asp Val Val Val Ala Thr Gly Gly Met Gly Met Val
180 185 190
Lys Ser Ala Tyr Ser Ser Gly Lys Pro Ser Phe Gly Val Gly Ala Gly
195 200 205
Asn Val Gln Val Ile Val Asp Ser Asn Ile Asp Phe Glu Ala Ala Ala
210 215 220
Glu Lys Ile Ile Thr Gly Arg Ala Phe Asp Asn Gly Ile Ile Cys Ser
225 230 235 240
Gly Glu Gln Ser Ile Ile Tyr Asn Glu Ala Asp Lys Glu Ala Val Phe
245 250 255
Thr Ala Phe Arg Asn His Gly Ala Tyr Phe Cys Asp Glu Ala Glu Gly
260 265 270
Asp Arg Ala Arg Ala Ala Ile Phe Glu Asn Gly Ala Ile Ala Lys Asp
275 280 285
Val Val Gly Gln Ser Val Ala Phe Ile Ala Lys Lys Ala Asn Ile Asn
290 295 300
Ile Pro Glu Gly Thr Arg Ile Leu Val Val Glu Ala Arg Gly Val Gly
305 310 315 320
Ala Glu Asp Val Ile Cys Lys Glu Lys Met Cys Pro Val Met Cys Ala
325 330 335
Leu Ser Tyr Lys His Phe Glu Glu Gly Val Glu Ile Ala Arg Thr Asn
340 345 350
Leu Ala Asn Glu Gly Asn Gly His Thr Cys Ala Ile His Ser Asn Asn
355 360 365
Gln Ala His Ile Ile Leu Ala Gly Ser Glu Leu Thr Val Ser Arg Ile
370 375 380
Val Val Asn Ala Pro Ser Ala Thr Thr Ala Gly Gly His Ile Gln Asn
385 390 395 400
Gly Leu Ala Val Thr Asn Thr Leu Gly Cys Gly Ser Trp Gly Asn Asn
405 410 415
Ser Ile Ser Glu Asn Phe Thr Tyr Lys His Leu Leu Asn Ile Ser Arg
420 425 430
Ile Ala Pro Leu Asn Ser Ser Ile His Ile Pro Asp Asp Lys Glu Ile
435 440 445
Trp Glu Leu
450
<210> 44
<211> 1356
<212> DNA
<213> 齿龈卟啉单胞菌(Porphyromonas gingivalis)
<400> 44
atggagatca aggaaatggt gtccctggcc cgcaaggccc agaaggagta ccaggccacc 60
cataatcagg aagccgtgga caacatctgc cgcgccgcgg cgaaagtcat ctacgaaaat 120
gccgccatcc tcgcccgcga ggcggtcgat gaaaccggca tgggcgtgta cgaacacaag 180
gtggccaaga atcagggcaa aagcaagggc gtgtggtaca acctgcataa caagaaaagc 240
atcggcatcc tgaacatcga cgagcgcacc ggcatgatcg agatcgccaa gcccatcggc 300
gtcgtcggcg cggtcacgcc gaccaccaat cccatcgtca ccccgatgtc caacatcatc 360
ttcgcgctga aaacctgcaa cgcgatcatc atcgcccccc acccgcgcag caaaaaatgc 420
tcggcccacg ccgtgcggct catcaaggaa gccatcgcgc cgttcaacgt gccggagggc 480
atggtgcaga tcatcgaaga gccgtcgatc gagaagaccc aggaactgat gggcgccgtc 540
gacgtggtgg tggccaccgg cggcatgggc atggtgaagt cggcgtatag ctcgggcaag 600
ccgagcttcg gcgtgggcgc cggcaacgtg caggtcatcg tcgattcgaa catcgatttc 660
gaagccgccg cggaaaagat catcacgggc cgcgcgttcg ataacggcat catctgctcc 720
ggcgaacaga gcatcatcta caacgaggcg gataaggagg ccgtcttcac ggccttccgg 780
aaccacggcg cgtacttctg cgatgaagcc gaaggcgatc gcgcccgggc ggcgatcttc 840
gaaaacggcg ccatcgccaa agacgtggtg ggccagagcg tggcgttcat cgccaagaaa 900
gcgaacatca atatccccga aggcacgcgc atcctggtgg tggaagcccg cggcgtcggc 960
gcggaagatg tgatctgcaa ggaaaagatg tgccccgtga tgtgcgccct gtcctacaaa 1020
cacttcgaag agggcgtcga gatcgcccgc accaacctcg cgaacgaggg caacggccac 1080
acctgcgcca tccattcgaa taatcaggcc cacatcatcc tggccggcag cgagctcacc 1140
gtcagccgca tcgtggtcaa cgcgccctcc gccaccaccg ccggcggcca tatccagaac 1200
ggcctggccg tgacgaacac cctgggctgc ggctcgtggg gcaacaacag catctcggaa 1260
aacttcacct ataagcatct gctcaatatc agccgcatcg ccccgctgaa cagcagcatc 1320
catatcccgg acgacaaaga gatctgggaa ctctga 1356
<210> 45
<211> 469
<212> PRT
<213> 荚膜甲基球菌(Methylococcus capsulatus)
<400> 45
Met Ser Gln Asp Asp Tyr Arg Ile Glu Lys Asp Ser Met Gly Glu Leu
1 5 10 15
Arg Val Pro Val Ser Ala Leu Tyr Ala Ala Gln Thr Gln Arg Ala Ile
20 25 30
Asp Asn Phe Pro Val Ser Gly Leu Ala Leu Pro Pro Ala Phe Ile Arg
35 40 45
Ala Ile Ala Arg Ile Lys Gln Cys Ala Ala Arg Val Asn Val Ala Leu
50 55 60
Gly His Leu Asp Ala Gly Lys Gly Glu Ala Ile Met Ala Ala Ala Glu
65 70 75 80
Glu Ile Ile Gly Gly Ala Tyr Ala Asp Gln Phe Pro Val Asp Val Phe
85 90 95
Gln Thr Gly Ser Gly Thr Ser Thr Asn Met Asn Val Asn Glu Val Leu
100 105 110
Ala Thr Leu Ala Ser Arg Arg Ala Gly Thr Pro Val Ser Ala Asn Asp
115 120 125
Asp Val Asn Met Gly Gln Ser Ser Asn Asp Val Ile Pro Thr Ala Ile
130 135 140
His Val Ser Ala Ala Leu Ala Val Asn Glu His Leu Ile Pro Ala Leu
145 150 155 160
Glu His Leu Ala Ala Thr Ile Arg Tyr Lys Gly Leu Ala His Pro Lys
165 170 175
Ala Val Lys Thr Gly Arg Thr His Leu Met Asp Ala Met Pro Val Arg
180 185 190
Leu Glu Gln Glu Leu Ser Gly Trp Ala Leu Gln Val Ala Asn Gly Val
195 200 205
Asp Arg Leu Arg Ala Ser Leu Pro Arg Leu Tyr Lys Leu Gly Gln Gly
210 215 220
Gly Thr Ala Val Gly Thr Gly Ile Asn Ala Asp Pro Ala Phe Ala Ser
225 230 235 240
Ser Phe Ala Glu Ala Leu Ala Asp Ala Thr Gly Leu Pro Phe Arg Pro
245 250 255
Asn Asp Ser Phe Phe Glu Ser Leu Ser Cys Gln Asp Ala Ala Val Glu
260 265 270
Leu Ser Gly Gln Leu Lys Thr Ile Ala Val Gly Ile Met Lys Ile Ala
275 280 285
Asn Asp Leu Arg Trp Met Asn Ser Gly Pro Leu Ala Gly Leu Gly Glu
290 295 300
Ile Glu Leu Pro Ala Leu Gln Pro Gly Ser Ser Ile Met Pro Gly Lys
305 310 315 320
Val Asn Pro Val Ile Pro Glu Ala Ala Cys Met Val Ala Ala Gln Val
325 330 335
Ile Gly Asn Asp Ala Ala Ile Thr Val Ala Gly Gln Ser Gly Ser Phe
340 345 350
Gln Leu Asn Val Met Leu Pro Val Ile Ala Tyr Asn Leu Leu Gln Ser
355 360 365
Ile Glu Leu Leu Ala Asn Ile Ala Arg Leu Leu Ala Asp Lys Ala Ile
370 375 380
Ala Asp Phe Arg Val Arg Glu Asp Asn Leu Arg Arg Ala Leu Ala Thr
385 390 395 400
Asn Pro Ile Leu Val Thr Ala Leu Asn Pro Val Ile Gly Tyr Leu Lys
405 410 415
Ala Ala Glu Ile Ala Lys Thr Ala Tyr Arg Thr Gly Arg Pro Ile Leu
420 425 430
Glu Val Ala Ile Glu Met Ser Gly Leu Asp Arg Ala Glu Leu Glu Arg
435 440 445
Leu Leu Asp Pro Ala Ala Leu Thr Thr Gly Gly Ile His Gly Val Pro
450 455 460
Ala Gly Ala Ala Gly
465
<210> 46
<211> 1410
<212> DNA
<213> 荚膜甲基球菌(Methylococcus capsulatus)
<400> 46
atgagccaag acgactatcg catcgaaaaa gacagcatgg gtgagctgcg ggttccggtt 60
tccgcgctct acgcggctca gacccagcgt gccatcgaca attttccggt gagcgggctg 120
gctttgccgc cggcgttcat ccgcgcgatc gcccggatca agcagtgcgc ggcccgggtc 180
aatgtggcgc tggggcatct ggatgcaggc aagggcgagg cgatcatggc ggcggccgag 240
gagatcatcg gcggggcata cgccgaccag tttcctgtcg acgtgttcca gaccggttcc 300
ggcaccagca ccaacatgaa cgtcaacgaa gtgctggcga ctttggcttc ccggcgcgcg 360
ggaacgcccg tgagcgccaa cgacgacgtc aacatggggc agagcagcaa tgacgtcatc 420
cccacggcga ttcacgtcag tgccgcgctg gcagtcaacg aacatctgat cccggcgctg 480
gaacacctgg cggcgacgat acgctacaag ggcttggcgc atccgaaggc ggtcaagacc 540
gggcggaccc atctgatgga cgccatgcca gtgcggctgg agcaagaact ctcgggctgg 600
gcgctgcagg tcgccaacgg cgtcgaccgc ctgcgggcga gtctgccgcg gctttacaaa 660
ttggggcagg gcggcacggc cgtgggcact ggcatcaacg ccgatccggc cttcgcttcc 720
tccttcgccg aagctctggc cgatgccacg ggcctgcctt ttcgccccaa cgattcgttc 780
ttcgagagcc tgagttgcca ggacgcggca gtcgaactgt cgggccagct caagaccatc 840
gccgtcggca tcatgaagat cgccaacgac ctgcgctgga tgaattcggg tcccctggct 900
ggcctggggg agatcgagct gcccgcgctc cagcccggca gctccatcat gcccggcaag 960
gtgaatccgg tgattcccga agccgcctgc atggtcgcgg cgcaggtcat cggcaacgac 1020
gccgccatca cggtggctgg tcagtcgggt tctttccaac tcaacgtgat gctgccggtg 1080
atcgcctaca acttgctgca gagcatcgag ttgctggcca acattgctcg tctgctggcc 1140
gacaaggcca tcgccgactt ccgggtgcgt gaggacaatc tgcgccgggc tctggcaacg 1200
aatccgatcc tggtcaccgc actcaacccg gtgatcggct acctgaaggc ggcggaaatc 1260
gccaagaccg cctaccggac ggggcggccg attctggagg tggccatcga aatgagcggt 1320
ctggaccgcg ccgaactgga gcgactgctc gatccggcgg ccctgaccac cggcggcatc 1380
cacggtgtac ccgccggcgc ggcgggctga 1410
<210> 47
<211> 467
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 47
Met Asn Thr Val Arg Ser Glu Lys Asp Ser Met Gly Ala Ile Asp Val
1 5 10 15
Pro Ala Asp Lys Leu Trp Gly Ala Gln Thr Gln Arg Ser Leu Glu His
20 25 30
Phe Arg Ile Ser Thr Glu Lys Met Pro Thr Ser Leu Ile His Ala Leu
35 40 45
Ala Leu Thr Lys Arg Ala Ala Ala Lys Val Asn Glu Asp Leu Gly Leu
50 55 60
Leu Ser Glu Glu Lys Ala Ser Ala Ile Arg Gln Ala Ala Asp Glu Val
65 70 75 80
Leu Ala Gly Gln His Asp Asp Glu Phe Pro Leu Ala Ile Trp Gln Thr
85 90 95
Gly Ser Gly Thr Gln Ser Asn Met Asn Met Asn Glu Val Leu Ala Asn
100 105 110
Arg Ala Ser Glu Leu Leu Gly Gly Val Arg Gly Met Glu Arg Lys Val
115 120 125
His Pro Asn Asp Asp Val Asn Lys Ser Gln Ser Ser Asn Asp Val Phe
130 135 140
Pro Thr Ala Met His Val Ala Ala Leu Leu Ala Leu Arg Lys Gln Leu
145 150 155 160
Ile Pro Gln Leu Lys Thr Leu Thr Gln Thr Leu Asn Glu Lys Ser Arg
165 170 175
Ala Phe Ala Asp Ile Val Lys Ile Gly Arg Thr His Leu Gln Asp Ala
180 185 190
Thr Pro Leu Thr Leu Gly Gln Glu Ile Ser Gly Trp Val Ala Met Leu
195 200 205
Glu His Asn Leu Lys His Ile Glu Tyr Ser Leu Pro His Val Ala Glu
210 215 220
Leu Ala Leu Gly Gly Thr Ala Val Gly Thr Gly Leu Asn Thr His Pro
225 230 235 240
Glu Tyr Ala Arg Arg Val Ala Asp Glu Leu Ala Val Ile Thr Cys Ala
245 250 255
Pro Phe Val Thr Ala Pro Asn Lys Phe Glu Ala Leu Ala Thr Cys Asp
260 265 270
Ala Leu Val Gln Ala His Gly Ala Leu Lys Gly Leu Ala Ala Ser Leu
275 280 285
Met Lys Ile Ala Asn Asp Val Arg Trp Leu Ala Ser Gly Pro Arg Cys
290 295 300
Gly Ile Gly Glu Ile Ser Ile Pro Glu Asn Glu Pro Gly Ser Ser Ile
305 310 315 320
Met Pro Gly Lys Val Asn Pro Thr Gln Cys Glu Ala Leu Thr Met Leu
325 330 335
Cys Cys Gln Val Met Gly Asn Asp Val Ala Ile Asn Met Gly Gly Ala
340 345 350
Ser Gly Asn Phe Glu Leu Asn Val Phe Arg Pro Met Val Ile His Asn
355 360 365
Phe Leu Gln Ser Val Arg Leu Leu Ala Asp Gly Met Glu Ser Phe Asn
370 375 380
Lys His Cys Ala Val Gly Ile Glu Pro Asn Arg Glu Arg Ile Asn Gln
385 390 395 400
Leu Leu Asn Glu Ser Leu Met Leu Val Thr Ala Leu Asn Thr His Ile
405 410 415
Gly Tyr Asp Lys Ala Ala Glu Ile Ala Lys Lys Ala His Lys Glu Gly
420 425 430
Leu Thr Leu Lys Ala Ala Ala Leu Ala Leu Gly Tyr Leu Ser Glu Ala
435 440 445
Glu Phe Asp Ser Trp Val Arg Pro Glu Gln Met Val Gly Ser Met Lys
450 455 460
Ala Gly Arg
465
<210> 48
<211> 1404
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 48
atgaacaccg tgcggagcga aaaggacagc atgggcgcca tcgacgtgcc cgccgataag 60
ctgtggggcg cccagaccca gcggtccctc gaacacttcc ggatctcgac cgaaaagatg 120
ccgaccagcc tgatccatgc gctcgccctg acgaaacggg ccgccgccaa ggtcaacgag 180
gacctcggcc tgctgagcga agagaaggcc tccgcgatcc gccaggccgc cgatgaagtc 240
ctcgccggcc agcacgacga cgagttcccg ctggccatct ggcagaccgg ctcgggcacc 300
cagtcgaaca tgaacatgaa cgaagtgctc gccaaccgcg cgtcggaact gctgggcggc 360
gtccggggca tggaacgcaa ggtccatccc aacgacgacg tgaacaagtc gcagagctcc 420
aatgatgtct tccccaccgc catgcatgtc gcggccctcc tggccctgcg caaacagctg 480
atcccccagc tgaaaaccct gacccagacc ctgaatgaaa aatcccgcgc gttcgccgac 540
atcgtgaaga tcggccggac gcacctccag gacgcgaccc ccctgaccct cggccaggag 600
atctccggct gggtggcgat gctggaacac aacctgaaac atatcgagta cagcctgccg 660
cacgtcgcgg aactggcgct gggcggcacg gcggtcggca ccggcctgaa cacgcatccg 720
gagtatgcgc ggcgcgtggc cgacgaactg gccgtcatca cctgtgcccc gttcgtgacc 780
gccccgaata aattcgaagc cctggcgacc tgtgacgccc tggtccaggc gcatggcgcc 840
ctcaagggcc tggccgccag cctcatgaaa atcgcgaatg acgtgcgctg gctggcctcc 900
ggcccccgct gcggcatcgg cgaaatctcg atccccgaaa acgagccggg ctcgtcgatc 960
atgccgggca aggtgaaccc gacccagtgc gaggcgctca cgatgctctg ctgccaggtc 1020
atgggcaatg acgtggccat caatatgggc ggcgcgtccg gcaacttcga actgaatgtc 1080
ttccgcccga tggtcatcca caatttcctg cagtccgtgc gcctgctggc ggacggcatg 1140
gagagcttca ataagcactg cgcggtgggc atcgagccca accgcgagcg catcaaccag 1200
ctgctgaatg agagcctgat gctggtcacc gcgctgaata cccacatcgg ctacgacaag 1260
gcggccgaaa tcgccaagaa agcgcacaaa gaaggcctga cgctgaaagc cgccgccctg 1320
gccctgggct acctgtccga ggccgagttc gacagctggg tccgcccgga gcagatggtg 1380
ggctcgatga aagccggccg gtga 1404
<210> 49
<211> 474
<212> PRT
<213> 结核分枝杆菌(Mycobacterium tuberculosis)
<400> 49
Met Ala Val Asp Ala Asp Ser Ala Asn Tyr Arg Ile Glu His Asp Thr
1 5 10 15
Met Gly Glu Val Arg Val Pro Ala Lys Ala Leu Trp Arg Ala Gln Thr
20 25 30
Gln Arg Ala Val Glu Asn Phe Pro Ile Ser Gly Arg Gly Leu Glu Arg
35 40 45
Thr Gln Ile Arg Ala Leu Gly Leu Leu Lys Gly Ala Cys Ala Gln Val
50 55 60
Asn Ser Asp Leu Gly Leu Leu Ala Pro Glu Lys Ala Asp Ala Ile Ile
65 70 75 80
Ala Ala Ala Ala Glu Ile Ala Asp Gly Gln His Asp Asp Gln Phe Pro
85 90 95
Ile Asp Val Phe Gln Thr Gly Ser Gly Thr Ser Ser Asn Met Asn Thr
100 105 110
Asn Glu Val Ile Ala Ser Ile Ala Ala Lys Gly Gly Val Thr Leu His
115 120 125
Pro Asn Asp Asp Val Asn Met Ser Gln Ser Ser Asn Asp Thr Phe Pro
130 135 140
Thr Ala Thr His Ile Ala Ala Thr Glu Ala Ala Val Ala His Leu Ile
145 150 155 160
Pro Ala Leu Gln Gln Leu His Asp Ala Leu Ala Ala Lys Ala Leu Asp
165 170 175
Trp His Thr Val Val Lys Ser Gly Arg Thr His Leu Met Asp Ala Val
180 185 190
Pro Val Thr Leu Gly Gln Glu Phe Ser Gly Tyr Ala Arg Gln Ile Glu
195 200 205
Ala Gly Ile Glu Arg Val Arg Ala Cys Leu Pro Arg Leu Gly Glu Leu
210 215 220
Ala Ile Gly Gly Thr Ala Val Gly Thr Gly Leu Asn Ala Pro Asp Asp
225 230 235 240
Phe Gly Val Arg Val Val Ala Val Leu Val Ala Gln Thr Gly Leu Ser
245 250 255
Glu Leu Arg Thr Ala Ala Asn Ser Phe Glu Ala Gln Ala Ala Arg Asp
260 265 270
Gly Leu Val Glu Ala Ser Gly Ala Leu Arg Thr Ile Ala Val Ser Leu
275 280 285
Thr Lys Ile Ala Asn Asp Ile Arg Trp Met Gly Ser Gly Pro Leu Thr
290 295 300
Gly Leu Ala Glu Ile Gln Leu Pro Asp Leu Gln Pro Gly Ser Ser Ile
305 310 315 320
Met Pro Gly Lys Val Asn Pro Val Leu Pro Glu Ala Val Thr Gln Val
325 330 335
Ala Ala Gln Val Ile Gly Asn Asp Ala Ala Ile Ala Trp Gly Gly Ala
340 345 350
Asn Gly Ala Phe Glu Leu Asn Val Tyr Ile Pro Met Met Ala Arg Asn
355 360 365
Ile Leu Glu Ser Phe Lys Leu Leu Thr Asn Val Ser Arg Leu Phe Ala
370 375 380
Gln Arg Cys Ile Ala Gly Leu Thr Ala Asn Val Glu His Leu Arg Arg
385 390 395 400
Leu Ala Glu Ser Ser Pro Ser Ile Val Thr Pro Leu Asn Ser Ala Ile
405 410 415
Gly Tyr Glu Glu Ala Ala Ala Val Ala Lys Gln Ala Leu Lys Glu Arg
420 425 430
Lys Thr Ile Arg Gln Thr Val Ile Asp Arg Gly Leu Ile Gly Asp Arg
435 440 445
Leu Ser Ile Glu Asp Leu Asp Arg Arg Leu Asp Val Leu Ala Met Ala
450 455 460
Lys Ala Glu Gln Leu Asp Ser Asp Arg Leu
465 470
<210> 50
<211> 1425
<212> DNA
<213> 结核分枝杆菌(Mycobacterium tuberculosis)
<400> 50
atggcggtgg atgcggacag cgcgaactac cgcatcgaac acgatacgat gggcgaagtg 60
cgcgtccccg ccaaggccct ctggcgggcc cagacgcagc gggccgtcga gaacttcccg 120
atcagcggcc ggggcctgga acgcacgcag atccgcgccc tgggcctcct gaagggcgcc 180
tgcgcccagg tgaactccga tctgggcctg ctcgcgccgg aaaaggcgga tgccatcatc 240
gccgccgcgg cggagatcgc cgacggccag cacgacgatc agttcccgat cgatgtcttc 300
cagaccggca gcggcacctc cagcaatatg aacaccaacg aggtcatcgc gagcatcgcg 360
gccaagggcg gcgtgaccct gcacccgaac gacgacgtga atatgagcca gtcgtccaac 420
gacaccttcc ccaccgccac ccatatcgcg gcgaccgagg cggccgtcgc gcatctgatc 480
cccgccctgc agcagctcca cgatgccctg gccgcgaaag cgctggactg gcacaccgtc 540
gtgaaatccg gccggacgca tctcatggac gccgtgccgg tgaccctggg ccaggagttc 600
tccggctacg cccggcagat cgaagccggc atcgaacggg tccgcgcgtg cctcccgcgg 660
ctgggcgagc tggccatcgg cggcaccgcc gtgggcaccg gcctcaacgc gcccgacgat 720
ttcggcgtgc gggtggtggc ggtgctcgtg gcccagaccg gcctgtcgga actccggacg 780
gcggccaatt ccttcgaagc ccaggccgcc cgcgatggcc tggtggaggc gtcgggcgcc 840
ctgcgcacga tcgccgtgag cctgacgaag atcgcgaacg acatccggtg gatgggctcc 900
ggcccgctca ccggcctggc ggaaatccag ctcccggacc tgcagcccgg cagctccatc 960
atgcccggca aggtcaaccc cgtgctgccg gaagcggtca cccaggtcgc ggcccaggtg 1020
atcggcaacg acgccgccat cgcctggggc ggcgcgaacg gcgcgttcga actgaatgtc 1080
tatatcccga tgatggcccg gaacatcctg gagtcgttca agctgctcac caacgtgagc 1140
cggctgttcg cgcagcgctg catcgccggc ctcaccgcca acgtcgaaca tctgcggcgg 1200
ctcgcggaat cctcgcccag catcgtcacg ccgctcaaca gcgcgatcgg ctacgaagaa 1260
gcggcggccg tggccaagca ggcgctcaaa gagcgcaaga ccatccgcca gacggtgatc 1320
gaccggggcc tgatcggcga tcggctgtcg atcgaggacc tggatcgccg cctggatgtg 1380
ctcgcgatgg ccaaagccga acagctggac tccgaccgcc tgtga 1425
<210> 51
<211> 602
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 51
Met Gln Thr Phe Gln Ala Asp Leu Ala Ile Val Gly Ala Gly Gly Ala
1 5 10 15
Gly Leu Arg Ala Ala Ile Ala Ala Ala Gln Ala Asn Pro Asn Ala Lys
20 25 30
Ile Ala Leu Ile Ser Lys Val Tyr Pro Met Arg Ser His Thr Val Ala
35 40 45
Ala Glu Gly Gly Ser Ala Ala Val Ala Gln Asp His Asp Ser Phe Glu
50 55 60
Tyr His Phe His Asp Thr Val Ala Gly Gly Asp Trp Leu Cys Glu Gln
65 70 75 80
Asp Val Val Asp Tyr Phe Val His His Cys Pro Thr Glu Met Thr Gln
85 90 95
Leu Glu Leu Trp Gly Cys Pro Trp Ser Arg Arg Pro Asp Gly Ser Val
100 105 110
Asn Val Arg Arg Phe Gly Gly Met Lys Ile Glu Arg Thr Trp Phe Ala
115 120 125
Ala Asp Lys Thr Gly Phe His Met Leu His Thr Leu Phe Gln Thr Ser
130 135 140
Leu Gln Phe Pro Gln Ile Gln Arg Phe Asp Glu His Phe Val Leu Asp
145 150 155 160
Ile Leu Val Asp Asp Gly His Val Arg Gly Leu Val Ala Met Asn Met
165 170 175
Met Glu Gly Thr Leu Val Gln Ile Arg Ala Asn Ala Val Val Met Ala
180 185 190
Thr Gly Gly Ala Gly Arg Val Tyr Arg Tyr Asn Thr Asn Gly Gly Ile
195 200 205
Val Thr Gly Asp Gly Met Gly Met Ala Leu Ser His Gly Val Pro Leu
210 215 220
Arg Asp Met Glu Phe Val Gln Tyr His Pro Thr Gly Leu Pro Gly Ser
225 230 235 240
Gly Ile Leu Met Thr Glu Gly Cys Arg Gly Glu Gly Gly Ile Leu Val
245 250 255
Asn Lys Asn Gly Tyr Arg Tyr Leu Gln Asp Tyr Gly Met Gly Pro Glu
260 265 270
Thr Pro Leu Gly Glu Pro Lys Asn Lys Tyr Met Glu Leu Gly Pro Arg
275 280 285
Asp Lys Val Ser Gln Ala Phe Trp His Glu Trp Arg Lys Gly Asn Thr
290 295 300
Ile Ser Thr Pro Arg Gly Asp Val Val Tyr Leu Asp Leu Arg His Leu
305 310 315 320
Gly Glu Lys Lys Leu His Glu Arg Leu Pro Phe Ile Cys Glu Leu Ala
325 330 335
Lys Ala Tyr Val Gly Val Asp Pro Val Lys Glu Pro Ile Pro Val Arg
340 345 350
Pro Thr Ala His Tyr Thr Met Gly Gly Ile Glu Thr Asp Gln Asn Cys
355 360 365
Glu Thr Arg Ile Lys Gly Leu Phe Ala Val Gly Glu Cys Ser Ser Val
370 375 380
Gly Leu His Gly Ala Asn Arg Leu Gly Ser Asn Ser Leu Ala Glu Leu
385 390 395 400
Val Val Phe Gly Arg Leu Ala Gly Glu Gln Ala Thr Glu Arg Ala Ala
405 410 415
Thr Ala Gly Asn Gly Asn Glu Ala Ala Ile Glu Ala Gln Ala Ala Gly
420 425 430
Val Glu Gln Arg Leu Lys Asp Leu Val Asn Gln Asp Gly Gly Glu Asn
435 440 445
Trp Ala Lys Ile Arg Asp Glu Met Gly Leu Ala Met Glu Glu Gly Cys
450 455 460
Gly Ile Tyr Arg Thr Pro Glu Leu Met Gln Lys Thr Ile Asp Lys Leu
465 470 475 480
Ala Glu Leu Gln Glu Arg Phe Lys Arg Val Arg Ile Thr Asp Thr Ser
485 490 495
Ser Val Phe Asn Thr Asp Leu Leu Tyr Thr Ile Glu Leu Gly His Gly
500 505 510
Leu Asn Val Ala Glu Cys Met Ala His Ser Ala Met Ala Arg Lys Glu
515 520 525
Ser Arg Gly Ala His Gln Arg Leu Asp Glu Gly Cys Thr Glu Arg Asp
530 535 540
Asp Val Asn Phe Leu Lys His Thr Leu Ala Phe Arg Asp Ala Asp Gly
545 550 555 560
Thr Thr Arg Leu Glu Tyr Ser Asp Val Lys Ile Thr Thr Leu Pro Pro
565 570 575
Ala Lys Arg Val Tyr Gly Gly Glu Ala Asp Ala Ala Asp Lys Ala Glu
580 585 590
Ala Ala Asn Lys Lys Glu Lys Ala Asn Gly
595 600
<210> 52
<211> 1809
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 52
atgcagacct tccaggccga tctggccatc gtgggtgcag gcggtgcagg tctccgggca 60
gcaatcgctg cagcccaggc gaaccccaac gccaagatcg cgctcatctc caaggtctac 120
ccgatgcggt cccataccgt ggcggcagag ggcggttcgg cggcagtggc gcaggaccac 180
gattcgttcg aataccactt ccacgacacg gtggccggcg gcgactggct gtgcgaacag 240
gatgtggtgg actacttcgt gcatcattgc cccaccgaaa tgacccagct ggaactgtgg 300
ggctgcccgt ggtcgcgccg gcccgatggc tccgtgaatg tgcgccggtt cggcggcatg 360
aagatcgaac gcacctggtt cgcggccgac aagacgggct tccacatgct ccataccctg 420
ttccagacga gcctgcagtt cccccagatc cagcggttcg acgagcactt cgtcctggac 480
atcctggtgg acgatggcca tgtgcgcggc ctcgtcgcca tgaacatgat ggagggcacc 540
ctcgtgcaga tccgcgccaa cgccgtggtc atggcgaccg gcggcgccgg ccgcgtgtac 600
cgctacaata ccaacggcgg catcgtgacc ggcgacggca tgggcatggc cctcagccac 660
ggcgtgcccc tccgcgacat ggagttcgtg cagtaccacc ccaccggcct cccgggcagc 720
ggcatcctga tgaccgaggg ctgccggggc gaaggcggca tcctcgtcaa caagaacggc 780
tatcgctacc tgcaggacta cggcatgggc ccggaaaccc cgctcggcga gcccaagaat 840
aaatatatgg agctgggccc ccgggataag gtcagccagg cgttctggca cgaatggcgg 900
aagggcaaca ccatctccac cccccgcggc gatgtcgtgt acctcgacct gcggcatctg 960
ggcgaaaaaa agctccacga acgcctgccg ttcatctgcg agctggccaa ggcctacgtg 1020
ggcgtcgacc cggtgaagga gccgatcccg gtgcggccga ccgcgcatta cacgatgggc 1080
ggcatcgaaa ccgaccagaa ctgcgaaacg cgcatcaagg gcctgttcgc ggtgggcgag 1140
tgcagctccg tcggcctcca cggcgcgaac cgcctgggca gcaatagcct cgccgaactc 1200
gtggtcttcg gccggctggc cggcgagcag gccacggaac gggcggccac cgcgggcaac 1260
ggcaacgagg ccgccatcga ggcccaggcc gccggcgtgg aacagcggct gaaggatctg 1320
gtcaaccagg atggcggcga aaactgggcg aagatccgcg acgaaatggg cctggcgatg 1380
gaagagggct gcggcatcta ccgcacgccg gagctgatgc agaagaccat cgataagctg 1440
gcggaactgc aggaacggtt caaacgggtc cggatcacgg atacctcctc ggtgttcaac 1500
accgacctcc tgtacaccat cgagctgggc cacggcctca acgtggcgga gtgtatggcg 1560
cactccgcga tggcgcggaa ggaaagccgc ggtgcccacc agcgcctcga cgaaggctgc 1620
accgagcgcg acgatgtgaa cttcctcaaa cacacgctgg ccttccggga cgcggatggc 1680
acgacccgcc tcgaatatag cgatgtgaag atcacgaccc tgcctcctgc gaagcgcgtc 1740
tacggcggtg aagccgacgc ggcagacaag gccgaggcag ccaataagaa ggagaaagcc 1800
aatggctga 1809
<210> 53
<211> 244
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 53
Met Ala Glu Met Lys Asn Leu Lys Ile Glu Val Val Arg Tyr Asn Pro
1 5 10 15
Glu Val Asp Thr Ala Pro His Ser Ala Phe Tyr Glu Val Pro Tyr Asp
20 25 30
Ala Thr Thr Ser Leu Leu Asp Ala Leu Gly Tyr Ile Lys Asp Asn Leu
35 40 45
Ala Pro Asp Leu Ser Tyr Arg Trp Ser Cys Arg Met Ala Ile Cys Gly
50 55 60
Ser Cys Gly Met Met Val Asn Asn Val Pro Lys Leu Ala Cys Lys Thr
65 70 75 80
Phe Leu Arg Asp Tyr Thr Asp Gly Met Lys Val Glu Ala Leu Ala Asn
85 90 95
Phe Pro Ile Glu Arg Asp Leu Val Val Asp Met Thr His Phe Ile Glu
100 105 110
Ser Leu Glu Ala Ile Lys Pro Tyr Ile Ile Gly Asn Ser Arg Thr Ala
115 120 125
Asp Gln Gly Thr Asn Ile Gln Thr Pro Ala Gln Met Ala Lys Tyr His
130 135 140
Gln Phe Ser Gly Cys Ile Asn Cys Gly Leu Cys Tyr Ala Ala Cys Pro
145 150 155 160
Gln Phe Gly Leu Asn Pro Glu Phe Ile Gly Pro Ala Ala Ile Thr Leu
165 170 175
Ala His Arg Tyr Asn Glu Asp Ser Arg Asp His Gly Lys Lys Glu Arg
180 185 190
Met Ala Gln Leu Asn Ser Gln Asn Gly Val Trp Ser Cys Thr Phe Val
195 200 205
Gly Tyr Cys Ser Glu Val Cys Pro Lys His Val Asp Pro Ala Ala Ala
210 215 220
Ile Gln Gln Gly Lys Val Glu Ser Ser Lys Asp Phe Leu Ile Ala Thr
225 230 235 240
Leu Lys Pro Arg
<210> 54
<211> 735
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 54
atggcggaaa tgaagaacct gaagatcgag gtcgtccggt ataatccgga ggtggatacc 60
gccccccaca gcgcgttcta cgaagtcccg tacgacgcca ccaccagcct cctggatgcg 120
ctgggctaca tcaaggataa cctggccccc gatctgtcgt accgctggtc ctgtcgcatg 180
gccatctgtg gctcctgcgg catgatggtg aataacgtgc cgaagctggc ctgcaagacc 240
ttcctgcggg actataccga cggcatgaaa gtggaggccc tcgcgaactt cccgatcgag 300
cgcgacctgg tggtcgatat gacgcacttc atcgagagcc tggaagcgat caaaccctat 360
atcatcggca acagccggac cgccgaccag ggcacgaaca tccagacgcc cgcgcagatg 420
gcgaagtatc accagttctc cggctgtatc aattgcggcc tgtgctatgc ggcgtgcccg 480
cagttcggcc tgaaccccga gttcatcggc ccggcggcca tcacgctcgc ccaccgctac 540
aacgaggaca gccgcgatca cggcaagaag gagcgcatgg cccagctcaa ttcgcagaat 600
ggcgtgtgga gctgcacctt cgtgggctat tgctccgagg tctgccccaa gcatgtcgac 660
ccggcggcgg cgatccagca gggcaaggtc gagtcgtcga aagacttcct gatcgccacg 720
ctcaagccgc ggtga 735
<210> 55
<211> 131
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 55
Met Thr Thr Lys Arg Lys Pro Tyr Val Arg Pro Met Thr Ser Thr Trp
1 5 10 15
Trp Lys Lys Leu Pro Phe Tyr Arg Phe Tyr Met Leu Arg Glu Gly Thr
20 25 30
Ala Val Pro Ala Val Trp Phe Ser Ile Glu Leu Ile Phe Gly Leu Phe
35 40 45
Ala Leu Lys Asn Gly Pro Glu Ala Trp Ala Gly Phe Val Asp Phe Leu
50 55 60
Gln Asn Pro Val Ile Val Ile Ile Asn Leu Ile Thr Leu Ala Ala Ala
65 70 75 80
Leu Leu His Thr Lys Thr Trp Phe Glu Leu Ala Pro Lys Ala Ala Asn
85 90 95
Ile Ile Val Lys Asp Glu Lys Met Gly Pro Glu Pro Ile Ile Lys Ser
100 105 110
Leu Trp Ala Val Thr Val Val Ala Thr Ile Val Ile Leu Phe Val Ala
115 120 125
Leu Tyr Trp
130
<210> 56
<211> 396
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 56
atgacgacca agcgcaagcc gtacgtccgg ccgatgacct cgacctggtg gaaaaagctc 60
cccttctacc gcttctatat gctgcgcgag ggcaccgcgg tgccggccgt ctggttctcg 120
atcgaactga tcttcggcct gttcgcgctg aagaatggcc cggaggcgtg ggccggcttc 180
gtggacttcc tgcagaaccc cgtcatcgtc atcatcaatc tcatcacgct cgccgcggcc 240
ctcctgcaca ccaagacctg gttcgagctg gccccgaagg cggcgaacat catcgtgaag 300
gacgagaaga tgggcccgga gccgatcatc aaatccctgt gggcggtcac ggtggtcgcc 360
acgatcgtca tcctgttcgt ggcgctgtac tggtga 396
<210> 57
<211> 119
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 57
Met Ile Asn Pro Asn Pro Lys Arg Ser Asp Glu Pro Val Phe Trp Gly
1 5 10 15
Leu Phe Gly Ala Gly Gly Met Trp Ser Ala Ile Ile Ala Pro Val Met
20 25 30
Ile Leu Leu Val Gly Ile Leu Leu Pro Leu Gly Leu Phe Pro Gly Asp
35 40 45
Ala Leu Ser Tyr Glu Arg Val Leu Ala Phe Ala Gln Ser Phe Ile Gly
50 55 60
Arg Val Phe Leu Phe Leu Met Ile Val Leu Pro Leu Trp Cys Gly Leu
65 70 75 80
His Arg Met His His Ala Met His Asp Leu Lys Ile His Val Pro Ala
85 90 95
Gly Lys Trp Val Phe Tyr Gly Leu Ala Ala Ile Leu Thr Val Val Thr
100 105 110
Leu Ile Gly Val Val Thr Ile
115
<210> 58
<211> 360
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 58
atgatcaatc cgaaccccaa acggagcgac gagcccgtct tctggggcct gttcggcgcg 60
ggcggcatgt ggagcgccat catcgcgccg gtcatgatcc tcctcgtggg catcctcctc 120
cccctgggcc tgttccccgg cgacgccctg tcgtacgagc gcgtgctggc cttcgcccag 180
tccttcatcg gccgcgtgtt cctcttcctc atgatcgtgc tccccctctg gtgcggcctg 240
caccgcatgc accacgccat gcacgacctg aagatccatg tccccgccgg caagtgggtc 300
ttctacggcc tcgcggcgat cctgacggtc gtgacgctga tcggcgtggt cacgatctga 360

Claims (146)

1.一种能够将CI碳源转化为多碳产物的经遗传修饰的微生物,其包含一种或多种异源基因,其中所述一种或多种异源基因是:丙酮酸脱氢酶(aceEF),柠檬酸合酶(gltA),乌头酸水合酶1(acnA)或异柠檬酸脱氢酶(icdA)。
2.一种能够将CI碳源转化为多碳产物的经遗传修饰的微生物,其包含一种或多种异源基因,其中所述一种或多种异源基因是:α-酮戊二酸脱羧酶(kgd),4-羟丁酸脱氢酶(4hbD),4-羟基丁酰-CoA转移酶(Cat2),醛脱氢酶(Aid)或醇脱氢酶(Adh)。
3.一种能够将CI碳源转化为多碳产物的经遗传修饰的微生物,其包含一种或多种异源基因,其中所述一种或多种异源基因是:琥珀酰CoA合成酶(SucC),CoA依赖性琥珀酸半醛脱氢酶(SucD),4-羟丁酸脱氢酶(4hbD),4-羟基丁酰CoA转移酶(Cat2),醛脱氢酶(Aid)或醇脱氢酶(Adh)。
4.如权利要求1所述的经遗传修饰的微生物,其还包含来自α-酮戊二酸脱羧酶(kgd),4-羟丁酸脱氢酶(4hbD),4-羟基丁酰-CoA转移酶(Cat2),醛脱氢酶(Aid)或醇脱氢酶(Adh)中的一种或多种基因。
5.如权利要求1所述的经遗传修饰的微生物,其还包含来自琥珀酰-CoA合成酶(SucC),CoA依赖性琥珀酸半醛脱氢酶(SucD),4-羟丁酸脱氢酶(4hbD),4-羟基丁酰-CoA转移酶(Cat2),醛脱氢酶(Aid)或醇脱氢酶(Adh)的一种或多种基因。
6.如权利要求2所述的经遗传修饰的微生物,其还包含琥珀酰-CoA合成酶(SucC)和/或CoA依赖性琥珀酸半醛脱氢酶(SucD)。
7.如权利要求3所述的经遗传修饰的微生物,其还包含α-酮戊二酸脱羧酶(kgd)。
8.如权利要求6或7所述的经遗传修饰的微生物,其还包含来自丙酮酸脱氢酶(aceEF),柠檬酸合酶(gltA),乌头酸水合酶1(acnA)或异柠檬酸脱氢酶(icdA)的一种或多种基因。
9.如权利要求1-8中任一项所述的经遗传修饰的微生物,其还包含来自延胡索酸水合酶(fum)和/或延胡索酸还原酶(fird)的一种或多种基因。
10.如权利要求1-9中任一项所述的经遗传修饰的微生物,其中,所述经遗传修饰的微生物是甲烷氧化菌。
11.如权利要求10所述的经遗传修饰的微生物,其中,所述甲烷氧化菌来自以下属:甲基杆菌(Methylobacter)、甲基微菌(Methylomicrobium),甲基单胞菌(Methylomonas),甲基暖菌(Methylocaldum),甲基球菌(Methylococcus),甲基苏玛菌(Methylosoma),甲基八叠球菌(Methylosarcina),甲基热菌(Methylothermus),甲基盐菌(Methylohalobius),甲基盖亚菌(Methylogaea),甲基卵菌(Methylovulum),泉发菌(Crenothrix),细枝发菌(Clonothrix),甲基球形菌(Methylosphaera),甲基帽菌(Methylocapsa),甲基细胞菌(Methylocella),甲基弯曲菌(Methylosinus),甲基孢囊菌(Methylocystis),甲基阿魏菌(Methyloferula)、甲基海洋菌(Methylomarinum)或甲基嗜酸菌(Methyloacidophilum)。
12.如权利要求10或11所述的经遗传修饰的微生物,其中,所述甲烷氧化菌是甲基球菌(Methylococcus)。
13.如权利要求12所述的经遗传修饰的微生物,其中,所述甲基球菌是荚膜甲基球菌(Methylococcus capsulatus)。
14.如权利要求1-13中任一项所述的经遗传修饰的微生物,其中,所述CI碳是一氧化碳(CO)、二氧化碳(CO2)、甲烷(CH4)或其任何组合。
15.如权利要求1-14中任一项所述的经遗传修饰的微生物,其中,所述CI碳是甲烷(CH4)。
16.如权利要求1-15中任一项所述的经遗传修饰的微生物,其中,所述一种或多种异源基因是过表达的。
17.如权利要求1-16中任一项所述的经遗传修饰的微生物,其还包含其它基因。
18.如权利要求1-17中任一项所述的经遗传修饰的微生物,其中,所述多碳产物是1,4-BDO。
19.一种能够将CI碳源转化为1,4-丁二醇(1,4-BDO)的经遗传修饰的微生物,其包含:丙酮酸脱氢酶基因,柠檬酸合酶基因,乌头酸水合酶1基因,异柠檬酸脱氢酶基因,α-酮戊二酸脱羧酶基因,4-羟丁酸脱氢酶基因,4-羟基丁酰-CoA转移酶基因,醛脱氢酶基因和醇脱氢酶基因。
20.一种能够将CI碳源转化为1,4-丁二醇(1,4-BDO)的经遗传修饰的微生物,其包含:丙酮酸脱氢酶基因,柠檬酸合酶基因,乌头酸水合酶1基因,异柠檬酸脱氢酶基因,琥珀酰-CoA合成酶基因,CoA依赖性琥珀酸半醛脱氢酶基因,4-羟丁酸脱氢酶基因,4-羟基丁酰-CoA转移酶基因,醛脱氢酶基因或醇脱氢酶基因。
21.一种能够将CI碳源转化为1,4-丁二醇(1,4-BDO)的经遗传修饰的微生物,其包含:丙酮酸脱氢酶基因,柠檬酸合酶基因,乌头酸水合酶1基因,异柠檬酸脱氢酶基因,α-酮戊二酸脱羧酶基因,琥珀酰-CoA合成酶基因,CoA依赖性琥珀酸半醛脱氢酶基因,4-羟丁酸脱氢酶基因,4-羟基丁酰CoA转移酶基因,醛脱氢酶基因或醇脱氢酶基因。
22.如权利要求19-21中任一项所述的经遗传修饰的微生物,其还包含延胡索酸水合酶基因和/或延胡索酸还原酶基因。
23.如权利要求19-22中任一项所述的经遗传修饰的微生物,其中,所述基因中的一种或多种是异源的。
24.如权利要求19-23中任一项所述的经遗传修饰的微生物,其中,所述基因中的一种或多种对于所述微生物是内源的。
25.如权利要求19-24中任一项所述的经遗传修饰的微生物,其中,所述基因中的一种或多种是过表达的。
26.如权利要求19-25中任一项所述的经遗传修饰的微生物,其还包含其它基因。
27.一种载体,其包含以下的任意两种或更多种基因:丙酮酸脱氢酶(aceEF);柠檬酸合酶(gltA);乌头酸水合酶1(acnA);异柠檬酸脱氢酶(icdA);α-酮戊二酸脱羧酶(kgd);琥珀酰CoA合成酶(SucC);CoA依赖性琥珀酸半醛脱氢酶(SucD);4-羟丁酸脱氢酶(4hbD);4-羟基丁酰CoA转移酶(Cat2);醛脱氢酶(Aid);和/或醇脱氢酶(Adh)。
28.如权利要求27所述的载体,其中,所述两种或更多种基因中的所述至少一种是异柠檬酸脱氢酶(icdA)。
29.如权利要求27或28所述的载体,其中,所述两种或更多种基因之一是α-酮戊二酸脱羧酶(kgd)基因,4-羟丁酸脱氢酶(4hbD)基因,4-羟基丁酰-CoA转移酶(cat2)基因,醛脱氢酶(aid)或醇脱氢酶(adh)基因。
30.如权利要求27-29中任一项所述的载体,其中,所述两种或更多种基因之一是:琥珀酰CoA合成酶(sucC)基因,CoA依赖性琥珀酸半醛脱氢酶(sucD)基因,4-羟丁酸脱氢酶(4hbD)基因,4-羟基丁酰-CoA转移酶(cat2)基因,醛脱氢酶(aid)基因和/或醇脱氢酶(adh)基因。
31.一种载体,其包含以下两种或更多种基因:丙酮酸脱氢酶(aceEF)基因、柠檬酸合酶(gltA)基因、乌头酸水合成酶1(acnA)基因,异柠檬酸脱氢酶(icdA)基因,延胡索酸水合酶,和/或延胡索酸还原酶。
32.如权利要求31所述的载体,其中,所述两种或更多种基因中的至少一种是异柠檬酸脱氢酶(icdA)。
33.一种载体,其包含以下两种或更多种基因:α-酮戊二酸脱羧酶(kgd)基因、4-羟基丁酸脱氢酶(4hbD)基因、4-羟基丁酰-CoA转移酶(cat2)基因、醛脱氢酶(aid)和/或醇脱氢酶(adh)基因。
34.一种载体,其包含以下两种或更多种基因:琥珀酰-CoA合成酶(sucC)基因,CoA依赖性琥珀酸半醛脱氢酶(sucD)基因,4-羟丁酸脱氢酶(4hbD)基因,4-羟基丁酰-CoA转移酶(cat2)基因,醛脱氢酶(aid)基因和/或醇脱氢酶(adh)基因。
35.一种分离的多核酸,其包含与SEQ ID NO.2至少85%相同的核苷酸序列。
36.如权利要求35所述的分离的多核酸,其中,所述核苷酸序列编码具有2-氧戊二酸脱羧酶活性的蛋白质。
37.一种分离的多核酸,其包含与SEQ ID NO.4至少85%相同的核苷酸序列。
38.一种分离的多核酸,其包含与SEQ ID NO.6至少87%相同的核苷酸序列。
39.如权利要求37或38所述的分离的多核酸,其中,所述核苷酸序列编码具有α-酮戊二酸脱羧酶活性的蛋白质。
40.一种分离的多核酸,其包含与SEQ ID NO.8至少86%相同的核苷酸序列。
41.如权利要求40所述的分离的多核酸,其中,所述核苷酸序列编码具有2-氧戊二酸脱氢酶El组分活性的蛋白质。
42.一种分离的多核酸,其包含与SEQ ID NO.10至少79%相同的核苷酸序列。
43.如权利要求42所述的分离的多核酸,其中,所述核苷酸序列编码具有氧化还原酶活性的蛋白质。
44.一种分离的多核酸,其包含与SEQ ID NO.12或14至少60%相同的核苷酸序列。
45.如权利要求44所述的分离的多核酸,其中,所述核苷酸序列编码具有4-羟基丁酸脱氢酶活性的蛋白质。
46.一种分离的多核酸,其包含与SEQ ID NO.16至少60%相同的核苷酸序列。
47.一种分离的多核酸,其包含与SEQ ID NO.18至少80%相同的核苷酸序列。
48.一种分离的多核酸,其包含与SEQ ID NO.20至少60%相同的核苷酸序列。
49.如权利要求46-48中任一项所述的分离的多核酸,其中,所述核苷酸序列编码具有4-羟基丁酸CoA转移酶活性的蛋白质。
50.一种分离的多核酸,其包含与SEQ ID NO.22至少60%相同的核苷酸序列。
51.一种分离的多核酸,其包含与SEQ ID NO.24至少84%相同的核苷酸序列。
52.一种分离的多核酸,其包含SEQ ID NO.26的核苷酸序列。
53.一种分离的多核酸,其包含与SEQ ID NO.28至少60%相同的核苷酸序列。
54.一种分离的多核酸,其包含与SEQ ID NO.30至少60%相同的核苷酸序列。
55.一种分离的多核酸,其包含与SEQ ID NO.32至少60%相同的核苷酸序列。
56.一种分离的多核酸,其包含与SEQ ID NO.36至少82%相同的核苷酸序列。
57.如权利要求50-56中任一项所述的分离的多核酸,其中,所述核苷酸序列编码具有醛脱氢酶和/或醇脱氢酶活性的蛋白质。
58.一种分离的多核酸,其包含与SEQ ID NO.34至少60%相同的核苷酸序列。
59.如权利要求58所述的分离的多核酸,其中,所述核苷酸序列编码具有ATP依赖性渗透酶活性的蛋白质。
60.一种分离的多核酸,其包含与SEQ ID NO.38至少86%相同的核苷酸序列。
61.如权利要求60所述的分离的多核酸,其中,所述核苷酸序列编码具有琥珀酰CoA合成酶β亚基活性的蛋白质。
62.一种分离的多核酸,其包含与SEQ ID NO.40至少86%相同的核苷酸序列。
63.一种分离的多核酸,其包含与SEQ ID NO.42至少60%相同的核苷酸序列。
64.一种分离的多核酸,其包含与SEQ ID NO.44至少81%相同的核苷酸序列。
65.如权利要求62-64中任一项所述的分离的多核酸,其中,所述核苷酸序列编码具有琥珀酰CoA合成酶α亚基活性的蛋白质。
66.一种分离的多核酸,其包含与SEQ ID NO.48至少83%相同的核苷酸序列。
67.一种分离的多核酸,其包含与SEQ ID NO.50至少83%相同的核苷酸序列。
68.如权利要求66或67所述的分离的多核酸,其中,所述核苷酸序列编码具有延胡索酸水合酶活性的蛋白质。
69.一种分离的多核酸,其包含与SEQ ID NO.52至少83%相同的核苷酸序列。
70.一种分离的多核酸,其包含与SEQ ID NO.54至少84%相同的核苷酸序列。
71.一种分离的多核酸,其包含与SEQ ID NO.56至少60%相同的核苷酸序列。
72.一种分离的多核酸,其包含与SEQ ID NO.58至少81%相同的核苷酸序列。
73.如权利要求69-72中任一项所述的分离的多核酸,其中,所述核苷酸序列编码具有延胡索酸还原酶活性的蛋白质。
74.一种制备能够将CI碳转化为多碳产物的经遗传修饰的微生物的方法,该方法包括使能够将CI碳转化为多碳产物的微生物与表达来自以下的至少一种异源基因的核酸接触:i)aceEF,ii)lpdA,iii)gltA,iv)acnA,v)icdA,vi)kgd,vii)sucC,viii)sucD,ix)4hbD,x)Cat2,xi)Aid,xii)Adh,xiii)Fum,xiv)Frd,或xv)其任何组合。
75.如权利要求74所述的方法,其中,所述经遗传修饰的微生物是甲烷氧化菌。
76.如权利要求75所述的方法,其中,所述甲烷氧化菌是荚膜甲基球菌(Methylococcuscapsulatus)。
77.如权利要求74-76中任一项所述的方法,其中,所述CI碳是甲烷(CH4)。
78.如权利要求74-77中任一项所述的方法,其中,所述微生物用至少两种异源基因转化。
79.如权利要求74-78中任一项所述的方法,其中,所述微生物用至少三种异源基因转化。
80.如权利要求74-79中任一项所述的方法,其中,所述微生物用至少四种异源基因转化。
81.如权利要求74-80中任一项所述的方法,其中,所述微生物用至少五种异源基因转化。
82.如权利要求74-81中任一项所述的方法,其中,所述多碳产物是1,4-BDO。
83.一种制备多碳产物的方法,其包括:
a)使CI碳与能够将CI碳转化为多碳产物的经遗传修饰的微生物接触,其中所述微生物包括至少一种异源基因,所述至少一种异源基因编码:i)aceEF、ii)lpdA、iii)gltA、iv)acnA、v)icdA、vi)kgd、vii)sucC、viii)sucD、ix)4hbD、x)Cat2、xi)Aid、xii)Adh、xiii)Fum、xiv)Frd,或xv)其任何组合;和b)使所述微生物生长以产生所述多碳产物。
84.如权利要求83所述的方法,其中,所述经遗传修饰的微生物包含aceEF,lpdA,gltA,acnA,icdA,kgd,4hbD,Cat2,Aid和Adh。
85.如权利要求83所述的方法,其中,所述经遗传修饰的微生物包含aceEF,lpdA,gltA,acnA,icdA,sucC,sucD,4hbD,Cat2,Aid和Adh。
86.如权利要求83所述的方法,其中,所述经遗传修饰的微生物包含aceEF,lpdA,gltA,acnA,icdA,kgd,sucC,sucD,4hbD,Cat2,Aid和Adh。
87.如权利要求83-86中任一项所述的方法,其中,所述经遗传修饰的微生物包含Fum和Frd。
88.如权利要求83-87中任一项所述的方法,其中,所述一种或多种基因对于所述微生物是内源的。
89.如权利要求83-88中任一项所述的方法,其中,所述经遗传修饰的微生物是甲烷氧化菌。
90.如权利要求89所述的方法,其中,所述甲烷氧化菌是荚膜甲基球菌(Methylococcuscapsulatus)。
91.如权利要求83-90中任一项所述的方法,其中,所述CI碳是甲烷(CH4)。
92.如权利要求83-91中任一项所述的方法,其中,所述微生物用至少两种异源基因转化。
93.如权利要求83-92中任一项所述的方法,其中,所述使所述微生物生长在外源GHB,外源α-酮戊二酸盐或酯和/或外源琥珀酸盐或酯的存在下进行。
94.如权利要求83-93中任一项所述的方法,其还包括回收所述多碳产物。
95.如权利要求83-94中任一项所述的方法,其中,所述多碳产物是1,4-BDO。
96.如权利要求95所述的方法,其还包括使所述1,4-BDO与催化剂接触。
97.如权利要求96所述的方法,其中,所述催化剂是酸催化剂,氧化铝催化剂,二氧化硅-氧化铝催化剂,氧化铝负载的氧化钨催化剂,杂多酸催化剂或硫酸锆催化剂。
98.如权利要求96或97所述的方法,其中,在与所述催化剂接触之后形成四氢呋喃。
99.如权利要求95所述的方法,其还包括使所述1,4-BDO与二羧酸/酸酐接触。
100.如权利要求99所述的方法,其中,在与所述二羧酸/酸酐接触之后,产生聚氨酯。
101.如权利要求96所述的方法,其还包括使所述1,4-BDO酯交换。
102.如权利要求101所述的方法,其中,所述酯交换通过使所述1,4-BDO与接触来进行。
103.如权利要求101或102所述的方法,其中,在酯交换之后,形成聚对苯二酸丁二醇酯(PBT)。
104.一种产生四氢呋喃(THF)的方法,其包括:
a)使CI碳与如权利要求1-26中任一项所述的经遗传修饰的微生物接触;
b)使所述微生物生长以产生1,4-BDO;和c)使来自(b)的所述1,4-BDO与催化剂接触,以产生THF。
105.如权利要求104所述的方法,其中,所述微生物是甲烷氧化菌。
106.如权利要求104或105所述的方法,其中,所述CI碳是甲烷(CH4)。
107.如权利要求104-106中任一项所述的方法,其中,在(c)之前移出来自(b)的所述1,4-BDO。
108.如权利要求104-107中任一项所述的方法,其中,所述催化剂是酸催化剂,氧化铝催化剂,二氧化硅-氧化铝催化剂,氧化铝负载的氧化钨催化剂,杂多酸催化剂或硫酸锆催化剂。
109.如权利要求104-108中任一项所述的方法,其中,产生的所述THF基本上是纯的。
110.如权利要求104-109中任一项所述的方法,其还包括回收所述THF。
111.如权利要求104-110中任一项所述的方法,其中,所述THF被进一步加工。
112.一种制备聚氨酯的方法,其包括:
a)使CI碳与如权利要求1-26中任一项所述的经遗传修饰的微生物接触;
b)使所述微生物生长以产生1,4-BDO;和c)使来自(b)的所述1,4-BDO与二羧酸/酸酐缩合,以产生聚氨酯。
113.如权利要求112所述的方法,其中,所述微生物是甲烷氧化菌。
114.如权利要求112或113所述的方法,其中,所述CI碳是甲烷(CH4)。
115.如权利要求112-114中任一项所述的方法,其中,在(c)之前移出来自(b)的所述1,4-BDO。
116.如权利要求112-115中任一项所述的方法,其中,所述二羧酸/酸酐是脂族或芳族的。
117.如权利要求112-116中任一项所述的方法,其中,产生的所述聚氨酯基本上是纯的。
118.如权利要求112-117中任一项所述的方法,其还包括回收所述聚氨酯。
119.如权利要求112-118中任一项所述的方法,其中,所述聚氨酯被进一步加工。
120.一种制备聚对苯二酸丁二醇酯(PBT)的方法,其包括:
a)使CI碳与如权利要求1-26中任一项所述的所述的经遗传修饰的微生物接触;
b)使所述微生物生长以产生1,4-BDO;和c)使来自(b)的所述1,4-BDO酯交换,以产生PBT。
121.如权利要求120所述的方法,其中,所述微生物是甲烷氧化菌。
122.如权利要求120或121所述的方法,其中,所述CI碳是甲烷(CH4)。
123.如权利要求120-122中任一项所述的方法,其中,在(c)之前移出来自(b)的所述1,4-BDO。
124.如权利要求120-123中任一项所述的方法,其中,所述酯交换通过与对苯二酸二甲酯(DMT)接触来进行。
125.如权利要求120-124中任一项所述的方法,其中,产生的所述PBT基本上是纯的。
126.如权利要求120-125中任一项所述的方法,其还包括回收所述PBT。
127.如权利要求120-126中任一项所述的方法,其中,所述PBT被进一步加工。
128.如权利要求74-126中任一项所述的方法,其中,所述微生物发酵至少96小时。
129.一种能够将CI碳转化为多碳产物的经遗传修饰的微生物,其包含一种或多种异源基因,其中,所述异源基因编码能够增加从琥珀酸盐或酯到1,4-BDO的总碳流量的酶。
130.一种能够将CI碳转化为多碳产物的经遗传修饰的微生物,其包含一种或多种异源基因,其中,所述异源基因编码能够增加从α-酮戊二酸盐或酯到1,4-BDO的总碳流量的酶。
131.一种能够将CI碳转化为多碳产物的经遗传修饰的微生物,其包含一种或多种异源基因,其中,所述异源基因编码能够增加从草酰乙酸盐或酯到琥珀酸盐或酯的总碳流量的酶。
132.一种能够将CI碳源转化为多碳产物的经遗传修饰的微生物,其包含一种或多种异源基因,其中所述一种或多种异源基因是选自以下组中一个或多个的基因:
a)第1组:丙酮酸脱氢酶(aceEF),柠檬酸合酶(gltA),乌头酸水合酶1(acnA),异柠檬酸脱氢酶(icdA);延胡索酸水合酶(fum);和/或延胡索酸还原酶(fird);
b)第2组:α-酮戊二酸脱羧酶(kgd),4-羟丁酸脱氢酶(4hbD),4-羟基丁酰-CoA转移酶(Cat2),醛脱氢酶(Aid)和/或醇脱氢酶(Adh);或
c)第3组:琥珀酰CoA合成酶(SucC),CoA依赖性琥珀酸半醛脱氢酶(SucD),4-羟丁酸脱氢酶(4hbD),4-羟基丁酰CoA转移酶(Cat2),醛脱氢酶(Aid)和/或醇脱氢酶(Adh)。
133.如权利要求132所述的经遗传修饰的微生物,其中,所述一种或多种异源基因是过表达的。
134.如权利要求132或133所述的经遗传修饰的微生物,其中,所述一种或多种异源基因来自第1组。
135.如权利要求134所述的经遗传修饰的微生物,其中,所述一种或多种异源基因是异柠檬酸脱氢酶(icdA)。
136.如权利要求132-135中任一项所述的经遗传修饰的微生物,其中,所述一种或多种异源基因来自第2组。
137.如权利要求132-136中任一项所述的经遗传修饰的微生物,其中,所述一种或多种异源基因来自第3组。
138.如权利要求132或133所述的经遗传修饰的微生物,其中,所述一种或多种异源基因包含来自第1组和第2组的基因。
139.如权利要求132或133所述的经遗传修饰的微生物,其中,所述一种或多种异源基因包含来自第2组和第3组的基因。
140.如权利要求132或133所述的经遗传修饰的微生物,其中,所述一种或多种异源基因包含来自第1组和第3组的基因。
141.如权利要求132或133所述的经遗传修饰的微生物,其中,所述一种或多种异源基因包含来自第1、2和3组的基因。
142.一种制备琥珀酸盐或酯的方法,其包括:
a)使CI碳与经遗传修饰的微生物接触,其中,所述经遗传修饰的微生物包含异源延胡索酸水合酶、延胡索酸还原酶或其任何组合;和b)使所述经遗传修饰的微生物生长以产生琥珀酸盐或酯。
143.如权利要求142所述的方法,其中,所述经遗传修饰的微生物包含丙酮酸脱氢酶(aceEF),柠檬酸合成酶(gltA),乌头酸水合成酶1(acnA)和/或异柠檬酸脱氢酶(icdA)。
144.如权利要求142或143所述的方法,其中,分离来自b)的所述琥珀酸盐或酯。
145.如权利要求142-144中任一项所述的方法,其中,所述琥珀酸盐或酯被转化为1,4-BDO。
146.如权利要求142-145中任一项所述的方法,其中,使所述经遗传修饰的微生物生长至少96小时。
CN201880031815.2A 2017-03-14 2018-03-13 从ci碳制备1,4-丁二醇及其衍生物的方法和微生物 Pending CN110621691A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762470953P 2017-03-14 2017-03-14
US62/470,953 2017-03-14
PCT/US2018/022204 WO2018169972A1 (en) 2017-03-14 2018-03-13 Methods and microorganisms for making 1,4-butanediol and derivatives thereof from c1 carbons

Publications (1)

Publication Number Publication Date
CN110621691A true CN110621691A (zh) 2019-12-27

Family

ID=61873941

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880031815.2A Pending CN110621691A (zh) 2017-03-14 2018-03-13 从ci碳制备1,4-丁二醇及其衍生物的方法和微生物

Country Status (9)

Country Link
US (2) US11155837B2 (zh)
EP (1) EP3596109A1 (zh)
CN (1) CN110621691A (zh)
AU (1) AU2018235765A1 (zh)
CA (1) CA3055612A1 (zh)
IL (1) IL269147A (zh)
RU (1) RU2019129161A (zh)
SG (1) SG11201908272UA (zh)
WO (1) WO2018169972A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11369920B2 (en) 2019-12-31 2022-06-28 Ingersoll-Rand Industrial U.S., Inc. Multi-mode air drying system
KR102339122B1 (ko) * 2020-03-11 2021-12-14 경희대학교 산학협력단 3-하이드록시부티레이트-4-하이드록시부티레이트 공중합체 생산용 형질전환 메탄자화균 및 이의 용도
WO2023052538A1 (en) * 2021-10-01 2023-04-06 Basf Se Biochemical pathway for the production of tulipalin a via itaconic acid

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009154683A1 (en) * 2008-05-28 2009-12-23 President And Fellows Of Harvard College Methane-powered microbial fuel cells
WO2014074886A1 (en) * 2012-11-09 2014-05-15 Calysta Energy, Inc. Compositions and methods for biological production of fatty acid derivatives
EP2738247A1 (en) * 2011-07-29 2014-06-04 Mitsui Chemicals, Inc. Microorganism having carbon dioxide fixation pathway introduced thereinto
WO2016165025A1 (en) * 2015-04-16 2016-10-20 National Research Council Of Canada Genetically engineered c1-utilizing microorganisms and processes for their production and use

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090029708A (ko) 2006-05-19 2009-03-23 엘에스9, 인코포레이티드 지방산 및 이의 유도체의 제조
KR100835476B1 (ko) 2006-12-29 2008-06-09 주식회사 효성 1,4-부탄디올로부터 테트라하이드로퓨란의 제조방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009154683A1 (en) * 2008-05-28 2009-12-23 President And Fellows Of Harvard College Methane-powered microbial fuel cells
EP2738247A1 (en) * 2011-07-29 2014-06-04 Mitsui Chemicals, Inc. Microorganism having carbon dioxide fixation pathway introduced thereinto
WO2014074886A1 (en) * 2012-11-09 2014-05-15 Calysta Energy, Inc. Compositions and methods for biological production of fatty acid derivatives
WO2016165025A1 (en) * 2015-04-16 2016-10-20 National Research Council Of Canada Genetically engineered c1-utilizing microorganisms and processes for their production and use

Also Published As

Publication number Publication date
EP3596109A1 (en) 2020-01-22
US11155837B2 (en) 2021-10-26
SG11201908272UA (en) 2019-10-30
IL269147A (en) 2019-11-28
RU2019129161A (ru) 2021-04-14
US20200040366A1 (en) 2020-02-06
WO2018169972A1 (en) 2018-09-20
RU2019129161A3 (zh) 2021-07-20
US20220064677A1 (en) 2022-03-03
CA3055612A1 (en) 2018-09-20
AU2018235765A1 (en) 2019-09-26

Similar Documents

Publication Publication Date Title
KR102525517B1 (ko) C1 탄소로부터 2,3-부탄디올 및 그의 유도체의 제조를 위한 방법 및 미생물
US20220064677A1 (en) Methods and microorganisms for making 1,4-butanediol and derivatives thereof from c1 carbons
US11905513B2 (en) Advanced genome editing
AU2023266388A1 (en) Methods and microorganisms for the fermentation of methane to multi-carbon compounds
KR101954530B1 (ko) 메탄을 이용하여 숙신산을 생성하는 재조합 미생물 및 이의 용도
JP7252536B2 (ja) ポリリジン生産菌及びそれを用いるポリリジン製造方法
CN112410353B (zh) 一种fkbS基因、含其的基因工程菌及其制备方法和用途
RU2817144C2 (ru) Способы и микроорганизмы для получения 2,3-бутандиола и его производных из c1-углеродных соединений
EP3802783A1 (en) Microorganisms and the production of fine chemicals
KR20200023450A (ko) 기능적 dna 서열의 안정화된 카피 수를 갖는 미생물 및 관련 방법
US11873523B2 (en) Aconitic acid exporter (aexA) increases organic acid production in Aspergillus
EP1231266A1 (en) Arabidopsis-origin gdp-4-keto-6-deoxy-d-mannose-3,5-epimerase-4-reductase gene
NL2023169B1 (en) Biotin prototrophy
CN115873880A (zh) 重组核酸序列、重组表达载体以及基因工程菌
WO2010036880A2 (en) Selection system for di-iron [fefe] hydrogenase properties
KR20200009462A (ko) 레귤론 변이를 통한 지방산 및 지방산 유도체 생산에서 불포화도 감소

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination