CN116783281A - 用于制备酰胺化合物的方法和组合物 - Google Patents

用于制备酰胺化合物的方法和组合物 Download PDF

Info

Publication number
CN116783281A
CN116783281A CN202280009979.1A CN202280009979A CN116783281A CN 116783281 A CN116783281 A CN 116783281A CN 202280009979 A CN202280009979 A CN 202280009979A CN 116783281 A CN116783281 A CN 116783281A
Authority
CN
China
Prior art keywords
leu
microbial organism
ala
naturally occurring
gly
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280009979.1A
Other languages
English (en)
Inventor
H·纳加拉扬
T·H·杨
A·胡达亚里
S·巴汉
S·加塔克
N·伊克利
A·沙阿
J·沙阿
B·张
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Genomatica Inc
Original Assignee
Genomatica Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Genomatica Inc filed Critical Genomatica Inc
Publication of CN116783281A publication Critical patent/CN116783281A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/005Amino acids other than alpha- or beta amino acids, e.g. gamma amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli

Landscapes

  • Genetics & Genomics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明公开生物合成方法和经工程改造的微生物,其增强或改良6‑氨基己酸酯、己二胺、己酸、己内酯或己内酰胺的生物合成。所述经工程改造的微生物被修饰成包括例如6‑氨基己酸酯的上调的和/或外源转运体、6‑氨基己酸酯的缺失和/或下调的输入物、上调的和/或外源的谷氨酸脱氢酶,以及/或rcsA和/或cpsBG的缺失和/或下调。其它经工程改造的微生物可以具有6‑氨基己酸酯的内源性转运体的破坏。

Description

用于制备酰胺化合物的方法和组合物
对序列表、表格或计算机程序的引用
序列表的正式拷贝通过EFS-Web以ASCII格式的文本文件与说明书同时提交,文件名为“GMTA048_ST25.txt”,创建日期为2022年1月14日且大小为212千字节。通过EFS-Web提交的序列表是说明书的一部分,并且以全文引用的方式并入本文中。
背景技术
尼龙是一种聚酰胺,其可以通过二胺与二羧酸的缩合聚合或内酰胺的缩合聚合来合成。尼龙6,6是由己二胺(HMD)与己二酸的反应产生,而尼龙6是由己内酰胺的开环聚合产生。因此,己二酸、己二胺和己内酰胺是尼龙制备中的重要中间物。
已对微生物进行工程改造以产生一些尼龙中间物。然而,作为对途径中间物和最终产物的不合需要的酶活性的结果,经工程改造的微生物会产生不合需要的副产物。因此,这类副产物和杂质增加生物合成化合物的成本和复杂度并且会降低所需产物的有效性或产率。
发明内容
本文中提供非天然存在的微生物有机体,其具有6-氨基己酸途径、己内酰胺途径、己二胺途径、己内酯途径、1,6-己二醇途径或这些途径中的一或多种的组合。所述非天然存在的微生物有机体可以包含至少一种编码外源转运体的外源核酸,所述外源转运体输出6-氨基己酸、己内酰胺、己二胺、己内酯和/或己二醇。所述非天然存在的微生物有机体可以包含内源转运体的破坏,所述内源转运体将6-氨基己酸、己内酰胺、己二胺、己内酯和/或己二醇输入细胞。所述非天然存在的微生物有机体可以包含至少一种编码外源谷氨酸脱氢酶(例如,gdhA或其同源物,EC编号1.4.1.4)的外源核酸。所述非天然存在的微生物有机体可以包含内源基因的破坏,所述内源基因的产物与粘液表型有关。非天然存在的微生物可以包括中的破坏,其减少与6-氨基己酸、己内酰胺、己二胺、己内酯和/或1,6-己二醇的产生就碳进行竞争的中间物和/或产物的产生。将这些变化中的一或多种引入具有产生6-氨基己酸、己内酰胺、己二胺、己内酯和/或1,6-己二醇的途径的非天然存在的微生物细胞可以增加6-氨基己酸、己内酰胺、己二胺、己内酯和/或1,6-己二醇的产生。非天然存在的微生物可以包含上文或下文所描述的经工程改造的变化中的一或多种。
输出6-氨基己酸的外源转运体可以是例如表16中的转运体。非天然存在的微生物有机体可以包含编码以下中的一或多个的外源核酸:SEQ ID NO:1、3、17、19、21、23、25、27、29、31、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91和/或93。将6-氨基己酸输入细胞的内源转运体可以是例如gabP或其同源物,和/或csiR或其同源物。非天然存在的微生物有机体可以包含内源gabP或其同源物、csiR或其同源物或这两者的破坏。外源谷氨酸脱氢酶可以是例如任何满足以下条件的谷氨酸脱氢酶(例如,表17,诸如gdhA或其同源物,EC编号1.4.1.4):由α-酮戊二酸产生谷氨酸并且其谷氨酸产物可以用于用以产生6-氨基己酸、己内酰胺和/或己二胺的途径中的转氨基反应(transmination reaction)。非天然存在的微生物有机体可以包含编码一或多种谷氨酸脱氢酶(例如,表17,诸如gdhA或其同源物)的外源核酸。产物与粘液表型有关的内源基因可以包括例如rcsA或其同源物,或cpsB或其同源物(EC编号2.7.7.13或2.7.7.22),或cpsG或其同源物(EC编号5.4.2.8),或cpsBGrcsA或其同源物,或cpsB或其同源物,或cpsG或其同源物,或cpsBG。非天然存在的微生物有机体可以包含以下中的破坏:rcsA或其同源物,或cpsB或其同源物,或cpsG或其同源物,或cpsBG rcsA或其同源物,或cpsB或其同源物,或cpsG或其同源物,或cpsBG,或前述各者的任何组合。
减少就碳进行竞争的中间物和/或产物的产生的破坏可以包括例如用于产生己二酸(例如,sad或其同源物、gabD或其同源物和/或ybfF或其同源物中的破坏)、6-羟基己酸(例如,yghD或其同源物、yjgB或其同源物和/或yahK或其同源物中的破坏)和/或γ-氨基丁酸(例如,gabT或其同源物中的破坏)的途径中的破坏。
非天然存在的微生物有机体可以包含:用于产生6-氨基己酸的途径;编码ybjE或其同源物,和/或yhiM或其同源物,和/或谷氨酸脱氢酶(例如,gdhA或其同源物)的外源核酸;gabP或其同源物,和/或csiR或其同源物,和/或rcsA或其同源物,和/或cpsB或其同源物,和/或cpsG或其同源物,和/或cpsBG的破坏。非天然存在的微生物有机体可以包含:用于产生6-氨基己酸的途径;gabP或其同源物和rcsA或其同源物的破坏;以及编码ybjE或其同源物和谷氨酸脱氢酶(例如,gdhA或其同源物)的外源核酸。非天然存在的微生物有机体可以包含用于产生6-氨基己酸的途径,并且还可以包括用于产生己二酸、6-羟基己酸和/或γ-氨基丁酸的途径中的破坏。
非天然存在的微生物有机体可以包含足以产生对应产物的量的编码酶的外源核酸,所述酶是产生6-氨基己酸、1,6-己二醇、己内酯、己内酰胺、己二胺所必需的。在一些情况下,这些外源核酸中的一或多种可以对非天然存在的微生物有机体来说是异源的。
非天然存在的微生物有机体可以具有用于产生C6产物(例如,6-氨基己酸、己内酰胺、己二胺、己内酯、1,6-己二醇和/或己二酸)的途径。非天然存在的微生物有机体可以包含编码外源转运体的外源核酸,所述外源转运体输出C6产物。非天然存在的微生物有机体可以包含输入C6产物的内源转运体的一或多种破坏。非天然存在的微生物有机体可以包含rcsA和/或cpsBG的内源基因的破坏。非天然存在的微生物有机体可以包含途径中的破坏,所述途径产生与所需C6产物就碳进行竞争的中间物和产物。
非天然存在的微生物有机体可以具有用于产生C5-C14产物的途径。非天然存在的微生物有机体可以包含编码外源转运体的外源核酸,所述外源转运体输出C5-C14产物。非天然存在的微生物有机体可以包含输入C5-C14产物的内源转运体的一或多种破坏。非天然存在的微生物有机体可以包含内源rcsA和/或cpsBG的破坏。非天然存在的微生物有机体可以包含途径中的破坏,所述途径产生与所需C5-C14产物就碳进行竞争的中间物和产物。
还公开用于产生6-氨基己酸、己内酰胺和/或己二胺的方法。所述方法可以包括培养产生6-氨基己酸、己内酰胺和/或己二胺的非天然存在的微生物有机体,其中所述非天然存在的微生物有机体表达编码ybjE或其同源物,和/或yhiM或其同源物,和/或谷氨酸脱氢酶(例如,gdhA或其同源物)的外源核酸,和/或所述非天然存在的微生物有机体具有gabP或其同源物,和/或csiR或其同源物,和/或rcsA或其同源物,和/或cpsB或其同源物,和/或cpsG或其同源物,和/或cpsBG或其同源物的破坏,和/或所述非天然存在的微生物有机体具有就碳进行竞争的中间物和/或产物的破坏,包括例如用于产生己二酸(例如,sad或其同源物,gabD或其同源物和/或ybfF或其同源物中的破坏)、6-羟基己酸(例如,yghD或其同源物,yjgB或其同源物和/或yahK或其同源物中的破坏)和/或γ-氨基丁酸(例如,gabT或其同源物中的破坏)的途径中的破坏。所述方法包括将非天然存在的微生物有机体在用于产生6-氨基己酸、己内酰胺、己二胺的条件下培养足够的时间。
用于产生6-氨基己酸(6ACA)的方法可以包含将上文所描述的适当的非天然存在的微生物有机体在适用于产生6ACA的条件下培养足够的时间。所述方法可以进一步包括从微生物有机体、发酵液或这两者回收6ACA。
用于产生己二胺的方法包含将上文所描述的适当的非天然存在的微生物有机体在适用于产生己二胺的条件下培养足够的时间。所述方法可以进一步包括从微生物有机体、发酵液或这两者回收己二胺。非天然存在的微生物有机体可以包含二、三、四、五、六、七个或更多个各自编码己二胺途径酶的外源核酸序列。
还公开用于产生C6产物(例如,6-氨基己酸、己内酰胺、己二胺、己内酯、1,6-己二醇和/或己二酸)的方法。所述方法可以包括培养产生C6的非天然存在的微生物有机体,其中所述微生物有机体表达编码转运体的外源核酸,所述转运体输出C6产物,并且所述微生物有机体具有以下中的破坏:rcsA或其同源物,和/或cpsB或其同源物,和/或cpsG或其同源物,和/或cpsBG或其同源物,和/或将C6产物输入细胞的内源转运体,和/或用于产生与所需C6产物就碳进行竞争的中间物和/或产物的步骤。所述方法包括将非天然存在的微生物有机体在用于产生C6产物的条件下培养足够的时间。
用于产生6-氨基己酸、1,6-己二醇、己内酯、己内酰胺、己二胺的方法包含将上文公开的适当的非天然存在的微生物有机体在用于产生6-氨基己酸、1,6-己二醇、己内酯、己内酰胺、己二胺的条件下培养足够的时间。所述方法可以进一步包括从微生物有机体、发酵液或这两者回收6-氨基己酸、1,6-己二醇、己内酯、己内酰胺和/或己二胺。非天然存在的微生物有机体可以包含二、三、四、五、六或七个各自编码6-氨基己酸、1,6-己二醇、己内酯、己内酰胺、己二胺途径酶的外源核酸序列。
本文中公开用于产生所需C5-C14产物的方法。所述方法可以包括培养产生C5-C14的非天然存在的微生物有机体,其中所述微生物有机体表达编码转运体的外源核酸,所述转运体输出所需C5-C14产物,并且所述微生物有机体具有以下中的破坏:rcsA,和/或cpsBG,和/或将所需C5-C14产物输入细胞的内源转运体,和/或产生与所需C5-C14产物就碳进行竞争的中间物和/或产物的步骤。所述方法包括将非天然存在的微生物有机体在用于产生所需C5-C14产物的条件下培养足够的时间。
6-氨基己酸途径可以包含:(i)转胺酶,(ii)6-氨基己酸脱氢酶,或(iii)转胺酶和6-氨基己酸脱氢酶两者。非天然存在的微生物有机体可以进一步包含一或多种编码一或多种6-氨基己酸途径酶的其它外源核酸。编码一或多种6-氨基己酸途径酶的外源核酸可以对微生物有机体来说是异源的。
非天然存在的微生物有机体可以包含己二胺途径。己二胺途径可以包含(i)6-氨基己酰基CoA转移酶,(ii)6-氨基己酰基CoA合成酶,(iii)6-氨基己酰基CoA还原酶,(iv)己二胺转胺酶,(v)己二胺脱氢酶,(v)或酶(i)-(v)中的一或多种的组合。微生物有机体可以进一步包含一或多种编码一或多种己二胺途径酶的其它外源核酸。编码一或多种己二胺途径酶的外源核酸可以对微生物有机体来说是异源的。
非天然存在的微生物有机体可以包含己内酰胺途径。己内酰胺途径可以包括氨基水解酶。微生物有机体可以进一步包含一或多种编码氨基水解酶的其它外源核酸。编码氨基水解酶的外源核酸可以对微生物有机体来说是异源的。
非天然存在的微生物有机体可以包含1,6-己二醇途径。1,6-己二醇途径可以包含以下酶中的一或多种:6-氨基己酰基-CoA转移酶或合成酶,其催化6ACA转化成6-氨基己酰基-CoA;6-氨基己酰基-CoA还原酶,其催化6-氨基己酰基-CoA转化成6-氨基己酸酯半醛;6-氨基己酸酯半醛还原酶,其催化6-氨基己酸酯半醛转化成6-氨基己醇;6-氨基己酸酯还原酶,其催化6ACA转化成6-氨基己酸酯半醛;己二酰基-CoA还原酶,己二酰基-CoA至己二酸酯半醛;己二酸酯半醛还原酶,其催化己二酸酯半醛转化成6-羟基己酸酯;6-羟基己酰基-CoA转移酶或合成酶,其催化6-羟基己酸酯转化成6-羟基己酰基-CoA;6-羟基己酰基-CoA还原酶,其催化6-羟基己酰基-CoA转化成6-羟基己醛;6-羟基己醛还原酶,其催化6-羟基己醛转化成HDO;6-氨基己醇氨基转移酶或氧化还原酶,其催化6-氨基己醇转化成6-羟基己醛;6-羟基己酸酯还原酶,其催化6-羟基己酸酯转化成6-羟基己醛;己二酸酯还原酶,其催化ADA转化成己二酸酯半醛;以及己二酰基-CoA转移酶、水解酶或合成酶,其催化己二酰基-CoA转化成ADA。
非天然存在的微生物有机体可以包含从己二酸酯或己二酰基-CoA到己内酯的途径。这些从己二酸酯或己二酰基-CoA到己内酯的途径可以包含以下酶中的一或多种:己二酰基-CoA还原酶、己二酸酯半醛还原酶、6-羟基己酰基-CoA转移酶或合成酶、6-羟基己酰基-CoA环化酶或自发性环化、己二酸酯还原酶、己二酰基-CoA转移酶、合成酶或水解酶、6-羟基己酸酯环化酶、6-羟基己酸酯激酶、6-羟基己酰基磷酸盐环化酶或自发性环化、磷酸反-6-羟基己酰酶。
非天然存在的微生物有机体可以包含以下物种:不动杆菌属(Acinetobacter)、放线杆菌属(Actinobacillus)、厌氧螺菌属(Anaerobiospirillum)、曲霉菌属(Aspergillus)、芽孢杆菌属(Bacillus)、梭菌属(Clostridium)、棒状杆菌属(Corynebacterium)、埃希氏菌属(Escherichia)、葡糖杆菌属(Gluconobacter)、克雷伯氏菌(Klebsiella)、克鲁维酵母(Kluyveromyces)、乳球菌属(Lactococcus)、乳杆菌属(Lactobacillus)、曼氏杆菌属(Mannheimia)、毕赤酵母属(Pichia)、假单胞菌属(Pseudomonas)、根瘤菌属(Rhizobium)、根霉菌属(Rhizopus)、酵母菌属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、链霉菌属(Streptomyces)和发酵单胞菌属(Zymomonas)。非天然存在的微生物有机体可以是大肠杆菌(Escherichia.coli)菌株。
在一个方面中,本公开涉及非天然存在的微生物有机体,其包含用于产生6-氨基己酸的途径和编码6-氨基己酸的转运体的外源核酸,其中外源转运体将6-氨基己酸从细胞输出。
上文所描述的非天然存在的微生物有机体,其中非天然存在的生物体产生6-氨基己酸,并且其中由所述微生物有机体产生的6-氨基己酸与不具有所述外源核酸的微生物有机体相比得到增加。
上文所描述的非天然存在的微生物有机体,其中外源转运体是YbjE或其同源物。
上文所描述的非天然存在的微生物有机体,其中外源转运体是YhiM或其同源物。
上文所描述的非天然存在的微生物有机体,其进一步包含编码第二外源转运体的第二核酸,其中第二外源转运体是YhiM或其同源物。
上文所描述的非天然存在的微生物有机体,其中至少一种外源核酸是以染色体方式集成的。
上文所描述的非天然存在的微生物有机体,其中至少一种外源核酸是游离型。
上文所描述的非天然存在的微生物有机体,其中至少一种外源核酸过度表达6-氨基己酸的转运体。
上文所描述的非天然存在的微生物有机体,其进一步包含编码转运体的内源核酸的破坏,所述转运体将6-氨基己酸输入微生物有机体。
上文所描述的非天然存在的微生物有机体,其中具有破坏的转运体是gabP或其同源物。
上文所描述的非天然存在的微生物有机体,其中具有破坏的转运体是csiR或其同源物。
上文所描述的非天然存在的微生物有机体,其中具有破坏的转运体是csiR或其同源物。
上文所描述的非天然存在的微生物有机体,其进一步包含编码谷氨酸脱氢酶的第三外源核酸。
上文所描述的非天然存在的微生物有机体,其中谷氨酸脱氢酶是GdhA或其同源物。
上文所描述的非天然存在的微生物有机体,其中第三外源核酸是以染色体方式集成的。
上文所描述的非天然存在的微生物有机体,其中第三外源核酸是游离型。
上文所描述的非天然存在的微生物有机体,其中第三外源核酸过度表达谷氨酸脱氢酶。
上文所描述的非天然存在的微生物有机体,其进一步包含rcsA、cpsB、cpsG或cpsBG的破坏。
上文所描述的非天然存在的微生物有机体,其中所述破坏是rcsA或其同源物的破坏。
上文所描述的非天然存在的微生物有机体,其中所述破坏是cpsB或其同源物的破坏。
上文所描述的非天然存在的微生物有机体,其中所述破坏是cpsG或其同源物的破坏。
上文所描述的非天然存在的微生物有机体,其中所述破坏是cpsBG的破坏。
在一个方面中,本公开涉及非天然存在的微生物有机体,其包含用于产生6-氨基己酸的途径和具有破坏的基因,其中被破坏的基因编码6-氨基己酸的内源转运体,其中所述内源转运体将6-氨基己酸输入细胞。
上文所描述的非天然存在的微生物有机体,其中非天然存在的微生物有机体产生6-氨基己酸,且其中由所述微生物有机体产生的6-氨基己酸与不具有编码内源转运体的基因的破坏的微生物有机体相比得到增加。
上文所描述的非天然存在的微生物有机体,其中具有破坏的基因是gabP或其同源物。
上文所描述的非天然存在的微生物有机体,其中具有破坏的基因是csiR或其同源物。
上文所描述的非天然存在的微生物有机体,其进一步包含具有第二破坏的第二基因,其中所述第二基因是csiR或其同源物。
上文所描述的非天然存在的微生物有机体,其进一步包含编码谷氨酸脱氢酶的外源核酸。
上文所描述的非天然存在的微生物有机体,其中谷氨酸脱氢酶是GdhA或其同源物。
上文所描述的非天然存在的微生物有机体,其中外源核酸是以染色体方式集成的。
上文所描述的非天然存在的微生物有机体,其中外源核酸是游离型。
上文所描述的非天然存在的微生物有机体,其中外源核酸过度表达谷氨酸脱氢酶。
上文所描述的非天然存在的微生物有机体,其进一步包含rcsA、cpsB、cpsG或cpsBG的破坏。
上文所描述的非天然存在的微生物有机体,其中所述破坏是rcsA或其同源物的破坏。
上文所描述的非天然存在的微生物有机体,其中所述破坏是cpsB或其同源物的破坏。
上文所描述的非天然存在的微生物有机体,其中所述破坏是cpsG或其同源物的破坏。
上文所描述的非天然存在的微生物有机体,其中所述破坏是cpsBG的破坏。
在一个方面中,本公开涉及非天然存在的微生物有机体,其包含用于产生6-氨基己酸的途径和编码谷氨酸脱氢酶的外源核酸,其中至少一些由谷氨酸脱氢酶产生的谷氨酸被产生6-氨基己酸的转氨酶使用。
上文所描述的非天然存在的微生物有机体,其中谷氨酸脱氢酶是GdhA或其同源物。
上文所描述的非天然存在的微生物有机体,其中外源核酸是以染色体方式集成的。
上文所描述的非天然存在的微生物有机体,其中外源核酸是游离型。
上文所描述的非天然存在的微生物有机体,其中外源核酸过度表达谷氨酸脱氢酶。
上文所描述的非天然存在的微生物有机体,其进一步包含编码6-氨基己酸的转运体的第二外源核酸,其中所述转运体将6-氨基己酸从细胞输出。
上文所描述的非天然存在的微生物有机体,其中外源转运体是YbjE或其同源物。
上文所描述的非天然存在的微生物有机体,其中外源转运体是YhiM或其同源物。
上文所描述的非天然存在的微生物有机体,其进一步包含第三外源核酸,其中所述第三外源核酸编码YhiM或其同源物。
上文所描述的非天然存在的微生物有机体,其中第二外源核酸是以染色体方式集成的。
上文所描述的非天然存在的微生物有机体,其中第二外源核酸是游离型。
上文所描述的非天然存在的微生物有机体,其中第二外源核酸过度表达转运体。
上文所描述的非天然存在的微生物有机体,其进一步包含具有破坏的基因,其中所述基因编码6-氨基己酸的内源转运体,其中所述内源转运体将6-氨基己酸输入细胞。
上文所描述的非天然存在的微生物有机体,其中具有破坏的内源转运体是gabP或其同源物。
上文所描述的非天然存在的微生物有机体,其中具有破坏的内源转运体是csiR或其同源物。
上文所描述的非天然存在的微生物有机体,其中具有破坏的内源转运体是csiR或其同源物。
上文所描述的非天然存在的微生物有机体,其进一步包含rcsA、cpsB、cpsG或cpsBG的破坏。
上文所描述的非天然存在的微生物有机体,其中所述破坏是rcsA或其同源物的破坏。
上文所描述的非天然存在的微生物有机体,其中所述破坏是cpsB或其同源物的破坏。
上文所描述的非天然存在的微生物有机体,其中所述破坏是cpsG或其同源物的破坏。
上文所描述的非天然存在的微生物有机体,其中所述破坏是cpsBG的破坏。
在一个方面中,本公开涉及非天然存在的微生物有机体,其包含用于产生6-氨基己酸的途径和rcsA、cpsB、cpsG或cpsBG的破坏,其中rcsA、cpsB、cpsG或cpsBG的破坏减少微生物有机体的粘液表型。
上文所描述的非天然存在的微生物有机体,其中与不具有破坏的非天然存在的微生物有机体相比,th3破坏增加6-氨基己酸的产生。
上文所描述的非天然存在的微生物有机体,其中所述破坏是rcsA或其同源物的破坏。
上文所描述的非天然存在的微生物有机体,其中所述破坏是cpsB或其同源物的破坏。
上文所描述的非天然存在的微生物有机体,其中所述破坏是cpsG或其同源物的破坏。
上文所描述的非天然存在的微生物有机体,其中所述破坏是cpsBG的破坏。
上文所描述的非天然存在的微生物有机体,其进一步包含编码6-氨基己酸的转运体的外源核酸,其中外源转运体将6-氨基己酸从细胞输出。
上文所描述的非天然存在的微生物有机体,其中转运体是YbjE或其同源物。
上文所描述的非天然存在的微生物有机体,其中转运体是YhiM。
上文所描述的非天然存在的微生物有机体,其进一步包含编码YhiM或其同源物的第二核酸。
上文所描述的非天然存在的微生物有机体,其中外源核酸是以染色体方式集成的。
上文所描述的非天然存在的微生物有机体,其中外源核酸是游离型。
上文所描述的非天然存在的微生物有机体,其中外源核酸过度表达转运体。
上文所描述的非天然存在的微生物有机体,其进一步包含编码转运体的基因的破坏,其中所述转运体将6-氨基己酸输入微生物有机体。
上文所描述的非天然存在的微生物有机体,其中所述破坏是在gabP或其同源物中。
上文所描述的非天然存在的微生物有机体,其中所述破坏是在csiR或其同源物中。
上文所描述的非天然存在的微生物有机体,其进一步包含csiR或其同源物中的第二破坏。
上文所描述的非天然存在的微生物有机体,其进一步包含编码谷氨酸脱氢酶的外源核酸。
上文所描述的非天然存在的微生物有机体,其中谷氨酸脱氢酶是GdhA或其同源物。
上文所描述的非天然存在的微生物有机体,其中外源核酸是以染色体方式集成的。
上文所描述的非天然存在的微生物有机体,其中外源核酸是游离型。
上文所描述的非天然存在的微生物有机体,其中外源核酸过度表达谷氨酸脱氢酶。
在一个方面中,本公开涉及非天然存在的微生物有机体,其包含用于产生C6产物的途径,其中所述非天然存在的微生物有机体包含编码C6产物的转运体的外源核酸,其中所述转运体将C6产物从细胞输出。
上文所描述的非天然存在的微生物有机体,其中由所述微生物有机体产生的C6产物与不具有所述外源核酸的非天然存在的微生物有机体相比得到增加。
上文所描述的非天然存在的微生物有机体,其中外源核酸是以染色体方式集成的。
上文所描述的非天然存在的微生物有机体,其中外源核酸是游离型。
上文所描述的非天然存在的微生物有机体,其中外源核酸过度表达转运体。
上文所描述的非天然存在的微生物有机体,其进一步包含编码转运体的基因的破坏,所述转运体将C6产物输入微生物有机体。
根据技术方案86所述的非天然存在的微生物有机体,其进一步包含rcsA、cpsB、cpsG或cpsBG的破坏。
上文所描述的非天然存在的微生物有机体,其进一步包含rcsA或其同源物的破坏。
上文所描述的非天然存在的微生物有机体,其进一步包含cpsBG的破坏。
上文所描述的非天然存在的微生物有机体,其进一步包含cpsB或其同源物的破坏。
上文所描述的非天然存在的微生物有机体,其进一步包含cpsG或其同源物的破坏。
在一个方面中,本公开涉及非天然存在的微生物有机体,其包含用于产生C5-C14产物的途径和编码C5至C14产物的转运体的外源核酸,其中所述转运体将C5-C14产物从细胞输出。
上文所描述的非天然存在的微生物有机体,其中由所述微生物有机体产生的C5-C14产物与不具有所述外源核酸的非天然存在的微生物有机体相比得到增加。
上文所描述的非天然存在的微生物有机体,其中外源核酸是以染色体方式集成的。
上文所描述的非天然存在的微生物有机体,其中外源核酸是游离型。
上文所描述的非天然存在的微生物有机体,其中外源核酸过度表达转运体。
上文所描述的非天然存在的微生物有机体,其进一步包含编码转运体的基因的破坏,所述转运体将C5-C14产物输入微生物有机体。
上文所描述的非天然存在的微生物有机体,其进一步包含rcsA、cpsB、cpsG或cpsBG的破坏。
上文所描述的非天然存在的微生物有机体,其进一步包含rcsA或其同源物的破坏。
上文所描述的非天然存在的微生物有机体,其进一步包含cpsBG的破坏。
上文所描述的非天然存在的微生物有机体,其进一步包含cpsB或其同源物的破坏。
上文所描述的非天然存在的微生物有机体,其进一步包含cpsG或其同源物的破坏。
上文所描述的非天然存在的微生物有机体,其中由所述微生物有机体产生的6-氨基己酸与不具有编码谷氨酸脱氢酶的外源核酸的非天然存在的微生物相比得到增加。
在一个方面中,本公开涉及用于产生6-氨基己酸的方法,其包含以下步骤:提供根据技术方案1所述的非天然存在的微生物有机体;和在培养基中在产生6-氨基己酸的条件下培养所述非天然存在的微生物有机体。
上文所描述的方法,其进一步包含将6-氨基己酸从微生物有机体转运到培养基中的步骤。
上文所描述的方法,其中所述外源核酸是以染色体方式集成的。
上文所描述的方法,其中所述外源核酸是游离型。
上文所描述的方法,其中所述外源核酸过度表达转运体。
上文所描述的方法,其中所述外源核酸编码YbjE或其同源物,或YhiM或其同源物。
上文所描述的方法,其中所述非天然存在的微生物有机体进一步包含编码转运体的基因的破坏,所述转运体将6-氨基己酸输入微生物有机体。
上文所描述的方法,其中所述基因是gabP或csiR。
上文所描述的方法,其中所述非天然存在的微生物有机体进一步包含编码谷氨酸脱氢酶的外源核酸。
上文所描述的方法,其中编码谷氨酸脱氢酶的外源核酸是以染色体方式集成的。
上文所描述的方法,其中编码谷氨酸脱氢酶的外源核酸是游离型。
上文所描述的方法,其中编码谷氨酸脱氢酶的外源核酸过度表达谷氨酸脱氢酶。
上文所描述的方法,其中谷氨酸脱氢酶是GdhA或其同源物。
上文所描述的方法,其中所述非天然存在的微生物有机体进一步包含rcsA、cpsB、cpsG或cpsBG的破坏。
上文所描述的方法,其中外源转运体是ybjE,且其中非天然存在的微生物有机体进一步包含gabP的破坏、rcsA的破坏和编码外源谷氨酸脱氢酶的基因。
在一个方面中,本公开涉及用于产生6-氨基己酸的方法,其包含以下步骤:获得根据技术方案23所述的非天然存在的微生物有机体;在培养基中在产生6-氨基己酸的条件下培养所述非天然存在的微生物有机体。
上文所描述的方法,其中被破坏的基因是gabP或csiR。
上文所描述的方法,其中所述非天然存在的微生物有机体进一步包含编码谷氨酸脱氢酶的外源核酸。
上文所描述的方法,其中编码谷氨酸脱氢酶的外源核酸是以染色体方式集成的。
上文所描述的方法,其中编码谷氨酸脱氢酶的外源核酸是游离型。
上文所描述的方法,其中编码谷氨酸脱氢酶的外源核酸过度表达谷氨酸脱氢酶。
上文所描述的方法,其中谷氨酸脱氢酶是GdhA。
上文所描述的方法,其中所述非天然存在的微生物有机体进一步包含rcsA、cpsB、cpsG或cpsBG的破坏。
上文所描述的方法,其中具有破坏的转运体是gabP,且其中非天然存在的微生物有机体进一步包含rcsA的破坏和编码外源谷氨酸脱氢酶的基因。
在一个方面中,本公开涉及用于产生6-氨基己酸的方法,其包含以下步骤:提供根据技术方案38所述的非天然存在的微生物有机体;在培养基中在产生6-氨基己酸的条件下培养所述非天然存在的微生物有机体;以及将6-氨基己酸从微生物有机体转运到培养基中。
上文所描述的方法,其中编码谷氨酸脱氢酶的外源核酸是以染色体方式集成的。
上文所描述的方法,其中编码谷氨酸脱氢酶的外源核酸是游离型。
上文所描述的方法,其中编码谷氨酸脱氢酶的外源核酸过度表达谷氨酸脱氢酶。
上文所描述的方法,其中谷氨酸脱氢酶是GdhA或其同源物。
上文所描述的方法,其中所述非天然存在的微生物有机体进一步包含编码6-氨基己酸的转运体的外源核酸,其中所述转运体将6-氨基己酸从细胞输出。
上文所描述的方法,其中所述外源核酸是以染色体方式集成的。
上文所描述的方法,其中所述外源核酸是游离型。
上文所描述的方法,其中所述外源核酸过度表达转运体。
上文所描述的方法,其中所述外源核酸编码YbjE或其同源物,或YhiM或其同源物。
上文所描述的方法,其中所述非天然存在的微生物有机体进一步包含转运体的破坏,所述转运体将6-氨基己酸输入微生物有机体。
上文所描述的方法,其中被破坏的基因是gabP或其同源物,或csiR或其同源物。
上文所描述的方法,其中所述非天然存在的微生物有机体进一步包含rcsA、cpsB、cpsG或cpsBG的破坏。
上文所描述的方法,其中所述非天然存在的微生物有机体进一步包含gabP的破坏、rcsA的破坏和编码YbjE的外源核酸。
在一个方面中,本公开涉及用于产生6-氨基己酸的方法,其包含以下步骤:提供根据技术方案60所述的非天然存在的微生物有机体;在培养基中在产生6-氨基己酸的条件下培养所述非天然存在的微生物有机体;以及将6-氨基己酸从微生物有机体转运到培养基中。
上文所描述的方法,其中非天然存在的微生物有机体进一步包含至少一种编码6-氨基己酸的转运体的外源核酸,其中外源转运体将6-氨基己酸从细胞输出。
上文所描述的方法,其中所述外源核酸是以染色体方式集成的。
上文所描述的方法,其中所述外源核酸是游离型。
上文所描述的方法,其中所述外源核酸过度表达转运体。
上文所描述的方法,其中所述外源核酸编码YbjE或其同源物,或YhiM或其同源物。
上文所描述的方法,其中所述非天然存在的微生物有机体进一步包含编码转运体的基因的破坏,所述转运体将6-氨基己酸输入微生物有机体。
上文所描述的方法,其中所述基因是gabP或其同源物,或csiR或其同源物。
上文所描述的方法,其中所述非天然存在的微生物有机体进一步包含外源谷氨酸脱氢酶。
上文所描述的方法,其中编码谷氨酸脱氢酶的外源核酸是以染色体方式集成的。
上文所描述的方法,其中编码谷氨酸脱氢酶的外源核酸是游离型。
上文所描述的方法,其中编码谷氨酸脱氢酶的外源核酸过度表达谷氨酸脱氢酶。
上文所描述的方法,其中谷氨酸脱氢酶是GdhA或其同源物。
在一个方面中,本公开涉及用于产生C6产物的方法,其包含以下步骤:提供根据技术方案82所述的非天然存在的微生物有机体;在培养基中在产生C6产物的条件下培养所述非天然存在的微生物有机体;以及将C6产物从微生物有机体转运到培养基中。
上文所描述的方法,其中所述非天然存在的微生物有机体进一步包含转运体的破坏,所述转运体将C6产物输入微生物有机体。
上文所描述的方法,其中所述非天然存在的微生物有机体进一步包含rcsA、cpsB、cpsG或cpsBG的破坏。
在一个方面中,本公开涉及用于产生C5-C14产物的方法,其包含以下步骤:提供根据技术方案93所述的非天然存在的微生物有机体;在培养基中在产生C5-C14产物的条件下培养所述非天然存在的微生物有机体;以及将C5-C14产物从微生物有机体转运到培养基中。
上文所描述的方法,其中所述非天然存在的微生物有机体进一步包含转运体的破坏,所述转运体将C6产物输入微生物有机体。
上文所描述的方法,其中所述非天然存在的微生物有机体进一步包含rcsA、cpsB、cpsG或cpsBG的破坏。
附图说明
图1展示从丁二酰基-CoA和乙酰基-CoA到6-氨基己酸酯、己二胺(HMDA)和己内酰胺的例示性途径。酶表示如下:A)3-氧代己二酰基-CoA硫解酶,B)3-氧代己二酰基-CoA还原酶,C)3-羟基己二酰基-CoA脱水酶,D)5-羧基-2-戊烯酰基-CoA还原酶,E)3-氧代己二酰基-CoA/酰基-CoA转移酶,F)3-氧代己二酰基-CoA合成酶,G)3-氧代己二酰基-CoA水解酶,H)3-氧代己二酸酯还原酶,I)3-羟基己二酸酯脱水酶,J)5-羧基-2-戊烯酸酯还原酶,K)己二酰基-CoA/酰基-CoA转移酶,L)己二酰基-CoA合成酶,M)己二酰基-CoA水解酶,N)己二酰基-CoA还原酶(醛形成),O)6-氨基己酸酯转氨酶,P)6-氨基己酸酯脱氢酶,Q)6-氨基己酰基-CoA/酰基-CoA转移酶,R)6-氨基己酰基-CoA合成酶,S)酰胺基水解酶,T)自发性环化,U)6-氨基己酰基-CoA还原酶(醛形成),V)HMDA转氨酶,W)HMDA脱氢酶,X)己二酸酯还原酶,Y)己二酸酯激酶,Z)己二酰基磷酸酯还原酶。
图2A展示从丁二酰基-CoA和乙酰基-CoA到被输出的6-氨基己酸的例示性途径。图2B和2C分别展示6-氨基己酸的产生和外源谷氨酸脱氢酶的表达的条形图和曲线图。在图2B中,从左侧开始的第一条柱是对照物;从左侧开始的第二条柱是lof GDH表达;从左侧开始的第三条柱是GDH的中等表达;并且从左侧开始的第四条柱是GDH的高表达。在图2C中,上面的线是中等GDH表达;中间的线是高GDH表达;并且最下面的线是对照物。
图3展示使用赖氨酸作为起始点来合成6-氨基己酸和己二酸酯的例示性途径。
图4展示使用己二酰基-CoA作为起始点的例示性己内酰胺合成途径。
图5展示从丙酮酸酯和丁二酸半醛到6-氨基己酸酯的例示性途径。酶是A)HODH醛缩酶,B)OHED水合酶,C)OHED还原酶,D)2-OHD脱羧酶,E)己二酸酯半醛氨基转移酶和/或己二酸酯半醛氧化还原酶(胺化),F)OHED脱羧酶,G)6-OHE还原酶,H)2-OHD氨基转移酶和/或2-OHD氧化还原酶(胺化),I)2-AHD脱羧酶,J)OHED氨基转移酶和/或OHED氧化还原酶(胺化),K)2-AHE还原酶,L)HODH甲酸酯-裂解酶和/或HODH脱氢酶,M)3-羟基己二酰基-CoA脱水酶,N)2,3-脱氢己二酰基-CoA还原酶,O)己二酰基-CoA脱氢酶,P)OHED甲酸酯-裂解酶和/或OHED脱氢酶,Q)2-OHD甲酸酯-裂解酶和/或2-OHD脱氢酶。缩写是:HODH=4-羟基-2-氧代庚烷-1,7-二酸酯,OHED=2-氧代庚-4-烯-1,7-二酸酯,2-OHD=2-氧代庚烷-1,7-二酸酯,2-AHE=2-氨基庚-4-烯-1,7-二酸酯,2-AHD=2-氨基庚烷-1,7-二酸酯,并且6-OHE=6-氧代己-4-烯酸酯。
图6展示从6-氨基己酸酯到己二胺的例示性途径。酶是A)6-氨基己酸酯激酶,B)6-AHOP氧化还原酶,C)6-氨基己酸半醛氨基转移酶和/或6-氨基己酸半醛氧化还原酶(胺化),D)6-氨基己酸酯N-乙酰基转移酶,E)6-乙酰胺基己酸酯激酶,F)6-AAHOP氧化还原酶,G)6-乙酰胺基己醛氨基转移酶和/或6-乙酰胺基己醛氧化还原酶(胺化),H)6-乙酰胺基己胺N-乙酰基转移酶和/或6-乙酰胺基己胺水解酶(酰胺),I)6-乙酰胺基己酸酯CoA转移酶和/或6-乙酰胺基己酸酯CoA连接酶,J)6-乙酰胺基己酰基-CoA氧化还原酶,K)6-AAHOP酰基转移酶,L)6-AHOP酰基转移酶,M)6-氨基己酸酯CoA转移酶和/或6-氨基己酸酯CoA连接酶,N)6-氨基己酰基-CoA氧化还原酶。缩写是:6-AAHOP=[(6-乙酰胺基己酰基)氧基]膦酸酯,并且6-AHOP=[(6-氨基己酰基)氧基]膦酸酯。
图7展示产生1,6-己二醇的例示性生物合成途径。A)是6-氨基己酰基-CoA转移酶或合成酶,其催化6ACA转化成6-氨基己酰基-CoA;B)是6-氨基己酰基-CoA还原酶,其催化6-氨基己酰基-CoA转化成6-氨基己酸酯半醛;C)是6-氨基己酸酯半醛还原酶,其催化6-氨基己酸酯半醛转化成6-氨基己醇;D)是6-氨基己酸酯还原酶,其催化6ACA转化成6-氨基己酸酯半醛;E)是己二酰基-CoA还原酶,己二酰基-CoA至己二酸酯半醛;F)是己二酸酯半醛还原酶,其催化己二酸酯半醛转化成6-羟基己酸酯;G)是6-羟基己酰基-CoA转移酶或合成酶,其催化6-羟基己酸酯转化成6-羟基己酰基-CoA;H)是6-羟基己酰基-CoA还原酶,其催化6-羟基己酰基-CoA转化成6-羟基己醛;I)是6-羟基己醛还原酶,其催化6-羟基己醛转化成HDO;J)是6-氨基己醇氨基转移酶或氧化还原酶,其催化6-氨基己醇转化成6-羟基己醛;K)是6-羟基己酸酯还原酶,其催化6-羟基己酸酯转化成6-羟基己醛;L)是己二酸酯还原酶,其催化ADA转化成己二酸酯半醛;并且M)是己二酰基-CoA转移酶、水解酶或合成酶,其催化己二酰基-CoA转化成ADA。
图8展示从己二酸酯或己二酰基-CoA到己内酯的例示性途径。酶是A.己二酰基-CoA还原酶,B.己二酸酯半醛还原酶,C.6-羟基己酰基-CoA转移酶或合成酶,D.6-羟基己酰基-CoA环化酶或自发性环化,E.己二酸酯还原酶,F.己二酰基-CoA转移酶、合成酶或水解酶,G.6-羟基己酸酯环化酶,H.6-羟基己酸酯激酶,I.6-羟基己酰基磷酸酯环化酶或自发性环化,J.磷酸反-6-羟基己酰酶。
图9A展示与具有野生型speAB的菌株相比,具有ΔspeAB的菌株中的副产物的比率。图9B展示与具有野生型speAB的菌株相比,具有ΔspeAB的菌株中的副产物的滴定度。
具体实施方式
应理解,本公开的教示不限于所描述的具体实施例,并且因此当然可以变化。还应理解,本文中所使用的术语仅出于描述具体范例的目的,并且不意图是限制性的,因为本发明的教示的范围将仅由随附权利要求书限定。
除非另有定义,否则本文中所用的所有技术和科学术语皆具有与所属领域的一般技术人员通常所理解相同的含义。与本文所描述的方法、装置和材料类似或等效的任何方法、装置和材料皆可以用于实践本发明。提供以下定义以有助于理解本文中频繁使用的某些术语,且不意谓限制本公开的范围。本文中所提及的所有文献(例如,专利申请案或专利案)皆以全文引用的方式并入。
必须注意,除非上下文另外明确规定,否则如本文和随附权利要求书中所用的单数形式“一(a)”、“一(an)”以及“所述”包括多个指示物。还应注意,权利要求可撰写为排除任何任选的要素。因此,此陈述意图充当结合权利要求要素的叙述使用如“单独(solely)”、“仅(only)”等排他性术语或使用“否定型(negative)”限制的前置基础。除非上下文另外明确规定,否则关于物质的浓度或水平给出的数字限制是近似的。因此,当浓度指示为(例如)10μg时,意在将所述浓度理解为至少大约或约10μg。
如所属领域的技术人员在阅读本公开后将显而易见的是,本文中所描述和说明的各个范例中的每一个皆具有离散的组分和特征,所述组分和特征可以在不偏离本发明的教示的范围或精神的情况下容易地与任何其它若干范例的特征分离或组合。任何所叙述的方法都可以按所叙述的事件的次序或按逻辑上可能的任何其它次序来进行。
可以使用图1中所描述的途径生物合成例示性酰胺化合物,例如尼龙中间物。可以在经基因修饰的细胞,诸如本文中所描述的细胞(例如,非天然存在的微生物)中提供图1中的途径。经工程改造的细胞可以包括至少一种编码途径酶的外源核酸,所述途径酶以足以产生6-氨基己酸、己内酰胺和/或己二胺的量被表达。
经工程改造的途径可以是如图1中所阐述的HMD途径。可以在本文中所描述的经基因修饰的细胞(例如,非天然存在的微生物)中提供HMD途径,其中HMD途径包括至少一种编码HMD途径酶的外源核酸,所述HMD途径酶以足以产生HMD的量被表达。酶可以包括1A是3-氧代己二酰基-CoA硫解酶;1B是3-氧代己二酰基-CoA还原转氨酶;1C是3-羟基己二酰基-CoA脱水转氨酶;1D是己二酸酯半醛还原转氨酶;1E是3-氧代己二酰基-CoA/酰基-CoA转移酶;1F是3-氧代己二酰基-CoA合成酶;1G是3-氧代己二酰基-CoA水解酶;1H是3-氧代己二酸酯还原转氨酶;1I是3-羟基己二酸脱水转氨酶;1J是5-羧基-2-戊烯酸酯还原转氨酶;1K是己二酰基-CoA/酰基-CoA转移酶;1L是己二酰基-CoA合成酶;1M是己二酰基-CoA水解酶;1N是己二酰基-CoA还原转氨酶(醛形成);1O是6-氨基己酸酯转氨酶;1P是6-氨基己酸酯脱氢酶;1Q是6-氨基己酰基-CoA/酰基-CoA转移酶;1R是6-氨基己酰基-CoA合成酶;1S是酰胺基水解酶;1T是自发性环化;1U是6-氨基己酰基-CoA还原转氨酶(醛形成);1V是HMDA转氨酶;并且1W是HMDA脱氢酶。
参考图1,非天然存在的微生物可以具有以下途径中的一或多个:ABCDNOPQRUVW;ABCDNOPQRT;或:ABCDNOPS。其它能够产生己二酸酯半醛的例示性途径包括美国专利案第8,377,680号中所描述的途径,其以全文引用的方式并入本文中。
图1还展示通过转移酶或合成酶从6-氨基己酸酯产生6-氨基己酰基-CoA(图1,步骤Q或R),接着进行6-氨基己酰基-CoA的自发性环化以形成己内酰胺(图1,步骤T)的途径。也可以将6-氨基己酸酯活化成6-氨基己酰基-CoA(图1,步骤Q或R),接着进行还原(图1,步骤U)和胺化(图1,步骤V或W)以形成HMDA。可以将6-氨基己酸活化成6-氨基己酰基-磷酸酯而不是6-氨基己酰基-CoA。6-氨基己酰基-磷酸酯可以自发地环化以形成己内酰胺。可以将6-氨基己酰基-磷酸酯还原成6-氨基己酸酯半醛,其接着可以如图1中所描绘转化成HMDA。
本文中所描述的非天然存在的微生物有机体可以包括转运体的工程改造,包括例如对微生物有机体进行工程改造以增加所需产物的输出。也可以对微生物有机体进行工程改造以减少所需产物的输入。微生物有机体中的这类转运体的工程改造可以增加微生物有机体中所需产物的产生。从微生物有机体输出(或分泌)所需产物和/或抑制所需产物输入微生物有机体可以通过降低微生物有机体中的产物浓度,允许微生物细胞中更多的反应物变成产物来增加产物形成。所需产物的产生也可以通过增加用于所需产物的反应物和/或中间物的输入(和/或减少其输出)来增加。所需产物的产生也可以通过增加由所需产物制得的产物(使用所需产物作为反应物或中间物的产物)的输入(和/或减少其输出)来增加。所需产物的产生可以通过减少与产生所需产物的途径就碳进行竞争的中间物和产物的产生来增加。
如下文在实例2中所描述,6-氨基己酸的产生受到从微生物有机体分泌/输出6-氨基己酸的限制。当微生物有机体被工程改造成增加6-氨基己酸的输出(分泌)时,从微生物有机体获得的以每个细胞单元计的6-氨基己酸的量增加。举例来说,当微生物有机体被工程化成由大肠杆菌(E.coli)表达6-氨基己酸输出物lysO(也称为ybjE)和/或yhiM时,6-氨基己酸的量增加。类似地,当微生物有机体被工程改造成抑制6-氨基己酸输入物时,6-氨基己酸的产生也得到增加。举例来说,当来自大肠杆菌的6-氨基己酸输入物gabP或其同源物和/或csiR或其同源物被破坏时,6-氨基己酸的产生得到增加。可以在具有SEQ ID NO:5的序列或与SEQ ID NO:5具有99%、95%、90%、80%或70%同源性的核酸序列的核酸中进行破坏。也可以在编码SEQ ID NO:6的氨基酸序列或与SEQ ID NO:6具有99%、95%、90%、80%或70%同源性的氨基酸序列的核酸中进行破坏。可以在具有SEQ ID NO:7的序列或与SEQ ID NO:7具有99%、95%、90%、80%或70%同源性的核酸序列的核酸中进行破坏。也可以在编码SEQ ID NO:8的氨基酸序列或与SEQ ID NO:8具有99%、95%、90%、80%或70%同源性的氨基酸序列的核酸中进行破坏。
在一个方面中,用于产生6-氨基己酸的经工程改造的微生物有机体可以过度表达lysO(也称为ybjE)或其同源物,和/或yhiM或其同源物,和/或以下表16中的适当的酶中的一或多种,以及/或具有gabP或其同源物和/或csiR或其同源物的破坏。在另一方面中,用于产生6-氨基己酸的经工程改造的微生物有机体可以过度表达以下表16中的适当的酶中的一或多种,包括例如具有以下序列的核酸:SEQ ID NO:1、17(寄存编号P75826)、19(寄存编号A0A3S6EWD1)、21(寄存编号A0A3R0JPG3)、23(寄存编号A0A2X5EV87)、25(寄存编号A0A0B6FGQ0)、27(寄存编号A0A0T9T4V6)、29(寄存编号A0A3X9TWR2)、31(寄存编号A0A0Q4NI65)、57(寄存编号A0A447V4H2)、59(寄存编号A0A085HLU7)、61(寄存编号A0A085AG20)、63(寄存编号A0A2X2DZ65)、65(UniParc ID UPI00045BA014)、67(寄存编号A0A1B9PQG6)、69(寄存编号A0A0Q9CPY2)、71(寄存编号A0A2N5KTP3)、73(寄存编号A0A2U3BBA9)、75(寄存编号A0A3S0AXG7)、77(寄存编号A0A198FET8)、79(寄存编号A0A1C5WGH0)、81(寄存编号A0A3E4Z618)、83(寄存编号A0A0B6XA16)、85(寄存编号A0A0G3CKY0)、87(寄存编号A0A2N4W2H6)、89(寄存编号A0A101K111)、91(寄存编号A0A356QXL1)和/或93(寄存编号W3V0I2),或一或多个与SEQ ID NO:1、17、19、21、23、25、27、29、31、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93具有99%、95%、90%、80%或70%一致性的核酸序列,和/或SEQ ID NO:3或与SEQ ID NO:3具有99%、95%、90%、80%或70%同源性的核酸序列,和/或具有以下序列的破坏:SEQ ID NO:5或与SEQ IDNO:5具有99%、95%、90%、80%或70%一致性的核酸序列,和/或SEQ ID NO:7或与SEQ IDNO:7具有99%、95%、90%、80%或70%一致性的核酸序列。在另一方面中,用于产生6-氨基己酸的经工程改造的微生物有机体可以过度表达编码以下中的一或多个的核酸:SEQ IDNO:2、4、18、20、22、24、26、28、30、32、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92和/或94,或一或多个与SEQ ID NO:2、4、18、20、22、24、26、28、30、32、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92和/或94具有99%、95%、90%、80%或70%一致性的多肽,和/或具有核酸的破坏,所述核酸编码SEQ ID NO:6或与SEQ ID NO:6具有99%、95%、90%、80%或70%一致性的多肽和/或SEQ ID NO:8或与SEQ ID NO:8具有99%、95%、90%、80%或70%一致性的多肽。
可以被工程改造到微生物有机体中以增加其它所需产物的合成的其它输入物包括例如溶质载体(SLC)转运体。SLC可以是将溶质(离子、代谢物、肽、药物、配体、其它有机小分子等)转运通过膜的膜蛋白。SLC可以是主动转运体并且利用能量(例如,ATP或离子梯度)将溶质(例如,配体)转运到微生物有机体中。SLC可以是不利用能量来转运溶质(例如,配体)的被动转运体。例示性SLC描述于例如法思(Fath)等人,微生物学综述(Microbiol.Rev.)57:995-1017(1993);莫萨托瓦(Moussatova)等人,生物化学和生物物理学学报(Biochim.Biopys.Acta Biomemb.)9:1757-1771(2008);林(Lin)等人,自然评论:药物发现(Nat.Rev.Drug Discov.)14:543-560(2015);海迪格(Hediger)等人,医学分子方面(Mol.Aspects Med.)34:95-107(2013);叶(Ye)等人,科学公共图书馆综合卷(PLoS ONE)9:e88883(2014);施莱辛格(Schlessinger)等人,药物化学当前话题(Curr.Top.Med.Chem.)13:843-856(2013);赛尔(Saier),微生物学(Microbiol.)146:1775-1795(2000);slc.bioparadigms.org的SLC表;genenames.org/cgi-bin/genefamilies/set/752的用于SLC的HUGO基因命名法(HUGO Gene Nomenclature),其皆以全文引用的方式并入以用于所有目的。SLC包括例如通道、孔、电化学电势驱动转运体、原发性主动转运体、基团转位体、电子载体、ATP驱动泵、离子通道和转运体,包括单向转运体、同向转运体和反向转运体。
可以通过增加谷氨酸脱氢酶的活性来增加与合成途径中的转氨酶有关的胺化合物的产生。利用谷氨酸获得胺产物的氨基且由谷氨酸产生α-酮戊二酸的转氨酶可以通过增加谷氨酸脱氢酶(“GDH”)的表达(和/或活性)来增加产物的产生。谷氨酸脱氢酶在由α-酮戊二酸和NH4产生谷氨酸方面具有较大的负吉布斯自由能(Gibbs free energy)且因此,向微生物细胞中添加GDH可以产生过量的谷氨酸(大量的此反应物)以与转氨酶和未胺化的中间物反应。用于铵的转运体也可以用于增加产物自转氨酶的产生。通过增加铵的输入物的活性和/或降低铵的输出物的活性,可以增加GDH的此反应物的细胞内浓度,其将进一步增加谷氨酸由GDH的产生,从而进一步增加产物由转氨酶的产生。
举例来说,如以下实例5和9中所示,GDH(例如,gdhA或其同源物)的过度表达增加6-氨基己酸的产生。被表达的GDH也可以由来自以下实例5或表17的一或多种酶编码,包括例如SEQ ID NO:9、33(寄存编号A0A1F9IMB6)、35(寄存编号C7RFH9)、37(寄存编号A0A3M1CG83)、39(寄存编号A0A095X4D3)、41(寄存编号A0A2S7L1V8)、43(寄存编号W5WWS1)、45(寄存编号P94316)、47(寄存编号AAA25611)、53(寄存编号A0A1V4WK45)和/或55(寄存编号a0A367ZGM1)中的一或多个,或一或多个与SEQ ID NO:9、33、35、37、39、41、43、45、47、53和/或55具有99%、95%、90%、80%或70%一致性的核酸序列。被表达的GDH也可以由一或多种核酸表达,所述一或多种核酸编码SEQ ID NO:10、34、36、38、40、42、44、46、48、54和/或56的一或多个氨基酸序列,或一或多个与SEQ ID NO:10、34、36、38、40、42、44、46、48、54和/或56具有99%、95%、90%、80%或70%一致性的氨基酸序列。图2A展示GDH产生过量的谷氨酸,此提高此反应物的浓度且驱动转氨酶反应朝向6-氨基己酸。如图2A中所示,形成6-氨基己酸的转氨酶反应的吉布斯自由能接近零,且因此反应物和产物(6-氨基己酸)以接近相等的量存在。谷氨酸的GDH产生的高负吉布斯自由能意味着与反应物(α-酮戊二酸和铵)相比,GDH产生大量过量的产物(谷氨酸)。过量的谷氨酸可以驱动转氨酶反应朝向6-氨基己酸,从而增加此所需产物的量。也可以通过例如过度表达来自大肠杆菌的铵转运体amtB、来自大肠杆菌的amtB的W148L变体和/或来自谷氨酸棒状杆菌(C.glutamicum)的amtA来增加谷氨酸产生。这些铵转运体可以提高微生物有机体中的铵浓度,从而驱动GDH反应产生更多的谷氨酸。
也可以通过从微生物有机体消除粘液表型来增加所需产物的产生。具有粘液表型的微生物有机体产生细胞外多糖,其对于一些微生物有机体来说可以变为表示大量的细胞碳。粘液表型与逃避免疫监视和形成生物膜相关,从而在一系列情形下对微生物有机体来说是有利的。粘液表型还与多种对所需产物的生产不利的特征相关。举例来说,具有粘液表型的微生物有机体不能充分集结且无法在生产培养物时具有良好和可再现的表现。这些不利特征会减少由微生物有机体产生的所需产物。对微生物有机体进行工程改造以消除或减少/抑制粘液表型可以缓解这些生产问题且使用于产生细胞外多糖的碳获得自由以用于产生所需产物且因此,增加这些所需产物的产生。
举例来说,rcsA或其同源物、rcsB或其同源物、wcaF或其同源物和/或cpsB或其同源物,和/或cpsG或其同源物,和/或cpsBG或其同源物的破坏敲除粘液表型且使微生物有机体成为非粘液型。所述破坏可以在具有SEQ ID NO:11的序列或与SEQ ID NO:11具有99%、95%、90%、80%或70%一致性的核酸序列的核酸中进行。所述破坏也可以在编码SEQ IDNO:12的氨基酸序列或与SEQ ID NO:12具有99%、95%、90%、80%或70%一致性的氨基酸序列的核酸中进行。所述破坏可以在具有SEQ ID NO:13的序列或与SEQ ID NO:13具有99%、95%、90%、80%或70%一致性的核酸序列的核酸中进行。所述破坏也可以在编码SEQID NO:14的氨基酸序列或与SEQ ID NO:14具有99%、95%、90%、80%或70%一致性的氨基酸序列的核酸中进行。所述破坏可以在具有SEQ ID NO:15的序列或与SEQ ID NO:15具有99%、95%、90%、80%或70%一致性的核酸序列的核酸中进行。所述破坏也可以在编码SEQID NO:16的氨基酸序列或与SEQ ID NO:16具有99%、95%、90%、80%或70%一致性的氨基酸序列的核酸中进行。rcsA和/或cpsBG的破坏还显著增加所需产物的产生(参见实例6),而rcsB或wcaF的破坏未增加所需产物的产生。具有rcsA或cpsBG破坏的微生物有机体所产生的6-氨基己酸比粘液亲本菌株(或具有rcsB或wcaF破坏的菌株)多3-4倍。
也可以通过减少所产生的竞争性中间物和/或产物的量来增加所需产物的产生。如果己二酸(ADA)是生产细胞中的副产物,那么可以通过破坏gabD(丁二酸酯-半醛脱氢酶NADP)、sad(丁二酸酯-半醛脱氢酶NAD)和/或ybfF(酰基-CoA酯酶)来增加所需产物(例如,6-氨基己酸、己内酰胺和/或六亚甲基二醇)的量。如果6-羟基己酸(6HCA)是副产物,那么可以通过破坏yghD(II型分泌系统蛋白质)、yjgB(乙醇脱氢酶)和/或yahK(醛还原酶)来增加所需产物(例如,6-氨基己酸、己内酰胺和/或六亚甲基二醇)的量。如果γ氨基丁酸(GABA)是副产物,那么可以通过破坏gabT(4-氨基丁酸酯氨基转移酶)来增加所需产物(例如,6-氨基己酸、己内酰胺和/或六亚甲基二醇)的量。
以下表1列举基因、DNA序列、蛋白质序列、寄存编号和基因座标签。
表1
ybjE的代表性同源物包括例如以下表2中的同源物:
表2.ybjE同源物
yhiM的代表性同源物包括例如以下表3中的同源物:
表3.yhiM同源物
属性 寄存编号 属性 寄存编号 属性 寄存编号
99.714 CSR38991.1 98.209 EGI90439.1 55.241 WP_088860944.1
99.694 WP_146758915.1 97.765 CSQ64563.1 54.7 WP_012697359.1
99.691 WP_000894161.1 96.736 WP_134799151.1 54.674 WP_026215110.1
99.676 OYI09881.1 91.589 WP_117031587.1 54.572 WP_091089750.1
99.611 CSQ73132.1 91.257 EBV5602406.1 54 WP_150920967.1
99.593 OCY87936.1 90.769 EAB7041734.1 53.736 WP_148035678.1
99.429 WP_154813013.1 90.571 WP_001318089.1 53.429 WP_150924208.1
99.383 SRV86132.1 90.351 EAA2490775.1 53.276 WP_135064867.1
99.143 MLU14817.1 90 WP_016158897.1 53.143 CAA2141987.1
98.857 OYI41353.1 89.429 WP_001517283.1 52.571 WP_092867765.1
98.806 ODG74425.1 88.136 EBO3310906.1 52.436 WP_135116030.1
98.592 EAA0484737.1 58 WP_012417708.1 52 WP_068625586.1
98.585 MJQ67314.1 58 WP_114851959.1 51.714 WP_056647755.1
98.571 WP_134796546.1 56.571 WP_150973537.1 51.6 WP_056647755.1
98.544 EFW54220.1 56.286 WP_125946421.1 50.852 WP_066586210.1
98.492 EIQ04384.1 56 RSV14362.1 50.6 WP_055240933.1
98.286 WP_001028889.1 55.714 WP_111069755.1 50.571 WP_147722741.1
98.22 EGJ00821.1 55.714 WP_123833051.1
gabP的代表性同源物包括例如以下表4中的同源物:
表4.gabP同源物
/>
/>
csiR的代表性同源物包括例如以下表5中的同源物:
表5.csiR同源物
属性 寄存编号 属性 寄存编号 属性 寄存编号
99.1 NP_708477.2 79.6 WP_025801405.1 57.1 WP_051496561.1
89.8 WP_012134775.1 72.9 WP_076942562.1 56.3 WP_021817631.1
89.4 WP_047461758.1 73.1 WP_024910326.1 59 WP_072820777.1
88.4 WP_042288480.1 61.8 WP_016415230.1 54.5 WP_009096767.1
88 NP_461720.1 59 WP_071946013.1 54.9 WP_007111526.1
88 WP_000126152.1 58.9 WP_045993733.1 56.1 WP_071230235.1
88 WP_000126159.1 60.8 WP_035593369.1 54 WP_070057168.1
88.3 WP_043081738.1 60.3 WP_029866289.1 56.5 WP_035471761.1
86.1 WP_017879787.1 61.7 WP_043253788.1 55.5 WP_071473537.1
86.1 WP_002889794.1 58.7 WP_075368656.1 55.7 WP_014291195.1
83.4 WP_013364902.1 59.4 WP_013332139.1 51.7 WP_076460165.1
84 WP_002442796.1 59.3 NP_745052.1
84.2 WP_038163099.1 57.7 WP_076748073.1
gdhA的代表性同源物包括例如以下表6中的同源物:
表6.gdhA同源物
/>
/>
rcsA的代表性同源物包括例如以下表7中的同源物:
表7.rcsA同源物
/>
cspB的代表性同源物包括例如以下表8中的同源物:
表8.cspB同源物
/>
/>
cspG的代表性同源物包括例如以下表9中的同源物:
表9.cspG同源物
/>
/>
如果所需产物是6-羟基己酸(6HCA),那么此产物的产生可以通过对生产细胞进行工程改造以过度表达yghD(II型分泌系统蛋白质)、yjgB(乙醇脱氢酶)和/或yahK(醛还原酶)来进行。
本文中所描述的经基因修饰的细胞(例如,非天然存在的微生物)能够产生尼龙中间物,诸如6-氨基己酸、己内酰胺和己二胺。
如本文中所使用,当在关于微生物有机体或微生物使用时,术语“非天然存在”意在指微生物有机体具有至少一种通常不会在所提及的物种的天然存在的品系(包括所提及的物种的野生型品系)中发现的基因变异。基因变异包括例如引入编码代谢多肽的可表达核酸的修饰、其它核酸添加、核酸缺失和/或微生物遗传物质的其它功能破坏。这类修饰包括例如所提及的物种的异源、同源或异源和同源多肽的编码区和其功能片段。其它修饰包括例如非编码调节区,其中修饰改变基因或操纵子的表达。例示性代谢多肽包括6-氨基己酸、己内酰胺、己二胺或乙酰丙酸生物合成途径内的酶。
如本文中所使用,术语“破坏”意指原生基因或启动子以降低基因和/或基因产物在宿主细胞中的活性的方式突变、缺失、间杂或下调。可以通过基因敲除或移除整个基因组DNA序列来完全(100%)减少基因。使用移码突变、早期终止密码子、关键残基的点突变或缺失或插入等可以通过完全阻止活性蛋白质的转录和/或翻译来使基因产物完全失活(100%)。
代谢修饰是指从天然存在的状态发生变化的生物化学反应。因此,非天然存在的微生物可以具有对编码代谢多肽或其功能片段的核酸的基因修饰。本文中公开例示性代谢修饰。
如本文中所使用,术语“微生物的”、“微生物有机体”或“微生物”可互换地使用,并且意在指任何以古细菌、细菌或真核域内所包括的微观细胞形式存在的生物体。因此,所述术语意图涵盖具有微观尺寸的原核或真核细胞或生物体,并且包括所有物种的细菌、古细菌和真细菌,以及真核微生物,诸如酵母和真菌。所述术语还包括可以被培养以用于产生生物化学物质的任何物种的细胞培养物。
如本文中所使用,术语“CoA”或“辅酶A”意在指有机辅因子或辅基(酶的非蛋白质部分),其是许多酶(脱辅基酶)形成活性酶系统的活性所需的。辅酶A在某些缩合酶中发挥功能,在乙酰基或其它酰基转移以及脂肪酸合成和氧化、丙酮酸酯氧化和其它乙酰化中起作用。
如本文中所使用,具有化学式-OOC-(CH2)4-COO-的“己二酸酯(adipate)”(参见图1)(IUPAC名称己二酸酯(hexanedioate))是己二酸(adipic acid)(IUPAC名称(己二酸(hexanedioic acid))的离子化形式,并且应理解,己二酸酯和己二酸始终可以互换地用于指呈其任何中性或离子化形式,包括其任何盐形式的化合物。所属领域的技术人员应理解,特定形式将视pH值而定。
如本文中所使用,具有化学式-OOC-(CH2)5-NH2的“6-氨基己酸酯”(参见图1,且简称为6-ACA)是6-氨基己酸(6-aminocaproic acid)(IUPAC名称6-氨基己酸(6-aminohexanoic acid))的离子化形式,并且应理解,6-氨基己酸酯和6-氨基己酸始终可互换地用于指呈其任何中性或离子化形式,包括其任何盐形式的化合物。所属领域的技术人员应理解,特定形式将视pH值而定。
如本文中所使用,“己内酰胺”(IUPAC名称氮杂环庚-2-酮)是6-氨基己酸的内酰胺(参见图1,且简称为CPO)。
如本文中所使用,“己二胺”,也称为1,6-二氨基己烷或1,6-己二胺,具有化学式H2N(CH2)6NH2(参见图1且简称为HMD)。
如本文中所使用,当在关于培养物或生长条件使用时,术语“基本上厌氧”意在指氧的量小于液体培养基中溶解的氧的饱和度的约10%。所述术语还意图包括维持在小于约1%氧的气氛中的液体或固体培养基的密封室。
如本文中所使用,当在关于生物化学物质的产生使用时,术语“生长偶合”意在指在微生物的生长期期间进行所提及的生物化学物质的生物合成。在具体实施例中,生长偶合产生可能是强制性的,意味着所提及的生物化学物质的生物合成是微生物的生长期期间产生的强制性产物。
如本文中所使用,“代谢修饰”意指从天然存在的状态发生变化的生物化学反应。代谢修饰可以包括例如通过功能性破坏一或多种编码参与反应的酶的基因来消除生物化学反应活性。
如本文中所使用,术语“破坏”、“基因破坏”或其语法等效物意指使被编码的基因产物失活的基因变异。基因变异可以是例如整个基因的缺失、转录或翻译所需的调节序列的缺失、产生被截短的基因产物的一部分基因的缺失,或通过各种使被编码的基因产物失活的突变策略中的任一种进行的基因变异。一种尤其适用的基因破坏方法是完全基因缺失,因为其减少或消除非天然存在的微生物中遗传逆转的出现。
如本文中所使用,“外源”意指所提及的分子或所提及的活性被引入宿主微生物有机体中。可以例如通过将编码核酸引入宿主遗传物质中,例如通过集成到宿主染色体中或以非染色体遗传物质(诸如质粒)形式来引入所述分子。因此,所述术语在关于编码核酸的表达使用时是指编码核酸以可表达形式引入微生物有机体中。当关于生物合成活性使用时,所述术语是指引入宿主参考生物体中的活性。举例来说,来源可以是在引入宿主微生物有机体中之后表达所提及的活性的同源或异源编码核酸。因此,术语“内源”是指存在于宿主中的参考分子或活性。类似地,所述术语在关于编码核酸的表达使用时是指微生物有机体内所含有的编码核酸的表达。
术语“异源”是指来源于除参考物种以外的来源的分子、材料或活性,而“同源”是指来源于宿主微生物有机体的分子、材料或活性。因此,编码核酸的外源表达可以利用异源或同源编码核酸中的任一种或这两者。
应理解,当微生物有机体中包括超过一种外源核酸时,外源核酸是指如上文所论述的参考编码核酸或生物合成活性。还应理解,如本文中所公开,这类外源核酸可以在独立的核酸分子上、在多顺反子核酸分子上或在其组合上被引入宿主微生物有机体中,并且仍视为超过一种外源核酸。举例来说,如本文中所公开,微生物有机体可以被工程改造成表达两种或更多种编码所需途径酶或蛋白质的外源核酸。在将两种编码所需活性的外源核酸引入宿主微生物有机体中的情况下,应理解,所述两种外源核酸可以单一核酸形式引入,例如在单一质粒上、在独立的质粒上,可以在单一部位或多个部位处集成到宿主染色体中,并且仍视为两种外源核酸。类似地,应理解可以任何所需组合形式将超过两种外源核酸引入宿主生物体中,例如在单一质粒上、在独立的质粒上,其不集成到宿主染色体中且质粒仍然是染色体外元件,并且仍被视为两种或更多种外源核酸。参考外源核酸或生物合成活性的数目是指编码核酸的数目或生物合成活性的数目,而不是被引入宿主生物体中的独立核酸的数目。
非天然存在的微生物有机体可以含有稳定基因变异,其是指微生物可以被培养超过五代而不损失变异。一般来说,稳定基因变异包括持续超过10代的修饰,具体地说,将持续超过约25代的稳定修饰,并且更具体地说,稳定遗传修饰将超过50代,包括无限期。
在基因的情况下,尤其适用的稳定基因变异是基因缺失。使用基因缺失来引入稳定的基因变异尤其适用于降低逆转成基因变异之前的表型的可能性。举例来说,可以例如通过编码酶的基因的缺失来实现生物化学物质的稳定的生长偶合产生,所述酶催化代谢修饰集合内的一或多个反应。可以通过多种缺失来进一步增强生物化学物质的生长偶合产生的稳定性,显著降低因各种被破坏的活性而发生多种补偿性逆转的可能性。
所属领域的技术人员将理解,包括本文中例示的代谢修饰的基因变异是参考合适的宿主生物体(例如大肠杆菌)和其相应代谢反应或所需遗传物质(诸如所需代谢途径的基因)的合适来源生物体来描述。然而,考虑到多种生物体的全基因组测序和基因组学领域中的高技术水平,所属领域的技术人员将容易能够将本文中所提供的教示和指导应用于基本上所有其它生物体。举例来说,本文中例示的大肠杆菌代谢变异可以容易地通过并入来自除所提及物种以外的物种的相同或类似编码核酸而应用于其它物种。这类基因变异通常包括例如物种同源物的基因变异,且具体地说,直系同源物、旁系同源物或非直系同源基因置换。
直系同源物是通过垂直传递而相关且负责不同生物体中的基本上相同或一致功能的一或多种基因。举例来说,对于环氧化物的水解的生物功能,小鼠环氧化物水解酶和人类环氧化物水解酶可以被视为直系同源物。举例来说,当基因共享足以指示其是同源的量的序列类似性或通过从共同的祖先进化而相关时,其是通过垂直传递而相关的。如果基因共享足以指示其是从共同的祖先进化,从而不可鉴别一级序列类似性的量的三维结构(但未必序列类似性),那么其也可以被视为直系同源物。直系同源基因可以编码具有约25%至100%氨基酸序列一致性的序列类似性的蛋白质。如果编码共享小于25%的氨基酸类似性的蛋白质的基因的三维结构也展示类似性,那么其也可以被视为通过垂直传递而产生。酶的丝氨酸蛋白酶家族的成员,包括组织纤维蛋白溶酶原活化因子和弹性转氨酶(elastransaminasee),被视为从共同的祖先通过垂直传递而产生。
直系同源物包括通过例如进化而在结构或整体活性方面不同的基因或其被编码的基因产物。举例来说,当一个物种编码呈现两种功能的基因产物且这类功能被分离到第二物种中的不同基因中时,所述三种基因和其相应的产物被视为直系同源物。对于生物化学产物的制备,所属领域的技术人员将理解,选择具有待引入或破坏的代谢活性的直系同源基因进行非天然存在的微生物的建构。呈现可分离的活性的直系同源物的实例是不同活性已分离到两种或更多种物种之间或单一物种内的不同基因产物中。特定实例是弹性转氨酶蛋白水解和纤维蛋白溶酶原蛋白水解(两种丝氨酸蛋白酶活性)以纤维蛋白溶酶原活化因子和弹性转氨酶形式分离到不同分子中。第二实例是分离支原体(mycoplasma)5'-3'核酸外切酶和果蝇(Drosophila)DNA聚合酶III活性。来自第一物种的DNA聚合酶可被视为来自第二物种的核酸外切酶或聚合酶中的任一种或这两种的直系同源物,且反之亦然。
相比之下,旁系同源物是通过例如复制,接着发生进化趋异而相关的同源物,且具有类似或共同,但不一致的功能。旁系同源物可起源于或来源于例如相同物种或不同物种。举例来说,微粒体环氧化物水解酶(环氧化物水解酶I)和可溶性环氧化物水解酶(环氧化物水解酶II)可被视为旁系同源物,因为其表示从共同祖先共同进化的两种不同酶,其催化不同的反应且在相同物种中具有不同功能。旁系同源物是来自相同物种的蛋白质,其彼此具有显著序列类似性,表明其是同源的,或通过从共同的祖先共同进化而相关。旁系同源蛋白质家族群体包括HipA同源物、荧光素酶基因、肽酶等。
非直系同源基因置换是来自一个物种的非直系同源基因可以取代不同物种中的参考基因功能。取代包括例如能够在来源物种中发挥与不同物种中的参考功能相比基本上相同或类似的功能。尽管通常可将非直系同源基因置换鉴别为与编码参考功能的已知基因在结构上相关,但如所述术语在本文中所使用,结构相关性较低但功能上类似的基因和其相应的基因产物仍将属于其含义的范围内。与编码寻求取代的功能的基因相比,功能类似性需要例如非直系同源基因产物的活性位或结合区域中的至少一些结构类似性。因此,非直系同源基因包括例如旁系同源物或不相关基因。
因此,在鉴别和建构具有6-氨基己酸、己内酰胺、己二胺或乙酰丙酸生物合成能力的非天然存在的微生物有机体时,通过对具体物种应用本文中所提供的教示和指导,所属领域的技术人员将理解,代谢修饰的鉴别可以包括直系同源物的鉴别和包涵或失活。就参考微生物中存在编码催化类似或基本上类似的代谢反应的酶的旁系同源物和/或非直系同源基因置换来说,所属领域的技术人员也可以利用这些在进化方面相关的基因。在基因破坏策略中,也可以在宿主微生物有机体、旁系同源物或直系同源物中破坏或缺失在进化方面相关的基因,以降低或消除活性,从而确保作为破坏的目标的酶活性的任何功能冗余不会使所设计的代谢修饰失效。
可以通过所属领域的技术人员众所周知的方法确定直系同源物、旁系同源物和非直系同源基因置换。举例来说,两个多肽的核酸或氨基酸序列的检验将揭露所比较的序列之间的序列一致性和类似性。基于这类类似性,所属领域的技术人员可以确定类似性是否足够高以指示蛋白质是通过从共同的祖先进化而相关。所属领域的技术人员众所周知的算法,诸如Align、BLAST、Clustal W等,比较和确定原始序列类似性或一致性,并且还确定序列中可分配权重或分数的空位的存在或显著性。这类算法也是所属领域中已知的并且同样适用于确定核苷酸序列类似性或一致性。基于众所周知的用于计算统计类似性的方法或发现随机多肽中的类似匹配的概率和所确定的匹配的显著性来计算用于确定相关性的足够类似性的参数。视需要,也可以由所属领域的技术人员以目视方式优化两个或更多个序列的计算机比较。预期相关基因产物或蛋白质可具有高类似性,例如25%至100%序列一致性。如果扫描具有足够尺寸的数据库(约5%),那么不相关的蛋白质可以具有与预期偶然存在基本上相同的一致性。5%与24%之间的序列可以表示或不可表示足以得出所比较的序列具有相关性的结论的同源性。鉴于数据集的尺寸,可以进行其它用于确定这类匹配的显著性的统计分析以确定这些序列的相关性。
举例来说,用于使用BLAST算法测定两个或更多个序列的相关性的例示性参数可如下文中所阐述。简单地说,可以使用2.2.29+版BLASTP(2014年1月14日)和以下转氨酶参数(parameTransaminase)来进行氨基酸序列比对:矩阵:0BLOSUM62;空位开头:11;空位延长:1;x_dropoff:50;预期:10.0;字长:3;过滤器:开启。可以使用2.0.6版BLASTN(1998年9月16日)和以下转氨酶参数进行核酸序列比对:匹配:1;错配:-2;空位开头:5;空位延长:2;x_dropoff:50;预期:10.0;字长:11;过滤器:关闭。所属领域的技术人员将知晓可对以上转氨酶参数进行哪些修改以例如提高或降低比较的严格度和确定两个或更多个序列的相关性。
应理解,本文中公开的任何途径,包括图式中所描述的途径,皆可视需要用于产生非天然存在的微生物有机体,所述非天然存在的微生物有机体产生任何途径中间物或产物。如本文中所公开,这类产生中间物的微生物有机体可以与另一种表达下游途径酶的微生物有机体组合使用以产生所需产物。然而,应理解,产生6-氨基己酸、己内酰胺或己二胺的非天然存在的微生物有机体可以用于产生作为所需产物的中间物。
本文中一般参考代谢反应、反应物或其产物或特定参考一或多种编码酶的核酸或基因来进行描述,所述酶与参考代谢反应、反应物或产物相关或催化参考代谢反应、反应物或产物。除非本文中另有明确陈述,否则所属领域的技术人员将理解,对反应的参考也构成对反应物和反应产物的参考。类似地,除非本文中另有明确陈述,否则对反应物或产物的参考也是对反应的参考,并且对任何这些代谢成分的参考也是对一或多种编码催化参考反应、反应物或产物的酶的基因的参考。类似地,鉴于众所周知的代谢生物化学、发酵学和基因组学领域,本文中对基因或编码核酸的参考也构成对相应的被编码的酶和其所催化的反应以及反应物和反应产物的参考。
可通过引入可表达的核酸来产生非天然存在的微生物有机体,所述可表达的核酸编码一或多种参与一或多种6-氨基己酸、己内酰胺、己二胺或其它C5-C14生物合成途径的酶。视选择用于生物合成的宿主微生物有机体而定,可以表达用于一些或所有具体6-氨基己酸、己内酰胺、己二胺或其它C5-C14生物合成途径的核酸。举例来说,如果所选择的宿主缺失一或多种用于所需生物合成途径的酶,那么将用于缺失的酶的可表达核酸引入宿主以用于后续外源表达。或者,如果所选择的宿主呈现一些途径基因的内源表达,但缺失其它基因,那么需要缺失的酶的编码核酸以实现6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物生物合成。因此,可以通过引入外源酶活性以获得所需生物合成途径来产生非天然存在的微生物有机体,或可以通过引入一或多种与一或多种内源酶共同产生所需产物(诸如6-氨基己酸、己内酰胺或己二胺)的外源酶活性来获得所需生物合成途径。
视所选择的宿主微生物有机体的6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物生物合成途径成分而定,非天然存在的微生物有机体将包括至少一种外源表达的6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物途径编码核酸和最多所有用于一或多种己二酸酯、6-氨基己酸、己内酰胺或其它C5-C14产物生物合成途径的编码核酸。举例来说,可以在缺失途径酶的宿主中通过相应编码核酸的外源表达来建立6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物生物合成。在缺失6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物途径的所有酶的宿主中,可以包括途径中的所有酶的外源表达,但应理解,即使宿主含有至少一种途径酶,但仍可表达途径的所有酶。
鉴于本文中所提供的教示和指导,所属领域的技术人员将理解,以可表达形式引入的编码核酸的数目将至少弥补所选择的宿主微生物有机体的己二酸酯、6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物途径缺陷。因此,非天然存在的微生物有机体可以具有至少一、二、三、四、五、六、七、八、九、十、十一或十二种,最多所有编码上述组成6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物生物合成途径的酶的核酸。在一些实施例中,非天然存在的微生物有机体还可以包括其它促进或优化6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物生物合成或赋予宿主微生物有机体其它适用功能的基因修饰。一种这类其它功能性可以包括例如增强6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物途径前体中的一或多种的合成,举例来说,所述前体在己二酸酯合成的情况下是丁二酰基-CoA和/或乙酰基-CoA,或在6-氨基己酸或己内酰胺合成的情况下是己二酰基-CoA或己二酸酯,包括本文中公开的己二酸酯途径酶,或在6-氨基己酸酯合成的情况下是丙酮酸酯和丁二酸半醛、谷氨酸、戊二酰基-CoA、高赖氨酸或2-氨基-7-氧代辛二酸酯,或在己二胺合成的情况下是6-氨基己酸酯、谷氨酸、戊二酰基-CoA、丙酮酸酯和4-氨基丁醛或2-氨基-7-氧代辛二酸酯。
可以由具有合成6-氨基己酸、己内酰胺、己二胺或乙酰丙酸的酶能力的宿主产生非天然存在的微生物有机体。增加6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物途径产物的合成或累积可以适用于例如驱使6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物途径反应向6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物产生发展。可以通过例如编码上述6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物途径酶中的一或多种的核酸的过度表达来实现合成或累积的增加。一或多种6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物途径酶的过度表达可以例如通过一或多种内源基因的外源表达或通过一或多种异源基因的外源表达来进行。因此,通过至少一、二、三、四、五、六、七、八、九、十、十一、十二、十三、十四,也就是说,最多所有编码6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物生物合成途径酶的核酸的过度表达,可以容易地将天然存在的生物体生成为非天然存在的微生物有机体,例如产生6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物。此外,可以通过内源基因的突变诱发来产生非天然存在的生物体,所述突变诱发引起6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物生物合成途径中的酶的活性增加。
外源表达可以提供针对宿主和应用来定制表达和/或调节元件的能力,从而实现由用户控制的所需表达量。然而,也可以通过去除负性调节效应物或在连接至诱导型启动子或其它调节元件时诱导基因的启动子来利用内源表达。因此,可以通过提供适当的诱导剂来上调具有天然存在的诱导型启动子的内源基因,或可以对内源基因的调节区进行工程改造以合并有诱导型调节元件,由此在所需时间实现内源基因的增加的表达的调节。类似地,可以包括诱导型启动子作为被引入非天然存在的微生物有机体中的外源基因的调节元件。
非天然存在的微生物有机体可以包括一或多种基因破坏,其中生物体产生6-ACA、己内酰胺、HMDA和/或其它C5-C14产物。在本文中所描述的基因中进行破坏,使得基因破坏降低基因产物的活性,使得基因破坏使非天然存在的生物体的6-ACA、己内酰胺、HMDA和/或其它C5-C14产物的产量增加。因此,非天然存在的微生物有机体包含一或多种基因破坏,本文中所描述的一或多种基因破坏使生物体中的6-ACA、己内酰胺、HMDA和/或其它C5-C14产物的产量增加。如本文中所公开,这类生物体含有用于产生6-ACA、己内酰胺、HMDA和/或其它C5-C14产物的途径。
应理解,在方法中,可以将一或多种外源核酸中的任一种引入微生物有机体中以产生非天然存在的微生物有机体。可以引入核酸以例如使微生物有机体具有6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物生物合成途径。或者,可以引入编码核酸以产生中间微生物有机体,其具有催化一些所需反应的生物合成能力,从而提供6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物生物合成能力。举例来说,具有6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物生物合成途径的非天然存在的微生物有机体可以包含至少两种编码所需酶的外源核酸。在产生己二酸酯的情况下,至少两种外源核酸可以编码酶,诸如丁二酰基-CoA:乙酰基-CoA酰基转移酶和3-羟基酰基-CoA脱氢酶的组合,或丁二酰基-CoA:乙酰基-CoA酰基转移酶和3-羟基己二酰基-CoA脱水转氨酶的组合,或3-羟基己二酰基-CoA和己二酸酯半醛转氨酶的组合,或3-羟基酰基-CoA和己二酰基-CoA合成酶的组合等。在产生己内酰胺的情况下,至少两种外源核酸可以编码酶,诸如CoA依赖性反-烯酰基-CoA还原酶和转氨酶的组合,或CoA-依赖性反-烯酰基-CoA还原转氨酶和酰胺基水解酶的组合,或转氨酶和酰胺基水解酶的组合。在产生6-氨基己酸的情况下,至少两种外源核酸可以编码酶,诸如4-羟基-2-氧代庚烷-1,7-二酸酯(HODH)陶拉酶(TAolase)和2-氧代庚-4-烯-1,7-二酸酯(OHED)水合转氨酶的组合,或2-氧代庚-4-烯-1,7-二酸酯(OHED)水合转氨酶和2-氨基庚烷-1,7-二酸酯(2-AHD)脱羧酶的组合、3-羟基己二酰基-CoA脱水转氨酶和己二酰基-CoA脱氢酶的组合、谷氨酰基-CoA转移酶和6-氨基庚二酰基-CoA水解酶的组合,或戊二酰基-CoAβ-酮硫解酶和3-氨基庚二酸酯2,3-氨基变位转氨酶的组合。在产生己二胺的情况下,至少两种外源核酸可以编码酶,诸如6-氨基己酸酯激酶和[(6-氨基己酰基)氧基]膦酸酯(6-AHOP)氧化还原转氨酶的组合,或6-乙酰胺基己酸酯激酶和[(6-乙酰胺基己酰基)氧基]膦酸酯(6-AAHOP)氧化还原转氨酶的组合、6-氨基己酸酯N-乙酰基转移酶和6-乙酰胺基己酰基-CoA氧化还原转氨酶的组合、3-羟基-6-氨基庚二酰基-CoA脱水转氨酶和2-氨基-7-氧代庚酸酯氨基转移酶的组合,或3-氧代庚二酰基-CoA连接酶和高赖氨酸脱羧酶的组合。因此,应理解,非天然存在的微生物有机体中可以包括生物合成途径的两种或更多种酶的任何组合。
类似地,应理解,非天然存在的微生物有机体中可以视需要包括生物合成途径的三种或更多种酶的任何组合,举例来说,在产生己二酸酯的情况中,酶丁二酰基-CoA:乙酰基-CoA酰基转移酶、3-羟基酰基-CoA脱氢酶和3-羟基己二酰基-CoA脱水转氨酶的组合;或丁二酰基-CoA:乙酰基-CoA酰基转移酶、3-羟基酰基-CoA脱氢酶和己二酸酯半醛还原转氨酶的组合;或丁二酰基-CoA:乙酰基-CoA酰基转移酶、3-羟基酰基-CoA脱氢酶和己二酰基-CoA合成转氨酶的组合;或3-羟基酰基-CoA脱氢酶、3-羟基己二酰基-CoA脱水转氨酶和己二酰基-CoA:乙酰基-CoA转移酶的组合等,只要所需生物合成途径的酶的组合引起相应所需产物的产生即可。在产生6-氨基己酸的情况下,至少三种外源核酸可以编码酶,诸如4-羟基-2-氧代庚烷-1,7-二酸酯(HODH)陶拉酶、2-氧代庚-4-烯-1,7-二酸酯(OHED)水合转氨酶和2-氧代庚烷-1,7-二酸酯(2-OHD)脱羧酶的组合,或2-氧代庚-4-烯-1,7-二酸酯(OHED)水合转氨酶、2-氨基庚-4-烯-1,7-二酸酯(2-AHE)还原转氨酶和2-氨基庚烷-1,7-二酸酯(2-AHD)脱羧酶的组合,或3-羟基己二酰基-CoA脱水转氨酶、2,3-脱氢己二酰基-CoA还原转氨酶和己二酰基-CoA脱氢酶的组合,或6-氨基-7-羧基庚-2-烯酰基-CoA还原转氨酶、6-氨基庚二酰基-CoA水解酶和2-氨基庚二酸酯脱羧酶的组合,或戊二酰基-CoAβ-酮硫解酶、3-胺化氧化还原转氨酶和2-氨基庚二酸酯脱羧酶的组合,或3-氧代己二酰基-CoA硫解酶、5-羧基-2-戊烯酸酯还原转氨酶和己二酸酯还原转氨酶的组合。在产生己二胺的情况下,至少三种外源核酸可以编码酶,诸如6-氨基己酸酯激酶、[(6-氨基己酰基)氧基]膦酸酯(6-AHOP)氧化还原转氨酶和6-氨基己酸半醛氨基转移酶的组合,或6-氨基己酸酯N-乙酰基转移酶、6-乙酰胺基己酸酯激酶和[(6-乙酰胺基己酰基)氧基]膦酸酯(6-AAHOP)氧化还原转氨酶的组合,或6-氨基己酸酯N-乙酰基转移酶、[(6-乙酰胺基己酰基)氧基]膦酸酯(6-AAHOP)酰基转移酶和6-乙酰胺基己酰基-CoA氧化还原转氨酶的组合,或3-氧代-6-氨基庚二酰基-CoA氧化还原转氨酶、3-羟基-6-氨基庚二酰基-CoA脱水转氨酶和高赖氨酸脱羧酶的组合,或2-氧代-4-羟基-7-氨基庚酸酯陶拉酶、2-氧代-7-氨基庚-3-烯酸酯还原转氨酶和高赖氨酸脱羧酶的组合,或6-乙酰胺基己酸酯还原转氨酶、6-乙酰胺基己醛氨基转移酶和6-乙酰胺基己胺N-乙酰基转移酶的组合。类似地,非天然存在的微生物有机体中可以视需要包括如本文中所公开的生物合成途径的四种或更多种酶的任何组合,只要所需生物合成途径的酶的组合引起相应所需产物的产生即可。
除如本文中所描述的6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物的生物合成以外,非天然存在的微生物有机体和方法也可以彼此以及与所属领域中众所周知的其它微生物有机体和方法的各种组合形式使用,以通过其它途径实现产物生物合成。举例来说,一种除使用6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物生产物以外的产生6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物的替代方法是通过添加另一种能够将己二酸酯、6-氨基己酸或己内酰胺途径中间物转化成6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物的微生物有机体。一种这类程序包括例如产生6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物途径中间物的微生物有机体的发酵。接着,可以使用6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物途径中间物作为第二微生物有机体的底物,所述第二微生物有机体将6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物途径中间物转化成6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物。可以将6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物途径中间物直接添加到第二生物体的另一培养物中,或6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物途径中间物生产物的原始培养物可以通过例如细胞分离来消耗这些微生物有机体,并且接着可以利用随后向发酵液中添加第二生物体来产生最终产物而不进行中间物纯化步骤。
非天然存在的微生物有机体和方法可以在多种子途径中组装以实现例如6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物的生物合成。可以将所需产物的生物合成途径分离到不同微生物有机体中,并且可以共同培养不同的微生物有机体以产生最终产物。在这类生物合成方案中,一种微生物有机体的产物是第二微生物有机体的底物直到合成最终产物。举例来说,可以通过建构微生物有机体来实现6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物的生物合成,所述微生物有机体含有用于将一种途径中间物转化成另一种途径中间物或产物的生物合成途径。或者,也可以在同一容器中使用两种生物体通过共同培养或共同发酵由微生物有机体以生物合成方式产生6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物,其中第一微生物有机体产生6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物中间物并且第二微生物有机体将中间物转化成6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物。
鉴于本文中所提供的教示和指导,所属领域的技术人员将理解,存在非天然存在的微生物有机体和方法与其它微生物有机体、具有子途径的其它非天然存在的微生物有机体的共同培养和所属领域中众所周知的用于产生6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物的其它化学和/或生物化学程序的组合的多种组合和排列。
类似地,所属领域的技术人员应理解,可以基于引入一或多种基因破坏的所需特征来选择宿主生物体以增加6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物的产生。因此,应理解,如果将基因修饰引入宿主生物体中以破坏基因,那么可以类似地破坏任何催化类似,但非一致代谢反应的同源物、直系同源物或旁系同源物以确保充分破坏所需代谢反应。因为不同生物体之间的代谢网络中存在某些差异,所属领域的技术人员将理解,在既定生物体中破坏的实际基因可能在生物体之间不同。然而,鉴于本文中所提供的教示和指导,所属领域的技术人员还将理解,所述方法可以应用于任何适合的宿主微生物以鉴别在感兴趣的物种中建构生物体所需的同源代谢变异,所述变异将增加6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物生物合成。增加的产生可以将6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物的生物合成与生物体的生长偶合,并且可以视需要强制性将6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物的产生与生物体的生长偶合。
6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物途径酶的编码核酸的来源可以包括例如被编码的基因产物能够催化参考反应的任何物种。这类物种包括原核和真核生物体,包括(但不限于)细菌(包括古细菌和真细菌)和真核生物(包括酵母菌、植物、昆虫、动物和哺乳动物,包括人类)。6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物途径酶的编码核酸的来源可以展示于表4中。6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物途径酶的编码核酸的来源是例如以下物种:大肠杆菌、大肠杆菌菌株K12、大肠杆菌C、大肠杆菌W、假单胞菌属(Pseudomonas sp.)、克氏假单胞菌(Pseudomonas knackmussii)、假单胞菌属菌株B13、恶臭假单胞菌(Pseudomonas putida)、荧光假单胞菌(Pseudomonas fluorescens)、施氏假单孢菌(Pseudomonas stutzeri)、门多萨假单胞菌(Pseudomonas mendocina)、沼泽红假单胞菌(Rhodopseudomonas palustris)、结核分枝杆菌(Mycobacteriumtuberculosis)、霍乱弧菌(Vibrio cholera)、幽门螺杆菌(Heliobacter pylori)、肺炎克雷伯氏杆菌(Klebsiella pneumoniae)、变形斑沙雷氏菌(Serratia proteamaculans)、链霉菌属(Streptomyces sp.)2065、铜绿假单胞菌(Pseudomonas aeruginosa)、铜绿假单胞菌PAO1、富养罗尔斯通氏菌(Ralstonia eutropha)、富养罗尔斯通氏菌H16、丙酮丁醇梭菌(Clostridium acetobutylicum)、超微眼虫藻(Euglena gracilis)、齿垢密螺旋体(Treponema denticola)、克氏梭菌(Clostridium kluyveri)、智人(Homo sapiens)、褐鼠(Rattus norvegicus)、不动杆菌属(Acinetobacter sp.)ADP1、不动杆菌属菌株M-1、天蓝色链霉菌(Streptomyces coelicolor)、巴氏真杆菌(Eubacterium barkeri)、不解糖消化链球菌(Peptostreptococcus asaccharolyticus)、肉毒杆菌(Clostridium botulinum)、肉毒杆菌A3菌株、酪丁酸梭菌(Clostridium tyrobutyricum)、巴氏梭菌(Clostridiumpasteurianum)、热乙酸梭菌(Clostridium thermoaceticum)(热乙酸莫尔氏菌(Moorellathermoaceticum))、热醋穆尔氏菌乙酸钙不动杆菌(Moorella thermoaceticaAcinetobacter calcoaceticus)、小家鼠(Mus musculus)、野猪(Sus scrofa)、黄杆菌属(Flavobacterium sp.)、金黄节杆菌(Arthrobacter aurescens)、产黄青霉(Penicilliumchrysogenum)、黑曲霉(Aspergillus niger)、构巢曲霉(Aspergillus nidulans)、枯草芽孢杆菌(Bacillus subtilis)、酿酒酵母(Saccharomyces cerevisiae)、运动发酵单胞菌(Zymomonas mobilis)、产琥珀酸曼氏杆(Mannheimia succiniciproducens)、扬氏梭菌(Clostridium ljungdahlii)、羧基脱水梭菌(Clostridium carboxydivorans)、嗜热脂肪地芽孢杆菌(Geobacillus stearothermophilus)、根癌土壤杆菌(Agrobacteriumtumefaciens)、木糖氧化无色杆菌(Achromobacter xylosoxidans)、反硝化无色杆菌(Achromobacter denitrificans)、阿拉伯芥(Arabidopsis thaliana)、流感嗜血杆菌(Haemophilus influenzae)、发酵性氨基酸杆菌(Acidaminococcus fermentans)、梭菌属(Clostridium sp.)M62/1、具核梭杆菌(Fusobacterium nucleatum)、家牛(Bos taurus)、枝状动胶菌(Zoogloea ramigera)、类球红细菌(Rhodobacter sphaeroides)、拜氏梭菌(Clostridium beijerinckii)、勤奋金属球菌(Metallosphaera sedula)、嗜热厌氧杆菌属(Thermoanaerobacter species)、布氏嗜热厌氧杆菌(Thermoanaerobacter brockii)、贝氏不动杆菌(Acinetobacter baylyi)、牙龈卟啉单胞菌(Porphyromonas gingivalis)、肠膜明串珠菌(Leuconostoc mesenteroides)、头寇岱硫化叶菌(Sulfolobus tokodaii)、头寇岱硫化叶菌7、硫磺矿硫化叶菌(Sulfolobus solfataricus)、硫磺矿硫化叶菌、嗜酸热硫化叶菌(Sulfolobus acidocaldarius)、鼠伤寒沙门氏菌(Salmonella typhimurium)、肠道沙门氏菌(Salmonella enterica)、海栖热袍菌(Thermotoga maritima)、嗜盐亲盐杆菌(Halobacterium salinarum)、蜡样芽孢杆菌(Bacillus cereus)、艰难梭菌(Clostridiumdifficile)、嗜碱金属杆菌(Alkaliphilus metalliredigenes)、腾冲嗜热厌氧菌(Thermoanaerobacter tengcongensis)、克鲁维酵母(Saccharomyces kluyveri)、幽门螺旋杆菌(Helicobacter pylori)、谷氨酸棒状杆菌(Corynebacterium glutamicum)、糖乙酸多丁醇梭菌(Clostridium saccharoperbutylacetonicum)、绿针假单胞菌(Pseudomonaschlororaphis)、棒状链霉菌(Streptomyces clavuligerus)、空肠弯曲杆菌(Campylobacter jejuni)、嗜热栖热菌(Thermus thermophilus)、嗜热丙酸氧化菌(Pelotomaculum thermopropionicum)、多毛拟杆菌(Bacteroides capillosus)、人结肠厌氧棍状菌(Anaerotruncus colihominis)、嗜热盐碱厌氧菌(Natranaerobiusthermophilius)、超嗜热古菌(Archaeoglobus fulgidus)、超嗜热古菌DSM 4304、死海盐盒菌(Haloarcula marismortui)、喜气火棒菌(Pyrobaculum aerophilum)、喜气火棒菌菌株IM2、烟草(Nicotiana tabacum)、辣薄荷(Menthe piperita)、火炬松(Pinus taeda)、大麦(Hordeum vulgare)、玉蜀黍(Zea mays)、混浊红球菌(Rhodococcus opacus)、钩虫贪铜菌(Cupriavidus necator)、慢生型大豆根瘤菌(Bradyrhizobium japonicum)、慢生型大豆根瘤菌USDA110、水松(Ascarius suum)、丁酸盐产生菌(butyrate-producing bacterium)L2-50、巨大芽孢杆菌(Bacillus megaterium)、海沼甲烷球菌(Methanococcus maripaludis)、马氏甲烷八叠球菌(Methanosarcina mazei)、马氏甲烷八叠球菌属、巴氏甲烷八叠球菌(Methanocarcina barkeri)、詹氏甲烷球菌(Methanocaldococcus jannaschii)、秀丽隐杆线虫(Caenorhabditis elegans)、硕大利什曼原虫(Leishmania major)、甲烷氧化菌(Methylomicrobium alcaliphilum)20Z、需盐色盐杆菌(Chromohalobacter salexigens)、闪烁古生球菌(Archaeglubus fulgidus)、莱茵衣藻(Chlamydomonas reinhardtii)、阴道毛滴虫(trichomonas vaginalis)G3、布氏锥虫(Trypanosoma brucei)、多枝枝动菌(Mycoplana ramose)、藤黄微球菌(Micrococcus luteas)、巴氏醋杆菌(Acetobacterpasteurians)、乳酸克鲁维酵母菌(Kluyveromyces lactis)、百脉根根瘤菌(Mesorhizobium loti)、乳酸乳球菌(Lactococcus lactis)、球形赖氨酸芽孢杆菌(Lysinibacillus sphaericus)、博伊丁念珠菌(Candida boidinii)、白色念珠菌(Candidaalbicans)SC5314、双向伯克霍尔德氏菌(Burkholderia ambifaria)AMMD、猪蛔虫(Ascarissuun)、鲍氏不动杆菌(Acinetobacter baumanii)、乙酸钙不动杆菌(Acinetobactercalcoaceticus)、植物伯克霍尔德菌(Burkholderia phymatum)、白色念珠菌、近端梭菌(Clostridium subterminale)、台湾贪铜菌(Cupriavidus taiwanensis)、泥色黄杆菌(Flavobacterium lutescens)、克鲁维拉钱斯氏酵母(Lachancea kluyveri)、乳杆菌属(Lactobacillus sp.)30a、肾脏钩端螺旋体(Leptospira interrogans)、热醋穆尔氏菌(Moorella thermoacetica)、黄色粘球菌(Myxococcus xanthus)、心叶烟(Nicotianaglutinosa)、艾阿华诺卡氏菌属(Nocardia iowensis sp.)(NRRL 5646)、瑞士假单胞菌(Pseudomonas reinekei)MT1、富养罗尔斯通氏菌(Ralstonia eutropha)JMP134、金属贪铜菌(Ralstonia metallidurans)、红球菌(Rhodococcus jostii)、粟酒裂殖酵母(Schizosaccharomyces pombe)、反刍月形单胞菌(Selenomonas ruminantium)、棒状链霉菌(Streptomyces clavuligenus)、嗜酸共生菌(Syntrophus aciditrophicus)、副溶血性弧菌(Vibrio parahaemolyticus)、创伤弧菌(Vibrio vulnificus)以及本文中公开或可用作相应基因的生物体来源的其它例示性物种(参见实例)。然而,通过现可供使用的超过550种物种的全基因组序列(其中超过一半可以在公共数据库,例如NCBI上获得),包括395种微生物基因组和各种酵母、真菌、植物和哺乳动物基因组,编码近缘或远缘物种中一或多种基因的必需的6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物生物合成活性(包括例如已知基因的同源物、直系同源物、旁系同源物和非直系同源基因置换,和生物体之间的基因变异交换)的基因的鉴别在所属领域中是常规和众所周知的。因此,本文中参考具体生物体(诸如大肠杆菌)所描述的实现6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物的生物合成的代谢变异也可以容易地应用于其它微生物,包括原核和真核生物体。鉴于本文中所提供的教示和指导,所属领域的技术人员将知晓,可以将在一种生物体中例示的代谢变异同样应用于其他生物体。
在一些情况下,诸如当6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物生物合成途径存在于不相关物种中时,可以通过例如来自所述不相关物种的一或多种旁系同源物的外源表达(其催化类似,但非一致的代谢反应以置换参考反应)使宿主物种进行6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物生物合成。因为不同的生物体之间存在代谢网络的某些差异,所属领域的技术人员将理解,不同生物体之间的实际基因用法可能不同。然而,鉴于本文中所提供的教示和指导,所属领域的技术人员还将理解,使用与本文中所例示同源的代谢变异,所述教示和方法可以应用于所有微生物有机体以在感兴趣的物种中建构将合成6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物的微生物有机体。
举例来说,宿主微生物有机体可以选自以下物质并且在以下物质中产生非天然存在的微生物有机体:细菌、酵母、真菌或各种其它适用于发酵方法的微生物中的任一种。例示性细菌包括选自以下的物种:大肠杆菌、催产克雷伯氏菌(Klebsiella oxytoca)、产琥珀酸厌氧螺菌(Anaerobiospirillum succiniciproducens)、产琥珀酸放线杆菌(Actinobacillus succinogenes)、产琥珀酸曼氏杆菌(Mannheimiasucciniciproducens)、埃特里根瘤菌(Rhizobium etli)、枯草芽孢杆菌、谷氨酸棒状杆菌、氧化葡糖杆菌(Gluconobacter oxydans)、运动发酵单胞菌、乳酸乳球菌、植物乳杆菌(Lactobacillus plantarum)、天蓝色链霉菌、丙酮丁醇梭菌(Clostridiumacetobutylicum)、荧光假单胞菌和恶臭假单胞菌。例示性酵母或真菌包括选自以下的物种:酿酒酵母、粟酒裂殖酵母、乳酸克鲁维酵母菌、马克斯克鲁维酵母(Kluyveromycesmarxianus)、土曲霉(Aspergillus terreus)、黑曲霉、毕赤酵母(Pichia pastoris)、少根根霉菌(Rhizopus arrhizus)、稻根霉菌(Rhizobus oryzae)等。举例来说,大肠杆菌是尤其适用的宿主生物体,因为其是被良好表征的适用于基因工程改造的微生物有机体。其它尤其适用的宿主生物体包括酵母,诸如酿酒酵母。应理解,任何适合的微生物宿主生物体可以用于引入代谢和/或基因修饰以产生所需产物。
可以例如通过所属领域中众所周知的重组和检测方法来进行用于建构和测试非天然存在的6-氨基己酸、己内酰胺、己二胺或乙酰丙酸产生宿主的表达量的方法。可以发现这类方法描述于例如萨布鲁克(Sambrook)等人,分子克隆实验指南(Molecular Cloning:ALaboratory Manual),第三版,冷泉港实验室(Cold Spring Harbor Laboratory),纽约(2001);和奥斯贝(Ausubel)等人,最新分子生物学实验方法汇编(Current Protocols inMolecular Biology),约翰·威利父子出版公司(John Wiley and Sons),马里兰州巴尔的摩(Baltimore,MD)(1999)中。
可以使用所属领域中众所周知的技术,包括(但不限于)结合、电穿孔、化学转化、转导、转染和超声波转化,将与6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物的产生途径有关的外源核酸序列稳定地或短暂地引入宿主细胞中。对于大肠杆菌或其它原核细胞中的外源表达,真核核酸的基因或cDNA中的一些核酸序列可以编码靶向信号,诸如N端线粒体或其它靶向信号,所述靶向信号可以视需要在转化到原核宿主细胞中之前被去除。举例来说,去除线粒体前导序列会引起大肠杆菌中的表达增加(霍夫梅斯特(Hoffmeister)等人,生物化学杂志(J.Biol.Chem.)280:4329-4338(2005))。对于酵母或其它真核细胞中的外源表达,基因可以表达于细胞溶质中而不添加前导序列,或可以靶向线粒体或其它细胞器,或通过添加合适的靶向序列(诸如适用于宿主细胞的线粒体靶向或分泌信号)来作为分泌的目标。因此,应理解,可以将用于去除或包括靶向序列的对核酸序列的适当修饰并入外源核酸序列中以提供所需特性。此外,基因可以通过所属领域中众所周知的技术经历密码子优化以实现优化的蛋白质表达。
可以建构一或多种表达载体以包括一或多种如本文中所例示的6-氨基己酸、己内酰胺、己二胺或乙酰丙酸生物合成途径编码核酸,所述核酸可操作地连接至在宿主生物体中具有功能性的表达控制序列。适用于微生物宿主生物体中的表达载体包括例如质粒、噬菌体载体、病毒载体、附加体和人工染色体,包括可操作以稳定集成到宿主染色体中的载体和选择序列或标记物。另外,表达载体可以包括一或多种可选标记基因和适当的表达控制序列。还可以包括例如提供对抗生素或毒素的抗性、补充营养缺陷型不足或提供培养基中没有的关键养分的可选标记基因。表达控制序列可以包括所属领域中众所周知的组成型和诱导型启动转氨酶、转录强化子、转录终止子等。当共同表达两种或更多种外源编码核酸时,可以将两种核酸例如插入单一表达载体或单独的表达载体中。对于单一载体表达,编码核酸可以可操作地连接至一个共同表达控制序列或连接至不同表达控制序列,例如一个诱导型启动子和一个组成型启动子。可以使用所属领域中众所周知的方法证实与代谢或合成路径有关的外源核酸序列的转化。这类方法包括例如核酸分析,诸如mRNA的RNA印迹或聚合酶链反应(PCR)扩增,或用于基因产物的表达的免疫印迹,或用于测试所引入的核酸序列或其对应基因产物的表达的其它合适的分析方法。所属领域的技术人员应理解,外源核酸是以足以产生所需产物的量表达,并且还应理解,可以使用所属领域中众所周知和本文中所公开的方法优化表达量以获得足够的表达。
在一些实施例中,提供用于产生所需中间物或产物(诸如己二酸酯、6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物)的方法。举例来说,用于产生己二酸酯的方法可能涉及将具有己二酸酯途径的非天然存在的微生物有机体在用于产生己二酸酯的条件下培养足够的时间,所述途径包括至少一种编码以足以产生己二酸酯的量表达的己二酸酯途径酶的外源核酸,所述己二酸酯途径包括丁二酰基-CoA:乙酰基-CoA酰基转移酶、3-羟基酰基-CoA脱氢酶、3-羟基己二酰基-CoA脱水转氨酶、己二酸酯半醛还原转氨酶和己二酰基-CoA合成转氨酶或磷酸己二酰转移酶/己二酸酯激酶或己二酰基-CoA:乙酰基-CoA转移酶或己二酰基-CoA水解酶。此外,用于产生己二酸酯的方法可能涉及将具有己二酸酯途径的非天然存在的微生物有机体在用于产生己二酸酯的条件下培养足够的时间,所述途径包括至少一种编码以足以产生己二酸酯的量表达的己二酸酯途径酶的外源核酸,所述己二酸酯途径包括丁二酰基-CoA:乙酰基-CoA酰基转移酶、3-氧代己二酰基-CoA转移酶、3-氧代己二酸酯还原转氨酶、3-羟基己二酸酯脱水转氨酶和2-烯酸酯还原转氨酶。
此外,用于产生6-氨基己酸的方法可能涉及将具有6-氨基己酸途径的非天然存在的微生物有机体在用于产生6-氨基己酸的条件下培养足够的时间,所述途径包括至少一种编码以足以产生6-氨基己酸的量表达的6-氨基己酸途径酶的外源核酸,所述6-氨基己酸途径包括CoA依赖性反-烯酰基-CoA还原转氨酶和转氨酶或6-氨基己酸酯脱氢酶。此外,用于产生己内酰胺的方法可能涉及将具有己内酰胺途径的非天然存在的微生物有机体在用于产生己内酰胺的条件下培养足够的时间,所述途径包括至少一种编码以足以产生己内酰胺的量表达的己内酰胺途径酶的外源核酸,所述己内酰胺途径包括CoA依赖性醛脱氢酶、转氨酶或6-氨基己酸酯脱氢酶和酰胺基水解酶。
可以使用众所周知的方法进行适用于6-氨基己酸、己内酰胺、己二胺或乙酰丙酸的产生的纯化和/或测试分析法。可以培养待测试的各经工程改造的菌株的合适的复本,诸如一式三份培养物。举例来说,可以监视经工程改造的生产宿主中的产物和副产物形成。可以使用所属领域中众所周知的常规程序,通过诸如HPLC(高效液相色谱)、GC-MS(气相色谱-质谱)和LC-MS(液相色谱-质谱)等方法或其它合适的分析方法来分析最终产物和中间物以及其它有机化合物。也可以使用培养物上清液测试发酵液中产物的释放。可以使用例如葡萄糖和醇的折射率检测器以及有机酸的UV检测器通过HPLC(林(Lin)等人,生物技术与生物工程学(Biotechnol.Bioeng.)90:775-779(2005))或所属领域中众所周知的其它合适的分析法和检测方法对副产物和残余葡萄糖进行定量。也可以使用所属领域中众所周知的方法分析来自外源DNA序列的单独的酶活性。
可以使用所属领域中众所周知的各种方法将6-氨基己酸、己内酰胺、己二胺或乙酰丙酸与培养物中的其它组分分离。这类分离方法包括例如包括连续液-液提取、渗透蒸发、膜滤、膜分离、反渗透、电渗析、蒸馏、结晶、离心、萃取过滤、离子交换色谱、尺寸排阻色谱、吸附色谱和超滤的提取程序和方法。
可以培养本文中所描述的任何非天然存在的微生物有机体以产生和/或分泌生物合成产物。举例来说,可以培养6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物生产物以用于6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物的生物合成产生。
对于6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物的产生,在具有碳源和其它必需营养物的培养基中培养重组菌株。有时需要并且可能极需要维持发酵器中的厌氧条件,以降低整个方法的成本。这类条件可以例如通过首先用氮气对培养基进行鼓泡,且接着用隔片和螺旋盖密封烧瓶来实现。对于观察到不以厌氧方式生长的菌株,可以通过在隔片中钻出一个小孔以进行有限的通气来施加微好氧或基本上厌氧条件。例示性厌氧条件已事先描述并且是所属领域中众所周知的。例示性好氧和厌氧条件描述于例如2011年5月24日颁布的美国专利案第7,947,483号中。如本文中所公开,发酵可以按一批、分批进料或连续方式进行。
可以视需要通过添加将培养基维持在合乎需要的pH值所需的碱(诸如NaOH或其它碱)或酸来将培养基的pH值维持在所需pH值,尤其中性pH值,诸如约pH 7。可以使用分光光度计(600nm)通过测量光学密度来确定生长率,并且通过监测随时间推移的碳源消耗来确定葡萄糖摄取率。
生长培养基可以包括例如任何能够向非天然存在的微生物供应碳源的碳水化合物源。这类来源包括例如糖,诸如葡萄糖、木糖、阿拉伯糖、半乳糖、甘露糖、果糖、蔗糖和淀粉。其它碳水化合物源包括例如可再生原料和生物质。可以用作方法中的原料的例示性生物质类型包括纤维素生物质、半纤维素生物质和木质素原料或原料的一部分。这类生物质原料含有例如适用作碳源的碳水化合物底物,诸如葡萄糖、木糖、阿拉伯糖、半乳糖、甘露糖、果糖和淀粉。鉴于本文中所提供的教示和指导,所属领域的技术人员将理解,除以上所例示以外的可再生原料和生物质也可以用于培养微生物有机体,以用于6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物的产生。
除诸如以上所例示的可再生原料以外,6-氨基己酸、己内酰胺、己二胺、其它C5-C14产物微生物有机体也可以被修饰成使用合成气作为其碳源来生长。可以在产生6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物的生物体中表达一或多种蛋白质或酶以提供利用合成气或其它气态碳源的代谢途径。
合成气体,也称为合成气或生产气体,是煤和含碳材料(诸如生物质材料,包括农业作物和残余物)的主要气化产物。合成气是主要包括H2和CO的混合物并且可以由任何有机原料(包括(但不限于)煤、煤油、天然气、生物质和废弃有机物质)的气化获得。气化通常在高燃料与氧比率下进行。尽管主要包括H2和CO,但合成气也可以包括少量的CO2和其它气体。因此,合成气体提供气态碳(诸如CO和CO2)的有成本效益的来源。
伍德-永达尔途径(Wood-Ljungdahl pathway)催化CO和H2转化成乙酰基-CoA和其它产物,诸如乙酸酯。能够利用CO和合成气的生物体通常也具有通过相同的基本酶集合和由伍德-永达尔途径涵盖的转化来利用CO2和CO2/H2混合物的能力。在发现微生物以H2依赖性方式将CO2转化成乙酸酯之后很久才揭露CO也可以被相同生物体使用且涉及相同的途径。已证实只要存在氢以提供必需的还原等效物,那么许多产乙酸菌便可以在存在CO2的情况下生长并且产生化合物,诸如乙酸酯(参见例如德雷克(Drake),乙酸形成作用(Acetogenesis),第3-60页,查普曼和霍尔公司(Chapman and Hall),纽约(1994))。这可以由下式概述:
2CO2+4H2+n ADP+n Pi→CH3COOH+2H2O+n ATP
因此,具有伍德-永达尔途径的非天然存在的微生物也可以利用CO2和H2混合物进行乙酰基-CoA和其它所需产物的产生。
伍德-永达尔途径是所属领域中众所周知的并且由12个反应组成,所述反应可以分成两条支线:(1)甲基支线和(2)羰基支线。甲基支线将合成气转化成甲基-四氢叶酸(甲基-THF),而羰基支线将甲基-THF转化成乙酰基-CoA。甲基支线中的反应依序由以下酶催化:铁氧化还原蛋白氧化还原转氨酶、甲酸酯脱氢酶、甲酰基四氢叶酸合成转氨酶、次甲基四氢叶酸环脱水转氨酶、亚甲基四氢叶酸脱氢酶和亚甲基四氢叶酸还原转氨酶。羰基支线中的反应依序由以下酶或蛋白质催化:腺苷钴胺类咕啉/铁-硫蛋白质、甲基转移酶、一氧化碳脱氢酶、乙酰基-CoA合成酶、乙酰基-CoA合成酶二硫化物还原转氨酶和氢化酶,并且这些酶也可以称为甲基四氢叶酸:类咕啉蛋白质甲基转移酶(例如,AcsE)、类咕啉铁-硫蛋白质、镍-蛋白质组装蛋白质(例如,AcsF)、铁氧化还原蛋白、乙酰基-CoA合成酶、一氧化碳脱氢酶和镍-蛋白质组装蛋白质(例如,CooC)。根据本文中所提供的关于引入足够量的编码核酸以产生6-氨基己酸、己内酰胺、己二胺或乙酰丙酸途径的教示和指导,所属领域的技术人员将理解,对于至少引入宿主生物体中不存在的编码伍德-永达尔酶或蛋白质的核酸,也可以进行相同的工程改造设计。因此,将一或多种编码核酸引入微生物有机体中使得被修饰的生物体含有完整的伍德-永达尔途径将提供合成气利用能力。
此外,与一氧化碳脱氢酶和/或氢化酶活性偶合的还原性(反向)三羧酸循环也可以用于将CO、CO2和/或H2转化成乙酰基-CoA和其它产物,诸如乙酸酯。能够通过还原性TCA途径来固定碳的生物体可以利用以下酶中的一或多种:ATP柠檬酸酯-裂解酶、柠檬酸酯裂解酶、顺乌头酸转氨酶、异柠檬酸酯脱氢酶、α-酮戊二酸:铁氧化还原蛋白氧化还原转氨酶、丁二酰基-CoA合成转氨酶、丁二酰基-CoA转移酶、反丁烯二酸酯还原转氨酶、富马酸酶(fumarase)、苹果酸酯脱氢酶、NAD(P)铁氧化还原蛋白氧化还原转氨酶、一氧化碳脱氢酶和氢化酶。具体地说,使用由一氧化碳脱氢酶和氢化酶从CO和/或H2提取的还原等效物,通过产生乙酰基-CoA或乙酸酯的还原性TCA循环来固定CO2。可以通过诸如乙酰基-CoA转移酶、乙酸激酶/磷酸转乙酰酶和乙酰基-CoA合成转氨酶等酶将乙酸酯转化成乙酰基-CoA。可以通过丙酮酸酯:铁氧化还原蛋白氧化还原转氨酶和葡糖异生酶将乙酰基-CoA转化成对甲苯甲酸酯、对苯二酸酯或(2-羟基-3-甲基-4-氧代丁氧基)膦酸酯前体、甘油醛-3-磷酸酯、磷酸烯醇丙酮酸和丙酮酸酯。根据本文中所提供的用于引入足够数量的编码核酸以产生对甲苯甲酸酯、对苯二甲酸酯或(2-羟基-3-甲基-4-氧代丁氧基)膦酸酯途径的教示和指导,所属领域的技术人员将理解,对于至少引入宿主生物体中不存在的编码还原性TCA途径酶或蛋白质的核酸,也可以进行相同的工程改造设计。因此,将一或多种编码核酸引入微生物有机体中使得被修饰的生物体含有完整的还原性TCA途径将提供合成气利用能力。
鉴于本文中所提供的教示和指导,所属领域的技术人员将理解,可以产生在依靠碳源(碳水化合物)生长时分泌生物合成化合物的非天然存在的微生物有机体。这类化合物包括例如6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物以及6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物途径中的任何中间代谢物。唯一需要的是对一或多种所需酶活性进行工程改造以实现所需化合物或中间物的生物合成,包括例如纳入一些或全部6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物生物合成途径。因此,一些实施例提供非天然存在的微生物有机体,其在依靠碳水化合物生长时产生和/或分泌6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物,和在依靠碳水化合物生长时产生和/或分泌6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物途径中所展示的任何中间代谢物。举例来说,产生己二酸酯的微生物有机体可以视需要由例如3-氧代己二酰基-CoA、3-羟基己二酰基-CoA、5-羧基-2-戊烯酰基-CoA或己二酰基-CoA等中间物来起始合成(参见图1)。此外,产生己二酸酯的微生物有机体可以由例如3-氧代己二酰基-CoA、3-氧代己二酸酯、3-羟基己二酸或己-2-烯二酸酯等中间物来起始合成。产生6-氨基己酸的微生物有机体可以由例如己二酸酯半醛等中间物来起始合成。产生己内酰胺的微生物有机体可以视需要由例如己二酸酯半醛或6-氨基己酸等中间物来起始合成(参见图1)。
在一些实施例中,非天然存在的微生物可以产生己二酸酯、6ACA、己内酯、己二胺或己内酰胺,如图3-8中所示。
非天然存在的微生物有机体可以进一步包括外源表达的编码醛脱氢酶(ALD)或反烯酰基还原酶(TER)或这两者的核酸。ALD与己二酰基-CoA反应产生己二酸酯半醛,而TER与5-羧基-2-戊烯酰基-CoA(CPCoA)反应形成己二酰基CoA。
与丁二酰基-CoA或乙酰基-CoA或这两种底物相比,ALD酶对己二酰基CoA底物具有更高的催化效率和活性。例示性ALD酶如表10中所示。
表10.醛脱氢酶对己二酰基-CoA的活性
/>
/>
/>
/>
/>
/>
/>
在一些实施例中,TER酶如表11中所示。
表11.5-羧基-2-戊烯酰基-CoA还原酶
/>
使用如本文中所例示的所属领域中众所周知的方法建构非天然存在的微生物有机体,以足以产生6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物的量外源表达至少一种编码6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物途径酶的核酸。应理解,在足以产生6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物的条件下培养微生物有机体。根据本文中所提供的教示和指导,非天然存在的微生物有机体可以实现6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物的生物合成,产生约0.1-200mM之间或更高的细胞内浓度。通常,6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物的细胞内浓度在约3-150mM之间,具体地说,在约5-125mM之间且更具体地说,在约8-100mM之间,包括约10mM、20mM、50mM、80mM或更高。也可以由非天然存在的微生物有机体实现介于这些例示性范围中的每一个之间和超过其的细胞内浓度。
培养条件可以包括厌氧或基本上厌氧生长或维持条件。例示性厌氧条件已事先描述并且是所属领域中众所周知的。用于发酵方法的例示性厌氧条件描述于本文中并且描述于例如2011年5月24日颁布的美国专利案第7,947,483号中。任何这些条件可以与非天然存在的微生物有机体和所属领域中众所周知的其它厌氧条件一起使用。在这类厌氧条件下,6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物生产物能够以5-10mM或更高的细胞内浓度以及本文中例示的所有其它浓度合成6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物。应理解,尽管以上描述是指细胞内浓度,但产生6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物的微生物有机体能够细胞内产生6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物和/或将产物分泌到培养基中。
培养条件可以包括例如液体培养物程序以及发酵和其它大规模培养物程序。如本文中所描述,可以在厌氧或基本上厌氧培养条件下获得生物合成产物的尤其适用产率。
如本文中所描述,用于实现6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物的生物合成的一种例示性生长条件包括厌氧培养物或发酵条件。非天然存在的微生物有机体可以在厌氧或基本上厌氧条件下维持、培养或发酵。简单地说,厌氧条件是指不含氧的环境。基本上厌氧条件包括例如培养物、批料发酵或连续发酵,使得培养基中的被溶解的氧浓度保持在0与10%饱和度之间。基本上厌氧条件还包括在保持小于1%氧的气氛的密封腔室内,使细胞在液体培养基中或在固体琼脂上生长或休眠。可以通过例如用N2/CO2混合物或其它合适的一或多种非氧气体对培养物进行鼓泡来维持氧的百分比。
本文中所描述的培养条件可以按比例放大和连续生长,以用于产生6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物。例示性生长程序包括例如分批进料发酵和分批分离;分批进料发酵和连续分离,或连续发酵和连续分离。发酵程序尤其适用于商业数量的6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物的生物合成产生。通常并且与非连续培养程序相同,6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物的连续和/或几乎连续产生将包括在足以维持和/或几乎维持指数生长期的营养物和培养基中培养非天然存在的产生6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物的生物体。在这类条件下的连续培养可以包括例如1天、2、3、4、5、6或7或更多天。此外,连续培养可以包括1周、2、3、4或5或更多周并且最多若干个月。或者,如果适合于具体应用,那么可以将生物体培养数小时。应理解,连续和/或几乎连续培养条件还可以包括这些例示性周期之间所有时间间隔。还应理解,微生物有机体的培养时间是足以产生足够量的产物以用于所需目的的时间段。
发酵程序所属领域中众所周知的。简单地说,用于6-氨基己酸、己内酰胺、己二胺或乙酰丙酸的生物合成产生的发酵可以用于例如分批进料发酵和分批分离;分批进料发酵和连续分离,或连续发酵和连续分离。分批和连续发酵程序的实例是所属领域中众所周知的。
除使用6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物生产物进行大量6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物的连续产生的以上发酵程序以外,6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物生产物还可以例如同时经历化学合成程序以将产物转化成其它化合物,或可以从发酵培养物分离产物且视需要依序经历化学转化以将产物转化成其它化合物。如本文中所描述,可以例如通过借助于铂催化剂进行的化学氢化将利用3-氧代己二酸酯、己-2-烯二酸酯的己二酸酯途径中的中间物转化成己二酸酯。
如本文中所描述,用于实现6-氨基己酸、己内酰胺、己二胺或其它C5-C14产物的生物合成的例示性培养条件包括向培养条件中添加渗透保护剂。在某些实施例中,如上文所描述,非天然存在的微生物有机体可以在存在渗透保护剂的情况下维持、培养或发酵。简单地说,渗透保护剂意指充当渗透调节物质并且帮助本文中所描述的微生物有机体经受住渗透胁迫。渗透保护剂包括(但不限于)甜菜碱、氨基酸和海藻糖。这类渗透保护剂的非限制性实例是甘氨酸甜菜碱、果仁糖甜菜碱、二甲基乙酸噻亭(dimethylthetin)、二甲基巯基丙酸酯、3-二甲基二氢硫基-2-甲基丙酸酯、六氢烟碱酸、哌可酸(pipecolic acid)、二甲基二氢硫基乙酸酯、胆碱、L-肉碱和四氢嘧啶。在一个方面中,渗透保护剂是甘氨酸甜菜碱。所属领域的一般技术人员应理解,适用于保护本文中所描述的微生物有机体避免渗透胁迫的渗透保护剂的量和类型将取决于所使用的微生物有机体。举例来说,在存在不同量的6-氨基己酸的情况下,大肠杆菌适合在存在2mM甘氨酸甜菜碱的情况下生长。培养条件中的渗透保护剂的量可以例如不超过约0.1mM、不超过约0.5mM、不超过约1.0mM、不超过约1.5mM、不超过约2.0mM、不超过约2.5mM、不超过约3.0mM、不超过约5.0mM、不超过约7.0mM、不超过约10mM、不超过约50mM、不超过约100mM或不超过约500mM。
成功地对途径进行工程改造涉及鉴别适当的具有足够的活性和特异性的酶集合。这需要鉴别适当的酶集合,将其相应基因克隆到生产宿主中,优化发酵条件以及在发酵之后分析产物形成。为了对用于产生6-氨基己酸或己内酰胺的生产宿主进行工程改造,可以在宿主微生物中表达一或多种外源DNA序列。此外,微生物可以具有内源基因的功能缺失。这些修饰将允许使用可再生原料产生6-氨基己酸酯或己内酰胺。
在6-氨基己酸转化成HMDA期间最小化或甚至消除环状亚胺或己内酰胺的形成的一些实施例中,需要向6-氨基己酸的氨基添加官能团(例如,乙酰基、丁二酰基)以保护其避免环化。这与在大肠杆菌中由L-谷氨酸形成鸟氨酸类似。具体地说,谷氨酸首先由N-乙酰谷氨酸合成酶转化成N-乙酰基-L-谷氨酸。接着,N-乙酰基-L-谷氨酸被活化成N-乙酰基谷氨酰基-磷酸酯,其经还原和诱导转氨以形成N-乙酰基-L-鸟氨酸。接着,由N-乙酰基-L-鸟氨酸脱乙酰基酶从N-乙酰基-L-鸟氨酸去除乙酰基,形成L-鸟氨酸。这类途径是必需的,因为由谷氨酸形成谷氨酸-5-磷酸酯,接着还原成谷氨酸-5-半醛会引起形成(S)-1-吡咯啉-5-甲酸酯,一种由谷氨酸-5-半醛自发形成的环状亚胺。在由6-氨基己酸形成HMDA的情况下,所述步骤涉及将6-氨基己酸乙酰化成乙酰基-6-氨基己酸、用CoA或磷酸酯基活化羧酸基、还原、胺化和去乙酰化。
实例
实例1. 6-氨基己酸酯的产生
通过使微生物发生基因变异,使得使用类似的酶促反应由丁二酰基-CoA和乙酰基-CoA合成己二酸酯来实现用于产生己二酸酯的高效途径(参见图1)。此方法的成功实施需要表达适当基因、调整其表达以及改变培养条件,由此高乙酰基-CoA、丁二酰基-CoA和/或氧化还原(例如,NADH/NAD+)比率将沿着己二酸酯合成而非降解的方向推进由此途径实现的代谢通量。与梭菌中丁酸酯形成的极高类似性(兼久(Kanehisa)和戈托(Goto),核酸研究(Nucl.Acids Res.)28:27-30(2000))表明,通过由参与代谢物的浓度定向调节的反应,己二酸酯合成途径中的每个步骤在热力学上是可行的。由己二酰基-CoA形成己二酸酯的最终步骤可以通过合成酶、磷酸己二酰转移酶/激酶、转移酶或水解酶机制进行。这类经工程改造的生物体描述于美国专利案第10,415,042号中,其以全文引用的方式并入本文中以用于所有目的。
使用己二酰基-CoA作为前体来形成己内酰胺和/或6-氨基己酸的例示性途径展示于图2中。所述途径涉及可以将己二酰基-CoA还原成己二酸酯半醛的CoA依赖性醛脱氢酶,和可以将此分子转化成6-氨基己酸的转氨酶或6-氨基己酸酯脱氢酶。将6-氨基己酸酯转化成己内酰胺的最终步骤可以通过酰胺基水解酶或化学转化来实现(吉他(Guit)和布依吉斯(Buijs),美国专利案第6,353,100号,2002年3月7日颁布;沃尔特斯(Wolters)等人,美国专利案第5,700,934号,1997年12月23日颁布;阿格特伯格(Agterberg)等人,美国专利案第6,660,857号,2003年12月9日颁布)。假设由图2中展示的反应方案弥补反向己二酸酯降解途径,己内酰胺的最大理论产率计算为0.8摩尔/摩尔所消耗的葡萄糖(参见表7)。所述途径在能量方面是有利的,因为在己内酰胺的最大理论产率下,每摩尔所消耗的葡萄糖形成最多0.78摩尔ATP。如果假设磷酸烯醇丙酮酸羧激酶(PPCK)在朝向草酰乙酸形成的ATP产生方向上起作用,那么可以将ATP产率进一步改良到每摩尔葡萄糖产生1.63摩尔ATP。
由阿迪基-CoA(adiyl-CoA)产生己二酰基-CoA且接着产生6-氨基己酸的经工程改造的生物体描述于美国专利案第10,415,042号中,其以全文引用的方式并入本文中以用于所有目的。此经工程改造的微生物产生6-氨基己酸。
实例2. 6ACA产生受到从细胞输出的限制
使用被工程改造成产生6-氨基己酸(6ACA)的细胞(例如,实例1中进行工程改造的细胞)。使经工程改造的细胞生长并且监测6ACA的细胞内和细胞外水平。经工程改造的大肠杆菌宿主中的6ACA产生展示稳定的6ACA的细胞内累积,以及从细胞内稳定期之前更早的时间开始停止增加的细胞外累积。生产率的其它动力学分析表明,6ACA产生受到转运体将6ACA从细胞输出的限制。
实例3. 6ACA输出物增加6ACA的产生
对6ACA生产细胞系进行工程改造以过度表达以下表12中的转运体。接着,测试过度表达转运体的细胞系的6ACA产生。转运体ybjE(也称为lysO)和yhiM引起6ACA产生的显著增加,而其它九种转运体并未如此。
表12.6ACA生产细胞系中过度表达的转运体
已知ybjE和yhiM都不是6ACA转运体。已报告阿拉伯芥转运体AtGAT1是6ACA的转运体,但其并未增加6ACA产生。可能其Km较高,针对生产细胞系中内源6ACA转运体的Km也是如此。
已知转运体ybjE是赖氨酸转运体,并且已知转运体yhiM是γ-氨基丁酸(GABA)转运体。
实例4. 6ACA输入物的缺失会增加6-氨基己酸酯的产生
以上实例证实,增加细胞外6ACA会增加生产细胞系的6ACA的整体产生。6ACA输入物(将6ACA输入生产细胞系)的缺失也会增加6ACA产生。生产细胞中缺失表13中的输入转运体并且gabP和csiR的缺失会增加6ACA产生,而lysP转运体的缺失并未改变6ACA产生。
表13.6ACA生产细胞系中缺失的输入物
gabP(称为GABA透性酶)或csiR(已知由碳饥饿诱导的输入物)的缺失会增加生产细胞系中6ACA的产生。赖氨酸同向转运体lysP在其缺失之后并未增加6ACA产生。
实例5. GDH的过度表达增加6-氨基己酸酯的产生
6ACA产生途径的最终步骤由利用谷氨酸的转氨酶催化。谷氨酸脱氢酶(GDH)的过度表达增加谷氨酸产生,其可推动6ACA产生的最终转氨酶步骤。图2A和2B展示在低GDH表达、中等GDH表达和高GDH表达情况下的6ACA产生的增加的条形图和图式。GDH的中等和高表达都会增加6ACA的产生。
实例6.粘液表型基因的缺失会增加6-氨基己酸酯的产生
生产细胞系有时呈现粘液表型,并且减少与粘液表型相关的胞外多糖的形成可以增加6ACA的产生。在粘液表型中发现若干基因的上调,并且进行这些基因的删除。基因rcsA、rcsB、wcaF和cpsBG的缺失使生产细胞系成为非粘液型,而被上调的基因galF和yjbop的缺失产生仍为粘液型的菌株。以下表14展示基因缺失对粘液表型和6ACA产生的作用。尽管ΔrcsA、ΔrscB、ΔwcaF和ΔcpsBG皆使生产细胞系成为非粘液型,但仅缺失ΔrcsA和ΔcpsBG引起6ACA产生的大量增加。
表14:粘液表型和6ACA的产生
菌株 粘液表型 6ACA(mM)
亲本 粘液型 11.2
ΔrcsA 非粘液型 41.1
ΔrscB 非粘液型 9.7
ΔgalF 粘液型 11.1
ΔwcaF 非粘液型 12.1
ΔcpsBG 非粘液型 32.9
Δyjb op 粘液型 19.1
粘液表型不利于6ACA菌株的生产特性。粘液型菌株需要大直径过滤器,产生双层细胞集结粒,细胞未完全集结,在生产期间的操作更复杂,并且粘液表型的胞外多糖从所需产物夺取碳。
与亲本粘液型菌株相比,具有缺失ΔrcsA的非粘液型菌株使6ACA产生增加约四倍。与亲本菌株相比,非粘液型菌株ΔcpsBG使6ACA产生增加约三倍。与亲本菌株相比,两种其它非粘液型缺失品系所引起的6ACA产生的增加可忽略不计。
实例7. 6ACA转运体、GDH和抗粘液型缺失会增加6-氨基己酸酯的产生
对用于产生6-氨基己酸的生产细胞系进行工程改造以过度表达ybjE(lysO)输出物和谷氨酸脱氢酶,以及破坏rcsA以防止粘液表型。还用9833T对生产细胞系进行工程改造。由这些经工程改造的细胞系进行的6-氨基己酸的产生展示于下表中:
表15:6ACA产生
向6ACA生产细胞系的早期版本添加ybjE使滴定度从9.6增加到15.9(66%增加),使速率从0.13增加到0.22(69%增加)并且使产率从0.07增加到0.12(71%增加)。
对6ACA生产细胞系做出的每一种变化(添加输出物(ybjE)、添加gdh和破坏rcsA)都使生产细胞系产生的6ACA增加。当这些变化与9893T组合时,6ACA产生整体增加约4倍。
实例8. 6ACA转运体活性
在大肠杆菌的ΔlysO菌株中测试假定的6ACA转运体,所述菌株也包括编码6ACA途径酶的基因的:1)硫解酶(Thl),2)3-羟基丁酰基-CoA脱氢酶(Hbd),3)巴豆酸酶(Crt),4)反-烯酰基-CoA还原酶(Ter),5)醛脱氢酶(ALD),和6)转氨酶(TA)。或者,将假定的6ACA转运体集成到含有途径基因的大肠杆菌染色体上,并且评估所得菌株的6ACA产生。
在基本培养基中向经工程改造的大肠杆菌细胞供应5%葡萄糖,并且在35℃下培育16-24小时之后,收集细胞,并且通过标准LC/MS方法或使用纯化的6ACA-转氨酶以酶促方式确定上清液中的6ACA水平。关于6ACA的酶检测,在将纯化的6ACA转氨酶(3μM)、50U/mL的牛谷氨酸脱氢酶(SIGMA)、0.1mMα-酮戊二酸、0.1mM NAD、10μMPMS(1-甲氧基-5-甲基酚嗪鎓硫酸甲酯)和2mM XTT(2,3-双-(2-甲氧基-4-硝基-5-磺基苯基)-2H-四唑鎓-5-甲酰苯胺)在0.1M Tris-HCl,pH 7.4缓冲液中培育之后测量在450nm下的吸光度。使用含有已知量的6ACA和与上文所描述相同的组分的校准曲线确定上清液中的6ACA水平。对于所评估的各转运体基因,相对于不含候选基因的质粒(空白载体;阴性对照)的上清液中的6ACA,由含有转运体基因的质粒的上清液中的6ACA确定相对6ACA输出。相对于未添加6ACA转运体的对照物,由上清液中6ACA的量对假定的6ACA转运体的活性进行评分([假定的6ACA转运体的上清液6ACA]/[未添加假定的6ACA转运体的上清液6ACA])。
所测试的假定的6ACA转运体的结果展示于以下表16中。相关转运分数<0.80是一个负号(-),分数为0.8-1.1是+,且分数为1.10-2.0是++,并且未检测到是空白。具有++的分数的6ACA转运体增加6ACA从细胞的输出。减少从细胞输出的6ACA的量的6ACA转运体(-和空白)是6ACA输入物。
表16.6ACA输出物活性
/>
/>
实例9:谷氨酸脱氢酶活性
将假定的GDH候选物克隆到表达质粒中且转形到大肠杆菌中。在600nm下测量具有假定的GDH候选物的大肠杆菌的细胞悬浮液,并且将细胞悬浮液针对OD为4来标准化。通过离心来制备细胞集结粒并且接着用含有核酸酶和溶菌酶的化学溶解试剂在室温下将集结粒溶解30分钟。使用此溶解物在室温(22-25℃)下测量Gdh活性并且分析法进行如下:将粗Gdh溶解物的等分试样、所需浓度的α-酮戊二酸(0.5mM)、5mM氯化铵和0.2mM NADH或NADPH在0.02mL 0.1M Tris-HCl,pH 7.5缓冲液中混合。使用荧光或在340nm下的吸光度,通过NADH或NADPH氧化监测反应的动力学。使用板读取器程序确定速率(ΔF/min)。确定针对SEQID NO:10的相对活性。
表17.GDH活性
/>
/>
/>
/>
实例10:减少胍丁胺和腐胺
通过被工程改造成具有图1的HMD途径(A B C D N O P Q R U V W)的大肠杆菌菌株中的缺失来敲除精氨酸脱羧酶(speA,GenBank寄存编号NP_417413.1,Uniprot寄存编号P21170,SEQ ID NO:49)和胍丁胺酶(speB,GenBank寄存编号NP_417412.1,UniProt寄存编号P60651,SEQ ID NO:51)。
与不具有缺失的HMD菌株相比,由于胍丁胺和腐胺副产物的比率和滴定度降低,这些菌株中的6ACA的产生增加。ΔspeAB菌株的这些结果展示于图9A和9B中。
本文所讨论和引用的所有出版物、专利和专利申请都以全文引用的方式并入本文。应理解,所公开的本发明不限于所描述的具体方法、方案和材料,因为这些可以变化。还应理解,本文使用的术语仅用于描述具体实施例的目的,且并不意图限制本发明的范围,本发明的范围仅由所附权利要求限制。
所属领域技术人员将认识到或能够仅使用常规实验来确定本文所描述的本发明的具体实施例的许多等效物。这类等效物意图由所附权利要求书涵盖。
序列表
<110> 美商奇諾麥提卡公司(Genomatica, Inc.)
<120> 用于制备酰胺化合物的方法和组合物
<130> GMTA.0048
<160> 94
<170> PatentIn version 3.5
<210> 1
<211> 900
<212> DNA
<213> 大肠杆菌
<400> 1
atgttttctg ggctgttaat cattctggtt cccctgattg tgggttacct cattccgctt 60
cgccaacaag ctgcgttaaa agttattaat cagctattaa gctggatggt ttaccttatt 120
ctctttttta tgggtatcag tctggcgttt ctcgataacc tcgccagtaa cctgttggcg 180
attctgcatt attctgccgt cagtattacc gttattttac tgtgtaatat tgccgccctg 240
atgtggctgg agcgaggcct gccgtggcgc aaccaccatc agcaagaaaa actcccgtcg 300
cgtattgcga tggcgctgga gtcgctaaaa ctgtgcggcg tagtagtgat tggttttgcc 360
attggtctaa gtggactggc tttcttacaa cacgcgaccg aagccagtga atacacgtta 420
attttgctac ttttcctcgt tggtattcag ttgcgcaata atggcatgac cttaaagcag 480
attgtcctta atcgccgggg aatgattgtc gccgtggtgg tggttgtcag ttcattaatt 540
ggtggtttaa ttaacgcctt tattcttgat ctccccatca ataccgcgct ggcaatggcc 600
tccggtttcg gctggtattc tctttccggt attttattga ccgaatcttt tggtccggta 660
atcgggagcg cggcgttttt taatgatctg gcccgtgaac tgattgctat tatgttgatc 720
cctgggctga ttcgccgcag ccgctctact gcactgggct tatgcggtgc cacatcaatg 780
gatttcaccc tgcccgttct tcaacgtact ggcgggctgg atatggtccc ggcggcaatt 840
gttcacggtt ttattcttag cctgttagtg ccgatcctca tcgccttttt ctctgcgtag 900
<210> 2
<211> 299
<212> PRT
<213> 大肠杆菌
<400> 2
Met Phe Ser Gly Leu Leu Ile Ile Leu Val Pro Leu Ile Val Gly Tyr
1 5 10 15
Leu Ile Pro Leu Arg Gln Gln Ala Ala Leu Lys Val Ile Asn Gln Leu
20 25 30
Leu Ser Trp Met Val Tyr Leu Ile Leu Phe Phe Met Gly Ile Ser Leu
35 40 45
Ala Phe Leu Asp Asn Leu Ala Ser Asn Leu Leu Ala Ile Leu His Tyr
50 55 60
Ser Ala Val Ser Ile Thr Val Ile Leu Leu Cys Asn Ile Ala Ala Leu
65 70 75 80
Met Trp Leu Glu Arg Gly Leu Pro Trp Arg Asn His His Gln Gln Glu
85 90 95
Lys Leu Pro Ser Arg Ile Ala Met Ala Leu Glu Ser Leu Lys Leu Cys
100 105 110
Gly Val Val Val Ile Gly Phe Ala Ile Gly Leu Ser Gly Leu Ala Phe
115 120 125
Leu Gln His Ala Thr Glu Ala Ser Glu Tyr Thr Leu Ile Leu Leu Leu
130 135 140
Phe Leu Val Gly Ile Gln Leu Arg Asn Asn Gly Met Thr Leu Lys Gln
145 150 155 160
Ile Val Leu Asn Arg Arg Gly Met Ile Val Ala Val Val Val Val Val
165 170 175
Ser Ser Leu Ile Gly Gly Leu Ile Asn Ala Phe Ile Leu Asp Leu Pro
180 185 190
Ile Asn Thr Ala Leu Ala Met Ala Ser Gly Phe Gly Trp Tyr Ser Leu
195 200 205
Ser Gly Ile Leu Leu Thr Glu Ser Phe Gly Pro Val Ile Gly Ser Ala
210 215 220
Ala Phe Phe Asn Asp Leu Ala Arg Glu Leu Ile Ala Ile Met Leu Ile
225 230 235 240
Pro Gly Leu Ile Arg Arg Ser Arg Ser Thr Ala Leu Gly Leu Cys Gly
245 250 255
Ala Thr Ser Met Asp Phe Thr Leu Pro Val Leu Gln Arg Thr Gly Gly
260 265 270
Leu Asp Met Val Pro Ala Ala Ile Val His Gly Phe Ile Leu Ser Leu
275 280 285
Leu Val Pro Ile Leu Ile Ala Phe Phe Ser Ala
290 295
<210> 3
<211> 1053
<212> DNA
<213> 大肠杆菌
<400> 3
atgaacatat atatcgggtg gcttttcaaa ttaatccctt tgattatggg cttaatttgt 60
atcgcgttag gtggctttgt gctggaaagt tcagggcaaa gcgagtattt cgtcgcgggt 120
catgtgctga tttctctggc ggccatatgc ctggcattat tcactaccgc atttattatc 180
atttcgcagc tcacgcgcgg cgttaatacg ttttacaata cattgttccc cattattggc 240
tatgcggggt caattatcac catgatatgg ggttgggcac tgttagcagg caatgatgtg 300
atggcagacg agtttgtcgc cggccatgtt attttcggcg ttggtatgat tgccgcctgt 360
gtatcgacgg tggcagcgtc atccggtcac tttctgctca ttcccaaaaa tgcagcgggg 420
agcaagagcg acggaacacc ggtacaggct tattcttcat taatcggtaa ctgcctcatt 480
gccgttcccg ttttactcac cctgctcggt ttcatttggt ctattacgct gttacgtagt 540
gctgacataa ctccgcatta tgtcgcgggt cacgtattgc ttgggttaac cgcaatctgt 600
gcctgtctaa ttggccttgt tgccacaatt gtccatcaaa cacgtaatac gttttcaact 660
aaagaacact ggctgtggtg ttattgggtt atttttctcg gctcaatcac ggtactgcag 720
gggatatacg tcttagtcag ttccgatgca agcgcccgac tggctcccgg cattattctt 780
atttgcctcg gaatgatctg ttacagcata ttctcaaaag tctggctact ggcactggta 840
tggagacgta cctgttcgtt agccaacaga ataccgatga ttcccgtctt cacctgcctg 900
ttttgccttt tcctggcatc gtttcttgcg gaaatggcgc agaccgacat gggatatttt 960
attccttcgc gagttctggt cggtttggga gcggtatgct ttacgttgtt ctcaatcgtt 1020
tcaatattag aagcgggttc tgctaaaaaa tag 1053
<210> 4
<211> 350
<212> PRT
<213> 大肠杆菌
<400> 4
Met Asn Ile Tyr Ile Gly Trp Leu Phe Lys Leu Ile Pro Leu Ile Met
1 5 10 15
Gly Leu Ile Cys Ile Ala Leu Gly Gly Phe Val Leu Glu Ser Ser Gly
20 25 30
Gln Ser Glu Tyr Phe Val Ala Gly His Val Leu Ile Ser Leu Ala Ala
35 40 45
Ile Cys Leu Ala Leu Phe Thr Thr Ala Phe Ile Ile Ile Ser Gln Leu
50 55 60
Thr Arg Gly Val Asn Thr Phe Tyr Asn Thr Leu Phe Pro Ile Ile Gly
65 70 75 80
Tyr Ala Gly Ser Ile Ile Thr Met Ile Trp Gly Trp Ala Leu Leu Ala
85 90 95
Gly Asn Asp Val Met Ala Asp Glu Phe Val Ala Gly His Val Ile Phe
100 105 110
Gly Val Gly Met Ile Ala Ala Cys Val Ser Thr Val Ala Ala Ser Ser
115 120 125
Gly His Phe Leu Leu Ile Pro Lys Asn Ala Ala Gly Ser Lys Ser Asp
130 135 140
Gly Thr Pro Val Gln Ala Tyr Ser Ser Leu Ile Gly Asn Cys Leu Ile
145 150 155 160
Ala Val Pro Val Leu Leu Thr Leu Leu Gly Phe Ile Trp Ser Ile Thr
165 170 175
Leu Leu Arg Ser Ala Asp Ile Thr Pro His Tyr Val Ala Gly His Val
180 185 190
Leu Leu Gly Leu Thr Ala Ile Cys Ala Cys Leu Ile Gly Leu Val Ala
195 200 205
Thr Ile Val His Gln Thr Arg Asn Thr Phe Ser Thr Lys Glu His Trp
210 215 220
Leu Trp Cys Tyr Trp Val Ile Phe Leu Gly Ser Ile Thr Val Leu Gln
225 230 235 240
Gly Ile Tyr Val Leu Val Ser Ser Asp Ala Ser Ala Arg Leu Ala Pro
245 250 255
Gly Ile Ile Leu Ile Cys Leu Gly Met Ile Cys Tyr Ser Ile Phe Ser
260 265 270
Lys Val Trp Leu Leu Ala Leu Val Trp Arg Arg Thr Cys Ser Leu Ala
275 280 285
Asn Arg Ile Pro Met Ile Pro Val Phe Thr Cys Leu Phe Cys Leu Phe
290 295 300
Leu Ala Ser Phe Leu Ala Glu Met Ala Gln Thr Asp Met Gly Tyr Phe
305 310 315 320
Ile Pro Ser Arg Val Leu Val Gly Leu Gly Ala Val Cys Phe Thr Leu
325 330 335
Phe Ser Ile Val Ser Ile Leu Glu Ala Gly Ser Ala Lys Lys
340 345 350
<210> 5
<211> 1401
<212> DNA
<213> 大肠杆菌
<400> 5
atggggcaat catcgcaacc acatgagtta ggcggcgggc tgaagtcacg ccacgtcacc 60
atgttgtcta ttgccggtgt tatcggcgca agtctgtttg tcggttccag cgtcgccatc 120
gccgaagcgg gcccggcggt attactggcc tatctgttcg ccgggctact ggtggttatg 180
attatgcgga tgttggcgga aatggcggtt gccacgcccg ataccggttc gttttccacc 240
tatgccgata aagccattgg tcgctgggcg ggctatacca tcggctggtt gtactggtgg 300
ttttgggtac tggttatccc gctggaagcc aacatcgccg ccatgatcct gcactcatgg 360
gttccaggca ttcccatctg gttattttcc ctcgtcatta ccctcgcctt aactggcagt 420
aacttattaa gcgttaaaaa ctacggcgaa tttgagttct ggctggcgct gtgcaaagtc 480
atcgctatcc tggcctttat tttccttggt gcagtcgcaa ttagcggttt ttacccgtat 540
gccgaagtga gcgggatctc aagattgtgg gatagcggcg gctttatgcc caacggtttc 600
ggtgcggtat taagcgcgat gttgatcacc atgttctcgt ttatgggcgc agaaattgtc 660
accattgccg ccgcggaatc cgacacgccg gaaaaacata ttgtccgcgc caccaactcg 720
gttatctggc gtatttctat cttctattta tgttctattt ttgtcgtcgt ggcattaatt 780
ccgtggaata tgcccggact aaaagccgtc ggttcttatc gctcggtact ggaattgctc 840
aatattcccc atgcgaaatt aatcatggac tgcgtgatat tactttccgt aaccagttgc 900
ctgaactcgg cgctgtatac cgcgtcaagg atgctctact ccttaagtcg tcgcggtgat 960
gctcccgcgg taatgggtaa aatcaaccgc agtaaaaccc cgtacgtggc ggtgttactc 1020
tccaccggcg cggcattctt aacggtggtg gtgaactatt acgcgcctgc gaaggtattt 1080
aaatttctga tcgacagctc cggcgctatc gccctgctgg tttatttagt catcgccgtt 1140
tcacagttgc ggatgcgcaa aattctgcga gcagaaggaa gcgaaattcg cttgcgaatg 1200
tggctttatc cgtggctcac ctggctagtc atcggcttta ttacctttgt gttggtagtg 1260
atgctattcc gtccggcgca acagttagaa gtgatctcca ccggcttatt agcgataggg 1320
attatctgta ccgtgccaat tatggctcgc tggaaaaagc tggtattgtg gcaaaaaaca 1380
cccgttcata atacgcgctg a 1401
<210> 6
<211> 466
<212> PRT
<213> 大肠杆菌
<400> 6
Met Gly Gln Ser Ser Gln Pro His Glu Leu Gly Gly Gly Leu Lys Ser
1 5 10 15
Arg His Val Thr Met Leu Ser Ile Ala Gly Val Ile Gly Ala Ser Leu
20 25 30
Phe Val Gly Ser Ser Val Ala Ile Ala Glu Ala Gly Pro Ala Val Leu
35 40 45
Leu Ala Tyr Leu Phe Ala Gly Leu Leu Val Val Met Ile Met Arg Met
50 55 60
Leu Ala Glu Met Ala Val Ala Thr Pro Asp Thr Gly Ser Phe Ser Thr
65 70 75 80
Tyr Ala Asp Lys Ala Ile Gly Arg Trp Ala Gly Tyr Thr Ile Gly Trp
85 90 95
Leu Tyr Trp Trp Phe Trp Val Leu Val Ile Pro Leu Glu Ala Asn Ile
100 105 110
Ala Ala Met Ile Leu His Ser Trp Val Pro Gly Ile Pro Ile Trp Leu
115 120 125
Phe Ser Leu Val Ile Thr Leu Ala Leu Thr Gly Ser Asn Leu Leu Ser
130 135 140
Val Lys Asn Tyr Gly Glu Phe Glu Phe Trp Leu Ala Leu Cys Lys Val
145 150 155 160
Ile Ala Ile Leu Ala Phe Ile Phe Leu Gly Ala Val Ala Ile Ser Gly
165 170 175
Phe Tyr Pro Tyr Ala Glu Val Ser Gly Ile Ser Arg Leu Trp Asp Ser
180 185 190
Gly Gly Phe Met Pro Asn Gly Phe Gly Ala Val Leu Ser Ala Met Leu
195 200 205
Ile Thr Met Phe Ser Phe Met Gly Ala Glu Ile Val Thr Ile Ala Ala
210 215 220
Ala Glu Ser Asp Thr Pro Glu Lys His Ile Val Arg Ala Thr Asn Ser
225 230 235 240
Val Ile Trp Arg Ile Ser Ile Phe Tyr Leu Cys Ser Ile Phe Val Val
245 250 255
Val Ala Leu Ile Pro Trp Asn Met Pro Gly Leu Lys Ala Val Gly Ser
260 265 270
Tyr Arg Ser Val Leu Glu Leu Leu Asn Ile Pro His Ala Lys Leu Ile
275 280 285
Met Asp Cys Val Ile Leu Leu Ser Val Thr Ser Cys Leu Asn Ser Ala
290 295 300
Leu Tyr Thr Ala Ser Arg Met Leu Tyr Ser Leu Ser Arg Arg Gly Asp
305 310 315 320
Ala Pro Ala Val Met Gly Lys Ile Asn Arg Ser Lys Thr Pro Tyr Val
325 330 335
Ala Val Leu Leu Ser Thr Gly Ala Ala Phe Leu Thr Val Val Val Asn
340 345 350
Tyr Tyr Ala Pro Ala Lys Val Phe Lys Phe Leu Ile Asp Ser Ser Gly
355 360 365
Ala Ile Ala Leu Leu Val Tyr Leu Val Ile Ala Val Ser Gln Leu Arg
370 375 380
Met Arg Lys Ile Leu Arg Ala Glu Gly Ser Glu Ile Arg Leu Arg Met
385 390 395 400
Trp Leu Tyr Pro Trp Leu Thr Trp Leu Val Ile Gly Phe Ile Thr Phe
405 410 415
Val Leu Val Val Met Leu Phe Arg Pro Ala Gln Gln Leu Glu Val Ile
420 425 430
Ser Thr Gly Leu Leu Ala Ile Gly Ile Ile Cys Thr Val Pro Ile Met
435 440 445
Ala Arg Trp Lys Lys Leu Val Leu Trp Gln Lys Thr Pro Val His Asn
450 455 460
Thr Arg
465
<210> 7
<211> 663
<212> DNA
<213> 大肠杆菌
<400> 7
atgaccatta cgtctctgga tggctatcgc tggctgaaga acgatattat tcgcggtaat 60
tttcaaccgg atgaaaaatt acgaatgagt ttgctgacat cgcgttatgc acttggcgtt 120
gggccgttac gggaagctct ttcgcaactg gtggcggaac ggctggtcac ggtggtgaat 180
caaaaagggt atcgggtggc gtctatgtca gagcaggagc tgctcgatat tttcgacgcc 240
cgcgccaata tggaagcgat gttagtgagt ctggcgattg cccgcggtgg cgatgagtgg 300
gaggcagacg ttctcgcaaa agcgcatctg ctgagtaagc ttgaggcctg tgacgccagc 360
gagaaaatgc ttgatgagtg ggatctgcgt catcaggcgt ttcatacggc aattgtggcg 420
ggctgtggtt ctcactattt gctgcaaatg cgtgaacggt tgtttgatct ggcggcgcgt 480
tatcgattta tctggctgcg gcgaacggtg ctttcggtgg aaatgctgga ggataaacac 540
gatcagcacc agaccctgac tgcggcggta ctggcgcgag ataccgcgcg cgccagtgag 600
ttaatgcgcc agcatttact gacgccaatt cccattatcc agcaggcgat ggctggcaat 660
taa 663
<210> 8
<211> 220
<212> PRT
<213> 大肠杆菌
<400> 8
Met Thr Ile Thr Ser Leu Asp Gly Tyr Arg Trp Leu Lys Asn Asp Ile
1 5 10 15
Ile Arg Gly Asn Phe Gln Pro Asp Glu Lys Leu Arg Met Ser Leu Leu
20 25 30
Thr Ser Arg Tyr Ala Leu Gly Val Gly Pro Leu Arg Glu Ala Leu Ser
35 40 45
Gln Leu Val Ala Glu Arg Leu Val Thr Val Val Asn Gln Lys Gly Tyr
50 55 60
Arg Val Ala Ser Met Ser Glu Gln Glu Leu Leu Asp Ile Phe Asp Ala
65 70 75 80
Arg Ala Asn Met Glu Ala Met Leu Val Ser Leu Ala Ile Ala Arg Gly
85 90 95
Gly Asp Glu Trp Glu Ala Asp Val Leu Ala Lys Ala His Leu Leu Ser
100 105 110
Lys Leu Glu Ala Cys Asp Ala Ser Glu Lys Met Leu Asp Glu Trp Asp
115 120 125
Leu Arg His Gln Ala Phe His Thr Ala Ile Val Ala Gly Cys Gly Ser
130 135 140
His Tyr Leu Leu Gln Met Arg Glu Arg Leu Phe Asp Leu Ala Ala Arg
145 150 155 160
Tyr Arg Phe Ile Trp Leu Arg Arg Thr Val Leu Ser Val Glu Met Leu
165 170 175
Glu Asp Lys His Asp Gln His Gln Thr Leu Thr Ala Ala Val Leu Ala
180 185 190
Arg Asp Thr Ala Arg Ala Ser Glu Leu Met Arg Gln His Leu Leu Thr
195 200 205
Pro Ile Pro Ile Ile Gln Gln Ala Met Ala Gly Asn
210 215 220
<210> 9
<211> 1344
<212> DNA
<213> 大肠杆菌
<400> 9
atggatcaga catattctct ggagtcattc ctcaaccatg tccaaaagcg cgacccgaat 60
caaaccgagt tcgcgcaagc cgttcgtgaa gtaatgacca cactctggcc ttttcttgaa 120
caaaatccaa aatatcgcca gatgtcatta ctggagcgtc tggttgaacc ggagcgcgtg 180
atccagtttc gcgtggtatg ggttgatgat cgcaaccaga tacaggtcaa ccgtgcatgg 240
cgtgtgcagt tcagctctgc catcggcccg tacaaaggcg gtatgcgctt ccatccgtca 300
gttaaccttt ccattctcaa attcctcggc tttgaacaaa ccttcaaaaa tgccctgact 360
actctgccga tgggcggtgg taaaggcggc agcgatttcg atccgaaagg aaaaagcgaa 420
ggtgaagtga tgcgtttttg ccaggcgctg atgactgaac tgtatcgcca cctgggcgcg 480
gataccgacg ttccggcagg tgatatcggg gttggtggtc gtgaagtcgg ctttatggcg 540
gggatgatga aaaagctctc caacaatacc gcctgcgtct tcaccggtaa gggcctttca 600
tttggcggca gtcttattcg cccggaagct accggctacg gtctggttta tttcacagaa 660
gcaatgctaa aacgccacgg tatgggtttt gaagggatgc gcgtttccgt ttctggctcc 720
ggcaacgtcg cccagtacgc tatcgaaaaa gcgatggaat ttggtgctcg tgtgatcact 780
gcgtcagact ccagcggcac tgtagttgat gaaagcggat tcacgaaaga gaaactggca 840
cgtcttatcg aaatcaaagc cagccgcgat ggtcgagtgg cagattacgc caaagaattt 900
ggtctggtct atctcgaagg ccaacagccg tggtctctac cggttgatat cgccctgcct 960
tgcgccaccc agaatgaact ggatgttgac gccgcgcatc agcttatcgc taatggcgtt 1020
aaagccgtcg ccgaaggggc aaatatgccg accaccatcg aagcgactga actgttccag 1080
caggcaggcg tactatttgc accgggtaaa gcggctaatg ctggtggcgt cgctacatcg 1140
ggcctggaaa tggcacaaaa cgctgcgcgc ctgggctgga aagccgagaa agttgacgca 1200
cgtttgcatc acatcatgct ggatatccac catgcctgtg ttgagcatgg tggtgaaggt 1260
gagcaaacca actacgtgca gggcgcgaac attgccggtt ttgtgaaggt tgccgatgcg 1320
atgctggcgc agggtgtgat ttaa 1344
<210> 10
<211> 447
<212> PRT
<213> 大肠杆菌
<400> 10
Met Asp Gln Thr Tyr Ser Leu Glu Ser Phe Leu Asn His Val Gln Lys
1 5 10 15
Arg Asp Pro Asn Gln Thr Glu Phe Ala Gln Ala Val Arg Glu Val Met
20 25 30
Thr Thr Leu Trp Pro Phe Leu Glu Gln Asn Pro Lys Tyr Arg Gln Met
35 40 45
Ser Leu Leu Glu Arg Leu Val Glu Pro Glu Arg Val Ile Gln Phe Arg
50 55 60
Val Val Trp Val Asp Asp Arg Asn Gln Ile Gln Val Asn Arg Ala Trp
65 70 75 80
Arg Val Gln Phe Ser Ser Ala Ile Gly Pro Tyr Lys Gly Gly Met Arg
85 90 95
Phe His Pro Ser Val Asn Leu Ser Ile Leu Lys Phe Leu Gly Phe Glu
100 105 110
Gln Thr Phe Lys Asn Ala Leu Thr Thr Leu Pro Met Gly Gly Gly Lys
115 120 125
Gly Gly Ser Asp Phe Asp Pro Lys Gly Lys Ser Glu Gly Glu Val Met
130 135 140
Arg Phe Cys Gln Ala Leu Met Thr Glu Leu Tyr Arg His Leu Gly Ala
145 150 155 160
Asp Thr Asp Val Pro Ala Gly Asp Ile Gly Val Gly Gly Arg Glu Val
165 170 175
Gly Phe Met Ala Gly Met Met Lys Lys Leu Ser Asn Asn Thr Ala Cys
180 185 190
Val Phe Thr Gly Lys Gly Leu Ser Phe Gly Gly Ser Leu Ile Arg Pro
195 200 205
Glu Ala Thr Gly Tyr Gly Leu Val Tyr Phe Thr Glu Ala Met Leu Lys
210 215 220
Arg His Gly Met Gly Phe Glu Gly Met Arg Val Ser Val Ser Gly Ser
225 230 235 240
Gly Asn Val Ala Gln Tyr Ala Ile Glu Lys Ala Met Glu Phe Gly Ala
245 250 255
Arg Val Ile Thr Ala Ser Asp Ser Ser Gly Thr Val Val Asp Glu Ser
260 265 270
Gly Phe Thr Lys Glu Lys Leu Ala Arg Leu Ile Glu Ile Lys Ala Ser
275 280 285
Arg Asp Gly Arg Val Ala Asp Tyr Ala Lys Glu Phe Gly Leu Val Tyr
290 295 300
Leu Glu Gly Gln Gln Pro Trp Ser Leu Pro Val Asp Ile Ala Leu Pro
305 310 315 320
Cys Ala Thr Gln Asn Glu Leu Asp Val Asp Ala Ala His Gln Leu Ile
325 330 335
Ala Asn Gly Val Lys Ala Val Ala Glu Gly Ala Asn Met Pro Thr Thr
340 345 350
Ile Glu Ala Thr Glu Leu Phe Gln Gln Ala Gly Val Leu Phe Ala Pro
355 360 365
Gly Lys Ala Ala Asn Ala Gly Gly Val Ala Thr Ser Gly Leu Glu Met
370 375 380
Ala Gln Asn Ala Ala Arg Leu Gly Trp Lys Ala Glu Lys Val Asp Ala
385 390 395 400
Arg Leu His His Ile Met Leu Asp Ile His His Ala Cys Val Glu His
405 410 415
Gly Gly Glu Gly Glu Gln Thr Asn Tyr Val Gln Gly Ala Asn Ile Ala
420 425 430
Gly Phe Val Lys Val Ala Asp Ala Met Leu Ala Gln Gly Val Ile
435 440 445
<210> 11
<211> 624
<212> DNA
<213> 大肠杆菌
<400> 11
atgtcaacga ttattatgga tttatgtagt tacacccgac taggtttaac cgggtatctg 60
ttgagtagag gggttaaaaa aagagaaatc aacgacattg aaaccgttga tgaccttgcc 120
atagcttgtg attcacagcg cccttcagtg gtgtttatta atgaggactg tttcatccac 180
gatgcttcta acagtcagcg tatcaagctc atcattaatc aacatcccaa tacgttattt 240
atcgttttta tggcaattgc caatgttcat tttgatgaat atctattggt cagaaaaaat 300
ttattgatca gttctaaatc gattaaaccg gaatctctcg acgatatcct tggcgatatt 360
ctgaaaaaag agacaacgat aacctcgttt ttaaatatgc cgacgttatc attgagccga 420
accgaatcga gtatgttgcg aatgtggatg gcaggtcagg gaaccattca aatctctgac 480
caaatgaata tcaaagccaa gaccgtttca tcgcataaag gtaatattaa acgtaagatc 540
aaaacgcata ataaacaggt tatctaccat gtcgtccgac tgacggataa tgtgactaat 600
ggtatttttg tcaacatgcg ctaa 624
<210> 12
<211> 207
<212> PRT
<213> 大肠杆菌
<400> 12
Met Ser Thr Ile Ile Met Asp Leu Cys Ser Tyr Thr Arg Leu Gly Leu
1 5 10 15
Thr Gly Tyr Leu Leu Ser Arg Gly Val Lys Lys Arg Glu Ile Asn Asp
20 25 30
Ile Glu Thr Val Asp Asp Leu Ala Ile Ala Cys Asp Ser Gln Arg Pro
35 40 45
Ser Val Val Phe Ile Asn Glu Asp Cys Phe Ile His Asp Ala Ser Asn
50 55 60
Ser Gln Arg Ile Lys Leu Ile Ile Asn Gln His Pro Asn Thr Leu Phe
65 70 75 80
Ile Val Phe Met Ala Ile Ala Asn Val His Phe Asp Glu Tyr Leu Leu
85 90 95
Val Arg Lys Asn Leu Leu Ile Ser Ser Lys Ser Ile Lys Pro Glu Ser
100 105 110
Leu Asp Asp Ile Leu Gly Asp Ile Leu Lys Lys Glu Thr Thr Ile Thr
115 120 125
Ser Phe Leu Asn Met Pro Thr Leu Ser Leu Ser Arg Thr Glu Ser Ser
130 135 140
Met Leu Arg Met Trp Met Ala Gly Gln Gly Thr Ile Gln Ile Ser Asp
145 150 155 160
Gln Met Asn Ile Lys Ala Lys Thr Val Ser Ser His Lys Gly Asn Ile
165 170 175
Lys Arg Lys Ile Lys Thr His Asn Lys Gln Val Ile Tyr His Val Val
180 185 190
Arg Leu Thr Asp Asn Val Thr Asn Gly Ile Phe Val Asn Met Arg
195 200 205
<210> 13
<211> 1437
<212> DNA
<213> 大肠杆菌
<400> 13
atggcgcagt cgaaactcta tccagttgtg atggcaggtg gctccggtag ccgcttatgg 60
ccgctttccc gcgtacttta tcccaagcag tttttatgcc tgaaaggcga tctcaccatg 120
ctgcaaacca ccatctgccg cctgaacggc gtggagtgcg aaagcccggt ggtgatttgc 180
aatgagcagc accgctttat tgtcgcggaa cagctgcgtc aactgaacaa acttaccgag 240
aacattattc tcgaaccggc agggcgaaac acggcacctg ccattgcgct ggcggcgctg 300
gcggcaaaac gtcatagccc ggagagcgac ccgttaatgc tggtattggc ggcggatcat 360
gtgattgccg atgaagacgc gttccgtgcc gccgtgcgta atgccatgcc atatgccgaa 420
gcgggcaagc tggtgacctt cggcattgtg ccggatctac cagaaaccgg ttatggctat 480
attcgtcgcg gtgaagtgtc tgcgggtgag caggatatgg tggcctttga agtggcgcag 540
tttgtcgaaa aaccgaatct ggaaaccgct caggcctatg tggcaagcgg cgaatattac 600
tggaacagcg gtatgttcct gttccgcgcc ggacgctatc tcgaagaact gaaaaaatat 660
cgcccggata tcctcgatgc ctgtgaaaaa gcgatgagcg ccgtcgatcc ggatctcaat 720
tttattcgcg tggatgaaga agcgtttctc gcctgcccgg aagagtcggt ggattacgcg 780
gtcatggaac gtacggcaga tgctgttgtg gtgccgatgg atgcgggctg gagcgatgtt 840
ggctcctggt cttcattatg ggagatcagc gcccacaccg ccgagggcaa cgtttgccac 900
ggcgatgtga ttaatcacaa aactgaaaac agctatgtgt atgctgaatc tggcctggtc 960
accaccgtcg gggtgaaaga tctggtagtg gtgcagacca aagatgcggt gctgattgcc 1020
gaccgtaacg cggtacagga tgtgaaaaaa gtggtcgagc agatcaaagc cgatggtcgc 1080
catgagcatc gggtgcatcg cgaagtgtat cgtccgtggg gcaaatatga ctctatcgac 1140
gcgggcgacc gctaccaggt gaaacgcatc accgtgaaac cgggcgaggg cttgtcggta 1200
cagatgcacc atcaccgcgc ggaacactgg gtggttgtcg cgggaacggc aaaagtcacc 1260
attgatggtg atatcaaact gcttggtgaa aacgagtcca tttatattcc gctgggggcg 1320
acgcattgcc tggaaaaccc ggggaaaatt ccgctcgatt taattgaagt gcgctccggc 1380
tcttatctcg aagaggatga tgtggtgcgt ttcgcggatc gctacggacg ggtgtaa 1437
<210> 14
<211> 478
<212> PRT
<213> 大肠杆菌
<400> 14
Met Ala Gln Ser Lys Leu Tyr Pro Val Val Met Ala Gly Gly Ser Gly
1 5 10 15
Ser Arg Leu Trp Pro Leu Ser Arg Val Leu Tyr Pro Lys Gln Phe Leu
20 25 30
Cys Leu Lys Gly Asp Leu Thr Met Leu Gln Thr Thr Ile Cys Arg Leu
35 40 45
Asn Gly Val Glu Cys Glu Ser Pro Val Val Ile Cys Asn Glu Gln His
50 55 60
Arg Phe Ile Val Ala Glu Gln Leu Arg Gln Leu Asn Lys Leu Thr Glu
65 70 75 80
Asn Ile Ile Leu Glu Pro Ala Gly Arg Asn Thr Ala Pro Ala Ile Ala
85 90 95
Leu Ala Ala Leu Ala Ala Lys Arg His Ser Pro Glu Ser Asp Pro Leu
100 105 110
Met Leu Val Leu Ala Ala Asp His Val Ile Ala Asp Glu Asp Ala Phe
115 120 125
Arg Ala Ala Val Arg Asn Ala Met Pro Tyr Ala Glu Ala Gly Lys Leu
130 135 140
Val Thr Phe Gly Ile Val Pro Asp Leu Pro Glu Thr Gly Tyr Gly Tyr
145 150 155 160
Ile Arg Arg Gly Glu Val Ser Ala Gly Glu Gln Asp Met Val Ala Phe
165 170 175
Glu Val Ala Gln Phe Val Glu Lys Pro Asn Leu Glu Thr Ala Gln Ala
180 185 190
Tyr Val Ala Ser Gly Glu Tyr Tyr Trp Asn Ser Gly Met Phe Leu Phe
195 200 205
Arg Ala Gly Arg Tyr Leu Glu Glu Leu Lys Lys Tyr Arg Pro Asp Ile
210 215 220
Leu Asp Ala Cys Glu Lys Ala Met Ser Ala Val Asp Pro Asp Leu Asn
225 230 235 240
Phe Ile Arg Val Asp Glu Glu Ala Phe Leu Ala Cys Pro Glu Glu Ser
245 250 255
Val Asp Tyr Ala Val Met Glu Arg Thr Ala Asp Ala Val Val Val Pro
260 265 270
Met Asp Ala Gly Trp Ser Asp Val Gly Ser Trp Ser Ser Leu Trp Glu
275 280 285
Ile Ser Ala His Thr Ala Glu Gly Asn Val Cys His Gly Asp Val Ile
290 295 300
Asn His Lys Thr Glu Asn Ser Tyr Val Tyr Ala Glu Ser Gly Leu Val
305 310 315 320
Thr Thr Val Gly Val Lys Asp Leu Val Val Val Gln Thr Lys Asp Ala
325 330 335
Val Leu Ile Ala Asp Arg Asn Ala Val Gln Asp Val Lys Lys Val Val
340 345 350
Glu Gln Ile Lys Ala Asp Gly Arg His Glu His Arg Val His Arg Glu
355 360 365
Val Tyr Arg Pro Trp Gly Lys Tyr Asp Ser Ile Asp Ala Gly Asp Arg
370 375 380
Tyr Gln Val Lys Arg Ile Thr Val Lys Pro Gly Glu Gly Leu Ser Val
385 390 395 400
Gln Met His His His Arg Ala Glu His Trp Val Val Val Ala Gly Thr
405 410 415
Ala Lys Val Thr Ile Asp Gly Asp Ile Lys Leu Leu Gly Glu Asn Glu
420 425 430
Ser Ile Tyr Ile Pro Leu Gly Ala Thr His Cys Leu Glu Asn Pro Gly
435 440 445
Lys Ile Pro Leu Asp Leu Ile Glu Val Arg Ser Gly Ser Tyr Leu Glu
450 455 460
Glu Asp Asp Val Val Arg Phe Ala Asp Arg Tyr Gly Arg Val
465 470 475
<210> 15
<211> 1371
<212> DNA
<213> 大肠杆菌
<400> 15
atgaaaaaat taacctgctt taaagcctat gatattcgcg ggaaattagg cgaagaactg 60
aatgaagata tcgcctggcg cattggtcgc gcctatggcg aatttctcaa accgaaaacc 120
attgtgttag gcggtgatgt ccgcctcacc agcgaaacct taaaactggc gctggcgaaa 180
ggtttacagg atgcgggcgt tgacgtgctg gatattggta tgtccggcac cgaagagatc 240
tatttcgcca cgttccatct cggcgtggat ggcggcattg aagttaccgc cagccataat 300
ccgatggatt ataacggcat gaagctggtt cgcgaggggg ctcgcccgat cagcggagat 360
accggactgc gcgacgtcca gcgtctggct gaagccaacg actttcctcc cgtcgatgaa 420
accaaacgcg gtcgctatca gcaaatcaac ctgcgtgacg cttacgttga tcacctgttc 480
ggttatatca atgtcaaaaa cctcacgccg ctcaagctgg tgatcaactc cgggaacggc 540
gcagcgggtc cggtggtgga cgccattgaa gcccgcttta aagccctcgg cgcgcccgtg 600
gaattaatca aagtgcacaa cacgccggac ggcaatttcc ccaacggtat tcctaaccca 660
ctactgccgg aatgccgcga cgacacccgc aatgcggtca tcaaacacgg cgcggatatg 720
ggcattgctt ttgatggcga ttttgaccgc tgtttcctgt ttgacgaaaa agggcagttt 780
attgagggct actacattgt cggcctgttg gcagaagcat tcctcgaaaa aaatcccggc 840
gcgaagatca tccacgatcc acgtctctcc tggaacaccg ttgatgtggt gactgccgca 900
ggtggcacgc cggtaatgtc gaaaaccgga cacgccttta ttaaagaacg tatgcgcaag 960
gaagacgcca tctatggtgg cgaaatgagc gcccaccatt acttccgtga tttcgcttac 1020
tgcgacagcg gcatgatccc gtggctgctg gtcgccgaac tggtgtgcct gaaagataaa 1080
acgctgggcg aactggtacg cgaccggatg gcggcgtttc cggcaagcgg tgagatcaac 1140
agcaaactgg cgcaacccgt tgaggcgatt aaccgcgtgg aacagcattt tagccgtgag 1200
gcgctggcgg tggatcgcac cgatggcatc agcatgacct ttgccgactg gcgctttaac 1260
ctgcgcacct ccaataccga accggtggtg cgcctgaatg tggaatcgcg cggtgatgtg 1320
ccgctgatgg aagcgcgaac gcgaactctg ctgacgttgc tgaacgagta a 1371
<210> 16
<211> 456
<212> PRT
<213> 大肠杆菌
<400> 16
Met Lys Lys Leu Thr Cys Phe Lys Ala Tyr Asp Ile Arg Gly Lys Leu
1 5 10 15
Gly Glu Glu Leu Asn Glu Asp Ile Ala Trp Arg Ile Gly Arg Ala Tyr
20 25 30
Gly Glu Phe Leu Lys Pro Lys Thr Ile Val Leu Gly Gly Asp Val Arg
35 40 45
Leu Thr Ser Glu Thr Leu Lys Leu Ala Leu Ala Lys Gly Leu Gln Asp
50 55 60
Ala Gly Val Asp Val Leu Asp Ile Gly Met Ser Gly Thr Glu Glu Ile
65 70 75 80
Tyr Phe Ala Thr Phe His Leu Gly Val Asp Gly Gly Ile Glu Val Thr
85 90 95
Ala Ser His Asn Pro Met Asp Tyr Asn Gly Met Lys Leu Val Arg Glu
100 105 110
Gly Ala Arg Pro Ile Ser Gly Asp Thr Gly Leu Arg Asp Val Gln Arg
115 120 125
Leu Ala Glu Ala Asn Asp Phe Pro Pro Val Asp Glu Thr Lys Arg Gly
130 135 140
Arg Tyr Gln Gln Ile Asn Leu Arg Asp Ala Tyr Val Asp His Leu Phe
145 150 155 160
Gly Tyr Ile Asn Val Lys Asn Leu Thr Pro Leu Lys Leu Val Ile Asn
165 170 175
Ser Gly Asn Gly Ala Ala Gly Pro Val Val Asp Ala Ile Glu Ala Arg
180 185 190
Phe Lys Ala Leu Gly Ala Pro Val Glu Leu Ile Lys Val His Asn Thr
195 200 205
Pro Asp Gly Asn Phe Pro Asn Gly Ile Pro Asn Pro Leu Leu Pro Glu
210 215 220
Cys Arg Asp Asp Thr Arg Asn Ala Val Ile Lys His Gly Ala Asp Met
225 230 235 240
Gly Ile Ala Phe Asp Gly Asp Phe Asp Arg Cys Phe Leu Phe Asp Glu
245 250 255
Lys Gly Gln Phe Ile Glu Gly Tyr Tyr Ile Val Gly Leu Leu Ala Glu
260 265 270
Ala Phe Leu Glu Lys Asn Pro Gly Ala Lys Ile Ile His Asp Pro Arg
275 280 285
Leu Ser Trp Asn Thr Val Asp Val Val Thr Ala Ala Gly Gly Thr Pro
290 295 300
Val Met Ser Lys Thr Gly His Ala Phe Ile Lys Glu Arg Met Arg Lys
305 310 315 320
Glu Asp Ala Ile Tyr Gly Gly Glu Met Ser Ala His His Tyr Phe Arg
325 330 335
Asp Phe Ala Tyr Cys Asp Ser Gly Met Ile Pro Trp Leu Leu Val Ala
340 345 350
Glu Leu Val Cys Leu Lys Asp Lys Thr Leu Gly Glu Leu Val Arg Asp
355 360 365
Arg Met Ala Ala Phe Pro Ala Ser Gly Glu Ile Asn Ser Lys Leu Ala
370 375 380
Gln Pro Val Glu Ala Ile Asn Arg Val Glu Gln His Phe Ser Arg Glu
385 390 395 400
Ala Leu Ala Val Asp Arg Thr Asp Gly Ile Ser Met Thr Phe Ala Asp
405 410 415
Trp Arg Phe Asn Leu Arg Thr Ser Asn Thr Glu Pro Val Val Arg Leu
420 425 430
Asn Val Glu Ser Arg Gly Asp Val Pro Leu Met Glu Ala Arg Thr Arg
435 440 445
Thr Leu Leu Thr Leu Leu Asn Glu
450 455
<210> 17
<211> 900
<212> DNA
<213> 大肠杆菌
<400> 17
atgttttctg ggctgttaat cattctggtt cccctgattg tgggttacct cattccgctt 60
cgccaacaag ctgcgttaaa agttattaat cagctattaa gctggatggt ttaccttatt 120
ctctttttta tgggtatcag tctggcgttt ctcgataacc tcgccagtaa cctgttggcg 180
attctgcatt attctgccgt cagtattacc gttattttac tgtgtaatat tgccgccctg 240
atgtggctgg agcgaggcct gccgtggcgc aaccaccatc agcaagaaaa actcccgtcg 300
cgtattgcga tggcgctgga gtcgctaaaa ctgtgcggcg tagtagtgat tggttttgcc 360
attggtctaa gtggactggc tttcttacaa cacgcgaccg aagccagtga atacacgtta 420
attttgctac ttttcctcgt tggtattcag ttgcgcaata atggcatgac cttaaagcag 480
attgtcctta atcgccgggg aatgattgtc gccgtggtgg tggttgtcag ttcattaatt 540
ggtggtttaa ttaacgcctt tattcttgat ctccccatca ataccgcgct ggcaatggcc 600
tccggtttcg gctggtattc tctttccggt attttattga ccgaatcttt tggtccggta 660
atcgggagcg cggcgttttt taatgatctg gcccgtgaac tgattgctat tatgttgatc 720
cctgggctga ttcgccgcag ccgctctact gcactgggct tatgcggtgc cacatcaatg 780
gatttcaccc tgcccgttct tcaacgtact ggcgggctgg atatggtccc ggcggcaatt 840
gttcacggtt ttattcttag cctgttagtg ccgatcctca tcgccttttt ctctgcgtag 900
<210> 18
<211> 299
<212> PRT
<213> 大肠杆菌
<400> 18
Met Phe Ser Gly Leu Leu Ile Ile Leu Val Pro Leu Ile Val Gly Tyr
1 5 10 15
Leu Ile Pro Leu Arg Gln Gln Ala Ala Leu Lys Val Ile Asn Gln Leu
20 25 30
Leu Ser Trp Met Val Tyr Leu Ile Leu Phe Phe Met Gly Ile Ser Leu
35 40 45
Ala Phe Leu Asp Asn Leu Ala Ser Asn Leu Leu Ala Ile Leu His Tyr
50 55 60
Ser Ala Val Ser Ile Thr Val Ile Leu Leu Cys Asn Ile Ala Ala Leu
65 70 75 80
Met Trp Leu Glu Arg Gly Leu Pro Trp Arg Asn His His Gln Gln Glu
85 90 95
Lys Leu Pro Ser Arg Ile Ala Met Ala Leu Glu Ser Leu Lys Leu Cys
100 105 110
Gly Val Val Val Ile Gly Phe Ala Ile Gly Leu Ser Gly Leu Ala Phe
115 120 125
Leu Gln His Ala Thr Glu Ala Ser Glu Tyr Thr Leu Ile Leu Leu Leu
130 135 140
Phe Leu Val Gly Ile Gln Leu Arg Asn Asn Gly Met Thr Leu Lys Gln
145 150 155 160
Ile Val Leu Asn Arg Arg Gly Met Ile Val Ala Val Val Val Val Val
165 170 175
Ser Ser Leu Ile Gly Gly Leu Ile Asn Ala Phe Ile Leu Asp Leu Pro
180 185 190
Ile Asn Thr Ala Leu Ala Met Ala Ser Gly Phe Gly Trp Tyr Ser Leu
195 200 205
Ser Gly Ile Leu Leu Thr Glu Ser Phe Gly Pro Val Ile Gly Ser Ala
210 215 220
Ala Phe Phe Asn Asp Leu Ala Arg Glu Leu Ile Ala Ile Met Leu Ile
225 230 235 240
Pro Gly Leu Ile Arg Arg Ser Arg Ser Thr Ala Leu Gly Leu Cys Gly
245 250 255
Ala Thr Ser Met Asp Phe Thr Leu Pro Val Leu Gln Arg Thr Gly Gly
260 265 270
Leu Asp Met Val Pro Ala Ala Ile Val His Gly Phe Ile Leu Ser Leu
275 280 285
Leu Val Pro Ile Leu Ile Ala Phe Phe Ser Ala
290 295
<210> 19
<211> 900
<212> DNA
<213> 嗜虫耶尔森菌
<400> 19
atgttttcag gcctgctcat cattttactc ccgttagttg cggggtatct gatcccgttg 60
cgccacccaa gcgttctgaa actgattacc cgtttattga gttggatcgt gtatgtgatc 120
ctctttttca tgggcattag cctggccttc ttagacaatc tgtcgtctaa cttgttgagc 180
attctgcatt acgccgtcgt aagtgttgtt gtcattcttc tgtgtaatat tgcagcgctg 240
atgtggctgg aacagaaaat gccgtggcgc caccagcatc gccaggagaa attgccttcc 300
cgcgtggcta tggcgatgga atcccttcag ctgtgtggtg tagttctgat cggttttctg 360
attggtttga gcggactgag tttcctgcaa cacgcgacag aggcgagtga atataccctg 420
atcttcctgc tgttcttaat tggcattcag ttacgtaata atggtatgac tctgcgtcag 480
attgtgttga accgccgcgg catgattgta gcggtggtgg ttaccgcgag tagtctggcg 540
ggtggggtca tcaatgcatt tatcttagat ctgcccttaa agaccggcct tgccatggca 600
agcggcttcg ggtggtattc tctttccggg attctcatga ccgaaagctt tggtccggtt 660
atcgggagtg cagccttttt caacgatctg agccgcgagc ttctggcaat tatgctgatt 720
ccagggcttg tgcgtcgttc acgttcaaca gcgctcgggc tgtgcggcgc cacgtcaatg 780
gatttcacgc ttccagtgtt gcagcgcagc ggcggtgtag aaattgttcc ggctgcgatt 840
gttcatggtt ttgtgctgag tctgctggtc ccagtcctta ttgctttgtt ctcggcttag 900
<210> 20
<211> 298
<212> PRT
<213> 嗜虫耶尔森菌
<400> 20
Met Tyr Ser Gly Leu Leu Ile Ile Leu Leu Pro Leu Ile Ile Gly Tyr
1 5 10 15
Leu Ile Pro Leu Ser Arg Lys Ser Leu Ile Gln Ala Ile Asn Arg Leu
20 25 30
Leu Ser Trp Met Val Tyr Val Ile Leu Phe Phe Met Gly Ile Ser Leu
35 40 45
Ala Phe Leu Glu Asn Leu Ser Ala Asn Leu Leu Leu Ile Phe Gln Tyr
50 55 60
Ala Ser Val Cys Phe Ile Cys Ile Leu Ser Ala Asn Leu Leu Ala Leu
65 70 75 80
Phe Leu Leu Glu His Lys Arg Pro Trp Lys Asn Thr His Arg Gln Glu
85 90 95
Ala Leu Pro Ser Arg Leu His Met Ala Leu Glu Ser Leu Lys Leu Cys
100 105 110
Gly Val Val Ile Ile Gly Phe Leu Leu Gly Leu Thr Glu Trp Pro Pro
115 120 125
Leu Gln Phe Ala Ala Gln Gly Ser Glu Leu Ala Leu Ile Phe Leu Leu
130 135 140
Phe Leu Val Gly Ile Gln Leu Arg Asn Ser Gly Met Thr Leu Arg Gln
145 150 155 160
Ile Val Leu Asn Arg Arg Gly Thr Ile Val Ala Ile Val Val Ala Val
165 170 175
Ser Ala Leu Ala Gly Gly Ala Leu Ala Ala Leu Phe Leu Gly Leu Pro
180 185 190
Leu Lys Thr Gly Leu Ala Met Ala Ser Gly Tyr Gly Trp Tyr Ser Leu
195 200 205
Ser Gly Ile Leu Leu Thr Asp Ala Phe Gly Pro Val Ile Gly Ser Ala
210 215 220
Ala Phe Phe Asn Asp Leu Ala Arg Glu Leu Val Ala Ile Met Leu Ile
225 230 235 240
Pro Thr Leu Val Arg Arg Ser Arg Ser Thr Ala Leu Gly Leu Cys Gly
245 250 255
Ala Thr Ser Met Asp Phe Thr Leu Pro Val Leu Gln Arg Ser Gly Gly
260 265 270
Leu Glu Met Val Pro Ala Ala Ile Val His Gly Phe Ile Leu Ser Leu
275 280 285
Leu Ala Pro Val Leu Ile Ala Leu Phe Ser
290 295
<210> 21
<211> 900
<212> DNA
<213> 痢疾志贺氏杆菌
<400> 21
atgttttccg gcctgttaat cattttactg cctcttatcg cgggttactt gattccgtta 60
cgtcaagaaa gcgcgctgcg cctgattaat cgcttcctgt ctggtattgt ttatctgatc 120
ctgttcttca tggggatcag cttagcattt ctcgataact tgtccgctaa tctgctgtcc 180
attctgcatt attcggctgt tactgtaacc gtgattctgc tgtgcaatat tgccgccctg 240
ctctggctgg aacgtaccat tccatggaaa aaccatcatc accaagaaaa attaccgtcc 300
cgtatcgcca tggccctgga atcattgaaa ctgtgtggtg tggtcgtact ggggtttctg 360
ctggggttga cgggctgggc gtttttacag catgctaccg aagcatccga gtatacgctc 420
attttcttat tgtttttaat cggtattcag ctgcgtaata atggcatgac gctgaaacag 480
attgtattaa accgccgcgg catgattatt gcggttatgg ttgtcgcgtc ctccatggtg 540
gcaggtgtta ttaatgcttt tattctggat ctgccattaa aaacagggct ggcaatggca 600
tcaggctttg gctggtactc gttgtccggc atcctgctga cagagagctt tggcccagtg 660
atcggttcgg ctgcgttctt taacgacctg gcacgcgaac tgattgctat catgctgatt 720
ccgggactcg tgcgccgtag ccgcagcacg gcgctgggac tgtgcggcgc gactagtatg 780
gatttcactc tgccggtcct gcagcgcagc ggtggcttgg agatggtccc ggcagcaatt 840
gttcatgggt ttattctctc gctgctggtc ccgattttaa tggcgttctt ctccgcatag 900
<210> 22
<211> 299
<212> PRT
<213> 痢疾志贺氏杆菌
<400> 22
Met Phe Ser Gly Leu Leu Ile Ile Leu Val Pro Leu Ile Val Gly Tyr
1 5 10 15
Leu Ile Pro Leu Arg Gln Gln Ala Ala Leu Lys Val Ile Asn Gln Leu
20 25 30
Leu Ser Trp Met Val Tyr Leu Ile Leu Phe Phe Met Gly Ile Ser Leu
35 40 45
Ala Phe Leu Asp Asn Leu Ala Ser Asn Leu Leu Ala Ile Leu His Tyr
50 55 60
Ser Ala Val Ser Ile Thr Val Ile Leu Leu Cys Asn Ile Ala Ala Leu
65 70 75 80
Ile Trp Leu Glu Arg Gly Leu Pro Trp Arg Asn His His Gln Gln Glu
85 90 95
Lys Leu Pro Ser Arg Ile Ala Met Ala Leu Glu Ser Leu Lys Leu Cys
100 105 110
Gly Val Val Val Ile Gly Phe Ala Ile Gly Leu Ser Gly Leu Ala Phe
115 120 125
Leu Gln His Ala Thr Glu Ala Ser Glu Tyr Thr Leu Ile Leu Leu Leu
130 135 140
Phe Leu Val Gly Ile Gln Leu Arg Asn Asn Gly Met Thr Leu Lys Gln
145 150 155 160
Ile Val Leu Asn Arg Arg Gly Met Ile Val Ala Val Val Val Val Ala
165 170 175
Ser Ser Leu Ile Gly Gly Leu Ile Asn Ala Phe Ile Leu Asp Leu Pro
180 185 190
Ile Asn Thr Ala Leu Ala Met Ala Ser Gly Phe Gly Trp Tyr Ser Leu
195 200 205
Ser Gly Ile Leu Leu Thr Glu Ser Phe Gly Pro Val Ile Gly Ser Ala
210 215 220
Ala Phe Phe Asn Asp Leu Ala Arg Glu Leu Ile Ala Ile Met Leu Ile
225 230 235 240
Pro Gly Leu Ile Arg Arg Ser Arg Ser Thr Ala Leu Gly Leu Cys Gly
245 250 255
Ala Thr Ser Met Asp Phe Thr Leu Pro Val Leu Gln Arg Thr Gly Gly
260 265 270
Leu Asp Met Val Pro Ala Ala Ile Val His Gly Phe Ile Leu Ser Leu
275 280 285
Leu Val Pro Ile Leu Ile Ala Phe Phe Ser Ala
290 295
<210> 23
<211> 900
<212> DNA
<213> 深红沙雷菌
<400> 23
atgttttcag gtctgttaat tattttagta ccgctgatcg tgggatacct gatcccactg 60
cgtcataaag ccgctctgca gctgattaat cgcctgctct cctggattgt ctatttaatt 120
ctgtttttca tgggtatctc tctcgcattc ctggataacc ttgcaagcaa cctggtggct 180
atctttcatt atagcgccgt tagtatcacc attattctgc tgtgcaatat cgccgccctg 240
ctttggctgg aacgtatctt accgtggcgc caccatcatc agcaggaaaa gttgccgtcg 300
cgtatcgcca tggcccttga aagcctccag ctgtgtggcg ttgtagtcct cggctttgta 360
atcgggctgt ctggtttgag cgtattgcag cacgcaaccg aagcttccga atataccctg 420
atttttcttc tgttcctggt gggaatccag ctccgtaact cgggcatgac tttaaaacaa 480
atcgtgctca atcgccgtgg tatgatggtg gcggtcgtgg tggtggcaag cagcttgctg 540
ggtggtgtca tcaatgcgtt tattctggat ctgcctctga aaaccgctct cgcgatggcg 600
tcgggctttg gttggtatag cctgtccggt attcttctga cggaatcttt tggtcccgtg 660
atcggctccg ccgcattctt caacgacctg gcccgcgagc tgctggcaat catgctgatc 720
ccgggactgg ttcgccgtag tcgctcgacg gcactgggtc tgtgtggagc gacctcaatg 780
gatttcactc tgccggtact ccaacgctcg ggtggggttg aaattgtccc tgctgccatt 840
gtgcacggtt ttatccttag cctgctggtc ccgttgctga tggccttttt ctcagcttag 900
<210> 24
<211> 298
<212> PRT
<213> 深红沙雷菌
<400> 24
Met Tyr Ser Gly Leu Leu Ile Ile Leu Val Pro Leu Ile Ala Gly Tyr
1 5 10 15
Leu Ile Pro Leu His Ser His Arg Leu Ile Gln Ser Ile Asn Arg Leu
20 25 30
Leu Ser Arg Met Val Tyr Val Ile Leu Phe Leu Met Gly Ile Ser Leu
35 40 45
Ala Phe Leu Glu Asn Leu Ser Ser Asn Leu Leu Leu Ile Phe Gln Tyr
50 55 60
Thr Ala Ala Phe Phe Leu Cys Ile Phe Leu Ala Asn Ala Leu Ala Leu
65 70 75 80
Tyr Leu Leu Glu Arg Lys Leu Pro Trp Arg Ser Thr His Lys Gln Glu
85 90 95
Lys Leu Pro Ser Arg Leu His Met Ala Leu Glu Ser Leu Gln Leu Cys
100 105 110
Gly Val Val Leu Ile Gly Phe Leu Leu Gly Leu Thr Gln Trp Pro Trp
115 120 125
Leu His Tyr Ala Thr Ala Gly Ser Glu Tyr Ala Leu Ile Phe Leu Leu
130 135 140
Phe Leu Val Gly Ile Gln Leu Arg Asn Ser Gly Met Thr Leu Arg Gln
145 150 155 160
Ile Ile Val Asn Arg Arg Gly Met Leu Val Gly Val Val Val Ala Ile
165 170 175
Ser Ala Leu Ala Gly Gly Ala Leu Ala Ala Trp Leu Leu Gly Val Pro
180 185 190
Val Lys Ala Gly Leu Ala Val Ala Ser Gly Phe Gly Trp Tyr Ser Leu
195 200 205
Ser Ala Ile Leu Ile Ser Asp Ala Tyr Gly Pro Val Leu Gly Ser Thr
210 215 220
Ala Phe Phe Asn Asp Leu Leu Arg Glu Leu Val Ala Ile Met Leu Ile
225 230 235 240
Pro Thr Leu Ile Arg Arg Ser Arg Ser Thr Ala Leu Gly Leu Cys Gly
245 250 255
Ala Thr Ser Met Asp Phe Thr Leu Pro Val Leu Gln Arg Ser Gly Gly
260 265 270
Leu Glu Ile Val Pro Pro Ala Ile Val His Gly Phe Leu Leu Ser Leu
275 280 285
Met Ala Pro Val Leu Ile Ala Leu Phe Ser
290 295
<210> 25
<211> 909
<212> DNA
<213> 弗氏耶尔森菌Y225
<400> 25
atgtactcag gtctgttaat tgtattaatg cctctgattc ttggttactt cattcgtctg 60
aataataaaa cggccctggc caccgtgcac tatcttctga acatcatgat ttacgtaatc 120
ttatttctga tgggtgtgtc gctggcgatg ttagaaaacc tgggcaacaa tttgctgtcc 180
atcttgctgt atgcgatgac ctttttcctt tgtatcttcg ccaccaattt acttgcattg 240
ttactgttag acaagcgtga tccttggatt atccaggtca ataaacaaga aaagtccccc 300
tcacaactgc acatggcctt cgattcgatt aagctgtgca gcgcattgat tctggggttt 360
ctgcttggtc tgactgattg gtctttgttt cactttgcgt caccagcatc cgagattgcc 420
ctgatcctgt tactgttgtt agttggcatc cagctgcgca ataatggtat gagcttaaaa 480
caaaccctgc tcaatcgccg cggcactatt attgccctcg tggtcgcgat ctcctccttg 540
ttaggcggga tgatcgcggc ctttctgctg ggtttaccca ccaagacggg cctggccatt 600
gcgtccggtt acggttggta ttcgctgagt ggcatcttgc tgagtgacgc ctatggccca 660
gtgattgggt ccaccgcctt tttcaacgat ctggcacgcg aacttgcaag tattctcctc 720
attcctatgt taatcaaccg ctaccgcagc accgccctgg gtctgacggg ggctgcatct 780
atcgatttca cactcccaat cctgcagcgc tgtggtggga tcagcatcgt gccggcggcg 840
attgtacacg gctttattct gtctctgatg actccggtct ttattgcctt ctttacccaa 900
caggcatag 909
<210> 26
<211> 299
<212> PRT
<213> 弗氏耶尔森菌Y225
<400> 26
Met Tyr Ser Gly Leu Leu Ile Ile Leu Leu Pro Leu Ile Leu Gly Tyr
1 5 10 15
Leu Ile Pro Leu Ser Arg Lys Thr Leu Ile Gln Leu Ile Asn Arg Leu
20 25 30
Leu Ser Trp Met Val Tyr Val Ile Leu Phe Phe Met Gly Ile Ser Leu
35 40 45
Ala Phe Leu Glu Asn Leu Ser Ala Asn Leu Leu Leu Ile Phe Gln Tyr
50 55 60
Ala Gly Val Phe Phe Leu Cys Ile Phe Cys Ala Asn Leu Leu Ala Leu
65 70 75 80
Phe Leu Leu Glu Arg Lys Thr Pro Trp Lys Asn Thr His Arg Gln Glu
85 90 95
Val Leu Pro Ser Arg Leu His Met Ala Leu Glu Ser Leu Lys Leu Cys
100 105 110
Gly Val Val Ile Val Gly Phe Leu Leu Gly Leu Ser Gln Trp Glu Trp
115 120 125
Leu Gln Phe Ala Ala Lys Gly Ser Glu Leu Ala Leu Ile Phe Leu Leu
130 135 140
Phe Leu Val Gly Ile Gln Leu Arg Asn Ser Gly Met Thr Leu Arg Gln
145 150 155 160
Ile Val Leu Asn Arg Arg Gly Ala Ile Val Ala Ile Val Val Ala Phe
165 170 175
Ser Ala Leu Ala Gly Gly Met Leu Ala Ala Val Leu Met Asp Leu Pro
180 185 190
Ile Lys Thr Gly Leu Ala Met Ala Ser Gly Phe Gly Trp Tyr Ser Leu
195 200 205
Ser Gly Ile Leu Leu Thr Asp Ser Phe Gly Pro Val Ile Gly Ser Ala
210 215 220
Ala Phe Phe Asn Asp Leu Ala Arg Glu Leu Val Ala Ile Met Leu Ile
225 230 235 240
Pro Thr Leu Val Arg Ser Ser Arg Ser Ser Ala Leu Gly Leu Cys Gly
245 250 255
Ala Thr Ser Met Asp Phe Thr Leu Pro Val Leu Gln Arg Ser Gly Gly
260 265 270
Leu Glu Met Val Pro Ala Ala Ile Val His Gly Phe Leu Leu Ser Leu
275 280 285
Leu Ala Pro Ile Leu Ile Ala Phe Phe Ser Ser
290 295
<210> 27
<211> 900
<212> DNA
<213> 弗氏耶尔森菌
<400> 27
atgtattctg ggctgctgat tattctgtta cctttaatca tcggctacct tattcccttg 60
tctcgtaaaa gtctcattca acttattaat cgccttctta gttggatggt atacgtaatt 120
ctgttcttca tgggtatcag tctggcgttt ctcgagaact taagcgcgaa cttgttactg 180
attttccagt acacggggat tttctttctt tgcatcttct gcgcaaacct gctcgcgctg 240
ttcctcctgg aacgcaaaac tccgtggaaa aacacgcatc gccaagaggc attgccgagc 300
cgtctgcaca tggcactgga atctttaaag ttgtgcggtg ttgttatcgt tggttttctg 360
ttaggcttaa cccaatggga atggctgcag tttgcggcca agggctcaga actggcatta 420
atctttttac tgtttctggt gggtatccag ctgcgcaatt ctggtatgac gctgcgccag 480
attgtgttga accgtcgcgg caccattgtt gcgtttgtcg ttgctattag cgccctggca 540
ggtggggcga ttgcggccat gctgattggc ctgccggtaa aaacgggcct ggctatggca 600
agcggtttcg ggtggtatag cctgtcgggc atccttctga ctgacacgtt tggcccggtg 660
attggcagtg cagcgttctt taatgacctg gcacgcgaat tagtggccat tatgctgatc 720
ccgacattgg tgcgctcatc acgttccacg gcgctgggtt tatgcggcgc gacttcgatg 780
gactttactc tgcccgtttt gcagcgctcg ggcggcctgg aaatggtacc agccgctatc 840
gtgcacggat tcctcctgtc gttgctggcg ccgattctca tcgcgttttt cagcagttag 900
<210> 28
<211> 299
<212> PRT
<213> 弗氏耶尔森菌
<400> 28
Met Tyr Ser Gly Leu Leu Ile Ile Leu Leu Pro Leu Ile Ile Gly Tyr
1 5 10 15
Leu Ile Pro Leu Ser Arg Lys Ser Leu Ile Gln Leu Ile Asn Arg Leu
20 25 30
Leu Ser Trp Met Val Tyr Val Ile Leu Phe Phe Met Gly Ile Ser Leu
35 40 45
Ala Phe Leu Glu Asn Leu Ser Ala Asn Leu Leu Leu Ile Phe Gln Tyr
50 55 60
Thr Gly Ile Phe Phe Leu Cys Ile Phe Cys Ala Asn Leu Leu Ala Leu
65 70 75 80
Phe Leu Leu Glu Arg Lys Thr Pro Trp Lys Asn Thr His Arg Gln Glu
85 90 95
Ala Leu Pro Ser Arg Leu His Met Ala Leu Glu Ser Leu Lys Leu Cys
100 105 110
Gly Val Val Ile Val Gly Phe Leu Leu Gly Leu Thr Gln Trp Glu Trp
115 120 125
Leu Gln Phe Ala Ala Lys Gly Ser Glu Leu Ala Leu Ile Phe Leu Leu
130 135 140
Phe Leu Val Gly Ile Gln Leu Arg Asn Ser Gly Met Thr Leu Arg Gln
145 150 155 160
Ile Val Leu Asn Arg Arg Gly Thr Ile Val Ala Phe Val Val Ala Ile
165 170 175
Ser Ala Leu Ala Gly Gly Ala Ile Ala Ala Met Leu Ile Gly Leu Pro
180 185 190
Val Lys Thr Gly Leu Ala Met Ala Ser Gly Phe Gly Trp Tyr Ser Leu
195 200 205
Ser Gly Ile Leu Leu Thr Asp Thr Phe Gly Pro Val Ile Gly Ser Ala
210 215 220
Ala Phe Phe Asn Asp Leu Ala Arg Glu Leu Val Ala Ile Met Leu Ile
225 230 235 240
Pro Thr Leu Val Arg Ser Ser Arg Ser Thr Ala Leu Gly Leu Cys Gly
245 250 255
Ala Thr Ser Met Asp Phe Thr Leu Pro Val Leu Gln Arg Ser Gly Gly
260 265 270
Leu Glu Met Val Pro Ala Ala Ile Val His Gly Phe Leu Leu Ser Leu
275 280 285
Leu Ala Pro Ile Leu Ile Ala Phe Phe Ser Ser
290 295
<210> 29
<211> 900
<212> DNA
<213> 肠道沙门氏菌I
<400> 29
atgttttctg ggttacttat tattctcgta ccgctgatcg tggggtactt gattccgctg 60
cgtcacaagg cggcccttca attgattaac cgtctgttat cgtggattgt atacttgatc 120
ctcttcttca tggggatttc cctcgcattc ctcgataact tggcctcgaa tctggttgcg 180
atcttccatt atagcgccgt tagcatcacc attattctct tgtgcaacat cgcggcgctg 240
ttgtggctgg agcgtattct cccctggcgc catcaccatc aacaggaaaa actgcccagt 300
cgcatcgcga tggcgctcga gtcgctgcaa ctgtgtgggg tagtcgtgct ggggttcgtt 360
atcggcctga gtggcctgag tgtactgcag catgcgacgg aagcaagcga atatacgttg 420
atcttcttgt tgtttttagt gggaattcag ctccgcaaca gcggcatgac acttaaacag 480
attgtactca atcgtcgcgg aatgatggtt gccgtggtag tcgtcgccag ttcgttatta 540
ggtggcgtta tcaatgcgtt tatcctcgac ctcccactga agaccgcatt agcgatggca 600
agcggctttg gatggtactc actgtcaggc atcttgctga cggaggcctt cggcccggtt 660
atcggctccg ccgcgttctt taatgatctg gcacgcgaac tgctggcgat tatgcttatt 720
cctggcctgg tacgtcgctc acgtagcacc gcattgggtc tgtgcggcgc gacgagtatg 780
gactttacac tgccggtact gcagcgtagc ggaggcgtag aaattgtacc ggccgccatt 840
gtccatggtt ttatcctgtc actcctggta cctctcctga tggcgttctt ttcggcatag 900
<210> 30
<211> 299
<212> PRT
<213> 肠道沙门氏菌I
<400> 30
Met Phe Ser Gly Leu Leu Ile Ile Leu Val Pro Leu Ile Val Gly Tyr
1 5 10 15
Leu Ile Pro Leu Arg His Lys Ala Ala Leu Gln Leu Ile Asn Arg Leu
20 25 30
Leu Ser Trp Ile Val Tyr Leu Ile Leu Phe Phe Met Gly Ile Ser Leu
35 40 45
Ala Phe Leu Asp Asn Leu Ala Ser Asn Leu Val Ala Ile Phe His Tyr
50 55 60
Ser Ala Val Ser Ile Thr Ile Ile Leu Leu Cys Asn Ile Ala Ala Leu
65 70 75 80
Leu Trp Leu Glu Arg Ile Leu Pro Trp Arg His His His Gln Gln Glu
85 90 95
Lys Leu Pro Ser Arg Ile Ala Met Ala Leu Glu Ser Leu Gln Leu Cys
100 105 110
Gly Val Val Val Leu Gly Phe Val Ile Gly Leu Ser Gly Leu Ser Val
115 120 125
Leu Gln His Ala Thr Glu Ala Ser Glu Tyr Thr Leu Ile Phe Leu Leu
130 135 140
Phe Leu Val Gly Ile Gln Leu Arg Asn Ser Gly Met Thr Leu Lys Gln
145 150 155 160
Ile Val Leu Asn Arg Arg Gly Met Met Val Ala Val Val Val Val Ala
165 170 175
Ser Ser Leu Leu Gly Gly Val Ile Asn Ala Phe Ile Leu Asp Leu Pro
180 185 190
Leu Lys Thr Ala Leu Ala Met Ala Ser Gly Phe Gly Trp Tyr Ser Leu
195 200 205
Ser Gly Ile Leu Leu Thr Glu Ala Phe Gly Pro Val Ile Gly Ser Ala
210 215 220
Ala Phe Phe Asn Asp Leu Ala Arg Glu Leu Leu Ala Ile Met Leu Ile
225 230 235 240
Pro Gly Leu Val Arg Arg Ser Arg Ser Thr Ala Leu Gly Leu Cys Gly
245 250 255
Ala Thr Ser Met Asp Phe Thr Leu Pro Val Leu Gln Arg Ser Gly Gly
260 265 270
Val Glu Ile Val Pro Ala Ala Ile Val His Gly Phe Ile Leu Ser Leu
275 280 285
Leu Val Pro Leu Leu Met Ala Phe Phe Ser Ala
290 295
<210> 31
<211> 900
<212> DNA
<213> 沙雷氏菌属Leaf51
<400> 31
atgtactcag gactcctgat tattttactg ccattaatcc tgggttatct tattcccgtt 60
aaaaatcacg ccttgctgca cgtggttaac caaatgctga gctggatggt ctatgttatt 120
ctgtttatca tgggtatttc cttggctttt ctggacaacc tgagtaccaa cctgctgctg 180
atctttaagt acgctgcggt atgcttctta tgcatttttg ttatgaatta tgctgctctg 240
tggcttctcg aacgccgccg tccgtggaaa acccagcata agcaggaaaa actgccctct 300
cgtttgcaca tggctttgga atcgctgaaa ttatgtggtg tagttattgg tggctttgcg 360
ctgggcctta ctcaatggca ctggctgacg tttgcttcgc aggctagcga attagccctg 420
ctttttctgc tggctctggt tggcattcaa ttacgcaaca gtagtatgac cctgcgtcag 480
attattctga accgccgcgg tatgatcgtc gctgtggtgg tagcaatcag tgccctgatc 540
gggggtgcac tggctgcctt actgttgggt ttgccgctca aaaccggatt ggcgctcgca 600
tctggctacg ggtggtactc actgtcgggt attgttctga cagattcgtt cggtccggta 660
attggatccg cagcgttctt caacgacctg gcgcgtgagc tgtgtgcaat catgctgatt 720
ccaactttag ttcgctcctc ccgctcgacc gcactcggtc tgtgtggtgc gacctcaatg 780
gatttcactc tgccggtatt acagcgctcc ggtggcttgg acatggtgcc gcccgcggtg 840
gttcatggat tcgttttatc attattgtcg ccggttctca tggccttctt ctctgcatag 900
<210> 32
<211> 299
<212> PRT
<213> 沙雷氏菌属Leaf51
<400> 32
Met Tyr Ser Gly Leu Leu Ile Ile Leu Leu Pro Leu Ile Leu Gly Tyr
1 5 10 15
Leu Ile Pro Val Lys Asn His Ala Leu Leu His Val Val Asn Gln Met
20 25 30
Leu Ser Trp Met Val Tyr Val Ile Leu Phe Ile Met Gly Ile Ser Leu
35 40 45
Ala Phe Leu Asp Asn Leu Ser Thr Asn Leu Leu Leu Ile Phe Lys Tyr
50 55 60
Ala Ala Val Cys Phe Leu Cys Ile Phe Val Met Asn Tyr Ala Ala Leu
65 70 75 80
Trp Leu Leu Glu Arg Arg Arg Pro Trp Lys Thr Gln His Lys Gln Glu
85 90 95
Lys Leu Pro Ser Arg Leu His Met Ala Leu Glu Ser Leu Lys Leu Cys
100 105 110
Gly Val Val Ile Gly Gly Phe Ala Leu Gly Leu Thr Gln Trp His Trp
115 120 125
Leu Thr Phe Ala Ser Gln Ala Ser Glu Leu Ala Leu Leu Phe Leu Leu
130 135 140
Ala Leu Val Gly Ile Gln Leu Arg Asn Ser Ser Met Thr Leu Arg Gln
145 150 155 160
Ile Ile Leu Asn Arg Arg Gly Met Ile Val Ala Val Val Val Ala Ile
165 170 175
Ser Ala Leu Ile Gly Gly Ala Leu Ala Ala Leu Leu Leu Gly Leu Pro
180 185 190
Leu Lys Thr Gly Leu Ala Leu Ala Ser Gly Tyr Gly Trp Tyr Ser Leu
195 200 205
Ser Gly Ile Val Leu Thr Asp Ser Phe Gly Pro Val Ile Gly Ser Ala
210 215 220
Ala Phe Phe Asn Asp Leu Ala Arg Glu Leu Cys Ala Ile Met Leu Ile
225 230 235 240
Pro Thr Leu Val Arg Ser Ser Arg Ser Thr Ala Leu Gly Leu Cys Gly
245 250 255
Ala Thr Ser Met Asp Phe Thr Leu Pro Val Leu Gln Arg Ser Gly Gly
260 265 270
Leu Asp Met Val Pro Pro Ala Val Val His Gly Phe Val Leu Ser Leu
275 280 285
Leu Ser Pro Val Leu Met Ala Phe Phe Ser Ala
290 295
<210> 33
<211> 1329
<212> DNA
<213> δ变形菌纲细菌RIFCSPLOWO2 02 FULL 50 16
<400> 33
atgaccaaaa gcatcccgaa aaaagatagc agcggcaccc aagaaaccaa catttttgca 60
aatgcactga aacgtctgga tgaagcagca cagtttgcag atattccgcc tgaagcgctg 120
gaacgtctga aacatccgaa aaaaatgatt caggtgagca ttccgattcg catggataat 180
ggtggtctgc gtatttttca gggttatcgt gttcgtcatg atcatacccg tggtcctggt 240
aaaggtggta ttcgttttca tccgaatgtt aatctggatg aggttaaagc actggcactg 300
tggatgacct gtaaatgtgc agttatgggt ctgccgtttg gtggtgcaaa aggtggcatt 360
accgttaatc cgaaagaact gagccgtatg gaactggaac gcctgagccg tgcatatatt 420
gcccgtattg cagaatttat tggtcccaaa accgatattc cggcaccgga tgtttatacc 480
aatccgatga ttatgggttg gatgatgatg gaatatagca aaattgccca agaacagagt 540
ccggcagtta ttaccggcaa accgattccg ttaggtggta gcctgggtcg tgaagatgca 600
accggtcgtg gtggttatta ttgtattaaa gagctggaag agaagaaacg ttggaaaccg 660
agcaaaattc gtgttgccat tcaaggtttt ggtaatgtgg gtcagaatat tgcacgtctg 720
ctgcatgccg atggctataa aatcgttgca gttagcgata gccaaggcgg tatctataaa 780
gaagaaggtt ttgatattcc gagcctgatc cagaataaaa acgcaacccg tcgtctgaaa 840
gcaatctatt gtaccggtag cgtttgtgaa accattcagg ttaaaagcct gagcaataaa 900
gatctgctgg aacttgatgt ggatattctg attccggcag cactggaaaa tcagattacc 960
gagaaaaatg ccagcaaaat caaagccagc aacattctgg aactggcaaa tggtccgatt 1020
accaccgaag cagataaaat cctgaacaaa aaaggtgttc tggtggttcc ggatatcctg 1080
gccaatggtg gtggtgttac cgttagctat tttgaatggg ttcagaataa ccagggctat 1140
tattggagcg aagaagaagt tcacgcaaaa ctgcatacct tcatgatccg cgaatttaac 1200
aatgtgtatc atctgatgac caaccgcaaa ataaacatgc gtaccgcagc atatgttcat 1260
gccctgaatc gtattggtga agcagttgaa gcacgtggca ccagcaaata ctttctgggt 1320
aatccgtag 1329
<210> 34
<211> 442
<212> PRT
<213> δ变形菌纲细菌RIFCSPLOWO2 02 FULL 50 16
<400> 34
Met Thr Lys Ser Ile Pro Lys Lys Asp Ser Ser Gly Thr Gln Glu Thr
1 5 10 15
Asn Ile Phe Ala Asn Ala Leu Lys Arg Leu Asp Glu Ala Ala Gln Phe
20 25 30
Ala Asp Ile Pro Pro Glu Ala Leu Glu Arg Leu Lys His Pro Lys Lys
35 40 45
Met Ile Gln Val Ser Ile Pro Ile Arg Met Asp Asn Gly Gly Leu Arg
50 55 60
Ile Phe Gln Gly Tyr Arg Val Arg His Asp His Thr Arg Gly Pro Gly
65 70 75 80
Lys Gly Gly Ile Arg Phe His Pro Asn Val Asn Leu Asp Glu Val Lys
85 90 95
Ala Leu Ala Leu Trp Met Thr Cys Lys Cys Ala Val Met Gly Leu Pro
100 105 110
Phe Gly Gly Ala Lys Gly Gly Ile Thr Val Asn Pro Lys Glu Leu Ser
115 120 125
Arg Met Glu Leu Glu Arg Leu Ser Arg Ala Tyr Ile Ala Arg Ile Ala
130 135 140
Glu Phe Ile Gly Pro Lys Thr Asp Ile Pro Ala Pro Asp Val Tyr Thr
145 150 155 160
Asn Pro Met Ile Met Gly Trp Met Met Met Glu Tyr Ser Lys Ile Ala
165 170 175
Gln Glu Gln Ser Pro Ala Val Ile Thr Gly Lys Pro Ile Pro Leu Gly
180 185 190
Gly Ser Leu Gly Arg Glu Asp Ala Thr Gly Arg Gly Gly Tyr Tyr Cys
195 200 205
Ile Lys Glu Leu Glu Glu Lys Lys Arg Trp Lys Pro Ser Lys Ile Arg
210 215 220
Val Ala Ile Gln Gly Phe Gly Asn Val Gly Gln Asn Ile Ala Arg Leu
225 230 235 240
Leu His Ala Asp Gly Tyr Lys Ile Val Ala Val Ser Asp Ser Gln Gly
245 250 255
Gly Ile Tyr Lys Glu Glu Gly Phe Asp Ile Pro Ser Leu Ile Gln Asn
260 265 270
Lys Asn Ala Thr Arg Arg Leu Lys Ala Ile Tyr Cys Thr Gly Ser Val
275 280 285
Cys Glu Thr Ile Gln Val Lys Ser Leu Ser Asn Lys Asp Leu Leu Glu
290 295 300
Leu Asp Val Asp Ile Leu Ile Pro Ala Ala Leu Glu Asn Gln Ile Thr
305 310 315 320
Glu Lys Asn Ala Ser Lys Ile Lys Ala Ser Asn Ile Leu Glu Leu Ala
325 330 335
Asn Gly Pro Ile Thr Thr Glu Ala Asp Lys Ile Leu Asn Lys Lys Gly
340 345 350
Val Leu Val Val Pro Asp Ile Leu Ala Asn Gly Gly Gly Val Thr Val
355 360 365
Ser Tyr Phe Glu Trp Val Gln Asn Asn Gln Gly Tyr Tyr Trp Ser Glu
370 375 380
Glu Glu Val His Ala Lys Leu His Thr Phe Met Ile Arg Glu Phe Asn
385 390 395 400
Asn Val Tyr His Leu Met Thr Asn Arg Lys Ile Asn Met Arg Thr Ala
405 410 415
Ala Tyr Val His Ala Leu Asn Arg Ile Gly Glu Ala Val Glu Ala Arg
420 425 430
Gly Thr Ser Lys Tyr Phe Leu Gly Asn Pro
435 440
<210> 35
<211> 1272
<212> DNA
<213> 普氏厌氧球菌DSM 20548
<400> 35
atgagcgaaa aactggatat tctggaagca acccgtgatc gttacaaaaa agcatgcgat 60
aaactgaaac tggacagcgc agtttatgaa attctgaaag aaccggaacg tctgattgaa 120
gttgcaattc cgattaaaat ggatgacggc aaaaccaaag tgtttaaagc atttcgtagc 180
gcacatagca gcgcactggg tccgagcaaa ggtggtattc gttttgataa aaatgtgacc 240
cgtgaagaag ttatggcact gagcatgatg atgagcatta aagttgcact gctgggtctg 300
ccgttaggtg gtggtaaagg tggtgttatt gttgatccga aagaactgag cgaacgtgaa 360
attgaaagcc tgagccgtgg ttttgttcgt gcaaccaata actatctggg tagccgtatt 420
gatattccgg caccggatgt taataccaac gccaaaatta tgggctattt catcgacgaa 480
tacattgcac tgaatcaggg tcgtgaagat attgcaacct ttaccggcaa accgctggca 540
ttaggtggta gctttgcacg tgatcaggca accggttttg gtgttgcact ggcagttaaa 600
tatgcctatg aacgtaaaga tgaaggcctg aaaggcaaaa cctttatttg tcaaggtttt 660
ggcaatgtgg gttacttcgc agccaaatat atgagcgaat ttggtgcacg cctgattgca 720
gttaatgcaa gcgatcgtaa agcaccgagc ggtagcagcg ccattattaa cgaagatggt 780
ctggatgttg aagaactgcg caaactgaaa gaagatggta gtagcgttct ggattatgca 840
gatagccgta aaattagcaa cgaagaattt tttgccctgg acaccgatat tattctgccg 900
tgtgcactgg aaaatgtgat caccgaaaaa atcgccaaaa ccatcaaagc caaagtgatt 960
agcgaaggtg caaatggtcc gaccacacct ggtggtgcac aggttctgga agataaaggt 1020
gttgttctga ttccggatat tatggcaaat agcggtggtg ttctggttag ccattatgaa 1080
tggattcaga atcagatcgg ctactatttc gattacgaca aggtgaaaga taaagaagag 1140
ggcgatctgc tgcgtgtttt tgaacgtatt tttgatatgg ccgaggaaga gaacgttgat 1200
ctgcgtgaag caagctttat ggttgcaatt aaaagcatgg cagaagccct gaaatacaaa 1260
ggtcgttatt ag 1272
<210> 36
<211> 423
<212> PRT
<213> 普氏厌氧球菌DSM 20548
<400> 36
Met Ser Glu Lys Leu Asp Ile Leu Glu Ala Thr Arg Asp Arg Tyr Lys
1 5 10 15
Lys Ala Cys Asp Lys Leu Lys Leu Asp Ser Ala Val Tyr Glu Ile Leu
20 25 30
Lys Glu Pro Glu Arg Leu Ile Glu Val Ala Ile Pro Ile Lys Met Asp
35 40 45
Asp Gly Lys Thr Lys Val Phe Lys Ala Phe Arg Ser Ala His Ser Ser
50 55 60
Ala Leu Gly Pro Ser Lys Gly Gly Ile Arg Phe Asp Lys Asn Val Thr
65 70 75 80
Arg Glu Glu Val Met Ala Leu Ser Met Met Met Ser Ile Lys Val Ala
85 90 95
Leu Leu Gly Leu Pro Leu Gly Gly Gly Lys Gly Gly Val Ile Val Asp
100 105 110
Pro Lys Glu Leu Ser Glu Arg Glu Ile Glu Ser Leu Ser Arg Gly Phe
115 120 125
Val Arg Ala Thr Asn Asn Tyr Leu Gly Ser Arg Ile Asp Ile Pro Ala
130 135 140
Pro Asp Val Asn Thr Asn Ala Lys Ile Met Gly Tyr Phe Ile Asp Glu
145 150 155 160
Tyr Ile Ala Leu Asn Gln Gly Arg Glu Asp Ile Ala Thr Phe Thr Gly
165 170 175
Lys Pro Leu Ala Leu Gly Gly Ser Phe Ala Arg Asp Gln Ala Thr Gly
180 185 190
Phe Gly Val Ala Leu Ala Val Lys Tyr Ala Tyr Glu Arg Lys Asp Glu
195 200 205
Gly Leu Lys Gly Lys Thr Phe Ile Cys Gln Gly Phe Gly Asn Val Gly
210 215 220
Tyr Phe Ala Ala Lys Tyr Met Ser Glu Phe Gly Ala Arg Leu Ile Ala
225 230 235 240
Val Asn Ala Ser Asp Arg Lys Ala Pro Ser Gly Ser Ser Ala Ile Ile
245 250 255
Asn Glu Asp Gly Leu Asp Val Glu Glu Leu Arg Lys Leu Lys Glu Asp
260 265 270
Gly Ser Ser Val Leu Asp Tyr Ala Asp Ser Arg Lys Ile Ser Asn Glu
275 280 285
Glu Phe Phe Ala Leu Asp Thr Asp Ile Ile Leu Pro Cys Ala Leu Glu
290 295 300
Asn Val Ile Thr Glu Lys Ile Ala Lys Thr Ile Lys Ala Lys Val Ile
305 310 315 320
Ser Glu Gly Ala Asn Gly Pro Thr Thr Pro Gly Gly Ala Gln Val Leu
325 330 335
Glu Asp Lys Gly Val Val Leu Ile Pro Asp Ile Met Ala Asn Ser Gly
340 345 350
Gly Val Leu Val Ser His Tyr Glu Trp Ile Gln Asn Gln Ile Gly Tyr
355 360 365
Tyr Phe Asp Tyr Asp Lys Val Lys Asp Lys Glu Glu Gly Asp Leu Leu
370 375 380
Arg Val Phe Glu Arg Ile Phe Asp Met Ala Glu Glu Glu Asn Val Asp
385 390 395 400
Leu Arg Glu Ala Ser Phe Met Val Ala Ile Lys Ser Met Ala Glu Ala
405 410 415
Leu Lys Tyr Lys Gly Arg Tyr
420
<210> 37
<211> 1266
<212> DNA
<213> 拟杆菌门细菌
<400> 37
atgagcaccc cgaccaccac cgcacaagaa agcatgtatg aagcagttct ggcacgtctg 60
aatgttgcag cacagattat taacctgccg gaaccgatta ccgaagttct gcgtcatccg 120
cagaaagaaa tcaaagttag cctgccgatt gtgatggata acggtaagat taaagtgttt 180
gaaggttatc gtgttgtgca tagcacccat ctgggtccga gcaaaggtgg tattcgttat 240
gcaatggatg tgaacgaaga tgaagttcgt gcactggcag catggatgac ctttaaatgt 300
gcagttgccg atctgccgta tggtggtgca aaaggtggca ttaaatgtga tccgaaacaa 360
atgagcgaag gtgaactgga acgtctgagc cgtgcatatg ccgttgcaat gaaagatgtt 420
attggcgtga ataaagatat tccggcaccg gatatgggca ccagcgcacg tgaaatggca 480
tggattctgg atgaatataa caaaattacc ggtgaagatg caccgggtgt tattaccggc 540
aaaccggttg gtttaggtgg tagcctgggt cgtgaagcag caaccggtcg tggtgttatg 600
attaatagtc tgcaggcact gagcaaactg aacattcagc cgaaacaggc aaccgcagca 660
gttcaaggtt ttggtaatgt tggtagccat gcagcacgtc tgctggcaga acagggtatt 720
aaagttattg caattagtga tgcaagcggt ggctactata atgaaaaagg cattaacatt 780
caggatgccc tgaattatgc gggtaaaaac aataaaagcc tgaacggtta tccgaacgcc 840
accaaaatta caaatgaaca gctgctgacc ctgagcgttg atctgctggt tcctgcagca 900
ctgcagaatg tgattaccta tgaaattgcc cagaacgtga agtgcaaaat tatcgttgaa 960
ggtgccaatg gtccgacact gccggaagca gatcaggttc tgaaagataa aggtattatt 1020
gtggtgccgg atattctggc aaatagcggt ggtgttaccg ttagctattt tgaatgggtg 1080
cagaacaaaa tgggctatta ttggaccgaa gatgaggtga atcagaaaca cgatgagaaa 1140
atgaaaatcg cctttgagaa agtgtggaac aacgcacaga aatatcagac cagcatgcgt 1200
attgcagcat atattaccgc actggaaaaa attcagctgg gcattaaaat gaaaggccat 1260
ttttag 1266
<210> 38
<211> 421
<212> PRT
<213> 拟杆菌门细菌
<400> 38
Met Ser Thr Pro Thr Thr Thr Ala Gln Glu Ser Met Tyr Glu Ala Val
1 5 10 15
Leu Ala Arg Leu Asn Val Ala Ala Gln Ile Ile Asn Leu Pro Glu Pro
20 25 30
Ile Thr Glu Val Leu Arg His Pro Gln Lys Glu Ile Lys Val Ser Leu
35 40 45
Pro Ile Val Met Asp Asn Gly Lys Ile Lys Val Phe Glu Gly Tyr Arg
50 55 60
Val Val His Ser Thr His Leu Gly Pro Ser Lys Gly Gly Ile Arg Tyr
65 70 75 80
Ala Met Asp Val Asn Glu Asp Glu Val Arg Ala Leu Ala Ala Trp Met
85 90 95
Thr Phe Lys Cys Ala Val Ala Asp Leu Pro Tyr Gly Gly Ala Lys Gly
100 105 110
Gly Ile Lys Cys Asp Pro Lys Gln Met Ser Glu Gly Glu Leu Glu Arg
115 120 125
Leu Ser Arg Ala Tyr Ala Val Ala Met Lys Asp Val Ile Gly Val Asn
130 135 140
Lys Asp Ile Pro Ala Pro Asp Met Gly Thr Ser Ala Arg Glu Met Ala
145 150 155 160
Trp Ile Leu Asp Glu Tyr Asn Lys Ile Thr Gly Glu Asp Ala Pro Gly
165 170 175
Val Ile Thr Gly Lys Pro Val Gly Leu Gly Gly Ser Leu Gly Arg Glu
180 185 190
Ala Ala Thr Gly Arg Gly Val Met Ile Asn Ser Leu Gln Ala Leu Ser
195 200 205
Lys Leu Asn Ile Gln Pro Lys Gln Ala Thr Ala Ala Val Gln Gly Phe
210 215 220
Gly Asn Val Gly Ser His Ala Ala Arg Leu Leu Ala Glu Gln Gly Ile
225 230 235 240
Lys Val Ile Ala Ile Ser Asp Ala Ser Gly Gly Tyr Tyr Asn Glu Lys
245 250 255
Gly Ile Asn Ile Gln Asp Ala Leu Asn Tyr Ala Gly Lys Asn Asn Lys
260 265 270
Ser Leu Asn Gly Tyr Pro Asn Ala Thr Lys Ile Thr Asn Glu Gln Leu
275 280 285
Leu Thr Leu Ser Val Asp Leu Leu Val Pro Ala Ala Leu Gln Asn Val
290 295 300
Ile Thr Tyr Glu Ile Ala Gln Asn Val Lys Cys Lys Ile Ile Val Glu
305 310 315 320
Gly Ala Asn Gly Pro Thr Leu Pro Glu Ala Asp Gln Val Leu Lys Asp
325 330 335
Lys Gly Ile Ile Val Val Pro Asp Ile Leu Ala Asn Ser Gly Gly Val
340 345 350
Thr Val Ser Tyr Phe Glu Trp Val Gln Asn Lys Met Gly Tyr Tyr Trp
355 360 365
Thr Glu Asp Glu Val Asn Gln Lys His Asp Glu Lys Met Lys Ile Ala
370 375 380
Phe Glu Lys Val Trp Asn Asn Ala Gln Lys Tyr Gln Thr Ser Met Arg
385 390 395 400
Ile Ala Ala Tyr Ile Thr Ala Leu Glu Lys Ile Gln Leu Gly Ile Lys
405 410 415
Met Lys Gly His Phe
420
<210> 39
<211> 1269
<212> DNA
<213> 溶乳厌氧菌S7-1-13
<400> 39
atgaccaccg catatgaaca gtttattaac ctgcagaaga aactgaaaga ggttagcgat 60
ctggcaggtt ttagcgaaag cttttataac attattcgtg agccggaacg catcattgaa 120
gttaatattc cggtgaaaat ggatgatggt acaacccgta cctttcgtgc atttcgtagc 180
gcacatagca gcgcactggg tccgagcaaa ggtggtgttc gttatgatga aagcgttacc 240
tatgaagagg ttaaagttct gagcaccctg atgagcctga aagttgcact gctgggtctg 300
ccgttaggtg gtggtaaagg tggtattgtt gttgatccga aaaaactgag cgaacgtgaa 360
ctggaagcac tgagccgtgg ttttgttcgt gccattaata actatattgg tccgcgtatt 420
gatgttccgg caccggatgt taataccaat ggcaaaatta tgggctattt caccgatgaa 480
tacattgccc tgaatggtaa tcgtcatgat attgcaacct ttaccggcaa aagcaccgat 540
atgggtggta gcctgggtcg taccgaagca accggttttg gtgtttatct gaccatcaaa 600
aagtactacg agaaaattgg caaaagcctg gatggtgcga cctttgcact gcaaggtttt 660
ggtaatgttg gtagctttgc agcacgtttt ctgacccagg atggtgcaaa actgattgca 720
ctgaatagca aagacaaaag ccagaaaagc ggtagcagcg ccatttatga tccgaatggt 780
ctggatgttg agaaactgga aaaagcacgt gaagaaaccg gttcagccct gaatattgaa 840
gccaaaaaaa tcctgaacga agagtttttt gcgatcccgt gtgatattct gattccggca 900
gcaatggaaa acgtgattga tgaaaccaat gcgggtaaca ttaaagcaag cctggttgtt 960
gaagcagcaa atggtccggt taccaaagcc ggtgaagcaa ttctgaatga aaaaaacatt 1020
ccgatcatcc cggatattct ggcaaatagc ggtggtgtgc tggttagcca ttatgaatgg 1080
attcagaata tgaccggtag ctattgggat gaagatgaag ttatgaccaa acaagagaag 1140
gatatgagca aagccattgg tgaagttttt gcaaccgcag agaaatacaa agtgaatttt 1200
cgtgaagcca gctttattct gagcctgagc cgtattgaaa aagccctgaa actgcgtggt 1260
cgtatttag 1269
<210> 40
<211> 422
<212> PRT
<213> 溶乳厌氧菌S7-1-13
<400> 40
Met Thr Thr Ala Tyr Glu Gln Phe Ile Asn Leu Gln Lys Lys Leu Lys
1 5 10 15
Glu Val Ser Asp Leu Ala Gly Phe Ser Glu Ser Phe Tyr Asn Ile Ile
20 25 30
Arg Glu Pro Glu Arg Ile Ile Glu Val Asn Ile Pro Val Lys Met Asp
35 40 45
Asp Gly Thr Thr Arg Thr Phe Arg Ala Phe Arg Ser Ala His Ser Ser
50 55 60
Ala Leu Gly Pro Ser Lys Gly Gly Val Arg Tyr Asp Glu Ser Val Thr
65 70 75 80
Tyr Glu Glu Val Lys Val Leu Ser Thr Leu Met Ser Leu Lys Val Ala
85 90 95
Leu Leu Gly Leu Pro Leu Gly Gly Gly Lys Gly Gly Ile Val Val Asp
100 105 110
Pro Lys Lys Leu Ser Glu Arg Glu Leu Glu Ala Leu Ser Arg Gly Phe
115 120 125
Val Arg Ala Ile Asn Asn Tyr Ile Gly Pro Arg Ile Asp Val Pro Ala
130 135 140
Pro Asp Val Asn Thr Asn Gly Lys Ile Met Gly Tyr Phe Thr Asp Glu
145 150 155 160
Tyr Ile Ala Leu Asn Gly Asn Arg His Asp Ile Ala Thr Phe Thr Gly
165 170 175
Lys Ser Thr Asp Met Gly Gly Ser Leu Gly Arg Thr Glu Ala Thr Gly
180 185 190
Phe Gly Val Tyr Leu Thr Ile Lys Lys Tyr Tyr Glu Lys Ile Gly Lys
195 200 205
Ser Leu Asp Gly Ala Thr Phe Ala Leu Gln Gly Phe Gly Asn Val Gly
210 215 220
Ser Phe Ala Ala Arg Phe Leu Thr Gln Asp Gly Ala Lys Leu Ile Ala
225 230 235 240
Leu Asn Ser Lys Asp Lys Ser Gln Lys Ser Gly Ser Ser Ala Ile Tyr
245 250 255
Asp Pro Asn Gly Leu Asp Val Glu Lys Leu Glu Lys Ala Arg Glu Glu
260 265 270
Thr Gly Ser Ala Leu Asn Ile Glu Ala Lys Lys Ile Leu Asn Glu Glu
275 280 285
Phe Phe Ala Ile Pro Cys Asp Ile Leu Ile Pro Ala Ala Met Glu Asn
290 295 300
Val Ile Asp Glu Thr Asn Ala Gly Asn Ile Lys Ala Ser Leu Val Val
305 310 315 320
Glu Ala Ala Asn Gly Pro Val Thr Lys Ala Gly Glu Ala Ile Leu Asn
325 330 335
Glu Lys Asn Ile Pro Ile Ile Pro Asp Ile Leu Ala Asn Ser Gly Gly
340 345 350
Val Leu Val Ser His Tyr Glu Trp Ile Gln Asn Met Thr Gly Ser Tyr
355 360 365
Trp Asp Glu Asp Glu Val Met Thr Lys Gln Glu Lys Asp Met Ser Lys
370 375 380
Ala Ile Gly Glu Val Phe Ala Thr Ala Glu Lys Tyr Lys Val Asn Phe
385 390 395 400
Arg Glu Ala Ser Phe Ile Leu Ser Leu Ser Arg Ile Glu Lys Ala Leu
405 410 415
Lys Leu Arg Gly Arg Ile
420
<210> 41
<211> 1344
<212> DNA
<213> 丝状极杆菌
<400> 41
atggaactga aaatcaaaga attcatggaa atggtcaaga cccgcaataa tcatgaaccg 60
gaatttctgc aggcagttca agaagttgca gaaaccgtta ttccgtatat tgccaaccac 120
gatatctaca acggtaaaaa cattctgctg cgtatggtgg aaccggaacg tctgattagc 180
tttcgtgtta gctgggttga tgataatggt gaaattcagg tgaatcgcgg ttatcgcatt 240
cagatgaata gcgcaattgg tccgtataaa ggtggtctgc gttttcatcc gaccgttaat 300
gcaagcattc tgaaatttct ggcctttgaa caggtgttta aaaacagcct gaccacactg 360
ccgatgggtg gtggtaaagg tggcagtgat tttgatccga aaggtaaaag cgaaaacgag 420
attatgcgtt tttgccacag ctttatgagc gaactgtatc gtcatattgg ccataacacc 480
gatgttccgg caggcgatat tggtgttggt agccgtgaaa ttggttttat gtttggcatg 540
tacaaaaaac tgaacaacag ctttaccggt gttctgaccg gcaaaggtgc aagctggggt 600
ggtagcctga ttcgtccgga agcaaccggt tatggcaccg tttattttgc acagaatatg 660
ctgctgcgca aagaagatag ctttgcgggt aaaaaagttg tgattagcgg tagcggtaat 720
gttgcacagt atgcagcaga aaaagcaatt gaactgggtg caaccgttct gaccctgagc 780
gatagcggtg gttatatcct ggatgaagaa ggcattaata ccgagaaact gaagcacatc 840
atgtacatca aaaacgaaaa acgtggtcgc atcagcgagt ataccgaaaa atatccgaat 900
gccaaatttg ttgccggtgg tcgtccgtgg tcagttaaat gtgatattgc actgccgtgt 960
gcaacccaga atgaactgaa tggtgatgaa gcaaaacagc tgattaaaaa cggttgtatg 1020
tgtgttagcg aaggtgcaaa tatgccgagc acaccggaag ccattcatga gtttcagaac 1080
gcaaaaattc tgttcgcacc gggtaaagca agcaatgcag gcggtgttgc aaccagcggt 1140
ctggaaatga gccagaatag cctgcgtctg agctggtcac gtaaagaagt ggacgataaa 1200
ctgaaagata tcatggaaga tatccacgat agctgcgttg aatatggcga aaatgaagat 1260
ggcaccatcg attatatcaa gggtgccaat attgccggtt ttgttaaagt tgccgatgca 1320
atgctggcac agggtgttgt ttag 1344
<210> 42
<211> 447
<212> PRT
<213> 丝状极杆菌
<400> 42
Met Glu Leu Lys Ile Lys Glu Phe Met Glu Met Val Lys Thr Arg Asn
1 5 10 15
Asn His Glu Pro Glu Phe Leu Gln Ala Val Gln Glu Val Ala Glu Thr
20 25 30
Val Ile Pro Tyr Ile Ala Asn His Asp Ile Tyr Asn Gly Lys Asn Ile
35 40 45
Leu Leu Arg Met Val Glu Pro Glu Arg Leu Ile Ser Phe Arg Val Ser
50 55 60
Trp Val Asp Asp Asn Gly Glu Ile Gln Val Asn Arg Gly Tyr Arg Ile
65 70 75 80
Gln Met Asn Ser Ala Ile Gly Pro Tyr Lys Gly Gly Leu Arg Phe His
85 90 95
Pro Thr Val Asn Ala Ser Ile Leu Lys Phe Leu Ala Phe Glu Gln Val
100 105 110
Phe Lys Asn Ser Leu Thr Thr Leu Pro Met Gly Gly Gly Lys Gly Gly
115 120 125
Ser Asp Phe Asp Pro Lys Gly Lys Ser Glu Asn Glu Ile Met Arg Phe
130 135 140
Cys His Ser Phe Met Ser Glu Leu Tyr Arg His Ile Gly His Asn Thr
145 150 155 160
Asp Val Pro Ala Gly Asp Ile Gly Val Gly Ser Arg Glu Ile Gly Phe
165 170 175
Met Phe Gly Met Tyr Lys Lys Leu Asn Asn Ser Phe Thr Gly Val Leu
180 185 190
Thr Gly Lys Gly Ala Ser Trp Gly Gly Ser Leu Ile Arg Pro Glu Ala
195 200 205
Thr Gly Tyr Gly Thr Val Tyr Phe Ala Gln Asn Met Leu Leu Arg Lys
210 215 220
Glu Asp Ser Phe Ala Gly Lys Lys Val Val Ile Ser Gly Ser Gly Asn
225 230 235 240
Val Ala Gln Tyr Ala Ala Glu Lys Ala Ile Glu Leu Gly Ala Thr Val
245 250 255
Leu Thr Leu Ser Asp Ser Gly Gly Tyr Ile Leu Asp Glu Glu Gly Ile
260 265 270
Asn Thr Glu Lys Leu Lys His Ile Met Tyr Ile Lys Asn Glu Lys Arg
275 280 285
Gly Arg Ile Ser Glu Tyr Thr Glu Lys Tyr Pro Asn Ala Lys Phe Val
290 295 300
Ala Gly Gly Arg Pro Trp Ser Val Lys Cys Asp Ile Ala Leu Pro Cys
305 310 315 320
Ala Thr Gln Asn Glu Leu Asn Gly Asp Glu Ala Lys Gln Leu Ile Lys
325 330 335
Asn Gly Cys Met Cys Val Ser Glu Gly Ala Asn Met Pro Ser Thr Pro
340 345 350
Glu Ala Ile His Glu Phe Gln Asn Ala Lys Ile Leu Phe Ala Pro Gly
355 360 365
Lys Ala Ser Asn Ala Gly Gly Val Ala Thr Ser Gly Leu Glu Met Ser
370 375 380
Gln Asn Ser Leu Arg Leu Ser Trp Ser Arg Lys Glu Val Asp Asp Lys
385 390 395 400
Leu Lys Asp Ile Met Glu Asp Ile His Asp Ser Cys Val Glu Tyr Gly
405 410 415
Glu Asn Glu Asp Gly Thr Ile Asp Tyr Ile Lys Gly Ala Asn Ile Ala
420 425 430
Gly Phe Val Lys Val Ala Asp Ala Met Leu Ala Gln Gly Val Val
435 440 445
<210> 43
<211> 1269
<212> DNA
<213> 食菌蛭弧菌W
<400> 43
atggcaaatg gtcatgatct gtatgaaggt ccgctgttta ataacgcact gaaagcactg 60
gaacatgccg gtaaaatcat taattgcaat ccgaacgtga tggaaaaact gcgtcgtccg 120
cgtcgtagca ttaccgttag cattccggtt cgtatggatg atttttccgt taaagtgttt 180
accggttatc gtgttcagta ttgtgcaacc ctgggtccgt ataaaggtgg tattcgtttt 240
catcctgatg ttggtctggc agaagttgca ggcctggcag cactgatgac ctttaaaaac 300
agcctgctgg gtctgccgtt aggtggtgca aaaggtggtg ttaccgttga tccgagcaaa 360
ctgagcgcaa ccgaaaaaca aattctgacc cgtcgttata ccagcgaaat tggtccgttt 420
atgggtccgc agaaagatat tccggcaccg gatgttggca ccgatgcaca gaccatggca 480
tggatgatgg atacctatag ccaagaaaat ggtggtttta cccagaccgg tgttgttacc 540
ggcaaaccgg ttgaaattgg tggtagcgtt ggtcgtaatc atgcaacagg tctgggtgtt 600
atttatgtta ccgaacatgc ctttcacaaa aaaggcctgg attttcaggg tgcacgtatt 660
gcaattcaag gttttggtaa tgttggtgca agcgcagcac attttgcaca tctgcgtggt 720
gccaaagtta ttgccattag tgatgttagc ggtgcctatt ttaacggtga tggtattgat 780
attccgagcg caattcgtca tatcaagacc tataaatacc tggaaggttt ccagggtgca 840
gaactgatta gccatccgga actgtttgaa ctgccgtgtg aagcactgat tccgtgtgca 900
ctggaaaatc agattacaga acataacgca catagcatcc aggccaaaat gattgttgaa 960
ggtgccaatg gtccgctgag ccatgaagca accaaaattc tgagcgaaaa aggcgttttt 1020
attgtgccgg atctgattgc gaatggtggt ggtgtgattg ttagctattt tgaatgggtt 1080
caagacacca tgagctattt ttgggaagaa ccggaagtgc atgaacgtct gaaaagcatt 1140
attctgaaag ccttcgaaac cagctatgcc tttagcattg acaaaaaaac cgatatgcgt 1200
gatgcagcaa tggcagttgc cattcagcgt ctggaaaaag caatgctgct gcgtggtatg 1260
tgtccgtag 1269
<210> 44
<211> 422
<212> PRT
<213> 食菌蛭弧菌W
<400> 44
Met Ala Asn Gly His Asp Leu Tyr Glu Gly Pro Leu Phe Asn Asn Ala
1 5 10 15
Leu Lys Ala Leu Glu His Ala Gly Lys Ile Ile Asn Cys Asn Pro Asn
20 25 30
Val Met Glu Lys Leu Arg Arg Pro Arg Arg Ser Ile Thr Val Ser Ile
35 40 45
Pro Val Arg Met Asp Asp Phe Ser Val Lys Val Phe Thr Gly Tyr Arg
50 55 60
Val Gln Tyr Cys Ala Thr Leu Gly Pro Tyr Lys Gly Gly Ile Arg Phe
65 70 75 80
His Pro Asp Val Gly Leu Ala Glu Val Ala Gly Leu Ala Ala Leu Met
85 90 95
Thr Phe Lys Asn Ser Leu Leu Gly Leu Pro Leu Gly Gly Ala Lys Gly
100 105 110
Gly Val Thr Val Asp Pro Ser Lys Leu Ser Ala Thr Glu Lys Gln Ile
115 120 125
Leu Thr Arg Arg Tyr Thr Ser Glu Ile Gly Pro Phe Met Gly Pro Gln
130 135 140
Lys Asp Ile Pro Ala Pro Asp Val Gly Thr Asp Ala Gln Thr Met Ala
145 150 155 160
Trp Met Met Asp Thr Tyr Ser Gln Glu Asn Gly Gly Phe Thr Gln Thr
165 170 175
Gly Val Val Thr Gly Lys Pro Val Glu Ile Gly Gly Ser Val Gly Arg
180 185 190
Asn His Ala Thr Gly Leu Gly Val Ile Tyr Val Thr Glu His Ala Phe
195 200 205
His Lys Lys Gly Leu Asp Phe Gln Gly Ala Arg Ile Ala Ile Gln Gly
210 215 220
Phe Gly Asn Val Gly Ala Ser Ala Ala His Phe Ala His Leu Arg Gly
225 230 235 240
Ala Lys Val Ile Ala Ile Ser Asp Val Ser Gly Ala Tyr Phe Asn Gly
245 250 255
Asp Gly Ile Asp Ile Pro Ser Ala Ile Arg His Ile Lys Thr Tyr Lys
260 265 270
Tyr Leu Glu Gly Phe Gln Gly Ala Glu Leu Ile Ser His Pro Glu Leu
275 280 285
Phe Glu Leu Pro Cys Glu Ala Leu Ile Pro Cys Ala Leu Glu Asn Gln
290 295 300
Ile Thr Glu His Asn Ala His Ser Ile Gln Ala Lys Met Ile Val Glu
305 310 315 320
Gly Ala Asn Gly Pro Leu Ser His Glu Ala Thr Lys Ile Leu Ser Glu
325 330 335
Lys Gly Val Phe Ile Val Pro Asp Leu Ile Ala Asn Gly Gly Gly Val
340 345 350
Ile Val Ser Tyr Phe Glu Trp Val Gln Asp Thr Met Ser Tyr Phe Trp
355 360 365
Glu Glu Pro Glu Val His Glu Arg Leu Lys Ser Ile Ile Leu Lys Ala
370 375 380
Phe Glu Thr Ser Tyr Ala Phe Ser Ile Asp Lys Lys Thr Asp Met Arg
385 390 395 400
Asp Ala Ala Met Ala Val Ala Ile Gln Arg Leu Glu Lys Ala Met Leu
405 410 415
Leu Arg Gly Met Cys Pro
420
<210> 45
<211> 1338
<212> DNA
<213> 脆弱拟杆菌
<400> 45
atgaacatcg agaaaattat gagcagcctg gaagcaaaac atccgggtga aagcgaatat 60
ctgcaggcag ttaaagaagt tctgctgagc attgaggata tctataatca gcatccggaa 120
ttcgagaaaa gcaaaattat cgaacgtctg gttgaaccgg atcgcatttt tacctttcgt 180
gttacctggg ttgatgataa aggtgaagtt cagaccaatc tgggttatcg tgttcagttt 240
aataacgcca ttggtccgta taaaggtggt attcgttttc atgcaagcgt gaatctgagc 300
atcctgaaat ttctgggttt tgagcagacc tttaaaaacg cactgaccac actgccgatg 360
ggtggtggta aaggtggcag cgattttagt ccgcgtggta aatcagatgc agaaattatg 420
cgtttttgcc aggcatttat gctggaactg tggcgtcatc tgggtcctga tatggatgtt 480
ccggcaggcg atattggtgt tggtggtcgt gaagttggtt atatgtttgg catgtacaaa 540
aaactgaccc gtgagtttac cggtacattt accggcaaag gtctggaatt tggtggtagc 600
ctgattcgtc cggaagcaac cggttttggt ggtctgtatt ttgttaacca gatgctgcag 660
accaaaggca ttgatattaa aggcaaaacc gttgccatta gcggttttgg caatgttgca 720
tggggtgcag caaccaaagc aaccgaactg ggtgcaaaag ttgttaccat tagtggtccg 780
gatggctata tctatgatcc gaatggtatt agcggtgaga aaatcgatta tatgttagaa 840
ctgcgtgcca gcggtaatga tattgttgca ccgtatgcag atgaatttcc gggtagcacc 900
tttgttgcag gtaaacgtcc gtgggaagtt aaagcagata ttgcactgcc gtgtgcaacc 960
cagaatgaac tgaatggtga agatgccaaa aacctgattg ataacaatgt tctgtgcgtg 1020
ggcgaaatta gcaatatggg ttgtacaccg gaagccattg acctgtttat tgaacacaaa 1080
accatgtacg caccgggtaa agcagttaat gccggtggtg ttgcaaccag cggtctggaa 1140
atgagccaga atgcaatgca tctgagctgg tcagcagccg aagttgatga aaaactgcat 1200
agcattatgc atggtattca tgcccagtgt gttaaatatg gcaccgaacc tgatggctac 1260
atcaattatg ttaaaggtgc aaacattgcc ggttttatga aagttgcaca tgcaatgatg 1320
ggtcagggca ttatttag 1338
<210> 46
<211> 445
<212> PRT
<213> 脆弱拟杆菌
<400> 46
Met Asn Ile Glu Lys Ile Met Ser Ser Leu Glu Ala Lys His Pro Gly
1 5 10 15
Glu Ser Glu Tyr Leu Gln Ala Val Lys Glu Val Leu Leu Ser Ile Glu
20 25 30
Asp Ile Tyr Asn Gln His Pro Glu Phe Glu Lys Ser Lys Ile Ile Glu
35 40 45
Arg Leu Val Glu Pro Asp Arg Ile Phe Thr Phe Arg Val Thr Trp Val
50 55 60
Asp Asp Lys Gly Glu Val Gln Thr Asn Leu Gly Tyr Arg Val Gln Phe
65 70 75 80
Asn Asn Ala Ile Gly Pro Tyr Lys Gly Gly Ile Arg Phe His Ala Ser
85 90 95
Val Asn Leu Ser Ile Leu Lys Phe Leu Gly Phe Glu Gln Thr Phe Lys
100 105 110
Asn Ala Leu Thr Thr Leu Pro Met Gly Gly Gly Lys Gly Gly Ser Asp
115 120 125
Phe Ser Pro Arg Gly Lys Ser Asp Ala Glu Ile Met Arg Phe Cys Gln
130 135 140
Ala Phe Met Leu Glu Leu Trp Arg His Leu Gly Pro Asp Met Asp Val
145 150 155 160
Pro Ala Gly Asp Ile Gly Val Gly Gly Arg Glu Val Gly Tyr Met Phe
165 170 175
Gly Met Tyr Lys Lys Leu Thr Arg Glu Phe Thr Gly Thr Phe Thr Gly
180 185 190
Lys Gly Leu Glu Phe Gly Gly Ser Leu Ile Arg Pro Glu Ala Thr Gly
195 200 205
Phe Gly Gly Leu Tyr Phe Val Asn Gln Met Leu Gln Thr Lys Gly Ile
210 215 220
Asp Ile Lys Gly Lys Thr Val Ala Ile Ser Gly Phe Gly Asn Val Ala
225 230 235 240
Trp Gly Ala Ala Thr Lys Ala Thr Glu Leu Gly Ala Lys Val Val Thr
245 250 255
Ile Ser Gly Pro Asp Gly Tyr Ile Tyr Asp Pro Asn Gly Ile Ser Gly
260 265 270
Glu Lys Ile Asp Tyr Met Leu Glu Leu Arg Ala Ser Gly Asn Asp Ile
275 280 285
Val Ala Pro Tyr Ala Asp Glu Phe Pro Gly Ser Thr Phe Val Ala Gly
290 295 300
Lys Arg Pro Trp Glu Val Lys Ala Asp Ile Ala Leu Pro Cys Ala Thr
305 310 315 320
Gln Asn Glu Leu Asn Gly Glu Asp Ala Lys Asn Leu Ile Asp Asn Asn
325 330 335
Val Leu Cys Val Gly Glu Ile Ser Asn Met Gly Cys Thr Pro Glu Ala
340 345 350
Ile Asp Leu Phe Ile Glu His Lys Thr Met Tyr Ala Pro Gly Lys Ala
355 360 365
Val Asn Ala Gly Gly Val Ala Thr Ser Gly Leu Glu Met Ser Gln Asn
370 375 380
Ala Met His Leu Ser Trp Ser Ala Ala Glu Val Asp Glu Lys Leu His
385 390 395 400
Ser Ile Met His Gly Ile His Ala Gln Cys Val Lys Tyr Gly Thr Glu
405 410 415
Pro Asp Gly Tyr Ile Asn Tyr Val Lys Gly Ala Asn Ile Ala Gly Phe
420 425 430
Met Lys Val Ala His Ala Met Met Gly Gln Gly Ile Ile
435 440 445
<210> 47
<211> 1266
<212> DNA
<213> 不解糖嗜胨菌
<400> 47
atgacagata cacttaatcc gttagtagcg gcacaagaaa aagtaagaat agcatgcgaa 60
aaattaggat gcgatccagc agtatatgaa ctattaaaag aaccacaaag agtaattgaa 120
atctcaattc cagtaaaaat ggatgatggt acagttaaag tgttcaaagg atggagaagt 180
gctcactcaa gcgctgtagg tccatcaaaa ggtggagtta gattccatcc aaatgtaaac 240
atggatgaag ttaaagctct ttctctatgg atgacattca aaggtggagc actaggctta 300
ccatacggcg gaggaaaagg tggaatctgc gtagatccag cagaactatc agaaagagaa 360
ttagaacaat tatcaagagg atgggtaaga ggtctttata aatatcttgg agacagaatc 420
gatatcccag caccagacgt aaacactaac ggacaaatca tgagctggtt cgttgatgaa 480
tatgtaaaat taaacggcga aagaatggac atcggaactt tcacaggaaa gccagtagca 540
tttggcggaa gtgaaggaag aaacgaagca actggattcg gagtagctgt agtagttaga 600
gaatctgcta agagattcgg aatcaaaatg gaagatgcta aaatagctgt tcaaggtttc 660
ggaaacgtag gtactttcac tgttaagaac attgaaagac aaggcggaaa agtttgtgct 720
atcgctgaat gggatagaaa cgaaggaaac tatgctctat acaatgaaaa tggaatcgac 780
ttcaaagaat tattagctta caaagaagct aacaaaactc ttatcggatt cccaggagca 840
gaaagaatta ctgatgaaga attctggaca aaagaatatg atatcatagt accagcagca 900
ttagaaaatg taatcacagg cgaaagagct aaaacaataa acgctaaatt agtttgtgaa 960
gcagctaatg gtcctacaac tccagaagga gacaaagtat taactgaaag aggaatcaac 1020
ttaacaccag atatcttaac taactcaggt ggagttctag tatcttacta tgaatgggta 1080
caaaatcaat atggatacta ctggacagaa gcagaagtag aagaaaaaca agaagcagac 1140
atgatgaaag ctatcaaagg cgtattcgca gttgctgatg aatacaatgt aactctaaga 1200
gaagctgttt acatgtatgc aatcaaatca atagatgtag ctatgaaatt aagaggatgg 1260
tattag 1266
<210> 48
<211> 421
<212> PRT
<213> 不解糖嗜胨菌
<400> 48
Met Thr Asp Thr Leu Asn Pro Leu Val Ala Ala Gln Glu Lys Val Arg
1 5 10 15
Ile Ala Cys Glu Lys Leu Gly Cys Asp Pro Ala Val Tyr Glu Leu Leu
20 25 30
Lys Glu Pro Gln Arg Val Ile Glu Ile Ser Ile Pro Val Lys Met Asp
35 40 45
Asp Gly Thr Val Lys Val Phe Lys Gly Trp Arg Ser Ala His Ser Ser
50 55 60
Ala Val Gly Pro Ser Lys Gly Gly Val Arg Phe His Pro Asn Val Asn
65 70 75 80
Met Asp Glu Val Lys Ala Leu Ser Leu Trp Met Thr Phe Lys Gly Gly
85 90 95
Ala Leu Gly Leu Pro Tyr Gly Gly Gly Lys Gly Gly Ile Cys Val Asp
100 105 110
Pro Ala Glu Leu Ser Glu Arg Glu Leu Glu Gln Leu Ser Arg Gly Trp
115 120 125
Val Arg Gly Leu Tyr Lys Tyr Leu Gly Asp Arg Ile Asp Ile Pro Ala
130 135 140
Pro Asp Val Asn Thr Asn Gly Gln Ile Met Ser Trp Phe Val Asp Glu
145 150 155 160
Tyr Val Lys Leu Asn Gly Glu Arg Met Asp Ile Gly Thr Phe Thr Gly
165 170 175
Lys Pro Val Ala Phe Gly Gly Ser Glu Gly Arg Asn Glu Ala Thr Gly
180 185 190
Phe Gly Val Ala Val Val Val Arg Glu Ser Ala Lys Arg Phe Gly Ile
195 200 205
Lys Met Glu Asp Ala Lys Ile Ala Val Gln Gly Phe Gly Asn Val Gly
210 215 220
Thr Phe Thr Val Lys Asn Ile Glu Arg Gln Gly Gly Lys Val Cys Ala
225 230 235 240
Ile Ala Glu Trp Asp Arg Asn Glu Gly Asn Tyr Ala Leu Tyr Asn Glu
245 250 255
Asn Gly Ile Asp Phe Lys Glu Leu Leu Ala Tyr Lys Glu Ala Asn Lys
260 265 270
Thr Leu Ile Gly Phe Pro Gly Ala Glu Arg Ile Thr Asp Glu Glu Phe
275 280 285
Trp Thr Lys Glu Tyr Asp Ile Ile Val Pro Ala Ala Leu Glu Asn Val
290 295 300
Ile Thr Gly Glu Arg Ala Lys Thr Ile Asn Ala Lys Leu Val Cys Glu
305 310 315 320
Ala Ala Asn Gly Pro Thr Thr Pro Glu Gly Asp Lys Val Leu Thr Glu
325 330 335
Arg Gly Ile Asn Leu Thr Pro Asp Ile Leu Thr Asn Ser Gly Gly Val
340 345 350
Leu Val Ser Tyr Tyr Glu Trp Val Gln Asn Gln Tyr Gly Tyr Tyr Trp
355 360 365
Thr Glu Ala Glu Val Glu Glu Lys Gln Glu Ala Asp Met Met Lys Ala
370 375 380
Ile Lys Gly Val Phe Ala Val Ala Asp Glu Tyr Asn Val Thr Leu Arg
385 390 395 400
Glu Ala Val Tyr Met Tyr Ala Ile Lys Ser Ile Asp Val Ala Met Lys
405 410 415
Leu Arg Gly Trp Tyr
420
<210> 49
<211> 1977
<212> DNA
<213> 大肠杆菌
<400> 49
atgtctgacg acatgtctat gggtttgcct tcgtcagcgg gcgaacacgg tgtactacgc 60
tccatgcagg aggttgcaat gagctcccag gaagccagca agatgctgcg tacttacaat 120
attgcctggt ggggcaataa ctactatgac gttaacgagc tgggccacat tagcgtgtgc 180
ccggacccgg acgtcccgga agctcgcgtc gatctcgcgc agttagtgaa aactcgtgaa 240
gcacagggcc agcgtctgcc tgcactgttc tgtttcccac agatcctgca gcaccgtttg 300
cgttccatta acgccgcgtt caaacgtgcg agggaatcct acggctataa cggcgattac 360
ttccttgttt atccgatcaa agttaaccag caccgccgcg tgattgagtc cctgattcat 420
tcgggcgaac cgctgggtct ggaagccggt tccaaagccg agttgatggc agtactggca 480
catgctggca tgacccgtag cgtcatcgtc tgcaacggtt ataaagaccg cgaatatatc 540
cgcctggcat taattggcga gaagatgggg cacaaggtct atctggtcat tgagaagatg 600
tcagaaatcg ccattgtgct ggatgaagca gaacgtctga atgtcgttcc tcgtctgggc 660
gtgcgtgcac gtctggcttc gcagggttcg ggtaaatggc agtcctccgg cggggaaaaa 720
tcgaagttcg gcctggctgc gactcaggta ctgcaactgg ttgaaaccct gcgtgaagcc 780
gggcgtctcg acagcctgca actactgcac ttccacctcg gttcgcagat ggcgaatatt 840
cgcgatatcg cgacaggcgt tcgtgaatcc gcgcgtttct atgtggaact gcacaagctg 900
ggcgtcaata ttcagtgctt cgacgtcggc ggcggtctgg gcgtggatta tgaaggtact 960
cgttcgcagt ccgactgttc ggtgaactac ggcctcaatg aatacgccaa caacattatc 1020
tgggcgattg gcgatgcgtg tgaagaaaac ggtctgccgc atccgacggt aatcaccgaa 1080
tcgggtcgtg cggtgactgc gcatcacacc gtgctggtgt ctaatatcat cggcgtggaa 1140
cgtaacgaat acacggtgcc gaccgcgcct gcagaagatg cgccgcgcgc gctgcaaagc 1200
atgtgggaaa cctggcagga gatgcacgaa ccgggaactc gccgttctct gcgtgaatgg 1260
ttacacgaca gtcagatgga tctgcacgac attcatatcg gctactcttc cggcatcttt 1320
agcctgcaag aacgtgcatg ggctgagcag ctttatttga gcatgtgcca tgaagtgcaa 1380
aagcagctgg atccgcaaaa ccgtgctcat cgtccgatta tcgacgagct gcaggaacgt 1440
atggcggaca aaatgtacgt caacttctcg ctgttccagt cgatgccgga cgcatggggg 1500
atcgaccagt tgttcccggt tctgccgctg gaagggctgg atcaagtgcc ggaacgtcgc 1560
gctgtgctgc tggatattac ctgtgactct gacggtgcta tcgaccacta tattgatggt 1620
gacggtattg ccacgacaat gccaatgccg gagtacgatc cagagaatcc gccgatgctc 1680
ggtttcttta tggtcggcgc atatcaggag atcctcggca acatgcacaa cctgttcggt 1740
gataccgaag cggttgacgt gttcgtcttc cctgacggta gcgtagaagt agaactgtct 1800
gacgaaggcg ataccgtggc ggacatgctg caatatgtac agctcgatcc gaaaacgctg 1860
ttaacccagt tccgcgatca agtgaagaaa accgatcttg atgctgaact gcaacaacag 1920
ttccttgaag agttcgaggc aggtttgtac ggttatactt atcttgaaga tgagtaa 1977
<210> 50
<211> 658
<212> PRT
<213> 大肠杆菌
<400> 50
Met Ser Asp Asp Met Ser Met Gly Leu Pro Ser Ser Ala Gly Glu His
1 5 10 15
Gly Val Leu Arg Ser Met Gln Glu Val Ala Met Ser Ser Gln Glu Ala
20 25 30
Ser Lys Met Leu Arg Thr Tyr Asn Ile Ala Trp Trp Gly Asn Asn Tyr
35 40 45
Tyr Asp Val Asn Glu Leu Gly His Ile Ser Val Cys Pro Asp Pro Asp
50 55 60
Val Pro Glu Ala Arg Val Asp Leu Ala Gln Leu Val Lys Thr Arg Glu
65 70 75 80
Ala Gln Gly Gln Arg Leu Pro Ala Leu Phe Cys Phe Pro Gln Ile Leu
85 90 95
Gln His Arg Leu Arg Ser Ile Asn Ala Ala Phe Lys Arg Ala Arg Glu
100 105 110
Ser Tyr Gly Tyr Asn Gly Asp Tyr Phe Leu Val Tyr Pro Ile Lys Val
115 120 125
Asn Gln His Arg Arg Val Ile Glu Ser Leu Ile His Ser Gly Glu Pro
130 135 140
Leu Gly Leu Glu Ala Gly Ser Lys Ala Glu Leu Met Ala Val Leu Ala
145 150 155 160
His Ala Gly Met Thr Arg Ser Val Ile Val Cys Asn Gly Tyr Lys Asp
165 170 175
Arg Glu Tyr Ile Arg Leu Ala Leu Ile Gly Glu Lys Met Gly His Lys
180 185 190
Val Tyr Leu Val Ile Glu Lys Met Ser Glu Ile Ala Ile Val Leu Asp
195 200 205
Glu Ala Glu Arg Leu Asn Val Val Pro Arg Leu Gly Val Arg Ala Arg
210 215 220
Leu Ala Ser Gln Gly Ser Gly Lys Trp Gln Ser Ser Gly Gly Glu Lys
225 230 235 240
Ser Lys Phe Gly Leu Ala Ala Thr Gln Val Leu Gln Leu Val Glu Thr
245 250 255
Leu Arg Glu Ala Gly Arg Leu Asp Ser Leu Gln Leu Leu His Phe His
260 265 270
Leu Gly Ser Gln Met Ala Asn Ile Arg Asp Ile Ala Thr Gly Val Arg
275 280 285
Glu Ser Ala Arg Phe Tyr Val Glu Leu His Lys Leu Gly Val Asn Ile
290 295 300
Gln Cys Phe Asp Val Gly Gly Gly Leu Gly Val Asp Tyr Glu Gly Thr
305 310 315 320
Arg Ser Gln Ser Asp Cys Ser Val Asn Tyr Gly Leu Asn Glu Tyr Ala
325 330 335
Asn Asn Ile Ile Trp Ala Ile Gly Asp Ala Cys Glu Glu Asn Gly Leu
340 345 350
Pro His Pro Thr Val Ile Thr Glu Ser Gly Arg Ala Val Thr Ala His
355 360 365
His Thr Val Leu Val Ser Asn Ile Ile Gly Val Glu Arg Asn Glu Tyr
370 375 380
Thr Val Pro Thr Ala Pro Ala Glu Asp Ala Pro Arg Ala Leu Gln Ser
385 390 395 400
Met Trp Glu Thr Trp Gln Glu Met His Glu Pro Gly Thr Arg Arg Ser
405 410 415
Leu Arg Glu Trp Leu His Asp Ser Gln Met Asp Leu His Asp Ile His
420 425 430
Ile Gly Tyr Ser Ser Gly Ile Phe Ser Leu Gln Glu Arg Ala Trp Ala
435 440 445
Glu Gln Leu Tyr Leu Ser Met Cys His Glu Val Gln Lys Gln Leu Asp
450 455 460
Pro Gln Asn Arg Ala His Arg Pro Ile Ile Asp Glu Leu Gln Glu Arg
465 470 475 480
Met Ala Asp Lys Met Tyr Val Asn Phe Ser Leu Phe Gln Ser Met Pro
485 490 495
Asp Ala Trp Gly Ile Asp Gln Leu Phe Pro Val Leu Pro Leu Glu Gly
500 505 510
Leu Asp Gln Val Pro Glu Arg Arg Ala Val Leu Leu Asp Ile Thr Cys
515 520 525
Asp Ser Asp Gly Ala Ile Asp His Tyr Ile Asp Gly Asp Gly Ile Ala
530 535 540
Thr Thr Met Pro Met Pro Glu Tyr Asp Pro Glu Asn Pro Pro Met Leu
545 550 555 560
Gly Phe Phe Met Val Gly Ala Tyr Gln Glu Ile Leu Gly Asn Met His
565 570 575
Asn Leu Phe Gly Asp Thr Glu Ala Val Asp Val Phe Val Phe Pro Asp
580 585 590
Gly Ser Val Glu Val Glu Leu Ser Asp Glu Gly Asp Thr Val Ala Asp
595 600 605
Met Leu Gln Tyr Val Gln Leu Asp Pro Lys Thr Leu Leu Thr Gln Phe
610 615 620
Arg Asp Gln Val Lys Lys Thr Asp Leu Asp Ala Glu Leu Gln Gln Gln
625 630 635 640
Phe Leu Glu Glu Phe Glu Ala Gly Leu Tyr Gly Tyr Thr Tyr Leu Glu
645 650 655
Asp Glu
<210> 51
<211> 921
<212> DNA
<213> 大肠杆菌
<400> 51
atgagcacct taggtcatca atacgataac tcactggttt ccaatgcctt tggtttttta 60
cgcctgccga tgaacttcca gccgtatgac agcgatgcag actgggtgat tactggcgtg 120
ccgttcgata tggccacttc tggtcgtgcg ggtggtcgcc acggtccggc agcgatccgt 180
caggtttcga cgaatctggc ctgggaacac aaccgcttcc cgtggaattt cgacatgcgt 240
gagcgtctga acgtcgtgga ctgcggcgat ctggtatatg cctttggcga tgcccgtgag 300
atgagcgaaa agctgcaggc gcacgccgag aagctgctgg ctgccggtaa gcgtatgctc 360
tctttcggtg gtgaccactt tgttacgctg ccgctgctgc gtgctcatgc gaagcatttc 420
ggcaaaatgg cgctggtaca ctttgacgcc cacaccgata cctatgcgaa cggttgtgaa 480
tttgaccacg gcactatgtt ctataccgcg ccgaaagaag gtctgatcga cccgaatcat 540
tccgtgcaga ttggtattcg taccgagttt gataaagaca acggctttac cgtgctggac 600
gcctgccagg tgaacgatcg cagcgtggat gacgttatcg cccaagtgaa acagattgtg 660
ggtgatatgc cggtttacct gacttttgat atcgactgcc tggatcctgc ttttgcacca 720
ggcaccggta cgccagtgat tggcggcctg acctccgatc gcgctattaa actggtacgc 780
ggcctgaaag atctcaacat tgttgggatg gacgtagtgg aagtggctcc ggcatacgat 840
cagtcggaaa tcactgctct ggcagcggca acgctggcgc tggaaatgct gtatattcag 900
gcggcgaaaa agggcgagta a 921
<210> 52
<211> 306
<212> PRT
<213> 大肠杆菌
<400> 52
Met Ser Thr Leu Gly His Gln Tyr Asp Asn Ser Leu Val Ser Asn Ala
1 5 10 15
Phe Gly Phe Leu Arg Leu Pro Met Asn Phe Gln Pro Tyr Asp Ser Asp
20 25 30
Ala Asp Trp Val Ile Thr Gly Val Pro Phe Asp Met Ala Thr Ser Gly
35 40 45
Arg Ala Gly Gly Arg His Gly Pro Ala Ala Ile Arg Gln Val Ser Thr
50 55 60
Asn Leu Ala Trp Glu His Asn Arg Phe Pro Trp Asn Phe Asp Met Arg
65 70 75 80
Glu Arg Leu Asn Val Val Asp Cys Gly Asp Leu Val Tyr Ala Phe Gly
85 90 95
Asp Ala Arg Glu Met Ser Glu Lys Leu Gln Ala His Ala Glu Lys Leu
100 105 110
Leu Ala Ala Gly Lys Arg Met Leu Ser Phe Gly Gly Asp His Phe Val
115 120 125
Thr Leu Pro Leu Leu Arg Ala His Ala Lys His Phe Gly Lys Met Ala
130 135 140
Leu Val His Phe Asp Ala His Thr Asp Thr Tyr Ala Asn Gly Cys Glu
145 150 155 160
Phe Asp His Gly Thr Met Phe Tyr Thr Ala Pro Lys Glu Gly Leu Ile
165 170 175
Asp Pro Asn His Ser Val Gln Ile Gly Ile Arg Thr Glu Phe Asp Lys
180 185 190
Asp Asn Gly Phe Thr Val Leu Asp Ala Cys Gln Val Asn Asp Arg Ser
195 200 205
Val Asp Asp Val Ile Ala Gln Val Lys Gln Ile Val Gly Asp Met Pro
210 215 220
Val Tyr Leu Thr Phe Asp Ile Asp Cys Leu Asp Pro Ala Phe Ala Pro
225 230 235 240
Gly Thr Gly Thr Pro Val Ile Gly Gly Leu Thr Ser Asp Arg Ala Ile
245 250 255
Lys Leu Val Arg Gly Leu Lys Asp Leu Asn Ile Val Gly Met Asp Val
260 265 270
Val Glu Val Ala Pro Ala Tyr Asp Gln Ser Glu Ile Thr Ala Leu Ala
275 280 285
Ala Ala Thr Leu Ala Leu Glu Met Leu Tyr Ile Gln Ala Ala Lys Lys
290 295 300
Gly Glu
305
<210> 53
<211> 1287
<212> DNA
<213> 互养棍状菌属PtaB Bin027
<400> 53
atggaaaaaa gcagctataa cccgtttacc aatgcacagg cacagtttga taaagtggca 60
agctttattg gtctggatga agcaacctgt gatctgctgc gtcagccgct gaaagaacat 120
catgtgctga ttccggtttg tatggatgat ggcaaaatga aaatcttcaa aggttttcgc 180
gtgctgcata atgatgcacg tggtccggca aaaggtggta ttcgttttca tccgcaagaa 240
accgcagata ccgttcgtgc actggcaatg tggatgacct ggaaatgtgc agttgttgat 300
attccgttag gtggtggtaa aggtggtgtt atttgtgatc cgcataatct gagcgaacgt 360
gaacaagaac gtctgtgtcg tggttgggtt cgtcagctga gcaaagaaat gggtccgtat 420
attgatgcac cggcaccgga tgttatgacc accgcaaaac atatgctgtg gatgctggat 480
gaatttgaaa ccattcatgg tggtcgttat ccgggtttta ttaccggcaa accggttggt 540
atgggtggta gcaccggtcg taccgaagcc accggttttg gtgcaattta tgttctgcgt 600
gaagcactga aagacctgca gattaaactg gaagaaacca gcctgagcgt tcaaggtttt 660
ggtaatgttg cacagtatgc agccaaaatg tttaccgaat taggtggcaa agttgttgca 720
gttgcatgtt gggataatga ggataaagtg agctatacct accagaaaaa agaaggcctg 780
agcatgaata tgctgctgga aattaccgat agcttcggct gcattaataa gaaaaaagcc 840
gcagcagcag gctgtaaaat tctgcctggt gaagaatgga ttgaacagga tgtggatatt 900
ctgatgcctg cagcactgga aaatcagatt accgcaaaaa acgtcaacaa gatcagcaaa 960
caggttaagg ttctgctgga aggtgcaaat ggtccgacca ccaccgatgc agatgatatt 1020
atcaaagaac gcggtatttt tctgctgccg gattttctgg caaatgccgg tggtgtgacc 1080
tgtagctatt ttgaacaggt tcagagcaac ctgaactact attgggaaaa agaagaggtg 1140
ctggaaaaac tggataccaa aatgaccagc gcatatcgtg cagtttatga cctggcaaaa 1200
aagaaaaacc tgtatatgcg tgatgcagcc tatgtgattg caattaatcg tgttgcccag 1260
gcagttaaaa tgcgtggctg ggcatag 1287
<210> 54
<211> 428
<212> PRT
<213> 互养棍状菌属PtaB Bin027
<400> 54
Met Glu Lys Ser Ser Tyr Asn Pro Phe Thr Asn Ala Gln Ala Gln Phe
1 5 10 15
Asp Lys Val Ala Ser Phe Ile Gly Leu Asp Glu Ala Thr Cys Asp Leu
20 25 30
Leu Arg Gln Pro Leu Lys Glu His His Val Leu Ile Pro Val Cys Met
35 40 45
Asp Asp Gly Lys Met Lys Ile Phe Lys Gly Phe Arg Val Leu His Asn
50 55 60
Asp Ala Arg Gly Pro Ala Lys Gly Gly Ile Arg Phe His Pro Gln Glu
65 70 75 80
Thr Ala Asp Thr Val Arg Ala Leu Ala Met Trp Met Thr Trp Lys Cys
85 90 95
Ala Val Val Asp Ile Pro Leu Gly Gly Gly Lys Gly Gly Val Ile Cys
100 105 110
Asp Pro His Asn Leu Ser Glu Arg Glu Gln Glu Arg Leu Cys Arg Gly
115 120 125
Trp Val Arg Gln Leu Ser Lys Glu Met Gly Pro Tyr Ile Asp Ala Pro
130 135 140
Ala Pro Asp Val Met Thr Thr Ala Lys His Met Leu Trp Met Leu Asp
145 150 155 160
Glu Phe Glu Thr Ile His Gly Gly Arg Tyr Pro Gly Phe Ile Thr Gly
165 170 175
Lys Pro Val Gly Met Gly Gly Ser Thr Gly Arg Thr Glu Ala Thr Gly
180 185 190
Phe Gly Ala Ile Tyr Val Leu Arg Glu Ala Leu Lys Asp Leu Gln Ile
195 200 205
Lys Leu Glu Glu Thr Ser Leu Ser Val Gln Gly Phe Gly Asn Val Ala
210 215 220
Gln Tyr Ala Ala Lys Met Phe Thr Glu Leu Gly Gly Lys Val Val Ala
225 230 235 240
Val Ala Cys Trp Asp Asn Glu Asp Lys Val Ser Tyr Thr Tyr Gln Lys
245 250 255
Lys Glu Gly Leu Ser Met Asn Met Leu Leu Glu Ile Thr Asp Ser Phe
260 265 270
Gly Cys Ile Asn Lys Lys Lys Ala Ala Ala Ala Gly Cys Lys Ile Leu
275 280 285
Pro Gly Glu Glu Trp Ile Glu Gln Asp Val Asp Ile Leu Met Pro Ala
290 295 300
Ala Leu Glu Asn Gln Ile Thr Ala Lys Asn Val Asn Lys Ile Ser Lys
305 310 315 320
Gln Val Lys Val Leu Leu Glu Gly Ala Asn Gly Pro Thr Thr Thr Asp
325 330 335
Ala Asp Asp Ile Ile Lys Glu Arg Gly Ile Phe Leu Leu Pro Asp Phe
340 345 350
Leu Ala Asn Ala Gly Gly Val Thr Cys Ser Tyr Phe Glu Gln Val Gln
355 360 365
Ser Asn Leu Asn Tyr Tyr Trp Glu Lys Glu Glu Val Leu Glu Lys Leu
370 375 380
Asp Thr Lys Met Thr Ser Ala Tyr Arg Ala Val Tyr Asp Leu Ala Lys
385 390 395 400
Lys Lys Asn Leu Tyr Met Arg Asp Ala Ala Tyr Val Ile Ala Ile Asn
405 410 415
Arg Val Ala Gln Ala Val Lys Met Arg Gly Trp Ala
420 425
<210> 55
<211> 1338
<212> DNA
<213> 厌氧绳菌纲细菌
<400> 55
atgccggttt atcatttcag cgaaaccttt tatcgcgaag agatgattgt tatggccgag 60
cagattaatg catttcagat ggcacaggca cagtttgatg gtgttgcaaa actgctgcgt 120
ctggatccgg caattgcaga aattctgcgt tggccgatgc gtgaatttgc atttcgtatt 180
ccggttcgta tggatgatgg tagcattcgt gtttttcagg gttttcgtgt tcagcataat 240
gatgcacgtg gtccgaataa aggtggtatt cgttttcatc cgagcgaaac cctggatacc 300
gttcgtgcac tggcaacctg gatgacctgg aaatgtgcag ttgcagatat tccgttaggt 360
ggtggtaaag gtggcgttgt tgttgatcct gcaacactga gcaccggtga aaaagaacgt 420
ctgtgtcgtg gttgggttca agcaatgtgg cgtaatctgg gtccgcgtat tgatgttccg 480
gcaccggatg ttggcaccac accgcagatg atgggttgga tgatggatga atatagcaaa 540
ctggttggtc agtatacacc gggtgttttt accggcaaac cgcttggtgg tggtggcagc 600
gaaggtcgta ccgaagcaac cggttatggt gtgatttatt gtgttcgtga agccatgaaa 660
cacctgaaaa tggatccgac caaatgtgtt gcagcaattc aaggttttgg taatgttgca 720
cagtatgcag ccattggctt tgtggaaatt cttggtggca aagttgcatg tgttagctgt 780
tgggatcgta aagataaaac cagctatacc tatagccaca aggatggtat taatccgcgt 840
tttctgctga gcattaccga tcagtatggc accattgata aagacaaagc agttgccgca 900
ggttataccg ttgaagatgg tggtgcatgg attagcaaag aagccgacgt tctgattccg 960
gcagcactgg aaggtcaggt taatgcagaa accgtgaaaa aaatgagcag ccgtgttcgt 1020
attgttgccg aaggtgcaaa tggtccgtgt acaccggaag cagatgaatt tttcaaacag 1080
aacaacatct ttaacatccc ggactttctg tgtaatgccg gtggtgttac caccagttat 1140
tttgaaagcg ttcagaacga catgaacttt tactggacca aagaagaagt gctgcagaaa 1200
ctggatacca aactgaccca ggcatttcat gcagttctgg aaatgagcga aaaagaaaaa 1260
gtgtatatgc gtgatgcagc ctatatggtt gcaattgatc gtgttgttaa agcaatgcag 1320
ctgcgtggct gggtttag 1338
<210> 56
<211> 445
<212> PRT
<213> 厌氧绳菌纲细菌
<400> 56
Met Pro Val Tyr His Phe Ser Glu Thr Phe Tyr Arg Glu Glu Met Ile
1 5 10 15
Val Met Ala Glu Gln Ile Asn Ala Phe Gln Met Ala Gln Ala Gln Phe
20 25 30
Asp Gly Val Ala Lys Leu Leu Arg Leu Asp Pro Ala Ile Ala Glu Ile
35 40 45
Leu Arg Trp Pro Met Arg Glu Phe Ala Phe Arg Ile Pro Val Arg Met
50 55 60
Asp Asp Gly Ser Ile Arg Val Phe Gln Gly Phe Arg Val Gln His Asn
65 70 75 80
Asp Ala Arg Gly Pro Asn Lys Gly Gly Ile Arg Phe His Pro Ser Glu
85 90 95
Thr Leu Asp Thr Val Arg Ala Leu Ala Thr Trp Met Thr Trp Lys Cys
100 105 110
Ala Val Ala Asp Ile Pro Leu Gly Gly Gly Lys Gly Gly Val Val Val
115 120 125
Asp Pro Ala Thr Leu Ser Thr Gly Glu Lys Glu Arg Leu Cys Arg Gly
130 135 140
Trp Val Gln Ala Met Trp Arg Asn Leu Gly Pro Arg Ile Asp Val Pro
145 150 155 160
Ala Pro Asp Val Gly Thr Thr Pro Gln Met Met Gly Trp Met Met Asp
165 170 175
Glu Tyr Ser Lys Leu Val Gly Gln Tyr Thr Pro Gly Val Phe Thr Gly
180 185 190
Lys Pro Leu Gly Gly Gly Gly Ser Glu Gly Arg Thr Glu Ala Thr Gly
195 200 205
Tyr Gly Val Ile Tyr Cys Val Arg Glu Ala Met Lys His Leu Lys Met
210 215 220
Asp Pro Thr Lys Cys Val Ala Ala Ile Gln Gly Phe Gly Asn Val Ala
225 230 235 240
Gln Tyr Ala Ala Ile Gly Phe Val Glu Ile Leu Gly Gly Lys Val Ala
245 250 255
Cys Val Ser Cys Trp Asp Arg Lys Asp Lys Thr Ser Tyr Thr Tyr Ser
260 265 270
His Lys Asp Gly Ile Asn Pro Arg Phe Leu Leu Ser Ile Thr Asp Gln
275 280 285
Tyr Gly Thr Ile Asp Lys Asp Lys Ala Val Ala Ala Gly Tyr Thr Val
290 295 300
Glu Asp Gly Gly Ala Trp Ile Ser Lys Glu Ala Asp Val Leu Ile Pro
305 310 315 320
Ala Ala Leu Glu Gly Gln Val Asn Ala Glu Thr Val Lys Lys Met Ser
325 330 335
Ser Arg Val Arg Ile Val Ala Glu Gly Ala Asn Gly Pro Cys Thr Pro
340 345 350
Glu Ala Asp Glu Phe Phe Lys Gln Asn Asn Ile Phe Asn Ile Pro Asp
355 360 365
Phe Leu Cys Asn Ala Gly Gly Val Thr Thr Ser Tyr Phe Glu Ser Val
370 375 380
Gln Asn Asp Met Asn Phe Tyr Trp Thr Lys Glu Glu Val Leu Gln Lys
385 390 395 400
Leu Asp Thr Lys Leu Thr Gln Ala Phe His Ala Val Leu Glu Met Ser
405 410 415
Glu Lys Glu Lys Val Tyr Met Arg Asp Ala Ala Tyr Met Val Ala Ile
420 425 430
Asp Arg Val Val Lys Ala Met Gln Leu Arg Gly Trp Val
435 440 445
<210> 57
<211> 909
<212> DNA
<213> 拉氏西地西菌
<400> 57
atgttctctg gtatgctgtt aatctttagc ccgctgatca ttggctacct gatccccatc 60
aaacaagtgc gctatctgaa cgcggtcaat accttgacta tgcgcctggt gatggtgatc 120
ctggtcttaa tgggcctgtc cctggcgggt ctggataacc ttggtcagca tatcagtacg 180
atcctgtatt tcgcggtcac cttctttatt tgcattggcg cgaccaacct gttagctctg 240
ccagtgctgg ataagctgtt tccgaccgaa actcacggtc accaacataa actgacctta 300
agcaccatga tgtccgaatc cggcaaatta atcgccgcgg tggccgtggg gttggtggtg 360
ggtctgctgc tgaaccacga cctctcgtgg gtggacacgg cctcggaagg catcctcctg 420
ctgctgttac tgctgatcgg gattcagctg cgcaacagcg gaatgaccct caagcaaatc 480
attctgaata aaagcggctt aatgattgct gcgctcgtgg tggctacaag cctgcctggg 540
ggtctgcttg cggcttggtg gctggacatt ccctaccatc atggattagc tatggcatcg 600
ggttttggtt ggtattcact tgccgggatt ctgatgggcg acggtcttgg acccgtttat 660
ggtggggcct cgtttatctt ggagctggcc cgtgagctga tggccattat gattatccct 720
attttaattc gtcgttatcc tctcaccgcg attggctatg gcggggcgac cgccatggat 780
tttacgctgc ccattattca gagcaccggc ggcatccgct gcgtacccat tgcaattgtt 840
agcggcttta ttctctccct cctggttcct gtcttgatgt tatttttctt aagcctgggt 900
accaattag 909
<210> 58
<211> 299
<212> PRT
<213> 拉氏西地西菌
<400> 58
Met Leu Ser Gly Leu Leu Ile Ile Leu Val Pro Leu Ile Ala Gly Tyr
1 5 10 15
Leu Ile Pro Leu Lys Gln Pro Pro Leu Leu Arg Leu Ile Asn Arg Leu
20 25 30
Leu Ser Trp Ile Val Tyr Val Ile Leu Phe Leu Met Gly Ile Ser Leu
35 40 45
Ala Phe Leu Asp Asn Leu Ala Ser Asn Leu Leu Thr Ile Leu His Tyr
50 55 60
Ser Val Ile Ser Val Val Val Ile Leu Leu Cys Asn Val Ala Gly Leu
65 70 75 80
Leu Leu Leu Glu Arg Ser Leu Pro Trp Arg His Gln His Arg Gln Glu
85 90 95
Lys Leu Pro Ser Arg Leu Ala Met Ala Leu Glu Ser Leu Gln Leu Cys
100 105 110
Gly Val Val Ala Leu Gly Phe Leu Leu Gly Leu Thr Gly Phe Glu Val
115 120 125
Leu Lys Tyr Ala Thr Glu Ala Ser Glu Tyr Thr Leu Ile Phe Leu Leu
130 135 140
Leu Leu Val Gly Ile Gln Leu Arg Asn Ser Gly Met Thr Phe Arg Gln
145 150 155 160
Ile Val Leu Asn Arg Arg Gly Met Ile Val Ala Ile Val Val Val Val
165 170 175
Ser Ser Leu Ile Ala Gly Val Ile Asn Ala Phe Leu Leu Gly Leu Pro
180 185 190
Ile Lys Thr Gly Met Ala Met Ala Ser Gly Phe Gly Trp Tyr Ser Leu
195 200 205
Ser Gly Ile Leu Met Thr Glu Ser Tyr Gly Pro Val Ile Gly Ser Ala
210 215 220
Thr Phe Phe Asn Asp Leu Val Arg Glu Leu Leu Ala Ile Met Leu Ile
225 230 235 240
Pro Ala Leu Val Arg Arg Ser Arg Ser Thr Ala Leu Gly Leu Cys Gly
245 250 255
Ala Thr Ser Met Asp Phe Thr Leu Pro Val Leu Gln Arg Ser Gly Gly
260 265 270
Val Glu Ile Val Pro Ala Ala Ile Val His Gly Phe Ile Leu Ser Leu
275 280 285
Leu Thr Pro Leu Leu Ile Ala Phe Phe Ala Ser
290 295
<210> 59
<211> 900
<212> DNA
<213> 格氏勒米诺氏菌ATCC33999 DSM 5078
<400> 59
atgttcagtg gcttattaat catcttagtc cctctgattg ttggttatct gatcccgtta 60
cgtcagcagg cagctctgaa agtcatcaat caactgctgt cctggatggt gtatttgatc 120
ttatttttca tggggatttc cttagctttt ctcgataacc tggctagcaa tcttctcgca 180
attctccatt attcggcagt gtcaattacc gttatccttc tgtgtaatat tgctgctttg 240
atttggctcg aacgtgggct cccgtggcgt aatcatcatc agcaagaaaa attgcccagt 300
cgtatcgcga tggcgctgga atcgctgaaa ttgtgtggtg tagtcgtgat cggttttgcg 360
attggtctga gcggtttagc gtttttgcag catgccactg aggcgagcga atataccctg 420
attctgctgc tgttcctggt ggggattcag ctgcgtaata acggtatgac cctgaaacag 480
atcgtgctca atcgccgcgg tatgatcgtg gcggtagtgg tggttgcatc ctcactgatc 540
ggaggcctga tcaatgcatt tatccttgac ctcccaatca acaccgcact ggcgatggct 600
tcgggctttg gctggtacag tctgagcgga atcttactca cagaaagttt cggtccggtg 660
attggctctg ccgcattctt taatgatctg gcgcgcgagc tcatcgcaat catgctcatc 720
ccaggcctca tccgccgctc ccgtagcacg gccttggggc tgtgcggggc aacctcgatg 780
gattttacgt taccggtcct gcagcgtacc ggtggtctgg atatggttcc ggccgcgatt 840
gttcacggct ttattctcag tcttctggtg ccgattttaa ttgcattctt tagtgcgtag 900
<210> 60
<211> 300
<212> PRT
<213> 格氏勒米诺氏菌ATCC33999 DSM 5078
<400> 60
Met Tyr Ser Gly Leu Ala Ile Val Leu Leu Pro Leu Ile Ala Gly Tyr
1 5 10 15
Leu Ile Pro Leu Lys Ser Val Asp Ala Leu Arg Thr Ile His Arg Thr
20 25 30
Leu Gly Ala Met Val Tyr Ile Ile Leu Phe Phe Met Gly Ile Ser Leu
35 40 45
Ala Phe Leu Asp Asn Leu Ala Ala Asn Leu Gln Thr Ile Leu Leu Tyr
50 55 60
Ser Val Thr Phe Phe Ile Ala Ile Phe Gly Thr Asn Leu Ile Ala Leu
65 70 75 80
Leu Leu Leu Asp Lys Arg Trp Pro Trp Arg Leu Pro Arg Leu Lys Lys
85 90 95
Glu Ala Gly Ser Arg Leu His Met Ile Leu Glu Ser Leu Gln Leu Cys
100 105 110
Gly Val Val Ala Gly Gly Phe Leu Ile Gly Leu Thr His Tyr Pro Trp
115 120 125
Leu Lys His Ala Ser Thr Ala Ser Glu Val Ala Leu Val Ile Leu Leu
130 135 140
Leu Leu Ile Gly Ile Gln Leu Arg Asn Ser Gly Met Thr Ile Lys Glu
145 150 155 160
Ile Thr Leu Asn Lys Arg Gly Ala Ala Ile Ala Leu Thr Val Ala Leu
165 170 175
Ser Ala Ala Val Gly Gly Ser Leu Ala Ala Leu Leu Leu Gly Leu Pro
180 185 190
Ile Asn Val Gly Ile Ala Met Ser Ser Gly Tyr Gly Trp Tyr Ser Leu
195 200 205
Ser Gly Ile Leu Leu Thr Asp Ala Phe Gly Pro Val Leu Gly Ser Ala
210 215 220
Ala Phe Phe Asn Asp Leu Ala Arg Glu Leu Ala Ala Ile Leu Val Ile
225 230 235 240
Pro Ser Leu Ile Gln Arg Arg Gln Ser Ala Ala Leu Gly Val Cys Gly
245 250 255
Ala Thr Ser Met Asp Phe Thr Leu Pro Val Leu Gln Arg Ser Gly Gly
260 265 270
Val Glu Ile Val Pro Ala Ala Ile Val His Gly Phe Ile Leu Ser Leu
275 280 285
Leu Ala Pro Val Phe Met Ala Leu Phe Ser Ala Ala
290 295 300
<210> 61
<211> 903
<212> DNA
<213> 关岛特拉布斯菌ATCC 49490
<400> 61
atgtacagtg gattgctgat tattttattg ccgttggtgt taggttacct gattccggta 60
cgtaacaaaa cgttgctgca gggggtaaat cgcctcctca gttggatggt gtacgtcatt 120
cttttcctga tgggcatcag tttggcattc ttggagaatc tggggtcgaa cctgatggct 180
gtactgcaat acgccgctgt ttcgaccgtg tgcattattg cagctaactt gctggccctg 240
cgcttactgg aacgccgtaa cgcttggaaa gctaccacgg ttagtcacga tgcgcttccc 300
tctcgcctta agatgatgtt agaaagttta cagctgtgcg gcgtagtcct ggtgggcttt 360
cttcttggtc tgtcgcagtg gccgccgctg aaattcgctg catcaggcgg ggagtatgca 420
ctcttagtcc tgctgtgcct tgtcggcatt cagttgcgca actccgggat gacattgcgt 480
cagatcgtgc tgaatcgccg cggcaccatc atcgcagtgg tggttgcggt gtctgctttg 540
tgtggtggtg ctctggcatc attgctgctc gatttacctc tgaaaacagg cctggcgatg 600
gcaagcggtt atggttggta ttcgctgtca ggcattctga tgaccaacgc gtatggtcct 660
gtgattgggt ctgcagcgtt cttcaacgac ttagcacgtg aactcattgc aattaccctt 720
attccaagcc tgattcgttc acgtcgtgca tcggctctgg gactctgcgg cgccacttct 780
atggacttca ccttaccggt cttacaacgc tcaggtgggg tcgacatggt cccgccggca 840
atcgttcacg gcttcattct gagtttgctc agtcctgtgc tcattacgtt gtttgttgca 900
tag 903
<210> 62
<211> 299
<212> PRT
<213> 关岛特拉布斯菌ATCC 49490
<400> 62
Met Phe Ser Gly Leu Leu Ile Ile Leu Leu Pro Leu Ile Ala Gly Tyr
1 5 10 15
Leu Ile Pro Leu Arg His Ser Ala Thr Leu Lys Leu Ile Asn Arg Leu
20 25 30
Leu Ser Trp Ile Val Tyr Val Ile Leu Phe Phe Met Gly Ile Ser Leu
35 40 45
Ala Phe Leu Asp Asn Leu Thr Ser Asn Leu Leu Ala Ile Leu His Tyr
50 55 60
Ser Ala Val Ser Ile Val Ile Ile Leu Leu Cys Asn Ile Val Ala Leu
65 70 75 80
Leu Trp Leu Glu Arg Val Leu Pro Trp Arg His Gln His Gln Gln Glu
85 90 95
Lys Leu Pro Ser Arg Ile Ala Met Ala Leu Glu Ser Leu Lys Leu Cys
100 105 110
Gly Val Val Val Leu Gly Phe Leu Leu Gly Leu Thr Gly Leu Ala Phe
115 120 125
Leu Gln His Ala Thr Glu Ala Ser Glu Tyr Thr Leu Ile Phe Leu Leu
130 135 140
Phe Leu Val Gly Val Gln Leu Arg Asn Asn Gly Met Thr Leu Arg Gln
145 150 155 160
Ile Ile Leu Asn Arg Arg Gly Met Ile Val Ala Val Ile Val Val Ile
165 170 175
Ser Ser Leu Val Gly Gly Ala Met Asn Ala Phe Ile Leu Asp Leu Pro
180 185 190
Leu Lys Thr Ser Leu Ala Met Ala Ser Gly Tyr Gly Trp Tyr Ser Leu
195 200 205
Ser Gly Ile Leu Leu Thr Glu Ala Phe Gly Pro Val Ile Gly Ser Ala
210 215 220
Ala Phe Phe Asn Asp Leu Ala Arg Glu Leu Ile Ala Ile Met Leu Ile
225 230 235 240
Pro Gly Leu Val His Arg Ser Arg Ser Thr Ala Leu Gly Leu Ser Gly
245 250 255
Ala Thr Ser Met Asp Phe Thr Leu Pro Val Leu Gln Arg Ser Gly Gly
260 265 270
Ile Glu Ile Val Pro Ala Ala Ile Val His Gly Phe Ile Leu Ser Leu
275 280 285
Leu Val Pro Leu Leu Met Ala Phe Phe Ser Ala
290 295
<210> 63
<211> 900
<212> DNA
<213> 植生拉乌尔菌
<400> 63
atgttttctg gcctgttaat cattttggtg cctctgatcg tcggttattt gattccgttg 60
cgtcatcgcg ccgcgctcaa attaattaac cgtctgttgt catggatcgt atatcttatc 120
ttatttttca tgggcatcag tctggctttt ctggataact tagccagcaa cctgctggcg 180
attttacatt acagcgcagt gtctgttacg attatcttgc tctgcaatat tgctgcgctg 240
ttttggctgg agcgtagtct gccgtggcgt cacaaccata aacaggagaa actgccatcg 300
cgtatcgcga tggcgctgga atccttacag ctgtgcggcg tcgtggttgt aggcttcctg 360
ttggggctga ccggactgcc tattttgcaa catgcgaccg aagccagtga atataccctc 420
atttttctgc tgtttctggt aggcattcag ctgcgcaact cggggatgac cctgaagcaa 480
attgtgctga accgtcgcgg gatgatcgtt gcagttgttg ttgttgcaag tagtatgctg 540
gcgggtgtta tcaacgctct gttactgggc ttgccgctga agaccgcgct ggctatggcg 600
agcggcttcg ggtggtatag cctttctggt attctgctta ccgagtcatt tggcccggtt 660
attggaagcg cggcgttctt caacgactta gcacgcgagt taatcgccat tatgcttatc 720
ccaggcatgg ttggacgtag ccgctctact gcccttggac tgtgcggtgc gactagcatg 780
gactttacct taccggtcct gcagcgttcg ggaggacttg aaatggtacc tgctgcgatc 840
gtgcatggtt tcattttgag cttgttagtg ccgctgctta tggcgttttt ctccgcttag 900
<210> 64
<211> 299
<212> PRT
<213> 植生拉乌尔菌
<400> 64
Met Phe Ser Gly Leu Leu Ile Ile Leu Leu Pro Leu Val Ala Gly Tyr
1 5 10 15
Leu Ile Pro Leu Arg His Pro Ser Val Leu Lys Leu Ile Thr Arg Leu
20 25 30
Leu Ser Trp Ile Val Tyr Val Ile Leu Phe Phe Met Gly Ile Ser Leu
35 40 45
Ala Phe Leu Asp Asn Leu Ser Ser Asn Leu Leu Ser Ile Leu His Tyr
50 55 60
Ala Val Val Ser Val Val Val Ile Leu Leu Cys Asn Ile Ala Ala Leu
65 70 75 80
Met Trp Leu Glu Gln Lys Met Pro Trp Arg His Gln His Arg Gln Glu
85 90 95
Lys Leu Pro Ser Arg Val Ala Met Ala Met Glu Ser Leu Gln Leu Cys
100 105 110
Gly Val Val Leu Ile Gly Phe Leu Ile Gly Leu Ser Gly Leu Ser Phe
115 120 125
Leu Gln His Ala Thr Glu Ala Ser Glu Tyr Thr Leu Ile Phe Leu Leu
130 135 140
Phe Leu Ile Gly Ile Gln Leu Arg Asn Asn Gly Met Thr Leu Arg Gln
145 150 155 160
Ile Val Leu Asn Arg Arg Gly Met Ile Val Ala Val Val Val Thr Ala
165 170 175
Ser Ser Leu Ala Gly Gly Val Ile Asn Ala Phe Ile Leu Asp Leu Pro
180 185 190
Leu Lys Thr Gly Leu Ala Met Ala Ser Gly Phe Gly Trp Tyr Ser Leu
195 200 205
Ser Gly Ile Leu Met Thr Glu Ser Phe Gly Pro Val Ile Gly Ser Ala
210 215 220
Ala Phe Phe Asn Asp Leu Ser Arg Glu Leu Leu Ala Ile Met Leu Ile
225 230 235 240
Pro Gly Leu Val Arg Arg Ser Arg Ser Thr Ala Leu Gly Leu Cys Gly
245 250 255
Ala Thr Ser Met Asp Phe Thr Leu Pro Val Leu Gln Arg Ser Gly Gly
260 265 270
Val Glu Ile Val Pro Ala Ala Ile Val His Gly Phe Val Leu Ser Leu
275 280 285
Leu Val Pro Val Leu Ile Ala Leu Phe Ser Ala
290 295
<210> 65
<211> 903
<212> DNA
<213> 阴沟肠杆菌复合体
<400> 65
atgtattctg ggctgttaat cattttatta ccacttttct tcggttacct gatccccatt 60
aagcagccta gtctgttaca caatattcat cgtctgttat cgcttatggt ctatgttatt 120
ctcttcttta tgggcatcag cttggccttt ctcgataatc tgtcggctaa tttagtgacg 180
atttttctgt atgcaggtgt ctttttcatc tgcatcatca gcgccaacct tgcagccctg 240
gcattacttg atcgtcagtg gccatggaaa aatgcccatc agcaggagaa actgccttcg 300
cgcctcggta tggctctcga aagtcttcaa ctttgcggca tcgttgctat tggctttgta 360
ctgggtctga ctcacattag ttggctgatt tatgccacgc aggctagcga attcgcactg 420
atttttctgc tgttattagt gggcatccag ctgcgcaact cagggatgag cctgcgtgaa 480
attacgctga atcgccgcgg catgatcatc gcccttgtgg tggtgttttc tgccatggtt 540
gggggtgcga ttgcggcttg gctgttggga ctgcctattc gcaccggctt ggcgatgagc 600
agcgcatatg gctggtatag cttatctggt attattttga ccgatagcct gggccctgtg 660
ctgggttcag ccgcgttttt caatgatctg gcacgtgaat tagtagcgat catgttaatc 720
ccggcccttg tgcgccgtaa cgtgagcagc gcagtaggca tctgcggcgc gactagcatg 780
gattttactc tgccggtttt gcagcgttct ggtggactgg ccatcgtacc ggcagccatt 840
gtccacggct ttattcttag cctgtttgcg ccggtactgt tggcgttctt ctcggctccg 900
tag 903
<210> 66
<211> 299
<212> PRT
<213> 阴沟肠杆菌复合体
<400> 66
Met Phe Ser Gly Leu Leu Ile Ile Leu Leu Pro Leu Ile Ala Gly Tyr
1 5 10 15
Leu Ile Pro Leu Arg Gln Glu Ser Ala Leu Arg Leu Ile Asn Arg Phe
20 25 30
Leu Ser Gly Ile Val Tyr Leu Ile Leu Phe Phe Met Gly Ile Ser Leu
35 40 45
Ala Phe Leu Asp Asn Leu Ser Ala Asn Leu Leu Ser Ile Leu His Tyr
50 55 60
Ser Ala Val Thr Val Thr Val Ile Leu Leu Cys Asn Ile Ala Ala Leu
65 70 75 80
Leu Trp Leu Glu Arg Thr Ile Pro Trp Lys Asn His His His Gln Glu
85 90 95
Lys Leu Pro Ser Arg Ile Ala Met Ala Leu Glu Ser Leu Lys Leu Cys
100 105 110
Gly Val Val Val Leu Gly Phe Leu Leu Gly Leu Thr Gly Trp Ala Phe
115 120 125
Leu Gln His Ala Thr Glu Ala Ser Glu Tyr Thr Leu Ile Phe Leu Leu
130 135 140
Phe Leu Ile Gly Ile Gln Leu Arg Asn Asn Gly Met Thr Leu Lys Gln
145 150 155 160
Ile Val Leu Asn Arg Arg Gly Met Ile Ile Ala Val Met Val Val Ala
165 170 175
Ser Ser Met Val Ala Gly Val Ile Asn Ala Phe Ile Leu Asp Leu Pro
180 185 190
Leu Lys Thr Gly Leu Ala Met Ala Ser Gly Phe Gly Trp Tyr Ser Leu
195 200 205
Ser Gly Ile Leu Leu Thr Glu Ser Phe Gly Pro Val Ile Gly Ser Ala
210 215 220
Ala Phe Phe Asn Asp Leu Ala Arg Glu Leu Ile Ala Ile Met Leu Ile
225 230 235 240
Pro Gly Leu Val Arg Arg Ser Arg Ser Thr Ala Leu Gly Leu Cys Gly
245 250 255
Ala Thr Ser Met Asp Phe Thr Leu Pro Val Leu Gln Arg Ser Gly Gly
260 265 270
Leu Glu Met Val Pro Ala Ala Ile Val His Gly Phe Ile Leu Ser Leu
275 280 285
Leu Val Pro Ile Leu Met Ala Phe Phe Ser Ala
290 295
<210> 67
<211> 900
<212> DNA
<213> 别弧菌属15175
<400> 67
atgtttagtg gtttattaat tatcctggta ccgttaatcg tgggttattt aattccgctg 60
cgccagcagg cagcgctgaa agttattaat cagctgctga gttggatggt gtatctgatc 120
ttattcttta tgggcatttc tctggcgttt ctggacaatc tggcttcaaa ccttcttgcg 180
atcctgcact acagcgcggt ttccattacg gtgattctcc tgtgcaacat cgccgccctg 240
atgtggctgg aacgcggctt gccgtggcgt aaccatcatc aacaagaaaa actccctagc 300
cgcatcgcaa tggcgctgga atcactgaaa ctctgcggcg ttgtcgttat tggctttgcg 360
atcggccttt ctggccttgc gtttttgcag cacgccaccg aagcctcaga atataccctg 420
attctgttac tgttcttggt tggcattcaa cttcgtaata acggcatgac gctgaagcag 480
atcgtcttaa accgccgtgg aatgatcgtg gcggtggtag ttgtggtcag ttcgctgatt 540
gggggtctga tcaacgcctt tatcttggat cttccaatta acaccgcgct ggcgatggcg 600
agcgggttcg gttggtattc attaagcggc attttattaa cggaatcttt cggtccagtg 660
attggcagcg cggccttctt taatgatctg gcgcgtgaac tgatcgcgat tatgctgatc 720
cccgggctga tccgccgctc gcgcagcacg gcattgggcc tttgtggtgc tacgagcatg 780
gattttaccc tgccggtgtt gcaacgcacg ggcggcttag acatggtccc ggcagcgatc 840
gtgcacggct ttatcctcag cctgttggtc ccaattctta tcgcgttctt tagtgcgtag 900
<210> 68
<211> 299
<212> PRT
<213> 别弧菌属15175
<400> 68
Met Leu Ser Gly Met Leu Phe Val Phe Leu Pro Leu Leu Phe Gly Tyr
1 5 10 15
Leu Ile Pro Leu His Ser Gln Lys Pro Leu Gln His Ile Asn Ala Ala
20 25 30
Thr Ser His Leu Val Thr Ile Ile Leu Ala Leu Met Gly Leu Ser Leu
35 40 45
Ala Ala Leu Asp Asn Leu Ala Gln Asn Leu Asn Gln Ile Val Thr Ile
50 55 60
Thr Ala Val Phe Phe Ile Ser Ile Ser Val Cys Asn Leu Ser Val Leu
65 70 75 80
Pro Ile Ile Asp Lys Leu Phe Pro Leu Asn Ser Glu Gly Asn Lys Asn
85 90 95
Thr Leu Pro Leu Phe Lys Met Ile Leu Glu Ser Ala Lys Leu Leu Leu
100 105 110
Ala Val Ala Ala Gly Leu Ala Phe Gly Leu Leu Ser Gly Ile Asp Leu
115 120 125
Thr Trp Val Glu Ser Ala Ser Glu Ile Ile Leu Leu Ala Leu Leu Phe
130 135 140
Leu Ile Gly Ile Gln Leu Arg Asn Ser Gly Leu Ser Leu Arg Gln Ile
145 150 155 160
Leu Leu Asn Lys His Gly Ile Ile Ile Ala Gly Val Ile Leu Ser Thr
165 170 175
Ser Leu Ile Gly Gly Leu Ile Ala Ala Leu Phe Leu Asp Ile Pro Leu
180 185 190
Asn His Gly Leu Ala Met Ala Ser Gly Phe Gly Trp Tyr Ser Leu Ala
195 200 205
Gly Ile Leu Met Gly Asp Ala Leu Gly Pro Val Tyr Gly Gly Ala Ala
210 215 220
Phe Leu Asn Glu Leu Met Arg Glu Leu Val Ala Leu Leu Leu Ile Pro
225 230 235 240
Thr Leu Ile His Arg Tyr Pro Val Thr Ser Ile Gly Tyr Ala Gly Ala
245 250 255
Thr Ala Met Asp Phe Thr Leu Pro Val Ile Gln Asn Cys Gly Gly Ile
260 265 270
Arg Cys Val Pro Ile Ala Ile Val Ser Gly Phe Ile Leu Ser Leu Leu
275 280 285
Val Pro Phe Leu Met Leu Phe Phe Val Ser Leu
290 295
<210> 69
<211> 900
<212> DNA
<213> 厄氏菌根918
<400> 69
atgtatagcg gcctgctcat tatcctgctc ccgttaattc tgggttacct catcccactg 60
tctcgcaaaa ccctcatcca gctgatcaat cgtttactga gctggatggt ttatgttatt 120
ctgtttttca tgggcattag cctggccttc ctggaaaatc tgtcagcgaa tctgctgttg 180
attttccagt atgctggggt tttcttttta tgcatctttt gtgctaacct tctggcattg 240
ttcctgttgg aacgtaagac cccatggaaa aacacgcatc gtcaggaagt tctgccctct 300
cgtttgcata tggctttgga gtcactgaaa ttatgtggcg ttgtcattgt aggtttctta 360
ttaggtttaa gccaatggga atggttacaa tttgctgcca aagggagtga actggcactt 420
atctttttac ttttccttgt tggaattcag ctgcgcaata gcggtatgac cctgcgtcag 480
attgtcctta atcgtcgtgg ggctatcgtc gcgatcgttg tggcgttctc agcgctggca 540
gggggtatgc tggcggcggt actgatggac ctgccaatta aaacgggact cgccatggcc 600
tctggttttg gctggtattc tctgagcggc attctcctga ccgatagctt cggccctgta 660
attgggtcgg ccgccttttt caatgattta gcgcgcgagc tggtggcaat catgctgatt 720
ccgacgctcg tgcgttcatc ccgctcatcg gccctgggcc tgtgcggcgc gactagcatg 780
gacttcaccc tgcccgtact gcagcgtagt ggcgggctcg aaatggttcc tgccgcaatt 840
gtgcatggat tcctgctttc gctgttagct ccgattttga ttgcattctt tagttcgtag 900
<210> 70
<211> 347
<212> PRT
<213> 厄氏菌根918
<400> 70
Met Asn Pro Ser Ile Ser Val Leu Phe Arg Ala Ile Pro Leu Ala Met
1 5 10 15
Gly Ala Val Cys Leu Ala Phe Gly Leu Tyr Val Leu Ser Gly Gly Asp
20 25 30
Asp Ala Asn His Phe Val Ala Gly His Val Asn Val Ala Leu Thr Ala
35 40 45
Ile Cys Ile Ala Leu Phe Thr Thr Ala Ala Thr Ile Ile Arg Gln Leu
50 55 60
Val His Arg Tyr Gly Arg Val Trp Glu Ile Val Leu Pro Val Leu Gly
65 70 75 80
Tyr Ala Val Ala Ile Ala Thr Met Ile Trp Gly Ile Thr Ile Ile Gly
85 90 95
Arg Gly Asp Glu Pro Gln Phe Ile Val Ala Gly His Val Met Leu Gly
100 105 110
Ile Gly Phe Ile Ala Gly Cys Val Ser Thr Val Ala Thr Ala Ser Thr
115 120 125
Lys Phe Val Leu Ile Gln Lys Ser Ala Ala Leu Pro Val Gly Gly Gly
130 135 140
Ala Pro Asp Gly Ala Tyr Ser Arg Gly Ala Gly Thr Val Leu Ile Ala
145 150 155 160
Ile Pro Ala Leu Phe Ala Val Val Gly Leu Ile Val Ala Val Thr Leu
165 170 175
Tyr Ala Arg Gly Gly Asn Ala Ala Leu Val Ala Gly Asn Val Met Val
180 185 190
Gly Leu Ser Leu Val Cys Ser Ala Leu Val Ala Leu Val Ala Ser Ile
195 200 205
Val Arg Gln Val Arg Asn Glu Phe Gly Asp Ala Glu Arg Tyr Arg Trp
210 215 220
Thr Trp Trp Val Val Ala Met Gly Thr Ile Asn Val Ala Leu Gly Leu
225 230 235 240
Val Val Leu Phe Ser Ser Asp Asp Pro Ser Arg Leu Ala Pro Gly Thr
245 250 255
Val Leu Ile Gly Leu Gly Leu Ile Cys Phe Ser Ile Leu Ser Lys Val
260 265 270
Leu Leu Leu Ala Leu Val Trp Arg Gln Val Phe Ala Leu Ala Asn Arg
275 280 285
Ile Pro Ile Ile Pro Val Ala Thr Ala Leu Ala Cys Leu Phe Phe Ala
290 295 300
Ala Phe Leu Phe Glu Ala Thr Met Thr Glu Pro Gly Phe Phe Val Gly
305 310 315 320
Ala His Val Leu Val Gly Leu Gly Ala Val Cys Phe Thr Leu Phe Ser
325 330 335
Ile Val Ser Ile Leu Glu Ala Gly Thr Ser Lys
340 345
<210> 71
<211> 960
<212> DNA
<213> 放线菌纲细菌
<400> 71
atggatacaa aatcaaacgt tacagataaa tctagtaaaa cacagggcct tctgtttggc 60
ttcctcggtg tgctcgcgtt cagctttacg gtgccgctta cacgcgtcgc tgtcgctgac 120
ttagatccga ccttcgtggg gcttggacgt gccttagtgg ctgcagccct ggccgctctg 180
ctgctggcat ttacgcgtca gcgtttacca gagcgccgcc attggccgcg cctggttatt 240
gtgggctccg gggtaattgt cggctttccc ttatttacca gcctggccct gcgtgaactg 300
ccagcagcgg atgccgcagt tattgtgggc cttctgccag cagcgactgt ggttatggca 360
gtgttacgtg cgggggaacg tccgagccgc gcgttttggg gcgcttgtgc gtttgggctg 420
cttgcagttc tcttgttcgc agcttcccaa ggagctggtc ttgtcccgga tcgtggacac 480
ctgctcgttc tgctggccgt cgccctttgt tcgttgggct acgcagaagg cggtgccttg 540
gcgcaagaaa tcggcggctg gcgtgttatc tcctggtcgt tggttgtgtt tgcaccgttt 600
ctggcgccat ttgtcgcctg gagcgtcttg ggcccaggtg gcgcggggct taccgtggcg 660
ggcccagcgg catgggcatg ttttgcctat gttagtgtcg tcagtatgtt tttgggcttt 720
ttcgcatggt accgtgggct cgcggaggga ggcgttgcgc gcgtcggaca agtgcaactg 780
agccaaccgg ttttaacgct gttatggtct gcgctcctgc tgggagaacg tgtaggtccg 840
ttcacggtgt tgtgcgcagt acttgtgctc gcatccgtgg cagttggcca gcgcactcgt 900
gtgaataaag gtggtgcccg caccgggaaa gccgcagcga aaaccggccg tgaaggttag 960
<210> 72
<211> 319
<212> PRT
<213> 放线菌纲细菌
<400> 72
Met Asp Thr Lys Ser Asn Val Thr Asp Lys Ser Ser Lys Thr Gln Gly
1 5 10 15
Leu Leu Phe Gly Phe Leu Gly Val Leu Ala Phe Ser Phe Thr Val Pro
20 25 30
Leu Thr Arg Val Ala Val Ala Asp Leu Asp Pro Thr Phe Val Gly Leu
35 40 45
Gly Arg Ala Leu Val Ala Ala Ala Leu Ala Ala Leu Leu Leu Ala Phe
50 55 60
Thr Arg Gln Arg Leu Pro Glu Arg Arg His Trp Pro Arg Leu Val Ile
65 70 75 80
Val Gly Ser Gly Val Ile Val Gly Phe Pro Leu Phe Thr Ser Leu Ala
85 90 95
Leu Arg Glu Leu Pro Ala Ala Asp Ala Ala Val Ile Val Gly Leu Leu
100 105 110
Pro Ala Ala Thr Val Val Met Ala Val Leu Arg Ala Gly Glu Arg Pro
115 120 125
Ser Arg Ala Phe Trp Gly Ala Cys Ala Phe Gly Leu Leu Ala Val Leu
130 135 140
Leu Phe Ala Ala Ser Gln Gly Ala Gly Leu Val Pro Asp Arg Gly His
145 150 155 160
Leu Leu Val Leu Leu Ala Val Ala Leu Cys Ser Leu Gly Tyr Ala Glu
165 170 175
Gly Gly Ala Leu Ala Gln Glu Ile Gly Gly Trp Arg Val Ile Ser Trp
180 185 190
Ser Leu Val Val Phe Ala Pro Phe Leu Ala Pro Phe Val Ala Trp Ser
195 200 205
Val Leu Gly Pro Gly Gly Ala Gly Leu Thr Val Ala Gly Pro Ala Ala
210 215 220
Trp Ala Cys Phe Ala Tyr Val Ser Val Val Ser Met Phe Leu Gly Phe
225 230 235 240
Phe Ala Trp Tyr Arg Gly Leu Ala Glu Gly Gly Val Ala Arg Val Gly
245 250 255
Gln Val Gln Leu Ser Gln Pro Val Leu Thr Leu Leu Trp Ser Ala Leu
260 265 270
Leu Leu Gly Glu Arg Val Gly Pro Phe Thr Val Leu Cys Ala Val Leu
275 280 285
Val Leu Ala Ser Val Ala Val Gly Gln Arg Thr Arg Val Asn Lys Gly
290 295 300
Gly Ala Arg Thr Gly Lys Ala Ala Ala Lys Thr Gly Arg Glu Gly
305 310 315
<210> 73
<211> 909
<212> DNA
<213> 弧菌属E4404
<400> 73
atgttttcgg ggatgctgtt catctttagt ccactgatcg caggttactt tgtgagcctg 60
agcaatgaat ctttactgaa caagattaac cgctatacta gcaatatcat ttatattatt 120
ttgagcttaa tggggctgag tttagcagcg ttagataatt tgggctcgaa cttgcagagt 180
atcttgattt acacgggctc tttcttcgta atcatcggac tgtgcaacct gtcagcgtta 240
ccattcatcg ataaaattct gccgctcaaa acagaacaaa ccgggaagcc catcccgctc 300
tcgatgatgc ttaaagacag cattacgttg atcatggtcg tgggcagcgg tctgatcatt 360
gggattttac ttccgattaa tctttcctgg gttgatacgg cgattgagtg gacgctgttt 420
ttactgcttc tgtttattgg cattcagctg cgtaattctg gtctgacgct gcgtcaaatc 480
ttgctgaaca aacatggcat gattatcagc gttgtgatca ttctgtcgag ctgggccggt 540
ggcattatcg ccgcgttcat tctggatctg ccaatctatc agtccctggc aatgagtagc 600
gggtttgggt ggtatagcct gagcggtatc ttaatgggtg atgcgtatgg cccagtgttt 660
ggcggcgcga gttttatgtt agaattatta cgcgaactgg tggccctggt gtcgattcct 720
ctgatggttc gcaatcgccc atgtacggcc attggttatg cgggcgccac cgctatggat 780
tttacccttc cagtgatcca gtccagtggc ggtgtgcgct gcgtgccagt ggctattgtg 840
agtggtttca ttctgtccct ggtggtgccg ttcttcatgc tgttctttgt gagcctgggt 900
cctgtttag 909
<210> 74
<211> 302
<212> PRT
<213> 弧菌属E4404
<400> 74
Met Phe Ser Gly Met Leu Phe Ile Phe Ser Pro Leu Ile Ala Gly Tyr
1 5 10 15
Phe Val Ser Leu Ser Asn Glu Ser Leu Leu Asn Lys Ile Asn Arg Tyr
20 25 30
Thr Ser Asn Ile Ile Tyr Ile Ile Leu Ser Leu Met Gly Leu Ser Leu
35 40 45
Ala Ala Leu Asp Asn Leu Gly Ser Asn Leu Gln Ser Ile Leu Ile Tyr
50 55 60
Thr Gly Ser Phe Phe Val Ile Ile Gly Leu Cys Asn Leu Ser Ala Leu
65 70 75 80
Pro Phe Ile Asp Lys Ile Leu Pro Leu Lys Thr Glu Gln Thr Gly Lys
85 90 95
Pro Ile Pro Leu Ser Met Met Leu Lys Asp Ser Ile Thr Leu Ile Met
100 105 110
Val Val Gly Ser Gly Leu Ile Ile Gly Ile Leu Leu Pro Ile Asn Leu
115 120 125
Ser Trp Val Asp Thr Ala Ile Glu Trp Thr Leu Phe Leu Leu Leu Leu
130 135 140
Phe Ile Gly Ile Gln Leu Arg Asn Ser Gly Leu Thr Leu Arg Gln Ile
145 150 155 160
Leu Leu Asn Lys His Gly Met Ile Ile Ser Val Val Ile Ile Leu Ser
165 170 175
Ser Trp Ala Gly Gly Ile Ile Ala Ala Phe Ile Leu Asp Leu Pro Ile
180 185 190
Tyr Gln Ser Leu Ala Met Ser Ser Gly Phe Gly Trp Tyr Ser Leu Ser
195 200 205
Gly Ile Leu Met Gly Asp Ala Tyr Gly Pro Val Phe Gly Gly Ala Ser
210 215 220
Phe Met Leu Glu Leu Leu Arg Glu Leu Val Ala Leu Val Ser Ile Pro
225 230 235 240
Leu Met Val Arg Asn Arg Pro Cys Thr Ala Ile Gly Tyr Ala Gly Ala
245 250 255
Thr Ala Met Asp Phe Thr Leu Pro Val Ile Gln Ser Ser Gly Gly Val
260 265 270
Arg Cys Val Pro Val Ala Ile Val Ser Gly Phe Ile Leu Ser Leu Val
275 280 285
Val Pro Phe Phe Met Leu Phe Phe Val Ser Leu Gly Pro Val
290 295 300
<210> 75
<211> 921
<212> DNA
<213> 奈瑟菌科细菌
<400> 75
atgtttcaat tggtaattct tttatttgcc cttgttgtgg gttactggat taaacgcctg 60
ccgctgtcca acaattcgct gaacaaattg ctgttcttca tcgtggtcgc cattttgttt 120
gtaatgggct atgacttcgg cgttaactta aaagaactga ttgaagaatt ggtcaacatc 180
gtcctgatgg tggtagtctt tacctcattg attttctttt gtaattttgt ttgcgctagc 240
attgtgtttc gtaaggagaa taagcaatgc cgcgataacc tgaaaaacgg gccccaagtc 300
tcaacgaatt atctgctgta cattttgcag tcagcgaagt acaccggaat cattttcttg 360
ggcatcattt gtggtgtaat cctccagaaa ccgctgacat acttggggga aattatcgat 420
gttcttctga ttgtacttct gttcgtaatt ggccaccaaa tgcgtattag tggcacaaaa 480
ctgaaacacg tgtttctcaa taaaagtggg atcaagttat cactgtctat cgtgtttagt 540
tctctgttag caggcgtgct ggtttccctg atcctgaaat tccccctgaa ccaggcttta 600
gctatgtcga gcggctttgg ttggtacacg ttatcgagta tcatggtcgg tagtctgatc 660
aatgaaaact actccgtggt ttcattcttc attgatttta accgtgaact gattgccatt 720
atcctgctgc cgtcgttagg tcgcctgttt ccgtatacta tggtcggtgt gtgcggcgcg 780
accgcgatgg acttcagcct tccggtgatt aaacaaaacc tttcgcagca gctggtggtg 840
gttgccatct ccagcggaat gatcctgagt gtggcaacgc cagttctgct tccgctgttt 900
gccaaattga gctacttata g 921
<210> 76
<211> 306
<212> PRT
<213> 奈瑟菌科细菌
<400> 76
Met Phe Gln Leu Val Ile Leu Leu Phe Ala Leu Val Val Gly Tyr Trp
1 5 10 15
Ile Lys Arg Leu Pro Leu Ser Asn Asn Ser Leu Asn Lys Leu Leu Phe
20 25 30
Phe Ile Val Val Ala Ile Leu Phe Val Met Gly Tyr Asp Phe Gly Val
35 40 45
Asn Leu Lys Glu Leu Ile Glu Glu Leu Val Asn Ile Val Leu Met Val
50 55 60
Val Val Phe Thr Ser Leu Ile Phe Phe Cys Asn Phe Val Cys Ala Ser
65 70 75 80
Ile Val Phe Arg Lys Glu Asn Lys Gln Cys Arg Asp Asn Leu Lys Asn
85 90 95
Gly Pro Gln Val Ser Thr Asn Tyr Leu Leu Tyr Ile Leu Gln Ser Ala
100 105 110
Lys Tyr Thr Gly Ile Ile Phe Leu Gly Ile Ile Cys Gly Val Ile Leu
115 120 125
Gln Lys Pro Leu Thr Tyr Leu Gly Glu Ile Ile Asp Val Leu Leu Ile
130 135 140
Val Leu Leu Phe Val Ile Gly His Gln Met Arg Ile Ser Gly Thr Lys
145 150 155 160
Leu Lys His Val Phe Leu Asn Lys Ser Gly Ile Lys Leu Ser Leu Ser
165 170 175
Ile Val Phe Ser Ser Leu Leu Ala Gly Val Leu Val Ser Leu Ile Leu
180 185 190
Lys Phe Pro Leu Asn Gln Ala Leu Ala Met Ser Ser Gly Phe Gly Trp
195 200 205
Tyr Thr Leu Ser Ser Ile Met Val Gly Ser Leu Ile Asn Glu Asn Tyr
210 215 220
Ser Val Val Ser Phe Phe Ile Asp Phe Asn Arg Glu Leu Ile Ala Ile
225 230 235 240
Ile Leu Leu Pro Ser Leu Gly Arg Leu Phe Pro Tyr Thr Met Val Gly
245 250 255
Val Cys Gly Ala Thr Ala Met Asp Phe Ser Leu Pro Val Ile Lys Gln
260 265 270
Asn Leu Ser Gln Gln Leu Val Val Val Ala Ile Ser Ser Gly Met Ile
275 280 285
Leu Ser Val Ala Thr Pro Val Leu Leu Pro Leu Phe Ala Lys Leu Ser
290 295 300
Tyr Leu
305
<210> 77
<211> 903
<212> DNA
<213> 粘液变形杆菌ATCC 19692
<400> 77
atgctgtctg gcctgctgat cattctgtta ccccttttcg tgggctatct tatcaaactg 60
aacaacctgc ccttgcttaa gatcgccaac cgcctgttaa gcgcgatggt gtacgtgatc 120
ctgttcctga tgggtgtgtc tctggctatg ctggataaca tcggtgaaaa tttagttagc 180
atcctgtttt acgcgtcagt atttttcttc tgcacttttg gtgcgaacct cttgtgctta 240
tggctgctgg ataagaaaga tccgtggcac gtcccggcac acaaacagag taaaccgccc 300
tcccgcatca aaatggtcct cgaatctctg cagttatgtg gtgtggttgt cattggcttc 360
ttcgtcggtc tgacgcaatg gcctattttt cactacgcgt cacatgcttc acaaggcgcg 420
ctgattttcc tgctgtggct tgtggggttg cagctccgta attcagggat gtctccaaaa 480
caaatcttga ttaatcgccg cgggacgacc gttgcgatcg tgatgggtgt atcggcgctt 540
gcgggcggtg tgttggccgc gtacattttg gggctgccga cgaaaatggg tctggctatt 600
gcaagtggtt acggttggta ttcgctgtcc ggtatcgtgt tgaccgatgc cttcggaccg 660
gtcatcgggt ccacggcgtt cttcaatgat ctcatgcgtg aactggccgc gatcatgctg 720
atccccatta tcgtcaaccg ttatcgcaac accgctctgg gtatttgtgg ttctacttca 780
atggatttca cgctccctgt gctgcagcgc tctggtggtg ttgcgattat tcctgcggca 840
attgtgcatg gttttgttct gtctttaatt acaccaattt tgatggcatt ctttacctca 900
tag 903
<210> 78
<211> 300
<212> PRT
<213> 粘液变形杆菌ATCC 19692
<400> 78
Met Leu Ser Gly Leu Leu Ile Ile Leu Leu Pro Leu Phe Val Gly Tyr
1 5 10 15
Leu Ile Lys Leu Asn Asn Leu Pro Leu Leu Lys Ile Ala Asn Arg Leu
20 25 30
Leu Ser Ala Met Val Tyr Val Ile Leu Phe Leu Met Gly Val Ser Leu
35 40 45
Ala Met Leu Asp Asn Ile Gly Glu Asn Leu Val Ser Ile Leu Phe Tyr
50 55 60
Ala Ser Val Phe Phe Phe Cys Thr Phe Gly Ala Asn Leu Leu Cys Leu
65 70 75 80
Trp Leu Leu Asp Lys Lys Asp Pro Trp His Val Pro Ala His Lys Gln
85 90 95
Ser Lys Pro Pro Ser Arg Ile Lys Met Val Leu Glu Ser Leu Gln Leu
100 105 110
Cys Gly Val Val Val Ile Gly Phe Phe Val Gly Leu Thr Gln Trp Pro
115 120 125
Ile Phe His Tyr Ala Ser His Ala Ser Gln Gly Ala Leu Ile Phe Leu
130 135 140
Leu Trp Leu Val Gly Leu Gln Leu Arg Asn Ser Gly Met Ser Pro Lys
145 150 155 160
Gln Ile Leu Ile Asn Arg Arg Gly Thr Thr Val Ala Ile Val Met Gly
165 170 175
Val Ser Ala Leu Ala Gly Gly Val Leu Ala Ala Tyr Ile Leu Gly Leu
180 185 190
Pro Thr Lys Met Gly Leu Ala Ile Ala Ser Gly Tyr Gly Trp Tyr Ser
195 200 205
Leu Ser Gly Ile Val Leu Thr Asp Ala Phe Gly Pro Val Ile Gly Ser
210 215 220
Thr Ala Phe Phe Asn Asp Leu Met Arg Glu Leu Ala Ala Ile Met Leu
225 230 235 240
Ile Pro Ile Ile Val Asn Arg Tyr Arg Asn Thr Ala Leu Gly Ile Cys
245 250 255
Gly Ser Thr Ser Met Asp Phe Thr Leu Pro Val Leu Gln Arg Ser Gly
260 265 270
Gly Val Ala Ile Ile Pro Ala Ala Ile Val His Gly Phe Val Leu Ser
275 280 285
Leu Ile Thr Pro Ile Leu Met Ala Phe Phe Thr Ser
290 295 300
<210> 79
<211> 891
<212> DNA
<213> 未经培养的拟杆菌属
<400> 79
atgaagaaac tgagcaaaaa tgcactgatc ggatatccgg ctggtatcat cacgggcatt 60
acctatggct taaatccact ttttgccgta ccgctgatga aacatggggc cgctaccgaa 120
agcatcctgt tctttcgtta cctgtttgcg gtattaattt tagccctgtt cctgcttgtt 180
cgccgccaga gctttcgcgt gagcggccaa caggcaggaa tcctgctcat tctgggactc 240
ctgtacacct cgagttccct tttcttattt gatgcgtatg aatatattgc aagtgggctt 300
gctaccacct tggtttttct gtacccggtc ctggtcgcaa ttatcatggt cttcttgaaa 360
gttgttccga gctggccagt gtggctggca attgctgcta cctttggggg agtgctcatt 420
atgacccaag gtgatggcac ccaggcgtta aatccgatcg gtgttttgct gtcaatcggt 480
agcgccctgg tgtacgcctt gttcattgtc attattaacc gttcgaaggc gattgcgtcc 540
atttcaaact cactgctgac tttttatgcg ttgtcggtag gagccgttgt tttcctgggc 600
aagattctga tctcggacac cgcactgacc gcaggcctga atcatgctca cgattggctg 660
aatctggtgg gccttgcatt ccttccgact gttgtctcga cagccaccct tgcgattgcg 720
agccgcaaca ttggcgctac caaggcgagc gtcctcggcg tattcgagcc tattacggcg 780
atcgtcgtcg gtaccctggt gttcggtgag ccgttgacca caaacattgt ggtcggtatc 840
accgtagcca ttgtggccgt gacgtttatg atcaccttga cgaaacgtta g 891
<210> 80
<211> 296
<212> PRT
<213> 未经培养的拟杆菌属
<400> 80
Met Lys Lys Leu Ser Lys Asn Ala Leu Ile Gly Tyr Pro Ala Gly Ile
1 5 10 15
Ile Thr Gly Ile Thr Tyr Gly Leu Asn Pro Leu Phe Ala Val Pro Leu
20 25 30
Met Lys His Gly Ala Ala Thr Glu Ser Ile Leu Phe Phe Arg Tyr Leu
35 40 45
Phe Ala Val Leu Ile Leu Ala Leu Phe Leu Leu Val Arg Arg Gln Ser
50 55 60
Phe Arg Val Ser Gly Gln Gln Ala Gly Ile Leu Leu Ile Leu Gly Leu
65 70 75 80
Leu Tyr Thr Ser Ser Ser Leu Phe Leu Phe Asp Ala Tyr Glu Tyr Ile
85 90 95
Ala Ser Gly Leu Ala Thr Thr Leu Val Phe Leu Tyr Pro Val Leu Val
100 105 110
Ala Ile Ile Met Val Phe Leu Lys Val Val Pro Ser Trp Pro Val Trp
115 120 125
Leu Ala Ile Ala Ala Thr Phe Gly Gly Val Leu Ile Met Thr Gln Gly
130 135 140
Asp Gly Thr Gln Ala Leu Asn Pro Ile Gly Val Leu Leu Ser Ile Gly
145 150 155 160
Ser Ala Leu Val Tyr Ala Leu Phe Ile Val Ile Ile Asn Arg Ser Lys
165 170 175
Ala Ile Ala Ser Ile Ser Asn Ser Leu Leu Thr Phe Tyr Ala Leu Ser
180 185 190
Val Gly Ala Val Val Phe Leu Gly Lys Ile Leu Ile Ser Asp Thr Ala
195 200 205
Leu Thr Ala Gly Leu Asn His Ala His Asp Trp Leu Asn Leu Val Gly
210 215 220
Leu Ala Phe Leu Pro Thr Val Val Ser Thr Ala Thr Leu Ala Ile Ala
225 230 235 240
Ser Arg Asn Ile Gly Ala Thr Lys Ala Ser Val Leu Gly Val Phe Glu
245 250 255
Pro Ile Thr Ala Ile Val Val Gly Thr Leu Val Phe Gly Glu Pro Leu
260 265 270
Thr Thr Asn Ile Val Val Gly Ile Thr Val Ala Ile Val Ala Val Thr
275 280 285
Phe Met Ile Thr Leu Thr Lys Arg
290 295
<210> 81
<211> 891
<212> DNA
<213> 普通居福西亚菌
<400> 81
atgaaaaagt taagtaaaaa tgcaattatt ggatatcctg ctggtattat taccggcatt 60
acttatggcc tgaatccact gttcgcaatg ccattaatga aaaatggtgc tgcgaccgaa 120
tctatcctgt ttttccgcta tgcgtttgcc gtgctgttac tgggcctgtt tctgttgttt 180
cgtaagcagt cattccgcgt atcggggaaa cagattggcg tactctttat tctgggcctg 240
ctttatactt cgtcttcgat ctttttgttt gacgcgtatg aatatatcgc ctcgggtctg 300
gccaccactc tggtgtttct gtacccggtg cttgtggcga ttatcatggt ttttctgaaa 360
gtagttccca gctggccggt gtggttagct atcgccgcga ctttcggcgg cgtgttaatc 420
atgacccagt cagatggctc gcagactatt aatcctattg gcgtgttgct gagcatcgct 480
tcagctttgg tatatgcatt atttattgtc atcatcaacc gttctaaagc gattgcggga 540
attagcaatt ctctgctgac cttttacgcc ttgatggtag gcgccatcgt gttcattggt 600
aaaatcctca gcagtgatac cgcgattacg gcaggcatca ccacaggggc agattggtta 660
aatcttgtag gtctggctct gctgccaacg atcgtttcta ctgctaccct ggcgatcgcg 720
tcccgtaata tcggagcgac caaagcaagt gttctgggcg tttttgaacc gatcaccgct 780
atcattgttg gcaccctgat gttcggtgag cctctgacca ccaacattat cgttggtatc 840
tcgattgcga tggttgcggt tacttttatg atcactgtga cgaaacgtta g 891
<210> 82
<211> 296
<212> PRT
<213> 普通居福西亚菌
<400> 82
Met Lys Lys Leu Ser Lys Asn Ala Ile Ile Gly Tyr Pro Ala Gly Ile
1 5 10 15
Ile Thr Gly Ile Thr Tyr Gly Leu Asn Pro Leu Phe Ala Met Pro Leu
20 25 30
Met Lys Asn Gly Ala Ala Thr Glu Ser Ile Leu Phe Phe Arg Tyr Ala
35 40 45
Phe Ala Val Leu Leu Leu Gly Leu Phe Leu Leu Phe Arg Lys Gln Ser
50 55 60
Phe Arg Val Ser Gly Lys Gln Ile Gly Val Leu Phe Ile Leu Gly Leu
65 70 75 80
Leu Tyr Thr Ser Ser Ser Ile Phe Leu Phe Asp Ala Tyr Glu Tyr Ile
85 90 95
Ala Ser Gly Leu Ala Thr Thr Leu Val Phe Leu Tyr Pro Val Leu Val
100 105 110
Ala Ile Ile Met Val Phe Leu Lys Val Val Pro Ser Trp Pro Val Trp
115 120 125
Leu Ala Ile Ala Ala Thr Phe Gly Gly Val Leu Ile Met Thr Gln Ser
130 135 140
Asp Gly Ser Gln Thr Ile Asn Pro Ile Gly Val Leu Leu Ser Ile Ala
145 150 155 160
Ser Ala Leu Val Tyr Ala Leu Phe Ile Val Ile Ile Asn Arg Ser Lys
165 170 175
Ala Ile Ala Gly Ile Ser Asn Ser Leu Leu Thr Phe Tyr Ala Leu Met
180 185 190
Val Gly Ala Ile Val Phe Ile Gly Lys Ile Leu Ser Ser Asp Thr Ala
195 200 205
Ile Thr Ala Gly Ile Thr Thr Gly Ala Asp Trp Leu Asn Leu Val Gly
210 215 220
Leu Ala Leu Leu Pro Thr Ile Val Ser Thr Ala Thr Leu Ala Ile Ala
225 230 235 240
Ser Arg Asn Ile Gly Ala Thr Lys Ala Ser Val Leu Gly Val Phe Glu
245 250 255
Pro Ile Thr Ala Ile Ile Val Gly Thr Leu Met Phe Gly Glu Pro Leu
260 265 270
Thr Thr Asn Ile Ile Val Gly Ile Ser Ile Ala Met Val Ala Val Thr
275 280 285
Phe Met Ile Thr Val Thr Lys Arg
290 295
<210> 83
<211> 909
<212> DNA
<213> 伯氏异短杆菌
<400> 83
atgtactctg gtttattaat cgttctgatt ccgttgattc tgggttatct tatccgttta 60
aataataaaa cagcgctggc cacggtgcac tacttattaa atatcatgat ctatgtgatc 120
ctgtttctga tgggtgtccg cttagcgatg ctcgagaact tgggaaacaa tctcctgagt 180
atcctgctgt atgctatgac tttctttctt tgcatctttg caacgaatct tctcgcgctc 240
attctcttgg ataaacgcga cccgtggatc attcaggtta acaaacagga aaagtcccca 300
tcgcagctgc atattgtgtc agatagtatt aaactttgcg gagcgttaat tcttggtttt 360
ctgttgggtc tgacggactg gagcctgttc cattttgctt ccccggctag tgaaattact 420
ttgattctgc ttcttctcct tgtgggcatt cagttgcgta acaacggcat gtctttaaaa 480
cagactctcc tgaatcgtcg tggtaccatt atcgcgcttg ttgtcgcgat ttcttcgctg 540
cttggcggta tgatcgcagc cttcttactg ggattgccaa cgaaaacggg tttagccatc 600
gcgagtggtt atgggtggta ttcgctgagc gggatcctcc tgtcggacgc atacgggacc 660
gtaatcggca gcgcagcttt ctttaatgac ctggctcgtg aattggcgag tatcctgctc 720
attcctatgc ttattaaccg ttaccgctca accgccctgg gcttgacggg agcggcatct 780
attgacttca ccctgccgat tctgcagcgc tgcggtggaa ttagcattgt gcctgccgcg 840
atcgttcatg gctttatctt atcactgatg acgccagtgt ttattgcgtt tttcacccag 900
caagcgtag 909
<210> 84
<211> 302
<212> PRT
<213> 伯氏异短杆菌
<400> 84
Met Tyr Ser Gly Leu Leu Ile Val Leu Ile Pro Leu Ile Leu Gly Tyr
1 5 10 15
Leu Ile Arg Leu Asn Asn Lys Thr Ala Leu Ala Thr Val His Tyr Leu
20 25 30
Leu Asn Ile Met Ile Tyr Val Ile Leu Phe Leu Met Gly Val Arg Leu
35 40 45
Ala Met Leu Glu Asn Leu Gly Asn Asn Leu Leu Ser Ile Leu Leu Tyr
50 55 60
Ala Met Thr Phe Phe Leu Cys Ile Phe Ala Thr Asn Leu Leu Ala Leu
65 70 75 80
Ile Leu Leu Asp Lys Arg Asp Pro Trp Ile Ile Gln Val Asn Lys Gln
85 90 95
Glu Lys Ser Pro Ser Gln Leu His Ile Val Ser Asp Ser Ile Lys Leu
100 105 110
Cys Gly Ala Leu Ile Leu Gly Phe Leu Leu Gly Leu Thr Asp Trp Ser
115 120 125
Leu Phe His Phe Ala Ser Pro Ala Ser Glu Ile Thr Leu Ile Leu Leu
130 135 140
Leu Leu Leu Val Gly Ile Gln Leu Arg Asn Asn Gly Met Ser Leu Lys
145 150 155 160
Gln Thr Leu Leu Asn Arg Arg Gly Thr Ile Ile Ala Leu Val Val Ala
165 170 175
Ile Ser Ser Leu Leu Gly Gly Met Ile Ala Ala Phe Leu Leu Gly Leu
180 185 190
Pro Thr Lys Thr Gly Leu Ala Ile Ala Ser Gly Tyr Gly Trp Tyr Ser
195 200 205
Leu Ser Gly Ile Leu Leu Ser Asp Ala Tyr Gly Thr Val Ile Gly Ser
210 215 220
Ala Ala Phe Phe Asn Asp Leu Ala Arg Glu Leu Ala Ser Ile Leu Leu
225 230 235 240
Ile Pro Met Leu Ile Asn Arg Tyr Arg Ser Thr Ala Leu Gly Leu Thr
245 250 255
Gly Ala Ala Ser Ile Asp Phe Thr Leu Pro Ile Leu Gln Arg Cys Gly
260 265 270
Gly Ile Ser Ile Val Pro Ala Ala Ile Val His Gly Phe Ile Leu Ser
275 280 285
Leu Met Thr Pro Val Phe Ile Ala Phe Phe Thr Gln Gln Ala
290 295 300
<210> 85
<211> 903
<212> DNA
<213> 泉布拉格菌
<400> 85
atgtacagcg gcctggccat tattctgtta cctctgatct ttggctatct gattcctatc 60
aagagtttgg atctgttgcg tacaattaat cgtctgttgt caagtatggt ttatgtgatc 120
ctgttcttta tgggaattag tctggcattc ctggacaacc tgtctgcaaa tttacagatg 180
atctttttgt atgcctccgt tttctttatt tgcatcttct ctagtaatat cctggcactg 240
atgcttttgg atcgccagtg gccgtggcgt aaccgtcagc atcagaagaa acttcccagt 300
cgcctgcaca tggtgcttga atcacttcgc ctgtgcggtg tggtggtgat cggcttcctg 360
cttggtttaa cccacatttc gtggttggca tacgcaagcc aggccagcca gttcgcgtta 420
atcttcctcc tggtgctggt aggtctgcag ttgcgtaact cgggcatgac cttacgtgaa 480
attacactga acaaacgcgg tatggttgtc gcacttattg tcgtcattag cgcatttgcc 540
ggcggcgcta ttggtgcgct tttgctgggc ctgccagtga aaactggcct ggcgatgagc 600
tcggcttatg gctggtacag cctttcgggg attctcctga ctgatgccct gggtccagtg 660
ctgggtagtg cagcattttt caacgatctg gctcgtgaat tggtggcgat tatgctgatt 720
ccgactctga ttcgcagcca tgcgagtacc gcgttaggca tttgtggtgc aacttccatg 780
gatttcaccc tgccagtctt acagcgctca ggcagcgttg aaatcatccc ggctgcaatt 840
gtgcacgggt ttatcttgtc tctgctggca ccaattctga tggcgttctt ttcggcgccg 900
tag 903
<210> 86
<211> 300
<212> PRT
<213> 泉布拉格菌
<400> 86
Met Tyr Ser Gly Leu Ala Ile Ile Leu Leu Pro Leu Ile Phe Gly Tyr
1 5 10 15
Leu Ile Pro Ile Lys Ser Leu Asp Leu Leu Arg Thr Ile Asn Arg Leu
20 25 30
Leu Ser Ser Met Val Tyr Val Ile Leu Phe Phe Met Gly Ile Ser Leu
35 40 45
Ala Phe Leu Asp Asn Leu Ser Ala Asn Leu Gln Met Ile Phe Leu Tyr
50 55 60
Ala Ser Val Phe Phe Ile Cys Ile Phe Ser Ser Asn Ile Leu Ala Leu
65 70 75 80
Met Leu Leu Asp Arg Gln Trp Pro Trp Arg Asn Arg Gln His Gln Lys
85 90 95
Lys Leu Pro Ser Arg Leu His Met Val Leu Glu Ser Leu Arg Leu Cys
100 105 110
Gly Val Val Val Ile Gly Phe Leu Leu Gly Leu Thr His Ile Ser Trp
115 120 125
Leu Ala Tyr Ala Ser Gln Ala Ser Gln Phe Ala Leu Ile Phe Leu Leu
130 135 140
Val Leu Val Gly Leu Gln Leu Arg Asn Ser Gly Met Thr Leu Arg Glu
145 150 155 160
Ile Thr Leu Asn Lys Arg Gly Met Val Val Ala Leu Ile Val Val Ile
165 170 175
Ser Ala Phe Ala Gly Gly Ala Ile Gly Ala Leu Leu Leu Gly Leu Pro
180 185 190
Val Lys Thr Gly Leu Ala Met Ser Ser Ala Tyr Gly Trp Tyr Ser Leu
195 200 205
Ser Gly Ile Leu Leu Thr Asp Ala Leu Gly Pro Val Leu Gly Ser Ala
210 215 220
Ala Phe Phe Asn Asp Leu Ala Arg Glu Leu Val Ala Ile Met Leu Ile
225 230 235 240
Pro Thr Leu Ile Arg Ser His Ala Ser Thr Ala Leu Gly Ile Cys Gly
245 250 255
Ala Thr Ser Met Asp Phe Thr Leu Pro Val Leu Gln Arg Ser Gly Ser
260 265 270
Val Glu Ile Ile Pro Ala Ala Ile Val His Gly Phe Ile Leu Ser Leu
275 280 285
Leu Ala Pro Ile Leu Met Ala Phe Phe Ser Ala Pro
290 295 300
<210> 87
<211> 900
<212> DNA
<213> 准肺炎克雷伯氏菌
<400> 87
atgttcagcg gtctgtttat cattctgtta ccattggttg tcggctacct gttgccattg 60
cgccatagtt cggcgctgaa attgattaat cgtatgttaa gttggattgt ctatgtgatc 120
ctgttcttca tgggcatctc ccttgccttt ctggataacc tggcgagcaa tcttctggct 180
atcctgcatt atgccgcagt gtcagtagta attatcctgc tgtgcaatat taccgctttg 240
ttgtggttag aacgcaagat gccgtggcgt agcctgcatc gccaagaaaa attgccaagc 300
cgtttggcga tggcgctgga atctctgcag ctttgcggtg tcgtagtcct tggattcttg 360
ctcggcttga cgggtcttag ctttctgcaa cacgcgacgg aggcgtcgga gtataccttg 420
attttcctgc tgttcctcgt ggggatccag cttcgtaaca acggtatgtc tctgcgccag 480
atcgttctta atcgtcgcgg gatgatcgta gcagtcgtgg taactgctag cagcctgctg 540
ggtggcattt taaacgcgtt catcttagat ctgccgttaa aaaccggtct ggccatggca 600
tcgggctttg gttggtattc gctcagtgga atccttttga cagaaagctt tggtccggtg 660
attggcagtg ccgcgttctt taacgacctg tgccgtgaac tgctggctat tatgctgatt 720
ccagggttaa ttcgccgctc tcgtagtacg gccttaggtt tatgtggcgc tacgagcatg 780
gattttacac tgccagtctt gcagcgtagc gggggtgtcg agattgtgcc cgccgccatt 840
gttcatggct ttctgttgag cctcctggtg ccgatcctca tcgccttctt cgccgcctag 900
<210> 88
<211> 299
<212> PRT
<213> 准肺炎克雷伯氏菌
<400> 88
Met Phe Ser Gly Leu Phe Ile Ile Leu Leu Pro Leu Val Val Gly Tyr
1 5 10 15
Leu Leu Pro Leu Arg His Ser Ser Ala Leu Lys Leu Ile Asn Arg Met
20 25 30
Leu Ser Trp Ile Val Tyr Val Ile Leu Phe Phe Met Gly Ile Ser Leu
35 40 45
Ala Phe Leu Asp Asn Leu Ala Ser Asn Leu Leu Ala Ile Leu His Tyr
50 55 60
Ala Ala Val Ser Val Val Ile Ile Leu Leu Cys Asn Ile Thr Ala Leu
65 70 75 80
Leu Trp Leu Glu Arg Lys Met Pro Trp Arg Ser Leu His Arg Gln Glu
85 90 95
Lys Leu Pro Ser Arg Leu Ala Met Ala Leu Glu Ser Leu Gln Leu Cys
100 105 110
Gly Val Val Val Leu Gly Phe Leu Leu Gly Leu Thr Gly Leu Ser Phe
115 120 125
Leu Gln His Ala Thr Glu Ala Ser Glu Tyr Thr Leu Ile Phe Leu Leu
130 135 140
Phe Leu Val Gly Ile Gln Leu Arg Asn Asn Gly Met Ser Leu Arg Gln
145 150 155 160
Ile Val Leu Asn Arg Arg Gly Met Ile Val Ala Val Val Val Thr Ala
165 170 175
Ser Ser Leu Leu Gly Gly Ile Leu Asn Ala Phe Ile Leu Asp Leu Pro
180 185 190
Leu Lys Thr Gly Leu Ala Met Ala Ser Gly Phe Gly Trp Tyr Ser Leu
195 200 205
Ser Gly Ile Leu Leu Thr Glu Ser Phe Gly Pro Val Ile Gly Ser Ala
210 215 220
Ala Phe Phe Asn Asp Leu Cys Arg Glu Leu Leu Ala Ile Met Leu Ile
225 230 235 240
Pro Gly Leu Ile Arg Arg Ser Arg Ser Thr Ala Leu Gly Leu Cys Gly
245 250 255
Ala Thr Ser Met Asp Phe Thr Leu Pro Val Leu Gln Arg Ser Gly Gly
260 265 270
Val Glu Ile Val Pro Ala Ala Ile Val His Gly Phe Leu Leu Ser Leu
275 280 285
Leu Val Pro Ile Leu Ile Ala Phe Phe Ala Ala
290 295
<210> 89
<211> 900
<212> DNA
<213> 芽生杆菌属WAO
<400> 89
atgaccagtg cttgttcaac caccccagca cgccctgcct ccgcaattga cccaattctt 60
ttatttacgg ttccgtttac cgtagttgca tgggcgagta gctttcctgc aatccgtgca 120
gggctgaccg gtttcggtcc acttgagatg gcagcgctgc gctttgcact ggctggggtc 180
cccgctgccc tgtttctcgt gctgacgcgc gccgcgctcc ccgcgggcac cgacatttgg 240
cgttttctca ccggtggcat cgtcttcatt gccctgtatg ccatcctgct gaatttaggt 300
caacgcgtgg ttccagcagg cgcggcgagt tttattatca acacaaatcc aattatgacc 360
gcggcactgg caatgctgat cttgaacgag cgtttttcgc tggtggcctg gcttgggact 420
actctgtctt tcgccggtat tggtgttatc gcgctgggca atggcctgga tctgaatatc 480
ggcatcagtg tgctgctgat tctcggcgcg gccttttgca atgcaatttc caccgtggtc 540
caaaaaccat tattcgctcg ccacaaaccg ctgagcgtcg cggcttggaa catggcaatt 600
ggcggactgg cgttgagccc ctttctgccg tcagcgctgg aacaaattcc aacggctccg 660
agccaggctc tgtggtcagt tgtctacctg gcggtggtgc cgagtctgat tgcatacggc 720
acgtgggcga tcactctgag ccgtctgcca gcggcacgtg cgtcaaattt tcaatacggt 780
gtgccgccga ctgccatgct gatttccttt atttggttag gagaaatccc gaccgcgctc 840
gggatcctgg gtggtgccat ggctctggcg ggtgtggtga ttgtgaatct caaacgttag 900
<210> 90
<211> 299
<212> PRT
<213> 芽生杆菌属WAO
<400> 90
Met Thr Ser Ala Cys Ser Thr Thr Pro Ala Arg Pro Ala Ser Ala Ile
1 5 10 15
Asp Pro Ile Leu Leu Phe Thr Val Pro Phe Thr Val Val Ala Trp Ala
20 25 30
Ser Ser Phe Pro Ala Ile Arg Ala Gly Leu Thr Gly Phe Gly Pro Leu
35 40 45
Glu Met Ala Ala Leu Arg Phe Ala Leu Ala Gly Val Pro Ala Ala Leu
50 55 60
Phe Leu Val Leu Thr Arg Ala Ala Leu Pro Ala Gly Thr Asp Ile Trp
65 70 75 80
Arg Phe Leu Thr Gly Gly Ile Val Phe Ile Ala Leu Tyr Ala Ile Leu
85 90 95
Leu Asn Leu Gly Gln Arg Val Val Pro Ala Gly Ala Ala Ser Phe Ile
100 105 110
Ile Asn Thr Asn Pro Ile Met Thr Ala Ala Leu Ala Met Leu Ile Leu
115 120 125
Asn Glu Arg Phe Ser Leu Val Ala Trp Leu Gly Thr Thr Leu Ser Phe
130 135 140
Ala Gly Ile Gly Val Ile Ala Leu Gly Asn Gly Leu Asp Leu Asn Ile
145 150 155 160
Gly Ile Ser Val Leu Leu Ile Leu Gly Ala Ala Phe Cys Asn Ala Ile
165 170 175
Ser Thr Val Val Gln Lys Pro Leu Phe Ala Arg His Lys Pro Leu Ser
180 185 190
Val Ala Ala Trp Asn Met Ala Ile Gly Gly Leu Ala Leu Ser Pro Phe
195 200 205
Leu Pro Ser Ala Leu Glu Gln Ile Pro Thr Ala Pro Ser Gln Ala Leu
210 215 220
Trp Ser Val Val Tyr Leu Ala Val Val Pro Ser Leu Ile Ala Tyr Gly
225 230 235 240
Thr Trp Ala Ile Thr Leu Ser Arg Leu Pro Ala Ala Arg Ala Ser Asn
245 250 255
Phe Gln Tyr Gly Val Pro Pro Thr Ala Met Leu Ile Ser Phe Ile Trp
260 265 270
Leu Gly Glu Ile Pro Thr Ala Leu Gly Ile Leu Gly Gly Ala Met Ala
275 280 285
Leu Ala Gly Val Val Ile Val Asn Leu Lys Arg
290 295
<210> 91
<211> 873
<212> DNA
<213> γ变形菌纲细菌
<400> 91
atgcatcctg gccgcggtct gttaaaacgt cactacgtgt ttgctatcac ggcgccggtc 60
ttttggtcac tggccggtgt ggtcgtcaag agtctggaac aggccacgga atggcagatt 120
aatttttacc gttgcttgag tctgactctg tttgtggcgg cagttaccct gattcgctac 180
cgccgttcca cgctggctgt cctgcgcatg ggcggtctga aaaccatcat ttctggcgcg 240
ctgcttagcg gcgcaatgtt atgtaatgtg gtggccctga aatacaccac agtggcagta 300
gcagtctttg taatggcggc agccccgatt ctcgcagctc tgttgggtcg tctgttctta 360
ggcgaagagg tgcgtgcgcg cgtgtgggtt tccattgtgt tggccattct ggggattggg 420
attatggttg gaggtcgcct gcaaatcggt gataccctcg gcgttgcagt agccatcctg 480
ggcatcgtgt tctttggtat ctacgctgtc tctcttcgtg taggcaaaaa tgtggacatg 540
accccggcgg tatttttcgg cggcgccatc ggcacggcag tctcatttag cgtttctgtg 600
ggtactggtg tgggcctggt gattccgtgg atcgaagcaa tgtggtgcac cctgctgggt 660
gtagtgcagt tggggttagg ctcggtcctg ttcgctttgg cagcccaggg cgtgccagcg 720
gtacagttaa ccctgtttgc gctgggtgag ccactgctgg cgccgttatg ggtatggctt 780
atgcttgacg atttgccaac catgaccacc ttgatcggcg gcgccgtgct gtttgcggcg 840
ctggccctgc aagtctctgc aagccgcaaa tag 873
<210> 92
<211> 290
<212> PRT
<213> γ变形菌纲细菌
<400> 92
Met His Pro Gly Arg Gly Leu Leu Lys Arg His Tyr Val Phe Ala Ile
1 5 10 15
Thr Ala Pro Val Phe Trp Ser Leu Ala Gly Val Val Val Lys Ser Leu
20 25 30
Glu Gln Ala Thr Glu Trp Gln Ile Asn Phe Tyr Arg Cys Leu Ser Leu
35 40 45
Thr Leu Phe Val Ala Ala Val Thr Leu Ile Arg Tyr Arg Arg Ser Thr
50 55 60
Leu Ala Val Leu Arg Met Gly Gly Leu Lys Thr Ile Ile Ser Gly Ala
65 70 75 80
Leu Leu Ser Gly Ala Met Leu Cys Asn Val Val Ala Leu Lys Tyr Thr
85 90 95
Thr Val Ala Val Ala Val Phe Val Met Ala Ala Ala Pro Ile Leu Ala
100 105 110
Ala Leu Leu Gly Arg Leu Phe Leu Gly Glu Glu Val Arg Ala Arg Val
115 120 125
Trp Val Ser Ile Val Leu Ala Ile Leu Gly Ile Gly Ile Met Val Gly
130 135 140
Gly Arg Leu Gln Ile Gly Asp Thr Leu Gly Val Ala Val Ala Ile Leu
145 150 155 160
Gly Ile Val Phe Phe Gly Ile Tyr Ala Val Ser Leu Arg Val Gly Lys
165 170 175
Asn Val Asp Met Thr Pro Ala Val Phe Phe Gly Gly Ala Ile Gly Thr
180 185 190
Ala Val Ser Phe Ser Val Ser Val Gly Thr Gly Val Gly Leu Val Ile
195 200 205
Pro Trp Ile Glu Ala Met Trp Cys Thr Leu Leu Gly Val Val Gln Leu
210 215 220
Gly Leu Gly Ser Val Leu Phe Ala Leu Ala Ala Gln Gly Val Pro Ala
225 230 235 240
Val Gln Leu Thr Leu Phe Ala Leu Gly Glu Pro Leu Leu Ala Pro Leu
245 250 255
Trp Val Trp Leu Met Leu Asp Asp Leu Pro Thr Met Thr Thr Leu Ile
260 265 270
Gly Gly Ala Val Leu Phe Ala Ala Leu Ala Leu Gln Val Ser Ala Ser
275 280 285
Arg Lys
290
<210> 93
<211> 900
<212> DNA
<213> 卡氏光杆状菌NC19
<400> 93
atgtattcag gtctgttaat cattttactt ccgcttaccc tgggctattt aattcgtctt 60
aataatcaga ctggcttgaa cgcagtacat cgcctgctca acgcgatggt ttacgtgatt 120
ttattcctga tgggtatctc actggcgctg cttgaagacc tcagccgcaa cttattctca 180
atctttcagt atgccaccgt gttcttctta tgcatttttg cagcgaacat gctggcactg 240
tttttgcttg aaaagcgtga cccgtggatc acgaatagcc ataaacaaga aaaaccgccc 300
tcccgccttc acatgatttt cgaatctctg aaattatgtg gcgttcttat tttgggcttc 360
ttgctggggc tgaccggctg gtcatggctt cattttgcct cactggccag cgagatcgca 420
ttagttgtgc tcttgttact cgtcggcatc cagctgcgca atggcggcat gaaccttaaa 480
caaattctgc tgaaccgtcg cggtacaact attgccctcg ttgtagccgt gtcagccttg 540
gcaggcgggg tagtggccgc gctgattctc gggcttccgg ttaagactgg actggctctg 600
gcttcgggct acggttggta tagtctgtct ggtattttgc tgtccgacgc gtatggacct 660
gtcatcggaa gtgccgcgtt cttcaatgac ctcgcgcgtg agctggcggc tattatgctc 720
atccctgtcc tggtaaaccg ttaccgcagc tcagccatcg gcctgagcgg cgctacgtcc 780
atggatttta ccctgccaat cctgcaacgt tgtggcggtg tatcaatcgt gcctgcggcg 840
atcgtgcatg gtttcttgct gagcctgttg gctccgctgt taattgcctt cttcacgtag 900
<210> 94
<211> 299
<212> PRT
<213> 卡氏光杆状菌NC19
<400> 94
Met Tyr Ser Gly Leu Leu Ile Ile Leu Leu Pro Leu Thr Leu Gly Tyr
1 5 10 15
Leu Ile Arg Leu Asn Asn Gln Thr Gly Leu Asn Ala Val His Arg Leu
20 25 30
Leu Asn Ala Met Val Tyr Val Ile Leu Phe Leu Met Gly Ile Ser Leu
35 40 45
Ala Leu Leu Glu Asp Leu Ser Arg Asn Leu Phe Ser Ile Phe Gln Tyr
50 55 60
Ala Thr Val Phe Phe Leu Cys Ile Phe Ala Ala Asn Met Leu Ala Leu
65 70 75 80
Phe Leu Leu Glu Lys Arg Asp Pro Trp Ile Thr Asn Ser His Lys Gln
85 90 95
Glu Lys Pro Pro Ser Arg Leu His Met Ile Phe Glu Ser Leu Lys Leu
100 105 110
Cys Gly Val Leu Ile Leu Gly Phe Leu Leu Gly Leu Thr Gly Trp Ser
115 120 125
Trp Leu His Phe Ala Ser Leu Ala Ser Glu Ile Ala Leu Val Val Leu
130 135 140
Leu Leu Leu Val Gly Ile Gln Leu Arg Asn Gly Gly Met Asn Leu Lys
145 150 155 160
Gln Ile Leu Leu Asn Arg Arg Gly Thr Thr Ile Ala Leu Val Val Ala
165 170 175
Val Ser Ala Leu Ala Gly Gly Val Val Ala Ala Leu Ile Leu Gly Leu
180 185 190
Pro Val Lys Thr Gly Leu Ala Leu Ala Ser Gly Tyr Gly Trp Tyr Ser
195 200 205
Leu Ser Gly Ile Leu Leu Ser Asp Ala Tyr Gly Pro Val Ile Gly Ser
210 215 220
Ala Ala Phe Phe Asn Asp Leu Ala Arg Glu Leu Ala Ala Ile Met Leu
225 230 235 240
Ile Pro Val Leu Val Asn Arg Tyr Arg Ser Ser Ala Ile Gly Leu Ser
245 250 255
Gly Ala Thr Ser Met Asp Phe Thr Leu Pro Ile Leu Gln Arg Cys Gly
260 265 270
Gly Val Ser Ile Val Pro Ala Ala Ile Val His Gly Phe Leu Leu Ser
275 280 285
Leu Leu Ala Pro Leu Leu Ile Ala Phe Phe Thr
290 295

Claims (35)

1.一种非天然存在的微生物有机体,其包含用于产生6-氨基己酸的途径和编码所述6-氨基己酸的转运体的外源核酸,其中外源转运体将所述6-氨基己酸从细胞输出。
2.根据权利要求1所述的非天然存在的微生物有机体,其中所述非天然存在的生物体产生6-氨基己酸,并且其中所述6-氨基己酸由所述微生物有机体的所述产生与不具有所述外源核酸的微生物有机体相比得到增加。
3.根据权利要求1所述的非天然存在的微生物有机体,其中所述外源转运体选自表16中的一种转运体,其具有大于0.80的相对6ACA输出活性。
4.根据权利要求3所述的非天然存在的微生物有机体,其中所述外源转运体具有大于1.10的相对6ACA输出活性。
5.根据权利要求1所述的非天然存在的微生物有机体,其进一步包含编码转运体的内源核酸的破坏,所述转运体将6-氨基己酸输入所述微生物有机体。
6.根据权利要求5所述的非天然存在的微生物有机体,其中具有所述破坏的所述转运体是在选自由以下组成的群组的基因中:gabP、csiR或一种前述基因的同源物。
7.根据权利要求5所述的非天然存在的微生物有机体,其进一步包含编码谷氨酸脱氢酶的第三外源核酸。
8.根据权利要求7所述的非天然存在的微生物有机体,其中所述谷氨酸脱氢酶是GdhA或其同源物。
9.根据权利要求8所述的非天然存在的微生物有机体,其进一步包含rcsA、cpsB、cpsG或cpsBG的破坏。
10.一种非天然存在的微生物有机体,其包含用于产生6-氨基己酸的途径和具有破坏的基因,其中所述被破坏的基因编码所述6-氨基己酸的内源转运体,其中所述内源转运体将所述6-氨基己酸输入细胞。
11.根据权利要求10所述的非天然存在的微生物有机体,其中所述非天然存在的微生物有机体产生6-氨基己酸,且其中所述6-氨基己酸由所述微生物有机体的所述产生与不具有编码所述内源转运体的基因的破坏的微生物有机体相比得到增加。
12.根据权利要求10所述的非天然存在的微生物有机体,其中具有所述破坏的所述转运体是在选自由以下组成的群组的基因中:gabP、csiR或一种前述基因的同源物。
13.一种非天然存在的微生物有机体,其包含用于产生6-氨基己酸的途径和编码谷氨酸脱氢酶的外源核酸,其中至少一些由所述谷氨酸脱氢酶产生的谷氨酸被产生所述6-氨基己酸的转氨酶使用。
14.根据权利要求13所述的非天然存在的微生物有机体,其中所述谷氨酸脱氢酶选自表17并且具有NADH或NADPH大于100ΔF/min的体外活性。
15.根据权利要求14所述的非天然存在的微生物有机体,其中所述谷氨酸脱氢酶选自表17并且具有NADH或NADPH为100-500ΔF/min的体外活性。
16.根据权利要求14所述的非天然存在的微生物有机体,其中所述谷氨酸脱氢酶选自表17并且具有NADH或NADPH大于500ΔF/min的体外活性。
17.一种非天然存在的微生物有机体,其包含用于产生6-氨基己酸的途径和rscA、cpsB、cpsG或cpsBG的破坏,其中所述rcsA、所述cpsB、所述cpsG或所述cpsBG的所述破坏会减少所述微生物有机体的粘液表型。
18.根据权利要求17所述的非天然存在的微生物有机体,其中所述破坏使6-氨基己酸的产生与不具有所述破坏的非天然存在的微生物有机体相比得到增加。
19.一种非天然存在的微生物有机体,其包含用于产生C6产物的途径,其中所述非天然存在的微生物有机体包含编码所述C6产物的转运体的外源核酸,其中所述转运体将所述C6产物从细胞输出。
20.根据权利要求19所述的非天然存在的微生物有机体,其中所述C6产物由所述微生物有机体的产生与不具有所述外源核酸的所述非天然存在的微生物有机体相比得到增加。
21.一种非天然存在的微生物有机体,其包含用于产生C5-C14产物的途径和编码所述C5-C14产物的转运体的外源核酸,其中所述转运体将所述C5-C14产物从细胞输出。
22.根据权利要求21所述的非天然存在的微生物有机体,其中所述C5-C14产物由所述微生物有机体的所述产生与不具有所述外源核酸的所述非天然存在的微生物有机体相比得到增加。
23.一种用于产生6-氨基己酸的方法,其包含以下步骤:提供根据权利要求1所述的非天然存在的微生物有机体;和在培养基中,在产生所述6-氨基己酸的条件下培养所述非天然存在的微生物有机体。
24.根据权利要求23所述的方法,其进一步包含将所述6-氨基己酸从微生物有机体转运到所述培养基中的步骤。
25.根据权利要求24所述的方法,其中外源核酸编码选自表16的转运体,所述转运体具有大于1.10的相对6ACA输出活性。
26.根据权利要求23所述的方法,其中所述非天然存在的微生物有机体进一步包含编码转运体的基因的破坏,所述转运体将6-氨基己酸输入所述微生物有机体。
27.根据权利要求26所述的方法,其中所述基因是gabP或csiR。
28.根据权利要求23所述的方法,其中所述非天然存在的微生物有机体进一步包含编码谷氨酸脱氢酶的外源核酸。
29.根据权利要求23所述的方法,其中所述非天然存在的微生物有机体进一步包含rscA、cpsB、cpsG或cpsBG的破坏。
30.一种用于产生6-氨基己酸的方法,其包含以下步骤:提供根据权利要求13所述的非天然存在的微生物有机体;在培养基中,在产生所述6-氨基己酸的条件下培养所述非天然存在的微生物有机体;以及将所述6-氨基己酸从微生物有机体转运到所述培养基中。
31.根据权利要求30所述的方法,其中谷氨酸脱氢酶选自表17并且具有NADH或NADPH大于100ΔF/min的体外活性。
32.根据权利要求31所述的方法,其中所述谷氨酸脱氢酶选自表17并且具有NADH或NADPH为100-500ΔF/min的体外活性。
33.根据权利要求31所述的方法,其中所述谷氨酸脱氢酶选自表17并且具有NADH或NADPH大于500ΔF/min的体外活性。
34.一种用于产生C6产物的方法,其包含以下步骤:提供根据权利要求19所述的非天然存在的微生物有机体;在培养基中,在产生所述C6产物的条件下培养所述非天然存在的微生物有机体;以及将所述C6产物从微生物有机体转运到所述培养基中。
35.一种用于产生C5-C14产物的方法,其包含以下步骤:提供根据权利要求21所述的非天然存在的微生物有机体;在培养基中,在产生所述C5-C14产物的条件下培养所述非天然存在的微生物有机体;以及将所述C5-C14产物从微生物有机体转运到所述培养基中。
CN202280009979.1A 2021-01-17 2022-01-15 用于制备酰胺化合物的方法和组合物 Pending CN116783281A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163138495P 2021-01-17 2021-01-17
US63/138,495 2021-01-17
PCT/US2022/012644 WO2022155554A1 (en) 2021-01-17 2022-01-15 Methods and compositions for making amide compounds

Publications (1)

Publication Number Publication Date
CN116783281A true CN116783281A (zh) 2023-09-19

Family

ID=82448698

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280009979.1A Pending CN116783281A (zh) 2021-01-17 2022-01-15 用于制备酰胺化合物的方法和组合物

Country Status (4)

Country Link
EP (1) EP4277976A1 (zh)
JP (1) JP2024503868A (zh)
CN (1) CN116783281A (zh)
WO (1) WO2022155554A1 (zh)

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19548222A1 (de) * 1995-12-22 1997-06-26 Forschungszentrum Juelich Gmbh Verfahren zur mikrobiellen Herstellung von Aminosäuren durch gesteigerte Aktivität von Exportcarriern
EP2265709B1 (en) 2008-03-27 2017-11-08 Genomatica, Inc. Microorganisms for the production of adipic acid and other compounds
US8404465B2 (en) * 2009-03-11 2013-03-26 Celexion, Llc Biological synthesis of 6-aminocaproic acid from carbohydrate feedstocks
AU2012273093A1 (en) * 2011-06-22 2013-05-02 Genomatica, Inc. Microorganisms for producing 6-aminocaproic acid
EP3517631B9 (en) * 2011-12-16 2023-10-04 Inbiose N.V. Mutant microorganisms to synthesize ph sensitive molecules and organic acids
JP2016165225A (ja) * 2013-07-09 2016-09-15 味の素株式会社 有用物質の製造方法
JP6553610B2 (ja) * 2013-12-05 2019-07-31 アールイージー ライフ サイエンシズ リミテッド ライアビリティ カンパニー 脂肪アミンの微生物生産方法
EP3141610A1 (en) * 2015-09-12 2017-03-15 Jennewein Biotechnologie GmbH Production of human milk oligosaccharides in microbial hosts with engineered import / export

Also Published As

Publication number Publication date
JP2024503868A (ja) 2024-01-29
WO2022155554A1 (en) 2022-07-21
EP4277976A1 (en) 2023-11-22

Similar Documents

Publication Publication Date Title
JP7370366B2 (ja) アジペート、ヘキサメチレンジアミン、及び6-アミノカプロン酸の生合成のための微生物及び方法
CN107384846B (zh) 生产1,4-丁二醇的微生物和相关方法
CN106119112B (zh) 用于产生己二酸和其他化合物的微生物
TW201002824A (en) Adipate (ester or thioester) synthesis
US20220235385A1 (en) Engineered microorganisms and methods for improved aldehyde dehydrogenase activity
CN110730820A (zh) 醛脱氢酶变体和使用方法
US20230348865A1 (en) Engineered enzymes and methods of making and using
CN116783281A (zh) 用于制备酰胺化合物的方法和组合物
WO2023076966A1 (en) Engineered enzymes and methods of making and using
TW201033370A (en) Adipate (ester or thioester) synthesis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination