CN114269908A - 工程化反式烯酰coa还原酶及其制备方法和使用方法 - Google Patents

工程化反式烯酰coa还原酶及其制备方法和使用方法 Download PDF

Info

Publication number
CN114269908A
CN114269908A CN202080046640.XA CN202080046640A CN114269908A CN 114269908 A CN114269908 A CN 114269908A CN 202080046640 A CN202080046640 A CN 202080046640A CN 114269908 A CN114269908 A CN 114269908A
Authority
CN
China
Prior art keywords
ala
gly
val
glu
leu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080046640.XA
Other languages
English (en)
Inventor
阿米特·M·沙阿
哈里什·纳加拉让
迈克尔·A·诺博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Genomatica Inc
Original Assignee
Genomatica Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Genomatica Inc filed Critical Genomatica Inc
Publication of CN114269908A publication Critical patent/CN114269908A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/001Amines; Imines
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0008Oxidoreductases (1.) acting on the aldehyde or oxo group of donors (1.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/001Oxidoreductases (1.) acting on the CH-CH group of donors (1.3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1096Transferases (2.) transferring nitrogenous groups (2.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/005Amino acids other than alpha- or beta amino acids, e.g. gamma amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/02Oxygen as only ring hetero atoms
    • C12P17/08Oxygen as only ring hetero atoms containing a hetero ring of at least seven ring members, e.g. zearalenone, macrolide aglycons
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/10Nitrogen as only ring hetero atom
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/18Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic polyhydric
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/40Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/40Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
    • C12P7/44Polycarboxylic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/62Carboxylic acid esters
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y102/00Oxidoreductases acting on the aldehyde or oxo group of donors (1.2)
    • C12Y102/01Oxidoreductases acting on the aldehyde or oxo group of donors (1.2) with NAD+ or NADP+ as acceptor (1.2.1)
    • C12Y102/01003Aldehyde dehydrogenase (NAD+) (1.2.1.3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y103/00Oxidoreductases acting on the CH-CH group of donors (1.3)
    • C12Y103/01Oxidoreductases acting on the CH-CH group of donors (1.3) with NAD+ or NADP+ as acceptor (1.3.1)
    • C12Y103/01044Trans-2-enoyl-CoA reductase (NAD+) (1.3.1.44)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y206/00Transferases transferring nitrogenous groups (2.6)
    • C12Y206/01Transaminases (2.6.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y103/00Oxidoreductases acting on the CH-CH group of donors (1.3)
    • C12Y103/01Oxidoreductases acting on the CH-CH group of donors (1.3) with NAD+ or NADP+ as acceptor (1.3.1)
    • C12Y103/01038Trans-2-enoyl-CoA reductase (NADPH) (1.3.1.38)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

公开了反式烯酰CoA还原酶(TER)酶和编码它们的核酸。在某些情况下,TER酶是非天然的工程化反式烯酰CoA还原酶。还公开了增强或改善6‑氨基己酸、己二胺、己酸、己内酯或己内酰胺的生物合成的生物合成方法和工程化微生物体。工程化微生物体包括外源性TER,在某些情况下也包括工程化TER。

Description

工程化反式烯酰COA还原酶及其制备方法和使用方法
相关申请的交叉引用
本申请要求于2019年4月24日提交的序列号为62/837,888、2019年6月11日提交的序列号为62/860,123、和2019年6月11日提交序列号为62/860,160的美国临时专利申请的权益,其内容通过引用整体并入本文。
并入序列表
本申请包含名为“GNO0098WO Sequence Listing.txt”的序列表,该序列表创建于2020年4月22日,大小为151KB。该序列表通过引用并入本文。
背景技术
尼龙是可通过二胺与二羧酸的缩聚或内酰胺的缩聚来合成的聚酰胺。尼龙6,6是由己二胺(Hexamethylenediamine,HMD)和己二酸反应产生的,而尼龙6是由己内酰胺开环聚合产生的。因此,己二酸、己二胺和己内酰胺是尼龙生产中的重要中间体。
微生物体已被工程化以生产一些尼龙中间体。然而,由于不希望的对途径中间体和最终产品的酶活性,工程化微生物体会产生不希望的副产物。因此,此类副产物和杂质增加了生物合成化合物的成本和复杂性,并且可能降低所需产物的效率或产率。
发明内容
本文提供了能够将5-羧基-2-戊烯酰-CoA(5-carboxy-2-pentenoyl-CoA,CPCoA)底物转化为己二酰-CoA产物的非天然存在的工程化反式烯酰CoA还原酶(Trans-enoyl CoAreductase,TER)。
本文还提供了具有6-氨基己酸途径、己内酰胺途径、己二胺途径、己内酯途径、1,6-己二醇途径或这些途径中的一种或多种的组合的非天然存在的微生物有机体。非天然存在的微生物有机体包含编码TER酶的至少一种外源核酸,该TER酶与5-羧基-2-戊烯酰-CoA(CPCoA)底物反应形成己二酰CoA。与巴豆酰CoA相比,TER酶对CPCoA底物具有更好的活性、更高的催化效率或其组合。
非天然存在的微生物有机体可以进一步包含编码产生6-氨基己酸、1,6-己二醇、己内酯、己内酰胺、己二胺所需的酶的另外的外源核酸,酶的量足以产生相应的产物。在一些情况下,这些外源核酸中的一种或多种对于微生物有机体可以是异源的。
还公开了产生6-氨基己酸、1,6-己二醇、己内酯、己内酰胺、己二胺的方法。该方法可包括培养产生6-氨基己酸、1,6-己二醇、己内酯、己内酰胺和/或己二胺的非天然存在的微生物有机体,其中该微生物有机体表达编码反式烯酰CoA还原酶的至少一种外源核酸,该反式烯酰CoA还原酶与5-羧基-2-戊烯酰-CoA(CPCoA)底物反应形成己二酰CoA。该方法包括在产生6-氨基己酸、1,6-己二醇、己内酯、己内酰胺、己二胺的条件下培养非天然存在的微生物有机体足够长的时间。
在一方面是包含与SEQ ID NO:1、4-9、11、14、15或17-26中任一个的至少25个或更多个连续氨基酸具有至少50%序列同一性的氨基酸序列的TER。
在一方面,工程化TER包含SEQ ID NO:1或SEQ ID NO:24的氨基酸的至少一个改变。在一些实施方式中,工程化TER酶在SEQ ID NO:1或SEQ ID NO:24的一个或多个氨基酸位置处包含一个或多个氨基酸改变。在一些实施方式中,工程化TER酶包含对应于相关野生型序列的至少两个、三个、四个、五个、六个、七个、八个或更多个氨基酸置换。在一些实施方式中,氨基酸置换是保守置换。在一些实施方式中,氨基酸置换是非保守置换。在一些实施方式中,与巴豆酰-CoA作为底物相比,工程化TER对5-羧基-2-戊烯酰-CoA作为底物具有更高的催化效率。
在一方面,工程化TER在对应于SEQ ID NO:1的氨基酸改变和氨基酸位置的残基Q11、A39、S48、Q52、S59、G97、S103、H104、V105、N106、F107、I147、S148、V149、L152、L156、R200、D201、R202、V301、T302、E303、K306、N307、N308、L316或其组合的一个或多个氨基酸位置处具有一个或多个氨基酸改变。在一些实施方式中,工程化TER具有在下表5和表6F中公开的一个或多个氨基酸置换。
在一方面,工程化TER具有选自对应于SEQ ID NO:24的残基S96、L98、M274、T275的位置的氨基酸的改变。在一些实施方式中,工程化TER包含一个或多个氨基酸置换:对应于SEQ ID NO:24的S96G、L98M、M274R、T275R。
在一方面,选择的和工程化的TER与5-羧基-2-戊烯酰-CoA反应形成己二酰-CoA。在一些实施方式中,工程化TER包含比没有氨基酸改变的SEQ ID NO:1或SEQ ID NO:24的反式烯酰CoA还原酶的活性高至少20%的活性。
在一方面,TER酶优先使用NADH作为辅因子。在其他方面,TER酶优先使用NADPH作为辅因子。
在一方面是一种非天然存在的微生物有机体,包含至少一种外源酶,该至少一种外源酶包含将5-羧基-2-戊烯酰-CoA转化为己二酰CoA的TER,该TER选自:
(i)包含SEQ ID NO:1、4-9、11、14、15或17-26的氨基酸序列的TER;(ii)包含与SEQID NO:1、4-9、11、14、15或17-26中任一个的至少25个或更多个连续氨基酸具有至少50%序列同一性的氨基酸序列的TER;和(iii)SEQ ID NO:1或24的工程化TER。
在一些实施方式中,包含编码TER的外源酶的非天然存在的微生物有机体还包含编码3-氧代己二酰-CoA硫解酶、3-氧代己二酰-CoA脱氢酶和3-氧代己二酰-CoA脱水酶的基因。在一些实施方式中,非天然存在的微生物有机体能够比表达野生型TER的对照细胞多产生至少10%的己二酸。
在一方面,提供了包含编码工程化TER的核酸序列的重组核酸分子。在一些实施方式中,工程化TER与异源启动子可操作地连接。在一些实施方式中,载体包含重组核酸分子。
在一方面,提供了产生己二酰CoA的方法,包括将上述方面和实施方式中任一项的非天然存在的微生物体在足够的时间和条件下进行培养以产生己二酰CoA。
在一方面,提供了产生6-氨基己酸(6-aminocaproic acid,6ACA)的方法,包括将上述方面和实施方式中任一项的非天然存在的微生物有机体在足够的时间和条件下进行培养以产生6ACA。在一些实施方式中,该方法进一步包括从微生物有机体、发酵液或两者中回收6ACA。
在一方面,提供了产生己二胺的方法,包括将上述方面和实施方式中任一项的非天然存在的微生物有机体在足够的时间和条件下进行培养以产生己二胺。在一些实施方式中,该方法进一步包括从微生物有机体、发酵液或两者中回收己二胺。在一些实施方式中,非天然存在的微生物有机体包含各自编码己二胺途径酶的两个、三个、四个、五个、六个或七个外源核酸序列。
在一方面,提供了产生6-氨基己酸、1,6-己二醇、己内酯、己内酰胺、己二胺的方法,包括将上述方面和实施方式中任一项的非天然存在的微生物有机体在足够的时间和条件下进行培养以产生6-氨基己酸、1,6-己二醇、己内酯、己内酰胺、己二胺。在一些实施方式中,该方法进一步包括从微生物有机体、发酵液或两者中回收己内酰胺。在一些实施方式中,非天然存在的微生物有机体包含各自编码6-氨基己酸、1,6-己二醇、己内酯、己内酰胺、己二胺途径酶的两个、三个、四个、五个、六个或七个外源核酸序列。
在一方面,提供了使用上述公开的方法合成的生物来源的6-氨基己酸、己二胺或己内酰胺。
在一些实施方式中,非天然存在的微生物有机体的TER酶对CPCoA底物比对巴豆酰-CoA底物具有更高的催化效率。在一些实施方式中,TER酶对CPCoA底物的催化效率是对巴豆酰-CoA底物的催化效率的至少两倍。
在一些实施方式中,非天然存在的微生物有机体的醛脱氢酶进一步与6-氨基己酰-CoA反应以形成6-氨基己酸半醛。
在一些实施方式中,相比于对照微生物有机体,包含编码TER酶的至少一种外源核酸的非天然存在的微生物有机体将更多的CPCoA转化为己二酰CoA,所述对照微生物有机体除了不包含编码TER酶的外源核酸之外与所述非天然存在的微生物有机体基本上相同。
在一些实施方式中,相比于野生型微生物有机体,包含编码TER酶的至少一种外源核酸的非天然存在的微生物有机体将更多的CPCoA转化为己二酰CoA,所述野生型微生物有机体除了不包含编码工程化TER酶的外源核酸之外与所述非天然存在的微生物有机体基本上相同。
在一些实施方式中,编码与CPCoA反应形成己二酰-CoA的TER酶的至少一种外源核酸对于微生物有机体是异源的。
在一些实施方式中,非天然存在的微生物有机体包含6-氨基己酸途径。在一些实施方式中,6-氨基己酸途径包括:(i)转氨酶;(ii)6-氨基己酸脱氢酶;或(iii)转氨酶和6-氨基己酸脱氢酶。在一些实施方式中,非天然存在的微生物有机体还包含编码6-氨基己酸途径酶中的一种或多种的一种或多种另外的外源核酸。在一些实施方式中,编码6-氨基己酸途径酶中的一种或多种的外源核酸对于微生物有机体是异源的。
在一些实施方式中,非天然存在的微生物有机体包含己二胺途径。在一些实施方式中,己二胺途径包括:(i)6-氨基己酰CoA转移酶;(ii)6-氨基己酰CoA合酶;(iii)6-氨基己酰CoA还原酶;(iv)己二胺转氨酶;(v)己二胺脱氢酶;或酶(i)至(vi)中的一种或多种的组合。在一些实施方式中,微生物有机体还包含编码己二胺途径酶中的一种或多种的一种或多种另外的外源核酸,所述己二胺途径酶例如将6-氨基己酸转化为6-氨基己酸半醛的羧酸还原酶(Carboxylic acid reductase,CAR)。6-氨基己酸半醛随后可转化为己二胺。在一些实施方式中,编码一种或多种己二胺途径酶的外源核酸对于微生物有机体是异源的。
在一些实施方式中,非天然存在的微生物有机体包含己内酰胺途径。在一些实施方式中,己内酰胺途径包含氨基水解酶。在一些实施方式中,微生物有机体还包含编码氨基水解酶的一种或多种另外的外源核酸。在一些实施方式中,编码氨基水解酶的外源核酸对于微生物有机体是异源的。
在一些实施方式中,非天然存在的微生物有机体包含1,6-己二醇途径。在一些实施方式中,1,6-己二醇途径包含以下的酶:催化6ACA转化为6-氨基己酰-CoA的6-氨基己酰-CoA转移酶或合成酶;催化6-氨基己酰-CoA转化为6-氨基己酸半醛的6-氨基己酰-CoA还原酶;催化6-氨基己酸半醛转化为6-氨基己醇的6-氨基己酸半醛还原酶;催化6ACA转化为6-氨基己酸半醛的6-氨基己酸还原酶;己二酰-CoA还原酶,己二酰-CoA至己二酸半醛;催化己二酸半醛转化为6-羟基己酸的己二酸半醛还原酶;催化6-羟基己酸转化为6-羟基己酰-CoA的6-羟基己酰-CoA转移酶或合成酶;催化6-羟基己酰-CoA转化为6-羟基己醛的6-羟基己酰-CoA还原酶;催化6-羟基己醛转化为HDO的6-羟基己醛还原酶;催化6-氨基己醇转化为6-羟基己醛的6-氨基己醇氨基转移酶或氧化还原酶;催化6-羟基己酸转化为6-羟基己醛的6-羟基己酸还原酶;催化ADA转化为己二酸半醛的己二酸还原酶;和催化己二酰-CoA转化为ADA的己二酰-CoA转移酶、水解酶或合酶。
在一些实施方式中,非天然存在的微生物有机体包含从己二酸或己二酰-CoA到己内酯的途径。在一些实施方式中,从己二酸或己二酰-CoA到己内酯的途径包括以下酶:己二酸-CoA还原酶、己二酸半醛还原酶、6-羟基己酰-CoA转移酶或合成酶、6-羟基己酰-CoA环化酶或自发环化、己二酸还原酶、己二酰-CoA转移酶、合成酶或水解酶、6-羟基己酸环化酶、6-羟基己酸激酶、6-羟基己酰磷酸环化酶或自发环化、磷酸反式-6-羟基己酰化酶。
在一些实施方式中,非天然存在的微生物有机体的TER源自原核物种。在一些实施方式中,TER酶是表3中所示的衍生物种。
在一些实施方式中,非天然存在的微生物有机体包括不动杆菌属(Acinetobacter)、放线杆菌属(Actinobacillus)、厌氧螺菌属(Anaerobiospirillum)、曲霉属(Aspergillus)、芽孢杆菌属(Bacillus)、梭菌属(Clostridium)、棒状杆菌属(Corynebacterium)、埃希氏菌属(Escherichia)、葡糖杆菌属(Gluconobacter)、克雷伯氏菌属(Klebsiella)、克鲁维酵母属(Kluyveromyces)、乳球菌属(Lactococcus)、乳杆菌属(Lactobacillus)、曼氏杆菌属(Mannheimia)、毕赤酵母属(Pichia)、假单胞菌属(Pseudomonas)、根瘤菌属(Rhizobium)、根霉属(Rhizopus)、酵母菌属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、链霉菌属(Streptomyces)和发酵单胞菌属(Zymomonas)的物种。在一些实施方式中,非天然存在的微生物有机体是大肠杆菌的菌株。
在一些实施方式中,培养在包含糖的发酵液中进行。
附图说明
图1示出了从琥珀酰-CoA和乙酰-CoA到6-氨基己酸、己二胺(HMDA)和己内酰胺的示例性途径。酶如下定名:A)3-氧代己二酰-CoA硫解酶;B)3-氧代己二酰-CoA还原酶;C)3-羟基己二酰-CoA脱水酶;D)5-羧基-2-戊烯酰-CoA还原酶;E)3-氧代己二酰-CoA/酰基-CoA转移酶,F)3-氧代己二酰-CoA合酶;G)3-氧代己二酰-CoA水解酶;H)3-氧代己二酸还原酶;I)3-羟基己二酸脱水酶;J)5-羧基-2-戊烯酸还原酶;K)己二酰-CoA/酰基-CoA转移酶;L)己二酰-CoA合酶;M)己二酰-CoA水解酶;N)己二酰-CoA还原酶(醛形成);O)6-氨基己酸转氨酶;P)6-氨基己酸脱氢酶;Q)6-氨基己酰-CoA/酰基-CoA转移酶;R)6-氨基己酰-CoA合酶;S)酰胺水解酶;T)自发环化;U)6-氨基己酰-CoA还原酶(醛形成);V)HMDA转氨酶;W)HMDA脱氢酶;X)己二酸还原酶;Y)己二酸激酶;Z)己二酰基磷酸还原酶;
图2是野生型SEQ ID NO:1到SEQ ID NO:1的变体的体内己二酸生产的图示。体内己二酸浓度以nM为单位;
图3示出了SEQ ID NO:1(假丝酵母属(Candida))和SEQ ID NO:24(果蝇属(Drosophila))的TER氨基酸序列比对;
图4示出了使用赖氨酸作为起点合成6-氨基己酸和己二酸的示例性途径;
图5示出了使用己二酰-CoA作为起点的示例性己内酰胺合成途径;
图6示出从丙酮酸和琥珀酸半醛到6-氨基己酸的示例性途径。酶为:A)HODH醛缩酶,B)OHED水合酶;C)OHED还原酶;D)2-OHD脱羧酶;E)己二酸半醛氨基转移酶和/或己二酸半醛氧化还原酶(胺化);F)OHED脱羧酶;G)6-OHE还原酶;H)2-OHD氨基转移酶和/或2-OHD氧化还原酶(胺化);I)2-AHD脱羧酶;J)OHED氨基转移酶和/或OHED氧化还原酶(胺化);K)2-AHE还原酶;L)HODH甲酸裂解酶和/或HODH脱氢酶;M)3-羟基己二酰-CoA脱水酶;N)2,3-脱氢己二酰-CoA还原酶;O)己二酰-CoA脱氢酶;P)OHED甲酸裂解酶和/或OHED脱氢酶;Q)2-OHD甲酸裂解酶和/或2-OHD脱氢酶。缩写为:HODH=4-羟基-2-氧代庚烷-1,7-二酸,OHED=2-氧代庚-4-烯-1,7-二酸,2-OHD=2-氧代庚烷-1,7-二酸,2-AHE=2-氨基庚-4-烯-1,7-二酸,2-AHD=2-氨基庚烷-1,7-二酸以及6-OHE=6-氧代己-4-烯酸;
图7示出了从6-氨基己酸到己二胺的示例性途径。酶为:A)6-氨基己酸激酶;B)6-AHOP氧化还原酶;C)6-氨基己酸半醛氨基转移酶和/或6-氨基己酸半醛氧化还原酶(胺化);D)6-氨基己酸N-乙酰转移酶;E)6-乙酰胺基己酸激酶;F)6-AAHOP氧化还原酶;G)6-乙酰胺基己醛氨基转移酶和/或6-乙酰胺基己醛氧化还原酶(胺化);H)6-乙酰胺基己胺N-乙酰转移酶和/或6-乙酰胺基己胺水解酶(酰胺);I)6-乙酰胺基己酸CoA转移酶和/或6-乙酰胺基己酸CoA连接酶;J)6-乙酰胺基己酰CoA氧化还原酶;K)6-AAHOP酰基转移酶;L)6-AHOP酰基转移酶;M)6-氨基己酸CoA转移酶和/或6-氨基己酸CoA连接酶;N)6-氨基己酰-CoA氧化还原酶。缩写为:6-AAHOP=[(6-乙酰胺基己酰基)氧基]膦酸,以及6-AHOP=[(6-氨基己酰基)氧基]膦酸;
图8示出了通向1,6-己二醇的示例性生物合成途径。A)是催化6ACA转化为6-氨基己酰-CoA的6-氨基己酰-CoA转移酶或合成酶;B)是催化6-氨基己酰-CoA转化为6-氨基己酸半醛的6-氨基己酰-CoA还原酶;C)是催化6-氨基己酸半醛转化为6-氨基己醇的6-氨基己酸半醛还原酶;D)是催化6ACA转化为6-氨基己酸半醛的6-氨基己酸还原酶;E)是己二酰-CoA还原酶,己二酰-CoA至己二酸半醛;F)是催化己二酸半醛转化为6-羟基己酸的己二酸半醛还原酶;G)是催化6-羟基己酸转化为6-羟基己酰-CoA的6-羟基己酰-CoA转移酶或合成酶;H)是催化6-羟基己酰-CoA转化为6-羟基己醛的6-羟基己酰-CoA还原酶;I)是催化6-羟基己醛转化为HDO的6-羟基己醛还原酶;J)是催化6-氨基己醇转化为6-羟基己醛的6-氨基己醇氨基转移酶或氧化还原酶;K)是催化6-羟基己酸转化为6-羟基己醛的6-羟基己酸还原酶;L)催化ADA转化为己二酸半醛的己二酸还原酶;和M)是催化己二酰-CoA转化为ADA的己二酰-CoA转移酶、水解酶或合酶。
图9示出了从己二酸或己二酰-CoA到己内酯的示例性途径。酶是:A.己二酰-CoA还原酶;B.己二酸半醛还原酶;C.6-羟基己酰-CoA转移酶或合成酶;D.6-羟基己酰-CoA环化酶或自发环化;E.己二酸还原酶;F.己二酰-CoA转移酶、合成酶或水解酶;G.6-羟基己酸环化酶;H.6-羟基己酸激酶;I.6-羟基己酰磷酸环化酶或自发环化;J.磷酸反式-6-羟基己酰化酶。
具体实施方式
除非另有定义,否则本文使用的所有技术和科学术语均具有如本发明所属的领域中的普通技术人员通常所理解的相同的含义。在本发明的实践中可以使用与本文描述的那些相似或等效的任何方法、装置和材料。提供以下定义是为了便于理解本文中经常使用的某些术语,而不是旨在限制本公开的范围。本文引用的所有参考文献都以引用方式整体并入本文。
反式烯酰CoA还原酶(TER)可还原5-羧基-2-戊烯酰-CoA(CPCoA)底物以形成己二酰CoA。该酶可用于产生尼龙中间体的各种途径。然而,许多TER对CPCoA的活性很低,可减少更长链的碳烯酰-CoA底物,并且可与巴豆酰-CoA反应生成丁酰-CoA。
描述了经鉴定对CPCoA具有活性的TER酶。在一些实施方式中,所公开的TER酶可使用CPCoA和巴豆酰-CoA作为底物。在一些实施方式中,公开的TER酶是非天然变体。在一些实施方式中,与它们的野生型对应物相比,变体TER酶对CPCoA作为底物具有更高的亲和力。
在一个实施方式中,鉴定了由Ter基因(SEQ ID NO:1)编码的来自热带假丝酵母菌(Candida topicalis)的TER酶。为了鉴定其他TER酶,使用了SEQ ID NO:1。同源酶的鉴定如表3所示。
在一些实施方式中,与相关的野生型酶(即,未修饰的酶)相比,一些经鉴定的TER被工程化为对5-羧基-2-戊烯酰-CoA(CPCoA)底物具有更高的催化效率和活性。在一些实施方式中,与巴豆酰CoA底物相比,TER对5-羧基-2-戊烯酰-CoA底物具有更好的催化功效和活性。这提高了效率,并进而提高了尼龙中间体的生产。
还描述了被工程化为表达外源性TER酶的非天然存在的微生物有机体,与其未修饰的野生型TER(例如SEQ ID NO:1或24)相比,该外源性TER酶对5-羧基-2-戊烯酰-CoA底物的催化效率和活性更好,或与巴豆酰-CoA相比,该外源性TER酶对CPCoA底物的催化效率和活性更好。
在一些实施方式中,5-反式烯酰基CoA还原酶或序列通过BLAST鉴定。在一些实施方式中,反式烯酰CoA还原酶与表3的TER的氨基酸序列中的至少25、50、75、100、150、200、250、300个或更多个连续氨基酸具有40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的序列同一性。
在一些实施方式中,5-反式烯酰基CoA还原酶或序列通过BLAST鉴定。在一些实施方式中,反式烯酰CoA还原酶与氨基酸序列SEQ ID NO:1、4-9、11、14、15或17-26中的至少25、50、75、100、150、200、250、300个或更多个连续氨基酸具有40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的序列同一性。
反式烯酰CoA还原酶具有保守结构域。基于多序列比对和隐马尔可夫模型(HiddenMarkov model,HMM),TER酶被分组到欧洲生物信息学研究所(European BioinformaticsInstitute)的Pfam数据库(pfam.xfam.org)的Pfam PF00107中。
在一些实施方式中,与巴豆酰-CoA相比,当5-羧基-2-戊烯酰-CoA作为底物时,工程化TER酶具有更高的催化效率和/或活性。在一些实施方式中,反式烯酰CoA还原酶包含与SEQ ID NO:1、4-9、11、14、15或17-26中任一个的至少25、50、75、100、150、200、250、300或更多个连续氨基酸具有至少约50%氨基酸序列同一性的氨基酸序列。在一些实施方式中,与5-羧基-2-戊烯酰-CoA反应形成己二酰-CoA的反式烯酰CoA还原酶的氨基酸序列选自SEQID NO:1、4-9、11、14、15或17-26的氨基酸序列。
在一些实施方式中,与巴豆酰-CoA底物相比,TER酶对5-羧基-2-戊烯酰-CoA底物至少具有至少1.5X、至少2.5X、5X、至少10X、至少25X或1.5X-25X的催化效率。
在一些实施方式中,在已知标准条件下,反式烯酰-CoA还原酶对5-羧基-2-戊烯酰-CoA的酶促转化比该酶对巴豆酰-CoA的酶活性高至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%或至少90%。
在一些实施方式中,反式烯酰-CoA还原酶被工程化为具有比其相应的野生型序列更高的对CPCoA底物的特异性,或对CPCoA比对巴豆酰-CoA底物具有更高的特异性。
如本文所用,当在多肽或核酸的上下文中使用时,“工程化的”或“变体”是指与未修饰的野生型相比在氨基酸位置或核酸位置具有至少一个变异或改变的序列。
在一些实施方式中,工程化TER具有SEQ ID NO:1或SEQ ID NO:24的氨基酸的至少一个改变。
在一些实施方式中,通过检查蛋白质的晶体结构来鉴定SEQ ID NO:1或24中突变的氨基酸位置,并且使编码SEQ ID NO:1或24的基因在选定的氨基酸位置进行饱和诱变。鉴定了催化相关残基,可以对催化相关残基进行改变以提供具有比野生型(未修饰的)SEQ IDNO:1或SEQ ID NO:24更好的活性的变体氨基酸。
在一些实施方式中,反式烯酰CoA还原酶被工程化为具有比其相应的野生型更高的对CPCoA底物的特异性。与其相应的野生型相比,具有更高的对CPCoA底物的特异性的工程化TER是SEQ ID NO:1的变体并且被编号为变体编号2-69、85、100-103、106-111或其组合。在一些实施方式中,与其相应的野生型相比,具有更高的对CPCoA底物的特异性的工程化TER是SEQ ID NO:1的变体并且被编号为变体编号2、3、4、9、19、22、23、32、37、38、39、40、46、48、51、53、85、100、101、102、103、106、107、108、109、110或111或其组合。
在一些实施方式中,工程化的反式烯酰CoA还原酶在氨基酸位置和氨基酸改变的如表5和表6所示的一个或多个氨基酸位置或其组合处的一个或多个氨基酸被取代。
在一些实施方式中,TER优选是NADPH并且选自SEQ ID NO:1的变体编号2-68、106、11或其组合。
在一些实施方式中,TER优选是NADH并且选自SEQ ID NO:1的变体编号85、100-105、107、108或其组合。
在一些实施方式中,工程化TER具有氨基酸序列的改变,该氨基酸序列的改变具有相对于SEQ ID NO:1或SEQ ID NO:24的氨基酸的至少一个、二个、至少三个、至少四个、至少五个、至少六个、至少七个或至少八个改变。
在一些实施方式中,工程化TER具有至少一个氨基酸改变,该至少一个氨基酸改变选自对应于SEQ ID NO:1的氨基酸位置和氨基酸改变的残基Q11、A39、S48、Q52、S59、G97、S103、H104、V105、N106、F107、I147、S148、V149、L152、L156、R200、D201、R202、V301、T302、E303、K306、N307、N308、L316及其组合的一个或多个位置。
在一些实施方式中,工程化TER具有一个或多个氨基酸改变,该一个或多个氨基酸改变选自对应于SEQ ID NO:1的残基Q11、A39、S48、Q52、S59、G97、S103、H104、V105、N106、F107、I147、S148、V149、L152、L156、R200、D201、R202、V301、T302、E303、K306、N307、N308、和L316或其组合的位置。
在一些实施方式中,工程化蛋白的一个氨基酸改变是在对应于SEQ ID NO:1的残基Q11、A39、S48、Q52、S59、G97、S103、H104、V105、N106、F107、I147、S148、V149、L152、T153、L156、R200、D201、R202、V301、T302、E303、K306、N307、N308、L316或其组合的位置处的保守或非保守氨基酸置换。
在一些实施方式中,工程化TER在对应于表5和表6中所示残基及其组合的位置处具有SEQ ID NO:1的一个或多个氨基酸改变。
在一些实施方式中,与巴豆酰-CoA底物或相应的SEQ ID NO:1和SEQ ID NO:24的野生型相比,工程化TER酶对5-羧基-2-戊烯酰-CoA底物具有至少1.5X、至少2.5X、5X、至少10X、至少25X或1.5X-25X的催化效率。
在一些实施方式中,在已知标准条件下,工程化反式烯酰-CoA还原酶对5-羧基-2-戊烯酰-CoA的酶促转化比该酶对巴豆酰-CoA或比相应的SEQ ID NO:1和SEQ ID NO:24的野生型的酶活性高至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%或至少90%。
在一些实施方式中,为了提供TER变体,选择本公开的SEQ ID NO:1代表的热带假丝酵母菌TER作为模板。如本文所述,可通过将一个或多个氨基酸改变(例如置换)引入模板来创造变体,以测试对CPCoA或其类似物的增加的活性和增加的特异性。
出于氨基酸位置编号的目的,在一些实施方式中,使用SEQ ID NO:1作为参考序列。因此,例如,关于SEQ ID NO:1提到的氨基酸位置79,但在不同的TER序列(目标序列或其他模板序列)的上下文中,用于变体创建的相应氨基酸位置可能具有相同的或不同的位置编号(例如78、79或80)。在某些情况下,原始氨基酸及其在SEQ ID NO:1参考模板上的位置,将精确地与目标TER上的原始氨基酸和位置相关联。在其他情况下,原始氨基酸及其在SEQID NO:1模板上的位置,将与原始氨基酸相关,但其在目标上的位置不会是对应的模板位置。然而,在目标上的对应氨基酸可以是与模板位置具有预定距离、例如距离模板位置10个、9个、8个、7个、6个、5个、4个、3个、2个或1个氨基酸位置以内。在其他情况下,SEQ ID NO:1模板上的原始氨基酸将不会精确地与目标上的原始氨基酸相关。然而,可以根据模板上氨基酸的大致位置和目标氨基酸附近的氨基酸序列来了解目标序列上对应的氨基酸是什么。应当理解,可以使用本文未具体公开的TER序列生成额外的比对,并且鉴于当前的公开内容,这种比对可用于理解和生成新的TER变体。在一些实践模式中,比对可以让人们了解目标氨基酸附近的常见或相似氨基酸,这些氨基酸可以被视为“序列基序”,它们在模板和目标序列之间具有一定的同一性或相似性。这些序列基序可用于描述TER序列中变异氨基酸所在的部分以及该基序中可能存在的变异的类型。
在某些情况下,使用基本局部比对搜索工具(Basic Local Alignment SearchTool,BLAST)算法来了解模板序列和目标序列之间的氨基酸基序的序列一致性是有用的。因此,在优选的实践模式中,BLAST被用于识别或了解模板和目标蛋白之间的较短小段的氨基酸(例如,序列基序)的一致性。BLAST通过定位两个序列之间的短匹配,使用近似Smith-Waterman算法的启发性方法,从而发现相似序列。该(BLAST)算法可识别与查询序列的相似度高于某个阈值的文库序列。使用BLAST算法来确定两个或更多个序列的关联性的示例性参数,例如,可以是如下所述。简单来说,氨基酸序列比对可使用BLASTP版本2.0.8(1999年1月5日)和下列参数来执行:矩阵:0BLOSUM62;空位开头:11;空位延伸:1;x_dropoff(x_dropoff);50;期望:10.0;字长:3;过滤器:开启。核酸序列比对可使用BLASTN版本2.0.6(1998年9月16日)和下列参数来执行:匹配:1;不匹配:-2;空位开头:5;空位延伸:2;x_dropoff:50;期望:10.0;字长:11;过滤器:关闭。本领域技术人员将知道,可以对上述参数进行何种修改以增加或减少比较的严格性,并确定两个或更多个序列的相关性。
定点诱变或序列改变(例如,位点特异性诱变或寡核苷酸定向诱变)可用来对目标TER DNA序列进行特异改变,以提供编码具有期望的氨基酸置换的TER的变体DNA序列。一般而言,使用具有提供编码变体氨基酸的密码子的序列的寡核苷酸。在一些实施方式中,由于作为进行置换的目标的TER长度通常小于150个氨基酸,对变体TER DNA序列的整个编码区进行人工基因合成。
使用诱变寡核苷酸来生成变体TER序列的示例性技术包括可以利用置入噬菌粒中的TER基因序列的Kunkel方法。E.coli TA ssDNA中的噬菌粒是用于进行诱变的模板,该诱变使用寡核苷酸作为在该模板上延伸的引物而进行。
根据TER DNA中的目标位置的两侧的限制酶位点,可以用盒式诱变来创建目标变体序列。对于盒式诱变,合成DNA片段,并插入到质粒中,用限制酶切割,并且随后与一对含有TER变体突变的互补寡核苷酸连接。质粒和寡核苷酸的限制性片段可相互连接。
在其他实施方式中,用于生成变体TER序列的另一种技术是PCR定点诱变。使用诱变寡核苷酸引物来引入期望的突变,并提供携带突变序列的PCR片段。可以使用额外的寡核苷酸来延伸突变片段的末端,以提供适用于限制酶消化和插入到基因中的限制位点。
用于定点诱变技术的市售试剂盒也是可以获得的。例如,QuikchangeTM试剂盒使用互补诱变引物,以使用高保真非链置换DNA聚合成酶(如pfu聚合酶)对基因区域进行PCR扩增。该反应生成松弛的带切口的环状DNA。通过使用限制酶(例如对甲基化DNA特异性的DpnI)进行酶消化,消除模板DNA。
在一些实施方式中,优化方法是定向进化。定向进化是一种强大的方法,它涉及引入针对特定基因的突变,以改善和/或改变酶的特性。改进和/或改变的酶可通过开发和实施灵敏的高通量筛选分析来识别,该分析允许自动筛选许多酶变体(例如,>104个)。通常进行多轮诱变和筛选以提供具有优化特性的酶。还开发了可帮助识别用于诱变的基因区域的计算算法,这些计算算法可显著减少需要生成和筛选的酶变体的数量。已经开发了许多定向进化技术(用于回顾,请参见Hibbert et al.,Biomol.Eng 22:11-19(2005);Huismanand Lalonde,In Biocatalysis in the pharmaceutical and biotechnologyindustries pgs.717-742(2007),Patel(ed.),CRC Press;Otten and Quax.Biomol.Eng22:1-9(2005);以及Sen et al.,Appl Biochem.Biotechnol143:212-223(2007))以有效创建各式各样的变体库,并且这些方法已成功应用于改善许多酶类的广泛特性。通过定向进化技术改进和/或改变的酶特性包括:例如,选择性/特异性,以转化非天然底物;温度稳定性,以进行稳固的高温加工;pH稳定性,以在较低或较高pH条件下进行生物加工;底物或产品耐受性,从而可实现高产品滴度;结合性(Km),包括扩大底物结合以包括非天然底物;抑制性(Ki),去除产物、底物或关键中间体的抑制;活性(kcat),以增加酶促反应速率以达到所需的通量;表达水平,以增加蛋白质生产和总途径通量;氧稳定性,以在需氧条件下操作空气敏感酶;和厌氧活性,以在缺氧情况下操作需氧酶。
已经开发了许多用于针对特定酶的所需特性进行基因的诱变和多样化的示例性方法。此类方法是本领域技术人员公知的。这些方法中的任何一个都可用于改变和/或优化6-氨基己酸、己二胺或己内酰胺途径酶或蛋白质的活性。这种方法包括但不限于:EpPCR,其通过降低DNA聚合酶在PCR反应中的保真度来引入随机点突变(Pritchard et al.,JTheor.Biol.234:497-509(2005));易错滚环扩增(Error-prone Rolling CircleAmplification,epRCA),其与epPCR类似,不同之处在于使用完整的环状质粒作为模板,并使用在最后2个核苷酸上具有外切核酸酶抗性硫代磷酸酯键的随机6聚体以扩增质粒,随后转化到细胞中,其中质粒在串联重复处重新环化(Fujii et al.,Nucleic Acids Res.32:e145(2004);和Fujii et al.,Nat.Protoc.1:2493-2497(2006));DNA或家族改组(DNA orFamily Shuffling),其通常涉及用核酸酶(如DnaseI或EndoV)消化两个或更多个变异基因以生成随机片段池,这些片段在DNA聚合酶存在的情况下通过退火和延伸的循环而重新组装,以创建嵌合基因文库(Stemmer,Proc Natl Acad Sci USA 91:10747-10751(1994);和Stemmer,Nature 370:389-391(1994));交错延伸(Staggered Extension,StEP),它需要模板引发,随后是重复循环的2步PCR:变性和非常短的退火/延伸(短至5秒)(Zhao et al.,Nat.Biotechnol.16:258-261(1998));随机引发重组(Random Priming Recombination,RPR),其中使用随机序列引物生成许多与模板的不同片段互补的短DNA片段(Shao et al.,Nucleic Acids Res 26:681-683(1998))。
其他方法包括:异源双链重组(Heteroduplex Recombination),其中使用线性化的质粒DNA形成异源双链,该异源双链通过错配修复进行修复(Volkov et al,NucleicAcids Res.27:e18(1999);和Volkov et al.,Methods Enzymol.328:456-463(2000));过渡模板随机嵌合(Random Chimeragenesis on Transient Template,RACHITT),其采用单链DNA(ssDNA)的脱氧核糖核酸酶I片段化和大小分级(Coco et al.,Nat.Biotechnol.19:354-359(2001));截断模板重组延伸(Recombined Extensionon Truncated template(RETT),在用作模板池的单向ssDNA片段存在的情况下,需要对来自引物的单向生长链进行模板转换(Lee et al.,J.Molec.Catalysis 26:119-129(2003));简并寡核苷酸基因改组(Degenerate Oligonucleotide Gene Shuffling,DOGS),其中使用简并引物控制分子间的重组(Bergquist and Gibbs,Methods Mol.Biol352:191-204(2007);Bergquist et al.,Biomol.Eng 22:63-72(2005);Gibbs et al.,Gene 271:13-20(2001));渐进式切割产生杂合酶(Incremental Truncation for the Creation of Hybrid Enzyme,ITCHY),其创建了一个组合文库,其中目标基因或基因片段有1个碱基对缺失的(Ostermeier et al.,Proc.Natl.Acad Sci.USA96:3562-3567(1999);和Ostermeier et al.,Nat.Biotechnol.17:1205-1209(1999));硫代渐进式切割产生杂合酶(Thio-IncrementalTruncation for the Creation of Hybrid Enzyme,THIO-ITCHY),它与ITCHY相似,不同之处在于使用硫代磷酸酯dNTP生成截断(Lutz et al.,Nucleic Acids Res 29:E16(2001));SCRATCHY,它结合了两种基因重组方法,即ITCHY和DNA改组(Lutz et al.,Proc.Natl.AcadSci.USA 98:11248-11253(2001));随机漂移诱变(Random Drift Mutagenesis,RNDM),其中通过epPCR进行突变后筛选/选择那些保留可用活性的突变(Bergquist et al.,Biomol.Eng.22:63-72(2005));序列饱和诱变(Sequence Saturation Mutagenesis,SeSaM),一种随机诱变方法,该方法使用硫代磷酸酯核苷酸的随机掺入和切割生成随机长度片段池,这些片段用作模板在存在“通用”碱基(例如肌苷)的情况下进行延伸,并且含有肌苷的互补物的复制会产生随机碱基掺入,从而导致诱变(Wong et al.,Biotechnol.J.3:74-82(2008);Wong et al.,Nucleic Acids Res.32:e26(2004);和Wong et al.,Anal.Biochem.341:187-189(2005));合成改组(Synthetic Shuffling),它使用设计为编码“目标中的所有遗传多样性”的重叠的寡核苷酸,并使得改组后的后代具有非常高的多样性(Ness et al.,Nat.Biotechnol.20:1251-1255(2002));核苷酸交换和切除技术(Nucleotide Exchange and Excision Technology,NexT),它利用以下步骤的组合:dUTP掺入,然后用尿嘧啶DNA糖基化酶处理,然后用哌啶处理进行终点DNA片段化(Muller etal.,Nucleic Acids Res.33:e17(2005))。
进一步的方法包括:序列同源性独立蛋白质重组(Sequence Homology-Independent Protein Recombination,SHIPREC),其中使用接头促进两个远缘或不相关基因之间的融合,并在两个基因之间产生一系列嵌合体,从而产生单交叉杂种文库(Sieberet al.,Nat.Biotechnol.19:456-460(2001));基因位点饱和诱变TM(Gene SiteSaturation MutagenesisTM,GSSMTM),其中起始材料包括含有插入片段和两个引物的超螺旋双链DNA(double stranded DNA,dsDNA)质粒,这些片段和引物在所需突变位点简并(Kretz et al.,Methods Enzymol.388:3-11(2004));组合盒式诱变(CombinatorialCassette Mutagenesis,CCM),其包括使用短寡核苷酸盒来替换具有大量可能的氨基酸序列改变的有限区域(Reidhaar-Olson et al.Methods Enzymol.208:564-586(1991);和Reidhaar-Olson et al.Science 241:53-57(1988));组合多重盒式诱变(CombinatorialMultiple Cassette Mutagenesis,CMCM),与CCM基本相似,其使用高突变率的epPCR识别热点和热点区域,然后通过CMCM延伸以覆盖蛋白质序列空间的限定区域(Reetz et al.,Angew.Chem.Int.Ed Engl.40:3589-3591(2001));突变菌株技术(Mutator Strainstechnique),其中条件性ts突变质粒利用mutD5基因,该基因编码DNA聚合酶III的突变亚基,在选择和阻断(当不需要选择时)有害突变积累过程中允许随机和自然突变频率增加20-X至4000-X(Selifonova et al.,Appl.Environ.Microbiol.67:3645-3649(2001));Lowet al.,J.Mol.Biol.260:359-3680(1996))。
其他示例性方法包括:穿透突变(Look-Through Mutagenesis,LTM),这是一种多维诱变方法,用于评估和优化所选氨基酸的组合突变(Rajpal et al.,Proc.Natl.AcadSci.USA 102:8466-8471(2005));基因重组装(Gene Reassembly),这是一种DNA改组方法,可在Silico蛋白质设计自动化(Protein Design Automation,PDA)中同时应用于多个基因或创建单个基因的大型嵌合体(多突变)库(Vrenium公司提供的可调基因重组装TM(TunableGeneReassemblyTM,TGRTM)技术),Silico蛋白质设计自动化是一种优化算法,它锚定具有特定折叠的在结构上限定的蛋白质骨架,并在序列空间中搜索可以稳定折叠和整体蛋白质能量学的氨基酸置换,并且通常最有效地适用于具有已知三维结构的蛋白质(Hayes et al.,Proc.Natl.Acad Sci.USA 99:15926-15931(2002));以及迭代饱和诱变(IterativeSaturation Mutagenesis,ISM),其包括使用结构/功能的知识来选择可能的酶改进位点,使用诱变方法在选定的位点进行饱和诱变,例如Stratagene QuikChange(Stratagene;加利福尼亚州圣地亚哥),筛选/选择所需的特性,并使用改进的克隆,在另一个位点重新开始并继续重复直到获得所需的活性(Reetz et al.,Nat.Protoc.2:891-903(2007);和Reetzet al.,Angew.Chem.Int.Ed Engl.45:7745-7751(2006))。
任何上述诱变方法可单独使用或以任何组合使用。此外,如本文所述,定向进化方法中的任何一种或组合可以与自适应进化技术结合使用。
可以使用本领域已知的任何方法鉴定具有所需酶活性的细胞。例如,酶活性测定可用于鉴定具有酶活性的细胞,参见,例如,Enzyme Nomenclature,Academic Press,Inc.,New York 2007。可用于确定TER与CPCoA之间的反应的其他测定法包括GC/MS分析。在其他实例中,可以监测NADH/NADPH的水平。例如,可以使用NADP/NADPH测定试剂盒(例如可从ABCAMTM获得的ab65349)通过比色法或光谱法来监测NADH/NADPH。
所公开的TER酶可用于生产尼龙中间体的途径。在一些实施方式中,非天然存在的微生物体可以用于生产己二酸半醛或使用己二酸半醛作为中间体生产的其他尼龙中间体。
在一些实施方式中,遗传修饰的细胞(例如非天然存在的微生物体)能够产生尼龙中间体,例如6-氨基己酸、己内酰胺和己二胺。
在一些实施方式中,尼龙中间体是使用图1中描述的途径生物合成的。在一些实施方式中,图1途径在本文所述的遗传修饰的细胞(例如,非天然存在的微生物体)中提供,其中该途径包括编码途径酶的至少一种外源核酸,该途径酶以足以产生6-氨基己酸、己内酰胺和己二胺的量表达。
在一些实施方式中,该途径是如图1所示的HMD途径。HMD途径在本文所述的遗传修饰的细胞(例如,非天然存在的微生物体)中提供,其中HMD途径包括编码HMD途径酶的至少一种外源核酸,该HMD途径酶以足以产生HMD的量表达。该酶是:1A)3-氧代己二酰-CoA硫解酶;1B)3-氧代己二酰-CoA还原酶;1C)3-羟基己二酰-CoA脱水酶;1D)5-羧基-2-戊烯酰-CoA还原酶;1E)3-氧代己二酰-CoA/酰基-CoA转移酶,1F)3-氧代己二酰-CoA合酶;1G)3-氧代己二酰-CoA水解酶;1H)3-氧代己二酸还原酶;1I)3-羟基己二酸脱水酶;1J)5-羧基-2-戊烯酸还原酶;1K)己二酰-CoA/酰基-CoA转移酶;1L)己二酰-CoA合酶;1M)己二酰-CoA水解酶;1N)己二酰-CoA还原酶(醛形成);1O)6-氨基己酸转氨酶;1P)6-氨基己酸脱氢酶;1Q)6-氨基己酰-CoA/酰基-CoA转移酶;1R)6-氨基己酰-CoA合酶;1S)酰胺水解酶;1T)自发环化;1U)6-氨基己酰-CoA还原酶(醛形成);1V)HMDA转氨酶;和1W)HMDA脱氢酶。
参考图1,在一些实施方式中,非天然存在的微生物体具有以下一种或多种途径:ABCDNOPQRUVW;ABCDNOPQRT;或ABCDNOPS。包含TER酶以产生己二酸半醛的其他示例性途径包括美国专利号8,377,680中描述的那些,该专利通过引用整体并入本文。
图1还示出了这样的途径:通过转移酶或合酶由6-氨基己酸到6-氨基己酰-CoA(图1,步骤Q或R),然后6-氨基己酰-CoA经自发环化形成己内酰胺(图1,步骤T)。在其他实施方式中,6-氨基己酸被活化成6-氨基己酰-CoA(图1,步骤Q或R),然后还原(图1,步骤U)和胺化(图1,步骤V或W)以形成HMDA。6-氨基己酸也可被活化成6-氨基己酰磷酸而不是6-氨基己酰-CoA。6-氨基己酰磷酸可自发环化形成己内酰胺。在一些实施方式中,6-氨基己酰磷酸可被还原成6-氨基己酸半醛,然后6-氨基己酸半醛可被转化成HMDA,如图1所描绘的。
如本文所用,当术语“非天然存在的”用于提及微生物有机体或微生物体时,意指微生物有机体具有通常在所提及物种的天然存在菌株(包括所提及物种的野生型菌株)中不存在的至少一种遗传改变。遗传改变包括,例如,引入编码代谢多肽的可表达核酸的修饰、其他核酸添加、核酸缺失和/或微生物遗传材料的其它功能性破坏。这样的修饰包括,例如,所提及物种的异源多肽、同源多肽或异源及同源多肽的编码区及其功能片段。其他的修饰包括,例如,其中修饰改变了基因或操纵子的表达的非编码调节区。示例性代谢多肽包括6-氨基己酸、己内酰胺、己二胺或乙酰丙酸生物合成途径内的酶。
代谢修饰是指改变其天然存在状态的生化反应。因此,非天然存在的微生物可具有对编码代谢多肽或其功能片段的核酸的遗传修饰。本文公开了示例性代谢修饰。
如本文所用,术语“微生物的”、“微生物有机体”或“微生物体”互换使用并且旨在表示作为包含在古细菌、细菌或真核细胞领域内的微观细胞存在的任何有机体。因此,该术语旨在涵盖原核或真核细胞或有机体,所述原核或真核细胞或有机体具有微观尺寸并且包括所有种类的细菌、古细菌和真细菌以及真核有机体,例如酵母和真菌。该术语还包括可培养用于生产生物化学物质的任何物种的细胞培养物。
如本文所用,术语“CoA”或“辅酶A”旨在表示一种有机辅因子或辅基(酶的非蛋白部分),其存在是许多酶(脱辅酶)的活性所必需的,以形成活性酶系统。辅酶A作用于某些缩合酶,作用于乙酰基或其他酰基转移以及脂肪酸合成和氧化、丙酮酸氧化和其他乙酰化。
如本文所用,具有化学式-OOC-(CH2)4-COO-(参见图1)的“己二酸根(adipate)”(IUPAC名称己二烯酸盐(hexanedioate))是己二酸(adipic acid)(IUPAC名称己二烯酸(hexanedioic acid))的离子化形式,并且应理解,己二酸根和己二酸可自始至终互换使用,以指代以其任何中性或离子化形式存在的化合物,包括其任何盐形式。技术人员将理解,具体形式将取决于pH。
如本文所用,具有化学式-OOC-(CH2)5-NH2(参见图1,缩写为6-ACA)的“6-氨基己酸根(6-aminocaproate)”是6-氨基己酸(6-aminocaproic acid)的离子化形式(IUPAC名称6-氨基己酸(6-aminohexanoic acid)),并且应理解,6-氨基己酸根和6-氨基己酸可自始至终互换使用,以指代以其任何中性或离子化形式存在的化合物,包括其任何盐形式。技术人员将理解,具体形式将取决于pH。
如本文所用,“己内酰胺(caprolactam)”(IUPAC名称氮杂环庚烷-2-酮(azepan-2-one))是6-氨基己酸的内酰胺(参见图1,缩写为CPO)。
如本文所用,“己二胺(hexamethylenediamine)”也称为1,6-二氨基己烷或1,6-己二胺,具有化学式H2N(CH2)6NH2(参见图1,缩写为HMD)。
如本文所用,当提及培养或生长条件时,使用术语“基本上厌氧的”旨在表示氧的量小于液体介质中溶解氧约10%的饱和度。该术语还旨在包括维持小于约1%氧气气氛的液体或固体介质的密封室。
如本文所用,术语“渗透保护剂”在用于提及培养或生长条件时旨在表示充当渗透剂并帮助如本文所述的微生物有机体在渗透胁迫中存活的化合物。渗透保护剂包括,例如,甜菜碱、氨基酸和糖海藻糖。其非限制性示例是甘氨酸甜菜碱、脯氨酸甜菜碱、二甲基噻亭、二甲基磺酰丙酸酯、3-二甲基磺酰-2-甲基丙酸酯、哌可酸、二甲基硫代乙酸、胆碱、L-肉碱和四氢嘧啶。
如本文所用,当术语“生长耦合的”用于提及生物化学物质的生产时,意指生物化学物质的生物合成在微生物体的生长阶段产生。在一个具体实施方式中,生长耦合的生产可以是强制性的,这意味着所提及生物化学物质的生物合成是微生物体生长阶段期间生产的强制产物。
如本文所用,“代谢修饰”意指改变其天然存在状态的生化反应。代谢修饰可包括,例如,通过编码参与反应的酶的一种或多种基因的功能破坏来消除生化反应活性。
如本文所用,术语“基因破坏”或其语法等同语,旨在表示使编码的基因产物无效的遗传改变。该遗传改变可以是,例如,全基因的缺失、转录或翻译所需的调控序列的缺失、产生截短基因产物的基因部分的缺失,或使得编码基因产物失活的各种突变策略中的任何策略。基因破坏的一个特别有用的方法是基因完全缺失,因为它减少或消除了非天然存在的微生物体中遗传回复的发生。
本文使用的“外源性的”旨在表示所提及的分子或所提及的活性是引入宿主微生物有机体中的。可以例如通过将编码核酸引入宿主遗传物质,例如通过整合进宿主染色体或作为非染色体遗传物质(如质粒)来引入分子。因此,当该术语用于编码核酸的表达时,是指将可表达形式的编码核酸引入微生物有机体中。当用于提及生物合成活性时,该术语是指被引入宿主参照体中的活性。来源可以是,例如,在引入宿主微生物有机体后表达所指的活性的同源或异源的编码核酸。因此,术语“内源性”是指存在于宿主中的所指的分子或活性。类似地,当用于提及编码核酸的表达时,该术语是指包含在微生物有机体中的编码核酸的表达。
术语“异源的”是指来源自除所指物种以外来源的分子、材料或活性,而“同源的”是指来源自宿主微生物有机体的分子、材料或活性。相应地,编码核酸的外源表达可利用异源或同源的编码核酸中的任一种或两种。
如本文所用,术语“约”意指所述值±10%。术语“约”可表示四舍五入到最接近的有效数字。因此,约5%意指4.5%至5.5%。此外,关于特定数字的约也包括该确切数字。例如,约5%还包括确切的5%。
本文使用的术语转换数(也称为kcat)定义为对于给定的酶浓度[ET],单个催化位点每秒将执行的底物分子的最大化学转化数。其可由最大反应速率Vmax和催化剂位点浓度[ET]计算如下:
Kcat=Vmax/[ET]。单位为s-1
如本文所用,术语“催化效率”是酶将底物转化为产物的效率的量度。催化效率的比较也可用来衡量酶对不同底物的偏好(即底物特异性)。催化效率越高,酶越“偏好”该底物。其可由下式计算:kcat/KM,其中kcat为转换数,KM为米氏常数(Michaelis constant),KM为反应速率为Vmax一半时的底物浓度。催化效率的单位可表示为s-1M-1
如本文所用,在6-氨基己酸、1,6-己二醇、己内酯、己内酰胺或己二胺的上下文中的术语“生物来源的”意指这些化合物在微生物有机体中合成。
应理解,当在微生物有机体中包括多于一种外源核酸时,该外源核酸是指所提及的编码核酸或生物合成活性,如上所论述的。还应理解,如本文所公开的,这样的外源核酸在不同的核酸分子、在多顺反子核酸分子或其组合上被引入宿主微生物中,而仍然看作是多于一种外源核酸。例如,如本文所公开的,微生物有机体可被工程化以表达编码期望途径酶或蛋白质的两种或更多种外源核酸。在编码期望活性的两种外源核酸被引入宿主微生物有机体的情况下,应理解的是,这两种外源核酸可作为单个核酸被引入,例如在单个质粒上,在不同的质粒上,可在单个位点或多个位点整合到宿主染色体中,而仍然被看作是两种外源核酸。类似地,应理解的是,多于两种的外源核酸可以任何所需的组合引入宿主有机体,例如在单个质粒上,在未整合到宿主染色体中的不同的质粒上,并且质粒保持为染色体外元件,并且仍被视为两种或更多种外源核酸。所提及的外源核酸或生物合成活性的数目,是指编码核酸的数目或生物合成活性的数目,而不是引入宿主有机体的不同的核酸的数目。
非天然存在的微生物有机体可含有稳定的遗传改变,这指的是可培养超过五代而不丧失该改变的微生物体。通常,稳定的遗传改变包括持续超过10代的修饰,特别是持续超过约25代的稳定修饰,更特别地,稳定遗传修饰将持续超过50代,包括无限期。
基因破坏的情形中,特别有用的稳定遗传改变是基因缺失。使用基因缺失来引入稳定的遗传改变,对于降低回复到遗传改变之前的表型的可能性是特别有用的。例如,可通过例如在一组代谢修饰中使编码催化一种或多种反应的酶的基因缺失来实现生物化学物质的稳定生长耦合生产。通过多次缺失可以进一步增强生物化学物质的生长耦合生产的稳定性,显著降低每个被破坏的活性发生多次补偿性回复的可能性。
本领域技术人员将理解,遗传改变(包括本文所例示的代谢修饰)是参照合适的宿主有机体(如大肠杆菌)及其相应的代谢反应或合适的来源体针对所需的遗传材料(例如所需的代谢途径的基因)而进行描述的。然而,鉴于各种有机体的完整基因组测序和基因组学领域的高水平技术,本领域技术人员将容易地将本文提供的教导和指导应用于基本上所有其他有机体。例如,本文示例的大肠杆菌代谢改变可以通过掺入来自所提及物种以外的物种的相同或类似的编码核酸,而容易地应用于其他物种。这种遗传改变包括例如物种同源物的遗传改变,一般而言,特别是直系同源物、旁系同源物或非直系同源物的基因替换。
直系同源物是通过直系亲缘相关并在不同有机体中负责基本上相同或相同的功能的一种或多种基因,它们。例如,小鼠环氧化物水解酶和人环氧化物水解酶可被认为是环氧化物水解生物功能的直系同源物。例如,当它们共享的序列相似性足以表明其同源性,或通过来自共同祖先的进化而相关时,基因是通过直系亲缘而关联的。如果基因共享三维结构但不一定具有序列相似性,而共享的三维结构的数量足以表明它们已从共同祖先进化到无法识别一级序列相似性的程度,则这些基因也可被认为是直系同源物。直系同源基因可以编码具有约25%至100%氨基酸序列相似性的序列相似性的蛋白质。对于编码共享氨基酸相似性小于25%的蛋白质的基因,如果它们的三维结构也显示出相似性,则也可被认为是通过直系亲缘产生。丝氨酸蛋白酶家族的成员,包括组织纤溶酶原活化物和弹性蛋白酶,被认为是由共同的祖先通过垂直亲缘产生的。
直系同源物包括通过例如进化在结构或整体活性上发生分化的基因或其编码的基因产物。例如,当一个物种编码表现出两个功能的基因产物,并且这些功能已经在第二个物种中分离到不同的基因时,这三个基因及其相应的产物被认为是直系同源物。本领域技术人员将理解,为了生产生化产物,选择具有代谢活性的待引入或破坏的直系同源基因,用于构建非天然存在的微生物体。显示可分离活性的直系同源物的一个示例是不同活性已经在两种或更多种物种之间或单种物种内分离到不同的基因产物。一个具体的例子是弹性蛋白酶蛋白水解和纤溶酶原蛋白酶分解(两种丝氨酸蛋白酶活性)分离到不同的分子,即纤溶酶原活化物和弹性蛋白酶。第二个例子是支原体5'-3'外切核酸酶和果蝇DNA聚合酶III活性的分离。来自第一种物种的DNA聚合成酶可被认为是来自第二种物种的外切核酸酶或聚合成酶中的任一个或两者的直系同源物,反之亦然。
相比之下,旁系同源物是通过例如复制和随后的进化分歧相关的同源物,并且具有相似或共通但不相同的功能。旁系同源物可起源于或来源自例如同一物种或不同物种。例如,微粒体环氧化物水解酶(环氧化物水解酶I)和可溶性环氧化物水解酶(环氧化物水解酶II)可被认为是旁系同源物,因为它们代表从共同祖先共同进化的两种不同的酶,它们催化不同的反应并在相同物种中具有不同的功能。旁系同源物是来自相同物种的蛋白质,其彼此之间具有显著的序列相似性以表明其是同源的,或通过来自共同祖先的共同进化而相关。旁系同源蛋白家族包括HipA同源物、荧光素酶基因、肽酶等。
非直系同源基因取代是指来自一个物种的非直系同源基因。其可置换不同物种的所提及的基因功能。置换包括,例如,与不同物种中的所提及的功能相比,能够在来源物种中执行基本上相同或相似的功能。尽管一般来说,非直系同源基因取代可被鉴定为与编码所提及的功能的已知基因在结构上相关,不过结构相关性较低但功能上相似的基因及其相应的基因产物仍将落在本文所用术语的含义内。功能相似性需要,例如,在非直系同源基因产物的活性位点或结合区域中与编码待被置换的功能的基因相比至少有一些结构相似性。因此,非直系同源基因包括例如旁系同源基因或不相关基因。
因此,在鉴定和构建具有6-氨基己酸、己内酰胺、己二胺或乙酰丙酸生物合成能力的非天然存在的微生物有机体时,本领域技术人员将理解,将本文提供的教导和指导应用于特定物种,代谢修饰的鉴定可包括直系同源物的鉴定和包含或失活。在编码催化相似或基本上相似的代谢反应的酶的所提及的微生物体中存在旁系同源物和/或非直系同源基因取代的情形中,本领域技术人员也可利用这些进化相关基因。在基因破坏策略中,也可以在宿主微生物有机体、旁系同源物或直系同源物中破坏或缺失进化相关基因,以减少或消除活性,从而确保想要破坏的酶活性的任何功能冗余不会使设计的代谢修饰短路。
直系同源物、旁系同源物和非直系同源基因取代可通过本领域技术人员熟知的方法来确定。例如,检查两个多肽的核酸或氨基酸序列将揭示比较序列之间的序列同一性和相似性。基于这种相似之处,本领域技术人员可确定相似性是否足够高以表明蛋白质通过从共同祖先进化而相关。本领域技术人员熟知的算法,诸如Align、BLAST、Clustal W等,比较和确定原始序列相似性或同一性,并且还确定了序列中的可被分配权重或得分的空位的存在或显著性。这种算法也是本领域已知的,并且类似地可用于确定核苷酸序列相似性或同一性。基于用于计算统计相似性、或在随机多肽中找到相似匹配的可能性以及确定匹配的显著性的公知方法,来计算相似性是否足以确定相关性的参数。根据需要,两个或更多个序列的计算机比较也可由本领域技术人员视觉优化。可以预期,相关基因产物或蛋白质具有高相似性,例如25%至100%的序列同一性。如果扫描足够大小的数据库(约5%),则非相关蛋白质的同一性可与偶然发生的预期情形基本相同。5%至24%之间的序列,可能代表也可能不代表同源性足以得出对比序列具有相关性的结论。在给定数据集大小的情况下,可以进行另外的确定此类匹配的显著性的统计分析,以确定这些序列的相关性来。
例如,使用BLAST算法确定两个或更多个序列的相关性的示例性参数,可如下所述。简单来说,氨基酸序列比对可使用BLASTP版本2.2.29+(2014年1月14日)和下列参数来执行:矩阵:0BLOSUM62;空位开头:11;空位延伸:1;x_dropoff;50;期望:10.0;字长:3;过滤器:开启。核酸序列比对可使用BLASTN版本2.0.6(1998年9月16日)和下列参数来执行:匹配:1;不匹配:-2;空位开头:5;空位延伸:2;x_dropoff:50;期望:10.0;字长:11;过滤器:关闭。本领域技术人员将知道,可以对上述参数进行何种修改以增加或减少比较的严格性,并确定两个或更多个序列的相关性。
应理解,本文公开的任何途径,包括图中描述的那些途径,可用于生成非天然存在的微生物有机体,该微生物有机体根据需要产生任何途径中间体或产物。如本文所公开的,这种产生中间体的微生物有机体可与表达下游途径酶的另一种微生物有机体组合使用以产生期望的产物。然而,应理解的是,可利用产生6-氨基己酸、己内酰胺、己二胺或乙酰丙酸途径中间体的非天然存在的微生物有机体来产生中间体作为所需产物。
对本申请的描述一般提及代谢反应、其反应物或其产物,或具体提及编码与所提及的代谢反应、其反应物或其产物相关或催化所提及的代谢反应、其反应物或其产物的酶的一种或多种核酸或基因。除非本文另有明确说明,否则本领域技术人员将理解,提及反应也构成对反应物和反应产物的提及。类似地,除非另有明确说明,否则提及反应物或产物也提及反应,并且指代任何这些代谢成分,也提及编码催化所提及的反应、反应物或产物的酶的一种或多种基因。同样,鉴于代谢生物化学、酶学和基因组学的熟知领域,本文提及的基因或编码核酸也涉及对相应编码的酶及其催化的反应以及该反应的反应物和产物的提及。
非天然存在的微生物有机体可通过引入编码参与一种或多种6-氨基己酸、己内酰胺、己二胺或乙酰丙酸生物合成途径的一种或多种酶的可表达核酸来产生。根据选择用于生物合成的宿主微生物有机体,可表达特定6-氨基己酸、己内酰胺、己二胺或乙酰丙酸生物合成途径中的一些或全部的核酸。例如,如果所选择的宿主缺乏一种或多种用于所需生物合成途径的酶,则将所缺乏的酶的可表达核酸引入宿主中,以用于随后的外源表达。可选地,如果所选择的宿主表现出某些途径基因的内源表达,但缺乏其他途径基因,则所缺乏的酶需要编码核酸来实现6-氨基己酸、己内酰胺、己二胺或乙酰丙酸的生物合成。因此,非天然存在的微生物有机体可以通过引入外源酶活性来获得所需的生物合成途径来生产,或者可通过引入一种或多种外源酶活性,从而与一种或多种内源酶一起产生所需的产物,例如6-氨基己酸、己内酰胺、己二胺或乙酰丙酸,来获得所需的生物合成途径。
取决于所选宿主微生物有机体的6-氨基己酸、己内酰胺、己二胺或乙酰丙酸生物合成途径成分,非天然存在的微生物有机体将包括至少一种外源表达的6-氨基己酸、己内酰胺、己二胺或乙酰丙酸途径-编码核酸和至多所有的用于一种或多种己二酸、6-氨基己酸或己内酰胺生物合成途径的编码核酸。例如,可通过相应的编码核酸的外源表达在缺乏途径酶的宿主中建立6-氨基己酸、己内酰胺、己二胺或乙酰丙酸的生物合成。在缺乏6-氨基己酸、己内酰胺、己二胺或乙酰丙酸途径的所有酶的宿主中,可包括途径中所有酶的外源表达,但是可以理解,即使宿主含有至少一种途径酶,也可表达途径中的所有酶。
鉴于本文提供的教导和指导,本领域技术人员将理解,以可表达形式引入的编码核酸的数量将至少与所选宿主微生物有机体的己二酸、6-氨基己酸、己内酰胺、己二胺或乙酰丙酸途径缺乏相仿。因此,非天然存在的微生物有机体可具有编码构成6-氨基己酸、己内酰胺、己二胺或乙酰丙酸生物合成途径的上述酶的至少一种、两种、三种、四种、五种、六种、七种、八种、九种、十种、十一种或十二种、至多全部核酸。在一些实施方式中,非天然存在的微生物有机体还可包括促进或优化6-氨基己酸、己内酰胺、己二胺或乙酰丙酸生物合成或赋予宿主微生物有机体其他有用功能的其他遗传修饰。一个这样的其他功能性可包括例如,对诸如以下的6-氨基己酸、己内酰胺、己二胺或乙酰丙酸途径前体中的一种或多种的合成的增强:在己二酸合成的情况下的琥珀酰-CoA和/或乙酰-CoA;或在6-氨基己酸或己内酰胺合成的情况下的己二酰-CoA或己二酸,包括本文公开的己二酸途径酶;或在6-氨基己酸合成的情况下的丙酮酸和琥珀酸半醛、谷氨酸、戊二酰-CoA、高赖氨酸或2-氨基-7-氧代辛二酸;或在己二胺合成的情况下,6-氨基己酸、谷氨酸、戊二酰-CoA、丙酮酸和4-氨基丁醛,或2-氨基-7-氧代辛二酸。
在一些实施方式中,非天然存在的微生物有机体具有至少一种编码与CPCoA反应形成己二酰CoA的反式烯酰-CoA还原酶的外源核酸,并且该反式烯酰-CoA还原酶选自包含与SEQ ID NO:1、4-9、11、14、15或17-26中任一个的至少25、50、75、100、150、200、250、300或更多个连续氨基酸具有至少约50%氨基酸序列同一性的氨基酸序列的TER。
通常,选择宿主微生物有机体,以使其产生6-氨基己酸、己内酰胺或己二胺途径的前体,所产生的前体为天然产生的分子或提供所需前体的从头生产或提高由宿主微生物有机体天然生产的前体的生产的工程产品。如本文所公开的,宿主有机体可被工程化以增加前体的生产。此外,已经被工程化以生产所需前体的微生物有机体可用作宿主有机体,并进一步工程化以表达6-氨基己酸、己内酰胺、己二胺或乙酰丙酸途径的酶或蛋白质。
在一些实施方式中,非天然存在的微生物有机体由包含合成6-氨基己酸、己内酰胺、己二胺或乙酰丙酸的酶促能力的宿主生成。在该具体实施方式中,增加6-氨基己酸、己内酰胺、己二胺或乙酰丙酸途径产物的合成或积累以例如驱动6-氨基己酸、己内酰胺、己二胺或乙酰丙酸途径反应朝向6-氨基己酸、己内酰胺、己二胺或乙酰丙酸生产。增加的合成或积累可通过例如编码上述6-氨基己酸、己内酰胺、己二胺或乙酰丙酸途径酶中的一种或多种的核酸的过表达来实现。6-氨基己酸、己内酰胺、己二胺或乙酰丙酸途径酶的过表达可例如通过一个或多个内源基因的外源表达、或通过一个或多个异源基因的外源表达来发生。因此,通过使编码6-氨基己酸、己内酰胺、己二胺或乙酰丙酸生物合成途径酶的一种、二种、三种、四种、五种、六种、七种、八种、九种、十一种、十二种、十三种、十四种、即至多所有核酸过表达,可很容易地将天然存在的有机体生成为例如,产生6-氨基己酸、己内酰胺、己二胺或乙酰丙酸的非天然存在的微生物有机体。此外,非天然存在的有机体可通过内源基因的诱变产生,该诱变导致6-氨基己酸、己内酰胺、己二胺或乙酰丙酸生物合成途径中的酶的活性增加。
在特别有用的实施方式中,使用了编码核酸的外源表达。外源表达赋予宿主和应用定制表达和/或调控元件的能力,以实现由用户控制的所需表达水平。然而,内源表达也可在其它实施方式中使用,例如通过去除负调控效应物或在与诱导型启动子或其他调控元件连接时诱导基因的启动子。因此,可通过提供合适的诱导剂来上调具有天然存在的诱导型启动子的内源基因,或者可使内源基因的调控区工程化以掺入诱导型调控元件,从而允许在所需的时间调控内源基因的增加的表达。类似地,可包括诱导型启动子作为所引入非天然存在的微生物有机体的外源基因的调控元件。
在一些实施方式中,非天然存在的微生物有机体包括一种或多种基因破坏,其中该微生物有机体产生6-ACA、己二酸和/或HMDA。破坏发生在编码这样的酶的基因中:当基因破坏降低酶的活性时,该酶使己二酸、6-ACA和/或HMDA的产生与有机体的生长相关联,这使得基因破坏使非天然存在的有机体增加己二酸、6-ACA和/或HMDA的生产。因此,在一些实施方式中,提供了非天然存在的微生物有机体,其包含一种或多种基因破坏,该一种或多种基因破坏发生在编码蛋白质或酶的基因中,其中该一种或多种基因破坏使得有机体中己二酸、6-ACA和/或HMDA的生产增加。如本文所公开的,这种有机体包含产生己二酸、6-ACA和/或HMDA的途径。
应理解的是,在方法中,可将一种或多种外源核酸中的任一种引入微生物有机体以产生非天然存在的微生物有机体。可引入核酸以赋予微生物有机体例如6-氨基己酸、己内酰胺、己二胺或乙酰丙酸生物合成途径。可选择地,可引入编码核酸以产生具有生物合成能力的中间微生物有机体以催化一些所需反应,从而赋予6-氨基己酸、己内酰胺、己二胺或乙酰丙酸生物合成能力。例如,具有6-氨基己酸、己内酰胺、己二胺或乙酰丙酸生物合成途径的非天然存在的微生物有机体可包含至少两种编码所需酶的外源核酸。在产生己二酸的情况下,至少两种外源核酸可编码酶,所述酶例如以下的组合:琥珀酰-CoA:乙酰-CoA酰基转移酶和3-羟酰-CoA脱氢酶;或琥珀酰-CoA:乙酰-CoA酰基转移酶和3-羟基己二酰-CoA脱水酶;或3-羟基己二酰-CoA和5-羧基-2-戊烯酰-CoA还原酶;或3-羟酰-CoA和己二酰-CoA合成酶等。在产生己内酰胺的情况下,至少有两种外源核酸可编码酶,所述酶例如以下的组合:CoA依赖性反式烯酰-CoA还原酶和转氨酶;或CoA依赖性反式烯酰-CoA还原酶和酰胺水解酶;或转氨酶和酰胺水解酶。在产生6-氨基己酸的情况下,至少有两种外源核酸可编码酶,所述酶例如以下的组合:4-羟基-2-氧代庚烷-1,7-二酸(4-hydroxy-2-oxoheptane-1,7-dioate,HODH)醛缩酶和2-氧代庚-4-烯-1,7-二酸(2-oxohept-4-ene-1,7-dioate,OHED)水合酶;或2-氧代庚-4-烯-1,7-二酸(OHED)水合酶和2-氨基庚烷-1,7-二酸酯(2-aminoheptane-1,7-dioate,2-AHD)脱羧酶;3-羟基己二酰-CoA脱水酶和己二酰-CoA脱氢酶;谷氨酰-CoA转移酶和6-氨基庚二酰-CoA水解酶;或戊二酰-CoAβ-酮硫解酶和3-氨基庚二酸2,3-氨基变位酶。在产生己二胺的情况下,至少有两种外源核酸可编码酶,所述酶例如以下的组合:6-氨基己酸激酶和[(6-氨基己酰基)氧基]膦酸([(6-aminohexanoyl)oxy]phosphonate,6-AHOP)氧化还原酶;或6-乙酰胺基己酸激酶和[(6-乙酰胺基己酰基)氧基]膦酸([(6-acetamidohexanoyl)oxy]phosphonate,6-AAHOP)氧化还原酶;6-氨基己酸N-乙酰转移酶和6-乙酰胺基己酰基-CoA氧化还原酶;3-羟基-6-氨基庚二酰-CoA脱水酶和2-氨基-7-氧代庚酸氨基转移酶;或3-氧代庚二酰-CoA连接酶和高赖氨酸脱羧酶。因此,应当理解的是,可在非天然存在的微生物有机体中包括生物合成途径的两种或更多种酶的任意组合。
类似地,应当理解的是,非天然存在的微生物有机体可包括生物合成途径的三种或更多种酶的任意组合中,例如,在产生己二酸的情况下,酶的以下组合:琥珀酰-CoA:乙酰-CoA酰基转移酶、3-羟酰-CoA脱氢酶和3-羟基己二酰-CoA脱水酶;或琥珀酰-CoA:乙酰-CoA酰基转移酶、3-羟酰-CoA脱氢酶和5-羧基-2-戊烯酰-CoA还原酶;或琥珀酰-CoA:乙酰-CoA酰基转移酶、3-羟酰-CoA脱氢酶和己二酰-CoA合成酶;或3-羟酰-CoA脱氢酶、3-羟基己二酰-CoA脱水酶和己二酰-CoA:乙酰-CoA转移酶等,只要所需生物合成途径的酶的组合导致产生相应的所需产品。在产生6-氨基己酸的情况下,至少有三种外源核酸可编码酶,所述酶例如以下的组合:4-羟基-2-氧代庚烷-1,7-二酸(HODH)醛缩酶、2-氧代庚-4-烯-1,7-二酸(OHED)水合酶和2-氧代庚烷-1,7-二酸(2-oxoheptane-1,7-dioate,2-OHD)脱羧酶;或2-氧代庚-4-烯-1,7-二酸(OHED)水合酶、2-氨基庚-4-烯-1,7-二酸(2-aminohept-4-ene-1,7-dioate,2-AHE)还原酶和2-氨基庚烷-1,7-二酸(2-AHD)脱羧酶;或3-羟基己二酰-CoA脱水酶、2,3-脱氢己二酰-CoA还原酶和己二酰-CoA脱氢酶;或6-氨基-7-羧基庚-2-烯酰-CoA还原酶、6-氨基庚二酰-CoA水解酶和2-氨基庚二酸脱羧酶;或戊二酰-CoAβ-酮硫解酶、3-氨化氧化还原酶和2-氨基庚二酸脱羧酶;或3-氧代己二酰-CoA硫解酶、5-羧基-2-戊烯酸还原酶和己二酸还原酶。在产生己二胺的情况下,至少三种外源核酸可编码酶,所述酶例如以下的组合:6-氨基己酸激酶、[(6-氨基己酰基)氧基]膦酸(6-AHOP)氧化还原酶和6-氨基己酸半醛氨基转移酶;或6-氨基己酸N-乙酰转移酶、6-乙酰胺基己酸激酶和[(6-乙酰胺基己酰基)氧基]膦酸(6-AAHOP)氧化还原酶;或6-氨基己酸N-乙酰转移酶、[(6-乙酰胺基己酰基)氧基]膦酸(6-AAHOP)酰基转移酶和6-乙酰胺基己酰基-CoA氧化还原酶;或3-氧-6-氨基庚二酰-CoA氧化还原酶、3-羟基-6-氨基庚二酰-CoA脱水酶和高赖氨酸脱羧酶;或2-氧代-4-羟基-7-氨基庚酸醛缩酶、2-氧代-7-氨基庚-3-烯酸还原酶和高赖氨酸脱羧酶;或6-乙酰胺基己酸还原酶、6-乙酰胺基己醛氨基转移酶和6-乙酰胺基己胺N-乙酰转移酶。类似地,如需要,非天然存在的微生物有机体中可包括本文公开的生物合成途径的四种或更多种酶的任何组合,只要所需的生物合成途径的酶的组合导致产生相应的所需产品。
除了如本文所述的6-氨基己酸、己内酰胺、己二胺或乙酰丙酸的生物合成之外,非天然存在的微生物有机体和方法也可以彼此之间以及与本领域公知的通过其他途径实现产品生物合成的其他微生物有机体和方法各种组合来使用。例如,除了使用6-氨基己酸、己内酰胺、己二胺或乙酰丙酸生产者之外的生产6-氨基己酸、己内酰胺、己二胺或乙酰丙酸的一种替代方案是通过添加另一种能够将己二酸、6-氨基己酸或己内酰胺途径中间体转化为6-氨基己酸、己内酰胺、己二胺或乙酰丙酸的微生物有机体。一种这样的程序包括,例如,对产生6-氨基己酸、己内酰胺、己二胺或乙酰丙酸途径中间体的微生物有机体进行发酵。然后6-氨基己酸、己内酰胺、己二胺或乙酰丙酸途径中间体可用作第二微生物的底物,该第二微生物有机体将6-氨基己酸、己内酰胺、己二胺或乙酰丙酸途径中间体转化为6-氨基己酸、己内酰胺、己二胺或乙酰丙酸。6-氨基己酸、己内酰胺、己二胺或乙酰丙酸途径中间体可直接添加到第二有机体的另一培养物中,或者6-氨基己酸、己内酰胺、己二胺或乙酰丙酸途径中间体生产者的原始培养物可例如通过细胞分离除尽这些微生物有机体,然后将第二有机体添加到发酵液中,这可用于生产最终产品,而无需中间纯化步骤。
在其他实施方式中,非天然存在的微生物有机体已和方法可在多种亚途径中组装以实现例如6-氨基己酸、己内酰胺、己二胺或乙酰丙酸的生物合成。在这些实施方式中,所需产物的生物合成途径可分离到不同的微生物有机体中,并且可共培养不同的微生物有机体以生产最终产物。在这样的生物合成方案中,一种微生物有机体的产物是第二微生物有机体的底物,直到合成最终产物。例如,6-氨基己酸、己内酰胺、己二胺或乙酰丙酸的生物合成可通过构建包含用于将一种途径中间体转化为另一种途径中间体或产物的生物合成途径的微生物有机体来完成。可选择地,6-氨基己酸、己内酰胺、己二胺或乙酰丙酸也可通过在同一容器中使用两种有机体通过共培养或共发酵从微生物有机体以生物合成的方式来产生,其中第一微生物有机体产生6-氨基己酸、己内酰胺、己二胺或乙酰丙酸中间体,第二微生物有机体将中间体转化为6-氨基己酸、己内酰胺、己二胺或乙酰丙酸。
鉴于本文提供的教导和指导,本领域技术人员将理解,非天然存在的微生物有机体和方法与其他微生物有机体、与具有亚途径的其他非天然存在的微生物有机体的共培养以及与本领域熟知的其他化学和/或生化程序一起存在多种组合和排列,以产生6-氨基己酸、己内酰胺、己二胺或乙酰丙酸。
类似地,本领域技术人员理解,可基于引入一种或多种基因破坏以增加6-氨基己酸、己内酰胺、己二胺或乙酰丙酸的生产的所需特征来选择宿主有机体。因此,应当理解,如果要在宿主有机体中引入基因修饰来破坏基因,则可以类似地破坏任何催化相似但不相同的代谢反应的同源物、直系同源物或旁系同源物,以确保所需的代谢反应被充分破坏。由于不同有机体之间的代谢网络之间存在某些差异,因此本领域技术人员将理解,在给定有机体中破坏的实际基因在有机体之间可能不同。然而,鉴于本文提供的教导和指导,本领域技术人员还将理解,可将方法应用于任何合适的宿主微生物体,以鉴定构建目标物种中的有机体所需的同源代谢改变,该目标物种将提高6-氨基己酸、己内酰胺、己二胺或乙酰丙酸的生物合成。在具体实施方式中,增加的生产将6-氨基己酸、己内酰胺、己二胺或乙酰丙酸的生物合成与有机体的生长耦合,并且如果需要以及如本文所公开的,可将6-氨基己酸、己内酰胺、己二胺或乙酰丙酸的生产与有机体的生长强制性地耦合。
6-氨基己酸、己内酰胺、己二胺或乙酰丙酸途径酶的编码核酸的来源可包括,例如,编码的基因产物能够催化所指反应的任何物种。此类物种包括原核生物有机体和真核生物有机体,包括但不限于:细菌,包括古菌和真细菌,以及真核生物,包括酵母、植物、昆虫、动物以及包括人在内的哺乳动物。在一些实施方式中,6-氨基己酸、己内酰胺、己二胺或乙酰丙酸途径酶的编码核酸的来源示于表3中。在一些实施方式中,反式烯酰-CoA还原酶的编码核酸的来源如表3所示。在其他实施方式中,反式烯酰-CoA还原酶的编码核酸的来源是假丝酵母属、果蝇属、拟南芥属(Arabidopsis)或智人。在一些实施方式中,6-氨基己酸、己内酰胺、己二胺或乙酰丙酸途径酶的编码核酸的来源是以下物种,例如:大肠杆菌(Escherichia coli)、大肠杆菌菌株K12(Escherichia coli str.K12)、大肠杆菌C(Escherichia coli C)、大肠杆菌Crooks(ATCC 8739)、大肠杆菌W(Escherichia coli W)、假单胞菌属(Pseudomonas sp)、Pseudomonas knackmussii、假单胞菌属菌株B13、恶臭假单胞菌(Pseudomonas putida)、荧光假单胞菌(Pseudomonas fluorescens)、斯氏假单胞菌(Pseudomonas stutzeri)、门多萨假单胞菌(Pseudomonas mendocina)、沼泽红假单胞菌(Rhodopseudomonas palustris)、结核分支杆菌(Mycobacterium tuberculosis)、霍乱弧菌(Vibrio cholera)、幽门螺杆菌(Heliobacter pylori)、肺炎克雷伯菌(Klebsiellapneumoniae)、变形斑沙雷菌(Serratia proteamaculans)、链霉菌属2065(Streptomycessp.2065)、铜绿假单胞菌(Pseudomonas aeruginosa)、铜绿假单胞菌PAO1、富养罗尔斯通氏菌(Ralstonia eutropha)、富养罗尔斯通氏菌H16、丙酮丁醇梭菌(Clostridiumacetobutylicum)、小眼虫(Euglenagracilis)、齿垢密螺旋体(Treponema denticola)、克氏梭菌(Clostridium kluyveri)、智人(Homo sapiens)、褐家鼠(Rattus norvegicus)、不动杆菌属ADP1(Acinetobacter sp.ADP1)、不动杆菌属菌株M-1、天蓝色链霉菌(Streptomyces coelicolor)、巴氏真杆菌(Eubacterium barkeri)、不解糖消化链球菌(Peptostreptococcus asaccharolyticus)、肉毒梭菌(Clostridium botulinum)、肉毒梭菌A3菌株、酪丁酸梭菌(Clostridium tyrobutyricum)、巴氏梭菌(Clostridiumpasteurianum)、热乙酸梭菌(Clostridium thermoaceticum)(Moorella thermoaceticum(热乙酸穆尔氏菌))、热醋穆尔氏菌(Moorella thermoacetica)乙酸钙不动杆菌(Acinetobacter calcoaceticus)、小家鼠(Mus musculus)、野猪(Sus scrofa)、黄杆菌属(Flavobacterium sp)、金黄节杆菌(Arthrobacter aurescens)、产黄青霉菌(Penicilliumchrysogenum)、黑曲霉菌(Aspergillus niger)、构巢曲霉菌(Aspergillus nidulans),枯草芽孢杆菌(Bacillus subtilis)、酿酒酵母(Saccharomyces cerevisiae)、运动发酵单胞菌(Zymomonas mobilis)、产琥珀酸曼氏杆菌(Mannheimia succiniciproducens)、杨氏梭菌(Clostridium ljungdahlii)、Clostridium carboxydivorans、嗜热脂肪土芽孢杆菌(Geobacillus stearothermophilus)、根癌农杆菌(Agrobacterium tumefaciens)、反硝化无色杆菌(Achromobacter denitrificans)、拟南芥(Arabidopsis thaliana)、流感嗜血杆菌(Haemophilus influenzae)、发酵氨基酸球菌(Acidaminococcus fermentans)、梭菌属M62/1(Clostridium sp.M62/1)、具核梭杆菌(Fusobacterium nucleatum)、家牛(Bostaurus)、生枝动胶菌(Zoogloea ramigera)、类球红细菌(Rhodobacter sphaeroides)、拜氏梭菌(Clostridium beijerinckii)、勤奋金属球菌(Metallosphaera sedula)、嗜热厌氧杆菌属(Thermoanaerobacter species)、布氏嗜热厌氧杆菌(Thermoanaerobacterbrockii)、贝氏不动杆菌(Acinetobacter baylyi)、牙龈卟啉单胞菌(Porphyromonasgingivalis)、肠膜明串珠菌(Leuconostoc mesenteroides)、头寇岱硫化叶菌(Sulfolobustokodaii)、头寇岱硫化叶菌7、硫磺矿硫化叶菌(Sulfolobus solfataricus)、硫磺矿硫化叶菌、Sulfolobus acidocTERarius、鼠伤寒沙门氏菌(Salmonella typhimurium)、肠道沙门氏菌(Salmonella enterica)、海栖热袍菌(Thermotoga maritima)、盐生盐杆菌(Halobacterium salinarum)、蜡样芽孢杆菌(Bacillus cereus)、艰难梭菌(Clostridiumdifficile)、Alkaliphilus metalliredigenes、腾冲嗜热厌氧杆菌(Thermoanaerobactertengcongensis)、克氏酵母(Saccharomyces kluyveri)、幽门螺旋杆菌(Helicobacterpylori)、谷氨酸棒状杆菌(Corynebacterium glutamicum)、糖乙酸多丁醇梭菌(Clostridium saccharoperbutylacetonicum)、绿针假单胞菌(Pseudomonaschlororaphis)、棒状链霉菌(Streptomyces clavuligerus)、空肠弯曲菌(Campylobacterjejuni)、嗜热栖热菌(Thermus thermophilus)、嗜热丙酸互营细菌(Pelotomaculumthermopropionicum)、多毛拟杆菌(Bacteroides capillosus)、人肠道厌氧棒状菌(Anaerotruncus colihominis)、嗜热盐碱厌氧菌(Natranaerobius thermophilius)、火焰古球状菌(Archaeoglobus fulgidus)、火焰古球状菌DSM4304、死海盐盒菌(Haloarculamarismortui)、耐超高温热棒菌(Pyrobaculum aerophilum)、耐超高温热棒菌菌株IM2、烟草(Nicotiana tabacum)、薄荷(Menthe piperita)、火炬松(Pinus taeda)、大麦芽(Hordeum vulgare)、玉米(Zea mays)、混浊红球菌(Rhodococcus opacus)、钩虫贪铜菌(Cupriavidus necator)、慢生型大豆根瘤菌(Bradyrhizobium japonicum)、慢生型大豆根瘤菌USDA110、猪蛔虫(Ascarius suum)、产丁酸细菌L2-50(butyrate-producingbacterium L2-50)、巨大芽胞杆菌(Bacillus megaterium)、海藻产甲烷球菌(Methanococcus maripaludis)、马氏甲烷八叠球菌(Methanosarcina mazei)、(Methanosarcina mazei)、马氏甲烷八叠球菌、MethanocTERococcus jannaschii、秀丽隐杆线虫(Caenorhabditis elegans)、利什曼原虫(Leishmania major)、好氧性甲烷氧化菌20Z(Methylomicrobium alcaliphilum 20Z)、需盐色盐杆菌(Chromohalobactersalexigens)、超高热硫酸还原古细菌(Archaeglubus fulgidus)、莱茵衣藻(Chlamydomonas reinhardtii)、阴道毛滴虫(trichomonas vaginalis G3)、布氏锥虫(Trypanosoma brucei)、Mycoplana ramose、滕黄微球菌(Micrococcus luteas)、巴氏醋杆菌(Acetobacter pasteurians)、乳酸克鲁维酵母(Kluyveromyces lactis)、中慢生型百脉根根瘤菌(Mesorhizobium loti)、乳酸乳球菌(Lactococcus lactis)、球形赖氨酸芽孢杆菌(Lysinibacillus sphaericus)、博伊丁假丝酵母(Candida boidinii)、白假丝酵母SC5314(Candida albicans SC5314)、双向伯克霍尔德氏菌AMMD(Burkholderia ambifariaAMMD)、猪蛔虫(Ascaris suun)、鲍氏不动杆菌(Acinetobacter baumanii)、醋酸钙不动杆菌(Acinetobacter calcoaceticus)、瘤状伯克霍尔德氏菌(Burkholderia phymatum)、白假丝酵母、近端梭菌(Clostridium subterminale)、台湾贪铜菌(Cupriavidustaiwanensis)、Flavobacterium lutescens、漆酶裂殖酵母(Lachancea kluyveri)、乳杆菌属30a(Lactobacillus sp.30a)、肾脏钩端螺旋体(Leptospira interrogans)、热醋穆尔氏菌、黄色黏球菌(Myxococcus xanthus)、心叶烟(Nicotiana glutinosa)、诺卡氏菌(Nocardia iowensis(菌属NRRL 5646))、瑞士假单胞菌MT1(Pseudomonas reinekei MT1)、富养罗尔斯通氏菌JMP134(Ralstonia eutropha JMP134)、Ralstonia metallidurans、Rhodococcus jostii、粟酒裂殖酵母(Schizosaccharomyces pombe)、反刍兽月形单胞菌(Selenomonas ruminantium)、Streptomyces clavuligenus、Syntrophusaciditrophicus、副溶血性弧菌(Vibrio parahaemolyticus)、创伤弧菌(Vibriovulnificus),以及本文公开的或可用作相应基因的源有机体的其他示例性物种(参见实施例)。然而,由于现在可获得的超过550种物种的完整基因组序列(其中超过一半可在公共数据库如NCBI上找到),包括395种微生物体基因组和各种酵母、真菌、植物和哺乳动物基因组,针对相关的或远缘的一种或多种基因,鉴别编码所需的6-氨基己酸、己内酰胺、己二胺或乙酰丙酸生物合成活性的基因,包括例如同源物、直系同源物、旁系同源物和已知基因的非直系基因置换,以及有机体之间的遗传改变的交换,在本领域中都是常规和公知的。因此,本文所述的关于特定有机体例如大肠杆菌的能够生物合成6-氨基己酸、己内酰胺、己二胺或乙酰丙酸的代谢改变可以很容易地应用于其他微生物体,包括原核生物和真核生物等。鉴于本文提供的教导和指导,本领域技术人员将知道在一个有机体中举例说明的代谢改变可同样地应用于其他有机体。
在一些情况下,例如当6-氨基己酸、己内酰胺、己二胺或乙酰丙酸生物合成途径存在于不相关物种中时,6-氨基己酸、己内酰胺、己二胺或乙酰丙酸生物合成可通过以下方式而赋予给宿主物种,例如通过来自不相关物种的催化类似但不同的代谢反应以取代所提及的反应的一种或多种旁系同源物的外源表达。由于不同有机体之间的代谢网络存在一定的差异,本领域技术人员会理解,不同有机体之间的实际基因用途可能会有所不同。然而,鉴于本文提供的教导和指导,本领域技术人员也将理解,该教导和方法可应用于使用与本文示例的那些同源的代谢改变的所有微生物有机体,以构建在目标物种中将合成6-氨基己酸、己内酰胺、己二胺或乙酰丙酸的微生物有机体。
宿主微生物有机体可选自例如细菌、酵母、真菌或适用于发酵过程的多种其他微生物体中的任一种,并且非天然存在的微生物有机体从细菌、酵母、真菌或适用于发酵过程的多种其他微生物体中的任一种中生成。示例性细菌包括选自以下的物种:大肠杆菌、产酸克雷伯菌(Klebsiella oxytoca)、产琥珀酸厌氧螺菌(Anaerobiospirillumsucciniciproducens)、产琥珀酸放线杆菌(Actinobacillus succinogenes)、产琥珀酸曼氏杆菌、菜豆根瘤菌(Rhizobium etli)、枯草芽孢杆菌、谷氨酸棒状杆菌、氧化葡糖杆菌(Gluconobacter oxydans)、运动发酵单胞菌、乳酸乳球菌、植物乳杆菌(Lactobacillusplantarum)、天蓝色链霉菌、丙酮丁醇梭菌、荧光假单胞菌、以及恶臭假单胞菌。示例性酵母或真菌包括选自以下的物种:酿酒酵母、粟酒裂殖酵母、乳酸克鲁维酵母、马克斯克鲁维酵母(Kluyveromyces marxianus)、土曲霉(Aspergillus terreus)、黑曲霉菌、巴斯德毕赤酵母(Pichia pastoris)、少根根霉(Rhizopus arrhizus)、米根霉(Rhizobus oryzae)等。例如,大肠杆菌是特别有用的宿主有机体,因为它是已得到充分表征的适合基因工程化的微生物有机体。其他特别有用的宿主有机体包括酵母,例如酿酒酵母。应理解,任何合适的微生物宿主有机体均可用于引入代谢和/或基因修饰以产生所需产物。
构建和测试非天然存在的产生6-氨基己酸、己内酰胺、己二胺或乙酰丙酸的宿主的表达水平的方法可例如通过本领域公知的重组和检测方法进行。此类方法可见描述于例如,Sambrook et al.,Molecular Cloning:A Laboratory Manual,Third Ed.,ColdSpring Harbor Laboratory,New York(2001);和Ausubel et al.,Current Protocols inMolecular Biology,John Wiley and Sons,Baltimore,MD(1999)中。
使用本领域公知的技术,包括但不限于:接合、电穿孔、化学转化、转导、转染和超声波转化,可将参与产生6-氨基己酸、己内酰胺、己二胺或乙酰丙酸的途径的外源核酸序列稳定或瞬时地引入宿主细胞中。对于在大肠杆菌或其他原核细胞中的外源表达,真核核酸的基因或cDNA中的一些核酸序列可编码靶向信号,例如N-末端线粒体或其他靶向信号,靶向信号可以根据需要在转化进原核宿主细胞之前去除。例如,去除线粒体前导序列,使得在大肠杆菌中的表达增加(Hoffmeister et al.,J.Biol.Chem.280:4329-4338(2005))。对于在酵母或其他真核细胞中的外源表达,基因可在胞质溶胶中表达而无需添加前导序列,或可通过添加合适的靶向序列,例如适于宿主细胞的线粒体靶向或分泌信号,来靶向线粒体或其他细胞器,或靶向分泌。因此,应理解的是,使核酸序列去除或包括靶向序列的适当修饰可以掺入到外源核酸序列中,以赋予所需特性。此外,基因可用在本领域中公知的技术进行密码子优化,以实现蛋白质的最佳表达。
可构建一个或多个表达载体以包括一种或多种如本文所例示的6-氨基己酸、己内酰胺、己二胺或乙酰丙酸生物合成途径编码核酸,并且该编码核酸与宿主有机体中的功能性表达控制序列可操作地连接。适用于微生物宿主有机体中的表达载体包括,例如,质粒、噬菌体载体、病毒载体、附加体和人工染色体(包括可操作用于稳定整合到宿主染色体中的载体和选择序列或标记)。此外,表达载体可包括一个或多个选择性标记基因和适当的表达控制序列。也可包括这样的选择性标记基因,其例如提供对抗生素或毒素的抗性、补充营养缺陷不足,或提供培养基中不存在的重要营养物。表达控制序列可包括本领域中公知的组成型和诱导型启动子、转录增强子、转录终止子等等。当要共表达两个或更多个外源编码核酸时,这两种核酸可以插入到,例如,单个表达载体或不同的表达载体中。对于单个载体表达,编码核酸可以可操作地连接到一个共同的表达控制序列,或连接到不同的表达控制序列,例如一个诱导型启动子和一个组成型启动子。参与代谢或合成途径的外源核酸序列的转化可使用本领域中公知的方法来确认。这种方法包括,例如,核酸分析,如Northern印迹法或mRNA的聚合成酶链反应(PCR)扩增,或用于表达基因产物的免疫印迹法,或用于测试所引入核酸序列或其对应的基因产物的表达的其他合适的分析方法。本领域技术人员应理解,该外源核酸表达了足够的量以产生期望的产物,且进一步理解的是,可以使用本领域中公知的和本文所公开的方法来优化表达水平,以得到充分表达。
在一些实施方式中,是生产所需中间体或产物例如己二酸、6-氨基己酸、己内酰胺、己二胺或乙酰丙酸的方法。例如,用于生产己二酸的方法可包括在一定条件下培养具有己二酸途径的非天然存在的微生物有机体足够的时间以产生己二酸,该途径包括至少一种编码己二酸途径酶的外源核酸,该己二酸途径酶的表达量足以产生己二酸,己二酸途径包括:琥珀酰-CoA:乙酰-CoA酰基转移酶;3-羟酰-CoA脱氢酶;3-羟基己二酰-CoA脱水酶;5-羧基-2-戊烯酰-CoA还原酶和己二酰-CoA合成酶;或磷酸反式己二酰酶/己二酸激酶;或己二酰-CoA:乙酰-CoA转移酶;或己二酰-CoA水解酶。此外,用于生产己二酸的方法可包括在一定条件下培养具有己二酸途径的非天然存在的微生物有机体足够的时间以产生己二酸,该途径包括至少一种编码己二酸途径酶的外源核酸,己二酸途径酶的表达量足以产生己二酸,己二酸途径包括:琥珀酰-CoA:乙酰-CoA酰基转移酶;3-氧代己二酸-CoA转移酶;3-氧代己二酸还原酶;3-羟基己二酸脱水酶;和2-烯酸还原酶。
此外,用于生产6-氨基己酸的方法可包括在一定条件下培养具有6-氨基己酸途径的非天然存在的微生物有机体足够的时间以产生6-氨基己酸,该途径包括至少一种编码6-氨基己酸途径酶的外源核酸,6-氨基己酸途径酶的表达量足以产生6-氨基己酸,6-氨基己酸途径包括:CoA依赖性反式烯酰-CoA还原酶和转氨酶或6-氨基己酸脱氢酶。此外,用于生产己内酰胺的方法可包括在一定条件下培养具有己内酰胺途径的非天然存在的微生物有机体足够的时间以产生己内酰胺,该途径包括至少一种编码己内酰胺途径酶的外源核酸,己内酰胺途径酶的表达量足以产生己内酰胺,己内酰胺途径包括:CoA依赖性醛脱氢酶、转氨酶或6-氨基己酸脱氢酶和酰胺水解酶。
可以使用公知的方法进行合适的纯化和/或测定,以测试6-氨基己酸、己内酰胺、己二胺或乙酰丙酸的生产。对于每一种待测试的工程化菌株,可以使合适的重复样(例如一式三份的培养物)生长。例如,可以监控工程化生产宿主中的产物和副产物的形成。最终产物和中间体,以及其他有机化合物,可通过如HPLC(高效液相色谱)、GC-MS(气相色谱-质谱)和LC-MS(液相色谱-质谱)的方法或其他合适分析方法使用在本领域中公知的常规程序来进行分析。还可以用培养物上清液来测试产物在发酵液中的释放。副产物和残余的葡萄糖可以通过HPLC来量化,例如,对于葡萄糖和醇使用折光率检测器,以及对于有机酸使用UV检测器(Lin et al.,Biotechnol.Bioeng.90:775-779(2005)),或使用在本领域中公知的其他合适的试验和检测方法。来自外源DNA序列的各个酶活性,也可使用本领域中公知的方法来测定。
6-氨基己酸、己内酰胺、己二胺或乙酰丙酸可使用多种本领域中公知的方法从培养物的其他成分中分离。这种分离方法包括,例如,萃取程序,以及包括连续液-液萃取、渗透蒸发、膜过滤、膜分离、反渗透、电渗析、蒸馏、结晶、离心、萃取过滤、离子交换层析、尺寸排阻层析、吸附层析和超滤在内的方法。所有上述方法在本领域中是公知的。
本文所述的任何非天然存在的微生物有机体均可被培养以生产和/或分泌生物合成产物。例如,6-氨基己酸、己内酰胺、己二胺或乙酰丙酸生产者可被培养用于6-氨基己酸、己内酰胺、己二胺或乙酰丙酸的生物合成生产。
为了生产6-氨基己酸、己内酰胺、己二胺或乙酰丙酸,将重组菌株在含有碳源和其他必需营养物的培养基中培养。有时需要并且可能非常希望在发酵罐中维持厌氧条件,以降低整个过程的成本。这样的条件可通过例如首先用氮气使培养基鼓泡,然后用带隔膜封盖(septum and crimp-cap)密封烧瓶来获得。对于厌氧下未观察到生长的菌株,可以通过使隔膜通开小孔进行有限曝气来施加微厌氧需氧或基本上厌氧的条件。先前已经描述了示例性的厌氧条件,并且是本领域公知的。示例性的需氧和厌氧条件描述于例如2011年5月14日提交的美国专利号7,947,483中。发酵可按批次、补料分批或连续方式进行,如本文所公开的。
如果需要,可根据将培养基保持在理想的pH值的需要,通过加入碱(如NaOH或其它碱)或酸,来将培养基的pH保持在所需的pH,特别是中性pH,例如大约7的pH。可通过使用分光光度计(600nm)测量光密度来确定生长速率,并且通过监测碳源随时间的消耗来确定葡萄糖摄取率。
生长培养基可包括,例如,可为非天然存在的微生物体提供碳源的任何碳水化合物源。此类源包括例如糖类,例如葡萄糖、木糖、阿拉伯糖、半乳糖、甘露糖、果糖、蔗糖和淀粉。碳水化合物的其他来源包括例如可再生原料和生物质。在方法中可用作原料的生物质的示例性类型,包括纤维素生物质、半纤维素生物质和木质素原料或该原料的一部分。这样的生物质原料含有例如可用作碳源的碳水化合物底物,例如葡萄糖、木糖、阿拉伯糖、半乳糖、甘露糖、果糖和淀粉。鉴于本申请提供的教导和指导,本领域技术人员将理解,除上述例示的那些之外的可再生原料和生物质,也可用于培养用于生产6-氨基己酸、己内酰胺、己二胺或乙酰丙酸的微生物有机体。
除了例如上面例示的那些可再生原料,6-氨基己酸、己内酰胺、己二胺或乙酰丙酸微生物有机体也可被修饰以在作为其碳源的合成气(syngas)上生长。在该特定的实施方式中,一种或多种蛋白质或酶在产生6-氨基己酸、己内酰胺、己二胺或乙酰丙酸的有机体中表达以提供用于利用合成气或其他气态碳源的代谢途径。
合成气体(Synthesis gas),也称为合成气或发生炉气(producer gas),是煤和含碳材料如生物质材料(包括农作物和残留物)气化的主要产物。合成气主要是H2和CO的混合物,可从任何有机原料的气化中获得,包括但不限于煤、煤油、天然气、生物质和废弃有机物。气化通常在高燃料氧比下进行。虽然主要是H2和CO,但合成气也可以包括少量的CO2和其他气体。因此,合成气体提供了具有成本效益的气态碳源,例如CO和另外的CO2
Wood-Ljungdahl途径催化CO和H2转化为乙酰-CoA和其他产物,如乙酸盐。能够利用CO和合成气的有机体通常也能够通过Wood-Ljungdahl途径所包含的相同的基础酶组和转化而具有利用CO2和CO2/H2混合物的能力。早在揭示CO也可被相同的有机体使用并且涉及相同的途径之前,已经认识到微生物体将CO2以H2依赖的方式将转化为乙酸。许多产乙酸菌已表现会在CO2存在下生长并产生诸如乙酸之类的化合物,只要存在氢气以提供必要的还原当量(例如,参见Drake,Acetogenesis,pp.3-60Chapman and Hall,New York,(1994))。这可用以下等式来概括:
2CO2+4H2+n ADP+n Pi→CH3COOH+2H2O+n ATP
因此,具有Wood-Ljungdahl途径的非天然存在的微生物体也可利用CO2和H2混合物来生产乙酰-CoA和其他所需产物。
Wood-Ljungdahl途径是本领域众所周知的,由12个反应组成,可分为两个分支:(1)甲基分支;和(2)羰基分支。甲基分支将合成气转化为甲基四氢叶酸(甲基-THF),而羰基分支将甲基-THF转化为乙酰-CoA。甲基分支中的反应依次被下列酶催化:铁氧还蛋白氧化还原酶、甲酸脱氢酶、甲酰四氢叶酸合成酶、甲川四氢叶酸环化脱水酶、亚甲基四氢叶酸脱氢酶和亚甲基四氢叶酸还原酶。羰基分支中的反应依次由下列酶或蛋白质催化:钴胺类咕啉/铁硫蛋白(cobalamide corrinoid/iron-sulfur protein)、甲基转移酶、一氧化碳脱氢酶、乙酰-CoA合酶、乙酰-CoA合酶二硫化还原酶和氢化酶,这些酶也可被称为甲基四氢叶酸:类咕啉蛋白甲基转移酶(例如AcsE)、类咕啉铁硫蛋白、镍蛋白组装蛋白(例如AcsF)、铁氧还蛋白、乙酰-CoA合酶、一氧化碳脱氢酶和镍蛋白组装蛋白(例如,CooC)。遵循本文提供的用于引入足够数量的编码核酸以产生6-氨基己酸、己内酰胺、己二胺或乙酰丙酸途径的教导和指导,本领域技术人员将理解,也可就以下方面进行相同的工程设计:至少引入编码宿主有机体中不存在的Wood-Ljungdahl酶或蛋白质的核酸。因此,将一种或多种编码核酸引入微生物有机体,使得修饰的有机体包含完整的Wood-Ljungdahl途径,将赋予合成气利用能力。
此外,与一氧化碳脱氢酶和/或氢化酶活性相耦合的还原性(反向)三羧酸循环也可用于将CO、CO2和/或H2转化为乙酰-CoA和其他产物,例如乙酸。能够通过还原性TCA途径固定碳的有机体可利用以下酶中的一种或多种:ATP柠檬酸裂解酶、柠檬酸裂解酶、顺乌头酸酶、异柠檬酸脱氢酶、α-酮戊二酸:铁氧还蛋白氧化还原酶、琥珀酰-CoA合成酶、琥珀酰-CoA转移酶、延胡索酸还原酶、延胡索酸酶、苹果酸脱氢酶、NAD(P)铁氧还蛋白氧化还原酶、一氧化碳脱氢酶、和氢化酶。具体而言,通过一氧化碳脱氢酶和氢化酶从CO和/或H2中提取的还原当量用于通过还原性TCA循环将CO2固定为乙酰-CoA或乙酸。乙酸可通过例如乙酰-CoA转移酶、乙酸激酶/磷酸转乙酰酶和乙酰-CoA合成酶等酶转化为乙酰-CoA。乙酰-CoA可通过丙酮酸:铁氧还蛋白氧化还原酶和糖原异生酶转化为对甲苯酸酯、对苯二酸盐或(2-羟基-3-甲基-4-氧代丁氧基)膦酸前体、甘油醛-3-磷酸、磷酸烯醇丙酮酸和丙酮酸。按照本文提供的用于引入足够数量的编码核酸以产生对甲苯酸酯、对苯二酸盐或(2-羟基-3-甲基-4-氧代丁氧基)膦酸途径的教导和指导,本领域技术人员将理解,也可就以下方面进行相同的工程设计:至少引入编码宿主有机体中不存在的还原性TCA途径酶或蛋白质的核酸。因此,将一种或多种编码核酸引入微生物,使得修饰的有机体包含完整的还原性TCA途径,将赋予合成气利用能力。
鉴于本申请提供的教导和指导,本领域技术人员将理解,可产生当在诸如碳水化合物的碳源上生长时分泌生物合成化合物的非天然存在的微生物有机体。此类化合物包括例如6-氨基己酸、己内酰胺、己二胺或乙酰丙酸以及6-氨基己酸、己内酰胺、己二胺或乙酰丙酸途径中的任何中间代谢物。所需要的只是针对一种或多种所需的酶活性进行工程化以实现所需化合物或中间体的生物合成,包括例如纳入6-氨基己酸、己内酰胺、己二胺或乙酰丙酸生物合成途径中的一些或全部。因此,一些实施方式提供了非天然存在的微生物有机体,该非天然存在的微生物有机体当在碳水化合物上生长时产生和/或分泌6-氨基己酸、己内酰胺、己二胺或乙酰丙酸以及当在碳水化合物上生长时产生和/或分泌6-氨基己酸、己内酰胺、己二胺或乙酰丙酸途径中示出的任何中间代谢物。例如,如果需要,产生己二酸的微生物有机体可从中间体开始合成,该中间体例如,3-氧代己二酰-CoA、3-羟基己二酰-CoA、5-羧基-2-戊烯酰-CoA或己二酰-CoA(参见图1)。此外,产生己二酸的微生物有机体可从例如3-氧代己二酰-CoA、3-氧代己二酸、3-羟基己二酸或六-2-烯二酸的中间体开始合成。产生6-氨基己酸的微生物可从中间体例如己二酸半醛开始合成。根据需要,产生己内酰胺的微生物有机体可从中间体开始合成,该中间体例如己二酸半醛或6-氨基己酸(参见图1)。
在一些实施方式中,如图4至图9所示,非天然存在的微生物体可生成己二酸、6ACA、己二胺、己内酯或己内酰胺。
在一些实施方式中,非天然存在的微生物有机体还包括外源表达的编码醛脱氢酶(Aldehyde dehydrogenase,ALD)或转氨酶(Transaminase,TA)或两者的核酸。ALD与己二酸-CoA反应生成己二酸半醛,而TA与己二酸半醛反应生成6-氨基己酸。
在一些实施方式中,与琥珀酰-CoA或乙酰-CoA或这两种底物相比,ALD酶对己二酰CoA底物具有更高的催化效率和活性。在一些实施方式中,ALD酶如表1所示。
表1.醛脱氢酶对己二酰-CoA的活性
Figure BDA0003432542400000191
Figure BDA0003432542400000201
Figure BDA0003432542400000211
Figure BDA0003432542400000221
Figure BDA0003432542400000231
在一些实施方式中,TA酶对己二酸半醛底物具有类似于琥珀酸半醛底物的催化效率和活性。在一些实施方式中,TA酶能够将己二酸半醛转化为6-氨基己酸。在一些实施方式中,TA酶如表2A和表2B中所示。
表2A.
Figure BDA0003432542400000232
Figure BDA0003432542400000241
Figure BDA0003432542400000251
Figure BDA0003432542400000261
表2B.转氨酶变体
Figure BDA0003432542400000262
Figure BDA0003432542400000271
非天然存在的微生物有机体使用如本文所示例的本领域众所周知的方法来构建,以外源性表达至少一种编码6-氨基己酸、己内酰胺、己二胺或乙酰丙酸途径酶的核酸,该途径酶的量足以产生6-氨基己酸酸、己内酰胺、己二胺或乙酰丙酸。应当理解,微生物有机体在足以产生6-氨基己酸、己内酰胺、己二胺或乙酰丙酸的条件下培养。根据本文提供的教导和指导,非天然存在的微生物有机体可实现6-氨基己酸、己内酰胺、己二胺或乙酰丙酸的生物合成,导致细胞内浓度在约0.1mM至200mM之间或更高。通常,6-氨基己酸、己内酰胺、己二胺或乙酰丙酸的细胞内浓度在约3mM至150mM之间,特别地在约5mM至125mM之间,更特别地在约8mM至100mM之间,包括约10mM、20mM、50mM、80mM或更多。也可以从非天然存在的微生物有机体中实现在这些示例性范围中的每一个之间和之上的细胞内浓度。
在一些实施方式中,培养条件包括厌氧或基本上厌氧的生长或维持条件。示例性厌氧条件先前已经描述并且是本领域公知的。发酵过程的示例性厌氧条件在本文中描述并且描述于例如2011年5月24日提交的美国专利第7,947,483号中。这些条件中的任何一种,以及其它本领域众所周知的厌氧条件,均可用于非天然存在的微生物有机体。在这种厌氧条件下,6-氨基己酸、己内酰胺、己二胺或乙酰丙酸生产者可以5mM至10mM或更高的细胞内浓度以及本文例示的所有其他浓度来合成6-氨基己酸、己内酰胺、己二胺或乙酰丙酸。应理解,即使以上描述是指细胞内浓度,产生6-氨基己酸、己内酰胺、己二胺或乙酰丙酸的微生物有机体可在细胞内产生6-氨基己酸、己内酰胺、己二胺或乙酰丙酸和/或将产物分泌到培养基中。
培养条件可以包括例如液体培养程序以及发酵和其它大规模培养程序。如本文所述,可在厌氧或基本上厌氧的培养条件下获得生物合成产物的特别有用的生产。
如本文所述,用于实现6-氨基己酸、己内酰胺、己二胺或乙酰丙酸的生物合成的一个示例性生长条件包括厌氧培养或发酵条件。在某些实施方式中,非天然存在的微生物有机体可在厌氧或基本上厌氧的条件下持续的培养或发酵。简而言之,厌氧条件是指没有氧气的环境。基本上厌氧的条件包括,例如,使得培养基中的溶解氧浓度保持在0%至10%的饱和度之间的培养、分批发酵或连续发酵。基本上厌氧的条件还包括:使细胞在保持小于1%氧气气氛的密封室内的液体培养基中或固体琼脂内生长或静息。可通过例如用N2/CO2混合物或其它一种或多种合适的非氧气体向培养物通气来维持氧气的百分比。
本文所述的培养条件可按比例扩大并连续生长,以用于制造6-氨基己酸、己内酰胺、己二胺或乙酰丙酸。示例性生长程序包括,例如,补料分批发酵和分批分离;补料分批发酵和连续分离,或连续发酵和连续分离。所有这些方法都是本领域公知的。发酵程序特别可用于生物合成生产商业数量的6-氨基己酸、己内酰胺、己二胺或乙酰丙酸。通常,和非连续培养程序一样,6-氨基己酸、己内酰胺、己二胺或乙酰丙酸的连续和/或近连续生产将包括在足以维持和/或近乎维持指数期增长的养分和培养基中培养产生6-氨基己酸、己内酰胺、己二胺或乙酰丙酸的非天然存在有机体。这种条件下的连续培养可包括,例如,1天、2天、3天、4天、5天、6天或7天或更长时间。此外,连续培养可包括1周、2周、3周、4或5周或更长周以及长达几个月。可选择地,如果适用于特定应用,则有机体可培养数小时。应当理解,所述连续和/或近连续的培养条件还可包括在这些示例性周期之间的所有时间间隔。还应当理解,培养微生物有机体的时间是足够长以生产足够量的用于所需目的的产品的时间。
发酵程序是本领域公知的。简而言之,用于生物合成生产6-氨基己酸、己内酰胺、己二胺或乙酰丙酸的发酵,可用于例如补料分批发酵和分批分离;补料分批发酵和连续分离,或连续发酵和连续分离。分批和连续发酵程序的示例是本领域公知的。
除了使用6-氨基己酸、己内酰胺、己二胺或乙酰丙酸生产者连续生产大量6-氨基己酸、己内酰胺、己二胺或乙酰丙酸的上述发酵程序之外,如果需要,6-氨基己酸、己内酰胺、己二胺或乙酰丙酸生产者还可以,例如,同时进行化学合成程序以将产物转化为其他化合物,或者可将产物从发酵培养物中分离并继而进行化学转化以将产物转化为其他化合物。如本文所述,利用3-氧代己二酸、六-2-烯二酸的己二酸途径中的中间体可例如通过铂催化剂进行化学氢化而转化为己二酸。
如本文所述,用于实现6-氨基己酸、己内酰胺、己二胺或乙酰丙酸的生物合成的示例性生长条件包括向培养条件添加渗透保护剂。在某些实施方式中,如本文所述,在渗透保护剂存在下,非天然存在的微生物有机体可被维持、培养或发酵。简而言之,渗透保护剂意指用作渗透剂,并且帮助如本文所述的微生物有机体在渗透胁迫中存活的化合物。渗透保护剂包括但不限于甜菜碱、氨基酸和糖海藻糖。其非限制性示例是甘氨酸甜菜碱、脯氨酸甜菜碱、二甲基噻亭、二甲基磺酰丙酸酯、3-二甲基磺酰-2-甲基丙酸酯、哌可酸、二甲基硫代乙酸、胆碱、L-肉碱和四氢嘧啶。在一个方面,渗透保护剂是甘氨酸甜菜碱。本领域普通技术人员应理解,适用于保护本文所述微生物有机体不受渗透胁迫影响的渗透保护剂的量和类型,将取决于所使用的微生物有机体。例如,如实施例XXII中所述,在不同量的6-氨基己酸存在下,大肠杆菌在2mM甘氨酸甜菜碱存在下合适地生长。培养条件下的渗透保护剂的量,可以是例如,不超过约0.1mM、不超过约0.5mM、不超过约1.0mM、不超过约1.5mM、不超过约2.0mM、不超过约2.5mM、不超过约3.0mM、不超过约5.0mM、不超过约7.0mM、不超过约10mM、不超过约50mM、不超过约100mM或不超过约500mM。
成功地将途径工程化涉及鉴定合适的具有足够活性和特异性的酶组。这需要鉴定合适的酶组,将其相应的基因克隆到生产宿主中,优化发酵条件,并测定发酵后的产物形成。为了将用于生产6-氨基己酸或己内酰胺的生产宿主工程化,可在宿主微生物体中表达一种或多种外源DNA序列。此外,微生物体可具有功能性缺失的一个或多个内源基因。这些修改将允许使用可再生原料生产6-氨基己酸或己内酰胺。
在一些实施方式中,在6-氨基己酸向HMD转化期间,最小化甚至消除环状亚胺或己内酰胺形成,需要向6-氨基己酸的胺基添加官能团(例如,乙酰基、琥珀酰基),以保护其不发生环化。这类似于大肠杆菌中从L-谷氨酸形成鸟氨酸。具体而言,首先谷氨酸通过N-乙酰谷氨酸合成酶转化为N-乙酰基-L-谷氨酸。然后N-乙酰基-L-谷氨酸活化为N-乙酰谷氨酰-磷酸,N-乙酰谷氨酰-磷酸被还原并转氨以形成N-乙酰基-L-鸟氨酸。然后通过N-乙酰基-L-鸟氨酸脱乙酰酶从N-乙酰基-L-鸟氨酸中除去乙酰基,从而形成L-鸟氨酸。这样的途径是必要的,因为从谷氨酸形成谷氨酸-5-磷酸,然后还原成谷氨酸-5-半醛导致形成(S)-1-吡咯啉-5-羧酸,一种由谷氨酸-5-半醛自发形成的环状亚胺。在从6-氨基己酸形成HMDA的情况下,该步骤可包括将6-氨基己酸乙酰化为乙酰基-6-氨基己酸,用CoA或磷酸酯基团活化羧酸基团,还原、胺化和脱乙酰化。
实验
实施例1.5-羧基-2-戊烯酰-CoA还原酶的鉴定。
从文献以及以生物信息学方式用使用基本局部比对搜索工具(BLAST)从公共数据库中鉴定编码5-羧基-2-戊烯酰-CoA还原酶(Ter)的基因(表3)。合成编码每种还原酶的基因,在大肠杆菌中表达,并使用酶偶联测定评估5-羧基-2-戊烯酰-CoA(CPCoA)还原酶活性。
将编码表3的TER酶候选物的基因克隆到低拷贝载体中在组成型启动子下,并使用标准技术将构建体转化到大肠杆菌中。将转化体在含有抗生素的LB培养基中在35℃下培养过夜,然后将细胞在室温下以15000rpm的速度离心。为了制备裂解物,去除上清液并将表达Ter基因的大肠杆菌细胞重新悬浮在含有溶菌酶、核酸酶和10mM DTT的化学裂解溶液中。立即使用裂解物。
偶联测定中使用的材料包括三种纯化的酶:3-氧代己二酰-CoA硫解酶(“硫解酶”或Thl)、3-氧代己二酰-CoA脱氢酶(“Hbd”)和3-氧代己二酰-CoA脱水酶(“巴豆酸酶”或Crt),以及底物包括:琥珀酰-CoA和乙酰-CoA以生成CPCoA。在这些产生Thl、Hbd和Crt底物的酶的存在下,测试了表达Ter基因的大肠杆菌裂解物的活性。
酶偶联测定由三种成分组成:
1)含有pH7.5的0.1M Tris-HCl、1mM乙酰-CoA、1mM琥珀酰-CoA、0.25mM NADH和0.25mM NADPH的底物溶液;
2)偶联酶混合物,其中含有5μM Thl、1μM Hbd和1μM Crt;和
3)TER裂解物。
乙酰-CoA、琥珀酰-CoA、NADH和NADPH购自Sigma。
添加偶联酶混合物(5μL)和TER裂解物(5μL)到底物溶液(30μL)中,测定开始。反应混合物在室温下孵育,通过NAD(P)H在340nm处的吸光度相对于不含TER蛋白的裂解物的线性下降来监测活性。此外,还评估了一些TER候选物对巴豆酰-CoA的活性。巴豆酰-CoA购自商业供应商。相对于野生型对照(热带假丝酵母菌,SEQ ID NO:1)具有显著活性的TER酶候选物被标示为正号(+),而几乎没有可检测的活性被标示为负号(-)。ND=未测定。
表3. 5-羧基-2-戊烯酰-CoA还原酶。
Figure BDA0003432542400000291
Figure BDA0003432542400000301
实施例2.5-羧基-2-戊烯酰-CoA还原酶的体内活性。
两种已鉴定的5-羧基-2-戊烯酰-CoA还原酶也在体内测定中进行了测试,其中被修饰以表达编码3-氧代己二酰-CoA硫解酶(Thl)、3-氧代己二酰-CoA脱氢酶(Hbd)和3-氧代己二酰-CoA脱水酶(“巴豆酸酶”或Crt)的基因的大肠杆菌菌株用包含5-羧基-2-戊烯酰-CoA还原酶基因的构建体转化。将编码热带假丝酵母TER酶的基因(SEQ ID NO:1,称为候选物#1)和编码黑腹果蝇TER的基因(SEQ ID NO:24,候选物#24)分别克隆到低拷贝质粒载体中在组成型启动子下。假丝酵母和果蝇TER的氨基酸序列大约有40%相同;氨基酸序列比对如图3所示。将表达Ter基因的载体转化到Thl/Hbd/Crt大肠杆菌菌株中。然后测试转化体的己二酸生产。在基本培养基中,用2%葡萄糖饲养工程化的大肠杆菌细胞,在35℃下孵育18小时后,收获细胞,并通过分析型HPLC或标准LC/MS分析方法对上清液评估己二酸生产。如表4所示,在大肠杆菌中的编码假丝酵母和果蝇TER酶的基因(包括Thl、Hbd和Crt基因)的表达,导致这些菌株产生己二酸。
此外,为了测试假丝酵母和果蝇Ter基因在6-氨基己酸(6ACA)途径中的功能,将用于表达假丝酵母和果蝇Ter基因的构建体转化到大肠杆菌菌株中,其中除Thl、Hbd和Crt基因以外,还包括编码醛脱氢酶(TER)和转氨酶(TA)的基因。这种Thl、Hbd、Crt、TER、TA大肠杆菌菌株包括生产6-氨基己酸(6ACA)所需的所有途径酶,但TER酶除外。使用的Thl、Hbd、Crt、Ter、Ald基因在US8,377,680(例如,实施例8)中报道。
如上所述,用假丝酵母和果蝇Ter构建体对Thl、Hbd、Crt、TER、TA大肠杆菌菌株进行转化,并将携带假丝酵母和果蝇Ter基因的转化体在35℃下培养18小时。通过离心收获大肠杆菌细胞后,使用标准分析方法分析上清液中的6ACA。
表4. 5-羧基-2-戊烯酰-CoA还原酶的体内活性。
Figure BDA0003432542400000302
表4示出了将Ter基因添加到包括编码酶Thl、Hbd、Crt、TER和TA的基因的菌株中导致产生6ACA。
实施例3.Ter基因的靶向诱变。
使用结构引导设计,然后通过在Q52、V105、S148、V149、T153、V301、T302和N307的密码子处、以及Q11、A39、S48、S59、G97、S103、H104、N106、F107、I147、L152、L156、R200、D201、R202、E303、K306、N308、和L316的密码子处使编码假丝酵母TER酶(SEQ ID NO:1)的基因突变,来产生编码假丝酵母TER酶(SEQ ID NO:1)的基因的变体。类似地,使用结构引导设计,然后通过在用于S96、L98、V129、M274、T275的密码子处使编码假丝酵母TER酶(SEQ IDNO:1)的基因突变,来产生编码假丝酵母TER酶(SEQ ID NO:1)的基因的变体。使用简并引物序列和PCR进行氨基酸位置的置换,其中将改变的基因序列混合物转化到大肠杆菌中。
如实施例1中所述在裂解物测定中测试转化体,并在裂解物测定中重新测试在测定中提供表现出高于野生型对照(SEQ ID NO:1或SEQ ID NO:24)活性的裂解物的克隆,该裂解物测定重复三次。然后对表现出高于野生型活性的克隆进行处理,以对它们所含的Ter基因进行序列分析。表5提供了在活性克隆的变体Ter基因序列中发现的突变。表现出高于野生型活性的变体,表示为“++”或“+++”,包括Ter基因中的单个突变和组合(多个)突变。
表5. 5-羧基-2-戊烯酰-CoA还原酶的工程化变体
Figure BDA0003432542400000311
Figure BDA0003432542400000321
Figure BDA0003432542400000331
在包括优选底物(CPCoA或CrCoA)的一式两份的裂解物测定中测试了一些变体,其中一种测定仅包括NADH作为辅因子,而另一种测定仅包括NADPH作为辅因子。使用变体在使用每种辅因子的测定中的相对活性来确定变体的辅因子偏好,如表5中提供的。
表5显示出,相对于野生型TER酶(SEQ ID NO:1或SEQ ID NO:24),使用CPCoA底物的许多变体具有增加的活性。使用巴豆酰-CoA底物,许多变体显示出活性。此外,发现在R200位置和/或R202位置具有突变的多个变体具有NADH底物偏好,这与野生型TER不同,野生型TER显示出NADPH作为辅因子的偏好。
实施例4.变体5-羧基-2-戊烯酰-CoA还原酶的体内活性。
还使用实施例2中描述的体内测定评估了具有1个至8个突变氨基酸的TER变体在用于制造己二酸的途径和用于产生6ACA的途径中发挥作用的能力。许多变体被证明在己二酸和6ACA途径中都起作用(表5)。图2提供了野生型假丝酵母同源物(SEQ ID NO:1)和变体2、3、4、9和19的测定结果的示例,其中TER变体活性以野生型TER活性的比例图示地提供。
表6.TER变体在体内试验中的活性
Figure BDA0003432542400000332
Figure BDA0003432542400000341
Figure BDA0003432542400000351
序列表
<110> 基因组股份公司
阿米特·M·沙阿
哈里什·纳加拉让
迈克尔·A·诺博
<120> 工程化反式烯酰COA还原酶及其制备方法和使用方法
<130> GNO0098/WO
<150> US 62/860,123
<151> 2019-06-11
<160> 49
<170> PatentIn version 3.5
<210> 1
<211> 364
<212> PRT
<213> Candida tropicalis
<400> 1
Met Ile Thr Ala Gln Ala Val Leu Tyr Thr Gln His Gly Glu Pro Lys
1 5 10 15
Asp Val Leu Phe Thr Gln Ser Phe Glu Ile Asp Asp Asp Asn Leu Ala
20 25 30
Pro Asn Glu Val Ile Val Lys Thr Leu Gly Ser Pro Val Asn Pro Ser
35 40 45
Asp Ile Asn Gln Ile Gln Gly Val Tyr Pro Ser Lys Pro Ala Lys Thr
50 55 60
Thr Gly Phe Gly Thr Thr Glu Pro Ala Ala Pro Cys Gly Asn Glu Gly
65 70 75 80
Leu Phe Glu Val Ile Lys Val Gly Ser Asn Val Leu Ser Leu Glu Ala
85 90 95
Gly Asp Trp Val Ile Pro Ser His Val Asn Phe Gly Thr Trp Arg Thr
100 105 110
His Ala Leu Gly Asn Asp Asp Asp Phe Ile Lys Leu Pro Asn Pro Ala
115 120 125
Gln Ser Lys Ala Asn Gly Lys Pro Asn Gly Leu Thr Ile Asn Gln Gly
130 135 140
Ala Thr Ile Ser Val Asn Pro Leu Thr Ala Tyr Leu Met Leu Thr His
145 150 155 160
Tyr Val Lys Leu Thr Pro Gly Lys Asp Trp Phe Ile Gln Asn Gly Gly
165 170 175
Thr Ser Ala Val Gly Lys Tyr Ala Ser Gln Ile Gly Lys Leu Leu Asn
180 185 190
Phe Asn Ser Ile Ser Val Ile Arg Asp Arg Pro Asn Leu Asp Glu Val
195 200 205
Val Ala Ser Leu Lys Glu Leu Gly Ala Thr Gln Val Ile Thr Glu Asp
210 215 220
Gln Asn Asn Ser Arg Glu Phe Gly Pro Thr Ile Lys Glu Trp Ile Lys
225 230 235 240
Gln Ser Gly Gly Glu Ala Lys Leu Ala Leu Asn Cys Val Gly Gly Lys
245 250 255
Ser Ser Thr Gly Ile Ala Arg Lys Leu Asn Asn Asn Gly Leu Met Leu
260 265 270
Thr Tyr Gly Gly Met Ser Phe Gln Pro Val Thr Ile Pro Thr Ser Leu
275 280 285
Tyr Ile Phe Lys Asn Phe Thr Ser Ala Gly Phe Trp Val Thr Glu Leu
290 295 300
Leu Lys Asn Asn Lys Glu Leu Lys Thr Leu Thr Leu Asn Gln Ile Ile
305 310 315 320
Ala Trp Tyr Glu Glu Gly Lys Leu Thr Asp Ala Lys Ser Ile Glu Thr
325 330 335
Leu Tyr Asp Gly Thr Lys Pro Leu His Glu Leu Tyr Gln Asp Gly Val
340 345 350
Ala Asn Ser Lys Asp Gly Lys Gln Leu Ile Thr Tyr
355 360
<210> 2
<400> 2
000
<210> 3
<400> 3
000
<210> 4
<211> 393
<212> PRT
<213> Cephaloticoccus primus
<400> 4
Met Ile Ile Lys Pro Lys Val Arg Gly Phe Val Cys Val Thr Ala His
1 5 10 15
Pro Asp Gly Cys Ala Ala His Val Gln Glu Trp Ile Asp Tyr Val Lys
20 25 30
Ala Gln Pro Ala Ile Glu Gly Gly Pro Lys Lys Val Leu Val Ile Gly
35 40 45
Ser Ser Thr Gly Tyr Gly Leu Ala Ser Arg Leu Ala Leu Ala Phe Gly
50 55 60
Ala Arg Ala Ser Thr Leu Gly Val Phe Phe Glu Arg Pro Ser Glu Glu
65 70 75 80
Gly Arg Pro Ala Thr Pro Gly Trp Tyr Asn Thr Ile Ala Leu Thr Lys
85 90 95
Ala Ala Arg Ala Glu Gly Leu Tyr Ala Arg Asn Ile Met Gly Asp Ala
100 105 110
Phe Ser Asp Glu Ile Lys Ala Gln Thr Ile Glu Ala Ile Lys Ala Asp
115 120 125
Leu Gly Gln Val Asp Leu Val Val Tyr Ser Leu Ala Ser Pro Arg Arg
130 135 140
Val His Pro Lys Thr Gly Thr Val His Lys Ser Cys Leu Lys Pro Ile
145 150 155 160
Gly Ala Pro Tyr Thr Asn Lys Thr Val Asp Thr Asp Lys Gly Leu Val
165 170 175
Ser Thr Ile Thr Ile Glu Pro Ala Ser Ala Glu Glu Val Ala Glu Thr
180 185 190
Val Ala Val Met Gly Gly Glu Asp Trp Glu Met Trp Ile Asp Ala Leu
195 200 205
Ala Ala Ala Gly Val Leu Ala Pro Gly Ala Gln Ser Leu Ala Tyr Ser
210 215 220
Tyr Ile Gly Pro Glu Val Thr Trp Pro Ile Tyr Gln Asn Gly Thr Ile
225 230 235 240
Gly Met Ala Lys Asn Asp Leu Ser Arg Ala Ala Lys Ala Ile Asp Ala
245 250 255
Lys Leu Gly Ala Ser Gly Gly Arg Ala Phe Ile Ser Val Asn Lys Ala
260 265 270
Leu Val Thr Gln Ala Ser Ser Ala Ile Pro Val Val Pro Leu Tyr Ile
275 280 285
Ser Leu Leu Tyr Lys Val Met Lys Ala Ala Gly Leu His Glu Gly Cys
290 295 300
Ile Glu Gln Met His Arg Leu Phe Ala Thr Gln Val Tyr Asn Gly Asn
305 310 315 320
Ser Pro Arg Phe Asp Glu Ala Gly Arg Val Arg Ile Asp Asp Trp Glu
325 330 335
Met Arg Pro Glu Ile Gln Ala Ala Val Ala Arg Leu Trp Pro Thr Ile
340 345 350
Thr Thr Glu Asn Leu Glu Ala Glu Thr Asp Ile Ala Gly Tyr Arg Ala
355 360 365
Glu Phe Leu Lys Leu Phe Gly Phe Gly Leu Pro Gly Val Asp Tyr Glu
370 375 380
Ala Pro Ala Glu Pro His Val Pro Leu
385 390
<210> 5
<211> 396
<212> PRT
<213> Opitutaceae TSB47
<400> 5
Met Val Ile Lys Pro Lys Val Arg Gly Phe Ile Cys Val Thr Ala His
1 5 10 15
Pro Ala Gly Cys Ala Ala His Val Gln Gln Gln Ile Asp Tyr Val Lys
20 25 30
Ser Lys Gly Pro Val Arg Asp Gly Pro Lys Lys Val Leu Val Leu Gly
35 40 45
Ala Ser Thr Gly Phe Gly Leu Ala Ser Arg Val Thr Ala Ala Phe Gly
50 55 60
Ser Gly Ala Ala Thr Leu Gly Val Phe Phe Glu Arg Pro Ser Glu Asp
65 70 75 80
Gly Arg Leu Ala Thr Pro Gly Trp Tyr Asn Ser Ala Ala Phe Thr Arg
85 90 95
Ala Ala Leu Asp Ala Gly Leu Tyr Ala Lys Asn Ile Asn Gly Asp Ala
100 105 110
Phe Ser Asp Ala Val Lys Arg Gln Ala Ile Asp Leu Ile Lys Ala Asp
115 120 125
Leu Gly Gln Val Asp Leu Val Val Tyr Ser Leu Ala Ser Pro Arg Arg
130 135 140
Thr His Pro Arg Thr Gly Ala Thr His Lys Ser Cys Leu Lys Pro Ile
145 150 155 160
Gly Ala Pro Tyr Thr Asn Lys Thr Val Asp Thr Asp Arg Gly Ile Val
165 170 175
Ser Asp Val Thr Ile Glu Pro Ala Thr Glu Thr Glu Ile Ala Asp Thr
180 185 190
Val Ala Val Met Gly Gly Glu Asp Trp Glu Met Trp Ile Asp Ala Leu
195 200 205
Leu Glu Ala Gly Val Leu Ala Pro Gly Ala Thr Ser Val Ala Tyr Ser
210 215 220
Tyr Ile Gly Pro Glu Val Thr Trp Pro Ile Tyr Lys Asn Gly Thr Ile
225 230 235 240
Gly Thr Ala Lys Ile Asp Leu Glu Arg Ala Ala Lys Lys Ile Asp Ala
245 250 255
Ala Leu Lys Ala His Gly Tyr Gly Arg Ala Phe Ile Ser Val Asn Lys
260 265 270
Ala Leu Val Thr Gln Ala Ser Ser Ala Ile Pro Val Val Pro Leu Tyr
275 280 285
Ile Ser Ile Leu Tyr Lys Ile Met Lys Ala Lys Gly Leu His Glu Gly
290 295 300
Cys Ile Glu Gln Met Gln Arg Leu Phe Ala Thr Gln Leu Tyr Asn Gly
305 310 315 320
Ser Ala Leu Ala Phe Asp Asp Gly Gly Arg Val Arg Val Asp Asn Trp
325 330 335
Glu Met Arg Pro Asp Val Gln Ala Glu Ala Ala Lys Ile Trp Pro Gln
340 345 350
Val Thr Thr Glu Asn Leu Ala Ala Leu Thr Asp Ile Glu Gly Tyr Arg
355 360 365
Ser Glu Phe Leu Arg Leu Phe Gly Phe Gly Leu Pro Gly Val Asn Tyr
370 375 380
Asp Ala Asp Tyr Glu Pro His Val Pro Met Pro Glu
385 390 395
<210> 6
<211> 392
<212> PRT
<213> Puniceicoccaceae MEDG31
<400> 6
Met Ile Val Lys Pro Arg Ile Arg Gly Phe Val Cys Ile Thr Ala His
1 5 10 15
Pro Val Gly Cys Thr Ala Lys Val Gln Arg Glu Ile Glu Val Ala Lys
20 25 30
Ala Ala Arg Gln Ser Gly Gly Pro Lys Lys Val Leu Val Ile Gly Ala
35 40 45
Ser Thr Gly Tyr Gly Leu Ser Ser Arg Ile Ala Ala Ala Phe Gly Ser
50 55 60
Asp Ala Ala Thr Leu Gly Val Phe Tyr Glu Arg Pro Ser Leu Lys Gly
65 70 75 80
Lys Pro Ala Ser Ala Gly Trp Tyr Asn Ser Ala Ala Phe Glu Ser Ala
85 90 95
Ala His Thr Ser Gly Leu Tyr Ala Lys Ser Ile Asn Gly Asp Ala Phe
100 105 110
Ser Thr Glu Val Lys Glu Gln Thr Ile Asp Met Ile Lys Ala Asp Leu
115 120 125
Gly Gln Val Asp Leu Val Ile Tyr Ser Leu Ala Ser Pro Arg Arg Thr
130 135 140
Asp Pro Ala Ser Gly Glu Thr Tyr Arg Ser Cys Leu Lys Pro Ile Gly
145 150 155 160
Gly Thr Tyr Thr Asn Arg Thr Leu Asp Thr Asp Lys Ala Gln Val Ser
165 170 175
Asp Ile Thr Ile Asp Ala Ala Thr Lys Gln Glu Ala Glu Asp Thr Val
180 185 190
Lys Val Met Gly Gly Glu Asp Trp Glu Leu Trp Met Gln Ala Leu Ala
195 200 205
Gln Ala Gly Val Val Ala Gln Gly Ala Lys Thr Val Ala Tyr Ser Tyr
210 215 220
Ile Gly Pro Glu Ile Thr Trp Pro Val Tyr Thr Asn Gly Thr Ile Gly
225 230 235 240
Ala Ala Lys Lys Asp Val Glu Arg Ala Ala Ala Ala Ile Thr Ala Gln
245 250 255
Tyr Asp Cys Asp Ala Tyr Val Ser Val Asn Lys Ala Val Val Thr Gln
260 265 270
Ala Ser Ser Ala Ile Pro Val Val Pro Leu Tyr Ile Ser Ile Leu Phe
275 280 285
Lys Ile Met Lys Ser Lys Gly Thr His Glu Asp Cys Ile Glu Gln Thr
290 295 300
Val Arg Leu Phe Asn Gln Arg Leu Tyr Gly Gly Asp Leu Gln Leu Asp
305 310 315 320
Glu Ser Gly Arg Ile Arg Ile Asp Asp Trp Glu Met Glu Pro Glu Ile
325 330 335
Gln Ala Ala Val Gln Glu Ile Trp Pro Glu Ile Ser Ser Glu Thr Leu
340 345 350
Ile Glu Leu Ser Asp Phe Thr Gly Tyr Gln Lys Asn Phe Leu Asn Leu
355 360 365
Phe Gly Phe Ala Ile Glu Gly Val Asp Tyr Asp Val Glu Val Glu Val
370 375 380
Asp Val Pro Val Pro Ser Ile Ser
385 390
<210> 7
<211> 399
<212> PRT
<213> Rubritalea marina
<400> 7
Met Ile Val Lys Pro Lys Ile Arg Gly Phe Ile Cys Thr Thr Ala His
1 5 10 15
Pro Asp Gly Cys Ala Ala His Val Gln Glu Gln Ile Asp Tyr Val Lys
20 25 30
Ser Lys Pro Lys Leu Glu Asn Gly Pro Lys Asn Val Leu Val Ile Gly
35 40 45
Ser Ser Thr Gly Tyr Gly Leu Ala Ser Arg Ile Val Pro Ala Phe Gln
50 55 60
Ser Gly Ala Asn Thr Leu Gly Leu Phe Phe Glu Lys Pro Gly Ser Glu
65 70 75 80
Lys Arg Pro Gly Ser Ala Gly Trp Tyr Asn Ser Ala Ala Phe Glu Lys
85 90 95
Ala Ala Asn Ala Glu Gly Leu Phe Ala Lys Ser Leu Asn Gly Asp Ala
100 105 110
Phe Ser Asn Glu Leu Lys Glu Gln Ala Ile Asp Ile Ile Lys Asn Glu
115 120 125
Met Asp Gly Lys Ile Asp Leu Val Val Tyr Ser Leu Ala Ser Pro Arg
130 135 140
Arg Thr Asp Pro Asn Thr Gly Glu Val Tyr Lys Ser Val Leu Lys Thr
145 150 155 160
Thr Gly Gly Glu Tyr Thr Asn Lys Thr Leu Asn Thr Asp Lys Gly Glu
165 170 175
Ile Asp Glu Val Thr Ile Gly Ala Ala Thr Ser Glu Glu Ile Asp His
180 185 190
Thr Ile Lys Val Met Gly Gly Glu Asp Trp Glu Phe Trp Met Asp Ala
195 200 205
Leu Ile Glu Ala Asp Val Leu Asp Ser Gly Val Lys Thr Val Ala Tyr
210 215 220
Ser Tyr Ile Gly Pro Glu Leu Thr Trp Pro Ile Tyr Thr Asp Gly Thr
225 230 235 240
Ile Gly Gln Ala Lys Lys Asp Leu Glu Ser Ser Cys Ala Lys Ile Asp
245 250 255
Ala Ser Leu Lys Glu Lys Phe Asn Gly Glu Ala Phe Val Ser Val Asn
260 265 270
Lys Ala Leu Val Thr Gln Ala Ser Ser Ala Ile Pro Val Val Pro Leu
275 280 285
Tyr Ile Ser Ile Leu Tyr Lys Glu Met Lys Ala Lys Gly Thr His Glu
290 295 300
Gly Cys Ile Glu Gln Ile Glu Arg Leu Phe Ser Asp Arg Leu Tyr Ser
305 310 315 320
Gly Asp Pro Lys Leu Asp Glu Ala Gly Arg Ile Arg Ile Asp Asp Trp
325 330 335
Glu Met Arg Glu Glu Ile Gln Ser Ala Val Ala Gly Ile Trp Thr Ser
340 345 350
Val Ser Asn Glu Asn Phe Gly Asp Val Ala Asp Phe Asp Gly Tyr Gln
355 360 365
Ser Glu Phe Leu Lys Leu Phe Gly Phe Gly Leu Asp Gly Val Asp Tyr
370 375 380
Glu Ser Glu Thr Asp Thr Thr Thr Ala Val Pro Ser Leu Ala Glu
385 390 395
<210> 8
<211> 399
<212> PRT
<213> Rubritalea profundi
<400> 8
Met Ile Val Lys Pro Lys Ile Arg Gly Phe Ile Cys Thr Thr Ser His
1 5 10 15
Pro Asp Gly Cys Ala Ala His Val Gln Glu Gln Ile Asp Tyr Val Lys
20 25 30
Ser Lys Pro Lys Ser Glu Asn Gly Pro Lys Asn Val Leu Val Ile Gly
35 40 45
Ser Ser Thr Gly Tyr Gly Leu Ala Ser Arg Ile Val Pro Ala Phe Gly
50 55 60
Ala Gly Ala Asn Thr Leu Gly Leu Phe Phe Glu Lys Pro Gly Ser Glu
65 70 75 80
Lys Arg Thr Gly Ser Ala Gly Trp Tyr Asn Thr Ala Ala Phe Glu Lys
85 90 95
Ala Ala Thr Ala Glu Gly Ile Phe Ala Lys Ser Leu Asn Gly Asp Ala
100 105 110
Phe Ser Asn Glu Leu Lys Gln Gln Ala Ile Asp Ile Ile Lys Asn Asp
115 120 125
Met Asp Gly Lys Ile Asp Leu Ile Val Tyr Ser Leu Ala Ser Pro Arg
130 135 140
Arg Thr Asp Pro Asn Thr Gly Glu Val Tyr Lys Ser Val Leu Lys Thr
145 150 155 160
Thr Gly Gly Glu Tyr Thr Asn Lys Thr Leu Asn Thr Asp Lys Gly Glu
165 170 175
Val Asp Glu Val Thr Ile Gly Ala Ala Thr Ala Glu Glu Ile Asp Asn
180 185 190
Thr Val Lys Val Met Gly Gly Glu Asp Trp Glu Phe Trp Val Asn Ala
195 200 205
Leu Ala Asp Ala Asn Val Leu Ala Glu Gly Val Lys Thr Val Ala Tyr
210 215 220
Ser Tyr Ile Gly Pro Glu Leu Thr Trp Pro Ile Tyr Thr Asp Gly Thr
225 230 235 240
Ile Gly Arg Ala Lys Lys Asp Val Glu Lys Ser Cys Ala Lys Leu Asp
245 250 255
Ala Lys Leu Lys Ala Ser Leu Gly Gly Glu Ala Phe Val Ser Val Asn
260 265 270
Lys Ala Leu Val Thr Gln Ala Ser Ser Ala Ile Pro Val Val Pro Leu
275 280 285
Tyr Ile Ser Ile Leu Tyr Lys Glu Met Lys Ala Lys Gly Leu His Glu
290 295 300
Gly Cys Ile Glu Gln Ile Glu Arg Leu Phe Ser Asp Arg Leu Tyr Ala
305 310 315 320
Ala Asp Arg Lys Leu Asp Glu Ala Gly Arg Ile Arg Ile Asp Asp Leu
325 330 335
Glu Met Arg Asp Asp Ile Gln Ala Ala Val Ala Asn Ile Trp Ser Ser
340 345 350
Val Ser Asn Glu Asn Phe Ala Asp Val Ala Asp Phe Lys Gly Tyr Lys
355 360 365
Asp Glu Phe Leu Lys Leu Phe Gly Phe Gly Ile Asp Gly Val Asp Tyr
370 375 380
Asp Ala Glu Ile Asp Pro Ala Thr Gly Val Pro Ser Leu Ala Glu
385 390 395
<210> 9
<211> 398
<212> PRT
<213> Rubritalea squalenifa
<400> 9
Met Ile Val Ser Pro Lys Ile Arg Gly Phe Ile Cys Thr Thr Ala His
1 5 10 15
Pro Asp Gly Cys Ala Ala His Val Gln Glu Gln Ile Asp Tyr Val Lys
20 25 30
Ser Lys Pro Lys Leu Glu Asn Gly Pro Lys Asn Val Leu Val Ile Gly
35 40 45
Ala Ser Thr Gly Tyr Gly Leu Ala Ser Arg Ile Val Pro Ala Phe Ala
50 55 60
Ser Gly Ala Asn Thr Leu Gly Leu Phe Phe Glu Lys Pro Gly Ser Glu
65 70 75 80
Lys Arg Thr Gly Ser Ala Gly Trp Tyr Asn Ser Ala Ala Phe Glu Lys
85 90 95
Ala Ala Thr Ala Glu Gly Leu Phe Ala Lys Ser Leu Asn Gly Asp Ala
100 105 110
Phe Ser His Glu Met Lys Ala Gln Ala Val Asp Ile Ile Lys Asn Glu
115 120 125
Met Gly Gly Lys Ile Asp Leu Val Val Tyr Ser Leu Ala Ser Pro Arg
130 135 140
Arg Thr Asp Pro Asp Thr Gly Glu Val Tyr Lys Ser Val Leu Lys Thr
145 150 155 160
Thr Gly Gly Asp Tyr Thr Asn Lys Thr Leu Asn Thr Asp Lys Gly Glu
165 170 175
Val Glu Glu Val Thr Ile Gly Ala Ala Thr Pro Glu Glu Ile Glu His
180 185 190
Thr Ile Lys Val Met Gly Gly Glu Asp Trp Glu Leu Trp Met Asn Ala
195 200 205
Leu Ser Asp Ala Gly Val Leu Ala Asp Gly Val Lys Thr Val Ala Tyr
210 215 220
Ser Tyr Ile Gly Pro Glu Leu Thr Trp Pro Ile Tyr Thr Asp Gly Thr
225 230 235 240
Ile Gly Gln Ala Lys Lys Asp Leu Glu Lys Ser Cys Ala Gln Leu Asn
245 250 255
Glu Lys Leu Ser Ser Leu Asn Gly Glu Ala Tyr Val Ser Val Asn Lys
260 265 270
Ala Leu Val Thr Gln Ala Ser Ser Ala Ile Pro Val Val Pro Leu Tyr
275 280 285
Ile Ser Ile Leu Tyr Lys Glu Met Lys Glu Lys Gly Leu His Glu Gly
290 295 300
Cys Ile Glu Gln Ile Glu Arg Leu Phe Ala Asp Arg Leu Tyr Ser Gly
305 310 315 320
Asp Ala Lys Leu Asp Glu Ala Gly Arg Ile Arg Ile Asp Asp Trp Glu
325 330 335
Met Arg Asp Asp Ile Gln Ser Ala Val Ala Glu Lys Trp Lys Thr Val
340 345 350
Ser Asn Glu Asn Phe Ser Glu Ile Ala Asp Phe Gln Gly Tyr Gln Asp
355 360 365
Glu Phe Leu Lys Leu Phe Gly Phe Gly Leu Glu Gly Val Asn Tyr Glu
370 375 380
Ala Asp Thr Asp Pro Ala Thr Gly Val Pro Ser Ile Ala Glu
385 390 395
<210> 10
<400> 10
000
<210> 11
<211> 400
<212> PRT
<213> Vibrio hepatarius
<400> 11
Met Ile Ile Lys Pro Arg Ile Arg Gly Phe Ile Cys Thr Thr Thr His
1 5 10 15
Pro Val Gly Cys Glu Ala Asn Val Lys Glu Gln Ile Ala Tyr Thr Lys
20 25 30
Ala Gln Gly Pro Ile Lys Asn Ala Pro Lys Arg Val Leu Val Val Gly
35 40 45
Ala Ser Ser Gly Tyr Gly Leu Ser Ser Arg Ile Ala Ala Ala Phe Gly
50 55 60
Gly Gly Ala Ser Thr Ile Gly Val Phe Phe Glu Lys Glu Gly Thr Glu
65 70 75 80
Lys Lys Pro Gly Thr Ala Gly Phe Tyr Asn Ala Ala Ala Phe Glu Lys
85 90 95
Leu Ala Arg Glu Glu Gly Leu Tyr Ala Lys Ser Leu Asn Gly Asp Ala
100 105 110
Phe Ser Asn Glu Ala Lys Gln Lys Thr Ile Glu Leu Ile Lys Glu Asp
115 120 125
Leu Gly Gln Val Asp Met Val Val Tyr Ser Leu Ala Ser Pro Val Arg
130 135 140
Lys Met Pro Glu Thr Gly Glu Leu Val Arg Ser Ala Leu Lys Pro Ile
145 150 155 160
Gly Glu Thr Tyr Thr Ser Thr Ala Val Asp Thr Asn Lys Asp Val Ile
165 170 175
Ile Glu Ala Ser Val Glu Pro Ala Thr Glu Glu Glu Ile Lys Asp Thr
180 185 190
Val Thr Val Met Gly Gly Glu Asp Trp Glu Leu Trp Ile Asn Ala Leu
195 200 205
Ser Glu Ala Gly Val Leu Ala Glu Gly Cys Lys Thr Val Ala Tyr Ser
210 215 220
Tyr Ile Gly Thr Glu Leu Thr Trp Pro Ile Tyr Trp Asp Gly Ala Leu
225 230 235 240
Gly Lys Ala Lys Met Asp Leu Asp Arg Ala Ala Thr Ala Leu Asn Glu
245 250 255
Lys Leu Ala Ala Thr Gly Gly Ser Ala Asn Val Ala Val Leu Lys Ser
260 265 270
Val Val Thr Gln Ala Ser Ser Ala Ile Pro Val Met Pro Leu Tyr Ile
275 280 285
Ala Met Val Phe Lys Lys Met Arg Glu Glu Gly Val His Glu Gly Cys
290 295 300
Met Glu Gln Ile Tyr Arg Met Phe Ser Gln Arg Leu Tyr Lys Glu Asp
305 310 315 320
Gly Ser Ala Ala Glu Val Asp Glu Lys Asn Arg Leu Arg Leu Asp Asp
325 330 335
Trp Glu Leu Arg Glu Asp Ile Gln Gln His Cys Arg Asp Leu Trp Pro
340 345 350
Gln Ile Thr Thr Glu Asn Leu Lys Glu Leu Thr Asp Tyr Val Glu Tyr
355 360 365
Lys Glu Glu Phe Leu Lys Leu Phe Gly Phe Gly Val Asp Gly Val Asp
370 375 380
Tyr Glu Ala Asp Val Asn Pro Ala Val Glu Ala Asp Phe Ile Ala Ile
385 390 395 400
<210> 12
<400> 12
000
<210> 13
<400> 13
000
<210> 14
<211> 400
<212> PRT
<213> Vibrio sp. EJY3
<400> 14
Met Ile Ile Lys Pro Arg Ile Arg Gly Phe Ile Cys Thr Thr Thr His
1 5 10 15
Pro Val Gly Cys Glu Ala Asn Val Lys Glu Gln Ile Ala Tyr Thr Lys
20 25 30
Ala Gln Gly Pro Ile Lys Asn Ala Pro Lys Arg Val Leu Val Val Gly
35 40 45
Ala Ser Ser Gly Tyr Gly Leu Ser Ser Arg Ile Ala Ala Ala Phe Gly
50 55 60
Gly Gly Ala Ser Thr Ile Gly Val Phe Phe Glu Lys Glu Gly Thr Glu
65 70 75 80
Lys Lys Pro Gly Thr Ala Gly Phe Tyr Asn Ala Ala Ala Phe Glu Lys
85 90 95
Leu Ala Arg Glu Glu Gly Leu Tyr Ala Lys Ser Leu Asn Gly Asp Ala
100 105 110
Phe Ser Asn Glu Ala Lys Glu Lys Thr Ile Glu Leu Ile Lys Gln Asp
115 120 125
Leu Gly Gln Ile Asp Met Val Val Tyr Ser Leu Ala Ser Pro Val Arg
130 135 140
Lys Leu Pro Glu Thr Gly Glu Leu Ile Arg Ser Ser Leu Lys Pro Ile
145 150 155 160
Gly Glu Thr Tyr Thr Ser Thr Ala Val Asp Thr Asn Lys Asp Val Ile
165 170 175
Ile Glu Ala Ser Val Glu Pro Ala Thr Glu Glu Glu Ile Lys Asp Thr
180 185 190
Val Thr Val Met Gly Gly Glu Asp Trp Glu Leu Trp Ile Asn Ala Leu
195 200 205
Ser Glu Ala Gly Val Leu Ala Glu Gly Cys Lys Thr Val Ala Tyr Ser
210 215 220
Tyr Ile Gly Thr Glu Leu Thr Trp Pro Ile Tyr Trp Asp Gly Ala Leu
225 230 235 240
Gly Lys Ala Lys Met Asp Leu Asp Arg Ala Ala Thr Ala Leu Asn Glu
245 250 255
Lys Leu Ala Gln Thr Gly Gly Ser Ala Asn Val Ala Val Leu Lys Ser
260 265 270
Val Val Thr Gln Ala Ser Ser Ala Ile Pro Val Met Pro Leu Tyr Ile
275 280 285
Ala Met Val Phe Lys Lys Met Arg Glu Glu Gly Val His Glu Gly Cys
290 295 300
Met Glu Gln Ile Tyr Arg Met Phe Ser Gln Arg Leu Tyr Lys Glu Asp
305 310 315 320
Gly Ser Ala Ala Glu Val Asp Asp Met Asn Arg Leu Arg Leu Asp Asp
325 330 335
Trp Glu Leu Arg Glu Asp Ile Gln Gln His Cys Arg Asp Leu Trp Pro
340 345 350
Gln Ile Thr Thr Glu Asn Leu Lys Glu Leu Thr Asp Tyr Val Glu Tyr
355 360 365
Lys Glu Glu Phe Leu Lys Leu Phe Gly Phe Gly Val Asp Gly Val Asp
370 375 380
Tyr Glu Ala Asp Val Asn Pro Ala Val Glu Ala Asp Phe Ile Gln Ile
385 390 395 400
<210> 15
<211> 341
<212> PRT
<213> Arabidopsis thaliana
<400> 15
Met Glu Thr Pro Thr Leu Cys Ile Lys Ser Phe Ser Thr Ile Met Ser
1 5 10 15
Pro Pro Ser Lys Ala Ile Val Tyr Glu Glu His Gly Ser Pro Asp Ser
20 25 30
Val Thr Arg Leu Val Asn Leu Pro Pro Val Glu Val Lys Glu Asn Asp
35 40 45
Val Cys Val Lys Met Ile Ala Ala Pro Ile Asn Pro Ser Asp Ile Asn
50 55 60
Arg Ile Glu Gly Val Tyr Pro Val Arg Pro Pro Val Pro Ala Val Gly
65 70 75 80
Gly Tyr Glu Gly Val Gly Glu Val Tyr Ala Val Gly Ser Asn Val Asn
85 90 95
Gly Phe Ser Pro Gly Asp Trp Val Ile Pro Ser Pro Pro Ser Ser Gly
100 105 110
Thr Trp Gln Thr Tyr Val Val Lys Glu Glu Ser Val Trp His Lys Ile
115 120 125
Asp Lys Glu Cys Pro Met Glu Tyr Ala Ala Thr Ile Thr Val Asn Pro
130 135 140
Leu Thr Ala Leu Arg Met Leu Glu Asp Phe Val Asn Leu Asn Ser Gly
145 150 155 160
Asp Ser Val Val Gln Asn Gly Ala Thr Ser Ile Val Gly Gln Cys Val
165 170 175
Ile Gln Leu Ala Arg Leu Arg Gly Ile Ser Thr Ile Asn Leu Ile Arg
180 185 190
Asp Arg Ala Gly Ser Asp Glu Ala Arg Glu Gln Leu Lys Ala Leu Gly
195 200 205
Ala Asp Glu Val Phe Ser Glu Ser Gln Leu Asn Gly Asn Leu Pro Glu
210 215 220
Pro Ala Leu Gly Phe Asn Cys Val Gly Gly Asn Ala Ala Ser Leu Val
225 230 235 240
Leu Lys Tyr Leu Arg Glu Gly Gly Thr Met Val Thr Tyr Gly Gly Met
245 250 255
Ser Lys Lys Pro Ile Thr Val Ser Thr Thr Ser Phe Ile Phe Lys Asp
260 265 270
Leu Ala Leu Arg Gly Phe Trp Leu Gln Ser Trp Leu Ser Met Gly Lys
275 280 285
Val Lys Glu Cys Arg Glu Met Ile Asp Tyr Leu Leu Gly Leu Ala Arg
290 295 300
Asp Gly Lys Leu Lys Tyr Glu Thr Glu Leu Val Pro Phe Glu Glu Phe
305 310 315 320
Pro Val Ala Leu Asp Lys Ala Leu Gly Lys Leu Gly Arg Gln Pro Lys
325 330 335
Gln Val Ile Thr Phe
340
<210> 16
<400> 16
000
<210> 17
<211> 393
<212> PRT
<213> Coraliomargarita sp
<400> 17
Met Ile Val Lys Pro Arg Ile Arg Gly Phe Val Cys Ile Thr Ala His
1 5 10 15
Pro Leu Gly Cys Glu Ala Asn Val Arg Ser Glu Ile Glu Lys Ala Ser
20 25 30
Ala Ala Gln Leu Glu Gly Gly Pro Lys Lys Val Leu Val Ile Gly Ala
35 40 45
Ser Thr Gly Tyr Gly Leu Ser Ser Arg Ile Thr Ala Ala Phe Ser His
50 55 60
Gly Ala Asp Thr Leu Gly Val Phe Phe Glu Arg Pro Ser Met Lys Gly
65 70 75 80
Lys Pro Ala Ser Ala Gly Trp Tyr Asn Ser Val Ala Phe Glu Lys Ala
85 90 95
Ala His Glu Ser Gly Arg Tyr Ala Lys Ser Ile Asn Gly Asp Ala Phe
100 105 110
Ser Asn Glu Ile Lys Glu Gln Thr Ile Gln Ala Ile Lys Asp Asp Leu
115 120 125
Gly Gln Val Asp Leu Val Ile Tyr Ser Leu Ala Ser Pro Arg Arg Thr
130 135 140
Asp Pro Ser Asp Gly Glu Thr Tyr Lys Ser Cys Leu Lys Pro Leu Gly
145 150 155 160
Asp Thr Tyr Thr Asn Arg Thr Leu Asp Thr Asp Lys Gly Val Val Ser
165 170 175
Glu Val Ser Ile Glu Thr Ala Thr Ala Glu Glu Thr Glu His Thr Val
180 185 190
Lys Val Met Gly Gly Glu Asp Trp Glu Leu Trp Met Cys Ala Leu Ala
195 200 205
Asp Ala Gly Cys Leu Ala Asp Gly Ala Lys Thr Val Ala Tyr Ser Tyr
210 215 220
Val Gly Pro Glu Ile Thr Trp Pro Val Tyr Thr Asn Gly Thr Ile Gly
225 230 235 240
Ala Ala Lys Lys Asp Val Glu Arg Ala Ala Ala Ala Ile His Ser Asn
245 250 255
His Gly Cys Glu Ala Tyr Val Ser Val Asn Lys Ala Val Val Thr Gln
260 265 270
Ala Ser Ser Ala Ile Pro Val Val Pro Leu Tyr Ile Ser Ile Leu Phe
275 280 285
Lys Val Met Lys Ala Lys Gly Thr His Glu Gly Cys Ile Glu Gln Met
290 295 300
Ile Arg Leu Phe Asn Glu Arg Leu Tyr Gly Gly Gly Leu Gln Leu Asp
305 310 315 320
Glu Asp Gly Arg Ile Arg Val Asp Asp Leu Glu Met Glu Pro Asp Val
325 330 335
Gln Gly Glu Val Ala Ala Ile Trp Pro Glu Ile Gln Thr Glu Asn Leu
340 345 350
Asp Glu Arg Ser Asp Phe Ala Gly Tyr Arg Gln Asp Phe Leu Arg Cys
355 360 365
Phe Gly Phe Gly Ile Glu Gly Val Asp Tyr Glu Ala Asp Val Glu Val
370 375 380
Glu Leu Pro Leu Pro Ser Gly Asn Gln
385 390
<210> 18
<211> 399
<212> PRT
<213> Haloferula sp.
<400> 18
Met Ile Ile Ser Pro Lys Ile Arg Gly Phe Ile Cys Thr Thr Ser His
1 5 10 15
Pro Asp Gly Cys Ala Ala His Val Gln Glu Gln Ile Asp Tyr Val Lys
20 25 30
Ser Lys Pro Pro Leu Ala Asn Ala Pro Lys Arg Val Leu Val Ile Gly
35 40 45
Ser Ser Thr Gly Tyr Gly Leu Ala Ser Arg Ile Val Pro Ala Phe Gly
50 55 60
Gly Gly Ala Ala Thr Ile Gly Val Phe Phe Glu Lys Glu Gly Ser Glu
65 70 75 80
Gly Lys Thr Gly Ser Ala Gly Trp Tyr Asn Ser Val Ala Phe Glu Gln
85 90 95
Ala Ala Thr Lys Ala Gly Leu Tyr Ala Lys Ser Phe Asn Gly Asp Ala
100 105 110
Phe Ser Asn Glu Val Lys Gln Gln Val Ile Asp Ala Ile Lys Ala Asp
115 120 125
Leu Gly Thr Val Asp Met Ile Val Tyr Ser Leu Ala Ser Pro Arg Arg
130 135 140
Thr Asp Pro Ala Thr Gly Glu Val Tyr Lys Ser Val Leu Lys Pro Thr
145 150 155 160
Gly Asp Thr Tyr Thr Asn Lys Asn Leu Asn Thr Asp Lys Lys Gln Leu
165 170 175
Glu Pro Val Thr Ile Glu Pro Ala Ser Glu Asp Glu Ile Ala Gln Thr
180 185 190
Val Lys Val Met Gly Gly Glu Asp Trp Lys Leu Trp Ile Asp Ala Leu
195 200 205
Ser Gln Ala Gly Val Leu Ala Asp Gly Phe Lys Thr Val Ala Tyr Ser
210 215 220
Tyr Ile Gly Pro Glu Leu Thr Trp Ala Ile Tyr Thr Asp Gly Thr Ile
225 230 235 240
Gly Arg Ala Lys Val His Leu Glu Glu Thr Ala Lys Glu Met Asn Ala
245 250 255
Ala Phe Gly Ala Gly Thr Ala Val Val Ser Val Asn Lys Ala Leu Val
260 265 270
Thr Gln Ala Ser Ser Ala Ile Pro Val Val Pro Leu Tyr Ile Ser Ile
275 280 285
Leu Tyr Lys Ile Met Lys Ala Lys Gly Thr His Glu Gly Cys Ile Glu
290 295 300
Gln Ile Glu Arg Leu Phe Ala Asp His Tyr Gly Ala Ala Asn Gly Pro
305 310 315 320
Thr Leu Asp Asp Lys Gly Arg Ile Arg Ile Asp Asp Trp Glu Met Arg
325 330 335
Pro Glu Ile Gln Glu Glu Val Glu Lys Ile Trp Gly Ile Ile Thr Thr
340 345 350
Glu Asn Leu Asn Glu Leu Ser Asp Phe Ala Gly Tyr Gln Lys Glu Phe
355 360 365
Leu Lys Leu Phe Gly Phe Gly Leu Pro Gly Val Asp Tyr Ala Ala Glu
370 375 380
Thr Asp Ser Val Arg Pro Leu Pro Ser Leu Ser Ser Ser Pro Ala
385 390 395
<210> 19
<211> 393
<212> PRT
<213> Opitutaceae BACL24
<400> 19
Met Ile Val Lys Pro Arg Ile Arg Gly Tyr Val Cys Ile Thr Ala His
1 5 10 15
Pro Lys Gly Cys Glu Ala Lys Val Arg Glu Glu Ile Glu Val Ala Lys
20 25 30
Ala Thr Lys Arg Ser Asp Gly Pro Lys Arg Val Leu Val Leu Gly Ser
35 40 45
Ser Thr Gly Tyr Gly Leu Ser Ser Arg Ile Ala Thr Ala Phe Gly Tyr
50 55 60
Asp Ala Ala Thr Phe Gly Ile Phe Phe Glu Arg Pro Ser Thr Asn Gly
65 70 75 80
Lys Pro Ala Ser Ala Gly Trp Tyr Asn Ser Val Ala Phe Glu Lys Ala
85 90 95
Ala His Glu Ala Gly Leu Tyr Ala Lys Ser Ile Asn Gly Asp Ala Phe
100 105 110
Ser Asn Glu Val Lys Ala Gln Ala Ile Ala Gln Ile Lys Glu Asp Leu
115 120 125
Gly Gln Ile Asp Leu Val Val Tyr Ser Leu Ala Ser Pro Arg Arg Thr
130 135 140
Asp Pro Glu Thr Gly Glu Val Tyr Lys Ser Val Leu Lys Pro Ile Gly
145 150 155 160
Asp Gln Ala Phe Thr Asn Arg Thr Met Asp Thr Asp Arg Asp Glu Val
165 170 175
Lys Asp Val Thr Ile Glu Pro Ala Thr Glu Glu Glu Ile Gln His Thr
180 185 190
Ile Asn Val Met Gly Gly Gln Asp Trp Glu Leu Trp Met Lys Ala Leu
195 200 205
Asn Asp Ala Gly Val Leu Ala Pro Gly Ala Lys Ser Val Ala Tyr Ser
210 215 220
Tyr Ile Gly Pro Glu Ala Thr Trp Pro Val Tyr Thr Asn Gly Thr Ile
225 230 235 240
Gly Gln Ala Lys Lys Asp Val Glu Arg Ala Ala Ala Ala Ile Thr Lys
245 250 255
Ala Tyr Asp Cys Ala Ala Tyr Val Ala Val Asn Lys Ala Val Val Thr
260 265 270
Gln Ala Ser Ser Ala Ile Pro Val Val Pro Leu Tyr Ile Ser Ile Ile
275 280 285
Ile Lys Leu Met Lys Glu Lys Gly Thr His Glu Asp Cys Ile Glu Gln
290 295 300
Met Val Arg Leu Phe Asp Asp Arg Leu Tyr Gly Lys Asp Leu Gln Leu
305 310 315 320
Asp Glu Leu Gly Arg Ile Arg Val Asp Asp Trp Glu Met Gln Pro Asp
325 330 335
Ile Gln Ala Lys Val Ile Glu Ile Trp Pro Ser Ile Thr Ser Glu Thr
340 345 350
Leu Asp Val Leu Gly Asp Tyr Thr Gly Tyr Gln His Asn Phe Leu Thr
355 360 365
Leu Phe Gly Phe Gly Leu Asp Gly Val Asp Tyr Asp Glu Asp Val Glu
370 375 380
Val Asp Leu Pro Leu Pro Ser Ser Leu
385 390
<210> 20
<211> 395
<212> PRT
<213> Opitutaceae EW11
<400> 20
Met Val Ile Lys Pro Lys Val Arg Gly Phe Val Cys Val Thr Ala His
1 5 10 15
Pro Ala Gly Cys Ala Ala His Val Gln Glu Gln Ile Asp Tyr Val Lys
20 25 30
Ser Lys Gly Pro Ile Lys Asn Gly Pro Lys Lys Val Leu Val Ile Gly
35 40 45
Ala Ser Thr Gly Tyr Gly Leu Ala Ser Arg Ile Ala Ala Ser Phe Gly
50 55 60
Ser Gly Ala Ala Thr Ile Gly Val Phe Phe Glu Arg Pro Ser Glu Glu
65 70 75 80
Gly Arg Pro Ala Thr Pro Gly Trp Tyr Asn Thr Ile Gly Phe Thr Lys
85 90 95
Ala Ala Arg Ala Ala Gly Leu Tyr Ala Lys Asn Ile Asn Gly Asp Ala
100 105 110
Phe Ser Asn Glu Ile Lys Gln Gln Val Val Asp Leu Ile Lys Ala Asp
115 120 125
Leu Gly Gln Val Asp Leu Ile Val Tyr Ser Leu Ala Ser Pro Arg Arg
130 135 140
Thr His Pro Lys Thr Gly Val Val His Lys Ser Val Leu Lys Pro Val
145 150 155 160
Gly Ala Pro Tyr Thr Asn Lys Thr Val Asp Thr Asp Lys Gly Val Val
165 170 175
Ser Asn Val Thr Ile Glu Pro Ala Ala Asp Thr Glu Val Ser Asp Thr
180 185 190
Ile Ala Val Met Gly Gly Glu Asp Trp Glu Met Trp Ile His Ala Leu
195 200 205
Ala Asp Ala Lys Val Leu Ala Pro Gly Ala Thr Ser Val Ala Tyr Ser
210 215 220
Tyr Ile Gly Pro Glu Val Thr Trp Pro Ile Tyr Lys Asn Gly Thr Ile
225 230 235 240
Gly Leu Ala Lys Asn Asp Leu Glu Ala Ala Gly Arg Arg Ile Asp Ala
245 250 255
Leu Leu Lys Ala His Gly Tyr Gly Arg Ala Phe Ile Ser Val Asn Lys
260 265 270
Ala Leu Val Thr Gln Ala Ser Ser Ala Ile Pro Val Val Pro Leu Tyr
275 280 285
Ile Ser Ile Leu Tyr Lys Ile Met Lys Ala Lys Gly Thr His Glu Gly
290 295 300
Cys Ile Glu Gln Met Gln Arg Leu Phe Ala Thr Gln Met Tyr Asn Asn
305 310 315 320
Ser Ala Leu His Phe Asp Asp Gly Gly Arg Val Arg Val Asp Asp Trp
325 330 335
Glu Met Lys Pro Asp Val Gln Ala Glu Val Ala Arg Leu Trp Pro Gln
340 345 350
Val Thr Thr Glu Asn Ile Glu Gln Leu Thr Asp Ile Ala Gly Tyr Arg
355 360 365
His Glu Phe Leu Lys Leu Phe Gly Phe Gly Leu Asp Gly Ile Asp Tyr
370 375 380
Asp Ala Asp Ile Glu Pro His Leu Pro Met Leu
385 390 395
<210> 21
<211> 393
<212> PRT
<213> Puniceicoccaceae MED-G30
<400> 21
Met Ile Val Lys Pro Arg Ile Arg Gly Phe Val Cys Ile Thr Ala His
1 5 10 15
Pro Gln Gly Cys Glu Ala Asn Val Arg Ser Glu Ile Glu Lys Ala Ser
20 25 30
Ala Ala Gln Leu Glu Gly Gly Pro Lys Lys Val Leu Val Ile Gly Ala
35 40 45
Ser Thr Gly Tyr Gly Leu Ser Ser Arg Ile Thr Ala Ala Phe Ser His
50 55 60
Gly Ala Asp Thr Leu Gly Val Phe Phe Glu Arg Pro Ser Met Lys Gly
65 70 75 80
Lys Pro Ala Ser Ala Gly Trp Tyr Asn Ser Val Ala Phe Glu Lys Ala
85 90 95
Ala His Glu Cys Gly Arg Tyr Ala Lys Ser Ile Asn Gly Asp Ala Phe
100 105 110
Ser Asn Glu Ile Lys Glu Gln Ala Ile Gln Ala Ile Lys Asp Asp Leu
115 120 125
Gly Gln Val Asp Leu Val Ile Tyr Ser Leu Ala Ser Pro Arg Arg Thr
130 135 140
Asp Pro Ser Asp Gly Glu Thr Tyr Lys Ser Cys Leu Lys Pro Leu Gly
145 150 155 160
Asp Thr Tyr Thr Asn Arg Thr Leu Asp Thr Asp Lys Gly Val Val Ser
165 170 175
Glu Val Ser Ile Glu Thr Ala Thr Ala Glu Glu Thr Glu His Thr Val
180 185 190
Lys Val Met Gly Gly Glu Asp Trp Glu Leu Trp Met Arg Ala Leu Ala
195 200 205
Asp Ala Gly Cys Leu Ala Asp Gly Ala Lys Thr Val Ala Tyr Ser Tyr
210 215 220
Val Gly Pro Glu Ile Thr Trp Pro Val Tyr Thr Asn Gly Thr Ile Gly
225 230 235 240
Ala Ala Lys Lys Asp Val Glu Arg Ala Ala Ala Ala Ile His Ser Asn
245 250 255
His Gly Cys Glu Ala Tyr Val Ser Val Asn Lys Ala Val Val Thr Gln
260 265 270
Ala Ser Ser Ala Ile Pro Val Val Pro Leu Tyr Ile Ser Ile Leu Phe
275 280 285
Lys Val Met Lys Ala Lys Gly Thr His Glu Gly Cys Ile Glu Gln Met
290 295 300
Ile Arg Leu Phe Asn Glu Arg Leu Tyr Gly Gly Gly Leu Gln Leu Asp
305 310 315 320
Glu Asp Gly Arg Ile Arg Val Asp Asp Leu Glu Met Glu Pro Asp Val
325 330 335
Gln Gly Glu Val Ala Ala Ile Trp Pro Glu Ile Gln Thr Glu Asn Leu
340 345 350
Asp Glu Arg Ser Asp Phe Ala Gly Tyr Arg Gln Asp Phe Leu Arg Cys
355 360 365
Phe Gly Phe Gly Ile Glu Gly Val Asp Tyr Glu Ala Asp Val Glu Val
370 375 380
Glu Leu Pro Leu Pro Ser Gly Asn Gln
385 390
<210> 22
<211> 395
<212> PRT
<213> Terrimicrobium sacchariphilum
<400> 22
Met Ile Ile Thr Pro Lys Ile Arg Gly Phe Ile Cys Thr Thr Ala His
1 5 10 15
Pro Asp Gly Cys Ala Ala His Val Gln Glu Gln Ile Ala Tyr Val Lys
20 25 30
Ser Lys Pro Ser Leu Pro Asn Ala Pro Lys Arg Val Leu Val Val Gly
35 40 45
Ser Ser Thr Gly Tyr Gly Leu Ala Ser Arg Ile Val Ala Ala Phe Gly
50 55 60
Gly Gly Ala Ser Thr Val Gly Val Phe Phe Glu Lys Glu Pro Val Glu
65 70 75 80
Lys Lys Thr Ala Ser Ala Gly Trp Tyr Asn Ser Ala Ala Phe Glu Glu
85 90 95
Ala Ala Leu Lys Glu Gly Leu Tyr Ala Lys Ser Phe Asn Gly Asp Ala
100 105 110
Phe Ser Asn Glu Met Lys Gln Lys Val Ile Glu Thr Ile Lys Thr Asp
115 120 125
Leu Gly Gln Ile Asp Met Ile Val Tyr Ser Leu Ala Ser Pro Arg Arg
130 135 140
Thr Asp Pro Val Thr Gly Glu Val Phe Lys Ser Val Leu Lys Pro Thr
145 150 155 160
Gly Glu Thr Phe Thr Asn Lys Asn Leu Asn Thr Asp Lys Lys Glu Ile
165 170 175
Glu Thr Val Ser Ile Asp Pro Ala Ser Pro Glu Glu Ile Ala His Thr
180 185 190
Val Lys Val Met Gly Gly Glu Asp Trp Gln Leu Trp Ile Asp Ala Leu
195 200 205
Glu Asn Ala Gly Ala Leu Ala Glu Gly Phe Lys Thr Val Ala Tyr Ser
210 215 220
Tyr Ile Gly Pro Glu Leu Thr Trp Ala Ile Tyr Thr Asp Gly Thr Ile
225 230 235 240
Gly Arg Ala Lys Leu Asp Leu Glu Lys Thr Ala Arg Asp Ile Asn Gly
245 250 255
Lys Phe Gly Ala Gly Thr Ala Leu Val Ser Val Asn Lys Ala Leu Val
260 265 270
Thr Gln Ala Ser Ser Ala Ile Pro Val Val Pro Leu Tyr Ile Ser Ile
275 280 285
Leu Tyr Lys Val Met Lys Ala Lys Gly Leu His Glu Gly Cys Ile Glu
290 295 300
Gln Ile Glu Arg Leu Phe Ala Asp His Tyr Cys Ala Pro Glu Gly Pro
305 310 315 320
Lys Leu Asp Asp Ala Gly Arg Ile Arg Ile Asp Asp Trp Glu Met Arg
325 330 335
Glu Asp Val Gln Ala Glu Val Arg Asp Ala Trp Lys Asp Val Ser Thr
340 345 350
Glu Thr Ile Asp Ala Ala Thr Asp Phe Ala Gly Tyr Gln Lys Glu Phe
355 360 365
Tyr Arg Leu Phe Gly Phe Gly Leu Ser Gly Val Asp Tyr Ala Ala Asp
370 375 380
Val Asp Pro Ile Arg Lys Ile Pro Ser Leu Gly
385 390 395
<210> 23
<211> 400
<212> PRT
<213> Vibrio owensii ATCC
<400> 23
Met Ile Ile Lys Pro Arg Ile Arg Gly Phe Ile Cys Thr Thr Thr His
1 5 10 15
Pro Val Gly Cys Glu Ala Asn Val Lys Glu Gln Ile Ala Tyr Thr Lys
20 25 30
Ala Gln Gly Pro Ile Lys Asn Ala Pro Lys Arg Val Leu Val Val Gly
35 40 45
Ala Ser Ser Gly Tyr Gly Leu Ser Ser Arg Ile Ala Ala Ala Phe Gly
50 55 60
Gly Gly Ala Ser Thr Ile Gly Val Phe Phe Glu Lys Glu Gly Thr Glu
65 70 75 80
Lys Lys Pro Gly Thr Ala Gly Phe Tyr Asn Ser Val Ala Phe Glu Lys
85 90 95
Leu Ala Arg Glu Glu Gly Leu Tyr Ala Lys Ser Leu Asn Gly Asp Ala
100 105 110
Phe Ser Asn Glu Ala Lys Gln Lys Thr Ile Asp Leu Ile Lys Glu Asp
115 120 125
Leu Gly Gln Val Asp Met Val Val Tyr Ser Leu Ala Ser Pro Val Arg
130 135 140
Lys Met Pro Glu Thr Gly Glu Leu Ile Arg Ser Ala Leu Lys Pro Ile
145 150 155 160
Gly Glu Thr Tyr Thr Ser Thr Ala Val Asp Thr Asn Lys Asp Val Ile
165 170 175
Ile Glu Ala Ser Val Glu Pro Ala Thr Glu Gln Glu Ile Gln Asp Thr
180 185 190
Val Thr Val Met Gly Gly Glu Asp Trp Glu Leu Trp Ile Asn Ala Leu
195 200 205
Ser Glu Ala Gly Val Leu Ala Asp Gly Cys Lys Thr Val Ala Tyr Ser
210 215 220
Tyr Ile Gly Thr Glu Leu Thr Trp Pro Ile Tyr Trp Asp Gly Ala Leu
225 230 235 240
Gly Lys Ala Lys Met Asp Leu Asp Arg Ala Ala Ala Ala Leu Asn Glu
245 250 255
Lys Leu Ser Thr Thr Gly Gly Ser Ala Asn Val Ala Val Leu Lys Ser
260 265 270
Val Val Thr Gln Ala Ser Ser Ala Ile Pro Val Met Pro Leu Tyr Ile
275 280 285
Ala Met Val Phe Lys Lys Met Arg Glu Glu Gly Val His Glu Gly Cys
290 295 300
Met Glu Gln Ile Phe Arg Met Phe Ser Gln Arg Leu Tyr Lys Glu Asp
305 310 315 320
Gly Ser Ala Ala Glu Val Asp Glu Val Asn Arg Leu Arg Leu Asp Asp
325 330 335
Trp Glu Leu Arg Glu Asp Ile Gln Gln His Cys Arg Asp Leu Trp Pro
340 345 350
Gln Ile Thr Ser Asp Asn Leu Lys Glu Leu Thr Asp Tyr Val Glu Tyr
355 360 365
Lys Glu Glu Phe Leu Lys Leu Phe Gly Phe Gly Val Asp Gly Val Asp
370 375 380
Tyr Glu Ala Asp Val Asn Pro Ala Val Glu Thr Asp Phe Thr Gln Ile
385 390 395 400
<210> 24
<211> 339
<212> PRT
<213> Drosophila melanogaster
<400> 24
Met Met Ser Val Val Ala Lys Ser Leu Lys Tyr Thr Gln His Gly Glu
1 5 10 15
Pro Gln Glu Val Leu Gln Leu Val Glu Asp Lys Leu Pro Asp Pro Lys
20 25 30
Asp Asn Gln Val Leu Val Lys Ile Leu Ala Ala Pro Ile Asn Pro Ala
35 40 45
Asp Ile Asn Thr Ile Gln Gly Lys Tyr Pro Val Lys Pro Lys Phe Pro
50 55 60
Ala Val Gly Gly Asn Glu Cys Val Ala Glu Val Ile Cys Val Gly Asp
65 70 75 80
Lys Val Lys Gly Phe Glu Ala Gly Gln His Val Ile Pro Leu Ala Ser
85 90 95
Gly Leu Gly Thr Trp Thr Thr His Ala Val Tyr Lys Glu Asp Gln Leu
100 105 110
Leu Ile Val Ser Lys Lys Val Gly Leu Ala Glu Ala Ala Thr Ser Thr
115 120 125
Val Asn Pro Thr Thr Ala Tyr Arg Met Leu Lys Asp Phe Val Gln Leu
130 135 140
Cys Pro Gly Asp Thr Val Ile Gln Asn Gly Ala Asn Ser Ala Val Gly
145 150 155 160
Gln Ala Val His Gln Leu Cys Arg Ala Trp Gly Ile Asn Ser Val Gly
165 170 175
Ile Val Arg Asp Arg Pro Glu Ile Ala Glu Leu Lys Gln Met Leu Gln
180 185 190
Cys Leu Gly Ala Thr Glu Val Leu Thr Glu Ala Glu Ile Arg Thr Ser
195 200 205
Asp Ile Phe Lys Ser Gly Lys Leu Lys Lys Pro Arg Leu Ala Phe Asn
210 215 220
Cys Val Gly Gly Lys Ser Ala Thr Glu Val Ser Arg His Leu Asp Asn
225 230 235 240
Gly Gly Val Leu Val Thr Tyr Gly Gly Met Ser Arg Glu Pro Val Thr
245 250 255
Val Ala Thr Gly Pro Leu Ile Phe Lys Asp Ile Ala Phe Arg Gly Phe
260 265 270
Trp Met Thr Arg Trp Ser Lys Glu Asn Tyr Ser Ser Pro Glu Arg Ser
275 280 285
Lys Met Phe Lys Glu Ile Phe Glu Leu Met Glu Gln Gly Lys Phe Val
290 295 300
Ala Pro Asn His Glu Met Val Pro Leu Ala Lys Phe Lys Asp Ala Ala
305 310 315 320
Ala Ala Ala Leu Ser Phe Lys Gly Phe Thr Gly Lys Lys Tyr Ile Leu
325 330 335
Asp Met Ser
<210> 25
<211> 321
<212> PRT
<213> Homo sapiens
<400> 25
Met Pro Ala Lys Val Val Glu Leu Lys Asn Leu Glu Leu Ala Ala Val
1 5 10 15
Arg Gly Ser Asp Val Arg Val Lys Met Leu Ala Ala Pro Ile Asn Pro
20 25 30
Ser Asp Ile Asn Met Ile Gln Gly Asn Tyr Gly Phe Leu Pro Glu Leu
35 40 45
Pro Ala Val Gly Gly Asn Glu Gly Val Ala Gln Val Val Ala Val Gly
50 55 60
Ser Asn Val Thr Gly Leu Lys Pro Gly Asp Trp Val Ile Pro Ala Asn
65 70 75 80
Ala Gly Leu Gly Thr Trp Arg Thr Glu Ala Val Phe Ser Glu Glu Ala
85 90 95
Leu Ile Gln Val Pro Ser Asp Ile Pro Leu Gln Ser Ala Ala Thr Leu
100 105 110
Gly Val Asn Pro Cys Thr Ala Tyr Arg Met Leu Met Asp Phe Glu Gln
115 120 125
Leu Gln Pro Gly Asp Ser Val Ile Gln Asn Ala Ser Asn Ser Gly Val
130 135 140
Gly Gln Ala Val Ile Gln Ile Ala Ala Ala Leu Gly Leu Arg Thr Ile
145 150 155 160
Asn Val Val Arg Asp Arg Pro Asp Ile Gln Lys Leu Ser Asp Arg Leu
165 170 175
Lys Ser Leu Gly Ala Glu His Val Ile Thr Glu Glu Glu Leu Arg Arg
180 185 190
Pro Glu Met Lys Asn Phe Phe Lys Asp Met Pro Gln Pro Arg Leu Ala
195 200 205
Leu Asn Cys Val Gly Gly Lys Ser Ser Thr Glu Leu Leu Arg Gln Leu
210 215 220
Ala Arg Gly Gly Thr Met Val Thr Tyr Gly Gly Met Ala Lys Gln Pro
225 230 235 240
Val Val Ala Ser Val Ser Leu Leu Ile Phe Lys Asp Leu Lys Leu Arg
245 250 255
Gly Phe Trp Leu Ser Gln Trp Lys Lys Asp His Ser Pro Asp Gln Phe
260 265 270
Lys Glu Leu Ile Leu Thr Leu Cys Asp Leu Ile Arg Arg Gly Gln Leu
275 280 285
Thr Ala Pro Ala Cys Ser Gln Val Pro Leu Gln Asp Tyr Gln Ser Ala
290 295 300
Leu Glu Ala Ser Met Lys Pro Phe Ile Ser Ser Lys Gln Ile Leu Thr
305 310 315 320
Met
<210> 26
<211> 405
<212> PRT
<213> Euglena gracilis
<400> 26
Met Ala Met Phe Thr Thr Thr Ala Lys Val Ile Gln Pro Lys Ile Arg
1 5 10 15
Gly Phe Ile Cys Thr Thr Thr His Pro Ile Gly Cys Glu Lys Arg Val
20 25 30
Gln Glu Glu Ile Ala Tyr Ala Arg Ala His Pro Pro Thr Ser Pro Gly
35 40 45
Pro Lys Arg Val Leu Val Ile Gly Cys Ser Thr Gly Tyr Gly Leu Ser
50 55 60
Thr Arg Ile Thr Ala Ala Phe Gly Tyr Gln Ala Ala Thr Leu Gly Val
65 70 75 80
Phe Leu Ala Gly Pro Pro Thr Lys Gly Arg Pro Ala Ala Ala Gly Trp
85 90 95
Tyr Asn Thr Val Ala Phe Glu Lys Ala Ala Leu Glu Ala Gly Leu Tyr
100 105 110
Ala Arg Ser Leu Asn Gly Asp Ala Phe Asp Ser Thr Thr Lys Ala Arg
115 120 125
Thr Val Glu Ala Ile Lys Arg Asp Leu Gly Thr Val Asp Leu Val Val
130 135 140
Tyr Ser Ile Ala Ala Pro Lys Arg Thr Asp Pro Ala Thr Gly Val Leu
145 150 155 160
His Lys Ala Cys Leu Lys Pro Ile Gly Ala Thr Tyr Thr Asn Arg Thr
165 170 175
Val Asn Thr Asp Lys Ala Glu Val Thr Asp Val Ser Ile Glu Pro Ala
180 185 190
Ser Pro Glu Glu Ile Ala Asp Thr Val Lys Val Met Gly Gly Glu Asp
195 200 205
Trp Glu Leu Trp Ile Gln Ala Leu Ser Glu Ala Gly Val Leu Ala Glu
210 215 220
Gly Ala Lys Thr Val Ala Tyr Ser Tyr Ile Gly Pro Glu Met Thr Trp
225 230 235 240
Pro Val Tyr Trp Ser Gly Thr Ile Gly Glu Ala Lys Lys Asp Val Glu
245 250 255
Lys Ala Ala Lys Arg Ile Thr Gln Gln Tyr Gly Cys Pro Ala Tyr Pro
260 265 270
Val Val Ala Lys Ala Leu Val Thr Gln Ala Ser Ser Ala Ile Pro Val
275 280 285
Val Pro Leu Tyr Ile Cys Leu Leu Tyr Arg Val Met Lys Glu Lys Gly
290 295 300
Thr His Glu Gly Cys Ile Glu Gln Met Val Arg Leu Leu Thr Thr Lys
305 310 315 320
Leu Tyr Pro Glu Asn Gly Ala Pro Ile Val Asp Glu Ala Gly Arg Val
325 330 335
Arg Val Asp Asp Trp Glu Met Ala Glu Asp Val Gln Gln Ala Val Lys
340 345 350
Asp Leu Trp Ser Gln Val Ser Thr Ala Asn Leu Lys Asp Ile Ser Asp
355 360 365
Phe Ala Gly Tyr Gln Thr Glu Phe Leu Arg Leu Phe Gly Phe Gly Ile
370 375 380
Asp Gly Val Asp Tyr Asp Gln Pro Val Asp Val Glu Ala Asp Leu Pro
385 390 395 400
Ser Ala Ala Gln Gln
405
<210> 27
<211> 453
<212> PRT
<213> Clostridium kluyveri DSM555
<400> 27
Met Ser Asn Glu Val Ser Ile Lys Glu Leu Ile Glu Lys Ala Lys Val
1 5 10 15
Ala Gln Lys Lys Leu Glu Ala Tyr Ser Gln Glu Gln Val Asp Val Leu
20 25 30
Val Lys Ala Leu Gly Lys Val Val Tyr Asp Asn Ala Glu Met Phe Ala
35 40 45
Lys Glu Ala Val Glu Glu Thr Glu Met Gly Val Tyr Glu Asp Lys Val
50 55 60
Ala Lys Cys His Leu Lys Ser Gly Ala Ile Trp Asn His Ile Lys Asp
65 70 75 80
Lys Lys Thr Val Gly Ile Ile Lys Glu Glu Pro Glu Arg Ala Leu Val
85 90 95
Tyr Val Ala Lys Pro Lys Gly Val Val Ala Ala Thr Thr Pro Ile Thr
100 105 110
Asn Pro Val Val Thr Pro Met Cys Asn Ala Met Ala Ala Ile Lys Gly
115 120 125
Arg Asn Thr Ile Ile Val Ala Pro His Pro Lys Ala Lys Lys Val Ser
130 135 140
Ala His Thr Val Glu Leu Met Asn Ala Glu Leu Lys Lys Leu Gly Ala
145 150 155 160
Pro Glu Asn Ile Ile Gln Ile Val Glu Ala Pro Ser Arg Glu Ala Ala
165 170 175
Lys Glu Leu Met Glu Ser Ala Asp Val Val Ile Ala Thr Gly Gly Ala
180 185 190
Gly Arg Val Lys Ala Ala Tyr Ser Ser Gly Arg Pro Ala Tyr Gly Val
195 200 205
Gly Pro Gly Asn Ser Gln Val Ile Val Asp Lys Gly Tyr Asp Tyr Asn
210 215 220
Lys Ala Ala Gln Asp Ile Ile Thr Gly Arg Lys Tyr Asp Asn Gly Ile
225 230 235 240
Ile Cys Ser Ser Glu Gln Ser Val Ile Ala Pro Ala Glu Asp Tyr Asp
245 250 255
Lys Val Ile Ala Ala Phe Val Glu Asn Gly Ala Phe Tyr Val Glu Asp
260 265 270
Glu Glu Thr Val Glu Lys Phe Arg Ser Thr Leu Phe Lys Asp Gly Lys
275 280 285
Ile Asn Ser Lys Ile Ile Gly Lys Ser Val Gln Ile Ile Ala Asp Leu
290 295 300
Ala Gly Val Lys Val Pro Glu Gly Thr Lys Val Ile Val Leu Lys Gly
305 310 315 320
Lys Gly Ala Gly Glu Lys Asp Val Leu Cys Lys Glu Lys Met Cys Pro
325 330 335
Val Leu Val Ala Leu Lys Tyr Asp Thr Phe Glu Glu Ala Val Glu Ile
340 345 350
Ala Met Ala Asn Tyr Met Tyr Glu Gly Ala Gly His Thr Ala Gly Ile
355 360 365
His Ser Asp Asn Asp Glu Asn Ile Arg Tyr Ala Gly Thr Val Leu Pro
370 375 380
Ile Ser Arg Leu Val Val Asn Gln Pro Ala Thr Thr Ala Gly Gly Ser
385 390 395 400
Phe Asn Asn Gly Phe Asn Pro Thr Thr Thr Leu Gly Cys Gly Ser Trp
405 410 415
Gly Arg Asn Ser Ile Ser Glu Asn Leu Thr Tyr Glu His Leu Ile Asn
420 425 430
Val Ser Arg Ile Gly Tyr Phe Asn Lys Glu Ala Lys Val Pro Ser Tyr
435 440 445
Glu Glu Ile Trp Gly
450
<210> 28
<211> 451
<212> PRT
<213> Porphyromonas gingivalis W83
<400> 28
Met Glu Ile Lys Glu Met Val Ser Leu Ala Arg Lys Ala Gln Lys Glu
1 5 10 15
Tyr Gln Ala Thr His Asn Gln Glu Ala Val Asp Asn Ile Cys Arg Ala
20 25 30
Ala Ala Lys Val Ile Tyr Glu Asn Ala Ala Ile Leu Ala Arg Glu Ala
35 40 45
Val Asp Glu Thr Gly Met Gly Val Tyr Glu His Lys Val Ala Lys Asn
50 55 60
Gln Gly Lys Ser Lys Gly Val Trp Tyr Asn Leu His Asn Lys Lys Ser
65 70 75 80
Ile Gly Ile Leu Asn Ile Asp Glu Arg Thr Gly Met Ile Glu Ile Ala
85 90 95
Lys Pro Ile Gly Val Val Gly Ala Val Thr Pro Thr Thr Asn Pro Ile
100 105 110
Val Thr Pro Met Ser Asn Ile Ile Phe Ala Leu Lys Thr Cys Asn Ala
115 120 125
Ile Ile Ile Ala Pro His Pro Arg Ser Lys Lys Cys Ser Ala His Ala
130 135 140
Val Arg Leu Ile Lys Glu Ala Ile Ala Pro Phe Asn Val Pro Glu Gly
145 150 155 160
Met Val Gln Ile Ile Glu Glu Pro Ser Ile Glu Lys Thr Gln Glu Leu
165 170 175
Met Gly Ala Val Asp Val Val Val Ala Thr Gly Gly Met Gly Met Val
180 185 190
Lys Ser Ala Tyr Ser Ser Gly Lys Pro Ser Phe Gly Val Gly Ala Gly
195 200 205
Asn Val Gln Val Ile Val Asp Ser Asn Ile Asp Phe Glu Ala Ala Ala
210 215 220
Glu Lys Ile Ile Thr Gly Arg Ala Phe Asp Asn Gly Ile Ile Cys Ser
225 230 235 240
Gly Glu Gln Ser Ile Ile Tyr Asn Glu Ala Asp Lys Glu Ala Val Phe
245 250 255
Thr Ala Phe Arg Asn His Gly Ala Tyr Phe Cys Asp Glu Ala Glu Gly
260 265 270
Asp Arg Ala Arg Ala Ala Ile Phe Glu Asn Gly Ala Ile Ala Lys Asp
275 280 285
Val Val Gly Gln Ser Val Ala Phe Ile Ala Lys Lys Ala Asn Ile Asn
290 295 300
Ile Pro Glu Gly Thr Arg Ile Leu Val Val Glu Ala Arg Gly Val Gly
305 310 315 320
Ala Glu Asp Val Ile Cys Lys Glu Lys Met Cys Pro Val Met Cys Ala
325 330 335
Leu Ser Tyr Lys His Phe Glu Glu Gly Val Glu Ile Ala Arg Thr Asn
340 345 350
Leu Ala Asn Glu Gly Asn Gly His Thr Cys Ala Ile His Ser Asn Asn
355 360 365
Gln Ala His Ile Ile Leu Ala Gly Ser Glu Leu Thr Val Ser Arg Ile
370 375 380
Val Val Asn Ala Pro Ser Ala Thr Thr Ala Gly Gly His Ile Gln Asn
385 390 395 400
Gly Leu Ala Val Thr Asn Thr Leu Gly Cys Gly Ser Trp Gly Asn Asn
405 410 415
Ser Ile Ser Glu Asn Phe Thr Tyr Lys His Leu Leu Asn Ile Ser Arg
420 425 430
Ile Ala Pro Leu Asn Ser Ser Ile His Ile Pro Asp Asp Lys Glu Ile
435 440 445
Trp Glu Leu
450
<210> 29
<211> 463
<212> PRT
<213> Clostridium difficile 630
<400> 29
Met Glu Lys Ala Val Glu Asn Phe Glu Asp Leu Ser Lys Glu Tyr Ile
1 5 10 15
Asn Gly Tyr Ile Glu Arg Ala Arg Lys Ala Gln Arg Glu Phe Glu Cys
20 25 30
Tyr Thr Gln Glu Gln Val Asp Lys Ile Val Lys Ile Val Gly Lys Val
35 40 45
Val Tyr Tyr Asn Ala Glu Tyr Leu Ala Lys Leu Ala Val Glu Glu Thr
50 55 60
Gly Met Gly Val Tyr Glu Asp Lys Val Ala Lys Asn Lys Ser Lys Ala
65 70 75 80
Lys Val Ile Tyr Asn Asn Leu Lys Asp Lys Lys Ser Val Gly Ile Ile
85 90 95
Asp Ile Asp Arg Glu Thr Gly Ile Thr Lys Val Ala Lys Pro Val Gly
100 105 110
Val Val Ala Ala Ile Thr Pro Cys Thr Asn Pro Ile Val Thr Pro Met
115 120 125
Ser Asn Ala Met Phe Ala Leu Lys Gly Arg Asn Ala Ile Ile Ile Thr
130 135 140
Pro His His Lys Ala Ile Gly Cys Ser Thr Lys Thr Val Glu Met Ile
145 150 155 160
Asn Glu Glu Leu Glu Lys Ile Gly Ala Pro Glu Asn Leu Ile Gln Ile
165 170 175
Leu Asp Gln Gln Ser Arg Glu Asn Thr Arg Asn Leu Ile Ser Ser Ala
180 185 190
Asp Val Val Ile Ala Thr Gly Gly Met Gly Met Val Lys Ala Ala Tyr
195 200 205
Ser Ser Gly Lys Pro Ala Leu Gly Val Gly Ala Gly Asn Val Gln Cys
210 215 220
Ile Ile Asp Arg Asp Val Asp Ile Lys Glu Ala Val Pro Lys Ile Ile
225 230 235 240
Ala Gly Arg Ile Phe Asp Asn Gly Ile Ile Cys Ser Gly Glu Gln Ser
245 250 255
Val Ile Val Ala Glu Glu Met Phe Asp Lys Ile Met Asp Glu Phe Lys
260 265 270
Asn Asn Lys Gly Phe Ile Val Arg Asp Lys Val Gln Lys Glu Ala Phe
275 280 285
Arg Asn Ala Met Phe Val Asn Lys Ser Met Asn Lys Asp Ala Val Gly
290 295 300
Gln Ser Val His Thr Ile Ala Lys Ile Ala Gly Val Glu Ile Pro Glu
305 310 315 320
Asp Thr Lys Ile Ile Val Ile Glu Ala Asp Gly Pro Gly Glu Glu Asp
325 330 335
Ile Ile Ala Lys Glu Lys Met Cys Pro Val Ile Ser Ala Tyr Lys Tyr
340 345 350
Lys Ser Phe Glu Glu Gly Val Ala Ile Ala Lys Ala Asn Leu Asn Val
355 360 365
Glu Gly Lys Gly His Ser Val Ser Ile His Ser Asn Thr Val Lys Asn
370 375 380
Ile Glu Tyr Ala Gly Glu Asn Ile Glu Val Ser Arg Phe Val Ile Asn
385 390 395 400
Gln Cys Cys Ala Thr Ser Ala Gly Gly Ser Phe Phe Asn Gly Leu Ala
405 410 415
Pro Thr Asn Thr Leu Gly Cys Gly Ser Trp Gly Asn Asn Ser Ile Ser
420 425 430
Glu Asn Leu Asp Tyr Lys His Leu Ile Asn Ile Ser Arg Ile Ala Tyr
435 440 445
Tyr Met Pro Glu Asn Glu Val Pro Thr Asp Glu Glu Leu Trp Gly
450 455 460
<210> 30
<211> 421
<212> PRT
<213> Achromobacter xylosoxidans
<400> 30
Met Lys Asn Gln Asp Leu Asn Thr Arg Arg Ser Leu Ala Thr Pro Arg
1 5 10 15
Gly Val Gly Val Met Cys Asp Phe Tyr Ala Val Arg Ala Glu Asn Ala
20 25 30
Thr Leu Trp Asp Ala Asn Gly Lys Glu Tyr Ile Asp Phe Ala Gly Gly
35 40 45
Ile Ala Val Leu Asn Thr Gly His Leu His Pro Lys Ile Lys Ala Ala
50 55 60
Val Ala Ala Gln Leu Asp Asn Phe Thr His Thr Ala Tyr Gln Ile Val
65 70 75 80
Pro Tyr Glu Gly Tyr Val Ser Leu Ala Glu Arg Ile Asn Arg Leu Ala
85 90 95
Pro Ile Asp Gly Leu Lys Lys Ser Ala Phe Phe Thr Thr Gly Val Glu
100 105 110
Ala Val Glu Asn Ala Val Lys Ile Ala Arg Ser Ala Thr Gly Arg Ser
115 120 125
Gly Val Ile Ala Phe Ser Gly Ser Phe His Gly Arg Thr Met Leu Gly
130 135 140
Met Ala Leu Thr Gly Lys Val Ala Pro Tyr Lys Leu Ser Phe Gly Pro
145 150 155 160
Met Pro Gly Asp Ile Tyr His Val Pro Phe Pro Asn Ala Thr Gln Ser
165 170 175
Ile Ser Val Ala Asp Ser Leu Lys Ala Leu Asp Leu Leu Phe Lys Cys
180 185 190
Asp Ile Asp Pro Lys Arg Val Ala Ala Ile Ile Ile Glu Pro Val Gln
195 200 205
Gly Glu Gly Gly Phe Asn Ile Thr Pro Pro Glu Leu Met Thr Ala Leu
210 215 220
Arg Lys Val Cys Asp Glu His Gly Ile Leu Leu Ile Ala Asp Glu Val
225 230 235 240
Gln Thr Gly Phe Gly Arg Thr Gly Lys Leu Phe Ala Met Glu His His
245 250 255
Ser Val Gln Ala Asp Leu Ile Thr Met Ala Lys Ser Leu Gly Gly Gly
260 265 270
Phe Pro Ile Ser Gly Val Val Gly Arg Ala Asp Val Met Asp Ala Pro
275 280 285
Ala Ala Gly Gly Leu Gly Gly Thr Tyr Ala Gly Asn Pro Leu Ala Val
290 295 300
Ala Ala Ala His Ala Val Leu Asp Val Ile Ala Glu Glu Lys Leu Cys
305 310 315 320
Glu Arg Ala Asp Ala Leu Gly Asp Lys Leu Arg Ala His Leu Glu Gly
325 330 335
Leu Arg Ala Lys Val Pro Gly Ile Ala Asp Val Arg Gly Leu Gly Ser
340 345 350
Met Val Ala Leu Glu Leu Asn Asp Pro Ala Thr Gly Lys Pro Asp Ala
355 360 365
Glu Ala Val Lys Arg Val Gln Ala Arg Ala Ile Glu Lys Gly Leu Ile
370 375 380
Leu Leu Ser Cys Gly Val Tyr Gly Asn Val Leu Arg Phe Leu Tyr Pro
385 390 395 400
Leu Thr Ile Pro Asp Ala Gln Phe Asp Arg Ala Leu Ala Ile Leu Ser
405 410 415
Glu Ala Leu Ala Ala
420
<210> 31
<211> 456
<212> PRT
<213> Paenarthrobacter aurescens TC1
<400> 31
Met Thr Thr Thr Ala Asn Glu Leu Ser Tyr Arg Ile Glu Gln Lys Arg
1 5 10 15
Asn Ile Asn Gly Ala Phe Pro Gly Pro Lys Ser Gln Ala Leu Ala Glu
20 25 30
Arg Arg Ser Ala Val Val Ala Ala Gly Val Ala Ser Gly Val Pro Val
35 40 45
Tyr Val Glu Asp Ala Asp Gly Gly Ile Ile Arg Asp Val Asp Gly Asn
50 55 60
Ser Phe Ile Asp Leu Gly Ser Gly Ile Ala Val Thr Ser Val Gly Ala
65 70 75 80
Ser Asp Pro Ala Val Val Ala Ala Val Gln Glu Ala Ala Ala His Phe
85 90 95
Thr His Thr Cys Phe Met Val Thr Pro Tyr Glu Gly Tyr Val Ala Val
100 105 110
Thr Glu Gln Leu Asn Arg Leu Thr Pro Gly Asp His Ala Lys Arg Thr
115 120 125
Val Leu Phe Asn Ser Gly Ala Glu Ala Val Glu Asn Ala Val Lys Val
130 135 140
Ala Arg Leu Ala Thr Gly Arg Asp Ala Val Val Ala Phe Asp His Ala
145 150 155 160
Tyr His Gly Arg Thr Asn Leu Thr Met Ala Leu Thr Ala Lys Ala Met
165 170 175
Pro Tyr Lys Thr Asn Phe Gly Pro Phe Ala Pro Glu Val Tyr Arg Met
180 185 190
Pro Met Ser Tyr Pro Phe Arg Glu Glu Asn Pro Glu Ile Thr Gly Ala
195 200 205
Glu Ala Ala Lys Arg Ala Ile Thr Met Ile Glu Lys Gln Ile Gly Gly
210 215 220
Asp Gln Val Ala Ala Ile Ile Ile Glu Pro Ile Gln Gly Glu Gly Gly
225 230 235 240
Phe Ile Val Pro Ala Glu Gly Phe Leu Pro Ala Leu Ser Glu Trp Ala
245 250 255
Lys Glu Lys Gly Ile Val Phe Ile Ala Asp Glu Val Gln Ser Gly Phe
260 265 270
Cys Arg Thr Gly Glu Trp Phe Ala Val Asp His Glu Gly Val Val Pro
275 280 285
Asp Ile Ile Thr Met Ala Lys Gly Ile Ala Gly Gly Leu Pro Leu Ser
290 295 300
Ala Ile Thr Gly Arg Ala Asp Leu Leu Asp Ala Val His Pro Gly Gly
305 310 315 320
Leu Gly Gly Thr Tyr Gly Gly Asn Pro Val Ala Cys Ala Ala Ala Leu
325 330 335
Ala Ala Ile Asp Thr Met Glu Gln His Asp Leu Asn Gly Arg Ala Arg
340 345 350
His Ile Glu Glu Leu Ala Leu Gly Lys Leu Arg Glu Leu Ala Ala Glu
355 360 365
Leu Ser Ala Gly Gly Gly Ser Val Val Gly Asp Ile Arg Gly Arg Gly
370 375 380
Ala Met Leu Ala Ile Glu Leu Val Gln Pro Gly Ser Lys Glu Pro Asn
385 390 395 400
Ala Glu Leu Thr Lys Ala Val Ala Ala Ala Cys Leu Lys Glu Gly Val
405 410 415
Ile Ile Leu Thr Cys Gly Thr Tyr Gly Asn Val Ile Arg Leu Leu Pro
420 425 430
Pro Leu Val Ile Ser Asp Glu Leu Leu Ile Asp Gly Leu Glu Val Leu
435 440 445
Ala Ala Ala Ile Lys Ala His Ala
450 455
<210> 32
<211> 424
<212> PRT
<213> Metagenomic
<400> 32
Met Ser Lys Thr Asn Ala Ser Leu Met Lys Arg Arg Glu Ala Ala Val
1 5 10 15
Pro Arg Gly Val Gly Gln Ile His Pro Ile Phe Ala Glu Ser Ala Lys
20 25 30
Asn Ala Thr Val Thr Asp Val Glu Gly Arg Glu Phe Ile Asp Phe Ala
35 40 45
Gly Gly Ile Ala Val Leu Asn Thr Gly His Val His Pro Lys Ile Ile
50 55 60
Ala Ala Val Thr Glu Gln Leu Asn Lys Leu Thr His Thr Cys Phe Gln
65 70 75 80
Val Leu Ala Tyr Glu Pro Tyr Val Glu Val Cys Glu Lys Ile Asn Ala
85 90 95
Lys Val Pro Gly Asp Phe Ala Lys Lys Thr Leu Leu Val Thr Thr Gly
100 105 110
Ser Glu Ala Val Glu Asn Ser Ile Lys Ile Ala Arg Ala Ala Thr Gly
115 120 125
Arg Ala Gly Val Ile Ala Phe Thr Gly Ala Tyr His Gly Arg Thr Met
130 135 140
Met Thr Leu Gly Leu Thr Gly Lys Val Val Pro Tyr Ser Ala Gly Met
145 150 155 160
Gly Leu Met Pro Gly Gly Ile Phe Arg Ala Leu Tyr Pro Asn Glu Leu
165 170 175
His Gly Val Ser Ile Asp Asp Ser Ile Ala Ser Ile Glu Arg Ile Phe
180 185 190
Lys Asn Asp Ala Glu Pro Arg Asp Ile Ala Ala Ile Ile Ile Glu Pro
195 200 205
Val Gln Gly Glu Gly Gly Phe Tyr Val Ala Pro Lys Glu Phe Met Lys
210 215 220
Arg Leu Arg Ala Leu Cys Asp Gln His Gly Ile Leu Leu Ile Ala Asp
225 230 235 240
Glu Val Gln Thr Gly Ala Gly Arg Thr Gly Thr Phe Phe Ala Met Glu
245 250 255
Gln Met Gly Val Ala Ala Asp Leu Thr Thr Phe Ala Lys Ser Ile Ala
260 265 270
Gly Gly Phe Pro Leu Ala Gly Val Cys Gly Lys Ala Glu Tyr Met Asp
275 280 285
Ala Ile Ala Pro Gly Gly Leu Gly Gly Thr Tyr Ala Gly Ser Pro Ile
290 295 300
Ala Cys Ala Ala Ala Leu Ala Val Met Glu Val Phe Glu Glu Glu His
305 310 315 320
Leu Leu Asp Arg Cys Lys Ala Val Gly Glu Arg Leu Val Thr Gly Leu
325 330 335
Lys Ala Ile Gln Ala Lys Tyr Pro Val Ile Gly Glu Val Arg Ala Leu
340 345 350
Gly Ala Met Ile Ala Val Glu Leu Phe Val Asp Gly Asp Ser His Lys
355 360 365
Pro Asn Ala Pro Ala Val Ala Ala Val Val Ala Lys Ala Arg Asp Lys
370 375 380
Gly Leu Ile Leu Leu Ser Cys Gly Thr Tyr Gly Asn Val Leu Arg Val
385 390 395 400
Leu Val Pro Leu Thr Ser Pro Asp Glu Gln Leu Asp Lys Gly Leu Ala
405 410 415
Ile Ile Glu Glu Cys Phe Ser Glu
420
<210> 33
<211> 425
<212> PRT
<213> Metagenomic
<400> 33
Met Ser Lys Thr Asn Ala Ser Leu Met Lys Arg Arg Glu Ala Ala Val
1 5 10 15
Pro Arg Gly Val Gly Gln Ile His Pro Ile Phe Ala Glu Ser Ala Lys
20 25 30
Asn Ala Thr Val Thr Asp Val Glu Gly Arg Glu Phe Ile Asp Phe Ala
35 40 45
Gly Gly Ile Ala Val Leu Asn Thr Gly His Leu His Pro Lys Ile Ile
50 55 60
Ala Ala Val Thr Glu Gln Leu Asn Lys Leu Thr His Thr Cys Phe Gln
65 70 75 80
Val Leu Ala Tyr Glu Pro Tyr Val Glu Leu Cys Glu Lys Ile Asn Ala
85 90 95
Lys Val Pro Gly Asp Phe Ala Lys Lys Thr Leu Leu Val Thr Thr Gly
100 105 110
Ser Glu Ala Val Glu Asn Ala Val Lys Ile Ala Arg Ala Ala Thr Gly
115 120 125
Arg Ala Gly Val Ile Ala Phe Thr Gly Ala Tyr His Gly Arg Thr Met
130 135 140
Met Thr Leu Gly Leu Thr Gly Lys Val Val Pro Tyr Ser Ala Gly Met
145 150 155 160
Gly Leu Met Pro Gly Gly Val Phe Arg Ala Leu Tyr Pro Asn Glu Leu
165 170 175
His Gly Val Ser Val Asp Asp Ser Ile Ala Ser Ile Glu Arg Ile Phe
180 185 190
Lys Asn Asp Ala Glu Pro Arg Asp Ile Ala Ala Ile Ile Ile Glu Pro
195 200 205
Val Gln Gly Glu Gly Gly Phe Tyr Val Ala Pro Lys Glu Phe Met Lys
210 215 220
Arg Leu Arg Ala Leu Cys Asp Gln His Gly Ile Leu Leu Ile Ala Asp
225 230 235 240
Glu Val Gln Thr Gly Ala Gly Arg Thr Gly Thr Phe Phe Ala Met Glu
245 250 255
Gln Met Gly Val Ser Ala Asp Leu Thr Thr Phe Ala Lys Ser Ile Ala
260 265 270
Gly Gly Phe Pro Leu Ala Gly Val Cys Gly Lys Ala Glu Tyr Met Asp
275 280 285
Ala Ile Ala Pro Gly Gly Leu Gly Gly Thr Tyr Ala Gly Ser Pro Ile
290 295 300
Ala Cys Ala Ala Ala Leu Ala Val Met Glu Val Phe Glu Glu Glu His
305 310 315 320
Leu Leu Asp Arg Cys Lys Ala Val Gly Glu Arg Leu Val Thr Gly Leu
325 330 335
Lys Ala Ile Gln Ser Lys Tyr Pro Val Ile Gly Glu Val Arg Ala Leu
340 345 350
Gly Ala Met Ile Ala Val Glu Leu Phe Val Asp Gly Asp Ser His Lys
355 360 365
Pro Asn Ala Ala Ala Val Ala Ser Val Val Ala Lys Ala Arg Asp Lys
370 375 380
Gly Leu Ile Leu Leu Ser Cys Gly Thr Tyr Gly Asn Val Leu Arg Val
385 390 395 400
Leu Val Pro Leu Thr Ser Pro Asp Glu Gln Leu Asp Lys Gly Leu Ala
405 410 415
Ile Ile Glu Glu Cys Phe Ser Glu Leu
420 425
<210> 34
<211> 425
<212> PRT
<213> Metagenomic
<400> 34
Met Ser Lys Thr Asn Ala Ser Leu Met Lys Arg Arg Glu Ala Ala Val
1 5 10 15
Pro Arg Gly Val Gly Gln Ile His Pro Ile Phe Ala Glu Ser Ala Lys
20 25 30
Asn Ala Thr Val Thr Asp Val Glu Gly Arg Glu Phe Ile Asp Phe Ala
35 40 45
Gly Gly Ile Ala Val Leu Asn Thr Gly His Leu His Pro Lys Ile Ile
50 55 60
Ala Ala Val Thr Ala Gln Leu Asn Lys Leu Thr His Thr Cys Phe Gln
65 70 75 80
Val Leu Ala Tyr Glu Pro Tyr Val Glu Leu Cys Glu Lys Ile Asn Ala
85 90 95
Lys Val Pro Gly Asp Phe Ala Lys Lys Thr Leu Leu Val Thr Thr Gly
100 105 110
Ser Glu Ala Val Glu Asn Ala Val Lys Ile Ala Arg Ala Ala Thr Gly
115 120 125
Arg Ala Gly Val Ile Ala Phe Thr Gly Ala Tyr His Gly Arg Thr Met
130 135 140
Met Thr Leu Gly Leu Thr Gly Lys Val Val Pro Tyr Ser Ala Gly Met
145 150 155 160
Gly Leu Met Pro Gly Gly Ile Phe Arg Ala Leu Tyr Pro Asn Glu Leu
165 170 175
His Gly Val Ser Ile Asp Asp Ser Ile Ala Ser Ile Glu Arg Ile Phe
180 185 190
Lys Asn Asp Ala Glu Pro Arg Asp Ile Ala Ala Ile Ile Ile Glu Pro
195 200 205
Val Gln Gly Glu Gly Gly Phe Tyr Val Ala Pro Lys Glu Phe Met Lys
210 215 220
Arg Leu Arg Ala Leu Cys Asp Gln His Gly Ile Leu Leu Ile Ala Asp
225 230 235 240
Glu Val Gln Thr Gly Ala Gly Arg Thr Gly Thr Phe Phe Ala Met Glu
245 250 255
Gln Met Gly Val Ala Ala Asp Leu Thr Thr Phe Ala Lys Ser Ile Ala
260 265 270
Gly Gly Phe Pro Leu Ala Gly Val Cys Gly Lys Ala Glu Tyr Met Asp
275 280 285
Ala Ile Ala Pro Gly Gly Leu Gly Gly Thr Tyr Ala Gly Ser Pro Ile
290 295 300
Ala Cys Ala Ala Ala Leu Ala Val Met Glu Val Phe Glu Glu Glu His
305 310 315 320
Leu Leu Asp Arg Cys Lys Ala Val Gly Glu Arg Leu Val Thr Gly Leu
325 330 335
Lys Ala Ile Gln Ala Lys Tyr Pro Val Ile Gly Glu Val Arg Ala Leu
340 345 350
Gly Ala Met Ile Ala Val Glu Leu Phe Val Asp Gly Asp Ser His Lys
355 360 365
Pro Asn Ala Pro Ala Val Ala Ala Val Val Ala Lys Ala Arg Asp Lys
370 375 380
Gly Leu Ile Leu Leu Ser Cys Gly Thr Tyr Gly Asn Val Leu Arg Val
385 390 395 400
Leu Val Pro Leu Thr Ser Pro Asp Glu Gln Leu Asp Lys Gly Leu Ala
405 410 415
Ile Ile Glu Glu Cys Phe Ala Glu Leu
420 425
<210> 35
<211> 420
<212> PRT
<213> Metagenomic
<400> 35
Met Lys Asn Gln Asp Leu Asn Thr Arg Arg Ser Leu Ala Thr Pro Arg
1 5 10 15
Gly Val Gly Val Met Cys Asp Phe Tyr Ala Val Arg Ala Glu Asn Ala
20 25 30
Thr Leu Trp Asp Ala Glu Gly Lys Glu Tyr Ile Asp Phe Ala Gly Gly
35 40 45
Ile Ala Val Leu Asn Thr Gly His Leu His Pro Lys Val Lys Ala Ala
50 55 60
Val Thr Ala Gln Leu Asp Asn Phe Thr His Thr Ala Tyr Gln Ile Val
65 70 75 80
Pro Tyr Glu Gly Tyr Ile Ser Leu Ala Glu Arg Ile Asn Arg Val Ala
85 90 95
Pro Ile Asp Gly Leu Lys Lys Thr Ala Phe Phe Thr Thr Gly Val Glu
100 105 110
Ala Val Glu Asn Ala Val Lys Ile Ala Arg Ser Ala Thr Gly Arg Ser
115 120 125
Gly Val Ile Ala Phe Ser Gly Ser Phe His Gly Arg Thr Met Leu Gly
130 135 140
Met Ala Leu Thr Gly Lys Val Ala Pro Tyr Lys Leu Ser Phe Gly Pro
145 150 155 160
Met Pro Gly Asp Ile Tyr His Val Pro Phe Pro Asn Ala Thr Gln Ser
165 170 175
Ile Ser Val Ala Asp Ser Leu Lys Ala Leu Asp Leu Leu Phe Lys Val
180 185 190
Asp Ile Asp Pro Lys Arg Val Ala Ala Ile Ile Ile Glu Pro Val Gln
195 200 205
Gly Glu Gly Gly Phe Asn Ile Thr Pro Pro Glu Leu Met Thr Ala Leu
210 215 220
Arg Lys Val Cys Asp Glu His Gly Ile Leu Leu Ile Ala Asp Glu Val
225 230 235 240
Gln Thr Gly Phe Gly Arg Thr Gly Lys Leu Phe Ala Met Glu His His
245 250 255
Thr Val Gln Ala Asp Ile Ile Thr Met Ala Lys Ser Leu Gly Gly Gly
260 265 270
Phe Pro Ile Ser Gly Ile Val Gly Arg Ala Glu Ile Met Asp Gly Pro
275 280 285
Ala Ala Gly Gly Leu Gly Gly Thr Tyr Ala Gly Asn Pro Leu Ala Val
290 295 300
Ala Ala Ala His Ala Val Leu Asp Val Ile Ala Glu Glu Lys Leu Cys
305 310 315 320
Glu Arg Ala Thr Gln Leu Gly Asp Lys Leu Arg Ala His Leu Glu Gly
325 330 335
Leu Arg Gly Lys Val Pro Gly Ile Ala Asp Val Arg Gly Leu Gly Ser
340 345 350
Met Val Ala Leu Glu Leu Asn Asp Ala Ala Gly Lys Pro Asp Ala Glu
355 360 365
Ala Val Lys Arg Val Gln Lys Arg Ala Leu Asp Ala Gly Leu Ile Leu
370 375 380
Leu Ser Cys Gly Val Tyr Gly Asn Val Leu Arg Phe Leu Tyr Pro Leu
385 390 395 400
Thr Ile Pro Asp Ala Gln Phe Ala Arg Ala Leu Asp Ile Leu Ser Glu
405 410 415
Ala Leu Ala Ala
420
<210> 36
<211> 422
<212> PRT
<213> Metagenomic
<400> 36
Met Met Gln Arg Arg Val Ala Ala Val Pro Arg Gly Val Gly Gln Ile
1 5 10 15
His Pro Ile Phe Ala Asp His Ala Lys Asn Ser Ser Val Val Asp Val
20 25 30
Glu Gly Arg Glu Phe Ile Asp Phe Ala Gly Gly Ile Ala Val Leu Asn
35 40 45
Thr Gly His Leu His Pro Lys Ile Val Lys Ala Val Glu Glu Gln Leu
50 55 60
His Lys Leu Thr His Thr Cys Phe Gln Val Leu Ala Tyr Glu Pro Tyr
65 70 75 80
Ile Ala Leu Cys Glu Ala Ile Ala Lys Arg Val Pro Gly Asp Phe Ala
85 90 95
Lys Lys Thr Leu Leu Val Thr Ser Gly Ser Glu Ala Val Glu Asn Ala
100 105 110
Val Lys Ile Ala Arg Ala Ala Thr Gly Arg Ala Gly Val Ile Ala Phe
115 120 125
Thr Gly Ala Tyr His Gly Arg Thr Met Met Thr Leu Ser Leu Thr Gly
130 135 140
Lys Val Val Pro Tyr Ser Ala Gly Met Gly Leu Met Pro Gly Gly Val
145 150 155 160
Phe Arg Ala Leu Ala Pro Cys Pro Leu His Gly Ile Ser Glu Asp Asp
165 170 175
Ala Ile Ala Ser Ile Glu Arg Val Phe Lys Asn Asp Ala Gln Pro Arg
180 185 190
Asp Ile Ala Ala Ile Ile Ile Glu Pro Val Gln Gly Glu Gly Gly Phe
195 200 205
Tyr Val Asn Ser Pro Ala Phe Met Gln Arg Leu Arg Ala Leu Cys Asp
210 215 220
Glu His Gly Ile Leu Leu Ile Ala Asp Glu Val Gln Thr Gly Ala Gly
225 230 235 240
Arg Thr Gly Thr Phe Phe Ala Cys Glu Gln Leu Gly Ile Val Pro Asp
245 250 255
Leu Thr Thr Phe Ala Lys Ser Val Gly Gly Gly Phe Pro Ile Ser Gly
260 265 270
Val Cys Gly Lys Ala Glu Ile Met Asp Val Ile Ala Pro Gly Gly Leu
275 280 285
Gly Gly Thr Tyr Ala Gly Ser Pro Ile Ala Cys Ala Ala Ala Leu Ala
290 295 300
Val Met Glu Val Phe Glu Glu Glu Lys Leu Leu Glu Arg Ser Gln Ala
305 310 315 320
Val Gly Glu Lys Leu Lys Ala Gly Leu Asn Ala Ile Ala Ala Arg His
325 330 335
Lys Val Ile Gly Asp Val Arg Gly Leu Gly Ser Met Val Ala Ile Glu
340 345 350
Leu Phe Glu Gly Gly Asp His Ser Lys Pro Ala Ala Glu Leu Val Gly
355 360 365
Arg Ile Val Ala Arg Ala Arg Asp Lys Gly Leu Leu Leu Leu Ser Cys
370 375 380
Gly Thr Tyr Tyr Asn Val Ile Arg Phe Leu Met Pro Leu Thr Ile Pro
385 390 395 400
Asp Ala Gln Leu Glu Arg Gly Leu Ala Ile Val Ala Glu Cys Phe Asp
405 410 415
Glu Leu Ala Ser Glu Gln
420
<210> 37
<211> 419
<212> PRT
<213> Metagenomic
<400> 37
Met Thr Asp Arg Lys Asn Ala Ala Ile Ser Arg Gly Val Gly Met Thr
1 5 10 15
Thr Gln Ile Tyr Ala Glu Arg Ala Glu Asn Ala Glu Ile Trp Asp Arg
20 25 30
Glu Gly Arg Arg Tyr Ile Asp Phe Ala Ala Gly Ile Ala Val Val Asn
35 40 45
Thr Gly His Arg His Pro Lys Val Val Gln Ala Val Lys Asp Gln Leu
50 55 60
Asp Arg Phe Thr His Thr Cys His Gln Val Val Pro Tyr Glu Asn Tyr
65 70 75 80
Val Ala Leu Ala Glu Arg Leu Asn Asp Leu Val Pro Gly Asp Phe Glu
85 90 95
Lys Lys Thr Ile Phe Ala Thr Thr Gly Ala Glu Ala Val Glu Asn Ala
100 105 110
Val Lys Ile Ala Arg Phe Ala Thr Gly Arg Ser Ala Ile Ile Ala Phe
115 120 125
Thr Gly Ala Phe His Gly Arg Thr Phe Met Gly Met Thr Leu Thr Gly
130 135 140
Lys Val Gln Pro Tyr Lys Ala Gly Phe Gly Ala Met Met Pro Asp Val
145 150 155 160
Phe His Leu Pro Phe Pro Asn Glu Leu His Gly Val Ser Gln Asp Asp
165 170 175
Ala Leu Ala Ala Leu Asp Lys Leu Phe Lys Ala Asp Val Asp Pro Ala
180 185 190
Arg Val Ala Ala Ile Ile Val Glu Pro Val Gln Gly Glu Gly Gly Phe
195 200 205
Tyr Pro Val Pro Ser Gly Phe Met Gln Lys Leu Arg Ala Leu Cys Asp
210 215 220
Asp Asn Gly Ile Leu Leu Ile Ala Asp Glu Val Gln Thr Gly Phe Ala
225 230 235 240
Arg Thr Gly Arg Leu Phe Ala Met Glu Leu His Gly Val Ser Ala Asp
245 250 255
Ile Thr Thr Met Ala Lys Gly Leu Gly Gly Gly Leu Pro Ile Ser Ala
260 265 270
Val Thr Gly Arg Ala Glu Ile Met Asp Ala Pro Asn Pro Gly Gly Leu
275 280 285
Gly Gly Thr Tyr Ala Gly Asn Pro Leu Gly Val Ala Ala Ala His Ala
290 295 300
Val Leu Asp Ile Ile Glu Glu Glu Gly Leu Cys Asp Arg Ala Glu Arg
305 310 315 320
Leu Gly Gln Arg Leu Lys Gln Arg Leu Ala Ser Leu Arg Asp Asp Val
325 330 335
Pro Glu Ile Val Asp Ile Arg Gly Pro Gly Leu Met Asn Ala Val Glu
340 345 350
Phe Asn Val Ala Gly Ser Asp Arg Pro Asn Pro Glu Met Thr Asn Arg
355 360 365
Val Arg Glu Glu Ala Leu Lys Arg Gly Leu Ile Leu Leu Thr Cys Gly
370 375 380
Val Tyr Gly Asn Val Val Arg Phe Leu Pro Pro Leu Thr Val Pro Asp
385 390 395 400
Ala Val Phe Asp Glu Ala Leu Gly Ile Leu Glu Asp Ser Ile Arg Ala
405 410 415
Ala Arg Gly
<210> 38
<211> 471
<212> PRT
<213> Saccharomyces cerevisiae
<400> 38
Met Ser Ile Cys Glu Gln Tyr Tyr Pro Glu Glu Pro Thr Lys Pro Thr
1 5 10 15
Val Lys Thr Glu Ser Ile Pro Gly Pro Glu Ser Gln Lys Gln Leu Lys
20 25 30
Glu Leu Gly Glu Val Phe Asp Thr Arg Pro Ala Tyr Phe Leu Ala Asp
35 40 45
Tyr Glu Lys Ser Leu Gly Asn Tyr Ile Thr Asp Val Asp Gly Asn Thr
50 55 60
Tyr Leu Asp Leu Tyr Ala Gln Ile Ser Ser Ile Ala Leu Gly Tyr Asn
65 70 75 80
Asn Pro Ala Leu Ile Lys Ala Ala Gln Ser Pro Glu Met Ile Arg Ala
85 90 95
Leu Val Asp Arg Pro Ala Leu Gly Asn Phe Pro Ser Lys Asp Leu Asp
100 105 110
Lys Ile Leu Lys Gln Ile Leu Lys Ser Ala Pro Lys Gly Gln Asp His
115 120 125
Val Trp Ser Gly Leu Ser Gly Ala Asp Ala Asn Glu Leu Ala Phe Lys
130 135 140
Ala Ala Phe Ile Tyr Tyr Arg Ala Lys Gln Arg Gly Tyr Asp Ala Asp
145 150 155 160
Phe Ser Glu Lys Glu Asn Leu Ser Val Met Asp Asn Asp Ala Pro Gly
165 170 175
Ala Pro His Leu Ala Val Leu Ser Phe Lys Arg Ala Phe His Gly Arg
180 185 190
Leu Phe Ala Ser Gly Ser Thr Thr Cys Ser Lys Pro Ile His Lys Leu
195 200 205
Asp Phe Pro Ala Phe His Trp Pro His Ala Glu Tyr Pro Ser Tyr Gln
210 215 220
Tyr Pro Leu Asp Glu Asn Ser Asp Ala Asn Arg Lys Glu Asp Asp His
225 230 235 240
Cys Leu Ala Ile Val Glu Glu Leu Ile Lys Thr Trp Ser Ile Pro Val
245 250 255
Ala Ala Leu Ile Ile Glu Pro Ile Gln Ser Glu Gly Gly Asp Asn His
260 265 270
Ala Ser Lys Tyr Phe Leu Gln Lys Leu Arg Asp Ile Thr Leu Lys Tyr
275 280 285
Asn Val Val Tyr Ile Ile Asp Glu Val Gln Thr Gly Val Gly Ala Thr
290 295 300
Gly Lys Leu Trp Cys His Glu Tyr Ala Asp Ile Gln Pro Pro Val Asp
305 310 315 320
Leu Val Thr Phe Ser Lys Lys Phe Gln Ser Ala Gly Tyr Phe Phe His
325 330 335
Asp Pro Lys Phe Ile Pro Asn Lys Pro Tyr Arg Gln Phe Asn Thr Trp
340 345 350
Cys Gly Glu Pro Ala Arg Met Ile Ile Ala Gly Ala Ile Gly Gln Glu
355 360 365
Ile Ser Asp Lys Lys Leu Thr Glu Gln Cys Ser Arg Val Gly Asp Tyr
370 375 380
Leu Phe Lys Lys Leu Glu Gly Leu Gln Lys Lys Tyr Pro Glu Asn Phe
385 390 395 400
Gln Asn Leu Arg Gly Lys Gly Arg Gly Thr Phe Ile Ala Trp Asp Leu
405 410 415
Pro Thr Gly Glu Lys Arg Asp Leu Leu Leu Lys Lys Leu Lys Leu Asn
420 425 430
Gly Cys Asn Val Gly Gly Cys Ala Val His Ala Val Arg Leu Arg Pro
435 440 445
Ser Leu Thr Phe Glu Glu Lys His Ala Asp Ile Phe Ile Glu Ala Leu
450 455 460
Ala Lys Ser Val Asn Glu Leu
465 470
<210> 39
<211> 450
<212> PRT
<213> Clostridium viride
<400> 39
Met Leu Lys Asn Ala Leu Pro Lys Ile Val Thr Glu Ser Leu Pro Gly
1 5 10 15
Pro Lys Ala Lys Ala Ile Ile Asp Arg Arg Ala Asn Ala Ile Pro Ser
20 25 30
Ala Ile Arg Cys Val Tyr Pro Val Val Ile Asp Arg Gly Glu Gly Ala
35 40 45
Met Val Glu Asp Val Asp Gly Asn His Phe Leu Asp Trp Ile Gly Gly
50 55 60
Val Gly Val Leu Asn Ile Gly Tyr Ser His Pro Glu Val Val Asp Ala
65 70 75 80
Val Lys Lys Gln Thr Glu Arg Tyr Phe His Gly Met Phe Asn Ile Val
85 90 95
Thr His Glu Gly Tyr Val Ala Leu Ala Glu Lys Leu Ser Thr Leu Ala
100 105 110
Pro Val Leu Gly Lys Glu Lys Lys Ala Phe Phe Ala Asn Ser Gly Ala
115 120 125
Glu Ala Asn Glu Asn Ala Ile Lys Ile Ala Lys Ala Tyr Thr Lys Arg
130 135 140
Pro Asn Ile Ile Val Phe Ser Gly Ala Phe His Gly Arg Thr Met Leu
145 150 155 160
Thr Met Ser Met Thr Ser Lys Lys Ala Tyr Ala Asn Gly Met Gly Pro
165 170 175
Phe Pro Asp Gly Val Tyr Arg Ala Lys Phe Pro Tyr Tyr Tyr Arg Asn
180 185 190
Pro Val Gly Leu Pro Gln Glu Glu Ala Val Asn Tyr Tyr Ile Glu Ser
195 200 205
Ile Lys Ser Val Phe Glu Glu Ala Ser Pro Pro Glu His Val Ala Ala
210 215 220
Ile Val Val Glu Pro Leu Gln Gly Glu Gly Gly Phe Ile Pro Ala Pro
225 230 235 240
Ile Glu Trp Val Lys Ala Val Arg Gln Leu Cys Asp Gln His Gly Ile
245 250 255
Leu Leu Ile Ala Asp Glu Val Gln Thr Gly Phe Cys Arg Ala Gly Lys
260 265 270
Met Phe Ala Ser Glu Tyr Trp Gln Gly Ala Gly Ala Ser Pro Asp Ile
275 280 285
Leu Thr Thr Ala Lys Ser Ile Ala Ala Gly Val Pro Ile Ser Ala Ile
290 295 300
Val Ala Arg Asn Glu Ile Met Asp Ala Val Pro Ala Gly Ile Ile Gly
305 310 315 320
Gly Thr Tyr Cys Gly Asn Pro Leu Ala Cys Ala Ala Ala Leu Lys Val
325 330 335
Ile Glu Val Met Glu Arg Asp Lys Phe Ala Gln Arg Ser Thr Glu Ile
340 345 350
Gly Lys Ile Ala Met Glu Arg Phe Gln Gln Phe Lys Gln Asn Tyr Pro
355 360 365
Val Val Gly Asp Val Arg Gly Leu Gly Ser Met Ile Gly Leu Glu Phe
370 375 380
Val Lys Asp Pro Val Ser Lys Glu Pro Asn Ala Pro Phe Val Asn Ala
385 390 395 400
Leu Val Gln Glu Ala Val Lys Arg Gly Leu Met Ile Glu Asn Ala Gly
405 410 415
Thr Tyr Gly Asn Val Ile Arg Phe Leu Ala Pro Leu Thr Ile Thr Asp
420 425 430
Glu Gln Leu Tyr Ala Gly Leu Asp Ile Met Glu Glu Ser Ile Lys Ala
435 440 445
Leu Leu
450
<210> 40
<211> 441
<212> PRT
<213> Gulosibacter molinativorax
<400> 40
Met Glu Phe Arg Leu Glu Gln Gln Arg Lys Ile Val Thr Glu Ile Pro
1 5 10 15
Gly Pro Lys Ser Glu Glu Leu Leu Lys Arg Arg Gln Gln Tyr Val Ser
20 25 30
Ser Ser Ile Gly Ser Ser Leu Pro Val Tyr Ile Gly Glu Ala Asp Gly
35 40 45
Ala Ile Leu Arg Asp Val Asp Gly Asn Gln Phe Ile Asp Phe Gly Ser
50 55 60
Gly Ile Gly Val Thr Thr Val Gly Asn Ala Asn Pro Lys Val Val Lys
65 70 75 80
Ala Ile Gln Asp Ala Ala Ala Ala Ser Thr His Leu Gln Ile Asn Thr
85 90 95
Ala Pro Tyr Gly Ser Tyr Val Asp Leu Cys Gln Lys Leu Thr Glu Leu
100 105 110
Thr Pro Gly Asp Phe Pro Lys Lys Ala Ala Leu Phe Asn Ser Gly Ala
115 120 125
Glu Ala Val Glu Asn Ala Val Lys Ile Ala Arg Lys Tyr Thr Gly Arg
130 135 140
Asp Ala Val Ile Val Phe Asp His Ala Phe His Gly Arg Thr Asn Leu
145 150 155 160
Thr Met Ala Met Thr Ser Lys Ser Met Pro Tyr Lys Asp Gly Phe Gly
165 170 175
Pro Phe Ala Pro Glu Val Tyr Arg Ala Pro Leu Ser Tyr Pro Phe Arg
180 185 190
Asp Glu Leu Ser Gly Pro Glu Ala Ala Ala Arg Thr Ile Asp Val Ile
195 200 205
Asp Lys Gln Val Gly Ala Lys Asn Val Ala Ala Ile Ile Ile Glu Pro
210 215 220
Ile Val Gly Glu Gly Gly Phe Ile Val Pro Ala Glu Gly Phe Leu Pro
225 230 235 240
Ala Leu Val Glu Tyr Ala Asn Glu Asn Gly Ile Val Phe Val Ala Asp
245 250 255
Glu Val Gln Ala Gly Met Ser Arg Thr Gly Lys Trp Phe Cys Ser Glu
260 265 270
Trp Glu Gly Ile Glu Pro Asp Leu Val Thr Ser Ala Lys Gly Ile Ala
275 280 285
Gly Gly Met Pro Leu Ser Ala Val Val Gly Arg Ala Glu Ile Met Asp
290 295 300
Ala Pro His Thr Gly Gly Ile Gly Gly Thr Tyr Ala Gly Asn Pro Val
305 310 315 320
Ala Asn Ala Ala Ala Leu Ala Thr Ile Ala Ser Tyr Glu Glu Asp Gly
325 330 335
Leu Gln Glu Ala Ala Leu Arg Ile Glu Lys Thr Ile Arg Gly Val Leu
340 345 350
Glu Pro Leu Val Asp Glu Leu Asp Val Val Gly Glu Val Arg Gly Arg
355 360 365
Gly Ala Met Leu Ala Ile Glu Leu Val Thr Gly Ala Asp Lys Thr Pro
370 375 380
Asn Pro Glu Leu Val Lys Thr Val Val Ala Glu Ala Gln Ala Gln Gly
385 390 395 400
Val Val Phe Leu Thr Cys Gly Thr Tyr Gly Asn Val Ile Arg Phe Leu
405 410 415
Pro Pro Leu Val Ile Thr Asp Glu Leu Leu Thr Asp Gly Leu Asn Val
420 425 430
Leu Val Asp Ala Ile Arg Lys Asn Ala
435 440
<210> 41
<211> 447
<212> PRT
<213> Kocuria rhizophila
<400> 41
Met Ala Glu Ile Glu Tyr Arg Leu Pro Gln Lys Arg Glu Leu Val Thr
1 5 10 15
Ser Ile Pro Gly Pro Lys Ser Gln Ser Leu Ala Glu Arg Arg Ala Gln
20 25 30
Thr Val Ala Ala Gly Val Ala Ser Ser Leu Pro Val Phe Ala Asp Glu
35 40 45
Leu Asp Gly Gly Val Ile Lys Asp Val Asp Gly Asn Gln Met Val Asp
50 55 60
Leu Gly Ser Gly Ile Ala Val Thr Ser Val Gly Ala Ser Asn Pro Lys
65 70 75 80
Val Val Ala Arg Val Gln Asp Ala Val Ala Lys Phe Thr His Thr Cys
85 90 95
Phe Met Val Thr Pro Tyr Glu Asp Tyr Val Ala Val Gly Glu Lys Met
100 105 110
Ala Gln Leu Thr Pro Gly Ser Phe Asp Lys Arg Thr Ala Leu Phe Thr
115 120 125
Ser Gly Ser Glu Ala Val Glu Asn Ala Val Lys Ile Ala Arg Val Arg
130 135 140
Thr Lys Arg Gln Ala Val Val Val Phe Asp His Ala Tyr His Gly Arg
145 150 155 160
Thr Asn Leu Thr Met Ala Met Thr Ala Lys Val Met Pro Tyr Lys Gln
165 170 175
Gly Phe Gly Pro Phe Ala Asn Glu Val Tyr Arg Val Pro Met Ser Tyr
180 185 190
Pro Phe Arg Asp Pro Glu Gly Met Thr Gly Thr Glu Ala Ala Lys Arg
195 200 205
Ala Leu Thr Met Val Glu Lys Gln Val Gly Ala Glu Asn Val Ala Ala
210 215 220
Val Val Ile Glu Pro Ile Gln Gly Glu Gly Gly Phe Ile Val Pro Ala
225 230 235 240
Glu Gly Phe Leu Pro Ala Leu Ser Ser Trp Cys Arg Glu Asn Gly Ala
245 250 255
Val Phe Val Ala Asp Glu Val Gln Ala Gly Ile Ala Arg Thr Gly Ala
260 265 270
Trp Phe Ala Ser Glu His Glu Gly Val Glu Pro Asp Leu Val Thr Phe
275 280 285
Ala Lys Gly Ile Ala Gly Gly Met Pro Leu Ser Gly Val Val Gly Arg
290 295 300
Ala Glu Ile Met Asp Ala Val His Pro Gly Gly Leu Gly Gly Thr Tyr
305 310 315 320
Gly Gly Asn Pro Val Ala Cys Ala Ala Ala Leu Gly Ala Leu Glu Ala
325 330 335
Ile Glu Glu Trp Asp Leu Val Ala Arg Ala Gln Glu Ile Glu Lys Val
340 345 350
Ile Arg Glu Glu Leu Gly Ser Val Ala Glu Ser Ser Pro Val Val Gly
355 360 365
Asp Leu Arg Gly Arg Gly Ala Met Ile Ala Leu Glu Phe Val Lys Pro
370 375 380
Gly Thr Thr Glu Pro Asn Pro Asp Ala Ala Lys Gln Ile Ala Ala Arg
385 390 395 400
Cys Leu Glu Gln Gly Val Ala Ile Leu Thr Cys Gly Thr Tyr Gly Asn
405 410 415
Ile Val Arg Leu Leu Pro Pro Leu Val Ile Asp Met Asp Leu Leu Arg
420 425 430
Asp Ala Leu Gly Val Phe Ala Ala Ala Ile Gln Glu Val Gly Ala
435 440 445
<210> 42
<211> 468
<212> PRT
<213> Arthrobacter sp. FB24
<400> 42
Met Val Glu Leu Val Glu Thr Arg Thr Gly Thr His Gln Lys Gly Ile
1 5 10 15
Pro Met Thr Ala Thr Ala Pro Asp Ile Thr Tyr Arg Leu Glu Gln Lys
20 25 30
Arg Arg Val Gln Ala Asp Phe Pro Gly Pro Lys Ser Val Ala Leu Thr
35 40 45
Glu Arg Arg Lys Ala Val Val Ala Ala Gly Val Ala Ser Ser Val Pro
50 55 60
Val Phe Val Ser Asp Ala Asp Gly Gly Ile Ile His Asp Val Asp Gly
65 70 75 80
Asn Ser Phe Ile Asp Leu Gly Ser Gly Ile Ala Val Thr Ser Val Gly
85 90 95
Ala Ser Asp Pro Ala Val Val Gly Ala Val Lys Glu Ala Val Glu His
100 105 110
Phe Thr His Thr Cys Phe Met Val Thr Pro Tyr Glu Gly Tyr Val Ala
115 120 125
Val Ala Glu Gln Leu Asn Arg Leu Thr Pro Gly Asp His Glu Lys Arg
130 135 140
Thr Val Leu Phe Asn Ser Gly Ala Glu Ala Val Glu Asn Ala Val Lys
145 150 155 160
Val Ala Arg Leu Ala Thr Gly Arg Asp Ala Val Val Ala Phe Asp His
165 170 175
Ala Tyr His Gly Arg Thr Asn Leu Thr Met Ala Leu Thr Ala Lys Ala
180 185 190
Met Pro Tyr Lys Thr Asn Phe Gly Pro Phe Ala Pro Glu Val Tyr Arg
195 200 205
Met Pro Met Ser Tyr Pro Phe Arg Glu Glu Asn Pro Ala Ile Thr Gly
210 215 220
Ala Glu Ala Ala Lys Arg Ala Ile Thr Ala Ile Glu Lys Gln Ile Gly
225 230 235 240
Gly Glu Gln Val Ala Ala Ile Ile Ile Glu Pro Ile Gln Gly Glu Gly
245 250 255
Gly Phe Ile Val Pro Ala Asp Gly Phe Leu Pro Ala Leu Ala Ala Trp
260 265 270
Ala Lys Glu Lys Gly Ile Val Phe Ile Ala Asp Glu Val Gln Ser Gly
275 280 285
Phe Cys Arg Thr Gly Glu Trp Phe Ala Val Asn His Glu Gly Val Val
290 295 300
Pro Asp Ile Ile Thr Met Ala Lys Gly Ile Ala Gly Gly Met Pro Leu
305 310 315 320
Ser Ala Ile Thr Gly Arg Ala Asp Leu Leu Asp Ala Val His Pro Gly
325 330 335
Gly Leu Gly Gly Thr Tyr Gly Gly Asn Pro Val Ala Cys Ala Ala Ala
340 345 350
Leu Ala Ser Ile Gly Ser Met Glu Glu Tyr Asp Leu Asn Ala Arg Ala
355 360 365
Lys His Ile Glu Glu Leu Ala Thr Gly Arg Leu Arg Glu Leu Gln Gly
370 375 380
Glu Val Ser Val Ile Gly Asp Ile Arg Gly Arg Gly Ala Met Leu Ala
385 390 395 400
Ile Glu Leu Val Gln Ala Gly Ser Lys Glu Pro Asn Pro Glu Leu Thr
405 410 415
Lys Ala Val Ala Ala Ala Cys Leu Lys Glu Gly Val Ile Ile Leu Thr
420 425 430
Cys Gly Thr Tyr Gly Asn Val Ile Arg Leu Leu Pro Pro Leu Val Ile
435 440 445
Gly Asp Glu Leu Leu Leu Asp Gly Leu Glu Val Leu Ala Ala Ala Ile
450 455 460
Lys Ala His Ala
465
<210> 43
<211> 426
<212> PRT
<213> Pseudomonas sp. AAC
<400> 43
Met Ser Lys Thr Asn Glu Ser Leu Leu Gln Arg Arg Gln Ala Ala Val
1 5 10 15
Pro Arg Gly Val Gly Gln Ile His Pro Val Val Ala Glu Arg Ala Glu
20 25 30
Asn Ala Thr Val Trp Asp Val Glu Gly Arg Glu Tyr Ile Asp Phe Ala
35 40 45
Gly Gly Ile Ala Val Leu Asn Thr Gly His Leu His Pro Lys Val Val
50 55 60
Ala Ala Val Gln Glu Gln Leu Thr Lys Leu Ser His Thr Cys Phe Gln
65 70 75 80
Val Leu Ala Tyr Glu Pro Tyr Ile Glu Leu Ala Glu Glu Ile Ala Lys
85 90 95
Arg Val Pro Gly Asn Phe Pro Lys Lys Thr Leu Leu Val Thr Ser Gly
100 105 110
Ser Glu Ala Val Glu Asn Ala Val Lys Ile Ala Arg Ala Ala Thr Gly
115 120 125
Arg Ala Gly Val Ile Ala Phe Thr Gly Ala Tyr His Gly Arg Thr Met
130 135 140
Met Thr Leu Gly Leu Thr Gly Lys Val Val Pro Tyr Ser Ala Gly Met
145 150 155 160
Gly Leu Met Pro Gly Gly Ile Phe Arg Ala Leu Ala Pro Cys Glu Leu
165 170 175
His Gly Ile Ser Glu Asp Glu Ser Ile Ala Ser Ile Glu Arg Ile Phe
180 185 190
Lys Asn Asp Ala Gln Pro Arg Asp Ile Ala Ala Ile Ile Ile Glu Pro
195 200 205
Val Gln Gly Glu Gly Gly Phe Tyr Val Asn Ser Lys Pro Phe Met Gln
210 215 220
Arg Leu Arg Ala Leu Cys Asp Glu His Gly Ile Leu Leu Ile Ala Asp
225 230 235 240
Glu Val Gln Thr Gly Ala Gly Arg Thr Gly Thr Phe Phe Ala Thr Glu
245 250 255
Gln Leu Gly Ile Val Pro Asp Leu Thr Thr Phe Ala Lys Ser Val Gly
260 265 270
Gly Gly Phe Pro Ile Ser Gly Val Val Gly Lys Ala Glu Ile Met Asp
275 280 285
Ala Ile Ala Pro Gly Gly Leu Gly Gly Thr Tyr Ala Gly Ser Pro Ile
290 295 300
Ala Cys Ala Ala Ala Leu Ala Val Leu Lys Val Phe Asp Glu Glu Lys
305 310 315 320
Leu Leu Glu Arg Ser Gln Ala Val Gly Glu Thr Leu Lys Ala Gly Leu
325 330 335
Arg Glu Ile Gln Ala Lys His Lys Val Ile Gly Asp Val Arg Gly Leu
340 345 350
Gly Ser Met Val Ala Ile Glu Leu Phe Glu Gly Gly Asp Val Asn Lys
355 360 365
Pro Ala Ala Glu Leu Val Ser Lys Ile Val Val Arg Ala Arg Glu Lys
370 375 380
Gly Leu Ile Leu Leu Ser Cys Gly Thr Tyr Tyr Asn Val Ile Arg Phe
385 390 395 400
Leu Met Pro Val Thr Ile Pro Asp Ala Gln Leu Lys Gln Gly Leu Ala
405 410 415
Ile Leu Ala Glu Cys Phe Asp Glu Leu Ala
420 425
<210> 44
<211> 426
<212> PRT
<213> Pseudomonas putida KG-4
<400> 44
Met Ser Lys Thr Asn Glu Ser Leu Met Gln Arg Arg Val Ala Ala Val
1 5 10 15
Pro Arg Gly Val Gly Gln Ile His Pro Ile Phe Ala Glu Ser Ala Arg
20 25 30
Asn Ala Thr Val Thr Asp Val Glu Gly Arg Glu Phe Ile Asp Phe Ala
35 40 45
Gly Gly Ile Ala Val Leu Asn Thr Gly His Val His Pro Lys Ile Ile
50 55 60
Ala Ala Val Glu Ala Gln Leu His Lys Leu Thr His Thr Cys Phe Gln
65 70 75 80
Val Leu Ala Tyr Glu Pro Tyr Val Glu Val Cys Glu Lys Ile Asn Ala
85 90 95
Leu Ile Pro Gly Asp Phe Ala Lys Lys Thr Leu Leu Val Thr Thr Gly
100 105 110
Ser Glu Ala Val Glu Asn Ala Ile Lys Ile Ala Arg Ala Ala Thr Gly
115 120 125
Arg Ala Gly Val Ile Ala Phe Thr Gly Ala Tyr His Gly Arg Thr Met
130 135 140
Met Thr Leu Gly Leu Thr Gly Lys Val Val Pro Tyr Ser Ala Gly Met
145 150 155 160
Gly Leu Met Pro Gly Gly Ile Phe Arg Ala Ile Tyr Pro Asn Glu Leu
165 170 175
His Gly Val Ser Ile Asp Asp Ser Ile Ala Ser Ile Glu Arg Ile Phe
180 185 190
Lys Asn Asp Ala Glu Ala Lys Asp Ile Ala Ala Ile Ile Leu Glu Pro
195 200 205
Val Gln Gly Glu Gly Gly Phe Tyr Val Ala Pro Lys Glu Phe Met Lys
210 215 220
Arg Leu Arg Ala Leu Cys Asp Gln His Gly Ile Leu Leu Ile Ala Asp
225 230 235 240
Glu Val Gln Thr Gly Ala Gly Arg Thr Gly Thr Phe Phe Ala Met Glu
245 250 255
Gln Met Gly Val Ala Pro Asp Leu Thr Thr Phe Ala Lys Ser Ile Ala
260 265 270
Gly Gly Phe Pro Leu Ala Gly Val Cys Gly Lys Ala Glu Tyr Met Asp
275 280 285
Ala Ile Ala Pro Gly Gly Leu Gly Gly Thr Tyr Ala Gly Ser Pro Ile
290 295 300
Ala Cys Ala Ala Ala Leu Ala Val Met Glu Val Phe Glu Glu Glu Lys
305 310 315 320
Leu Leu Asp Arg Ser Lys Ala Val Gly Glu Arg Leu Val Thr Gly Leu
325 330 335
Arg Lys Ile Gln Asp Lys His Pro Ile Ile Gly Asp Val Arg Ala Leu
340 345 350
Gly Ser Met Ile Ala Val Glu Val Phe Asp Lys Ala Gly Ser His Thr
355 360 365
Pro Asn Pro Thr Ala Val Ala Ala Val Val Ala Lys Ala Arg Asp Lys
370 375 380
Gly Leu Ile Leu Leu Ser Cys Gly Thr Tyr Gly Asn Val Leu Arg Ile
385 390 395 400
Leu Val Pro Leu Thr Ser Pro Asp Glu Gln Leu Asp Lys Gly Leu Ala
405 410 415
Ile Ile Glu Glu Cys Phe Ala Glu Leu Ala
420 425
<210> 45
<211> 442
<212> PRT
<213> Alcaligenes A. faecalis
<400> 45
Met Ser Lys Asp Lys Ala Met Leu Asn Ala Phe Asp Pro Ala Ala Ala
1 5 10 15
Asp Ser Leu Pro Ala Ala Glu Arg Ala Leu Ile Glu Arg Arg Gln Arg
20 25 30
Val Leu Gly Thr Ala Tyr Arg Leu Phe Tyr Asp Asn Pro Leu His Ile
35 40 45
Val Arg Gly Glu Gly Val Trp Leu Tyr Asp Ala Ala Gly Glu Arg Tyr
50 55 60
Leu Asp Ala Tyr Asn Asn Val Ala Ser Val Gly His Ser His Pro Arg
65 70 75 80
Val Val Ala Ala Ile Ala Glu Gln Ala Ala Ile Leu Asn Thr His Thr
85 90 95
Arg Tyr Leu His Asp Gly Val Val Glu Tyr Ala Glu Arg Leu Val Ala
100 105 110
Thr Phe Pro Ser Ala Leu Ser Gln Ala Met Phe Thr Cys Thr Gly Ser
115 120 125
Glu Ala Asn Asp Leu Ala Leu Arg Ile Ala Arg Ser His Thr Gly Ala
130 135 140
Ser Gly Val Ile Val Thr Glu Leu Ala Tyr His Gly Val Thr Ala Ala
145 150 155 160
Val Ala Ala Val Ser Pro Ser Leu Gly Lys Thr Val Pro Leu Gly Val
165 170 175
Asp Val Arg Ala Val Ser Ala Pro Asp Thr Tyr Arg His Asp Pro Ala
180 185 190
Thr Ile Gly Val Trp Phe Ala Ala Arg Val Gln Glu Ala Ile Asp Asp
195 200 205
Met Leu Arg His Gly Ile Arg Pro Ala Ala Leu Leu Val Asp Thr Val
210 215 220
Phe Ser Ser Asp Gly Val Tyr Thr Asp Pro Ala Pro Phe Leu Ala Pro
225 230 235 240
Ala Val Glu Ala Ile Arg Ala Ala Gly Gly Leu Phe Ile Ala Asp Glu
245 250 255
Val Gln Ala Gly Phe Ala Arg Thr Gly Ser Cys Met Trp Gly Phe Gln
260 265 270
Arg His Gly Leu Val Pro Asp Ile Val Thr Met Gly Lys Pro Met Gly
275 280 285
Asn Gly His Pro Ile Ala Gly Val Val Ala Arg Pro Glu Ile Phe Glu
290 295 300
Arg Phe Gly Arg Asp Ala Arg Tyr Phe Asn Thr Phe Gly Gly Asn Pro
305 310 315 320
Val Ser Cys Ala Ala Ala Leu Ala Thr Leu Asp Val Ile Gln Asp Glu
325 330 335
Gly Leu Gln Ala Asn Ala Ala Arg Thr Gly Ala Tyr Leu Arg Asp Lys
340 345 350
Phe Arg Glu Met Ala Arg Lys His Ser Trp Ile Gly Asp Val Arg Gly
355 360 365
Asp Gly Leu Phe Met Gly Ile Glu Leu Val Lys Asp Gln Ala Ala Lys
370 375 380
Thr Pro Ala Thr Glu Glu Thr His Arg Phe Val Asn Leu Met Arg Glu
385 390 395 400
His Arg Val Leu Leu Ser Ala Thr Gly Leu Arg Gly Asn Val Ile Lys
405 410 415
Leu Arg Pro Gln Leu Pro Phe Ser Leu Glu Asn Ala Asp Gln Leu Met
420 425 430
Gln Ala Ala Asp Glu Val Phe Ala Lys Leu
435 440
<210> 46
<211> 1095
<212> DNA
<213> Candida tropicalis
<400> 46
atgatcacgg cgcaagcggt tctgtacacc cagcacggtg aaccaaagga tgttctgttt 60
actcaatcct ttgaaatcga tgatgataac ctcgcaccca atgaagtgat tgttaaaacc 120
ttgggctcgc cggtcaatcc tagcgatatc aaccagatcc agggcgttta tccatctaag 180
ccggcgaaaa ccaccggatt cggtactacg gaaccggcgg ccccgtgcgg caatgaaggc 240
ttattcgaag taattaaagt aggtagtaac gtcagctctc tggaagccgg ggattgggtg 300
attcctagcc acgtcaattt cgggacctgg cgcacacatg ccctggggaa cgatgacgat 360
ttcattaaac tgccgaatcc ggcgcaaagc aaagcgaacg ggaagcctaa tggcctgacc 420
attaaccaag gcgcgacgat cagcgtgaac cccttgacgg catatctcat gctcactcat 480
tacgttaaat tgacaccggg taaggattgg ttcatccaaa atggtgggac cagcgctgtt 540
ggtaagtacg cgtcgcaaat cggcaaactt ttgaacttta actcaattag tgttattcgc 600
gatcgtccta acctggacga agttgtggcc agccttaaag aactgggcgc cacccaggta 660
attaccgaag atcagaataa tagcagagaa ttcggtccga ccattaaaga atggatcaaa 720
cagtcaggtg gtgaagcgaa acttgcgctg aactgcgttg ggggcaaatc gtcgaccggg 780
attgcccgta agctgaacaa caacggccta atgctgacct acggaggtat gagtttccaa 840
ccagtgacaa tccctacctc gttgtatatc ttcaagaact tcacctccgc tggcttttgg 900
gtgaccgaac tgctaaaaaa caacaaagaa ctgaaaacat ctaccttaaa tcagattatt 960
gcatggtatg aagagggcaa actgacggat gcgaagtcaa ttgaaacact gtatgatgga 1020
acgaaacctt tgcacgaatt ataccaggat ggtgtggcga acagtaaaga cggcaaacag 1080
ctgattactt attag 1095
<210> 47
<211> 1095
<212> PRT
<213> Candida tropicalis
<400> 47
Ala Thr Gly Ala Thr Cys Ala Cys Gly Gly Cys Gly Cys Ala Ala Gly
1 5 10 15
Cys Gly Gly Thr Thr Cys Thr Gly Thr Ala Cys Ala Cys Cys Cys Ala
20 25 30
Gly Cys Ala Cys Gly Gly Thr Gly Ala Ala Cys Cys Ala Ala Ala Gly
35 40 45
Gly Ala Thr Gly Thr Thr Cys Thr Gly Thr Thr Thr Ala Cys Thr Cys
50 55 60
Ala Ala Thr Cys Cys Thr Thr Thr Gly Ala Ala Ala Thr Cys Gly Ala
65 70 75 80
Thr Gly Ala Thr Gly Ala Thr Ala Ala Cys Cys Thr Cys Gly Cys Ala
85 90 95
Cys Cys Cys Ala Ala Thr Gly Ala Ala Gly Thr Gly Ala Thr Thr Gly
100 105 110
Thr Thr Ala Ala Ala Ala Cys Cys Thr Thr Gly Gly Gly Cys Thr Cys
115 120 125
Gly Cys Cys Gly Gly Thr Cys Ala Ala Thr Cys Cys Thr Ala Gly Cys
130 135 140
Gly Ala Thr Ala Thr Cys Ala Ala Cys Cys Ala Gly Ala Thr Cys Cys
145 150 155 160
Ala Gly Gly Gly Cys Gly Thr Thr Thr Ala Thr Cys Cys Ala Thr Cys
165 170 175
Thr Ala Ala Gly Cys Cys Gly Gly Cys Gly Ala Ala Ala Ala Cys Cys
180 185 190
Ala Cys Cys Gly Gly Ala Thr Thr Cys Gly Gly Thr Ala Cys Thr Ala
195 200 205
Cys Gly Gly Ala Ala Cys Cys Gly Gly Cys Gly Gly Cys Cys Cys Cys
210 215 220
Gly Thr Gly Cys Gly Gly Cys Ala Ala Thr Gly Ala Ala Gly Gly Cys
225 230 235 240
Thr Thr Ala Thr Thr Cys Gly Ala Ala Gly Thr Ala Ala Thr Thr Ala
245 250 255
Ala Ala Gly Thr Ala Gly Gly Thr Ala Gly Thr Ala Ala Cys Gly Thr
260 265 270
Cys Ala Gly Cys Thr Cys Thr Cys Thr Gly Gly Ala Ala Gly Cys Cys
275 280 285
Gly Gly Gly Gly Ala Thr Thr Gly Gly Gly Thr Gly Ala Thr Thr Cys
290 295 300
Cys Thr Ala Gly Cys Cys Ala Cys Gly Thr Cys Ala Ala Thr Thr Thr
305 310 315 320
Cys Gly Gly Gly Ala Cys Cys Thr Gly Gly Cys Gly Cys Ala Cys Ala
325 330 335
Cys Ala Thr Gly Cys Cys Cys Thr Gly Gly Gly Gly Ala Ala Cys Gly
340 345 350
Ala Thr Gly Ala Cys Gly Ala Thr Thr Thr Cys Ala Thr Thr Ala Ala
355 360 365
Ala Cys Thr Gly Cys Cys Gly Ala Ala Thr Cys Cys Gly Gly Cys Gly
370 375 380
Cys Ala Ala Ala Gly Cys Ala Ala Ala Gly Cys Gly Ala Ala Cys Gly
385 390 395 400
Gly Gly Ala Ala Gly Cys Cys Thr Ala Ala Thr Gly Gly Cys Cys Thr
405 410 415
Gly Ala Cys Cys Ala Thr Thr Ala Ala Cys Cys Ala Ala Gly Gly Cys
420 425 430
Gly Cys Gly Ala Cys Gly Ala Thr Cys Ala Gly Cys Gly Thr Gly Ala
435 440 445
Ala Cys Cys Cys Cys Thr Thr Gly Ala Cys Gly Gly Cys Ala Thr Ala
450 455 460
Thr Cys Thr Cys Ala Thr Gly Cys Thr Cys Ala Cys Thr Cys Ala Thr
465 470 475 480
Thr Ala Cys Gly Thr Thr Ala Ala Ala Thr Thr Gly Ala Cys Ala Cys
485 490 495
Cys Gly Gly Gly Thr Ala Ala Gly Gly Ala Thr Thr Gly Gly Thr Thr
500 505 510
Cys Ala Thr Cys Cys Ala Ala Ala Ala Thr Gly Gly Thr Gly Gly Gly
515 520 525
Ala Cys Cys Ala Gly Cys Gly Cys Thr Gly Thr Thr Gly Gly Thr Ala
530 535 540
Ala Gly Thr Ala Cys Gly Cys Gly Thr Cys Gly Cys Ala Ala Ala Thr
545 550 555 560
Cys Gly Gly Cys Ala Ala Ala Cys Thr Thr Thr Thr Gly Ala Ala Cys
565 570 575
Thr Thr Thr Ala Ala Cys Thr Cys Ala Ala Thr Thr Ala Gly Thr Gly
580 585 590
Thr Thr Ala Thr Thr Cys Gly Cys Gly Ala Thr Cys Gly Thr Cys Cys
595 600 605
Thr Ala Ala Cys Cys Thr Gly Gly Ala Cys Gly Ala Ala Gly Thr Thr
610 615 620
Gly Thr Gly Gly Cys Cys Ala Gly Cys Cys Thr Thr Ala Ala Ala Gly
625 630 635 640
Ala Ala Cys Thr Gly Gly Gly Cys Gly Cys Cys Ala Cys Cys Cys Ala
645 650 655
Gly Gly Thr Ala Ala Thr Thr Ala Cys Cys Gly Ala Ala Gly Ala Thr
660 665 670
Cys Ala Gly Ala Ala Thr Ala Ala Thr Ala Gly Cys Ala Gly Ala Gly
675 680 685
Ala Ala Thr Thr Cys Gly Gly Thr Cys Cys Gly Ala Cys Cys Ala Thr
690 695 700
Thr Ala Ala Ala Gly Ala Ala Thr Gly Gly Ala Thr Cys Ala Ala Ala
705 710 715 720
Cys Ala Gly Thr Cys Ala Gly Gly Thr Gly Gly Thr Gly Ala Ala Gly
725 730 735
Cys Gly Ala Ala Ala Cys Thr Thr Gly Cys Gly Cys Thr Gly Ala Ala
740 745 750
Cys Thr Gly Cys Gly Thr Thr Gly Gly Gly Gly Gly Cys Ala Ala Ala
755 760 765
Thr Cys Gly Thr Cys Gly Ala Cys Cys Gly Gly Gly Ala Thr Thr Gly
770 775 780
Cys Cys Cys Gly Thr Ala Ala Gly Cys Thr Gly Ala Ala Cys Ala Ala
785 790 795 800
Cys Ala Ala Cys Gly Gly Cys Cys Thr Ala Ala Thr Gly Cys Thr Gly
805 810 815
Ala Cys Cys Thr Ala Cys Gly Gly Ala Gly Gly Thr Ala Thr Gly Ala
820 825 830
Gly Thr Thr Thr Cys Cys Ala Ala Cys Cys Ala Gly Thr Gly Ala Cys
835 840 845
Ala Ala Thr Cys Cys Cys Thr Ala Cys Cys Thr Cys Gly Thr Thr Gly
850 855 860
Thr Ala Thr Ala Thr Cys Thr Thr Cys Ala Ala Gly Ala Ala Cys Thr
865 870 875 880
Thr Cys Ala Cys Cys Thr Cys Cys Gly Cys Thr Gly Gly Cys Thr Thr
885 890 895
Thr Thr Gly Gly Gly Thr Gly Ala Cys Cys Gly Ala Ala Cys Thr Gly
900 905 910
Cys Thr Ala Ala Ala Ala Ala Ala Cys Ala Ala Cys Ala Ala Ala Gly
915 920 925
Ala Ala Cys Thr Gly Ala Ala Ala Ala Cys Ala Thr Cys Thr Ala Cys
930 935 940
Cys Thr Thr Ala Ala Ala Thr Cys Ala Gly Ala Thr Thr Ala Thr Thr
945 950 955 960
Gly Cys Ala Thr Gly Gly Thr Ala Thr Gly Ala Ala Gly Ala Gly Gly
965 970 975
Gly Cys Ala Ala Ala Cys Thr Gly Ala Cys Gly Gly Ala Thr Gly Cys
980 985 990
Gly Ala Ala Gly Thr Cys Ala Ala Thr Thr Gly Ala Ala Ala Cys Ala
995 1000 1005
Cys Thr Gly Thr Ala Thr Gly Ala Thr Gly Gly Ala Ala Cys Gly
1010 1015 1020
Ala Ala Ala Cys Cys Thr Thr Thr Gly Cys Ala Cys Gly Ala Ala
1025 1030 1035
Thr Thr Ala Thr Ala Cys Cys Ala Gly Gly Ala Thr Gly Gly Thr
1040 1045 1050
Gly Thr Gly Gly Cys Gly Ala Ala Cys Ala Gly Thr Ala Ala Ala
1055 1060 1065
Gly Ala Cys Gly Gly Cys Ala Ala Ala Cys Ala Gly Cys Thr Gly
1070 1075 1080
Ala Thr Thr Ala Cys Thr Thr Ala Thr Thr Ala Ala
1085 1090 1095
<210> 48
<211> 1023
<212> DNA
<213> Drosophila melanogaster
<400> 48
atgatgagcg ttgttgcaaa aagcctgaaa tatacccagc atggtgaacc gcaagaagtt 60
ctgcagctgg ttgaagataa actgcctgat ccgaaagata atcaggtgct ggttaaaatt 120
ctggcagcac cgattaatcc ggcagatatt aacaccattc agggtaaata tccggtgaaa 180
ccgaaatttc cggcagttgg tggtaatgaa tgtgttgccg aagttatttg cgttggcgat 240
aaagtgaaag gttttgaagc aggtcagcat gttattccgc tggcaagcgg tttaggcacc 300
tggaccacac atgcagttta taaagaagat cagctgctga ttgtgagcaa aaaagttggt 360
ctggcagaag cagcgaccag caccgtgaat ccgaccaccg catatcgtat gctgaaagat 420
tttgttcagc tgtgtccggg tgataccgtt attcagaatg gtgcaaatag cgcagttggt 480
caggccgttc atcagctgtg ccgtgcatgg ggtattaata gcgttggtat tgttcgtgat 540
cgtccggaaa ttgcagaact gaaacaaatg ctgcagtgtc tgggtgcaac cgaagttctg 600
accgaagcag aaattcgtac cagcgatatc tttaaaagcg gcaaactgaa aaaaccgcgt 660
ctggcattta attgtgttgg tggcaaaagc gccaccgaag ttagccgtca tctggataat 720
ggtggtgttc tggttaccta tggtggtatg agccgtgaac cggttaccgt tgcaaccggt 780
ccgctgattt tcaaagatat tgcatttcgt ggtttctgga tgacccgttg gagcaaagaa 840
aactatagca gtccggaacg tagcaagatg ttcaaagaaa tttttgaact gatggaacag 900
ggcaaatttg tggcaccgaa tcatgaaatg gtgccgctgg ccaaattcaa agatgcagca 960
gcagccgcac tgagctttaa aggttttacc ggcaaaaaat acatcctgga tatgagcatt 1020
tag 1023
<210> 49
<211> 1023
<212> DNA
<213> Drosophila melanogaster
<400> 49
atgatgagcg ttgttgcaaa aagcctgaaa tatacccagc atggtgaacc gcaagaagtt 60
ctgcagctgg ttgaagataa actgcctgat ccgaaagata atcaggtgct ggttaaaatt 120
ctggcagcac cgattaatcc ggcagatatt aacaccattc agggtaaata tccggtgaaa 180
ccgaaatttc cggcagttgg tggtaatgaa tgtgttgccg aagttatttg cgttggcgat 240
aaagtgaaag gttttgaagc aggtcagcat gttattccgc tggcaagcgg tttaggcacc 300
tggaccacac atgcagttta taaagaagat cagctgctga ttgtgagcaa aaaagttggt 360
ctggcagaag cagcgaccag caccgtgaat ccgaccaccg catatcgtat gctgaaagat 420
tttgttcagc tgtgtccggg tgataccgtt attcagaatg gtgcaaatag cgcagttggt 480
caggccgttc atcagctgtg ccgtgcatgg ggtattaata gcgttggtat tgttcgtgat 540
cgtccggaaa ttgcagaact gaaacaaatg ctgcagtgtc tgggtgcaac cgaagttctg 600
accgaagcag aaattcgtac cagcgatatc tttaaaagcg gcaaactgaa aaaaccgcgt 660
ctggcattta attgtgttgg tggcaaaagc gccaccgaag ttagccgtca tctggataat 720
ggtggtgttc tggttaccta tggtggtatg agccgtgaac cggttaccgt tgcaaccggt 780
ccgctgattt tcaaagatat tgcatttcgt ggtttctgga tgacccgttg gagcaaagaa 840
aactatagca gtccggaacg tagcaagatg ttcaaagaaa tttttgaact gatggaacag 900
ggcaaatttg tggcaccgaa tcatgaaatg gtgccgctgg ccaaattcaa agatgcagca 960
gcagccgcac tgagctttaa aggttttacc ggcaaaaaat acatcctgga tatgagcatt 1020
taa 1023

Claims (72)

1.一种工程化反式烯酰CoA还原酶(TER),包含SEQ ID NO:1或SEQ ID NO:24的氨基酸的一个或多个改变。
2.根据权利要求1所述的工程化TER,其中,所述氨基酸的序列包含SEQ ID NO:1或SEQID NO:24的氨基酸位置的至少两个、三个、四个、五个、六个、七个、八个或更多个改变。
3.根据权利要求1至2中任一项所述的工程化TER,其中,一个或多个氨基酸改变选自对应于SEQ ID NO:1的残基Q11、A39、S48、Q52、S59、G97、S103、H104、V105、N106、F107、I147、S148、V149、L152、T153、L156、R200、D201、R202、V301、T302、E303、K306、N307、N308、L316或其组合的一个或多个位置。
4.根据权利要求1至3中任一项所述的工程化TER,其中,工程化蛋白在对应于SEQ IDNO:1的残基Q11、A39、S48、Q52、S59、G97、S103、H104、V105、N106、F107、I147、S148、V149、L152、T153、L156、R200、D201、R202、V301、T302、E303、K306、N307、N308、L316或其组合的一个或多个位置处的一个或多个氨基酸改变是保守性氨基酸改变。
5.根据权利要求1至3中任一项所述的工程化TER,其中,工程化蛋白在对应于SEQ IDNO:1的残基Q11、A39、S48、Q52、S59、G97、S103、H104、V105、N106、F107、I147、S148、V149、L152、T153、L156、R200、D201、R202、V301、T302、E303、K306、N307、N308、L316或其组合的一个或多个位置处的一个或多个氨基酸改变是非保守性氨基酸改变。
6.根据权利要求1至5中任一项所述的工程化TER,其中,工程化蛋白的一个或多个氨基酸改变是在对应于SEQ ID NO:1的残基V105的位置处的改变。
7.根据权利要求6所述的工程化TER,其中,所述在对应于SEQ ID NO:1的残基V105的位置处的氨基酸改变是将所述氨基酸置换为A、G、K、N或R。
8.根据权利要求1至7中任一项所述的工程化TER,其中,工程化蛋白的一个或多个氨基酸改变是在对应于SEQ ID NO:1的残基S148的位置处的改变。
9.根据权利要求8所述的工程化TER,其中,所述在对应于SEQ ID NO:1的残基S148的位置处的氨基酸改变是将所述氨基酸置换为K或R。
10.根据权利要求1至9中任一项所述的工程化TER,其中,工程化蛋白的一个或多个氨基酸改变是在对应于SEQ ID NO:1的残基V149的位置处的改变。
11.根据权利要求10所述的工程化TER,其中,所述在对应于SEQ ID NO:1的残基V149的位置处的氨基酸改变是将所述氨基酸置换为I或S。
12.根据权利要求1至11中任一项所述的工程化TER,其中,工程化蛋白的一个或多个氨基酸改变是在对应于SEQ ID NO:1的残基V301的位置处的改变。
13.根据权利要求12所述的工程化TER,其中,所述在对应于SEQ ID NO:1的残基V301的位置处的氨基酸改变是将所述氨基酸置换为I、K、L或R。
14.根据权利要求1至13中任一项所述的工程化TER,其中,工程化蛋白的一个或多个氨基酸改变是在对应于SEQ ID NO:1的残基T302的位置处的改变。
15.根据权利要求14所述的工程化TER,其中,所述工程化蛋白的一个或多个氨基酸改变是将所述氨基酸置换为K或R。
16.根据权利要求1至15中任一项所述的工程化TER,其中,工程化蛋白的一个或多个氨基酸改变是在对应于SEQ ID NO:1的残基N307的位置处的改变。
17.根据权利要求16所述的工程化TER,其中,所述工程化蛋白的一个或多个氨基酸改变是将所述氨基酸置换为K或R。
18.根据权利要求1至17中任一项所述的工程化TER,其中,工程化蛋白的一个或多个氨基酸改变是在对应于SEQ ID NO:1的残基F107的位置处的改变。
19.根据权利要求18所述的工程化TER,其中,所述工程化蛋白的一个或多个氨基酸改变是将所述氨基酸置换为M。
20.根据权利要求1至19中任一项所述的工程化TER,其中,所述一个或多个氨基酸改变是在对应于SEQ ID NO:1的残基R200、D201或R202的位置处的氨基酸改变。
21.根据权利要求20所述的工程化TER,其中,所述一个或多个氨基酸序列改变选自由以下组成的组:将对应于SEQ ID NO:1的残基R200的位置处的氨基酸置换为D、G或L,将对应于SEQ ID NO:1的残基D201的位置处的氨基酸突变为I、L或V,以及将对应于SEQ ID NO:1的残基R202的位置处的氨基酸突变为A、G、H、K、L、Q或S。
22.根据权利要求1至21中任一项所述的工程化TER,其中,所述工程化TER包含在对应于SEQ ID NO:1的残基R200或R202的位置处的改变。
23.根据权利要求22所述的工程化TER,其中所述工程化TER包含选自由R200D、R200G、R200L、R202D、R202G和R202L组成的组的氨基酸改变。
24.根据权利要求1至2中任一项所述的工程化TER,其中所述氨基酸改变选自对应于SEQ ID NO:24的S96、L98、M274、T275或其组合的位置。
25.根据权利要求24所述的工程化TER,其中所述氨基酸改变选自由SEQ ID NO:24的S96G、L98M、M274R、T275R组成的组。
26.根据权利要求1至25中任一项所述的工程化TER,其中所述氨基酸序列与SEQ IDNO:1或SEQ ID NO:24的至少25个连续氨基酸具有至少60%的同一性。
27.根据权利要求1至26中任一项所述的工程化TER,其中,所述工程化反式烯酰CoA还原酶与5-羧基-2-戊烯酰-CoA反应形成己二酰-CoA。
28.根据权利要求1至27中任一项所述的工程化TER,其中,所述工程化TER包含的活性比没有氨基酸改变的SEQ ID NO:1或SEQ ID NO:24的反式烯酰CoA还原酶的活性高至少20%。
29.根据权利要求1至28中任一项所述的工程化TER,进一步包括所述工程化TER在与表达工程化TER所来源的野生型TER的对照细胞相比能够多产生至少10%的己二酸的包含编码3-氧代己二酰-CoA硫解酶、3-氧代己二酰-CoA脱氢酶和3-氧代己二酰-CoA脱水酶的基因的细胞中的表达。
30.根据权利要求1至30中任一项所述的工程化TER,其中,所述工程化TER还可使用巴豆酰-CoA作为底物。
31.根据权利要求1至30中任一项所述的工程化TER,其中,与巴豆酰-CoA作为底物相比,所述工程化TER对5-羧基-2-戊烯酰-CoA作为底物具有更高的催化效率。
32.根据权利要求1至31中任一项所述的工程化TER,其中,所述工程化TER优选NADPH、NADH或两者作为辅因子。
33.一种重组核酸分子,包含编码权利要求1至32中任一项所述的工程化TER的核酸序列。
34.根据权利要求33所述的重组核酸分子,其中,编码工程化TER的所述核酸序列与异源启动子可操作地连接。
35.一种载体,包含权利要求34所述的重组核酸分子。
36.一种用根据权利要求32至35中任一项所述的核酸分子转化的宿主细胞。
37.一种非天然存在的微生物有机体,包含至少一种外源酶,所述至少一种外源酶包含将5-羧基-2-戊烯酰-CoA转化为己二酰CoA的TER,所述TER选自:
(i)包含SEQ ID NO:1、4-9、11、14、15或17-26的氨基酸序列的TER;
(ii)包含与SEQ ID NO:1、4-9、11、14、15或17-26中任一个的至少25个或更多个连续氨基酸具有至少50%序列同一性的氨基酸序列的TER;或
(iii)权利要求1至32中任一项所述的工程化TER。
38.根据权利要求37所述的非天然存在的微生物有机体,其中,所述TER不包含SEQ IDNO:26的氨基酸序列。
39.根据权利要求37至38中任一项所述的非天然存在的微生物有机体,其中,所述微生物有机体包括己酸途径、己二胺途径或己内酰胺途径。
40.根据权利要求37至39中任一项所述的非天然存在的微生物有机体,其中,所述非天然存在的微生物有机体包含编码TER的氨基酸序列的至少一种外源核酸序列,所述TER的氨基酸序列选自由以下组成的组:与SEQ ID NO:1、4-9、11、14、15或17-25中任一个具有至少50%氨基酸序列同一性的TER和根据权利要求1至32中任一项所述的工程化TER。
41.根据权利要求37至40中任一项所述的非天然存在的微生物有机体,其中,编码所述TER酶的所述至少一种外源核酸对于所述微生物有机体是异源的。
42.根据权利要求37至41中任一项所述的非天然存在的微生物有机体,其中,所述非天然存在的微生物有机体包含6-氨基己酸途径。
43.如权利要求42所述的非天然存在的微生物有机体,其中,所述6-氨基己酸途径包含:(i)转氨酶;(ii)6-氨基己酸脱氢酶;或(iii)转氨酶和6-氨基己酸脱氢酶。
44.根据权利要求37至43中任一项所述的非天然存在的微生物有机体,其中,所述微生物有机体还包含编码6-氨基己酸途径酶中的一种或多种的一种或多种另外的外源核酸。
45.根据权利要求44所述的非天然存在的微生物有机体,其中,所述编码一种或多种6-氨基己酸途径酶的外源核酸对于所述微生物有机体是异源的。
46.根据权利要求37至45中任一项所述的非天然存在的微生物有机体,其中,所述非天然存在的微生物有机体包含己二胺途径。
47.根据权利要求46所述的非天然存在的微生物有机体,其中,所述己二胺途径包括:(i)6-氨基己酰CoA转移酶;(ii)6-氨基己酰CoA合酶;(iii)6-氨基己酰CoA还原酶;(iv)己二胺转氨酶;(v)己二胺脱氢酶;(vi)6-氨基己酸还原酶;或酶(i)至(vi)中的一种或多种的组合。
48.根据权利要求37至47中任一项所述的非天然存在的微生物有机体,其中,所述微生物有机体还包含编码己二胺途径酶中的一种或多种的一种或多种另外的外源核酸。
49.根据权利要求48所述的非天然存在的微生物有机体,其中,所述编码一种或多种己二胺途径酶的外源核酸对于所述微生物有机体是异源的。
50.根据权利要求37至49中任一项所述的非天然存在的微生物有机体,其中,所述非天然存在的微生物有机体包含己内酰胺途径。
51.根据权利要求50所述的非天然存在的微生物有机体,其中,所述己内酰胺途径包括氨基水解酶。
52.根据权利要求37至51中任一项所述的非天然存在的微生物有机体,其中,所述微生物有机体还包含编码氨基水解酶的一种或多种另外的外源核酸。
53.根据权利要求52所述的非天然存在的微生物有机体,其中,所述编码氨基水解酶的外源核酸对于所述微生物有机体是异源的。
54.根据权利要求37至53中任一项所述的非天然存在的微生物有机体,其中,所述TER源自细菌、酵母、真菌、藻类、动物或植物物种。
55.根据权利要求37至54中任一项所述的非天然存在的微生物有机体,其中,所述TER源自表3中所示的物种。
56.根据权利要求37至55中任一项所述的非天然存在的微生物有机体,包括不动杆菌属、放线杆菌属、厌氧螺菌属、曲霉属、芽孢杆菌属、梭菌属、棒状杆菌属、埃希氏菌属、葡糖杆菌属、克雷伯氏菌属、克鲁维酵母属、乳球菌属、乳杆菌属、曼氏杆菌属、毕赤酵母属、假单胞菌属、根瘤菌属、根霉属、酵母菌属、裂殖酵母属、链霉菌属和发酵单胞菌属的物种。
57.根据权利要求37至56中任一项所述的非天然存在的微生物有机体,其中,所述非天然存在的微生物有机体包含两种、三种、四种、五种、六种或七种外源核酸,所述外源核酸各自编码用于以下的酶:6-氨基己酸途径、己二胺途径、己内酰胺途径、1,6-己二醇途径、己内酯途径或两种或更多种途径的组合。
58.根据权利要求37至57中任一项所述的非天然存在的微生物有机体或宿主细胞,其中,所述非天然存在的微生物有机体或宿主细胞产生的己二酸、己酸、己二胺、己内酯或己内酰胺中的一种或多种比由对照微生物有机体或宿主细胞产生的多,所述对照微生物有机体或宿主细胞除了不包含外源性转烯酰CoA还原酶或编码反式烯酰CoA还原酶的外源核酸序列之外与所述非天然存在的微生物有机体或宿主细胞基本上相同。
59.一种生产己二酰-CoA的方法,包括:
将权利要求37至58中任一项所述的非天然存在的微生物有机体或宿主细胞在足够的时间和条件下进行培养以产生己二酰-CoA。
60.根据权利要求59所述的方法,还包括从所述非天然存在的微生物有机体、发酵液或两者中回收己二酰-CoA。
61.一种生产己酸的方法,包括:
将权利要求37至58中任一项的非天然存在的微生物有机体或宿主细胞在足够的时间和条件下进行培养以产生己酸。
62.根据权利要求61所述的方法,还包括从所述非天然存在的微生物有机体、发酵液或两者中回收己酸。
63.一种生产己二胺的方法,包括:
将权利要求37至58中任一项的非天然存在的微生物有机体或宿主细胞在足够的时间和条件下进行培养以产生己二胺。
64.根据权利要求63所述的方法,还包括从所述非天然存在的微生物有机体、发酵液或两者中回收己二胺。
65.根据权利要求59至64中任一项所述的方法,其中,所述微生物有机体或宿主细胞包含各自编码己二胺途径酶的两个、三个、四个、五个、六个或七个外源核酸序列。
66.一种生产己内酰胺的方法,包括:
将权利要求36至58中任一项的非天然存在的微生物有机体在足够的时间和条件下进行培养以产生己内酰胺。
67.根据权利要求66所述的方法,还包括从所述非天然存在的微生物有机体、发酵液或两者中回收己内酰胺。
68.根据权利要求59至67中任一项所述的方法,其中,所述微生物有机体包含各自编码己内酰胺途径酶的两个、三个、四个、五个、六个或七个外源核酸序列。
69.根据权利要求59至68中任一项所述的方法,其中,所述培养在包含糖的发酵液中进行。
70.根据权利要求59至69中任一项所述方法,其中,所述非天然存在的微生物体包括不动杆菌属、放线杆菌属、厌氧螺菌属、曲霉属、芽孢杆菌属、梭菌属、棒状杆菌属、埃希氏菌属、葡糖杆菌属、克雷伯氏菌属、克鲁维酵母属、乳球菌属、乳杆菌属、曼氏杆菌属、毕赤酵母属、假单胞菌属、根瘤菌属、根霉属、酵母菌属、裂殖酵母属、链霉菌属和发酵单胞菌属的物种。
71.由权利要求59至70中任一项的方法合成的生物来源的己二酸、6-羟基己酸、6-氨基己酰-CoA、6-氨基己酸、己二胺、己内酯或己内酰胺。
72.权利要求71所述的己二酸、己酸、己二胺或己内酰胺的用途。
CN202080046640.XA 2019-04-24 2020-04-24 工程化反式烯酰coa还原酶及其制备方法和使用方法 Pending CN114269908A (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201962837888P 2019-04-24 2019-04-24
US62/837,888 2019-04-24
US201962860123P 2019-06-11 2019-06-11
US201962860160P 2019-06-11 2019-06-11
US62/860,160 2019-06-11
US62/860,123 2019-06-11
PCT/US2020/029788 WO2020219859A1 (en) 2019-04-24 2020-04-24 Engineered trans-enoyl coa reductase and methods of making and using

Publications (1)

Publication Number Publication Date
CN114269908A true CN114269908A (zh) 2022-04-01

Family

ID=70740755

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202080046801.5A Pending CN114341344A (zh) 2019-04-24 2020-04-24 用于改进醛脱氢酶活性的工程微生物体和方法
CN202080046640.XA Pending CN114269908A (zh) 2019-04-24 2020-04-24 工程化反式烯酰coa还原酶及其制备方法和使用方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202080046801.5A Pending CN114341344A (zh) 2019-04-24 2020-04-24 用于改进醛脱氢酶活性的工程微生物体和方法

Country Status (10)

Country Link
US (3) US20220333142A1 (zh)
EP (3) EP3959310A1 (zh)
JP (1) JP2022530475A (zh)
KR (2) KR20220023757A (zh)
CN (2) CN114341344A (zh)
AU (1) AU2020262938A1 (zh)
BR (1) BR112021021294A2 (zh)
CA (1) CA3137571A1 (zh)
SG (1) SG11202111575WA (zh)
WO (3) WO2020219859A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111386339A (zh) * 2017-11-30 2020-07-07 东丽株式会社 用于生产3-羟基己二酸、α-氢化己二烯二酸及/或己二酸的基因修饰微生物以及该化学产品的制造方法
CN111386339B (zh) * 2017-11-30 2024-05-10 东丽株式会社 用于生产3-羟基己二酸、α-氢化己二烯二酸及/或己二酸的基因修饰微生物以及该化学产品的制造方法

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230159611A (ko) 2021-03-30 2023-11-21 아사히 가세이 가부시키가이샤 재조합 미생물 및 c6 화합물의 제조 방법
WO2023076966A1 (en) * 2021-10-27 2023-05-04 Genomatica, Inc. Engineered enzymes and methods of making and using
CN114940950B (zh) * 2022-03-28 2023-07-07 北京科技大学 一种丁酸梭菌发酵废液资源化利用的方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7947483B2 (en) 2007-08-10 2011-05-24 Genomatica, Inc. Methods and organisms for the growth-coupled production of 1,4-butanediol
CN102317464B (zh) * 2008-12-12 2014-10-29 塞莱西翁有限公司 从α-酮酸生物合成双官能烷烃
ES2749423T3 (es) * 2009-05-07 2020-03-20 Genomatica Inc Microorganismos y métodos para la biosíntesis de adipato, hexametilendiamina y ácido 6-aminocaproico
WO2012089613A1 (en) * 2010-12-28 2012-07-05 Dsm Ip Assets B.V. Process to increase the production of a succinyl-coa derived compound
WO2013067432A1 (en) * 2011-11-02 2013-05-10 Genomatica, Inc. Microorganisms and methods for the production of caprolactone
AU2015369651B2 (en) * 2014-12-23 2020-03-12 Genomatica, Inc. Method of producing and processing diamines
EP3314002A4 (en) * 2015-06-23 2019-07-10 Genomatica, Inc. MICRO-ORGANISMS AND METHOD FOR PRODUCING BIOSYNTHETIZED TARGET PRODUCTS WITH A REDUCED SUBSTANCE OF BY-PRODUCTS

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111386339A (zh) * 2017-11-30 2020-07-07 东丽株式会社 用于生产3-羟基己二酸、α-氢化己二烯二酸及/或己二酸的基因修饰微生物以及该化学产品的制造方法
CN111386339B (zh) * 2017-11-30 2024-05-10 东丽株式会社 用于生产3-羟基己二酸、α-氢化己二烯二酸及/或己二酸的基因修饰微生物以及该化学产品的制造方法

Also Published As

Publication number Publication date
AU2020262938A1 (en) 2021-11-11
EP3959310A1 (en) 2022-03-02
CN114341344A (zh) 2022-04-12
BR112021021294A2 (pt) 2022-03-29
KR20220023757A (ko) 2022-03-02
SG11202111575WA (en) 2021-11-29
KR20220023339A (ko) 2022-03-02
US20220235385A1 (en) 2022-07-28
CA3137571A1 (en) 2020-10-29
WO2020219863A1 (en) 2020-10-29
JP2022530475A (ja) 2022-06-29
EP3959327A1 (en) 2022-03-02
US20220348890A1 (en) 2022-11-03
US20220333142A1 (en) 2022-10-20
WO2020219866A1 (en) 2020-10-29
WO2020219859A1 (en) 2020-10-29
EP3959309A1 (en) 2022-03-02

Similar Documents

Publication Publication Date Title
JP7370366B2 (ja) アジペート、ヘキサメチレンジアミン、及び6-アミノカプロン酸の生合成のための微生物及び方法
US10415063B2 (en) Semi-synthetic terephthalic acid via microorganisms that produce muconic acid
WO2011137198A1 (en) Microorganisms and methods for the biosynthesis of propylene
US20220333142A1 (en) Engineered trans-enoyl coa reductase and methods of making and using
US20230348865A1 (en) Engineered enzymes and methods of making and using
WO2023076966A1 (en) Engineered enzymes and methods of making and using
CN116783281A (zh) 用于制备酰胺化合物的方法和组合物
AU2013202628B2 (en) Organisms for the production of 1,3-butanediol

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination