CN113710798A - 戊糖和己糖的降解途径 - Google Patents

戊糖和己糖的降解途径 Download PDF

Info

Publication number
CN113710798A
CN113710798A CN202080029904.0A CN202080029904A CN113710798A CN 113710798 A CN113710798 A CN 113710798A CN 202080029904 A CN202080029904 A CN 202080029904A CN 113710798 A CN113710798 A CN 113710798A
Authority
CN
China
Prior art keywords
activity
enzyme
phosphate
dehydrogenase
recombinant microorganism
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080029904.0A
Other languages
English (en)
Inventor
D·J·科赫
L·佩德森帕里齐
F·加尔泽拉尼
J·M·弗朗索瓦
S·拉瑞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Braskem SA
Original Assignee
Braskem SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Braskem SA filed Critical Braskem SA
Publication of CN113710798A publication Critical patent/CN113710798A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/18Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing at least two hetero rings condensed among themselves or condensed with a common carbocyclic ring system, e.g. rifamycin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/40Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
    • C12P7/42Hydroxy-carboxylic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/02Oxygen as only ring hetero atoms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/18Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic polyhydric
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/001Amines; Imines
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/04Alpha- or beta- amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/04Alpha- or beta- amino acids
    • C12P13/06Alanine; Leucine; Isoleucine; Serine; Homoserine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P5/00Preparation of hydrocarbons or halogenated hydrocarbons
    • C12P5/02Preparation of hydrocarbons or halogenated hydrocarbons acyclic
    • C12P5/026Unsaturated compounds, i.e. alkenes, alkynes or allenes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/24Preparation of oxygen-containing organic compounds containing a carbonyl group
    • C12P7/26Ketones
    • C12P7/28Acetone-containing products
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/01Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
    • C12Y101/01043Phosphogluconate 2-dehydrogenase (1.1.1.43)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/01Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
    • C12Y101/01301D-Arabitol-phosphate dehydrogenase (1.1.1.301)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y102/00Oxidoreductases acting on the aldehyde or oxo group of donors (1.2)
    • C12Y102/01Oxidoreductases acting on the aldehyde or oxo group of donors (1.2) with NAD+ or NADP+ as acceptor (1.2.1)
    • C12Y102/01009Glyceraldehyde-3-phosphate dehydrogenase (NADP+) (1.2.1.9)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y202/00Transferases transferring aldehyde or ketonic groups (2.2)
    • C12Y202/01Transketolases and transaldolases (2.2.1)
    • C12Y202/01002Transaldolase (2.2.1.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/01Phosphotransferases with an alcohol group as acceptor (2.7.1)
    • C12Y207/010116-Phosphofructokinase (2.7.1.11)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/02Phosphotransferases with a carboxy group as acceptor (2.7.2)
    • C12Y207/02003Phosphoglycerate kinase (2.7.2.3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • C12Y301/01Carboxylic ester hydrolases (3.1.1)
    • C12Y301/010316-Phosphogluconolactonase (3.1.1.31)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y401/00Carbon-carbon lyases (4.1)
    • C12Y401/02Aldehyde-lyases (4.1.2)
    • C12Y401/02022Fructose-6-phosphate phosphoketolase (4.1.2.22)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y501/00Racemaces and epimerases (5.1)
    • C12Y501/03Racemaces and epimerases (5.1) acting on carbohydrates and derivatives (5.1.3)
    • C12Y501/03001Ribulose-phosphate 3-epimerase (5.1.3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y503/00Intramolecular oxidoreductases (5.3)
    • C12Y503/01Intramolecular oxidoreductases (5.3) interconverting aldoses and ketoses (5.3.1)
    • C12Y503/01006Ribose-5-phosphate isomerase (5.3.1.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y504/00Intramolecular transferases (5.4)
    • C12Y504/02Phosphotransferases (phosphomutases) (5.4.2)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Virology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本申请涉及可用于由一种或多种戊糖和/或己糖生物合成单乙二醇(MEG)或乙醇酸(GA)、或MEG和一种或多种联产品(co‑product)的重组微生物。还提供使用所述重组微生物由一种或多种戊糖和/或己糖生产MEG(或GA)、或MEG(或GA)和一种或多种联产品的方法,以及包含所述重组微生物和/或产物MEG(或GA)、或MEG和一种或多种联产品的组合物。

Description

戊糖和己糖的降解途径
相关申请的交叉引用
本申请要求于2019年2月20日提交的题为“DEGRADATION PATHWAY FOR PENTOSEAND HEXOSE SUGARS”的美国临时申请号62/808,258的优先权,其公开内容通过引用并入本文。
技术领域
本申请涉及可用于由一种或多种戊糖和/或己糖生物合成单乙二醇或单乙二醇和一种或多种联产品(co-product)的重组微生物。本申请另外涉及用于由一种或多种戊糖和/或己糖生物合成乙醇酸或乙醇酸和一种或多种联产品的重组微生物。本申请还涉及使用重组微生物由一种或多种戊糖和/或己糖生产单乙二醇或单乙二醇和一种或多种联产品的方法,以及使用重组微生物由一种或多种戊糖和/或己糖生产乙醇酸或乙醇酸和一种或多种联产品的方法。本申请进一步涉及包含一种或多种这些化合物和/或重组微生物的组合物。
关于序列表的声明
与本申请相关的序列表以文本格式代替纸质副本提供,并在此通过引用并入说明书。包含序列表的文本文件的名称是BRSK-007_02WO_ST25.txt。该文本文件大约641KB,创建于2020年2月18日,通过EFS-Web以电子方式提交。
背景技术
目前,大量的化合物来源于石油化工产品。化合物如单乙二醇(MEG)、乙醇酸、丙酮、异丙醇(IPA)、丙烯、丝氨酸、甘氨酸、单乙醇胺和乙二胺,是生产产品的有价值的原料,所述产品如聚对苯二甲酸乙二醇酯(PET)树脂(由MEG生产)、聚丙烯塑料(由丙烯生产)、聚乙醇酸和其他生物相容性共聚物(由乙醇酸生产)和聚氨酯纤维(由乙二胺生产)。烯烃(例如乙烯、丙烯、不同的丁烯和戊烯)用于塑料工业、燃料和化学工业的其他领域。例如,异丁烯是一种小而高反应性的分子,广泛用作平台化合物(platform chemical)以制造各种产品,所述产品包括燃料添加剂、橡胶和橡胶添加剂以及专用化学品。
然而,这些化合物目前是由源自化石燃料的前体生产的,这会导致气候变化。为了开发更环保的MEG生产工艺,研究人员已经工程化了具有生产MEG的生物合成途径的微生物。然而,这些途径的实施具有挑战性,一些主要的待克服的障碍有产品产率的损失、氧化还原平衡和过量的生物质形成。
因此,需要改进的生物合成途径,其用于生产MEG和其他可用于工业和制药应用的化合物。
发明内容
本公开主要依赖于天然的、经过验证的反应,仅通过引入一种戊糖磷酸醛缩酶催化的新反应,允许多种C5和C6糖在没有碳损失的情况下转化为广泛可用的关键中间体甘油醛-3-磷酸(G3P)和乙醇醛。
在一些实施方案中,本公开内容的酶反应允许由葡萄糖、木糖或可进入磷酸戊糖途径的其他各种糖高产率生产MEG(或乙醇酸)或MEG(或GA)和一种或多种联产品。在其他实施方案中,本公开内容的酶反应允许由各种可以容易地分解为相应单体的糖低聚物高产率生产MEG(或乙醇酸)或MEG(或GA)和联产品。在进一步的实施方案中,本公开内容的酶反应允许由C5和/或C6糖单体和/或低聚物的混合物高产率生产MEG(或乙醇酸)或MEG(或GA)和联产品。
在一些实施方案中,与其他基于葡萄糖的MEG(或乙醇酸)生产方法相比,本方法解决或减少了以下问题:ATP短缺;NADH大幅过量;整体产物产率潜力低。在进一步的实施方案中,与其他基于葡萄糖的MEG或乙醇酸生产方法相比,本方法进一步允许利用D-葡萄糖、D-木糖和/或各种其他糖或混合物,并具有相同的MEG或乙醇酸的高产率。
在一些实施方案中,与其他基于D-木糖的MEG(或乙醇酸)生产方法以及其他基于D-木糖的MEG和联产品生产方法相比,本方法解决了以下挑战和问题:依赖于木糖的工艺(可得性/市场限制、高价格或低纯度、比D-葡萄糖更慢且效率更低的摄入);葡萄糖诱导的D-木糖利用抑制。在进一步的实施方案中,与其他基于D-木糖的MEG(或乙醇酸)生产方法以及其他基于D-木糖的MEG和联产品生产方法相比,本方法进一步允许利用D-葡萄糖、D-木糖和/或各种其他糖或混合物,并具有相同的MEG或乙醇酸或MEG和一种或多种联产品的高产率。
一方面,本公开提供了包含一种或多种生化途径的重组微生物,所述生化途径由一种或多种戊糖和/或己糖通过戊糖磷酸中间体生产一种或多种衍生自D-甘油醛-3-磷酸(G3P)和乙醇醛的产物。
在一些实施方案中,戊糖磷酸中间体是D-核糖-5-磷酸、D-核酮糖-5-磷酸或D-木酮糖-5-磷酸,其中的酶具有D-核糖-5-磷酸、D-核酮糖-5-磷酸或D-木酮糖-5-磷酸醛缩酶活性。
在一些实施方案中,核酮糖激酶催化D-核酮糖磷酸化为D-核酮糖-5-磷酸。在一些实施方案中,核酮糖激酶由大肠杆菌(E.coli)AraB编码。在一些实施方案中,核酮糖激酶由与来自大肠杆菌的AraB(SEQ ID NO:288)具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的核酸序列编码。
在一些实施方案中,核糖激酶催化D-核糖磷酸化为D-核糖-5-磷酸。在一些实施方案中,核糖激酶由大肠杆菌rbsK编码。在一些实施方案中,核酮糖激酶由与来自大肠杆菌的rbsK(SEQ ID NO:290)具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的核酸序列编码。
在一些实施方案中,木酮糖激酶催化D-木酮糖磷酸化为D-木酮糖-5-磷酸。在一些实施方案中,核糖激酶由海栖热袍菌(T.maritima)XuK编码。在一些实施方案中,核酮糖激酶由与来自海栖热袍菌的XuK(SEQ ID NO:291)具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的核酸序列编码。
在一个实施方案中,重组微生物联产(co-produce)单乙二醇(MEG)和一种或多种联产品。在另一个实施方案中,一种或多种联产品选自丙酮、异丙醇、丙烯、L-丝氨酸、甘氨酸、单乙醇胺(MEA)、乙二胺或其组合。在一个仍进一步的实施方案中,一种或多种产物选自单乙二醇(MEG)和乙醇酸(GA)。
因此,在一个实施方案中,本申请涉及包含一种或多种生化途径的重组微生物,所述生化途径包含至少一种具有将一种或多种戊糖和/或己糖无损转化为戊糖磷酸中间体的活性的酶,并且包含至少一种具有戊糖磷酸醛缩酶活性的酶,其将戊糖磷酸中间体转化为乙醇醛和D-甘油醛-3-磷酸(G3P)。
在一个实施方案中,本申请涉及包含一种或多种生化途径的重组微生物,所述生化途径包含至少一种具有将一种或多种戊糖和/或己糖无损转化为D-核糖-5-磷酸中间体的活性的酶,该并且包含至少一种具有D-核糖-5-磷酸醛缩酶(DERA)活性的酶,该酶将D-核糖-5-磷酸中间体转化为乙醇醛和D-甘油醛-3-磷酸(G3P)。
在一些实施方案中,重组微生物包括至少一种具有转酮醇酶活性的酶的表达和至少一种具有戊糖磷酸醛缩酶活性的酶的表达。在一些实施方案中,重组微生物包含至少一种具有转酮醇酶活性的酶的表达和至少一种具有D-核糖-5-磷酸醛缩酶(DERA)活性的酶的表达。在一些实施方案中,具有转酮醇酶活性的酶由与来自大肠杆菌的tktA具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码。在其他实施方案中,具有转酮醇酶活性的酶是来自大肠杆菌的tktA。在一些实施方案中,具有转酮醇酶活性的酶由与来自大肠杆菌的tktB具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在其他实施方案中,具有转酮醇酶活性的酶是来自大肠杆菌的tktB。在另一个实施方案中,编码具有转酮醇酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO:148和150的氨基酸序列。在一些实施方案中,编码具有转酮醇酶活性的酶的一种或多种核酸分子是tktA,或其同源物。在一些实施方案中,编码具有转酮醇酶活性的酶的一种或多种核酸分子是tktB,或其同源物。在一个进一步的实施方案中,编码具有转酮醇酶活性的酶的一种或多种核酸分子由选自SEQ ID NO:147和149的核酸序列编码。在一些实施方案中,具有D-核糖-5-磷酸醛缩酶活性的酶由与来自大肠杆菌的deoC具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码。在其他实施方案中,所述具有D-核糖-5-磷酸醛缩酶活性的酶是来自大肠杆菌的deoC。
在一些实施方案中,热容芽孢杆菌B.Caldolyticus戊糖磷酸醛缩酶由与以下序列具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的核酸序列编码:
Figure BDA0003310804120000041
在一些实施方案中,热容芽孢杆菌戊糖磷酸醛缩酶由cDNA优化序列编码,所述序列包含与以下序列具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的核酸序列:
Figure BDA0003310804120000042
在一些实施方案中,大肠杆菌戊糖磷酸醛缩酶是与以下序列具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列:
Figure BDA0003310804120000043
在一些实施方案中,热容芽孢杆菌戊糖磷酸醛缩酶是与以下序列具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列:
Figure BDA0003310804120000051
在一些实施方案中,热容芽孢杆菌戊糖磷酸醛缩酶包含C37N突变,并由与以下序列具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的核酸序列编码:
Figure BDA0003310804120000052
在一些实施方案中,热容芽孢杆菌戊糖磷酸醛缩酶包含C37N突变,并是与以下序列具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列:
Figure BDA0003310804120000053
在一些实施方案中,重组微生物包含至少一种具有转醛醇酶活性的酶的表达。在一些实施方案中,具有转醛醇酶活性的酶由与来自大肠杆菌的talA或talB具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码。在一些实施方案中,具有转醛醇酶活性的酶是来自大肠杆菌的talA。在其他实施方案中,具有转醛醇酶活性的酶是来自大肠杆菌的talB。在另一个实施方案中,编码具有转醛醇酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO:152和154的氨基酸序列。在一个进一步的实施方案中,编码具有转醛醇酶活性的酶的一种或多种核酸分子由选自SEQ ID NO:151和153的核酸序列编码。
在一些实施方案中,重组微生物包含至少一种具有核酮糖-5-磷酸3-差向异构酶(epimerase)活性的酶的表达。在一些实施方案中,具有核酮糖-5-磷酸3-差向异构酶活性的酶由与来自大肠杆菌的rpe具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码。在其他实施方案中,具有核酮糖-5-磷酸3-差向异构酶活性的酶是来自大肠杆菌的rpe。在另一个实施方案中,编码具有核酮糖-5-磷酸3-差向异构酶活性的酶的一种或多种核酸分子包含SEQ ID NO:158中列出的氨基酸序列。在一个进一步的实施方案中,编码具有核酮糖-5-磷酸3-差向异构酶活性的酶的一种或多种核酸分子由SEQ ID NO:157中列出的核酸序列编码。
在一些实施方案中,重组微生物包含至少一种具有核糖-5-磷酸异构酶活性的酶的表达。在一些实施方案中,具有核糖-5-磷酸异构酶活性的酶由与来自大肠杆菌的rpiA具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码。在其他实施方案中,具有核糖-5-磷酸异构酶活性的酶是来自大肠杆菌的rpiA。在其他实施方案中,具有核糖-5-磷酸异构酶活性的酶由与来自大肠杆菌的rpiB具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码。在其他实施方案中,具有核糖-5-磷酸异构酶活性的酶是来自大肠杆菌的rpiB。在另一个实施方案中,编码具有核糖-5-磷酸异构酶活性的酶的一种或多种核酸分子包含SEQ ID NO:156中列出的氨基酸序列。在一个进一步的实施方案中,编码具有核糖-5-磷酸异构酶活性的酶的一种或多种核酸分子由SEQ ID NO:155中列出的核酸序列编码。
在一些实施方案中,重组微生物包含至少一种具有选自以下的活性的酶的表达:转酮醇酶活性、转醛醇酶活性、核酮糖-5-磷酸3-差向异构酶活性、核糖-5-磷酸异构酶活性和D-核糖-5-磷酸醛缩酶活性,重组微生物进一步包含一种或多种内源性酶的缺失或降低的活性,所述内源性酶选自甘油醛3-磷酸脱氢酶、磷酸甘油酸激酶和磷酸甘油酸变位酶。在一些实施方案中,内源性的甘油醛3-磷酸脱氢酶是gapA,磷酸甘油酸激酶是pgk,磷酸甘油酸变位酶是gpmA或gpmM。
在一些实施方案中,重组微生物包含至少一种具有果糖6-磷酸磷酸酮醇酶(phosphoketolase)活性的酶的表达。在一些实施方案中,具有果糖-6-磷酸磷酸酮醇酶活性的酶由与选自以下的具有果糖-6-磷酸磷酸酮醇酶活性的酶具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码:齿双歧杆菌(Bifidobacterium dentium)BDP_1006、乳双歧杆菌(Bifidobacterium lactis)xfp、类植物乳杆菌(Lactobacillus paraplantarum)xpkA和短双歧杆菌(Bifidobacterium breve)xfp。在一个优选的实施方案中,具有果糖-6-磷酸磷酸酮醇酶活性的酶选自齿双歧杆菌BDP_1006、乳双歧杆菌xfp、类植物乳杆菌xpkA和短双歧杆菌xfp。在另一个实施方案中,编码具有果糖-6-磷酸磷酸酮醇酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO:212、214、216和218的氨基酸序列。在一个进一步的实施方案中,编码具有果糖-6-磷酸磷酸酮醇酶活性的酶的一种或多种核酸分子由选自SEQ ID NO:211、213、215和217的核酸序列编码。
在一些实施方案中,重组微生物包含至少一种具有磷酸乙酰转移酶活性的酶的表达。在一些实施方案中,具有磷酸乙酰转移酶活性的酶由与选自以下的具有磷酸乙酰转移酶活性的酶具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码:大肠杆菌pta和丙酮丁醇梭菌(Clostridium acetobutylicum)pta。在一个优选的实施方案中,具有磷酸乙酰转移酶活性的酶选自大肠杆菌pta和丙酮丁醇梭菌pta。在另一个实施方案中,编码具有磷酸乙酰转移酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO:220和222的氨基酸序列。在一个进一步的实施方案中,编码具有磷酸乙酰转移酶活性的酶的一种或多种核酸分子由选自SEQ ID NO:219和221的核酸序列编码。
在一些实施方案中,重组微生物包含至少一种具有选自以下的活性的酶的表达:果糖-6-磷酸磷酸酮醇酶活性、磷酸乙酰转移酶活性、转酮醇酶活性、转醛醇酶活性、核酮糖-5-磷酸3-差向异构酶活性、核糖-5-磷酸异构酶活性和D-核糖-5-磷酸醛缩酶活性,重组微生物进一步包含内源性酶6-磷酸果糖激酶的缺失或降低的活性。在一些实施方案中,内源性6-磷酸果糖激酶是pfkA和/或pfkB。
在一些实施方案中,一种或多种戊糖和/或己糖包含D-木糖,并且重组微生物进一步包含至少一种具有木糖异构酶活性的酶的表达和至少一种具有木酮糖5-激酶活性的酶的表达。在一些实施方案中,至少一种具有木糖异构酶活性的酶由与来自大肠杆菌或Pyromyces sp.的xylA具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一个优选的实施方案中,具有木糖异构酶活性的酶选自大肠杆菌xylA和Pyromyces sp xylA。在又一个实施方案中,编码木糖异构酶的一种或多种核酸分子包含选自SEQ ID NO:95和144的氨基酸序列。在一个进一步的实施方案中,编码木糖异构酶的一种或多种核酸分子由选自SEQ ID NO:93、94和143的核酸序列编码。在一些实施方案中,至少一种具有木酮糖5-激酶活性的酶由与来自大肠杆菌的xylB具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一个优选的实施方案中,具有木酮糖5-激酶活性的酶是大肠杆菌xylB。在另一个实施方案中,编码D-木酮糖5-激酶的一种或多种核酸分子包含SEQ ID NO:146中列出的氨基酸序列。在一个进一步的实施方案中,编码D-木酮糖5-激酶的一种或多种核酸分子由SEQ IDNO:145中列出的核酸序列编码。
在一些实施方案中,一种或多种戊糖和/或己糖包含D-果糖,并且重组微生物进一步包含至少一种具有果糖1,6-二磷酸酶活性的酶的表达。在一个实施方案中,至少一种具有果糖1,6-二磷酸酶活性的酶由与来自大肠杆菌的fbp具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一个优选的实施方案中,具有果糖1,6-二磷酸酶活性的酶是大肠杆菌fbp。在一些实施方案中,具有果糖1,6-二磷酸酶活性的酶将D-果糖1,6-二磷酸转化为D-果糖6-磷酸。在其他实施方案中,重组微生物中的内源性酶将D-果糖转化为果糖1,6-二磷酸。
在上述任何重组微生物的一些实施方案中,所述重组微生物进一步包含一种或多种内源性酶中缺失的或降低的活性,所述内源性酶选自葡萄糖6-磷酸-1-脱氢酶、6-磷酸葡萄糖酸内酯酶和6-磷酸葡萄糖酸脱氢酶。在进一步的实施方案中,葡萄糖6-磷酸-1-脱氢酶是zwf,6-磷酸葡萄糖酸内酯酶是pgl,6-磷酸葡萄糖酸脱氢酶是gnd。
在一些实施方案中,一种或多种戊糖和/或己糖能够在重组微生物的非氧化磷酸戊糖途径中转化为一种或多种中间体。在其他实施方案中,一种或多种戊糖和/或己糖由单体、低聚物或其组合组成。
在一些实施方案中,至少一种具有转酮醇酶活性和/或果糖-6-磷酸磷酸酮醇酶活性的酶的表达和至少一种具有D-核糖5-磷酸醛缩酶活性的酶的表达,使得能够实现一种或多种戊糖和/或己糖无损转化为D-核糖-5-磷酸中间体以及随后D-核糖-5-磷酸转化为G3P和乙醇醛。
在一些实施方案中,重组微生物通过C2途径中乙醇醛的转化和通过一种或多种C3途径中G3P的转化,生产MEG或乙醇酸(GA)。在一些实施方案中,通过C2途径中具有乙醇醛还原酶活性的酶还原乙醇醛来生产MEG。在其他实施方案中,通过C2途径中具有乙醇醛脱氢酶活性的酶氧化乙醇醛来生产GA。
在一些实施方案中,用于生产MEG或GA的至少一种酶选自具有选自以下的活性的至少一种酶:3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、羟基丙酮酸脱羧酶活性、3-磷酸羟基丙酮酸还原酶活性、乙醇醛还原酶活性、乙醇醛脱氢酶活性、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶活性、丝氨酸脱羧酶活性、乙醇胺转氨酶或乙醇胺氧化还原酶(脱氨基)活性、甘油酸脱羧酶活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性、甘油酸2-激酶活性和乙醛酸还原酶活性。
在一些实施方案中,重组微生物通过C2途径中乙醇醛的转化生产MEG,并通过一种或多种C3途径中G3P的转化生产一种或多种联产品。在其他实施方案中,一种或多种联产品选自丙酮、异丙醇、丙烯、异丁烯和一种或多种丝氨酸途径化合物。在一些优选的实施方案中,一种或多种丝氨酸途径化合物选自丝氨酸、甘氨酸、单乙醇胺(MEA)和乙二胺(EDA)。
在一些实施方案中,用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的至少一种酶选自至少一种具有选自以下的活性的酶:硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A:乙酰乙酸转移酶或乙酸:乙酰乙酰辅酶A水解酶活性和乙酰乙酸脱羧酶活性,并且一种或多种联产品包括丙酮。
在一些实施方案中,用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶:硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A:乙酰乙酸转移酶或乙酸:乙酰乙酰辅酶A水解酶活性、乙酰乙酸脱羧酶活性和仲醇脱氢酶活性,并且一种或多种联产品包含异丙醇。
在一些实施方案中,用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶:硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A:乙酰乙酸转移酶或乙酸:乙酰乙酰辅酶A水解酶活性、乙酰乙酸脱羧酶活性、仲醇脱氢酶活性和脱水酶活性,并且一种或多种联产品包含丙烯。
在一些实施方案中,用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶:硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A:乙酰乙酸转移酶或乙酸:乙酰乙酰辅酶A水解酶活性、乙酰乙酸脱羧酶活性、3-羟基异戊酸(3HIV)合酶活性、羟甲基戊二酰辅酶A合酶活性、甲基戊烯二酰辅酶A水合酶活性、甲基巴豆酰辅酶A羧化酶活性、甲基巴豆酰辅酶A水合酶活性、3-羟基异戊酰辅酶A硫酯酶活性、3HIV激酶活性、3HIV-3-磷酸脱羧酶活性和3HIV脱羧酶活性,并且一种或多种联产品包含异丁烯。
在一些实施方案中,用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶:3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性和甘油酸2-激酶活性,并且一种或多种联产品包含L-丝氨酸。
在一些实施方案中,用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶:丝氨酸羟甲基转移酶活性、转移酶活性、甲醛脱氢酶活性、甲酸脱氢酶活性、与甘氨酸裂解系统相关的活性、3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、丝氨酸转氨酶活性、羟基丙酮酸脱羧酶活性、丝氨酸氧化还原酶(脱氨基)活性、丝氨酸脱羧酶活性、乙醇胺转氨酶或乙醇胺氧化还原酶(脱氨基)活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性、甘油酸2-激酶活性、乙醇醛脱氢酶活性、乙醇酸脱氢酶活性、丙氨酸-乙醛酸转氨酶活性、丙氨酸转氨酶活性和NAD(P)H依赖性谷氨酸脱氢酶活性,并且一种或多种联产品包含甘氨酸。在另一个实施方案中,与甘氨酸裂解系统相关的活性包含选自以下的酶或蛋白:甘氨酸脱羧酶(P蛋白)、氨甲基转移酶(T蛋白)、二氢硫辛酰胺脱氢酶(L蛋白)和H蛋白。
在一些实施方案中,用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶:3-磷酸甘油酸脱氢酶活性、3-磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、转氨酶活性、羟基丙酮酸脱羧酶活性、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶活性、丝氨酸脱羧酶活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性、甘油酸2-激酶活性、乙醛脱氢酶活性和乙醇胺解氨酶活性,并且一种或多种联产品包含单乙醇胺(MEA)。
在一些实施方案中,用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶:丝氨酸脱氢酶活性、2-氨基丙二酸半醛脱羧酶活性、氨基乙醛转氨酶活性、2-氨基丙二酸半醛转氨酶活性、2,3-二氨基丙酸脱羧酶活性、丝氨酸脱羧酶活性、乙醇胺脱氢酶活性、丝氨酸羟甲基转移酶活性、醛氧化酶活性、N-乙酰转移酶或O-乙酰转移酶活性、N-乙酰丝氨酸脱氢酶活性、转氨酶活性、脱乙酰酶活性、丝氨酸氨基酶活性和2,3-二氨基丙酸解氨酶活性,并且一种或多种联产品包含乙二胺(EDA)。
在上述任何重组微生物的一些实施方案中,所述重组微生物进一步包含一种或多种修饰,以减少或缺失乙醇醛还原酶、乙醇醛脱氢酶、乳酸脱氢酶或其组合的活性。
在一个实施方案中,至少一部分在C3途径中生产的过量NADH用作C2途径中还原当量的来源。在另一个实施方案中,至少一部分在C3途径中生产的过量NADH用于生产ATP。
在一个实施方案中,最小化过量的生物质形成,并且最大化MEG(或乙醇酸)或MEG(或GA)和一种或多种联产品的生产。
在另一方面,本申请提供了一种使用上述实施方案中任一项的重组微生物生产一种或多种衍生自甘油醛-3-磷酸(G3P)和乙醇醛的产物的方法,其中所述方法包括在含有提供碳源的一种或多种戊糖和/或己糖的培养介质中培养重组微生物,直至生产一种或多种衍生自甘油醛-3-磷酸(G3P)和乙醇醛的产物。在一些实施方案中,重组微生物联产单乙二醇(MEG)和一种或多种联产品。在进一步的实施方案中,一种或多种联产品选自丙酮、异丙醇、丙烯、L-丝氨酸、甘氨酸、单乙醇胺(MEA)、乙二胺(EDA)或其组合。在仍进一步的实施方案中,一种或多种产物选自单乙二醇(MEG)和乙醇酸(GA)。
在又一方面,本申请提供了一种生产重组微生物的方法,所述微生物由一种或多种戊糖和/或己糖通过D-核糖-5-磷酸中间体生产或积累一种或多种衍生自甘油醛-3-磷酸(G3P)和乙醇醛的产物,所述方法包括:向重组微生物中引入或在重组微生物中表达一种或多种酶,其用于将一种或多种戊糖和/或己糖转化为D-核糖-5-磷酸中间体;向重组微生物中引入或在重组微生物中表达一种或多种酶,其用于将D-核糖-5-磷酸中间体转化为G3P和乙醇醛;向重组微生物中引入或在重组微生物中表达一种或多种酶,其用于在C2途径中由乙醇醛生产一种或多种产物;向重组微生物中引入或在重组微生物中表达一种或多种酶,其用于在一种或多种C3途径中由G3P生产一种或多种产物;在含有一种或多种戊糖和/或己糖的培养介质中培养重组微生物,以生产或积累一种或多种产物。在一些实施方案中,重组微生物联产单乙二醇(MEG)和一种或多种联产品。在进一步的实施方案中,一种或多种联产品选自丙酮、异丙醇、丙烯、L-丝氨酸、甘氨酸、单乙醇胺(MEA)、乙二胺(EDA)或其组合。在仍进一步的实施方案中,一种或多种产物选自单乙二醇(MEG)和乙醇酸(GA)。
附图说明
附图中说明了本公开的说明性实施方案,其中:
图1说明了戊糖或己糖的降解途径。符号
Figure BDA0003310804120000111
表示可能被下调或失活/消除的酶,即相应的基因可能减弱或缺失。
图2说明了戊糖或己糖的降解途径的变体,其包含果糖-6-磷酸磷酸酮醇酶(Fpk)和磷酸乙酰转移酶(pta)。符号
Figure BDA0003310804120000112
表示可能被下调或失活/消除的酶,即相应的基因可能减弱或缺失。
图3说明了各种糖无损转化为乙醇醛和甘油醛3-磷酸。
图4说明了通过戊糖磷酸(D-核糖5-磷酸、D-核酮糖5-磷酸和D-木酮糖5-磷酸)高产率生产MEG和可能的联产途径。
图5说明了通过戊糖磷酸(D-核糖5-磷酸、D-核酮糖5-磷酸和D-木酮糖5-磷酸)高产率生产乙醇酸的途径。图6说明了MEG和Ser、Gly、MEA、EDA联产途径的概述。
图7说明了已公开的EDA生产途径。来自WO 2014/049382。反应F:通过L-丝氨酸氨基酶,直接氨基化L-丝氨酸。反应G:通过2,3-二氨基丙酸解氨酶,直接氨基化丙酮酸。
图8描绘了来自大肠杆菌和热容芽孢杆菌的DERA的比对,其中突出显示了突变。
图9是显示用于测量戊糖激酶活性的测定的反应示意图。
图10是重组rbsK酶对戊糖底物的Michaelis-Menten曲线图。将初始速率绘制为底物浓度的函数。
图11是重组木酮糖激酶对戊糖底物的Michaelis-Menten曲线图。将初始速率绘制为底物浓度的函数。
图12是重组AraB酶对戊糖底物的Michaelis-Menten曲线图。将初始速率绘制为底物浓度的函数。
图13是显示用于测量重组DERA活性的测定的反应示意图,其使用天然底物2-脱氧-核糖-5P。
图14是显示用于由戊糖底物测量重组DERA活性的测定的反应示意图。
图15是市售大肠杆菌衍生DERA酶使用天然底物脱氧-核糖-5P的Michaelis-Menten曲线图。将初始速率绘制为底物浓度的函数。
图16是重组大肠杆菌衍生野生型DERA酶使用天然底物脱氧-核糖-5P的Michaelis-Menten曲线图。将初始速率绘制为底物浓度的函数。
图17是重组热容芽孢杆菌衍生野生型DERA酶使用天然底物脱氧-核糖-5P的Michaelis-Menten曲线图。将初始速率绘制为底物浓度的函数。
图18是重组大肠杆菌衍生C47N突变DERA酶变体使用天然底物脱氧-核糖-5P的Michaelis-Menten曲线图。将初始速率绘制为底物浓度的函数。
图19是重组大肠杆菌衍生C47N突变DERA酶变体使用天然底物脱氧-核糖-5P的Michaelis-Menten曲线图。将初始速率绘制为底物浓度的函数。
图20是重组大肠杆菌衍生K201N突变DERA酶变体使用天然底物脱氧-核糖-5P的的Michaelis-Menten曲线图。将初始速率绘制为底物浓度的函数。
图21是显示用于测量aldA活性的测定的反应示意图,其使用乙醇醛底物。
图22是aldA使用乙醇醛作为底物的Michaelis-Menten曲线图。将初始速率绘制为底物浓度的函数。
图23是显示用于由戊糖测量乙醇酸产量的测定的反应示意图。
图24是DERA活性的示意图,其使用表达DERA蛋白的MG1655-ΔtktA-ΔtktB株,并以木糖生长。
图25是以木糖基础介质生长的大肠杆菌株的生长曲线图。
具体实施方式
定义
以下定义和缩写将用于解释本公开。
如本文和所附权利要求中使用的,单数形式“一(a)”、“一个(an)”和“所述……(the)”包括复数所指对象,除非上下文另有明确规定。因此,例如,提及“一种酶”包括多种这样的酶,提及“所述微生物”包括提及一种或多种微生物,等等。
如本文所用,术语“包含(comprises)”、“包含(comprising)”、“包括(includes)”、“包括(including)”、“具有(has)”、“具有(having)”、“含有(contains)”、“含有(containing)”或其任何其他变体旨在涵盖非排他性的包含。包含元素列表的组合物、混合物、过程、方法、物品或装置不必须仅限于那些元素,而是可以包括其他未明确列出的元素或此类组合物、混合物、过程、方法、物品或装置所固有的其他元素。此外,除非另有明确说明,否则“或”是指包含性的“或”,而不是排他性的“或”。
如本文所用,修饰数值的术语“约”和“左右”表示围绕该明确值的近距离范围。如果“X”是该值,则“约X”或“X左右”将指示0.9X至1.1X的值,或在一些实施方案中,0.95X至1.05X的值。对“约X”或“X左右”的任何提及具体表示至少以下值:X、0.95X、0.96X、0.97X、0.98X、0.99X、1.01X、1.02X、1.03X、1.04X和1.05X。因此,“约X”和“X左右”旨在为权利要求的限定(例如“0.98X”)提供教导和书面描述支持。
如本文所用,术语“微生物的(microbial)”和“微生物(microbial organism,microorganism)”包括在古细菌、细菌或真核生物界内作为微观细胞存在的任何生物体,所述真核生物包括酵母和丝状真菌、原生动物、藻类或高等原生生物。因此,该术语旨在涵盖具有微观尺寸的原核或真核细胞或生物体,并且包括所有物种的细菌、古细菌和真细菌以及真核微生物(如酵母和真菌)。还包括可以培养用于生产化学品的任何物种的细胞培养物。
如本文所述,在一些实施方案中,所述重组微生物是原核微生物。在一些实施方案中,所述原核微生物是细菌。“细菌”或“真细菌”是指原核生物的界。细菌包括至少十一个不同的组,如下:(1)革兰氏阳性(gram+)菌,其中有两大主要分支:(1)高G+C组(放线菌属(Actinomycetes)、分枝杆菌属(Mycobacteria)、微球菌属(Micrococcus)和其他)(2)低G+C组(芽孢杆菌属(Bacillus)、梭菌属(Clostridia)、乳杆菌属(Lactobacillus)、葡萄球菌属(Staphylococci)、链球菌属(Streptococci)和支原体属(Mycoplasmas));(2)变形菌(Proteobacteria),例如紫色光合+非光合革兰氏阴性菌(包括大多数“常见”革兰氏阴性菌);(3)蓝细菌(Cyanobacteria),例如产氧光养菌(oxygenic phototroph);(4)螺旋体(Spirochetes)及相关物种;(5)浮霉状菌属(Planctomyces);(6)拟杆菌属(Bacteroides)、黄杆菌属(Flavobacteria);(7)衣原体属(Chlamydia);(8)绿色硫细菌(Green sulfurbacteria);(9)绿色非硫细菌(Green non-sulfur bacteria,也是厌氧光养菌(anaerobicphototroph));(10)抗辐射微球菌及其相关;(11)栖热袍菌(Thermotoga)和栖热腔菌(Thermosipho)嗜热菌。
“革兰氏阴性菌”包括球菌、非肠杆菌(nonenteric rods)和肠杆菌(entericrods)。革兰氏阴性菌的属包括例如:奈瑟氏菌属(Neisseria)、螺旋菌属(Spirillum)、巴氏杆菌属(Pasteurella)、布鲁氏菌属(Brucella)、耶尔森氏菌属(Yersinia)、弗朗西斯氏菌属(Francisella)、嗜血杆菌属(Haemophilus)、博德特氏菌属(Bordetella)、埃希氏菌属(Escherichia)、沙门氏菌属(Salmonella)、志贺氏菌属(Shigella)、克雷伯氏菌属(Klebsiella)、变形杆菌属(Proteus)、弧菌属(Vibrio)、假单胞菌属(Pseudomonas)、拟杆菌属(Bacteroides)、醋杆菌属(Acetobacter)、气杆菌属(Aerobacter)、土壤杆菌属(Agrobacterium)、固氮菌属(Azotobacter)、螺旋菌属(Spirilla)、沙雷氏菌属(Serratia)、弧菌属(Vibrio)、根瘤菌属(Rhizobium)、衣原体属(Chlamydia)、立克次氏体属(Rickettsia)、密螺旋体属(Treponema)和梭杆菌属(Fusobacterium)。
“革兰氏阳性菌”包括球菌、非孢子杆菌(nonsporulating rods)和孢子杆菌(sporulating rods)。革兰氏阳性菌的属包括例如:放线菌属(Actinomyces)、芽孢杆菌属(Bacillus)、梭菌属(Clostridium)、棒杆菌属(Corynebacterium)、丹毒丝菌属(Erysipelothrix)、乳杆菌属(Lactobacillus)、李斯特菌属(Listeria)、分枝杆菌属(Mycobacterium)、粘球菌属(Myxococcus)、诺卡氏菌属(Nocardia)、葡萄球菌属(Staphylococcus)、链球菌属(Streptococcus)和链霉菌属(Streptomyces)。
术语“重组微生物”和“重组宿主细胞”在本文中可互换使用,是指已被遗传修饰以表达或过表达内源性酶、表达异源酶(如包括在载体中、在整合构建体中的那些酶)、或内源基因的表达发生改变的微生物。“改变(alteration)”意为基因的表达、或编码一种或多种多肽或多肽亚基的RNA分子或等效RNA分子的水平、或一种或多种多肽或多肽亚基的活性被上调或下调,使得表达、水平或活性大于或小于在没有改变的情况下观察到的表达、水平或活性。例如,术语“改变(alter)”可以表示“抑制”,但“改变”一词的使用不限于此定义。应理解,术语“重组微生物”和“重组宿主细胞”不仅指特定的重组微生物,而且指此类微生物的后代或潜在后代。因为由于突变或环境影响,某些修饰可能在后代中发生,所以这样的后代实际上可能与亲本细胞不同,但仍包括在本文所用的术语的范围内。
与基因序列相关的术语“表达”是指基因的转录,以及在适当情况下,指所得mRNA转录物翻译成蛋白质。因此,如从上下文可以清楚看出的,蛋白质的表达是由开放阅读框序列的转录和翻译引起的。可以基于细胞中存在的相应mRNA的量或由选定序列编码的所需产物的量,来确定宿主细胞中所需产物的表达水平。例如,可以通过qRT-PCR或Northern杂交定量由选定序列转录的mRNA(参见Sambrook等人,Molecular Cloning:A LaboratoryManual,Cold Spring Harbor Laboratory Press(1989))。可以通过各种方法定量由所选择的序列编码的蛋白质,例如通过ELISA,通过测定该蛋白质的生物活性,或通过使用独立于这种活性的测定,如蛋白质印迹或放射免疫测定(使用识别并结合该蛋白质的抗体)。参见Sambrook等人,1989,同上。
在本文中,术语“多核苷酸”可与术语“核酸”互换使用,是指由两种或多种单体组成的有机聚合物,其包括核苷酸、核苷或其类似物,包括但不限于单链或双链、有义或反义的任何长度的脱氧核糖核酸(DNA),以及在适当情况下,包括单链或双链、有义或反义的任何长度的核糖核酸(RNA)(包括siRNA)。术语“核苷酸”是指由连接到嘌呤或嘧啶碱基和磷酸基团的核糖或脱氧核糖组成的几种化合物中的任一种,并且是核酸的基本结构单元。术语“核苷”是指由嘌呤或嘧啶碱基与脱氧核糖或核糖组合组成的化合物(如鸟苷或腺苷),尤其见于核酸中。术语“核苷酸类似物”或“核苷类似物”分别是指一种核苷酸或核苷,其中一个或多个单个原子被不同的原子或不同的官能团替换。相应地,术语多核苷酸包括任何长度的核酸、DNA、RNA、其类似物及其片段。三个或更多核苷酸的多核苷酸也称为核苷酸低聚物或寡核苷酸。
应理解,本文所述的多核苷酸包括“基因”,本文所述的核酸分子包括“载体”或“质粒”。相应地,术语“基因”,也称为“结构基因”,是指编码特定氨基酸序列的多核苷酸,其包含一种或多种蛋白质或酶的全部或部分,并且可以包括调节性(非转录)DNA序列,如启动子序列,其决定例如基因表达的条件。基因的转录区可以包括非翻译区,包括内含子、5'-非翻译区(UTR)和3'-UTR,以及编码序列。
如本文所用,术语“酶”是指催化或促进一种或多种化学或生化反应的任何物质,其通常包括完全或部分由一种或多种多肽组成的酶,但也可以包括由包括多核苷酸的不同分子组成的酶。
如本文所用,术语“非天然存在的”,当用于提及本公开的微生物或酶活性时,旨在表示该微生物或酶具有至少一种在参考物种的天然存在的株(包括参考物种的野生型株)中通常不存在的基因改变。基因改变包括例如,引入编码代谢多肽的可表达核酸的修饰、其他核酸添加、核酸缺失和/或微生物遗传物质的其他功能破坏。这类修饰包括,例如,参考物种的异源、同源或异源和同源多肽的编码区及其功能片段。其他修饰包括例如,其中的修饰改变基因或操纵子的表达的非编码调控区。示例性的非天然存在的微生物或酶活性包括上述羟基化活性。
如本文所用,关于各种分子(例如多核苷酸、多肽、酶等)的术语“外源的”是指在自然界中给定的酵母、细菌、生物体、微生物或细胞中通常或天然不存在和/或由其生产的分子。
另一方面,如本文所用,关于各种分子(例如多核苷酸、多肽、酶等)的术语“内源的”或“天然的(native)”是指在自然界中给定的酵母、细菌、生物体、微生物或细胞中通常或天然存在和/或由其生产的分子。
如本文的上下文中使用的,修饰的宿主细胞的术语“异源的”是指各种分子(例如多核苷酸、多肽、酶等),其中以下至少一项为真:(a)该分子对于宿主细胞是外来的(“外源的”)(即,不是天然存在于宿主细胞中的);(b)该分子天然存在于(例如,是“内源的”)给定的宿主微生物或宿主细胞中,但在细胞中的非天然位置或以非天然的量生产;和/或(c)该分子在核苷酸或氨基酸序列上与内源性核苷酸或氨基酸序列不同,使得在核苷酸或氨基酸序列上与内源性存在的内源性核苷酸或氨基酸不同的该分子在细胞中以非天然的(例如,大于天然存在的)量生产。
如本文所用,关于第一家族或物种的原始酶或基因的术语“同源物”是指第二家族或物种的不同酶或基因,其通过功能、结构或基因组分析确定为对应于第一家族或物种的原始酶或基因的第二家族或物种的酶或基因。同源物通常具有功能、结构或基因组相似性。已知技术可以容易地使用遗传探针和PCR克隆酶或基因的同源物。可以使用功能测定和/或通过基因的基因组作图来确认克隆序列作为同源物的特性。
如果基因编码的氨基酸序列与第二基因的氨基酸序列相似,则该蛋白质与第二蛋白质具有“同源性”或为“同源的”。或者,如果两个蛋白质具有“相似”的氨基酸序列,则该蛋白质与第二蛋白质具有同源性。因此,术语“同源蛋白质”旨在表示两种蛋白质具有相似的氨基酸序列。在某些情况下,两种蛋白质之间的同源性表明其与进化相关的共有祖先。认为、相信或已知术语“同源序列”或“同源物”在功能上相关。可以通过多种方式中的任何一种来表示函数关系,所述方式包括但不限于:(a)序列同一性的程度和/或(b)相同或相似的生物学功能。优选地,同时表明(a)和(b)。序列同一性的程度可以变化,但在一个实施方案中,为至少50%(当使用本领域已知的标准序列比对程序时)、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或至少98.5%、或至少约99%、或至少99.5%、或至少99.8%、或至少99.9%。可以使用本领域中容易获得的软件程序来确定同源性,例如在Current Protocols in Molecular Biology(F.M.Ausubel等人,eds.,1987)附录30,7.718节,表7.71中讨论的那些程序。MacVector(Oxford MolecularLtd,Oxford,U.K)和ALIGN Plus(Scientific and Educational Software,Pennsylvania)是一些比对程序。其他非限制性比对程序包括Sequencher(Gene Codes,Ann Arbor,Michigan)、AlignX和Vector NTI(Invitrogen,Carlsbad,CA)。相似的生物学功能可以包括但不限于:催化相同或相似的酶促反应;对底物或辅因子具有相同或相似的选择性;具有相同或相似的稳定性;对各种发酵条件(温度、pH值等)具有相同或相似的耐受性;和/或对各种代谢底物、产物、副产物、中间体等具有相同或相似的耐受性。生物功能的相似程度可以变化,但在一个实施方案中,为至少1%、至少2%、至少3%、至少4%、至少5%、至少6%、至少7%、至少8%、至少9%、至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或至少98.5%、或至少约99%、或至少99.5%、或至少99.8%、或至少99.9%,根据本领域技术人员已知的一种或多种测定来确定给定的生物学功能。
术语“变体”是指本文所述的任何多肽或酶。变体还涵盖多聚体(multimer)的一种或多种组分、包含单个组分的多聚体、包含多个单个组分的多聚体(例如参考分子的多聚体)、化学分解产物和生物分解产物。特别地,在非限制性实施方案中,由于编码参考酶的多肽序列的任何部分的改变,该酶可以是相对于参考酶的“变体”。在用于测量参考酶制剂的酶活性的标准测定中,参考酶的变体可以具有至少10%、至少30%、至少50%、至少80%、至少90%、至少100%、至少105%、至少110%、至少120%、至少130%或更高的酶活性。在一些实施方案中,变体还可以指与本公开的全长或未加工的酶具有至少50%、至少60%、至少70%、至少80%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性的多肽。在一些实施方案中,变体还可以指与本公开的成熟或加工的酶具有至少50%、至少60%、至少70%、至少80%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性的多肽。
如本文所用,术语“信号序列”是指将肽和多肽靶向至细胞位置或细胞外环境的氨基酸序列。信号序列通常位于多肽的N-末端部分,并且通常被酶促去除。具有其信号序列的多肽称为全长的和/或未加工的。已去除其信号序列的多肽称为成熟的和/或加工的。
如本文所用,术语“产率潜力(yield potential)”是指来自生物合成途径的产物的产率。在一个实施方案中,产率潜力可以表示为每重量起始化合物的最终产物的重量百分比。
如本文所用,术语“热力学最大产率(thermodynamic maximum yield)”是指基于产物与原料相比的能量值,由给定原料(如葡萄糖)的发酵获得的产物的最大产率。例如,在正常发酵中,如果不使用额外的能源(如光、氢气或甲烷或电力),则产物不能比原料含有更多能量。热力学最大产率表示来自原料的所有能量和质量都转化为产物的产物产率。该产率可以计算,并且与特定途径无关。如果通向产物的特定途径的产率低于热力学最大产率,则其损失质量,并且很可能可以改进为或以更有效的通向该产物的途径取代。
术语“氧化还原平衡的(redox balanced)”是指一组反应,其总体生产与消耗一样多的氧化还原辅因子。设计代谢途径和工程化生物体,使得氧化还原辅因子平衡或接近平衡,通常会导致所需化合物的生产效率更高、产率更高。氧化还原反应总是同时发生,因为一个氧化反应和另一个还原反应这两个半反应同时发生。在氧化还原过程中,还原剂将电子转移至氧化剂。因此,在该反应中,还原剂(reductant,reducing agent)失去电子并被氧化,氧化剂(oxidant,oxidizing agent)获得电子并被还原。在一个实施方案中,氧化还原反应发生在生物系统中。经常通过氧化还原反应储存和释放生物能量。光合作用涉及将二氧化碳还原为糖类和将水氧化为分子氧。逆反应呼吸作用将糖类氧化以生产二氧化碳和水。作为中间步骤,还原的碳化合物用于还原烟酰胺腺嘌呤二核苷酸(NAD+),其随后促进产生质子梯度,所述质子梯度驱动三磷酸腺苷(ATP)的合成并由氧的还原维持。术语氧化还原状态通常用于描述生物系统(如细胞或器官)中GSH/GSSG、NAD+/NADH和NADP+/NADPH的平衡。氧化还原状态反映在几组代谢物(例如乳酸盐和丙酮酸盐、β-羟基丁酸盐和乙酰乙酸盐)的平衡中,其互变取决于这些比率。异常氧化还原状态可以在各种有害情况(如缺氧、休克和败血症)下发展。
如本文所用,术语“C2途径”、“C2分支途径”、“C2生化途径”或“C2流”是指其中可以通过乙醇醛生产MEG的生化途径。
如本文所用,术语“C3途径”、“C3分支途径”、“C3生化途径”或“C3流”是指其中可以通过丙酮酸、乙酰辅酶A或磷酸二羟丙酮(DHAP)生产MEG和/或一种或多种联产品(如丙酮、异丙醇、丙烯、异丁烯和/或丝氨酸途径化合物)的生化途径。
术语“C5糖”和“戊糖”可互换使用,是指由5个碳原子组成的糖分子。类似地,术语“C6糖”和“己糖”可互换使用,是指由6个碳原子组成的糖分子。糖可以是单体、低聚物或其组合。在一个进一步的示例性实施方案中,所述糖是葡萄糖或葡萄糖的低聚物。在其他实施方案中,葡萄糖的低聚物选自果糖、蔗糖、淀粉、纤维二糖、麦芽糖、乳糖和纤维素。在仍进一步的实施方案中,糖包括D-木糖、D-半乳糖、D-甘露糖、D-阿拉伯糖、L-阿拉伯糖、D-果糖或其组合。
简介
本公开主要依赖于天然的、经过验证的反应,仅通过引入一种戊糖磷酸醛缩酶催化的新反应,允许由多种C5(戊糖)和C6(己糖)糖在没有碳损失的情况下获取广泛可用的关键中间体甘油醛-3-磷酸(G3P)和乙醇醛。在一些实施方案中,己糖可以选自D-阿洛糖、D-阿卓糖、D-葡萄糖、D-甘露糖、D-古洛糖、D-艾杜糖、D-半乳糖、D-塔洛糖、D-塔格糖、D-山梨糖、D-果糖、D-阿洛酮糖和本领域已知的其他己糖。在一些实施方案中,戊糖可以选自D-木糖、D-核糖、D-阿拉伯糖、D-来苏糖、D-木酮糖、D-核酮糖和本领域已知的其他戊糖。在一些实施方案中,己糖和戊糖可以选自本文公开的任何己糖和戊糖的左旋或右旋对映异构体。
本公开所述的酶反应允许例如由葡萄糖、木糖、或可以进入磷酸戊糖途径的各种其他糖、或可以容易地分解为上述单体的各种糖低聚物、或其混合物高产率生产MEG(或乙醇酸)或MEG(或GA)和联产品。
与其他基于葡萄糖的MEG(或乙醇酸)生产方法相比,本方法解决或减少了以下问题:ATP短缺;NADH大幅过量;整体产物产率潜力低。与其他基于葡萄糖的MEG或乙醇酸生产方法相比,本方法进一步允许以相同的高产率利用D-葡萄糖、D-木糖和/或各种其他糖或混合物。
与其他基于D-木糖的MEG(或乙醇酸)生产方法以及其他基于D-木糖的MEG和联产品生产方法相比,本方法解决了以下挑战和问题:依赖于木糖的工艺(可得性/市场限制、高价格或低纯度、比D-葡萄糖更慢且效率更低的摄入);葡萄糖诱导的D-木糖利用抑制。与其他基于D-木糖的MEG(或乙醇酸)生产方法以及其他基于D-木糖的MEG和联产品生产方法相比,本方法进一步允许以相同的高产率利用D-葡萄糖、D-木糖和/或各种其他糖或混合物。
所有目前已知的使用葡萄糖作为原料的MEG(或乙醇酸)生产方法均具有低产率潜力。这是葡萄糖被降解为MEG的生物化学的固有缺点,对于所有建议的和已知的途径,每个生产的MEG(或乙醇酸)分子发生一次脱羧。然而,每个MEG一次脱羧过多,不能达到氧化还原中性,因此也不能达到最佳产率。
本公开通过建立迄今未描述的戊糖磷酸醛缩酶反应,描述了一种全新的通过磷酸戊糖途径和/或其关键戊糖磷酸中间体的戊糖或己糖降解方式,所述关键戊糖磷酸中间体包括D-核糖-5-磷酸、D-核酮糖-5-磷酸和D-木酮糖-5-磷酸盐,其中所述醛缩酶具有D-核糖-5-磷酸醛缩酶活性、D-核酮糖-5-磷酸醛缩酶活性或D-木酮糖-5-磷酸醛缩酶活性,并生产关键前体乙醇醛和甘油醛3-磷酸(G3P)(图1)。依赖于进入磷酸戊糖途径,这种转化不会损失碳,即使由己糖转化也是如此。因此,本公开允许基于己糖和/或戊糖高产率生产各种G3P或乙醇醛衍生物。
利用非氧化进入磷酸戊糖途径
该技术可用于通过非氧化磷酸戊糖途径将葡萄糖无损转化为戊糖磷酸中间体。其中,戊糖磷酸中间体包括D-核糖-5-磷酸、D-核酮糖-5-磷酸或D-木酮糖-5-磷酸。将转酮醇酶(如由来自大肠杆菌的tktA或tktB编码)用作非氧化进入磷酸戊糖途径,将糖酵解中间体D-果糖6-磷酸和D-甘油醛3-磷酸转化为D-木酮糖5-磷酸和D-赤藓糖4-磷酸。D-赤藓糖4-磷酸和另一个D-果糖6-磷酸被转醛醇酶(如来自大肠杆菌的talA或talB)进一步加工,然后被转酮醇酶加工为D-核糖5-磷酸和D-木酮糖5-磷酸。D-木酮糖5-磷酸分子可以容易地通过D-核酮糖5-磷酸3-差向异构酶(rpe)和D-核糖5-磷酸异构酶(rpi)转化为D-核糖5-磷酸(图1)。
最终等式是:
2.5D-葡萄糖+2.5ATP+0.5磷酸→3D-核糖5-磷酸+2.5ADP
如果使用D-木糖作为碳源,简单的异构化(大肠杆菌中的xylA)和活化(大肠杆菌中的xylB,木酮糖5-激酶)生成D-木酮糖5-磷酸,其可以通过rpe和rpi的作用转化为D-核糖5-磷酸。这已是许多生物体(如大肠杆菌)中利用木糖的天然途径。
最终等式是:
2D-木糖+2ATP→2D-核糖5-磷酸+2ADP
非氧化进入磷酸戊糖途径的流的优化
为避免丢失一个碳,不应利用大肠杆菌中的常见途径,即通过6-磷酸D-葡萄糖酸-1,5-内酯氧化进入磷酸戊糖途径和氧化脱羧为D-核酮糖5-磷酸。通过缺失或抑制一个或多个负责的基因(在大肠杆菌中:zwf、pgl、gnd)来有利地抑制至少一个或多个合适的反应,即葡萄糖6-磷酸1-脱氢酶、6-磷酸葡萄糖酸内酯酶和6-磷酸葡萄糖酸脱氢酶。
利用可选的非氧化进入磷酸戊糖途径
可选地,可以将特异性的D-果糖6-磷酸磷酸酮醇酶(Fpk)和磷酸乙酰转移酶(PTA)用作无损进入磷酸戊糖途径,由D-果糖6-磷酸制备一个D-赤藓糖4-磷酸和一个乙酰辅酶A。如上所述,将D-赤藓糖4-磷酸和一个另外的D-果糖6-磷酸加工为两个D-核糖5-磷酸(图2)。
最终等式是:
2D-葡萄糖+2ATP+1辅酶A→2D-核糖5-磷酸+1乙酰辅酶A+2ADP
下调糖酵解下游反应
需要糖酵解的上部,将2.5D-葡萄糖或D-果糖转化为关键中间体2x D-果糖6-磷酸和1x D-甘油醛3-磷酸。为了减少或消除进一步流向糖酵解的下游,即D-甘油醛3-磷酸氧化磷酸化为1,3-双磷酸D-甘油酸并随后转化为3-磷酸-D-甘油酸和2-磷酸-D-甘油酸,可以在大肠杆菌中降低D-甘油醛3-磷酸脱氢酶、磷酸甘油酸激酶和磷酸甘油酸变位酶(分别由gapA、pgk和gpmA/gpmM编码)的活性。
如果利用了通过Fpk可选进入磷酸戊糖途径,则不需要D-甘油醛3-磷酸,并且可以减少或使适当的6-磷酸果糖激酶活性缺失(在大肠杆菌中的pfkA和/或pfkB基因)。
利用另外的糖
如果生物体具有或被赋予消耗以下的能力:淀粉、或蔗糖、或纤维素、或麦芽糖、或C5或C6糖(如葡萄糖或木糖)的低聚物(例如通过表达蔗糖转化酶或纤维二糖向内转运蛋白(importer)和纤维二糖水解酶)、或任何其他可以通过磷酸戊糖途径降解的糖,则该生物体可以生成本公开的关键中间体D-核糖5-磷酸,从而使其能够以相同的方式、以相同的程度利用本公开的组合物和方法产生相同的益处。例如,L-或D-阿拉伯糖均可以在大肠杆菌中通过已知的降解途径在没有碳损失的情况下自然加工,分别加工为磷酸戊糖途径中间体D-木酮糖5-磷酸或D-核酮糖5-磷酸(图3)。然后,这些物质可以通过rpe和rpi介导的活性容易地转化为D-核糖5-磷酸。例如在大肠杆菌中,D-甘露糖或D-半乳糖也自然降解为磷酸戊糖途径进入分子D-果糖6-磷酸。
在大肠杆菌中,D-果糖不是通过D-果糖6-磷酸降解,而是通过D-果糖1-磷酸和D-果糖1,6-二磷酸降解。然而,固有的果糖1,6-二磷酸酶的简单过表达将导致产生D-果糖6-磷酸,因此本发明能够利用D-果糖或D-果糖产生的低聚物(如蔗糖)。
对反应产物的可能利用
G3P是糖酵解的早期关键中间体,因此可以用于合成大多数可以源自葡萄糖的化学品,如但不限于丙酮、2-丙醇、丙烯、异丁烯、单乙二醇(MEG)、乙醇酸(GA)和丝氨酸途径化合物。丝氨酸途径化合物可以包括L-丝氨酸、甘氨酸、单乙醇胺(MEA)和乙二胺(EDA)。乙醇醛可以容易地通过还原转化为MEG或通过氧化转化为GA(图4和图5)。
大多数生物也可以自然地将乙醇醛氧化为乙醛酸,并进一步将其转化为常见的中间体草酰乙酸、苹果酸或2-磷酸甘油酸(通过酒石酸半醛)。这些中间体可以转化为生物质或各种化合物。如果应该避免这些反应,例如为了提高MEG生产,可以通过使适当基因的活性减少或缺失来减少或消除这些反应。
高产率生产MEG
该技术为利用相同的核心降解途径由葡萄糖或木糖或甚至两种糖的混合物生产MEG提供了新型有利高产途径(图4)。
如果利用葡萄糖用于MEG生产,则迄今为止描述的所有方法都教导了通过糖酵解降解为3-磷酸甘油酸,并进一步通过L-丝氨酸途径反应降解为MEG。然而,通过这种方式,该3碳化合物将被降解为2碳化合物(MEG),每个MEG损失一个CO2,这对于所有描述的途径变化都为真。过量的CO2生产伴随着还原当量(NADH)的过度生产,并导致产率潜力的显著损失(每克糖仅0.69g_MEG,对比热力学最大产率潜力为0.82g_MEG):
1D-葡萄糖→2MEG+2CO2+2NADH,y=0.69g/g
WO2010/076324(或US2011/0294178;Metabolic Explorer)中描述了发酵性MEG生产,其全文并入本文。该申请建议通过2-酮酸脱羧和还原生产二醇,包括基于丝氨酸生物合成的途径生产中间体羟基丙酮酸并进一步生产乙二醇。然而,该公开的途径具有降低的总产率潜力,其为0.69g_MEG/g_葡萄糖,而葡萄糖→MEG转化的热力学最大产率为0.82g/g。该途径也不是氧化还原平衡的,并且具有高度过量的NADH,消耗的每mol葡萄糖对应2mol过量的NADH,需要重新氧化所有NADH以使细胞存活。在有氧发酵中,这种NADH可以用于生成ATP,但ATP会大量过量(2NADH→6ATP),导致在生产阶段形成过量的生物质,从而降低产物形成和产率。
因此,WO2010/076324中公开的发酵性MEG生产途径具有ATP短缺(每个MEG对应-1ATP)、过量NADH(每个MEG对应+1NADH)、低产率潜力(ymax=0.69g_MEG/g_葡萄糖),并且是尚未被证明具有高效率/生产率的具有挑战性的途径。
WO2011/130378A1(或US2011/0312049;Genomatica)的公开内容提出了一种类似于WO2010/076324的方法,其通过羟基丙酮酸由葡萄糖生产MEG,但也提到了具有可选的但相关的关键中间体甘油酸或乙醇胺的途径变化。
除ATP短缺之外,WO2011/130378A1的公开与WO2010/076324具有相同的缺点。每个MEG可以对应+0ATP或+1ATP,取决于所利用的酶。
如果使用非氧化磷酸戊糖途径将D-葡萄糖转化为D-核糖5-磷酸,则本公开允许由D-葡萄糖产生氧化还原中性MEG,产率为0.827g/g(图4)。
5/6D-葡萄糖或1D-木糖→2MEG+1CO2+0NADH,y=0.827g/g
关于使用D-木糖,其他最近的公开已证明D-木糖至MEG的途径的产率为0.827g/g。
已证实通过核酮糖-1-磷酸由木糖发酵生产MEG(WO2013/126721)具有高产率潜力(0.82g_MEG/g_木糖),其等于热力学最大产率。其通过2-碳流(通过乙醇醛)和3-碳流(通过磷酸二羟丙酮)这两种不同的并行活性途径生产MEG。C2流易于实施,但C3流难以通过代谢工程化高效实施。C3流利用WO2010/076324或WO2011/130378中所示的途径。
假设典型地由ATP驱动木糖输入,则整个过程至少是ATP中性的。因此,为了获得细胞生长和维持所需的一些多余ATP,将损失一些木糖并因此损失产率。
然而,葡萄糖是大多数微生物的首选碳源,木糖的摄入不像葡萄糖的摄入那样有效和快速。此外,培养介质中葡萄糖的存在通常会抑制其他糖类(如木糖)的利用。为了更有效的过程,需要破坏导致这种优先消耗的生物体调节,并使株适应木糖优先或糖的共同消耗。
然而,关键的挑战是获得作为负担得起的清洁原料的木糖。作为纯化学品的木糖价格昂贵且不能大量供应。半纤维素水解物中的木糖的量较多且成本可能低于葡萄糖,但伴随着许多杂质和抑制发酵的物质。
因此,由木糖发酵生产MEG(或乙醇酸)(WO2013/126721)对使用木糖作为原料(可得性、价格、纯度、葡萄糖对木糖利用的抑制)和使用C3途径提出了挑战,其尚未在高效率/生产力方面得到证明。此外,存在ATP短缺,+0ATP(如果不使用甘油酸激酶,则为-1ATP),其不足以维持细胞。
已进一步证实的通过木酮糖-1-磷酸由木糖发酵生产MEG(Alkim等人,MicrobCell Fact(2015)14:127),与WO2013/126721描述的途径非常相似。其具有相同的高产率潜力(0.82g/g),难以通过DHAP实施MEG生产的C3流,ATP短缺和原料的挑战。
另外的已证实的通过木糖酸由木糖发酵生产MEG(WO2013/119020),与WO2013/126721描述的途径有相似之处。其生产乙醇醛和丙酮酸作为关键中间体,以允许以0.41g/g的产率潜力由乙醇醛生产MEG。这代表了高相对产率,因为它的实现仅用了一半的流。然而,WO2013/119020或别处没有介绍将剩余的丙酮酸转化为MEG的途径。目前,没有已知的现实和有效的途径将丙酮酸转化为MEG。虽然丙酮酸本身作为联产品使得整个过程是氧化还原中性的(+0NADH),但其不是经济上令人关注的产物,并且该过程将缺乏1ATP(对于丙酮酸输出可能还多约2ATP)。因此,理想情况下,需要丙酮酸衍生的、经济上令人关注的高产率联产品,以递送多余ATP。因此,通过木糖酸由木糖发酵生产MEG(WO2013/119020)对以下方面提出了挑战:使用木糖作为原料(可得性、价格、纯度、葡萄糖对木糖利用的抑制)、MEG的绝对产率低、ATP短缺(其可能是-1至有丙酮酸时-3ATP,取决于联产品)、并且需要具有高产率潜力和多余ATP的丙酮酸衍生的联产品。
本公开提供了用于由D-木糖高产率生产MEG的进一步解决方案。然而,与以前的解决方案不同,该解决方案还允许使用相同的核心降解途径由D-葡萄糖高产率生产MEG。
MEG和DHAP衍生化合物的高产率联产
本公开还允许用于联产MEG的有利高产率途径,该途径需要还原当量,具有其生物合成途径生成还原当量的化合物,所述化合物如丙酮、2-丙醇、丙烯、异丁烯和/或丝氨酸途径化合物。在一些实施方案中,丝氨酸途径化合物包括L-丝氨酸、甘氨酸、单乙醇胺(MEA)和/或乙二胺(EDA)。虽然之前已经描述了MEG与其他化合物的协同联产(参见美国申请No.62/305,814、美国申请No.62/430,742和美国申请No.62/406,684,其各自在此全文并入),该解决方案不仅允许利用D-木糖,还允许利用D-葡萄糖和甚至D-葡萄糖和D-木糖的混合物,其具有相同的高产率和协同联产优势。
高产率生产乙醇酸(GA)
所描述的由D-葡萄糖至GA的途径也通过3-磷酸甘油酸和丝氨酸途径的反应,或通过乙醛酸旁路。在这两种情况下,每个乙醇酸再次过量损失一个CO2,导致最大产率仅为0.84g/g,远低于热力学最大产率潜力(1.7g/g):
1D-葡萄糖→2GA+2CO2+6NADH,y=0.84g/g
已描述了用于生产GA的产率提高的新途径(WO2016079440、WO2013126721、WO2013119020)。然而,其只有在使用D-木糖作为碳源时才有效,D-木糖目前尚无法作为商品获得:
1D-木糖→2GA+1CO2+4NADH,y=1.01g/g
使用本公开的组合物和方法,由D-葡萄糖(具有非氧化磷酸戊糖途径)的产率显著增加。其也对D-木糖有效,具有相同产率(图5):
5/6D-葡萄糖或1D-木糖->2GA+1CO2+4NADH,y=1.01g/g
以下针对通过使用D-葡萄糖或D-木糖的标准途径与通过使用D-葡萄糖或D-木糖的本公开的途径生产MEG(或乙醇酸,GA),给出了化学计量。
与用于MEG或GA生产的标准D-葡萄糖途径(如WO2010/076324或WO2011/130378A1中公开的)相关的化学计量:
1D-葡萄糖→2GA+6NADH+0ATP;y=0.844g/g
或1D-葡萄糖→2MEG+4NADH+0ATP;y=0.689g/g
与本公开使用D-葡萄糖用于MEG或GA生产的途径相关的化学计量:
2.5D-葡萄糖+2.5ATP+0.5磷酸→3R5P→3GA +3DHAP+3NADH→6GA +12NADH+3ATP
1D-葡萄糖→2.4GA+4.8NADH+1.2ATP;y=1.01g/g
或1D-葡萄糖→2.4MEG+0NADH+1.2ATP,y=0.827g/g
与用于MEG或GA生产的标准D-木糖途径(如WO2013/126721或Alkim等人,MicrobCell Fact(2015)14:127中公开的途径)相关的化学计量:
1D-木糖→2GA+4NADH-1ATP*;y=1.01g/g
或1D-木糖→2MEG+0NADH-1ATP*;y=0.827g/g
*当使用XylE同向转运蛋白(symporter)而不是XylFGH木糖主动向内转运蛋白(importer)时,约-0.1ATP
与本公开使用D-木糖用于MEG或GA生产的途径相关的化学计量:
1D-木糖+2ATP→D-木酮糖5-P→D-核糖5-P→GA +1NADH+DHAP→2GA+4NADH+1ATP
1D-木糖→2GA+4NADH-1ATP*;y=1.01g/g
或1D-木糖→2MEG+0NADH-1ATP*;y=0.827g/g
*当使用XylE同向转运蛋白(symporter)而不是XylFGH木糖主动向内转运蛋白(importer)时,约-0.1ATP。
单乙二醇(MEG)
单乙二醇(MEG)是工业应用的重要原料。MEG的主要用途是制造聚对苯二甲酸乙二醇酯(PET)树脂、膜和纤维。此外,MEG在防冻剂、冷却剂、飞行器防冰剂、除冰剂和溶剂的生产中也很重要。MEG也称为乙烷-1,2-二醇。
乙二醇还用作对流热传递的介质,例如在汽车和液冷计算机中。
由于其高沸点和对水的亲和力,乙二醇是有用的干燥剂。乙二醇广泛用于抑制将天然气从偏远气田输送至天然气加工设施的多相长管道中天然气包合物(水合物)的形成。可以从天然气中回收乙二醇,并在去除水和无机盐的净化处理后将其作为抑制剂再利用。
乙二醇的次要用途包括:用于电容器制造,作为制造1,4-二恶烷的化学中间体,以及作为防止个人计算机液体冷却系统腐蚀的添加剂。乙二醇也用于制造一些疫苗;作为鞋油、油墨和染料的次要成分;用于处理木材腐烂和真菌;以及作为生物标本的防腐剂。
乙醇酸
乙醇酸在纺织工业中用作染色剂和鞣剂,在食品加工中用作调味剂和防腐剂,在制药工业中用作护肤剂。其还用于粘合剂和塑料中。乙醇酸通常包含于用于油墨和涂料的乳液聚合物、溶剂和添加剂中,以改善流动性能并赋予光泽。其用于增加瓷砖地板摩擦系数的表面处理产物中。
由于其优异的渗透皮肤的能力,乙醇酸在护肤产物中得到应用,以改善皮肤的外观和质地。其可以以20%至70%的浓度用作由皮肤科医生进行的化学换肤,或以介于10%至20%之间的较低浓度用于家用试剂盒。除浓度之外,pH在决定溶液中乙醇酸的效力中也起着很大的作用。
可以通过多种方式合成乙醇酸。主要方法使用甲醛与合成气的催化反应(甲醛的羰基化),因为其成本低。也可以通过氯乙酸与氢氧化钠反应,随后重新酸化来制备乙醇酸。其他未明显在使用中的方法包括草酸的氢化和由甲醛衍生的氰醇的水解。今天的一些乙醇酸不含甲酸。可以从天然来源(如甘蔗、甜菜、菠萝、哈密瓜和未成熟的葡萄)中分离乙醇酸。
乙醇酸是可用于一系列反应的有机合成中间体,所述反应包括:氧化还原、酯化和长链聚合。其用作制备聚乙醇酸和其他生物相容性共聚物(例如PLGA)的单体。商业上,重要的衍生物包括易于蒸馏的甲基(CAS#96-35-5)和乙基(CAS#623-50-7)酯。丁酯是一些漆的成分,因为其不挥发并具有良好的溶解性能而受欢迎。
丙酮
丙酮(acetone,也称为propanone)是具有分子式(CH3)2CO的有机化合物。其是无色、易挥发、易燃的液体,是最简单的酮。
丙酮与水混溶,是重要的溶剂,通常在实验室中用于清洁目的。全球产量超过670万吨,主要用作溶剂以及甲基丙烯酸甲酯和双酚A的生产。其是有机化学中的常见组成部分。丙酮的常见家庭用途是作为指甲油去除剂的活性成分和作为涂料稀释剂。
异丙醇
异丙醇(isopropyl alcohol,IUPAC名称为2-丙醇,也称为isopropanol)是具有化学式C3H8O或C3H7OH或CH3CHOHCH3的化合物。其是无色、易燃的化合物,具有强烈的气味。其是仲醇的最简单示例,其中醇碳原子连接至其他两个碳原子,有时示为(CH3)2CHOH。其是丙醇的结构异构体。其具有广泛的工业和家庭用途。
丙烯(propene,propylene)也称为甲基乙烯,是具有化学式C3H6的不饱和有机化合物。其具有一个双键,是烯烃类的烃中第二简单的成员。
丙烯由化石燃料(石油、天然气,以及在小得多的程度上由煤炭)生产。丙烯是炼油和天然气加工的副产物。
异丁烯
异丁烯(isobutene,isobutylene,也称为2-甲基丙烯)是具有工业意义的碳氢化合物。其是四碳支链烯烃(alkene,olefin),是丁烯(butylene,butene)的四种异构体之一。其在标准温度和压力下是无色可燃气体。
异丁烯用作生产各种产物的中间体。其分别在汽油含氧化合物甲基叔丁基醚(MTBE)和乙基叔丁基醚(ETBE)的制造中与甲醇和乙醇反应。与丁烷的烷基化生产另一种燃料添加剂异辛烷。异丁烯也用于生产甲基丙烯醛。异丁烯的聚合生产丁基橡胶(聚异丁烯)。通过使用异丁烯对苯酚进行Friedel-Crafts烷基化,生产抗氧化剂如丁基羟基甲苯(BHT)和丁基羟基茴香醚(BHA)。
通常通过叔丁醇脱水或异丁烷催化脱氢获得聚合物和化学级的异丁烯。通常通过将甲醇或乙醇与来自烯烃蒸汽裂解装置或炼油厂的丁烯流中含有的异丁烯反应,来生产汽油含氧化合物MTBE和ETBE。因为将醚与剩余的丁烯分离更简单,所以不在反应前分离异丁烯。
丝氨酸途径化合物
可以与MEG(或乙醇酸)联产的化合物包括丝氨酸途径化合物,例如丝氨酸、甘氨酸、单乙醇胺(MEA)和乙二胺(EDA)。
丝氨酸是非必需氨基酸,其可以在人体内合成。由于高度水溶性,丝氨酸在制药和化妆品工业的乳液中用作保湿剂。此外,丝氨酸在化学工业中有着巨大的市场,因为其可以转化为其他化学品,如塑料、清洁剂、膳食补充剂和各种其他产物。事实上,丝氨酸被提及为30种最有希望替代石油工业化学品的生物物质之一。
丝氨酸的α-脱羧产生乙醇胺,其是工业产物,用作除草剂、纺织、金属、清洁剂、塑料和个人护理产物工业的中间体,具有高达每年数百千吨的产量(Scott,E.等人(2007)Biomass in the manufacture of industrial products—the use of proteins andamino acids.Appl Microbiol Biotechnol.75(4):751-762)。
甘氨酸是最简单的氨基酸,对制药和工业应用很有价值。其作为添加剂包含在宠物食品和动物饲料中。对于人,甘氨酸作为甜味剂/增味剂出售。某些食品补充剂和蛋白质饮料含有甘氨酸。某些药物制剂包含甘氨酸,以改善药物的胃吸收。甘氨酸在抗酸剂、镇痛剂、止汗剂、化妆品和洗漱用品中用作缓冲剂。许多杂项产物使用甘氨酸或其衍生物,如生产橡胶海绵制品、肥料和金属络合剂。甘氨酸在合成各种化学产物中作为中间体也很有价值。其用于制造除草剂草甘膦。甘氨酸可以转化为草酸,其在纺织和纸浆工业以及废水处理中用作漂白剂。甘氨酸还广泛用于实验室研究中,例如凝胶电泳中。
乙二胺(EDA)(1,2-二氨基乙烷,C2H4(NH2)2)被大量用于生产许多工业化学品。其与羧酸(包括脂肪酸)、腈、醇(在高温下)、烷化剂、二硫化碳以及醛和酮形成衍生物。由于其具有两个胺的双功能性质,其容易形成杂环如咪唑烷。乙二胺最突出的衍生物是螯合剂EDTA,其通过涉及氰化物和甲醛的Strecker合成由乙二胺衍生而来。羟乙基乙二胺是另一种商业上重要的螯合剂。许多生物活性化合物和药物含有N-CH2-CH2-N键,包括一些抗组胺药。亚乙基双二硫代氨基甲酸盐是商业上重要的杀菌剂,商品名为代森锰(Maneb)、代森锰锌(Mancozeb)、代森锌(Zineb)和代森联(Metiram)。一些含有咪唑啉的杀菌剂衍生自乙二胺。乙二胺是常见的支气管扩张药氨茶碱中的成分,其用于溶解活性成分茶碱。乙二胺也已用于皮肤病制剂。当用作药物赋形剂时,由于显著的首过效应,口服给药后其生物利用度约为0.34。小于20%通过小便排泄消除。由于乙二胺含有两个胺基团,其是广泛使用的各种聚合物的前体。衍生自甲醛的缩合物是增塑剂。其广泛用于生产聚氨酯纤维。PAMAM类树枝状聚合物衍生自乙二胺。漂白活化剂四乙酰乙二胺由乙二胺生成。衍生物N,N-亚乙基双(硬脂酰胺)(EBS)是一种商业上有意义的脱模剂,以及汽油和机油中的表面活性剂。
乙二胺还用作:溶解蛋白质(如白蛋白和酪蛋白)的溶剂;某些电镀浴;涂料和冷却剂中的腐蚀抑制剂;用于彩色摄影显影的化学品、粘合剂(binder)、粘着剂(adhesive)、织物柔软剂、环氧树脂固化剂和染料。乙二胺二氢碘化物(EDDI)被加入动物饲料中作为碘化物的来源。
示例性的酶列于表1中,其可以用于本文公开的MEG或乙醇酸、或MEG和一种或多种联产品的生物合成途径中。
表1
Figure BDA0003310804120000271
Figure BDA0003310804120000281
Figure BDA0003310804120000291
Figure BDA0003310804120000301
Figure BDA0003310804120000311
Figure BDA0003310804120000321
Figure BDA0003310804120000331
Figure BDA0003310804120000341
Figure BDA0003310804120000351
Figure BDA0003310804120000361
乙醇醛还原酶(EC 1.1.1.77)
本公开描述了可以催化以下可逆反应的酶:
Figure BDA0003310804120000362
Figure BDA0003310804120000363
乙醇醛还原酶也可以称为乳醛还原酶、丙二醇氧化还原酶、(R)[或(S)]-丙烷-1,2-二醇:NAD+氧化还原酶或L-1,2-丙二醇氧化还原酶。
因此,在一些实施方案中,本公开提供了在乙二醇降解途径、乙二醇代谢和降解的超级途径、厌氧L-乳醛降解途径和/或岩藻糖和鼠李糖降解的超级途径中起作用的酶。在一个实施方案中,该酶可以使用Fe2+作为辅因子。
L-1,2-丙二醇氧化还原酶是铁依赖性III族脱氢酶。其将L-乳醛(L-岩藻糖和L-鼠李糖分解代谢途径的产物)厌氧还原为L-1,2-丙二醇,然后其从细胞中排出。
已解析了该酶的晶体结构,表明结构域交换的二聚体,金属、辅因子和底物结合位点可以位于其中。需要一个天冬氨酸和三个保守的组氨酸残基实现Fe2+的结合和酶促活性。
在体外,高浓度的NAD+可以重新活化该酶,Fe3+和抗坏血酸或Fe2+和H2O2的混合物可以有效失活该酶。保守的His277残基的金属催化氧化被认为是失活的原因。
FucO的表达能够实现工程化的β-氧化循环的单转逆转(one-turn reversal)。FucO活性有助于在工程化株中将异丁醛转化为异丁醇。
在具体的实施方案中,该酶将乙醇醛转化为MEG。在一些实施方案中,乙醇醛还原酶来自大肠杆菌。在一些实施方案中,乙醇醛还原酶由fucO基因编码。
在一个实施方案中,乙醇醛还原酶由获自微生物的一种或多种核酸分子编码,所述微生物选自大肠杆菌和酿酒酵母。在另一个实施方案中,一种或多种核酸分子选自gldA、GRE2、GRE3、yqhD、ydjG、fucO、yafB(dkgB)和/或yqhE(dkgA),或其同源物。在另一个实施方案中,一种或多种核酸分子是yqhD。在一些实施方案中,yqhD包含G149E突变。在进一步的实施方案中,乙醇醛还原酶包含选自SEQ ID NO:13、15、17、20、23、25、28、30和32的氨基酸序列。在一个仍进一步的实施方案中,乙醇醛还原酶由选自SEQ ID NO:12、14、16、18、19、21、22、24、26、27、29和31的核酸序列编码。
在一些实施方案中,产生乙醇酸的重组微生物在编码具有乙醇醛还原酶活性的酶的基因中包含缺失、插入或功能缺失突变,以防止乙醇醛转化为单乙二醇(MEG),而是使反应分流至乙醇醛转化为乙醇酸(GA)。在一些实施方案中,具有乙醇醛还原酶活性的酶来自大肠杆菌。在一些实施方案中,具有乙醇醛还原酶活性的酶由fucO基因或其同源物编码。
醛还原酶
许多醛还原酶可以用于将乙醇醛转化为MEG。
NADPH依赖性醛还原酶(YqhD)可以催化以下反应:
Figure BDA0003310804120000371
Figure BDA0003310804120000372
醛+NADP++H2O→羧酸酯+NADPH+2H+(EC 1.2.1.4)
Figure BDA0003310804120000373
Figure BDA0003310804120000374
YqhD是NADPH依赖性醛还原酶,其可能参与乙二醛解毒和/或是对脂质过氧化的非谷胱甘肽依赖性反应的一部分。
据报道,各种醇、醛、氨基酸、糖类和α-羟基酸已被测试为YqhD的底物。纯化的蛋白质仅显示了NADP依赖性的醇脱氢酶活性,具有对长于C(3)的醇的偏好,但具有毫摩尔范围内的Km值,表明其不是生理底物。相比之下,YqhD的确对底物如丙醛、乙醛和丁醛以及丙烯醛和丙二醛表现出短链醛还原酶活性。在代谢工程化株中,内源性醛还原酶YqhD、YjgB和YahK将苯乙醛和4-羟基苯乙醛被还原为2-苯乙醇和2-(4-羟苯基)乙醇。
YqhD的过表达增加了细胞的1,3-丙二醇氧化还原酶活性。已将大肠杆菌工程化以表达YqhD,用于1,3-丙二醇的工业生产。YqhD活性也有助于异丁醇、1,2-丙二醇、1,2,4-丁三醇和丙酮醇的生产。yqhD的突变能够实现通过工程化的β-氧化循环的单转逆转来生产丁醇。
YqhD具有糠醛还原酶活性,其表现出导致生长抑制,是由于从木质纤维素生物质生产乙醇的代谢工程化株中NADPH的消耗。
已以
Figure BDA0003310804120000381
的分辨率解析了YqhD的晶体结构。YqhD是二聚体的不对称二聚体,活性位点含有Zn2+离子。NADPH辅因子在烟酰胺环中的5和6位被羟基基团修饰。
yqhD的过表达导致对活性氧生成化合物(如过氧化氢、百草枯、铬酸盐和亚碲酸钾)的抗性增加。yqhD缺失突变体显示出对这些化合物和乙二醛的敏感性增加,并且含有的在脂质过氧化过程中生成的活性醛水平增加。相反,yqhD缺失导致糠醛耐受性增加。
在具体的实施方案中,NADPH依赖性醛还原酶将乙醇醛转化为MEG。在一些实施方案中,NADPH依赖性醛还原酶来自大肠杆菌。在一些实施方案中,NADPH依赖性醛还原酶由yqhD基因编码。
多功能甲基乙二醛还原酶(DkgA)可以催化以下反应:
Figure BDA0003310804120000382
Figure BDA0003310804120000383
Figure BDA0003310804120000384
2-酮-L-古洛糖酸+NADP+←2,5-双脱氢-D-葡萄糖酸+NADPH+H+(该反应有利于相反的方向,EC 1.1.1.346)
DkgA(YqhE)属于醛酮还原酶(AKR)家族,已表明具有甲基乙二醛还原酶和β-酮酯还原酶活性。
已报道了dkgA编码大肠杆菌中两种25DKG还原酶之一的2,5-二酮-D-葡萄糖酸还原酶(25DKGR)A。该酶使用NADPH作为优选的电子供体,并被认为参与酮葡萄糖酸代谢。据报道,该酶对2,5-二酮-D-葡萄糖酸的比活性比其对甲基乙二醛的活性低近1000倍。
由于其对NADPH的Km低,DkgA还原呋喃可能耗尽NADPH库,从而限制细胞生物合成。对醛还原酶的广泛调查表明,DkgA是几种内源性醛还原酶之一,其有助于降解代谢工程所需的醛终产物。
已以
Figure BDA0003310804120000391
的分辨率解析了DkgA的晶体结构。
在具体的实施方案中,多功能甲基乙二醛还原酶将乙醇醛转化为MEG。在一些实施方案中,多功能甲基乙二醛还原酶来自大肠杆菌。在一些实施方案中,多功能甲基乙二醛还原酶由dkgA基因编码。
多功能甲基乙二醛还原酶(DkgB)可以催化以下反应:
Figure BDA0003310804120000392
Figure BDA0003310804120000393
2-酮-L-古洛糖酸+NADP+←2,5-双脱氢-D-葡萄糖酸+NADPH+H+(该反应有利于相反的方向,EC 1.1.1.346)
DkgB(YafB)是醛酮还原酶(AKR)亚家族3F的成员。已表明DkgB具有2,5-二酮-D-葡萄糖酸还原酶、甲基乙二醛还原酶和4-硝基苯甲醛还原酶活性。
据报道,dkgB编码2,5-二酮-D-葡萄糖酸还原酶(25DKGR)B,是大肠杆菌中两种25DKG还原酶之一。该酶使用NADPH作为优选的电子供体,并被认为涉及酮葡萄糖酸代谢。然而,据报道,该酶对2,5-二酮-D-葡萄糖酸的比活性比其对甲基乙二醛的活性低近1000倍。
在具体的实施方案中,多功能甲基乙二醛还原酶将乙醇醛转化为MEG。在一些实施方案中,多功能甲基乙二醛还原酶来自大肠杆菌。在一些实施方案中,多功能甲基乙二醛还原酶由dkgB基因编码。
甲基乙二醛还原酶(YeaE)可以催化以下反应:
Figure BDA0003310804120000394
已表明YeaE具有甲基乙二醛还原酶活性。
YeaE的亚基结构尚未确定,但其氨基酸序列与醛酮还原酶DkgA(YqhE)和DkgB(YafB)的相似性表明其可能是单体的。
在具体的实施方案中,甲基乙二醛还原酶将乙醇醛转化为MEG。在一些实施方案中,甲基乙二醛还原酶来自大肠杆菌。在一些实施方案中,甲基乙二醛还原酶由yeaE基因编码。
L-甘油醛3-磷酸还原酶(yghZ)可以催化以下反应:
L-甘油醛3-磷酸+NADPH+H+→sn-甘油3-磷酸+NADP+(EC 1.1.1.-)
Figure BDA0003310804120000395
YghZ是L-甘油醛3-磷酸(L-GAP)还原酶。该酶还能够以低速率解毒甲基乙二醛。YghZ界定了AKR14(醛酮还原酶14)蛋白家族。
L-GAP不是天然代谢物,并对大肠杆菌有毒。L-GAP是大肠杆菌K-12的甘油-3-磷酸和己糖磷酸转运系统的底物。据推测,YghZ的生理作用是L-GAP的解毒作用,其可能由GAP的非酶促消旋化或由未知的细胞过程形成。
已确定大肠杆菌酶的晶体结构,认为是四聚体。然而,其他人已发现,基于凝胶过滤和电子显微镜研究,该蛋白质形成八聚体。
在具体的实施方案中,L-甘油醛3-磷酸还原酶将乙醇醛转化为MEG。在一些实施方案中,L-甘油醛3-磷酸还原酶来自大肠杆菌。在一些实施方案中,L-甘油醛3-磷酸还原酶由yghZ基因编码。
L-1,2-丙二醇脱氢酶/甘油脱氢酶(GldA)可以催化以下反应:
Figure BDA0003310804120000401
氨基丙酮+NADH+H+→(R)-1-氨基丙-2-醇+NAD+(EC 1.1.1.75)
Figure BDA0003310804120000402
GldA酶的生理功能长期以来一直不清楚。该酶作为甘油脱氢酶和D-1-氨基-2-丙醇:NAD+氧化还原酶被独立地分离。当时,认为D-1-氨基-2-丙醇是维生素B12生物合成的中间体,虽然大肠杆菌不能够从头合成维生素B12,但一直在寻找催化该化合物合成的酶。后来发现GldA负责这两项活性。
最近提出GldA的主要体内作用是通过将二羟基丙酮转化为甘油来去除二羟基丙酮。然而,最近还建立了在甘油发酵中的双重作用。可以通过两种不同的途径完成大肠杆菌中的甘油异化。甘油和甘油磷酸二酯降解途径需要末端电子受体的存在,并利用Glp系统的ATP依赖性激酶,该激酶将甘油磷酸化为甘油-3-磷酸。然而,在使激酶失活并选择以甘油生长后,发现连接NAD+的脱氢酶GldA能够支持甘油发酵。最近表明GldA既作为甘油脱氢酶参与甘油发酵,生产二羟基丙酮,也作为1,2-丙二醇脱氢酶参与甘油发酵,通过由丙酮生产1,2-丙二醇来再生NAD+。
该酶以两种催化活性形式存在,一种八个亚基的大型形式和一种两个亚基的小型形式。大型形式表现为主要类别。
在具体的实施方案中,L-1,2-丙二醇脱氢酶/甘油脱氢酶将乙醇醛转化为MEG。在一些实施方案中,L-1,2-丙二醇脱氢酶/甘油脱氢酶来自大肠杆菌。在一些实施方案中,L-1,2-丙二醇脱氢酶/甘油脱氢酶由gldA基因编码。
来自酿酒酵母的NADPH依赖性甲基乙二醛还原酶(GRE2)可以催化以下反应:
Figure BDA0003310804120000403
Figure BDA0003310804120000404
Gre2是一种多功能酶,其使用NADPH作为辅因子,催化广泛的底物的立体选择性还原,所述底物包括脂肪族和芳香族酮、二酮以及醛。
已以
Figure BDA0003310804120000411
的分辨率解析了apo形式的来自酿酒酵母的Gre2晶体结构,并以
Figure BDA0003310804120000412
的分辨率解析了NADPH复合形式的来自酿酒酵母的Gre2晶体结构。Gre2形成同源二聚体,其每个亚基含有参与底物识别的N-末端罗斯曼折叠(Rossmann-fold)结构域和可变C-末端结构域。与辅因子NADPH结合后诱导契合(fit)使该两个结构域向彼此移动,产生更适合底物的结构域间裂缝。计算模拟与定点诱变和酶活性分析相组合,能够表征潜在的底物结合口袋,其决定催化的严格底物立体选择性。
Gre2催化细胞毒性化合物甲基乙二醛(MG)不可逆地还原为(S)-乳醛,作为乙二醛酶I GLO1对MG解毒的替代方法。通过糖酵解旁路由磷酸二羟丙酮合成MG,据信MG在细胞周期调节和应激适应中发挥作用。GRE2还催化异戊醛还原为异戊醇。该酶通过调节异戊醛的水平来抑制异戊醇诱导的丝状形成(filamentation),细胞通过丝状形成来响应异戊醛信号。GRE2也参与麦角甾醇代谢。
在具体的实施方案中,NADPH依赖性甲基乙二醛还原酶将乙醇醛转化为MEG。在一些实施方案中,NADPH依赖性甲基乙二醛还原酶来自酿酒酵母。在一些实施方案中,NADPH依赖性甲基乙二醛还原酶由GRE2基因编码。
硫解酶/乙酰辅酶A乙酰转移酶(EC 2.3.1.9)
本公开描述了可以催化以下反应的酶:
Figure BDA0003310804120000413
硫解酶/乙酰辅酶A乙酰转移酶也可以称为乙酰辅酶A-C-乙酰转移酶、乙酰乙酰辅酶A硫解酶、乙酰辅酶A:乙酰辅酶AC-乙酰转移酶或硫解酶II。
因此,在一些实施方案中,本公开提供了在乙酰乙酸降解(至乙酰辅酶A)中起作用的酶。在一个实施方案中,该酶的抑制剂可以是乙酰乙酰辅酶A。
在具体的实施方案中,该酶将乙酰辅酶A转化为乙酰乙酰辅酶A。在一个实施方案中,硫解酶或乙酰辅酶A乙酰转移酶由一种或多种获自微生物的核酸分子编码,所述微生物选自梭菌属物种、芽孢杆菌属物种、大肠杆菌、酵母属物种和海杆菌属物种(Marinobactersp.)。在一些实施方案中,硫解酶或乙酰辅酶A乙酰转移酶由一种或多种获自微生物的核酸分子编码,所述微生物选自丙酮丁醇梭菌、热解糖梭菌(Clostridiumthermosaccharolyticum)、蜡状芽孢杆菌(Bacillus cereus)、大肠杆菌、酿酒酵母和除烃海杆菌(Marinobacter hydrocarbonoclasticus)。在一些实施方案中,所述一种或多种核酸分子是thlA、atoB和/或ERG10,或其同源物。在进一步的实施方案中,硫解酶或乙酰辅酶A乙酰转移酶包含选自SEQ ID NO:35、37和40的氨基酸序列。在一个仍进一步的实施方案中,硫解酶或乙酰辅酶A乙酰转移酶由选自SEQ ID NO:33、34、36、38和39的核酸序列编码。
乙酰辅酶A:乙酰乙酰辅酶A转移酶(EC 2.8.3.-)
本公开描述了可以催化以下反应的酶:
Figure BDA0003310804120000421
乙酰辅酶A:乙酰乙酰辅酶A转移酶也可以称为乙酸:乙酰乙酰辅酶A转移酶或乙酰乙酰辅酶A转移酶。
因此,在一些实施方案中,本公开提供了在乙酰乙酸降解(至乙酰辅酶A)中起作用的酶。在一个实施方案中,该酶的抑制剂可以包括乙酰辅酶A和辅酶A。
大肠杆菌以短链脂肪酸(C3-C6)生长,需要将这些酸活化成各自的硫酯。乙酰乙酰辅酶A转移酶催化该活化。该反应发生在两个半反应中,其中涉及共价酶-辅酶A。该酶在反应过程中经历了两个可检测的构象变化。认为该反应可能通过乒乓机制(ping-pongmechanism)进行。该酶可以利用多种短链酰基辅酶A和羧酸底物,但对正常的和3-酮底物表现出最大活性。
在具体的实施方案中,该酶将乙酰乙酰辅酶A转化为乙酰乙酸。在一些实施方案中,乙酰辅酶A:乙酰乙酸辅酶A转移酶来自梭菌属物种。在一些实施方案中,乙酰辅酶A:乙酰乙酸辅酶A转移酶来自丙酮丁醇梭菌。在一些实施方案中,乙酰辅酶A:乙酰乙酸辅酶A转移酶来自大肠杆菌。在一些实施方案中,乙酰辅酶A:乙酰乙酸辅酶A转移酶由atoA和atoD基因编码。在另一个实施方案中,乙酰乙酰辅酶A转移酶的亚基组成是[(AtoA)2][(AtoD)2],其中(AtoA)2是β复合物,(AtoD)2是α复合物。在一个实施方案中,乙酰辅酶A:乙酰乙酸辅酶A转移酶是融合的乙酰辅酶A:乙酰乙酸辅酶A转移酶:α亚基/β亚基。在另一个实施方案中,乙酰辅酶A:乙酰乙酸辅酶A转移酶由ydiF基因编码。
乙酸:乙酰乙酰辅酶A水解酶(EC 3.1.2.11)
本公开描述了可以催化以下反应的酶:
Figure BDA0003310804120000422
乙酰乙酰辅酶A水解酶(acetoacetyl-CoA hydrolase)也可以称为乙酰乙酰辅酶A水解酶(acetoacetyl coenzyme A hydrolase)或乙酰乙酰辅酶A脱酰酶(acetoacetyl CoAdeacylase或acetoacetyl coenzyme A deacylase)。
该酶属于水解酶家族,具体为那些作用于硫酯键的酶。
在具体的实施方案中,该酶将乙酰乙酰辅酶A转化为乙酰乙酸。在一些实施方案中,乙酸:乙酰乙酰辅酶A水解酶来自梭菌属物种。在一些实施方案中,乙酸:乙酰乙酰辅酶A水解酶来自丙酮丁醇梭菌。在另一个实施方案中,乙酰乙酰辅酶A水解酶由ctfA(亚基A)和/或ctfB(亚基B)基因编码。
在进一步的实施方案中,乙酰辅酶A:乙酰乙酸辅酶A转移酶或乙酸:乙酰乙酰辅酶A水解酶包含选自SEQ ID NO:43、46、97、99、101和103的氨基酸序列。在一个仍进一步的实施方案中,乙酰辅酶A:乙酰乙酸辅酶A转移酶或乙酸:乙酰乙酰辅酶A水解酶由选自SEQ IDNO:41、42、44、45、96、98、100和102的核酸序列编码。
乙酰乙酸脱羧酶(EC 4.1.1.4)
本公开描述了可以催化以下反应的酶:
乙酰乙酸+H+→丙酮+CO2
乙酰乙酸脱羧酶也可以称为ADC、AADC或乙酰乙酸羧基裂解酶。
因此,在一些实施方案中,本公开提供了在异丙醇生物合成、丙酮酸发酵为丙酮、丙酮丁醇梭菌产酸和产溶剂发酵的超级途径和/或丙酮丁醇梭菌产溶剂发酵的超级途径中起作用的酶。
乙酰乙酸脱羧酶(ADC)在丙酮丁醇梭菌的溶剂生产中起关键作用。在生长的产酸阶段,酸积累导致代谢转变为溶剂生产。在这个阶段,酸被重新吸收和代谢以生产丙酮、丁醇和乙醇。
该酶的初步纯化和结晶揭示了活性位点中涉及赖氨酸残基。该酶是由单一类型亚基的12个拷贝组成的大型复合物。
已纯化了丙酮丁醇梭菌ATCC 824的该酶,并克隆了编码其的adc基因。也已从相关株丙酮丁醇梭菌DSM 792中纯化该酶,并对基因进行了克隆和测序。脱羧反应通过形成席夫碱(Schiff base)中间体进行。
ADC是酸摄入的关键酶,其有效地将辅酶A转移酶反应拉向乙酰乙酸形成的方向。
在具体的实施方案中,该酶将乙酰乙酸转化为丙酮。在一个实施方案中,乙酰乙酸脱羧酶由一种或多种获自微生物的核酸分子编码,所述微生物选自梭菌属物种、芽孢杆菌属物种、色杆菌属物种(Chromobacterium sp.)和假单胞菌属物种。在另一个实施方案中,乙酰乙酸脱羧酶由一种或多种获自微生物的核酸分子编码,所述微生物选自丙酮丁醇梭菌、拜氏梭菌(Clostridium beijerinckii)、解纤维素梭菌(Clostridiumcellulolyticum)、多粘芽孢杆菌(Bacillus polymyxa)、紫色色杆菌(Chromobacteriumviolaceum)和恶臭假单胞菌(Pseudomonas putida)。在一些实施方案中,编码乙酰乙酸脱羧酶的一种或多种核酸分子是adc,或其同源物。在进一步的实施方案中,乙酰乙酸脱羧酶包含选自SEQ ID NO:49和52的氨基酸序列。在一个仍进一步的实施方案中,乙酰乙酸脱羧酶由选自SEQ ID NO:47、48、50和51的核酸序列编码。
醇脱氢酶(EC 1.1.1.-)
本公开描述了可以分别催化伯醇或仲醇可逆氧化为醛或酮的酶。在一个实施方案中,该酶是仲醇脱氢酶(S-ADH)并且催化酮(如丙酮)还原为仲醇(如2-丙醇(异丙醇))。
在一些实施方案中,S-ADH来自伯克霍尔德氏菌属物种(Burkholderia sp.)。在一些实施方案中,S-ADH来自伯克霍尔德氏菌属物种(Burkholderia sp.)AIU 652。在一些实施方案中,S-ADH来自产碱杆菌属物种(Alcaligenes sp.)。在一些实施方案中,S-ADH来自真养产碱杆菌(Alcaligenes eutrophus)。在一些实施方案中,S-ADH来自梭菌属物种。在一些实施方案中,S-ADH来自拉格利梭菌(Clostridium ragsdalei)。在一些实施方案中,S-ADH来自拜氏梭菌。在一些实施方案中,S-ADH来自嗜热厌氧杆菌属物种(Thermoanaerobacter sp.)。在一些实施方案中,S-ADH来自布氏嗜热厌氧杆菌(Thermoanaerobacter brockii)。在一些实施方案中,S-ADH来自嗜热厌氧乙醇杆菌(Thermoanaerobacter ethanolicus)(热氢硫酸梭菌Clostridiumthermohydrosulfuricum)。在一些实施方案中,S-ADH由adhB基因编码。在一些实施方案中,S-ADH来自锥虫植生滴虫属物种(Phytomonas sp.)。在一些实施方案中,S-ADH来自红球菌属物种(Rhodococcus sp.)。在一些实施方案中,S-ADH来自赤红球菌(Rhodococcusruber)。在一些实施方案中,S-ADH来自沼泽产甲烷菌(Methanobacterium palustre)。在一些实施方案中,S-ADH来自产甲烷古细菌泥游产甲烷菌(Methanogenium liminatans)。在一些实施方案中,S-ADH来自寄生原生生物溶组织内阿米巴(Entamoeba histolytica,EhAdh1)。在一些实施方案中,S-ADH来自寄生原生动物猫毛滴虫(Tritrichomonasfoetus)。在一些实施方案中,S-ADH来自人寄生虫阴道毛滴虫(Trichomonas vaginalis)。
在一些实施方案中,根据同源性预测S-ADH,并且S-ADH可以来自马瑞氏热厌氧杆菌(Thermoanaerobacter mathranii)、藤黄微球菌(Micrococcus luteus)、白色拟诺卡氏菌(Nocardiopsis alba)、黑森分枝杆菌(Mycobacterium hassiacum)、猪螺杆菌(Helicobacter suis)、白色念珠菌、近平滑念珠菌(Candida parapsilosis)、拟平滑念珠菌(Candida orthopsilosis)、似平滑念珠菌(Candida metapsilosis)、长喙壳菌(Grosmannia clavigera)和Scheffersomyces stipitis。
在一些实施方案中,醇脱氢酶与来自梭菌的醇脱氢酶具有至少70%的序列同一性、至少80%的序列同一性或至少90%的序列同一性。在其他实施方案中,醇脱氢酶是选自拜氏梭菌(Clostridium beijerinckii)adh和食碳梭菌(Clostridiumcarboxidivorans)adh的醇脱氢酶。在进一步的实施方案中,醇脱氢酶包含选自SEQ ID NO:138和140的氨基酸序列。在一个仍进一步的实施方案中,醇脱氢酶由选自SEQ ID NO:136、137和139的核酸序列编码。
脱水酶(EC 4.2.1.-)
本公开描述了可以催化以下反应的酶:
Figure BDA0003310804120000441
D-木糖异构酶(EC 5.3.1.5)
本公开描述了可以催化以下可逆反应的酶:
Figure BDA0003310804120000442
D-木糖异构酶也可以称为木糖异构酶或D-木糖酮醇异构酶。
因此,在一些实施方案中,本公开提供了在木糖降解中起作用的酶。
木糖异构酶催化D-木糖分解代谢的第一个反应。
已表明两个保守的组氨酸残基H101和H271是催化活性所必需的。在木糖结合期间,两个保守的色氨酸残基W49和W188的荧光被淬灭,并且已表明W49是催化活性所必需的。Mg2+、Mn2+或Co2+的存在保护酶免于热变性。
亚基组成尚未通过实验确定。
在具体的实施方案中,该酶将D-木糖转化为D-木酮糖。在一个实施方案中,重组微生物进一步包含内源性或外源性木糖异构酶,其催化D-木糖转化为D-木酮糖。在一个实施方案中,木糖异构酶是外源的。在另一个实施方案中,木糖异构酶由获自Pyromyces sp.或大肠杆菌的一种或多种核酸分子编码。在另一个实施方案中,编码木糖异构酶的一种或多种核酸分子是xylA或其同源物。在又一个实施方案中,编码木糖异构酶的一种或多种核酸分子包含选自SEQ ID NO:95和144的氨基酸序列。在一个进一步的实施方案中,编码木糖异构酶的一种或多种核酸分子由选自SEQ ID NO:93、94和143的核酸序列编码。
在一些实施方案中,生产MEG或GA或任选MEG或GA和一种或多种联产品的重组微生物,在编码D-木糖异构酶的基因中包含缺失、插入或功能缺失突变,以防止D-木糖转化为D-木酮糖,而将反应分流至D-木糖转化为D-木糖酸。
D-木酮糖5-激酶/木酮糖激酶
本公开描述了可以催化以下反应的酶:
D-木酮糖+ATP→D-木酮糖5-磷酸+ADP+H+(EC 2.7.1.17)
ATP+1-脱氧-D-木酮糖→1-脱氧-D-木酮糖5-磷酸+ADP+H+(EC 2.7.1.-)
D-木酮糖5-激酶也可以称为木酮糖激酶(xylulose kinase或xylulokinase)。
木酮糖激酶催化D-木酮糖的磷酸化,这是木糖降解途径的第二步,生产磷酸戊糖途径的中间体D-木酮糖-5-磷酸。
在没有底物的情况下,木酮糖激酶的ATPase活性很弱。木酮糖激酶还可以催化1-脱氧-D-木酮糖的磷酸化。这将允许潜在的补救途径用于生成1-脱氧-D-木酮糖5-磷酸,其用于萜类、硫胺素和吡哆醛的生物合成。1-脱氧-D-木酮糖的磷酸化速率比D-木酮糖的磷酸化速率低32倍。
已经研究了该细菌酶的动力学机制,表明主要是有序的反应机制。该酶在与底物和ATP结合后发生显著的构象变化。已证明两个保守的天冬氨酸残基D6和D233是催化活性所必需的,并提出了催化机制。
已分别以
Figure BDA0003310804120000451
Figure BDA0003310804120000452
的分辨率确定了apo形式的和与D-木酮糖结合的细菌木酮糖激酶的晶体结构。
在具体的实施方案中,该酶将D-木酮糖转化为D-木酮糖-5-磷酸。在一些实施方案中,D-木酮糖5-激酶来自大肠杆菌。在一些实施方案中,D-木酮糖5-激酶由xylB基因编码。在一些实施方案中,D-木酮糖5-激酶来自酿酒酵母。在一些实施方案中,D-木酮糖5-激酶由XKS1基因编码。在一些实施方案中,D-木酮糖5-激酶来自树干毕赤酵母(Pichiastipitis)。在一些实施方案中,D-木酮糖5-激酶由XYL3基因编码。
在一些实施方案中,D-木酮糖5-激酶由与来自大肠杆菌的xylB具有至少70%序列同一性的氨基酸序列编码。在一个进一步的实施方案中,D-木酮糖5-激酶由与来自大肠杆菌的xylB具有至少80%序列同一性的氨基酸序列编码。在一个仍进一步的实施方案中,D-木酮糖5-激酶由与来自大肠杆菌的xylB具有至少90%序列同一性的氨基酸序列编码。在其他实施方案中,D-木酮糖5-激酶是来自大肠杆菌的xylB。
在一个实施方案中,D-木酮糖5-激酶由一种或多种获自大肠杆菌的核酸分子编码。在一些实施方案中,编码D-木酮糖5-激酶的一种或多种核酸分子是xylB或其同源物。在另一个实施方案中,编码D-木酮糖5-激酶的一种或多种核酸分子包含SEQ ID NO:146中列出的氨基酸序列。在一个进一步的实施方案中,编码D-木酮糖5-激酶的一种或多种核酸分子由SEQ ID NO:145中列出的核酸序列编码。
在一些实施方案中,核酮糖激酶催化D-核酮糖磷酸化为D-核酮糖-5-磷酸。在一些实施方案中,核酮糖激酶由大肠杆菌AraB编码。在一些实施方案中,核酮糖激酶由与来自大肠杆菌的AraB(SEQ ID NO:288)具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的核酸序列编码。
在一些实施方案中,核糖激酶催化D-核糖磷酸化为D-核糖-5-磷酸。在一些实施方案中,核糖激酶由大肠杆菌rbsK编码。在一些实施方案中,核酮糖激酶由与来自大肠杆菌的rbsK(SEQ ID NO:290)具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的核酸序列编码。
在一些实施方案中,木酮糖激酶催化D-木酮糖磷酸化为D-木酮糖-5-磷酸。在一些实施方案中,核糖激酶由海栖热袍菌(T.maritima)XuK编码。在一些实施方案中,核酮糖激酶由与来自海栖热袍菌的XuK(SEQ ID NO:291)具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的核酸序列编码。
乙醇醛脱氢酶(1.2.1.21)
本公开描述了可以催化以下反应的酶:
Figure BDA0003310804120000461
该酶属于氧化还原酶家族,具体为那些以NAD+或NADP+作为受体作用于供体的醛或氧代基团的酶。该酶参与乙醛酸和二羧酸代谢。
乙醇醛脱氢酶(glycolaldehyde dehydrogenase)也可以称为乙醇醛:NAD+氧化还原酶或乙醇醛脱氢酶(glycol aldehyde dehydrogenase)。
在大肠杆菌中,醛脱氢酶A(AldA)是一种对小α-羟基醛底物具有相对广泛底物特异性的酶。其因此在多种代谢途径中被利用。
L-岩藻糖和L-鼠李糖通过平行途径代谢,所述途径在其相应的醛缩酶反应后汇聚,产生相同的产物:磷酸二羟丙酮和L-乳醛。有氧地,醛脱氢酶A将L-乳醛氧化为L-乳酸。
在利用相同酶的平行途径中,D-阿拉伯糖和L-木糖可以代谢为磷酸二羟丙酮和乙醇醛,醛脱氢酶A将乙醇醛氧化为乙醇酸。
已解析了单独的酶以及三元和二元复合物的晶体结构。
醛脱氢酶A仅在有氧条件下存在,并且在岩藻糖、鼠李糖或谷氨酸的存在下被最高度地诱导。NADH抑制该酶,NADH可以作为开关,从氧化乳醛转变为通过丙二醇氧化还原酶还原乳醛。在对葡萄糖限制的短期适应期间,AldA被上调。
基于序列相似性,预测AldA为琥珀酸半醛脱氢酶。
已研究了aldA表达的调节。该基因受以下调节:分解代谢物的抑制、在厌氧条件下通过ArcA的抑制和碳源的诱导。
在具体的实施方案中,该酶将乙醇醛转化为乙醇酸。在一些实施方案中,乙醇醛脱氢酶来自大肠杆菌。在一些实施方案中,乙醇醛脱氢酶由aldA基因编码。
在一些实施方案中,生产MEG或乙醇酸、或MEG和一种或多种联产品的重组微生物,在编码乙醇醛脱氢酶的基因中包含缺失、插入或功能缺失突变,以防止由乙醇醛生产乙醇酸,而将反应分流至乙醇醛转化为MEG。在一些实施方案中,催化乙醇醛转化为乙醇酸的乙醇醛脱氢酶活性是部分缺失、破坏、突变和/或降低的,其中仍然生产一定量的乙醇酸。
在其他实施方案中,生产乙醇酸的重组微生物包含或表达至少一种编码乙醇醛脱氢酶的核酸分子。
乳酸脱氢酶(1.1.1.28)
本公开描述了可以催化以下反应的酶:
(R)-乳酸+NAD+←丙酮酸+NADH+H+
乳酸脱氢酶(LDH)是存在于几乎所有活细胞中的酶,如存在于动物、植物和原核生物中。LDH催化乳酸转化为丙酮酸和反向,以及催化NADH转化为NAD+和反向。脱氢酶是将氢化物从一个分子转移至另一个分子的酶。
存在四种不同酶类的LDH。最常见的一种是NAD(P)依赖性L-乳酸脱氢酶。其他LDH作用于D-乳酸和/或依赖于细胞色素c:D-乳酸脱氢酶(细胞色素)和L-乳酸脱氢酶(细胞色素)。
LDH具有医学意义,因为其广泛存在于身体组织中,如血细胞和心肌。因为其在组织损伤期间释放,所以其是常见损伤和疾病(如心力衰竭)的标志。
乳酸脱氢酶(lactate dehydrogenase)也可以称为乳酸脱氢酶(lactic aciddehydrogenase)、(R)-乳酸:NAD+氧化还原酶或发酵D-乳酸脱氢酶。
在大肠杆菌中,乳酸脱氢酶(LdhA)是可溶性的连接NAD的乳酸脱氢酶(LDH),其特异性生产D-乳酸。LdhA是同源四聚体,在较高pH条件下显示正同向协同性。
大肠杆菌含有另外两种乳酸脱氢酶:D-乳酸脱氢酶和L-乳酸脱氢酶。两者都是以乳酸有氧生长所需的膜相关黄素蛋白。
LdhA在有氧条件下存在,但当大肠杆菌在酸性pH和厌氧条件下以各种糖生长时被诱导。与大多数参与厌氧呼吸的基因不同,ldhA不受Fnr激活;相反,ArcAB系统和数个参与控制碳水化合物代谢的基因(csrAB和mlc)显示出调节表达。ldhA的表达受到转录调节因子ArcA的负向影响。ldhA属于σ32调节子。
ldhA基因是代谢工程中突变的常见靶点,最常是为了消除不需要的发酵副产物的生产,但也是为了特别生产D-乳酸。
在具体的实施方案中,该酶将丙酮酸转化为乳酸。在一些实施方案中,乳酸脱氢酶来自大肠杆菌。在一些实施方案中,乳酸脱氢酶由ldhA基因编码。
在一些实施方案中,生产MEG或GA、或MEG和一种或多种联产品的重组微生物,在编码乳酸脱氢酶的基因中包含缺失、插入或功能缺失突变,以防止由丙酮酸生产乳酸,而将反应分流至生产一种或多种联产品。
可溶性吡啶核苷酸转氢酶(EC 1.6.1.1.)
本公开描述了可以催化以下反应的酶:
Figure BDA0003310804120000481
可溶性吡啶核苷酸转氢酶也可以称为NAD(P)+转氢酶(B-特异性)、STH、吡啶核苷酸转氢酶或转氢酶。
大肠杆菌含有可溶性和膜结合吡啶核苷酸转氢酶。可溶性吡啶核苷酸转氢酶是sthA或udhA基因的产物;其主要生理作用表现为NADPH的再氧化。膜结合质子转运转氢酶是pntAB基因的产物;PntAB是NADPH的主要来源。
UdhA含有非共价结合的FAD,并以由七个或八个单体组成的形式存在。UdhA(SthA)的适度过表达允许磷酸葡萄糖异构酶突变体的最大生长速率增加,而pgi sthA双突变体不能存活。这些表型可能是由于UdhA在NADPH形成过多的条件下恢复细胞氧化还原平衡的能力。sthA中的突变出现在pgi突变株适应以葡萄糖基础介质生长的过程中。以甘油生长下调sthA的转录。
在一些实施方案中,转氢酶的表达可以增加NADPH依赖性醇脱氢酶的活性,导致丙酮转化为2-丙醇提高。在一个实施方案中,可溶性吡啶核苷酸转氢酶由一种或多种获自大肠杆菌的核酸分子编码。在另一个实施方案中,编码可溶性吡啶核苷酸转氢酶的一种或多种核酸分子是udhA,或其同源物。在一些实施方案中,编码可溶性吡啶核苷酸转氢酶的一种或多种核酸分子包含SEQ ID NO:142中列出的氨基酸序列。在一些实施方案中,编码可溶性吡啶核苷酸转氢酶的一种或多种核酸分子由SEQ ID NO:141中列出的核酸序列编码。
羟甲基戊二酰辅酶A合酶(EC 2.3.3.-)
本公开描述了可以催化以下反应的酶:
Figure BDA0003310804120000482
羟甲基戊二酰辅酶A合酶也可以称为(S)-3-羟基-3-甲基戊二酰辅酶A乙酰乙酰辅酶A-裂解酶(辅酶A-乙酰化)、3-羟基-3-甲基戊二酰辅酶A合成酶(3-hydroxy-3-methylglutaryl CoA synthetase,3-hydroxy-3-methylglutaryl coenzyme Asynthetase)、3-羟基-3-甲基戊二酰辅酶A合酶(3-hydroxy-3-methylglutaryl coenzymeA synthase,3-hydroxy-3-methylglutaryl-CoA synthase,3-hydroxy-3-methylglutaryl-coenzyme A synthase)、β-羟基-β-甲基戊二酰辅酶A合酶、HMG-辅酶A合酶、乙酰乙酰辅酶A转乙酰酶、羟甲基戊二酰辅酶A合酶和羟甲基戊二酰辅酶A缩合酶。
羟甲基戊二酰辅酶A合酶催化乙酰辅酶A与乙酰乙酰辅酶A缩合形成(S)-3-羟基-3-甲基戊二酰辅酶A,这是胆固醇前体(R)-甲羟戊酸合成的早期阶段。
该酶催化可以分为四个步骤的复杂反应。第一步涉及酶-乙酰辅酶A二元复合物的形成,随后乙酰基团从辅酶A硫酯转移至酶上的半胱氨酸残基,形成硫酯酰基-酶中间体。在下一步中,现在已还原的辅酶A解离,第二底物乙酰乙酰辅酶A与酶结合。第三步涉及通过从乙酰半胱氨酸的甲基中去除质子来形成碳负离子。然后,活化的乙酰半胱氨酸与乙酰乙酰辅酶A配体的γ-碳进行类克莱森(Claisen-like)缩合,形成HMG-辅酶A,同时保留与酶的硫酯键。最后一步包括该键的水解,产生游离的HMG-辅酶A。
已克隆和测序了来自人的HMGCS1基因(Russ AP等人(1992)Amplification anddirect sequencing of a cDNA encoding human cytosolic3-hydroxy-3-methylglutaryl-coenzyme A synthase.Biochim Biophys Acta 1132(3):329-31)。该基因在大肠杆菌中表达,并已纯化和表征该重组蛋白(Rokosz LL等人(1994)Humancytoplasmic 3-hydroxy-3-methylglutaryl coenzyme A synthase:expression,purification,and characterization of recombinant wild-type and Cys129mutantenzymes.Arch Biochem Biophys 312(1):1-13)。该酶是120kDa的同源二聚体。通过形成共价乙酰-酶中间体进行催化。动力学数据表明两种底物(乙酰辅酶A和乙酰乙酰辅酶A)竞争结合同一位点。
在一个实施方案中,羟甲基戊二酰辅酶A合酶可以具有3-羟基异戊酸(3HIV)合酶活性,并且可以催化以下反应:
Figure BDA0003310804120000491
在一个实施方案中,3HIV合酶由一种或多种获自微生物的核酸分子编码,所述微生物选自鼠属物种(Mus sp.)、酵母属物种、乳杆菌属物种和单胞菌属物种(Polaromonassp.)。在另一个实施方案中,3HIV合酶由一种或多种获自微生物的核酸分子编码,所述微生物选自小鼠、酿酒酵母、卷曲乳杆菌(Lactobacillus crispatus)和食萘极地单胞菌(Polaromonas naphthalenivorans)。在一些实施方案中,编码3HIV合酶的一种或多种核酸分子选自Hmgcs1、ERG13、PksG和/或Pnap_0477,或其同源物。在一个进一步的实施方案中,编码3HIV合酶的一种或多种核酸分子包含选自SEQ ID NO:105、107、109和111的氨基酸序列。在又一个实施方案中,编码3HIV合酶的一种或多种核酸分子由选自SEQ ID NO:104、106、108和110的核酸序列编码。在一些实施方案中,编码羟甲基戊二酰辅酶A合酶的一种或多种核酸分子是hmgS,或其同源物。在一个进一步的实施方案中,编码羟甲基戊二酰辅酶A合酶的一种或多种核酸分子包含SEQ ID NO:123中列出的氨基酸序列。在又一个实施方案中,编码羟甲基戊二酰辅酶A合酶的一种或多种核酸分子由SEQ ID NO:122中列出的核酸序列编码。
甲基戊烯二酰辅酶A水合酶(EC 4.2.1.18)
本公开描述了可以催化以下反应的酶:
Figure BDA0003310804120000501
该酶在亮氨酸降解途径中催化3-甲基戊烯二酰辅酶A顺式水合(syn-hydration)为(S)-3-羟基-3-甲基戊二酰辅酶A。已在恶臭假单胞菌中表征该细菌酶。其与哺乳动物酶的不同之处在于,其活性位点只具有一个谷氨酰残基而不是两个,从而导致不同的反应机制。这些酶是巴豆酸酶(crotonase)超家族的成员(Wong BJ和Gerlt JA(2004)Evolutionof function in the crotonase superfamily:(3S)-methylglutaconyl-CoA hydratasefrom Pseudomonas putida.Biochemistry 43(16):4646-4654),并综述于(Hamed RB等人(2008)Mechanisms and structures of crotonase superfamily enzymes--how naturecontrols enolate and oxyanion reactivity.Cell Mol Life Sci 65(16):2507-2527)中。
在大肠杆菌中表达、纯化和表征了该重组酶。通过ESI-MS确定10-His标记多肽的表观分子量为32.251kDa。随后在对酶进行表征之前去除10-His标签(Wong和Gerlt,2004)。
在一个实施方案中,甲基戊烯二酰辅酶A水合酶由获自假单胞菌属物种的一种或多种核酸分子编码。在另一个实施方案中,甲基戊烯二酰辅酶A水合酶由获自恶臭假单胞菌的一种或多种核酸分子编码。在一些实施方案中,编码甲基戊烯二酰辅酶A水合酶的一种或多种核酸分子是liuC,或其同源物。在一个进一步的实施方案中,编码甲基戊烯二酰辅酶A水合酶的一种或多种核酸分子包含SEQ ID NO:125中列出的氨基酸序列。在又一个实施方案中,编码甲基戊烯二酰辅酶A水合酶的一种或多种核酸分子由SEQ ID NO:124中列出的核酸序列编码。
甲基巴豆酰辅酶A羧化酶(EC 6.4.1.4)
本公开描述了可以催化以下反应的酶:
Figure BDA0003310804120000502
该酶活性与3-甲基巴豆酰辅酶A羧化酶复合物有关。该酶是含有生物素的生物素依赖性羧化酶,其参与铜绿假单胞菌(Pseudomonas aeruginosa)PAO1的L-亮氨酸(和异戊酸)降解途径。该途径也是无环萜烯利用途径(香茅醇降解和顺式-香叶辅酶A降解途径)的最后阶段。该酶不在以香茅醇或香茅酸生长的细胞中表达,但在以异戊酸生长的细胞中表达。基因liuB和liuD编码3-甲基巴豆酰辅酶A羧化酶的两个亚基。这些亚基编码于该生物体的liuRABCDE基因簇中(Hoschle B等人(2005)Methylcrotonyl-CoA and geranyl-CoAcarboxylases are involved in leucine/isovalerate utilization(Liu)and acyclicterpene utilization(Atu),and are encoded by liuB/liuD and atuC/atuF,inPseudomonas aeruginosa.Microbiology 151(Pt11):3649-3656;Forster-Fromme K和Jendrossek D(2010).Catabolism of citronellol and related acyclic terpenoidsin pseudomonads.Appl Microbiol Biotechnol 87(3):859-869)。
通过亲和素亲和层析从细胞提取物中纯化该酶,并对SDS凝胶分离的亚基进行胰蛋白酶指纹分析和ESI-MS,使得可以鉴定其相应的基因(Hoschle等人,2005)。
更早的工作中表征了香茅醇假单胞菌(Pseudomonas citronellolis)的3-甲基巴豆酰辅酶A羧化酶(Hector ML和Fall RR(1976)Multiple acyl-coenzyme A carboxylasesin Pseudomonas citronellolis.Biochemistry 15(16):3465-3472;Fall RR和Hector ML(1977)Acyl-coenzyme A carboxylases.Homologous 3-methylcrotonyl-CoA andgeranyl-CoA carboxylases from Pseudomonas citronellolis.Biochemistry 16(18):4000-4005;Fall RR(1981)3-Methylcrotonyl-CoA and geranyl-CoA carboxylases fromPseudomonas citronellolis.Methods Enzymol 71Pt C:791-799)。
在一个实施方案中,甲基巴豆酰辅酶A羧化酶由获自假单胞菌属物种的一种或多种核酸分子编码。在另一个实施方案中,甲基巴豆酰辅酶A羧化酶由获自铜绿假单胞菌的一种或多种核酸分子编码。在一些实施方案中,编码甲基巴豆酰辅酶A羧化酶的一种或多种核酸分子选自liuB和/或liuD,或其同源物。在一个进一步的实施方案中,编码甲基巴豆酰辅酶A羧化酶的一种或多种核酸分子包含选自SEQ ID NO:127和129的氨基酸序列。在又一个实施方案中,编码甲基巴豆酰辅酶A羧化酶的一种或多种核酸分子由SEQ ID NO:126和128的核酸序列编码。
甲基巴豆酰辅酶A水合酶(EC 4.2.1.17)
本公开描述了可以催化以下反应的酶:
Figure BDA0003310804120000511
示例性酶是3-酮酰辅酶A硫解酶。其通过β-氧化循环参与脂肪酸的降解。其对底物具有广泛的链长特异性,尽管其对中链底物表现出最高的活性。其是多酶复合物的一部分,由fadA基因编码(Yang SY等人(1990)Nucleotide sequence of the fadA gene.Primarystructure of 3-ketoacyl-coenzyme A thiolase from Escherichia coli and thestructural organization of the fadAB operon.J Biol Chem 265(18):10424-10429;http://www.ncbi.nlm.nih.gov/pubmed/7024730;Binstock JF和Schulz H(1981)Fattyacid oxidation complex from Escherichia coli.Methods Enzymol 71 Pt C:403-11)。
3-酮酰辅酶A硫解酶也可以称为乙酰辅酶A C-酰基转移酶、β-酮硫解酶、乙酰辅酶A酰基转移酶和酰基辅酶A:乙酰辅酶A C-酰基转移酶。
另一种示例性酶是烯酰辅酶A水合酶。α亚基有四种与之相关的酶活性。其是多酶复合物的一部分。其中两种活性,烯酰辅酶A水合酶(EC 4.2.1.17)和3-OH酰基辅酶A差向异构酶(EC 5.1.2.3)由相同的N末端活性位点进行(Yang SY和Elzinga M(1993)Associationof both enoyl coenzyme A hydratase and 3-hydroxyacyl coenzyme A epimerasewith an active site in the amino-terminal domain of the multifunctional fattyacid oxidation protein from Escherichia coli.J Biol Chem 268(9):6588-6592)。
在一个实施方案中,甲基巴豆酰辅酶A水合酶是3-酮酰辅酶A硫解酶。在另一个实施方案中,甲基巴豆酰辅酶A水合酶由获自大肠杆菌的一种或多种核酸分子编码。在一些实施方案中,编码甲基巴豆酰辅酶A水合酶的一种或多种核酸分子是fadA,或其同源物。在一个进一步的实施方案中,编码甲基巴豆酰辅酶A水合酶的一种或多种核酸分子包含SEQ IDNO:131中列出的氨基酸序列。在又一个实施方案中,编码甲基巴豆酰辅酶A水合酶的一种或多种核酸分子由SEQ ID NO:130中列出的核酸序列编码。
在一个实施方案中,甲基巴豆酰辅酶A水合酶是烯酰辅酶A水合酶。在另一个实施方案中,甲基巴豆酰辅酶A水合酶由获自大肠杆菌的一种或多种核酸分子编码。在一些实施方案中,编码甲基巴豆酰辅酶A水合酶的一种或多种核酸分子是fadB,或其同源物。在一个进一步的实施方案中,编码甲基巴豆酰辅酶A水合酶的一种或多种核酸分子包含SEQ IDNO:133中列出的氨基酸序列。在又一个实施方案中,编码甲基巴豆酰辅酶A水合酶的一种或多种核酸分子由SEQ ID NO:132中列出的核酸序列编码。
3-羟基-异戊酰辅酶A硫酯酶(EC 3.1.2.-)
本公开描述了可以催化以下反应的酶:
Figure BDA0003310804120000521
酰基辅酶A+H2O→羧酸+辅酶A+H+
示例性的酰基辅酶A硫酯酶是TesB。硫酯酶II(TesB)是大肠杆菌中存在的多种硫酯酶之一。该酶具有相对广泛的底物特异性,其裂解中链和长链酰基辅酶A底物;测试的最好底物是3,5-十四二烯酰辅酶A(Nie L等人(2008)A novel paradigm of fatty acidbeta-oxidation exemplified by the thioesterase-dependent partial degradationof conjugated linoleic acid that fully supports growth of Escherichiacoli.Biochemistry 47(36):9618-9626)。硫酯酶II是支持以油酸或共轭亚油酸为唯一碳源生长的硫酯酶之一(Nie等人,2008)。
已以
Figure BDA0003310804120000522
的分辨率解析了该酶的晶体结构。预测D204残基位于活性位点中;突变体的动力学分析证实了其重要性(Li J等人(2000)Crystal structure of theEscherichia coli thioesterase II,a homolog of the human Nef bindingenzyme.Nat Struct Biol 7(7):555-559)。
缺乏或过度生产tesB的株不具有明显的缺陷(Narasimhan ML等人(1986)Geneticand biochemical characterization of an Escherichia coli K-12mutant deficientin acyl-coenzyme A thioesterase II.J Bacteriol 165(3):911-917;Naggert J等人(1991)Cloning,sequencing,and characterization of Escherichia colithioesterase II.J Biol Chem 266(17):11044-11050)。TesB的过量生产减轻了在甘油饥饿时积累的长链酰基-ACP分子对脂肪酸合成的抑制(Jiang P和Cronan JE(1994)Inhibition of fatty acid synthesis in Escherichia coli in the absence ofphospholipid synthesis and release of inhibition by thioesterase action.JBacteriol 176(10):2814-2821)。
在一个实施方案中,3-羟基-异戊酰辅酶A硫酯酶由获自大肠杆菌的一种或多种核酸分子编码。在一些实施方案中,编码3-羟基-异戊酰辅酶A硫酯酶的一种或多种核酸分子是tesB,或其同源物。在一个进一步的实施方案中,编码3-羟基-异戊酰辅酶A硫酯酶的一种或多种核酸分子包含SEQ ID NO:135中列出的氨基酸序列。在又一个实施方案中,编码3-羟基-异戊酰辅酶A硫酯酶的一种或多种核酸分子由SEQ ID NO:134中列出的核酸序列编码。
甲羟戊酸-3-激酶(EC 2.7.1.-)
本公开描述了可以催化以下反应的酶:
Figure BDA0003310804120000531
(R)-甲羟戊酸+ATP→(R)-甲羟戊酸3-磷酸+ADP+H+
甲羟戊酸-3-激酶也可以称为(R)-MVA 3-磷酸转移酶或3-羟基异戊酸(3HIV)激酶。
尚未报道来自嗜酸热原体(Thermoplasma acidophilum)的这种酶的亚基结构。
认为来自嗜热古菌嗜酸热原体的甲羟戊酸-3-激酶参与了古细菌中发现的甲羟戊酸途径的变体(Azami Y等人(2014)(R)-Mevalonate 3-Phosphate Is an Intermediateof the Mevalonate Pathway in Thermoplasma acidophilum.J Biol Chem 289(23):15957-15967;http://www.ncbi.nlm.nih.gov/pubmed/24914732;Vinokur JM等人(2014)Evidence of a Novel Mevalonate Pathway in Archaea.Biochemistry 53(25):4161-4168)。
在大肠杆菌中表达、纯化和表征了重组的His标记的酶。尽管其与二磷酸甲羟戊酸脱羧酶具有同源性,但其表现为无脱羧酶活性(Azami等人,2014;Vinokur等人,2014)。该酶显示出弱的磷酸甲羟戊酸激酶活性,生产少量的(R)-甲羟戊酸二磷酸(Azami等人,2014)。其不具有甲羟戊酸-5-激酶活性(Vinokur等人,2014)。
在一个实施方案中,3HIV激酶由一种或多种获自微生物的核酸分子编码,所述微生物选自热原体属物种(Thermoplasma sp.)和嗜酸古菌属物种(Picrophilus sp.)。在另一个实施方案中,3HIV激酶由一种或多种获自微生物的核酸分子编码,所述微生物选自嗜酸热原体和托氏嗜酸古菌(Picrophilus torridus)。在一些实施方案中,编码3HIV激酶的一种或多种核酸分子是TA1305和/或PTO1356,或其同源物。在一些实施方案中,TA1305包含L200E突变。在一个进一步的实施方案中,编码3HIV激酶的一种或多种核酸分子包含选自SEQ ID NO:113、115和117的氨基酸序列。在又一个实施方案中,编码3HIV激酶的一种或多种核酸分子由选自SEQ ID NO:112、114和116的核酸序列编码。
甲羟戊酸二磷酸脱羧酶(EC 4.1.1.-)
本公开描述了可以催化以下反应的酶:
(R)-甲羟戊酸二磷酸+ATP→异戊烯二磷酸+CO2+ADP+磷酸
3-膦氧基异戊酸→CO2+异丁烯
3-羟基异戊酸→CO2+异丁烯
甲羟戊酸二磷酸脱羧酶也可以称为焦磷酸甲羟戊酸脱羧酶(pyrophosphomevalonate decarboxylase)、甲羟戊酸-5-焦磷酸脱羧酶、焦磷酸甲羟戊酸脱羧酶(pyrophosphomevalonic acid decarboxylase)、5-焦磷酸甲羟戊酸脱羧酶、甲羟戊酸5-二磷酸脱羧酶和ATP:(R)-5-二磷酸甲羟戊酸羧基裂解酶(脱水)、3-膦氧基异戊酸脱羧酶、3-羟基异戊酸-3-磷酸脱羧酶、3HIV-3-磷酸脱羧酶、3-羟基异戊酸脱羧酶和3HIV脱羧酶。
该酶通过ATP依赖性脱羧作用将甲羟戊酸5-二磷酸(MVAPP)转化为异戊烯二磷酸(IPP)。该酶的两种底物是ATP和甲羟戊酸5-二磷酸,而其四种产物是ADP、磷酸、异戊烯二磷酸和CO2
甲羟戊酸二磷酸脱羧酶催化甲羟戊酸途径的最后一步。甲羟戊酸途径负责由乙酸生物合成类异戊二烯。该途径通过合成甾醇类异戊二烯(如胆固醇)和非甾醇类异戊二烯(如多萜醇、血红素A、tRNA异戊烯基转移酶和泛醌),在多个细胞过程中发挥关键作用。该酶属于裂解酶家族,具体为羧基裂解酶,其裂解碳-碳键。
甲羟戊酸二磷酸脱羧酶识别并结合两种底物:ATP和甲羟戊酸5-二磷酸。结合后,该酶进行三类反应,其可以分为两个主要阶段。首先,发生磷酸化。这产生了一种反应性中间体,其在第二阶段进行协同脱磷酸和脱羧。
在一个实施方案中,催化3-膦氧基异戊酸→CO2+异丁烯反应的酶是3HIV-3-磷酸脱羧酶。在另一个实施方案中,3HIV-3-磷酸脱羧酶由获自链球菌属物种的一种或多种核酸分子编码。在一些实施方案中,所述微生物选自缓症链球菌(Streptococcus mitis)和/或戈登氏链球菌(Streptococcus gordonii)。在一些实施方案中,编码3HIV-3-磷酸脱羧酶的一种或多种核酸分子包含选自SEQ ID NO:119和121的氨基酸序列。在一个进一步的实施方案中,编码3HIV-3-磷酸脱羧酶的一种或多种核酸分子由选自SEQ ID NO:118和120的核酸序列编码。
在一个实施方案中,催化反应3-羟基异戊酸→CO2+异丁烯的酶是3HIV脱羧酶。在另一个实施方案中,3HIV脱羧酶由一种或多种获自微生物的核酸分子编码,所述微生物选自链球菌属物种、热原体属物种和嗜酸古菌属物种。在另一个实施方案中,3HIV脱羧酶由一种或多种获自微生物的核酸分子编码,所述微生物选自戈登氏链球菌、嗜酸热原体和托氏嗜酸古菌(Picrophilus torridus)。在一些实施方案中,编码3HIV脱羧酶的一种或多种核酸分子包括mvaD、TA1305和/或PTO1356,或其同源物。在一个进一步的实施方案中,编码3HIV脱羧酶的一种或多种核酸分子包含选自SEQ ID NO:113、117和121的氨基酸序列。在又一个实施方案中,编码3HIV脱羧酶的一种或多种核酸分子由选自SEQ ID NO:112、116和120的核酸序列编码。
转酮醇酶(EC 2.2.1.1)
本公开描述了可以催化以下反应的酶:
Figure BDA0003310804120000551
Figure BDA0003310804120000552
转酮醇酶催化酮醇基团在几个供体和受体底物之间的可逆转移。该关键酶是糖酵解和磷酸戊糖途径之间的可逆联系。该酶参与戊糖的分解代谢、D-核糖5-磷酸的形成以及D-赤藓糖4-磷酸(芳香族氨基酸和PLP的前体)的提供。大肠杆菌含有TktA和TktB两种转酮醇酶同工酶。TktA负责主要的转酮醇酶活性。
除了其在中心碳代谢中的功能之外,转酮醇酶在染色体结构中也表现出具有意想不到的作用;tktA突变体影响染色体拓扑。
已解析了与供体和受体底物复合的TktA的晶体结构,阐明了转酮醇酶的反应机制和作用方式。已提出了使用量子力学/分子力学方法的转酮醇酶活性计算模型,定义了硫胺素二磷酸活化的新途径。转酮醇酶I(TktA)是同源二聚体。已研究了TktA野生型和活性位点突变体的尿素变性途径,并确定了温度和pH对转酮醇酶的结构、稳定性、聚集和活性的影响。已研究了TktA的受体特异性。
TktA的丰度受SOS诱导剂和诱变剂7-甲氧基-2-硝基萘[2,1-b]呋喃(R7000)的影响。tktA在进入稳定期期间受到负调节。RpoS的影响可能是间接的,并且可能由其本身受RpoS直接调节的中间调节因子介导。
尚未明确确定转酮醇酶II(TktB)的亚基结构。TktB的过度生产抑制tktA突变表型。在苯丙氨酸存在下,tyrR突变体中tktB的表达增加。tktB表达在稳定期增加,并受RpoS和ppGpp的正调控。在有氧而不是厌氧生长条件下,渗透应激期间TktB蛋白的水平增加。TktB表现出与降解体有关,并可能将碳代谢与复制联系起来。
tktA和tktB的表达是互补的,导致在整个生长过程中转酮醇酶表达水平大致恒定。
在一些实施方案中,转酮醇酶由与来自大肠杆菌的tktA具有至少70%序列同一性的氨基酸序列编码。在一个进一步的实施方案中,转酮醇酶由与来自大肠杆菌的tktA具有至少80%序列同一性的氨基酸序列编码。在一个仍进一步的实施方案中,转酮醇酶由与来自大肠杆菌的tktA具有至少90%序列同一性的氨基酸序列编码。在其他实施方案中,转酮醇酶是来自大肠杆菌的tktA。在一些实施方案中,转酮醇酶由与来自大肠杆菌的tktB具有至少70%序列同一性的氨基酸序列编码。在一个进一步的实施方案中,转酮醇酶由与来自大肠杆菌的tktB具有至少80%序列同一性的氨基酸序列编码。在一个仍进一步的实施方案中,转酮醇酶由与来自大肠杆菌的tktB具有至少90%序列同一性的氨基酸序列编码。在其他实施方案中,转酮醇酶是来自大肠杆菌的tktB。
在一些实施方案中,编码转酮醇酶的一种或多种核酸分子是tktA,或其同源物。在一些实施方案中,编码转酮醇酶的一种或多种核酸分子是tktB,或其同源物。在另一个实施方案中,编码转酮醇酶的一种或多种核酸分子包含选自SEQ ID NO:148和150的氨基酸序列。在一个进一步的实施方案中,编码转酮醇酶的一种或多种核酸分子由选自SEQ ID NO:147和149的核酸序列编码。
转醛醇酶(EC 2.2.1.2)
本公开描述了可以催化以下反应的酶:
Figure BDA0003310804120000561
转醛醇酶也可以称为二羟基丙酮转移酶;二羟基丙酮合酶;甲醛转酮醇酶。
转醛醇酶B是磷酸戊糖途径非氧化分支的酶。转醛醇酶与转酮醇酶一起,在磷酸戊糖途径和糖酵解之间建立可逆的联系。其催化甘油醛-3-磷酸和景天庚酮糖-7-磷酸互变为果糖-6-磷酸和赤藓糖-4-磷酸。已在实验和理论上解决了该反应的可逆性和通过磷酸戊糖途径的碳流。
大肠杆菌中有两种密切相关的转醛醇酶,由talA和talB编码。只有转醛醇酶B已被生物化学表征。TalB在溶液和晶体结构中是二聚体。R300残基的突变导致催化活性单体的形成。通过定点诱变鉴定了对催化重要的活性位点残基。
已确定了转醛醇酶B的晶体结构,证实了在活性位点存在席夫碱中间体,并导致了建议的反应机制。
talB无效突变体在以葡萄糖为碳源的基础介质上不具有生长缺陷。
在一些实施方案中,转醛醇酶由与来自大肠杆菌的talA或talB具有至少70%序列同一性的氨基酸序列编码。在一个进一步的实施方案中,转醛醇酶由与来自大肠杆菌的talA或talB具有至少80%序列同一性的氨基酸序列编码。在一个仍进一步的实施方案中,转醛醇酶由与来自大肠杆菌的talA或talB具有至少90%序列同一性的氨基酸序列编码。在其他实施方案中,转醛醇酶是来自大肠杆菌的talA。在仍进一步的实施方案中,转醛醇酶是来自大肠杆菌的talB。
在一些实施方案中,编码转醛醇酶的一种或多种核酸分子是talA,或其同源物。在一些实施方案中,编码转醛醇酶的一种或多种核酸分子是talB,或其同源物。在另一个实施方案中,编码转醛醇酶的一种或多种核酸分子包含选自SEQ ID NO:152和154的氨基酸序列。在一个进一步的实施方案中,编码转醛醇酶的一种或多种核酸分子由选自SEQ ID NO:151和153的核酸序列编码。
核糖-5-磷酸异构酶(EC 5.3.1.6)
本公开描述了可以催化以下反应的酶:
Figure BDA0003310804120000571
核糖-5-磷酸异构酶也可以称为磷酸戊糖异构酶;磷酸核糖异构酶;核糖磷酸异构酶;5-磷酸核糖异构酶;D-核糖5-磷酸异构酶;D-核糖-5-磷酸酮醇异构酶。
在大肠杆菌中存在两种物理上和遗传上不同的核糖-5-磷酸异构酶。组成型核糖-5-磷酸异构酶A(rpiA)通常占细胞中99%以上的核糖-5-磷酸异构酶活性,并在磷酸戊糖途径(非氧化分支)中发挥作用。如果其表达被诱导,诱导型核糖-5-磷酸异构酶B(rpiB)可以替代rpiA的功能。两种酶之间没有序列相似性。
已解析了RpiA的晶体结构,并预测了活性位点残基和酸碱催化机制。rpiA突变体需要核糖以生长。
在一些实施方案中,核糖-5-磷酸异构酶由与来自大肠杆菌的rpiA具有至少70%序列同一性的氨基酸序列编码。在一个进一步的实施方案中,核糖-5-磷酸异构酶由与来自大肠杆菌的rpiA具有至少80%序列同一性的氨基酸序列编码。在一个仍进一步的实施方案中,核糖-5-磷酸异构酶由与来自大肠杆菌的rpiA具有至少90%序列同一性的氨基酸序列编码。在其他实施方案中,核糖-5-磷酸异构酶是来自大肠杆菌的rpiA。
在一些实施方案中,编码核糖-5-磷酸异构酶的一种或多种核酸分子是rpiA,或其同源物。在另一个实施方案中,编码核糖-5-磷酸异构酶的一种或多种核酸分子包含SEQ IDNO:156中列出的氨基酸序列。在一个进一步的实施方案中,编码核糖-5-磷酸异构酶的一种或多种核酸分子由SEQ ID NO:155中列出的核酸序列编码。
核酮糖-5-磷酸3-差向异构酶(EC 5.1.3.1)
本公开描述了可以催化以下反应的酶:
Figure BDA0003310804120000572
核酮糖-5-磷酸3-差向异构酶也可以称为核酮糖-磷酸3-差向异构酶;磷酸核酮糖差向异构酶;赤藓糖-4-磷酸异构酶;磷酸酮戊糖3-差向异构酶;木酮糖磷酸3-差向异构酶;磷酸酮戊糖差向异构酶;D-核酮糖磷酸-3-差向异构酶;D-核酮糖5-磷酸差向异构酶;D-核酮糖-5-P 3-差向异构酶;D-木酮糖-5-磷酸3-差向异构酶;戊糖-5-磷酸3-差向异构酶。
核酮糖-5-磷酸3-差向异构酶(Rpe)是磷酸戊糖途径非氧化分支的酶。
Rpe的活性需要亚铁,并且由于芬顿化学(Fenton chemistry)而容易受到H2O2的攻击而损坏。Mn2+、Co2+和Zn2+可以不同程度地取代Fe2+,并且含有这些替代阳离子的Rpe不易受到H2O2的攻击。诱导锰转运蛋白可以保护Rpe免受H2O2的损害。
在一些实施方案中,核酮糖-5-磷酸3-差向异构酶由与来自大肠杆菌的rpe具有至少70%序列同一性的氨基酸序列编码。在一个进一步的实施方案中,核酮糖-5-磷酸3-差向异构酶由与来自大肠杆菌的rpe具有至少80%序列同一性的氨基酸序列编码。在一个仍进一步的实施方案中,核酮糖-5-磷酸3-差向异构酶由与来自大肠杆菌的rpe具有至少90%序列同一性的氨基酸序列编码。在其他实施方案中,核酮糖-5-磷酸3-差向异构酶是来自大肠杆菌的rpe。
在一些实施方案中,编码核酮糖-5-磷酸3-差向异构酶的一种或多种核酸分子是rpe,或其同源物。在另一个实施方案中,编码核酮糖-5-磷酸3-差向异构酶的一种或多种核酸分子包含SEQ ID NO:158中列出的氨基酸序列。在一个进一步的实施方案中,编码核酮糖-5-磷酸3-差向异构酶的一种或多种核酸分子由SEQ ID NO:157中列出的核酸序列编码。
果糖6-磷酸磷酸酮醇酶(Fpk,EC4.1.2.22)
本公开描述了可以催化以下反应的酶:
Figure BDA0003310804120000581
β-D-呋喃果糖6-磷酸转化为D-赤藓糖4-磷酸和乙酰磷酸的磷酸酮醇酶反应是双歧杆菌(Bifidobacterium)旁路中的关键反应之一。有证据表明双歧杆菌中存在两种不同的F6P-磷酸酮醇酶。一种仅对F6P具有特异性,而另一种能够利用F6P和D-木酮糖5-磷酸(EC:4.1.2.9),该反应在双歧杆菌旁路中随后出现。由xfp基因编码的酶最初发现于动物双歧杆菌乳酸亚种(Bifidobacterium animalis lactis)中,其是双特异性酶。也从肠系膜明串珠菌(Leuconostoc mesenteroides)(LEUM_1961)中纯化了磷酸酮醇酶。
在一些实施方案中,具有果糖-6-磷酸磷酸酮醇酶活性的酶由与选自以下的具有果糖-6-磷酸磷酸酮醇酶活性的酶具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码:齿双歧杆菌(Bifidobacterium dentium)BDP_1006、乳双歧杆菌(Bifidobacterium lactis)xfp、类植物乳杆菌(Lactobacillus paraplantarum)xpkA和短双歧杆菌(Bifidobacterium breve)xfp。在一个优选的实施方案中,具有果糖-6-磷酸磷酸酮醇酶活性的酶选自齿双歧杆菌BDP_1006、乳双歧杆菌xfp、类植物乳杆菌xpkA和短双歧杆菌xfp。在另一个实施方案中,编码所述果糖-6-磷酸磷酸酮醇酶的一种或多种核酸分子包含选自SEQ ID NO:212、214、216和218的氨基酸序列。在一个进一步的实施方案中,编码所述果糖-6-磷酸磷酸酮醇酶的一种或多种核酸分子由选自SEQ ID NO:211、213、215和217的核酸序列编码。
磷酸乙酰转移酶(EC 2.3.1.8)
本公开描述了可以催化以下反应的酶:
Figure BDA0003310804120000582
磷酸乙酰转移酶(Pta)催化乙酰辅酶A和乙酰磷酸之间的可逆转化,这是乙酸代谢中的一个步骤。丙酮酸和磷酸烯醇丙酮酸都在乙酰磷酸合成方向上激活该酶,并在乙酰辅酶A合成方向上抑制该酶。从乙酰辅酶AI途径形成乙酸一直是代谢工程的目标,以减少流向乙酸的流并增加商业所需终产物的产量。还使用系统生物学方法(如代谢建模和流平衡分析)对其进行了研究。
Pta由三个结构域组成;磷酸乙酰转移酶活性只需要C-末端结构域。N-末端结构域参与天然四级结构的稳定和代谢调节。
Pta可能能够利用乙酰辅酶A和丙酰辅酶A。ack pta双突变体具有降低的来自L-苏氨酸的丙酸水平,表明该酶是将L-苏氨酸代谢为丙酸的厌氧途径的一部分。pta突变体不能以乙酸作为唯一的碳源生长。pta和pta ackA突变体在葡萄糖饥饿中存活的能力均受损。pta突变体的生长缺陷表现为由于乙酰辅酶A的流的扰动。pta突变体在微需氧条件下以葡萄糖作为碳源生长时生产大量乳酸。最近已彻底研究了pta突变对代谢、酶活性和基因表达的影响。pta和recBC突变体被合成地生长抑制。
以乙酸生长和低pH条件下生长降低Pta的水平。pta属于CreBC调节子。FNR对pta表达具有轻微的积极影响。测量了pta-ackA的生长速率依赖性表达模式。
已从丙酮丁醇梭菌中克隆编码该酶的pta基因,并在大肠杆菌中进行测序和表达。该基因与ackA基因相邻,ackA基因编码催化第二步的酶——乙酸激酶。对来自含有亚克隆的大肠杆菌和丙酮丁醇梭菌的细胞提取物进行的酶活性测定表明活性升高。当生物体达到溶剂形成阶段时,该酶表现出比活性的降低。
也已从以下之中鉴定或测量了具有磷酸乙酰转移酶活性或磷酸乙酰转移酶基因的酶:大肠杆菌(eutD、pta)、抑云玫瑰变色菌(Roseovarius nubinhibens)ISM、克氏梭菌(Clostridium kluyveri)、莱因衣藻(Chlamydomonas reinhardtii)(PAT2)、Dasytricharuminantium、Pelobacter acetylenicus、Gottschalkia acidurici、旧金山乳酸菌(Lactobacillus sanfranciscensis)、脱氮副球菌(Paracoccus denitrificans)NKNIS、氧化还原真杆菌(Eubacterium oxidoreducens)G41、肺炎支原体(Mycoplasma pneumoniae)M129、海栖热袍菌(Thermotoga maritima)、Moorella thermoacetica、Methanosarcinathermophile、丙酸梭菌(Clostridium propionicum)和具核梭杆菌(Fusobacteriumnucleatum)。
在一些实施方案中,具有磷酸乙酰转移酶活性的酶由与选自以下的具有磷酸乙酰转移酶活性的酶具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码:大肠杆菌pta和丙酮丁醇梭菌(Clostridium acetobutylicum)pta。在一个优选的实施方案中,具有磷酸乙酰转移酶活性的酶选自大肠杆菌pta和丙酮丁醇梭菌pta。在另一个实施方案中,编码磷酸乙酰转移酶的一种或多种核酸分子包含选自SEQ IDNO:220和222的氨基酸序列。在一个进一步的实施方案中,编码磷酸乙酰转移酶的一种或多种核酸分子由选自SEQ ID NO:219和221的核酸序列编码。
葡萄糖-6-磷酸1-脱氢酶(EC 1.1.1.49)
本公开描述了可以催化以下反应的酶:
Figure BDA0003310804120000601
葡萄糖-6-磷酸1-脱氢酶也可以称为葡萄糖-6-磷酸脱氢酶(NADP+);NADP-葡萄糖-6-磷酸脱氢酶;中间发酵(Zwischenferment);D-葡萄糖6-磷酸脱氢酶;葡萄糖6-磷酸脱氢酶(NADP);NADP依赖性葡萄糖6-磷酸脱氢酶;6-磷酸葡萄糖脱氢酶;Entner-Doudoroff酶;G6PDH;GPD;葡萄糖-6-磷酸脱氢酶。
葡萄糖-6-磷酸脱氢酶(G6PDH)是磷酸戊糖途径的第一种酶,提供合成代谢所需的大部分NADPH。
大肠杆菌G6PDH显示出对NADP+的强烈偏好,而不是NAD+。使用分子模拟、定点突变体的动力学表征和系统发育分析,研究了这种偏好的结构基础。
使用GC-MS和13C标记和2D NMR光谱,测量了通过中心碳代谢途径的代谢流。在不同生长条件下,在酶表达和活性水平上测量了对这些途径的调节。
用生产NADH的葡萄糖-6-磷酸脱氢酶取代天然的生产NADPH的酶,降低了野生型细胞的生长速度,同时增加了Δpgi突变体的生长速度。这表明由G6PDH生产NADH在体内是有益还是有害取决于上游Embden-Meyerhof通路的运行。
除了在中心碳代谢中的作用之外,还发现G6PDH是具有氨基酸序列Asn-Asn-Trp-Asn-Asn(NNWNN)的线性肽的来源,其作为“细胞外死亡因子”(EDF)用于MazEF介导的细胞死亡。该肽通过增加毒素MazF和ChpBK的内切核糖核酸酶活性发挥作用。应激条件下的EDF产生是由于MazF在特定ACA位点切割zwfmRNA,生成无前导的截短的mRNA。EDF编码区相对于MazF切割位点的位置很重要,并且需要反式翻译系统(trans-translation system)。
zwf是最一致的流-耦合(flux-coupled)基因之一,这些基因在扰动时的表达转换模式与其相应的流量值相关。zwf的表达在转录水平上受生长速率调节。G6PDH活性在快速生长的细胞中更高,并且与碳限制生长条件相比,在氮限制条件下更高。zwf是响应超氧化物应激的SoxRS调节子的一部分。已证明其他调节因子可以激活zwf的转录。接触亚碲酸盐激活zwf的转录,从而增加NADPH的合成。
zwf无效突变不会显著影响生长速率。然而,中心碳代谢和代谢流发生了变化。pgizwf双突变体不能以葡萄糖作为唯一碳源生长。在葡萄糖存在下,其积累高水平的6-磷酸葡萄糖而抑制果糖-1,6-双磷酸酶I的活性。缺失zwf降低大肠杆菌JM109的有机溶剂耐受性。
在一些实施方案中,生产MEG或乙醇酸、或MEG和一种或多种联产品的重组微生物在编码葡萄糖-6-磷酸脱氢酶的基因中包含缺失、插入或功能缺失突变,以防止葡萄糖-6-磷酸通过磷酸戊糖途径的氧化分支的流,而是通过磷酸戊糖途径的非氧化分支分流葡萄糖-6-磷酸,以生产D-核糖-5-磷酸中间体。
6-磷酸葡萄糖酸内酯酶(EC 3.1.1.31)
本公开描述了可以催化以下反应的酶:
6-磷酸D-葡萄糖酸-1,5-内酯+H2O→D-葡萄糖酸6-磷酸+H+
6-磷酸葡萄糖酸内酯酶也可以称为磷酸葡萄糖酸内酯酶;6-PGL。
6-磷酸葡萄糖酸内酯酶是氧化磷酸戊糖途径的酶。
pgl突变株以葡萄糖作为唯一碳源生长仅比野生型稍慢。以葡萄糖生长可能是由于6-磷酸D-葡萄糖酸-1,5-内酯的非酶水解或旁路途径,其涉及去磷酸化和葡萄糖酸内酯的输出,水解为葡萄糖酸,随后是葡萄糖酸的重新输入和磷酸化。当以麦芽糖培养介质生长时,缺乏Pgl活性的株在碘处理后变成蓝色。可以通过来自恶臭假单胞菌的pgl基因的表达来补偿pgl缺失株的表型,尽管这两个基因之间没有可检测到的相似性。
用于生产核黄素的大肠杆菌代谢工程策略包括过表达pgl,导致核黄素滴度增加。
pgl是在大肠杆菌B株BL21中缺失的基因组区域的一部分,但存在于K-12株MG1655中。
在一些实施方案中,生产MEG或乙醇酸、或MEG和一种或多种联产品的重组微生物在编码6-磷酸葡萄糖酸内酯酶的基因中包含缺失、插入或功能缺失突变,以防止葡萄糖-6-磷酸通过磷酸戊糖途径的氧化分支的流,而是通过磷酸戊糖途径的非氧化分支分流葡萄糖-6-磷酸,以生产D-核糖-5-磷酸中间体。
6-磷酸葡萄糖酸脱氢酶,脱羧(EC 1.1.1.44)
本公开描述了可以催化以下反应的酶:
D-葡萄糖酸6-磷酸+NADP+→D-核酮糖5-磷酸+CO2+NADPH
6-磷酸葡萄糖酸脱氢酶(6-phosphogluconate dehydrogenase)也可以称为磷酸葡萄糖酸脱氢酶(NADP+依赖性,脱羧);磷酸葡萄糖酸脱氢酶;6-磷酸葡萄糖酸脱氢酶(6-phosphogluconic dehydrogenase);6-磷酸葡萄糖酸羧化酶;6-磷酸-D-葡萄糖酸脱氢酶;甘油醛3-磷酸脱氢酶。
6-磷酸葡萄糖酸脱氢酶是磷酸戊糖途径氧化分支的酶。
已解析了该酶与底物和共底物化合物复合的三种晶体结构。结合NADP+可以诱导该酶的构象变化。已经提出了催化机制。
gnd是大肠杆菌种群中高度多态性的基因,可能是由于株间转移和重组所致。这可能是因为其靠近决定O抗原结构的rfb区。
6-磷酸葡萄糖酸脱氢酶的表达受生长速率调节。大部分生长速率依赖性的Gnd水平增加是由于转录增加,导致更高的mRNA水平。转录后调控涉及gnd mRNA密码子67和78之间的二级结构元件。该区可能通过将翻译起始区隔离到mRNA二级结构中而发挥作用,从而降低翻译起始的效率。然而,显然尚未确定这种调节机制的效应子。truA(hisT)突变体通过转录后调控降低生长速率依赖性的Gnd表达增加。在酸性条件下生长上调gnd的表达。gnd是最一致的流-耦合基因(FCG)之一,这些基因在扰动时的表达转换模式与其相应的流量值相关。
为启动子区域中的缺失突变选择的某些生长条件导致gnd转录增加和酶活性增加。edd gnd双突变体不能以葡萄糖酸生长。gnd中的无效突变不会显著改变生长速率。然而,细胞代谢和代谢流发生了变化;以葡萄糖或甘油生长的过程中琥珀酸产量增加。与野生型相比,gnd缺失突变体在以甘油厌氧生长期间表现出增强的乙醇和H2产量,而在不同的高度工程化的株中,过表达gnd增加乙醇和H2的产量。
在一些实施方案中,生产MEG或乙醇酸、或MEG和一种或多种联产品的重组微生物在编码6-磷酸葡萄糖酸脱氢酶的基因中包含缺失、插入或功能缺失突变,以防止葡萄糖-6-磷酸通过磷酸戊糖途径的氧化分支的流,而是通过磷酸戊糖途径的非氧化分支分流葡萄糖-6-磷酸,以生产D-核糖-5-磷酸中间体。
甘油醛3-磷酸脱氢酶,磷酸化(EC 1.2.1.12)
本公开描述了可以催化以下反应的酶:
Figure BDA0003310804120000621
甘油醛3-磷酸脱氢酶也可以称为甘油醛-3-磷酸脱氢酶(磷酸化);磷酸丙糖脱氢酶;脱氢酶,磷酸甘油醛;磷酸甘油醛脱氢酶;3-磷酸甘油醛脱氢酶;NAD+依赖性甘油醛磷酸脱氢酶;甘油醛磷酸脱氢酶(NAD+);甘油醛-3-磷酸脱氢酶(NAD+);NADH-甘油醛磷酸脱氢酶;甘油醛-3-P-脱氢酶。
在大肠杆菌糖酵解和糖异生过程中,在NAD+和磷酸存在下,甘油醛3-磷酸脱氢酶A催化D-甘油醛-3-磷酸可逆氧化磷酸化为1,3-双磷酸-D-甘油酸。该酶还存在于许多其他生物体中,其特性已得到广泛研究。
大肠杆菌不寻常地具有由gapA和epd(gapB)编码的两种甘油醛-3-磷酸脱氢酶(GAPDH)活性。然而,gapA编码的酶具有高效的磷酸化的甘油醛-3-磷酸脱氢酶活性和低的磷酸化的赤藓糖4-磷酸脱氢酶活性,而epd编码的酶具有有效的非磷酸化的赤藓糖-4-磷酸脱氢酶活性和非常低的磷酸化的甘油醛-3-磷酸脱氢酶活性。
GapA蛋白具有的序列与真核序列的相似度高于与嗜热细菌酶的相似度,并且通常高于与原核酶的相似度。糖酵解需要gapA产物,而不需要epd产物。这两种酶都可以参与吡哆醛5'-磷酸(PLP)的生产。
对来自大肠杆菌K-10的gapA突变体的早期研究表明了其在糖酵解中的作用并证明了其一些催化特性。gapA突变体表现出生长缺陷,并且还表现出增加的聚集和裂解表型,这些表型可被高盐介质挽救。
已研究了gapA基因表达的调节。fkpA、gapA和hslT基因的调节受慢性热应激条件下进化的影响。
大肠杆菌序列含有几个在所有GAPDH中都保守且假定参与NAD+结合或催化机制的氨基酸。
已以
Figure BDA0003310804120000631
的分辨率确定了在NAD+存在下野生型酶的晶体结构,其与其他GAPDH的晶体结构相似。已以
Figure BDA0003310804120000632
的分辨率解析了N313T突变体的晶体结构。已报道了其他几种有和没有结合的NAD+,以及处于半缩醛中间状态的大肠杆菌GAPDH的晶体结构。
已使用定点诱变研究了负责NAD+辅因子立体特异性的分子因子。该酶是一种B-特异性脱氢酶,其催化pro-S氢的转移并以顺烟酰胺方向结合NAD(H)。已研究了在伴侣蛋白Tig存在下,变性的大肠杆菌GAPDH的重折叠的触发因素。
ADP-核糖基化GAPDH是一些真菌和革兰氏阳性病原体以及大肠杆菌致病株中的分泌毒力因子。非致病性大肠杆菌不分泌GAPDH。证据表明大肠杆菌GAPDH也参与DNA修复。
构建了一系列可诱导表达末端配对反义RNA的载体,以沉默宿主大肠杆菌K-12MG1655中的中心碳代谢。以93%的效率沉默gapA的载体导致了严重的生长抑制。已证明通过温度变化调节工程化大肠杆菌gapA的表达可以控制糖酵解。
在一些实施方案中,生产MEG或乙醇酸、或MEG和一种或多种联产品的重组微生物在编码甘油醛3-磷酸脱氢酶的基因中包含缺失、插入或功能缺失突变,以防止甘油醛3-磷酸转化为1,3-二磷酸-D-甘油酸,而是允许甘油醛3-磷酸通过转酮醇酶转化为木酮糖-5-磷酸(同时将果糖-6-磷酸转化为赤藓糖-4-磷酸),其可以进一步转化为非氧化磷酸戊糖途径中的中间体D-核糖5-磷酸,该中间体可以通过D-核糖5-磷酸醛缩酶转化为中间体乙醇醛和D-甘油醛3-磷酸(G3P)用于生产MEG或乙醇酸、或MEG和一种或多种联产品。
戊糖磷酸醛缩酶
戊糖-磷酸醛缩酶催化可逆的醛缩反应,将戊糖磷酸转化为甘油醛-3-磷酸和乙醇醛。在一些实施方案中,戊糖磷酸醛缩酶是D-核糖-5-磷酸醛缩酶(DERA)、D-核酮糖-5-磷酸醛缩酶或D-木酮糖-5-磷酸醛缩酶。
在一些实施方案中,D-核糖-5-磷酸醛缩酶催化D-核糖-5-磷酸转化为乙醛和甘油醛-3-磷酸。
在一些实施方案中,D-核酮糖-5-磷酸醛缩酶催化D-核酮糖-5-磷酸转化为乙醇醛和甘油醛-3-磷酸。
在一些实施方案中,D-木酮糖-5-磷酸醛缩酶催化D-木酮糖-5-磷酸转化为乙醇醛和甘油醛-3-磷酸。
在一些实施方案中,戊糖磷酸醛缩酶来自大肠杆菌。在一些实施方案中,戊糖磷酸醛缩酶来自热容芽孢杆菌。
在一些实施方案中,大肠杆菌戊糖磷酸醛缩酶由包含以下的核酸序列编码:
Figure BDA0003310804120000641
在一些实施方案中,大肠杆菌戊糖磷酸醛缩酶是包含以下的氨基酸序列:
Figure BDA0003310804120000642
在一些实施方案中,大肠杆菌戊糖磷酸醛缩酶包含突变C47N,并由包含以下的核酸序列编码:
Figure BDA0003310804120000643
在一些实施方案中,热容芽孢杆菌戊糖磷酸醛缩酶由与以下序列具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码:
Figure BDA0003310804120000651
在一些实施方案中,热容芽孢杆菌戊糖磷酸醛缩酶由cDNA优化序列编码,所述序列包含与以下序列具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的核酸序列:
Figure BDA0003310804120000652
在一些实施方案中,大肠杆菌戊糖磷酸醛缩酶是与以下序列具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列:
Figure BDA0003310804120000653
在一些实施方案中,大肠杆菌戊糖磷酸醛缩酶是包含C47N突变并包含以下的氨基酸序列:
Figure BDA0003310804120000661
在一些实施方案中,热容芽孢杆菌戊糖磷酸醛缩酶是与以下序列具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列:
Figure BDA0003310804120000662
在一些实施方案中,热容芽孢杆菌戊糖磷酸醛缩酶包含C37N突变,并由与以下序列具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的核酸序列编码:
Figure BDA0003310804120000663
在一些实施方案中,热容芽孢杆菌戊糖磷酸醛缩酶包含C37N突变,并是与以下序列具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列:
Figure BDA0003310804120000664
6-磷酸果糖激酶(EC 2.7.1.11)
磷酸果糖激酶(Pfk)在糖酵解过程中催化果糖-6-磷酸在C1碳上的磷酸化。大肠杆菌含有Pfk-1(pfkA)和Pfk-2(pfkB)两种Pfk同工酶,其不具有序列相似性。野生型大肠杆菌中90%以上的磷酸果糖激酶活性可以归因于Pfk-1。
PfkA催化果糖-6-磷酸的磷酸化,是调节糖酵解途径的关键酶。该酶不能在体内催化逆反应。该酶显示出与底物果糖-6-磷酸的协同动力学,但与另一底物ATP不显示协同动力学。最近表明了PfkA还催化景天庚酮糖-7-磷酸的磷酸化,作为二磷酸景天庚酮糖旁路的一部分。已在有和没有激活剂和抑制剂的情况下解析了PfkA的晶体结构。基于序列相似性,预测PfkA是NAD+激酶。
PfkB是糖激酶的核糖激酶家族的成员。与PfkA不同,PfkB不显示与果糖-6-磷酸的协同相互作用、PEP的抑制或ADP的激活。MgATP2-是该酶的真正底物。PfkB还可以使用塔格糖-6-磷酸作为底物。该反应是半乳糖醇分解代谢途径的一部分。已以
Figure BDA0003310804120000671
的分辨率解析了MgATP抑制的四聚体形式的PfkB晶体结构。将此结构与PfkB与果糖-6-磷酸复合物的晶体结构进行比较,表明了果糖-6-磷酸结合和MgATP结合之间存在负相互作用。
在一些实施方案中,生产MEG或乙醇酸、或MEG和一种或多种联产品的重组微生物在编码6-磷酸果糖激酶的基因中包含缺失、插入或功能缺失突变,以防止果糖-6-磷酸转化为1,6-二磷酸,而是允许通过6-磷酸果糖磷酸酮醇酶将果糖-6-磷酸转化为赤藓糖-4-磷酸和乙酰磷酸,并为磷酸戊糖途径的非氧化分支提供更多的赤藓糖-4-磷酸,以进一步产生D-核糖5-磷酸中间体,该中间体可被D-核糖5-磷酸醛缩酶转化为生产MEG或乙醇酸、或MEG和一种或多种联产品所需的中间体乙醛和D-甘油醛3-磷酸(G3P)。在一些实施方案中,6-磷酸果糖激酶是pfkA和/或pfkB。
羟基丙酮酸脱羧酶、2-氧代戊二酸脱羧酶、2-酮酸脱羧酶(EC 4.1.1.-)
本公开描述了可以催化以下反应的酶:
Figure BDA0003310804120000672
2-氧代戊二酸+辅酶A+NAD+→琥珀酰辅酶A+CO2+NADH
4-甲基-2-氧代戊酸+H+→3-甲基丁醛+CO2
3-甲基-2-氧代丁酸+H+→异丁醛+CO2
羟基丙酮酸脱羧酶也可以称为羟基丙酮酸羧基裂解酶。
2-氧代戊二酸脱羧酶也可以称为氧代戊二酸脱羧酶;α-酮戊二酸脱羧酶(alpha-ketoglutarate decarboxylase,alpha-ketoglutaric decarboxylase);前-2-氧代戊二酸脱羧酶;2-氧代戊二酸羧基裂解酶。
大肠杆菌SucA负责2-氧代戊二酸脱氢酶多酶复合物(OGDHC)的2-氧代戊二酸脱羧酶活性,该复合物催化2-氧代戊二酸(2-酮戊二酸)转化为琥珀酰辅酶A和CO2,并产生NADH。
OGDHC是2-氧代酸脱氢酶家族的成员。该家族的成员含有三种酶组分的多个拷贝:2-氧代戊二酸脱羧酶(E1)、硫辛酰胺酰基转移酶(E2)和硫辛酰胺脱氢酶(E3)。在大多数革兰氏阳性细菌和线粒体中,E1组分是由两个亚基组成的异源二聚体,而在大多数(但不是全部)革兰氏阴性细菌中,其由单一类型的亚基组成。在这两种情况下,E1组分的多个拷贝以及E3组分的多个拷贝围绕具有八面体对称性的24个亚基的E2核心或具有二十面体对称性的60个亚基的E2核心(取决于复合物和物种)组装。在大肠杆菌中,丙酮酸脱氢酶和甘氨酸裂解多酶复合物共享E3组分。2-氧代戊二酸和丙酮酸脱氢酶复合物的E1和E2略有不同,将其指定为(o)和(p)以进行区分。
大肠杆菌OGDHC含有12个单位的E1(o)组分2-氧代戊二酸脱羧酶,其需要硫胺素并由sucA编码,24个单位的E2(o)组分二氢硫辛基转琥珀酰酶,其由sucB编码,以及2个单位的E3组分硫胺脱氢酶,其由lpd编码。24个E2(o)单元形成复合物的八面体核心。其含有硫辛酰赖氨酸以及E1(o)和E3亚基二聚体的结合位点。电子冷冻断层扫描表明其灵活地连接至E2核心。
在OGDHC反应循环中,SucA结合2-氧代戊二酸并使其脱羧,SucA是含有硫胺二磷酸辅因子的酶。已以
Figure BDA0003310804120000681
的分辨率测定了缺乏N-末端77个残基的截短的apo形式的SucA的晶体结构。以
Figure BDA0003310804120000682
的分辨率测定了具有硫胺二磷酸和Mg2+的holo形式的结构。截短的形式保留了脱羧酶活性,但没有与E2(o)组装成OGDH复合物。数据还表明存在AMP结合位点。证明了在OGDHC中通过与O2的副反应生成氧依赖性的硫胺自由基。
对通过His260和His298饱和诱变制备的工程化SucA的研究表明,底物识别需要His260,但His298可以被类似大小的疏水残基替换。数据还表明E2(o)在特异性方面发挥作用。
在早期工作中克隆和测序了sucA基因,并研究了sucABCD的调控。表明了sucAB和sucCD基因是相互必需的,任一对都足以生产琥珀酰辅酶A,但同时缺失sucAB和sucCD不能存活。
α-酮异戊酸脱羧酶催化3-甲基-2-氧代丁酸脱羧为异丁醛。该酶对3-甲基-2-氧代丁酸具有高度特异性,但也对其他支链2-酮酸显示出活性(4-甲基-2-氧代戊酸,相对活性22.7%;(S)-3-甲基-2-氧代戊酸,16.7%,2-氧代-3-苯基丙酸,7.1%,以及4-(甲硫基)-2-氧代丁酸,5.8%)。
该酶是同源四聚体,由已测序和克隆的kivd基因编码。推导出的蛋白质序列与由ipd基因(该基因因插入IS983元件而在L439位置中断)编码的乳酸乳球菌IL1403株蛋白质具有98.6%的同一性(在其前438个氨基酸上)。kivd基因与乳酸乳球菌MG1363和SK11株的测序基因组中的任何基因都没有任何同源性。
对156株乳酸菌(乳球菌(Lactococcus)、乳杆菌(Lactobacillus)、明串珠菌(Leuconostoc))的Kivd活性检测研究表明,只有乳酸乳球菌的株具有该活性,即使在乳球菌株中,45株中也只有7株具有该活性。
将来自乳酸乳球菌B1157株的同源蛋白质描述为支链α-酮酸脱羧酶。该蛋白质与Kivd具有89.8%的同一性,并且还具有对2-酮异戊酸的偏好。
在一些实施方案中,具有2-酮酸脱羧酶活性的酶、具有羟基丙酮酸脱羧酶活性的酶或具有2-氧代戊二酸脱羧酶活性的酶将羟基丙酮酸转化为乙醇醛。在一些实施方案中,将羟基丙酮酸转化为乙醇醛的酶由与Kivd或SucA具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一些实施方案中,具有2-酮酸脱羧酶活性的酶是Kivd。在一些实施方案中,具有2-氧代戊二酸脱羧酶活性的酶是SucA。
在一些实施方案中,编码具有2-氧代戊二酸脱羧酶活性的酶的一种或多种核酸分子是sucA,或其同源物。在一些实施方案中,编码具有2-酮酸脱羧酶活性的酶的一种或多种核酸分子是Kivd,或其同源物。在另一个实施方案中,编码具有2-酮酸脱羧酶活性的酶、具有羟基丙酮酸脱羧酶活性的酶或具有2-氧代戊二酸脱羧酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO:224和226的氨基酸序列。在一个进一步的实施方案中,编码具有2-酮酸脱羧酶活性的酶、具有羟基丙酮酸脱羧酶活性的酶或具有2-氧代戊二酸脱羧酶活性的酶的一种或多种核酸分子由选自SEQ ID NO:223和225的核酸序列编码。
2-氧代戊二酸还原酶、3-磷酸-羟基丙酮酸还原酶、3-磷酸甘油酸脱氢酶 (EC1.1.1.-)
本公开描述了可以催化以下反应的酶:
Figure BDA0003310804120000691
Figure BDA0003310804120000692
Figure BDA0003310804120000693
3-磷酸甘油酸脱氢酶也可以称为磷酸甘油酸脱氢酶(phosphoglyceratedehydrogenase);PHGDH(基因名称);D-3-磷酸甘油酸:NAD+氧化还原酶;α-磷酸甘油酸脱氢酶;3-磷酸甘油酸脱氢酶;D-3-磷酸甘油酸脱氢酶;甘油酸3-磷酸脱氢酶;甘油酸-1,3-磷酸脱氢酶;磷酸甘油酸氧化还原酶;磷酸甘油酸脱氢酶(phosphoglyceric aciddehydrogenase);SerA;3-磷酸甘油酸:NAD+2-氧化还原酶;SerA 3PG脱氢酶;3PHP还原酶。
3-磷酸甘油酸脱氢酶催化L-丝氨酸生物合成的第一个关键步。该酶受显示出协同作用的变构终产物抑制作用的调节。丝氨酸的抑制主要通过降低催化速度起作用,对底物的Km影响很小;因此,SerA被归类为V型变构酶。
已广泛研究了丝氨酸变构和协同抑制的基础。在同源四聚体中占据四个丝氨酸结合位点中的两个导致85%的活性抑制。丝氨酸的进一步结合显示出负协同性。磷酸能够减少对丝氨酸结合的位点协同效应;该效应主要是由于存在固有结合的NADH。Trp139Gly突变导致同型二聚酶在丝氨酸结合和变构抑制方面失去协同作用。效应子结合位点内残基的定点诱变、亚基之间的调节界面和灵活的铰链区支持一个模型,该模型中相邻结构域的移动参与抑制酶活性。瞬时动力学分析表明,抑制催化活性的协同作用是由于丝氨酸结合引起的构象变化。缺少调节结构域的酶不再受丝氨酸抑制,但其他动力学参数保持不变。杂合四聚体提供了对变构抑制机制的进一步了解。
定点诱变已允许鉴定活性位点内有助于底物结合和催化的残基。底物和核苷酸结合结构域之间铰链区的突变影响酶的kcat;某些突变使丝氨酸结合和催化抑制解耦合。
广泛的定点诱变和结构研究有助于详细了解变构调节、协同性和催化活性之间的相互作用。停流动力学分析(stopped-flow kinetic analysis)提供了对催化途径的进一步了解,表明两个催化方向的限速步骤都是酶的构象变化。丝氨酸结合表现为导致酶、辅酶、底物和效应子之间形成无活性-端(dead-end)四元复合物,消除了底物结合后的构象变化。
该酶还具有α-酮戊二酸还原酶活性,生成2-羟基戊二酸。虽然该反应的代谢作用尚不清楚,但认为其可能在调节丝氨酸生物合成和将NADH再循环回NAD+方面发挥作用,尤其是在厌氧过程中。
已解析了野生型酶和许多点突变体的晶体结构。该结构表明该同源四聚体的每个亚基由三个不同的结构域组成,一个核苷酸结合结构域、一个底物结合结构域和一个调节/丝氨酸结合结构域。
serA是以甘油基础介质生长所必需的;加入丝氨酸可以挽救生长缺陷。
在一些实施方案中,具有3-磷酸甘油酸脱氢酶活性的酶可以是具有3-磷酸-羟基丙酮酸还原酶活性的酶或具有2-氧代戊二酸还原酶活性的酶。在一些实施方案中,具有3-磷酸甘油酸脱氢酶活性的酶、具有3-磷酸-羟基丙酮酸还原酶活性的酶或具有2-氧代戊二酸还原酶活性的酶催化甘油酸3-磷酸转化为3-磷酸羟基丙酮酸。在一些实施方案中,具有3-磷酸甘油酸脱氢酶活性的酶、具有3-磷酸-羟基丙酮酸还原酶活性的酶或具有2-氧代戊二酸还原酶活性的酶由与serA具有至少70%序列同一性、具有至少80%序列同一性、或具有至少90%序列同一性的氨基酸序列编码。在一些实施方案中,具有3-磷酸甘油酸脱氢酶活性的酶、具有3-磷酸-羟基丙酮酸还原酶活性的酶或具有2-氧代戊二酸还原酶活性的酶是serA。
在一些实施方案中,编码具有3-磷酸甘油酸脱氢酶活性的酶的一种或多种核酸分子是serA,或其同源物。在另一个实施方案中,编码具有3-磷酸甘油酸脱氢酶活性的酶、具有3-磷酸-羟基丙酮酸还原酶活性的酶或具有2-氧代戊二酸还原酶活性的酶的一种或多种核酸分子包含SEQ ID NO:228中列出的氨基酸序列。在一个进一步的实施方案中,编码具有3-磷酸甘油酸脱氢酶活性的酶、具有3-磷酸-羟基丙酮酸还原酶活性的酶或具有2-氧代戊二酸还原酶活性的酶的一种或多种核酸分子由SEQ ID NO:227中列出的核酸序列编码。
3-磷酸丝氨酸转氨酶、丝氨酸转氨酶、L-丝氨酸转氨酶(EC 2.6.1.52)
本公开描述了可以催化以下反应的酶:
Figure BDA0003310804120000701
Figure BDA0003310804120000702
Figure BDA0003310804120000711
Figure BDA0003310804120000712
3-磷酸丝氨酸转氨酶(3-phosphoserine aminotransferase)也可以称为磷酸丝氨酸转氨酶(phosphoserine transaminase);PSAT;磷酸丝氨酸转氨酶;羟基丙酮酸磷酸-谷氨酸转氨酶;L-磷酸丝氨酸转氨酶;磷酸羟基丙酮酸转氨酶;磷酸羟基丙酮酸-谷氨酸转氨酶;3-O-磷酸-L-丝氨酸:2-氧代戊二酸转氨酶;SerC;PdxC;3PHP转氨酶。
serC编码的酶是磷酸丝氨酸/磷酸羟基苏氨酸转氨酶,其通过使用不同的底物在丝氨酸和吡哆醇的生物合成中起作用。吡哆醛5'-磷酸是这两种酶活性的辅因子,表明其可以以自催化方式起作用,刺激其自身的生物合成。
已研究了转氨酶之间的冗余和混杂。没有观察到对非磷酸化底物的活性;然而,3-羟基丙酮酸能够用作SerC酶活性测定的底物。此外,遗传实验表明SerC是一种次要的丙氨酸转氨酶。
ArgD和SerC两种酶的正常活性足以生物合成琥珀酰二氨基庚二酸(SDAP)和赖氨酸;第三种酶AstC足以生物合成SDAP,但单独时不能满足细胞对赖氨酸的需求。其他酶(包括GabT和PuuE)可能有助于SDAP的生物合成。从质粒表达argD、astC、serC、aspC、gabT、hisC、ilvE、patA、puuE或tyrB允许三重ΔargD serC astC突变体以基础介质生长。
已解析了未连接形式的和与底物类似物α-甲基-L-谷氨酸复合的该酶的晶体结构,并提出了分子反应机制。
serC是以甘油基础介质生长所必需的;加入丝氨酸和吡哆醇(pyridoxol)/吡哆素(pyridoxine)可以挽救生长缺陷。
在一些实施方案中,具有磷酸丝氨酸转氨酶活性的酶可以是具有L-丝氨酸转氨酶活性的酶或具有丝氨酸转氨酶活性的酶。在一些实施方案中,具有磷酸丝氨酸转氨酶活性的酶、具有L-丝氨酸转氨酶活性的酶或具有丝氨酸转氨酶活性的酶催化L-丝氨酸转化为羟基丙酮酸。在一些实施方案中,具有磷酸丝氨酸转氨酶活性的酶、具有L-丝氨酸转氨酶活性的酶或具有丝氨酸转氨酶活性的酶由与serC具有至少70%序列同一性、具有至少80%序列同一性、或具有至少90%序列同一性的氨基酸序列编码。在一些实施方案中,具有磷酸丝氨酸转氨酶活性的酶、具有L-丝氨酸转氨酶活性的酶或具有丝氨酸转氨酶活性的酶是serC。
在一些实施方案中,编码具有磷酸丝氨酸转氨酶活性的酶的一种或多种核酸分子是serC,或其同源物。在另一个实施方案中,编码具有磷酸丝氨酸转氨酶活性的酶、具有L-丝氨酸转氨酶活性的酶或具有丝氨酸转氨酶活性的酶的一种或多种核酸分子包含SEQ IDNO:230中列出的氨基酸序列。在一个进一步的实施方案中,编码具有磷酸丝氨酸转氨酶活性的酶、具有L-丝氨酸转氨酶活性的酶或具有丝氨酸转氨酶活性的酶的一种或多种核酸分子由SEQ ID NO:229中列出的核酸序列编码。
3-磷酸-羟基丙酮酸磷酸酶
本公开描述了可以催化以下反应的酶:
3-磷酸-羟基丙酮酸+H2O→羟基丙酮酸+磷酸
YeaB(NudL)属于Nudix水解酶家族,预测其具有辅酶A焦磷酸水解酶活性。
yeaB(nudL)作为pgsA突变体中flhDC转录抑制的多拷贝抑制因子被分离。该抑制可能是由于过表达nudL的细胞中σS表达的减少。
yeaB(nudL)也作为pdxB缺失株的PLP营养缺陷的多拷贝抑制因子被分离。发现NudL是偶然发现的代谢途径的一部分,该途径产生吡哆醛5'-磷酸生物合成I途径的中间体4-磷酸-羟基-L-苏氨酸,其位于PdxB的下游。该途径从丝氨酸生物合成中转移3-磷酸羟基丙酮酸。NudL是将3-磷酸羟基丙酮酸转化为羟基丙酮酸的低效催化剂(Kcat为5.7x10-5),但其活性表现为足以生产PLP。
在一些实施方案中,具有3-磷酸-羟基丙酮酸磷酸酶活性的酶由与yeaB具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一些实施方案中,具有3-磷酸-羟基丙酮酸磷酸酶活性的酶是yeaB。
在一些实施方案中,编码具有3-磷酸-羟基丙酮酸磷酸酶活性的酶的一种或多种核酸分子是yeaB,或其同源物。在另一个实施方案中,编码具有3-磷酸-羟基丙酮酸磷酸酶活性的酶的一种或多种核酸分子包含SEQ ID NO:232中列出的氨基酸序列。在一个进一步的实施方案中,编码具有3-磷酸-羟基丙酮酸磷酸酶活性的酶的一种或多种核酸分子由SEQID NO:231中列出的核酸序列编码。
磷酸丝氨酸磷酸酶(EC 3.1.3.3)
本公开描述了可以催化以下反应的酶:
3-磷酸-L-丝氨酸+H2O→L-丝氨酸+磷酸
磷酸丝氨酸磷酸酶催化丝氨酸生物合成的最后一步。该酶属于卤酸脱卤酶(HAD)样水解酶超家族。最初使用来自大肠杆菌W株的部分纯化的酶进行酶学研究;作为HAD酶超家族研究的一部分,对该纯化酶进行了分析。
serB是以甘油基础介质生长所必需的;加入丝氨酸可以挽救生长缺陷。鉴定了Gph、HisB和YtjC为条件ΔserB表型的多拷贝抑制因子。定向进化实验鉴定了增加这些抑制因子的适应性和酶活性的突变。
在一些实施方案中,具有磷酸丝氨酸磷酸酶活性的酶由与serB具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一些实施方案中,具有磷酸丝氨酸磷酸酶活性的酶是serB。
在一些实施方案中,编码具有磷酸丝氨酸磷酸酶活性的酶的一种或多种核酸分子是serB,或其同源物。在另一个实施方案中,编码具有磷酸丝氨酸磷酸酶活性的酶的一种或多种核酸分子包含SEQ ID NO:234中列出的氨基酸序列。在一个进一步的实施方案中,编码具有磷酸丝氨酸磷酸酶活性的酶的一种或多种核酸分子由SEQ ID NO:233中列出的核酸序列编码。
丝氨酸-丙酮酸转氨酶(EC 2.6.1.51)
本公开描述了可以催化以下反应的酶:
Figure BDA0003310804120000731
Figure BDA0003310804120000732
丝氨酸-丙酮酸转氨酶也可以称为丙氨酸-乙醛酸转氨酶。
过氧化物酶体丝氨酸-丙酮酸转氨酶(AGXT1)和线粒体定位的丙氨酸-乙醛酸转氨酶2(AGXT2)均使用丙氨酸作为氨基供体催化乙醛酸转化为甘氨酸。与AGXT2不同,AGXT1不能利用非对称的二甲基精氨酸(ADMA)作为氨基供体。
过氧化物酶体丝氨酸-丙酮酸转氨酶是磷酸吡哆醛依赖性的肝脏特异性的酶,其由同源二聚体组成。其在过氧化物酶体中的位置对于适当的酶活性至关重要。C-末端的过氧化物酶体靶向序列(PTS1)是易位至过氧化物酶体中所必需的。
丝氨酸-丙酮酸转氨酶的功能障碍或错误靶向导致肝过氧化物酶体缺失,导致乙醛酸逃逸至细胞质中并在其中进一步代谢为草酸和乙醇酸。草酸不能在人体中进一步代谢,导致在肾脏和泌尿道中形成不溶性的草酸钙。AGXT1基因的突变导致过氧化物酶体靶向不当,并导致常染色体隐性代谢障碍(1型原发性高草酸尿症),其导致不可逆的肾损伤。三分之一的1型原发性高草酸尿症患者具有独特的蛋白质分选缺陷,其中肝过氧化物酶体的酶误定位至线粒体。
在一些实施方案中,具有丝氨酸-丙酮酸转氨酶活性的酶由与人AGXT1具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一些实施方案中,具有丝氨酸-丙酮酸转氨酶活性的酶是人AGXT1。
在一些实施方案中,编码具有丝氨酸-丙酮酸转氨酶活性的酶的一种或多种核酸分子是AGXT1,或其同源物。在一些实施方案中,编码具有丝氨酸-丙酮酸转氨酶活性的酶的一种或多种核酸分子包含SEQ ID NO:244中列出的氨基酸序列。在一个进一步的实施方案中,编码具有丝氨酸-丙酮酸转氨酶活性的酶的一种或多种核酸分子由SEQ ID NO:243中列出的核酸序列编码。
丝氨酸脱羧酶(EC 4.1.1.65)
本公开描述了可以催化以下反应的酶:
3-O-sn-磷脂酰-L-丝氨酸+H+→L-1-磷脂酰乙醇胺+CO2
丝氨酸脱羧酶也可以称为磷脂酰丝氨酸脱羧酶;PS脱羧酶;磷脂酰-L-丝氨酸羧基裂解酶。
磷脂酰丝氨酸脱羧酶是使用共价结合的丙酮酰辅基的一小类酶之一。认为丙酮酰基团的作用方式类似于磷酸吡哆醛辅因子,通过与底物的氨基基团形成席夫碱,然后作为电子库(electron sink)促进脱羧作用。
其中四种酶,组氨酸脱羧酶(E.C.4.1.1.22)、磷脂酰丝氨酸脱羧酶、天冬氨酸1-脱羧酶和S-腺苷甲硫氨酸脱羧酶是形成重要生物胺的脱羧酶。已知所有这些酶都具有通过酰胺连接至α亚基的氨基末端的丙酮酰辅基。该组中的另外两种酶是D-脯氨酸还原酶和甘氨酸还原酶(E.C.1.21.4.2)。
含有丙酮酰基的酶表达为酶原,通过称为丝氨酸分解(serinolysis)的自成熟裂解对酶原进行翻译后加工。在这个过程中,由丝氨酸残基形成丙酮酰基团,将前体蛋白分成两部分,成为α和β亚基。在某些情况下,可能涉及另外的亚基。
该酶与其他由不同亚基组成的丙酮酰基依赖性脱羧酶的不同之处在于,丙酮酸辅基与较小的亚基相关联。该酶是数目未知的异源二聚体的多聚体。
在一些实施方案中,具有丝氨酸脱羧酶活性的酶催化L-丝氨酸转化为乙醇胺。
在一些实施方案中,具有丝氨酸脱羧酶活性的酶由与拟南芥SDC具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一些实施方案中,具有丝氨酸脱羧酶活性的酶是拟南芥SDC。
在一些实施方案中,编码具有丝氨酸脱羧酶活性的酶的一种或多种核酸分子是SDC,或其同源物。在一些实施方案中,编码具有丝氨酸脱羧酶活性的酶的一种或多种核酸分子包含SEQ ID NO:236中列出的氨基酸序列。在一个进一步的实施方案中,编码具有丝氨酸脱羧酶活性的酶的一种或多种核酸分子由SEQ ID NO:235中列出的核酸序列编码。
乙醇胺氧化还原酶(脱氨基)(EC 1.4.3.8)、乙醇胺转氨酶(EC 2.6.1.-)
本公开描述了可以催化以下反应的酶:
乙醇胺+氧+H2O→铵+过氧化氢+乙醇醛
乙醇胺+2-氧代戊二酸→乙醇醛+L-谷氨酸
乙醇胺氧化还原酶(脱氨基)也可以称为乙醇胺氧化酶。该酶属于氧化还原酶家族,具体是那些以氧为受体作用于供体的CH-NH2基团的酶。
在一些实施方案中,乙醇胺氧化酶或乙醇胺转氨酶催化乙醇胺转化为乙醇醛。
在一些实施方案中,具有乙醇胺氧化酶活性的酶由与大肠杆菌tynA具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一些实施方案中,具有乙醇胺氧化酶活性的酶是大肠杆菌tynA。
在一些实施方案中,编码具有乙醇胺氧化酶活性的酶的一种或多种核酸分子是tynA,或其同源物。在一些实施方案中,编码具有乙醇胺氧化酶活性的酶的一种或多种核酸分子包含SEQ ID NO:238中列出的氨基酸序列。在一个进一步的实施方案中,编码具有乙醇胺氧化酶活性的酶的一种或多种核酸分子由SEQ ID NO:237中列出的核酸序列编码。
在一些实施方案中,具有乙醇胺转氨酶活性的酶由与大肠杆菌alaA具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一些实施方案中,具有乙醇胺转氨酶活性的酶是大肠杆菌alaA。
在一些实施方案中,编码具有乙醇胺转氨酶活性的酶的一种或多种核酸分子是alaA,或其同源物。在一些实施方案中,编码具有乙醇胺转氨酶活性的酶的一种或多种核酸分子包含SEQ ID NO:240中列出的氨基酸序列。在一个进一步的实施方案中,编码具有乙醇胺转氨酶活性的酶的一种或多种核酸分子由SEQ ID NO:239中列出的核酸序列编码。
羟基丙酮酸还原酶(EC 1.1.1.-)
本公开描述了可以催化以下反应的酶:
Figure BDA0003310804120000751
羟基丙酮酸还原酶也可以称为β-羟基丙酮酸还原酶;NADH:羟基丙酮酸还原酶;D-甘油酸脱氢酶。
羟基丙酮酸还原酶是存在于高等植物、藻类、哺乳动物组织和细菌中的酶。在大多数情况下,已假定其将羟基丙酮酸转化为甘油酸。然而,大多数酶也将乙醛酸还原为乙醇酸。
在丝氨酸循环甲基营养菌中,羟基丙酮酸还原酶在碳的同化中起关键作用。其催化羟基丙酮酸转化为甘油酸,这是丝氨酸循环的关键步骤,但该酶也通过乙醛酸和乙醇酸的相互转化在C2化合物的代谢中发挥重要作用。
在一些实施方案中,羟基丙酮酸还原酶催化甘油酸转化为羟基丙酮酸。
在一些实施方案中,具有羟基丙酮酸还原酶活性的酶由与大肠杆菌ghrB具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一些实施方案中,具有羟基丙酮酸还原酶活性的酶是大肠杆菌ghrB。
在一些实施方案中,编码羟基丙酮酸还原酶的一种或多种核酸分子是ghrB,或其同源物。在一些实施方案中,编码具有羟基丙酮酸还原酶活性的酶的一种或多种核酸分子包含SEQ ID NO:242中列出的氨基酸序列。在一个进一步的实施方案中,编码具有羟基丙酮酸还原酶活性的酶的一种或多种核酸分子由选自SEQ ID NO:241中列出的核酸序列编码。
甘油酸脱羧酶
本公开描述了可以催化以下反应的酶:
D-甘油酸+H+→乙二醇+CO2
在一些实施方案中,甘油酸脱羧酶催化甘油酸转化为乙二醇。
3-磷酸甘油酸磷酸酶(EC 3.1.3.38)或2-磷酸甘油酸磷酸酶(EC 3.1.3.20)
本公开描述了可以催化以下反应的酶:
3-磷酸-D-甘油酸+H2O→D-甘油酸+磷酸
2-磷酸-D-甘油酸+H2O→D-甘油酸+磷酸
3-磷酸甘油酸磷酸酶也可以称为D-3-磷酸甘油酸磷酸酶;3-PGA磷酸酶。2-磷酸甘油酸磷酸酶也可以称为D-2-磷酸甘油酸磷酸酶;2-PGA磷酸酶。这些酶属于水解酶家族,具体是那些作用于磷酸单酯键的酶。
在一些实施方案中,具有3-磷酸甘油酸磷酸酶活性的酶或具有2-磷酸甘油酸磷酸酶活性的酶由与大肠杆菌phoA具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一些实施方案中,具有3-磷酸甘油酸磷酸酶活性的酶或具有2-磷酸甘油酸磷酸酶活性的酶是大肠杆菌phoA。
在一些实施方案中,编码具有3-磷酸甘油酸磷酸酶活性的酶或具有2-磷酸甘油酸磷酸酶活性的酶的一种或多种核酸分子是phoA,或其同源物。在一些实施方案中,编码具有3-磷酸甘油酸磷酸酶活性的酶或具有2-磷酸甘油酸磷酸酶活性的酶的一种或多种核酸分子包含SEQ ID NO:246中列出的氨基酸序列。在一个进一步的实施方案中,编码具有3-磷酸甘油酸磷酸酶活性的酶或具有2-磷酸甘油酸磷酸酶活性的酶的一种或多种核酸分子由SEQID NO:245中列出的核酸序列编码。
甘油酸激酶(EC 2.7.1.31)
本公开描述了可以催化以下反应的酶:
Figure BDA0003310804120000761
Figure BDA0003310804120000762
甘油酸激酶也可以称为甘油酸3-激酶;甘油酸激酶(磷酸化)(双关(ambiguous));D-甘油酸3-激酶;D-甘油酸激酶(双关);甘油酸激酶(双关);GK(双关);D-甘油酸激酶(双关);ATP:(R)-甘油酸3-磷酸转移酶。
该酶属于转移酶家族,具体是那些以醇基团为受体转移含有磷的基团的酶(磷酸转移酶)。该酶参与3种代谢途径:丝氨酸/甘氨酸/苏氨酸代谢、甘油脂代谢和乙醛酸-二羧酸代谢。
在一些实施方案中,具有甘油酸激酶活性的酶催化3-磷酸甘油酸转化为甘油酸。在其他实施方案中,具有甘油酸激酶活性的酶催化2-磷酸甘油酸转化为甘油酸。
在一些实施方案中,具有甘油酸激酶活性的酶是甘油酸3-激酶。在一些实施方案中,具有甘油酸3-激酶活性的酶由与拟南芥GLYK具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一些实施方案中,甘油酸3-激酶是拟南芥GLYK。
在一些实施方案中,编码具有甘油酸3-激酶活性的酶的一种或多种核酸分子是GLYK,或其同源物。在一些实施方案中,编码具有甘油酸3-激酶活性的酶的一种或多种核酸分子包含SEQ ID NO:248中列出的氨基酸序列。在一个进一步的实施方案中,编码具有甘油酸3-激酶活性的酶的一种或多种核酸分子由SEQ ID NO:247中列出的核酸序列编码。
在一些实施方案中,具有甘油酸激酶活性的酶是具有甘油酸2-激酶活性的酶。在一些实施方案中,具有甘油酸2-激酶活性的酶由与大肠杆菌glxK具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一些实施方案中,具有甘油酸2-激酶活性的酶由与大肠杆菌garK具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在其他实施方案中,具有甘油酸2-激酶活性的酶是大肠杆菌glxK。
在一些实施方案中,甘油酸2-激酶是大肠杆菌garK。
在一些实施方案中,编码具有甘油酸2-激酶活性的酶的一种或多种核酸分子是glxK,或其同源物。在一些实施方案中,编码具有甘油酸2-激酶活性的酶的一种或多种核酸分子是garK,或其同源物。在一些实施方案中,编码具有甘油酸2-激酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO:250和252的氨基酸序列。在一个进一步的实施方案中,编码具有甘油酸2-激酶活性的酶的一种或多种核酸分子由选自SEQ ID NO:249和251的核酸序列编码。
转移一碳基团的转移酶(EC 2.1.2.-)
本公开描述了可以催化以下反应的酶:
Figure BDA0003310804120000771
可以使用转移酶如羟甲基-、甲酰基-和相关转移酶。羟甲基-、甲酰基-和相关转移酶的示例包括甘氨酸羟甲基转移酶、磷酸核糖基甘氨酰胺甲酰基转移酶、磷酸核糖氨基咪唑甲酰胺甲酰基转移酶、甘氨酸亚氨代甲基(formimidoyl)转移酶、谷氨酸亚氨甲基(formimino)转移酶、D-丙氨酸2-羟甲基转移酶、脱氧胞苷酸5-羟甲基转移酶、甲硫氨酰基-tRNA甲酰基转移酶、氨甲基转移酶、3-甲基-2-氧代丁酸羟甲基转移酶和UDP-4-氨基-4-脱氧-L-阿拉伯糖甲酰基转移酶。
丝氨酸羟甲基转移酶(EC 2.1.2.1)
本公开描述了可以催化以下反应的酶:
Figure BDA0003310804120000772
丝氨酸羟甲基转移酶(GlyA)将丝氨酸转化为甘氨酸,同时将甲基基团转移至四氢叶酸,从而形成5,10-亚甲基四氢叶酸(M-THF)。M-THF是细胞中C1单位的主要来源,使GlyA成为嘌呤、胸苷、甲硫氨酸、胆碱和脂质的生物合成的关键酶。
该酶还催化多种副反应,包括5,10-亚甲基THF水解为5-甲酰THF,以及3-羟基氨基酸(L-苏氨酸、别苏氨酸、3-苯基丝氨酸)可逆裂解为甘氨酸和醛。D-丙氨酸通过与磷酸吡哆醛辅基反应形成磷酸吡哆胺使酶失活。
该酶保守区内的Thr226残基表现为与底物鉴别有关。His228残基在确定反应的特异性中起作用。Lys229表现为不起到催化作用。Arg363表现为是氨基酸底物的羧基基团的结合位点。Tyr65的羟基基团可能参与活性位点从封闭构象到开放构象的转化。Tyr55和Arg235都是转醛基反应所必需的。
对酶重折叠的研究表明,吡哆醛5'-磷酸(PLP)仅在折叠途径的末尾与二聚脱辅基酶结合。已进一步研究了PLP加入的机制。在高浓度的PLP下,第二个PLP分子可以在Lys346处结合。PLP结合位点的稳定性涉及保守的疏水接触区。Tyr55是正确定位PLP辅因子所必需的。
已解析了野生型和突变体丝氨酸羟甲基转移酶的晶体结构。
glyA突变体不能使用甘氨酸作为唯一氮源。glyA突变体对甘氨酸是营养缺陷的;后来表明glyA是以甘油基础介质生长所必需的。
glyA mRNA中结构基因的3'序列是mRNA稳定性所必需的。
在一些实施方案中,具有丝氨酸羟甲基转移酶活性的酶由与大肠杆菌glyA具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一些实施方案中,编码具有丝氨酸羟甲基转移酶活性的酶的一种或多种核酸分子包含UniProt ID P0A825中列出的氨基酸序列。在一个进一步的实施方案中,编码具有丝氨酸羟甲基转移酶活性的酶的一种或多种核酸分子由Gene ID 947022中列出的核酸序列编码。
甲醛脱氢酶(EC 1.2.1.46和EC 1.2.1.-)
本公开描述了可以催化以下反应的酶:
甲醛+NAD++H2O→甲酸+NADH+2H+
甲醛脱氢酶也可以称为连接NAD的甲醛脱氢酶、NAD依赖性甲醛脱氢酶或甲醛:NAD+氧化还原酶。
在动物、植物和细菌中发现的大部分甲醛脱氢酶都属于III类醇脱氢酶组,需要加入谷胱甘肽才能发挥活性。事实上,表明了这些酶的真正底物不是甲醛,而是由甲醛和谷胱甘肽以非酶促方式形成的S-羟甲基谷胱甘肽。
与那些酶不同,从恶臭假单胞菌中分离出的酶催化甲醛不可逆氧化为甲酸,而无需加入谷胱甘肽。由于其底物是甲醛,本质上这是“真正的”甲醛脱氢酶。与其他甲醛脱氢酶一样,恶臭假单胞菌FDH是含有锌的金属酶。其还需要NAD+作为电子受体。然而,与属于III类醇脱氢酶组的酶不同,其对4-甲基吡唑敏感。在一个实施方案中,甲醛脱氢酶来自恶臭假单胞菌。在一些实施方案中,甲醛脱氢酶由与恶臭假单胞菌fdhA具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一些实施方案中,编码甲醛脱氢酶的一种或多种核酸分子包含GenBank登录号BAA04743.1中列出的氨基酸序列。在一个进一步的实施方案中,编码甲醛脱氢酶的一种或多种核酸分子由GenBank登录号D21201.1中列出的核酸序列编码。
在工业上重要的放线菌谷氨酸棒杆菌(Corynebacterium glutamicum)ATCC13032中,有证据表明两种酶有助于降解有毒的甲醛,即由fadH基因编码的分枝硫醇(mycothiol)依赖性甲醛脱氢酶,和由ald(乙醛脱氢酶)基因编码的乙醛脱氢酶,后者在较小程度上起作用。缺乏这两种酶的突变体无法在含有甲醛的介质中生长。该突变体也不在含有香草酸的介质中生长,因为香草酸的氧化产生细胞内甲醛。当这种土壤细菌在其栖息地遇到甲醛时,或者当环境化合物(如香草酸)代谢过程中产生甲醛时,甲醛的解毒是必需的。FadH产生的甲酸可以被fdhF基因编码的甲酸脱氢酶进一步氧化为CO2
与野生型相比,ald突变体的甲醛降解减少了约30%。染色体ald基因的失活导致乙醛脱氢酶活性的丧失和该生物体以乙醇生长或利用乙醇的能力的丧失,表明乙醇经过两步氧化为乙酸。ald基因的表达依赖于转录调节因子RamA,而RamB对表达有轻微的负面影响。在一个实施方案中,甲醛脱氢酶来自谷氨酸棒杆菌ATCC 13032。在一些实施方案中,甲醛脱氢酶由与谷氨酸棒杆菌ATCC 13032的ald具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一些实施方案中,编码甲醛脱氢酶的一种或多种核酸分子包含UniProt ID Q8NLZ0中列出的氨基酸序列。在一个进一步的实施方案中,编码甲醛脱氢酶的一种或多种核酸分子由Gene ID 1020739中列出的核酸序列编码。
在一些实施方案中,甲醛脱氢酶由与食油假单胞菌(Pseudomonas oleovorans)alkH具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。
在酿酒酵母中,两个串联重复基因ALD2和ALD3编码醛脱氢酶的两种细胞质应激诱导亚型。这些同种型的表达依赖于一般应激转录因子Msn2和Msn4,但不依赖于HOG MAP激酶途径。两种形式都可以比使用NADP+更有效地使用辅因子NAD+,并且不被任何阳离子激活。虽然ALD3由多种压力诱导,包括渗透性休克、热休克、葡萄糖耗竭、氧化应激和药物,但ALD2仅由渗透应激和葡萄糖耗竭诱导。
在一些实施方案中,甲醛脱氢酶由与酿酒酵母ALD2具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在其他实施方案中,甲醛脱氢酶由与酿酒酵母ALD3具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一些实施方案中,编码甲醛脱氢酶的一种或多种核酸分子包含选自UniProt ID P47771和UniProt ID P54114的氨基酸序列。在一个进一步的实施方案中,编码甲醛脱氢酶还原酶的一种或多种核酸分子由选自Gene ID855206和Gene ID 855205的核酸序列编码。
在一些实施方案中,具有甲醛脱氢酶活性的酶由与人ALDH3A2具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在其他实施方案中,具有甲醛脱氢酶活性的酶由与人ALDH9A1具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一些实施方案中,编码具有甲醛脱氢酶活性的酶的一种或多种核酸分子包含选自UniProt ID P51648和UniProtID P49189的氨基酸序列。在一个进一步的实施方案中,编码具有甲醛脱氢酶活性的酶的一种或多种核酸分子由选自Gene ID 224和Gene ID 223的核酸序列编码。
甲酸脱氢酶(EC 1.2.1.-)
本公开描述了可以催化以下反应的酶:
甲酸+氧化的电子受体+H+→CO2+还原的电子受体
甲酸+H+→CO2+H2(由复合物催化)
甲酸+氧化的氢化酶3→CO2+还原的氢化酶3
甲酸脱氢酶-H是大肠杆菌中三种膜相关甲酸脱氢酶同工酶之一。所有同工酶都在生物体的厌氧代谢中起作用。
甲酸脱氢酶-H(FDH-H)位于细胞质中,FDH-H与氢化酶-3形成甲酸-氢裂解酶复合物。该酶对氧敏感,并且由于在FdhF开放阅读框中的框内UGA终止密码子位置共翻译掺入硒代半胱氨酸而含有硒。已以
Figure BDA0003310804120000802
的分辨率解析了FDH-H的晶体结构,证实了[4Fe-4S]簇的存在、硒代半胱氨酸与Mo辅因子的配位以及抑制剂硝酸结合位点的位置。甲酸和外部电子受体的缺失诱导fdhF的表达,硝酸、亚硝酸、三甲胺N-氧化物和氧抑制fdhF的表达。甲酸可以克服硝酸的抑制,但不能克服氧的抑制。DNA促旋酶的抑制增强fdhF的表达。
fdnGHI编码膜结合甲酸脱氢酶N(FDH-N),FDH-N是呼吸酶,其催化甲酸氧化为二氧化碳,向醌池提供电子以减少厌氧呼吸底物(如硝酸盐和三甲胺N-氧化物)。FDH-N是复合铁硫钼酶(CISM)家族的成员。FDH-N氧化甲酸是生电的(H+/e-=1);周质中甲酸的氧化伴随着内膜细胞质面的甲基萘醌还原。硝酸和厌氧菌诱导甲酸脱氢酶-N的表达,分别由NarL和Fnr介导。纯化的FDH-N含有三个亚基,分别称为α(FdnG)、β(FdnH)和γ(FdnI)。以
Figure BDA0003310804120000801
解析的晶体结构表明,该亚复合物进一步组织为生理相关的三聚体,其中α和β亚基位置朝向内膜的周质面,而γ亚基位置朝向细胞质。电子从α亚基中的甲酸氧化位点跨膜转移至γ亚基中的甲基萘醌还原位点。在甲基萘醌还原位点,从细胞质中吸收质子。
fdoGHI编码甲酸脱氢酶O(FDH-O),FDH-O是呼吸性钼酶,其催化甲酸氧化为二氧化碳,向膜可溶性醌池提供电子以还原硝酸。FDH-O和硝酸还原酶Z参与从甲酸至硝酸的电子传递途径,该途径在细胞从需氧条件转变为厌氧条件时是活跃的。该途径通过甲基萘醌或泛醌运转。FDH-O表现为组成型表达的;与甲酸脱氢酶N(FDH-N)不同,其不受Fnr或NarL的调控。FDH-O的表达在有氧条件下增加;在厌氧条件下,硝酸轻微刺激表达;全局调节因子H-NS和CRP可能在FDH-O表达的调节中发挥作用。FDH-O可能有助于细胞快速适应厌氧环境的能力,同时FDH-N的水平仍然不足。FDH-O是由α(FdoG)、β(FdoH)和γ(FdoI)亚基组成的异源三聚体复合物,其与厌氧表达的FDH-N具有广泛的序列相似性和共同的免疫学特性。
Candida boidinii甲酸脱氢酶FDH1是NAD依赖性酶,其介导甲酸的解毒,并受Cu2+、Hg、对氯汞苯甲酸、氰化物、叠氮化物、硫氰酸和氰酸的强烈抑制。氰化物的抑制是可逆的,并与甲酸竞争。甲醇诱导蛋白质表达,葡萄糖抑制蛋白质表达。由于该甲酸脱氢酶催化的酶促反应可以再生NADH,因此已将该酶克隆至大肠杆菌中,以优化需要NADH的工程化途径。
在工业上重要的放线菌谷氨酸棒杆菌ATCC 13032中,有证据表明甲酸脱氢酶催化甲酸氧化为CO2。甲酸和有毒的甲醛都存在于环境中,并且可以被这种土壤细菌通过甲醛氧化为甲酸而异化。这可以通过FadH和Ald实现。然后甲酸通过FdhF转化为CO2。FdhF是钼辅因子依赖性甲酸脱氢酶,其在有氧条件下有活性,据推测与应激反应有关。尚未定义FdhF使用的确切电子受体。fdhF基因是含有相关基因fdhD和cg0617的基因簇的一部分,突变体分析显示这些基因是甲酸脱氢酶活性所必需的。在甲酸存在下,谷氨酸棒杆菌ATCC 13032的生长受到一定程度的抑制,而缺乏甲酸脱氢酶活性的株则表现出更强的抑制作用。放射性示踪剂实验表明,当谷氨酸棒杆菌ATCC 13032以葡萄糖和13C-甲酸生长时,甲酸被代谢为13C-二氧化碳。fdhF缺失突变体不能代谢甲酸。生长研究还表明需要Mo2+。蛋白质序列分析表明FdhF不是完整的膜蛋白,但可能是细胞溶质的或膜相关蛋白。已在多种其他土壤细菌中鉴定出推定的直系同源物。
当Cupriavidus oxalaticus以甲酸为主要碳源和能源生长时,NAD+依赖性甲酸脱氢酶是生成NADH和CO2的关键酶。后者进入二磷酸核酮糖羧化酶反应。已从以甲酸生长的细胞中将该酶纯化至均质。该酶是复合黄素蛋白,含有2个FMN(黄素单核苷酸)、18-25个非血红素铁原子和15-20个酸不稳定硫化物。比活性为42单位/mg。该酶对其天然底物甲酸具有特异性,但可以接受多种非生理电子受体,包括甲基紫精、吩嗪硫酸甲酯、亚甲蓝、硝基蓝四唑盐、FMN、FAD、核黄素和氧。已经表明该酶也可以催化相反方向的反应。然而,在所采用的条件下,该酶催化甲酸氧化比CO2还原快约30倍。
来自Gottschalkia acidurici的NAD+依赖性甲酸脱氢酶催化可逆反应。在催化甲酸氧化为CO2的同时,其还催化后者还原为甲酸,然后甲酸转化为乙酸。该酶已部分纯化,发现其是大型酶复合物(分子量至少为200kDa),对氧和光非常敏感。该酶含有L-硒代半胱氨酸。在通过铁氧还蛋白进行甲酸氧化的过程中,该酶的粗制品可以与NAD还原偶联。当使用人工电子受体甲基紫精而不是NAD时,则不需要铁氧还蛋白。氰化物抑制该酶90%。细胞提取物中的基础甲酸氧化活性为0.85μmol/min/mg蛋白质,但在加入钨酸和亚硒酸后增加12倍。有趣的是,来自相关生物体Clostridium cylindrosporum的酶虽然对亚硒酸有类似的需求,但需要钼酸而不是钨酸,钨酸对其具有拮抗作用。
来自扭脱甲基杆菌(Methylobacterium extorquens)的含有钨的NAD+依赖性甲酸脱氢酶是异源二聚体,含有铁硫簇、FMN和钨。尽管已经发现了其他几个例子,但在需氧细菌中发现含有钨的酶是有些不寻常的。较小的β亚基表现为融合蛋白,其N-末端结构域与NueE样亚基相联系,其C-末端结构域与已知的NADH-泛醌氧化还原酶的NuoF样亚基相联系。
两个小组独立地从Methylosinus trichosporium OB3b中纯化出了两种不同形式的甲酸脱氢酶FDH,发现这两种蛋白质具有不同的特性。该蛋白质由两类亚基组成,亚基呈明显的α2β2排列,总大小为315kDa。该蛋白质含有非血红素铁和硫化物,不含其他金属,表现为需要FMN。
莫拉氏菌属物种(Moraxella sp.)的NAD+依赖性甲酸脱氢酶fdh是相对简单的二聚体蛋白质,没有辅基基团。
在一些实施方案中,具有甲酸脱氢酶活性的酶由与选自以下的甲酸脱氢酶具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码:大肠杆菌fdhF(chlF,FDH-H)、大肠杆菌FDH-N、大肠杆菌FDH-O、Candida boidiniiFDH1、谷氨酸棒杆菌fdhF、Cupriavidus oxalaticus的NAD+依赖性甲酸脱氢酶、Gottschalkia acidurici的NAD+依赖性甲酸脱氢酶、扭脱甲基杆菌(Methylobacteriumextorquens)Fdh1、Methylosinus trichosporium的甲酸脱氢酶和莫拉氏菌属物种的NAD+依赖性甲酸脱氢酶fdh。在一些实施方案中,编码甲酸脱氢酶或甲酸脱氢酶亚基的一种或多种核酸分子包含选自以下的氨基酸序列:UniProt ID P07658、UniProt ID P0AEK7、UniProt ID P0AAJ3、UniProt ID P24183、UniProt ID P32176、UniProt ID P0AAJ5、UniProt ID P0AEL0、UniProt ID O13437、UniProt ID Q8NSY6、UniProt ID Q8KTI7、UniProt ID Q8KTI8和UniProt ID O08375。在一个进一步的实施方案中,编码甲酸脱氢酶或甲酸脱氢酶亚基的一种或多种核酸分子由选自以下的核酸序列编码:Gene ID 948584、Gene ID 946038、Gene ID948794、Gene ID 946035、Gene ID 948394、Gene ID 948395、Gene ID 948383、GenBank登录号AJ011046.2、Gene ID 1021531、GenBank登录号AF489516和GenBank登录号Y13245.1。
甘氨酸裂解系统
甘氨酸裂解系统由四种蛋白质组成:三种酶和一种载体蛋白。在动物中,该系统与线粒体内膜松散结合。这些酶是i)P-蛋白(含有磷酸吡哆醛的蛋白质)或甘氨酸脱氢酶(脱羧)(EC1.4.4.2),ii)T-蛋白或氨甲基转移酶(EC2.1.2.10),以及iii)L-蛋白或二氢硫辛酰胺脱氢酶(EC1.8.1.4)。该载体蛋白称为H-蛋白(含有硫辛酸的蛋白质)。
甘氨酸裂解反应催化以下可逆反应:
Figure BDA0003310804120000821
该系统分为三个部分反应。该反应是完全可逆的,在甘氨酸裂解和甘氨酸合成中,与H-蛋白的硫辛酸结合的氨甲基部分代表一种中间体,通过T-蛋白的作用,该中间体随后降解为亚甲基四氢叶酸(M-THF)和氨,或可以由M-THF和氨形成该中间体。可能地,该反应可能涉及P-蛋白、甘氨酸的氨甲基部分和H-蛋白的三元复合物,将其作为关键中间状态。
P-蛋白催化的反应
甘氨酸降解的第一个部分反应是由P蛋白(甘氨酸脱羧酶)催化的脱羧反应。H-蛋白作为共底物。甘氨酸裂解反应最典型的特性之一是,虽然P-蛋白应该属于一类磷酸吡哆醛依赖性的氨基酸脱羧酶,但P-蛋白需要H-蛋白来显著催化甘氨酸的脱羧。该反应通过顺序随机机制进行,其中甘氨酸的羧基碳转化为二氧化碳。甘氨酸分子的残余部分被转移至巯基基团之一,巯基基团通过还原裂解与H蛋白相连的硫辛酸中的二硫键而形成。
P-蛋白是约200kDa的含有磷酸吡哆醛的蛋白质,是同源二聚体或异源二聚体的二聚体。前者每个亚基具有一分子磷酸吡哆醛,后者在β亚基上每个二聚体具有一分子该辅因子。吡哆醛辅因子连接于特定的赖氨酸残基上。吡哆醛辅因子与活性位点口袋非共价相互作用。T.thermophilus P-蛋白的活性位点通过具有面向溶剂的宽入口的通道连接至分子表面。通道周围的分子表面由几个带正电的氨基酸残基组成,这些氨基酸残基可能涉及与H蛋白形成复合物。
在一些实施方案中,具有甘氨酸脱羧酶活性的酶由与大肠杆菌gcvP具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一些实施方案中,编码具有甘氨酸脱羧酶活性的酶的一种或多种核酸分子包含UniProt IDP33195中列出的氨基酸序列。在一个进一步的实施方案中,编码具有甘氨酸脱羧酶活性的酶的一种或多种核酸分子由Gene ID 947394中列出的核酸序列编码。
T-蛋白催化的反应
与H-蛋白相连的甘氨酸脱羧部分在T-蛋白(氨甲基转移酶)的催化下进一步降解。该反应需要THF并产生氨、M-THF和具有还原的硫辛酸的H-蛋白。在不存在THF的情况下,产生甲醛而不是M-THF,但反应速率小于在THF存在下测量的反应速率的0.05%。在逆反应中,T-蛋白通过有序的Ter Bi机制催化由M-THF、氨和具有还原的硫辛酸的H-蛋白形成H-蛋白结合的氨甲基硫辛酸中间体,其中H-蛋白是第一个结合的底物,随后是M-THF和氨。产物释放的顺序是THF和装载甲胺的H-蛋白。
T-蛋白是约40kDa的单体,与H-蛋白形成1:1的复合物。一项使用大肠杆菌蛋白的交联研究表明,H-蛋白与T-蛋白的相互作用导致T-蛋白的构象变化。发现了T-蛋白的Lys-288和H-蛋白的Asp-43之间的分子间接触。T-蛋白的N-末端区是与H-蛋白的相互作用和将T-蛋白保持在紧凑的形式所必需的。已分析了游离形式的和与N5-甲基-四氢叶酸(M-THF的类似物)结合的人T-蛋白的晶体结构。整体结构由三个三叶草样的结构组成,在中央腔中THF辅因子与深埋在疏水口袋中的蝶啶环结合,谷氨酰基团指向C-末端侧表面。该结构类似于来自Termotoga naritima、大肠杆菌和Pyrococcus horikoshii OT3的细菌T-蛋白的结构。人T-蛋白的结构和突变分析表明,不变的Asp-101可能通过增加叶酸底物N10原子的亲核特性在催化起始中起关键作用。
已通过交联和定点诱变鉴定了参与叶酸结合的残基。GvcT的N-末端区域对于GvcT的正确构象是重要的,使得能够与H-蛋白相互作用。
在一些实施方案中,具有氨甲基转移酶活性的酶由与大肠杆菌gcvT具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一些实施方案中,编码具有氨甲基转移酶活性的酶的一种或多种核酸分子包含UniProt IDP27248中列出的氨基酸序列。在一个进一步的实施方案中,编码具有氨甲基转移酶活性的酶的一种或多种核酸分子由Gene ID 947390中列出的核酸序列编码。
L-蛋白催化的反应
甘氨酸裂解反应的最后一步是在L-蛋白的催化下,连接至H-蛋白的还原硫辛酸的再氧化。L-蛋白是公知的二氢硫辛酰胺脱氢酶、硫辛酰胺脱氢酶、二氢硫辛酰基脱氢酶或2-含氧酸(丙酮酸、2-氧代戊二酸和支链2-含氧酸)脱氢酶多酶复合物的E3蛋白组分。其催化电子向最终受体NAD的转移。
使用豌豆L-蛋白和H-蛋白的实验表明,二氢硫辛酰H-蛋白的氧化不受结构相关类似物(如apoH-蛋白或辛酰化H-蛋白)的存在的影响。L-蛋白和H-蛋白之间的结构相互作用对于氧化反应可能不是必需的。
已经研究了该反应的动力学,并提出了改进的乒乓机制。将定点诱变用于鉴定和表征氧化还原活性二硫化物和影响FAD辅因子氧化还原电位的带电残基。FAD辅因子的插入对于二聚化和充分的活性至关重要。
lpd无效突变体在有氧条件下产生更多的丙酮酸和L-谷氨酸。代谢通量分析显示Entner-Doudoroff途径I和乙醛酸旁路被激活。在大肠杆菌lpd突变体中检测到了另一种二氢硫辛酸脱氢酶活性;因此,可能存在同工酶。
大肠杆菌中lpd基因的突变导致丙酮酸脱氢酶复合物对NADH抑制不太敏感,并在厌氧生长期间具有活性。Glu354的氨基酸替换降低了该酶对NADH抑制的敏感性,提出其通过限制NADH的移动来发挥作用。
已表明lpd中的抑制子突变使缺乏硫氧还蛋白和谷胱甘肽/谷氧还蛋白还原途径的氧化还原缺陷突变体的生长恢复。抑制子突变降低了Lpd活性,导致二氢硫辛酰胺积累,然后二氢硫辛酰胺可以通过还原谷氧还蛋白作为电子供体。Lpd的再氧化使TCA循环的功能恢复。
与专性厌氧微生物相比,在耐氧微生物中lpd显示出不同的密码子适应,导致不同的翻译效率特征。因此预测lpd在氧化应激反应中起作用。已表明lpd缺失突变体特别是对过氧化氢暴露(而不是对其他应激)比野生型更敏感。
在一些实施方案中,具有二氢硫辛酰胺脱氢酶活性的酶由与大肠杆菌lpd(lpdA,E3亚基)具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一些实施方案中,编码具有二氢硫辛酰胺脱氢酶活性的酶的一种或多种核酸分子包含UniProt ID P0A9P0中列出的氨基酸序列。在一个进一步的实施方案中,编码具有二氢硫辛酰胺脱氢酶活性的酶的一种或多种核酸分子由Gene ID 944854中列出的核酸序列编码。
H-蛋白
H-蛋白是约14kDa的单体热稳定蛋白质。脊椎动物H-蛋白由125个氨基酸残基组成,硫辛酸共价连接至Lys-59。硫辛酰化豌豆叶H-蛋白(131个残基)的X射线晶体结构揭示了硫辛酰赖氨酸位于该蛋白质表面。如上所述,H-蛋白上的硫辛酰赖氨酸臂在甘氨酸裂解系统组分的活性位点之间运送反应中间体和还原当量。该机制类似于在2-含氧酸脱氢酶复合物中发现的机制。
大肠杆菌中的硫辛酸蛋白连接酶A(LplA)催化H-蛋白以及2-含氧酸脱氢酶复合物的酰基转移酶(E2)组分的硫辛酰化(lipoylation)。该酶催化由硫辛酸和ATP形成硫辛酰-AMP以及将硫辛酰-AMP的硫辛酰部分转移至H-蛋白和E2组分。X射线晶体学研究表明,LplA由一个大N-末端结构域和一个小C-末端结构域组成,在两个结构域之间的界面处有一个底物结合口袋。
在哺乳动物中,硫辛酰化是线粒体内事件。硫辛酸首先被硫辛酸激活酶激活为硫辛酰-GMP,使用GTP作为高能化合物。硫辛酸激活酶与已知为异生素代谢中链脂肪酸:辅酶A连接酶III的蛋白质相同。然后通过硫辛酰转移酶的作用,将硫辛酸从硫辛酰-GMP转移至脱辅基蛋白。
H-蛋白是由大肠杆菌中的gcvH基因编码的硫辛酰蛋白,该蛋白在将甘氨酸的甲胺基团从P-蛋白运送至T-蛋白时被还原,并被二氢硫辛酰胺脱氢酶重新氧化。GcvH作为gcv复合物的三种酶的底物发挥作用。
根据残基61-65的保守性及其与豌豆(Pisum sativum)蛋白的硫辛酸附着位点的对应关系,预测这些残基含有硫辛酰修饰(在赖氨酸上)。
已检查了GcvH和GcvT之间的相互作用。这两种蛋白质之间的相互作用可能是形成叶酸结合位点所必需的,其中叶酸聚谷氨酰区结合而暴露蝶啶环。GcvT N-末端对于与GcvH的相互作用很重要,可能是通过介导构象变化,并且GcvH的D43残基与GcvH-GcvT复合物中的GcvT接近。
在一些实施方案中,H-蛋白由与大肠杆菌gcvH具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一些实施方案中,编码H-蛋白的一种或多种核酸分子包含UniProt ID P0A6T9中列出的氨基酸序列。在一个进一步的实施方案中,编码H-蛋白的一种或多种核酸分子由Gene ID 947393中列出的核酸序列编码。
乙醇酸脱氢酶或乙醇酸氧化酶(EC 1.1.99.14)
本公开描述了可以催化以下反应的酶:
乙醇酸+氧化的电子受体→乙醛酸+还原的电子受体
乙醇酸脱氢酶也可以称为乙醇酸氧化酶、乙醇酸氧化还原酶和乙醇酸:(受体)2-氧化还原酶。
乙醇酸氧化酶催化利用乙醇酸作为唯一碳源的第一步。该酶可以是膜相关的。已分离了来自大肠杆菌ATCC11775(血清型O1:K1:H7)的细胞质膜相关乙醇酸氧化还原酶活性,并且GlcF亚基本身只能在膜部分中检测到。生理电子受体未知。从表达来自多拷贝质粒的glcDEF的大肠杆菌株中提取的粗提取物含有乙醇酸氧化酶活性。glcD、glcE或glcF中的插入突变体消除了这种活性,表明所有三种基因产物都是乙醇酸氧化酶复合物的亚基。以乙醇酸生长诱导glcDEFGB操纵子的表达。
拟南芥中推定的乙醇酸氧化酶是线粒体同源二聚体蛋白,每个单体结合一个FAD,并在叶、茎、花和根中表达。氰化物离子抑制酶活性。其立体特异性地催化D-乳酸氧化为丙酮酸,介导甲基乙二醛和D-乳酸的解毒。
在一些实施方案中,具有乙醇酸脱氢酶活性的酶由与选自以下的具有乙醇酸脱氢酶活性的酶具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码:大肠杆菌乙醇酸脱氢酶GLC和拟南芥乙醇酸脱氢酶。在一些实施方案中,编码乙醇酸脱氢酶或乙醇酸脱氢酶亚基的一种或多种核酸分子包含选自以下的氨基酸序列:UniProt ID P0AEP9、UniProt ID P52073、UniProt ID P52074和UniProt IDQ94AX4。在一个进一步的实施方案中,编码乙醇酸脱氢酶或乙醇酸脱氢酶亚基的一种或多种核酸分子由选自以下的核酸序列编码:Gene ID 947353、Gene ID 2847718、Gene ID2847717和GenBank登录号Y13245.1。
丙氨酸-乙醛酸转氨酶(EC 2.6.1.44)
本公开描述了可以催化以下反应的酶:
Figure BDA0003310804120000861
在酿酒酵母中,丙氨酸-乙醛酸转氨酶亚基是用于甘氨酸合成的三种不同的酶之一。通过比较敲除株中的酶比活性,鉴定了编码该酶的AGX1基因。当置于缺乏其他负责甘氨酸合成的酶的背景中时,AGX1中的突变产生了完全的甘氨酸营养缺陷。随后纯化和表征了该酶。该酶含有吡哆醛5'-磷酸作为辅因子,是约80kDa的同源二聚体,对L-丙氨酸和乙醛酸具有高度特异性。
线粒体定位的人丙氨酸-乙醛酸转氨酶2(AGXT2)和过氧化物酶体丝氨酸-丙酮酸转氨酶(AGXT1,见上文)均使用丙氨酸作为氨基供体催化乙醛酸转化为甘氨酸。然而,AGXT2也可以利用不对称二甲基精氨酸(ADMA)作为氨基供体,导致形成α-酮-δ-(NN-二甲基胍基)戊酸(DMGV),而AGXT1不可以。ADMA是一氧化氮(NO)合酶的有效内源性抑制剂。ADMA水平也受细胞溶质二甲基精氨酸二甲氨基水解酶(DDAH)的控制,DDAH将ADMA水解为瓜氨酸和二甲胺。ADMA水平升高与糖尿病、高血压、充血性心力衰竭和动脉粥样硬化有关。AGXT2是磷酸吡哆醛依赖性酶,主要在肾脏中表达,其活性是肾脏调节血压的一种机制。
在拟南芥中,已鉴定出具有四种转氨酶活性的丙氨酸转氨酶。AOAT1(GGAT1)位于过氧化物酶体。敲除植物具有降低的AOAT、GPAT(谷氨酸:丙酮酸转氨酶)、AGAT(丙氨酸:乙醛酸转氨酶)和GGAT(谷氨酸:乙醛酸转氨酶)活性。GGAT和AGAT活性的减少幅度最大。这表明AOAT1主要参与光呼吸。类似地,预测位于过氧化物酶体中的AOAT2(GGAT2)可能参与光呼吸。重组蛋白体外测定表明,GGAT1和GGAT2具有四种转氨酶活性,即GGAT、AGAT、GPAT和AOAT。这两种重组蛋白对氨基酸底物谷氨酸和丙氨酸以及含氧酸底物乙醛酸、丙酮酸和2-氧代戊二酸表现出非常相似的Km值。
在一些实施方案中,具有丙氨酸-乙醛酸转氨酶活性的酶由与选自以下的具有丙氨酸-乙醛酸转氨酶活性的酶具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码:酿酒酵母AGX1、人AGXT2、拟南芥AOAT1和拟南芥AOAT2。在一些实施方案中,编码具有丙氨酸-乙醛酸转氨酶活性的酶的一种或多种核酸分子包含选自以下的氨基酸序列:UniProt ID P43567、UniProt ID Q9BYV1、UniProt IDQ9LR30和UniProt ID Q9S7E9。在一个进一步的实施方案中,编码具有丙氨酸-乙醛酸转氨酶活性的酶的一种或多种核酸分子由选自以下的核酸序列编码:Gene ID 850514、Gene ID64902、TAIR登录号AT1G23310和TAIR登录号AT1G70580。
丙氨酸转氨酶(EC 2.6.1.2)
本公开描述了可以催化以下反应的酶:
Figure BDA0003310804120000871
在一些实施方案中,丙氨酸转氨酶是谷氨酸-丙酮酸转氨酶。AlaA是大肠杆菌中三种主要的丙氨酸合成转氨酶之一。AlaA和AlaC占细胞中90%的谷氨酸-丙酮酸转氨酶(GPT)活性。已以
Figure BDA0003310804120000872
的分辨率解析了AlaA的晶体结构。该结构显示了典型的折叠I型转氨酶的对称α2同源二聚体。alaA缺失株不具有生长缺陷,但alaA avtA双突变体在琼脂平板上形成小菌落。alaA avtA alaC三突变体具有在液体介质中生长缓慢的表型。可以通过加入丙氨酸来挽救双突变体和三突变体的缺陷。在不同的生长条件下进行了适应性和竞争性生长实验。特别是在限氧条件下,与在丰富介质中的生长相比,ΔalaA株在基础介质中的倍增时间增加。在竞争性生长条件下,即使在丰富介质中,ΔalaA突变与野生型相比也具有劣势。alaA在对减少应激的致命影响的基因的筛选中被鉴定。alaA插入突变体比野生型对丝裂霉素C和其他应激更敏感,对10%SDS更不敏感。alaA基因最初被鉴定为对丙氨酸或缬氨酸具有渗漏型需求的突变体。
AlaB是大肠杆菌中三种主要的丙氨酸合成转氨酶之一。AlaB催化谷氨酸-丙酮酸转氨酶反应,以谷氨酸作为氨基供体,由丙酮酸生成丙氨酸。已在粗细胞提取物中测定了该活性,并已在质粒上分离出了编码AlaB的基因。从多拷贝质粒表达alaB部分抑制了ilvEalaA突变株的生长缺陷。
AlaC是大肠杆菌中三种主要的丙氨酸合成转氨酶之一。已生成基于AlaA晶体结构的该酶的同源模型。alaC缺失株不具有生长缺陷,但alaA avtA alaC三突变体具有在液体介质中生长缓慢的表型。加入丙氨酸可以挽救该缺陷。在不同的生长条件下进行了适应性和竞争性生长实验。特别是在限氧条件下,与在丰富介质中的生长相比,ΔalaC株在基础介质中的倍增时间增加;与alaA和avtA突变体不同,加入L-丙氨酸使倍增时间恢复至在DMEM介质中观察到的倍增时间。在竞争性生长条件下,即使在丰富介质中,ΔalaC突变与野生型相比也具有劣势。转录调节因子SgrR激活alaC的表达。因此,AlaC可能在葡萄糖-磷酸应激中发挥作用。然而,alaC缺失突变体未显示出对诱导糖-磷酸应激的α-甲基葡萄糖苷的敏感性改变。
在人中,丙氨酸转氨酶是细胞质酶,其催化L-丙氨酸和2-氧代戊二酸之间的可逆转氨作用以形成丙酮酸和L-谷氨酸。这四种主要代谢中间体的相互转化赋予该酶降解和生物合成的双重作用。该酶参与骨骼肌和肝脏的丙氨酸-葡萄糖循环、糖异生和大脑中的谷氨酸生成。丙氨酸转氨酶在肾脏、骨骼肌、脂肪组织和心脏中表达。该酶有两种同工型:丙氨酸转氨酶1(GPT)和丙氨酸转氨酶2(GPT2)。从肝脏中纯化了人丙氨酸转氨酶1(GPT)。来自脂肪组织的重组人丙氨酸转氨酶2(GPT2)在大肠杆菌中表达,通过SDS-PAGE测定了分子量。该酶在脂肪组织、肌肉、大脑和肾脏中的表达水平较高,而在乳房和肝脏中的表达水平较低。
尚未报道来自海洋多毛类环节动物Arenicola marina(沙躅,lugworm)的丙氨酸转氨酶的亚基结构。通过凝胶过滤色谱法确定其天然表观分子量为91kDa。尚未鉴定在该生物体中编码其的基因。在海洋环节动物和软体动物中,该反应参与在缺氧(hypoxia)或缺氧症(anoxia)期间运作的厌氧能量生成途径。已从体壁肌肉中部分纯化并表征了来自该生物体的丙氨酸转氨酶(谷氨酸丙酮酸转氨酶)。在该组织中发现了高丙氨酸转氨酶活性。也已在贻贝(Mytilus edulis)组织中证实了特定的、可逆的、L-谷氨酸依赖性的L-丙氨酸转氨酶和L-天冬氨酸转氨酶活性。
拟南芥色氨酸转氨酶TAA1蛋白参与吲哚-3-丙酮酸的形成,吲哚-3-丙酮酸是吲哚-3-乙酸(IAA)的前体,IAA是生物学上重要的生长素,在许多植物物种中发挥植物激素作用。体外测定揭示了该吡哆醛5'-磷酸(PLP)依赖性转氨酶可以作用于多种不同的L-氨基酸,包括L-苯丙氨酸、L-酪氨酸、L-亮氨酸、L-丙氨酸、L-甲硫氨酸和L-谷氨酰胺,使用丙酮酸或2-氧代戊二酸作为共底物。然而,酶测定、计算机对接实验和突变体表型分析都表明L-色氨酸是该酶的体内底物。当用L-色氨酸和丙酮酸测试时,TAA1具有Km为0.29mM,Vmax为12.9μM/min。不清楚丙酮酸或2-氧代戊二酸哪一个是该酶的生物学上更相关的共底物。
在避荫(shade avoidance)突变体和具有弱乙烯不敏感性的突变体的筛选中鉴定了编码该蛋白质的基因,表明通过TAA1介导的途径合成的生长素对于对特定环境和激素刺激的反应特别重要。此外,当在拟南芥属植物中敲除TAA1和其一个或多个密切相关的家族成员(即TAR1和TAR2)时,需要适当生长素水平的正常发育过程(如胚胎发生)受到破坏。基于分布在16个科的30个不同物种的酶提取物在转氨酶反应中催化IPA形成的能力,该酶活性表现为广泛分布于植物界。三种藻类物种也具有该活性。
在拟南芥中,已鉴定出具有四种转氨酶活性的丙氨酸转氨酶。AOAT1(GGAT1)位于过氧化物酶体。敲除植物具有降低的AOAT、GPAT(谷氨酸:丙酮酸转氨酶)、AGAT(丙氨酸:乙醛酸转氨酶)和GGAT(谷氨酸:乙醛酸转氨酶)活性。GGAT和AGAT活性的减少幅度最大。这表明AOAT1主要参与光呼吸。类似地,预测位于过氧化物酶体中的AOAT2(GGAT2)可能参与光呼吸。重组蛋白体外测定表明,GGAT1和GGAT2具有四种转氨酶活性,即GGAT、AGAT、GPAT和AOAT。这两种重组蛋白对氨基酸底物谷氨酸和丙氨酸以及含氧酸底物乙醛酸、丙酮酸和2-氧代戊二酸表现出非常相似的Km值。
也已描述了来自Candida maltosa、丙酸梭菌(Clostridium propionicum)、Pyrococcus furiosus、Megathyrsus maximus和黍(Panicum miliaceum)的丙氨酸转氨酶活性。从NAD-ME型C4植物黍中克隆了推定的丙氨酸转氨酶,发现该酶在叶肉和束鞘细胞中均表达,并且该基因表达是光诱导的。在两种细胞类型的绿化过程中,mRNA积累大幅增加,这与该酶在C4光合作用中的预测作用一致。
在一些实施方案中,具有丙氨酸转氨酶活性的酶由与选自以下的具有丙氨酸转氨酶活性的酶具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码:大肠杆菌谷氨酸-丙酮酸转氨酶alaA、大肠杆菌谷氨酸-丙酮酸转氨酶alaB、大肠杆菌谷氨酸-丙酮酸转氨酶alaC、人丙氨酸转氨酶1(GPT)、人丙氨酸转氨酶2(GPT2)、Arenicola marina丙氨酸转氨酶、拟南芥色氨酸转氨酶TAA1、拟南芥AOAT1、拟南芥AOAT2、Candida maltosa丙氨酸转氨酶、丙酸梭菌丙氨酸转氨酶、Pyrococcus furiosus丙氨酸转氨酶aat、Megathyrsus maximus丙氨酸转氨酶和黍丙氨酸转氨酶AlaAT-2。在一些实施方案中,编码具有丙氨酸转氨酶活性的酶的一种或多种核酸分子包含选自以下的氨基酸序列:UniProt ID P0A959、UniProt ID P77434、UniProt ID P24298、UniProt ID Q8TD30、UniProt ID Q9S7N2、UniProt ID Q9LR30、UniProt ID Q9S7E9、UniProt ID Q9P9M8和UniProt ID P34106。在一个进一步的实施方案中,编码具有丙氨酸转氨酶活性的酶的一种或多种核酸分子由选自以下的核酸序列编码:Gene ID946772、Gene ID 946850、Gene ID2875、Gene ID 84706、Gene ID 843393、TAIR登录号AT1G23310、TAIR登录号AT1G70580、GenBank登录号AF163769.1和GenBank登录号X69421.1。
谷氨酸脱氢酶(EC 1.4.1.2和EC 1.4.1.3)
本公开描述了可以催化以下反应的酶:
Figure BDA0003310804120000891
Figure BDA0003310804120000901
在一些实施方案中,谷氨酸脱氢酶是来自酿酒酵母的NAD依赖性谷氨酸脱氢酶(GDH2),其将谷氨酸降解为氨和α-酮戊二酸。GDH2的表达对氮分解代谢物的抑制和细胞内氨水平敏感。
拟南芥中有两个NAD依赖性谷氨酸脱氢酶(GDH)基因GDH1和GDH2,分别编码α和β亚基。已检测到GDH的七种六聚体同种型,其由不同比例的α和β亚基组成。在不同的环境和生理条件下,不同的同种型分布在不同的组织中。GDH的酶活性部分在转录水平上部分受控制。
来自不解糖嗜胨菌(Peptoniphilus asaccharolyticus)的谷氨酸脱氢酶催化L-谷氨酸NAD依赖性氧化脱氨基为2-氧代戊二酸。该反应具有高度的底物特异性。在存在D-谷氨酸、D-或L-天冬氨酸、谷氨酰胺或当NADP替换NAD时未观察到活性。使用蔗糖梯度密度离心,研究人员估计该天然酶的分子量在300-340kDa之间,表明该酶可能是同源六聚体。另一方面,其他研究人员使用凝胶过滤估计该天然酶的分子量约为226kDa。对L-谷氨酸和NAD+的KM值分别为1.3mM和0.25mM。
Halobacterium salinarum是据报道具有多于一种GDH形式的生物体之一,不同形式的GDH利用不同的辅因子(NAD和NADP)。最终表明该生物体具有编码四种不同谷氨酸脱氢酶的四个基因。已纯化和生化表征了这些基因产物中的两个。最初预测其中一个基因gdhA1编码一种NADP特异性形式,但发现其编码一种NAD特异性酶。
人谷氨酸脱氢酶(GDH)是同源六聚体线粒体基质酶,其催化L-谷氨酸可逆氧化脱氨基为2-氧代戊二酸和氨。哺乳动物GDH是不寻常的酶,因为其能够使用NAD或NADP作为辅因子。人表达两种GDH同工酶。谷氨酸脱氢酶1(GLUD1)在肝脏、大脑、胰腺和肾脏中高水平表达。谷氨酸脱氢酶2(GLUD2)由X染色体连锁的无内含子基因编码,在视网膜、睾丸和大脑中表达。导致酶活性过度的GLUD1突变导致高胰岛素血症。已经广泛研究了正效应子(如ADP和L-亮氨酸)和负效应子(如GTP)对哺乳动物GDH活性的变构控制。
枯草芽孢杆菌PCI 219具有单一的谷氨酸脱氢酶(GDH),该酶对NAD(H)和NADP(H)具有双重辅酶特异性。通过凝胶过滤估计其分子量为250,000+/-20,000,通过蔗糖密度梯度区域离心估计为270,000+/-30,000。亚基大小约为57,000,表明其是同源四聚体。
从番茄(Solanum lycopersicum)组织中分离出了cDNA克隆。该cDNA编码的蛋白质与植物的谷氨酸脱氢酶(GDH)具有相同的特性。该蛋白的表达分析表明其在茎、根和叶中表达,但在果实组织中不存在。该研究还表明,番茄GDH1的两个亚基由单个基因编码。该酶将2-氧代戊二酸转化为L-谷氨酸。
也描述了来自丙酸梭菌和海栖热袍菌的谷氨酸脱氢酶活性。
在一些实施方案中,具有谷氨酸脱氢酶活性的酶由与选自以下的谷氨酸脱氢酶具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码:酿酒酵母NAD依赖性谷氨酸脱氢酶GDH2、拟南芥NAD依赖性谷氨酸脱氢酶GDH2、拟南芥NAD依赖性谷氨酸脱氢酶GDH1、不解糖嗜胨菌NAD依赖性谷氨酸脱氢酶gdhA、Halobacterium salinarum NAD依赖性谷氨酸脱氢酶gdhA、海栖热袍菌谷氨酸脱氢酶、人谷氨酸脱氢酶1(GLUD1)、人谷氨酸脱氢酶2(GLUD2)、枯草芽孢杆菌谷氨酸脱氢酶和番茄谷氨酸脱氢酶GDH1。在一些实施方案中,编码具有谷氨酸脱氢酶活性的酶的一种或多种核酸分子包含选自以下的氨基酸序列:UniProt ID P33327、UniProt ID Q38946、UniProt IDQ38946、UniProt ID P28997、UniProt ID P29051、UniProt ID P00367、UniProt IDP49448和UniProt ID P93541。在一个进一步的实施方案中,编码具有谷氨酸脱氢酶活性的酶的一种或多种核酸分子由选自以下的核酸序列编码:Gene ID 461927、TAIR登录号AT5G07440、TAIR登录号AT5G18170、GenBank登录号M76403.1、GenBank登录号X63837.1、Gene ID 2746、Gene ID 2747和GenBank登录号U48695.1。
乙醛脱氢酶(EC 1.2.1.10)
本公开描述了可以催化以下反应的酶:
Figure BDA0003310804120000911
大肠杆菌mhpF编码酰化乙醛脱氢酶。MhpF作为单体具有活性;反应的限速步骤表现为转硫酯化。MhpF参与β-氧化途径的工程化逆转中正丁醇的合成。MhpE的表达在翻译上与MhpF偶联,这两种蛋白质之间的相互作用表现为MhpE溶解所必需的。
大肠杆菌AdhE是同聚蛋白,具有三种Fe2+依赖性催化功能:醇脱氢酶、辅酶A依赖性乙醛脱氢酶和丙酮酸甲酸裂解酶失活酶。然而,AdhE是否存在丙酮酸甲酸裂解酶失活酶活性一直有争议。AdhE的同聚结构的不寻常之处在于,20-60个亚基呈螺旋状排列以形成棒状超微结构。在发酵条件下,AdhE催化乙酰辅酶A还原为乙醛,并将乙醛还原为乙醇。有氧地,在相反的方向上,AdhE可以催化乙醛氧化为乙酰辅酶A。adhE的表达表现为在转录和翻译水平上受到调节,并且可能在翻译后水平上受到调节。adhE的表达在厌氧生长期间比在有氧生长期间高约10倍。在早期工作中部分纯化和表征了来自大肠杆菌B的AdhE。后来从大肠杆菌B中将其纯化至同质,并对其连接辅酶A的醛脱氢酶活性进行了详细的动力学分析。提出了双-单-单-单乒乓机制(bi-uni-uni-uni ping-pong mechanism)。来自肠道沙门氏菌(Salmonella enterica)enterica serovar Typhimurium亚种的AdhE与大肠杆菌AdhE显示出70%氨基酸序列同一性。与大肠杆菌酶相比,该酶对醇底物具有较低的Km,并且具有一些底物特异性的差异。在代谢工程领域,adhE的缺失是生产化合物如琥珀酸、D-乳酸和聚羟基链烷酸的决定因素。
莱茵衣藻(Chlamydomonas reinhardtii)ADH1编码双功能乙醇脱氢酶/乙醛脱氢酶。其在缺氧条件下表现活跃,并参与衣藻中两种不同的厌氧乙醇生产途径。
DmpF是来自假单胞菌属物种的酰化乙醛脱氢酶。在假单胞菌属物种CF600中,间位裂解(meta-cleavage)途径的最后两个步骤涉及通过酶4-羟基-2-氧代戊酸醛缩酶和乙醛脱氢酶(酰化)将(S)-4-羟基-2-氧代戊酸转化为丙酮酸和乙酰辅酶A。生化研究表明,这两种酶包含双功能醛缩酶-脱氢酶异二聚体,并表明醛缩酶反应的产物乙醛通过通道机制(channeling mechanism)转移至脱氢酶活性位点。这将有毒的乙醛对细胞造成的风险最小化。
质粒构建体的蛋白质表达模式表明,在恶臭假单胞菌F1中存在todI基因产物。todI基因产物的预测氨基酸序列显示出与其他细菌酰化醛脱氢酶基因产物非常高的同一性。
丙酮丁醇梭菌ATCC 824的adhE基因编码具有乙醇脱氢酶和乙醛脱氢酶活性的多功能酶。在溶剂生成过程中,这两种活性对于正丁醇和乙醇的形成都是必要的。adhE基因是sol操纵子的一部分,位于pSOL1巨大质粒上。在丙酮丁醇梭菌ATCC 824中从质粒表达该基因导致NADH依赖性丁醇脱氢酶、NAD依赖性乙醛脱氢酶和丁醛脱氢酶的活性升高,以及NADH依赖性乙醇脱氢酶的活性小幅增加。用adhE基因补充缺乏丁醛脱氢酶、乙酰乙酸脱羧酶和乙酰乙酰辅酶A:乙酸/丁酸:辅酶A转移酶活性的突变体(其既不产生丁醇也不产生丙酮),导致丁醇的形成恢复,而没有任何丙酮形成或任何乙醇产量的显著增加,表明该酶的主要作用是形成丁醇,提供丁醛脱氢酶活性(将丁酰辅酶A转化为正丁醛)和丁醇脱氢酶活性。此外,该基因的失活大幅降低丁醇的产量(85%),支持了这一作用。来自pSOL1质粒的另一个基因adhE2编码第二个参与丁醇生产的多功能醛/醇脱氢酶。然而,该酶仅在产醇条件下产生,在产溶剂条件下不表达。来自株ATCC 824的基因最初称为aad。
还描述了来自肠系膜明串珠菌(Leuconostoc mesenteroides)、Pelobacteracetylenicus和恶臭假单胞菌的乙醛脱氢酶活性。部分纯化的肠系膜明串珠菌辅酶A依赖性醛脱氢酶无法与与其共纯化的连接NAD的醇脱氢酶分离。该酶对NAD具有特异性,不能使用NADP。虽然乙醛和1-丙醛是最好的底物,该酶也可以使用正丁醛(与乙醛的活性的31%)和异丁醛(14%)。
在一些实施方案中,具有乙醛脱氢酶活性的酶由与选自以下的具有乙醛脱氢酶活性的酶具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码:大肠杆菌mhpF、大肠杆菌AdhE、莱因衣藻ADH1、肠系膜明串珠菌辅酶A依赖性乙醛脱氢酶、Pelobacter acetylenicus乙醛脱氢酶、假单胞菌属物种dmpF、恶臭假单胞菌酰化乙醛脱氢酶todl、恶臭假单胞菌乙醛脱氢酶cmtH和丙酮丁醇梭菌醇/醛脱氢酶AdhE。在一些实施方案中,编码具有乙醛脱氢酶活性的酶的一种或多种核酸分子包含选自以下的氨基酸序列:UniProt ID P77580、UniProt P0A9Q7、UniProt ID A8JI07、UniProt IDQ52060、UniProt ID Q51949和UniProt ID P33744。在一个进一步的实施方案中,编码具有乙醛脱氢酶活性的酶的一种或多种核酸分子由选自以下的核酸序列编码:Gene ID945008、Gene ID 945837、Gene ID 5729132、GenBank登录号X60835.1、GenBank登录号U09250.1和Gene ID 1116167。
乙醇胺解氨酶(EC 4.3.1.7)
本公开描述了可以催化以下反应的酶:
Figure BDA0003310804120000931
乙醇胺解氨酶(EAL)允许大肠杆菌在外部维生素B12存在的情况下利用乙醇胺作为唯一氮源和唯一碳源。EAL是腺苷钴胺素依赖性酶,其被其底物自发失活,并可以被EutA重新激活。最初在非K-12株NCIB 8114中研究了该酶。已解析了N-末端截短但具有活性形式的、与辅因子和底物在二元和三元复合物中的该酶的晶体结构。该酶由(αβ)2二聚体的六聚体组成,α亚基保持着活性位点,钴胺素辅因子结合在α和β亚基之间的界面上。作者提出了与前述的腺苷钴胺素依赖性重排机制一致的反应机制。已在晶体结构的基础上对该反应的立体化学过程建模,对该酶明显缺乏立体特异性作出了解释。分解代谢物抑制EAL的产生,乙醇胺和腺苷钴胺素辅因子同时存在诱导EAL的产生。乙醇胺解氨酶包含两个亚基α(EutB)和β(EutC)。
在一些实施方案中,具有乙醇胺解氨酶活性的酶由与具有乙醇胺解氨酶活性的大肠杆菌酶具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一些实施方案中,编码乙醇胺解氨酶亚基的一种或多种核酸分子包含选自UniProt ID P0AEJ6和UniProt ID P19636的氨基酸序列。在一个进一步的实施方案中,编码乙醇胺解氨酶亚基的一种或多种核酸分子由选自Gene ID 946924和Gene ID946925的核酸序列编码。
丝氨酸氨基酶(EC 2.6.1.-)
本公开描述了可以催化以下反应的酶:
L-丝氨酸+NH4+→(S)-2,3-二氨基丙酸
在一些实施方案中,具有丝氨酸氨基酶活性的酶可以是丝氨酸-乙醛酸转氨酶。在其他实施方案中,具有丝氨酸氨基酶活性的酶可以是丝氨酸-丙酮酸转氨酶(见上文)。
丝氨酸-乙醛酸转氨酶催化L-丝氨酸的α-氨基转移至乙醛酸,形成甘氨酸和羟基丙酮酸。在丝氨酸循环甲基营养生物中,该酶发挥两个重要作用:形成一碳单元的受体(甘氨酸),以及在同化途径中将L-丝氨酸转化为羟基丙酮酸。这是第一个纯化的微生物丝氨酸-乙醛酸转氨酶,几年后也鉴定出了编码该酶的基因。
拟南芥AGT1编码的丝氨酸:乙醛酸转氨酶是同源二聚体。纯化的重组蛋白丝氨酸:乙醛酸转氨基的活性最高。该酶还催化比活性低得多的丙氨酸:乙醛酸转氨基和丝氨酸:丙酮酸转氨基。
推测sgaA是编码扭脱甲基杆菌(Methylobacterium extorquens)染色体上丝氨酸-乙醛酸转氨酶的基因。虽然尚未表达该克隆基因的产物,但使用了突变互补来研究其作用。该基因中的突变消除了以C1化合物生长的能力,并且向突变体补充该基因片段的克隆完整版本使活性恢复。此外,sgaA序列与许多转氨酶相似。
在进一步的实施方案中,具有丝氨酸氨基酶活性的酶可以是具有磷酸丝氨酸转氨酶活性的酶。在一些实施方案中,编码磷酸丝氨酸转氨酶的一种或多种核酸分子是serC,或其同源物。在另一个实施方案中,编码具有磷酸丝氨酸转氨酶活性的酶、具有L-丝氨酸转氨酶活性的酶或具有丝氨酸转氨酶活性的酶的一种或多种核酸分子包含SEQ ID NO:230中列出的氨基酸序列。在一个进一步的实施方案中,编码具有磷酸丝氨酸转氨酶活性的酶、具有L-丝氨酸转氨酶活性的酶或具有丝氨酸转氨酶活性的酶的一种或多种核酸分子由SEQ IDNO:229中列出的核酸序列编码。在一些实施方案中,具有磷酸丝氨酸转氨酶活性的酶是人PSAT1,或其同源物。在一个实施方案中,编码具有磷酸丝氨酸转氨酶活性的酶的一种或多种核酸分子包含UniProt ID Q9Y617中列出的氨基酸序列。在另一个实施方案中,编码具有磷酸丝氨酸转氨酶活性的酶的一种或多种核酸分子由Gene ID 29968中列出的核酸序列编码。
在一些实施方案中,具有丝氨酸转氨酶活性的酶由与以下的酶具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码:拟南芥丝氨酸-乙醛酸转氨酶AGT1、Hyphomicrobium methylovorum GM2丝氨酸-乙醛酸转氨酶sgaA和扭脱甲基杆菌sgaA。在一些实施方案中,编码具有丝氨酸-乙醛酸转氨酶活性的酶的一种或多种核酸分子包含选自UniProt ID Q56YA5和UniProt ID O08374的氨基酸序列。在一个进一步的实施方案中,编码具有丝氨酸-乙醛酸转氨酶活性的酶的一种或多种核酸分子由选自以下的核酸序列编码:TAIR登录号AT2G13360、GenBank登录号D86125.1和GenBank登录号L27235.1。
在一些实施方案中,具有丝氨酸转氨酶活性的酶是丝氨酸-丙酮酸转氨酶。在一些实施方案中,丝氨酸-丙酮酸转氨酶由与人AGXT1具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一些实施方案中,丝氨酸-丙酮酸转氨酶是人AGXT1。在一些实施方案中,编码丝氨酸-丙酮酸转氨酶的一种或多种核酸分子是AGXT1,或其同源物。在一些实施方案中,编码丝氨酸-丙酮酸转氨酶的一种或多种核酸分子包含SEQ ID NO:244中列出的氨基酸序列。在一个进一步的实施方案中,编码丝氨酸-丙酮酸转氨酶的一种或多种核酸分子由SEQ ID NO:243中列出的核酸序列编码。
在一些实施方案中,具有丝氨酸氨基酶活性的酶是具有丙氨酸-乙醛酸转氨酶活性的酶。在一些实施方案中,具有丙氨酸-乙醛酸转氨酶活性的酶由与选自以下的具有丙氨酸-乙醛酸转氨酶活性的酶具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码:酿酒酵母AGX1、人AGXT2、拟南芥AOAT1和拟南芥AOAT2。在一些实施方案中,编码具有丙氨酸-乙醛酸转氨酶活性的酶的一种或多种核酸分子包含选自以下的氨基酸序列:UniProt ID P43567、UniProt ID Q9BYV1、UniProt IDQ9LR30和UniProt ID Q9S7E9。在一个进一步的实施方案中,编码具有丙氨酸-乙醛酸转氨酶活性的酶的一种或多种核酸分子由选自以下的核酸序列编码:Gene ID 850514、Gene ID64902、TAIR登录号AT1G23310和TAIR登录号AT1G70580。
在一些实施方案中,具有丝氨酸转氨酶活性的酶是具有丙氨酸转氨酶活性的酶。在一些实施方案中,具有丙氨酸转氨酶活性的酶由与选自以下的具有丙氨酸转氨酶活性的酶具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码:大肠杆菌谷氨酸-丙酮酸转氨酶alaA、大肠杆菌谷氨酸-丙酮酸转氨酶alaB、大肠杆菌谷氨酸-丙酮酸转氨酶alaC、人丙氨酸转氨酶1(GPT)、人丙氨酸转氨酶2(GPT2)、Arenicola marina丙氨酸转氨酶、拟南芥色氨酸转氨酶TAA1、拟南芥AOAT1、拟南芥AOAT2、Candida maltosa丙氨酸转氨酶、丙酸梭菌丙氨酸转氨酶、Pyrococcus furiosus丙氨酸转氨酶aat、Megathyrsus maximus丙氨酸转氨酶和黍丙氨酸转氨酶AlaAT-2。在一些实施方案中,编码具有丙氨酸转氨酶活性的酶的一种或多种核酸分子包含选自以下的氨基酸序列:UniProt ID P0A959、UniProt ID P77434、UniProt ID P24298、UniProt ID Q8TD30、UniProt ID Q9S7N2、UniProt ID Q9LR30、UniProt ID Q9S7E9、UniProt ID Q9P9M8和UniProt ID P34106。在一个进一步的实施方案中,编码具有丙氨酸转氨酶活性的酶的一种或多种核酸分子由选自以下的核酸序列编码:Gene ID946772、Gene ID 946850、Gene ID2875、Gene ID 84706、Gene ID 843393、TAIR登录号AT1G23310、TAIR登录号AT1G70580、GenBank登录号AF163769.1和GenBank登录号X69421.1。
2,3-二氨基丙酸解氨酶(EC 4.3.1.15)
本公开描述了可以催化以下反应的酶:
Figure BDA0003310804120000951
2,3-二氨基丙酸解氨酶不是立体特异性的,其催化2,3-二氨基丙酸的D和L立体异构体的α,β-消除。该酶也表现出对D-丝氨酸的弱活性,对L-丝氨酸、D-β-Cl-丙氨酸或L-β-Cl-丙氨酸没有活性。
该酶是同源二聚体,含有一个吡哆醛5'-磷酸辅基,属于含PLP的酶的折叠II型家族。已解析了脱辅基酶和全酶以及与反应中间体和底物复合的该酶的晶体结构。分析了活性位点残基突变体的动力学特性,提出了反应机理。
在一些实施方案中,具有2,3-二氨基丙酸解氨酶活性的酶由与大肠杆菌2,3-二氨基丙酸解氨酶ygeX具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在其他实施方案中,具有2,3-二氨基丙酸解氨酶活性的酶是大肠杆菌ygeX。在一些实施方案中,编码具有2,3-二氨基丙酸解氨酶活性的酶的一种或多种核酸分子包含UniProt ID P66899中列出的氨基酸序列。在进一步的实施方案中,编码具有2,3-二氨基丙酸解氨酶活性的酶的一种或多种核酸分子由Gene ID 947012中列出的核酸序列编码。
乙醛酸旁路
乙醛酸循环是三羧酸循环的变体,是发生在植物、细菌、原生生物和真菌中的合成代谢途径。乙醛酸循环的核心是将乙酰辅酶A转化为琥珀酸以合成碳水化合物。在微生物中,当不能获得复杂来源如葡萄糖时,乙醛酸循环允许细胞利用简单的碳化合物作为碳源。通常认为该循环在动物中不存在,但胚胎发生早期阶段的线虫除外。然而近年来,在一些动物组织中检测到参与乙醛酸循环的关键酶苹果酸合酶和异柠檬酸裂解酶,对细菌和动物中酶的进化关系提出了质疑,并表明动物编码了该循环的替代酶,这些替代酶在功能上不同于非后生动物物种中已知的苹果酸合酶和异柠檬酸裂解酶。
乙醛酸循环利用与三羧酸循环相关的八种酶中的五种:柠檬酸合酶、顺乌头酸酶、琥珀酸脱氢酶、延胡索酸酶和苹果酸脱氢酶。这两个循环的不同之处在于,在乙醛酸循环中,异柠檬酸裂解酶将异柠檬酸转化为乙醛酸和琥珀酸,而不是转化为α-酮戊二酸。这绕过了发生在TCA循环中的脱羧步骤,允许在随后的大分子(包括葡萄糖)合成中使用简单的碳化合物。乙醛酸随后与乙酰辅酶A结合产生苹果酸,由苹果酸合酶催化。也通过琥珀酸脱氢酶和延胡索酸酶的作用,从琥珀酸平行形成苹果酸。
脊椎动物通常将来自脂质的脂肪酸用作能量来源,因为脂肪酸通过β氧化降解为乙酸分子。该乙酸与辅酶A的活性硫醇基团结合,进入柠檬酸循环(TCA循环),在其中该乙酸被完全氧化为二氧化碳。因此,该途径允许细胞从脂肪中获得能量。为了利用来自脂肪的乙酸生物合成碳水化合物,使用乙醛酸循环,其初始反应与TCA循环相同。
含有细胞壁的生物,如植物、真菌和细菌,在生长过程中需要非常大量的碳水化合物来生物合成复杂结构的多糖,如纤维素、葡聚糖和壳多糖。在这些生物体中,在没有可用碳水化合物的情况下(例如,在某些微生物环境中或在植物种子萌发期间),乙醛酸循环允许由脂质通过脂肪酸β-氧化生成的乙酸合成葡萄糖。
乙醛酸循环绕过了柠檬酸循环中碳以CO2形式损失的步骤。乙醛酸循环的两个初始步骤与柠檬酸循环中的相同:乙酸→柠檬酸→异柠檬酸。在下一步中,在第一个乙醛酸循环酶异柠檬酸裂解酶的催化下,异柠檬酸裂解为琥珀酸和乙醛酸(后者为该循环命名)。乙醛酸与乙酰辅酶A缩合(该步骤由苹果酸合酶催化),产生苹果酸。苹果酸和草酰乙酸都可以转化为磷酸烯醇丙酮酸,其是磷酸烯醇丙酮酸羧激酶的产物,是糖异生的第一个酶。因此,乙醛酸循环的最终结果是由脂肪酸生产葡萄糖。第一步生成的琥珀酸可以进入柠檬酸循环,最终形成草酰乙酸。
使用重组微生物生物合成MEG或乙醇酸、或MEG(或GA)和一种或多种联产品
如上所述,一方面,本公开提供了包含一种或多种生化途径的重组微生物,所述生化途径由一种或多种戊糖和/或己糖通过戊糖磷酸中间体生产一种或多种衍生自D-甘油醛-3-磷酸(G3P)和乙醇醛的产物。在一个实施方案中,重组微生物联产单乙二醇(MEG)和一种或多种联产品。在另一个实施方案中,一种或多种联产品选自丙酮、异丙醇、丙烯、L-丝氨酸、甘氨酸、单乙醇胺(MEA)、乙二胺或其组合。在一个仍进一步的实施方案中,一种或多种产物选自单乙二醇(MEG)和乙醇酸(GA)。
因此,在一个实施方案中,本申请涉及包含一种或多种生化途径的重组微生物,所述生化途径包含至少一种具有将一种或多种戊糖和/或己糖无损转化为戊糖磷酸中间体的活性的酶,并且包含至少一种具有戊糖磷酸醛缩酶活性的酶,其将戊糖磷酸中间体转化为乙醇醛和D-甘油醛-3-磷酸(G3P)。
在一些实施方案中,戊糖磷酸中间体是D-核糖-5-磷酸、D-核酮糖-5-磷酸或D-木酮糖-5-磷酸。在一些实施方案中,至少一种具有戊糖磷酸醛缩酶活性的酶具有D-核糖-5-磷酸醛缩酶活性、D-核酮糖-5-磷酸醛缩酶活性或D-木酮糖-5-磷酸醛缩酶活性。
在一些实施方案中,重组微生物包括至少一种具有转酮醇酶活性的酶的表达和至少一种具有戊糖磷酸醛缩酶活性的酶的表达。在一些实施方案中,具有转酮醇酶活性的酶由与来自大肠杆菌的tktA具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码。在其他实施方案中,具有转酮醇酶活性的酶是来自大肠杆菌的tktA。在一些实施方案中,具有转酮醇酶活性的酶由与来自大肠杆菌的tktB具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在其他实施方案中,具有转酮醇酶活性的酶是来自大肠杆菌的tktB。在另一个实施方案中,编码具有转酮醇酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO:148和150的氨基酸序列。在一些实施方案中,编码具有转酮醇酶活性的酶的一种或多种核酸分子是tktA,或其同源物。在一些实施方案中,编码具有转酮醇酶活性的酶的一种或多种核酸分子是tktB,或其同源物。在一个进一步的实施方案中,编码具有转酮醇酶活性的酶的一种或多种核酸分子由选自SEQ ID NO:147和149的核酸序列编码。在一些实施方案中,具有戊糖磷酸醛缩酶活性的酶由与来自大肠杆菌的deoC具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码。在其他实施方案中,具有戊糖磷酸醛缩酶活性的酶是来自大肠杆菌的deoC。
在一些实施方案中,所述重组微生物包含至少一种具有转醛醇酶活性的酶的表达。在一些实施方案中,具有转醛醇酶活性的酶由与来自大肠杆菌的talA或talB具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码。在一些实施方案中,具有转醛醇酶活性的酶是来自大肠杆菌的talA。
在其他实施方案中,具有转醛醇酶活性的酶是来自大肠杆菌的talB。在另一个实施方案中,编码具有转醛醇酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO:152和154的氨基酸序列。在一个进一步的实施方案中,编码具有转醛醇酶活性的酶的一种或多种核酸分子由选自SEQ ID NO:151和153的核酸序列编码。
在一些实施方案中,重组微生物包含至少一种具有核酮糖-5-磷酸3-差向异构酶活性的酶的表达。在一些实施方案中,具有核酮糖-5-磷酸3-差向异构酶活性的酶由与来自大肠杆菌的rpe具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码。在其他实施方案中,具有核酮糖-5-磷酸3-差向异构酶活性的酶是来自大肠杆菌的rpe。在另一个实施方案中,编码具有核酮糖-5-磷酸3-差向异构酶活性的酶的一种或多种核酸分子包含SEQ ID NO:158中列出的氨基酸序列。在一个进一步的实施方案中,编码具有核酮糖-5-磷酸3-差向异构酶活性的酶的一种或多种核酸分子由SEQ ID NO:157中列出的核酸序列编码。
在一些实施方案中,重组微生物包含至少一种具有核糖-5-磷酸异构酶活性的酶的表达。在一些实施方案中,所述具有核糖-5-磷酸异构酶活性的酶由与来自大肠杆菌的rpiA具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码。在其他实施方案中,所述具有核糖-5-磷酸异构酶活性的酶是来自大肠杆菌的rpiA。在其他实施方案中,所述具有核糖-5-磷酸异构酶活性的酶由与来自大肠杆菌的rpiB具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码。在其他实施方案中,所述具有核糖-5-磷酸异构酶活性的酶是来自大肠杆菌的rpiB。在另一个实施方案中,编码具有核糖-5-磷酸异构酶活性的酶的一种或多种核酸分子包含SEQ IDNO:156中列出的氨基酸序列。在一个进一步的实施方案中,编码具有核糖-5-磷酸异构酶活性的酶的一种或多种核酸分子由SEQ ID NO:155中列出的核酸序列编码。
在一些实施方案中,重组微生物包含至少一种具有选自以下的活性的酶的表达:转酮醇酶活性、转醛醇酶活性、核酮糖-5-磷酸3-差向异构酶活性、核糖-5-磷酸异构酶活性和D-核糖-5-磷酸醛缩酶活性,重组微生物进一步包含一种或多种内源性酶的缺失或降低的活性,所述内源性酶选自甘油醛3-磷酸脱氢酶、磷酸甘油酸激酶和磷酸甘油酸变位酶。在一些实施方案中,内源性的甘油醛3-磷酸脱氢酶是gapA,磷酸甘油酸激酶是pgk,磷酸甘油酸变位酶是gpmA或gpmM。
在一些实施方案中,重组微生物包含至少一种具有果糖6-磷酸磷酸酮醇酶(phosphoketolase)活性的酶的表达。在一些实施方案中,具有果糖-6-磷酸磷酸酮醇酶活性的酶由与选自以下的具有果糖-6-磷酸磷酸酮醇酶活性的酶具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码:齿双歧杆菌(Bifidobacterium dentium)BDP_1006、乳双歧杆菌(Bifidobacterium lactis)xfp、类植物乳杆菌(Lactobacillus paraplantarum)xpkA和短双歧杆菌(Bifidobacterium breve)xfp。在一个优选的实施方案中,具有果糖-6-磷酸磷酸酮醇酶活性的酶选自齿双歧杆菌BDP_1006、乳双歧杆菌xfp、类植物乳杆菌xpkA和短双歧杆菌xfp。在另一个实施方案中,编码具有果糖-6-磷酸磷酸酮醇酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO:212、214、216和218的氨基酸序列。在一个进一步的实施方案中,编码具有果糖-6-磷酸磷酸酮醇酶活性的酶的一种或多种核酸分子由选自SEQ ID NO:211、213、215和217的核酸序列编码。
在一些实施方案中,重组微生物包含至少一种具有磷酸乙酰转移酶活性的酶的表达。在一些实施方案中,具有磷酸乙酰转移酶活性的酶由与选自以下的具有磷酸乙酰转移酶活性的酶具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码:大肠杆菌pta和丙酮丁醇梭菌(Clostridium acetobutylicum)pta。在一个优选的实施方案中,具有磷酸乙酰转移酶活性的酶选自大肠杆菌pta和丙酮丁醇梭菌pta。在另一个实施方案中,编码具有磷酸乙酰转移酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO:220和222的氨基酸序列。在一个进一步的实施方案中,编码具有磷酸乙酰转移酶活性的酶的一种或多种核酸分子由选自SEQ ID NO:219和221的核酸序列编码。
在一些实施方案中,重组微生物包含至少一种具有选自以下的活性的酶的表达:果糖-6-磷酸磷酸酮醇酶活性、磷酸乙酰转移酶活性、转酮醇酶活性、转醛醇酶活性、核酮糖-5-磷酸3-差向异构酶活性、核糖-5-磷酸异构酶活性和D-核糖-5-磷酸醛缩酶活性,重组微生物进一步包含内源性酶6-磷酸果糖激酶的缺失或降低的活性。在一些实施方案中,内源性6-磷酸果糖激酶是pfkA和/或pfkB。
在一些实施方案中,一种或多种戊糖和/或己糖包含D-木糖,并且重组微生物进一步包含至少一种具有木糖异构酶活性的酶的表达和至少一种具有木酮糖5-激酶活性的酶的表达。在一些实施方案中,至少一种具有木糖异构酶活性的酶由与来自大肠杆菌或Pyromyces sp.的xylA具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一个优选的实施方案中,具有木糖异构酶活性的酶选自大肠杆菌xylA和Pyromyces sp xylA。在又一个实施方案中,编码木糖异构酶的一种或多种核酸分子包含选自SEQ ID NO:95和144的氨基酸序列。在一个进一步的实施方案中,编码木糖异构酶的一种或多种核酸分子由选自SEQ ID NO:93、94和143的核酸序列编码。在一些实施方案中,至少一种具有木酮糖5-激酶活性的酶由与来自大肠杆菌的xylB具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一个优选的实施方案中,具有木酮糖5-激酶活性的酶是大肠杆菌xylB。在另一个实施方案中,编码D-木酮糖5-激酶的一种或多种核酸分子包含SEQ ID NO:146中列出的氨基酸序列。在一个进一步的实施方案中,编码D-木酮糖5-激酶的一种或多种核酸分子由SEQ IDNO:145中列出的核酸序列编码。
在一些实施方案中,一种或多种戊糖和/或己糖包含D-果糖,并且重组微生物进一步包含至少一种具有果糖1,6-二磷酸酶活性的酶的表达。在一些实施方案中,至少一种具有果糖1,6-二磷酸酶活性的酶由与来自大肠杆菌的fbp具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一个优选的实施方案中,具有果糖1,6-二磷酸酶活性的酶是大肠杆菌fbp。在一些实施方案中,具有果糖1,6-二磷酸酶活性的酶将D-果糖1,6-二磷酸转化为D-果糖6-磷酸。在其他实施方案中,重组微生物中的内源性酶将D-果糖转化为果糖1,6-二磷酸。
在上述任何重组微生物的一些实施方案中,所述重组微生物进一步包含一种或多种内源性酶中缺失的或降低的活性,所述内源性酶选自葡萄糖6-磷酸-1-脱氢酶、6-磷酸葡萄糖酸内酯酶和6-磷酸葡萄糖酸脱氢酶。在进一步的实施方案中,葡萄糖6-磷酸-1-脱氢酶是zwf,6-磷酸葡萄糖酸内酯酶是pgl,6-磷酸葡萄糖酸脱氢酶是gnd。
在一些实施方案中,一种或多种戊糖和/或己糖能够在重组微生物的非氧化磷酸戊糖途径中转化为一种或多种中间体。在其他实施方案中,一种或多种戊糖和/或己糖由单体、低聚物或其组合组成。
在一些实施方案中,至少一种具有转酮醇酶活性和/或果糖-6-磷酸磷酸酮醇酶活性的酶的表达和至少一种具有D-核糖5-磷酸醛缩酶活性的酶的表达,使得能够实现一种或多种戊糖和/或己糖无损转化为D-核糖-5-磷酸中间体以及随后D-核糖-5-磷酸转化为G3P和乙醇醛。
在一些实施方案中,重组微生物通过C2途径中乙醇醛的转化和通过一种或多种C3途径中G3P的转化,生产MEG或乙醇酸(GA)。在一些实施方案中,通过C2途径中具有乙醇醛还原酶活性的酶还原乙醇醛来生产MEG。在其他实施方案中,通过C2途径中具有乙醇醛脱氢酶活性的酶氧化乙醇醛来生产GA。
在一些实施方案中,用于生产MEG或GA的至少一种酶选自具有选自以下的活性的至少一种酶:3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、羟基丙酮酸脱羧酶活性、3-磷酸羟基丙酮酸还原酶活性、乙醇醛还原酶活性、乙醇醛脱氢酶活性、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶活性、丝氨酸脱羧酶活性、乙醇胺转氨酶或乙醇胺氧化还原酶(脱氨基)活性、甘油酸脱羧酶活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性、甘油酸2-激酶活性和乙醛酸还原酶活性。
在一些实施方案中,重组微生物通过C2途径中乙醇醛的转化生产MEG,并通过一种或多种C3途径中G3P的转化生产一种或多种联产品。在其他实施方案中,一种或多种联产品选自丙酮、异丙醇、丙烯、异丁烯和一种或多种丝氨酸途径化合物。在一些优选的实施方案中,一种或多种丝氨酸途径化合物选自丝氨酸、甘氨酸、单乙醇胺(MEA)和乙二胺(EDA)。
在一些实施方案中,用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的至少一种酶选自至少一种具有选自以下的活性的酶:硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A:乙酰乙酸转移酶或乙酸:乙酰乙酰辅酶A水解酶活性和乙酰乙酸脱羧酶活性,并且一种或多种联产品包括丙酮。
在一些实施方案中,用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶:硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A:乙酰乙酸转移酶或乙酸:乙酰乙酰辅酶A水解酶活性、乙酰乙酸脱羧酶活性和仲醇脱氢酶活性,并且一种或多种联产品包含异丙醇。
在一些实施方案中,用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶:硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A:乙酰乙酸转移酶或乙酸:乙酰乙酰辅酶A水解酶活性、乙酰乙酸脱羧酶活性、仲醇脱氢酶活性和脱水酶活性,并且一种或多种联产品包含丙烯。
在一些实施方案中,用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶:硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A:乙酰乙酸转移酶或乙酸:乙酰乙酰辅酶A水解酶活性、乙酰乙酸脱羧酶活性、3-羟基异戊酸(3HIV)合酶活性、羟甲基戊二酰辅酶A合酶活性、甲基戊烯二酰辅酶A水合酶活性、甲基巴豆酰辅酶A羧化酶活性、甲基巴豆酰辅酶A水合酶活性、3-羟基异戊酰辅酶A硫酯酶活性、3HIV激酶活性、3HIV-3-磷酸脱羧酶活性和3HIV脱羧酶活性,并且一种或多种联产品包含异丁烯。
在一些实施方案中,用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶:3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性和甘油酸2-激酶活性,并且一种或多种联产品包含L-丝氨酸。
在一些实施方案中,用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶:丝氨酸羟甲基转移酶活性、转移酶活性、甲醛脱氢酶活性、甲酸脱氢酶活性、与甘氨酸裂解系统相关的活性、3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、丝氨酸转氨酶活性、羟基丙酮酸脱羧酶活性、丝氨酸氧化还原酶(脱氨基)活性、丝氨酸脱羧酶活性、乙醇胺转氨酶或乙醇胺氧化还原酶(脱氨基)活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性、甘油酸2-激酶活性、乙醇醛脱氢酶活性、乙醇酸脱氢酶活性、丙氨酸-乙醛酸转氨酶活性、丙氨酸转氨酶活性和NAD(P)H依赖性谷氨酸脱氢酶活性,并且一种或多种联产品包含甘氨酸。在另一个实施方案中,与甘氨酸裂解系统相关的活性包含选自以下的酶或蛋白:甘氨酸脱羧酶(P蛋白)、氨甲基转移酶(T蛋白)、二氢硫辛酰胺脱氢酶(L蛋白)和H蛋白。
在一些实施方案中,用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶:3-磷酸甘油酸脱氢酶活性、3-磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、转氨酶活性、羟基丙酮酸脱羧酶活性、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶活性、丝氨酸脱羧酶活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性、甘油酸2-激酶活性、乙醛脱氢酶活性和乙醇胺解氨酶活性,并且一种或多种联产品包含单乙醇胺(MEA)。
在一些实施方案中,用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶:丝氨酸脱氢酶活性、2-氨基丙二酸半醛脱羧酶活性、氨基乙醛转氨酶活性、2-氨基丙二酸半醛转氨酶活性、2,3-二氨基丙酸脱羧酶活性、丝氨酸脱羧酶活性、乙醇胺脱氢酶活性、丝氨酸羟甲基转移酶活性、醛氧化酶活性、N-乙酰转移酶或O-乙酰转移酶活性、N-乙酰丝氨酸脱氢酶活性、转氨酶活性、脱乙酰酶活性、丝氨酸氨基酶活性和2,3-二氨基丙酸解氨酶活性,并且一种或多种联产品包含乙二胺(EDA)。
在上述任何重组微生物的一些实施方案中,所述重组微生物进一步包含一种或多种修饰,以减少或缺失乙醇醛还原酶、乙醇醛脱氢酶、乳酸脱氢酶或其组合的活性。
在一个实施方案中,至少一部分在C3途径中生产的过量NADH用作C2途径中还原当量的来源。在另一个实施方案中,至少一部分在C3途径中生产的过量NADH用于生产ATP。
在一个实施方案中,最小化过量的生物质形成,并且最大化MEG或乙醇酸、或MEG和一种或多种联产品的生产。
戊糖和/或己糖转化为D-核糖5-磷酸中间体,随后D-核糖5-磷酸中间体转化为乙醇醛和D-甘油醛3-磷酸
在本公开中,戊糖和/或己糖转化为戊糖磷酸中间体,其是非氧化磷酸戊糖途径的中间体。然后,戊糖磷酸中间体(D-核糖-5-磷酸、D-核酮糖-5-磷酸或D-木酮糖-5-磷酸)作为D-戊糖-磷酸醛缩酶(具有D-核糖-5-磷酸醛缩酶活性、D-核酮糖-5-磷酸醛缩酶活性或D-木酮糖-5-磷酸醛缩酶活性)的底物,以生产乙醇醛和D-甘油醛3-磷酸,这些化合物然后可以进一步转化为MEG或GA、或MEG和一种或多种联产品。
在本公开中,戊糖和/或己糖转化为D-核糖5-磷酸,其是非氧化磷酸戊糖途径的中间体。然后,D-核糖5-磷酸中间体作为D-核糖5-磷酸醛缩酶的底物,产生乙醇醛和D-甘油醛3-磷酸,这些化合物然后可以进一步转化为MEG或GA、或MEG和一种或多种联产品。
[A]因此,在一个实施方案中,本申请涉及一种能够由一种或多种戊糖和/或己糖通过戊糖磷酸中间体生产乙醇醛和D-甘油醛3-磷酸(G3P)的重组微生物,其中该重组微生物表达以下(a)至(h)的一种或多种:
(a)至少一种内源性或外源性核酸分子,其编码具有转酮醇酶活性的酶,该酶催化D-果糖-6-磷酸和D-甘油醛-3-磷酸分别可逆转化为D-赤藓糖-4-磷酸和D-木酮糖-5-磷酸,和/或催化来自(b)的D-甘油醛-3-磷酸和来自(b)的D-景天庚酮糖-7-磷酸分别可逆转化为戊糖磷酸和D-木酮糖-5-磷酸;
(b)至少一种内源性或外源性核酸分子,其编码具有转醛醇酶活性的酶,该酶催化来自(a)的D-果糖-6-磷酸和D-赤藓糖-4-磷酸分别可逆转化为D-甘油醛-3-磷酸和D-景天庚酮糖-7-磷酸;
(c)至少一种内源性或外源性核酸分子,其编码具有核酮糖-5-磷酸3-差向异构酶活性的酶,该酶催化来自(a)和/或(f)的D-木酮糖-5-磷酸和D-核酮糖-5-磷酸的相互转化;
(d)至少一种内源性或外源性核酸分子,其编码具有核糖-5-磷酸异构酶活性的酶,该酶催化来自(c)的D-核酮糖-5-磷酸和D-核糖-5-磷酸的相互转化;
(e)至少一种内源性或外源性核酸分子,其编码具有木糖异构酶活性的酶,该酶催化D-木糖转化为D-木酮糖;
(f)至少一种内源性或外源性核酸分子,其编码具有木酮糖5-激酶活性的酶,该酶催化D-木酮糖转化为D-木酮糖-5-磷酸;
(g)至少一种内源性或外源性核酸分子,其编码具有果糖1,6-二磷酸酶活性的酶,该酶催化D-果糖1,6-二磷酸转化为D-果糖6-磷酸;
(h)至少一种内源性或外源性核酸分子,其编码具有戊糖-5-磷酸醛缩酶活性的酶,该酶催化来自(a)和/或(d)的戊糖-5-磷酸转化为乙醇醛和D-甘油醛-3-磷酸;
其中重组微生物任选地进一步在编码甘油醛3-磷酸脱氢酶和/或磷酸甘油酸激酶和/或磷酸甘油酸变位酶的基因中包含缺失、插入或功能缺失突变;
其中,一种或多种戊糖和/或己糖能够在重组微生物的非氧化磷酸戊糖途径中转化为一种或多种中间体,
并且其中生产乙醇醛和D-甘油醛-3-磷酸(G3P)。
[B]因此,在一个实施方案中,本申请涉及一种能够由一种或多种戊糖和/或己糖通过D-核糖5-磷酸、核酮糖5-磷酸或木酮糖5-磷酸中间体生产乙醇醛和D-甘油醛3-磷酸(G3P)的重组微生物,其中该重组微生物表达以下(a)至(h)的一种或多种:
(a)至少一种内源性或外源性核酸分子,其编码具有转酮醇酶活性的酶,该酶催化D-果糖-6-磷酸和D-甘油醛-3-磷酸分别可逆转化为D-赤藓糖-4-磷酸和D-木酮糖-5-磷酸,和/或催化来自(b)的D-甘油醛-3-磷酸和来自(b)的D-景天庚酮糖-7-磷酸分别可逆转化为D-核糖-5-磷酸和D-木酮糖-5-磷酸;
(b)至少一种内源性或外源性核酸分子,其编码具有转醛醇酶活性的酶,该酶催化来自(a)的D-果糖-6-磷酸和D-赤藓糖-4-磷酸分别可逆转化为D-甘油醛-3-磷酸和D-景天庚酮糖-7-磷酸;
(c)至少一种内源性或外源性核酸分子,其编码具有核酮糖-5-磷酸3-差向异构酶活性的酶,该酶催化来自(a)和/或(f)的D-木酮糖-5-磷酸和D-核酮糖-5-磷酸的相互转化;
(d)至少一种内源性或外源性核酸分子,其编码具有核糖-5-磷酸异构酶活性的酶,该酶催化来自(c)的D-核酮糖-5-磷酸和D-核糖-5-磷酸的相互转化;
(e)至少一种内源性或外源性核酸分子,其编码具有木糖异构酶活性的酶,该酶催化D-木糖转化为D-木酮糖;
(f)至少一种内源性或外源性核酸分子,其编码具有木酮糖5-激酶活性的酶,该酶催化D-木酮糖转化为D-木酮糖-5-磷酸;
(g)至少一种内源性或外源性核酸分子,其编码具有果糖1,6-二磷酸酶活性的酶,该酶催化D-果糖1,6-二磷酸转化为D-果糖6-磷酸;
(h)至少一种内源性或外源性核酸分子,其编码具有D-核糖-5-磷酸、核酮糖5-磷酸或木酮糖5-磷酸醛缩酶活性的酶,该酶催化来自(a)和/或(d)的D-核糖-5-磷酸、核酮糖5-磷酸或木酮糖5-磷酸转化为乙醇醛和D-甘油醛-3-磷酸;
其中重组微生物任选地进一步在编码甘油醛3-磷酸脱氢酶和/或磷酸甘油酸激酶和/或磷酸甘油酸变位酶的基因中包含缺失、插入或功能缺失突变;
其中,一种或多种戊糖和/或己糖能够在重组微生物的非氧化磷酸戊糖途径中转化为一种或多种中间体,
并且其中生产乙醇醛和D-甘油醛-3-磷酸(G3P)。
[C]在另一个实施方案中,本申请涉及一种能够由一种或多种戊糖和/或己糖通过D-核糖5-磷酸中间体生产乙醇醛和D-甘油醛3-磷酸(G3P)的重组微生物,其中该重组微生物表达以下(a)至(j)的一种或多种:
(a)至少一种内源性或外源性核酸分子,其编码具有果糖-6-磷酸磷酸酮醇酶活性的酶,该酶催化D-果糖-6-磷酸可逆转化为D-赤藓糖-4-磷酸和乙酰磷酸;
(b)至少一种内源性或外源性核酸分子,其编码具有磷酸乙酰转移酶活性的酶,该酶催化来自(a)的乙酰磷酸可逆转化为乙酰辅酶A;
(c)至少一种内源性或外源性核酸分子,其编码具有转醛醇酶活性的酶,该酶催化来自(a)的D-果糖-6-磷酸和D-赤藓糖-4-磷酸分别可逆转化为D-甘油醛-3-磷酸和D-景天庚酮糖-7-磷酸;
(d)至少一种内源性或外源性核酸分子,其编码具有转酮醇酶活性的酶,该酶催化来自(c)的D-甘油醛-3-磷酸和来自(c)的D-景天庚酮糖-7-磷酸分别可逆转化为D-核糖-5-磷酸和D-木酮糖-5-磷酸;
(e)至少一种内源性或外源性核酸分子,其编码具有核酮糖-5-磷酸3-差向异构酶活性的酶,该酶催化来自(d)和/或(h)的D-木酮糖-5-磷酸和D-核酮糖-5-磷酸的相互转化;
(f)至少一种内源性或外源性核酸分子,其编码具有核糖-5-磷酸异构酶活性的酶,该酶催化来自(e)的D-核酮糖-5-磷酸和D-核糖-5-磷酸的相互转化;
(g)至少一种内源性或外源性核酸分子,其编码具有木糖异构酶活性的酶,该酶催化D-木糖转化为D-木酮糖;
(h)至少一种内源性或外源性核酸分子,其编码具有木酮糖5-激酶活性的酶,该酶催化D-木酮糖转化为D-木酮糖-5-磷酸;
(i)至少一种内源性或外源性核酸分子,其编码具有果糖1,6-二磷酸酶活性的酶,该酶催化D-果糖1,6-二磷酸转化为D-果糖6-磷酸;
(j)至少一种内源性或外源性核酸分子,其编码具有D-核糖5-磷酸醛缩酶活性的酶,该酶催化来自(d)和/或(f)的D-核糖-5-磷酸转化为乙醇醛和D-甘油醛-3-磷酸;
其中重组微生物任选地进一步在编码6-磷酸果糖激酶的基因中包含缺失、插入或功能缺失突变;
其中,一种或多种戊糖和/或己糖能够在重组微生物的非氧化磷酸戊糖途径中转化为一种或多种中间体,
其中步骤(b)中产生的乙酰辅酶A可以用于生产一种或多种联产品,所述联产品选自乙醇酸、丙酮、异丙醇、丙烯、异丁烯和一种或多种丝氨酸途径化合物;
并且其中生产乙醇醛和D-甘油醛-3-磷酸(G3P)。
在一些实施方案中,磷酸戊糖途径的氧化分支被删除或失活,以优化糖流向非氧化性进入磷酸戊糖途径。
[D]因此,在一个实施方案中,实施方案[A]、实施方案[B]或实施方案[C]的重组微生物任选地进一步包含一种或多种选自以下的修饰:
(i)编码葡萄糖6-磷酸-1-脱氢酶的基因中的缺失、插入或功能缺失突变,该酶催化葡萄糖-6-磷酸转化为6-磷酸-D-葡萄糖酸-1,5-内酯;
(ii)编码6-磷酸葡萄糖酸内酯酶的基因中的缺失、插入或功能缺失突变,该酶催化6-磷酸-D-葡萄糖酸-1,5-内酯转化为葡萄糖酸-6-磷酸;和
(iii)编码6-磷酸葡萄糖酸脱氢酶的基因中的缺失、插入或功能缺失突变,该酶催化葡萄糖酸-6-磷酸转化为D-核酮糖-5-磷酸。
在一些实施方案中,具有转酮醇酶活性的酶由与大肠杆菌tktA具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在其他实施方案中,转酮醇酶由与大肠杆菌tktB具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一些实施方案中,转酮醇酶是来自大肠杆菌的tktA。在其他实施方案中,转酮醇酶是来自大肠杆菌的tktB。
在一些实施方案中,编码具有转酮醇酶活性的酶的一种或多种核酸分子是tktA,或其同源物。在一些实施方案中,编码具有转酮醇酶活性的酶的一种或多种核酸分子是tktB或其同源物。在另一个实施方案中,编码具有转酮醇酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO:148和150的氨基酸序列。在一个进一步的实施方案中,编码具有转酮醇酶活性的酶的一种或多种核酸分子由选自SEQ ID NO:147和149的核酸序列编码。
在一些实施方案中,具有转醛醇酶活性的酶由与来自大肠杆菌的talA或talB具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码。在一些实施方案中,具有转醛醇酶活性的酶是来自大肠杆菌的talA。在其他实施方案中,具有转醛醇酶活性的酶是来自大肠杆菌的talB。在另一个实施方案中,编码具有转醛醇酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO:152和154的氨基酸序列。在一个进一步的实施方案中,编码具有转醛醇酶活性的酶的一种或多种核酸分子由选自SEQ ID NO:151和153的核酸序列编码。
在一个实施方案中,具有核糖-5-磷酸异构酶活性的酶由与大肠杆菌rpiA或rpiB具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一些实施方案中,具有核糖-5-磷酸异构酶活性的酶是大肠杆菌rpiA。在一些实施方案中,具有核糖-5-磷酸异构酶活性的酶是大肠杆菌rpiB。
在一些实施方案中,编码具有核糖-5-磷酸异构酶活性的酶的一种或多种核酸分子是rpiA,或其同源物。在另一个实施方案中,编码具有核糖-5-磷酸异构酶活性的酶的一种或多种核酸分子包含SEQ ID NO:156中列出的氨基酸序列。在一个进一步的实施方案中,编码具有核糖-5-磷酸异构酶活性的酶的一种或多种核酸分子由SEQ ID No:155中列出的核酸序列编码。在一些实施方案中,编码具有核糖-5-磷酸异构酶活性的酶的一种或多种核酸分子是rpiB,或其同源物。在另一个实施方案中,编码具有核糖-5-磷酸异构酶活性的酶的一种或多种核酸分子包含SEQ ID NO:254中列出的氨基酸序列。在一个进一步的实施方案中,编码具有核糖-5-磷酸异构酶活性的酶的一种或多种核酸分子由SEQ ID NO:253中列出的核酸序列编码。
在一个实施方案中,具有核酮糖-5-磷酸3-差向异构酶活性的酶由与大肠杆菌rpe具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在其他实施方案中,具有核酮糖-5-磷酸3-差向异构酶活性的酶是大肠杆菌rpe。
在一些实施方案中,编码具有核酮糖-5-磷酸3-差向异构酶活性的酶的一种或多种核酸分子是rpe,或其同源物。在另一个实施方案中,编码具有核酮糖-5-磷酸3-差向异构酶活性的酶的一种或多种核酸分子包含SEQ ID NO:158中列出的氨基酸序列。在一个进一步的实施方案中,编码具有核酮糖-5-磷酸3-差向异构酶活性的酶的一种或多种核酸分子由SEQ ID NO:157中列出的核酸序列编码。
在一个实施方案中,具有果糖-6-磷酸磷酸酮醇酶活性的酶由与选自以下的具有果糖-6-磷酸磷酸酮醇酶活性的酶具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码:齿双歧杆菌(Bifidobacterium dentium)BDP_1006、乳双歧杆菌(Bifidobacterium lactis)xfp、类植物乳杆菌(Lactobacillus paraplantarum)xpkA和短双歧杆菌(Bifidobacterium breve)xfp。在其他实施方案中,具有果糖-6-磷酸磷酸酮醇酶活性的酶选自齿双歧杆菌BDP_1006、乳双歧杆菌xfp、类植物乳杆菌xpkA和短双歧杆菌xfp。
在一些实施方案中,编码具有果糖-6-磷酸磷酸酮醇酶活性的酶的一种或多种核酸分子选自BDP_1006、xfp、xpkA,或其同源物。在另一个实施方案中,编码具有果糖-6-磷酸磷酸酮醇酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO:212、214、216和218的氨基酸序列。在一个进一步的实施方案中,编码具有果糖-6-磷酸磷酸酮醇酶活性的酶的一种或多种核酸分子由选自SEQ ID NO:211、213、215和217的核酸序列编码。
在一个实施方案中,具有磷酸乙酰转移酶活性的酶由与选自以下的具有磷酸乙酰转移酶活性的酶具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码:大肠杆菌pta和丙酮丁醇梭菌(Clostridium acetobutylicum)pta。在其他实施方案中,具有磷酸乙酰转移酶活性的酶选自大肠杆菌pta和丙酮丁醇梭菌pta。
在一些实施方案中,编码具有磷酸乙酰转移酶活性的酶的一种或多种核酸分子是pta,或其同源物。在另一个实施方案中,编码具有磷酸乙酰转移酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO:220和222的氨基酸序列。在一个进一步的实施方案中,编码具有磷酸乙酰转移酶活性的酶的一种或多种核酸分子由选自SEQ ID NO:219和221的核酸序列编码。
在一些实施方案中,具有戊糖磷酸醛缩酶活性(包括D-核糖-5-磷酸醛缩酶活性、D-核酮糖-5-磷酸醛缩酶活性或D-木酮糖-5-磷酸醛缩酶活性)的酶由与来自大肠杆菌的deoC具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码。在其他实施方案中,所述具有D-核糖-5-磷酸醛缩酶活性的酶是来自大肠杆菌的deoC。
在一些实施方案中,重组微生物进一步包含内源性或外源性的具有木糖异构酶活性的酶,该酶催化D-木糖转化为D-木酮糖。在一个实施方案中,具有木糖异构酶活性的酶是外源的。在另一个实施方案中,具有木糖异构酶活性的酶由获自Pyromyces sp.的一种或多种核酸分子编码。在一个进一步的实施方案中,具有木糖异构酶活性的酶由获自大肠杆菌的一种或多种核酸分子编码。在另一个实施方案中,编码具有木糖异构酶活性的酶的一种或多种核酸分子是xylA,或其同源物。在又一个实施方案中,编码具有木糖异构酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO:95和144的氨基酸序列。在一个进一步的实施方案中,编码具有木糖异构酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO:93、94和143的核酸序列。
在一些实施方案中,具有木酮糖5-激酶活性的酶由与来自大肠杆菌的xylB具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一个优选的实施方案中,具有木酮糖5-激酶活性的酶是大肠杆菌xylB。在另一个实施方案中,编码D-木酮糖5-激酶的一种或多种核酸分子包含SEQ ID NO:146中列出的氨基酸序列。在一个进一步的实施方案中,编码D-木酮糖5-激酶的一种或多种核酸分子由SEQ IDNO:145中列出的核酸序列编码。
在一些实施方案中,具有果糖1,6-二磷酸酶活性的酶由与来自大肠杆菌的fbp具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一个优选的实施方案中,具有果糖1,6-二磷酸酶活性的酶是大肠杆菌fbp。在一些实施方案中,具有果糖1,6-二磷酸酶活性的酶将D-果糖1,6-二磷酸转化为D-果糖6-磷酸。在其他实施方案中,重组微生物中的内源性酶将D-果糖转化为果糖1,6-二磷酸。
MEG或乙醇酸、或MEG和联产品的生产途径
在一些实施方案中,由实施方案[A]、由实施方案[B]或由实施方案[C](并且任选地包括实施方案[D])生产的乙醇醛和甘油醛-3-磷酸中间体用于已知的MEG(或乙醇酸)C2生产途径,该途径与C3途径偶联,如下所述,以联产额外的MEG(或乙醇酸)和/或一种或多种联产品。
在一些实施方案中,通过C2途径生产MEG,该途径使用具有乙醇醛还原酶活性的酶将乙醇醛转化为MEG。在另一个实施方案中,通过C2途径生产乙醇酸(GA),该途径使用具有乙醇醛脱氢酶活性的酶将乙醇醛氧化为GA。
[E]在一个实施方案中,本申请涉及一种能够由一种或多种戊糖和/或己糖生产单乙二醇(MEG)的重组微生物,其中来自实施方案[A]、来自实施方案[B]或来自实施方案[C](并且任选地包括实施方案[D])的重组微生物进一步表达:至少一种内源性或外源性核酸分子,其编码具有乙醇醛还原酶活性的酶,该酶催化乙醇醛转化为MEG,其中所述重组微生物任选地进一步在编码乙醇醛脱氢酶的基因中包含缺失、插入或功能缺失突变,并且其中生产MEG。
[F]在一个实施方案中,本申请涉及一种能够由一种或多种戊糖和/或己糖生产乙醇酸(GA)的重组微生物,其中来自实施方案[A]、来自实施方案[B]或来自实施方案[C](并且任选地包括实施方案[D])的重组微生物进一步表达:至少一种内源性或外源性核酸分子,其编码具有乙醇醛脱氢酶活性的酶,该酶催化乙醇醛转化为GA,其中所述重组微生物任选地进一步在编码乙醇醛还原酶的基因中包含缺失、插入或功能缺失突变,并且其中生产GA。
在一些实施方案中,具有乙醇醛还原酶活性的酶由获自微生物的一种或多种核酸分子编码,所述微生物选自大肠杆菌和酿酒酵母。在另一个实施方案中,一种或多种核酸分子选自gldA、GRE2、GRE3、yqhD、ydjG、fucO、yafB(dkgB)和/或yqhE(dkgA),或其同源物。在另一个实施方案中,一种或多种核酸分子是yqhD。在一些实施方案中,yqhD包含G149E突变。在一个进一步的实施方案中,具有乙醇醛还原酶活性的酶包含选自SEQ ID NO:13、15、17、20、23、25、28、30和32的氨基酸序列。在一个仍进一步的实施方案中,具有乙醇醛还原酶活性的酶由选自SEQ ID NO:12、14、16、18、19、21、22、24、26、27、29和31的核酸序列编码。
在一个实施方案中,具有乙醇醛脱氢酶活性的酶由与来自大肠杆菌的aldA(SEQID NO:289)具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一个优选的实施方案中,具有乙醇醛脱氢酶活性的酶是大肠杆菌aldA。
通过C2途径生产MEG(或乙醇酸)和通过C3途径生产MEG(或乙醇酸)
一方面,由一种或多种戊糖和/或己糖生产MEG(或乙醇酸)如下:将一种或多种戊糖和/或己糖无损转化为D-核糖-5-磷酸中间体,然后将戊糖磷酸中间体转化为乙醇醛和G3P中间体,然后通过C2途径,将乙醇醛中间体转化为MEG(或乙醇酸),以及通过C3途径,将G3P转化为MEG(或乙醇酸)。其中,戊糖磷酸中间体是D-核糖-5-磷酸、D-核酮糖-5-磷酸或D-木酮糖-磷酸。
在一些实施方案中,本申请涉及一种能够由一种或多种戊糖和/或己糖生产MEG(或乙醇酸)的重组微生物,其中来自实施方案[A]、来自实施方案[B]或来自实施方案[C](并且任选地包括实施方案[D])、并另外具有在C2途径中生产MEG(或乙醇酸)的实施方案[E]或实施方案[F]的重组微生物进一步包含一种或多种生产MEG(或乙醇酸)的C3生物合成途径。用于生产MEG的C3生物合成途径例如如WO 2010/076324(Metabolic Explorer)中所述,其通过引用整体并入本文。
在一些实施方案中,用于生产MEG的C3生物合成途径包括三个酶促反应,从3-磷酸羟基丙酮酸前体(丝氨酸的前体)的转化开始。首先,磷酸酶活性允许磷酸羟基丙酮酸转化为羟基丙酮酸。然后在2-酮酸脱羧酶活性的作用下,羟基丙酮酸转化为乙醇醛。最后,羟基醛还原酶活性允许乙醇醛转化为乙二醇。另一种生产乙二醇的途径从L-丝氨酸作为前体开始。首先,转氨酶或氨基酸氧化酶活性允许丝氨酸转化为羟基丙酮酸。接下来的两步将羟基丙酮酸转化为乙醇醛,然后转化为MEG,这两步与上述第一个途径相似。
在一个优选的实施方案中,本公开提供重组微生物,其包含一种或多种用于生产MEG的C3生物合成途径。在一些实施方案中,重组微生物(特别是细菌)含有至少一种编码具有2-酮酸脱羧酶活性的多肽的基因和一种编码具有羟基醛还原酶活性的多肽的基因。这些基因可以是外源的或内源的,并且可以在染色体或染色体外表达。
在本公开的一个进一步的实施方案中,重组微生物(特别是细菌)包含其中中间体3-磷酸甘油酸的可得性增加的修饰。优选地,通过减弱编码磷酸甘油酸变位酶的基因(特别是基因gpmA和pgml之一或两者)的表达水平来实现该增加。这可以通过用较弱的启动子替换这些基因的野生型启动子来实现,或者通过使用使相应信使RNA或蛋白质不稳定的元件来实现。如果需要,也可以通过删除相应的DNA序列来实现基因的完全衰减。
在另一个实施方案中,重组微生物(特别是细菌)包含这样的修饰,其刺激进入丝氨酸生物合成途径的流。这可以通过增加分别由serA和serC基因编码的3-磷酸甘油酸脱氢酶和/或磷酸丝氨酸转氨酶的表达水平来实现。可以通过引入驱动serA和/或serC基因表达的人工启动子、通过增加细胞中的拷贝数或通过将增加相应蛋白质活性的突变引入serA和/或serC基因,来增加3-磷酸甘油酸脱氢酶和/或磷酸丝氨酸转氨酶的表达水平。也可以通过用lrp突变等位基因(如lrp-1等位基因对应于lrp蛋白中的GLU 114ASP替代)替换野生型lrp基因(编码亮氨酸反应性调节蛋白)导致serA基因转录的组成型激活,来增加serA基因的表达。
在本公开的一个具体实施方案中,可以将突变引入serA基因中,该突变降低SerA蛋白对反馈抑制剂丝氨酸(反馈脱敏等位基因)的敏感性,因此允许在丝氨酸存在下增加活性。EP 0 931 833(Ajinomoto)或EP 0 620 853(Wacker)中描述了脱敏等位基因(即反馈不敏感等位基因)的例子。
在另一个实施方案中,重组微生物(特别是细菌)包含这样的修饰,其刺激进入羟基丙酮酸生物合成途径的流。可以通过增加丝氨酸转氨酶或丝氨酸氧化酶(对于从丝氨酸作为前体开始的途径)的表达水平,或通过增加3-磷酸羟基丙酮酸磷酸酶的表达来实现这个结果。可以通过引入和过表达来自R.opacus的编码L-氨基酸氧化酶的基因,或通过将增加相应蛋白质活性的突变引入基因,来增加丝氨酸氧化酶的表达水平。可以通过引入驱动大肠杆菌serC基因表达的人工启动子、通过增加细胞中的拷贝数或通过将增加相应蛋白质活性的突变引入serC基因中,来增加丝氨酸转氨酶的表达。可以通过引入驱动大肠杆菌yeaB基因或serB基因表达的人工启动子、通过增加细胞中的拷贝数或通过将增加相应蛋白质活性的突变引入yeaB基因或serB基因中,来增加3-磷酸羟基丙酮酸磷酸酶的表达。可以通过引入和过表达来自酿酒酵母的GPP2基因,或通过将增加相应蛋白质活性的突变引入GPP2基因,来增加3-磷酸羟基丙酮酸磷酸酶的表达。
在本公开的一个进一步的实施方案中,重组微生物(特别是细菌)包含修饰,以呈现减弱的水平将乙醇醛转化为除乙二醇之外的其他化合物。这可以通过降低消耗乙醇醛的酶如羟基苏氨酸醛缩酶(由UaE编码)或乙醇醛脱氢酶(由aldA、aldB编码)的水平来实现。可以通过用较低强度的启动子替换天然启动子或通过使相应的信使RNA或蛋白质不稳定的元件,来减弱这些基因。如果需要,也可以通过删除相应的DNA序列来实现基因的完全衰减。
在本公开的一个进一步的实施方案中,通过使用不依赖于磷酸烯醇式丙酮酸(PEP)作为磷供体的糖输入系统,如已知转运葡萄糖的galP,或通过向糖-磷酸转移酶系统提供更多的磷酸烯醇式丙酮酸(PEP),来提高糖输入的效率。存在多种可用于增加微生物中PEP的可得性的方法。特别地,这可以通过减弱反应PEP→丙酮酸来实现。优选地,在所述株中至少减弱一个选自pykA和pykF的编码丙酮酸激酶的基因,以获得该结果。增加PEP可得性的另一种方法是有利于反应丙酮酸→PEP。这可以通过增加催化上述反应的磷酸烯醇式丙酮酸合酶的活性来实现。该酶由ppsA基因编码。因此,在微生物中,优先增加ppsA基因的表达。两种修饰可以同时存在于微生物中。
在本公开的一个进一步的实施方案中,重组微生物(特别是细菌)包含修饰,以呈现减弱的水平将丝氨酸转化为除乙二醇之外的其他化合物。可以通过减弱消耗丝氨酸的酶的水平,如丝氨酸脱氨酶(由sdaA、sdaB和/或tdcG编码)、丝氨酸转乙酰酶(由cysE编码)、色氨酸合酶(由trpAB编码)或丝氨酸羟甲基转移酶(由glyA编码),来实现该结果。可以通过用较低强度的启动子替换天然启动子或通过使相应的信使RNA或蛋白质不稳定的元件,来减弱这些基因。如果需要,也可以通过删除相应的DNA序列来实现基因的完全衰减。
在本公开的一个进一步的实施方案中,重组微生物(特别是细菌)包含修饰,以呈现减弱的水平将羟基丙酮酸转化为除乙醇醛之外的其他化合物。可以通过减弱消耗羟基丙酮酸的酶的水平,如羟基丙酮酸还原酶(由ghrA编码)或羟基丙酮酸异构酶(由hyi编码),来实现该结果。可以通过用较低强度的启动子替换天然启动子或通过使相应的信使RNA或蛋白质不稳定的元件,来减弱这些基因。如果需要,也可以通过删除相应的DNA序列来实现基因的完全衰减。
在一些实施方案中,本申请涉及一种能够由一种或多种戊糖和/或己糖生产MEG(或乙醇酸)的重组微生物,其中来自实施方案[A]、来自实施方案[B]或来自实施方案[C](并且任选地包括实施方案[D])、并另外具有在C2途径中生产MEG(或乙醇酸)的实施方案[E]或实施方案[F]的重组微生物进一步包含一种或多种生产MEG(或乙醇酸)的C3生物合成途径。用于生产MEG的C3生物合成途径例如如WO 2011/130378(Genomatica)中所述,其通过引用整体并入本文。
在一些实施方案中,本公开提供重组微生物,其包含具有至少一种编码乙二醇途径酶的外源核酸的乙二醇途径,所述外源核酸以足以产生乙二醇的量表达,所述乙二醇途径包括丝氨酸转氨酶、丝氨酸氧化还原酶(脱氨基)、羟基丙酮酸脱羧酶、乙醇醛还原酶、丝氨酸脱羧酶、乙醇胺转氨酶、乙醇胺氧化还原酶(脱氨基)、羟基丙酮酸还原酶或甘油酸脱羧酶。
在一些实施方案中,重组微生物包含具有至少一种编码乙二醇途径酶的外源核酸的乙二醇途径,所述外源核酸以足以产生乙二醇的量表达,所述乙二醇途径包括丝氨酸转氨酶或丝氨酸氧化还原酶(脱氨基);羟基丙酮酸脱羧酶和乙醇醛还原酶。
在一些实施方案中,重组微生物包含具有至少一种编码乙二醇途径酶的外源核酸的乙二醇途径,所述外源核酸以足以产生乙二醇的量表达,所述乙二醇途径包括丝氨酸转氨酶或丝氨酸氧化还原酶(脱氨基);羟基丙酮酸还原酶和甘油酸脱羧酶。
在一些实施方案中,重组微生物包含具有至少一种编码乙二醇途径酶的外源核酸的乙二醇途径,所述外源核酸以足以产生乙二醇的量表达,所述乙二醇途径包括丝氨酸脱羧酶;乙醇胺转氨酶或乙醇胺氧化还原酶(脱氨基)和乙醇醛还原酶。
在一些实施方案中,本公开提供重组微生物,其包含具有至少一种编码乙二醇途径酶的外源核酸的乙二醇途径,所述外源核酸以足以产生乙二醇的量表达,所述乙二醇途径包括羟基丙酮酸脱羧酶、乙醇醛还原酶、羟基丙酮酸还原酶、甘油酸脱羧酶、3-磷酸甘油酸磷酸酶和甘油酸激酶。
在一些实施方案中,重组微生物包含具有至少一种编码乙二醇途径酶的外源核酸的乙二醇途径,所述外源核酸以足以产生乙二醇的量表达,所述乙二醇途径包括羟基丙酮酸还原酶;羟基丙酮酸脱羧酶和乙醇醛还原酶。
在一些实施方案中,重组微生物包含具有至少一种编码乙二醇途径酶的外源核酸的乙二醇途径,所述外源核酸以足以产生乙二醇的量表达,所述乙二醇途径包括3-磷酸甘油酸磷酸酶或甘油酸激酶;羟基丙酮酸还原酶;羟基丙酮酸脱羧酶和乙醇醛还原酶。
在一些实施方案中,重组微生物包含具有至少一种编码乙二醇途径酶的外源核酸的乙二醇途径,所述外源核酸以足以产生乙二醇的量表达,所述乙二醇途径包括甘油酸脱羧酶。
在一些实施方案中,重组微生物包含具有至少一种编码乙二醇途径酶的外源核酸的乙二醇途径,所述外源核酸以足以产生乙二醇的量表达,所述乙二醇途径包括3-磷酸甘油酸磷酸酶或甘油酸激酶和甘油酸脱羧酶。
在一些实施方案中,本公开提供了包含乙二醇途径的重组微生物,其中所述重组微生物包含至少一种编码酶或蛋白质的外源核酸,所述酶或蛋白质将底物转化为产物,选自以下:丝氨酸转化为羟基丙酮酸、羟基丙酮酸转化为乙醇醛、乙醇醛转化为乙二醇、丝氨酸转化为乙醇胺、乙醇胺转化为乙醇醛、3-磷酸甘油酸转化为甘油酸、甘油酸转化为羟基丙酮酸、羟基丙酮酸转化为甘油酸以及甘油酸转化为乙二醇。本领域技术人员将理解,这些仅是示例性的,本领域技术人员基于本文的教导,可以容易地确定适用于生产所需产物并且可获得用于将底物转化为产物的适当活性的本文公开的任何底物-产物对。因此,本公开内容提供了重组微生物,其含有至少一种编码酶或蛋白质的外源核酸,其中所述酶或蛋白质转化乙二醇途径的底物和产物。
虽然在本文中笼统地描述为含有乙二醇途径的重组微生物,但应理解,本公开另外提供了包含至少一种编码乙二醇途径酶的外源核酸的重组微生物,所述外源核酸以足以产生乙二醇途径的中间体的量表达。因此,除了含有产生乙二醇的乙二醇途径的重组微生物之外,本公开还提供了包含至少一种编码乙二醇途径酶的外源核酸的重组微生物,其中所述微生物产生乙二醇途径中间体,例如羟基丙酮酸、乙醇胺、乙醇醛或甘油酸。
在一些实施方案中,丝氨酸转氨酶或丝氨酸氧化还原酶(脱氨基)催化丝氨酸转化为羟基丙酮酸。在一些实施方案中,羟基丙酮酸脱羧酶催化羟基丙酮酸转化为乙醇醛。在一些实施方案中,乙醇醛还原酶催化乙醇醛转化为乙二醇。在一些实施方案中,丝氨酸脱羧酶催化丝氨酸转化为乙醇胺。在一些实施方案中,乙醇胺转氨酶或乙醇胺氧化还原酶(脱氨基)催化乙醇胺转化为乙醇醛。在一些实施方案中,羟基丙酮酸还原酶催化甘油酸转化为羟基丙酮酸。在一些实施方案中,甘油酸脱羧酶催化甘油酸转化为乙二醇。在一些实施方案中,3-磷酸甘油酸磷酸酶或甘油酸激酶催化3-磷酸甘油酸转化为甘油酸。
在一些实施方案中,生产MEG(或乙醇酸)如下:将一种或多种戊糖和/或己糖无损转化为D-核糖-5-磷酸中间体,然后将D-核糖-5-磷酸中间体转化为乙醇醛和G3P中间体,然后通过C2途径,将乙醇醛中间体转化为MEG(或乙醇酸),以及通过C3途径,将G3P中间体转化为MEG(或乙醇酸)。
[K]在一个实施方案中,本申请涉及一种能够由一种或多种戊糖和/或己糖和一种氮源生产单乙二醇(MEG)(或乙醇酸)的重组微生物,其中来自实施方案[A]、或来自实施方案[B]或来自实施方案[C](并且任选地包括实施方案[D])、并另外具有在C2途径中生产MEG(或乙醇酸)的实施方案[E]或实施方案[F]的重组微生物进一步表达以下(a)至(h)中的一种或多种:
(a)至少一种内源性或外源性核酸分子,其编码具有3-磷酸甘油酸脱氢酶活性的酶,该酶催化3-磷酸甘油酸转化为3-磷酸羟基丙酮酸;
(b)至少一种内源性或外源性核酸分子,其编码具有磷酸丝氨酸转氨酶活性的酶,该酶催化来自(a)的3-磷酸羟基丙酮酸转化为磷酸-L-丝氨酸;
(c)至少一种内源性或外源性核酸分子,其编码具有3-磷酸羟基丙酮酸磷酸酶活性的酶,该酶催化来自(a)的3-磷酸羟基丙酮酸转化为羟基丙酮酸;
(d)至少一种内源性或外源性核酸分子,其编码具有磷酸丝氨酸磷酸酶活性的酶,该酶催化来自(b)的磷酸-L-丝氨酸转化为L-丝氨酸;
(e)至少一种内源性或外源性核酸分子,其编码具有L-丝氨酸转氨酶或丝氨酸氧化酶活性的酶,该酶催化来自(d)的L-丝氨酸转化为羟基丙酮酸;
(f)至少一种内源性或外源性核酸分子,其编码具有羟基丙酮酸脱羧酶活性的酶,该酶催化来自(c)或(e)的羟基丙酮酸转化为乙醇醛;
(g)至少一种内源性或外源性核酸分子,其编码具有乙醇醛还原酶活性的酶,该酶催化来自(f)的乙醇醛转化为MEG;
(h)至少一种内源性或外源性核酸分子,其编码具有乙醇醛脱氢酶活性的酶,该酶催化来自(f)的乙醇醛转化为乙醇酸;
其中来自实施方案[A]、来自实施方案[B]或来自实施方案[C]的产生的中间体G3P通过重组微生物中的内源性糖酵解转化为3-磷酸甘油酸,并且其中生产MEG(或乙醇酸)。
[L]在一个实施方案中,本申请涉及一种能够由一种或多种戊糖和/或己糖和一种氮源生产单乙二醇(MEG)(或乙醇酸)的重组微生物,其中来自实施方案[A]、来自实施方案[B]或来自实施方案[C](并且任选地包括实施方案[D])、并另外具有在C2途径中生产MEG(或乙醇酸)的实施方案[E]或实施方案[F]的重组微生物进一步表达以下(a)至(j)中的一种或多种:
(a)至少一种内源性或外源性核酸分子,其编码具有2-磷酸甘油酸磷酸酶活性的酶和/或具有甘油酸-2-激酶活性的酶,该酶催化2-磷酸甘油酸转化为甘油酸;
(b)至少一种内源性或外源性核酸分子,其编码具有3-磷酸甘油酸磷酸酶活性的酶或具有甘油酸-3-激酶活性的酶,该酶催化3-磷酸甘油酸转化为甘油酸;
(c)至少一种内源性或外源性核酸分子,其编码具有羟基丙酮酸还原酶活性的酶,该酶催化来自(a)和/或(b)的甘油酸转化为羟基丙酮酸;
(d)至少一种内源性或外源性核酸分子,其编码具有丝氨酸转氨酶活性的酶或具有丝氨酸氧化还原酶(脱氨基)活性的酶,该酶催化L-丝氨酸转化为羟基丙酮酸;
(e)至少一种内源性或外源性核酸分子,其编码具有L-丝氨酸脱羧酶活性的酶,该酶催化L-丝氨酸转化为乙醇胺;
(f)至少一种内源性或外源性核酸分子,其编码具有羟基丙酮酸脱羧酶活性的酶,该酶催化来自(c)和/或(d)的羟基丙酮酸转化为乙醇醛;
(g)至少一种内源性或外源性核酸分子,其编码具有乙醇胺转氨酶或乙醇胺氧化还原酶(脱氨基)活性的酶,该酶催化来自(e)的乙醇胺转化为乙醇醛;
(h)至少一种内源性或外源性核酸分子,其编码具有甘油酸脱羧酶活性的酶,该酶催化来自(a)和/或(b)的甘油酸转化为MEG;
(i)至少一种内源性或外源性核酸分子,其编码具有乙醇醛还原酶活性的酶,该酶催化来自(f)和/或(g)的乙醇醛转化为MEG;
(j)至少一种内源性或外源性核酸分子,其编码具有乙醇醛脱氢酶活性的酶,该酶催化来自(f)和/或(g)的乙醇醛转化为乙醇酸;
其中来自实施方案[A]、来自实施方案[B]或来自实施方案[C]的产生的中间体G3P通过重组微生物中的内源性糖酵解转化为3-磷酸甘油酸和/或2-磷酸甘油酸,并且其中生产MEG(或乙醇酸)。
在一些实施方案中,2-酮酸脱羧酶、羟基丙酮酸脱羧酶或2-氧代戊二酸脱羧酶将羟基丙酮酸转化为乙醇醛。在一些实施方案中,将羟基丙酮酸转化为乙醇醛的酶由与Kivd、dxs或SucA具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一些实施方案中,2-酮酸脱羧酶是来自乳酸乳球菌的Kivd。在又一个实施方案中,编码2-酮酸脱羧酶的一种或多种核酸分子包含SEQ ID NO:224中列出的氨基酸序列。在一个进一步的实施方案中,编码2-酮酸脱羧酶的一种或多种核酸分子包含SEQID NO:223中列出的核酸序列。在一些实施方案中,2-氧代戊二酸脱羧酶是来自大肠杆菌的SucA。在又一个实施方案中,编码2-氧代戊二酸脱羧酶的一种或多种核酸分子包含SEQ IDNO:226中列出的氨基酸序列。在一个进一步的实施方案中,编码2-氧代戊二酸脱羧酶的一种或多种核酸分子包含SEQ ID NO:225中列出的核酸序列。
在一些实施方案中,羟基醛还原酶可以是乙醇醛还原酶。在一些实施方案中,具有乙醇醛还原酶活性的酶由与yqhD或FucO具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一些实施方案中,具有乙醇醛还原酶活性的酶由获自微生物的一种或多种核酸分子编码,所述微生物选自大肠杆菌和酿酒酵母。在另一个实施方案中,一种或多种核酸分子选自gldA、GRE2、GRE3、yqhD、ydjG、fucO、yafB(dkgB)和/或yqhE(dkgA),或其同源物。在另一个实施方案中,一种或多种核酸分子是yqhD。在一些实施方案中,yqhD包含G149E突变。在一个进一步的实施方案中,具有乙醇醛还原酶活性的酶包含选自SEQ ID NO:13、15、17、20、23、25、28、30和32的氨基酸序列。在一个仍进一步的实施方案中,具有乙醇醛还原酶活性的酶由选自SEQ ID NO:12、14、16、18、19、21、22、24、26、27、29和31的核酸序列编码。
在一些实施方案中,3-磷酸甘油酸脱氢酶可以是3-磷酸-羟基丙酮酸还原酶或2-氧代戊二酸还原酶。在一些实施方案中,具有3-磷酸-羟基丙酮酸还原酶活性的酶由与serA具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一些实施方案中,具有3-磷酸-羟基丙酮酸还原酶活性的酶是来自大肠杆菌的serA。在又一个实施方案中,编码具有3-磷酸-羟基丙酮酸还原酶活性的酶的一种或多种核酸分子包含SEQ ID NO:228中列出的氨基酸序列。在一个进一步的实施方案中,编码具有3-磷酸-羟基丙酮酸还原酶活性的酶的一种或多种核酸分子包含SEQ ID NO:227中列出的核酸序列。
在一些实施方案中,3-磷酸丝氨酸转氨酶可以是L-丝氨酸转氨酶、丝氨酸转氨酶或丝氨酸-丙酮酸转氨酶。在一些实施方案中,具有3-磷酸丝氨酸转氨酶活性的酶由与serC具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一些实施方案中,具有3-磷酸丝氨酸转氨酶活性的酶是来自大肠杆菌的serC。在又一个实施方案中,编码具有3-磷酸丝氨酸转氨酶活性的酶的一种或多种核酸分子包含SEQ ID NO:230中列出的氨基酸序列。在一个进一步的实施方案中,编码具有3-磷酸丝氨酸转氨酶活性的酶的一种或多种核酸分子包含SEQ ID NO:229中列出的核酸序列。
在一些实施方案中,具有丝氨酸-丙酮酸转氨酶活性的酶是来自人的AGXT1。在又一个实施方案中,编码具有丝氨酸-丙酮酸转氨酶活性的酶的一种或多种核酸分子包含SEQID NO:244中列出的氨基酸序列。在一个进一步的实施方案中,编码具有丝氨酸-丙酮酸转氨酶活性的酶的一种或多种核酸分子包含SEQ ID NO:243中列出的核酸序列。
在一些实施方案中,具有3-磷酸-羟基丙酮酸磷酸酶活性的酶由与yeaB(nudL)具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一些实施方案中,具有3-磷酸-羟基丙酮酸磷酸酶活性的酶是来自大肠杆菌的yeaB(nudL)。在又一个实施方案中,编码具有3-磷酸-羟基丙酮酸磷酸酶活性的酶的一种或多种核酸分子包含SEQ ID NO:232中列出的氨基酸序列。在一个进一步的实施方案中,编码具有3-磷酸-羟基丙酮酸磷酸酶活性的酶的一种或多种核酸分子包含SEQ ID NO:231中列出的核酸序列。
在一些实施方案中,具有磷酸丝氨酸磷酸酶活性的酶由与serB具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一些实施方案中,具有磷酸丝氨酸磷酸酶活性的酶是来自大肠杆菌的serB。在又一个实施方案中,编码具有磷酸丝氨酸磷酸酶活性的酶的一种或多种核酸分子包含SEQ ID NO:234中列出的氨基酸序列。在一个进一步的实施方案中,编码具有磷酸丝氨酸磷酸酶活性的酶的一种或多种核酸分子包含SEQ ID NO:233中列出的核酸序列。
在一些实施方案中,具有2-磷酸甘油酸磷酸酶活性的酶或具有甘油酸-2-激酶活性的酶将2-磷酸甘油酸转化为甘油酸。在一些实施方案中,将2-磷酸甘油酸转化为甘油酸的酶由与phoA、glxK或garK具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一些实施方案中,具有2-磷酸甘油酸磷酸酶活性的酶是来自大肠杆菌的phoA。在又一个实施方案中,编码具有2-磷酸甘油酸磷酸酶活性的酶的一种或多种核酸分子包含SEQ ID NO:246中列出的氨基酸序列。在一个进一步的实施方案中,编码具有2-磷酸甘油酸磷酸酶活性的酶的一种或多种核酸分子包含SEQ ID NO:245中列出的核酸序列。在一些实施方案中,具有甘油酸-2-激酶活性的酶是来自大肠杆菌的glxK。在又一个实施方案中,编码具有甘油酸-2-激酶活性的酶的一种或多种核酸分子包含SEQ ID NO:250中列出的氨基酸序列。在一个进一步的实施方案中,编码具有甘油酸-2-激酶活性的酶的一种或多种核酸分子包含SEQ ID NO:249中列出的核酸序列。在一些实施方案中,具有甘油酸-2-激酶活性的酶是来自大肠杆菌的garK。在又一个实施方案中,编码具有甘油酸-2-激酶活性的酶的一种或多种核酸分子包含SEQ ID NO:252中列出的氨基酸序列。在一个进一步的实施方案中,编码具有甘油酸-2-激酶活性的酶的一种或多种核酸分子包含SEQ ID NO:251中列出的核酸序列。
在一些实施方案中,具有3-磷酸甘油酸磷酸酶活性的酶或具有甘油酸-3-激酶活性的酶将3-磷酸甘油酸转化为甘油酸。在一些实施方案中,将3-磷酸甘油酸转化为甘油酸的酶由与phoA或GLYK具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一些实施方案中,具有3-磷酸甘油酸磷酸酶活性的酶是来自大肠杆菌的phoA。在又一个实施方案中,编码具有3-磷酸甘油酸磷酸酶活性的酶的一种或多种核酸分子包含SEQ ID NO:246中列出的氨基酸序列。在一个进一步的实施方案中,编码具有3-磷酸甘油酸磷酸酶活性的酶的一种或多种核酸分子包含SEQ ID NO:245中列出的核酸序列。在一些实施方案中,具有甘油酸-3-激酶活性的酶是来自拟南芥的GLYK。在又一个实施方案中,编码具有甘油酸-3-激酶活性的酶的一种或多种核酸分子包含SEQ IDNO:248中列出的氨基酸序列。在一个进一步的实施方案中,编码具有甘油酸-3-激酶活性的酶的一种或多种核酸分子包含SEQ ID NO:247中列出的核酸序列。
在一些实施方案中,具有羟基丙酮酸还原酶活性的酶将甘油酸转化为羟基丙酮酸。在一些实施方案中,将甘油酸转化为羟基丙酮酸的酶由与ghrB具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一些实施方案中,具有羟基丙酮酸还原酶活性的酶是来自大肠杆菌的ghrB。在又一个实施方案中,编码具有羟基丙酮酸还原酶活性的酶的一种或多种核酸分子包含SEQ ID NO:242中列出的氨基酸序列。在一个进一步的实施方案中,编码具有羟基丙酮酸还原酶活性的酶的一种或多种核酸分子包含SEQ ID NO:241中列出的核酸序列。
在一些实施方案中,具有丝氨酸脱羧酶活性的酶将L-丝氨酸转化为乙醇胺。在一些实施方案中,将L-丝氨酸转化为乙醇胺的酶由与SDC具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一些实施方案中,具有丝氨酸脱羧酶活性的酶是来自拟南芥的SDC。在又一个实施方案中,编码具有丝氨酸脱羧酶活性的酶的一种或多种核酸分子包含SEQ ID NO:236中列出的氨基酸序列。在一个进一步的实施方案中,编码具有丝氨酸脱羧酶活性的酶的一种或多种核酸分子包含SEQ ID NO:235中列出的核酸序列。
在一些实施方案中,具有乙醇胺转氨酶活性的酶或具有乙醇胺氧化还原酶(脱氨基)活性的酶将乙醇胺转化为乙醇醛。在一些实施方案中,将乙醇胺转化为乙醇醛的酶由与alaA或tynA具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一些实施方案中,具有乙醇胺转氨酶活性的酶是来自大肠杆菌的alaA。在又一个实施方案中,编码具有乙醇胺转氨酶活性的酶的一种或多种核酸分子包含SEQ ID NO:240中列出的氨基酸序列。在一个进一步的实施方案中,编码具有乙醇胺转氨酶活性的酶的一种或多种核酸分子包含SEQ ID NO:239中列出的核酸序列。在一些实施方案中,具有乙醇胺氧化还原酶(脱氨基)活性的酶是来自大肠杆菌的tynA。在又一个实施方案中,编码具有乙醇胺氧化还原酶(脱氨基)活性的酶的一种或多种核酸分子包含SEQ ID NO:238中列出的氨基酸序列。在一个进一步的实施方案中,编码具有乙醇胺氧化还原酶(脱氨基)活性的酶的一种或多种核酸分子包含SEQ ID NO:237中列出的核酸序列。
另一方面,生产MEG如下:将一种或多种戊糖和/或己糖无损转化为D-核糖-5-磷酸中间体,然后将D-核糖-5-磷酸中间体转化为乙醇醛和D-甘油醛-3-磷酸(G3P)中间体,然后通过C2途径,将乙醇醛中间体转化为MEG,以及通过C3途径,将G3P中间体转化为一种或多种联产品。
通过C2途径联产MEG和通过C3途径联产丙酮、异丙醇、丙烯和/或异丁烯
在一些实施方案中,生产MEG如下:将一种或多种戊糖和/或己糖无损转化为D-核糖-5-磷酸中间体,然后将D-核糖-5-磷酸中间体转化为乙醇醛和D-甘油醛-3-磷酸(G3P)中间体,然后通过C2途径,将乙醇醛中间体转化为MEG,以及通过C3途径,将G3P中间体转化为丙酮。
[M]在一个实施方案中,本申请涉及一种能够由一种或多种戊糖和/或己糖联产单乙二醇(MEG)和丙酮的重组微生物,其中来自实施方案[A]、来自实施方案[B]或来自实施方案[C](并且任选地包括实施方案[D])、并另外具有在C2途径中生产MEG的实施方案[E]的重组微生物进一步表达以下(a)至(c)中的一种或多种:
(a)至少一种内源性或外源性核酸分子,其编码具有硫解酶或乙酰辅酶A乙酰转移酶活性的酶,该酶催化乙酰辅酶A转化为乙酰乙酰辅酶A;
(b)至少一种内源性或外源性核酸分子,其编码具有乙酰辅酶A:乙酰乙酸辅酶A转移酶活性的酶或具有乙酸:乙酰乙酰辅酶A水解酶活性的酶,该酶催化来自(a)的乙酰乙酰辅酶A转化为乙酰乙酸;和/或
(c)至少一种内源性或外源性核酸分子,其编码具有乙酰乙酸脱羧酶活性的酶,该酶催化来自(b)的乙酰乙酸转化为丙酮;
其中来自实施方案[A]和/或实施方案[B]的产生的中间体G3P通过微生物中的内源性糖酵解转化为乙酰辅酶A,并且其中联产MEG(或乙醇酸)和丙酮。
在一些实施方案中,生产MEG如下:将一种或多种戊糖和/或己糖无损转化为D-核糖-5-磷酸中间体,然后将D-核糖-5-磷酸中间体转化为乙醇醛和D-甘油醛-3-磷酸(G3P)中间体,然后通过C2途径,将乙醇醛中间体转化为MEG,以及通过C3途径,将G3P中间体转化为异丁烯。
[N]在一些实施方案中,本申请涉及一种能够由一种或多种戊糖和/或己糖联产单乙二醇(MEG)和异丁烯的重组微生物,其中来自实施方案[A]、来自实施方案[B]或来自实施方案[C](并且任选地包括实施方案[D])、并另外具有在C2途径中生产MEG的实施方案[E]的重组微生物进一步表达以下(a)至(d)中的一种或多种:
(a)至少一种内源性或外源性核酸分子,其编码具有硫解酶或乙酰辅酶A乙酰转移酶活性的酶,该酶催化乙酰辅酶A转化为乙酰乙酰辅酶A;
(b)至少一种内源性或外源性核酸分子,其编码具有乙酰辅酶A:乙酰乙酸辅酶A转移酶活性的酶或具有乙酸:乙酰乙酰辅酶A水解酶活性的酶,该酶催化来自(a)的乙酰乙酰辅酶A转化为乙酰乙酸;
(c)至少一种内源性或外源性核酸分子,其编码具有乙酰乙酸脱羧酶活性的酶,该酶催化来自(b)的乙酰乙酸转化为丙酮;
(d)至少一种内源性或外源性核酸分子,其编码具有3-羟基异戊酸合酶活性的酶,该酶催化来自(c)的丙酮和乙酰辅酶A转化为3-羟基异戊酸(3HIV);
其中所述重组微生物表达以下(e)至(j)中的一种或多种:
(e)至少一种内源性或外源性核酸分子,其编码具有硫解酶或乙酰辅酶A乙酰转移酶活性的酶,该酶催化乙酰辅酶A转化为乙酰乙酰辅酶A;
(f)至少一种内源性或外源性核酸分子,其编码具有羟甲基戊二酰辅酶A合酶活性的酶,该酶催化来自(e)的乙酰乙酰辅酶A和乙酰辅酶A转化为3-羟基-3-甲基戊二酰辅酶A(HMG-CoA);
(g)至少一种内源性或外源性核酸分子,其编码具有甲基戊烯二酰辅酶A水合酶活性的酶,该酶催化来自(f)的HMG-CoA转化为3-甲基戊烯二酰辅酶A;
(h)至少一种内源性或外源性核酸分子,其编码具有甲基巴豆酰辅酶A羧化酶活性的酶,该酶催化来自(g)的3-甲基戊烯二酰辅酶A转化为3-甲基巴豆酰辅酶A;
(i)至少一种内源性或外源性核酸分子,其编码具有甲基巴豆酰辅酶A水合酶活性的酶,该酶催化来自(h)的3-甲基巴豆酰辅酶A转化为3-羟基异戊酰辅酶A;
(j)至少一种内源性或外源性核酸分子,其编码具有3-羟基异戊酰辅酶A硫酯酶活性的酶,该酶催化来自(i)的3-羟基异戊酰辅酶A转化为3HIV;
其中所述重组微生物进一步表达(a1)和(a2)和/或(b1),选自:
(a1)至少一种内源性或外源性核酸分子,其编码具有3HIV激酶活性的酶,该酶催化来自(d)或(j)的3HIV转化为3HIV-3-磷酸;
(a2)至少一种内源性或外源性核酸分子,其编码具有3HIV-3-磷酸脱羧酶活性的酶,该酶催化来自(a1)的3HIV-3-磷酸转化为异丁烯;
(b1)至少一种内源性或外源性核酸分子,其编码具有3HIV脱羧酶活性的酶,该酶催化来自(d)或(j)的3HIV转化为异丁烯;
其中来自实施方案[A]、来自实施方案[B]或来自实施方案[C]的产生的中间体G3P通过微生物中的内源性糖酵解转化为乙酰辅酶A,并且其中联产MEG和异丁烯。
在一些实施方案中,生产MEG如下:将一种或多种戊糖和/或己糖无损转化为D-核糖-5-磷酸中间体,然后将D-核糖-5-磷酸中间体转化为乙醇醛和D-甘油醛-3-磷酸(G3P)中间体,然后通过C2途径,将乙醇醛中间体转化为MEG,以及通过C3途径,将G3P中间体转化为异丙醇。
[O]在一个实施方案中,来自实施方案[M]和/或[N](任选地包括实施方案[EE])的重组微生物任选地进一步表达至少一种内源性或外源性核酸分子,其编码具有仲醇脱氢酶活性的酶,该酶催化丙酮转化为异丙醇。
在一些实施方案中,醇脱氢酶与来自梭菌的醇脱氢酶具有至少70%的序列同一性、至少80%的序列同一性或至少90%的序列同一性。在其他实施方案中,醇脱氢酶是选自拜氏梭菌(Clostridium beijerinckii)adh和食碳梭菌(Clostridiumcarboxidivorans)adh的醇脱氢酶。在进一步的实施方案中,醇脱氢酶包含选自SEQ ID NO:138和140的氨基酸序列。在一个仍进一步的实施方案中,醇脱氢酶由选自SEQ ID NO:136、137和139的核酸序列编码。
在一些实施方案中,生产MEG如下:将一种或多种戊糖和/或己糖无损转化为D-核糖-5-磷酸中间体,然后将D-核糖-5-磷酸中间体转化为乙醇醛和D-甘油醛-3-磷酸(G3P)中间体,然后通过C2途径,将乙醇醛中间体转化为MEG,以及通过C3途径,将G3P中间体转化为丙烯。
[P]在另一个实施方案中,来自实施方案[O](任选地包括实施方案[EE])的重组微生物任选地进一步包含至少一种内源性或外源性核酸分子,其编码具有脱水酶活性的酶,该酶催化异丙醇转化为丙烯。
在上文公开的用于联产异丁烯的任何途径的一个实施方案中,具有3-羟基异戊酸合酶活性的酶由一种或多种获自微生物的核酸分子编码,所述微生物选自鼠属物种(Mussp.)、酵母属物种、乳杆菌属物种和单胞菌属物种(Polaromonas sp.)。在另一个实施方案中,具有3-羟基异戊酸合酶活性的酶由一种或多种获自微生物的核酸分子编码,所述微生物选自小鼠、酿酒酵母、卷曲乳杆菌(Lactobacillus crispatus)和食萘极地单胞菌(Polaromonas naphthalenivorans)。在一些实施方案中,编码具有3-羟基异戊酸合酶活性的酶的一种或多种核酸分子选自Hmgcs1、ERG13、PksG和/或Pnap_0477,或其同源物。在一个进一步的实施方案中,编码具有3-羟基异戊酸合酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO:105、107、109和111的氨基酸序列。在又一个实施方案中,编码具有3-羟基异戊酸合酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO:104、106、108和110的核酸序列。
在上文公开的用于联产异丁烯的任何途径的一个实施方案中,具有羟甲基戊二酰辅酶A合酶活性的酶由一种或多种获自酵母属物种的核酸分子编码。在另一个实施方案中,具有羟甲基戊二酰辅酶A合酶活性的酶由获自酿酒酵母的一种或多种核酸分子编码。在一些实施方案中,编码具有羟甲基戊二酰辅酶A合酶活性的酶的一种或多种核酸分子是HmgS,或其同源物。在一个进一步的实施方案中,编码具有羟甲基戊二酰辅酶A合酶活性的酶的一种或多种核酸分子包含SEQ ID NO:123中列出的氨基酸序列。在又一个实施方案中,编码具有羟甲基戊二酰辅酶A合酶活性的酶的一种或多种核酸分子包含SEQ ID NO:122中列出的核酸序列。
在上文公开的用于联产异丁烯的任何途径的一个实施方案中,具有甲基戊烯二酰辅酶A水合酶活性的酶由一种或多种获自假单胞菌属物种的核酸分子编码。在另一个实施方案中,具有甲基戊烯二酰辅酶A水合酶活性的酶由获自恶臭假单胞菌的一种或多种核酸分子编码。在一些实施方案中,编码具有甲基戊烯二酰辅酶A水合酶活性的酶的一种或多种核酸分子是liuC,或其同源物。在一个进一步的实施方案中,编码具有甲基戊烯二酰辅酶A水合酶活性的酶的一种或多种核酸分子包含SEQ ID NO:125中列出的氨基酸序列。在又一个实施方案中,编码具有甲基戊烯二酰辅酶A水合酶活性的酶的一种或多种核酸分子包含SEQ ID NO:124中列出的核酸序列。
在上文公开的用于联产异丁烯的任何途径的一个实施方案中,具有甲基巴豆酰辅酶A羧化酶活性的酶由一种或多种获自假单胞菌属物种的核酸分子编码。在另一个实施方案中,具有甲基巴豆酰辅酶A羧化酶活性的酶由获自铜绿假单胞菌的一种或多种核酸分子编码。在一些实施方案中,编码具有甲基巴豆酰辅酶A羧化酶活性的酶的一种或多种核酸分子是liuB和/或liuD,或其同源物。在一个进一步的实施方案中,编码具有甲基巴豆酰辅酶A羧化酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO:127和129的氨基酸序列。在又一个实施方案中,编码具有甲基巴豆酰辅酶A羧化酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO:126和128的核酸序列。
在上文公开的用于联产异丁烯的任何途径的一个实施方案中,具有甲基巴豆酰辅酶A水合酶活性的酶是3-酮酰基辅酶A硫解酶。在另一个实施方案中,具有甲基巴豆酰辅酶A水合酶活性的酶是烯酰辅酶A水合酶。在另一个实施方案中,具有甲基巴豆酰辅酶A水合酶活性的酶由获自大肠杆菌的一种或多种核酸分子编码。在一些实施方案中,编码具有甲基巴豆酰辅酶A水合酶活性的酶的一种或多种核酸分子是fadA和/或fadB,或其同源物。在一个进一步的实施方案中,编码具有甲基巴豆酰辅酶A水合酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO:131和133的氨基酸序列。在又一个实施方案中,编码具有甲基巴豆酰辅酶A水合酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO:130和132的核酸序列。
在上文公开的用于联产异丁烯的任何途径的一个实施方案中,具有3-羟基异戊酰辅酶A硫酯酶活性的酶由一种或多种获自大肠杆菌的核酸分子编码。在一些实施方案中,编码具有3-羟基异戊酰辅酶A硫酯酶活性的酶的一种或多种核酸分子是tesB,或其同源物。在一个进一步的实施方案中,编码具有3-羟基异戊酰辅酶A硫酯酶活性的酶的一种或多种核酸分子包含SEQ ID NO:135中列出的氨基酸序列。在又一个实施方案中,编码具有3-羟基异戊酰辅酶A硫酯酶活性的酶的一种或多种核酸分子包含SEQ ID NO:134中列出的核酸序列。
在上文公开的用于联产异丁烯的任何途径的一个实施方案中,具有3HIV激酶活性的酶由一种或多种获自微生物的核酸分子编码,所述微生物选自热原体属物种(Thermoplasma sp.)和嗜酸古菌属物种。在另一个实施方案中,具有3HIV激酶活性的酶由一种或多种获自微生物的核酸分子编码,所述微生物选自嗜酸热原体(Thermoplasmaacidophilum)和托氏嗜酸古菌(Picrophilus torridus)。在一些实施方案中,编码具有3HIV激酶活性的酶的一种或多种核酸分子是TA1305和/或PTO1356,或其同源物。在一些实施方案中,TA1305包含L200E突变。在一个进一步的实施方案中,编码具有3HIV激酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO:113、115和117的氨基酸序列。在又一个实施方案中,编码具有3HIV激酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO:112、114和116的核酸序列。
在上文公开的用于联产异丁烯的任何途径的一个实施方案中,具有3HIV-3-磷酸脱羧酶活性的酶由一种或多种获自链球菌属物种的核酸分子编码。在另一个实施方案中,具有3HIV-3-磷酸脱羧酶活性的酶由获自微生物的一种或多种核酸分子编码,所述微生物选自缓症链球菌(Streptococcus mitis)和/或戈登氏链球菌(Streptococcus gordonii)。在一些实施方案中,编码具有3HIV-3-磷酸脱羧酶活性的酶的一种或多种核酸分子是smi_1746和/或mvaD,或其同源物。在一个进一步的实施方案中,编码具有3HIV-3-磷酸脱羧酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO:119和121的氨基酸序列。在又一个实施方案中,编码具有3HIV-3-磷酸脱羧酶活性的酶的一种或多种核酸分子包含选自SEQ IDNO:118和120的核酸序列。
在上文公开的用于联产异丁烯的任何途径的一个实施方案中,具有3HIV脱羧酶活性的酶由一种或多种获自微生物的核酸分子编码,所述微生物选自链球菌属物种、热原体属物种(Thermoplasma sp.)和嗜酸古菌属物种。在另一个实施方案中,具有3HIV脱羧酶活性的酶由一种或多种获自微生物的核酸分子编码,所述微生物选自戈登氏链球菌、嗜酸热原体和托氏嗜酸古菌(Picrophilus torridus)。在一些实施方案中,编码具有3HIV脱羧酶活性的酶的一种或多种核酸分子包含mvaD、TA1305和/或PTO1356,或其同源物。在一个进一步的实施方案中,编码具有3HIV脱羧酶活性的酶的一种或多种核酸分子包含选自SEQ IDNO:113、117和121的氨基酸序列。在又一个实施方案中,编码具有3HIV脱羧酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO:112、116和120的核酸序列。
通过C2途径联产MEG和通过C3途径联产一种或多种丝氨酸途径化合物
在一些实施方案中,通过C2途径生产MEG与通过C3途径生产一种或多种丝氨酸途径化合物相偶联。在一个实施方案中,一种或多种丝氨酸途径化合物涉及L-丝氨酸生物合成途径。在另一个实施方案中,一种或多种丝氨酸途径化合物是L-丝氨酸(Ser)、甘氨酸(Gly)、单乙醇胺(MEA)和/或乙二胺(EDA)(图6)。
通过C2途径生产单乙二醇(MEG)或乙醇酸
如上所述,所有目前已知的使用葡萄糖作为原料的MEG(或乙醇酸)生产方法均具有低产率潜力。这是葡萄糖被降解为MEG的生物化学的固有缺点,对于所有建议的和已知的途径,每个生产的MEG(或乙醇酸)分子发生一次脱羧。然而,每个MEG一次脱羧过多,不能达到氧化还原中性,因此也不能达到最佳产率。
为了生产本公开中的MEG,如上所述,一种或多种戊糖和/或己糖通过非氧化进入磷酸戊糖途径,以保持产率潜力的方式转化为戊糖磷酸中间体。然后戊糖磷酸中间体通过具有戊糖磷酸醛缩酶活性的酶转化为乙醇醛和G3P,其中所述戊糖磷酸中间体是D-核糖-5-磷酸、D-核酮糖-5-磷酸或D-木酮糖-5-磷酸,其中所述醛缩酶具有D-核糖-5-磷酸醛缩酶活性、D-核酮糖-5-磷酸醛缩酶活性或D-木酮糖-5-磷酸醛缩酶活性。乙醇醛中间体被还原为MEG,消耗一个NADH。可选地,乙醇醛可以被乙醇醛脱氢酶氧化为乙醇酸。C3化合物G3P被进一步氧化为L-丝氨酸途径化合物Ser、Gly、MEA或EDA中的一种或多种,产生NADH。
为了减少ATP需求并优化产率潜力,优选通过H+/木糖同向转运蛋白(如来自大肠杆菌的XylE)或被动的、不依赖于能量的协同蛋白(facilitator)来向内转运D-木糖,而不是通过主动的ABC型转运蛋白(如来自大肠杆菌的XylFGH),其每转运一个分子利用1个ATP。虽然同向转运蛋白不直接消耗ATP,但其对质子梯度的降低(degradation)相当于利用了大约0.1个ATP。以下所有方程式中都没有考虑这种间接ATP消耗以及维持细胞所需的ATP。
氨(NH3)
氨是分子式为NH3的氮和氢的化合物,其用作食品和肥料的前体,也用作合成医药产品和商业清洁产品的基础材料。氨在带正电荷时以铵阳离子形式存在,其化学式为NH4 +
本公开教导利用氨或类似化合物作为氮源。当氨或类似化合物用作氮源时,其被固定在有机物质中,例如谷氨酸。在一个实施方案中,当2-氧代戊二酸通常地形成谷氨酸时,氨被固定,并且该过程消耗一个NADH。
L-丝氨酸(Ser)的生产
Ser通过天然途径由3-磷酸丝氨酸或其变体生产。在一个实施方案中,由D-核糖5-磷酸醛缩酶转化D-核糖5-磷酸产生的G3P通过微生物中的内源性糖酵解转化为3-磷酸-D-甘油酸(3-磷酸甘油酸)。3-磷酸甘油酸通过D-3-磷酸甘油酸脱氢酶(EC 1.1.1.95)转化为3-磷酸羟基丙酮酸。然后3-磷酸羟基丙酮酸通过3-磷酸丝氨酸转氨酶(EC 2.6.1.52)转化为3-磷酸丝氨酸。然后3-磷酸丝氨酸通过磷酸丝氨酸磷酸酶(EC 3.1.3.3)转化为L-丝氨酸。
在一些实施方案中,3-磷酸甘油酸至L-丝氨酸的反应如下:
3-磷酸-D-甘油酸+NAD++L-谷氨酸+H2O→L-丝氨酸+NADH+2-氧代戊二酸+磷酸
考虑到从G3P至3-磷酸羟基丙酮酸产生两个NADH,和NH3固定需要一个NADH,生产Ser正好产生一个过量的NADH,这是等摩尔联产一个MEG(或乙醇酸)所需要的。
在一些实施方案中,生产MEG和L-丝氨酸非常接近于热力学最大产率潜力,即使用一种或多种戊糖和/或己糖无损转化为戊糖-5-磷酸中间体,随后将D-核糖-5-磷酸中间体转化为乙醇醛和D-甘油醛-3-磷酸(G3P)中间体,然后通过乙醇醛的还原联产MEG,并通过一种或多种C3途径由G3P中间体联产L-丝氨酸。在一些实施方案中,与通过天然、标准的C3途径由葡萄糖制造L-丝氨酸的生产相比,通过本申请中公开的途径联产MEG和L-丝氨酸的热力学产率潜力高14%。
联产:(戊糖或己糖)+NH3→MEG+Ser+0ATP*
Y(途径)=(0.371+0.629)g/g=1.00g(MEG+Ser)/g((戊糖或己糖)+NH3),96%的Y(最大)(燃烧热)=1.044g/g
标准途径:葡萄糖+2NH3→2Ser+2NADH+0ATP
Y(途径)=0.981g(Ser)/g((戊糖或己糖)+2NH3),84%的Y(最大)(燃烧热)=1.164g/g
*假设被动或H+同向转运D-木糖(戊糖)。不考虑H+同向转运蛋白的间接ATP消耗或维持细胞所需的ATP。
在一些实施方案中,联产MEG和L-丝氨酸如下:将一种或多种戊糖和/或己糖无损转化为戊糖磷酸中间体,然后将戊糖磷酸中间体转化为乙醇醛和D-甘油醛-3-磷酸(G3P)中间体,然后通过C2途径,将乙醇醛中间体转化为MEG,以及通过一种或多种C3途径,将G3P中间体转化为丝氨酸。
[Q]在一个实施方案中,本申请涉及一种能够由一种或多种戊糖和/或己糖和一种氮源联产单乙二醇(MEG)和L-丝氨酸的重组微生物,其中来自实施方案[A]、来自实施方案[B]或来自实施方案[C](并且任选地包括实施方案[D])、并另外具有在C2途径中生产MEG的实施方案[E]的重组微生物进一步表达以下(a)至(h)中的一种或多种:
(a)至少一种内源性或外源性核酸分子,其编码具有3-磷酸甘油酸脱氢酶活性的酶,该酶催化3-磷酸甘油酸转化为3-磷酸羟基丙酮酸;
(b)至少一种内源性或外源性核酸分子,其编码具有3-磷酸甘油酸磷酸酶活性的酶和/或具有甘油酸3-激酶活性的酶,该酶催化3-磷酸甘油酸转化为甘油酸;
(c)至少一种内源性或外源性核酸分子,其编码具有2-磷酸甘油酸磷酸酶活性的酶和/或具有甘油酸2-激酶活性的酶,该酶催化2-磷酸甘油酸转化为甘油酸;
(d)至少一种内源性或外源性核酸分子,其编码具有磷酸丝氨酸转氨酶活性的酶,该酶催化来自(a)的3-磷酸羟基丙酮酸转化为磷酸-L-丝氨酸;
(e)至少一种内源性或外源性核酸分子,其编码具有3-磷酸羟基丙酮酸磷酸酶活性的酶,该酶催化来自(a)的3-磷酸羟基丙酮酸转化为羟基丙酮酸;
(f)至少一种内源性或外源性核酸分子,其编码具有磷酸丝氨酸磷酸酶活性的酶,该酶催化来自(d)的磷酸-L-丝氨酸转化为L-丝氨酸;
(g)至少一种内源性或外源性核酸分子,其编码具有羟基丙酮酸还原酶活性的酶,该酶催化来自(b)和/或(c)的甘油酸转化为羟基丙酮酸;
(h)至少一种内源性或外源性核酸分子,其编码具有丝氨酸-丙酮酸转氨酶活性的酶,该酶催化来自(e)和/或(g)的羟基丙酮酸转化为L-丝氨酸;
其中来自实施方案[A]、来自实施方案[B]或来自实施方案[C]的产生的中间体G3P通过微生物中的内源性糖酵解转化为3-磷酸甘油酸和/或2-磷酸甘油酸,并且其中生产MEG和L-丝氨酸。
甘氨酸(Gly)的生产
Gly通过天然途径生产,例如由Ser或其变体。
在一个实施方案中,Gly通过基于Ser的途径生产。在该基于Ser的途径中,由THF产生5,10-亚甲基四氢叶酸(M-THF),L-丝氨酸通过丝氨酸羟甲基转移酶转化为甘氨酸。M-THF用于各种细胞化合物的生物合成,例如在甲基化反应中。
在一个优选的实施方案中,M-THF也可以用于生产多两个NADH或一个NADH和一个H2
Figure BDA0003310804120001251
(EC 2.1.2.-;转移酶,如羟甲基-、甲酰基-和相关的转移一个碳基团的转移酶),随后将甲醛氧化(EC 1.2.1.46;甲醛脱氢酶)为甲酸和NADH,并进一步将甲酸氧化为CO2和NADH(甲酸脱氢酶,FDH)或CO2和H2(甲酸氢解酶复合物)。
在一些实施方案中,如果部分进行这种THF的重构,则可以用于生成刚好足够的NADH以进行另一条不同的甘氨酸生物合成途径。在一个实施方案中,通过甘氨酸裂解系统的途径(其利用M-THF、NH3、CO2和NADH直接合成甘氨酸),可以与基于丝氨酸的甘氨酸生产一起使用,以利用产生的过量M-THF生产更多的甘氨酸。
甘氨酸裂解系统(GCV)是多酶复合物,其催化甘氨酸的可逆氧化,产生二氧化碳、氨、5,10-亚甲基四氢叶酸(M-THF)和还原的吡啶核苷酸:
Figure BDA0003310804120001261
四氢叶酸用作甘氨酸裂解形成亚甲基基团期间产生的一碳单元的受体。GCV系统由P蛋白、H蛋白、T蛋白和L蛋白四种蛋白质组分组成。P蛋白(EC 1.4.4.2,甘氨酸脱氢酶(脱羧))催化从甘氨酸中磷酸吡哆醛依赖性释放CO2,留下甲胺部分。甲胺部分转移至H蛋白的硫辛酸基团,H蛋白在甘氨酸脱羧之前与P蛋白结合。T蛋白(EC 2.1.2.10,氨甲基转移酶)催化从甲胺基团中释放NH3,并将剩余的C1单元转移至THF形成5,10-mTHF。然后L蛋白(EC1.8.1.4,二氢硫辛酰脱氢酶)氧化H蛋白的硫辛酸成分,并将电子转移至NAD+形成NADH。
有时当同一组酶以相反方向运行以形成甘氨酸时,称为甘氨酸合酶。在厌氧菌尿酸发酵梭菌(Clostridium acidiurici)中,甘氨酸裂解系统主要在甘氨酸合成方向运行。
可选地,在另一个实施方案中,也可以通过丙氨酸-乙醛酸转氨酶(EC 2.6.1.44)的乙醛酸转氨作用生产甘氨酸。尽管在生物体(如酿酒酵母)中,该途径仅在以不可发酵碳源(如乙醇或醋酸)生长期间表达,但该途径很容易在任何微生物中过表达。氨基基团供体丙氨酸通过与谷氨酸的转氨作用(丙氨酸转氨酶,EC 2.6.1.2)重构,而谷氨酸又通过NADH或NADPH依赖性谷氨酸脱氢酶(EC 1.4.1.2或EC1.4.1.3)固定氨而重构。在一个实施方案中,该甘氨酸途径避免了中间体L-丝氨酸,并且不会导致产生M-THF,而是直接产生两个还原当量(如NADH)。
在一些实施方案中,生产MEG和甘氨酸非常接近于热力学最大产率潜力,即使用一种或多种戊糖和/或己糖无损转化为D-核糖-5-磷酸中间体,随后将D-核糖-5-磷酸中间体转化为乙醇醛和D-甘油醛-3-磷酸(G3P)中间体,然后通过乙醇醛的还原联产MEG,并通过一种或多种C3途径由G3P中间体联产甘氨酸。在一些实施方案中,与通过天然、标准的C3途径由葡萄糖制造甘氨酸的生产相比,通过本申请中公开的途径联产MEG(或乙醇酸)和甘氨酸的热力学产率潜力高37%。
联产,丝氨酸途径:(戊糖或己糖)+NH3+THF->MEG+Gly+M-THF+0ATP*
联产,丝氨酸途径,假设通过甲酸使用FDH重构THF:
(戊糖或己糖)+NH3->MEG+Gly+2NADH+0ATP*
联产,乙醛酸途径:(戊糖或己糖)+NH3->MEG+Gly+2NAD(P)H+0ATP*
Y(途径)=(0.371+0.449)g/g=0.820g(MEG+Gly)/g((戊糖或己糖)+NH3),81%的Y(最大)(燃烧热)=1.013g/g
联产,丝氨酸途径,假设通过甲酸和FDH部分重构THF,加上通过甘氨酸裂解系统合成甘氨酸:
通过NADH生产部分重构THF:M-THF->2/3M-THF+1/3THF+2/3NADH为甘氨酸裂解系统利用剩余的M-THF和生成的NADH:
2/3M-THF+2/3NADH+2/3NH3+2/3CO2->2/3Gly
(戊糖或己糖)+5/3NH3+2/3CO2->MEG+5/3Gly+0ATP*
y(途径)=(0.348+0.698)g/g=1.046g/g,97%的y(最大)=1.076g/g
标准途径:葡萄糖+2NH3+2THF->2Gly+2M-THF+2NADH+0ATP
Y(途径)=0.701g(Gly)/g(葡萄糖+2NH3),59%的Y(最大)(燃烧热)=1.197g/g
*假设被动或H+同向转运D-木糖(戊糖)。不考虑H+同向转运蛋白的间接ATP消耗或维持细胞所需的ATP。
在一些实施方案中,联产MEG和甘氨酸如下:将一种或多种戊糖和/或己糖无损转化为D-核糖-5-磷酸中间体,然后将D-核糖-5-磷酸中间体转化为乙醇醛和D-甘油醛-3-磷酸(G3P)中间体,然后通过C2途径,将乙醇醛中间体转化为MEG,以及通过一种或多种C3途径,将G3P中间体转化为甘氨酸。
[R]在一个实施方案中,本申请涉及一种能够由一种或多种戊糖和/或己糖和一种氮源联产单乙二醇(MEG)和甘氨酸的重组微生物,其中来自实施方案[A]、来自实施方案[B]或来自实施方案[C](并且任选地包括实施方案[D])、并另外具有在C2途径中生产MEG的实施方案[E]的重组微生物进一步表达以下(a)至(e)中的一种或多种:
(a)至少一种内源性或外源性核酸分子,其编码具有丝氨酸羟甲基转移酶活性的酶,该酶催化L-丝氨酸和四氢叶酸(THF)转化为甘氨酸和5,10-亚甲基四氢叶酸(M-THF);
(b)至少一种内源性或外源性核酸分子,其编码具有转移酶活性的酶,该酶催化来自(a)的M-THF转化为甲醛;
(c)至少一种内源性或外源性核酸分子,其编码具有甲醛脱氢酶活性的酶,该酶催化来自(b)的甲醛转化为甲酸和NADH;
(d)至少一种内源性或外源性核酸分子,其编码具有甲酸脱氢酶活性的酶,该酶催化来自(c)的甲酸转化为CO2和NADH;
(e)至少一种内源性或外源性核酸分子,其编码甘氨酸裂解系统的蛋白质,该蛋白质催化来自(a)的M-THF、CO2、NH3和来自(c)或(d)的NADH转化为甘氨酸和THF;
其中THF由步骤(b)至(e)重构,其中任选地来自(c)的甲酸被甲酸氢解酶复合物进一步氧化为CO2和H2,并且其中生产MEG和甘氨酸。
[S]在一个实施方案中,本申请涉及一种能够由一种或多种戊糖和/或己糖和一种氮源联产单乙二醇(MEG)和甘氨酸的重组微生物,其中来自实施方案[A]、来自实施方案[B]或来自实施方案[C](并且任选地包括实施方案[D])、并另外具有在C2途径中生产MEG的实施方案[E]的重组微生物进一步表达以下(a)至(k)中的一种或多种:
(a)至少一种内源性或外源性核酸分子,其编码具有3-磷酸甘油酸脱氢酶活性的酶,该酶催化3-磷酸甘油酸转化为3-磷酸羟基丙酮酸;
(b)至少一种内源性或外源性核酸分子,其编码具有磷酸丝氨酸转氨酶活性的酶,该酶催化来自(a)的3-磷酸羟基丙酮酸转化为磷酸-L-丝氨酸;
(c)至少一种内源性或外源性核酸分子,其编码具有3-磷酸羟基丙酮酸磷酸酶活性的酶,该酶催化来自(a)的3-磷酸羟基丙酮酸转化为羟基丙酮酸;
(d)至少一种内源性或外源性核酸分子,其编码具有磷酸丝氨酸磷酸酶活性的酶,该酶催化来自(b)的磷酸-L-丝氨酸转化为L-丝氨酸;
(e)至少一种内源性或外源性核酸分子,其编码具有L-丝氨酸转氨酶或丝氨酸氧化酶活性的酶,该酶催化来自(d)的L-丝氨酸转化为羟基丙酮酸;
(f)至少一种内源性或外源性核酸分子,其编码具有羟基丙酮酸脱羧酶活性的酶,该酶催化来自(c)或(e)的羟基丙酮酸转化为乙醇醛;
(g)至少一种内源性或外源性核酸分子,其编码具有乙醇醛脱氢酶活性的酶,该酶催化来自(f)的乙醇醛转化为乙醇酸;
(h)至少一种内源性或外源性核酸分子,其编码具有乙醇酸脱氢酶活性的酶,该酶催化来自(g)的乙醇酸转化为乙醛酸;
(i)至少一种内源性或外源性核酸分子,其编码具有丙氨酸-乙醛酸转氨酶活性的酶,该酶催化来自(h)的乙醛酸和丙氨酸转化为甘氨酸和丙酮酸;
(j)至少一种内源性或外源性核酸分子,其编码具有丙氨酸转氨酶活性的酶,该酶催化来自(i)的丙酮酸和谷氨酸转化为丙氨酸和2-氧代戊二酸;
(k)至少一种内源性或外源性核酸分子,其编码具有NAD(P)H依赖性谷氨酸脱氢酶活性的酶,该酶催化来自(j)的2-氧代戊二酸和氨转化为谷氨酸;
其中来自实施方案[A]或来自实施方案[B]的产生的中间体G3P通过微生物中的内源性糖酵解转化为3-磷酸甘油酸和/或2-磷酸甘油酸,其中用于步骤(i)的乙醛酸任选地来自该微生物中的乙醛酸旁路,其中丙氨酸和谷氨酸由步骤(j)和(k)重构,并且其中联产MEG和甘氨酸。
[T]在一个实施方案中,本申请涉及一种能够由一种或多种戊糖和/或己糖和一种氮源联产单乙二醇(MEG)和甘氨酸的重组微生物,其中来自实施方案[A]、来自实施方案[B]或来自实施方案[C](并且任选地包括实施方案[D])、并另外具有在C2途径中生产MEG的实施方案[E]的重组微生物进一步表达以下(a)至(l)中的一种或多种:
(a)至少一种内源性或外源性核酸分子,其编码具有2-磷酸甘油酸磷酸酶活性的酶和/或具有甘油酸-2-激酶活性的酶,该酶催化2-磷酸甘油酸转化为甘油酸;
(b)至少一种内源性或外源性核酸分子,其编码具有3-磷酸甘油酸磷酸酶活性的酶和/或具有甘油酸-3-激酶活性的酶,该酶催化3-磷酸甘油酸转化为甘油酸;
(c)至少一种内源性或外源性核酸分子,其编码具有羟基丙酮酸还原酶活性的酶,该酶催化来自(a)和/或(b)的甘油酸转化为羟基丙酮酸;
(d)至少一种内源性或外源性核酸分子,其编码具有丝氨酸转氨酶或丝氨酸氧化还原酶(脱氨基)活性的酶,该酶催化L-丝氨酸转化为羟基丙酮酸;
(e)至少一种内源性或外源性核酸分子,其编码具有L-丝氨酸脱羧酶活性的酶,该酶催化L-丝氨酸转化为乙醇胺;
(f)至少一种内源性或外源性核酸分子,其编码具有羟基丙酮酸脱羧酶活性的酶,该酶催化来自(c)和/或(d)的羟基丙酮酸转化为乙醇醛;
(g)至少一种内源性或外源性核酸分子,其编码具有乙醇胺转氨酶活性的酶或具有乙醇胺氧化还原酶(脱氨基)活性的酶,该酶催化来自(e)的乙醇胺转化为乙醇醛;
(h)至少一种内源性或外源性核酸分子,其编码具有乙醇醛脱氢酶活性的酶,该酶催化来自(f)和/或(g)的乙醇醛转化为乙醇酸;
(i)至少一种内源性或外源性核酸分子,其编码具有乙醇酸脱氢酶活性的酶,该酶催化来自(g)的乙醇酸转化为乙醛酸;
(j)至少一种内源性或外源性核酸分子,其编码具有丙氨酸-乙醛酸转氨酶活性的酶,该酶催化来自(i)的乙醛酸和丙氨酸转化为甘氨酸和丙酮酸;
(k)至少一种内源性或外源性核酸分子,其编码具有丙氨酸转氨酶活性的酶,该酶催化来自(j)的丙酮酸和谷氨酸转化为丙氨酸和2-氧代戊二酸;
(l)至少一种内源性或外源性核酸分子,其编码具有NAD(P)H依赖性谷氨酸脱氢酶活性的酶,该酶催化来自(k)的2-氧代戊二酸和氨转化为谷氨酸;
其中来自实施方案[A]、来自实施方案[B]或来自实施方案[C]的产生的中间体G3P通过微生物中的内源性糖酵解转化为3-磷酸甘油酸和/或2-磷酸甘油酸,其中用于步骤(j)的乙醛酸任选地来自该微生物中的乙醛酸旁路,其中丙氨酸和谷氨酸由步骤(k)和(l)重构,并且其中联产MEG和甘氨酸。
在一些实施方案中,具有丝氨酸羟甲基转移酶活性的酶将L-丝氨酸转化为甘氨酸。在一些实施方案中,将L-丝氨酸转化为甘氨酸的酶由与大肠杆菌glyA具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一些实施方案中,编码具有丝氨酸羟甲基转移酶活性的酶的一种或多种核酸分子包含UniProt ID P0A825中列出的氨基酸序列。在一个进一步的实施方案中,编码具有丝氨酸羟甲基转移酶活性的酶的一种或多种核酸分子由Gene ID 947022中列出的核酸序列编码。
在一些实施方案中,具有转移一碳基团的转移酶活性的酶用于将M-THF转化为甲醛。可以使用转移酶如羟甲基-、甲酰基-和相关转移酶。羟甲基-、甲酰基-和相关转移酶的示例包括甘氨酸羟甲基转移酶、磷酸核糖基甘氨酰胺甲酰基转移酶、磷酸核糖氨基咪唑甲酰胺甲酰基转移酶、甘氨酸亚氨代甲基转移酶、谷氨酸亚氨甲基转移酶、D-丙氨酸2-羟甲基转移酶、脱氧胞苷酸5-羟甲基转移酶、甲硫氨酰基-tRNA甲酰基转移酶、氨甲基转移酶、3-甲基-2-氧代丁酸羟甲基转移酶和UDP-4-氨基-4-脱氧-L-阿拉伯糖甲酰基转移酶。
在一些实施方案中,具有甲醛脱氢酶活性的酶用于将甲醛转化为甲酸和NADH。在一些实施方案中,具有甲醛脱氢酶活性的酶由与选自以下的甲醛脱氢酶具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码:酿酒酵母ALD2、酿酒酵母ALD3、人ALDH3A2和人ALDH9A1。在一些实施方案中,编码具有甲醛脱氢酶活性的酶的一种或多种核酸分子包含选自以下的氨基酸序列:UniProt ID P47771、UniProt ID P54114、UniProt ID P51648和UniProt ID P49189。在一个进一步的实施方案中,编码具有甲醛脱氢酶活性的酶的一种或多种核酸分子由选自Gene ID 855206、Gene ID855205、Gene ID 224和Gene ID 223的核酸序列编码。
在一些实施方案中,具有甲酸脱氢酶活性的酶用于将甲酸转化为CO2和NADH。在一些实施方案中,具有甲酸脱氢酶活性的酶由与选自以下的具有甲酸脱氢酶活性的酶具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码:大肠杆菌fdhF(chlF,FDH-H)、大肠杆菌FDH-N、大肠杆菌FDH-O、Candida boidiniiFDH1、谷氨酸棒杆菌(Corynebacterium glutamicum)fdhF、Cupriavidus oxalaticus的NAD+依赖性甲酸脱氢酶、Gottschalkia acidurici的NAD+依赖性甲酸脱氢酶、扭脱甲基杆菌(Methylobacterium extorquens)Fdh1、Methylosinus trichosporium的甲酸脱氢酶和莫拉氏菌属物种(Moraxella sp.)的NAD+依赖性甲酸脱氢酶fdh。在一些实施方案中,编码与甲酸脱氢酶活性相关的酶或酶的亚基的一种或多种核酸分子包含选自以下的氨基酸序列:UniProt ID P07658、UniProt ID P0AEK7、UniProt ID P0AAJ3、UniProt ID P24183、UniProt ID P32176、UniProt ID P0AAJ5、UniProt ID P0AEL0、UniProt ID O13437、UniProt ID Q8NSY6、UniProt ID Q8KTI7、UniProt ID Q8KTI8和UniProt ID O08375。在一个进一步的实施方案中,编码与甲酸脱氢酶活性相关的酶或酶的亚基的一种或多种核酸分子包含选自以下的核酸序列:Gene ID 948584、Gene ID 946038、Gene ID 948794、Gene ID946035、Gene ID 948394、Gene ID 948395、Gene ID 948383、GenBank登录号AJ011046.2、Gene ID 1021531、GenBank登录号AF489516和GenBank登录号Y13245.1。
在一些实施方案中,甘氨酸裂解系统的一种或多种蛋白质用于由M-THF、CO2、NH3和NADH生产甘氨酸。在一些实施方案中,甘氨酸裂解系统的蛋白质包含:i)P-蛋白(含有磷酸吡哆醛的蛋白)或甘氨酸脱羧酶(EC 1.4.4.2),ii)T-蛋白或氨甲基转移酶(EC 2.1.2.10),iii)L-蛋白或二氢硫辛酰胺脱氢酶(EC1.8.1.4)和iv)称为H-蛋白的载体蛋白(含有硫辛酸的蛋白)。在一些实施方案中,具有甘氨酸脱羧酶活性的酶由与大肠杆菌gcvP具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一些实施方案中,编码具有甘氨酸脱羧酶活性的酶的一种或多种核酸分子包含UniProt IDP33195中列出的氨基酸序列。在一个进一步的实施方案中,编码具有甘氨酸脱羧酶活性的酶的一种或多种核酸分子包含Gene ID 947394中列出的核酸序列。在一些实施方案中,具有氨甲基转移酶活性的酶由与大肠杆菌gcvT具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一些实施方案中,编码具有氨甲基转移酶活性的酶的一种或多种核酸分子包含UniProt ID P27248中列出的氨基酸序列。在一个进一步的实施方案中,编码具有氨甲基转移酶活性的酶的一种或多种核酸分子包含Gene ID 947390中列出的核酸序列。在一些实施方案中,具有二氢硫辛酰胺脱氢酶活性的酶由与大肠杆菌lpd(lpdA,E3亚基)具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一些实施方案中,编码具有二氢硫辛酰胺脱氢酶活性的酶的一种或多种核酸分子包含UniProt ID P0A9P0中列出的氨基酸序列。在一个进一步的实施方案中,编码具有二氢硫辛酰胺脱氢酶活性的酶的一种或多种核酸分子包含Gene ID 944854中列出的核酸序列。在一些实施方案中,H-蛋白由与大肠杆菌gcvH具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一些实施方案中,编码H-蛋白的一种或多种核酸分子包含UniProt ID P0A6T9中列出的氨基酸序列。在一个进一步的实施方案中,编码H-蛋白的一种或多种核酸分子由Gene ID 947393中列出的核酸序列编码。
在一些实施方案中,具有乙醇酸脱氢酶活性的酶用于将乙醇酸转化为乙醛酸。在一些实施方案中,具有乙醇酸脱氢酶活性的酶由与选自以下的具有乙醇酸脱氢酶活性的酶具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码:大肠杆菌乙醇酸脱氢酶GLC和拟南芥乙醇酸脱氢酶。在一些实施方案中,编码与乙醇酸脱氢酶活性相关的酶或酶亚基的一种或多种核酸分子包含选自以下的氨基酸序列:UniProt ID P0AEP9、UniProt ID P52073、UniProt ID P52074和UniProt ID Q94AX4。在一个进一步的实施方案中,编码与乙醇酸脱氢酶活性相关的酶或酶亚基的一种或多种核酸分子包含选自以下的核酸序列:Gene ID 947353、Gene ID 2847718、Gene ID 2847717和GenBank登录号Y13245.1。
在一些实施方案中,具有丙氨酸-乙醛酸脱氢酶活性的酶用于将乙醛酸转化为甘氨酸。在一些实施方案中,具有丙氨酸-乙醛酸转氨酶活性的酶由与选自以下的具有丙氨酸-乙醛酸转氨酶活性的酶具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码:酿酒酵母AGX1、人AGXT2、拟南芥AOAT1和拟南芥AOAT2。在一些实施方案中,编码具有丙氨酸-乙醛酸转氨酶活性的酶的一种或多种核酸分子包含选自以下的氨基酸序列:UniProt ID P43567、UniProt ID Q9BYV1、UniProt IDQ9LR30和UniProt ID Q9S7E9。在一个进一步的实施方案中,编码具有丙氨酸-乙醛酸转氨酶活性的酶的一种或多种核酸分子包含选自以下的核酸序列:Gene ID 850514、Gene ID64902、TAIR登录号AT1G23310和TAIR登录号AT1G70580。
在一些实施方案中,具有丙氨酸转氨酶活性的酶用于由丙酮酸和谷氨酸重构丙氨酸。在一些实施方案中,具有丙氨酸转氨酶活性的酶由与选自以下的具有丙氨酸转氨酶活性的酶具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码:大肠杆菌谷氨酸-丙酮酸转氨酶alaA、大肠杆菌谷氨酸-丙酮酸转氨酶alaB、大肠杆菌谷氨酸-丙酮酸转氨酶alaC、人丙氨酸转氨酶1(GPT)、人丙氨酸转氨酶2(GPT2)、Arenicola marina丙氨酸转氨酶、拟南芥色氨酸转氨酶TAA1、拟南芥AOAT1、拟南芥AOAT2、Candida maltosa丙氨酸转氨酶、丙酸梭菌丙氨酸转氨酶、Pyrococcus furiosus丙氨酸转氨酶aat、Megathyrsus maximus丙氨酸转氨酶和黍丙氨酸转氨酶AlaAT-2。在一些实施方案中,编码具有丙氨酸转氨酶活性的酶的一种或多种核酸分子包含选自以下的氨基酸序列:UniProt ID P0A959、UniProt ID P77434、UniProt ID P24298、UniProt ID Q8TD30、UniProt ID Q9S7N2、UniProt ID Q9LR30、UniProt ID Q9S7E9、UniProt ID Q9P9M8和UniProt ID P34106。在一个进一步的实施方案中,编码具有丙氨酸转氨酶活性的酶的一种或多种核酸分子包含选自以下的核酸序列:Gene ID 946772、Gene ID 946850、Gene ID2875、Gene ID 84706、Gene ID 843393、TAIR登录号AT1G23310、TAIR登录号AT1G70580、GenBank登录号AF163769.1和GenBank登录号X69421.1。
在一些实施方案中,具有谷氨酸脱氢酶活性的酶用于由氨和2-氧代戊二酸重构谷氨酸。在一些实施方案中,具有谷氨酸脱氢酶活性的酶由与选自以下的具有谷氨酸脱氢酶活性的酶具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码:酿酒酵母NAD依赖性谷氨酸脱氢酶GDH2、拟南芥NAD依赖性谷氨酸脱氢酶GDH2、拟南芥NAD依赖性谷氨酸脱氢酶GDH1、不解糖嗜胨菌NAD依赖性谷氨酸脱氢酶gdhA、Halobacterium salinarum NAD依赖性谷氨酸脱氢酶gdhA、海栖热袍菌谷氨酸脱氢酶、人谷氨酸脱氢酶1(GLUD1)、人谷氨酸脱氢酶2(GLUD2)、枯草芽孢杆菌谷氨酸脱氢酶和番茄谷氨酸脱氢酶GDH1。在一些实施方案中,编码具有谷氨酸脱氢酶活性的酶的一种或多种核酸分子包含选自以下的氨基酸序列:UniProt ID P33327、UniProt ID Q38946、UniProt IDQ38946、UniProt ID P28997、UniProt ID P29051、UniProt ID P00367、UniProt IDP49448和UniProt ID P93541。在一个进一步的实施方案中,编码具有谷氨酸脱氢酶活性的酶的一种或多种核酸分子由选自以下的核酸序列编码:Gene ID 461927、TAIR登录号AT5G07440、TAIR登录号AT5G18170、GenBank登录号M76403.1、GenBank登录号X63837.1、Gene ID 2746、Gene ID 2747和GenBank登录号U48695.1。
单乙醇胺(MEA)的生产
可以通过Ser的脱羧或乙醇醛的氨基转移来生产MEA。
在一些优选的实施方案中,利用丝氨酸脱羧酶,因为该酶是天然存在的(即在植物的胆碱生物合成途径中),并且乙醇醛中间体的转氨基使得MEG和MEA途径之间产生交流(cross talk)。
可选地,在另一个实施方案中,可以由乙醛和氨通过乙醇胺解氨酶(EC 4.3.1.7)形成MEA:
Figure BDA0003310804120001331
在这种情况下,MEA不通过Ser生物合成途径形成,而是由乙酰辅酶A及其通过乙醛脱氢酶还原为乙醛形成。虽然氧化还原情况没有改变,但与基于Ser的途径相比,该途径产生+1ATP。该途径也避免了有毒的中间体Ser,但具有有毒且易挥发的中间体乙醛。
在一些实施方案中,生产MEG和MEA非常接近于热力学最大产率潜力,即使用一种或多种戊糖和/或己糖无损转化为D-核糖-5-磷酸中间体,随后将D-核糖-5-磷酸中间体转化为乙醇醛和D-甘油醛-3-磷酸(G3P)中间体,然后通过乙醇醛的还原联产MEG,并通过一种或多种C3途径由G3P中间体联产MEA。在一些实施方案中,与通过天然的或公开的类似途径由葡萄糖制造MEA的生产相比,通过本申请中公开的途径联产MEG和MEA的热力学产率潜力高15%。
联产,Ser途径:(戊糖或己糖)+NH3->MEG+MEA+0ATP*
联产,乙醛途径:(戊糖或己糖)+NH3->MEG+MEA +1ATP*
Y(途径)=(0.371+0.365)g/g=0.736g(MEG+MEA)/g((戊糖或己糖)+NH3),98%的Y(最大)(燃烧热)=0.749g/g
标准途径:葡萄糖+2NH3->2MEA+2NADH+0ATP
Y(途径)=0.570g(MEA)/g(葡萄糖+2NH3),85%的Y(最大)(燃烧热)=0.669g/g
*假设被动或H+同向转运D-木糖(戊糖)。不考虑H+同向转运蛋白的间接ATP消耗或维持细胞所需的ATP。
在一些实施方案中,联产MEG和MEA如下:将一种或多种戊糖和/或己糖无损转化为D-核糖-5-磷酸中间体,然后将D-核糖-5-磷酸中间体转化为乙醇醛和D-甘油醛-3-磷酸(G3P)中间体,然后通过C2途径,将乙醇醛中间体转化为MEG,以及通过一种或多种C3途径,将G3P中间体转化为MEA。
[U]在一个实施方案中,本申请涉及一种能够由一种或多种戊糖和/或己糖和一种氮源联产单乙二醇(MEG)和MEA的重组微生物,其中来自实施方案[A]、来自实施方案[B]或来自实施方案[C](并且任选地包括实施方案[D])、并另外具有在C2途径中生产MEG的实施方案[E]的重组微生物进一步表达以下(a)至(i)中的一种或多种:
(a)至少一种内源性或外源性核酸分子,其编码具有3-磷酸甘油酸脱氢酶活性的酶,该酶催化3-磷酸甘油酸转化为3-磷酸羟基丙酮酸;
(b)至少一种内源性或外源性核酸分子,其编码具有3-磷酸甘油酸磷酸酶活性的酶和/或具有甘油酸3-激酶活性的酶,该酶催化3-磷酸甘油酸转化为甘油酸;
(c)至少一种内源性或外源性核酸分子,其编码具有2-磷酸甘油酸磷酸酶活性的酶和/或具有甘油酸2-激酶活性的酶,该酶催化2-磷酸甘油酸转化为甘油酸;
(d)至少一种内源性或外源性核酸分子,其编码具有磷酸丝氨酸转氨酶活性的酶,该酶催化来自(a)的3-磷酸羟基丙酮酸转化为磷酸-L-丝氨酸;
(e)至少一种内源性或外源性核酸分子,其编码具有3-磷酸羟基丙酮酸磷酸酶活性的酶,该酶催化来自(a)的3-磷酸羟基丙酮酸转化为羟基丙酮酸;
(f)至少一种内源性或外源性核酸分子,其编码具有磷酸丝氨酸磷酸酶活性的酶,该酶催化来自(d)的磷酸-L-丝氨酸转化为L-丝氨酸;
(g)至少一种内源性或外源性核酸分子,其编码具有羟基丙酮酸还原酶活性的酶,该酶催化来自(b)和/或(c)的甘油酸转化为羟基丙酮酸;
(h)至少一种内源性或外源性核酸分子,其编码具有丝氨酸-丙酮酸转氨酶活性的酶,该酶催化来自(e)和/或(g)的羟基丙酮酸转化为L-丝氨酸;
(i)至少一种内源性或外源性核酸分子,其编码具有丝氨酸脱羧酶活性的酶,该酶催化来自(f)和/或(h)的L-丝氨酸转化为MEA;
其中来自实施方案[A]、来自实施方案[B]或来自实施方案[C]的产生的中间体G3P通过微生物中的内源性糖酵解转化为3-磷酸甘油酸和/或2-磷酸甘油酸,并且其中联产MEG和MEA。
[V]在一个实施方案中,本申请涉及一种能够由一种或多种戊糖和/或己糖和一种氮源联产单乙二醇(MEG)和MEA的重组微生物,其中来自实施方案[A]、来自实施方案[B]或来自实施方案[C](并且任选地包括实施方案[D])、并另外具有在C2途径中生产MEG的实施方案[E]的重组微生物进一步表达以下(a)至(f)中的一种或多种:
(a)至少一种内源性或外源性核酸分子,其编码具有2-磷酸甘油酸磷酸酶活性的酶和/或具有甘油酸-2-激酶活性的酶,该酶催化2-磷酸甘油酸转化为甘油酸;
(b)至少一种内源性或外源性核酸分子,其编码具有3-磷酸甘油酸磷酸酶活性的酶和/或具有甘油酸-3-激酶活性的酶,该酶催化3-磷酸甘油酸转化为甘油酸;
(c)至少一种内源性或外源性核酸分子,其编码具有羟基丙酮酸还原酶活性的酶,该酶催化来自(a)和/或(b)的甘油酸转化为羟基丙酮酸;
(d)至少一种内源性或外源性核酸分子,其编码具有丝氨酸-丙酮酸转氨酶或丝氨酸氧化还原酶(脱氨基)活性的酶,该酶催化L-丝氨酸转化为羟基丙酮酸;
(e)至少一种内源性或外源性核酸分子,其编码具有羟基丙酮酸脱羧酶活性的酶,该酶催化来自(c)和/或(d)的羟基丙酮酸转化为乙醇醛;
(f)至少一种内源性或外源性核酸分子,其编码具有转氨酶活性的酶,该酶催化来自(e)的乙醇醛转化为MEA;
其中来自实施方案[A]或来自实施方案[B]的产生的中间体G3P通过微生物中的内源性糖酵解转化为3-磷酸甘油酸和/或2-磷酸甘油酸,并且其中联产MEG和MEA。
[W]在一个实施方案中,本申请涉及一种能够由一种或多种戊糖和/或己糖和一种氮源联产单乙二醇(MEG)和MEA的重组微生物,其中来自实施方案[A]、来自实施方案[B]或来自实施方案[C](并且任选地包括实施方案[D])、并另外具有在C2途径中生产MEG的实施方案[E]的重组微生物进一步表达以下(a)至(b)中的一种或多种:
(a)至少一种内源性或外源性核酸分子,其编码具有乙醛脱氢酶活性的酶,该酶催化乙酰辅酶A转化为乙醛;
(b)至少一种内源性或外源性核酸分子,其编码具有乙醇胺解氨酶活性的酶,该酶催化乙醛和氨转化为MEA;
其中来自实施方案[A]、来自实施方案[B]或来自实施方案[C]的产生的中间体G3P通过微生物中的内源性糖酵解转化为乙酰辅酶A,并且其中联产MEG和MEA。
在一些实施方案中,具有乙醛脱氢酶活性的酶用于将乙酰辅酶A还原为乙醛。在一些实施方案中,具有乙醛脱氢酶活性的酶由与选自以下的具有乙醛脱氢酶活性的酶具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码:大肠杆菌mhpF、大肠杆菌AdhE、莱因衣藻ADH1、肠系膜明串珠菌辅酶A依赖性乙醛脱氢酶、Pelobacter acetylenicus乙醛脱氢酶、假单胞菌属物种dmpF、恶臭假单胞菌酰化乙醛脱氢酶todl、恶臭假单胞菌乙醛脱氢酶cmtH和丙酮丁醇梭菌醇/醛脱氢酶AdhE。在一些实施方案中,编码具有乙醛脱氢酶活性的酶的一种或多种核酸分子包含选自以下的氨基酸序列:UniProt ID P77580、UniProt P0A9Q7、UniProt ID A8JI07、UniProt ID Q52060、UniProt ID Q51949和UniProt ID P33744。在一个进一步的实施方案中,编码具有乙醛脱氢酶活性的酶的一种或多种核酸分子包含选自以下的核酸序列:Gene ID 945008、Gene ID945837、Gene ID 5729132、GenBank登录号X60835.1、GenBank登录号U09250.1和Gene ID1116167。
在一些实施方案中,具有乙醇胺解氨酶活性的酶用于将乙醛和氨转化为MEA。在一些实施方案中,具有乙醇胺解氨酶活性的酶由与大肠杆菌乙醇胺解氨酶具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一些实施方案中,编码乙醇胺解氨酶亚基的一种或多种核酸分子包含选自UniProt ID P0AEJ6和UniProt ID P19636的氨基酸序列。在一个进一步的实施方案中,编码乙醇胺解氨酶亚基的一种或多种核酸分子由选自Gene ID 946924和Gene ID 946925的核酸序列编码。
乙二胺(EDA)的生产
可以通过WO 2014/049382中描述的任何途径A至E生产EDA,WO 2014/049382整体并入本文(图7)。
在一些实施方案中,联产MEG和EDA如下:将一种或多种戊糖和/或己糖无损转化为D-核糖-5-磷酸中间体,然后将D-核糖-5-磷酸中间体转化为乙醇醛和D-甘油醛-3-磷酸(G3P)中间体,然后通过C2途径,将乙醇醛中间体转化为MEG,以及通过一种或多种C3途径,将G3P中间体转化为EDA。
[X]在一个实施方案中,本申请涉及一种能够由一种或多种戊糖和/或己糖和一种氮源联产单乙二醇(MEG)和乙二胺(EDA)的重组微生物,其中来自实施方案[A]、来自实施方案[B]或来自实施方案[C](并且任选地包括实施方案[D])、并另外具有在C2途径中生产MEG的实施方案[E]的重组微生物进一步表达以下(a)至(c)中的一种或多种:
(a)至少一种内源性或外源性核酸分子,其编码具有丝氨酸脱氢酶活性的酶,该酶催化L-丝氨酸转化为2-氨基丙二酸半醛;
(b)至少一种内源性或外源性核酸分子,其编码具有2-氨基丙二酸半醛脱羧酶活性的酶,该酶催化来自(a)的2-氨基丙二酸半醛转化为氨基乙醛;
(c)至少一种内源性或外源性核酸分子,其编码具有氨基乙醛转氨酶活性的酶,该酶催化来自(b)的氨基乙醛转化为EDA;
其中2-氨基丙二酸半醛可以任选地通过自发反应转化为氨基乙醛,并且其中联产MEG和EDA。
根据本公开的这一方面,重组微生物过表达至少一种基因,其编码显示出丝氨酸脱氢酶和氨基乙醛转氨酶活性的酶。这些基因可以是内源性基因或外源性基因。
丝氨酸脱氢酶催化L-丝氨酸转化为2-氨基丙二酸半醛的第一反应。该酶属于醇脱氢酶的大型酶家族,醇脱氢酶也称为醛还原酶。已知数种酶表现出丝氨酸脱氢酶活性。在本公开的一个实施方案中,这些酶由选自本领域公知的基因列表中的基因编码(Chowdhury等人,1996,Yao等人,2010,Tchigvintsev等人,2012,Fujisawa等人,2003,Hawes等人,1996和Lokanath等人,2005),包括但不限于此处列出的基因:来自恶臭假单胞菌、来自聚球藻(Synechococcus)PCC6301或来自蜡状芽孢杆菌(Bacillus cereus)的mmsB;来自恶臭假单胞菌E23的hibdh;来自铜绿假单胞菌的PA0743;来自大肠杆菌或来自短芽孢杆菌(Bacillusbrevis)或来自枯草芽孢杆菌的ydfG;来自根癌农杆菌(Agrobacterium tumefaciens)的sdh;来自大鼠(Rattus norvegicus)或来自嗜热栖热菌(Thermus thermophilus)HB8的hibadh;来自大肠杆菌的yiaY。
在本公开的一个优选的实施方案中,丝氨酸脱氢酶由来自大肠杆菌的ydfG、或来自恶臭假单胞菌的mmsB、或来自大肠杆菌的yiaY编码。优选地,通过突变编码基因来优化这些酶,以提高其将L-丝氨酸转化为2-氨基丙二酸半醛的催化效率。
在本公开的另一个实施方案中,通过进化酶获得丝氨酸脱氢酶,该进化是为了改变酶的底物特异性和/或其催化效率,以获得表现出对丝氨酸的特异性和丝氨酸脱氢酶的活性的酶。这些酶选自对化学性质与L-丝氨酸相似的底物具有相同类型催化活性的酶。优选地,这些酶可以选自3-羟基异丁酸脱氢酶和丝氨酸脱氢酶。更优选地,这些酶由选自本领域公知的基因列表中的基因编码,包括但不限于此处的基因:来自大肠杆菌或来自柠檬明串珠菌(Leuconostoc citreum)或来自Symbiobacterium thermophilum的gldA;来自大肠杆菌的yqhE;来自大肠杆菌的yafB;来自杜氏利什曼原虫(Leishmania donovani)的alr;来自聚球藻属物种(Synechococcus sp.)的sakR1;来自枯草芽孢杆菌的yhdN;来自枯草芽孢杆菌的ytbE;来自拟南芥的AKR4C9;来自大肠杆菌的fucO。可以使用与由这些基因编码的任何多肽具有至少90%序列同一性的任何多肽。
通过本领域技术人员熟知的手段和方法进行这些酶的进化,以获得对底物L-丝氨酸具有改进的特异性和/或能够以改进的活性将其转化为2-氨基丙二酸半醛的酶。通过在本公开的微生物中或体外表达进化酶,以L-丝氨酸为底物,并通过检测产物2-氨基丙二酸半醛来选择进化的酶。
2-氨基丙二酸半醛转化为氨基乙醛的第二反应在细胞中自发进行(Fujisawa等人,2003)。在本公开的另一个实施方案中,具有2-氨基丙二酸半醛脱羧酶活性的酶催化2-氨基丙二酸半醛转化为氨基乙醛的第二反应。这种酶不是自然遇到的。因此通过已知酶的进化或通过筛选宏基因组文库获得该酶。用进化的氨基酸脱羧酶或进化的酮酸脱羧酶行使2-氨基丙二酸半醛脱羧酶活性,该酶催化氨基酸或酮酸的脱羧。优选地,选择进化的氨基酸脱羧酶。更优选地,所述进化的氨基酸脱羧酶选自组氨酸脱羧酶、丝氨酸脱羧酶、天冬氨酸脱羧酶、二氨基丁酸脱羧酶和鸟氨酸脱羧酶。这些酶由从本领域众所周知的基因列表中选择的基因编码,包括但不限于此处列出的基因:来自拟南芥的sdc;来自Aquifex aeolicus或来自枯草芽孢杆菌的panD;来自拟南芥的GAD或GAD2或GAD3或GAD4或GAD5;来自牛(BosTaurus)的GAD或GAD2或OAZ1或ODC1;来自大肠杆菌的gadA或gadB或panD或speC或speF;来自天蓝色链霉菌(Streptomyces coelicolor)的SCC105.13;来自Mannheimiasucciniciproducens的gadB;来自沃氏富盐菌(Haloferax volcanii)的bdb;来自乳杆菌属物种(Lactobacillus sp.)的odc1;来自乳酸乳球菌乳酸亚种(Lactococcus lactissubsp.Lactis)的kivD;来自乳酸乳球菌的kdcA;来自牛的OAZ1或ODC1;来自大肠杆菌的speC或speF;来自酿酒酵母的SPE1。可以使用与由这些基因编码的任何多肽具有至少90%序列同一性的任何多肽。优选地,来自拟南芥的sdc基因用于获得2-氨基丙二酸半醛脱羧酶活性。
通过本领域技术人员熟知的手段和方法进行这些酶的进化,以获得对底物2-氨基丙二酸半醛具有特异性并能够将其转化为氨基乙醛的酶。通过在本发明的微生物中或体外表达进化酶,以2-氨基丙二酸半醛作为底物并通过定量产物氨基乙醛来选择进化酶。
氨基乙醛转氨酶催化氨基乙醛转化为乙二胺的最后一个反应。这种酶不是自然遇到的。因此通过已知酶的进化或通过筛选宏基因组文库获得该酶。在本发明的一个实施方案中,用进化的转氨酶(transaminase)或转氨酶(aminotransferase)行使氨基乙醛转氨酶活性,该酶催化一个分子的氨基基团与另一个分子上的氧代基团的交换。优选地,进化的转氨酶选自磷酸丝氨酸转氨酶或天冬氨酸转氨酶或谷氨酸转氨酶。更优选地,进化的转氨酶选自使用谷氨酸作为氨基基团供体的转氨酶。这些酶由从本领域众所周知的基因列表中选择的基因编码,包括但不限于此处列出的基因:来自大肠杆菌或来自枯草芽孢杆菌或来自谷氨酸棒杆菌(Corynebacterium glutamicum)的serC;来自野猪(Sus scrofa)的GOT1;来自大肠杆菌的patA;来自犬布鲁氏菌(Brucella canis)的ygjG;来自根瘤菌(Rhizobium)NGR 234或来自阿维链霉菌(Streptomyces avermitilis)的rocD;来自天蓝色链霉菌(Streptomyces coelicolor)的SCO1284;来自拟南芥的AGT或AGT2或AGT3或GGT1;来自牛的AGXT。可以使用与由这些基因编码的任何多肽具有至少90%序列同一性的任何多肽。优选地,来自大肠杆菌的serC或来自野猪的GOT1基因用于获得氨基乙醛转氨酶活性。
通过本领域技术人员熟知的手段和方法进行这些酶的进化,以获得对底物氨基乙醛具有特异性并能够将其转化为乙二胺的酶。通过在本发明的微生物中或体外表达进化酶,以氨基乙醛作为底物并通过检测产物乙二胺来选择进化酶。
在本公开的另一个实施方案中,可以从以乙二胺作为唯一碳源和氮源生长的株中分离氨基乙醛转氨酶。为此目的,在以乙二胺作为唯一氮源和碳源的基础介质上培养来自环境样品的乙二胺富集培养物。从这些培养物中生成宏基因组文库,并针对氨基乙醛转氨酶的存在进行筛选。这种方法允许分离对应于酶活性的基因,并且是本领域专业人员所熟知的。
根据本公开的一个具体方面,工程化来自实施方案[X]的微生物以过表达至少一种以下基因:ydfG基因或mmsB基因或yiaY基因,编码丝氨酸脱氢酶;和/或进化的serC基因或GOT1基因,编码氨基乙醛转氨酶活性。
[Y]在一个实施方案中,本申请涉及一种能够由一种或多种戊糖和/或己糖和一种氮源联产单乙二醇(MEG)(或乙醇酸)和乙二胺(EDA)的重组微生物,其中来自实施方案[A]、来自实施方案[B]或来自实施方案[C](并且任选地包括实施方案[D])、并另外具有在C2途径中生产MEG的实施方案[E]的重组微生物进一步表达以下(a)至(c)中的一种或多种:
(a)至少一种内源性或外源性核酸分子,其编码具有丝氨酸脱氢酶活性的酶,该酶催化L-丝氨酸转化为2-氨基丙二酸半醛;
(b)至少一种内源性或外源性核酸分子,其编码具有2-氨基丙二酸半醛转氨酶活性的酶,该酶催化来自(a)的2-氨基丙二酸半醛转化为2,3-二氨基丙酸;
(c)至少一种内源性或外源性核酸分子,其编码具有2,3-二氨基丙酸脱羧酶活性的酶,该酶催化来自(b)的2,3-二氨基丙酸转化为EDA;
其中联产MEG和EDA。
根据本公开的这一方面,重组微生物过表达至少一种基因,其编码显示出丝氨酸脱氢酶、2-氨基丙二酸半醛转氨酶和2,3-二氨基丙酸脱羧酶活性的酶。这些基因可以是内源性基因或外源性基因。
丝氨酸脱氢酶催化L-丝氨酸转化为2-氨基丙二酸半醛的第一反应。该酶属于醇脱氢酶的大型酶家族,醇脱氢酶也称为醛还原酶。已知数种酶表现出丝氨酸脱氢酶活性。在本公开的一个实施方案中,丝氨酸脱氢酶选自这些已知的酶。这些酶由选自本领域公知的基因列表中的基因编码(Chowdhury等人,1996,Yao等人,2010,Tchigvintsev等人,2012,Fujisawa等人,2003,Hawes等人,1996和Lokanath等人,2005),包括但不限于此处列出的基因:来自恶臭假单胞菌、来自聚球藻(Synechococcus)PCC6301或来自蜡状芽孢杆菌(Bacillus cereus)的mmsB;来自恶臭假单胞菌E23的hibdh;来自铜绿假单胞菌的PA0743;来自大肠杆菌或来自短芽孢杆菌(Bacillus brevis)或来自枯草芽孢杆菌的ydfG;来自根癌农杆菌(Agrobacterium tumefaciens)的sdh;来自大鼠(Rattus norvegicus)或来自嗜热栖热菌(Thermus thermophilus)HB8的hibadh;来自大肠杆菌的yiaY。
在本公开的一个优选的实施方案中,丝氨酸脱氢酶由来自大肠杆菌的ydfG、或来自恶臭假单胞菌的mmsB、或来自大肠杆菌的yiaY编码。优选地,通过突变编码基因来优化这些酶,以提高其将L-丝氨酸转化为2-氨基丙二酸半醛的催化效率。
在本公开的另一个实施方案中,通过进化酶获得丝氨酸脱氢酶,该进化是为了改变酶的底物特异性和/或其催化效率,以获得表现出对丝氨酸的特异性和丝氨酸脱氢酶的活性的酶。这些酶选自对化学性质与L-丝氨酸相似的底物具有相同类型催化活性的酶。优选地,这些酶可以选自3-羟基异丁酸脱氢酶和丝氨酸脱氢酶。更优选地,这些酶由选自本领域公知的基因列表中的基因编码,包括但不限于此处的基因:来自大肠杆菌或来自柠檬明串珠菌(Leuconostoc citreum)或来自Symbiobacterium thermophilum的gldA;来自大肠杆菌的yqhE;来自大肠杆菌的yafB;来自杜氏利什曼原虫(Leishmania donovani)的alr;来自聚球藻属物种(Synechococcus sp.)的sakR1;来自枯草芽孢杆菌的yhdN;来自枯草芽孢杆菌的ytbE;来自拟南芥的AKR4C9;来自大肠杆菌的fucO。可以使用与由这些基因编码的任何多肽具有至少90%序列同一性的任何多肽。
通过本领域技术人员熟知的手段和方法进行这些酶的进化,以获得对底物L-丝氨酸具有改进的特异性和/或能够以改进的活性将其转化为2-氨基丙二酸半醛的酶。通过在本公开的微生物中或体外表达进化酶,以L-丝氨酸为底物,并通过检测产物2-氨基丙二酸半醛来选择进化的酶。
2-氨基丙二酸半醛转氨酶催化2-氨基丙二酸半醛转化为2,3-二氨基丙酸的第二反应。这种酶不是自然遇到的。因此通过已知酶的进化或通过筛选宏基因组文库获得该酶。用进化的转氨酶(transaminase)或转氨酶(aminotransferase)行使2-氨基丙二酸半醛转氨酶活性,该酶催化一个分子的氨基基团与另一个分子上的氧代基团的交换。优选地,进化的转氨酶选自磷酸丝氨酸转氨酶或天冬氨酸转氨酶或谷氨酸转氨酶。更优选地,进化的转氨酶选自使用谷氨酸作为氨基基团供体的转氨酶。这些酶由从本领域众所周知的基因列表中选择的基因编码,包括但不限于此处列出的基因:来自大肠杆菌或来自枯草芽孢杆菌或来自谷氨酸棒杆菌(Corynebacterium glutamicum)的serC;来自野猪(Sus scrofa)的GOT1;来自大肠杆菌的patA;来自犬布鲁氏菌(Brucella canis)的ygjG;来自根瘤菌(Rhizobium)NGR 234或来自阿维链霉菌(Streptomyces avermitilis)的rocD;来自天蓝色链霉菌(Streptomyces coelicolor)的SCO1284;来自拟南芥的AGT或AGT2或AGT3或GGT1;来自牛的AGXT。可以使用与由这些基因编码的任何多肽具有至少90%序列同一性的任何多肽。优选地,来自大肠杆菌的serC或来自野猪的GOT1基因用于获得2-氨基丙二酸半醛转氨酶活性。
通过本领域技术人员熟知的手段和方法进行这些酶的进化,以获得对底物2-氨基丙二酸半醛具有改进的特异性和/或能够以改进的活性将其转化为2,3-二氨基丙酸的酶。通过在本发明的微生物中或体外表达进化酶,以2-氨基丙二酸半醛作为底物并通过定量产物2,3-二氨基丙酸来选择进化酶。
具有2,3-二氨基丙酸脱羧酶活性的酶催化2,3-二氨基丙酸转化为乙二胺的第三反应。这种酶不是自然遇到的。因此通过已知酶的进化或通过筛选宏基因组文库获得该酶。用进化的氨基酸脱羧酶或进化的酮酸脱羧酶行使2,3-二氨基丙酸脱羧酶活性,该酶催化氨基酸或酮酸的脱羧。优选地,选择进化的氨基酸脱羧酶。更优选地,所述进化的氨基酸脱羧酶选自组氨酸脱羧酶、丝氨酸脱羧酶、天冬氨酸脱羧酶、二氨基丁酸脱羧酶和鸟氨酸脱羧酶。这些酶由从本领域众所周知的基因列表中选择的基因编码,包括但不限于此处列出的基因:来自拟南芥的sdc;来自枯草芽孢杆菌的padC或yclB;来自空肠弯曲杆菌(Campylobacter jejuni)或大肠杆菌的ubiD;来自酿酒酵母的PAD1或GAD1或SPE1;来自Aquifex aeolicus或来自枯草芽孢杆菌的panD;来自拟南芥的GAD或GAD2或GAD3或GAD4或GAD5;来自牛(Bos Taurus)的GAD或GAD2或OAZ1或ODC1;来自大肠杆菌的gadA或gadB或panD或speC或speF;来自天蓝色链霉菌(Streptomyces coelicolor)的SCC105.13;来自Mannheimia succiniciproducens的gadB;来自沃氏富盐菌(Haloferax volcanii)的bdb;来自乳杆菌属物种(Lactobacillus sp.)的odc1;来自乳酸乳球菌乳酸亚种(Lactococcuslactis subsp.Lactis)的kivD;来自乳酸乳球菌的kdcA;来自牛的OAZ1或ODC1;来自大肠杆菌的speC或speF;来自酿酒酵母的SPE1。可以使用与由这些基因编码的任何多肽具有至少90%序列同一性的任何多肽。优选地,来自拟南芥的sdc基因用于获得2,3-二氨基丙酸脱羧酶活性。
通过本领域技术人员熟知的手段和方法进行这些酶的进化,以获得对底物2,3-二氨基丙酸具有改进的特异性和/或能够以改进的活性将其转化为乙二胺的酶。通过在本发明的微生物中或体外表达进化酶,以2,3-二氨基丙酸作为底物并通过定量产物乙二胺来选择进化酶。根据本公开的一个具体方面,工程化来自实施方案[Y]的微生物以过表达:ydfG基因、yiaY基因或mmsB基因,编码丝氨酸脱氢酶;和/或进化的serC基因或GOT1基因,编码2-氨基丙二酸半醛转氨酶活性;和/或进化的来自拟南芥的sdc基因,编码2,3-二氨基丙酸脱羧酶。
[Z]在一个实施方案中,本申请涉及一种能够由一种或多种戊糖和/或己糖和一种氮源联产单乙二醇(MEG)(或乙醇酸)和乙二胺(EDA)的重组微生物,其中来自实施方案[A]、来自实施方案[B]或来自实施方案[C](并且任选地包括实施方案[D])、并另外具有在C2途径中生产MEG的实施方案[E]的重组微生物进一步表达以下(a)至(c)中的一种或多种:
(a)至少一种内源性或外源性核酸分子,其编码具有丝氨酸脱羧酶活性的酶,该酶催化L-丝氨酸转化为乙醇胺;
(b)至少一种内源性或外源性核酸分子,其编码具有乙醇胺脱氢酶活性的酶,该酶催化来自(a)的乙醇胺转化为氨基乙醛;
(c)至少一种内源性或外源性核酸分子,其编码具有氨基乙醛转氨酶活性的酶,该酶催化来自(b)的氨基乙醛转化为EDA;
其中联产MEG和EDA。
根据本公开的这一方面,重组微生物过表达至少一种基因,其编码显示出丝氨酸脱羧酶、乙醇胺脱氢酶和氨基乙醛转氨酶活性的酶。这些基因可以是内源性基因或外源性基因。
具有丝氨酸脱羧酶活性的酶催化L-丝氨酸转化为乙醇胺的第一反应。这组酶催化L-丝氨酸脱羧为乙醇胺。在本发明的一个优选的实施方案中,丝氨酸脱羧酶由来自拟南芥的sdc编码(Rontein等人,2001,W02007/144346)。由来自拟南芥的sdc编码的丝氨酸脱羧酶将L-丝氨酸转化为乙醇胺具体公开于专利申请WO2007/144364中,该专利申请通过引用并入本文。优选地,通过突变编码基因来优化这些酶,以提高其将L-丝氨酸转化为乙醇胺的转化效率。
在本公开的一个实施方案中,通过进化酶获得丝氨酸脱羧酶活性,该进化是为了改变酶的底物特异性和/或其催化效率,以获得表现出对丝氨酸的特异性和改进的丝氨酸脱羧酶活性的酶。这些酶选自对化学性质与乙醇胺相似的底物具有相同类型催化活性的酶。这些酶由从本领域众所周知的基因列表中选择的基因编码,包括但不限于此处列出的基因:来自酿酒酵母的GAD1或SPE1;来自Aquifex aeolicus或枯草芽孢杆菌的panD;来自拟南芥的GAD或GAD2或GAD3或GAD4或GAD5;来自牛(Bos Taurus)的GAD或GAD2或OAZ1或ODC1;来自大肠杆菌的gadA或gadB或panD或speC或speF;来自天蓝色链霉菌(Streptomycescoelicolor)的SCC105.13;来自Mannheimia succiniciproducens的gadB;来自沃氏富盐菌(Haloferax volcanii)的bdb;来自乳杆菌属物种(Lactobacillus sp.)的odc1;来自牛的OAZ1或ODC1;来自大肠杆菌的speC或speF;来自酿酒酵母的SPE1。可以使用与由这些基因编码的任何多肽具有至少90%序列同一性的任何多肽。
通过本领域技术人员熟知的手段和方法进行这些酶的进化,以获得对底物L-丝氨酸具有改进的特异性和能够以改进的活性将其转化为乙醇胺的酶。通过在本发明的微生物中或体外表达进化酶,以L-丝氨酸作为底物并通过定量产物乙醇胺来选择进化酶。
乙醇胺脱氢酶催化乙醇胺转化为氨基乙醛的第二反应。在现有技术中没有公开具有这种活性的天然酶;然而,有些酶具有低催化活性。因此,有利地将这些具有低催化活性的酶进化为具有改进活性的进化酶。也可以通过筛选宏基因组文库获得有用的酶。
在本公开的一个实施方案中,通过进化酶获得乙醇胺脱氢酶活性,该进化是为了改变酶的底物特异性和/或其催化效率,以获得表现出对乙醇胺的特异性和乙醇胺脱氢酶的活性的酶。这些酶选自对化学性质与乙醇胺相似的底物具有相同类型催化活性的酶。这些酶由从本领域众所周知的基因列表中选择的基因编码,包括但不限于此处列出的基因:来自恶臭假单胞菌、或来自聚球藻(Synechococcus)PCC6301、或来自蜡状芽孢杆菌(Bacillus cereus)的mmsB;来自恶臭假单胞菌E23的hibdh;来自铜绿假单胞菌的PA0743;来自大肠杆菌或来自短芽孢杆菌(Bacillus brevis)或来自枯草芽孢杆菌的ydfG;来自根癌农杆菌(Agrobacterium tumefaciens)的sdh;来自大鼠(Rattus norvegicus)或来自嗜热栖热菌(Thermus thermophilus)HB8的hibadh;来自大肠杆菌或来自柠檬明串珠菌(Leuconostoc citreum)或来自Symbiobacterium thermophilum的gldA;来自大肠杆菌的yqhE;来自大肠杆菌的yafB;来自产气肠杆菌(Enterobacter aerogenes)的aladh;来自杜氏利什曼原虫(Leishmania donovani)的alr;来自聚球藻属物种(Synechococcus sp.)的sakR1;来自枯草芽孢杆菌的yhdN;来自枯草芽孢杆菌的ytbE;来自大肠杆菌的yiaY;来自拟南芥的AKR4C9;来自大肠杆菌的fucO。可以使用与由这些基因编码的任何多肽具有至少90%序列同一性的任何多肽。优选地,来自大肠杆菌的fucO或来自大肠杆菌的yiaY基因用于获得乙醇胺脱氢酶活性。
通过本领域技术人员熟知的手段和方法进行这些酶的进化,以获得对底物乙醇胺具有改进的特异性和/或能够以改进的活性将其转化为氨基乙醛的酶。通过在本发明的微生物中或体外表达进化酶,以乙醇胺作为底物并通过定量产物氨基乙醛来选择进化酶。
氨基乙醛转氨酶催化氨基乙醛转化为乙二胺的最后反应。这种酶不是自然遇到的。因此通过已知酶的进化或通过筛选宏基因组文库获得该酶。在本公开的一个实施方案中,用进化的转氨酶(transaminase)或转氨酶(aminotransferase)行使氨基乙醛转氨酶活性,该酶催化一个分子的氨基基团与另一个分子上的氧代基团的交换。优选地,进化的转氨酶选自磷酸丝氨酸转氨酶或天冬氨酸转氨酶或谷氨酸转氨酶。更优选地,进化的转氨酶选自使用谷氨酸作为氨基基团供体的转氨酶。这些酶由从本领域众所周知的基因列表中选择的基因编码,包括但不限于此处列出的基因:来自大肠杆菌或来自枯草芽孢杆菌或来自谷氨酸棒杆菌(Corynebacterium glutamicum)的serC;来自野猪(Sus scrofa)的GOT1;来自大肠杆菌的patA;来自犬布鲁氏菌(Brucella canis)的ygjG;来自根瘤菌(Rhizobium)NGR234或来自阿维链霉菌(Streptomyces avermitilis)的rocD;来自天蓝色链霉菌(Streptomyces coelicolor)的SCO1284;来自拟南芥的AGT或AGT2或AGT3或GGT1;来自牛的AGXT。可以使用与由这些基因编码的任何多肽具有至少90%序列同一性的任何多肽。优选地,使用来自大肠杆菌的serC或来自野猪的GOT1基因。
通过本领域技术人员熟知的手段和方法进行这些酶的进化,以获得对底物氨基乙醛具有改进的特异性和/或能够以改进的活性将其转化为乙二胺的酶。通过在本发明的微生物中或体外表达进化酶,以氨基乙醛作为底物并通过检测产物乙二胺来选择进化酶。
在本公开的另一个实施方案中,可以从以乙二胺作为唯一碳源和氮源生长的株中分离氨基乙醛转氨酶。为此目的,在以乙二胺作为唯一氮源和碳源的基础介质上培养来自环境样品的乙二胺富集培养物。从这些培养物中生成宏基因组文库,并针对氨基乙醛转氨酶的存在进行筛选。这种方法允许分离对应于酶活性的基因,并且是本领域专业人员所熟知的。
根据本公开的一个具体方面,工程化来自实施方案[Z]的微生物以过表达:来自拟南芥的sdc基因,编码丝氨酸脱羧酶;和/或来自大肠杆菌的fucO或yiaY基因,编码乙醇胺脱氢酶活性;和/或进化的serC基因或GOT1基因,编码氨基乙醛转氨酶活性。
[AA]在一个实施方案中,本申请涉及一种能够由一种或多种戊糖和/或己糖和一种氮源联产单乙二醇(MEG)(或乙醇酸)和乙二胺(EDA)的重组微生物,其中来自实施方案[A]、来自实施方案[B]或来自实施方案[C](并且任选地包括实施方案[D])、并另外具有在C2途径中生产MEG的实施方案[E]的重组微生物进一步表达以下(a)至(c)中的一种或多种:
(a)至少一种内源性或外源性核酸分子,其编码具有丝氨酸羟甲基转移酶活性的酶,该酶催化L-丝氨酸转化为甘氨酸;
(b)至少一种内源性或外源性核酸分子,其编码具有醛氧化酶活性的酶,该酶催化来自(a)的甘氨酸转化为氨基乙醛;
(c)至少一种内源性或外源性核酸分子,其编码具有氨基乙醛转氨酶活性的酶,该酶催化来自(b)的氨基乙醛转化为EDA;
其中联产MEG和EDA。
优选地,使用来自大肠杆菌的glyA基因以获得丝氨酸羟甲基转移酶活性。
通过进化酶获得醛氧化酶,该进化是为了改变酶的底物特异性和/或其催化效率,以获得表现出对甘氨酸的特异性和醛氧化酶的活性的酶。这些酶选自对化学性质与甘氨酸相似的底物具有相同类型催化活性的酶。这些酶由从本领域众所周知的基因列表中选择的基因编码,包括但不限于此处列出的基因:来自Aquifex aeolicus的aldH1;来自Anoxybacillus flavithermus的dhaS;来自西方蜜蜂(Apis mellifera)的Aldh;来自枯草芽孢杆菌的aldX、aldY、dhaS、ycbD、yfmT或ywdH;来自大肠杆菌的prr;来自酿酒酵母的ALD2、ALD3、ALD4、ALD5、ALD6;来自Roseobacter denitrificans的betB;来自金黄节杆菌(Arthrobacter aurescens)的AAur_0650。可以使用与由这些基因编码的任何多肽具有至少90%序列同一性的任何多肽。
通过具有氨基乙醛转氨酶活性的酶将氨基乙醛转化为乙二胺。通过进化酶获得该酶,该进化是为了改变酶的底物特异性和/或其催化效率,以获得表现出对氨基乙醛的特异性和转氨酶活性的酶。这些酶选自对化学性质与氨基乙醛相似的底物具有相同类型催化活性的酶。这些酶由从本领域众所周知的基因列表中选择的基因编码,包括但不限于此处列出的基因:来自大肠杆菌或来自枯草芽孢杆菌或来自谷氨酸棒杆菌(Corynebacteriumglutamicum)的serC;来自野猪(Sus scrofa)的GOT1;来自大肠杆菌的patA;来自犬布鲁氏菌(Brucella canis)的ygjG;来自根瘤菌(Rhizobium)NGR 234或来自阿维链霉菌(Streptomyces avermitilis)的rocD;来自天蓝色链霉菌(Streptomyces coelicolor)的SCO1284;来自拟南芥的AGT或AGT2或AGT3或GGT1;来自牛的AGXT。可以使用与由这些基因编码的任何多肽具有至少90%序列同一性的任何多肽。
根据本公开的一个具体的方面,工程化来自实施方案[AA]的微生物,以过表达进化的serC基因或GOT1基因,该基因编码氨基乙醛转氨酶活性。
[BB]在一个实施方案中,本申请涉及一种能够由一种或多种戊糖和/或己糖和一种氮源联产单乙二醇(MEG)(或乙醇酸)和乙二胺(EDA)的重组微生物,其中来自实施方案[A]、来自实施方案[B]或来自实施方案[C](并且任选地包括实施方案[D])、并另外具有在C2途径中生产MEG的实施方案[E]的重组微生物进一步表达以下(a)至(e)中的一种或多种:
(a)至少一种内源性或外源性核酸分子,其编码具有氨基酸N-乙酰转移酶活性或O-乙酰转移酶活性的酶,该酶催化L-丝氨酸转化为N-乙酰丝氨酸;
(b)至少一种内源性或外源性核酸分子,其编码具有N-乙酰丝氨酸脱氢酶活性的酶,该酶催化来自(a)的N-乙酰丝氨酸转化为N-乙酰丙二酸半醛;
(c)至少一种内源性或外源性核酸分子,其编码具有转氨酶活性的酶,该酶催化来自(b)的N-乙酰丙二酸半醛转化为乙酰氨基丙酸;
(d)至少一种内源性或外源性核酸分子,其编码具有脱乙酰酶活性的酶,该酶催化来自(c)的乙酰氨基丙酸转化为2,3-二氨基丙酸;
(e)至少一种内源性或外源性核酸分子,其编码具有2,3-二氨基丙酸脱羧酶活性的酶,该酶催化来自(d)的2,3-二氨基丙酸转化为EDA;
其中联产MEG和EDA。
实施方案[BB]的第一转化步骤可以是氨基酸N-乙酰转移酶活性或O-乙酰转移酶活性,因为O向N的转化是自发的。优选地,使用来自大肠杆菌的argA基因以获得氨基酸N-乙酰转移酶活性。
通过进化酶获得具有N-乙酰丝氨酸脱氢酶活性的酶,该进化是为了改变酶的底物特异性和/或其催化效率,以获得表现出对N-乙酰丝氨酸的特异性和N-乙酰丝氨酸脱氢酶活性的酶。这些酶选自对化学性质与N-乙酰丝氨酸相似的底物具有相同类型催化活性的酶。这些酶由从本领域众所周知的基因列表中选择的基因编码,包括但不限于此处列出的基因:来自恶臭假单胞菌、或来自聚球藻(Synechococcus)PCC6301、或来自蜡状芽孢杆菌(Bacillus cereus)的mmsB;来自恶臭假单胞菌E23的hibdh;来自铜绿假单胞菌的PA0743;来自大肠杆菌或来自短芽孢杆菌(Bacillus brevis)或来自枯草芽孢杆菌的ydfG;来自根癌农杆菌(Agrobacterium tumefaciens)的sdh;来自大鼠(Rattus norvegicus)或来自嗜热栖热菌(Thermus thermophilus)HB8的hibadh;来自大肠杆菌或来自柠檬明串珠菌(Leuconostoc citreum)或来自Symbiobacterium thermophilum的gldA;来自大肠杆菌的yqhE;来自大肠杆菌的yafB;来自产气肠杆菌(Enterobacter aerogenes)的aladh;来自杜氏利什曼原虫(Leishmania donovani)的alr;来自聚球藻属物种(Synechococcus sp.)的sakR1;来自枯草芽孢杆菌的yhdN;来自枯草芽孢杆菌的ytbE;来自大肠杆菌的yiaY;来自拟南芥的AKR4C9;来自大肠杆菌的fucO。可以使用与由这些基因编码的任何多肽具有至少90%序列同一性的任何多肽。
可以通过进化酶获得具有转氨酶活性、将N-乙酰丙二酸半醛转化为乙酰氨基丙酸的酶,该进化是为了改变酶的底物特异性和/或其催化效率,以获得表现出对N-乙酰丙二酸半醛的特异性和N-乙酰丙二酸半醛转氨酶的活性的酶。这些酶选自对化学性质与N-乙酰丙二酸半醛相似的底物具有相同类型催化活性的酶。这些酶由从本领域众所周知的基因列表中选择的基因编码,包括但不限于此处列出的基因:来自大肠杆菌或来自枯草芽孢杆菌或来自谷氨酸棒杆菌(Corynebacterium glutamicum)的serC;来自野猪(Sus scrofa)的GOT1;来自大肠杆菌的patA;来自犬布鲁氏菌(Brucella canis)的ygjG;来自根瘤菌(Rhizobium)NGR 234或来自阿维链霉菌(Streptomyces avermitilis)的rocD;来自天蓝色链霉菌(Streptomyces coelicolor)的2SCG18.31c;来自拟南芥的AGT或AGT2或AGT3或GGT1;来自牛的AGXT。可以使用与由这些基因编码的任何多肽具有至少90%序列同一性的任何多肽。
优选地,使用来自大肠杆菌的基因argE以获得将乙酰氨基丙酸转化为2,3-二氨基丙酸的脱乙酰酶活性。
可以通过进化酶来获得具有氨基酸脱羧酶活性或酮酸脱羧酶活性、以将2,3-二氨基丙酸转化为乙二胺的酶,该进化是为了改变其底物特异性和/或其催化效率,以获得表现出对2,3-二氨基丙酸的特异性和氨基酸脱羧酶或酮酸脱羧酶的活性的酶。这些酶选自对化学性质与2,3-二氨基丙酸相似的底物具有相同类型催化活性的酶。这些酶由从本领域众所周知的基因列表中选择的基因编码,包括但不限于此处列出的基因:来自拟南芥的sdc;来自枯草芽孢杆菌的padC或yclB;来自空肠弯曲杆菌(Campylobacter jejuni)或大肠杆菌的ubiD;来自酿酒酵母的PAD1或GAD1或SPE1;来自Aquifex aeolicus或来自枯草芽孢杆菌的panD;来自拟南芥的GAD或GAD2或GAD3或GAD4或GAD5;来自牛(Bos Taurus)的GAD或GAD2或OAZ1或ODC1;来自大肠杆菌的gadA或gadB或panD或speC或speF;来自天蓝色链霉菌(Streptomyces coelicolor)的SCC105.13;来自Mannheimia succiniciproducens的gadB;来自沃氏富盐菌(Haloferax volcanii)的bdb;来自乳杆菌属物种(Lactobacillus sp.)的odc1;来自乳酸乳球菌乳酸亚种(Lactococcus lactis subsp.Lactis)的kivD;来自乳酸乳球菌的kdcA;来自牛的OAZ1或ODC1;来自大肠杆菌的speC或speF;来自酿酒酵母的SPE1。可以使用与由这些基因编码的任何多肽具有至少90%序列同一性的任何多肽。
在本公开的一个进一步的实施方案中,用其中优化了丝氨酸生物合成的微生物执行该方法。专利申请WO 2007/144346中特别公开了这种优化,该申请通过引用并入本文。
可选地,在另一个实施方案中,可以通过以下过程生产EDA:可以通过丝氨酸氨基酶(EC 2.6.1.-)将Ser直接胺化为(S)-2,3-二氨基丙酸,然后例如通过来自L-2,4-二氨基丁酸或鸟氨酸脱羧酶家族的酶脱羧为EDA(图7)。然而,如果这种具有(S)-2,3-二氨基丙酸脱羧酶活性的酶不是特异性的,该酶也可能作用于其他氨基酸或丝氨酸本身。
在一些实施方案中,可以通过以下方法生产EDA:也可以通过使用(S)-2,3-二氨基丙酸解氨酶(EC 4.3.1.15)直接胺化丙酮酸来产生中间体(S)-2,3-二氨基丙酸(图7):
Figure BDA0003310804120001461
在一些实施方案中,生产MEG和EDA非常接近于热力学最大产率潜力,即使用一种或多种戊糖和/或己糖无损转化为D-核糖-5-磷酸中间体,随后将D-核糖-5-磷酸中间体转化为乙醇醛和D-甘油醛-3-磷酸(G3P)中间体,然后通过乙醇醛的还原联产MEG,并通过一种或多种C3途径由G3P中间体联产EDA。在一些实施方案中,与通过天然的或公开的类似途径由葡萄糖制造EDA的生产相比,通过本申请中公开的途径联产MEG和EDA的热力学产率潜力高14%。
联产:(戊糖或己糖)+2NH3->MEG+EDA+0ATP*
Y(途径)=(0.337+0.326)g/g=0.663g(MEG+EDA)/g((戊糖或己糖)+2NH3),97%的Y(最大)(燃烧热)=0.687g/g
标准途径:葡萄糖+4NH3->2EDA+2NADH+0ATP
Y(途径)=0.484g(EDA)/g(葡萄糖+4NH3),85%的Y(最大)(燃烧热)=0.571g/g
*假设被动或H+同向转运D-木糖(戊糖)。不考虑H+同向转运蛋白的间接ATP消耗或维持细胞所需的ATP。
[CC]在一个实施方案中,本申请涉及一种能够由一种或多种戊糖和/或己糖和一种氮源联产单乙二醇(MEG)(或乙醇酸)和乙二胺(EDA)的重组微生物,其中来自实施方案[A]、来自实施方案[B]或来自实施方案[C](并且任选地包括实施方案[D])、并另外具有在C2途径中生产MEG的实施方案[E]的重组微生物进一步表达以下(a)至(b)中的一种或多种:
(a)至少一种内源性或外源性核酸分子,其编码具有丝氨酸氨基酶活性的酶,该酶催化L-丝氨酸转化为(S)-2,3-二氨基丙酸;
(b)至少一种内源性或外源性核酸分子,其编码具有(S)-2,3-二氨基丙酸脱羧酶活性的酶,该酶催化来自(a)的(S)-2,3-二氨基丙酸转化为EDA;
其中联产MEG和EDA。
[DD]在一个实施方案中,本申请涉及一种能够由一种或多种戊糖和/或己糖和一种氮源联产单乙二醇(MEG)(或乙醇酸)和乙二胺(EDA)的重组微生物,其中来自实施方案[A]、来自实施方案[B]或来自实施方案[C](并且任选地包括实施方案[D])、并另外具有在C2途径中生产MEG的实施方案[E]的重组微生物进一步表达以下(a)至(b)中的一种或多种:
(a)至少一种内源性或外源性核酸分子,其编码具有(S)-2,3-二氨基丙酸解氨酶活性的酶,该酶催化丙酮酸和氨转化为(S)-2,3-二氨基丙酸;
(b)至少一种内源性或外源性核酸分子,其编码具有(S)-2,3-二氨基丙酸脱羧酶活性的酶,该酶催化来自(a)的(S)-2,3-二氨基丙酸转化为EDA;
其中G3P通过重组微生物中的内源性糖酵解转化为丙酮酸,并且其中联产MEG和EDA。
在一些实施方案中,具有2,3-二氨基丙酸解氨酶活性的酶用于将丙酮酸和铵转化为(S)-2,3-二氨基丙酸。在一些实施方案中,具有2,3-二氨基丙酸解氨酶活性的酶由与大肠杆菌2,3-二氨基丙酸解氨酶ygeX具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在其他实施方案中,具有2,3-二氨基丙酸解氨酶活性的酶是大肠杆菌ygeX。在一些实施方案中,编码具有2,3-二氨基丙酸解氨酶活性的酶的一种或多种核酸分子包含UniProt ID P66899中列出的氨基酸序列。在进一步的实施方案中,编码具有2,3-二氨基丙酸解氨酶活性的酶的一种或多种核酸分子由Gene ID947012中列出的核酸序列编码。
在以上公开的任何方面的一个实施方案中,具有乙醇醛还原酶活性的酶由获自微生物的一种或多种核酸分子编码,所述微生物选自大肠杆菌和酿酒酵母。在另一个实施方案中,一种或多种核酸分子选自gldA、GRE2、GRE3、yqhD、ydjG、fucO、yafB(dkgB)和/或yqhE(dkgA),或其同源物。在另一个实施方案中,一种或多种核酸分子是yqhD。在一些实施方案中,yqhD包含G149E突变。在一个进一步的实施方案中,具有乙醇醛还原酶活性的酶包含选自SEQ ID NO:13、15、17、20、23、25、28、30和32的氨基酸序列。在一个仍进一步的实施方案中,具有乙醇醛还原酶活性的酶由选自SEQ ID NO:12、14、16、18、19、21、22、24、26、27、29和31的核酸序列编码。
在上述公开的任一个方面的一个实施方案中,具有硫解酶或乙酰辅酶A乙酰转移酶活性的酶由一种或多种获自微生物的核酸分子编码,所述微生物选自梭菌属物种、芽孢杆菌属物种、大肠杆菌、酵母属物种和海杆菌属物种。在一些实施方案中,具有硫解酶或乙酰辅酶A乙酰转移酶活性的酶由一种或多种获自微生物的核酸分子编码,所述微生物选自丙酮丁醇梭菌、热解糖梭菌(Clostridium thermosaccharolyticum)、蜡状芽孢杆菌(Bacillus cereus)、大肠杆菌、酿酒酵母和除烃海杆菌(Marinobacterhydrocarbonoclasticus)。在一些实施方案中,所述一种或多种核酸分子是thlA、atoB和/或ERG10,或其同源物。在一个进一步的实施方案中,具有硫解酶或乙酰辅酶A乙酰转移酶活性的酶包含选自SEQ ID NO:35、37和40的氨基酸序列。在一个仍进一步的实施方案中,具有硫解酶或乙酰辅酶A乙酰转移酶活性的酶由选自SEQ ID NO:33、34、36、38和39的核酸序列编码。
在以上公开的任何方面的一个实施方案中,具有乙酰辅酶A:乙酰乙酸辅酶A转移酶或乙酸:乙酰乙酰辅酶A水解酶活性的酶由一种或多种获自微生物的核酸分子编码,所述微生物选自梭菌属物种(Clostridium sp.)和大肠杆菌。在另一个实施方案中,具有乙酰辅酶A:乙酰乙酸辅酶A转移酶或乙酸:乙酰乙酰辅酶A水解酶活性的酶由获自大肠杆菌的一种或多种核酸分子编码。在一些实施方案中,编码具有乙酰辅酶A:乙酰乙酸辅酶A转移酶活性的酶的一种或多种核酸分子是atoA和/或atoD,或其同源物。在另一个实施方案中,具有乙酰辅酶A:乙酰乙酸辅酶A转移酶或乙酸:乙酰乙酰辅酶A水解酶活性的酶由一种或多种获自丙酮丁醇梭菌(Clostridium acetobutylicum)的核酸分子编码。在一些实施方案中,编码具有乙酸:乙酰乙酰辅酶A水解酶活性的酶的一种或多种核酸分子是ctfA和/或ctfB,或其同源物。在一个进一步的实施方案中,具有乙酰辅酶A:乙酰乙酸辅酶A转移酶或乙酸:乙酰乙酰辅酶A水解酶活性的酶包含选自SEQ ID NO:43、46、97、99、101和103的氨基酸序列。在一个仍进一步的实施方案中,具有乙酰辅酶A:乙酰乙酸辅酶A转移酶或乙酸:乙酰乙酰辅酶A水解酶活性的酶由选自SEQ ID NO:41、42、44、45、96、98、100和102的核酸序列编码。
在以上公开的任何方面的一个实施方案中,具有乙酰乙酸脱羧酶活性的酶由一种或多种获自微生物的核酸分子编码,所述微生物选自梭菌属物种、芽孢杆菌属物种、色杆菌属物种(Chromobacterium sp.)和假单胞菌属物种。在另一个实施方案中,具有乙酰乙酸脱羧酶活性的酶由一种或多种获自微生物的核酸分子编码,所述微生物选自丙酮丁醇梭菌、拜氏梭菌(Clostridium beijerinckii)、解纤维素梭菌(Clostridium cellulolyticum)、多粘芽孢杆菌(Bacillus polymyxa)、紫色色杆菌(Chromobacterium violaceum)和恶臭假单胞菌。在一些实施方案中,编码具有乙酰乙酸脱羧酶活性的酶的一种或多种核酸分子是adc,或其同源物。在一个进一步的实施方案中,具有乙酰乙酸脱羧酶活性的酶包含选自SEQID NO:49和52的氨基酸序列。在一个仍进一步的实施方案中,具有乙酰乙酸脱羧酶活性的酶由选自SEQ ID NO:47、48、50和51的核酸序列编码。
[EE]在另一个实施方案中,选自实施方案[D]或实施方案[E]的重组微生物任选地进一步包含一种或多种选自以下的修饰:
(i)编码乙醇醛还原酶的基因中的缺失、插入或功能缺失突变,该酶催化乙醇醛转化为单乙二醇(MEG);
(ii)编码乙醇醛脱氢酶的基因中的缺失、插入或功能缺失突变,该酶催化乙醇醛转化为乙醇酸;和
(iii)编码乳酸脱氢酶的基因中的缺失、插入或功能缺失突变,该酶催化丙酮酸转化为乳酸。
在一些实施方案中,产生乙醇酸的重组微生物在编码具有乙醇醛还原酶活性的酶的基因中包含缺失、插入或功能缺失突变,以防止乙醇醛转化为单乙二醇(MEG),而是使反应分流至乙醇醛转化为乙醇酸(GA)。在一些实施方案中,具有乙醇醛还原酶活性的酶来自大肠杆菌。在一些实施方案中,具有乙醇醛还原酶活性的酶由fucO基因或其同源物编码。
在一些实施方案中,生产MEG(或乙醇酸)、或MEG和一种或多种联产品的重组微生物,在编码乙醇醛脱氢酶的基因中包含缺失、插入或功能缺失突变,以防止由乙醇醛生产乙醇酸,而将反应分流至乙醇醛转化为MEG。在一些实施方案中,乙醇醛脱氢酶来自大肠杆菌。在一些实施方案中,乙醇醛脱氢酶由aldA基因或其同源物编码。在一些实施方案中,编码乙醇醛脱氢酶的基因是部分缺失、插入或功能缺失突变的,其中仍然存在一些乙醇醛脱氢酶功能并且仍然生产一定量的乙醇酸。
在一些实施方案中,生产MEG(或乙醇酸)或任选MEG(或乙醇酸)和一种或多种联产品的重组微生物,在编码乳酸脱氢酶的基因中包含缺失、插入或功能缺失突变,以防止由丙酮酸生产乳酸,而将反应分流至生产一种或多种联产品。在一些实施方案中,乳酸脱氢酶来自大肠杆菌。在一些实施方案中,乳酸脱氢酶由ldhA基因或其同源物编码。
本文描述的任何重组微生物和方法实施方案的非限制性组合被包括作为本公开的一部分。
重组微生物
本公开提供了可以工程化以表达各种内源性或外源性酶的微生物。
在本文所述的各种实施方案中,重组微生物是真核微生物。在一些实施方案中,所述真核微生物是酵母。在示例性的实施方案中,所述酵母是选自以下的属的成员:耶氏酵母属(Yarrowia)、念珠菌属(Candida)、酵母属(Saccharomyces)、毕赤酵母属(Pichia)、汉逊酵母属(Hansenula)、克鲁维酵母属(Kluyveromyces)、伊萨酵母属(Issatchenkia)、接合酵母属(Zygosaccharomyces)、德巴利酵母属(Debaryomyces)、裂殖酵母属(Schizosaccharomyces)、管囊酵母属(Pachysolen)、隐球菌属(Cryptococcus)、毛孢子菌属(Trichosporon)、红酵母属(Rhodotorula)和Myxozyma属。
在一些实施方案中,重组微生物是原核微生物。在示例性的实施方案中,所述原核微生物是选自以下的属的成员:埃希氏菌属(Escherichia)、梭菌属(Clostridium)、发酵单胞菌属(Zymomonas)、沙门氏菌属(Salmonella)、红球菌属(Rhodococcus)、假单胞菌属(Pseudomonas)、芽孢杆菌属(Bacillus)、乳杆菌属(Lactobacillus)、肠球菌属(Enterococcus)、产碱杆菌属(Alcaligenes)、克雷伯氏菌属(Klebsiella)、类芽孢杆菌属(Paenibacillus)、节杆菌属(Arthrobacter)、棒杆菌属(Corynebacterium)和短杆菌属(Brevibacterium)。
在一些实施方案中,重组微生物用于生产单乙二醇(MEG)或乙醇酸(GA)、或MEG和一种或多种本文公开的联产品。
因此,在另一方面,本发明提供了使用本文所述的重组微生物生产MEG或GA、或MEG和一种或多种联产品的方法。在一个实施方案中,该方法包括在含有提供碳源的原料的培养介质中培养重组微生物,直至产生MEG或GA、或MEG和一种或多种联产品。在一个进一步的实施方案中,回收MEG或GA、或MEG和一种或多种联产品。可以通过本领域已知的方法回收,如蒸馏、基于膜的分离气提(gas stripping)、溶剂萃取和膨胀床吸附(expanded bedadsorption)。
在一些实施方案中,所述原料包含碳源。在本文所述的各种实施方案中,所述碳源可以选自糖、甘油、醇、有机酸、烷烃、脂肪酸、木质纤维素、蛋白质、二氧化碳和一氧化碳。在一个示例性实施方案中,所述碳源是糖。在一些实施方案中,所述糖包括一种或多种戊糖和/或己糖。在其他实施方案中,一种或多种戊糖和/或己糖由单体、低聚物或其组合组成。在一个进一步的示例性实施方案中,所述糖是葡萄糖或葡萄糖的低聚物。在其他实施方案中,葡萄糖的低聚物选自果糖、蔗糖、淀粉、纤维二糖、麦芽糖、乳糖和纤维素。在仍进一步的实施方案中,糖包括D-木糖、D-半乳糖、D-甘露糖、D-阿拉伯糖、L-阿拉伯糖、D-果糖或其组合。
生产或积累MEG(或乙醇酸)、或MEG和一种或多种联产品的重组微生物的生产方法
在另一方面,本申请提供了一种使用上述实施方案中任一项的重组微生物生产一种或多种衍生自甘油醛-3-磷酸(G3P)和乙醇醛的产物的方法,其中所述方法包括在含有提供碳源的一种或多种戊糖和/或己糖的培养介质中培养重组微生物,直至生产一种或多种衍生自甘油醛-3-磷酸(G3P)和乙醇醛的产物。在一些实施方案中,重组微生物联产单乙二醇(MEG)和一种或多种联产品。在进一步的实施方案中,一种或多种联产品选自丙酮、异丙醇、丙烯、L-丝氨酸、甘氨酸、单乙醇胺(MEA)、乙二胺(EDA)或其组合。在仍进一步的实施方案中,一种或多种产物选自单乙二醇(MEG)和乙醇酸(GA)。
在又一方面,本申请提供了一种生产重组微生物的方法,所述微生物由一种或多种戊糖和/或己糖通过戊糖磷酸中间体生产或积累一种或多种衍生自甘油醛-3-磷酸(G3P)和乙醇醛的产物,所述戊糖磷酸中间体是D-核糖-5-磷酸、D-核酮糖-5-磷酸或D-木酮糖-5-磷酸,所述方法包括:向重组微生物中引入或在重组微生物中表达一种或多种酶,其用于将一种或多种戊糖和/或己糖转化为戊糖磷酸中间体;向重组微生物中引入或在重组微生物中表达一种或多种酶,其用于将D-核糖-5-磷酸中间体转化为G3P和乙醇醛;向重组微生物中引入或在重组微生物中表达一种或多种酶,其用于在C2途径中由乙醇醛生产一种或多种产物;向重组微生物中引入或在重组微生物中表达一种或多种酶,其用于在一种或多种C3途径中由G3P生产一种或多种产物;在含有一种或多种戊糖和/或己糖的培养介质中培养重组微生物,以生产或积累一种或多种产物。在一些实施方案中,重组微生物联产单乙二醇(MEG)和一种或多种联产品。在进一步的实施方案中,一种或多种联产品选自丙酮、异丙醇、丙烯、L-丝氨酸、甘氨酸、单乙醇胺(MEA)、乙二胺(EDA)或其组合。在仍进一步的实施方案中,一种或多种产物选自单乙二醇(MEG)和乙醇酸(GA)。在一些实施方案中,乙醇醛由乙醇醛脱氢酶氧化为GA。
在一个实施方案中,本申请涉及一种生产重组微生物的方法,所述微生物由一种或多种戊糖和/或己糖通过磷酸戊糖中间体生产或积累一种或多种衍生自甘油醛-3-磷酸(G3P)和乙醇醛的产物,所述方法包括:向重组微生物中引入或在重组微生物中表达至少一种酶,该酶具有将一种或多种戊糖和/或己糖无损转化为戊糖磷酸中间体的活性,并且包含至少一种具有戊糖磷酸醛缩酶活性的酶,其中所述酶具有D-核糖-5-磷酸醛缩酶活性、D-核酮糖-5-磷酸醛缩酶活性或D-木酮糖-5-磷酸醛缩酶活性,将D-核糖-5-磷酸中间体转化为乙醇醛和D-甘油醛-3-磷酸(G3P)。
在一些实施方案中,该方法包括向重组微生物中引入或在重组微生物中表达至少一种具有转酮醇酶活性的酶,并表达至少一种具有D-核糖-5-磷酸醛缩酶活性的酶。在一些实施方案中,具有转酮醇酶活性的酶由与来自大肠杆菌的tktA具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码。在其他实施方案中,具有转酮醇酶活性的酶是来自大肠杆菌的tktA。在一些实施方案中,具有转酮醇酶活性的酶由与来自大肠杆菌的tktB具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在其他实施方案中,具有转酮醇酶活性的酶是来自大肠杆菌的tktB。在另一个实施方案中,编码具有转酮醇酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO:148和150的氨基酸序列。在一些实施方案中,编码具有转酮醇酶活性的酶的一种或多种核酸分子是tktA,或其同源物。在一些实施方案中,编码具有转酮醇酶活性的酶的一种或多种核酸分子是tktB,或其同源物。在一个进一步的实施方案中,编码具有转酮醇酶活性的酶的一种或多种核酸分子由选自SEQ ID NO:147和149的核酸序列编码。在一些实施方案中,具有D-核糖-5-磷酸醛缩酶活性的酶由与来自大肠杆菌的deoC具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码。在其他实施方案中,具有D-核糖-5-磷酸醛缩酶活性的酶是来自大肠杆菌的deoC。
在一些实施方案中,该方法包括向重组微生物中引入或在重组微生物中表达至少一种具有转醛醇酶活性的酶。在一些实施方案中,具有转醛醇酶活性的酶由与来自大肠杆菌的talA或talB具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码。在一些实施方案中,具有转醛醇酶活性的酶是来自大肠杆菌的talA。在其他实施方案中,具有转醛醇酶活性的酶是来自大肠杆菌的talB。在另一个实施方案中,编码具有转醛醇酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO:152和154的氨基酸序列。在一个进一步的实施方案中,编码具有转醛醇酶活性的酶的一种或多种核酸分子由选自SEQ ID NO:151和153的核酸序列编码。
在一些实施方案中,该方法包括向重组微生物中引入或在重组微生物中表达至少一种具有核糖-5-磷酸3-差向异构酶活性的酶。在一些实施方案中,具有核酮糖-5-磷酸3-差向异构酶活性的酶由与来自大肠杆菌的rpe具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码。在其他实施方案中,具有核酮糖-5-磷酸3-差向异构酶活性的酶是来自大肠杆菌的rpe。在另一个实施方案中,编码具有核酮糖-5-磷酸3-差向异构酶活性的酶的一种或多种核酸分子包含SEQ ID NO:158中列出的氨基酸序列。在一个进一步的实施方案中,编码具有核酮糖-5-磷酸3-差向异构酶活性的酶的一种或多种核酸分子由SEQ ID NO:157中列出的核酸序列编码。
在一些实施方案中,该方法包括向重组微生物中引入或在重组微生物中表达至少一种具有核糖-5-磷酸异构酶活性的酶。在一些实施方案中,具有核糖-5-磷酸异构酶活性的酶由与来自大肠杆菌的rpiA具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码。在其他实施方案中,具有核糖-5-磷酸异构酶活性的酶是来自大肠杆菌的rpiA。在其他实施方案中,具有核糖-5-磷酸异构酶活性的酶由与来自大肠杆菌的rpiB具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码。在其他实施方案中,具有核糖-5-磷酸异构酶活性的酶是来自大肠杆菌的rpiB。在另一个实施方案中,编码具有核糖-5-磷酸异构酶活性的酶的一种或多种核酸分子包含SEQ ID NO:156中列出的氨基酸序列。在一个进一步的实施方案中,编码具有核糖-5-磷酸异构酶活性的酶的一种或多种核酸分子由SEQ ID NO:155中列出的核酸序列编码。
在一些实施方案中,该方法包括向重组微生物中引入或在重组微生物中表达至少一种具有选自以下的活性的酶:转酮醇酶活性、转醛醇酶活性、核酮糖-5-磷酸3-差向异构酶活性、核糖-5-磷酸异构酶活性和D-核糖-5-磷酸醛缩酶活性。在其他实施方案中,该方法进一步包括向重组微生物中引入一种或多种修饰,以降低或缺失一种或多种内源性酶的活性,所述内源性酶选自甘油醛3-磷酸脱氢酶、磷酸甘油酸激酶、磷酸甘油酸激酶和磷酸甘油酸变位酶。在一些实施方案中,内源性的甘油醛3-磷酸脱氢酶是gapA,磷酸甘油酸激酶是pgk,磷酸甘油酸变位酶是gpmA或gpmM。
在一些实施方案中,所述方法包括向重组微生物中引入或在重组微生物中表达至少一种具有果糖-6-磷酸磷酸酮醇酶活性的酶。在一些实施方案中,具有果糖-6-磷酸磷酸酮醇酶活性的酶由与选自以下的具有果糖-6-磷酸磷酸酮醇酶活性的酶具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码:齿双歧杆菌(Bifidobacterium dentium)BDP_1006、乳双歧杆菌(Bifidobacterium lactis)xfp、类植物乳杆菌(Lactobacillus paraplantarum)xpkA和短双歧杆菌(Bifidobacterium breve)xfp。在一个优选的实施方案中,具有果糖-6-磷酸磷酸酮醇酶活性的酶选自齿双歧杆菌BDP_1006、乳双歧杆菌xfp、类植物乳杆菌xpkA和短双歧杆菌xfp。在另一个实施方案中,编码具有果糖-6-磷酸磷酸酮醇酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO:212、214、216和218的氨基酸序列。在一个进一步的实施方案中,编码具有果糖-6-磷酸磷酸酮醇酶活性的酶的一种或多种核酸分子由选自SEQ ID NO:211、213、215和217的核酸序列编码。
在一些实施方案中,该方法包括向重组微生物中引入或在重组微生物中表达至少一种具有磷酸乙酰转移酶活性的酶。在一些实施方案中,具有磷酸乙酰转移酶活性的酶由与选自以下的具有磷酸乙酰转移酶活性的酶具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码:大肠杆菌pta和丙酮丁醇梭菌(Clostridiumacetobutylicum)pta。在一个优选的实施方案中,具有磷酸乙酰转移酶活性的酶选自大肠杆菌pta和丙酮丁醇梭菌pta。在另一个实施方案中,编码具有磷酸乙酰转移酶活性的酶的一种或多种核酸分子包含选自SEQ ID NO:220和222的氨基酸序列。在一个进一步的实施方案中,编码具有磷酸乙酰转移酶活性的酶的一种或多种核酸分子由选自SEQ ID NO:219和221的核酸序列编码。
在一些实施方案中,该方法包括向重组微生物中引入或在重组微生物中表达至少一种具有选自以下的活性的酶:果糖-6-磷酸磷酸酮醇酶活性、磷酸乙酰转移酶活性、转酮醇酶活性、转醛醇酶活性、核酮糖-5-磷酸3-差向异构酶活性、核糖-5-磷酸异构酶活性和D-核糖-5-磷酸醛缩酶活性。在其他实施方案中,该方法进一步包括将一种或多种修饰引入重组微生物中,以减少或缺失内源性6-磷酸果糖激酶的活性。在一些实施方案中,内源性6-磷酸果糖激酶是pfkA和/或pfkB。
在一些实施方案中,一种或多种戊糖和/或己糖包含D-木糖,并且该方法进一步包含向重组微生物中引入或在重组微生物中表达至少一种具有木糖异构酶活性的酶和至少一种具有木酮糖5-激酶活性的酶的表达。在一些实施方案中,至少一种具有木糖异构酶活性的酶由与来自大肠杆菌或Pyromyces sp.的xylA具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一个优选的实施方案中,具有木糖异构酶活性的酶选自大肠杆菌xylA和Pyromyces sp xylA。在又一个实施方案中,编码木糖异构酶的一种或多种核酸分子包含选自SEQ ID NO:95和144的氨基酸序列。在一个进一步的实施方案中,编码木糖异构酶的一种或多种核酸分子由选自SEQ ID NO:93、94和143的核酸序列编码。在一些实施方案中,至少一种具有木酮糖5-激酶活性的酶由与来自大肠杆菌的xylB具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一个优选的实施方案中,具有木酮糖5-激酶活性的酶是大肠杆菌xylB。在另一个实施方案中,编码D-木酮糖5-激酶的一种或多种核酸分子包含SEQID NO:146中列出的氨基酸序列。在一个进一步的实施方案中,编码D-木酮糖5-激酶的一种或多种核酸分子由SEQ ID NO:145中列出的核酸序列编码。
在一些实施方案中,一种或多种戊糖和/或己糖包含D-果糖,并且该方法进一步包含向重组微生物中引入或在重组微生物中表达至少一种具有果糖1,6-二磷酸酶活性的酶。在一些实施方案中,至少一种具有果糖1,6-二磷酸酶活性的酶由与来自大肠杆菌的fbp具有至少70%序列同一性、具有至少80%序列同一性或具有至少90%序列同一性的氨基酸序列编码。在一个优选的实施方案中,具有果糖1,6-二磷酸酶活性的酶是大肠杆菌fbp。在一些实施方案中,具有果糖1,6-二磷酸酶活性的酶将D-果糖1,6-二磷酸转化为D-果糖6-磷酸。在其他实施方案中,重组微生物中的内源性酶将D-果糖转化为果糖1,6-二磷酸。
在上述任何方法的一些实施方案中,所述方法进一步包括:将一种或多种修饰引入重组微生物中,以减少或缺失一种或多种内源性酶的活性,所述内源性酶选自葡萄糖6-磷酸-1-脱氢酶、6-磷酸葡萄糖酸内酯酶和6-磷酸葡萄糖酸脱氢酶。在进一步的实施方案中,葡萄糖6-磷酸-1-脱氢酶是zwf,6-磷酸葡萄糖酸内酯酶是pgl,6-磷酸葡萄糖酸脱氢酶是gnd。
在一些实施方案中,一种或多种戊糖和/或己糖能够在重组微生物的非氧化磷酸戊糖途径中转化为一种或多种中间体。在其他实施方案中,一种或多种戊糖和/或己糖由单体、低聚物或其组合组成。
在一些实施方案中,至少一种具有转酮醇酶活性和/或果糖-6-磷酸磷酸酮醇酶活性的酶的表达和至少一种具有戊糖磷酸醛缩酶活性的酶的表达,使得能够实现一种或多种戊糖和/或己糖无损转化为戊糖磷酸中间体以及随后戊糖磷酸转化为G3P和乙醇醛。
在一些实施方案中,该方法允许通过C2途径中乙醇醛的转化和通过一种或多种C3途径中G3P的转化,生产MEG或乙醇酸(GA)。在一些实施方案中,通过C2途径中具有乙醇醛还原酶活性的酶还原乙醇醛来生产MEG。在其他实施方案中,通过C2途径中具有乙醇醛脱氢酶活性的酶氧化乙醇醛来生产GA。
在一些实施方案中,用于生产MEG或GA的至少一种酶选自具有选自以下的活性的至少一种酶:3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、羟基丙酮酸脱羧酶活性、3-磷酸羟基丙酮酸还原酶活性、乙醇醛还原酶活性、乙醇醛脱氢酶活性、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶活性、丝氨酸脱羧酶活性、乙醇胺转氨酶或乙醇胺氧化还原酶(脱氨基)活性、甘油酸脱羧酶活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性、甘油酸2-激酶活性和乙醛酸还原酶活性。
在一些实施方案中,该方法允许通过C2途径中乙醇醛的转化生产MEG,并通过一种或多种C3途径中G3P的转化生产一种或多种联产品。在其他实施方案中,一种或多种联产品选自丙酮、异丙醇、丙烯、异丁烯和一种或多种丝氨酸途径化合物。在一些优选的实施方案中,一种或多种丝氨酸途径化合物选自丝氨酸、甘氨酸、单乙醇胺(MEA)和乙二胺(EDA)。
在一些实施方案中,用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的至少一种酶选自至少一种具有选自以下的活性的酶:硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A:乙酰乙酸转移酶或乙酸:乙酰乙酰辅酶A水解酶活性和乙酰乙酸脱羧酶活性,并且一种或多种联产品包括丙酮。
在一些实施方案中,用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶:硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A:乙酰乙酸转移酶或乙酸:乙酰乙酰辅酶A水解酶活性、乙酰乙酸脱羧酶活性和仲醇脱氢酶活性,并且一种或多种联产品包含异丙醇。
在一些实施方案中,用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶:硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A:乙酰乙酸转移酶或乙酸:乙酰乙酰辅酶A水解酶活性、乙酰乙酸脱羧酶活性、仲醇脱氢酶活性和脱水酶活性,并且一种或多种联产品包含丙烯。
在一些实施方案中,用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶:硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A:乙酰乙酸转移酶或乙酸:乙酰乙酰辅酶A水解酶活性、乙酰乙酸脱羧酶活性、3-羟基异戊酸(3HIV)合酶活性、羟甲基戊二酰辅酶A合酶活性、甲基戊烯二酰辅酶A水合酶活性、甲基巴豆酰辅酶A羧化酶活性、甲基巴豆酰辅酶A水合酶活性、3-羟基异戊酰辅酶A硫酯酶活性、3HIV激酶活性、3HIV-3-磷酸脱羧酶活性和3HIV脱羧酶活性,并且一种或多种联产品包含异丁烯。
在一些实施方案中,用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶:3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性和甘油酸2-激酶活性,并且一种或多种联产品包含L-丝氨酸。
在一些实施方案中,用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶:丝氨酸羟甲基转移酶活性、转移酶活性、甲醛脱氢酶活性、甲酸脱氢酶活性、与甘氨酸裂解系统相关的活性、3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、丝氨酸转氨酶活性、羟基丙酮酸脱羧酶活性、丝氨酸氧化还原酶(脱氨基)活性、丝氨酸脱羧酶活性、乙醇胺转氨酶或乙醇胺氧化还原酶(脱氨基)活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性、甘油酸2-激酶活性、乙醇醛脱氢酶活性、乙醇酸脱氢酶活性、丙氨酸-乙醛酸转氨酶活性、丙氨酸转氨酶活性和NAD(P)H依赖性谷氨酸脱氢酶活性,并且一种或多种联产品包含甘氨酸。在另一个实施方案中,与甘氨酸裂解系统相关的活性包含选自以下的酶或蛋白:甘氨酸脱羧酶(P蛋白)、氨甲基转移酶(T蛋白)、二氢硫辛酰胺脱氢酶(L蛋白)和H蛋白。
在一些实施方案中,用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶:3-磷酸甘油酸脱氢酶活性、3-磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、转氨酶活性、羟基丙酮酸脱羧酶活性、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶活性、丝氨酸脱羧酶活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性、甘油酸2-激酶活性、乙醛脱氢酶活性和乙醇胺解氨酶活性,并且一种或多种联产品包含单乙醇胺(MEA)。
在一些实施方案中,用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶:丝氨酸脱氢酶活性、2-氨基丙二酸半醛脱羧酶活性、氨基乙醛转氨酶活性、2-氨基丙二酸半醛转氨酶活性、2,3-二氨基丙酸脱羧酶活性、丝氨酸脱羧酶活性、乙醇胺脱氢酶活性、丝氨酸羟甲基转移酶活性、醛氧化酶活性、N-乙酰转移酶或O-乙酰转移酶活性、N-乙酰丝氨酸脱氢酶活性、转氨酶活性、脱乙酰酶活性、丝氨酸氨基酶活性和2,3-二氨基丙酸解氨酶活性,并且一种或多种联产品包含乙二胺(EDA)。
在上述任何方法的一些实施方案中,所述方法进一步包含向重组微生物中引入一种或多种修饰,以减少或缺失乙醇醛还原酶、乙醇醛脱氢酶、乳酸脱氢酶或其组合的活性。
在一个实施方案中,至少一部分在C3途径中生产的过量NADH用作C2途径中还原当量的来源。在另一个实施方案中,至少一部分在C3途径中生产的过量NADH用于生产ATP。
在一个实施方案中,最小化过量的生物质形成,并且最大化MEG或乙醇酸、或MEG和一种或多种联产品的生产。
戊糖和/或己糖转化为戊糖磷酸中间体,随后戊糖磷酸中间体转化为乙醇醛和D-甘油醛3-磷酸
在本公开中,戊糖和/或己糖转化为非氧化磷酸戊糖途径的中间体戊糖磷酸,其中所述戊糖磷酸中间体是D-核糖-5-磷酸、D-核酮糖-5-磷酸或D-木酮糖-5-磷酸。然后,戊糖磷酸中间体作为戊糖磷酸醛缩酶的底物,其中所述醛缩酶具有D-核糖-5-磷酸醛缩酶活性、D-核酮糖-5-磷酸醛缩酶活性或D-木酮糖-5-磷酸醛缩酶活性,以生产乙醇醛和D-甘油醛3-磷酸,这些化合物然后可以进一步转化为MEG或GA、或MEG和一种或多种联产品。
[mA]因此,在一个实施方案中,本申请涉及能够由一种或多种戊糖和/或己糖通过戊糖磷酸中间体生产乙醇醛和D-甘油醛3-磷酸(G3P)的重组微生物的生产方法,其中所述方法包括向重组微生物中引入或在重组微生物中表达以下(a)至(h)中的一种或多种:
(a)至少一种内源性或外源性核酸分子,其编码具有转酮醇酶活性的酶,该酶催化D-果糖-6-磷酸和D-甘油醛-3-磷酸分别可逆转化为D-赤藓糖-4-磷酸和D-木酮糖-5-磷酸,和/或催化来自(b)的D-甘油醛-3-磷酸和来自(b)的D-景天庚酮糖-7-磷酸分别可逆转化为D-核糖-5-磷酸和D-木酮糖-5-磷酸;
(b)至少一种内源性或外源性核酸分子,其编码具有转醛醇酶活性的酶,该酶催化来自(a)的D-果糖-6-磷酸和D-赤藓糖-4-磷酸分别可逆转化为D-甘油醛-3-磷酸和D-景天庚酮糖-7-磷酸;
(c)至少一种内源性或外源性核酸分子,其编码具有核酮糖-5-磷酸3-差向异构酶活性的酶,该酶催化来自(a)和/或(f)的D-木酮糖-5-磷酸和D-核酮糖-5-磷酸的相互转化;
(d)至少一种内源性或外源性核酸分子,其编码具有核糖-5-磷酸异构酶活性的酶,该酶催化来自(c)的D-核酮糖-5-磷酸和D-核糖-5-磷酸的相互转化;
(e)至少一种内源性或外源性核酸分子,其编码具有木糖异构酶活性的酶,该酶催化D-木糖转化为D-木酮糖;
(f)至少一种内源性或外源性核酸分子,其编码具有木酮糖5-激酶活性的酶,该酶催化D-木酮糖转化为D-木酮糖-5-磷酸;
(g)至少一种内源性或外源性核酸分子,其编码具有果糖1,6-二磷酸酶活性的酶,该酶催化D-果糖1,6-二磷酸转化为D-果糖6-磷酸;
(h)至少一种内源性或外源性核酸分子,其编码具有D-核糖5-磷酸醛缩酶活性的酶,该酶催化来自(a)和/或(d)的D-核糖-5-磷酸转化为乙醇醛和D-甘油醛-3-磷酸;
其中该方法任选地进一步包括向编码甘油醛3-磷酸脱氢酶和/或磷酸甘油酸激酶和/或磷酸甘油酸变位酶的基因中引入缺失、插入或功能缺失突变;
其中,一种或多种戊糖和/或己糖能够在重组微生物的非氧化磷酸戊糖途径中转化为一种或多种中间体,
并且其中生产乙醇醛和D-甘油醛-3-磷酸(G3P)。
[mB]在另一个实施方案中,本申请涉及能够由一种或多种戊糖和/或己糖通过戊糖磷酸中间体生产乙醇醛和D-甘油醛3-磷酸(G3P)的重组微生物的生产方法,其中所述方法包括向重组微生物中引入或在重组微生物中表达以下(a)至(j)中的一种或多种:
(a)至少一种内源性或外源性核酸分子,其编码具有果糖-6-磷酸磷酸酮醇酶活性的酶,该酶催化D-果糖-6-磷酸可逆转化为D-赤藓糖-4-磷酸和乙酰磷酸;
(b)至少一种内源性或外源性核酸分子,其编码具有磷酸乙酰转移酶活性的酶,该酶催化来自(a)的乙酰磷酸可逆转化为乙酰辅酶A;
(c)至少一种内源性或外源性核酸分子,其编码具有转醛醇酶活性的酶,该酶催化来自(a)的D-果糖-6-磷酸和D-赤藓糖-4-磷酸分别可逆转化为D-甘油醛-3-磷酸和D-景天庚酮糖-7-磷酸;
(d)至少一种内源性或外源性核酸分子,其编码具有转酮醇酶活性的酶,该酶催化来自(c)的D-甘油醛-3-磷酸和来自(c)的D-景天庚酮糖-7-磷酸分别可逆转化为D-核糖-5-磷酸和D-木酮糖-5-磷酸;
(e)至少一种内源性或外源性核酸分子,其编码具有核酮糖-5-磷酸3-差向异构酶活性的酶,该酶催化来自(d)和/或(h)的D-木酮糖-5-磷酸和D-核酮糖-5-磷酸的相互转化;
(f)至少一种内源性或外源性核酸分子,其编码具有核糖-5-磷酸异构酶活性的酶,该酶催化来自(e)的D-核酮糖-5-磷酸和D-核糖-5-磷酸的相互转化;
(g)至少一种内源性或外源性核酸分子,其编码具有木糖异构酶活性的酶,该酶催化D-木糖转化为D-木酮糖;
(h)至少一种内源性或外源性核酸分子,其编码具有木酮糖5-激酶活性的酶,该酶催化D-木酮糖转化为D-木酮糖-5-磷酸;
(i)至少一种内源性或外源性核酸分子,其编码具有果糖1,6-二磷酸酶活性的酶,该酶催化D-果糖1,6-二磷酸转化为D-果糖6-磷酸;
(j)至少一种内源性或外源性核酸分子,其编码具有D-核糖5-磷酸醛缩酶活性的酶,该酶催化来自(d)和/或(f)的D-核糖-5-磷酸转化为乙醇醛和D-甘油醛-3-磷酸;
其中所述方法任选地进一步包括向编码6-磷酸果糖激酶的基因中引入缺失、插入或功能缺失突变;
其中,一种或多种戊糖和/或己糖能够在重组微生物的非氧化磷酸戊糖途径中转化为一种或多种中间体,
其中步骤(b)中产生的乙酰辅酶A可以用于生产一种或多种联产品,所述联产品选自乙醇酸、丙酮、异丙醇、丙烯、异丁烯和一种或多种丝氨酸途径化合物;
并且其中生产乙醇醛和D-甘油醛-3-磷酸(G3P)。
在一些实施方案中,磷酸戊糖途径的氧化分支被删除或失活,以优化糖流向非氧化性进入磷酸戊糖途径。
[mC]因此,在一个实施方案中,实施方案[mA]或实施方案[mB]的方法任选地进一步包含引入一种或多种选自以下的修饰:
(i)编码葡萄糖6-磷酸-1-脱氢酶的基因中的缺失、插入或功能缺失突变,该酶催化葡萄糖-6-磷酸转化为6-磷酸-D-葡萄糖酸-1,5-内酯;
(ii)编码6-磷酸葡萄糖酸内酯酶的基因中的缺失、插入或功能缺失突变,该酶催化6-磷酸-D-葡萄糖酸-1,5-内酯转化为葡萄糖酸-6-磷酸;和
(iii)编码6-磷酸葡萄糖酸脱氢酶的基因中的缺失、插入或功能缺失突变,该酶催化葡萄糖酸-6-磷酸转化为D-核酮糖-5-磷酸。
MEG或乙醇酸、或MEG和联产品的生产途径
在一些实施方案中,由实施方案[mA]或由实施方案[mB](并且任选地包括实施方案[mC])生产的乙醇醛和甘油醛-3-磷酸中间体用于已知的MEG(或乙醇酸)C2生产途径,该途径与C3途径偶联,如下所述,以联产额外的MEG(或乙醇酸)和/或一种或多种联产品。
在一些实施方案中,通过C2途径生产MEG,该途径使用具有乙醇醛还原酶活性的酶将乙醇醛转化为MEG。在另一个实施方案中,通过C2途径生产乙醇酸(GA),该途径使用具有乙醇醛脱氢酶活性的酶将乙醇醛氧化为GA。
[mD]在一个实施方案中,本申请涉及能够由一种或多种戊糖和/或己糖生产单乙二醇(MEG)的重组微生物的生产方法,其中实施方案[mA]或实施方案[mB](并且任选地包括实施方案[mC])的方法进一步包括向重组微生物中引入或在重组微生物中表达:至少一种内源性或外源性核酸分子,其编码具有乙醇醛还原酶活性的酶,该酶催化乙醇醛转化为MEG,其中所述重组微生物任选地进一步在编码乙醇醛脱氢酶的基因中包含缺失、插入或功能缺失突变,并且其中生产MEG。
[mE]在一个实施方案中,本申请涉及能够由一种或多种戊糖和/或己糖生产乙醇酸(GA)的重组微生物的生产方法,其中实施方案[mA]或实施方案[mB](并且任选地包括实施方案[mC])的方法进一步包括向重组微生物中引入或在重组微生物中表达:至少一种内源性或外源性核酸分子,其编码具有乙醇醛脱氢酶活性的酶,该酶催化乙醇醛转化为GA,其中所述重组微生物任选地进一步在编码乙醇醛还原酶的基因中包含缺失、插入或功能缺失突变,并且其中生产GA。
通过C2途径生产MEG(或乙醇酸)和通过C3途径生产MEG(或乙醇酸)
一方面,由一种或多种戊糖和/或己糖生产MEG(或乙醇酸)如下:将一种或多种戊糖和/或己糖无损转化为戊糖磷酸中间体,然后将戊糖磷酸中间体转化为乙醇醛和G3P中间体,然后通过C2途径,将乙醇醛中间体转化为MEG(或乙醇酸),以及通过C3途径,将G3P转化为MEG(或乙醇酸)。其中,戊糖磷酸中间体是D-核糖-5-磷酸、D-核酮糖-5-磷酸或D-木酮糖-磷酸。
在一些实施方案中,本申请涉及能够由一种或多种戊糖和/或己糖生产MEG(或乙醇酸)的重组微生物的生产方法,其中实施方案[mA]或实施方案[mB](并且任选地包括实施方案[mC])的、并另外具有在C2途径中生产MEG(或乙醇酸)的实施方案[mD]或实施方案[mE]的方法进一步包含一种或多种生产MEG(或乙醇酸)的C3生物合成途径。
[mK]在一个实施方案中,本申请涉及能够由一种或多种戊糖和/或己糖和一种氮源生产单乙二醇(MEG)(或乙醇酸)的重组微生物的生产方法,其中实施方案[mA]或实施方案[mB](并且任选地包括实施方案[mC])的、并另外具有在C2途径中生产MEG(或乙醇酸)的实施方案[mD]或实施方案[mE]的方法进一步包括向重组微生物中引入或在重组微生物中表达以下(a)至(h)中的一种或多种:
(a)至少一种内源性或外源性核酸分子,其编码具有3-磷酸甘油酸脱氢酶活性的酶,该酶催化3-磷酸甘油酸转化为3-磷酸羟基丙酮酸;
(b)至少一种内源性或外源性核酸分子,其编码具有磷酸丝氨酸转氨酶活性的酶,该酶催化来自(a)的3-磷酸羟基丙酮酸转化为磷酸-L-丝氨酸;
(c)至少一种内源性或外源性核酸分子,其编码具有3-磷酸羟基丙酮酸磷酸酶活性的酶,该酶催化来自(a)的3-磷酸羟基丙酮酸转化为羟基丙酮酸;
(d)至少一种内源性或外源性核酸分子,其编码具有磷酸丝氨酸磷酸酶活性的酶,该酶催化来自(b)的磷酸-L-丝氨酸转化为L-丝氨酸;
(e)至少一种内源性或外源性核酸分子,其编码具有L-丝氨酸转氨酶或丝氨酸氧化酶活性的酶,该酶催化来自(d)的L-丝氨酸转化为羟基丙酮酸;
(f)至少一种内源性或外源性核酸分子,其编码具有羟基丙酮酸脱羧酶活性的酶,该酶催化来自(c)或(e)的羟基丙酮酸转化为乙醇醛;
(g)至少一种内源性或外源性核酸分子,其编码具有乙醇醛还原酶活性的酶,该酶催化来自(f)的乙醇醛转化为MEG;
(h)至少一种内源性或外源性核酸分子,其编码具有乙醇醛脱氢酶活性的酶,该酶催化来自(f)的乙醇醛转化为乙醇酸;
其中来自实施方案[mA]或来自实施方案[mB]的产生的中间体G3P通过重组微生物中的内源性糖酵解转化为3-磷酸甘油酸,并且其中生产MEG(或乙醇酸)。
[mL]在一个实施方案中,本申请涉及能够由一种或多种戊糖和/或己糖和一种氮源生产单乙二醇(MEG)(或乙醇酸)的重组微生物的生产方法,其中实施方案[mA]或实施方案[mB](并且任选地包括实施方案[mC])的、并另外具有在C2途径中生产MEG(或乙醇酸)的实施方案[mD]或实施方案[mE]的方法进一步包括向重组微生物中引入或在重组微生物中表达以下(a)至(j)中的一种或多种:
(a)至少一种内源性或外源性核酸分子,其编码具有2-磷酸甘油酸磷酸酶活性的酶和/或具有甘油酸-2-激酶活性的酶,该酶催化2-磷酸甘油酸转化为甘油酸;
(b)至少一种内源性或外源性核酸分子,其编码具有3-磷酸甘油酸磷酸酶活性的酶或具有甘油酸-3-激酶活性的酶,该酶催化3-磷酸甘油酸转化为甘油酸;
(c)至少一种内源性或外源性核酸分子,其编码具有羟基丙酮酸还原酶活性的酶,该酶催化来自(a)和/或(b)的甘油酸转化为羟基丙酮酸;
(d)至少一种内源性或外源性核酸分子,其编码具有丝氨酸转氨酶活性的酶或具有丝氨酸氧化还原酶(脱氨基)活性的酶,该酶催化L-丝氨酸转化为羟基丙酮酸;
(e)至少一种内源性或外源性核酸分子,其编码具有L-丝氨酸脱羧酶活性的酶,该酶催化L-丝氨酸转化为乙醇胺;
(f)至少一种内源性或外源性核酸分子,其编码具有羟基丙酮酸脱羧酶活性的酶,该酶催化来自(c)和/或(d)的羟基丙酮酸转化为乙醇醛;
(g)至少一种内源性或外源性核酸分子,其编码具有乙醇胺转氨酶或乙醇胺氧化还原酶(脱氨基)活性的酶,该酶催化来自(e)的乙醇胺转化为乙醇醛;
(h)至少一种内源性或外源性核酸分子,其编码具有甘油酸脱羧酶活性的酶,该酶催化来自(a)和/或(b)的甘油酸转化为MEG;
(i)至少一种内源性或外源性核酸分子,其编码具有乙醇醛还原酶活性的酶,该酶催化来自(f)和/或(g)的乙醇醛转化为MEG;
(j)至少一种内源性或外源性核酸分子,其编码具有乙醇醛脱氢酶活性的酶,该酶催化来自(f)和/或(g)的乙醇醛转化为乙醇酸;
其中来自实施方案[mA]或来自实施方案[mB]的产生的中间体G3P通过重组微生物中的内源性糖酵解转化为3-磷酸甘油酸和/或2-磷酸甘油酸,并且其中生产MEG(或乙醇酸)。
另一方面,生产MEG如下:将一种或多种戊糖和/或己糖无损转化为D-核糖-5-磷酸中间体,然后将D-核糖-5-磷酸中间体转化为乙醇醛和D-甘油醛-3-磷酸(G3P)中间体,然后通过C2途径,将乙醇醛中间体转化为MEG,以及通过C3途径,将G3P中间体转化为一种或多种联产品。
通过C2途径联产MEG和通过C3途径联产丙酮、异丙醇、丙烯和/或异丁烯
在一些实施方案中,生产MEG如下:将一种或多种戊糖和/或己糖无损转化为戊糖磷酸中间体,然后将戊糖磷酸中间体转化为乙醇醛和D-甘油醛-3-磷酸(G3P)中间体,然后通过C2途径,将乙醇醛中间体转化为MEG,以及通过C3途径,将G3P中间体转化为丙酮。其中,戊糖磷酸中间体是D-核糖-5-磷酸、D-核酮糖-5-磷酸或D-木酮糖-磷酸。
[mM]在一个实施方案中,本申请涉及能够由一种或多种戊糖和/或己糖联产单乙二醇(MEG)和丙酮的重组微生物的生产方法,其中实施方案[mA]或实施方案[mB](并且任选地包括实施方案[mC])的、并另外具有在C2途径中生产MEG的实施方案[mD]的方法进一步包括向重组微生物中引入或在重组微生物中表达以下(a)至(c)中的一种或多种:
(a)至少一种内源性或外源性核酸分子,其编码具有硫解酶或乙酰辅酶A乙酰转移酶活性的酶,该酶催化乙酰辅酶A转化为乙酰乙酰辅酶A;
(b)至少一种内源性或外源性核酸分子,其编码具有乙酰辅酶A:乙酰乙酸辅酶A转移酶活性的酶或具有乙酸:乙酰乙酰辅酶A水解酶活性的酶,该酶催化来自(a)的乙酰乙酰辅酶A转化为乙酰乙酸;和/或
(c)至少一种内源性或外源性核酸分子,其编码具有乙酰乙酸脱羧酶活性的酶,该酶催化来自(b)的乙酰乙酸转化为丙酮;
其中来自实施方案[mA]和/或实施方案[mB]的产生的中间体G3P通过微生物中的内源性糖酵解转化为乙酰辅酶A,并且其中联产MEG(或乙醇酸)和丙酮。
在一些实施方案中,生产MEG如下:将一种或多种戊糖和/或己糖无损转化为戊糖磷酸中间体,然后将戊糖磷酸中间体转化为乙醇醛和D-甘油醛-3-磷酸(G3P)中间体,然后通过C2途径,将乙醇醛中间体转化为MEG,以及通过C3途径,将G3P中间体转化为异丁烯,其中戊糖磷酸中间体是D-核糖-5-磷酸、D-核酮糖-5-磷酸或D-木酮糖-5-磷酸。
[mN]在一些实施方案中,本申请涉及能够由一种或多种戊糖和/或己糖联产单乙二醇(MEG)和异丁烯的重组微生物的生产方法,其中实施方案[mA]或实施方案[mB](并且任选地包括实施方案[mC])的、并另外具有在C2途径中生产MEG的实施方案[mD]的方法进一步包括向重组微生物中引入或在重组微生物中表达以下(a)至(d)中的一种或多种:
(a)至少一种内源性或外源性核酸分子,其编码具有硫解酶或乙酰辅酶A乙酰转移酶活性的酶,该酶催化乙酰辅酶A转化为乙酰乙酰辅酶A;
(b)至少一种内源性或外源性核酸分子,其编码具有乙酰辅酶A:乙酰乙酸辅酶A转移酶活性的酶或具有乙酸:乙酰乙酰辅酶A水解酶活性的酶,该酶催化来自(a)的乙酰乙酰辅酶A转化为乙酰乙酸;
(c)至少一种内源性或外源性核酸分子,其编码具有乙酰乙酸脱羧酶活性的酶,该酶催化来自(b)的乙酰乙酸转化为丙酮;
(d)至少一种内源性或外源性核酸分子,其编码具有3-羟基异戊酸合酶活性的酶,该酶催化来自(c)的丙酮和乙酰辅酶A转化为3-羟基异戊酸(3HIV);
其中所述方法包括向重组微生物中引入或在重组微生物中表达以下(e)至(j)中的一种或多种:
(e)至少一种内源性或外源性核酸分子,其编码具有硫解酶或乙酰辅酶A乙酰转移酶活性的酶,该酶催化乙酰辅酶A转化为乙酰乙酰辅酶A;
(f)至少一种内源性或外源性核酸分子,其编码具有羟甲基戊二酰辅酶A合酶活性的酶,该酶催化来自(e)的乙酰乙酰辅酶A和乙酰辅酶A转化为3-羟基-3-甲基戊二酰辅酶A(HMG-CoA);
(g)至少一种内源性或外源性核酸分子,其编码具有甲基戊烯二酰辅酶A水合酶活性的酶,该酶催化来自(f)的HMG-CoA转化为3-甲基戊烯二酰辅酶A;
(h)至少一种内源性或外源性核酸分子,其编码具有甲基巴豆酰辅酶A羧化酶活性的酶,该酶催化来自(g)的3-甲基戊烯二酰辅酶A转化为3-甲基巴豆酰辅酶A;
(i)至少一种内源性或外源性核酸分子,其编码具有甲基巴豆酰辅酶A水合酶活性的酶,该酶催化来自(h)的3-甲基巴豆酰辅酶A转化为3-羟基异戊酰辅酶A;
(j)至少一种内源性或外源性核酸分子,其编码具有3-羟基异戊酰辅酶A硫酯酶活性的酶,该酶催化来自(i)的3-羟基异戊酰辅酶A转化为3HIV;
其中所述方法进一步包括向重组微生物中引入或在重组微生物中表达(a1)和(a2)和/或(b1),选自:
(a1)至少一种内源性或外源性核酸分子,其编码具有3HIV激酶活性的酶,该酶催化来自(d)或(j)的3HIV转化为3HIV-3-磷酸;
(a2)至少一种内源性或外源性核酸分子,其编码具有3HIV-3-磷酸脱羧酶活性的酶,该酶催化来自(a1)的3HIV-3-磷酸转化为异丁烯;
(b1)至少一种内源性或外源性核酸分子,其编码具有3HIV脱羧酶活性的酶,该酶催化来自(d)或(j)的3HIV转化为乙醇醛;
其中来自实施方案[mA]和/或实施方案[mB]的产生的中间体G3P通过微生物中的内源性糖酵解转化为乙酰辅酶A,并且其中联产MEG和异丁烯。
在一些实施方案中,生产MEG如下:将一种或多种戊糖和/或己糖无损转化为D-核糖-5-磷酸中间体,然后将D-核糖-5-磷酸中间体转化为乙醇醛和D-甘油醛-3-磷酸(G3P)中间体,然后通过C2途径,将乙醇醛中间体转化为MEG,以及通过C3途径,将G3P中间体转化为异丙醇。
[mO]在一个实施方案中,实施方案[mM]和/或[mN](任选地包括实施方案[mEE])的方法任选地进一步包括向重组微生物中引入或在重组微生物中表达至少一种内源性或外源性核酸分子,其编码具有仲醇脱氢酶活性的酶,该酶催化丙酮转化为异丙醇。
在一些实施方案中,生产MEG如下:将一种或多种戊糖和/或己糖无损转化为戊糖磷酸中间体,然后将戊糖磷酸中间体转化为乙醇醛和D-甘油醛-3-磷酸(G3P)中间体,然后通过C2途径,将乙醇醛中间体转化为MEG,以及通过C3途径,将G3P中间体转化为丙烯。其中,戊糖磷酸中间体是D-核糖-5-磷酸、D-核酮糖-5-磷酸或D-木酮糖-磷酸。
[mP]在另一个实施方案中,实施方案[mO](任选地包括实施方案[mEE])的方法任选地进一步包含至少一种内源性或外源性核酸分子,其编码具有脱水酶活性的酶,该酶催化异丙醇转化为丙烯。
通过C2途径联产MEG和通过C3途径联产一种或多种丝氨酸途径化合物
在一些实施方案中,联产MEG和L-丝氨酸如下:将一种或多种戊糖和/或己糖无损转化为戊糖磷酸中间体,然后将戊糖磷酸中间体转化为乙醇醛和D-甘油醛-3-磷酸(G3P)中间体,然后通过C2途径,将乙醇醛中间体转化为MEG,以及通过一个或多个C3途径,将G3P中间体转化为L-丝氨酸。其中,戊糖磷酸中间体是D-核糖-5-磷酸、D-核酮糖-5-磷酸或D-木酮糖-磷酸。
[mQ]在一个实施方案中,本申请涉及能够由一种或多种戊糖和/或己糖和一种氮源联产单乙二醇(MEG)和L-丝氨酸的重组微生物的生产方法,其中实施方案[mA]或实施方案[mB](并且任选地包括实施方案[mC])的、并另外具有在C2途径中生产MEG的实施方案[mD]的方法进一步包括向重组微生物中引入或在重组微生物中表达以下(a)至(h)中的一种或多种:
(a)至少一种内源性或外源性核酸分子,其编码具有3-磷酸甘油酸脱氢酶活性的酶,该酶催化3-磷酸甘油酸转化为3-磷酸羟基丙酮酸;
(b)至少一种内源性或外源性核酸分子,其编码具有3-磷酸甘油酸磷酸酶活性的酶和/或具有甘油酸3-激酶活性的酶,该酶催化3-磷酸甘油酸转化为甘油酸;
(c)至少一种内源性或外源性核酸分子,其编码具有2-磷酸甘油酸磷酸酶活性的酶和/或具有甘油酸2-激酶活性的酶,该酶催化2-磷酸甘油酸转化为甘油酸;
(d)至少一种内源性或外源性核酸分子,其编码具有磷酸丝氨酸转氨酶活性的酶,该酶催化来自(a)的3-磷酸羟基丙酮酸转化为磷酸-L-丝氨酸;
(e)至少一种内源性或外源性核酸分子,其编码具有3-磷酸羟基丙酮酸磷酸酶活性的酶,该酶催化来自(a)的3-磷酸羟基丙酮酸转化为羟基丙酮酸;
(f)至少一种内源性或外源性核酸分子,其编码具有磷酸丝氨酸磷酸酶活性的酶,该酶催化来自(d)的磷酸-L-丝氨酸转化为L-丝氨酸;
(g)至少一种内源性或外源性核酸分子,其编码具有羟基丙酮酸还原酶活性的酶,该酶催化来自(b)和/或(c)的甘油酸转化为羟基丙酮酸;
(h)至少一种内源性或外源性核酸分子,其编码具有丝氨酸-丙酮酸转氨酶活性的酶,该酶催化来自(e)和/或(g)的羟基丙酮酸转化为L-丝氨酸;
其中来自实施方案[mA]或来自实施方案[mB]的产生的中间体G3P通过微生物中的内源性糖酵解转化为3-磷酸甘油酸和/或2-磷酸甘油酸,并且其中生产MEG和L-丝氨酸。
在一些实施方案中,联产MEG和甘氨酸如下:将一种或多种戊糖和/或己糖无损转化为戊糖磷酸中间体,然后将戊糖磷酸中间体转化为乙醇醛和D-甘油醛-3-磷酸(G3P)中间体,然后通过C2途径,将乙醇醛中间体转化为MEG,以及通过一种或多种C3途径,将G3P中间体转化为甘氨酸。其中,戊糖磷酸中间体是D-核糖-5-磷酸、D-核酮糖-5-磷酸或D-木酮糖-磷酸。
[mR]在一个实施方案中,本申请涉及能够由一种或多种戊糖和/或己糖和一种氮源联产单乙二醇(MEG)和甘氨酸的重组微生物的生产方法,其中实施方案[mA]或实施方案[mB](并且任选地包括实施方案[mC])的、并另外具有在C2途径中生产MEG的实施方案[mD]的方法进一步包括向重组微生物中引入或在重组微生物中表达以下(a)至(e)中的一种或多种:
(a)至少一种内源性或外源性核酸分子,其编码具有丝氨酸羟甲基转移酶活性的酶,该酶催化L-丝氨酸和四氢叶酸(THF)转化为甘氨酸和5,10-亚甲基四氢叶酸(M-THF);
(b)至少一种内源性或外源性核酸分子,其编码具有转移酶活性的酶,该酶催化来自(a)的M-THF转化为甲醛;
(c)至少一种内源性或外源性核酸分子,其编码具有甲醛脱氢酶活性的酶,该酶催化来自(b)的甲醛转化为甲酸和NADH;
(d)至少一种内源性或外源性核酸分子,其编码具有甲酸脱氢酶活性的酶,该酶催化来自(c)的甲酸转化为CO2和NADH;
(e)至少一种内源性或外源性核酸分子,其编码甘氨酸裂解系统的蛋白质,该蛋白质催化来自(a)的M-THF、CO2、NH3和来自(c)或(d)的NADH转化为甘氨酸和THF;
其中THF由步骤(b)至(e)重构,其中任选地来自(c)的甲酸被甲酸氢解酶复合物进一步氧化为CO2和H2,并且其中生产MEG和甘氨酸。
[mS]在一个实施方案中,本申请涉及能够由一种或多种戊糖和/或己糖和一种氮源联产单乙二醇(MEG)和甘氨酸的重组微生物的生产方法,其中来自实施方案[mA]或来自实施方案[mB](并且任选地包括实施方案[mC])、并另外具有在C2途径中生产MEG的实施方案[mD]的重组微生物进一步包括向重组微生物中引入或在重组微生物中表达以下(a)至(k)中的一种或多种:
(a)至少一种内源性或外源性核酸分子,其编码具有3-磷酸甘油酸脱氢酶活性的酶,该酶催化3-磷酸甘油酸转化为3-磷酸羟基丙酮酸;
(b)至少一种内源性或外源性核酸分子,其编码具有磷酸丝氨酸转氨酶活性的酶,该酶催化来自(a)的3-磷酸羟基丙酮酸转化为磷酸-L-丝氨酸;
(c)至少一种内源性或外源性核酸分子,其编码具有3-磷酸羟基丙酮酸磷酸酶活性的酶,该酶催化来自(a)的3-磷酸羟基丙酮酸转化为羟基丙酮酸;
(d)至少一种内源性或外源性核酸分子,其编码具有磷酸丝氨酸磷酸酶活性的酶,该酶催化来自(b)的磷酸-L-丝氨酸转化为L-丝氨酸;
(e)至少一种内源性或外源性核酸分子,其编码具有L-丝氨酸转氨酶或丝氨酸氧化酶活性的酶,该酶催化来自(d)的L-丝氨酸转化为羟基丙酮酸;
(f)至少一种内源性或外源性核酸分子,其编码具有羟基丙酮酸脱羧酶活性的酶,该酶催化来自(c)或(e)的羟基丙酮酸转化为乙醇醛;
(g)至少一种内源性或外源性核酸分子,其编码具有乙醇醛脱氢酶活性的酶,该酶催化来自(f)的乙醇醛转化为乙醇酸;
(h)至少一种内源性或外源性核酸分子,其编码具有乙醇酸脱氢酶活性的酶,该酶催化来自(g)的乙醇酸转化为乙醛酸;
(i)至少一种内源性或外源性核酸分子,其编码具有丙氨酸-乙醛酸转氨酶活性的酶,该酶催化来自(h)的乙醛酸和丙氨酸转化为甘氨酸和丙酮酸;
(j)至少一种内源性或外源性核酸分子,其编码具有丙氨酸转氨酶活性的酶,该酶催化来自(i)的丙酮酸和谷氨酸转化为丙氨酸和2-氧代戊二酸;
(k)至少一种内源性或外源性核酸分子,其编码具有NAD(P)H依赖性谷氨酸脱氢酶活性的酶,该酶催化来自(j)的2-氧代戊二酸和氨转化为谷氨酸;
其中来自实施方案[mA]或来自实施方案[mB]的产生的中间体G3P通过微生物中的内源性糖酵解转化为3-磷酸甘油酸和/或2-磷酸甘油酸,其中丙氨酸和谷氨酸由步骤(j)和(k)重构,并且其中联产MEG和甘氨酸。
[mT]在一个实施方案中,本申请涉及能够由一种或多种戊糖和/或己糖和一种氮源联产单乙二醇(MEG)和甘氨酸的重组微生物的生产方法,其中来自实施方案[mA]或来自实施方案[mB](并且任选地包括实施方案[mC])、并另外具有在C2途径中生产MEG的实施方案[mD]的重组微生物进一步包括向重组微生物中引入或在重组微生物中表达以下(a)至(l)中的一种或多种:
(a)至少一种内源性或外源性核酸分子,其编码具有2-磷酸甘油酸磷酸酶活性的酶和/或具有甘油酸-2-激酶活性的酶,该酶催化2-磷酸甘油酸转化为甘油酸;
(b)至少一种内源性或外源性核酸分子,其编码具有3-磷酸甘油酸磷酸酶活性的酶和/或具有甘油酸-3-激酶活性的酶,该酶催化3-磷酸甘油酸转化为甘油酸;
(c)至少一种内源性或外源性核酸分子,其编码具有羟基丙酮酸还原酶活性的酶,该酶催化来自(a)和/或(b)的甘油酸转化为羟基丙酮酸;
(d)至少一种内源性或外源性核酸分子,其编码具有丝氨酸转氨酶或丝氨酸氧化还原酶(脱氨基)活性的酶,该酶催化L-丝氨酸转化为羟基丙酮酸;
(e)至少一种内源性或外源性核酸分子,其编码具有L-丝氨酸脱羧酶活性的酶,该酶催化L-丝氨酸转化为乙醇胺;
(f)至少一种内源性或外源性核酸分子,其编码具有羟基丙酮酸脱羧酶活性的酶,该酶催化来自(c)和/或(d)的羟基丙酮酸转化为乙醇醛;
(g)至少一种内源性或外源性核酸分子,其编码具有乙醇胺转氨酶活性的酶或具有乙醇胺氧化还原酶(脱氨基)活性的酶,该酶催化来自(e)的乙醇胺转化为乙醇醛;
(h)至少一种内源性或外源性核酸分子,其编码具有乙醇醛脱氢酶活性的酶,该酶催化来自(f)和/或(g)的乙醇醛转化为乙醇酸;
(i)至少一种内源性或外源性核酸分子,其编码具有乙醇酸脱氢酶活性的酶,该酶催化来自(g)的乙醇酸转化为乙醛酸;
(j)至少一种内源性或外源性核酸分子,其编码具有丙氨酸-乙醛酸转氨酶活性的酶,该酶催化来自(i)的乙醛酸和丙氨酸转化为甘氨酸和丙酮酸;
(k)至少一种内源性或外源性核酸分子,其编码具有丙氨酸转氨酶活性的酶,该酶催化来自(j)的丙酮酸和谷氨酸转化为丙氨酸和2-氧代戊二酸;
(l)至少一种内源性或外源性核酸分子,其编码具有NAD(P)H依赖性谷氨酸脱氢酶活性的酶,该酶催化来自(k)的2-氧代戊二酸和氨转化为谷氨酸;
其中来自实施方案[mA]或来自实施方案[mB]的产生的中间体G3P通过微生物中的内源性糖酵解转化为3-磷酸甘油酸和/或2-磷酸甘油酸,其中丙氨酸和谷氨酸由步骤(k)和(l)重构,并且其中联产MEG和甘氨酸。
在一些实施方案中,联产MEG和MEA如下:将一种或多种戊糖和/或己糖无损转化为戊糖磷酸中间体,然后将戊糖磷酸中间体转化为乙醇醛和D-甘油醛-3-磷酸(G3P)中间体,然后通过C2途径,将乙醇醛中间体转化为MEG,以及通过一种或多种C3途径,将G3P中间体转化为MEA。其中,戊糖磷酸中间体是D-核糖-5-磷酸、D-核酮糖-5-磷酸或D-木酮糖-磷酸。
[mU]在一个实施方案中,本申请涉及能够由一种或多种戊糖和/或己糖和一种氮源联产单乙二醇(MEG)和MEA的重组微生物的生产方法,其中实施方案[mA]或实施方案[mB](并且任选地包括实施方案[mC])的、并另外具有在C2途径中生产MEG的实施方案[mD]的方法进一步包括向重组微生物中引入或在重组微生物中表达以下(a)至(i)中的一种或多种:
(a)至少一种内源性或外源性核酸分子,其编码具有3-磷酸甘油酸脱氢酶活性的酶,该酶催化3-磷酸甘油酸转化为3-磷酸羟基丙酮酸;
(b)至少一种内源性或外源性核酸分子,其编码具有3-磷酸甘油酸磷酸酶活性的酶和/或具有甘油酸3-激酶活性的酶,该酶催化3-磷酸甘油酸转化为甘油酸;
(c)至少一种内源性或外源性核酸分子,其编码具有2-磷酸甘油酸磷酸酶活性的酶和/或具有甘油酸2-激酶活性的酶,该酶催化2-磷酸甘油酸转化为甘油酸;
(d)至少一种内源性或外源性核酸分子,其编码具有磷酸丝氨酸转氨酶活性的酶,该酶催化来自(a)的3-磷酸羟基丙酮酸转化为磷酸-L-丝氨酸;
(e)至少一种内源性或外源性核酸分子,其编码具有3-磷酸羟基丙酮酸磷酸酶活性的酶,该酶催化来自(a)的3-磷酸羟基丙酮酸转化为羟基丙酮酸;
(f)至少一种内源性或外源性核酸分子,其编码具有磷酸丝氨酸磷酸酶活性的酶,该酶催化来自(d)的磷酸-L-丝氨酸转化为L-丝氨酸;
(g)至少一种内源性或外源性核酸分子,其编码具有羟基丙酮酸还原酶活性的酶,该酶催化来自(b)和/或(c)的甘油酸转化为羟基丙酮酸;
(h)至少一种内源性或外源性核酸分子,其编码具有丝氨酸-丙酮酸转氨酶活性的酶,该酶催化来自(e)和/或(g)的羟基丙酮酸转化为L-丝氨酸;
(i)至少一种内源性或外源性核酸分子,其编码具有丝氨酸脱羧酶活性的酶,该酶催化来自(f)和/或(h)的L-丝氨酸转化为MEA;
其中来自实施方案[mA]或来自实施方案[mB]的产生的中间体G3P通过微生物中的内源性糖酵解转化为3-磷酸甘油酸和/或2-磷酸甘油酸,并且其中联产MEG和MEA。
[mV]在一个实施方案中,本申请涉及能够由一种或多种戊糖和/或己糖和一种氮源联产单乙二醇(MEG)和MEA的重组微生物的生产方法,其中实施方案[mA]或实施方案[mB](并且任选地包括实施方案[mC])的、并另外具有在C2途径中生产MEG的实施方案[mD]的方法进一步包括向重组微生物中引入或在重组微生物中表达以下(a)至(f)中的一种或多种:
(a)至少一种内源性或外源性核酸分子,其编码具有2-磷酸甘油酸磷酸酶活性的酶和/或具有甘油酸-2-激酶活性的酶,该酶催化2-磷酸甘油酸转化为甘油酸;
(b)至少一种内源性或外源性核酸分子,其编码具有3-磷酸甘油酸磷酸酶活性的酶和/或具有甘油酸-3-激酶活性的酶,该酶催化3-磷酸甘油酸转化为甘油酸;
(c)至少一种内源性或外源性核酸分子,其编码具有羟基丙酮酸还原酶活性的酶,该酶催化来自(a)和/或(b)的甘油酸转化为羟基丙酮酸;
(d)至少一种内源性或外源性核酸分子,其编码具有丝氨酸-丙酮酸转氨酶或丝氨酸氧化还原酶(脱氨基)活性的酶,该酶催化L-丝氨酸转化为羟基丙酮酸;
(e)至少一种内源性或外源性核酸分子,其编码具有羟基丙酮酸脱羧酶活性的酶,该酶催化来自(c)和/或(d)的羟基丙酮酸转化为乙醇醛;
(f)至少一种内源性或外源性核酸分子,其编码具有转氨酶活性的酶,该酶催化来自(e)的乙醇醛转化为MEA;
其中来自实施方案[mA]或来自实施方案[mB]的产生的中间体G3P通过微生物中的内源性糖酵解转化为3-磷酸甘油酸和/或2-磷酸甘油酸,并且其中联产MEG和MEA。
[mW]在一个实施方案中,本申请涉及能够由一种或多种戊糖和/或己糖和一种氮源联产单乙二醇(MEG)和MEA的重组微生物的生产方法,其中实施方案[mA]或实施方案m[B](并且任选地包括实施方案[mC])的、并另外具有在C2途径中生产MEG的实施方案[mD]的方法进一步包括向重组微生物中引入或在重组微生物中表达以下(a)至(b)中的一种或多种:
(a)至少一种内源性或外源性核酸分子,其编码具有乙醛脱氢酶活性的酶,该酶催化乙酰辅酶A转化为乙醛;
(b)至少一种内源性或外源性核酸分子,其编码具有乙醇胺解氨酶活性的酶,该酶催化乙醛和氨转化为MEA;
其中来自实施方案[mA]和/或实施方案[mB]的产生的中间体G3P通过重组微生物中的内源性糖酵解转化为乙酰辅酶A,并且其中联产MEG和MEA。
在一些实施方案中,联产MEG和EDA如下:将一种或多种戊糖和/或己糖无损转化为戊糖磷酸中间体,然后将戊糖磷酸中间体转化为乙醇醛和D-甘油醛-3-磷酸(G3P)中间体,然后通过C2途径,将乙醇醛中间体转化为MEG,以及通过一种或多种C3途径,将G3P中间体转化为EDA。其中,戊糖磷酸中间体是D-核糖-5-磷酸、D-核酮糖-5-磷酸或D-木酮糖-磷酸。
[mX]在一个实施方案中,本申请涉及能够由一种或多种戊糖和/或己糖和一种氮源联产单乙二醇(MEG)和乙二胺(EDA)的重组微生物的生产方法,其中实施方案[mA]或实施方案[mB](并且任选地包括实施方案[mC])的、并另外具有在C2途径中生产MEG的实施方案[mD]的方法进一步包括向重组微生物中引入或在重组微生物中表达以下(a)至(c)中的一种或多种:
(a)至少一种内源性或外源性核酸分子,其编码具有丝氨酸脱氢酶活性的酶,该酶催化L-丝氨酸转化为2-氨基丙二酸半醛;
(b)至少一种内源性或外源性核酸分子,其编码具有2-氨基丙二酸半醛脱羧酶活性的酶,该酶催化来自(a)的2-氨基丙二酸半醛转化为氨基乙醛;
(c)至少一种内源性或外源性核酸分子,其编码具有氨基乙醛转氨酶活性的酶,该酶催化来自(b)的氨基乙醛转化为EDA;
其中2-氨基丙二酸半醛可以任选地通过自发反应转化为氨基乙醛,并且其中联产MEG和EDA。
[mY]在一个实施方案中,本申请涉及能够由一种或多种戊糖和/或己糖和一种氮源联产单乙二醇(MEG)(或乙醇酸)和乙二胺(EDA)的重组微生物的生产方法,其中实施方案[mA]或实施方案[mB](并且任选地包括实施方案[mC])的、并另外具有在C2途径中生产MEG的实施方案[mD]的方法进一步包括向重组微生物中引入或在重组微生物中表达以下(a)至(c)中的一种或多种:
(a)至少一种内源性或外源性核酸分子,其编码具有丝氨酸脱氢酶活性的酶,该酶催化L-丝氨酸转化为2-氨基丙二酸半醛;
(b)至少一种内源性或外源性核酸分子,其编码具有2-氨基丙二酸半醛转氨酶活性的酶,该酶催化来自(a)的2-氨基丙二酸半醛转化为2,3-二氨基丙酸;
(c)至少一种内源性或外源性核酸分子,其编码具有2,3-二氨基丙酸脱羧酶活性的酶,该酶催化来自(b)的2,3-二氨基丙酸转化为EDA;
其中联产MEG和EDA。
[mZ]在一个实施方案中,本申请涉及能够由一种或多种戊糖和/或己糖和一种氮源联产单乙二醇(MEG)(或乙醇酸)和乙二胺(EDA)的重组微生物的生产方法,其中实施方案[mA]或实施方案[mB](并且任选地包括实施方案[mC])的、并另外具有在C2途径中生产MEG的实施方案[mD]的方法进一步包括向重组微生物中引入或在重组微生物中表达以下(a)至(c)中的一种或多种:
(a)至少一种内源性或外源性核酸分子,其编码具有丝氨酸脱羧酶活性的酶,该酶催化L-丝氨酸转化为乙醇胺;
(b)至少一种内源性或外源性核酸分子,其编码具有乙醇胺脱氢酶活性的酶,该酶催化来自(a)的乙醇胺转化为氨基乙醛;
(c)至少一种内源性或外源性核酸分子,其编码具有氨基乙醛转氨酶活性的酶,该酶催化来自(b)的氨基乙醛转化为EDA;
其中联产MEG和EDA。
[mAA]在一个实施方案中,本申请涉及能够由一种或多种戊糖和/或己糖和一种氮源联产单乙二醇(MEG)(或乙醇酸)和乙二胺(EDA)的重组微生物的生产方法,其中实施方案[mA]或实施方案[mB](并且任选地包括实施方案[mC])的、并另外具有在C2途径中生产MEG的实施方案[mD]的方法进一步包括向重组微生物中引入或在重组微生物中表达以下(a)至(c)中的一种或多种:
(a)至少一种内源性或外源性核酸分子,其编码具有丝氨酸羟甲基转移酶活性的酶,该酶催化L-丝氨酸转化为甘氨酸;
(b)至少一种内源性或外源性核酸分子,其编码具有醛氧化酶活性的酶,该酶催化来自(a)的甘氨酸转化为氨基乙醛;
(c)至少一种内源性或外源性核酸分子,其编码具有氨基乙醛转氨酶活性的酶,该酶催化来自(b)的氨基乙醛转化为EDA;
其中联产MEG和EDA。
[mBB]在一个实施方案中,本申请涉及能够由一种或多种戊糖和/或己糖和一种氮源联产单乙二醇(MEG)(或乙醇酸)和乙二胺(EDA)的重组微生物的生产方法,其中实施方案[mA]或实施方案[mB](并且任选地包括实施方案[mC])的、并另外具有在C2途径中生产MEG的实施方案[mD]的方法进一步包括向重组微生物中引入或在重组微生物中表达以下(a)至(e)中的一种或多种:
(a)至少一种内源性或外源性核酸分子,其编码具有氨基酸N-乙酰转移酶活性或O-乙酰转移酶活性的酶,该酶催化L-丝氨酸转化为N-乙酰丝氨酸;
(b)至少一种内源性或外源性核酸分子,其编码具有N-乙酰丝氨酸脱氢酶活性的酶,该酶催化来自(a)的N-乙酰丝氨酸转化为N-乙酰丙二酸半醛;
(c)至少一种内源性或外源性核酸分子,其编码具有转氨酶活性的酶,该酶催化来自(b)的N-乙酰丙二酸半醛转化为乙酰氨基丙酸;
(d)至少一种内源性或外源性核酸分子,其编码具有脱乙酰酶活性的酶,该酶催化来自(c)的乙酰氨基丙酸转化为2,3-二氨基丙酸;
(e)至少一种内源性或外源性核酸分子,其编码具有2,3-二氨基丙酸脱羧酶活性的酶,该酶催化来自(d)的2,3-二氨基丙酸转化为EDA;
其中联产MEG和EDA。
[mCC]在一个实施方案中,本申请涉及能够由一种或多种戊糖和/或己糖和一种氮源联产单乙二醇(MEG)(或乙醇酸)和乙二胺(EDA)的重组微生物的生产方法,其中实施方案[mA]或实施方案[mB](并且任选地包括实施方案[mC])的、并另外具有在C2途径中生产MEG的实施方案[mD]的方法进一步包括向重组微生物中引入或在重组微生物中表达以下(a)至(b)中的一种或多种:
(a)至少一种内源性或外源性核酸分子,其编码具有丝氨酸氨基酶活性的酶,该酶催化L-丝氨酸转化为(S)-2,3-二氨基丙酸;
(b)至少一种内源性或外源性核酸分子,其编码具有(S)-2,3-二氨基丙酸脱羧酶活性的酶,该酶催化来自(a)的(S)-2,3-二氨基丙酸转化为EDA;
其中联产MEG和EDA。
[mDD]在一个实施方案中,本申请涉及能够由一种或多种戊糖和/或己糖和一种氮源联产单乙二醇(MEG)(或乙醇酸)和乙二胺(EDA)的重组微生物的生产方法,其中实施方案[mA]或实施方案[mB](并且任选地包括实施方案[mC])的、并另外具有在C2途径中生产MEG的实施方案[mD]的方法进一步包括向重组微生物中引入或在重组微生物中表达以下(a)至(b)中的一种或多种:
(a)至少一种内源性或外源性核酸分子,其编码具有(S)-2,3-二氨基丙酸解氨酶活性的酶,该酶催化丙酮酸和氨转化为(S)-2,3-二氨基丙酸;
(b)至少一种内源性或外源性核酸分子,其编码具有(S)-2,3-二氨基丙酸脱羧酶活性的酶,该酶催化来自(a)的(S)-2,3-二氨基丙酸转化为EDA;
其中G3P通过重组微生物中的内源性糖酵解转化为丙酮酸,并且其中联产MEG和EDA。
[mEE]在另一个实施方案中,实施方案[mD]或实施方案[mE]的方法任选地进一步包含引入一种或多种选自以下的修饰:
(i)编码乙醇醛还原酶的基因中的缺失、插入或功能缺失突变,该酶催化乙醇醛转化为单乙二醇(MEG);
(ii)编码乙醇醛脱氢酶的基因中的缺失、插入或功能缺失突变,该酶催化乙醇醛转化为乙醇酸;和
(iii)编码乳酸脱氢酶的基因中的缺失、插入或功能缺失突变,该酶催化丙酮酸转化为乳酸。
酶的工程化
可以工程化重组微生物中的酶,以改进底物到产物转化的一个或多个方面。可以进一步工程化以用于本公开的方法的酶的非限制性实例包括:D-核糖-5-磷酸醛缩酶、转酮醇酶、转醛醇酶、醛还原酶、乙酰乙酰辅酶A水解酶、木糖异构酶、3-磷酸甘油酸脱氢酶、磷酸丝氨酸转氨酶、3-磷酸羟基丙酮酸磷酸酶、磷酸丝氨酸磷酸酶、丝氨酸转氨酶、羟基丙酮酸脱羧酶、3-磷酸羟基丙酮酸还原酶、乙醇醛脱氢酶、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶、丝氨酸脱羧酶、乙醇胺转氨酶或乙醇胺氧化还原酶(脱氨基)、甘油酸脱羧酶、羟基丙酮酸还原酶、3-磷酸甘油酸磷酸酶、2-磷酸甘油酸磷酸酶、甘油酸3-激酶、甘油酸2-激酶、甲羟戊酸二磷酸脱羧酶,及其组合。可以工程化这些酶以提高催化活性、提高选择性、提高稳定性、提高对各种发酵条件(温度、pH等)的耐受性、或提高对各种代谢底物、产物、副产物、中间体等的耐受性。如本文所用的关于特定酶活性的术语“改进的催化活性”是指比相对于可比较的非工程化酶测量的酶活性水平更高的酶活性。
定向进化是一个术语,用于描述允许在实验室中模拟自然进化过程的整个范围的分子生物学技术。对于酶,这通常涉及一个或多个起始基因的随机诱变,然后是筛选或选择步骤以分离或富集在一种或多种所需特性方面具有改进的酶变体。可以重复该过程,直到达到所需的变化水平,或者直到不会引发进一步的变化。二十多年来开发了各种工具和技术,将这一过程从自然界花费的数百万年缩短至实验室中的仅数周或数月。最常见的策略模仿自然界中发生的进化机制,如在DNA产物群体中引入随机点突变的易错PCR(error-prone PCR,epPCR),以及允许通常在>70%同源性的亲本基因之间进行随机重组的DNA改组(DNA shuffling)技术。后来的技术通过针对预先选择的位点或随机分布的位点的饱和或盒式诱变,来接触更广泛的氨基酸,并使得非同源基因能够随机重组。进一步的技术可以创建密码子的随机插入和删除、改组结构域或外显子或环区域,并产生随机截短的库。
例如,已将工程化方法用于改变醛缩酶的稳定性、底物特异性和立体特异性,以生产用于生物催化过程的优异的酶。使用来自大肠杆菌和爱德华氏菌(Edwardsiellaictaluri)的fda基因的家族DNA改组,提高了果糖-1,6-二磷酸醛缩酶(FBP-醛缩酶)的热稳定性和溶剂耐受性。鉴定出了第四代变体,其显示出平均比任一亲本高280倍的在53℃的半衰期。相同的变体还在各种极性和非极性有机溶剂中显示出增强的活性(Hao和Berry2004Protein Eng Des Sel 17:689-697)。
作为另一个例子,乙酰乙酰辅酶A水解酶可以将乙酰乙酰辅酶A转化为乙酰乙酸。然而,水解酶是非特异性的,因为其也与乙酰辅酶A发生相同数量级的反应,乙酰辅酶A是硫解酶形成乙酰乙酰辅酶A所需的底物。因此,为了创造更有效的乙酰乙酰辅酶A水解酶,已将这些酶工程化,以具有对乙酰乙酰辅酶A底物比对乙酰辅酶A底物高至少10倍的活性,方法是替换酶β亚基中的数个对催化重要的谷氨酸残基(WO 2015/042588)。
作为另一个例子,大肠杆菌YqhD酶是底物广泛的醛还原酶,对多于10种醛底物具有NADPH依赖性还原酶活性,并且是生产生物可再生燃料和化学品的有用的酶(Jarboe2010Applied Microbiology and Biotechnology 89:249)。虽然YqhD酶活性通过清除有毒的醛而有益,但该酶也是NADPH依赖性的,并促进NADPH的消耗和生物体的生长抑制。对YqhD进行了易错PCR,以提高由3-羟基丙醛(3-HPA)生产1,3-丙二醇的产量。该定向工程化产生了两个突变体D99QN147H和Q202A,对于某些醛(特别是3-HPA)的Km降低、kcat增加(Li等人2008Prog.Nat.Sci.18(12):1519-1524)。D99QN147H突变体的这种改进的催化活性与关于YqhD的结构已知的内容相一致(Sulzenbacher等人2004J.Mol.Biol.342(2):489-502),因为Asp99和Asn147残基均与NADPH相互作用。使用D99QN147H突变体使由3-HPA生产1,3-丙二醇的产量增加了2倍。WO 2011012697 A2中还描述了对NADPH具有增加的催化效率(增加的Kcat/Km)的突变YqhD酶,该专利全文并入本文。
作为另一个例子,木糖异构酶是金属依赖性酶,其催化醛糖和酮糖的相互转化,主要是在木糖至木酮糖和葡萄糖至果糖之间。该酶对来苏糖、阿拉伯糖和甘露糖的亲和力较低。糖的羟基基团可以定义糖异构酶的底物偏好。嗜热栖热菌(Thermus thermophilus)木糖异构酶残基256处的天冬氨酸被替换为精氨酸(Patel等人2012Protein Engineering,Design&Selection vol.25no.7pp.331–336)。该突变木糖异构酶表现出对D-来苏糖、L-阿拉伯糖和D-甘露糖的特异性增加。与野生型酶相比,D256R木糖异构酶突变体对这3种底物的催化效率也更高。假说是突变酶中残基256处的精氨酸可能在催化反应中起作用或影响底物取向的变化。
作为另一个例子,木糖醇脱氢酶与木糖还原酶一起在木糖的利用中起作用。木糖还原酶(XR)将木糖还原为木糖醇,然后木糖醇脱氢酶(XDH)将木糖醇再氧化为木酮糖。然而,由于XR偏好NADPH作为共底物,而XDH只使用NAD+作为共底物,因此遇到了共底物回收问题。一种解决方案是工程化XDH,使其共底物特异性从NAD+改变为NADP+(Ehrensberger等人2006 Structure 14:567-575)。氧化葡萄糖酸杆菌(Gluconobacter oxydans)全酶的晶体结构表明,Asp38主要负责XDH的NAD+特异性。Asp38与腺苷核糖的羟基相互作用,而Met39堆积在嘌呤环下方,也位于2'羟基附近。构建了双突变体(D38S/M39R)XDH,其只使用NADP+而不会损失酶活性。
作为另一个例子,甲羟戊酸二磷酸脱羧酶(MVD)是ATP依赖性酶,其在甲羟戊酸(MVA)途径中催化(R)-甲羟戊酸-5-二磷酸磷酸化/脱羧为异戊烯焦磷酸(IPP)。MVD催化经典MVA途径中的最后一步,在依赖于ATP的不可逆反应中,MVD由该步由(R)-甲羟戊酸-5-二磷酸(MVAPP)产生IPP。MVAPP首先被磷酸化,随后发生脱羧反应,同时释放无机磷酸。经典MVD也以相同的机制催化非磷酸化3-羟基异戊酸(3-HIV)转化为异丁烯。例如在WO2012052427和WO 2015004211中公开了在将3-膦酰氧基异戊酸转化为异丁烯中具有改进活性的甲羟戊酸二磷酸(MDP)脱羧酶变体,这些专利各自以其全文并入本文。
代谢工程-过度表达酶或下调/缺失酶以增加途径的流
在本文所述的各种实施方案中,可以过表达参与本文所述生物合成途径的重组微生物中的外源性和内源性酶。
术语“过表达(overexpressed)”或“过表达(overexpression)”是指与表达基础水平的mRNA或具有基础水平的蛋白质的类似的相应未修饰细胞相比,编码蛋白质的mRNA水平升高(例如,异常水平)和/或细胞中蛋白质水平升高。在具体的实施方案中,在工程化以表现出增加的基因mRNA、蛋白质和/或活性的微生物中,mRNA或蛋白质可以过表达至少2倍、3倍、4倍、5倍、6倍、8倍、10倍、12倍、15倍或更多倍。
在一些实施方案中,本公开的重组微生物生成自包含合成底物的酶活性的宿主,所述底物如D-核糖-5-磷酸、乙醇醛、D-甘油醛-3-磷酸、D-木酮糖、D-核酮糖、D-核酮糖-1-磷酸、D-木酮糖-1-磷酸、D-核酮糖-5-磷酸、D-木酮糖-5-磷酸、D-木糖酸内酯、D-木糖酸、2-酮-3-脱氧-木糖酸、乙醇醛、DHAP、丙酮酸、乙酰乙酰辅酶A、乙酰乙酸或3-羟基异戊酸。在一些实施方案中,增加以下物质的合成或积累可用于增加MEG(或GA)、或MEG和一种或多种联产品的产量:例如D-核糖-5-磷酸、乙醇醛、D-甘油醛-3-磷酸、D-木酮糖、D-核酮糖、D-核酮糖-1-磷酸、D-木酮糖-1-磷酸、D-核酮糖-5-磷酸、D-木酮糖-5-磷酸、D-木糖酸内酯、D-木糖酸、2-酮-3-脱氧-木糖酸、乙醇醛、DHAP、丙酮酸、乙酰乙酰辅酶A、乙酰乙酸或3-羟基异戊酸。
在一些实施方案中,增加涉及MEG(或GA)、或MEG和一种或多种联产品的生物合成途径的内源性或外源性酶的表达,可用于增加来自以下物质的流:例如D-核糖-5-磷酸、乙醇醛、D-甘油醛-3-磷酸、D-木酮糖、D-核酮糖、D-核酮糖-1-磷酸、D-木酮糖-1-磷酸、D-核酮糖-5-磷酸、D-木酮糖-5-磷酸、D-木糖酸内酯、D-木糖酸、2-酮-3-脱氧-木糖酸、乙醇醛、DHAP、丙酮酸、乙酰乙酰辅酶A、乙酰乙酸或3-羟基异戊酸,从而导致MEG(或GA)、或MEG和一种或多种联产品的合成或积累增加。
可以通过例如过表达编码一种或多种上述MEG(或GA)、或MEG和一种或多种联产品的生物合成途径的酶的核酸,来增加合成或积累。可以例如通过增加内源基因的表达,或通过表达外源基因或增加外源基因的表达,使MEG(或GA)、或MEG和一种或多种联产品的生物合成途径的酶发生过表达。因此,可以通过过表达一种或多种编码MEG(或GA)、或MEG和一种或多种联产品的生物合成途径的酶的核酸分子,容易地修饰天然存在的生物体,以生成生产非天然的MEG(或GA)、或MEG和一种或多种联产品的生物体。此外,可以通过内源基因的诱变生成非天然存在的生物体,该诱变导致MEG(或GA)、或MEG和一种或多种联产品的生物合成途径的酶的活性增加。
有了本公开,本领域技术人员将能够容易地构建本文所述的重组微生物,因为本公开内容的重组微生物可以使用本领域众所周知的方法构建,如上文示例,以外源表达至少一种编码MEG(或GA)、或MEG和一种或多种联产品的生物合成途径的酶的核酸,其量足以生产MEG(或GA)、或MEG和一种或多种联产品。
可以通过例如本领域公知的重组和检测方法,实施构建和测试非天然存在的生产MEG(或GA)、或MEG和一种或多种联产品的宿主的表达水平的方法。这样的方法例如描述于Sambrook等人,Molecular Cloning:A Laboratory Manual,第三版,Cold Spring HarborLaboratory,New York(2001);Ausubo等人,Current Protocols in Molecular Biology,John Wiley and Sons,Baltimore,Md.(1999)中。
本领域已知的多种机制可以用于表达或过表达外源性或内源性基因。例如,可以构建一个或多个表达载体以包含一种或多种如本文示例的编码MEG(或GA)、或MEG和一种或多种联产品的生物合成途径的酶的核酸,其可操作连接至在宿主生物体中起作用的表达控制序列。适用于本发明微生物宿主生物的表达载体包括例如质粒、噬菌体载体、病毒载体、附加体(episome)和人工染色体,包括可操作的用于稳定整合至宿主染色体中的载体和选择序列或标记。还可以包括可选择的标记基因,例如,提供对抗生素或毒素的抗性、补充营养缺陷或提供不在培养介质中的关键营养物。表达控制序列可以包括本领域熟知的组成型和诱导型启动子、转录增强子、转录终止子等。当共表达两种或多种外源编码核酸时,可以将两种核酸插入例如单个表达载体中或分开的表达载体中。对于单个载体表达,编码核酸可以与一种共同的表达控制序列可操作连接,或与不同的表达控制序列连接,如一种诱导型启动子和一种组成型启动子。可以使用本领域公知的方法来确认参与代谢或合成途径的外源性核酸序列的转化。
本领域技术人员将理解,可以有利地修饰编码序列,以增强其在特定宿主中的表达。遗传密码是冗余的,有64个可能的密码子,但大多数生物体通常使用这些密码子的一个子集。一个物种中最常利用的密码子称为最佳密码子,那些不太经常利用的密码子分类为稀有或低使用(low-usage)密码子。可以替换密码子以反映宿主偏好的密码子使用,这一过程有时称为“密码子优化”或“物种密码子偏向性控制(controlling for species codonbias)”。
例如,可以制备包含特定原核或真核宿主偏好的密码子的优化编码序列(另见Murray等人(1989)Nucl.Acids Res.17:477-508),以(与由非优化序列产生的转录物相比)提高翻译速度或产生具有所需特性(如更长的半衰期)的重组RNA转录物。还可以修饰翻译终止密码子,以反映宿主偏好。例如,酿酒酵母和哺乳动物的典型终止密码子分别是UAA和UGA。单子叶植物的典型终止密码子是UGA,而昆虫和大肠杆菌通常使用UAA作为终止密码子(Dalphin等人(1996)Nucl.Acids Res.24:216-218)。
本领域技术人员将认识到,由于遗传密码的简并性质,多种核酸序列可用于编码本公开的给定酶。在本文中引用的编码生物合成酶的核酸序列仅用于说明本公开的实施方案,本公开包括编码本公开的酶的多肽和蛋白质的氨基酸序列的任何核酸序列。以类似方式,多肽通常可以耐受其氨基酸序列中的一个或多个氨基酸取代、缺失和插入,而不会损失或显著损失所需活性。本公开内容包括具有与本文所述的特定蛋白质不同的氨基酸序列的此类多肽,只要修饰的或变体的多肽具有参照多肽的酶促合成代谢或分解代谢活性。此外,由本文所示核酸序列编码的氨基酸序列仅是说明本公开的实施方案。
表达控制序列是本领域已知的,包括例如启动子、增强子、聚腺苷酸化信号、转录终止子、内部核糖体进入位点(IRES)等,其为多核苷酸序列在宿主细胞中的表达作准备。表达控制序列与参与转录的细胞蛋白特异性地相互作用(Maniatis等人,Science,236:1237-1245(1987))。示例性表达控制序列描述于例如Goeddel,Gene Expression Technology:Methods in Enzymology,Vol.185,Academic Press,San Diego,Calif.(1990)中。
在各种实施方案中,表达控制序列可以与多核苷酸序列可操作连接。“可操作连接(operably linked)”是指多核苷酸序列和表达控制序列以这样一种方式连接,即当适当的分子(例如,转录激活因子蛋白)与表达控制序列结合时允许基因表达。就转录和翻译方向而言,可操作连接的启动子位于所选多核苷酸序列的上游。可操作连接的增强子可以位于所选多核苷酸的上游、内部或下游。
在一些实施方案中,操作重组微生物以缺失、破坏、突变和/或降低一种或多种内源性酶的活性,所述内源性酶催化与生物合成途径竞争生产MEG(或GA)、或MEG和一种或多种联产品的途径中的反应。
在一些实施方案中,操作重组微生物以缺失、破坏、突变和/或降低磷酸戊糖途径氧化分支中的一种或多种内源性酶的活性。在一些实施方案中,该操作阻止葡萄糖-6-磷酸通过磷酸戊糖途径的氧化分支转化,而是通过磷酸戊糖途径的非氧化分支分流葡萄糖-6-磷酸,以产生生产MEG(或GA)、或MEG和一种或多种联产品所需的戊糖磷酸中间体。其中戊糖磷酸中间体是D-核糖-5-磷酸、D-核酮糖-5-磷酸或D-木酮糖-5-磷酸。在一些这样的实施方案中,一种或多种内源性酶选自葡萄糖6-磷酸-1-脱氢酶、6-磷酸葡萄糖酸内酯酶和6-磷酸葡萄糖酸脱氢酶。在进一步的实施方案中,葡萄糖6-磷酸-1-脱氢酶是zwf,6-磷酸葡萄糖酸内酯酶是pgl,6-磷酸葡萄糖酸脱氢酶是gnd。
在一些实施方案中,操作重组微生物以缺失、破坏、突变和/或降低甘油醛3-磷酸脱氢酶的活性。在一些实施方案中,该操作防止甘油醛3-磷酸转化为1,3-二磷酸-D-甘油酸,而是允许通过转酮醇酶将甘油醛3-磷酸转化为木酮糖-5-磷酸(同时果糖-6-磷酸转化为赤藓糖-4-磷酸),从而产生生产MEG(或GA)、或MEG和一种或多种联产品所需的戊糖磷酸中间体,并提供更多的赤藓糖-4-磷酸用于磷酸戊糖途径的非氧化分支,以进一步产生戊糖磷酸中间体。在一些实施方案中,甘油醛3-磷酸脱氢酶是gapA。其中,戊糖磷酸中间体是D-核糖-5-磷酸、D-核酮糖-5-磷酸或D-木酮糖-5-磷酸。
在一些实施方案中,操作重组微生物以缺失、破坏、突变和/或降低6-磷酸果糖激酶的活性。在一些实施方案中,该操作阻止果糖-6-磷酸转化为1,6-二磷酸,而是允许果糖-6-磷酸通过果糖-6-磷酸磷酸酮醇酶转化为赤藓糖-4-磷酸和乙酰磷酸,并为磷酸戊糖途径的非氧化分支提供更多的赤藓糖-4-磷酸,以进一步产生生产MEG(或GA)、或MEG和一种或多种联产品所需的戊糖磷酸中间体。在一些实施方案中,6-磷酸果糖激酶是pfkA和/或pfkB。
在一些实施方案中,操作重组微生物以缺失、破坏、突变和/或降低一种或多种催化乙醇醛转化为乙醇酸的内源性酶的活性。在一些这类实施方案中,催化乙醇醛转化为乙醇酸的酶是乙醇醛脱氢酶。在一些实施方案中,乙醇醛脱氢酶来自大肠杆菌。在一些实施方案中,乙醇醛脱氢酶由aldA基因或其同源物编码。在一些实施方案中,该操作防止由乙醇醛产生乙醇酸,而是将反应分流向乙醇醛转化为MEG。在一些实施方案中,催化乙醇醛转化为乙醇酸的一种或多种内源性酶的活性是部分缺失、破坏、突变和/或降低的,其中仍然存在一些乙醇醛脱氢酶功能并且仍然生产一定量的乙醇酸。
在一些实施方案中,操作重组微生物以缺失、破坏、突变和/或降低一种或多种催化丙酮酸转化为乳酸的内源性酶的活性。在一些这类实施方案中,催化丙酮酸转化为乳酸的酶是乳酸脱氢酶。在一些实施方案中,乳酸脱氢酶来自大肠杆菌。在一些实施方案中,乳酸脱氢酶由ldhA基因或其同源物编码。在一些实施方案中,该操作防止由丙酮酸产生乳酸,而是将反应分流向生产MEG(或GA)、或MEG和一种或多种联产品。
在一些实施方案中,操作重组微生物以缺失、破坏、突变和/或降低一种或多种催化乙醇醛转化为单乙二醇(MEG)的内源性酶的活性,相反,将反应分流至乙醇醛转化为乙醇酸(GA)。在一些实施方案中,具有乙醇醛还原酶活性的酶来自大肠杆菌。在一些实施方案中,具有乙醇醛还原酶活性的酶由fucO基因或其同源物编码。
给出上述详细描述只是为了清楚理解,不应由此理解不必要的限制,因为修改对于本领域技术人员来说将是显而易见的。
虽然已经结合其具体实施例描述了本公开,但将理解,本公开能够进一步修改,并且本申请旨在涵盖一般地遵循本公开的原理的本公开的任何变化、使用或改编,并包括此类对本公开的偏离:在本公开所属领域内的已知或惯常实践范围内,并且可应用上文所列出的和遵循所附权利要求的范围的基本特征。
本文引用的每项专利、专利申请和出版物的公开内容,包括权利要求、附图(figures)和/或附图(drawings),均通过引用整体并入本文。
实施例
实施例1
生成DERA变体、戊糖激酶和醛脱氢酶的6-his标记构建体
对于构建脱氧-核糖-5-磷酸醛缩酶(DERA),编码来自大肠杆菌(EcDERA或EcdeoC,UniProt登录号P0A6L0)(SEQ ID NO:255)和来自热容芽孢杆菌(BcDERA或BcdeoC,UniProt登录号A0A2H5KL15)(SEQ ID NO:286)的DERA的野生型基因由GenScript(中国香港)合成,并基于大肠杆菌密码子对BcDERA进行了密码子优化(SEQ ID NO:287)。将这两个DNA片段克隆至pET28质粒中。
基于公开的DERA序列(Heine,A.等人(2001)Observation of covalentintermediates in an enzyme mechanism at atomic resolution.Science 294:369-374)[1]进行了定点诱变,在EcDERA氨基酸序列中将第47位的半胱氨酸替换为精氨酸(C47N),或在BcDERA中通过蛋白质比对所确定的等效位置C37进行替换(以产生C37N)(图8)。选择这些位点以提高DERA活性,因为EcDERA的C47和BcDERA的C47位于活性位点附近。根据制造商的步骤,使用表2中的引物(下划线为突变密码子)和Phusion定点诱变试剂盒(来自Thermo Scientific)进行定点诱变。作为阴性对照,使用表2中的引物,通过将EcDERA中第201位或BcDERA中的等效位置第181位的催化性赖氨酸突变为天冬酰胺(EcDERA的K201N或BcDERA的K181N突变)来构建无活性的DERA。通过测序(Eurogentec)分析和验证了所有野生型序列和特定突变的引入。
通过使用来源生物体的基因组DNA和表2中的PCR引物获得戊糖激酶、核糖激酶(rbsK)(SEQ ID NO:290)、木酮糖激酶(Xuk)(SEQ ID NO:291)和核酮糖激酶(AraB)(SEQ IDNO:288)。通过使用大肠杆菌的基因组DNA和表2中的引物获得醛脱氢酶。
表2.用于获得目标基因的DNA来源和引物
Figure BDA0003310804120001791
蛋白质表达和纯化
新鲜制备的大肠杆菌细胞(DE3,New England Biolabs)用于蛋白质表达。在补充有50μg/mL卡那霉素的丰富介质LB(酵母提取物5g/L、胰蛋白胨10g/L、NaCl 10g/L)上过夜预培养细菌后,以OD 600nm 0.05开始培养细菌。然后,当OD 600nm达到0.6/0.8时,通过向培养介质中添加0.5mM异丙基β-D-1-硫代半乳糖吡喃糖苷(IPTG)来诱导蛋白质表达。在30℃进行培养并诱导表达4小时。表达后,通过离心收集大肠杆菌细胞,并将细胞沉淀保持在-20℃直至使用。为了回收和纯化表达的蛋白质,在冰上的结合缓冲液(HEPES 50mM,pH 7.4;NaCl 300mM)中重新悬浮冷冻的沉淀,并超声处理(4个循环,30秒开/30秒关,探头(microtip)功率30%,Fisher Scientific Fb505型),然后在4℃、20000g离心15分钟。根据制造商的建议,将上清液与His Spintrap TALON(Merck)浆液混合,以纯化标记的His-蛋白质。SDS-PAGE检查所有蛋白质的纯度,显示出预期大小的主要条带,表明蛋白质纯度>90%。使用10kDa Amicon Ultra Centrifugal Filter(Merck),将洗脱缓冲液中的纯化蛋白质交换为HEPES 50mM,pH 7;KCl 100mM、MgCl2 5mM,用于DERA蛋白质酶促测定,或交换为HEPES60mM,pH 7.5、KCl 60mM、MgCl2 3mM,用于PGM3蛋白质酶促测定。
体外戊糖激酶活性测定
对于如上所述纯化的戊糖激酶(核糖激酶(rbsK)、核酮糖激酶(AraB)和木酮糖激酶(XuK)),以其各自的戊糖,通过使用丙酮酸激酶和乳酸脱氢酶将产生的ADP酶促偶联至NADH氧化进行了测定(图9和图14)。反应混合物含有HEPES50mM,pH 7;KCl 100mM、MgCl25mM、适量的糖激酶、ATP 2mM、NADH 0.25mM、戊糖浓度范围、磷酸-烯醇-丙酮酸2mM、浓度为2U/mL的市售丙酮酸激酶(PK)和乳酸脱氢酶(LDH)(所有产品均购自Merck)。
测定结果显示了rbsK、木酮糖激酶(XuK)或AraB与戊糖底物的Michaelis-Menten曲线,分别示于图10、图11和图12中。将初始速率绘制为底物浓度的函数。结果表明,每种表达和纯化的激酶均显示出对其各自的戊糖底物的激酶活性。
体外DERA变体活性测定
通过酶促偶联方法进行DERA变体的体外酶促测定。图13显示了使用DERA的天然底物2-脱氧-核糖-5P进行的DERA测定的方案。图14显示了使用源自上游激酶反应的戊糖-5P底物进行的DERA测定的方案。通过测量甘油-3-P脱氢酶(GPDH)将二羟基丙酮3-P(DHAP)转化为甘油-3P时产生的NADH在OD 340nm处的氧化,来监测该测定。在37℃通过分光光度跟踪反应。
对于使用天然底物的反应,混合物含有HEPES 50mM,pH 7.0;KCl 100mM、MgCl25mM、NADH 0.25mM、2-脱氧核糖-5P 5mM、2U/mL市售的磷酸丙糖异构酶(TPI)和甘油-3-P脱氢酶(GPDH)和适量的DERA变体蛋白。
对于使用激酶衍生的戊糖-5P底物的反应,所述戊糖是核糖、核酮糖或木酮糖。根据图14中的方案进行该测定,混合物含有HEPES 50mM,pH 7.0:KCl 100mM、MgCl2 5mM、NADH0.25mM、2U/mL市售的磷酸丙糖异构酶(TPI)和甘油-3-P脱氢酶(GPDH)、适量的DERA变体蛋白、5mM戊糖(核糖、核酮糖或木酮糖)、适量的特异性激酶(即rbsK、AraB或Xuk)和2.5-5mM的ATP。
DERA变体的体外测定证明了DERA蛋白中的突变对针对天然底物2-脱氧核糖-5P的酶活性的影响。结果显示了每种DERA变体活性的Michaelis-Menten动力学,示于图15、图16、图17、图18、图19和图20中。确定了以下的比活性:来自市售来源的野生型DERA酶(图15)、合成的野生型EcDERA酶(图16)和合成的BcDERA酶(图17)。合成的EcDERA C47N变体(图18)保持了相对于野生型EcDERA酶的降低的活性。同样地,合成的BcDERA C47N变体(图19)保持了相对于WT BcDERA酶的降低的活性。正如预期的那样,阴性对照EcDERA K201N变体没有表现出活性(图20)。
表3显示了DERA变体的体外测定结果,证明了DERA蛋白中的突变对上游戊糖激酶产生的核糖-5P、核酮糖-5P和木酮糖-5P底物酶促转化为甘油醛-3P以及随后转化为DHAP和甘油-3P的影响。结果表明,DERA的突变形式降低了产生甘油醛-3P以及随后转化为DHAP和甘油-3P的速率。
表3.结果证明了对目标戊糖-5-P中间体的DERA活性以及DERA突变对戊糖-5P转化为乙醇醛和G3P的影响。DERA蛋白的DERA比活性。用5mM的初始底物浓度估算Vmax。
Figure BDA0003310804120001811
aldA的体外酶促测定
根据图21中的方案,通过直接监测NADH的形成,以其天然底物乙醇醛对AldA蛋白进行了测试。反应混合物含有HEPES 50mM,pH 7;KCl 100mM、MgCl25mM、适量的aldA蛋白、NAD+2.5mM、乙醇醛5mM(NAD+购自Merck)。
图22中的结果证明了重组aldA酶的比活性保留了将乙醇醛转化为乙醇酸的活性。
使用DERA对由戊糖和戊糖-5P中间体生产GA进行体外验证
该酶促测定旨在验证,通过使用和依赖DERA酶及其变体,由戊糖(核糖、核酮糖或木酮糖)和戊糖-5P中间体(核糖-5P、核酮糖-5P或木酮糖-5P)乙醇酸的体外生产(图23)。在HEPES缓冲液50mM,pH 7.0;KCl 100mM、MgCl2 5mM、NADH 3mM、ATP*Mg 15mM和戊糖(核糖、核酮糖或木酮糖)20mM的反应混合物中进行酶促测定。通过加入以下物质完成反应混合:纯化的核糖激酶(用于含有核糖的反应)、核酮糖激酶(用于含有核酮糖的反应)或木酮糖激酶(用于含有木酮糖的反应)各0.2mg/mL、纯化的醛脱氢酶(aldA)0.25mg/mL、2U/mL TPI和GPDH的混合物(TPI/GPDH来自Merck)和2.5mg/mL纯化的DERA蛋白。反应在37℃进行24小时。反应后,使用配备RI检测器的Thermo Fisher Scientific系统(Courtaboeuf,法国),在205nm的UV检测器和Phenomenex柱(Rezex H+),在50℃使用2.5mM H2SO4作为流动相,流速为0.5mL/min,通过高效液相色谱法测定戊糖和乙醇酸的浓度。表4、表5和表6中给出了体外验证实验的结果。对于根据图23中的方案由木酮糖或核酮糖生产乙醇酸而言,与EcDERA WT相比,EcDERA C47N变体增加了乙醇酸的产量。对于由木酮糖、核酮糖或核糖生产乙醇酸而言,与BcDERA WT相比,BcDERA C37N保留了减少的乙醇酸产量。正如预期的那样,阴性对照变体EcDERAK201N和BcDERAK181N没有保留由戊糖生产乙醇酸的显著能力。结果表明,通过使用DERA候选酶,可以由戊糖(即核糖、核酮糖和木酮糖)体外生产乙醇酸。因此,结果还证明了对目标戊糖-5P中间体(如D-核糖-5P、D-核酮糖-5P和D-木酮糖-5P)的DERA活性,验证了DERA将这类戊糖-5P中间体转化为乙醇醛和G3P的能力。
表4.由木酮糖生产GA的体外验证测定结果
木酮糖(mM) 乙醇酸(mM)
EcDERA WT 6.27 2.54
EcDERA(C47N) 5.84 2.81
EcDERA(K201N) 1.67 0.18
无DERA 1.97 0.19
无激酶 15.46 0.21
- - -
BcDERA WT 2.73 1.39
BcDERA(C37N) 2.72 0.62
BcDERA(K181N) 2.58 0.09
无DERA 2.84 0.00
无激酶 20.71 0.00
表5.由核酮糖生产GA的体外验证测定结果
核酮糖(mM) 乙醇酸(mM)
EcDERA WT 3.36 6.37
EcDERA(C47N) 1.78 7.87
EcDERA(K201N) 1.67 0.18
无DERA 1.97 0.19
无激酶 9.06 0.29
- - -
BcDERA WT 0.00 1.70
BcDERA(C37N) 0.00 0.53
BcDERA(K181N) 0.00 0.00
无DERA 0.00 0.00
无激酶 26.50 0.00
表6.由核糖生产GA的体外验证测定结果
核糖(mM) 乙醇酸(mM)
BcDERA WT 0.20 0.90
BcDERA(C37N) 0.10 0.40
BcDERA(K181N) 0.10 -
实施例2
在大肠杆菌中使用DERA生产乙醇酸的体内测定
为了评估使用DERA进行体内乙醇酸(GA)生产的可行性,基于使用具有基因型MG1655ΔtktA-ΔtktB的大肠杆菌筛选株开发了一种测定方法。如图24所描述的,这类株由于缺失转酮醇酶基因tktA(GenBank Gene ID:947420)和tktB(GenBank Gene ID:945865),本身不能以木糖生长。然而,表达活性DERA蛋白的株可以使用在碳5上磷酸化的戊糖(戊糖-5P)来生产乙醇醛和甘油醛-3-磷酸。乙醇醛和甘油醛-3-磷酸可以进入乙醛酸旁路和糖酵解,以支持株生长。因此,筛选株中的体内DERA活性与细胞生长直接相关。
使tktA和tktB缺失
在大肠杆菌MG1655野生型株中依次使tktA和tktB缺失。首先,根据标准程序进行转导,使tktA和tktB缺失(Thomason LC等人(2007)E.Coli genome manipulation by P1transduction.Curr Protoc Mol Biol.第1章:单元1 17),使用MG1655ΔtktA::KanR株JW5478和MG1655ΔtktB::KanR株JW2449,二者均获自Keio单基因缺失库(Keio single-gene deletion collection)(Baba T等人(2006)Construction of E.Coli K-12in-frame,single-gene knockout mutations:the Keio collection.Mol Sys Biol.2:20060008)。在补充有100μg/ml卡那霉素的LB琼脂上选择转化体,并通过菌落PCR和测序进行鉴定。如前所述,使用Flp重组,通过FTR区域的特异性重组进一步去除抗生素标记物(Datsenko KA和Wanner BL(2000)One-step inactivation of chromosomal genes inEscherichia coli K-12using PCR products.Proc Natl Acad Sci USA97:6640-6645)。所得株命名为DERA_筛选_01:MG1655ΔtktA-ΔtktB。
获得DERAC47N突变体
来自大肠杆菌的DERA(UniProt登录号P0A6L0)由GenScript(中国香港)合成,并克隆至pET28载体中。然后根据制造商的步骤,使用Phusion Site-Directed
Figure BDA0003310804120001831
Kit(Thermo ScientificTM),根据表7中描述的引物,使用定点诱变引入点突变。通过测序进一步确认了EcDERA C47N(SEQ ID NO:294)突变体。
表7:用于定点诱变的寡核苷酸。粗体为突变位点。
Figure BDA0003310804120001832
用于在基于细胞生长的筛选株中表达DERA的质粒构建
为了在筛选株中表达DERA,首先修饰了pZS21质粒(Expressys),将PLtetO-1启动子替换为J23119(SEQ ID NO:293)或J23101(SEQ ID NO:292)组成型启动子(http://parts.igem.org/Promoters/Catalog/Anderson)。J23119和J23101启动子以合成基因片段的形式获得,由
Figure BDA0003310804120001841
合成(Leipzig,德国)。使用表8中详述的引物,通过PCR扩增合成的启动子。随后根据制造商的方案,通过使用
Figure BDA0003310804120001842
HiFi DNA组装克隆试剂盒(NewEngland Biolabs),将这些启动子克隆至通过AatII和KpnI限制性酶促线性化的pZS21质粒中。通过PCR和测序确认了构建情况。所得质粒分别称为pZS2-J23119和pZS2-J23101。
为了表达更高拷贝数的DERA,用从pZA21质粒(Expressys)中回收的p15A复制起点修饰这两个质粒。使用表8中描述的引物,通过PCR扩增含有启动子和卡那霉素标记的来自pZS2-J23119(或pZS2-J23101)的片段,以及含有p15A起点和pZA21多克隆位点的片段。根据制造商的方案,使用
Figure BDA0003310804120001843
HD克隆试剂盒(Clontech)将DNA片段重组为功能性质粒。所得质粒分别称为pZA2-J23119和pZA2-J23101。
使用表8中描述的质粒,通过PCR扩增EcDERA C47N变体。随后根据制造商的方案,通过使用
Figure BDA0003310804120001844
HD克隆试剂盒(Clontech),将其克隆至通过KpnI的限制性酶促线性化的pZA2-J23119或pZA2-J23101中。通过PCR和测序确认了构建情况。所得质粒分别称为pZA2-J23119-DERA(SEQ ID NO:295)和pZA2-J23101-DERA(SEQ ID NO:296)。
表8.用于构建质粒pZS2-J23119、pZS2-J23101、pZA2-J23119、pZA2-J23101、pZA2-J23119-DERA和pZA2-J23101-DERA的寡核苷酸。下划线为结合区。
Figure BDA0003310804120001845
Figure BDA0003310804120001851
使用大肠杆菌DERA C47N变体进行MG1655ΔtktA-ΔtktB生长的体内测定
使用pZA2-J23119-DERA或pZA2-J23101-DERA质粒,或单独使用空载体,使用标准步骤通过电穿孔转化筛选株DERA_筛选_01(MG1655ΔtktA-ΔtktB)(Woodall C.A.E.coliPlasmid Vectors.Methods in Molecular BiologyTM.2003.vol235.doi:10.1385/1-59259-409-3:55)。所得株在M9木糖介质(20g/L木糖)中生长50小时。加入终浓度为100μg/mL的卡那霉素。通过OD600监测生长。
生长测定的结果示于图25中。与其相应对照相比,含有pZA2-J23119-DERA(J23119DERA)或pZA2-J23101-DERA(J23101 DERA)的MG1655ΔtktA-ΔtktB株均显示出增强的生长。J23119 DERA相比于J23101 DERA显示出增强的生长。总而言之,结果表明MG1655ΔtktA-ΔtktB株中表达的EcDERA C47N变体可以使得在木糖基础介质中培养时生长。
列举的实施方案
实施方案1.包含一种或多种生化途径的重组微生物,所述生化途径由一种或多种戊糖和/或己糖通过戊糖磷酸中间体生产一种或多种衍生自甘油醛-3-磷酸(G3P)和乙醇醛的产物;其中所述一种或多种生化途径包含至少一种具有戊糖磷酸醛缩酶活性的酶的表达。
实施方案2.根据实施方案1所述的重组微生物,其中所述戊糖磷酸中间体是D-核糖-5-磷酸、D-核酮糖-5-磷酸或D-木酮糖-5-磷酸,其中的酶具有D-核糖-5-磷酸、D-核酮糖-5-磷酸或D-木酮糖-5-磷酸醛缩酶活性。
实施方案3.根据任何前述实施方案所述的重组微生物,其中所述重组微生物联产单乙二醇(MEG)和一种或多种联产品。
实施方案4.根据任何前述实施方案所述的重组微生物,其中所述一种或多种联产品选自丙酮、异丙醇、丙烯、L-丝氨酸、甘氨酸、单乙醇胺(MEA)、乙二胺或其组合。
实施方案5.根据任何前述实施方案所述的重组微生物,其中所述一种或多种产物选自单乙二醇(MEG)和乙醇酸(GA)。
实施方案6.根据任何前述实施方案所述的重组微生物,其中所述一种或多种生化途径包含至少一种具有转酮醇酶活性的酶的表达。
实施方案7.根据任何前述实施方案所述的重组微生物,其中至少一种具有转酮醇酶活性的酶由与来自大肠杆菌的tktA或tktB具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码。
实施方案8.根据任何前述实施方案所述的重组微生物,其中至少一种具有戊糖磷酸醛缩酶活性的酶由与来自大肠杆菌的deoC具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码。
实施方案9.根据任何前述实施方案所述的重组微生物,其中所述一种或多种生化途径包含至少一种具有转醛醇酶活性的酶的表达。
实施方案10.根据任何前述实施方案所述的重组微生物,其中至少一种具有转醛醇酶活性的酶由与来自大肠杆菌的talA或talB具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码。
实施方案11.根据任何前述实施方案所述的重组微生物,其中所述一种或多种生化途径包含至少一种具有核酮糖-5-磷酸3-差向异构酶活性的酶的表达。
实施方案12.根据任何前述实施方案所述的重组微生物,其中至少一种具有核酮糖-5-磷酸3-差向异构酶活性的酶由与来自大肠杆菌的rpe具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码。
实施方案13.根据任何前述实施方案所述的重组微生物,其中所述一种或多种生化途径包含至少一种具有核糖-5-磷酸异构酶活性的酶的表达。
实施方案14.根据任何前述实施方案所述的重组微生物,其中至少一种具有核糖-5-磷酸异构酶活性的酶由与来自大肠杆菌的rpiA或rpiB具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码。
实施方案15.根据任何前述实施方案所述的重组微生物,其中所述重组微生物进一步包含一种或多种内源性酶的缺失或降低的活性,所述内源性酶选自甘油醛3-磷酸脱氢酶、磷酸甘油酸激酶和磷酸甘油酸变位酶。
实施方案16.根据任何前述实施方案所述的重组微生物,其中所述甘油醛3-磷酸脱氢酶是gapA,磷酸甘油酸激酶是pgk,磷酸甘油酸变位酶是gpmA和/或gpmM。
实施方案17.根据任何前述实施方案所述的重组微生物,其中所述一种或多种生化途径包含至少一种具有果糖-6-磷酸磷酸酮醇酶活性的酶的表达。
实施方案18.根据任何前述实施方案所述的重组微生物,其中至少一种具有果糖-6-磷酸磷酸酮醇酶活性的酶由与选自以下的具有果糖-6-磷酸磷酸酮醇酶活性的酶具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码:齿双歧杆菌(Bifidobacterium dentium)BDP_1006、乳双歧杆菌(Bifidobacterium lactis)xfp、类植物乳杆菌(Lactobacillus paraplantarum)xpkA和短双歧杆菌(Bifidobacteriumbreve)xfp。
实施方案19.根据任何前述实施方案所述的重组微生物,其中所述一种或多种生化途径包含至少一种具有磷酸乙酰转移酶活性的酶的表达。
实施方案20.根据任何前述实施方案所述的重组微生物,其中至少一种具有磷酸乙酰转移酶活性的酶由与选自以下的具有磷酸乙酰转移酶活性的酶具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码:大肠杆菌pta和丙酮丁醇梭菌(Clostridium acetobutylicum)pta。
实施方案21.根据任何前述实施方案所述的重组微生物,其中所述重组微生物进一步包含内源性酶6-磷酸果糖激酶的缺失或降低的活性。
实施方案22.根据任何前述实施方案所述的重组微生物,其中6-磷酸果糖激酶是pfkA和/或pfkB。
实施方案23.根据任何前述实施方案所述的重组微生物,其中所述重组微生物进一步包含一种或多种内源性酶的缺失或降低的活性,所述内源性酶选自葡萄糖6-磷酸-1-脱氢酶、6-磷酸葡萄糖酸内酯酶和6-磷酸葡萄糖酸脱氢酶。
实施方案24.根据任何前述实施方案所述的重组微生物,其中葡萄糖6-磷酸-1-脱氢酶是zwf,6-磷酸葡萄糖酸内酯酶是pgl,6-磷酸葡萄糖酸脱氢酶是gnd。
实施方案25.根据任何前述实施方案所述的重组微生物,其中所述一种或多种戊糖和/或己糖包含D-木糖,并且重组微生物进一步包含至少一种具有木糖异构酶活性的酶的表达和至少一种具有木酮糖5-激酶活性的酶的表达。
实施方案26.根据任何前述实施方案所述的重组微生物,其中至少一种具有木糖异构酶活性的酶由与来自大肠杆菌或Pyromyces sp.的xylA具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码。
实施方案27.根据任何前述实施方案所述的重组微生物,其中至少一种具有木酮糖5-激酶活性的酶由与来自大肠杆菌的xylB具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码。
实施方案28.根据任何前述实施方案所述的重组微生物,其中所述一种或多种戊糖和/或己糖包含D-果糖,并且重组微生物进一步包含至少一种具有果糖1,6-二磷酸酶活性的酶的表达。
实施方案29.根据任何前述实施方案所述的重组微生物,其中至少一种具有果糖1,6-二磷酸酶活性的酶由与来自大肠杆菌的fbp具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码。
实施方案30.根据任何前述实施方案所述的重组微生物,其中所述一种或多种戊糖和/或己糖能够在重组微生物的非氧化磷酸戊糖途径中转化为一种或多种中间体。
实施方案31.根据任何前述实施方案所述的重组微生物,其中所述一种或多种戊糖和/或己糖由单体、低聚物或其组合组成。
实施方案32.根据任何前述实施方案所述的重组微生物,其中至少一种具有转酮醇酶活性和/或果糖-6-磷酸磷酸酮醇酶活性的酶的表达和至少一种具有戊糖磷酸醛缩酶活性的酶的表达,使得能够实现一种或多种戊糖和/或己糖无损转化为D-核糖-5-磷酸中间体以及随后D-核糖-5-磷酸转化为G3P和乙醇醛。
实施方案33.根据任何前述实施方案所述的重组微生物,其中通过C2途径中乙醇醛的转化和一种或多种C3途径中G3P的转化生产MEG或GA。
实施方案34.根据任何前述实施方案所述的重组微生物,其中通过C2途径中具有乙醇醛还原酶活性的酶还原乙醇醛来生产MEG。
实施方案35.根据任何前述实施方案所述的重组微生物,其中通过C2途径中具有乙醇醛脱氢酶活性的酶氧化乙醇醛来生产GA。
实施方案36.根据任何前述实施方案所述的重组微生物,其中用于生产MEG或GA的至少一种酶选自具有选自以下的活性的至少一种酶:3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、羟基丙酮酸脱羧酶活性、3-磷酸羟基丙酮酸还原酶活性、乙醇醛还原酶活性、乙醇醛脱氢酶活性、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶活性、丝氨酸脱羧酶活性、乙醇胺转氨酶或乙醇胺氧化还原酶(脱氨基)活性、甘油酸脱羧酶活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性、甘油酸2-激酶活性和乙醛酸还原酶活性。
实施方案37.根据任何前述实施方案所述的重组微生物,其中通过C2途径中乙醇醛的转化生产MEG,通过一种或多种C3途径中G3P的转化生产一种或多种联产品。
实施方案38.根据任何前述实施方案所述的重组微生物,其中用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的至少一种酶选自至少一种具有选自以下的活性的酶:硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A:乙酰乙酸转移酶或乙酸:乙酰乙酰辅酶A水解酶活性和乙酰乙酸脱羧酶活性,并且其中所述一种或多种联产品包含丙酮。
实施方案39.根据任何前述实施方案所述的重组微生物,其中用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶:硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A:乙酰乙酸转移酶或乙酸:乙酰乙酰辅酶A水解酶活性、乙酰乙酸脱羧酶活性和仲醇脱氢酶活性,并且其中所述一种或多种联产品包含异丙醇。
实施方案40.根据任何前述实施方案所述的重组微生物,其中用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶:硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A:乙酰乙酸转移酶或乙酸:乙酰乙酰辅酶A水解酶活性、乙酰乙酸脱羧酶活性、仲醇脱氢酶活性和脱水酶活性,并且其中所述一种或多种联产品包含丙烯。
实施方案41.根据任何前述实施方案所述的重组微生物,其中用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶:硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A:乙酰乙酸转移酶或乙酸:乙酰乙酰辅酶A水解酶活性、乙酰乙酸脱羧酶活性、3-羟基异戊酸(3HIV)合酶活性、羟甲基戊二酰辅酶A合酶活性、甲基戊烯二酰辅酶A水合酶活性、甲基巴豆酰辅酶A羧化酶活性、甲基巴豆酰辅酶A水合酶活性、3-羟基异戊酰辅酶A硫酯酶活性、3HIV激酶活性、3HIV-3-磷酸脱羧酶活性和3HIV脱羧酶活性,并且其中所述一种或多种联产品包含异丁烯。
实施方案42.根据任何前述实施方案所述的重组微生物,其中用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶:3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性和甘油酸2-激酶活性,并且其中所述一种或多种联产品包含L-丝氨酸。
实施方案43.根据任何前述实施方案所述的重组微生物,其中用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶:丝氨酸羟甲基转移酶活性、转移酶活性、甲醛脱氢酶活性、甲酸脱氢酶活性、与甘氨酸裂解系统相关的活性、3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、丝氨酸转氨酶活性、羟基丙酮酸脱羧酶活性、丝氨酸氧化还原酶(脱氨基)活性、丝氨酸脱羧酶活性、乙醇胺转氨酶或乙醇胺氧化还原酶(脱氨基)活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性、甘油酸2-激酶活性、乙醇醛脱氢酶活性、乙醇酸脱氢酶活性、丙氨酸-乙醛酸转氨酶活性、丙氨酸转氨酶活性和NAD(P)H依赖性谷氨酸脱氢酶活性,并且其中所述一种或多种联产品包含甘氨酸。
实施方案44.根据任何前述实施方案所述的重组微生物,其中与甘氨酸裂解系统相关的活性包含选自以下的酶或蛋白:甘氨酸脱羧酶(P蛋白)、氨甲基转移酶(T蛋白)、二氢硫辛酰胺脱氢酶(L蛋白)和H蛋白。
实施方案45.根据任何前述实施方案所述的重组微生物,其中用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶:3-磷酸甘油酸脱氢酶活性、3-磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、转氨酶活性、羟基丙酮酸脱羧酶活性、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶活性、丝氨酸脱羧酶活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性、甘油酸2-激酶活性、乙醛脱氢酶活性和乙醇胺解氨酶活性,并且其中所述一种或多种联产品包含单乙醇胺(MEA)。
实施方案46.根据任何前述实施方案所述的重组微生物,其中用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶:丝氨酸脱氢酶活性、2-氨基丙二酸半醛脱羧酶活性、氨基乙醛转氨酶活性、2-氨基丙二酸半醛转氨酶活性、2,3-二氨基丙酸脱羧酶活性、丝氨酸脱羧酶活性、乙醇胺脱氢酶活性、丝氨酸羟甲基转移酶活性、醛氧化酶活性、N-乙酰转移酶或O-乙酰转移酶活性、N-乙酰丝氨酸脱氢酶活性、转氨酶活性、脱乙酰酶活性、丝氨酸氨基酶活性和2,3-二氨基丙酸解氨酶活性,并且其中所述一种或多种联产品包含乙二胺(EDA)。
实施方案47.根据任何前述实施方案所述的重组微生物,其中所述重组微生物进一步包含一种或多种修饰,以减少或缺失乙醇醛还原酶、乙醇醛脱氢酶、乳酸脱氢酶或其组合的活性。
实施方案48.根据任何前述实施方案所述的重组微生物,其中至少一部分在C3途径中生产的过量NADH用作C2途径中还原当量的来源。
实施方案49.根据任何前述实施方案所述的重组微生物,其中至少一部分在C3途径中生产的过量NADH用于生产ATP。
实施方案50.根据任何前述实施方案所述的重组微生物,其中最小化过量的生物质形成,并且最大化MEG或GA、或MEG和一种或多种联产品的生产。
实施方案51.使用根据任何上述实施方案所述的重组微生物生产一种或多种衍生自甘油醛-3-磷酸(G3P)和乙醇醛的产物的方法,其中所述方法包括在含有提供碳源的一种或多种戊糖和/或己糖的培养介质中培养重组微生物,直至生产一种或多种衍生自甘油醛-3-磷酸(G3P)和乙醇醛的产物。
实施方案52.根据任何前述实施方案所述的方法,其中所述重组微生物联产单乙二醇(MEG)和一种或多种联产品。
实施方案53.根据任何前述实施方案所述的方法,其中所述一种或多种联产品选自丙酮、异丙醇、丙烯、L-丝氨酸、甘氨酸、单乙醇胺(MEA)、乙二胺(EDA),或其组合。
实施方案54.根据任何前述实施方案所述的方法,其中所述一种或多种产物选自单乙二醇(MEG)和乙醇酸(GA)。
实施方案55.生产重组微生物的方法,所述微生物由一种或多种戊糖和/或己糖通过D-核糖-5-磷酸中间体生产或积累一种或多种衍生自甘油醛-3-磷酸(G3P)和乙醇醛的产物,所述方法包括:
向重组微生物中引入或在重组微生物中表达一种或多种酶,所述酶用于将一种或多种戊糖和/或己糖转化为D-核糖-5-磷酸中间体;
向重组微生物中引入或在重组微生物中表达一种或多种酶,所述酶用于将戊糖磷酸中间体转化为G3P和乙醇醛;
向重组微生物中引入或在重组微生物中表达一种或多种酶,所述酶用于在C2途径中由乙醇醛生产一种或多种产物;和
向重组微生物中引入或在重组微生物中表达一种或多种酶,所述酶用于在一种或多种C3途径中由G3P生产一种或多种产物;和
在含有一种或多种戊糖和/或己糖的培养介质中培养所述重组微生物,以生产或积累一种或多种产物。
实施方案56.根据任何前述实施方案所述的方法,其中所述重组微生物联产单乙二醇(MEG)和一种或多种联产品。
实施方案57.根据任何前述实施方案所述的方法,其中所述一种或多种联产品选自丙酮、异丙醇、丙烯、L-丝氨酸、甘氨酸、单乙醇胺(MEA)、乙二胺,或其组合。
实施方案58.根据任何前述实施方案所述的方法,其中所述一种或多种产物选自单乙二醇(MEG)和乙醇酸(GA)。
实施方案59.根据任何前述实施方案所述的方法,其中乙醇醛通过乙醇醛脱氢酶氧化为乙醇酸。
实施方案60.根据任何前述实施方案所述的方法,其中用于将一种或多种戊糖和/或己糖转化为戊糖磷酸中间体的一种或多种酶选自一种或多种具有以下活性的酶:转酮醇酶活性、转醛醇酶活性、核酮糖-5-磷酸3-差向异构酶活性和核糖-5-磷酸异构酶活性。
实施方案61.根据任何前述实施方案所述的方法,其中所述方法进一步包括向重组微生物中引入一种或多种修饰,以降低或缺失一种或多种内源性酶的活性,所述内源性酶选自甘油醛3-磷酸脱氢酶(gapA)、磷酸甘油酸激酶(pgk)和磷酸甘油酸变位酶(gpmA和/或gpmM)。
实施方案62.根据任何前述实施方案所述的方法,其中将一种或多种戊糖和/或己糖转化为戊糖磷酸中间体的一种或多种酶选自一种或多种具有以下活性的酶:果糖-6-磷酸磷酸酮醇酶活性、磷酸乙酰转移酶活性、转酮醇酶活性、转醛醇酶活性、核酮糖-5-磷酸3-差向异构酶活性和核糖-5-磷酸异构酶活性。
实施方案63.根据任何前述实施方案所述的方法,其中所述方法进一步包括将一种或多种修饰引入重组微生物中,以减少或缺失内源性6-磷酸果糖激酶(pfkA和/或pfkB)酶的活性。
实施方案64.根据实施方案54-62中任一项所述的方法,其中将戊糖磷酸中间体转化为G3P和乙醇醛的一种或多种酶是一种或多种具有D-核糖-5-磷酸醛缩酶活性的酶。
实施方案65.根据任何前述实施方案所述的方法,其中所述方法进一步包括:将一种或多种修饰引入重组微生物中,以减少或缺失一种或多种内源性酶的活性,所述内源性酶选自葡萄糖6-磷酸-1-脱氢酶、6-磷酸葡萄糖酸内酯酶和6-磷酸葡萄糖酸脱氢酶。
实施方案66.根据任何前述实施方案所述的方法,其中葡萄糖6-磷酸-1-脱氢酶是zwf,6-磷酸葡萄糖酸内酯酶是pgl,6-磷酸葡萄糖酸脱氢酶是gnd。
实施方案67.根据任何前述实施方案所述的方法,其中所述一种或多种戊糖和/或己糖包含D-木糖,所述方法进一步包括:
向重组微生物中引入或在重组微生物中表达一种或多种具有木糖异构酶活性的酶,该酶用于将D-木糖转化为D-木酮糖;和
向重组微生物中引入或在重组微生物中表达一种或多种具有木酮糖5-激酶活性的酶,该酶用于将D-木酮糖转化为D-木酮糖-5-磷酸。
实施方案68.根据任何前述实施方案所述的方法,其中所述一种或多种戊糖和/或己糖包含D-果糖,所述重组微生物进一步包括:向重组微生物中引入或在重组微生物中表达一种或多种具有果糖1,6-二磷酸酶活性的酶,该酶用于将D-果糖1,6-二磷酸转化为D-果糖6-磷酸,其中重组微生物中的内源性酶将D-果糖转化为果糖1,6-二磷酸。
实施方案69.根据任何前述实施方案所述的方法,其中所述一种或多种戊糖和/或己糖能够在重组微生物的非氧化磷酸戊糖途径中转化为一种或多种中间体。
实施方案70.根据任何前述实施方案所述的方法,其中所述一种或多种戊糖和/或己糖由单体、低聚物或其组合组成。
实施方案71.根据任何前述实施方案所述的方法,其中所述一种或多种具有转酮醇酶活性和/或果糖-6-磷酸磷酸酮醇酶活性的酶的表达和一种或多种具有戊糖磷酸醛缩酶活性的酶的表达,使得能够实现一种或多种戊糖和/或己糖无损转化为戊糖磷酸中间体以及随后D-核糖-5-磷酸转化为G3P和乙醇醛。
实施方案72.根据任何前述实施方案所述的方法,其中通过C2途径中乙醇醛的转化和一种或多种C3途径中G3P的转化生产MEG或GA。
实施方案73.根据任何前述实施方案所述的方法,其中具有乙醇醛还原酶活性的酶还原乙醇醛来生产MEG。
实施方案74.根据任何前述实施方案所述的方法,其中具有乙醇醛脱氢酶活性的酶氧化乙醇醛来生产GA。
实施方案75.根据任何前述实施方案所述的方法,其中用于生产MEG或GA的一种或多种酶选自具有选自以下的活性的一种或多种酶:3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、羟基丙酮酸脱羧酶活性、3-磷酸羟基丙酮酸还原酶活性、乙醇醛还原酶活性、乙醇醛脱氢酶活性、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶活性、丝氨酸脱羧酶活性、乙醇胺转氨酶或乙醇胺氧化还原酶(脱氨基)活性、甘油酸脱羧酶活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性、甘油酸2-激酶活性和乙醛酸还原酶活性。
实施方案76.根据任何前述实施方案所述的方法,其中通过C2途径中乙醇醛的转化生产MEG,通过一种或多种C3途径中G3P的转化生产一种或多种联产品。
实施方案77.根据任何前述实施方案所述的方法,其中用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的一种或多种酶选自一种或多种具有选自以下的活性的酶:硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A:乙酰乙酸转移酶或乙酸:乙酰乙酰辅酶A水解酶活性和乙酰乙酸脱羧酶活性,并且其中所述一种或多种联产品包含丙酮。
实施方案78.根据任何前述实施方案所述的方法,其中用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶:硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A:乙酰乙酸转移酶或乙酸:乙酰乙酰辅酶A水解酶活性、乙酰乙酸脱羧酶活性和仲醇脱氢酶活性,并且其中所述一种或多种联产品包含异丙醇。
实施方案79.根据任何前述实施方案所述的方法,其中用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶:硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A:乙酰乙酸转移酶或乙酸:乙酰乙酰辅酶A水解酶活性、乙酰乙酸脱羧酶活性、仲醇脱氢酶活性和脱水酶活性,并且其中所述一种或多种联产品包含丙烯。
实施方案80.根据任何前述实施方案所述的方法,其中用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶:硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A:乙酰乙酸转移酶或乙酸:乙酰乙酰辅酶A水解酶活性、乙酰乙酸脱羧酶活性、3-羟基异戊酸(3HIV)合酶活性、羟甲基戊二酰辅酶A合酶活性、甲基戊烯二酰辅酶A水合酶活性、甲基巴豆酰辅酶A羧化酶活性、甲基巴豆酰辅酶A水合酶活性、3-羟基异戊酰辅酶A硫酯酶活性、3HIV激酶活性、3HIV-3-磷酸脱羧酶活性和3HIV脱羧酶活性,并且其中所述一种或多种联产品包含异丁烯。
实施方案81.根据任何前述实施方案所述的方法,其中用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶:3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性和甘油酸2-激酶活性,并且其中所述一种或多种联产品包含L-丝氨酸。
实施方案82.根据任何前述实施方案所述的方法,其中用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶:丝氨酸羟甲基转移酶活性、转移酶活性、甲醛脱氢酶活性、甲酸脱氢酶活性、与甘氨酸裂解系统相关的活性、3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、丝氨酸转氨酶活性、羟基丙酮酸脱羧酶活性、丝氨酸氧化还原酶(脱氨基)活性、丝氨酸脱羧酶活性、乙醇胺转氨酶或乙醇胺氧化还原酶(脱氨基)活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性、甘油酸2-激酶活性、乙醇醛脱氢酶活性、乙醇酸脱氢酶活性、丙氨酸-乙醛酸转氨酶活性、丙氨酸转氨酶活性和NAD(P)H依赖性谷氨酸脱氢酶活性,并且其中所述一种或多种联产品包含甘氨酸。
实施方案83.根据任何前述实施方案所述的方法,其中与甘氨酸裂解系统相关的活性包含选自以下的酶或蛋白:甘氨酸脱羧酶(P蛋白)、氨甲基转移酶(T蛋白)、二氢硫辛酰胺脱氢酶(L蛋白)和H蛋白。
实施方案84.根据任何前述实施方案所述的方法,其中用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶:3-磷酸甘油酸脱氢酶活性、3-磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、转氨酶活性、羟基丙酮酸脱羧酶活性、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶活性、丝氨酸脱羧酶活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性、甘油酸2-激酶活性、乙醛脱氢酶活性和乙醇胺解氨酶活性,并且其中所述一种或多种联产品包含单乙醇胺(MEA)。
实施方案85.根据任何前述实施方案所述的方法,其中用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶:丝氨酸脱氢酶活性、2-氨基丙二酸半醛脱羧酶活性、氨基乙醛转氨酶活性、2-氨基丙二酸半醛转氨酶活性、2,3-二氨基丙酸脱羧酶活性、丝氨酸脱羧酶活性、乙醇胺脱氢酶活性、丝氨酸羟甲基转移酶活性、醛氧化酶活性、N-乙酰转移酶或O-乙酰转移酶活性、N-乙酰丝氨酸脱氢酶活性、转氨酶活性、脱乙酰酶活性、丝氨酸氨基酶活性和2,3-二氨基丙酸解氨酶活性,并且其中所述一种或多种联产品包含乙二胺(EDA)。
实施方案86.根据任何前述实施方案所述的方法,其中所述方法进一步包含向重组微生物中引入一种或多种修饰,以减少或缺失乙醇醛还原酶、乙醇醛脱氢酶、乳酸脱氢酶或其组合的活性。
实施方案87.根据任何前述实施方案所述的方法,其中至少一部分在C3途径中生产的过量NADH用作C2途径中还原当量的来源。
实施方案88.根据任何前述实施方案所述的方法,其中至少一部分在C3途径中生产的过量NADH用于生产ATP。
实施方案89.根据任何前述实施方案所述的方法,其中最小化过量的生物质形成,并且最大化MEG或GA、或MEG和一种或多种联产品的生产。
序列表
<110> 布拉斯科公司
<120> 戊糖和己糖的降解途径
<130> BRSK-007/02WO (331051-2061)
<150> 62/808,258
<151> 2019-02-20
<160> 299
<170> PatentIn version 3.5
<210> 1
<211> 873
<212> DNA
<213> 菊苣假单胞菌(Pseudomonas cichorii)
<400> 1
gtgaacaaag ttggcatgtt ctacacctac tggtcgactg agtggatggt cgactttccg 60
gcgactgcga agcgcattgc cgggctcggc ttcgacttaa tggaaatctc gctcggcgag 120
tttcacaatc tttccgacgc gaagaagcgt gagctaaaag ccgtggctga tgatctgggg 180
ctcacggtga tgtgctgtat cggactgaag tctgagtacg actttgcctc gccggacaag 240
agcgttcgtg atgccggcac ggaatatgtg aagcgcttgc tcgacgactg tcacctcctc 300
ggcgcgccgg tctttgctgg ccttacgttc tgcgcgtggc cccaatctcc gccgctggac 360
atgaaggata agcgccctta cgtcgaccgt gcaatcgaaa gcgttcgtcg tgttatcaag 420
gtagctgaag actacggcat tatttatgca ctggaagtgg tgaaccgatt cgagcagtgg 480
ctttgcaatg acgccaagga agcaattgcg tttgccgacg cggttgacag tccggcgtgc 540
aaggtccagc tcgacacatt ccacatgaat atcgaagaga cttccttccg cgatgcaatc 600
cttgcctgca agggcaagat gggccatttc catttgggcg aagcgaaccg tctgccgccg 660
ggcgagggtc gcctgccgtg ggatgaaata ttcggggcgc tgaaggaaat cggatatgac 720
ggcaccatcg ttatggaacc gttcatgcgc aagggcggct cggtcagccg cgcggtgggc 780
gtatggcggg atatgtcgaa cggtgcgacg gacgaagaga tggacgagcg cgctcgccgc 840
tcgttgcagt ttgttcgtga caagctggcc tga 873
<210> 2
<211> 873
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的菊苣假单胞菌序列
<400> 2
atgaacaaag tgggtatgtt ctatacgtac tggtccacgg aatggatggt tgactttccg 60
gcaaccgcga aacgtattgc gggcctgggc ttcgacctga tggaaatttc tctgggcgaa 120
tttcacaacc tgtccgatgc gaaaaagcgt gaactgaaag ccgttgccga cgatctgggt 180
ctgactgtga tgtgctgtat cggcctgaaa tctgaatacg atttcgcgag cccggataaa 240
agcgttcgcg acgccggtac tgaatatgtc aaacgtctgc tggatgactg tcacctgctg 300
ggcgcaccag tgttcgcggg tctgaccttc tgtgcgtggc cgcagtcccc accgctggac 360
atgaaggata aacgtccgta cgtggaccgt gccatcgaaa gcgtgcgccg cgtaatcaaa 420
gtcgctgaag attatggcat tatttacgct ctggaagttg ttaaccgttt cgaacagtgg 480
ctgtgcaacg acgcgaaaga ggccattgcc ttcgctgacg cggtggattc tccggcttgc 540
aaagttcagc tggacacttt ccatatgaac atcgaggaaa cctccttccg tgacgcgatc 600
ctggcttgca agggtaaaat gggccatttc catctgggcg aagcaaaccg cctgccgccg 660
ggcgaaggtc gtctgccgtg ggacgaaatt tttggcgctc tgaaggaaat cggctacgat 720
ggcacgattg ttatggagcc gttcatgcgc aaaggtggct ccgtttcccg tgcagttggt 780
gtttggcgtg atatgtctaa cggtgccacc gatgaagaaa tggacgaacg tgcacgtcgc 840
tccctgcaat tcgttcgcga taaactggcg taa 873
<210> 3
<211> 290
<212> PRT
<213> 菊苣假单胞菌
<400> 3
Met Asn Lys Val Gly Met Phe Tyr Thr Tyr Trp Ser Thr Glu Trp Met
1 5 10 15
Val Asp Phe Pro Ala Thr Ala Lys Arg Ile Ala Gly Leu Gly Phe Asp
20 25 30
Leu Met Glu Ile Ser Leu Gly Glu Phe His Asn Leu Ser Asp Ala Lys
35 40 45
Lys Arg Glu Leu Lys Ala Val Ala Asp Asp Leu Gly Leu Thr Val Met
50 55 60
Cys Cys Ile Gly Leu Lys Ser Glu Tyr Asp Phe Ala Ser Pro Asp Lys
65 70 75 80
Ser Val Arg Asp Ala Gly Thr Glu Tyr Val Lys Arg Leu Leu Asp Asp
85 90 95
Cys His Leu Leu Gly Ala Pro Val Phe Ala Gly Leu Thr Phe Cys Ala
100 105 110
Trp Pro Gln Ser Pro Pro Leu Asp Met Lys Asp Lys Arg Pro Tyr Val
115 120 125
Asp Arg Ala Ile Glu Ser Val Arg Arg Val Ile Lys Val Ala Glu Asp
130 135 140
Tyr Gly Ile Ile Tyr Ala Leu Glu Val Val Asn Arg Phe Glu Gln Trp
145 150 155 160
Leu Cys Asn Asp Ala Lys Glu Ala Ile Ala Phe Ala Asp Ala Val Asp
165 170 175
Ser Pro Ala Cys Lys Val Gln Leu Asp Thr Phe His Met Asn Ile Glu
180 185 190
Glu Thr Ser Phe Arg Asp Ala Ile Leu Ala Cys Lys Gly Lys Met Gly
195 200 205
His Phe His Leu Gly Glu Ala Asn Arg Leu Pro Pro Gly Glu Gly Arg
210 215 220
Leu Pro Trp Asp Glu Ile Phe Gly Ala Leu Lys Glu Ile Gly Tyr Asp
225 230 235 240
Gly Thr Ile Val Met Glu Pro Phe Met Arg Lys Gly Gly Ser Val Ser
245 250 255
Arg Ala Val Gly Val Trp Arg Asp Met Ser Asn Gly Ala Thr Asp Glu
260 265 270
Glu Met Asp Glu Arg Ala Arg Arg Ser Leu Gln Phe Val Arg Asp Lys
275 280 285
Leu Ala
290
<210> 4
<211> 888
<212> DNA
<213> 类球红细菌(Rhodobacter sphaeroides)
<400> 4
gtgaaaaatc ctgtcggcat catctcgatg cagttcatcc ggcccttcac ctcggagtcg 60
ctgcatttcc tgaagaagtc ccgggccctg ggcttcgatt tcatcgagct tctcgtgccc 120
gagcccgaag acgggctcga cgcggccgag gtgcggcgca tctgcgaggg cgaggggctg 180
ggcctcgttc tggccgcgcg cgtgaacctc cagcgctcga tcgcgagcga ggaggccgcg 240
gcgcgggccg gcgggcgcga ctatctgaaa tactgcatcg aggccgccga ggcgctcggc 300
gcgaccatcg tcggcggccc gctctatggc gagccgctgg tcttcgccgg ccgcccgccc 360
ttcccctgga cggccgagca gatcgccacc cgcgccgccc gcaccgtcga ggggctggcc 420
gaagtggccc cgctcgccgc gagcgcgggc aaggtcttcg ggctcgagcc gctgaaccgc 480
ttcgagaccg acatcgtgaa cacgaccgca caggccatcg aggtggtgga tgcggtgggc 540
tcgcccggtc tcggcgtcat gctcgacacg ttccacatga acatggagga acgctcgatc 600
cccgatgcga tccgcgccac aggcgcgcgc ctcgtccatt ttcaggccaa cgagaaccac 660
cgcggcttcc ccggcaccgg caccatggac tggacggcca tcgcgcgggc gctggggcag 720
gcgggctacg cgggtccggt ctcgctcgag cctttccggc gcgacgacga gcgcgtggcg 780
ctgcccatcg cccactggcg cgccccgcac gaggacgagg acgagaagct gcgcgcgggg 840
ctgggtctca tccgctccgc gatcaccctg gcggaggtga cccactga 888
<210> 5
<211> 295
<212> PRT
<213> 类球红细菌
<400> 5
Met Lys Asn Pro Val Gly Ile Ile Ser Met Gln Phe Ile Arg Pro Phe
1 5 10 15
Thr Ser Glu Ser Leu His Phe Leu Lys Lys Ser Arg Ala Leu Gly Phe
20 25 30
Asp Phe Ile Glu Leu Leu Val Pro Glu Pro Glu Asp Gly Leu Asp Ala
35 40 45
Ala Glu Val Arg Arg Ile Cys Glu Gly Glu Gly Leu Gly Leu Val Leu
50 55 60
Ala Ala Arg Val Asn Leu Gln Arg Ser Ile Ala Ser Glu Glu Ala Ala
65 70 75 80
Ala Arg Ala Gly Gly Arg Asp Tyr Leu Lys Tyr Cys Ile Glu Ala Ala
85 90 95
Glu Ala Leu Gly Ala Thr Ile Val Gly Gly Pro Leu Tyr Gly Glu Pro
100 105 110
Leu Val Phe Ala Gly Arg Pro Pro Phe Pro Trp Thr Ala Glu Gln Ile
115 120 125
Ala Thr Arg Ala Ala Arg Thr Val Glu Gly Leu Ala Glu Val Ala Pro
130 135 140
Leu Ala Ala Ser Ala Gly Lys Val Phe Gly Leu Glu Pro Leu Asn Arg
145 150 155 160
Phe Glu Thr Asp Ile Val Asn Thr Thr Ala Gln Ala Ile Glu Val Val
165 170 175
Asp Ala Val Gly Ser Pro Gly Leu Gly Val Met Leu Asp Thr Phe His
180 185 190
Met Asn Met Glu Glu Arg Ser Ile Pro Asp Ala Ile Arg Ala Thr Gly
195 200 205
Ala Arg Leu Val His Phe Gln Ala Asn Glu Asn His Arg Gly Phe Pro
210 215 220
Gly Thr Gly Thr Met Asp Trp Thr Ala Ile Ala Arg Ala Leu Gly Gln
225 230 235 240
Ala Gly Tyr Ala Gly Pro Val Ser Leu Glu Pro Phe Arg Arg Asp Asp
245 250 255
Glu Arg Val Ala Leu Pro Ile Ala His Trp Arg Ala Pro His Glu Asp
260 265 270
Glu Asp Glu Lys Leu Arg Ala Gly Leu Gly Leu Ile Arg Ser Ala Ile
275 280 285
Thr Leu Ala Glu Val Thr His
290 295
<210> 6
<211> 1422
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 6
atgatgaaac aagaagttat cctggtactc gactgtggcg cgaccaatgt cagggccatc 60
gcggttaatc ggcagggcaa aattgttgcc cgcgcctcaa cgcctaatgc cagcgatatc 120
gcgatggaaa acaacacctg gcaccagtgg tctttagacg ccattttgca acgctttgct 180
gattgctgtc ggcaaatcaa tagtgaactg actgaatgcc acatccgcgg tatcgccgtc 240
accacctttg gtgtggatgg cgctctggta gataagcaag gcaatctgct ctatccgatt 300
attagctgga aatgtccgcg aacagcagcg gttatggaca atattgaacg gttaatctcc 360
gcacagcggt tgcaggctat ttctggcgtc ggagccttta gtttcaatac gttatataag 420
ttggtgtggt tgaaagaaaa tcatccacaa ctgctggaac gcgcgcacgc ctggctcttt 480
atttcgtcgc tgattaacca ccgtttaacc ggcgaattca ctactgatat cacgatggcc 540
ggaaccagcc agatgctgga tatccagcaa cgcgatttca gtccgcaaat tttacaagcc 600
accggtattc cacgccgact cttccctcgt ctggtggaag cgggtgaaca gattggtacg 660
ctacagaaca gcgccgcagc aatgctcggc ttacccgttg gcataccggt gatttccgca 720
ggtcacgata cccagttcgc cctttttggc gctggtgctg aacaaaatga acccgtgctc 780
tcttccggta catgggaaat tttaatggtt cgcagcgccc aggttgatac ttcgctgtta 840
agtcagtacg ccggttccac ctgcgaactg gatagccagg cagggttgta taacccaggt 900
atgcaatggc tggcatccgg cgtgctggaa tgggtgagaa aactgttctg gacggctgaa 960
acaccctggc aaatgttgat tgaagaagct cgtctgatcg cgcctggcgc ggatggcgta 1020
aaaatgcagt gtgatttatt gtcgtgtcag aacgctggct ggcaaggagt gacgcttaat 1080
accacgcggg ggcatttcta tcgcgcggcg ctggaagggt taactgcgca attacagcgc 1140
aatctacaga tgctggaaaa aatcgggcac tttaaggcct ctgaattatt gttagtcggt 1200
ggaggaagtc gcaacacatt gtggaatcag attaaagcca atatgcttga tattccggta 1260
aaagttctcg acgacgccga aacgaccgtc gcaggagctg cgctgttcgg ttggtatggc 1320
gtaggggaat ttaacagccc ggaagaagcc cgcgcacaga ttcattatca gtaccgttat 1380
ttctacccgc aaactgaacc tgaatttata gaggaagtgt ga 1422
<210> 7
<211> 1422
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的大肠杆菌序列
<400> 7
atgatgaaac aagaagttat cctggtactc gactgtggcg cgaccaatgt cagggccatc 60
gcggttaatc ggcagggcaa aattgttgcc cgcgcctcaa cgcctaatgc cagcgatatc 120
gcgatggaaa acaacacctg gcaccagtgg tctttagacg ccattttgca acgctttgct 180
gattgctgtc ggcaaatcaa tagtgaactg actgaatgcc acatccgcgg tatcgccgtc 240
accacctttg gtgtggatgg cgctctggta gataagcaag gcaatctgct ctatccgatt 300
attagctgga aatgtccgcg aacagcagcg gttatggaca atattgaacg gttaatctcc 360
gcacagcggt tgcaggctat ttctggcgtc ggagccttta gtttcaatac gttatataag 420
ttggtgtggt tgaaagaaaa tcatccacaa ctgctggaac gcgcgcacgc ctggctcttt 480
atttcgtcgc tgattaacca ccgtttaacc ggcgaattca ctactgatat cacgatggcc 540
ggaaccagcc agatgctgga tatccagcaa cgcgatttca gtccgcaaat tttacaagcc 600
accggtattc cacgccgact cttccctcgt ctggtggaag cgggtgaaca gattggtacg 660
ctacagaaca gcgccgcagc aatgctcggc ttacccgttg gcataccggt gatttccgca 720
ggtcacgata cccagttcgc cctttttggc gctggtgctg aacaaaatga acccgtgctc 780
tcttccggta catgggaaat tttaatggtt cgcagcgccc aggttgatac ttcgctgtta 840
agtcagtacg ccggttccac ctgcgaactg gatagccagg cagggttgta taacccaggt 900
atgcaatggc tggcatccgg cgtgctggaa tgggtgagaa aactgttctg gacggctgaa 960
acaccctggc aaatgttgat tgaagaagct cgtctgatcg cgcctggcgc ggatggcgta 1020
aaaatgcagt gtgatttatt gtcgtgtcag aacgctggct ggcaaggagt gacgcttaat 1080
accacgcggg ggcatttcta tcgcgcggcg ctggaagggt taactgcgca attacagcgc 1140
aatctacaga tgctggaaaa aatcgggcac tttaaggcct ctgaattatt gttagtcggt 1200
ggaggaagtc gcaacacatt gtggaatcag attaaagcca atatgcttga tattccggta 1260
aaagttctcg acgacgccga aacgaccgtc gcaggagctg cgctgttcgg ttggtatggc 1320
gtaggggaat ttaacagccc ggaagaagcc cgcgcacaga ttcattatca gtaccgttat 1380
ttctacccgc aaactgaacc tgaatttata gaggaagtgt ga 1422
<210> 8
<211> 473
<212> PRT
<213> 大肠杆菌
<400> 8
Met Met Lys Gln Glu Val Ile Leu Val Leu Asp Cys Gly Ala Thr Asn
1 5 10 15
Val Arg Ala Ile Ala Val Asn Arg Gln Gly Lys Ile Val Ala Arg Ala
20 25 30
Ser Thr Pro Asn Ala Ser Asp Ile Ala Met Glu Asn Asn Thr Trp His
35 40 45
Gln Trp Ser Leu Asp Ala Ile Leu Gln Arg Phe Ala Asp Cys Cys Arg
50 55 60
Gln Ile Asn Ser Glu Leu Thr Glu Cys His Ile Arg Gly Ile Ala Val
65 70 75 80
Thr Thr Phe Gly Val Asp Gly Ala Leu Val Asp Lys Gln Gly Asn Leu
85 90 95
Leu Tyr Pro Ile Ile Ser Trp Lys Cys Pro Arg Thr Ala Ala Val Met
100 105 110
Asp Asn Ile Glu Arg Leu Ile Ser Ala Gln Arg Leu Gln Ala Ile Ser
115 120 125
Gly Val Gly Ala Phe Ser Phe Asn Thr Leu Tyr Lys Leu Val Trp Leu
130 135 140
Lys Glu Asn His Pro Gln Leu Leu Glu Arg Ala His Ala Trp Leu Phe
145 150 155 160
Ile Ser Ser Leu Ile Asn His Arg Leu Thr Gly Glu Phe Thr Thr Asp
165 170 175
Ile Thr Met Ala Gly Thr Ser Gln Met Leu Asp Ile Gln Gln Arg Asp
180 185 190
Phe Ser Pro Gln Ile Leu Gln Ala Thr Gly Ile Pro Arg Arg Leu Phe
195 200 205
Pro Arg Leu Val Glu Ala Gly Glu Gln Ile Gly Thr Leu Gln Asn Ser
210 215 220
Ala Ala Ala Met Leu Gly Leu Pro Val Gly Ile Pro Val Ile Ser Ala
225 230 235 240
Gly His Asp Thr Gln Phe Ala Leu Phe Gly Ala Gly Ala Glu Gln Asn
245 250 255
Glu Pro Val Leu Ser Ser Gly Thr Trp Glu Ile Leu Met Val Arg Ser
260 265 270
Ala Gln Val Asp Thr Ser Leu Leu Ser Gln Tyr Ala Gly Ser Thr Cys
275 280 285
Glu Leu Asp Ser Gln Ala Gly Leu Tyr Asn Pro Gly Met Gln Trp Leu
290 295 300
Ala Ser Gly Val Leu Glu Trp Val Arg Lys Leu Phe Trp Thr Ala Glu
305 310 315 320
Thr Pro Trp Gln Met Leu Ile Glu Glu Ala Arg Leu Ile Ala Pro Gly
325 330 335
Ala Asp Gly Val Lys Met Gln Cys Asp Leu Leu Ser Cys Gln Asn Ala
340 345 350
Gly Trp Gln Gly Val Thr Leu Asn Thr Thr Arg Gly His Phe Tyr Arg
355 360 365
Ala Ala Leu Glu Gly Leu Thr Ala Gln Leu Gln Arg Asn Leu Gln Met
370 375 380
Leu Glu Lys Ile Gly His Phe Lys Ala Ser Glu Leu Leu Leu Val Gly
385 390 395 400
Gly Gly Ser Arg Asn Thr Leu Trp Asn Gln Ile Lys Ala Asn Met Leu
405 410 415
Asp Ile Pro Val Lys Val Leu Asp Asp Ala Glu Thr Thr Val Ala Gly
420 425 430
Ala Ala Leu Phe Gly Trp Tyr Gly Val Gly Glu Phe Asn Ser Pro Glu
435 440 445
Glu Ala Arg Ala Gln Ile His Tyr Gln Tyr Arg Tyr Phe Tyr Pro Gln
450 455 460
Thr Glu Pro Glu Phe Ile Glu Glu Val
465 470
<210> 9
<211> 648
<212> DNA
<213> 大肠杆菌
<400> 9
atggaacgaa ataaacttgc tcgtcagatt attgacactt gcctggaaat gacccgcctg 60
ggactgaacc aggggacagc ggggaacgtc agtgtacgtt atcaggatgg gatgctgatt 120
acgcctacag gcattccata tgaaaaactg acggagtcgc atattgtctt tattgatggc 180
aacggtaaac atgaggaagg aaagctcccc tcaagcgaat ggcgtttcca tatggcagcc 240
tatcaaagca gaccggatgc caacgcggtt gttcacaatc atgccgttca ttgcacggca 300
gtttccattc ttaaccgatc gatccccgct attcactaca tgattgcggc ggctggcggt 360
aattctattc cttgcgcgcc ttatgcgacc tttggaacac gcgaactttc tgaacatgtt 420
gcgctggctc tcaaaaatcg taaggcaact ttgttacaac atcatgggct tatcgcttgt 480
gaggtgaatc tggaaaaagc gttatggctg gcgcatgaag ttgaagtgct ggcgcaactt 540
tacctgacga ccctggcgat tacggacccg gtgccagtgc tgagcgatga agagattgcc 600
gtagtgctgg agaaattcaa aacctatggg ttacgaattg aagagtaa 648
<210> 10
<211> 648
<212> DNA
<213> 大肠杆菌
<400> 10
atggaacgaa ataaacttgc tcgtcagatt attgacactt gcctggaaat gacccgcctg 60
ggactgaacc aggggacagc ggggaacgtc agtgtacgtt atcaggatgg gatgctgatt 120
acgcctacag gcattccata tgaaaaactg acggagtcgc atattgtctt tattgatggc 180
aacggtaaac atgaggaagg aaagctcccc tcaagcgaat ggcgtttcca tatggcagcc 240
tatcaaagca gaccggatgc caacgcggtt gttcacaatc atgccgttca ttgcacggca 300
gtttccattc ttaaccgatc gatccccgct attcactaca tgattgcggc ggctggcggt 360
aattctattc cttgcgcgcc ttatgcgacc tttggaacac gcgaactttc tgaacatgtt 420
gcgctggctc tcaaaaatcg taaggcaact ttgttacaac atcatgggct tatcgcttgt 480
gaggtgaatc tggaaaaagc gttatggctg gcgcatgaag ttgaagtgct ggcgcaactt 540
tacctgacga ccctggcgat tacggacccg gtgccagtgc tgagcgatga agagattgcc 600
gtagtgctgg agaaattcaa aacctatggg ttacgaattg aagagtaa 648
<210> 11
<211> 215
<212> PRT
<213> 大肠杆菌
<400> 11
Met Glu Arg Asn Lys Leu Ala Arg Gln Ile Ile Asp Thr Cys Leu Glu
1 5 10 15
Met Thr Arg Leu Gly Leu Asn Gln Gly Thr Ala Gly Asn Val Ser Val
20 25 30
Arg Tyr Gln Asp Gly Met Leu Ile Thr Pro Thr Gly Ile Pro Tyr Glu
35 40 45
Lys Leu Thr Glu Ser His Ile Val Phe Ile Asp Gly Asn Gly Lys His
50 55 60
Glu Glu Gly Lys Leu Pro Ser Ser Glu Trp Arg Phe His Met Ala Ala
65 70 75 80
Tyr Gln Ser Arg Pro Asp Ala Asn Ala Val Val His Asn His Ala Val
85 90 95
His Cys Thr Ala Val Ser Ile Leu Asn Arg Ser Ile Pro Ala Ile His
100 105 110
Tyr Met Ile Ala Ala Ala Gly Gly Asn Ser Ile Pro Cys Ala Pro Tyr
115 120 125
Ala Thr Phe Gly Thr Arg Glu Leu Ser Glu His Val Ala Leu Ala Leu
130 135 140
Lys Asn Arg Lys Ala Thr Leu Leu Gln His His Gly Leu Ile Ala Cys
145 150 155 160
Glu Val Asn Leu Glu Lys Ala Leu Trp Leu Ala His Glu Val Glu Val
165 170 175
Leu Ala Gln Leu Tyr Leu Thr Thr Leu Ala Ile Thr Asp Pro Val Pro
180 185 190
Val Leu Ser Asp Glu Glu Ile Ala Val Val Leu Glu Lys Phe Lys Thr
195 200 205
Tyr Gly Leu Arg Ile Glu Glu
210 215
<210> 12
<211> 1104
<212> DNA
<213> 大肠杆菌
<400> 12
atggaccgca ttattcaatc accgggtaaa tacatccagg gcgctgatgt gattaatcgt 60
ctgggcgaat acctgaagcc gctggcagaa cgctggttag tggtgggtga caaatttgtt 120
ttaggttttg ctcaatccac tgtcgagaaa agctttaaag atgctggact ggtagtagaa 180
attgcgccgt ttggcggtga atgttcgcaa aatgagatcg accgtctgcg tggcatcgcg 240
gagactgcgc agtgtggcgc aattctcggt atcggtggcg gaaaaaccct cgatactgcc 300
aaagcactgg cacatttcat gggtgttccg gtagcgatcg caccgactat cgcctctacc 360
gatgcaccgt gcagcgcatt gtctgttatc tacaccgatg agggtgagtt tgaccgctat 420
ctgctgttgc caaataaccc gaatatggtc attgtcgaca ccaaaatcgt cgctggcgca 480
cctgcacgtc tgttagcggc gggtatcggc gatgcgctgg caacctggtt tgaagcgcgt 540
gcctgctctc gtagcggcgc gaccaccatg gcgggcggca agtgcaccca ggctgcgctg 600
gcactggctg aactgtgcta caacaccctg ctggaagaag gcgaaaaagc gatgcttgct 660
gccgaacagc atgtagtgac tccggcgctg gagcgcgtga ttgaagcgaa cacctatttg 720
agcggtgttg gttttgaaag tggtggtctg gctgcggcgc acgcagtgca taacggcctg 780
accgctatcc cggacgcgca tcactattat cacggtgaaa aagtggcatt cggtacgctg 840
acgcagctgg ttctggaaaa tgcgccggtg gaggaaatcg aaaccgtagc tgcccttagc 900
catgcggtag gtttgccaat aactctcgct caactggata ttaaagaaga tgtcccggcg 960
aaaatgcgaa ttgtggcaga agcggcatgt gcagaaggtg aaaccattca caacatgcct 1020
ggcggcgcga cgccagatca ggtttacgcc gctctgctgg tagccgacca gtacggtcag 1080
cgtttcctgc aagagtggga ataa 1104
<210> 13
<211> 367
<212> PRT
<213> 大肠杆菌
<400> 13
Met Asp Arg Ile Ile Gln Ser Pro Gly Lys Tyr Ile Gln Gly Ala Asp
1 5 10 15
Val Ile Asn Arg Leu Gly Glu Tyr Leu Lys Pro Leu Ala Glu Arg Trp
20 25 30
Leu Val Val Gly Asp Lys Phe Val Leu Gly Phe Ala Gln Ser Thr Val
35 40 45
Glu Lys Ser Phe Lys Asp Ala Gly Leu Val Val Glu Ile Ala Pro Phe
50 55 60
Gly Gly Glu Cys Ser Gln Asn Glu Ile Asp Arg Leu Arg Gly Ile Ala
65 70 75 80
Glu Thr Ala Gln Cys Gly Ala Ile Leu Gly Ile Gly Gly Gly Lys Thr
85 90 95
Leu Asp Thr Ala Lys Ala Leu Ala His Phe Met Gly Val Pro Val Ala
100 105 110
Ile Ala Pro Thr Ile Ala Ser Thr Asp Ala Pro Cys Ser Ala Leu Ser
115 120 125
Val Ile Tyr Thr Asp Glu Gly Glu Phe Asp Arg Tyr Leu Leu Leu Pro
130 135 140
Asn Asn Pro Asn Met Val Ile Val Asp Thr Lys Ile Val Ala Gly Ala
145 150 155 160
Pro Ala Arg Leu Leu Ala Ala Gly Ile Gly Asp Ala Leu Ala Thr Trp
165 170 175
Phe Glu Ala Arg Ala Cys Ser Arg Ser Gly Ala Thr Thr Met Ala Gly
180 185 190
Gly Lys Cys Thr Gln Ala Ala Leu Ala Leu Ala Glu Leu Cys Tyr Asn
195 200 205
Thr Leu Leu Glu Glu Gly Glu Lys Ala Met Leu Ala Ala Glu Gln His
210 215 220
Val Val Thr Pro Ala Leu Glu Arg Val Ile Glu Ala Asn Thr Tyr Leu
225 230 235 240
Ser Gly Val Gly Phe Glu Ser Gly Gly Leu Ala Ala Ala His Ala Val
245 250 255
His Asn Gly Leu Thr Ala Ile Pro Asp Ala His His Tyr Tyr His Gly
260 265 270
Glu Lys Val Ala Phe Gly Thr Leu Thr Gln Leu Val Leu Glu Asn Ala
275 280 285
Pro Val Glu Glu Ile Glu Thr Val Ala Ala Leu Ser His Ala Val Gly
290 295 300
Leu Pro Ile Thr Leu Ala Gln Leu Asp Ile Lys Glu Asp Val Pro Ala
305 310 315 320
Lys Met Arg Ile Val Ala Glu Ala Ala Cys Ala Glu Gly Glu Thr Ile
325 330 335
His Asn Met Pro Gly Gly Ala Thr Pro Asp Gln Val Tyr Ala Ala Leu
340 345 350
Leu Val Ala Asp Gln Tyr Gly Gln Arg Phe Leu Gln Glu Trp Glu
355 360 365
<210> 14
<211> 1029
<212> DNA
<213> 酿酒酵母(Saccharomyces cerevisiae)
<400> 14
atgtcagttt tcgtttcagg tgctaacggg ttcattgccc aacacattgt cgatctcctg 60
ttgaaggaag actataaggt catcggttct gccagaagtc aagaaaaggc cgagaattta 120
acggaggcct ttggtaacaa cccaaaattc tccatggaag ttgtcccaga catatctaag 180
ctggacgcat ttgaccatgt tttccaaaag cacggcaagg atatcaagat agttctacat 240
acggcctctc cattctgctt tgatatcact gacagtgaac gcgatttatt aattcctgct 300
gtgaacggtg ttaagggaat tctccactca attaaaaaat acgccgctga ttctgtagaa 360
cgtgtagttc tcacctcttc ttatgcagct gtgttcgata tggcaaaaga aaacgataag 420
tctttaacat ttaacgaaga atcctggaac ccagctacct gggagagttg ccaaagtgac 480
ccagttaacg cctactgtgg ttctaagaag tttgctgaaa aagcagcttg ggaatttcta 540
gaggagaata gagactctgt aaaattcgaa ttaactgccg ttaacccagt ttacgttttt 600
ggtccgcaaa tgtttgacaa agatgtgaaa aaacacttga acacatcttg cgaactcgtc 660
aacagcttga tgcatttatc accagaggac aagataccgg aactatttgg tggatacatt 720
gatgttcgtg atgttgcaaa ggctcattta gttgccttcc aaaagaggga aacaattggt 780
caaagactaa tcgtatcgga ggccagattt actatgcagg atgttctcga tatccttaac 840
gaagacttcc ctgttctaaa aggcaatatt ccagtgggga aaccaggttc tggtgctacc 900
cataacaccc ttggtgctac tcttgataat aaaaagagta agaaattgtt aggtttcaag 960
ttcaggaact tgaaagagac cattgacgac actgcctccc aaattttaaa atttgagggc 1020
agaatataa 1029
<210> 15
<211> 342
<212> PRT
<213> 酿酒酵母
<400> 15
Met Ser Val Phe Val Ser Gly Ala Asn Gly Phe Ile Ala Gln His Ile
1 5 10 15
Val Asp Leu Leu Leu Lys Glu Asp Tyr Lys Val Ile Gly Ser Ala Arg
20 25 30
Ser Gln Glu Lys Ala Glu Asn Leu Thr Glu Ala Phe Gly Asn Asn Pro
35 40 45
Lys Phe Ser Met Glu Val Val Pro Asp Ile Ser Lys Leu Asp Ala Phe
50 55 60
Asp His Val Phe Gln Lys His Gly Lys Asp Ile Lys Ile Val Leu His
65 70 75 80
Thr Ala Ser Pro Phe Cys Phe Asp Ile Thr Asp Ser Glu Arg Asp Leu
85 90 95
Leu Ile Pro Ala Val Asn Gly Val Lys Gly Ile Leu His Ser Ile Lys
100 105 110
Lys Tyr Ala Ala Asp Ser Val Glu Arg Val Val Leu Thr Ser Ser Tyr
115 120 125
Ala Ala Val Phe Asp Met Ala Lys Glu Asn Asp Lys Ser Leu Thr Phe
130 135 140
Asn Glu Glu Ser Trp Asn Pro Ala Thr Trp Glu Ser Cys Gln Ser Asp
145 150 155 160
Pro Val Asn Ala Tyr Cys Gly Ser Lys Lys Phe Ala Glu Lys Ala Ala
165 170 175
Trp Glu Phe Leu Glu Glu Asn Arg Asp Ser Val Lys Phe Glu Leu Thr
180 185 190
Ala Val Asn Pro Val Tyr Val Phe Gly Pro Gln Met Phe Asp Lys Asp
195 200 205
Val Lys Lys His Leu Asn Thr Ser Cys Glu Leu Val Asn Ser Leu Met
210 215 220
His Leu Ser Pro Glu Asp Lys Ile Pro Glu Leu Phe Gly Gly Tyr Ile
225 230 235 240
Asp Val Arg Asp Val Ala Lys Ala His Leu Val Ala Phe Gln Lys Arg
245 250 255
Glu Thr Ile Gly Gln Arg Leu Ile Val Ser Glu Ala Arg Phe Thr Met
260 265 270
Gln Asp Val Leu Asp Ile Leu Asn Glu Asp Phe Pro Val Leu Lys Gly
275 280 285
Asn Ile Pro Val Gly Lys Pro Gly Ser Gly Ala Thr His Asn Thr Leu
290 295 300
Gly Ala Thr Leu Asp Asn Lys Lys Ser Lys Lys Leu Leu Gly Phe Lys
305 310 315 320
Phe Arg Asn Leu Lys Glu Thr Ile Asp Asp Thr Ala Ser Gln Ile Leu
325 330 335
Lys Phe Glu Gly Arg Ile
340
<210> 16
<211> 984
<212> DNA
<213> 酿酒酵母
<400> 16
atgtcttcac tggttactct taataacggt ctgaaaatgc ccctagtcgg cttagggtgc 60
tggaaaattg acaaaaaagt ctgtgcgaat caaatttatg aagctatcaa attaggctac 120
cgtttattcg atggtgcttg cgactacggc aacgaaaagg aagttggtga aggtatcagg 180
aaagccatct ccgaaggtct tgtttctaga aaggatatat ttgttgtttc aaagttatgg 240
aacaattttc accatcctga tcatgtaaaa ttagctttaa agaagacctt aagcgatatg 300
ggacttgatt atttagacct gtattatatt cacttcccaa tcgccttcaa atatgttcca 360
tttgaagaga aataccctcc aggattctat acgggcgcag atgacgagaa gaaaggtcac 420
atcaccgaag cacatgtacc aatcatagat acgtaccggg ctctggaaga atgtgttgat 480
gaaggcttga ttaagtctat tggtgtttcc aactttcagg gaagcttgat tcaagattta 540
ttacgtggtt gtagaatcaa gcccgtggct ttgcaaattg aacaccatcc ttatttgact 600
caagaacacc tagttgagtt ttgtaaatta cacgatatcc aagtagttgc ttactcctcc 660
ttcggtcctc aatcattcat tgagatggac ttacagttgg caaaaaccac gccaactctg 720
ttcgagaatg atgtaatcaa gaaggtctca caaaaccatc caggcagtac cacttcccaa 780
gtattgctta gatgggcaac tcagagaggc attgccgtca ttccaaaatc ttccaagaag 840
gaaaggttac ttggcaacct agaaatcgaa aaaaagttca ctttaacgga gcaagaattg 900
aaggatattt ctgcactaaa tgccaacatc agatttaatg atccatggac ctggttggat 960
ggtaaattcc ccacttttgc ctga 984
<210> 17
<211> 327
<212> PRT
<213> 酿酒酵母
<400> 17
Met Ser Ser Leu Val Thr Leu Asn Asn Gly Leu Lys Met Pro Leu Val
1 5 10 15
Gly Leu Gly Cys Trp Lys Ile Asp Lys Lys Val Cys Ala Asn Gln Ile
20 25 30
Tyr Glu Ala Ile Lys Leu Gly Tyr Arg Leu Phe Asp Gly Ala Cys Asp
35 40 45
Tyr Gly Asn Glu Lys Glu Val Gly Glu Gly Ile Arg Lys Ala Ile Ser
50 55 60
Glu Gly Leu Val Ser Arg Lys Asp Ile Phe Val Val Ser Lys Leu Trp
65 70 75 80
Asn Asn Phe His His Pro Asp His Val Lys Leu Ala Leu Lys Lys Thr
85 90 95
Leu Ser Asp Met Gly Leu Asp Tyr Leu Asp Leu Tyr Tyr Ile His Phe
100 105 110
Pro Ile Ala Phe Lys Tyr Val Pro Phe Glu Glu Lys Tyr Pro Pro Gly
115 120 125
Phe Tyr Thr Gly Ala Asp Asp Glu Lys Lys Gly His Ile Thr Glu Ala
130 135 140
His Val Pro Ile Ile Asp Thr Tyr Arg Ala Leu Glu Glu Cys Val Asp
145 150 155 160
Glu Gly Leu Ile Lys Ser Ile Gly Val Ser Asn Phe Gln Gly Ser Leu
165 170 175
Ile Gln Asp Leu Leu Arg Gly Cys Arg Ile Lys Pro Val Ala Leu Gln
180 185 190
Ile Glu His His Pro Tyr Leu Thr Gln Glu His Leu Val Glu Phe Cys
195 200 205
Lys Leu His Asp Ile Gln Val Val Ala Tyr Ser Ser Phe Gly Pro Gln
210 215 220
Ser Phe Ile Glu Met Asp Leu Gln Leu Ala Lys Thr Thr Pro Thr Leu
225 230 235 240
Phe Glu Asn Asp Val Ile Lys Lys Val Ser Gln Asn His Pro Gly Ser
245 250 255
Thr Thr Ser Gln Val Leu Leu Arg Trp Ala Thr Gln Arg Gly Ile Ala
260 265 270
Val Ile Pro Lys Ser Ser Lys Lys Glu Arg Leu Leu Gly Asn Leu Glu
275 280 285
Ile Glu Lys Lys Phe Thr Leu Thr Glu Gln Glu Leu Lys Asp Ile Ser
290 295 300
Ala Leu Asn Ala Asn Ile Arg Phe Asn Asp Pro Trp Thr Trp Leu Asp
305 310 315 320
Gly Lys Phe Pro Thr Phe Ala
325
<210> 18
<211> 1164
<212> DNA
<213> 大肠杆菌
<400> 18
atgaacaact ttaatctgca caccccaacc cgcattctgt ttggtaaagg cgcaatcgct 60
ggtttacgcg aacaaattcc tcacgatgct cgcgtattga ttacctacgg cggcggcagc 120
gtgaaaaaaa ccggcgttct cgatcaagtt ctggatgccc tgaaaggcat ggacgtgctg 180
gaatttggcg gtattgagcc aaacccggct tatgaaacgc tgatgaacgc cgtgaaactg 240
gttcgcgaac agaaagtgac tttcctgctg gcggttggcg gcggttctgt actggacggc 300
accaaattta tcgccgcagc ggctaactat ccggaaaata tcgatccgtg gcacattctg 360
caaacgggcg gtaaagagat taaaagcgcc atcccgatgg gctgtgtgct gacgctgcca 420
gcaaccggtt cagaatccaa cgcagaagcg gtgatctccc gtaaaaccac aggcgacaag 480
caggcgttcc attctgccca tgttcagccg gtatttgccg tgctcgatcc ggtttatacc 540
tacaccctgc cgccgcgtca ggtggctaac ggcgtagtgg acgcctttgt acacaccgtg 600
gaacagtatg ttaccaaacc ggttgatgcc aaaattcagg accgtttcgc agaaggcatt 660
ttgctgacgc taatcgaaga tggtccgaaa gccctgaaag agccagaaaa ctacgatgtg 720
cgcgccaacg tcatgtgggc ggcgactcag gcgctgaacg gtttgattgg cgctggcgta 780
ccgcaggact gggcaacgca tatgctgggc cacgaactga ctgcgatgca cggtctggat 840
cacgcgcaaa cactggctat cgtcctgcct gcactgtgga atgaaaaacg cgataccaag 900
cgcgctaagc tgctgcaata tgctgaacgc gtctggaaca tcactgaagg ttccgatgat 960
gagcgtattg acgccgcgat tgccgcaacc cgcaatttct ttgagcaatt aggcgtgccg 1020
acccacctct ccgactacgg tctggacggc agctccatcc cggctttgct gaaaaaactg 1080
gaagagcacg gcatgaccca actgggcgaa aatcatgaca ttacgttgga tgtcagccgc 1140
cgtatatacg aagccgcccg ctaa 1164
<210> 19
<211> 1167
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的大肠杆菌序列
<400> 19
atgaacaatt ttaatttgca tactccaact agaatattat ttggaaaagg tgcaattgca 60
ggtttaaggg aacaaatacc acatgatgca agggtattaa tcacatacgg tggtggttct 120
gtcaagaaaa ctggtgtatt ggatcaagta ttggatgctt taaagggtat ggatgtcttg 180
gaatttggag gaatcgaacc aaaccctgct tacgagactt taatgaatgc tgtcaaattg 240
gtcagagaac aaaaggtaac attcttattg gctgttggag gtggatcagt attagatggt 300
acaaagttca ttgctgctgc agcaaattat ccagaaaaca ttgatccatg gcatatattg 360
caaactggtg gtaaggaaat aaagtcagct atcccaatgg gatgtgtttt gacattgcct 420
gcaacaggat cagaatcaaa cgctgaagca gtcatctcaa gaaagactac aggtgacaaa 480
caggcattcc attctgccca tgtccaacct gtatttgctg ttttagaccc tgtatacact 540
tacacattac caccaaggca agtcgcaaat ggagttgtcg atgcctttgt tcacactgta 600
gaacagtacg tcaccaaacc agtcgatgca aagatccagg acaggtttgc agaaggtatt 660
ttattgacat taatcgaaga tggaccaaaa gcattgaaag agccagagaa ctatgacgtt 720
agggcaaatg ttatgtgggc tgctacccag gcattgaacg gtttaattgg tgcaggagtt 780
ccacaagatt gggctacaca catgttgggt cacgagttga ccgccatgca cggtttggac 840
catgcacaga ctttagccat tgttttgcct gccttatgga acgagaaaag agatactaag 900
agggctaagt tattacaata cgctgaaagg gtttggaata tcaccgaggg atctgatgat 960
gaaaggattg atgccgctat tgcagccact agaaacttct ttgaacaatt aggtgttcca 1020
actcacttgt ctgactatgg tttagatgga tcatctattc cagctttgtt gaagaaattg 1080
gaagagcacg gtatgaccca gttgggtgag aatcatgata taaccttaga tgtatctagg 1140
agaatctacg aggctgctag ataatga 1167
<210> 20
<211> 387
<212> PRT
<213> 大肠杆菌
<400> 20
Met Asn Asn Phe Asn Leu His Thr Pro Thr Arg Ile Leu Phe Gly Lys
1 5 10 15
Gly Ala Ile Ala Gly Leu Arg Glu Gln Ile Pro His Asp Ala Arg Val
20 25 30
Leu Ile Thr Tyr Gly Gly Gly Ser Val Lys Lys Thr Gly Val Leu Asp
35 40 45
Gln Val Leu Asp Ala Leu Lys Gly Met Asp Val Leu Glu Phe Gly Gly
50 55 60
Ile Glu Pro Asn Pro Ala Tyr Glu Thr Leu Met Asn Ala Val Lys Leu
65 70 75 80
Val Arg Glu Gln Lys Val Thr Phe Leu Leu Ala Val Gly Gly Gly Ser
85 90 95
Val Leu Asp Gly Thr Lys Phe Ile Ala Ala Ala Ala Asn Tyr Pro Glu
100 105 110
Asn Ile Asp Pro Trp His Ile Leu Gln Thr Gly Gly Lys Glu Ile Lys
115 120 125
Ser Ala Ile Pro Met Gly Cys Val Leu Thr Leu Pro Ala Thr Gly Ser
130 135 140
Glu Ser Asn Ala Glu Ala Val Ile Ser Arg Lys Thr Thr Gly Asp Lys
145 150 155 160
Gln Ala Phe His Ser Ala His Val Gln Pro Val Phe Ala Val Leu Asp
165 170 175
Pro Val Tyr Thr Tyr Thr Leu Pro Pro Arg Gln Val Ala Asn Gly Val
180 185 190
Val Asp Ala Phe Val His Thr Val Glu Gln Tyr Val Thr Lys Pro Val
195 200 205
Asp Ala Lys Ile Gln Asp Arg Phe Ala Glu Gly Ile Leu Leu Thr Leu
210 215 220
Ile Glu Asp Gly Pro Lys Ala Leu Lys Glu Pro Glu Asn Tyr Asp Val
225 230 235 240
Arg Ala Asn Val Met Trp Ala Ala Thr Gln Ala Leu Asn Gly Leu Ile
245 250 255
Gly Ala Gly Val Pro Gln Asp Trp Ala Thr His Met Leu Gly His Glu
260 265 270
Leu Thr Ala Met His Gly Leu Asp His Ala Gln Thr Leu Ala Ile Val
275 280 285
Leu Pro Ala Leu Trp Asn Glu Lys Arg Asp Thr Lys Arg Ala Lys Leu
290 295 300
Leu Gln Tyr Ala Glu Arg Val Trp Asn Ile Thr Glu Gly Ser Asp Asp
305 310 315 320
Glu Arg Ile Asp Ala Ala Ile Ala Ala Thr Arg Asn Phe Phe Glu Gln
325 330 335
Leu Gly Val Pro Thr His Leu Ser Asp Tyr Gly Leu Asp Gly Ser Ser
340 345 350
Ile Pro Ala Leu Leu Lys Lys Leu Glu Glu His Gly Met Thr Gln Leu
355 360 365
Gly Glu Asn His Asp Ile Thr Leu Asp Val Ser Arg Arg Ile Tyr Glu
370 375 380
Ala Ala Arg
385
<210> 21
<211> 1164
<212> DNA
<213> 大肠杆菌
<400> 21
atgaacaact ttaatctgca caccccaacc cgcattctgt ttggtaaagg cgcaatcgct 60
ggtttacgcg aacaaattcc tcacgatgct cgcgtattga ttacctacgg cggcggcagc 120
gtgaaaaaaa ccggcgttct cgatcaagtt ctggatgccc tgaaaggcat ggacgtgctg 180
gaatttggcg gtattgagcc aaacccggct tatgaaacgc tgatgaacgc cgtgaaactg 240
gttcgcgaac agaaagtgac tttcctgctg gcggttggcg gcggttctgt actggacggc 300
accaaattta tcgccgcagc ggctaactat ccggaaaata tcgatccgtg gcacattctg 360
caaacgggcg gtaaagagat taaaagcgcc atcccgatgg gctgtgtgct gacgctgcca 420
gcaaccggtt cagaatccaa cgcaggcgcg gtgatctccc gtaaaaccac aggcgacaag 480
caggcgttcc attctgccca tgttcagccg gtatttgccg tgctcgatcc ggtttatacc 540
tacaccctgc cgccgcgtca ggtggctaac ggcgtagtgg acgcctttgt acacaccgtg 600
gaacagtatg ttaccaaacc ggttgatgcc aaaattcagg accgtttcgc agaaggcatt 660
ttgctgacgc taatcgaaga tggtccgaaa gccctgaaag agccagaaaa ctacgatgtg 720
cgcgccaacg tcatgtgggc ggcgactcag gcgctgaacg gtttgattgg cgctggcgta 780
ccgcaggact gggcaacgca tatgctgggc cacgaactga ctgcgatgca cggtctggat 840
cacgcgcaaa cactggctat cgtcctgcct gcactgtgga atgaaaaacg cgataccaag 900
cgcgctaagc tgctgcaata tgctgaacgc gtctggaaca tcactgaagg ttccgatgat 960
gagcgtattg acgccgcgat tgccgcaacc cgcaatttct ttgagcaatt aggcgtgccg 1020
acccacctct ccgactacgg tctggacggc agctccatcc cggctttgct gaaaaaactg 1080
gaagagcacg gcatgaccca actgggcgaa aatcatgaca ttacgttgga tgtcagccgc 1140
cgtatatacg aagccgcccg ctaa 1164
<210> 22
<211> 1164
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的大肠杆菌序列
<400> 22
atgaacaact ttaatctgca caccccaacc cgcattctgt ttggtaaagg cgcaatcgct 60
ggtttacgcg aacaaattcc tcacgatgct cgcgtattga ttacctacgg cggcggcagc 120
gtgaaaaaaa ccggcgttct cgatcaagtt ctggatgccc tgaaaggcat ggacgtgctg 180
gaatttggcg gtattgagcc aaacccggct tatgaaacgc tgatgaacgc cgtgaaactg 240
gttcgcgaac agaaagtgac tttcctgctg gcggttggcg gcggttctgt actggacggc 300
accaaattta tcgccgcagc ggctaactat ccggaaaata tcgatccgtg gcacattctg 360
caaacgggcg gtaaagagat taaaagcgcc atcccgatgg gctgtgtgct gacgctgcca 420
gcaaccggtt cagaatccaa cgcaggcgcg gtgatctccc gtaaaaccac aggcgacaag 480
caggcgttcc attctgccca tgttcagccg gtatttgccg tgctcgatcc ggtttatacc 540
tacaccctgc cgccgcgtca ggtggctaac ggcgtagtgg acgcctttgt acacaccgtg 600
gaacagtatg ttaccaaacc ggttgatgcc aaaattcagg accgtttcgc agaaggcatt 660
ttgctgacgc taatcgaaga tggtccgaaa gccctgaaag agccagaaaa ctacgatgtg 720
cgcgccaacg tcatgtgggc ggcgactcag gcgctgaacg gtttgattgg cgctggcgta 780
ccgcaggact gggcaacgca tatgctgggc cacgaactga ctgcgatgca cggtctggat 840
cacgcgcaaa cactggctat cgtcctgcct gcactgtgga atgaaaaacg cgataccaag 900
cgcgctaagc tgctgcaata tgctgaacgc gtctggaaca tcactgaagg ttccgatgat 960
gagcgtattg acgccgcgat tgccgcaacc cgcaatttct ttgagcaatt aggcgtgccg 1020
acccacctct ccgactacgg tctggacggc agctccatcc cggctttgct gaaaaaactg 1080
gaagagcacg gcatgaccca actgggcgaa aatcatgaca ttacgttgga tgtcagccgc 1140
cgtatatacg aagccgcccg ctaa 1164
<210> 23
<211> 387
<212> PRT
<213> 大肠杆菌
<400> 23
Met Asn Asn Phe Asn Leu His Thr Pro Thr Arg Ile Leu Phe Gly Lys
1 5 10 15
Gly Ala Ile Ala Gly Leu Arg Glu Gln Ile Pro His Asp Ala Arg Val
20 25 30
Leu Ile Thr Tyr Gly Gly Gly Ser Val Lys Lys Thr Gly Val Leu Asp
35 40 45
Gln Val Leu Asp Ala Leu Lys Gly Met Asp Val Leu Glu Phe Gly Gly
50 55 60
Ile Glu Pro Asn Pro Ala Tyr Glu Thr Leu Met Asn Ala Val Lys Leu
65 70 75 80
Val Arg Glu Gln Lys Val Thr Phe Leu Leu Ala Val Gly Gly Gly Ser
85 90 95
Val Leu Asp Gly Thr Lys Phe Ile Ala Ala Ala Ala Asn Tyr Pro Glu
100 105 110
Asn Ile Asp Pro Trp His Ile Leu Gln Thr Gly Gly Lys Glu Ile Lys
115 120 125
Ser Ala Ile Pro Met Gly Cys Val Leu Thr Leu Pro Ala Thr Gly Ser
130 135 140
Glu Ser Asn Ala Gly Ala Val Ile Ser Arg Lys Thr Thr Gly Asp Lys
145 150 155 160
Gln Ala Phe His Ser Ala His Val Gln Pro Val Phe Ala Val Leu Asp
165 170 175
Pro Val Tyr Thr Tyr Thr Leu Pro Pro Arg Gln Val Ala Asn Gly Val
180 185 190
Val Asp Ala Phe Val His Thr Val Glu Gln Tyr Val Thr Lys Pro Val
195 200 205
Asp Ala Lys Ile Gln Asp Arg Phe Ala Glu Gly Ile Leu Leu Thr Leu
210 215 220
Ile Glu Asp Gly Pro Lys Ala Leu Lys Glu Pro Glu Asn Tyr Asp Val
225 230 235 240
Arg Ala Asn Val Met Trp Ala Ala Thr Gln Ala Leu Asn Gly Leu Ile
245 250 255
Gly Ala Gly Val Pro Gln Asp Trp Ala Thr His Met Leu Gly His Glu
260 265 270
Leu Thr Ala Met His Gly Leu Asp His Ala Gln Thr Leu Ala Ile Val
275 280 285
Leu Pro Ala Leu Trp Asn Glu Lys Arg Asp Thr Lys Arg Ala Lys Leu
290 295 300
Leu Gln Tyr Ala Glu Arg Val Trp Asn Ile Thr Glu Gly Ser Asp Asp
305 310 315 320
Glu Arg Ile Asp Ala Ala Ile Ala Ala Thr Arg Asn Phe Phe Glu Gln
325 330 335
Leu Gly Val Pro Thr His Leu Ser Asp Tyr Gly Leu Asp Gly Ser Ser
340 345 350
Ile Pro Ala Leu Leu Lys Lys Leu Glu Glu His Gly Met Thr Gln Leu
355 360 365
Gly Glu Asn His Asp Ile Thr Leu Asp Val Ser Arg Arg Ile Tyr Glu
370 375 380
Ala Ala Arg
385
<210> 24
<211> 981
<212> DNA
<213> 大肠杆菌
<400> 24
atgaaaaaga tacctttagg cacaacggat attacgcttt cgcgaatggg gttggggaca 60
tgggccattg gcggcggtcc tgcatggaat ggcgatctcg atcggcaaat atgtattgat 120
acgattcttg aagcccatcg ttgtggcatt aatctgattg atactgcgcc aggatataac 180
tttggcaata gtgaagttat cgtcggtcag gcgttaaaaa aactgccccg tgaacaggtt 240
gtagtagaaa ccaaatgcgg cattgtctgg gaacgaaaag gaagtttatt caacaaagtt 300
ggcgatcggc agttgtataa aaacctttcc ccggaatcta tccgcgaaga ggtagcagcg 360
agcttgcaac gtctgggtat tgattacatc gatatctaca tgacgcactg gcagtcggtg 420
ccgccatttt ttacgccgat cgctgaaact gtcgcagtgc ttaatgagtt aaagtctgaa 480
gggaaaattc gcgctatagg cgctgctaac gtcgatgctg accatatccg cgagtatctg 540
caatatggtg aactggatat tattcaggcg aaatacagta tcctcgaccg ggcaatggaa 600
aacgaactgc tgccactatg tcgtgataat ggcattgtgg ttcaggttta ttccccgcta 660
gagcagggat tgttgaccgg caccatcact cgtgattacg ttccgggcgg cgctcgggca 720
aataaagtct ggttccagcg tgaaaacatg ctgaaagtga ttgatatgct tgaacagtgg 780
cagccacttt gtgctcgtta tcagtgcaca attcccactc tggcactggc gtggatatta 840
aaacagagtg atttaatctc cattcttagt ggggctactg caccggaaca ggtacgcgaa 900
aatgtcgcgg cactgaatat caacttatcg gatgcagacg caacattgat gagggaaatg 960
gcagaggccc tggagcgtta a 981
<210> 25
<211> 326
<212> PRT
<213> 大肠杆菌
<400> 25
Met Lys Lys Ile Pro Leu Gly Thr Thr Asp Ile Thr Leu Ser Arg Met
1 5 10 15
Gly Leu Gly Thr Trp Ala Ile Gly Gly Gly Pro Ala Trp Asn Gly Asp
20 25 30
Leu Asp Arg Gln Ile Cys Ile Asp Thr Ile Leu Glu Ala His Arg Cys
35 40 45
Gly Ile Asn Leu Ile Asp Thr Ala Pro Gly Tyr Asn Phe Gly Asn Ser
50 55 60
Glu Val Ile Val Gly Gln Ala Leu Lys Lys Leu Pro Arg Glu Gln Val
65 70 75 80
Val Val Glu Thr Lys Cys Gly Ile Val Trp Glu Arg Lys Gly Ser Leu
85 90 95
Phe Asn Lys Val Gly Asp Arg Gln Leu Tyr Lys Asn Leu Ser Pro Glu
100 105 110
Ser Ile Arg Glu Glu Val Ala Ala Ser Leu Gln Arg Leu Gly Ile Asp
115 120 125
Tyr Ile Asp Ile Tyr Met Thr His Trp Gln Ser Val Pro Pro Phe Phe
130 135 140
Thr Pro Ile Ala Glu Thr Val Ala Val Leu Asn Glu Leu Lys Ser Glu
145 150 155 160
Gly Lys Ile Arg Ala Ile Gly Ala Ala Asn Val Asp Ala Asp His Ile
165 170 175
Arg Glu Tyr Leu Gln Tyr Gly Glu Leu Asp Ile Ile Gln Ala Lys Tyr
180 185 190
Ser Ile Leu Asp Arg Ala Met Glu Asn Glu Leu Leu Pro Leu Cys Arg
195 200 205
Asp Asn Gly Ile Val Val Gln Val Tyr Ser Pro Leu Glu Gln Gly Leu
210 215 220
Leu Thr Gly Thr Ile Thr Arg Asp Tyr Val Pro Gly Gly Ala Arg Ala
225 230 235 240
Asn Lys Val Trp Phe Gln Arg Glu Asn Met Leu Lys Val Ile Asp Met
245 250 255
Leu Glu Gln Trp Gln Pro Leu Cys Ala Arg Tyr Gln Cys Thr Ile Pro
260 265 270
Thr Leu Ala Leu Ala Trp Ile Leu Lys Gln Ser Asp Leu Ile Ser Ile
275 280 285
Leu Ser Gly Ala Thr Ala Pro Glu Gln Val Arg Glu Asn Val Ala Ala
290 295 300
Leu Asn Ile Asn Leu Ser Asp Ala Asp Ala Thr Leu Met Arg Glu Met
305 310 315 320
Ala Glu Ala Leu Glu Arg
325
<210> 26
<211> 1149
<212> DNA
<213> 大肠杆菌
<400> 26
atggctaaca gaatgattct gaacgaaacg gcatggtttg gtcggggtgc tgttggggct 60
ttaaccgatg aggtgaaacg ccgtggttat cagaaggcgc tgatcgtcac cgataaaacg 120
ctggtgcaat gcggcgtggt ggcgaaagtg accgataaga tggatgctgc agggctggca 180
tgggcgattt acgacggcgt agtgcccaac ccaacaatta ctgtcgtcaa agaagggctc 240
ggtgtattcc agaatagcgg cgcggattac ctgatcgcta ttggtggtgg ttctccacag 300
gatacttgta aagcgattgg cattatcagc aacaacccgg agtttgccga tgtgcgtagc 360
ctggaagggc tttccccgac caataaaccc agtgtaccga ttctggcaat tcctaccaca 420
gcaggtactg cggcagaagt gaccattaac tacgtgatca ctgacgaaga gaaacggcgc 480
aagtttgttt gcgttgatcc gcatgatatc ccgcaggtgg cgtttattga cgctgacatg 540
atggatggta tgcctccagc gctgaaagct gcgacgggtg tcgatgcgct cactcatgct 600
attgaggggt atattacccg tggcgcgtgg gcgctaaccg atgcactgca cattaaagcg 660
attgaaatca ttgctggggc gctgcgagga tcggttgctg gtgataagga tgccggagaa 720
gaaatggcgc tcgggcagta tgttgcgggt atgggcttct cgaatgttgg gttagggttg 780
gtgcatggta tggcgcatcc actgggcgcg ttttataaca ctccacacgg tgttgcgaac 840
gccatcctgt taccgcatgt catgcgttat aacgctgact ttaccggtga gaagtaccgc 900
gatatcgcgc gcgttatggg cgtgaaagtg gaaggtatga gcctggaaga ggcgcgtaat 960
gccgctgttg aagcggtgtt tgctctcaac cgtgatgtcg gtattccgcc acatttgcgt 1020
gatgttggtg tacgcaagga agacattccg gcactggcgc aggcggcact ggatgatgtt 1080
tgtaccggtg gcaacccgcg tgaagcaacg cttgaggata ttgtagagct ttaccatacc 1140
gcctggtaa 1149
<210> 27
<211> 1149
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的大肠杆菌序列
<400> 27
atggctaaca gaatgattct gaacgaaacg gcatggtttg gtcggggtgc tgttggggct 60
ttaaccgatg aggtgaaacg ccgtggttat cagaaggcgc tgatcgtcac cgataaaacg 120
ctggtgcaat gcggcgtggt ggcgaaagtg accgataaga tggatgctgc agggctggca 180
tgggcgattt acgacggcgt agtgcccaac ccaacaatta ctgtcgtcaa agaagggctc 240
ggtgtattcc agaatagcgg cgcggattac ctgatcgcta ttggtggtgg ttctccacag 300
gatacttgta aagcgattgg cattatcagc aacaacccgg agtttgccga tgtgcgtagc 360
ctggaagggc tttccccgac caataaaccc agtgtaccga ttctggcaat tcctaccaca 420
gcaggtactg cggcagaagt gaccattaac tacgtgatca ctgacgaaga gaaacggcgc 480
aagtttgttt gcgttgatcc gcatgatatc ccgcaggtgg cgtttattga cgctgacatg 540
atggatggta tgcctccagc gctgaaagct gcgacgggtg tcgatgcgct cactcatgct 600
attgaggggt atattacccg tggcgcgtgg gcgctaaccg atgcactgca cattaaagcg 660
attgaaatca ttgctggggc gctgcgagga tcggttgctg gtgataagga tgccggagaa 720
gaaatggcgc tcgggcagta tgttgcgggt atgggcttct cgaatgttgg gttagggttg 780
gtgcatggta tggcgcatcc actgggcgcg ttttataaca ctccacacgg tgttgcgaac 840
gccatcctgt taccgcatgt catgcgttat aacgctgact ttaccggtga gaagtaccgc 900
gatatcgcgc gcgttatggg cgtgaaagtg gaaggtatga gcctggaaga ggcgcgtaat 960
gccgctgttg aagcggtgtt tgctctcaac cgtgatgtcg gtattccgcc acatttgcgt 1020
gatgttggtg tacgcaagga agacattccg gcactggcgc aggcggcact ggatgatgtt 1080
tgtaccggtg gcaacccgcg tgaagcaacg cttgaggata ttgtagagct ttaccatacc 1140
gcctggtaa 1149
<210> 28
<211> 382
<212> PRT
<213> 大肠杆菌
<400> 28
Met Ala Asn Arg Met Ile Leu Asn Glu Thr Ala Trp Phe Gly Arg Gly
1 5 10 15
Ala Val Gly Ala Leu Thr Asp Glu Val Lys Arg Arg Gly Tyr Gln Lys
20 25 30
Ala Leu Ile Val Thr Asp Lys Thr Leu Val Gln Cys Gly Val Val Ala
35 40 45
Lys Val Thr Asp Lys Met Asp Ala Ala Gly Leu Ala Trp Ala Ile Tyr
50 55 60
Asp Gly Val Val Pro Asn Pro Thr Ile Thr Val Val Lys Glu Gly Leu
65 70 75 80
Gly Val Phe Gln Asn Ser Gly Ala Asp Tyr Leu Ile Ala Ile Gly Gly
85 90 95
Gly Ser Pro Gln Asp Thr Cys Lys Ala Ile Gly Ile Ile Ser Asn Asn
100 105 110
Pro Glu Phe Ala Asp Val Arg Ser Leu Glu Gly Leu Ser Pro Thr Asn
115 120 125
Lys Pro Ser Val Pro Ile Leu Ala Ile Pro Thr Thr Ala Gly Thr Ala
130 135 140
Ala Glu Val Thr Ile Asn Tyr Val Ile Thr Asp Glu Glu Lys Arg Arg
145 150 155 160
Lys Phe Val Cys Val Asp Pro His Asp Ile Pro Gln Val Ala Phe Ile
165 170 175
Asp Ala Asp Met Met Asp Gly Met Pro Pro Ala Leu Lys Ala Ala Thr
180 185 190
Gly Val Asp Ala Leu Thr His Ala Ile Glu Gly Tyr Ile Thr Arg Gly
195 200 205
Ala Trp Ala Leu Thr Asp Ala Leu His Ile Lys Ala Ile Glu Ile Ile
210 215 220
Ala Gly Ala Leu Arg Gly Ser Val Ala Gly Asp Lys Asp Ala Gly Glu
225 230 235 240
Glu Met Ala Leu Gly Gln Tyr Val Ala Gly Met Gly Phe Ser Asn Val
245 250 255
Gly Leu Gly Leu Val His Gly Met Ala His Pro Leu Gly Ala Phe Tyr
260 265 270
Asn Thr Pro His Gly Val Ala Asn Ala Ile Leu Leu Pro His Val Met
275 280 285
Arg Tyr Asn Ala Asp Phe Thr Gly Glu Lys Tyr Arg Asp Ile Ala Arg
290 295 300
Val Met Gly Val Lys Val Glu Gly Met Ser Leu Glu Glu Ala Arg Asn
305 310 315 320
Ala Ala Val Glu Ala Val Phe Ala Leu Asn Arg Asp Val Gly Ile Pro
325 330 335
Pro His Leu Arg Asp Val Gly Val Arg Lys Glu Asp Ile Pro Ala Leu
340 345 350
Ala Gln Ala Ala Leu Asp Asp Val Cys Thr Gly Gly Asn Pro Arg Glu
355 360 365
Ala Thr Leu Glu Asp Ile Val Glu Leu Tyr His Thr Ala Trp
370 375 380
<210> 29
<211> 804
<212> DNA
<213> 大肠杆菌
<400> 29
atggctatcc ctgcatttgg tttaggtact ttccgtctga aagacgacgt tgttatttca 60
tctgtgataa cggcgcttga acttggttat cgcgcaattg ataccgcaca aatctatgat 120
aacgaagccg cagtaggtca ggcgattgca gaaagtggcg tgccacgtca tgaactctac 180
atcaccacta aaatctggat tgaaaatctc agcaaagaca aattgatccc aagtctgaaa 240
gagagcctgc aaaaattgcg taccgattat gttgatctga cgctaatcca ctggccgtca 300
ccaaacgatg aagtctctgt tgaagagttt atgcaggcgc tgctggaagc caaaaaacaa 360
gggctgacgc gtgagatcgg tatttccaac ttcacgatcc cgttgatgga aaaagcgatt 420
gctgctgttg gtgctgaaaa catcgctact aaccagattg aactctctcc ttatctgcaa 480
aaccgtaaag tggttgcctg ggctaaacag cacggcatcc atattacttc ctatatgacg 540
ctggcgtatg gtaaggccct gaaagatgag gttattgctc gtatcgcagc taaacacaat 600
gcgactccgg cacaagtgat tctggcgtgg gctatggggg aaggttactc agtaattcct 660
tcttctacta aacgtaaaaa cctggaaagt aatcttaagg cacaaaattt acagcttgat 720
gccgaagata aaaaagcgat cgccgcactg gattgcaacg accgcctggt tagcccggaa 780
ggtctggctc ctgaatggga ttaa 804
<210> 30
<211> 267
<212> PRT
<213> 大肠杆菌
<400> 30
Met Ala Ile Pro Ala Phe Gly Leu Gly Thr Phe Arg Leu Lys Asp Asp
1 5 10 15
Val Val Ile Ser Ser Val Ile Thr Ala Leu Glu Leu Gly Tyr Arg Ala
20 25 30
Ile Asp Thr Ala Gln Ile Tyr Asp Asn Glu Ala Ala Val Gly Gln Ala
35 40 45
Ile Ala Glu Ser Gly Val Pro Arg His Glu Leu Tyr Ile Thr Thr Lys
50 55 60
Ile Trp Ile Glu Asn Leu Ser Lys Asp Lys Leu Ile Pro Ser Leu Lys
65 70 75 80
Glu Ser Leu Gln Lys Leu Arg Thr Asp Tyr Val Asp Leu Thr Leu Ile
85 90 95
His Trp Pro Ser Pro Asn Asp Glu Val Ser Val Glu Glu Phe Met Gln
100 105 110
Ala Leu Leu Glu Ala Lys Lys Gln Gly Leu Thr Arg Glu Ile Gly Ile
115 120 125
Ser Asn Phe Thr Ile Pro Leu Met Glu Lys Ala Ile Ala Ala Val Gly
130 135 140
Ala Glu Asn Ile Ala Thr Asn Gln Ile Glu Leu Ser Pro Tyr Leu Gln
145 150 155 160
Asn Arg Lys Val Val Ala Trp Ala Lys Gln His Gly Ile His Ile Thr
165 170 175
Ser Tyr Met Thr Leu Ala Tyr Gly Lys Ala Leu Lys Asp Glu Val Ile
180 185 190
Ala Arg Ile Ala Ala Lys His Asn Ala Thr Pro Ala Gln Val Ile Leu
195 200 205
Ala Trp Ala Met Gly Glu Gly Tyr Ser Val Ile Pro Ser Ser Thr Lys
210 215 220
Arg Lys Asn Leu Glu Ser Asn Leu Lys Ala Gln Asn Leu Gln Leu Asp
225 230 235 240
Ala Glu Asp Lys Lys Ala Ile Ala Ala Leu Asp Cys Asn Asp Arg Leu
245 250 255
Val Ser Pro Glu Gly Leu Ala Pro Glu Trp Asp
260 265
<210> 31
<211> 828
<212> DNA
<213> 大肠杆菌
<400> 31
atggctaatc caaccgttat taagctacag gatggcaatg tcatgcccca gctgggactg 60
ggcgtctggc aagcaagtaa tgaggaagta atcaccgcca ttcaaaaagc gttagaagtg 120
ggttatcgct cgattgatac cgccgcggcc tacaagaacg aagaaggtgt cggcaaagcc 180
ctgaaaaatg cctcagtcaa cagagaagaa ctgttcatca ccactaagct gtggaacgac 240
gaccacaagc gcccccgcga agccctgctc gacagcctga aaaaactcca gcttgattat 300
atcgacctct acttaatgca ctggcccgtt cccgctatcg accattatgt cgaagcatgg 360
aaaggcatga tcgaattgca aaaagaggga ttaatcaaaa gcatcggcgt gtgcaacttc 420
cagatccatc acctgcaacg cctgattgat gaaactggcg tgacgcctgt gataaaccag 480
atcgaacttc atccgctgat gcaacaacgc cagctacacg cctggaacgc gacacacaaa 540
atccagaccg aatcctggag cccattagcg caaggaggga aaggcgtttt cgatcagaaa 600
gtcattcgcg atctggcaga taaatacggc aaaaccccgg cgcagattgt tatccgctgg 660
catctggata gcggcctggt ggtgatcccg aaatcggtca caccttcacg tattgccgaa 720
aactttgatg tctgggattt ccgtctcgac aaagacgaac tcggcgaaat tgcaaaactc 780
gatcagggca agcgtctcgg tcccgatcct gaccagttcg gcggctaa 828
<210> 32
<211> 275
<212> PRT
<213> 大肠杆菌
<400> 32
Met Ala Asn Pro Thr Val Ile Lys Leu Gln Asp Gly Asn Val Met Pro
1 5 10 15
Gln Leu Gly Leu Gly Val Trp Gln Ala Ser Asn Glu Glu Val Ile Thr
20 25 30
Ala Ile Gln Lys Ala Leu Glu Val Gly Tyr Arg Ser Ile Asp Thr Ala
35 40 45
Ala Ala Tyr Lys Asn Glu Glu Gly Val Gly Lys Ala Leu Lys Asn Ala
50 55 60
Ser Val Asn Arg Glu Glu Leu Phe Ile Thr Thr Lys Leu Trp Asn Asp
65 70 75 80
Asp His Lys Arg Pro Arg Glu Ala Leu Leu Asp Ser Leu Lys Lys Leu
85 90 95
Gln Leu Asp Tyr Ile Asp Leu Tyr Leu Met His Trp Pro Val Pro Ala
100 105 110
Ile Asp His Tyr Val Glu Ala Trp Lys Gly Met Ile Glu Leu Gln Lys
115 120 125
Glu Gly Leu Ile Lys Ser Ile Gly Val Cys Asn Phe Gln Ile His His
130 135 140
Leu Gln Arg Leu Ile Asp Glu Thr Gly Val Thr Pro Val Ile Asn Gln
145 150 155 160
Ile Glu Leu His Pro Leu Met Gln Gln Arg Gln Leu His Ala Trp Asn
165 170 175
Ala Thr His Lys Ile Gln Thr Glu Ser Trp Ser Pro Leu Ala Gln Gly
180 185 190
Gly Lys Gly Val Phe Asp Gln Lys Val Ile Arg Asp Leu Ala Asp Lys
195 200 205
Tyr Gly Lys Thr Pro Ala Gln Ile Val Ile Arg Trp His Leu Asp Ser
210 215 220
Gly Leu Val Val Ile Pro Lys Ser Val Thr Pro Ser Arg Ile Ala Glu
225 230 235 240
Asn Phe Asp Val Trp Asp Phe Arg Leu Asp Lys Asp Glu Leu Gly Glu
245 250 255
Ile Ala Lys Leu Asp Gln Gly Lys Arg Leu Gly Pro Asp Pro Asp Gln
260 265 270
Phe Gly Gly
275
<210> 33
<211> 1179
<212> DNA
<213> 丙酮丁醇梭菌(Clostridium acetobutylicum)
<400> 33
atgaaagaag ttgtaatagc tagtgcagta agaacagcga ttggatctta tggaaagtct 60
cttaaggatg taccagcagt agatttagga gctacagcta taaaggaagc agttaaaaaa 120
gcaggaataa aaccagagga tgttaatgaa gtcattttag gaaatgttct tcaagcaggt 180
ttaggacaga atccagcaag acaggcatct tttaaagcag gattaccagt tgaaattcca 240
gctatgacta ttaataaggt ttgtggttca ggacttagaa cagttagctt agcagcacaa 300
attataaaag caggagatgc tgacgtaata atagcaggtg gtatggaaaa tatgtctaga 360
gctccttact tagcgaataa cgctagatgg ggatatagaa tgggaaacgc taaatttgtt 420
gatgaaatga tcactgacgg attgtgggat gcatttaatg attaccacat gggaataaca 480
gcagaaaaca tagctgagag atggaacatt tcaagagaag aacaagatga gtttgctctt 540
gcatcacaaa aaaaagctga agaagctata aaatcaggtc aatttaaaga tgaaatagtt 600
cctgtagtaa ttaaaggcag aaagggagaa actgtagttg atacagatga gcaccctaga 660
tttggatcaa ctatagaagg acttgcaaaa ttaaaacctg ccttcaaaaa agatggaaca 720
gttacagctg gtaatgcatc aggattaaat gactgtgcag cagtacttgt aatcatgagt 780
gcagaaaaag ctaaagagct tggagtaaaa ccacttgcta agatagtttc ttatggttca 840
gcaggagttg acccagcaat aatgggatat ggacctttct atgcaacaaa agcagctatt 900
gaaaaagcag gttggacagt tgatgaatta gatttaatag aatcaaatga agcttttgca 960
gctcaaagtt tagcagtagc aaaagattta aaatttgata tgaataaagt aaatgtaaat 1020
ggaggagcta ttgcccttgg tcatccaatt ggagcatcag gtgcaagaat actcgttact 1080
cttgtacacg caatgcaaaa aagagatgca aaaaaaggct tagcaacttt atgtataggt 1140
ggcggacaag gaacagcaat attgctagaa aagtgctag 1179
<210> 34
<211> 1179
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的丙酮丁醇梭菌序列
<400> 34
atgaaagaag ttgttattgc gagcgcggtt cgtaccgcga ttggcagcta tggcaagagc 60
ctgaaggatg ttccggcggt ggacctgggt gcgaccgcga tcaaagaggc ggttaagaaa 120
gcgggcatta aaccggagga tgtgaacgaa gttatcctgg gtaacgtgct gcaagcgggt 180
ctgggccaaa acccggcgcg tcaggcgagc ttcaaggcgg gcctgccggt tgaaatcccg 240
gcgatgacca ttaacaaagt ttgcggtagc ggcctgcgta ccgtgagcct ggcggcgcaa 300
atcattaagg cgggtgacgc ggatgttatc attgcgggtg gcatggagaa catgagccgt 360
gcgccgtacc tggcgaacaa cgcgcgttgg ggttatcgta tgggcaacgc gaaattcgtg 420
gacgaaatga ttaccgacgg tctgtgggat gcgtttaacg actaccacat gggcatcacc 480
gcggagaaca ttgcggaacg ttggaacatt agccgtgagg aacaagatga gttcgcgctg 540
gcgagccaga agaaagcgga ggaagcgatc aagagcggcc agtttaaaga cgaaatcgtt 600
ccggtggtta ttaagggtcg taagggtgaa accgtggtgg acaccgatga acacccgcgt 660
ttcggtagca ccattgaggg cctggcgaag ctgaaaccgg cgtttaagaa agatggcacc 720
gtgaccgcgg gtaacgcgag cggcctgaac gactgcgcgg cggtgctggt tatcatgagc 780
gcggagaagg cgaaagaact gggtgtgaag ccgctggcga aaattgttag ctacggtagc 840
gcgggtgtgg acccggcgat catgggttac ggcccgtttt atgcgaccaa ggcggcgatt 900
gagaaagcgg gttggaccgt ggacgaactg gatctgatcg agagcaacga agcgttcgcg 960
gcgcaaagcc tggcggtggc gaaggatctg aaatttgaca tgaacaaggt gaacgtgaac 1020
ggtggtgcga ttgcgctggg tcacccgatt ggtgcgagcg gcgcgcgtat cctggtgacc 1080
ctggttcacg cgatgcagaa acgtgacgcg aagaaaggtc tggcgaccct gtgcattggt 1140
ggtggtcaag gcaccgcgat tctgctggaa aagtgctaa 1179
<210> 35
<211> 392
<212> PRT
<213> 丙酮丁醇梭菌
<400> 35
Met Lys Glu Val Val Ile Ala Ser Ala Val Arg Thr Ala Ile Gly Ser
1 5 10 15
Tyr Gly Lys Ser Leu Lys Asp Val Pro Ala Val Asp Leu Gly Ala Thr
20 25 30
Ala Ile Lys Glu Ala Val Lys Lys Ala Gly Ile Lys Pro Glu Asp Val
35 40 45
Asn Glu Val Ile Leu Gly Asn Val Leu Gln Ala Gly Leu Gly Gln Asn
50 55 60
Pro Ala Arg Gln Ala Ser Phe Lys Ala Gly Leu Pro Val Glu Ile Pro
65 70 75 80
Ala Met Thr Ile Asn Lys Val Cys Gly Ser Gly Leu Arg Thr Val Ser
85 90 95
Leu Ala Ala Gln Ile Ile Lys Ala Gly Asp Ala Asp Val Ile Ile Ala
100 105 110
Gly Gly Met Glu Asn Met Ser Arg Ala Pro Tyr Leu Ala Asn Asn Ala
115 120 125
Arg Trp Gly Tyr Arg Met Gly Asn Ala Lys Phe Val Asp Glu Met Ile
130 135 140
Thr Asp Gly Leu Trp Asp Ala Phe Asn Asp Tyr His Met Gly Ile Thr
145 150 155 160
Ala Glu Asn Ile Ala Glu Arg Trp Asn Ile Ser Arg Glu Glu Gln Asp
165 170 175
Glu Phe Ala Leu Ala Ser Gln Lys Lys Ala Glu Glu Ala Ile Lys Ser
180 185 190
Gly Gln Phe Lys Asp Glu Ile Val Pro Val Val Ile Lys Gly Arg Lys
195 200 205
Gly Glu Thr Val Val Asp Thr Asp Glu His Pro Arg Phe Gly Ser Thr
210 215 220
Ile Glu Gly Leu Ala Lys Leu Lys Pro Ala Phe Lys Lys Asp Gly Thr
225 230 235 240
Val Thr Ala Gly Asn Ala Ser Gly Leu Asn Asp Cys Ala Ala Val Leu
245 250 255
Val Ile Met Ser Ala Glu Lys Ala Lys Glu Leu Gly Val Lys Pro Leu
260 265 270
Ala Lys Ile Val Ser Tyr Gly Ser Ala Gly Val Asp Pro Ala Ile Met
275 280 285
Gly Tyr Gly Pro Phe Tyr Ala Thr Lys Ala Ala Ile Glu Lys Ala Gly
290 295 300
Trp Thr Val Asp Glu Leu Asp Leu Ile Glu Ser Asn Glu Ala Phe Ala
305 310 315 320
Ala Gln Ser Leu Ala Val Ala Lys Asp Leu Lys Phe Asp Met Asn Lys
325 330 335
Val Asn Val Asn Gly Gly Ala Ile Ala Leu Gly His Pro Ile Gly Ala
340 345 350
Ser Gly Ala Arg Ile Leu Val Thr Leu Val His Ala Met Gln Lys Arg
355 360 365
Asp Ala Lys Lys Gly Leu Ala Thr Leu Cys Ile Gly Gly Gly Gln Gly
370 375 380
Thr Ala Ile Leu Leu Glu Lys Cys
385 390
<210> 36
<211> 1185
<212> DNA
<213> 大肠杆菌
<400> 36
atgaaaaatt gtgtcatcgt cagtgcggta cgtactgcta tcggtagttt taacggttca 60
ctcgcttcca ccagcgccat cgacctgggg gcgacagtaa ttaaagccgc cattgaacgt 120
gcaaaaatcg attcacaaca cgttgatgaa gtgattatgg gtaacgtgtt acaagccggg 180
ctggggcaaa atccggcgcg tcaggcactg ttaaaaagcg ggctggcaga aacggtgtgc 240
ggattcacgg tcaataaagt atgtggttcg ggtcttaaaa gtgtggcgct tgccgcccag 300
gccattcagg caggtcaggc gcagagcatt gtggcggggg gtatggaaaa tatgagttta 360
gccccctact tactcgatgc aaaagcacgc tctggttatc gtcttggaga cggacaggtt 420
tatgacgtaa tcctgcgcga tggcctgatg tgcgccaccc atggttatca tatggggatt 480
accgccgaaa acgtggctaa agagtacgga attacccgtg aaatgcagga tgaactggcg 540
ctacattcac agcgtaaagc ggcagccgca attgagtccg gtgcttttac agccgaaatc 600
gtcccggtaa atgttgtcac tcgaaagaaa accttcgtct tcagtcaaga cgaattcccg 660
aaagcgaatt caacggctga agcgttaggt gcattgcgcc cggccttcga taaagcagga 720
acagtcaccg ctgggaacgc gtctggtatt aacgacggtg ctgccgctct ggtgattatg 780
gaagaatctg cggcgctggc agcaggcctt acccccctgg ctcgcattaa aagttatgcc 840
agcggtggcg tgccccccgc attgatgggt atggggccag tacctgccac gcaaaaagcg 900
ttacaactgg cggggctgca actggcggat attgatctca ttgaggctaa tgaagcattt 960
gctgcacagt tccttgccgt tgggaaaaac ctgggctttg attctgagaa agtgaatgtc 1020
aacggcgggg ccatcgcgct cgggcatcct atcggtgcca gtggtgctcg tattctggtc 1080
acactattac atgccatgca ggcacgcgat aaaacgctgg ggctggcaac actgtgcatt 1140
ggcggcggtc agggaattgc gatggtgatt gaacggttga attaa 1185
<210> 37
<211> 394
<212> PRT
<213> 大肠杆菌
<400> 37
Met Lys Asn Cys Val Ile Val Ser Ala Val Arg Thr Ala Ile Gly Ser
1 5 10 15
Phe Asn Gly Ser Leu Ala Ser Thr Ser Ala Ile Asp Leu Gly Ala Thr
20 25 30
Val Ile Lys Ala Ala Ile Glu Arg Ala Lys Ile Asp Ser Gln His Val
35 40 45
Asp Glu Val Ile Met Gly Asn Val Leu Gln Ala Gly Leu Gly Gln Asn
50 55 60
Pro Ala Arg Gln Ala Leu Leu Lys Ser Gly Leu Ala Glu Thr Val Cys
65 70 75 80
Gly Phe Thr Val Asn Lys Val Cys Gly Ser Gly Leu Lys Ser Val Ala
85 90 95
Leu Ala Ala Gln Ala Ile Gln Ala Gly Gln Ala Gln Ser Ile Val Ala
100 105 110
Gly Gly Met Glu Asn Met Ser Leu Ala Pro Tyr Leu Leu Asp Ala Lys
115 120 125
Ala Arg Ser Gly Tyr Arg Leu Gly Asp Gly Gln Val Tyr Asp Val Ile
130 135 140
Leu Arg Asp Gly Leu Met Cys Ala Thr His Gly Tyr His Met Gly Ile
145 150 155 160
Thr Ala Glu Asn Val Ala Lys Glu Tyr Gly Ile Thr Arg Glu Met Gln
165 170 175
Asp Glu Leu Ala Leu His Ser Gln Arg Lys Ala Ala Ala Ala Ile Glu
180 185 190
Ser Gly Ala Phe Thr Ala Glu Ile Val Pro Val Asn Val Val Thr Arg
195 200 205
Lys Lys Thr Phe Val Phe Ser Gln Asp Glu Phe Pro Lys Ala Asn Ser
210 215 220
Thr Ala Glu Ala Leu Gly Ala Leu Arg Pro Ala Phe Asp Lys Ala Gly
225 230 235 240
Thr Val Thr Ala Gly Asn Ala Ser Gly Ile Asn Asp Gly Ala Ala Ala
245 250 255
Leu Val Ile Met Glu Glu Ser Ala Ala Leu Ala Ala Gly Leu Thr Pro
260 265 270
Leu Ala Arg Ile Lys Ser Tyr Ala Ser Gly Gly Val Pro Pro Ala Leu
275 280 285
Met Gly Met Gly Pro Val Pro Ala Thr Gln Lys Ala Leu Gln Leu Ala
290 295 300
Gly Leu Gln Leu Ala Asp Ile Asp Leu Ile Glu Ala Asn Glu Ala Phe
305 310 315 320
Ala Ala Gln Phe Leu Ala Val Gly Lys Asn Leu Gly Phe Asp Ser Glu
325 330 335
Lys Val Asn Val Asn Gly Gly Ala Ile Ala Leu Gly His Pro Ile Gly
340 345 350
Ala Ser Gly Ala Arg Ile Leu Val Thr Leu Leu His Ala Met Gln Ala
355 360 365
Arg Asp Lys Thr Leu Gly Leu Ala Thr Leu Cys Ile Gly Gly Gly Gln
370 375 380
Gly Ile Ala Met Val Ile Glu Arg Leu Asn
385 390
<210> 38
<211> 1197
<212> DNA
<213> 酿酒酵母
<400> 38
atgtctcaga acgtttacat tgtatcgact gccagaaccc caattggttc attccagggt 60
tctctatcct ccaagacagc agtggaattg ggtgctgttg ctttaaaagg cgccttggct 120
aaggttccag aattggatgc atccaaggat tttgacgaaa ttatttttgg taacgttctt 180
tctgccaatt tgggccaagc tccggccaga caagttgctt tggctgccgg tttgagtaat 240
catatcgttg caagcacagt taacaaggtc tgtgcatccg ctatgaaggc aatcattttg 300
ggtgctcaat ccatcaaatg tggtaatgct gatgttgtcg tagctggtgg ttgtgaatct 360
atgactaacg caccatacta catgccagca gcccgtgcgg gtgccaaatt tggccaaact 420
gttcttgttg atggtgtcga aagagatggg ttgaacgatg cgtacgatgg tctagccatg 480
ggtgtacacg cagaaaagtg tgcccgtgat tgggatatta ctagagaaca acaagacaat 540
tttgccatcg aatcctacca aaaatctcaa aaatctcaaa aggaaggtaa attcgacaat 600
gaaattgtac ctgttaccat taagggattt agaggtaagc ctgatactca agtcacgaag 660
gacgaggaac ctgctagatt acacgttgaa aaattgagat ctgcaaggac tgttttccaa 720
aaagaaaacg gtactgttac tgccgctaac gcttctccaa tcaacgatgg tgctgcagcc 780
gtcatcttgg tttccgaaaa agttttgaag gaaaagaatt tgaagccttt ggctattatc 840
aaaggttggg gtgaggccgc tcatcaacca gctgatttta catgggctcc atctcttgca 900
gttccaaagg ctttgaaaca tgctggcatc gaagacatca attctgttga ttactttgaa 960
ttcaatgaag ccttttcggt tgtcggtttg gtgaacacta agattttgaa gctagaccca 1020
tctaaggtta atgtatatgg tggtgctgtt gctctaggtc acccattggg ttgttctggt 1080
gctagagtgg ttgttacact gctatccatc ttacagcaag aaggaggtaa gatcggtgtt 1140
gccgccattt gtaatggtgg tggtggtgct tcctctattg tcattgaaaa gatatga 1197
<210> 39
<211> 1197
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的酿酒酵母序列
<400> 39
atgtctcaga acgtttacat tgtatcgact gccagaaccc caattggttc attccagggt 60
tctctatcct ccaagacagc agtggaattg ggtgctgttg ctttaaaagg cgccttggct 120
aaggttccag aattggatgc atccaaggat tttgacgaaa ttatttttgg taacgttctt 180
tctgccaatt tgggccaagc tccggccaga caagttgctt tggctgccgg tttgagtaat 240
catatcgttg caagcacagt taacaaggtc tgtgcatccg ctatgaaggc aatcattttg 300
ggtgctcaat ccatcaaatg tggtaatgct gatgttgtcg tagctggtgg ttgtgaatct 360
atgactaacg caccatacta catgccagca gcccgtgcgg gtgccaaatt tggccaaact 420
gttcttgttg atggtgtcga aagagatggg ttgaacgatg cgtacgatgg tctagccatg 480
ggtgtacacg cagaaaagtg tgcccgtgat tgggatatta ctagagaaca acaagacaat 540
tttgccatcg aatcctacca aaaatctcaa aaatctcaaa aggaaggtaa attcgacaat 600
gaaattgtac ctgttaccat taagggattt agaggtaagc ctgatactca agtcacgaag 660
gacgaggaac ctgctagatt acacgttgaa aaattgagat ctgcaaggac tgttttccaa 720
aaagaaaacg gtactgttac tgccgctaac gcttctccaa tcaacgatgg tgctgcagcc 780
gtcatcttgg tttccgaaaa agttttgaag gaaaagaatt tgaagccttt ggctattatc 840
aaaggttggg gtgaggccgc tcatcaacca gctgatttta catgggctcc atctcttgca 900
gttccaaagg ctttgaaaca tgctggcatc gaagacatca attctgttga ttactttgaa 960
ttcaatgaag ccttttcggt tgtcggtttg gtgaacacta agattttgaa gctagaccca 1020
tctaaggtta atgtatatgg tggtgctgtt gctctaggtc acccattggg ttgttctggt 1080
gctagagtgg ttgttacact gctatccatc ttacagcaag aaggaggtaa gatcggtgtt 1140
gccgccattt gtaatggtgg tggtggtgct tcctctattg tcattgaaaa gatatga 1197
<210> 40
<211> 398
<212> PRT
<213> 酿酒酵母
<400> 40
Met Ser Gln Asn Val Tyr Ile Val Ser Thr Ala Arg Thr Pro Ile Gly
1 5 10 15
Ser Phe Gln Gly Ser Leu Ser Ser Lys Thr Ala Val Glu Leu Gly Ala
20 25 30
Val Ala Leu Lys Gly Ala Leu Ala Lys Val Pro Glu Leu Asp Ala Ser
35 40 45
Lys Asp Phe Asp Glu Ile Ile Phe Gly Asn Val Leu Ser Ala Asn Leu
50 55 60
Gly Gln Ala Pro Ala Arg Gln Val Ala Leu Ala Ala Gly Leu Ser Asn
65 70 75 80
His Ile Val Ala Ser Thr Val Asn Lys Val Cys Ala Ser Ala Met Lys
85 90 95
Ala Ile Ile Leu Gly Ala Gln Ser Ile Lys Cys Gly Asn Ala Asp Val
100 105 110
Val Val Ala Gly Gly Cys Glu Ser Met Thr Asn Ala Pro Tyr Tyr Met
115 120 125
Pro Ala Ala Arg Ala Gly Ala Lys Phe Gly Gln Thr Val Leu Val Asp
130 135 140
Gly Val Glu Arg Asp Gly Leu Asn Asp Ala Tyr Asp Gly Leu Ala Met
145 150 155 160
Gly Val His Ala Glu Lys Cys Ala Arg Asp Trp Asp Ile Thr Arg Glu
165 170 175
Gln Gln Asp Asn Phe Ala Ile Glu Ser Tyr Gln Lys Ser Gln Lys Ser
180 185 190
Gln Lys Glu Gly Lys Phe Asp Asn Glu Ile Val Pro Val Thr Ile Lys
195 200 205
Gly Phe Arg Gly Lys Pro Asp Thr Gln Val Thr Lys Asp Glu Glu Pro
210 215 220
Ala Arg Leu His Val Glu Lys Leu Arg Ser Ala Arg Thr Val Phe Gln
225 230 235 240
Lys Glu Asn Gly Thr Val Thr Ala Ala Asn Ala Ser Pro Ile Asn Asp
245 250 255
Gly Ala Ala Ala Val Ile Leu Val Ser Glu Lys Val Leu Lys Glu Lys
260 265 270
Asn Leu Lys Pro Leu Ala Ile Ile Lys Gly Trp Gly Glu Ala Ala His
275 280 285
Gln Pro Ala Asp Phe Thr Trp Ala Pro Ser Leu Ala Val Pro Lys Ala
290 295 300
Leu Lys His Ala Gly Ile Glu Asp Ile Asn Ser Val Asp Tyr Phe Glu
305 310 315 320
Phe Asn Glu Ala Phe Ser Val Val Gly Leu Val Asn Thr Lys Ile Leu
325 330 335
Lys Leu Asp Pro Ser Lys Val Asn Val Tyr Gly Gly Ala Val Ala Leu
340 345 350
Gly His Pro Leu Gly Cys Ser Gly Ala Arg Val Val Val Thr Leu Leu
355 360 365
Ser Ile Leu Gln Gln Glu Gly Gly Lys Ile Gly Val Ala Ala Ile Cys
370 375 380
Asn Gly Gly Gly Gly Ala Ser Ser Ile Val Ile Glu Lys Ile
385 390 395
<210> 41
<211> 651
<212> DNA
<213> 大肠杆菌
<400> 41
atggatgcga aacaacgtat tgcgcgccgt gtggcgcaag agcttcgtga tggtgacatc 60
gttaacttag ggatcggttt acccacaatg gtcgccaatt atttaccgga gggtattcat 120
atcactctgc aatcggaaaa cggcttcctc ggtttaggcc cggtcacgac agcgcatcca 180
gatctggtga acgctggcgg gcaaccgtgc ggtgttttac ccggtgcagc catgtttgat 240
agcgccatgt catttgcgct aatccgtggc ggtcatattg atgcctgcgt gctcggcggt 300
ttgcaagtag acgaagaagc aaacctcgcg aactgggtag tgcctgggaa aatggtgccc 360
ggtatgggtg gcgcgatgga tctggtgacc gggtcgcgca aagtgatcat cgccatggaa 420
cattgcgcca aagatggttc agcaaaaatt ttgcgccgct gcaccatgcc actcactgcg 480
caacatgcgg tgcatatgct ggttactgaa ctggctgtct ttcgttttat tgacggcaaa 540
atgtggctca ccgaaattgc cgacgggtgt gatttagcca ccgtgcgtgc caaaacagaa 600
gctcggtttg aagtcgccgc cgatctgaat acgcaacggg gtgatttatg a 651
<210> 42
<211> 651
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的大肠杆菌序列
<400> 42
atggatgcga aacaacgtat tgcgcgccgt gtggcgcaag agcttcgtga tggtgacatc 60
gttaacttag ggatcggttt acccacaatg gtcgccaatt atttaccgga gggtattcat 120
atcactctgc aatcggaaaa cggcttcctc ggtttaggcc cggtcacgac agcgcatcca 180
gatctggtga acgctggcgg gcaaccgtgc ggtgttttac ccggtgcagc catgtttgat 240
agcgccatgt catttgcgct aatccgtggc ggtcatattg atgcctgcgt gctcggcggt 300
ttgcaagtag acgaagaagc aaacctcgcg aactgggtag tgcctgggaa aatggtgccc 360
ggtatgggtg gcgcgatgga tctggtgacc gggtcgcgca aagtgatcat cgccatggaa 420
cattgcgcca aagatggttc agcaaaaatt ttgcgccgct gcaccatgcc actcactgcg 480
caacatgcgg tgcatatgct ggttactgaa ctggctgtct ttcgttttat tgacggcaaa 540
atgtggctca ccgaaattgc cgacgggtgt gatttagcca ccgtgcgtgc caaaacagaa 600
gctcggtttg aagtcgccgc cgatctgaat acgcaacggg gtgatttatg a 651
<210> 43
<211> 216
<212> PRT
<213> 大肠杆菌
<400> 43
Met Asp Ala Lys Gln Arg Ile Ala Arg Arg Val Ala Gln Glu Leu Arg
1 5 10 15
Asp Gly Asp Ile Val Asn Leu Gly Ile Gly Leu Pro Thr Met Val Ala
20 25 30
Asn Tyr Leu Pro Glu Gly Ile His Ile Thr Leu Gln Ser Glu Asn Gly
35 40 45
Phe Leu Gly Leu Gly Pro Val Thr Thr Ala His Pro Asp Leu Val Asn
50 55 60
Ala Gly Gly Gln Pro Cys Gly Val Leu Pro Gly Ala Ala Met Phe Asp
65 70 75 80
Ser Ala Met Ser Phe Ala Leu Ile Arg Gly Gly His Ile Asp Ala Cys
85 90 95
Val Leu Gly Gly Leu Gln Val Asp Glu Glu Ala Asn Leu Ala Asn Trp
100 105 110
Val Val Pro Gly Lys Met Val Pro Gly Met Gly Gly Ala Met Asp Leu
115 120 125
Val Thr Gly Ser Arg Lys Val Ile Ile Ala Met Glu His Cys Ala Lys
130 135 140
Asp Gly Ser Ala Lys Ile Leu Arg Arg Cys Thr Met Pro Leu Thr Ala
145 150 155 160
Gln His Ala Val His Met Leu Val Thr Glu Leu Ala Val Phe Arg Phe
165 170 175
Ile Asp Gly Lys Met Trp Leu Thr Glu Ile Ala Asp Gly Cys Asp Leu
180 185 190
Ala Thr Val Arg Ala Lys Thr Glu Ala Arg Phe Glu Val Ala Ala Asp
195 200 205
Leu Asn Thr Gln Arg Gly Asp Leu
210 215
<210> 44
<211> 663
<212> DNA
<213> 大肠杆菌
<400> 44
atgaaaacaa aattgatgac attacaagac gccaccggct tctttcgtga cggcatgacc 60
atcatggtgg gcggatttat ggggattggc actccatccc gcctggttga agcattactg 120
gaatctggtg ttcgcgacct gacattgata gccaatgata ccgcgtttgt tgataccggc 180
atcggtccgc tcatcgtcaa tggtcgagtc cgcaaagtga ttgcttcaca tatcggcacc 240
aacccggaaa caggtcggcg catgatatct ggtgagatgg acgtcgttct ggtgccgcaa 300
ggtacgctaa tcgagcaaat tcgctgtggt ggagctggac ttggtggttt tctcacccca 360
acgggtgtcg gcaccgtcgt agaggaaggc aaacagacac tgacactcga cggtaaaacc 420
tggctgctcg aacgcccact gcgcgccgac ctggcgctaa ttcgcgctca tcgttgcgac 480
acacttggca acctgaccta tcaacttagc gcccgcaact ttaaccccct gatagccctt 540
gcggctgata tcacgctggt agagccagat gaactggtcg aaaccggcga gctgcaacct 600
gaccatattg tcacccctgg tgccgttatc gaccacatca tcgtttcaca ggagagcaaa 660
taa 663
<210> 45
<211> 663
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的大肠杆菌序列
<400> 45
atgaaaacaa aattgatgac attacaagac gccaccggct tctttcgtga cggcatgacc 60
atcatggtgg gcggatttat ggggattggc actccatccc gcctggttga agcattactg 120
gaatctggtg ttcgcgacct gacattgata gccaatgata ccgcgtttgt tgataccggc 180
atcggtccgc tcatcgtcaa tggtcgagtc cgcaaagtga ttgcttcaca tatcggcacc 240
aacccggaaa caggtcggcg catgatatct ggtgagatgg acgtcgttct ggtgccgcaa 300
ggtacgctaa tcgagcaaat tcgctgtggt ggagctggac ttggtggttt tctcacccca 360
acgggtgtcg gcaccgtcgt agaggaaggc aaacagacac tgacactcga cggtaaaacc 420
tggctgctcg aacgcccact gcgcgccgac ctggcgctaa ttcgcgctca tcgttgcgac 480
acacttggca acctgaccta tcaacttagc gcccgcaact ttaaccccct gatagccctt 540
gcggctgata tcacgctggt agagccagat gaactggtcg aaaccggcga gctgcaacct 600
gaccatattg tcacccctgg tgccgttatc gaccacatca tcgtttcaca ggagagcaaa 660
taa 663
<210> 46
<211> 220
<212> PRT
<213> 大肠杆菌
<400> 46
Met Lys Thr Lys Leu Met Thr Leu Gln Asp Ala Thr Gly Phe Phe Arg
1 5 10 15
Asp Gly Met Thr Ile Met Val Gly Gly Phe Met Gly Ile Gly Thr Pro
20 25 30
Ser Arg Leu Val Glu Ala Leu Leu Glu Ser Gly Val Arg Asp Leu Thr
35 40 45
Leu Ile Ala Asn Asp Thr Ala Phe Val Asp Thr Gly Ile Gly Pro Leu
50 55 60
Ile Val Asn Gly Arg Val Arg Lys Val Ile Ala Ser His Ile Gly Thr
65 70 75 80
Asn Pro Glu Thr Gly Arg Arg Met Ile Ser Gly Glu Met Asp Val Val
85 90 95
Leu Val Pro Gln Gly Thr Leu Ile Glu Gln Ile Arg Cys Gly Gly Ala
100 105 110
Gly Leu Gly Gly Phe Leu Thr Pro Thr Gly Val Gly Thr Val Val Glu
115 120 125
Glu Gly Lys Gln Thr Leu Thr Leu Asp Gly Lys Thr Trp Leu Leu Glu
130 135 140
Arg Pro Leu Arg Ala Asp Leu Ala Leu Ile Arg Ala His Arg Cys Asp
145 150 155 160
Thr Leu Gly Asn Leu Thr Tyr Gln Leu Ser Ala Arg Asn Phe Asn Pro
165 170 175
Leu Ile Ala Leu Ala Ala Asp Ile Thr Leu Val Glu Pro Asp Glu Leu
180 185 190
Val Glu Thr Gly Glu Leu Gln Pro Asp His Ile Val Thr Pro Gly Ala
195 200 205
Val Ile Asp His Ile Ile Val Ser Gln Glu Ser Lys
210 215 220
<210> 47
<211> 735
<212> DNA
<213> 丙酮丁醇梭菌
<400> 47
atgttaaagg atgaagtaat taaacaaatt agcacgccat taacttcgcc tgcatttcct 60
agaggaccct ataaatttca taatcgtgag tattttaaca ttgtatatcg tacagatatg 120
gatgcacttc gtaaagttgt gccagagcct ttagaaattg atgagccctt agtcaggttt 180
gaaattatgg caatgcatga tacgagtgga cttggttgtt atacagaaag cggacaggct 240
attcccgtaa gctttaatgg agttaaggga gattatcttc atatgatgta tttagataat 300
gagcctgcaa ttgcagtagg aagggaatta agtgcatatc ctaaaaagct cgggtatcca 360
aagctttttg tggattcaga tactttagta ggaactttag actatggaaa acttagagtt 420
gcgacagcta caatggggta caaacataaa gccttagatg ctaatgaagc aaaggatcaa 480
atttgtcgcc ctaattatat gttgaaaata atacccaatt atgatggaag ccctagaata 540
tgtgagctta taaatgcgaa aatcacagat gttaccgtac atgaagcttg gacaggacca 600
actcgactgc agttatttga tcacgctatg gcgccactta atgatttgcc agtaaaagag 660
attgtttcta gctctcacat tcttgcagat ataatattgc ctagagctga agttatatat 720
gattatctta agtaa 735
<210> 48
<211> 735
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的丙酮丁醇梭菌序列
<400> 48
atgctgaagg acgaggttat taagcagatt agcaccccgc tgaccagccc ggcgttcccg 60
cgtggtccgt acaagttcca taatcgcgaa tacttcaaca ttgtgtatcg taccgacatg 120
gatgcgctgc gtaaggtggt tccggagccg ctggaaattg acgagccgct ggttcgtttc 180
gaaatcatgg cgatgcacga taccagcggt ctgggctgct acaccgagag cggtcaggcg 240
attccggtga gctttaacgg tgttaaaggc gactacctgc acatgatgta tctggataac 300
gaaccggcga ttgcggtggg tcgtgagctg agcgcgtacc cgaagaaact gggctatccg 360
aagctgttcg tggacagcga taccctggtg ggcaccctgg actacggcaa actgcgtgtt 420
gcgaccgcga ccatgggcta taagcacaaa gcgctggacg cgaacgaagc gaaggatcag 480
atttgccgtc cgaactacat gctgaaaatc attccgaact atgacggtag cccgcgtatc 540
tgcgaactga ttaacgcgaa gatcaccgat gttaccgttc atgaggcgtg gaccggcccg 600
acccgtctgc aactgtttga ccacgcgatg gcgccgctga acgatctgcc ggtgaaagag 660
atcgttagca gcagccacat cctggcggac atcatcctgc cgcgtgcgga agttatctac 720
gattacctga agtaa 735
<210> 49
<211> 244
<212> PRT
<213> 丙酮丁醇梭菌
<400> 49
Met Leu Lys Asp Glu Val Ile Lys Gln Ile Ser Thr Pro Leu Thr Ser
1 5 10 15
Pro Ala Phe Pro Arg Gly Pro Tyr Lys Phe His Asn Arg Glu Tyr Phe
20 25 30
Asn Ile Val Tyr Arg Thr Asp Met Asp Ala Leu Arg Lys Val Val Pro
35 40 45
Glu Pro Leu Glu Ile Asp Glu Pro Leu Val Arg Phe Glu Ile Met Ala
50 55 60
Met His Asp Thr Ser Gly Leu Gly Cys Tyr Thr Glu Ser Gly Gln Ala
65 70 75 80
Ile Pro Val Ser Phe Asn Gly Val Lys Gly Asp Tyr Leu His Met Met
85 90 95
Tyr Leu Asp Asn Glu Pro Ala Ile Ala Val Gly Arg Glu Leu Ser Ala
100 105 110
Tyr Pro Lys Lys Leu Gly Tyr Pro Lys Leu Phe Val Asp Ser Asp Thr
115 120 125
Leu Val Gly Thr Leu Asp Tyr Gly Lys Leu Arg Val Ala Thr Ala Thr
130 135 140
Met Gly Tyr Lys His Lys Ala Leu Asp Ala Asn Glu Ala Lys Asp Gln
145 150 155 160
Ile Cys Arg Pro Asn Tyr Met Leu Lys Ile Ile Pro Asn Tyr Asp Gly
165 170 175
Ser Pro Arg Ile Cys Glu Leu Ile Asn Ala Lys Ile Thr Asp Val Thr
180 185 190
Val His Glu Ala Trp Thr Gly Pro Thr Arg Leu Gln Leu Phe Asp His
195 200 205
Ala Met Ala Pro Leu Asn Asp Leu Pro Val Lys Glu Ile Val Ser Ser
210 215 220
Ser His Ile Leu Ala Asp Ile Ile Leu Pro Arg Ala Glu Val Ile Tyr
225 230 235 240
Asp Tyr Leu Lys
<210> 50
<211> 741
<212> DNA
<213> 拜氏梭菌(Clostridium beijerinckii)
<400> 50
atgttagaaa gtgaagtatc taaacaaatt acaactccac ttgctgctcc agcgtttcct 60
agaggaccat ataggtttca caatagagaa tatctaaaca ttatttatcg aactgattta 120
gatgctcttc gaaaaatagt accagagcca cttgaattag atagagcata tgttagattt 180
gaaatgatgg ctatgcctga tacaaccgga ctaggctcat atacagaatg tggtcaagct 240
attccagtaa aatataatgg tgttaagggt gactacttgc atatgatgta tctagataat 300
gaacctgcta ttgctgttgg aagagaaagt agcgcttatc caaaaaagct tggctatcca 360
aagctatttg ttgattcaga tactttagtt gggacactta aatatggtac attaccagta 420
gctactgcaa caatgggata taagcacgag cctctagatc ttaaagaagc ctatgctcaa 480
attgcaagac ccaattttat gctaaaaatc attcaaggtt acgatggtaa gccaagaatt 540
tgtgaactaa tatgtgcaga aaatactgat ataactattc acggtgcttg gactggaagt 600
gcacgtctac aattatttag ccatgcacta gctcctcttg ctgatttacc tgtattagag 660
attgtatcag catctcatat cctcacagat ttaactcttg gaacacctaa ggttgtacat 720
gattatcttt cagtaaaata a 741
<210> 51
<211> 741
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的拜氏梭菌序列
<400> 51
atgctggaga gcgaagttag caaacaaatc accaccccgc tggcggcgcc ggcgttcccg 60
cgtggcccgt accgttttca taaccgtgag tacctgaaca tcatttatcg taccgacctg 120
gatgcgctgc gtaagattgt gccggagccg ctggaactgg accgtgcgta cgttcgtttc 180
gagatgatgg cgatgccgga taccaccggt ctgggcagct acaccgaatg cggtcaggcg 240
atcccggtga agtataacgg tgttaaaggc gactacctgc acatgatgta tctggataac 300
gagccggcga ttgcggtggg tcgtgaaagc agcgcgtacc cgaagaaact gggctatccg 360
aagctgtttg tggacagcga taccctggtg ggcaccctga aatatggcac cctgccggtt 420
gcgaccgcga ccatgggcta caagcacgag ccgctggacc tgaaagaagc gtatgcgcag 480
attgcgcgtc cgaacttcat gctgaagatc attcaaggtt atgacggcaa accgcgtatc 540
tgcgagctga tttgcgcgga aaacaccgat atcaccatcc atggtgcgtg gaccggcagc 600
gcgcgtctgc aactgtttag ccatgcgctg gcgccgctgg cggatctgcc ggtgctggaa 660
atcgttagcg cgagccacat tctgaccgat ctgaccctgg gcaccccgaa ggttgtgcat 720
gactatctga gcgtgaagta a 741
<210> 52
<211> 246
<212> PRT
<213> 拜氏梭菌
<400> 52
Met Leu Glu Ser Glu Val Ser Lys Gln Ile Thr Thr Pro Leu Ala Ala
1 5 10 15
Pro Ala Phe Pro Arg Gly Pro Tyr Arg Phe His Asn Arg Glu Tyr Leu
20 25 30
Asn Ile Ile Tyr Arg Thr Asp Leu Asp Ala Leu Arg Lys Ile Val Pro
35 40 45
Glu Pro Leu Glu Leu Asp Arg Ala Tyr Val Arg Phe Glu Met Met Ala
50 55 60
Met Pro Asp Thr Thr Gly Leu Gly Ser Tyr Thr Glu Cys Gly Gln Ala
65 70 75 80
Ile Pro Val Lys Tyr Asn Gly Val Lys Gly Asp Tyr Leu His Met Met
85 90 95
Tyr Leu Asp Asn Glu Pro Ala Ile Ala Val Gly Arg Glu Ser Ser Ala
100 105 110
Tyr Pro Lys Lys Leu Gly Tyr Pro Lys Leu Phe Val Asp Ser Asp Thr
115 120 125
Leu Val Gly Thr Leu Lys Tyr Gly Thr Leu Pro Val Ala Thr Ala Thr
130 135 140
Met Gly Tyr Lys His Glu Pro Leu Asp Leu Lys Glu Ala Tyr Ala Gln
145 150 155 160
Ile Ala Arg Pro Asn Phe Met Leu Lys Ile Ile Gln Gly Tyr Asp Gly
165 170 175
Lys Pro Arg Ile Cys Glu Leu Ile Cys Ala Glu Asn Thr Asp Ile Thr
180 185 190
Ile His Gly Ala Trp Thr Gly Ser Ala Arg Leu Gln Leu Phe Ser His
195 200 205
Ala Leu Ala Pro Leu Ala Asp Leu Pro Val Leu Glu Ile Val Ser Ala
210 215 220
Ser His Ile Leu Thr Asp Leu Thr Leu Gly Thr Pro Lys Val Val His
225 230 235 240
Asp Tyr Leu Ser Val Lys
245
<210> 53
<211> 770
<212> DNA
<213> 人(Homo sapiens)
<400> 53
atggaagaga agcagatcct gtgcgtgggg ctagtggtgc tggacgtcat cagcctggtg 60
gacaagtacc ctaaggagga ctcggagata aggtgtttgt cccagagatg gcagcgcgga 120
ggcaacgcgt ccaactcctg caccgttctc tccctgctcg gagccccctg tgccttcatg 180
ggctcaatgg ctcctggcca tgttgctgat tttgtcctgg atgacctccg ccgctattct 240
gtggacctac gctacacagt ctttcagacc acaggctccg tccccatcgc cacggtcatc 300
atcaacgagg ccagtggtag ccgcaccatc ctatactatg acaggagcct gccagatgtg 360
tctgctacag actttgagaa ggttgatctg acccagttca agtggatcca cattgagggc 420
cggaacgcat cggagcaggt gaagatgctg cagcggatag acgcacacaa caccaggcag 480
cctccagagc agaagatccg ggtgtccgtg gaggtggaga agccacgaga ggagctcttc 540
cagctgtttg gctacggaga cgtggtgttt gtcagcaaag atgtggccaa gcacttgggg 600
ttccagtcag cagaggaagc cttgaggggc ttgtatggtc gtgtgaggaa aggggctgtg 660
cttgtctgtg cctgggctga ggagggcgcc gacgccctgg gccctgatgg caaattgctc 720
cactcggatg ctttcccgcc accccgcgtg gtggatacac tgggagctgg 770
<210> 54
<211> 897
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的人序列
<400> 54
atggaggaaa agcaaattct gtgcgttggt ctggtggttc tggacgtgat tagcctggtt 60
gataagtacc cgaaagagga tagcgaaatc cgttgcctga gccagcgttg gcaacgtggt 120
ggcaacgcga gcaatagctg caccgttctg agcctgctgg gtgcgccgtg cgcgttcatg 180
ggtagcatgg cgccgggtca tgttgcggac ttcctggtgg cggattttcg tcgtcgtggt 240
gtggacgtta gccaggttgc gtggcaaagc aagggcgata ccccgagctc ctgctgcatc 300
attaacaaca gcaacggtaa ccgtaccatt gtgctgcacg acaccagcct gccggatgtt 360
agcgcgaccg acttcgagaa ggtggatctg acccagttta aatggattca cattgagggc 420
cgtaacgcga gcgaacaggt taaaatgctg caacgtattg atgcgcacaa cacccgtcag 480
ccgccggaac aaaagattcg tgtgagcgtt gaggtggaaa aaccgcgtga ggaactgttc 540
caactgtttg gttacggcga cgtggttttc gttagcaagg atgtggcgaa acacctgggt 600
tttcaaagcg cggaggaagc gctgcgtggt ctgtatggcc gtgtgcgtaa aggcgcggtt 660
ctggtgtgcg cgtgggcgga ggaaggcgcg gatgcgctgg gtccggatgg caaactgctg 720
cacagcgatg cgttcccgcc gccgcgtgtg gttgacaccc tgggtgcggg cgataccttc 780
aacgcgagcg ttatctttag cctgagccag ggccgtagcg tgcaagaggc gctgcgtttc 840
ggctgccaag ttgcgggtaa aaaatgcggt ctgcaaggct ttgacggtat cgtgtaa 897
<210> 55
<211> 298
<212> PRT
<213> 人
<400> 55
Met Glu Glu Lys Gln Ile Leu Cys Val Gly Leu Val Val Leu Asp Val
1 5 10 15
Ile Ser Leu Val Asp Lys Tyr Pro Lys Glu Asp Ser Glu Ile Arg Cys
20 25 30
Leu Ser Gln Arg Trp Gln Arg Gly Gly Asn Ala Ser Asn Ser Cys Thr
35 40 45
Val Leu Ser Leu Leu Gly Ala Pro Cys Ala Phe Met Gly Ser Met Ala
50 55 60
Pro Gly His Val Ala Asp Phe Leu Val Ala Asp Phe Arg Arg Arg Gly
65 70 75 80
Val Asp Val Ser Gln Val Ala Trp Gln Ser Lys Gly Asp Thr Pro Ser
85 90 95
Ser Cys Cys Ile Ile Asn Asn Ser Asn Gly Asn Arg Thr Ile Val Leu
100 105 110
His Asp Thr Ser Leu Pro Asp Val Ser Ala Thr Asp Phe Glu Lys Val
115 120 125
Asp Leu Thr Gln Phe Lys Trp Ile His Ile Glu Gly Arg Asn Ala Ser
130 135 140
Glu Gln Val Lys Met Leu Gln Arg Ile Asp Ala His Asn Thr Arg Gln
145 150 155 160
Pro Pro Glu Gln Lys Ile Arg Val Ser Val Glu Val Glu Lys Pro Arg
165 170 175
Glu Glu Leu Phe Gln Leu Phe Gly Tyr Gly Asp Val Val Phe Val Ser
180 185 190
Lys Asp Val Ala Lys His Leu Gly Phe Gln Ser Ala Glu Glu Ala Leu
195 200 205
Arg Gly Leu Tyr Gly Arg Val Arg Lys Gly Ala Val Leu Val Cys Ala
210 215 220
Trp Ala Glu Glu Gly Ala Asp Ala Leu Gly Pro Asp Gly Lys Leu Leu
225 230 235 240
His Ser Asp Ala Phe Pro Pro Pro Arg Val Val Asp Thr Leu Gly Ala
245 250 255
Gly Asp Thr Phe Asn Ala Ser Val Ile Phe Ser Leu Ser Gln Gly Arg
260 265 270
Ser Val Gln Glu Ala Leu Arg Phe Gly Cys Gln Val Ala Gly Lys Lys
275 280 285
Cys Gly Leu Gln Gly Phe Asp Gly Ile Val
290 295
<210> 56
<211> 1095
<212> DNA
<213> 人
<400> 56
atggcccacc gatttccagc cctcacccag gagcagaaga aggagctctc agaaattgcc 60
cagagcattg ttgccaatgg aaaggggatc ctggctgcag atgaatctgt aggtaccatg 120
gggaaccgcc tgcagaggat caaggtggaa aacactgaag agaaccgccg gcagttccga 180
gaaatcctct tctctgtgga cagttccatc aaccagagca tcgggggtgt gatccttttc 240
cacgagaccc tctaccagaa ggacagccag ggaaagctgt tcagaaacat cctcaaggaa 300
aaggggatcg tggtgggaat caagttagac caaggaggtg ctcctcttgc aggaacaaac 360
aaagaaacca ccattcaagg gcttgatggc ctctcagagc gctgtgctca gtacaagaaa 420
gatggtgttg actttgggaa gtggcgtgct gtgctgagga ttgccgacca gtgtccatcc 480
agcctcgcta tccaggaaaa cgccaacgcc ctggctcgct acgccagcat ctgtcagcag 540
aatggactgg tacctattgt tgaaccagag gtaattcctg atggagacca tgacctggaa 600
cactgccagt atgttactga gaaggtcctg gctgctgtct acaaggccct gaatgaccat 660
catgtttacc tggagggcac cctgctaaag cccaacatgg tgactgctgg acatgcctgc 720
accaagaagt atactccaga acaagtagct atggccaccg taacagctct ccaccgtact 780
gttcctgcag ctgttcctgg catctgcttt ttgtctggtg gcatgagtga agaggatgcc 840
actctcaacc tcaatgctat caacctttgc cctctaccaa agccctggaa actaagtttc 900
tcttatggac gggccctgca ggccagtgca ctggctgcct ggggtggcaa ggctgcaaac 960
aaggaggcaa cccaggaggc ttttatgaag cgggccatgg ctaactgcca ggcggccaaa 1020
ggacagtatg ttcacacggg ttcttctggg gctgcttcca cccagtcgct cttcacagcc 1080
tgctatacct actag 1095
<210> 57
<211> 1095
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的人序列
<400> 57
atggcgcacc gttttccggc gctgacccaa gagcagaaga aggagctgag cgagattgcg 60
cagagcatcg tggcgaatgg taaaggtatt ctggcggcgg atgagagcgt tggtaccatg 120
ggcaaccgtc tgcagcgtat taaggtggag aacaccgagg aaaaccgtcg tcaattccgt 180
gaaatcctgt ttagcgttga tagcagcatc aaccagagca ttggtggcgt gatcctgttc 240
cacgaaaccc tgtaccagaa ggacagccaa ggtaaactgt ttcgtaacat tctgaaggaa 300
aaaggtattg tggttggcat caagctggat caaggtggcg cgccgctggc gggcaccaac 360
aaggaaacca ccatccaggg tctggacggc ctgagcgaac gttgcgcgca atataagaaa 420
gatggtgttg acttcggcaa gtggcgtgcg gtgctgcgta ttgcggacca gtgcccgagc 480
agcctggcga tccaagaaaa cgcgaacgcg ctggcgcgtt acgcgagcat ctgccagcaa 540
aacggtctgg tgccgattgt tgagccggaa gttatcccgg acggcgatca cgacctggag 600
cactgccagt atgtgaccga aaaggttctg gcggcggtgt acaaagcgct gaacgatcac 660
cacgtttatc tggagggtac cctgctgaaa ccgaacatgg tgaccgcggg ccatgcgtgc 720
accaagaaat acaccccgga acaggtggcg atggcgaccg tgaccgcgct gcaccgtacc 780
gttccggcgg cggtgccggg tatttgcttt ctgagcggtg gcatgagcga agaggacgcg 840
accctgaacc tgaacgcgat caacctgtgc ccgctgccga agccgtggaa actgagcttc 900
agctacggcc gtgcgctgca ggcgagcgcg ctggcggcgt ggggtggcaa ggcggcgaac 960
aaagaggcga cccaagaagc gtttatgaag cgtgcgatgg cgaactgcca ggcggcgaaa 1020
ggtcaatatg tgcataccgg cagcagcggt gcggcgagca cccagagcct gtttaccgcg 1080
tgctatacct attaa 1095
<210> 58
<211> 364
<212> PRT
<213> 人
<400> 58
Met Ala His Arg Phe Pro Ala Leu Thr Gln Glu Gln Lys Lys Glu Leu
1 5 10 15
Ser Glu Ile Ala Gln Ser Ile Val Ala Asn Gly Lys Gly Ile Leu Ala
20 25 30
Ala Asp Glu Ser Val Gly Thr Met Gly Asn Arg Leu Gln Arg Ile Lys
35 40 45
Val Glu Asn Thr Glu Glu Asn Arg Arg Gln Phe Arg Glu Ile Leu Phe
50 55 60
Ser Val Asp Ser Ser Ile Asn Gln Ser Ile Gly Gly Val Ile Leu Phe
65 70 75 80
His Glu Thr Leu Tyr Gln Lys Asp Ser Gln Gly Lys Leu Phe Arg Asn
85 90 95
Ile Leu Lys Glu Lys Gly Ile Val Val Gly Ile Lys Leu Asp Gln Gly
100 105 110
Gly Ala Pro Leu Ala Gly Thr Asn Lys Glu Thr Thr Ile Gln Gly Leu
115 120 125
Asp Gly Leu Ser Glu Arg Cys Ala Gln Tyr Lys Lys Asp Gly Val Asp
130 135 140
Phe Gly Lys Trp Arg Ala Val Leu Arg Ile Ala Asp Gln Cys Pro Ser
145 150 155 160
Ser Leu Ala Ile Gln Glu Asn Ala Asn Ala Leu Ala Arg Tyr Ala Ser
165 170 175
Ile Cys Gln Gln Asn Gly Leu Val Pro Ile Val Glu Pro Glu Val Ile
180 185 190
Pro Asp Gly Asp His Asp Leu Glu His Cys Gln Tyr Val Thr Glu Lys
195 200 205
Val Leu Ala Ala Val Tyr Lys Ala Leu Asn Asp His His Val Tyr Leu
210 215 220
Glu Gly Thr Leu Leu Lys Pro Asn Met Val Thr Ala Gly His Ala Cys
225 230 235 240
Thr Lys Lys Tyr Thr Pro Glu Gln Val Ala Met Ala Thr Val Thr Ala
245 250 255
Leu His Arg Thr Val Pro Ala Ala Val Pro Gly Ile Cys Phe Leu Ser
260 265 270
Gly Gly Met Ser Glu Glu Asp Ala Thr Leu Asn Leu Asn Ala Ile Asn
275 280 285
Leu Cys Pro Leu Pro Lys Pro Trp Lys Leu Ser Phe Ser Tyr Gly Arg
290 295 300
Ala Leu Gln Ala Ser Ala Leu Ala Ala Trp Gly Gly Lys Ala Ala Asn
305 310 315 320
Lys Glu Ala Thr Gln Glu Ala Phe Met Lys Arg Ala Met Ala Asn Cys
325 330 335
Gln Ala Ala Lys Gly Gln Tyr Val His Thr Gly Ser Ser Gly Ala Ala
340 345 350
Ser Thr Gln Ser Leu Phe Thr Ala Cys Tyr Thr Tyr
355 360
<210> 59
<211> 747
<212> DNA
<213> 新月柄杆菌(Caulobacter crescentus)
<400> 59
atgtcctcag ccatctatcc cagcctgaag ggcaagcgcg tcgtcatcac cggcggcggc 60
tcgggcatcg gggccggcct caccgccggc ttcgcccgtc agggcgcgga ggtgatcttc 120
ctcgacatcg ccgacgagga ctccagggct cttgaggccg agctggccgg ctcgccgatc 180
ccgccggtct acaagcgctg cgacctgatg aacctcgagg cgatcaaggc ggtcttcgcc 240
gagatcggcg acgtcgacgt gctggtcaac aacgccggca atgacgaccg ccacaagctg 300
gccgacgtga ccggcgccta ttgggacgag cggatcaacg tcaacctgcg ccacatgctg 360
ttctgcaccc aggccgtcgc gccgggcatg aagaagcgtg gcggcggggc ggtgatcaac 420
ttcggttcga tcagctggca cctggggctt gaggacctcg tcctctacga aaccgccaag 480
gccggcatcg aaggcatgac ccgcgcgctg gcccgggagc tgggtcccga cgacatccgc 540
gtcacctgcg tggtgccggg caacgtcaag accaagcgcc aggagaagtg gtacacgccc 600
gaaggcgagg cccagatcgt ggcggcccaa tgcctgaagg gccgcatcgt cccggagaac 660
gtcgccgcgc tggtgctgtt cctggcctcg gatgacgcgt cgctctgcac cggccacgaa 720
tactggatcg acgccggctg gcgttga 747
<210> 60
<211> 747
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的新月柄杆菌序列
<400> 60
atgagcagcg cgatctaccc gagcctgaaa ggtaaacgtg tggtgattac cggcggcggc 60
agcggcattg gtgcgggcct gaccgcgggc ttcgcgcgtc agggtgcgga agtgatcttt 120
ctggacattg cggacgaaga tagccgtgcg ctggaggcgg aactggcggg cagcccgatc 180
ccgccggtgt acaagcgttg cgatctgatg aacctggagg cgatcaaagc ggttttcgcg 240
gaaattggcg acgtggatgt tctggtgaac aacgcgggta acgacgaccg tcacaagctg 300
gcggatgtga ccggtgcgta ttgggatgag cgtattaacg ttaacctgcg tcacatgctg 360
ttctgcaccc aggcggtggc gccgggtatg aagaaacgtg gtggcggtgc ggttatcaac 420
tttggcagca ttagctggca cctgggtctg gaggacctgg tgctgtacga aaccgcgaaa 480
gcgggcatcg agggtatgac ccgtgcgctg gcgcgtgaac tgggtccgga cgatattcgt 540
gtgacctgcg tggttccggg taacgttaag accaaacgtc aagagaagtg gtataccccg 600
gagggtgaag cgcagattgt tgcggcgcaa tgcctgaaag gtcgtattgt tccggaaaac 660
gtggcggcgc tggttctgtt tctggcgagc gatgatgcga gcctgtgcac cggccatgag 720
tattggattg atgcgggctg gcgttaa 747
<210> 61
<211> 248
<212> PRT
<213> 新月柄杆菌
<400> 61
Met Ser Ser Ala Ile Tyr Pro Ser Leu Lys Gly Lys Arg Val Val Ile
1 5 10 15
Thr Gly Gly Gly Ser Gly Ile Gly Ala Gly Leu Thr Ala Gly Phe Ala
20 25 30
Arg Gln Gly Ala Glu Val Ile Phe Leu Asp Ile Ala Asp Glu Asp Ser
35 40 45
Arg Ala Leu Glu Ala Glu Leu Ala Gly Ser Pro Ile Pro Pro Val Tyr
50 55 60
Lys Arg Cys Asp Leu Met Asn Leu Glu Ala Ile Lys Ala Val Phe Ala
65 70 75 80
Glu Ile Gly Asp Val Asp Val Leu Val Asn Asn Ala Gly Asn Asp Asp
85 90 95
Arg His Lys Leu Ala Asp Val Thr Gly Ala Tyr Trp Asp Glu Arg Ile
100 105 110
Asn Val Asn Leu Arg His Met Leu Phe Cys Thr Gln Ala Val Ala Pro
115 120 125
Gly Met Lys Lys Arg Gly Gly Gly Ala Val Ile Asn Phe Gly Ser Ile
130 135 140
Ser Trp His Leu Gly Leu Glu Asp Leu Val Leu Tyr Glu Thr Ala Lys
145 150 155 160
Ala Gly Ile Glu Gly Met Thr Arg Ala Leu Ala Arg Glu Leu Gly Pro
165 170 175
Asp Asp Ile Arg Val Thr Cys Val Val Pro Gly Asn Val Lys Thr Lys
180 185 190
Arg Gln Glu Lys Trp Tyr Thr Pro Glu Gly Glu Ala Gln Ile Val Ala
195 200 205
Ala Gln Cys Leu Lys Gly Arg Ile Val Pro Glu Asn Val Ala Ala Leu
210 215 220
Val Leu Phe Leu Ala Ser Asp Asp Ala Ser Leu Cys Thr Gly His Glu
225 230 235 240
Tyr Trp Ile Asp Ala Gly Trp Arg
245
<210> 62
<211> 1173
<212> DNA
<213> 沃氏富盐菌(Haloferax volcanii)
<400> 62
atgagccccg cccccaccga catcgtcgag gagttcacgc gccgcgactg gcagggagac 60
gacgtgacgg gcaccgtgcg ggtcgccatg atcggcctcg gctggtggac ccgcgacgag 120
gcgattcccg cggtcgaggc gtccgagttc tgcgagacga cggtcgtcgt cagcagttcg 180
aaggagaaag ccgagggcgc gacggcgttg accgagtcga taacccacgg cctcacctac 240
gacgagttcc acgagggggt cgccgccgac gcctacgacg cggtgtacgt cgtcacgccg 300
aacggtctgc atctcccgta cgtcgagacc gccgccgagt tggggaaggc ggtcctctgc 360
gagaaaccgc tggaagcgtc ggtcgagcgg gccgaaaagc tcgtcgccgc ctgcgaccgc 420
gccgacgtgc ccctgatggt cgcctatcgg atgcagaccg agccggccgt ccggcgcgcc 480
cgcgaactcg tcgaggccgg cgtcatcggc gagccggtgt tcgtccacgg ccacatgtcc 540
cagcgcctgc tcgacgaggt cgtccccgac cccgaccagt ggcggctcga ccccgaactc 600
tccggcggcg cgaccgtcat ggacatcggg ctctacccgc tgaacaccgc ccggttcgtc 660
ctcgacgccg accccgtccg cgtcagggcg accgcccgcg tcgacgacga ggcgttcgag 720
gccgtcggcg acgagcacgt cagtttcggc gtcgacttcg acgacggcac gctcgcggtc 780
tgcaccgcca gccagtcggc ttaccagttg agccacctcc gggtgaccgg caccgagggc 840
gaactcgaaa tcgagcccgc gttctacaac cgccaaaagc ggggattccg actgtcgtgg 900
ggggaccagt ccgccgacta cgacttcgag caggtaaacc agatgacgga ggagttcgac 960
tacttcgcgt cccggctcct gtcggattcc gaccccgcgc ccgacggcga ccacgcgctc 1020
gtggacatgc gcgcgatgga cgcgatttac gccgcggcgg agcgcgggac cgatgtcgcc 1080
gtcgacgccg ccgactccga ttccgccgac tccgattccg ccgacgctgc cgccgccaac 1140
cacgacgccg accccgattc cgacgggacg tag 1173
<210> 63
<211> 390
<212> PRT
<213> 沃氏富盐菌
<400> 63
Met Ser Pro Ala Pro Thr Asp Ile Val Glu Glu Phe Thr Arg Arg Asp
1 5 10 15
Trp Gln Gly Asp Asp Val Thr Gly Thr Val Arg Val Ala Met Ile Gly
20 25 30
Leu Gly Trp Trp Thr Arg Asp Glu Ala Ile Pro Ala Val Glu Ala Ser
35 40 45
Glu Phe Cys Glu Thr Thr Val Val Val Ser Ser Ser Lys Glu Lys Ala
50 55 60
Glu Gly Ala Thr Ala Leu Thr Glu Ser Ile Thr His Gly Leu Thr Tyr
65 70 75 80
Asp Glu Phe His Glu Gly Val Ala Ala Asp Ala Tyr Asp Ala Val Tyr
85 90 95
Val Val Thr Pro Asn Gly Leu His Leu Pro Tyr Val Glu Thr Ala Ala
100 105 110
Glu Leu Gly Lys Ala Val Leu Cys Glu Lys Pro Leu Glu Ala Ser Val
115 120 125
Glu Arg Ala Glu Lys Leu Val Ala Ala Cys Asp Arg Ala Asp Val Pro
130 135 140
Leu Met Val Ala Tyr Arg Met Gln Thr Glu Pro Ala Val Arg Arg Ala
145 150 155 160
Arg Glu Leu Val Glu Ala Gly Val Ile Gly Glu Pro Val Phe Val His
165 170 175
Gly His Met Ser Gln Arg Leu Leu Asp Glu Val Val Pro Asp Pro Asp
180 185 190
Gln Trp Arg Leu Asp Pro Glu Leu Ser Gly Gly Ala Thr Val Met Asp
195 200 205
Ile Gly Leu Tyr Pro Leu Asn Thr Ala Arg Phe Val Leu Asp Ala Asp
210 215 220
Pro Val Arg Val Arg Ala Thr Ala Arg Val Asp Asp Glu Ala Phe Glu
225 230 235 240
Ala Val Gly Asp Glu His Val Ser Phe Gly Val Asp Phe Asp Asp Gly
245 250 255
Thr Leu Ala Val Cys Thr Ala Ser Gln Ser Ala Tyr Gln Leu Ser His
260 265 270
Leu Arg Val Thr Gly Thr Glu Gly Glu Leu Glu Ile Glu Pro Ala Phe
275 280 285
Tyr Asn Arg Gln Lys Arg Gly Phe Arg Leu Ser Trp Gly Asp Gln Ser
290 295 300
Ala Asp Tyr Asp Phe Glu Gln Val Asn Gln Met Thr Glu Glu Phe Asp
305 310 315 320
Tyr Phe Ala Ser Arg Leu Leu Ser Asp Ser Asp Pro Ala Pro Asp Gly
325 330 335
Asp His Ala Leu Val Asp Met Arg Ala Met Asp Ala Ile Tyr Ala Ala
340 345 350
Ala Glu Arg Gly Thr Asp Val Ala Val Asp Ala Ala Asp Ser Asp Ser
355 360 365
Ala Asp Ser Asp Ser Ala Asp Ala Ala Ala Ala Asn His Asp Ala Asp
370 375 380
Pro Asp Ser Asp Gly Thr
385 390
<210> 64
<211> 1176
<212> DNA
<213> 未知
<220>
<223> 里氏木霉(Trichoderma reesei)序列
<400> 64
atggcgtctg gaaaccctta caccctgaaa tggggcatca tggccaccgg cggaatcgca 60
gagaccttct gcaaggatct cctgtgcaac cccgcgattc gaggcgccga tgatgtgcgc 120
cacgagattg tggccgtggc ctcttccagc agcagcaaga gagcagagga gttcctccag 180
agaatcgacg gtgcctttga cgccaagacg tacggatcat acccggaact tgtggcagac 240
cccaacgtcg acatcgtcta tgtggcaact ccccacagcc accacttcca gaacaccatg 300
ctggcgctgg aagccggcaa gaacgtcttg tgcgaaaagg ctttcaccgt gacggccgcg 360
caggcccgaa agctggttga gacggccaag gccaagaagc tcttcctgat ggaagctgtg 420
tggacacggt actttccgct gagtatcaag attcgagagc tcattgccgc cggcgagatt 480
ggcactgtct ttcgaacaat cgccgacttg tccatcaacg caaactcaga gcagggtcaa 540
gccctgaaat tcgcagactc acatcgaatg gtcaacccgg acctcgcagg cggtgccacc 600
ttggatctcg gagtctatcc cttgacctgg gtgttccaga ccctgtatca tttgcaaccg 660
gaggaagaca aggaggctcc caccgtggtt gcttccagca acaagtacac cactggcgca 720
gacgagaata ccgccatcat ctgcagcttc cctcgccaca acagcattgg aattgcttcg 780
acgacgatga gggcggacac cgaccccgag aaggacacca ttccggcggt ccgaattcaa 840
ggatccaagg gagaaatcca agtcttcttc ccgacctacc gaccgctcaa gtacaaggtg 900
gtgaagacga acggcgaggc gcagacggtt gactgcccca tccccggaga ccccgcgcgc 960
aagggctcgg gccacggaat gttctgggag gcggacgagt gtgctcgatg ccttcgcgat 1020
ggcaagttgg agagtgccac gttgccatgg aaggagagca ttgtcattat ggaaacgatg 1080
gaggaggcgc tgaggcaggg tggcgtcacg tatccggagc tgattaccac ggatgtctat 1140
gatcccaaga gccctctcaa cacggggaat cagtag 1176
<210> 65
<211> 391
<212> PRT
<213> 未知
<220>
<223> 里氏木霉序列
<400> 65
Met Ala Ser Gly Asn Pro Tyr Thr Leu Lys Trp Gly Ile Met Ala Thr
1 5 10 15
Gly Gly Ile Ala Glu Thr Phe Cys Lys Asp Leu Leu Cys Asn Pro Ala
20 25 30
Ile Arg Gly Ala Asp Asp Val Arg His Glu Ile Val Ala Val Ala Ser
35 40 45
Ser Ser Ser Ser Lys Arg Ala Glu Glu Phe Leu Gln Arg Ile Asp Gly
50 55 60
Ala Phe Asp Ala Lys Thr Tyr Gly Ser Tyr Pro Glu Leu Val Ala Asp
65 70 75 80
Pro Asn Val Asp Ile Val Tyr Val Ala Thr Pro His Ser His His Phe
85 90 95
Gln Asn Thr Met Leu Ala Leu Glu Ala Gly Lys Asn Val Leu Cys Glu
100 105 110
Lys Ala Phe Thr Val Thr Ala Ala Gln Ala Arg Lys Leu Val Glu Thr
115 120 125
Ala Lys Ala Lys Lys Leu Phe Leu Met Glu Ala Val Trp Thr Arg Tyr
130 135 140
Phe Pro Leu Ser Ile Lys Ile Arg Glu Leu Ile Ala Ala Gly Glu Ile
145 150 155 160
Gly Thr Val Phe Arg Thr Ile Ala Asp Leu Ser Ile Asn Ala Asn Ser
165 170 175
Glu Gln Gly Gln Ala Leu Lys Phe Ala Asp Ser His Arg Met Val Asn
180 185 190
Pro Asp Leu Ala Gly Gly Ala Thr Leu Asp Leu Gly Val Tyr Pro Leu
195 200 205
Thr Trp Val Phe Gln Thr Leu Tyr His Leu Gln Pro Glu Glu Asp Lys
210 215 220
Glu Ala Pro Thr Val Val Ala Ser Ser Asn Lys Tyr Thr Thr Gly Ala
225 230 235 240
Asp Glu Asn Thr Ala Ile Ile Cys Ser Phe Pro Arg His Asn Ser Ile
245 250 255
Gly Ile Ala Ser Thr Thr Met Arg Ala Asp Thr Asp Pro Glu Lys Asp
260 265 270
Thr Ile Pro Ala Val Arg Ile Gln Gly Ser Lys Gly Glu Ile Gln Val
275 280 285
Phe Phe Pro Thr Tyr Arg Pro Leu Lys Tyr Lys Val Val Lys Thr Asn
290 295 300
Gly Glu Ala Gln Thr Val Asp Cys Pro Ile Pro Gly Asp Pro Ala Arg
305 310 315 320
Lys Gly Ser Gly His Gly Met Phe Trp Glu Ala Asp Glu Cys Ala Arg
325 330 335
Cys Leu Arg Asp Gly Lys Leu Glu Ser Ala Thr Leu Pro Trp Lys Glu
340 345 350
Ser Ile Val Ile Met Glu Thr Met Glu Glu Ala Leu Arg Gln Gly Gly
355 360 365
Val Thr Tyr Pro Glu Leu Ile Thr Thr Asp Val Tyr Asp Pro Lys Ser
370 375 380
Pro Leu Asn Thr Gly Asn Gln
385 390
<210> 66
<211> 870
<212> DNA
<213> 新月柄杆菌
<400> 66
atgaccgctc aagtcacttg cgtatgggat ctgaaggcca cgttgggcga aggcccgatc 60
tggcatggcg acaccctgtg gttcgtcgac atcaagcagc gtaaaatcca caactaccac 120
cccgccaccg gcgagcgctt cagcttcgac gcgccggatc aggtgacctt cctcgcgccg 180
atcgtcggcg cgaccggctt tgtcgtcggt ctgaagaccg ggattcaccg cttccacccg 240
gccacgggct tcagcctgct gctcgaggtc gaggacgcgg cgctgaacaa ccgccccaac 300
gacgccacgg tcgacgcgca aggccgtctg tggttcggca ccatgcacga cggggaagag 360
aacaatagcg gctcgctcta tcggatggac ctcaccggcg tcgcccggat ggaccgcgac 420
atctgcatca ccaacggccc gtgcgtctcg cccgacggca agaccttcta ccacaccgac 480
accctggaaa agacgatcta cgccttcgac ctggccgagg acggcctgct gtcgaacaag 540
cgcgtcttcg tgcagttcgc cctgggcgac gatgtctatc cggacggttc ggtcgtcgat 600
tccgaaggct atctgtggac cgccctgtgg ggcggtttcg gcgcggtccg cttctcgccg 660
caaggcgacg ccgtgacgcg catcgaactg cccgccccca acgtcaccaa gccctgcttc 720
ggcgggcctg acctgaagac cctctatttc accaccgccc gcaagggcct gagcgacgag 780
accctggccc agtacccgct ggccggcggt gtgttcgccg ttccggtcga tgtggccggc 840
caaccccagc atgaggtccg ccttgtctaa 870
<210> 67
<211> 289
<212> PRT
<213> 新月柄杆菌
<400> 67
Met Thr Ala Gln Val Thr Cys Val Trp Asp Leu Lys Ala Thr Leu Gly
1 5 10 15
Glu Gly Pro Ile Trp His Gly Asp Thr Leu Trp Phe Val Asp Ile Lys
20 25 30
Gln Arg Lys Ile His Asn Tyr His Pro Ala Thr Gly Glu Arg Phe Ser
35 40 45
Phe Asp Ala Pro Asp Gln Val Thr Phe Leu Ala Pro Ile Val Gly Ala
50 55 60
Thr Gly Phe Val Val Gly Leu Lys Thr Gly Ile His Arg Phe His Pro
65 70 75 80
Ala Thr Gly Phe Ser Leu Leu Leu Glu Val Glu Asp Ala Ala Leu Asn
85 90 95
Asn Arg Pro Asn Asp Ala Thr Val Asp Ala Gln Gly Arg Leu Trp Phe
100 105 110
Gly Thr Met His Asp Gly Glu Glu Asn Asn Ser Gly Ser Leu Tyr Arg
115 120 125
Met Asp Leu Thr Gly Val Ala Arg Met Asp Arg Asp Ile Cys Ile Thr
130 135 140
Asn Gly Pro Cys Val Ser Pro Asp Gly Lys Thr Phe Tyr His Thr Asp
145 150 155 160
Thr Leu Glu Lys Thr Ile Tyr Ala Phe Asp Leu Ala Glu Asp Gly Leu
165 170 175
Leu Ser Asn Lys Arg Val Phe Val Gln Phe Ala Leu Gly Asp Asp Val
180 185 190
Tyr Pro Asp Gly Ser Val Val Asp Ser Glu Gly Tyr Leu Trp Thr Ala
195 200 205
Leu Trp Gly Gly Phe Gly Ala Val Arg Phe Ser Pro Gln Gly Asp Ala
210 215 220
Val Thr Arg Ile Glu Leu Pro Ala Pro Asn Val Thr Lys Pro Cys Phe
225 230 235 240
Gly Gly Pro Asp Leu Lys Thr Leu Tyr Phe Thr Thr Ala Arg Lys Gly
245 250 255
Leu Ser Asp Glu Thr Leu Ala Gln Tyr Pro Leu Ala Gly Gly Val Phe
260 265 270
Ala Val Pro Val Asp Val Ala Gly Gln Pro Gln His Glu Val Arg Leu
275 280 285
Val
<210> 68
<211> 1776
<212> DNA
<213> 新月柄杆菌
<400> 68
ttgtctaacc gcacgccccg ccggttccgg tcccgcgatt ggttcgataa ccccgaccat 60
atcgacatga ccgcgctcta tctggagcgc ttcatgaact acgggatcac gccggaggag 120
ctgcgcagcg gcaagccgat catcggcatc gcccagaccg gcagcgacat ctcgccctgc 180
aaccgcatcc acctggacct ggtccagcgg gtgcgggacg ggatccgcga cgccgggggc 240
atccccatgg agttcccggt ccatccgatc ttcgagaact gccgtcgccc gacggcggcg 300
ctggaccgga acctctcgta cctgggtctc gtcgagaccc tgcacggcta tccgatcgac 360
gccgtggttc tgaccaccgg ctgcgacaag accaccccgg ccgggatcat ggccgccacc 420
acggtcaata tcccggccat cgtgctgtcg ggcggcccga tgctggacgg ctggcacgag 480
aacgagctcg tgggctcggg caccgtgatc tggcgctcgc gccgcaagct ggcggccggc 540
gagatcaccg aggaagagtt catcgaccgc gccgccagct cggcgccgtc ggcgggccac 600
tgcaacacca tgggcacggc ctcgaccatg aacgccgtgg ccgaggcgct gggcctgtcg 660
ctgaccggct gcgcggccat ccccgccccc taccgcgagc gcggccagat ggcctacaag 720
accggccagc gcatcgtcga tctggcctat gacgacgtca aaccgctcga catcctgacc 780
aagcaagcct tcgagaacgc catcgccctg gtggcggcgg ccggcggctc gaccaacgcc 840
cagccgcaca tcgtggccat ggcccgtcac gccggcgtcg agatcaccgc cgacgactgg 900
cgcgcggcct atgacatccc gctgatcgtc aacatgcagc cggccggcaa gtatctgggc 960
gagcgcttcc accgagccgg cggcgcgccg gcggtgctgt gggagctgtt gcagcaaggc 1020
cgcctgcacg gcgacgtgct gaccgtcacc ggcaagacga tgagcgagaa cctgcaaggc 1080
cgcgaaacca gcgaccgcga ggtgatcttc ccgtaccacg agccgctggc cgagaaggcc 1140
gggttcctgg ttctcaaggg caacctcttc gacttcgcga tcatgaagtc cagcgtgatc 1200
ggcgaggagt tccgcaagcg ctacctgtcg cagcccggcc aggaaggcgt gttcgaagcc 1260
cgcgccatcg tgttcgacgg ctcggacgac tatcacaagc ggatcaacga tccggccctg 1320
gagatcgacg agcgctgcat cctggtgatc cgcggcgcgg gtccgatcgg ctggcccggc 1380
tcggccgagg tcgtcaacat gcagccgccg gatcaccttc tgaagaaggg gatcatgagc 1440
ctgcccaccc tgggcgatgg ccgtcagtcg ggcaccgccg acagcccctc gatcctgaac 1500
gcctcgcccg aaagcgcgat cggcggcggc ctgtcgtggc tgcgcaccgg cgacaccatc 1560
cgcatcgacc tcaacaccgg ccgctgcgac gccctggtcg acgaggcgac gatcgccgcg 1620
cgcaagcagg acggcatccc ggcggttccc gccaccatga cgccctggca ggaaatctac 1680
cgcgcccacg ccagtcagct cgacaccggc ggcgtgctgg agttcgcggt caagtaccag 1740
gacctggcgg ccaagctgcc ccgccacaac cactga 1776
<210> 69
<211> 591
<212> PRT
<213> 新月柄杆菌
<400> 69
Met Ser Asn Arg Thr Pro Arg Arg Phe Arg Ser Arg Asp Trp Phe Asp
1 5 10 15
Asn Pro Asp His Ile Asp Met Thr Ala Leu Tyr Leu Glu Arg Phe Met
20 25 30
Asn Tyr Gly Ile Thr Pro Glu Glu Leu Arg Ser Gly Lys Pro Ile Ile
35 40 45
Gly Ile Ala Gln Thr Gly Ser Asp Ile Ser Pro Cys Asn Arg Ile His
50 55 60
Leu Asp Leu Val Gln Arg Val Arg Asp Gly Ile Arg Asp Ala Gly Gly
65 70 75 80
Ile Pro Met Glu Phe Pro Val His Pro Ile Phe Glu Asn Cys Arg Arg
85 90 95
Pro Thr Ala Ala Leu Asp Arg Asn Leu Ser Tyr Leu Gly Leu Val Glu
100 105 110
Thr Leu His Gly Tyr Pro Ile Asp Ala Val Val Leu Thr Thr Gly Cys
115 120 125
Asp Lys Thr Thr Pro Ala Gly Ile Met Ala Ala Thr Thr Val Asn Ile
130 135 140
Pro Ala Ile Val Leu Ser Gly Gly Pro Met Leu Asp Gly Trp His Glu
145 150 155 160
Asn Glu Leu Val Gly Ser Gly Thr Val Ile Trp Arg Ser Arg Arg Lys
165 170 175
Leu Ala Ala Gly Glu Ile Thr Glu Glu Glu Phe Ile Asp Arg Ala Ala
180 185 190
Ser Ser Ala Pro Ser Ala Gly His Cys Asn Thr Met Gly Thr Ala Ser
195 200 205
Thr Met Asn Ala Val Ala Glu Ala Leu Gly Leu Ser Leu Thr Gly Cys
210 215 220
Ala Ala Ile Pro Ala Pro Tyr Arg Glu Arg Gly Gln Met Ala Tyr Lys
225 230 235 240
Thr Gly Gln Arg Ile Val Asp Leu Ala Tyr Asp Asp Val Lys Pro Leu
245 250 255
Asp Ile Leu Thr Lys Gln Ala Phe Glu Asn Ala Ile Ala Leu Val Ala
260 265 270
Ala Ala Gly Gly Ser Thr Asn Ala Gln Pro His Ile Val Ala Met Ala
275 280 285
Arg His Ala Gly Val Glu Ile Thr Ala Asp Asp Trp Arg Ala Ala Tyr
290 295 300
Asp Ile Pro Leu Ile Val Asn Met Gln Pro Ala Gly Lys Tyr Leu Gly
305 310 315 320
Glu Arg Phe His Arg Ala Gly Gly Ala Pro Ala Val Leu Trp Glu Leu
325 330 335
Leu Gln Gln Gly Arg Leu His Gly Asp Val Leu Thr Val Thr Gly Lys
340 345 350
Thr Met Ser Glu Asn Leu Gln Gly Arg Glu Thr Ser Asp Arg Glu Val
355 360 365
Ile Phe Pro Tyr His Glu Pro Leu Ala Glu Lys Ala Gly Phe Leu Val
370 375 380
Leu Lys Gly Asn Leu Phe Asp Phe Ala Ile Met Lys Ser Ser Val Ile
385 390 395 400
Gly Glu Glu Phe Arg Lys Arg Tyr Leu Ser Gln Pro Gly Gln Glu Gly
405 410 415
Val Phe Glu Ala Arg Ala Ile Val Phe Asp Gly Ser Asp Asp Tyr His
420 425 430
Lys Arg Ile Asn Asp Pro Ala Leu Glu Ile Asp Glu Arg Cys Ile Leu
435 440 445
Val Ile Arg Gly Ala Gly Pro Ile Gly Trp Pro Gly Ser Ala Glu Val
450 455 460
Val Asn Met Gln Pro Pro Asp His Leu Leu Lys Lys Gly Ile Met Ser
465 470 475 480
Leu Pro Thr Leu Gly Asp Gly Arg Gln Ser Gly Thr Ala Asp Ser Pro
485 490 495
Ser Ile Leu Asn Ala Ser Pro Glu Ser Ala Ile Gly Gly Gly Leu Ser
500 505 510
Trp Leu Arg Thr Gly Asp Thr Ile Arg Ile Asp Leu Asn Thr Gly Arg
515 520 525
Cys Asp Ala Leu Val Asp Glu Ala Thr Ile Ala Ala Arg Lys Gln Asp
530 535 540
Gly Ile Pro Ala Val Pro Ala Thr Met Thr Pro Trp Gln Glu Ile Tyr
545 550 555 560
Arg Ala His Ala Ser Gln Leu Asp Thr Gly Gly Val Leu Glu Phe Ala
565 570 575
Val Lys Tyr Gln Asp Leu Ala Ala Lys Leu Pro Arg His Asn His
580 585 590
<210> 70
<211> 1968
<212> DNA
<213> 大肠杆菌
<400> 70
atgtctgttc gcaatatttt tgctgacgag agccacgata tttacaccgt cagaacgcac 60
gccgatggcc cggacggcga actcccatta accgcagaga tgcttatcaa ccgcccgagc 120
ggggatctgt tcggtatgac catgaatgcc ggaatgggtt ggtctccgga cgagctggat 180
cgggacggta ttttactgct cagtacactc ggtggcttac gcggcgcaga cggtaaaccc 240
gtggcgctgg cgttgcacca ggggcattac gaactggaca tccagatgaa agcggcggcc 300
gaggttatta aagccaacca tgccctgccc tatgccgtgt acgtctccga tccttgtgac 360
gggcgtactc agggtacaac ggggatgttt gattcgctac cataccgaaa tgacgcatcg 420
atggtaatgc gccgccttat tcgctctctg cccgacgcga aagcagttat tggtgtggcg 480
agttgcgata aggggcttcc ggccaccatg atggcactcg ccgcgcagca caacatcgca 540
accgtgctgg tccccggcgg cgcgacgctg cccgcaaagg atggagaaga caacggcaag 600
gtgcaaacca ttggcgcacg cttcgccaat ggcgaattat ctctacagga cgcacgccgt 660
gcgggctgta aagcctgtgc ctcttccggc ggcggctgtc aatttttggg cactgccggg 720
acatctcagg tggtggccga aggattggga ctggcaatcc cacattcagc cctggcccct 780
tccggtgagc ctgtgtggcg ggagatcgcc agagcttccg cgcgagctgc gctgaacctg 840
agtcaaaaag gcatcaccac ccgggaaatt ctcaccgata aagcgataga gaatgcgatg 900
acggtccatg ccgcgttcgg tggttcaaca aacctgctgt tacacatccc ggcaattgct 960
caccaggcag gttgccatat cccgaccgtt gatgactgga tccgcatcaa caagcgcgtg 1020
ccccgactgg tgagcgtact gcctaatggc ccggtttatc atccaacggt caatgccttt 1080
atggcaggtg gtgtgccgga agtcatgttg catctgcgca gcctcggatt gttgcatgaa 1140
gacgttatga cggttaccgg cagcacgctg aaagaaaacc tcgactggtg ggagcactcc 1200
gaacggcgtc agcggttcaa gcaactcctg ctcgatcagg aacaaatcaa cgctgacgaa 1260
gtgatcatgt ctccgcagca agcaaaagcg cgcggattaa cctcaactat caccttcccg 1320
gtgggcaata ttgcgccaga aggttcggtg atcaaatcca ccgccattga cccctcgatg 1380
attgatgagc aaggtatcta ttaccataaa ggtgtggcga aggtttatct gtccgagaaa 1440
agtgcgattt acgatatcaa acatgacaag atcaaggcgg gcgatattct ggtcattatt 1500
ggcgttggac cttcaggtac agggatggaa gaaacctacc aggttaccag tgccctgaag 1560
catctgtcat acggtaagca tgtttcgtta atcaccgatg cacgtttctc gggcgtttct 1620
actggcgcgt gcatcggcca tgtggggcca gaagcgctgg ccggaggccc catcggtaaa 1680
ttacgcaccg gggatttaat tgaaattaaa attgattgtc gcgagcttca cggcgaagtc 1740
aatttcctcg gaacccgtag cgatgaacaa ttaccttcac aggaggaggc aactgcaata 1800
ttaaatgcca gacccagcca tcaggattta cttcccgatc ctgaattgcc agatgatacc 1860
cggctatggg caatgcttca ggccgtgagt ggtgggacat ggaccggttg tatttatgat 1920
gtaaacaaaa ttggcgcggc tttgcgcgat tttatgaata aaaactga 1968
<210> 71
<211> 1968
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的大肠杆菌序列
<400> 71
atgtctgttc gcaatatttt tgctgacgag agccacgata tttacaccgt cagaacgcac 60
gccgatggcc cggacggcga actcccatta accgcagaga tgcttatcaa ccgcccgagc 120
ggggatctgt tcggtatgac catgaatgcc ggaatgggtt ggtctccgga cgagctggat 180
cgggacggta ttttactgct cagtacactc ggtggcttac gcggcgcaga cggtaaaccc 240
gtggcgctgg cgttgcacca ggggcattac gaactggaca tccagatgaa agcggcggcc 300
gaggttatta aagccaacca tgccctgccc tatgccgtgt acgtctccga tccttgtgac 360
gggcgtactc agggtacaac ggggatgttt gattcgctac cataccgaaa tgacgcatcg 420
atggtaatgc gccgccttat tcgctctctg cccgacgcga aagcagttat tggtgtggcg 480
agttgcgata aggggcttcc ggccaccatg atggcactcg ccgcgcagca caacatcgca 540
accgtgctgg tccccggcgg cgcgacgctg cccgcaaagg atggagaaga caacggcaag 600
gtgcaaacca ttggcgcacg cttcgccaat ggcgaattat ctctacagga cgcacgccgt 660
gcgggctgta aagcctgtgc ctcttccggc ggcggctgtc aatttttggg cactgccggg 720
acatctcagg tggtggccga aggattggga ctggcaatcc cacattcagc cctggcccct 780
tccggtgagc ctgtgtggcg ggagatcgcc agagcttccg cgcgagctgc gctgaacctg 840
agtcaaaaag gcatcaccac ccgggaaatt ctcaccgata aagcgataga gaatgcgatg 900
acggtccatg ccgcgttcgg tggttcaaca aacctgctgt tacacatccc ggcaattgct 960
caccaggcag gttgccatat cccgaccgtt gatgactgga tccgcatcaa caagcgcgtg 1020
ccccgactgg tgagcgtact gcctaatggc ccggtttatc atccaacggt caatgccttt 1080
atggcaggtg gtgtgccgga agtcatgttg catctgcgca gcctcggatt gttgcatgaa 1140
gacgttatga cggttaccgg cagcacgctg aaagaaaacc tcgactggtg ggagcactcc 1200
gaacggcgtc agcggttcaa gcaactcctg ctcgatcagg aacaaatcaa cgctgacgaa 1260
gtgatcatgt ctccgcagca agcaaaagcg cgcggattaa cctcaactat caccttcccg 1320
gtgggcaata ttgcgccaga aggttcggtg atcaaatcca ccgccattga cccctcgatg 1380
attgatgagc aaggtatcta ttaccataaa ggtgtggcga aggtttatct gtccgagaaa 1440
agtgcgattt acgatatcaa acatgacaag atcaaggcgg gcgatattct ggtcattatt 1500
ggcgttggac cttcaggtac agggatggaa gaaacctacc aggttaccag tgccctgaag 1560
catctgtcat acggtaagca tgtttcgtta atcaccgatg cacgtttctc gggcgtttct 1620
actggcgcgt gcatcggcca tgtggggcca gaagcgctgg ccggaggccc catcggtaaa 1680
ttacgcaccg gggatttaat tgaaattaaa attgattgtc gcgagcttca cggcgaagtc 1740
aatttcctcg gaacccgtag cgatgaacaa ttaccttcac aggaggaggc aactgcaata 1800
ttaaatgcca gacccagcca tcaggattta cttcccgatc ctgaattgcc agatgatacc 1860
cggctatggg caatgcttca ggccgtgagt ggtgggacat ggaccggttg tatttatgat 1920
gtaaacaaaa ttggcgcggc tttgcgcgat tttatgaata aaaactga 1968
<210> 72
<211> 655
<212> PRT
<213> 大肠杆菌
<400> 72
Met Ser Val Arg Asn Ile Phe Ala Asp Glu Ser His Asp Ile Tyr Thr
1 5 10 15
Val Arg Thr His Ala Asp Gly Pro Asp Gly Glu Leu Pro Leu Thr Ala
20 25 30
Glu Met Leu Ile Asn Arg Pro Ser Gly Asp Leu Phe Gly Met Thr Met
35 40 45
Asn Ala Gly Met Gly Trp Ser Pro Asp Glu Leu Asp Arg Asp Gly Ile
50 55 60
Leu Leu Leu Ser Thr Leu Gly Gly Leu Arg Gly Ala Asp Gly Lys Pro
65 70 75 80
Val Ala Leu Ala Leu His Gln Gly His Tyr Glu Leu Asp Ile Gln Met
85 90 95
Lys Ala Ala Ala Glu Val Ile Lys Ala Asn His Ala Leu Pro Tyr Ala
100 105 110
Val Tyr Val Ser Asp Pro Cys Asp Gly Arg Thr Gln Gly Thr Thr Gly
115 120 125
Met Phe Asp Ser Leu Pro Tyr Arg Asn Asp Ala Ser Met Val Met Arg
130 135 140
Arg Leu Ile Arg Ser Leu Pro Asp Ala Lys Ala Val Ile Gly Val Ala
145 150 155 160
Ser Cys Asp Lys Gly Leu Pro Ala Thr Met Met Ala Leu Ala Ala Gln
165 170 175
His Asn Ile Ala Thr Val Leu Val Pro Gly Gly Ala Thr Leu Pro Ala
180 185 190
Lys Asp Gly Glu Asp Asn Gly Lys Val Gln Thr Ile Gly Ala Arg Phe
195 200 205
Ala Asn Gly Glu Leu Ser Leu Gln Asp Ala Arg Arg Ala Gly Cys Lys
210 215 220
Ala Cys Ala Ser Ser Gly Gly Gly Cys Gln Phe Leu Gly Thr Ala Gly
225 230 235 240
Thr Ser Gln Val Val Ala Glu Gly Leu Gly Leu Ala Ile Pro His Ser
245 250 255
Ala Leu Ala Pro Ser Gly Glu Pro Val Trp Arg Glu Ile Ala Arg Ala
260 265 270
Ser Ala Arg Ala Ala Leu Asn Leu Ser Gln Lys Gly Ile Thr Thr Arg
275 280 285
Glu Ile Leu Thr Asp Lys Ala Ile Glu Asn Ala Met Thr Val His Ala
290 295 300
Ala Phe Gly Gly Ser Thr Asn Leu Leu Leu His Ile Pro Ala Ile Ala
305 310 315 320
His Gln Ala Gly Cys His Ile Pro Thr Val Asp Asp Trp Ile Arg Ile
325 330 335
Asn Lys Arg Val Pro Arg Leu Val Ser Val Leu Pro Asn Gly Pro Val
340 345 350
Tyr His Pro Thr Val Asn Ala Phe Met Ala Gly Gly Val Pro Glu Val
355 360 365
Met Leu His Leu Arg Ser Leu Gly Leu Leu His Glu Asp Val Met Thr
370 375 380
Val Thr Gly Ser Thr Leu Lys Glu Asn Leu Asp Trp Trp Glu His Ser
385 390 395 400
Glu Arg Arg Gln Arg Phe Lys Gln Leu Leu Leu Asp Gln Glu Gln Ile
405 410 415
Asn Ala Asp Glu Val Ile Met Ser Pro Gln Gln Ala Lys Ala Arg Gly
420 425 430
Leu Thr Ser Thr Ile Thr Phe Pro Val Gly Asn Ile Ala Pro Glu Gly
435 440 445
Ser Val Ile Lys Ser Thr Ala Ile Asp Pro Ser Met Ile Asp Glu Gln
450 455 460
Gly Ile Tyr Tyr His Lys Gly Val Ala Lys Val Tyr Leu Ser Glu Lys
465 470 475 480
Ser Ala Ile Tyr Asp Ile Lys His Asp Lys Ile Lys Ala Gly Asp Ile
485 490 495
Leu Val Ile Ile Gly Val Gly Pro Ser Gly Thr Gly Met Glu Glu Thr
500 505 510
Tyr Gln Val Thr Ser Ala Leu Lys His Leu Ser Tyr Gly Lys His Val
515 520 525
Ser Leu Ile Thr Asp Ala Arg Phe Ser Gly Val Ser Thr Gly Ala Cys
530 535 540
Ile Gly His Val Gly Pro Glu Ala Leu Ala Gly Gly Pro Ile Gly Lys
545 550 555 560
Leu Arg Thr Gly Asp Leu Ile Glu Ile Lys Ile Asp Cys Arg Glu Leu
565 570 575
His Gly Glu Val Asn Phe Leu Gly Thr Arg Ser Asp Glu Gln Leu Pro
580 585 590
Ser Gln Glu Glu Ala Thr Ala Ile Leu Asn Ala Arg Pro Ser His Gln
595 600 605
Asp Leu Leu Pro Asp Pro Glu Leu Pro Asp Asp Thr Arg Leu Trp Ala
610 615 620
Met Leu Gln Ala Val Ser Gly Gly Thr Trp Thr Gly Cys Ile Tyr Asp
625 630 635 640
Val Asn Lys Ile Gly Ala Ala Leu Arg Asp Phe Met Asn Lys Asn
645 650 655
<210> 73
<211> 1968
<212> DNA
<213> 大肠杆菌
<400> 73
atgaccattg agaaaatttt caccccgcag gacgacgcgt tttatgcggt gatcacccac 60
gcggcggggc cgcagggcgc tctgccgctg accccgcaga tgctgatgga atctcccagc 120
ggcaacctgt tcggcatgac gcagaacgcc gggatgggct gggacgccaa caagctcacc 180
ggcaaagagg tgctgattat cggcactcag ggcggcatcc gcgccggaga cggacgccca 240
atcgcgctgg gctaccacac cgggcattgg gagatcggca tgcagatgca ggcggcggcg 300
aaggagatca cccgcaatgg cgggatcccg ttcgcggcct tcgtcagcga tccgtgcgac 360
gggcgctcgc agggcacgca cggtatgttc gattccctgc cgtaccgcaa cgacgcggcg 420
atcgtgtttc gccgcctgat ccgctccctg ccgacgcggc gggcggtgat cggcgtagcg 480
acctgcgata aagggctgcc cgccaccatg attgcgctgg ccgcgatgca cgacctgccg 540
actattctgg tgccgggcgg ggcgacgctg ccgccgaccg tcggggaaga cgcgggcaag 600
gtgcagacca tcggcgcgcg tttcgccaac cacgaactct ccctgcagga ggccgccgaa 660
ctgggctgtc gcgcctgcgc ctcgccgggc ggcgggtgtc agttcctcgg cacggcgggc 720
acctcgcagg tggtcgcgga ggcgctgggt ctggcgctgc cgcactccgc gctggcgccg 780
tccgggcagg cggtgtggct ggagatcgcc cgccagtcgg cgcgcgcggt cagcgagctg 840
gatagccgcg gcatcaccac gcgggatatc ctctccgata aagccatcga aaacgcgatg 900
gtgatccacg cggcgttcgg cggctccacc aatttactgc tgcacattcc ggccatcgcc 960
cacgcggcgg gctgcacgat cccggacgtt gagcactgga cgcgcatcaa ccgtaaagtg 1020
ccgcgtctgg tgagcgtgct gcccaacggc ccggactatc acccgaccgt gcgcgccttc 1080
ctcgcgggcg gcgtgccgga ggtgatgctc cacctgcgcg acctcggcct gctgcatctg 1140
gacgccatga ccgtgaccgg ccagacggtg ggcgagaacc ttgaatggtg gcaggcgtcc 1200
gagcgccggg cgcgcttccg ccagtgcctg cgcgagcagg acggcgtaga gccggatgac 1260
gtgatcctgc cgccggagaa ggcaaaagcg aaagggctga cctcgacggt ctgcttcccg 1320
acgggcaaca tcgctccgga aggttcggtg atcaaggcca cggcgatcga cccgtcggtg 1380
gtgggcgaag atggcgtata ccaccacacc ggccgggtgc gggtgtttgt ctcggaagcg 1440
caggcgatca aggcgatcaa gcgggaagag attgtgcagg gcgatatcat ggtggtgatc 1500
ggcggcgggc cgtccggcac cggcatggaa gagacctacc agctcacctc cgcgctaaag 1560
catatctcgt ggggcaagac ggtgtcgctc atcaccgatg cgcgcttctc gggcgtgtcg 1620
acgggcgcct gcttcggcca cgtgtcgccg gaggcgctgg cgggcgggcc gattggcaag 1680
ctgcgcgata acgacatcat cgagattgcc gtggatcgtc tgacgttaac tggcagcgtg 1740
aacttcatcg gcaccgcgga caacccgctg acgccggaag agggcgcgcg cgagctggcg 1800
cggcggcaga cgcacccgga cctgcacgcc cacgactttt tgccggacga cacccggctg 1860
tgggcggcac tgcagtcggt gagcggcggc acctggaaag gctgtattta tgacaccgat 1920
aaaattatcg aggtaattaa cgccggtaaa aaagcgctcg gaatttaa 1968
<210> 74
<211> 1968
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的大肠杆菌序列
<400> 74
atgaccattg agaaaatttt caccccgcag gacgacgcgt tttatgcggt gatcacccac 60
gcggcggggc cgcagggcgc tctgccgctg accccgcaga tgctgatgga atctcccagc 120
ggcaacctgt tcggcatgac gcagaacgcc gggatgggct gggacgccaa caagctcacc 180
ggcaaagagg tgctgattat cggcactcag ggcggcatcc gcgccggaga cggacgccca 240
atcgcgctgg gctaccacac cgggcattgg gagatcggca tgcagatgca ggcggcggcg 300
aaggagatca cccgcaatgg cgggatcccg ttcgcggcct tcgtcagcga tccgtgcgac 360
gggcgctcgc agggcacgca cggtatgttc gattccctgc cgtaccgcaa cgacgcggcg 420
atcgtgtttc gccgcctgat ccgctccctg ccgacgcggc gggcggtgat cggcgtagcg 480
acctgcgata aagggctgcc cgccaccatg attgcgctgg ccgcgatgca cgacctgccg 540
actattctgg tgccgggcgg ggcgacgctg ccgccgaccg tcggggaaga cgcgggcaag 600
gtgcagacca tcggcgcgcg tttcgccaac cacgaactct ccctgcagga ggccgccgaa 660
ctgggctgtc gcgcctgcgc ctcgccgggc ggcgggtgtc agttcctcgg cacggcgggc 720
acctcgcagg tggtcgcgga ggcgctgggt ctggcgctgc cgcactccgc gctggcgccg 780
tccgggcagg cggtgtggct ggagatcgcc cgccagtcgg cgcgcgcggt cagcgagctg 840
gatagccgcg gcatcaccac gcgggatatc ctctccgata aagccatcga aaacgcgatg 900
gtgatccacg cggcgttcgg cggctccacc aatttactgc tgcacattcc ggccatcgcc 960
cacgcggcgg gctgcacgat cccggacgtt gagcactgga cgcgcatcaa ccgtaaagtg 1020
ccgcgtctgg tgagcgtgct gcccaacggc ccggactatc acccgaccgt gcgcgccttc 1080
ctcgcgggcg gcgtgccgga ggtgatgctc cacctgcgcg acctcggcct gctgcatctg 1140
gacgccatga ccgtgaccgg ccagacggtg ggcgagaacc ttgaatggtg gcaggcgtcc 1200
gagcgccggg cgcgcttccg ccagtgcctg cgcgagcagg acggcgtaga gccggatgac 1260
gtgatcctgc cgccggagaa ggcaaaagcg aaagggctga cctcgacggt ctgcttcccg 1320
acgggcaaca tcgctccgga aggttcggtg atcaaggcca cggcgatcga cccgtcggtg 1380
gtgggcgaag atggcgtata ccaccacacc ggccgggtgc gggtgtttgt ctcggaagcg 1440
caggcgatca aggcgatcaa gcgggaagag attgtgcagg gcgatatcat ggtggtgatc 1500
ggcggcgggc cgtccggcac cggcatggaa gagacctacc agctcacctc cgcgctaaag 1560
catatctcgt ggggcaagac ggtgtcgctc atcaccgatg cgcgcttctc gggcgtgtcg 1620
acgggcgcct gcttcggcca cgtgtcgccg gaggcgctgg cgggcgggcc gattggcaag 1680
ctgcgcgata acgacatcat cgagattgcc gtggatcgtc tgacgttaac tggcagcgtg 1740
aacttcatcg gcaccgcgga caacccgctg acgccggaag agggcgcgcg cgagctggcg 1800
cggcggcaga cgcacccgga cctgcacgcc cacgactttt tgccggacga cacccggctg 1860
tgggcggcac tgcagtcggt gagcggcggc acctggaaag gctgtattta tgacaccgat 1920
aaaattatcg aggtaattaa cgccggtaaa aaagcgctcg gaatttaa 1968
<210> 75
<211> 655
<212> PRT
<213> 大肠杆菌
<400> 75
Met Thr Ile Glu Lys Ile Phe Thr Pro Gln Asp Asp Ala Phe Tyr Ala
1 5 10 15
Val Ile Thr His Ala Ala Gly Pro Gln Gly Ala Leu Pro Leu Thr Pro
20 25 30
Gln Met Leu Met Glu Ser Pro Ser Gly Asn Leu Phe Gly Met Thr Gln
35 40 45
Asn Ala Gly Met Gly Trp Asp Ala Asn Lys Leu Thr Gly Lys Glu Val
50 55 60
Leu Ile Ile Gly Thr Gln Gly Gly Ile Arg Ala Gly Asp Gly Arg Pro
65 70 75 80
Ile Ala Leu Gly Tyr His Thr Gly His Trp Glu Ile Gly Met Gln Met
85 90 95
Gln Ala Ala Ala Lys Glu Ile Thr Arg Asn Gly Gly Ile Pro Phe Ala
100 105 110
Ala Phe Val Ser Asp Pro Cys Asp Gly Arg Ser Gln Gly Thr His Gly
115 120 125
Met Phe Asp Ser Leu Pro Tyr Arg Asn Asp Ala Ala Ile Val Phe Arg
130 135 140
Arg Leu Ile Arg Ser Leu Pro Thr Arg Arg Ala Val Ile Gly Val Ala
145 150 155 160
Thr Cys Asp Lys Gly Leu Pro Ala Thr Met Ile Ala Leu Ala Ala Met
165 170 175
His Asp Leu Pro Thr Ile Leu Val Pro Gly Gly Ala Thr Leu Pro Pro
180 185 190
Thr Val Gly Glu Asp Ala Gly Lys Val Gln Thr Ile Gly Ala Arg Phe
195 200 205
Ala Asn His Glu Leu Ser Leu Gln Glu Ala Ala Glu Leu Gly Cys Arg
210 215 220
Ala Cys Ala Ser Pro Gly Gly Gly Cys Gln Phe Leu Gly Thr Ala Gly
225 230 235 240
Thr Ser Gln Val Val Ala Glu Ala Leu Gly Leu Ala Leu Pro His Ser
245 250 255
Ala Leu Ala Pro Ser Gly Gln Ala Val Trp Leu Glu Ile Ala Arg Gln
260 265 270
Ser Ala Arg Ala Val Ser Glu Leu Asp Ser Arg Gly Ile Thr Thr Arg
275 280 285
Asp Ile Leu Ser Asp Lys Ala Ile Glu Asn Ala Met Val Ile His Ala
290 295 300
Ala Phe Gly Gly Ser Thr Asn Leu Leu Leu His Ile Pro Ala Ile Ala
305 310 315 320
His Ala Ala Gly Cys Thr Ile Pro Asp Val Glu His Trp Thr Arg Ile
325 330 335
Asn Arg Lys Val Pro Arg Leu Val Ser Val Leu Pro Asn Gly Pro Asp
340 345 350
Tyr His Pro Thr Val Arg Ala Phe Leu Ala Gly Gly Val Pro Glu Val
355 360 365
Met Leu His Leu Arg Asp Leu Gly Leu Leu His Leu Asp Ala Met Thr
370 375 380
Val Thr Gly Gln Thr Val Gly Glu Asn Leu Glu Trp Trp Gln Ala Ser
385 390 395 400
Glu Arg Arg Ala Arg Phe Arg Gln Cys Leu Arg Glu Gln Asp Gly Val
405 410 415
Glu Pro Asp Asp Val Ile Leu Pro Pro Glu Lys Ala Lys Ala Lys Gly
420 425 430
Leu Thr Ser Thr Val Cys Phe Pro Thr Gly Asn Ile Ala Pro Glu Gly
435 440 445
Ser Val Ile Lys Ala Thr Ala Ile Asp Pro Ser Val Val Gly Glu Asp
450 455 460
Gly Val Tyr His His Thr Gly Arg Val Arg Val Phe Val Ser Glu Ala
465 470 475 480
Gln Ala Ile Lys Ala Ile Lys Arg Glu Glu Ile Val Gln Gly Asp Ile
485 490 495
Met Val Val Ile Gly Gly Gly Pro Ser Gly Thr Gly Met Glu Glu Thr
500 505 510
Tyr Gln Leu Thr Ser Ala Leu Lys His Ile Ser Trp Gly Lys Thr Val
515 520 525
Ser Leu Ile Thr Asp Ala Arg Phe Ser Gly Val Ser Thr Gly Ala Cys
530 535 540
Phe Gly His Val Ser Pro Glu Ala Leu Ala Gly Gly Pro Ile Gly Lys
545 550 555 560
Leu Arg Asp Asn Asp Ile Ile Glu Ile Ala Val Asp Arg Leu Thr Leu
565 570 575
Thr Gly Ser Val Asn Phe Ile Gly Thr Ala Asp Asn Pro Leu Thr Pro
580 585 590
Glu Glu Gly Ala Arg Glu Leu Ala Arg Arg Gln Thr His Pro Asp Leu
595 600 605
His Ala His Asp Phe Leu Pro Asp Asp Thr Arg Leu Trp Ala Ala Leu
610 615 620
Gln Ser Val Ser Gly Gly Thr Trp Lys Gly Cys Ile Tyr Asp Thr Asp
625 630 635 640
Lys Ile Ile Glu Val Ile Asn Ala Gly Lys Lys Ala Leu Gly Ile
645 650 655
<210> 76
<211> 906
<212> DNA
<213> 大肠杆菌
<400> 76
atgaaaaaat tcagcggcat tattccaccg gtatccagca cgtttcatcg tgacggaacc 60
cttgataaaa aggcaatgcg cgaagttgcc gacttcctga ttaataaagg ggtcgacggg 120
ctgttttatc tgggtaccgg tggtgaattt agccaaatga atacagccca gcgcatggca 180
ctcgccgaag aagctgtaac cattgtcgac gggcgagtgc cggtattgat tggcgtcggt 240
tccccttcca ctgacgaagc ggtcaaactg gcgcagcatg cgcaagccta cggcgctgat 300
ggtatcgtcg ccatcaaccc ctactactgg aaagtcgcac cacgaaatct tgacgactat 360
taccagcaga tcgcccgtag cgtcacccta ccggtgatcc tgtacaactt tccggatctg 420
acgggtcagg acttaacccc ggaaaccgtg acgcgtctgg ctctgcaaaa cgagaatatc 480
gttggcatca aagacaccat cgacagcgtt ggtcacttgc gtacgatgat caacacagtt 540
aagtcggtac gcccgtcgtt ttcggtattc tgcggttacg atgatcattt gctgaatacg 600
atgctgctgg gcggcgacgg tgcgataacc gccagcgcta actttgctcc ggaactctcc 660
gtcggcatct accgcgcctg gcgtgaaggc gatctggcga ccgctgcgac gctgaataaa 720
aaactactac aactgcccgc tatttacgcc ctcgaaacac cgtttgtctc actgatcaaa 780
tacagcatgc agtgtgtcgg gctgcctgta gagacatatt gcttaccacc gattcttgaa 840
gcatctgaag aagcaaaaga taaagtccac gtgctgctta ccgcgcaggg cattttacca 900
gtctga 906
<210> 77
<211> 906
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的大肠杆菌序列
<400> 77
atgaaaaaat tcagcggcat tattccaccg gtatccagca cgtttcatcg tgacggaacc 60
cttgataaaa aggcaatgcg cgaagttgcc gacttcctga ttaataaagg ggtcgacggg 120
ctgttttatc tgggtaccgg tggtgaattt agccaaatga atacagccca gcgcatggca 180
ctcgccgaag aagctgtaac cattgtcgac gggcgagtgc cggtattgat tggcgtcggt 240
tccccttcca ctgacgaagc ggtcaaactg gcgcagcatg cgcaagccta cggcgctgat 300
ggtatcgtcg ccatcaaccc ctactactgg aaagtcgcac cacgaaatct tgacgactat 360
taccagcaga tcgcccgtag cgtcacccta ccggtgatcc tgtacaactt tccggatctg 420
acgggtcagg acttaacccc ggaaaccgtg acgcgtctgg ctctgcaaaa cgagaatatc 480
gttggcatca aagacaccat cgacagcgtt ggtcacttgc gtacgatgat caacacagtt 540
aagtcggtac gcccgtcgtt ttcggtattc tgcggttacg atgatcattt gctgaatacg 600
atgctgctgg gcggcgacgg tgcgataacc gccagcgcta actttgctcc ggaactctcc 660
gtcggcatct accgcgcctg gcgtgaaggc gatctggcga ccgctgcgac gctgaataaa 720
aaactactac aactgcccgc tatttacgcc ctcgaaacac cgtttgtctc actgatcaaa 780
tacagcatgc agtgtgtcgg gctgcctgta gagacatatt gcttaccacc gattcttgaa 840
gcatctgaag aagcaaaaga taaagtccac gtgctgctta ccgcgcaggg cattttacca 900
gtctga 906
<210> 78
<211> 301
<212> PRT
<213> 大肠杆菌
<400> 78
Met Lys Lys Phe Ser Gly Ile Ile Pro Pro Val Ser Ser Thr Phe His
1 5 10 15
Arg Asp Gly Thr Leu Asp Lys Lys Ala Met Arg Glu Val Ala Asp Phe
20 25 30
Leu Ile Asn Lys Gly Val Asp Gly Leu Phe Tyr Leu Gly Thr Gly Gly
35 40 45
Glu Phe Ser Gln Met Asn Thr Ala Gln Arg Met Ala Leu Ala Glu Glu
50 55 60
Ala Val Thr Ile Val Asp Gly Arg Val Pro Val Leu Ile Gly Val Gly
65 70 75 80
Ser Pro Ser Thr Asp Glu Ala Val Lys Leu Ala Gln His Ala Gln Ala
85 90 95
Tyr Gly Ala Asp Gly Ile Val Ala Ile Asn Pro Tyr Tyr Trp Lys Val
100 105 110
Ala Pro Arg Asn Leu Asp Asp Tyr Tyr Gln Gln Ile Ala Arg Ser Val
115 120 125
Thr Leu Pro Val Ile Leu Tyr Asn Phe Pro Asp Leu Thr Gly Gln Asp
130 135 140
Leu Thr Pro Glu Thr Val Thr Arg Leu Ala Leu Gln Asn Glu Asn Ile
145 150 155 160
Val Gly Ile Lys Asp Thr Ile Asp Ser Val Gly His Leu Arg Thr Met
165 170 175
Ile Asn Thr Val Lys Ser Val Arg Pro Ser Phe Ser Val Phe Cys Gly
180 185 190
Tyr Asp Asp His Leu Leu Asn Thr Met Leu Leu Gly Gly Asp Gly Ala
195 200 205
Ile Thr Ala Ser Ala Asn Phe Ala Pro Glu Leu Ser Val Gly Ile Tyr
210 215 220
Arg Ala Trp Arg Glu Gly Asp Leu Ala Thr Ala Ala Thr Leu Asn Lys
225 230 235 240
Lys Leu Leu Gln Leu Pro Ala Ile Tyr Ala Leu Glu Thr Pro Phe Val
245 250 255
Ser Leu Ile Lys Tyr Ser Met Gln Cys Val Gly Leu Pro Val Glu Thr
260 265 270
Tyr Cys Leu Pro Pro Ile Leu Glu Ala Ser Glu Glu Ala Lys Asp Lys
275 280 285
Val His Val Leu Leu Thr Ala Gln Gly Ile Leu Pro Val
290 295 300
<210> 79
<211> 909
<212> DNA
<213> 大肠杆菌
<400> 79
atgccgcagt ccgcgttgtt cacgggaatc attccccctg tctccaccat ttttaccgcc 60
gacggccagc tcgataagcc gggcaccgcc gcgctgatcg acgatctgat caaagcaggc 120
gttgacggcc tgttcttcct gggcagcggt ggcgagttct cccagctcgg cgccgaagag 180
cgtaaagcca ttgcccgctt tgctatcgat catgtcgatc gtcgcgtgcc ggtgctgatc 240
ggcaccggcg gcaccaacgc ccgggaaacc atcgaactca gccagcacgc gcagcaggcg 300
ggcgcggacg gcatcgtggt gatcaacccc tactactgga aagtgtcgga agcgaacctg 360
atccgctatt tcgagcaggt ggccgacagc gtcacgctgc cggtgatgct ctataacttc 420
ccggcgctga ccgggcagga tctgactccg gcgctggtga aaaccctcgc cgactcgcgc 480
agcaatatta tcggcatcaa agacaccatc gactccgtcg cccacctgcg cagcatgatc 540
cataccgtca aaggtgccca tccgcacttc accgtgctct gcggctacga cgatcatctg 600
ttcaataccc tgctgctcgg cggcgacggg gcgatatcgg cgagcggcaa ctttgccccg 660
caggtgtcgg tgaatcttct gaaagcctgg cgcgacgggg acgtggcgaa agcggccggg 720
tatcatcaga ccttgctgca aattccgcag atgtatcagc tggatacgcc gtttgtgaac 780
gtgattaaag aggcgatcgt gctctgcggt cgtcctgtct ccacgcacgt gctgccgccc 840
gcctcgccgc tggacgagcc gcgcaaggcg cagctgaaaa ccctgctgca acagctcaag 900
ctttgctga 909
<210> 80
<211> 909
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的大肠杆菌序列
<400> 80
atgccgcagt ccgcgttgtt cacgggaatc attccccctg tctccaccat ttttaccgcc 60
gacggccagc tcgataagcc gggcaccgcc gcgctgatcg acgatctgat caaagcaggc 120
gttgacggcc tgttcttcct gggcagcggt ggcgagttct cccagctcgg cgccgaagag 180
cgtaaagcca ttgcccgctt tgctatcgat catgtcgatc gtcgcgtgcc ggtgctgatc 240
ggcaccggcg gcaccaacgc ccgggaaacc atcgaactca gccagcacgc gcagcaggcg 300
ggcgcggacg gcatcgtggt gatcaacccc tactactgga aagtgtcgga agcgaacctg 360
atccgctatt tcgagcaggt ggccgacagc gtcacgctgc cggtgatgct ctataacttc 420
ccggcgctga ccgggcagga tctgactccg gcgctggtga aaaccctcgc cgactcgcgc 480
agcaatatta tcggcatcaa agacaccatc gactccgtcg cccacctgcg cagcatgatc 540
cataccgtca aaggtgccca tccgcacttc accgtgctct gcggctacga cgatcatctg 600
ttcaataccc tgctgctcgg cggcgacggg gcgatatcgg cgagcggcaa ctttgccccg 660
caggtgtcgg tgaatcttct gaaagcctgg cgcgacgggg acgtggcgaa agcggccggg 720
tatcatcaga ccttgctgca aattccgcag atgtatcagc tggatacgcc gtttgtgaac 780
gtgattaaag aggcgatcgt gctctgcggt cgtcctgtct ccacgcacgt gctgccgccc 840
gcctcgccgc tggacgagcc gcgcaaggcg cagctgaaaa ccctgctgca acagctcaag 900
ctttgctga 909
<210> 81
<211> 302
<212> PRT
<213> 大肠杆菌
<400> 81
Met Pro Gln Ser Ala Leu Phe Thr Gly Ile Ile Pro Pro Val Ser Thr
1 5 10 15
Ile Phe Thr Ala Asp Gly Gln Leu Asp Lys Pro Gly Thr Ala Ala Leu
20 25 30
Ile Asp Asp Leu Ile Lys Ala Gly Val Asp Gly Leu Phe Phe Leu Gly
35 40 45
Ser Gly Gly Glu Phe Ser Gln Leu Gly Ala Glu Glu Arg Lys Ala Ile
50 55 60
Ala Arg Phe Ala Ile Asp His Val Asp Arg Arg Val Pro Val Leu Ile
65 70 75 80
Gly Thr Gly Gly Thr Asn Ala Arg Glu Thr Ile Glu Leu Ser Gln His
85 90 95
Ala Gln Gln Ala Gly Ala Asp Gly Ile Val Val Ile Asn Pro Tyr Tyr
100 105 110
Trp Lys Val Ser Glu Ala Asn Leu Ile Arg Tyr Phe Glu Gln Val Ala
115 120 125
Asp Ser Val Thr Leu Pro Val Met Leu Tyr Asn Phe Pro Ala Leu Thr
130 135 140
Gly Gln Asp Leu Thr Pro Ala Leu Val Lys Thr Leu Ala Asp Ser Arg
145 150 155 160
Ser Asn Ile Ile Gly Ile Lys Asp Thr Ile Asp Ser Val Ala His Leu
165 170 175
Arg Ser Met Ile His Thr Val Lys Gly Ala His Pro His Phe Thr Val
180 185 190
Leu Cys Gly Tyr Asp Asp His Leu Phe Asn Thr Leu Leu Leu Gly Gly
195 200 205
Asp Gly Ala Ile Ser Ala Ser Gly Asn Phe Ala Pro Gln Val Ser Val
210 215 220
Asn Leu Leu Lys Ala Trp Arg Asp Gly Asp Val Ala Lys Ala Ala Gly
225 230 235 240
Tyr His Gln Thr Leu Leu Gln Ile Pro Gln Met Tyr Gln Leu Asp Thr
245 250 255
Pro Phe Val Asn Val Ile Lys Glu Ala Ile Val Leu Cys Gly Arg Pro
260 265 270
Val Ser Thr His Val Leu Pro Pro Ala Ser Pro Leu Asp Glu Pro Arg
275 280 285
Lys Ala Gln Leu Lys Thr Leu Leu Gln Gln Leu Lys Leu Cys
290 295 300
<210> 82
<211> 957
<212> DNA
<213> 未知
<220>
<223> Scheffersomyces stipitis序列
<400> 82
atgccttcta ttaagttgaa ctctggttac gacatgccag ccgtcggttt cggctgttgg 60
aaagtcgacg tcgacacctg ttctgaacag atctaccgtg ctatcaagac cggttacaga 120
ttgttcgacg gtgccgaaga ttacgccaac gaaaagttag ttggtgccgg tgtcaagaag 180
gccattgacg aaggtatcgt caagcgtgaa gatttgttcc ttacctccaa gttgtggaac 240
aactaccacc acccagacaa cgtcgaaaag gccttgaaca gaaccctttc tgacttgcaa 300
gttgactacg ttgacttgtt cttgatccac ttcccagtca ccttcaagtt cgttccatta 360
gaagaaaagt acccaccagg attctactgt ggtaagggtg acaacttcga ctacgaagat 420
gttccaattt tagagacttg gaaggctctt gaaaagttgg tcaaggccgg taagatcaga 480
tctatcggtg tttctaactt cccaggtgct ttgctcttgg acttgttgag aggtgctacc 540
atcaagccat ctgtcttgca agttgaacac cacccatact tgcaacaacc aagattgatc 600
gaattcgctc aatcccgtgg tattgctgtc accgcttact cttcgttcgg tcctcaatct 660
ttcgttgaat tgaaccaagg tagagctttg aacacttctc cattgttcga gaacgaaact 720
atcaaggcta tcgctgctaa gcacggtaag tctccagctc aagtcttgtt gagatggtca 780
tcccaaagag gcattgccat cattccaaag tccaacactg tcccaagatt gttggaaaac 840
aaggacgtca acagcttcga cttggacgaa caagatttcg ctgacattgc caagttggac 900
atcaacttga gattcaacga cccatgggac tgggacaaga ttcctatctt cgtctaa 957
<210> 83
<211> 957
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的Scheffersomyces stipitis序列
<400> 83
atgccatcta tcaagttaaa ttccggttac gacatgcctg ctgttggttt cggttgctgg 60
aaggttgatg tcgatacttg ttccgagcaa atttaccgtg ctatcaagac tggttacaga 120
ttgttcgatg gtgctgaaga ctacgccaac gaaaagttag tcggtgctgg tgttaaaaag 180
gctatcgacg aaggtattgt taaaagagaa gacttgttct tgacttctaa gttgtggaac 240
aactaccacc atcctgataa cgtcgaaaaa gctttgaacc gtaccttgtc cgatttgcaa 300
gtcgattacg ttgatttgtt cttgattcat ttcccagtta ccttcaagtt cgttccattg 360
gaagagaagt atccaccagg tttctactgt ggtaagggtg ataacttcga ttacgaagat 420
gtcccaatct tagaaacctg gaaggcttta gaaaagttgg ttaaggctgg taagatcaga 480
tccatcggtg tttctaactt cccaggtgcc ttattgttag acttattgag aggtgctacc 540
attaagcctt ccgttttgca agttgaacat catccttact tgcaacaacc aagattgatc 600
gaattcgctc aatctagagg tatcgctgtt actgcctact cttccttcgg tccacaatct 660
ttcgttgagt tgaaccaagg tagagctttg aacacctctc cattgttcga aaacgaaact 720
attaaggcca ttgctgctaa gcatggtaag tctccagccc aagttttgtt gagatggtct 780
tctcaaagag gtatcgctat tatcccaaag tctaatactg tcccaagatt gttggaaaac 840
aaggacgtta actcctttga tttggatgaa caagactttg ctgacatcgc taaattggac 900
atcaacttga gattcaacga cccatgggac tgggacaaga ttccaatttt tgtttaa 957
<210> 84
<211> 318
<212> PRT
<213> 未知
<220>
<223> Scheffersomyces stipitis序列
<400> 84
Met Pro Ser Ile Lys Leu Asn Ser Gly Tyr Asp Met Pro Ala Val Gly
1 5 10 15
Phe Gly Cys Trp Lys Val Asp Val Asp Thr Cys Ser Glu Gln Ile Tyr
20 25 30
Arg Ala Ile Lys Thr Gly Tyr Arg Leu Phe Asp Gly Ala Glu Asp Tyr
35 40 45
Ala Asn Glu Lys Leu Val Gly Ala Gly Val Lys Lys Ala Ile Asp Glu
50 55 60
Gly Ile Val Lys Arg Glu Asp Leu Phe Leu Thr Ser Lys Leu Trp Asn
65 70 75 80
Asn Tyr His His Pro Asp Asn Val Glu Lys Ala Leu Asn Arg Thr Leu
85 90 95
Ser Asp Leu Gln Val Asp Tyr Val Asp Leu Phe Leu Ile His Phe Pro
100 105 110
Val Thr Phe Lys Phe Val Pro Leu Glu Glu Lys Tyr Pro Pro Gly Phe
115 120 125
Tyr Cys Gly Lys Gly Asp Asn Phe Asp Tyr Glu Asp Val Pro Ile Leu
130 135 140
Glu Thr Trp Lys Ala Leu Glu Lys Leu Val Lys Ala Gly Lys Ile Arg
145 150 155 160
Ser Ile Gly Val Ser Asn Phe Pro Gly Ala Leu Leu Leu Asp Leu Leu
165 170 175
Arg Gly Ala Thr Ile Lys Pro Ser Val Leu Gln Val Glu His His Pro
180 185 190
Tyr Leu Gln Gln Pro Arg Leu Ile Glu Phe Ala Gln Ser Arg Gly Ile
195 200 205
Ala Val Thr Ala Tyr Ser Ser Phe Gly Pro Gln Ser Phe Val Glu Leu
210 215 220
Asn Gln Gly Arg Ala Leu Asn Thr Ser Pro Leu Phe Glu Asn Glu Thr
225 230 235 240
Ile Lys Ala Ile Ala Ala Lys His Gly Lys Ser Pro Ala Gln Val Leu
245 250 255
Leu Arg Trp Ser Ser Gln Arg Gly Ile Ala Ile Ile Pro Lys Ser Asn
260 265 270
Thr Val Pro Arg Leu Leu Glu Asn Lys Asp Val Asn Ser Phe Asp Leu
275 280 285
Asp Glu Gln Asp Phe Ala Asp Ile Ala Lys Leu Asp Ile Asn Leu Arg
290 295 300
Phe Asn Asp Pro Trp Asp Trp Asp Lys Ile Pro Ile Phe Val
305 310 315
<210> 85
<211> 984
<212> DNA
<213> 酿酒酵母
<400> 85
atgtcttcac tggttactct taataacggt ctgaaaatgc ccctagtcgg cttagggtgc 60
tggaaaattg acaaaaaagt ctgtgcgaat caaatttatg aagctatcaa attaggctac 120
cgtttattcg atggtgcttg cgactacggc aacgaaaagg aagttggtga aggtatcagg 180
aaagccatct ccgaaggtct tgtttctaga aaggatatat ttgttgtttc aaagttatgg 240
aacaattttc accatcctga tcatgtaaaa ttagctttaa agaagacctt aagcgatatg 300
ggacttgatt atttagacct gtattatatt cacttcccaa tcgccttcaa atatgttcca 360
tttgaagaga aataccctcc aggattctat acgggcgcag atgacgagaa gaaaggtcac 420
atcaccgaag cacatgtacc aatcatagat acgtaccggg ctctggaaga atgtgttgat 480
gaaggcttga ttaagtctat tggtgtttcc aactttcagg gaagcttgat tcaagattta 540
ttacgtggtt gtagaatcaa gcccgtggct ttgcaaattg aacaccatcc ttatttgact 600
caagaacacc tagttgagtt ttgtaaatta cacgatatcc aagtagttgc ttactcctcc 660
ttcggtcctc aatcattcat tgagatggac ttacagttgg caaaaaccac gccaactctg 720
ttcgagaatg atgtaatcaa gaaggtctca caaaaccatc caggcagtac cacttcccaa 780
gtattgctta gatgggcaac tcagagaggc attgccgtca ttccaaaatc ttccaagaag 840
gaaaggttac ttggcaacct agaaatcgaa aaaaagttca ctttaacgga gcaagaattg 900
aaggatattt ctgcactaaa tgccaacatc agatttaatg atccatggac ctggttggat 960
ggtaaattcc ccacttttgc ctga 984
<210> 86
<211> 984
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的酿酒酵母序列
<400> 86
atgtcttcac tggttactct taataacggt ctgaaaatgc ccctagtcgg cttagggtgc 60
tggaaaattg acaaaaaagt ctgtgcgaat caaatttatg aagctatcaa attaggctac 120
cgtttattcg atggtgcttg cgactacggc aacgaaaagg aagttggtga aggtatcagg 180
aaagccatct ccgaaggtct tgtttctaga aaggatatat ttgttgtttc aaagttatgg 240
aacaattttc accatcctga tcatgtaaaa ttagctttaa agaagacctt aagcgatatg 300
ggacttgatt atttagacct gtattatatt cacttcccaa tcgccttcaa atatgttcca 360
tttgaagaga aataccctcc aggattctat acgggcgcag atgacgagaa gaaaggtcac 420
atcaccgaag cacatgtacc aatcatagat acgtaccggg ctctggaaga atgtgttgat 480
gaaggcttga ttaagtctat tggtgtttcc aactttcagg gaagcttgat tcaagattta 540
ttacgtggtt gtagaatcaa gcccgtggct ttgcaaattg aacaccatcc ttatttgact 600
caagaacacc tagttgagtt ttgtaaatta cacgatatcc aagtagttgc ttactcctcc 660
ttcggtcctc aatcattcat tgagatggac ttacagttgg caaaaaccac gccaactctg 720
ttcgagaatg atgtaatcaa gaaggtctca caaaaccatc caggcagtac cacttcccaa 780
gtattgctta gatgggcaac tcagagaggc attgccgtca ttccaaaatc ttccaagaag 840
gaaaggttac ttggcaacct agaaatcgaa aaaaagttca ctttaacgga gcaagaattg 900
aaggatattt ctgcactaaa tgccaacatc agatttaatg atccatggac ctggttggat 960
ggtaaattcc ccacttttgc ctga 984
<210> 87
<211> 327
<212> PRT
<213> 酿酒酵母
<400> 87
Met Ser Ser Leu Val Thr Leu Asn Asn Gly Leu Lys Met Pro Leu Val
1 5 10 15
Gly Leu Gly Cys Trp Lys Ile Asp Lys Lys Val Cys Ala Asn Gln Ile
20 25 30
Tyr Glu Ala Ile Lys Leu Gly Tyr Arg Leu Phe Asp Gly Ala Cys Asp
35 40 45
Tyr Gly Asn Glu Lys Glu Val Gly Glu Gly Ile Arg Lys Ala Ile Ser
50 55 60
Glu Gly Leu Val Ser Arg Lys Asp Ile Phe Val Val Ser Lys Leu Trp
65 70 75 80
Asn Asn Phe His His Pro Asp His Val Lys Leu Ala Leu Lys Lys Thr
85 90 95
Leu Ser Asp Met Gly Leu Asp Tyr Leu Asp Leu Tyr Tyr Ile His Phe
100 105 110
Pro Ile Ala Phe Lys Tyr Val Pro Phe Glu Glu Lys Tyr Pro Pro Gly
115 120 125
Phe Tyr Thr Gly Ala Asp Asp Glu Lys Lys Gly His Ile Thr Glu Ala
130 135 140
His Val Pro Ile Ile Asp Thr Tyr Arg Ala Leu Glu Glu Cys Val Asp
145 150 155 160
Glu Gly Leu Ile Lys Ser Ile Gly Val Ser Asn Phe Gln Gly Ser Leu
165 170 175
Ile Gln Asp Leu Leu Arg Gly Cys Arg Ile Lys Pro Val Ala Leu Gln
180 185 190
Ile Glu His His Pro Tyr Leu Thr Gln Glu His Leu Val Glu Phe Cys
195 200 205
Lys Leu His Asp Ile Gln Val Val Ala Tyr Ser Ser Phe Gly Pro Gln
210 215 220
Ser Phe Ile Glu Met Asp Leu Gln Leu Ala Lys Thr Thr Pro Thr Leu
225 230 235 240
Phe Glu Asn Asp Val Ile Lys Lys Val Ser Gln Asn His Pro Gly Ser
245 250 255
Thr Thr Ser Gln Val Leu Leu Arg Trp Ala Thr Gln Arg Gly Ile Ala
260 265 270
Val Ile Pro Lys Ser Ser Lys Lys Glu Arg Leu Leu Gly Asn Leu Glu
275 280 285
Ile Glu Lys Lys Phe Thr Leu Thr Glu Gln Glu Leu Lys Asp Ile Ser
290 295 300
Ala Leu Asn Ala Asn Ile Arg Phe Asn Asp Pro Trp Thr Trp Leu Asp
305 310 315 320
Gly Lys Phe Pro Thr Phe Ala
325
<210> 88
<211> 1092
<212> DNA
<213> 未知
<220>
<223> Scheffersomyces stipitis序列
<400> 88
atgactgcta acccttcctt ggtgttgaac aagatcgacg acatttcgtt cgaaacttac 60
gatgccccag aaatctctga acctaccgat gtcctcgtcc aggtcaagaa aaccggtatc 120
tgtggttccg acatccactt ctacgcccat ggtagaatcg gtaacttcgt tttgaccaag 180
ccaatggtct tgggtcacga atccgccggt actgttgtcc aggttggtaa gggtgtcacc 240
tctcttaagg ttggtgacaa cgtcgctatc gaaccaggta ttccatccag attctccgac 300
gaatacaaga gcggtcacta caacttgtgt cctcacatgg ccttcgccgc tactcctaac 360
tccaaggaag gcgaaccaaa cccaccaggt accttatgta agtacttcaa gtcgccagaa 420
gacttcttgg tcaagttgcc agaccacgtc agcttggaac tcggtgctct tgttgagcca 480
ttgtctgttg gtgtccacgc ctctaagttg ggttccgttg ctttcggcga ctacgttgcc 540
gtctttggtg ctggtcctgt tggtcttttg gctgctgctg tcgccaagac cttcggtgct 600
aagggtgtca tcgtcgttga cattttcgac aacaagttga agatggccaa ggacattggt 660
gctgctactc acaccttcaa ctccaagacc ggtggttctg aagaattgat caaggctttc 720
ggtggtaacg tgccaaacgt cgttttggaa tgtactggtg ctgaaccttg tatcaagttg 780
ggtgttgacg ccattgcccc aggtggtcgt ttcgttcaag tcggtaacgc tgctggtcca 840
gtcagcttcc caatcaccgt tttcgccatg aaggaattga ctttgttcgg ttctttcaga 900
tacggattca acgactacaa gactgctgtt ggaatctttg acactaacta ccaaaacggt 960
agagaaaatg ctccaattga ctttgaacaa ttgatcaccc acagatacaa gttcaaggac 1020
gctattgaag cctacgactt ggtcagagcc ggtaagggtg ctgtcaagtg tctcattgac 1080
ggccctgagt aa 1092
<210> 89
<211> 1092
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的Scheffersomyces stipitis
<400> 89
atgactgcta acccttcctt ggtgttgaac aagatcgacg acatttcgtt cgaaacttac 60
gatgccccag aaatctctga acctaccgat gtcctcgtcc aggtcaagaa aaccggtatc 120
tgtggttccg acatccactt ctacgcccat ggtagaatcg gtaacttcgt tttgaccaag 180
ccaatggtct tgggtcacga atccgccggt actgttgtcc aggttggtaa gggtgtcacc 240
tctcttaagg ttggtgacaa cgtcgctatc gaaccaggta ttccatccag attctccgac 300
gaatacaaga gcggtcacta caacttgtgt cctcacatgg ccttcgccgc tactcctaac 360
tccaaggaag gcgaaccaaa cccaccaggt accttatgta agtacttcaa gtcgccagaa 420
gatttcttgg tcaagttgcc agaccacgtc agcttggaac tcggtgctct tgttgagcca 480
ttgtctgttg gtgtccacgc ctctaagttg ggttccgttg ctttcggcga ctacgttgcc 540
gtctttggag caggtcctgt tggtcttttg gctgctgctg tcgccaagac cttcggtgct 600
aagggtgtca tcgtcgttga cattttcgac aacaagttga agatggccaa ggacattgga 660
gctgctactc acaccttcaa ctccaagacc ggtggttctg aagaattgat caaggctttc 720
ggtggtaacg tgccaaacgt cgttttggaa tgtacaggtg cagaaccttg tatcaagttg 780
ggtgttgacg ccattgcccc aggtggtcgt ttcgttcaag tcggtaacgc tgctggtcca 840
gtcagcttcc caatcaccgt tttcgccatg aaggaattga ctttgttcgg ttctttcaga 900
tacggattca acgactacaa gactgctgtt ggaatctttg acactaacta ccaaaacggt 960
agagaaaatg ctccaattga ctttgaacaa ttgatcaccc acagatacaa gttcaaggac 1020
gctattgaag cctacgactt ggtcagagcc ggtaagggtg ctgtcaagtg tctcattgac 1080
ggccctgagt aa 1092
<210> 90
<211> 363
<212> PRT
<213> 未知
<220>
<223> Scheffersomyces stipitis序列
<400> 90
Met Thr Ala Asn Pro Ser Leu Val Leu Asn Lys Ile Asp Asp Ile Ser
1 5 10 15
Phe Glu Thr Tyr Asp Ala Pro Glu Ile Ser Glu Pro Thr Asp Val Leu
20 25 30
Val Gln Val Lys Lys Thr Gly Ile Cys Gly Ser Asp Ile His Phe Tyr
35 40 45
Ala His Gly Arg Ile Gly Asn Phe Val Leu Thr Lys Pro Met Val Leu
50 55 60
Gly His Glu Ser Ala Gly Thr Val Val Gln Val Gly Lys Gly Val Thr
65 70 75 80
Ser Leu Lys Val Gly Asp Asn Val Ala Ile Glu Pro Gly Ile Pro Ser
85 90 95
Arg Phe Ser Asp Glu Tyr Lys Ser Gly His Tyr Asn Leu Cys Pro His
100 105 110
Met Ala Phe Ala Ala Thr Pro Asn Ser Lys Glu Gly Glu Pro Asn Pro
115 120 125
Pro Gly Thr Leu Cys Lys Tyr Phe Lys Ser Pro Glu Asp Phe Leu Val
130 135 140
Lys Leu Pro Asp His Val Ser Leu Glu Leu Gly Ala Leu Val Glu Pro
145 150 155 160
Leu Ser Val Gly Val His Ala Ser Lys Leu Gly Ser Val Ala Phe Gly
165 170 175
Asp Tyr Val Ala Val Phe Gly Ala Gly Pro Val Gly Leu Leu Ala Ala
180 185 190
Ala Val Ala Lys Thr Phe Gly Ala Lys Gly Val Ile Val Val Asp Ile
195 200 205
Phe Asp Asn Lys Leu Lys Met Ala Lys Asp Ile Gly Ala Ala Thr His
210 215 220
Thr Phe Asn Ser Lys Thr Gly Gly Ser Glu Glu Leu Ile Lys Ala Phe
225 230 235 240
Gly Gly Asn Val Pro Asn Val Val Leu Glu Cys Thr Gly Ala Glu Pro
245 250 255
Cys Ile Lys Leu Gly Val Asp Ala Ile Ala Pro Gly Gly Arg Phe Val
260 265 270
Gln Val Gly Asn Ala Ala Gly Pro Val Ser Phe Pro Ile Thr Val Phe
275 280 285
Ala Met Lys Glu Leu Thr Leu Phe Gly Ser Phe Arg Tyr Gly Phe Asn
290 295 300
Asp Tyr Lys Thr Ala Val Gly Ile Phe Asp Thr Asn Tyr Gln Asn Gly
305 310 315 320
Arg Glu Asn Ala Pro Ile Asp Phe Glu Gln Leu Ile Thr His Arg Tyr
325 330 335
Lys Phe Lys Asp Ala Ile Glu Ala Tyr Asp Leu Val Arg Ala Gly Lys
340 345 350
Gly Ala Val Lys Cys Leu Ile Asp Gly Pro Glu
355 360
<210> 91
<211> 1092
<212> DNA
<213> 未知
<220>
<223> 里氏木霉序列
<400> 91
atggcgactc aaacgatcaa caaggatgcg atcagcaacc tctccttcgt cctcaacaag 60
cccggcgacg tgacctttga ggagcggccg aagccgacca tcacggaccc caacgacgtc 120
ctcgtcgccg tcaactacac gggcatctgc ggctccgacg tgcactactg ggtgcacggc 180
gccatcgggc acttcgtcgt caaggacccg atggtgctgg gccacgagtc ggccggcacc 240
gtcgtcgagg tcggcccggc cgtcaagagc ctcaagcccg gcgaccgcgt cgccctcgag 300
cccggctacc cgtgccggcg gtgctccttc tgccgcgccg gcaaatacaa cctgtgcccg 360
gacatggtct tcgccgccac gccgccgtac cacggcaccc tgacgggcct gtgggcggcg 420
cccgccgact tctgctacaa gctgccggac ggcgtgtcgc tgcaggaggg cgcgctgatc 480
gagccgctgg ccgtggccgt ccacattgtc aagcaggccc gcgtccagcc gggccagtcc 540
gtcgtcgtca tgggcgccgg ccccgtcggc ctgctgtgcg ccgccgtggc caaggcgtac 600
ggcgcctcca ccattgtcag cgtcgacatc gtgcagtcca agctcgactt tgcgcgcggc 660
ttctgctcga cgcacacgta cgtctcgcag cgcatctcgg ctgaggacaa cgcaaaggcc 720
atcaaggagc tggcgggcct gcccggcggc gccgacgtcg tgattgacgc cagcggcgcg 780
gagccgtcga tccagacgag cattcacgtc gtccgcatgg gcggcacgta cgtccagggc 840
ggcatgggca agagcgacat cacgttcccc atcatggcca tgtgcctcaa ggaggtgacg 900
gtccggggct cgttccgcta cggcgccggc gactacgagc tggcggtcga gctggtccgg 960
acggggcggg tggacgtcaa gaagctgatt acgggcaccg tcagcttcaa gcaggcggag 1020
gaggcgttcc aaaaggtcaa gtctggggag gccatcaaga ttctgattgc cgggcccaac 1080
gagaaggtgt aa 1092
<210> 92
<211> 363
<212> PRT
<213> 未知
<220>
<223> 里氏木霉序列
<400> 92
Met Ala Thr Gln Thr Ile Asn Lys Asp Ala Ile Ser Asn Leu Ser Phe
1 5 10 15
Val Leu Asn Lys Pro Gly Asp Val Thr Phe Glu Glu Arg Pro Lys Pro
20 25 30
Thr Ile Thr Asp Pro Asn Asp Val Leu Val Ala Val Asn Tyr Thr Gly
35 40 45
Ile Cys Gly Ser Asp Val His Tyr Trp Val His Gly Ala Ile Gly His
50 55 60
Phe Val Val Lys Asp Pro Met Val Leu Gly His Glu Ser Ala Gly Thr
65 70 75 80
Val Val Glu Val Gly Pro Ala Val Lys Ser Leu Lys Pro Gly Asp Arg
85 90 95
Val Ala Leu Glu Pro Gly Tyr Pro Cys Arg Arg Cys Ser Phe Cys Arg
100 105 110
Ala Gly Lys Tyr Asn Leu Cys Pro Asp Met Val Phe Ala Ala Thr Pro
115 120 125
Pro Tyr His Gly Thr Leu Thr Gly Leu Trp Ala Ala Pro Ala Asp Phe
130 135 140
Cys Tyr Lys Leu Pro Asp Gly Val Ser Leu Gln Glu Gly Ala Leu Ile
145 150 155 160
Glu Pro Leu Ala Val Ala Val His Ile Val Lys Gln Ala Arg Val Gln
165 170 175
Pro Gly Gln Ser Val Val Val Met Gly Ala Gly Pro Val Gly Leu Leu
180 185 190
Cys Ala Ala Val Ala Lys Ala Tyr Gly Ala Ser Thr Ile Val Ser Val
195 200 205
Asp Ile Val Gln Ser Lys Leu Asp Phe Ala Arg Gly Phe Cys Ser Thr
210 215 220
His Thr Tyr Val Ser Gln Arg Ile Ser Ala Glu Asp Asn Ala Lys Ala
225 230 235 240
Ile Lys Glu Leu Ala Gly Leu Pro Gly Gly Ala Asp Val Val Ile Asp
245 250 255
Ala Ser Gly Ala Glu Pro Ser Ile Gln Thr Ser Ile His Val Val Arg
260 265 270
Met Gly Gly Thr Tyr Val Gln Gly Gly Met Gly Lys Ser Asp Ile Thr
275 280 285
Phe Pro Ile Met Ala Met Cys Leu Lys Glu Val Thr Val Arg Gly Ser
290 295 300
Phe Arg Tyr Gly Ala Gly Asp Tyr Glu Leu Ala Val Glu Leu Val Arg
305 310 315 320
Thr Gly Arg Val Asp Val Lys Lys Leu Ile Thr Gly Thr Val Ser Phe
325 330 335
Lys Gln Ala Glu Glu Ala Phe Gln Lys Val Lys Ser Gly Glu Ala Ile
340 345 350
Lys Ile Leu Ile Ala Gly Pro Asn Glu Lys Val
355 360
<210> 93
<211> 1314
<212> DNA
<213> 未知
<220>
<223> Pyromyces sp.序列
<400> 93
atggctaagg aatatttccc acaaattcaa aagattaagt tcgaaggtaa ggattctaag 60
aatccattag ccttccacta ctacgatgct gaaaaggaag tcatgggtaa gaaaatgaag 120
gattggttac gtttcgccat ggcctggtgg cacactcttt gcgccgaagg tgctgaccaa 180
ttcggtggag gtacaaagtc tttcccatgg aacgaaggta ctgatgctat tgaaattgcc 240
aagcaaaagg ttgatgctgg tttcgaaatc atgcaaaagc ttggtattcc atactactgt 300
ttccacgatg ttgatcttgt ttccgaaggt aactctattg aagaatacga atccaacctt 360
aaggctgtcg ttgcttacct caaggaaaag caaaaggaaa ccggtattaa gcttctctgg 420
agtactgcta acgtcttcgg tcacaagcgt tacatgaacg gtgcctccac taacccagac 480
tttgatgttg tcgcccgtgc tattgttcaa attaagaacg ccatagacgc cggtattgaa 540
cttggtgctg aaaactacgt cttctggggt ggtcgtgaag gttacatgag tctccttaac 600
actgaccaaa agcgtgaaaa ggaacacatg gccactatgc ttaccatggc tcgtgactac 660
gctcgttcca agggattcaa gggtactttc ctcattgaac caaagccaat ggaaccaacc 720
aagcaccaat acgatgttga cactgaaacc gctattggtt tccttaaggc ccacaactta 780
gacaaggact tcaaggtcaa cattgaagtt aaccacgcta ctcttgctgg tcacactttc 840
gaacacgaac ttgcctgtgc tgttgatgct ggtatgctcg gttccattga tgctaaccgt 900
ggtgactacc aaaacggttg ggatactgat caattcccaa ttgatcaata cgaactcgtc 960
caagcttgga tggaaatcat ccgtggtggt ggtttcgtta ctggtggtac caacttcgat 1020
gccaagactc gtcgtaactc tactgacctc gaagacatca tcattgccca cgtttctggt 1080
atggatgcta tggctcgtgc tcttgaaaac gctgccaagc tcctccaaga atctccatac 1140
accaagatga agaaggaacg ttacgcttcc ttcgacagtg gtattggtaa ggactttgaa 1200
gatggtaagc tcaccctcga acaagtttac gaatacggta agaagaacgg tgaaccaaag 1260
caaacttctg gtaagcaaga actctacgaa gctattgttg ccatgtacca ataa 1314
<210> 94
<211> 1314
<212> DNA
<213> 未知
<220>
<223> 密码子优化的Pyromyces sp.序列
<400> 94
atggccaagg aatacttccc acaaatccaa aagattaaat tcgaaggtaa agattccaag 60
aacccattgg cttttcacta ctacgatgct gagaaggaag ttatgggtaa gaagatgaag 120
gattggttga gattcgctat ggcttggtgg cacactttgt gcgctgaagg tgctgaccaa 180
ttcggtggtg gtactaagtc tttcccatgg aacgaaggta ctgatgctat tgaaatcgct 240
aagcaaaaag tcgatgctgg ttttgagatt atgcaaaaat tgggtatccc atactactgt 300
ttccacgacg tcgacttggt ttctgaaggt aattctatcg aagaatacga atctaatttg 360
aaggctgttg tcgcttactt aaaagaaaag caaaaggaga ctggtattaa gttgttgtgg 420
tccaccgcta acgtctttgg tcataaaaga tacatgaacg gtgcttccac caacccagac 480
ttcgatgtcg tcgccagagc tatcgttcaa attaaaaacg ccatcgacgc tggtattgaa 540
ttgggtgctg aaaattacgt cttttggggt ggtcgtgaag gttacatgtc tttgttgaac 600
actgaccaaa agagagaaaa agaacacatg gccactatgt tgaccatggc cagagattac 660
gccagatcta agggtttcaa gggtaccttc ttaattgaac caaaacctat ggaaccaact 720
aagcaccaat acgacgttga cactgaaact gctatcggtt ttttgaaggc tcacaacttg 780
gataaggatt ttaaagtcaa cattgaagtt aaccatgcta ctttggctgg tcacactttt 840
gaacatgaat tggcctgtgc tgttgatgct ggtatgttgg gttctatcga tgctaataga 900
ggtgactatc aaaacggttg ggacactgat caattcccaa tcgatcaata tgaattagtt 960
caagcttgga tggaaattat cagaggtggt ggtttcgtta ctggtggtac taacttcgat 1020
gctaagacca gaagaaactc tactgatttg gaagatatta tcattgccca cgtttccggt 1080
atggatgcca tggccagagc tttggaaaac gccgccaagt tattgcaaga gtccccatac 1140
accaagatga aaaaggaacg ttacgcttct ttcgactctg gtatcggtaa agacttcgaa 1200
gatggtaagt tgaccttgga acaagtttac gaatacggta agaagaacgg tgaacctaaa 1260
caaacctctg gtaaacaaga attgtatgaa gctattgttg ccatgtacca ataa 1314
<210> 95
<211> 437
<212> PRT
<213> 未知
<220>
<223> Pyromyces sp.序列
<400> 95
Met Ala Lys Glu Tyr Phe Pro Gln Ile Gln Lys Ile Lys Phe Glu Gly
1 5 10 15
Lys Asp Ser Lys Asn Pro Leu Ala Phe His Tyr Tyr Asp Ala Glu Lys
20 25 30
Glu Val Met Gly Lys Lys Met Lys Asp Trp Leu Arg Phe Ala Met Ala
35 40 45
Trp Trp His Thr Leu Cys Ala Glu Gly Ala Asp Gln Phe Gly Gly Gly
50 55 60
Thr Lys Ser Phe Pro Trp Asn Glu Gly Thr Asp Ala Ile Glu Ile Ala
65 70 75 80
Lys Gln Lys Val Asp Ala Gly Phe Glu Ile Met Gln Lys Leu Gly Ile
85 90 95
Pro Tyr Tyr Cys Phe His Asp Val Asp Leu Val Ser Glu Gly Asn Ser
100 105 110
Ile Glu Glu Tyr Glu Ser Asn Leu Lys Ala Val Val Ala Tyr Leu Lys
115 120 125
Glu Lys Gln Lys Glu Thr Gly Ile Lys Leu Leu Trp Ser Thr Ala Asn
130 135 140
Val Phe Gly His Lys Arg Tyr Met Asn Gly Ala Ser Thr Asn Pro Asp
145 150 155 160
Phe Asp Val Val Ala Arg Ala Ile Val Gln Ile Lys Asn Ala Ile Asp
165 170 175
Ala Gly Ile Glu Leu Gly Ala Glu Asn Tyr Val Phe Trp Gly Gly Arg
180 185 190
Glu Gly Tyr Met Ser Leu Leu Asn Thr Asp Gln Lys Arg Glu Lys Glu
195 200 205
His Met Ala Thr Met Leu Thr Met Ala Arg Asp Tyr Ala Arg Ser Lys
210 215 220
Gly Phe Lys Gly Thr Phe Leu Ile Glu Pro Lys Pro Met Glu Pro Thr
225 230 235 240
Lys His Gln Tyr Asp Val Asp Thr Glu Thr Ala Ile Gly Phe Leu Lys
245 250 255
Ala His Asn Leu Asp Lys Asp Phe Lys Val Asn Ile Glu Val Asn His
260 265 270
Ala Thr Leu Ala Gly His Thr Phe Glu His Glu Leu Ala Cys Ala Val
275 280 285
Asp Ala Gly Met Leu Gly Ser Ile Asp Ala Asn Arg Gly Asp Tyr Gln
290 295 300
Asn Gly Trp Asp Thr Asp Gln Phe Pro Ile Asp Gln Tyr Glu Leu Val
305 310 315 320
Gln Ala Trp Met Glu Ile Ile Arg Gly Gly Gly Phe Val Thr Gly Gly
325 330 335
Thr Asn Phe Asp Ala Lys Thr Arg Arg Asn Ser Thr Asp Leu Glu Asp
340 345 350
Ile Ile Ile Ala His Val Ser Gly Met Asp Ala Met Ala Arg Ala Leu
355 360 365
Glu Asn Ala Ala Lys Leu Leu Gln Glu Ser Pro Tyr Thr Lys Met Lys
370 375 380
Lys Glu Arg Tyr Ala Ser Phe Asp Ser Gly Ile Gly Lys Asp Phe Glu
385 390 395 400
Asp Gly Lys Leu Thr Leu Glu Gln Val Tyr Glu Tyr Gly Lys Lys Asn
405 410 415
Gly Glu Pro Lys Gln Thr Ser Gly Lys Gln Glu Leu Tyr Glu Ala Ile
420 425 430
Val Ala Met Tyr Gln
435
<210> 96
<211> 657
<212> DNA
<213> 丙酮丁醇梭菌
<400> 96
atgaactcta aaataattag atttgaaaat ttaaggtcat tctttaaaga tgggatgaca 60
attatgattg gaggtttttt aaactgtggc actccaacca aattaattga ttttttagtt 120
aatttaaata taaagaattt aacgattata agtaatgata catgttatcc taatacaggt 180
attggtaagt taatatcaaa taatcaagta aaaaagctta ttgcttcata tataggcagc 240
aacccagata ctggcaaaaa actttttaat aatgaacttg aagtagagct ctctccccaa 300
ggaactctag tggaaagaat acgtgcaggc ggatctggct taggtggtgt actaactaaa 360
acaggtttag gaactttgat tgaaaaagga aagaaaaaaa tatctataaa tggaacggaa 420
tatttgttag agctacctct tacagccgat gtagcattaa ttaaaggtag tattgtagat 480
gaggccggaa acaccttcta taaaggtact actaaaaact ttaatcccta tatggcaatg 540
gcagctaaaa ccgtaatagt tgaagctgaa aatttagtta gctgtgaaaa actagaaaag 600
gaaaaagcaa tgacccccgg agttcttata aattatatag taaaggagcc tgcataa 657
<210> 97
<211> 218
<212> PRT
<213> 丙酮丁醇梭菌
<400> 97
Met Asn Ser Lys Ile Ile Arg Phe Glu Asn Leu Arg Ser Phe Phe Lys
1 5 10 15
Asp Gly Met Thr Ile Met Ile Gly Gly Phe Leu Asn Cys Gly Thr Pro
20 25 30
Thr Lys Leu Ile Asp Phe Leu Val Asn Leu Asn Ile Lys Asn Leu Thr
35 40 45
Ile Ile Ser Asn Asp Thr Cys Tyr Pro Asn Thr Gly Ile Gly Lys Leu
50 55 60
Ile Ser Asn Asn Gln Val Lys Lys Leu Ile Ala Ser Tyr Ile Gly Ser
65 70 75 80
Asn Pro Asp Thr Gly Lys Lys Leu Phe Asn Asn Glu Leu Glu Val Glu
85 90 95
Leu Ser Pro Gln Gly Thr Leu Val Glu Arg Ile Arg Ala Gly Gly Ser
100 105 110
Gly Leu Gly Gly Val Leu Thr Lys Thr Gly Leu Gly Thr Leu Ile Glu
115 120 125
Lys Gly Lys Lys Lys Ile Ser Ile Asn Gly Thr Glu Tyr Leu Leu Glu
130 135 140
Leu Pro Leu Thr Ala Asp Val Ala Leu Ile Lys Gly Ser Ile Val Asp
145 150 155 160
Glu Ala Gly Asn Thr Phe Tyr Lys Gly Thr Thr Lys Asn Phe Asn Pro
165 170 175
Tyr Met Ala Met Ala Ala Lys Thr Val Ile Val Glu Ala Glu Asn Leu
180 185 190
Val Ser Cys Glu Lys Leu Glu Lys Glu Lys Ala Met Thr Pro Gly Val
195 200 205
Leu Ile Asn Tyr Ile Val Lys Glu Pro Ala
210 215
<210> 98
<211> 660
<212> DNA
<213> 丙酮丁醇梭菌
<400> 98
atgattaatg ataaaaacct agcgaaagaa ataatagcca aaagagttgc aagagaatta 60
aaaaatggtc aacttgtaaa cttaggtgta ggtcttccta ccatggttgc agattatata 120
ccaaaaaatt tcaaaattac tttccaatca gaaaacggaa tagttggaat gggcgctagt 180
cctaaaataa atgaggcaga taaagatgta gtaaatgcag gaggagacta tacaacagta 240
cttcctgacg gcacattttt cgatagctca gtttcgtttt cactaatccg tggtggtcac 300
gtagatgtta ctgttttagg ggctctccag gtagatgaaa agggtaatat agccaattgg 360
attgttcctg gaaaaatgct ctctggtatg ggtggagcta tggatttagt aaatggagct 420
aagaaagtaa taattgcaat gagacataca aataaaggtc aacctaaaat tttaaaaaaa 480
tgtacacttc ccctcacggc aaagtctcaa gcaaatctaa ttgtaacaga acttggagta 540
attgaggtta ttaatgatgg tttacttctc actgaaatta ataaaaacac aaccattgat 600
gaaataaggt ctttaactgc tgcagattta ctcatatcca atgaacttag acccatggct 660
<210> 99
<211> 221
<212> PRT
<213> 丙酮丁醇梭菌
<400> 99
Met Ile Asn Asp Lys Asn Leu Ala Lys Glu Ile Ile Ala Lys Arg Val
1 5 10 15
Ala Arg Glu Leu Lys Asn Gly Gln Leu Val Asn Leu Gly Val Gly Leu
20 25 30
Pro Thr Met Val Ala Asp Tyr Ile Pro Lys Asn Phe Lys Ile Thr Phe
35 40 45
Gln Ser Glu Asn Gly Ile Val Gly Met Gly Ala Ser Pro Lys Ile Asn
50 55 60
Glu Ala Asp Lys Asp Val Val Asn Ala Gly Gly Asp Tyr Thr Thr Val
65 70 75 80
Leu Pro Asp Gly Thr Phe Phe Asp Ser Ser Val Ser Phe Ser Leu Ile
85 90 95
Arg Gly Gly His Val Asp Val Thr Val Leu Gly Ala Leu Gln Val Asp
100 105 110
Glu Lys Gly Asn Ile Ala Asn Trp Ile Val Pro Gly Lys Met Leu Ser
115 120 125
Gly Met Gly Gly Ala Met Asp Leu Val Asn Gly Ala Lys Lys Val Ile
130 135 140
Ile Ala Met Arg His Thr Asn Lys Gly Gln Pro Lys Ile Leu Lys Lys
145 150 155 160
Cys Thr Leu Pro Leu Thr Ala Lys Ser Gln Ala Asn Leu Ile Val Thr
165 170 175
Glu Leu Gly Val Ile Glu Val Ile Asn Asp Gly Leu Leu Leu Thr Glu
180 185 190
Ile Asn Lys Asn Thr Thr Ile Asp Glu Ile Arg Ser Leu Thr Ala Ala
195 200 205
Asp Leu Leu Ile Ser Asn Glu Leu Arg Pro Met Ala Val
210 215 220
<210> 100
<211> 651
<212> DNA
<213> 大肠杆菌
<400> 100
atggatgcga aacaacgtat tgcgcgccgt gtggcgcaag agcttcgtga tggtgacatc 60
gttaacttag ggatcggttt acccacaatg gtcgccaatt atttaccgga gggtattcat 120
atcactctgc aatcggaaaa cggcttcctc ggtttaggcc cggtcacgac agcgcatcca 180
gatctggtga acgctggcgg gcaaccgtgc ggtgttttac ccggtgcagc catgtttgat 240
agcgccatgt catttgcgct aatccgtggc ggtcatattg atgcctgcgt gctcggcggt 300
ttgcaagtag acgaagaagc aaacctcgcg aactgggtag tgcctgggaa aatggtgccc 360
ggtatgggtg gcgcgatgga tctggtgacc gggtcgcgca aagtgatcat cgccatggaa 420
cattgcgcca aagatggttc agcaaaaatt ttgcgccgct gcaccatgcc actcactgcg 480
caacatgcgg tgcatatgct ggttactgaa ctggctgtct ttcgttttat tgacggcaaa 540
atgtggctca ccgaaattgc cgacgggtgt gatttagcca ccgtgcgtgc caaaacagaa 600
gctcggtttg aagtcgccgc cgatctgaat acgcaacggg gtgatttatg a 651
<210> 101
<211> 216
<212> PRT
<213> 大肠杆菌
<400> 101
Met Asp Ala Lys Gln Arg Ile Ala Arg Arg Val Ala Gln Glu Leu Arg
1 5 10 15
Asp Gly Asp Ile Val Asn Leu Gly Ile Gly Leu Pro Thr Met Val Ala
20 25 30
Asn Tyr Leu Pro Glu Gly Ile His Ile Thr Leu Gln Ser Glu Asn Gly
35 40 45
Phe Leu Gly Leu Gly Pro Val Thr Thr Ala His Pro Asp Leu Val Asn
50 55 60
Ala Gly Gly Gln Pro Cys Gly Val Leu Pro Gly Ala Ala Met Phe Asp
65 70 75 80
Ser Ala Met Ser Phe Ala Leu Ile Arg Gly Gly His Ile Asp Ala Cys
85 90 95
Val Leu Gly Gly Leu Gln Val Asp Glu Glu Ala Asn Leu Ala Asn Trp
100 105 110
Val Val Pro Gly Lys Met Val Pro Gly Met Gly Gly Ala Met Asp Leu
115 120 125
Val Thr Gly Ser Arg Lys Val Ile Ile Ala Met Glu His Cys Ala Lys
130 135 140
Asp Gly Ser Ala Lys Ile Leu Arg Arg Cys Thr Met Pro Leu Thr Ala
145 150 155 160
Gln His Ala Val His Met Leu Val Thr Glu Leu Ala Val Phe Arg Phe
165 170 175
Ile Asp Gly Lys Met Trp Leu Thr Glu Ile Ala Asp Gly Cys Asp Leu
180 185 190
Ala Thr Val Arg Ala Lys Thr Glu Ala Arg Phe Glu Val Ala Ala Asp
195 200 205
Leu Asn Thr Gln Arg Gly Asp Leu
210 215
<210> 102
<211> 663
<212> DNA
<213> 大肠杆菌
<400> 102
atgaaaacaa aattgatgac attacaagac gccaccggct tctttcgtga cggcatgacc 60
atcatggtgg gcggatttat ggggattggc actccatccc gcctggttga agcattactg 120
gaatctggtg ttcgcgacct gacattgata gccaatgata ccgcgtttgt tgataccggc 180
atcggtccgc tcatcgtcaa tggtcgagtc cgcaaagtga ttgcttcaca tatcggcacc 240
aacccggaaa caggtcggcg catgatatct ggtgagatgg acgtcgttct ggtgccgcaa 300
ggtacgctaa tcgagcaaat tcgctgtggt ggagctggac ttggtggttt tctcacccca 360
acgggtgtcg gcaccgtcgt agaggaaggc aaacagacac tgacactcga cggtaaaacc 420
tggctgctcg aacgcccact gcgcgccgac ctggcgctaa ttcgcgctca tcgttgcgac 480
acacttggca acctgaccta tcaacttagc gcccgcaact ttaaccccct gatagccctt 540
gcggctgata tcacgctggt agagccagat gaactggtcg aaaccggcga gctgcaacct 600
gaccatattg tcacccctgg tgccgttatc gaccacatca tcgtttcaca ggagagcaaa 660
taa 663
<210> 103
<211> 220
<212> PRT
<213> 大肠杆菌
<400> 103
Met Lys Thr Lys Leu Met Thr Leu Gln Asp Ala Thr Gly Phe Phe Arg
1 5 10 15
Asp Gly Met Thr Ile Met Val Gly Gly Phe Met Gly Ile Gly Thr Pro
20 25 30
Ser Arg Leu Val Glu Ala Leu Leu Glu Ser Gly Val Arg Asp Leu Thr
35 40 45
Leu Ile Ala Asn Asp Thr Ala Phe Val Asp Thr Gly Ile Gly Pro Leu
50 55 60
Ile Val Asn Gly Arg Val Arg Lys Val Ile Ala Ser His Ile Gly Thr
65 70 75 80
Asn Pro Glu Thr Gly Arg Arg Met Ile Ser Gly Glu Met Asp Val Val
85 90 95
Leu Val Pro Gln Gly Thr Leu Ile Glu Gln Ile Arg Cys Gly Gly Ala
100 105 110
Gly Leu Gly Gly Phe Leu Thr Pro Thr Gly Val Gly Thr Val Val Glu
115 120 125
Glu Gly Lys Gln Thr Leu Thr Leu Asp Gly Lys Thr Trp Leu Leu Glu
130 135 140
Arg Pro Leu Arg Ala Asp Leu Ala Leu Ile Arg Ala His Arg Cys Asp
145 150 155 160
Thr Leu Gly Asn Leu Thr Tyr Gln Leu Ser Ala Arg Asn Phe Asn Pro
165 170 175
Leu Ile Ala Leu Ala Ala Asp Ile Thr Leu Val Glu Pro Asp Glu Leu
180 185 190
Val Glu Thr Gly Glu Leu Gln Pro Asp His Ile Val Thr Pro Gly Ala
195 200 205
Val Ile Asp His Ile Ile Val Ser Gln Glu Ser Lys
210 215 220
<210> 104
<211> 1563
<212> DNA
<213> 小鼠(Mus musculus)
<400> 104
atgcctgggt cacttccttt gaatgcagag gcttgctggc caaaagatgt gggaatcgtt 60
gcccttgaaa tctactttcc ttctcaatat gtcgatcaag ctgagttgga aaaatacgat 120
ggtgtagatg ctggaaagta taccatcggc ctgggccagg ccaggatggg cttctgcacg 180
gatcgtgaag acatcaactc tctttgcctg actgtggttc agaaactgat ggagagacat 240
agcctttcct atgattgcat tgggcggcta gaagttggaa cagagacaat catcgacaaa 300
tcgaaatcag tgaagtctaa tttgatgcag ctgtttgagg agtctgggaa tacagatata 360
gaaggaatag atacaaccaa tgcatgctat gggggcacag ctgcagtctt caatgccgtg 420
aactgggtcg aatccagctc ttgggatgga cgatatgctc tggtagttgc aggagacatt 480
gctatatatg ccacaggaaa tgccagacct acaggtggag ttggagctgt ggccctgcta 540
attgggccaa acgctcctct aatttttgac cgagggctcc gtgggacaca catgcagcat 600
gcctatgact tttacaagcc tgacatgctc tccgagtacc ctgtggtcga cggaaagctc 660
tccatacagt gctacctcag cgccctggac cgctgctatt ctgtctaccg caaaaagatc 720
cgtgcccagt ggcagaaaga gggaaaggat aaagatttta ccctgaatga ttttggcttc 780
atgatctttc actcaccata ttgtaaactg gtgcagaaat ctctagctcg gatgttcctg 840
aatgactttc ttaatgatca aaacagagat aaaaacagta tttacagtgg actggaagcc 900
tttggggacg ttaaattaga agatacttac tttgacagag atgtagaaaa ggcatttatg 960
aaggctagtt ctgagctatt caaccagaaa acaaaggcgt ctttgcttgt gtctaatcag 1020
aatggaaata tgtacacatc ctctgtctat ggttccctgg cttctgtcct ggcacagtac 1080
tcacctcagc agttggcagg gaagagggtt ggagtgttct cttacggttc tggcttggct 1140
gccacgctgt actcccttaa agtcacacaa gacgccacac caggatctgc ccttgataaa 1200
ataacagcaa gtttatgtga ccttaaatca aggcttgact cgagaacttg tgtggcaccg 1260
gatgtctttg ctgaaaacat gaagctcaga gaggacacac atcacttagc caactatatt 1320
ccccagtgtt caatagactc actctttgaa ggaacgtggt atctggtcag agtggatgaa 1380
aaacacagaa ggacttacgc ccggcgcccc ttcacaaatg accacagttt ggatgaagga 1440
atggggctcg tgcatagtaa cacagcaaca gagcatattc caagccctgc taagaaagtg 1500
ccaagactcc ctgcaacctc ggccgaatct gaatcagctg tcatcagtaa cggggagcac 1560
tga 1563
<210> 105
<211> 520
<212> PRT
<213> 小鼠
<400> 105
Met Pro Gly Ser Leu Pro Leu Asn Ala Glu Ala Cys Trp Pro Lys Asp
1 5 10 15
Val Gly Ile Val Ala Leu Glu Ile Tyr Phe Pro Ser Gln Tyr Val Asp
20 25 30
Gln Ala Glu Leu Glu Lys Tyr Asp Gly Val Asp Ala Gly Lys Tyr Thr
35 40 45
Ile Gly Leu Gly Gln Ala Arg Met Gly Phe Cys Thr Asp Arg Glu Asp
50 55 60
Ile Asn Ser Leu Cys Leu Thr Val Val Gln Lys Leu Met Glu Arg His
65 70 75 80
Ser Leu Ser Tyr Asp Cys Ile Gly Arg Leu Glu Val Gly Thr Glu Thr
85 90 95
Ile Ile Asp Lys Ser Lys Ser Val Lys Ser Lys Leu Met Gln Leu Phe
100 105 110
Glu Glu Ser Gly Asn Thr Asp Ile Glu Gly Ile Asp Thr Thr Asn Ala
115 120 125
Cys Tyr Gly Gly Thr Ala Ala Val Phe Asn Ala Val Asn Trp Val Glu
130 135 140
Ser Ser Ser Trp Asp Gly Arg Tyr Ala Leu Val Val Ala Gly Asp Ile
145 150 155 160
Ala Ile Tyr Ala Thr Gly Asn Ala Arg Pro Thr Gly Gly Val Gly Ala
165 170 175
Val Ala Leu Leu Ile Gly Pro Asn Ala Pro Leu Ile Phe Asp Arg Gly
180 185 190
Leu Arg Gly Thr His Met Gln His Ala Tyr Asp Phe Tyr Lys Pro Asp
195 200 205
Met Leu Ser Glu Tyr Pro Val Val Asp Gly Lys Leu Ser Ile Gln Cys
210 215 220
Tyr Leu Ser Ala Leu Asp Arg Cys Tyr Ser Val Tyr Arg Lys Lys Ile
225 230 235 240
Arg Ala Gln Trp Gln Lys Glu Gly Lys Asp Lys Asp Phe Thr Leu Asn
245 250 255
Asp Phe Gly Phe Met Ile Phe His Ser Pro Tyr Cys Lys Leu Val Gln
260 265 270
Lys Ser Leu Ala Arg Met Phe Leu Asn Asp Phe Leu Asn Asp Gln Asn
275 280 285
Arg Asp Lys Asn Ser Ile Tyr Ser Gly Leu Glu Ala Phe Gly Asp Val
290 295 300
Lys Leu Glu Asp Thr Tyr Phe Asp Arg Asp Val Glu Lys Ala Phe Met
305 310 315 320
Lys Ala Ser Ser Glu Leu Phe Asn Gln Lys Thr Lys Ala Ser Leu Leu
325 330 335
Val Ser Asn Gln Asn Gly Asn Met Tyr Thr Ser Ser Val Tyr Gly Ser
340 345 350
Leu Ala Ser Val Leu Ala Gln Tyr Ser Pro Gln Gln Leu Ala Gly Lys
355 360 365
Arg Val Gly Val Phe Ser Tyr Gly Ser Gly Leu Ala Ala Thr Leu Tyr
370 375 380
Ser Leu Lys Val Thr Gln Asp Ala Thr Pro Gly Ser Ala Leu Asp Lys
385 390 395 400
Ile Thr Ala Ser Leu Cys Asp Leu Lys Ser Arg Leu Asp Ser Arg Thr
405 410 415
Cys Val Ala Pro Asp Val Phe Ala Glu Asn Met Lys Leu Arg Glu Asp
420 425 430
Thr His His Leu Ala Asn Tyr Ile Pro Gln Cys Ser Ile Asp Ser Leu
435 440 445
Phe Glu Gly Thr Trp Tyr Leu Val Arg Val Asp Glu Lys His Arg Arg
450 455 460
Thr Tyr Ala Arg Arg Pro Phe Thr Asn Asp His Ser Leu Asp Glu Gly
465 470 475 480
Met Gly Leu Val His Ser Asn Thr Ala Thr Glu His Ile Pro Ser Pro
485 490 495
Ala Lys Lys Val Pro Arg Leu Pro Ala Thr Ser Ala Glu Ser Glu Ser
500 505 510
Ala Val Ile Ser Asn Gly Glu His
515 520
<210> 106
<211> 770
<212> DNA
<213> 酿酒酵母
<400> 106
atgaaactct caactaaact ttgttggtgt ggtattaaag gaagacttag gccgcaaaag 60
caacaacaat tacacaatac aaacttgcaa atgactgaac taaaaaaaca aaagaccgct 120
gaacaaaaaa ccagacctca aaatgtcggt attaaaggta tccaaattta catcccaact 180
caatgtgtca accaatctga gctagagaaa tttgatggcg tttctcaagg taaatacaca 240
attggtctgg gccaaaccaa catgtctttt gtcaatgaca gagaagatat ctactcgatg 300
tccctaactg ttttgtctaa gttgatcaag agttacaaca tcgacaccaa caaaattggt 360
agattagaag tcggtactga aactctgatt gacaagtcca agtctgtcaa gtctgtcttg 420
atgcaattgt ttggtgaaaa cactgacgtc gaaggtattg acacgcttaa tgcctgttac 480
ggtggtacca acgcgttgtt caactctttg aactggattg aatctaacgc atgggatggt 540
agagacgcca ttgtagtttg cggtgatatt gccatctacg ataagggtgc cgcaagacca 600
accggtggtg ccggtactgt tgctatgtgg atcggtcctg atgctccaat tgtatttgac 660
tctgtaagag cttcttacat ggaacacgcc tacgattttt acaagccaga tttcaccagc 720
gaatatcctt acgtcgatgg tcatttttca ttaacttgtt acgtcaaggc 770
<210> 107
<211> 491
<212> PRT
<213> 酿酒酵母
<400> 107
Met Lys Leu Ser Thr Lys Leu Cys Trp Cys Gly Ile Lys Gly Arg Leu
1 5 10 15
Arg Pro Gln Lys Gln Gln Gln Leu His Asn Thr Asn Leu Gln Met Thr
20 25 30
Glu Leu Lys Lys Gln Lys Thr Ala Glu Gln Lys Thr Arg Pro Gln Asn
35 40 45
Val Gly Ile Lys Gly Ile Gln Ile Tyr Ile Pro Thr Gln Cys Val Asn
50 55 60
Gln Ser Glu Leu Glu Lys Phe Asp Gly Val Ser Gln Gly Lys Tyr Thr
65 70 75 80
Ile Gly Leu Gly Gln Thr Asn Met Ser Phe Val Asn Asp Arg Glu Asp
85 90 95
Ile Tyr Ser Met Ser Leu Thr Val Leu Ser Lys Leu Ile Lys Ser Tyr
100 105 110
Asn Ile Asp Thr Asn Lys Ile Gly Arg Leu Glu Val Gly Thr Glu Thr
115 120 125
Leu Ile Asp Lys Ser Lys Ser Val Lys Ser Val Leu Met Gln Leu Phe
130 135 140
Gly Glu Asn Thr Asp Val Glu Gly Ile Asp Thr Leu Asn Ala Cys Tyr
145 150 155 160
Gly Gly Thr Asn Ala Leu Phe Asn Ser Leu Asn Trp Ile Glu Ser Asn
165 170 175
Ala Trp Asp Gly Arg Asp Ala Ile Val Val Cys Gly Asp Ile Ala Ile
180 185 190
Tyr Asp Lys Gly Ala Ala Arg Pro Thr Gly Gly Ala Gly Thr Val Ala
195 200 205
Met Trp Ile Gly Pro Asp Ala Pro Ile Val Phe Asp Ser Val Arg Ala
210 215 220
Ser Tyr Met Glu His Ala Tyr Asp Phe Tyr Lys Pro Asp Phe Thr Ser
225 230 235 240
Glu Tyr Pro Tyr Val Asp Gly His Phe Ser Leu Thr Cys Tyr Val Lys
245 250 255
Ala Leu Asp Gln Val Tyr Lys Ser Tyr Ser Lys Lys Ala Ile Ser Lys
260 265 270
Gly Leu Val Ser Asp Pro Ala Gly Ser Asp Ala Leu Asn Val Leu Lys
275 280 285
Tyr Phe Asp Tyr Asn Val Phe His Val Pro Thr Cys Lys Leu Val Thr
290 295 300
Lys Ser Tyr Gly Arg Leu Leu Tyr Asn Asp Phe Arg Ala Asn Pro Gln
305 310 315 320
Leu Phe Pro Glu Val Asp Ala Glu Leu Ala Thr Arg Asp Tyr Asp Glu
325 330 335
Ser Leu Thr Asp Lys Asn Ile Glu Lys Thr Phe Val Asn Val Ala Lys
340 345 350
Pro Phe His Lys Glu Arg Val Ala Gln Ser Leu Ile Val Pro Thr Asn
355 360 365
Thr Gly Asn Met Tyr Thr Ala Ser Val Tyr Ala Ala Phe Ala Ser Leu
370 375 380
Leu Asn Tyr Val Gly Ser Asp Asp Leu Gln Gly Lys Arg Val Gly Leu
385 390 395 400
Phe Ser Tyr Gly Ser Gly Leu Ala Ala Ser Leu Tyr Ser Cys Lys Ile
405 410 415
Val Gly Asp Val Gln His Ile Ile Lys Glu Leu Asp Ile Thr Asn Lys
420 425 430
Leu Ala Lys Arg Ile Thr Glu Thr Pro Lys Asp Tyr Glu Ala Ala Ile
435 440 445
Glu Leu Arg Glu Asn Ala His Leu Lys Lys Asn Phe Lys Pro Gln Gly
450 455 460
Ser Ile Glu His Leu Gln Ser Gly Val Tyr Tyr Leu Thr Asn Ile Asp
465 470 475 480
Asp Lys Phe Arg Arg Ser Tyr Asp Val Lys Lys
485 490
<210> 108
<211> 1167
<212> DNA
<213> 卷曲乳杆菌(Lactobacillus crispatus)
<400> 108
atgcaagtag gtattgatca aattggactt tttacgccag acaagtacgt tgatatggtc 60
gatttggcga acgcaagaaa gcaagatcca aataagtttt tagttggcat tggtcaaaga 120
gagatgagtg ttgcggatat tacgcaagat gcagtttcaa tgggaattaa tgcgacttta 180
aagtttattg acaagattga taagaataaa gtcggtctat taatttttgg gactgaaagc 240
agtattgatc aatcaaagtc agcttcttta tttgtaaaaa cagccttaaa gttgaagcca 300
gaagtaagaa cttttgaagt aaaggaagct tgctttggtt taacggcagc cttaatgatg 360
gcacgtgatt ttgttcgggt acatcctgaa caaaccgcaa ttgtcatcgg tagtgatatt 420
gctcgctatg gtgttaatac tgctggtgag gtaacacaag gagccggtag cgtggcaatg 480
ctcatcaaag ctgacccaag cattttagcc ctaaataatg gtcattcagc ttacagcgaa 540
gatattaacg acttctggag accaaattat tctcgcaccg ctttagttga cggcaagtat 600
tcgactcaag tttacttgga tttcttcaag aagaccttta ctgattataa gaagcaaaaa 660
ggattgaaaa caagcgactt tgatgcgatt acttaccatt tgccatttac taagatgggg 720
atgaaggcta acaatattgc tattgagggg caagatcaag caacaatgat caagttggag 780
cgtagttttg cggctgctaa acaattatca agccgagtag gtaatatcta caccgcttca 840
ctttatatga gtttacttag tttgctagag aatggtgaat tacccgctgg ctcattaatt 900
ggcctgtttt catatggttc aggtgcaatg gctgagtttt atagtggcaa gttggttgaa 960
ggatatgaaa aacaaattga tcctacagct gatcaagcaa tgcttgatcg gcggaagaag 1020
ctgacagtta agcaatatga agacgtcttc aatacggctt tgttagatcc tgaggatggc 1080
ttagaattaa ctagcgacga tgaagtaggt acttggtatt ttgctggtac taaggatcat 1140
attcgtcaat accgcgtaaa agaataa 1167
<210> 109
<211> 388
<212> PRT
<213> 卷曲乳杆菌
<400> 109
Met Gln Val Gly Ile Asp Gln Ile Gly Leu Phe Thr Pro Asp Lys Tyr
1 5 10 15
Val Asp Met Val Asp Leu Ala Asn Ala Arg Lys Gln Asp Pro Asn Lys
20 25 30
Phe Leu Val Gly Ile Gly Gln Arg Glu Met Ser Val Ala Asp Ile Thr
35 40 45
Gln Asp Ala Val Ser Met Gly Ile Asn Ala Thr Leu Lys Phe Ile Asp
50 55 60
Lys Ile Asp Lys Asn Lys Val Gly Leu Leu Ile Phe Gly Thr Glu Ser
65 70 75 80
Ser Ile Asp Gln Ser Lys Ser Ala Ser Leu Phe Val Lys Thr Ala Leu
85 90 95
Lys Leu Lys Pro Glu Val Arg Thr Phe Glu Val Lys Glu Ala Cys Phe
100 105 110
Gly Leu Thr Ala Ala Leu Met Met Ala Arg Asp Phe Val Arg Val His
115 120 125
Pro Glu Gln Thr Ala Ile Val Ile Gly Ser Asp Ile Ala Arg Tyr Gly
130 135 140
Val Asn Thr Ala Gly Glu Val Thr Gln Gly Ala Gly Ser Val Ala Met
145 150 155 160
Leu Ile Lys Ala Asp Pro Ser Ile Leu Ala Leu Asn Asn Gly His Ser
165 170 175
Ala Tyr Ser Glu Asp Ile Asn Asp Phe Trp Arg Pro Asn Tyr Ser Arg
180 185 190
Thr Ala Leu Val Asp Gly Lys Tyr Ser Thr Gln Val Tyr Leu Asp Phe
195 200 205
Phe Lys Lys Thr Phe Thr Asp Tyr Lys Lys Gln Lys Gly Leu Lys Thr
210 215 220
Ser Asp Phe Asp Ala Ile Thr Tyr His Leu Pro Phe Thr Lys Met Gly
225 230 235 240
Met Lys Ala Asn Asn Ile Ala Ile Glu Gly Gln Asp Gln Ala Thr Met
245 250 255
Ile Lys Leu Glu Arg Ser Phe Ala Ala Ala Lys Gln Leu Ser Ser Arg
260 265 270
Val Gly Asn Ile Tyr Thr Ala Ser Leu Tyr Met Ser Leu Leu Ser Leu
275 280 285
Leu Glu Asn Gly Glu Leu Pro Ala Gly Ser Leu Ile Gly Leu Phe Ser
290 295 300
Tyr Gly Ser Gly Ala Met Ala Glu Phe Tyr Ser Gly Lys Leu Val Glu
305 310 315 320
Gly Tyr Glu Lys Gln Ile Asp Pro Thr Ala Asp Gln Ala Met Leu Asp
325 330 335
Arg Arg Lys Lys Leu Thr Val Lys Gln Tyr Glu Asp Val Phe Asn Thr
340 345 350
Ala Leu Leu Asp Pro Glu Asp Gly Leu Glu Leu Thr Ser Asp Asp Glu
355 360 365
Val Gly Thr Trp Tyr Phe Ala Gly Thr Lys Asp His Ile Arg Gln Tyr
370 375 380
Arg Val Lys Glu
385
<210> 110
<211> 660
<212> DNA
<213> 未知
<220>
<223> 食萘极地单胞菌(Polaromonas naphthalenivorans)序列
<400> 110
atgaccctgc atttaccttc cagagtcaag ctcgtcgatg tcggtccccg cgacggcctg 60
cagaacgaaa aatcgcccgt tcccgccgcc gtgaaaatcg aactcgtgca tcgcctgcag 120
gacgccggtc tcacggaaat cgaggtcacc agttacgttt cgcccaaatg ggtgccgcag 180
atggctgaca acgccgaagt catggccggc atccggcgca agcccggcgt gcgctattcg 240
gtgctgacgc ccaacatgca gggtctagag gcggcgatga agccagcgcc cgagttgtgg 300
cccgacgaga tcgtggtgtt cggcgcggcc agcgaagcct tcagccagcg caacatcaac 360
tgctcgattg ccgaaagcat cgagcgtttc cggccggtgg tggctgcggc ccgggccaac 420
aatatttatg ttcgcggcgc catttcctgc accgtcggct gcccctacga gggcgagatt 480
gcgccggagc gcgtcgaaat ggtggcgcgc ctgatgaagg acatcggcgt gcagcacatc 540
ggcgtggccg acacgattgg cgtcggcacg ccgctgaagg tgcagcgcgc cctggaagcg 600
gcgctgaagc attacgacct cgatggcgtg tcgggccatt tccatgacac ctacggccag 660
<210> 111
<211> 308
<212> PRT
<213> 未知
<220>
<223> 食萘极地单胞菌序列
<400> 111
Met Thr Leu His Leu Pro Ser Arg Val Lys Leu Val Asp Val Gly Pro
1 5 10 15
Arg Asp Gly Leu Gln Asn Glu Lys Ser Pro Val Pro Ala Ala Val Lys
20 25 30
Ile Glu Leu Val His Arg Leu Gln Asp Ala Gly Leu Thr Glu Ile Glu
35 40 45
Val Thr Ser Tyr Val Ser Pro Lys Trp Val Pro Gln Met Ala Asp Asn
50 55 60
Ala Glu Val Met Ala Gly Ile Arg Arg Lys Pro Gly Val Arg Tyr Ser
65 70 75 80
Val Leu Thr Pro Asn Met Gln Gly Leu Glu Ala Ala Met Lys Pro Ala
85 90 95
Pro Glu Leu Trp Pro Asp Glu Ile Val Val Phe Gly Ala Ala Ser Glu
100 105 110
Ala Phe Ser Gln Arg Asn Ile Asn Cys Ser Ile Ala Glu Ser Ile Glu
115 120 125
Arg Phe Arg Pro Val Val Ala Ala Ala Arg Ala Asn Asn Ile Tyr Val
130 135 140
Arg Gly Ala Ile Ser Cys Thr Val Gly Cys Pro Tyr Glu Gly Glu Ile
145 150 155 160
Ala Pro Glu Arg Val Glu Met Val Ala Arg Leu Met Lys Asp Ile Gly
165 170 175
Val Gln His Ile Gly Val Ala Asp Thr Ile Gly Val Gly Thr Pro Leu
180 185 190
Lys Val Gln Arg Ala Leu Glu Ala Ala Leu Lys His Tyr Asp Leu Asp
195 200 205
Gly Val Ser Gly His Phe His Asp Thr Tyr Gly Gln Ala Leu Ala Asn
210 215 220
Thr Leu Ala Ser Leu Gln Met Gly Val Trp Gln Phe Asp Thr Ser Val
225 230 235 240
Ala Gly Leu Gly Gly Cys Pro Tyr Ala Lys Gly Ala Thr Gly Asn Val
245 250 255
Ala Thr Glu Asp Val Val Tyr Leu Leu His Gly Met Gly Ile Glu Thr
260 265 270
Gly Ile Asp Leu Asp Lys Leu Ile Asp Ala Gly Lys Phe Ile Ser Asp
275 280 285
Phe Leu Gly Arg Gln Pro Asn Ser Arg Ala Ala Thr Ala Leu Leu Asn
290 295 300
Lys Arg Met Asn
305
<210> 112
<211> 770
<212> DNA
<213> 嗜酸热原体(Thermoplasma acidophilum)
<400> 112
atgacctaca gatcaatagg atcaactgct tatccaacga tcggcgttgt tctcctgggc 60
gggatagcaa atcccgtcac gaggacgccg ctgcatacct cggcagggat agcatacagt 120
gattcctgcg gatcgataag atccgagacc aggatatacg ccgatgaggc tacgcacata 180
tatttcaatg gtacggaatc gacagatgac aatagatccg tgaggcgtgt gcttgatcgt 240
tattcaagcg tcttcgagga ggcgttcggt acgaagactg tttcatattc ttcacagaac 300
ttcggcatac tgagcggcag ttccgatgct ggagcggcat cgataggcgc agctatattg 360
ggcctcaaac ccgatctgga tccgcacgat gttgaaaatg acctcagggc ggtctccgaa 420
agcgcaggca ggagcctctt cggcggctta acaataactt ggagcgatgg tttccatgca 480
tatacggaaa agattcttga tcctgaggca ttctccgggt attcgatcgt tgccttcgcg 540
tttgactatc agagaaatcc gtccgatgtc atacaccaga atatagtgag aagcgatctc 600
tatccggcca ggaagaagca tgccgatgaa catgcgcaca tgatcaagga gtacgcaaag 660
acaaacgaca taaagggcat atttgatctg gcccaggaag atacagagga ataccattcc 720
atacttcgtg gcgtgggcgt gaacgtgata agggagaaca tgcagaagct 770
<210> 113
<211> 318
<212> PRT
<213> 嗜酸热原体
<400> 113
Met Thr Tyr Arg Ser Ile Gly Ser Thr Ala Tyr Pro Thr Ile Gly Val
1 5 10 15
Val Leu Leu Gly Gly Ile Ala Asn Pro Val Thr Arg Thr Pro Leu His
20 25 30
Thr Ser Ala Gly Ile Ala Tyr Ser Asp Ser Cys Gly Ser Ile Arg Ser
35 40 45
Glu Thr Arg Ile Tyr Ala Asp Glu Ala Thr His Ile Tyr Phe Asn Gly
50 55 60
Thr Glu Ser Thr Asp Asp Asn Arg Ser Val Arg Arg Val Leu Asp Arg
65 70 75 80
Tyr Ser Ser Val Phe Glu Glu Ala Phe Gly Thr Lys Thr Val Ser Tyr
85 90 95
Ser Ser Gln Asn Phe Gly Ile Leu Ser Gly Ser Ser Asp Ala Gly Ala
100 105 110
Ala Ser Ile Gly Ala Ala Ile Leu Gly Leu Lys Pro Asp Leu Asp Pro
115 120 125
His Asp Val Glu Asn Asp Leu Arg Ala Val Ser Glu Ser Ala Gly Arg
130 135 140
Ser Leu Phe Gly Gly Leu Thr Ile Thr Trp Ser Asp Gly Phe His Ala
145 150 155 160
Tyr Thr Glu Lys Ile Leu Asp Pro Glu Ala Phe Ser Gly Tyr Ser Ile
165 170 175
Val Ala Phe Ala Phe Asp Tyr Gln Arg Asn Pro Ser Asp Val Ile His
180 185 190
Gln Asn Ile Val Arg Ser Asp Leu Tyr Pro Ala Arg Lys Lys His Ala
195 200 205
Asp Glu His Ala His Met Ile Lys Glu Tyr Ala Lys Thr Asn Asp Ile
210 215 220
Lys Gly Ile Phe Asp Leu Ala Gln Glu Asp Thr Glu Glu Tyr His Ser
225 230 235 240
Ile Leu Arg Gly Val Gly Val Asn Val Ile Arg Glu Asn Met Gln Lys
245 250 255
Leu Ile Ser Tyr Leu Lys Leu Ile Arg Lys Asp Tyr Trp Asn Ala Tyr
260 265 270
Ile Val Thr Gly Gly Ser Asn Val Tyr Val Ala Val Glu Ser Glu Asn
275 280 285
Ala Asp Arg Leu Phe Ser Ile Glu Asn Thr Phe Gly Ser Lys Lys Lys
290 295 300
Met Leu Arg Ile Val Gly Gly Ala Trp His Arg Arg Pro Glu
305 310 315
<210> 114
<211> 957
<212> DNA
<213> 嗜酸热原体
<400> 114
atgacctaca gatcaatagg atcaactgct tatccaacga tcggcgttgt tctcctgggc 60
gggatagcaa atcccgtcac gaggacgccg ctgcatacct cggcagggat agcatacagt 120
gattcctgcg gatcgataag atccgagacc aggatatacg ccgatgaggc tacgcacata 180
tatttcaatg gtacggaatc gacagatgac aatagatccg tgaggcgtgt gcttgatcgt 240
tattcaagcg tcttcgagga ggcgttcggt acgaagactg tttcatattc ttcacagaac 300
ttcggcatac tgagcggcag ttccgatgct ggagcggcat cgataggcgc agctatattg 360
ggcctcaaac ccgatctgga tccgcacgat gttgaaaatg acctcagggc ggtctccgaa 420
agcgcaggca ggagcctctt cggcggctta acaataactt ggagcgatgg tttccatgca 480
tatacggaaa agattcttga tcctgaggca ttctccgggt attcgatcgt tgccttcgcg 540
tttgactatc agagaaatcc gtccgatgtc atacaccaga atatagtgag aagcgatgag 600
tatccggcca ggaagaagca tgccgatgaa catgcgcaca tgatcaagga gtacgcaaag 660
acaaacgaca taaagggcat atttgatctg gcccaggaag atacagagga ataccattcc 720
atacttcgtg gcgtgggcgt gaacgtgata agggagaaca tgcagaagct catcagttac 780
ctgaagctga tcaggaagga ttactggaat gcctacatcg tgaccggcgg aagcaacgtc 840
tacgtggctg tagaaagcga gaatgcagat aggctgtttt cgatcgaaaa taccttcggt 900
tcaaaaaaga agatgctcag gatagttggc ggtgcctggc atagaagacc agagtga 957
<210> 115
<211> 318
<212> PRT
<213> 嗜酸热原体
<400> 115
Met Thr Tyr Arg Ser Ile Gly Ser Thr Ala Tyr Pro Thr Ile Gly Val
1 5 10 15
Val Leu Leu Gly Gly Ile Ala Asn Pro Val Thr Arg Thr Pro Leu His
20 25 30
Thr Ser Ala Gly Ile Ala Tyr Ser Asp Ser Cys Gly Ser Ile Arg Ser
35 40 45
Glu Thr Arg Ile Tyr Ala Asp Glu Ala Thr His Ile Tyr Phe Asn Gly
50 55 60
Thr Glu Ser Thr Asp Asp Asn Arg Ser Val Arg Arg Val Leu Asp Arg
65 70 75 80
Tyr Ser Ser Val Phe Glu Glu Ala Phe Gly Thr Lys Thr Val Ser Tyr
85 90 95
Ser Ser Gln Asn Phe Gly Ile Leu Ser Gly Ser Ser Asp Ala Gly Ala
100 105 110
Ala Ser Ile Gly Ala Ala Ile Leu Gly Leu Lys Pro Asp Leu Asp Pro
115 120 125
His Asp Val Glu Asn Asp Leu Arg Ala Val Ser Glu Ser Ala Gly Arg
130 135 140
Ser Leu Phe Gly Gly Leu Thr Ile Thr Trp Ser Asp Gly Phe His Ala
145 150 155 160
Tyr Thr Glu Lys Ile Leu Asp Pro Glu Ala Phe Ser Gly Tyr Ser Ile
165 170 175
Val Ala Phe Ala Phe Asp Tyr Gln Arg Asn Pro Ser Asp Val Ile His
180 185 190
Gln Asn Ile Val Arg Ser Asp Glu Tyr Pro Ala Arg Lys Lys His Ala
195 200 205
Asp Glu His Ala His Met Ile Lys Glu Tyr Ala Lys Thr Asn Asp Ile
210 215 220
Lys Gly Ile Phe Asp Leu Ala Gln Glu Asp Thr Glu Glu Tyr His Ser
225 230 235 240
Ile Leu Arg Gly Val Gly Val Asn Val Ile Arg Glu Asn Met Gln Lys
245 250 255
Leu Ile Ser Tyr Leu Lys Leu Ile Arg Lys Asp Tyr Trp Asn Ala Tyr
260 265 270
Ile Val Thr Gly Gly Ser Asn Val Tyr Val Ala Val Glu Ser Glu Asn
275 280 285
Ala Asp Arg Leu Phe Ser Ile Glu Asn Thr Phe Gly Ser Lys Lys Lys
290 295 300
Met Leu Arg Ile Val Gly Gly Ala Trp His Arg Arg Pro Glu
305 310 315
<210> 116
<211> 770
<212> DNA
<213> 未知
<220>
<223> 托氏嗜酸古菌(Picrophilus torridus)序列
<400> 116
atggaaaatt acaatgttaa gacaagggcg ttcccaacaa taggcataat actgcttggt 60
gggatctcgg ataaaaagaa caggataccg ctgcatacaa cggcaggcat agcatatact 120
ggtataaaca atgatgttta cactgagaca aagctttatg tatcaaaaga tgaaaaatgc 180
tatattgatg gaaaggaaat tgatttaaat tcagatagat caccatcgaa ggttattgat 240
aaattcaagc atgaaatact tatgagagta aatcttgatg atgaaaataa cctttcaatt 300
gattcaagga actttaatat attaagtggc agctcagatt ctggggccgc tgcactggga 360
gagtgcatag aatcaatttt tgaatacaat ataaatatat ttacatttga aaacgatctt 420
cagaggatat cagaaagtgt tggaagaagc ctttacggtg gtttaacagt aaactatgcc 480
aatggcaggg aatcattaac agagccatta cttgagcctg aggcatttaa taactttaca 540
ataattggtg cacattttaa cattgataga aaaccatcaa atgagattca tgaaaatatc 600
ataaaacatg aaaattacag ggaaagaata aaaagtgctg agagaaaggc gaaaaaactt 660
gaggagctat caaggaatgc aaacataaag ggtatctttg aacttgcaga atccgataca 720
gtggaatacc ataaaatgct ccatgatgtt ggcgttgaca taataaatga 770
<210> 117
<211> 324
<212> PRT
<213> 未知
<220>
<223> 托氏嗜酸古菌(Picrophilus torridus)序列
<400> 117
Met Glu Asn Tyr Asn Val Lys Thr Arg Ala Phe Pro Thr Ile Gly Ile
1 5 10 15
Ile Leu Leu Gly Gly Ile Ser Asp Lys Lys Asn Arg Ile Pro Leu His
20 25 30
Thr Thr Ala Gly Ile Ala Tyr Thr Gly Ile Asn Asn Asp Val Tyr Thr
35 40 45
Glu Thr Lys Leu Tyr Val Ser Lys Asp Glu Lys Cys Tyr Ile Asp Gly
50 55 60
Lys Glu Ile Asp Leu Asn Ser Asp Arg Ser Pro Ser Lys Val Ile Asp
65 70 75 80
Lys Phe Lys His Glu Ile Leu Met Arg Val Asn Leu Asp Asp Glu Asn
85 90 95
Asn Leu Ser Ile Asp Ser Arg Asn Phe Asn Ile Leu Ser Gly Ser Ser
100 105 110
Asp Ser Gly Ala Ala Ala Leu Gly Glu Cys Ile Glu Ser Ile Phe Glu
115 120 125
Tyr Asn Ile Asn Ile Phe Thr Phe Glu Asn Asp Leu Gln Arg Ile Ser
130 135 140
Glu Ser Val Gly Arg Ser Leu Tyr Gly Gly Leu Thr Val Asn Tyr Ala
145 150 155 160
Asn Gly Arg Glu Ser Leu Thr Glu Pro Leu Leu Glu Pro Glu Ala Phe
165 170 175
Asn Asn Phe Thr Ile Ile Gly Ala His Phe Asn Ile Asp Arg Lys Pro
180 185 190
Ser Asn Glu Ile His Glu Asn Ile Ile Lys His Glu Asn Tyr Arg Glu
195 200 205
Arg Ile Lys Ser Ala Glu Arg Lys Ala Lys Lys Leu Glu Glu Leu Ser
210 215 220
Arg Asn Ala Asn Ile Lys Gly Ile Phe Glu Leu Ala Glu Ser Asp Thr
225 230 235 240
Val Glu Tyr His Lys Met Leu His Asp Val Gly Val Asp Ile Ile Asn
245 250 255
Asp Arg Met Glu Asn Leu Ile Glu Arg Val Lys Glu Met Lys Asn Asn
260 265 270
Phe Trp Asn Ser Tyr Ile Val Thr Gly Gly Pro Asn Val Phe Val Ile
275 280 285
Thr Glu Lys Lys Asp Val Asp Lys Ala Met Glu Gly Leu Asn Asp Leu
290 295 300
Cys Asp Asp Ile Arg Leu Leu Lys Val Ala Gly Lys Pro Gln Val Ile
305 310 315 320
Ser Lys Asn Phe
<210> 118
<211> 660
<212> DNA
<213> 缓症链球菌(Streptococcus mitis)
<400> 118
atggatagag agcctgtaac agtacgttcc tacgcaaata ttgccattat caaatactgg 60
ggaaagaaaa aagaaaaaga gatggttcct gctactagca gtatttctct gactttggaa 120
aatatgtaca cggagacgac cttgtcatct ctaccgacgg atgcgacagc tgatgcattt 180
tatatcaatg gtcagttaca aaatgaggca gagcatgtca agatgagtaa gattattgac 240
cgctaccgtc cagatggtga tggctttgtt cgtatcgata ctcaaaacag tatgcctacc 300
gcagcgggct tgtcatcaag ttctagtggt ttgtctgcct tggtcaaggc ttgtaatgct 360
tatttcaagc ttggtttgaa tcggagtcag ttggcacagg aggctaagtt tgcctcaggc 420
tcttcctctc ggagttttta tggaccactc ggtgcctggg ataaggatag cggagagatt 480
tacccggtag agacaggcct gaaactagct atgattatgt tggtgctaga agacaagaaa 540
aaaccaatct ctagccgtga tgggatgaaa ctttgtgtgg aaacttcgac gacctttgac 600
gactgggtgc gtcagtctga gaaggattat caggatatgc tggtttacct caaggcaaat 660
<210> 119
<211> 317
<212> PRT
<213> 缓症链球菌
<400> 119
Met Asp Arg Glu Pro Val Thr Val Arg Ser Tyr Ala Asn Ile Ala Ile
1 5 10 15
Ile Lys Tyr Trp Gly Lys Lys Lys Glu Lys Glu Met Val Pro Ala Thr
20 25 30
Ser Ser Ile Ser Leu Thr Leu Glu Asn Met Tyr Thr Glu Thr Thr Leu
35 40 45
Ser Ser Leu Pro Thr Asp Ala Thr Ala Asp Ala Phe Tyr Ile Asn Gly
50 55 60
Gln Leu Gln Asn Glu Ala Glu His Val Lys Met Ser Lys Ile Ile Asp
65 70 75 80
Arg Tyr Arg Pro Asp Gly Asp Gly Phe Val Arg Ile Asp Thr Gln Asn
85 90 95
Ser Met Pro Thr Ala Ala Gly Leu Ser Ser Ser Ser Ser Gly Leu Ser
100 105 110
Ala Leu Val Lys Ala Cys Asn Ala Tyr Phe Lys Leu Gly Leu Asn Arg
115 120 125
Ser Gln Leu Ala Gln Glu Ala Lys Phe Ala Ser Gly Ser Ser Ser Arg
130 135 140
Ser Phe Tyr Gly Pro Leu Gly Ala Trp Asp Lys Asp Ser Gly Glu Ile
145 150 155 160
Tyr Pro Val Glu Thr Gly Leu Lys Leu Ala Met Ile Met Leu Val Leu
165 170 175
Glu Asp Lys Lys Lys Pro Ile Ser Ser Arg Asp Gly Met Lys Leu Cys
180 185 190
Val Glu Thr Ser Thr Thr Phe Asp Asp Trp Val Arg Gln Ser Glu Lys
195 200 205
Asp Tyr Gln Asp Met Leu Val Tyr Leu Lys Ala Asn Asp Phe Ala Lys
210 215 220
Val Gly Glu Leu Thr Glu Lys Asn Ala Leu Ala Met His Ala Thr Thr
225 230 235 240
Lys Thr Ala Ser Pro Ala Phe Ser Tyr Leu Thr Asp Ala Ser Tyr Glu
245 250 255
Ala Met Asp Phe Val Arg Gln Leu Arg Glu Gln Gly Glu Ala Cys Tyr
260 265 270
Phe Thr Met Asp Ala Gly Pro Asn Val Lys Val Leu Cys Gln Glu Lys
275 280 285
Asp Leu Glu His Leu Ser Glu Ile Phe Gly Gln Arg Tyr Arg Leu Ile
290 295 300
Val Ser Lys Thr Lys Asp Leu Ser Gln Asp Gly Cys Cys
305 310 315
<210> 120
<211> 948
<212> DNA
<213> 戈登氏链球菌(Streptococcus gordonii)
<400> 120
atggatcgaa agcctgtaag tgtcaaatcc tatgccaata ttgcaattgt caaatattgg 60
ggcaagaaag atgcagaaaa gatgattccg tctacaagca gtatctcact gacactggaa 120
aatatgtata ccgagacgca gctgagtcct ttgccggata cagcgactgg tgatgagttt 180
tatattgacg gtcagctgca aagcccggca gaacatgcca aaatcagtaa aattattgac 240
cgttttcgct ctccagaaga tggttttgtc cgtgttgata ccagcaataa tatgccaaca 300
gcagcagggc tgtcttccag ctccagcggt ctatctgctc tggtcaaggc ttgcaatgct 360
tattttcaga caggctatca gacggaagaa ctggctcaac tggccaagtt tgcttcaggg 420
tcctctgctc ggtctttctt tggtccgcta gcggcctggg ataaggacag tggagccatc 480
tatccagtca agacggattt gaagctagcc atgattatgc tggttctgca cgatgagaaa 540
aagcccattt ccagccgcga cggtatggag ctctgtgcta aaacttccac aattttccca 600
gattggattg cccaatctgc cttggattat caggccatgc taggctattt gcaggacaat 660
gattttgcca aggttggtca actgacggaa gaaaatgccc ttcggatgca tgctacaaca 720
gaaaaagctt atccgccgtt ttcttatctg acagaggagt cttatcaggc tatggatgct 780
gtcagaaagc tacgggagca gggcgagcgt tgctacttta ccatggatgc ggggccaaat 840
gtcaaggtgc tctgcttgga ggaagatcta gaccatttgg ctgccatatt tgagaaggac 900
tatcgcctta ttgtctccaa aacaaaggac ttgtcagatg aaagctag 948
<210> 121
<211> 315
<212> PRT
<213> 戈登氏链球菌
<400> 121
Met Asp Arg Lys Pro Val Ser Val Lys Ser Tyr Ala Asn Ile Ala Ile
1 5 10 15
Val Lys Tyr Trp Gly Lys Lys Asp Ala Glu Lys Met Ile Pro Ser Thr
20 25 30
Ser Ser Ile Ser Leu Thr Leu Glu Asn Met Tyr Thr Glu Thr Gln Leu
35 40 45
Ser Pro Leu Pro Asp Thr Ala Thr Gly Asp Glu Phe Tyr Ile Asp Gly
50 55 60
Gln Leu Gln Ser Pro Ala Glu His Ala Lys Ile Ser Lys Ile Ile Asp
65 70 75 80
Arg Phe Arg Ser Pro Glu Asp Gly Phe Val Arg Val Asp Thr Ser Asn
85 90 95
Asn Met Pro Thr Ala Ala Gly Leu Ser Ser Ser Ser Ser Gly Leu Ser
100 105 110
Ala Leu Val Lys Ala Cys Asn Ala Tyr Phe Gln Thr Gly Tyr Gln Thr
115 120 125
Glu Glu Leu Ala Gln Leu Ala Lys Phe Ala Ser Gly Ser Ser Ala Arg
130 135 140
Ser Phe Phe Gly Pro Leu Ala Ala Trp Asp Lys Asp Ser Gly Ala Ile
145 150 155 160
Tyr Pro Val Lys Thr Asp Leu Lys Leu Ala Met Ile Met Leu Val Leu
165 170 175
His Asp Glu Lys Lys Pro Ile Ser Ser Arg Asp Gly Met Glu Leu Cys
180 185 190
Ala Lys Thr Ser Thr Ile Phe Pro Asp Trp Ile Ala Gln Ser Ala Leu
195 200 205
Asp Tyr Gln Ala Met Leu Gly Tyr Leu Gln Asp Asn Asp Phe Ala Lys
210 215 220
Val Gly Gln Leu Thr Glu Glu Asn Ala Leu Arg Met His Ala Thr Thr
225 230 235 240
Glu Lys Ala Tyr Pro Pro Phe Ser Tyr Leu Thr Glu Glu Ser Tyr Gln
245 250 255
Ala Met Asp Ala Val Arg Lys Leu Arg Glu Gln Gly Glu Arg Cys Tyr
260 265 270
Phe Thr Met Asp Ala Gly Pro Asn Val Lys Val Leu Cys Leu Glu Glu
275 280 285
Asp Leu Asp His Leu Ala Ala Ile Phe Glu Lys Asp Tyr Arg Leu Ile
290 295 300
Val Ser Lys Thr Lys Asp Leu Ser Asp Glu Ser
305 310 315
<210> 122
<211> 1476
<212> DNA
<213> 酿酒酵母
<400> 122
atgaaactct caactaaact ttgttggtgt ggtattaaag gaagacttag gccgcaaaag 60
caacaacaat tacacaatac aaacttgcaa atgactgaac taaaaaaaca aaagaccgct 120
gaacaaaaaa ccagacctca aaatgtcggt attaaaggta tccaaattta catcccaact 180
caatgtgtca accaatctga gctagagaaa tttgatggcg tttctcaagg taaatacaca 240
attggtctgg gccaaaccaa catgtctttt gtcaatgaca gagaagatat ctactcgatg 300
tccctaactg ttttgtctaa gttgatcaag agttacaaca tcgacaccaa caaaattggt 360
agattagaag tcggtactga aactctgatt gacaagtcca agtctgtcaa gtctgtcttg 420
atgcaattgt ttggtgaaaa cactgacgtc gaaggtattg acacgcttaa tgcctgttac 480
ggtggtacca acgcgttgtt caactctttg aactggattg aatctaacgc atgggatggt 540
agagacgcca ttgtagtttg cggtgatatt gccatctacg ataagggtgc cgcaagacca 600
accggtggtg ccggtactgt tgctatgtgg atcggtcctg atgctccaat tgtatttgac 660
tctgtaagag cttcttacat ggaacacgcc tacgattttt acaagccaga tttcaccagc 720
gaatatcctt acgtcgatgg tcatttttca ttaacttgtt acgtcaaggc tcttgatcaa 780
gtttacaaga gttattccaa gaaggctatt tctaaagggt tggttagcga tcccgctggt 840
tcggatgctt tgaacgtttt gaaatatttc gactacaacg ttttccatgt tccaacctgt 900
aaattggtca caaaatcata cggtagatta ctatataacg atttcagagc caatcctcaa 960
ttgttcccag aagttgacgc cgaattagct actcgcgatt atgacgaatc tttaaccgat 1020
aagaacattg aaaaaacttt tgttaatgtt gctaagccat tccacaaaga gagagttgcc 1080
caatctttga ttgttccaac aaacacaggt aacatgtaca ccgcatctgt ttatgccgcc 1140
tttgcatctc tattaaacta tgttggatct gacgacttac aaggcaagcg tgttggttta 1200
ttttcttacg gttccggttt agctgcatct ctatattctt gcaaaattgt tggtgacgtc 1260
caacatatta tcaaggaatt agatattact aacaaattag ccaagagaat caccgaaact 1320
ccaaaggatt acgaagctgc catcgaattg agagaaaatg cccatttgaa gaagaacttc 1380
aaacctcaag gttccattga gcatttgcaa agtggtgttt actacttgac caacatcgat 1440
gacaaattta gaagatctta cgatgttaaa aaataa 1476
<210> 123
<211> 491
<212> PRT
<213> 酿酒酵母
<400> 123
Met Lys Leu Ser Thr Lys Leu Cys Trp Cys Gly Ile Lys Gly Arg Leu
1 5 10 15
Arg Pro Gln Lys Gln Gln Gln Leu His Asn Thr Asn Leu Gln Met Thr
20 25 30
Glu Leu Lys Lys Gln Lys Thr Ala Glu Gln Lys Thr Arg Pro Gln Asn
35 40 45
Val Gly Ile Lys Gly Ile Gln Ile Tyr Ile Pro Thr Gln Cys Val Asn
50 55 60
Gln Ser Glu Leu Glu Lys Phe Asp Gly Val Ser Gln Gly Lys Tyr Thr
65 70 75 80
Ile Gly Leu Gly Gln Thr Asn Met Ser Phe Val Asn Asp Arg Glu Asp
85 90 95
Ile Tyr Ser Met Ser Leu Thr Val Leu Ser Lys Leu Ile Lys Ser Tyr
100 105 110
Asn Ile Asp Thr Asn Lys Ile Gly Arg Leu Glu Val Gly Thr Glu Thr
115 120 125
Leu Ile Asp Lys Ser Lys Ser Val Lys Ser Val Leu Met Gln Leu Phe
130 135 140
Gly Glu Asn Thr Asp Val Glu Gly Ile Asp Thr Leu Asn Ala Cys Tyr
145 150 155 160
Gly Gly Thr Asn Ala Leu Phe Asn Ser Leu Asn Trp Ile Glu Ser Asn
165 170 175
Ala Trp Asp Gly Arg Asp Ala Ile Val Val Cys Gly Asp Ile Ala Ile
180 185 190
Tyr Asp Lys Gly Ala Ala Arg Pro Thr Gly Gly Ala Gly Thr Val Ala
195 200 205
Met Trp Ile Gly Pro Asp Ala Pro Ile Val Phe Asp Ser Val Arg Ala
210 215 220
Ser Tyr Met Glu His Ala Tyr Asp Phe Tyr Lys Pro Asp Phe Thr Ser
225 230 235 240
Glu Tyr Pro Tyr Val Asp Gly His Phe Ser Leu Thr Cys Tyr Val Lys
245 250 255
Ala Leu Asp Gln Val Tyr Lys Ser Tyr Ser Lys Lys Ala Ile Ser Lys
260 265 270
Gly Leu Val Ser Asp Pro Ala Gly Ser Asp Ala Leu Asn Val Leu Lys
275 280 285
Tyr Phe Asp Tyr Asn Val Phe His Val Pro Thr Cys Lys Leu Val Thr
290 295 300
Lys Ser Tyr Gly Arg Leu Leu Tyr Asn Asp Phe Arg Ala Asn Pro Gln
305 310 315 320
Leu Phe Pro Glu Val Asp Ala Glu Leu Ala Thr Arg Asp Tyr Asp Glu
325 330 335
Ser Leu Thr Asp Lys Asn Ile Glu Lys Thr Phe Val Asn Val Ala Lys
340 345 350
Pro Phe His Lys Glu Arg Val Ala Gln Ser Leu Ile Val Pro Thr Asn
355 360 365
Thr Gly Asn Met Tyr Thr Ala Ser Val Tyr Ala Ala Phe Ala Ser Leu
370 375 380
Leu Asn Tyr Val Gly Ser Asp Asp Leu Gln Gly Lys Arg Val Gly Leu
385 390 395 400
Phe Ser Tyr Gly Ser Gly Leu Ala Ala Ser Leu Tyr Ser Cys Lys Ile
405 410 415
Val Gly Asp Val Gln His Ile Ile Lys Glu Leu Asp Ile Thr Asn Lys
420 425 430
Leu Ala Lys Arg Ile Thr Glu Thr Pro Lys Asp Tyr Glu Ala Ala Ile
435 440 445
Glu Leu Arg Glu Asn Ala His Leu Lys Lys Asn Phe Lys Pro Gln Gly
450 455 460
Ser Ile Glu His Leu Gln Ser Gly Val Tyr Tyr Leu Thr Asn Ile Asp
465 470 475 480
Asp Lys Phe Arg Arg Ser Tyr Asp Val Lys Lys
485 490
<210> 124
<211> 816
<212> DNA
<213> 恶臭假单胞菌(Pseudomonas putida)
<400> 124
atgagcgatt tcagcaccct cgaagtgatc cgcgacccgc gcggcttcgc caccctgtgg 60
ttaagccgtg aggacaagaa caacgccttc aatgcgcaga tgatccgcga gctgatcgtg 120
gccatcgacc agttggccga agacgccagc ctgcgctttg tgctgctgcg cggccgtggc 180
cggcacttca gcgccggtgc cgacctggcc tggatgcagc agtcggcgca actggacttc 240
aacaccaacc tggatgatgc ccacgaactg ggcgagctga tgtacgccct gcatcgcctc 300
aaggccccga ccctggccgt ggtgcaaggt gcagcctttg gcggcgcgct gggcctgatc 360
agctgctgcg acatggccat cggcgccgaa gacgcccaac tgtgcctgtc ggaagtacgc 420
atcggcctgg ccccggcggt catcagcccg ttcgtggtca aggccattgg cgaacgcgcc 480
gcgcgccgct acgccctcac cgccgagcgt ttcactggcg tgcgcgcacg cgagctgggc 540
ctgctggccg aggtgtaccc ggccagcgaa ctggacgacc acgtcgaagc ctgggtaagc 600
aacctgctgc agaacagccc gcaagcattg cgcgccacca aggacttgct gcgcgaagtg 660
gacgacggcg aactcagccc ggccctgcgc cgttactgcg aaaacaccat cgcccgtatc 720
cgcgtcagcg ccgaaggcca ggagggcctg cgcgctttcc tggaaaaacg ccgccctgcc 780
tggcaaaccg ttgacaagaa ggagccgcgc ccatga 816
<210> 125
<211> 271
<212> PRT
<213> 恶臭假单胞菌
<400> 125
Met Ser Asp Phe Ser Thr Leu Glu Val Ile Arg Asp Pro Arg Gly Phe
1 5 10 15
Ala Thr Leu Trp Leu Ser Arg Glu Asp Lys Asn Asn Ala Phe Asn Ala
20 25 30
Gln Met Ile Arg Glu Leu Ile Val Ala Ile Asp Gln Leu Ala Glu Asp
35 40 45
Ala Ser Leu Arg Phe Val Leu Leu Arg Gly Arg Gly Arg His Phe Ser
50 55 60
Ala Gly Ala Asp Leu Ala Trp Met Gln Gln Ser Ala Gln Leu Asp Phe
65 70 75 80
Asn Thr Asn Leu Asp Asp Ala His Glu Leu Gly Glu Leu Met Tyr Ala
85 90 95
Leu His Arg Leu Lys Ala Pro Thr Leu Ala Val Val Gln Gly Ala Ala
100 105 110
Phe Gly Gly Ala Leu Gly Leu Ile Ser Cys Cys Asp Met Ala Ile Gly
115 120 125
Ala Glu Asp Ala Gln Leu Cys Leu Ser Glu Val Arg Ile Gly Leu Ala
130 135 140
Pro Ala Val Ile Ser Pro Phe Val Val Lys Ala Ile Gly Glu Arg Ala
145 150 155 160
Ala Arg Arg Tyr Ala Leu Thr Ala Glu Arg Phe Thr Gly Val Arg Ala
165 170 175
Arg Glu Leu Gly Leu Leu Ala Glu Val Tyr Pro Ala Ser Glu Leu Asp
180 185 190
Asp His Val Glu Ala Trp Val Ser Asn Leu Leu Gln Asn Ser Pro Gln
195 200 205
Ala Leu Arg Ala Thr Lys Asp Leu Leu Arg Glu Val Asp Asp Gly Glu
210 215 220
Leu Ser Pro Ala Leu Arg Arg Tyr Cys Glu Asn Thr Ile Ala Arg Ile
225 230 235 240
Arg Val Ser Ala Glu Gly Gln Glu Gly Leu Arg Ala Phe Leu Glu Lys
245 250 255
Arg Arg Pro Ala Trp Gln Thr Val Asp Lys Lys Glu Pro Arg Pro
260 265 270
<210> 126
<211> 1608
<212> DNA
<213> 铜绿假单胞菌(Pseudomonas aeruginosa)
<400> 126
atggccatcc tgcacaccca gatcaatcca cgctccgccg agttcgcggc caacgccgcg 60
accatgctgg aacaggtcaa cgccctgcgc accctcctcg gccgcatcca cgaaggcggc 120
ggtagcgccg cccaggcccg gcacagcgcg cgcggcaagc tgctggtgcg cgaacgcatc 180
aaccgcctgc tcgaccccgg ctcgccgttc ctcgagcttt ccgccctcgc cgcccacgaa 240
gtctacggcg aagaggtcgc cgccgccggc atcgtcgccg ggatcggccg ggtcgaaggg 300
gtggaatgca tgatcgtcgg caacgatgcc acggtgaagg gcggcaccta ctatccgctg 360
accgtgaaga agcacctgcg ggcccaggcc atcgccctgg agaaccgcct gccatgcatc 420
tacctggtgg actctggcgg cgccaacctg ccgcgccagg acgaggtgtt ccccgaccgc 480
gagcacttcg gccggatctt cttcaaccag gccaacatga gtgcccgcgg catcccgcag 540
atcgccgtgg tcatgggctc ctgcaccgcc ggcggggcct acgtgccggc gatgtccgac 600
gaaaccgtga tggtgcgcga acaggccacc atcttcctcg ccgggccgcc gctggtgaag 660
gccgctaccg gcgaggtggt cagcgccgag gaacttggcg gcgccgacgt gcactgcaag 720
gtctcagggg tcgccgacca ctatgccgag gacgatgacc atgccctggc catcgcccgc 780
cgctgcgtcg ccaacctcaa ctggcgcaag cagggccagc tgcaatgccg tgcaccgcgc 840
gcgccgctgt accccgccga ggagctgtac ggggtgattc ccgccgacag caagcagccc 900
tacgacgtgc gcgaagtgat cgcacggctg gtggacggct ccgagttcga cgaattcaag 960
gcgctgttcg gcaccaccct ggtctgcggc ttcgcccacc tgcacggcta tccgatcgcc 1020
atcctggcca acaacgggat cctcttcgcc gaggccgcgc agaaaggcgc gcacttcatc 1080
gagttggcct gccagcgtgg catcccgctg ctgttcctgc agaacatcac cggtttcatg 1140
gtcggccaga agtacgaggc tggcggcatc gccaagcacg gcgccaagct ggtgaccgcg 1200
gtggcctgcg cgcgggtgcc gaagttcacc gtgctgatcg gcggcagctt cggcgccggc 1260
aactacggca tgtgcggacg cgcctacgac ccgcgcttcc tgtggatgtg gccgaacgcg 1320
aggatcggcg tgatgggcgg cgaacaggcc gccggggtgc tcgcccaggt caagcgcgag 1380
caggccgagc gcgccggcca gcagctcggc gtcgaagagg aggcgaagat caaggcgccg 1440
atcctcgagc agtacgagca ccagggccat ccctactact ccagcgcgcg actgtgggac 1500
gacggcgtga tcgatccggc gcagacccgc gaggtcctcg ccctggcgct ttccgccgcc 1560
ctcaacgccc ccatcgagcc gaccgccttc ggcgtgttcc gcatgtga 1608
<210> 127
<211> 535
<212> PRT
<213> 铜绿假单胞菌
<400> 127
Met Ala Ile Leu His Thr Gln Ile Asn Pro Arg Ser Ala Glu Phe Ala
1 5 10 15
Ala Asn Ala Ala Thr Met Leu Glu Gln Val Asn Ala Leu Arg Thr Leu
20 25 30
Leu Gly Arg Ile His Glu Gly Gly Gly Ser Ala Ala Gln Ala Arg His
35 40 45
Ser Ala Arg Gly Lys Leu Leu Val Arg Glu Arg Ile Asn Arg Leu Leu
50 55 60
Asp Pro Gly Ser Pro Phe Leu Glu Leu Ser Ala Leu Ala Ala His Glu
65 70 75 80
Val Tyr Gly Glu Glu Val Ala Ala Ala Gly Ile Val Ala Gly Ile Gly
85 90 95
Arg Val Glu Gly Val Glu Cys Met Ile Val Gly Asn Asp Ala Thr Val
100 105 110
Lys Gly Gly Thr Tyr Tyr Pro Leu Thr Val Lys Lys His Leu Arg Ala
115 120 125
Gln Ala Ile Ala Leu Glu Asn Arg Leu Pro Cys Ile Tyr Leu Val Asp
130 135 140
Ser Gly Gly Ala Asn Leu Pro Arg Gln Asp Glu Val Phe Pro Asp Arg
145 150 155 160
Glu His Phe Gly Arg Ile Phe Phe Asn Gln Ala Asn Met Ser Ala Arg
165 170 175
Gly Ile Pro Gln Ile Ala Val Val Met Gly Ser Cys Thr Ala Gly Gly
180 185 190
Ala Tyr Val Pro Ala Met Ser Asp Glu Thr Val Met Val Arg Glu Gln
195 200 205
Ala Thr Ile Phe Leu Ala Gly Pro Pro Leu Val Lys Ala Ala Thr Gly
210 215 220
Glu Val Val Ser Ala Glu Glu Leu Gly Gly Ala Asp Val His Cys Lys
225 230 235 240
Val Ser Gly Val Ala Asp His Tyr Ala Glu Asp Asp Asp His Ala Leu
245 250 255
Ala Ile Ala Arg Arg Cys Val Ala Asn Leu Asn Trp Arg Lys Gln Gly
260 265 270
Gln Leu Gln Cys Arg Ala Pro Arg Ala Pro Leu Tyr Pro Ala Glu Glu
275 280 285
Leu Tyr Gly Val Ile Pro Ala Asp Ser Lys Gln Pro Tyr Asp Val Arg
290 295 300
Glu Val Ile Ala Arg Leu Val Asp Gly Ser Glu Phe Asp Glu Phe Lys
305 310 315 320
Ala Leu Phe Gly Thr Thr Leu Val Cys Gly Phe Ala His Leu His Gly
325 330 335
Tyr Pro Ile Ala Ile Leu Ala Asn Asn Gly Ile Leu Phe Ala Glu Ala
340 345 350
Ala Gln Lys Gly Ala His Phe Ile Glu Leu Ala Cys Gln Arg Gly Ile
355 360 365
Pro Leu Leu Phe Leu Gln Asn Ile Thr Gly Phe Met Val Gly Gln Lys
370 375 380
Tyr Glu Ala Gly Gly Ile Ala Lys His Gly Ala Lys Leu Val Thr Ala
385 390 395 400
Val Ala Cys Ala Arg Val Pro Lys Phe Thr Val Leu Ile Gly Gly Ser
405 410 415
Phe Gly Ala Gly Asn Tyr Gly Met Cys Gly Arg Ala Tyr Asp Pro Arg
420 425 430
Phe Leu Trp Met Trp Pro Asn Ala Arg Ile Gly Val Met Gly Gly Glu
435 440 445
Gln Ala Ala Gly Val Leu Ala Gln Val Lys Arg Glu Gln Ala Glu Arg
450 455 460
Ala Gly Gln Gln Leu Gly Val Glu Glu Glu Ala Lys Ile Lys Ala Pro
465 470 475 480
Ile Leu Glu Gln Tyr Glu His Gln Gly His Pro Tyr Tyr Ser Ser Ala
485 490 495
Arg Leu Trp Asp Asp Gly Val Ile Asp Pro Ala Gln Thr Arg Glu Val
500 505 510
Leu Ala Leu Ala Leu Ser Ala Ala Leu Asn Ala Pro Ile Glu Pro Thr
515 520 525
Ala Phe Gly Val Phe Arg Met
530 535
<210> 128
<211> 1968
<212> DNA
<213> 铜绿假单胞菌
<400> 128
atgaacccgg actaccgcag catccagcgc ctcctggtcg ccaaccgcgg cgagatcgcc 60
tgccgggtga tgcgcagcgc gcgcgccctc ggcatcggca gcgtcgccgt gcacagcgac 120
atcgaccgcc acgcccgcca cgtcgccgaa gccgacatcg ccgtcgacct gggcggcgcc 180
aagcccgccg acagctacct gcgcggcgac aggatcatcg cagctgccct cgccagcggc 240
gcccaggcga tccaccccgg ctacggcttc ctctcggaga acgccgactt cgcccgcgcc 300
tgcgaggaag ccggcctgct cttcctcgga ccgccggcgg cggccatcga cgccatgggc 360
agcaagtcgg ccgccaaggc gctgatggaa gaagccggcg tgccgctggt gcccggctat 420
cacggcgaag cccaggacct cgagactttc cgccgggaag ccgggcgcat cggctacccg 480
gtgctgctca aggccgccgc tggcggcggc ggcaagggca tgaaggtggt ggagcgcgag 540
gccgagctgg ccgaggccct ttcctccgcc cagcgcgagg ccaaggccgc cttcggcgac 600
gcgcgtatgc tggtggagaa atacctgctg aagccgcgcc acgtggagat ccaggtattc 660
gccgaccgcc atggccactg cctgtacctc aacgaacgcg actgttcgat ccagcgccgc 720
caccagaagg tcgtcgagga agcccccgcc cccggtctcg gcgcggaact gcgccgggcc 780
atgggcgagg ccgcggtacg cgcggcgcag gcgatcggct acgtcggcgc cggtaccgtc 840
gaattcctcc tcgacgaacg cggccagttc ttcttcatgg aaatgaacac ccgcctgcag 900
gtggaacacc cggtcaccga ggccatcacc ggcctcgacc tggtcgcctg gcagatccgc 960
gtcgctcgcg gcgaggcgct accgctgacg caggaacagg taccgctgaa cggccacgcc 1020
atcgaagtac ggctctatgc ggaagacccc gagggcgact tcctccccgc cagcggccgc 1080
ctgatgctat accgcgaagc ggccgccggc cccggccggc gggtcgacag cggggtacgc 1140
gaaggcgacg aggtctcgcc gttctacgac ccgatgctgg ccaagctgat cgcctggggc 1200
gaaacccgcg aggaagcccg ccagcgcctg ctggcgatgc tggcggaaac ctcggtcggc 1260
ggcctgcgca ccaacctggc gttcctccgc cgcatcctcg gccatccggc gttcgccgcc 1320
gccgaactgg acaccgggtt catcgcgcgc caccaagacg acctgctgcc ggcgccgcaa 1380
gcgctgccgg agcatttctg gcaagccgcc gccgaagcct ggctgcagag cgaaccgggc 1440
caccgtcgcg acgacgaccc gcattcgccg tggagccgca acgacggctg gcgcagcgcc 1500
ctggcgcggg agtccgacct gatgctgcgc tgccgcgacg aacgccgctg cgtccgcctg 1560
cgccacgcca gccccagcca gtatcgcctc gacggcgacg acctggtcag ccgggtggac 1620
ggtgtcaccc gtcgctcggc ggcgttgcgc cgcggacgcc aattgttcct cgaatgggag 1680
ggcgaactgc tggccatcga agccgtcgac ccgatcgccg aggccgaggc cgcccatgcc 1740
caccagggcg gtttgagcgc gccgatgaac ggcagtatcg tgcgggtcct ggtcgagccc 1800
ggccagacgg tcgaagccgg cgccaccctg gtggtgctgg aggcgatgaa gatggaacac 1860
agcatccgcg cgccccacgc cggggtagtg aaggcgctgt attgcagcga gggcgaactg 1920
gtcgaggaag gcacgccgct ggtggagctg gacgagaacc aggcctga 1968
<210> 129
<211> 655
<212> PRT
<213> 铜绿假单胞菌
<400> 129
Met Asn Pro Asp Tyr Arg Ser Ile Gln Arg Leu Leu Val Ala Asn Arg
1 5 10 15
Gly Glu Ile Ala Cys Arg Val Met Arg Ser Ala Arg Ala Leu Gly Ile
20 25 30
Gly Ser Val Ala Val His Ser Asp Ile Asp Arg His Ala Arg His Val
35 40 45
Ala Glu Ala Asp Ile Ala Val Asp Leu Gly Gly Ala Lys Pro Ala Asp
50 55 60
Ser Tyr Leu Arg Gly Asp Arg Ile Ile Ala Ala Ala Leu Ala Ser Gly
65 70 75 80
Ala Gln Ala Ile His Pro Gly Tyr Gly Phe Leu Ser Glu Asn Ala Asp
85 90 95
Phe Ala Arg Ala Cys Glu Glu Ala Gly Leu Leu Phe Leu Gly Pro Pro
100 105 110
Ala Ala Ala Ile Asp Ala Met Gly Ser Lys Ser Ala Ala Lys Ala Leu
115 120 125
Met Glu Glu Ala Gly Val Pro Leu Val Pro Gly Tyr His Gly Glu Ala
130 135 140
Gln Asp Leu Glu Thr Phe Arg Arg Glu Ala Gly Arg Ile Gly Tyr Pro
145 150 155 160
Val Leu Leu Lys Ala Ala Ala Gly Gly Gly Gly Lys Gly Met Lys Val
165 170 175
Val Glu Arg Glu Ala Glu Leu Ala Glu Ala Leu Ser Ser Ala Gln Arg
180 185 190
Glu Ala Lys Ala Ala Phe Gly Asp Ala Arg Met Leu Val Glu Lys Tyr
195 200 205
Leu Leu Lys Pro Arg His Val Glu Ile Gln Val Phe Ala Asp Arg His
210 215 220
Gly His Cys Leu Tyr Leu Asn Glu Arg Asp Cys Ser Ile Gln Arg Arg
225 230 235 240
His Gln Lys Val Val Glu Glu Ala Pro Ala Pro Gly Leu Gly Ala Glu
245 250 255
Leu Arg Arg Ala Met Gly Glu Ala Ala Val Arg Ala Ala Gln Ala Ile
260 265 270
Gly Tyr Val Gly Ala Gly Thr Val Glu Phe Leu Leu Asp Glu Arg Gly
275 280 285
Gln Phe Phe Phe Met Glu Met Asn Thr Arg Leu Gln Val Glu His Pro
290 295 300
Val Thr Glu Ala Ile Thr Gly Leu Asp Leu Val Ala Trp Gln Ile Arg
305 310 315 320
Val Ala Arg Gly Glu Ala Leu Pro Leu Thr Gln Glu Gln Val Pro Leu
325 330 335
Asn Gly His Ala Ile Glu Val Arg Leu Tyr Ala Glu Asp Pro Glu Gly
340 345 350
Asp Phe Leu Pro Ala Ser Gly Arg Leu Met Leu Tyr Arg Glu Ala Ala
355 360 365
Ala Gly Pro Gly Arg Arg Val Asp Ser Gly Val Arg Glu Gly Asp Glu
370 375 380
Val Ser Pro Phe Tyr Asp Pro Met Leu Ala Lys Leu Ile Ala Trp Gly
385 390 395 400
Glu Thr Arg Glu Glu Ala Arg Gln Arg Leu Leu Ala Met Leu Ala Glu
405 410 415
Thr Ser Val Gly Gly Leu Arg Thr Asn Leu Ala Phe Leu Arg Arg Ile
420 425 430
Leu Gly His Pro Ala Phe Ala Ala Ala Glu Leu Asp Thr Gly Phe Ile
435 440 445
Ala Arg His Gln Asp Asp Leu Leu Pro Ala Pro Gln Ala Leu Pro Glu
450 455 460
His Phe Trp Gln Ala Ala Ala Glu Ala Trp Leu Gln Ser Glu Pro Gly
465 470 475 480
His Arg Arg Asp Asp Asp Pro His Ser Pro Trp Ser Arg Asn Asp Gly
485 490 495
Trp Arg Ser Ala Leu Ala Arg Glu Ser Asp Leu Met Leu Arg Cys Arg
500 505 510
Asp Glu Arg Arg Cys Val Arg Leu Arg His Ala Ser Pro Ser Gln Tyr
515 520 525
Arg Leu Asp Gly Asp Asp Leu Val Ser Arg Val Asp Gly Val Thr Arg
530 535 540
Arg Ser Ala Ala Leu Arg Arg Gly Arg Gln Leu Phe Leu Glu Trp Glu
545 550 555 560
Gly Glu Leu Leu Ala Ile Glu Ala Val Asp Pro Ile Ala Glu Ala Glu
565 570 575
Ala Ala His Ala His Gln Gly Gly Leu Ser Ala Pro Met Asn Gly Ser
580 585 590
Ile Val Arg Val Leu Val Glu Pro Gly Gln Thr Val Glu Ala Gly Ala
595 600 605
Thr Leu Val Val Leu Glu Ala Met Lys Met Glu His Ser Ile Arg Ala
610 615 620
Pro His Ala Gly Val Val Lys Ala Leu Tyr Cys Ser Glu Gly Glu Leu
625 630 635 640
Val Glu Glu Gly Thr Pro Leu Val Glu Leu Asp Glu Asn Gln Ala
645 650 655
<210> 130
<211> 1164
<212> DNA
<213> 大肠杆菌
<400> 130
atggaacagg ttgtcattgt cgatgcaatt cgcaccccga tgggccgttc gaagggcggt 60
gcttttcgta acgtgcgtgc agaagatctc tccgctcatt taatgcgtag cctgctggcg 120
cgtaacccgg cgctggaagc ggcggccctc gacgatattt actggggttg tgtgcagcag 180
acgctggagc agggttttaa tatcgcccgt aacgcggcgc tgctggcaga agtaccacac 240
tctgtcccgg cggttaccgt taatcgcttg tgtggttcat ccatgcaggc actgcatgac 300
gcagcacgaa tgatcatgac tggcgatgcg caggcatgtc tggttggcgg cgtggagcat 360
atgggccatg tgccgatgag tcacggcgtc gattttcacc ccggcctgag ccgcaatgtc 420
gccaaagcgg cgggcatgat gggcttaacg gcagaaatgc tggcgcgtat gcacggtatc 480
agccgtgaaa tgcaggatgc ctttgccgcg cggtcacacg cccgcgcctg ggccgccacg 540
cagtcggccg catttaaaaa tgaaatcatc ccgaccggtg gtcacgatgc cgacggcgtc 600
ctgaagcagt ttaattacga cgaagtgatt cgcccggaaa ccaccgtgga agccctcgcc 660
acgctgcgtc cggcgtttga tccagtaaac ggtatggtaa cggcgggcac atcttctgca 720
ctttccgatg gcgcagctgc catgctggtg atgagtgaaa gccgcgccca tgaattaggt 780
cttaagccgc gcgctcgtgt gcgttcgatg gcggtcgttg gttgtgaccc atcgattatg 840
ggttacggcc cggttccggc ctcgaaactg gcgctgaaaa aagcggggct ttctgccagc 900
gatatcggcg tgtttgaaat gaacgaagcc tttgccgcgc agatcctgcc atgtattaaa 960
gatctgggac taattgagca gattgacgag aagatcaacc tcaacggtgg cgcgatcgcg 1020
ctgggtcatc cgctgggttg ttccggtgcg cgtatcagca ccacgctgct gaatctgatg 1080
gaacgcaaag acgttcagtt tggtctggcg acgatgtgta tcggtctggg tcagggtatt 1140
gcgacggtgt ttgagcgggt ttaa 1164
<210> 131
<211> 387
<212> PRT
<213> 大肠杆菌
<400> 131
Met Glu Gln Val Val Ile Val Asp Ala Ile Arg Thr Pro Met Gly Arg
1 5 10 15
Ser Lys Gly Gly Ala Phe Arg Asn Val Arg Ala Glu Asp Leu Ser Ala
20 25 30
His Leu Met Arg Ser Leu Leu Ala Arg Asn Pro Ala Leu Glu Ala Ala
35 40 45
Ala Leu Asp Asp Ile Tyr Trp Gly Cys Val Gln Gln Thr Leu Glu Gln
50 55 60
Gly Phe Asn Ile Ala Arg Asn Ala Ala Leu Leu Ala Glu Val Pro His
65 70 75 80
Ser Val Pro Ala Val Thr Val Asn Arg Leu Cys Gly Ser Ser Met Gln
85 90 95
Ala Leu His Asp Ala Ala Arg Met Ile Met Thr Gly Asp Ala Gln Ala
100 105 110
Cys Leu Val Gly Gly Val Glu His Met Gly His Val Pro Met Ser His
115 120 125
Gly Val Asp Phe His Pro Gly Leu Ser Arg Asn Val Ala Lys Ala Ala
130 135 140
Gly Met Met Gly Leu Thr Ala Glu Met Leu Ala Arg Met His Gly Ile
145 150 155 160
Ser Arg Glu Met Gln Asp Ala Phe Ala Ala Arg Ser His Ala Arg Ala
165 170 175
Trp Ala Ala Thr Gln Ser Ala Ala Phe Lys Asn Glu Ile Ile Pro Thr
180 185 190
Gly Gly His Asp Ala Asp Gly Val Leu Lys Gln Phe Asn Tyr Asp Glu
195 200 205
Val Ile Arg Pro Glu Thr Thr Val Glu Ala Leu Ala Thr Leu Arg Pro
210 215 220
Ala Phe Asp Pro Val Asn Gly Met Val Thr Ala Gly Thr Ser Ser Ala
225 230 235 240
Leu Ser Asp Gly Ala Ala Ala Met Leu Val Met Ser Glu Ser Arg Ala
245 250 255
His Glu Leu Gly Leu Lys Pro Arg Ala Arg Val Arg Ser Met Ala Val
260 265 270
Val Gly Cys Asp Pro Ser Ile Met Gly Tyr Gly Pro Val Pro Ala Ser
275 280 285
Lys Leu Ala Leu Lys Lys Ala Gly Leu Ser Ala Ser Asp Ile Gly Val
290 295 300
Phe Glu Met Asn Glu Ala Phe Ala Ala Gln Ile Leu Pro Cys Ile Lys
305 310 315 320
Asp Leu Gly Leu Ile Glu Gln Ile Asp Glu Lys Ile Asn Leu Asn Gly
325 330 335
Gly Ala Ile Ala Leu Gly His Pro Leu Gly Cys Ser Gly Ala Arg Ile
340 345 350
Ser Thr Thr Leu Leu Asn Leu Met Glu Arg Lys Asp Val Gln Phe Gly
355 360 365
Leu Ala Thr Met Cys Ile Gly Leu Gly Gln Gly Ile Ala Thr Val Phe
370 375 380
Glu Arg Val
385
<210> 132
<211> 2190
<212> DNA
<213> 大肠杆菌
<400> 132
atgctttaca aaggcgacac cctgtacctt gactggctgg aagatggcat tgccgaactg 60
gtatttgatg ccccaggttc agttaataaa ctcgacactg cgaccgtcgc cagcctcggc 120
gaggccatcg gcgtgctgga acagcaatca gatctaaaag ggctgctgct gcgttcgaac 180
aaagcagcct ttatcgtcgg tgctgatatc accgaatttt tgtccctgtt cctcgttcct 240
gaagaacagt taagtcagtg gctgcacttt gccaatagcg tgtttaatcg cctggaagat 300
ctgccggtgc cgaccattgc tgccgtcaat ggctatgcgc tgggcggtgg ctgcgaatgc 360
gtgctggcga ccgattatcg tctggcgacg ccggatctgc gcatcggtct gccggaaacc 420
aaactgggca tcatgcctgg ctttggcggt tctgtacgta tgccacgtat gctgggcgct 480
gacagtgcgc tggaaatcat tgccgccggt aaagatgtcg gcgcggatca ggcgctgaaa 540
atcggtctgg tggatggcgt agtcaaagca gaaaaactgg ttgaaggcgc aaaggcggtt 600
ttacgccagg ccattaacgg cgacctcgac tggaaagcaa aacgtcagcc gaagctggaa 660
ccactaaaac tgagcaagat tgaagccacc atgagcttca ccatcgctaa agggatggtc 720
gcacaaacag cggggaaaca ttatccggcc cccatcaccg cagtaaaaac cattgaagct 780
gcggcccgtt ttggtcgtga agaagcctta aacctggaaa acaaaagttt tgtcccgctg 840
gcgcatacca acgaagcccg cgcactggtc ggcattttcc ttaacgatca atatgtaaaa 900
ggcaaagcga agaaactcac caaagacgtt gaaaccccga aacaggccgc ggtgctgggt 960
gcaggcatta tgggcggcgg catcgcttac cagtctgcgt ggaaaggcgt gccggttgtc 1020
atgaaagata tcaacgacaa gtcgttaacc ctcggcatga ccgaagccgc gaaactgctg 1080
aacaagcagc ttgagcgcgg caagatcgat ggtctgaaac tggctggcgt gatctccaca 1140
atccacccaa cgctcgacta cgccggattt gaccgcgtgg atattgtggt agaagcggtt 1200
gttgaaaacc cgaaagtgaa aaaagccgta ctggcagaaa ccgaacaaaa agtacgccag 1260
gataccgtgc tggcgtctaa cacttcaacc attcctatca gcgaactggc caacgcgctg 1320
gaacgcccgg aaaacttctg cgggatgcac ttctttaacc cggtccaccg aatgccgttg 1380
gtagaaatta ttcgcggcga gaaaagctcc gacgaaacca tcgcgaaagt tgtcgcctgg 1440
gcgagcaaga tgggcaagac gccgattgtg gttaacgact gccccggctt ctttgttaac 1500
cgcgtgctgt tcccgtattt cgccggtttc agccagctgc tgcgcgacgg cgcggatttc 1560
cgcaagatcg acaaagtgat ggaaaaacag tttggctggc cgatgggccc ggcatatctg 1620
ctggacgttg tgggcattga taccgcgcat cacgctcagg ctgtcatggc agcaggcttc 1680
ccgcagcgga tgcagaaaga ttaccgcgat gccatcgacg cgctgtttga tgccaaccgc 1740
tttggtcaga agaacggcct cggtttctgg cgttataaag aagacagcaa aggtaagccg 1800
aagaaagaag aagacgccgc cgttgaagac ctgctggcag aagtgagcca gccgaagcgc 1860
gatttcagcg aagaagagat tatcgcccgc atgatgatcc cgatggtcaa cgaagtggtg 1920
cgctgtctgg aggaaggcat tatcgccact ccggcggaag cggatatggc gctggtctac 1980
ggcctgggct tccctccgtt ccacggcggc gcgttccgct ggctggacac cctcggtagc 2040
gcaaaatacc tcgatatggc acagcaatat cagcacctcg gcccgctgta tgaagtgccg 2100
gaaggtctgc gtaataaagc gcgtcataac gaaccgtact atcctccggt tgagccagcc 2160
cgtccggttg gcgacctgaa aacggcttaa 2190
<210> 133
<211> 729
<212> PRT
<213> 大肠杆菌
<400> 133
Met Leu Tyr Lys Gly Asp Thr Leu Tyr Leu Asp Trp Leu Glu Asp Gly
1 5 10 15
Ile Ala Glu Leu Val Phe Asp Ala Pro Gly Ser Val Asn Lys Leu Asp
20 25 30
Thr Ala Thr Val Ala Ser Leu Gly Glu Ala Ile Gly Val Leu Glu Gln
35 40 45
Gln Ser Asp Leu Lys Gly Leu Leu Leu Arg Ser Asn Lys Ala Ala Phe
50 55 60
Ile Val Gly Ala Asp Ile Thr Glu Phe Leu Ser Leu Phe Leu Val Pro
65 70 75 80
Glu Glu Gln Leu Ser Gln Trp Leu His Phe Ala Asn Ser Val Phe Asn
85 90 95
Arg Leu Glu Asp Leu Pro Val Pro Thr Ile Ala Ala Val Asn Gly Tyr
100 105 110
Ala Leu Gly Gly Gly Cys Glu Cys Val Leu Ala Thr Asp Tyr Arg Leu
115 120 125
Ala Thr Pro Asp Leu Arg Ile Gly Leu Pro Glu Thr Lys Leu Gly Ile
130 135 140
Met Pro Gly Phe Gly Gly Ser Val Arg Met Pro Arg Met Leu Gly Ala
145 150 155 160
Asp Ser Ala Leu Glu Ile Ile Ala Ala Gly Lys Asp Val Gly Ala Asp
165 170 175
Gln Ala Leu Lys Ile Gly Leu Val Asp Gly Val Val Lys Ala Glu Lys
180 185 190
Leu Val Glu Gly Ala Lys Ala Val Leu Arg Gln Ala Ile Asn Gly Asp
195 200 205
Leu Asp Trp Lys Ala Lys Arg Gln Pro Lys Leu Glu Pro Leu Lys Leu
210 215 220
Ser Lys Ile Glu Ala Thr Met Ser Phe Thr Ile Ala Lys Gly Met Val
225 230 235 240
Ala Gln Thr Ala Gly Lys His Tyr Pro Ala Pro Ile Thr Ala Val Lys
245 250 255
Thr Ile Glu Ala Ala Ala Arg Phe Gly Arg Glu Glu Ala Leu Asn Leu
260 265 270
Glu Asn Lys Ser Phe Val Pro Leu Ala His Thr Asn Glu Ala Arg Ala
275 280 285
Leu Val Gly Ile Phe Leu Asn Asp Gln Tyr Val Lys Gly Lys Ala Lys
290 295 300
Lys Leu Thr Lys Asp Val Glu Thr Pro Lys Gln Ala Ala Val Leu Gly
305 310 315 320
Ala Gly Ile Met Gly Gly Gly Ile Ala Tyr Gln Ser Ala Trp Lys Gly
325 330 335
Val Pro Val Val Met Lys Asp Ile Asn Asp Lys Ser Leu Thr Leu Gly
340 345 350
Met Thr Glu Ala Ala Lys Leu Leu Asn Lys Gln Leu Glu Arg Gly Lys
355 360 365
Ile Asp Gly Leu Lys Leu Ala Gly Val Ile Ser Thr Ile His Pro Thr
370 375 380
Leu Asp Tyr Ala Gly Phe Asp Arg Val Asp Ile Val Val Glu Ala Val
385 390 395 400
Val Glu Asn Pro Lys Val Lys Lys Ala Val Leu Ala Glu Thr Glu Gln
405 410 415
Lys Val Arg Gln Asp Thr Val Leu Ala Ser Asn Thr Ser Thr Ile Pro
420 425 430
Ile Ser Glu Leu Ala Asn Ala Leu Glu Arg Pro Glu Asn Phe Cys Gly
435 440 445
Met His Phe Phe Asn Pro Val His Arg Met Pro Leu Val Glu Ile Ile
450 455 460
Arg Gly Glu Lys Ser Ser Asp Glu Thr Ile Ala Lys Val Val Ala Trp
465 470 475 480
Ala Ser Lys Met Gly Lys Thr Pro Ile Val Val Asn Asp Cys Pro Gly
485 490 495
Phe Phe Val Asn Arg Val Leu Phe Pro Tyr Phe Ala Gly Phe Ser Gln
500 505 510
Leu Leu Arg Asp Gly Ala Asp Phe Arg Lys Ile Asp Lys Val Met Glu
515 520 525
Lys Gln Phe Gly Trp Pro Met Gly Pro Ala Tyr Leu Leu Asp Val Val
530 535 540
Gly Ile Asp Thr Ala His His Ala Gln Ala Val Met Ala Ala Gly Phe
545 550 555 560
Pro Gln Arg Met Gln Lys Asp Tyr Arg Asp Ala Ile Asp Ala Leu Phe
565 570 575
Asp Ala Asn Arg Phe Gly Gln Lys Asn Gly Leu Gly Phe Trp Arg Tyr
580 585 590
Lys Glu Asp Ser Lys Gly Lys Pro Lys Lys Glu Glu Asp Ala Ala Val
595 600 605
Glu Asp Leu Leu Ala Glu Val Ser Gln Pro Lys Arg Asp Phe Ser Glu
610 615 620
Glu Glu Ile Ile Ala Arg Met Met Ile Pro Met Val Asn Glu Val Val
625 630 635 640
Arg Cys Leu Glu Glu Gly Ile Ile Ala Thr Pro Ala Glu Ala Asp Met
645 650 655
Ala Leu Val Tyr Gly Leu Gly Phe Pro Pro Phe His Gly Gly Ala Phe
660 665 670
Arg Trp Leu Asp Thr Leu Gly Ser Ala Lys Tyr Leu Asp Met Ala Gln
675 680 685
Gln Tyr Gln His Leu Gly Pro Leu Tyr Glu Val Pro Glu Gly Leu Arg
690 695 700
Asn Lys Ala Arg His Asn Glu Pro Tyr Tyr Pro Pro Val Glu Pro Ala
705 710 715 720
Arg Pro Val Gly Asp Leu Lys Thr Ala
725
<210> 134
<211> 861
<212> DNA
<213> 大肠杆菌
<400> 134
atgagtcagg cgctaaaaaa tttactgaca ttgttaaatc tggaaaaaat tgaggaagga 60
ctctttcgcg gccagagtga agatttaggt ttacgccagg tgtttggcgg ccaggtcgtg 120
ggtcaggcct tgtatgctgc aaaagagacc gtccctgaag agcggctggt acattcgttt 180
cacagctact ttcttcgccc tggcgatagt aagaagccga ttatttatga tgtcgaaacg 240
ctgcgtgacg gtaacagctt cagcgcccgc cgggttgctg ctattcaaaa cggcaaaccg 300
attttttata tgactgcctc tttccaggca ccagaagcgg gtttcgaaca tcaaaaaaca 360
atgccgtccg cgccagcgcc tgatggcctc ccttcggaaa cgcaaatcgc ccaatcgctg 420
gcgcacctgc tgccgccagt gctgaaagat aaattcatct gcgatcgtcc gctggaagtc 480
cgtccggtgg agtttcataa cccactgaaa ggtcacgtcg cagaaccaca tcgtcaggtg 540
tggatccgcg caaatggtag cgtgccggat gacctgcgcg ttcatcagta tctgctcggt 600
tacgcttctg atcttaactt cctgccggta gctctacagc cgcacggcat cggttttctc 660
gaaccgggga ttcagattgc caccattgac cattccatgt ggttccatcg cccgtttaat 720
ttgaatgaat ggctgctgta tagcgtggag agcacctcgg cgtccagcgc acgtggcttt 780
gtgcgcggtg agttttatac ccaagacggc gtactggttg cctcgaccgt tcaggaaggg 840
gtgatgcgta atcacaatta a 861
<210> 135
<211> 286
<212> PRT
<213> 大肠杆菌
<400> 135
Met Ser Gln Ala Leu Lys Asn Leu Leu Thr Leu Leu Asn Leu Glu Lys
1 5 10 15
Ile Glu Glu Gly Leu Phe Arg Gly Gln Ser Glu Asp Leu Gly Leu Arg
20 25 30
Gln Val Phe Gly Gly Gln Val Val Gly Gln Ala Leu Tyr Ala Ala Lys
35 40 45
Glu Thr Val Pro Glu Glu Arg Leu Val His Ser Phe His Ser Tyr Phe
50 55 60
Leu Arg Pro Gly Asp Ser Lys Lys Pro Ile Ile Tyr Asp Val Glu Thr
65 70 75 80
Leu Arg Asp Gly Asn Ser Phe Ser Ala Arg Arg Val Ala Ala Ile Gln
85 90 95
Asn Gly Lys Pro Ile Phe Tyr Met Thr Ala Ser Phe Gln Ala Pro Glu
100 105 110
Ala Gly Phe Glu His Gln Lys Thr Met Pro Ser Ala Pro Ala Pro Asp
115 120 125
Gly Leu Pro Ser Glu Thr Gln Ile Ala Gln Ser Leu Ala His Leu Leu
130 135 140
Pro Pro Val Leu Lys Asp Lys Phe Ile Cys Asp Arg Pro Leu Glu Val
145 150 155 160
Arg Pro Val Glu Phe His Asn Pro Leu Lys Gly His Val Ala Glu Pro
165 170 175
His Arg Gln Val Trp Ile Arg Ala Asn Gly Ser Val Pro Asp Asp Leu
180 185 190
Arg Val His Gln Tyr Leu Leu Gly Tyr Ala Ser Asp Leu Asn Phe Leu
195 200 205
Pro Val Ala Leu Gln Pro His Gly Ile Gly Phe Leu Glu Pro Gly Ile
210 215 220
Gln Ile Ala Thr Ile Asp His Ser Met Trp Phe His Arg Pro Phe Asn
225 230 235 240
Leu Asn Glu Trp Leu Leu Tyr Ser Val Glu Ser Thr Ser Ala Ser Ser
245 250 255
Ala Arg Gly Phe Val Arg Gly Glu Phe Tyr Thr Gln Asp Gly Val Leu
260 265 270
Val Ala Ser Thr Val Gln Glu Gly Val Met Arg Asn His Asn
275 280 285
<210> 136
<211> 1056
<212> DNA
<213> 拜氏梭菌
<400> 136
atgaaaggtt ttgcaatgct aggtattaat aagttaggat ggatcgaaaa agaaaggcca 60
gttgcgggtt catatgatgc tattgtacgc ccattagcag tatctccgtg tacatcagat 120
atacatactg tttttgaggg agctcttgga gataggaaga atatgatttt agggcatgaa 180
gctgtaggtg aagttgttga agtaggaagt gaagtgaagg attttaaacc tggtgacaga 240
gttatagttc cttgtacaac tccagattgg agatctttgg aagttcaagc tggttttcaa 300
cagcactcaa acggtatgct cgcaggatgg aaattttcaa atttcaagga tggagttttt 360
ggtgaatatt ttcatgtaaa tgatgcggat atgaatcttg cgattctacc taaagacatg 420
ccattagaaa atgctgttat gataacagat atgatgacta ctggatttca tggagcagaa 480
cttgcagata ttcaaatggg ttcaagtgtt gtggtaattg gcattggagc tgttggctta 540
atgggaatag caggtgctaa attacgtgga gcaggtagaa taattggagt ggggagcagg 600
ccgatttgtg ttgaggctgc aaaattttat ggagcaacag atattctaaa ttataaaaat 660
ggtcatatag ttgatcaagt tatgaaatta acgaatggaa aaggcgttga ccgcgtaatt 720
atggcaggcg gtggttctga aacattatcc caagcagtat ctatggttaa accaggagga 780
ataatttcta atataaatta tcatggaagt ggagatgctt tactaatacc acgtgtagaa 840
tggggatgtg gaatggctca caagactata aaaggaggtc tttgtcctgg gggacgtttg 900
agagcagaaa tgttaagaga tatggtagta tataatcgtg ttgatctaag taaattagtt 960
acacatgtat atcatggatt tgatcacata gaagaagcac tgttattaat gaaagacaag 1020
ccaaaagact taattaaagc agtagttata ttataa 1056
<210> 137
<211> 1056
<212> DNA
<213> 拜氏梭菌
<400> 137
atgaaagggt ttgccatgtt aggtatcaat aaactgggct ggattgaaaa agagcgcccg 60
gtggcgggtt catacgatgc aattgttcgt ccgctggccg tcagtccgtg caccagcgac 120
atccatacag tctttgaagg tgccctgggt gatcggaaaa acatgattct gggccatgaa 180
gccgtaggcg aagtagtgga agtgggcagc gaggtaaagg atttcaaacc gggtgatcgc 240
gtaattgttc cttgcacgac cccagattgg cgctcactgg aagttcaggc tggttttcag 300
cagcatagta acggtatgtt agcaggctgg aagtttagca attttaaaga cggggtgttc 360
ggggagtatt ttcatgtcaa cgatgcggac atgaatctgg ctattttacc taaagatatg 420
ccgctggaga acgcagtgat gattaccgac atgatgacga caggctttca cggtgcagaa 480
ctggctgaca tccaaatggg ctccagtgtg gtggttatcg gtattggtgc ggtcgggctg 540
atgggtatcg cgggcgcgaa attacggggc gctggtcgca tcatcggtgt cggcagccgt 600
ccaatttgcg ttgaagcagc taaattctat ggtgccacgg acattctgaa ctataaaaat 660
ggtcacatcg tcgatcaggt gatgaaactg accaatggca aaggtgtgga ccgcgtgatc 720
atggcgggcg gcggctcaga gactttatct caagcggtgt ctatggttaa acctgggggc 780
atcatttcta atattaacta tcatggctcc ggcgacgcat tactgatccc gcgtgttgaa 840
tggggctgtg ggatggccca caaaaccatt aaaggggggt tatgtccggg tggtcgcctg 900
cgtgccgaaa tgctgcgtga catggtggtt tacaaccgtg tggatctgtc caaactggta 960
actcacgtat accacggttt cgatcacatt gaagaggcgc tgctgctgat gaaggataag 1020
ccaaaggatc tgattaaggc ggttgttatc ctgtaa 1056
<210> 138
<211> 351
<212> PRT
<213> 拜氏梭菌
<400> 138
Met Lys Gly Phe Ala Met Leu Gly Ile Asn Lys Leu Gly Trp Ile Glu
1 5 10 15
Lys Glu Arg Pro Val Ala Gly Ser Tyr Asp Ala Ile Val Arg Pro Leu
20 25 30
Ala Val Ser Pro Cys Thr Ser Asp Ile His Thr Val Phe Glu Gly Ala
35 40 45
Leu Gly Asp Arg Lys Asn Met Ile Leu Gly His Glu Ala Val Gly Glu
50 55 60
Val Val Glu Val Gly Ser Glu Val Lys Asp Phe Lys Pro Gly Asp Arg
65 70 75 80
Val Ile Val Pro Cys Thr Thr Pro Asp Trp Arg Ser Leu Glu Val Gln
85 90 95
Ala Gly Phe Gln Gln His Ser Asn Gly Met Leu Ala Gly Trp Lys Phe
100 105 110
Ser Asn Phe Lys Asp Gly Val Phe Gly Glu Tyr Phe His Val Asn Asp
115 120 125
Ala Asp Met Asn Leu Ala Ile Leu Pro Lys Asp Met Pro Leu Glu Asn
130 135 140
Ala Val Met Ile Thr Asp Met Met Thr Thr Gly Phe His Gly Ala Glu
145 150 155 160
Leu Ala Asp Ile Gln Met Gly Ser Ser Val Val Val Ile Gly Ile Gly
165 170 175
Ala Val Gly Leu Met Gly Ile Ala Gly Ala Lys Leu Arg Gly Ala Gly
180 185 190
Arg Ile Ile Gly Val Gly Ser Arg Pro Ile Cys Val Glu Ala Ala Lys
195 200 205
Phe Tyr Gly Ala Thr Asp Ile Leu Asn Tyr Lys Asn Gly His Ile Val
210 215 220
Asp Gln Val Met Lys Leu Thr Asn Gly Lys Gly Val Asp Arg Val Ile
225 230 235 240
Met Ala Gly Gly Gly Ser Glu Thr Leu Ser Gln Ala Val Ser Met Val
245 250 255
Lys Pro Gly Gly Ile Ile Ser Asn Ile Asn Tyr His Gly Ser Gly Asp
260 265 270
Ala Leu Leu Ile Pro Arg Val Glu Trp Gly Cys Gly Met Ala His Lys
275 280 285
Thr Ile Lys Gly Gly Leu Cys Pro Gly Gly Arg Leu Arg Ala Glu Met
290 295 300
Leu Arg Asp Met Val Val Tyr Asn Arg Val Asp Leu Ser Lys Leu Val
305 310 315 320
Thr His Val Tyr His Gly Phe Asp His Ile Glu Glu Ala Leu Leu Leu
325 330 335
Met Lys Asp Lys Pro Lys Asp Leu Ile Lys Ala Val Val Ile Leu
340 345 350
<210> 139
<211> 2580
<212> DNA
<213> 未知
<220>
<223> 食碳梭菌(Clostridium carboxidivorans)序列
<400> 139
atgaaggtaa ctaatgttga agaactgatg aaaaaaatgc aggaagtgca aaatgctcaa 60
aaaaaatttg ggagttttac tcaggaacaa gtagatgaaa ttttcaggca agcagcacta 120
gcagctaaca gtgccagaat agatctagct aaaatggcag tggaagaaac taaaatggga 180
attgtagagg ataaggttat aaaaaatcat tttgttgcag aatacatata taataagtat 240
aaaaatgaaa aaacttgtgg gattttggaa gaagatgaag gctttggaat ggttaaaatt 300
gcagaacctg taggtgtgat tgcagcagta attccaacaa caaatccaac atctacagca 360
atatttaaag cattattagc tttgaaaaca agaaatggta taattttttc accacatcca 420
agagcaaaaa agtgtactat tgcagcagct aagttagttc ttgatgctgc agttaaagca 480
ggtgctccta aaggaattat aggttggata gatgaacctt ctattgaact ttcacagata 540
gtaatgaaag aagctgatat aatccttgca acaggtggtc caggtatggt taaagcagct 600
tattcttcag gtaaacctgc tataggggtt ggtcctggta acacacctgc tttaattgat 660
gaaagtgctg atattaaaat ggcagtaaat tcaatacttc tttccaaaac ttttgataat 720
ggtatgattt gtgcttcaga gcagtcggta gtagttgtag attcaatata tgaagaagtt 780
aagaaagaat ttgctcatag aggagcttat attttaagta aggatgaaac aactaaagtt 840
ggaaaaatac tcttagttaa tggtacatta aatgctggta tcgttggtca gagtgcttat 900
aaaatagcag aaatggcagg agttaaagtt ccagaagatg ctaaagttct tataggagaa 960
gtaaaatcag tggagcattc agaagagcca ttttcacatg aaaagttatc tccagtttta 1020
gctatgtata gagctaaaaa ttttgatgaa gctcttttaa aagctggaag attagttgaa 1080
ctcggtggaa tgggtcatac atctgtatta tatgtaaatg caataactga aaaagtaaaa 1140
gtagaaaaat ttagagaaac tatgaagact ggtagaacat taataaatat gccttcagca 1200
caaggtgcta taggagacat atataacttt aaactagctc cttcattaac attaggttgt 1260
ggttcatggg gaggaaactc cgtatcagaa aatgttggac ctaaacactt attaaatata 1320
aaaagtgttg ctgagaggag agaaaatatg ctttggttta gagttcctga aaaggtttat 1380
tttaaatatg gtagtcttgg agttgcatta aaagaattag atattttgga taagaaaaaa 1440
gtatttatag taacagataa agttctttat caattaggtt atatagatag agttacaaag 1500
attcttgaag aattgaaaat ttcatataaa atatttacag atgtagaacc agatccaacc 1560
ctagctacag ctaaaaaagg tgcagaagaa ttgttatcat ttaatccaga tactattata 1620
gcagttggtg gtggttcagc aatggatgct gctaagatta tgtgggtaat gtatgaacat 1680
ccggaagtaa gatttgaaga tttagctatg agatttatgg atataagaaa gagagtatat 1740
acttttccta agatgggtga aaaagcaatg atgatttctg ttgcaacatc agcaggaaca 1800
ggatcagaag taacaccttt tgcagtaatt actgatgaaa aaacaggagc taaatatcca 1860
ttagctgatt atgaattaac tccaaatatg gctataattg atgctgaact tatgatgggt 1920
atgccaaaag gattaacagc agcttcagga atagatgcac taactcatgc aatagaagct 1980
tatgtatcaa taatggcttc agaatatact aatggattag cgttagaagc aataagattg 2040
atatttaagt atttaccaat agcttacagt gaaggaacaa caagtataaa ggcaagagaa 2100
aaaatggcgc atgcttcaac aatagctggt atggcatttg ctaatgcatt tttaggagta 2160
tgtcattcaa tggcacataa attaggatca actcatcacg taccacatgg cattgccaat 2220
gcactactta taaatgaagt tataaaattt aatgcagtag aaaatccaag aaaacaagct 2280
gcatttccac aatataagta tccaaatata aaaaagagat atgctagaat agcagattac 2340
cttaacttag gtgggtcaac agacgatgaa aaagtacaat tattaataaa tgctatagat 2400
gaattaaaag ctaagataaa tattccagaa agtattaaag aagcaggagt aacagaagaa 2460
aaattttatg ctactttaga taaaatgtca gaattagctt ttgatgatca atgtacaggt 2520
gcaaacccta gatatccatt aataagtgaa ataaaacaaa tgtatgtaaa tgcattttaa 2580
<210> 140
<211> 859
<212> PRT
<213> 未知
<220>
<223> 食碳梭菌(Clostridium carboxidivorans)序列
<400> 140
Met Lys Val Thr Asn Val Glu Glu Leu Met Lys Lys Met Gln Glu Val
1 5 10 15
Gln Asn Ala Gln Lys Lys Phe Gly Ser Phe Thr Gln Glu Gln Val Asp
20 25 30
Glu Ile Phe Arg Gln Ala Ala Leu Ala Ala Asn Ser Ala Arg Ile Asp
35 40 45
Leu Ala Lys Met Ala Val Glu Glu Thr Lys Met Gly Ile Val Glu Asp
50 55 60
Lys Val Ile Lys Asn His Phe Val Ala Glu Tyr Ile Tyr Asn Lys Tyr
65 70 75 80
Lys Asn Glu Lys Thr Cys Gly Ile Leu Glu Glu Asp Glu Gly Phe Gly
85 90 95
Met Val Lys Ile Ala Glu Pro Val Gly Val Ile Ala Ala Val Ile Pro
100 105 110
Thr Thr Asn Pro Thr Ser Thr Ala Ile Phe Lys Ala Leu Leu Ala Leu
115 120 125
Lys Thr Arg Asn Gly Ile Ile Phe Ser Pro His Pro Arg Ala Lys Lys
130 135 140
Cys Thr Ile Ala Ala Ala Lys Leu Val Leu Asp Ala Ala Val Lys Ala
145 150 155 160
Gly Ala Pro Lys Gly Ile Ile Gly Trp Ile Asp Glu Pro Ser Ile Glu
165 170 175
Leu Ser Gln Ile Val Met Lys Glu Ala Asp Ile Ile Leu Ala Thr Gly
180 185 190
Gly Pro Gly Met Val Lys Ala Ala Tyr Ser Ser Gly Lys Pro Ala Ile
195 200 205
Gly Val Gly Pro Gly Asn Thr Pro Ala Leu Ile Asp Glu Ser Ala Asp
210 215 220
Ile Lys Met Ala Val Asn Ser Ile Leu Leu Ser Lys Thr Phe Asp Asn
225 230 235 240
Gly Met Ile Cys Ala Ser Glu Gln Ser Val Val Val Val Asp Ser Ile
245 250 255
Tyr Glu Glu Val Lys Lys Glu Phe Ala His Arg Gly Ala Tyr Ile Leu
260 265 270
Ser Lys Asp Glu Thr Thr Lys Val Gly Lys Ile Leu Leu Val Asn Gly
275 280 285
Thr Leu Asn Ala Gly Ile Val Gly Gln Ser Ala Tyr Lys Ile Ala Glu
290 295 300
Met Ala Gly Val Lys Val Pro Glu Asp Ala Lys Val Leu Ile Gly Glu
305 310 315 320
Val Lys Ser Val Glu His Ser Glu Glu Pro Phe Ser His Glu Lys Leu
325 330 335
Ser Pro Val Leu Ala Met Tyr Arg Ala Lys Asn Phe Asp Glu Ala Leu
340 345 350
Leu Lys Ala Gly Arg Leu Val Glu Leu Gly Gly Met Gly His Thr Ser
355 360 365
Val Leu Tyr Val Asn Ala Ile Thr Glu Lys Val Lys Val Glu Lys Phe
370 375 380
Arg Glu Thr Met Lys Thr Gly Arg Thr Leu Ile Asn Met Pro Ser Ala
385 390 395 400
Gln Gly Ala Ile Gly Asp Ile Tyr Asn Phe Lys Leu Ala Pro Ser Leu
405 410 415
Thr Leu Gly Cys Gly Ser Trp Gly Gly Asn Ser Val Ser Glu Asn Val
420 425 430
Gly Pro Lys His Leu Leu Asn Ile Lys Ser Val Ala Glu Arg Arg Glu
435 440 445
Asn Met Leu Trp Phe Arg Val Pro Glu Lys Val Tyr Phe Lys Tyr Gly
450 455 460
Ser Leu Gly Val Ala Leu Lys Glu Leu Asp Ile Leu Asp Lys Lys Lys
465 470 475 480
Val Phe Ile Val Thr Asp Lys Val Leu Tyr Gln Leu Gly Tyr Ile Asp
485 490 495
Arg Val Thr Lys Ile Leu Glu Glu Leu Lys Ile Ser Tyr Lys Ile Phe
500 505 510
Thr Asp Val Glu Pro Asp Pro Thr Leu Ala Thr Ala Lys Lys Gly Ala
515 520 525
Glu Glu Leu Leu Ser Phe Asn Pro Asp Thr Ile Ile Ala Val Gly Gly
530 535 540
Gly Ser Ala Met Asp Ala Ala Lys Ile Met Trp Val Met Tyr Glu His
545 550 555 560
Pro Glu Val Arg Phe Glu Asp Leu Ala Met Arg Phe Met Asp Ile Arg
565 570 575
Lys Arg Val Tyr Thr Phe Pro Lys Met Gly Glu Lys Ala Met Met Ile
580 585 590
Ser Val Ala Thr Ser Ala Gly Thr Gly Ser Glu Val Thr Pro Phe Ala
595 600 605
Val Ile Thr Asp Glu Lys Thr Gly Ala Lys Tyr Pro Leu Ala Asp Tyr
610 615 620
Glu Leu Thr Pro Asn Met Ala Ile Ile Asp Ala Glu Leu Met Met Gly
625 630 635 640
Met Pro Lys Gly Leu Thr Ala Ala Ser Gly Ile Asp Ala Leu Thr His
645 650 655
Ala Ile Glu Ala Tyr Val Ser Ile Met Ala Ser Glu Tyr Thr Asn Gly
660 665 670
Leu Ala Leu Glu Ala Ile Arg Leu Ile Phe Lys Tyr Leu Pro Ile Ala
675 680 685
Tyr Ser Glu Gly Thr Thr Ser Ile Lys Ala Arg Glu Lys Met Ala His
690 695 700
Ala Ser Thr Ile Ala Gly Met Ala Phe Ala Asn Ala Phe Leu Gly Val
705 710 715 720
Cys His Ser Met Ala His Lys Leu Gly Ser Thr His His Val Pro His
725 730 735
Gly Ile Ala Asn Ala Leu Leu Ile Asn Glu Val Ile Lys Phe Asn Ala
740 745 750
Val Glu Asn Pro Arg Lys Gln Ala Ala Phe Pro Gln Tyr Lys Tyr Pro
755 760 765
Asn Ile Lys Lys Arg Tyr Ala Arg Ile Ala Asp Tyr Leu Asn Leu Gly
770 775 780
Gly Ser Thr Asp Asp Glu Lys Val Gln Leu Leu Ile Asn Ala Ile Asp
785 790 795 800
Glu Leu Lys Ala Lys Ile Asn Ile Pro Glu Ser Ile Lys Glu Ala Gly
805 810 815
Val Thr Glu Glu Lys Phe Tyr Ala Thr Leu Asp Lys Met Ser Glu Leu
820 825 830
Ala Phe Asp Asp Gln Cys Thr Gly Ala Asn Pro Arg Tyr Pro Leu Ile
835 840 845
Ser Glu Ile Lys Gln Met Tyr Val Asn Ala Phe
850 855
<210> 141
<211> 1401
<212> DNA
<213> 大肠杆菌
<400> 141
atgccacatt cctacgatta cgatgccata gtaataggtt ccggccccgg cggcgaaggc 60
gctgcaatgg gcctggttaa gcaaggtgcg cgcgtcgcag ttatcgagcg ttatcaaaat 120
gttggcggcg gttgcaccca ctggggcacc atcccgtcga aagctctccg tcacgccgtc 180
agccgcatta tagaattcaa tcaaaaccca ctttacagcg accattcccg actgctccgc 240
tcttcttttg ccgatatcct taaccatgcc gataacgtga ttaatcaaca aacgcgcatg 300
cgtcagggat tttacgaacg taatcactgt gaaatattgc agggaaacgc tcgctttgtt 360
gacgagcata cgttggcgct ggattgcccg gacggcagcg ttgaaacact aaccgctgaa 420
aaatttgtta ttgcctgcgg ctctcgtcca tatcatccaa cagatgttga tttcacccat 480
ccacgcattt acgacagcga ctcaattctc agcatgcacc acgaaccgcg ccatgtactt 540
atctatggtg ctggagtgat cggctgtgaa tatgcgtcga tcttccgcgg tatggatgta 600
aaagtggatc tgatcaacac ccgcgatcgc ctgctggcat ttctcgatca agagatgtca 660
gattctctct cctatcactt ctggaacagt ggcgtagtga ttcgtcacaa cgaagagtac 720
gagaagatcg aaggctgtga cgatggtgtg atcatgcatc tgaagtcggg taaaaaactg 780
aaagctgact gcctgctcta tgccaacggt cgcaccggta ataccgattc gctggcgtta 840
cagaacattg ggctagaaac tgacagccgc ggacagctga aggtcaacag catgtatcag 900
accgcacagc cacacgttta cgcggtgggc gacgtgattg gttatccgag cctggcgtcg 960
gcggcctatg accaggggcg cattgccgcg caggcgctgg taaaaggcga agccaccgca 1020
catctgattg aagatatccc taccggtatt tacaccatcc cggaaatcag ctctgtgggc 1080
aaaaccgaac agcagctgac cgcaatgaaa gtgccatatg aagtgggccg cgcccagttt 1140
aaacatctgg cacgcgcaca aatcgtcggc atgaacgtgg gcacgctgaa aattttgttc 1200
catcgggaaa caaaagagat tctgggtatt cactgctttg gcgagcgcgc tgccgaaatt 1260
attcatatcg gtcaggcgat tatggaacag aaaggtggcg gcaacactat tgagtacttc 1320
gtcaacacca cctttaacta cccgacgatg gcggaagcct atcgggtagc tgcgttaaac 1380
ggtttaaacc gcctgtttta a 1401
<210> 142
<211> 466
<212> PRT
<213> 大肠杆菌
<400> 142
Met Pro His Ser Tyr Asp Tyr Asp Ala Ile Val Ile Gly Ser Gly Pro
1 5 10 15
Gly Gly Glu Gly Ala Ala Met Gly Leu Val Lys Gln Gly Ala Arg Val
20 25 30
Ala Val Ile Glu Arg Tyr Gln Asn Val Gly Gly Gly Cys Thr His Trp
35 40 45
Gly Thr Ile Pro Ser Lys Ala Leu Arg His Ala Val Ser Arg Ile Ile
50 55 60
Glu Phe Asn Gln Asn Pro Leu Tyr Ser Asp His Ser Arg Leu Leu Arg
65 70 75 80
Ser Ser Phe Ala Asp Ile Leu Asn His Ala Asp Asn Val Ile Asn Gln
85 90 95
Gln Thr Arg Met Arg Gln Gly Phe Tyr Glu Arg Asn His Cys Glu Ile
100 105 110
Leu Gln Gly Asn Ala Arg Phe Val Asp Glu His Thr Leu Ala Leu Asp
115 120 125
Cys Pro Asp Gly Ser Val Glu Thr Leu Thr Ala Glu Lys Phe Val Ile
130 135 140
Ala Cys Gly Ser Arg Pro Tyr His Pro Thr Asp Val Asp Phe Thr His
145 150 155 160
Pro Arg Ile Tyr Asp Ser Asp Ser Ile Leu Ser Met His His Glu Pro
165 170 175
Arg His Val Leu Ile Tyr Gly Ala Gly Val Ile Gly Cys Glu Tyr Ala
180 185 190
Ser Ile Phe Arg Gly Met Asp Val Lys Val Asp Leu Ile Asn Thr Arg
195 200 205
Asp Arg Leu Leu Ala Phe Leu Asp Gln Glu Met Ser Asp Ser Leu Ser
210 215 220
Tyr His Phe Trp Asn Ser Gly Val Val Ile Arg His Asn Glu Glu Tyr
225 230 235 240
Glu Lys Ile Glu Gly Cys Asp Asp Gly Val Ile Met His Leu Lys Ser
245 250 255
Gly Lys Lys Leu Lys Ala Asp Cys Leu Leu Tyr Ala Asn Gly Arg Thr
260 265 270
Gly Asn Thr Asp Ser Leu Ala Leu Gln Asn Ile Gly Leu Glu Thr Asp
275 280 285
Ser Arg Gly Gln Leu Lys Val Asn Ser Met Tyr Gln Thr Ala Gln Pro
290 295 300
His Val Tyr Ala Val Gly Asp Val Ile Gly Tyr Pro Ser Leu Ala Ser
305 310 315 320
Ala Ala Tyr Asp Gln Gly Arg Ile Ala Ala Gln Ala Leu Val Lys Gly
325 330 335
Glu Ala Thr Ala His Leu Ile Glu Asp Ile Pro Thr Gly Ile Tyr Thr
340 345 350
Ile Pro Glu Ile Ser Ser Val Gly Lys Thr Glu Gln Gln Leu Thr Ala
355 360 365
Met Lys Val Pro Tyr Glu Val Gly Arg Ala Gln Phe Lys His Leu Ala
370 375 380
Arg Ala Gln Ile Val Gly Met Asn Val Gly Thr Leu Lys Ile Leu Phe
385 390 395 400
His Arg Glu Thr Lys Glu Ile Leu Gly Ile His Cys Phe Gly Glu Arg
405 410 415
Ala Ala Glu Ile Ile His Ile Gly Gln Ala Ile Met Glu Gln Lys Gly
420 425 430
Gly Gly Asn Thr Ile Glu Tyr Phe Val Asn Thr Thr Phe Asn Tyr Pro
435 440 445
Thr Met Ala Glu Ala Tyr Arg Val Ala Ala Leu Asn Gly Leu Asn Arg
450 455 460
Leu Phe
465
<210> 143
<211> 1323
<212> DNA
<213> 大肠杆菌
<400> 143
atgcaagcct attttgacca gctcgatcgc gttcgttatg aaggctcaaa atcctcaaac 60
ccgttagcat tccgtcacta caatcccgac gaactggtgt tgggtaagcg tatggaagag 120
cacttgcgtt ttgccgcctg ctactggcac accttctgct ggaacggggc ggatatgttt 180
ggtgtggggg cgtttaatcg tccgtggcag cagcctggtg aggcactggc gttggcgaag 240
cgtaaagcag atgtcgcatt tgagtttttc cacaagttac atgtgccatt ttattgcttc 300
cacgatgtgg atgtttcccc tgagggcgcg tcgttaaaag agtacatcaa taattttgcg 360
caaatggttg atgtcctggc aggcaagcaa gaagagagcg gcgtgaagct gctgtgggga 420
acggccaact gctttacaaa ccctcgctac ggcgcgggtg cggcgacgaa cccagatcct 480
gaagtcttca gctgggcggc aacgcaagtt gttacagcga tggaagcaac ccataaattg 540
ggcggtgaaa actatgtcct gtggggcggt cgtgaaggtt acgaaacgct gttaaatacc 600
gacttgcgtc aggagcgtga acaactgggc cgctttatgc agatggtggt tgagcataaa 660
cataaaatcg gtttccaggg cacgttgctt atcgaaccga aaccgcaaga accgaccaaa 720
catcaatatg attacgatgc cgcgacggtc tatggcttcc tgaaacagtt tggtctggaa 780
aaagagatta aactgaacat tgaagctaac cacgcgacgc tggcaggtca ctctttccat 840
catgaaatag ccaccgccat tgcgcttggc ctgttcggtt ctgtcgacgc caaccgtggc 900
gatgcgcaac tgggctggga caccgaccag ttcccgaaca gtgtggaaga gaatgcgctg 960
gtgatgtatg aaattctcaa agcaggcggt ttcaccaccg gtggtctgaa cttcgatgcc 1020
aaagtacgtc gtcaaagtac tgataaatat gatctgtttt acggtcatat cggcgcgatg 1080
gatacgatgg cactggcgct gaaaattgca gcgcgcatga ttgaagatgg cgagctggat 1140
aaacgcatcg cgcagcgtta ttccggctgg aatagcgaat tgggccagca aatcctgaaa 1200
ggccaaatgt cactggcaga tttagccaaa tatgctcagg aacatcattt gtctccggtg 1260
catcagagtg gtcgccagga acaactggaa aatctggtaa accattatct gttcgacaaa 1320
taa 1323
<210> 144
<211> 440
<212> PRT
<213> 大肠杆菌
<400> 144
Met Gln Ala Tyr Phe Asp Gln Leu Asp Arg Val Arg Tyr Glu Gly Ser
1 5 10 15
Lys Ser Ser Asn Pro Leu Ala Phe Arg His Tyr Asn Pro Asp Glu Leu
20 25 30
Val Leu Gly Lys Arg Met Glu Glu His Leu Arg Phe Ala Ala Cys Tyr
35 40 45
Trp His Thr Phe Cys Trp Asn Gly Ala Asp Met Phe Gly Val Gly Ala
50 55 60
Phe Asn Arg Pro Trp Gln Gln Pro Gly Glu Ala Leu Ala Leu Ala Lys
65 70 75 80
Arg Lys Ala Asp Val Ala Phe Glu Phe Phe His Lys Leu His Val Pro
85 90 95
Phe Tyr Cys Phe His Asp Val Asp Val Ser Pro Glu Gly Ala Ser Leu
100 105 110
Lys Glu Tyr Ile Asn Asn Phe Ala Gln Met Val Asp Val Leu Ala Gly
115 120 125
Lys Gln Glu Glu Ser Gly Val Lys Leu Leu Trp Gly Thr Ala Asn Cys
130 135 140
Phe Thr Asn Pro Arg Tyr Gly Ala Gly Ala Ala Thr Asn Pro Asp Pro
145 150 155 160
Glu Val Phe Ser Trp Ala Ala Thr Gln Val Val Thr Ala Met Glu Ala
165 170 175
Thr His Lys Leu Gly Gly Glu Asn Tyr Val Leu Trp Gly Gly Arg Glu
180 185 190
Gly Tyr Glu Thr Leu Leu Asn Thr Asp Leu Arg Gln Glu Arg Glu Gln
195 200 205
Leu Gly Arg Phe Met Gln Met Val Val Glu His Lys His Lys Ile Gly
210 215 220
Phe Gln Gly Thr Leu Leu Ile Glu Pro Lys Pro Gln Glu Pro Thr Lys
225 230 235 240
His Gln Tyr Asp Tyr Asp Ala Ala Thr Val Tyr Gly Phe Leu Lys Gln
245 250 255
Phe Gly Leu Glu Lys Glu Ile Lys Leu Asn Ile Glu Ala Asn His Ala
260 265 270
Thr Leu Ala Gly His Ser Phe His His Glu Ile Ala Thr Ala Ile Ala
275 280 285
Leu Gly Leu Phe Gly Ser Val Asp Ala Asn Arg Gly Asp Ala Gln Leu
290 295 300
Gly Trp Asp Thr Asp Gln Phe Pro Asn Ser Val Glu Glu Asn Ala Leu
305 310 315 320
Val Met Tyr Glu Ile Leu Lys Ala Gly Gly Phe Thr Thr Gly Gly Leu
325 330 335
Asn Phe Asp Ala Lys Val Arg Arg Gln Ser Thr Asp Lys Tyr Asp Leu
340 345 350
Phe Tyr Gly His Ile Gly Ala Met Asp Thr Met Ala Leu Ala Leu Lys
355 360 365
Ile Ala Ala Arg Met Ile Glu Asp Gly Glu Leu Asp Lys Arg Ile Ala
370 375 380
Gln Arg Tyr Ser Gly Trp Asn Ser Glu Leu Gly Gln Gln Ile Leu Lys
385 390 395 400
Gly Gln Met Ser Leu Ala Asp Leu Ala Lys Tyr Ala Gln Glu His His
405 410 415
Leu Ser Pro Val His Gln Ser Gly Arg Gln Glu Gln Leu Glu Asn Leu
420 425 430
Val Asn His Tyr Leu Phe Asp Lys
435 440
<210> 145
<211> 1455
<212> DNA
<213> 大肠杆菌
<400> 145
atgtatatcg ggatagatct tggcacctcg ggcgtaaaag ttattttgct caacgagcag 60
ggtgaggtgg ttgctgcgca aacggaaaag ctgaccgttt cgcgcccgca tccactctgg 120
tcggaacaag acccggaaca gtggtggcag gcaactgatc gcgcaatgaa agctctgggc 180
gatcagcatt ctctgcagga cgttaaagca ttgggtattg ccggccagat gcacggagca 240
accttgctgg atgctcagca acgggtgtta cgccctgcca ttttgtggaa cgacgggcgc 300
tgtgcgcaag agtgcacttt gctggaagcg cgagttccgc aatcgcgggt gattaccggc 360
aacctgatga tgcccggatt tactgcgcct aaattgctat gggttcagcg gcatgagccg 420
gagatattcc gtcaaatcga caaagtatta ttaccgaaag attacttgcg tctgcgtatg 480
acgggggagt ttgccagcga tatgtctgac gcagctggca ccatgtggct ggatgtcgca 540
aagcgtgact ggagtgacgt catgctgcag gcttgcgact tatctcgtga ccagatgccc 600
gcattatacg aaggcagcga aattactggt gctttgttac ctgaagttgc gaaagcgtgg 660
ggtatggcga cggtgccagt tgtcgcaggc ggtggcgaca atgcagctgg tgcagttggt 720
gtgggaatgg ttgatgctaa tcaggcaatg ttatcgctgg ggacgtcggg ggtctatttt 780
gctgtcagcg aagggttctt aagcaagcca gaaagcgccg tacatagctt ttgccatgcg 840
ctaccgcaac gttggcattt aatgtctgtg atgctgagtg cagcgtcgtg tctggattgg 900
gccgcgaaat taaccggcct gagcaatgtc ccagctttaa tcgctgcagc tcaacaggct 960
gatgaaagtg ccgagccagt ttggtttctg ccttatcttt ccggcgagcg tacgccacac 1020
aataatcccc aggcgaaggg ggttttcttt ggtttgactc atcaacatgg ccccaatgaa 1080
ctggcgcgag cagtgctgga aggcgtgggt tatgcgctgg cagatggcat ggatgtcgtg 1140
catgcctgcg gtattaaacc gcaaagtgtt acgttgattg ggggcggggc gcgtagtgag 1200
tactggcgtc agatgctggc ggatatcagc ggtcagcagc tcgattaccg tacggggggg 1260
gatgtggggc cagcactggg cgcagcaagg ctggcgcaga tcgcggcgaa tccagagaaa 1320
tcgctcattg aattgttgcc gcaactaccg ttagaacagt cgcatctacc agatgcgcag 1380
cgttatgccg cttatcagcc acgacgagaa acgttccgtc gcctctatca gcaacttctg 1440
ccattaatgg cgtaa 1455
<210> 146
<211> 484
<212> PRT
<213> 大肠杆菌
<400> 146
Met Tyr Ile Gly Ile Asp Leu Gly Thr Ser Gly Val Lys Val Ile Leu
1 5 10 15
Leu Asn Glu Gln Gly Glu Val Val Ala Ala Gln Thr Glu Lys Leu Thr
20 25 30
Val Ser Arg Pro His Pro Leu Trp Ser Glu Gln Asp Pro Glu Gln Trp
35 40 45
Trp Gln Ala Thr Asp Arg Ala Met Lys Ala Leu Gly Asp Gln His Ser
50 55 60
Leu Gln Asp Val Lys Ala Leu Gly Ile Ala Gly Gln Met His Gly Ala
65 70 75 80
Thr Leu Leu Asp Ala Gln Gln Arg Val Leu Arg Pro Ala Ile Leu Trp
85 90 95
Asn Asp Gly Arg Cys Ala Gln Glu Cys Thr Leu Leu Glu Ala Arg Val
100 105 110
Pro Gln Ser Arg Val Ile Thr Gly Asn Leu Met Met Pro Gly Phe Thr
115 120 125
Ala Pro Lys Leu Leu Trp Val Gln Arg His Glu Pro Glu Ile Phe Arg
130 135 140
Gln Ile Asp Lys Val Leu Leu Pro Lys Asp Tyr Leu Arg Leu Arg Met
145 150 155 160
Thr Gly Glu Phe Ala Ser Asp Met Ser Asp Ala Ala Gly Thr Met Trp
165 170 175
Leu Asp Val Ala Lys Arg Asp Trp Ser Asp Val Met Leu Gln Ala Cys
180 185 190
Asp Leu Ser Arg Asp Gln Met Pro Ala Leu Tyr Glu Gly Ser Glu Ile
195 200 205
Thr Gly Ala Leu Leu Pro Glu Val Ala Lys Ala Trp Gly Met Ala Thr
210 215 220
Val Pro Val Val Ala Gly Gly Gly Asp Asn Ala Ala Gly Ala Val Gly
225 230 235 240
Val Gly Met Val Asp Ala Asn Gln Ala Met Leu Ser Leu Gly Thr Ser
245 250 255
Gly Val Tyr Phe Ala Val Ser Glu Gly Phe Leu Ser Lys Pro Glu Ser
260 265 270
Ala Val His Ser Phe Cys His Ala Leu Pro Gln Arg Trp His Leu Met
275 280 285
Ser Val Met Leu Ser Ala Ala Ser Cys Leu Asp Trp Ala Ala Lys Leu
290 295 300
Thr Gly Leu Ser Asn Val Pro Ala Leu Ile Ala Ala Ala Gln Gln Ala
305 310 315 320
Asp Glu Ser Ala Glu Pro Val Trp Phe Leu Pro Tyr Leu Ser Gly Glu
325 330 335
Arg Thr Pro His Asn Asn Pro Gln Ala Lys Gly Val Phe Phe Gly Leu
340 345 350
Thr His Gln His Gly Pro Asn Glu Leu Ala Arg Ala Val Leu Glu Gly
355 360 365
Val Gly Tyr Ala Leu Ala Asp Gly Met Asp Val Val His Ala Cys Gly
370 375 380
Ile Lys Pro Gln Ser Val Thr Leu Ile Gly Gly Gly Ala Arg Ser Glu
385 390 395 400
Tyr Trp Arg Gln Met Leu Ala Asp Ile Ser Gly Gln Gln Leu Asp Tyr
405 410 415
Arg Thr Gly Gly Asp Val Gly Pro Ala Leu Gly Ala Ala Arg Leu Ala
420 425 430
Gln Ile Ala Ala Asn Pro Glu Lys Ser Leu Ile Glu Leu Leu Pro Gln
435 440 445
Leu Pro Leu Glu Gln Ser His Leu Pro Asp Ala Gln Arg Tyr Ala Ala
450 455 460
Tyr Gln Pro Arg Arg Glu Thr Phe Arg Arg Leu Tyr Gln Gln Leu Leu
465 470 475 480
Pro Leu Met Ala
<210> 147
<211> 1992
<212> DNA
<213> 大肠杆菌
<400> 147
atgtcctcac gtaaagagct tgccaatgct attcgtgcgc tgagcatgga cgcagtacag 60
aaagccaaat ccggtcaccc gggtgcccct atgggtatgg ctgacattgc cgaagtcctg 120
tggcgtgatt tcctgaaaca caacccgcag aatccgtcct gggctgaccg tgaccgcttc 180
gtgctgtcca acggccacgg ctccatgctg atctacagcc tgctgcacct caccggttac 240
gatctgccga tggaagaact gaaaaacttc cgtcagctgc actctaaaac tccgggtcac 300
ccggaagtgg gttacaccgc tggtgtggaa accaccaccg gtccgctggg tcagggtatt 360
gccaacgcag tcggtatggc gattgcagaa aaaacgctgg cggcgcagtt taaccgtccg 420
ggccacgaca ttgtcgacca ctacacctac gccttcatgg gcgacggctg catgatggaa 480
ggcatctccc acgaagtttg ctctctggcg ggtacgctga agctgggtaa actgattgca 540
ttctacgatg acaacggtat ttctatcgat ggtcacgttg aaggctggtt caccgacgac 600
accgcaatgc gtttcgaagc ttacggctgg cacgttattc gcgacatcga cggtcatgac 660
gcggcatcta tcaaacgcgc agtagaagaa gcgcgcgcag tgactgacaa accttccctg 720
ctgatgtgca aaaccatcat cggtttcggt tccccgaaca aagccggtac ccacgactcc 780
cacggtgcgc cgctgggcga cgctgaaatt gccctgaccc gcgaacaact gggctggaaa 840
tatgcgccgt tcgaaatccc gtctgaaatc tatgctcagt gggatgcgaa agaagcaggc 900
caggcgaaag aatccgcatg gaacgagaaa ttcgctgctt acgcgaaagc ttatccgcag 960
gaagccgctg aatttacccg ccgtatgaaa ggcgaaatgc cgtctgactt cgacgctaaa 1020
gcgaaagagt tcatcgctaa actgcaggct aatccggcga aaatcgccag ccgtaaagcg 1080
tctcagaatg ctatcgaagc gttcggtccg ctgttgccgg aattcctcgg cggttctgct 1140
gacctggcgc cgtctaacct gaccctgtgg tctggttcta aagcaatcaa cgaagatgct 1200
gcgggtaact acatccacta cggtgttcgc gagttcggta tgaccgcgat tgctaacggt 1260
atctccctgc acggtggctt cctgccgtac acctccacct tcctgatgtt cgtggaatac 1320
gcacgtaacg ccgtacgtat ggctgcgctg atgaaacagc gtcaggtgat ggtttacacc 1380
cacgactcca tcggtctggg cgaagacggc ccgactcacc agccggttga gcaggtcgct 1440
tctctgcgcg taaccccgaa catgtctaca tggcgtccgt gtgaccaggt tgaatccgcg 1500
gtcgcgtgga aatacggtgt tgagcgtcag gacggcccga ccgcactgat cctctcccgt 1560
cagaacctgg cgcagcagga acgaactgaa gagcaactgg caaacatcgc gcgcggtggt 1620
tatgtgctga aagactgcgc cggtcagccg gaactgattt tcatcgctac cggttcagaa 1680
gttgaactgg ctgttgctgc ctacgaaaaa ctgactgccg aaggcgtgaa agcgcgcgtg 1740
gtgtccatgc cgtctaccga cgcatttgac aagcaggatg ctgcttaccg tgaatccgta 1800
ctgccgaaag cggttactgc acgcgttgct gtagaagcgg gtattgctga ctactggtac 1860
aagtatgttg gcctgaacgg tgctatcgtc ggtatgacca ccttcggtga atctgctccg 1920
gcagagctgc tgtttgaaga gttcggcttc actgttgata acgttgttgc gaaagcaaaa 1980
gaactgctgt aa 1992
<210> 148
<211> 663
<212> PRT
<213> 大肠杆菌
<400> 148
Met Ser Ser Arg Lys Glu Leu Ala Asn Ala Ile Arg Ala Leu Ser Met
1 5 10 15
Asp Ala Val Gln Lys Ala Lys Ser Gly His Pro Gly Ala Pro Met Gly
20 25 30
Met Ala Asp Ile Ala Glu Val Leu Trp Arg Asp Phe Leu Lys His Asn
35 40 45
Pro Gln Asn Pro Ser Trp Ala Asp Arg Asp Arg Phe Val Leu Ser Asn
50 55 60
Gly His Gly Ser Met Leu Ile Tyr Ser Leu Leu His Leu Thr Gly Tyr
65 70 75 80
Asp Leu Pro Met Glu Glu Leu Lys Asn Phe Arg Gln Leu His Ser Lys
85 90 95
Thr Pro Gly His Pro Glu Val Gly Tyr Thr Ala Gly Val Glu Thr Thr
100 105 110
Thr Gly Pro Leu Gly Gln Gly Ile Ala Asn Ala Val Gly Met Ala Ile
115 120 125
Ala Glu Lys Thr Leu Ala Ala Gln Phe Asn Arg Pro Gly His Asp Ile
130 135 140
Val Asp His Tyr Thr Tyr Ala Phe Met Gly Asp Gly Cys Met Met Glu
145 150 155 160
Gly Ile Ser His Glu Val Cys Ser Leu Ala Gly Thr Leu Lys Leu Gly
165 170 175
Lys Leu Ile Ala Phe Tyr Asp Asp Asn Gly Ile Ser Ile Asp Gly His
180 185 190
Val Glu Gly Trp Phe Thr Asp Asp Thr Ala Met Arg Phe Glu Ala Tyr
195 200 205
Gly Trp His Val Ile Arg Asp Ile Asp Gly His Asp Ala Ala Ser Ile
210 215 220
Lys Arg Ala Val Glu Glu Ala Arg Ala Val Thr Asp Lys Pro Ser Leu
225 230 235 240
Leu Met Cys Lys Thr Ile Ile Gly Phe Gly Ser Pro Asn Lys Ala Gly
245 250 255
Thr His Asp Ser His Gly Ala Pro Leu Gly Asp Ala Glu Ile Ala Leu
260 265 270
Thr Arg Glu Gln Leu Gly Trp Lys Tyr Ala Pro Phe Glu Ile Pro Ser
275 280 285
Glu Ile Tyr Ala Gln Trp Asp Ala Lys Glu Ala Gly Gln Ala Lys Glu
290 295 300
Ser Ala Trp Asn Glu Lys Phe Ala Ala Tyr Ala Lys Ala Tyr Pro Gln
305 310 315 320
Glu Ala Ala Glu Phe Thr Arg Arg Met Lys Gly Glu Met Pro Ser Asp
325 330 335
Phe Asp Ala Lys Ala Lys Glu Phe Ile Ala Lys Leu Gln Ala Asn Pro
340 345 350
Ala Lys Ile Ala Ser Arg Lys Ala Ser Gln Asn Ala Ile Glu Ala Phe
355 360 365
Gly Pro Leu Leu Pro Glu Phe Leu Gly Gly Ser Ala Asp Leu Ala Pro
370 375 380
Ser Asn Leu Thr Leu Trp Ser Gly Ser Lys Ala Ile Asn Glu Asp Ala
385 390 395 400
Ala Gly Asn Tyr Ile His Tyr Gly Val Arg Glu Phe Gly Met Thr Ala
405 410 415
Ile Ala Asn Gly Ile Ser Leu His Gly Gly Phe Leu Pro Tyr Thr Ser
420 425 430
Thr Phe Leu Met Phe Val Glu Tyr Ala Arg Asn Ala Val Arg Met Ala
435 440 445
Ala Leu Met Lys Gln Arg Gln Val Met Val Tyr Thr His Asp Ser Ile
450 455 460
Gly Leu Gly Glu Asp Gly Pro Thr His Gln Pro Val Glu Gln Val Ala
465 470 475 480
Ser Leu Arg Val Thr Pro Asn Met Ser Thr Trp Arg Pro Cys Asp Gln
485 490 495
Val Glu Ser Ala Val Ala Trp Lys Tyr Gly Val Glu Arg Gln Asp Gly
500 505 510
Pro Thr Ala Leu Ile Leu Ser Arg Gln Asn Leu Ala Gln Gln Glu Arg
515 520 525
Thr Glu Glu Gln Leu Ala Asn Ile Ala Arg Gly Gly Tyr Val Leu Lys
530 535 540
Asp Cys Ala Gly Gln Pro Glu Leu Ile Phe Ile Ala Thr Gly Ser Glu
545 550 555 560
Val Glu Leu Ala Val Ala Ala Tyr Glu Lys Leu Thr Ala Glu Gly Val
565 570 575
Lys Ala Arg Val Val Ser Met Pro Ser Thr Asp Ala Phe Asp Lys Gln
580 585 590
Asp Ala Ala Tyr Arg Glu Ser Val Leu Pro Lys Ala Val Thr Ala Arg
595 600 605
Val Ala Val Glu Ala Gly Ile Ala Asp Tyr Trp Tyr Lys Tyr Val Gly
610 615 620
Leu Asn Gly Ala Ile Val Gly Met Thr Thr Phe Gly Glu Ser Ala Pro
625 630 635 640
Ala Glu Leu Leu Phe Glu Glu Phe Gly Phe Thr Val Asp Asn Val Val
645 650 655
Ala Lys Ala Lys Glu Leu Leu
660
<210> 149
<211> 2004
<212> DNA
<213> 大肠杆菌
<400> 149
atgtcccgaa aagaccttgc caatgcgatt cgcgcactca gtatggatgc ggtacaaaaa 60
gccaactctg gtcatcccgg cgcgccgatg ggcatggctg atattgccga agtgctgtgg 120
aacgattttc ttaaacataa ccctaccgac ccaacctggt atgatcgcga ccgctttatt 180
ctttccaacg gtcacgcgtc gatgctgctc tacagtttgc tacatctgac cggttacgac 240
ctgccgctgg aagaactgaa gaacttccgt cagttgcatt cgaaaacccc aggccacccg 300
gagattggct atacgccagg cgttgaaacc accaccggcc cgcttggaca aggtttggcg 360
aacgccgtcg ggctggcgat agcagagcgt acactggcgg cgcagtttaa ccagccagac 420
catgagatcg tcgatcactt cacctatgtg tttatgggcg acggctgcct gatggaaggt 480
atttcccacg aagtctgttc gctggcaggc acgctgggac tgggcaagct gattggtttt 540
tacgatcaca acggtatttc catcgacggt gaaacagaag gctggtttac cgacgatacg 600
gcaaaacgtt ttgaagccta tcactggcat gtgatccatg aaatcgacgg tcacgatccg 660
caggcggtga aggaagcgat ccttgaagcg caaagcgtga aagataagcc gtcgctgatt 720
atctgccgta cggtgattgg ctttggttcg ccgaataaag caggtaagga agaggcgcac 780
ggcgcaccac tgggggaaga agaagtggcg ctggcacggc aaaaactggg ctggcaccat 840
ccgccatttg agatccctaa agagatttat cacgcctggg atgcccgtga aaaaggcgaa 900
aaagcgcagc agagctggaa tgagaagttt gccgcctata aaaaggctca tccgcaactg 960
gcagaagagt ttacccgacg gatgagcggt ggtttaccga aggactggga gaaaacgact 1020
cagaaatata tcaatgagtt acaggcaaat ccggcgaaaa tcgctacccg taaggcttcg 1080
caaaatacgc ttaacgctta cgggccgatg ctgcctgagt tgctcggcgg ttcggcggat 1140
ctggctccca gcaacctgac catctggaaa ggttctgttt cgctgaagga agatccagcg 1200
ggcaactaca ttcactacgg ggtgcgtgaa tttggcatga ccgctatcgc caacggcatc 1260
gcgcaccacg gcggctttgt gccgtatacc gcgacgttcc tgatgtttgt tgaatacgcc 1320
cgtaacgccg cgcggatggc ggcactgatg aaagcgcggc agattatggt ttatacccac 1380
gactcaattg gcctgggcga agatggtccg acgcaccagg ctgttgagca actggccagc 1440
ctgcgcttaa cgccaaattt cagcacctgg cgaccgtgcg atcaggtgga agcggcggtg 1500
ggctggaagc tggcggttga gcgccacaac ggaccgacgg cactgatcct ctcaaggcag 1560
aatctggccc aggtggaacg tacgccggat caggttaaag agattgctcg tggcggttat 1620
gtgctgaaag acagcggcgg taagccagat attattctga ttgccaccgg ttcagagatg 1680
gaaattaccc tgcaagcggc agagaaatta gcaggagaag gtcgcaatgt acgcgtagtt 1740
tccctgccct cgaccgatat tttcgacgcc caggatgagg aatatcggga gtcggtgttg 1800
ccttctaacg ttgcggctcg cgtggcggtg gaagcaggta ttgccgatta ctggtacaag 1860
tatgttggtc tgaaaggggc aattgtcggg atgacgggtt acggggaatc tgctccggcg 1920
gataagctgt tcccgttctt tggctttacc gccgagaata ttgtggcaaa agcgcataag 1980
gtgctgggag tgaaaggtgc ctga 2004
<210> 150
<211> 667
<212> PRT
<213> 大肠杆菌
<400> 150
Met Ser Arg Lys Asp Leu Ala Asn Ala Ile Arg Ala Leu Ser Met Asp
1 5 10 15
Ala Val Gln Lys Ala Asn Ser Gly His Pro Gly Ala Pro Met Gly Met
20 25 30
Ala Asp Ile Ala Glu Val Leu Trp Asn Asp Phe Leu Lys His Asn Pro
35 40 45
Thr Asp Pro Thr Trp Tyr Asp Arg Asp Arg Phe Ile Leu Ser Asn Gly
50 55 60
His Ala Ser Met Leu Leu Tyr Ser Leu Leu His Leu Thr Gly Tyr Asp
65 70 75 80
Leu Pro Leu Glu Glu Leu Lys Asn Phe Arg Gln Leu His Ser Lys Thr
85 90 95
Pro Gly His Pro Glu Ile Gly Tyr Thr Pro Gly Val Glu Thr Thr Thr
100 105 110
Gly Pro Leu Gly Gln Gly Leu Ala Asn Ala Val Gly Leu Ala Ile Ala
115 120 125
Glu Arg Thr Leu Ala Ala Gln Phe Asn Gln Pro Asp His Glu Ile Val
130 135 140
Asp His Phe Thr Tyr Val Phe Met Gly Asp Gly Cys Leu Met Glu Gly
145 150 155 160
Ile Ser His Glu Val Cys Ser Leu Ala Gly Thr Leu Gly Leu Gly Lys
165 170 175
Leu Ile Gly Phe Tyr Asp His Asn Gly Ile Ser Ile Asp Gly Glu Thr
180 185 190
Glu Gly Trp Phe Thr Asp Asp Thr Ala Lys Arg Phe Glu Ala Tyr His
195 200 205
Trp His Val Ile His Glu Ile Asp Gly His Asp Pro Gln Ala Val Lys
210 215 220
Glu Ala Ile Leu Glu Ala Gln Ser Val Lys Asp Lys Pro Ser Leu Ile
225 230 235 240
Ile Cys Arg Thr Val Ile Gly Phe Gly Ser Pro Asn Lys Ala Gly Lys
245 250 255
Glu Glu Ala His Gly Ala Pro Leu Gly Glu Glu Glu Val Ala Leu Ala
260 265 270
Arg Gln Lys Leu Gly Trp His His Pro Pro Phe Glu Ile Pro Lys Glu
275 280 285
Ile Tyr His Ala Trp Asp Ala Arg Glu Lys Gly Glu Lys Ala Gln Gln
290 295 300
Ser Trp Asn Glu Lys Phe Ala Ala Tyr Lys Lys Ala His Pro Gln Leu
305 310 315 320
Ala Glu Glu Phe Thr Arg Arg Met Ser Gly Gly Leu Pro Lys Asp Trp
325 330 335
Glu Lys Thr Thr Gln Lys Tyr Ile Asn Glu Leu Gln Ala Asn Pro Ala
340 345 350
Lys Ile Ala Thr Arg Lys Ala Ser Gln Asn Thr Leu Asn Ala Tyr Gly
355 360 365
Pro Met Leu Pro Glu Leu Leu Gly Gly Ser Ala Asp Leu Ala Pro Ser
370 375 380
Asn Leu Thr Ile Trp Lys Gly Ser Val Ser Leu Lys Glu Asp Pro Ala
385 390 395 400
Gly Asn Tyr Ile His Tyr Gly Val Arg Glu Phe Gly Met Thr Ala Ile
405 410 415
Ala Asn Gly Ile Ala His His Gly Gly Phe Val Pro Tyr Thr Ala Thr
420 425 430
Phe Leu Met Phe Val Glu Tyr Ala Arg Asn Ala Ala Arg Met Ala Ala
435 440 445
Leu Met Lys Ala Arg Gln Ile Met Val Tyr Thr His Asp Ser Ile Gly
450 455 460
Leu Gly Glu Asp Gly Pro Thr His Gln Ala Val Glu Gln Leu Ala Ser
465 470 475 480
Leu Arg Leu Thr Pro Asn Phe Ser Thr Trp Arg Pro Cys Asp Gln Val
485 490 495
Glu Ala Ala Val Gly Trp Lys Leu Ala Val Glu Arg His Asn Gly Pro
500 505 510
Thr Ala Leu Ile Leu Ser Arg Gln Asn Leu Ala Gln Val Glu Arg Thr
515 520 525
Pro Asp Gln Val Lys Glu Ile Ala Arg Gly Gly Tyr Val Leu Lys Asp
530 535 540
Ser Gly Gly Lys Pro Asp Ile Ile Leu Ile Ala Thr Gly Ser Glu Met
545 550 555 560
Glu Ile Thr Leu Gln Ala Ala Glu Lys Leu Ala Gly Glu Gly Arg Asn
565 570 575
Val Arg Val Val Ser Leu Pro Ser Thr Asp Ile Phe Asp Ala Gln Asp
580 585 590
Glu Glu Tyr Arg Glu Ser Val Leu Pro Ser Asn Val Ala Ala Arg Val
595 600 605
Ala Val Glu Ala Gly Ile Ala Asp Tyr Trp Tyr Lys Tyr Val Gly Leu
610 615 620
Lys Gly Ala Ile Val Gly Met Thr Gly Tyr Gly Glu Ser Ala Pro Ala
625 630 635 640
Asp Lys Leu Phe Pro Phe Phe Gly Phe Thr Ala Glu Asn Ile Val Ala
645 650 655
Lys Ala His Lys Val Leu Gly Val Lys Gly Ala
660 665
<210> 151
<211> 951
<212> DNA
<213> 大肠杆菌
<400> 151
atgaacgagt tagacggcat caaacagttc accactgtcg tggcagacag cggcgatatt 60
gagtccattc gccattatca tccccaggat gccaccacca atccttcgct gttactcaaa 120
gctgccggat tatcacaata tgagcattta atagacgatg ctatcgcctg gggtaaaaaa 180
aatggcaaga cccaggaaca acaggtggtc gcagcgtgtg acaaactggc ggtcaatttc 240
ggtgctgaaa tcctcaaaat cgtacccggt cgcgtgtcaa cagaagttga tgcacgcctc 300
tcttttgata aagaaaagag tattgagaag gcgcgccatc tggtggactt gtatcagcaa 360
caaggcgttg agaaatcacg cattctgatc aagctggctt cgacctggga aggaattcgc 420
gcggcagaag agctggaaaa agaaggtatt aactgcaacc tgacgctgct gttttctttt 480
gcacaggcac gggcctgtgc ggaagcaggc gtttttctga tttcgccgtt tgtcgggcgt 540
atttatgact ggtatcaggc acgcaagccg atggacccgt atgtggtgga agaagatccg 600
ggcgttaaat cggtgcgcaa tatctacgac tactataagc aacaccacta tgaaaccatt 660
gtgatgggcg cgagcttccg tcgcaccgaa caaatcctcg ccttaaccgg ctgcgatcga 720
ctgactatcg caccgaattt actgaaggag ctgcaggaaa aagtttcgcc agtggtacgt 780
aaattaatcc caccttctca gacgttccca cgcccagctc ccatgagcga agcggagttc 840
cgttgggagc acaatcagga tgcgatggcg gtagaaaaac tgtctgaagg cattcgtctg 900
ttcgccgttg atcaacgcaa actggaagat cttcttgccg ccaaactata a 951
<210> 152
<211> 316
<212> PRT
<213> 大肠杆菌
<400> 152
Met Asn Glu Leu Asp Gly Ile Lys Gln Phe Thr Thr Val Val Ala Asp
1 5 10 15
Ser Gly Asp Ile Glu Ser Ile Arg His Tyr His Pro Gln Asp Ala Thr
20 25 30
Thr Asn Pro Ser Leu Leu Leu Lys Ala Ala Gly Leu Ser Gln Tyr Glu
35 40 45
His Leu Ile Asp Asp Ala Ile Ala Trp Gly Lys Lys Asn Gly Lys Thr
50 55 60
Gln Glu Gln Gln Val Val Ala Ala Cys Asp Lys Leu Ala Val Asn Phe
65 70 75 80
Gly Ala Glu Ile Leu Lys Ile Val Pro Gly Arg Val Ser Thr Glu Val
85 90 95
Asp Ala Arg Leu Ser Phe Asp Lys Glu Lys Ser Ile Glu Lys Ala Arg
100 105 110
His Leu Val Asp Leu Tyr Gln Gln Gln Gly Val Glu Lys Ser Arg Ile
115 120 125
Leu Ile Lys Leu Ala Ser Thr Trp Glu Gly Ile Arg Ala Ala Glu Glu
130 135 140
Leu Glu Lys Glu Gly Ile Asn Cys Asn Leu Thr Leu Leu Phe Ser Phe
145 150 155 160
Ala Gln Ala Arg Ala Cys Ala Glu Ala Gly Val Phe Leu Ile Ser Pro
165 170 175
Phe Val Gly Arg Ile Tyr Asp Trp Tyr Gln Ala Arg Lys Pro Met Asp
180 185 190
Pro Tyr Val Val Glu Glu Asp Pro Gly Val Lys Ser Val Arg Asn Ile
195 200 205
Tyr Asp Tyr Tyr Lys Gln His His Tyr Glu Thr Ile Val Met Gly Ala
210 215 220
Ser Phe Arg Arg Thr Glu Gln Ile Leu Ala Leu Thr Gly Cys Asp Arg
225 230 235 240
Leu Thr Ile Ala Pro Asn Leu Leu Lys Glu Leu Gln Glu Lys Val Ser
245 250 255
Pro Val Val Arg Lys Leu Ile Pro Pro Ser Gln Thr Phe Pro Arg Pro
260 265 270
Ala Pro Met Ser Glu Ala Glu Phe Arg Trp Glu His Asn Gln Asp Ala
275 280 285
Met Ala Val Glu Lys Leu Ser Glu Gly Ile Arg Leu Phe Ala Val Asp
290 295 300
Gln Arg Lys Leu Glu Asp Leu Leu Ala Ala Lys Leu
305 310 315
<210> 153
<211> 954
<212> DNA
<213> 大肠杆菌
<400> 153
atgacggaca aattgacctc ccttcgtcag tacaccaccg tagtggccga cactggggac 60
atcgcggcaa tgaagctgta tcaaccgcag gatgccacaa ccaacccttc tctcattctt 120
aacgcagcgc agattccgga ataccgtaag ttgattgatg atgctgtcgc ctgggcgaaa 180
cagcagagca acgatcgcgc gcagcagatc gtggacgcga ccgacaaact ggcagtaaat 240
attggtctgg aaatcctgaa actggttccg ggccgtatct caactgaagt tgatgcgcgt 300
ctttcctatg acaccgaagc gtcaattgcg aaagcaaaac gcctgatcaa actctacaac 360
gatgctggta ttagcaacga tcgtattctg atcaaactgg cttctacctg gcagggtatc 420
cgtgctgcag aacagctgga aaaagaaggc atcaactgta acctgaccct gctgttctcc 480
ttcgctcagg ctcgtgcttg tgcggaagcg ggcgtgttcc tgatctcgcc gtttgttggc 540
cgtattcttg actggtacaa agcgaatacc gataagaaag agtacgctcc ggcagaagat 600
ccgggcgtgg tttctgtatc tgaaatctac cagtactaca aagagcacgg ttatgaaacc 660
gtggttatgg gcgcaagctt ccgtaacatc ggcgaaattc tggaactggc aggctgcgac 720
cgtctgacca tcgcaccggc actgctgaaa gagctggcgg agagcgaagg ggctatcgaa 780
cgtaaactgt cttacaccgg cgaagtgaaa gcgcgtccgg cgcgtatcac tgagtccgag 840
ttcctgtggc agcacaacca ggatccaatg gcagtagata aactggcgga aggtatccgt 900
aagtttgcta ttgaccagga aaaactggaa aaaatgatcg gcgatctgct gtaa 954
<210> 154
<211> 317
<212> PRT
<213> 大肠杆菌
<400> 154
Met Thr Asp Lys Leu Thr Ser Leu Arg Gln Tyr Thr Thr Val Val Ala
1 5 10 15
Asp Thr Gly Asp Ile Ala Ala Met Lys Leu Tyr Gln Pro Gln Asp Ala
20 25 30
Thr Thr Asn Pro Ser Leu Ile Leu Asn Ala Ala Gln Ile Pro Glu Tyr
35 40 45
Arg Lys Leu Ile Asp Asp Ala Val Ala Trp Ala Lys Gln Gln Ser Asn
50 55 60
Asp Arg Ala Gln Gln Ile Val Asp Ala Thr Asp Lys Leu Ala Val Asn
65 70 75 80
Ile Gly Leu Glu Ile Leu Lys Leu Val Pro Gly Arg Ile Ser Thr Glu
85 90 95
Val Asp Ala Arg Leu Ser Tyr Asp Thr Glu Ala Ser Ile Ala Lys Ala
100 105 110
Lys Arg Leu Ile Lys Leu Tyr Asn Asp Ala Gly Ile Ser Asn Asp Arg
115 120 125
Ile Leu Ile Lys Leu Ala Ser Thr Trp Gln Gly Ile Arg Ala Ala Glu
130 135 140
Gln Leu Glu Lys Glu Gly Ile Asn Cys Asn Leu Thr Leu Leu Phe Ser
145 150 155 160
Phe Ala Gln Ala Arg Ala Cys Ala Glu Ala Gly Val Phe Leu Ile Ser
165 170 175
Pro Phe Val Gly Arg Ile Leu Asp Trp Tyr Lys Ala Asn Thr Asp Lys
180 185 190
Lys Glu Tyr Ala Pro Ala Glu Asp Pro Gly Val Val Ser Val Ser Glu
195 200 205
Ile Tyr Gln Tyr Tyr Lys Glu His Gly Tyr Glu Thr Val Val Met Gly
210 215 220
Ala Ser Phe Arg Asn Ile Gly Glu Ile Leu Glu Leu Ala Gly Cys Asp
225 230 235 240
Arg Leu Thr Ile Ala Pro Ala Leu Leu Lys Glu Leu Ala Glu Ser Glu
245 250 255
Gly Ala Ile Glu Arg Lys Leu Ser Tyr Thr Gly Glu Val Lys Ala Arg
260 265 270
Pro Ala Arg Ile Thr Glu Ser Glu Phe Leu Trp Gln His Asn Gln Asp
275 280 285
Pro Met Ala Val Asp Lys Leu Ala Glu Gly Ile Arg Lys Phe Ala Ile
290 295 300
Asp Gln Glu Lys Leu Glu Lys Met Ile Gly Asp Leu Leu
305 310 315
<210> 155
<211> 954
<212> DNA
<213> 大肠杆菌
<400> 155
atgacggaca aattgacctc ccttcgtcag tacaccaccg tagtggccga cactggggac 60
atcgcggcaa tgaagctgta tcaaccgcag gatgccacaa ccaacccttc tctcattctt 120
aacgcagcgc agattccgga ataccgtaag ttgattgatg atgctgtcgc ctgggcgaaa 180
cagcagagca acgatcgcgc gcagcagatc gtggacgcga ccgacaaact ggcagtaaat 240
attggtctgg aaatcctgaa actggttccg ggccgtatct caactgaagt tgatgcgcgt 300
ctttcctatg acaccgaagc gtcaattgcg aaagcaaaac gcctgatcaa actctacaac 360
gatgctggta ttagcaacga tcgtattctg atcaaactgg cttctacctg gcagggtatc 420
cgtgctgcag aacagctgga aaaagaaggc atcaactgta acctgaccct gctgttctcc 480
ttcgctcagg ctcgtgcttg tgcggaagcg ggcgtgttcc tgatctcgcc gtttgttggc 540
cgtattcttg actggtacaa agcgaatacc gataagaaag agtacgctcc ggcagaagat 600
ccgggcgtgg tttctgtatc tgaaatctac cagtactaca aagagcacgg ttatgaaacc 660
gtggttatgg gcgcaagctt ccgtaacatc ggcgaaattc tggaactggc aggctgcgac 720
cgtctgacca tcgcaccggc actgctgaaa gagctggcgg agagcgaagg ggctatcgaa 780
cgtaaactgt cttacaccgg cgaagtgaaa gcgcgtccgg cgcgtatcac tgagtccgag 840
ttcctgtggc agcacaacca ggatccaatg gcagtagata aactggcgga aggtatccgt 900
aagtttgcta ttgaccagga aaaactggaa aaaatgatcg gcgatctgct gtaa 954
<210> 156
<211> 317
<212> PRT
<213> 大肠杆菌
<400> 156
Met Thr Asp Lys Leu Thr Ser Leu Arg Gln Tyr Thr Thr Val Val Ala
1 5 10 15
Asp Thr Gly Asp Ile Ala Ala Met Lys Leu Tyr Gln Pro Gln Asp Ala
20 25 30
Thr Thr Asn Pro Ser Leu Ile Leu Asn Ala Ala Gln Ile Pro Glu Tyr
35 40 45
Arg Lys Leu Ile Asp Asp Ala Val Ala Trp Ala Lys Gln Gln Ser Asn
50 55 60
Asp Arg Ala Gln Gln Ile Val Asp Ala Thr Asp Lys Leu Ala Val Asn
65 70 75 80
Ile Gly Leu Glu Ile Leu Lys Leu Val Pro Gly Arg Ile Ser Thr Glu
85 90 95
Val Asp Ala Arg Leu Ser Tyr Asp Thr Glu Ala Ser Ile Ala Lys Ala
100 105 110
Lys Arg Leu Ile Lys Leu Tyr Asn Asp Ala Gly Ile Ser Asn Asp Arg
115 120 125
Ile Leu Ile Lys Leu Ala Ser Thr Trp Gln Gly Ile Arg Ala Ala Glu
130 135 140
Gln Leu Glu Lys Glu Gly Ile Asn Cys Asn Leu Thr Leu Leu Phe Ser
145 150 155 160
Phe Ala Gln Ala Arg Ala Cys Ala Glu Ala Gly Val Phe Leu Ile Ser
165 170 175
Pro Phe Val Gly Arg Ile Leu Asp Trp Tyr Lys Ala Asn Thr Asp Lys
180 185 190
Lys Glu Tyr Ala Pro Ala Glu Asp Pro Gly Val Val Ser Val Ser Glu
195 200 205
Ile Tyr Gln Tyr Tyr Lys Glu His Gly Tyr Glu Thr Val Val Met Gly
210 215 220
Ala Ser Phe Arg Asn Ile Gly Glu Ile Leu Glu Leu Ala Gly Cys Asp
225 230 235 240
Arg Leu Thr Ile Ala Pro Ala Leu Leu Lys Glu Leu Ala Glu Ser Glu
245 250 255
Gly Ala Ile Glu Arg Lys Leu Ser Tyr Thr Gly Glu Val Lys Ala Arg
260 265 270
Pro Ala Arg Ile Thr Glu Ser Glu Phe Leu Trp Gln His Asn Gln Asp
275 280 285
Pro Met Ala Val Asp Lys Leu Ala Glu Gly Ile Arg Lys Phe Ala Ile
290 295 300
Asp Gln Glu Lys Leu Glu Lys Met Ile Gly Asp Leu Leu
305 310 315
<210> 157
<211> 678
<212> DNA
<213> 大肠杆菌
<400> 157
atgaaacagt atttgattgc cccctcaatt ctgtcggctg attttgcccg cctgggtgaa 60
gataccgcaa aagccctggc agctggcgct gatgtcgtgc attttgacgt catggataac 120
cactatgttc ccaatctgac gattgggcca atggtgctga aatccttgcg taactatggc 180
attaccgccc ctatcgacgt acacctgatg gtgaaacccg tcgatcgcat tgtgcctgat 240
ttcgctgccg ctggtgccag catcattacc tttcatccag aagcctccga gcatgttgac 300
cgcacgctgc aactgattaa agaaaatggc tgtaaagcgg gtctggtatt taacccggcg 360
acacctctga gctatctgga ttacgtgatg gataagctgg atgtgatcct gctgatgtcc 420
gtcaaccctg gtttcggcgg tcagtctttc attcctcaaa cactggataa actgcgcgaa 480
gtacgtcgcc gtatcgacga gtctggcttt gacattcgac tagaagtgga cggtggcgtg 540
aaggtgaaca acattggcga aatcgctgcg gcgggcgcgg atatgttcgt cgccggttcg 600
gcaatcttcg accagccaga ctacaaaaaa gtcattgatg aaatgcgcag tgaactggca 660
aaggtaagtc atgaataa 678
<210> 158
<211> 225
<212> PRT
<213> 大肠杆菌
<400> 158
Met Lys Gln Tyr Leu Ile Ala Pro Ser Ile Leu Ser Ala Asp Phe Ala
1 5 10 15
Arg Leu Gly Glu Asp Thr Ala Lys Ala Leu Ala Ala Gly Ala Asp Val
20 25 30
Val His Phe Asp Val Met Asp Asn His Tyr Val Pro Asn Leu Thr Ile
35 40 45
Gly Pro Met Val Leu Lys Ser Leu Arg Asn Tyr Gly Ile Thr Ala Pro
50 55 60
Ile Asp Val His Leu Met Val Lys Pro Val Asp Arg Ile Val Pro Asp
65 70 75 80
Phe Ala Ala Ala Gly Ala Ser Ile Ile Thr Phe His Pro Glu Ala Ser
85 90 95
Glu His Val Asp Arg Thr Leu Gln Leu Ile Lys Glu Asn Gly Cys Lys
100 105 110
Ala Gly Leu Val Phe Asn Pro Ala Thr Pro Leu Ser Tyr Leu Asp Tyr
115 120 125
Val Met Asp Lys Leu Asp Val Ile Leu Leu Met Ser Val Asn Pro Gly
130 135 140
Phe Gly Gly Gln Ser Phe Ile Pro Gln Thr Leu Asp Lys Leu Arg Glu
145 150 155 160
Val Arg Arg Arg Ile Asp Glu Ser Gly Phe Asp Ile Arg Leu Glu Val
165 170 175
Asp Gly Gly Val Lys Val Asn Asn Ile Gly Glu Ile Ala Ala Ala Gly
180 185 190
Ala Asp Met Phe Val Ala Gly Ser Ala Ile Phe Asp Gln Pro Asp Tyr
195 200 205
Lys Lys Val Ile Asp Glu Met Arg Ser Glu Leu Ala Lys Val Ser His
210 215 220
Glu
225
<210> 159
<211> 1416
<212> DNA
<213> 大肠杆菌
<400> 159
gtgaaacaaa gcactattgc actggcactc ttaccgttac tgtttacccc tgtgacaaaa 60
gcccggacac cagaaatgcc tgttctggaa aaccgggctg ctcagggcga tattactgca 120
cccggcggtg ctcgccgttt aacgggtgat cagactgccg ctctgcgtga ttctcttagc 180
gataaacctg caaaaaatat tattttgctg attggcgatg ggatggggga ctcggaaatt 240
actgccgcac gtaattatgc cgaaggtgcg ggcggctttt ttaaaggtat agatgcctta 300
ccgcttaccg ggcaatacac tcactatgcg ctgaataaaa aaaccggcaa accggactac 360
gtcaccgact cggctgcatc agcaaccgcc tggtcaaccg gtgtcaaaac ctataacggc 420
gcgctgggcg tcgatattca cgaaaaagat cacccaacga ttctggaaat ggcaaaagcc 480
gcaggtctgg cgaccggtaa cgtttctacc gcagagttgc aggatgccac gcccgctgcg 540
ctggtggcac atgtgacctc gcgcaaatgc tacggtccga gcgcgaccag tgaaaaatgt 600
ccgggtaacg ctctggaaaa aggcggaaaa ggatcgatta ccgaacagct gcttaacgct 660
cgtgccgacg ttacgcttgg cggcggcgca aaaacctttg ctgaaacggc aaccgctggt 720
gaatggcagg gaaaaacgct gcgtgaacag gcacaggcgc gtggttatca gttggtgagc 780
gatgctgcct cactgaattc ggtgacggaa gcgaatcagc aaaaacccct gcttggcctg 840
tttgctgacg gcaatatgcc agtgcgctgg ctaggaccga aagcaacgta ccatggcaat 900
atcgataagc ccgcagtcac ctgtacgcca aatccgcaac gtaatgacag tgtaccaacc 960
ctggcgcaga tgaccgacaa agccattgaa ttgttgagta aaaatgagaa aggctttttc 1020
ctgcaagttg aaggtgcgtc aatcgataaa caggatcatg ctgcgaatcc ttgtgggcaa 1080
attggcgaga cggtcgatct cgatgaagcc gtacaacggg cgctggaatt cgctaaaaag 1140
gagggtaaca cgctggtcat agtcaccgct gatcacgccc acgccagcca gattgttgcg 1200
ccggatacca aagctccggg cctcacccag gcgctaaata ccaaagatgg cgcagtgatg 1260
gtgatgagtt acgggaactc cgaagaggat tcacaagaac ataccggcag tcagttgcgt 1320
attgcggcgt atggcccgca tgccgccaat gttgttggac tgaccgacca gaccgatctc 1380
ttctacacca tgaaagccgc tctggggctg aaataa 1416
<210> 160
<211> 471
<212> PRT
<213> 大肠杆菌
<400> 160
Met Lys Gln Ser Thr Ile Ala Leu Ala Leu Leu Pro Leu Leu Phe Thr
1 5 10 15
Pro Val Thr Lys Ala Arg Thr Pro Glu Met Pro Val Leu Glu Asn Arg
20 25 30
Ala Ala Gln Gly Asp Ile Thr Ala Pro Gly Gly Ala Arg Arg Leu Thr
35 40 45
Gly Asp Gln Thr Ala Ala Leu Arg Asp Ser Leu Ser Asp Lys Pro Ala
50 55 60
Lys Asn Ile Ile Leu Leu Ile Gly Asp Gly Met Gly Asp Ser Glu Ile
65 70 75 80
Thr Ala Ala Arg Asn Tyr Ala Glu Gly Ala Gly Gly Phe Phe Lys Gly
85 90 95
Ile Asp Ala Leu Pro Leu Thr Gly Gln Tyr Thr His Tyr Ala Leu Asn
100 105 110
Lys Lys Thr Gly Lys Pro Asp Tyr Val Thr Asp Ser Ala Ala Ser Ala
115 120 125
Thr Ala Trp Ser Thr Gly Val Lys Thr Tyr Asn Gly Ala Leu Gly Val
130 135 140
Asp Ile His Glu Lys Asp His Pro Thr Ile Leu Glu Met Ala Lys Ala
145 150 155 160
Ala Gly Leu Ala Thr Gly Asn Val Ser Thr Ala Glu Leu Gln Asp Ala
165 170 175
Thr Pro Ala Ala Leu Val Ala His Val Thr Ser Arg Lys Cys Tyr Gly
180 185 190
Pro Ser Ala Thr Ser Glu Lys Cys Pro Gly Asn Ala Leu Glu Lys Gly
195 200 205
Gly Lys Gly Ser Ile Thr Glu Gln Leu Leu Asn Ala Arg Ala Asp Val
210 215 220
Thr Leu Gly Gly Gly Ala Lys Thr Phe Ala Glu Thr Ala Thr Ala Gly
225 230 235 240
Glu Trp Gln Gly Lys Thr Leu Arg Glu Gln Ala Gln Ala Arg Gly Tyr
245 250 255
Gln Leu Val Ser Asp Ala Ala Ser Leu Asn Ser Val Thr Glu Ala Asn
260 265 270
Gln Gln Lys Pro Leu Leu Gly Leu Phe Ala Asp Gly Asn Met Pro Val
275 280 285
Arg Trp Leu Gly Pro Lys Ala Thr Tyr His Gly Asn Ile Asp Lys Pro
290 295 300
Ala Val Thr Cys Thr Pro Asn Pro Gln Arg Asn Asp Ser Val Pro Thr
305 310 315 320
Leu Ala Gln Met Thr Asp Lys Ala Ile Glu Leu Leu Ser Lys Asn Glu
325 330 335
Lys Gly Phe Phe Leu Gln Val Glu Gly Ala Ser Ile Asp Lys Gln Asp
340 345 350
His Ala Ala Asn Pro Cys Gly Gln Ile Gly Glu Thr Val Asp Leu Asp
355 360 365
Glu Ala Val Gln Arg Ala Leu Glu Phe Ala Lys Lys Glu Gly Asn Thr
370 375 380
Leu Val Ile Val Thr Ala Asp His Ala His Ala Ser Gln Ile Val Ala
385 390 395 400
Pro Asp Thr Lys Ala Pro Gly Leu Thr Gln Ala Leu Asn Thr Lys Asp
405 410 415
Gly Ala Val Met Val Met Ser Tyr Gly Asn Ser Glu Glu Asp Ser Gln
420 425 430
Glu His Thr Gly Ser Gln Leu Arg Ile Ala Ala Tyr Gly Pro His Ala
435 440 445
Ala Asn Val Val Gly Leu Thr Asp Gln Thr Asp Leu Phe Tyr Thr Met
450 455 460
Lys Ala Ala Leu Gly Leu Lys
465 470
<210> 161
<211> 1858
<212> DNA
<213> 拟南芥(Arabidopsis thaliana)
<400> 161
cacgtggcga agaatagtcc ccgaatcttc ctctgacgac catttgatac ttttttttct 60
tcagtttgtt ggttttgtcc tcttaacaaa atattcttca aactctctct gttgtttgtt 120
tgttgacaaa tctctcaaaa ccatttgttt tgcaatcgca gatccgtttt tcttcgggtc 180
tcatcacaat gaatggcttc tctgatctta atccttctga gaggtacgct ttgtctgatc 240
atcaatgatg cttataataa tctcatttat acatgatctt gcctctatat atttgttcat 300
cttagtaatc ttcggtctca gcttccattt tcgtctccca ctatgtttct aggattttgt 360
gttacttttg ttagaaaact gcgatttttg tgctagtgtt tgtttctcca agatcaatgg 420
aactcgttgc ctaaaattcc tgattatagt tacataaaca tcaaatggtt ctaattggtc 480
tttgatctta aacccatttg attatggtat ctaaagtttg atccttttga tgcactctca 540
tcgcagtttc tcgtgatttt aatattattg aactcttttg atttgtggtg aagcaaacct 600
tctctgtcac aactagctcc attagaagcc attctgtttg atgttgatgg aacactctgt 660
gactcagatc ccatccacct tattgccttc caagaactgc ttcaagaggt tccttgcttt 720
ttttaatgtc attataactt ccaaatttac aacaagactt tagaaaactg tgaataatat 780
gctatggaac cttgctatta ctcagtttca agctctcgtg tcaatcaatt ttgtttcttt 840
ctatcattcg cagattggtt ttaacaatgg tgtcccaatc gatgagaaat tctttgttga 900
gaacattgct ggaaaacaca attctgaaat tgctctactt ctgttccctg atgatgtttc 960
aagagggtta aaattctgtg atgaaaagga agctctttac cgcaagtaag ctatttttct 1020
gtgtttcctc cattctttta atgtcacaaa ctcttttcag gtctgagttc atttggagta 1080
actttgtttt gttctttttt cttgatgatt agaattgttg cagagaagat aaagccactt 1140
gatgggctta taaaactgac caaatggatc gaagatcgtg gattgaaacg agctgcggta 1200
acaaacgctc caaaagaaaa cgcagagctc atgatatcga aacttggtct gactgatttc 1260
tttcaagcag tgattcttgg ctctgaatgt gaatttccca aaccacaccc tggaccttac 1320
ttgaaggctc ttgaagtgct taacgtgtca aaggagcaca cgctagtttt cgaagactcg 1380
atctctggga taaaagctgg agttgcagct ggaatgccag tgattggact gactacaggg 1440
aatccagcaa gcctgcttat gcaagcaaaa cccgcttttc tcatcgagaa ctatgcggat 1500
ccaaaactgt gggctgtgtt ggaagaactt gataacaagt cttaagtctc acttgtttgg 1560
cttatggaaa cccacacatg catgagcagc ctctgaagtt taccttatgt cttagatgat 1620
cattgttgaa taattcattg ggagtttatg acaatgggag ctttcaaata tctgattatt 1680
ttgtattgat acatgcacaa tgctagattt gtatccagga gatagttgca taaaccaata 1740
tactataccc tcggatctta gcttattttc attgatatct tgttgttttg tgctgtaaac 1800
atatcagctt ttgaatacat ttggtccatg gcgcaaaata agactttttt tttttttt 1858
<210> 162
<211> 244
<212> PRT
<213> 拟南芥
<400> 162
Met Asn Gly Phe Ser Asp Leu Asn Pro Ser Glu Ser Lys Pro Ser Leu
1 5 10 15
Ser Gln Leu Ala Pro Leu Glu Ala Ile Leu Phe Asp Val Asp Gly Thr
20 25 30
Leu Cys Asp Ser Asp Pro Ile His Leu Ile Ala Phe Gln Glu Leu Leu
35 40 45
Gln Glu Ile Gly Phe Asn Asn Gly Val Pro Ile Asp Glu Lys Phe Phe
50 55 60
Val Glu Asn Ile Ala Gly Lys His Asn Ser Glu Ile Ala Leu Leu Leu
65 70 75 80
Phe Pro Asp Asp Val Ser Arg Gly Leu Lys Phe Cys Asp Glu Lys Glu
85 90 95
Ala Leu Tyr Arg Lys Ile Val Ala Glu Lys Ile Lys Pro Leu Asp Gly
100 105 110
Leu Ile Lys Leu Thr Lys Trp Ile Glu Asp Arg Gly Leu Lys Arg Ala
115 120 125
Ala Val Thr Asn Ala Pro Lys Glu Asn Ala Glu Leu Met Ile Ser Lys
130 135 140
Leu Gly Leu Thr Asp Phe Phe Gln Ala Val Ile Leu Gly Ser Glu Cys
145 150 155 160
Glu Phe Pro Lys Pro His Pro Gly Pro Tyr Leu Lys Ala Leu Glu Val
165 170 175
Leu Asn Val Ser Lys Glu His Thr Leu Val Phe Glu Asp Ser Ile Ser
180 185 190
Gly Ile Lys Ala Gly Val Ala Ala Gly Met Pro Val Ile Gly Leu Thr
195 200 205
Thr Gly Asn Pro Ala Ser Leu Leu Met Gln Ala Lys Pro Ala Phe Leu
210 215 220
Ile Glu Asn Tyr Ala Asp Pro Lys Leu Trp Ala Val Leu Glu Glu Leu
225 230 235 240
Asp Asn Lys Ser
<210> 163
<211> 819
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 163
atgcgtatta tggccagtca tgatacgcct gtgtcaccgg ctggcattct gattgacttg 60
gacggtactg tattcagagg aaatgagttg atcgaaggag caagagaagc gatcaaaacg 120
cttaggagaa tgggaaagaa aatcgtcttt ttaagcaacc gggggaatat ctcccgtgcc 180
atgtgcagaa aaaaacttct tggcgcgggg attgaaacgg acgtaaacga cattgttctg 240
tcatcaagcg tgacagcggc ttttctgaaa aaacattatc gtttttcaaa ggtatgggtg 300
cttggggagc aaggcttggt tgacgagctg aggctggccg gtgtgcagaa cgcgagcgaa 360
ccgaaggaag cggattggct cgtgatctcc cttcatgaaa cgctcacgta cgacgattta 420
aatcaagcct ttcaagcggc tgccggcggc gctcgtatta tcgctacaaa caaagaccgc 480
tcttttccga acgaagacgg aaatgccatt gatgtggccg gaatgatcgg ggcaattgag 540
acttctgcac aagcgaagac tgaacttgtt gtcggaaaac cgtcatggct gatggcggag 600
gctgcctgta cagcaatggg gctgtccgca catgaatgca tgattatagg agacagcatt 660
gaatctgaca ttgcgatggg gaagctttat ggcatgaaaa gcgccttagt gctaactggt 720
tctgcgaaac agggtgaaca gcgtttgtac acgccggatt atgtgctgga ttctattaag 780
gatgtaacca aattggctga ggaggggatt ctgatatga 819
<210> 164
<211> 272
<212> PRT
<213> 枯草芽孢杆菌
<400> 164
Met Arg Ile Met Ala Ser His Asp Thr Pro Val Ser Pro Ala Gly Ile
1 5 10 15
Leu Ile Asp Leu Asp Gly Thr Val Phe Arg Gly Asn Glu Leu Ile Glu
20 25 30
Gly Ala Arg Glu Ala Ile Lys Thr Leu Arg Arg Met Gly Lys Lys Ile
35 40 45
Val Phe Leu Ser Asn Arg Gly Asn Ile Ser Arg Ala Met Cys Arg Lys
50 55 60
Lys Leu Leu Gly Ala Gly Ile Glu Thr Asp Val Asn Asp Ile Val Leu
65 70 75 80
Ser Ser Ser Val Thr Ala Ala Phe Leu Lys Lys His Tyr Arg Phe Ser
85 90 95
Lys Val Trp Val Leu Gly Glu Gln Gly Leu Val Asp Glu Leu Arg Leu
100 105 110
Ala Gly Val Gln Asn Ala Ser Glu Pro Lys Glu Ala Asp Trp Leu Val
115 120 125
Ile Ser Leu His Glu Thr Leu Thr Tyr Asp Asp Leu Asn Gln Ala Phe
130 135 140
Gln Ala Ala Ala Gly Gly Ala Arg Ile Ile Ala Thr Asn Lys Asp Arg
145 150 155 160
Ser Phe Pro Asn Glu Asp Gly Asn Ala Ile Asp Val Ala Gly Met Ile
165 170 175
Gly Ala Ile Glu Thr Ser Ala Gln Ala Lys Thr Glu Leu Val Val Gly
180 185 190
Lys Pro Ser Trp Leu Met Ala Glu Ala Ala Cys Thr Ala Met Gly Leu
195 200 205
Ser Ala His Glu Cys Met Ile Ile Gly Asp Ser Ile Glu Ser Asp Ile
210 215 220
Ala Met Gly Lys Leu Tyr Gly Met Lys Ser Ala Leu Val Leu Thr Gly
225 230 235 240
Ser Ala Lys Gln Gly Glu Gln Arg Leu Tyr Thr Pro Asp Tyr Val Leu
245 250 255
Asp Ser Ile Lys Asp Val Thr Lys Leu Ala Glu Glu Gly Ile Leu Ile
260 265 270
<210> 165
<211> 825
<212> DNA
<213> 荧光假单胞菌(Pseudomonas fluorescens)
<400> 165
atgagtgacg cagcgattca tcccatccgt tttatcctca gtgacgtgga cggcaccttg 60
ctgcatcccg atcatagcct cagccaacgc accgccgacg cggtgcgcgc cttgcgcgaa 120
gccggagtgt tgttcagcct ggccagcggg cgcccgccca aggccatgct gcacctgatc 180
gaaacctttg ggatcgatgt gccggtggcg ggcttcaatg gcggtacctt gatcaacccg 240
gatggcagca tcctggttgc ccatcatctg ccggcggaag cggcgctggt taccctggcg 300
ctgttttcag cggagccgga ggtggaagtg tgggtgtttg ccgatggcga ctggctgcgc 360
cgtgacccgt cagggccgat ggagccgcgc gaggcgaatg gcctgggcta tgggccggtg 420
gtggtggaga gtttcgagcc ctacctggac cgggtcgaca agatcgtcgc cgcgagtcac 480
aacacgcaat tattggtaga gctggaggcg cgattgcaac ccaaggtgca ggggctggcc 540
caggtgtcgc gttcgcaacc ggtgtacttg gacgtgaccg cgatgctggc caacaagggc 600
gaggccttga agaccttggc ggcacacctg ggtgtgccca tggagcaaac ggcggcgatt 660
ggcgatggtg gcaatgaccc ggcgatgttt caggtggccg ggttgtcgat tgccatgggg 720
caggcggaag aaaccgtcaa gcgccaggcc agtgtggtga cgggcagcaa catcgaagat 780
ggcgccgccg aagcaatcga acggtttatt ctcgcggcac cttaa 825
<210> 166
<211> 274
<212> PRT
<213> 荧光假单胞菌
<400> 166
Met Ser Asp Ala Ala Ile His Pro Ile Arg Phe Ile Leu Ser Asp Val
1 5 10 15
Asp Gly Thr Leu Leu His Pro Asp His Ser Leu Ser Gln Arg Thr Ala
20 25 30
Asp Ala Val Arg Ala Leu Arg Glu Ala Gly Val Leu Phe Ser Leu Ala
35 40 45
Ser Gly Arg Pro Pro Lys Ala Met Leu His Leu Ile Glu Thr Phe Gly
50 55 60
Ile Asp Val Pro Val Ala Gly Phe Asn Gly Gly Thr Leu Ile Asn Pro
65 70 75 80
Asp Gly Ser Ile Leu Val Ala His His Leu Pro Ala Glu Ala Ala Leu
85 90 95
Val Thr Leu Ala Leu Phe Ser Ala Glu Pro Glu Val Glu Val Trp Val
100 105 110
Phe Ala Asp Gly Asp Trp Leu Arg Arg Asp Pro Ser Gly Pro Met Glu
115 120 125
Pro Arg Glu Ala Asn Gly Leu Gly Tyr Gly Pro Val Val Val Glu Ser
130 135 140
Phe Glu Pro Tyr Leu Asp Arg Val Asp Lys Ile Val Ala Ala Ser His
145 150 155 160
Asn Thr Gln Leu Leu Val Glu Leu Glu Ala Arg Leu Gln Pro Lys Val
165 170 175
Gln Gly Leu Ala Gln Val Ser Arg Ser Gln Pro Val Tyr Leu Asp Val
180 185 190
Thr Ala Met Leu Ala Asn Lys Gly Glu Ala Leu Lys Thr Leu Ala Ala
195 200 205
His Leu Gly Val Pro Met Glu Gln Thr Ala Ala Ile Gly Asp Gly Gly
210 215 220
Asn Asp Pro Ala Met Phe Gln Val Ala Gly Leu Ser Ile Ala Met Gly
225 230 235 240
Gln Ala Glu Glu Thr Val Lys Arg Gln Ala Ser Val Val Thr Gly Ser
245 250 255
Asn Ile Glu Asp Gly Ala Ala Glu Ala Ile Glu Arg Phe Ile Leu Ala
260 265 270
Ala Pro
<210> 167
<211> 651
<212> DNA
<213> 大肠杆菌
<400> 167
gtgcggtgca aaggttttct gtttgatctt gatggaacgc tggtggattc cctgcctgcg 60
gtagaacggg cgtggagcaa ctgggccaga cgtcatgggt tagcgccgga agaggtgctg 120
gctttcattc acggtaaaca ggcgatcacc tctctgcgcc attttatggc gggcaaatcc 180
gaggctgata ttgccgccga gtttacgcgt ctggagcaca tcgaggccac ggaaaccgaa 240
ggtattaccg cgcttccggg ggcaatcgcc ttactcagtc atttgaataa agcaggtatt 300
ccgtgggcca ttgtgacttc tggctccatg ccggtagcgc gagcgcgcca taaaatagct 360
gggcttcccg caccagaggt gtttgtaacc gctgagcgag tgaagcgcgg aaaaccagaa 420
cctgatgcgt atctgttagg cgcgcagctg ctggggcttg cgccgcagga gtgtgtggtg 480
gtggaagatg ctcccgctgg cgtgctttct ggcctggcgg cgggttgtca tgtcattgcg 540
gttaacgctc cggcagatac cccgcgcctg aatgaggtcg atttggtcct ccacagtctg 600
gagcaaatta ctgtgaccaa acagccaaat ggcgatgtta ttattcagtg a 651
<210> 168
<211> 216
<212> PRT
<213> 大肠杆菌
<400> 168
Met Arg Cys Lys Gly Phe Leu Phe Asp Leu Asp Gly Thr Leu Val Asp
1 5 10 15
Ser Leu Pro Ala Val Glu Arg Ala Trp Ser Asn Trp Ala Arg Arg His
20 25 30
Gly Leu Ala Pro Glu Glu Val Leu Ala Phe Ile His Gly Lys Gln Ala
35 40 45
Ile Thr Ser Leu Arg His Phe Met Ala Gly Lys Ser Glu Ala Asp Ile
50 55 60
Ala Ala Glu Phe Thr Arg Leu Glu His Ile Glu Ala Thr Glu Thr Glu
65 70 75 80
Gly Ile Thr Ala Leu Pro Gly Ala Ile Ala Leu Leu Ser His Leu Asn
85 90 95
Lys Ala Gly Ile Pro Trp Ala Ile Val Thr Ser Gly Ser Met Pro Val
100 105 110
Ala Arg Ala Arg His Lys Ile Ala Gly Leu Pro Ala Pro Glu Val Phe
115 120 125
Val Thr Ala Glu Arg Val Lys Arg Gly Lys Pro Glu Pro Asp Ala Tyr
130 135 140
Leu Leu Gly Ala Gln Leu Leu Gly Leu Ala Pro Gln Glu Cys Val Val
145 150 155 160
Val Glu Asp Ala Pro Ala Gly Val Leu Ser Gly Leu Ala Ala Gly Cys
165 170 175
His Val Ile Ala Val Asn Ala Pro Ala Asp Thr Pro Arg Leu Asn Glu
180 185 190
Val Asp Leu Val Leu His Ser Leu Glu Gln Ile Thr Val Thr Lys Gln
195 200 205
Pro Asn Gly Asp Val Ile Ile Gln
210 215
<210> 169
<211> 816
<212> DNA
<213> 大肠杆菌
<400> 169
atgagcgtaa aagttatcgt cacagacatg gacggtactt ttcttaacga cgccaaaacg 60
tacaaccaac cacgttttat ggcgcaatat caggaactga aaaagcgcgg cattaagttc 120
gttgttgcca gcggtaatca gtattaccag cttatttcat tctttcctga gctaaaggat 180
gagatctctt ttgtcgcgga aaacggcgca ctggtttacg aacatggcaa gcagttgttc 240
cacggcgaac tgacccgaca tgaatcgcgg attgttattg gcgagttgct aaaagataag 300
caactcaatt ttgtcgcctg cggtctgcaa agtgcatatg tcagcgaaaa tgcccccgaa 360
gcatttgtcg cactgatggc aaaacactac catcgcctga aacctgtaaa agattatcag 420
gagattgacg acgtactgtt caagttttcg ctcaacctgc cggatgaaca aatcccgtta 480
gtgatcgaca aactgcacgt agcgctcgat ggcattatga aacccgttac cagtggtttt 540
ggctttatcg acctgattat tcccggtcta cataaagcaa acggtatttc gcggttactg 600
aaacgctggg atctgtcacc gcaaaatgtg gtagcgattg gcgacagcgg taacgatgcg 660
gagatgctga aaatggcgcg ttattccttt gcgatgggca atgctgcgga aaacattaaa 720
caaatcgccc gttacgctac cgatgataat aatcatgaag gcgcgctgaa tgtgattcag 780
gcggtgctgg ataacacatc cccttttaac agctga 816
<210> 170
<211> 271
<212> PRT
<213> 大肠杆菌
<400> 170
Met Ser Val Lys Val Ile Val Thr Asp Met Asp Gly Thr Phe Leu Asn
1 5 10 15
Asp Ala Lys Thr Tyr Asn Gln Pro Arg Phe Met Ala Gln Tyr Gln Glu
20 25 30
Leu Lys Lys Arg Gly Ile Lys Phe Val Val Ala Ser Gly Asn Gln Tyr
35 40 45
Tyr Gln Leu Ile Ser Phe Phe Pro Glu Leu Lys Asp Glu Ile Ser Phe
50 55 60
Val Ala Glu Asn Gly Ala Leu Val Tyr Glu His Gly Lys Gln Leu Phe
65 70 75 80
His Gly Glu Leu Thr Arg His Glu Ser Arg Ile Val Ile Gly Glu Leu
85 90 95
Leu Lys Asp Lys Gln Leu Asn Phe Val Ala Cys Gly Leu Gln Ser Ala
100 105 110
Tyr Val Ser Glu Asn Ala Pro Glu Ala Phe Val Ala Leu Met Ala Lys
115 120 125
His Tyr His Arg Leu Lys Pro Val Lys Asp Tyr Gln Glu Ile Asp Asp
130 135 140
Val Leu Phe Lys Phe Ser Leu Asn Leu Pro Asp Glu Gln Ile Pro Leu
145 150 155 160
Val Ile Asp Lys Leu His Val Ala Leu Asp Gly Ile Met Lys Pro Val
165 170 175
Thr Ser Gly Phe Gly Phe Ile Asp Leu Ile Ile Pro Gly Leu His Lys
180 185 190
Ala Asn Gly Ile Ser Arg Leu Leu Lys Arg Trp Asp Leu Ser Pro Gln
195 200 205
Asn Val Val Ala Ile Gly Asp Ser Gly Asn Asp Ala Glu Met Leu Lys
210 215 220
Met Ala Arg Tyr Ser Phe Ala Met Gly Asn Ala Ala Glu Asn Ile Lys
225 230 235 240
Gln Ile Ala Arg Tyr Ala Thr Asp Asp Asn Asn His Glu Gly Ala Leu
245 250 255
Asn Val Ile Gln Ala Val Leu Asp Asn Thr Ser Pro Phe Asn Ser
260 265 270
<210> 171
<211> 813
<212> DNA
<213> 大肠杆菌
<400> 171
atggctatta aactcattgc tatcgatatg gatggcaccc ttctgctgcc cgatcacacc 60
atttcacccg ccgttaaaaa tgcgattgcc gcagctcgcg cccgtggcgt gaatgtcgtg 120
ctaacgacgg gtcgcccgta tgcaggtgtg cacaactacc tgaaagagct gcatatggaa 180
cagccgggcg actactgcat tacttataac ggcgcgctgg tacagaaggc cgctgatggt 240
agcaccgtgg cgcaaactgc tctcagctat gacgactatc gtttcctgga aaaactctct 300
cgcgaagtcg gttctcattt ccacgccctg gaccgcacca cgctgtacac cgccaaccgt 360
gatatcagct actacacggt gcatgaatcc ttcgttgcca ccattccgct ggtgttctgc 420
gaagcggaga aaatggaccc caatacccag ttcctgaaag tgatgatgat tgatgaaccc 480
gccatcctcg accaggctat cgcgcgtatt ccgcaggaag tgaaagagaa atataccgtg 540
ctgaaaagtg cgccgtactt cctcgaaatc ctcgataaac gcgttaacaa aggtacgggg 600
gtgaaatcac tggccgacgt gttaggtatt aaaccggaag aaatcatggc gattggcgat 660
caggaaaacg atatcgcaat gattgaatat gcaggcgtcg gtgtggcgat ggataacgct 720
attccttcag tgaaagaagt ggcgaacttt gtcaccaaat ctaaccttga agatggcgtg 780
gcgtttgcta ttgagaagta tgtgctgaat taa 813
<210> 172
<211> 270
<212> PRT
<213> 大肠杆菌
<400> 172
Met Ala Ile Lys Leu Ile Ala Ile Asp Met Asp Gly Thr Leu Leu Leu
1 5 10 15
Pro Asp His Thr Ile Ser Pro Ala Val Lys Asn Ala Ile Ala Ala Ala
20 25 30
Arg Ala Arg Gly Val Asn Val Val Leu Thr Thr Gly Arg Pro Tyr Ala
35 40 45
Gly Val His Asn Tyr Leu Lys Glu Leu His Met Glu Gln Pro Gly Asp
50 55 60
Tyr Cys Ile Thr Tyr Asn Gly Ala Leu Val Gln Lys Ala Ala Asp Gly
65 70 75 80
Ser Thr Val Ala Gln Thr Ala Leu Ser Tyr Asp Asp Tyr Arg Phe Leu
85 90 95
Glu Lys Leu Ser Arg Glu Val Gly Ser His Phe His Ala Leu Asp Arg
100 105 110
Thr Thr Leu Tyr Thr Ala Asn Arg Asp Ile Ser Tyr Tyr Thr Val His
115 120 125
Glu Ser Phe Val Ala Thr Ile Pro Leu Val Phe Cys Glu Ala Glu Lys
130 135 140
Met Asp Pro Asn Thr Gln Phe Leu Lys Val Met Met Ile Asp Glu Pro
145 150 155 160
Ala Ile Leu Asp Gln Ala Ile Ala Arg Ile Pro Gln Glu Val Lys Glu
165 170 175
Lys Tyr Thr Val Leu Lys Ser Ala Pro Tyr Phe Leu Glu Ile Leu Asp
180 185 190
Lys Arg Val Asn Lys Gly Thr Gly Val Lys Ser Leu Ala Asp Val Leu
195 200 205
Gly Ile Lys Pro Glu Glu Ile Met Ala Ile Gly Asp Gln Glu Asn Asp
210 215 220
Ile Ala Met Ile Glu Tyr Ala Gly Val Gly Val Ala Met Asp Asn Ala
225 230 235 240
Ile Pro Ser Val Lys Glu Val Ala Asn Phe Val Thr Lys Ser Asn Leu
245 250 255
Glu Asp Gly Val Ala Phe Ala Ile Glu Lys Tyr Val Leu Asn
260 265 270
<210> 173
<211> 867
<212> DNA
<213> 恶性疟原虫(Plasmodium falciparum)
<400> 173
atgcacgaaa ttgtagataa gaatggtaag aaagttcaaa agaataattt gaatgatgaa 60
ataaaaataa tctttacgga tttagatgga acattgttaa atagtgagaa taaggtttca 120
gaacagaatt tggagagttt aataagagct caagaaaaag gcataaaggt tgttatagca 180
acaggtagat ctatattttc tgtagagaat gttataggag agcatgtaaa aaagaataga 240
ataagtttat taccagggat atatatgaat ggatgtgtaa catttgatga aaaaggttca 300
agggtgatag ataggattat gaacaatgac ttgaaaatgg agatacatga attttctaaa 360
caaataaata tatcaaaata tgctatatgg ttttgtttag aaaaaacata ttgttttgaa 420
ataaatgatt gtatacgtga atatatggag gttgaagcat taaatcctga tgttattgaa 480
gataatatgt tagaaggttt gacagtatat aaagtattat tttcattacc agaaaatata 540
ttagaaaata cgttaaaatt atgtagagag aaattttctc atcgtattaa tgtagctaat 600
acttttcaaa gttatgttga attatttcat caacatacta ataaattcga aggtgtaaaa 660
gaaatttgta aatattataa tataagtcta aacaatgcgc tagctatggg agatggagaa 720
aatgatattg aaatgttaag tggtttaaca cattcagtgg gtgtacataa tgcttcagaa 780
aaagtaaaaa attcagctgc ttatgttgga ccttcgaata atgaacatgc tatatctcat 840
gtcttgaaga cattctgtga catataa 867
<210> 174
<211> 288
<212> PRT
<213> 恶性疟原虫
<400> 174
Met His Glu Ile Val Asp Lys Asn Gly Lys Lys Val Gln Lys Asn Asn
1 5 10 15
Leu Asn Asp Glu Ile Lys Ile Ile Phe Thr Asp Leu Asp Gly Thr Leu
20 25 30
Leu Asn Ser Glu Asn Lys Val Ser Glu Gln Asn Leu Glu Ser Leu Ile
35 40 45
Arg Ala Gln Glu Lys Gly Ile Lys Val Val Ile Ala Thr Gly Arg Ser
50 55 60
Ile Phe Ser Val Glu Asn Val Ile Gly Glu His Val Lys Lys Asn Arg
65 70 75 80
Ile Ser Leu Leu Pro Gly Ile Tyr Met Asn Gly Cys Val Thr Phe Asp
85 90 95
Glu Lys Gly Ser Arg Val Ile Asp Arg Ile Met Asn Asn Asp Leu Lys
100 105 110
Met Glu Ile His Glu Phe Ser Lys Gln Ile Asn Ile Ser Lys Tyr Ala
115 120 125
Ile Trp Phe Cys Leu Glu Lys Thr Tyr Cys Phe Glu Ile Asn Asp Cys
130 135 140
Ile Arg Glu Tyr Met Glu Val Glu Ala Leu Asn Pro Asp Val Ile Glu
145 150 155 160
Asp Asn Met Leu Glu Gly Leu Thr Val Tyr Lys Val Leu Phe Ser Leu
165 170 175
Pro Glu Asn Ile Leu Glu Asn Thr Leu Lys Leu Cys Arg Glu Lys Phe
180 185 190
Ser His Arg Ile Asn Val Ala Asn Thr Phe Gln Ser Tyr Val Glu Leu
195 200 205
Phe His Gln His Thr Asn Lys Phe Glu Gly Val Lys Glu Ile Cys Lys
210 215 220
Tyr Tyr Asn Ile Ser Leu Asn Asn Ala Leu Ala Met Gly Asp Gly Glu
225 230 235 240
Asn Asp Ile Glu Met Leu Ser Gly Leu Thr His Ser Val Gly Val His
245 250 255
Asn Ala Ser Glu Lys Val Lys Asn Ser Ala Ala Tyr Val Gly Pro Ser
260 265 270
Asn Asn Glu His Ala Ile Ser His Val Leu Lys Thr Phe Cys Asp Ile
275 280 285
<210> 175
<211> 1059
<212> DNA
<213> 鸟肠球菌(Enterococcus avium)
<400> 175
atgagtaaaa caatgaaggg tgtttccaag caggcacccg gttatgacca aatggcattt 60
atcgatttat ctgttccaga agcaacagat gacaaggtct tgattaaagt cgcttataca 120
ggtatttgcg gatcagatat ccatacgttt aaaggtgaat acaaaaatcc cactactccc 180
gtcgtcctag gacatgaatt ttctgggcag gtagttgaag tcggagccaa tgtaccaaag 240
gtcaaggttg gtgatcgggt aaccagtgag acgacctttt atgtctgcgg cgaatgcgat 300
tattgcaagg aaaagcagta taatttgtgt ccccatcgaa aaggaatcgg cacgcagcaa 360
aatggctcca tggcgaacta tgtgttggct cgagaagaaa gcattcattt actgccggat 420
catttaagct atgaaggtgc ggcgatgagc gaaccattag cgtgctgtgt ccacgcgatg 480
tatcaaaaga gtcacttgga attaaaagac acgatcatta tcatgggccc tggaccaatc 540
ggactgtatc ttttgcagat tgccaaggaa attggagcct tcgtcattat gacggggatc 600
acaaaagatg ctcatcgctt agcattagca aaaaaactag gcgcggatgt gatcgttgat 660
acgatgaagg aagatctagc gaaagtcgtc aatgagatca cggatggcta cggtgtcgat 720
aaagtgtatg atgcctcagg agcagttcct gctgttaatg ctagtctgcc attgattcgc 780
aagcaggggc aatttattca agtaggcttg ttcgctaata aaatggtgga tttagacact 840
gaatcgatca ttcaacgaga gatcgaatac atcggcagtc gttcacagaa cccttatgac 900
tggccgattg cgatccactt attagcgaaa ggtgcgatca atatcgatga gatgattacg 960
aaaaaatacc cgttgactga atggcgggaa gcctttgata aagtgatgga aggcaatgaa 1020
atcaaggtaa tgatcgaatc caatccagaa gaattttaa 1059
<210> 176
<211> 352
<212> PRT
<213> 鸟肠球菌
<400> 176
Met Ser Lys Thr Met Lys Gly Val Ser Lys Gln Ala Pro Gly Tyr Asp
1 5 10 15
Gln Met Ala Phe Ile Asp Leu Ser Val Pro Glu Ala Thr Asp Asp Lys
20 25 30
Val Leu Ile Lys Val Ala Tyr Thr Gly Ile Cys Gly Ser Asp Ile His
35 40 45
Thr Phe Lys Gly Glu Tyr Lys Asn Pro Thr Thr Pro Val Val Leu Gly
50 55 60
His Glu Phe Ser Gly Gln Val Val Glu Val Gly Ala Asn Val Pro Lys
65 70 75 80
Val Lys Val Gly Asp Arg Val Thr Ser Glu Thr Thr Phe Tyr Val Cys
85 90 95
Gly Glu Cys Asp Tyr Cys Lys Glu Lys Gln Tyr Asn Leu Cys Pro His
100 105 110
Arg Lys Gly Ile Gly Thr Gln Gln Asn Gly Ser Met Ala Asn Tyr Val
115 120 125
Leu Ala Arg Glu Glu Ser Ile His Leu Leu Pro Asp His Leu Ser Tyr
130 135 140
Glu Gly Ala Ala Met Ser Glu Pro Leu Ala Cys Cys Val His Ala Met
145 150 155 160
Tyr Gln Lys Ser His Leu Glu Leu Lys Asp Thr Ile Ile Ile Met Gly
165 170 175
Pro Gly Pro Ile Gly Leu Tyr Leu Leu Gln Ile Ala Lys Glu Ile Gly
180 185 190
Ala Phe Val Ile Met Thr Gly Ile Thr Lys Asp Ala His Arg Leu Ala
195 200 205
Leu Ala Lys Lys Leu Gly Ala Asp Val Ile Val Asp Thr Met Lys Glu
210 215 220
Asp Leu Ala Lys Val Val Asn Glu Ile Thr Asp Gly Tyr Gly Val Asp
225 230 235 240
Lys Val Tyr Asp Ala Ser Gly Ala Val Pro Ala Val Asn Ala Ser Leu
245 250 255
Pro Leu Ile Arg Lys Gln Gly Gln Phe Ile Gln Val Gly Leu Phe Ala
260 265 270
Asn Lys Met Val Asp Leu Asp Thr Glu Ser Ile Ile Gln Arg Glu Ile
275 280 285
Glu Tyr Ile Gly Ser Arg Ser Gln Asn Pro Tyr Asp Trp Pro Ile Ala
290 295 300
Ile His Leu Leu Ala Lys Gly Ala Ile Asn Ile Asp Glu Met Ile Thr
305 310 315 320
Lys Lys Tyr Pro Leu Thr Glu Trp Arg Glu Ala Phe Asp Lys Val Met
325 330 335
Glu Gly Asn Glu Ile Lys Val Met Ile Glu Ser Asn Pro Glu Glu Phe
340 345 350
<210> 177
<211> 846
<212> DNA
<213> 白色念珠菌(Candida albicans)
<400> 177
atggattccg catactggtc atacgataac atagtcccaa gcttccgttt ggatggaaaa 60
ctagtcatat taaccggtgg ctctggtggt ttggctgccg tggtatcaag agctttatta 120
gccaaaggtg ccgatgttgc attagtcgat atgaacttgg aaagaacaca acaagctgct 180
agagacgtct tacaatgggg cgaagagcaa atgaaaggta aatacgaatc accaatcggt 240
caggtgagtg cttggtcatg taatattggc gatgctgaag ctgtcgactt gacattcaaa 300
gccatcaacg aacaccacgg caaaatctca agtgtcttgg tcaacactgc cggttacgct 360
gaaaacttcc cagctgaaga gtacccagcc aagaacgctg aaaaccttat gaaagttaac 420
gggttggggt cattctacgt ttcccaagct tttgctagac cattaatcca aaacaacatg 480
accggatcga tcattttgat cgggtcaatg tccggtacca tcgtcaacga cccacaacca 540
caatgcatgt acaacatgtc caaagccggt gtcattcatt tagccagatc attggcctgt 600
gaatgggcta aatacaatat cagagtcaac acattgtcgc cagggtacat cttaacccca 660
ttgacaagaa acgttattag tggacacacc gaaatgaaga cagaatggga atcaaagatc 720
ccaatgaaga gaatggcaga accaaaagag tttgttggtt ctatcttata cttggcctca 780
gaatctgctt catcatacac tactggtcac aacttggtcg ttgacggggg ttacgagtgc 840
tggtaa 846
<210> 178
<211> 281
<212> PRT
<213> 白色念珠菌
<400> 178
Met Asp Ser Ala Tyr Trp Ser Tyr Asp Asn Ile Val Pro Ser Phe Arg
1 5 10 15
Leu Asp Gly Lys Leu Val Ile Leu Thr Gly Gly Ser Gly Gly Leu Ala
20 25 30
Ala Val Val Ser Arg Ala Leu Leu Ala Lys Gly Ala Asp Val Ala Leu
35 40 45
Val Asp Met Asn Leu Glu Arg Thr Gln Gln Ala Ala Arg Asp Val Leu
50 55 60
Gln Trp Gly Glu Glu Gln Met Lys Gly Lys Tyr Glu Ser Pro Ile Gly
65 70 75 80
Gln Val Ser Ala Trp Ser Cys Asn Ile Gly Asp Ala Glu Ala Val Asp
85 90 95
Leu Thr Phe Lys Ala Ile Asn Glu His His Gly Lys Ile Ser Ser Val
100 105 110
Leu Val Asn Thr Ala Gly Tyr Ala Glu Asn Phe Pro Ala Glu Glu Tyr
115 120 125
Pro Ala Lys Asn Ala Glu Asn Leu Met Lys Val Asn Gly Leu Gly Ser
130 135 140
Phe Tyr Val Ser Gln Ala Phe Ala Arg Pro Leu Ile Gln Asn Asn Met
145 150 155 160
Thr Gly Ser Ile Ile Leu Ile Gly Ser Met Ser Gly Thr Ile Val Asn
165 170 175
Asp Pro Gln Pro Gln Cys Met Tyr Asn Met Ser Lys Ala Gly Val Ile
180 185 190
His Leu Ala Arg Ser Leu Ala Cys Glu Trp Ala Lys Tyr Asn Ile Arg
195 200 205
Val Asn Thr Leu Ser Pro Gly Tyr Ile Leu Thr Pro Leu Thr Arg Asn
210 215 220
Val Ile Ser Gly His Thr Glu Met Lys Thr Glu Trp Glu Ser Lys Ile
225 230 235 240
Pro Met Lys Arg Met Ala Glu Pro Lys Glu Phe Val Gly Ser Ile Leu
245 250 255
Tyr Leu Ala Ser Glu Ser Ala Ser Ser Tyr Thr Thr Gly His Asn Leu
260 265 270
Val Val Asp Gly Gly Tyr Glu Cys Trp
275 280
<210> 179
<211> 849
<212> DNA
<213> 热带念珠菌(Candida tropicalis)
<400> 179
atggactcct catcatactg gtcatacgac aacattgttc caagttttag attggatgga 60
aaattagtaa ttatcactgg tggttctggt ggtttgtccg ctgttgtttc cagagccttg 120
ttagcaaaag gtgctgatat tgctttgatt gatatgaact tggaaagaac ccaacaagcc 180
gcaagagatg ttttacaatg gggtgaagaa caaatgaaag gaaaacacga atctccaatt 240
ggtcaagtca gtgcttggtc ctgtaacatt ggtgatgctg aagctgttga attgacattc 300
aaagccatca acgaacacca cggtaaagtt gccagtgttt tgattaacac agctggttat 360
gctgaaaatt tccctgctga agaataccca gccaagaatg ccgaaaatat catgaaggtc 420
aatggtttag gatcctttta cgtctcacaa gctttcgcca gacctttgat tcaaaataac 480
atgactggct ctattatctt gattggttct atgtctggta ccattgtcaa cgatccacaa 540
ccacaatgta tgtacaacat gtccaaagct ggtgtcattc acttggccag atctttagca 600
tgtgaatggg ccaaatacaa catcagagtc aataccttgt ccccaggtta tattttgact 660
ccattgacaa gaaatgttat tagtggtcac actgaaatga agacagaatg ggaatccaag 720
attccaatga agagaatggc cgagccaaaa gaatttgtcg gttctatttt gtacttggct 780
tctgattctg cctcttccta cactactggt cacaatttgg tagtggatgg tggttacgaa 840
tgttggtaa 849
<210> 180
<211> 282
<212> PRT
<213> 热带念珠菌
<400> 180
Met Asp Ser Ser Ser Tyr Trp Ser Tyr Asp Asn Ile Val Pro Ser Phe
1 5 10 15
Arg Leu Asp Gly Lys Leu Val Ile Ile Thr Gly Gly Ser Gly Gly Leu
20 25 30
Ser Ala Val Val Ser Arg Ala Leu Leu Ala Lys Gly Ala Asp Ile Ala
35 40 45
Leu Ile Asp Met Asn Leu Glu Arg Thr Gln Gln Ala Ala Arg Asp Val
50 55 60
Leu Gln Trp Gly Glu Glu Gln Met Lys Gly Lys His Glu Ser Pro Ile
65 70 75 80
Gly Gln Val Ser Ala Trp Ser Cys Asn Ile Gly Asp Ala Glu Ala Val
85 90 95
Glu Leu Thr Phe Lys Ala Ile Asn Glu His His Gly Lys Val Ala Ser
100 105 110
Val Leu Ile Asn Thr Ala Gly Tyr Ala Glu Asn Phe Pro Ala Glu Glu
115 120 125
Tyr Pro Ala Lys Asn Ala Glu Asn Ile Met Lys Val Asn Gly Leu Gly
130 135 140
Ser Phe Tyr Val Ser Gln Ala Phe Ala Arg Pro Leu Ile Gln Asn Asn
145 150 155 160
Met Thr Gly Ser Ile Ile Leu Ile Gly Ser Met Ser Gly Thr Ile Val
165 170 175
Asn Asp Pro Gln Pro Gln Cys Met Tyr Asn Met Ser Lys Ala Gly Val
180 185 190
Ile His Leu Ala Arg Ser Leu Ala Cys Glu Trp Ala Lys Tyr Asn Ile
195 200 205
Arg Val Asn Thr Leu Ser Pro Gly Tyr Ile Leu Thr Pro Leu Thr Arg
210 215 220
Asn Val Ile Ser Gly His Thr Glu Met Lys Thr Glu Trp Glu Ser Lys
225 230 235 240
Ile Pro Met Lys Arg Met Ala Glu Pro Lys Glu Phe Val Gly Ser Ile
245 250 255
Leu Tyr Leu Ala Ser Asp Ser Ala Ser Ser Tyr Thr Thr Gly His Asn
260 265 270
Leu Val Val Asp Gly Gly Tyr Glu Cys Trp
275 280
<210> 181
<211> 1158
<212> DNA
<213> 未知
<220>
<223> Scheffersomyces stipitis序列
<400> 181
aatttctata gattggtaca aatcatagaa tagagaatcc caatagcaca agctcctgat 60
ttccttgcat tatttgcccg cgctcaagta ttttttagac tgagtcttcc atacttcgta 120
ctgatataaa caaatattgc acaaactact actagtgaat tactaatagt ttccaccaaa 180
tacagccact acacactaca tatactacaa tggactactc atacgctaac gttgttccca 240
acttcagatt ggacggaaga ttggctatta ttaccggagg ttctggtggt ttggccgcag 300
tcatttcgcg tgccttgttg gcccagggcg ctgatgttgc tctcattgac atgaacttgg 360
aaagaaccaa gtccgctgcc aaagaagttt tgggctgggg tgaagagacg ttgaagggtg 420
aacacgcttc agccatcggc caagtttccg cctggtcctg caacattggg gatgctgagg 480
cagtagacgc tactttcagc tccatcaacg aacaccacgg caagatcgct gacttgttga 540
ttaacaccgc tggatactgt gaaaacttcc ctgccgaaac gtacccggct actaacgctg 600
aaagcatcat gaaggtgaac ggtttgggct cattctacgt ttcgcaatcg ttcgctagac 660
cattgatcca gaacaacttg agaggctcta tcatcttgat tggctcaatg tctggaacaa 720
ttgtcaacga cccacaaccc caatgtatgt acaacatgtc caaggctgga gtgatccact 780
tggtcagatc gttggcctgc gaatgggcca agtacaacat cagagtcaac accttatcac 840
caggctatat tttgactcct ttaaccagaa acgtgatttc tggccacaca gagatgaagg 900
aagcctggga atccaagatc cccatgaaga gaatggccga acccaaggaa ttcgtggggt 960
ccatcttata cttggcaagc gagactgctt cttcctacac tacgggccac aatttggttg 1020
tggacggagg atatgaatgc tggtagatac cgctcccatt ttaatgaaac gaccacgata 1080
cgacccacag tttaatttca caagtataaa gtttatatgt cgctactgtt ttatagagaa 1140
agccaaaatt gacgaaac 1158
<210> 182
<211> 278
<212> PRT
<213> 未知
<220>
<223> Scheffersomyces stipitis序列
<400> 182
Met Asp Tyr Ser Tyr Ala Asn Val Val Pro Asn Phe Arg Leu Asp Gly
1 5 10 15
Arg Leu Ala Ile Ile Thr Gly Gly Ser Gly Gly Leu Ala Ala Val Ile
20 25 30
Ser Arg Ala Leu Leu Ala Gln Gly Ala Asp Val Ala Leu Ile Asp Met
35 40 45
Asn Leu Glu Arg Thr Lys Ser Ala Ala Lys Glu Val Leu Gly Trp Gly
50 55 60
Glu Glu Thr Leu Lys Gly Glu His Ala Ser Ala Ile Gly Gln Val Ser
65 70 75 80
Ala Trp Ser Cys Asn Ile Gly Asp Ala Glu Ala Val Asp Ala Thr Phe
85 90 95
Ser Ser Ile Asn Glu His His Gly Lys Ile Ala Asp Leu Leu Ile Asn
100 105 110
Thr Ala Gly Tyr Cys Glu Asn Phe Pro Ala Glu Thr Tyr Pro Ala Thr
115 120 125
Asn Ala Glu Ser Ile Met Lys Val Asn Gly Leu Gly Ser Phe Tyr Val
130 135 140
Ser Gln Ser Phe Ala Arg Pro Leu Ile Gln Asn Asn Leu Arg Gly Ser
145 150 155 160
Ile Ile Leu Ile Gly Ser Met Ser Gly Thr Ile Val Asn Asp Pro Gln
165 170 175
Pro Gln Cys Met Tyr Asn Met Ser Lys Ala Gly Val Ile His Leu Val
180 185 190
Arg Ser Leu Ala Cys Glu Trp Ala Lys Tyr Asn Ile Arg Val Asn Thr
195 200 205
Leu Ser Pro Gly Tyr Ile Leu Thr Pro Leu Thr Arg Asn Val Ile Ser
210 215 220
Gly His Thr Glu Met Lys Glu Ala Trp Glu Ser Lys Ile Pro Met Lys
225 230 235 240
Arg Met Ala Glu Pro Lys Glu Phe Val Gly Ser Ile Leu Tyr Leu Ala
245 250 255
Ser Glu Thr Ala Ser Ser Tyr Thr Thr Gly His Asn Leu Val Val Asp
260 265 270
Gly Gly Tyr Glu Cys Trp
275
<210> 183
<211> 1482
<212> DNA
<213> 荧光假单胞菌
<400> 183
atgaaactga ataagcagaa cctcacccag ctggcgcccg aagtgaaatt gccagcctat 60
acgcttgccg acacacgcca gggcatcgcc catatcggcg tcggcggctt ccatcgcgcg 120
caccaggcgt attacaccga tgcgctgatg aataccggcg agggcctgga ctggagcatc 180
tgcggcgttg gcctgcgcag cgaggaccgc aaggcccgcg atgacctggc cggccaggac 240
tacctgttca ccctgtacga actgggcgac accgacgaca ccgaagtgcg cgtgatcggc 300
tcgatcagcg acatgctgct ggccgaagac agcgcccagg cattgatcga taaactggcc 360
agccccgaga ttcgcatcgt ctcgctgacc atcaccgaag gcggctactg catcgacgac 420
agcaacggcg aattcatggc ccacttgccg cagatccagc acgacctggc tcatccgtcg 480
tcgccaaaaa ccgtgttcgg ctttatctgc gcggcattga cccagcgccg cgcggccggc 540
atcccggcgt ttaccgtgat gtcctgcgat aacctgcccc acaatggcgc tgtcacgcgc 600
aaggcactgc tggcgttcgc cgccctgcac aacgccgagc tgcatgactg gatcaaggcc 660
catgtgagct tcccgaacgc catggtcgac cgcatcacgc cgatgaccag caccgcccac 720
cgcctgcaac tgcacgatga acacggcatc gacgatgcct ggccagttgt ttgcgaaccc 780
tttgtgcagt gggtactgga agacaaattc gtcaacggcc gcccggcgtg ggaaaaggtt 840
ggcgtgcagt tcaccgacga tgtgacaccc tatgaagaga tgaagatcgg cttgctcaac 900
ggcagccacc tggccctgac ctacctgggt tttctcaagg gctatcggtt tgtgcacgag 960
accatgaacg acccgctgtt cgtggcctac atgcgcgcct acatggacct cgacgtcacg 1020
ccaaacctcg cgccggtacc gggcatcgac ctgaccgact acaagcagac cctggtggac 1080
cgcttctcca accaggcgat tgccgaccag ttggaacggg tgtgttcgga tggctcgtcg 1140
aagtttccca agttcaccgt gccgaccatc aaccgcctga ttgccgacgg ccgtgagacc 1200
gagcgtgcag cactggtcgt cgcggcctgg gccttgtatt tgaagggtgt ggatgagaat 1260
ggcgtgagct acacaatccc cgatccgcgc gccgagttct gccaggggct ggtgagtgac 1320
gatgcactga tcagccagcg gttgctggca gtggaagaga ttttcggtac ggctattccc 1380
aactcgcctg agtttgtggc agcgttcgag cggtgctatg ggagcctgcg tgataacggc 1440
gtcaccacta ccctgaagca cctcctgaag aaaccggttt aa 1482
<210> 184
<211> 493
<212> PRT
<213> 荧光假单胞菌
<400> 184
Met Lys Leu Asn Lys Gln Asn Leu Thr Gln Leu Ala Pro Glu Val Lys
1 5 10 15
Leu Pro Ala Tyr Thr Leu Ala Asp Thr Arg Gln Gly Ile Ala His Ile
20 25 30
Gly Val Gly Gly Phe His Arg Ala His Gln Ala Tyr Tyr Thr Asp Ala
35 40 45
Leu Met Asn Thr Gly Glu Gly Leu Asp Trp Ser Ile Cys Gly Val Gly
50 55 60
Leu Arg Ser Glu Asp Arg Lys Ala Arg Asp Asp Leu Ala Gly Gln Asp
65 70 75 80
Tyr Leu Phe Thr Leu Tyr Glu Leu Gly Asp Thr Asp Asp Thr Glu Val
85 90 95
Arg Val Ile Gly Ser Ile Ser Asp Met Leu Leu Ala Glu Asp Ser Ala
100 105 110
Gln Ala Leu Ile Asp Lys Leu Ala Ser Pro Glu Ile Arg Ile Val Ser
115 120 125
Leu Thr Ile Thr Glu Gly Gly Tyr Cys Ile Asp Asp Ser Asn Gly Glu
130 135 140
Phe Met Ala His Leu Pro Gln Ile Gln His Asp Leu Ala His Pro Ser
145 150 155 160
Ser Pro Lys Thr Val Phe Gly Phe Ile Cys Ala Ala Leu Thr Gln Arg
165 170 175
Arg Ala Ala Gly Ile Pro Ala Phe Thr Val Met Ser Cys Asp Asn Leu
180 185 190
Pro His Asn Gly Ala Val Thr Arg Lys Ala Leu Leu Ala Phe Ala Ala
195 200 205
Leu His Asn Ala Glu Leu His Asp Trp Ile Lys Ala His Val Ser Phe
210 215 220
Pro Asn Ala Met Val Asp Arg Ile Thr Pro Met Thr Ser Thr Ala His
225 230 235 240
Arg Leu Gln Leu His Asp Glu His Gly Ile Asp Asp Ala Trp Pro Val
245 250 255
Val Cys Glu Pro Phe Val Gln Trp Val Leu Glu Asp Lys Phe Val Asn
260 265 270
Gly Arg Pro Ala Trp Glu Lys Val Gly Val Gln Phe Thr Asp Asp Val
275 280 285
Thr Pro Tyr Glu Glu Met Lys Ile Gly Leu Leu Asn Gly Ser His Leu
290 295 300
Ala Leu Thr Tyr Leu Gly Phe Leu Lys Gly Tyr Arg Phe Val His Glu
305 310 315 320
Thr Met Asn Asp Pro Leu Phe Val Ala Tyr Met Arg Ala Tyr Met Asp
325 330 335
Leu Asp Val Thr Pro Asn Leu Ala Pro Val Pro Gly Ile Asp Leu Thr
340 345 350
Asp Tyr Lys Gln Thr Leu Val Asp Arg Phe Ser Asn Gln Ala Ile Ala
355 360 365
Asp Gln Leu Glu Arg Val Cys Ser Asp Gly Ser Ser Lys Phe Pro Lys
370 375 380
Phe Thr Val Pro Thr Ile Asn Arg Leu Ile Ala Asp Gly Arg Glu Thr
385 390 395 400
Glu Arg Ala Ala Leu Val Val Ala Ala Trp Ala Leu Tyr Leu Lys Gly
405 410 415
Val Asp Glu Asn Gly Val Ser Tyr Thr Ile Pro Asp Pro Arg Ala Glu
420 425 430
Phe Cys Gln Gly Leu Val Ser Asp Asp Ala Leu Ile Ser Gln Arg Leu
435 440 445
Leu Ala Val Glu Glu Ile Phe Gly Thr Ala Ile Pro Asn Ser Pro Glu
450 455 460
Phe Val Ala Ala Phe Glu Arg Cys Tyr Gly Ser Leu Arg Asp Asn Gly
465 470 475 480
Val Thr Thr Thr Leu Lys His Leu Leu Lys Lys Pro Val
485 490
<210> 185
<211> 1368
<212> DNA
<213> 肺炎克雷伯氏菌(Klebsiella pneumoniae)
<400> 185
ttagttaatc agcgtgtaaa cggcggcgac tttctcgcgc atcagcgcca ggaaatccgc 60
gttgttggcg agatcaccaa acagggcttt atcacgggcg aagacagcca ccggatcctg 120
agcctcgaac atctcatgca ccgcctgcgc atccaggatg ccgtcctggt actgatatgg 180
cagagttccc ttgtgccact gctccataaa gacgaagaac agcgccggca gcatggcggt 240
cgcttccggg cggacgccgc gctggtagca ctcctgcaag gttggcgcga tcatcgccgg 300
aattttcgag aagccgtcgg cggcgacgcg ctggttggtg tcctggatat aggggttggt 360
aaagcgctta agcaccacat cccggtaggt cggcagatca atgccgttgt cgccgagaca 420
cggaataacg tcctccgtaa cgtagcggtc ggcaatggcg tagataacat cggtcagcgt 480
gctttcatga atatactgct ggccgattaa ggttcccgcc caggcaatgc agctgtgcga 540
cgcgttcaaa atacggattt tcgcctcttc atacgggatg accgactcca ccatctccac 600
gccgactgcc tccagattcg ggcggacatc gcggaagttg ttctccacta cccactggat 660
aaaggtctcc cccatcaccg gcgctttgtc atcaattccg gcttgcgctt tgatgcgggc 720
cggcagatcg gccgccggac gcggggtgat gcggtccacc atggtgttcg gacaggtggt 780
attggccgcc atccagtcaa tcaccgcctg tttgccggtg agctgcagga actcgaccat 840
accgtcgtgg aaacgctcgc cgttatggcg cacgttatcg cagttgagca gggtcagcgg 900
cccggcgttg tcggccatgc gcttttccag gatccgcgcg agggtgccgt aaatggtttt 960
gcactcgcct tgcaggtcgg cctgcagatc ggggttgctg gtttccagcc gatggcgagt 1020
gttcaggtag tacccccctt ccgtcacggt aaaggcgata actttggtct gcgggtttgc 1080
cccttcgtta atcagcggct gtagcccggc ctgccacggt agcagtttct ggattgaggt 1140
gatctcttca tattcgcgct ccccttccgg gctgacggtc tcgaggacgt aacgtcctcc 1200
ctgcgccgcc agcgcctgga ccacctgctc ggcgtcgttg cgaatattcc ccgccgcgat 1260
gcgccagcga ttatccccgg aagcaatcag acgatgcaga taccacgcct gatgcgcgcg 1320
atgaaaagaa cccagaccga tatgaagcca tgtgaattga ttgttcat 1368
<210> 186
<211> 455
<212> PRT
<213> 肺炎克雷伯氏菌
<400> 186
Met Asn Asn Gln Phe Thr Trp Leu His Ile Gly Leu Gly Ser Phe His
1 5 10 15
Arg Ala His Gln Ala Trp Tyr Leu His Arg Leu Ile Ala Ser Gly Asp
20 25 30
Asn Arg Trp Arg Ile Ala Ala Gly Asn Ile Arg Asn Asp Ala Glu Gln
35 40 45
Val Val Gln Ala Leu Ala Ala Gln Gly Gly Arg Tyr Val Leu Glu Thr
50 55 60
Val Ser Pro Glu Gly Glu Arg Glu Tyr Glu Glu Ile Thr Ser Ile Gln
65 70 75 80
Lys Leu Leu Pro Trp Gln Ala Gly Leu Gln Pro Leu Ile Asn Glu Gly
85 90 95
Ala Asn Pro Gln Thr Lys Val Ile Ala Phe Thr Val Thr Glu Gly Gly
100 105 110
Tyr Tyr Leu Asn Thr Arg His Arg Leu Glu Thr Ser Asn Pro Asp Leu
115 120 125
Gln Ala Asp Leu Gln Gly Glu Cys Lys Thr Ile Tyr Gly Thr Leu Ala
130 135 140
Arg Ile Leu Glu Lys Arg Met Ala Asp Asn Ala Gly Pro Leu Thr Leu
145 150 155 160
Leu Asn Cys Asp Asn Val Arg His Asn Gly Glu Arg Phe His Asp Gly
165 170 175
Met Val Glu Phe Leu Gln Leu Thr Gly Lys Gln Ala Val Ile Asp Trp
180 185 190
Met Ala Ala Asn Thr Thr Cys Pro Asn Thr Met Val Asp Arg Ile Thr
195 200 205
Pro Arg Pro Ala Ala Asp Leu Pro Ala Arg Ile Lys Ala Gln Ala Gly
210 215 220
Ile Asp Asp Lys Ala Pro Val Met Gly Glu Thr Phe Ile Gln Trp Val
225 230 235 240
Val Glu Asn Asn Phe Arg Asp Val Arg Pro Asn Leu Glu Ala Val Gly
245 250 255
Val Glu Met Val Glu Ser Val Ile Pro Tyr Glu Glu Ala Lys Ile Arg
260 265 270
Ile Leu Asn Ala Ser His Ser Cys Ile Ala Trp Ala Gly Thr Leu Ile
275 280 285
Gly Gln Gln Tyr Ile His Glu Ser Thr Leu Thr Asp Val Ile Tyr Ala
290 295 300
Ile Ala Asp Arg Tyr Val Thr Glu Asp Val Ile Pro Cys Leu Gly Asp
305 310 315 320
Asn Gly Ile Asp Leu Pro Thr Tyr Arg Asp Val Val Leu Lys Arg Phe
325 330 335
Thr Asn Pro Tyr Ile Gln Asp Thr Asn Gln Arg Val Ala Ala Asp Gly
340 345 350
Phe Ser Lys Ile Pro Ala Met Ile Ala Pro Thr Leu Gln Glu Cys Tyr
355 360 365
Gln Arg Gly Val Arg Pro Glu Ala Thr Ala Met Leu Pro Ala Leu Phe
370 375 380
Phe Val Phe Met Glu Gln Trp His Lys Gly Thr Leu Pro Tyr Gln Tyr
385 390 395 400
Gln Asp Gly Ile Leu Asp Ala Gln Ala Val His Glu Met Phe Glu Ala
405 410 415
Gln Asp Pro Val Ala Val Phe Ala Arg Asp Lys Ala Leu Phe Gly Asp
420 425 430
Leu Ala Asn Asn Ala Asp Phe Leu Ala Leu Met Arg Glu Lys Val Ala
435 440 445
Ala Val Tyr Thr Leu Ile Asn
450 455
<210> 187
<211> 1398
<212> DNA
<213> 茄科雷尔氏菌(Ralstonia solanacearum)
<400> 187
atgacgcggt cgtccctcgc gcgtgcgcca gtgctgctgc atattggcgc cggatctttc 60
catcgtgcgc accaggcgtg gtatctgcat cgcgtcaacg cggccgtgcc tcccggcgag 120
cgctggacgc tgacggtcgg gaacattcgc gacgacatgc acgcgacact cgccgcgctg 180
gccgcgcagc agggtgccta cacgctcgag accgtcacgc cgcaaggcga gcgtgcgtat 240
gagacgatcc gctcgatcgc gcgggtgctg ccctggtccg ccgatcttgc cgcgctcatc 300
aatacgggcg ccgatcccgc gtgccggatc gtgtcgttta cggtcaccga aggcgggtat 360
tacctcgacg agcacgatcg tctcgatgtc acgcatcccg atctcgcggc cgacctgcgg 420
ggcgcccgct cgacgctata cggcgcattg gccgcgttgc tcgccgagcg ccgccagcgc 480
ggagccgggc cgctcacgct gcagagttgc gacaatctgc gcagcaacgg cgcgcgtttt 540
cgcgcgggca tgcgcgcgtt cctcgcgctg cgcggcgacg cagcgctcct cgcgtggttc 600
gatgccaacg tatcgtgccc gagcgcgatg gtcgaccgga tcacgccgcg gccgaccgac 660
gacgtccgca cgcgcgtgca cgcggccacc ggcgtcgacg accgctgccc ggtcatgggc 720
gaatccttca tccaatgggt gatcgaggac aacttcatcg ccggccggcc ggcatgggag 780
atcgcgggcg cggagatcgt cgccgatgtg catccgtacg aagaggcgaa gatccggatc 840
ctgaatgcga cgcacagctg catcgcctgg gcgggcacgc tcgcgggact cacctacatt 900
cacgaaggga tgcgtgatgc ggccatttat cgcttcgcct acgactacgt caccgacgac 960
gtgattccct gcctgacgcc gagcccgctg gatctcgagc gctatcggga cgtcgtgctc 1020
gagcgcttcg gcaatccgta cgtgctcgac accaaccagc gtgtcgccgc cgatggcttc 1080
tcgaaaatcc ccggcttcat cgcaccgacg ctcgccgaat gctttgcgcg cggcgccgat 1140
ccggtcgcga ccgcggtgtt gccggcgctg tttctgggct tccttgaagg ttgggcgcgc 1200
ggcaccttgc cctacgtata ccaggacggc gtgatggatg gcgccgccgc acgcagcatc 1260
gtcgaggctc cggattccgt tgccgcgttc tgttcagatc gccaattgtg gggttcgctt 1320
gcgggccgcg acgcgcttgt ccaggcggtg cgtgcgggac gcgcgcgcgt tgaagcatgg 1380
cgagccgcac gccgctga 1398
<210> 188
<211> 465
<212> PRT
<213> 茄科雷尔氏菌
<400> 188
Met Thr Arg Ser Ser Leu Ala Arg Ala Pro Val Leu Leu His Ile Gly
1 5 10 15
Ala Gly Ser Phe His Arg Ala His Gln Ala Trp Tyr Leu His Arg Val
20 25 30
Asn Ala Ala Val Pro Pro Gly Glu Arg Trp Thr Leu Thr Val Gly Asn
35 40 45
Ile Arg Asp Asp Met His Ala Thr Leu Ala Ala Leu Ala Ala Gln Gln
50 55 60
Gly Ala Tyr Thr Leu Glu Thr Val Thr Pro Gln Gly Glu Arg Ala Tyr
65 70 75 80
Glu Thr Ile Arg Ser Ile Ala Arg Val Leu Pro Trp Ser Ala Asp Leu
85 90 95
Ala Ala Leu Ile Asn Thr Gly Ala Asp Pro Ala Cys Arg Ile Val Ser
100 105 110
Phe Thr Val Thr Glu Gly Gly Tyr Tyr Leu Asp Glu His Asp Arg Leu
115 120 125
Asp Val Thr His Pro Asp Leu Ala Ala Asp Leu Arg Gly Ala Arg Ser
130 135 140
Thr Leu Tyr Gly Ala Leu Ala Ala Leu Leu Ala Glu Arg Arg Gln Arg
145 150 155 160
Gly Ala Gly Pro Leu Thr Leu Gln Ser Cys Asp Asn Leu Arg Ser Asn
165 170 175
Gly Ala Arg Phe Arg Ala Gly Met Arg Ala Phe Leu Ala Leu Arg Gly
180 185 190
Asp Ala Ala Leu Leu Ala Trp Phe Asp Ala Asn Val Ser Cys Pro Ser
195 200 205
Ala Met Val Asp Arg Ile Thr Pro Arg Pro Thr Asp Asp Val Arg Thr
210 215 220
Arg Val His Ala Ala Thr Gly Val Asp Asp Arg Cys Pro Val Met Gly
225 230 235 240
Glu Ser Phe Ile Gln Trp Val Ile Glu Asp Asn Phe Ile Ala Gly Arg
245 250 255
Pro Ala Trp Glu Ile Ala Gly Ala Glu Ile Val Ala Asp Val His Pro
260 265 270
Tyr Glu Glu Ala Lys Ile Arg Ile Leu Asn Ala Thr His Ser Cys Ile
275 280 285
Ala Trp Ala Gly Thr Leu Ala Gly Leu Thr Tyr Ile His Glu Gly Met
290 295 300
Arg Asp Ala Ala Ile Tyr Arg Phe Ala Tyr Asp Tyr Val Thr Asp Asp
305 310 315 320
Val Ile Pro Cys Leu Thr Pro Ser Pro Leu Asp Leu Glu Arg Tyr Arg
325 330 335
Asp Val Val Leu Glu Arg Phe Gly Asn Pro Tyr Val Leu Asp Thr Asn
340 345 350
Gln Arg Val Ala Ala Asp Gly Phe Ser Lys Ile Pro Gly Phe Ile Ala
355 360 365
Pro Thr Leu Ala Glu Cys Phe Ala Arg Gly Ala Asp Pro Val Ala Thr
370 375 380
Ala Val Leu Pro Ala Leu Phe Leu Gly Phe Leu Glu Gly Trp Ala Arg
385 390 395 400
Gly Thr Leu Pro Tyr Val Tyr Gln Asp Gly Val Met Asp Gly Ala Ala
405 410 415
Ala Arg Ser Ile Val Glu Ala Pro Asp Ser Val Ala Ala Phe Cys Ser
420 425 430
Asp Arg Gln Leu Trp Gly Ser Leu Ala Gly Arg Asp Ala Leu Val Gln
435 440 445
Ala Val Arg Ala Gly Arg Ala Arg Val Glu Ala Trp Arg Ala Ala Arg
450 455 460
Arg
465
<210> 189
<211> 1185
<212> DNA
<213> 枯草芽孢杆菌
<400> 189
atgaatcgta tcgcagctga cgttcagcgt gcttttgaaa acgccggaga aaagacgttg 60
cctataaaag ttgaagaaat tgttctcggt aagcaagcag ctgattcgct tttggattat 120
gtaaaacgaa aaaacaatca acatattgtc cttgtctgcg acgcgaatac acaccgcatt 180
gcaggaattg atttagaaaa ccgactgaat caagaaggat ttcaggccga gtgcctgatc 240
attccagaaa atgaagccgg agatgtgaca gctgatgaac gatcgctcat tcatgtgctg 300
atccatacga aacaaccaac ggatgtcatg atcgcagtcg gttcgggcac gattcatgat 360
atcgtccgct ttgcggcgtt tcaaagagat ttgccgttta tttcttatcc gactgctcca 420
tctgtagacg gttttacatc agccggtgcg ccgattattt tatacggcac gaaaacaacc 480
attcaaacga aggccccatc tgcgctgttc gctgatctgg atctattaaa agcggcaccg 540
cagtcaatgg tggcggctgg ctttggtgac atgctcggta aaatcacgtc tttagcagat 600
tgggaaatat cccggcatct tgccggtgag ccttattcgc ctgcaggagc taagatcgtt 660
caggaggcgc ttgctgcctg cattgaacac acagaagaca ttgcgatgaa aacggaaact 720
ggcatacggg ttttgatgga gtctttactt gtatcggggc ttgtcatgct ggcattagat 780
cattcccgac cggcatcagg cggcgagcat catatttcac attggattga aatggagtta 840
atggagaaaa aacggcctca gattcttcat ggggcaaagg tgggctgtgc cgctgtttta 900
ttaactgaca catacagaaa gctcgctcag gatgacgggc tgaacgaatt ttcaccaagc 960
cgccgggaag ccatccaatc ggcttatcaa acactcccga gaggagaagt gctggctgat 1020
tggctgagat cagccggagg ccctgcgtat tttgacgaaa tcggtgtcgg gcaggattcc 1080
gtcaaaaatg ccttcagaca cgcgcacacc ttaagagacc gatgcaccgg attaagaatc 1140
atcaatgaaa acaaaacgct gatcaaccat ggtctatatg aatag 1185
<210> 190
<211> 394
<212> PRT
<213> 枯草芽孢杆菌
<400> 190
Met Asn Arg Ile Ala Ala Asp Val Gln Arg Ala Phe Glu Asn Ala Gly
1 5 10 15
Glu Lys Thr Leu Pro Ile Lys Val Glu Glu Ile Val Leu Gly Lys Gln
20 25 30
Ala Ala Asp Ser Leu Leu Asp Tyr Val Lys Arg Lys Asn Asn Gln His
35 40 45
Ile Val Leu Val Cys Asp Ala Asn Thr His Arg Ile Ala Gly Ile Asp
50 55 60
Leu Glu Asn Arg Leu Asn Gln Glu Gly Phe Gln Ala Glu Cys Leu Ile
65 70 75 80
Ile Pro Glu Asn Glu Ala Gly Asp Val Thr Ala Asp Glu Arg Ser Leu
85 90 95
Ile His Val Leu Ile His Thr Lys Gln Pro Thr Asp Val Met Ile Ala
100 105 110
Val Gly Ser Gly Thr Ile His Asp Ile Val Arg Phe Ala Ala Phe Gln
115 120 125
Arg Asp Leu Pro Phe Ile Ser Tyr Pro Thr Ala Pro Ser Val Asp Gly
130 135 140
Phe Thr Ser Ala Gly Ala Pro Ile Ile Leu Tyr Gly Thr Lys Thr Thr
145 150 155 160
Ile Gln Thr Lys Ala Pro Ser Ala Leu Phe Ala Asp Leu Asp Leu Leu
165 170 175
Lys Ala Ala Pro Gln Ser Met Val Ala Ala Gly Phe Gly Asp Met Leu
180 185 190
Gly Lys Ile Thr Ser Leu Ala Asp Trp Glu Ile Ser Arg His Leu Ala
195 200 205
Gly Glu Pro Tyr Ser Pro Ala Gly Ala Lys Ile Val Gln Glu Ala Leu
210 215 220
Ala Ala Cys Ile Glu His Thr Glu Asp Ile Ala Met Lys Thr Glu Thr
225 230 235 240
Gly Ile Arg Val Leu Met Glu Ser Leu Leu Val Ser Gly Leu Val Met
245 250 255
Leu Ala Leu Asp His Ser Arg Pro Ala Ser Gly Gly Glu His His Ile
260 265 270
Ser His Trp Ile Glu Met Glu Leu Met Glu Lys Lys Arg Pro Gln Ile
275 280 285
Leu His Gly Ala Lys Val Gly Cys Ala Ala Val Leu Leu Thr Asp Thr
290 295 300
Tyr Arg Lys Leu Ala Gln Asp Asp Gly Leu Asn Glu Phe Ser Pro Ser
305 310 315 320
Arg Arg Glu Ala Ile Gln Ser Ala Tyr Gln Thr Leu Pro Arg Gly Glu
325 330 335
Val Leu Ala Asp Trp Leu Arg Ser Ala Gly Gly Pro Ala Tyr Phe Asp
340 345 350
Glu Ile Gly Val Gly Gln Asp Ser Val Lys Asn Ala Phe Arg His Ala
355 360 365
His Thr Leu Arg Asp Arg Cys Thr Gly Leu Arg Ile Ile Asn Glu Asn
370 375 380
Lys Thr Leu Ile Asn His Gly Leu Tyr Glu
385 390
<210> 191
<211> 1059
<212> DNA
<213> 敏捷气热菌(Aeropyrum pernix)
<400> 191
ttgtatacct cgttccacag gatagacctc ccgaggacta tagtagtcgg cggaggcgtt 60
ctcgacaagg cgggcggcta tgtatctggg gtggctcagc gaggcagcta tgtgctcgtc 120
gtatccggcc caacggtgtc ctcgaaatac ttcgagaggc ttagagccag cctcgaggcc 180
gagggcctta cagtcggcct gaagataatc agggacgcca cggttgagac tgctgaggag 240
gtggcccgtg aggctcttga gagcaggata gaggttgtgg cgggcctggg aggtgggaag 300
tcgatagacg ttgctaagta cgcttcaaaa agggcgggct cggttttcgt cagcataccc 360
accgtggcta gccacgacgg gataacatcg ccattctcaa gcctgaaggg gttcgacaag 420
cctatatcga ggcccgctaa ggctccggag gcgataatta tagatgtgga tgtgatagcg 480
gaggctccca ggcgctacaa catcgctggc ttcggagacc tgataggcaa gtatactgca 540
gtcctcgact ggaggctggc ccacaagctc aggctggaat actatggcga atacgccgcc 600
agtctcgccc tcctgagcgc caaacatgtg agccagtacg ccgaggagat agcgctgggt 660
acgagggagg gctatagagt gctgctggag gctctcgtga gcagcggggt gtcgatgtgt 720
atagccggta gcacgaggcc tgcaagcggc agtgaacacc tcttcgccca cgccctccac 780
atagtcgcta ggaacaagcc tctccacggc gaggcggttg gggtggggac tataatgatg 840
gcctacctcc acggtaagaa ctggaggagg ataaggggcc tgctgaagac ggtcggcgcc 900
cccactaacg ccaaggagct tggtgtcgag gatgatgagg ttgttgaggc cctcactata 960
gcagccagga tcagaccgga gaggtacacc atactaggtg aaaaggggct cacgagagag 1020
gcggctgagg cgctggcgcg caagacgggc gttatatag 1059
<210> 192
<211> 352
<212> PRT
<213> 敏捷气热菌(Aeropyrum pernix)
<400> 192
Met Tyr Thr Ser Phe His Arg Ile Asp Leu Pro Arg Thr Ile Val Val
1 5 10 15
Gly Gly Gly Val Leu Asp Lys Ala Gly Gly Tyr Val Ser Gly Val Ala
20 25 30
Gln Arg Gly Ser Tyr Val Leu Val Val Ser Gly Pro Thr Val Ser Ser
35 40 45
Lys Tyr Phe Glu Arg Leu Arg Ala Ser Leu Glu Ala Glu Gly Leu Thr
50 55 60
Val Gly Leu Lys Ile Ile Arg Asp Ala Thr Val Glu Thr Ala Glu Glu
65 70 75 80
Val Ala Arg Glu Ala Leu Glu Ser Arg Ile Glu Val Val Ala Gly Leu
85 90 95
Gly Gly Gly Lys Ser Ile Asp Val Ala Lys Tyr Ala Ser Lys Arg Ala
100 105 110
Gly Ser Val Phe Val Ser Ile Pro Thr Val Ala Ser His Asp Gly Ile
115 120 125
Thr Ser Pro Phe Ser Ser Leu Lys Gly Phe Asp Lys Pro Ile Ser Arg
130 135 140
Pro Ala Lys Ala Pro Glu Ala Ile Ile Ile Asp Val Asp Val Ile Ala
145 150 155 160
Glu Ala Pro Arg Arg Tyr Asn Ile Ala Gly Phe Gly Asp Leu Ile Gly
165 170 175
Lys Tyr Thr Ala Val Leu Asp Trp Arg Leu Ala His Lys Leu Arg Leu
180 185 190
Glu Tyr Tyr Gly Glu Tyr Ala Ala Ser Leu Ala Leu Leu Ser Ala Lys
195 200 205
His Val Ser Gln Tyr Ala Glu Glu Ile Ala Leu Gly Thr Arg Glu Gly
210 215 220
Tyr Arg Val Leu Leu Glu Ala Leu Val Ser Ser Gly Val Ser Met Cys
225 230 235 240
Ile Ala Gly Ser Thr Arg Pro Ala Ser Gly Ser Glu His Leu Phe Ala
245 250 255
His Ala Leu His Ile Val Ala Arg Asn Lys Pro Leu His Gly Glu Ala
260 265 270
Val Gly Val Gly Thr Ile Met Met Ala Tyr Leu His Gly Lys Asn Trp
275 280 285
Arg Arg Ile Arg Gly Leu Leu Lys Thr Val Gly Ala Pro Thr Asn Ala
290 295 300
Lys Glu Leu Gly Val Glu Asp Asp Glu Val Val Glu Ala Leu Thr Ile
305 310 315 320
Ala Ala Arg Ile Arg Pro Glu Arg Tyr Thr Ile Leu Gly Glu Lys Gly
325 330 335
Leu Thr Arg Glu Ala Ala Glu Ala Leu Ala Arg Lys Thr Gly Val Ile
340 345 350
<210> 193
<211> 1020
<212> DNA
<213> 大肠杆菌
<400> 193
atgaaccaac gtaatgcttc aatgactgtg atcggtgccg gctcgtacgg caccgctctt 60
gccatcaccc tggcaagaaa tggccacgag gttgtcctct ggggccatga ccctgaacat 120
atcgcaacgc ttgaacgcga ccgctgtaac gccgcgtttc tccccgatgt gccttttccc 180
gatacgctcc atcttgaaag cgatctcgcc actgcgctgg cagccagccg taatattctc 240
gtcgtcgtac ccagccatgt ctttggtgaa gtgctgcgcc agattaaacc actgatgcgt 300
cctgatgcgc gtctggtgtg ggcgaccaaa gggctggaag cggaaaccgg acgtctgtta 360
caggacgtgg cgcgtgaggc cttaggcgat caaattccgc tggcggttat ctctggccca 420
acgtttgcga aagaactggc ggcaggttta ccgacagcta tttcgctggc ctcgaccgat 480
cagacctttg ccgatgatct ccagcagctg ctgcactgcg gcaaaagttt ccgcgtttac 540
agcaatccgg atttcattgg cgtgcagctt ggcggcgcgg tgaaaaacgt tattgccatt 600
ggtgcgggga tgtccgacgg tatcggtttt ggtgcgaatg cgcgtacggc gctgatcacc 660
cgtgggctgg ctgaaatgtc gcgtcttggt gcggcgctgg gtgccgaccc tgccaccttt 720
atgggcatgg cggggcttgg cgatctggtg cttacctgta ccgacaacca gtcgcgtaac 780
cgccgttttg gcatgatgct cggtcagggc atggatgtac aaagcgcgca ggagaagatt 840
ggtcaggtgg tggaaggcta ccgcaatacg aaagaagtcc gcgaactggc gcatcgcttc 900
ggcgttgaaa tgccaataac cgaggaaatt tatcaagtat tatattgcgg aaaaaacgcg 960
cgcgaggcag cattgacttt actaggtcgt gcacgcaagg acgagcgcag cagccactaa 1020
<210> 194
<211> 339
<212> PRT
<213> 大肠杆菌
<400> 194
Met Asn Gln Arg Asn Ala Ser Met Thr Val Ile Gly Ala Gly Ser Tyr
1 5 10 15
Gly Thr Ala Leu Ala Ile Thr Leu Ala Arg Asn Gly His Glu Val Val
20 25 30
Leu Trp Gly His Asp Pro Glu His Ile Ala Thr Leu Glu Arg Asp Arg
35 40 45
Cys Asn Ala Ala Phe Leu Pro Asp Val Pro Phe Pro Asp Thr Leu His
50 55 60
Leu Glu Ser Asp Leu Ala Thr Ala Leu Ala Ala Ser Arg Asn Ile Leu
65 70 75 80
Val Val Val Pro Ser His Val Phe Gly Glu Val Leu Arg Gln Ile Lys
85 90 95
Pro Leu Met Arg Pro Asp Ala Arg Leu Val Trp Ala Thr Lys Gly Leu
100 105 110
Glu Ala Glu Thr Gly Arg Leu Leu Gln Asp Val Ala Arg Glu Ala Leu
115 120 125
Gly Asp Gln Ile Pro Leu Ala Val Ile Ser Gly Pro Thr Phe Ala Lys
130 135 140
Glu Leu Ala Ala Gly Leu Pro Thr Ala Ile Ser Leu Ala Ser Thr Asp
145 150 155 160
Gln Thr Phe Ala Asp Asp Leu Gln Gln Leu Leu His Cys Gly Lys Ser
165 170 175
Phe Arg Val Tyr Ser Asn Pro Asp Phe Ile Gly Val Gln Leu Gly Gly
180 185 190
Ala Val Lys Asn Val Ile Ala Ile Gly Ala Gly Met Ser Asp Gly Ile
195 200 205
Gly Phe Gly Ala Asn Ala Arg Thr Ala Leu Ile Thr Arg Gly Leu Ala
210 215 220
Glu Met Ser Arg Leu Gly Ala Ala Leu Gly Ala Asp Pro Ala Thr Phe
225 230 235 240
Met Gly Met Ala Gly Leu Gly Asp Leu Val Leu Thr Cys Thr Asp Asn
245 250 255
Gln Ser Arg Asn Arg Arg Phe Gly Met Met Leu Gly Gln Gly Met Asp
260 265 270
Val Gln Ser Ala Gln Glu Lys Ile Gly Gln Val Val Glu Gly Tyr Arg
275 280 285
Asn Thr Lys Glu Val Arg Glu Leu Ala His Arg Phe Gly Val Glu Met
290 295 300
Pro Ile Thr Glu Glu Ile Tyr Gln Val Leu Tyr Cys Gly Lys Asn Ala
305 310 315 320
Arg Glu Ala Ala Leu Thr Leu Leu Gly Arg Ala Arg Lys Asp Glu Arg
325 330 335
Ser Ser His
<210> 195
<211> 1176
<212> DNA
<213> 酿酒酵母
<400> 195
atgtctgctg ctgctgatag attaaactta acttccggcc acttgaatgc tggtagaaag 60
agaagttcct cttctgtttc tttgaaggct gccgaaaagc ctttcaaggt tactgtgatt 120
ggatctggta actggggtac tactattgcc aaggtggttg ccgaaaattg taagggatac 180
ccagaagttt tcgctccaat agtacaaatg tgggtgttcg aagaagagat caatggtgaa 240
aaattgactg aaatcataaa tactagacat caaaacgtga aatacttgcc tggcatcact 300
ctacccgaca atttggttgc taatccagac ttgattgatt cagtcaagga tgtcgacatc 360
atcgttttca acattccaca tcaatttttg ccccgtatct gtagccaatt gaaaggtcat 420
gttgattcac acgtcagagc tatctcctgt ctaaagggtt ttgaagttgg tgctaaaggt 480
gtccaattgc tatcctctta catcactgag gaactaggta ttcaatgtgg tgctctatct 540
ggtgctaaca ttgccaccga agtcgctcaa gaacactggt ctgaaacaac agttgcttac 600
cacattccaa aggatttcag aggcgagggc aaggacgtcg accataaggt tctaaaggcc 660
ttgttccaca gaccttactt ccacgttagt gtcatcgaag atgttgctgg tatctccatc 720
tgtggtgctt tgaagaacgt tgttgcctta ggttgtggtt tcgtcgaagg tctaggctgg 780
ggtaacaacg cttctgctgc catccaaaga gtcggtttgg gtgagatcat cagattcggt 840
caaatgtttt tcccagaatc tagagaagaa acatactacc aagagtctgc tggtgttgct 900
gatttgatca ccacctgcgc tggtggtaga aacgtcaagg ttgctaggct aatggctact 960
tctggtaagg acgcctggga atgtgaaaag gagttgttga atggccaatc cgctcaaggt 1020
ttaattacct gcaaagaagt tcacgaatgg ttggaaacat gtggctctgt cgaagacttc 1080
ccattatttg aagccgtata ccaaatcgtt tacaacaact acccaatgaa gaacctgccg 1140
gacatgattg aagaattaga tctacatgaa gattag 1176
<210> 196
<211> 391
<212> PRT
<213> 酿酒酵母
<400> 196
Met Ser Ala Ala Ala Asp Arg Leu Asn Leu Thr Ser Gly His Leu Asn
1 5 10 15
Ala Gly Arg Lys Arg Ser Ser Ser Ser Val Ser Leu Lys Ala Ala Glu
20 25 30
Lys Pro Phe Lys Val Thr Val Ile Gly Ser Gly Asn Trp Gly Thr Thr
35 40 45
Ile Ala Lys Val Val Ala Glu Asn Cys Lys Gly Tyr Pro Glu Val Phe
50 55 60
Ala Pro Ile Val Gln Met Trp Val Phe Glu Glu Glu Ile Asn Gly Glu
65 70 75 80
Lys Leu Thr Glu Ile Ile Asn Thr Arg His Gln Asn Val Lys Tyr Leu
85 90 95
Pro Gly Ile Thr Leu Pro Asp Asn Leu Val Ala Asn Pro Asp Leu Ile
100 105 110
Asp Ser Val Lys Asp Val Asp Ile Ile Val Phe Asn Ile Pro His Gln
115 120 125
Phe Leu Pro Arg Ile Cys Ser Gln Leu Lys Gly His Val Asp Ser His
130 135 140
Val Arg Ala Ile Ser Cys Leu Lys Gly Phe Glu Val Gly Ala Lys Gly
145 150 155 160
Val Gln Leu Leu Ser Ser Tyr Ile Thr Glu Glu Leu Gly Ile Gln Cys
165 170 175
Gly Ala Leu Ser Gly Ala Asn Ile Ala Thr Glu Val Ala Gln Glu His
180 185 190
Trp Ser Glu Thr Thr Val Ala Tyr His Ile Pro Lys Asp Phe Arg Gly
195 200 205
Glu Gly Lys Asp Val Asp His Lys Val Leu Lys Ala Leu Phe His Arg
210 215 220
Pro Tyr Phe His Val Ser Val Ile Glu Asp Val Ala Gly Ile Ser Ile
225 230 235 240
Cys Gly Ala Leu Lys Asn Val Val Ala Leu Gly Cys Gly Phe Val Glu
245 250 255
Gly Leu Gly Trp Gly Asn Asn Ala Ser Ala Ala Ile Gln Arg Val Gly
260 265 270
Leu Gly Glu Ile Ile Arg Phe Gly Gln Met Phe Phe Pro Glu Ser Arg
275 280 285
Glu Glu Thr Tyr Tyr Gln Glu Ser Ala Gly Val Ala Asp Leu Ile Thr
290 295 300
Thr Cys Ala Gly Gly Arg Asn Val Lys Val Ala Arg Leu Met Ala Thr
305 310 315 320
Ser Gly Lys Asp Ala Trp Glu Cys Glu Lys Glu Leu Leu Asn Gly Gln
325 330 335
Ser Ala Gln Gly Leu Ile Thr Cys Lys Glu Val His Glu Trp Leu Glu
340 345 350
Thr Cys Gly Ser Val Glu Asp Phe Pro Leu Phe Glu Ala Val Tyr Gln
355 360 365
Ile Val Tyr Asn Asn Tyr Pro Met Lys Asn Leu Pro Asp Met Ile Glu
370 375 380
Glu Leu Asp Leu His Glu Asp
385 390
<210> 197
<211> 1224
<212> DNA
<213> 大肠杆菌
<400> 197
atgaaacgtg catttattat ggtgctggac tcattcggca tcggcgctac agaagatgca 60
gaacgctttg gtgacgtcgg ggctgacacc ctgggtcata tcgcagaagc ttgtgccaaa 120
ggcgaagctg ataacggtcg taaaggcccg ctcaatctgc caaatctgac ccgtctgggg 180
ctggcgaaag cacacgaagg ttctaccggt ttcattccgg cgggaatgga cggcaacgct 240
gaagttatcg gcgcgtacgc atgggcgcac gaaatgtcat ccggtaaaga taccccgtct 300
ggtcactggg aaattgccgg tgtcccggtt ctgtttgagt ggggatattt ctccgatcac 360
gaaaacagct tcccgcaaga gctgctggat aaactggtcg aacgcgctaa tctgccgggt 420
tacctcggta actgccactc ttccggtacg gtcattctgg atcaactggg cgaagagcac 480
atgaaaaccg gcaagccgat tttctatacc tccgctgact ccgtgttcca gattgcctgc 540
catgaagaaa ctttcggtct ggataaactc tacgaactgt gcgaaatcgc ccgtgaagag 600
ctgaccaacg gcggctacaa tatcggtcgt gttatcgctc gtccgtttat cggcgacaaa 660
gccggtaact tccagcgtac cggtaaccgt cacgacctgg ctgttgagcc gccagcaccg 720
accgtgctgc agaaactggt tgatgaaaaa cacggccagg tggtttctgt cggtaaaatt 780
gcggacatct acgccaactg cggtatcacc aaaaaagtga aagcgactgg cctggacgcg 840
ctgtttgacg ccaccatcaa agagatgaaa gaagcgggtg ataacaccat cgtcttcacc 900
aacttcgttg acttcgactc ttcctggggc caccgtcgcg acgtcgccgg ttatgccgcg 960
ggtctggaac tgttcgaccg ccgtctgccg gagctgatgt ctctgctgcg cgatgacgac 1020
atcctgatcc tcaccgctga ccacggttgc gatccgacct ggaccggtac tgaccacacg 1080
cgtgaacaca ttccggtact ggtatatggc ccgaaagtaa aaccgggctc actgggtcat 1140
cgtgaaacct tcgcggatat cggccagact ctggcaaaat attttggtac ttctgatatg 1200
gaatatggca aagccatgtt ctga 1224
<210> 198
<211> 407
<212> PRT
<213> 大肠杆菌
<400> 198
Met Lys Arg Ala Phe Ile Met Val Leu Asp Ser Phe Gly Ile Gly Ala
1 5 10 15
Thr Glu Asp Ala Glu Arg Phe Gly Asp Val Gly Ala Asp Thr Leu Gly
20 25 30
His Ile Ala Glu Ala Cys Ala Lys Gly Glu Ala Asp Asn Gly Arg Lys
35 40 45
Gly Pro Leu Asn Leu Pro Asn Leu Thr Arg Leu Gly Leu Ala Lys Ala
50 55 60
His Glu Gly Ser Thr Gly Phe Ile Pro Ala Gly Met Asp Gly Asn Ala
65 70 75 80
Glu Val Ile Gly Ala Tyr Ala Trp Ala His Glu Met Ser Ser Gly Lys
85 90 95
Asp Thr Pro Ser Gly His Trp Glu Ile Ala Gly Val Pro Val Leu Phe
100 105 110
Glu Trp Gly Tyr Phe Ser Asp His Glu Asn Ser Phe Pro Gln Glu Leu
115 120 125
Leu Asp Lys Leu Val Glu Arg Ala Asn Leu Pro Gly Tyr Leu Gly Asn
130 135 140
Cys His Ser Ser Gly Thr Val Ile Leu Asp Gln Leu Gly Glu Glu His
145 150 155 160
Met Lys Thr Gly Lys Pro Ile Phe Tyr Thr Ser Ala Asp Ser Val Phe
165 170 175
Gln Ile Ala Cys His Glu Glu Thr Phe Gly Leu Asp Lys Leu Tyr Glu
180 185 190
Leu Cys Glu Ile Ala Arg Glu Glu Leu Thr Asn Gly Gly Tyr Asn Ile
195 200 205
Gly Arg Val Ile Ala Arg Pro Phe Ile Gly Asp Lys Ala Gly Asn Phe
210 215 220
Gln Arg Thr Gly Asn Arg His Asp Leu Ala Val Glu Pro Pro Ala Pro
225 230 235 240
Thr Val Leu Gln Lys Leu Val Asp Glu Lys His Gly Gln Val Val Ser
245 250 255
Val Gly Lys Ile Ala Asp Ile Tyr Ala Asn Cys Gly Ile Thr Lys Lys
260 265 270
Val Lys Ala Thr Gly Leu Asp Ala Leu Phe Asp Ala Thr Ile Lys Glu
275 280 285
Met Lys Glu Ala Gly Asp Asn Thr Ile Val Phe Thr Asn Phe Val Asp
290 295 300
Phe Asp Ser Ser Trp Gly His Arg Arg Asp Val Ala Gly Tyr Ala Ala
305 310 315 320
Gly Leu Glu Leu Phe Asp Arg Arg Leu Pro Glu Leu Met Ser Leu Leu
325 330 335
Arg Asp Asp Asp Ile Leu Ile Leu Thr Ala Asp His Gly Cys Asp Pro
340 345 350
Thr Trp Thr Gly Thr Asp His Thr Arg Glu His Ile Pro Val Leu Val
355 360 365
Tyr Gly Pro Lys Val Lys Pro Gly Ser Leu Gly His Arg Glu Thr Phe
370 375 380
Ala Asp Ile Gly Gln Thr Leu Ala Lys Tyr Phe Gly Thr Ser Asp Met
385 390 395 400
Glu Tyr Gly Lys Ala Met Phe
405
<210> 199
<211> 1641
<212> DNA
<213> 大肠杆菌
<400> 199
atggcaatcc acaatcgtgc aggccaacct gcacaacaga gtgatttgat taacgtcgcc 60
caactgacgg cgcaatatta tgtactgaaa ccagaagcag ggaatgcgga gcacgcggtg 120
aaattcggta cttccggtca ccgtggcagt gcagcgcgcc acagctttaa cgagccgcac 180
attctggcga tcgctcaggc aattgctgaa gaacgtgcga aaaacggcat cactggccct 240
tgctatgtgg gtaaagatac tcacgccctg tccgaacctg cattcatttc cgttctggaa 300
gtgctggcag cgaacggcgt tgatgtcatt gtgcaggaaa acaatggctt caccccgacg 360
cctgccgttt ccaatgccat cctggttcac aataaaaaag gtggcccgct ggcagacggt 420
atcgtgatta caccgtccca taacccgccg gaagatggtg gaatcaaata caatccgcca 480
aatggtggcc cggctgatac caacgtcact aaagtggtgg aagacagggc caacgcactg 540
ctggccgatg gcctgaaagg cgtgaagcgt atctccctcg acgaagcgat ggcatccggt 600
catgtgaaag agcaggatct ggtgcagccg ttcgtggaag gtctggccga tatcgttgat 660
atggccgcga ttcagaaagc gggcctgacg ctgggcgttg atccgctggg cggttccggt 720
atcgaatact ggaagcgtat tggcgagtat tacaacctca acctgactat cgttaacgat 780
caggtcgatc aaaccttccg ctttatgcac cttgataaag acggcgcgat ccgtatggac 840
tgctcctccg agtgtgcgat ggcgggcctg ctggcactgc gtgataagtt cgatctggcg 900
tttgctaacg acccggatta tgaccgtcac ggtatcgtca ctccggcagg tttgatgaat 960
ccgaaccact acctggcggt ggcaatcaat tacctgttcc agcatcgtcc gcagtggggc 1020
aaagatgttg ccgtcggtaa aacgctggtt tcatctgcga tgatcgaccg tgtggtcaac 1080
gacttgggcc gtaaactggt agaagtcccg gtaggtttca aatggtttgt cgatggtctg 1140
ttcgacggca gcttcggctt tggcggcgaa gagagtgcag gggcttcctt cctgcgtttc 1200
gacggcacgc cgtggtccac cgacaaagac ggcatcatca tgtgtctgct ggcggcggaa 1260
atcaccgctg tcaccggtaa gaacccgcag gaacactaca acgaactggc aaaacgcttt 1320
ggtgcgccga gctacaaccg tttgcaggca gctgcgactt ccgcacaaaa agcggcgctg 1380
tctaagctgt ctccggaaat ggtgagcgcc agcaccctgg caggtgaccc gatcaccgcg 1440
cgcctgactg ctgctccggg caacggtgct tctattggcg gtctgaaagt gatgactgac 1500
aacggctggt tcgccgcgcg tccgtcaggc acggaagacg catataagat ctactgcgaa 1560
agcttcctcg gtgaagaaca tcgcaagcag attgagaaag aagcggttga gattgttagc 1620
gaagttctga aaaacgcgta a 1641
<210> 200
<211> 546
<212> PRT
<213> 大肠杆菌
<400> 200
Met Ala Ile His Asn Arg Ala Gly Gln Pro Ala Gln Gln Ser Asp Leu
1 5 10 15
Ile Asn Val Ala Gln Leu Thr Ala Gln Tyr Tyr Val Leu Lys Pro Glu
20 25 30
Ala Gly Asn Ala Glu His Ala Val Lys Phe Gly Thr Ser Gly His Arg
35 40 45
Gly Ser Ala Ala Arg His Ser Phe Asn Glu Pro His Ile Leu Ala Ile
50 55 60
Ala Gln Ala Ile Ala Glu Glu Arg Ala Lys Asn Gly Ile Thr Gly Pro
65 70 75 80
Cys Tyr Val Gly Lys Asp Thr His Ala Leu Ser Glu Pro Ala Phe Ile
85 90 95
Ser Val Leu Glu Val Leu Ala Ala Asn Gly Val Asp Val Ile Val Gln
100 105 110
Glu Asn Asn Gly Phe Thr Pro Thr Pro Ala Val Ser Asn Ala Ile Leu
115 120 125
Val His Asn Lys Lys Gly Gly Pro Leu Ala Asp Gly Ile Val Ile Thr
130 135 140
Pro Ser His Asn Pro Pro Glu Asp Gly Gly Ile Lys Tyr Asn Pro Pro
145 150 155 160
Asn Gly Gly Pro Ala Asp Thr Asn Val Thr Lys Val Val Glu Asp Arg
165 170 175
Ala Asn Ala Leu Leu Ala Asp Gly Leu Lys Gly Val Lys Arg Ile Ser
180 185 190
Leu Asp Glu Ala Met Ala Ser Gly His Val Lys Glu Gln Asp Leu Val
195 200 205
Gln Pro Phe Val Glu Gly Leu Ala Asp Ile Val Asp Met Ala Ala Ile
210 215 220
Gln Lys Ala Gly Leu Thr Leu Gly Val Asp Pro Leu Gly Gly Ser Gly
225 230 235 240
Ile Glu Tyr Trp Lys Arg Ile Gly Glu Tyr Tyr Asn Leu Asn Leu Thr
245 250 255
Ile Val Asn Asp Gln Val Asp Gln Thr Phe Arg Phe Met His Leu Asp
260 265 270
Lys Asp Gly Ala Ile Arg Met Asp Cys Ser Ser Glu Cys Ala Met Ala
275 280 285
Gly Leu Leu Ala Leu Arg Asp Lys Phe Asp Leu Ala Phe Ala Asn Asp
290 295 300
Pro Asp Tyr Asp Arg His Gly Ile Val Thr Pro Ala Gly Leu Met Asn
305 310 315 320
Pro Asn His Tyr Leu Ala Val Ala Ile Asn Tyr Leu Phe Gln His Arg
325 330 335
Pro Gln Trp Gly Lys Asp Val Ala Val Gly Lys Thr Leu Val Ser Ser
340 345 350
Ala Met Ile Asp Arg Val Val Asn Asp Leu Gly Arg Lys Leu Val Glu
355 360 365
Val Pro Val Gly Phe Lys Trp Phe Val Asp Gly Leu Phe Asp Gly Ser
370 375 380
Phe Gly Phe Gly Gly Glu Glu Ser Ala Gly Ala Ser Phe Leu Arg Phe
385 390 395 400
Asp Gly Thr Pro Trp Ser Thr Asp Lys Asp Gly Ile Ile Met Cys Leu
405 410 415
Leu Ala Ala Glu Ile Thr Ala Val Thr Gly Lys Asn Pro Gln Glu His
420 425 430
Tyr Asn Glu Leu Ala Lys Arg Phe Gly Ala Pro Ser Tyr Asn Arg Leu
435 440 445
Gln Ala Ala Ala Thr Ser Ala Gln Lys Ala Ala Leu Ser Lys Leu Ser
450 455 460
Pro Glu Met Val Ser Ala Ser Thr Leu Ala Gly Asp Pro Ile Thr Ala
465 470 475 480
Arg Leu Thr Ala Ala Pro Gly Asn Gly Ala Ser Ile Gly Gly Leu Lys
485 490 495
Val Met Thr Asp Asn Gly Trp Phe Ala Ala Arg Pro Ser Gly Thr Glu
500 505 510
Asp Ala Tyr Lys Ile Tyr Cys Glu Ser Phe Leu Gly Glu Glu His Arg
515 520 525
Lys Gln Ile Glu Lys Glu Ala Val Glu Ile Val Ser Glu Val Leu Lys
530 535 540
Asn Ala
545
<210> 201
<211> 1746
<212> DNA
<213> 枯草芽孢杆菌
<400> 201
atgacttgga gaaagagcta tgaacgctgg aaacagacag aacatttaga tctggaatta 60
aaagagcgcc ttattgaatt agagggagat gaacaggccc ttgaggactg tttctataaa 120
gaccttgaat tcggtaccgg cggaatgcgc ggggaaatcg gcgccgggac aaatcggatg 180
aatatttaca ctgtgcgcaa agcatcggcc gggtttgcgg catacatctc gaagcaaggt 240
gaggaagcga aaaaacgggg cgttgtcatt gcttatgatt cccgccataa gtctccggag 300
ttcgcgatgg aagcggcaaa aacacttgcg acacaaggca tccaaacata cgtgtttgat 360
gagcttcgcc cgacgccaga gctgtcattc gctgttagac agctgaacgc ttatggtgga 420
attgtggtaa cggcaagcca taacccgcct gaatataacg gctacaaagt atacggggat 480
gatggcggcc agctgcctcc aaaggaagcg gacatcgtca ttgagcaggt aaacgcgatt 540
gaaaatgagc tgacgatcac agtggacgaa gaaaataagt taaaagaaaa aggcttaatc 600
aaaatcatcg gtgaagatat tgataaagtt tatacagaaa aactgacgtc catttctgta 660
catcctgaat tatcggaaga agtagatgta aaggttgttt tcacaccgct gcatggaact 720
gcaaataaac cggtcagacg cggtcttgaa gcactcggct acaaaaatgt aacggttgtc 780
aaagaacagg aactgccgga ttcaaacttc tccactgtta catcgccgaa cccggaagag 840
catgcggcat tcgaatatgc cattaagctt ggggaggagc agaatgcaga tattctcatc 900
gcgacagatc ctgatgctga ccgcctcggc atcgcggtga aaaacgatca aggcaaatat 960
acagtgctga caggaaacca aaccggagcg ttgctgcttc attacctgct ttctgaaaag 1020
aaaaaacaag gcatcctgcc tgataacggt gttgttctca aaacgatcgt cacaagcgaa 1080
atcggccgtg ctgtagcttc ttcattcggc cttgatacga ttgatacgct gacaggcttt 1140
aagtttatcg gtgaaaagat taaggaatac gaagcatcag gccagtatac cttccaattc 1200
ggttatgaag agagctacgg ttatttaatc ggggattttg cccgcgataa ggacgccatt 1260
caggctgcgc ttttggcagt tgaagtttgc gcgttctata aaaaacaggg aatgtcattg 1320
tatgaggcgc tcatcaatct ctttaacgaa tatggttttt atcgtgaagg gctgaaatcc 1380
ctgacgctga aaggcaaaca aggagcagag caaattgaag cgattcttgc ttccttcaga 1440
caaaatccgc cgcagaaaat ggcgggcaaa caggttgtca cagcagaaga ttacgctgta 1500
agcaaacgga cgcttctgac tgaaagcaaa gaagaagcca tcgacttgcc aaaatcaaat 1560
gtattgaaat acttcctgga agacgggtct tggttctgtc tccgtccttc tggaactgag 1620
ccgaaggtta aattttattt cgccgtaaaa gggtcatctt tggaagacag tgaaaagcga 1680
cttgccgtcc tttctgaaga tgtaatgaag acggtggatg aaattgttga gtcaacagca 1740
aaataa 1746
<210> 202
<211> 581
<212> PRT
<213> 枯草芽孢杆菌
<400> 202
Met Thr Trp Arg Lys Ser Tyr Glu Arg Trp Lys Gln Thr Glu His Leu
1 5 10 15
Asp Leu Glu Leu Lys Glu Arg Leu Ile Glu Leu Glu Gly Asp Glu Gln
20 25 30
Ala Leu Glu Asp Cys Phe Tyr Lys Asp Leu Glu Phe Gly Thr Gly Gly
35 40 45
Met Arg Gly Glu Ile Gly Ala Gly Thr Asn Arg Met Asn Ile Tyr Thr
50 55 60
Val Arg Lys Ala Ser Ala Gly Phe Ala Ala Tyr Ile Ser Lys Gln Gly
65 70 75 80
Glu Glu Ala Lys Lys Arg Gly Val Val Ile Ala Tyr Asp Ser Arg His
85 90 95
Lys Ser Pro Glu Phe Ala Met Glu Ala Ala Lys Thr Leu Ala Thr Gln
100 105 110
Gly Ile Gln Thr Tyr Val Phe Asp Glu Leu Arg Pro Thr Pro Glu Leu
115 120 125
Ser Phe Ala Val Arg Gln Leu Asn Ala Tyr Gly Gly Ile Val Val Thr
130 135 140
Ala Ser His Asn Pro Pro Glu Tyr Asn Gly Tyr Lys Val Tyr Gly Asp
145 150 155 160
Asp Gly Gly Gln Leu Pro Pro Lys Glu Ala Asp Ile Val Ile Glu Gln
165 170 175
Val Asn Ala Ile Glu Asn Glu Leu Thr Ile Thr Val Asp Glu Glu Asn
180 185 190
Lys Leu Lys Glu Lys Gly Leu Ile Lys Ile Ile Gly Glu Asp Ile Asp
195 200 205
Lys Val Tyr Thr Glu Lys Leu Thr Ser Ile Ser Val His Pro Glu Leu
210 215 220
Ser Glu Glu Val Asp Val Lys Val Val Phe Thr Pro Leu His Gly Thr
225 230 235 240
Ala Asn Lys Pro Val Arg Arg Gly Leu Glu Ala Leu Gly Tyr Lys Asn
245 250 255
Val Thr Val Val Lys Glu Gln Glu Leu Pro Asp Ser Asn Phe Ser Thr
260 265 270
Val Thr Ser Pro Asn Pro Glu Glu His Ala Ala Phe Glu Tyr Ala Ile
275 280 285
Lys Leu Gly Glu Glu Gln Asn Ala Asp Ile Leu Ile Ala Thr Asp Pro
290 295 300
Asp Ala Asp Arg Leu Gly Ile Ala Val Lys Asn Asp Gln Gly Lys Tyr
305 310 315 320
Thr Val Leu Thr Gly Asn Gln Thr Gly Ala Leu Leu Leu His Tyr Leu
325 330 335
Leu Ser Glu Lys Lys Lys Gln Gly Ile Leu Pro Asp Asn Gly Val Val
340 345 350
Leu Lys Thr Ile Val Thr Ser Glu Ile Gly Arg Ala Val Ala Ser Ser
355 360 365
Phe Gly Leu Asp Thr Ile Asp Thr Leu Thr Gly Phe Lys Phe Ile Gly
370 375 380
Glu Lys Ile Lys Glu Tyr Glu Ala Ser Gly Gln Tyr Thr Phe Gln Phe
385 390 395 400
Gly Tyr Glu Glu Ser Tyr Gly Tyr Leu Ile Gly Asp Phe Ala Arg Asp
405 410 415
Lys Asp Ala Ile Gln Ala Ala Leu Leu Ala Val Glu Val Cys Ala Phe
420 425 430
Tyr Lys Lys Gln Gly Met Ser Leu Tyr Glu Ala Leu Ile Asn Leu Phe
435 440 445
Asn Glu Tyr Gly Phe Tyr Arg Glu Gly Leu Lys Ser Leu Thr Leu Lys
450 455 460
Gly Lys Gln Gly Ala Glu Gln Ile Glu Ala Ile Leu Ala Ser Phe Arg
465 470 475 480
Gln Asn Pro Pro Gln Lys Met Ala Gly Lys Gln Val Val Thr Ala Glu
485 490 495
Asp Tyr Ala Val Ser Lys Arg Thr Leu Leu Thr Glu Ser Lys Glu Glu
500 505 510
Ala Ile Asp Leu Pro Lys Ser Asn Val Leu Lys Tyr Phe Leu Glu Asp
515 520 525
Gly Ser Trp Phe Cys Leu Arg Pro Ser Gly Thr Glu Pro Lys Val Lys
530 535 540
Phe Tyr Phe Ala Val Lys Gly Ser Ser Leu Glu Asp Ser Glu Lys Arg
545 550 555 560
Leu Ala Val Leu Ser Glu Asp Val Met Lys Thr Val Asp Glu Ile Val
565 570 575
Glu Ser Thr Ala Lys
580
<210> 203
<211> 666
<212> DNA
<213> 乳酸乳球菌(Lactococcus lactis)
<400> 203
atgtttaaag cagtattgtt tgatttagat ggtgtaatta cagataccgc agagtatcat 60
tttagagctt ggaaagcttt ggctgaagaa attggcatta atggtgttga ccgccaattt 120
aatgagcaat taaaaggggt ctcacgagaa gactcgcttc agaaaattct agatttagct 180
gataaaaaag tatcagctga ggaatttaaa gaacttgcta agagaaaaaa tgataactat 240
gtgaaaatga ttcaggatgt gtcgccagcc gatgtctatc ctggaatttt acaattactc 300
aaagatttac gttcaaataa aatcaaaatt gctttagcat cggcttctaa gaatggtcca 360
tttttattag agaaaatgaa tttaactgga tattttgatg caattgctga tccggctgaa 420
gttgcagcat caaaaccagc accagatatt tttattgcag cagcacatgc agtgggtgtt 480
gccccctctg aatcaattgg gttagaggat tctcaagctg gaattcaagc catcaaagat 540
tcaggggctt taccaattgg tgtagggcgc ccagaagatt tgggagatga tatcgtcatt 600
gtgcctgata cttcatacta tacattagaa tttttgaaag aagtttggct tcaaaagcaa 660
aaatga 666
<210> 204
<211> 221
<212> PRT
<213> 乳酸乳球菌
<400> 204
Met Phe Lys Ala Val Leu Phe Asp Leu Asp Gly Val Ile Thr Asp Thr
1 5 10 15
Ala Glu Tyr His Phe Arg Ala Trp Lys Ala Leu Ala Glu Glu Ile Gly
20 25 30
Ile Asn Gly Val Asp Arg Gln Phe Asn Glu Gln Leu Lys Gly Val Ser
35 40 45
Arg Glu Asp Ser Leu Gln Lys Ile Leu Asp Leu Ala Asp Lys Lys Val
50 55 60
Ser Ala Glu Glu Phe Lys Glu Leu Ala Lys Arg Lys Asn Asp Asn Tyr
65 70 75 80
Val Lys Met Ile Gln Asp Val Ser Pro Ala Asp Val Tyr Pro Gly Ile
85 90 95
Leu Gln Leu Leu Lys Asp Leu Arg Ser Asn Lys Ile Lys Ile Ala Leu
100 105 110
Ala Ser Ala Ser Lys Asn Gly Pro Phe Leu Leu Glu Lys Met Asn Leu
115 120 125
Thr Gly Tyr Phe Asp Ala Ile Ala Asp Pro Ala Glu Val Ala Ala Ser
130 135 140
Lys Pro Ala Pro Asp Ile Phe Ile Ala Ala Ala His Ala Val Gly Val
145 150 155 160
Ala Pro Ser Glu Ser Ile Gly Leu Glu Asp Ser Gln Ala Gly Ile Gln
165 170 175
Ala Ile Lys Asp Ser Gly Ala Leu Pro Ile Gly Val Gly Arg Pro Glu
180 185 190
Asp Leu Gly Asp Asp Ile Val Ile Val Pro Asp Thr Ser Tyr Tyr Thr
195 200 205
Leu Glu Phe Leu Lys Glu Val Trp Leu Gln Lys Gln Lys
210 215 220
<210> 205
<211> 660
<212> DNA
<213> 大肠杆菌
<400> 205
atgaaactgc aaggggtaat tttcgatctg gatggtgtaa tcaccgatac cgcgcatctg 60
catttccagg cgtggcagca gattgccgct gaaattggca tcagcattga tgcgcagttt 120
aacgaatccc taaaagggat cagccgcgat gagtctctgc ggcgcattct gcaacacggg 180
ggcaaagagg gcgactttaa ctcgcaggag agggcgcaac tggcgtatcg caaaaatctg 240
ctctatgtcc actcactacg cgagttgacg gtcaacgctg ttctacccgg cattcgctct 300
ttgctggcag atctccgtgc acagcagatc tcggttgggc tggcttctgt ctccctgaat 360
gcgccgacga ttttagcggc gctggagctg cgcgagtttt tcaccttctg cgcggatgct 420
tcccaactta aaaactcgaa accggacccg gaaatctttc tcgccgcctg tgcagggctg 480
ggcgtgccgc cgcaggcatg tatcggcatt gaagatgcgc aggcgggcat tgacgccatt 540
aacgccagcg gtatgcgctc ggtggggatc ggcgcgggct taaccggggc gcaattactg 600
ttgccttcaa cggaatcact cacctggccg cggttatcgg ccttctggca aaacgtatag 660
<210> 206
<211> 219
<212> PRT
<213> 大肠杆菌
<400> 206
Met Lys Leu Gln Gly Val Ile Phe Asp Leu Asp Gly Val Ile Thr Asp
1 5 10 15
Thr Ala His Leu His Phe Gln Ala Trp Gln Gln Ile Ala Ala Glu Ile
20 25 30
Gly Ile Ser Ile Asp Ala Gln Phe Asn Glu Ser Leu Lys Gly Ile Ser
35 40 45
Arg Asp Glu Ser Leu Arg Arg Ile Leu Gln His Gly Gly Lys Glu Gly
50 55 60
Asp Phe Asn Ser Gln Glu Arg Ala Gln Leu Ala Tyr Arg Lys Asn Leu
65 70 75 80
Leu Tyr Val His Ser Leu Arg Glu Leu Thr Val Asn Ala Val Leu Pro
85 90 95
Gly Ile Arg Ser Leu Leu Ala Asp Leu Arg Ala Gln Gln Ile Ser Val
100 105 110
Gly Leu Ala Ser Val Ser Leu Asn Ala Pro Thr Ile Leu Ala Ala Leu
115 120 125
Glu Leu Arg Glu Phe Phe Thr Phe Cys Ala Asp Ala Ser Gln Leu Lys
130 135 140
Asn Ser Lys Pro Asp Pro Glu Ile Phe Leu Ala Ala Cys Ala Gly Leu
145 150 155 160
Gly Val Pro Pro Gln Ala Cys Ile Gly Ile Glu Asp Ala Gln Ala Gly
165 170 175
Ile Asp Ala Ile Asn Ala Ser Gly Met Arg Ser Val Gly Ile Gly Ala
180 185 190
Gly Leu Thr Gly Ala Gln Leu Leu Leu Pro Ser Thr Glu Ser Leu Thr
195 200 205
Trp Pro Arg Leu Ser Ala Phe Trp Gln Asn Val
210 215
<210> 207
<211> 1392
<212> DNA
<213> 铜绿假单胞菌
<400> 207
atgagcactg taaaagcacc gacgctgccc gccagcatct tccgcgccta cgacatccgt 60
cgcgtggtag gcgataccct caccgccgag accgcctact ggatcggtcg cgccatcggc 120
tcggaaagcc tcgcccgcgg cgaaccgtgc gtcgctgtcg gccgcgatgg ccgcctgtcc 180
ggtcccgagc tggtcaagca gctgatccag ggcctggtgg actgcggttg ccaggtcagc 240
gacgtgggca tggtgcctac cccggtgctg tactacgcgg ccaacgtgct cgagggcaag 300
tccggggtga tgctgaccgg cagccacaat ccgccggact acaacggctt caagatcgtg 360
gtcgccggcg agaccctggc caacgagcag atccaggccc tgcgcgagcg catcgagaaa 420
aacgacctgg catccggcgt cggcagcgta gagcaggtcg acatcctgcc gcgctacttc 480
aagcagatcc gcgacgacat cgccatggcc aagccgatga aggtggtggt cgactgcggc 540
aacggcgtgg ccggggtgat cgccccgcag ttgatcgagg ccctgggctg cagcgtgatc 600
ccgctgtact gcgaggtcga cggcaacttc ccgaaccacc atccggaccc gggcaagccg 660
gagaacctga aggacctgat cgccaaggtc aaggccgaga acgccgacct gggcctggcc 720
ttcgacggcg acggcgatcg cgtcggcgtg gtcaccaata ccggtaccat catctatccg 780
gaccgtctgc tgatgctgtt cgccaaggac gtggtctcgc gcaacccggg ggccgacatc 840
atcttcgacg tcaagtgcac ccgccgtctg atcgccctga tcagcggcta cggcggccgt 900
ccggtgatgt ggaagaccgg ccactcgctg atcaagaaga agatgaagga aaccggcgcc 960
ctgctggctg gcgagatgag cggccacgtg ttcttcaagg agcgctggtt cggcttcgac 1020
gatggcatct acagcgccgc ccgcctgctg gaaatcctca gccaggatca gcgtgacagc 1080
gagcacgtgt tctcggcctt cccgagcgac atttccaccc cggaaatcaa catcaccgtc 1140
accgaggaca gcaagttcgc catcatcgag gcgctgcaac gcgacgccca atggggcgaa 1200
ggcaacatca ccaccctcga cggcgtgcgg gtcgactacc ccaaaggctg gggcctggta 1260
cgcgcctcca acaccactcc cgtgctggtc ctgcgcttcg aagcggaccc cgaggaagag 1320
ctggagcgca tcaagaccgt cttccgtaac caactgaagg cagtggattc ctcgctgccc 1380
gtgcccttct ga 1392
<210> 208
<211> 463
<212> PRT
<213> 铜绿假单胞菌
<400> 208
Met Ser Thr Ala Lys Ala Pro Thr Leu Pro Ala Ser Ile Phe Arg Ala
1 5 10 15
Tyr Asp Ile Arg Gly Val Val Gly Asp Thr Leu Thr Ala Glu Thr Ala
20 25 30
Tyr Trp Ile Gly Arg Ala Ile Gly Ser Glu Ser Leu Ala Arg Gly Glu
35 40 45
Pro Cys Val Ala Val Gly Arg Asp Gly Arg Leu Ser Gly Pro Glu Leu
50 55 60
Val Lys Gln Leu Ile Gln Gly Leu Val Asp Cys Gly Cys Gln Val Ser
65 70 75 80
Asp Val Gly Met Val Pro Thr Pro Val Leu Tyr Tyr Ala Ala Asn Val
85 90 95
Leu Glu Gly Lys Ser Gly Val Met Leu Thr Gly Ser His Asn Pro Pro
100 105 110
Asp Tyr Asn Gly Phe Lys Ile Val Val Ala Gly Glu Thr Leu Ala Asn
115 120 125
Glu Gln Ile Gln Ala Leu Arg Glu Arg Ile Glu Lys Asn Asp Leu Ala
130 135 140
Ser Gly Val Gly Ser Val Glu Gln Val Asp Ile Leu Pro Arg Tyr Phe
145 150 155 160
Lys Gln Ile Arg Asp Asp Ile Ala Met Ala Lys Pro Met Lys Val Val
165 170 175
Val Asp Cys Gly Asn Gly Val Ala Gly Val Ile Ala Pro Gln Leu Ile
180 185 190
Glu Ala Leu Gly Cys Ser Val Ile Pro Leu Tyr Cys Glu Val Asp Gly
195 200 205
Asn Phe Pro Asn His His Pro Asp Pro Gly Lys Pro Glu Asn Leu Lys
210 215 220
Asp Leu Ile Ala Lys Val Lys Ala Glu Asn Ala Asp Leu Gly Leu Ala
225 230 235 240
Phe Asp Gly Asp Gly Asp Arg Val Gly Val Val Thr Asn Thr Gly Thr
245 250 255
Ile Ile Tyr Pro Asp Arg Leu Leu Met Leu Phe Ala Lys Asp Val Val
260 265 270
Ser Arg Asn Pro Gly Ala Asp Ile Ile Phe Asp Val Lys Cys Thr Arg
275 280 285
Arg Leu Ile Ala Leu Ile Ser Gly Tyr Gly Gly Arg Pro Val Met Trp
290 295 300
Lys Thr Gly His Ser Leu Ile Lys Lys Lys Met Lys Glu Thr Gly Ala
305 310 315 320
Leu Leu Ala Gly Glu Met Ser Gly His Val Phe Phe Lys Glu Arg Trp
325 330 335
Phe Gly Phe Asp Asp Gly Ile Tyr Ser Ala Ala Arg Leu Leu Glu Ile
340 345 350
Leu Ser Gln Asp Gln Arg Asp Ser Glu His Val Phe Ser Ala Phe Pro
355 360 365
Ser Asp Ile Ser Thr Pro Glu Ile Asn Ile Thr Val Thr Glu Asp Ser
370 375 380
Lys Phe Ala Ile Ile Glu Ala Leu Gln Arg Asp Ala Gln Trp Gly Glu
385 390 395 400
Gly Asn Ile Thr Thr Leu Asp Gly Val Arg Val Asp Tyr Pro Lys Gly
405 410 415
Trp Gly Leu Val Arg Ala Ser Asn Thr Thr Pro Val Leu Val Leu Arg
420 425 430
Phe Glu Ala Asp Thr Glu Glu Glu Leu Glu Arg Ile Lys Thr Val Phe
435 440 445
Arg Asn Gln Leu Lys Ala Val Asp Ser Ser Leu Pro Val Pro Phe
450 455 460
<210> 209
<211> 1371
<212> DNA
<213> 大肠杆菌
<400> 209
atgaaaaaat taacctgctt taaagcctat gatattcgcg ggaaattagg cgaagaactg 60
aatgaagata tcgcctggcg cattggtcgc gcctatggcg aatttctcaa accgaaaacc 120
attgtgttag gcggtgatgt ccgcctcacc agcgaaacct taaaactggc gctggcgaaa 180
ggtttacagg atgcgggcgt tgacgtgctg gatattggta tgtccggcac cgaagagatc 240
tatttcgcca cgttccatct cggcgtggat ggcggcattg aagttaccgc cagccataat 300
ccgatggatt ataacggcat gaagctggtt cgcgaggggg ctcgcccgat cagcggagat 360
accggactgc gcgacgtcca gcgtctggct gaagccaacg actttcctcc cgtcgatgaa 420
accaaacgcg gtcgctatca gcaaatcaac ctgcgtgacg cttacgttga tcacctgttc 480
ggttatatca atgtcaaaaa cctcacgccg ctcaagctgg tgatcaactc cgggaacggc 540
gcagcgggtc cggtggtgga cgccattgaa gcccgcttta aagccctcgg cgcgcccgtg 600
gaattaatca aagtgcacaa cacgccggac ggcaatttcc ccaacggtat tcctaaccca 660
ctactgccgg aatgccgcga cgacacccgc aatgcggtca tcaaacacgg cgcggatatg 720
ggcattgctt ttgatggcga ttttgaccgc tgtttcctgt ttgacgaaaa agggcagttt 780
attgagggct actacattgt cggcctgttg gcagaagcat tcctcgaaaa aaatcccggc 840
gcgaagatca tccacgatcc acgtctctcc tggaacaccg ttgatgtggt gactgccgca 900
ggtggcacgc cggtaatgtc gaaaaccgga cacgccttta ttaaagaacg tatgcgcaag 960
gaagacgcca tctatggtgg cgaaatgagc gcccaccatt acttccgtga tttcgcttac 1020
tgcgacagcg gcatgatccc gtggctgctg gtcgccgaac tggtgtgcct gaaagataaa 1080
acgctgggcg aactggtacg cgaccggatg gcggcgtttc cggcaagcgg tgagatcaac 1140
agcaaactgg cgcaacccgt tgaggcgatt aaccgcgtgg aacagcattt tagccgtgag 1200
gcgctggcgg tggatcgcac cgatggcatc agcatgacct ttgccgactg gcgctttaac 1260
ctgcgcacct ccaataccga accggtggtg cgcctgaatg tggaatcgcg cggtgatgtg 1320
ccgctgatgg aagcgcgaac gcgaactctg ctgacgttgc tgaacgagta a 1371
<210> 210
<211> 456
<212> PRT
<213> 大肠杆菌
<400> 210
Met Lys Lys Leu Thr Cys Phe Lys Ala Tyr Asp Ile Arg Gly Lys Leu
1 5 10 15
Gly Glu Glu Leu Asn Glu Asp Ile Ala Trp Arg Ile Gly Arg Ala Tyr
20 25 30
Gly Glu Phe Leu Lys Pro Lys Thr Ile Val Leu Gly Gly Asp Val Arg
35 40 45
Leu Thr Ser Glu Thr Leu Lys Leu Ala Leu Ala Lys Gly Leu Gln Asp
50 55 60
Ala Gly Val Asp Val Leu Asp Ile Gly Met Ser Gly Thr Glu Glu Ile
65 70 75 80
Tyr Phe Ala Thr Phe His Leu Gly Val Asp Gly Gly Ile Glu Val Thr
85 90 95
Ala Ser His Asn Pro Met Asp Tyr Asn Gly Met Lys Leu Val Arg Glu
100 105 110
Gly Ala Arg Pro Ile Ser Gly Asp Thr Gly Leu Arg Asp Val Gln Arg
115 120 125
Leu Ala Glu Ala Asn Asp Phe Pro Pro Val Asp Glu Thr Lys Arg Gly
130 135 140
Arg Tyr Gln Gln Ile Asn Leu Arg Asp Ala Tyr Val Asp His Leu Phe
145 150 155 160
Gly Tyr Ile Asn Val Lys Asn Leu Thr Pro Leu Lys Leu Val Ile Asn
165 170 175
Ser Gly Asn Gly Ala Ala Gly Pro Val Val Asp Ala Ile Glu Ala Arg
180 185 190
Phe Lys Ala Leu Gly Ala Pro Val Glu Leu Ile Lys Val His Asn Thr
195 200 205
Pro Asp Gly Asn Phe Pro Asn Gly Ile Pro Asn Pro Leu Leu Pro Glu
210 215 220
Cys Arg Asp Asp Thr Arg Asn Ala Val Ile Lys His Gly Ala Asp Met
225 230 235 240
Gly Ile Ala Phe Asp Gly Asp Phe Asp Arg Cys Phe Leu Phe Asp Glu
245 250 255
Lys Gly Gln Phe Ile Glu Gly Tyr Tyr Ile Val Gly Leu Leu Ala Glu
260 265 270
Ala Phe Leu Glu Lys Asn Pro Gly Ala Lys Ile Ile His Asp Pro Arg
275 280 285
Leu Ser Trp Asn Thr Val Asp Val Val Thr Ala Ala Gly Gly Thr Pro
290 295 300
Val Met Ser Lys Thr Gly His Ala Phe Ile Lys Glu Arg Met Arg Lys
305 310 315 320
Glu Asp Ala Ile Tyr Gly Gly Glu Met Ser Ala His His Tyr Phe Arg
325 330 335
Asp Phe Ala Tyr Cys Asp Ser Gly Met Ile Pro Trp Leu Leu Val Ala
340 345 350
Glu Leu Val Cys Leu Lys Asp Lys Thr Leu Gly Glu Leu Val Arg Asp
355 360 365
Arg Met Ala Ala Phe Pro Ala Ser Gly Glu Ile Asn Ser Lys Leu Ala
370 375 380
Gln Pro Val Glu Ala Ile Asn Arg Val Glu Gln His Phe Ser Arg Glu
385 390 395 400
Ala Leu Ala Val Asp Arg Thr Asp Gly Ile Ser Met Thr Phe Ala Asp
405 410 415
Trp Arg Phe Asn Leu Arg Thr Ser Asn Thr Glu Pro Val Val Arg Leu
420 425 430
Asn Val Glu Ser Arg Gly Asp Val Pro Leu Met Glu Ala Arg Thr Arg
435 440 445
Thr Leu Leu Thr Leu Leu Asn Glu
450 455
<210> 211
<211> 2478
<212> DNA
<213> 齿双歧杆菌(Bifidobacterium dentium)
<400> 211
atgacgagtc ctgttattgg caccccttgg aagaagctga acgctccggt ttccgaggaa 60
gctatcgaag gtgtggataa gtactggcgt gcagccaact acctctccat cggccagatc 120
tatctgcgta gcaacccgct gatgaaggag cccttcaccc gcgaagacgt caagcaccgt 180
ctggtcggcc actggggcac caccccgggc ctgaacttcc tcatcggcca catcaaccgt 240
ctcatcgctg atcaccagca gaacaccgtg atcatcatgg gcccgggcca cggcggcccg 300
gctggtaccg ctcagtccta cctggacggc acctacaccg agtacttccc gaacatcacc 360
aaggatgaag ctggcctgca gaagttcttc cgccagttct cctacccggg cggcatcccg 420
tcccactacg ctccggagac cccgggctcc atccacgaag gtggcgagct gggttacgcc 480
ctgtcccacg cctatggcgc tgtgatgaac aacccgagcc tgttcgttcc ggccatcgtc 540
ggcgacggcg aagccgagac cggcccgctg gccaccggct ggcagtccaa caagctcgtc 600
aacccgcgca ccgacggtat cgtgctgccg atcctgcacc tcaatggcta caagatcgcc 660
aacccgacca tcctgtcccg catctccgac gaagagctgc acgagttctt ccacggcatg 720
ggctatgagc cgtatgagtt cgtcgccggc ttcgacaacg aggatcacct gtcgatccac 780
cgtcgtttcg ccgagttgtt cgagaccgtc ttcgacgaga tctgcgacat caaggccgcc 840
gctcagactg acgacatgac tcgtccgttc tacccgatga tcatcttccg caccccgaag 900
ggctggacct gcccgaagtt catcgacggc aagaagaccg aaggttcctg gcgctcccac 960
caggttccgc tggcttccgc ccgcgatacc gaggctcact tcgaggtcct caagaactgg 1020
ctcgagtcct acaagccgga agagctgttc gacgccaacg gcgccgtgaa gccggaagtc 1080
accgccttca tgccgaccgg cgaactgcgc atcggtgaga acccgaacgc caacggtggc 1140
cgcatccgcg aagagctgaa cctgccggcc ctcgaggact acgaggtcaa ggaagtcgcc 1200
gagtacggcc acggctgggg ccagctcgag gccacccgtc gtctgggcgt ctacacccgc 1260
gacatcatca agaacaaccc ggactccttc cgtatcttcg gaccggacga gaccgcttcc 1320
aaccgtctgc aggccgcata cgacgtcacc aacaagcagt gggacgccgg ctacctgtcc 1380
gctcaggttg atgagcacat ggccgtcacc ggtcaggtca ccgagcagct ctccgagcac 1440
cagatggaag gcttcctcga ggcctacctg ctcaccggcc gtcacggcat ctggagctcc 1500
tacgagtcct tcgtgcacgt gatcgactcc atgctgaacc agcacgccaa gtggctcgag 1560
gctaccgtcc gcgagatccc gtggcgcaag ccgatctcct ccatgaacct gctcgtctcc 1620
tcccacgtgt ggcgtcagga tcacaacggc ttctcccacc aggatccggg tgtcacctcc 1680
gtcctgctga acaagtgctt caacaacgat cacgtgatcg gcatctactt cccggtggat 1740
tccaacatgc tgctcgccgt ggctgagaag tgctacaagt ccaccgacat gatcaacgcc 1800
atcatcgccg gcaagcagcc ggccgccacc tggctgaccc tggacgaagc tcgcgccgag 1860
ctcgagaagg gtgccgccga gtgggagtgg gcctccaccg ccaagtccaa cgacgaagca 1920
cagatcgtgc tcgcctccgc tggcgatgtc ccggctcagg agatcatggc cgctgccgac 1980
aagctcgatg ccatgggcat caagttcaag gtcgtcaacg ttgtggatct ggtcaagctg 2040
cagtccacca aggagaatga cgaagccatc tccgacgccg acttcgctga cctgttcacc 2100
gaggacaagc cggtcctgtt cgcctaccac tcctatgccc gcgacgtgcg tggtctgatc 2160
tacgatcgcc cgaaccacga caacttcaac gtccacggct acgaggagca gggctccacc 2220
accaccccgt acgacatggt gcgcgtgaac aacatcgatc gctacgagct cgttgccgaa 2280
gctctgcgca tgatcgacgc tgacaagtac gccgacaaga tcgacgagct cgaggccttc 2340
cgcaaggaag ccttccagtt cgcagtcgac aacggctacg atcacccgga ttacaccgac 2400
tgggtgtact ccggcgtcaa caccaacaag cagggtgctg tctccgctac cgccgcaacc 2460
gccggcgata acgagtga 2478
<210> 212
<211> 825
<212> PRT
<213> 齿双歧杆菌
<400> 212
Met Thr Ser Pro Val Ile Gly Thr Pro Trp Lys Lys Leu Asn Ala Pro
1 5 10 15
Val Ser Glu Glu Ala Ile Glu Gly Val Asp Lys Tyr Trp Arg Ala Ala
20 25 30
Asn Tyr Leu Ser Ile Gly Gln Ile Tyr Leu Arg Ser Asn Pro Leu Met
35 40 45
Lys Glu Pro Phe Thr Arg Glu Asp Val Lys His Arg Leu Val Gly His
50 55 60
Trp Gly Thr Thr Pro Gly Leu Asn Phe Leu Ile Gly His Ile Asn Arg
65 70 75 80
Leu Ile Ala Asp His Gln Gln Asn Thr Val Ile Ile Met Gly Pro Gly
85 90 95
His Gly Gly Pro Ala Gly Thr Ala Gln Ser Tyr Leu Asp Gly Thr Tyr
100 105 110
Thr Glu Tyr Phe Pro Asn Ile Thr Lys Asp Glu Ala Gly Leu Gln Lys
115 120 125
Phe Phe Arg Gln Phe Ser Tyr Pro Gly Gly Ile Pro Ser His Tyr Ala
130 135 140
Pro Glu Thr Pro Gly Ser Ile His Glu Gly Gly Glu Leu Gly Tyr Ala
145 150 155 160
Leu Ser His Ala Tyr Gly Ala Val Met Asn Asn Pro Ser Leu Phe Val
165 170 175
Pro Ala Ile Val Gly Asp Gly Glu Ala Glu Thr Gly Pro Leu Ala Thr
180 185 190
Gly Trp Gln Ser Asn Lys Leu Val Asn Pro Arg Thr Asp Gly Ile Val
195 200 205
Leu Pro Ile Leu His Leu Asn Gly Tyr Lys Ile Ala Asn Pro Thr Ile
210 215 220
Leu Ser Arg Ile Ser Asp Glu Glu Leu His Glu Phe Phe His Gly Met
225 230 235 240
Gly Tyr Glu Pro Tyr Glu Phe Val Ala Gly Phe Asp Asn Glu Asp His
245 250 255
Leu Ser Ile His Arg Arg Phe Ala Glu Leu Phe Glu Thr Val Phe Asp
260 265 270
Glu Ile Cys Asp Ile Lys Ala Ala Ala Gln Thr Asp Asp Met Thr Arg
275 280 285
Pro Phe Tyr Pro Met Ile Ile Phe Arg Thr Pro Lys Gly Trp Thr Cys
290 295 300
Pro Lys Phe Ile Asp Gly Lys Lys Thr Glu Gly Ser Trp Arg Ser His
305 310 315 320
Gln Val Pro Leu Ala Ser Ala Arg Asp Thr Glu Ala His Phe Glu Val
325 330 335
Leu Lys Asn Trp Leu Glu Ser Tyr Lys Pro Glu Glu Leu Phe Asp Ala
340 345 350
Asn Gly Ala Val Lys Pro Glu Val Thr Ala Phe Met Pro Thr Gly Glu
355 360 365
Leu Arg Ile Gly Glu Asn Pro Asn Ala Asn Gly Gly Arg Ile Arg Glu
370 375 380
Glu Leu Asn Leu Pro Ala Leu Glu Asp Tyr Glu Val Lys Glu Val Ala
385 390 395 400
Glu Tyr Gly His Gly Trp Gly Gln Leu Glu Ala Thr Arg Arg Leu Gly
405 410 415
Val Tyr Thr Arg Asp Ile Ile Lys Asn Asn Pro Asp Ser Phe Arg Ile
420 425 430
Phe Gly Pro Asp Glu Thr Ala Ser Asn Arg Leu Gln Ala Ala Tyr Asp
435 440 445
Val Thr Asn Lys Gln Trp Asp Ala Gly Tyr Leu Ser Ala Gln Val Asp
450 455 460
Glu His Met Ala Val Thr Gly Gln Val Thr Glu Gln Leu Ser Glu His
465 470 475 480
Gln Met Glu Gly Phe Leu Glu Ala Tyr Leu Leu Thr Gly Arg His Gly
485 490 495
Ile Trp Ser Ser Tyr Glu Ser Phe Val His Val Ile Asp Ser Met Leu
500 505 510
Asn Gln His Ala Lys Trp Leu Glu Ala Thr Val Arg Glu Ile Pro Trp
515 520 525
Arg Lys Pro Ile Ser Ser Met Asn Leu Leu Val Ser Ser His Val Trp
530 535 540
Arg Gln Asp His Asn Gly Phe Ser His Gln Asp Pro Gly Val Thr Ser
545 550 555 560
Val Leu Leu Asn Lys Cys Phe Asn Asn Asp His Val Ile Gly Ile Tyr
565 570 575
Phe Pro Val Asp Ser Asn Met Leu Leu Ala Val Ala Glu Lys Cys Tyr
580 585 590
Lys Ser Thr Asp Met Ile Asn Ala Ile Ile Ala Gly Lys Gln Pro Ala
595 600 605
Ala Thr Trp Leu Thr Leu Asp Glu Ala Arg Ala Glu Leu Glu Lys Gly
610 615 620
Ala Ala Glu Trp Glu Trp Ala Ser Thr Ala Lys Ser Asn Asp Glu Ala
625 630 635 640
Gln Ile Val Leu Ala Ser Ala Gly Asp Val Pro Ala Gln Glu Ile Met
645 650 655
Ala Ala Ala Asp Lys Leu Asp Ala Met Gly Ile Lys Phe Lys Val Val
660 665 670
Asn Val Val Asp Leu Val Lys Leu Gln Ser Thr Lys Glu Asn Asp Glu
675 680 685
Ala Ile Ser Asp Ala Asp Phe Ala Asp Leu Phe Thr Glu Asp Lys Pro
690 695 700
Val Leu Phe Ala Tyr His Ser Tyr Ala Arg Asp Val Arg Gly Leu Ile
705 710 715 720
Tyr Asp Arg Pro Asn His Asp Asn Phe Asn Val His Gly Tyr Glu Glu
725 730 735
Gln Gly Ser Thr Thr Thr Pro Tyr Asp Met Val Arg Val Asn Asn Ile
740 745 750
Asp Arg Tyr Glu Leu Val Ala Glu Ala Leu Arg Met Ile Asp Ala Asp
755 760 765
Lys Tyr Ala Asp Lys Ile Asp Glu Leu Glu Ala Phe Arg Lys Glu Ala
770 775 780
Phe Gln Phe Ala Val Asp Asn Gly Tyr Asp His Pro Asp Tyr Thr Asp
785 790 795 800
Trp Val Tyr Ser Gly Val Asn Thr Asn Lys Gln Gly Ala Val Ser Ala
805 810 815
Thr Ala Ala Thr Ala Gly Asp Asn Glu
820 825
<210> 213
<211> 2478
<212> DNA
<213> 乳双歧杆菌(Bifidobacterium lactis)
<400> 213
atgactaatc ctgttattgg taccccatgg cagaagctgg atcgtccggt ttccgaagag 60
gccatcgaag gcatggacaa gtactggcgc gtcgccaact acatgtctat cggccagatc 120
tacctgcgta gcaacccgct gatgaaggag cccttcaccc gcgatgacgt gaagcaccgt 180
ctggtcggcc actggggcac caccccgggc ctgaacttcc ttctcgccca catcaaccgc 240
ctgatcgccg atcaccagca gaacaccgtg ttcatcatgg gtcctggcca cggcggccct 300
gcaggtaccg ctcagtccta catcgacggc acctacaccg agtactaccc gaacatcacc 360
aaggacgaag ctggcctgca gaagttcttc cgccagttct cctacccggg tggcattcct 420
tcccacttcg ctccggagac gccgggctcc atccacgaag gcggcgagct gggctacgcc 480
ctgtcgcacg cctacggcgc gatcatggac aacccgagcc tcttcgtccc gtgcatcatc 540
ggtgacggcg aagccgagac cggccctctg gccaccggct ggcagtccaa caagctcgtc 600
aacccgcgca ccgacggcat cgtcctgccg atcctgcacc tcaacggcta caagatcgcc 660
aacccgacga tcctcgcccg catctccgac gaggagctgc acgacttctt ccgcggcatg 720
ggttaccacc cgtacgagtt cgtcgccggc ttcgacaacg aggatcacct gtcgatccac 780
cgtcgcttcg ccgagctctt cgagaccatc ttcgacgaga tctgcgatat caaggctgcg 840
gctcagaccg acgacatgac ccgtccgttc tacccgatgc tcatcttccg caccccgaag 900
ggctggacct gcccgaagtt catcgacggc aagaagaccg aaggctcctg gcgtgcacac 960
caggtcccgc tggcttccgc ccgcgacacc gaggcccact tcgaagtcct caagggctgg 1020
atggaatcct acaagccgga ggagctcttc aacgccgacg gctccatcaa ggaggacgtc 1080
accgcattca tgcctaaggg cgaactgcgc atcggcgcca acccgaatgc caacggcggc 1140
cgcatccgcg aggatctgaa gctccctgag ctcgatcagt acgagatcac cggcgtcaag 1200
gaatacggcc acggttgggg ccaggtcgag gctccgcgtt ccctcggcgc gtactgccgc 1260
gacatcatca agaacaaccc ggattcgttc cgcgtcttcg gacctgacga gaccgcgtcc 1320
aaccgtctga acgcgaccta cgaggtcacc aagaagcagt gggacaacgg atacctctcg 1380
gctctcgtcg acgagaacat ggccgtcacc ggccaggttg tcgagcagct ctccgagcat 1440
cagtgcgaag gcttcctcga ggcctacctg ctcaccggcc gtcacggcat ctggagctcc 1500
tacgagtcct tcgtgcacgt gatcgactcc atgctgaacc agcatgcgaa gtggctcgag 1560
gccaccgtcc gcgagatccc gtggcgtaag ccgatctcct cggtgaacct cctggtctcc 1620
tcgcacgtgt ggcgtcagga tcacaacggc ttctcgcacc aggatccggg tgtgacctcc 1680
gtcctgctga acaagacgtt caacaacgac cacgtgacga acatctactt cgcgaccgat 1740
gccaacatgc tgctggccat cgccgagaag tgcttcaagt ccaccaacaa gatcaacgca 1800
atcttcgccg gcaagcagcc ggccgcgacg tggatcaccc tcgacgaggt acgcgccgag 1860
ctcgaggctg gtgccgccga gtggaagtgg gcttccaacg ccaagagcaa cgacgaggtc 1920
caggttgtcc tcgccgccgc cggcgacgtc ccgacccagg agatcatggc cgcttccgat 1980
gccctcaaca agatgggcat caagttcaag gtcgtcaacg tcgtggacct catcaagctg 2040
cagtcctcga aggagaacga cgaggccatg tctgacgagg acttcgccga cctgttcacc 2100
gcggacaagc cggtcctctt cgcctaccac tcctatgccc aggacgttcg tggcctcatc 2160
tacgaccgcc cgaaccacga caacttcacc gttgtcggat acaaggagca gggctccacg 2220
acgacgccgt tcgacatggt gcgtgtcaac gacatggatc gctacgccct tcaggccaag 2280
gccctcgagc tcatcgacgc cgacaagtat gccgacaaga tcaacgagct caacgagttc 2340
cgcaagaccg cgttccagtt cgccgtcgac aatggctatg acattcctga gttcaccgat 2400
tgggtgtacc cggatgtcaa ggtcgacgag acctccatgc tctccgccac cgccgcgacc 2460
gccggcgaca acgagtga 2478
<210> 214
<211> 825
<212> PRT
<213> 乳双歧杆菌
<400> 214
Met Thr Asn Pro Val Ile Gly Thr Pro Trp Gln Lys Leu Asp Arg Pro
1 5 10 15
Val Ser Glu Glu Ala Ile Glu Gly Met Asp Lys Tyr Trp Arg Val Ala
20 25 30
Asn Tyr Met Ser Ile Gly Gln Ile Tyr Leu Arg Ser Asn Pro Leu Met
35 40 45
Lys Glu Pro Phe Thr Arg Asp Asp Val Lys His Arg Leu Val Gly His
50 55 60
Trp Gly Thr Thr Pro Gly Leu Asn Phe Leu Leu Ala His Ile Asn Arg
65 70 75 80
Leu Ile Ala Asp His Gln Gln Asn Thr Val Phe Ile Met Gly Pro Gly
85 90 95
His Gly Gly Pro Ala Gly Thr Ala Gln Ser Tyr Ile Asp Gly Thr Tyr
100 105 110
Thr Glu Tyr Tyr Pro Asn Ile Thr Lys Asp Glu Ala Gly Leu Gln Lys
115 120 125
Phe Phe Arg Gln Phe Ser Tyr Pro Gly Gly Ile Pro Ser His Phe Ala
130 135 140
Pro Glu Thr Pro Gly Ser Ile His Glu Gly Gly Glu Leu Gly Tyr Ala
145 150 155 160
Leu Ser His Ala Tyr Gly Ala Ile Met Asp Asn Pro Ser Leu Phe Val
165 170 175
Pro Cys Ile Ile Gly Asp Gly Glu Ala Glu Thr Gly Pro Leu Ala Thr
180 185 190
Gly Trp Gln Ser Asn Lys Leu Val Asn Pro Arg Thr Asp Gly Ile Val
195 200 205
Leu Pro Ile Leu His Leu Asn Gly Tyr Lys Ile Ala Asn Pro Thr Ile
210 215 220
Leu Ala Arg Ile Ser Asp Glu Glu Leu His Asp Phe Phe Arg Gly Met
225 230 235 240
Gly Tyr His Pro Tyr Glu Phe Val Ala Gly Phe Asp Asn Glu Asp His
245 250 255
Leu Ser Ile His Arg Arg Phe Ala Glu Leu Phe Glu Thr Ile Phe Asp
260 265 270
Glu Ile Cys Asp Ile Lys Ala Ala Ala Gln Thr Asp Asp Met Thr Arg
275 280 285
Pro Phe Tyr Pro Met Leu Ile Phe Arg Thr Pro Lys Gly Trp Thr Cys
290 295 300
Pro Lys Phe Ile Asp Gly Lys Lys Thr Glu Gly Ser Trp Arg Ala His
305 310 315 320
Gln Val Pro Leu Ala Ser Ala Arg Asp Thr Glu Ala His Phe Glu Val
325 330 335
Leu Lys Gly Trp Met Glu Ser Tyr Lys Pro Glu Glu Leu Phe Asn Ala
340 345 350
Asp Gly Ser Ile Lys Glu Asp Val Thr Ala Phe Met Pro Lys Gly Glu
355 360 365
Leu Arg Ile Gly Ala Asn Pro Asn Ala Asn Gly Gly Arg Ile Arg Glu
370 375 380
Asp Leu Lys Leu Pro Glu Leu Asp Gln Tyr Glu Ile Thr Gly Val Lys
385 390 395 400
Glu Tyr Gly His Gly Trp Gly Gln Val Glu Ala Pro Arg Ser Leu Gly
405 410 415
Ala Tyr Cys Arg Asp Ile Ile Lys Asn Asn Pro Asp Ser Phe Arg Val
420 425 430
Phe Gly Pro Asp Glu Thr Ala Ser Asn Arg Leu Asn Ala Thr Tyr Glu
435 440 445
Val Thr Lys Lys Gln Trp Asp Asn Gly Tyr Leu Ser Ala Leu Val Asp
450 455 460
Glu Asn Met Ala Val Thr Gly Gln Val Val Glu Gln Leu Ser Glu His
465 470 475 480
Gln Cys Glu Gly Phe Leu Glu Ala Tyr Leu Leu Thr Gly Arg His Gly
485 490 495
Ile Trp Ser Ser Tyr Glu Ser Phe Val His Val Ile Asp Ser Met Leu
500 505 510
Asn Gln His Ala Lys Trp Leu Glu Ala Thr Val Arg Glu Ile Pro Trp
515 520 525
Arg Lys Pro Ile Ser Ser Val Asn Leu Leu Val Ser Ser His Val Trp
530 535 540
Arg Gln Asp His Asn Gly Phe Ser His Gln Asp Pro Gly Val Thr Ser
545 550 555 560
Val Leu Leu Asn Lys Thr Phe Asn Asn Asp His Val Thr Asn Ile Tyr
565 570 575
Phe Ala Thr Asp Ala Asn Met Leu Leu Ala Ile Ala Glu Lys Cys Phe
580 585 590
Lys Ser Thr Asn Lys Ile Asn Ala Ile Phe Ala Gly Lys Gln Pro Ala
595 600 605
Ala Thr Trp Ile Thr Leu Asp Glu Val Arg Ala Glu Leu Glu Ala Gly
610 615 620
Ala Ala Glu Trp Lys Trp Ala Ser Asn Ala Lys Ser Asn Asp Glu Val
625 630 635 640
Gln Val Val Leu Ala Ala Ala Gly Asp Val Pro Thr Gln Glu Ile Met
645 650 655
Ala Ala Ser Asp Ala Leu Asn Lys Met Gly Ile Lys Phe Lys Val Val
660 665 670
Asn Val Val Asp Leu Ile Lys Leu Gln Ser Ser Lys Glu Asn Asp Glu
675 680 685
Ala Met Ser Asp Glu Asp Phe Ala Asp Leu Phe Thr Ala Asp Lys Pro
690 695 700
Val Leu Phe Ala Tyr His Ser Tyr Ala Gln Asp Val Arg Gly Leu Ile
705 710 715 720
Tyr Asp Arg Pro Asn His Asp Asn Phe Thr Val Val Gly Tyr Lys Glu
725 730 735
Gln Gly Ser Thr Thr Thr Pro Phe Asp Met Val Arg Val Asn Asp Met
740 745 750
Asp Arg Tyr Ala Leu Gln Ala Lys Ala Leu Glu Leu Ile Asp Ala Asp
755 760 765
Lys Tyr Ala Asp Lys Ile Asn Glu Leu Asn Glu Phe Arg Lys Thr Ala
770 775 780
Phe Gln Phe Ala Val Asp Asn Gly Tyr Asp Ile Pro Glu Phe Thr Asp
785 790 795 800
Trp Val Tyr Pro Asp Val Lys Val Asp Glu Thr Ser Met Leu Ser Ala
805 810 815
Thr Ala Ala Thr Ala Gly Asp Asn Glu
820 825
<210> 215
<211> 2367
<212> DNA
<213> 未知
<220>
<223> 类植物乳杆菌(Lactobacillus paraplantarum)序列
<220>
<221> misc_feature
<222> (75)..(75)
<223> n是a、c、g或t
<400> 215
atgacaacag attactcatc accagcatat ttgcaaaaag ttgataagta ctggcgggca 60
gccaactact tatcngttgg gcaactttat ttaaaagatt atccattatt acaacagcca 120
ttgaaggcca gtgacgttaa ggttcatcca atttgtcact gggggacgat tgccggtcaa 180
aactctatct acgcgcacct taaccgggtt attaacaagt acggtttgaa gatgttctac 240
gttgaaggtc caggtcatgg tggtcaagtg atggtttcaa actcttatct tgacggtact 300
tacaccgata tttatccaga aattacgcag gatgttgaag gaatgcagaa actcttcaag 360
caattctcat tcccaggtgg ggttgcttcc catgcggcac ctgaaacacc tggttcaatc 420
cacgaaggtg gcgaactagg ttactcaatt tcacacgggg ttggggcaat tcttgacaat 480
cctgacgaaa ttgcagcggt cgttgttggt gatggggaat ccgaaacggg tccattagca 540
acttcatggc aatcaacgaa gttcattaac ccaatcaatg acggggcagt gttaccaatc 600
ttgaacttaa atggttttaa gatttctaac ccaacgattt ttggtcggac ttctgatgct 660
aagattaagg aatacttcga aagcatgagc tgggaaccaa tcttcgttga aggtgacgat 720
cctgaaaagg ttcacccagt cttagctaaa gccatggatg aagccgttga aaagatcaag 780
gcaatccaga agcatgctcg tgaaaatgac gatgcgacgt tgccagtatg gccaatgatc 840
gttttccgtg cacctaaggg ctggactggt cctaagtcat gggacggcga taagattgaa 900
ggttcattcc gggcccatca aattccgatt cctgttgatc aaaatgacat ggaacatgcg 960
gacgctttag ttgattggct tgaatcatat caaccaaagg aactcttcaa tgaagatggt 1020
tctttgaagg atgatattaa agaaattatt cctactgggg acagtcggat ggcagctaac 1080
ccaatcacca atggtggggt tgatccgaaa gccttgaact taccaaactt ccgggattat 1140
gcggtcgata cgtccaagga aggcgcgaat gttaagcaag atatgcttgt ttggtcagac 1200
tatttgcggg atgtcatcaa gaagaatcct gataacttcc ggttgttcgg acctgatgaa 1260
accatgtcta accgcttata tggtgtcttc gaaaccacta atcgtcaatg gatggaagac 1320
attcatcccg atagtgacca atatgaagct gcagctggcc gggtcttaga tgctcagtta 1380
tctgaacacc aagctgaagg ttggttagaa ggttacgtct taactggacg tcatgggtta 1440
tttgccagtt atgaagcctt cctacgcgtt gtggactcaa tgttgacgca acacttcaag 1500
tggttacgta aggccaatga acttgattgg cgtaaaaagt acccatcact taacattatc 1560
gcggcttcaa ctgtattcca acaagaccat aatggttaca cccaccaaga tccaggtgcg 1620
ttgactcatt tggccgaaaa gaaaccagaa tacattcgcg aatatttacc agccgatgcc 1680
aacacgttat tagctgtcgg tgacgtcatt ttccggagcc aagaaaagat caactacgtg 1740
gttacgtcaa aacacccacg tcaacaatgg ttcagcattg aagaagctaa acaattagtt 1800
gacaatggtc ttggtatcat tgactgggca agcacggatc aaggtagcga accagacatc 1860
gtctttgcag ctgctgggac ggaaccaacg cttgaaacgt tggctgccat ccaattacta 1920
cacgacagtt tcccagagat gaagattcgt ttcgtgaacg tggtcgacat cttgaagtta 1980
cgtagtcctg aaaaggatcc acggggcttg tcagatgctg aatttgacca ttactttact 2040
aaggacaaac cagtggtctt tgctttccac ggttacgaag atttagttcg tgacatcttc 2100
ttcgatcgtc acaaccataa cttatacgtc cacggttacc gtgaaaatgg tgatattacc 2160
acaccattcg acgtacgggt catgaaccaa atggatcgtt tcgacttagc taagacggcg 2220
attgcggcgc aaccagcaat ggaaaacacc ggtgcggcct ttgttcaatc catggataac 2280
atgcttgcta aacacaatgc atacattcgg gatgccggaa ccgacttgcc agaagttaac 2340
gactggcaat ggaaaggttt gaaataa 2367
<210> 216
<211> 788
<212> PRT
<213> 未知
<220>
<223> 类植物乳杆菌序列
<400> 216
Met Thr Thr Asp Tyr Ser Ser Pro Ala Tyr Leu Gln Lys Val Asp Lys
1 5 10 15
Tyr Trp Arg Ala Ala Asn Tyr Leu Ser Val Gly Gln Leu Tyr Leu Lys
20 25 30
Asp Tyr Pro Leu Leu Gln Gln Pro Leu Lys Ala Ser Asp Val Lys Val
35 40 45
His Pro Ile Cys His Trp Gly Thr Ile Ala Gly Gln Asn Ser Ile Tyr
50 55 60
Ala His Leu Asn Arg Val Ile Asn Lys Tyr Gly Leu Lys Met Phe Tyr
65 70 75 80
Val Glu Gly Pro Gly His Gly Gly Gln Val Met Val Ser Asn Ser Tyr
85 90 95
Leu Asp Gly Thr Tyr Thr Asp Ile Tyr Pro Glu Ile Thr Gln Asp Val
100 105 110
Glu Gly Met Gln Lys Leu Phe Lys Gln Phe Ser Phe Pro Gly Gly Val
115 120 125
Ala Ser His Ala Ala Pro Glu Thr Pro Gly Ser Ile His Glu Gly Gly
130 135 140
Glu Leu Gly Tyr Ser Ile Ser His Gly Val Gly Ala Ile Leu Asp Asn
145 150 155 160
Pro Asp Glu Ile Ala Ala Val Val Val Gly Asp Gly Glu Ser Glu Thr
165 170 175
Gly Pro Leu Ala Thr Ser Trp Gln Ser Thr Lys Phe Ile Asn Pro Ile
180 185 190
Asn Asp Gly Ala Val Leu Pro Ile Leu Asn Leu Asn Gly Phe Lys Ile
195 200 205
Ser Asn Pro Thr Ile Phe Gly Arg Thr Ser Asp Ala Lys Ile Lys Glu
210 215 220
Tyr Phe Glu Ser Met Ser Trp Glu Pro Ile Phe Val Glu Gly Asp Asp
225 230 235 240
Pro Glu Lys Val His Pro Val Leu Ala Lys Ala Met Asp Glu Ala Val
245 250 255
Glu Lys Ile Lys Ala Ile Gln Lys His Ala Arg Glu Asn Asp Asp Ala
260 265 270
Thr Leu Pro Val Trp Pro Met Ile Val Phe Arg Ala Pro Lys Gly Trp
275 280 285
Thr Gly Pro Lys Ser Trp Asp Gly Asp Lys Ile Glu Gly Ser Phe Arg
290 295 300
Ala His Gln Ile Pro Ile Pro Val Asp Gln Asn Asp Met Glu His Ala
305 310 315 320
Asp Ala Leu Val Asp Trp Leu Glu Ser Tyr Gln Pro Lys Glu Leu Phe
325 330 335
Asn Glu Asp Gly Ser Leu Lys Asp Asp Ile Lys Glu Ile Ile Pro Thr
340 345 350
Gly Asp Ser Arg Met Ala Ala Asn Pro Ile Thr Asn Gly Gly Val Asp
355 360 365
Pro Lys Ala Leu Asn Leu Pro Asn Phe Arg Asp Tyr Ala Val Asp Thr
370 375 380
Ser Lys Glu Gly Ala Asn Val Lys Gln Asp Met Leu Val Trp Ser Asp
385 390 395 400
Tyr Leu Arg Asp Val Ile Lys Lys Asn Pro Asp Asn Phe Arg Leu Phe
405 410 415
Gly Pro Asp Glu Thr Met Ser Asn Arg Leu Tyr Gly Val Phe Glu Thr
420 425 430
Thr Asn Arg Gln Trp Met Glu Asp Ile His Pro Asp Ser Asp Gln Tyr
435 440 445
Glu Ala Ala Ala Gly Arg Val Leu Asp Ala Gln Leu Ser Glu His Gln
450 455 460
Ala Glu Gly Trp Leu Glu Gly Tyr Val Leu Thr Gly Arg His Gly Leu
465 470 475 480
Phe Ala Ser Tyr Glu Ala Phe Leu Arg Val Val Asp Ser Met Leu Thr
485 490 495
Gln His Phe Lys Trp Leu Arg Lys Ala Asn Glu Leu Asp Trp Arg Lys
500 505 510
Lys Tyr Pro Ser Leu Asn Ile Ile Ala Ala Ser Thr Val Phe Gln Gln
515 520 525
Asp His Asn Gly Tyr Thr His Gln Asp Pro Gly Ala Leu Thr His Leu
530 535 540
Ala Glu Lys Lys Pro Glu Tyr Ile Arg Glu Tyr Leu Pro Ala Asp Ala
545 550 555 560
Asn Thr Leu Leu Ala Val Gly Asp Val Ile Phe Arg Ser Gln Glu Lys
565 570 575
Ile Asn Tyr Val Val Thr Ser Lys His Pro Arg Gln Gln Trp Phe Ser
580 585 590
Ile Glu Glu Ala Lys Gln Leu Val Asp Asn Gly Leu Gly Ile Ile Asp
595 600 605
Trp Ala Ser Thr Asp Gln Gly Ser Glu Pro Asp Ile Val Phe Ala Ala
610 615 620
Ala Gly Thr Glu Pro Thr Leu Glu Thr Leu Ala Ala Ile Gln Leu Leu
625 630 635 640
His Asp Ser Phe Pro Glu Met Lys Ile Arg Phe Val Asn Val Val Asp
645 650 655
Ile Leu Lys Leu Arg Ser Pro Glu Lys Asp Pro Arg Gly Leu Ser Asp
660 665 670
Ala Glu Phe Asp His Tyr Phe Thr Lys Asp Lys Pro Val Val Phe Ala
675 680 685
Phe His Gly Tyr Glu Asp Leu Val Arg Asp Ile Phe Phe Asp Arg His
690 695 700
Asn His Asn Leu Tyr Val His Gly Tyr Arg Glu Asn Gly Asp Ile Thr
705 710 715 720
Thr Pro Phe Asp Val Arg Val Met Asn Gln Met Asp Arg Phe Asp Leu
725 730 735
Ala Lys Thr Ala Ile Ala Ala Gln Pro Ala Met Glu Asn Thr Gly Ala
740 745 750
Ala Phe Val Gln Ser Met Asp Asn Met Leu Ala Lys His Asn Ala Tyr
755 760 765
Ile Arg Asp Ala Gly Thr Asp Leu Pro Glu Val Asn Asp Trp Gln Trp
770 775 780
Lys Gly Leu Lys
785
<210> 217
<211> 2478
<212> DNA
<213> 短双歧杆菌(Bifidobacterium breve)
<400> 217
atgacaaatc ctgttattgg caccccgtgg cagaagctgg atcgcccggt ttccgaagaa 60
gccatcgaag gcatggacaa gtattggcgc gtcaccaact acatgtccat cggccagatc 120
tatctgcgta gcaacccgct gatgaaggaa cccttcaccc gcgatgacgt gaagcaccgt 180
ctggtcggcc actggggcac caccccgggc ctgaacttcc ttctcgccca catcaaccgc 240
ctcatcgctg accaccagca gaacaccgtg ttcatcatgg gcccgggcca cggcggcccg 300
gctggcacct cccagtctta cgttgacggc acgtacaccg agtactaccc gaacatcacc 360
aaggacgaag ctggcctgca gaagttcttc cgccagttct cctacccggg cggcatcccg 420
tcgcacttcg ccccggagac cccgggatcg atccacgaag gtggcgagct tggctacgcg 480
ctctcccacg catacggcgc cgtgatgaac aacccgagcc tgttcgtgcc gtgcatcatc 540
ggcgacggcg aggccgagac cggcccgctc gccaccggct ggcagtccaa caagctcgtc 600
aacccgcgca ccgacggcat cgtgctgccg atcctgcacc tcaacggcta caagatcgcc 660
aacccgacca tcctcgctcg tatctccgac gaagagctgc atgacttctt ccgcggcatg 720
ggctaccacc cgtacgagtt cgttgccggc ttcgacaacg aggaccacat gtcgatccac 780
cgtcgtttcg ccgagctgtt cgagacgatc ttcgacgaga tctgcgacat caaggctgcg 840
gcccagaccg acgacatgac ccgtccgttc tacccgatgc tcatcttccg caccccgaag 900
ggctggacct gcccgaagtt catcgacggc aagaagaccg aaggctcctg gcgtgcgcac 960
caggtcccgc tggcttccgc ccgcgacacc gaagagcact tcgaagtcct caagggctgg 1020
atggaatcct acaagccgga agagctcttc aacgccgacg gctccatcaa ggatgacgtc 1080
accgcgttca tgccgaaggg cgagctccgc atcggcgcca acccgaacgc caacggtggt 1140
gtgatccgcg aggacctgaa gctccccgag ctcgaccagt acgaggtcac cggcgtcaag 1200
gagtacggcc atggctgggg ccaggtcgag gctccgcgtg ccctcggtgc atactgccgc 1260
gacatcatca agaacaaccc ggattcgttc cgcatcttcg gaccggacga gaccgcttcc 1320
aaccgcctga acgcgaccta cgaggtcacc gacaagcagt gggacaacgg ctacctttcg 1380
ggtctcgtcg acgagcacat ggcggtcacc ggtcaggtca ccgagcagct ctccgagcac 1440
cagtgcgagg gcttcctcga ggcgtacctc ctcaccggcc gccacggcat ctggagctcc 1500
tacgagtcct tcgtccacgt catcgactcg atgctcaacc agcatgcgaa gtggctcgag 1560
gccaccgtcc gcgagatccc gtggcgcaag ccgatctcct cggtgaacct cctcgtctcc 1620
tcgcacgtgt ggcgtcagga tcacaacggc ttctcgcacc aggatccggg tgtcacctcg 1680
ctcctgatca acaagacgtt caacaacgat cacgtgacga acatctactt cgcgaccgac 1740
gcgaacatgc tgctcgcgat ctccgagaag tgcttcaagt ccaccaacaa gatcaatgcg 1800
atcttcgccg gcaagcagcc tgctccgacg tgggtcacgc tcgatgaggc ccgcgccgag 1860
ctcgaagccg gcgccgctga gtggaagtgg gcttccaacg ccgagaacaa cgatgaggtc 1920
caggtcgtcc tcgcttccgc tggcgatgtg ccgacccagg agctcatggc cgcctccgat 1980
gccctcaaca agatgggcat caagttcaag gtcgtcaacg ttgttgacct cctgaagctg 2040
cagtcccgcg agaacaacga cgaggccctc acggacgagg agttcaccga actcttcacc 2100
gccgacaagc cggttctgtt cgcataccac tcctacgctc aggatgttcg cggcctcatc 2160
tacgaccgcc cgaaccacga caacttccac gtcgtcggct acaaggagca gggctccacg 2220
accacgccgt tcgacatggt ccgcgtcaac gacatggatc gctatgcgct ccaggccgct 2280
gccctcaagc tgatcgatgc cgacaagtac gccgacaaga tcgacgagct caacgcgttc 2340
cgcaagaagg cgttccagtt cgctgtcgac aacggctacg acatcccgga gttcaccgac 2400
tgggtgtacc cggatgtcaa ggtcgacgag acgcagatgc tttccgcgac cgcggcgacc 2460
gcaggcgaca acgagtga 2478
<210> 218
<211> 825
<212> PRT
<213> 短双歧杆菌
<400> 218
Met Thr Asn Pro Val Ile Gly Thr Pro Trp Gln Lys Leu Asp Arg Pro
1 5 10 15
Val Ser Glu Glu Ala Ile Glu Gly Met Asp Lys Tyr Trp Arg Val Thr
20 25 30
Asn Tyr Met Ser Ile Gly Gln Ile Tyr Leu Arg Ser Asn Pro Leu Met
35 40 45
Lys Glu Pro Phe Thr Arg Asp Asp Val Lys His Arg Leu Val Gly His
50 55 60
Trp Gly Thr Thr Pro Gly Leu Asn Phe Leu Leu Ala His Ile Asn Arg
65 70 75 80
Leu Ile Ala Asp His Gln Gln Asn Thr Val Phe Ile Met Gly Pro Gly
85 90 95
His Gly Gly Pro Ala Gly Thr Ser Gln Ser Tyr Val Asp Gly Thr Tyr
100 105 110
Thr Glu Tyr Tyr Pro Asn Ile Thr Lys Asp Glu Ala Gly Leu Gln Lys
115 120 125
Phe Phe Arg Gln Phe Ser Tyr Pro Gly Gly Ile Pro Ser His Phe Ala
130 135 140
Pro Glu Thr Pro Gly Ser Ile His Glu Gly Gly Glu Leu Gly Tyr Ala
145 150 155 160
Leu Ser His Ala Tyr Gly Ala Val Met Asn Asn Pro Ser Leu Phe Val
165 170 175
Pro Cys Ile Ile Gly Asp Gly Glu Ala Glu Thr Gly Pro Leu Ala Thr
180 185 190
Gly Trp Gln Ser Asn Lys Leu Val Asn Pro Arg Thr Asp Gly Ile Val
195 200 205
Leu Pro Ile Leu His Leu Asn Gly Tyr Lys Ile Ala Asn Pro Thr Ile
210 215 220
Leu Ala Arg Ile Ser Asp Glu Glu Leu His Asp Phe Phe Arg Gly Met
225 230 235 240
Gly Tyr His Pro Tyr Glu Phe Val Ala Gly Phe Asp Asn Glu Asp His
245 250 255
Met Ser Ile His Arg Arg Phe Ala Glu Leu Phe Glu Thr Ile Phe Asp
260 265 270
Glu Ile Cys Asp Ile Lys Ala Ala Ala Gln Thr Asp Asp Met Thr Arg
275 280 285
Pro Phe Tyr Pro Met Leu Ile Phe Arg Thr Pro Lys Gly Trp Thr Cys
290 295 300
Pro Lys Phe Ile Asp Gly Lys Lys Thr Glu Gly Ser Trp Arg Ala His
305 310 315 320
Gln Val Pro Leu Ala Ser Ala Arg Asp Thr Glu Glu His Phe Glu Val
325 330 335
Leu Lys Gly Trp Met Glu Ser Tyr Lys Pro Glu Glu Leu Phe Asn Ala
340 345 350
Asp Gly Ser Ile Lys Asp Asp Val Thr Ala Phe Met Pro Lys Gly Glu
355 360 365
Leu Arg Ile Gly Ala Asn Pro Asn Ala Asn Gly Gly Val Ile Arg Glu
370 375 380
Asp Leu Lys Leu Pro Glu Leu Asp Gln Tyr Glu Val Thr Gly Val Lys
385 390 395 400
Glu Tyr Gly His Gly Trp Gly Gln Val Glu Ala Pro Arg Ala Leu Gly
405 410 415
Ala Tyr Cys Arg Asp Ile Ile Lys Asn Asn Pro Asp Ser Phe Arg Ile
420 425 430
Phe Gly Pro Asp Glu Thr Ala Ser Asn Arg Leu Asn Ala Thr Tyr Glu
435 440 445
Val Thr Asp Lys Gln Trp Asp Asn Gly Tyr Leu Ser Gly Leu Val Asp
450 455 460
Glu His Met Ala Val Thr Gly Gln Val Thr Glu Gln Leu Ser Glu His
465 470 475 480
Gln Cys Glu Gly Phe Leu Glu Ala Tyr Leu Leu Thr Gly Arg His Gly
485 490 495
Ile Trp Ser Ser Tyr Glu Ser Phe Val His Val Ile Asp Ser Met Leu
500 505 510
Asn Gln His Ala Lys Trp Leu Glu Ala Thr Val Arg Glu Ile Pro Trp
515 520 525
Arg Lys Pro Ile Ser Ser Val Asn Leu Leu Val Ser Ser His Val Trp
530 535 540
Arg Gln Asp His Asn Gly Phe Ser His Gln Asp Pro Gly Val Thr Ser
545 550 555 560
Leu Leu Ile Asn Lys Thr Phe Asn Asn Asp His Val Thr Asn Ile Tyr
565 570 575
Phe Ala Thr Asp Ala Asn Met Leu Leu Ala Ile Ser Glu Lys Cys Phe
580 585 590
Lys Ser Thr Asn Lys Ile Asn Ala Ile Phe Ala Gly Lys Gln Pro Ala
595 600 605
Pro Thr Trp Val Thr Leu Asp Glu Ala Arg Ala Glu Leu Glu Ala Gly
610 615 620
Ala Ala Glu Trp Lys Trp Ala Ser Asn Ala Glu Asn Asn Asp Glu Val
625 630 635 640
Gln Val Val Leu Ala Ser Ala Gly Asp Val Pro Thr Gln Glu Leu Met
645 650 655
Ala Ala Ser Asp Ala Leu Asn Lys Met Gly Ile Lys Phe Lys Val Val
660 665 670
Asn Val Val Asp Leu Leu Lys Leu Gln Ser Arg Glu Asn Asn Asp Glu
675 680 685
Ala Leu Thr Asp Glu Glu Phe Thr Glu Leu Phe Thr Ala Asp Lys Pro
690 695 700
Val Leu Phe Ala Tyr His Ser Tyr Ala Gln Asp Val Arg Gly Leu Ile
705 710 715 720
Tyr Asp Arg Pro Asn His Asp Asn Phe His Val Val Gly Tyr Lys Glu
725 730 735
Gln Gly Ser Thr Thr Thr Pro Phe Asp Met Val Arg Val Asn Asp Met
740 745 750
Asp Arg Tyr Ala Leu Gln Ala Ala Ala Leu Lys Leu Ile Asp Ala Asp
755 760 765
Lys Tyr Ala Asp Lys Ile Asp Glu Leu Asn Ala Phe Arg Lys Lys Ala
770 775 780
Phe Gln Phe Ala Val Asp Asn Gly Tyr Asp Ile Pro Glu Phe Thr Asp
785 790 795 800
Trp Val Tyr Pro Asp Val Lys Val Asp Glu Thr Gln Met Leu Ser Ala
805 810 815
Thr Ala Ala Thr Ala Gly Asp Asn Glu
820 825
<210> 219
<211> 2145
<212> DNA
<213> 大肠杆菌
<400> 219
gtgtcccgta ttattatgct gatccctacc ggaaccagcg tcggtctgac cagcgtcagc 60
cttggcgtga tccgtgcaat ggaacgcaaa ggcgttcgtc tgagcgtttt caaacctatc 120
gctcagccgc gtaccggtgg cgatgcgccc gatcagacta cgactatcgt gcgtgcgaac 180
tcttccacca cgacggccgc tgaaccgctg aaaatgagct acgttgaagg tctgctttcc 240
agcaatcaga aagatgtgct gatggaagag atcgtcgcaa actaccacgc taacaccaaa 300
gacgctgaag tcgttctggt tgaaggtctg gtcccgacac gtaagcacca gtttgcccag 360
tctctgaact acgaaatcgc taaaacgctg aatgcggaaa tcgtcttcgt tatgtctcag 420
ggcactgaca ccccggaaca gctgaaagag cgtatcgaac tgacccgcaa cagcttcggc 480
ggtgccaaaa acaccaacat caccggcgtt atcgttaaca aactgaacgc accggttgat 540
gaacagggtc gtactcgccc ggatctgtcc gagattttcg acgactcttc caaagctaaa 600
gtaaacaatg ttgatccggc gaagctgcaa gaatccagcc cgctgccggt tctcggcgct 660
gtgccgtgga gctttgacct gatcgcgact cgtgcgatcg atatggctcg ccacctgaat 720
gcgaccatca tcaacgaagg cgacatcaat actcgccgcg ttaaatccgt cactttctgc 780
gcacgcagca ttccgcacat gctggagcac ttccgtgccg gttctctgct ggtgacttcc 840
gcagaccgtc ctgacgtgct ggtggccgct tgcctggcag ccatgaacgg cgtagaaatc 900
ggtgccctgc tgctgactgg cggttacgaa atggacgcgc gcatttctaa actgtgcgaa 960
cgtgctttcg ctaccggcct gccggtattt atggtgaaca ccaacacctg gcagacctct 1020
ctgagcctgc agagcttcaa cctggaagtt ccggttgacg atcacgaacg tatcgagaaa 1080
gttcaggaat acgttgctaa ctacatcaac gctgactgga tcgaatctct gactgccact 1140
tctgagcgca gccgtcgtct gtctccgcct gcgttccgtt atcagctgac tgaacttgcg 1200
cgcaaagcgg gcaaacgtat cgtactgccg gaaggtgacg aaccgcgtac cgttaaagca 1260
gccgctatct gtgctgaacg tggtatcgca acttgcgtac tgctgggtaa tccggcagag 1320
atcaaccgtg ttgcagcgtc tcagggtgta gaactgggtg cagggattga aatcgttgat 1380
ccagaagtgg ttcgcgaaag ctatgttggt cgtctggtcg aactgcgtaa gaacaaaggc 1440
atgaccgaaa ccgttgcccg cgaacagctg gaagacaacg tggtgctcgg tacgctgatg 1500
ctggaacagg atgaagttga tggtctggtt tccggtgctg ttcacactac cgcaaacacc 1560
atccgtccgc cgctgcagct gatcaaaact gcaccgggca gctccctggt atcttccgtg 1620
ttcttcatgc tgctgccgga acaggtttac gtttacggtg actgtgcgat caacccggat 1680
ccgaccgctg aacagctggc agaaatcgcg attcagtccg ctgattccgc tgcggccttc 1740
ggtatcgaac cgcgcgttgc tatgctctcc tactccaccg gtacttctgg tgcaggtagc 1800
gacgtagaaa aagttcgcga agcaactcgt ctggcgcagg aaaaacgtcc tgacctgatg 1860
atcgacggtc cgctgcagta cgacgctgcg gtaatggctg acgttgcgaa atccaaagcg 1920
ccgaactctc cggttgcagg tcgcgctacc gtgttcatct tcccggatct gaacaccggt 1980
aacaccacct acaaagcggt acagcgttct gccgacctga tctccatcgg gccgatgctg 2040
cagggtatgc gcaagccggt taacgacctg tcccgtggcg cactggttga cgatatcgtc 2100
tacaccatcg cgctgactgc gattcagtct gcacagcagc agtaa 2145
<210> 220
<211> 714
<212> PRT
<213> 大肠杆菌
<400> 220
Met Ser Arg Ile Ile Met Leu Ile Pro Thr Gly Thr Ser Val Gly Leu
1 5 10 15
Thr Ser Val Ser Leu Gly Val Ile Arg Ala Met Glu Arg Lys Gly Val
20 25 30
Arg Leu Ser Val Phe Lys Pro Ile Ala Gln Pro Arg Thr Gly Gly Asp
35 40 45
Ala Pro Asp Gln Thr Thr Thr Ile Val Arg Ala Asn Ser Ser Thr Thr
50 55 60
Thr Ala Ala Glu Pro Leu Lys Met Ser Tyr Val Glu Gly Leu Leu Ser
65 70 75 80
Ser Asn Gln Lys Asp Val Leu Met Glu Glu Ile Val Ala Asn Tyr His
85 90 95
Ala Asn Thr Lys Asp Ala Glu Val Val Leu Val Glu Gly Leu Val Pro
100 105 110
Thr Arg Lys His Gln Phe Ala Gln Ser Leu Asn Tyr Glu Ile Ala Lys
115 120 125
Thr Leu Asn Ala Glu Ile Val Phe Val Met Ser Gln Gly Thr Asp Thr
130 135 140
Pro Glu Gln Leu Lys Glu Arg Ile Glu Leu Thr Arg Asn Ser Phe Gly
145 150 155 160
Gly Ala Lys Asn Thr Asn Ile Thr Gly Val Ile Val Asn Lys Leu Asn
165 170 175
Ala Pro Val Asp Glu Gln Gly Arg Thr Arg Pro Asp Leu Ser Glu Ile
180 185 190
Phe Asp Asp Ser Ser Lys Ala Lys Val Asn Asn Val Asp Pro Ala Lys
195 200 205
Leu Gln Glu Ser Ser Pro Leu Pro Val Leu Gly Ala Val Pro Trp Ser
210 215 220
Phe Asp Leu Ile Ala Thr Arg Ala Ile Asp Met Ala Arg His Leu Asn
225 230 235 240
Ala Thr Ile Ile Asn Glu Gly Asp Ile Asn Thr Arg Arg Val Lys Ser
245 250 255
Val Thr Phe Cys Ala Arg Ser Ile Pro His Met Leu Glu His Phe Arg
260 265 270
Ala Gly Ser Leu Leu Val Thr Ser Ala Asp Arg Pro Asp Val Leu Val
275 280 285
Ala Ala Cys Leu Ala Ala Met Asn Gly Val Glu Ile Gly Ala Leu Leu
290 295 300
Leu Thr Gly Gly Tyr Glu Met Asp Ala Arg Ile Ser Lys Leu Cys Glu
305 310 315 320
Arg Ala Phe Ala Thr Gly Leu Pro Val Phe Met Val Asn Thr Asn Thr
325 330 335
Trp Gln Thr Ser Leu Ser Leu Gln Ser Phe Asn Leu Glu Val Pro Val
340 345 350
Asp Asp His Glu Arg Ile Glu Lys Val Gln Glu Tyr Val Ala Asn Tyr
355 360 365
Ile Asn Ala Asp Trp Ile Glu Ser Leu Thr Ala Thr Ser Glu Arg Ser
370 375 380
Arg Arg Leu Ser Pro Pro Ala Phe Arg Tyr Gln Leu Thr Glu Leu Ala
385 390 395 400
Arg Lys Ala Gly Lys Arg Ile Val Leu Pro Glu Gly Asp Glu Pro Arg
405 410 415
Thr Val Lys Ala Ala Ala Ile Cys Ala Glu Arg Gly Ile Ala Thr Cys
420 425 430
Val Leu Leu Gly Asn Pro Ala Glu Ile Asn Arg Val Ala Ala Ser Gln
435 440 445
Gly Val Glu Leu Gly Ala Gly Ile Glu Ile Val Asp Pro Glu Val Val
450 455 460
Arg Glu Ser Tyr Val Gly Arg Leu Val Glu Leu Arg Lys Asn Lys Gly
465 470 475 480
Met Thr Glu Thr Val Ala Arg Glu Gln Leu Glu Asp Asn Val Val Leu
485 490 495
Gly Thr Leu Met Leu Glu Gln Asp Glu Val Asp Gly Leu Val Ser Gly
500 505 510
Ala Val His Thr Thr Ala Asn Thr Ile Arg Pro Pro Leu Gln Leu Ile
515 520 525
Lys Thr Ala Pro Gly Ser Ser Leu Val Ser Ser Val Phe Phe Met Leu
530 535 540
Leu Pro Glu Gln Val Tyr Val Tyr Gly Asp Cys Ala Ile Asn Pro Asp
545 550 555 560
Pro Thr Ala Glu Gln Leu Ala Glu Ile Ala Ile Gln Ser Ala Asp Ser
565 570 575
Ala Ala Ala Phe Gly Ile Glu Pro Arg Val Ala Met Leu Ser Tyr Ser
580 585 590
Thr Gly Thr Ser Gly Ala Gly Ser Asp Val Glu Lys Val Arg Glu Ala
595 600 605
Thr Arg Leu Ala Gln Glu Lys Arg Pro Asp Leu Met Ile Asp Gly Pro
610 615 620
Leu Gln Tyr Asp Ala Ala Val Met Ala Asp Val Ala Lys Ser Lys Ala
625 630 635 640
Pro Asn Ser Pro Val Ala Gly Arg Ala Thr Val Phe Ile Phe Pro Asp
645 650 655
Leu Asn Thr Gly Asn Thr Thr Tyr Lys Ala Val Gln Arg Ser Ala Asp
660 665 670
Leu Ile Ser Ile Gly Pro Met Leu Gln Gly Met Arg Lys Pro Val Asn
675 680 685
Asp Leu Ser Arg Gly Ala Leu Val Asp Asp Ile Val Tyr Thr Ile Ala
690 695 700
Leu Thr Ala Ile Gln Ser Ala Gln Gln Gln
705 710
<210> 221
<211> 1002
<212> DNA
<213> 丙酮丁醇梭菌
<400> 221
atggatttaa tagaaagcat atgggagtgt gctaagcaag acaaaaaaag gataatatta 60
gctgaaggtg aagaaaaaag aaatctaatt gccgcagata aaattatcaa agagggatta 120
gcagagcttg ttcttgtagg tgatgaaaat aaaattaaag aaaaagcaag tgagttgaat 180
cttgacattt cgaaggctga aataatggat ccagagacat cactaaaaac agaaacatat 240
gctagagatt tttatgaact tagaaaacac aaaggaatga ctattgaaaa atctgaaaaa 300
atggtaagag atcctcttta ttttgcaaca atggctttaa aagatggcta tgttgatgga 360
atggtttcag gagctgttca cacaactgga gatttattaa gaccaggact tcaaattata 420
aaaactgcac caggagttaa aatagtatca ggattctttg ttatgataat acctgactgc 480
gattatggtg aagagggtct tttattattt gcagattgtg ctgtaaatcc taacccaaca 540
tcagatgaac tagctgatat tgctataact acagctgaaa cagctagaaa attatgtaac 600
gtagagccta aagttgcgat gctttcattc tcaactatgg gaagtgcaaa aggcgaaatg 660
gtagataagg ttaaaaatgc tgttgaaatc acaaagaaat tcagaccgga tcttgctatt 720
gatggtgagc ttcagcttga tgctgcaata gatagtgaag tagcggcttt aaaagcacct 780
tctagtaatg ttgcaggaaa tgcaaatgtt cttgtattcc cagatcttca aacaggaaac 840
attgggtaca agcttgttca aagatttgca aaagcaaaag caataggacc tatatgtcaa 900
ggatttgcaa aacctattaa tgatttatca agaggctgta gctcagagga tatagtaaat 960
gttgttgcta taactgttgt tcaggctcaa agaggtatat aa 1002
<210> 222
<211> 333
<212> PRT
<213> 丙酮丁醇梭菌
<400> 222
Met Asp Leu Ile Glu Ser Ile Trp Glu Cys Ala Lys Gln Asp Lys Lys
1 5 10 15
Arg Ile Ile Leu Ala Glu Gly Glu Glu Lys Arg Asn Leu Ile Ala Ala
20 25 30
Asp Lys Ile Ile Lys Glu Gly Leu Ala Glu Leu Val Leu Val Gly Asp
35 40 45
Glu Asn Lys Ile Lys Glu Lys Ala Ser Glu Leu Asn Leu Asp Ile Ser
50 55 60
Lys Ala Glu Ile Met Asp Pro Glu Thr Ser Leu Lys Thr Glu Thr Tyr
65 70 75 80
Ala Arg Asp Phe Tyr Glu Leu Arg Lys His Lys Gly Met Thr Ile Glu
85 90 95
Lys Ser Glu Lys Met Val Arg Asp Pro Leu Tyr Phe Ala Thr Met Ala
100 105 110
Leu Lys Asp Gly Tyr Val Asp Gly Met Val Ser Gly Ala Val His Thr
115 120 125
Thr Gly Asp Leu Leu Arg Pro Gly Leu Gln Ile Ile Lys Thr Ala Pro
130 135 140
Gly Val Lys Ile Val Ser Gly Phe Phe Val Met Ile Ile Pro Asp Cys
145 150 155 160
Asp Tyr Gly Glu Glu Gly Leu Leu Leu Phe Ala Asp Cys Ala Val Asn
165 170 175
Pro Asn Pro Thr Ser Asp Glu Leu Ala Asp Ile Ala Ile Thr Thr Ala
180 185 190
Glu Thr Ala Arg Lys Leu Cys Asn Val Glu Pro Lys Val Ala Met Leu
195 200 205
Ser Phe Ser Thr Met Gly Ser Ala Lys Gly Glu Met Val Asp Lys Val
210 215 220
Lys Asn Ala Val Glu Ile Thr Lys Lys Phe Arg Pro Asp Leu Ala Ile
225 230 235 240
Asp Gly Glu Leu Gln Leu Asp Ala Ala Ile Asp Ser Glu Val Ala Ala
245 250 255
Leu Lys Ala Pro Ser Ser Asn Val Ala Gly Asn Ala Asn Val Leu Val
260 265 270
Phe Pro Asp Leu Gln Thr Gly Asn Ile Gly Tyr Lys Leu Val Gln Arg
275 280 285
Phe Ala Lys Ala Lys Ala Ile Gly Pro Ile Cys Gln Gly Phe Ala Lys
290 295 300
Pro Ile Asn Asp Leu Ser Arg Gly Cys Ser Ser Glu Asp Ile Val Asn
305 310 315 320
Val Val Ala Ile Thr Val Val Gln Ala Gln Arg Gly Ile
325 330
<210> 223
<211> 1647
<212> DNA
<213> 乳酸乳球菌
<400> 223
atgtatacag taggagatta cctattagac cgattacacg agttaggaat tgaagaaatt 60
tttggagtcc ctggagacta taacttacaa tttttagatc aaattatttc ccacaaggat 120
atgaaatggg tcggaaatgc taatgaatta aatgcttcat atatggctga tggctatgct 180
cgtactaaaa aagctgccgc atttcttaca acctttggag taggtgaatt gagtgcagtt 240
aatggattag caggaagtta cgccgaaaat ttaccagtag tagaaatagt gggatcacct 300
acatcaaaag ttcaaaatga aggaaaattt gttcatcata cgctggctga cggtgatttt 360
aaacacttta tgaaaatgca cgaacctgtt acagcagctc gaactttact gacagcagaa 420
aatgcaaccg ttgaaattga ccgagtactt tctgcactat taaaagaaag aaaacctgtc 480
tatatcaact taccagttga tgttgctgct gcaaaagcag agaaaccctc actccctttg 540
aaaaaggaaa actcaacttc aaatacaagt gaccaagaaa ttttgaacaa aattcaagaa 600
agcttgaaaa atgccaaaaa accaatcgtg attacaggac atgaaataat tagttttggc 660
ttagaaaaaa cagtcactca atttatttca aagacaaaac tacctattac gacattaaac 720
tttggtaaaa gttcagttga tgaagccctc ccttcatttt taggaatcta taatggtaca 780
ctctcagagc ctaatcttaa agaattcgtg gaatcagccg acttcatctt gatgcttgga 840
gttaaactca cagactcttc aacaggagcc ttcactcatc atttaaatga aaataaaatg 900
atttcactga atatagatga aggaaaaata tttaacgaaa gaatccaaaa ttttgatttt 960
gaatccctca tctcctctct cttagaccta agcgaaatag aatacaaagg aaaatatatc 1020
gataaaaagc aagaagactt tgttccatca aatgcgcttt tatcacaaga ccgcctatgg 1080
caagcagttg aaaacctaac tcaaagcaat gaaacaatcg ttgctgaaca agggacatca 1140
ttctttggcg cttcatcaat tttcttaaaa tcaaagagtc attttattgg tcaaccctta 1200
tggggatcaa ttggatatac attcccagca gcattaggaa gccaaattgc agataaagaa 1260
agcagacacc ttttatttat tggtgatggt tcacttcaac ttacagtgca agaattagga 1320
ttagcaatca gagaaaaaat taatccaatt tgctttatta tcaataatga tggttataca 1380
gtcgaaagag aaattcatgg accaaatcaa agctacaatg atattccaat gtggaattac 1440
tcaaaattac cagaatcgtt tggagcaaca gaagatcgag tagtctcaaa aatcgttaga 1500
actgaaaatg aatttgtgtc tgtcatgaaa gaagctcaag cagatccaaa tagaatgtac 1560
tggattgagt taattttggc aaaagaaggt gcaccaaaag tactgaaaaa aatgggcaaa 1620
ctatttgctg aacaaaataa atcataa 1647
<210> 224
<211> 548
<212> PRT
<213> 乳酸乳球菌
<400> 224
Met Tyr Thr Val Gly Asp Tyr Leu Leu Asp Arg Leu His Glu Leu Gly
1 5 10 15
Ile Glu Glu Ile Phe Gly Val Pro Gly Asp Tyr Asn Leu Gln Phe Leu
20 25 30
Asp Gln Ile Ile Ser His Lys Asp Met Lys Trp Val Gly Asn Ala Asn
35 40 45
Glu Leu Asn Ala Ser Tyr Met Ala Asp Gly Tyr Ala Arg Thr Lys Lys
50 55 60
Ala Ala Ala Phe Leu Thr Thr Phe Gly Val Gly Glu Leu Ser Ala Val
65 70 75 80
Asn Gly Leu Ala Gly Ser Tyr Ala Glu Asn Leu Pro Val Val Glu Ile
85 90 95
Val Gly Ser Pro Thr Ser Lys Val Gln Asn Glu Gly Lys Phe Val His
100 105 110
His Thr Leu Ala Asp Gly Asp Phe Lys His Phe Met Lys Met His Glu
115 120 125
Pro Val Thr Ala Ala Arg Thr Leu Leu Thr Ala Glu Asn Ala Thr Val
130 135 140
Glu Ile Asp Arg Val Leu Ser Ala Leu Leu Lys Glu Arg Lys Pro Val
145 150 155 160
Tyr Ile Asn Leu Pro Val Asp Val Ala Ala Ala Lys Ala Glu Lys Pro
165 170 175
Ser Leu Pro Leu Lys Lys Glu Asn Ser Thr Ser Asn Thr Ser Asp Gln
180 185 190
Glu Ile Leu Asn Lys Ile Gln Glu Ser Leu Lys Asn Ala Lys Lys Pro
195 200 205
Ile Val Ile Thr Gly His Glu Ile Ile Ser Phe Gly Leu Glu Lys Thr
210 215 220
Val Thr Gln Phe Ile Ser Lys Thr Lys Leu Pro Ile Thr Thr Leu Asn
225 230 235 240
Phe Gly Lys Ser Ser Val Asp Glu Ala Leu Pro Ser Phe Leu Gly Ile
245 250 255
Tyr Asn Gly Thr Leu Ser Glu Pro Asn Leu Lys Glu Phe Val Glu Ser
260 265 270
Ala Asp Phe Ile Leu Met Leu Gly Val Lys Leu Thr Asp Ser Ser Thr
275 280 285
Gly Ala Phe Thr His His Leu Asn Glu Asn Lys Met Ile Ser Leu Asn
290 295 300
Ile Asp Glu Gly Lys Ile Phe Asn Glu Arg Ile Gln Asn Phe Asp Phe
305 310 315 320
Glu Ser Leu Ile Ser Ser Leu Leu Asp Leu Ser Glu Ile Glu Tyr Lys
325 330 335
Gly Lys Tyr Ile Asp Lys Lys Gln Glu Asp Phe Val Pro Ser Asn Ala
340 345 350
Leu Leu Ser Gln Asp Arg Leu Trp Gln Ala Val Glu Asn Leu Thr Gln
355 360 365
Ser Asn Glu Thr Ile Val Ala Glu Gln Gly Thr Ser Phe Phe Gly Ala
370 375 380
Ser Ser Ile Phe Leu Lys Ser Lys Ser His Phe Ile Gly Gln Pro Leu
385 390 395 400
Trp Gly Ser Ile Gly Tyr Thr Phe Pro Ala Ala Leu Gly Ser Gln Ile
405 410 415
Ala Asp Lys Glu Ser Arg His Leu Leu Phe Ile Gly Asp Gly Ser Leu
420 425 430
Gln Leu Thr Val Gln Glu Leu Gly Leu Ala Ile Arg Glu Lys Ile Asn
435 440 445
Pro Ile Cys Phe Ile Ile Asn Asn Asp Gly Tyr Thr Val Glu Arg Glu
450 455 460
Ile His Gly Pro Asn Gln Ser Tyr Asn Asp Ile Pro Met Trp Asn Tyr
465 470 475 480
Ser Lys Leu Pro Glu Ser Phe Gly Ala Thr Glu Asp Arg Val Val Ser
485 490 495
Lys Ile Val Arg Thr Glu Asn Glu Phe Val Ser Val Met Lys Glu Ala
500 505 510
Gln Ala Asp Pro Asn Arg Met Tyr Trp Ile Glu Leu Ile Leu Ala Lys
515 520 525
Glu Gly Ala Pro Lys Val Leu Lys Lys Met Gly Lys Leu Phe Ala Glu
530 535 540
Gln Asn Lys Ser
545
<210> 225
<211> 2802
<212> DNA
<213> 大肠杆菌
<400> 225
atgcagaaca gcgctttgaa agcctggttg gactcttctt acctctctgg cgcaaaccag 60
agctggatag aacagctcta tgaagacttc ttaaccgatc ctgactcggt tgacgctaac 120
tggcgttcga cgttccagca gttacctggt acgggagtca aaccggatca attccactct 180
caaacgcgtg aatatttccg ccgcctggcg aaagacgctt cacgttactc ttcaacgatc 240
tccgaccctg acaccaatgt gaagcaggtt aaagtcctgc agctcattaa cgcataccgc 300
ttccgtggtc accagcatgc gaatctcgat ccgctgggac tgtggcagca agataaagtg 360
gccgatctgg atccgtcttt ccacgatctg accgaagcag acttccagga gaccttcaac 420
gtcggttcat ttgccagcgg caaagaaacc atgaaactcg gcgagctgct ggaagccctc 480
aagcaaacct actgcggccc gattggtgcc gagtatatgc acattaccag caccgaagaa 540
aaacgctgga tccaacagcg tatcgagtct ggtcgcgcga ctttcaatag cgaagagaaa 600
aaacgcttct taagcgaact gaccgccgct gaaggtcttg aacgttacct cggcgcaaaa 660
ttccctggcg caaaacgctt ctcgctggaa ggcggtgacg cgttaatccc gatgcttaaa 720
gagatgatcc gccacgctgg caacagcggc acccgcgaag tggttctcgg gatggcgcac 780
cgtggtcgtc tgaacgtgct ggtgaacgtg ctgggtaaaa aaccgcaaga cttgttcgac 840
gagttcgccg gtaaacataa agaacacctc ggcacgggtg acgtgaaata ccacatgggc 900
ttctcgtctg acttccagac cgatggcggc ctggtgcacc tggcgctggc gtttaacccg 960
tctcaccttg agattgtaag cccggtagtt atcggttctg ttcgtgcccg tctggacaga 1020
cttgatgagc cgagcagcaa caaagtgctg ccaatcacca tccacggtga cgccgcagtg 1080
accgggcagg gcgtggttca ggaaaccctg aacatgtcga aagcgcgtgg ttatgaagtt 1140
ggcggtacgg tacgtatcgt tatcaacaac caggttggtt tcaccacctc taatccgctg 1200
gatgcccgtt ctacgccgta ctgtactgat atcggtaaga tggttcaggc cccgattttc 1260
cacgttaacg cggacgatcc ggaagccgtt gcctttgtga cccgtctggc gctcgatttc 1320
cgtaacacct ttaaacgtga tgtcttcatc gacctggtgt gctaccgccg tcacggccac 1380
aacgaagccg acgagccgag cgcaacccag ccgctgatgt atcagaaaat caaaaaacat 1440
ccgacaccgc gcaaaatcta cgctgacaag ctggagcagg aaaaagtggc gacgctggaa 1500
gatgccaccg agatggttaa cctgtaccgc gatgcgctgg atgctggcga ttgcgtagtg 1560
gcagagtggc gtccgatgaa catgcactct ttcacctggt cgccgtacct caaccacgaa 1620
tgggacgaag agtacccgaa caaagttgag atgaagcgcc tgcaggagct ggcgaaacgc 1680
atcagcacgg tgccggaagc agttgaaatg cagtctcgcg ttgccaagat ttatggcgat 1740
cgccaggcga tggctgccgg tgagaaactg ttcgactggg gcggtgcgga aaacctcgct 1800
tacgccacgc tggttgatga aggcattccg gttcgcctgt cgggtgaaga ctccggtcgc 1860
ggtaccttct tccaccgcca cgcggtgatc cacaaccagt ctaacggttc cacttacacg 1920
ccgctgcaac atatccataa cgggcagggc gcgttccgtg tctgggactc cgtactgtct 1980
gaagaagcag tgctggcgtt tgaatatggt tatgccaccg cagaaccacg cactctgacc 2040
atctgggaag cgcagttcgg tgacttcgcc aacggtgcgc aggtggttat cgaccagttc 2100
atctcctctg gcgaacagaa atggggccgg atgtgtggtc tggtgatgtt gctgccgcac 2160
ggttacgaag ggcaggggcc ggagcactcc tccgcgcgtc tggaacgtta tctgcaactt 2220
tgtgctgagc aaaacatgca ggtttgcgta ccgtctaccc cggcacaggt ttaccacatg 2280
ctgcgtcgtc aggcgctgcg cgggatgcgt cgtccgctgg tcgtgatgtc gccgaaatcc 2340
ctgctgcgtc atccgctggc ggtttccagc ctcgaagaac tggcgaacgg caccttcctg 2400
ccagccatcg gtgaaatcga cgagcttgat ccgaagggcg tgaagcgcgt agtgatgtgt 2460
tctggtaagg tttattacga cctgctggaa cagcgtcgta agaacaatca acacgatgtc 2520
gccattgtgc gtatcgagca actctacccg ttcccgcata aagcgatgca ggaagtgttg 2580
cagcagtttg ctcacgtcaa ggattttgtc tggtgccagg aagagccgct caaccagggc 2640
gcatggtact gcagccagca tcatttccgt gaagtgattc cgtttggggc ttctctgcgt 2700
tatgcaggcc gcccggcctc cgcctctccg gcggtagggt atatgtccgt tcaccagaaa 2760
cagcaacaag atctggttaa tgacgcgctg aacgtcgaat aa 2802
<210> 226
<211> 933
<212> PRT
<213> 大肠杆菌
<400> 226
Met Gln Asn Ser Ala Leu Lys Ala Trp Leu Asp Ser Ser Tyr Leu Ser
1 5 10 15
Gly Ala Asn Gln Ser Trp Ile Glu Gln Leu Tyr Glu Asp Phe Leu Thr
20 25 30
Asp Pro Asp Ser Val Asp Ala Asn Trp Arg Ser Thr Phe Gln Gln Leu
35 40 45
Pro Gly Thr Gly Val Lys Pro Asp Gln Phe His Ser Gln Thr Arg Glu
50 55 60
Tyr Phe Arg Arg Leu Ala Lys Asp Ala Ser Arg Tyr Ser Ser Thr Ile
65 70 75 80
Ser Asp Pro Asp Thr Asn Val Lys Gln Val Lys Val Leu Gln Leu Ile
85 90 95
Asn Ala Tyr Arg Phe Arg Gly His Gln His Ala Asn Leu Asp Pro Leu
100 105 110
Gly Leu Trp Gln Gln Asp Lys Val Ala Asp Leu Asp Pro Ser Phe His
115 120 125
Asp Leu Thr Glu Ala Asp Phe Gln Glu Thr Phe Asn Val Gly Ser Phe
130 135 140
Ala Ser Gly Lys Glu Thr Met Lys Leu Gly Glu Leu Leu Glu Ala Leu
145 150 155 160
Lys Gln Thr Tyr Cys Gly Pro Ile Gly Ala Glu Tyr Met His Ile Thr
165 170 175
Ser Thr Glu Glu Lys Arg Trp Ile Gln Gln Arg Ile Glu Ser Gly Arg
180 185 190
Ala Thr Phe Asn Ser Glu Glu Lys Lys Arg Phe Leu Ser Glu Leu Thr
195 200 205
Ala Ala Glu Gly Leu Glu Arg Tyr Leu Gly Ala Lys Phe Pro Gly Ala
210 215 220
Lys Arg Phe Ser Leu Glu Gly Gly Asp Ala Leu Ile Pro Met Leu Lys
225 230 235 240
Glu Met Ile Arg His Ala Gly Asn Ser Gly Thr Arg Glu Val Val Leu
245 250 255
Gly Met Ala His Arg Gly Arg Leu Asn Val Leu Val Asn Val Leu Gly
260 265 270
Lys Lys Pro Gln Asp Leu Phe Asp Glu Phe Ala Gly Lys His Lys Glu
275 280 285
His Leu Gly Thr Gly Asp Val Lys Tyr His Met Gly Phe Ser Ser Asp
290 295 300
Phe Gln Thr Asp Gly Gly Leu Val His Leu Ala Leu Ala Phe Asn Pro
305 310 315 320
Ser His Leu Glu Ile Val Ser Pro Val Val Ile Gly Ser Val Arg Ala
325 330 335
Arg Leu Asp Arg Leu Asp Glu Pro Ser Ser Asn Lys Val Leu Pro Ile
340 345 350
Thr Ile His Gly Asp Ala Ala Val Thr Gly Gln Gly Val Val Gln Glu
355 360 365
Thr Leu Asn Met Ser Lys Ala Arg Gly Tyr Glu Val Gly Gly Thr Val
370 375 380
Arg Ile Val Ile Asn Asn Gln Val Gly Phe Thr Thr Ser Asn Pro Leu
385 390 395 400
Asp Ala Arg Ser Thr Pro Tyr Cys Thr Asp Ile Gly Lys Met Val Gln
405 410 415
Ala Pro Ile Phe His Val Asn Ala Asp Asp Pro Glu Ala Val Ala Phe
420 425 430
Val Thr Arg Leu Ala Leu Asp Phe Arg Asn Thr Phe Lys Arg Asp Val
435 440 445
Phe Ile Asp Leu Val Cys Tyr Arg Arg His Gly His Asn Glu Ala Asp
450 455 460
Glu Pro Ser Ala Thr Gln Pro Leu Met Tyr Gln Lys Ile Lys Lys His
465 470 475 480
Pro Thr Pro Arg Lys Ile Tyr Ala Asp Lys Leu Glu Gln Glu Lys Val
485 490 495
Ala Thr Leu Glu Asp Ala Thr Glu Met Val Asn Leu Tyr Arg Asp Ala
500 505 510
Leu Asp Ala Gly Asp Cys Val Val Ala Glu Trp Arg Pro Met Asn Met
515 520 525
His Ser Phe Thr Trp Ser Pro Tyr Leu Asn His Glu Trp Asp Glu Glu
530 535 540
Tyr Pro Asn Lys Val Glu Met Lys Arg Leu Gln Glu Leu Ala Lys Arg
545 550 555 560
Ile Ser Thr Val Pro Glu Ala Val Glu Met Gln Ser Arg Val Ala Lys
565 570 575
Ile Tyr Gly Asp Arg Gln Ala Met Ala Ala Gly Glu Lys Leu Phe Asp
580 585 590
Trp Gly Gly Ala Glu Asn Leu Ala Tyr Ala Thr Leu Val Asp Glu Gly
595 600 605
Ile Pro Val Arg Leu Ser Gly Glu Asp Ser Gly Arg Gly Thr Phe Phe
610 615 620
His Arg His Ala Val Ile His Asn Gln Ser Asn Gly Ser Thr Tyr Thr
625 630 635 640
Pro Leu Gln His Ile His Asn Gly Gln Gly Ala Phe Arg Val Trp Asp
645 650 655
Ser Val Leu Ser Glu Glu Ala Val Leu Ala Phe Glu Tyr Gly Tyr Ala
660 665 670
Thr Ala Glu Pro Arg Thr Leu Thr Ile Trp Glu Ala Gln Phe Gly Asp
675 680 685
Phe Ala Asn Gly Ala Gln Val Val Ile Asp Gln Phe Ile Ser Ser Gly
690 695 700
Glu Gln Lys Trp Gly Arg Met Cys Gly Leu Val Met Leu Leu Pro His
705 710 715 720
Gly Tyr Glu Gly Gln Gly Pro Glu His Ser Ser Ala Arg Leu Glu Arg
725 730 735
Tyr Leu Gln Leu Cys Ala Glu Gln Asn Met Gln Val Cys Val Pro Ser
740 745 750
Thr Pro Ala Gln Val Tyr His Met Leu Arg Arg Gln Ala Leu Arg Gly
755 760 765
Met Arg Arg Pro Leu Val Val Met Ser Pro Lys Ser Leu Leu Arg His
770 775 780
Pro Leu Ala Val Ser Ser Leu Glu Glu Leu Ala Asn Gly Thr Phe Leu
785 790 795 800
Pro Ala Ile Gly Glu Ile Asp Glu Leu Asp Pro Lys Gly Val Lys Arg
805 810 815
Val Val Met Cys Ser Gly Lys Val Tyr Tyr Asp Leu Leu Glu Gln Arg
820 825 830
Arg Lys Asn Asn Gln His Asp Val Ala Ile Val Arg Ile Glu Gln Leu
835 840 845
Tyr Pro Phe Pro His Lys Ala Met Gln Glu Val Leu Gln Gln Phe Ala
850 855 860
His Val Lys Asp Phe Val Trp Cys Gln Glu Glu Pro Leu Asn Gln Gly
865 870 875 880
Ala Trp Tyr Cys Ser Gln His His Phe Arg Glu Val Ile Pro Phe Gly
885 890 895
Ala Ser Leu Arg Tyr Ala Gly Arg Pro Ala Ser Ala Ser Pro Ala Val
900 905 910
Gly Tyr Met Ser Val His Gln Lys Gln Gln Gln Asp Leu Val Asn Asp
915 920 925
Ala Leu Asn Val Glu
930
<210> 227
<211> 1233
<212> DNA
<213> 大肠杆菌
<400> 227
atggcaaagg tatcgctgga gaaagacaag attaagtttc tgctggtaga aggcgtgcac 60
caaaaggcgc tggaaagcct tcgtgcagct ggttacacca acatcgaatt tcacaaaggc 120
gcgctggatg atgaacaatt aaaagaatcc atccgcgatg cccacttcat cggcctgcga 180
tcccgtaccc atctgactga agacgtgatc aacgccgcag aaaaactggt cgctattggc 240
tgtttctgta tcggaacaaa ccaggttgat ctggatgcgg cggcaaagcg cgggatcccg 300
gtatttaacg caccgttctc aaatacgcgc tctgttgcgg agctggtgat tggcgaactg 360
ctgctgctat tgcgcggcgt gccggaagcc aatgctaaag cgcaccgtgg cgtgtggaac 420
aaactggcgg cgggttcttt tgaagcgcgc ggcaaaaagc tgggtatcat cggctacggt 480
catattggta cgcaattggg cattctggct gaatcgctgg gaatgtatgt ttacttttat 540
gatattgaaa ataaactgcc gctgggcaac gccactcagg tacagcatct ttctgacctg 600
ctgaatatga gcgatgtggt gagtctgcat gtaccagaga atccgtccac caaaaatatg 660
atgggcgcga aagaaatttc actaatgaag cccggctcgc tgctgattaa tgcttcgcgc 720
ggtactgtgg tggatattcc ggcgctgtgt gatgcgctgg cgagcaaaca tctggcgggg 780
gcggcaatcg acgtattccc gacggaaccg gcgaccaata gcgatccatt tacctctccg 840
ctgtgtgaat tcgacaacgt ccttctgacg ccacacattg gcggttcgac tcaggaagcg 900
caggagaata tcggcctgga agttgcgggt aaattgatca agtattctga caatggctca 960
acgctctctg cggtgaactt cccggaagtc tcgctgccac tgcacggtgg gcgtcgtctg 1020
atgcacatcc acgaaaaccg tccgggcgtg ctaactgcgc tgaacaaaat cttcgccgag 1080
cagggcgtca acatcgccgc gcaatatctg caaacttccg cccagatggg ttatgtggtt 1140
attgatattg aagccgacga agacgttgcc gaaaaagcgc tgcaggcaat gaaagctatt 1200
ccgggtacca ttcgcgcccg tctgctgtac taa 1233
<210> 228
<211> 410
<212> PRT
<213> 大肠杆菌
<400> 228
Met Ala Lys Val Ser Leu Glu Lys Asp Lys Ile Lys Phe Leu Leu Val
1 5 10 15
Glu Gly Val His Gln Lys Ala Leu Glu Ser Leu Arg Ala Ala Gly Tyr
20 25 30
Thr Asn Ile Glu Phe His Lys Gly Ala Leu Asp Asp Glu Gln Leu Lys
35 40 45
Glu Ser Ile Arg Asp Ala His Phe Ile Gly Leu Arg Ser Arg Thr His
50 55 60
Leu Thr Glu Asp Val Ile Asn Ala Ala Glu Lys Leu Val Ala Ile Gly
65 70 75 80
Cys Phe Cys Ile Gly Thr Asn Gln Val Asp Leu Asp Ala Ala Ala Lys
85 90 95
Arg Gly Ile Pro Val Phe Asn Ala Pro Phe Ser Asn Thr Arg Ser Val
100 105 110
Ala Glu Leu Val Ile Gly Glu Leu Leu Leu Leu Leu Arg Gly Val Pro
115 120 125
Glu Ala Asn Ala Lys Ala His Arg Gly Val Trp Asn Lys Leu Ala Ala
130 135 140
Gly Ser Phe Glu Ala Arg Gly Lys Lys Leu Gly Ile Ile Gly Tyr Gly
145 150 155 160
His Ile Gly Thr Gln Leu Gly Ile Leu Ala Glu Ser Leu Gly Met Tyr
165 170 175
Val Tyr Phe Tyr Asp Ile Glu Asn Lys Leu Pro Leu Gly Asn Ala Thr
180 185 190
Gln Val Gln His Leu Ser Asp Leu Leu Asn Met Ser Asp Val Val Ser
195 200 205
Leu His Val Pro Glu Asn Pro Ser Thr Lys Asn Met Met Gly Ala Lys
210 215 220
Glu Ile Ser Leu Met Lys Pro Gly Ser Leu Leu Ile Asn Ala Ser Arg
225 230 235 240
Gly Thr Val Val Asp Ile Pro Ala Leu Cys Asp Ala Leu Ala Ser Lys
245 250 255
His Leu Ala Gly Ala Ala Ile Asp Val Phe Pro Thr Glu Pro Ala Thr
260 265 270
Asn Ser Asp Pro Phe Thr Ser Pro Leu Cys Glu Phe Asp Asn Val Leu
275 280 285
Leu Thr Pro His Ile Gly Gly Ser Thr Gln Glu Ala Gln Glu Asn Ile
290 295 300
Gly Leu Glu Val Ala Gly Lys Leu Ile Lys Tyr Ser Asp Asn Gly Ser
305 310 315 320
Thr Leu Ser Ala Val Asn Phe Pro Glu Val Ser Leu Pro Leu His Gly
325 330 335
Gly Arg Arg Leu Met His Ile His Glu Asn Arg Pro Gly Val Leu Thr
340 345 350
Ala Leu Asn Lys Ile Phe Ala Glu Gln Gly Val Asn Ile Ala Ala Gln
355 360 365
Tyr Leu Gln Thr Ser Ala Gln Met Gly Tyr Val Val Ile Asp Ile Glu
370 375 380
Ala Asp Glu Asp Val Ala Glu Lys Ala Leu Gln Ala Met Lys Ala Ile
385 390 395 400
Pro Gly Thr Ile Arg Ala Arg Leu Leu Tyr
405 410
<210> 229
<211> 1089
<212> DNA
<213> 大肠杆菌
<400> 229
atggctcaaa tcttcaattt tagttctggt ccggcaatgc taccggcaga ggtgcttaaa 60
caggctcaac aggaactgcg cgactggaac ggtcttggta cgtcggtgat ggaagtgagt 120
caccgtggca aagagttcat tcaggttgca gaggaagccg agaaggattt tcgcgatctt 180
cttaatgtcc cctccaacta caaggtatta ttctgccatg gcggtggtcg cggtcagttt 240
gctgcggtac cgctgaatat tctcggtgat aaaaccaccg cagattatgt tgatgccggt 300
tactgggcgg caagtgccat taaagaagcg aaaaaatact gcacgcctaa tgtctttgac 360
gccaaagtga ctgttgatgg tctgcgcgcg gttaagccaa tgcgtgaatg gcaactctct 420
gataatgctg cttatatgca ttattgcccg aatgaaacca tcgatggtat cgccatcgac 480
gaaacgccag acttcggcgc agatgtggtg gtcgccgctg acttctcttc aaccattctt 540
tcccgtccga ttgacgtcag ccgttatggt gtaatttacg ctggcgcgca gaaaaatatc 600
ggcccggctg gcctgacaat cgtcatcgtt cgtgaagatt tgctgggcaa agcgaatatc 660
gcgtgtccgt cgattctgga ttattccatc ctcaacgata acggctccat gtttaacacg 720
ccgccgacat ttgcctggta tctatctggt ctggtcttta aatggctgaa agcgaacggc 780
ggtgtagctg aaatggataa aatcaatcag caaaaagcag aactgctata tggggtgatt 840
gataacagcg atttctaccg caatgacgtg gcgaaagcta accgttcgcg gatgaacgtg 900
ccgttccagt tggcggacag tgcgcttgac aaattgttcc ttgaagagtc ttttgctgct 960
ggccttcatg cactgaaagg tcaccgtgtg gtcggcggaa tgcgcgcttc tatttataac 1020
gccatgccgc tggaaggcgt taaagcgctg acagacttca tggttgagtt cgaacgccgt 1080
cacggttaa 1089
<210> 230
<211> 362
<212> PRT
<213> 大肠杆菌
<400> 230
Met Ala Gln Ile Phe Asn Phe Ser Ser Gly Pro Ala Met Leu Pro Ala
1 5 10 15
Glu Val Leu Lys Gln Ala Gln Gln Glu Leu Arg Asp Trp Asn Gly Leu
20 25 30
Gly Thr Ser Val Met Glu Val Ser His Arg Gly Lys Glu Phe Ile Gln
35 40 45
Val Ala Glu Glu Ala Glu Lys Asp Phe Arg Asp Leu Leu Asn Val Pro
50 55 60
Ser Asn Tyr Lys Val Leu Phe Cys His Gly Gly Gly Arg Gly Gln Phe
65 70 75 80
Ala Ala Val Pro Leu Asn Ile Leu Gly Asp Lys Thr Thr Ala Asp Tyr
85 90 95
Val Asp Ala Gly Tyr Trp Ala Ala Ser Ala Ile Lys Glu Ala Lys Lys
100 105 110
Tyr Cys Thr Pro Asn Val Phe Asp Ala Lys Val Thr Val Asp Gly Leu
115 120 125
Arg Ala Val Lys Pro Met Arg Glu Trp Gln Leu Ser Asp Asn Ala Ala
130 135 140
Tyr Met His Tyr Cys Pro Asn Glu Thr Ile Asp Gly Ile Ala Ile Asp
145 150 155 160
Glu Thr Pro Asp Phe Gly Ala Asp Val Val Val Ala Ala Asp Phe Ser
165 170 175
Ser Thr Ile Leu Ser Arg Pro Ile Asp Val Ser Arg Tyr Gly Val Ile
180 185 190
Tyr Ala Gly Ala Gln Lys Asn Ile Gly Pro Ala Gly Leu Thr Ile Val
195 200 205
Ile Val Arg Glu Asp Leu Leu Gly Lys Ala Asn Ile Ala Cys Pro Ser
210 215 220
Ile Leu Asp Tyr Ser Ile Leu Asn Asp Asn Gly Ser Met Phe Asn Thr
225 230 235 240
Pro Pro Thr Phe Ala Trp Tyr Leu Ser Gly Leu Val Phe Lys Trp Leu
245 250 255
Lys Ala Asn Gly Gly Val Ala Glu Met Asp Lys Ile Asn Gln Gln Lys
260 265 270
Ala Glu Leu Leu Tyr Gly Val Ile Asp Asn Ser Asp Phe Tyr Arg Asn
275 280 285
Asp Val Ala Lys Ala Asn Arg Ser Arg Met Asn Val Pro Phe Gln Leu
290 295 300
Ala Asp Ser Ala Leu Asp Lys Leu Phe Leu Glu Glu Ser Phe Ala Ala
305 310 315 320
Gly Leu His Ala Leu Lys Gly His Arg Val Val Gly Gly Met Arg Ala
325 330 335
Ser Ile Tyr Asn Ala Met Pro Leu Glu Gly Val Lys Ala Leu Thr Asp
340 345 350
Phe Met Val Glu Phe Glu Arg Arg His Gly
355 360
<210> 231
<211> 579
<212> DNA
<213> 大肠杆菌
<400> 231
gtggaatacc gtagcctgac gcttgatgat tttttatcgc gctttcaact tttgcgcccg 60
caaattaacc gggaaaccct aaatcatcgt caggctgctg tgttaatccc catcgtccgt 120
cgaccgcaac cggggttgtt gctgactcag cgttcgattc atctgcgtaa acacgctgga 180
caagtggcat tccctggagg tgcagtcgat gacacggacg catcagctat cgccgccgcg 240
ctgcgcgaag ctgaagaaga ggtcgctata ccgccttccg ccgttgaagt tatcggcgtg 300
ctgccgcccg tcgatagcgt cactggctac caggtaaccc cagtggtcgg cattatcccg 360
cccgatctgc cgtatcgcgc cagtgaagat gaagtctcgg cggtgtttga aatgccgctc 420
gcccaggcat tacatctggg tcgttatcac cctttagata tctaccgccg tggtgattca 480
catcgggtat ggctgtcctg gtacgaacag tattttgtat ggggaatgac cgcaggcata 540
attcgtgagc tggcgctgca aattggtgtg aaaccctga 579
<210> 232
<211> 192
<212> PRT
<213> 大肠杆菌
<400> 232
Met Glu Tyr Arg Ser Leu Thr Leu Asp Asp Phe Leu Ser Arg Phe Gln
1 5 10 15
Leu Leu Arg Pro Gln Ile Asn Arg Glu Thr Leu Asn His Arg Gln Ala
20 25 30
Ala Val Leu Ile Pro Ile Val Arg Arg Pro Gln Pro Gly Leu Leu Leu
35 40 45
Thr Gln Arg Ser Ile His Leu Arg Lys His Ala Gly Gln Val Ala Phe
50 55 60
Pro Gly Gly Ala Val Asp Asp Thr Asp Ala Ser Ala Ile Ala Ala Ala
65 70 75 80
Leu Arg Glu Ala Glu Glu Glu Val Ala Ile Pro Pro Ser Ala Val Glu
85 90 95
Val Ile Gly Val Leu Pro Pro Val Asp Ser Val Thr Gly Tyr Gln Val
100 105 110
Thr Pro Val Val Gly Ile Ile Pro Pro Asp Leu Pro Tyr Arg Ala Ser
115 120 125
Glu Asp Glu Val Ser Ala Val Phe Glu Met Pro Leu Ala Gln Ala Leu
130 135 140
His Leu Gly Arg Tyr His Pro Leu Asp Ile Tyr Arg Arg Gly Asp Ser
145 150 155 160
His Arg Val Trp Leu Ser Trp Tyr Glu Gln Tyr Phe Val Trp Gly Met
165 170 175
Thr Ala Gly Ile Ile Arg Glu Leu Ala Leu Gln Ile Gly Val Lys Pro
180 185 190
<210> 233
<211> 969
<212> DNA
<213> 大肠杆菌
<400> 233
atgcctaaca ttacctggtg cgacctgcct gaagatgtct ctttatggcc gggtctgcct 60
ctttcattaa gtggtgatga agtgatgcca ctggattacc acgcaggtcg tagcggctgg 120
ctgctgtatg gtcgtgggct ggataaacaa cgtctgaccc aataccagag caaactgggt 180
gcggcgatgg tgattgttgc cgcctggtgc gtggaagatt atcaggtgat tcgtctggca 240
ggttcactca ccgcacgggc tacacgcctg gcccacgaag cgcagctgga tgtcgccccg 300
ctggggaaaa tcccgcacct gcgcacgccg ggtttgctgg tgatggatat ggactccacc 360
gccatccaga ttgaatgtat tgatgaaatt gccaaactgg ccggaacggg cgagatggtg 420
gcggaagtaa ccgaacgggc gatgcgcggc gaactcgatt ttaccgccag cctgcgcagc 480
cgtgtggcga cgctgaaagg cgctgacgcc aatattctgc aacaggtgcg tgaaaatctg 540
ccgctgatgc caggcttaac gcaactggtg ctcaagctgg aaacgctggg ctggaaagtg 600
gcgattgcct ccggcggctt tactttcttt gctgaatacc tgcgcgacaa gctgcgcctg 660
accgccgtgg tagccaatga actggagatc atggacggta aatttaccgg caatgtgatc 720
ggcgacatcg tagacgcgca gtacaaagcg aaaactctga ctcgcctcgc gcaggagtat 780
gaaatcccgc tggcgcagac cgtggcgatt ggcgatggag ccaatgacct gccgatgatc 840
aaagcggcag ggctggggat tgcctaccat gccaagccaa aagtgaatga aaaggcggaa 900
gtcaccatcc gtcacgctga cctgatgggg gtattctgca tcctctcagg cagcctgaat 960
cagaagtaa 969
<210> 234
<211> 322
<212> PRT
<213> 大肠杆菌
<400> 234
Met Pro Asn Ile Thr Trp Cys Asp Leu Pro Glu Asp Val Ser Leu Trp
1 5 10 15
Pro Gly Leu Pro Leu Ser Leu Ser Gly Asp Glu Val Met Pro Leu Asp
20 25 30
Tyr His Ala Gly Arg Ser Gly Trp Leu Leu Tyr Gly Arg Gly Leu Asp
35 40 45
Lys Gln Arg Leu Thr Gln Tyr Gln Ser Lys Leu Gly Ala Ala Met Val
50 55 60
Ile Val Ala Ala Trp Cys Val Glu Asp Tyr Gln Val Ile Arg Leu Ala
65 70 75 80
Gly Ser Leu Thr Ala Arg Ala Thr Arg Leu Ala His Glu Ala Gln Leu
85 90 95
Asp Val Ala Pro Leu Gly Lys Ile Pro His Leu Arg Thr Pro Gly Leu
100 105 110
Leu Val Met Asp Met Asp Ser Thr Ala Ile Gln Ile Glu Cys Ile Asp
115 120 125
Glu Ile Ala Lys Leu Ala Gly Thr Gly Glu Met Val Ala Glu Val Thr
130 135 140
Glu Arg Ala Met Arg Gly Glu Leu Asp Phe Thr Ala Ser Leu Arg Ser
145 150 155 160
Arg Val Ala Thr Leu Lys Gly Ala Asp Ala Asn Ile Leu Gln Gln Val
165 170 175
Arg Glu Asn Leu Pro Leu Met Pro Gly Leu Thr Gln Leu Val Leu Lys
180 185 190
Leu Glu Thr Leu Gly Trp Lys Val Ala Ile Ala Ser Gly Gly Phe Thr
195 200 205
Phe Phe Ala Glu Tyr Leu Arg Asp Lys Leu Arg Leu Thr Ala Val Val
210 215 220
Ala Asn Glu Leu Glu Ile Met Asp Gly Lys Phe Thr Gly Asn Val Ile
225 230 235 240
Gly Asp Ile Val Asp Ala Gln Tyr Lys Ala Lys Thr Leu Thr Arg Leu
245 250 255
Ala Gln Glu Tyr Glu Ile Pro Leu Ala Gln Thr Val Ala Ile Gly Asp
260 265 270
Gly Ala Asn Asp Leu Pro Met Ile Lys Ala Ala Gly Leu Gly Ile Ala
275 280 285
Tyr His Ala Lys Pro Lys Val Asn Glu Lys Ala Glu Val Thr Ile Arg
290 295 300
His Ala Asp Leu Met Gly Val Phe Cys Ile Leu Ser Gly Ser Leu Asn
305 310 315 320
Gln Lys
<210> 235
<211> 2233
<212> DNA
<213> 拟南芥
<400> 235
cgaaagggca aaaaccaaaa agagaatcaa attttgcctc ttctatataa atcaaatcaa 60
cgacgaagcg tcgctctcgt tttctgtgtg tctctctctt tgtcccacca ttttcaccgc 120
ttctcctcca atcactcaga tctacagatt cctttaaaac aacaatggtt ggatctttgg 180
aatctgatca aactctttca atggccacct taatcgaaaa actcgacatc ttatctgacg 240
acttcgatcc aaccgccgta gtcaccgaac cgttacctcc tccggtaact aatggaatcg 300
gagctgataa aggaggagga ggaggagaaa gagagatggt tctcggtagg aatatacaca 360
caacgtcact cgctgtaacg gaaccggagg ttaacgatga attcaccgga gataaagaag 420
cttatatggc tagtgttctt gctcgttacc ggaaaacttt ggttgaacga accaaaaacc 480
atttaggtaa aatttgatct gatctgatct ttttttttga atcggaatcg gaatctgaat 540
cggaatctgg tgtaggttat ccttataact tggatttcga ctatggtgcg cttggtcagt 600
tacaacattt ttcgattaat aatcttggag atccgtttat tgaaagtaac tatggtgtac 660
actcaagacc ttttgaagtt ggtgtgttgg attggtttgc tcgtctttgg gagattgaga 720
gagatgatta ttggggttac attaccaatt gtggtactga aggcaacctt catggcattt 780
tagtcgggta cgtttttcga aaatcatcgg tgttttgatt cattcgaaaa accgaaaaaa 840
aacggtgttt gatttgatgt gtgtttgtag gagggagatg tttccggatg ggatattgta 900
tgcgtcgcgt gaatcgcatt actcggtgtt taaagctgct cgaatgtatc gaatggagtg 960
tgagaaggtt gatacgctta tgtcagggga gattgattgt gatgatttga ggaagaagtt 1020
gttggctaat aaagataaac cggcgattct taatgttaac ataggttggt ttatgtttta 1080
gtactttggc tttgtttgtt gtgttaggat tggtgctaat ggttgaaatc ttgttttctt 1140
taggaacgac ggttaaagga gctgttgatg atcttgacct tgttatcaaa actcttgaag 1200
agtgtggttt ctcacatgat aggttctata ttcattgtga tggagctttg tttggactta 1260
tgatgccttt tgtcaaacgt gtaagtgtat agtcttcagt ctaagcgaaa tcgttatgat 1320
aatctttgtt ctgctctgag atttgttgtt ttatctcctc tgtaggcacc gaaagtgacg 1380
tttaataaac cgatagggag tgtgagtgta tcgggccaca aatttgtcgg gtgtccaatg 1440
ccatgtggtg ttcagataac aagaatggaa catatcaaag tcctctccag taacgttgag 1500
taccttgctt caagggatgc aacaatcatg ggaagtcgta acgggcatgc tcctttgttc 1560
ctctggtaca ccttaaacag gaaaggttac aaaggattcc agaaagaagt tcagaaatgc 1620
ttgagaaacg cgcattacct caaagaccga cttcgtgaag ctgggattag cgccatgctt 1680
aatgagctta gcagcactgt ggtctttgaa cggcctaaag atgaagagtt tgttagaagg 1740
tggcagcttg cttgccaagg tgatatagct catgtggtgg ttatgccaag tgttacaatc 1800
gagaagcttg ataatttcct gaaagacctt gtcaaacaca gattgatctg gtacgaggat 1860
ggatctcagc ctccttgcct tgcatcggag gtaggaacca acaactgcat ctgtccagct 1920
cacaagtgac ggcaccattt ctcatttgtt ggtattgttg ttttctagta agccacatct 1980
agtttaaatt cctcatcact gtattcctga acttggtttc aatcatcgta aaattttgtc 2040
agtttctctt atttacaagt taaggtttca aacagtgttt acaatttgta gctcaatctg 2100
gagcatgatc aaccttcact tcgtcgttcg caatcgttta ccgagtttta gcattatcgt 2160
aacagcaagt atgtgcctta agccgctgat ttagctgcgt gtttgatgat cggtgcttaa 2220
tgcctaggaa aag 2233
<210> 236
<211> 482
<212> PRT
<213> 拟南芥
<400> 236
Met Val Gly Ser Leu Glu Ser Asp Gln Thr Leu Ser Met Ala Thr Leu
1 5 10 15
Ile Glu Lys Leu Asp Ile Leu Ser Asp Asp Phe Asp Pro Thr Ala Val
20 25 30
Val Thr Glu Pro Leu Pro Pro Pro Val Thr Asn Gly Ile Gly Ala Asp
35 40 45
Lys Gly Gly Gly Gly Gly Glu Arg Glu Met Val Leu Gly Arg Asn Ile
50 55 60
His Thr Thr Ser Leu Ala Val Thr Glu Pro Glu Val Asn Asp Glu Phe
65 70 75 80
Thr Gly Asp Lys Glu Ala Tyr Met Ala Ser Val Leu Ala Arg Tyr Arg
85 90 95
Lys Thr Leu Val Glu Arg Thr Lys Asn His Leu Gly Tyr Pro Tyr Asn
100 105 110
Leu Asp Phe Asp Tyr Gly Ala Leu Gly Gln Leu Gln His Phe Ser Ile
115 120 125
Asn Asn Leu Gly Asp Pro Phe Ile Glu Ser Asn Tyr Gly Val His Ser
130 135 140
Arg Pro Phe Glu Val Gly Val Leu Asp Trp Phe Ala Arg Leu Trp Glu
145 150 155 160
Ile Glu Arg Asp Asp Tyr Trp Gly Tyr Ile Thr Asn Cys Gly Thr Glu
165 170 175
Gly Asn Leu His Gly Ile Leu Val Gly Arg Glu Met Phe Pro Asp Gly
180 185 190
Ile Leu Tyr Ala Ser Arg Glu Ser His Tyr Ser Val Phe Lys Ala Ala
195 200 205
Arg Met Tyr Arg Met Glu Cys Glu Lys Val Asp Thr Leu Met Ser Gly
210 215 220
Glu Ile Asp Cys Asp Asp Leu Arg Lys Lys Leu Leu Ala Asn Lys Asp
225 230 235 240
Lys Pro Ala Ile Leu Asn Val Asn Ile Gly Thr Thr Val Lys Gly Ala
245 250 255
Val Asp Asp Leu Asp Leu Val Ile Lys Thr Leu Glu Glu Cys Gly Phe
260 265 270
Ser His Asp Arg Phe Tyr Ile His Cys Asp Gly Ala Leu Phe Gly Leu
275 280 285
Met Met Pro Phe Val Lys Arg Ala Pro Lys Val Thr Phe Asn Lys Pro
290 295 300
Ile Gly Ser Val Ser Val Ser Gly His Lys Phe Val Gly Cys Pro Met
305 310 315 320
Pro Cys Gly Val Gln Ile Thr Arg Met Glu His Ile Lys Val Leu Ser
325 330 335
Ser Asn Val Glu Tyr Leu Ala Ser Arg Asp Ala Thr Ile Met Gly Ser
340 345 350
Arg Asn Gly His Ala Pro Leu Phe Leu Trp Tyr Thr Leu Asn Arg Lys
355 360 365
Gly Tyr Lys Gly Phe Gln Lys Glu Val Gln Lys Cys Leu Arg Asn Ala
370 375 380
His Tyr Leu Lys Asp Arg Leu Arg Glu Ala Gly Ile Ser Ala Met Leu
385 390 395 400
Asn Glu Leu Ser Ser Thr Val Val Phe Glu Arg Pro Lys Asp Glu Glu
405 410 415
Phe Val Arg Arg Trp Gln Leu Ala Cys Gln Gly Asp Ile Ala His Val
420 425 430
Val Val Met Pro Ser Val Thr Ile Glu Lys Leu Asp Asn Phe Leu Lys
435 440 445
Asp Leu Val Lys His Arg Leu Ile Trp Tyr Glu Asp Gly Ser Gln Pro
450 455 460
Pro Cys Leu Ala Ser Glu Val Gly Thr Asn Asn Cys Ile Cys Pro Ala
465 470 475 480
His Lys
<210> 237
<211> 2274
<212> DNA
<213> 大肠杆菌
<400> 237
atgggaagcc cctctctgta ttctgcccgt aaaacaaccc tggcgttggc agtcgcctta 60
agtttcgcct ggcaagcgcc ggtatttgcc cacggtggtg aagcgcatat ggtgccaatg 120
gataaaacgc ttaaagaatt tggtgccgat gtgcagtggg acgactacgc ccagctcttt 180
accctgatta aagatggcgc gtacgtgaaa gtgaagcctg gtgcgcaaac agcaattgtt 240
aatggtcagc ctctggcact gcaagtaccg gtagtgatga aagacaataa agcctgggtt 300
tctgacacct ttattaacga tgttttccag tccgggctgg atcaaacctt tcaggtagaa 360
aagcgccctc acccacttaa tgcgctaact gcggacgaaa ttaaacaggc cgttgaaatt 420
gttaaagctt ccgcggactt caaacccaat acccgtttta ctgagatctc cctgctaccg 480
ccagataaag aagctgtctg ggcgtttgcg ctggaaaaca aaccggttga ccagccgcgc 540
aaagccgacg tcattatgct cgacggcaaa catatcatcg aagcggtggt ggatctgcaa 600
aacaacaaac tgctctcctg gcaacccatt aaagacgccc acggtatggt gttgctggat 660
gatttcgcca gtgtgcagaa cattattaac aacagtgaag aatttgccgc tgccgtgaag 720
aaacgcggta ttactgatgc gaaaaaagtg attaccacgc cgctgaccgt aggttatttc 780
gatggtaaag atggcctgaa acaagatgcc cggttgctca aagtcatcag ctatcttgat 840
gtcggtgatg gcaactactg ggcacatccc atcgaaaacc tggtggcggt cgttgattta 900
gaacagaaaa aaatcgttaa gattgaagaa ggtccggtag ttccggtgcc aatgaccgca 960
cgcccatttg atggccgtga ccgcgttgct ccggcagtta agcctatgca aatcattgag 1020
cctgaaggta aaaattacac cattactggc gatatgattc actggcggaa ctgggatttt 1080
cacctcagca tgaactctcg cgtcgggccg atgatctcca ccgtgactta taacgacaat 1140
ggcaccaaac gcaaagtcat gtacgaaggt tctctcggcg gcatgattgt gccttacggt 1200
gatcctgata ttggctggta ctttaaagcg tatctggact ctggtgacta cggtatgggc 1260
acgctaacct caccaattgc tcgtggtaaa gatgccccgt ctaacgcagt gctccttaat 1320
gaaaccatcg ccgactacac tggcgtgccg atggagatcc ctcgcgctat cgcggtattt 1380
gaacgttatg ccgggccgga gtataagcat caggaaatgg gccagcccaa cgtcagtacc 1440
gaacgccggg agttagtggt gcgctggatc agtacagtgg gtaactatga ctacattttt 1500
gactggatct tccatgaaaa cggcactatt ggcatcgatg ccggtgctac gggcatcgaa 1560
gcggtgaaag gtgttaaagc gaaaaccatg cacgatgaga cggcgaaaga tgacacgcgc 1620
tacggcacgc ttatcgatca caatatcgtg ggtactacac accaacatat ttataatttc 1680
cgcctcgatc tggatgtaga tggcgagaat aacagcctgg tggcgatgga cccagtggta 1740
aaaccgaata ctgccggtgg cccacgcacc agtaccatgc aagttaatca gtacaacatc 1800
ggcaatgaac aggatgccgc acagaaattt gatccgggca cgattcgtct gttgagtaac 1860
ccgaacaaag agaaccgcat gggcaatccg gtttcctatc aaattattcc ttatgcaggt 1920
ggtactcacc cggtagcaaa aggtgcccag ttcgcgccgg acgagtggat ctatcatcgt 1980
ttaagcttta tggacaagca gctctgggta acgcgttatc atcctggcga gcgtttcccg 2040
gaaggcaaat atccgaaccg ttctactcat gacaccggtc ttggacaata cagtaaggat 2100
aacgagtcgc tggacaacac cgacgccgtt gtctggatga ccaccggcac cacacatgtg 2160
gcccgcgccg aagagtggcc gattatgccg accgaatggg tacatactct gctgaaacca 2220
tggaacttct ttgacgaaac gccaacgcta ggggcgctga agaaagataa gtga 2274
<210> 238
<211> 757
<212> PRT
<213> 大肠杆菌
<400> 238
Met Gly Ser Pro Ser Leu Tyr Ser Ala Arg Lys Thr Thr Leu Ala Leu
1 5 10 15
Ala Val Ala Leu Ser Phe Ala Trp Gln Ala Pro Val Phe Ala His Gly
20 25 30
Gly Glu Ala His Met Val Pro Met Asp Lys Thr Leu Lys Glu Phe Gly
35 40 45
Ala Asp Val Gln Trp Asp Asp Tyr Ala Gln Leu Phe Thr Leu Ile Lys
50 55 60
Asp Gly Ala Tyr Val Lys Val Lys Pro Gly Ala Gln Thr Ala Ile Val
65 70 75 80
Asn Gly Gln Pro Leu Ala Leu Gln Val Pro Val Val Met Lys Asp Asn
85 90 95
Lys Ala Trp Val Ser Asp Thr Phe Ile Asn Asp Val Phe Gln Ser Gly
100 105 110
Leu Asp Gln Thr Phe Gln Val Glu Lys Arg Pro His Pro Leu Asn Ala
115 120 125
Leu Thr Ala Asp Glu Ile Lys Gln Ala Val Glu Ile Val Lys Ala Ser
130 135 140
Ala Asp Phe Lys Pro Asn Thr Arg Phe Thr Glu Ile Ser Leu Leu Pro
145 150 155 160
Pro Asp Lys Glu Ala Val Trp Ala Phe Ala Leu Glu Asn Lys Pro Val
165 170 175
Asp Gln Pro Arg Lys Ala Asp Val Ile Met Leu Asp Gly Lys His Ile
180 185 190
Ile Glu Ala Val Val Asp Leu Gln Asn Asn Lys Leu Leu Ser Trp Gln
195 200 205
Pro Ile Lys Asp Ala His Gly Met Val Leu Leu Asp Asp Phe Ala Ser
210 215 220
Val Gln Asn Ile Ile Asn Asn Ser Glu Glu Phe Ala Ala Ala Val Lys
225 230 235 240
Lys Arg Gly Ile Thr Asp Ala Lys Lys Val Ile Thr Thr Pro Leu Thr
245 250 255
Val Gly Tyr Phe Asp Gly Lys Asp Gly Leu Lys Gln Asp Ala Arg Leu
260 265 270
Leu Lys Val Ile Ser Tyr Leu Asp Val Gly Asp Gly Asn Tyr Trp Ala
275 280 285
His Pro Ile Glu Asn Leu Val Ala Val Val Asp Leu Glu Gln Lys Lys
290 295 300
Ile Val Lys Ile Glu Glu Gly Pro Val Val Pro Val Pro Met Thr Ala
305 310 315 320
Arg Pro Phe Asp Gly Arg Asp Arg Val Ala Pro Ala Val Lys Pro Met
325 330 335
Gln Ile Ile Glu Pro Glu Gly Lys Asn Tyr Thr Ile Thr Gly Asp Met
340 345 350
Ile His Trp Arg Asn Trp Asp Phe His Leu Ser Met Asn Ser Arg Val
355 360 365
Gly Pro Met Ile Ser Thr Val Thr Tyr Asn Asp Asn Gly Thr Lys Arg
370 375 380
Lys Val Met Tyr Glu Gly Ser Leu Gly Gly Met Ile Val Pro Tyr Gly
385 390 395 400
Asp Pro Asp Ile Gly Trp Tyr Phe Lys Ala Tyr Leu Asp Ser Gly Asp
405 410 415
Tyr Gly Met Gly Thr Leu Thr Ser Pro Ile Ala Arg Gly Lys Asp Ala
420 425 430
Pro Ser Asn Ala Val Leu Leu Asn Glu Thr Ile Ala Asp Tyr Thr Gly
435 440 445
Val Pro Met Glu Ile Pro Arg Ala Ile Ala Val Phe Glu Arg Tyr Ala
450 455 460
Gly Pro Glu Tyr Lys His Gln Glu Met Gly Gln Pro Asn Val Ser Thr
465 470 475 480
Glu Arg Arg Glu Leu Val Val Arg Trp Ile Ser Thr Val Gly Asn Tyr
485 490 495
Asp Tyr Ile Phe Asp Trp Ile Phe His Glu Asn Gly Thr Ile Gly Ile
500 505 510
Asp Ala Gly Ala Thr Gly Ile Glu Ala Val Lys Gly Val Lys Ala Lys
515 520 525
Thr Met His Asp Glu Thr Ala Lys Asp Asp Thr Arg Tyr Gly Thr Leu
530 535 540
Ile Asp His Asn Ile Val Gly Thr Thr His Gln His Ile Tyr Asn Phe
545 550 555 560
Arg Leu Asp Leu Asp Val Asp Gly Glu Asn Asn Ser Leu Val Ala Met
565 570 575
Asp Pro Val Val Lys Pro Asn Thr Ala Gly Gly Pro Arg Thr Ser Thr
580 585 590
Met Gln Val Asn Gln Tyr Asn Ile Gly Asn Glu Gln Asp Ala Ala Gln
595 600 605
Lys Phe Asp Pro Gly Thr Ile Arg Leu Leu Ser Asn Pro Asn Lys Glu
610 615 620
Asn Arg Met Gly Asn Pro Val Ser Tyr Gln Ile Ile Pro Tyr Ala Gly
625 630 635 640
Gly Thr His Pro Val Ala Lys Gly Ala Gln Phe Ala Pro Asp Glu Trp
645 650 655
Ile Tyr His Arg Leu Ser Phe Met Asp Lys Gln Leu Trp Val Thr Arg
660 665 670
Tyr His Pro Gly Glu Arg Phe Pro Glu Gly Lys Tyr Pro Asn Arg Ser
675 680 685
Thr His Asp Thr Gly Leu Gly Gln Tyr Ser Lys Asp Asn Glu Ser Leu
690 695 700
Asp Asn Thr Asp Ala Val Val Trp Met Thr Thr Gly Thr Thr His Val
705 710 715 720
Ala Arg Ala Glu Glu Trp Pro Ile Met Pro Thr Glu Trp Val His Thr
725 730 735
Leu Leu Lys Pro Trp Asn Phe Phe Asp Glu Thr Pro Thr Leu Gly Ala
740 745 750
Leu Lys Lys Asp Lys
755
<210> 239
<211> 1218
<212> DNA
<213> 大肠杆菌
<400> 239
atgtccccca ttgaaaaatc cagcaaatta gagaatgtct gttatgacat ccgtggtccg 60
gtgctgaaag aagcaaaacg cctggaagaa gaaggtaaca aggtactgaa actgaacatc 120
ggcaacccag ccccgttcgg ttttgacgcg ccagatgaaa tcctcgttga cgtgatacgc 180
aacctgccta ccgctcaagg gtattgcgat tccaaaggtc tttactccgc gcgtaaagcc 240
atcatgcagc actaccaggc tcgtggcatg cgtgatgtta ccgtggaaga tatttacatc 300
ggcaatggtg tatcggagct tatcgttcag gcaatgcagg cattgctgaa cagcggggac 360
gaaatgttgg ttcctgcacc agattaccca ctctggaccg cggcggtttc gctttccagc 420
ggtaaagcgg tgcattatct ttgcgatgaa tcctctgact ggttcccgga cctcgatgat 480
attcgcgcta aaattacgcc tcgtacgcgt gggatcgtta ttatcaaccc aaataaccca 540
accggcgcgg tatattccaa agagctttta atggagattg tggagattgc acgtcagcat 600
aatctcatta tcttcgccga tgaaatttat gacaaaattc tctacgacga cgctgagcat 660
cactcaattg cgccgctggc acctgacctg ctgaccatta cctttaacgg actgtcgaaa 720
acgtaccgcg ttgcaggctt ccgtcagggg tggatggtgt tgaacgggcc gaaaaaacac 780
gccaaaggct acatcgaagg tctggaaatg ctggcttcaa tgcgcctgtg tgctaacgtt 840
cctgcgcaac acgccattca gaccgcgcta ggtggttatc agagcatcag tgaatttatt 900
acccctggcg gtcgtcttta tgagcagcgt aaccgcgcgt gggaactgat caacgatatt 960
ccgggcgttt cctgcgtgaa acctcgtggt gcgctgtata tgttcccgaa aatcgacgcc 1020
aaacgcttta acattcacga cgatcagaaa atggtgttgg atttcctgtt gcaggaaaaa 1080
gttctgttgg tgcaagggac ggcattcaac tggccgtggc cggatcactt ccgcattgtc 1140
acgctaccgc gtgtcgatga tatcgagctg tctttgagca agttcgcgcg tttcctttct 1200
ggttatcatc agctgtaa 1218
<210> 240
<211> 405
<212> PRT
<213> 大肠杆菌
<400> 240
Met Ser Pro Ile Glu Lys Ser Ser Lys Leu Glu Asn Val Cys Tyr Asp
1 5 10 15
Ile Arg Gly Pro Val Leu Lys Glu Ala Lys Arg Leu Glu Glu Glu Gly
20 25 30
Asn Lys Val Leu Lys Leu Asn Ile Gly Asn Pro Ala Pro Phe Gly Phe
35 40 45
Asp Ala Pro Asp Glu Ile Leu Val Asp Val Ile Arg Asn Leu Pro Thr
50 55 60
Ala Gln Gly Tyr Cys Asp Ser Lys Gly Leu Tyr Ser Ala Arg Lys Ala
65 70 75 80
Ile Met Gln His Tyr Gln Ala Arg Gly Met Arg Asp Val Thr Val Glu
85 90 95
Asp Ile Tyr Ile Gly Asn Gly Val Ser Glu Leu Ile Val Gln Ala Met
100 105 110
Gln Ala Leu Leu Asn Ser Gly Asp Glu Met Leu Val Pro Ala Pro Asp
115 120 125
Tyr Pro Leu Trp Thr Ala Ala Val Ser Leu Ser Ser Gly Lys Ala Val
130 135 140
His Tyr Leu Cys Asp Glu Ser Ser Asp Trp Phe Pro Asp Leu Asp Asp
145 150 155 160
Ile Arg Ala Lys Ile Thr Pro Arg Thr Arg Gly Ile Val Ile Ile Asn
165 170 175
Pro Asn Asn Pro Thr Gly Ala Val Tyr Ser Lys Glu Leu Leu Met Glu
180 185 190
Ile Val Glu Ile Ala Arg Gln His Asn Leu Ile Ile Phe Ala Asp Glu
195 200 205
Ile Tyr Asp Lys Ile Leu Tyr Asp Asp Ala Glu His His Ser Ile Ala
210 215 220
Pro Leu Ala Pro Asp Leu Leu Thr Ile Thr Phe Asn Gly Leu Ser Lys
225 230 235 240
Thr Tyr Arg Val Ala Gly Phe Arg Gln Gly Trp Met Val Leu Asn Gly
245 250 255
Pro Lys Lys His Ala Lys Gly Tyr Ile Glu Gly Leu Glu Met Leu Ala
260 265 270
Ser Met Arg Leu Cys Ala Asn Val Pro Ala Gln His Ala Ile Gln Thr
275 280 285
Ala Leu Gly Gly Tyr Gln Ser Ile Ser Glu Phe Ile Thr Pro Gly Gly
290 295 300
Arg Leu Tyr Glu Gln Arg Asn Arg Ala Trp Glu Leu Ile Asn Asp Ile
305 310 315 320
Pro Gly Val Ser Cys Val Lys Pro Arg Gly Ala Leu Tyr Met Phe Pro
325 330 335
Lys Ile Asp Ala Lys Arg Phe Asn Ile His Asp Asp Gln Lys Met Val
340 345 350
Leu Asp Phe Leu Leu Gln Glu Lys Val Leu Leu Val Gln Gly Thr Ala
355 360 365
Phe Asn Trp Pro Trp Pro Asp His Phe Arg Ile Val Thr Leu Pro Arg
370 375 380
Val Asp Asp Ile Glu Leu Ser Leu Ser Lys Phe Ala Arg Phe Leu Ser
385 390 395 400
Gly Tyr His Gln Leu
405
<210> 241
<211> 975
<212> DNA
<213> 大肠杆菌
<400> 241
atgaagccgt ccgttatcct ctacaaagcc ttacctgatg atttactgca acgcctgcaa 60
gagcatttca ccgttcacca ggtggcaaac ctcagcccac aaaccgtcga acaaaatgca 120
gcaatttttg ccgaagctga aggtttactg ggttcaaacg agaatgtaaa tgccgcattg 180
ctggaaaaaa tgccgaaact gcgtgccaca tcaacgatct ccgtcggcta tgacaatttt 240
gatgtcgatg cgcttaccgc ccgaaaaatt ctgctgatgc acacgccaac cgtattaaca 300
gaaaccgtcg ccgatacgct gatggcgctg gtgttgtcta ccgctcgtcg ggttgtggag 360
gtagcagaac gggtaaaagc aggcgaatgg accgcgagca taggcccgga ctggtacggc 420
actgacgttc accataaaac actgggcatt gtcgggatgg gacggatcgg catggcgctg 480
gcacaacgtg cgcactttgg cttcaacatg cccatcctct ataacgcgcg ccgccaccat 540
aaagaagcag aagaacgctt caacgcccgc tactgcgatt tggatactct gttacaagag 600
tcagatttcg tttgcctgat cctgccgtta actgatgaga cgcatcatct gtttggcgca 660
gaacaattcg ccaaaatgaa atcctccgcc attttcatta atgccggacg tggcccggtg 720
gttgacgaaa atgcactgat cgcagcattg cagaaaggcg aaattcacgc tgccgggctg 780
gatgtcttcg aacaagagcc actgtccgta gattcgccgt tgctctcaat ggccaacgtc 840
gtcgcagtac cgcatattgg atctgccacc catgagacgc gttatggcat ggccgcctgt 900
gccgtggata atttgattga tgcgttacaa ggaaaggttg agaagaactg tgtgaatccg 960
cacgtcgcgg actaa 975
<210> 242
<211> 324
<212> PRT
<213> 大肠杆菌
<400> 242
Met Lys Pro Ser Val Ile Leu Tyr Lys Ala Leu Pro Asp Asp Leu Leu
1 5 10 15
Gln Arg Leu Gln Glu His Phe Thr Val His Gln Val Ala Asn Leu Ser
20 25 30
Pro Gln Thr Val Glu Gln Asn Ala Ala Ile Phe Ala Glu Ala Glu Gly
35 40 45
Leu Leu Gly Ser Asn Glu Asn Val Asn Ala Ala Leu Leu Glu Lys Met
50 55 60
Pro Lys Leu Arg Ala Thr Ser Thr Ile Ser Val Gly Tyr Asp Asn Phe
65 70 75 80
Asp Val Asp Ala Leu Thr Ala Arg Lys Ile Leu Leu Met His Thr Pro
85 90 95
Thr Val Leu Thr Glu Thr Val Ala Asp Thr Leu Met Ala Leu Val Leu
100 105 110
Ser Thr Ala Arg Arg Val Val Glu Val Ala Glu Arg Val Lys Ala Gly
115 120 125
Glu Trp Thr Ala Ser Ile Gly Pro Asp Trp Tyr Gly Thr Asp Val His
130 135 140
His Lys Thr Leu Gly Ile Val Gly Met Gly Arg Ile Gly Met Ala Leu
145 150 155 160
Ala Gln Arg Ala His Phe Gly Phe Asn Met Pro Ile Leu Tyr Asn Ala
165 170 175
Arg Arg His His Lys Glu Ala Glu Glu Arg Phe Asn Ala Arg Tyr Cys
180 185 190
Asp Leu Asp Thr Leu Leu Gln Glu Ser Asp Phe Val Cys Leu Ile Leu
195 200 205
Pro Leu Thr Asp Glu Thr His His Leu Phe Gly Ala Glu Gln Phe Ala
210 215 220
Lys Met Lys Ser Ser Ala Ile Phe Ile Asn Ala Gly Arg Gly Pro Val
225 230 235 240
Val Asp Glu Asn Ala Leu Ile Ala Ala Leu Gln Lys Gly Glu Ile His
245 250 255
Ala Ala Gly Leu Asp Val Phe Glu Gln Glu Pro Leu Ser Val Asp Ser
260 265 270
Pro Leu Leu Ser Met Ala Asn Val Val Ala Val Pro His Ile Gly Ser
275 280 285
Ala Thr His Glu Thr Arg Tyr Gly Met Ala Ala Cys Ala Val Asp Asn
290 295 300
Leu Ile Asp Ala Leu Gln Gly Lys Val Glu Lys Asn Cys Val Asn Pro
305 310 315 320
His Val Ala Asp
<210> 243
<211> 1179
<212> DNA
<213> 人
<400> 243
atggcctctc acaagctgct ggtgaccccc cccaaggccc tgctcaagcc cctctccatc 60
cccaaccagc tcctgctggg gcctggtcct tccaacctgc ctcctcgcat catggcagcc 120
ggggggctgc agatgatcgg gtccatgagc aaggatatgt accagatcat ggacgagatc 180
aaggaaggca tccagtacgt gttccagacc aggaacccac tcacactggt catctctggc 240
tcgggacact gtgccctgga ggccgccctg gtcaatgtgc tggagcctgg ggactccttc 300
ctggttgggg ccaatggcat ttgggggcag cgagccgtgg acatcgggga gcgcatagga 360
gcccgagtgc acccgatgac caaggaccct ggaggccact acacactgca ggaggtggag 420
gagggcctgg cccagcacaa gccagtgctg ctgttcttaa cccacgggga gtcgtccacc 480
ggcgtgctgc agccccttga tggcttcggg gaactctgcc acaggtacaa gtgcctgctc 540
ctggtggatt cggtggcatc cctgggcggg accccccttt acatggaccg gcaaggcatc 600
gacatcctgt actcgggctc ccagaaggcc ctgaacgccc ctccagggac ctcgctcatc 660
tccttcagtg acaaggccaa aaagaagatg tactcccgca agacgaagcc cttctccttc 720
tacctggaca tcaagtggct ggccaacttc tggggctgtg acgaccagcc caggatgtac 780
catcacacaa tccccgtcat cagcctgtac agcctgagag agagcctggc cctcattgcg 840
gaacagggcc tggagaacag ctggcgccag caccgcgagg ccgcggcgta tctgcatggg 900
cgcctgcagg cactggggct gcagctcttc gtgaaggacc cggcgctccg gcttcccaca 960
gtcaccactg tggctgtacc cgctggctat gactggagag acatcgtcag ctacgtcata 1020
gaccacttcg acattgagat catgggtggc cttgggccct ccacggggaa ggtgctgcgg 1080
atcggcctgc tgggctgcaa tgccacccgc gagaatgtgg accgcgtgac ggaggccctg 1140
agggcggccc tgcagcactg ccccaagaag aagctgtga 1179
<210> 244
<211> 392
<212> PRT
<213> 人
<400> 244
Met Ala Ser His Lys Leu Leu Val Thr Pro Pro Lys Ala Leu Leu Lys
1 5 10 15
Pro Leu Ser Ile Pro Asn Gln Leu Leu Leu Gly Pro Gly Pro Ser Asn
20 25 30
Leu Pro Pro Arg Ile Met Ala Ala Gly Gly Leu Gln Met Ile Gly Ser
35 40 45
Met Ser Lys Asp Met Tyr Gln Ile Met Asp Glu Ile Lys Glu Gly Ile
50 55 60
Gln Tyr Val Phe Gln Thr Arg Asn Pro Leu Thr Leu Val Ile Ser Gly
65 70 75 80
Ser Gly His Cys Ala Leu Glu Ala Ala Leu Val Asn Val Leu Glu Pro
85 90 95
Gly Asp Ser Phe Leu Val Gly Ala Asn Gly Ile Trp Gly Gln Arg Ala
100 105 110
Val Asp Ile Gly Glu Arg Ile Gly Ala Arg Val His Pro Met Thr Lys
115 120 125
Asp Pro Gly Gly His Tyr Thr Leu Gln Glu Val Glu Glu Gly Leu Ala
130 135 140
Gln His Lys Pro Val Leu Leu Phe Leu Thr His Gly Glu Ser Ser Thr
145 150 155 160
Gly Val Leu Gln Pro Leu Asp Gly Phe Gly Glu Leu Cys His Arg Tyr
165 170 175
Lys Cys Leu Leu Leu Val Asp Ser Val Ala Ser Leu Gly Gly Thr Pro
180 185 190
Leu Tyr Met Asp Arg Gln Gly Ile Asp Ile Leu Tyr Ser Gly Ser Gln
195 200 205
Lys Ala Leu Asn Ala Pro Pro Gly Thr Ser Leu Ile Ser Phe Ser Asp
210 215 220
Lys Ala Lys Lys Lys Met Tyr Ser Arg Lys Thr Lys Pro Phe Ser Phe
225 230 235 240
Tyr Leu Asp Ile Lys Trp Leu Ala Asn Phe Trp Gly Cys Asp Asp Gln
245 250 255
Pro Arg Met Tyr His His Thr Ile Pro Val Ile Ser Leu Tyr Ser Leu
260 265 270
Arg Glu Ser Leu Ala Leu Ile Ala Glu Gln Gly Leu Glu Asn Ser Trp
275 280 285
Arg Gln His Arg Glu Ala Ala Ala Tyr Leu His Gly Arg Leu Gln Ala
290 295 300
Leu Gly Leu Gln Leu Phe Val Lys Asp Pro Ala Leu Arg Leu Pro Thr
305 310 315 320
Val Thr Thr Val Ala Val Pro Ala Gly Tyr Asp Trp Arg Asp Ile Val
325 330 335
Ser Tyr Val Ile Asp His Phe Asp Ile Glu Ile Met Gly Gly Leu Gly
340 345 350
Pro Ser Thr Gly Lys Val Leu Arg Ile Gly Leu Leu Gly Cys Asn Ala
355 360 365
Thr Arg Glu Asn Val Asp Arg Val Thr Glu Ala Leu Arg Ala Ala Leu
370 375 380
Gln His Cys Pro Lys Lys Lys Leu
385 390
<210> 245
<211> 10
<212> DNA
<213> 大肠杆菌
<400> 245
aaaaaaaaaa 10
<210> 246
<211> 6
<212> PRT
<213> 大肠杆菌
<400> 246
Leu Ala Asn Phe Trp Gly
1 5
<210> 247
<211> 10
<212> DNA
<213> 拟南芥
<400> 247
aaaaaaaaaa 10
<210> 248
<211> 5
<212> PRT
<213> 拟南芥
<400> 248
Phe Val Lys Asp Pro
1 5
<210> 249
<211> 1146
<212> DNA
<213> 大肠杆菌
<400> 249
atgaagattg tcattgcgcc agactctttt aaagagagct taagtgcaga aaaatgttgt 60
caggcaatta aagccgggtt ttcgaccctc tttcccgatg cgaactatat ctgtttgccg 120
atagcggatg gcggcgaagg gacggtggat gcgatggtcg ccgcgacggg cggcaacatc 180
gtgacgcttg aagtctgcgg gccgatgggc gaaaaagtga atgcttttta tggccttacc 240
ggcgacggga aaacggcggt gattgagatg gcggcagcaa gtggcctgat gctggtcgcg 300
cctgaaaagc gtaatccgtt gctggcctcc agttttggta cgggggagtt aattcgtcat 360
gcgctggata acgacattcg ccatattatt ctcggcattg gcggcagtgc gacggtcgac 420
ggcggtatgg gcatggcgca ggcgctcggt gtgcgtttcc ttgatgccga cggtcaggcg 480
ctggcggcaa acggtggtaa tttagcgcgc gtggcaagca ttgagatgga tgaatgcgat 540
ccgcgtctgg cgaattgcca tattgaagta gcatgtgacg ttgataaccc gctggtaggg 600
gcacgcggcg cggcggcggt gtttggcccg caaaaagggg caacgccgga gatggtcgaa 660
gaacttgaac aggggctgca aaattacgcc cgtgttttac aacagcaaac tgaaattaat 720
gtctgccaga tggcgggcgg cggcgctgcg ggcggtatgg gtattgcggc ggcggtattt 780
ctcaatgcgg atattaaacc gggcattgaa attgtgttga atgcggtcaa tcttgcgcag 840
gcagtgcagg gcgcagcact ggtgattacc ggggaagggc gcatcgactc gcaaacggca 900
ggcggtaaag cgccgctggg tgtggcgtcg gtggcgaagc agtttaatgt accggtgatt 960
gggattgctg gcgtattggg tgatggcgtg gaagtggtgc accagtacgg cattgacgcg 1020
gtattcagca ttttgcctcg tctggcacct ttagccgaag tgctcgccag cggtgaaacc 1080
aatctcttca acagcgcgcg aaatattgcc tgcgccatta aaataggtca gggaattaaa 1140
aactaa 1146
<210> 250
<211> 381
<212> PRT
<213> 大肠杆菌
<400> 250
Met Lys Ile Val Ile Ala Pro Asp Ser Phe Lys Glu Ser Leu Ser Ala
1 5 10 15
Glu Lys Cys Cys Gln Ala Ile Lys Ala Gly Phe Ser Thr Leu Phe Pro
20 25 30
Asp Ala Asn Tyr Ile Cys Leu Pro Ile Ala Asp Gly Gly Glu Gly Thr
35 40 45
Val Asp Ala Met Val Ala Ala Thr Gly Gly Asn Ile Val Thr Leu Glu
50 55 60
Val Cys Gly Pro Met Gly Glu Lys Val Asn Ala Phe Tyr Gly Leu Thr
65 70 75 80
Gly Asp Gly Lys Thr Ala Val Ile Glu Met Ala Ala Ala Ser Gly Leu
85 90 95
Met Leu Val Ala Pro Glu Lys Arg Asn Pro Leu Leu Ala Ser Ser Phe
100 105 110
Gly Thr Gly Glu Leu Ile Arg His Ala Leu Asp Asn Asp Ile Arg His
115 120 125
Ile Ile Leu Gly Ile Gly Gly Ser Ala Thr Val Asp Gly Gly Met Gly
130 135 140
Met Ala Gln Ala Leu Gly Val Arg Phe Leu Asp Ala Asp Gly Gln Ala
145 150 155 160
Leu Ala Ala Asn Gly Gly Asn Leu Ala Arg Val Ala Ser Ile Glu Met
165 170 175
Asp Glu Cys Asp Pro Arg Leu Ala Asn Cys His Ile Glu Val Ala Cys
180 185 190
Asp Val Asp Asn Pro Leu Val Gly Ala Arg Gly Ala Ala Ala Val Phe
195 200 205
Gly Pro Gln Lys Gly Ala Thr Pro Glu Met Val Glu Glu Leu Glu Gln
210 215 220
Gly Leu Gln Asn Tyr Ala Arg Val Leu Gln Gln Gln Thr Glu Ile Asn
225 230 235 240
Val Cys Gln Met Ala Gly Gly Gly Ala Ala Gly Gly Met Gly Ile Ala
245 250 255
Ala Ala Val Phe Leu Asn Ala Asp Ile Lys Pro Gly Ile Glu Ile Val
260 265 270
Leu Asn Ala Val Asn Leu Ala Gln Ala Val Gln Gly Ala Ala Leu Val
275 280 285
Ile Thr Gly Glu Gly Arg Ile Asp Ser Gln Thr Ala Gly Gly Lys Ala
290 295 300
Pro Leu Gly Val Ala Ser Val Ala Lys Gln Phe Asn Val Pro Val Ile
305 310 315 320
Gly Ile Ala Gly Val Leu Gly Asp Gly Val Glu Val Val His Gln Tyr
325 330 335
Gly Ile Asp Ala Val Phe Ser Ile Leu Pro Arg Leu Ala Pro Leu Ala
340 345 350
Glu Val Leu Ala Ser Gly Glu Thr Asn Leu Phe Asn Ser Ala Arg Asn
355 360 365
Ile Ala Cys Ala Ile Lys Ile Gly Gln Gly Ile Lys Asn
370 375 380
<210> 251
<211> 1146
<212> DNA
<213> 大肠杆菌
<400> 251
atgaaaatcg taatcgcccc agactcttat aaagaaagtt tatctgccag cgaggttgcg 60
caggcgatag aaaaaggatt tcgggaaatt tttcctgatg cacagtacgt ttctgttccg 120
gttgccgacg gtggcgaagg aacggtggaa gcgatgattg cagccaccca gggggctgaa 180
cgtcacgcct gggttacagg gccgctgggc gagaaagtga atgccagttg ggggatctcc 240
ggcgatggca aaaccgcgtt tattgaaatg gcggcggcca gtgggctgga gctggtacct 300
gcggaaaaac gcgatccact cgtgaccact tcacgcggca caggcgagtt aatcctgcag 360
gcgctggaga gcggtgcgac aaacattatt atcggcattg gcggcagcgc tacaaatgat 420
ggcggcgcag gcatggtaca ggcgctgggg gcgaaattat gcgacgccaa cggcaatgaa 480
attggttttg gcggcggtag tcttaatact ctgaatgata ttgatatttc cggcctcgat 540
ccgcgcttaa aagattgcgt cattcgcgtc gcttgtgatg tcaccaatcc gctggtgggc 600
gataacggcg catcgcgcat ctttggccca caaaagggag ccagtgaagc gatgattgtt 660
gagctggaca ataacctctc tcactatgcc gaggtcatta aaaaagcgct gcatgttgat 720
gtgaaagatg tccccggtgc aggagctgcg ggtggtatgg gcgcggcgct aatggcgttt 780
cttggtgcgg aactgaaaag tggtattgaa atcgtcacta cggcgctgaa tctggaggaa 840
catattcacg attgtacgct ggtgatcacc ggtgaagggc gtattgacag ccagagtatt 900
cacgggaagg taccgattgg tgtcgcaaac gtggcgaaga agtaccataa accggtgatt 960
ggcattgcgg gtagcctgac cgatgatgtt ggcgttgtac atcagcatgg cattgatgcg 1020
gtcttcagcg tattgaccag cataggtacg ttggacgaag cattccgcgg ggcttatgac 1080
aatatctgcc gtgcttcacg taatatcgcc gcgacactgg cgattggaat gcgcaacgcg 1140
gggtga 1146
<210> 252
<211> 381
<212> PRT
<213> 大肠杆菌
<400> 252
Met Lys Ile Val Ile Ala Pro Asp Ser Tyr Lys Glu Ser Leu Ser Ala
1 5 10 15
Ser Glu Val Ala Gln Ala Ile Glu Lys Gly Phe Arg Glu Ile Phe Pro
20 25 30
Asp Ala Gln Tyr Val Ser Val Pro Val Ala Asp Gly Gly Glu Gly Thr
35 40 45
Val Glu Ala Met Ile Ala Ala Thr Gln Gly Ala Glu Arg His Ala Trp
50 55 60
Val Thr Gly Pro Leu Gly Glu Lys Val Asn Ala Ser Trp Gly Ile Ser
65 70 75 80
Gly Asp Gly Lys Thr Ala Phe Ile Glu Met Ala Ala Ala Ser Gly Leu
85 90 95
Glu Leu Val Pro Ala Glu Lys Arg Asp Pro Leu Val Thr Thr Ser Arg
100 105 110
Gly Thr Gly Glu Leu Ile Leu Gln Ala Leu Glu Ser Gly Ala Thr Asn
115 120 125
Ile Ile Ile Gly Ile Gly Gly Ser Ala Thr Asn Asp Gly Gly Ala Gly
130 135 140
Met Val Gln Ala Leu Gly Ala Lys Leu Cys Asp Ala Asn Gly Asn Glu
145 150 155 160
Ile Gly Phe Gly Gly Gly Ser Leu Asn Thr Leu Asn Asp Ile Asp Ile
165 170 175
Ser Gly Leu Asp Pro Arg Leu Lys Asp Cys Val Ile Arg Val Ala Cys
180 185 190
Asp Val Thr Asn Pro Leu Val Gly Asp Asn Gly Ala Ser Arg Ile Phe
195 200 205
Gly Pro Gln Lys Gly Ala Ser Glu Ala Met Ile Val Glu Leu Asp Asn
210 215 220
Asn Leu Ser His Tyr Ala Glu Val Ile Lys Lys Ala Leu His Val Asp
225 230 235 240
Val Lys Asp Val Pro Gly Ala Gly Ala Ala Gly Gly Met Gly Ala Ala
245 250 255
Leu Met Ala Phe Leu Gly Ala Glu Leu Lys Ser Gly Ile Glu Ile Val
260 265 270
Thr Thr Ala Leu Asn Leu Glu Glu His Ile His Asp Cys Thr Leu Val
275 280 285
Ile Thr Gly Glu Gly Arg Ile Asp Ser Gln Ser Ile His Gly Lys Val
290 295 300
Pro Ile Gly Val Ala Asn Val Ala Lys Lys Tyr His Lys Pro Val Ile
305 310 315 320
Gly Ile Ala Gly Ser Leu Thr Asp Asp Val Gly Val Val His Gln His
325 330 335
Gly Ile Asp Ala Val Phe Ser Val Leu Thr Ser Ile Gly Thr Leu Asp
340 345 350
Glu Ala Phe Arg Gly Ala Tyr Asp Asn Ile Cys Arg Ala Ser Arg Asn
355 360 365
Ile Ala Ala Thr Leu Ala Ile Gly Met Arg Asn Ala Gly
370 375 380
<210> 253
<211> 450
<212> DNA
<213> 大肠杆菌
<400> 253
atgaaaaaga ttgcatttgg ctgtgatcat gtcggtttca ttttaaaaca tgaaatagtg 60
gcacatttag ttgagcgtgg cgttgaagtg attgataaag gaacctggtc gtcagagcgt 120
actgattatc cacattacgc cagtcaagtc gcactggctg ttgctggcgg agaggttgat 180
ggcgggattt tgatttgtgg tactggcgtc ggtatttcga tagcggcgaa caagtttgcc 240
ggaattcgcg cggtcgtctg tagcgaacct tattccgcgc aactttcgcg gcagcataac 300
gacaccaacg tgctggcttt tggttcacga gtggttggcc tcgaactggc aaaaatgatt 360
gtggatgcgt ggctgggcgc acagtacgaa ggcggtcgtc atcaacaacg cgtggaggcg 420
attacggcaa tagagcagcg gagaaattga 450
<210> 254
<211> 149
<212> PRT
<213> 大肠杆菌
<400> 254
Met Lys Lys Ile Ala Phe Gly Cys Asp His Val Gly Phe Ile Leu Lys
1 5 10 15
His Glu Ile Val Ala His Leu Val Glu Arg Gly Val Glu Val Ile Asp
20 25 30
Lys Gly Thr Trp Ser Ser Glu Arg Thr Asp Tyr Pro His Tyr Ala Ser
35 40 45
Gln Val Ala Leu Ala Val Ala Gly Gly Glu Val Asp Gly Gly Ile Leu
50 55 60
Ile Cys Gly Thr Gly Val Gly Ile Ser Ile Ala Ala Asn Lys Phe Ala
65 70 75 80
Gly Ile Arg Ala Val Val Cys Ser Glu Pro Tyr Ser Ala Gln Leu Ser
85 90 95
Arg Gln His Asn Asp Thr Asn Val Leu Ala Phe Gly Ser Arg Val Val
100 105 110
Gly Leu Glu Leu Ala Lys Met Ile Val Asp Ala Trp Leu Gly Ala Gln
115 120 125
Tyr Glu Gly Gly Arg His Gln Gln Arg Val Glu Ala Ile Thr Ala Ile
130 135 140
Glu Gln Arg Arg Asn
145
<210> 255
<211> 780
<212> DNA
<213> 大肠杆菌
<400> 255
atgactgatc tgaaagcaag cagcctgcgt gcactgaaat tgatggacct gaccaccctg 60
aatgacgacg acaccgacga gaaagtgatc gccctgtgtc atcaggccaa aactccggtc 120
ggcaataccg ccgctatctg tatctatcct cgctttatcc cgattgctcg caaaactctg 180
aaagagcagg gcaccccgga aatccgtatc gctacggtaa ccaacttccc acacggtaac 240
gacgacatcg acatcgcgct ggcagaaacc cgtgcggcaa tcgcctacgg tgctgatgaa 300
gttgacgttg tgttcccgta ccgcgcgctg atggcgggta acgagcaggt tggttttgac 360
ctggtgaaag cctgtaaaga ggcttgcgcg gcagcgaatg tactgctgaa agtgatcatc 420
gaaaccggcg aactgaaaga cgaagcgctg atccgtaaag cgtctgaaat ctccatcaaa 480
gcgggtgcgg acttcatcaa aacctctacc ggtaaagtgg ctgtgaacgc gacgccggaa 540
agcgcgcgca tcatgatgga agtgatccgt gatatgggcg tagaaaaaac cgttggtttc 600
aaaccggcgg gcggcgtgcg tactgcggaa gatgcgcaga aatatctcgc cattgcagat 660
gaactgttcg gtgctgactg ggcagatgcg cgtcactacc gctttggcgc ttccagcctg 720
ctggcaagcc tgctgaaagc gctgggtcac ggcgacggta agagcgccag cagctactaa 780
<210> 256
<211> 259
<212> PRT
<213> 大肠杆菌
<400> 256
Met Thr Asp Leu Lys Ala Ser Ser Leu Arg Ala Leu Lys Leu Met Asp
1 5 10 15
Leu Thr Thr Leu Asn Asp Asp Asp Thr Asp Glu Lys Val Ile Ala Leu
20 25 30
Cys His Gln Ala Lys Thr Pro Val Gly Asn Thr Ala Ala Ile Cys Ile
35 40 45
Tyr Pro Arg Phe Ile Pro Ile Ala Arg Lys Thr Leu Lys Glu Gln Gly
50 55 60
Thr Pro Glu Ile Arg Ile Ala Thr Val Thr Asn Phe Pro His Gly Asn
65 70 75 80
Asp Asp Ile Asp Ile Ala Leu Ala Glu Thr Arg Ala Ala Ile Ala Tyr
85 90 95
Gly Ala Asp Glu Val Asp Val Val Phe Pro Tyr Arg Ala Leu Met Ala
100 105 110
Gly Asn Glu Gln Val Gly Phe Asp Leu Val Lys Ala Cys Lys Glu Ala
115 120 125
Cys Ala Ala Ala Asn Val Leu Leu Lys Val Ile Ile Glu Thr Gly Glu
130 135 140
Leu Lys Asp Glu Ala Leu Ile Arg Lys Ala Ser Glu Ile Ser Ile Lys
145 150 155 160
Ala Gly Ala Asp Phe Ile Lys Thr Ser Thr Gly Lys Val Ala Val Asn
165 170 175
Ala Thr Pro Glu Ser Ala Arg Ile Met Met Glu Val Ile Arg Asp Met
180 185 190
Gly Val Glu Lys Thr Val Gly Phe Lys Pro Ala Gly Gly Val Arg Thr
195 200 205
Ala Glu Asp Ala Gln Lys Tyr Leu Ala Ile Ala Asp Glu Leu Phe Gly
210 215 220
Ala Asp Trp Ala Asp Ala Arg His Tyr Arg Phe Gly Ala Ser Ser Leu
225 230 235 240
Leu Ala Ser Leu Leu Lys Ala Leu Gly His Gly Asp Gly Lys Ser Ala
245 250 255
Ser Ser Tyr
<210> 257
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> EcDERA C47N引物1
<400> 257
cggcaatacc gccgctatca atatctatcc tcgctttatc c 41
<210> 258
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> EcDERA C47N引物2
<400> 258
ggataaagcg aggatagata ttgatagcgg cggtattgcc g 41
<210> 259
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> EcDERA K201N引物1
<400> 259
gtagaaaaaa ccgttggttt caacccggcg ggc 33
<210> 260
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> EcDERA K201N引物2
<400> 260
gcccgccggg ttgaaaccaa cggttttttc tac 33
<210> 261
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> BcDERA C37N引物1
<400> 261
cttcgcggcg gtgaacgtta acccgacctg 30
<210> 262
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> BcDERA C37N引物2
<400> 262
caggtcgggt taacgttcac cgccgcgaag 30
<210> 263
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> BcDERA K181N引物1
<400> 263
gcgggtgtga acgcgagcgg cggtg 25
<210> 264
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> BcDERA K181N引物2
<400> 264
caccgccgct cgcgttcaca cccgc 25
<210> 265
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 大肠杆菌rbsK引物1
<400> 265
taagcaccat ggcaatgcaa aacgcag 27
<210> 266
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 大肠杆菌rbsK引物2
<400> 266
tgcttaaagc ttcctctgcc tgtctaaaaa tg 32
<210> 267
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 海栖热袍菌(T. maritima)XuK引物1
<400> 267
aggagatata ccatggtgga agcggtgatt ttcgaca 37
<210> 268
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 海栖热袍菌XuK引物2
<400> 268
gtgcggccgc aagcttaaga acctctttga gaacgttcag 40
<210> 269
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 大肠杆菌AraB引物1
<400> 269
atggcgattg caattggcc 19
<210> 270
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 大肠杆菌AraB引物2
<400> 270
cgaattcgtt atagagtcgc aacggcctgg 30
<210> 271
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 大肠杆菌aldA引物1
<400> 271
catatgtcag tacccgttca acatcctatg 30
<210> 272
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 大肠杆菌aldA引物2
<400> 272
gaattcgtta agactgtaaa taaaccacct gggtctg 37
<210> 273
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 定点诱变的EcDERA C47N正向引物
<400> 273
cggcaatacc gccgctatca atatctatcc tcgctttatc c 41
<210> 274
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 定点诱变的EcDERA C47N反向引物
<400> 274
ggataaagcg aggatagata ttgatagcgg cggtattgcc g 41
<210> 275
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> pZS2_J23101_J23119 FW
<400> 275
cgccccagct ggcaattccg actaagaaac acagctaaca ccacg 45
<210> 276
<211> 56
<212> DNA
<213> 人工序列
<220>
<223> pZS2_J23101_RV
<400> 276
gtggtggtac gcgtaccatg ggatcggtac cgctagcata atacctagga ctgagc 56
<210> 277
<211> 56
<212> DNA
<213> 人工序列
<220>
<223> pZS2_J23119_RV
<400> 277
gtggtggtac gcgtaccatg ggatcggtac cgctagcatt atacctagga ctgagc 56
<210> 278
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> pZA2_MCS_ori_FW
<400> 278
tcgaggtcga cggtatcgat aagcttgata tcgaa 35
<210> 279
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> pZA2_MCS_ori_RV
<400> 279
agctcgcttg gactcctgtt gatagatcc 29
<210> 280
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> pZS2_Kan_启动子_FW
<400> 280
gagtccaagc gagctctcga accccagagt ccc 33
<210> 281
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> pZS2_Kan_J23101_FW
<400> 281
taccgtcgac ctcgacggta ccgctagcat aatacct 37
<210> 282
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> pZS2_Kan_J23119_RV
<400> 282
taccgtcgac ctcgacggta ccgctagcat tatacct 37
<210> 283
<211> 82
<212> DNA
<213> 人工序列
<220>
<223> DERA_组装_J23101_RV
<400> 283
ggtattatgc tagcgtaata gaaataattt tgtttaactt taaggaggtt tggaatggca 60
actgatctga aagcaagcag cc 82
<210> 284
<211> 82
<212> DNA
<213> 人工序列
<220>
<223> DERA_组装_J23119_RV
<400> 284
ggtataatgc tagcgtaata gaaataattt tgtttaactt taaggaggtt tggaatggca 60
actgatctga aagcaagcag cc 82
<210> 285
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> DERA_组装_RV
<400> 285
ccgtcgacct cgacgttagt agctgctggc gctcttaccg 40
<210> 286
<211> 672
<212> DNA
<213> 热容芽孢杆菌(Bacillus caldolyticus)DERA
<400> 286
atgacgatga atatcgcgaa aatgatcgat catacgctgc tcaaaccgga agcgacagaa 60
caacaaatcg tgcaactgtg cacggaagca aagcaatacg gctttgctgc cgtgtgcgtc 120
aacccaacgt gggtgaaaac ggcggcgcgc gagctttccg gcacggatgt ccgcgtctgc 180
acggtcatcg gctttccact tggggcaacg acgccggaaa caaaggcgtt tgaaacaacg 240
aacgccatcg aaaacggcgc tcgcgaagtc gacatggtga tcaacatcgg tgcgttaaaa 300
agcgggcaag acgagcttgt cgagcgcgac attcgtgcgg ttgtcgaagc ggcggctggc 360
agggcgcttg tcaaagtgat cgttgaaacg gcgcttttga ccgatgagga aaaagtgcgc 420
gcctgccagc tcgcagtgaa agccggcgct gattatgtga aaacgtcgac cgggttttcc 480
ggcggaggtg cgacggtgga ggatgtggcg ctgatgcgga aaacggtcgg cgacagagca 540
ggcgtcaaag catcaggcgg cgtccgtgac tggaaaaccg ctgaggcgat gatcaacgcc 600
ggcgcgacgc gcatcggcac aagctctggg gtggcgatcg tcaccggcgg gacgggccgc 660
gctgactact aa 672
<210> 287
<211> 674
<212> DNA
<213> 人工序列
<220>
<223> BcDERA的cDNA优化序列
<400> 287
ccatggcaaa catcgcgaag atgattgacc acaccctgct gaaaccggag gcgaccgaac 60
agcaaatcgt tcagctgtgc accgaggcga aacaatacgg cttcgcggcg gtgtgcgtta 120
acccgacctg ggttaagacc gcggcgcgtg aactgagcgg taccgacgtg cgtgtttgca 180
ccgtgattgg tttcccgctg ggtgcgacca ccccggagac caaagcgttt gaaaccacca 240
acgcgattga gaacggcgcg cgtgaagttg atatggtgat caacattggc gcgctgaaga 300
gcggtcagga cgagctggtt gagcgtgata ttcgtgcggt ggttgaggct gcggcgggtc 360
gtgcgctggt gaaagttatt gtggaaaccg cgctgctgac cgacgaggaa aaagtgcgtg 420
cgtgccaact ggcggttaag gcgggtgcgg attacgtgaa aaccagcacc ggttttagcg 480
gtggcggtgc gaccgttgag gatgtggcgc tgatgcgtaa gaccgttggc gatcgtgcgg 540
gtgtgaaagc gagcggcggt gttcgtgact ggaagaccgc ggaagcgatg atcaacgcgg 600
gtgcgacccg tattggtacc agcagcggtg ttgcgattgt gaccggcggt accggtcgtg 660
cggattataa gctt 674
<210> 288
<211> 1701
<212> DNA
<213> 大肠杆菌AraB
<400> 288
atggcgattg caattggcct cgattttggc agtgattctg tgcgagcttt ggcggtggac 60
tgcgctaccg gtgaagagat cgccaccagc gtagagtggt atccccgttg gcagaaaggg 120
caattttgtg atgccccgaa taaccagttc cgtcatcatc cgcgtgacta cattgagtca 180
atggaagcgg cactgaaaac cgtgcttgca gagcttagcg tcgaacagcg cgcagctgtg 240
gtcgggattg gcgttgacag taccggctcg acgcccgcac cgattgatgc cgacggaaac 300
gtgctggcgc tgcgcccgga gtttgccgaa aacccgaacg cgatgttcgt attgtggaaa 360
gaccacactg cggttgaaga agcggaagag attacccgtt tgtgccacgc gccgggcaac 420
gttgactact cccgctacat tggtggtatt tattccagcg aatggttctg ggcaaaaatc 480
ctgcatgtga ctcgccagga cagcgccgtg gcgcaatctg ccgcatcgtg gattgagctg 540
tgcgactggg tgccagctct gctttccggt accacccgcc cgcaggatat tcgtcgcgga 600
cgttgcagcg ccgggcataa atctctgtgg cacgaaagct ggggcggcct gccgccagcc 660
agtttctttg atgagctgga cccgatcctc aatcgccatt tgccttcccc gctgttcact 720
gacacttgga ctgccgatat tccggtgggc accttatgcc cggaatgggc gcagcgtctc 780
ggcctgcctg aaagcgtggt gatttccggc ggcgcgtttg actgccatat gggcgcagtt 840
ggcgcaggcg cacagcctaa cgcactggta aaagttatcg gtacttccac ctgcgacatt 900
ctgattgccg acaaacagag cgttggcgag cgggcagtta aaggtatttg cggtcaggtt 960
gatggcagcg tggtgcctgg atttatcggt ctggaagcag gccaatcggc gtttggtgat 1020
atctacgcct ggtttggtcg cgtactcggc tggccgctgg aacagcttgc cgcccagcat 1080
ccggaactga aaacgcaaat caacgccagc cagaaacaac tgcttccggc gctgaccgaa 1140
gcatgggcca aaaatccgtc tctggatcac ctgccggtgg tgctcgactg gtttaacggc 1200
cgccgcacac cgaacgctaa ccaacgcctg aaaggggtga ttaccgatct taacctcgct 1260
accgacgctc cgctgctgtt cggcggtttg attgctgcca ccgcctttgg cgcacgcgca 1320
atcatggagt gctttaccga tcaggggatc gccgttaata acgtgatggc actgggcggc 1380
atcgcgcgga aaaaccaggt cattatgcag gcctgctgcg acgtgctgaa tcgcccgctg 1440
caaattgttg cctctgacca gtgctgtgcg ctcggtgcgg cgatttttgc tgccgtcgcc 1500
gcgaaagtgc acgcagacat cccatcagct cagcaaaaaa tggccagtgc ggtagagaaa 1560
accctgcaac cgtgcagcga gcaggcacaa cgctttgaac agctttatcg ccgctatcag 1620
caatgggcga tgagcgccga acaacactat cttccaactt ccgccccggc acaggctgcc 1680
caggccgttg cgactctata a 1701
<210> 289
<211> 1440
<212> DNA
<213> 大肠杆菌aldA
<400> 289
atgtcagtac ccgttcaaca tcctatgtat atcgatggac agtttgttac ctggcgtgga 60
gacgcatgga ttgatgtggt aaaccctgct acagaggctg tcatttcccg catacccgat 120
ggtcaggccg aggatgcccg taaggcaatc gatgcagcag aacgtgcaca accagaatgg 180
gaagcgttgc ctgctattga acgcgccagt tggttgcgca aaatctccgc cgggatccgc 240
gaacgcgcca gtgaaatcag tgcgctgatt gttgaagaag ggggcaagat ccagcagctg 300
gctgaagtcg aagtggcttt tactgccgac tatatcgatt acatggcgga gtgggcacgg 360
cgttacgagg gcgagattat tcaaagcgat cgtccaggag aaaatattct tttgtttaaa 420
cgtgcgcttg gtgtgactac cggcattctg ccgtggaact tcccgttctt cctcattgcc 480
cgcaaaatgg ctcccgctct tttgaccggt aataccatcg tcattaaacc tagtgaattt 540
acgccaaaca atgcgattgc attcgccaaa atcgtcgatg aaataggcct tccgcgcggc 600
gtgtttaacc ttgtactggg gcgtggtgaa accgttgggc aagaactggc gggtaaccca 660
aaggtcgcaa tggtcagtat gacaggcagc gtctctgcag gtgagaagat catggcgact 720
gcggcgaaaa acatcaccaa agtgtgtctg gaattggggg gtaaagcacc agctatcgta 780
atggacgatg ccgatcttga actggcagtc aaagccatcg ttgattcacg cgtcattaat 840
agtgggcaag tgtgtaactg tgcagaacgt gtttatgtac agaaaggcat ttatgatcag 900
ttcgtcaatc ggctgggtga agcgatgcag gcggttcaat ttggtaaccc cgctgaacgc 960
aacgacattg cgatggggcc gttgattaac gccgcggcgc tggaaagggt cgagcaaaaa 1020
gtggcgcgcg cagtagaaga aggggcgaga gtggcgttcg gtggcaaagc ggtagagggg 1080
aaaggatatt attatccgcc gacattgctg ctggatgttc gccaggaaat gtcgattatg 1140
catgaggaaa cctttggccc ggtgctgcca gttgtcgcat ttgacacgct ggaagatgct 1200
atctcaatgg ctaatgacag tgattacggc ctgacctcat caatctatac ccaaaatctg 1260
aacgtcgcga tgaaagccat taaagggctg aagtttggtg aaacttacat caaccgtgaa 1320
aacttcgaag ctatgcaagg cttccacgcc ggatggcgta aatccggtat tggcggcgca 1380
gatggtaaac atggcttgca tgaatatctg cagacccagg tggtttattt acagtcttaa 1440
<210> 290
<211> 1869
<212> DNA
<213> 大肠杆菌rbsK
<400> 290
atgttgcaag gaattttaga aaccgtacca tctgacttga aagatccgat atcattatgg 60
tttaagcaag accgcaaccc aaaaactata gaagaggtca ccgctctctg caaaaaatcc 120
gactggaatg agttacacaa aagatttgat tctagaattc agtttggcac tgctggttta 180
agatcgcaaa tgcaagctgg ctttagcagg atgaatactt tagtagtcat acaagcgtct 240
cagggattgg caacttatgt aagacaacag tttccagaca atttggtagc tgttgtggga 300
cacgatcata gattccattc taaggagttc gctagagcta ctgctgctgc atttctttta 360
aaaggattta aggtacatta tttgaatcct gaccacgaat ttgttcatac ccctttagtt 420
ccctttgcag tggataagct aaaggcctcc gttggcgtaa tgataacagc aagtcacaac 480
ccaaaaatgg ataatggata taaagtatac tattccaatg gatgccaaat cattccacct 540
cacgatcatg ccatctctga ttccattgac gcaaatttag aaccatgggc caatgtgtgg 600
gatttcgacg atgttctaaa taaggctctc aaacaaggga aattgatgta ttccagagaa 660
gaaatgctga agttatattt agaggaggtt tctaaaaatc tggtagaaat caacccatta 720
aagcttgaag taaaagccaa accttggttc gtttacactc caatgcatgg ggttggattt 780
gacattttca gcaccatcgt aaaaaaaaca ctgtgcctgg tagaaggtaa ggattaccta 840
tgtgttcctg aacaacaaaa tccagatcct tctttcccaa ctgttggatt tcctaaccct 900
gaagaaaaag gtgctttaga cattggtata aacttggctg aaaaacatga cattgactta 960
cttgttgcca acgaccctga cgctgataga ttctctgttg ctgttaaaga tatgcagtca 1020
ggcgaatggc gacaactaac aggtaacgaa atcggttttc tttttgcatt ttatgaatat 1080
cagaaatata aaagtatgga caaagaattt cagcacgttc atccgttggc tatgttaaat 1140
tcaacagtgt cttcacaaat gataaaaaaa atggcagaaa tagaagggtt ccattatgag 1200
gatacattaa caggatttaa gtggatcgga aatcgtgcca tactcttgga aaagaaaggc 1260
tattacgttc cttttggatt cgaggaagca ataggctaca tgtttccagc aatggagcat 1320
gataaggatg gtatcagtgc atccattgtc ttcttgcaag cctactgtaa gtggaaaata 1380
gaccacaatt tggacccgct aaatgtctta gaaaatggct tcaaaaaata tggcgtgttc 1440
aaagagtaca atggctatta tgtcgttcca aatccaactg ttacaaaaga tatatttgac 1500
tacatcagga atgtctacac tcctgagggc gcgtcatatc cttcatctat tggtgaagaa 1560
atcgaagtac tttactatcg agatttaacc actggttacc aatcggatac cataaatcat 1620
aaacctactc tacccgtcga tcctacatca caaatgataa cagtatctgc tagaccaagt 1680
aacggtagtg agaatgagca tatccgcttc actattcgcg ggtccggaac agaaccaaaa 1740
cttaaagtat atattgaagc ttgcgcaaat gaagaacaaa gagcctcttt cttggcgaaa 1800
ttgacttgga atgtgctgag acgtgaatgg tttagaccag atgaaatgaa tatagttaca 1860
aaattttga 1869
<210> 291
<211> 1479
<212> DNA
<213> 海栖热袍菌MSB8 XuK
<400> 291
atgaacctgt acgtgggact cgatgtggga acgaccggtg tcaagggaat tcttgtgaac 60
gagaagggag agattcttgc aacagcgaat gaaagactaa ccatgttcac tcctcagcct 120
gcctgggcgg agcaggatcc cctctcctgg tgggaggcgg tgaaaaaaat actgaaaaac 180
ctctccgaaa gatcgaaaga aatgggcggc aaaataagag cgatctctac cagcgggcag 240
atgcacagtc ttgtggcaat cgatgacaac ggtaaagtcc tgagaaacgc tatcctctgg 300
tgcgatcaga gaacatacaa agagtgcgaa gaagccaccc agatcctcgg cggagaggaa 360
aacgttctca agctcgtcgg aaatcccatt ttgcccggtt tcacgctccc aaagatactc 420
tggatccgaa agcatgaacc tgagatctac ggaaaaattt caaaaatcat gctgccaaaa 480
gatttcataa actacatgct caccggtgag gtgaaaacgg agcattccga cgcctccgga 540
acggtgatgt acagtgtgtc aaagatggaa tggaacaagg acgtattgaa agaactcaac 600
ataccggaaa gtgttctccc agagataata ccgtcgaacg gcgtggttgg aaatgtgaaa 660
cctgaagtag cgtcggatct cggtctctcc gaagacacgc ttgtgatagg cggaggagcc 720
gacaacgcct gtgcagctct tggaatagcc gtcgtagaac cgggtgacgt gatggtgagt 780
cttggtactt caggaaccgt tctggcaccc acaaaaggga atcagcccga tccaaagggt 840
agagtacatt tctttgcaca caccgttcca gaaacaagat accacatggg tgtgatgctc 900
tccgctacct attcactgga gtggttcaag gaaaaattcc tgagcgaaga ttacgaaaca 960
atcaacgaag aggtggataa aattcctgca ggatcaaacg ggataatctt cctgccgtat 1020
ctcaacggtg aaaggacacc acacagagat ccattcgcga ggggtgtttt cttcggtata 1080
tcctcgtaca acaccaagtg ggatatggtg agagccatat tcgaaggcgt tgccttcggt 1140
atcaaagatt cgttcgatat actgagagaa ctcaaggtgg ttctcaacag tgtgagaatt 1200
acaggaggag gttcaaagag cagggtatgg aacaaaatgc tcgcagatat gacaggattg 1260
agaatacaaa aaccagccgt ggatgaaggg gcgtcttacg gtgcagcgat cctcgcagtg 1320
tctggctcaa tgggagaaaa tcccgcgaaa atttcgaaag aatggtttcg cgtgaagagt 1380
tacactgacc ctgctgttga aaacacagaa acctacgaaa aactacacga gaaattcaaa 1440
aaactctaca catctctcaa agagatgttc agatcttga 1479
<210> 292
<211> 111
<212> DNA
<213> 人工序列
<220>
<223> J23101_启动子
<400> 292
ctaagaaaca cagctaacac cacgtcgtcc ctatctgctg ccctaggtct atgagtggtt 60
gctggataac tttacagcta gctcagtcct aggtattatg ctagcggtac c 111
<210> 293
<211> 111
<212> DNA
<213> 人工序列
<220>
<223> J23119_启动子
<400> 293
ctaagaaaca cagctaacac cacgtcgtcc ctatctgctg ccctaggtct atgagtggtt 60
gctggataac ttgacagcta gctcagtcct aggtataatg ctagcggtac c 111
<210> 294
<211> 780
<212> DNA
<213> 人工序列
<220>
<223> DERA_C47N_大肠杆菌_MG1655
<400> 294
atgactgatc tgaaagcaag cagcctgcgt gcactgaaat tgatggacct gaccaccctg 60
aatgacgacg acaccgacga gaaagtgatc gccctgtgtc atcaggccaa aactccggtc 120
ggcaataccg ccgctatcaa tatctatcct cgctttatcc cgattgctcg caaaactctg 180
aaagagcagg gcaccccgga aatccgtatc gctacggtaa ccaacttccc acacggtaac 240
gacgacatcg acatcgcgct ggcagaaacc cgtgcggcaa tcgcctacgg tgctgatgaa 300
gttgacgttg tgttcccgta ccgcgcgctg atggcgggta acgagcaggt tggttttgac 360
ctggtgaaag cctgtaaaga ggcttgcgcg gcagcgaatg tactgctgaa agtgatcatc 420
gaaaccggcg aactgaaaga cgaagcgctg atccgtaaag cgtctgaaat ctccatcaaa 480
gcgggtgcgg acttcatcaa aacctctacc ggtaaagtgg ctgtgaacgc gacgccggaa 540
agcgcgcgca tcatgatgga agtgatccgt gatatgggcg tagaaaaaac cgttggtttc 600
aaaccggcgg gcggcgtgcg tactgcggaa gatgcgcaga aatatctcgc cattgcagat 660
gaactgttcg gtgctgactg ggcagatgcg cgtcactacc gctttggcgc ttccagcctg 720
ctggcaagcc tgctgaaagc gctgggtcac ggcgacggta agagcgccag cagctactaa 780
<210> 295
<211> 3075
<212> DNA
<213> 人工序列
<220>
<223> pZA2-J23119-DERA
<400> 295
tcgaggtcga cggtatcgat aagcttgata tcgaattcct gcagcccggg ggatcccatg 60
gtacgcgtac caccaccacc accactgaga tccggctgct aacaaagccc gaaaggaagc 120
tgagttggct gctgccaccg ctgagcaata actagcacgc gtgctagagg catcaaataa 180
aacgaaaggc tcagtcgaaa gactgggcct ttcgttttat ctgttgtttg tcggtgaacg 240
ctctcctgag taggacaaat ccgccgccct agacctaggg atatattccg cttcctcgct 300
cactgactcg ctacgctcgg tcgttcgact gcggcgagcg gaaatggctt acgaacgggg 360
cggagatttc ctggaagatg ccaggaagat acttaacagg gaagtgagag ggccgcggca 420
aagccgtttt tccataggct ccgcccccct gacaagcatc acgaaatctg acgctcaaat 480
cagtggtggc gaaacccgac aggactataa agataccagg cgtttccccc tggcggctcc 540
ctcgtgcgct ctcctgttcc tgcctttcgg tttaccggtg tcattccgct gttatggccg 600
cgtttgtctc attccacgcc tgacactcag ttccgggtag gcagttcgct ccaagctgga 660
ctgtatgcac gaaccccccg ttcagtccga ccgctgcgcc ttatccggta actatcgtct 720
tgagtccaac ccggaaagac atgcaaaagc accactggca gcagccactg gtaattgatt 780
tagaggagtt agtcttgaag tcatgcgccg gttaaggcta aactgaaagg acaagttttg 840
gtgactgcgc tcctccaagc cagttacctc ggttcaaaga gttggtagct cagagaacct 900
tcgaaaaacc gccctgcaag gcggtttttt cgttttcaga gcaagagatt acgcgcagac 960
caaaacgatc tcaagaagat catcttatta atcagataaa atattactag atttcagtgc 1020
aatttatctc ttcaaatgta gcacctgaag tcagccccat acgatataag ttgttactag 1080
tgcttggatt ctcaccaata aaaaacgccc ggcggcaacc gagcgttctg aacaaatcca 1140
gatggagttc tgaggtcatt actggatcta tcaacaggag tccaagcgag ctctcgaacc 1200
ccagagtccc gctcagaaga actcgtcaag aaggcgatag aaggcgatgc gctgcgaatc 1260
gggagcggcg ataccgtaaa gcacgaggaa gcggtcagcc cattcgccgc caagctcttc 1320
agcaatatca cgggtagcca acgctatgtc ctgatagcgg tccgccacac ccagccggcc 1380
acagtcgatg aatccagaaa agcggccatt ttccaccatg atattcggca agcaggcatc 1440
gccatgggtc acgacgagat cctcgccgtc gggcatgcgc gccttgagcc tggcgaacag 1500
ttcggctggc gcgagcccct gatgctcttc gtccagatca tcctgatcga caagaccggc 1560
ttccatccga gtacgtgctc gctcgatgcg atgtttcgct tggtggtcga atgggcaggt 1620
agccggatca agcgtatgca gccgccgcat tgcatcagcc atgatggata ctttctcggc 1680
aggagcaagg tgagatgaca ggagatcctg ccccggcact tcgcccaata gcagccagtc 1740
ccttcccgct tcagtgacaa cgtcgagcac agctgcgcaa ggaacgcccg tcgtggccag 1800
ccacgatagc cgcgctgcct cgtcctgcag ttcattcagg gcaccggaca ggtcggtctt 1860
gacaaaaaga accgggcgcc cctgcgctga cagccggaac acggcggcat cagagcagcc 1920
gattgtctgt tgtgcccagt catagccgaa tagcctctcc acccaagcgg ccggagaacc 1980
tgcgtgcaat ccatcttgtt caatcatgcg aaacgatcct catcctgtct cttgatcaga 2040
tcttgatccc ctgcgccatc agatccttgg cggcaagaaa gccatccagt ttactttgca 2100
gggcttccca accttaccag agggcgcccc agctggcaat tccgactaag aaacacagct 2160
aacaccacgt cgtccctatc tgctgcccta ggtctatgag tggttgctgg ataacttgac 2220
agctagctca gtcctaggta taatgctagc gtaatagaaa taattttgtt taactttaag 2280
gaggtttgga atggcaactg atctgaaagc aagcagcctg cgtgcactga aattgatgga 2340
cctgaccacc ctgaatgacg acgacaccga cgagaaagtg atcgccctgt gtcatcaggc 2400
caaaactccg gtcggcaata ccgccgctat caatatctat cctcgcttta tcccgattgc 2460
tcgcaaaact ctgaaagagc agggcacccc ggaaatccgt atcgctacgg taaccaactt 2520
cccacacggt aacgacgaca tcgacatcgc gctggcagaa acccgtgcgg caatcgccta 2580
cggtgctgat gaagttgacg ttgtgttccc gtaccgcgcg ctgatggcgg gtaacgagca 2640
ggttggtttt gacctggtga aagcctgtaa agaggcttgc gcggcagcga atgtactgct 2700
gaaagtgatc atcgaaaccg gcgaactgaa agacgaagcg ctgatccgta aagcgtctga 2760
aatctccatc aaagcgggtg cggacttcat caaaacctct accggtaaag tggctgtgaa 2820
cgcgacgccg gaaagcgcgc gcatcatgat ggaagtgatc cgtgatatgg gcgtagaaaa 2880
aaccgttggt ttcaaaccgg cgggcggcgt gcgtactgcg gaagatgcgc agaaatatct 2940
cgccattgca gatgaactgt tcggtgctga ctgggcagat gcgcgtcact accgctttgg 3000
cgcttccagc ctgctggcaa gcctgctgaa agcgctgggt cacggcgacg gtaagagcgc 3060
cagcagctac taacg 3075
<210> 296
<211> 3075
<212> DNA
<213> 人工序列
<220>
<223> pZA2-J23101-DERA
<400> 296
tcgaggtcga cggtatcgat aagcttgata tcgaattcct gcagcccggg ggatcccatg 60
gtacgcgtac caccaccacc accactgaga tccggctgct aacaaagccc gaaaggaagc 120
tgagttggct gctgccaccg ctgagcaata actagcacgc gtgctagagg catcaaataa 180
aacgaaaggc tcagtcgaaa gactgggcct ttcgttttat ctgttgtttg tcggtgaacg 240
ctctcctgag taggacaaat ccgccgccct agacctaggg atatattccg cttcctcgct 300
cactgactcg ctacgctcgg tcgttcgact gcggcgagcg gaaatggctt acgaacgggg 360
cggagatttc ctggaagatg ccaggaagat acttaacagg gaagtgagag ggccgcggca 420
aagccgtttt tccataggct ccgcccccct gacaagcatc acgaaatctg acgctcaaat 480
cagtggtggc gaaacccgac aggactataa agataccagg cgtttccccc tggcggctcc 540
ctcgtgcgct ctcctgttcc tgcctttcgg tttaccggtg tcattccgct gttatggccg 600
cgtttgtctc attccacgcc tgacactcag ttccgggtag gcagttcgct ccaagctgga 660
ctgtatgcac gaaccccccg ttcagtccga ccgctgcgcc ttatccggta actatcgtct 720
tgagtccaac ccggaaagac atgcaaaagc accactggca gcagccactg gtaattgatt 780
tagaggagtt agtcttgaag tcatgcgccg gttaaggcta aactgaaagg acaagttttg 840
gtgactgcgc tcctccaagc cagttacctc ggttcaaaga gttggtagct cagagaacct 900
tcgaaaaacc gccctgcaag gcggtttttt cgttttcaga gcaagagatt acgcgcagac 960
caaaacgatc tcaagaagat catcttatta atcagataaa atattactag atttcagtgc 1020
aatttatctc ttcaaatgta gcacctgaag tcagccccat acgatataag ttgttactag 1080
tgcttggatt ctcaccaata aaaaacgccc ggcggcaacc gagcgttctg aacaaatcca 1140
gatggagttc tgaggtcatt actggatcta tcaacaggag tccaagcgag ctctcgaacc 1200
ccagagtccc gctcagaaga actcgtcaag aaggcgatag aaggcgatgc gctgcgaatc 1260
gggagcggcg ataccgtaaa gcacgaggaa gcggtcagcc cattcgccgc caagctcttc 1320
agcaatatca cgggtagcca acgctatgtc ctgatagcgg tccgccacac ccagccggcc 1380
acagtcgatg aatccagaaa agcggccatt ttccaccatg atattcggca agcaggcatc 1440
gccatgggtc acgacgagat cctcgccgtc gggcatgcgc gccttgagcc tggcgaacag 1500
ttcggctggc gcgagcccct gatgctcttc gtccagatca tcctgatcga caagaccggc 1560
ttccatccga gtacgtgctc gctcgatgcg atgtttcgct tggtggtcga atgggcaggt 1620
agccggatca agcgtatgca gccgccgcat tgcatcagcc atgatggata ctttctcggc 1680
aggagcaagg tgagatgaca ggagatcctg ccccggcact tcgcccaata gcagccagtc 1740
ccttcccgct tcagtgacaa cgtcgagcac agctgcgcaa ggaacgcccg tcgtggccag 1800
ccacgatagc cgcgctgcct cgtcctgcag ttcattcagg gcaccggaca ggtcggtctt 1860
gacaaaaaga accgggcgcc cctgcgctga cagccggaac acggcggcat cagagcagcc 1920
gattgtctgt tgtgcccagt catagccgaa tagcctctcc acccaagcgg ccggagaacc 1980
tgcgtgcaat ccatcttgtt caatcatgcg aaacgatcct catcctgtct cttgatcaga 2040
tcttgatccc ctgcgccatc agatccttgg cggcaagaaa gccatccagt ttactttgca 2100
gggcttccca accttaccag agggcgcccc agctggcaat tccgactaag aaacacagct 2160
aacaccacgt cgtccctatc tgctgcccta ggtctatgag tggttgctgg ataactttac 2220
agctagctca gtcctaggta ttatgctagc gtaatagaaa taattttgtt taactttaag 2280
gaggtttgga atggcaactg atctgaaagc aagcagcctg cgtgcactga aattgatgga 2340
cctgaccacc ctgaatgacg acgacaccga cgagaaagtg atcgccctgt gtcatcaggc 2400
caaaactccg gtcggcaata ccgccgctat caatatctat cctcgcttta tcccgattgc 2460
tcgcaaaact ctgaaagagc agggcacccc ggaaatccgt atcgctacgg taaccaactt 2520
cccacacggt aacgacgaca tcgacatcgc gctggcagaa acccgtgcgg caatcgccta 2580
cggtgctgat gaagttgacg ttgtgttccc gtaccgcgcg ctgatggcgg gtaacgagca 2640
ggttggtttt gacctggtga aagcctgtaa agaggcttgc gcggcagcga atgtactgct 2700
gaaagtgatc atcgaaaccg gcgaactgaa agacgaagcg ctgatccgta aagcgtctga 2760
aatctccatc aaagcgggtg cggacttcat caaaacctct accggtaaag tggctgtgaa 2820
cgcgacgccg gaaagcgcgc gcatcatgat ggaagtgatc cgtgatatgg gcgtagaaaa 2880
aaccgttggt ttcaaaccgg cgggcggcgt gcgtactgcg gaagatgcgc agaaatatct 2940
cgccattgca gatgaactgt tcggtgctga ctgggcagat gcgcgtcact accgctttgg 3000
cgcttccagc ctgctggcaa gcctgctgaa agcgctgggt cacggcgacg gtaagagcgc 3060
cagcagctac taacg 3075
<210> 297
<211> 223
<212> PRT
<213> 热容芽孢杆菌(Bacillus caldolyticus)DERA
<400> 297
Met Thr Met Asn Ile Ala Lys Met Ile Asp His Thr Leu Leu Lys Pro
1 5 10 15
Glu Ala Thr Glu Gln Gln Ile Val Gln Leu Cys Thr Glu Ala Lys Gln
20 25 30
Tyr Gly Phe Ala Ala Val Cys Val Asn Pro Thr Trp Val Lys Thr Ala
35 40 45
Ala Arg Glu Leu Ser Gly Thr Asp Val Arg Val Cys Thr Val Ile Gly
50 55 60
Phe Pro Leu Gly Ala Thr Thr Pro Glu Thr Lys Ala Phe Glu Thr Thr
65 70 75 80
Asn Ala Ile Glu Asn Gly Ala Arg Glu Val Asp Met Val Ile Asn Ile
85 90 95
Gly Ala Leu Lys Ser Gly Gln Asp Glu Leu Val Glu Arg Asp Ile Arg
100 105 110
Ala Val Val Glu Ala Ala Ala Gly Arg Ala Leu Val Lys Val Ile Val
115 120 125
Glu Thr Ala Leu Leu Thr Asp Glu Glu Lys Val Arg Ala Cys Gln Leu
130 135 140
Ala Val Lys Ala Gly Ala Asp Tyr Val Lys Thr Ser Thr Gly Phe Ser
145 150 155 160
Gly Gly Gly Ala Thr Val Glu Asp Val Ala Leu Met Arg Lys Thr Val
165 170 175
Gly Asp Arg Ala Gly Val Lys Ala Ser Gly Gly Val Arg Asp Trp Lys
180 185 190
Thr Ala Glu Ala Met Ile Asn Ala Gly Ala Thr Arg Ile Gly Thr Ser
195 200 205
Ser Gly Val Ala Ile Val Thr Gly Gly Thr Gly Arg Ala Asp Tyr
210 215 220
<210> 298
<211> 223
<212> PRT
<213> 热容芽孢杆菌(Bacillus caldolyticus)C37N DERA
<400> 298
Met Thr Met Asn Ile Ala Lys Met Ile Asp His Thr Leu Leu Lys Pro
1 5 10 15
Glu Ala Thr Glu Gln Gln Ile Val Gln Leu Cys Thr Glu Ala Lys Gln
20 25 30
Tyr Gly Phe Ala Ala Val Asn Val Asn Pro Thr Trp Val Lys Thr Ala
35 40 45
Ala Arg Glu Leu Ser Gly Thr Asp Val Arg Val Cys Thr Val Ile Gly
50 55 60
Phe Pro Leu Gly Ala Thr Thr Pro Glu Thr Lys Ala Phe Glu Thr Thr
65 70 75 80
Asn Ala Ile Glu Asn Gly Ala Arg Glu Val Asp Met Val Ile Asn Ile
85 90 95
Gly Ala Leu Lys Ser Gly Gln Asp Glu Leu Val Glu Arg Asp Ile Arg
100 105 110
Ala Val Val Glu Ala Ala Ala Gly Arg Ala Leu Val Lys Val Ile Val
115 120 125
Glu Thr Ala Leu Leu Thr Asp Glu Glu Lys Val Arg Ala Cys Gln Leu
130 135 140
Ala Val Lys Ala Gly Ala Asp Tyr Val Lys Thr Ser Thr Gly Phe Ser
145 150 155 160
Gly Gly Gly Ala Thr Val Glu Asp Val Ala Leu Met Arg Lys Thr Val
165 170 175
Gly Asp Arg Ala Gly Val Lys Ala Ser Gly Gly Val Arg Asp Trp Lys
180 185 190
Thr Ala Glu Ala Met Ile Asn Ala Gly Ala Thr Arg Ile Gly Thr Ser
195 200 205
Ser Gly Val Ala Ile Val Thr Gly Gly Thr Gly Arg Ala Asp Tyr
210 215 220
<210> 299
<211> 259
<212> PRT
<213> 大肠杆菌
<400> 299
Met Thr Asp Leu Lys Ala Ser Ser Leu Arg Ala Leu Lys Leu Met Asp
1 5 10 15
Leu Thr Thr Leu Asn Asp Asp Asp Thr Asp Glu Lys Val Ile Ala Leu
20 25 30
Cys His Gln Ala Lys Thr Pro Val Gly Asn Thr Ala Ala Ile Asn Ile
35 40 45
Tyr Pro Arg Phe Ile Pro Ile Ala Arg Lys Thr Leu Lys Glu Gln Gly
50 55 60
Thr Pro Glu Ile Arg Ile Ala Thr Val Thr Asn Phe Pro His Gly Asn
65 70 75 80
Asp Asp Ile Asp Ile Ala Leu Ala Glu Thr Arg Ala Ala Ile Ala Tyr
85 90 95
Gly Ala Asp Glu Val Asp Val Val Phe Pro Tyr Arg Ala Leu Met Ala
100 105 110
Gly Asn Glu Gln Val Gly Phe Asp Leu Val Lys Ala Cys Lys Glu Ala
115 120 125
Cys Ala Ala Ala Asn Val Leu Leu Lys Val Ile Ile Glu Thr Gly Glu
130 135 140
Leu Lys Asp Glu Ala Leu Ile Arg Lys Ala Ser Glu Ile Ser Ile Lys
145 150 155 160
Ala Gly Ala Asp Phe Ile Lys Thr Ser Thr Gly Lys Val Ala Val Asn
165 170 175
Ala Thr Pro Glu Ser Ala Arg Ile Met Met Glu Val Ile Arg Asp Met
180 185 190
Gly Val Glu Lys Thr Val Gly Phe Lys Pro Ala Gly Gly Val Arg Thr
195 200 205
Ala Glu Asp Ala Gln Lys Tyr Leu Ala Ile Ala Asp Glu Leu Phe Gly
210 215 220
Ala Asp Trp Ala Asp Ala Arg His Tyr Arg Phe Gly Ala Ser Ser Leu
225 230 235 240
Leu Ala Ser Leu Leu Lys Ala Leu Gly His Gly Asp Gly Lys Ser Ala
245 250 255
Ser Ser Tyr

Claims (92)

1.一种包含一种或多种生化途径的重组微生物,所述生化途径由一种或多种戊糖和/或己糖通过戊糖磷酸中间体生产一种或多种衍生自甘油醛-3-磷酸(G3P)和乙醇醛的产物;其中所述一种或多种生化途径包含至少一种具有戊糖磷酸醛缩酶活性的酶的表达。
2.根据权利要求1所述的重组微生物,其中所述戊糖磷酸中间体是D-核糖-5-磷酸、D-核酮糖-5-磷酸或D-木酮糖-5-磷酸,其中所述酶具有D-核糖-5-磷酸、D-核酮糖-5-磷酸或D-木酮糖-5-磷酸醛缩酶活性。
3.根据权利要求1所述的重组微生物,其中所述一种或多种产物选自单乙二醇(MEG)和乙醇酸(GA)。
4.根据权利要求1所述的重组微生物,其中所述重组微生物联产单乙二醇(MEG)或乙醇酸(GA)和一种或多种联产品。
5.根据权利要求3所述的重组微生物,其中所述一种或多种联产品选自丙酮、异丙醇、丙烯、L-丝氨酸、甘氨酸、单乙醇胺(MEA)、乙二胺或其组合。
6.根据权利要求1-5中任一项所述的重组微生物,其中所述一种或多种生化途径包含至少一种具有转酮醇酶活性的酶的表达。
7.根据权利要求6所述的重组微生物,其中所述至少一种具有转酮醇酶活性的酶由与来自大肠杆菌的tktA或tktB具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码。
8.根据权利要求1所述的重组微生物,其中所述至少一种具有戊糖磷酸醛缩酶活性的酶由与SEQ ID NO:256来自大肠杆菌的deoC具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码。
9.根据权利要求1所述的重组微生物,其中所述至少一种具有戊糖磷酸醛缩酶活性的酶由与SEQ ID NO:298来自热容芽孢杆菌B.caldolyticus的deoC具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码。
10.根据权利要求8所述的重组微生物,其中所述来自大肠杆菌的deoC包含第47位的半胱氨酸突变为精氨酸(C47N)。
11.根据权利要求9所述的重组微生物,其中所述来自热容芽孢杆菌的deoC包含第37位的半胱氨酸突变为精氨酸(C37N)。
12.根据权利要求1-8中任一项所述的重组微生物,其中所述一种或多种生化途径包含至少一种具有转醛醇酶活性的酶的表达。
13.根据权利要求8所述的重组微生物,其中所述至少一种具有转醛醇酶活性的酶由与来自大肠杆菌的talA或talB具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码。
14.根据权利要求1-12中任一项所述的重组微生物,其中所述一种或多种生化途径包含至少一种具有核酮糖-5-磷酸3-差向异构酶活性的酶的表达。
15.根据权利要求12所述的重组微生物,其中所述至少一种具有核酮糖-5-磷酸3-差向异构酶活性的酶由与来自大肠杆菌的rpe具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码。
16.根据权利要求1-14中任一项所述的重组微生物,其中所述一种或多种生化途径包含至少一种具有核糖-5-磷酸异构酶活性的酶的表达。
17.根据权利要求15所述的重组微生物,其中所述至少一种具有核糖-5-磷酸异构酶活性的酶由与来自大肠杆菌的rpiA或rpiB具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码。
18.根据权利要求1-16中任一项所述的重组微生物,其中所述重组微生物进一步包含一种或多种内源性酶的缺失或降低的活性,所述内源性酶选自甘油醛3-磷酸脱氢酶、磷酸甘油酸激酶和磷酸甘油酸变位酶。
19.根据权利要求17所述的重组微生物,其中所述甘油醛3-磷酸脱氢酶是gapA,磷酸甘油酸激酶是pgk,磷酸甘油酸变位酶是gpmA和/或gpmM。
20.根据权利要求1-15中任一项所述的重组微生物,其中所述一种或多种生化途径包含至少一种具有果糖-6-磷酸磷酸酮醇酶活性的酶的表达。
21.根据权利要求18所述的重组微生物,其中至少一种具有果糖-6-磷酸磷酸酮醇酶活性的酶由与选自以下的具有果糖-6-磷酸磷酸酮醇酶活性的酶具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码:齿双歧杆菌BDP_1006、乳双歧杆菌xfp、类植物乳杆菌xpkA和短双歧杆菌xfp。
22.根据权利要求18或19所述的重组微生物,其中所述一种或多种生化途径包含至少一种具有磷酸乙酰转移酶活性的酶的表达。
23.根据权利要求20所述的重组微生物,其中所述至少一种具有磷酸乙酰转移酶活性的酶由与选自以下的具有磷酸乙酰转移酶活性的酶具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码:大肠杆菌pta和丙酮丁醇梭菌pta。
24.根据权利要求1-15或18-21中任一项所述的重组微生物,其中所述重组微生物进一步包含内源性酶6-磷酸果糖激酶的缺失或降低的活性。
25.根据权利要求22所述的重组微生物,其中所述6-磷酸果糖激酶是pfkA和/或pfkB。
26.根据权利要求1-23中任一项所述的重组微生物,其中所述重组微生物进一步包含一种或多种内源性酶的缺失或降低的活性,所述内源性酶选自葡萄糖6-磷酸-1-脱氢酶、6-磷酸葡萄糖酸内酯酶和6-磷酸葡萄糖酸脱氢酶。
27.根据权利要求24所述的重组微生物,其中所述葡萄糖6-磷酸-1-脱氢酶是zwf,6-磷酸葡萄糖酸内酯酶是pgl,6-磷酸葡萄糖酸脱氢酶是gnd。
28.根据权利要求1-25中任一项所述的重组微生物,其中所述一种或多种戊糖和/或己糖包含D-木糖,并且重组微生物进一步包含至少一种具有木糖异构酶活性的酶的表达和至少一种具有木酮糖5-激酶活性的酶的表达。
29.根据权利要求26所述的重组微生物,其中所述至少一种具有木糖异构酶活性的酶由与来自大肠杆菌或Pyromyces属物种的xylA具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码。
30.根据权利要求2264所述的重组微生物,其中所述至少一种具有木酮糖5-激酶活性的酶由与来自大肠杆菌的xylB具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码。
31.根据权利要求1-28中任一项所述的重组微生物,其中所述一种或多种戊糖和/或己糖包含D-果糖,并且重组微生物进一步包含至少一种具有果糖1,6-二磷酸酶活性的酶的表达。
32.根据权利要求29所述的重组微生物,其中所述至少一种具有果糖1,6-二磷酸酶活性的酶由与来自大肠杆菌的fbp具有至少70%序列同一性、至少80%序列同一性或至少90%序列同一性的氨基酸序列编码。
33.根据权利要求1-30中任一项所述的重组微生物,其中所述一种或多种戊糖和/或己糖能够在重组微生物的非氧化磷酸戊糖途径中转化为一种或多种中间体。
34.根据权利要求1-31中任一项所述的重组微生物,其中所述一种或多种戊糖和/或己糖由单体、低聚物或其组合组成。
35.根据权利要求5-32中任一项所述的重组微生物,其中所述至少一种具有转酮醇酶活性和/或果糖-6-磷酸磷酸酮醇酶活性的酶的表达和至少一种具有D-核糖-5-磷酸醛缩酶活性的酶的表达,使得能够实现一种或多种戊糖和/或己糖无损转化为D-核糖-5-磷酸中间体以及随后D-核糖-5-磷酸转化为G3P和乙醇醛。
36.根据权利要求4-33中任一项所述的重组微生物,其中通过C2途径中乙醇醛的转化和一种或多种C3途径中G3P的转化生产MEG或GA。
37.根据权利要求34所述的重组微生物,其中通过C2途径中具有乙醇醛还原酶活性的酶还原乙醇醛来生产MEG。
38.根据权利要求34所述的重组微生物,其中通过C2途径中具有乙醇醛脱氢酶活性的酶氧化乙醇醛来生产GA。
39.根据权利要求34所述的重组微生物,其中用于生产MEG或GA的至少一种酶选自具有选自以下的活性的至少一种酶:3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、羟基丙酮酸脱羧酶活性、3-磷酸羟基丙酮酸还原酶活性、乙醇醛还原酶活性、乙醇醛脱氢酶活性、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶活性、丝氨酸脱羧酶活性、乙醇胺转氨酶或乙醇胺氧化还原酶(脱氨基)活性、甘油酸脱羧酶活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性、甘油酸2-激酶活性和乙醛酸还原酶活性。
40.根据权利要求2-33中任一项所述的重组微生物,其中通过C2途径中乙醇醛的转化生产MEG,通过一种或多种C3途径中G3P的转化生产一种或多种联产品。
41.根据权利要求38所述的重组微生物,其中用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶:硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A:乙酰乙酸转移酶或乙酸:乙酰乙酰辅酶A水解酶活性和乙酰乙酸脱羧酶活性,并且其中所述一种或多种联产品包含丙酮。
42.根据权利要求38所述的重组微生物,其中用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶:硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A:乙酰乙酸转移酶或乙酸:乙酰乙酰辅酶A水解酶活性、乙酰乙酸脱羧酶活性和仲醇脱氢酶活性,并且其中所述一种或多种联产品包含异丙醇。
43.根据权利要求38所述的重组微生物,其中用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶:硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A:乙酰乙酸转移酶或乙酸:乙酰乙酰辅酶A水解酶活性、乙酰乙酸脱羧酶活性、仲醇脱氢酶活性和脱水酶活性,并且其中所述一种或多种联产品包含丙烯。
44.根据权利要求38所述的重组微生物,其中用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶:硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A:乙酰乙酸转移酶或乙酸:乙酰乙酰辅酶A水解酶活性、乙酰乙酸脱羧酶活性、3-羟基异戊酸(3HIV)合酶活性、羟甲基戊二酰辅酶A合酶活性、甲基戊烯二酰辅酶A水合酶活性、甲基巴豆酰辅酶A羧化酶活性、甲基巴豆酰辅酶A水合酶活性、3-羟基异戊酰辅酶A硫酯酶活性、3HIV激酶活性、3HIV-3-磷酸脱羧酶活性和3HIV脱羧酶活性,并且其中所述一种或多种联产品包含异丁烯。
45.根据权利要求38所述的重组微生物,其中用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶:3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性和甘油酸2-激酶活性,并且其中所述一种或多种联产品包含L-丝氨酸。
46.根据权利要求38所述的重组微生物,其中用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶:丝氨酸羟甲基转移酶活性、转移酶活性、甲醛脱氢酶活性、甲酸脱氢酶活性、与甘氨酸裂解系统相关的活性、3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、丝氨酸转氨酶活性、羟基丙酮酸脱羧酶活性、丝氨酸氧化还原酶(脱氨基)活性、丝氨酸脱羧酶活性、乙醇胺转氨酶或乙醇胺氧化还原酶(脱氨基)活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性、甘油酸2-激酶活性、乙醇醛脱氢酶活性、乙醇酸脱氢酶活性、丙氨酸-乙醛酸转氨酶活性、丙氨酸转氨酶活性和NAD(P)H依赖性谷氨酸脱氢酶活性,并且其中所述一种或多种联产品包含甘氨酸。
47.根据权利要求44所述的重组微生物,其中与甘氨酸裂解系统相关的活性包含选自以下的酶或蛋白:甘氨酸脱羧酶(P蛋白)、氨甲基转移酶(T蛋白)、二氢硫辛酰胺脱氢酶(L蛋白)和H蛋白。
48.根据权利要求38所述的重组微生物,其中用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶:3-磷酸甘油酸脱氢酶活性、3-磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、转氨酶活性、羟基丙酮酸脱羧酶活性、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶活性、丝氨酸脱羧酶活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性、甘油酸2-激酶活性、乙醛脱氢酶活性和乙醇胺解氨酶活性,并且其中所述一种或多种联产品包含单乙醇胺(MEA)。
49.根据权利要求38所述的重组微生物,其中用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的至少一种酶选自具有选自以下的活性的至少一种酶:丝氨酸脱氢酶活性、2-氨基丙二酸半醛脱羧酶活性、氨基乙醛转氨酶活性、2-氨基丙二酸半醛转氨酶活性、2,3-二氨基丙酸脱羧酶活性、丝氨酸脱羧酶活性、乙醇胺脱氢酶活性、丝氨酸羟甲基转移酶活性、醛氧化酶活性、N-乙酰转移酶或O-乙酰转移酶活性、N-乙酰丝氨酸脱氢酶活性、转氨酶活性、脱乙酰酶活性、丝氨酸氨基酶活性和2,3-二氨基丙酸解氨酶活性,并且其中所述一种或多种联产品包含乙二胺(EDA)。
50.根据权利要求1-47中任一项所述的重组微生物,其中所述重组微生物进一步包含一种或多种修饰,以减少或缺失乙醇醛还原酶、乙醇醛脱氢酶、乳酸脱氢酶或其组合的活性。
51.根据权利要求1-48中任一项所述的重组微生物,其中至少一部分在C3途径中生产的过量NADH用作C2途径中还原当量的来源。
52.根据权利要求1-48中任一项所述的重组微生物,其中至少一部分在C3途径中生产的过量NADH用于生产ATP。
53.根据权利要求1-50中任一项所述的重组微生物,其中最小化过量的生物质形成,并且最大化MEG或/和GA和一种或多种联产品的生产。
54.一种使用根据前述权利要求中任一项所述的重组微生物生产一种或多种衍生自甘油醛-3-磷酸(G3P)和乙醇醛的产物的方法,其中所述方法包括在含有提供碳源的一种或多种戊糖和/或己糖的培养介质中培养重组微生物,直至生产一种或多种衍生自甘油醛-3-磷酸(G3P)和乙醇醛的产物。
55.根据权利要求54所述的方法,其中所述重组微生物联产单乙二醇(MEG)和一种或多种联产品。
56.根据权利要求55所述的方法,其中所述一种或多种联产品选自丙酮、异丙醇、丙烯、L-丝氨酸、甘氨酸、单乙醇胺(MEA)、乙二胺(EDA),或其组合。
57.根据权利要求54所述的方法,其中所述一种或多种产物选自单乙二醇(MEG)和乙醇酸(GA)。
58.一种生产重组微生物的方法,所述重组微生物由一种或多种戊糖和/或己糖通过戊糖磷酸中间体生产或积累一种或多种衍生自甘油醛-3-磷酸(G3P)和乙醇醛的产物,所述方法包括:
向重组微生物中引入或在重组微生物中表达一种或多种酶,所述酶用于将一种或多种戊糖和/或己糖转化为戊糖磷酸中间体;
向重组微生物中引入或在重组微生物中表达一种或多种酶,所述酶用于将D-核糖-5-磷酸中间体转化为G3P和乙醇醛;
向重组微生物中引入或在重组微生物中表达一种或多种酶,所述酶用于在C2途径中由乙醇醛生产一种或多种产物;和
向重组微生物中引入或在重组微生物中表达一种或多种酶,所述酶用于在一种或多种C3途径中由G3P生产一种或多种产物;和
在含有一种或多种戊糖和/或己糖的培养介质中培养所述重组微生物,以生产或积累一种或多种产物。
59.根据权利要求58所述的方法,其中所述重组微生物联产单乙二醇(MEG)和一种或多种联产品。
60.根据权利要求59所述的方法,其中所述一种或多种联产品选自丙酮、异丙醇、丙烯、L-丝氨酸、甘氨酸、单乙醇胺(MEA)、乙二胺,或其组合。
61.根据权利要求58所述的方法,其中所述一种或多种产物选自单乙二醇(MEG)和乙醇酸(GA)。
62.根据权利要求58所述的方法,其中乙醇醛通过乙醇醛脱氢酶氧化为乙醇酸。
63.根据权利要求58-62中任一项所述的方法,其中用于将一种或多种戊糖和/或己糖转化为戊糖磷酸中间体的一种或多种酶选自具有以下活性的一种或多种酶:转酮醇酶活性、转醛醇酶活性、核酮糖-5-磷酸3-差向异构酶活性和核糖-5-磷酸异构酶活性。
64.根据权利要求63所述的方法,其中所述方法进一步包括向重组微生物中引入一种或多种修饰,以降低或缺失一种或多种内源性酶的活性,所述内源性酶选自甘油醛3-磷酸脱氢酶(gapA)、磷酸甘油酸激酶(pgk)和磷酸甘油酸变位酶(gpmA和/或gpmM)。
65.根据权利要求58-62中任一项所述的方法,其中将一种或多种戊糖和/或己糖转化为戊糖磷酸中间体的一种或多种酶选自具有以下活性的一种或多种酶:果糖-6-磷酸磷酸酮醇酶活性、磷酸乙酰转移酶活性、转酮醇酶活性、转醛醇酶活性、核酮糖-5-磷酸3-差向异构酶活性和核糖-5-磷酸异构酶活性。
66.根据权利要求65所述的方法,其中所述方法进一步包括将一种或多种修饰引入重组微生物中,以减少或缺失内源性6-磷酸果糖激酶(pfkA和/或pfkB)酶的活性。
67.根据权利要求58-66中任一项所述的方法,其中将戊糖磷酸中间体转化为G3P和乙醇醛的一种或多种酶是一种或多种具有戊糖磷酸醛缩酶活性的酶。
68.根据权利要求58-67中任一项所述的方法,其中所述方法进一步包括:将一种或多种修饰引入重组微生物中,以减少或缺失一种或多种内源性酶的活性,所述内源性酶选自葡萄糖6-磷酸-1-脱氢酶、6-磷酸葡萄糖酸内酯酶和6-磷酸葡萄糖酸脱氢酶。
69.根据权利要求68所述的方法,其中所述葡萄糖6-磷酸-1-脱氢酶是zwf,6-磷酸葡萄糖酸内酯酶是pgl,6-磷酸葡萄糖酸脱氢酶是gnd。
70.根据权利要求58-69中任一项所述的方法,其中所述一种或多种戊糖和/或己糖包含D-木糖,所述方法进一步包括:
向重组微生物中引入或在重组微生物中表达一种或多种具有木糖异构酶活性的酶,该酶用于将D-木糖转化为D-木酮糖;和
向重组微生物中引入或在重组微生物中表达一种或多种具有木酮糖5-激酶活性的酶,该酶用于将D-木酮糖转化为D-木酮糖-5-磷酸。
71.根据权利要求58-70中任一项所述的方法,其中所述一种或多种戊糖和/或己糖包含D-果糖,所述重组微生物进一步包括:向重组微生物中引入或在重组微生物中表达一种或多种具有果糖1,6-二磷酸酶活性的酶,该酶用于将D-果糖1,6-二磷酸转化为D-果糖6-磷酸,其中重组微生物中的内源性酶将D-果糖转化为果糖1,6-二磷酸。
72.根据权利要求58-71中任一项所述的方法,其中所述一种或多种戊糖和/或己糖能够在重组微生物的非氧化磷酸戊糖途径中转化为一种或多种中间体。
73.根据权利要求58-72中任一项所述的方法,其中所述一种或多种戊糖和/或己糖由单体、低聚物或其组合组成。
74.根据权利要求63-73中任一项所述的方法,其中所述一种或多种具有转酮醇酶活性和/或果糖-6-磷酸磷酸酮醇酶活性的酶的表达和一种或多种具有戊糖磷酸醛缩酶活性的酶的表达,使得能够实现一种或多种戊糖和/或己糖无损转化为戊糖磷酸中间体以及随后将戊糖磷酸转化为G3P和乙醇醛。
75.根据权利要求61-74中任一项所述的方法,其中通过C2途径中乙醇醛的转化和一种或多种C3途径中G3P的转化生产MEG或GA。
76.根据权利要求75所述的方法,其中具有乙醇醛还原酶活性的酶还原乙醇醛来生产MEG。
77.根据权利要求75所述的方法,其中具有乙醇醛脱氢酶活性的酶氧化乙醇醛来生产GA。
78.根据权利要求75所述的方法,其中用于生产MEG或GA的一种或多种酶选自具有选自以下的活性的一种或多种酶:3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、羟基丙酮酸脱羧酶活性、3-磷酸羟基丙酮酸还原酶活性、乙醇醛还原酶活性、乙醇醛脱氢酶活性、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶活性、丝氨酸脱羧酶活性、乙醇胺转氨酶或乙醇胺氧化还原酶(脱氨基)活性、甘油酸脱羧酶活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性、甘油酸2-激酶活性和乙醛酸还原酶活性。
79.根据权利要求58-74中任一项所述的方法,其中通过C2途径中乙醇醛的转化生产MEG,通过一种或多种C3途径中G3P的转化生产一种或多种联产品。
80.根据权利要求79所述的方法,其中用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶:硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A:乙酰乙酸转移酶或乙酸:乙酰乙酰辅酶A水解酶活性和乙酰乙酸脱羧酶活性,并且其中所述一种或多种联产品包含丙酮。
81.根据权利要求79所述的方法,其中用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶:硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A:乙酰乙酸转移酶或乙酸:乙酰乙酰辅酶A水解酶活性、乙酰乙酸脱羧酶活性和仲醇脱氢酶活性,并且其中所述一种或多种联产品包含异丙醇。
82.根据权利要求79所述的方法,其中用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶:硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A:乙酰乙酸转移酶或乙酸:乙酰乙酰辅酶A水解酶活性、乙酰乙酸脱羧酶活性、仲醇脱氢酶活性和脱水酶活性,并且其中所述一种或多种联产品包含丙烯。
83.根据权利要求79所述的方法,其中用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶:硫解酶或乙酰辅酶A乙酰转移酶活性、乙酰辅酶A:乙酰乙酸转移酶或乙酸:乙酰乙酰辅酶A水解酶活性、乙酰乙酸脱羧酶活性、3-羟基异戊酸(3HIV)合酶活性、羟甲基戊二酰辅酶A合酶活性、甲基戊烯二酰辅酶A水合酶活性、甲基巴豆酰辅酶A羧化酶活性、甲基巴豆酰辅酶A水合酶活性、3-羟基异戊酰辅酶A硫酯酶活性、3HIV激酶活性、3HIV-3-磷酸脱羧酶活性和3HIV脱羧酶活性,并且其中所述一种或多种联产品包含异丁烯。
84.根据权利要求79所述的方法,其中用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶:3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性和甘油酸2-激酶活性,并且其中所述一种或多种联产品包含L-丝氨酸。
85.根据权利要求79所述的方法,其中用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶:丝氨酸羟甲基转移酶活性、转移酶活性、甲醛脱氢酶活性、甲酸脱氢酶活性、与甘氨酸裂解系统相关的活性、3-磷酸甘油酸脱氢酶活性、磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、丝氨酸转氨酶活性、羟基丙酮酸脱羧酶活性、丝氨酸氧化还原酶(脱氨基)活性、丝氨酸脱羧酶活性、乙醇胺转氨酶或乙醇胺氧化还原酶(脱氨基)活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性、甘油酸2-激酶活性、乙醇醛脱氢酶活性、乙醇酸脱氢酶活性、丙氨酸-乙醛酸转氨酶活性、丙氨酸转氨酶活性和NAD(P)H依赖性谷氨酸脱氢酶活性,并且其中所述一种或多种联产品包含甘氨酸。
86.根据权利要求81所述的方法,其中与甘氨酸裂解系统相关的活性包含选自以下的酶或蛋白:甘氨酸脱羧酶(P蛋白)、氨甲基转移酶(T蛋白)、二氢硫辛酰胺脱氢酶(L蛋白)和H蛋白。
87.根据权利要求79所述的方法,其中用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶:3-磷酸甘油酸脱氢酶活性、3-磷酸丝氨酸转氨酶活性、3-磷酸羟基丙酮酸磷酸酶活性、磷酸丝氨酸磷酸酶活性、转氨酶活性、羟基丙酮酸脱羧酶活性、丝氨酸氧化还原酶(脱氨基)或丝氨酸-丙酮酸转氨酶活性、丝氨酸脱羧酶活性、羟基丙酮酸还原酶活性、3-磷酸甘油酸磷酸酶活性、2-磷酸甘油酸磷酸酶活性、甘油酸3-激酶活性、甘油酸2-激酶活性、乙醛脱氢酶活性和乙醇胺解氨酶活性,并且其中所述一种或多种联产品包含单乙醇胺(MEA)。
88.根据权利要求79所述的方法,其中用于通过一种或多种C3途径中G3P的转化生产一种或多种联产品的一种或多种酶选自具有选自以下的活性的一种或多种酶:丝氨酸脱氢酶活性、2-氨基丙二酸半醛脱羧酶活性、氨基乙醛转氨酶活性、2-氨基丙二酸半醛转氨酶活性、2,3-二氨基丙酸脱羧酶活性、丝氨酸脱羧酶活性、乙醇胺脱氢酶活性、丝氨酸羟甲基转移酶活性、醛氧化酶活性、N-乙酰转移酶或O-乙酰转移酶活性、N-乙酰丝氨酸脱氢酶活性、转氨酶活性、脱乙酰酶活性、丝氨酸氨基酶活性和2,3-二氨基丙酸解氨酶活性,并且其中所述一种或多种联产品包含乙二胺(EDA)。
89.根据权利要求58-88中任一项所述的方法,其中所述方法进一步包含向重组微生物中引入一种或多种修饰,以减少或缺失乙醇醛还原酶、乙醇醛脱氢酶、乳酸脱氢酶或其组合的活性。
90.根据权利要求58-89中任一项所述的方法,其中至少一部分在C3途径中生产的过量NADH用作C2途径中还原当量的来源。
91.根据权利要求58-89中任一项所述的方法,其中至少一部分在C3途径中生产的过量NADH用于生产ATP。
92.根据权利要求58-91中任一项所述的方法,其中最小化过量的生物质形成,并且最大化MEG或GA或MEG和一种或多种联产品的生产。
CN202080029904.0A 2019-02-20 2020-02-20 戊糖和己糖的降解途径 Pending CN113710798A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962808258P 2019-02-20 2019-02-20
US62/808,258 2019-02-20
PCT/BR2020/050053 WO2020168408A1 (en) 2019-02-20 2020-02-20 Degradation pathway for pentose and hexose sugars

Publications (1)

Publication Number Publication Date
CN113710798A true CN113710798A (zh) 2021-11-26

Family

ID=69902951

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080029904.0A Pending CN113710798A (zh) 2019-02-20 2020-02-20 戊糖和己糖的降解途径

Country Status (5)

Country Link
US (1) US11584944B2 (zh)
EP (1) EP3927816A1 (zh)
JP (2) JP7463388B2 (zh)
CN (1) CN113710798A (zh)
WO (1) WO2020168408A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116355821A (zh) * 2023-03-10 2023-06-30 湖北大学 一种生产乙二醇的运动发酵单胞菌重组菌株、构建方法及其应用

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021063958A1 (en) * 2019-09-30 2021-04-08 Global Bioenergies Improved means and methods for increasing the yield of acetyl-coa from glucose
CN111996157B (zh) * 2020-09-08 2022-07-08 齐鲁工业大学 一种高效生产1,3-丙二醇的基因工程菌及其构建方法与应用
CN112501221A (zh) * 2020-12-14 2021-03-16 呼伦贝尔东北阜丰生物科技有限公司 一种提高苏氨酸糖酸转化率的方法
WO2022140538A1 (en) * 2020-12-23 2022-06-30 Massachusetts Institute Of Technology Modified bacterium for oxalate degradation and uses thereof

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002095494A (ja) * 2000-09-22 2002-04-02 Yuki Gosei Kogyo Co Ltd リボース1−リン酸類及びヌクレオシド化合物の製造方法
US20050153407A1 (en) * 2002-09-20 2005-07-14 William Greenberg Chemoenzymatic methods for the synthesis of statins and stain intermediates
AU2013203440A1 (en) * 2007-08-10 2013-05-02 Genomatica, Inc. Methods and organisms for the growth-coupled production of 1,4-butanediol
WO2013066568A1 (en) * 2011-10-07 2013-05-10 Danisco Us Inc. Utilization of phosphoketolase in the production of mevalonate, isoprenoid precursors, and isoprene
CN106536742A (zh) * 2014-05-26 2017-03-22 财富科学家股份有限公司 D‑赤藓糖和乙酰磷酸的酶促生产方法
CN109312373A (zh) * 2016-03-09 2019-02-05 布拉斯肯有限公司 用于共生产乙二醇和三碳化合物的微生物和方法

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW313589B (zh) 1991-12-12 1997-08-21 Wacker Chemie Gmbh
JP4066543B2 (ja) 1998-01-12 2008-03-26 味の素株式会社 発酵法によるl−セリンの製造法
WO2007140816A1 (en) 2006-06-09 2007-12-13 Metabolic Explorer Glycolic acid production by fermentation from renewable resources
WO2007144018A1 (en) 2006-06-12 2007-12-21 Metabolic Explorer Ethanolamine production by fermentation
DE102006027683A1 (de) 2006-06-14 2007-12-20 Siemens Ag Verfahren und Vorrichtung zur Vernetzung einer automatisierten Anlage
ES2549003T3 (es) 2008-12-31 2015-10-22 Metabolic Explorer Método para la preparación de dioles
EP2233562A1 (en) 2009-03-24 2010-09-29 Metabolic Explorer Method for producing high amount of glycolic acid by fermentation
US8969053B2 (en) 2009-07-30 2015-03-03 Metabolic Explorer Mutant YqhD enzyme for the production of a biochemical by fermentation
KR20130093481A (ko) 2010-04-13 2013-08-22 게노마티카 인코포레이티드 에틸렌 글리콜을 생산하기 위한 미생물 및 방법
PE20140009A1 (es) 2010-10-19 2014-01-18 Global Bioenergies Produccion de alquenos mediante conversion enzimatica combinada de acidos 3-hidroxialcanoicos
KR101351879B1 (ko) 2012-02-06 2014-01-22 명지대학교 산학협력단 에탄―1,2―디올 생산 미생물 및 이를 이용한 에탄―1,2―디올 생산 방법
WO2013126721A1 (en) 2012-02-23 2013-08-29 Massachusetts Institute Of Technology Engineering microbes and metabolic pathways for the production of ethylene glycol
WO2014049382A2 (en) 2012-09-26 2014-04-03 Metabolic Explorer Ethylenediamine fermentative production by a recombinant microorganism
WO2014153036A1 (en) 2013-03-14 2014-09-25 The Regents Of The University Of California Non-co2 evolving metabolic pathway for chemical production
PL3019604T3 (pl) 2013-07-09 2021-01-25 Global Bioenergies Warianty dekarboksylazy difosfomewalonianowej
WO2015042588A1 (en) 2013-09-23 2015-03-26 Braskem S.A. Engineered enzyme having acetoacetyl-coa hydrolase activity, microorganisms comprising same, and methods of using same
FR3028529B1 (fr) 2014-11-19 2016-12-30 Inst Nat De La Rech Agronomique Inra Procede de production d'au moins un metabolite d'interet par transformation d'un pentose dans un microorganisme
WO2020006058A2 (en) 2018-06-26 2020-01-02 Genomatica, Inc. Engineered microorganisms with g3p---> 3pg enzyme and/or fructose-1,6-bisphosphatase including those having synthetic or enhanced methylotrophy

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002095494A (ja) * 2000-09-22 2002-04-02 Yuki Gosei Kogyo Co Ltd リボース1−リン酸類及びヌクレオシド化合物の製造方法
US20050153407A1 (en) * 2002-09-20 2005-07-14 William Greenberg Chemoenzymatic methods for the synthesis of statins and stain intermediates
AU2013203440A1 (en) * 2007-08-10 2013-05-02 Genomatica, Inc. Methods and organisms for the growth-coupled production of 1,4-butanediol
WO2013066568A1 (en) * 2011-10-07 2013-05-10 Danisco Us Inc. Utilization of phosphoketolase in the production of mevalonate, isoprenoid precursors, and isoprene
CN106536742A (zh) * 2014-05-26 2017-03-22 财富科学家股份有限公司 D‑赤藓糖和乙酰磷酸的酶促生产方法
CN109312373A (zh) * 2016-03-09 2019-02-05 布拉斯肯有限公司 用于共生产乙二醇和三碳化合物的微生物和方法

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
CHAMBRE D 等: ""2-Deoxyribose-5-phosphate aldolase, a remarkably tolerant aldolase towards nucleophile substrates"", CHEMICAL COMMUNICATIONS, vol. 55, no. 52, 4 July 2019 (2019-07-04), pages 7498 - 7501 *
JENNEWEIN S等: ""Directed evolution of an industrial biocatalyst: 2‐deoxy‐D‐ribose 5‐phosphate aldolase"", BIOTECHNOLOGY JOURNAL, vol. 1, no. 5, 11 May 2006 (2006-05-11), pages 537, XP002508195, DOI: 10.1002/BIOT.200600020 *
VALENTIN‐HANSEN P 等: ""The Primary Structure of Escherichia coli K12 2‐Deoxyribose 5‐Phosphate Aldolase: Nucleotide Sequence of the deoC Gene and the Amino Acid Sequence of the Enzyme"", EUROPEAN JOURNAL OF BIOCHEMISTRY, vol. 125, no. 3, 3 July 1982 (1982-07-03), pages 563 *
VICENTE GOTOR等: "《酶不对称有机合成》", vol. 1, 31 October 2009, 华东理工大学出版社, pages: 276 *
YUFENG MAO 等: ""Non-natural Aldol Reactions Enable the Design and Construction of Novel One-Carbon Assimilation Pathways in vitro"", FRONTIERS IN MICROBIOLOGY, vol. 12, 2 June 2021 (2021-06-02), pages 677596 *
尤忠毓: "" (R)-4-氰基-3-羟基丁酸乙酯的酶法合成"", 中国博士学位论文全文数据库 工程科技Ⅰ辑, no. 1, 15 January 2019 (2019-01-15), pages 016 - 119 *
施红等: "《生物化学》", vol. 1, 31 July 2015, 中国中医药出版社, pages: 128 - 129 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116355821A (zh) * 2023-03-10 2023-06-30 湖北大学 一种生产乙二醇的运动发酵单胞菌重组菌株、构建方法及其应用
CN116355821B (zh) * 2023-03-10 2023-09-29 湖北大学 一种生产乙二醇的运动发酵单胞菌重组菌株、构建方法及其应用

Also Published As

Publication number Publication date
US20200283811A1 (en) 2020-09-10
JP2022521905A (ja) 2022-04-13
US11584944B2 (en) 2023-02-21
EP3927816A1 (en) 2021-12-29
WO2020168408A1 (en) 2020-08-27
BR112021015626A2 (pt) 2021-11-30
JP2024026211A (ja) 2024-02-28
JP7463388B2 (ja) 2024-04-08

Similar Documents

Publication Publication Date Title
JP7504112B2 (ja) ヘキソースからの含酸素化合物の生成のための微生物および方法
CN113710798A (zh) 戊糖和己糖的降解途径
ES2329778T3 (es) 2,3-aminomutasa de alanina.
CN107771214B (zh) 用于具有增加的2,4-二羟基丁酸外排物的优化的2,4-二羟基丁酸产生的修饰的微生物
US9121041B2 (en) Method for the preparation of diols
KR20190004258A (ko) 에틸렌 글리콜 및 3-탄소 화합물의 동시-생산을 위한 미생물 및 방법
US8372621B2 (en) Methods and materials for the production of shikimic acid
JP2002511250A (ja) 微生物におけるオキサロ酢酸由来生化学物質の生産増強のためのピルビン酸カルボキシラーゼの過剰発現
EP2591091B1 (en) Method for the preparation of 1,3-propanediol from sucrose
RU2760290C1 (ru) Способ ферментативной продукции целевых молекул микроорганизмами, включающими гены, кодирующие фосфотрансферазную систему (фтс) сахаров
CN113710813A (zh) 通过逆向乙醛酸支路生产乙醇酸和甘氨酸的微生物和方法
KR102149044B1 (ko) 2-히드록시 감마 부티로락톤 또는 2,4-디히드록시-부티레이트 의 제조 방법
JP5243748B2 (ja) ブタノール生産能を有する形質転換体
US20200208160A1 (en) Modulation of carbon flux through the meg and c3 pathways for the improved production of monoethylene glycol and c3 compounds
KR20190097250A (ko) 신규한 효소를 사용한 메틸글리옥살의 히드록시아세톤으로의 전환 및 그의 적용
US11162082B2 (en) Mutant phosphoserine aminotransferase for the conversion of homoserine into 4-hydroxy-2-ketobutyrate
BR112021015626B1 (pt) Microorganismo recombinante superexpressando uma enzima tendo atividade d-ribose-5-fosfato aldolase, método de produção do mesmo e método de produção de um ou mais produtos selecionados de monoetilenoglicol e ácido glicólico
CN110100005A (zh) 用于辅因子平衡的分子变阻器
Peiro Engineering and compartmentalisation of a synthetic methanol utilisation pathway in E. coli.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination