CN109952380B - 用于生产目标物质的方法 - Google Patents

用于生产目标物质的方法 Download PDF

Info

Publication number
CN109952380B
CN109952380B CN201780066784.XA CN201780066784A CN109952380B CN 109952380 B CN109952380 B CN 109952380B CN 201780066784 A CN201780066784 A CN 201780066784A CN 109952380 B CN109952380 B CN 109952380B
Authority
CN
China
Prior art keywords
protein
gene
amino acid
acid sequence
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201780066784.XA
Other languages
English (en)
Other versions
CN109952380A (zh
Inventor
B.米吉茨
C.罗切
P.凯利
朝里彩香
福井启太
户矢崎未来
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ajinomoto Co Inc
Original Assignee
Ajinomoto Co Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ajinomoto Co Inc filed Critical Ajinomoto Co Inc
Publication of CN109952380A publication Critical patent/CN109952380A/zh
Application granted granted Critical
Publication of CN109952380B publication Critical patent/CN109952380B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/22Preparation of oxygen-containing organic compounds containing a hydroxy group aromatic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1085Transferases (2.) transferring alkyl or aryl groups other than methyl groups (2.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0006Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0008Oxidoreductases (1.) acting on the aldehyde or oxo group of donors (1.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0069Oxidoreductases (1.) acting on single donors with incorporation of molecular oxygen, i.e. oxygenases (1.13)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • C12N9/0073Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14) with NADH or NADPH as one donor, and incorporation of one atom of oxygen 1.14.13
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1003Transferases (2.) transferring one-carbon groups (2.1)
    • C12N9/1007Methyltransferases (general) (2.1.1.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/24Preparation of oxygen-containing organic compounds containing a carbonyl group
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/40Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
    • C12P7/42Hydroxy-carboxylic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/01Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
    • C12Y101/01001Alcohol dehydrogenase (1.1.1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/01Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
    • C12Y101/01025Shikimate dehydrogenase (1.1.1.25)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y102/00Oxidoreductases acting on the aldehyde or oxo group of donors (1.2)
    • C12Y102/99Oxidoreductases acting on the aldehyde or oxo group of donors (1.2) with other acceptors (1.2.99)
    • C12Y102/99007Aldehyde dehydrogenase (FAD-independent) (1.2.99.7)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y113/00Oxidoreductases acting on single donors with incorporation of molecular oxygen (oxygenases) (1.13)
    • C12Y113/11Oxidoreductases acting on single donors with incorporation of molecular oxygen (oxygenases) (1.13) with incorporation of two atoms of oxygen (1.13.11)
    • C12Y113/11003Protocatechuate 3,4-dioxygenase (1.13.11.3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y114/00Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
    • C12Y114/13Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with NADH or NADPH as one donor, and incorporation of one atom of oxygen (1.14.13)
    • C12Y114/13082Vanillate monooxygenase (1.14.13.82)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y201/00Transferases transferring one-carbon groups (2.1)
    • C12Y201/01Methyltransferases (2.1.1)
    • C12Y201/01015Fatty-acid O-methyltransferase (2.1.1.15)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y205/00Transferases transferring alkyl or aryl groups, other than methyl groups (2.5)
    • C12Y205/01Transferases transferring alkyl or aryl groups, other than methyl groups (2.5) transferring alkyl or aryl groups, other than methyl groups (2.5.1)
    • C12Y205/010543-Deoxy-7-phosphoheptulonate synthase (2.5.1.54)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y402/00Carbon-oxygen lyases (4.2)
    • C12Y402/01Hydro-lyases (4.2.1)
    • C12Y402/01013-Dehydroquinate dehydratase (4.2.1.10)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y402/00Carbon-oxygen lyases (4.2)
    • C12Y402/01Hydro-lyases (4.2.1)
    • C12Y402/011183-Dehydroshikimate dehydratase (4.2.1.118)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y402/00Carbon-oxygen lyases (4.2)
    • C12Y402/03Carbon-oxygen lyases (4.2) acting on phosphates (4.2.3)
    • C12Y402/030043-Dehydroquinate synthase (4.2.3.4)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

提供了用于生产目标物质诸如香草醛和香草酸的方法。通过使用具有目标物质生产能力的微生物从碳源或目标物质的前体生产目标物质,所述微生物已经以L‑半胱氨酸生物合成酶活性得以增加的方式进行了修饰。

Description

用于生产目标物质的方法
发明领域
本发明涉及通过使用微生物生产目标物质,诸如香草醛和香草酸的方法。
发明背景
香草醛是提供香草气味的主要成分,并且用作食品、饮料、香水等中的芳香物。香草醛通常通过从天然产物中提取或通过化学合成来生产。
已经尝试在生产香草醛的方法中尝试生物工程技术,例如通过使用各种微生物与丁香油酚、异丁香油酚、阿魏酸、葡萄糖、香草酸、椰子壳等(Kaur B.and Chakraborty D.,Biotechnological and molecular approaches for vanillin production:areview.Appl Biochem Biotechnol.2013Feb;169(4):1353-72)。另外,使用生物工程技术生产香草醛的其他方法包括以糖苷生产(WO2013/022881和WO2004/111254),使用香草醛合酶从阿魏酸生产香草醛(JP2015-535181),通过大肠杆菌发酵来生产香草酸,然后将香草酸酶促转化为香草醛(美国专利No.6,372,461)。
谷氨酸棒杆菌(Corynebacterium glutamicum)中的硫代谢受到全局阻抑物McbR和两种活化物SsuR和CysR调节(Lee SM.et al.,The cmaR gene of Corynebacteriumammoniagenes performs a novel regulatory role in the metabolism of sulfur-containing amino acids.Microbiology.2009Jun;155(Pt6):1878-89)。当富含甲硫氨酸时,McbR阻抑ssuR基因,cysR基因等的表达,并且S-腺苷甲硫氨酸(SAM)的胞内水平得到提高。CysR活化cysIXHDNYZ基因、fpr2基因、ssuR基因等的表达。谷氨酸棒杆菌天然的fpr2-cysIXHDNYZ基因簇参与同化硫酸盐还原(Rueckert C.et al.,Functional genomics andexpression analysis of the Corynebacterium glutamicum fpr2-cysIXHDNYZ genecluster involved in assimilatory sulphate reduction.BMC Genomics.2005Sep 13;6:121)。具体地,已经证明了由cysIXHDNYZ基因编码的CysIXHDNYZ蛋白参与无机硫化合物,诸如硫酸盐和亚硫酸盐的还原。此外,已经提示由fpr2基因编码的Fpr2蛋白参与用于亚硫酸盐还原的电子转运。另外,SsuR活化参与有机硫化合物利用的基因的表达。
发明概述
本发明描述了用于改善目标物质诸如香草醛和香草酸的生产的新技术,因此提供了用于有效生产目标物质的方法。
本发明的一方面是通过以L-半胱氨酸生物合成酶的活性得以增加的方式修饰微生物,微生物可以以显著改善的方式生产目标物质诸如香草酸。
本发明的一方面提供了生产目标物质的方法,所述方法包括以下步骤:通过使用具有生产所述目标物质的能力的微生物来生产所述目标物质,其中所述微生物已经以与未修饰的菌株相比L-半胱氨酸生物合成酶的活性得以增加的方式进行了修饰,且其中所述目标物质选自由以下组成的组:L-甲硫氨酸、需要S-腺苷甲硫氨酸来进行生物合成的代谢物和它们的组合。
本发明的另一方面提供了如本文中所述的方法,其中所述生产包括:在含有碳源的培养基中培养所述微生物以在所述培养基中生产和积累所述目标物质。
本发明的另一方面提供了如本文中所述的方法,其中所述生产包括:通过使用所述微生物来将所述目标物质的前体转化成所述目标物质。
本发明的另一方面提供了如本文中所述的方法,其中所述转化包括:在含有所述前体的培养基中培养所述微生物以在所述培养基中生产和积累所述目标物质。
本发明的另一方面提供了如本文中所述的方法,其中所述转化包括:在反应混合物中允许所述微生物的细胞作用于所述前体以在所述反应混合物中生产和积累所述目标物质。
本发明的另一方面提供了如本文中所述的方法,其中所述细胞是存在于所述微生物的培养液中的细胞、从所述培养液中收集的细胞、存在于所述培养液的加工产物中的细胞、存在于收集的细胞的加工产物中的细胞,或这些的组合。
本发明的另一方面提供了如本文中所述的方法,其中所述前体选自由以下组成的组:原儿茶酸、原儿茶醛、L-色氨酸、L-组氨酸、L-苯丙氨酸、L-酪氨酸、L-精氨酸、L-鸟氨酸、甘氨酸和它们的组合。
本发明的另一方面提供了如本文中所述的方法,所述方法还包括收集所述目标物质。
本发明的另一方面提供了如本文中所述的方法,其中所述L-半胱氨酸生物合成酶是由选自由以下组成的基因编码的蛋白质:cysI基因、cysX基因、cysH基因、cysD基因、cysN基因、cysY基因、cysZ基因、fpr2基因和它们的组合。
本发明的另一方面提供了如上文所述的方法,其中:
所述cysI基因编码选自由以下组成的组的蛋白质:
(1a)包含SEQ ID NO:89的氨基酸序列的蛋白质,
(1b)包含SEQ ID NO:89的氨基酸序列,且该氨基酸序列包含1至10个氨基酸残基的取代、缺失、插入和/或添加的蛋白质,且其中所述蛋白质具有参与硫利用的功能,和
(1c)包含与SEQ ID NO:89的氨基酸序列具有90%或更高的同一性的氨基酸序列的蛋白质,且其中所述蛋白质具有参与硫利用的功能;
所述cysX基因编码选自由以下组成的组的蛋白质:
(2a)包含SEQ ID NO:91的氨基酸序列的蛋白质,
(2b)包含SEQ ID NO:91的氨基酸序列,且该氨基酸序列包含1至10个氨基酸残基的取代、缺失、插入和/或添加的蛋白质,且其中所述蛋白质具有参与硫利用的功能,和
(2c)包含与SEQ ID NO:91的氨基酸序列具有90%或更高的同一性的氨基酸序列的蛋白质,且其中所述蛋白质具有参与硫利用的功能;
所述cysH基因编码选自由以下组成的组的蛋白质:
(3a)包含SEQ ID NO:93的氨基酸序列的蛋白质,
(3b)包含SEQ ID NO:93的氨基酸序列,且该氨基酸序列包含1至10个氨基酸残基的取代、缺失、插入和/或添加的蛋白质,且其中所述蛋白质具有参与硫利用的功能,和
(3c)包含与SEQ ID NO:93的氨基酸序列具有90%或更高的同一性的氨基酸序列的蛋白质,且其中所述蛋白质具有参与硫利用的功能;
所述cysD基因编码选自由以下组成的组的蛋白质:
(4a)包含SEQ ID NO:95的氨基酸序列的蛋白质,
(4b)包含SEQ ID NO:95的氨基酸序列,且该氨基酸序列包含1至10个氨基酸残基的取代、缺失、插入和/或添加的蛋白质,且其中所述蛋白质具有参与硫利用的功能,和
(4c)包含与SEQ ID NO:95的氨基酸序列具有90%或更高的同一性的氨基酸序列的蛋白质,且其中所述蛋白质具有参与硫利用的功能;
所述cysN基因编码选自由以下组成的组的蛋白质:
(5a)包含SEQ ID NO:97的氨基酸序列的蛋白质,
(5b)包含SEQ ID NO:97的氨基酸序列,且该氨基酸序列包含1至10个氨基酸残基的取代、缺失、插入和/或添加的蛋白质,且其中所述蛋白质具有参与硫利用的功能,和
(5c)包含与SEQ ID NO:97的氨基酸序列具有90%或更高的同一性的氨基酸序列的蛋白质,且其中所述蛋白质具有参与硫利用的功能;
所述cysY基因编码选自由以下组成的组的蛋白质:
(6a)包含SEQ ID NO:99的氨基酸序列的蛋白质,
(6b)包含SEQ ID NO:99的氨基酸序列,且该氨基酸序列包含1至10个氨基酸残基的取代、缺失、插入和/或添加的蛋白质,且其中所述蛋白质具有参与硫利用的功能,和
(6c)包含与SEQ ID NO:99的氨基酸序列具有90%或更高的同一性的氨基酸序列的蛋白质,且其中所述蛋白质具有参与硫利用的功能;
所述cysZ基因编码选自由以下组成的组的蛋白质:
(7a)包含SEQ ID NO:101的氨基酸序列的蛋白质,
(7b)包含SEQ ID NO:101的氨基酸序列,且该氨基酸序列包含1至10个氨基酸残基的取代、缺失、插入和/或添加的蛋白质,且其中所述蛋白质具有参与硫利用的功能,和
(7c)包含与SEQ ID NO:101的氨基酸序列具有90%或更高的同一性的氨基酸序列的蛋白质,且其中所述蛋白质具有参与硫利用的功能;
所述fpr2基因编码选自由以下组成的组的蛋白质:
(8a)包含SEQ ID NO:103的氨基酸序列的蛋白质,
(8b)包含SEQ ID NO:103的氨基酸序列,且该氨基酸序列包含1至10个氨基酸残基的取代、缺失、插入和/或添加的蛋白质,且其中所述蛋白质具有参与硫利用的功能,和
(8c)包含与SEQ ID NO:103的氨基酸序列具有90%或更高的同一性的氨基酸序列的蛋白质,且其中所述蛋白质具有参与硫利用的功能。
本发明的另一方面提供了如本文中所述的方法,其中通过增加编码所述L-半胱氨酸生物合成酶的基因的表达来增加所述L-半胱氨酸生物合成酶的活性。
本发明的另一方面提供了如本文中所述的方法,其中通过增加所述基因的拷贝数和/或对所述基因的表达控制序列进行修饰来增加所述基因的表达。
本发明的另一方面提供了如本文中所述的方法,其中通过增加所述基因的正向表达调节物的活性来增加所述基因的表达。
本发明的另一方面提供了如本文中所述的方法,其中所述正向表达调节物是由选自由以下组成的组的基因编码的蛋白质:cysR基因、ssuR基因和它们的组合。
本发明的另一方面提供了如本文中所述的方法,其中增加至少由cysR基因编码的蛋白质的活性。
本发明的另一方面提供了如上文所述的方法,其中:
所述cysR基因编码选自由以下组成的组的蛋白质:
(9a)包含SEQ ID NO:105的氨基酸序列的蛋白质,
(9b)包含SEQ ID NO:105的氨基酸序列,且该氨基酸序列包含1至10个氨基酸残基的取代、缺失、插入和/或添加的蛋白质,且其中所述蛋白质具有正向调节编码L-半胱氨酸生物合成酶的基因表达的功能,和
(9c)包含与SEQ ID NO:105的氨基酸序列具有90%或更高的同一性的氨基酸序列的蛋白质,且其中所述蛋白质具有正向调节编码L-半胱氨酸生物合成酶的基因表达的功能;
所述ssuR基因编码选自由以下组成的组的蛋白质:
(10a)包含SEQ ID NO:107的氨基酸序列的蛋白质,
(10b)包含SEQ ID NO:107的氨基酸序列,且该氨基酸序列包含1至10个氨基酸残基的取代、缺失、插入和/或添加的蛋白质,且其中所述蛋白质具有正向调节编码L-半胱氨酸生物合成酶的基因表达的功能,和
(10c)包含与SEQ ID NO:107的氨基酸序列具有90%或更高的同一性的氨基酸序列的蛋白质,且其中所述蛋白质具有正向调节编码L-半胱氨酸生物合成酶的基因表达的功能。
本发明的另一方面提供了如本文中所述的方法,其中所述微生物是属于肠杆菌科(Enterobacteriaceae)的细菌、棒状杆菌细菌或酵母。
本发明的另一方面提供了如本文中所述的方法,其中所述微生物是属于棒状杆菌属的细菌。
本发明的另一方面提供了如本文中所述的方法,其中所述微生物是谷氨酸棒杆菌。
本发明的另一方面提供了如本文中所述的方法,其中所述微生物是属于埃希氏菌属的细菌。
本发明的另一方面提供了如本文中所述的方法,其中所述微生物是大肠杆菌(Escherichia coli)。
本发明的另一方面提供了如本文中所述的方法,其中所述代谢物选自由以下组成的组:香草醛、香草酸、褪黑激素、麦角硫因、麦根酸、阿魏酸、多胺、愈创木酚、4-乙烯基愈创木酚、4-乙基愈创木酚和肌酸。
本发明的另一方面提供了如本文中所述的方法,其中所述微生物已经以与未修饰的菌株相比参与所述目标物质的生物合成的酶的活性得以增加的方式进行了进一步修饰。
本发明的另一方面提供了如本文中所述的方法,其中所述参与目标物质的生物合成的酶选自由以下组成的组:3-脱氧-D-阿拉伯糖-庚酮糖酸7-磷酸合酶、3-脱氢奎尼酸合酶、3-脱氢奎尼酸脱水酶、3-脱氢莽草酸脱水酶、O-甲基转移酶、芳族醛氧化还原酶和它们的组合。
本发明的另一方面提供了如本文中所述的方法,其中所述微生物已经以与未修饰的菌株相比磷酸泛酰巯基乙胺基转移酶的活性得以增加的方式进行了进一步的修饰。
本发明的另一方面提供了如本文中所述的方法,其中所述微生物已经以与未修饰的菌株相比参与除所述目标物质以外的物质的副生产的酶的活性得以降低的方式进行了进一步的修饰。
本发明的另一方面提供了如本文中所述的方法,其中所述参与除目标物质以外的物质的副生产的酶选自由以下组成的组:香草酸脱甲基酶、原儿茶酸3,4-双加氧酶、醇脱氢酶、莽草酸脱氢酶和它们的组合。
本发明的另一方面提供了生产香草醛的方法,所述方法包括:通过如上文中所述的方法来生产香草酸;和将所述香草酸转化成香草醛。
发明详述
<1>微生物
如本文所述的微生物是具有生产目标物质的能力的微生物,所述微生物已经以L-半胱氨酸生物合成酶的活性得以增加的方式进行了修饰。生产目标物质的能力也可以称为“目标物质生产能力”。
<1-1>具有目标物质生产能力的微生物
短语“具有目标物质生产能力的微生物”可以指能够生产目标物质的微生物。
短语“具有目标物质生产能力的微生物”可以指在微生物用于发酵方法的情况下能够通过发酵生产目标物质的微生物。也就是说,短语“具有目标物质生产能力的微生物”可以指能够从碳源生产目标物质的微生物。具体而言,短语“具有目标物质生产能力的微生物”可以指当在含有碳源的培养基等培养基中培养时能够在培养基中以一定程度生产并积累目标物质,从而可以从培养基中收集目标物质的微生物。
短语“具有目标物质生产能力的微生物”还可以指在将微生物用于生物转化方法的情况下能够通过生物转化生产目标物质的微生物。也就是说,短语“具有目标物质生产能力的微生物”可以指能够从目标物质的前体生产目标物质的微生物。具体而言,短语“具有目标物质生产能力的微生物”可以指当在含有目标物质的前体的培养基中培养时,能够在培养基中以一定程度生产并积累目标物质,从而可以从培养基中收集目标物质的微生物。具体而言,短语“具有目标物质生产能力的微生物”还可以指能够在被允许作用于反应混合物中的目标物质的前体时在反应混合物中以一定程度生产和积累目标物质,从而可以从反应混合物中收集目标物质的微生物。
具有目标物质生产能力的微生物可以是能够在培养基或反应混合物中以比用非修饰菌株可以获得的量更大的量生产和积累目标物质的微生物。非修饰的菌株也可以称为“非修饰的微生物的菌株”。短语“非修饰微生物的菌株”或“非修饰的菌株”可以指尚未以L-半胱氨酸生物合成酶的活性得以增加的方式进行修饰的对照菌株。具有目标物质生产能力的微生物可以能够在培养基或反应混合物中以例如0.01g/L以上、0.05g/L以上或0.09g/L以上的量积累目标物质。
目标物质可以选自L-甲硫氨酸和需要S-腺苷甲硫氨酸(SAM)进行生物合成的代谢物。需要SAM进行生物合成的代谢物的实例可以包括例如香草醛、香草酸、褪黑激素、麦角硫因、麦根酸、阿魏酸、多胺、愈创木酚、4-乙烯基愈创木酚、4-乙基愈创木酚和肌酸。微生物可以能够仅产生一种目标物质的能力,或者可以能够产生两种或更多种目标物质的能力。此外,微生物可以能够从目标物质的一种前体或目标物质的两种或更多种前体产生目标物质的能力。
当目标物质是能够形成盐的化合物时,目标物质可以作为游离化合物,其盐或它们的混合物获得。也就是说,除非另有说明,术语“目标物质”可以指游离形式的目标物质、其盐或其混合物。盐的实例可以包括例如硫酸盐,盐酸盐,碳酸盐,铵盐,钠盐和钾盐。作为目标物质的盐,可以使用一种盐,或者可以组合使用两种或更多种盐。
可以用作亲本菌株以构建如本文中描述的微生物的微生物没有特别限制。微生物的实例可以包括细菌和酵母。
细菌的实例可以包括属于肠杆菌科的细菌和棒状杆菌细菌。
属于肠杆菌科的细菌的实例可以包括属于埃希氏菌属、肠杆菌属(Enterobacter)、泛菌属(Pantoea)、克雷伯氏菌属(Klebsiella)、沙雷菌属(Serratia)、欧文氏菌属(Erwinia)、发光杆菌属(Photorhabdus)、普罗威登斯菌属(Providencia)、沙门氏菌属(Salmonella)、摩根菌属(Morganella)的细菌。具体地,可以使用根据用于NCBI(National Center for Biotechnology Information)数据库的分类学(ncbi.nlm.nih.gov/Taxonomy/Browser/wwwtax.cgi?id=91347)分类为肠杆菌科的细菌。
埃希氏菌属细菌没有特别限制,并且其实例可以包括根据微生物学领域技术人员已知的分类学分类为埃希氏菌属的细菌。埃希氏菌属细菌的实例可以包括例如记载于Neidhardt et al.(Backmann B.J.,1996,Derivations and Genotypes of some mutantderivatives of Escherichia coli K-12,pp.2460-2488,Table 1,In F.D.Neidhardt(编),Escherichia coli and Salmonella Cellular and Molecular Biology/第二版,American Society for Microbiology Press,Washington,D.C.)工作中的那些细菌。埃希氏菌属细菌的实例可以包括例如大肠杆菌。大肠杆菌的具体实例可以包括大肠杆菌K-12菌株,诸如W3110菌株(ATCC 27325)和MG1655菌株(ATCC 47076);大肠杆菌K5菌株(ATCC23506);大肠杆菌B菌株,诸如BL21(DE3)菌株;以及其衍生菌株。
肠杆菌属细菌没有特别限制,并且其实例可以包括根据微生物学领域技术人员已知的分类学分类为肠杆菌属的细菌。肠杆菌属细菌的实例可以包括例如聚团肠杆菌(Enterobacter agglomerans)和产气肠杆菌(Enterobacter aerogenes)。聚团肠杆菌的具体实例可以包括例如聚团肠杆菌ATCC 12287菌株。产气肠杆菌的具体实例可以包括例如产气肠杆菌ATCC 13048菌株、NBRC 12010菌株(Biotechnol.Bioeng.,2007,Mar.27;98(2):340-348)和AJ110637菌株(FERM BP-10955)。肠杆菌属细菌的实例还可以包括例如记载于欧洲专利申请公开(EP-A)No.0952221中的菌株。另外,聚团肠杆菌还可以包括分类为成团泛菌(Pantoea agglomerans)的一些菌株。
泛菌属细菌没有特别限制,并且其实例可以包括根据微生物学领域技术人员已知的分类学分类为泛菌属的细菌。泛菌属细菌的实例可以包括例如菠萝泛菌(Pantoeaananatis)、斯氏泛菌(Pantoea stewartii)、成团泛菌和柠檬泛菌(Pantoea citrea)。菠萝泛菌的具体实例可以包括例如菠萝泛菌LMG20103菌株、AJ13355菌株(FERM BP-6614)、AJ13356菌株(FERM BP-6615)、AJ13601菌株(FERM BP-7207)、SC17菌株(FERM BP-11091)、SC17(0)菌株(VKPM B-9246)和SC17sucA菌株(FERM BP-8646)。一些肠杆菌属细菌和欧文氏菌属细菌重新分类为泛菌属(Int.J.Syst.Bacteriol.,39,337-345(1989);Int.J.Syst.Bacteriol.,43,162-173(1993))。例如,基于16S rRNA等的核苷酸序列分析,一些聚团肠杆菌菌株最近重新分类为成团泛菌、菠萝泛菌、斯氏泛菌等(Int.J.Syst.Bacteriol.,39,337-345(1989))。泛菌属细菌可以包括如上文描述的重新分类为泛菌属的那些细菌。
欧文氏菌属细菌的实例可以包括解淀粉欧文氏菌(Erwinia amylovora)和胡萝卜软腐欧文氏菌(Erwinia carotovora)。克雷伯氏菌属细菌的实例可以包括植物克雷伯氏菌(Klebsiella planticola)。
棒状杆菌细菌的实例可以包括属于棒杆菌属、短杆菌属(Brevibacterium)、细杆菌属(Microbacterium)等的细菌。
此类棒状杆菌细菌的具体实例可以包括以下物种。
嗜乙酰乙酸棒状杆菌(Corynebacterium acetoacidophilum)
醋谷氨酸棒杆菌(Corynebacterium acetoglutamicum)
解烷棒状杆菌(Corynebacterium alkanolyticum)
帚石南棒状杆菌(Corynebacterium callunae)
钝齿棒状杆菌(Corynebacterium crenatum)
谷氨酸棒杆菌(Corynebacterium glutamicum)
百合棒杆菌(Corynebacterium lilium)
栖糖蜜棒杆菌(Corynebacterium melassecola)
热产氨棒状杆菌(Corynebacterium thermoaminogenes)(有效棒杆菌(Corynebacterium efficiens))
力士棒杆菌(Corynebacterium herculis)
二歧短杆菌(Brevibacterium divaricatum)(谷氨酸棒杆菌)
黄色短杆菌(Brevibacterium flavum)(谷氨酸棒杆菌)
未成熟短杆菌(Brevibacterium immariophilum)
乳糖发酵短杆菌(Brevibacterium lactofermentum)(谷氨酸棒杆菌)
玫瑰色短杆菌(Brevibacterium roseum)
解糖短杆菌(Brevibacterium saccharolyticum)
硫殖短杆菌(Brevibacterium thiogenitalis)
产氨短杆菌(Corynebacterium ammoniagenes)(Corynebacterium stationis)
白色短杆菌(Brevibacterium album)
蜡状短杆菌(Brevibacterium cerinum)
嗜氨细杆菌(Microbacterium ammoniaphilum)
棒状杆菌细菌的具体实例可以包括以下菌株。
嗜乙酰乙酸棒杆菌(Corynebacterium acetoacidophilum)ATCC 13870
醋谷氨酸棒杆菌(Corynebacterium acetoglutamicum)ATCC 15806
解烷棒杆菌(Corynebacterium alkanolyticum)ATCC 21511
帚石南棒杆菌(Corynebacterium callunae)ATCC 15991
钝齿棒杆菌(Corynebacterium crenatum)AS1.542
谷氨酸棒杆菌ATCC 13020,ATCC 13032,ATCC 13060,ATCC 13869,FERM BP-734
百合棒杆菌(Corynebacterium lilium)ATCC 15990
栖糖蜜棒杆菌(Corynebacterium melassecola)ATCC 17965
有效棒杆菌(Corynebacterium efficiens)(热产氨棒状杆菌(Corynebacteriumthermoaminogenes))AJ12340(FERM BP-1539)
力士棒杆菌(Corynebacterium herculis)ATCC 13868
二歧短杆菌(Brevibacterium divaricatum)(谷氨酸棒杆菌)ATCC 14020
黄色短杆菌(Brevibacterium flavum)(谷氨酸棒杆菌)ATCC 13826,ATCC 14067,AJ12418(FERM BP-2205)
未成熟短杆菌(Brevibacterium immariophilum)ATCC 14068
乳糖发酵短杆菌(Brevibacterium lactofermentum)(谷氨酸棒杆菌)ATCC 13869
玫瑰色短杆菌(Brevibacterium roseum)ATCC 13825
解糖短杆菌(Brevibacterium saccharolyticum)ATCC 14066
硫殖短杆菌(Brevibacterium thiogenitalis)ATCC 19240
产氨短杆菌(Corynebacterium ammoniagenes)(停滞棒杆菌(Corynebacteriumstationis))ATCC 6871,ATCC 6872
白色短杆菌(Brevibacterium album)ATCC 15111
蜡状短杆菌(Brevibacterium cerinum)ATCC 15112
嗜氨细杆菌(Microbacterium ammoniaphilum)ATCC 15354
棒状杆菌细菌可以包括先前被分类为短杆菌属但目前并入棒状杆菌属中的细菌(Int.J.Syst.Bacteriol.,41,255(1991))。此外,停滞棒杆菌可以包括先前已被分类为产氨棒状杆菌,但目前基于16S rRNA的核苷酸序列分析等重新分类为停滞棒杆菌的细菌(Int.J.Syst.Evol.Microbiol.,60,874-879(2010))。
酵母可以是芽殖酵母或裂殖酵母。酵母可以是单倍体或二倍体以上的多倍体酵母。酵母的实例可包括属于酵母属(Saccharomyces)的酵母,例如酿酒酵母(Saccharomycescerevisiae),属于毕赤酵母属(Pichia)(其也可以称为Wickerhamomyces属)的酵母,如西弗毕赤酵母(Pichia ciferrii),赛道威毕赤酵母(Pichia sydowiorum)和巴斯德毕赤酵母(Pichia pastoris),属于假丝酵母属(Candida)的酵母,诸如实用假性酵母(Candidautilis),属于汉逊酵母属(Hansenula)的酵母,如多形汉逊酵母(Hansenula polymorpha)和属于裂殖酵母(Schizosaccharomyces)的酵母,如粟酒裂殖酵母(Schizosaccharomycespombe)。
这些菌株可以从例如美国典型培养物保藏中心(地址:P.O.Box 1549,Manassas,VA 20108,United States of America;或atcc.org)获得。也就是说,注册号被赋予各自的菌株,并且菌株可以通过使用这些注册号订购(参见atcc.org)。美国典型培养物保藏中心的目录中列出了菌株的注册号。这些菌株也可以从例如菌株保藏的保藏所获得。
微生物固有具有目标物质生产能力,或者可以已经以使它具有目标物质生产能力的方式进行了修饰。具有目标物质生产能力的微生物可以通过赋予如上所述的此类微生物以目标物质生产能力或增强如上提及的此类微生物的目标物质生产能力来获得。
以下,说明赋予或提高目标物质生成能力的方法的具体实例。为了赋予或提高目标物质生产能力,下面举例说明的此类修饰可以独立使用,或者以适当组合使用。
目标物质可以通过参与目标物质生物合成的酶的作用产生。此类酶也可以称为“目标物质生物合成酶”。因此,微生物可以具有目标物质生物合成酶。换言之,微生物可以具有编码目标物质生物合成酶的基因。此类基因也可以称为“目标物质生物合成基因”。微生物可以固有具有目标物质生物合成基因,或者可以已经引入了目标物质生物合成基因。本文解释了用于引入基因的方法。
另外,通过提高目标物质生物合成酶的活性,可以改善微生物的目标物质生产能力。也就是说,赋予或提高目标物质生成能力的方法的实例可以包括提高目标物质生物合成酶的活性的方法。也就是说,微生物可以经修饰而使得增加了目标物质生物合成酶的活性。一种目标物质生物合成酶的活性可以得以增加,或者两种或更多种目标物质生物合成酶的活性可以得以增加。本文描述了用于增加蛋白质(诸如酶等)的活性的方法。通过例如增加编码蛋白质的基因的表达,可以提高蛋白质(诸如酶等)的活性。
目标物质可以从例如碳源和/或目标物质的前体产生。因此,目标物质生物合成酶的实例可以包括例如催化从碳源和/或前体向目标物质转化的酶。例如,3-脱氢莽草酸可以通过部分莽草酸途径产生,其可以包括由3-脱氧-D-阿拉伯糖-庚酮糖酸7-磷酸合酶(DAHP合酶),3-脱氢奎尼酸合酶和3-脱氢奎尼酸脱水酶催化的步骤;可以通过3-脱氢莽草酸脱水酶(DHSD)的作用将3-脱氢莽草酸转化为原儿茶酸;可以通过O-甲基转移酶(OMT)或芳香醛氧化还原酶,诸如芳香羧酸还原酶,ACAR的作用将原儿茶酸分别转化为香草酸或原儿茶醛;以及可以通过ACAR或OMT的作用将香草酸或原儿茶醛转化为香草醛。也就是说,目标物质生物合成酶的具体实例可以包括例如DAHP合酶,3-脱氢奎尼酸合酶,3-脱氢奎尼酸脱水酶,DHSD,OMT和ACAR。
术语“3-脱氧-D-阿拉伯糖-庚酮糖酸7-磷酸合酶(DAHP合酶)”可以指具有催化将D-赤藓糖-4-磷酸和磷酸烯醇丙酮酸转化成3-脱氧-D-阿拉伯糖-庚糖酮酸7-磷酸(DAHP)和磷酸的反应的活性的蛋白质(EC 2.5.1.54)。编码DAHP合酶的基因也可以称为“DAHP合酶基因”。DAHP合酶的实例可以包括分别由aroF、aroG和aroH基因编码的AroF、AroG和AroH蛋白。在这些中,AroG可以作为主要的DAHP合酶发挥功能。DAHP合酶诸如AroF、AroG和AroH蛋白的实例包括各种生物体如肠杆菌科(Enterobacteriaceae)细菌和棒状杆菌细菌的那些。DAHP合酶的具体实例可以包括大肠杆菌天然的AroF、AroG和AroH蛋白。大肠杆菌K-12MG1655菌株天然的aroG基因的核苷酸序列如SEQ ID NO:1所示,并且由该基因编码的AroG蛋白的氨基酸序列如SEQ ID NO:2所示。
DAHP合酶活性可以通过例如将酶与底物,诸如D-赤藓糖-4-磷酸和磷酸烯醇丙酮酸温育并测量DAHP的酶和底物依赖性生成来测量。
术语“3-脱氢奎尼酸合酶”可以指具有催化使DAHP脱磷酸化以产生3-脱氢奎宁酸的反应的活性的蛋白质(EC 4.2.3.4)。编码3-脱氢奎尼酸合酶的基因也可以称为“3-脱氢奎尼酸合酶基因”。3-脱氢奎尼酸合酶的实例可以包括由aroB基因编码的AroB蛋白。3-脱氢奎尼酸合酶如AroB蛋白的实例可以包括各种生物体如肠杆菌科细菌和棒状杆菌细菌天然的那些。3-脱氢奎尼酸合酶的具体实例可以包括大肠杆菌天然的AroB。大肠杆菌K-12MG1655菌株天然的aroB基因的核苷酸序列如SEQ ID NO:3所示,并且由该基因编码的AroB蛋白的氨基酸序列如SEQ ID NO:4所示。
3-脱氢奎尼酸合酶活性可以通过例如将酶与底物,诸如DAHP温育并测量3-脱氢奎宁酸的酶和底物依赖性产生来测量。
术语“3-脱氢奎尼酸脱水酶”可以指具有催化使3-脱氢奎宁酸脱水以生成3-脱氢莽草酸的反应的活性的蛋白质(EC 4.2.1.10)。编码3-脱氢奎尼酸脱水酶的基因也可以称为“3-脱氢奎尼酸脱水酶基因”。3-脱氢奎尼酸脱水酶的实例可以包括由aroD基因编码的AroD蛋白。3-脱氢奎尼酸脱水酶诸如AroD蛋白的实例可以包括各种生物体如肠杆菌科细菌和棒杆菌的那些。3-脱氢奎尼酸脱水酶的具体实例可以包括大肠杆菌天然的AroD蛋白。大肠杆菌K-12MG1655菌株天然的aroD基因的核苷酸序列如SEQ ID NO:5所示,并且由该基因编码的AroD蛋白的氨基酸序列如SEQ ID NO:6所示。
3-脱氢奎尼酸脱水酶活性可以通过例如将酶与底物,诸如3-脱氢奎宁酸温育并测量3-脱氢莽草酸的酶和底物依赖性产生来测量。
术语“3-脱氢草酸脱水酶(DHSD)”可以指具有催化使3-脱氢莽草酸脱水以生成原儿茶酸的反应的活性的蛋白质(EC 4.2.1.118)。编码DHSD的基因也可以称为“DHSD基因”。DHSD的实例可以包括由asbF基因编码的AsbF蛋白。DHSD例如AsbF蛋白的实例包括各种生物体如苏云金芽孢杆菌(Bacillus thuringiensis),粗糙脉孢菌(Neurospora crassa)和Podospora pauciseta天然的那些。苏云金芽孢杆菌BMB171菌株天然的asbF基因的核苷酸序列如SEQ ID NO:7所示,并且由该基因编码的AsbF蛋白的氨基酸序列如SEQ ID NO:8所示。
DHSD活性可以通过例如将酶与底物,诸如3-脱氢莽草酸温育并测量原儿茶酸的酶和底物依赖性产生来测量。
编码莽草酸途径的酶如DAHP合酶,3-脱氢奎尼酸合酶和3-脱氢奎尼酸脱水酶的基因的表达受到酪氨酸阻遏物TyrR阻遏,所述TyrR其由tyrR基因编码。因此,莽草酸途径酶的活性也可以通过降低酪氨酸阻遏物TyrR的活性而增加。大肠杆菌K-12MG1655菌株天然的tyrR基因的核苷酸序列如SEQ ID NO:9所示,并且由该基因编码的TyrR蛋白的氨基酸序列如SEQ ID NO:10所示。
术语“O-甲基转移酶(OMT)”可以指具有在甲基供体存在下催化物质的羟基的甲基化反应的活性的蛋白质(EC 2.1.1.68等)。此活性也可以称为“OMT活性”。编码OMT的基因也可以称为“OMT基因”。根据在如本文中所述的方法中生产目标物质的特定生物合成途径,OMT可以具有需要的底物特异性。例如,当经由原儿茶酸向香草酸的转化生产目标物质时,可以使用至少对原儿茶酸特异性的OMT。此外,例如,当经由原儿茶醛向香草醛的转化生产目标物质时,可以使用至少对原儿茶醛特异性的OMT。也就是说,具体地,术语“O-甲基转移酶(OMT)”可以指具有催化在存在甲基基团供体的情况下使原儿茶酸和/或原儿茶醛甲基化(即间位上的羟基基团的甲基化)以产生香草酸和/或香草醛的反应的活性的蛋白质。OMT可以对作为底物的原儿茶酸和原儿茶醛两者是特异性的,但不一定限于此。也就是说,可以采用具有所需底物特异性的OMT,这取决于在本发明的方法中生产目标物质的生物合成途径的类型。OMT通常可以使用原儿茶酸和原儿茶醛两者作为底物,但是不必然限于此。甲基基团供体的实例可以包括S-腺苷甲硫氨酸(SAM)。OMT的实例可以包括各种生物体天然的OMT,诸如智人(Homo sapiens)(Hs)天然的OMT(GenBank登录号NP_000745和NP_009294)、拟南芥(Arabidopsis thaliana)天然的OMT(GenBank登录号NP_200227和NP_009294)、Fragaria xananassa天然的OMT(GenBank登录号AAF28353)以及WO2013/022881A1中示例的哺乳动物、植物和微生物的其他各种OMT。对于智人天然的OMT基因,已知四种转录物变体和两种OMT同种型。这四种转录物变体(转录物变体1-4,GenBank登录号NM_000754.3,NM_001135161.1,NM_001135162.1和NM_007310.2)的核苷酸序列显示为SEQ ID NO:11至14,较长OMT同种型(MB-COMT,GenBank登录号NP_000745.1)的氨基酸序列如SEQ ID NO:15所示,并且较短OMT同种型(S-COMT,GenBank登录号NP_009294.1)的氨基酸序列如SEQ ID NO:16所示。SEQ IDNO:16对应于截短了N端的50个氨基酸残基的SEQ ID NO:15。OMT的实例可以进一步包含拟杆菌门(Bacteroidetes)细菌,即属于拟杆菌门的细菌天然的OMT。拟杆菌门细菌的实例可以包括属于Niastella、Terrimonas、Chitinophaga等属的细菌(International Journalof Systematic and Evolutionary Microbiology(2007),57,1828-1833)。Niastella细菌的实例可以包括Niastella koreensis。Niastella koreensis天然的OMT基因的核苷酸序列以SEQ ID NO:142显示,并且由此基因编码的OMT的氨基酸序列以SEQ ID NO:143显示。
OMT还可以催化原儿茶酸和/或原儿茶醛的甲基化反应以产生异香草酸和/或异香草醛(即对位羟基的甲基化)作为副反应。OMT可以选择性催化间位羟基的甲基化的。表述“选择性催化间位羟基的甲基化”可以意味着OMT选择性地从原儿茶酸生成香草酸的OMT和/或选择性地从原儿茶醛生成香草醛的OMT。表述“从原儿茶酸选择性产生香草酸”可以表示当允许OMT作用于原儿茶酸时按摩尔比计,OMT产生香草酸的量为异香草酸的量的例如3倍或更多,5倍或更多,10倍或更多,15倍或更多,20倍或更多,25倍或更多,或30倍或更多。此外,表述“从原儿茶醛选择性产生香草酸”可以表示当允许OMT作用于原儿茶醛时按摩尔比计,OMT产生香草醛的量为异香草酸的量的例如3倍或更多,5倍或更多,10倍或更多,15倍或更多,20倍或更多,25倍或更多,或者30倍或更多。选择性催化间位羟基甲基化的OMT的实例可以包括本文所述的具有“特定突变”的OMT。
具有“特定突变”的OMT也可以称为“突变体OMT”。编码突变体OMT的基因也可以称为“突变体OMT基因”。
不具有“特定突变”的OMT也可以称为“野生型OMT”。编码野生型OMT的基因也可以称为“野生型OMT基因”。本文中提及的术语“野生型”是为了方便将“野生型”OMT与“突变体”OMT区分开而使用,并且“野生型”OMT不限于作为天然物质获得的那些,并且可以包括任何没有“特定突变”的OMT。野生型OMT的实例可以包括例如上面例示的OMT。另外,上述例示的所有OMT保守变体应当认为包括在野生型OMT中,条件是此类保守变体不具有“特定突变”。
“特定突变”的实例可以包括WO2013/022881A1中描述的突变体OMT中包含的突变。也就是说,“特定突变”的实例可以包括野生型OMT的198位亮氨酸残基(L198)被比亮氨酸残基的疏水性指数(hydrophobic index)具有更低疏水性指数(亲水性指数(hydropathyindex))的氨基酸残基取代的突变,以及野生型OMT的199位谷氨酸残基(E199)被在pH7.4具有中性或正侧链电荷的氨基酸残基取代的突变。突变体OMT可以具有这些突变中的一个或两者。
“比亮氨酸残基的疏水性指数具有更低疏水性指数(亲水指数)的氨基酸残基”的实例可以包括Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Lys,Met,Phe,Pro,Ser,Thr,Trp和Tyr。作为“比亮氨酸残基的疏水性指数具有更低疏水性指数(亲水指数)的氨基酸残基”,特别地优选选自Ala,Arg,Asn,Asp,Glu,Gln,Gly,His,Lys,Met,Pro,Ser,Thr,Trp和Tyr的氨基酸残基,并且Tyr是更具体的实例。
“在pH7.4具有中性或正侧链电荷的氨基酸残基”可以包括Ala,Arg,Asn,Cys,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val。作为“在pH7.4具有中性或正侧链电荷的氨基酸残基”,Ala和Gln是具体的实例。
任意的野生型OMT中的“L198”和“E199”可以指“与以SEQ ID NO:16所示的氨基酸序列的第198位的亮氨酸残基对应的氨基酸残基”和“与以SEQ ID NO:16所示的氨基酸序列的第199位谷氨酸残基对应的氨基酸残基”。这些氨基酸残基的位置表示相对位置,并且其绝对位置可以由于氨基酸残基的缺失,插入,添加等而改变。例如,若在SEQ ID NO:16所示的氨基酸序列中的位置X的N端侧的位置缺失或插入一个氨基酸残基,则原来在位置X处的氨基酸残基重新定位在位置X-1或X+1,但仍被认为是“与SEQ ID NO:16所示的氨基酸序列的X位的氨基酸残基对应的氨基酸残基”。此外,虽然“L198”和“E199”通常分别是亮氨酸残基和谷氨酸残基,但它们可以不是亮氨酸残基和谷氨酸残基。也就是说,当“L198”和“E199”分别不是亮氨酸残基和谷氨酸残基时,“特定突变”可以包括那些氨基酸残基各自被任何上述氨基酸残基替换的突变。
在任意OMT的氨基酸序列中,哪个氨基酸残基为对应于“L198”或“E199”的氨基酸残基可以通过将任意OMT的氨基酸序列和SEQ ID NO:16的氨基酸序列比对确定。比对可以通过例如使用已知的基因分析软件来进行。此类软件的具体实例可以包括由HitachiSolutions生产的DNASIS,Genetyx生产的GENETYX等(Elizabeth C.Tyler et al.,Computers and Biomedical Research,24(1)72-96,1991;Barton GJ et al.,Journal ofMolecular Biology,198(2),327-37,1987)。
例如,可以通过修饰野生型OMT基因使得由其编码的OMT具有“特定突变”来获得突变体OMT基因。待修饰的野生型OMT基因可以通过例如从具有野生型OMT基因的生物体的克隆或化学合成来获得。此外,也可以不使用野生型OMT基因而获得突变体OMT基因。例如,可以通过化学合成直接获得突变体OMT基因。获得的突变OMT基因可以原样使用,或者在使用前进一步修饰。
基因可以使用已知的方法进行修饰。例如,可以通过位点特异性诱变方法将目标突变引入DNA的靶位点中。位点特异性诱变方法的实例可以包括使用PCR的方法(Higuchi,R.,61,于PCR Technology,Erlich,H.A.编,Stockton Press(1989);Carter P.,Meth.InEnzymol.,154,382(1987));以及使用噬菌体的方法(Kramer,W.and Frits,H.J.,Meth.inEnzymol.,154,350(1987);Kunkel,T.A.et al.,Meth.in Enzymol.,154,367(1987))。
可以通过例如在SAM存在下将酶与底物,诸如原儿茶酸或原儿茶醛温育并测量相应产物,诸如香草酸或香草醛的酶和底物依赖性产生来测量OMT活性(WO2013/022881A1)。此外,通过在相同条件下测量相应副产物,诸如异香草酸或异香草醛的产生,并将副产物的产生与产物的产生进行比较,可以确定OMT是否选择性地生成产物。
术语“芳族醛氧化还原酶(芳族羧酸还原酶;ACAR)”可以指具有催化在电子供体和ATP存在下还原香草酸和/或原儿茶酸的反应以产生香草醛和/或原儿茶醛的活性的蛋白质(EC 1.2.99.6等)。此活性也可以称为“ACAR活性”。编码ACAR的基因也可称为“ACAR基因”。ACAR通常可以使用香草酸和原儿茶酸两者作为底物,但不必限于此。也就是说,ACAR可以具有需要的底物特异性,这取决于在如本文所述的方法中生产目标物质的特定生物合成途径。例如,当通过香草酸向香草醛的转化来生产目标物质时,可以使用至少对香草酸特异性的ACAR。另外,例如,当通过原儿茶酸向原儿茶醛的转化来生产目标物质时,可以使用至少对原儿茶酸特异性的ACAR。电子供体的实例可以包括NADH和NADPH。ACAR的实例可以包括各种生物体如诺卡尔菌属种(Nocardia sp.)菌株NRRL 5646、放线菌属种(Actinomycessp.)、热乙酸梭菌(Clostridium thermoaceticum)、黑曲霉(Aspergillus niger)、甜瓜棒孢(Corynespora melonis)、云芝属种(Coriolus sp.)和链孢霉属种(Neurospora sp.)天然的ACAR(J.Biol.Chem.,2007,Vol.282,No.1,pp.478-485)。诺卡尔菌属种菌株NRRL 5646已被分类为艾阿华诺卡氏菌(Nocardia iowensis)。ACAR的实例还可包括其他诺卡氏菌细菌,例如巴西诺卡氏菌(Nocardia brasiliensis)和伤口诺卡氏菌(Nocardia vulneris)的ACAR。巴西诺卡氏菌ATCC 700358天然的ACAR基因的核苷酸序列以SEQ ID NO:17显示,并且由此基因编码的ACAR的氨基酸序列以SEQ ID NO:18显示。巴西诺卡氏菌ATCC 700358天然的变体ACAR基因的实例的核苷酸序列以SEQ ID NO:19显示,并且由此基因编码的ACAR的氨基酸序列以SEQ ID NO:20显示。
ACAR活性可以通过例如在ATP和NADPH存在下将酶与底物,诸如香草酸或原儿茶酸一起温育,并且测量NADPH的酶和底物依赖性氧化来测量(J.Biol.Chem.,2007,Vol.282,No.1,pp.478-485中描述的方法的修改)。
可以通过磷酸泛酰巯基乙胺化(phosphopantetheinylation)将ACAR变为活性酶(J.Biol.Chem.,2007,Vol.282,No.1,pp.478-485)。因此,ACAR活性也可以通过增加催化蛋白质的磷酸泛酰巯基乙胺化的酶(其也可以称为“磷酸泛酰巯基乙胺基化酶”)的活性来增加。也就是说,赋予或提高目标物质生产能力的方法的实例可以包括增加磷酸泛酰巯基乙胺基化酶的活性的方法。也就是说,微生物可以以使磷酸泛酰巯基乙胺基化酶的活性得以增加的方式进行了修饰。磷酸泛酰巯基乙胺基化酶的实例可以包括磷酸泛酰巯基乙胺基转移酶(PPT)。
术语“磷酸泛酰巯基乙胺基转移酶(PPT)”可以指具有在磷酸泛酰巯基乙胺基供体存在下催化使ACAR磷酸泛酰巯基乙胺化的反应的活性的蛋白质。此活性也可以称为“PPT活性”。编码PPT的基因也可以称为“PPT基因”。磷酸泛酰巯基乙胺基供体的实例可以包括辅酶A(CoA)。PPT的实例可以包括EntD蛋白,其由entD基因编码。PPT例如EntD蛋白质的实例可以包括各种生物体天然的那些。PPT的具体实例可以包括大肠杆菌天然的EntD蛋白。大肠杆菌K-12MG1655菌株的entD基因的核苷酸序列如SEQ ID NO:21所示,并且由该基因编码的EntD蛋白的氨基酸序列如SEQ ID NO:22所示。PPT的具体实例还可以包括巴西诺卡菌天然的PPT,皮疽诺卡菌(Nocardia farcinica)IFM10152天然的PPT(J.Biol.Chem.,2007,Vol.282,No.1,pp.478-485)和谷氨酸棒杆菌天然的PPT(App.Env.Microbiol.2009,Vol.75,No.9,pp.2765-2774)。谷氨酸棒杆菌ATCC 13032菌株天然的PPT基因的核苷酸序列如SEQ ID NO:23所示,并且由该基因编码的PPT的氨基酸序列如SEQ ID NO:24所示。
PPT活性可以基于例如在CoA存在下与ACAR温育时观察到的ACAR活性的增强来测量(J.Biol.Chem.,2007,Vol.282,No.1,pp.478-485)。
褪黑激素可以从L-色氨酸生产。也就是说,目标物质生物合成酶的实例还可以包括例如L-色氨酸生物合成酶和催化L-色氨酸转化成褪黑激素的酶。L-色氨酸生物合成酶的实例可以包括芳香族氨基酸的常见生物合成酶,例如3-脱氧-D-阿拉伯糖庚酮糖酸-7-磷酸合酶(aroF,aroG,aroH),3-脱氢喹啉合酶(aroB),3-脱氢喹啉脱水酶(aroD),莽草酸脱氢酶(aroE),莽草酸激酶(aroK,aroL),5-烯醇丙酮酰莽草酸-3-磷酸合酶(aroA)和分支酸合酶(aroC);以及邻氨基苯甲酸合酶(trpED)和色氨酸合酶(trpAB)。在酶的名称之后的括号中显示了编码酶的基因的名称的实例(这在下文也适用于相同的情况)。通过色氨酸5-羟化酶(EC 1.14.16.4),5-羟色氨酸脱羧酶(EC 4.1.1.28),芳烷基胺N-乙酰转移酶(AANAT;EC2.3.1.87)和乙酰血清素O-甲基转移酶(EC 2.1.1.4)的作用,L-色氨酸可以依次转化为羟色氨酸,5-羟色胺,N-乙酰血清素和褪黑激素。也就是说,催化L-色氨酸转化为褪黑激素的酶的实例可以包括这些酶。值得注意的是,乙酰血清素O-甲基转移酶是OMT的一个实例,其催化使用SAM作为甲基供体使N-乙酰血清素甲基化以产生褪黑激素的反应。
麦角硫因可以从L-组氨酸生产。也就是说,目标物质生物合成酶的实例还可以包括例如L-组氨酸生物合成酶和催化L-组氨酸转化为麦角硫因的酶。L-组氨酸生物合成酶的实例可以包括ATP磷酸核糖基转移酶(hisG),磷酸核糖基AMP环化水解酶(hisI),磷酸核糖基-ATP焦磷酸水解酶(hisI),磷酸核糖基亚胺甲基-5-氨基咪唑甲酰胺核苷酸异构酶(phosphoribosylformimino-5-aminoimidazole carboxamide ribotide isomerase)(hisA),氨基转移酶(hisH),磷酸组氨醇氨基转移酶(hisC),组氨醇磷酸酶(hisB)和组氨醇脱氢酶(hisD)。L-组氨酸可以通过分别由egtB、egtC、egtD和egtE基因编码的EgtB、EgtC、EgtD和EgtE蛋白的作用连续转化为组氨酸三甲基内盐(hercynine),hercynyl-γ-L-谷氨酰-L-半胱氨酸亚砜,hercynyl-L-半胱氨酸亚砜和麦角硫因。组氨酸三甲基内盐还可以通过由egt1基因编码的Egt1蛋白的作用转化为hercynyl-L-半胱氨酸亚砜。也就是说,催化L-组氨酸转化为麦角硫因的酶的实例可以包括这些酶。值得注意的是,EgtD是S-腺苷-1-甲硫氨酸(SAM)依赖性组氨酸N,N,N-甲基转移酶,其催化使用SAM作为甲基供体使组氨酸甲基化以产生组氨酸三甲基内盐的反应。
愈创木酚可以从香草酸生产。因此,上述关于香草酸的目标物质生物合成酶的描述可以在必要修饰后适用于愈创木酚的目标物质生物合成酶。香草酸可以通过香草酸脱羧酶(VDC)的作用转化为愈创木酚。也就是说,目标物质生物合成酶的实例还可以包括VDC。
阿魏酸、4-乙烯基愈创木酚和4-乙基愈创木酚可以从L-苯丙氨酸或L-酪氨酸生产。也就是说,目标物质生物合成酶的实例还可以包括例如L-苯丙氨酸生物合成酶,L-酪氨酸生物合成酶,以及催化L-苯丙氨酸或L-酪氨酸转化为阿魏酸,4-乙烯基愈创木酚或4-乙基愈创木酚的酶。L-苯丙氨酸生物合成酶的实例可包括上文例示的芳香族氨基酸的常见生物合成酶,以及分支酸变位酶(pheA),预苯酸脱水酶(pheA)和酪氨酸氨基转移酶(tyrB)。分支酸变位酶和预苯酸脱水酶可以由pheA基因编码为双功能酶。L-酪氨酸生物合成酶的实例可以包括上文例示的芳香族氨基酸的常见生物合成酶,以及分支酸变位酶(tyrA),预苯酸脱氢酶(tyrA)和酪氨酸氨基转移酶(tyrB)。分支酸变位酶和预苯酸脱氢酶可以由tyrA基因编码为双功能酶。L-苯丙氨酸可以通过苯丙氨酸脱氨酶(PAL;EC 4.3.1.24)的作用转化为肉桂酸,然后通过肉桂酸4-羟化酶(C4H;EC 1.14.13.11)的作用转化为对香豆酸。此外,L-酪氨酸可通过酪氨酸脱氨酶(TAL;EC 4.3.1.23)的作用转化为对香豆酸。对香豆酸可以分别通过羟基肉桂酸3-羟化酶(C3H),O-甲基转移酶(OMT),阿魏酸脱羧酶(FDC)和乙烯基苯酚还原酶(VPR)的作用连续转化为咖啡酸,阿魏酸,4-乙烯基愈创木酚和4-乙基愈创木酚。也就是说,催化L-苯丙氨酸或L-酪氨酸转化为阿魏酸,4-乙烯基愈创木酚或4-乙基愈创木酚的酶的实例可以包括这些酶。为了生产阿魏酸,4-乙烯基愈创木酚或4-乙基愈创木酚,可以使用至少使用咖啡酸的OMT。
多胺可以从L-精氨酸或L-鸟氨酸生产。也就是说,目标物质生物合成酶的实例还可包括,例如,L-精氨酸生物合成酶,L-鸟氨酸生物合成酶,以及催化L-精氨酸或L-鸟氨酸转化为多胺的酶。L-鸟氨酸生物合成酶的实例可包括N-乙酰谷氨酸合酶(argA),N-乙酰谷氨酸激酶(argB),N-乙酰谷氨酰磷酸还原酶(argC),乙酰鸟氨酸转氨酶(argD)和乙酰鸟氨酸脱乙酰酶(argE)。L-精氨酸生物合成酶的实例可包括上文例示的L-鸟氨酸生物合成酶,以及氨甲酰磷酸合成酶(carAB),鸟氨酸氨甲酰转移酶(argF,argI),精氨琥珀酸合成酶(argG),精氨基琥珀酸裂合酶(argH)。L-精氨酸可以通过精氨酸脱羧酶(speA;EC4.1.1.19)的作用转化为胍丁胺,然后通过胍丁胺尿素水解酶(speB;EC3.5.3.11)的作用转化为腐胺。此外,L-鸟氨酸可以通过鸟氨酸脱羧酶(speC;EC4.1.1.17)的作用转化为腐胺。腐胺可以通过亚精胺合酶(speE;EC 2.5.1.16)的作用转化为亚精胺,然后通过精胺合成酶(EC 2.5.1.22)的作用转化为精胺。胍丁胺也可以通过胍丁胺/三胺氨基丙基转移酶的作用转化为氨基丙基胍丁胺,然后通过氨基丙基胍丁胺尿素水解酶的作用转化为亚精胺。也就是说,催化L-精氨酸或L-鸟氨酸转化为多胺的酶的实例可以包括这些酶。值得注意的是,亚精胺合酶,精胺合成酶和胍丁胺/三胺氨基丙基转移酶各自催化将来自脱羧的S-腺苷甲硫氨酸(dcSAM)(其可以通过脱羧作用从SAM产生)的丙胺基团转移到相应的底物中的反应。
肌酸可以从L-精氨酸和甘氨酸生产。也就是说,目标物质生物合成酶的实例还可以包括例如L-精氨酸生物合成酶,甘氨酸生物合成酶和催化L-精氨酸和甘氨酸转化成肌酸的酶。可以将L-精氨酸和甘氨酸组合以通过精氨酸:甘氨酸脒基转移酶(AGAT,EC 2.1.4.1)的作用产生胍基乙酸(guanidinoacetate)和鸟氨酸;使用SAM作为甲基供体,可以通过胍基乙酸N-甲基转移酶(GAMT,EC 2.1.1.2)的作用使胍基乙酸甲基化以生成肌酸。也就是说,催化L-精氨酸和甘氨酸转化为肌酸的酶的实例可包括这些酶。
麦根酸可以从SAM生产。也就是说,目标物质生物合成酶的实例还可以包括例如催化SAM转化为麦根酸的酶。可以通过烟草胺(nicotianamine)合酶(EC 2.5.1.43)的作用从三个SAM分子合成一个烟草胺分子。烟草胺可以通过烟草胺转氨酶(EC 2.6.1.80)、3"-脱氨基-3"-氧烟草胺(oxonicotianamine)还原酶(EC 1.1.1.285)和2'-脱氧麦根酸2'-双加氧酶(EC 1.14.11.24)的作用连续转化为3"-脱氨基-3"-氧烟草胺、2'-脱氧麦根酸和麦根酸。也就是说,催化SAM转化为麦根酸的酶的实例可以包括这些酶。
L-甲硫氨酸可以从L-半胱氨酸生产。也就是说,目标物质生物合成酶的实例还可包括,例如,L-半胱氨酸生物合成酶和催化L-半胱氨酸转化为L-甲硫氨酸的酶。L-半胱氨酸生物合成酶的实例可包括本文中描述的CysIXHDNYZ蛋白、Fpr2蛋白和CysK蛋白码。催化L-半胱氨酸转化为L-甲硫氨酸的酶的实例可包括胱硫醚-γ-合酶和胱硫醚-β-裂合酶。
用于赋予或提高目标物质生产能力的方法的实例还可以包括提高目标物质以外物质,例如在生产目标物质期间作为中间产物生成的物质和用作目标物质前体的物质的摄取系统的活性的方法。也就是说,本发明的细菌可以以使此类摄取系统的活性得以增加的方式进行了修饰。术语“物质的摄取系统”可以指具有将来自细胞外部的物质掺入细胞的功能的蛋白质。此活性也可以称为“物质的摄取活性”。编码此类摄取系统的基因也可以称为“摄取系统基因”。此类摄取系统的实例可以包括香草酸摄取系统和原儿茶酸摄取系统。香草酸摄取系统的实例可以包括由vanK基因编码的VanK蛋白(M.T.Chaudhry,et al.,Microbiology,2007,153:857-865)。谷氨酸棒杆菌ATCC13869菌株天然的vanK基因(NCgl2302)的核苷酸序列如SEQ ID NO:25所示,并且由该基因编码的VanK蛋白的氨基酸序列如SEQ ID NO:26所示。原儿茶酸摄取系统基因可以包括由pcaK基因编码的PcaK蛋白(M.T.Chaudhry,et al.,Microbiology,2007,153:857-865)。谷氨酸棒杆菌ATCC13869菌株天然的pcaK基因(NCgl1031)的核苷酸序列如SEQ ID NO:27所示,并且由该基因编码的PcaK蛋白的氨基酸序列如SEQ ID NO:28所示。
可以根据例如已知方法(M.T.Chaudhry,et al.,Microbiology,2007.153:857-865)测量物质的摄取活性。
用于赋予或提高目标物质生产能力的方法的实例还可以包括降低参与目标物质以外的物质的副生成的酶的活性的方法。除了目标物质以外的此类物质也可以称为“副产物”。此类酶也可以称为“副产物生成酶”。副产物生成酶的实例可以包括例如参与目标物质利用的酶和催化远离目标物质的生物合成途径分支的反应以产生除目标物质之外的物质的酶。本文描述了降低蛋白质诸如酶等的活性的方法。通过例如破坏编码蛋白质的基因可以降低蛋白质诸如酶等的活性。例如,据报道,在棒状杆菌细菌中,香草醛按香草醛->香草酸->原儿茶酸的顺序代谢并利用(Current Microbiology,2005,Vol.51,pp.59-65)。也就是说,副产物生成酶的具体实例可以包括催化香草醛转化为原儿茶酸的酶和催化原儿茶酸进一步代谢的酶。此类酶的实例可以包括香草酸脱甲基酶,原儿茶酸3,4-双加氧酶,以及将原儿茶酸3,4-双加氧酶的反应产物进一步分解为琥珀酰-CoA和乙酰-CoA的各种酶(Appl.Microbiol.Biotechnol.,2012,Vol.95,p77-89)。此外,可以通过醇脱氢酶的作用将香草醛转化成香草醇(Kunjapur AM.et al.,J.Am.Chem.Soc.,2014,Vol.136,p11644-11654.;Hansen EH.et al.,App.Env.Microbiol.,2009,Vol.75,p2765-2774.)。也就是说,副产物生成酶的具体实例也可以包括醇脱氢酶(ADH)。此外,作为香草酸和香草醛生物合成途径中间体的3-脱氢莽草酸也可以通过莽草酸脱氢酶的作用转化为莽草酸。也就是说,副产物生成酶的具体实例还可以包括莽草酸脱氢酶。
术语“香草酸脱甲基酶”可以指具有催化香草酸脱甲基化生成原儿茶酸的反应的活性的蛋白质。此活性也可以称为“香草酸脱甲基酶活性”。编码香草酸脱甲基酶的基因也可以称为“香草酸脱甲基酶基因”。香草酸脱甲基酶的实例可以包括由vanAB基因编码的VanAB蛋白(Current Microbiology,2005,Vol.51,pp.59-65)。vanA基因和vanB基因分别编码香草酸脱甲基酶的亚基A和亚基B。为了降低香草酸脱甲基酶活性,这两种vanAB基因可以被破坏等,或者两者中仅一种可以被破坏等。谷氨酸棒杆菌ATCC13869天然菌株的vanAB基因的核苷酸序列分别如SEQ ID NO:29和31所示,并且由这些基因编码的VanAB蛋白的氨基酸序列分别如SEQ ID NO:30和32所示。vanAB基因通常与vanK基因一起构成vanABK操纵子。因此,为了降低香草酸脱甲基酶活性,vanABK操纵子可以被完全破坏等(例如缺失)。在此类情况下,可以将vanK基因再引入宿主。例如,当使用存在于细胞外的香草酸,并且vanABK操纵子完全被破坏等(例如缺失)时,优选再引入vanK基因。
香草酸脱甲基酶活性可以通过例如将酶与底物诸如香草酸温育并测量原儿茶酸的酶和底物依赖性产生来测量(J Bacteriol,2001,Vol.183,p3276-3281)。
术语“原儿茶酸3,4-双加氧酶”可以指具有催化氧化原儿茶酸反应生成β-羧基-顺,顺-粘康酸的反应活性的蛋白质。此活性也可以称为“原儿茶酸3,4-双加氧酶活性”。编码原儿茶酸3,4-双加氧酶的基因也可以称为“原儿茶酸3,4-双加氧酶基因”。原儿茶酸3,4-双加氧酶的实例可以包括由pcaGH基因编码的PcaGH蛋白(Appl.Microbiol.Biotechnol.,2012,Vol.95,p77-89)。pcaG基因和pcaH基因分别编码原儿茶酸3,4-双加氧酶的α亚基和β亚基。为了降低原儿茶酸3,4-双加氧酶活性,这两种pcaGH基因可以被破坏等,或者两者中仅一种可以被破坏等。谷氨酸棒杆菌ATCC 13032菌株天然的pcaGH基因的核苷酸序列分别如SEQ ID NO:33和35所示,并且由这些基因编码的PcaGH蛋白的氨基酸序列分别如SEQ IDNO:34和36所示。
原儿茶酸3,4-双加氧酶活性可以通过例如将酶与底物诸如原儿茶酸温育并测量酶和底物依赖性氧消耗量来测量(Meth.Enz.,1970,Vol.17A,p526-529)。
术语“醇脱氢酶(ADH)”可以指具有在电子供体存在下催化醛还原以产生醇的反应的活性的蛋白质(EC 1.1.1.1,EC 1.1.1.2,EC 1.1.1.71等)。此活性也可以称为“ADH活性”。编码ADH的基因也可以称为“ADH基因”。电子供体的实例可以包括NADH和NADPH。
作为ADH,具有在电子供体存在下催化还原香草醛的反应以产生香草醇的活性的ADH是一个特别的例子。该活性也可以特别称为“香草醇脱氢酶活性”。此外,具有香草醇脱氢酶活性的ADH也可以特别称为“香草醇脱氢酶”。作为ADH,具有催化在电子供体存在下还原香草醛以产生香草醇的反应的活性的ADH是具体的实例。此活性也可以特别称为“香草醇脱氢酶活性”。此外,具有香草醇脱氢酶活性的ADH也可以特别称为“香草醇脱氢酶”。
ADH的实例可以包括分别由yqhD基因,NCgl0324基因,NCgl0313基因,NCgl2709基因,NCgl0219基因和NCgl2382基因编码的YqhD蛋白,NCgl0324蛋白质,NCgl0313蛋白质,NCgl2709蛋白质,NCgl0219蛋白质和NCgl2382蛋白质。yqhD基因和NCgl0324基因编码香草醇脱氢酶。yqhD基因可以在例如属于肠杆菌科的细菌,诸如大肠杆菌中找到。NCgl0324基因,NCgl0313基因,NCgl2709基因,NCgl0219基因和NCgl2382基因可以例如在棒状杆菌细菌例如谷氨酸棒杆菌中找到。大肠杆菌K-12MG1655菌株天然的yqhD基因的核苷酸序列如SEQID NO:37所示,并且由此基因编码的YqhD蛋白的氨基酸序列以SEQ ID NO:38所示。谷氨酸棒杆菌ATCC13869菌株天然的NCgl0324基因,NCgl0313基因和NCgl2709基因的核苷酸序列分别如SEQ ID NO:39,41和43所示,并且由这些基因编码的蛋白质的氨基酸序列分别如SEQID NO:40,42和44所示。谷氨酸棒杆菌ATCC 13032菌株天然的NCgl0219基因和NCgl2382基因的核苷酸序列分别如SEQ ID NO:45和47所示,并且由这些基因编码的蛋白质的氨基酸序列如SEQ ID NO:46和48所示。
可以降低一种ADH的活性,或者可以降低两种或更多种ADH的活性。例如,可以降低诸如NCgl0324蛋白质,NCgl2709蛋白质和NCgl0313蛋白质中的一种或多种的活性。特别地,可以至少降低NCgl0324蛋白质的活性。
ADH活性可以通过例如在NADPH或NADH存在下将酶与底物(诸如醛,如香草醛)一起温育,并测量NADPH或NADH的酶和底物依赖性氧化来测量。
术语“莽草酸脱氢酶”可以指具有催化在电子供体存在下还原3-脱氢莽草酸以产生莽草酸的反应的活性的蛋白质(EC 1.1.1.25)。该活性也可称为“莽草酸脱氢酶活性”。编码莽草酸脱氢酶的基因也可称为“莽草酸脱氢酶基因”。电子供体的实例可包括NADH和NADPH。莽草酸脱氢酶的实例可包括AroE蛋白,其由aroE基因编码。大肠杆菌K-12MG1655菌株天然的aroE基因的核苷酸序列如SEQ ID NO:49所示,并且由该基因编码的AroE蛋白的氨基酸序列如SEQ ID NO:50所示。
莽草酸脱氢酶活性可以通过例如在NADPH或NADH存在下将酶与底物诸如3-脱氢莽草酸一起温育,并测量NADPH或NADH的酶和底物依赖性氧化来测量。
用于赋予或增强目标物质生产能力的方法的实例还可以包括降低NCgl2048蛋白的活性的方法。
术语“NCgl2048蛋白”可以指由NCgl2048基因编码的蛋白质。NCgl2048蛋白的实例可以包括各种生物体,诸如肠杆菌科细菌和棒状杆菌细菌天然的那些蛋白质。NCgl2048蛋白的具体实例可以包括谷氨酸棒杆菌天然的NCgl2048蛋白。谷氨酸棒杆菌ATCC 13869菌株天然的NCgl2048基因的核苷酸序列以SEQ ID NO:133显示,并且由此基因编码的蛋白质的氨基酸序列以SEQ ID NO:134显示。顺便提及,关于本文中所述的保守变体,NCgl2048蛋白的原始功能可以指具有以SEQ ID NO:134所示的氨基酸序列的蛋白质的功能,或者也可以指微生物中的蛋白质活性降低提供目标物质生产增加的特性。
待修饰活性的蛋白质可以根据产生目标物质的生物合成途径的类型以及选定的微生物中固有存在的蛋白质的类型和活性来适当选择。例如,当通过原儿茶酸的生物转化生产香草醛时,可优选增强OMT,ACAR,PPT和原儿茶酸摄取系统中一种或多种的活性。此外,当通过原儿茶醛生物转化生产香草醛时,可以优选增强OMT的活性。
用于育种出具有目标物质生产能力的微生物的基因和蛋白质可以分别具有例如上面列举的或其他已知的核苷酸序列和氨基酸序列。此外,用于育种出具有目标物质生产能力的微生物的基因和蛋白质可以是上面例示的基因和蛋白质的保守变体,例如分别具有上述例示或其他已知核苷酸序列和氨基酸序列的基因和蛋白质。具体地,例如,用于育种出具有目标物质生产能力的微生物的基因可以各自是编码蛋白质的基因,所述蛋白质具有上述例示的氨基酸序列或已知蛋白质的氨基酸序列但可以包含一个或几个位置处一个或几个氨基酸残基的取代、缺失、插入和/或添加,只要保持蛋白质的原始功能,即其酶活性,转运蛋白活性等即可。对于基因和蛋白质的保守变体,可以在必要修改后应用后面描述的关于L-半胱氨酸生物合成基因和L-半胱氨酸生物合成蛋白的保守变体的描述。
<1-2>L-半胱氨酸生物合成酶活性的增加
微生物可以以L-半胱氨酸生物合成酶的活性得以增加的方式进行修饰。具体地,微生物可以以与非修饰的菌株相比L-半胱氨酸生物合成酶的活性得以增加的方式进行修饰。通过以L-半胱氨酸生物合成酶的活性得以增加的方式修饰微生物,微生物的目标物质生产能力可以得到改善,并且也就是说,可以提高通过使用微生物生产目标物质。此外,通过以L-半胱氨酸生物合成酶的活性得以增加的方式修饰微生物,微生物生成或再生SAM的能力可能得到改善。也就是说,具体地,微生物的目标物质生产能力的增加可以是由于微生物生成或再生SAM的能力增加所致。
可以通过以L-半胱氨酸生物合成酶的活性得以增加的方式修饰具有目标物质生产能力的微生物来获得微生物。微生物也可以通过以L-半胱氨酸生物合成酶的活性得以增加的方式修饰微生物,然后赋予微生物以目标物质生产能力或增强微生物的目标物质生产能力来获得。另外,微生物可以由于增加L-半胱氨酸生物合成酶活性的修饰,或者由于增加L-半胱氨酸生物合成酶活性的修饰和其他用于赋予或增强目标物质生产能力的修饰的组合而具有目标物质生产能力。构建微生物的修饰可以以任意顺序进行。
术语“L-半胱氨酸生物合成酶”可以指参与L-半胱氨酸生物合成的蛋白质。编码L-半胱氨酸生物合成酶的基因也可称为“L-半胱氨酸生物合成基因”。L-半胱氨酸生物合成酶的实例可包括参与硫利用的蛋白质。参与硫利用的蛋白质的实例可包括CysIXHDNYZ蛋白质和Fpr2蛋白质,它们分别由cysIXHDNYZ基因和fpr2基因编码。CysIXHDNYZ蛋白特别涉及无机硫化合物如硫酸盐和亚硫酸盐的还原。特别地,Fpr2蛋白可以参与电子转运以进行亚硫酸盐的还原。L-半胱氨酸生物合成酶的实例还可包括O-乙酰丝氨酸(硫醇)-裂合酶。O-乙酰丝氨酸(硫醇)-裂合酶的实例可包括CysK蛋白,其由cysK基因编码。L-半胱氨酸生物合成酶的实例可包括各种生物体,例如肠杆菌科细菌和棒状杆菌细菌天然的那些。L-半胱氨酸生物合成酶的具体实例可包括谷氨酸棒杆菌天然的CysIXHDNYZ蛋白,Fpr2蛋白和CysK蛋白。谷氨酸棒杆菌ATCC 13869菌株天然的cysIXHDNYZ基因、fpr2基因和cysK基因(NCgl2473)的核苷酸序列分别以SEQ ID NOS:88,90,92,94,96,98,100,102和140显示,并且这些基因编码的蛋白质的氨基酸序列分别以SEQ ID NOS:89,91,93,95,97,99,101,103和141显示。可以增加一种L-半胱氨酸生物合成酶的活性,或者可以增加两种或更多种L-半胱氨酸生物合成酶的活性。例如,可以增加CysIXHDNYZ蛋白、Fpr2蛋白和CysK蛋白中一种或多种的活性,或者可以增加CysIXHDNYZ蛋白和Fpr2蛋白中一种或多种的活性。
L-半胱氨酸生物合成酶的活性可以通过例如增加编码L-半胱氨酸生物合成酶的基因(例如cysIXHDNYZ基因、fpr2基因和cysK基因)的表达来增加。
L-半胱氨酸生物合成基因的表达可以通过例如修饰(例如增加或减少)基因表达调节物的活性来增加。也就是说,L-半胱氨酸生物合成基因的表达可以通过例如增加基因的正表达调节物(例如活化剂)的活性来增加。此外,L-半胱氨酸生物合成基因的表达可以通过例如降低基因的负表达调节物(例如阻遏物)的活性来增加。此类调节物也可称为“调节蛋白”。编码此类调节因子的基因也可称为“调节基因”。
此类活化剂的实例可包括CysR和SsuR蛋白,它们分别由cysR和ssuR基因编码。CysR蛋白活性的增加可导致cysIXHDNYZ基因,fpr2基因和ssuR基因中一种或多种的表达增加。此外,SsuR蛋白活性的增加可以导致参与有机硫化合物利用的基因表达增加。此类活化剂的实例可包括各种生物体,例如肠杆菌科细菌和棒状杆菌的那些活化剂。此类活化剂的具体实例可包括谷氨酸棒杆菌天然的CysR和SsuR蛋白。谷氨酸棒杆菌ATCC 13869菌株天然的cysR基因(NCgl0120)和ssuR基因的核苷酸序列分别以SEQ ID NO:104和106显示,并且由这些基因编码的蛋白质的氨基酸序列分别以SEQ ID NO:105和107显示。可以增加CysR蛋白和SsuR蛋白中的一种或两种的活性。例如,可以至少增加CysR蛋白的活性。可以通过例如增加编码活化剂的基因的表达来增加此类活化剂的活性。
此类阻遏物的实例是McbR蛋白,其由mcbR基因编码。McbR蛋白活性降低可以导致cysR和ssuR基因中一种或多种的表达增加,从而可进一步导致cysIXHDNYZ基因和fpr2基因中一种或多种的表达增加。此类阻遏物的活性可以通过例如降低编码阻遏物的基因的表达或通过破坏编码阻遏物的基因来降低。
也就是说,具体地,可以通过例如增加cysIXHDNYZ基因,fpr2基因,cysR基因和ssuR基因中的一种或多种的表达来增加L-半胱氨酸生物合成酶的活性。因此,短语“L-半胱氨酸生物合成酶的活性得以增加”可以表示例如cysIXHDNYZ基因,fpr2基因,cysR基因和ssuR基因中的一种或多种的表达得以增加。例如,可以至少增加cysR基因的表达。此外,例如,可以增加所有这些基因的表达。可以通过增加cysR基因的表达来增加cysIXHDNYZ基因,fpr2基因和ssuR基因中一种或多种的表达。
L-半胱氨酸生物合成基因或其调节基因可以是例如具有以SEQ ID NO:88,90,92,94,96,98,100,102,104,106或140所示的核苷酸序列的基因。此外,L-半胱氨酸生物合成酶或其调节蛋白可以是例如具有SEQ ID NO:89,91,93,95,97,99,101,103,105,107或141所示氨基酸序列的蛋白质,表述“基因或蛋白质具有核苷酸或氨基酸序列”涵盖当基因或蛋白质包括核苷酸或氨基酸序列时,以及当基因或蛋白质仅包括核苷酸或氨基酸序列时。
L-半胱氨酸生物合成基因或其调节基因可以是上文例示的任何L-半胱氨酸生物合成基因或其调节基因(即cysIXHDNYZ基因,fpr2基因,cysR基因,ssuR基因,mcbR基因和cysK基因)的变体,只要保持其原始功能即可。类似地,L-半胱氨酸生物合成酶或其调节蛋白可以是上文例示的任何L-半胱氨酸生物合成酶或其调节蛋白,例如CysIXHDNYZ蛋白,Fpr2蛋白,CysR蛋白,SsuR蛋白,McbR蛋白,和CysK蛋白的变体,只要保持其原始功能即可。保持其原始功能的变体也可以称为“保守变体”。用上述基因名称定义的基因和用上述蛋白质名称定义的蛋白质不仅可以分别包括上面例示的基因和蛋白质,还可以包括其保守变体。也就是说,例如,术语“cysR基因(或NCgl0120基因)”不仅可以包括上面例示的cysR基因,例如具有以SEQ ID NO:104所示核苷酸序列的cysR基因,还可以包括其保守变体。类似地,术语“CysR蛋白(或NCgl0120蛋白)”不仅可包括上文例示的CysR蛋白,例如具有以SEQID NO:105所示的氨基酸序列的CysR蛋白,还可包括其保守变体。保守变体的实例可包括例如上文例示的基因和蛋白质的同源物和人工修饰形式。
表述“保持原始功能”指基因或蛋白质的变体具有对应于原始基因或蛋白质的功能(例如活性或性质)的功能(例如活性或性质)。当提到基因时,表述“保持原始功能”指该基因的变体编码保持原始功能的蛋白质。也就是说,当提及L-半胱氨酸生物合成基因或其调节物基因时,表述“保持原始功能”指基因的变体编码L-半胱氨酸生物合成基因或其调节物基因。当提及参与硫利用的蛋白质时,表述“保持原始功能”指蛋白质的变体具有参与硫利用的功能,诸如参与无机硫化合物还原的功能,和参与亚硫酸盐还原的电子转运的功能。此外,用于O-乙酰丝氨酸(硫醇)-裂合酶的表述“保持原始功能”指蛋白质变体具有O-乙酰丝氨酸(硫醇)-裂合酶活性。此外,当提及L-半胱氨酸生物合成酶的调节蛋白时,表述“保持原始功能”指蛋白质变体具有正调节(即活化)编码L-半胱氨酸生物合成酶的基因表达的功能。
以下将解释保守变体的实例。
L-半胱氨酸生物合成基因或其调节物基因或L-半胱氨酸生物合成基因或其调节物基因的同源物可以使用上述例示的L-半胱氨酸生物合成基因或其调节物基因的任何核苷酸序列或上文例示的L-半胱氨酸生物合成基因或其调节物的任何氨基酸序列作为查询序列通过例如BLAST搜索或FASTA搜索从公共数据库容易地获得。此外,L-半胱氨酸生物合成基因或其调节物基因的同源物可以通过例如使用棒状杆菌细菌等生物体的染色体作为模板和基于上述例示的L-半胱氨酸生物合成基因或其调节物基因的任何核苷酸序列制备的寡核苷酸作为引物的PCR获得。
L-半胱氨酸生物合成基因或其调节物基因可以编码蛋白质,所述蛋白质具有任何上述氨基酸序列如以SEQ ID NO:89,91,93,95,97,99,101,103,105,107和141所示的氨基酸序列,且包括在一个或几个位置处一个或几个氨基酸残基的取代,缺失,插入和/或添加,只要保持原始功能即可。例如,编码的蛋白质可以具有延伸的或缺失的N端和/或C端。尽管以上使用的术语“一个或几个”所表示的数目可以随蛋白质的三维结构中的氨基酸残基的位置或氨基酸残基的类型而不同,具体而言,它例如为1至50,1至40,1至30,1至20,1至10,1至5,或1至3。
一个或几个氨基酸残基的上述取代,缺失,插入和/或添加可以各自是保持蛋白质原始功能的保守突变。保守突变的典型实例是保守取代。若取代位点是芳香氨基酸,则保守取代是其中取代在Phe,Trp和Tyr之间相互发生的突变;若它是疏水性氨基酸,则保守取代是取代在Leu,Ile和Val之间相互发生的突变;若它是极性氨基酸;则保守取代是取代在Gln和Asn之间相互发生的突变;若它是碱性氨基酸,则保守取代是取代在Lys,Arg和His之间相互发生的突变;若它是酸性氨基酸,则保守取代是取代在Asp和Glu之间相互发生的突变;以及若它是具有羟基的氨基酸,则保守取代是取代在Ser和Thr之间相互发生的突变。认为是保守取代的取代的实例可以具体包括用Ser或Thr取代Ala,用Gln,His,或Lys取代Arg,用Glu,Gln,Lys,His,或Asp取代Asn,用Asn,Glu,或Gln取代Asp,用Ser或Ala取代Cys,用Asn,Glu,Lys,His,Asp,或Arg取代Gln,用Gly,Asn,Gln,Lys,或Asp取代Glu,用Pro取代Gly,用Asn,Lys,Gln,Arg,或Tyr取代His,用Leu,Met,Val,或Phe取代Ile,用Ile,Met,Val,或用Phe取代Leu,用Asn,Glu,Gln,His,或Arg取代Lys,用Ile,Leu,Val,或Phe取代Met,用Trp,Tyr,Met,Ile,或Leu取代Phe,用Thr或Ala取代Ser,用Ser或Ala取代Thr,用Phe或Tyr取代Trp,用His,Phe,或Trp取代Tyr,以及用Met,Ile,或Leu取代Val。此外,如上所述的氨基酸残基的此类取代,缺失,插入,添加等可以包括由于个体差异引起的天然存在的突变或者该基因来源的生物体的物种的差异(突变体或变体)。
此外,L-半胱氨酸生物合成基因或其调节物基因可以是编码与上述任何氨基酸序列的总氨基酸序列具有例如50%或更多,65%或更多,80%或更多,90%或更多,95%或更多,97%或更多,或99%或更多的同源性的氨基酸序列的蛋白质的基因,只要保持原始功能。另外,在本说明书中,“同源性”等同于“同一性”。
此外,L-半胱氨酸生物合成基因或其调节物基因可以是能够在严格条件下与可以从任何前述核苷酸序列,如以SEQ ID NOS:88,90,92,94,96,98,100,102,104,106和140所示的核苷酸序列制备的探针,例如与任何上述核苷酸序列的全部序列或部分序列互补的序列杂交的基因(例如DNA),只要保持原始功能。“严格条件”可以指形成所谓特异性杂合物,并且不形成非特异性杂合物的条件。严格条件的实例可以包括高度同源的DNA彼此杂交(例如,不小于50%,65%,或80%同源,不小于90%同源,不小于95%同源,不小于97%同源,或不小于99%同源的DNA彼此杂交,并且同源性小于上述项的DNA不彼此杂交)的那些条件,或典型的Southern杂交的清洗条件,即在与1x SSC,0.1%SDS于60℃;0.1x SSC,0.1%SDS于60℃;或者0.1x SSC,0.1%SDS于68℃对应的盐浓度和温度清洗1次,或2或3次的条件。
用于上述杂交的探针可以是与如上述的基因互补的序列的一部分。此类探针可以使用基于已知基因序列制备的寡核苷酸作为引物和含有任何上述基因的DNA片段作为模板通过PCR制备。作为探针,例如可以使用长度约300bp的DNA片段。当使用长度为约300bp的DNA片段作为探针时,具体地,杂交的清洗条件可以是例如50℃,2xSSC和0.1%SDS。
此外,由于关于密码子简并性的性质随宿主而变化,L-半胱氨酸生物合成基因或其调节物基因可以包括相应等同密码子对任意密码子的替换。也就是说,由于遗传密码的简并性,L-半胱氨酸生物合成基因或其调节物基因可以是以上例示的任何L-半胱氨酸生物合成基因或其调节物基因的变体。例如,L-半胱氨酸生物合成基因或其调节物基因各自可以以使其根据选择的宿主中的密码子频率而具有最佳密码子的方式进行了修饰的基因。
例如,可以通过数学算法来确定两个序列之间的序列同一性的百分比。此类数学算法的非限制性实例可以包括Myers and Miller(1988)CABIOS 4:11-17的算法、Smith etal(1981)Adv.Appl.Math.2:482的局部同源性算法、Needleman and Wunsch(1970)J.Mol.Biol.48:443-453的同源性比对算法、Pearson and Lipman(1988)Proc.Natl.Acad.Sci.85:2444-2448的同源性筛选方法和Karlin and Altschul(1990)Proc.Natl.Acad.Sci.USA 87:2264的算法的修改形式,诸如记载于Karlin and Altschul(1993)Proc.Natl.Acad.Sci.USA 90:5873-5877的。
通过使用基于此类数学算法的程序,可以进行用于确定序列同一性的序列比较和比对。该程序可以由计算机适当地执行。此类程序的实例可以包括但不限于PC/Gene程序的CLUSTAL(可从Intelligenetics,Mountain View,Calif.获得),ALIGN程序(版本2.0)以及Wisconsin Genetics Software Package,版本8(可从Genetics Computer Group(GCG),575Science Drive,Madison,Wis.,USA获得)的GAP,BESTFIT,BLAST,FASTA和TFASTA。使用这些程序的比对可以通过使用例如初始参数来进行。CLUSTAL程序充分记载于Higgins etal.(1988)Gene 73:237-244(1988),Higgins et al.(1989)CABIOS 5:151-153,Corpet etal.(1988)Nucleic Acids Res.16:10881-90,Huang et al.(1992)CABIOS 8:155-65,以及Pearson et al.(1994)Meth.Mol.Biol.24:307-331。
为了获得与靶核苷酸序列同源的核苷酸序列,具体而言,例如,可以通过使用BLASTN程序以100的得分和12的字长来进行BLAST核苷酸搜索。为了获得与靶蛋白质同源的氨基酸序列,特别地,例如可以通过以50的得分和3的字长使用BLASTX程序进行BLAST蛋白质搜索。关于BLAST核苷酸搜索和BLAST蛋白质搜索,参见ncbi.nlm.nih.gov。另外,为了比较目的,可以使用Gapped BLAST(BLAST 2.0)以获得包含缺口的比对。另外,可以使用PSI-BLAST来进行重复搜索以检测序列之间的远距离关系。关于Gapped BLAST和PSI-BLAST,参见Altschul et al.(1997)Nucleic Acids Res.25:3389。当使用BLAST、Gapped BLAST或PSI-BLAST时,可以使用每个程序的初始参数(例如核苷酸序列的BLASTN和氨基酸序列的BLASTX)。比对也可以手动进行。
两个序列之间的序列同一性计算为在比对两个序列以便彼此最大限度配合时两个序列中匹配的残基的比率。
前述关于基因和蛋白质的保守变体的描述可以在必要修改后应用于任意蛋白质的变体,例如目标物质生物合成酶和编码它们的基因。
<1-3>增加蛋白质活性的方法
以下,将解释用于增加蛋白质诸如L-半胱氨酸生物合成酶或其调节物活性的方法。
表述“蛋白质的活性得以增加”指与非修饰菌株相比,蛋白质的活性增加。具体而言,表述“蛋白质的活性得以增加”可以意味着与非修饰菌株相比,每细胞的蛋白质的活性增加。术语“非修饰菌株”或“非修饰的微生物的菌株”可以指尚未以增加目标蛋白质活性的方式进行修饰的对照菌株。非修饰菌株的实例可以包括野生型菌株和亲本菌株。非修饰菌株的具体实例可以包括微生物物种的相应类型菌株。非修饰菌株的具体实例还可以包括以上关于微生物描述所例示的菌株。也就是说,在一个实施方案中,与类型菌株,即微生物所属的物种的类型菌株相比,蛋白质的活性可以得以增加。在另一个实施方案中,与谷氨酸棒杆菌ATCC13869菌株相比,蛋白质的活性也可以得以增加。在另一个实施方案中,与谷氨酸棒杆菌ATCC13032菌株相比,蛋白质的活性也可以得以增加。在另一个实施方案中,与大肠杆菌K-12MG1655菌株相比,蛋白质的活性也可以得以增加。“蛋白质活性得以增加”的短语也可以表达为“蛋白质的活性得以增强”。更具体地说,表述“蛋白质的活性得以增加”可以意味着与非修饰菌株相比每细胞的蛋白质的分子数目增加,和/或蛋白质的每个分子的功能增加。也就是说,表述“蛋白质活性得以增加”中的术语“活性”不限于蛋白质的催化活性,而且还可以指编码蛋白质的基因的转录量(即mRNA的量),或蛋白质的翻译量(即蛋白质的量)。此外,“蛋白质的活性得以增加”的短语不仅包括当目标蛋白质的活性在固有具有目标蛋白质活性的菌株中增加时,而且还包括当将目标蛋白质的活性赋予不固有地具有目标蛋白质活性的菌株时。此外,只要蛋白质的活性最终得以增加,宿主中固有存在的目标蛋白质的活性可以弱化和/或消除,然后可以将适当类型的目标蛋白质赋予宿主。
蛋白质活性增加的程度不受特别限制,只要蛋白质的活性与非修饰菌株相比增加即可。蛋白质的活性可以增加至例如非修饰菌株的蛋白质活性的1.2倍以上,1.5倍以上,2倍以上,或3倍以上。此外,当非修饰菌株不具有目标蛋白质的活性时,足够的是由于引入编码蛋白质的基因而产生蛋白质,并且例如,蛋白质可以以使其活性可以得到测量的程度生产。
提高蛋白质活性的修饰可以通过例如增加编码该蛋白质的基因的表达来实现。短语“基因的表达得以增加”意指与非修饰菌株如野生型菌株和亲本菌株相比,基因的表达得以增加。具体而言,短语“基因表达得以增加”可以意味着每个细胞的基因表达量与非修饰菌株相比得以增加。更具体地,短语“基因表达得以增加”可以意味着基因的转录量(即mRNA的量)得以增加,和/或基因的翻译量(即从基因表达的蛋白质量)得以增加。“基因表达得以增加”的短语也称为“基因表达得以增强”。基因的表达可以增加至例如非修饰菌株的表达的1.2倍以上,1.5倍以上,2倍以上,或3倍以上。此外,“基因表达得以增加”的短语不仅可以包括当目标基因的表达量在固有表达目标基因的菌株中得以增加时,而且还包括当将基因引入到不固有地表达目标基因并在其中表达的菌株中时。也就是说,短语“基因表达得以增加”也可以意指例如,将目标基因引入不拥有该基因的菌株中并在其中表达。
例如,可以通过增加基因的拷贝数来增加基因的表达。
可以通过将基因引入宿主的染色体来增加基因的拷贝数。例如可以通过使用同源重组(Miller,J.H.,Experiments in Molecular Genetics,1972,Cold Spring HarborLaboratory)将基因引入染色体。使用同源重组的基因转移方法的实例可以包括使用线性DNA的方法,诸如Red驱动的整合(Datsenko,K.A.,and Wanner,B.L.,Proc.Natl.Acad.Sci.USA,97:6640-6645(2000)),使用含有温度敏感性复制起点的质粒的方法,使用能够接合转移的质粒的方法,使用不具有在宿主中起作用的复制起点的自杀载体的方法,使用噬菌体的转导方法。可以引入基因的仅一个拷贝,或可以引入基因的两个或更多个拷贝。例如,通过使用以染色体上的多个拷贝存在的序列作为靶标进行同源重组,可以将多个拷贝的基因引入染色体。以多个拷贝存在于染色体上的此类序列的实例可以包括重复DNA和位于转座子两端的反向重复序列。或者,可以通过使用染色体上的适当序列,如对于产生目标物质不必要的基因作为靶标进行同源重组。另外,也可以用转座子或Mini-Mu(日本专利公开(Kokai)No.2-109985,美国专利No.5,882,888,EP 805867B1)将基因随机引入染色体。
可以通过使用具有与全部基因或其一部分互补的序列的探针进行Southern杂交、使用基于该基因序列制备的引物的PCR等确认靶基因对染色体的引入。
此外,通过将含有该基因的载体引入宿主中,也可以增加基因的拷贝数。例如,通过将含有靶基因的DNA片段与在宿主中起作用的载体连接以构建该基因的表达载体,并用该表达载体转化宿主,可以增加靶基因的拷贝数。可以通过例如使用具有靶基因的微生物的基因组DNA作为模板的PCR获得含有靶基因的DNA片段。作为载体,可以使用宿主细胞中可自主复制的载体。该载体可以是多拷贝载体。此外,载体可以具有用于选择转化体的标志物如抗生素抗性基因。此外,载体可以具有用于表达引入的基因的启动子和/或终止子。载体可以是例如源自细菌质粒的载体,源自酵母质粒的载体,源自噬菌体的载体,粘粒,噬菌粒等。可在肠杆菌科细菌诸如大肠杆菌中自主复制的载体的具体实例可以包括例如pUC19,pUC18,pHSG299,pHSG399,pHSG398,pBR322,pSTV29(所有这些可购自Takara Bio),pACYC184,pMW219(NIPPON GENE),pTrc99A(Pharmacia),pPROK系列载体(Clontech),pKK233-2(Clontech),pET系列载体(Novagen),pQE系列载体(QIAGEN),pCold TF DNA(TaKaRa),pACYC系列载体,和宽宿主范围的载体RSF1010。可在棒状杆菌细菌中自主复制的载体的具体实例可以包括例如pHM1519(Agric.Biol.Chem.,48,2901-2903(1984));pAM330(Agric.Biol.Chem.,48,2901-2903(1984));通过改善这些质粒获得并具有药物抗性基因的质粒;日本专利公开(Kokai)No.3-210184中描述的质粒pCRY30;日本专利公开(Kokai)No.2-72876和美国专利No.5,185,262中描述的质粒pCRY21,pCRY2KE,pCRY2KX,pCRY31,pCRY3KE和pCRY3KX;日本专利公开(Kokai)No.1-191686中描述的质粒pCRY2和pCRY3;日本专利公开(Kokai)No.58-192900中描述的pAJ655,pAJ611和pAJ1844;日本专利公开(Kokai)No.57-134500中描述的pCG1;日本专利公开(Kokai)No.58-35197中描述的pCG2;日本专利公开(Kokai)No.57-183799中描述的pCG4和pCG11;日本专利公开(Kokai)No.10-215883中描述的pVK7;WO2007/046389中描述的pVK9;WO2013/069634中描述的pVS7;和日本专利公开(Kokai)No.9-070291中描述的pVC7。
当引入基因时,宿主可以表达基因是足够的。具体而言,宿主中存在基因以便其在宿主中起作用的启动子的控制下表达是足够的。术语“在宿主中起作用的启动子”可以指在宿主中显示启动子活性的启动子。启动子可以是源自宿主的启动子或异源启动子。启动子可以是待引入基因的天然启动子或另一基因的启动子。作为启动子,例如也可以使用如本文描述的更强的启动子。
终止基因转录的终止子可以位于基因的下游。终止子没有特别限制,只要其在选择的宿主中起作用。终止子可以是源自宿主的终止子或异源终止子。终止子可以是待引入基因的天然终止子或另一基因的终止子。终止子的具体实例可以包括例如T7终止子、T4终止子、fd噬菌体终止子、tet终止子和trpA终止子。
在“Fundamental Microbiology Vol.8,Genetic Engineering,KYORITSUSHUPPAN CO.,LTD,1987”中详细公开了可用于各种微生物中的载体,启动子和终止子,并且可以使用那些。
此外,当引入两个或更多个基因时,基因各自可以由宿主表达是足够的。例如,所有基因可以由单个表达载体或染色体携带。此外,基因可以分别由两个或更多个表达载体携带,或者分开由单一或两个或更多个表达载体和染色体携带。也可以引入由两个或更多个基因构成的操纵子。“引入2个或更多个基因”的短语可以指例如引入编码2种或更多种蛋白质(酶等)的相应基因,引入编码构成单一蛋白质复合物(例如酶复合物)的2种或更多种亚基的相应基因以及它们的组合。
待引入的基因没有特别限制,只要它编码在宿主中起作用的蛋白即可。待引入的基因可以是源自宿主的基因,或者可以是异源基因。可以例如使用基于该基因的核苷酸序列设计的引物,并使用具有该基因的生物体的基因组DNA,携带该基因的质粒等作为模板通过PCR获得待引入的基因。待引入的基因也可以完全合成,例如基于该基因的核苷酸序列(Gene,60(1),115-127(1987))。获得的基因可以原样使用,或者根据需要在修饰后使用。也就是说,可以通过修饰基因来获得基因的变体。基因可以通过已知技术进行修饰。例如,可以通过位点特异性突变方法将目标突变引入DNA的目标位点。也就是说,可以通过位点特异性突变方法修饰基因的编码区,使得编码蛋白的特定位点包括氨基酸残基的取代,缺失,插入和/或添加。位点特异性突变方法的实例可以包括利用PCR的方法(Higuchi,R.,61,于PCRTechnology,Erlich,H.A.Eds.,Stockton Press(1989);Carter,P.,Meth.in Enzymol.,154,382(1987))和利用噬菌体的方法(Kramer,W.and Frits,H.J.,Meth.于Enzymol.,154,350(1987);Kunkel,T.A.et al.,Meth.in Enzymol.,154,367(1987))。或者,可以完全合成基因的变体。
另外,当蛋白质作为由多个亚基构成的复合物起作用时,可以修饰多个亚基的部分或全部,只要蛋白质的活性最终得以增加。也就是说,例如,当通过增加基因的表达来增加蛋白质的活性时,可以增强编码亚基的多个基因的部分或全部的表达。通常优选增强编码亚基的多个基因全部的表达。此外,构成该复合物的亚基可以源自单一种类的生物体或两种或更多种生物体,只要该复合物具有目标蛋白质的功能即可。也就是说,例如,可以将编码多个亚基的相同生物体的基因引入宿主,或者可以将编码多个亚基的不同生物体的基因引入宿主中。
此外,可以通过改善基因的转录效率增加基因的表达。另外,通过提高基因的翻译效率也可以增加基因的表达。基因的转录效率和基因的翻译效率可以通过例如修饰基因的表达控制序列来改善。术语“表达控制序列”可以共同指影响基因表达的位点。表达控制序列的实例可以包括例如启动子,Shine-Dalgarno(SD)序列(其也可以称为核糖体结合位点(RBS))和RBS与起始密码子之间的间隔物区。可以通过使用启动子搜索载体或基因分析软件如GENETYX来鉴定表达控制序列。这些表达调控序列可以通过例如使用温度敏感性载体的方法或Red驱动整合方法(WO2005/010175)进行修饰。
通过例如用更强的启动子替换染色体上的基因的启动子可以提高基因的转录效率。术语“更强的启动子”可以指与基因的固有的野生型启动子相比提供改善的基因转录的启动子。更强的启动子的实例可以包括例如已知的高表达启动子,诸如T7启动子、trp启动子、lac启动子、thr启动子、tac启动子、trc启动子、tet启动子、araBAD启动子、rpoH启动子、msrA启动子、Pm1启动子(源自双歧杆菌属(Bifidobacterium))、PR启动子和PL启动子。在棒状杆菌细菌中可用的更强启动子的实例可以包括例如在棒状杆菌细菌中用乙酸、乙醇、丙酮酸等可诱导的人工修饰的P54-6启动子(Appl.Microbiol.Biotechnol.,53,674-679(2000)),pta,aceA,aceB,adh,和amyE启动子,cspB,SOD和tuf(EF-Tu)启动子,它们是能够在棒状杆菌细菌中提供大表达量的有力启动子(Journal of Biotechnology,104(2003)311-323;Appl.Environ.Microbiol.,2005Dec;71(12):8587-96),P2启动子(SEQ ID NO:108的位置942-1034),P3启动子(SEQ ID NO:111)和P6启动子(SEQ ID NO:135)以及lac启动子,tac启动子和trc启动子。此外,作为更强的启动子,通过使用各种报道基因也可以获得高活性类型的现有启动子。例如,通过使启动子区中的-35和-10区更接近共有序列,可以增强启动子的活性(WO00/18935)。高活性型启动子的实例可以包括各种tac样启动子(Katashkina JI et al.,Russian Federation Patent Application No.2006134574)。在Goldstein et al.(Prokaryotic Promoters in Biotechnology,Biotechnol.Annu.Rev.,1,105-128(1995))的论文等中描述了评估启动子强度的方法和强启动子的实例。
例如,通过用更强的SD序列替换染色体上的基因的Shine-Dalgarno(SD)序列(其也可以称为核糖体结合位点(RBS)),可以改善基因的翻译效率。术语“更强的SD序列”可以指与基因固有的野生型SD序列相比提供改善的mRNA翻译的SD序列。更强的SD序列的实例可以包括例如源自噬菌体T7的基因10的RBS(Olins P.O.et al,Gene,1988,73,227-235)。此外,已知在RBS和起始密码子之间的间隔物区中,特别是在紧邻起始密码子上游的序列(5'-UTR)中,几个核苷酸的取代,插入或缺失显著影响mRNA的稳定性和翻译效率,因此,也可以通过修饰来改善基因的翻译效率。
基因的翻译效率也可以通过例如修饰密码子来改善。例如,通过用更频繁使用的同义密码子取代基因中存在的稀有密码子,可以提高基因的翻译效率。也就是说,例如,基因可以以使该基因含有根据在选择的宿主中观察到的密码子频率的最佳密码子的方式进行了修饰。例如,可以通过用于将目标突变引入DNA的目标位点中的位点特异性突变方法替换密码子。或者,可以完全合成替换目标密码子的基因片段。“密码子选择数据库”(kazusa.or.jp/codon;Nakamura,Y.et al,Nucl.Acids Res.,28,292(2000))中公开了各种生物体中的密码子的频率。
此外,基因的表达还可以通过扩增增加基因表达的调节子或缺失或弱化减少基因表达的调节子来增加。
可以独立使用或以任意组合使用如上所述用于增加基因表达的此类方法。
此外,也可以通过例如增强酶的比活性来获得增加蛋白质活性的修饰。比活性的增强也可以包括对反馈抑制的脱敏。也就是说,当蛋白质被代谢物反馈抑制时,可以通过使选择的宿主中的基因或蛋白质突变以对反馈抑制脱敏来增加蛋白质的活性。短语“对反馈抑制脱敏”可以包括消除反馈抑制,和弱化反馈抑制,除非另有叙述。此外,“对反馈抑制脱敏”的短语,即当反馈抑制得到消除或弱化时,也可以称为“对反馈抑制耐受”。通过例如搜索各种生物体可以获得显示增强的比活性的蛋白质。此外,通过向现有蛋白质中引入突变也可以获得高活性类型的固有蛋白质。待引入的突变可以是例如在蛋白质的一个或几个位置上一个或几个氨基酸残基的取代,缺失,插入和/或添加。可以通过例如如上所述的此类位点特异性突变方法来引入突变。突变也可以通过例如诱变处理来引入。诱变处理的实例可以包括X射线照射,紫外线照射和用突变剂如N-甲基-N'-硝基-N-亚硝基胍(MNNG),甲磺酸乙酯(EMS)和甲磺酸甲酯(MMS)处理。此外,可以通过用羟胺在体外直接处理DNA来诱导随机突变。比活性的增强可以独立使用,或者可以与如上述用于增强基因表达的此类方法任意组合使用。
用于转化的方法不受特别限制,并且可以使用常规已知的方法。可以使用例如用氯化钙处理接受细胞以增加其对DNA的通透性的方法,其已经对大肠杆菌K-12菌株报道(Mandel,M.and Higa,A.,J.Mol.Biol.,1970,53,159-162),以及从生长阶段中的细胞制备感受态细胞,接着用DNA转化的方法,其已经对枯草芽孢杆菌(Bacillus subtilis)报告(Duncan,C.H.,Wilson,G.A.and Young,F.E.,Gene,1977,1:153-167)。或者,可以使用使DNA-接受细胞变为原生质体或原生质球(其可以容易摄取重组DNA),接着将重组DNA引入DNA-接受细胞中的方法,已知该方法适用于枯草芽孢杆菌、放线菌和酵母(Chang,S.andChoen,S.N.,1979,Mol.Gen.Genet.,168:111-115;Bibb,M.J.,Ward,J.M.and Hopwood,O.A.,1978,Nature,274:398-400;Hinnen,A.,Hicks,J.B.and Fink,G.R.,1978,Proc.Natl.Acad.Sci.USA,75:1929-1933)。此外,也可以使用对棒状杆菌细菌报告的电脉冲方法(日本专利公开(Kokai)No.2-207791)。
可以通过测量蛋白质的活性来确认蛋白质活性的增加。
通过确认编码蛋白质的基因的表达增加,也可以确认蛋白质活性的增加。可以通过确认基因转录量的增加或通过确认从该基因表达的蛋白质量的增加来确认基因表达的增加。
可以通过比较从基因转录的mRNA的量与非修饰菌株如野生型菌株或亲本菌株的mRNA量来确认基因转录量的增加。用于评估mRNA量的方法的实例可以包括Northern杂交,RT-PCR等(Sambrook,J.,et al.,Molecular Cloning A Laboratory Manual/第三版,ColdSpring Harbor Laboratory Press,Cold Spring Harbor(USA),2001)。mRNA的量可以增加到例如非修饰菌株的mRNA量的1.2倍以上,1.5倍以上,2倍以上或3倍以上。
可以通过使用抗体的Western印迹法(Molecular Cloning,Cold Spring HarborLaboratory Press,Cold Spring Harbor(USA),2001)来确认蛋白质量的增加。蛋白质的量(诸如每细胞的蛋白质分子的数目)可以增加到例如非修饰菌株的蛋白质量的1.2倍以上,1.5倍以上,2倍以上或3倍以上。
除了增强L-半胱氨酸生物合成酶或其调节物的活性外,上述提高蛋白质活性的方法可用于提高任意蛋白质如目标物质生物合成酶,磷酸泛酰巯基乙胺基化酶和物质摄取系统的活性,和增强任意基因如编码那些任意蛋白质的基因的表达。
<1-4>降低蛋白质活性的方法
以下,将解释用于降低蛋白质的活性的方法。
表述“蛋白质的活性得以降低”指与非修饰菌株相比蛋白质的活性得以降低。具体而言,表述“蛋白质的活性得以降低”可以意味着与非修饰菌株相比,每个细胞的蛋白质的活性得以降低。术语“非修饰菌株”可以指尚未以使目的蛋白质的活性得以降低的方式进行修饰的对照菌株。非修饰菌株的实例可以包括野生型菌株和亲本菌株。非修饰菌株的具体实例可以包括微生物物种的相应类型菌株。非修饰菌株的具体实例还可以包括以上关于微生物描述所例示的菌株。也就是说,在一个实施方案中,与类型菌株,即微生物所属的物种的类型菌株相比,可以降低蛋白质的活性。在另一个实施方案中,与谷氨酸棒杆菌ATCC13869菌株相比,蛋白质的活性也可以得以降低。在另一个实施方案中,与谷氨酸棒杆菌ATCC 13032相比,蛋白质的活性也可以得以降低。另一个实施方案中,与大肠杆菌K-12MG1655菌株相比,蛋白质的活性也可以得以降低。“蛋白质活性得以降低”的短语还可以包括当蛋白质的活性已经完全消失时。更具体地说,表述“蛋白质的活性得以降低”可以意味着与非修饰的菌株相比每个细胞的蛋白质的分子数目得以减少,和/或蛋白质的每个分子的功能得以降低。也就是说,表述“蛋白质的活性得以降低”中的术语“活性”不限于蛋白质的催化活性,而且还可以指编码蛋白质的基因的转录量(即mRNA的量)或蛋白质的翻译量(即蛋白质的量)。“每个细胞的蛋白质的分子数目得以减少”的短语还可以包括当完全不存在蛋白质时。“蛋白质的每个分子的功能得以降低”的短语也可以包括当每个蛋白质分子的功能完全消失时。蛋白质活性降低的程度没有特别限制,只要活性与非修饰菌株的活性相比降低即可。蛋白质的活性可以降低到例如非修饰菌株的蛋白质活性的50%或更少,20%或更少,10%或更少,5%或更少,或0%。
可以通过例如减少编码蛋白质的基因的表达来实现用于降低蛋白质活性的修饰。短语“基因的表达得以降低”指与非修饰菌株如野生型菌株和亲本菌株相比,该基因的表达得以降低。具体而言,短语“基因表达得以降低”可以意味着与非修饰菌株相比,每个细胞的基因表达得以降低。更具体地说,短语“基因表达得以降低”可以意味着基因的转录量(即mRNA的量)得以减少,和/或基因的翻译量(即从基因表达的蛋白质量)得以减少。“基因表达得以降低”的短语也可以包括当基因完全不表达时。“基因表达得以降低”的短语也可以称为“基因表达得以弱化”。基因的表达可以降低到例如非修饰菌株的表达的50%或更少,20%或更少,10%或更少,5%或更少,或0%。
基因表达的降低可以是由于例如转录效率降低,翻译效率降低或组合所致。可以通过修饰基因的表达控制序列诸如启动子,Shine-Dalgarno(SD)序列(其也可以称为核糖体结合位点(RBS)),和基因的RBS和起始密码子之间的间隔物区来降低基因的表达。当修饰表达控制序列时,修饰表达控制序列的一个或多个核苷酸,两个或更多个核苷酸,或三个或更多个核苷酸。例如,通过用更弱的启动子替换染色体上基因的启动子,可以降低基因的转录效率。术语“更弱的启动子”可以指与基因固有的野生型启动子相比,提供基因的弱化转录的启动子。更弱启动子的实例可以包括例如诱导型启动子。也就是说,诱导型启动子可以在非诱导条件下,例如在不存在相应诱导物的情况下,起到更弱启动子的作用。更弱启动子的实例还可以包括例如P4和P8启动子(分别为SEQ ID NO:109的位置872-969和SEQ ID NO:110的位置901-1046)。此外,可以缺失表达控制序列的一部分或全部。基因的表达还可以通过例如操纵负责表达控制的因子来降低。负责表达控制的因子的实例可以包括负责转录或翻译控制的低分子(诸如诱导剂,抑制剂等),负责转录或翻译控制的蛋白质(转录因子等),负责转录或翻译控制的核酸(诸如siRNA等),等等。此外,通过例如对基因的编码区引入降低基因表达的突变,也可以降低基因的表达。例如,通过用在宿主中不太频繁使用的同义密码子替换基因编码区中的密码子,可以降低基因的表达。此外,例如,如本文所述,基因表达可以由于基因的破坏而降低。
用于降低蛋白质活性的修饰也可以通过例如破坏编码该蛋白质的基因来获得。短语“基因受到破坏”可以指基因以使得不产生通常可以起作用的蛋白质的方式进行了修饰。“不产生通常可以起作用的蛋白质”的短语可以包括当完全不从基因产生蛋白质时和当从基因产生每个分子的功能(例如活性或性质)得以降低或消除的蛋白质时。
可以通过例如缺失染色体上的基因来获得基因的破坏。术语“基因的缺失”可以指基因编码区的部分或整个区域的缺失。此外,可以缺失包括染色体上基因的编码区上游和下游序列的整个基因。只要可以降低蛋白质的活性,待缺失的区域可以是任何区域,例如N端区域(即编码蛋白质的N端区域的区域),内部区域或C端区域(即编码蛋白质的C端区域的区域)。缺失更长的区域通常可以更确定地使基因失活。待缺失的区域可以是具有例如基因的编码区的总长度的10%以上、20%以上、30%以上、40%以上、50%以上、60%以上、70%以上、80%以上、90%以上、或95%以上的长度的区域。此外,优选的是,待缺失的区域的上游和下游序列的阅读框不相同。读码框的不一致性可以引起待缺失的区域下游的移码。
例如,也可以通过对染色体上基因的编码区引入用于氨基酸取代的突变(错义突变),终止密码子的突变(无义突变),添加或缺失一个或两个核苷酸残基的突变(移码突变)等获得基因的破坏(Journal of Biological Chemistry,272:8611-8617(1997);Proceedings of the National Academy of Sciences,USA,95 5511-5515(1998);Journal of Biological Chemistry,26 116,20833-20839(1991))。
也可以通过例如将另一个核苷酸序列插入到染色体上的基因的编码区中获得基因的破坏。插入的位点可以位于基因的任何区域中,并且插入更长的核苷酸序列通常可以更确定地使基因失活。优选的是插入位点上游和下游序列的阅读框不相同。读码框的不一致性可以引起待缺失的区域下游的移码。其他核苷酸序列没有特别限制,只要选择降低或消除所编码蛋白质活性的序列即可,并且其实例可以包括例如标志物基因如抗生素抗性基因,以及可用于产生目标物质的基因。
特别地,可以以编码蛋白质的氨基酸序列得以缺失的方式进行基因的破坏。换言之,可以通过例如缺失蛋白质的氨基酸序列,特别地修饰基因以使该基因编码氨基酸序列得以的蛋白质来实现降低蛋白质活性的修饰。短语“蛋白质的氨基酸序列的缺失”可以指蛋白质的氨基酸序列的部分或整个区域的缺失。另外,短语“蛋白质的氨基酸序列的缺失”可以指原始氨基酸序列在蛋白质中消失,并且还可以包括当原始氨基酸序列变为另一个氨基酸序列时。也就是说,例如,通过移码改变为另一氨基酸序列的区域可以视为缺失区域。当蛋白质的氨基酸序列得以缺失时,通常缩短蛋白质的总长度,但也可以存在蛋白质的总长度没有改变或延长的情况。例如,通过缺失基因编码区的部分或整个区域,可以在编码的蛋白质中缺失由缺失区域编码的区域。另外,例如,通过将终止密码子引入基因的编码区中,可以在编码的蛋白质中缺失由引入位点的下游区域编码的区域。另外,例如,通过在基因的编码区中移码,可以在编码的蛋白质中缺失由移码区编码的区域。关于基因缺失中待缺失区域的位置和长度的上述描述可以在必要修改后应用于缺失蛋白质氨基酸序列中待缺失区域的位置和长度。
如上所述的染色体上基因的此类修饰可以如下获得:通过例如制备以使基因不能产生通常起作用的蛋白质的方式进行了修饰的破坏类型基因,并用含有破坏类型基因的重组DNA转化宿主以引起破坏类型基因和染色体上的野生型基因之间的同源重组,从而用该破坏类型基因取代染色体上的野生型基因。在该程序中,若重组DNA中包括根据宿主特征如营养缺陷选择的标志物基因,则操作变得更容易。破坏类型基因的实例可以包括编码区的部分或整个区域得以缺失的基因,包含错义突变的基因,包括无义突变的基因,包含移码突变的基因,以及包含转座子或标志物基因插入的基因。由破坏类型基因编码的蛋白质即使产生也具有与野生型蛋白质不同的构象,因此其功能得以降低或消除。已经建立了基于使用同源重组的基因取代的此类基因破坏,并且存在使用线性DNA的方法,诸如称为“Red驱动整合”的方法(Datsenko,K.A,and Wanner,B.L.,Proc.Natl.Acad.Sci.USA,97:6640-6645(2000)),以及利用Red驱动的整合与源自λ噬菌体的切除系统的组合的方法(Cho,E.H.,Gumport,R.I.,Gardner,J.F.,J.Bacteriol.,184:5200-5203(2002))(参考WO2005/010175),使用具有温度敏感性复制起点的质粒的方法,使用能够接合转移的质粒的方法,利用没有在宿主中起作用的复制起点的自杀载体的方法(美国专利号6,303,383,日本专利公开(Kokai)No.05-007491),等等。
用于降低蛋白质活性的修饰也可以通过例如诱变处理来获得。诱变处理的实例包括X射线或紫外线的照射和用突变剂如N-甲基-N'-硝基-N-亚硝基胍(MNNG),甲磺酸乙酯(EMS)和甲磺酸甲酯(MMS)处理。
如上文提及的用于降低蛋白质活性的此类方法可以独立使用或者以任意组合使用。
当蛋白质作为由多个亚基构成的复合物起作用时,可以修饰多个亚基的部分或全部,只要蛋白质的活性最终得以降低。也就是说,例如,编码相应亚基的多个基因的部分或全部可以得以破坏等。此外,当蛋白质存在多种同工酶时,多种同工酶的部分或全部活性可以得以降低,只要蛋白质的活性最终得以降低。也就是说,例如,编码相应同功酶的多个基因的部分或全部可以得以破坏等。
可以通过测量蛋白质的活性确认蛋白质活性的降低。
蛋白质活性的降低也可以通过确认编码该蛋白质的基因的表达的降低来确认。基因表达的降低可以通过确认基因转录量的减少或从基因表达的蛋白质量的降低来确认。
通过比较从基因转录的mRNA的量与非修饰菌株中观察到的量,可以确认基因转录量的降低。用于评估mRNA量的方法的实例可以包括Northern杂交,RT-PCR等(MolecularCloning,Cold Spring Harbor Laboratory Press,Cold Spring Harbor(USA),2001)。mRNA的量可以降低到例如在非修饰菌株中观察到的量的50%或更少,20%或更少,10%或更少,5%或更少,或0%。
通过使用抗体的Western印迹法(Molecular Cloning,Cold Spring HarborLaboratory Press,Cold Spring Harbor(USA)2001)可以确认蛋白质量的减少。蛋白质的量(诸如每个细胞的蛋白质的分子数目)可以降低到例如在非修饰菌株中观察到的蛋白质量的50%或更少,20%或更少,10%或更少,5%或更少,或0%。
可以根据用于破坏的手段通过确定基因的部分或全部的核苷酸序列,基因的限制酶图谱,全长等来确认基因的破坏。
上述的降低蛋白质活性的方法还可以适用于任意蛋白质诸如副产物生成酶的活性降低,以及任意基因诸如编码那些任意蛋白的基因的表达降低。
<2>用于生产目标物质的方法
如本文中描述的方法是通过使用如本文中描述的微生物生产目标物质的方法。
<2-1>发酵方法
可以通过例如如本文中描述的微生物的发酵来生产目标物质。也就是说,如本文中描述的方法的实施方案可以是通过发酵微生物来生产目标物质的方法。此实施方案也可以称为“发酵方法”。此外,通过发酵如本文中所述的微生物生产目标物质的步骤也可以称为“发酵步骤”。
可以通过培养如本文中描述的微生物来进行发酵步骤。具体而言,在发酵方法中,可以从碳源生产目标物质。也就是说,发酵步骤可以是例如在培养基,诸如含有碳源的培养基中培养微生物以在培养基中生产和积累目标物质的步骤。也就是说,发酵方法可以是用于生产目标物质的方法,其包括以下步骤:例如在培养基,诸如含有碳源的培养基中培养微生物以在培养基中生产和积累目标物质的方法。此外,换言之,发酵步骤可以是例如通过使用微生物从碳源生产目标物质的步骤。
待使用的培养基没有特别限制,只要微生物可以在其中增殖并产生目标物质即可。作为培养基,例如可以使用用于培养微生物诸如细菌和酵母的典型培养基。培养基可以根据需要含有碳源,氮源,磷酸盐源,硫源,以及其他培养基组分,如各种有机组分和无机组分。培养基成分的类型和浓度可以根据诸如选择的微生物的类型等各种条件适当确定。
碳源没有特别限制,只要微生物可以利用它并产生目标物质即可。碳源的具体实例可以包括例如糖类,诸如葡萄糖,果糖,蔗糖,乳糖,半乳糖,木糖,阿拉伯糖,赤糖糊(blackstrap molasses),淀粉的水解物和生物质的水解物;有机酸如乙酸,柠檬酸,琥珀酸和葡糖酸;醇如乙醇,甘油和粗甘油;和脂肪酸。作为碳源,特别地,可以使用植物来源的材料。植物的实例可以包括例如玉米,稻,小麦,大豆,甘蔗,甜菜和棉。植物来源材料的实例可以包括例如器官,诸如根,茎,干,枝,叶,花和种子,包括它们的植物体和这些植物器官的分解产物。植物来源材料的在其使用时的形式没有特别限定,并且它们可以以诸如未加工产物,汁,研磨产物,纯化产物等任何形式使用。戊糖如木糖,己糖如葡萄糖或它们的混合物可从例如植物生物质获得并且得到使用。具体而言,可以通过将植物生物质进行处理,诸如蒸汽处理,浓酸水解,稀酸水解,纤维素酶等酶水解,碱处理而得到这些糖类。由于半纤维素与纤维素相比通常更容易水解,因此可预先水解植物生物质中的半纤维素以释放戊糖,然后可以水解纤维素以产生己糖。此外,木糖可以通过例如通过对微生物赋予用于将己糖如葡萄糖转化为木糖的途径从己糖转化供应。作为碳源,可以使用一种碳源,或者可以组合使用两种或更多种碳源。
培养基中碳源的浓度没有特别限制,只要微生物可以增殖并产生目标物质即可。培养基中碳源的浓度可以在使得目标物质的生产不受抑制的范围内尽可能高。碳源在培养基中的初始浓度通常可以是例如通常5至30%(w/v),或10至20%(w/v)。此外,可以根据需要对培养基添加碳源。例如,可以与伴随发酵进展的碳源的减少或消减成比例地对培养基添加碳源。虽然可以暂时消减碳源,但是只要最终可以生产目标物质,可以优选以不消减碳源或不继续消减碳源的方式进行培养。
氮源的具体实例可以包括例如铵盐如硫酸铵,氯化铵和磷酸铵,有机氮源如蛋白胨,酵母提取物,肉膏和大豆蛋白分解产物,氨和尿素。用于pH调节的氨气和氨水也可用作氮源。作为氮源,可以使用一种氮源,也可以组合使用两种或更多种的氮源。
磷酸盐源的具体实例可以包括例如磷酸盐如磷酸二氢钾和磷酸氢二钾,以及磷酸聚合物如焦磷酸。作为磷酸盐源,可以使用一种磷酸盐源,或者可以组合使用两种或更多种磷酸盐源。
硫源的具体实例可以包括例如无机硫化合物如硫酸盐,硫代硫酸盐和亚硫酸盐,以及含硫氨基酸如半胱氨酸,胱氨酸和谷胱甘肽。作为硫源,可以使用一种硫源,或者可以组合使用两种或更多种硫源。
其他各种有机和无机组分的具体实例可以包括例如无机盐如氯化钠和氯化钾;微量金属如铁,锰,镁和钙;维生素如维生素B1,维生素B2,维生素B6,烟酸,烟酰胺和维生素B12;氨基酸;核酸;和含有这些的有机成分如蛋白胨,酪蛋白氨基酸,酵母提取物和大豆蛋白分解产物。作为其他各种有机和无机组分,可以使用一种组分,或者可以组合使用两种或更多种组分。
此外,当使用需要营养物如氨基酸进行生长的营养缺陷型突变株时,优选培养基含有此类需要的营养物。此外,培养基可以含有用于生产目标物质的组分。此类组分的具体实例可以包括例如甲基供体例如SAM及其前体例如甲硫氨酸。
培养条件没有特别限制,只要微生物可以增殖并且产生目标物质即可。培养可以用例如用于培养微生物诸如细菌和酵母的典型条件进行。培养条件可以根据诸如选择的微生物的种类等各种条件适当确定。
培养可以通过使用液体培养基来进行。在培养时,例如,可以将在诸如琼脂培养基等固体培养基上培养的微生物直接接种到液体培养基中,或者将在液体培养基中作为种子培养物培养的微生物接种到液体培养基中进行主要培养。也就是说,培养可以作为种子培养和主要培养分开进行。在此类情况下,种子培养和主要培养的培养条件可以是相同的或者可以是不相同。至少在主要培养过程中产生目标物质是足够的。培养开始时培养基中存在的微生物的量没有特别限制。例如,显示OD660为4-100的种子培养液可以在开始培养时以0.1-100质量%,或1-50质量%的量接种到用于主要培养的培养基中。
培养可以以分批培养,补料分批培养,连续培养或这些的组合进行。在培养开始时使用的培养基也可以称为“起始培养基”。在补料分批培养或连续培养中添加到培养系统(例如发酵罐)的培养基也可以称为“补料培养基”。为了在补料分批培养或者连续培养中向培养系统添加补料培养基也可以称为“补料”。此外,当作为种子培养和主要培养分开进行培养时,种子培养和主要培养的培养方案可以相同或可以不同。例如,种子培养和主要培养两者都可以作为分批培养进行。或者,例如,种子培养可以作为分批培养进行,并且主要培养可以以补料分批培养或连续培养进行。
各种组分诸如碳源可以存在于起始培养基,补料培养基或两者中。也就是说,各种组分诸如碳源可以在培养期间独立地或以任意组合的方式添加到培养基。这些组分可以添加一次或多次,或者可以连续添加。起始培养基中存在的组分的类型可以与补料培养基中存在的组分的类型相同或不同。此外,起始培养基中存在的组分的浓度可以与补料培养基中存在的组分的浓度相同或不同。此外,可以使用两种或更多种含有不同类型和/或不同浓度组分的补料培养基。例如,当间歇进行两次或更多次补料时,补料培养基中存在的组分的类型和/或浓度对于每次补料可以是相同的或者可以是不同的。
培养可以例如在需氧条件下进行。术语“需氧条件”可以指其中培养基中的溶解氧浓度为0.33ppm或更高,或1.5ppm或更高的条件。可以将氧浓度控制为例如饱和氧浓度的1-50%,或约5%。培养可以例如在通气或摇动下进行。培养基的pH值可以是例如3至10,或4.0至9.5。培养基的pH可以根据需要在培养过程中进行调整。培养基的pH可以通过使用各种碱性和酸性物质如氨气,氨水,碳酸钠,碳酸氢钠,碳酸钾,碳酸氢钾,碳酸镁,氢氧化钠,氢氧化钙和氢氧化镁来调节。培养温度可以是例如20至45℃,或25至37℃。培养时间可以是例如10至120小时。例如,可以继续培养直到培养基中存在的碳源被消耗,或者直到微生物的活性丧失。
通过在诸如上文所述的条件下培养微生物,在培养基中积累目标物质。
可以通过用于检测或鉴定化合物的已知方法来确认目标物质的产生。此类方法的实例可以包括例如HPLC,UPLC,LC/MS,GC/MS和NMR。这些方法可以独立使用,或者可以以适当的组合使用。这些方法也可以用于确定培养基中存在的各种组分的浓度。
生产的目标物质可以适当收集。也就是说,发酵方法可以进一步包括收集目标物质的步骤。此步骤也可以称为“收集步骤”。收集步骤可以是从培养肉汤,特别是从培养基中收集目标物质的步骤。目标物质可以通过用于分离和纯化化合物的已知方法收集。此类方法的实例可以包括例如离子交换树脂法,膜处理,沉淀,提取,蒸馏和结晶。具体地,目标物质也可以通过用有机溶剂如乙酸乙酯萃取或通过蒸汽蒸馏来收集。这些方法可以独立使用,或者可以以适当的组合使用。
此外,当目标物质沉淀在培养基中时,它可以通过例如离心或过滤收集。在培养基中溶解的目标物质结晶后,可以将沉淀在培养基中的目标物质和溶解在培养基中的目标物质一起分离。
除了目标物质之外,收集的目标物质可以包含例如微生物细胞,培养基组分,水分和微生物的副产物代谢物。收集的目标物质的纯度可以是例如30%(w/w)或更高,50%(w/w)或更高,70%(w/w)或更高,80%(w/w)或更高,90%(w/w)或更高,或95%(w/w)或更高。
<2-2>生物转化方法
目标物质也可以通过例如使用如本文中所述的微生物的生物转化来产生。也就是说,如本文中所述的方法的另一个实施方案可以是使用微生物通过生物转化来生产目标物质的方法。该实施方案也可以称为“生物转化方法”。此外,使用微生物通过生物转化来生产目标物质的步骤也可以称为“生物转化步骤”。
具体而言,在生物转化方法中,目标物质可以从目标物质的前体产生。更具体而言,在生物转化方法中,通过使用微生物,可以通过将目标物质的前体转化为目标物质来生产目标物质。也就是说,生物转化步骤可以是通过使用微生物将目标物质的前体转化为目标物质的步骤。
目标物质的前体也可以简称为“前体”。前体的实例可以包括下述物质,该物质向目标物质的转化包括需要SAM。前体的具体实例可以包括目标物质的生物合成途径的中间体,如就目标物质生物合成酶的描述而言所述的那些,条件是中间体向目标物质的转化需要SAM。前体的更具体实例可以包括例如原儿茶酸,原儿茶醛,L-色氨酸,L-组氨酸,香草酸,苯甲酸,L-苯丙氨酸,L-酪氨酸,L-精氨酸,L-鸟氨酸和甘氨酸。原儿茶酸可以用作生产例如香草醛,香草酸或愈创木酚的前体。原儿茶醛可以用作生产例如香草醛的前体。L-色氨酸可以用作生产例如褪黑激素的前体。L-组氨酸可以用作生产例如麦角硫因的前体。L-苯丙氨酸和L-酪氨酸各自可以用作生产例如阿魏酸,4-乙烯基愈创木酚或4-乙基愈创木酚的前体。L-精氨酸和L-鸟氨酸各自可以用作生产例如多胺的前体。L-精氨酸和甘氨酸各自可以用作生产例如肌酸的前体。作为前体,可以使用一种前体,或者可以组合使用两种或更多种前体。在前体是可以形成盐的化合物的情况下,前体可以作为游离化合物,其盐或其混合物使用。也就是说,术语“前体”可以指游离形式的前体,其盐或其混合物,除非另有说明。盐的实例可以包括例如硫酸盐,盐酸盐,碳酸盐,铵盐,钠盐和钾盐。作为前体的盐,可以使用一种盐,或者可以组合使用两种或更多种盐。
作为前体,可以使用商业产品,或者可以使用适当制备和获得的产品。也就是说,生物转化方法可以进一步包括生产前体的步骤。生产前体的方法没有特别限定,例如可以使用已知的方法。前体可以通过例如化学合成法,酶法,生物转化法,发酵法,提取方法或它们的组合来生产。也就是说,例如,目标物质的前体可以使用酶(该酶也可以称为“前体生物合成酶”)从其另外的前体产生,所述酶催化此类另外的前体转化成目标物质的前体。此外,例如,通过使用具有前体生产能力的微生物,可以从碳源或此类另外的前体生产目标物质的前体。短语“具有前体生产能力的微生物”可以指能够从碳源或其另外的前体生产目标物质的前体的微生物。例如,根据酶法或生物转化法生产原儿茶酸的方法的实例可以包括使用恶臭假单胞菌(Pseudomonas putida)KS-0180(日本专利公开(Kokai)No.7-75589)将对甲酚转化为原儿茶酸的方法,使用NADH依赖性对羟基苯甲酸羟化酶将对羟基苯甲酸转化为原儿茶酸的方法(日本专利公开(Kokai)No.5-244941),通过在含有对苯二甲酸的培养基中培养含有参与从对苯二甲酸生成原儿茶酸的反应的基因的转化体来生产原儿茶酸的方法(日本专利公开(Kokai)No.2007-104942),以及通过使用具有原儿茶酸生产能力并且具有原儿茶酸5-氧化酶活性降低或该活性缺乏的微生物从其前体生产原儿茶酸的方法(日本专利公开(Kokai)No.2010-207094)。此外,通过发酵生产原儿茶酸的方法的实例可以包括通过使用短杆菌属细菌和乙酸作为碳源生产原儿茶酸的方法(日本专利公开(Kokai)No.50-89592),通过使用引入有编码3-二氢莽草酸脱氢酶的基因的埃希氏菌属或克雷伯氏菌属细菌和葡萄糖作为碳源生产原儿茶酸的方法(美国专利号5,272,073)。此外,原儿茶醛可以通过根据使用ACAR的酶法或使用具有ACAR的微生物的生物转化法使用原儿茶酸作为前体生产。生产的前体可以原样或者根据需要进行适当的处理如浓缩,稀释,干燥,溶解,分馏,提取和纯化后用于生物转化方法。也就是说,作为前体,例如可以使用纯化至所需程度的纯化产物,或者可以使用含有前体的材料。含有前体的材料没有特别限制,只要微生物可以使用前体即可。含有前体的材料的具体实例可以包括通过培养具有前体生产能力的微生物获得的培养肉汤,与培养肉汤分离的培养上清液及其加工产物如其浓缩产物(如浓缩液体)和其干燥产物。
在一个实施方案中,生物转化步骤可以通过例如培养如本文中所述的微生物来进行。该实施方案也可以称为“生物转化方法的第一实施方案”。也就是说,生物转化步骤可以是例如在含有目标物质的前体的培养基中培养微生物以将该前体转化为目标物质的步骤。生物转化步骤具体可以是在含有目标物质的前体的培养基中培养微生物以在培养基中产生并积累目标物质的步骤。
要使用的培养基没有特别限制,只要培养基含有目标物质的前体,并且微生物可以在其中增殖并产生目标物质。培养条件没有特别限制,只要微生物可以增殖并且产生目标物质即可。关于发酵方法所提及的培养的描述,诸如关于培养基和培养条件的描述可以在必要修改后适用于生物转化方法的第一实施方案中的培养,只是培养基在第一实施方案中含有前体。
前体可以在整个培养期内存在在培养基中,或者可以在培养的部分时期期间存在在培养基中。也就是说,短语“在含有前体的培养基中培养微生物”并不一定意味着培养基中在整个培养期内都存在前体。例如,从培养开始起培养基中可以存在或可以不存在前体。当在培养开始时培养基中不存在前体时,在培养开始后将前体添加到培养基。添加的时机可以根据诸如培养期的长度等各种条件适当确定。例如,在微生物充分生长后,可以将前体添加到培养基中。此外,在任何情况下,可以根据需要将前体添加到培养基。例如,可以与伴随目标物质生成的前体的减少或消减成比例地对培养基添加前体。用于将前体添加到培养基的方法没有特别限制。例如,可以通过将含有前体的补料培养基补料到培养基来将前体供应给培养基。此外,例如,如本文中所述的微生物和具有前体生产能力的微生物可以共培养以允许具有前体生产能力的微生物在培养基中产生前体,从而将前体添加到培养基。这些添加方法可以独立使用,或者可以以适当的组合使用。前体在培养基中的浓度没有特别限制,只要微生物可以使用该前体作为目标物质的原料即可。前体在培养基中的浓度例如可以为0.1g/L或更高,1g/L或更高,2g/L或更高,5g/L或更高,10g/L或更高,或者15g/L或更高,或者可以是200g/L或更低,100g/L或更低,50g/L或更低,或者20g/L或更低,或者可以在由其组合限定的范围内(按游离化合物的重量计)。在整个培养期内,前体可以以或不以上文例示的范围内的浓度存在于培养基中。例如,在培养开始时前体可以以上文例示的范围内的浓度存在于培养基中,或者可以将其添加到培养基,从而在培养开始后获得上文例示的范围。在培养分别作为种子培养和主要培养进行的情况下,至少在主要培养期间产生目标物质是足够的。因此,足够的是至少在主要培养期间,即在主要培养的整个时期内或在主要培养的部分时期期间,培养基中存在前体,并且也就是说,在种子培养期间培养基中可以存在或可以不存在前体。在此类情况下,关于培养的术语,如“培养期(培养时期)”和“培养开始”可以理解为与主要培养有关的术语。
在另一个实施方案中,生物转化步骤也可以通过例如使用如本文中所述的微生物的细胞来进行。该实施方案也可以称为“生物转化方法的第二实施方案”。也就是说,生物转化步骤可以是例如通过使用微生物的细胞将反应混合物中的目标物质的前体转化成目标物质的步骤。生物转化步骤具体可以是使微生物的细胞作用于反应混合物中的目标物质的前体以在反应混合物中生成并积累目标物质的步骤。通过使用此类细胞进行的生物转化步骤也可以称为“转化反应”。
微生物的细胞可以通过培养微生物来获得。用于获得细胞的培养方法没有特别限制,只要微生物可以增殖即可。在用于获得细胞的培养时,前体可以存在或可以不存在于培养基中。此外,在用于获得细胞的培养时,培养基中可以产生或可以不产生目标物质。关于发酵方法中所述的培养的描述,例如关于培养基和培养条件的描述可以在必要修改后应用于获得用于生物转化方法的第二实施方案的细胞的培养。
细胞可以在存在于培养肉汤(具体是培养基)中时,或者在从培养肉汤(具体是培养基)中收集后用于转化反应。也可以根据需要在进行处理后将细胞用于转化反应。也就是说,细胞的实例可以包括含有细胞的培养肉汤,从培养肉汤中收集的细胞和其加工产物。换言之,细胞的实例可以包括存在于微生物的培养肉汤中的细胞,从培养肉汤中收集的细胞或存在于其加工产物中的细胞。加工产物的实例可以包括通过对细胞进行处理,特别地通过对含有细胞的培养肉汤或从培养肉汤中收集的细胞进行处理而获得的产物。这些形式的细胞可以独立使用,或者可以以适当的组合使用。
从培养基中收集细胞的方法没有特别限制,例如可以使用已知的方法。此类方法的实例可以包括例如自发沉淀,离心和过滤。也可以使用絮凝剂。这些方法可以独立使用,或者可以以适当的组合使用。收集的细胞可以根据需要通过使用合适的培养基进行清洗。收集的细胞可以根据需要通过使用适当的培养基重悬浮。可用于清洗或悬浮细胞的培养基的实例可以包括例如水性介质(水性溶剂),如水和缓冲水溶液。
细胞处理的实例可以包括例如稀释,冷凝,在载体如丙烯酰胺和角叉菜胶上固定化,冷冻和融化处理,以及增加细胞膜通透性的处理。例如,可以通过使用表面活性剂或有机溶剂来增加细胞膜的通透性。这些处理可以独立使用,或者可以以适当的组合使用。
用于转化反应的细胞没有特别限制,只要细胞具有目标物质生产能力。优选细胞保持其代谢活性。短语“细胞保持其代谢活性”可以表示细胞具有利用碳源产生或再生产生目标物质所需物质的能力。此类物质的实例可以包括例如ATP,电子供体如NADH和NADPH,以及甲基供体如SAM。细胞可以具有或可以不具有增殖能力。
转化反应可以在适当的反应混合物中进行。具体而言,转化反应可以通过使细胞和前体共存于适当的反应混合物中来进行。转化反应可以通过分批方法进行或可以通过柱方法进行。在分批法的情况下,转化反应可以通过例如将微生物的细胞和前体混合在反应容器中所含的反应混合物中来进行。转化反应可以静态进行,或者可以在搅拌或摇动反应混合物的情况下进行。在柱方法的情况下,转化反应可以通过例如使含有前体的反应混合物通过填充有固定化细胞的柱来进行。反应混合物的实例可以包括基于水性介质(水性溶剂)如水和水性缓冲液的那些。
除了前体之外,反应混合物可以根据需要含有除前体之外的组分。除前体以外的成分的实例可以包括ATP,电子供体诸如NADH,NADPH,甲基供体诸如SAM,金属离子,缓冲剂,表面活性剂,有机溶剂,碳源,磷酸盐源,和其它各种培养基成分。也就是说,例如,含有前体的培养基也可以用作反应混合物。也就是说,关于生物转化方法的第一实施方案中提及的培养基的描述也可以在必要修改后适用于生物转化方法的第二实施方案中的反应混合物。存在于反应混合物中的组分的类型和浓度可以根据各种条件来确定,例如待使用的前体的类型和待使用的细胞的形式。
转化反应的条件,诸如溶解氧浓度,反应混合物的pH,反应温度,反应时间,各种成分的浓度等没有特别限制,只要产生目标物质。转化反应可以用例如用于利用微生物细胞诸如静止细胞进行物质转化的典型条件来进行。转化反应的条件可以根据各种条件来确定,例如选择的微生物的类型。转化反应可以例如在需氧条件下进行。术语“需氧条件”可以指其中反应混合物中的溶解氧浓度为0.33ppm或更高,或1.5ppm或更高的条件。氧浓度可以控制为例如饱和氧浓度的1-50%,或约5%。反应混合物的pH值通常可以是例如6.0至10.0,或6.5至9.0。反应温度可以是例如15至50℃,或15至45℃,或20至40℃。反应时间可以是例如5分钟至200小时。在柱方法的情况下,反应混合物的加载速率可以是例如使得反应时间落入上述例示的反应时间范围内的速率。此外,转化反应也可以在例如培养条件下进行,例如用于培养微生物诸如细菌和真菌的典型条件。在转化反应期间,细胞可以增殖或可以不增殖。也就是说,关于生物转化方法的第一实施方案的培养条件的描述也可以在必要修改后适用于生物转化方法的第二实施方案中转化反应的条件,只是细胞可以或不可以在第二实施方案中增殖。在此类情况下,用于获得细胞的培养条件和转化反应的条件可以相同或不同。前体在反应混合物中的浓度例如可以为0.1g/L或更高,1g/L或更高,2g/L或更高,5g/L或更高,10g/L或更高,或者15g/L或更高,或者可以是200g/L或更低,100g/L或更低,50g/L或更低,或者20g/L或更低,或者可以在由其组合限定的范围内(按游离化合物的重量计)。例如,反应混合物中细胞的密度可以是1或更高,或者可以是300或更低,或者可以在其组合限定的范围内(按600nm的光密度(OD)计)。
在转化反应期间,可以将细胞,前体和其他组分独立地或以其任何任意组合添加到反应混合物。例如,可以与伴随目标物质产生的前体的减少或消耗成比例将前体添加到反应混合物。这些组分可以添加一次或多次,或者可以连续添加。
用于向反应混合物添加诸如前体的各种组分的方法没有特别限制。这些组分各自可以通过例如直接将它们加入到反应混合物中而添加到反应混合物中。此外,例如,可以将如本文中所述的微生物和具有前体生产能力的微生物共培养,以使具有前体生产能力的微生物在反应混合物中产生前体,从而将前体提供给反应混合物。此外,例如,组分如ATP,电子给体和甲基供体可以各自在反应混合物中产生或再生,可以在微生物的细胞中产生或再生,或者可以通过不同细胞之间的偶联反应产生或再生。例如,当微生物的细胞保持其代谢活性时,它们可以通过使用碳源在它们内部产生或再生诸如ATP,电子供体和甲基供体等组分。例如,具体地,微生物可以具有增强的SAM生成或再生能力,并且其生成或再生的SAM可以用于转化反应。SAM的生成或再生可以与用于生成或再生SAM的任何其他方法组合而得到进一步增强。另外,ATP生成或再生方法的实例可以包括例如通过使用棒状杆菌属细菌从碳源提供ATP的方法(Hori,H.et al.,Appl.Microbiol.Biotechnol.,48(6):693-698(1997)),通过使用酵母细胞和葡萄糖再生ATP的方法(Yamamoto,S et al.,Biosci.Biotechnol.Biochem.,69(4):784-789(2005)),使用磷酸烯醇丙酮酸和丙酮酸激酶再生ATP的方法(C.Aug'e and Ch.Gautheron,Tetrahedron Lett.,29:789-790(1988)),以及通过使用多磷酸和多磷酸激酶再生ATP的方法(Murata,K.et al.,Agric.Biol.Chem.,52(6):1471-1477(1988))。
此外,反应条件可以从转化反应的开始至结束是恒定的,或者它们可以在转化反应期间改变。表述“反应条件在转化反应期间改变”不仅可以包括当反应条件在时间上改变时,而且还包括当反应条件在空间上改变时。表述“反应条件在空间上改变”表示例如当通过柱法进行转化反应时,反应温度和孔密度等反应条件随流动中的位置而不同。
通过进行如上所述的生物转化步骤,获得培养肉汤(具体地培养基)或含有目标物质的反应混合物。目标物质的产生和目标物质的收集的确认可以以与上述发酵方法相同的方式进行。也就是说,生物转化方法可以进一步包括收集步骤,例如从培养肉汤(具体地培养基)或反应混合物中收集目标物质的步骤。除了目标物质之外,收集的目标物质可以包含例如微生物细胞,培养基组分,反应混合物组分,水分和微生物的副产物代谢物。收集的目标物质的纯度可以是,例如,30%(w/w)或更高,50%(w/w)或更高,70%(w/w)或更高,80%(w/w)或更高,90%(w/w)或更高,或95%(w/w)或更高。
<2-3>生产香草醛和其他目标物质的方法
当通过使用如本文所述的微生物,即通过发酵方法或生物转化方法生产目标物质时,由此产生的目标物质可以进一步转化为另一种目标物质。因此,本发明提供了制备第二目标物质,即目标物质B的方法,所述方法包括以下步骤:通过使用微生物,即通过发酵方法或生物转化方法产生第一目标物质,即目标物质A,并且将由此产生的第一目标物质A转化为第二目标物质B。
例如,当通过使用如本文所述的微生物,即通过发酵方法或生物转化方法生产香草酸时,由此产生的香草酸可以进一步转化为香草醛。因此,本发明提供了生产香草醛的方法,其包括通过使用微生物,即通过发酵方法或生物转化方法生产香草酸,并将由此产生的香草酸转化为香草醛的步骤。该方法也可以称为“香草醛生产方法”。
通过使用微生物产生的香草酸可以原样用于转化成香草醛,或者在根据需要进行适当的处理如浓缩,稀释,干燥,溶解,分馏,提取和纯化之后用于转化成香草醛。也就是说,作为香草酸,例如,可以使用纯化至期望程度的纯化产物,或者可以使用含有香草酸的物质。含有香草酸的物质没有特别限制,只要催化转化的组分(例如微生物和酶)可以使用香草酸。含有香草酸的材料的具体实例可以包括含有香草酸的培养肉汤或反应混合物,从培养肉汤或反应混合物中分离的上清液,及其加工产物,如浓缩产物,如其浓缩液及其干燥产物。
将香草酸转化为香草醛的方法没有特别限制。
可以通过例如使用具有ACAR的微生物的生物转化方法将香草酸转化为香草醛。具有ACAR的微生物可以以L-半胱氨酸生物合成酶的活性得以增加的方式或者可以不以L-半胱氨酸生物合成酶的活性得以增加的方式进行修饰。关于如本文所述的微生物的描述可以在必要的修改后适用于具有ACAR的微生物,只是具有ACAR的微生物可以以使L-半胱氨酸生物合成酶的活性得以增加的方式进行修饰或可以不以使L-半胱氨酸生物合成酶的活性得以增加的方式进行修饰。具有ACAR的微生物可以以ACAR、PPT和香草酸摄取系统中的一种或多种的活性得以增强的方式进行修饰。另外,关于使用微生物生产目标物质的生物转化方法的描述可以在必要的修改后适用于使用具有ACAR的微生物将香草酸转化为香草醛的生物转化方法。
也可以例如通过使用ACAR的酶方法将香草酸转化成香草醛。
ACAR可以通过允许具有ACAR基因的宿主表达ACAR基因来生成。ACAR也可以用无细胞蛋白质表达系统来生成。
具有ACAR基因的宿主也可以称为“具有ACAR的宿主”。具有ACAR基因的宿主可以是固有地具有ACAR基因的宿主,或者可以是经修饰而具有ACAR基因的宿主。固有地具有ACAR基因的宿主的实例可以包括衍生出上述示例的ACAR的生物体。经修饰而具有ACAR基因的宿主的实例可以包括已经引入有ACAR基因的宿主。此外,固有地具有ACAR基因的宿主可以以ACAR得以增加的方式进行修饰。用于表达ACAR的宿主不受特别限制,只要宿主可以表达可以起作用的ACAR即可。宿主的实例可以包括例如,微生物,如细菌和酵母(真菌),植物细胞,昆虫细胞和动物细胞。
可以通过培养具有ACAR基因的宿主来表达ACAR基因。培养方法没有特别限制,只要具有ACAR基因的宿主可以增殖并表达ACAR即可。关于发酵方法培养的描述可以在必要的修改后适用于具有ACAR基因的宿主的培养。必要时,可以诱导ACAR基因的表达。作为培养的结果,可以获得含有ACAR的培养肉汤。ACAR可以在宿主细胞和/或培养基中积累。
在宿主细胞,培养基等中包含的ACAR可以原样用于酶促反应,或者自其纯化的ACAR可以用于酶促反应。可以进行纯化到期望的程度。也就是说,作为ACAR,可以使用纯化的ACAR,或者可以使用含有ACAR的级分。此类级分没有特别限制,只要其中含有的ACAR可以作用于香草酸即可。此类级分的实例可以包括具有ACAR基因的宿主的培养肉汤,即具有ACAR的宿主;从培养肉汤中收集细胞;细胞的加工产物,如细胞破碎物,细胞裂解物,细胞提取物和固定化细胞,如用丙烯酰胺,角叉菜胶等固定化的细胞;从培养肉汤中收集的培养物上清液;其部分纯化产物,例如粗产物;及其组合。这些级分可以独立使用或与纯化的ACAR组合使用。
酶促反应可以通过允许ACAR作用于香草酸来进行。酶促反应的条件没有特别限制,只要产生香草醛即可。酶促反应可以用例如用于使用酶或微生物细胞如静息细胞进行物质转化的典型条件进行。例如,关于生物转化方法的第二实施方案中的转化反应的描述也可以在必要的修改后适用于香草醛生产方法中的酶促反应。
通过进行如上所述的转化获得含有香草醛的反应混合物。香草醛的产生和香草醛的收集的确认可以以与上述发酵方法相同的方式进行。也就是说,香草醛生产方法可以进一步包括从反应混合物中收集香草醛的步骤。除香草醛外,收集的香草醛可以含有例如微生物细胞,培养基组分,反应混合物组分,ACAR,水分和微生物的副产物代谢物。收集的香草醛的纯度可以是例如30%(w/w)或更高,50%(w/w)或更高,70%(w/w)或更高,80%(w/w)或更高,90%(w/w)或更高,或95%(w/w)更高。
香草酸也可以通过例如使用具有VDC的微生物的生物转化方法或使用VDC的酶促方法转化为愈创木酚。阿魏酸可以通过例如使用具有FDC的微生物的生物转化方法或使用FDC的酶促方法转化为4-乙烯基愈创木酚。4-乙烯基愈创木酚可以通过例如使用具有VPR的微生物的生物转化方法或使用VPR的酶促方法转化为4-乙基愈创木酚。通过这些方法的组合,阿魏酸也可以转化为4-乙基愈创木酚。具体地,阿魏酸可以通过例如与VPR或具有VPR的微生物组合同时或依次使用FDC或具有FDC的微生物,或使用具有FDC和VPR两者的微生物转化为4-乙基愈创木酚。关于香草醛生产方法的上述描述可以在必要的修改后适用于生产其他目标物质的方法。
实施例
下文,将参考以下非限制性实施例更具体地解释本发明。
在本实施例中,从作为亲本菌株的谷氨酸棒杆菌2256菌株(ATCC 13869)构建具有编码Crp家族表达调节蛋白的NCgl0120基因(cysR)的增强表达的菌株,并且用构建的菌株进行香草酸生产。
<1>香草酸脱甲基酶基因缺陷的菌株(FKS0165菌株)的构建
已经报道了在棒状杆菌细菌中,香草醛按香草醛->香草酸->原儿茶酸的顺序代谢,并利用(Current Microbiology,2005,Vol.51,pp.59-65)。从香草酸到原儿茶酸的转化反应由香草酸脱甲基酶催化。vanA基因和vanB基因分别编码香草酸脱甲基酶的亚基A和亚基B。vanK基因编码香草酸摄取系统,并与vanAB基因一起构成vanABK操纵子(M.T.Chaudhry,et al.,Microbiology,2007,153:857-865)。因此,首先通过缺失vanABK操纵子从谷氨酸棒杆菌2256菌株构建目标物质诸如香草醛和香草醛利用能力缺陷的菌株(FKS0165菌株)。程序如下所示。
<1-1>用于缺失vanABK基因的质粒pBS4SΔvanABK56的构建
通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板,和SEQ ID NO:51和52的合成DNA作为引物进行PCR,以获得含有vanA基因的N端侧编码区的PCR产物。分别通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板和SEQ ID NO:53和54的合成DNA作为引物进行PCR,以获得含有vanK基因的C端侧编码区的PCR产物。SEQ ID NO:52和53的序列彼此部分互补。然后,以近似等摩尔量混合含有vanA基因的N端侧编码区的PCR产物和含有vanK基因的C端侧编码区的PCR产物,并通过使用In Fusion HD克隆试剂盒(Clontech)将其插入用BamHI和PstI处理的pBS4S载体(WO2007/046389)中。利用该DNA,转化大肠杆菌JM109的感受态细胞(Takara Bio),并且将细胞应用于含有100μM IPTG,40μg/mL X-Gal和40μg/mL卡那霉素的LB培养基,并培养过夜。然后,挑取出现的白色菌落,并且分离成单菌落以获得转化体。从所获得的转化体中提取质粒,并将插入了靶PCR产物的质粒命名为pBS4SΔvanABK56。
<1-2>FKS0165菌株的构建
上面获得的pBS4SΔvanABK56不含能使质粒在棒状杆菌细菌细胞中自主复制的区域。因此,若用该质粒转化棒状杆菌细菌,则通过同源重组将该质粒掺入基因组中的菌株作为转化体出现,但它以非常低的频率发生。因此,通过电脉冲法将pBS4SΔvanABK56导入谷氨酸棒杆菌2256菌株。将细胞应用于含有25μg/mL卡那霉素的CM-Dex琼脂培养基(5g/L葡萄糖、10g/L聚胨、10g/L酵母提取物、1g/L KH2PO4、0.4g/L MgSO4-7H2O、0.01g/L FeSO4-7H2O、0.01g/L MnSO4-7H2O、3g/L尿素、1.2g/L大豆水解物、10μg/L生物素、15g/L琼脂,用NaOH调节到pH 7.5),并在31.5℃培养。通过PCR确认生长的菌株是一次重组菌株,其中通过同源重组将pBS4SΔvanABK56掺入基因组中。此一次重组的菌株具有野生型vanABK基因和缺陷型vanABK基因两者。
将一次重组菌株在CM-Dex液体培养基(与CM-Dex琼脂培养基具有相同的组成,只是它不含琼脂)中培养过夜,并将该培养肉汤应用于S10琼脂培养基(100g/L蔗糖,10g/L聚胨,10g/L酵母提取物,1g/L KH2PO4,0.4g/L MgSO4-7H2O,0.01g/L FeSO4-7H2O,0.01g/LMnSO4-4-5H2O,3g/L尿素,1.2g/L大豆蛋白水解物溶液,10μg/L生物素,20μg/L琼脂,用NaOH调节至pH7.5,并在120℃高压灭菌20分钟),并在31.5℃培养。在出现的菌落中,在CM-Dex琼脂培养基上纯化显示卡那霉素易感性的菌株。通过从纯化的菌株中制备基因组DNA,并使用它用SEQ ID NO:55和56的合成DNA作为引物进行PCR,确认了vanABK基因的缺失,并将该菌株命名为FKS0165菌株。
<2>醇脱氢酶同源基因缺陷菌株(FKFC14菌株)的构建
随后,通过使用谷氨酸棒杆菌菌株FKS0165作为亲本株,通过以下程序构建菌株FKFC14,其是醇脱氢酶同源基因(即NCgl0324基因(adhC)、NCgl0313基因(adhE)、和NCgl2709gene(adhA))缺陷的。
<2-1>FKFC5菌株(FKS0165ΔNCgl0324菌株)的构建
<2-1-1>用于缺失NCgl0324基因的质粒pBS4SΔ2256adhC的构建
通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板,和SEQ ID NO:57和58的合成DNA作为引物进行PCR,以获得含有NCgl0324基因的N端侧编码区的PCR产物。分别通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板,和SEQ ID NO:59和60的合成DNA作为引物进行PCR,以获得含有NCgl0324基因的C端侧编码区的PCR产物。SEQ ID NO:58和59的序列彼此部分互补。然后,将约等摩尔量的含有NCgl0324基因的N端侧编码区的PCR产物和含有NCgl0324基因的C端侧编码区的PCR产物混合,并通过使用In Fusion HD克隆试剂盒(Clontech)插入已经用BamHI和PstI处理的pBS4S载体(WO2007/046389)中。利用该DNA,转化大肠杆菌JM109的感受态细胞(Takara Bio),并且将细胞应用于含有100μM IPTG,40μg/mL X-Gal和40μg/mL卡那霉素的LB培养基,并培养过夜。然后,挑取出现的白色菌落,分离成单菌落以获得转化体。从所获得的转化体中提取质粒,并将其中插入了靶PCR产物的质粒命名为pBS4SΔ2256adhC。
<2-1-2>FKFC5菌株(FKS0165ΔNCgl0324菌株)的构建
由于上述获得的pBS4SΔ2256adhC不含使质粒能够在棒状杆菌细菌细胞中自主复制的区域,若用该质粒转化棒状杆菌细菌,则通过同源重组将该质粒掺入基因组中的菌株作为转化体出现,但它以非常低的频率发生。因此,通过电脉冲法将pBS4SΔ2256adhC导入谷氨酸棒杆菌FKS0165菌株。将细胞应用于含有25μg/mL卡那霉素的CM-Dex琼脂培养基,并在31.5℃培养。通过PCR确认,生长的菌株是通过同源重组将pBS4SΔ2256adhC掺入基因组中的一次重组菌株。此一次重组菌株具有野生型NCgl0324基因和缺陷型NCgl0324基因两者。
将一次重组的菌株在CM-Dex液体培养基中培养过夜,将培养肉汤应用到S10琼脂培养基,并在31.5℃进行培养。在出现的菌落中,在CM-Dex琼脂培养基上纯化显示卡那霉素易感性的菌株。从纯化的菌株制备基因组DNA,并用SEQ ID NO:61和62的合成DNA作为引物进行PCR以确认NCgl0324基因的缺失,并将该菌株命名为FKFC5菌株。
<2-2>FKFC11菌株(2256ΔvanABKΔNCgl0324ΔNCgl0313菌株)的构建
<2-2-1>用于缺失NCgl0313基因的质粒pBS4SΔ2256adhE的构建
通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板和SEQ ID NO:63和64的合成DNA作为引物进行PCR,以获得含有NCgl0313基因的N端侧编码区的PCR产物。分别通过使用谷氨酸棒杆菌2256菌株的基因组DNA为模板和SEQ ID NO:65和66的合成DNA为引物进行PCR,以获得含有NCgl0313基因的C端侧编码区的PCR产物。SEQ ID NO:64和65的序列彼此部分互补。然后,将约等摩尔量的含有NCgl0313基因的N端侧编码区的PCR产物和含有NCgl0313基因的C端侧编码区的PCR产物混合,并通过使用In Fusion HD克隆试剂盒(Clontech)将其插入用BamHI和PstI处理的pBS4S载体(WO2007/046389)中。利用该DNA,转化大肠杆菌JM109的感受态细胞(Takara Bio),并且将细胞应用于含有100μM IPTG,40μg/mL X-Gal和40μg/mL卡那霉素的LB培养基,并培养过夜。然后,挑取出现的白色菌落,并且分离成单菌落以获得转化体。从获得的转化体中提取质粒,并将其中插入了靶PCR产物的质粒命名为pBS4SΔ2256adhE。
<2-2-2>FKFC11菌株(2256ΔvanABKΔNCgl0324ΔNCgl0313株)的构建
由于上述获得的pBS4SΔ2256adhE不含有使质粒能够在棒状杆菌细菌细胞中的自主复制的区域,若用该质粒转化棒状杆菌,则通过同源重组将该质粒掺入基因组中的菌株作为转化体出现,但它在非常低的频率发生。因此,通过电脉冲方法将pBS4SΔ2256adhE导入谷氨酸棒杆菌FKFC5菌株。将细胞应用于含有25μg/mL卡那霉素的CM-Dex琼脂培养基,并在31.5℃下培养。通过PCR证实,生长的菌株是一次重组菌株,其中通过同源重组将pBS4SΔ2256adhE掺入基因组中。此一次重组菌株具有野生型NCgl0313基因和缺陷型NCgl0313基因两者。
将一次重组的菌株在CM-Dex液体培养基中培养过夜,将培养肉汤应用到S10琼脂培养基上,并在31.5℃进行培养。在出现的菌落中,显示卡那霉素易感性的菌株在CM-Dex琼脂培养基上纯化。从纯化的菌株制备基因组DNA,并使用SEQ ID NO:67和68的合成DNA作为引物进行PCR以确认NCgl0313基因的缺失,并将该菌株命名为FKFC11菌株。
<2-3>FKFC14菌株(2256ΔvanABKΔNCgl0324ΔNCgl0313ΔNCgl2709株)的构建
<2-3-1>用于缺失NCgl2709基因的质粒pBS4SΔ2256adhA的构建
通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板和SEQ ID NO:69和70的合成DNA作为引物进行PCR以获得含有NCgl2709基因的N端侧编码区的PCR产物。分别通过使用谷氨酸棒杆菌2256菌株的基因组DNA为模板和SEQ ID NO:71和72的合成DNA作为引物进行PCR,以得到含有NCgl2709基因的C端侧编码区的PCR产物。SEQ ID NO:70和71的序列彼此部分互补。然后,将约等摩尔量的含有NCgl2709基因的N端侧编码区的PCR产物和含有NCgl2709基因的C端侧编码区的PCR产物混合,并通过使用In Fusion HD克隆试剂盒(Clontech)插入到用BamHI和PstI处理的pBS4S载体中。利用该DNA,转化大肠杆菌JM109的感受态细胞(Takara Bio),并且将细胞应用于含有100μM IPTG,40μg/mL X-Gal和40μg/mL卡那霉素的LB培养基,并培养过夜。然后,挑取出现的白色菌落,并且分离成单菌落以获得转化体。从获得的转化体中提取质粒,并将其中插入了靶PCR产物的质粒命名为pBS4SΔ2256adhA。
<2-3-2>FKFC14菌株(2256ΔvanABKΔNCgl0324ΔNCgl0313ΔNCgl2709菌株)的构建
由于上文获得的pBS4SΔ2256adhA不含能够使质粒在棒状杆菌细菌细胞中自主复制的区域,若用该质粒转化棒状杆菌,则通过同源重组将该质粒掺入基因组的菌株作为转化体出现,但它在非常低的频率发生。因此,通过电脉冲法将pBS4SΔ2256adhA导入谷氨酸棒杆菌FKFC11菌株。将细胞应用于含有25μg/mL卡那霉素的CM-Dex琼脂培养基,并在31.5℃培养。通过PCR确认,生长的菌株是通过同源重组将pBS4SΔ2256adhA掺入基因组中的一次重组菌株。该一次重组菌株具有野生型NCgl2709基因和缺陷型NCgl2709基因两者。
将一次重组的菌株在CM-Dex液体培养基中培养过夜,将培养肉汤应用到S10琼脂培养基上,并在31.5℃进行培养。在出现的菌落中,显示卡那霉素易感性的菌株在CM-Dex琼脂培养基上纯化。从纯化的菌株制备基因组DNA,并用SEQ ID NO:73和74的合成DNA作为引物进行PCR以确认NCgl2709基因的缺失,并将该菌株命名为FKFC14菌株。
<3>原儿茶酸双加氧酶基因缺陷菌株(FKFC14ΔpcaGH菌株)的构建
随后,通过使用谷氨酸棒杆菌FKFC14菌株作为亲本菌株,通过外包构建菌株FKFC14ΔpcaGH,其是编码原儿茶酸3,4-双加氧酶的α亚基和β亚基的NCgl2314基因(pcaG)和NCgl2315基因(pcaH)缺陷的。也可以经由以下程序构建FKFC14ΔpcaGH菌株。
<3-1>用于缺失NCgl2314和NCgl2315基因的质粒pBS4SΔ2256pcaGH的构建
NCgl2314和NCgl2315基因彼此相邻,因此可以一起缺失这些基因。通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板,和SEQ ID NO:75和76的合成DNA作为引物进行PCR以获得含有NCgl2315基因的上游区的PCR产物。分别通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板和SEQ ID NO:77和78的合成DNA作为引物进行PCR,以获得含有NCgl2314基因的下游区的PCR产物。SEQ ID NO:76和77的序列彼此部分互补。然后,混合近似等摩尔量的含有NCgl2315基因的上游区的PCR产物和含有NCgl2314基因的下游区的PCR产物,并通过使用In Fusion HD克隆试剂盒(Clontech)将其插入用BamHI和PstI处理的pBS4S载体(WO2007/046389)中。利用该DNA,转化大肠杆菌JM109的感受态细胞(TakaraBio),并且将细胞应用于含有100μM IPTG,40μg/mL X-Gal和40μg/mL卡那霉素的LB培养基,并培养过夜。然后,挑取出现的白色菌落,并且分离成单菌落以获得转化体。从所获得的转化体中提取质粒,并将插入了靶PCR产物的质粒命名为pBS4SΔ2256pcaGH。
<3-2>FKFC14ΔpcaGH菌株的构建
由于上面获得的pBS4SΔ2256pcaGH不含能使质粒在棒状杆菌细菌细胞中自主复制的区域,若用该质粒转化棒状杆菌细菌,则通过同源重组将该质粒掺入基因组中的菌株作为转化体出现,但它以非常低的频率发生。因此,通过电脉冲法将pBS4SΔ2256pcaGH导入谷氨酸棒杆菌FKFC14菌株。将细胞应用于含有25μg/mL卡那霉素的CM-Dex琼脂培养基,并在31.5℃培养。通过PCR确认生长的菌株是一次重组菌株,其中通过同源重组将pBS4SΔ2256pcaGH掺入基因组中。此一次重组的菌株具有野生型NCgl2314和NCgl2315基因,和缺陷型NCgl2314和NCgl2315基因两者。
将一次重组菌株在CM-Dex液体培养基中培养过夜,并将该培养培养基应用于S10琼脂培养基,并在31.5℃培养。在出现的菌落中,在CM-Dex琼脂培养基上纯化显示卡那霉素易感性的菌株。通过从纯化的菌株中制备基因组DNA,并使用它用SEQ ID NO:79和80的合成DNA作为引物进行PCR,确认了NCgl2314和NCgl2315基因的缺失,并将该菌株命名为FKFC14ΔpcaGH菌株。
<4>Ap1_0007菌株(FKFC14ΔpcaGH P2::NCgl0120菌株)的构建
随后,通过使用谷氨酸棒杆菌FKFC14ΔpcaGH菌株作为亲本菌株,通过外包构建菌株Ap1_0007,其中编码Crp家族表达调节蛋白的NCgl0120基因(cysR)的启动子区已经用P2启动子替换。此菌株中含有P2启动子的基因组区域的核苷酸序列以SEQ ID NO:108显示,其中位置942-1034对应于P2启动子。也可以经由以下程序构建Ap1_0007菌株。
<4-1>用于替换NCgl0120基因启动子的质粒pBS4SP2::NCgl0120的构建
通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板,和SEQ ID NO:81和82的合成DNA作为引物进行PCR以获得含有NCgl0120基因的上游区的PCR产物。分别通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板和SEQ ID NO:83和84的合成DNA作为引物进行PCR,以获得含有NCgl0120基因的下游区的PCR产物。另外,通过人工基因合成获得含有P2启动子区的SEQ ID NO:85的DNA片段。然后,通过使用SEQ ID NO:85的DNA片段作为模板,和SEQ ID NO:86和87的合成DNA作为引物进行PCR,以获得含有P2启动子的PCR产物。SEQ IDNO:82和86的序列彼此部分互补,并且SEQ ID NO:83和87的序列彼此部分互补。然后,混合近似等摩尔量的含有NCgl0120基因的上游区的PCR产物、含有NCgl0120基因的N端侧编码区的PCR产物和含有P2启动子的PCR产物,并通过使用In Fusion HD克隆试剂盒(Clontech)将其插入用BamHI和PstI处理的pBS4S载体(WO2007/046389)中。利用该DNA,转化大肠杆菌JM109的感受态细胞(Takara Bio),并且将细胞应用于含有100μM IPTG,40μg/mL X-Gal和40μg/mL卡那霉素的LB培养基,并培养过夜。然后,挑取出现的白色菌落,并且分离成单菌落以获得转化体。从所获得的转化体中提取质粒,并将插入了靶PCR产物的质粒命名为pBS4SP2::NCgl0120。
<4-2>Ap1_0007菌株的构建
由于上面获得的pBS4SP2::NCgl0120不含能使质粒在棒状杆菌细菌细胞中自主复制的区域,若用该质粒转化棒状杆菌细菌,则通过同源重组将该质粒掺入基因组中的菌株作为转化体出现,尽管它以非常低的频率发生。因此,通过电脉冲法将pBS4SP2::NCgl0120导入谷氨酸棒杆菌FKFC14ΔpcaGH菌株。将细胞应用于含有25μg/mL卡那霉素的CM-Dex琼脂培养基,并在31.5℃培养。通过PCR确认生长的菌株是一次重组菌株,其中通过同源重组将pBS4SP2::NCgl0120掺入基因组中。
将一次重组菌株在CM-Dex液体培养基中培养过夜,并将该培养培养基应用于S10琼脂培养基,并在31.5℃培养。在出现的菌落中,在CM-Dex琼脂培养基上纯化显示卡那霉素易感性的菌株。通过从纯化的菌株中制备基因组DNA,并用于进行核苷酸序列分析以确认P2启动子位于NCgl0120基因上游,并且该菌株命名为Ap1_0007菌株。
<5>用于表达智人OMT基因的质粒pVK9::PcspB-hsomt的构建
<5-1>质粒pEPlac-COMT2的构建
对于智人OMT基因已知两种OMT同种型,即较短的OMT同种型(S-COMT)和较长的OMT同种型(MB-COMT)。S-COMT的氨基酸序列以SEQ ID NO:16显示,并且编码S-COMT的野生型cDNA的核苷酸序列以SEQ ID NO:112显示。对S-COMT的野生型cDNA进行了密码子优化以在大肠杆菌中表达并且使用由ATG Service Gen(Russian Federation,Saint-Petersburg)提供的服务进行化学合成。为了便于进一步克隆,合成在3’和5’端分别具有限制酶NdeI和SacI的位点的基因的DNA片段。经密码子优化的S-COMT cDNA也可以称为COMT2基因。含有COMT2基因的合成DNA片段的核苷酸序列以SEQ ID NO:113显示。在pUC57载体(GenScript)中获得含有COMT2基因的合成DNA片段。
在T7系统中确认COMT2基因的表达。将pUC57载体中插入的COMT2基因再克隆到pET22(+)载体(Novagen)的NdeI和SacI限制性位点中。将获得的质粒导入大肠杆菌BL21(DE3)细胞(Novagen)中。在含有200mg/l氨苄青霉素的LB培养基(胰蛋白胨,10g/l;酵母提取物,5g/l;NaCl,10g/l)中培养含有质粒的细胞,并且在指数生长期中在2小时内通过IPTG,1mM诱导。通过超声处理破坏细胞。使用12%SDS-PAGE中的电泳分析粗制蛋白质提取物。鉴定出对应于S-OMT的条带(约24kDa),并且从凝胶中切出。从凝胶中分离目标蛋白,并且用胰蛋白酶处理。使用质谱法分析获得的胰蛋白酶水解物以确认COMT2基因表达。
将pUC57载体中插入的COMT2基因再克隆到pELAC载体的NdeI和SacI限制性位点中(SEQ ID NO:114,Smirnov S.V.et al.,Appl.Microbiol.Biotechnol.,2010,88(3):719-726)。通过用含有PlacUV5启动子的合成BglII-XbaI片段替换pET22b(+)(Novagen)的BglII-XbaI片段构建pELAC载体。为了将COMT2基因插入pELAC载体中,使用T4DNA连接酶(Fermentas,Lithuania)如供应商推荐的那样进行连接反应。用乙醇处理连接混合物,并且将获得的沉淀物溶于水中,并且使用电穿孔(Micro Pulser,BioRad)在由供应商推荐的条件下导入大肠杆菌TG1细胞中。将细胞应用到补充有氨苄青霉素(200mg/L)的LA板(200mg/L)(Sambrook J.and Russell D.W.,Molecular Cloning:A Laboratory Manual(第3版),Cold Spring Harbor Laboratory Press,2001)上,并且于37℃培养过夜。使用PCR分析测试获得的菌落以选择需要的克隆。使用引物P1和P2(SEQ ID NO:115和116)来选择含有COMT2基因的菌落。当使用载体特异性引物P1和用于终止COMT2基因的反向引物P2时获得DNA片段(713bp)。因此,构建载体pEPlac-COMT2。使用引物P1和P3(SEQ ID NO:115和117)测定克隆的COMT2基因的序列。
<5-2>质粒pVK9::PcspB-hsomt的构建
通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板,和SEQ ID NO:118和119的合成DNA作为引物进行PCR以获得含有cspB基因的启动子区和SD序列的PCR产物。分开地,也通过使用质粒pEPlac-COMT2作为模板和SEQ ID NO:120和121的合成DNA作为引物进行PCR以获得含有COMT2基因的PCR产物。然后,通过使用In Fusion HD克隆试剂盒(Clontech)将这些PCR产物插入用BamHI和PstI处理的pVK9载体(WO2007/046389)中。pVK9载体是棒状杆菌细菌和大肠杆菌的穿梭载体。用此DNA转化大肠杆菌JM109的感受态细胞(TakaraBio),并且将细胞应用于含有100μM IPTG、40μg/mL X-Gal和25μg/mL卡那霉素的LB培养基,并且培养过夜。然后,挑出出现的白色菌落,并且分成单菌落以获得转化体。从获得的转化体提取质粒,并且插入有靶PCR产物的质粒命名为pVK9::PcspB-hsomt。
<6>香草酸生产菌株的构建
通过外包构建谷氨酸棒杆菌FKFC14ΔpcaGH/pVK9::PcspB-hsomt和Ap1_0007/pVK9::PcspB-hsomt菌株(其含有质粒pVK9::PcspB-hsomt)。也可以经由以下程序构建这些菌株。
通过电脉冲方法将质粒pVK9::PcspB-hsomt导入谷氨酸棒杆菌FKFC14ΔpcaGH和Ap1_0007菌株中。将细胞应用于含有25μg/mL卡那霉素的CM-Dex琼脂培养基中,并且于31.5℃培养。在相同的琼脂培养基上纯化生长的菌株,并且分别命名为FKFC14ΔpcaGH/pVK9::PcspB-hsomt和Ap1_0007/pVK9::PcspB-hsomt。
将这些菌株各自接种到试管中存在的4mL不含mameno的CM-Dex培养基(5g/L葡萄糖、10g/L聚胨、10g/L酵母提取物、1g/L KH2PO4、0.4g/L MgSO4-7H2O、0.01g/L FeSO4-7H2O、0.01g/L MnSO4-7H2O、3g/L尿素、10μg/L生物素,用KOH调节到pH 7.5)中,并且于31.5℃在摇动的情况下培养约16小时,所述不含mameno的CM-Dex培养基含有25μg/mL卡那霉素。将获得的培养肉汤的0.9mL等分试样与0.6mL 50%甘油水溶液混合以获得甘油储液,并且于-80℃贮存。
<7>谷氨酸棒杆菌FKFC14ΔpcaGH/pVK9::PcspB-hsomt和Ap1_0007/pVK9::PcspB-hsomt菌株的香草酸生产
将FKFC14ΔpcaGH/pVK9::PcspB-hsomt和Ap1_0007/pVK9::PcspB-hsomt菌株的甘油储液的各5μL等分试样接种到试管中存在的4mL不含mameno,且含有25μg/mL卡那霉素的CM-Dex培养基,并且于31.5℃在摇动的情况下培养20小时作为预培养物。将获得的预培养物肉汤的0.5mL等分试样接种到具有挡板的锥形瓶中存在的50mL不含mameno,且含有25μg/mL卡那霉素的CM-Dex培养基,并且于31.5℃在摇动的情况下培养20小时。以8000rpm将获得的培养物肉汤离心5分钟,除去上清液,并且在经灭菌的生理盐水中悬浮细胞。测量细胞悬浮液的光密度(OD),并且用生理盐水稀释细胞悬浮液以获得600nm处的OD为50。将稀释的细胞悬浮液的5mL等分试样接种到具有挡板的锥形瓶中存在的20mL含有25μg/mL卡那霉素的香草酸生产培养基(75g/L葡萄糖、0.6g/L MgSO4-7H2O、6.3g/L(NH4)2SO4、2.5g/L KH2PO4、12.5mg/L FeSO4-7H2O、12.5mg/L MnSO4-4-5H2O、2.5g/L酵母提取物、150μg/L维生素B1、150μg/L生物素、6.9g/L原儿茶酸,用KOH调节到pH 7,然后与37.5g/L CaCO3(用180℃的热空气灭菌3小时)混合)中,并且于31.5℃在摇动的情况下培养24小时。
在培养开始和完成时,用Biotech分析仪AS-310(Sakura SI)分析培养基中的葡萄糖浓度。也通过使用超高效液相层析NEXERA X2系统(SHIMADZU)用以下条件分析培养基中的原儿茶酸和香草酸浓度。
UPLC分析条件:
柱:KINETEX 2.6μm XB-C18,150 x 30mm(Phenomenex)
炉温度:40℃
流动相(A):0.1%三氟乙酸
流动相(B):0.1%三氟乙酸/80%乙腈
梯度程度(时间,A(%),B(%)):(0,90,10)->(3,80,20)
流速:1.5ml/min
表1中显示了结果。对Ap1_0007/pVK9::PcspB-hsomt菌株观察到的培养基中的香草酸浓度是对FKFC14ΔpcaGH/pVK9::PcspB-hsomt菌株观察到的香草酸浓度的约1.3倍。
[表1]
表1:谷氨酸棒杆菌香草酸生产菌株的香草酸生产
Figure BDA0002041690010000671
Figure BDA0002041690010000672
<8>通过定量PCR分析NCgl0120基因(cysR)的表达量
随后,通过数字PCR分析FKFC14ΔpcaGH/pVK9::PcspB-hsomt和Ap1_0007/pVK9::PcspB-hsomt菌株中的NCgl0120基因(cysR)表达量。
<8-1>RNA的制备
将含有细胞的培养肉汤的250μL等分试样与500μL RNA Protect BacteriaReagent(QIAGEN)混合,并且于-80℃贮存,所述培养肉汤对于FKFC14ΔpcaGH/pVK9::PcspB-hsomt和Ap1_0007/pVK9::PcspB-hsomt菌株的每种在实施例<7>中在培养开始后5小时获得。于室温融化冷冻的混合物,与200μL含有溶菌酶的TE缓冲液(10mM Tris,1mM EDTA,pH 8.0)以及与10μL蛋白酶K(20mg/mL)一起添加,混合,然后于室温温育40分钟。使用RNeasy Mini试剂盒(QIAGEN)进行以下程序。将经处理的产物与700μL含有1%2-巯基乙醇的RLT缓冲液一起添加,混合,并且离心以获得上清液。将上清液与500μL乙醇一起添加,混合,并且应用到试剂盒中包含柱,并且将柱离心。用350μL RW1缓冲液清洗柱,然后将80μLDNA酶I溶液添加到柱以于室温进行DNA酶处理15分钟。此外,用350μL RW1缓冲液清洗柱,并且用500μL RPE缓冲液清洗两次,并且用无RNA酶的灭菌水洗脱以获得RNA。使用NanoDrop(Thermo Fisher Scientific)量化获得的RNA,并且使用BioAnalyer(AgilentTechnologies)用RNA6000Nano试剂盒(Agilent Technologies)通过进行电泳分析以确认获得的RNA具有足够的纯度。
<8-2>通过反向转录合成cDNA
使用具有gDNAEraser的PrimeScript RT试剂试剂盒(TAKARABIO)进行逆转录。将1μg RNA等分试样与1μL gDNAEraser和2μL 5×DNAEraser缓冲液一起添加,用直至总体积10μL的灭菌水稀释,并且于42℃温育2min以降解染色体DNA。将所得的混合物与4μL 5×PrimeScript Buffer2、1μL PrimeScript RT酶混合物I、1μL RT引物混合物和4μL灭菌水进一步一起添加,于37℃温育15分钟和85℃温育5秒以获得cDNA。
<8-3>液滴制备
为了PCR扩增NCgl0120基因(cysR),混合2.2μL cDNA(对应于110ng模板RNA)、11μL2×EvaGreen Mix(BIORAD)、各0.44μL SEQ ID NO:122和123(5μM)的引物和7.92μL灭菌水以获得总体积22μL,并且使用具有EvaGreen的自动化液滴发生器油(BIORAD)的自动化液滴发生器(BIORAD)制备液滴。另外,为了PCR扩增16S rRNA作为对照,也用相同的程序制备液滴,只是使用2.2μL 10000倍稀释的cDNA(对应于11pg模板RNA)和各0.44μL SEQ ID NO:124和125引物(5μM)作为模板和引物。
<8-4>PCR
将制备的液滴设置到S1000热循环仪(BIORAD),并且在于95℃变性5min,接着是95℃达30sec和60℃达1min,然后4℃达5min和90℃达5min的40个循环,最终保持于4℃的情况下进行PCR。在所有PCR步骤中,将变温速度(Ramp Rate)设置于2℃/sec。
<8-5>分析基因的拷贝数
将PCR后的样品设置于液滴阅读器QX200液滴数字PCR系统(BIORAD),并且将20μL每种样品(对应于100ng NCgl0120基因(cysR)的模板RNA,或10pg 16S rRNA的模板RNA)加载到设备。用软件QuantaSoft(BIORAD)分析结果以分析每100ng模板RNA的NCgl0120基因(cysR)的拷贝数。关于16S rRNA,用软件QuantaSoft(BIORAD)计算每10pg模板的其拷贝数,然后将计算的数值转化成每100ng的。此外,基于对FKFC14ΔpcaGH/pVK9::PcspB-hsomt菌株观察到的数值(其数值定义为1),计算对Ap1_0007/pVK9::PcspB-hsomt菌株观察到的NCgl0120基因(cysR)的相对拷贝数。
表2和3中显示了结果。虽然对Ap1_0007/pVK9::PcspB-hsomt菌株观察到的16SrRNA的拷贝数几乎等于对FKFC14ΔpcaGH/pVK9::PcspB-hsomt菌株观察到的数值,但是对Ap1_0007/pVK9::PcspB-hsomt菌株观察到的NCgl0120基因(cysR)的拷贝数高于对FKFC14ΔpcaGH/pVK9::PcspB-hsomt菌株观察到的拷贝数(表2)。具体地,对Ap1_0007/pVK9::PcspB-hsomt菌株观察到的NCgl0120基因(cysR)的相对拷贝数(即,相对表达量)是对FKFC14ΔpcaGH/pVK9::PcspB-hsomt菌株观察到的拷贝数的约2.7倍(表3)。
[表2]
表2:每100ng模板RNA的NCgl0120基因(cysR)和16S rRNA的拷贝数
菌株 16S rRNA cysR
FKFC14ΔpcaGH/pVK9::PcspB-hsomt 1.4×109 4.2×104
Ap1_0007/pVK9::PcspB-hsomt 1.5×109 1.1×105
[表3]
表3:NCgl0120基因(cysR)的相对拷贝数
菌株 cysR
FKFC14ΔpcaGH/pVK9::PcspB-hsomt 1
Ap1_0007/pVK9::PcspB-hsomt 2.7
<9>构建Dp2_0157菌株(FKFC14ΔpcaGH P2::NCgl0120P8::NCgl2048P6::NCgl2473菌株)
<9-1>Bp1_0112菌株(FKFC14ΔpcaGH P2::NCgl0120P8::NCgl2048菌株)的构建
通过使用谷氨酸棒杆菌Ap1_0007菌株作为亲本菌株,通过外包构建菌株Bp1_0112,其中NCgl2048基因的启动子区已经用P8启动子替换以弱化此基因的表达。此菌株中含有P8启动子的基因组区的核苷酸序列以SEQ ID NO:110显示,其中位置901-1046对应于P8启动子。Bp1_0112菌株也可以经由以下程序构建。
<9-1-1>用于替换NCgl2048基因启动子的质粒pBS4SP8::NCgl2048的构建
通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板,和SEQ ID NO:126和127的合成DNA作为引物进行PCR以获得含有NCgl2048基因的上游区的PCR产物。分别通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板和SEQ ID NO:128和129的合成DNA作为引物进行PCR,以获得含有NCgl2048基因的N端侧编码区的PCR产物。另外,通过人工基因合成获得含有P8启动子区的SEQ ID NO:130的DNA片段。然后,通过使用SEQ ID NO:130的DNA片段作为模板,和SEQ ID NO:131和132的合成DNA作为引物进行PCR,以获得含有P8启动子的PCR产物。SEQ ID NO:127和131的序列彼此部分互补,并且SEQ ID NO:128和132的序列彼此部分互补。然后,混合近似等摩尔量的含有NCgl2048基因的上游区的PCR产物、含有NCgl2048基因的N端侧编码区的PCR产物和含有P8启动子的PCR产物,并通过使用In Fusion HD克隆试剂盒(Clontech)将其插入用BamHI和PstI处理的pBS4S载体(WO2007/046389)中。利用该DNA,转化大肠杆菌JM109的感受态细胞(Takara Bio),并且将细胞应用于含有100μM IPTG,40μg/mL X-Gal和40μg/mL卡那霉素的LB培养基,并培养过夜。然后,挑取出现的白色菌落,并且分离成单菌落以获得转化体。从所获得的转化体中提取质粒,并将插入了靶PCR产物的质粒命名为pBS4SP8::NCgl2048。
<9-1-2>Bp1_0112菌株的构建
由于上面获得的pBS4SP8::NCgl2048不含能使质粒在棒状杆菌细菌细胞中自主复制的区域,若用该质粒转化棒状杆菌细菌,则通过同源重组将该质粒掺入基因组中的菌株作为转化体出现,尽管它以非常低的频率发生。因此,通过电脉冲法将pBS4SP8::NCgl2048导入谷氨酸棒杆菌Ap1_0007菌株。将细胞应用于含有25μg/mL卡那霉素的CM-Dex琼脂培养基,并在31.5℃培养。通过PCR确认生长的菌株是一次重组菌株,其中通过同源重组将pBS4SP8::NCgl2048掺入基因组中。
将一次重组菌株在CM-Dex液体培养基中培养过夜,将该培养培养基应用于S10琼脂培养基,并在31.5℃培养。在出现的菌落中,在CM-Dex琼脂培养基上纯化显示卡那霉素易感性的菌株。通过从纯化的菌株中制备基因组DNA,并用于进行核苷酸序列分析以确认P8启动子位于NCgl2048基因上游,并且该菌株命名为Bp1_0112菌株。
<9-2>Dp2_0157菌株(FKFC14ΔpcaGH P2::NCgl0120P8::NCgl2048P6::NCgl2473菌株)的构建
随后,通过使用谷氨酸棒杆菌Bp1_0112菌株作为亲本菌株,通过外包构建菌株Dp2_0157,其中编码O-乙酰丝氨酸(硫醇)-裂合酶的NCgl2473基因(cysK)的启动子区已经用P6启动子替换。P6启动子的核苷酸序列以SEQ ID NO:135显示。Dp2_0157菌株也可以经由以下程序构建。
<9-2-1>用于替换NCgl2473基因启动子的质粒pBS4S_P6::NCgl2473的构建
通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板,和SEQ ID NO:136和137的合成DNA作为引物进行PCR以获得含有NCgl2473基因的上游区的PCR产物。分别通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板和SEQ ID NO:138和139的合成DNA作为引物进行PCR,以获得含有NCgl2473基因的N端侧编码区的PCR产物。另外,通过人工基因合成获得含有P6启动子区的SEQ ID NO:135的DNA片段。SEQ ID NO:135和137的序列彼此部分互补,并且SEQ ID NO:135和138的序列彼此部分互补。然后,混合近似等摩尔量的含有NCgl2473基因的上游区的PCR产物、含有NCgl2473基因的N端侧编码区的PCR产物和含有P6启动子的SEQ ID NO:135的DNA片段,并通过使用In Fusion HD克隆试剂盒(Clontech)将其插入用BamHI和PstI处理的pBS4S载体(WO2007/046389)中。利用该DNA,转化大肠杆菌JM109的感受态细胞(Takara Bio),并且将细胞应用于含有100μM IPTG,40μg/mL X-Gal和40μg/mL卡那霉素的LB培养基,并培养过夜。然后,挑取出现的白色菌落,并且分离成单菌落以获得转化体。从所获得的转化体中提取质粒,并将插入了靶PCR产物的质粒命名为pBS4S_P6::NCgl2473。
<9-2-2>Dp2_0157菌株的构建
由于上面获得的pBS4S_P6::NCgl2473不含能使质粒在棒状杆菌细菌细胞中自主复制的区域,若用该质粒转化棒状杆菌细菌,则通过同源重组将该质粒掺入基因组中的菌株作为转化体出现,尽管它以非常低的频率发生。因此,通过电脉冲法将pBS4S_P6::NCgl2473导入谷氨酸棒杆菌Bp1_0112菌株。将细胞应用于含有25μg/mL卡那霉素的CM-Dex琼脂培养基,并在31.5℃培养。通过PCR确认生长的菌株是一次重组菌株,其中通过同源重组将pBS4S_P6::NCgl2473掺入基因组中。
将一次重组菌株在CM-Dex液体培养基中培养过夜,将该培养培养基应用于S10琼脂培养基,并在31.5℃培养。在出现的菌落中,在CM-Dex琼脂培养基上纯化显示卡那霉素易感性的菌株。通过从纯化的菌株中制备基因组DNA,并用于进行核苷酸序列分析以确认P6启动子位于NCgl2473基因上游,并且该菌株命名为Dp2_0157菌株。
<10>用于表达Niastella koreensis的OMT基因的质粒pVK9::PcspB-omt35的构建
通过外包获得质粒pVK9::PcspB-omt35。质粒pVK9::PcspB-omt35含有针对谷氨酸棒杆菌的密码子选择进行密码子优化的Niastella koreensis的OMT基因。此基因也可以称为“omt35基因”,并且由此基因编码的OMT也可以称为“OMT35”。omt35基因的核苷酸序列以SEQ ID NO:147显示,并且OMT35的氨基酸序列以SEQ ID NO:143显示。质粒pVK9::PcspB-omt35也可以经由以下程序构建。
通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板,和SEQ ID NO:144和145的合成DNA作为引物进行PCR以获得含有cspB基因的启动子区和SD序列的PCR产物。分开地通过人工基因合成获得含有omt35基因的ORF的SEQ ID NO:146的DNA片段。然后,通过使用In Fusion HD克隆试剂盒(Clontech)将PCR产物和DNA片段插入用BamHI和PstI处理的pVK9载体(WO2007/046389)中。利用该DNA,转化大肠杆菌JM109的感受态细胞(Takara Bio),并且将细胞应用于含有100μM IPTG,40μg/mL X-Gal和25μg/mL卡那霉素的LB培养基,并培养过夜。然后,挑取出现的白色菌落,并且分离成单菌落以获得转化体。从所获得的转化体中提取质粒,并将插入了靶PCR产物的质粒命名为pVK9::PcspB-omt35。
<11>香草酸生产菌株的构建
通过电穿孔将质粒pVK9::PcspB-omt35导入谷氨酸棒杆菌Bp1_0112和Dp2_0157菌株中。将细胞应用于含有25μg/mL卡那霉素的CM-Dex琼脂培养基,并且于31.5℃培养。在相同的琼脂培养基上纯化培养的菌株,并且分别命名为Bp1_0112_Rb和Dp2_0157_Rb。
将这些菌株各自接种到试管中存在的含有25μg/mL卡那霉素的4mLCM-Dex w/omameno培养基(5g/L葡萄糖、10g/L聚胨、10g/L酵母提取物、1g/L KH2PO4、0.4g/L MgSO4-7H2O、0.01g/L FeSO4-7H2O、0.01g/L MnSO4-7H2O、3g/L尿素、10μg/L生物素,用KOH调节到pH7.5)中,并且于31.5℃在摇动的情况下培养约16小时。将0.9mL获得的培养肉汤的等分试样与0.6mL 50%甘油水溶液混合以获得甘油储液,并且于-80℃贮存。
<12>谷氨酸棒杆菌Bp1_0112_Rb和Dp2_0157_Rb菌株的香草酸生产
将Bp1_0112_Rb和Dp2_0157_Rb菌株的甘油储液中每种的5μL等分试样接种到2.0mL深孔板中存在的0.5mL含有25μg/mL卡那霉素的CM-Dex w/o mameno培养基,并且于30℃在摇动的情况下培养16小时作为预培养物。将获得的预培养物肉汤的0.1mL等分试样接种到2.0mL深孔板中含有25μg/mL卡那霉素的0.4mL香草酸生产培养基(75g/L葡萄糖、0.6g/L MgSO4-7H2O、6.3g/L(NH4)2SO4、2.5g/L KH2PO4、12.5mg/L FeSO4-7H2O、12.5mg/L MnSO4-4-5H2O、2.5g/L酵母提取物、150μg/L维生素B1、150μg/L生物素、6.9g/L原儿茶酸,用KOH调节到pH 7,然后与30g/L CaCO3(用180℃的热空气灭菌3小时)混合),并且于30℃在摇动的情况下培养24小时。
在培养完成时,通过使用超高效液相层析NEXERA X2系统(SHIMADZU)用以下条件分析培养基中的香草酸浓度。另外,通过使用Spectra Max 190(Molecular Devices)以600nm测量光密度(OD)。
UPLC分析条件:
柱:KINETEX 2.6μm XB-C18,150 x 30mm(Phenomenex)
炉温度:40℃
流动相(A):0.1%三氟乙酸
流动相(B):0.1%三氟乙酸/80%乙腈
梯度程序(时间,A(%),B(%)):(0,90,10)->(3,80,20)
流速:1.5ml/min
表4中显示了结果。对Dp2_0157_Rb菌株观察到的培养基中的香草酸浓度是Bp1_0112_Rb菌株观察到的香草酸浓度的约1.32倍。此外,对Dp2_0157_Rb菌株观察到的每OD的香草酸生产率(productivity)是对Bp1_0112_Rb菌株观察到的每OD的香草酸生产能力的约1.38倍。
[表4]
表4:谷氨酸棒杆菌香草酸生产菌株的香草酸生产
Figure BDA0002041690010000741
[工业适用性]
根据本发明,微生物用于生产目标物质,诸如香草醛和香草酸的能力可以得到改善,并且可以有效生产目标物质。
<序列表的解释>
SEQ ID NOS:
1:大肠杆菌MG1655的aroG基因的核苷酸序列
2:大肠杆菌MG1655的AroG蛋白的氨基酸序列
3:大肠杆菌MG1655的aroB基因的核苷酸序列
4:大肠杆菌MG1655的AroB蛋白的氨基酸序列
5:大肠杆菌MG1655的aroD基因的核苷酸序列
6:大肠杆菌MG1655的AroD蛋白的氨基酸序列
7:苏云金芽孢杆菌BMB171的asbF基因的核苷酸序列
8:苏云金芽孢杆菌BMB171的AsbF蛋白的氨基酸序列
9:大肠杆菌MG1655的tyrR基因的核苷酸序列
10:大肠杆菌MG1655的TyrR蛋白的氨基酸序列
11-14:智人OMT基因的转录物变体1至4的核苷酸序列
15:智人OMT同种型(MB-COMT)的氨基酸序列
16:智人OMT同种型(S-COMT)的氨基酸序列
17:巴西诺卡菌的ACAR基因的核苷酸序列
18:巴西诺卡菌的ACAR蛋白的氨基酸序列
19:巴西诺卡菌的ACAR基因的核苷酸序列
20:巴西诺卡菌的ACAR蛋白的氨基酸序列
21:大肠杆菌MG1655的entD基因的核苷酸序列
22:大肠杆菌MG1655的EntD蛋白的氨基酸序列
23:谷氨酸棒杆菌ATCC 13032的PPT基因的核苷酸序列
24:谷氨酸棒杆菌ATCC 13032的PPT蛋白的氨基酸序列
25:谷氨酸棒杆菌2256(ATCC 13869)的vanK基因的核苷酸序列
26:谷氨酸棒杆菌2256(ATCC 13869)的VanK蛋白的氨基酸序列
27:谷氨酸棒杆菌2256(ATCC 13869)的pcaK基因的核苷酸序列
28:谷氨酸棒杆菌2256(ATCC 13869)的PcaK蛋白的氨基酸序列
29:谷氨酸棒杆菌2256(ATCC 13869)的vanA基因的核苷酸序列
30:谷氨酸棒杆菌2256(ATCC 13869)的VanA蛋白的氨基酸序列
31:谷氨酸棒杆菌2256(ATCC 13869)的vanB基因的核苷酸序列
32:谷氨酸棒杆菌2256(ATCC 13869)的VanB蛋白的氨基酸序列
33:谷氨酸棒杆菌ATCC 13032的pcaG基因的核苷酸序列
34:谷氨酸棒杆菌ATCC 13032的PcaG蛋白的氨基酸序列
35:谷氨酸棒杆菌ATCC 13032的pcaH基因的核苷酸序列
36:谷氨酸棒杆菌ATCC 13032的PcaH蛋白的氨基酸序列
37:大肠杆菌MG1655的yqhD基因的核苷酸序列
38:大肠杆菌MG1655的YqhD蛋白的氨基酸序列
39:谷氨酸棒杆菌2256(ATCC 13869)的NCgl0324基因的核苷酸序列
40:谷氨酸棒杆菌2256(ATCC 13869)的NCgl0324蛋白的氨基酸序列
41:谷氨酸棒杆菌2256(ATCC 13869)的NCgl0313基因的核苷酸序列
42:谷氨酸棒杆菌2256(ATCC 13869)的NCgl0313蛋白的氨基酸序列
43:谷氨酸棒杆菌2256(ATCC 13869)的NCgl2709基因的核苷酸序列
44:谷氨酸棒杆菌2256(ATCC 13869)的NCgl2709蛋白的氨基酸序列
45:谷氨酸棒杆菌ATCC 13032的NCgl0219基因的核苷酸序列
46:谷氨酸棒杆菌ATCC 13032的NCgl0219蛋白的氨基酸序列
47:谷氨酸棒杆菌ATCC 13032的NCgl2382基因的核苷酸序列
48:谷氨酸棒杆菌ATCC 13032的NCgl2382蛋白的氨基酸序列
49:大肠杆菌MG1655的aroE基因的核苷酸序列
50:大肠杆菌MG1655的AroE蛋白的氨基酸序列
51-84:引物
85:含有P2启动子区的DNA片段的核苷酸序列
86和87:引物
88:谷氨酸棒杆菌2256(ATCC 13869)的cysI基因的核苷酸序列
89:谷氨酸棒杆菌2256(ATCC 13869)的CysI蛋白的氨基酸序列
90:谷氨酸棒杆菌2256(ATCC 13869)的cysX基因的核苷酸序列
91:谷氨酸棒杆菌2256(ATCC 13869)的CysX蛋白的氨基酸序列
92:谷氨酸棒杆菌2256(ATCC 13869)的cysH基因的核苷酸序列
93:谷氨酸棒杆菌2256(ATCC 13869)的CysH蛋白的氨基酸序列
94:谷氨酸棒杆菌2256(ATCC 13869)的cysD基因的核苷酸序列
95:谷氨酸棒杆菌2256(ATCC 13869)的CysD蛋白的氨基酸序列
96:谷氨酸棒杆菌2256(ATCC 13869)的cysN基因的核苷酸序列
97:谷氨酸棒杆菌2256(ATCC 13869)的CysN蛋白的氨基酸序列
98:谷氨酸棒杆菌2256(ATCC 13869)的cysY基因的核苷酸序列
99:谷氨酸棒杆菌2256(ATCC 13869)的CysY蛋白的氨基酸序列
100:谷氨酸棒杆菌2256(ATCC 13869)的cysZ基因的核苷酸序列
101:谷氨酸棒杆菌2256(ATCC 13869)的CysZ蛋白的氨基酸序列
102:谷氨酸棒杆菌2256(ATCC 13869)的fpr2基因的核苷酸序列
103:谷氨酸棒杆菌2256(ATCC 13869)的Fpr2蛋白的氨基酸序列
104:谷氨酸棒杆菌2256(ATCC 13869)的cysR基因的核苷酸序列
105:谷氨酸棒杆菌2256(ATCC 13869)的CysR蛋白的氨基酸序列
106:谷氨酸棒杆菌2256(ATCC 13869)的ssuR基因的核苷酸序列
107:谷氨酸棒杆菌2256(ATCC 13869)的SsuR蛋白的氨基酸序列
108:含有P2启动子的核苷酸序列
109:含有P4启动子的核苷酸序列
110:含有P6启动子的核苷酸序列
111:含有P8启动子的核苷酸序列
112:编码智人S-COMT的cDNA的核苷酸序列
113:含有COMT2基因的合成DNA片段的核苷酸序列
114:pELAC载体
115-129:引物
130:含有P8启动子区的DNA片段的核苷酸序列
131和132:引物
133:谷氨酸棒杆菌2256(ATCC 13869)的NCgl2048基因的核苷酸序列
134:谷氨酸棒杆菌2256(ATCC 13869)的NCgl2048蛋白的氨基酸序列
135:含有P6启动子的核苷酸序列
136-139:引物
140:谷氨酸棒杆菌2256(ATCC 13869)的cysK基因的核苷酸序列
141:谷氨酸棒杆菌2256(ATCC 13869)的CysK蛋白的氨基酸序列
142:Niastella koreensis的OMT基因的核苷酸序列
143:Niastella koreensis的OMT的氨基酸序列
144和145:引物
146:含有omt35基因的DNA片段的核苷酸序列
147:omt35基因的核苷酸序列(Niastella koreensis经密码子优化的OMT基因)
序列表
<110> 味之素株式会社
<120> 用于生产目标物质的方法
<130> D885-16114
<150> US62/413030
<151> 2016-10-26
<150> US62/417602
<151> 2016-11-04
<160> 147
<170> PatentIn version 3.5
<210> 1
<211> 1053
<212> DNA
<213> 大肠杆菌
<400> 1
atgaattatc agaacgacga tttacgcatc aaagaaatca aagagttact tcctcctgtc 60
gcattgctgg aaaaattccc cgctactgaa aatgccgcga atacggttgc ccatgcccga 120
aaagcgatcc ataagatcct gaaaggtaat gatgatcgcc tgttggttgt gattggccca 180
tgctcaattc atgatcctgt cgcggcaaaa gagtatgcca ctcgcttgct ggcgctgcgt 240
gaagagctga aagatgagct ggaaatcgta atgcgcgtct attttgaaaa gccgcgtacc 300
acggtgggct ggaaagggct gattaacgat ccgcatatgg ataatagctt ccagatcaac 360
gacggtctgc gtatagcccg taaattgctg cttgatatta acgacagcgg tctgccagcg 420
gcaggtgagt ttctcgatat gatcacccca caatatctcg ctgacctgat gagctggggc 480
gcaattggcg cacgtaccac cgaatcgcag gtgcaccgcg aactggcatc agggctttct 540
tgtccggtcg gcttcaaaaa tggcaccgac ggtacgatta aagtggctat cgatgccatt 600
aatgccgccg gtgcgccgca ctgcttcctg tccgtaacga aatgggggca ttcggcgatt 660
gtgaatacca gcggtaacgg cgattgccat atcattctgc gcggcggtaa agagcctaac 720
tacagcgcga agcacgttgc tgaagtgaaa gaagggctga acaaagcagg cctgccagca 780
caggtgatga tcgatttcag ccatgctaac tcgtccaaac aattcaaaaa gcagatggat 840
gtttgtgctg acgtttgcca gcagattgcc ggtggcgaaa aggccattat tggcgtgatg 900
gtggaaagcc atctggtgga aggcaatcag agcctcgaga gcggggagcc gctggcctac 960
ggtaagagca tcaccgatgc ctgcatcggc tgggaagata ccgatgctct gttacgtcaa 1020
ctggcgaatg cagtaaaagc gcgtcgcggg taa 1053
<210> 2
<211> 350
<212> PRT
<213> 大肠杆菌
<400> 2
Met Asn Tyr Gln Asn Asp Asp Leu Arg Ile Lys Glu Ile Lys Glu Leu
1 5 10 15
Leu Pro Pro Val Ala Leu Leu Glu Lys Phe Pro Ala Thr Glu Asn Ala
20 25 30
Ala Asn Thr Val Ala His Ala Arg Lys Ala Ile His Lys Ile Leu Lys
35 40 45
Gly Asn Asp Asp Arg Leu Leu Val Val Ile Gly Pro Cys Ser Ile His
50 55 60
Asp Pro Val Ala Ala Lys Glu Tyr Ala Thr Arg Leu Leu Ala Leu Arg
65 70 75 80
Glu Glu Leu Lys Asp Glu Leu Glu Ile Val Met Arg Val Tyr Phe Glu
85 90 95
Lys Pro Arg Thr Thr Val Gly Trp Lys Gly Leu Ile Asn Asp Pro His
100 105 110
Met Asp Asn Ser Phe Gln Ile Asn Asp Gly Leu Arg Ile Ala Arg Lys
115 120 125
Leu Leu Leu Asp Ile Asn Asp Ser Gly Leu Pro Ala Ala Gly Glu Phe
130 135 140
Leu Asp Met Ile Thr Pro Gln Tyr Leu Ala Asp Leu Met Ser Trp Gly
145 150 155 160
Ala Ile Gly Ala Arg Thr Thr Glu Ser Gln Val His Arg Glu Leu Ala
165 170 175
Ser Gly Leu Ser Cys Pro Val Gly Phe Lys Asn Gly Thr Asp Gly Thr
180 185 190
Ile Lys Val Ala Ile Asp Ala Ile Asn Ala Ala Gly Ala Pro His Cys
195 200 205
Phe Leu Ser Val Thr Lys Trp Gly His Ser Ala Ile Val Asn Thr Ser
210 215 220
Gly Asn Gly Asp Cys His Ile Ile Leu Arg Gly Gly Lys Glu Pro Asn
225 230 235 240
Tyr Ser Ala Lys His Val Ala Glu Val Lys Glu Gly Leu Asn Lys Ala
245 250 255
Gly Leu Pro Ala Gln Val Met Ile Asp Phe Ser His Ala Asn Ser Ser
260 265 270
Lys Gln Phe Lys Lys Gln Met Asp Val Cys Ala Asp Val Cys Gln Gln
275 280 285
Ile Ala Gly Gly Glu Lys Ala Ile Ile Gly Val Met Val Glu Ser His
290 295 300
Leu Val Glu Gly Asn Gln Ser Leu Glu Ser Gly Glu Pro Leu Ala Tyr
305 310 315 320
Gly Lys Ser Ile Thr Asp Ala Cys Ile Gly Trp Glu Asp Thr Asp Ala
325 330 335
Leu Leu Arg Gln Leu Ala Asn Ala Val Lys Ala Arg Arg Gly
340 345 350
<210> 3
<211> 1089
<212> DNA
<213> 大肠杆菌
<400> 3
atggagagga ttgtcgttac tctcggggaa cgtagttacc caattaccat cgcatctggt 60
ttgtttaatg aaccagcttc attcttaccg ctgaaatcgg gcgagcaggt catgttggtc 120
accaacgaaa ccctggctcc tctgtatctc gataaggtcc gcggcgtact tgaacaggcg 180
ggtgttaacg tcgatagcgt tatcctccct gacggcgagc agtataaaag cctggctgta 240
ctcgataccg tctttacggc gttgttacaa aaaccgcatg gtcgcgatac tacgctggtg 300
gcgcttggcg gcggcgtagt gggcgatctg accggcttcg cggcggcgag ttatcagcgc 360
ggtgtccgtt tcattcaagt cccgacgacg ttactgtcgc aggtcgattc ctccgttggc 420
ggcaaaactg cggtcaacca tcccctcggt aaaaacatga ttggcgcgtt ctaccaacct 480
gcttcagtgg tggtggatct cgactgtctg aaaacgcttc ccccgcgtga gttagcgtcg 540
gggctggcag aagtcatcaa atacggcatt attcttgacg gtgcgttttt taactggctg 600
gaagagaatc tggatgcgtt gttgcgtctg gacggtccgg caatggcgta ctgtattcgc 660
cgttgttgtg aactgaaggc agaagttgtc gccgccgacg agcgcgaaac cgggttacgt 720
gctttactga atctgggaca cacctttggt catgccattg aagctgaaat ggggtatggc 780
aattggttac atggtgaagc ggtcgctgcg ggtatggtga tggcggcgcg gacgtcggaa 840
cgtctcgggc agtttagttc tgccgaaacg cagcgtatta taaccctgct caagcgggct 900
gggttaccgg tcaatgggcc gcgcgaaatg tccgcgcagg cgtatttacc gcatatgctg 960
cgtgacaaga aagtccttgc gggagagatg cgcttaattc ttccgttggc aattggtaag 1020
agtgaagttc gcagcggcgt ttcgcacgag cttgttctta acgccattgc cgattgtcaa 1080
tcagcgtaa 1089
<210> 4
<211> 362
<212> PRT
<213> 大肠杆菌
<400> 4
Met Glu Arg Ile Val Val Thr Leu Gly Glu Arg Ser Tyr Pro Ile Thr
1 5 10 15
Ile Ala Ser Gly Leu Phe Asn Glu Pro Ala Ser Phe Leu Pro Leu Lys
20 25 30
Ser Gly Glu Gln Val Met Leu Val Thr Asn Glu Thr Leu Ala Pro Leu
35 40 45
Tyr Leu Asp Lys Val Arg Gly Val Leu Glu Gln Ala Gly Val Asn Val
50 55 60
Asp Ser Val Ile Leu Pro Asp Gly Glu Gln Tyr Lys Ser Leu Ala Val
65 70 75 80
Leu Asp Thr Val Phe Thr Ala Leu Leu Gln Lys Pro His Gly Arg Asp
85 90 95
Thr Thr Leu Val Ala Leu Gly Gly Gly Val Val Gly Asp Leu Thr Gly
100 105 110
Phe Ala Ala Ala Ser Tyr Gln Arg Gly Val Arg Phe Ile Gln Val Pro
115 120 125
Thr Thr Leu Leu Ser Gln Val Asp Ser Ser Val Gly Gly Lys Thr Ala
130 135 140
Val Asn His Pro Leu Gly Lys Asn Met Ile Gly Ala Phe Tyr Gln Pro
145 150 155 160
Ala Ser Val Val Val Asp Leu Asp Cys Leu Lys Thr Leu Pro Pro Arg
165 170 175
Glu Leu Ala Ser Gly Leu Ala Glu Val Ile Lys Tyr Gly Ile Ile Leu
180 185 190
Asp Gly Ala Phe Phe Asn Trp Leu Glu Glu Asn Leu Asp Ala Leu Leu
195 200 205
Arg Leu Asp Gly Pro Ala Met Ala Tyr Cys Ile Arg Arg Cys Cys Glu
210 215 220
Leu Lys Ala Glu Val Val Ala Ala Asp Glu Arg Glu Thr Gly Leu Arg
225 230 235 240
Ala Leu Leu Asn Leu Gly His Thr Phe Gly His Ala Ile Glu Ala Glu
245 250 255
Met Gly Tyr Gly Asn Trp Leu His Gly Glu Ala Val Ala Ala Gly Met
260 265 270
Val Met Ala Ala Arg Thr Ser Glu Arg Leu Gly Gln Phe Ser Ser Ala
275 280 285
Glu Thr Gln Arg Ile Ile Thr Leu Leu Lys Arg Ala Gly Leu Pro Val
290 295 300
Asn Gly Pro Arg Glu Met Ser Ala Gln Ala Tyr Leu Pro His Met Leu
305 310 315 320
Arg Asp Lys Lys Val Leu Ala Gly Glu Met Arg Leu Ile Leu Pro Leu
325 330 335
Ala Ile Gly Lys Ser Glu Val Arg Ser Gly Val Ser His Glu Leu Val
340 345 350
Leu Asn Ala Ile Ala Asp Cys Gln Ser Ala
355 360
<210> 5
<211> 759
<212> DNA
<213> 大肠杆菌
<400> 5
atgaaaaccg taactgtaaa agatctcgtc attggtacgg gcgcacctaa aatcatcgtc 60
tcgctgatgg cgaaagatat cgccagcgtg aaatccgaag ctctcgccta tcgtgaagcg 120
gactttgata ttctggaatg gcgtgtggac cactatgccg acctctccaa tgtggagtct 180
gtcatggcgg cagcaaaaat tctccgtgag accatgccag aaaaaccgct gctgtttacc 240
ttccgcagtg ccaaagaagg cggcgagcag gcgatttcca ccgaggctta tattgcactc 300
aatcgtgcag ccatcgacag cggcctggtt gatatgatcg atctggagtt atttaccggt 360
gatgatcagg ttaaagaaac cgtcgcctac gcccacgcgc atgatgtgaa agtagtcatg 420
tccaaccatg acttccataa aacgccggaa gccgaagaaa tcattgcccg tctgcgcaaa 480
atgcaatcct tcgacgccga tattcctaag attgcgctga tgccgcaaag taccagcgat 540
gtgctgacgt tgcttgccgc gaccctggag atgcaggagc agtatgccga tcgtccaatt 600
atcacgatgt cgatggcaaa aactggcgta atttctcgtc tggctggtga agtatttggc 660
tcggcggcaa cttttggtgc ggtaaaaaaa gcgtctgcgc cagggcaaat ctcggtaaat 720
gatttgcgca cggtattaac tattttacac caggcataa 759
<210> 6
<211> 252
<212> PRT
<213> 大肠杆菌
<400> 6
Met Lys Thr Val Thr Val Lys Asp Leu Val Ile Gly Thr Gly Ala Pro
1 5 10 15
Lys Ile Ile Val Ser Leu Met Ala Lys Asp Ile Ala Ser Val Lys Ser
20 25 30
Glu Ala Leu Ala Tyr Arg Glu Ala Asp Phe Asp Ile Leu Glu Trp Arg
35 40 45
Val Asp His Tyr Ala Asp Leu Ser Asn Val Glu Ser Val Met Ala Ala
50 55 60
Ala Lys Ile Leu Arg Glu Thr Met Pro Glu Lys Pro Leu Leu Phe Thr
65 70 75 80
Phe Arg Ser Ala Lys Glu Gly Gly Glu Gln Ala Ile Ser Thr Glu Ala
85 90 95
Tyr Ile Ala Leu Asn Arg Ala Ala Ile Asp Ser Gly Leu Val Asp Met
100 105 110
Ile Asp Leu Glu Leu Phe Thr Gly Asp Asp Gln Val Lys Glu Thr Val
115 120 125
Ala Tyr Ala His Ala His Asp Val Lys Val Val Met Ser Asn His Asp
130 135 140
Phe His Lys Thr Pro Glu Ala Glu Glu Ile Ile Ala Arg Leu Arg Lys
145 150 155 160
Met Gln Ser Phe Asp Ala Asp Ile Pro Lys Ile Ala Leu Met Pro Gln
165 170 175
Ser Thr Ser Asp Val Leu Thr Leu Leu Ala Ala Thr Leu Glu Met Gln
180 185 190
Glu Gln Tyr Ala Asp Arg Pro Ile Ile Thr Met Ser Met Ala Lys Thr
195 200 205
Gly Val Ile Ser Arg Leu Ala Gly Glu Val Phe Gly Ser Ala Ala Thr
210 215 220
Phe Gly Ala Val Lys Lys Ala Ser Ala Pro Gly Gln Ile Ser Val Asn
225 230 235 240
Asp Leu Arg Thr Val Leu Thr Ile Leu His Gln Ala
245 250
<210> 7
<211> 843
<212> DNA
<213> 苏云金芽孢杆菌
<400> 7
atgaaatatt cgctatgtac catttcattt cgtcatcaat taatttcatt tactgatatt 60
gttcaatttg catatgaaaa cggttttgaa ggaattgaat tatgggggac gcatgcacaa 120
aatttgtaca tgcaagaacg tgaaacgaca gaacgagaat tgaattttct aaaggataaa 180
aacttagaaa ttacgatgat aagtgattac ttagatatat cattatcagc agattttgaa 240
aaaacgatag agaaaagtga acaacttgta gtactagcta attggtttaa tacgaataaa 300
attcgcacgt ttgctgggca aaaagggagc aaggacttct cggaacaaga gagaaaagag 360
tatgtgaagc gaatacgtaa gatttgtgat gtgtttgctc agaacaatat gtatgtgctg 420
ttagaaacac atcccaatac actaacggac acattgcctt ctactataga gttattagaa 480
gaagtaaacc atccgaattt aaaaataaat cttgattttc ttcatatatg ggagtctggc 540
gcagatccaa tagacagttt ccatcgatta aagccgtgga cactacatta ccattttaag 600
aatatatctt cagcggatta tttgcatgtg tttgaaccta ataatgtata tgctgcagca 660
ggaagtcgta taggtatggt tccgttattt gaaggtattg taaattatga tgagattatt 720
caggaagtga gaaatacgga tctttttgct tccttagaat ggtttggaca taattcaaaa 780
gagatattaa aagaagaaat gaaagtatta ataaatagaa aattagaagt agtaacttcg 840
taa 843
<210> 8
<211> 280
<212> PRT
<213> 苏云金芽孢杆菌
<400> 8
Met Lys Tyr Ser Leu Cys Thr Ile Ser Phe Arg His Gln Leu Ile Ser
1 5 10 15
Phe Thr Asp Ile Val Gln Phe Ala Tyr Glu Asn Gly Phe Glu Gly Ile
20 25 30
Glu Leu Trp Gly Thr His Ala Gln Asn Leu Tyr Met Gln Glu Arg Glu
35 40 45
Thr Thr Glu Arg Glu Leu Asn Phe Leu Lys Asp Lys Asn Leu Glu Ile
50 55 60
Thr Met Ile Ser Asp Tyr Leu Asp Ile Ser Leu Ser Ala Asp Phe Glu
65 70 75 80
Lys Thr Ile Glu Lys Ser Glu Gln Leu Val Val Leu Ala Asn Trp Phe
85 90 95
Asn Thr Asn Lys Ile Arg Thr Phe Ala Gly Gln Lys Gly Ser Lys Asp
100 105 110
Phe Ser Glu Gln Glu Arg Lys Glu Tyr Val Lys Arg Ile Arg Lys Ile
115 120 125
Cys Asp Val Phe Ala Gln Asn Asn Met Tyr Val Leu Leu Glu Thr His
130 135 140
Pro Asn Thr Leu Thr Asp Thr Leu Pro Ser Thr Ile Glu Leu Leu Glu
145 150 155 160
Glu Val Asn His Pro Asn Leu Lys Ile Asn Leu Asp Phe Leu His Ile
165 170 175
Trp Glu Ser Gly Ala Asp Pro Ile Asp Ser Phe His Arg Leu Lys Pro
180 185 190
Trp Thr Leu His Tyr His Phe Lys Asn Ile Ser Ser Ala Asp Tyr Leu
195 200 205
His Val Phe Glu Pro Asn Asn Val Tyr Ala Ala Ala Gly Ser Arg Ile
210 215 220
Gly Met Val Pro Leu Phe Glu Gly Ile Val Asn Tyr Asp Glu Ile Ile
225 230 235 240
Gln Glu Val Arg Asn Thr Asp Leu Phe Ala Ser Leu Glu Trp Phe Gly
245 250 255
His Asn Ser Lys Glu Ile Leu Lys Glu Glu Met Lys Val Leu Ile Asn
260 265 270
Arg Lys Leu Glu Val Val Thr Ser
275 280
<210> 9
<211> 1542
<212> DNA
<213> 大肠杆菌
<400> 9
atgcgtctgg aagtcttttg tgaagaccga ctcggtctga cccgcgaatt actcgatcta 60
ctcgtgctaa gaggcattga tttacgcggt attgagattg atcccattgg gcgaatctac 120
ctcaattttg ctgaactgga gtttgagagt ttcagcagtc tgatggccga aatacgccgt 180
attgcgggtg ttaccgatgt gcgtactgtc ccgtggatgc cttccgaacg tgagcatctg 240
gcgttgagcg cgttactgga ggcgttgcct gaacctgtgc tctctgtcga tatgaaaagc 300
aaagtggata tggcgaaccc ggcgagctgt cagctttttg ggcaaaaatt ggatcgcctg 360
cgcaaccata ccgccgcaca attgattaac ggctttaatt ttttacgttg gctggaaagc 420
gaaccgcaag attcgcataa cgagcatgtc gttattaatg ggcagaattt cctgatggag 480
attacgcctg tttatcttca ggatgaaaat gatcaacacg tcctgaccgg tgcggtggtg 540
atgttgcgat caacgattcg tatgggccgc cagttgcaaa atgtcgccgc ccaggacgtc 600
agcgccttca gtcaaattgt cgccgtcagc ccgaaaatga agcatgttgt cgaacaggcg 660
cagaaactgg cgatgctaag cgcgccgctg ctgattacgg gtgacacagg tacaggtaaa 720
gatctctttg cctacgcctg ccatcaggca agccccagag cgggcaaacc ttacctggcg 780
ctgaactgtg cgtctatacc ggaagatgcg gtcgagagtg aactgtttgg tcatgctccg 840
gaagggaaga aaggattctt tgagcaggcg aacggtggtt cggtgctgtt ggatgaaata 900
ggggaaatgt caccacggat gcaggcgaaa ttactgcgtt tccttaatga tggcactttc 960
cgtcgggttg gcgaagacca tgaggtgcat gtcgatgtgc gggtgatttg cgctacgcag 1020
aagaatctgg tcgaactggt gcaaaaaggc atgttccgtg aagatctcta ttatcgtctg 1080
aacgtgttga cgctcaatct gccgccgcta cgtgactgtc cgcaggacat catgccgtta 1140
actgagctgt tcgtcgcccg ctttgccgac gagcagggcg tgccgcgtcc gaaactggcc 1200
gctgacctga atactgtact tacgcgttat gcgtggccgg gaaatgtgcg gcagttaaag 1260
aacgctatct atcgcgcact gacacaactg gacggttatg agctgcgtcc acaggatatt 1320
ttgttgccgg attatgacgc cgcaacggta gccgtgggcg aagatgcgat ggaaggttcg 1380
ctggacgaaa tcaccagccg ttttgaacgc tcggtattaa cccagcttta tcgcaattat 1440
cccagcacgc gcaaactggc aaaacgtctc ggcgtttcac ataccgcgat tgccaataag 1500
ttgcgggaat atggtctgag tcagaagaag aacgaagagt aa 1542
<210> 10
<211> 513
<212> PRT
<213> 大肠杆菌
<400> 10
Met Arg Leu Glu Val Phe Cys Glu Asp Arg Leu Gly Leu Thr Arg Glu
1 5 10 15
Leu Leu Asp Leu Leu Val Leu Arg Gly Ile Asp Leu Arg Gly Ile Glu
20 25 30
Ile Asp Pro Ile Gly Arg Ile Tyr Leu Asn Phe Ala Glu Leu Glu Phe
35 40 45
Glu Ser Phe Ser Ser Leu Met Ala Glu Ile Arg Arg Ile Ala Gly Val
50 55 60
Thr Asp Val Arg Thr Val Pro Trp Met Pro Ser Glu Arg Glu His Leu
65 70 75 80
Ala Leu Ser Ala Leu Leu Glu Ala Leu Pro Glu Pro Val Leu Ser Val
85 90 95
Asp Met Lys Ser Lys Val Asp Met Ala Asn Pro Ala Ser Cys Gln Leu
100 105 110
Phe Gly Gln Lys Leu Asp Arg Leu Arg Asn His Thr Ala Ala Gln Leu
115 120 125
Ile Asn Gly Phe Asn Phe Leu Arg Trp Leu Glu Ser Glu Pro Gln Asp
130 135 140
Ser His Asn Glu His Val Val Ile Asn Gly Gln Asn Phe Leu Met Glu
145 150 155 160
Ile Thr Pro Val Tyr Leu Gln Asp Glu Asn Asp Gln His Val Leu Thr
165 170 175
Gly Ala Val Val Met Leu Arg Ser Thr Ile Arg Met Gly Arg Gln Leu
180 185 190
Gln Asn Val Ala Ala Gln Asp Val Ser Ala Phe Ser Gln Ile Val Ala
195 200 205
Val Ser Pro Lys Met Lys His Val Val Glu Gln Ala Gln Lys Leu Ala
210 215 220
Met Leu Ser Ala Pro Leu Leu Ile Thr Gly Asp Thr Gly Thr Gly Lys
225 230 235 240
Asp Leu Phe Ala Tyr Ala Cys His Gln Ala Ser Pro Arg Ala Gly Lys
245 250 255
Pro Tyr Leu Ala Leu Asn Cys Ala Ser Ile Pro Glu Asp Ala Val Glu
260 265 270
Ser Glu Leu Phe Gly His Ala Pro Glu Gly Lys Lys Gly Phe Phe Glu
275 280 285
Gln Ala Asn Gly Gly Ser Val Leu Leu Asp Glu Ile Gly Glu Met Ser
290 295 300
Pro Arg Met Gln Ala Lys Leu Leu Arg Phe Leu Asn Asp Gly Thr Phe
305 310 315 320
Arg Arg Val Gly Glu Asp His Glu Val His Val Asp Val Arg Val Ile
325 330 335
Cys Ala Thr Gln Lys Asn Leu Val Glu Leu Val Gln Lys Gly Met Phe
340 345 350
Arg Glu Asp Leu Tyr Tyr Arg Leu Asn Val Leu Thr Leu Asn Leu Pro
355 360 365
Pro Leu Arg Asp Cys Pro Gln Asp Ile Met Pro Leu Thr Glu Leu Phe
370 375 380
Val Ala Arg Phe Ala Asp Glu Gln Gly Val Pro Arg Pro Lys Leu Ala
385 390 395 400
Ala Asp Leu Asn Thr Val Leu Thr Arg Tyr Ala Trp Pro Gly Asn Val
405 410 415
Arg Gln Leu Lys Asn Ala Ile Tyr Arg Ala Leu Thr Gln Leu Asp Gly
420 425 430
Tyr Glu Leu Arg Pro Gln Asp Ile Leu Leu Pro Asp Tyr Asp Ala Ala
435 440 445
Thr Val Ala Val Gly Glu Asp Ala Met Glu Gly Ser Leu Asp Glu Ile
450 455 460
Thr Ser Arg Phe Glu Arg Ser Val Leu Thr Gln Leu Tyr Arg Asn Tyr
465 470 475 480
Pro Ser Thr Arg Lys Leu Ala Lys Arg Leu Gly Val Ser His Thr Ala
485 490 495
Ile Ala Asn Lys Leu Arg Glu Tyr Gly Leu Ser Gln Lys Lys Asn Glu
500 505 510
Glu
<210> 11
<211> 2304
<212> DNA
<213> 智人
<400> 11
cggcctgcgt ccgccaccgg aagcgccctc ctaatccccg cagcgccacc gccattgccg 60
ccatcgtcgt ggggcttctg gggcagctag ggctgcccgc cgcgctgcct gcgccggacc 120
ggggcgggtc cagtcccggg cgggccgtcg cgggagagaa ataacatctg ctttgctgcc 180
gagctcagag gagaccccag acccctcccg cagccagagg gctggagcct gctcagaggt 240
gctttgaaga tgccggaggc cccgcctctg ctgttggcag ctgtgttgct gggcctggtg 300
ctgctggtgg tgctgctgct gcttctgagg cactggggct ggggcctgtg ccttatcggc 360
tggaacgagt tcatcctgca gcccatccac aacctgctca tgggtgacac caaggagcag 420
cgcatcctga accacgtgct gcagcatgcg gagcccggga acgcacagag cgtgctggag 480
gccattgaca cctactgcga gcagaaggag tgggccatga acgtgggcga caagaaaggc 540
aagatcgtgg acgccgtgat tcaggagcac cagccctccg tgctgctgga gctgggggcc 600
tactgtggct actcagctgt gcgcatggcc cgcctgctgt caccaggggc gaggctcatc 660
accatcgaga tcaaccccga ctgtgccgcc atcacccagc ggatggtgga tttcgctggc 720
gtgaaggaca aggtcaccct tgtggttgga gcgtcccagg acatcatccc ccagctgaag 780
aagaagtatg atgtggacac actggacatg gtcttcctcg accactggaa ggaccggtac 840
ctgccggaca cgcttctctt ggaggaatgt ggcctgctgc ggaaggggac agtgctactg 900
gctgacaacg tgatctgccc aggtgcgcca gacttcctag cacacgtgcg cgggagcagc 960
tgctttgagt gcacacacta ccaatcgttc ctggaataca gggaggtggt ggacggcctg 1020
gagaaggcca tctacaaggg cccaggcagc gaagcagggc cctgactgcc cccccggccc 1080
ccctctcggg ctctctcacc cagcctggta ctgaaggtgc cagacgtgct cctgctgacc 1140
ttctgcggct ccgggctgtg tcctaaatgc aaagcacacc tcggccgagg cctgcgccct 1200
gacatgctaa cctctctgaa ctgcaacact ggattgttct tttttaagac tcaatcatga 1260
cttctttact aacactggct agctatatta tcttatatac taatatcatg ttttaaaaat 1320
ataaaataga aattaagaat ctaaatattt agatataact cgacttagta catccttctc 1380
aactgccatt cccctgctgc ccttgacttg ggcaccaaac attcaaagct ccccttgacg 1440
gacgctaacg ctaagggcgg ggcccctagc tggctgggtt ctgggtggca cgcctggccc 1500
actggcctcc cagccacagt ggtgcagagg tcagccctcc tgcagctagg ccaggggcac 1560
ctgttagccc catggggacg actgccggcc tgggaaacga agaggagtca gccagcattc 1620
acacctttct gaccaagcag gcgctgggga caggtggacc ccgcagcagc accagcccct 1680
ctgggcccca tgtggcacag agtggaagca tctccttccc tactccccac tgggccttgc 1740
ttacagaaga ggcaatggct cagaccagct cccgcatccc tgtagttgcc tccctggccc 1800
atgagtgagg atgcagtgct ggtttctgcc cacctacacc tagagctgtc cccatctcct 1860
ccaaggggtc agactgctag ccacctcaga ggctccaagg gcccagttcc caggcccagg 1920
acaggaatca accctgtgct agctgagttc acctgcaccg agaccagccc ctagccaaga 1980
ttctactcct gggctcaagg cctggctagc ccccagccag cccactccta tggatagaca 2040
gaccagtgag cccaagtgga caagtttggg gccacccagg gaccagaaac agagcctctg 2100
caggacacag cagatgggca cctgggacca cctccaccca gggccctgcc ccagacgcgc 2160
agaggcccga cacaagggag aagccagcca cttgtgccag acctgagtgg cagaaagcaa 2220
aaagttcctt tgctgcttta atttttaaat tttcttacaa aaatttaggt gtttaccaat 2280
agtcttattt tggcttattt ttaa 2304
<210> 12
<211> 2262
<212> DNA
<213> 智人
<400> 12
ctcccacggg aggagcaaga acacagaaca gagggggcaa gacagctcca ccaggagtca 60
ggagtgaatc ccctctggga acgaggcact aggaagaaga acttccagcc caggagaaat 120
aacatctgct ttgctgccga gctcagagga gaccccagac ccctcccgca gccagagggc 180
tggagcctgc tcagaggtgc tttgaagatg ccggaggccc cgcctctgct gttggcagct 240
gtgttgctgg gcctggtgct gctggtggtg ctgctgctgc ttctgaggca ctggggctgg 300
ggcctgtgcc ttatcggctg gaacgagttc atcctgcagc ccatccacaa cctgctcatg 360
ggtgacacca aggagcagcg catcctgaac cacgtgctgc agcatgcgga gcccgggaac 420
gcacagagcg tgctggaggc cattgacacc tactgcgagc agaaggagtg ggccatgaac 480
gtgggcgaca agaaaggcaa gatcgtggac gccgtgattc aggagcacca gccctccgtg 540
ctgctggagc tgggggccta ctgtggctac tcagctgtgc gcatggcccg cctgctgtca 600
ccaggggcga ggctcatcac catcgagatc aaccccgact gtgccgccat cacccagcgg 660
atggtggatt tcgctggcgt gaaggacaag gtcacccttg tggttggagc gtcccaggac 720
atcatccccc agctgaagaa gaagtatgat gtggacacac tggacatggt cttcctcgac 780
cactggaagg accggtacct gccggacacg cttctcttgg aggaatgtgg cctgctgcgg 840
aaggggacag tgctactggc tgacaacgtg atctgcccag gtgcgccaga cttcctagca 900
cacgtgcgcg ggagcagctg ctttgagtgc acacactacc aatcgttcct ggaatacagg 960
gaggtggtgg acggcctgga gaaggccatc tacaagggcc caggcagcga agcagggccc 1020
tgactgcccc cccggccccc ctctcgggct ctctcaccca gcctggtact gaaggtgcca 1080
gacgtgctcc tgctgacctt ctgcggctcc gggctgtgtc ctaaatgcaa agcacacctc 1140
ggccgaggcc tgcgccctga catgctaacc tctctgaact gcaacactgg attgttcttt 1200
tttaagactc aatcatgact tctttactaa cactggctag ctatattatc ttatatacta 1260
atatcatgtt ttaaaaatat aaaatagaaa ttaagaatct aaatatttag atataactcg 1320
acttagtaca tccttctcaa ctgccattcc cctgctgccc ttgacttggg caccaaacat 1380
tcaaagctcc ccttgacgga cgctaacgct aagggcgggg cccctagctg gctgggttct 1440
gggtggcacg cctggcccac tggcctccca gccacagtgg tgcagaggtc agccctcctg 1500
cagctaggcc aggggcacct gttagcccca tggggacgac tgccggcctg ggaaacgaag 1560
aggagtcagc cagcattcac acctttctga ccaagcaggc gctggggaca ggtggacccc 1620
gcagcagcac cagcccctct gggccccatg tggcacagag tggaagcatc tccttcccta 1680
ctccccactg ggccttgctt acagaagagg caatggctca gaccagctcc cgcatccctg 1740
tagttgcctc cctggcccat gagtgaggat gcagtgctgg tttctgccca cctacaccta 1800
gagctgtccc catctcctcc aaggggtcag actgctagcc acctcagagg ctccaagggc 1860
ccagttccca ggcccaggac aggaatcaac cctgtgctag ctgagttcac ctgcaccgag 1920
accagcccct agccaagatt ctactcctgg gctcaaggcc tggctagccc ccagccagcc 1980
cactcctatg gatagacaga ccagtgagcc caagtggaca agtttggggc cacccaggga 2040
ccagaaacag agcctctgca ggacacagca gatgggcacc tgggaccacc tccacccagg 2100
gccctgcccc agacgcgcag aggcccgaca caagggagaa gccagccact tgtgccagac 2160
ctgagtggca gaaagcaaaa agttcctttg ctgctttaat ttttaaattt tcttacaaaa 2220
atttaggtgt ttaccaatag tcttattttg gcttattttt aa 2262
<210> 13
<211> 2279
<212> DNA
<213> 智人
<400> 13
tggagataac acggatcgct gtgtacactg tgtgctccgg ttgttgcatc cgagggttga 60
tcggatggtg gttcccatcc agatccaagt cctggcccct gatcacagag aaacacagct 120
ggacattaaa gtgaaataac atctgctttg ctgccgagct cagaggagac cccagacccc 180
tcccgcagcc agagggctgg agcctgctca gaggtgcttt gaagatgccg gaggccccgc 240
ctctgctgtt ggcagctgtg ttgctgggcc tggtgctgct ggtggtgctg ctgctgcttc 300
tgaggcactg gggctggggc ctgtgcctta tcggctggaa cgagttcatc ctgcagccca 360
tccacaacct gctcatgggt gacaccaagg agcagcgcat cctgaaccac gtgctgcagc 420
atgcggagcc cgggaacgca cagagcgtgc tggaggccat tgacacctac tgcgagcaga 480
aggagtgggc catgaacgtg ggcgacaaga aaggcaagat cgtggacgcc gtgattcagg 540
agcaccagcc ctccgtgctg ctggagctgg gggcctactg tggctactca gctgtgcgca 600
tggcccgcct gctgtcacca ggggcgaggc tcatcaccat cgagatcaac cccgactgtg 660
ccgccatcac ccagcggatg gtggatttcg ctggcgtgaa ggacaaggtc acccttgtgg 720
ttggagcgtc ccaggacatc atcccccagc tgaagaagaa gtatgatgtg gacacactgg 780
acatggtctt cctcgaccac tggaaggacc ggtacctgcc ggacacgctt ctcttggagg 840
aatgtggcct gctgcggaag gggacagtgc tactggctga caacgtgatc tgcccaggtg 900
cgccagactt cctagcacac gtgcgcggga gcagctgctt tgagtgcaca cactaccaat 960
cgttcctgga atacagggag gtggtggacg gcctggagaa ggccatctac aagggcccag 1020
gcagcgaagc agggccctga ctgccccccc ggcccccctc tcgggctctc tcacccagcc 1080
tggtactgaa ggtgccagac gtgctcctgc tgaccttctg cggctccggg ctgtgtccta 1140
aatgcaaagc acacctcggc cgaggcctgc gccctgacat gctaacctct ctgaactgca 1200
acactggatt gttctttttt aagactcaat catgacttct ttactaacac tggctagcta 1260
tattatctta tatactaata tcatgtttta aaaatataaa atagaaatta agaatctaaa 1320
tatttagata taactcgact tagtacatcc ttctcaactg ccattcccct gctgcccttg 1380
acttgggcac caaacattca aagctcccct tgacggacgc taacgctaag ggcggggccc 1440
ctagctggct gggttctggg tggcacgcct ggcccactgg cctcccagcc acagtggtgc 1500
agaggtcagc cctcctgcag ctaggccagg ggcacctgtt agccccatgg ggacgactgc 1560
cggcctggga aacgaagagg agtcagccag cattcacacc tttctgacca agcaggcgct 1620
ggggacaggt ggaccccgca gcagcaccag cccctctggg ccccatgtgg cacagagtgg 1680
aagcatctcc ttccctactc cccactgggc cttgcttaca gaagaggcaa tggctcagac 1740
cagctcccgc atccctgtag ttgcctccct ggcccatgag tgaggatgca gtgctggttt 1800
ctgcccacct acacctagag ctgtccccat ctcctccaag gggtcagact gctagccacc 1860
tcagaggctc caagggccca gttcccaggc ccaggacagg aatcaaccct gtgctagctg 1920
agttcacctg caccgagacc agcccctagc caagattcta ctcctgggct caaggcctgg 1980
ctagccccca gccagcccac tcctatggat agacagacca gtgagcccaa gtggacaagt 2040
ttggggccac ccagggacca gaaacagagc ctctgcagga cacagcagat gggcacctgg 2100
gaccacctcc acccagggcc ctgccccaga cgcgcagagg cccgacacaa gggagaagcc 2160
agccacttgt gccagacctg agtggcagaa agcaaaaagt tcctttgctg ctttaatttt 2220
taaattttct tacaaaaatt taggtgttta ccaatagtct tattttggct tatttttaa 2279
<210> 14
<211> 2035
<212> DNA
<213> 智人
<400> 14
gctgttggca gctgtgttgc tgggcctggt gctgctggtg gtgctgctgc tgcttctgag 60
gcactggggc tggggcctgt gccttatcgg ctggaacgag ttcatcctgc agcccatcca 120
caacctgctc atgggtgaca ccaaggagca gcgcatcctg aaccacgtgc tgcagcatgc 180
ggagcccggg aacgcacaga gcgtgctgga ggccattgac acctactgcg agcagaagga 240
gtgggccatg aacgtgggcg acaagaaagg caagatcgtg gacgccgtga ttcaggagca 300
ccagccctcc gtgctgctgg agctgggggc ctactgtggc tactcagctg tgcgcatggc 360
ccgcctgctg tcaccagggg cgaggctcat caccatcgag atcaaccccg actgtgccgc 420
catcacccag cggatggtgg atttcgctgg cgtgaaggac aaggtcaccc ttgtggttgg 480
agcgtcccag gacatcatcc cccagctgaa gaagaagtat gatgtggaca cactggacat 540
ggtcttcctc gaccactgga aggaccggta cctgccggac acgcttctct tggaggaatg 600
tggcctgctg cggaagggga cagtgctact ggctgacaac gtgatctgcc caggtgcgcc 660
agacttccta gcacacgtgc gcgggagcag ctgctttgag tgcacacact accaatcgtt 720
cctggaatac agggaggtgg tggacggcct ggagaaggcc atctacaagg gcccaggcag 780
cgaagcaggg ccctgactgc ccccccggcc cccctctcgg gctctctcac ccagcctggt 840
actgaaggtg ccagacgtgc tcctgctgac cttctgcggc tccgggctgt gtcctaaatg 900
caaagcacac ctcggccgag gcctgcgccc tgacatgcta acctctctga actgcaacac 960
tggattgttc ttttttaaga ctcaatcatg acttctttac taacactggc tagctatatt 1020
atcttatata ctaatatcat gttttaaaaa tataaaatag aaattaagaa tctaaatatt 1080
tagatataac tcgacttagt acatccttct caactgccat tcccctgctg cccttgactt 1140
gggcaccaaa cattcaaagc tccccttgac ggacgctaac gctaagggcg gggcccctag 1200
ctggctgggt tctgggtggc acgcctggcc cactggcctc ccagccacag tggtgcagag 1260
gtcagccctc ctgcagctag gccaggggca cctgttagcc ccatggggac gactgccggc 1320
ctgggaaacg aagaggagtc agccagcatt cacacctttc tgaccaagca ggcgctgggg 1380
acaggtggac cccgcagcag caccagcccc tctgggcccc atgtggcaca gagtggaagc 1440
atctccttcc ctactcccca ctgggccttg cttacagaag aggcaatggc tcagaccagc 1500
tcccgcatcc ctgtagttgc ctccctggcc catgagtgag gatgcagtgc tggtttctgc 1560
ccacctacac ctagagctgt ccccatctcc tccaaggggt cagactgcta gccacctcag 1620
aggctccaag ggcccagttc ccaggcccag gacaggaatc aaccctgtgc tagctgagtt 1680
cacctgcacc gagaccagcc cctagccaag attctactcc tgggctcaag gcctggctag 1740
cccccagcca gcccactcct atggatagac agaccagtga gcccaagtgg acaagtttgg 1800
ggccacccag ggaccagaaa cagagcctct gcaggacaca gcagatgggc acctgggacc 1860
acctccaccc agggccctgc cccagacgcg cagaggcccg acacaaggga gaagccagcc 1920
acttgtgcca gacctgagtg gcagaaagca aaaagttcct ttgctgcttt aatttttaaa 1980
ttttcttaca aaaatttagg tgtttaccaa tagtcttatt ttggcttatt tttaa 2035
<210> 15
<211> 271
<212> PRT
<213> 智人
<400> 15
Met Pro Glu Ala Pro Pro Leu Leu Leu Ala Ala Val Leu Leu Gly Leu
1 5 10 15
Val Leu Leu Val Val Leu Leu Leu Leu Leu Arg His Trp Gly Trp Gly
20 25 30
Leu Cys Leu Ile Gly Trp Asn Glu Phe Ile Leu Gln Pro Ile His Asn
35 40 45
Leu Leu Met Gly Asp Thr Lys Glu Gln Arg Ile Leu Asn His Val Leu
50 55 60
Gln His Ala Glu Pro Gly Asn Ala Gln Ser Val Leu Glu Ala Ile Asp
65 70 75 80
Thr Tyr Cys Glu Gln Lys Glu Trp Ala Met Asn Val Gly Asp Lys Lys
85 90 95
Gly Lys Ile Val Asp Ala Val Ile Gln Glu His Gln Pro Ser Val Leu
100 105 110
Leu Glu Leu Gly Ala Tyr Cys Gly Tyr Ser Ala Val Arg Met Ala Arg
115 120 125
Leu Leu Ser Pro Gly Ala Arg Leu Ile Thr Ile Glu Ile Asn Pro Asp
130 135 140
Cys Ala Ala Ile Thr Gln Arg Met Val Asp Phe Ala Gly Val Lys Asp
145 150 155 160
Lys Val Thr Leu Val Val Gly Ala Ser Gln Asp Ile Ile Pro Gln Leu
165 170 175
Lys Lys Lys Tyr Asp Val Asp Thr Leu Asp Met Val Phe Leu Asp His
180 185 190
Trp Lys Asp Arg Tyr Leu Pro Asp Thr Leu Leu Leu Glu Glu Cys Gly
195 200 205
Leu Leu Arg Lys Gly Thr Val Leu Leu Ala Asp Asn Val Ile Cys Pro
210 215 220
Gly Ala Pro Asp Phe Leu Ala His Val Arg Gly Ser Ser Cys Phe Glu
225 230 235 240
Cys Thr His Tyr Gln Ser Phe Leu Glu Tyr Arg Glu Val Val Asp Gly
245 250 255
Leu Glu Lys Ala Ile Tyr Lys Gly Pro Gly Ser Glu Ala Gly Pro
260 265 270
<210> 16
<211> 221
<212> PRT
<213> 智人
<400> 16
Met Gly Asp Thr Lys Glu Gln Arg Ile Leu Asn His Val Leu Gln His
1 5 10 15
Ala Glu Pro Gly Asn Ala Gln Ser Val Leu Glu Ala Ile Asp Thr Tyr
20 25 30
Cys Glu Gln Lys Glu Trp Ala Met Asn Val Gly Asp Lys Lys Gly Lys
35 40 45
Ile Val Asp Ala Val Ile Gln Glu His Gln Pro Ser Val Leu Leu Glu
50 55 60
Leu Gly Ala Tyr Cys Gly Tyr Ser Ala Val Arg Met Ala Arg Leu Leu
65 70 75 80
Ser Pro Gly Ala Arg Leu Ile Thr Ile Glu Ile Asn Pro Asp Cys Ala
85 90 95
Ala Ile Thr Gln Arg Met Val Asp Phe Ala Gly Val Lys Asp Lys Val
100 105 110
Thr Leu Val Val Gly Ala Ser Gln Asp Ile Ile Pro Gln Leu Lys Lys
115 120 125
Lys Tyr Asp Val Asp Thr Leu Asp Met Val Phe Leu Asp His Trp Lys
130 135 140
Asp Arg Tyr Leu Pro Asp Thr Leu Leu Leu Glu Glu Cys Gly Leu Leu
145 150 155 160
Arg Lys Gly Thr Val Leu Leu Ala Asp Asn Val Ile Cys Pro Gly Ala
165 170 175
Pro Asp Phe Leu Ala His Val Arg Gly Ser Ser Cys Phe Glu Cys Thr
180 185 190
His Tyr Gln Ser Phe Leu Glu Tyr Arg Glu Val Val Asp Gly Leu Glu
195 200 205
Lys Ala Ile Tyr Lys Gly Pro Gly Ser Glu Ala Gly Pro
210 215 220
<210> 17
<211> 3453
<212> DNA
<213> 巴西诺卡菌
<400> 17
ttgttcgccg aggacgagca ggtgaaagcc gcggtgccgg accaggaggt ggtcgaggcg 60
atccgggcgc ccggcctgcg cctggcacag atcatggcca ccgtgatgga gcgctatgcg 120
gaccgccccg cggtgggaca gcgggcgagc gagccggtca ccgagagcgg tcgcaccacc 180
ttccggctgc tcccggaatt cgagaccctg acctaccgcg agctgtgggc gcgcgtccgc 240
gcggtggccg ccgcgtggca cggagatgcc gaaaggcctt tgcgggccgg ggatttcgtt 300
gctctgctgg gtttcgccgg catcgattac ggcaccctcg atctcgcgaa catccatctc 360
ggcctcgtca cggtgccgct gcaatccggc gccacggccc cgcaactcgc cgcgatcctg 420
gccgagacca cgccccgggt gctggccgcg acacccgacc atctcgatat cgccgtcgaa 480
ttgctgaccg ggggagcctc gccggaacgg ctggtggtat tcgactaccg ccccgcggac 540
gacgatcacc gggcggcgct cgagtccgcg cgcagacggt tgagcgacgc gggcagtgcg 600
gtggtggtcg agacgctcga cgcggtccgc gcccgcggca gcgaattgcc ggccgcgccg 660
ctgttcgttc ccgccgcgga cgaggacccg ctggctctgc tcatctacac ctccggcagc 720
accggcacgc ctaagggcgc catgtacacc gaaagactga accgcacgac gtggctgagc 780
ggggcgaaag gcgtcggcct cacgctcggc tacatgccga tgagtcatat tgccgggcgg 840
gcctcgttcg ccggtgtgct ggcccgcggc ggcacggtct acttcaccgc ccgcagcgat 900
atgtcgacgc tgttcgaaga tctggccctg gtgcggccga ccgagatgtt cttcgtcccg 960
cgcgtgtgcg acatgatctt ccagcgctat caggccgaac tgtcgcggcg cgcgcccgcc 1020
gcggccgcga gcccggaact cgagcaggaa ctgaagaccg aactgcgctt gtccgcggtc 1080
ggggaccgct tactcggggc gatcgcgggc agcgcgccgc tgtcggccga gatgcgggag 1140
ttcatggagt cgctgctgga tctggaactg cacgacggct acggctcgac cgaggcgggt 1200
atcggcgtac tgcaagacaa tatcgtccag cgtccgccgg tcatcgatta caagctcgtc 1260
gacgtgccgg aattgggcta cttccggacg gaccagccgc atccccgcgg tgagttgctg 1320
ttgaaaaccg aagggatgat tccgggctac ttccggcggc ccgaggtgac cgcggagatc 1380
ttcgacgagg acggtttcta caggaccggt gacatcgtcg ccgaactcga accggatcgg 1440
ctgatctacc tggaccgccg caacaatgtg ctgaaactgg cccagggcga gttcgtcacg 1500
gtcgcccatc tggaagcggt gttcgcgacc agtccgctga tccggcagat ctacatctac 1560
ggcaacagcg agcgctcgtt cctgctggcg gtgatcgtgc ccaccgcgga cgcgctggcc 1620
gacggtgtca ccgacgcgct gaacacggcg ctgaccgaat ccttgcgaca gctcgcgaaa 1680
gaagccgggc tgcaatccta tgagctgccg cgcgagttcc tggtcgaaac cgaaccgttc 1740
accgtcgaga acggtctgct ctccggtatc gcgaaactgt tgcggcccaa gctcaaggag 1800
cactacggcg agcgactcga gcagctgtac cgcgatatcg aggcgaaccg caacgacgag 1860
ctgatcgagc tgcggcgcac cgcggccgag ctgccggtgc tcgaaaccgt cacgcgggct 1920
gcacgttcga tgctcggact ggccgcgtcg gagttgcggc cggacgcgca tttcaccgat 1980
ctcggcggtg attcactgtc cgcgctgtcg ttttcgaccc tgctgcagga catgctcgag 2040
gtcgaggtcc cggtcggtgt catcgtgagc cccgccaact cgctcgccga tctggcgaaa 2100
tacatcgagg ccgaacggca ttcgggggtg cggcggccga gcctgatctc ggtgcacggt 2160
cccggcaccg agatccgtgc cgccgatctc accctggaca agttcatcga cgagcgcacc 2220
ctcgctgccg cgaaagcggt tccggccgcg ccggcccagg cgcagaccgt cctgctcacc 2280
ggggcgaacg gctatctcgg ccgcttcctg tgcctggaat ggctgcagcg actggaccag 2340
accggcggca cgctggtctg catcgtgcgc ggtaccgacg cggccgccgc gcggaagcgc 2400
ctggatgcgg tgttcgacag cggtgatccg gagctgctcg accactaccg gaagctggcc 2460
gccgagcacc tcgaggtgct cgcgggcgat atcggcgacc cgaatctcgg cctggacgaa 2520
gcgacttggc agcggctcgc cgcgaccgtc gacctgatcg tgcaccccgc cgccctcgtc 2580
aaccatgtgc tgccgtacag ccagctgttc gggccgaatg tggtcggcac cgccgagatc 2640
atccggctgg ccatcaccga gcgccgtaag cccgtgacgt acctgtcgac ggtcgcggtg 2700
gccgcacagg tcgatcccgc cggcttcgac gaggagcgcg atatccggga gatgagcgcg 2760
gtgcgctcca tcgacgccgg gtacgcgaac ggttacggca acagcaagtg ggccggcgag 2820
gtgctgctgc gcgaggccca tgatctgtgc gggctgccgg tcgccgtgtt ccgctcggac 2880
atgatcctgg cgcacagcaa atacgtcggt cagctcaacg tccccgatgt gttcacccgg 2940
ctcatcctga gcctggcgct caccggcatc gcaccgtatt cgttctacgg gacggacagc 3000
gccgggcagc gcaggcgggc ccactacgac ggtctgcccg ccgatttcgt cgccgaggcg 3060
atcaccaccc tcggcgcgcg agccgagtcg gggttccata cctacgacgt gtggaacccg 3120
tacgacgacg gcatctcgct ggacgaattc gtcgactggc tcggcgattt cggcgtgccg 3180
atccagcgga tcgacgacta cgacgaatgg ttccggcgtt tcgagaccgc gatccgcgcg 3240
ctgcccgaaa agcagcgcga tgcttcgctg ctaccgctgc tggacgcaca ccggcggcca 3300
ctgcgcgcgg tgcgcggttc gctgttgccc gccaagaact tccaggcggc ggtgcagtcc 3360
gcgcggatcg gccccgatca ggacatcccg catctttccc cgcagttgat cgacaagtac 3420
gtcaccgacc tgcgccacct cggcctgctc tga 3453
<210> 18
<211> 1150
<212> PRT
<213> 巴西诺卡菌
<400> 18
Met Phe Ala Glu Asp Glu Gln Val Lys Ala Ala Val Pro Asp Gln Glu
1 5 10 15
Val Val Glu Ala Ile Arg Ala Pro Gly Leu Arg Leu Ala Gln Ile Met
20 25 30
Ala Thr Val Met Glu Arg Tyr Ala Asp Arg Pro Ala Val Gly Gln Arg
35 40 45
Ala Ser Glu Pro Val Thr Glu Ser Gly Arg Thr Thr Phe Arg Leu Leu
50 55 60
Pro Glu Phe Glu Thr Leu Thr Tyr Arg Glu Leu Trp Ala Arg Val Arg
65 70 75 80
Ala Val Ala Ala Ala Trp His Gly Asp Ala Glu Arg Pro Leu Arg Ala
85 90 95
Gly Asp Phe Val Ala Leu Leu Gly Phe Ala Gly Ile Asp Tyr Gly Thr
100 105 110
Leu Asp Leu Ala Asn Ile His Leu Gly Leu Val Thr Val Pro Leu Gln
115 120 125
Ser Gly Ala Thr Ala Pro Gln Leu Ala Ala Ile Leu Ala Glu Thr Thr
130 135 140
Pro Arg Val Leu Ala Ala Thr Pro Asp His Leu Asp Ile Ala Val Glu
145 150 155 160
Leu Leu Thr Gly Gly Ala Ser Pro Glu Arg Leu Val Val Phe Asp Tyr
165 170 175
Arg Pro Ala Asp Asp Asp His Arg Ala Ala Leu Glu Ser Ala Arg Arg
180 185 190
Arg Leu Ser Asp Ala Gly Ser Ala Val Val Val Glu Thr Leu Asp Ala
195 200 205
Val Arg Ala Arg Gly Ser Glu Leu Pro Ala Ala Pro Leu Phe Val Pro
210 215 220
Ala Ala Asp Glu Asp Pro Leu Ala Leu Leu Ile Tyr Thr Ser Gly Ser
225 230 235 240
Thr Gly Thr Pro Lys Gly Ala Met Tyr Thr Glu Arg Leu Asn Arg Thr
245 250 255
Thr Trp Leu Ser Gly Ala Lys Gly Val Gly Leu Thr Leu Gly Tyr Met
260 265 270
Pro Met Ser His Ile Ala Gly Arg Ala Ser Phe Ala Gly Val Leu Ala
275 280 285
Arg Gly Gly Thr Val Tyr Phe Thr Ala Arg Ser Asp Met Ser Thr Leu
290 295 300
Phe Glu Asp Leu Ala Leu Val Arg Pro Thr Glu Met Phe Phe Val Pro
305 310 315 320
Arg Val Cys Asp Met Ile Phe Gln Arg Tyr Gln Ala Glu Leu Ser Arg
325 330 335
Arg Ala Pro Ala Ala Ala Ala Ser Pro Glu Leu Glu Gln Glu Leu Lys
340 345 350
Thr Glu Leu Arg Leu Ser Ala Val Gly Asp Arg Leu Leu Gly Ala Ile
355 360 365
Ala Gly Ser Ala Pro Leu Ser Ala Glu Met Arg Glu Phe Met Glu Ser
370 375 380
Leu Leu Asp Leu Glu Leu His Asp Gly Tyr Gly Ser Thr Glu Ala Gly
385 390 395 400
Ile Gly Val Leu Gln Asp Asn Ile Val Gln Arg Pro Pro Val Ile Asp
405 410 415
Tyr Lys Leu Val Asp Val Pro Glu Leu Gly Tyr Phe Arg Thr Asp Gln
420 425 430
Pro His Pro Arg Gly Glu Leu Leu Leu Lys Thr Glu Gly Met Ile Pro
435 440 445
Gly Tyr Phe Arg Arg Pro Glu Val Thr Ala Glu Ile Phe Asp Glu Asp
450 455 460
Gly Phe Tyr Arg Thr Gly Asp Ile Val Ala Glu Leu Glu Pro Asp Arg
465 470 475 480
Leu Ile Tyr Leu Asp Arg Arg Asn Asn Val Leu Lys Leu Ala Gln Gly
485 490 495
Glu Phe Val Thr Val Ala His Leu Glu Ala Val Phe Ala Thr Ser Pro
500 505 510
Leu Ile Arg Gln Ile Tyr Ile Tyr Gly Asn Ser Glu Arg Ser Phe Leu
515 520 525
Leu Ala Val Ile Val Pro Thr Ala Asp Ala Leu Ala Asp Gly Val Thr
530 535 540
Asp Ala Leu Asn Thr Ala Leu Thr Glu Ser Leu Arg Gln Leu Ala Lys
545 550 555 560
Glu Ala Gly Leu Gln Ser Tyr Glu Leu Pro Arg Glu Phe Leu Val Glu
565 570 575
Thr Glu Pro Phe Thr Val Glu Asn Gly Leu Leu Ser Gly Ile Ala Lys
580 585 590
Leu Leu Arg Pro Lys Leu Lys Glu His Tyr Gly Glu Arg Leu Glu Gln
595 600 605
Leu Tyr Arg Asp Ile Glu Ala Asn Arg Asn Asp Glu Leu Ile Glu Leu
610 615 620
Arg Arg Thr Ala Ala Glu Leu Pro Val Leu Glu Thr Val Thr Arg Ala
625 630 635 640
Ala Arg Ser Met Leu Gly Leu Ala Ala Ser Glu Leu Arg Pro Asp Ala
645 650 655
His Phe Thr Asp Leu Gly Gly Asp Ser Leu Ser Ala Leu Ser Phe Ser
660 665 670
Thr Leu Leu Gln Asp Met Leu Glu Val Glu Val Pro Val Gly Val Ile
675 680 685
Val Ser Pro Ala Asn Ser Leu Ala Asp Leu Ala Lys Tyr Ile Glu Ala
690 695 700
Glu Arg His Ser Gly Val Arg Arg Pro Ser Leu Ile Ser Val His Gly
705 710 715 720
Pro Gly Thr Glu Ile Arg Ala Ala Asp Leu Thr Leu Asp Lys Phe Ile
725 730 735
Asp Glu Arg Thr Leu Ala Ala Ala Lys Ala Val Pro Ala Ala Pro Ala
740 745 750
Gln Ala Gln Thr Val Leu Leu Thr Gly Ala Asn Gly Tyr Leu Gly Arg
755 760 765
Phe Leu Cys Leu Glu Trp Leu Gln Arg Leu Asp Gln Thr Gly Gly Thr
770 775 780
Leu Val Cys Ile Val Arg Gly Thr Asp Ala Ala Ala Ala Arg Lys Arg
785 790 795 800
Leu Asp Ala Val Phe Asp Ser Gly Asp Pro Glu Leu Leu Asp His Tyr
805 810 815
Arg Lys Leu Ala Ala Glu His Leu Glu Val Leu Ala Gly Asp Ile Gly
820 825 830
Asp Pro Asn Leu Gly Leu Asp Glu Ala Thr Trp Gln Arg Leu Ala Ala
835 840 845
Thr Val Asp Leu Ile Val His Pro Ala Ala Leu Val Asn His Val Leu
850 855 860
Pro Tyr Ser Gln Leu Phe Gly Pro Asn Val Val Gly Thr Ala Glu Ile
865 870 875 880
Ile Arg Leu Ala Ile Thr Glu Arg Arg Lys Pro Val Thr Tyr Leu Ser
885 890 895
Thr Val Ala Val Ala Ala Gln Val Asp Pro Ala Gly Phe Asp Glu Glu
900 905 910
Arg Asp Ile Arg Glu Met Ser Ala Val Arg Ser Ile Asp Ala Gly Tyr
915 920 925
Ala Asn Gly Tyr Gly Asn Ser Lys Trp Ala Gly Glu Val Leu Leu Arg
930 935 940
Glu Ala His Asp Leu Cys Gly Leu Pro Val Ala Val Phe Arg Ser Asp
945 950 955 960
Met Ile Leu Ala His Ser Lys Tyr Val Gly Gln Leu Asn Val Pro Asp
965 970 975
Val Phe Thr Arg Leu Ile Leu Ser Leu Ala Leu Thr Gly Ile Ala Pro
980 985 990
Tyr Ser Phe Tyr Gly Thr Asp Ser Ala Gly Gln Arg Arg Arg Ala His
995 1000 1005
Tyr Asp Gly Leu Pro Ala Asp Phe Val Ala Glu Ala Ile Thr Thr
1010 1015 1020
Leu Gly Ala Arg Ala Glu Ser Gly Phe His Thr Tyr Asp Val Trp
1025 1030 1035
Asn Pro Tyr Asp Asp Gly Ile Ser Leu Asp Glu Phe Val Asp Trp
1040 1045 1050
Leu Gly Asp Phe Gly Val Pro Ile Gln Arg Ile Asp Asp Tyr Asp
1055 1060 1065
Glu Trp Phe Arg Arg Phe Glu Thr Ala Ile Arg Ala Leu Pro Glu
1070 1075 1080
Lys Gln Arg Asp Ala Ser Leu Leu Pro Leu Leu Asp Ala His Arg
1085 1090 1095
Arg Pro Leu Arg Ala Val Arg Gly Ser Leu Leu Pro Ala Lys Asn
1100 1105 1110
Phe Gln Ala Ala Val Gln Ser Ala Arg Ile Gly Pro Asp Gln Asp
1115 1120 1125
Ile Pro His Leu Ser Pro Gln Leu Ile Asp Lys Tyr Val Thr Asp
1130 1135 1140
Leu Arg His Leu Gly Leu Leu
1145 1150
<210> 19
<211> 3501
<212> DNA
<213> 巴西诺卡菌
<400> 19
atggcgactg attcgcgaag cgatcggcta cggcgtcgaa ttgcacagtt gttcgccgag 60
gacgagcagg tgaaagccgc ggtgccggac caggaggtgg tcgaggcgat ccgggcgccc 120
ggcctgcgcc tggcacagat catggccacc gtgatggagc gctatgcgga ccgccccgcg 180
gtgggacagc gggcgagcga gccggtcacc gagagcggtc gcaccacctt ccggctgctc 240
ccggaattcg agaccctgac ctaccgcgag ctgtgggcgc gcgtccgcgc ggtggccgcc 300
gcgtggcacg gagatgccga aaggcctttg cgggccgggg atttcgttgc tctgctgggt 360
ttcgccggca tcgattacgg caccctcgat ctcgcgaaca tccatctcgg cctcgtcacg 420
gtgccgctgc aatccggcgc cacggccccg caactcgccg cgatcctggc cgagaccacg 480
ccccgggtgc tggccgcgac acccgaccat ctcgatatcg ccgtcgaatt gctgaccggg 540
ggagcctcgc cggaacggct ggtggtattc gactaccgcc ccgcggacga cgatcaccgg 600
gcggcgctcg agtccgcgcg cagacggttg agcgacgcgg gcagtgcggt ggtggtcgag 660
acgctcgacg cggtccgcgc ccgcggcagc gaattgccgg ccgcgccgct gttcgttccc 720
gccgcggacg aggacccgct ggctctgctc atctacacct ccggcagcac cggcacgcct 780
aagggcgcca tgtacaccga aagactgaac cgcacgacgt ggctgagcgg ggcgaaaggc 840
gtcggcctca cgctcggcta catgccgatg agtcatattg ccgggcgggc ctcgttcgcc 900
ggtgtgctgg cccgcggcgg cacggtctac ttcaccgccc gcagcgatat gtcgacgctg 960
ttcgaagatc tggccctggt gcggccgacc gagatgttct tcgtcccgcg cgtgtgcgac 1020
atgatcttcc agcgctatca ggccgaactg tcgcggcgcg cgcccgccgc ggccgcgagc 1080
ccggaactcg agcaggaact gaagaccgaa ctgcgcttgt ccgcggtcgg ggaccgctta 1140
ctcggggcga tcgcgggcag cgcgccgctg tcggccgaga tgcgggagtt catggagtcg 1200
ctgctggatc tggaactgca cgacggctac ggctcgaccg aggcgggtat cggcgtactg 1260
caagacaata tcgtccagcg tccgccggtc atcgattaca agctcgtcga cgtgccggaa 1320
ttgggctact tccggacgga ccagccgcat ccccgcggtg agttgctgtt gaaaaccgaa 1380
gggatgattc cgggctactt ccggcggccc gaggtgaccg cggagatctt cgacgaggac 1440
ggtttctaca ggaccggtga catcgtcgcc gaactcgaac cggatcggct gatctacctg 1500
gaccgccgca acaatgtgct gaaactggcc cagggcgagt tcgtcacggt cgcccatctg 1560
gaagcggtgt tcgcgaccag tccgctgatc cggcagatct acatctacgg caacagcgag 1620
cgctcgttcc tgctggcggt gatcgtgccc accgcggacg cgctggccga cggtgtcacc 1680
gacgcgctga acacggcgct gaccgaatcc ttgcgacagc tcgcgaaaga agccgggctg 1740
caatcctatg agctgccgcg cgagttcctg gtcgaaaccg aaccgttcac cgtcgagaac 1800
ggtctgctct ccggtatcgc gaaactgttg cggcccaagc tcaaggagca ctacggcgag 1860
cgactcgagc agctgtaccg cgatatcgag gcgaaccgca acgacgagct gatcgagctg 1920
cggcgcaccg cggccgagct gccggtgctc gaaaccgtca cgcgggctgc acgttcgatg 1980
ctcggactgg ccgcgtcgga gttgcggccg gacgcgcatt tcaccgatct cggcggtgat 2040
tcactgtccg cgctgtcgtt ttcgaccctg ctgcaggaca tgctcgaggt cgaggtcccg 2100
gtcggtgtca tcgtgagccc cgccaactcg ctcgccgatc tggcgaaata catcgaggcc 2160
gaacggcatt cgggggtgcg gcggccgagc ctgatctcgg tgcacggtcc cggcaccgag 2220
atccgtgccg ccgatctcac cctggacaag ttcatcgacg agcgcaccct cgctgccgcg 2280
aaagcggttc cggccgcgcc ggcccaggcg cagaccgtcc tgctcaccgg ggcgaacggc 2340
tatctcggcc gcttcctgtg cctggaatgg ctgcagcgac tggaccagac cggcggcacg 2400
ctggtctgca tcgtgcgcgg taccgacgcg gccgccgcgc ggaagcgcct ggatgcggtg 2460
ttcgacagcg gtgatccgga gctgctcgac cactaccgga agctggccgc cgagcacctc 2520
gaggtgctcg cgggcgatat cggcgacccg aatctcggcc tggacgaagc gacttggcag 2580
cggctcgccg cgaccgtcga cctgatcgtg caccccgccg ccctcgtcaa ccatgtgctg 2640
ccgtacagcc agctgttcgg gccgaatgtg gtcggcaccg ccgagatcat ccggctggcc 2700
atcaccgagc gccgtaagcc cgtgacgtac ctgtcgacgg tcgcggtggc cgcacaggtc 2760
gatcccgccg gcttcgacga ggagcgcgat atccgggaga tgagcgcggt gcgctccatc 2820
gacgccgggt acgcgaacgg ttacggcaac agcaagtggg ccggcgaggt gctgctgcgc 2880
gaggcccatg atctgtgcgg gctgccggtc gccgtgttcc gctcggacat gatcctggcg 2940
cacagcaaat acgtcggtca gctcaacgtc cccgatgtgt tcacccggct catcctgagc 3000
ctggcgctca ccggcatcgc accgtattcg ttctacggga cggacagcgc cgggcagcgc 3060
aggcgggccc actacgacgg tctgcccgcc gatttcgtcg ccgaggcgat caccaccctc 3120
ggcgcgcgag ccgagtcggg gttccatacc tacgacgtgt ggaacccgta cgacgacggc 3180
atctcgctgg acgaattcgt cgactggctc ggcgatttcg gcgtgccgat ccagcggatc 3240
gacgactacg acgaatggtt ccggcgtttc gagaccgcga tccgcgcgct gcccgaaaag 3300
cagcgcgatg cttcgctgct accgctgctg gacgcacacc ggcggccact gcgcgcggtg 3360
cgcggttcgc tgttgcccgc caagaacttc caggcggcgg tgcagtccgc gcggatcggc 3420
cccgatcagg acatcccgca tctttccccg cagttgatcg acaagtacgt caccgacctg 3480
cgccacctcg gcctgctctg a 3501
<210> 20
<211> 1166
<212> PRT
<213> 巴西诺卡菌
<400> 20
Met Ala Thr Asp Ser Arg Ser Asp Arg Leu Arg Arg Arg Ile Ala Gln
1 5 10 15
Leu Phe Ala Glu Asp Glu Gln Val Lys Ala Ala Val Pro Asp Gln Glu
20 25 30
Val Val Glu Ala Ile Arg Ala Pro Gly Leu Arg Leu Ala Gln Ile Met
35 40 45
Ala Thr Val Met Glu Arg Tyr Ala Asp Arg Pro Ala Val Gly Gln Arg
50 55 60
Ala Ser Glu Pro Val Thr Glu Ser Gly Arg Thr Thr Phe Arg Leu Leu
65 70 75 80
Pro Glu Phe Glu Thr Leu Thr Tyr Arg Glu Leu Trp Ala Arg Val Arg
85 90 95
Ala Val Ala Ala Ala Trp His Gly Asp Ala Glu Arg Pro Leu Arg Ala
100 105 110
Gly Asp Phe Val Ala Leu Leu Gly Phe Ala Gly Ile Asp Tyr Gly Thr
115 120 125
Leu Asp Leu Ala Asn Ile His Leu Gly Leu Val Thr Val Pro Leu Gln
130 135 140
Ser Gly Ala Thr Ala Pro Gln Leu Ala Ala Ile Leu Ala Glu Thr Thr
145 150 155 160
Pro Arg Val Leu Ala Ala Thr Pro Asp His Leu Asp Ile Ala Val Glu
165 170 175
Leu Leu Thr Gly Gly Ala Ser Pro Glu Arg Leu Val Val Phe Asp Tyr
180 185 190
Arg Pro Ala Asp Asp Asp His Arg Ala Ala Leu Glu Ser Ala Arg Arg
195 200 205
Arg Leu Ser Asp Ala Gly Ser Ala Val Val Val Glu Thr Leu Asp Ala
210 215 220
Val Arg Ala Arg Gly Ser Glu Leu Pro Ala Ala Pro Leu Phe Val Pro
225 230 235 240
Ala Ala Asp Glu Asp Pro Leu Ala Leu Leu Ile Tyr Thr Ser Gly Ser
245 250 255
Thr Gly Thr Pro Lys Gly Ala Met Tyr Thr Glu Arg Leu Asn Arg Thr
260 265 270
Thr Trp Leu Ser Gly Ala Lys Gly Val Gly Leu Thr Leu Gly Tyr Met
275 280 285
Pro Met Ser His Ile Ala Gly Arg Ala Ser Phe Ala Gly Val Leu Ala
290 295 300
Arg Gly Gly Thr Val Tyr Phe Thr Ala Arg Ser Asp Met Ser Thr Leu
305 310 315 320
Phe Glu Asp Leu Ala Leu Val Arg Pro Thr Glu Met Phe Phe Val Pro
325 330 335
Arg Val Cys Asp Met Ile Phe Gln Arg Tyr Gln Ala Glu Leu Ser Arg
340 345 350
Arg Ala Pro Ala Ala Ala Ala Ser Pro Glu Leu Glu Gln Glu Leu Lys
355 360 365
Thr Glu Leu Arg Leu Ser Ala Val Gly Asp Arg Leu Leu Gly Ala Ile
370 375 380
Ala Gly Ser Ala Pro Leu Ser Ala Glu Met Arg Glu Phe Met Glu Ser
385 390 395 400
Leu Leu Asp Leu Glu Leu His Asp Gly Tyr Gly Ser Thr Glu Ala Gly
405 410 415
Ile Gly Val Leu Gln Asp Asn Ile Val Gln Arg Pro Pro Val Ile Asp
420 425 430
Tyr Lys Leu Val Asp Val Pro Glu Leu Gly Tyr Phe Arg Thr Asp Gln
435 440 445
Pro His Pro Arg Gly Glu Leu Leu Leu Lys Thr Glu Gly Met Ile Pro
450 455 460
Gly Tyr Phe Arg Arg Pro Glu Val Thr Ala Glu Ile Phe Asp Glu Asp
465 470 475 480
Gly Phe Tyr Arg Thr Gly Asp Ile Val Ala Glu Leu Glu Pro Asp Arg
485 490 495
Leu Ile Tyr Leu Asp Arg Arg Asn Asn Val Leu Lys Leu Ala Gln Gly
500 505 510
Glu Phe Val Thr Val Ala His Leu Glu Ala Val Phe Ala Thr Ser Pro
515 520 525
Leu Ile Arg Gln Ile Tyr Ile Tyr Gly Asn Ser Glu Arg Ser Phe Leu
530 535 540
Leu Ala Val Ile Val Pro Thr Ala Asp Ala Leu Ala Asp Gly Val Thr
545 550 555 560
Asp Ala Leu Asn Thr Ala Leu Thr Glu Ser Leu Arg Gln Leu Ala Lys
565 570 575
Glu Ala Gly Leu Gln Ser Tyr Glu Leu Pro Arg Glu Phe Leu Val Glu
580 585 590
Thr Glu Pro Phe Thr Val Glu Asn Gly Leu Leu Ser Gly Ile Ala Lys
595 600 605
Leu Leu Arg Pro Lys Leu Lys Glu His Tyr Gly Glu Arg Leu Glu Gln
610 615 620
Leu Tyr Arg Asp Ile Glu Ala Asn Arg Asn Asp Glu Leu Ile Glu Leu
625 630 635 640
Arg Arg Thr Ala Ala Glu Leu Pro Val Leu Glu Thr Val Thr Arg Ala
645 650 655
Ala Arg Ser Met Leu Gly Leu Ala Ala Ser Glu Leu Arg Pro Asp Ala
660 665 670
His Phe Thr Asp Leu Gly Gly Asp Ser Leu Ser Ala Leu Ser Phe Ser
675 680 685
Thr Leu Leu Gln Asp Met Leu Glu Val Glu Val Pro Val Gly Val Ile
690 695 700
Val Ser Pro Ala Asn Ser Leu Ala Asp Leu Ala Lys Tyr Ile Glu Ala
705 710 715 720
Glu Arg His Ser Gly Val Arg Arg Pro Ser Leu Ile Ser Val His Gly
725 730 735
Pro Gly Thr Glu Ile Arg Ala Ala Asp Leu Thr Leu Asp Lys Phe Ile
740 745 750
Asp Glu Arg Thr Leu Ala Ala Ala Lys Ala Val Pro Ala Ala Pro Ala
755 760 765
Gln Ala Gln Thr Val Leu Leu Thr Gly Ala Asn Gly Tyr Leu Gly Arg
770 775 780
Phe Leu Cys Leu Glu Trp Leu Gln Arg Leu Asp Gln Thr Gly Gly Thr
785 790 795 800
Leu Val Cys Ile Val Arg Gly Thr Asp Ala Ala Ala Ala Arg Lys Arg
805 810 815
Leu Asp Ala Val Phe Asp Ser Gly Asp Pro Glu Leu Leu Asp His Tyr
820 825 830
Arg Lys Leu Ala Ala Glu His Leu Glu Val Leu Ala Gly Asp Ile Gly
835 840 845
Asp Pro Asn Leu Gly Leu Asp Glu Ala Thr Trp Gln Arg Leu Ala Ala
850 855 860
Thr Val Asp Leu Ile Val His Pro Ala Ala Leu Val Asn His Val Leu
865 870 875 880
Pro Tyr Ser Gln Leu Phe Gly Pro Asn Val Val Gly Thr Ala Glu Ile
885 890 895
Ile Arg Leu Ala Ile Thr Glu Arg Arg Lys Pro Val Thr Tyr Leu Ser
900 905 910
Thr Val Ala Val Ala Ala Gln Val Asp Pro Ala Gly Phe Asp Glu Glu
915 920 925
Arg Asp Ile Arg Glu Met Ser Ala Val Arg Ser Ile Asp Ala Gly Tyr
930 935 940
Ala Asn Gly Tyr Gly Asn Ser Lys Trp Ala Gly Glu Val Leu Leu Arg
945 950 955 960
Glu Ala His Asp Leu Cys Gly Leu Pro Val Ala Val Phe Arg Ser Asp
965 970 975
Met Ile Leu Ala His Ser Lys Tyr Val Gly Gln Leu Asn Val Pro Asp
980 985 990
Val Phe Thr Arg Leu Ile Leu Ser Leu Ala Leu Thr Gly Ile Ala Pro
995 1000 1005
Tyr Ser Phe Tyr Gly Thr Asp Ser Ala Gly Gln Arg Arg Arg Ala
1010 1015 1020
His Tyr Asp Gly Leu Pro Ala Asp Phe Val Ala Glu Ala Ile Thr
1025 1030 1035
Thr Leu Gly Ala Arg Ala Glu Ser Gly Phe His Thr Tyr Asp Val
1040 1045 1050
Trp Asn Pro Tyr Asp Asp Gly Ile Ser Leu Asp Glu Phe Val Asp
1055 1060 1065
Trp Leu Gly Asp Phe Gly Val Pro Ile Gln Arg Ile Asp Asp Tyr
1070 1075 1080
Asp Glu Trp Phe Arg Arg Phe Glu Thr Ala Ile Arg Ala Leu Pro
1085 1090 1095
Glu Lys Gln Arg Asp Ala Ser Leu Leu Pro Leu Leu Asp Ala His
1100 1105 1110
Arg Arg Pro Leu Arg Ala Val Arg Gly Ser Leu Leu Pro Ala Lys
1115 1120 1125
Asn Phe Gln Ala Ala Val Gln Ser Ala Arg Ile Gly Pro Asp Gln
1130 1135 1140
Asp Ile Pro His Leu Ser Pro Gln Leu Ile Asp Lys Tyr Val Thr
1145 1150 1155
Asp Leu Arg His Leu Gly Leu Leu
1160 1165
<210> 21
<211> 621
<212> DNA
<213> 大肠杆菌
<400> 21
atgaaaacta cgcatacctc cctccccttt gccggacata cgctgcattt tgttgagttc 60
gatccggcga atttttgtga gcaggattta ctctggctgc cgcactacgc acaactgcaa 120
cacgctggac gtaaacgtaa aacagagcat ttagccggac ggatcgctgc tgtttatgct 180
ttgcgggaat atggctataa atgtgtgccc gcaatcggcg agctacgcca acctgtctgg 240
cctgcggagg tatacggcag tattagccac tgtgggacta cggcattagc cgtggtatct 300
cgtcaaccga ttggcattga tatagaagaa attttttctg tacaaaccgc aagagaattg 360
acagacaaca ttattacacc agcggaacac gagcgactcg cagactgcgg tttagccttt 420
tctctggcgc tgacactggc attttccgcc aaagagagcg catttaaggc aagtgagatc 480
caaactgatg caggttttct ggactatcag ataattagct ggaataaaca gcaggtcatc 540
attcatcgtg agaatgagat gtttgctgtg cactggcaga taaaagaaaa gatagtcata 600
acgctgtgcc aacacgatta a 621
<210> 22
<211> 206
<212> PRT
<213> 大肠杆菌
<400> 22
Met Lys Thr Thr His Thr Ser Leu Pro Phe Ala Gly His Thr Leu His
1 5 10 15
Phe Val Glu Phe Asp Pro Ala Asn Phe Cys Glu Gln Asp Leu Leu Trp
20 25 30
Leu Pro His Tyr Ala Gln Leu Gln His Ala Gly Arg Lys Arg Lys Thr
35 40 45
Glu His Leu Ala Gly Arg Ile Ala Ala Val Tyr Ala Leu Arg Glu Tyr
50 55 60
Gly Tyr Lys Cys Val Pro Ala Ile Gly Glu Leu Arg Gln Pro Val Trp
65 70 75 80
Pro Ala Glu Val Tyr Gly Ser Ile Ser His Cys Gly Thr Thr Ala Leu
85 90 95
Ala Val Val Ser Arg Gln Pro Ile Gly Ile Asp Ile Glu Glu Ile Phe
100 105 110
Ser Val Gln Thr Ala Arg Glu Leu Thr Asp Asn Ile Ile Thr Pro Ala
115 120 125
Glu His Glu Arg Leu Ala Asp Cys Gly Leu Ala Phe Ser Leu Ala Leu
130 135 140
Thr Leu Ala Phe Ser Ala Lys Glu Ser Ala Phe Lys Ala Ser Glu Ile
145 150 155 160
Gln Thr Asp Ala Gly Phe Leu Asp Tyr Gln Ile Ile Ser Trp Asn Lys
165 170 175
Gln Gln Val Ile Ile His Arg Glu Asn Glu Met Phe Ala Val His Trp
180 185 190
Gln Ile Lys Glu Lys Ile Val Ile Thr Leu Cys Gln His Asp
195 200 205
<210> 23
<211> 654
<212> DNA
<213> 谷氨酸棒杆菌
<400> 23
atgctggatg agtctttgtt tccaaattcg gcaaagtttt ctttcattaa aactggcgat 60
gctgttaatt tagaccattt ccatcagttg catccgttgg aaaaggcact ggtagcgcac 120
tcggttgata ttagaaaagc agagtttgga gatgccaggt ggtgtgcaca tcaggcactc 180
caagctttgg gacgagatag cggtgatccc attttgcgtg gggaacgagg aatgccattg 240
tggccttctt cggtgtctgg ttcattgacc cacactgacg gattccgagc tgctgttgtg 300
gcgccacgat tgttggtgcg ttctatggga ttggatgccg aacctgcgga gccgttgccc 360
aaggatgttt tgggttcaat cgctcgggtg ggggagattc ctcaacttaa gcgcttggag 420
gaacaaggtg tgcactgcgc ggatcgcctg ctgttttgtg ccaaggaagc aacatacaaa 480
gcgtggttcc cgctgacgca taggtggctt ggttttgaac aagctgagat cgacttgcgt 540
gatgatggca cttttgtgtc ctatttgctg gttcgaccaa ctccagtgcc gtttatttca 600
ggtaaatggg tactgcgtga tggttatgtc atagctgcga ctgcagtgac ttga 654
<210> 24
<211> 217
<212> PRT
<213> 谷氨酸棒杆菌
<400> 24
Met Leu Asp Glu Ser Leu Phe Pro Asn Ser Ala Lys Phe Ser Phe Ile
1 5 10 15
Lys Thr Gly Asp Ala Val Asn Leu Asp His Phe His Gln Leu His Pro
20 25 30
Leu Glu Lys Ala Leu Val Ala His Ser Val Asp Ile Arg Lys Ala Glu
35 40 45
Phe Gly Asp Ala Arg Trp Cys Ala His Gln Ala Leu Gln Ala Leu Gly
50 55 60
Arg Asp Ser Gly Asp Pro Ile Leu Arg Gly Glu Arg Gly Met Pro Leu
65 70 75 80
Trp Pro Ser Ser Val Ser Gly Ser Leu Thr His Thr Asp Gly Phe Arg
85 90 95
Ala Ala Val Val Ala Pro Arg Leu Leu Val Arg Ser Met Gly Leu Asp
100 105 110
Ala Glu Pro Ala Glu Pro Leu Pro Lys Asp Val Leu Gly Ser Ile Ala
115 120 125
Arg Val Gly Glu Ile Pro Gln Leu Lys Arg Leu Glu Glu Gln Gly Val
130 135 140
His Cys Ala Asp Arg Leu Leu Phe Cys Ala Lys Glu Ala Thr Tyr Lys
145 150 155 160
Ala Trp Phe Pro Leu Thr His Arg Trp Leu Gly Phe Glu Gln Ala Glu
165 170 175
Ile Asp Leu Arg Asp Asp Gly Thr Phe Val Ser Tyr Leu Leu Val Arg
180 185 190
Pro Thr Pro Val Pro Phe Ile Ser Gly Lys Trp Val Leu Arg Asp Gly
195 200 205
Tyr Val Ile Ala Ala Thr Ala Val Thr
210 215
<210> 25
<211> 1428
<212> DNA
<213> 谷氨酸棒杆菌
<400> 25
atgcgcctgc gtgtctcgag tagtctcctc cccttcctcg tccccaacct cgaccattac 60
ggtcgccctc tcctaaagga gcctggcatg gatatccgcc aaacaattaa cgacacagca 120
atgtcgagat atcagtggtt cattgtattt atcgcagtgc tgctcaacgc actggacggc 180
tttgatgtcc tcgccatgtc ttttactgcg aatgcagtga ccgaagaatt tggactgagt 240
ggcagccagc ttggtgtgct gctgagttcc gcgctgttcg gcatgaccgc tggatctttg 300
ctgttcggtc cgatcggtga ccgtttcggc cgtaagaatg ccctgatgat cgcgctgctg 360
ttcaacgtgg tgggattggt attgtccgcc accgcgcagt ccgcaggcca gttgggcgtg 420
tggcgtttga tcactggtat cggcatcggc ggaatcctcg cctgcatcac agtggtgatc 480
agtgagttct ccaacaacaa aaaccgcggc atggccatgt ccatctacgc tgctggttac 540
ggcatcggcg cgtccttggg cggattcggc gcagcgcagc tcatcccaac atttggatgg 600
cgctccgtgt tcgcagccgg tgcgatcgca actggtatcg ccaccatcgc tactttcttc 660
ttcctgccag aatccgttga ttggctgagc actcgccgcc ctgcgggcgc tcgcgacaag 720
atcaattaca ttgcgcgccg cctgggcaaa gtcggtacct ttgagcttcc aggcgaacaa 780
agcttgtcga cgaaaaaagc cggtctccaa tcgtatgcag tgctcgttaa caaagagaac 840
cgtggaacca gcatcaagct gtgggttgcg ttcggcatcg tgatgttcgg cttctacttc 900
gccaacactt ggaccccgaa gctgctcgtg gaaaccggaa tgtcagaaca gcagggcatc 960
atcggtggtt tgatgttgtc catgggtgga gcattcggtt ccctgctcta cggtttcctc 1020
accaccaagt tcagctcccg aaacacactg atgaccttca tggtgctgtc cggcctgacg 1080
ctgatcctgt tcatttcctc cacctctgtt ccatccatcg cgtttgccag cggcgttgtc 1140
gtgggcatgc tgatcaatgg ttgtgtggct ggtctgtaca ccctgtcccc acagctgtac 1200
tccgctgaag tacgcaccac tggtgtgggc gctgcgattg gtatgggtcg tgtcggtgcg 1260
atttccgcgc cactgctggt gggtagcctg ctggattctg gctggtcccc aacgcagctg 1320
tatgttggtg tggcagtgat tgttattgcc ggtgcaaccg cattgattgg gatgcgcact 1380
caggcagtag ccgtcgaaaa gcagcctgaa gccctagcga ccaaatag 1428
<210> 26
<211> 475
<212> PRT
<213> 谷氨酸棒杆菌
<400> 26
Met Arg Leu Arg Val Ser Ser Ser Leu Leu Pro Phe Leu Val Pro Asn
1 5 10 15
Leu Asp His Tyr Gly Arg Pro Leu Leu Lys Glu Pro Gly Met Asp Ile
20 25 30
Arg Gln Thr Ile Asn Asp Thr Ala Met Ser Arg Tyr Gln Trp Phe Ile
35 40 45
Val Phe Ile Ala Val Leu Leu Asn Ala Leu Asp Gly Phe Asp Val Leu
50 55 60
Ala Met Ser Phe Thr Ala Asn Ala Val Thr Glu Glu Phe Gly Leu Ser
65 70 75 80
Gly Ser Gln Leu Gly Val Leu Leu Ser Ser Ala Leu Phe Gly Met Thr
85 90 95
Ala Gly Ser Leu Leu Phe Gly Pro Ile Gly Asp Arg Phe Gly Arg Lys
100 105 110
Asn Ala Leu Met Ile Ala Leu Leu Phe Asn Val Val Gly Leu Val Leu
115 120 125
Ser Ala Thr Ala Gln Ser Ala Gly Gln Leu Gly Val Trp Arg Leu Ile
130 135 140
Thr Gly Ile Gly Ile Gly Gly Ile Leu Ala Cys Ile Thr Val Val Ile
145 150 155 160
Ser Glu Phe Ser Asn Asn Lys Asn Arg Gly Met Ala Met Ser Ile Tyr
165 170 175
Ala Ala Gly Tyr Gly Ile Gly Ala Ser Leu Gly Gly Phe Gly Ala Ala
180 185 190
Gln Leu Ile Pro Thr Phe Gly Trp Arg Ser Val Phe Ala Ala Gly Ala
195 200 205
Ile Ala Thr Gly Ile Ala Thr Ile Ala Thr Phe Phe Phe Leu Pro Glu
210 215 220
Ser Val Asp Trp Leu Ser Thr Arg Arg Pro Ala Gly Ala Arg Asp Lys
225 230 235 240
Ile Asn Tyr Ile Ala Arg Arg Leu Gly Lys Val Gly Thr Phe Glu Leu
245 250 255
Pro Gly Glu Gln Ser Leu Ser Thr Lys Lys Ala Gly Leu Gln Ser Tyr
260 265 270
Ala Val Leu Val Asn Lys Glu Asn Arg Gly Thr Ser Ile Lys Leu Trp
275 280 285
Val Ala Phe Gly Ile Val Met Phe Gly Phe Tyr Phe Ala Asn Thr Trp
290 295 300
Thr Pro Lys Leu Leu Val Glu Thr Gly Met Ser Glu Gln Gln Gly Ile
305 310 315 320
Ile Gly Gly Leu Met Leu Ser Met Gly Gly Ala Phe Gly Ser Leu Leu
325 330 335
Tyr Gly Phe Leu Thr Thr Lys Phe Ser Ser Arg Asn Thr Leu Met Thr
340 345 350
Phe Met Val Leu Ser Gly Leu Thr Leu Ile Leu Phe Ile Ser Ser Thr
355 360 365
Ser Val Pro Ser Ile Ala Phe Ala Ser Gly Val Val Val Gly Met Leu
370 375 380
Ile Asn Gly Cys Val Ala Gly Leu Tyr Thr Leu Ser Pro Gln Leu Tyr
385 390 395 400
Ser Ala Glu Val Arg Thr Thr Gly Val Gly Ala Ala Ile Gly Met Gly
405 410 415
Arg Val Gly Ala Ile Ser Ala Pro Leu Leu Val Gly Ser Leu Leu Asp
420 425 430
Ser Gly Trp Ser Pro Thr Gln Leu Tyr Val Gly Val Ala Val Ile Val
435 440 445
Ile Ala Gly Ala Thr Ala Leu Ile Gly Met Arg Thr Gln Ala Val Ala
450 455 460
Val Glu Lys Gln Pro Glu Ala Leu Ala Thr Lys
465 470 475
<210> 27
<211> 1296
<212> DNA
<213> 谷氨酸棒杆菌
<400> 27
gtgtcaacga ccaccccaac ccgcgcaacc aaaagtgtcg gaacagttct cgcactcctg 60
tggttcgcaa ttgtcctcga cggctttgac ctagtcgtcc tgggcgcaac aatcccgtcc 120
atgctggagg atcccgcgtg ggatctcact gctggacagg ccacacagat ttccaccatc 180
ggcctcgtcg gcatgaccat cggcgcactg accattggtt tcttaactga ccgtctgggt 240
cgacgccgcg tcatgctgtt ctctgtggca gtgttttctg tattcaccct cctgctggca 300
ttcaccacca acgtccagct cttcagcctg tggcgtttcc tcgcaggtgt tggccttggt 360
ggagcactcc ccaccgcaat tgccatggtg accgagtttc gccccggcac caaagcgggc 420
tctgcatcaa ctaccttgat gaccggatac cacgtcgggg cagtagcaac cgctttcctt 480
ggtctcttcc ttatcgacgg ctttggttgg cactccatgt tcatcgcagg cgctgtgcca 540
ggactactcc tgctgccact gctgtatttc ttccttccag aatccccgca gtacctcaaa 600
atctccggca agttggatga ggcgcaggca gttgcagcat cttatggact ttccctggat 660
gatgatcttg atcgcgaaca cgaagaagaa cttggcgagt cctcctcact ttcctccctg 720
ttcaagccct cgttccgccg caacaccctg gcgatttggg gcacctcatt catgggactc 780
ctcctggtct acggcctgaa cacatggctg ccacaaatca tgcgccaagc agactacgac 840
atgggtaact ccctgggctt cctcatggtt cttaacatcg gcgcagtgat cggcctttat 900
attgcagggc gaattgccga taagaactcc cctcgcaaaa cagcactcgt atggttcgtg 960
ttctctgcat ttttcctcgc actacttgct gtccggatgc cactgatcgg tctgtatggc 1020
atcgtgctgc tcaccggcat ctttgtgttc agctcccagg tactcatcta cgccttcgtt 1080
ggtgagaatc accctgccaa gatgcgtgca actgccatgg gattctccgc aggaattggt 1140
cgcctcggcg cgatctcggg tccgttgctg ggcggcctgc ttgtcagtgc caaccttgct 1200
tacccatggg gcttcttcgc cttcgctggc gttggactgc tgggcgcgct gattttctcc 1260
gcatcgaaga ctctgaggca tcgcgagaac gcttag 1296
<210> 28
<211> 431
<212> PRT
<213> 谷氨酸棒杆菌
<400> 28
Met Ser Thr Thr Thr Pro Thr Arg Ala Thr Lys Ser Val Gly Thr Val
1 5 10 15
Leu Ala Leu Leu Trp Phe Ala Ile Val Leu Asp Gly Phe Asp Leu Val
20 25 30
Val Leu Gly Ala Thr Ile Pro Ser Met Leu Glu Asp Pro Ala Trp Asp
35 40 45
Leu Thr Ala Gly Gln Ala Thr Gln Ile Ser Thr Ile Gly Leu Val Gly
50 55 60
Met Thr Ile Gly Ala Leu Thr Ile Gly Phe Leu Thr Asp Arg Leu Gly
65 70 75 80
Arg Arg Arg Val Met Leu Phe Ser Val Ala Val Phe Ser Val Phe Thr
85 90 95
Leu Leu Leu Ala Phe Thr Thr Asn Val Gln Leu Phe Ser Leu Trp Arg
100 105 110
Phe Leu Ala Gly Val Gly Leu Gly Gly Ala Leu Pro Thr Ala Ile Ala
115 120 125
Met Val Thr Glu Phe Arg Pro Gly Thr Lys Ala Gly Ser Ala Ser Thr
130 135 140
Thr Leu Met Thr Gly Tyr His Val Gly Ala Val Ala Thr Ala Phe Leu
145 150 155 160
Gly Leu Phe Leu Ile Asp Gly Phe Gly Trp His Ser Met Phe Ile Ala
165 170 175
Gly Ala Val Pro Gly Leu Leu Leu Leu Pro Leu Leu Tyr Phe Phe Leu
180 185 190
Pro Glu Ser Pro Gln Tyr Leu Lys Ile Ser Gly Lys Leu Asp Glu Ala
195 200 205
Gln Ala Val Ala Ala Ser Tyr Gly Leu Ser Leu Asp Asp Asp Leu Asp
210 215 220
Arg Glu His Glu Glu Glu Leu Gly Glu Ser Ser Ser Leu Ser Ser Leu
225 230 235 240
Phe Lys Pro Ser Phe Arg Arg Asn Thr Leu Ala Ile Trp Gly Thr Ser
245 250 255
Phe Met Gly Leu Leu Leu Val Tyr Gly Leu Asn Thr Trp Leu Pro Gln
260 265 270
Ile Met Arg Gln Ala Asp Tyr Asp Met Gly Asn Ser Leu Gly Phe Leu
275 280 285
Met Val Leu Asn Ile Gly Ala Val Ile Gly Leu Tyr Ile Ala Gly Arg
290 295 300
Ile Ala Asp Lys Asn Ser Pro Arg Lys Thr Ala Leu Val Trp Phe Val
305 310 315 320
Phe Ser Ala Phe Phe Leu Ala Leu Leu Ala Val Arg Met Pro Leu Ile
325 330 335
Gly Leu Tyr Gly Ile Val Leu Leu Thr Gly Ile Phe Val Phe Ser Ser
340 345 350
Gln Val Leu Ile Tyr Ala Phe Val Gly Glu Asn His Pro Ala Lys Met
355 360 365
Arg Ala Thr Ala Met Gly Phe Ser Ala Gly Ile Gly Arg Leu Gly Ala
370 375 380
Ile Ser Gly Pro Leu Leu Gly Gly Leu Leu Val Ser Ala Asn Leu Ala
385 390 395 400
Tyr Pro Trp Gly Phe Phe Ala Phe Ala Gly Val Gly Leu Leu Gly Ala
405 410 415
Leu Ile Phe Ser Ala Ser Lys Thr Leu Arg His Arg Glu Asn Ala
420 425 430
<210> 29
<211> 1131
<212> DNA
<213> 谷氨酸棒杆菌
<400> 29
atgacactgt ccgaacgcaa gctcaccacc accgccaaga ttcttcccca cccactcaac 60
gcctggtacg tcgccgcttg ggattatgaa gtcacatcta aaaagcccat ggccaggaca 120
atcgccaaca aaccactcgc tttgtaccgc accaaagatg gccgagccgt tgcccttgca 180
gacgcctgct ggcaccgcct cgcaccgcta tccaagggaa aactcgtggg cacagacgga 240
atccaatgcc cttatcacgg cttggagtac aactccgcgg gccgctgcat gaaaatgccc 300
gcgcaggaaa ccctcaaccc gtcagcagcc gtcaactcct accccgtggt ggaagcccac 360
cgctttgtgt gggtgtggct gggcgatccc acattggcag atcccaccca agtacccgat 420
atgcaccaga tgagccaccc cgaatgggca ggcgatggac gcaccatctc cgctgactgc 480
aactaccaat tagtgctgga caacttgatg gacctcaccc acgaagaatt cgtgcactcc 540
tccagcatcg gccaagacga acttagtgaa tcagagttcg tggtcaccca cactgaagat 600
tccgtgacgg tcacccgctg gatgcatgac atagatgcac caccgttttg gcaaaagaac 660
atgaatgata agttcccagg atttgaaggc aaggtggatc gttggcagat catccactac 720
tactaccctt ccaccatctg cattgatgtt ggtgtagcaa aggctggaac cggcgcgcag 780
gaaggcgacc gcagccaggg cgttaatggg tatgtaatga acaccattac cccagattca 840
gatcgttcct ctcattactt ctgggcattc atgcgcaact accgcctgga aagccaaacc 900
atcaccaccc agctgcgcga cggtgtatcc ggtgtattca aagaagacga agacatgctg 960
accgctcagc aagatgccat cgacgccaac accgactatg agttttacag cctcaacatt 1020
gatgccggtg gcatgtgggt gcgccgaatc ctcgaggaag cactctccaa ggaaggccga 1080
ctggatatcc ccaccacatt cccccgcgca acaccgaagc cggaggcata a 1131
<210> 30
<211> 376
<212> PRT
<213> 谷氨酸棒杆菌
<400> 30
Met Thr Leu Ser Glu Arg Lys Leu Thr Thr Thr Ala Lys Ile Leu Pro
1 5 10 15
His Pro Leu Asn Ala Trp Tyr Val Ala Ala Trp Asp Tyr Glu Val Thr
20 25 30
Ser Lys Lys Pro Met Ala Arg Thr Ile Ala Asn Lys Pro Leu Ala Leu
35 40 45
Tyr Arg Thr Lys Asp Gly Arg Ala Val Ala Leu Ala Asp Ala Cys Trp
50 55 60
His Arg Leu Ala Pro Leu Ser Lys Gly Lys Leu Val Gly Thr Asp Gly
65 70 75 80
Ile Gln Cys Pro Tyr His Gly Leu Glu Tyr Asn Ser Ala Gly Arg Cys
85 90 95
Met Lys Met Pro Ala Gln Glu Thr Leu Asn Pro Ser Ala Ala Val Asn
100 105 110
Ser Tyr Pro Val Val Glu Ala His Arg Phe Val Trp Val Trp Leu Gly
115 120 125
Asp Pro Thr Leu Ala Asp Pro Thr Gln Val Pro Asp Met His Gln Met
130 135 140
Ser His Pro Glu Trp Ala Gly Asp Gly Arg Thr Ile Ser Ala Asp Cys
145 150 155 160
Asn Tyr Gln Leu Val Leu Asp Asn Leu Met Asp Leu Thr His Glu Glu
165 170 175
Phe Val His Ser Ser Ser Ile Gly Gln Asp Glu Leu Ser Glu Ser Glu
180 185 190
Phe Val Val Thr His Thr Glu Asp Ser Val Thr Val Thr Arg Trp Met
195 200 205
His Asp Ile Asp Ala Pro Pro Phe Trp Gln Lys Asn Met Asn Asp Lys
210 215 220
Phe Pro Gly Phe Glu Gly Lys Val Asp Arg Trp Gln Ile Ile His Tyr
225 230 235 240
Tyr Tyr Pro Ser Thr Ile Cys Ile Asp Val Gly Val Ala Lys Ala Gly
245 250 255
Thr Gly Ala Gln Glu Gly Asp Arg Ser Gln Gly Val Asn Gly Tyr Val
260 265 270
Met Asn Thr Ile Thr Pro Asp Ser Asp Arg Ser Ser His Tyr Phe Trp
275 280 285
Ala Phe Met Arg Asn Tyr Arg Leu Glu Ser Gln Thr Ile Thr Thr Gln
290 295 300
Leu Arg Asp Gly Val Ser Gly Val Phe Lys Glu Asp Glu Asp Met Leu
305 310 315 320
Thr Ala Gln Gln Asp Ala Ile Asp Ala Asn Thr Asp Tyr Glu Phe Tyr
325 330 335
Ser Leu Asn Ile Asp Ala Gly Gly Met Trp Val Arg Arg Ile Leu Glu
340 345 350
Glu Ala Leu Ser Lys Glu Gly Arg Leu Asp Ile Pro Thr Thr Phe Pro
355 360 365
Arg Ala Thr Pro Lys Pro Glu Ala
370 375
<210> 31
<211> 978
<212> DNA
<213> 谷氨酸棒杆菌
<400> 31
atgaactcgc aatggcaaga tgcacatgtt gtttccagcg aaatcatcgc tgcagacatt 60
cgacgaatag aactatcccc gaaatttgcg attccagtaa aacccggcga acatctcaag 120
atcatggtgc ccctaaaaac tggacaggaa aagagatcgt actccatcgt tgacgctcgt 180
cacgacggtt cgactctcgc cctgagcgta ctcaaaacca gaaactcccg tggaggatct 240
gagttcatgc atacgcttcg agctggagac acagttactg tctccaggcc gtctcaggat 300
tttcctctcc gcgtgggtgc gcctgagtat gtacttgttg ccggcggaat tggaatcaca 360
gcgatccgtt caatggcatc tttattaaag aaattgggag caaactaccg cattcatttc 420
gcagcacgca gccttgatgc catggcttac aaagatgagc tcgtggcaga acacggcgac 480
aagctgcacc tgcatctaga ttctgaaggc accaccatcg atgtcccagc attgatcgaa 540
accttaaacc cccacactga gctttatatg tgcggcccca tccgcttgat ggatgccatc 600
cggcgcgcat ggaacacccg cggacttgac cccaccaatc tgcgtttcga aacgtttgga 660
aacagtggat ggttctcccc agaggttttc cacatccaag taccagagct ggggcttcac 720
gccacagtca acaaggatga aagcatgctg gaggctttgc aaaaggctgg ggcgaatatg 780
atgtttgatt gtcgaaaagg cgaatgtggt ttgtgccagg ttcgcgttct agaagtcgat 840
ggccaggttg atcaccgcga tgtgttcttc tctgatcgtc aaaaagaatc cgacgcaaag 900
gcatgcgcct gcgtgtctcg agtagtctcc tccccttcct cgtccccaac ctcgaccatt 960
acggtcgccc tctcctaa 978
<210> 32
<211> 325
<212> PRT
<213> 谷氨酸棒杆菌
<400> 32
Met Asn Ser Gln Trp Gln Asp Ala His Val Val Ser Ser Glu Ile Ile
1 5 10 15
Ala Ala Asp Ile Arg Arg Ile Glu Leu Ser Pro Lys Phe Ala Ile Pro
20 25 30
Val Lys Pro Gly Glu His Leu Lys Ile Met Val Pro Leu Lys Thr Gly
35 40 45
Gln Glu Lys Arg Ser Tyr Ser Ile Val Asp Ala Arg His Asp Gly Ser
50 55 60
Thr Leu Ala Leu Ser Val Leu Lys Thr Arg Asn Ser Arg Gly Gly Ser
65 70 75 80
Glu Phe Met His Thr Leu Arg Ala Gly Asp Thr Val Thr Val Ser Arg
85 90 95
Pro Ser Gln Asp Phe Pro Leu Arg Val Gly Ala Pro Glu Tyr Val Leu
100 105 110
Val Ala Gly Gly Ile Gly Ile Thr Ala Ile Arg Ser Met Ala Ser Leu
115 120 125
Leu Lys Lys Leu Gly Ala Asn Tyr Arg Ile His Phe Ala Ala Arg Ser
130 135 140
Leu Asp Ala Met Ala Tyr Lys Asp Glu Leu Val Ala Glu His Gly Asp
145 150 155 160
Lys Leu His Leu His Leu Asp Ser Glu Gly Thr Thr Ile Asp Val Pro
165 170 175
Ala Leu Ile Glu Thr Leu Asn Pro His Thr Glu Leu Tyr Met Cys Gly
180 185 190
Pro Ile Arg Leu Met Asp Ala Ile Arg Arg Ala Trp Asn Thr Arg Gly
195 200 205
Leu Asp Pro Thr Asn Leu Arg Phe Glu Thr Phe Gly Asn Ser Gly Trp
210 215 220
Phe Ser Pro Glu Val Phe His Ile Gln Val Pro Glu Leu Gly Leu His
225 230 235 240
Ala Thr Val Asn Lys Asp Glu Ser Met Leu Glu Ala Leu Gln Lys Ala
245 250 255
Gly Ala Asn Met Met Phe Asp Cys Arg Lys Gly Glu Cys Gly Leu Cys
260 265 270
Gln Val Arg Val Leu Glu Val Asp Gly Gln Val Asp His Arg Asp Val
275 280 285
Phe Phe Ser Asp Arg Gln Lys Glu Ser Asp Ala Lys Ala Cys Ala Cys
290 295 300
Val Ser Arg Val Val Ser Ser Pro Ser Ser Ser Pro Thr Ser Thr Ile
305 310 315 320
Thr Val Ala Leu Ser
325
<210> 33
<211> 615
<212> DNA
<213> 谷氨酸棒杆菌
<400> 33
atgattgata cagggaagaa cggcgagttc cgctacgagc agtcgaatat catcgatcag 60
aacgaagccg agttcggcat cactccttca cagaccgtgg gcccttacgt ccacatcggt 120
ttgacccttg aaggtgcgga gcatctcgtg gagccaggtt cggaaggcgc ggtgtccttt 180
actgtttccg caactgatgg caacggcgac cccatcgcgg atgccatgtt tgaactgtgg 240
caggccgatc cagagggcat ccacaactct gatttggatc caaaccgcac agcaccagca 300
accgcagatg gcttccgcgg gcttggtcgc gcgatggcaa acgcgcaggg tgaggcaacg 360
ttcaccactt tggttccggg agcattcgca gatgaggcac cacacttcaa ggttggtgtg 420
ttcgcccgtg gcatgctgga gcgtctgtac actcgcgcat acctgccaga cgccgatttg 480
agcaccgacc cagttttggc tgtggtccca gctgatcgac gtgacctcct ggtggctcaa 540
aagaccgatg atggattccg cttcgacatc actgtccagg ctgaagacaa tgaaacccca 600
ttttttggac tctaa 615
<210> 34
<211> 204
<212> PRT
<213> 谷氨酸棒杆菌
<400> 34
Met Ile Asp Thr Gly Lys Asn Gly Glu Phe Arg Tyr Glu Gln Ser Asn
1 5 10 15
Ile Ile Asp Gln Asn Glu Ala Glu Phe Gly Ile Thr Pro Ser Gln Thr
20 25 30
Val Gly Pro Tyr Val His Ile Gly Leu Thr Leu Glu Gly Ala Glu His
35 40 45
Leu Val Glu Pro Gly Ser Glu Gly Ala Val Ser Phe Thr Val Ser Ala
50 55 60
Thr Asp Gly Asn Gly Asp Pro Ile Ala Asp Ala Met Phe Glu Leu Trp
65 70 75 80
Gln Ala Asp Pro Glu Gly Ile His Asn Ser Asp Leu Asp Pro Asn Arg
85 90 95
Thr Ala Pro Ala Thr Ala Asp Gly Phe Arg Gly Leu Gly Arg Ala Met
100 105 110
Ala Asn Ala Gln Gly Glu Ala Thr Phe Thr Thr Leu Val Pro Gly Ala
115 120 125
Phe Ala Asp Glu Ala Pro His Phe Lys Val Gly Val Phe Ala Arg Gly
130 135 140
Met Leu Glu Arg Leu Tyr Thr Arg Ala Tyr Leu Pro Asp Ala Asp Leu
145 150 155 160
Ser Thr Asp Pro Val Leu Ala Val Val Pro Ala Asp Arg Arg Asp Leu
165 170 175
Leu Val Ala Gln Lys Thr Asp Asp Gly Phe Arg Phe Asp Ile Thr Val
180 185 190
Gln Ala Glu Asp Asn Glu Thr Pro Phe Phe Gly Leu
195 200
<210> 35
<211> 693
<212> DNA
<213> 谷氨酸棒杆菌
<400> 35
atggacatcc cacacttcgc cccgacggga ggcgaatact ccccactgca cttcccggag 60
taccggacca ccatcaagcg caacccaagc aacgatctca tcatggttcc tagtcgcctc 120
ggcgagtcca cgggacctgt cttcggcgac cgcgacttgg gagacatcga caacgacatg 180
accaaggtga acggtggcga ggctatcggc cagcgcatct tcgttcacgg ccgtgtcctc 240
ggtttcgatg gcaagccagt tccgcacacc ttggtcgagg cgtggcaggc aaacgccgca 300
ggccgttacc gccacaagaa tgactcctgg ccagcgccac tggatccaca cttcaacggt 360
gttgcacgta ctctcaccga caaggacggc cagtaccact tctggaccgt tatgccaggt 420
aattaccctt ggggtaacca ccacaacgca tggcgcccgg cgcacattca cttctcgctc 480
tatggtcgtc agtttacgga gcgtctggtc acccagatgt acttcccgaa cgatccattg 540
ttcttccagg atccgatcta caacgcggtg ccaaagggtg cacgtgagcg catgatcgca 600
acgttcgact atgacgagac ccgtgaaaac ttcgcgcttg gttacaagtt cgacatcgtc 660
cttcgtggcc gcaacgccac cccatttgag taa 693
<210> 36
<211> 230
<212> PRT
<213> 谷氨酸棒杆菌
<400> 36
Met Asp Ile Pro His Phe Ala Pro Thr Gly Gly Glu Tyr Ser Pro Leu
1 5 10 15
His Phe Pro Glu Tyr Arg Thr Thr Ile Lys Arg Asn Pro Ser Asn Asp
20 25 30
Leu Ile Met Val Pro Ser Arg Leu Gly Glu Ser Thr Gly Pro Val Phe
35 40 45
Gly Asp Arg Asp Leu Gly Asp Ile Asp Asn Asp Met Thr Lys Val Asn
50 55 60
Gly Gly Glu Ala Ile Gly Gln Arg Ile Phe Val His Gly Arg Val Leu
65 70 75 80
Gly Phe Asp Gly Lys Pro Val Pro His Thr Leu Val Glu Ala Trp Gln
85 90 95
Ala Asn Ala Ala Gly Arg Tyr Arg His Lys Asn Asp Ser Trp Pro Ala
100 105 110
Pro Leu Asp Pro His Phe Asn Gly Val Ala Arg Thr Leu Thr Asp Lys
115 120 125
Asp Gly Gln Tyr His Phe Trp Thr Val Met Pro Gly Asn Tyr Pro Trp
130 135 140
Gly Asn His His Asn Ala Trp Arg Pro Ala His Ile His Phe Ser Leu
145 150 155 160
Tyr Gly Arg Gln Phe Thr Glu Arg Leu Val Thr Gln Met Tyr Phe Pro
165 170 175
Asn Asp Pro Leu Phe Phe Gln Asp Pro Ile Tyr Asn Ala Val Pro Lys
180 185 190
Gly Ala Arg Glu Arg Met Ile Ala Thr Phe Asp Tyr Asp Glu Thr Arg
195 200 205
Glu Asn Phe Ala Leu Gly Tyr Lys Phe Asp Ile Val Leu Arg Gly Arg
210 215 220
Asn Ala Thr Pro Phe Glu
225 230
<210> 37
<211> 1164
<212> DNA
<213> 大肠杆菌
<400> 37
atgaacaact ttaatctgca caccccaacc cgcattctgt ttggtaaagg cgcaatcgct 60
ggtttacgcg aacaaattcc tcacgatgct cgcgtattga ttacctacgg cggcggcagc 120
gtgaaaaaaa ccggcgttct cgatcaagtt ctggatgccc tgaaaggcat ggacgtgctg 180
gaatttggcg gtattgagcc aaacccggct tatgaaacgc tgatgaacgc cgtgaaactg 240
gttcgcgaac agaaagtgac tttcctgctg gcggttggcg gcggttctgt actggacggc 300
accaaattta tcgccgcagc ggctaactat ccggaaaata tcgatccgtg gcacattctg 360
caaacgggcg gtaaagagat taaaagcgcc atcccgatgg gctgtgtgct gacgctgcca 420
gcaaccggtt cagaatccaa cgcaggcgcg gtgatctccc gtaaaaccac aggcgacaag 480
caggcgttcc attctgccca tgttcagccg gtatttgccg tgctcgatcc ggtttatacc 540
tacaccctgc cgccgcgtca ggtggctaac ggcgtagtgg acgcctttgt acacaccgtg 600
gaacagtatg ttaccaaacc ggttgatgcc aaaattcagg accgtttcgc agaaggcatt 660
ttgctgacgc taatcgaaga tggtccgaaa gccctgaaag agccagaaaa ctacgatgtg 720
cgcgccaacg tcatgtgggc ggcgactcag gcgctgaacg gtttgattgg cgctggcgta 780
ccgcaggact gggcaacgca tatgctgggc cacgaactga ctgcgatgca cggtctggat 840
cacgcgcaaa cactggctat cgtcctgcct gcactgtgga atgaaaaacg cgataccaag 900
cgcgctaagc tgctgcaata tgctgaacgc gtctggaaca tcactgaagg ttccgatgat 960
gagcgtattg acgccgcgat tgccgcaacc cgcaatttct ttgagcaatt aggcgtgccg 1020
acccacctct ccgactacgg tctggacggc agctccatcc cggctttgct gaaaaaactg 1080
gaagagcacg gcatgaccca actgggcgaa aatcatgaca ttacgttgga tgtcagccgc 1140
cgtatatacg aagccgcccg ctaa 1164
<210> 38
<211> 387
<212> PRT
<213> 大肠杆菌
<400> 38
Met Asn Asn Phe Asn Leu His Thr Pro Thr Arg Ile Leu Phe Gly Lys
1 5 10 15
Gly Ala Ile Ala Gly Leu Arg Glu Gln Ile Pro His Asp Ala Arg Val
20 25 30
Leu Ile Thr Tyr Gly Gly Gly Ser Val Lys Lys Thr Gly Val Leu Asp
35 40 45
Gln Val Leu Asp Ala Leu Lys Gly Met Asp Val Leu Glu Phe Gly Gly
50 55 60
Ile Glu Pro Asn Pro Ala Tyr Glu Thr Leu Met Asn Ala Val Lys Leu
65 70 75 80
Val Arg Glu Gln Lys Val Thr Phe Leu Leu Ala Val Gly Gly Gly Ser
85 90 95
Val Leu Asp Gly Thr Lys Phe Ile Ala Ala Ala Ala Asn Tyr Pro Glu
100 105 110
Asn Ile Asp Pro Trp His Ile Leu Gln Thr Gly Gly Lys Glu Ile Lys
115 120 125
Ser Ala Ile Pro Met Gly Cys Val Leu Thr Leu Pro Ala Thr Gly Ser
130 135 140
Glu Ser Asn Ala Gly Ala Val Ile Ser Arg Lys Thr Thr Gly Asp Lys
145 150 155 160
Gln Ala Phe His Ser Ala His Val Gln Pro Val Phe Ala Val Leu Asp
165 170 175
Pro Val Tyr Thr Tyr Thr Leu Pro Pro Arg Gln Val Ala Asn Gly Val
180 185 190
Val Asp Ala Phe Val His Thr Val Glu Gln Tyr Val Thr Lys Pro Val
195 200 205
Asp Ala Lys Ile Gln Asp Arg Phe Ala Glu Gly Ile Leu Leu Thr Leu
210 215 220
Ile Glu Asp Gly Pro Lys Ala Leu Lys Glu Pro Glu Asn Tyr Asp Val
225 230 235 240
Arg Ala Asn Val Met Trp Ala Ala Thr Gln Ala Leu Asn Gly Leu Ile
245 250 255
Gly Ala Gly Val Pro Gln Asp Trp Ala Thr His Met Leu Gly His Glu
260 265 270
Leu Thr Ala Met His Gly Leu Asp His Ala Gln Thr Leu Ala Ile Val
275 280 285
Leu Pro Ala Leu Trp Asn Glu Lys Arg Asp Thr Lys Arg Ala Lys Leu
290 295 300
Leu Gln Tyr Ala Glu Arg Val Trp Asn Ile Thr Glu Gly Ser Asp Asp
305 310 315 320
Glu Arg Ile Asp Ala Ala Ile Ala Ala Thr Arg Asn Phe Phe Glu Gln
325 330 335
Leu Gly Val Pro Thr His Leu Ser Asp Tyr Gly Leu Asp Gly Ser Ser
340 345 350
Ile Pro Ala Leu Leu Lys Lys Leu Glu Glu His Gly Met Thr Gln Leu
355 360 365
Gly Glu Asn His Asp Ile Thr Leu Asp Val Ser Arg Arg Ile Tyr Glu
370 375 380
Ala Ala Arg
385
<210> 39
<211> 1062
<212> DNA
<213> 谷氨酸棒杆菌
<400> 39
atgagcatcc aagtaaaagc actccagaaa accggccccg aagcaccttt cgaggtcaaa 60
atcattgagc gtcgtgagcc tcgcgctgac gacgtagtta tcgacatcaa agctgccggc 120
atctgccaca gcgatatcca caccatccgc aacgaatggg gcgaggcaca cttcccgctc 180
accgtcggcc acgaaatcgc aggcgttgtc tctgcggttg gctccgatgt aaccaagtgg 240
aaagtcggcg accgcgttgg cgtcggctgc ctagttaact cctgcggcga atgtgaacag 300
tgtgtcgcgg gatttgaaaa caactgcctt cgcggaaacg tcggaaccta caactccgac 360
gacgtcgacg gcaccatcac gcaaggtggc tacgccgaaa aggtagtggt caacgaacgt 420
ttcctctgca gcatcccaga ggaactcgac ttcgatgtcg cagcaccact gctgtgcgca 480
ggcatcacca cctactcccc gatcgctcgc tggaacgtta aagaaggcga caaagtagca 540
gtcatgggcc tcggcgggct cggccacatg ggtgtccaaa tcgccgcagc caagggcgct 600
gacgttaccg ttctgtcccg ttccctgcgc aaggctgaac ttgccaagga actcggcgca 660
gctcgcacgc ttgcgacttc tgatgaggat ttcttcaccg aacacgccgg tgaattcgac 720
ttcatcctca acaccattag cgcatccatc ccagtcgaca agtacctgag ccttctcaag 780
ccacacggtg tcatggctgt tgtcggtctg ccaccagaga agcagccact gagcttcggt 840
gcgctcatcg gcggcggaaa agtcctcacc ggatccaaca ttggcggcat ccctgaaacc 900
caggaaatgc tcgacttctg tgcaaaacac ggcctcggcg cgatgatcga aactgtcggc 960
gtcaacgatg ttgatgcagc ctacgaccgc gttgttgccg gcgacgttca gttccgcgtt 1020
gtcattgata ctgcttcgtt tgcagaggta gaggcggttt ag 1062
<210> 40
<211> 353
<212> PRT
<213> 谷氨酸棒杆菌
<400> 40
Met Ser Ile Gln Val Lys Ala Leu Gln Lys Thr Gly Pro Glu Ala Pro
1 5 10 15
Phe Glu Val Lys Ile Ile Glu Arg Arg Glu Pro Arg Ala Asp Asp Val
20 25 30
Val Ile Asp Ile Lys Ala Ala Gly Ile Cys His Ser Asp Ile His Thr
35 40 45
Ile Arg Asn Glu Trp Gly Glu Ala His Phe Pro Leu Thr Val Gly His
50 55 60
Glu Ile Ala Gly Val Val Ser Ala Val Gly Ser Asp Val Thr Lys Trp
65 70 75 80
Lys Val Gly Asp Arg Val Gly Val Gly Cys Leu Val Asn Ser Cys Gly
85 90 95
Glu Cys Glu Gln Cys Val Ala Gly Phe Glu Asn Asn Cys Leu Arg Gly
100 105 110
Asn Val Gly Thr Tyr Asn Ser Asp Asp Val Asp Gly Thr Ile Thr Gln
115 120 125
Gly Gly Tyr Ala Glu Lys Val Val Val Asn Glu Arg Phe Leu Cys Ser
130 135 140
Ile Pro Glu Glu Leu Asp Phe Asp Val Ala Ala Pro Leu Leu Cys Ala
145 150 155 160
Gly Ile Thr Thr Tyr Ser Pro Ile Ala Arg Trp Asn Val Lys Glu Gly
165 170 175
Asp Lys Val Ala Val Met Gly Leu Gly Gly Leu Gly His Met Gly Val
180 185 190
Gln Ile Ala Ala Ala Lys Gly Ala Asp Val Thr Val Leu Ser Arg Ser
195 200 205
Leu Arg Lys Ala Glu Leu Ala Lys Glu Leu Gly Ala Ala Arg Thr Leu
210 215 220
Ala Thr Ser Asp Glu Asp Phe Phe Thr Glu His Ala Gly Glu Phe Asp
225 230 235 240
Phe Ile Leu Asn Thr Ile Ser Ala Ser Ile Pro Val Asp Lys Tyr Leu
245 250 255
Ser Leu Leu Lys Pro His Gly Val Met Ala Val Val Gly Leu Pro Pro
260 265 270
Glu Lys Gln Pro Leu Ser Phe Gly Ala Leu Ile Gly Gly Gly Lys Val
275 280 285
Leu Thr Gly Ser Asn Ile Gly Gly Ile Pro Glu Thr Gln Glu Met Leu
290 295 300
Asp Phe Cys Ala Lys His Gly Leu Gly Ala Met Ile Glu Thr Val Gly
305 310 315 320
Val Asn Asp Val Asp Ala Ala Tyr Asp Arg Val Val Ala Gly Asp Val
325 330 335
Gln Phe Arg Val Val Ile Asp Thr Ala Ser Phe Ala Glu Val Glu Ala
340 345 350
Val
<210> 41
<211> 1113
<212> DNA
<213> 谷氨酸棒杆菌
<400> 41
gtgtccatga gcactgtcgt gcctggaatt gtcgccctgt ccaagggggc accggtagaa 60
aaagtaaacg ttgttgtccc tgatccaggt gctaacgatg tcatcgtcaa gattcaggcc 120
tgcggtgtgt gccacaccga cttggcctac cgcgatggcg atatttcaga tgagttccct 180
tacctcctcg gccacgaggc agcaggtatt gttgaggagg taggcgagtc cgtcacccac 240
gttgaggtcg gcgatttcgt catcttgaac tggcgtgcag tgtgcggcga gtgccgtgca 300
tgtaagaagg gcgagccaaa gtactgcttt aacacccaca acgcatctaa gaagatgacc 360
ctggaagacg gcaccgagct gtccccagca ctgggtattg gcgcgttctt ggaaaagacc 420
ctggtccacg aaggccagtg caccaaggtt aaccctgagg aagatccagc agcagctggc 480
cttctgggtt gcggcatcat ggcaggtctt ggtgctgcgg taaacaccgg tgatattaag 540
cgcggcgagt ccgtggcagt cttcggcctt ggtggcgtgg gcatggcagc tattgctggc 600
gccaagattg ctggtgcatc gaagattatt gctgttgata tcgatgagaa gaagttggag 660
tgggcgaagg aattcggcgc aacccacacc attaattcct ctggtcttgg tggcgagggt 720
gatgcctctg aggtcgtggc aaaggttcgt gagctcactg atggtttcgg tactgacgtc 780
tccatcgatg cggtaggcat catgccgacc tggcagcagg cgttttactc ccgtgatcat 840
gcaggccgca tggtgatggt gggcgttcca aacctgacgt ctcgcgtaga tgttcctgcg 900
attgattttt acggtcgcgg tggctctgtg cgccctgcat ggtacggcga ctgcctgcct 960
gagcgtgatt tcccaactta tgtggatctg cacctgcagg gtcgtttccc gctggataag 1020
tttgtttctg agcgtattgg tcttgatgat gttgaagagg ctttcaacac catgaaggct 1080
ggcgacgtgc tgcgttctgt ggtggagatc taa 1113
<210> 42
<211> 370
<212> PRT
<213> 谷氨酸棒杆菌
<400> 42
Met Ser Met Ser Thr Val Val Pro Gly Ile Val Ala Leu Ser Lys Gly
1 5 10 15
Ala Pro Val Glu Lys Val Asn Val Val Val Pro Asp Pro Gly Ala Asn
20 25 30
Asp Val Ile Val Lys Ile Gln Ala Cys Gly Val Cys His Thr Asp Leu
35 40 45
Ala Tyr Arg Asp Gly Asp Ile Ser Asp Glu Phe Pro Tyr Leu Leu Gly
50 55 60
His Glu Ala Ala Gly Ile Val Glu Glu Val Gly Glu Ser Val Thr His
65 70 75 80
Val Glu Val Gly Asp Phe Val Ile Leu Asn Trp Arg Ala Val Cys Gly
85 90 95
Glu Cys Arg Ala Cys Lys Lys Gly Glu Pro Lys Tyr Cys Phe Asn Thr
100 105 110
His Asn Ala Ser Lys Lys Met Thr Leu Glu Asp Gly Thr Glu Leu Ser
115 120 125
Pro Ala Leu Gly Ile Gly Ala Phe Leu Glu Lys Thr Leu Val His Glu
130 135 140
Gly Gln Cys Thr Lys Val Asn Pro Glu Glu Asp Pro Ala Ala Ala Gly
145 150 155 160
Leu Leu Gly Cys Gly Ile Met Ala Gly Leu Gly Ala Ala Val Asn Thr
165 170 175
Gly Asp Ile Lys Arg Gly Glu Ser Val Ala Val Phe Gly Leu Gly Gly
180 185 190
Val Gly Met Ala Ala Ile Ala Gly Ala Lys Ile Ala Gly Ala Ser Lys
195 200 205
Ile Ile Ala Val Asp Ile Asp Glu Lys Lys Leu Glu Trp Ala Lys Glu
210 215 220
Phe Gly Ala Thr His Thr Ile Asn Ser Ser Gly Leu Gly Gly Glu Gly
225 230 235 240
Asp Ala Ser Glu Val Val Ala Lys Val Arg Glu Leu Thr Asp Gly Phe
245 250 255
Gly Thr Asp Val Ser Ile Asp Ala Val Gly Ile Met Pro Thr Trp Gln
260 265 270
Gln Ala Phe Tyr Ser Arg Asp His Ala Gly Arg Met Val Met Val Gly
275 280 285
Val Pro Asn Leu Thr Ser Arg Val Asp Val Pro Ala Ile Asp Phe Tyr
290 295 300
Gly Arg Gly Gly Ser Val Arg Pro Ala Trp Tyr Gly Asp Cys Leu Pro
305 310 315 320
Glu Arg Asp Phe Pro Thr Tyr Val Asp Leu His Leu Gln Gly Arg Phe
325 330 335
Pro Leu Asp Lys Phe Val Ser Glu Arg Ile Gly Leu Asp Asp Val Glu
340 345 350
Glu Ala Phe Asn Thr Met Lys Ala Gly Asp Val Leu Arg Ser Val Val
355 360 365
Glu Ile
370
<210> 43
<211> 1047
<212> DNA
<213> 谷氨酸棒杆菌
<400> 43
gtgagtttta tgaccactgc tgcaccccaa gaatttaccg ctgctgttgt tgaaaaattc 60
ggtcatgacg tgaccgtgaa ggatattgac cttccaaagc cagggccaca ccaggcattg 120
gtgaaggtac tcacctccgg catctgccac accgacctcc acgccttgga gggcgattgg 180
ccagtaaagc cggaaccacc attcgtacca ggacacgaag gtgtaggtga agttgttgag 240
ctcggaccag gtgaacacga tgtgaaggtc ggcgatattg tcggcaatgc gtggctctgg 300
tcagcgtgcg gcacctgcga atactgcatc acaggcaggg aaactcagtg taacgaagct 360
gagtacggtg gctacaccca aaatggatcc ttcggccagt acatgctggt ggatacccga 420
tacgccgctc gcatcccaga cggcgtggac tacctcgaag cagcgccaat tctgtgtgca 480
ggcgtgactg tctacaaggc actcaaagtc tctgaaaccc gcccgggcca attcatggtg 540
atctccggtg tcggcggact tggccacatc gcagtccaat acgcagcggc gatgggcatg 600
cgtgtcattg cggtagatat tgccgaggac aagctggaac ttgcccgtaa gcacggtgcg 660
gaatttaccg tgaatgcgcg taatgaagat ccaggcgaag ctgtacagaa gtacaccaac 720
ggtggcgcac acggcgtgct tgtgactgca gttcacgagg cagcattcgg ccaggcactg 780
gatatggctc gacgtgcagg aacaattgtg ttcaacggtc tgccaccggg agagttccca 840
gcatccgtgt tcaacatcgt attcaagggc ctgaccatcc gtggatccct cgtgggaacc 900
cgccaagact tggccgaagc gctcgatttc tttgcacgcg gactaatcaa gccaaccgtg 960
agtgagtgct ccctcgatga ggtcaatgga gttcttgacc gcatgcgaaa cggcaagatc 1020
gatggtcgtg tggcgattcg tttctaa 1047
<210> 44
<211> 348
<212> PRT
<213> 谷氨酸棒杆菌
<400> 44
Met Ser Phe Met Thr Thr Ala Ala Pro Gln Glu Phe Thr Ala Ala Val
1 5 10 15
Val Glu Lys Phe Gly His Asp Val Thr Val Lys Asp Ile Asp Leu Pro
20 25 30
Lys Pro Gly Pro His Gln Ala Leu Val Lys Val Leu Thr Ser Gly Ile
35 40 45
Cys His Thr Asp Leu His Ala Leu Glu Gly Asp Trp Pro Val Lys Pro
50 55 60
Glu Pro Pro Phe Val Pro Gly His Glu Gly Val Gly Glu Val Val Glu
65 70 75 80
Leu Gly Pro Gly Glu His Asp Val Lys Val Gly Asp Ile Val Gly Asn
85 90 95
Ala Trp Leu Trp Ser Ala Cys Gly Thr Cys Glu Tyr Cys Ile Thr Gly
100 105 110
Arg Glu Thr Gln Cys Asn Glu Ala Glu Tyr Gly Gly Tyr Thr Gln Asn
115 120 125
Gly Ser Phe Gly Gln Tyr Met Leu Val Asp Thr Arg Tyr Ala Ala Arg
130 135 140
Ile Pro Asp Gly Val Asp Tyr Leu Glu Ala Ala Pro Ile Leu Cys Ala
145 150 155 160
Gly Val Thr Val Tyr Lys Ala Leu Lys Val Ser Glu Thr Arg Pro Gly
165 170 175
Gln Phe Met Val Ile Ser Gly Val Gly Gly Leu Gly His Ile Ala Val
180 185 190
Gln Tyr Ala Ala Ala Met Gly Met Arg Val Ile Ala Val Asp Ile Ala
195 200 205
Glu Asp Lys Leu Glu Leu Ala Arg Lys His Gly Ala Glu Phe Thr Val
210 215 220
Asn Ala Arg Asn Glu Asp Pro Gly Glu Ala Val Gln Lys Tyr Thr Asn
225 230 235 240
Gly Gly Ala His Gly Val Leu Val Thr Ala Val His Glu Ala Ala Phe
245 250 255
Gly Gln Ala Leu Asp Met Ala Arg Arg Ala Gly Thr Ile Val Phe Asn
260 265 270
Gly Leu Pro Pro Gly Glu Phe Pro Ala Ser Val Phe Asn Ile Val Phe
275 280 285
Lys Gly Leu Thr Ile Arg Gly Ser Leu Val Gly Thr Arg Gln Asp Leu
290 295 300
Ala Glu Ala Leu Asp Phe Phe Ala Arg Gly Leu Ile Lys Pro Thr Val
305 310 315 320
Ser Glu Cys Ser Leu Asp Glu Val Asn Gly Val Leu Asp Arg Met Arg
325 330 335
Asn Gly Lys Ile Asp Gly Arg Val Ala Ile Arg Phe
340 345
<210> 45
<211> 1020
<212> DNA
<213> 谷氨酸棒杆菌
<400> 45
atgcccaaat acattgccat gcaggtatcc gaatccggtg caccgttagc cgcgaatctc 60
gtgcaacctg ctccgttgaa atcgagggaa gtccgcgtgg aaatcgctgc tagtggtgtg 120
tgccatgcag atattggcac ggcagcagca tcggggaagc acactgtttt tcctgttacc 180
cctggtcatg agattgcagg aaccatcgcg gaaattggtg aaaacgtatc tcggtggacg 240
gttggtgatc gcgttgcaat cggttggttt ggtggcaatt gcggtgactg cgctttttgt 300
cgtgcaggtg atcctgtgca ttgcagagag cggaagattc ctggcgtttc ttatgcgggt 360
ggttgggcac agaatattgt tgttccagcg gaggctcttg ctgcgattcc agatggcatg 420
gacttttacg aggccgcccc gatgggctgc gcaggtgtga caacattcaa tgcgttgcga 480
aacctgaagc tggatcccgg tgcggctgtc gcggtctttg gaatcggcgg tttagtgcgc 540
ctagctattc agtttgctgc gaaaatgggt tatcgaacca tcaccatcgc ccgcggttta 600
gagcgtgagg agctagctag gcaacttggc gccaaccact acatcgatag caatgatctg 660
caccctggcc aggcgttatt tgaacttggc ggggctgact tgatcttgtc tactgcgtcc 720
accacggagc ctctttcgga gttgtctacc ggtctttcta ttggcgggca gctaaccatt 780
atcggagttg atgggggaga tatcaccgtt tcggcagccc aattgatgat gaaccgtcag 840
atcatcacag gtcacctcac tggaagtgcg aatgacacgg aacagactat gaaatttgct 900
catctccatg gcgtgaaacc gcttattgaa cggatgcctc tcgatcaagc caacgaggct 960
attgcacgta tttcagctgg taaaccacgt ttccgtattg tcttggagcc gaattcataa 1020
<210> 46
<211> 339
<212> PRT
<213> 谷氨酸棒杆菌
<400> 46
Met Pro Lys Tyr Ile Ala Met Gln Val Ser Glu Ser Gly Ala Pro Leu
1 5 10 15
Ala Ala Asn Leu Val Gln Pro Ala Pro Leu Lys Ser Arg Glu Val Arg
20 25 30
Val Glu Ile Ala Ala Ser Gly Val Cys His Ala Asp Ile Gly Thr Ala
35 40 45
Ala Ala Ser Gly Lys His Thr Val Phe Pro Val Thr Pro Gly His Glu
50 55 60
Ile Ala Gly Thr Ile Ala Glu Ile Gly Glu Asn Val Ser Arg Trp Thr
65 70 75 80
Val Gly Asp Arg Val Ala Ile Gly Trp Phe Gly Gly Asn Cys Gly Asp
85 90 95
Cys Ala Phe Cys Arg Ala Gly Asp Pro Val His Cys Arg Glu Arg Lys
100 105 110
Ile Pro Gly Val Ser Tyr Ala Gly Gly Trp Ala Gln Asn Ile Val Val
115 120 125
Pro Ala Glu Ala Leu Ala Ala Ile Pro Asp Gly Met Asp Phe Tyr Glu
130 135 140
Ala Ala Pro Met Gly Cys Ala Gly Val Thr Thr Phe Asn Ala Leu Arg
145 150 155 160
Asn Leu Lys Leu Asp Pro Gly Ala Ala Val Ala Val Phe Gly Ile Gly
165 170 175
Gly Leu Val Arg Leu Ala Ile Gln Phe Ala Ala Lys Met Gly Tyr Arg
180 185 190
Thr Ile Thr Ile Ala Arg Gly Leu Glu Arg Glu Glu Leu Ala Arg Gln
195 200 205
Leu Gly Ala Asn His Tyr Ile Asp Ser Asn Asp Leu His Pro Gly Gln
210 215 220
Ala Leu Phe Glu Leu Gly Gly Ala Asp Leu Ile Leu Ser Thr Ala Ser
225 230 235 240
Thr Thr Glu Pro Leu Ser Glu Leu Ser Thr Gly Leu Ser Ile Gly Gly
245 250 255
Gln Leu Thr Ile Ile Gly Val Asp Gly Gly Asp Ile Thr Val Ser Ala
260 265 270
Ala Gln Leu Met Met Asn Arg Gln Ile Ile Thr Gly His Leu Thr Gly
275 280 285
Ser Ala Asn Asp Thr Glu Gln Thr Met Lys Phe Ala His Leu His Gly
290 295 300
Val Lys Pro Leu Ile Glu Arg Met Pro Leu Asp Gln Ala Asn Glu Ala
305 310 315 320
Ile Ala Arg Ile Ser Ala Gly Lys Pro Arg Phe Arg Ile Val Leu Glu
325 330 335
Pro Asn Ser
<210> 47
<211> 879
<212> DNA
<213> 谷氨酸棒杆菌
<400> 47
atgcaaaccc ttgctgctat tgttcgtgcc acgaagcaac cttttgagat caccaccatt 60
gatctggatg caccacgacc agatgaagtt caaatccgtg ttattgctgc cggagtgcgc 120
cacactgacg caattgttcg tgatcagatt tacccaactt ttcttcccgc agttttcggc 180
cacgaaggcg ccggagtagt tgtcgccgtg ggttctgcag tcacctcggt gaaaccagat 240
gacaaggtag tgctgggatt caactcttgt ggccagtgct tgaagtgttt gggcggtaag 300
cctgcgtact gtgagaaatt ctatgaccgc aacttcgcat gcacccgcga tgccgggcac 360
actactttgt ttacccgtgc aacaaaagag caggcagagg ccatcatcga cacccttgat 420
gatgttttct acgatgcgga tgcgggtttc ctggcatacc cagcaactcc cccagaggct 480
tcgggagtaa gcgtgttggt tgtcgcggct ggtacctctg atctccccca agcaaaggaa 540
gcactacaca ctgcctccta cttggggcgc tccacctcac tgattgttga ttttggagtg 600
gctggcatcc accgcctgct ttcatacgaa gaagaactcc gcgctgcggg cgtgctcatc 660
gttgccgctg gaatggatgg tgcgctaccc ggagttgtcg caggcttagt gtccgcacct 720
gtcgtcgcac tgccaacctc cgtgggatac ggcgcaggtg ctggaggaat cgcaccactt 780
ctgaccatgc ttaacgcctg cgcgccggga gttggagtgg tcaacattga taacggctat 840
ggagcaggac acctggctgc gcagattgcg gcgaggtaa 879
<210> 48
<211> 292
<212> PRT
<213> 谷氨酸棒杆菌
<400> 48
Met Gln Thr Leu Ala Ala Ile Val Arg Ala Thr Lys Gln Pro Phe Glu
1 5 10 15
Ile Thr Thr Ile Asp Leu Asp Ala Pro Arg Pro Asp Glu Val Gln Ile
20 25 30
Arg Val Ile Ala Ala Gly Val Arg His Thr Asp Ala Ile Val Arg Asp
35 40 45
Gln Ile Tyr Pro Thr Phe Leu Pro Ala Val Phe Gly His Glu Gly Ala
50 55 60
Gly Val Val Val Ala Val Gly Ser Ala Val Thr Ser Val Lys Pro Asp
65 70 75 80
Asp Lys Val Val Leu Gly Phe Asn Ser Cys Gly Gln Cys Leu Lys Cys
85 90 95
Leu Gly Gly Lys Pro Ala Tyr Cys Glu Lys Phe Tyr Asp Arg Asn Phe
100 105 110
Ala Cys Thr Arg Asp Ala Gly His Thr Thr Leu Phe Thr Arg Ala Thr
115 120 125
Lys Glu Gln Ala Glu Ala Ile Ile Asp Thr Leu Asp Asp Val Phe Tyr
130 135 140
Asp Ala Asp Ala Gly Phe Leu Ala Tyr Pro Ala Thr Pro Pro Glu Ala
145 150 155 160
Ser Gly Val Ser Val Leu Val Val Ala Ala Gly Thr Ser Asp Leu Pro
165 170 175
Gln Ala Lys Glu Ala Leu His Thr Ala Ser Tyr Leu Gly Arg Ser Thr
180 185 190
Ser Leu Ile Val Asp Phe Gly Val Ala Gly Ile His Arg Leu Leu Ser
195 200 205
Tyr Glu Glu Glu Leu Arg Ala Ala Gly Val Leu Ile Val Ala Ala Gly
210 215 220
Met Asp Gly Ala Leu Pro Gly Val Val Ala Gly Leu Val Ser Ala Pro
225 230 235 240
Val Val Ala Leu Pro Thr Ser Val Gly Tyr Gly Ala Gly Ala Gly Gly
245 250 255
Ile Ala Pro Leu Leu Thr Met Leu Asn Ala Cys Ala Pro Gly Val Gly
260 265 270
Val Val Asn Ile Asp Asn Gly Tyr Gly Ala Gly His Leu Ala Ala Gln
275 280 285
Ile Ala Ala Arg
290
<210> 49
<211> 819
<212> DNA
<213> 大肠杆菌
<400> 49
atggaaacct atgctgtttt tggtaatccg atagcccaca gcaaatcgcc attcattcat 60
cagcaatttg ctcagcaact gaatattgaa catccctatg ggcgcgtgtt ggcacccatc 120
aatgatttca tcaacacact gaacgctttc tttagtgctg gtggtaaagg tgcgaatgtg 180
acggtgcctt ttaaagaaga ggcttttgcc agagcggatg agcttactga acgggcagcg 240
ttggctggtg ctgttaatac cctcatgcgg ttagaagatg gacgcctgct gggtgacaat 300
accgatggtg taggcttgtt aagcgatctg gaacgtctgt cttttatccg ccctggttta 360
cgtattctgc ttatcggcgc tggtggagca tctcgcggcg tactactgcc actcctttcc 420
ctggactgtg cggtgacaat aactaatcgg acggtatccc gcgcggaaga gttggctaaa 480
ttgtttgcgc acactggcag tattcaggcg ttgagtatgg acgaactgga aggtcatgag 540
tttgatctca ttattaatgc aacatccagt ggcatcagtg gtgatattcc ggcgatcccg 600
tcatcgctca ttcatccagg catttattgc tatgacatgt tctatcagaa aggaaaaact 660
ccttttctgg catggtgtga gcagcgaggc tcaaagcgta atgctgatgg tttaggaatg 720
ctggtggcac aggcggctca tgcctttctt ctctggcacg gtgttctgcc tgacgtagaa 780
ccagttataa agcaattgca ggaggaattg tccgcgtga 819
<210> 50
<211> 272
<212> PRT
<213> 大肠杆菌
<400> 50
Met Glu Thr Tyr Ala Val Phe Gly Asn Pro Ile Ala His Ser Lys Ser
1 5 10 15
Pro Phe Ile His Gln Gln Phe Ala Gln Gln Leu Asn Ile Glu His Pro
20 25 30
Tyr Gly Arg Val Leu Ala Pro Ile Asn Asp Phe Ile Asn Thr Leu Asn
35 40 45
Ala Phe Phe Ser Ala Gly Gly Lys Gly Ala Asn Val Thr Val Pro Phe
50 55 60
Lys Glu Glu Ala Phe Ala Arg Ala Asp Glu Leu Thr Glu Arg Ala Ala
65 70 75 80
Leu Ala Gly Ala Val Asn Thr Leu Met Arg Leu Glu Asp Gly Arg Leu
85 90 95
Leu Gly Asp Asn Thr Asp Gly Val Gly Leu Leu Ser Asp Leu Glu Arg
100 105 110
Leu Ser Phe Ile Arg Pro Gly Leu Arg Ile Leu Leu Ile Gly Ala Gly
115 120 125
Gly Ala Ser Arg Gly Val Leu Leu Pro Leu Leu Ser Leu Asp Cys Ala
130 135 140
Val Thr Ile Thr Asn Arg Thr Val Ser Arg Ala Glu Glu Leu Ala Lys
145 150 155 160
Leu Phe Ala His Thr Gly Ser Ile Gln Ala Leu Ser Met Asp Glu Leu
165 170 175
Glu Gly His Glu Phe Asp Leu Ile Ile Asn Ala Thr Ser Ser Gly Ile
180 185 190
Ser Gly Asp Ile Pro Ala Ile Pro Ser Ser Leu Ile His Pro Gly Ile
195 200 205
Tyr Cys Tyr Asp Met Phe Tyr Gln Lys Gly Lys Thr Pro Phe Leu Ala
210 215 220
Trp Cys Glu Gln Arg Gly Ser Lys Arg Asn Ala Asp Gly Leu Gly Met
225 230 235 240
Leu Val Ala Gln Ala Ala His Ala Phe Leu Leu Trp His Gly Val Leu
245 250 255
Pro Asp Val Glu Pro Val Ile Lys Gln Leu Gln Glu Glu Leu Ser Ala
260 265 270
<210> 51
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 51
cggtacccgg ggatccttac ttccgcgtat ccaac 35
<210> 52
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 52
ctaggaatcg cggccggtga actcctaaag aactatataa c 41
<210> 53
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 53
ggccgcgatt cctagcatgc 20
<210> 54
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 54
ccaagcttgc atgccagtca tcatcaacgg tgccg 35
<210> 55
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 55
atctccgcag aagacgtact g 21
<210> 56
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 56
tccgatcatg tatgacctcc 20
<210> 57
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 57
cggtacccgg ggatcggcat agtgcttcca acgctc 36
<210> 58
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 58
tagctccact caagattcct cgatattacc tacagg 36
<210> 59
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 59
tcttgagtgg agctagggcc 20
<210> 60
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 60
ccaagcttgc atgcccatat agagcccagg agctctc 37
<210> 61
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 61
cgccgcaaag tccaaataga aag 23
<210> 62
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 62
ggattcttcc tgaactcagc 20
<210> 63
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 63
cggtacccgg ggatcgggct cgtcctgaaa ttgcac 36
<210> 64
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 64
tccgtcgtga gccatgttgt gcccacgaga ctacc 35
<210> 65
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 65
atggctcacg acggattgcg 20
<210> 66
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 66
ccaagcttgc atgcccggtt gcagccttca taaacg 36
<210> 67
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 67
agaccaatga gtacccaacc g 21
<210> 68
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 68
tcagcgtctg gctcagctac 20
<210> 69
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 69
cggtacccgg ggatcaaccc cagctcaaat aacacc 36
<210> 70
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 70
tttcaacaca atccgtcctt ctcgcttgga ttacttg 37
<210> 71
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 71
cggattgtgt tgaaattgct ctg 23
<210> 72
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 72
ccaagcttgc atgcctcacc acgggaatct tcagg 35
<210> 73
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 73
ccggactggg gtgtgttttg 20
<210> 74
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 74
cccggaaaat acggtatagc 20
<210> 75
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 75
ccaagcttgc atgccccatc gcattgccga aaagc 35
<210> 76
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 76
aaagatcggg tcaatgcagt tcgcggggcg aacat 35
<210> 77
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 77
cgccccgcga actgcattga cccgatcttt atacc 35
<210> 78
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 78
cggtacccgg ggatcaacgt tgacggtgat gccat 35
<210> 79
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 79
gaaatgtcat acttcagcca tcagg 25
<210> 80
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 80
tgcgagtgat gaaatcctga aactt 25
<210> 81
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 81
ccaagcttgc atgcctttcg cggtgaatca accca 35
<210> 82
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 82
caggtcaaag ctaaggcatt gtctgtaaat gggca 35
<210> 83
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 83
ctaaggggtt tagcaatgcc caatcaggcc cactt 35
<210> 84
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 84
cggtacccgg ggatcttagg gtacgagggt aagtg 35
<210> 85
<211> 93
<212> DNA
<213> 人工序列
<220>
<223> P2启动子的DNA片段
<400> 85
cttagctttg acctgcacaa atagttgcaa attgtcccac atacacataa agtagcttgc 60
gtatttaaaa ttatgaacct aaggggttta gca 93
<210> 86
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 86
atttacagac aatgccttag ctttgacctg cacaa 35
<210> 87
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 87
ggcctgattg ggcattgcta aaccccttag g 31
<210> 88
<211> 1686
<212> DNA
<213> 谷氨酸棒杆菌
<400> 88
atgacaacaa ccaccggaag tgcccggcca gcacgtgccg ccaggaagcc taagcccgaa 60
ggccaatgga aaatcgacgg caccgagccg cttaaccatg ccgaggaaat taagcaagaa 120
gaacccgctt ttgctgtcaa gcagcgggtc attgatattt actccaagca gggtttttct 180
tccattgcac cggatgacat tgccccacgc tttaagtggt tgggcattta cacccagcgt 240
aagcaggatc tgggcggtga actgaccggt cagcttcctg atgatgagct gcaggatgag 300
tacttcatga tgcgtgtgcg ttttgatggc ggactggctt cccctgagcg cctgcgtgcc 360
gtgggtgaaa tttctaggga ttatgctcgt tccaccgcgg acttcaccga ccgccagaac 420
attcagctgc actggattcg tattgaagat gtgcctgcga tctgggagaa gctagaaacc 480
gtcggactgt ccaccatgct tggttgcggt gacgttccac gtgttatctt gggctcccca 540
gtttctggcg tagctgctga agagctgatc gatgccaccc cggctatcga tgcgattcgt 600
gagcgctacc tagacaagga agagttccac aaccttcctc gtaagtttaa gactgctatc 660
actggcaacc agcgccagga tgttacccac gaaatccagg acgtttcctt cgttccttcg 720
attcacccag aattcggccc aggatttgag tgctttgtgg gcggcggcct gtccaccaac 780
ccaatgcttg ctcagccact tggttcttgg attccacttg atgaggttcc agaagtgtgg 840
gctggcgtcg ccggaatttt ccgcgactac ggcttccgac gcctgcgtaa ccgtgctcgc 900
ctcaagttct tggtggcaca gtggggtatt gagaagttcc gtgaagttct tgagaccgaa 960
tacctcgagc gcaagctgat tgatggccca gttgttacca ccaaccctgg ctaccgtgac 1020
cacattggca ttcacccaca aaaggacggc aagttctacc tcggtgtgaa gccaaccgtt 1080
ggacacacca ccggtgagca gctcattgcc attgctgatg ttgcagaaaa gcacggcatc 1140
accaggattc gtaccacggc ggaaaaggaa ctgctcttcc tcgatattga gcgagagaac 1200
cttactaccg ttgcacgtga cctggatgaa atcggactgt actcttcacc ttccgagttc 1260
cgccgcggca tcatttcctg caccggcttg gagttctgca agcttgcgca cgcaaccacc 1320
aagtcacgag caattgagct tgtggacgaa ctggaagagc gactcggcga tttggatgtt 1380
cccatcaaga ttgccctgaa cggttgccct aactcttgtg cacgcaccca ggtttccgac 1440
atcggattca agggacagac cgtcactgat gctgacggca accgcgttga aggtttccag 1500
gttcacctgg gcggttccat gaacttggat ccaaacttcg gacgcaagct caagggccac 1560
aaggttattg ccgatgaagt gggagagtac gtcactcgcg ttgttaccca cttcaaggaa 1620
cagcgccacg aggacgagca cttccgcgat tgggtccagc gggccgctga ggaagatttg 1680
gtgtga 1686
<210> 89
<211> 561
<212> PRT
<213> 谷氨酸棒杆菌
<400> 89
Met Thr Thr Thr Thr Gly Ser Ala Arg Pro Ala Arg Ala Ala Arg Lys
1 5 10 15
Pro Lys Pro Glu Gly Gln Trp Lys Ile Asp Gly Thr Glu Pro Leu Asn
20 25 30
His Ala Glu Glu Ile Lys Gln Glu Glu Pro Ala Phe Ala Val Lys Gln
35 40 45
Arg Val Ile Asp Ile Tyr Ser Lys Gln Gly Phe Ser Ser Ile Ala Pro
50 55 60
Asp Asp Ile Ala Pro Arg Phe Lys Trp Leu Gly Ile Tyr Thr Gln Arg
65 70 75 80
Lys Gln Asp Leu Gly Gly Glu Leu Thr Gly Gln Leu Pro Asp Asp Glu
85 90 95
Leu Gln Asp Glu Tyr Phe Met Met Arg Val Arg Phe Asp Gly Gly Leu
100 105 110
Ala Ser Pro Glu Arg Leu Arg Ala Val Gly Glu Ile Ser Arg Asp Tyr
115 120 125
Ala Arg Ser Thr Ala Asp Phe Thr Asp Arg Gln Asn Ile Gln Leu His
130 135 140
Trp Ile Arg Ile Glu Asp Val Pro Ala Ile Trp Glu Lys Leu Glu Thr
145 150 155 160
Val Gly Leu Ser Thr Met Leu Gly Cys Gly Asp Val Pro Arg Val Ile
165 170 175
Leu Gly Ser Pro Val Ser Gly Val Ala Ala Glu Glu Leu Ile Asp Ala
180 185 190
Thr Pro Ala Ile Asp Ala Ile Arg Glu Arg Tyr Leu Asp Lys Glu Glu
195 200 205
Phe His Asn Leu Pro Arg Lys Phe Lys Thr Ala Ile Thr Gly Asn Gln
210 215 220
Arg Gln Asp Val Thr His Glu Ile Gln Asp Val Ser Phe Val Pro Ser
225 230 235 240
Ile His Pro Glu Phe Gly Pro Gly Phe Glu Cys Phe Val Gly Gly Gly
245 250 255
Leu Ser Thr Asn Pro Met Leu Ala Gln Pro Leu Gly Ser Trp Ile Pro
260 265 270
Leu Asp Glu Val Pro Glu Val Trp Ala Gly Val Ala Gly Ile Phe Arg
275 280 285
Asp Tyr Gly Phe Arg Arg Leu Arg Asn Arg Ala Arg Leu Lys Phe Leu
290 295 300
Val Ala Gln Trp Gly Ile Glu Lys Phe Arg Glu Val Leu Glu Thr Glu
305 310 315 320
Tyr Leu Glu Arg Lys Leu Ile Asp Gly Pro Val Val Thr Thr Asn Pro
325 330 335
Gly Tyr Arg Asp His Ile Gly Ile His Pro Gln Lys Asp Gly Lys Phe
340 345 350
Tyr Leu Gly Val Lys Pro Thr Val Gly His Thr Thr Gly Glu Gln Leu
355 360 365
Ile Ala Ile Ala Asp Val Ala Glu Lys His Gly Ile Thr Arg Ile Arg
370 375 380
Thr Thr Ala Glu Lys Glu Leu Leu Phe Leu Asp Ile Glu Arg Glu Asn
385 390 395 400
Leu Thr Thr Val Ala Arg Asp Leu Asp Glu Ile Gly Leu Tyr Ser Ser
405 410 415
Pro Ser Glu Phe Arg Arg Gly Ile Ile Ser Cys Thr Gly Leu Glu Phe
420 425 430
Cys Lys Leu Ala His Ala Thr Thr Lys Ser Arg Ala Ile Glu Leu Val
435 440 445
Asp Glu Leu Glu Glu Arg Leu Gly Asp Leu Asp Val Pro Ile Lys Ile
450 455 460
Ala Leu Asn Gly Cys Pro Asn Ser Cys Ala Arg Thr Gln Val Ser Asp
465 470 475 480
Ile Gly Phe Lys Gly Gln Thr Val Thr Asp Ala Asp Gly Asn Arg Val
485 490 495
Glu Gly Phe Gln Val His Leu Gly Gly Ser Met Asn Leu Asp Pro Asn
500 505 510
Phe Gly Arg Lys Leu Lys Gly His Lys Val Ile Ala Asp Glu Val Gly
515 520 525
Glu Tyr Val Thr Arg Val Val Thr His Phe Lys Glu Gln Arg His Glu
530 535 540
Asp Glu His Phe Arg Asp Trp Val Gln Arg Ala Ala Glu Glu Asp Leu
545 550 555 560
Val
<210> 90
<211> 249
<212> DNA
<213> 谷氨酸棒杆菌
<400> 90
gtgagtcttc ggaggaaacc caatcccaac cgcaaccacc ctctgtactg cccatactgc 60
gcgggagaag ttcttttccc cgatgagcaa acagaattcg cgtggttgtg tgcggattgc 120
accagagttt ttgaagtgaa atatcacggc caggacgatc cagtgcacag gccagcacca 180
gcaaagtcca catcgcaagc attaaaagaa tctctcgaaa gacacaaaag aggtgagtcg 240
caacaatga 249
<210> 91
<211> 82
<212> PRT
<213> 谷氨酸棒杆菌
<400> 91
Met Ser Leu Arg Arg Lys Pro Asn Pro Asn Arg Asn His Pro Leu Tyr
1 5 10 15
Cys Pro Tyr Cys Ala Gly Glu Val Leu Phe Pro Asp Glu Gln Thr Glu
20 25 30
Phe Ala Trp Leu Cys Ala Asp Cys Thr Arg Val Phe Glu Val Lys Tyr
35 40 45
His Gly Gln Asp Asp Pro Val His Arg Pro Ala Pro Ala Lys Ser Thr
50 55 60
Ser Gln Ala Leu Lys Glu Ser Leu Glu Arg His Lys Arg Gly Glu Ser
65 70 75 80
Gln Gln
<210> 92
<211> 786
<212> DNA
<213> 谷氨酸棒杆菌
<400> 92
atgagctttc aactagttaa cgccctgaaa aatactggtt cggtaaaaga tcccgagatc 60
tcacccgaag gacctcgcac gaccacaccg ttgtcaccag aggtagcaaa acacaacgag 120
gaactcgtcg aaaagcatgc tgctgcgttg tatgacgcca gcgcgcaaga gatcctggaa 180
tggacagccg agcacacgcc gggcgctatt gcagtgacct tgagcatgga aaacaccgtg 240
ctggcggagc tggctgcgcg gcacctgccg gaagctgatt tcctcttttt ggacaccggt 300
taccacttca aggaaactct tgaagttgcc cgccaggtag atgagcgtta ttcccagaag 360
cttgtcaccg cgctgccaat cctcaagcgc acggagcagg attccattta tggtctcaac 420
ctgtaccgca gcaacccagc ggcgtgctgc cgaatgcgca aagttgaacc gctggcggcg 480
tcgttaagcc catacgctgg ctggatcacc ggcctgcgcc gcgctgatgg cccaacccgt 540
gctcaagccc ctgcgctgag cttggatgcc accggcaggc tcaagatttc tccaattatc 600
acctggtcat tggaggaaac caacgagttc attgcggaca acaacctcat cgatcaccca 660
cttacccatc agggttatcc atcaattgga tgcgaaacct gcacccttcc tgttgctgaa 720
ggacaagacc ctagggccgg ccgttgggct ggaaacgcca agacagaatg cggacttcac 780
tcatga 786
<210> 93
<211> 261
<212> PRT
<213> 谷氨酸棒杆菌
<400> 93
Met Ser Phe Gln Leu Val Asn Ala Leu Lys Asn Thr Gly Ser Val Lys
1 5 10 15
Asp Pro Glu Ile Ser Pro Glu Gly Pro Arg Thr Thr Thr Pro Leu Ser
20 25 30
Pro Glu Val Ala Lys His Asn Glu Glu Leu Val Glu Lys His Ala Ala
35 40 45
Ala Leu Tyr Asp Ala Ser Ala Gln Glu Ile Leu Glu Trp Thr Ala Glu
50 55 60
His Thr Pro Gly Ala Ile Ala Val Thr Leu Ser Met Glu Asn Thr Val
65 70 75 80
Leu Ala Glu Leu Ala Ala Arg His Leu Pro Glu Ala Asp Phe Leu Phe
85 90 95
Leu Asp Thr Gly Tyr His Phe Lys Glu Thr Leu Glu Val Ala Arg Gln
100 105 110
Val Asp Glu Arg Tyr Ser Gln Lys Leu Val Thr Ala Leu Pro Ile Leu
115 120 125
Lys Arg Thr Glu Gln Asp Ser Ile Tyr Gly Leu Asn Leu Tyr Arg Ser
130 135 140
Asn Pro Ala Ala Cys Cys Arg Met Arg Lys Val Glu Pro Leu Ala Ala
145 150 155 160
Ser Leu Ser Pro Tyr Ala Gly Trp Ile Thr Gly Leu Arg Arg Ala Asp
165 170 175
Gly Pro Thr Arg Ala Gln Ala Pro Ala Leu Ser Leu Asp Ala Thr Gly
180 185 190
Arg Leu Lys Ile Ser Pro Ile Ile Thr Trp Ser Leu Glu Glu Thr Asn
195 200 205
Glu Phe Ile Ala Asp Asn Asn Leu Ile Asp His Pro Leu Thr His Gln
210 215 220
Gly Tyr Pro Ser Ile Gly Cys Glu Thr Cys Thr Leu Pro Val Ala Glu
225 230 235 240
Gly Gln Asp Pro Arg Ala Gly Arg Trp Ala Gly Asn Ala Lys Thr Glu
245 250 255
Cys Gly Leu His Ser
260
<210> 94
<211> 954
<212> DNA
<213> 谷氨酸棒杆菌
<400> 94
ttgggctgga aacgccaaga cagaatgcgg acttcactca tgaccacaac cgttgcatca 60
gaactttccc cacaccttaa agatcttgaa aatgaatcca tccacatcct ccgcgaggta 120
gctggccagt ttgataaggt cggcctgctg ttttccggcg gtaaggattc cgtcgtggtg 180
tacgagcttg cgcgccgcgc tttcgctcca gctaacgtgc cttttgaatt gctgcacgtg 240
gacaccggcc acaacttccc agaggttttg gaattccgcg acaacctggt ggagcgcacc 300
ggcgcccgcc tgcgcgtagc taaagtccag gactggatcg atcgcggtga cctgcaggaa 360
cgcccagacg gcacccgcaa cccactgcag actgtccctt tggtggagac catcgctgag 420
cagggctacg acgccgtgct tggtggcgct cgccgcgatg aggagcgtgc ccgcgccaag 480
gagcgtgtgt tctctgtgcg tgactccttc ggtggttggg atccacgccg tcagcgccca 540
gagctgtgga ccctctacaa cggtggccac ctgccaggcg aaaacatccg tgttttccca 600
atctccaact ggactgaagc tgacatctgg gagtacatcg gcgcccgtgg catcgaactt 660
ccaccgatct acttctccca cgaccgcgaa gttttcgagc gcgacggcat gtggctgacc 720
gcaggcgagt ggggtggacc aaagaagggc gaggagatcg tcaccaagac tgtccgctac 780
cgcaccgtcg gcgatatgtc ctgcaccggt gctgtgctct cagaagcccg caccattgac 840
gatgtgatcg aagagatcgc cacctccacc cttaccgaac gtggcgcaac ccgcgccgat 900
gaccgcctca gcgaatccgc aatggaagac cgcaagaagg aaggctactt ctga 954
<210> 95
<211> 317
<212> PRT
<213> 谷氨酸棒杆菌
<400> 95
Met Gly Trp Lys Arg Gln Asp Arg Met Arg Thr Ser Leu Met Thr Thr
1 5 10 15
Thr Val Ala Ser Glu Leu Ser Pro His Leu Lys Asp Leu Glu Asn Glu
20 25 30
Ser Ile His Ile Leu Arg Glu Val Ala Gly Gln Phe Asp Lys Val Gly
35 40 45
Leu Leu Phe Ser Gly Gly Lys Asp Ser Val Val Val Tyr Glu Leu Ala
50 55 60
Arg Arg Ala Phe Ala Pro Ala Asn Val Pro Phe Glu Leu Leu His Val
65 70 75 80
Asp Thr Gly His Asn Phe Pro Glu Val Leu Glu Phe Arg Asp Asn Leu
85 90 95
Val Glu Arg Thr Gly Ala Arg Leu Arg Val Ala Lys Val Gln Asp Trp
100 105 110
Ile Asp Arg Gly Asp Leu Gln Glu Arg Pro Asp Gly Thr Arg Asn Pro
115 120 125
Leu Gln Thr Val Pro Leu Val Glu Thr Ile Ala Glu Gln Gly Tyr Asp
130 135 140
Ala Val Leu Gly Gly Ala Arg Arg Asp Glu Glu Arg Ala Arg Ala Lys
145 150 155 160
Glu Arg Val Phe Ser Val Arg Asp Ser Phe Gly Gly Trp Asp Pro Arg
165 170 175
Arg Gln Arg Pro Glu Leu Trp Thr Leu Tyr Asn Gly Gly His Leu Pro
180 185 190
Gly Glu Asn Ile Arg Val Phe Pro Ile Ser Asn Trp Thr Glu Ala Asp
195 200 205
Ile Trp Glu Tyr Ile Gly Ala Arg Gly Ile Glu Leu Pro Pro Ile Tyr
210 215 220
Phe Ser His Asp Arg Glu Val Phe Glu Arg Asp Gly Met Trp Leu Thr
225 230 235 240
Ala Gly Glu Trp Gly Gly Pro Lys Lys Gly Glu Glu Ile Val Thr Lys
245 250 255
Thr Val Arg Tyr Arg Thr Val Gly Asp Met Ser Cys Thr Gly Ala Val
260 265 270
Leu Ser Glu Ala Arg Thr Ile Asp Asp Val Ile Glu Glu Ile Ala Thr
275 280 285
Ser Thr Leu Thr Glu Arg Gly Ala Thr Arg Ala Asp Asp Arg Leu Ser
290 295 300
Glu Ser Ala Met Glu Asp Arg Lys Lys Glu Gly Tyr Phe
305 310 315
<210> 96
<211> 1302
<212> DNA
<213> 谷氨酸棒杆菌
<400> 96
atgactgctc caaccttgaa taaagcatcc gaaaagattg catcacgcga gacccttcgt 60
ctgtgcaccg caggttccgt agatgatggc aagtccacct tcgtcggccg cctcctgcac 120
gacaccaagt ctgttcttgc tgatcagcta gcttccgtag agcgcacctc cgccgaccgc 180
ggcttcgaag gcctcgacct gtccctcctc gtcgacggcc tgcgcgccga gcgtgagcag 240
ggcatcacca tcgacgttgc ctaccgctac ttcgccactg acaagcgcac cttcatcctg 300
gctgacaccc caggccacgt gcagtacacc cgcaacaccg tcaccggcgt ctccacctcc 360
caggttgtag ttttgcttgt cgacgcccgc cacggcgtcg tcgagcagac ccgccgccac 420
ctgtccgtat cggccctgct gggcgtgcgc acggtgatcc tcgcagtcaa caaaattgac 480
cttgttgatt acagcgaaga agtcttccgc aacattgaaa aagaattcgt ttctttggct 540
tccgctttag atgtcaccga cacccacgtc gttccgatct ccgcactcaa gggcgacaac 600
gttgcagaac cttccaccca catggactgg tacgcgggac caaccgtgct ggaaatcctg 660
gaaaacgttg aagtttcccg cggccgtgca cacgacctgg gcttccgctt cccaatccag 720
tacgtcatcc gcgagcacgc aaccgattac cgcggctacg ccggcaccat caacgctggt 780
tccatctccg tgggcgatac cgtgcaccta cctgaaggcc gcaccaccca ggtcacccac 840
atcgattccg ctgacggatc cctccaaacc gcatcagttg gagaagccgt tgtcctgcgc 900
ctagcccagg aaatcgacct catccgcggc gaactcatcg caggctccga tcgcccagaa 960
tccgttcgtt ccttcaacgc cactgtcgtt ggtctagcag atcgcactat caaaccaggt 1020
gcagcagtca aggtccgcta cggcaccgag ctggtccgcg gacgcgtcgc agccatcgaa 1080
cgagtcctcg acatcgacgg cgtcaacgac aacgaagcac cagaaaccta cggcctcaac 1140
gacatcgcgc acgtgcgcat cgatgttgca ggtgaattgg aagttgaaga ttacgctgct 1200
cgtggcgcaa ttggctcctt ccttcttatc gatcaatcct ccggcgacac cctcgctgcc 1260
ggtttggttg gccaccgcct acgcaataac tggtcgatct ag 1302
<210> 97
<211> 433
<212> PRT
<213> 谷氨酸棒杆菌
<400> 97
Met Thr Ala Pro Thr Leu Asn Lys Ala Ser Glu Lys Ile Ala Ser Arg
1 5 10 15
Glu Thr Leu Arg Leu Cys Thr Ala Gly Ser Val Asp Asp Gly Lys Ser
20 25 30
Thr Phe Val Gly Arg Leu Leu His Asp Thr Lys Ser Val Leu Ala Asp
35 40 45
Gln Leu Ala Ser Val Glu Arg Thr Ser Ala Asp Arg Gly Phe Glu Gly
50 55 60
Leu Asp Leu Ser Leu Leu Val Asp Gly Leu Arg Ala Glu Arg Glu Gln
65 70 75 80
Gly Ile Thr Ile Asp Val Ala Tyr Arg Tyr Phe Ala Thr Asp Lys Arg
85 90 95
Thr Phe Ile Leu Ala Asp Thr Pro Gly His Val Gln Tyr Thr Arg Asn
100 105 110
Thr Val Thr Gly Val Ser Thr Ser Gln Val Val Val Leu Leu Val Asp
115 120 125
Ala Arg His Gly Val Val Glu Gln Thr Arg Arg His Leu Ser Val Ser
130 135 140
Ala Leu Leu Gly Val Arg Thr Val Ile Leu Ala Val Asn Lys Ile Asp
145 150 155 160
Leu Val Asp Tyr Ser Glu Glu Val Phe Arg Asn Ile Glu Lys Glu Phe
165 170 175
Val Ser Leu Ala Ser Ala Leu Asp Val Thr Asp Thr His Val Val Pro
180 185 190
Ile Ser Ala Leu Lys Gly Asp Asn Val Ala Glu Pro Ser Thr His Met
195 200 205
Asp Trp Tyr Ala Gly Pro Thr Val Leu Glu Ile Leu Glu Asn Val Glu
210 215 220
Val Ser Arg Gly Arg Ala His Asp Leu Gly Phe Arg Phe Pro Ile Gln
225 230 235 240
Tyr Val Ile Arg Glu His Ala Thr Asp Tyr Arg Gly Tyr Ala Gly Thr
245 250 255
Ile Asn Ala Gly Ser Ile Ser Val Gly Asp Thr Val His Leu Pro Glu
260 265 270
Gly Arg Thr Thr Gln Val Thr His Ile Asp Ser Ala Asp Gly Ser Leu
275 280 285
Gln Thr Ala Ser Val Gly Glu Ala Val Val Leu Arg Leu Ala Gln Glu
290 295 300
Ile Asp Leu Ile Arg Gly Glu Leu Ile Ala Gly Ser Asp Arg Pro Glu
305 310 315 320
Ser Val Arg Ser Phe Asn Ala Thr Val Val Gly Leu Ala Asp Arg Thr
325 330 335
Ile Lys Pro Gly Ala Ala Val Lys Val Arg Tyr Gly Thr Glu Leu Val
340 345 350
Arg Gly Arg Val Ala Ala Ile Glu Arg Val Leu Asp Ile Asp Gly Val
355 360 365
Asn Asp Asn Glu Ala Pro Glu Thr Tyr Gly Leu Asn Asp Ile Ala His
370 375 380
Val Arg Ile Asp Val Ala Gly Glu Leu Glu Val Glu Asp Tyr Ala Ala
385 390 395 400
Arg Gly Ala Ile Gly Ser Phe Leu Leu Ile Asp Gln Ser Ser Gly Asp
405 410 415
Thr Leu Ala Ala Gly Leu Val Gly His Arg Leu Arg Asn Asn Trp Ser
420 425 430
Ile
<210> 98
<211> 900
<212> DNA
<213> 谷氨酸棒杆菌
<400> 98
ttggctcctt ccttcttatc gatcaatcct ccggcgacac cctcgctgcc ggtttggttg 60
gccaccgcct acgcaataac tggtcgatct agaccagttg ctgtgaaggc aaggtgccgg 120
cttagatgcc ggcgcctagc ctacatccag ctaagacccc ctttaggaca cctcatgatt 180
cccctgatta cgctttccca cggttcccgc aaaaagtccg cagctgcagg tattactgcg 240
ctgactcatg aggccggacg aatgctggaa acaccagccg tggaagcgca tttagagctt 300
gctgaacctt cccttgatca ggttgtggca acgctcagtg cggaaggcgt aaccagggca 360
gcgttggttc ctttgctgtt tagcaatgcg tatcacgcaa agattgacgt tcctgaggca 420
gtaaaagatg cttcagaaaa gtatggtgtg gaacttctcg tgggtccgca tttgggcact 480
ggctccgatg tagccagcgt gcttgcgcag cggttgcgtg cggacgcccc cacagatgcc 540
catgtgattt tgtattccgt tggcagctca cacgtgtccg ccaatgaatc agtcatcgat 600
cttgcccaca ccattgctct cctcactggc ttttcggttg aggtggtgcc cgctaccggt 660
gggccaggtg ccggcggcgc cggagtaata gaggtggcct cgaaacacaa ggccgtccac 720
atcctgccgc tgtttgttac ggaaggtttg ctgctggatc gggttattga tcaatccgcc 780
aacatcgcag ctgccaccgg cacgaacttt acctattccg aacccctaac tactgacctc 840
gcaccacttg ttgcagcccg ttaccacgct gcattgagcg cactgctggc acatatctaa 900
<210> 99
<211> 299
<212> PRT
<213> 谷氨酸棒杆菌
<400> 99
Met Ala Pro Ser Phe Leu Ser Ile Asn Pro Pro Ala Thr Pro Ser Leu
1 5 10 15
Pro Val Trp Leu Ala Thr Ala Tyr Ala Ile Thr Gly Arg Ser Arg Pro
20 25 30
Val Ala Val Lys Ala Arg Cys Arg Leu Arg Cys Arg Arg Leu Ala Tyr
35 40 45
Ile Gln Leu Arg Pro Pro Leu Gly His Leu Met Ile Pro Leu Ile Thr
50 55 60
Leu Ser His Gly Ser Arg Lys Lys Ser Ala Ala Ala Gly Ile Thr Ala
65 70 75 80
Leu Thr His Glu Ala Gly Arg Met Leu Glu Thr Pro Ala Val Glu Ala
85 90 95
His Leu Glu Leu Ala Glu Pro Ser Leu Asp Gln Val Val Ala Thr Leu
100 105 110
Ser Ala Glu Gly Val Thr Arg Ala Ala Leu Val Pro Leu Leu Phe Ser
115 120 125
Asn Ala Tyr His Ala Lys Ile Asp Val Pro Glu Ala Val Lys Asp Ala
130 135 140
Ser Glu Lys Tyr Gly Val Glu Leu Leu Val Gly Pro His Leu Gly Thr
145 150 155 160
Gly Ser Asp Val Ala Ser Val Leu Ala Gln Arg Leu Arg Ala Asp Ala
165 170 175
Pro Thr Asp Ala His Val Ile Leu Tyr Ser Val Gly Ser Ser His Val
180 185 190
Ser Ala Asn Glu Ser Val Ile Asp Leu Ala His Thr Ile Ala Leu Leu
195 200 205
Thr Gly Phe Ser Val Glu Val Val Pro Ala Thr Gly Gly Pro Gly Ala
210 215 220
Gly Gly Ala Gly Val Ile Glu Val Ala Ser Lys His Lys Ala Val His
225 230 235 240
Ile Leu Pro Leu Phe Val Thr Glu Gly Leu Leu Leu Asp Arg Val Ile
245 250 255
Asp Gln Ser Ala Asn Ile Ala Ala Ala Thr Gly Thr Asn Phe Thr Tyr
260 265 270
Ser Glu Pro Leu Thr Thr Asp Leu Ala Pro Leu Val Ala Ala Arg Tyr
275 280 285
His Ala Ala Leu Ser Ala Leu Leu Ala His Ile
290 295
<210> 100
<211> 930
<212> DNA
<213> 谷氨酸棒杆菌
<400> 100
atgcagacat taatctttat cgccattgca ggcgtcgcag cacagcttgt tgatggcggc 60
ctcggcatgg ggttcggcgt cacctcaacc accatcctca tcatgctcgc aggtttaggc 120
cctgcgcagg catccgccgt cgtgcacacc gcagaggttg gaaccacctt agtttctggt 180
ttaagccact ggaaatttgg caacgtggat tggaaagtag ttgtccggct cggtatcccc 240
ggcgctatcg gcgcatttgc tggcgctacc ttcttgtcca atatttccac cgaagcagca 300
gcaccgatca cctccctgat tcttgccctg atcggcatga acctagtctg gcgattcagc 360
aagggacgca tccgccgcga ctattccgat cgcccgcaca gcaagggatt cctcggcgga 420
ctcggtattg tcggtggctt cgttgacgcg tccggtggcg gcggatgggg tccagtgacc 480
acctctacgc tgctgtcttt gggacgcacc gaaccccgca aagtagtcgg caccgtcaac 540
accgcagaat tcttagtctc cctagccgca acattgggct tcgtcgtggg actgtgggat 600
gacctagtag ctaacctctc tgcagttctc gcgttgctca tcggcggcgc aatcgcagca 660
ccaatcggcg cctggatgat ctctcgcgtt aatgcaaccg tcctcggcgg cttcgtgggc 720
accctgattg tcacactgaa cctgccaaag gtgctcaatg tggttggcct tgatttcatc 780
cccaccggcc tcgtccaggt caccgtcctc ctcatcggcc tgccgctgac gtacctcggc 840
ttccgccgct accgcaaaaa cctcctcaac gaaaccatct ccagcgaggt tgtctccgaa 900
ccacagggac aaaagattaa aagctcttaa 930
<210> 101
<211> 309
<212> PRT
<213> 谷氨酸棒杆菌
<400> 101
Met Gln Thr Leu Ile Phe Ile Ala Ile Ala Gly Val Ala Ala Gln Leu
1 5 10 15
Val Asp Gly Gly Leu Gly Met Gly Phe Gly Val Thr Ser Thr Thr Ile
20 25 30
Leu Ile Met Leu Ala Gly Leu Gly Pro Ala Gln Ala Ser Ala Val Val
35 40 45
His Thr Ala Glu Val Gly Thr Thr Leu Val Ser Gly Leu Ser His Trp
50 55 60
Lys Phe Gly Asn Val Asp Trp Lys Val Val Val Arg Leu Gly Ile Pro
65 70 75 80
Gly Ala Ile Gly Ala Phe Ala Gly Ala Thr Phe Leu Ser Asn Ile Ser
85 90 95
Thr Glu Ala Ala Ala Pro Ile Thr Ser Leu Ile Leu Ala Leu Ile Gly
100 105 110
Met Asn Leu Val Trp Arg Phe Ser Lys Gly Arg Ile Arg Arg Asp Tyr
115 120 125
Ser Asp Arg Pro His Ser Lys Gly Phe Leu Gly Gly Leu Gly Ile Val
130 135 140
Gly Gly Phe Val Asp Ala Ser Gly Gly Gly Gly Trp Gly Pro Val Thr
145 150 155 160
Thr Ser Thr Leu Leu Ser Leu Gly Arg Thr Glu Pro Arg Lys Val Val
165 170 175
Gly Thr Val Asn Thr Ala Glu Phe Leu Val Ser Leu Ala Ala Thr Leu
180 185 190
Gly Phe Val Val Gly Leu Trp Asp Asp Leu Val Ala Asn Leu Ser Ala
195 200 205
Val Leu Ala Leu Leu Ile Gly Gly Ala Ile Ala Ala Pro Ile Gly Ala
210 215 220
Trp Met Ile Ser Arg Val Asn Ala Thr Val Leu Gly Gly Phe Val Gly
225 230 235 240
Thr Leu Ile Val Thr Leu Asn Leu Pro Lys Val Leu Asn Val Val Gly
245 250 255
Leu Asp Phe Ile Pro Thr Gly Leu Val Gln Val Thr Val Leu Leu Ile
260 265 270
Gly Leu Pro Leu Thr Tyr Leu Gly Phe Arg Arg Tyr Arg Lys Asn Leu
275 280 285
Leu Asn Glu Thr Ile Ser Ser Glu Val Val Ser Glu Pro Gln Gly Gln
290 295 300
Lys Ile Lys Ser Ser
305
<210> 102
<211> 1374
<212> DNA
<213> 谷氨酸棒杆菌
<400> 102
atgacaactc ccctgcgcgt agccatcatc ggagctggcc ctgctggcat ttacgcatcc 60
gacctcctca tccgcaatga agagcgcgaa gtgttcgttg accttttcga gcaaatgcct 120
gcaccgttcg gactcatccg ttacggcgtt gcaccagacc acccacgcat caagggcatc 180
gttaagtccc tgcacaacgt gttggacaag ccacgcctgc gcctgctcgg caacattgaa 240
atcggcaaag acatcaccgt cgaagaactc cgcgactact acgacgcagt tgtcttctcc 300
accggtgcag ttgcagaccg cgacctcaac atccccggaa ttgaagcaga aggttccttc 360
ggtgccggcg agttcgttgg cttctacgac ggcaacccac gcttcgagcg ctcctgggat 420
ctgtctgcac agtccgtcgc tgttatcggc gttggtaacg tcggcctcga tgtagcccgc 480
atcctggcta agacaggcga cgagctcaaa gtcaccgaaa tttccgacaa cgtctacgac 540
tccctcaaag aaaacaaggc cactgaagta cacgttttcg gacgtcgtgg cccagcacag 600
gtcaagttca ccccacagga actcaaagaa ctcgaccact cccccaccat caacgtggtt 660
gttgacccag aagacatcga ctacgacggc gcctccgaag aagcccgccg cgcatccaaa 720
tcccaggacc tggtctgcca gatcctggaa cagtacgcaa tccgcgagcc aaaggacgct 780
ccgcacaccc tgcagatcca cctctttgaa aacccagttg aggttcttca aaaggacggc 840
aaggttgttg gcctgcgcac cgaacgcacc gcgctcgacg gcaacggtgg cgtaaacggc 900
accggcgaat tcaaggactg gccagttcag gctgtctacc gcgcagtcgg ctacaagtcc 960
gaccccatcg acggcgtccc attcgatggg aacaagcacg tcatccctaa tgacggcgga 1020
catgtcctca ccgctccagg tgcagagcca gtaccaggcc tctacgccac cggctggatc 1080
aagcgtggac caatcggtct gatcggcaac accaagtctg atgccaagga aaccaccgac 1140
atcctcatca aggatgccgt caccggtgta cttgaagccc caaagcacca gggcgaagaa 1200
gccatcatcg agcttctcga ttcccgcaac atcccattca ccacctggga aggctggtac 1260
aaactcgacg cagcagagcg cgcactcggt gaagccgaag gccgcgagcg caagaagatt 1320
gttgattggg aagaaatggt ccgccaggcc cgcgaagctc cagcaattgt ctaa 1374
<210> 103
<211> 457
<212> PRT
<213> 谷氨酸棒杆菌
<400> 103
Met Thr Thr Pro Leu Arg Val Ala Ile Ile Gly Ala Gly Pro Ala Gly
1 5 10 15
Ile Tyr Ala Ser Asp Leu Leu Ile Arg Asn Glu Glu Arg Glu Val Phe
20 25 30
Val Asp Leu Phe Glu Gln Met Pro Ala Pro Phe Gly Leu Ile Arg Tyr
35 40 45
Gly Val Ala Pro Asp His Pro Arg Ile Lys Gly Ile Val Lys Ser Leu
50 55 60
His Asn Val Leu Asp Lys Pro Arg Leu Arg Leu Leu Gly Asn Ile Glu
65 70 75 80
Ile Gly Lys Asp Ile Thr Val Glu Glu Leu Arg Asp Tyr Tyr Asp Ala
85 90 95
Val Val Phe Ser Thr Gly Ala Val Ala Asp Arg Asp Leu Asn Ile Pro
100 105 110
Gly Ile Glu Ala Glu Gly Ser Phe Gly Ala Gly Glu Phe Val Gly Phe
115 120 125
Tyr Asp Gly Asn Pro Arg Phe Glu Arg Ser Trp Asp Leu Ser Ala Gln
130 135 140
Ser Val Ala Val Ile Gly Val Gly Asn Val Gly Leu Asp Val Ala Arg
145 150 155 160
Ile Leu Ala Lys Thr Gly Asp Glu Leu Lys Val Thr Glu Ile Ser Asp
165 170 175
Asn Val Tyr Asp Ser Leu Lys Glu Asn Lys Ala Thr Glu Val His Val
180 185 190
Phe Gly Arg Arg Gly Pro Ala Gln Val Lys Phe Thr Pro Gln Glu Leu
195 200 205
Lys Glu Leu Asp His Ser Pro Thr Ile Asn Val Val Val Asp Pro Glu
210 215 220
Asp Ile Asp Tyr Asp Gly Ala Ser Glu Glu Ala Arg Arg Ala Ser Lys
225 230 235 240
Ser Gln Asp Leu Val Cys Gln Ile Leu Glu Gln Tyr Ala Ile Arg Glu
245 250 255
Pro Lys Asp Ala Pro His Thr Leu Gln Ile His Leu Phe Glu Asn Pro
260 265 270
Val Glu Val Leu Gln Lys Asp Gly Lys Val Val Gly Leu Arg Thr Glu
275 280 285
Arg Thr Ala Leu Asp Gly Asn Gly Gly Val Asn Gly Thr Gly Glu Phe
290 295 300
Lys Asp Trp Pro Val Gln Ala Val Tyr Arg Ala Val Gly Tyr Lys Ser
305 310 315 320
Asp Pro Ile Asp Gly Val Pro Phe Asp Gly Asn Lys His Val Ile Pro
325 330 335
Asn Asp Gly Gly His Val Leu Thr Ala Pro Gly Ala Glu Pro Val Pro
340 345 350
Gly Leu Tyr Ala Thr Gly Trp Ile Lys Arg Gly Pro Ile Gly Leu Ile
355 360 365
Gly Asn Thr Lys Ser Asp Ala Lys Glu Thr Thr Asp Ile Leu Ile Lys
370 375 380
Asp Ala Val Thr Gly Val Leu Glu Ala Pro Lys His Gln Gly Glu Glu
385 390 395 400
Ala Ile Ile Glu Leu Leu Asp Ser Arg Asn Ile Pro Phe Thr Thr Trp
405 410 415
Glu Gly Trp Tyr Lys Leu Asp Ala Ala Glu Arg Ala Leu Gly Glu Ala
420 425 430
Glu Gly Arg Glu Arg Lys Lys Ile Val Asp Trp Glu Glu Met Val Arg
435 440 445
Gln Ala Arg Glu Ala Pro Ala Ile Val
450 455
<210> 104
<211> 1173
<212> DNA
<213> 谷氨酸棒杆菌
<400> 104
ttgtctatga ttggctatgg tttacctatg cccaatcagg cccacttctc tgcgtccttt 60
gcccgcccct ctaccccggc tgcaaagtgc atgcaccata tccgcctcgg ccagcaactc 120
attagaaatg agctggtcga ggccacaggt ctgtcccaac cgactgtcac ccgcgcagtc 180
accgctttaa tgcaggcagg tttggttcgt gaacgccctg atctcacact ctcatcgggc 240
cctggtcgtc ccaatattcc tctagaactc gctccaagtc catggattca tgcaggcgtg 300
gcaatcggca ccaagtcttc ctacgtcgct ttgtttgata ccaagggtcg cacccttcgt 360
gatgccatac tggaaatctc agcagctgat ttagatccag acaccttcat cgaacacctc 420
atcgctggtg tcaaccgcct caccactggt cttgatctac cactggtagg tattggtgtg 480
gctacctcag gaaaagtcac caacgcgggc gttgtcaccg caagcaactt gggctgggat 540
ggcgttgata tcgccggccg tctgaactac caattcagcg ttccagcaac cgtggcatca 600
gcaattcctg ccatcgcagc ttctgaactg caggcttccc cacttcccca ccctgagcag 660
ccaactccca tcaccttgac cttctacgcc gatgactctg tgggcgcggc ctacagcaat 720
gatttgggag tacatgtcat tggaccactg gctacaactc gtggatcagg tttggatact 780
ttgggcatgg ctgctgaaga tgcgctgagc acccaaggtt tcttaagcag ggtttctgat 840
cagggtatct ttgccaacag ccttggtgag ctagtcacca ttgctaaaga caatgaaacc 900
gcacgggaat tcctcaacga tcgcgcgacc ctgctggctc acactgccgc agaagctgct 960
gaaacagtta agccatccac cctggttctc tcgggatcgg cgttttccga agatccacaa 1020
ggtcggttgg tgttcgcttc ccaattgaag aaggaatacg acgcagacat tgagctccgc 1080
ttgatcccca cccaccggga aaatgtccgc gcagcagctc gcgcagtcgc acttgatcga 1140
ctactcaacg agccacttac cctcgtaccc taa 1173
<210> 105
<211> 390
<212> PRT
<213> 谷氨酸棒杆菌
<400> 105
Leu Ser Met Ile Gly Tyr Gly Leu Pro Met Pro Asn Gln Ala His Phe
1 5 10 15
Ser Ala Ser Phe Ala Arg Pro Ser Thr Pro Ala Ala Lys Cys Met His
20 25 30
His Ile Arg Leu Gly Gln Gln Leu Ile Arg Asn Glu Leu Val Glu Ala
35 40 45
Thr Gly Leu Ser Gln Pro Thr Val Thr Arg Ala Val Thr Ala Leu Met
50 55 60
Gln Ala Gly Leu Val Arg Glu Arg Pro Asp Leu Thr Leu Ser Ser Gly
65 70 75 80
Pro Gly Arg Pro Asn Ile Pro Leu Glu Leu Ala Pro Ser Pro Trp Ile
85 90 95
His Ala Gly Val Ala Ile Gly Thr Lys Ser Ser Tyr Val Ala Leu Phe
100 105 110
Asp Thr Lys Gly Arg Thr Leu Arg Asp Ala Ile Leu Glu Ile Ser Ala
115 120 125
Ala Asp Leu Asp Pro Asp Thr Phe Ile Glu His Leu Ile Ala Gly Val
130 135 140
Asn Arg Leu Thr Thr Gly Leu Asp Leu Pro Leu Val Gly Ile Gly Val
145 150 155 160
Ala Thr Ser Gly Lys Val Thr Asn Ala Gly Val Val Thr Ala Ser Asn
165 170 175
Leu Gly Trp Asp Gly Val Asp Ile Ala Gly Arg Leu Asn Tyr Gln Phe
180 185 190
Ser Val Pro Ala Thr Val Ala Ser Ala Ile Pro Ala Ile Ala Ala Ser
195 200 205
Glu Leu Gln Ala Ser Pro Leu Pro His Pro Glu Gln Pro Thr Pro Ile
210 215 220
Thr Leu Thr Phe Tyr Ala Asp Asp Ser Val Gly Ala Ala Tyr Ser Asn
225 230 235 240
Asp Leu Gly Val His Val Ile Gly Pro Leu Ala Thr Thr Arg Gly Ser
245 250 255
Gly Leu Asp Thr Leu Gly Met Ala Ala Glu Asp Ala Leu Ser Thr Gln
260 265 270
Gly Phe Leu Ser Arg Val Ser Asp Gln Gly Ile Phe Ala Asn Ser Leu
275 280 285
Gly Glu Leu Val Thr Ile Ala Lys Asp Asn Glu Thr Ala Arg Glu Phe
290 295 300
Leu Asn Asp Arg Ala Thr Leu Leu Ala His Thr Ala Ala Glu Ala Ala
305 310 315 320
Glu Thr Val Lys Pro Ser Thr Leu Val Leu Ser Gly Ser Ala Phe Ser
325 330 335
Glu Asp Pro Gln Gly Arg Leu Val Phe Ala Ser Gln Leu Lys Lys Glu
340 345 350
Tyr Asp Ala Asp Ile Glu Leu Arg Leu Ile Pro Thr His Arg Glu Asn
355 360 365
Val Arg Ala Ala Ala Arg Ala Val Ala Leu Asp Arg Leu Leu Asn Glu
370 375 380
Pro Leu Thr Leu Val Pro
385 390
<210> 106
<211> 1074
<212> DNA
<213> 谷氨酸棒杆菌
<400> 106
gtgttcatgc ttgcacagcg aacactcccc attcacatca ccgcccccca cctgcccgtc 60
gcgcgcgtat ttcaccaaat tcgcgccaca gacgccgatc gcacctcgct gcaacgcgat 120
cttgaactct cccaagctgg catcactcgg catgtatcag cgcttattga tgcaggtctc 180
gtggaggaaa cccgagtgga ttccggggcg cgctcggggc gaccgcgcac aaaattaggc 240
atcgacggcc gccatctcac cgcctgggga gtgcacattg gcctgcgcag cacggatttt 300
gcggtgtgcg atttagccgg ccgagtgatt aggtatgagc gcgtggacca tgaagtttca 360
cactccacgc cgtcggaaac gctgaatttt gtcgcacata ggttacaaac attgagcgcc 420
ggcttgcccg agccccgcaa tgtgggcgtg gcattatctg cccacttaag cgccaacggc 480
accgtcactt ccgaagatta tggctggtca gaggtggaaa ttgggataca cctccccttc 540
cccgccacca tcggatcagg tgttgcggcg atggccggtt cggaaattat caacgcgcca 600
ctgacccaat ccacgcagtc cacgctgtat ttctacgccc gcgaaatggt ctcccacgcc 660
tggattttca acggcgctgt ccaccgcccc aacagcggcc gcacgccgac ggcgttcgga 720
aatacaaata ccttaaaaga tgcttttcga cgtggactca caccaacaac tttctccgat 780
ttagtccaac tctcccacac caacccgctt gcccgacaga tcctcaacga gcgcgcccac 840
aaacttgccg acgccgtaac caccgccgtt gatgttgtcg accccgaagc cgtcgtcttc 900
gccggcgaag ccttcaccct ggatccggaa actcttcgca ttgtggtgac ccagctccga 960
gcaaacaccg gcagccaact gagaatccaa cgcgcagacg cccacattct ccgcaccgcg 1020
gccatccagg tggcgctgca tccgatccgt caagatccgt tagcatttgt gtaa 1074
<210> 107
<211> 357
<212> PRT
<213> 谷氨酸棒杆菌
<400> 107
Met Phe Met Leu Ala Gln Arg Thr Leu Pro Ile His Ile Thr Ala Pro
1 5 10 15
His Leu Pro Val Ala Arg Val Phe His Gln Ile Arg Ala Thr Asp Ala
20 25 30
Asp Arg Thr Ser Leu Gln Arg Asp Leu Glu Leu Ser Gln Ala Gly Ile
35 40 45
Thr Arg His Val Ser Ala Leu Ile Asp Ala Gly Leu Val Glu Glu Thr
50 55 60
Arg Val Asp Ser Gly Ala Arg Ser Gly Arg Pro Arg Thr Lys Leu Gly
65 70 75 80
Ile Asp Gly Arg His Leu Thr Ala Trp Gly Val His Ile Gly Leu Arg
85 90 95
Ser Thr Asp Phe Ala Val Cys Asp Leu Ala Gly Arg Val Ile Arg Tyr
100 105 110
Glu Arg Val Asp His Glu Val Ser His Ser Thr Pro Ser Glu Thr Leu
115 120 125
Asn Phe Val Ala His Arg Leu Gln Thr Leu Ser Ala Gly Leu Pro Glu
130 135 140
Pro Arg Asn Val Gly Val Ala Leu Ser Ala His Leu Ser Ala Asn Gly
145 150 155 160
Thr Val Thr Ser Glu Asp Tyr Gly Trp Ser Glu Val Glu Ile Gly Ile
165 170 175
His Leu Pro Phe Pro Ala Thr Ile Gly Ser Gly Val Ala Ala Met Ala
180 185 190
Gly Ser Glu Ile Ile Asn Ala Pro Leu Thr Gln Ser Thr Gln Ser Thr
195 200 205
Leu Tyr Phe Tyr Ala Arg Glu Met Val Ser His Ala Trp Ile Phe Asn
210 215 220
Gly Ala Val His Arg Pro Asn Ser Gly Arg Thr Pro Thr Ala Phe Gly
225 230 235 240
Asn Thr Asn Thr Leu Lys Asp Ala Phe Arg Arg Gly Leu Thr Pro Thr
245 250 255
Thr Phe Ser Asp Leu Val Gln Leu Ser His Thr Asn Pro Leu Ala Arg
260 265 270
Gln Ile Leu Asn Glu Arg Ala His Lys Leu Ala Asp Ala Val Thr Thr
275 280 285
Ala Val Asp Val Val Asp Pro Glu Ala Val Val Phe Ala Gly Glu Ala
290 295 300
Phe Thr Leu Asp Pro Glu Thr Leu Arg Ile Val Val Thr Gln Leu Arg
305 310 315 320
Ala Asn Thr Gly Ser Gln Leu Arg Ile Gln Arg Ala Asp Ala His Ile
325 330 335
Leu Arg Thr Ala Ala Ile Gln Val Ala Leu His Pro Ile Arg Gln Asp
340 345 350
Pro Leu Ala Phe Val
355
<210> 108
<211> 2180
<212> DNA
<213> 人工序列
<220>
<223> 启动子P2
<400> 108
tttcgcggtg aatcaaccca cccgaacggc gatccttcga agtattttgc cgattgatca 60
attagcgtcg gcaacatcac tgaatatgct gctcatgcag accggcgcaa tcgttggccc 120
gctgatcgca ggtgcgttga ttccgctgat cggtttcggg tggctgtatt tccttgatgt 180
tgtctccatc atccccacac tgtgggctgt atggtcactg ccttcaatca agccatccgg 240
caaggtcatg aaggccggtt tcgccagtgt ggtggatggc ctgaagtatt tggctggcca 300
acccgtgttg ttgatggtga tggtgctgga tcttatcgcc atgattttcg gcatgccacg 360
tgcgctttac cccgagatcg cggaagtgaa cttcggtggt ggtgacgccg gtgcaacgat 420
gctggcgttc atgtactcat ccatggctgt tggcgcagtt cttggcggcg tgctgtctgg 480
ttgggtttcc cggattagcc gccagggtgt tgcagtttat tggtgcatca tcgcctgggg 540
cgcagccgtt gctttgggtg gcgtagcaat tgttgtcagc cccggcgctg tgaccgcgtg 600
ggcgtggatg ttcatcatca tgatggtcat tggtggcatg gctgacatgt ttagctcggc 660
tgttcgaaat gctattttgc agcagtctgc agcggaacat gtgcagggcc gaatccaagg 720
tgtgtggatc atcgtcgtgg tgggtggacc tcgtttagct gacgtccttc acggttgggc 780
cgctgagccc ttgggtgcag gttggacggt attatggggc ggagtagcgg tggttgtact 840
cactgcaatt tgtatggtgg cggtgcctaa attctggaaa tacgagaaac caaaaattac 900
cggcatctaa atacttatcc atgcccattt acagacaatg ccttagcttt gacctgcaca 960
aatagttgca aattgtccca catacacata aagtagcttg cgtatttaaa attatgaacc 1020
taaggggttt agcaatgccc aatcaggccc acttctctgc gtcctttgcc cgcccctcta 1080
ccccggctgc aaagtgcatg caccatatcc gcctcggcca gcaactcatt agaaatgagc 1140
tggtcgaggc cacaggtctg tcccaaccga ctgtcacccg cgcagtcacc gctttaatgc 1200
aggcaggttt ggttcgtgaa cgccctgatc tcacactctc atcgggccct ggtcgtccca 1260
atattcctct agaactcgct ccaagtccat ggattcatgc aggcgtggca atcggcacca 1320
agtcttccta cgtcgctttg tttgatacca agggtcgcac ccttcgtgat gccatactgg 1380
aaatctcagc agctgattta gatccagaca ccttcatcga acacctcatc gctggtgtca 1440
accgcctcac cactggtctt gatctaccac tggtaggtat tggtgtggct acctcaggaa 1500
aagtcaccaa cgcgggcgtt gtcaccgcaa gcaacttggg ctgggatggc gttgatatcg 1560
ccggccgtct gaactaccaa ttcagcgttc cagcaaccgt ggcatcagca attcctgcca 1620
tcgcagcttc tgaactgcag gcttccccac ttccccaccc tgagcagcca actcccatca 1680
ccttgacctt ctacgccgat gactctgtgg gcgcggccta cagcaatgat ttgggagtac 1740
atgtcattgg accactggct acaactcgtg gatcaggttt ggatactttg ggcatggctg 1800
ctgaagatgc gctgagcacc caaggtttct taagcagggt ttctgatcag ggtatctttg 1860
ccaacagcct tggtgagcta gtcaccattg ctaaagacaa tgaaaccgca cgggaattcc 1920
tcaacgatcg cgcgaccctg ctggctcaca ctgccgcaga agctgctgaa acagttaagc 1980
catccaccct ggttctctcg ggatcggcgt tttccgaaga tccacaaggt cggttggtgt 2040
tcgcttccca attgaagaag gaatacgacg cagacattga gctccgcttg atccccaccc 2100
accgggaaaa tgtccgcgca gcagctcgcg cagtcgcact tgatcgacta ctcaacgagc 2160
cacttaccct cgtaccctaa 2180
<210> 109
<211> 2247
<212> DNA
<213> 人工序列
<220>
<223> 启动子P4
<400> 109
ccctcatgag ttcaggggtt agaaaagcaa tgggatttgg atgcggttcg gttttggccg 60
tcatcatggt tatctcattt gttggatggg cgcttagctt catggatgga acggcaccta 120
ttcgccaact ccagcaaatc cctgaagatg ttccgccggc gcgtggtgta gaagttccgc 180
aaattgatac aggggcagat ggacgcacgt cagatcattt gcgtttttgg gcggaaccaa 240
ttgctcaaga tgctggtgtg tccgctcaag cgattgcggc ttatggaaac gcagagctca 300
ttgcgagtac tgcgtggcct ggctgcaatc tggggtggaa taccttggca ggtatcggcc 360
aggtggaaac ccgtcacggt acctacaacg gcaaaatgtt cgggggcagt tccctggatg 420
aaaatggagt tgcaacccct ccaatcatcg gcgttccact tgatggttca ccggggtttg 480
cggaaattcc cgacactgat ggtggggaat tagatggcga tactgaatat gatcgcgcgg 540
taggtcccat gcagttcatt ccggaaacgt ggcgacttat gggattggat gcaaacggtg 600
atggggtagc ggaccccaac caaattgatg acgcagcatt gagtgccgca aacctgttgt 660
gttccaacga tcgtgacttg tccactcctg aaggatggac cgcagctgtt cattcttaca 720
acatgtctaa tcagtatttg atggacgttc gagatgctgc cgcgtcctac gctttacgac 780
agccggcgat ctaaaactta acaagcgcaa cccccgaaaa tgtgagatta tgtccggtcg 840
gacacgtgcg ggctggggat atgggtagtt taataaattt ataccacaca gtctattgca 900
atagaccaag ctgttcagta gggtgcatgg gagaagaatt tcctaataaa aactcttaag 960
gacctccaag tggctgaaat catgcacgta ttcgctcgcg aaattctcga ctcccgcggt 1020
aacccaaccg tcgaggcaga ggttttcctt gatgacggtt cccacggtgt cgcaggtgtt 1080
ccatccggcg catccaccgg cgtccacgag gctcatgagc tgcgtgacgg tggcgatcgc 1140
tacctgggca agggcgtttt gaaggcagtt gaaaacgtca acgaagaaat cggcgacgag 1200
ctcgctggcc tagaggctga cgatcagcgc ctcatcgacg aagcaatgat caagcttgat 1260
ggcaccgcca acaagtcccg cctgggtgca aacgcaatcc ttggtgtttc catggctgtt 1320
gcaaaggctg ctgctgattc cgcaggcctc ccactgttcc gctacatcgg tggaccaaac 1380
gcacacgttc ttccagttcc aatgatgaac atcatcaacg gtggcgctca cgctgactcc 1440
ggtgttgacg ttcaggaatt catgatcgct ccaatcggtg cagagacctt ctctgaggct 1500
ctccgcaacg gcgcagaggt ctaccacgca ctgaagtccg tcatcaagga aaagggcctg 1560
tccaccggac ttggcgatga gggcggcttc gctccttccg tcggctccac ccgtgaggct 1620
cttgacctta tcgttgaggc aatcgagaag gctggcttca ccccaggcaa ggacatcgct 1680
cttgctctgg acgttgcttc ctctgagttc ttcaaggacg gcacctacca cttcgaaggt 1740
ggccagcact ccgcagctga gatggcaaac gtttacgctg agctcgttga cgcgtaccca 1800
atcgtctcca tcgaggaccc actgcaggaa gatgactggg agggttacac caacctcacc 1860
gcaaccatcg gcgacaaggt tcagatcgtt ggcgacgact tcttcgtcac caaccctgag 1920
cgcctgaagg agggcatcgc taagaaggct gccaactcca tcctggttaa ggtgaaccag 1980
atcggtaccc tcaccgagac cttcgacgct gtcgacatgg ctcaccgcgc aggctacacc 2040
tccatgatgt cccaccgttc cggtgagacc gaggacacca ccattgctga cctcgcagtt 2100
gcactcaact gtggccagat caagactggt gctccagcac gttccgaccg tgtcgcaaag 2160
tacaaccagc ttctccgcat cgagcagttg cttggcgacg ccggcgtcta cgcaggtcgc 2220
agcgcattcc cacgctttca gggctaa 2247
<210> 110
<211> 2192
<212> DNA
<213> 人工序列
<220>
<223> 启动子P8
<400> 110
tcaccgagtc tttgatcaag ggtggcgctt ttgactccct tggacacgca cgaaaaggcc 60
tcatgctggt cttcgaagat gccgttgatt ccgtcatcgc taccaaaaaa gctgctgaca 120
agggacaatt tgatctcttt gcagctttcg actcggataa caacgacgat gtggcaagtt 180
tcttccagat caccgttcct gatgacgaat gggaccgtaa gcatgagctc gcactcgagc 240
gagaaatgct gggtctgtat gtttctggac acccactcga tggctatgaa gatgccattg 300
ctgcccaggt tgatacagca ctgaccacca ttgttgccgg tgaactcaag cacggcgcag 360
aagtgaccgt gggtggcatt atctctggtg tggatcgacg gttctccaag aaggacggtt 420
ccccttgggc gattgtcacc attgaagatc acaacggcgc gtccgttgaa ttgttggtct 480
tcaacaaggt gtattccatc gttggatcca tgattgtgga agacaacatc attttggcca 540
aggcacacat ctccattcga gatgatcgta tgagcctttt ctgtgatgat ctccgcgttc 600
cagagcttgg gccaggaaac gggcaaggac ttccgcttcg tttgtccatg cgtactgatc 660
agtgcaccat gtccaacatt gccaagctca agcaggtgct ggtggacaac aagggtgaat 720
ctgatgtgta cctcaatttg atcgatgggg ataactccac ggtcatgatt ttgggtgatc 780
acttaagagt caaccgatcc gcaagtttga tgggcgacct caaggcaacg atggggccag 840
gcatcctcgg ttaatcacat cacactggga ttaccccgtg taggggtgaa aacccgaatg 900
tggctaaaac ttttggaaac ttaagttacc tttaatcgga aacttattga attcgggtga 960
ggcaactgca actctggact taaagcatga gccagaaccg catcaggacc actcacgttg 1020
gttccttgcc ccgtacccca gagctacttg atgcaaacat caagcgctct aacggtgaga 1080
ttggggagga ggaattcttc cagatcctgc agtcttctgt agatgacgtg atcaagcgcc 1140
aggttgacct gggtatcgac atcctcaacg agggcgaata cggccacgtc acctccggtg 1200
cagttgactt cggtgcatgg tggaactact ccttcacccg cctgggcgga ctgaccatga 1260
ccgataccga ccgttgggca agccaggaag cagtgcgttc cacccctggc aacatcaagc 1320
tgaccagctt ctctgatcgt cgcgaccgcg cattgttcag cgaagcatac gaggatccag 1380
tatctggcat cttcaccggc cgcgcttctg tgggcaaccc agagttcacc ggacctatta 1440
cctacattgg ccaggaagaa actcagacgg atgttgatct gctgaagaag ggcatgaacg 1500
cagcgggagc taccgacggc ttcgttgcag cactatcccc aggatctgca gctcgattga 1560
ccaacaagtt ctacgacact gatgaagaag tcgtcgcagc atgtgccgat gcgctttccc 1620
aggaatacaa gatcatcacc gatgcaggtc tgaccgttca gctcgacgca ccggacttgg 1680
cagaagcatg ggatcagatc aacccagagc caagcgtgaa ggattactta gactggatcg 1740
gtacacgcat cgatgccatc aacagtgcag tgaagggcct tccaaaggaa cagacccgcc 1800
tgcacatctg ctggggctct tggcacggac cacacgtcac tgacatccca ttcggtgaca 1860
tcattggtga gatcctgcgc gcagaggtcg gtggcttctc cttcgaaggc gcatctcctc 1920
gtcacgcaca cgagtggcgt gtatgggaag aaaacaagct tcctgaaggc tctgttatct 1980
accctggtgt tgtgtctcac tccatcaacg ctgtggagca cccacgcctg gttgctgatc 2040
gtatcgttca gttcgccaag cttgttggcc ctgagaacgt cattgcgtcc actgactgtg 2100
gtctgggcgg acgtctgcat tcccagatcg catgggcaaa gctggagtcc ctagtagagg 2160
gcgctcgcat tgcatcaaag gaactgttct aa 2192
<210> 111
<211> 97
<212> DNA
<213> 人工序列
<220>
<223> 启动子P3
<400> 111
tgccgtttct cgcgttgtgt gtggtactac gtggggacct aagcgtgtaa gatggaaacg 60
tctgtatcgg ataagtagcg aggagtgttc gttaaaa 97
<210> 112
<211> 666
<212> DNA
<213> 智人
<400> 112
atgggtgaca ccaaggagca gcgcatcctg aaccacgtgc tgcagcatgc ggagcccggg 60
aacgcacaga gcgtgctgga ggccattgac acctactgcg agcagaagga gtgggccatg 120
aacgtgggcg acaagaaagg caagatcgtg gacgccgtga ttcaggagca ccagccctcc 180
gtgctgctgg agctgggggc ctactgtggc tactcagctg tgcgcatggc ccgcctgctg 240
tcaccagggg cgaggctcat caccatcgag atcaaccccg actgtgccgc catcacccag 300
cggatggtgg atttcgctgg cgtgaaggac aaggtcaccc ttgtggttgg agcgtcccag 360
gacatcatcc cccagctgaa gaagaagtat gatgtggaca cactggacat ggtcttcctc 420
gaccactgga aggaccggta cctgccggac acgcttctct tggaggaatg tggcctgctg 480
cggaagggga cagtgctact ggctgacaac gtgatctgcc caggtgcgcc agacttccta 540
gcacacgtgc gcgggagcag ctgctttgag tgcacacact accaatcgtt cctggaatac 600
agggaggtgg tggacggcct ggagaaggcc atctacaagg gcccaggcag cgaagcaggg 660
ccttaa 666
<210> 113
<211> 675
<212> DNA
<213> 智人
<400> 113
catatggggg ataccaaaga acagcggatt ctgaatcatg ttttacagca cgctgaaccg 60
ggcaatgctc agagcgtttt agaagcaata gatacctatt gtgaacagaa ggaatgggca 120
atgaatgttg gcgataaaaa gggcaaaatt gttgatgcag ttatccagga acatcagccg 180
agcgttttac ttgaactggg cgcatattgc ggttattccg cagttcggat ggcacggctg 240
ctgtcccctg gcgctcgctt aattaccatt gaaattaatc cggattgcgc agcaattacc 300
cagcggatgg ttgactttgc aggtgttaaa gataaagtca ccttggttgt cggcgctagc 360
caggatatta ttccgcagct gaaaaaaaaa tacgatgttg ataccctgga tatggtcttt 420
ttagatcatt ggaaagatcg gtatctgccc gatactctgt tattggaaga gtgcggtctg 480
ctgcggaaag gcaccgttct actggcagat aatgttattt gtcctggggc tcctgatttt 540
ctagctcatg ttcggggcag cagctgtttc gaatgtaccc attaccaatc gtttctggaa 600
tatcgcgaag ttgttgatgg tctggaaaag gcaatttata aaggtcctgg tagcgaggct 660
ggcccgtaag agctc 675
<210> 114
<211> 6557
<212> DNA
<213> 人工序列
<220>
<223> pELAC载体
<400> 114
tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60
cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120
ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180
gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240
acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300
ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360
ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420
acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480
tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540
tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat 600
gagtattcaa catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt 660
ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg 720
agtgggttac atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga 780
agaacgtttt ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg 840
tattgacgcc gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt 900
tgagtactca ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg 960
cagtgctgcc ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg 1020
aggaccgaag gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga 1080
tcgttgggaa ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc 1140
tgcagcaatg gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc 1200
ccggcaacaa ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc 1260
ggcccttccg gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg 1320
cggtatcatt gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac 1380
gacggggagt caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc 1440
actgattaag cattggtaac tgtcagacca agtttactca tatatacttt agattgattt 1500
aaaacttcat ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac 1560
caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa 1620
aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc 1680
accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt 1740
aactggcttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg 1800
ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc 1860
agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt 1920
accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga 1980
gcgaacgacc tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct 2040
tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg 2100
cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca 2160
cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa 2220
cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt 2280
ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga 2340
taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga 2400
gcgcctgatg cggtattttc tccttacgca tctgtgcggt atttcacacc gcatatatgg 2460
tgcactctca gtacaatctg ctctgatgcc gcatagttaa gccagtatac actccgctat 2520
cgctacgtga ctgggtcatg gctgcgcccc gacacccgcc aacacccgct gacgcgccct 2580
gacgggcttg tctgctcccg gcatccgctt acagacaagc tgtgaccgtc tccgggagct 2640
gcatgtgtca gaggttttca ccgtcatcac cgaaacgcgc gaggcagctg cggtaaagct 2700
catcagcgtg gtcgtgaagc gattcacaga tgtctgcctg ttcatccgcg tccagctcgt 2760
tgagtttctc cagaagcgtt aatgtctggc ttctgataaa gcgggccatg ttaagggcgg 2820
ttttttcctg tttggtcact gatgcctccg tgtaaggggg atttctgttc atgggggtaa 2880
tgataccgat gaaacgagag aggatgctca cgatacgggt tactgatgat gaacatgccc 2940
ggttactgga acgttgtgag ggtaaacaac tggcggtatg gatgcggcgg gaccagagaa 3000
aaatcactca gggtcaatgc cagcgcttcg ttaatacaga tgtaggtgtt ccacagggta 3060
gccagcagca tcctgcgatg cagatccgga acataatggt gcagggcgct gacttccgcg 3120
tttccagact ttacgaaaca cggaaaccga agaccattca tgttgttgct caggtcgcag 3180
acgttttgca gcagcagtcg cttcacgttc gctcgcgtat cggtgattca ttctgctaac 3240
cagtaaggca accccgccag cctagccggg tcctcaacga caggagcacg atcatgcgca 3300
cccgtggggc cgccatgccg gcgataatgg cctgcttctc gccgaaacgt ttggtggcgg 3360
gaccagtgac gaaggcttga gcgagggcgt gcaagattcc gaataccgca agcgacaggc 3420
cgatcatcgt cgcgctccag cgaaagcggt cctcgccgaa aatgacccag agcgctgccg 3480
gcacctgtcc tacgagttgc atgataaaga agacagtcat aagtgcggcg acgatagtca 3540
tgccccgcgc ccaccggaag gagctgactg ggttgaaggc tctcaagggc atcggtcgag 3600
atcccggtgc ctaatgagtg agctaactta cattaattgc gttgcgctca ctgcccgctt 3660
tccagtcggg aaacctgtcg tgccagctgc attaatgaat cggccaacgc gcggggagag 3720
gcggtttgcg tattgggcgc cagggtggtt tttcttttca ccagtgagac gggcaacagc 3780
tgattgccct tcaccgcctg gccctgagag agttgcagca agcggtccac gctggtttgc 3840
cccagcaggc gaaaatcctg tttgatggtg gttaacggcg ggatataaca tgagctgtct 3900
tcggtatcgt cgtatcccac taccgagata tccgcaccaa cgcgcagccc ggactcggta 3960
atggcgcgca ttgcgcccag cgccatctga tcgttggcaa ccagcatcgc agtgggaacg 4020
atgccctcat tcagcatttg catggtttgt tgaaaaccgg acatggcact ccagtcgcct 4080
tcccgttccg ctatcggctg aatttgattg cgagtgagat atttatgcca gccagccaga 4140
cgcagacgcg ccgagacaga acttaatggg cccgctaaca gcgcgatttg ctggtgaccc 4200
aatgcgacca gatgctccac gcccagtcgc gtaccgtctt catgggagaa aataatactg 4260
ttgatgggtg tctggtcaga gacatcaaga aataacgccg gaacattagt gcaggcagct 4320
tccacagcaa tggcatcctg gtcatccagc ggatagttaa tgatcagccc actgacgcgt 4380
tgcgcgagaa gattgtgcac cgccgcttta caggcttcga cgccgcttcg ttctaccatc 4440
gacaccacca cgctggcacc cagttgatcg gcgcgagatt taatcgccgc gacaatttgc 4500
gacggcgcgt gcagggccag actggaggtg gcaacgccaa tcagcaacga ctgtttgccc 4560
gccagttgtt gtgccacgcg gttgggaatg taattcagct ccgccatcgc cgcttccact 4620
ttttcccgcg ttttcgcaga aacgtggctg gcctggttca ccacgcggga aacggtctga 4680
taagagacac cggcatactc tgcgacatcg tataacgtta ctggtttcac attcaccacc 4740
ctgaattgac tctcttccgg gcgctatcat gccataccgc gaaaggtttt gcgccattcg 4800
atggtgtccg ggatctcgac gctctccctt atgcgactcc tgcattagga agcagcccag 4860
tagtaggttg aggccgttga gcaccgccgc cgcaaggaat ggtgcatgca aggagatggc 4920
gcccaacagt cccccggcca cggggcctgc caccataccc acgccgaaac aagcgctcat 4980
gagcccgaag tggcgagccc gatcttcccc atcggtgatg tcggcgatat aggcgccagc 5040
aaccgcacct gtggcgccgg tgatgccggc cacgatgcgt ccggcgtaga ggatcgagat 5100
ctgcgggcag tgagcgcaac gcaattaatg tgagttagct cactcattag gcaccccagg 5160
ctttacactt tatgcttccg gctcgtataa tgtgtggaat tgtgagcgga taacaatttc 5220
acacaggatc tagatttaag aaggagatat acatatggcc gaagaaggta aactggtaat 5280
ctggattaac ggcgataaag gctataacgg tctcgctgaa gtcggtaaga aattcgagaa 5340
agataccgga attaaagtca ccgttgagca tccggataaa ctggaagaga aattcccaca 5400
ggttgcggca acaggcgatg gccctgacat tatcttctgg gcacacgacc gctttggtgg 5460
ctacgctcaa tctggcctgt tggctgaaat caccccggac aaagcgttcc aggacaagct 5520
gtatccgttt acctgggatg ccgtacgtta caacggcaag ctgattgctt acccgatcgc 5580
tgttgaagcg ttatcgctga tttataacaa agatctgctg ccgaacccgc caaaaacctg 5640
ggaagagatc ccggcgctgg ataaagaact gaaagcgaaa ggtaagagcg cgctgatgtt 5700
caacctgcaa gaaccgtact tcacctggcc gctgattgct gctgacgggg gttatgcgtt 5760
caagtatgaa aacggcaagt acgacattaa agacgtgggc gtggataacg ctggcgcgaa 5820
agcgggtctg accttcctgg ttgacctgat taaaaacaaa cacatgaatg cagacaccga 5880
ttactccatc gcagaagctg cctttaataa aggcgaaaca gcgatgacca tcaacggccc 5940
gtgggcatgg tccaacatcg acaccagcaa agtgaattat ggtgtaacgg tactgccgac 6000
cttcaagggt caaccatcca aaccgttcgt tggcgtgctg agcgcaggta ttaacgccgc 6060
cagtccgaac aaagagctgg caaaagagtt cctcgaaaac tatctgctga ctgatgaagg 6120
tctggaagcg gttaataaag acaaaccgct gggtgccgta gcgctgaagt cttacgagga 6180
agagttggcg aaagatccac gtattgccgc cactatggaa aacgcccaga aaggtgaaat 6240
catgccgaac atcccgcaga tgtccgcttt ctggtatgcc gtgcgtactg cggtgatcaa 6300
cgccgccagc ggtcgtcaga ctgtcgatga agccctgaaa gacgcgcaga ctaaggatcc 6360
gaattcgagc tccgtcgaca agcttgcggc cgcactcgag caccaccacc accaccactg 6420
agatccggct gctaacaaag cccgaaagga agctgagttg gctgctgcca ccgctgagca 6480
ataactagca taaccccttg gggcctctaa acgggtcttg aggggttttt tgctgaaagg 6540
aggaactata tccggat 6557
<210> 115
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 115
gtgagttagc tcactcatta gg 22
<210> 116
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 116
cgattggtaa tgggtacatt cg 22
<210> 117
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 117
ggatctcagt ggtggtggtg 20
<210> 118
<211> 44
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 118
ccaagcttgc atgccaaatt cctgtgaatt agctgattta gtac 44
<210> 119
<211> 38
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 119
tttggtatcc cccatagagg cgaaggctcc ttgaatag 38
<210> 120
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 120
atgggggata ccaaagaaca gc 22
<210> 121
<211> 38
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 121
cggtacccgg ggatcatgct agttattgct cagcggtg 38
<210> 122
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 122
ccttctacgc cgatgactct 20
<210> 123
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 123
cagccatgcc caaagtatcc 20
<210> 124
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 124
aggtggggat gacgtcaaat 20
<210> 125
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 125
gaactgaggc cggctttaag 20
<210> 126
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 126
ccaagcttgc atgcctcacc gagtctttga tcaag 35
<210> 127
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 127
caaaagtttt agccacattc gggttttcac cccta 35
<210> 128
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 128
ctctggactt aaagcatgag ccagaaccgc atcag 35
<210> 129
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 129
cggtacccgg ggatcttaga acagttcctt tgatg 35
<210> 130
<211> 87
<212> DNA
<213> 人工序列
<220>
<223> P8启动子的DNA片段
<400> 130
gtggctaaaa cttttggaaa cttaagttac ctttaatcgg aaacttattg aattcgggtg 60
aggcaactgc aactctggac ttaaagc 87
<210> 131
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 131
gtgaaaaccc gaatgtggct aaaacttttg gaaac 35
<210> 132
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 132
gcggttctgg ctcatgcttt aagtccagag ttgca 35
<210> 133
<211> 1206
<212> DNA
<213> 谷氨酸棒杆菌
<400> 133
atgagccaga accgcatcag gaccactcac gttggttcct tgccccgtac cccagagcta 60
cttgatgcaa acatcaagcg ttctaacggt gagattgggg aggaggaatt cttccagatt 120
ctgcagtctt ctgtagatga cgtgatcaag cgccaggttg acctgggtat cgacatcctt 180
aacgagggcg aatacggcca cgtcacctcc ggtgcagttg acttcggtgc atggtggaac 240
tactccttca cccgcctggg cggactgacc atgaccgata ccgaccgttg ggcaagccag 300
gaagcagtgc gttccacccc tggcaacatc aagctgacca gcttctctga tcgtcgcgac 360
cgcgcattgt tcagcgaagc atacgaggat ccagtatctg gcatcttcac cggtcgcgct 420
tctgtgggca acccagagtt caccggacct attacctaca ttggccagga agaaactcag 480
acggatgttg atctgctgaa gaagggcatg aacgcagcgg gagctaccga cggcttcgtt 540
gcagcactat ccccaggatc tgcagctcga ttgaccaaca agttctacga cactgatgaa 600
gaagtcgtcg cagcatgtgc tgatgcgctt tcccaggaat acaagatcat caccgatgca 660
ggtctgaccg ttcagctcga cgcaccggac ttggcagaag catgggatca gatcaaccca 720
gagccaagcg tgaaggatta cttggactgg atcggtacac gcatcgatgc catcaacagt 780
gcagtgaagg gccttccaaa ggaacagacc cgcctgcaca tctgctgggg ctcttggcac 840
ggaccacacg tcactgacat cccattcggt gacatcattg gtgagatcct gcgcgcagag 900
gtcggtggct tctccttcga aggcgcatct cctcgtcacg cacacgagtg gcgtgtatgg 960
gaagaaaaca agcttcctga aggctctgtt atctaccctg gtgttgtgtc tcactccatc 1020
aacgctgtgg agcacccacg cctggttgct gatcgtatcg ttcagttcgc caagcttgtt 1080
ggccctgaga acgtcattgc gtccactgac tgtggtctgg gcggacgtct gcattcccag 1140
atcgcatggg caaagctgga gtccctagta gagggcgctc gcattgcatc aaaggaactg 1200
ttctaa 1206
<210> 134
<211> 401
<212> PRT
<213> 谷氨酸棒杆菌
<400> 134
Met Ser Gln Asn Arg Ile Arg Thr Thr His Val Gly Ser Leu Pro Arg
1 5 10 15
Thr Pro Glu Leu Leu Asp Ala Asn Ile Lys Arg Ser Asn Gly Glu Ile
20 25 30
Gly Glu Glu Glu Phe Phe Gln Ile Leu Gln Ser Ser Val Asp Asp Val
35 40 45
Ile Lys Arg Gln Val Asp Leu Gly Ile Asp Ile Leu Asn Glu Gly Glu
50 55 60
Tyr Gly His Val Thr Ser Gly Ala Val Asp Phe Gly Ala Trp Trp Asn
65 70 75 80
Tyr Ser Phe Thr Arg Leu Gly Gly Leu Thr Met Thr Asp Thr Asp Arg
85 90 95
Trp Ala Ser Gln Glu Ala Val Arg Ser Thr Pro Gly Asn Ile Lys Leu
100 105 110
Thr Ser Phe Ser Asp Arg Arg Asp Arg Ala Leu Phe Ser Glu Ala Tyr
115 120 125
Glu Asp Pro Val Ser Gly Ile Phe Thr Gly Arg Ala Ser Val Gly Asn
130 135 140
Pro Glu Phe Thr Gly Pro Ile Thr Tyr Ile Gly Gln Glu Glu Thr Gln
145 150 155 160
Thr Asp Val Asp Leu Leu Lys Lys Gly Met Asn Ala Ala Gly Ala Thr
165 170 175
Asp Gly Phe Val Ala Ala Leu Ser Pro Gly Ser Ala Ala Arg Leu Thr
180 185 190
Asn Lys Phe Tyr Asp Thr Asp Glu Glu Val Val Ala Ala Cys Ala Asp
195 200 205
Ala Leu Ser Gln Glu Tyr Lys Ile Ile Thr Asp Ala Gly Leu Thr Val
210 215 220
Gln Leu Asp Ala Pro Asp Leu Ala Glu Ala Trp Asp Gln Ile Asn Pro
225 230 235 240
Glu Pro Ser Val Lys Asp Tyr Leu Asp Trp Ile Gly Thr Arg Ile Asp
245 250 255
Ala Ile Asn Ser Ala Val Lys Gly Leu Pro Lys Glu Gln Thr Arg Leu
260 265 270
His Ile Cys Trp Gly Ser Trp His Gly Pro His Val Thr Asp Ile Pro
275 280 285
Phe Gly Asp Ile Ile Gly Glu Ile Leu Arg Ala Glu Val Gly Gly Phe
290 295 300
Ser Phe Glu Gly Ala Ser Pro Arg His Ala His Glu Trp Arg Val Trp
305 310 315 320
Glu Glu Asn Lys Leu Pro Glu Gly Ser Val Ile Tyr Pro Gly Val Val
325 330 335
Ser His Ser Ile Asn Ala Val Glu His Pro Arg Leu Val Ala Asp Arg
340 345 350
Ile Val Gln Phe Ala Lys Leu Val Gly Pro Glu Asn Val Ile Ala Ser
355 360 365
Thr Asp Cys Gly Leu Gly Gly Arg Leu His Ser Gln Ile Ala Trp Ala
370 375 380
Lys Leu Glu Ser Leu Val Glu Gly Ala Arg Ile Ala Ser Lys Glu Leu
385 390 395 400
Phe
<210> 135
<211> 86
<212> DNA
<213> 人工序列
<220>
<223> 启动子P6
<400> 135
cgccggataa atgaattgat tattttaggc tcccagggat taagtctagg gtggaatgca 60
gaaatatttc ctacggaagg tccgtt 86
<210> 136
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 136
ccaagcttgc atgccgacgt tggtgtgacc gagcgcgaca 40
<210> 137
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 137
aaataatcaa ttcatttatc cggcgccgga cagggatttg agtttttctc 50
<210> 138
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 138
aaatatttcc tacggaaggt ccgttatggg caatgtgtac aacaacatca 50
<210> 139
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 139
cggtacccgg ggatcccgac cttgagacat gaaaaaacca 40
<210> 140
<211> 936
<212> DNA
<213> 谷氨酸棒杆菌
<400> 140
atgggcaatg tgtacaacaa catcaccgaa accatcggcc acaccccact ggtaaagctg 60
aacaagctca ccgaaggcct cgacgcaact gtcctggtca agcttgagtc attcaaccca 120
gcaaactccg tcaaggaccg tatcggtctg gccatcgttg aagatgcaga gaagtccggt 180
gcactgaagc caggcggcac catcgttgaa gcaacctccg gcaacaccgg tatcgcactg 240
gcaatggtcg gcgctgcacg cggatacaac gttgttctca ccatgccgga gaccatgtcc 300
aacgagcgtc gcgttctcct ccgcgcttac ggtgcagaga tcgttcttac cccaggtgca 360
gcaggcatgc agggtgcaaa ggacaaggca gacgaaatcg tcgctgaacg cgaaaacgca 420
gtccttgctc gccagttcga gaacgaggca aacccacgcg tccaccgcga caccaccgcg 480
aaggaaatcc tcgaagacac cgacggcaac gttgatatct tcgttgcaag cttcggcacc 540
ggcggaaccg tcaccggcgt tggccaggtc ctgaaggaaa acaacgcaga cgtacaggtc 600
tacaccgtcg agccagaagc atccccactt ctgaccgctg gtaaggctgg cccacacaag 660
atccagggca tcggcgcaaa cttcatcccc gaggtcctgg accgcaaggt tctcgacgac 720
gtgctgaccg tctccaacga agacgcaatc gcattctccc gcaagctcgc taccgaagag 780
ggcatcctcg gcggtatctc caccggcgca aacatcaagg cagctcttga ccttgcagca 840
aagccagaga acgctggcaa gaccatcgtc accgttgtca ccgacttcgg cgagcgctac 900
gtctccaccg ttctttacga agacatccgc gactaa 936
<210> 141
<211> 311
<212> PRT
<213> 谷氨酸棒杆菌
<400> 141
Met Gly Asn Val Tyr Asn Asn Ile Thr Glu Thr Ile Gly His Thr Pro
1 5 10 15
Leu Val Lys Leu Asn Lys Leu Thr Glu Gly Leu Asp Ala Thr Val Leu
20 25 30
Val Lys Leu Glu Ser Phe Asn Pro Ala Asn Ser Val Lys Asp Arg Ile
35 40 45
Gly Leu Ala Ile Val Glu Asp Ala Glu Lys Ser Gly Ala Leu Lys Pro
50 55 60
Gly Gly Thr Ile Val Glu Ala Thr Ser Gly Asn Thr Gly Ile Ala Leu
65 70 75 80
Ala Met Val Gly Ala Ala Arg Gly Tyr Asn Val Val Leu Thr Met Pro
85 90 95
Glu Thr Met Ser Asn Glu Arg Arg Val Leu Leu Arg Ala Tyr Gly Ala
100 105 110
Glu Ile Val Leu Thr Pro Gly Ala Ala Gly Met Gln Gly Ala Lys Asp
115 120 125
Lys Ala Asp Glu Ile Val Ala Glu Arg Glu Asn Ala Val Leu Ala Arg
130 135 140
Gln Phe Glu Asn Glu Ala Asn Pro Arg Val His Arg Asp Thr Thr Ala
145 150 155 160
Lys Glu Ile Leu Glu Asp Thr Asp Gly Asn Val Asp Ile Phe Val Ala
165 170 175
Ser Phe Gly Thr Gly Gly Thr Val Thr Gly Val Gly Gln Val Leu Lys
180 185 190
Glu Asn Asn Ala Asp Val Gln Val Tyr Thr Val Glu Pro Glu Ala Ser
195 200 205
Pro Leu Leu Thr Ala Gly Lys Ala Gly Pro His Lys Ile Gln Gly Ile
210 215 220
Gly Ala Asn Phe Ile Pro Glu Val Leu Asp Arg Lys Val Leu Asp Asp
225 230 235 240
Val Leu Thr Val Ser Asn Glu Asp Ala Ile Ala Phe Ser Arg Lys Leu
245 250 255
Ala Thr Glu Glu Gly Ile Leu Gly Gly Ile Ser Thr Gly Ala Asn Ile
260 265 270
Lys Ala Ala Leu Asp Leu Ala Ala Lys Pro Glu Asn Ala Gly Lys Thr
275 280 285
Ile Val Thr Val Val Thr Asp Phe Gly Glu Arg Tyr Val Ser Thr Val
290 295 300
Leu Tyr Glu Asp Ile Arg Asp
305 310
<210> 142
<211> 666
<212> DNA
<213> Niastella koreensis
<400> 142
atgaataatc aaatttttga atccgttgac cattatatca gcgatttact gggttacgaa 60
gacgatgcat tgcttgccgc caccaattca ttagccgaag caggcatgcc tgccatcagc 120
gtatcaccca accagggcaa gtttctgcaa ttactggccc aattgtgcca ggcaaaaaat 180
atcctggagc tgggcacact ggcaggctac agcaccattt ggatggcccg ggccttaccc 240
aaaaacggcc ggctcatcac ccttgaatat gaccccaaac atgcggccgt tgcacaaaaa 300
aatatcgacc gggccggcct tacttcacaa gtacagatca gaaccggtaa agcaattgac 360
atattaccgc aattagtgga agaaggcgcc ggaccttttg atatgatctt tatcgatgcc 420
gataaaccac cttacaccga atattttcaa tgggcgcttc ggttatcacg tcccggtaca 480
ctcatcgtgg ccgataatgt gatccgtgat ggcaaagtgc tggatgaaaa cagtacggag 540
cctgctgtac agggcgcaag acgtttcaat gccatgctgg gcgccaatac cgccgttgac 600
gccaccattc ttcaaatggt aggtgtaaaa gaatacgatg gaatggcttt ggccatagta 660
aaataa 666
<210> 143
<211> 221
<212> PRT
<213> Niastella koreensis
<400> 143
Met Asn Asn Gln Ile Phe Glu Ser Val Asp His Tyr Ile Ser Asp Leu
1 5 10 15
Leu Gly Tyr Glu Asp Asp Ala Leu Leu Ala Ala Thr Asn Ser Leu Ala
20 25 30
Glu Ala Gly Met Pro Ala Ile Ser Val Ser Pro Asn Gln Gly Lys Phe
35 40 45
Leu Gln Leu Leu Ala Gln Leu Cys Gln Ala Lys Asn Ile Leu Glu Leu
50 55 60
Gly Thr Leu Ala Gly Tyr Ser Thr Ile Trp Met Ala Arg Ala Leu Pro
65 70 75 80
Lys Asn Gly Arg Leu Ile Thr Leu Glu Tyr Asp Pro Lys His Ala Ala
85 90 95
Val Ala Gln Lys Asn Ile Asp Arg Ala Gly Leu Thr Ser Gln Val Gln
100 105 110
Ile Arg Thr Gly Lys Ala Ile Asp Ile Leu Pro Gln Leu Val Glu Glu
115 120 125
Gly Ala Gly Pro Phe Asp Met Ile Phe Ile Asp Ala Asp Lys Pro Pro
130 135 140
Tyr Thr Glu Tyr Phe Gln Trp Ala Leu Arg Leu Ser Arg Pro Gly Thr
145 150 155 160
Leu Ile Val Ala Asp Asn Val Ile Arg Asp Gly Lys Val Leu Asp Glu
165 170 175
Asn Ser Thr Glu Pro Ala Val Gln Gly Ala Arg Arg Phe Asn Ala Met
180 185 190
Leu Gly Ala Asn Thr Ala Val Asp Ala Thr Ile Leu Gln Met Val Gly
195 200 205
Val Lys Glu Tyr Asp Gly Met Ala Leu Ala Ile Val Lys
210 215 220
<210> 144
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 144
catgattacg ccaagcttgc atgccaaatt cctgtgatta gctgatttag 50
<210> 145
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 145
cggattcgaa gatctggttg ttcatagagg cgaaggctcc ttgaataggt 50
<210> 146
<211> 778
<212> DNA
<213> Niastella koreensis
<400> 146
atgaacaacc agatcttcga atccgtcgat cactatattt ctgatcttct gggctacgag 60
gatgatgcgc ttttggccgc cactaattcc ctggccgagg caggtatgcc ggctattagc 120
gtttccccga accagggcaa atttttgcaa ctgctggccc aactttgcca agccaaaaac 180
attttggagc ttggtacgtt ggccggctat tcgaccatct ggatggctcg cgctctcccc 240
aagaacggcc gccttatcac cctggaatac gatccgaagc atgccgcggt agctcagaag 300
aacattgatc gcgctggctt gaccagccaa gtgcaaatcc gcacgggtaa agcaatcgac 360
atcctgccgc agctggtgga ggagggtgcc ggtccatttg atatgatctt cattgatgcc 420
gataagcccc catacaccga atactttcaa tgggctctgc gactgtcccg ccccggcact 480
ctcatcgtcg cggataatgt catccgcgat ggaaaggtgc tggacgaaaa ctccaccgag 540
cctgccgtcc aaggtgcccg ccgttttaat gccatgctcg gtgctaatac ggcagttgac 600
gcaaccatcc tccaaatggt gggcgtgaaa gagtacgacg gcatggcgct ggccatcgtt 660
aagtaaaagc ttgcggccgc actcgagcac caccaccacc accactgaga tccggctgct 720
aacaaagccc gaaaggaagc tgagttggct gctgccaccg ctgagcaata actagcat 778
<210> 147
<211> 666
<212> DNA
<213> Niastella koreensis
<400> 147
atgaacaacc agatcttcga atccgtcgat cactatattt ctgatcttct gggctacgag 60
gatgatgcgc ttttggccgc cactaattcc ctggccgagg caggtatgcc ggctattagc 120
gtttccccga accagggcaa atttttgcaa ctgctggccc aactttgcca agccaaaaac 180
attttggagc ttggtacgtt ggccggctat tcgaccatct ggatggctcg cgctctcccc 240
aagaacggcc gccttatcac cctggaatac gatccgaagc atgccgcggt agctcagaag 300
aacattgatc gcgctggctt gaccagccaa gtgcaaatcc gcacgggtaa agcaatcgac 360
atcctgccgc agctggtgga ggagggtgcc ggtccatttg atatgatctt cattgatgcc 420
gataagcccc catacaccga atactttcaa tgggctctgc gactgtcccg ccccggcact 480
ctcatcgtcg cggataatgt catccgcgat ggaaaggtgc tggacgaaaa ctccaccgag 540
cctgccgtcc aaggtgcccg ccgttttaat gccatgctcg gtgctaatac ggcagttgac 600
gcaaccatcc tccaaatggt gggcgtgaaa gagtacgacg gcatggcgct ggccatcgtt 660
aagtaa 666

Claims (16)

1.一种生产目标物质的方法,所述方法包括以下步骤:
通过使用具有生产所述目标物质的能力的微生物来生产所述目标物质,
其中所述微生物是谷氨酸棒杆菌,
其中所述微生物已经以与未修饰的菌株相比通过增加cysR基因和/或cysK基因的表达而增加由cysR基因编码的蛋白质和/或由cysK基因编码的蛋白质的活性的方式进行了修饰,
其中通过增加所述基因的拷贝数和/或替换所述基因的启动子来增加cysR基因和/或cysK基因中每种的表达,
其中所述cysR基因编码包含SEQ ID NO:105的氨基酸序列的蛋白质,
其中所述cysK基因编码包含SEQ ID NO:141的氨基酸序列的蛋白质,且
其中所述目标物质是香草酸。
2.根据权利要求1所述的方法,其中所述生产包括:
在含有碳源的培养基中培养所述微生物以在所述培养基中生产和积累所述目标物质。
3.根据权利要求1所述的方法,其中所述生产包括:
通过使用所述微生物来将所述目标物质的前体转化成所述目标物质。
4.根据权利要求3所述的方法,其中所述转化包括:
在含有所述前体的培养基中培养所述微生物以在所述培养基中生产和积累所述目标物质。
5.根据权利要求3所述的方法,其中所述转化包括:
在反应混合物中允许所述微生物的细胞作用于所述前体以在所述反应混合物中生产和积累所述目标物质。
6.根据权利要求5所述的方法,其中所述细胞是存在于所述微生物的培养液中的细胞、从所述培养液中收集的细胞、存在于所述培养液的加工产物中的细胞、存在于收集的细胞的加工产物中的细胞,或这些的组合。
7.根据权利要求3至6中任一项所述的方法,其中所述前体是原儿茶酸。
8.根据权利要求1至7中任一项所述的方法,所述方法还包括收集所述目标物质。
9.根据权利要求1至8中任一项所述的方法,其中由cysR基因编码的蛋白质的活性增加导致L-半胱氨酸生物合成酶活性的增加,且其中所述L-半胱氨酸生物合成酶是由选自由以下组成的基因编码的蛋白质:cysI基因、cysX基因、cysH基因、cysD基因、cysN基因、cysY基因、cysZ基因、fpr2基因、cysK基因和它们的组合。
10.根据权利要求9所述的方法,其中:
所述cysI基因编码选自由以下组成的组的蛋白质:
(1a)包含SEQ ID NO:89的氨基酸序列的蛋白质,
(1b)包含SEQ ID NO:89的氨基酸序列,且该氨基酸序列包含1至10个氨基酸残基的取代、缺失、插入和/或添加的蛋白质,且其中所述蛋白质具有参与硫利用的功能,和
(1c)包含与SEQ ID NO:89的氨基酸序列具有90%或更高的同一性的氨基酸序列的蛋白质,且其中所述蛋白质具有参与硫利用的功能;
所述cysX基因编码选自由以下组成的组的蛋白质:
(2a)包含SEQ ID NO:91的氨基酸序列的蛋白质,
(2b)包含SEQ ID NO:91的氨基酸序列,且该氨基酸序列包含1至10个氨基酸残基的取代、缺失、插入和/或添加的蛋白质,且其中所述蛋白质具有参与硫利用的功能,和
(2c)包含与SEQ ID NO:91的氨基酸序列具有90%或更高的同一性的氨基酸序列的蛋白质,且其中所述蛋白质具有参与硫利用的功能;
所述cysH基因编码选自由以下组成的组的蛋白质:
(3a)包含SEQ ID NO:93的氨基酸序列的蛋白质,
(3b)包含SEQ ID NO:93的氨基酸序列,且该氨基酸序列包含1至10个氨基酸残基的取代、缺失、插入和/或添加的蛋白质,且其中所述蛋白质具有参与硫利用的功能,和
(3c)包含与SEQ ID NO:93的氨基酸序列具有90%或更高的同一性的氨基酸序列的蛋白质,且其中所述蛋白质具有参与硫利用的功能;
所述cysD基因编码选自由以下组成的组的蛋白质:
(4a)包含SEQ ID NO:95的氨基酸序列的蛋白质,
(4b)包含SEQ ID NO:95的氨基酸序列,且该氨基酸序列包含1至10个氨基酸残基的取代、缺失、插入和/或添加的蛋白质,且其中所述蛋白质具有参与硫利用的功能,和
(4c)包含与SEQ ID NO:95的氨基酸序列具有90%或更高的同一性的氨基酸序列的蛋白质,且其中所述蛋白质具有参与硫利用的功能;
所述cysN基因编码选自由以下组成的组的蛋白质:
(5a)包含SEQ ID NO:97的氨基酸序列的蛋白质,
(5b)包含SEQ ID NO:97的氨基酸序列,且该氨基酸序列包含1至10个氨基酸残基的取代、缺失、插入和/或添加的蛋白质,且其中所述蛋白质具有参与硫利用的功能,和
(5c)包含与SEQ ID NO:97的氨基酸序列具有90%或更高的同一性的氨基酸序列的蛋白质,且其中所述蛋白质具有参与硫利用的功能;
所述cysY基因编码选自由以下组成的组的蛋白质:
(6a)包含SEQ ID NO:99的氨基酸序列的蛋白质,
(6b)包含SEQ ID NO:99的氨基酸序列,且该氨基酸序列包含1至10个氨基酸残基的取代、缺失、插入和/或添加的蛋白质,且其中所述蛋白质具有参与硫利用的功能,和
(6c)包含与SEQ ID NO:99的氨基酸序列具有90%或更高的同一性的氨基酸序列的蛋白质,且其中所述蛋白质具有参与硫利用的功能;
所述cysZ基因编码选自由以下组成的组的蛋白质:
(7a)包含SEQ ID NO:101的氨基酸序列的蛋白质,
(7b)包含SEQ ID NO:101的氨基酸序列,且该氨基酸序列包含1至10个氨基酸残基的取代、缺失、插入和/或添加的蛋白质,且其中所述蛋白质具有参与硫利用的功能,和
(7c)包含与SEQ ID NO:101的氨基酸序列具有90%或更高的同一性的氨基酸序列的蛋白质,且其中所述蛋白质具有参与硫利用的功能;
所述fpr2基因编码选自由以下组成的组的蛋白质:
(8a)包含SEQ ID NO:103的氨基酸序列的蛋白质,
(8b)包含SEQ ID NO:103的氨基酸序列,且该氨基酸序列包含1至10个氨基酸残基的取代、缺失、插入和/或添加的蛋白质,且其中所述蛋白质具有参与硫利用的功能,和
(8c)包含与SEQ ID NO:103的氨基酸序列具有90%或更高的同一性的氨基酸序列的蛋白质,且其中所述蛋白质具有参与硫利用的功能;并且
所述cysK基因编码选自下组的蛋白质:
(10a)包含SEQ ID NO:141的氨基酸序列的蛋白质,
(10b)包含SEQ ID NO:141的氨基酸序列,且该氨基酸序列包含1至10个氨基酸残基的取代、缺失、插入和/或添加的蛋白质,所述蛋白质具有O-乙酰丝氨酸(硫醇)-裂合酶活性,和
(10c)包含与SEQ ID NO:141的氨基酸序列具有90%或更高的同一性的氨基酸序列的蛋白质,且其中所述蛋白质具有O-乙酰丝氨酸(硫醇)-裂合酶活性。
11.根据权利要求1至10中任一项所述的方法,其中所述微生物已经以与未修饰的菌株相比参与所述目标物质的生物合成的酶的活性得以增加的方式进行了进一步修饰。
12.根据权利要求11所述的方法,其中所述参与目标物质的生物合成的酶选自由以下组成的组:3-脱氧-D-阿拉伯糖-庚酮糖酸7-磷酸合酶、3-脱氢奎尼酸合酶、3-脱氢奎尼酸脱水酶、3-脱氢莽草酸脱水酶、O-甲基转移酶、芳族醛氧化还原酶和它们的组合。
13.根据权利要求1至12中任一项所述的方法,其中所述微生物已经以与未修饰的菌株相比磷酸泛酰巯基乙胺基转移酶的活性得以增加的方式进行了进一步的修饰。
14.根据权利要求1至13中任一项所述的方法,其中所述微生物已经以与未修饰的菌株相比参与除所述目标物质以外的物质的副生产的酶的活性得以降低的方式进行了进一步的修饰。
15.根据权利要求14所述的方法,其中所述参与除目标物质以外的物质的副生产的酶选自由以下组成的组:香草酸脱甲基酶、原儿茶酸3,4-双加氧酶、醇脱氢酶、莽草酸脱氢酶和它们的组合。
16.一种生产香草醛的方法,所述方法包括:
通过权利要求1至15中任一项所述的方法来生产香草酸;和
将所述香草酸转化成香草醛。
CN201780066784.XA 2016-10-26 2017-10-26 用于生产目标物质的方法 Active CN109952380B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201662413030P 2016-10-26 2016-10-26
US62/413,030 2016-10-26
US201662417602P 2016-11-04 2016-11-04
US62/417,602 2016-11-04
PCT/JP2017/038799 WO2018079687A1 (en) 2016-10-26 2017-10-26 Method for producing objective substance

Publications (2)

Publication Number Publication Date
CN109952380A CN109952380A (zh) 2019-06-28
CN109952380B true CN109952380B (zh) 2023-07-14

Family

ID=61226628

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780066784.XA Active CN109952380B (zh) 2016-10-26 2017-10-26 用于生产目标物质的方法

Country Status (5)

Country Link
US (1) US20190249205A1 (zh)
EP (1) EP3532627A1 (zh)
JP (2) JP2019531759A (zh)
CN (1) CN109952380B (zh)
WO (1) WO2018079687A1 (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112021019284A2 (pt) 2019-03-29 2022-02-01 Ajinomoto Kk Métodos para produzir alolactose e para produzir um indutor de expressão gênica
CN111748506B (zh) * 2019-03-29 2022-07-05 中国科学院微生物研究所 产胍基乙酸的工程菌及其构建方法与应用
JPWO2020226087A1 (zh) 2019-05-08 2020-11-12
EP3839051A1 (en) 2019-12-19 2021-06-23 Evonik Operations GmbH Method for the fermentative production of guanidinoacetic acid
JPWO2021177392A1 (zh) 2020-03-04 2021-09-10
AU2021303704A1 (en) * 2020-07-09 2023-03-09 Evonik Operations Gmbh Method for the fermentative production of guanidinoacetic acid
BR112022026755A2 (pt) * 2020-07-09 2023-01-24 Evonik Operations Gmbh Micro-organismo, método para a produção fermentativa de ácido acético de guanidino (gaa) e para a produção fermentativa de creatina
CN114276947A (zh) * 2021-10-12 2022-04-05 湖北远大生物技术有限公司 酶促转化制备l-半胱氨酸的方法和用途

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101631849A (zh) * 2007-03-14 2010-01-20 味之素株式会社 L-谷氨酸类氨基酸生产微生物以及氨基酸的生产方法

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5089592A (zh) 1973-12-13 1975-07-18
JPS57134500A (en) 1981-02-12 1982-08-19 Kyowa Hakko Kogyo Co Ltd Plasmid pcg1
JPS57183799A (en) 1981-04-17 1982-11-12 Kyowa Hakko Kogyo Co Ltd Novel plasmid
JPS5835197A (ja) 1981-08-26 1983-03-01 Kyowa Hakko Kogyo Co Ltd プラスミドpcg2
JPS58192900A (ja) 1982-05-04 1983-11-10 Ajinomoto Co Inc 複合プラスミド
JPH01191686A (ja) 1988-01-26 1989-08-01 Mitsubishi Petrochem Co Ltd 複合プラスミド
FR2627508B1 (fr) 1988-02-22 1990-10-05 Eurolysine Procede pour l'integration d'un gene choisi sur le chromosome d'une bacterie et bacterie obtenue par ledit procede
JP2678995B2 (ja) 1988-09-08 1997-11-19 三菱化学株式会社 トリプトフアンシンターゼの製造法
US5185262A (en) 1988-07-27 1993-02-09 Mitsubishi Petrochemical Co., Ltd. DNA fragment containing gene which encodes the function of stabilizing plasmid in host microorganism
JPH02207791A (ja) 1989-02-07 1990-08-17 Ajinomoto Co Inc 微生物の形質転換法
JP2973446B2 (ja) 1990-01-11 1999-11-08 三菱化学株式会社 新規プラスミドベクター
JPH07108228B2 (ja) 1990-10-15 1995-11-22 味の素株式会社 温度感受性プラスミド
US5128253A (en) * 1991-05-31 1992-07-07 Kraft General Foods, Inc. Bioconversion process for the production of vanillin
JPH05244941A (ja) 1992-03-03 1993-09-24 Toyo Ink Mfg Co Ltd Nadh依存性パラヒドロキシ安息香酸ヒドロキシラーゼ及びその製造方法
US5272073A (en) 1992-06-30 1993-12-21 Purdue Research Foundation Biocatalytic synthesis of catechol from glucose
JPH0775589A (ja) 1993-09-08 1995-03-20 Kawasaki Steel Corp プロトカテキュ酸の製造方法
AU4431196A (en) 1995-01-23 1996-08-14 Novo Nordisk A/S Dna integration by transposition
JPH0970291A (ja) 1995-06-30 1997-03-18 Ajinomoto Co Inc 人工トランスポゾンを用いた遺伝子増幅方法
JP4168463B2 (ja) 1996-12-05 2008-10-22 味の素株式会社 L−リジンの製造法
AU756507B2 (en) 1998-03-18 2003-01-16 Ajinomoto Co., Inc. L-glutamic acid-producing bacterium and method for producing L-glutamic acid
EP1114173A4 (en) 1998-09-18 2005-02-16 Univ Michigan State SYNTHESIS OF VANILLIN FROM A CARBON SOURCE
JP2000262288A (ja) 1999-03-16 2000-09-26 Ajinomoto Co Inc コリネ型細菌の温度感受性プラスミド
CN1452659A (zh) * 2000-03-09 2003-10-29 Basf公司 编码代谢途径蛋白的谷氨酸棒杆菌基因
US7846697B2 (en) 2003-06-19 2010-12-07 BLMaps Method of producing a low molecular weight organic compound in a cell
RU2337140C2 (ru) 2003-07-29 2008-10-27 Адзиномото Ко., Инк. Способ продуцирования l-лизина или l-треонина с помощью бактерий escherichia, имеющих аттенуированную активность малеинового фермента
JP4882063B2 (ja) 2005-10-12 2012-02-22 国立大学法人東京農工大学 テレフタル酸の代謝に関与する新規遺伝子
JP5088136B2 (ja) 2005-10-18 2012-12-05 味の素株式会社 コハク酸の製造方法
RU2418069C2 (ru) 2006-09-29 2011-05-10 Закрытое акционерное общество "Научно-исследовательский институт Аджиномото-Генетика" (ЗАО АГРИ) Способ конструирования рекомбинантных бактерий, принадлежащих к роду pantoea, и способ продукции l-аминокислот с использованием бактерий, принадлежащих к роду pantoea
JP2010207094A (ja) 2009-03-06 2010-09-24 Genaris Inc プロトカテク酸の製造法
CN105063104B (zh) 2011-08-08 2019-08-13 国际香料香精公司 用于香草醛或香草醛β-D-葡萄糖苷的生物合成的组合物和方法
WO2013069634A1 (ja) 2011-11-11 2013-05-16 味の素株式会社 発酵法による目的物質の製造法
BR112015009849A2 (pt) 2012-11-05 2017-12-05 Evolva Sa vanilina sintase
WO2015009558A1 (en) * 2013-07-16 2015-01-22 International Flavors & Fragrances Inc. Compositions and methods for the biosynthesis of vanillin or vanillin beta-d-glucoside
CA2959563A1 (en) * 2014-09-01 2016-03-10 Metabolic Explorer Method and microorganism for methionine production by fermentation with improved methionine efflux
PL3331998T3 (pl) * 2015-08-07 2020-12-28 Evonik Operations Gmbh Wytwarzanie przez fermentację l-metioniny zależne od tiokarboksylanu białka
EP3368695A2 (en) * 2015-10-27 2018-09-05 Ajinomoto Co., Inc. Method for producing aldehyde

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101631849A (zh) * 2007-03-14 2010-01-20 味之素株式会社 L-谷氨酸类氨基酸生产微生物以及氨基酸的生产方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Deregulation of S‑adenosylmethionine biosynthesis and regeneration improves methylation in the E. coli de novo vanillin biosynthesis pathway;Aditya M. Kunjapu等;《Microbial Cell Factories》;20160411;第15卷(第61期);摘要,第7页左栏第2段至右栏第2段,第2页右栏,第9页表1 *

Also Published As

Publication number Publication date
JP2022093626A (ja) 2022-06-23
EP3532627A1 (en) 2019-09-04
JP7331985B2 (ja) 2023-08-23
CN109952380A (zh) 2019-06-28
WO2018079687A1 (en) 2018-05-03
US20190249205A1 (en) 2019-08-15
JP2019531759A (ja) 2019-11-07

Similar Documents

Publication Publication Date Title
CN109952380B (zh) 用于生产目标物质的方法
CN108350412B (zh) 用于生产醛的方法
CN108929886B (zh) 生产目标物质的方法
CN109890970B (zh) 生产目标物质的方法
DK3087178T3 (en) PROCEDURE FOR PREPARING OXALATE OXIDASES WITH ACTIVITY OPTIMUM NEAR PHYSIOLOGICAL PH AND APPLICATION OF SUCH RECOMBINANT OXALATE OXIDASES IN THE TREATMENT OF OXALATE-RELATED DISEASES
KR20180008786A (ko) 메타크릴산 및 그 유도체의 생물학적 제조 방법
CN109937257B (zh) 生产目标物质的方法
CN109837315B (zh) 用于生产目标物质的方法
CN109963947B (zh) 用于生产l-甲硫氨酸或需要s-腺苷甲硫氨酸进行合成的代谢物的方法
CN109890972B (zh) 生产目标物质的方法
CN109890960B (zh) 用于生产醛的方法
CN110923183A (zh) 产羊毛甾醇大肠杆菌菌株的构建方法
CN106591344A (zh) 一种融合分子伴侣标签的大肠杆菌热诱导可溶性蛋白表达载体及其应用
CN112553176B (zh) 一种热稳定性提高的谷氨酰胺转氨酶
CN113755418A (zh) 表面展示碳酸酐酶的重组工程菌及其构建方法与应用
CN101603023B (zh) 一株温控共表达外源基因的重组大肠杆菌及其应用
Guo et al. Generation of branched-chain amino acids resistant Corynebacterium glutamicum acetohydroxy acid synthase by site-directed mutagenesis
CN106755031B (zh) 鼠李糖脂生产质粒及其构建方法与大肠杆菌工程菌和应用
CN114426957A (zh) 一种糖醛酸脱氢酶突变体及其在制备糖二酸中的应用
CN112553177B (zh) 一种热稳定性提高的谷氨酰胺转氨酶变体
CN114317473B (zh) 一种催化活性和热稳定性提高的谷氨酰胺转氨酶变体
KR101137021B1 (ko) 퓨조박테리움 뉴클레텀 유래의 신규 글리코실트랜스퍼라제및 이를 이용한 올리고당 제조방법
RU2723183C2 (ru) О-сукцинилгомосерин-продуцирующий микроорганизм и способ получения о-сукцинилгомосерина с его использованием
KR102527339B1 (ko) 일산화탄소 탈수소효소 및 포름산 탈수소효소를 이용한 개미산의 제조 방법
CN114891649B (zh) 复合菌及其在降解长链烷烃中的应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant