CN109890960A - 用于生产醛的方法 - Google Patents

用于生产醛的方法 Download PDF

Info

Publication number
CN109890960A
CN109890960A CN201780066218.9A CN201780066218A CN109890960A CN 109890960 A CN109890960 A CN 109890960A CN 201780066218 A CN201780066218 A CN 201780066218A CN 109890960 A CN109890960 A CN 109890960A
Authority
CN
China
Prior art keywords
gene
leu
target substance
ala
microorganism
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201780066218.9A
Other languages
English (en)
Other versions
CN109890960B (zh
Inventor
户矢崎未来
福井启太
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ajinomoto Co Inc
Original Assignee
Ajinomoto Co Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ajinomoto Co Inc filed Critical Ajinomoto Co Inc
Publication of CN109890960A publication Critical patent/CN109890960A/zh
Application granted granted Critical
Publication of CN109890960B publication Critical patent/CN109890960B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/24Preparation of oxygen-containing organic compounds containing a carbonyl group
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0008Oxidoreductases (1.) acting on the aldehyde or oxo group of donors (1.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1205Phosphotransferases with an alcohol group as acceptor (2.7.1), e.g. protein kinases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y102/00Oxidoreductases acting on the aldehyde or oxo group of donors (1.2)
    • C12Y102/07Oxidoreductases acting on the aldehyde or oxo group of donors (1.2) with an iron-sulfur protein as acceptor (1.2.7)
    • C12Y102/07005Aldehyde ferredoxin oxidoreductase (1.2.7.5)

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

描述了用于生产目标物质,例如醛,如香草醛的方法。通过使用具有生产目标物质的能力的微生物从碳源或目标物质的前体生产目标物质,其中微生物已经经过修饰而具有特定的羧酸还原酶(CAR)基因,例如戈登氏菌CAR基因、新鞘氨醇杆菌CAR基因或胶球藻CAR基因。

Description

用于生产醛的方法
发明领域
本发明涉及通过使用微生物生产目标物质,例如醛诸如香草醛的方法。
发明背景
香草醛是造成香草气味的主要成分,通过混入食品、饮料、香水等中作为芳香物使用。香草醛主要通过从天然产物中提取或通过化学合成来生产。
生物工程技术也已经尝试用来生产香草醛,例如通过使用各种微生物与丁香油酚、异丁香油酚、阿魏酸、葡萄糖、香草酸、椰子壳等作为原料(NPL1)进行。其他生物工程方法包括作为糖苷生产香草醛的方法(PTL 1和2)、使用香草醛合酶从阿魏酸生产香草醛的方法(PTL 3)以及通过大肠杆菌发酵来生产香草酸,然后将香草酸酶促转化为香草醛的方法(PTL 4)。
香草醛可以通过中间体原儿茶酸生产。具体地,可以分别通过O-甲基转移酶(OMT)或醛氧化还原酶(羧酸还原酶;CAR)的作用将原儿茶酸转化为香草酸或原儿茶醛;并且分别通过CAR或OMT的作用将香草酸或原儿茶醛转化为香草醛。此外,异香草醛可以通过中间体原儿茶酸作为副产物生产。具体地,可以通过OMT的作用将原儿茶酸转化为异香草酸;并且可以通过CAR的作用将异香草酸转化为异香草醛。
[引用列表]
[专利文献]
PTL 1:WO2013/022881
PTL 2:WO2004/111254
PTL 3:JP2015-535181
PTL 4:US6372461
[非专利文献]
NPL 1:Kaur B.and Chakraborty D.,Biotechnological and molecularapproaches for vanillin production:a review.Appl Biochem Biotechnol.2013 Feb;169(4):1353-72.
发明概述
在纯化过程期间难以分离醛诸如香草醛与另一种醛诸如原儿茶醛和异香草醛。因此,香草醛的选择性生成可以用于例如减少纯化成本。然而,先前尚未报告适合于香草醛的选择性生成的CAR。
本发明的一方面是开发用于改善目标物质,例如醛诸如香草醛的生产的新技术,诸如可用于目标物质的选择性生成的新技术,从而提供用于有效生产目标物质的方法。
本文中描述了通过使用能够表达Gordonia effusa、马来西亚新鞘氨醇杆菌(Novosphingobium malaysiense)或Coccomyxa subellipsoidea的羧酸还原酶(CAR)基因的微生物可以显著改善微生物生产目标物质,例如醛诸如香草醛的能力。
本发明的一方面提供了一种生产目标物质的方法,所述方法包括:
通过使用具有生产所述目标物质的能力的微生物来生产所述目标物质,
其中所述目标物质是醛,
其中所述微生物已经进行了修饰而使该微生物具有醛氧化还原酶基因,且
其中所述醛氧化还原酶基因编码选自由以下组成的组的蛋白质:
(a)包含SEQ ID NO:18、79或83的氨基酸序列的蛋白质;
(b)包含SEQ ID NO:18、79或83的氨基酸序列,且该氨基酸序列包含1至10个氨基酸残基的取代、缺失、插入和/或添加的蛋白质,且其中所述蛋白质具有醛氧化还原酶活性;
(c)包含与SEQ ID NO:18、79或83的氨基酸序列具有90%或更高的同一性的氨基酸序列的蛋白质,且其中所述蛋白质具有醛氧化还原酶活性。
本发明的另一方面提供了如本文中描述的方法,其中所述生产包括:
在含有碳源的培养基中培养所述微生物以在所述培养基中生产和积累所述目标物质。
本发明的另一方面提供了如本文中描述的方法,其中所述生产包括:
通过使用所述微生物以将所述目标物质的前体转化成所述目标物质。
本发明的另一方面提供了如本文中描述的方法,其中所述转化包括:
在含有所述前体的培养基中培养所述微生物以在所述培养基中生产和积累所述目标物质。
本发明的另一方面提供了如本文中描述的方法,其中所述转化包括:
在反应混合物中允许所述微生物的细胞作用于所述前体以在所述反应混合物中生产和积累所述目标物质。
本发明的另一方面提供了如本文中描述的方法,其中所述细胞选自由以下组成的组:
-存在于所述微生物的培养液中的细胞,
-从所述培养液中收集的细胞,
-存在于所述培养液的加工产物中的细胞,
-存在于收集的细胞的加工产物中的细胞,和
-这些的组合。
本发明的另一方面提供了如本文中描述的方法,其中所述前体是选自由以下组成的组的物质:原儿茶酸、香草酸、苯甲酸、L-苯丙氨酸、肉桂酸和它们的组合。
本发明的另一方面提供了如本文中描述的方法,所述方法还包括从所述培养基或反应混合物中收集所述目标物质。
本发明的另一方面提供了如本文中描述的方法,其中所述微生物是属于肠杆菌科(Enterobacteriaceae)的细菌、棒状杆菌细菌(coryneform bacterium)或酵母。
本发明的另一方面提供了如本文中描述的方法,其中所述微生物是属于棒状杆菌属(Corynebacterium)的细菌。
本发明的另一方面提供了如本文中描述的方法,其中所述微生物是谷氨酸棒杆菌(Corynebacterium glutamicum)。
本发明的另一方面提供了如本文中描述的方法,其中所述微生物是属于埃希氏菌属(Escherichia)的细菌。
本发明的另一方面提供了如本文中描述的方法,其中所述微生物是大肠杆菌(Escherichia coli)。
本发明的另一方面提供了如本文中描述的方法,其中所述目标物质是芳族醛。
本发明的另一方面提供了如本文中描述的方法,其中所述目标物质是选自由以下组成的组的芳族醛:香草醛、苯甲醛、肉桂醛和它们的组合。
本发明的另一方面提供了如本文中描述的方法,其中所述微生物已经以与未修饰的菌株相比参与所述目标物质的生物合成的酶的活性得以增加的方式进行了进一步的修饰。
本发明的另一方面提供了如本文中描述的方法,其中所述参与目标物质的生物合成的酶能够催化从所述目标物质的前体向所述目标物质的转化。
本发明的另一方面提供了如本文中描述的方法,其中所述参与目标物质的生物合成的酶选自由以下组成的组:3-脱氧-D-阿拉伯糖-庚酮糖酸7-磷酸合酶、3-脱氢奎尼酸合酶、3-脱氢奎尼酸脱水酶、3-脱氢莽草酸脱水酶、O-甲基转移酶、苯丙氨酸氨裂合酶和它们的组合。
本发明的另一方面提供了如本文中描述的方法,其中所述微生物已经以与未修饰的菌株相比磷酸泛酰巯基乙胺基转移酶的活性得以增加的方式进行了进一步的修饰。
本发明的另一方面提供了如本文中描述的方法,其中所述微生物已经以与未修饰的菌株相比除所述目标物质以外的物质的摄取系统的活性得以增加的方式进行了进一步的修饰。
本发明的另一方面提供了如本文中描述的方法,其中所述摄取系统选自由以下组成的组:香草酸摄取系统、原儿茶酸摄取系统和它们的组合。
本发明的另一方面提供了如本文中描述的方法,其中所述微生物已经以与未修饰的菌株相比在所述目标物质的生产期间参与生产副产物的酶的活性得以降低的方式进行了进一步的修饰。
本发明的另一方面提供了如本文中描述的方法,其中所述在目标物质的生产期间参与生产副产物的酶选自由以下组成的组:香草酸脱甲基酶、原儿茶酸3,4-双加氧酶、醇脱氢酶、莽草酸脱氢酶和它们的组合。
发明详述
在下文,将详细解释本发明。
<1>本发明的微生物
如本文中描述的微生物是具有生产目标物质的能力的微生物,所述微生物已经经过修饰而具有(即含有)特定的羧酸还原酶(CAR)基因,诸如戈登氏菌(Gordonia)CAR基因、新鞘氨醇杆菌(Novosphingobium)CAR基因或胶球藻(Coccomyxa)CAR基因。生产目标物质的能力也可以称为“目标物质生产能力”。
<1-1>具有目标物质生产能力的微生物
术语“具有目标物质生产能力的微生物”可以指能够生产目标物质的微生物。
术语“具有目标物质生产能力的微生物”可以指在微生物用于发酵方法的情况下能够通过发酵生产目标物质的微生物。也就是说,术语“具有目标物质生产能力的微生物”可以指能够从碳源生产目标物质的微生物。具体而言,术语“具有目标物质生产能力的微生物”可以指当在培养基例如含有碳源的培养基中培养时能够在培养基中以一定程度生产并积累目标物质,从而可以从中收集目标物质的微生物。
术语“具有目标物质生产能力的微生物”还可以指在将微生物用于生物转化方法的情况下能够通过生物转化生产目标物质的微生物。也就是说,术语“具有目标物质生产能力的微生物”可以指能够从目标物质的前体生产目标物质的微生物。具体而言,术语“具有目标物质生产能力的微生物”可以指当在含有目标物质的前体的培养基中培养时,能够在培养基中以一定程度生产并积累目标物质,从而可以从中收集目标物质的微生物。具体而言,术语“具有目标物质生产能力的微生物”还可以指能够在被允许作用于反应混合物中的目标物质的前体时在反应混合物中以一定程度生产和积累目标物质,从而可以从反应混合物中收集目标物质的微生物。
具有目标物质生产能力的微生物可以是能够在培养基或反应混合物中以比用非修饰菌株获得的量更大的量积累目标物质的微生物。非修饰的菌株也可以称为“非修饰的微生物的菌株”。术语“非修饰菌株”可以指尚未修饰而具有特定CAR基因的对照菌株。非修饰的菌株的实例可以包括具有除特定CAR基因以外的CAR基因,诸如巴西诺卡菌(Nocardiabrasiliensis)的CAR基因替换特定CAR基因的菌株。具有目标物质生产能力的微生物可以是能够在培养基或反应混合物中以例如0.01g/L以上、0.05g/L以上或0.09g/L以上的量积累目标物质的微生物。
术语“目标物质”可以指醛。醛的实例可以包括芳香醛。芳香醛的实例可以包括香草醛、苯甲醛和肉桂醛。微生物可以具有仅产生一种目标物质的能力,或者可以具有产生两种或更多种目标物质的能力。此外,微生物可以具有从目标物质的一种前体或目标物质的两种或更多种前体产生目标物质的能力。
用于构建如本文中描述的微生物的亲本菌株没有特别限制。微生物的实例可以包括细菌和酵母。
细菌的实例可以包括属于肠杆菌科的细菌和棒状杆菌细菌。
属于肠杆菌科的细菌的实例可以包括属于埃希氏菌属、肠杆菌属(Enterobacter)、泛菌属(Pantoea)、克雷伯氏菌属(Klebsiella)、沙雷菌属(Serratia)、欧文氏菌属(Erwinia)、发光杆菌属(Photorhabdus)、普罗威登斯菌属(Providencia)、沙门氏菌属(Salmonella)、摩根菌属(Morganella)的细菌。具体地,可以使用根据用于NCBI(National Center for Biotechnology Information)数据库的分类学(www.ncbi.nlm.nih.gov/Taxonomy/Browser/wwwtax.cgi?id=91347)分类为肠杆菌科的细菌。
埃希氏菌属细菌没有特别限制,并且其实例可以包括根据微生物学领域技术人员已知的分类学分类为埃希氏菌属的细菌。埃希氏菌属细菌的实例可以包括例如记载于Neidhardt et al.(Backmann B.J.,1996,Derivations and Genotypes of some mutantderivatives of Escherichia coli K-12,pp.2460-2488,Table 1,In F.D.Neidhardt(编),Escherichia coli and Salmonella Cellular and Molecular Biology/第二版,American Society for Microbiology Press,Washington,D.C.)工作中的那些细菌。埃希氏菌属细菌的实例可以包括例如大肠杆菌。大肠杆菌的具体实例可以包括大肠杆菌K-12菌株,诸如W3110菌株(ATCC 27325)和MG1655菌株(ATCC 47076);大肠杆菌K5菌株(ATCC23506);大肠杆菌B菌株,诸如BL21(DE3)菌株;以及其衍生菌株。
肠杆菌属细菌没有特别限制,并且其实例可以包括根据微生物学领域技术人员已知的分类学分类为肠杆菌属的细菌。肠杆菌属细菌的实例可以包括例如聚团肠杆菌(Enterobacter agglomerans)和产气肠杆菌(Enterobacter aerogenes)。聚团肠杆菌的具体实例可以包括例如聚团肠杆菌ATCC 12287菌株。产气肠杆菌的具体实例可以包括例如产气肠杆菌ATCC 13048菌株、NBRC 12010菌株(Biotechnol.Bioeng.,2007,Mar.27;98(2):340-348)和AJ110637菌株(FERM BP-10955)。肠杆菌属细菌的实例还可以包括例如记载于欧洲专利申请公开(EP-A)No.0952221中的菌株。另外,聚团肠杆菌还可以包括分类为成团泛菌(Pantoea agglomerans)的一些菌株。
泛菌属细菌没有特别限制,并且其实例可以包括根据微生物学领域技术人员已知的分类学分类为泛菌属的细菌。泛菌属细菌的实例可以包括例如菠萝泛菌(Pantoeaananatis)、斯氏泛菌(Pantoea stewartii)、成团泛菌和柠檬泛菌(Pantoea citrea)。菠萝泛菌的具体实例可以包括例如菠萝泛菌LMG20103菌株、AJ13355菌株(FERM BP-6614)、AJ13356菌株(FERM BP-6615)、AJ13601菌株(FERM BP-7207)、SC17菌株(FERM BP-11091)、SC17(0)菌株(VKPM B-9246)和SC17sucA菌株(FERM BP-8646)。一些肠杆菌属细菌和欧文氏菌属细菌重新分类为泛菌属(Int.J.Syst.Bacteriol.,39,337-345(1989);Int.J.Syst.Bacteriol.,43,162-173(1993))。例如,基于16S rRNA等的核苷酸序列分析,一些聚团肠杆菌菌株最近重新分类为成团泛菌、菠萝泛菌、斯氏泛菌等(Int.J.Syst.Bacteriol.,39,337-345(1989))。泛菌属细菌可以包括如上文描述的重新分类为泛菌属的那些细菌。
欧文氏菌属细菌的实例可以包括解淀粉欧文氏菌(Erwinia amylovora)和胡萝卜软腐欧文氏菌(Erwinia carotovora)。克雷伯氏菌属细菌的实例可以包括植物克雷伯氏菌(Klebsiella planticola)。
棒状杆菌细菌的实例可以包括属于棒杆菌属、短杆菌属(Brevibacterium)、细杆菌属(Microbacterium)等的细菌。
此类棒状杆菌细菌的具体实例可以包括以下物种。
嗜乙酰乙酸棒状杆菌(Corynebacterium acetoacidophilum)
醋谷氨酸棒杆菌(Corynebacterium acetoglutamicum)
解烷棒状杆菌(Corynebacterium alkanolyticum)
帚石南棒状杆菌(Corynebacterium callunae)
钝齿棒状杆菌(Corynebacterium crenatum)
谷氨酸棒杆菌(Corynebacterium glutamicum)
百合棒杆菌(Corynebacterium lilium)
栖糖蜜棒杆菌(Corynebacterium melassecola)
热产氨棒状杆菌(Corynebacterium thermoaminogenes)(有效棒杆菌(Corynebacterium efficiens))
力士棒杆菌(Corynebacterium herculis)
二歧短杆菌(Brevibacterium divaricatum)(谷氨酸棒杆菌)
黄色短杆菌(Brevibacterium flavum)(谷氨酸棒杆菌)
未成熟短杆菌(Brevibacterium immariophilum)
乳糖发酵短杆菌(Brevibacterium lactofermentum)(谷氨酸棒杆菌)
玫瑰色短杆菌(Brevibacterium roseum)
解糖短杆菌(Brevibacterium saccharolyticum)
硫殖短杆菌(Brevibacterium thiogenitalis)
产氨短杆菌(Corynebacterium ammoniagenes)(Corynebacterium stationis)
白色短杆菌(Brevibacterium album)
蜡状短杆菌(Brevibacterium cerinum)
嗜氨细杆菌(Microbacterium ammoniaphilum)
棒状杆菌细菌的具体实例可以包括以下菌株。
嗜乙酰乙酸棒杆菌(Corynebacterium acetoacidophilum)ATCC 13870
醋谷氨酸棒杆菌(Corynebacterium acetoglutamicum)ATCC 15806
解烷棒杆菌(Corynebacterium alkanolyticum)ATCC 21511
帚石南棒杆菌(Corynebacterium callunae)ATCC 15991
钝齿棒杆菌(Corynebacterium crenatum)AS1.542
谷氨酸棒杆菌ATCC 13020,ATCC 13032,ATCC 13060,ATCC 13869,FERM BP-734
百合棒杆菌(Corynebacterium lilium)ATCC 15990
栖糖蜜棒杆菌(Corynebacterium melassecola)ATCC 17965
有效棒杆菌(Corynebacterium efficiens)(热产氨棒状杆菌(Corynebacteriumthermoaminogenes))AJ12340(FERM BP-1539)
力士棒杆菌(Corynebacterium herculis)ATCC 13868
二歧短杆菌(Brevibacterium divaricatum)(谷氨酸棒杆菌)ATCC 14020
黄色短杆菌(Brevibacterium flavum)(谷氨酸棒杆菌)ATCC 13826,ATCC 14067,AJ12418(FERM BP-2205)
未成熟短杆菌(Brevibacterium immariophilum)ATCC 14068
乳糖发酵短杆菌(Brevibacterium lactofermentum)(谷氨酸棒杆菌)ATCC 13869
玫瑰色短杆菌(Brevibacterium roseum)ATCC 13825
解糖短杆菌(Brevibacterium saccharolyticum)ATCC 14066
硫殖短杆菌(Brevibacterium thiogenitalis)ATCC 19240
产氨短杆菌(Corynebacterium ammoniagenes)(停滞棒杆菌(Corynebacteriumstationis))ATCC 6871,ATCC 6872
白色短杆菌(Brevibacterium album)ATCC 15111
蜡状短杆菌(Brevibacterium cerinum)ATCC 15112
嗜氨细杆菌(Microbacterium ammoniaphilum)ATCC 15354
棒状杆菌细菌可以包括先前被分类为短杆菌属但目前并入棒状杆菌属中的细菌(Int.J.Syst.Bacteriol.,41,255(1991))。此外,停滞棒杆菌可以包括先前已被分类为产氨棒状杆菌,但目前基于16S rRNA的核苷酸序列分析等重新分类为停滞棒杆菌的细菌(Int.J.Syst.Evol.Microbiol.,60,874-879(2010))。
酵母可以是芽殖酵母或可以是裂殖酵母。酵母可以是单倍体酵母或可以是二倍体以上的多倍体酵母。酵母的实例可包括属于酵母属(Saccharomyces)的酵母,例如酿酒酵母(Saccharomyces cerevisiae),属于毕赤酵母属(Pichia)(也称为Wickerhamomyces属)的酵母,如西弗毕赤酵母(Pichia ciferrii),赛道威毕赤酵母(Pichia sydowiorum)和巴斯德毕赤酵母(Pichia pastoris),属于假丝酵母属(Candida)的酵母,诸如实用假性酵母(Candida utilis),属于汉逊酵母属(Hansenula)的酵母,如多形汉逊酵母(Hansenulapolymorpha)和属于裂殖酵母(Schizosaccharomyces)的酵母,如粟酒裂殖酵母(Schizosaccharomyces pombe)。
这些菌株可以从例如美国典型培养物保藏中心(地址:P.O.Box 1549,Manassas,VA 20108,United States of America)获得。也就是说,注册号被赋予各自的菌株,并且菌株可以通过使用这些注册号订购(参见www.atcc.org/)。美国典型培养物保藏中心的目录中列出了菌株的注册号。这些菌株也可以从例如菌株保藏的保藏所获得。
微生物可以固有具有目标物质生产能力,或者可以经修饰而使它具有目标物质生产能力。具有目标物质生产能力的微生物可以通过赋予如上所述的此类微生物以目标物质生产能力或增强如上所述的此类微生物的目标物质生产能力来获得。
以下,说明赋予或提高目标物质生成能力的方法的具体实例。为了赋予或提高目标物质生产能力,下面举例说明的此类修饰可以独立使用,或者可以适当组合使用。
目标物质可以通过参与目标物质生物合成的酶的作用产生。此类酶也可以称为“目标物质生物合成酶”。因此,微生物可以具有目标物质生物合成酶。换言之,微生物可以具有编码目标物质生物合成酶的基因。此类基因也可以称为“目标物质生物合成基因”。微生物可以固有具有目标物质生物合成基因,或者可以引入了目标物质生物合成基因。本文描述了用于引入基因的方法。
另外,通过提高目标物质生物合成酶的活性,可以改善微生物的目标物质生产能力。也就是说,赋予或提高目标物质生成能力的方法的实例可以包括提高目标物质生物合成酶的活性的方法。也就是说,微生物可以经修饰而使得增加了目标物质生物合成酶的活性。一种目标物质生物合成酶的活性可以得以增加,或者两种或更多种目标物质生物合成酶的活性可以得以增加。本文描述了用于增加蛋白质(酶等)的活性的方法。通过例如增加编码蛋白质的基因的表达,可以提高蛋白质(酶等)的活性。
目标物质可以从例如碳源和/或目标物质的前体产生。因此,目标物质生物合成酶的实例可以包括例如催化从碳源和/或前体向目标物质转化的酶。例如,3-脱氢莽草酸可以通过部分莽草酸途径产生,其可以包括由3-脱氧-D-阿拉伯糖-庚酮糖酸7-磷酸合酶(DAHP合酶),3-脱氢奎尼酸合酶和3-脱氢奎尼酸脱水酶催化的步骤;可以通过3-脱氢莽草酸脱水酶(DHSD)的作用将3-脱氢莽草酸转化为原儿茶酸;可以通过O-甲基转移酶(OMT)或醛氧化还原酶(羧酸还原酶,CAR)的作用将原儿茶酸分别转化为香草酸或原儿茶醛;以及可以通过CAR或OMT的作用将香草酸或原儿茶醛转化为香草醛。此外,苯甲醛和肉桂醛可以分别由例如苯甲酸和肉桂酸通过CAR的作用产生。也就是说,目标物质生物合成酶的具体实例可以包括例如DAHP合酶,3-脱氢奎尼酸合酶,3-脱氢奎尼酸脱水酶,DHSD,OMT和CAR。具体地,使用特定的CAR可以通过香草酸作为中间体来有效生产香草醛。因此,香草醛生产及其相关事项以部分或完全通过香草酸作为中间体产生香草醛为前提描述。
术语“3-脱氧-D-阿拉伯糖-庚酮糖酸7-磷酸合酶(DAHP合酶)”可以指具有催化将D-赤藓糖-4-磷酸和磷酸烯醇丙酮酸转化成3-脱氧-D-阿拉伯糖-庚糖酮酸7-磷酸(DAHP)和磷酸的反应的活性的蛋白质(EC 2.5.1.54)。编码DAHP合酶的基因也可以称为“DAHP合酶基因”。DAHP合酶的实例可以包括分别由aroF、aroG和aroH基因编码的AroF、AroG和AroH蛋白。在它们中,AroG可以作为主要的DAHP合酶发挥功能。DAHP合酶诸如AroF、AroG和AroH蛋白的实例包括各种生物体如肠杆菌科(Enterobacteriaceae)细菌和棒状杆菌细菌的那些。DAHP合酶的具体实例可以包括大肠杆菌的AroF、AroG和AroH蛋白。大肠杆菌K-12MG1655菌株的aroG基因的核苷酸序列如SEQ ID NO:1所示,并且由该基因编码的AroG蛋白的氨基酸序列如SEQ ID NO:2所示。
DAHP合酶活性可以通过例如将酶与底物(即D-赤藓糖-4-磷酸和磷酸烯醇丙酮酸)温育并测量DAHP的酶和底物依赖性生成来测量。
术语“3-脱氢奎尼酸合酶”可以指具有催化使DAHP脱磷酸化以产生3-脱氢奎宁酸的反应的活性的蛋白质(EC 4.2.3.4)。编码3-脱氢奎尼酸合酶的基因也可以称为“3-脱氢奎尼酸合酶基因”。3-脱氢奎尼酸合酶的实例可以包括由aroB基因编码的AroB蛋白。3-脱氢奎尼酸合酶如AroB蛋白的实例可以包括各种生物体如肠杆菌科细菌和棒状杆菌细菌的那些。3-脱氢奎尼酸合酶的具体实例可以包括大肠杆菌的AroB蛋白。大肠杆菌K-12MG1655菌株的aroB基因的核苷酸序列如SEQ ID NO:3所示,并且由该基因编码的AroB蛋白的氨基酸序列如SEQ ID NO:4所示。
3-脱氢奎尼酸合酶活性可以通过例如将酶与底物(即DAHP)温育并测量3-脱氢奎宁酸的酶和底物依赖性产生来测量。
术语“3-脱氢奎尼酸脱水酶”可以指具有催化使3-脱氢奎宁酸脱水以生成3-脱氢莽草酸的反应的活性的蛋白质(EC 4.2.1.10)。编码3-脱氢奎尼酸脱水酶的基因也可以称为“3-脱氢奎尼酸脱水酶基因”。3-脱氢奎尼酸脱水酶的实例可以包括由aroD基因编码的AroD蛋白。3-脱氢奎尼酸脱水酶诸如AroD蛋白的实例可以包括各种生物体如肠杆菌科细菌和棒杆菌的那些。3-脱氢奎尼酸脱水酶的具体实例可以包括大肠杆菌的AroD蛋白。大肠杆菌K-12MG1655菌株的aroD基因的核苷酸序列如SEQ ID NO:5所示,并且由该基因编码的AroD蛋白的氨基酸序列如SEQ ID NO:6所示。
3-脱氢奎尼酸脱水酶活性可以通过例如将酶与底物(即3-脱氢奎宁酸)温育并测量3-脱氢莽草酸的酶和底物依赖性产生来测量。
术语“3-脱氢草酸脱水酶(DHSD)”可以指具有催化使3-脱氢莽草酸脱水以生成原儿茶酸的反应的活性的蛋白质(EC 4.2.1.118)。编码DHSD的基因也可以称为“DHSD基因”。DHSD的实例可以包括由asbF基因编码的AsbF蛋白。DHSD例如AsbF蛋白的实例包括各种生物体如苏云金芽孢杆菌(Bacillus thuringiensis),粗糙脉孢菌(Neurospora crassa)和Podospora pauciseta的那些。苏云金芽孢杆菌BMB171菌株的asbF基因的核苷酸序列如SEQID NO:7所示,并且由该基因编码的AsbF蛋白的氨基酸序列如SEQ ID NO:8所示。
DHSD活性可以通过例如将酶与底物(即3-脱氢莽草酸)温育并测量原儿茶酸的酶和底物依赖性产生来测量。
编码莽草酸途径的酶如DAHP合酶,3-脱氢奎尼酸合酶和3-脱氢奎尼酸脱水酶的基因的表达受到酪氨酸阻遏物TyrR阻遏,所述TyrR由tyrR基因编码。因此,莽草酸途径酶的活性也可以通过降低酪氨酸阻遏物TyrR的活性而增加。大肠杆菌K-12MG1655菌株的tyrR基因的核苷酸序列如SEQ ID NO:9所示,并且由该基因编码的TyrR蛋白的氨基酸序列如SEQ IDNO:10所示。
术语“O-甲基转移酶(OMT)”可以指具有催化在存在甲基基团供体的情况下使原儿茶酸甲基化以产生香草酸的反应的活性的蛋白质(即在原儿茶酸的间位上的羟基基团的甲基化,EC 2.1.1.68等)。此活性也可以称为“OMT活性”。编码OMT的基因也可以称为“OMT基因”。OMT也可以催化在存在甲基基团供体的情况下使原儿茶醛甲基化以产生香草醛的反应(即,原儿茶醛的间位上的羟基基团的甲基化)。OMT通常可以使用原儿茶酸和原儿茶醛两者作为底物,但是不必然限于此。甲基基团供体的实例可以包括S-腺苷甲硫氨酸(SAM)。OMT的实例可以包括各种生物体的OMT,诸如智人(Homo sapiens)(Hs)的OMT(GenBank登录号NP_000745和NP_009294)、拟南芥(Arabidopsis thaliana)的OMT(GenBank登录号NP_200227和NP_009294)、Fragaria x ananassa的OMT(GenBank登录号AAF28353)以及WO2013/022881A1中示例的哺乳动物、植物和微生物的其他各种OMT。对于智人的OMT基因,已知四种转录物变体和两种OMT同种型。这四种转录物变体(转录物变体1-4,GenBank登录号NM_000754.3,NM_001135161.1,NM_001135162.1和NM_007310.2)的核苷酸序列显示为SEQ ID NO:11至14,较长OMT同种型(MB-COMT,GenBank登录号NP_000745.1)的氨基酸序列如SEQ ID NO:15所示,并且较短OMT同种型(S-COMT,GenBank登录号NP_009294.1)的氨基酸序列如SEQ ID NO:16所示。SEQ ID NO:16对应于截短了N端的50个氨基酸残基的SEQ ID NO:15。
OMT还可以催化原儿茶酸和/或原儿茶醛的甲基化反应以产生异香草酸和/或异香草醛(即对位羟基的甲基化)作为副反应。OMT可以选择性催化间位羟基的甲基化的。表述“选择性催化间位羟基的甲基化”可以意味着OMT选择性地从原儿茶酸生成香草酸的OMT和/或选择性地从原儿茶醛生成香草醛的OMT。表述“从原儿茶酸选择性产生香草酸”可以表示当允许OMT作用于原儿茶酸时按摩尔比计,OMT产生香草酸的量为异香草酸的量的例如3倍或更多,5倍或更多,10倍或更多,15倍或更多,20倍或更多,25倍或更多,或30倍或更多。此外,表述“从原儿茶醛选择性产生香草酸”可以表示当允许OMT作用于原儿茶醛时按摩尔比计,OMT产生香草醛的量为异香草酸的量的例如3倍或更多,5倍或更多,10倍或更多,15倍或更多,20倍或更多,25倍或更多,或者30倍或更多。选择性催化间位羟基甲基化的OMT的实例可以包括本文所述的具有“特定突变”的OMT。
具有“特定突变”的OMT也可以称为“突变体OMT”。编码突变体OMT的基因也可以称为“突变体OMT基因”。
不具有“特定突变”的OMT也可以称为“野生型OMT”。编码野生型OMT的基因也可以称为“野生型OMT基因”。术语“野生型”是为了方便将“野生型”OMT与“突变体”OMT区分开而使用,并且“野生型”OMT不限于作为天然物质获得的那些,并且可以包括任何没有“特定突变”的OMT。野生型OMT的实例可以包括例如上面例示的OMT。另外,上述例示的所有OMT保守变体可以认为是野生型OMT,条件是此类保守变体不具有“特定突变”。
“特定突变”的实例可以包括WO2013/022881A1中描述的突变体OMT中包含的突变。也就是说,“特定突变”的实例可以包括野生型OMT的198位亮氨酸残基(L198)被比亮氨酸残基的疏水性指数(hydrophobic index)显示更低疏水性指数(亲水性指数(hydropathyindex))的氨基酸残基取代的突变,以及野生型OMT的199位谷氨酸残基(E199)被在pH7.4具有中性或正侧链电荷的氨基酸残基取代的突变。突变体OMT可以具有这些突变中的一个或两者。
“比亮氨酸残基的疏水性指数显示更低疏水性指数(亲水指数)的氨基酸残基”的实例可以包括Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Lys,Met,Phe,Pro,Ser,Thr,Trp和Tyr。作为“比亮氨酸残基的疏水性指数显示更低疏水性指数(亲水指数)的氨基酸残基”,特别优选诸如Ala,Arg,Asn,Asp,Glu,Gln,Gly,His,Lys,Met,Pro,Ser,Thr,Trp和Tyr的氨基酸残基,并且Tyr是更优选的。
“在pH7.4具有中性或正侧链电荷的氨基酸残基”可以包括Ala,Arg,Asn,Cys,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val。作为“在pH7.4具有中性或正侧链电荷的氨基酸残基”,Ala或Gln是特别优选的。
任意的野生型OMT中的“L198”和“E199”可以指“与以SEQ ID NO:16所示的氨基酸序列的第198位的亮氨酸残基对应的氨基酸残基”和“与以SEQ ID NO:16所示的氨基酸序列的第199位谷氨酸残基对应的氨基酸残基”。这些氨基酸残基的位置表示相对位置,并且其绝对位置可以由于氨基酸残基的缺失,插入,添加等而改变。例如,若在SEQ ID NO:16所示的氨基酸序列中的位置X的N端侧的位置缺失或插入一个氨基酸残基,则原来在位置X处的氨基酸残基重新定位在位置X-1或X+1,但仍被认为是“与SEQ ID NO:16所示的氨基酸序列的X位的氨基酸残基对应的氨基酸残基”。此外,虽然“L198”和“E199”通常分别是亮氨酸残基和谷氨酸残基,但它们可以不是亮氨酸残基和谷氨酸残基。也就是说,当“L198”和“E199”分别不是亮氨酸残基和谷氨酸残基时,“特定突变”可以包括那些氨基酸残基各自被任何上述氨基酸残基替换的突变。
在任意OMT的氨基酸序列中,哪个氨基酸残基为对应于“L198”或“E199”的氨基酸残基可以通过将任意OMT的氨基酸序列和SEQ ID NO:16的氨基酸序列比对确定。比对可以通过例如使用已知的基因分析软件来进行。此类软件的具体实例可以包括由HitachiSolutions生产的DNASIS,Genetyx生产的GENETYX等(Elizabeth C.Tyler et al.,Computers and Biomedical Research,24(1)72-96,1991;Barton GJ et al.,Journal ofMolecular Biology,198(2),327-37,1987)。
例如,可以通过修饰野生型OMT基因使得由其编码的OMT具有“特定突变”来获得突变体OMT基因。待修饰的野生型OMT基因可以通过例如从具有野生型OMT基因的生物体的克隆或化学合成来获得。此外,也可以不使用野生型OMT基因而获得突变体OMT基因。例如,可以通过化学合成直接获得突变体OMT基因。获得的突变OMT基因可以原样使用,或者在使用前进一步修饰。
基因可以通过使用已知的方法进行修饰。例如,可以通过位点特异性诱变方法将目标突变引入DNA的靶位点中。位点特异性诱变方法的实例可以包括使用PCR的方法(Higuchi,R.,61,于PCR Technology,Erlich,H.A.编,Stockton Press(1989);Carter P.,Meth.In Enzymol.,154,382(1987));以及使用噬菌体的方法(Kramer,W.and Frits,H.J.,Meth.in Enzymol.,154,350(1987);Kunkel,T.A.et al.,Meth.in Enzymol.,154,367(1987))。
可以通过例如在SAM存在下将酶与底物(即原儿茶酸或原儿茶醛)温育并测量相应产物(即香草酸或香草醛)的酶和底物依赖性产生来测量间位羟基基团的甲基化活性,诸如OMT活性(WO2013/022881A1)。此外,通过在相同条件下测量相应副产物(即异香草酸或异香草醛)的产生,并将副产物的产生与产物的产生进行比较,可以确定OMT是否选择性地生成产物。
下文在“引入特定羧酸还原酶基因”中描述了羧酸还原酶(CAR)。
可以通过磷酸泛酰巯基乙胺化(phosphopantetheinylation)将CAR变为活性酶(J.Biol.Chem.,2007,Vol.282,No.1,pp.478-485)。因此,CAR活性也可以通过增加催化蛋白质的磷酸泛酰巯基乙胺化的酶(也称为“磷酸泛酰巯基乙胺基化酶”)的活性来增加。也就是说,赋予或提高目标物质生产能力的方法的实例可以包括增加磷酸泛酰巯基乙胺基化酶的活性的方法。也就是说,微生物可以以使磷酸泛酰巯基乙胺基化酶的活性得以增加的方式进行了修饰。磷酸泛酰巯基乙胺基化酶的实例可以包括磷酸泛酰巯基乙胺基转移酶(PPT)。
术语“磷酸泛酰巯基乙胺基转移酶(PPT)”可以指具有在磷酸泛酰巯基乙胺基供体存在下催化使CAR磷酸泛酰巯基乙胺化的反应的活性的蛋白质。此活性也可以称为“PPT活性”。编码PPT的基因也可以称为“PPT基因”。磷酸泛酰巯基乙胺基供体的实例可以包括辅酶A(CoA)。PPT的实例可以包括EntD蛋白,其由entD基因编码。PPT例如EntD蛋白质的实例可以包括各种生物体的那些。PPT的具体实例可以包括大肠杆菌的EntD蛋白。大肠杆菌K-12MG1655菌株的entD基因的核苷酸序列如SEQ ID NO:21所示,并且由该基因编码的EntD蛋白的氨基酸序列如SEQ ID NO:22所示。PPT的具体实例还可以包括巴西诺卡菌的PPT,皮疽诺卡菌(Nocardia farcinica)IFM10152的PPT(J.Biol.Chem.,2007,Vol.282,No.1,pp.478-485)和谷氨酸棒杆菌的PPT(App.Env.Microbiol.2009,Vol.75,No.9,p.2765-2774)。谷氨酸棒杆菌ATCC 13032菌株的PPT基因的核苷酸序列如SEQ ID NO:23所示,并且由该基因编码的PPT的氨基酸序列如SEQ ID NO:24所示。
PPT活性可以基于例如在CoA存在下与CAR温育时观察到的CAR活性的增强来测量(J.Biol.Chem.,2007,Vol.282,No.1,pp.478-485)。
此外,如上所述,苯甲醛和肉桂醛可以分别从例如苯甲酸和肉桂酸产生。也就是说,目标物质生物合成酶的实例还可以包括例如苯甲酸生物合成酶和肉桂酸生物合成酶。具体而言,肉桂酸可以通过苯丙氨酸脱氨酶(phenylalanine ammonia lyase)(PAL;EC4.3.1.24)的作用从例如L-苯丙氨酸生成。也就是说,肉桂酸生物合成酶的实例可以包括例如L-苯丙氨酸生物合成酶和PAL。L-苯丙氨酸生物合成酶的实例可以包括芳香氨基酸的常见生物合成酶,如3-脱氧-D-阿拉伯糖庚糖酮酸-7-磷酸合酶(aroF,aroG,aroH),3-脱氢奎尼酸合酶(aroB),3-脱氢奎尼酸脱水酶(aroD),莽草酸脱氢酶(aroE),莽草酸激酶(aroK,aroL),5-烯醇式丙酮基莽草酸-3-磷酸合酶(aroA)和分支酸合酶(aroC);以及分支酸变位酶(pheA),预苯酸脱水酶(pheA)和酪氨酸氨基转移酶(tyrB)。分支酸变位酶和预苯酸脱水酶可由pheA基因编码为双功能酶。
用于赋予或提高目标物质生产能力的方法的实例还可以包括提高目标物质以外物质,例如在生产目标物质期间作为中间产物生成的物质和用作目标物质前体的物质的摄取系统的活性的方法。也就是说,本发明的细菌可以以使此类摄取系统的活性得以增加的方式进行了修饰。术语“物质的摄取系统”可以指具有将来自细胞外部的物质掺入细胞的功能的蛋白质。此活性也可以称为“物质的摄取活性”。编码此类摄取系统的基因也可以称为“摄取系统基因”。此类摄取系统的实例可以包括香草酸摄取系统和原儿茶酸摄取系统。香草酸摄取系统的实例可以包括由vanK基因编码的VanK蛋白(M.T.Chaudhry,et al.,Microbiology,2007,153:857-865)。谷氨酸棒杆菌ATCC13869菌株的vanK基因(NCgl2302)的核苷酸序列如SEQ ID NO:25所示,并且由该基因编码的VanK蛋白的氨基酸序列如SEQ IDNO:26所示。原儿茶酸摄取系统基因可以包括由pcaK基因编码的PcaK蛋白(M.T.Chaudhry,et al.,Microbiology,2007,153:857-865)。谷氨酸棒杆菌ATCC13869菌株的pcaK基因(NCgl1031)的核苷酸序列如SEQ ID NO:27所示,并且由该基因编码的PcaK蛋白的氨基酸序列如SEQ ID NO:28所示。
可以根据例如已知方法(M.T.Chaudhry,et al.,Microbiology,2007.153:857-865)测量物质的摄取活性。
用于赋予或提高目标物质生产能力的方法的实例还可以包括降低参与目标物质以外的物质的副生成的酶的活性的方法。除了目标物质以外的此类物质也可以称为“副产物”。此类酶也可以称为“副产物生成酶”。具体地,副产物生成酶可以指在目标物质的生产期间参与副产物的生成的酶。副产物生成酶的实例可以包括例如参与目标物质利用的酶和催化远离目标物质的生物合成途径分支的反应以产生除目标物质之外的物质的酶。本文描述了降低蛋白质(酶等)的活性的方法。通过例如破坏编码蛋白质的基因可以降低蛋白质(酶等)的活性。例如,据报道,在棒状杆菌细菌中,香草醛按香草醛->香草酸->原儿茶酸的顺序代谢并利用(Current Microbiology,2005,Vol.51,pp.59-65)。也就是说,副产物生成酶的具体实例可以包括催化香草醛转化为原儿茶酸的酶和催化原儿茶酸进一步代谢的酶。此类酶的实例可以包括香草酸脱甲基酶,原儿茶酸3,4-双加氧酶,以及将原儿茶酸3,4-双加氧酶的反应产物进一步分解为琥珀酰-CoA和乙酰-CoA的各种酶(Appl.Microbiol.Biotechnol.,2012,Vol.95,p77-89)。此外,可以通过醇脱氢酶的作用将醛诸如香草醛转化成相应的醇,诸如香草醇(Kunjapur AM.et al.,J.Am.Chem.Soc.,2014,Vol.136,p11644-11654.;Hansen EH.et al.,App.Env.Microbiol.,2009,Vol.75,p2765-2774.)。也就是说,副产物生成酶的具体实例也可以包括醇脱氢酶(ADH)。此外,作为香草酸和香草醛生物合成途径中间体的3-脱氢莽草酸也可以通过莽草酸脱氢酶的作用转化为莽草酸。也就是说,用于香草醛生产的副产物生成酶的具体实例还可以包括莽草酸脱氢酶。
术语“香草酸脱甲基酶”可以指具有催化香草酸脱甲基化生成原儿茶酸的反应的活性的蛋白质。此活性也可以称为“香草酸脱甲基酶活性”。编码香草酸脱甲基酶的基因也可以称为“香草酸脱甲基酶基因”。香草酸脱甲基酶的实例可以包括由vanAB基因编码的VanAB蛋白(Current Microbiology,2005,Vol.51,pp.59-65)。vanA基因和vanB基因分别编码香草酸脱甲基酶的亚基A和亚基B。为了降低香草酸脱甲基酶活性,vanAB基因两者可以被破坏等,或者两者中仅一种可以被破坏等。谷氨酸棒杆菌ATCC13869菌株的vanAB基因的核苷酸序列分别如SEQ ID NO:29和31所示,并且由这些基因编码的VanAB蛋白的氨基酸序列分别如SEQ ID NO:30和6032所示。vanAB基因通常与vanK基因一起构成vanABK操纵子。因此,为了降低香草酸脱甲基酶活性,vanABK操纵子可以被完全破坏等(例如缺失)。在此类情况下,可以将vanK基因再引入宿主。例如,当使用存在于细胞外的香草酸,并且vanABK操纵子完全被破坏等(例如缺失)时,优选再引入vanK基因。
香草酸脱甲基酶活性可以通过例如将酶与底物(即香草酸)温育并测量原儿茶酸的酶和底物依赖性产生来测量(J Bacteriol,2001,Vol.183,p3276-3281)。
术语“原儿茶酸3,4-双加氧酶”可以指具有催化氧化原儿茶酸反应生成β-羧基-顺,顺-粘康酸的反应活性的蛋白质。此活性也可以称为“原儿茶酸3,4-双加氧酶活性”。编码原儿茶酸3,4-双加氧酶的基因也可以称为“原儿茶酸3,4-双加氧酶基因”。原儿茶酸3,4-双加氧酶的实例可以包括由pcaGH基因编码的PcaGH蛋白(Appl.Microbiol.Biotechnol.,2012,Vol.95,p77-89)。pcaG基因和pcaH基因分别编码原儿茶酸3,4-双加氧酶的α亚基和β亚基。为了降低原儿茶酸3,4-双加氧酶活性,pcaGH基因两者可以被破坏等,或者两者中仅一种可以被破坏等。谷氨酸棒杆菌ATCC 13032菌株的pcaGH基因的核苷酸序列分别如SEQID NO:33和35所示,并且由这些基因编码的PcaGH蛋白的氨基酸序列分别如SEQ ID NO:34和36所示。
原儿茶酸3,4-双加氧酶活性可以通过例如将酶与底物(即原儿茶酸)温育并测量酶和底物依赖性氧消耗量来测量(Meth.Enz.,1970,Vol.17A,p526-529)。
术语“醇脱氢酶(ADH)”可以指具有在电子供体存在下催化醛还原以产生醇的反应的活性的蛋白质(EC 1.1.1.1,EC 1.1.1.2,EC 1.1.1.71等)。此活性也可以称为“ADH活性”。编码ADH的基因也可以称为“ADH基因”。用作ADH底物的醛的实例可以包括在如本文所述的方法中作为目标物质示例的醛,例如芳香醛如香草醛,苯甲醛和肉桂醛。也就是说,在“ADH活性”的定义中提到的醛和醇的组合的实例可以包括芳香醛和相应的芳香醇的组合,例如香草醛和香草醇的组合,苯甲醛和苯甲醇的组合,以及肉桂醛和肉桂醇的组合。使用芳香醛,香草醛,苯甲醛或肉桂醛的ADH也可以分别称为“芳香醇脱氢酶”,“香草醇脱氢酶”,“苯甲醇脱氢酶”或“肉桂醇脱氢酶”。此外,将芳香醛,香草醛,苯甲醛或肉桂醛用作底物的ADH活性也可以称为“芳香醇脱氢酶活性”,“香草醇脱氢酶活性”,“苯甲醇脱氢酶活性”或“肉桂醇脱氢酶活性”。ADH可以使用一种醇,或者可以使用两种或更多种醇。电子供体的实例可以包括NADH和NADPH。
ADH的实例可以包括分别由yqhD基因,NCgl0324基因,NCgl0313基因,NCgl2709基因,NCgl0219基因和NCgl2382基因编码的YqhD蛋白,NCgl0324蛋白质,NCgl0313蛋白质,NCgl2709蛋白质,NCgl0219蛋白质和NCgl2382蛋白质。yqhD基因可以在例如属于肠杆菌科的细菌,诸如大肠杆菌中找到。NCgl0324基因,NCgl0313基因,NCgl2709基因,NCgl0219基因和NCgl2382基因可以例如在棒状杆菌细菌例如谷氨酸棒杆菌中找到。大肠杆菌K-12MG1655菌株的yqhD基因的核苷酸序列如SEQ ID NO:37所示,并且由此基因编码的YqhD蛋白的氨基酸序列以SEQ ID NO:38所示。谷氨酸棒杆菌ATCC13869菌株的NCgl0324基因,NCgl0313基因和NCgl2709基因的核苷酸序列分别如SEQ ID NO:39,41和43所示,并且由这些基因编码的蛋白质的氨基酸序列分别如SEQ ID NO:40,42和44所示。谷氨酸棒杆菌ATCC 13032菌株的NCgl0219基因和NCgl2382基因的核苷酸序列分别如SEQ ID NO:45和47所示,并且由这些基因编码的蛋白质的氨基酸序列如SEQ ID NO:46和48所示。
可以降低一种ADH的活性,或者可以降低两种或更多种ADH的活性。例如,可以降低诸如NCgl0324蛋白质,NCgl2709蛋白质和NCgl0313蛋白质的一种或多种ADH,例如,所有ADH的活性。还可以至少降低NCgl0324蛋白和NCgl2709蛋白中任一个或两者的活性。也就是说,例如,可以降低至少NCgl1024蛋白质的活性,并且可以进一步降低NCgl2709蛋白质的活性。或者,可以降低至少NCgl2709蛋白的活性,并且可以进一步降低NCgl0324蛋白的活性。ADH与目标物质的组合没有特别限制,只要棒状杆菌细菌中ADH活性的降低提高了目标物质的产量即可。例如,可以降低ADH的活性,其至少使用要生产的醛作为目标物质。也就是说,可以降低诸如香草醇脱氢酶,苯甲醇脱氢酶和肉桂醇脱氢酶等芳香醇脱氢酶的活性,分别用于生产芳香醛,如香草醛,苯甲醛和肉桂醛。具体而言,例如,当生产芳草醛时,可以降低YqhD蛋白的活性。此外,具体而言,例如,当生产香草醛时,可以降低NCgl0324蛋白和NCgl0313蛋白中任一种或两者的活性,或可以降低至少NCgl0324蛋白的活性。此外,具体而言,当产生苯甲醛时,可以降低NCgl0324蛋白和NCgl2709蛋白中的任一种或两者的活性。另外,具体而言,当生产肉桂酸时,可以降低NCgl0324蛋白和NCgl2709蛋白中任一种或两者的活性。YqhD蛋白可以具有香草醇脱氢酶活性。NCgl0324蛋白可具有香草醇脱氢酶活性,苯甲醇脱氢酶活性和肉桂醇脱氢酶活性的全部。NCgl2709蛋白可以具有苯甲醇脱氢酶活性和肉桂醇脱氢酶活性两者。
ADH活性可以通过例如在NADPH或NADH存在下将酶与底物(即醛如香草醛)一起温育,并测量NADPH或NADH的酶和底物依赖性氧化来测量。在至少一种合适的条件下,例如在适当的电子供体如NADPH或NADH存在下检测ADH活性是足够的。
术语“莽草酸脱氢酶”可以指具有催化在电子供体存在下还原3-脱氢莽草酸以产生莽草酸的反应的活性的蛋白质(EC 1.1.1.25)。该活性也可称为“莽草酸脱氢酶活性”。编码莽草酸脱氢酶的基因也可称为“莽草酸脱氢酶基因”。电子供体的实例可包括NADH和NADPH。莽草酸脱氢酶的实例可包括AroE蛋白,其由aroE基因编码。大肠杆菌K-12MG1655菌株的aroE基因的核苷酸序列如SEQ ID NO:49所示,并且由该基因编码的AroE蛋白的氨基酸序列如SEQ ID NO:50所示。
莽草酸脱氢酶活性可以通过例如在NADPH或NADH存在下将酶与底物(即3-脱氢莽草酸)一起温育,并测量NADPH或NADH的酶和底物依赖性氧化来测量。
具有经修饰的活性的蛋白质可以根据产生目标物质的生物合成途径的类型以及微生物固有拥有的蛋白质的类型和活性来适当选择。例如,当通过生物转化方法从原儿茶酸生产香草醛时,可优选增加一种或多种蛋白质如OMT,CAR,PPT和原儿茶酸摄取系统的活性。此外,当通过生物转化方法由香草酸生产香草醛时,可以优选增强一种或多种蛋白质如CAR,PPT和香草酸摄取系统的活性。如本文所述的微生物已经经过修饰而具有特定的CAR基因,因此可以增强至少CAR活性。
用于育种出具有目标物质生产能力的微生物的基因和蛋白质可以分别具有例如上面列举的或其他已知的核苷酸序列和氨基酸序列。此外,用于育种出具有目标物质生产能力的微生物的基因和蛋白质可以是上面例示的基因和蛋白质的保守变体,例如分别具有上述例示或其他已知核苷酸序列和氨基酸序列的基因和蛋白质。具体地,例如,用于育种出具有目标物质生产能力的微生物的基因可以各自是编码蛋白质的基因,所述蛋白质具有上述例示的氨基酸序列或已知蛋白质的氨基酸序列但包含一个或几个位置处一个或几个氨基酸残基的取代、缺失、插入或添加,只要保持其原始功能,即酶活性,转运蛋白活性等即可。对于基因和蛋白质的保守变体,可以在必要修改后应用后面描述的关于CAR基因和CAR的保守变体的描述。
<1-2>引入特定的羧酸还原酶基因
如本文所述的微生物已经经修饰而具有特定的羧酸还原酶(CAR)基因。具有CAR基因的微生物也可称为“具有CAR的微生物”。通过修饰微生物而具有特定的CAR基因,可以改善微生物的目标物质生产能力,也就是说,可以增加通过使用微生物生产目标物质。也就是说,与未修饰的菌株相比,对于所述微生物可以获得改善的目标物质生产能力和增加的目标物质的生成。目标物质生成的增加可以是目标物质的生成的绝对程度,如绝对量和绝对产率的增加,或者可以相对于副产品以目标物质的生成的相对程度计,如相对量和相对产率。副产物的实例可以包括例如对于香草醛生产的原儿茶醛和异香草醛。在纯化过程中可能难以将醛如香草醛与另一种醛如原儿茶醛和异香草醛分离。因此,目标物质诸如香草醛的生成的增加可以导致例如纯化成本的降低。
可以通过将具有目标物质生产能力的微生物修饰为具有特定的CAR基因来获得微生物。也可以通过将微生物修饰为具有特定的CAR基因,然后赋予微生物以目标物质生产能力或增强微生物的目标物质生产能力来获得微生物。另外,微生物可以是由于使微生物具有特定CAR基因的修饰,或者由于使微生物具有特定CAR基因的修饰和其他用于赋予或增强目标物质生产能力的修饰的组合而获得目标物质生产能力的微生物。构建微生物的修饰可以以任意顺序进行。
术语“醛氧化还原酶(羧酸还原酶;CAR)”可以指具有催化在电子供体和ATP存在下还原羧酸以产生相应的醛的反应的活性的蛋白质(EC 1.2.99.6等)。此活性也可以称为“CAR活性”。编码CAR的基因也可称为“CAR基因”。采用下述的CAR,其至少使用对应于作为如本文所述的方法中的目标物质生产的醛的羧酸。也就是说,作为CAR产物产生的醛的实例可包括在如本文所述的方法中作为目标物质例示的醛,例如芳香醛,如香草醛、苯甲醛和肉桂醛。也就是说,“CAR活性”定义中提到的羧酸和醛的组合的实例可以包括芳族羧酸和相应的芳族醛的组合,例如香草酸和香草醛的组合,苯甲酸和苯甲醛的组合以及肉桂酸和肉桂醛的组合。换言之,例如,用于香草醛生产的CAR的术语“CAR活性”可以指催化将香草酸还原以产生香草醛的反应的活性。使用芳族羧酸的CAR也可称为“芳族醛氧化还原酶(芳族羧酸还原酶;ACAR)”。此外,其中的芳族羧酸用作底物的CAR活性也可称为“ACAR活性”。特定的CAR可以具有ACAR活性。CAR可以使用一种羧酸,或者可以使用两种以上的羧酸。电子供体的实例可以包括NADH和NADPH。
CAR也可以催化在电子供体和ATP的存在下还原原儿茶酸和/或异香草酸以产生原儿茶醛和/或异香草醛的反应。CAR可以选择性催化香草醛的产生。表述“选择性催化香草醛的产生”可以意味着当允许CAR作用于香草酸时CAR产生香草醛,其中例如按摩尔比计,香草醛的产生量是在除使用原儿茶酸作为底物以外与香草醛生成在相同条件下产生的原儿茶醛的量和除使用异香草酸作为底物以外与香草醛生成在相同条件下产生的异香草醛的量的每种或任一种的1.1倍以上、1.2倍以上、1.5倍以上、2倍以上、3倍以上、4倍以上、5倍以上、10倍以上、15倍以上、20倍以上、25倍以上、或30倍以上。
CAR活性可以通过例如在ATP和NADPH存在下将酶与底物(例如香草酸)一起温育,并测量NADPH的酶和底物依赖性氧化来测量(J.Biol.Chem.,2007,Vol.282,No.1,pp.478-485中描述的方法的修改)。此外,通过在除使用原儿茶酸或异香草酸作为底物以外在相同条件下测量原儿茶醛或异香草醛的产生,并将原儿茶醛或异香草醛的产生与香草醛的产生进行比较,可以确定CAR是否选择性催化香草醛的生产。特定CAR具有在至少一种合适的条件下测量的CAR活性是足够的。顺便提及,本申请中提及的所有其他蛋白质具有各自在至少一种合适的条件下测量的相应活性也是足够的。
术语“特定的CAR基因”可以指编码特定CAR的基因。特定CAR基因的实例可以包括戈登氏菌CAR基因、新鞘氨醇杆菌CAR基因和胶球藻CAR基因。特定的CAR的实例可以包括戈登氏菌CAR、新鞘氨醇杆菌CAR和胶球藻CAR。术语“戈登氏菌CAR基因”可以指编码戈登氏菌CAR的基因。术语“戈登氏菌CAR”可以共同指在戈登氏菌细菌中发现的CAR及特定范围内的其变异,例如保守变体。术语“新鞘氨醇杆菌CAR基因”可以指编码新鞘氨醇杆菌CAR的基因。术语“新鞘氨醇杆菌CAR”可以共同指在新鞘氨醇杆菌细菌中发现的CAR及特定范围内的其变异,例如保守变体。术语“胶球藻CAR基因”可以指编码胶球藻CAR的基因。术语“胶球藻CAR”可以共同指在胶球藻藻类中发现的CAR及特定范围内的其变异,例如保守变体。
戈登氏菌细菌的实例可包括Gordonia effusa。也就是说,戈登氏菌CAR基因和戈登氏菌CAR的实例可以分别包括Gordonia effusa的CAR基因和CAR。Gordonia effusa的CAR基因的核苷酸序列如SEQ ID NO:17所示,并且由该基因编码的CAR的氨基酸序列如SEQ IDNO:18所示。新鞘氨醇杆菌细菌的实例可以包括马来西亚新鞘氨醇杆菌(Novosphingobiummalaysiense)。也就是说,新鞘氨醇杆菌CAR基因和新鞘氨醇杆菌CAR的实例可以分别包括马来西亚新鞘氨醇杆菌的CAR基因和CAR。马来西亚新鞘氨醇杆菌的CAR基因的核苷酸序列如SEQ ID NO:78所示,并且由该基因编码的CAR的氨基酸序列如SEQ ID NO:79所示。胶球藻藻类的实例可以包括Coccomyxa subellipsoidea。也就是说,胶球藻CAR基因和胶球藻CAR的实例可分别包括Coccomyxa subellipsoidea的CAR基因和CAR。Coccomyxasubellipsoidea C-169的CAR基因(cDNA)的核苷酸序列如SEQ ID NO:82所示,并且由该基因编码的CAR的氨基酸序列如SEQ ID NO:83所示。也就是说,特定的CAR基因可以是例如具有SEQ ID NO:17、38或82所示的核苷酸序列的基因。此外,特定的CAR可以是例如具有SEQID NO:18、79或83所示的氨基酸序列的蛋白质。除非另有说明,表述“基因或蛋白质具有核苷酸或氨基酸序列”可以表示基因或蛋白质包括核苷酸或氨基酸序列,并且还可以包括基因或蛋白质仅包含核苷酸或氨基酸序列的情况。
特定的CAR基因可以是上面例示的任何CAR基因(例如,具有SEQ ID NO:17、38或82所示的核苷酸序列的基因)的变体,只要其原始功能得以保持即可。类似地,特定的CAR可以是上文例示的任何CAR(例如,具有SEQ ID NO:17、38或82所示的核苷酸序列的基因)的变体,只要其原始功能得以保持即可。保持其原始功能的变体也可以称为“保守变体”。也就是说,特定CAR基因和特定CAR的实例还可以包括此类保守变体。在戈登氏菌细菌、新鞘氨醇杆菌细菌或胶球藻藻类中可以找到或可以找不到此类保守变体。保守变体的实例可以包括例如上文例示的基因和蛋白质的同源物和人工修饰形式。
表述“保持原始功能”可以指基因或蛋白质的变体具有对应于原始基因或蛋白质的功能(例如活性或性质)的功能(例如活性或性质)。就基因而言表述“保持原始功能”可以指该基因的变体编码保持原始功能的蛋白质。也就是说,就CAR基因而言表述“保持原始功能”可以意味着基因的变体编码CAR。就CAR而言表述“保持原始功能”可以意味着蛋白质的变体具有CAR活性。
以下将解释保守变体的实例。
特定CAR基因的同源物或特定CAR的同源物可以使用上述例示的CAR基因的任何核苷酸序列或上文例示的任何CAR氨基酸序列作为查询序列通过例如BLAST搜索或FASTA搜索从公共数据库容易地获得。此外,特定CAR基因的同源物可以通过例如使用戈登氏菌细菌、新鞘氨醇杆菌细菌或胶球藻藻类等生物体的染色体作为模板和基于上述例示的CAR基因的任何核苷酸序列的核苷酸序列制备的寡核苷酸作为引物的PCR获得。
特定CAR基因可以是编码蛋白质的基因,所述蛋白质具有任何上述氨基酸序列(例如以SEQ ID NO:18、79或83所示的氨基酸序列),且包括在一个或几个位置处一个或几个氨基酸残基的取代,缺失,插入和/或添加,只要保持原始功能即可。例如,编码的蛋白质可以具有延伸的或缺失的N端和/或C端。尽管以上使用的术语“一个或几个”所表示的数目可以随蛋白质的三维结构中的氨基酸残基的位置或氨基酸残基的类型而不同,具体而言,它例如为1至50,1至40,1至30,1至20,1至10,1至5,或1至3。
一个或几个氨基酸残基的上述取代,缺失,插入和/或添加各自是保持蛋白质原始功能的保守突变。保守突变的典型实例是保守取代。若取代位点是芳香氨基酸,则保守取代是其中取代在Phe,Trp和Tyr之间相互发生的突变;若它是疏水性氨基酸,则保守取代是取代在Leu,Ile和Val之间相互发生的突变;若它是极性氨基酸;则保守取代是取代在Gln和Asn之间相互发生的突变;若它是碱性氨基酸,则保守取代是取代在Lys,Arg和His之间相互发生的突变;若它是酸性氨基酸,则保守取代是取代在Asp和Glu之间相互发生的突变;以及若它是具有羟基的氨基酸,则保守取代是取代在Ser和Thr之间相互发生的突变。认为是保守取代的取代的实例可以具体包括用Ser或Thr取代Ala,用Gln,His,或Lys取代Arg,用Glu,Gln,Lys,His,或Asp取代Asn,用Asn,Glu,或Gln取代Asp,用Ser或Ala取代Cys,用Asn,Glu,Lys,His,Asp,或Arg取代Gln,用Gly,Asn,Gln,Lys,或Asp取代Glu,用Pro取代Gly,用Asn,Lys,Gln,Arg,或Tyr取代His,用Leu,Met,Val,或Phe取代Ile,用Ile,Met,Val,或用Phe取代Leu,用Asn,Glu,Gln,His,或Arg取代Lys,用Ile,Leu,Val,或Phe取代Met,用Trp,Tyr,Met,Ile,或Leu取代Phe,用Thr或Ala取代Ser,用Ser或Ala取代Thr,用Phe或Tyr取代Trp,用His,Phe,或Trp取代Tyr,以及用Met,Ile,或Leu取代Val。此外,如上所述的氨基酸残基的此类取代,缺失,插入,添加等可以包括由于个体差异引起的天然存在的突变或者该基因来源的生物体的物种的差异(突变体或变体)。
此外,特定的CAR基因可以是编码与上述任何氨基酸序列的总氨基酸序列具有例如50%或更多,65%或更多,80%或更多,90%或更多,95%或更多,97%或更多,或99%或更多的同源性的氨基酸序列的蛋白质的基因,只要保持原始功能。另外,在本说明书中,“同源性”是指“同一性”。
此外,特定的CAR基因可以是能够在严格条件下与可以从任何前述核苷酸序列(例如以SEQ ID NO:17、78或82所示的核苷酸序列)制备的探针,例如与任何上述核苷酸序列的全部序列或部分序列互补的序列杂交的基因(例如DNA),只要保持原始功能。“严格条件”可以指形成所谓特异性杂合物,并且不形成非特异性杂合物的条件。严格条件的实例可以包括高度同源的DNA彼此杂交(例如,不小于50%,65%,80%,90%,95%,97%或99%同源的DNA彼此杂交,并且同源性小于上述项的DNA不彼此杂交)的那些条件,或典型的Southern杂交的清洗条件,即在与1x SSC,0.1%SDS于60℃;0.1x SSC,0.1%SDS于60℃;或者0.1xSSC,0.1%SDS于68℃对应的盐浓度和温度清洗1次,或2或3次的条件。
用于上述杂交的探针可以是与如上述的基因互补的序列的一部分。此类探针可以使用基于已知基因序列制备的寡核苷酸作为引物和含有任何上述基因的DNA片段作为模板通过PCR制备。作为探针,例如可以使用长度约300bp的DNA片段。当使用长度为约300bp的DNA片段作为探针时,具体地,杂交的清洗条件可以是例如50℃,2xSSC和0.1%SDS。
此外,由于关于密码子简并性的性质随宿主而变化,特定CAR基因可以包括相应等同密码子对任意密码子的替换。也就是说,由于遗传密码的简并性,特定CAR可以是以上例示的任何CAR基因的变体。例如,特定CAR基因可以以使其根据待使用的宿主中的密码子频率而具有最佳密码子的方式进行了修饰的基因。经密码子优化的特定CAR基因的实例可以包括例如具有SEQ ID NO:77、81或85所示的核苷酸序列的CAR基因,其已经针对大肠杆菌的密码子选择进行了密码子优化。
例如,可以通过使用数学算法来确定两个序列之间的序列同一性的百分比。此类数学算法的非限制性实例可以包括Myers and Miller(1988)CABIOS 4:11-17的算法、Smith et al(1981)Adv.Appl.Math.2:482的局部同源性算法、Needleman and Wunsch(1970)J.Mol.Biol.48:443-453的同源性比对算法、Pearson and Lipman(1988)Proc.Natl.Acad.Sci.85:2444-2448的同源性筛选方法和Karlin and Altschul(1990)Proc.Natl.Acad.Sci.USA 87:2264的算法的修改形式,诸如记载于Karlin and Altschul(1993)Proc.Natl.Acad.Sci.USA 90:5873-5877的。
通过使用基于此类数学算法的程序,可以进行用于确定序列同一性的序列比较(即比对)。该程序可以由计算机适当地执行。此类程序的实例可以包括但不限于PC/Gene程序的CLUSTAL(可从Intelligenetics,Mountain View,Calif.获得),ALIGN程序(版本2.0)以及Wisconsin Genetics Software Package,版本8(可从Genetics Computer Group(GCG),575Science Drive,Madison,Wis.,USA获得)的GAP,BESTFIT,BLAST,FASTA和TFASTA。使用这些程序的比对可以通过使用例如初始参数来进行。CLUSTAL程序充分记载于Higgins et al.(1988)Gene 73:237-244(1988),Higgins et al.(1989)CABIOS 5:151-153,Corpet et al.(1988)Nucleic Acids Res.16:10881-90,Huang et al.(1992)CABIOS8:155-65,以及Pearson et al.(1994)Meth.Mol.Biol.24:307-331。
为了获得与靶核苷酸序列同源的核苷酸序列,具体而言,例如,可以通过使用BLASTN程序以100的得分和12的字长来进行BLAST核苷酸搜索。为了获得与靶蛋白质同源的氨基酸序列,特别地,例如可以通过以50的得分和3的字长使用BLASTX程序进行BLAST蛋白质搜索。关于BLAST核苷酸搜索和BLAST蛋白质搜索,参见www.ncbi.nlm.nih.gov。另外,为了比较目的,可以使用Gapped BLAST(BLAST 2.0)以获得包含缺口的比对。另外,可以使用PSI-BLAST来进行重复搜索以检测序列之间的远距离关系。关于Gapped BLAST和PSI-BLAST,参见Altschul et al.(1997)Nucleic Acids Res.25:3389。当使用BLAST、GappedBLAST或PSI-BLAST时,可以使用每个程序的初始参数(例如核苷酸序列的BLASTN和氨基酸序列的BLASTX)。比对也可以手动进行。
两个序列之间的序列同一性计算为在比对两个序列以便彼此最大限度配合时两个序列中匹配的残基的比率。
前述关于基因和蛋白质的保守变体的描述可以在必要修改后应用于任意蛋白质的变体,例如目标物质生物合成酶和编码它们的基因。
可以通过将基因引入微生物中将微生物修饰为具有特定的CAR基因。
将特定CAR基因引入微生物的方法没有特别限制。微生物可操作含有特定的CAR基因是足够的。微生物可以具有特定CAR基因的一个拷贝,或者可以具有特定CAR基因的两个或更多个拷贝。微生物可以具有一种特定的CAR基因,或者可以具有两种或更多种特定的CAR基因。可以通过与下文在“增加蛋白质活性的方法”中描述的基因引入的方式相同的方式将特定的CAR基因引入微生物中。
微生物可以具有或可以没有除特定CAR基因以外的CAR基因。
<1-3>增加蛋白质活性的方法
以下,将描述用于增加蛋白质活性的方法,包括引入基因的方法。
表述“蛋白质的活性得以增加”可以指与非修饰菌株相比,蛋白质的活性增加。具体而言,表述“蛋白质的活性得以增加”可以意味着与非修饰菌株相比,每细胞的蛋白质的活性增加。术语“非修饰菌株”可以指尚未以增加目标蛋白质活性的方式进行修饰的对照菌株。非修饰菌株的实例可以包括野生型菌株和亲本菌株。非修饰菌株的具体实例可以包括微生物物种的相应类型菌株。非修饰菌株的具体实例还可以包括以上关于微生物描述所例示的菌株。也就是说,在一个实施方案中,与类型菌株,即微生物所属的物种的类型菌株相比,蛋白质的活性可以得以增加。在另一个实施方案中,与谷氨酸棒杆菌ATCC13869菌株相比,蛋白质的活性也可以得以增加。在另一个实施方案中,与谷氨酸棒杆菌ATCC13032菌株相比,蛋白质的活性也可以得以增加。在另一个实施方案中,与大肠杆菌K-12MG1655菌株相比,蛋白质的活性也可以得以增加。“蛋白质活性得以增加”的状态也可以表达为“蛋白质的活性得以增强”。更具体地说,表述“蛋白质的活性得以增加”可以意味着与非修饰菌株相比每细胞的蛋白质的分子数目增加,和/或蛋白质的每个分子的功能增加。也就是说,表述“蛋白质活性得以增加”中的术语“活性”不限于蛋白质的催化活性,而且还可以指编码蛋白质的基因的转录量(即mRNA的量),或蛋白质的翻译量(即蛋白质的量)。此外,“蛋白质的活性得以增加”的状态不仅包括目标蛋白质的活性在固有具有目标蛋白质活性的菌株中增加的状态,而且还包括将目标蛋白质的活性赋予不固有地具有目标蛋白质活性的菌株的状态。此外,只要蛋白质的活性最终得以增加,宿主中固有地包含的目标蛋白质的活性可以减弱和/或消除,然后可以将适当类型的目标蛋白质赋予宿主。
蛋白质活性增加的程度不受特别限制,只要蛋白质的活性与非修饰菌株相比增加即可。蛋白质的活性可以增加至例如非修饰菌株的蛋白质活性的1.2倍以上,1.5倍以上,2倍以上,或3倍以上。此外,当非修饰菌株不具有目标蛋白质的活性时,足够的是由于引入编码蛋白质的基因而产生蛋白质,并且例如,蛋白质可以以使其活性可以得到测量的程度生产。
提高蛋白质活性的修饰可以通过例如增加编码该蛋白质的基因的表达来实现。表述“基因的表达得以增加”意指与非修饰菌株如野生型菌株和亲本菌株相比,基因的表达得以增加。具体而言,表述“基因表达得以增加”可以意味着每个细胞的基因表达量与非修饰菌株相比得以增加。更具体地,表述“基因表达得以增加”可以意味着基因的转录量(即mRNA的量)得以增加,和/或基因的翻译量(即从基因表达的蛋白质量)得以增加。“基因表达得以增加”的状态也称为“基因表达得以增强”。基因的表达可以增加至例如非修饰菌株的表达的1.2倍以上,1.5倍以上,2倍以上,或3倍以上。此外,“基因表达得以增加”的状态不仅可以包括目标基因的表达量在固有表达目标基因的菌株中得以增加的状态,而且还包括将基因引入到不固有地表达目标基因并在其中表达的菌株中的状态。也就是说,短语“基因表达得以增加”也可以意指例如,将目标基因引入不拥有该基因的菌株中并在其中表达。
例如,可以通过增加基因的拷贝数来增加基因的表达。
可以通过将基因引入宿主的染色体来增加基因的拷贝数。例如可以通过使用同源重组(Miller,J.H.,Experiments in Molecular Genetics,1972,Cold Spring HarborLaboratory)将基因引入染色体。使用同源重组的基因转移方法的实例可以包括使用线性DNA的方法,诸如Red驱动的整合(Datsenko,K.A.,and Wanner,B.L.,Proc.Natl.Acad.Sci.USA,97:6640-6645(2000)),使用含有温度敏感性复制起点的质粒的方法,使用能够接合转移的质粒的方法,使用不具有在宿主中起作用的复制起点的自杀载体的方法,使用噬菌体的转导方法。可以引入基因的仅一个拷贝或两个或更多个拷贝。例如,通过使用以染色体上的多个拷贝存在的序列作为靶标进行同源重组,可以将多个拷贝的基因引入染色体。以多个拷贝存在于染色体上的此类序列的实例可以包括重复DNA和位于转座子两端的反向重复序列。或者,可以通过使用染色体上的适当序列,如对于产生目标物质不必要的基因作为靶标进行同源重组。另外,也可以用转座子或Mini-Mu(日本专利公开(Kokai)No.2-109985,美国专利No.5,882,888,EP 805867B1)将基因随机引入染色体。
可以通过使用具有与全部基因或其一部分互补的序列的探针进行Southern杂交、使用基于该基因序列制备的引物的PCR等确认靶基因对染色体的引入。
此外,通过将含有该基因的载体引入宿主中,也可以增加基因的拷贝数。例如,通过将含有靶基因的DNA片段与在宿主中起作用的载体连接以构建该基因的表达载体,并用该表达载体转化宿主,可以增加靶基因的拷贝数。可以通过例如使用具有靶基因的微生物的基因组DNA作为模板的PCR获得含有靶基因的DNA片段。作为载体,可以使用宿主细胞中可自主复制的载体。该载体可以是多拷贝载体。此外,载体优选具有用于选择转化体的标志物如抗生素抗性基因。此外,载体可以具有用于表达引入的基因的启动子和/或终止子。载体可以是例如源自细菌质粒的载体,源自酵母质粒的载体,源自噬菌体的载体,粘粒,噬菌粒等。可在肠杆菌科细菌诸如大肠杆菌中自主复制的载体的具体实例可以包括例如pUC19,pUC18,pHSG299,pHSG399,pHSG398,pBR322,pSTV29(所有这些可购自Takara Bio),pACYC184,pMW219(NIPPON GENE),pTrc99A(Pharmacia),pPROK系列载体(Clontech),pKK233-2(Clontech),pET系列载体(Novagen),pQE系列载体(QIAGEN),pCold TF DNA(Takara Bio),pACYC系列载体,和宽宿主范围的载体RSF1010。可在棒状杆菌细菌中自主复制的载体的具体实例可以包括例如pHM1519(Agric.Biol.Chem.,48,2901-2903(1984));pAM330(Agric.Biol.Chem.,48,2901-2903(1984));通过改善这些质粒获得并具有药物抗性基因的质粒;日本专利公开(Kokai)No.3-210184中描述的质粒pCRY30;日本专利公开(Kokai)No.2-72876和美国专利No.5,185,262中描述的质粒pCRY21,pCRY2KE,pCRY2KX,pCRY31,pCRY3KE和pCRY3KX;日本专利公开(Kokai)No.1-191686中描述的质粒pCRY2和pCRY3;日本专利公开(Kokai)No.58-192900中描述的pAJ655,pAJ611和pAJ1844;日本专利公开(Kokai)No.57-134500中描述的pCG1;日本专利公开(Kokai)No.58-35197中描述的pCG2;日本专利公开(Kokai)No.57-183799中描述的pCG4和pCG11;日本专利公开(Kokai)No.10-215883中描述的pVK7;WO2007/046389中描述的pVK9;WO2013/069634中描述的pVS7;和日本专利公开(Kokai)No.9-070291中描述的pVC7。
当引入基因时,宿主可表达地含有基因是足够的。具体而言,宿主含有基因以便其在宿主中起作用的启动子的控制下表达是足够的。术语“在宿主中起作用的启动子”可以指在宿主中显示启动子活性的启动子。启动子可以是源自宿主的启动子或异源启动子。启动子可以是待引入基因的天然启动子或另一基因的启动子。作为启动子,例如也可以使用如后述的更强的启动子。
终止基因转录的终止子可以位于基因的下游。终止子没有特别限制,只要其在宿主中起作用。终止子可以是源自宿主的终止子或异源终止子。终止子可以是待引入基因的天然终止子或另一基因的终止子。终止子的具体实例可以包括例如T7终止子、T4终止子、fd噬菌体终止子、tet终止子和trpA终止子。
在“Fundamental Microbiology Vol.8,Genetic Engineering,KYORITSUSHUPPAN CO.,LTD,1987”中详细公开了可用于各种微生物中的载体,启动子和终止子,并且可以使用那些。
此外,当引入两个或更多个基因时,基因各自由宿主可操作含有是足够的。例如,所有基因可以由单个表达载体或染色体携带。此外,基因可以分别由两个或更多个表达载体携带,或者分开由单一或两个或更多个表达载体和染色体携带。也可以引入由两个或更多个基因构成的操纵子。“引入两个或更多个基因”的情况可以包括例如引入编码两种或更多种蛋白质(酶等)的相应基因的情况,引入编码构成单一蛋白质复合物(例如酶复合物)的两种或更多种亚基的相应基因的情况以及上述情况的组合。
待引入的基因没有特别限制,只要它编码能够在宿主中起作用的蛋白即可。待引入的基因可以是源自宿主的基因,或者可以是异源基因。可以例如使用基于该基因的核苷酸序列设计的引物,并使用具有该基因的生物体的基因组DNA,携带该基因的质粒等作为模板通过PCR获得待引入的基因。待引入的基因也可以完全合成,例如基于该基因的核苷酸序列(Gene,60(1),115-127(1987))。获得的基因可以原样使用,或者根据需要在修饰后使用。也就是说,可以通过修饰基因来获得基因的变体。基因可以通过已知技术进行修饰。例如,可以通过位点特异性突变方法将目标突变引入DNA的目标位点。也就是说,可以通过位点特异性突变方法修饰基因的编码区,使得编码蛋白的特定位点包括氨基酸残基的取代,缺失,插入和/或添加。位点特异性突变方法的实例可以包括利用PCR的方法(Higuchi,R.,61,于PCR Technology,Erlich,H.A.Eds.,Stockton Press(1989);Carter,P.,Meth.inEnzymol.,154,382(1987))和利用噬菌体的方法(Kramer,W.and Frits,H.J.,Meth.于Enzymol.,154,350(1987);Kunkel,T.A.et al.,Meth.in Enzymol.,154,367(1987))。或者,可以完全合成基因的变体。
另外,当蛋白质作为具有多个亚基的复合物起作用时,可以修饰多个亚基的部分或全部,只要蛋白质的活性最终得以增加。也就是说,例如,当通过增加基因的表达来增加蛋白质的活性时,可以增强编码亚基的多个基因的部分或全部的表达。通常优选增强编码亚基的多个基因全部的表达。此外,构成该复合物的亚基可以源自单一种类的生物体或两种或更多种生物体,只要该复合物具有目标蛋白质的功能即可。也就是说,例如,可以将编码多个亚基的相同生物体的基因引入宿主,或者可以将编码多个亚基的不同生物体的基因引入宿主中。
此外,可以通过改善基因的转录效率增加基因的表达。另外,通过提高基因的翻译效率也可以增加基因的表达。基因的转录效率和基因的翻译效率可以通过例如修饰基因的表达控制序列来改善。术语“表达控制序列”可以共同指影响基因表达的位点。表达控制序列的实例可以包括例如启动子,Shine-Dalgarno(SD)序列(也称为核糖体结合位点(RBS))和RBS与起始密码子之间的间隔物区。可以通过使用启动子搜索载体或基因分析软件如GENETYX来鉴定表达控制序列。这些表达调控序列可以通过例如使用温度敏感性载体的方法或Red驱动整合方法(WO2005/010175)进行修饰。
通过例如用更强的启动子替换染色体上的基因的启动子可以提高基因的转录效率。术语“更强的启动子”可以指与基因的固有存在的野生型启动子相比提供改善的基因转录的启动子。更强的启动子的实例可以包括例如已知的高表达启动子,诸如T7启动子、trp启动子、lac启动子、thr启动子、tac启动子、trc启动子、tet启动子、araBAD启动子、rpoH启动子、msrA启动子、Pm1启动子(源自双歧杆菌属(Bifidobacterium))、PR启动子和PL启动子。在棒状杆菌细菌中起作用的更强启动子的实例可以包括例如在棒状杆菌细菌中用乙酸、乙醇、丙酮酸等可诱导的人工修饰的P54-6启动子(Appl.Microbiol.Biotechnol.,53,674-679(2000)),pta,aceA,aceB,adh,和amyE启动子,以及cspB,SOD和tuf(EF-Tu)启动子,它们是能够在棒状杆菌细菌中提供大表达量的有力启动子(Journal of Biotechnology,104(2003)311-323;Appl.Environ.Microbiol.,2005Dec;71(12):8587-96)以及lac启动子,tac启动子和trc启动子。此外,作为更强的启动子,通过使用各种报道基因也可以获得高活性类型的固有启动子。例如,通过使启动子区中的-35和-10区更接近共有序列,可以增强启动子的活性(WO00/18935)。高活性型启动子的实例可以包括各种tac样启动子(Katashkina JI et al.,Russian Federation Patent Application No.2006134574)。在Goldstein et al.(Prokaryotic Promoters in Biotechnology,Biotechnol.Annu.Rev.,1,105-128(1995))的论文等中描述了评估启动子强度的方法和强启动子的实例。
例如,通过用更强的SD序列替换染色体上的基因的Shine-Dalgarno(SD)序列(也称为核糖体结合位点(RBS)),可以改善基因的翻译效率。“更强的SD序列”可以指与基因固有的野生型SD序列相比提供改善的mRNA翻译的SD序列。更强的SD序列的实例可以包括例如源自噬菌体T7的基因10的RBS(Olins P.O.et al,Gene,1988,73,227-235)。此外,已知在RBS和起始密码子之间的间隔物区中,特别是在紧邻起始密码子上游的序列(5'-UTR)中,几个核苷酸的取代,插入或缺失显著影响mRNA的稳定性和翻译效率,因此,通过修饰它们也可以改善基因的翻译效率。
基因的翻译效率也可以通过例如修饰密码子来改善。例如,通过用更频繁使用的同义密码子取代基因中存在的稀有密码子,可以提高基因的翻译效率。也就是说,例如,基因可以以使该基因含有根据在待使用的宿主中观察到的密码子频率的最佳密码子的方式进行了修饰。例如,可以通过位点特异性突变方法替换密码子。或者,可以完全合成替换目标密码子的基因片段。“密码子选择数据库”(www.kazusa.or.jp/codon;Nakamura,Y.etal,Nucl.Acids Res.,28,292(2000))中公开了各种生物体中的密码子的频率。
此外,基因的表达还可以通过扩增增加基因表达的调节子或缺失或减弱减少基因表达的调节子来增加。
可以独立使用或以任意组合使用如上所述用于增加基因表达的此类方法。
此外,也可以通过例如增强酶的比活性来获得增加蛋白质活性的修饰。比活性的增强也可以包括对反馈抑制的脱敏。也就是说,当蛋白质被代谢物反馈抑制时,可以通过使宿主含有编码已经对反馈抑制脱敏的突变体蛋白质的基因来增加蛋白质的活性。表述“对反馈抑制脱敏”可以包括消除反馈抑制,和减弱反馈抑制,除非另有叙述。此外,“对反馈抑制脱敏”的状态,即反馈抑制得到消除或减弱的状态,也可以称为“对反馈抑制耐受”。通过例如搜索各种生物体可以获得显示增强的比活性的蛋白质。此外,通过向现有蛋白质中引入突变也可以获得高活性类型的固有蛋白质。待引入的突变可以是例如在蛋白质中的一个或几个位置上一个或几个氨基酸残基的取代,缺失,插入或添加。可以通过例如如上所述的此类位点特异性突变方法来引入突变。突变也可以通过例如诱变处理来引入。诱变处理的实例可以包括X射线照射,紫外线照射和用突变剂如N-甲基-N'-硝基-N-亚硝基胍(MNNG),甲磺酸乙酯(EMS)和甲磺酸甲酯(MMS)处理。此外,可以通过用羟胺在体外直接处理DNA来诱导随机突变。比活性的增强可以独立使用,或者可以与如上述用于增强基因表达的此类方法任意组合使用。
用于转化的方法不受特别限制,并且可以使用常规已知的方法。可以使用例如用氯化钙处理接受细胞以增加其对DNA的通透性的方法,其已经对大肠杆菌K-12菌株报道(Mandel,M.and Higa,A.,J.Mol.Biol.,1970,53,159-162),以及从生长阶段中的细胞制备感受态细胞,接着用DNA转化的方法,其已经对枯草芽孢杆菌(Bacillus subtilis)报告(Duncan,C.H.,Wilson,G.A.and Young,F.E.,Gene,1977,1:153-167)。或者,也可以使用使DNA-接受细胞变为原生质体或原生质球(其可以容易摄取重组DNA),接着将重组DNA引入DNA-接受细胞中的方法,已知该方法适用于枯草芽孢杆菌、放线菌和酵母(Chang,S.andChoen,S.N.,1979,Mol.Gen.Genet.,168:111-115;Bibb,M.J.,Ward,J.M.and Hopwood,O.A.,1978,Nature,274:398-400;Hinnen,A.,Hicks,J.B.and Fink,G.R.,1978,Proc.Natl.Acad.Sci.USA,75:1929-1933)。此外,也可以使用对棒状杆菌细菌报告的电脉冲方法(日本专利公开(Kokai)No.2-207791)。
可以通过测量蛋白质的活性来确认蛋白质活性的增加。
通过确认编码蛋白质的基因的表达增加,也可以确认蛋白质活性的增加。可以通过确认基因转录量的增加或通过确认从该基因表达的蛋白质量的增加来确认基因表达的增加。
可以通过比较从基因转录的mRNA的量与非修饰菌株如野生型菌株或亲本菌株的mRNA量来确认基因转录量的增加。用于评估mRNA量的方法的实例可以包括Northern杂交,RT-PCR等(Sambrook,J.,et al.,Molecular Cloning A Laboratory Manual/第三版,ColdSpring Harbor Laboratory Press,Cold Spring Harbor(USA),2001)。mRNA的量可以增加到例如非修饰菌株的mRNA量的1.2倍以上,1.5倍以上,2倍以上或3倍以上。
可以通过使用抗体的Western印迹法(Molecular Cloning,Cold Spring HarborLaboratory Press,Cold Spring Harbor(USA),2001)来确认蛋白质量的增加。蛋白质的量(诸如每细胞的蛋白质分子的数目)可以增加到例如非修饰菌株的蛋白质量的1.2倍以上,1.5倍以上,2倍以上或3倍以上。
除了引入特定的CAR外,上述提高蛋白质活性的方法可用于提高任意蛋白质如目标物质生物合成酶,磷酸泛酰巯基乙胺基化酶和物质摄取系统的活性,和增强任意基因如编码那些任意蛋白质的基因的表达。
<1-4>降低蛋白质活性的方法
以下,将描述用于降低蛋白质的活性的方法。
表述“蛋白质的活性得以降低”可以指与非修饰菌株相比蛋白质的活性得以降低。具体而言,表述“蛋白质的活性得以降低”可以意味着与非修饰菌株相比,每个细胞的蛋白质的活性得以降低。本文使用的术语“非修饰菌株”可以指尚未以使目的蛋白质的活性得以降低的方式进行修饰的对照菌株。非修饰菌株的实例可以包括野生型菌株和亲本菌株。非修饰菌株的具体实例可以包括微生物物种的相应类型菌株。非修饰菌株的具体实例还可以包括以上关于微生物描述所例示的菌株。也就是说,在一个实施方案中,与类型菌株,即微生物所属的物种的类型菌株相比,可以降低蛋白质的活性。在另一个实施方案中,与谷氨酸棒杆菌ATCC 13869菌株相比,蛋白质的活性也可以得以降低。在另一个实施方案中,与谷氨酸棒杆菌ATCC 13032相比,蛋白质的活性也可以得以降低。另一个实施方案中,与大肠杆菌K-12MG1655菌株相比,蛋白质的活性也可以得以降低。“蛋白质活性得以降低”的状态还可以包括蛋白质的活性已经完全消失的状态。更具体地说,表述“蛋白质的活性得以降低”可以意味着与非修饰的菌株相比每个细胞的蛋白质的分子数目得以减少,和/或蛋白质的每个分子的功能得以降低。也就是说,表述“蛋白质的活性得以降低”中的术语“活性”不限于蛋白质的催化活性,而且还可以指编码蛋白质的基因的转录量(即mRNA的量)或蛋白质的翻译量(即蛋白质的量)。“每个细胞的蛋白质的分子数目得以减少”的状态还可以包括完全不存在蛋白质的状态。“蛋白质的每个分子的功能得以降低”的状态也可以包括每个蛋白质分子的功能完全消失的状态。蛋白质活性降低的程度没有特别限制,只要活性与非修饰菌株的活性相比降低即可。蛋白质的活性可以降低到例如非修饰菌株的蛋白质活性的50%或更少,20%或更少,10%或更少,5%或更少,或0%。
可以通过例如减少编码蛋白质的基因的表达来实现用于降低蛋白质活性的修饰。表述“基因的表达得以降低”可以指与非修饰菌株如野生型菌株和亲本菌株相比,该基因的表达得以降低。具体而言,表述“基因表达得以降低”可以意味着与非修饰菌株相比,每个细胞的基因表达得以降低。更具体地说,表述“基因表达得以降低”可以意味着基因的转录量(即mRNA的量)得以减少,和/或基因的翻译量(即从基因表达的蛋白质量)得以减少。“基因表达得以降低”的状态也可以包括基因完全不表达的状态。“基因表达得以降低”的状态也可以称为“基因表达得以减弱”。基因的表达可以降低到例如非修饰菌株的表达的50%或更少,20%或更少,10%或更少,5%或更少,或0%。
基因表达的降低可以是由于例如转录效率降低,翻译效率降低或其组合所致。可以通过修饰基因的表达控制序列诸如启动子,Shine-Dalgarno(SD)序列(也称为核糖体结合位点(RBS)),和基因的RBS和起始密码子之间的间隔物区来降低基因的表达。当修饰表达控制序列时,修饰表达控制序列的一个或多个核苷酸,两个或更多个核苷酸,或三个或更多个核苷酸。例如,通过用更弱的启动子替换染色体上基因的启动子,可以降低基因的转录效率。术语“更弱的启动子”可以指与基因固有的野生型启动子相比,提供基因的减弱转录的启动子。更弱启动子的实例可以包括例如诱导型启动子。也就是说,诱导型启动子可以在非诱导条件下,例如在不存在相应诱导物的情况下,起到更弱启动子的作用。此外,可以缺失表达控制序列的一部分或全部。基因的表达还可以通过例如操纵负责表达控制的因子来降低。负责表达控制的因子的实例可以包括负责转录或翻译控制的低分子(诱导剂,抑制剂等),负责转录或翻译控制的蛋白质(转录因子等),负责转录或翻译控制的核酸(siRNA等),等等。此外,通过例如对基因的编码区引入降低基因表达的突变,也可以降低基因的表达。例如,通过用在宿主中不太频繁使用的同义密码子替换基因编码区中的密码子,可以降低基因的表达。此外,例如,如后所述,基因表达可以由于基因的破坏而降低。
用于降低蛋白质活性的修饰也可以通过例如破坏编码该蛋白质的基因来获得。表述“基因受到破坏”可以指基因以使得不产生通常可以起作用的蛋白质的方式进行了修饰。“不产生通常可以起作用的蛋白质”的状态可以包括完全不从基因产生蛋白质的状态和从基因产生每分子的功能(例如活性或性质)得以降低或消除的蛋白质的状态。
可以通过例如缺失染色体上的基因来获得基因的破坏。术语“基因的缺失”可以指基因编码区的部分或整个区域的缺失。此外,可以缺失包括染色体上基因的编码区上游和下游序列的整个基因。只要可以降低蛋白质的活性,待缺失的区域可以是任何区域,例如N端区域(编码蛋白质的N端区域的区域),内部区域或C端区域(编码蛋白质的C端区域的区域)。缺失更长的区域通常可以更确定地使基因失活。待缺失的区域可以是具有例如基因的编码区的总长度的10%以上、20%以上、30%以上、40%以上、50%以上、60%以上、70%以上、80%以上、90%以上、或95%以上的长度的区域。此外,优选的是,待缺失的区域的上游和下游序列的阅读框不相同。读码框的不一致性可以引起待缺失的区域下游的移码。
例如,也可以通过对染色体上基因的编码区引入用于氨基酸取代的突变(错义突变),终止密码子的突变(无义突变),添加或缺失一个或两个核苷酸残基的突变(移码突变)等获得基因的破坏(Journal of Biological Chemistry,272:8611-8617(1997);Proceedings of the National Academy of Sciences,USA,95 5511-5515(1998);Journal of Biological Chemistry,26 116,20833-20839(1991))。
也可以通过例如将另一个核苷酸序列插入到染色体上的基因的编码区中获得基因的破坏。插入的位点可以位于基因的任何区域中,并且插入更长的核苷酸序列通常可以更确定地使基因失活。优选的是插入位点上游和下游序列的阅读框不相同。读码框的不一致性可以引起待缺失的区域下游的移码。其他核苷酸序列没有特别限制,只要选择降低或消除所编码蛋白质活性的序列即可,并且其实例可以包括例如标志物基因如抗生素抗性基因,以及可用于产生目标物质的基因。
特别地,可以以编码蛋白质的氨基酸序列得以缺失的方式进行基因的破坏。换言之,可以通过例如缺失蛋白质的氨基酸序列,特别地修饰基因以使该基因编码氨基酸序列得以的蛋白质来实现降低蛋白质活性的修饰。术语“蛋白质的氨基酸序列的缺失”可以指蛋白质的氨基酸序列的部分或整个区域的缺失。另外,术语“蛋白质的氨基酸序列的缺失”是指原始氨基酸序列在蛋白质中消失,并且还可以包括原始氨基酸序列变为另一个氨基酸序列的情况。也就是说,例如,通过移码改变为另一氨基酸序列的区域可以视为缺失区域。当蛋白质的氨基酸序列得以缺失时,通常缩短蛋白质的总长度,但也可以存在蛋白质的总长度没有改变或延长的情况。例如,通过缺失基因编码区的部分或整个区域,可以在编码的蛋白质中缺失由缺失区域编码的区域。另外,例如,通过将终止密码子引入基因的编码区中,可以在编码的蛋白质中缺失由引入位点的下游区域编码的区域。另外,例如,通过在基因的编码区中移码,可以在编码的蛋白质中缺失由移码区编码的区域。关于基因缺失中待缺失区域的位置和长度的上述描述可以在必要修改后应用于缺失蛋白质氨基酸序列中待缺失区域的位置和长度。
如上所述的染色体上基因的此类修饰可以如下获得:通过例如制备以使基因不能产生通常起作用的蛋白质的方式进行了修饰的破坏类型基因,并用含有破坏类型基因的重组DNA转化宿主以引起破坏类型基因和染色体上的野生型基因之间的同源重组,从而用该破坏类型基因取代染色体上的野生型基因。在该程序中,若重组DNA中包括根据宿主特征如营养缺陷选择的标志物基因,则操作变得更容易。破坏类型基因的实例可以包括编码区的部分或整个区域得以缺失的基因,包含错义突变的基因,包括无义突变的基因,包含移码突变的基因,以及包含转座子或标志物基因插入的基因。由破坏类型基因编码的蛋白质即使产生也具有与野生型蛋白质不同的构象,因此其功能得以降低或消除。已经建立了基于使用同源重组的基因取代的此类基因破坏,并且存在使用线性DNA的方法,诸如称为“Red驱动整合”的方法(Datsenko,K.A,and Wanner,B.L.,Proc.Natl.Acad.Sci.USA,97:6640-6645(2000)),以及利用Red驱动的整合与源自λ噬菌体的切除系统的组合的方法(Cho,E.H.,Gumport,R.I.,Gardner,J.F.,J.Bacteriol.,184:5200-5203(2002))(参考WO2005/010175),使用具有温度敏感性复制起点的质粒的方法,使用能够接合转移的质粒的方法,利用没有在宿主中起作用的复制起点的自杀载体的方法(美国专利号6,303,383,日本专利公开(Kokai)No.05-007491),等等。
用于降低蛋白质活性的修饰也可以通过例如诱变处理来获得。诱变处理的实例包括X射线或紫外线的照射和用突变剂如N-甲基-N'-硝基-N-亚硝基胍(MNNG),甲磺酸乙酯(EMS)和甲磺酸甲酯(MMS)处理。
如上文提及的用于降低蛋白质活性的此类方法可以独立使用或者以任意组合使用。
当蛋白质作为具有多个亚基的复合物起作用时,可以修饰多个亚基的部分或全部,只要蛋白质的活性最终得以降低。也就是说,例如,编码相应亚基的多个基因的部分或全部可以得以破坏等。此外,当蛋白质存在多种同工酶时,多种同工酶的部分或全部活性可以得以降低,只要蛋白质的活性最终得以降低。也就是说,例如,编码相应同功酶的多个基因的部分或全部可以得以破坏等。
可以通过测量蛋白质的活性确认蛋白质活性的降低。
蛋白质活性的降低也可以通过确认编码该蛋白质的基因的表达的降低来确认。基因表达的降低可以通过确认基因转录量的减少或从基因表达的蛋白质量的降低来确认。
通过比较从基因转录的mRNA的量与非修饰菌株中观察到的量,可以确认基因转录量的降低。用于评估mRNA量的方法的实例可以包括Northern杂交,RT-PCR等(MolecularCloning,Cold Spring Harbor Laboratory Press,Cold Spring Harbor(USA),2001)。mRNA的量可以降低到例如在非修饰菌株中观察到的量的50%或更少,20%或更少,10%或更少,5%或更少,或0%。
通过使用抗体的Western印迹法(Molecular Cloning,Cold Spring HarborLaboratory Press,Cold Spring Harbor(USA)2001)可以确认蛋白质量的减少。蛋白质的量(诸如每个细胞的蛋白质的分子数目)可以降低到例如在非修饰菌株中观察到的蛋白质量的50%或更少,20%或更少,10%或更少,5%或更少,或0%。
可以根据用于破坏的手段通过确定基因的部分或全部的核苷酸序列,基因的限制酶图谱,全长等来确认基因的破坏。
如上所述的降低蛋白质活性的此类方法还可以适用于任意蛋白质诸如副产物生成酶的活性降低,以及任意基因诸如编码那些任意蛋白的基因的表达降低。
<2>本发明的方法
如本文中描述的方法是通过使用如本文中描述的微生物生产目标物质的方法。
<2-1>发酵方法
可以通过例如如本文中描述的微生物的发酵来生产目标物质。也就是说,如本文中描述的方法的实施方案可以是通过发酵微生物来生产目标物质的方法。此实施方案也可以称为“发酵方法”。此外,通过发酵微生物生产目标物质的步骤也可以称为“发酵步骤”。
可以通过培养如本文中描述的微生物来进行发酵步骤。具体而言,在发酵方法中,可以从碳源生产目标物质。也就是说,发酵步骤可以是例如在培养基,诸如含有碳源的培养基中培养微生物以在培养基中生产和积累目标物质的步骤。也就是说,发酵方法可以是例如在培养基,诸如含有碳源的培养基中培养微生物以在培养基中生产和积累目标物质的方法。此外,换言之,发酵步骤可以是例如通过使用微生物从碳源生产目标物质的步骤。
培养基没有特别限制,只要微生物可以在其中增殖并产生目标物质即可。作为培养基,例如可以使用通常用于培养微生物诸如细菌和酵母的培养基。培养基可以根据需要含有碳源,氮源,磷酸盐源,硫源,以及其他培养基组分,如各种有机组分和无机组分。培养基成分的类型和浓度可以根据诸如要使用的微生物的类型等各种条件适当确定。
碳源没有特别限制,只要微生物可以利用它并产生目标物质即可。碳源的具体实例可以包括例如糖类,诸如葡萄糖,果糖,蔗糖,乳糖,半乳糖,木糖,阿拉伯糖,赤糖糊(blackstrap molasses),淀粉的水解物和生物质的水解物;有机酸如乙酸,柠檬酸,琥珀酸和葡糖酸;醇如乙醇,甘油和粗甘油;和脂肪酸。作为碳源,特别地,可以使用植物来源的材料。植物的实例可以包括例如玉米,稻,小麦,大豆,甘蔗,甜菜和棉。植物来源材料的实例可以包括例如器官,诸如根,茎,干,枝,叶,花和种子,包括它们的植物体和这些植物器官的分解产物。植物来源材料的在其使用时的形式没有特别限定,并且可以它们可以为诸如未加工产物,汁,研磨产物,纯化产物等任何形式。戊糖如木糖,己糖如葡萄糖或它们的混合物可从例如植物生物质获得。具体而言,可以通过将植物生物质进行处理,诸如蒸汽处理,浓酸水解,稀酸水解,纤维素酶等酶水解,碱处理而得到这些糖类。由于半纤维素与纤维素相比通常更容易水解,因此可预先水解植物生物质中的半纤维素以释放戊糖,然后可以水解纤维素以产生己糖。此外,木糖可以通过例如通过对微生物赋予用于将己糖如葡萄糖转化为木糖的途径从己糖转化供应。作为碳源,可以使用一种碳源,或者可以组合使用两种或更多种碳源。
培养基中碳源的浓度没有特别限制,只要微生物可以增殖并产生目标物质即可。培养基中碳源的浓度可以在使得目标物质的生产不受抑制的范围内尽可能高。碳源在培养基中的初始浓度通常可以是例如5至30%(w/v),或10至20%(w/v)。此外,可以根据需要对培养基额外供应碳源。例如,可以与伴随发酵进展的碳源的减少或消减成比例地对培养基额外供应碳源。虽然可以暂时消减碳源,但是只要最终可以生产目标物质,可以优选以不消减碳源或不持续消减碳源的方式进行培养。
氮源的具体实例可以包括例如铵盐如硫酸铵,氯化铵和磷酸铵,有机氮源如蛋白胨,酵母提取物,肉膏和大豆蛋白分解产物,氨和尿素。用于pH调节的氨气和氨水也可用作氮源。作为氮源,可以使用一种氮源,也可以组合使用两种或更多种的氮源。
磷酸盐源的具体实例可以包括例如磷酸盐如磷酸二氢钾和磷酸氢二钾,以及磷酸聚合物如焦磷酸。作为磷酸盐源,可以使用一种磷酸盐源,或者可以组合使用两种或更多种磷酸盐源。
硫源的具体实例可以包括例如无机硫化合物如硫酸盐,硫代硫酸盐和亚硫酸盐,以及含硫氨基酸如半胱氨酸,胱氨酸和谷胱甘肽。作为硫源,可以使用一种硫源,或者可以组合使用两种或更多种硫源。
其他各种有机和无机组分的具体实例可以包括例如无机盐如氯化钠和氯化钾;微量金属如铁,锰,镁和钙;维生素如维生素B1,维生素B2,维生素B6,烟酸,烟酰胺和维生素B12;氨基酸;核酸;和含有这些的有机成分如蛋白胨,酪蛋白氨基酸,酵母提取物和大豆蛋白分解产物。作为其他各种有机和无机组分,可以使用一种组分,或者可以组合使用两种或更多种组分。
此外,当使用需要营养物如氨基酸进行生长的营养缺陷型突变株时,优选将此类所需营养物补充到培养基中。此外,可以将用于生产目标物质的组件补充到培养基。此类组分的具体实例可以包括例如甲基供体例如SAM及其前体例如甲硫氨酸。
培养条件没有特别限制,只要微生物可以增殖并且产生目标物质即可。培养可以用例如通常用于培养微生物诸如细菌和酵母的条件进行。培养条件可以根据诸如选择的微生物的种类等各种条件适当确定。
培养可以通过使用液体培养基来进行。在培养时,例如,可以将在诸如琼脂培养基等固体培养基上培养的微生物直接接种到液体培养基中,或者将在液体培养基中作为种子培养物培养的微生物接种到液体培养基中进行主要培养。也就是说,培养可以作为种子培养和主要培养分开进行。在此类情况下,种子培养和主要培养的培养条件可以是相同的或者可以是不相同。至少在主要培养过程中产生目标物质是足够的。培养开始时培养基中含有的微生物的量没有特别限制。例如,具有OD660为4-100的种子培养液可以在开始培养时以0.1-100质量%,或1-50质量%的量添加到用于主要培养的培养基中。
培养可以以分批培养,补料分批培养,连续培养或这些的组合进行。在培养开始时使用的培养基也可以称为“起始培养基”。在补料分批培养或连续培养中供应到培养系统(例如发酵罐)的培养基也可以称为“补料培养基”。为了在补料分批培养或者连续培养中向培养系统供应补料培养基也可以称为“补料”。此外,当作为种子培养和主要培养分开进行培养时,种子培养和主要培养的培养方案可以相同或可以不同。例如,种子培养和主要培养两者都可以作为分批培养进行。或者,例如,种子培养可以作为分批培养进行,并且主要培养可以以补料分批培养或连续培养进行。
各种组分诸如碳源可以存在于起始培养基,补料培养基或两者中。也就是说,各种组分诸如碳源可以在培养期间独立地或以任意组合的方式额外供给到培养基。这些组分可以供应一次或多次,或者可以连续供应。起始培养基中存在的组分的类型可以与补料培养基中存在的组分的类型相同或不同。此外,起始培养基中存在的组分的浓度可以与补料培养基中存在的组分的浓度相同或不同。此外,可以使用两种或更多种具有不同类型和/或不同浓度组分的补料培养基。例如,当间歇进行两次或更多次补料时,补料培养基中包含的组分的类型和/或浓度对于每次补料可以是相同的或者可以是不同的。
培养可以例如在需氧条件下进行。术语“需氧条件”可以指其中培养基中的溶解氧浓度为0.33ppm或更高,或1.5ppm或更高的条件。可以将氧浓度控制为例如饱和氧浓度的1-50%,或约5%。培养可以例如在通气或摇动下进行。培养基的pH值可以是例如3至10,或4.0至9.5。培养基的pH可以根据需要在培养过程中进行调整。培养基的pH可以通过使用各种碱性和酸性物质如氨气,氨水,碳酸钠,碳酸氢钠,碳酸钾,碳酸氢钾,碳酸镁,氢氧化钠,氢氧化钙和氢氧化镁来调节。培养温度可以是例如20至45℃,或25至37℃。培养时间可以是例如10至120小时。例如,可以继续培养直到培养基中存在的碳源被消耗,或者直到微生物的活性丧失。
通过在诸如上文所述的条件下培养微生物,在培养基中积累目标物质。
可以通过用于检测或鉴定化合物的已知方法来确认目标物质的产生。此类方法的实例可以包括例如HPLC,UPLC,LC/MS,GC/MS和NMR。这些方法可以独立使用,或者可以以适当的组合使用。这些方法也可以用于确定培养基中存在的各种组分的浓度。
生产的目标物质可以适当收集。也就是说,发酵方法可以进一步包括收集目标物质的步骤。此步骤也可以称为“收集步骤”。收集步骤可以是从培养肉汤,特别是从培养基中收集目标物质的步骤。目标物质可以通过用于分离和纯化化合物的已知方法收集。此类方法的实例可以包括例如离子交换树脂法,膜处理,沉淀,提取,蒸馏和结晶。具体地,目标物质也可以通过用有机溶剂如乙酸乙酯萃取或通过蒸汽蒸馏来收集。这些方法可以独立使用,或者可以以适当的组合使用。
此外,当目标物质沉积在培养基中时,它可以通过例如离心或过滤收集。在培养基中溶解的目标物质结晶后,可以将沉积在培养基中的目标物质和溶解在培养基中的目标物质一起分离。
除了目标物质之外,收集的目标物质可以包含例如微生物细胞,培养基组分,水分和微生物的副产物代谢物。收集的目标物质的纯度可以是例如30%(w/w)或更高,50%(w/w)或更高,70%(w/w)或更高,80%(w/w)或更高,90%(w/w)或更高,或95%(w/w)或更高。
<2-2>生物转化方法
目标物质也可以通过例如使用如本文中所述的微生物的生物转化来产生。也就是说,如本文中所述的方法的另一个实施方案可以是使用微生物通过生物转化来生产目标物质的方法。该实施方案也可以称为“生物转化方法”。此外,使用微生物通过生物转化来生产目标物质的步骤也可以称为“生物转化步骤”。
具体而言,在生物转化方法中,目标物质可以从目标物质的前体产生。更具体而言,在生物转化方法中,通过使用微生物,可以通过将目标物质的前体转化为目标物质来生产目标物质。也就是说,生物转化步骤可以是通过使用微生物将目标物质的前体转化为目标物质的步骤。
目标物质的前体也可以简称为“前体”。前体的实例可以包括下述物质,该物质向目标物质的转化包括由特定的CAR催化的步骤。前体的具体实例可以包括目标物质的生物合成途径的中间体,如就目标物质生物合成酶的描述而言所述的那些,条件是中间体向目标物质的转化提供由特定的CAR催化的步骤。前体的更具体实例可以包括例如原儿茶酸,香草酸,苯甲酸,L-苯丙氨酸和肉桂酸。原儿茶酸和香草酸各自可以用作生产例如香草醛的前体。苯甲酸可以用作生产例如苯甲醛的前体。L-苯丙氨酸和肉桂酸各自可以用作生产例如肉桂醛的前体。作为前体,可以使用一种前体,或者可以组合使用两种或更多种前体。在前体是可以形成盐的化合物的情况下,前体可以作为游离化合物,其盐或其混合物使用。也就是说,术语“前体”可以指游离形式的前体,其盐或其混合物,除非另有说明。盐的实例可以包括例如硫酸盐,盐酸盐,碳酸盐,铵盐,钠盐和钾盐。作为前体的盐,可以使用一种盐,或者可以组合使用两种或更多种盐。
作为前体,可以使用商业产品,或者可以使用适当制备和获得的产品。也就是说,生物转化方法可以进一步包括生产前体的步骤。生产前体的方法没有特别限定,例如可以使用已知的方法。前体可以通过例如化学合成法,酶法,生物转化法,发酵法,提取方法或它们的组合来生产。也就是说,例如,目标物质的前体可以使用酶(也称为“前体生物合成酶”)从其另外的前体产生,所述酶催化此类另外的前体转化成目标物质的前体。此外,例如,通过使用具有前体生产能力的微生物,可以从碳源或此类另外的前体生产目标物质的前体。术语“具有前体生产能力的微生物”可以指能够从碳源或其另外的前体生产目标物质的前体的微生物。例如,根据酶法或生物转化法生产原儿茶酸的方法的实例可以包括使用恶臭假单胞菌(Pseudomonas putida)KS-0180(日本专利公开(Kokai)No.7-75589)将对甲酚转化为原儿茶酸的方法,使用NADH依赖性对羟基苯甲酸羟化酶将对羟基苯甲酸转化为原儿茶酸的方法(日本专利公开(Kokai)No.5-244941),通过在含有对苯二甲酸的培养基中培养含有参与从对苯二甲酸生成原儿茶酸的反应的基因的转化体来生产原儿茶酸的方法(日本专利公开(Kokai)No.2007-104942),以及通过使用具有原儿茶酸生产能力并且具有原儿茶酸5-氧化酶活性降低或该活性缺乏的微生物从其前体生产原儿茶酸的方法(日本专利公开(Kokai)No.2010-207094)。此外,通过发酵生产原儿茶酸的方法的实例可以包括通过使用短杆菌属细菌和乙酸作为碳源生产原儿茶酸的方法(日本专利公开(Kokai)No.50-89592),通过使用引入有编码3-二氢莽草酸脱氢酶的基因的埃希氏菌属或克雷伯氏菌属细菌和葡萄糖作为碳源生产原儿茶酸的方法(美国专利号5,272,073)。此外,香草酸可以通过根据使用OMT的酶法或使用具有OMT的微生物的生物转化法使用原儿茶酸作为前体(J.Am.CHm.Soc.,1998,Vol.120)或根据使用假单胞菌属种AV10的生物转化方法使用阿魏酸作为前体(J.App.Microbiol.,2013,Vol.116,p903-910)生产。生产的前体可以原样或者根据需要进行适当的处理如浓缩,稀释,干燥,溶解,分馏,提取和纯化后用于生物转化方法。也就是说,作为前体,例如可以使用纯化至所需程度的纯化产物,或者可以使用含有前体的材料。含有前体的材料没有特别限制,只要微生物可以使用前体即可。含有前体的材料的具体实例可以包括通过培养具有前体生产能力的微生物获得的培养肉汤,与培养肉汤分离的培养上清液及其加工产物如其浓缩产物(如浓缩液体)和其干燥产物。
在一个实施方案中,生物转化步骤可以通过例如培养如本文中所述的微生物来进行。该实施方案也可以称为“生物转化方法的第一实施方案”。也就是说,生物转化步骤可以是例如在含有目标物质的前体的培养基中培养微生物以将该前体转化为目标物质的步骤。生物转化步骤具体可以是在含有目标物质的前体的培养基中培养微生物以在培养基中产生并积累目标物质的步骤。
要使用的培养基没有特别限制,只要培养基含有目标物质的前体,并且微生物可以在其中增殖并产生目标物质。培养条件没有特别限制,只要微生物可以增殖并且产生目标物质即可。关于发酵方法所提及的培养的描述,诸如关于培养基和培养条件的描述可以在必要修改后适用于生物转化方法的第一实施方案中的培养,只是培养基在第一实施方案中含有前体。
前体可以在整个培养期内存在在培养基中,或者可以在培养的部分时期期间存在在培养基中。也就是说,短语“在含有前体的培养基中培养微生物”并不一定意味着培养基中在整个培养期内都存在前体。例如,从培养开始起培养基中可以存在或可以不存在前体。当在培养开始时培养基中不存在前体时,在培养开始后将前体添加到培养基。添加的时机可以根据诸如培养期的长度等各种条件适当确定。例如,在微生物充分生长后,可以将前体添加到培养基中。此外,在任何情况下,可以根据需要将前体添加到培养基。例如,可以与生成目标物质时发生的前体的减少或消减成比例地对培养基添加前体。用于将前体提供给培养基的方法没有特别限制。例如,可以通过将含有前体的补料培养基补料到培养基来将前体供应给培养基。此外,例如,如本文中所述的微生物和具有前体生产能力的微生物可以共培养以允许具有前体生产能力的微生物在培养基中产生前体,从而将前体供应给培养基。这些供应手段可以独立使用,或者可以以适当的组合使用。前体在培养基中的浓度没有特别限制,只要微生物可以使用该前体作为目标物质的原料即可。前体在培养基中的浓度例如可以为0.1g/L或更高,1g/L或更高,2g/L或更高,5g/L或更高,10g/L或更高,或者15g/L或更高,或者可以是200g/L或更低,100g/L或更低,50g/L或更低,或者20g/L或更低,或者可以在由其组合限定的范围内(按游离化合物的重量计)。在整个培养期内,前体可以以或不以上文例示的范围内的浓度存在于培养基中。例如,在培养开始时前体可以以上文例示的范围内的浓度存在于培养基中,或者可以将其添加到培养基,从而在培养开始后获得上文例示的范围。在培养分别作为种子培养和主要培养进行的情况下,至少在主要培养期间产生目标物质是足够的。因此,足够的是至少在主要培养期间,即在主要培养的整个时期内或在主要培养的部分时期期间,培养基中存在前体,并且也就是说,在种子培养期间培养基中可以存在或可以不存在前体。在此类情况下,关于培养的术语,如“培养期(培养时期)”和“培养开始”可以理解为与主要培养有关的术语。
在另一个实施方案中,生物转化步骤也可以通过例如使用如本文中所述的微生物的细胞来进行。该实施方案也可以称为“生物转化方法的第二实施方案”。也就是说,生物转化步骤可以是例如通过使用微生物的细胞将反应混合物中的目标物质的前体转化成目标物质的步骤。生物转化步骤具体可以是使微生物的细胞作用于反应混合物中的目标物质的前体以在反应混合物中生成并积累目标物质的步骤。通过使用此类细胞进行的生物转化步骤也可以称为“转化反应”。
微生物的细胞可以通过培养微生物来获得。用于获得细胞的培养方法没有特别限制,只要微生物可以增殖即可。在用于获得细胞的培养时,前体可以存在或可以不存在于培养基中。此外,在用于获得细胞的培养时,培养基中可以产生或可以不产生目标物质。关于发酵方法中所述的培养的描述,例如关于培养基和培养条件的描述可以在必要修改后应用于获得用于生物转化方法的第二实施方案的细胞的培养。
细胞可以在存在于培养肉汤(具体是培养基)中时,或者在从培养肉汤(具体是培养基)中收集后用于转化反应。也可以根据需要在进行处理后将细胞用于转化反应。也就是说,细胞的实例可以包括含有细胞的培养肉汤,从培养肉汤中收集的细胞或其加工产物。换言之,细胞的实例可以包括存在于微生物的培养肉汤中的细胞,从培养肉汤中收集的细胞和存在于其加工产物中的细胞。加工产物的实例可以包括通过对细胞,诸如含有细胞的培养肉汤或从培养肉汤中收集的细胞进行处理而获得的产物。这些形式的细胞可以独立使用,或者可以以适当的组合使用。
从培养基中收集细胞的方法没有特别限制,例如可以使用已知的方法。此类方法的实例可以包括例如自发沉淀,离心和过滤。也可以使用絮凝剂。这些方法可以独立使用,或者可以以适当的组合使用。收集的细胞可以根据需要通过使用合适的培养基进行清洗。收集的细胞可以根据需要通过使用适当的培养基重悬浮。可用于清洗或悬浮细胞的培养基的实例可以包括例如水性介质(水性溶剂),如水和缓冲水溶液。
细胞处理的实例可以包括例如稀释,冷凝,在载体如丙烯酰胺和角叉菜胶上固定化,冷冻和融化处理,以及增加细胞膜通透性的处理。例如,可以通过使用表面活性剂或有机溶剂来增加细胞膜的通透性。这些处理可以独立使用,或者可以以适当的组合使用。
用于转化反应的细胞没有特别限制,只要细胞具有目标物质生产能力。优选细胞保持其代谢活性。表述“细胞保持其代谢活性”可以表示细胞具有利用碳源产生或再生产生目标物质所需物质的能力。此类物质的实例可以包括例如ATP,电子供体如NADH和NADPH,以及甲基供体如SAM。细胞可以具有或可以不具有增殖能力。
转化反应可以在适当的反应混合物中进行。具体而言,转化反应可以通过使细胞和前体共存于适当的反应混合物中来进行。转化反应可以通过分批方法进行或可以通过柱方法进行。在分批法的情况下,转化反应可以通过例如将微生物的细胞和前体混合在反应容器中所含的反应混合物中来进行。转换反应可以静态进行,或者可以在搅拌或摇动反应混合物的情况下进行。在柱方法的情况下,转化反应可以通过例如使含有前体的反应混合物通过填充有固定化细胞的柱来进行。反应混合物的实例可以包括基于水性介质(水性溶剂)如水和水性缓冲液的那些。
除了前体之外,反应混合物可以根据需要含有除前体之外的组分。除前体以外的成分的实例可以包括ATP,电子供体诸如NADH,NADPH,甲基供体诸如SAM,金属离子,缓冲剂,表面活性剂,有机溶剂,碳源,磷酸盐源,和其它各种培养基成分。也就是说,例如,含有前体的培养基也可以用作反应混合物。也就是说,关于生物转化方法的第一实施方案中提及的培养基的描述也可以在必要修改后适用于生物转化方法的第二实施方案中的反应混合物。包含在反应混合物中的组分的类型和浓度可以根据各种条件来确定,例如前体的类型和细胞的形式。
转化反应的条件,诸如溶解氧浓度,反应混合物的pH,反应温度,反应时间,各种成分的浓度等没有特别限制,只要产生目标物质。转化反应可以用例如通常用于利用微生物细胞诸如静止细胞进行物质转换的条件来进行。转化反应的条件可以根据各种条件来确定,例如微生物的类型。转化反应可以例如在需氧条件下进行。术语“需氧条件”可以指其中反应混合物中的溶解氧浓度为0.33ppm或更高,或1.5ppm或更高的条件。氧浓度可以控制为例如饱和氧浓度的1-50%,或约5%。反应混合物的pH值通常可以是例如6.0至10.0,或6.5至9.0。反应温度通常可以是例如15至50℃,或15至45℃,或20至40℃。反应时间可以是例如5分钟至200小时。在柱方法的情况下,反应混合物的加载速率可以是例如使得反应时间落入上述例示的反应时间范围内的速率。此外,转化反应也可以在例如培养条件下进行,例如通常用于培养微生物诸如细菌和真菌的条件。在转化反应期间,细胞可以增殖或可以不增殖。也就是说,关于生物转化方法的第一实施方案中所述的培养条件的描述也可以在必要修改后适用于生物转化方法的第二实施方案中转化反应的条件,只是细胞可以或不可以在第二实施方案中增殖。在此类情况下,用于获得细胞的培养条件和转化反应的条件可以相同或不同。前体在反应混合物中的浓度例如可以为0.1g/L或更高,1g/L或更高,2g/L或更高,5g/L或更高,10g/L或更高,或者15g/L或更高,或者可以是200g/L或更低,100g/L或更低,50g/L或更低,或者20g/L或更低,或者可以在由其组合限定的范围内(按游离化合物的重量计)。例如,反应混合物中细胞的密度可以是1或更高,或者可以是300或更低,或者可以在其组合限定的范围内(按600nm的光密度(OD)计)。
在转化反应期间,可以将细胞,前体和其他组分独立地或以其任何任意组合额外提供给反应混合物。例如,可以与伴随目标物质产生的前体的减少或消耗成比例将前体额外地提供给反应混合物。这些组分可以供应一次或多次,或者可以连续供应。
用于向反应混合物供应诸如前体的各种组分的方法没有特别限制。这些组分各自可以通过例如直接将它们加入到反应混合物中而供应到反应混合物中。此外,例如,可以将如本文中所述的微生物和具有前体生产能力的微生物共培养,以使具有前体生产能力的微生物在反应混合物中产生前体,从而将前体提供给反应混合物。此外,例如,组分如ATP,电子给体和甲基供体可以各自在反应混合物中产生或再生,可以在微生物的细胞中产生或再生,或者可以通过不同细胞之间的偶联反应产生或再生。例如,当微生物的细胞保持其代谢活性时,它们可以通过使用碳源在它们内部产生或再生诸如ATP,电子供体和甲基供体等组分。另外,ATP生成或再生方法的实例可以包括例如通过使用棒状杆菌属细菌从碳源提供ATP的方法(Hori,H.et al.,Appl.Microbiol.Biotechnol.,48(6):693-698(1997)),通过使用酵母细胞和葡萄糖再生ATP的方法(Yamamoto,S et al.,Biosci.Biotechnol.Biochem.,69(4):784-789(2005)),使用磷酸烯醇丙酮酸和丙酮酸激酶再生ATP的方法(C.Aug'e and Ch.Gautheron,Tetrahedron Lett.,29:789-790(1988)),以及通过使用多磷酸和多磷酸激酶再生ATP的方法(Murata,K.et al.,Agric.Biol.Chem.,52(6):1471-1477(1988))。
此外,反应条件可以从转化反应的开始至结束是恒定的,或者它们可以在转化反应期间改变。表述“反应条件在转化反应期间改变”不仅可以包括反应条件在时间上改变的情况,而且还可以包括反应条件在空间上改变的情况。表述“反应条件在空间上改变”可以表示例如当通过柱法进行转化反应时,反应温度和孔密度等反应条件随流动中的位置而不同。
通过进行如上所述的生物转化步骤,获得培养肉汤(或培养基)或含有目标物质的反应混合物。目标物质的产生和目标物质的收集的确认可以以与上述发酵方法相同的方式进行。也就是说,生物转化方法可以进一步包括收集步骤,例如从培养肉汤(或培养基)或反应混合物中收集目标物质的步骤。除了目标物质之外,收集的目标物质可以包含例如微生物细胞,培养基组分,反应混合物组分,水分和微生物的副产物代谢物。收集的目标物质的纯度可以是,例如,30%(w/w)或更高,50%(w/w)或更高,70%(w/w)或更高,80%(w/w)或更高,90%(w/w)或更高,或95%(w/w)或更高。
实施例
下文,将参考以下非限制性实施例更具体地解释本发明。
在本实施例中,从作为亲本菌株的谷氨酸棒杆菌2256菌株(ATCC 13869)构建含有各种CAR基因的菌株,并且使用这些构建的菌株生产香草醛。
<1>香草酸脱甲基酶基因缺陷的菌株(FKS0165菌株)的构建
已经报道了在棒状杆菌细菌中,香草醛按香草醛->香草酸->原儿茶酸的顺序代谢,并利用(Current Microbiology,2005,Vol.51,pp.59-65)。从香草酸到原儿茶酸的转化反应由香草酸脱甲基酶催化。vanA基因和vanB基因分别编码香草酸脱甲基酶的亚基A和亚基B。vanK基因编码香草酸摄取系统,并与vanAB基因一起构成vanABK操纵子(M.T.Chaudhry,et al.,Microbiology,2007,153:857-865)。因此,首先通过缺失vanABK操纵子从谷氨酸棒杆菌2256菌株构建不能利用目标物质诸如香草醛和香草醛的菌株(FKS0165菌株)。程序如下所示。
<1-1>用于缺失vanABK基因的质粒pBS4SΔvanABK56的构建
通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板,和SEQ ID NO:51和52的合成DNA作为引物进行PCR,以获得含有vanA基因的N端侧编码区的PCR产物。分别通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板和SEQ ID NO:53和54的合成DNA作为引物进行PCR,以获得含有vanK基因的C端侧编码区的PCR产物。SEQ ID NO:52和53的序列彼此部分互补。然后,以近似等摩尔量混合含有vanA基因的N端侧编码区的PCR产物和含有vanK基因的C端侧编码区的PCR产物,并通过使用In Fusion HD克隆试剂盒(Clontech)将其插入已经用BamHI和PstI处理的pBS4S载体(WO2007/046389)中。利用该DNA,转化大肠杆菌JM109的感受态细胞(Takara Bio),并且将细胞应用于含有100μM IPTG,40μg/mL X-Gal和40μg/mL卡那霉素的LB培养基,并培养过夜。然后,挑取出现的白色菌落,并且分离成单菌落以获得转化体。从所获得的转化体中提取质粒,并将插入了靶PCR产物的质粒命名为pBS4SΔvanABK56。
<1-2>FKS0165菌株的构建
上面获得的pBS4SΔvanABK56不含能使质粒在棒状杆菌细菌细胞中自主复制的区域。因此,若用该质粒转化棒状杆菌细菌,则通过同源重组将该质粒掺入基因组中的菌株作为转化体出现,尽管它以非常低的频率发生。因此,通过电脉冲法将pBS4SΔvanABK56导入谷氨酸棒杆菌2256菌株。将细胞应用于含有25μg/mL卡那霉素的CM-Dex琼脂培养基(5g/L葡萄糖、10g/L聚胨、10g/L酵母提取物、1g/L KH2PO4、0.4g/L MgSO4-7H2O、0.01g/L FeSO4-7H2O、0.01g/L MnSO4-7H2O、3g/L尿素、1.2g/L大豆水解物、10μg/L生物素、15g/L琼脂,用NaOH调节到pH 7.5),并在31.5℃培养。通过PCR确认生长的菌株是一次重组菌株,其中通过同源重组将pBS4SΔvanABK56掺入基因组中。此一次重组的菌株具有野生型vanABK基因和缺陷型vanABK基因两者。
将一次重组菌株在CM-Dex液体培养基(与CM-Dex琼脂培养基具有相同的组成,只是它不含琼脂)中培养过夜,并将该培养肉汤应用于S10琼脂培养基(100g/L蔗糖,10g/L聚胨,10g/L酵母提取物,1g/L KH2PO4,0.4g/L MgSO4-7H2O,0.01g/L FeSO4-7H2O,0.01g/LMnSO4-4-5H2O,3g/L尿素,1.2g/L大豆蛋白水解物溶液,10μg/L生物素,20μg/L琼脂,用NaOH调节至pH7.5,并在120℃高压灭菌20分钟),并在31.5℃培养。在出现的菌落中,在CM-Dex琼脂培养基上纯化显示卡那霉素易感性的菌株。通过从纯化的菌株中制备基因组DNA,并使用它和SEQ ID NO:55和56的合成DNA作为引物进行PCR,确认了vanABK基因的缺失,并将该菌株命名为FKS0165菌株。
<2>醇脱氢酶同源基因缺陷菌株(FKFC14菌株)的构建
随后,通过使用谷氨酸棒杆菌菌株FKS0165作为亲本株,通过以下程序构建菌株FKFC14,其是醇脱氢酶同源基因(即NCgl0324基因(adhC)、NCgl0313基因(adhE)、和NCgl2709gene(adhA))缺陷的。
<2-1>FKFC5菌株(FKS0165ΔNCgl0324菌株)的构建
<2-1-1>用于缺失NCgl0324基因的质粒pBS4SΔ2256adhC的构建
通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板,和SEQ ID NO:57和58的合成DNA作为引物进行PCR,以获得含有NCgl0324基因的N端侧编码区的PCR产物。分别通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板,和SEQ ID NO:59和60的合成DNA作为引物进行PCR,以获得含有NCgl0324基因的C端侧编码区的PCR产物。SEQ ID NO:58和59的序列彼此部分互补。然后,将约等摩尔量的含有NCgl0324基因的N端侧编码区的PCR产物和含有NCgl0324基因的C端侧编码区的PCR产物混合,并通过使用In Fusion HD克隆试剂盒(Clontech)插入已经用BamHI和PstI处理的pBS4S载体(WO2007/046389)中。利用该DNA,转化大肠杆菌JM109的感受态细胞(Takara Bio),并且将细胞应用于含有100μM IPTG,40μg/mL X-Gal和40μg/mL卡那霉素的LB培养基,并培养过夜。然后,挑取出现的白色菌落,分离成单菌落以获得转化体。从所获得的转化体中提取质粒,并将其中插入了靶PCR产物的质粒命名为pBS4SΔ2256adhC。
<2-1-2>FKFC5菌株(FKS0165ΔNCgl0324菌株)的构建
由于上述获得的pBS4SΔ2256adhC不含使质粒能够在棒状杆菌细菌细胞中自主复制的区域,若用该质粒转化棒状杆菌细菌,则通过同源重组将该质粒掺入基因组中的菌株作为转化体出现,尽管它以非常低的频率发生。因此,通过电脉冲法将pBS4SΔ2256adhC导入谷氨酸棒杆菌FKS0165菌株。将细胞应用于含有25μg/mL卡那霉素的CM-Dex琼脂培养基,并在31.5℃培养。通过PCR确认,生长的菌株是通过同源重组将pBS4SΔ2256adhC掺入基因组中的一次重组菌株。此一次重组菌株具有野生型NCgl0324基因和缺陷型NCgl0324基因两者。
将一次重组的菌株在CM-Dex液体培养基中培养过夜,将培养基应用到S10琼脂培养基,并在31.5℃进行培养。在出现的菌落中,在CM-Dex琼脂培养基上纯化显示卡那霉素易感性的菌株。从纯化的菌株制备基因组DNA,并用SEQ ID NO:61和62的合成DNA作为引物进行PCR以确认NCgl0324基因的缺失,并将该菌株命名为FKFC5菌株。
<2-2>FKFC11菌株(2256ΔvanABKΔNCgl0324ΔNCgl0313菌株)的构建
<2-2-1>用于缺失NCgl0313基因的质粒pBS4SΔ2256adhE的构建
通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板和SEQ ID NO:63和64的合成DNA作为引物进行PCR,以获得含有NCgl0313基因的N端侧编码区的PCR产物。分别通过使用谷氨酸棒杆菌2256菌株的基因组DNA为模板和SEQ ID NO:65和66的合成DNA为引物进行PCR,以获得含有NCgl0313基因的C端侧编码区的PCR产物。SEQ ID NO:64和65的序列彼此部分互补。然后,将约等摩尔量的含有NCgl0313基因的N端侧编码区的PCR产物和含有NCgl0313基因的C端侧编码区的PCR产物混合,并通过使用In Fusion HD克隆试剂盒(Clontech)将其插入用BamHI和PstI处理的pBS4S载体(WO2007/046389)中。利用该DNA,转化大肠杆菌JM109的感受态细胞(Takara Bio),并且将细胞应用于含有100μM IPTG,40μg/mL X-Gal和40μg/mL卡那霉素的LB培养基,并培养过夜。然后,挑取出现的白色菌落,并且分离成单菌落以获得转化体。从获得的转化体中提取质粒,并将其中插入了靶PCR产物的质粒命名为pBS4SΔ2256adhE。
<2-2-2>FKFC11菌株(2256ΔvanABKΔNCgl0324ΔNCgl0313菌株)的构建
由于上述获得的pBS4SΔ2256adhE不含有使质粒能够在棒状杆菌细菌细胞中的自主复制的区域,若用该质粒转化棒状杆菌细菌,则通过同源重组将该质粒掺入基因组中的菌株作为转化体出现,尽管它在非常低的频率发生。因此,通过电脉冲方法将pBS4SΔ2256adhE导入谷氨酸棒杆菌FKFC5菌株。将细胞应用于含有25μg/mL卡那霉素的CM-Dex琼脂培养基,并在31.5℃下培养。通过PCR证实,生长的菌株是一次重组菌株,其中通过同源重组将pBS4SΔ2256adhE掺入基因组中。此一次重组菌株具有野生型NCgl0313基因和缺陷型NCgl0313基因两者。
将一次重组的菌株在CM-Dex液体培养基中培养过夜,将培养基应用到S10琼脂培养基上,并在31.5℃进行培养。在出现的菌落中,显示卡那霉素易感性的菌株在CM-Dex琼脂培养基上纯化。从纯化的菌株制备基因组DNA,并使用SEQ ID NO:67和68的合成DNA作为引物进行PCR以确认NCgl0313基因的缺失,并将该菌株命名为FKFC11菌株。
<2-3>FKFC14菌株(2256ΔvanABKΔNCgl0324ΔNCgl0313ΔNCgl2709菌株)的构建
<2-3-1>用于缺失NCgl2709基因的质粒pBS4SΔ2256adhA的构建
通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板和SEQ ID NO:69和70的合成DNA作为引物进行PCR以获得含有NCgl2709基因的N端侧编码区的PCR产物。分别通过使用谷氨酸棒杆菌2256菌株的基因组DNA为模板和SEQ ID NO:71和72的合成DNA作为引物进行PCR,以得到含有NCgl2709基因的C端侧编码区的PCR产物。SEQ ID NO:70和71的序列彼此部分互补。然后,将约等摩尔量的含有NCgl2709基因的N端侧编码区的PCR产物和含有NCgl2709基因的C端侧编码区的PCR产物混合,并通过使用In Fusion HD克隆试剂盒(Clontech)插入到用BamHI和PstI处理的pBS4S载体中。利用该DNA,转化大肠杆菌JM109的感受态细胞(Takara Bio),并且将细胞应用于含有100μM IPTG,40μg/mL X-Gal和40μg/mL卡那霉素的LB培养基,并培养过夜。然后,挑取出现的白色菌落,并且分离成单菌落以获得转化体。从获得的转化体中提取质粒,并将其中插入了靶PCR产物的质粒命名为pBS4SΔ2256adhA。
<2-3-2>FKFC14菌株(2256ΔvanABKΔNCgl0324ΔNCgl0313ΔNCgl2709菌株)的构建
由于上文获得的pBS4SΔ2256adhA不含能够使质粒在棒状杆菌细菌细胞中自主复制的区域,若用该质粒转化棒状杆菌细菌,则通过同源重组将该质粒掺入基因组的菌株作为转化体出现,尽管它在非常低的频率发生。因此,通过电脉冲法将pBS4SΔ2256adhA导入谷氨酸棒杆菌FKFC11菌株。将细胞应用于含有25μg/mL卡那霉素的CM-Dex琼脂培养基,并在31.5℃培养。通过PCR确认,生长的菌株是通过同源重组将pBS4SΔ2256adhA掺入基因组中的一次重组菌株。该一次重组菌株具有野生型NCgl2709基因和缺陷型NCgl2709基因两者。
将一次重组的菌株在CM-Dex液体培养基中培养过夜,将培养基应用到S10琼脂培养基上,并在31.5℃进行培养。在出现的菌落中,显示卡那霉素易感性的菌株在CM-Dex琼脂培养基上纯化。从纯化的菌株制备基因组DNA,并用SEQ ID NO:73和74的合成DNA作为引物进行PCR以确认NCgl2709基因的缺失,并将该菌株命名为FKFC14菌株。
<3>香草醛生产菌株的构建
<3-1>用于共表达CAR和PPT基因的质粒的构建
经由以下程序构建用于共表达巴西诺卡菌的CAR基因(Nb_ACAR)和大肠杆菌的PPT基因(entD)的质粒pVK9::Ptuf*-Nb_ACAR-entD,用于共表达Gordonia effusa的CAR基因(Ge_ACAR)和大肠杆菌的PPT基因(entD)的质粒pVK9::Ptuf*-Ge_ACAR-entD,用于共表达马来西亚新鞘氨醇杆菌的CAR基因(Nm_ACAR)和大肠杆菌的PPT基因(entD)的质粒pVK9::Ptuf*-Nm_ACAR-entD和用于共表达Coccomyxa subellipsoidea C-169的CAR基因(Cs2_ACAR)和大肠杆菌的PPT基因(entD)的质粒pVK9::Ptuf*-Cs2_ACAR-entD。PPT催化磷酸泛酰巯基乙胺基基团对于CAR的添加,从而活化CAR。针对大肠杆菌的密码子选择对CAR基因进行密码子优化并使用。将这些基因克隆到pVK9载体(WO2007/046389)中。pVK9载体是用于棒状杆菌细菌和大肠杆菌的穿梭载体。
用BamHI和PstI处理pVK9载体,并且用包含人工操纵子的DNA片段插入以获得质粒pVK9::Ptuf*-Nb_ACAR-entD,所述人工操纵子由按此顺序的Tuf*启动子、SD序列、Nb_ACAR(经密码子优化)、SD序列和大肠杆菌entD基因组成。该质粒的含有插入的DNA片段的部分的核苷酸序列以SEQ ID NO:19显示,其中插入的DNA片段对应于位置16-4621。
用BamHI和PstI处理pVK9载体,并且用包含人工操纵子的DNA片段插入以获得质粒pVK9::Ptuf*-Ge_ACAR-entD,所述人工操纵子由按此顺序的Tuf*启动子、SD序列、Ge_ACAR(经密码子优化)、SD序列和大肠杆菌entD基因组成。该质粒的含有插入的DNA片段的部分的核苷酸序列以SEQ ID NO:20显示,其中插入的DNA片段对应于位置16-4517。此外,Ge_ACAR的核苷酸序列(经密码子优化)以SEQ ID NO:77显示。
用BamHI和PstI处理pVK9载体,并且用包含人工操纵子的DNA片段插入以获得质粒pVK9::Ptuf*-Nm_ACAR-entD,所述人工操纵子由按此顺序的Tuf*启动子、SD序列、Nm_ACAR(经密码子优化)、SD序列和大肠杆菌entD基因组成。该质粒的含有插入的DNA片段的部分的核苷酸序列以SEQ ID NO:80显示,其中插入的DNA片段对应于位置16-4528。此外,Nm_ACAR的核苷酸序列(经密码子优化)以SEQ ID NO:81显示。
用BamHI和PstI处理pVK9载体,并且用包含人工操纵子的DNA片段插入以获得质粒pVK9::Ptuf*-Cs2_ACAR-entD,所述人工操纵子由按此顺序的Tuf*启动子、SD序列、Cs2_ACAR(经密码子优化)、SD序列和大肠杆菌entD基因组成。该质粒的含有插入的DNA片段的部分的核苷酸序列以SEQ ID NO:84显示,其中插入的DNA片段对应于位置16-4702。此外,Cs2_ACAR的核苷酸序列(经密码子优化)以SEQ ID NO:85显示。
<3-2>用于表达vanK基因的质粒pVS7::Plac-vanK的构建
vanK基因编码香草酸摄取系统。因此,为了改善香草酸的摄取,经由以下程序构建用于表达谷氨酸棒杆菌2256菌株的vanK基因的质粒pVS7::Plac-vanK。
通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板,和SEQ ID NO:75和76的合成DNA作为引物进行PCR以获得含有vanK基因的ORF和SD序列的PCR产物。然后,通过使用In Fusion HD克隆试剂盒(Clontech)将PCR产物插入用BamHI和PstI处理的pVS7载体(WO2013/069634)中。pVS7载体是棒状杆菌细菌和大肠杆菌的穿梭载体。用此DNA转化大肠杆菌JM109的感受态细胞(Takara Bio),并且将细胞应用于含有100μM IPTG、40μg/mL X-Gal和50μg/mL壮观霉素的LB培养基,并且培养过夜。然后,挑出出现的白色菌落,并且分成单菌落以获得转化体。从获得的转化体提取质粒,并且插入有靶PCR产物的质粒命名为pVS7::Plac-vanK。在此质粒中,从源自pVS7载体的lac启动子表达克隆的vanK基因。
<3-3>香草醛生产菌株的构建
通过电脉冲方法将质粒pVK9::Ptuf*-Nb_ACAR-entD,pVK9::Ptuf*-Ge_ACAR-entD、pVK9::Ptuf*-Nm_ACAR-entD或pVK9::Ptuf*-Cs2_ACAR-entD以及质粒pVS7::Plac-vanK引入谷氨酸棒杆菌FKFC14菌株。将细胞应用于含有25μg/mL卡那霉素和50μg/mL壮观霉素的CM-Dex SGFC琼脂培养基(2.5g/L葡萄糖、2.5g/L果糖、10g/L聚胨、10g/L酵母提取物、1g/L KH2PO4、0.4g/L MgSO4-7H2O、0.01g/L FeSO4-7H2O、0.01g/L MnSO4-7H2O、2g/L琥珀酸二钠六水合物、4g/L葡萄糖酸钠、3g/L尿素、1.2g/L大豆水解物、10μg/L生物素、15g/L琼脂,用NaOH调节至pH 7.5),并且于31.5℃培养。在相同的琼脂培养基上纯化生长的菌株,并且分别命名为FKFC14/pVK9::Ptuf*-Nb_ACAR-entD pVS7-vanK、FKFC14/pVK9::Ptuf*-Ge_ACAR-entD pVS7-vanK、FKFC14/pVK9::Ptuf*-Nm_ACAR-entD pVS7-vanK和FKFC14/pVK9::Ptuf*-Cs2_ACAR-entD pVS7-vanK。将这些菌株各自接种到试管中含有的4mL CM-Dex SGFC培养基(与CM-Dex SGFC琼脂培养基具有相同的组成,只是它不含琼脂)中,并且在摇动的情况下于31.5℃培养约16小时。将获得的培养肉汤的0.9mL等分试样与0.6mL 50%甘油水溶液混合以获得甘油储液,并且于-80℃贮存。
<4>比较谷氨酸棒杆菌香草醛生产菌株的香草醛生产和原儿茶醛生产
将构建的香草醛生产菌株的每个甘油储液的20μL等分试样应用于CM-Dex SGFC琼脂培养基,并且于31.5℃培养20小时作为预培养物。在无菌生理盐水中悬浮获得的细胞。测量细胞悬浮液的光密度(OD),并且用生理盐水稀释细胞悬浮液以获得600nm处的OD为83。将稀释的细胞悬浮液的1.5mL等分试样接种到试管中含有的3.5mL含有25μg/mL卡那霉素和50μg/mL壮观霉素的香草醛生产培养基(42.9g/L香草酸、85.7g/L葡萄糖、10g/L聚胨、10g/L酵母提取物、1g/L KH2PO4、0.4g/L MgSO4-7H2O、0.01g/L FeSO4-7H2O、0.01g/L MnSO4-7H2O、3g/L尿素、1.2g/L大豆水解物、10μg/L生物素,用KOH调节到pH 7.4,然后与8.6g/L CaCO3(用180℃热空气灭菌3小时)混合),或者含有25μg/mL卡那霉素和50μg/mL壮观霉素的原儿茶醛生产培养基(42.9g/L原儿茶酸、85.7g/L葡萄糖、10g/L聚胨、10g/L酵母提取物、1g/L ofKH2PO4、0.4g/L MgSO4-7H2O、0.01g/L FeSO4-7H2O、0.01g/L MnSO4-7H2O、3g/L尿素、1.2g/L大豆水解物、10μg/L生物素,用KOH调节到pH 7.4,然后与8.6g/L CaCO3(用180℃热空气灭菌3小时)混合),并且在摇动的情况下于30℃培养21小时。
在培养开始和完成时,用Biotech分析仪AS-310(Sakura SI)分析培养基中葡萄糖的浓度。还通过使用超高效液相层析NEXERA X2系统(SHIMADZU)用以下条件分析培养基中的香草酸、香草醛、原儿茶酸和原儿茶醛的浓度。
UPLC分析的条件
柱:KINETEX 2.6μm XB-C18,150x 30mm(Phenomenex)
炉温度:40℃
流动相(A):0.1%三氟乙酸
流动相(B):0.1%三氟乙酸/80%乙腈
梯度程序(时间,A(%),B(%)):(0,90,10)->(3,80,20)
流速:1.5ml/min
表1-3中显示了结果。
对FKFC14/pVK9::Ptuf*-Ge_ACAR-entD pVS7-vanK菌株观察到的V/P比率,即香草醛的生产量相对于原儿茶醛的生产量的比率,是对FKFC14/pVK9::Ptuf*-Nb_ACAR-entDpVS7-vanK菌株观察到的V/P比率的约1.4倍(表1)。因此,得出结论Ge_ACAR可用于生产香草醛。
FKFC14/pVK9::Ptuf*-Nb_ACAR-entD pVS7-vanK菌株以9.6g/L的浓度生产原儿茶醛,而FKFC14/pVK9::Ptuf*-Nm_ACAR-entD pVS7-vanK菌株不产生原儿茶醛(表2)。因此,得出结论Nm_ACAR可用于生产香草醛。
对FKFC14/pVK9::Ptuf*-Cs2_ACAR-entD pVS7-vanK菌株观察到的V/P比率,即香草醛的生产量相对于原儿茶醛的生产量的比率,是对FKFC14/pVK9::Ptuf*-Nb_ACAR-entDpVS7-vanK菌株观察到的V/P比率的约1.6倍(表3)。因此,得出结论Cs2_ACAR可用于生产香草醛。
[表1]
表1:由谷氨酸棒杆菌香草醛生产菌株的香草醛和原儿茶醛生产(平均值±S.E.)
缩写:
Glc,葡萄糖;
V.acid,香草酸;
P.acid,原儿茶酸;
P.ald.,原儿茶醛;
concn.,浓度;
V/P比率,香草醛的生产量相对于原儿茶醛的生产量的比率。
[表2]
表2:由谷氨酸棒杆菌香草醛生产菌株的香草醛和原儿茶醛生产(平均值±S.E.)
缩写:
Glc,葡萄糖;
V.acid,香草酸;
P.acid,原儿茶酸;
P.ald.,原儿茶醛;
concn.,浓度;
N.D.,未检测;
V/P比率,香草醛的生产量相对于原儿茶醛的生产量的比率。
[表3]
表3:由谷氨酸棒杆菌香草醛生产菌株的香草醛和原儿茶醛生产(平均值±S.E.)
缩写:
Glc,葡萄糖;
V.acid,香草酸;
P.acid,原儿茶酸;
P.ald.,原儿茶醛;
concn.,浓度;
V/P比率,香草醛的生产量相对于原儿茶醛的生产量的比率。
<5>由谷氨酸棒杆菌香草醛生产菌株的香草醛生产和异香草醛生产的比较
将构建的香草醛生产菌株的每个甘油储液的20μL等分试样应用于CM-Dex SGFC琼脂培养基,并且于31.5℃培养20小时作为预培养物。在无菌生理盐水中悬浮获得的细胞。测量细胞悬浮液的光密度(OD),并且用生理盐水稀释细胞悬浮液以获得600nm处的OD为83。将稀释的细胞悬浮液的1.5mL等分试样接种到试管中含有的3.5mL含有25μg/mL卡那霉素和50μg/mL壮观霉素的香草醛生产培养基(42.9g/L香草酸、85.7g/L葡萄糖、10g/L聚胨、10g/L酵母提取物、1g/L KH2PO4、0.4g/L MgSO4-7H2O、0.01g/L FeSO4-7H2O、0.01g/L MnSO4-7H2O、3g/L尿素、1.2g/L大豆水解物、10μg/L生物素,用KOH调节到pH 7.4,然后与8.6g/L CaCO3(用180℃热空气灭菌3小时)混合),或者含有25μg/mL卡那霉素和50μg/mL壮观霉素的异香草醛生产培养基(42.9g/L异香草酸、85.7g/L葡萄糖、10g/L聚胨、10g/L酵母提取物、1g/L ofKH2PO4、0.4g/L MgSO4-7H2O、0.01g/L FeSO4-7H2O、0.01g/L MnSO4-7H2O、3g/L尿素、1.2g/L大豆水解物、10μg/L生物素,用KOH调节到pH 7.4,然后与8.6g/L CaCO3(用180℃热空气灭菌3小时)混合),并且在摇动的情况下于30℃培养21小时。
在培养开始和完成时,用Biotech分析仪AS-310(Sakura SI)分析培养基中葡萄糖的浓度。还通过使用超高效液相层析NEXERA X2系统(SHIMADZU)用以下条件分析培养基中的香草酸、香草醛、异香草酸和异香草醛的浓度。UPLC分析的条件
柱:KINETEX 2.6μm XB-C18,150x 30mm(Phenomenex)
炉温:40℃
流动相(A):0.1%三氟乙酸
流动相(B):0.1%三氟乙酸/80%乙腈
梯度程序(时间,A(%),B(%)):(0,90,10)->(3,80,20)
流速:1.5ml/min
表4-5中显示了结果。
对于FKFC14/pVK9::Ptuf*-Nm_ACAR-entD pVS7-vanK菌株没有观察到异香草醛生产,而FKFC14/pVK9::Ptuf*-Nb_ACAR-entD pVS7-vanK菌株以9.3g/L的浓度生产异香草醛(表4)。因此,得出结论Nm_ACAR可用于生产香草醛。
对FKFC14/pVK9::Ptuf*-Cs2_ACAR-entD pVS7-vanK菌株观察到的V/iV比率,即香草醛生产量相对于异香草醛生产量的比率是对FKFC14/pVK9::Ptuf*-Nb_ACAR-entD pVS7-vanK菌株观察到的V/iV比率的约1.2倍(表5)。因此,得出结论Cs2_ACAR可用于生产香草醛。
[表4]
表4:谷氨酸棒杆菌香草醛生产菌株的香草醛和异香草醛生产(平均值±S.E.)
缩写:
Glc,葡萄糖;
V.acid,香草酸;
iV.acid,异香草酸;
concn.,浓度;
N.D.,未检测;
V/iV比率,香草醛的生产量相对于异香草醛的生产量的比率。
[表5]
表5:谷氨酸棒杆菌香草醛生产菌株的香草醛和异香草醛生产(平均值±S.E.)
缩写:
Glc,葡萄糖;
V.acid,香草酸;
iV.acid,异香草酸;
concn.,浓度;
N.D.,未检测;
V/iV比率,香草醛的生产量相对于异香草醛的生产量的比率。
[工业适用性]
根据本发明,微生物用于生产目标物质,即醛,诸如香草醛的能力可以得到改善,并且可以有效生产目标物质。
<序列表的解释>
SEQ ID NOS:
1:大肠杆菌MG1655的aroG基因的核苷酸序列
2:大肠杆菌MG1655的AroG蛋白的氨基酸序列
3:大肠杆菌MG1655的aroB基因的核苷酸序列
4:大肠杆菌MG1655的AroB蛋白的氨基酸序列
5:大肠杆菌MG1655的aroD基因的核苷酸序列
6:大肠杆菌MG1655的AroD蛋白的氨基酸序列
7:苏云金芽孢杆菌BMB171的asbF基因的核苷酸序列
8:苏云金芽孢杆菌BMB171的AsbF蛋白的氨基酸序列
9:大肠杆菌MG1655的tyrR基因的核苷酸序列
10:大肠杆菌MG1655的TyrR蛋白的氨基酸序列
11-14:智人的OMT基因的转录物变体1至4的核苷酸序列
15:智人的OMT同种型(MB-COMT)的氨基酸序列
16:智人的OMT同种型(S-COMT)的氨基酸序列
17:Gordonia effusa的CAR基因的核苷酸序列
18:Gordonia effusa的CAR蛋白的氨基酸序列
19:含有巴西诺卡菌的CAR基因(经密码子优化)和大肠杆菌的entD基因的DNA片段的核苷酸序列
20:含有Gordonia effusa的CAR基因(经密码子优化)和大肠杆菌的entD基因的DNA片段的核苷酸序列
21:大肠杆菌MG1655的entD基因的核苷酸序列
22:大肠杆菌MG1655的EntD蛋白的氨基酸序列
23:谷氨酸棒杆菌ATCC 13032的PPT基因的核苷酸序列
24:谷氨酸棒杆菌ATCC 13032的PPT蛋白的氨基酸序列
25:谷氨酸棒杆菌2256(ATCC 13869)的vanK基因的核苷酸序列
26:谷氨酸棒杆菌2256(ATCC 13869)的VanK蛋白的氨基酸序列
27:谷氨酸棒杆菌2256(ATCC 13869)的pcaK基因的核苷酸序列
28:谷氨酸棒杆菌2256(ATCC 13869)的PcaK蛋白的氨基酸序列
29:谷氨酸棒杆菌2256(ATCC 13869)的vanA基因的核苷酸序列
30:谷氨酸棒杆菌2256(ATCC 13869)的VanA蛋白的氨基酸序列
31:谷氨酸棒杆菌2256(ATCC 13869)的vanB基因的核苷酸序列
32:谷氨酸棒杆菌2256(ATCC 13869)的VanB蛋白的氨基酸序列
33:谷氨酸棒杆菌ATCC 13032的pcaG基因的核苷酸序列
34:谷氨酸棒杆菌ATCC 13032的PcaG蛋白的氨基酸序列
35:谷氨酸棒杆菌ATCC 13032的pcaH基因的核苷酸序列
36:谷氨酸棒杆菌ATCC 13032的PcaH蛋白的氨基酸序列
37:大肠杆菌MG1655的yqhD基因的核苷酸序列
38:大肠杆菌MG1655的YqhD蛋白的氨基酸序列
39:谷氨酸棒杆菌2256(ATCC 13869)的NCgl0324基因的核苷酸序列
40:谷氨酸棒杆菌2256(ATCC 13869)的NCgl0324蛋白的氨基酸序列
41:谷氨酸棒杆菌2256(ATCC 13869)的NCgl0313基因的核苷酸序列
42:谷氨酸棒杆菌2256(ATCC 13869)的NCgl0313蛋白的氨基酸序列
43:谷氨酸棒杆菌2256(ATCC 13869)的NCgl2709基因的核苷酸序列
44:谷氨酸棒杆菌2256(ATCC 13869)的NCgl2709蛋白的氨基酸序列
45:谷氨酸棒杆菌ATCC 13032的NCgl0219基因的核苷酸序列
46:谷氨酸棒杆菌ATCC 13032的NCgl0219蛋白的氨基酸序列
47:谷氨酸棒杆菌ATCC 13032的NCgl2382基因的核苷酸序列
48:谷氨酸棒杆菌ATCC 13032的NCgl2382蛋白的氨基酸序列
49:大肠杆菌MG1655的aroE基因的核苷酸序列
50:大肠杆菌MG1655的AroE蛋白的氨基酸序列
51-76:引物
77:针对大肠杆菌的密码子选择密码子优化的Gordonia effusa的CAR基因的核苷酸序列
78:马来西亚新鞘氨醇杆菌的CAR基因的核苷酸序列
79:马来西亚新鞘氨醇杆菌的CAR蛋白的氨基酸序列
80:含有马来西亚新鞘氨醇杆菌的CAR基因(经密码子优化)和大肠杆菌的entD基因的DNA片段的核苷酸序列
81:针对大肠杆菌的密码子选择密码子优化的马来西亚新鞘氨醇杆菌的CAR基因的核苷酸序列
82:Coccomyxa subellipsoidea C-169的CAR基因(cDNA)的核苷酸序列
83:Coccomyxa subellipsoidea C-169的CAR蛋白的氨基酸序列
84:含有Coccomyxa subellipsoidea的CAR基因(经密码子优化)和大肠杆菌的entD基因的DNA片段的核苷酸序列
85:针对大肠杆菌的密码子选择密码子优化的Coccomyxa subellipsoidea的CAR基因的核苷酸序列
序列表
<110> 味之素株式会社
<120> 用于生产醛的方法
<130> D927-17403
<150> JP2016-211106
<151> 2016-10-27
<150> JP2016-211107
<151> 2016-10-27
<150> JP2016-211103
<151> 2016-10-27
<150> JP2017-022265
<151> 2017-02-09
<150> JP2017-022330
<151> 2017-02-09
<150> JP2017-022314
<151> 2017-02-09
<160> 85
<170> PatentIn version 3.5
<210> 1
<211> 1071
<212> DNA
<213> 大肠杆菌
<400> 1
atgcaaaaag acgcgctgaa taacgtacat attaccgacg aacaggtttt aatgactccg 60
gaacaactga aggccgcttt tccattgagc ctgcaacaag aagcccagat tgctgactcg 120
cgtaaaagca tttcagatat tatcgccggg cgcgatcctc gtctgctggt agtatgtggt 180
ccttgttcca ttcatgatcc ggaaactgct ctggaatatg ctcgtcgatt taaagccctt 240
gccgcagagg tcagcgatag cctctatctg gtaatgcgcg tctattttga aaaaccccgt 300
accactgtcg gctggaaagg gttaattaac gatccccata tggatggctc ttttgatgta 360
gaagccgggc tgcagatcgc gcgtaaattg ctgcttgagc tggtgaatat gggactgcca 420
ctggcgacgg aagcgttaga tccgaatagc ccgcaatacc tgggcgatct gtttagctgg 480
tcagcaattg gtgctcgtac aacggaatcg caaactcacc gtgaaatggc ctccgggctt 540
tccatgccgg ttggttttaa aaacggcacc gacggcagtc tggcaacagc aattaacgct 600
atgcgcgccg ccgcccagcc gcaccgtttt gttggcatta accaggcagg gcaggttgcg 660
ttgctacaaa ctcaggggaa tccggacggc catgtgatcc tgcgcggtgg taaagcgccg 720
aactatagcc ctgcggatgt tgcgcaatgt gaaaaagaga tggaacaggc gggactgcgc 780
ccgtctctga tggtagattg cagccacggt aattccaata aagattatcg ccgtcagcct 840
gcggtggcag aatccgtggt tgctcaaatc aaagatggca atcgctcaat tattggtctg 900
atgatcgaaa gtaatatcca cgagggcaat cagtcttccg agcaaccgcg cagtgaaatg 960
aaatacggtg tatccgtaac cgatgcctgc attagctggg aaatgaccga tgccttgctg 1020
cgtgaaattc atcaggatct gaacgggcag ctgacggctc gcgtggctta a 1071
<210> 2
<211> 356
<212> PRT
<213> 大肠杆菌
<400> 2
Met Gln Lys Asp Ala Leu Asn Asn Val His Ile Thr Asp Glu Gln Val
1 5 10 15
Leu Met Thr Pro Glu Gln Leu Lys Ala Ala Phe Pro Leu Ser Leu Gln
20 25 30
Gln Glu Ala Gln Ile Ala Asp Ser Arg Lys Ser Ile Ser Asp Ile Ile
35 40 45
Ala Gly Arg Asp Pro Arg Leu Leu Val Val Cys Gly Pro Cys Ser Ile
50 55 60
His Asp Pro Glu Thr Ala Leu Glu Tyr Ala Arg Arg Phe Lys Ala Leu
65 70 75 80
Ala Ala Glu Val Ser Asp Ser Leu Tyr Leu Val Met Arg Val Tyr Phe
85 90 95
Glu Lys Pro Arg Thr Thr Val Gly Trp Lys Gly Leu Ile Asn Asp Pro
100 105 110
His Met Asp Gly Ser Phe Asp Val Glu Ala Gly Leu Gln Ile Ala Arg
115 120 125
Lys Leu Leu Leu Glu Leu Val Asn Met Gly Leu Pro Leu Ala Thr Glu
130 135 140
Ala Leu Asp Pro Asn Ser Pro Gln Tyr Leu Gly Asp Leu Phe Ser Trp
145 150 155 160
Ser Ala Ile Gly Ala Arg Thr Thr Glu Ser Gln Thr His Arg Glu Met
165 170 175
Ala Ser Gly Leu Ser Met Pro Val Gly Phe Lys Asn Gly Thr Asp Gly
180 185 190
Ser Leu Ala Thr Ala Ile Asn Ala Met Arg Ala Ala Ala Gln Pro His
195 200 205
Arg Phe Val Gly Ile Asn Gln Ala Gly Gln Val Ala Leu Leu Gln Thr
210 215 220
Gln Gly Asn Pro Asp Gly His Val Ile Leu Arg Gly Gly Lys Ala Pro
225 230 235 240
Asn Tyr Ser Pro Ala Asp Val Ala Gln Cys Glu Lys Glu Met Glu Gln
245 250 255
Ala Gly Leu Arg Pro Ser Leu Met Val Asp Cys Ser His Gly Asn Ser
260 265 270
Asn Lys Asp Tyr Arg Arg Gln Pro Ala Val Ala Glu Ser Val Val Ala
275 280 285
Gln Ile Lys Asp Gly Asn Arg Ser Ile Ile Gly Leu Met Ile Glu Ser
290 295 300
Asn Ile His Glu Gly Asn Gln Ser Ser Glu Gln Pro Arg Ser Glu Met
305 310 315 320
Lys Tyr Gly Val Ser Val Thr Asp Ala Cys Ile Ser Trp Glu Met Thr
325 330 335
Asp Ala Leu Leu Arg Glu Ile His Gln Asp Leu Asn Gly Gln Leu Thr
340 345 350
Ala Arg Val Ala
355
<210> 3
<211> 1089
<212> DNA
<213> 大肠杆菌
<400> 3
atggagagga ttgtcgttac tctcggggaa cgtagttacc caattaccat cgcatctggt 60
ttgtttaatg aaccagcttc attcttaccg ctgaaatcgg gcgagcaggt catgttggtc 120
accaacgaaa ccctggctcc tctgtatctc gataaggtcc gcggcgtact tgaacaggcg 180
ggtgttaacg tcgatagcgt tatcctccct gacggcgagc agtataaaag cctggctgta 240
ctcgataccg tctttacggc gttgttacaa aaaccgcatg gtcgcgatac tacgctggtg 300
gcgcttggcg gcggcgtagt gggcgatctg accggcttcg cggcggcgag ttatcagcgc 360
ggtgtccgtt tcattcaagt cccgacgacg ttactgtcgc aggtcgattc ctccgttggc 420
ggcaaaactg cggtcaacca tcccctcggt aaaaacatga ttggcgcgtt ctaccaacct 480
gcttcagtgg tggtggatct cgactgtctg aaaacgcttc ccccgcgtga gttagcgtcg 540
gggctggcag aagtcatcaa atacggcatt attcttgacg gtgcgttttt taactggctg 600
gaagagaatc tggatgcgtt gttgcgtctg gacggtccgg caatggcgta ctgtattcgc 660
cgttgttgtg aactgaaggc agaagttgtc gccgccgacg agcgcgaaac cgggttacgt 720
gctttactga atctgggaca cacctttggt catgccattg aagctgaaat ggggtatggc 780
aattggttac atggtgaagc ggtcgctgcg ggtatggtga tggcggcgcg gacgtcggaa 840
cgtctcgggc agtttagttc tgccgaaacg cagcgtatta taaccctgct caagcgggct 900
gggttaccgg tcaatgggcc gcgcgaaatg tccgcgcagg cgtatttacc gcatatgctg 960
cgtgacaaga aagtccttgc gggagagatg cgcttaattc ttccgttggc aattggtaag 1020
agtgaagttc gcagcggcgt ttcgcacgag cttgttctta acgccattgc cgattgtcaa 1080
tcagcgtaa 1089
<210> 4
<211> 362
<212> PRT
<213> 大肠杆菌
<400> 4
Met Glu Arg Ile Val Val Thr Leu Gly Glu Arg Ser Tyr Pro Ile Thr
1 5 10 15
Ile Ala Ser Gly Leu Phe Asn Glu Pro Ala Ser Phe Leu Pro Leu Lys
20 25 30
Ser Gly Glu Gln Val Met Leu Val Thr Asn Glu Thr Leu Ala Pro Leu
35 40 45
Tyr Leu Asp Lys Val Arg Gly Val Leu Glu Gln Ala Gly Val Asn Val
50 55 60
Asp Ser Val Ile Leu Pro Asp Gly Glu Gln Tyr Lys Ser Leu Ala Val
65 70 75 80
Leu Asp Thr Val Phe Thr Ala Leu Leu Gln Lys Pro His Gly Arg Asp
85 90 95
Thr Thr Leu Val Ala Leu Gly Gly Gly Val Val Gly Asp Leu Thr Gly
100 105 110
Phe Ala Ala Ala Ser Tyr Gln Arg Gly Val Arg Phe Ile Gln Val Pro
115 120 125
Thr Thr Leu Leu Ser Gln Val Asp Ser Ser Val Gly Gly Lys Thr Ala
130 135 140
Val Asn His Pro Leu Gly Lys Asn Met Ile Gly Ala Phe Tyr Gln Pro
145 150 155 160
Ala Ser Val Val Val Asp Leu Asp Cys Leu Lys Thr Leu Pro Pro Arg
165 170 175
Glu Leu Ala Ser Gly Leu Ala Glu Val Ile Lys Tyr Gly Ile Ile Leu
180 185 190
Asp Gly Ala Phe Phe Asn Trp Leu Glu Glu Asn Leu Asp Ala Leu Leu
195 200 205
Arg Leu Asp Gly Pro Ala Met Ala Tyr Cys Ile Arg Arg Cys Cys Glu
210 215 220
Leu Lys Ala Glu Val Val Ala Ala Asp Glu Arg Glu Thr Gly Leu Arg
225 230 235 240
Ala Leu Leu Asn Leu Gly His Thr Phe Gly His Ala Ile Glu Ala Glu
245 250 255
Met Gly Tyr Gly Asn Trp Leu His Gly Glu Ala Val Ala Ala Gly Met
260 265 270
Val Met Ala Ala Arg Thr Ser Glu Arg Leu Gly Gln Phe Ser Ser Ala
275 280 285
Glu Thr Gln Arg Ile Ile Thr Leu Leu Lys Arg Ala Gly Leu Pro Val
290 295 300
Asn Gly Pro Arg Glu Met Ser Ala Gln Ala Tyr Leu Pro His Met Leu
305 310 315 320
Arg Asp Lys Lys Val Leu Ala Gly Glu Met Arg Leu Ile Leu Pro Leu
325 330 335
Ala Ile Gly Lys Ser Glu Val Arg Ser Gly Val Ser His Glu Leu Val
340 345 350
Leu Asn Ala Ile Ala Asp Cys Gln Ser Ala
355 360
<210> 5
<211> 759
<212> DNA
<213> 大肠杆菌
<400> 5
atgaaaaccg taactgtaaa agatctcgtc attggtacgg gcgcacctaa aatcatcgtc 60
tcgctgatgg cgaaagatat cgccagcgtg aaatccgaag ctctcgccta tcgtgaagcg 120
gactttgata ttctggaatg gcgtgtggac cactatgccg acctctccaa tgtggagtct 180
gtcatggcgg cagcaaaaat tctccgtgag accatgccag aaaaaccgct gctgtttacc 240
ttccgcagtg ccaaagaagg cggcgagcag gcgatttcca ccgaggctta tattgcactc 300
aatcgtgcag ccatcgacag cggcctggtt gatatgatcg atctggagtt atttaccggt 360
gatgatcagg ttaaagaaac cgtcgcctac gcccacgcgc atgatgtgaa agtagtcatg 420
tccaaccatg acttccataa aacgccggaa gccgaagaaa tcattgcccg tctgcgcaaa 480
atgcaatcct tcgacgccga tattcctaag attgcgctga tgccgcaaag taccagcgat 540
gtgctgacgt tgcttgccgc gaccctggag atgcaggagc agtatgccga tcgtccaatt 600
atcacgatgt cgatggcaaa aactggcgta atttctcgtc tggctggtga agtatttggc 660
tcggcggcaa cttttggtgc ggtaaaaaaa gcgtctgcgc cagggcaaat ctcggtaaat 720
gatttgcgca cggtattaac tattttacac caggcataa 759
<210> 6
<211> 252
<212> PRT
<213> 大肠杆菌
<400> 6
Met Lys Thr Val Thr Val Lys Asp Leu Val Ile Gly Thr Gly Ala Pro
1 5 10 15
Lys Ile Ile Val Ser Leu Met Ala Lys Asp Ile Ala Ser Val Lys Ser
20 25 30
Glu Ala Leu Ala Tyr Arg Glu Ala Asp Phe Asp Ile Leu Glu Trp Arg
35 40 45
Val Asp His Tyr Ala Asp Leu Ser Asn Val Glu Ser Val Met Ala Ala
50 55 60
Ala Lys Ile Leu Arg Glu Thr Met Pro Glu Lys Pro Leu Leu Phe Thr
65 70 75 80
Phe Arg Ser Ala Lys Glu Gly Gly Glu Gln Ala Ile Ser Thr Glu Ala
85 90 95
Tyr Ile Ala Leu Asn Arg Ala Ala Ile Asp Ser Gly Leu Val Asp Met
100 105 110
Ile Asp Leu Glu Leu Phe Thr Gly Asp Asp Gln Val Lys Glu Thr Val
115 120 125
Ala Tyr Ala His Ala His Asp Val Lys Val Val Met Ser Asn His Asp
130 135 140
Phe His Lys Thr Pro Glu Ala Glu Glu Ile Ile Ala Arg Leu Arg Lys
145 150 155 160
Met Gln Ser Phe Asp Ala Asp Ile Pro Lys Ile Ala Leu Met Pro Gln
165 170 175
Ser Thr Ser Asp Val Leu Thr Leu Leu Ala Ala Thr Leu Glu Met Gln
180 185 190
Glu Gln Tyr Ala Asp Arg Pro Ile Ile Thr Met Ser Met Ala Lys Thr
195 200 205
Gly Val Ile Ser Arg Leu Ala Gly Glu Val Phe Gly Ser Ala Ala Thr
210 215 220
Phe Gly Ala Val Lys Lys Ala Ser Ala Pro Gly Gln Ile Ser Val Asn
225 230 235 240
Asp Leu Arg Thr Val Leu Thr Ile Leu His Gln Ala
245 250
<210> 7
<211> 843
<212> DNA
<213> 苏云金芽孢杆菌
<400> 7
atgaaatatt cgctatgtac catttcattt cgtcatcaat taatttcatt tactgatatt 60
gttcaatttg catatgaaaa cggttttgaa ggaattgaat tatgggggac gcatgcacaa 120
aatttgtaca tgcaagaacg tgaaacgaca gaacgagaat tgaattttct aaaggataaa 180
aacttagaaa ttacgatgat aagtgattac ttagatatat cattatcagc agattttgaa 240
aaaacgatag agaaaagtga acaacttgta gtactagcta attggtttaa tacgaataaa 300
attcgcacgt ttgctgggca aaaagggagc aaggacttct cggaacaaga gagaaaagag 360
tatgtgaagc gaatacgtaa gatttgtgat gtgtttgctc agaacaatat gtatgtgctg 420
ttagaaacac atcccaatac actaacggac acattgcctt ctactataga gttattagaa 480
gaagtaaacc atccgaattt aaaaataaat cttgattttc ttcatatatg ggagtctggc 540
gcagatccaa tagacagttt ccatcgatta aagccgtgga cactacatta ccattttaag 600
aatatatctt cagcggatta tttgcatgtg tttgaaccta ataatgtata tgctgcagca 660
ggaagtcgta taggtatggt tccgttattt gaaggtattg taaattatga tgagattatt 720
caggaagtga gaaatacgga tctttttgct tccttagaat ggtttggaca taattcaaaa 780
gagatattaa aagaagaaat gaaagtatta ataaatagaa aattagaagt agtaacttcg 840
taa 843
<210> 8
<211> 280
<212> PRT
<213> 苏云金芽孢杆菌
<400> 8
Met Lys Tyr Ser Leu Cys Thr Ile Ser Phe Arg His Gln Leu Ile Ser
1 5 10 15
Phe Thr Asp Ile Val Gln Phe Ala Tyr Glu Asn Gly Phe Glu Gly Ile
20 25 30
Glu Leu Trp Gly Thr His Ala Gln Asn Leu Tyr Met Gln Glu Arg Glu
35 40 45
Thr Thr Glu Arg Glu Leu Asn Phe Leu Lys Asp Lys Asn Leu Glu Ile
50 55 60
Thr Met Ile Ser Asp Tyr Leu Asp Ile Ser Leu Ser Ala Asp Phe Glu
65 70 75 80
Lys Thr Ile Glu Lys Ser Glu Gln Leu Val Val Leu Ala Asn Trp Phe
85 90 95
Asn Thr Asn Lys Ile Arg Thr Phe Ala Gly Gln Lys Gly Ser Lys Asp
100 105 110
Phe Ser Glu Gln Glu Arg Lys Glu Tyr Val Lys Arg Ile Arg Lys Ile
115 120 125
Cys Asp Val Phe Ala Gln Asn Asn Met Tyr Val Leu Leu Glu Thr His
130 135 140
Pro Asn Thr Leu Thr Asp Thr Leu Pro Ser Thr Ile Glu Leu Leu Glu
145 150 155 160
Glu Val Asn His Pro Asn Leu Lys Ile Asn Leu Asp Phe Leu His Ile
165 170 175
Trp Glu Ser Gly Ala Asp Pro Ile Asp Ser Phe His Arg Leu Lys Pro
180 185 190
Trp Thr Leu His Tyr His Phe Lys Asn Ile Ser Ser Ala Asp Tyr Leu
195 200 205
His Val Phe Glu Pro Asn Asn Val Tyr Ala Ala Ala Gly Ser Arg Ile
210 215 220
Gly Met Val Pro Leu Phe Glu Gly Ile Val Asn Tyr Asp Glu Ile Ile
225 230 235 240
Gln Glu Val Arg Asn Thr Asp Leu Phe Ala Ser Leu Glu Trp Phe Gly
245 250 255
His Asn Ser Lys Glu Ile Leu Lys Glu Glu Met Lys Val Leu Ile Asn
260 265 270
Arg Lys Leu Glu Val Val Thr Ser
275 280
<210> 9
<211> 1542
<212> DNA
<213> 大肠杆菌
<400> 9
atgcgtctgg aagtcttttg tgaagaccga ctcggtctga cccgcgaatt actcgatcta 60
ctcgtgctaa gaggcattga tttacgcggt attgagattg atcccattgg gcgaatctac 120
ctcaattttg ctgaactgga gtttgagagt ttcagcagtc tgatggccga aatacgccgt 180
attgcgggtg ttaccgatgt gcgtactgtc ccgtggatgc cttccgaacg tgagcatctg 240
gcgttgagcg cgttactgga ggcgttgcct gaacctgtgc tctctgtcga tatgaaaagc 300
aaagtggata tggcgaaccc ggcgagctgt cagctttttg ggcaaaaatt ggatcgcctg 360
cgcaaccata ccgccgcaca attgattaac ggctttaatt ttttacgttg gctggaaagc 420
gaaccgcaag attcgcataa cgagcatgtc gttattaatg ggcagaattt cctgatggag 480
attacgcctg tttatcttca ggatgaaaat gatcaacacg tcctgaccgg tgcggtggtg 540
atgttgcgat caacgattcg tatgggccgc cagttgcaaa atgtcgccgc ccaggacgtc 600
agcgccttca gtcaaattgt cgccgtcagc ccgaaaatga agcatgttgt cgaacaggcg 660
cagaaactgg cgatgctaag cgcgccgctg ctgattacgg gtgacacagg tacaggtaaa 720
gatctctttg cctacgcctg ccatcaggca agccccagag cgggcaaacc ttacctggcg 780
ctgaactgtg cgtctatacc ggaagatgcg gtcgagagtg aactgtttgg tcatgctccg 840
gaagggaaga aaggattctt tgagcaggcg aacggtggtt cggtgctgtt ggatgaaata 900
ggggaaatgt caccacggat gcaggcgaaa ttactgcgtt tccttaatga tggcactttc 960
cgtcgggttg gcgaagacca tgaggtgcat gtcgatgtgc gggtgatttg cgctacgcag 1020
aagaatctgg tcgaactggt gcaaaaaggc atgttccgtg aagatctcta ttatcgtctg 1080
aacgtgttga cgctcaatct gccgccgcta cgtgactgtc cgcaggacat catgccgtta 1140
actgagctgt tcgtcgcccg ctttgccgac gagcagggcg tgccgcgtcc gaaactggcc 1200
gctgacctga atactgtact tacgcgttat gcgtggccgg gaaatgtgcg gcagttaaag 1260
aacgctatct atcgcgcact gacacaactg gacggttatg agctgcgtcc acaggatatt 1320
ttgttgccgg attatgacgc cgcaacggta gccgtgggcg aagatgcgat ggaaggttcg 1380
ctggacgaaa tcaccagccg ttttgaacgc tcggtattaa cccagcttta tcgcaattat 1440
cccagcacgc gcaaactggc aaaacgtctc ggcgtttcac ataccgcgat tgccaataag 1500
ttgcgggaat atggtctgag tcagaagaag aacgaagagt aa 1542
<210> 10
<211> 513
<212> PRT
<213> 大肠杆菌
<400> 10
Met Arg Leu Glu Val Phe Cys Glu Asp Arg Leu Gly Leu Thr Arg Glu
1 5 10 15
Leu Leu Asp Leu Leu Val Leu Arg Gly Ile Asp Leu Arg Gly Ile Glu
20 25 30
Ile Asp Pro Ile Gly Arg Ile Tyr Leu Asn Phe Ala Glu Leu Glu Phe
35 40 45
Glu Ser Phe Ser Ser Leu Met Ala Glu Ile Arg Arg Ile Ala Gly Val
50 55 60
Thr Asp Val Arg Thr Val Pro Trp Met Pro Ser Glu Arg Glu His Leu
65 70 75 80
Ala Leu Ser Ala Leu Leu Glu Ala Leu Pro Glu Pro Val Leu Ser Val
85 90 95
Asp Met Lys Ser Lys Val Asp Met Ala Asn Pro Ala Ser Cys Gln Leu
100 105 110
Phe Gly Gln Lys Leu Asp Arg Leu Arg Asn His Thr Ala Ala Gln Leu
115 120 125
Ile Asn Gly Phe Asn Phe Leu Arg Trp Leu Glu Ser Glu Pro Gln Asp
130 135 140
Ser His Asn Glu His Val Val Ile Asn Gly Gln Asn Phe Leu Met Glu
145 150 155 160
Ile Thr Pro Val Tyr Leu Gln Asp Glu Asn Asp Gln His Val Leu Thr
165 170 175
Gly Ala Val Val Met Leu Arg Ser Thr Ile Arg Met Gly Arg Gln Leu
180 185 190
Gln Asn Val Ala Ala Gln Asp Val Ser Ala Phe Ser Gln Ile Val Ala
195 200 205
Val Ser Pro Lys Met Lys His Val Val Glu Gln Ala Gln Lys Leu Ala
210 215 220
Met Leu Ser Ala Pro Leu Leu Ile Thr Gly Asp Thr Gly Thr Gly Lys
225 230 235 240
Asp Leu Phe Ala Tyr Ala Cys His Gln Ala Ser Pro Arg Ala Gly Lys
245 250 255
Pro Tyr Leu Ala Leu Asn Cys Ala Ser Ile Pro Glu Asp Ala Val Glu
260 265 270
Ser Glu Leu Phe Gly His Ala Pro Glu Gly Lys Lys Gly Phe Phe Glu
275 280 285
Gln Ala Asn Gly Gly Ser Val Leu Leu Asp Glu Ile Gly Glu Met Ser
290 295 300
Pro Arg Met Gln Ala Lys Leu Leu Arg Phe Leu Asn Asp Gly Thr Phe
305 310 315 320
Arg Arg Val Gly Glu Asp His Glu Val His Val Asp Val Arg Val Ile
325 330 335
Cys Ala Thr Gln Lys Asn Leu Val Glu Leu Val Gln Lys Gly Met Phe
340 345 350
Arg Glu Asp Leu Tyr Tyr Arg Leu Asn Val Leu Thr Leu Asn Leu Pro
355 360 365
Pro Leu Arg Asp Cys Pro Gln Asp Ile Met Pro Leu Thr Glu Leu Phe
370 375 380
Val Ala Arg Phe Ala Asp Glu Gln Gly Val Pro Arg Pro Lys Leu Ala
385 390 395 400
Ala Asp Leu Asn Thr Val Leu Thr Arg Tyr Ala Trp Pro Gly Asn Val
405 410 415
Arg Gln Leu Lys Asn Ala Ile Tyr Arg Ala Leu Thr Gln Leu Asp Gly
420 425 430
Tyr Glu Leu Arg Pro Gln Asp Ile Leu Leu Pro Asp Tyr Asp Ala Ala
435 440 445
Thr Val Ala Val Gly Glu Asp Ala Met Glu Gly Ser Leu Asp Glu Ile
450 455 460
Thr Ser Arg Phe Glu Arg Ser Val Leu Thr Gln Leu Tyr Arg Asn Tyr
465 470 475 480
Pro Ser Thr Arg Lys Leu Ala Lys Arg Leu Gly Val Ser His Thr Ala
485 490 495
Ile Ala Asn Lys Leu Arg Glu Tyr Gly Leu Ser Gln Lys Lys Asn Glu
500 505 510
Glu
<210> 11
<211> 2304
<212> DNA
<213> 智人
<400> 11
cggcctgcgt ccgccaccgg aagcgccctc ctaatccccg cagcgccacc gccattgccg 60
ccatcgtcgt ggggcttctg gggcagctag ggctgcccgc cgcgctgcct gcgccggacc 120
ggggcgggtc cagtcccggg cgggccgtcg cgggagagaa ataacatctg ctttgctgcc 180
gagctcagag gagaccccag acccctcccg cagccagagg gctggagcct gctcagaggt 240
gctttgaaga tgccggaggc cccgcctctg ctgttggcag ctgtgttgct gggcctggtg 300
ctgctggtgg tgctgctgct gcttctgagg cactggggct ggggcctgtg ccttatcggc 360
tggaacgagt tcatcctgca gcccatccac aacctgctca tgggtgacac caaggagcag 420
cgcatcctga accacgtgct gcagcatgcg gagcccggga acgcacagag cgtgctggag 480
gccattgaca cctactgcga gcagaaggag tgggccatga acgtgggcga caagaaaggc 540
aagatcgtgg acgccgtgat tcaggagcac cagccctccg tgctgctgga gctgggggcc 600
tactgtggct actcagctgt gcgcatggcc cgcctgctgt caccaggggc gaggctcatc 660
accatcgaga tcaaccccga ctgtgccgcc atcacccagc ggatggtgga tttcgctggc 720
gtgaaggaca aggtcaccct tgtggttgga gcgtcccagg acatcatccc ccagctgaag 780
aagaagtatg atgtggacac actggacatg gtcttcctcg accactggaa ggaccggtac 840
ctgccggaca cgcttctctt ggaggaatgt ggcctgctgc ggaaggggac agtgctactg 900
gctgacaacg tgatctgccc aggtgcgcca gacttcctag cacacgtgcg cgggagcagc 960
tgctttgagt gcacacacta ccaatcgttc ctggaataca gggaggtggt ggacggcctg 1020
gagaaggcca tctacaaggg cccaggcagc gaagcagggc cctgactgcc cccccggccc 1080
ccctctcggg ctctctcacc cagcctggta ctgaaggtgc cagacgtgct cctgctgacc 1140
ttctgcggct ccgggctgtg tcctaaatgc aaagcacacc tcggccgagg cctgcgccct 1200
gacatgctaa cctctctgaa ctgcaacact ggattgttct tttttaagac tcaatcatga 1260
cttctttact aacactggct agctatatta tcttatatac taatatcatg ttttaaaaat 1320
ataaaataga aattaagaat ctaaatattt agatataact cgacttagta catccttctc 1380
aactgccatt cccctgctgc ccttgacttg ggcaccaaac attcaaagct ccccttgacg 1440
gacgctaacg ctaagggcgg ggcccctagc tggctgggtt ctgggtggca cgcctggccc 1500
actggcctcc cagccacagt ggtgcagagg tcagccctcc tgcagctagg ccaggggcac 1560
ctgttagccc catggggacg actgccggcc tgggaaacga agaggagtca gccagcattc 1620
acacctttct gaccaagcag gcgctgggga caggtggacc ccgcagcagc accagcccct 1680
ctgggcccca tgtggcacag agtggaagca tctccttccc tactccccac tgggccttgc 1740
ttacagaaga ggcaatggct cagaccagct cccgcatccc tgtagttgcc tccctggccc 1800
atgagtgagg atgcagtgct ggtttctgcc cacctacacc tagagctgtc cccatctcct 1860
ccaaggggtc agactgctag ccacctcaga ggctccaagg gcccagttcc caggcccagg 1920
acaggaatca accctgtgct agctgagttc acctgcaccg agaccagccc ctagccaaga 1980
ttctactcct gggctcaagg cctggctagc ccccagccag cccactccta tggatagaca 2040
gaccagtgag cccaagtgga caagtttggg gccacccagg gaccagaaac agagcctctg 2100
caggacacag cagatgggca cctgggacca cctccaccca gggccctgcc ccagacgcgc 2160
agaggcccga cacaagggag aagccagcca cttgtgccag acctgagtgg cagaaagcaa 2220
aaagttcctt tgctgcttta atttttaaat tttcttacaa aaatttaggt gtttaccaat 2280
agtcttattt tggcttattt ttaa 2304
<210> 12
<211> 2262
<212> DNA
<213> 智人
<400> 12
ctcccacggg aggagcaaga acacagaaca gagggggcaa gacagctcca ccaggagtca 60
ggagtgaatc ccctctggga acgaggcact aggaagaaga acttccagcc caggagaaat 120
aacatctgct ttgctgccga gctcagagga gaccccagac ccctcccgca gccagagggc 180
tggagcctgc tcagaggtgc tttgaagatg ccggaggccc cgcctctgct gttggcagct 240
gtgttgctgg gcctggtgct gctggtggtg ctgctgctgc ttctgaggca ctggggctgg 300
ggcctgtgcc ttatcggctg gaacgagttc atcctgcagc ccatccacaa cctgctcatg 360
ggtgacacca aggagcagcg catcctgaac cacgtgctgc agcatgcgga gcccgggaac 420
gcacagagcg tgctggaggc cattgacacc tactgcgagc agaaggagtg ggccatgaac 480
gtgggcgaca agaaaggcaa gatcgtggac gccgtgattc aggagcacca gccctccgtg 540
ctgctggagc tgggggccta ctgtggctac tcagctgtgc gcatggcccg cctgctgtca 600
ccaggggcga ggctcatcac catcgagatc aaccccgact gtgccgccat cacccagcgg 660
atggtggatt tcgctggcgt gaaggacaag gtcacccttg tggttggagc gtcccaggac 720
atcatccccc agctgaagaa gaagtatgat gtggacacac tggacatggt cttcctcgac 780
cactggaagg accggtacct gccggacacg cttctcttgg aggaatgtgg cctgctgcgg 840
aaggggacag tgctactggc tgacaacgtg atctgcccag gtgcgccaga cttcctagca 900
cacgtgcgcg ggagcagctg ctttgagtgc acacactacc aatcgttcct ggaatacagg 960
gaggtggtgg acggcctgga gaaggccatc tacaagggcc caggcagcga agcagggccc 1020
tgactgcccc cccggccccc ctctcgggct ctctcaccca gcctggtact gaaggtgcca 1080
gacgtgctcc tgctgacctt ctgcggctcc gggctgtgtc ctaaatgcaa agcacacctc 1140
ggccgaggcc tgcgccctga catgctaacc tctctgaact gcaacactgg attgttcttt 1200
tttaagactc aatcatgact tctttactaa cactggctag ctatattatc ttatatacta 1260
atatcatgtt ttaaaaatat aaaatagaaa ttaagaatct aaatatttag atataactcg 1320
acttagtaca tccttctcaa ctgccattcc cctgctgccc ttgacttggg caccaaacat 1380
tcaaagctcc ccttgacgga cgctaacgct aagggcgggg cccctagctg gctgggttct 1440
gggtggcacg cctggcccac tggcctccca gccacagtgg tgcagaggtc agccctcctg 1500
cagctaggcc aggggcacct gttagcccca tggggacgac tgccggcctg ggaaacgaag 1560
aggagtcagc cagcattcac acctttctga ccaagcaggc gctggggaca ggtggacccc 1620
gcagcagcac cagcccctct gggccccatg tggcacagag tggaagcatc tccttcccta 1680
ctccccactg ggccttgctt acagaagagg caatggctca gaccagctcc cgcatccctg 1740
tagttgcctc cctggcccat gagtgaggat gcagtgctgg tttctgccca cctacaccta 1800
gagctgtccc catctcctcc aaggggtcag actgctagcc acctcagagg ctccaagggc 1860
ccagttccca ggcccaggac aggaatcaac cctgtgctag ctgagttcac ctgcaccgag 1920
accagcccct agccaagatt ctactcctgg gctcaaggcc tggctagccc ccagccagcc 1980
cactcctatg gatagacaga ccagtgagcc caagtggaca agtttggggc cacccaggga 2040
ccagaaacag agcctctgca ggacacagca gatgggcacc tgggaccacc tccacccagg 2100
gccctgcccc agacgcgcag aggcccgaca caagggagaa gccagccact tgtgccagac 2160
ctgagtggca gaaagcaaaa agttcctttg ctgctttaat ttttaaattt tcttacaaaa 2220
atttaggtgt ttaccaatag tcttattttg gcttattttt aa 2262
<210> 13
<211> 2279
<212> DNA
<213> 智人
<400> 13
tggagataac acggatcgct gtgtacactg tgtgctccgg ttgttgcatc cgagggttga 60
tcggatggtg gttcccatcc agatccaagt cctggcccct gatcacagag aaacacagct 120
ggacattaaa gtgaaataac atctgctttg ctgccgagct cagaggagac cccagacccc 180
tcccgcagcc agagggctgg agcctgctca gaggtgcttt gaagatgccg gaggccccgc 240
ctctgctgtt ggcagctgtg ttgctgggcc tggtgctgct ggtggtgctg ctgctgcttc 300
tgaggcactg gggctggggc ctgtgcctta tcggctggaa cgagttcatc ctgcagccca 360
tccacaacct gctcatgggt gacaccaagg agcagcgcat cctgaaccac gtgctgcagc 420
atgcggagcc cgggaacgca cagagcgtgc tggaggccat tgacacctac tgcgagcaga 480
aggagtgggc catgaacgtg ggcgacaaga aaggcaagat cgtggacgcc gtgattcagg 540
agcaccagcc ctccgtgctg ctggagctgg gggcctactg tggctactca gctgtgcgca 600
tggcccgcct gctgtcacca ggggcgaggc tcatcaccat cgagatcaac cccgactgtg 660
ccgccatcac ccagcggatg gtggatttcg ctggcgtgaa ggacaaggtc acccttgtgg 720
ttggagcgtc ccaggacatc atcccccagc tgaagaagaa gtatgatgtg gacacactgg 780
acatggtctt cctcgaccac tggaaggacc ggtacctgcc ggacacgctt ctcttggagg 840
aatgtggcct gctgcggaag gggacagtgc tactggctga caacgtgatc tgcccaggtg 900
cgccagactt cctagcacac gtgcgcggga gcagctgctt tgagtgcaca cactaccaat 960
cgttcctgga atacagggag gtggtggacg gcctggagaa ggccatctac aagggcccag 1020
gcagcgaagc agggccctga ctgccccccc ggcccccctc tcgggctctc tcacccagcc 1080
tggtactgaa ggtgccagac gtgctcctgc tgaccttctg cggctccggg ctgtgtccta 1140
aatgcaaagc acacctcggc cgaggcctgc gccctgacat gctaacctct ctgaactgca 1200
acactggatt gttctttttt aagactcaat catgacttct ttactaacac tggctagcta 1260
tattatctta tatactaata tcatgtttta aaaatataaa atagaaatta agaatctaaa 1320
tatttagata taactcgact tagtacatcc ttctcaactg ccattcccct gctgcccttg 1380
acttgggcac caaacattca aagctcccct tgacggacgc taacgctaag ggcggggccc 1440
ctagctggct gggttctggg tggcacgcct ggcccactgg cctcccagcc acagtggtgc 1500
agaggtcagc cctcctgcag ctaggccagg ggcacctgtt agccccatgg ggacgactgc 1560
cggcctggga aacgaagagg agtcagccag cattcacacc tttctgacca agcaggcgct 1620
ggggacaggt ggaccccgca gcagcaccag cccctctggg ccccatgtgg cacagagtgg 1680
aagcatctcc ttccctactc cccactgggc cttgcttaca gaagaggcaa tggctcagac 1740
cagctcccgc atccctgtag ttgcctccct ggcccatgag tgaggatgca gtgctggttt 1800
ctgcccacct acacctagag ctgtccccat ctcctccaag gggtcagact gctagccacc 1860
tcagaggctc caagggccca gttcccaggc ccaggacagg aatcaaccct gtgctagctg 1920
agttcacctg caccgagacc agcccctagc caagattcta ctcctgggct caaggcctgg 1980
ctagccccca gccagcccac tcctatggat agacagacca gtgagcccaa gtggacaagt 2040
ttggggccac ccagggacca gaaacagagc ctctgcagga cacagcagat gggcacctgg 2100
gaccacctcc acccagggcc ctgccccaga cgcgcagagg cccgacacaa gggagaagcc 2160
agccacttgt gccagacctg agtggcagaa agcaaaaagt tcctttgctg ctttaatttt 2220
taaattttct tacaaaaatt taggtgttta ccaatagtct tattttggct tatttttaa 2279
<210> 14
<211> 2035
<212> DNA
<213> 智人
<400> 14
gctgttggca gctgtgttgc tgggcctggt gctgctggtg gtgctgctgc tgcttctgag 60
gcactggggc tggggcctgt gccttatcgg ctggaacgag ttcatcctgc agcccatcca 120
caacctgctc atgggtgaca ccaaggagca gcgcatcctg aaccacgtgc tgcagcatgc 180
ggagcccggg aacgcacaga gcgtgctgga ggccattgac acctactgcg agcagaagga 240
gtgggccatg aacgtgggcg acaagaaagg caagatcgtg gacgccgtga ttcaggagca 300
ccagccctcc gtgctgctgg agctgggggc ctactgtggc tactcagctg tgcgcatggc 360
ccgcctgctg tcaccagggg cgaggctcat caccatcgag atcaaccccg actgtgccgc 420
catcacccag cggatggtgg atttcgctgg cgtgaaggac aaggtcaccc ttgtggttgg 480
agcgtcccag gacatcatcc cccagctgaa gaagaagtat gatgtggaca cactggacat 540
ggtcttcctc gaccactgga aggaccggta cctgccggac acgcttctct tggaggaatg 600
tggcctgctg cggaagggga cagtgctact ggctgacaac gtgatctgcc caggtgcgcc 660
agacttccta gcacacgtgc gcgggagcag ctgctttgag tgcacacact accaatcgtt 720
cctggaatac agggaggtgg tggacggcct ggagaaggcc atctacaagg gcccaggcag 780
cgaagcaggg ccctgactgc ccccccggcc cccctctcgg gctctctcac ccagcctggt 840
actgaaggtg ccagacgtgc tcctgctgac cttctgcggc tccgggctgt gtcctaaatg 900
caaagcacac ctcggccgag gcctgcgccc tgacatgcta acctctctga actgcaacac 960
tggattgttc ttttttaaga ctcaatcatg acttctttac taacactggc tagctatatt 1020
atcttatata ctaatatcat gttttaaaaa tataaaatag aaattaagaa tctaaatatt 1080
tagatataac tcgacttagt acatccttct caactgccat tcccctgctg cccttgactt 1140
gggcaccaaa cattcaaagc tccccttgac ggacgctaac gctaagggcg gggcccctag 1200
ctggctgggt tctgggtggc acgcctggcc cactggcctc ccagccacag tggtgcagag 1260
gtcagccctc ctgcagctag gccaggggca cctgttagcc ccatggggac gactgccggc 1320
ctgggaaacg aagaggagtc agccagcatt cacacctttc tgaccaagca ggcgctgggg 1380
acaggtggac cccgcagcag caccagcccc tctgggcccc atgtggcaca gagtggaagc 1440
atctccttcc ctactcccca ctgggccttg cttacagaag aggcaatggc tcagaccagc 1500
tcccgcatcc ctgtagttgc ctccctggcc catgagtgag gatgcagtgc tggtttctgc 1560
ccacctacac ctagagctgt ccccatctcc tccaaggggt cagactgcta gccacctcag 1620
aggctccaag ggcccagttc ccaggcccag gacaggaatc aaccctgtgc tagctgagtt 1680
cacctgcacc gagaccagcc cctagccaag attctactcc tgggctcaag gcctggctag 1740
cccccagcca gcccactcct atggatagac agaccagtga gcccaagtgg acaagtttgg 1800
ggccacccag ggaccagaaa cagagcctct gcaggacaca gcagatgggc acctgggacc 1860
acctccaccc agggccctgc cccagacgcg cagaggcccg acacaaggga gaagccagcc 1920
acttgtgcca gacctgagtg gcagaaagca aaaagttcct ttgctgcttt aatttttaaa 1980
ttttcttaca aaaatttagg tgtttaccaa tagtcttatt ttggcttatt tttaa 2035
<210> 15
<211> 271
<212> PRT
<213> 智人
<400> 15
Met Pro Glu Ala Pro Pro Leu Leu Leu Ala Ala Val Leu Leu Gly Leu
1 5 10 15
Val Leu Leu Val Val Leu Leu Leu Leu Leu Arg His Trp Gly Trp Gly
20 25 30
Leu Cys Leu Ile Gly Trp Asn Glu Phe Ile Leu Gln Pro Ile His Asn
35 40 45
Leu Leu Met Gly Asp Thr Lys Glu Gln Arg Ile Leu Asn His Val Leu
50 55 60
Gln His Ala Glu Pro Gly Asn Ala Gln Ser Val Leu Glu Ala Ile Asp
65 70 75 80
Thr Tyr Cys Glu Gln Lys Glu Trp Ala Met Asn Val Gly Asp Lys Lys
85 90 95
Gly Lys Ile Val Asp Ala Val Ile Gln Glu His Gln Pro Ser Val Leu
100 105 110
Leu Glu Leu Gly Ala Tyr Cys Gly Tyr Ser Ala Val Arg Met Ala Arg
115 120 125
Leu Leu Ser Pro Gly Ala Arg Leu Ile Thr Ile Glu Ile Asn Pro Asp
130 135 140
Cys Ala Ala Ile Thr Gln Arg Met Val Asp Phe Ala Gly Val Lys Asp
145 150 155 160
Lys Val Thr Leu Val Val Gly Ala Ser Gln Asp Ile Ile Pro Gln Leu
165 170 175
Lys Lys Lys Tyr Asp Val Asp Thr Leu Asp Met Val Phe Leu Asp His
180 185 190
Trp Lys Asp Arg Tyr Leu Pro Asp Thr Leu Leu Leu Glu Glu Cys Gly
195 200 205
Leu Leu Arg Lys Gly Thr Val Leu Leu Ala Asp Asn Val Ile Cys Pro
210 215 220
Gly Ala Pro Asp Phe Leu Ala His Val Arg Gly Ser Ser Cys Phe Glu
225 230 235 240
Cys Thr His Tyr Gln Ser Phe Leu Glu Tyr Arg Glu Val Val Asp Gly
245 250 255
Leu Glu Lys Ala Ile Tyr Lys Gly Pro Gly Ser Glu Ala Gly Pro
260 265 270
<210> 16
<211> 221
<212> PRT
<213> 智人
<400> 16
Met Gly Asp Thr Lys Glu Gln Arg Ile Leu Asn His Val Leu Gln His
1 5 10 15
Ala Glu Pro Gly Asn Ala Gln Ser Val Leu Glu Ala Ile Asp Thr Tyr
20 25 30
Cys Glu Gln Lys Glu Trp Ala Met Asn Val Gly Asp Lys Lys Gly Lys
35 40 45
Ile Val Asp Ala Val Ile Gln Glu His Gln Pro Ser Val Leu Leu Glu
50 55 60
Leu Gly Ala Tyr Cys Gly Tyr Ser Ala Val Arg Met Ala Arg Leu Leu
65 70 75 80
Ser Pro Gly Ala Arg Leu Ile Thr Ile Glu Ile Asn Pro Asp Cys Ala
85 90 95
Ala Ile Thr Gln Arg Met Val Asp Phe Ala Gly Val Lys Asp Lys Val
100 105 110
Thr Leu Val Val Gly Ala Ser Gln Asp Ile Ile Pro Gln Leu Lys Lys
115 120 125
Lys Tyr Asp Val Asp Thr Leu Asp Met Val Phe Leu Asp His Trp Lys
130 135 140
Asp Arg Tyr Leu Pro Asp Thr Leu Leu Leu Glu Glu Cys Gly Leu Leu
145 150 155 160
Arg Lys Gly Thr Val Leu Leu Ala Asp Asn Val Ile Cys Pro Gly Ala
165 170 175
Pro Asp Phe Leu Ala His Val Arg Gly Ser Ser Cys Phe Glu Cys Thr
180 185 190
His Tyr Gln Ser Phe Leu Glu Tyr Arg Glu Val Val Asp Gly Leu Glu
195 200 205
Lys Ala Ile Tyr Lys Gly Pro Gly Ser Glu Ala Gly Pro
210 215 220
<210> 17
<211> 3387
<212> DNA
<213> Gordonia effusa
<400> 17
atgtctgacc agcccaacgc gcttccgtct gccatcgagc cgctgaaccc cgatcctcaa 60
gcgacagagc agatctcgca ctgtgcgacg attgccgaac ttgtccgggt tctcgccgag 120
agctacggtg atcgccccgc gctgggttgg cgaaacaata gtgatccctc gtcctggcat 180
tcgatgactt accgagatct cgctgagcgg gcggattcca tggcgcgact tctccattcg 240
acacttggcg tcgccgagaa cgaccgggtg gcgacggtgg gcttcactag cgcggagtac 300
accatcgcct cgcttgccgt cggcacgctc ggcgcgatgg aggtaccact gcaaaacgcc 360
gggtccgtcg acgtctgggc cgcaatcctc accgaaaccg actgtgtgag cgcggttgtc 420
gcggccgatc aactgccttc gatcgctcgg ctggccgaat cgggcaccta caccggcctg 480
cgacatgtgc tggtcttcga catcggctcg cgcgacggaa ccacgctcga tgacgcggca 540
cgacgactgg tcgctgcggg cacccaggtg catctccgcc agcccggcgc cgagccgacg 600
acaccgccgg ctccactgcc ccagatcacg gccaaccccg accgcgtcgc cctcctcatc 660
tacacctccg gtagcaccgg agcccccaaa ggcgccatgt acaccgaaac cgcggtgacc 720
cggttattcc aatcgggact cagcggcttg gggcgcgcca ccgacggtca cggctggatc 780
accctgaact tcatgccgat gagccacgtg atgggacgca gcactctgtg gcaaaccctg 840
ggaaatggtg gcaccgcgta cttcaccccg cgcgccgacc tcgccgagtt gctcaccgac 900
ctcgcagcgg tccagccgac cgacctgcaa ttcgtaccgc gcatctggga catgctgtac 960
caggagtacg tccgcctcac cgatcaggac gtcagtgaac aagacgccct cacccgtatg 1020
cgcgaacact atttcggtac ccggactgcc accgccatca ccggttccgc accgatctcc 1080
gatgaggttc ggcgtttcgt cgaagcgatg ctgccggttc cactcatcga aggctatgga 1140
agtaccgagg ccgccggcgt ctccatcgac ggccgcatcc agcgaccgcc ggtggtggat 1200
tacaagcttc tcgacgttcc tgaactcggc tacctgagca ccgatcggcc gcacccgcgc 1260
ggcgaactgc tcgtcaagac cgaccatatc ttcgcggggt actacaaccg tcccgacctc 1320
acctcatcgg tcttcgacga ccagggctac taccggacgg gcgacatcgt cgccgagacc 1380
ggcccagacc aaatcgagta tgtcgaccgc cggaacaacg tgatgaagct ttcgcagggt 1440
gagttcgtcg cgatcgccca catcgaggcg gtactgacca ccccgccgat ccagcaactg 1500
tacgtctacg gcaacagcgc gcggccctat ctgctcgcgg tcgtcgtgcc cacccccgag 1560
ttacgcgaac gacacgccga cgacaacgag ctgcgacgag aagtactgac ggcactgcgc 1620
tctcatggcg aacgtaatgg ccttgcggcc gtagagattc cgcgcgatgt gattgtcgaa 1680
cgcacgccgt tcagcctgga gaacggtctt cttaccggca tccgaaaact cgcgcgccca 1740
caactcaaag agcgctacgg cgctcggctg gaggccctct acgccgagct ggccgatagc 1800
cgtatcacca ggctgcgcga cgtcaaagcc gttgccgcac aacgctcaac ggtgacaacg 1860
gtcatcgacg tggtcacagc gatactcgac ctcgccgacg gggaggtcac ggccgcggca 1920
catttcaccg acctcggcgg agattccctc accgccgtca cggtcgggaa cgaactccgc 1980
gacatcttcg acgccgaagt accggtcggc gtcttgacca gcccgtcatc gacgctggcc 2040
gacatagccg aacatatcga cgggcgacac agcgaggccc ggccaaccgc ggaatcggtc 2100
cacggcaccg gaaccaccct tcgggcagcg gacctcactc tcgacaaatt cctcgacgag 2160
gagaccttgc gcgctgcgtc cgacgtgacg tcggctgcga ccgacgtacg gaccgtattc 2220
atcaccggcg caaccggatt cctcggtcgc tatctgacac tcgactggtt gcgtcggatg 2280
gcaaaagtcg gcggcacggt gatctgcctc gttcgaggtg cggacgatga tgccgcccgg 2340
gcgcgcctag acgcggcatt cgactccagc gatctatggt cggagtacca gcgactggcc 2400
aaagaccacc ttcgggttct cgccggcgac aaggactcgg atcacctcgc gctcacccca 2460
gacgtatggg atgaattggc aaagtccgtc gacctcatca tcgatcccgc ggcgctggtc 2520
aaccatgtgt tgccatatcg agaactattc ggacccaacg tatctggcac tgctgagctg 2580
atcagactcg cggtgacgac cacccgtaag ccatacgtgt atatctcaac ggtcggtgta 2640
ggcgaccagg tcgcgccggg atctttcacc gaggaccccg acatccgcga gatgagctcg 2700
gtacgcgaga ttaacgacac ttacgccaac ggatatggca acagcaaatg ggccggcgaa 2760
gtattgctcg cgcaggcgca cgaacgattt gagttaccgg tcagcgtctt tcgctgcgac 2820
atgatcgtcg ccgatgatca caccatcggg cagctgaacc tacctgacat gttcacgcgg 2880
ctactgatga gcgtgctcgc caccggcttg gcacctcgct ctttctatca actcgccacc 2940
gacggatcgg cacaggaggc ccacttcgat gctctgccgg tcgatttcct cgccgaagcg 3000
atcaacaccc tgtgggttaa ggacggagcc cgcaccttca acgcgatgaa cccgcacgcc 3060
gacggcatcg gattcgatca gtacattcgc tggctgatcg acagcggcga gcagatcagc 3120
cttgtagaca actatgacga ttggtatcgg cgattcggtg cggccctcgc cgatctgccg 3180
gaaaagcagc gacgcggatc gttgattccg ttgctgcaca actatgttca cccgatgacg 3240
ccgcacaatc gcggtatggc gtcggcggac cgattccacg acgcggtccg aaccgctggc 3300
gtcgggcagt cgtccgacat cccgcatatc acgccacaga tcatcgagaa ctacgcccgc 3360
agcctccgcg gtctcggggt gatctga 3387
<210> 18
<211> 1128
<212> PRT
<213> Gordonia effusa
<400> 18
Met Ser Asp Gln Pro Asn Ala Leu Pro Ser Ala Ile Glu Pro Leu Asn
1 5 10 15
Pro Asp Pro Gln Ala Thr Glu Gln Ile Ser His Cys Ala Thr Ile Ala
20 25 30
Glu Leu Val Arg Val Leu Ala Glu Ser Tyr Gly Asp Arg Pro Ala Leu
35 40 45
Gly Trp Arg Asn Asn Ser Asp Pro Ser Ser Trp His Ser Met Thr Tyr
50 55 60
Arg Asp Leu Ala Glu Arg Ala Asp Ser Met Ala Arg Leu Leu His Ser
65 70 75 80
Thr Leu Gly Val Ala Glu Asn Asp Arg Val Ala Thr Val Gly Phe Thr
85 90 95
Ser Ala Glu Tyr Thr Ile Ala Ser Leu Ala Val Gly Thr Leu Gly Ala
100 105 110
Met Glu Val Pro Leu Gln Asn Ala Gly Ser Val Asp Val Trp Ala Ala
115 120 125
Ile Leu Thr Glu Thr Asp Cys Val Ser Ala Val Val Ala Ala Asp Gln
130 135 140
Leu Pro Ser Ile Ala Arg Leu Ala Glu Ser Gly Thr Tyr Thr Gly Leu
145 150 155 160
Arg His Val Leu Val Phe Asp Ile Gly Ser Arg Asp Gly Thr Thr Leu
165 170 175
Asp Asp Ala Ala Arg Arg Leu Val Ala Ala Gly Thr Gln Val His Leu
180 185 190
Arg Gln Pro Gly Ala Glu Pro Thr Thr Pro Pro Ala Pro Leu Pro Gln
195 200 205
Ile Thr Ala Asn Pro Asp Arg Val Ala Leu Leu Ile Tyr Thr Ser Gly
210 215 220
Ser Thr Gly Ala Pro Lys Gly Ala Met Tyr Thr Glu Thr Ala Val Thr
225 230 235 240
Arg Leu Phe Gln Ser Gly Leu Ser Gly Leu Gly Arg Ala Thr Asp Gly
245 250 255
His Gly Trp Ile Thr Leu Asn Phe Met Pro Met Ser His Val Met Gly
260 265 270
Arg Ser Thr Leu Trp Gln Thr Leu Gly Asn Gly Gly Thr Ala Tyr Phe
275 280 285
Thr Pro Arg Ala Asp Leu Ala Glu Leu Leu Thr Asp Leu Ala Ala Val
290 295 300
Gln Pro Thr Asp Leu Gln Phe Val Pro Arg Ile Trp Asp Met Leu Tyr
305 310 315 320
Gln Glu Tyr Val Arg Leu Thr Asp Gln Asp Val Ser Glu Gln Asp Ala
325 330 335
Leu Thr Arg Met Arg Glu His Tyr Phe Gly Thr Arg Thr Ala Thr Ala
340 345 350
Ile Thr Gly Ser Ala Pro Ile Ser Asp Glu Val Arg Arg Phe Val Glu
355 360 365
Ala Met Leu Pro Val Pro Leu Ile Glu Gly Tyr Gly Ser Thr Glu Ala
370 375 380
Ala Gly Val Ser Ile Asp Gly Arg Ile Gln Arg Pro Pro Val Val Asp
385 390 395 400
Tyr Lys Leu Leu Asp Val Pro Glu Leu Gly Tyr Leu Ser Thr Asp Arg
405 410 415
Pro His Pro Arg Gly Glu Leu Leu Val Lys Thr Asp His Ile Phe Ala
420 425 430
Gly Tyr Tyr Asn Arg Pro Asp Leu Thr Ser Ser Val Phe Asp Asp Gln
435 440 445
Gly Tyr Tyr Arg Thr Gly Asp Ile Val Ala Glu Thr Gly Pro Asp Gln
450 455 460
Ile Glu Tyr Val Asp Arg Arg Asn Asn Val Met Lys Leu Ser Gln Gly
465 470 475 480
Glu Phe Val Ala Ile Ala His Ile Glu Ala Val Leu Thr Thr Pro Pro
485 490 495
Ile Gln Gln Leu Tyr Val Tyr Gly Asn Ser Ala Arg Pro Tyr Leu Leu
500 505 510
Ala Val Val Val Pro Thr Pro Glu Leu Arg Glu Arg His Ala Asp Asp
515 520 525
Asn Glu Leu Arg Arg Glu Val Leu Thr Ala Leu Arg Ser His Gly Glu
530 535 540
Arg Asn Gly Leu Ala Ala Val Glu Ile Pro Arg Asp Val Ile Val Glu
545 550 555 560
Arg Thr Pro Phe Ser Leu Glu Asn Gly Leu Leu Thr Gly Ile Arg Lys
565 570 575
Leu Ala Arg Pro Gln Leu Lys Glu Arg Tyr Gly Ala Arg Leu Glu Ala
580 585 590
Leu Tyr Ala Glu Leu Ala Asp Ser Arg Ile Thr Arg Leu Arg Asp Val
595 600 605
Lys Ala Val Ala Ala Gln Arg Ser Thr Val Thr Thr Val Ile Asp Val
610 615 620
Val Thr Ala Ile Leu Asp Leu Ala Asp Gly Glu Val Thr Ala Ala Ala
625 630 635 640
His Phe Thr Asp Leu Gly Gly Asp Ser Leu Thr Ala Val Thr Val Gly
645 650 655
Asn Glu Leu Arg Asp Ile Phe Asp Ala Glu Val Pro Val Gly Val Leu
660 665 670
Thr Ser Pro Ser Ser Thr Leu Ala Asp Ile Ala Glu His Ile Asp Gly
675 680 685
Arg His Ser Glu Ala Arg Pro Thr Ala Glu Ser Val His Gly Thr Gly
690 695 700
Thr Thr Leu Arg Ala Ala Asp Leu Thr Leu Asp Lys Phe Leu Asp Glu
705 710 715 720
Glu Thr Leu Arg Ala Ala Ser Asp Val Thr Ser Ala Ala Thr Asp Val
725 730 735
Arg Thr Val Phe Ile Thr Gly Ala Thr Gly Phe Leu Gly Arg Tyr Leu
740 745 750
Thr Leu Asp Trp Leu Arg Arg Met Ala Lys Val Gly Gly Thr Val Ile
755 760 765
Cys Leu Val Arg Gly Ala Asp Asp Asp Ala Ala Arg Ala Arg Leu Asp
770 775 780
Ala Ala Phe Asp Ser Ser Asp Leu Trp Ser Glu Tyr Gln Arg Leu Ala
785 790 795 800
Lys Asp His Leu Arg Val Leu Ala Gly Asp Lys Asp Ser Asp His Leu
805 810 815
Ala Leu Thr Pro Asp Val Trp Asp Glu Leu Ala Lys Ser Val Asp Leu
820 825 830
Ile Ile Asp Pro Ala Ala Leu Val Asn His Val Leu Pro Tyr Arg Glu
835 840 845
Leu Phe Gly Pro Asn Val Ser Gly Thr Ala Glu Leu Ile Arg Leu Ala
850 855 860
Val Thr Thr Thr Arg Lys Pro Tyr Val Tyr Ile Ser Thr Val Gly Val
865 870 875 880
Gly Asp Gln Val Ala Pro Gly Ser Phe Thr Glu Asp Pro Asp Ile Arg
885 890 895
Glu Met Ser Ser Val Arg Glu Ile Asn Asp Thr Tyr Ala Asn Gly Tyr
900 905 910
Gly Asn Ser Lys Trp Ala Gly Glu Val Leu Leu Ala Gln Ala His Glu
915 920 925
Arg Phe Glu Leu Pro Val Ser Val Phe Arg Cys Asp Met Ile Val Ala
930 935 940
Asp Asp His Thr Ile Gly Gln Leu Asn Leu Pro Asp Met Phe Thr Arg
945 950 955 960
Leu Leu Met Ser Val Leu Ala Thr Gly Leu Ala Pro Arg Ser Phe Tyr
965 970 975
Gln Leu Ala Thr Asp Gly Ser Ala Gln Glu Ala His Phe Asp Ala Leu
980 985 990
Pro Val Asp Phe Leu Ala Glu Ala Ile Asn Thr Leu Trp Val Lys Asp
995 1000 1005
Gly Ala Arg Thr Phe Asn Ala Met Asn Pro His Ala Asp Gly Ile
1010 1015 1020
Gly Phe Asp Gln Tyr Ile Arg Trp Leu Ile Asp Ser Gly Glu Gln
1025 1030 1035
Ile Ser Leu Val Asp Asn Tyr Asp Asp Trp Tyr Arg Arg Phe Gly
1040 1045 1050
Ala Ala Leu Ala Asp Leu Pro Glu Lys Gln Arg Arg Gly Ser Leu
1055 1060 1065
Ile Pro Leu Leu His Asn Tyr Val His Pro Met Thr Pro His Asn
1070 1075 1080
Arg Gly Met Ala Ser Ala Asp Arg Phe His Asp Ala Val Arg Thr
1085 1090 1095
Ala Gly Val Gly Gln Ser Ser Asp Ile Pro His Ile Thr Pro Gln
1100 1105 1110
Ile Ile Glu Asn Tyr Ala Arg Ser Leu Arg Gly Leu Gly Val Ile
1115 1120 1125
<210> 19
<211> 4636
<212> DNA
<213> 人工序列
<220>
<223> 含有巴西诺卡菌的CAR基因(经密码子优化)和大肠杆菌的entD基因
的DNA片段的核苷酸序列
<400> 19
ccaagcttgc atgccagatc gtttagatcc gaaggaaaac gtcgaaaagc aatttgcttt 60
tcgacgcccc accccgcgcg ttttagcgtg tcagtagacg cgtagggtaa gtggggtagc 120
ggcttgttag atatcttgaa atcggctttc aacagcattg atttcgatgt atttagctgg 180
ccgtttgaga cgcgatgtcc acagggtagc tggtagtttg aaaatcaacg ccgttgccct 240
taggattcag taactggcac attttgtaat gcgctagatc tgtgtgccca gtcttccagg 300
ctgcttatca cagtgaaagc aaaaccaatt cgtggctgcg aaagtcgtag ccaccacgaa 360
gtccaggagg acatacaatg gcaactgaca gcaggagcga ccgtctacgt aggcggatag 420
ctcagctatt tgcagaagat gaacaggtta aggcagcagt tccggatcag gaagttgttg 480
aagcaattcg tgcacctggt ctgcgtctgg ctcagattat ggcaaccgtg atggaacgtt 540
acgcagatcg tcctgcagtt gggcagcgtg caagcgaacc ggttaccgaa agcgggcgta 600
ccacctttcg tctgttaccg gagtttgaaa ccctgaccta tcgtgaactg tgggcacgtg 660
tgcgtgcagt tgcagcagca tggcatgggg acgcagagag gcccttacgt gcaggagact 720
ttgtcgctct gctggggttt gcaggtattg actatggtac cttagactta gcaaatattc 780
acctgggttt agttaccgtt ccgctgcaaa gcggtgcaac tgcaccgcaa ctggcagcaa 840
ttctggcaga aaccacccct cgtgttctgg cagcaactcc tgatcacctg gacattgcag 900
tagagctact gaccggaggg gcaagcccgg agcgtctggt tgtctttgac tatcgtcctg 960
cagatgatga ccatcgtgca gcattagaaa gcgcacgtag gcgtctaagc gatgcaggtt 1020
cggcagttgt tgttgaaacc ttagatgcag tccgtgcacg cggtagcgag ctaccggcag 1080
caccgctgtt tgtccctgca gcagatgaag atccgctggc tctgttaatt tacaccagcg 1140
gtagcaccgg gacccccaaa ggtgcaatgt ataccgagag gctgaatcgt actacgtggc 1200
tgagcggtgc aaagggtgtt ggtttaacct taggttatat gccgatgtcg cacatagcag 1260
gacgtgcatc atttgcaggg gttctggcac gcggtggtac cgtttatttt accgcacgca 1320
gcgacatgag caccctgttt gaggacctgg cactggttcg tccgaccgaa atgttttttg 1380
ttccgcgtgt ttgtgacatg atttttcaac gttaccaggc agagctgagc cggcgtgcac 1440
ctgcagcagc agcaagcccg gagttagaac aggagctgaa aaccgagctg cgtctaagcg 1500
cagtcggaga tcgtctatta ggggcaattg caggtagcgc accgctgagc gcagaaatgc 1560
gtgaatttat ggaaagcctg ctggacctgg agctgcatga cggttatggt agcaccgaag 1620
cagggattgg tgtcctgcaa gataacattg ttcagaggcc gccggttatt gactataaat 1680
tagttgatgt tccggagcta ggttattttc gtacggatca gccgcaccct cgtggggaac 1740
tactgctaaa gaccgaggga atgataccgg gttattttcg tcgtcctgaa gttaccgcag 1800
aaatttttga cgaagatggg ttttacagga ccggggatat tgttgcagag ttagagccgg 1860
accgtctgat ttaccttgat cgtcgtaata acgttctgaa gctggcacag ggtgaatttg 1920
ttaccgttgc acacctggag gcagtttttg caacctcgcc gctgattcgt cagatttaca 1980
tttacggtaa tagcgaacgt agctttctgc tggcagttat tgttcctacc gcagatgcac 2040
tggcagatgg ggttaccgat gcactgaata ccgcactgac cgagagccta aggcagttag 2100
caaaggaggc aggactgcaa agctacgaac tgccgcgtga atttctggtt gagaccgagc 2160
cgtttaccgt agaaaatggg ctgttaagcg ggattgcaaa gctgctacgt cctaaattaa 2220
aagaacatta cggtgaaagg ttagaacagc tgtatcgtga cattgaggca aatcgtaatg 2280
atgaactgat tgagctgcgt cgtaccgcag cagaactgcc ggttttagag accgtaaccc 2340
gtgctgctag gagcatgtta gggctggcag caagcgaact acgtccggat gcacacttta 2400
ccgacttagg tggggactcg ctgagcgcac tgagcttcag caccctgctg caggatatgt 2460
tagaagttga agttccggtt ggggttattg ttagccctgc aaatagctta gcagacctgg 2520
caaagtatat tgaggcagag cgtcacagcg gagttcgtcg tccgagcctg attagcgttc 2580
atgggcctgg taccgaaatt agggcagcag acttaaccct ggataaattt attgacgaac 2640
gtaccttagc tgcagcaaag gcagtcccgg cagcaccggc acaggcacag accgtactgt 2700
taaccggagc aaatggttac ctgggtcgtt ttctgtgtct ggagtggctg cagaggctgg 2760
atcagaccgg ggggaccctg gtttgtattg ttcgtgggac cgatgcagca gcagcacgca 2820
aacgtctgga cgcagttttt gacagcgggg acccggagct gttagatcat taccgtaaac 2880
tggcagcaga acatttagaa gttttagcag gtgacattgg tgatccgaac ttaggtctgg 2940
atgaggcaac ttggcagcgt ttagcagcaa ccgtcgatct gattgttcat cctgcagcat 3000
tagttaatca cgttctgccg tatagccagc tgtttggacc gaacgttgtt ggtaccgcag 3060
aaattattcg tctggcaatt accgaacgta ggaaacctgt tacctatctg agcaccgttg 3120
cagttgcagc tcaggttgac ccggcaggtt ttgacgaaga acgtgacatt cgtgaaatga 3180
gcgcagttcg tagcattgac gcaggatatg caaatgggta tggtaatagc aaatgggcag 3240
gtgaagttct gctgcgtgaa gcacacgatc tgtgtggact gccggttgca gtttttcgta 3300
gcgatatgat tctggcacat agcaagtatg ttgggcagtt aaatgttcct gacgttttta 3360
cccgtttaat tctgagcctg gcattaaccg ggattgctcc gtacagcttt tacggaaccg 3420
atagcgcagg acagcgtagg cgtgcacatt acgacgggct gcctgcagac tttgttgcag 3480
aagcaattac caccttaggt gcaagggcag aaagcggatt tcacacctat gatgtttgga 3540
atccgtatga tgatggtatt agcctggatg agtttgttga ttggttaggt gactttggtg 3600
ttccgattca gcgtattgac gactatgatg agtggtttcg taggtttgaa accgcaattc 3660
gtgcactgcc tgagaaacag cgtgacgcta gcctgctacc gctgctggat gctcatcgtc 3720
gtcccctgcg tgcagttcgt gggagcctgc tacctgcaaa aaattttcaa gcagcagttc 3780
agagcgcacg cattggtcct gaccaggata ttccgcacct aagcccgcag ctaattgaca 3840
aatatgttac cgatctgcgt catttaggtc tgttataaag gaggacatac aatggtcgat 3900
atgaaaacta cgcatacctc cctccccttt gccggacata cgctgcattt tgttgagttc 3960
gatccggcga atttttgtga gcaggattta ctctggctgc cgcactacgc acaactgcaa 4020
cacgctggac gtaaacgtaa aacagagcat ttagccggac ggatcgctgc tgtttatgct 4080
ttgcgggaat atggctataa atgtgtgccc gcaatcggcg agctacgcca acctgtctgg 4140
cctgcggagg tatacggcag tattagccac tgtgggacta cggcattagc cgtggtatct 4200
cgtcaaccga ttggcattga tatagaagaa attttttctg tacaaaccgc aagagaattg 4260
acagacaaca ttattacacc agcggaacac gagcgactcg cagactgcgg tttagccttt 4320
tctctggcgc tgacactggc attttccgcc aaagagagcg catttaaggc aagtgagatc 4380
caaactgatg caggttttct ggactatcag ataattagct ggaataaaca gcaggtcatc 4440
attcatcgtg agaatgagat gtttgctgtg cactggcaga taaaagaaaa gatagtcata 4500
acgctgtgcc aacacgatta attgacaaca tctggtacga ttcgcccgca gccatcactg 4560
accacgggcg aaagtgtaaa gcaggtgcct taccatcctg acctgacaac cggatatgcg 4620
ggatccccgg gtaccg 4636
<210> 20
<211> 4522
<212> DNA
<213> 人工序列
<220>
<223> 含有Gordonia effusa的CAR基因(经密码子优化)和大肠杆菌的entD
基因的DNA片段的核苷酸序列
<400> 20
ccaagcttgc atgccagatc gtttagatcc gaaggaaaac gtcgaaaagc aatttgcttt 60
tcgacgcccc accccgcgcg ttttagcgtg tcagtagacg cgtagggtaa gtggggtagc 120
ggcttgttag atatcttgaa atcggctttc aacagcattg atttcgatgt atttagctgg 180
ccgtttgaga cgcgatgtcc acagggtagc tggtagtttg aaaatcaacg ccgttgccct 240
taggattcag taactggcac attttgtaat gcgctagatc tgtgtgccca gtcttccagg 300
ctgcttatca cagtgaaagc aaaaccaatt cgtggctgcg aaagtcgtag ccaccacgaa 360
gtccaggagg acatacaatg agcgatcagc cgaatgcact gccgagcgca attgaaccgc 420
tgaatccgga tccgcaggca accgagcaga ttagccattg tgcaaccatt gcagaactgg 480
ttcgtgttct ggcagaaagc tatggtgatc gtccggcact gggttggcgt aataatagcg 540
atccgagcag ctggcatagc atgacctatc gtgatctggc cgaacgtgca gatagcatgg 600
cacgtctgct gcatagcacc ctgggtgttg cagaaaatga tcgtgttgca accgttggtt 660
ttaccagcgc agaatatacc attgcaagcc tggcagttgg tacactgggt gcaatggaag 720
ttccgctgca gaatgcaggt agcgttgatg tttgggcagc aattctgacc gaaaccgatt 780
gtgttagcgc agttgttgca gcagatcagc tgccgagcat tgcccgtctg gcggaaagcg 840
gcacctatac cggtctgcgt catgttctgg tttttgatat tggtagccgt gatggcacca 900
ccctggatga tgcagcacgt cgtctggttg ccgcaggcac ccaggttcat ctgcgtcagc 960
ctggtgcaga accgaccacc cctccggcac cgctgccgca gattaccgca aacccggatc 1020
gtgtggcact gctgatttat accagcggta gcacaggtgc accgaaaggt gcaatgtata 1080
ccgaaacagc agttacccgt ctgtttcaga gcggtctgag tggtctgggt cgtgcaaccg 1140
atggtcatgg ttggattacc ctgaacttta tgccgatgag ccatgttatg ggtcgtagta 1200
ccctgtggca gaccctgggt aatggtggca ccgcatattt tacaccgcgt gcagatctgg 1260
ctgaactgct gaccgatctg gcagccgttc agccgacgga tctgcagttt gttccgcgta 1320
tttgggatat gctgtatcaa gaatatgttc gtctgacaga tcaggatgtt agcgaacagg 1380
atgcactgac ccgtatgcgt gaacattatt tcggcacccg taccgcaacc gcaattaccg 1440
gtagcgcacc gattagtgat gaagttcgtc gttttgttga agcaatgctg ccggttccgc 1500
tgattgaagg ttatggtagc accgaagcag ccggtgttag cattgatggt cgtattcagc 1560
gtccgcctgt tgttgattat aaactgctgg atgtgccgga actgggttat ctgagcaccg 1620
atcgtccgca tccgcgtggt gagctgctgg ttaaaaccga tcatattttt gccggttatt 1680
acaatcgtcc ggatctgacc agcagcgttt ttgatgatca gggttattat cgtaccggtg 1740
atattgttgc cgaaaccggt ccggatcaga ttgaatatgt tgatcgtcgt aacaacgtga 1800
tgaaactgag ccagggtgaa tttgttgcaa ttgcccatat tgaagcagtt ctgaccaccc 1860
caccgattca gcagctgtat gtttatggta atagcgcacg tccgtatctg ctggccgttg 1920
ttgttccgac accggaactg cgtgaacgtc atgcagatga taatgaactg cgtcgtgaag 1980
ttctgacagc actgcgtagc catggtgaac gtaatggtct ggcagcagtt gaaattccgc 2040
gtgatgttat tgttgaacgt accccgttta gcctggaaaa tggtctgctg acaggtattc 2100
gtaaactggc acgtccgcag ctgaaagaac gttatggtgc acgtctggaa gcactgtatg 2160
ccgaactggc cgatagccgt attacacgtc tgcgtgatgt gaaagcagtt gcagcccagc 2220
gtagcaccgt taccaccgtt attgatgttg ttaccgcaat tctggatctg gcggatggtg 2280
aagttaccgc agcagcacat tttacagatc tgggtggtga tagcctgacc gcagttaccg 2340
ttggtaacga actgcgcgat atttttgatg ccgaagttcc ggttggtgtg ctgaccagcc 2400
cgagcagtac cctggcagat attgcggaac atattgatgg ccgtcatagc gaagcacgtc 2460
cgaccgcaga aagcgttcat ggcaccggta caaccctgcg tgcagccgat ctgaccctgg 2520
ataaatttct ggatgaagaa acactgcgtg ccgcaagtga tgttaccagt gcagccaccg 2580
atgttcgtac cgtgtttatt accggtgcaa ccggttttct gggtcgctac ctgacactgg 2640
attggctgcg tcgtatggca aaagttggtg gtacagttat ttgtctggtg cgtggtgccg 2700
atgatgacgc agcccgtgcg cgtctggatg cagcatttga tagcagcgat ctgtggtctg 2760
aatatcagcg tctggcaaaa gatcatctgc gcgtgctggc aggcgataaa gatagcgatc 2820
atctggcact gacaccggat gtgtgggatg aactggcaaa aagcgttgat ctgattattg 2880
atccggcagc actggttaat catgtactgc cgtatcgcga actgtttggt ccgaatgtta 2940
gcggcaccgc agaactgatc cgtctggcag ttaccaccac ccgtaaaccg tatgtgtata 3000
tttcaaccgt gggtgttggt gatcaggttg ctccgggtag ctttaccgaa gatcctgata 3060
ttcgtgaaat gagcagcgtg cgtgaaatca atgataccta tgcaaatggt tacggcaata 3120
gcaaatgggc aggcgaagtt ctgctggcac aggcacatga acgttttgaa ctgccggtta 3180
gcgtttttcg ttgtgatatg attgttgcgg atgatcatac cattggtcag ctgaatctgc 3240
cggatatgtt tactcgcctg ctgatgagcg ttctggcaac aggtctggca ccgcgtagct 3300
tttatcagct ggcgaccgat ggtagtgcac aagaggcaca ttttgatgcg ctgccggtgg 3360
atttcctggc cgaagcaatt aatacactgt gggttaaaga tggtgcccgt acctttaatg 3420
caatgaatcc gcatgccgat ggtattggtt ttgatcagta tattcgttgg ctgattgata 3480
gcggtgaaca aattagcctg gtggataatt atgatgattg gtatcgtcgc tttggtgccg 3540
cactggcgga tctgcctgaa aaacagcgtc gtggtagcct gattccgctg ctgcacaatt 3600
atgttcatcc gatgacaccg cataatcgtg gtatggcaag cgcagatcgt tttcatgatg 3660
cagttcgtac agcaggcgtt ggtcagagca gcgatattcc gcatattacc cctcagatta 3720
ttgaaaatta tgcacgtagc ctgcgtggcc tgggtgtgat ttaaaggagg acatacaatg 3780
gtcgatatga aaactacgca tacctccctc ccctttgccg gacatacgct gcattttgtt 3840
gagttcgatc cggcgaattt ttgtgagcag gatttactct ggctgccgca ctacgcacaa 3900
ctgcaacacg ctggacgtaa acgtaaaaca gagcatttag ccggacggat cgctgctgtt 3960
tatgctttgc gggaatatgg ctataaatgt gtgcccgcaa tcggcgagct acgccaacct 4020
gtctggcctg cggaggtata cggcagtatt agccactgtg ggactacggc attagccgtg 4080
gtatctcgtc aaccgattgg cattgatata gaagaaattt tttctgtaca aaccgcaaga 4140
gaattgacag acaacattat tacaccagcg gaacacgagc gactcgcaga ctgcggttta 4200
gccttttctc tggcgctgac actggcattt tccgccaaag agagcgcatt taaggcaagt 4260
gagatccaaa ctgatgcagg ttttctggac tatcagataa ttagctggaa taaacagcag 4320
gtcatcattc atcgtgagaa tgagatgttt gctgtgcact ggcagataaa agaaaagata 4380
gtcataacgc tgtgccaaca cgattaattg acaacatctg gtacgattcg cccgcagcca 4440
tcactgacca cgggcgaaag tgtaaagcag gtgccttacc atcctgacct gacaaccgga 4500
tatgcgggat ccccgggtac cg 4522
<210> 21
<211> 621
<212> DNA
<213> 大肠杆菌
<400> 21
atgaaaacta cgcatacctc cctccccttt gccggacata cgctgcattt tgttgagttc 60
gatccggcga atttttgtga gcaggattta ctctggctgc cgcactacgc acaactgcaa 120
cacgctggac gtaaacgtaa aacagagcat ttagccggac ggatcgctgc tgtttatgct 180
ttgcgggaat atggctataa atgtgtgccc gcaatcggcg agctacgcca acctgtctgg 240
cctgcggagg tatacggcag tattagccac tgtgggacta cggcattagc cgtggtatct 300
cgtcaaccga ttggcattga tatagaagaa attttttctg tacaaaccgc aagagaattg 360
acagacaaca ttattacacc agcggaacac gagcgactcg cagactgcgg tttagccttt 420
tctctggcgc tgacactggc attttccgcc aaagagagcg catttaaggc aagtgagatc 480
caaactgatg caggttttct ggactatcag ataattagct ggaataaaca gcaggtcatc 540
attcatcgtg agaatgagat gtttgctgtg cactggcaga taaaagaaaa gatagtcata 600
acgctgtgcc aacacgatta a 621
<210> 22
<211> 206
<212> PRT
<213> 大肠杆菌
<400> 22
Met Lys Thr Thr His Thr Ser Leu Pro Phe Ala Gly His Thr Leu His
1 5 10 15
Phe Val Glu Phe Asp Pro Ala Asn Phe Cys Glu Gln Asp Leu Leu Trp
20 25 30
Leu Pro His Tyr Ala Gln Leu Gln His Ala Gly Arg Lys Arg Lys Thr
35 40 45
Glu His Leu Ala Gly Arg Ile Ala Ala Val Tyr Ala Leu Arg Glu Tyr
50 55 60
Gly Tyr Lys Cys Val Pro Ala Ile Gly Glu Leu Arg Gln Pro Val Trp
65 70 75 80
Pro Ala Glu Val Tyr Gly Ser Ile Ser His Cys Gly Thr Thr Ala Leu
85 90 95
Ala Val Val Ser Arg Gln Pro Ile Gly Ile Asp Ile Glu Glu Ile Phe
100 105 110
Ser Val Gln Thr Ala Arg Glu Leu Thr Asp Asn Ile Ile Thr Pro Ala
115 120 125
Glu His Glu Arg Leu Ala Asp Cys Gly Leu Ala Phe Ser Leu Ala Leu
130 135 140
Thr Leu Ala Phe Ser Ala Lys Glu Ser Ala Phe Lys Ala Ser Glu Ile
145 150 155 160
Gln Thr Asp Ala Gly Phe Leu Asp Tyr Gln Ile Ile Ser Trp Asn Lys
165 170 175
Gln Gln Val Ile Ile His Arg Glu Asn Glu Met Phe Ala Val His Trp
180 185 190
Gln Ile Lys Glu Lys Ile Val Ile Thr Leu Cys Gln His Asp
195 200 205
<210> 23
<211> 654
<212> DNA
<213> 谷氨酸棒杆菌
<400> 23
atgctggatg agtctttgtt tccaaattcg gcaaagtttt ctttcattaa aactggcgat 60
gctgttaatt tagaccattt ccatcagttg catccgttgg aaaaggcact ggtagcgcac 120
tcggttgata ttagaaaagc agagtttgga gatgccaggt ggtgtgcaca tcaggcactc 180
caagctttgg gacgagatag cggtgatccc attttgcgtg gggaacgagg aatgccattg 240
tggccttctt cggtgtctgg ttcattgacc cacactgacg gattccgagc tgctgttgtg 300
gcgccacgat tgttggtgcg ttctatggga ttggatgccg aacctgcgga gccgttgccc 360
aaggatgttt tgggttcaat cgctcgggtg ggggagattc ctcaacttaa gcgcttggag 420
gaacaaggtg tgcactgcgc ggatcgcctg ctgttttgtg ccaaggaagc aacatacaaa 480
gcgtggttcc cgctgacgca taggtggctt ggttttgaac aagctgagat cgacttgcgt 540
gatgatggca cttttgtgtc ctatttgctg gttcgaccaa ctccagtgcc gtttatttca 600
ggtaaatggg tactgcgtga tggttatgtc atagctgcga ctgcagtgac ttga 654
<210> 24
<211> 217
<212> PRT
<213> 谷氨酸棒杆菌
<400> 24
Met Leu Asp Glu Ser Leu Phe Pro Asn Ser Ala Lys Phe Ser Phe Ile
1 5 10 15
Lys Thr Gly Asp Ala Val Asn Leu Asp His Phe His Gln Leu His Pro
20 25 30
Leu Glu Lys Ala Leu Val Ala His Ser Val Asp Ile Arg Lys Ala Glu
35 40 45
Phe Gly Asp Ala Arg Trp Cys Ala His Gln Ala Leu Gln Ala Leu Gly
50 55 60
Arg Asp Ser Gly Asp Pro Ile Leu Arg Gly Glu Arg Gly Met Pro Leu
65 70 75 80
Trp Pro Ser Ser Val Ser Gly Ser Leu Thr His Thr Asp Gly Phe Arg
85 90 95
Ala Ala Val Val Ala Pro Arg Leu Leu Val Arg Ser Met Gly Leu Asp
100 105 110
Ala Glu Pro Ala Glu Pro Leu Pro Lys Asp Val Leu Gly Ser Ile Ala
115 120 125
Arg Val Gly Glu Ile Pro Gln Leu Lys Arg Leu Glu Glu Gln Gly Val
130 135 140
His Cys Ala Asp Arg Leu Leu Phe Cys Ala Lys Glu Ala Thr Tyr Lys
145 150 155 160
Ala Trp Phe Pro Leu Thr His Arg Trp Leu Gly Phe Glu Gln Ala Glu
165 170 175
Ile Asp Leu Arg Asp Asp Gly Thr Phe Val Ser Tyr Leu Leu Val Arg
180 185 190
Pro Thr Pro Val Pro Phe Ile Ser Gly Lys Trp Val Leu Arg Asp Gly
195 200 205
Tyr Val Ile Ala Ala Thr Ala Val Thr
210 215
<210> 25
<211> 1428
<212> DNA
<213> 谷氨酸棒杆菌
<400> 25
atgcgcctgc gtgtctcgag tagtctcctc cccttcctcg tccccaacct cgaccattac 60
ggtcgccctc tcctaaagga gcctggcatg gatatccgcc aaacaattaa cgacacagca 120
atgtcgagat atcagtggtt cattgtattt atcgcagtgc tgctcaacgc actggacggc 180
tttgatgtcc tcgccatgtc ttttactgcg aatgcagtga ccgaagaatt tggactgagt 240
ggcagccagc ttggtgtgct gctgagttcc gcgctgttcg gcatgaccgc tggatctttg 300
ctgttcggtc cgatcggtga ccgtttcggc cgtaagaatg ccctgatgat cgcgctgctg 360
ttcaacgtgg tgggattggt attgtccgcc accgcgcagt ccgcaggcca gttgggcgtg 420
tggcgtttga tcactggtat cggcatcggc ggaatcctcg cctgcatcac agtggtgatc 480
agtgagttct ccaacaacaa aaaccgcggc atggccatgt ccatctacgc tgctggttac 540
ggcatcggcg cgtccttggg cggattcggc gcagcgcagc tcatcccaac atttggatgg 600
cgctccgtgt tcgcagccgg tgcgatcgca actggtatcg ccaccatcgc tactttcttc 660
ttcctgccag aatccgttga ttggctgagc actcgccgcc ctgcgggcgc tcgcgacaag 720
atcaattaca ttgcgcgccg cctgggcaaa gtcggtacct ttgagcttcc aggcgaacaa 780
agcttgtcga cgaaaaaagc cggtctccaa tcgtatgcag tgctcgttaa caaagagaac 840
cgtggaacca gcatcaagct gtgggttgcg ttcggcatcg tgatgttcgg cttctacttc 900
gccaacactt ggaccccgaa gctgctcgtg gaaaccggaa tgtcagaaca gcagggcatc 960
atcggtggtt tgatgttgtc catgggtgga gcattcggtt ccctgctcta cggtttcctc 1020
accaccaagt tcagctcccg aaacacactg atgaccttca tggtgctgtc cggcctgacg 1080
ctgatcctgt tcatttcctc cacctctgtt ccatccatcg cgtttgccag cggcgttgtc 1140
gtgggcatgc tgatcaatgg ttgtgtggct ggtctgtaca ccctgtcccc acagctgtac 1200
tccgctgaag tacgcaccac tggtgtgggc gctgcgattg gtatgggtcg tgtcggtgcg 1260
atttccgcgc cactgctggt gggtagcctg ctggattctg gctggtcccc aacgcagctg 1320
tatgttggtg tggcagtgat tgttattgcc ggtgcaaccg cattgattgg gatgcgcact 1380
caggcagtag ccgtcgaaaa gcagcctgaa gccctagcga ccaaatag 1428
<210> 26
<211> 475
<212> PRT
<213> 谷氨酸棒杆菌
<400> 26
Met Arg Leu Arg Val Ser Ser Ser Leu Leu Pro Phe Leu Val Pro Asn
1 5 10 15
Leu Asp His Tyr Gly Arg Pro Leu Leu Lys Glu Pro Gly Met Asp Ile
20 25 30
Arg Gln Thr Ile Asn Asp Thr Ala Met Ser Arg Tyr Gln Trp Phe Ile
35 40 45
Val Phe Ile Ala Val Leu Leu Asn Ala Leu Asp Gly Phe Asp Val Leu
50 55 60
Ala Met Ser Phe Thr Ala Asn Ala Val Thr Glu Glu Phe Gly Leu Ser
65 70 75 80
Gly Ser Gln Leu Gly Val Leu Leu Ser Ser Ala Leu Phe Gly Met Thr
85 90 95
Ala Gly Ser Leu Leu Phe Gly Pro Ile Gly Asp Arg Phe Gly Arg Lys
100 105 110
Asn Ala Leu Met Ile Ala Leu Leu Phe Asn Val Val Gly Leu Val Leu
115 120 125
Ser Ala Thr Ala Gln Ser Ala Gly Gln Leu Gly Val Trp Arg Leu Ile
130 135 140
Thr Gly Ile Gly Ile Gly Gly Ile Leu Ala Cys Ile Thr Val Val Ile
145 150 155 160
Ser Glu Phe Ser Asn Asn Lys Asn Arg Gly Met Ala Met Ser Ile Tyr
165 170 175
Ala Ala Gly Tyr Gly Ile Gly Ala Ser Leu Gly Gly Phe Gly Ala Ala
180 185 190
Gln Leu Ile Pro Thr Phe Gly Trp Arg Ser Val Phe Ala Ala Gly Ala
195 200 205
Ile Ala Thr Gly Ile Ala Thr Ile Ala Thr Phe Phe Phe Leu Pro Glu
210 215 220
Ser Val Asp Trp Leu Ser Thr Arg Arg Pro Ala Gly Ala Arg Asp Lys
225 230 235 240
Ile Asn Tyr Ile Ala Arg Arg Leu Gly Lys Val Gly Thr Phe Glu Leu
245 250 255
Pro Gly Glu Gln Ser Leu Ser Thr Lys Lys Ala Gly Leu Gln Ser Tyr
260 265 270
Ala Val Leu Val Asn Lys Glu Asn Arg Gly Thr Ser Ile Lys Leu Trp
275 280 285
Val Ala Phe Gly Ile Val Met Phe Gly Phe Tyr Phe Ala Asn Thr Trp
290 295 300
Thr Pro Lys Leu Leu Val Glu Thr Gly Met Ser Glu Gln Gln Gly Ile
305 310 315 320
Ile Gly Gly Leu Met Leu Ser Met Gly Gly Ala Phe Gly Ser Leu Leu
325 330 335
Tyr Gly Phe Leu Thr Thr Lys Phe Ser Ser Arg Asn Thr Leu Met Thr
340 345 350
Phe Met Val Leu Ser Gly Leu Thr Leu Ile Leu Phe Ile Ser Ser Thr
355 360 365
Ser Val Pro Ser Ile Ala Phe Ala Ser Gly Val Val Val Gly Met Leu
370 375 380
Ile Asn Gly Cys Val Ala Gly Leu Tyr Thr Leu Ser Pro Gln Leu Tyr
385 390 395 400
Ser Ala Glu Val Arg Thr Thr Gly Val Gly Ala Ala Ile Gly Met Gly
405 410 415
Arg Val Gly Ala Ile Ser Ala Pro Leu Leu Val Gly Ser Leu Leu Asp
420 425 430
Ser Gly Trp Ser Pro Thr Gln Leu Tyr Val Gly Val Ala Val Ile Val
435 440 445
Ile Ala Gly Ala Thr Ala Leu Ile Gly Met Arg Thr Gln Ala Val Ala
450 455 460
Val Glu Lys Gln Pro Glu Ala Leu Ala Thr Lys
465 470 475
<210> 27
<211> 1296
<212> DNA
<213> 谷氨酸棒杆菌
<400> 27
gtgtcaacga ccaccccaac ccgcgcaacc aaaagtgtcg gaacagttct cgcactcctg 60
tggttcgcaa ttgtcctcga cggctttgac ctagtcgtcc tgggcgcaac aatcccgtcc 120
atgctggagg atcccgcgtg ggatctcact gctggacagg ccacacagat ttccaccatc 180
ggcctcgtcg gcatgaccat cggcgcactg accattggtt tcttaactga ccgtctgggt 240
cgacgccgcg tcatgctgtt ctctgtggca gtgttttctg tattcaccct cctgctggca 300
ttcaccacca acgtccagct cttcagcctg tggcgtttcc tcgcaggtgt tggccttggt 360
ggagcactcc ccaccgcaat tgccatggtg accgagtttc gccccggcac caaagcgggc 420
tctgcatcaa ctaccttgat gaccggatac cacgtcgggg cagtagcaac cgctttcctt 480
ggtctcttcc ttatcgacgg ctttggttgg cactccatgt tcatcgcagg cgctgtgcca 540
ggactactcc tgctgccact gctgtatttc ttccttccag aatccccgca gtacctcaaa 600
atctccggca agttggatga ggcgcaggca gttgcagcat cttatggact ttccctggat 660
gatgatcttg atcgcgaaca cgaagaagaa cttggcgagt cctcctcact ttcctccctg 720
ttcaagccct cgttccgccg caacaccctg gcgatttggg gcacctcatt catgggactc 780
ctcctggtct acggcctgaa cacatggctg ccacaaatca tgcgccaagc agactacgac 840
atgggtaact ccctgggctt cctcatggtt cttaacatcg gcgcagtgat cggcctttat 900
attgcagggc gaattgccga taagaactcc cctcgcaaaa cagcactcgt atggttcgtg 960
ttctctgcat ttttcctcgc actacttgct gtccggatgc cactgatcgg tctgtatggc 1020
atcgtgctgc tcaccggcat ctttgtgttc agctcccagg tactcatcta cgccttcgtt 1080
ggtgagaatc accctgccaa gatgcgtgca actgccatgg gattctccgc aggaattggt 1140
cgcctcggcg cgatctcggg tccgttgctg ggcggcctgc ttgtcagtgc caaccttgct 1200
tacccatggg gcttcttcgc cttcgctggc gttggactgc tgggcgcgct gattttctcc 1260
gcatcgaaga ctctgaggca tcgcgagaac gcttag 1296
<210> 28
<211> 431
<212> PRT
<213> 谷氨酸棒杆菌
<400> 28
Met Ser Thr Thr Thr Pro Thr Arg Ala Thr Lys Ser Val Gly Thr Val
1 5 10 15
Leu Ala Leu Leu Trp Phe Ala Ile Val Leu Asp Gly Phe Asp Leu Val
20 25 30
Val Leu Gly Ala Thr Ile Pro Ser Met Leu Glu Asp Pro Ala Trp Asp
35 40 45
Leu Thr Ala Gly Gln Ala Thr Gln Ile Ser Thr Ile Gly Leu Val Gly
50 55 60
Met Thr Ile Gly Ala Leu Thr Ile Gly Phe Leu Thr Asp Arg Leu Gly
65 70 75 80
Arg Arg Arg Val Met Leu Phe Ser Val Ala Val Phe Ser Val Phe Thr
85 90 95
Leu Leu Leu Ala Phe Thr Thr Asn Val Gln Leu Phe Ser Leu Trp Arg
100 105 110
Phe Leu Ala Gly Val Gly Leu Gly Gly Ala Leu Pro Thr Ala Ile Ala
115 120 125
Met Val Thr Glu Phe Arg Pro Gly Thr Lys Ala Gly Ser Ala Ser Thr
130 135 140
Thr Leu Met Thr Gly Tyr His Val Gly Ala Val Ala Thr Ala Phe Leu
145 150 155 160
Gly Leu Phe Leu Ile Asp Gly Phe Gly Trp His Ser Met Phe Ile Ala
165 170 175
Gly Ala Val Pro Gly Leu Leu Leu Leu Pro Leu Leu Tyr Phe Phe Leu
180 185 190
Pro Glu Ser Pro Gln Tyr Leu Lys Ile Ser Gly Lys Leu Asp Glu Ala
195 200 205
Gln Ala Val Ala Ala Ser Tyr Gly Leu Ser Leu Asp Asp Asp Leu Asp
210 215 220
Arg Glu His Glu Glu Glu Leu Gly Glu Ser Ser Ser Leu Ser Ser Leu
225 230 235 240
Phe Lys Pro Ser Phe Arg Arg Asn Thr Leu Ala Ile Trp Gly Thr Ser
245 250 255
Phe Met Gly Leu Leu Leu Val Tyr Gly Leu Asn Thr Trp Leu Pro Gln
260 265 270
Ile Met Arg Gln Ala Asp Tyr Asp Met Gly Asn Ser Leu Gly Phe Leu
275 280 285
Met Val Leu Asn Ile Gly Ala Val Ile Gly Leu Tyr Ile Ala Gly Arg
290 295 300
Ile Ala Asp Lys Asn Ser Pro Arg Lys Thr Ala Leu Val Trp Phe Val
305 310 315 320
Phe Ser Ala Phe Phe Leu Ala Leu Leu Ala Val Arg Met Pro Leu Ile
325 330 335
Gly Leu Tyr Gly Ile Val Leu Leu Thr Gly Ile Phe Val Phe Ser Ser
340 345 350
Gln Val Leu Ile Tyr Ala Phe Val Gly Glu Asn His Pro Ala Lys Met
355 360 365
Arg Ala Thr Ala Met Gly Phe Ser Ala Gly Ile Gly Arg Leu Gly Ala
370 375 380
Ile Ser Gly Pro Leu Leu Gly Gly Leu Leu Val Ser Ala Asn Leu Ala
385 390 395 400
Tyr Pro Trp Gly Phe Phe Ala Phe Ala Gly Val Gly Leu Leu Gly Ala
405 410 415
Leu Ile Phe Ser Ala Ser Lys Thr Leu Arg His Arg Glu Asn Ala
420 425 430
<210> 29
<211> 1131
<212> DNA
<213> 谷氨酸棒杆菌
<400> 29
atgacactgt ccgaacgcaa gctcaccacc accgccaaga ttcttcccca cccactcaac 60
gcctggtacg tcgccgcttg ggattatgaa gtcacatcta aaaagcccat ggccaggaca 120
atcgccaaca aaccactcgc tttgtaccgc accaaagatg gccgagccgt tgcccttgca 180
gacgcctgct ggcaccgcct cgcaccgcta tccaagggaa aactcgtggg cacagacgga 240
atccaatgcc cttatcacgg cttggagtac aactccgcgg gccgctgcat gaaaatgccc 300
gcgcaggaaa ccctcaaccc gtcagcagcc gtcaactcct accccgtggt ggaagcccac 360
cgctttgtgt gggtgtggct gggcgatccc acattggcag atcccaccca agtacccgat 420
atgcaccaga tgagccaccc cgaatgggca ggcgatggac gcaccatctc cgctgactgc 480
aactaccaat tagtgctgga caacttgatg gacctcaccc acgaagaatt cgtgcactcc 540
tccagcatcg gccaagacga acttagtgaa tcagagttcg tggtcaccca cactgaagat 600
tccgtgacgg tcacccgctg gatgcatgac atagatgcac caccgttttg gcaaaagaac 660
atgaatgata agttcccagg atttgaaggc aaggtggatc gttggcagat catccactac 720
tactaccctt ccaccatctg cattgatgtt ggtgtagcaa aggctggaac cggcgcgcag 780
gaaggcgacc gcagccaggg cgttaatggg tatgtaatga acaccattac cccagattca 840
gatcgttcct ctcattactt ctgggcattc atgcgcaact accgcctgga aagccaaacc 900
atcaccaccc agctgcgcga cggtgtatcc ggtgtattca aagaagacga agacatgctg 960
accgctcagc aagatgccat cgacgccaac accgactatg agttttacag cctcaacatt 1020
gatgccggtg gcatgtgggt gcgccgaatc ctcgaggaag cactctccaa ggaaggccga 1080
ctggatatcc ccaccacatt cccccgcgca acaccgaagc cggaggcata a 1131
<210> 30
<211> 376
<212> PRT
<213> 谷氨酸棒杆菌
<400> 30
Met Thr Leu Ser Glu Arg Lys Leu Thr Thr Thr Ala Lys Ile Leu Pro
1 5 10 15
His Pro Leu Asn Ala Trp Tyr Val Ala Ala Trp Asp Tyr Glu Val Thr
20 25 30
Ser Lys Lys Pro Met Ala Arg Thr Ile Ala Asn Lys Pro Leu Ala Leu
35 40 45
Tyr Arg Thr Lys Asp Gly Arg Ala Val Ala Leu Ala Asp Ala Cys Trp
50 55 60
His Arg Leu Ala Pro Leu Ser Lys Gly Lys Leu Val Gly Thr Asp Gly
65 70 75 80
Ile Gln Cys Pro Tyr His Gly Leu Glu Tyr Asn Ser Ala Gly Arg Cys
85 90 95
Met Lys Met Pro Ala Gln Glu Thr Leu Asn Pro Ser Ala Ala Val Asn
100 105 110
Ser Tyr Pro Val Val Glu Ala His Arg Phe Val Trp Val Trp Leu Gly
115 120 125
Asp Pro Thr Leu Ala Asp Pro Thr Gln Val Pro Asp Met His Gln Met
130 135 140
Ser His Pro Glu Trp Ala Gly Asp Gly Arg Thr Ile Ser Ala Asp Cys
145 150 155 160
Asn Tyr Gln Leu Val Leu Asp Asn Leu Met Asp Leu Thr His Glu Glu
165 170 175
Phe Val His Ser Ser Ser Ile Gly Gln Asp Glu Leu Ser Glu Ser Glu
180 185 190
Phe Val Val Thr His Thr Glu Asp Ser Val Thr Val Thr Arg Trp Met
195 200 205
His Asp Ile Asp Ala Pro Pro Phe Trp Gln Lys Asn Met Asn Asp Lys
210 215 220
Phe Pro Gly Phe Glu Gly Lys Val Asp Arg Trp Gln Ile Ile His Tyr
225 230 235 240
Tyr Tyr Pro Ser Thr Ile Cys Ile Asp Val Gly Val Ala Lys Ala Gly
245 250 255
Thr Gly Ala Gln Glu Gly Asp Arg Ser Gln Gly Val Asn Gly Tyr Val
260 265 270
Met Asn Thr Ile Thr Pro Asp Ser Asp Arg Ser Ser His Tyr Phe Trp
275 280 285
Ala Phe Met Arg Asn Tyr Arg Leu Glu Ser Gln Thr Ile Thr Thr Gln
290 295 300
Leu Arg Asp Gly Val Ser Gly Val Phe Lys Glu Asp Glu Asp Met Leu
305 310 315 320
Thr Ala Gln Gln Asp Ala Ile Asp Ala Asn Thr Asp Tyr Glu Phe Tyr
325 330 335
Ser Leu Asn Ile Asp Ala Gly Gly Met Trp Val Arg Arg Ile Leu Glu
340 345 350
Glu Ala Leu Ser Lys Glu Gly Arg Leu Asp Ile Pro Thr Thr Phe Pro
355 360 365
Arg Ala Thr Pro Lys Pro Glu Ala
370 375
<210> 31
<211> 978
<212> DNA
<213> 谷氨酸棒杆菌
<400> 31
atgaactcgc aatggcaaga tgcacatgtt gtttccagcg aaatcatcgc tgcagacatt 60
cgacgaatag aactatcccc gaaatttgcg attccagtaa aacccggcga acatctcaag 120
atcatggtgc ccctaaaaac tggacaggaa aagagatcgt actccatcgt tgacgctcgt 180
cacgacggtt cgactctcgc cctgagcgta ctcaaaacca gaaactcccg tggaggatct 240
gagttcatgc atacgcttcg agctggagac acagttactg tctccaggcc gtctcaggat 300
tttcctctcc gcgtgggtgc gcctgagtat gtacttgttg ccggcggaat tggaatcaca 360
gcgatccgtt caatggcatc tttattaaag aaattgggag caaactaccg cattcatttc 420
gcagcacgca gccttgatgc catggcttac aaagatgagc tcgtggcaga acacggcgac 480
aagctgcacc tgcatctaga ttctgaaggc accaccatcg atgtcccagc attgatcgaa 540
accttaaacc cccacactga gctttatatg tgcggcccca tccgcttgat ggatgccatc 600
cggcgcgcat ggaacacccg cggacttgac cccaccaatc tgcgtttcga aacgtttgga 660
aacagtggat ggttctcccc agaggttttc cacatccaag taccagagct ggggcttcac 720
gccacagtca acaaggatga aagcatgctg gaggctttgc aaaaggctgg ggcgaatatg 780
atgtttgatt gtcgaaaagg cgaatgtggt ttgtgccagg ttcgcgttct agaagtcgat 840
ggccaggttg atcaccgcga tgtgttcttc tctgatcgtc aaaaagaatc cgacgcaaag 900
gcatgcgcct gcgtgtctcg agtagtctcc tccccttcct cgtccccaac ctcgaccatt 960
acggtcgccc tctcctaa 978
<210> 32
<211> 325
<212> PRT
<213> 谷氨酸棒杆菌
<400> 32
Met Asn Ser Gln Trp Gln Asp Ala His Val Val Ser Ser Glu Ile Ile
1 5 10 15
Ala Ala Asp Ile Arg Arg Ile Glu Leu Ser Pro Lys Phe Ala Ile Pro
20 25 30
Val Lys Pro Gly Glu His Leu Lys Ile Met Val Pro Leu Lys Thr Gly
35 40 45
Gln Glu Lys Arg Ser Tyr Ser Ile Val Asp Ala Arg His Asp Gly Ser
50 55 60
Thr Leu Ala Leu Ser Val Leu Lys Thr Arg Asn Ser Arg Gly Gly Ser
65 70 75 80
Glu Phe Met His Thr Leu Arg Ala Gly Asp Thr Val Thr Val Ser Arg
85 90 95
Pro Ser Gln Asp Phe Pro Leu Arg Val Gly Ala Pro Glu Tyr Val Leu
100 105 110
Val Ala Gly Gly Ile Gly Ile Thr Ala Ile Arg Ser Met Ala Ser Leu
115 120 125
Leu Lys Lys Leu Gly Ala Asn Tyr Arg Ile His Phe Ala Ala Arg Ser
130 135 140
Leu Asp Ala Met Ala Tyr Lys Asp Glu Leu Val Ala Glu His Gly Asp
145 150 155 160
Lys Leu His Leu His Leu Asp Ser Glu Gly Thr Thr Ile Asp Val Pro
165 170 175
Ala Leu Ile Glu Thr Leu Asn Pro His Thr Glu Leu Tyr Met Cys Gly
180 185 190
Pro Ile Arg Leu Met Asp Ala Ile Arg Arg Ala Trp Asn Thr Arg Gly
195 200 205
Leu Asp Pro Thr Asn Leu Arg Phe Glu Thr Phe Gly Asn Ser Gly Trp
210 215 220
Phe Ser Pro Glu Val Phe His Ile Gln Val Pro Glu Leu Gly Leu His
225 230 235 240
Ala Thr Val Asn Lys Asp Glu Ser Met Leu Glu Ala Leu Gln Lys Ala
245 250 255
Gly Ala Asn Met Met Phe Asp Cys Arg Lys Gly Glu Cys Gly Leu Cys
260 265 270
Gln Val Arg Val Leu Glu Val Asp Gly Gln Val Asp His Arg Asp Val
275 280 285
Phe Phe Ser Asp Arg Gln Lys Glu Ser Asp Ala Lys Ala Cys Ala Cys
290 295 300
Val Ser Arg Val Val Ser Ser Pro Ser Ser Ser Pro Thr Ser Thr Ile
305 310 315 320
Thr Val Ala Leu Ser
325
<210> 33
<211> 615
<212> DNA
<213> 谷氨酸棒杆菌
<400> 33
atgattgata cagggaagaa cggcgagttc cgctacgagc agtcgaatat catcgatcag 60
aacgaagccg agttcggcat cactccttca cagaccgtgg gcccttacgt ccacatcggt 120
ttgacccttg aaggtgcgga gcatctcgtg gagccaggtt cggaaggcgc ggtgtccttt 180
actgtttccg caactgatgg caacggcgac cccatcgcgg atgccatgtt tgaactgtgg 240
caggccgatc cagagggcat ccacaactct gatttggatc caaaccgcac agcaccagca 300
accgcagatg gcttccgcgg gcttggtcgc gcgatggcaa acgcgcaggg tgaggcaacg 360
ttcaccactt tggttccggg agcattcgca gatgaggcac cacacttcaa ggttggtgtg 420
ttcgcccgtg gcatgctgga gcgtctgtac actcgcgcat acctgccaga cgccgatttg 480
agcaccgacc cagttttggc tgtggtccca gctgatcgac gtgacctcct ggtggctcaa 540
aagaccgatg atggattccg cttcgacatc actgtccagg ctgaagacaa tgaaacccca 600
ttttttggac tctaa 615
<210> 34
<211> 204
<212> PRT
<213> 谷氨酸棒杆菌
<400> 34
Met Ile Asp Thr Gly Lys Asn Gly Glu Phe Arg Tyr Glu Gln Ser Asn
1 5 10 15
Ile Ile Asp Gln Asn Glu Ala Glu Phe Gly Ile Thr Pro Ser Gln Thr
20 25 30
Val Gly Pro Tyr Val His Ile Gly Leu Thr Leu Glu Gly Ala Glu His
35 40 45
Leu Val Glu Pro Gly Ser Glu Gly Ala Val Ser Phe Thr Val Ser Ala
50 55 60
Thr Asp Gly Asn Gly Asp Pro Ile Ala Asp Ala Met Phe Glu Leu Trp
65 70 75 80
Gln Ala Asp Pro Glu Gly Ile His Asn Ser Asp Leu Asp Pro Asn Arg
85 90 95
Thr Ala Pro Ala Thr Ala Asp Gly Phe Arg Gly Leu Gly Arg Ala Met
100 105 110
Ala Asn Ala Gln Gly Glu Ala Thr Phe Thr Thr Leu Val Pro Gly Ala
115 120 125
Phe Ala Asp Glu Ala Pro His Phe Lys Val Gly Val Phe Ala Arg Gly
130 135 140
Met Leu Glu Arg Leu Tyr Thr Arg Ala Tyr Leu Pro Asp Ala Asp Leu
145 150 155 160
Ser Thr Asp Pro Val Leu Ala Val Val Pro Ala Asp Arg Arg Asp Leu
165 170 175
Leu Val Ala Gln Lys Thr Asp Asp Gly Phe Arg Phe Asp Ile Thr Val
180 185 190
Gln Ala Glu Asp Asn Glu Thr Pro Phe Phe Gly Leu
195 200
<210> 35
<211> 693
<212> DNA
<213> 谷氨酸棒杆菌
<400> 35
atggacatcc cacacttcgc cccgacggga ggcgaatact ccccactgca cttcccggag 60
taccggacca ccatcaagcg caacccaagc aacgatctca tcatggttcc tagtcgcctc 120
ggcgagtcca cgggacctgt cttcggcgac cgcgacttgg gagacatcga caacgacatg 180
accaaggtga acggtggcga ggctatcggc cagcgcatct tcgttcacgg ccgtgtcctc 240
ggtttcgatg gcaagccagt tccgcacacc ttggtcgagg cgtggcaggc aaacgccgca 300
ggccgttacc gccacaagaa tgactcctgg ccagcgccac tggatccaca cttcaacggt 360
gttgcacgta ctctcaccga caaggacggc cagtaccact tctggaccgt tatgccaggt 420
aattaccctt ggggtaacca ccacaacgca tggcgcccgg cgcacattca cttctcgctc 480
tatggtcgtc agtttacgga gcgtctggtc acccagatgt acttcccgaa cgatccattg 540
ttcttccagg atccgatcta caacgcggtg ccaaagggtg cacgtgagcg catgatcgca 600
acgttcgact atgacgagac ccgtgaaaac ttcgcgcttg gttacaagtt cgacatcgtc 660
cttcgtggcc gcaacgccac cccatttgag taa 693
<210> 36
<211> 230
<212> PRT
<213> 谷氨酸棒杆菌
<400> 36
Met Asp Ile Pro His Phe Ala Pro Thr Gly Gly Glu Tyr Ser Pro Leu
1 5 10 15
His Phe Pro Glu Tyr Arg Thr Thr Ile Lys Arg Asn Pro Ser Asn Asp
20 25 30
Leu Ile Met Val Pro Ser Arg Leu Gly Glu Ser Thr Gly Pro Val Phe
35 40 45
Gly Asp Arg Asp Leu Gly Asp Ile Asp Asn Asp Met Thr Lys Val Asn
50 55 60
Gly Gly Glu Ala Ile Gly Gln Arg Ile Phe Val His Gly Arg Val Leu
65 70 75 80
Gly Phe Asp Gly Lys Pro Val Pro His Thr Leu Val Glu Ala Trp Gln
85 90 95
Ala Asn Ala Ala Gly Arg Tyr Arg His Lys Asn Asp Ser Trp Pro Ala
100 105 110
Pro Leu Asp Pro His Phe Asn Gly Val Ala Arg Thr Leu Thr Asp Lys
115 120 125
Asp Gly Gln Tyr His Phe Trp Thr Val Met Pro Gly Asn Tyr Pro Trp
130 135 140
Gly Asn His His Asn Ala Trp Arg Pro Ala His Ile His Phe Ser Leu
145 150 155 160
Tyr Gly Arg Gln Phe Thr Glu Arg Leu Val Thr Gln Met Tyr Phe Pro
165 170 175
Asn Asp Pro Leu Phe Phe Gln Asp Pro Ile Tyr Asn Ala Val Pro Lys
180 185 190
Gly Ala Arg Glu Arg Met Ile Ala Thr Phe Asp Tyr Asp Glu Thr Arg
195 200 205
Glu Asn Phe Ala Leu Gly Tyr Lys Phe Asp Ile Val Leu Arg Gly Arg
210 215 220
Asn Ala Thr Pro Phe Glu
225 230
<210> 37
<211> 1164
<212> DNA
<213> 大肠杆菌
<400> 37
atgaacaact ttaatctgca caccccaacc cgcattctgt ttggtaaagg cgcaatcgct 60
ggtttacgcg aacaaattcc tcacgatgct cgcgtattga ttacctacgg cggcggcagc 120
gtgaaaaaaa ccggcgttct cgatcaagtt ctggatgccc tgaaaggcat ggacgtgctg 180
gaatttggcg gtattgagcc aaacccggct tatgaaacgc tgatgaacgc cgtgaaactg 240
gttcgcgaac agaaagtgac tttcctgctg gcggttggcg gcggttctgt actggacggc 300
accaaattta tcgccgcagc ggctaactat ccggaaaata tcgatccgtg gcacattctg 360
caaacgggcg gtaaagagat taaaagcgcc atcccgatgg gctgtgtgct gacgctgcca 420
gcaaccggtt cagaatccaa cgcaggcgcg gtgatctccc gtaaaaccac aggcgacaag 480
caggcgttcc attctgccca tgttcagccg gtatttgccg tgctcgatcc ggtttatacc 540
tacaccctgc cgccgcgtca ggtggctaac ggcgtagtgg acgcctttgt acacaccgtg 600
gaacagtatg ttaccaaacc ggttgatgcc aaaattcagg accgtttcgc agaaggcatt 660
ttgctgacgc taatcgaaga tggtccgaaa gccctgaaag agccagaaaa ctacgatgtg 720
cgcgccaacg tcatgtgggc ggcgactcag gcgctgaacg gtttgattgg cgctggcgta 780
ccgcaggact gggcaacgca tatgctgggc cacgaactga ctgcgatgca cggtctggat 840
cacgcgcaaa cactggctat cgtcctgcct gcactgtgga atgaaaaacg cgataccaag 900
cgcgctaagc tgctgcaata tgctgaacgc gtctggaaca tcactgaagg ttccgatgat 960
gagcgtattg acgccgcgat tgccgcaacc cgcaatttct ttgagcaatt aggcgtgccg 1020
acccacctct ccgactacgg tctggacggc agctccatcc cggctttgct gaaaaaactg 1080
gaagagcacg gcatgaccca actgggcgaa aatcatgaca ttacgttgga tgtcagccgc 1140
cgtatatacg aagccgcccg ctaa 1164
<210> 38
<211> 387
<212> PRT
<213> 大肠杆菌
<400> 38
Met Asn Asn Phe Asn Leu His Thr Pro Thr Arg Ile Leu Phe Gly Lys
1 5 10 15
Gly Ala Ile Ala Gly Leu Arg Glu Gln Ile Pro His Asp Ala Arg Val
20 25 30
Leu Ile Thr Tyr Gly Gly Gly Ser Val Lys Lys Thr Gly Val Leu Asp
35 40 45
Gln Val Leu Asp Ala Leu Lys Gly Met Asp Val Leu Glu Phe Gly Gly
50 55 60
Ile Glu Pro Asn Pro Ala Tyr Glu Thr Leu Met Asn Ala Val Lys Leu
65 70 75 80
Val Arg Glu Gln Lys Val Thr Phe Leu Leu Ala Val Gly Gly Gly Ser
85 90 95
Val Leu Asp Gly Thr Lys Phe Ile Ala Ala Ala Ala Asn Tyr Pro Glu
100 105 110
Asn Ile Asp Pro Trp His Ile Leu Gln Thr Gly Gly Lys Glu Ile Lys
115 120 125
Ser Ala Ile Pro Met Gly Cys Val Leu Thr Leu Pro Ala Thr Gly Ser
130 135 140
Glu Ser Asn Ala Gly Ala Val Ile Ser Arg Lys Thr Thr Gly Asp Lys
145 150 155 160
Gln Ala Phe His Ser Ala His Val Gln Pro Val Phe Ala Val Leu Asp
165 170 175
Pro Val Tyr Thr Tyr Thr Leu Pro Pro Arg Gln Val Ala Asn Gly Val
180 185 190
Val Asp Ala Phe Val His Thr Val Glu Gln Tyr Val Thr Lys Pro Val
195 200 205
Asp Ala Lys Ile Gln Asp Arg Phe Ala Glu Gly Ile Leu Leu Thr Leu
210 215 220
Ile Glu Asp Gly Pro Lys Ala Leu Lys Glu Pro Glu Asn Tyr Asp Val
225 230 235 240
Arg Ala Asn Val Met Trp Ala Ala Thr Gln Ala Leu Asn Gly Leu Ile
245 250 255
Gly Ala Gly Val Pro Gln Asp Trp Ala Thr His Met Leu Gly His Glu
260 265 270
Leu Thr Ala Met His Gly Leu Asp His Ala Gln Thr Leu Ala Ile Val
275 280 285
Leu Pro Ala Leu Trp Asn Glu Lys Arg Asp Thr Lys Arg Ala Lys Leu
290 295 300
Leu Gln Tyr Ala Glu Arg Val Trp Asn Ile Thr Glu Gly Ser Asp Asp
305 310 315 320
Glu Arg Ile Asp Ala Ala Ile Ala Ala Thr Arg Asn Phe Phe Glu Gln
325 330 335
Leu Gly Val Pro Thr His Leu Ser Asp Tyr Gly Leu Asp Gly Ser Ser
340 345 350
Ile Pro Ala Leu Leu Lys Lys Leu Glu Glu His Gly Met Thr Gln Leu
355 360 365
Gly Glu Asn His Asp Ile Thr Leu Asp Val Ser Arg Arg Ile Tyr Glu
370 375 380
Ala Ala Arg
385
<210> 39
<211> 1062
<212> DNA
<213> 谷氨酸棒杆菌
<400> 39
atgagcatcc aagtaaaagc actccagaaa accggccccg aagcaccttt cgaggtcaaa 60
atcattgagc gtcgtgagcc tcgcgctgac gacgtagtta tcgacatcaa agctgccggc 120
atctgccaca gcgatatcca caccatccgc aacgaatggg gcgaggcaca cttcccgctc 180
accgtcggcc acgaaatcgc aggcgttgtc tctgcggttg gctccgatgt aaccaagtgg 240
aaagtcggcg accgcgttgg cgtcggctgc ctagttaact cctgcggcga atgtgaacag 300
tgtgtcgcgg gatttgaaaa caactgcctt cgcggaaacg tcggaaccta caactccgac 360
gacgtcgacg gcaccatcac gcaaggtggc tacgccgaaa aggtagtggt caacgaacgt 420
ttcctctgca gcatcccaga ggaactcgac ttcgatgtcg cagcaccact gctgtgcgca 480
ggcatcacca cctactcccc gatcgctcgc tggaacgtta aagaaggcga caaagtagca 540
gtcatgggcc tcggcgggct cggccacatg ggtgtccaaa tcgccgcagc caagggcgct 600
gacgttaccg ttctgtcccg ttccctgcgc aaggctgaac ttgccaagga actcggcgca 660
gctcgcacgc ttgcgacttc tgatgaggat ttcttcaccg aacacgccgg tgaattcgac 720
ttcatcctca acaccattag cgcatccatc ccagtcgaca agtacctgag ccttctcaag 780
ccacacggtg tcatggctgt tgtcggtctg ccaccagaga agcagccact gagcttcggt 840
gcgctcatcg gcggcggaaa agtcctcacc ggatccaaca ttggcggcat ccctgaaacc 900
caggaaatgc tcgacttctg tgcaaaacac ggcctcggcg cgatgatcga aactgtcggc 960
gtcaacgatg ttgatgcagc ctacgaccgc gttgttgccg gcgacgttca gttccgcgtt 1020
gtcattgata ctgcttcgtt tgcagaggta gaggcggttt ag 1062
<210> 40
<211> 353
<212> PRT
<213> 谷氨酸棒杆菌
<400> 40
Met Ser Ile Gln Val Lys Ala Leu Gln Lys Thr Gly Pro Glu Ala Pro
1 5 10 15
Phe Glu Val Lys Ile Ile Glu Arg Arg Glu Pro Arg Ala Asp Asp Val
20 25 30
Val Ile Asp Ile Lys Ala Ala Gly Ile Cys His Ser Asp Ile His Thr
35 40 45
Ile Arg Asn Glu Trp Gly Glu Ala His Phe Pro Leu Thr Val Gly His
50 55 60
Glu Ile Ala Gly Val Val Ser Ala Val Gly Ser Asp Val Thr Lys Trp
65 70 75 80
Lys Val Gly Asp Arg Val Gly Val Gly Cys Leu Val Asn Ser Cys Gly
85 90 95
Glu Cys Glu Gln Cys Val Ala Gly Phe Glu Asn Asn Cys Leu Arg Gly
100 105 110
Asn Val Gly Thr Tyr Asn Ser Asp Asp Val Asp Gly Thr Ile Thr Gln
115 120 125
Gly Gly Tyr Ala Glu Lys Val Val Val Asn Glu Arg Phe Leu Cys Ser
130 135 140
Ile Pro Glu Glu Leu Asp Phe Asp Val Ala Ala Pro Leu Leu Cys Ala
145 150 155 160
Gly Ile Thr Thr Tyr Ser Pro Ile Ala Arg Trp Asn Val Lys Glu Gly
165 170 175
Asp Lys Val Ala Val Met Gly Leu Gly Gly Leu Gly His Met Gly Val
180 185 190
Gln Ile Ala Ala Ala Lys Gly Ala Asp Val Thr Val Leu Ser Arg Ser
195 200 205
Leu Arg Lys Ala Glu Leu Ala Lys Glu Leu Gly Ala Ala Arg Thr Leu
210 215 220
Ala Thr Ser Asp Glu Asp Phe Phe Thr Glu His Ala Gly Glu Phe Asp
225 230 235 240
Phe Ile Leu Asn Thr Ile Ser Ala Ser Ile Pro Val Asp Lys Tyr Leu
245 250 255
Ser Leu Leu Lys Pro His Gly Val Met Ala Val Val Gly Leu Pro Pro
260 265 270
Glu Lys Gln Pro Leu Ser Phe Gly Ala Leu Ile Gly Gly Gly Lys Val
275 280 285
Leu Thr Gly Ser Asn Ile Gly Gly Ile Pro Glu Thr Gln Glu Met Leu
290 295 300
Asp Phe Cys Ala Lys His Gly Leu Gly Ala Met Ile Glu Thr Val Gly
305 310 315 320
Val Asn Asp Val Asp Ala Ala Tyr Asp Arg Val Val Ala Gly Asp Val
325 330 335
Gln Phe Arg Val Val Ile Asp Thr Ala Ser Phe Ala Glu Val Glu Ala
340 345 350
Val
<210> 41
<211> 1113
<212> DNA
<213> 谷氨酸棒杆菌
<400> 41
gtgtccatga gcactgtcgt gcctggaatt gtcgccctgt ccaagggggc accggtagaa 60
aaagtaaacg ttgttgtccc tgatccaggt gctaacgatg tcatcgtcaa gattcaggcc 120
tgcggtgtgt gccacaccga cttggcctac cgcgatggcg atatttcaga tgagttccct 180
tacctcctcg gccacgaggc agcaggtatt gttgaggagg taggcgagtc cgtcacccac 240
gttgaggtcg gcgatttcgt catcttgaac tggcgtgcag tgtgcggcga gtgccgtgca 300
tgtaagaagg gcgagccaaa gtactgcttt aacacccaca acgcatctaa gaagatgacc 360
ctggaagacg gcaccgagct gtccccagca ctgggtattg gcgcgttctt ggaaaagacc 420
ctggtccacg aaggccagtg caccaaggtt aaccctgagg aagatccagc agcagctggc 480
cttctgggtt gcggcatcat ggcaggtctt ggtgctgcgg taaacaccgg tgatattaag 540
cgcggcgagt ccgtggcagt cttcggcctt ggtggcgtgg gcatggcagc tattgctggc 600
gccaagattg ctggtgcatc gaagattatt gctgttgata tcgatgagaa gaagttggag 660
tgggcgaagg aattcggcgc aacccacacc attaattcct ctggtcttgg tggcgagggt 720
gatgcctctg aggtcgtggc aaaggttcgt gagctcactg atggtttcgg tactgacgtc 780
tccatcgatg cggtaggcat catgccgacc tggcagcagg cgttttactc ccgtgatcat 840
gcaggccgca tggtgatggt gggcgttcca aacctgacgt ctcgcgtaga tgttcctgcg 900
attgattttt acggtcgcgg tggctctgtg cgccctgcat ggtacggcga ctgcctgcct 960
gagcgtgatt tcccaactta tgtggatctg cacctgcagg gtcgtttccc gctggataag 1020
tttgtttctg agcgtattgg tcttgatgat gttgaagagg ctttcaacac catgaaggct 1080
ggcgacgtgc tgcgttctgt ggtggagatc taa 1113
<210> 42
<211> 370
<212> PRT
<213> 谷氨酸棒杆菌
<400> 42
Met Ser Met Ser Thr Val Val Pro Gly Ile Val Ala Leu Ser Lys Gly
1 5 10 15
Ala Pro Val Glu Lys Val Asn Val Val Val Pro Asp Pro Gly Ala Asn
20 25 30
Asp Val Ile Val Lys Ile Gln Ala Cys Gly Val Cys His Thr Asp Leu
35 40 45
Ala Tyr Arg Asp Gly Asp Ile Ser Asp Glu Phe Pro Tyr Leu Leu Gly
50 55 60
His Glu Ala Ala Gly Ile Val Glu Glu Val Gly Glu Ser Val Thr His
65 70 75 80
Val Glu Val Gly Asp Phe Val Ile Leu Asn Trp Arg Ala Val Cys Gly
85 90 95
Glu Cys Arg Ala Cys Lys Lys Gly Glu Pro Lys Tyr Cys Phe Asn Thr
100 105 110
His Asn Ala Ser Lys Lys Met Thr Leu Glu Asp Gly Thr Glu Leu Ser
115 120 125
Pro Ala Leu Gly Ile Gly Ala Phe Leu Glu Lys Thr Leu Val His Glu
130 135 140
Gly Gln Cys Thr Lys Val Asn Pro Glu Glu Asp Pro Ala Ala Ala Gly
145 150 155 160
Leu Leu Gly Cys Gly Ile Met Ala Gly Leu Gly Ala Ala Val Asn Thr
165 170 175
Gly Asp Ile Lys Arg Gly Glu Ser Val Ala Val Phe Gly Leu Gly Gly
180 185 190
Val Gly Met Ala Ala Ile Ala Gly Ala Lys Ile Ala Gly Ala Ser Lys
195 200 205
Ile Ile Ala Val Asp Ile Asp Glu Lys Lys Leu Glu Trp Ala Lys Glu
210 215 220
Phe Gly Ala Thr His Thr Ile Asn Ser Ser Gly Leu Gly Gly Glu Gly
225 230 235 240
Asp Ala Ser Glu Val Val Ala Lys Val Arg Glu Leu Thr Asp Gly Phe
245 250 255
Gly Thr Asp Val Ser Ile Asp Ala Val Gly Ile Met Pro Thr Trp Gln
260 265 270
Gln Ala Phe Tyr Ser Arg Asp His Ala Gly Arg Met Val Met Val Gly
275 280 285
Val Pro Asn Leu Thr Ser Arg Val Asp Val Pro Ala Ile Asp Phe Tyr
290 295 300
Gly Arg Gly Gly Ser Val Arg Pro Ala Trp Tyr Gly Asp Cys Leu Pro
305 310 315 320
Glu Arg Asp Phe Pro Thr Tyr Val Asp Leu His Leu Gln Gly Arg Phe
325 330 335
Pro Leu Asp Lys Phe Val Ser Glu Arg Ile Gly Leu Asp Asp Val Glu
340 345 350
Glu Ala Phe Asn Thr Met Lys Ala Gly Asp Val Leu Arg Ser Val Val
355 360 365
Glu Ile
370
<210> 43
<211> 1047
<212> DNA
<213> 谷氨酸棒杆菌
<400> 43
gtgagtttta tgaccactgc tgcaccccaa gaatttaccg ctgctgttgt tgaaaaattc 60
ggtcatgacg tgaccgtgaa ggatattgac cttccaaagc cagggccaca ccaggcattg 120
gtgaaggtac tcacctccgg catctgccac accgacctcc acgccttgga gggcgattgg 180
ccagtaaagc cggaaccacc attcgtacca ggacacgaag gtgtaggtga agttgttgag 240
ctcggaccag gtgaacacga tgtgaaggtc ggcgatattg tcggcaatgc gtggctctgg 300
tcagcgtgcg gcacctgcga atactgcatc acaggcaggg aaactcagtg taacgaagct 360
gagtacggtg gctacaccca aaatggatcc ttcggccagt acatgctggt ggatacccga 420
tacgccgctc gcatcccaga cggcgtggac tacctcgaag cagcgccaat tctgtgtgca 480
ggcgtgactg tctacaaggc actcaaagtc tctgaaaccc gcccgggcca attcatggtg 540
atctccggtg tcggcggact tggccacatc gcagtccaat acgcagcggc gatgggcatg 600
cgtgtcattg cggtagatat tgccgaggac aagctggaac ttgcccgtaa gcacggtgcg 660
gaatttaccg tgaatgcgcg taatgaagat ccaggcgaag ctgtacagaa gtacaccaac 720
ggtggcgcac acggcgtgct tgtgactgca gttcacgagg cagcattcgg ccaggcactg 780
gatatggctc gacgtgcagg aacaattgtg ttcaacggtc tgccaccggg agagttccca 840
gcatccgtgt tcaacatcgt attcaagggc ctgaccatcc gtggatccct cgtgggaacc 900
cgccaagact tggccgaagc gctcgatttc tttgcacgcg gactaatcaa gccaaccgtg 960
agtgagtgct ccctcgatga ggtcaatgga gttcttgacc gcatgcgaaa cggcaagatc 1020
gatggtcgtg tggcgattcg tttctaa 1047
<210> 44
<211> 348
<212> PRT
<213> 谷氨酸棒杆菌
<400> 44
Met Ser Phe Met Thr Thr Ala Ala Pro Gln Glu Phe Thr Ala Ala Val
1 5 10 15
Val Glu Lys Phe Gly His Asp Val Thr Val Lys Asp Ile Asp Leu Pro
20 25 30
Lys Pro Gly Pro His Gln Ala Leu Val Lys Val Leu Thr Ser Gly Ile
35 40 45
Cys His Thr Asp Leu His Ala Leu Glu Gly Asp Trp Pro Val Lys Pro
50 55 60
Glu Pro Pro Phe Val Pro Gly His Glu Gly Val Gly Glu Val Val Glu
65 70 75 80
Leu Gly Pro Gly Glu His Asp Val Lys Val Gly Asp Ile Val Gly Asn
85 90 95
Ala Trp Leu Trp Ser Ala Cys Gly Thr Cys Glu Tyr Cys Ile Thr Gly
100 105 110
Arg Glu Thr Gln Cys Asn Glu Ala Glu Tyr Gly Gly Tyr Thr Gln Asn
115 120 125
Gly Ser Phe Gly Gln Tyr Met Leu Val Asp Thr Arg Tyr Ala Ala Arg
130 135 140
Ile Pro Asp Gly Val Asp Tyr Leu Glu Ala Ala Pro Ile Leu Cys Ala
145 150 155 160
Gly Val Thr Val Tyr Lys Ala Leu Lys Val Ser Glu Thr Arg Pro Gly
165 170 175
Gln Phe Met Val Ile Ser Gly Val Gly Gly Leu Gly His Ile Ala Val
180 185 190
Gln Tyr Ala Ala Ala Met Gly Met Arg Val Ile Ala Val Asp Ile Ala
195 200 205
Glu Asp Lys Leu Glu Leu Ala Arg Lys His Gly Ala Glu Phe Thr Val
210 215 220
Asn Ala Arg Asn Glu Asp Pro Gly Glu Ala Val Gln Lys Tyr Thr Asn
225 230 235 240
Gly Gly Ala His Gly Val Leu Val Thr Ala Val His Glu Ala Ala Phe
245 250 255
Gly Gln Ala Leu Asp Met Ala Arg Arg Ala Gly Thr Ile Val Phe Asn
260 265 270
Gly Leu Pro Pro Gly Glu Phe Pro Ala Ser Val Phe Asn Ile Val Phe
275 280 285
Lys Gly Leu Thr Ile Arg Gly Ser Leu Val Gly Thr Arg Gln Asp Leu
290 295 300
Ala Glu Ala Leu Asp Phe Phe Ala Arg Gly Leu Ile Lys Pro Thr Val
305 310 315 320
Ser Glu Cys Ser Leu Asp Glu Val Asn Gly Val Leu Asp Arg Met Arg
325 330 335
Asn Gly Lys Ile Asp Gly Arg Val Ala Ile Arg Phe
340 345
<210> 45
<211> 1020
<212> DNA
<213> 谷氨酸棒杆菌
<400> 45
atgcccaaat acattgccat gcaggtatcc gaatccggtg caccgttagc cgcgaatctc 60
gtgcaacctg ctccgttgaa atcgagggaa gtccgcgtgg aaatcgctgc tagtggtgtg 120
tgccatgcag atattggcac ggcagcagca tcggggaagc acactgtttt tcctgttacc 180
cctggtcatg agattgcagg aaccatcgcg gaaattggtg aaaacgtatc tcggtggacg 240
gttggtgatc gcgttgcaat cggttggttt ggtggcaatt gcggtgactg cgctttttgt 300
cgtgcaggtg atcctgtgca ttgcagagag cggaagattc ctggcgtttc ttatgcgggt 360
ggttgggcac agaatattgt tgttccagcg gaggctcttg ctgcgattcc agatggcatg 420
gacttttacg aggccgcccc gatgggctgc gcaggtgtga caacattcaa tgcgttgcga 480
aacctgaagc tggatcccgg tgcggctgtc gcggtctttg gaatcggcgg tttagtgcgc 540
ctagctattc agtttgctgc gaaaatgggt tatcgaacca tcaccatcgc ccgcggttta 600
gagcgtgagg agctagctag gcaacttggc gccaaccact acatcgatag caatgatctg 660
caccctggcc aggcgttatt tgaacttggc ggggctgact tgatcttgtc tactgcgtcc 720
accacggagc ctctttcgga gttgtctacc ggtctttcta ttggcgggca gctaaccatt 780
atcggagttg atgggggaga tatcaccgtt tcggcagccc aattgatgat gaaccgtcag 840
atcatcacag gtcacctcac tggaagtgcg aatgacacgg aacagactat gaaatttgct 900
catctccatg gcgtgaaacc gcttattgaa cggatgcctc tcgatcaagc caacgaggct 960
attgcacgta tttcagctgg taaaccacgt ttccgtattg tcttggagcc gaattcataa 1020
<210> 46
<211> 339
<212> PRT
<213> 谷氨酸棒杆菌
<400> 46
Met Pro Lys Tyr Ile Ala Met Gln Val Ser Glu Ser Gly Ala Pro Leu
1 5 10 15
Ala Ala Asn Leu Val Gln Pro Ala Pro Leu Lys Ser Arg Glu Val Arg
20 25 30
Val Glu Ile Ala Ala Ser Gly Val Cys His Ala Asp Ile Gly Thr Ala
35 40 45
Ala Ala Ser Gly Lys His Thr Val Phe Pro Val Thr Pro Gly His Glu
50 55 60
Ile Ala Gly Thr Ile Ala Glu Ile Gly Glu Asn Val Ser Arg Trp Thr
65 70 75 80
Val Gly Asp Arg Val Ala Ile Gly Trp Phe Gly Gly Asn Cys Gly Asp
85 90 95
Cys Ala Phe Cys Arg Ala Gly Asp Pro Val His Cys Arg Glu Arg Lys
100 105 110
Ile Pro Gly Val Ser Tyr Ala Gly Gly Trp Ala Gln Asn Ile Val Val
115 120 125
Pro Ala Glu Ala Leu Ala Ala Ile Pro Asp Gly Met Asp Phe Tyr Glu
130 135 140
Ala Ala Pro Met Gly Cys Ala Gly Val Thr Thr Phe Asn Ala Leu Arg
145 150 155 160
Asn Leu Lys Leu Asp Pro Gly Ala Ala Val Ala Val Phe Gly Ile Gly
165 170 175
Gly Leu Val Arg Leu Ala Ile Gln Phe Ala Ala Lys Met Gly Tyr Arg
180 185 190
Thr Ile Thr Ile Ala Arg Gly Leu Glu Arg Glu Glu Leu Ala Arg Gln
195 200 205
Leu Gly Ala Asn His Tyr Ile Asp Ser Asn Asp Leu His Pro Gly Gln
210 215 220
Ala Leu Phe Glu Leu Gly Gly Ala Asp Leu Ile Leu Ser Thr Ala Ser
225 230 235 240
Thr Thr Glu Pro Leu Ser Glu Leu Ser Thr Gly Leu Ser Ile Gly Gly
245 250 255
Gln Leu Thr Ile Ile Gly Val Asp Gly Gly Asp Ile Thr Val Ser Ala
260 265 270
Ala Gln Leu Met Met Asn Arg Gln Ile Ile Thr Gly His Leu Thr Gly
275 280 285
Ser Ala Asn Asp Thr Glu Gln Thr Met Lys Phe Ala His Leu His Gly
290 295 300
Val Lys Pro Leu Ile Glu Arg Met Pro Leu Asp Gln Ala Asn Glu Ala
305 310 315 320
Ile Ala Arg Ile Ser Ala Gly Lys Pro Arg Phe Arg Ile Val Leu Glu
325 330 335
Pro Asn Ser
<210> 47
<211> 879
<212> DNA
<213> 谷氨酸棒杆菌
<400> 47
atgcaaaccc ttgctgctat tgttcgtgcc acgaagcaac cttttgagat caccaccatt 60
gatctggatg caccacgacc agatgaagtt caaatccgtg ttattgctgc cggagtgcgc 120
cacactgacg caattgttcg tgatcagatt tacccaactt ttcttcccgc agttttcggc 180
cacgaaggcg ccggagtagt tgtcgccgtg ggttctgcag tcacctcggt gaaaccagat 240
gacaaggtag tgctgggatt caactcttgt ggccagtgct tgaagtgttt gggcggtaag 300
cctgcgtact gtgagaaatt ctatgaccgc aacttcgcat gcacccgcga tgccgggcac 360
actactttgt ttacccgtgc aacaaaagag caggcagagg ccatcatcga cacccttgat 420
gatgttttct acgatgcgga tgcgggtttc ctggcatacc cagcaactcc cccagaggct 480
tcgggagtaa gcgtgttggt tgtcgcggct ggtacctctg atctccccca agcaaaggaa 540
gcactacaca ctgcctccta cttggggcgc tccacctcac tgattgttga ttttggagtg 600
gctggcatcc accgcctgct ttcatacgaa gaagaactcc gcgctgcggg cgtgctcatc 660
gttgccgctg gaatggatgg tgcgctaccc ggagttgtcg caggcttagt gtccgcacct 720
gtcgtcgcac tgccaacctc cgtgggatac ggcgcaggtg ctggaggaat cgcaccactt 780
ctgaccatgc ttaacgcctg cgcgccggga gttggagtgg tcaacattga taacggctat 840
ggagcaggac acctggctgc gcagattgcg gcgaggtaa 879
<210> 48
<211> 292
<212> PRT
<213> 谷氨酸棒杆菌
<400> 48
Met Gln Thr Leu Ala Ala Ile Val Arg Ala Thr Lys Gln Pro Phe Glu
1 5 10 15
Ile Thr Thr Ile Asp Leu Asp Ala Pro Arg Pro Asp Glu Val Gln Ile
20 25 30
Arg Val Ile Ala Ala Gly Val Arg His Thr Asp Ala Ile Val Arg Asp
35 40 45
Gln Ile Tyr Pro Thr Phe Leu Pro Ala Val Phe Gly His Glu Gly Ala
50 55 60
Gly Val Val Val Ala Val Gly Ser Ala Val Thr Ser Val Lys Pro Asp
65 70 75 80
Asp Lys Val Val Leu Gly Phe Asn Ser Cys Gly Gln Cys Leu Lys Cys
85 90 95
Leu Gly Gly Lys Pro Ala Tyr Cys Glu Lys Phe Tyr Asp Arg Asn Phe
100 105 110
Ala Cys Thr Arg Asp Ala Gly His Thr Thr Leu Phe Thr Arg Ala Thr
115 120 125
Lys Glu Gln Ala Glu Ala Ile Ile Asp Thr Leu Asp Asp Val Phe Tyr
130 135 140
Asp Ala Asp Ala Gly Phe Leu Ala Tyr Pro Ala Thr Pro Pro Glu Ala
145 150 155 160
Ser Gly Val Ser Val Leu Val Val Ala Ala Gly Thr Ser Asp Leu Pro
165 170 175
Gln Ala Lys Glu Ala Leu His Thr Ala Ser Tyr Leu Gly Arg Ser Thr
180 185 190
Ser Leu Ile Val Asp Phe Gly Val Ala Gly Ile His Arg Leu Leu Ser
195 200 205
Tyr Glu Glu Glu Leu Arg Ala Ala Gly Val Leu Ile Val Ala Ala Gly
210 215 220
Met Asp Gly Ala Leu Pro Gly Val Val Ala Gly Leu Val Ser Ala Pro
225 230 235 240
Val Val Ala Leu Pro Thr Ser Val Gly Tyr Gly Ala Gly Ala Gly Gly
245 250 255
Ile Ala Pro Leu Leu Thr Met Leu Asn Ala Cys Ala Pro Gly Val Gly
260 265 270
Val Val Asn Ile Asp Asn Gly Tyr Gly Ala Gly His Leu Ala Ala Gln
275 280 285
Ile Ala Ala Arg
290
<210> 49
<211> 819
<212> DNA
<213> 大肠杆菌
<400> 49
atggaaacct atgctgtttt tggtaatccg atagcccaca gcaaatcgcc attcattcat 60
cagcaatttg ctcagcaact gaatattgaa catccctatg ggcgcgtgtt ggcacccatc 120
aatgatttca tcaacacact gaacgctttc tttagtgctg gtggtaaagg tgcgaatgtg 180
acggtgcctt ttaaagaaga ggcttttgcc agagcggatg agcttactga acgggcagcg 240
ttggctggtg ctgttaatac cctcatgcgg ttagaagatg gacgcctgct gggtgacaat 300
accgatggtg taggcttgtt aagcgatctg gaacgtctgt cttttatccg ccctggttta 360
cgtattctgc ttatcggcgc tggtggagca tctcgcggcg tactactgcc actcctttcc 420
ctggactgtg cggtgacaat aactaatcgg acggtatccc gcgcggaaga gttggctaaa 480
ttgtttgcgc acactggcag tattcaggcg ttgagtatgg acgaactgga aggtcatgag 540
tttgatctca ttattaatgc aacatccagt ggcatcagtg gtgatattcc ggcgatcccg 600
tcatcgctca ttcatccagg catttattgc tatgacatgt tctatcagaa aggaaaaact 660
ccttttctgg catggtgtga gcagcgaggc tcaaagcgta atgctgatgg tttaggaatg 720
ctggtggcac aggcggctca tgcctttctt ctctggcacg gtgttctgcc tgacgtagaa 780
ccagttataa agcaattgca ggaggaattg tccgcgtga 819
<210> 50
<211> 272
<212> PRT
<213> 大肠杆菌
<400> 50
Met Glu Thr Tyr Ala Val Phe Gly Asn Pro Ile Ala His Ser Lys Ser
1 5 10 15
Pro Phe Ile His Gln Gln Phe Ala Gln Gln Leu Asn Ile Glu His Pro
20 25 30
Tyr Gly Arg Val Leu Ala Pro Ile Asn Asp Phe Ile Asn Thr Leu Asn
35 40 45
Ala Phe Phe Ser Ala Gly Gly Lys Gly Ala Asn Val Thr Val Pro Phe
50 55 60
Lys Glu Glu Ala Phe Ala Arg Ala Asp Glu Leu Thr Glu Arg Ala Ala
65 70 75 80
Leu Ala Gly Ala Val Asn Thr Leu Met Arg Leu Glu Asp Gly Arg Leu
85 90 95
Leu Gly Asp Asn Thr Asp Gly Val Gly Leu Leu Ser Asp Leu Glu Arg
100 105 110
Leu Ser Phe Ile Arg Pro Gly Leu Arg Ile Leu Leu Ile Gly Ala Gly
115 120 125
Gly Ala Ser Arg Gly Val Leu Leu Pro Leu Leu Ser Leu Asp Cys Ala
130 135 140
Val Thr Ile Thr Asn Arg Thr Val Ser Arg Ala Glu Glu Leu Ala Lys
145 150 155 160
Leu Phe Ala His Thr Gly Ser Ile Gln Ala Leu Ser Met Asp Glu Leu
165 170 175
Glu Gly His Glu Phe Asp Leu Ile Ile Asn Ala Thr Ser Ser Gly Ile
180 185 190
Ser Gly Asp Ile Pro Ala Ile Pro Ser Ser Leu Ile His Pro Gly Ile
195 200 205
Tyr Cys Tyr Asp Met Phe Tyr Gln Lys Gly Lys Thr Pro Phe Leu Ala
210 215 220
Trp Cys Glu Gln Arg Gly Ser Lys Arg Asn Ala Asp Gly Leu Gly Met
225 230 235 240
Leu Val Ala Gln Ala Ala His Ala Phe Leu Leu Trp His Gly Val Leu
245 250 255
Pro Asp Val Glu Pro Val Ile Lys Gln Leu Gln Glu Glu Leu Ser Ala
260 265 270
<210> 51
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 51
cggtacccgg ggatccttac ttccgcgtat ccaac 35
<210> 52
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 52
ctaggaatcg cggccggtga actcctaaag aactatataa c 41
<210> 53
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 53
ggccgcgatt cctagcatgc 20
<210> 54
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 54
ccaagcttgc atgccagtca tcatcaacgg tgccg 35
<210> 55
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 55
atctccgcag aagacgtact g 21
<210> 56
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 56
tccgatcatg tatgacctcc 20
<210> 57
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 57
cggtacccgg ggatcggcat agtgcttcca acgctc 36
<210> 58
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 58
tagctccact caagattcct cgatattacc tacagg 36
<210> 59
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 59
tcttgagtgg agctagggcc 20
<210> 60
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 60
ccaagcttgc atgcccatat agagcccagg agctctc 37
<210> 61
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 61
cgccgcaaag tccaaataga aag 23
<210> 62
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 62
ggattcttcc tgaactcagc 20
<210> 63
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 63
cggtacccgg ggatcgggct cgtcctgaaa ttgcac 36
<210> 64
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 64
tccgtcgtga gccatgttgt gcccacgaga ctacc 35
<210> 65
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 65
atggctcacg acggattgcg 20
<210> 66
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 66
ccaagcttgc atgcccggtt gcagccttca taaacg 36
<210> 67
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 67
agaccaatga gtacccaacc g 21
<210> 68
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 68
tcagcgtctg gctcagctac 20
<210> 69
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 69
cggtacccgg ggatcaaccc cagctcaaat aacacc 36
<210> 70
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 70
tttcaacaca atccgtcctt ctcgcttgga ttacttg 37
<210> 71
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 71
cggattgtgt tgaaattgct ctg 23
<210> 72
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 72
ccaagcttgc atgcctcacc acgggaatct tcagg 35
<210> 73
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 73
ccggactggg gtgtgttttg 20
<210> 74
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 74
cccggaaaat acggtatagc 20
<210> 75
<211> 47
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 75
ccaagcttgc atgccaggag gattataatg cgcctgcgtg tctcgag 47
<210> 76
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 76
cggtacccgg ggatccaact acgcggcgac gtac 34
<210> 77
<211> 3387
<212> DNA
<213> Gordonia effusa
<400> 77
atgagcgatc agccgaatgc actgccgagc gcaattgaac cgctgaatcc ggatccgcag 60
gcaaccgagc agattagcca ttgtgcaacc attgcagaac tggttcgtgt tctggcagaa 120
agctatggtg atcgtccggc actgggttgg cgtaataata gcgatccgag cagctggcat 180
agcatgacct atcgtgatct ggccgaacgt gcagatagca tggcacgtct gctgcatagc 240
accctgggtg ttgcagaaaa tgatcgtgtt gcaaccgttg gttttaccag cgcagaatat 300
accattgcaa gcctggcagt tggtacactg ggtgcaatgg aagttccgct gcagaatgca 360
ggtagcgttg atgtttgggc agcaattctg accgaaaccg attgtgttag cgcagttgtt 420
gcagcagatc agctgccgag cattgcccgt ctggcggaaa gcggcaccta taccggtctg 480
cgtcatgttc tggtttttga tattggtagc cgtgatggca ccaccctgga tgatgcagca 540
cgtcgtctgg ttgccgcagg cacccaggtt catctgcgtc agcctggtgc agaaccgacc 600
acccctccgg caccgctgcc gcagattacc gcaaacccgg atcgtgtggc actgctgatt 660
tataccagcg gtagcacagg tgcaccgaaa ggtgcaatgt ataccgaaac agcagttacc 720
cgtctgtttc agagcggtct gagtggtctg ggtcgtgcaa ccgatggtca tggttggatt 780
accctgaact ttatgccgat gagccatgtt atgggtcgta gtaccctgtg gcagaccctg 840
ggtaatggtg gcaccgcata ttttacaccg cgtgcagatc tggctgaact gctgaccgat 900
ctggcagccg ttcagccgac ggatctgcag tttgttccgc gtatttggga tatgctgtat 960
caagaatatg ttcgtctgac agatcaggat gttagcgaac aggatgcact gacccgtatg 1020
cgtgaacatt atttcggcac ccgtaccgca accgcaatta ccggtagcgc accgattagt 1080
gatgaagttc gtcgttttgt tgaagcaatg ctgccggttc cgctgattga aggttatggt 1140
agcaccgaag cagccggtgt tagcattgat ggtcgtattc agcgtccgcc tgttgttgat 1200
tataaactgc tggatgtgcc ggaactgggt tatctgagca ccgatcgtcc gcatccgcgt 1260
ggtgagctgc tggttaaaac cgatcatatt tttgccggtt attacaatcg tccggatctg 1320
accagcagcg tttttgatga tcagggttat tatcgtaccg gtgatattgt tgccgaaacc 1380
ggtccggatc agattgaata tgttgatcgt cgtaacaacg tgatgaaact gagccagggt 1440
gaatttgttg caattgccca tattgaagca gttctgacca ccccaccgat tcagcagctg 1500
tatgtttatg gtaatagcgc acgtccgtat ctgctggccg ttgttgttcc gacaccggaa 1560
ctgcgtgaac gtcatgcaga tgataatgaa ctgcgtcgtg aagttctgac agcactgcgt 1620
agccatggtg aacgtaatgg tctggcagca gttgaaattc cgcgtgatgt tattgttgaa 1680
cgtaccccgt ttagcctgga aaatggtctg ctgacaggta ttcgtaaact ggcacgtccg 1740
cagctgaaag aacgttatgg tgcacgtctg gaagcactgt atgccgaact ggccgatagc 1800
cgtattacac gtctgcgtga tgtgaaagca gttgcagccc agcgtagcac cgttaccacc 1860
gttattgatg ttgttaccgc aattctggat ctggcggatg gtgaagttac cgcagcagca 1920
cattttacag atctgggtgg tgatagcctg accgcagtta ccgttggtaa cgaactgcgc 1980
gatatttttg atgccgaagt tccggttggt gtgctgacca gcccgagcag taccctggca 2040
gatattgcgg aacatattga tggccgtcat agcgaagcac gtccgaccgc agaaagcgtt 2100
catggcaccg gtacaaccct gcgtgcagcc gatctgaccc tggataaatt tctggatgaa 2160
gaaacactgc gtgccgcaag tgatgttacc agtgcagcca ccgatgttcg taccgtgttt 2220
attaccggtg caaccggttt tctgggtcgc tacctgacac tggattggct gcgtcgtatg 2280
gcaaaagttg gtggtacagt tatttgtctg gtgcgtggtg ccgatgatga cgcagcccgt 2340
gcgcgtctgg atgcagcatt tgatagcagc gatctgtggt ctgaatatca gcgtctggca 2400
aaagatcatc tgcgcgtgct ggcaggcgat aaagatagcg atcatctggc actgacaccg 2460
gatgtgtggg atgaactggc aaaaagcgtt gatctgatta ttgatccggc agcactggtt 2520
aatcatgtac tgccgtatcg cgaactgttt ggtccgaatg ttagcggcac cgcagaactg 2580
atccgtctgg cagttaccac cacccgtaaa ccgtatgtgt atatttcaac cgtgggtgtt 2640
ggtgatcagg ttgctccggg tagctttacc gaagatcctg atattcgtga aatgagcagc 2700
gtgcgtgaaa tcaatgatac ctatgcaaat ggttacggca atagcaaatg ggcaggcgaa 2760
gttctgctgg cacaggcaca tgaacgtttt gaactgccgg ttagcgtttt tcgttgtgat 2820
atgattgttg cggatgatca taccattggt cagctgaatc tgccggatat gtttactcgc 2880
ctgctgatga gcgttctggc aacaggtctg gcaccgcgta gcttttatca gctggcgacc 2940
gatggtagtg cacaagaggc acattttgat gcgctgccgg tggatttcct ggccgaagca 3000
attaatacac tgtgggttaa agatggtgcc cgtaccttta atgcaatgaa tccgcatgcc 3060
gatggtattg gttttgatca gtatattcgt tggctgattg atagcggtga acaaattagc 3120
ctggtggata attatgatga ttggtatcgt cgctttggtg ccgcactggc ggatctgcct 3180
gaaaaacagc gtcgtggtag cctgattccg ctgctgcaca attatgttca tccgatgaca 3240
ccgcataatc gtggtatggc aagcgcagat cgttttcatg atgcagttcg tacagcaggc 3300
gttggtcaga gcagcgatat tccgcatatt acccctcaga ttattgaaaa ttatgcacgt 3360
agcctgcgtg gcctgggtgt gatttaa 3387
<210> 78
<211> 3408
<212> DNA
<213> 马来西亚新鞘氨醇杆菌
<400> 78
atggatgccg agagcggagt catgccgagc gatcccgatg tggttgcctt cgtccgccgg 60
ccggacacgt gccttagcgc gatgatcgag aaagcgctcg attcctatgc cgggcgcgat 120
gcattagcct ggcgccccac gcgttcaggc gtgttgagcg ataccttcga agtcatgacc 180
tacaaggacc tggcaaggcg cgtccgctcc gtggcgacgg cgctcgccaa agaccccgat 240
ctgggtctga aagccggcga cccgatcggg atcatggcct ttgccaacgt cgacttcgtc 300
accctcaatc tcgcgctggg cctctgcggt ggcgttatcg cgccgctgca gacctccgcc 360
agcatggaag cactgaccgg gctggtcagg gaactggcag cgccctgcct cgccgcatcg 420
ctcgaacatc tcgaagcgat caccacgctc gccatcgcaa gcgaaaaaac gcgcgcaatc 480
cttatcttcg accacgatgg cctcgacgaa gatgcccggg ccgcgatcgc cgccgcccag 540
caacgcctag acgcggaaaa gcccggctgc ctgatcctgc cgttttccga agtgatcgca 600
cgcggcgaaa agctgccgcc gctcgatccc ttcgttccgg cgccgggcga ggaccccttg 660
gctctgatct attacacctc gggcagcacc ggcacaccaa agggcgttat gtacacgcag 720
aagctggtga agctgggcta ttcgatagcc cgcgaccatg ccccgatcgt cctgcactat 780
cagccgctca accactcctt cgggatgtcc ttcatcgcca tggccctcgc cagcggcggc 840
acgtcctact ttaccgccaa gagcgacctg tcgacgctgc tgagcgacat gaagatggtc 900
cgcccgacga ccatggctct cgtcccgcgc atatcggaaa tgctgttcca gcgtttccat 960
gccgactacg ccgacgagat cgcacgcgac gaggatgccg caatggcgcg gttccgcgaa 1020
gacgttctcg gggggcggat gaccgacatc gtcaccgggg ccgcacctac ttcgccggaa 1080
cttcgcgact tcatcgagaa gatgaccggt ctcacactga tggaagggta cggctgcacc 1140
gaagcaggcg gctcgatcac cttcaacgac cgggtgatgc gcccgcccgt gctcgaatac 1200
cgcctgatcg acgtgcccga gctcggctat ttcactaccg atacgcccca tccgcgcggc 1260
gagctcatcc tcaagagcga tgcgatgttc gccgggtact tcgcgcgtcc ggacctcacg 1320
gcaaaggcct tcgacgacga ggggttctac cataccggcg acattatggc cgagatcgaa 1380
cccgaccacc tcgtctacct cgaccgcacc aacaacgtga tgaagctgtc gcagggcgaa 1440
ttcgtaccgg tcgcgttgct ggaatcgctc tatgcgggcg gtgatccggt gatccgccag 1500
atctatctct atggcaattc gacgcgggct ttcctgctcg gcgtggccgt gcccaacatg 1560
gatgccctgc ccgagggaat cggtgatgag gaaatcaagg cccgcatgct ccaggctctg 1620
gaacgcatcg ccagggccaa cgaacgccat tcctacgaag tcccgcgcga cctgattata 1680
gagcatgagc cgttctctcc cgaaaacggc ctgcttgcgg gcgtcggcaa gtacatgcgc 1740
cccgccttca aggcgcgata cggagagcag ctcgaagcgc tctatgaaga aatcgctcgc 1800
agtcaggacc gcgagctgca ggaattgcgc agaaccggcc gcaccttccc agttctcgaa 1860
accgtgtgcc gggcggccgg cgccgtactg ggcggcaaga ccgttgccct ttccgagaca 1920
ggctccttcg cgtcgtcggg tggggattcg ctttcagcac tgtccctctc gctgcttttg 1980
gaggacatct acgaactgcc cgtcgaagtc agcgcgatcc tccatccctc gggcacgtac 2040
gggctgcttg ccgcggaaat cgaggagaag ctgggcggcg gtgcgaagcg acgcgacgcc 2100
gtggccgttc atggcgcgga cctcaccgtg ctcaaggcgg ccgacctgac gctcgacaag 2160
ttcatagacg ccgagatcct tggcgccgcc accggcctgc ccgcgccgcc cgacgctgaa 2220
ccagaggtgg tgcttctcac cggtgtcacc ggcttcctag gccgtttcat gtgcctggaa 2280
tggctgcgtc ggctggagcg caacggcaag ggcaaggtgg tctgcgtggc gcgcggtgcc 2340
gatgacgacg atgcccgccg ccgcgtcctg gcaggctttg aaggcggtga tggcgcactg 2400
gcggcggaag tggcccggct gggcgaaggc cggctggccg tcttcgcagg cgatcttgcc 2460
gcaccccggc tgggtctcac cgcgacatgc tggcaggcgc tgtgcgacca ggtggacctc 2520
attgctcacc ctggcgcctt cgtgaaccac aagctgccct accgccagct gttcggagcc 2580
aacacagcag gcacggccga actgatcgcg ctggctctca ccacgcgcaa gaagcgcttc 2640
gcccatgtct ctaccatcgc cacgacatac aacgatggtc atcgcgcgga tgaaaacggc 2700
tacatcgaca gcgccattcc cgaatggcat gtaagcgacg cctacgccga cggctatggg 2760
tcgtccaaat gggccgcaga agtgctgctg gccagagcca atgagcaata tggcctaccc 2820
gtttcggtct accgttcgaa catgatcatg gcacccggcg agttctccgg tcagctcaat 2880
gtgcccgata tcttcactcg cctgctgctg agcctggcgc tgacccggct ggcccccgcc 2940
agcttctatt cgggcgattc cgcgcgggcc cattacgaag gcctgccggt cgatttcctg 3000
gcccgcgcca tcgtgaccat tgccgaagac aaccgcgcgg ggttccatac cttccacacg 3060
atcaacccgc acgatgacgg gatctcgacc gacactttcg tcgactggat cggtgaagcg 3120
ggcattccga tcgaacggat cgcggactac gacgaatggg tcacgcgttt cgggacggcc 3180
ctgcgcgccc tgcctgaaaa gcagcggcaa gcctcgatcc tgccgttgat ggacgcgtac 3240
aagcacccgt ccccggcgat ccccgacttc cgcgatcagg cacctaactt ccgccaggcg 3300
gttgccgaat cgcaagtgaa cggagacggc gcgatccctc atctcacgcc ggcattgatt 3360
gctcggtatc tggaggacct gaaggccacc ggcctgctca cctcctga 3408
<210> 79
<211> 1135
<212> PRT
<213> 马来西亚新鞘氨醇杆菌
<400> 79
Met Asp Ala Glu Ser Gly Val Met Pro Ser Asp Pro Asp Val Val Ala
1 5 10 15
Phe Val Arg Arg Pro Asp Thr Cys Leu Ser Ala Met Ile Glu Lys Ala
20 25 30
Leu Asp Ser Tyr Ala Gly Arg Asp Ala Leu Ala Trp Arg Pro Thr Arg
35 40 45
Ser Gly Val Leu Ser Asp Thr Phe Glu Val Met Thr Tyr Lys Asp Leu
50 55 60
Ala Arg Arg Val Arg Ser Val Ala Thr Ala Leu Ala Lys Asp Pro Asp
65 70 75 80
Leu Gly Leu Lys Ala Gly Asp Pro Ile Gly Ile Met Ala Phe Ala Asn
85 90 95
Val Asp Phe Val Thr Leu Asn Leu Ala Leu Gly Leu Cys Gly Gly Val
100 105 110
Ile Ala Pro Leu Gln Thr Ser Ala Ser Met Glu Ala Leu Thr Gly Leu
115 120 125
Val Arg Glu Leu Ala Ala Pro Cys Leu Ala Ala Ser Leu Glu His Leu
130 135 140
Glu Ala Ile Thr Thr Leu Ala Ile Ala Ser Glu Lys Thr Arg Ala Ile
145 150 155 160
Leu Ile Phe Asp His Asp Gly Leu Asp Glu Asp Ala Arg Ala Ala Ile
165 170 175
Ala Ala Ala Gln Gln Arg Leu Asp Ala Glu Lys Pro Gly Cys Leu Ile
180 185 190
Leu Pro Phe Ser Glu Val Ile Ala Arg Gly Glu Lys Leu Pro Pro Leu
195 200 205
Asp Pro Phe Val Pro Ala Pro Gly Glu Asp Pro Leu Ala Leu Ile Tyr
210 215 220
Tyr Thr Ser Gly Ser Thr Gly Thr Pro Lys Gly Val Met Tyr Thr Gln
225 230 235 240
Lys Leu Val Lys Leu Gly Tyr Ser Ile Ala Arg Asp His Ala Pro Ile
245 250 255
Val Leu His Tyr Gln Pro Leu Asn His Ser Phe Gly Met Ser Phe Ile
260 265 270
Ala Met Ala Leu Ala Ser Gly Gly Thr Ser Tyr Phe Thr Ala Lys Ser
275 280 285
Asp Leu Ser Thr Leu Leu Ser Asp Met Lys Met Val Arg Pro Thr Thr
290 295 300
Met Ala Leu Val Pro Arg Ile Ser Glu Met Leu Phe Gln Arg Phe His
305 310 315 320
Ala Asp Tyr Ala Asp Glu Ile Ala Arg Asp Glu Asp Ala Ala Met Ala
325 330 335
Arg Phe Arg Glu Asp Val Leu Gly Gly Arg Met Thr Asp Ile Val Thr
340 345 350
Gly Ala Ala Pro Thr Ser Pro Glu Leu Arg Asp Phe Ile Glu Lys Met
355 360 365
Thr Gly Leu Thr Leu Met Glu Gly Tyr Gly Cys Thr Glu Ala Gly Gly
370 375 380
Ser Ile Thr Phe Asn Asp Arg Val Met Arg Pro Pro Val Leu Glu Tyr
385 390 395 400
Arg Leu Ile Asp Val Pro Glu Leu Gly Tyr Phe Thr Thr Asp Thr Pro
405 410 415
His Pro Arg Gly Glu Leu Ile Leu Lys Ser Asp Ala Met Phe Ala Gly
420 425 430
Tyr Phe Ala Arg Pro Asp Leu Thr Ala Lys Ala Phe Asp Asp Glu Gly
435 440 445
Phe Tyr His Thr Gly Asp Ile Met Ala Glu Ile Glu Pro Asp His Leu
450 455 460
Val Tyr Leu Asp Arg Thr Asn Asn Val Met Lys Leu Ser Gln Gly Glu
465 470 475 480
Phe Val Pro Val Ala Leu Leu Glu Ser Leu Tyr Ala Gly Gly Asp Pro
485 490 495
Val Ile Arg Gln Ile Tyr Leu Tyr Gly Asn Ser Thr Arg Ala Phe Leu
500 505 510
Leu Gly Val Ala Val Pro Asn Met Asp Ala Leu Pro Glu Gly Ile Gly
515 520 525
Asp Glu Glu Ile Lys Ala Arg Met Leu Gln Ala Leu Glu Arg Ile Ala
530 535 540
Arg Ala Asn Glu Arg His Ser Tyr Glu Val Pro Arg Asp Leu Ile Ile
545 550 555 560
Glu His Glu Pro Phe Ser Pro Glu Asn Gly Leu Leu Ala Gly Val Gly
565 570 575
Lys Tyr Met Arg Pro Ala Phe Lys Ala Arg Tyr Gly Glu Gln Leu Glu
580 585 590
Ala Leu Tyr Glu Glu Ile Ala Arg Ser Gln Asp Arg Glu Leu Gln Glu
595 600 605
Leu Arg Arg Thr Gly Arg Thr Phe Pro Val Leu Glu Thr Val Cys Arg
610 615 620
Ala Ala Gly Ala Val Leu Gly Gly Lys Thr Val Ala Leu Ser Glu Thr
625 630 635 640
Gly Ser Phe Ala Ser Ser Gly Gly Asp Ser Leu Ser Ala Leu Ser Leu
645 650 655
Ser Leu Leu Leu Glu Asp Ile Tyr Glu Leu Pro Val Glu Val Ser Ala
660 665 670
Ile Leu His Pro Ser Gly Thr Tyr Gly Leu Leu Ala Ala Glu Ile Glu
675 680 685
Glu Lys Leu Gly Gly Gly Ala Lys Arg Arg Asp Ala Val Ala Val His
690 695 700
Gly Ala Asp Leu Thr Val Leu Lys Ala Ala Asp Leu Thr Leu Asp Lys
705 710 715 720
Phe Ile Asp Ala Glu Ile Leu Gly Ala Ala Thr Gly Leu Pro Ala Pro
725 730 735
Pro Asp Ala Glu Pro Glu Val Val Leu Leu Thr Gly Val Thr Gly Phe
740 745 750
Leu Gly Arg Phe Met Cys Leu Glu Trp Leu Arg Arg Leu Glu Arg Asn
755 760 765
Gly Lys Gly Lys Val Val Cys Val Ala Arg Gly Ala Asp Asp Asp Asp
770 775 780
Ala Arg Arg Arg Val Leu Ala Gly Phe Glu Gly Gly Asp Gly Ala Leu
785 790 795 800
Ala Ala Glu Val Ala Arg Leu Gly Glu Gly Arg Leu Ala Val Phe Ala
805 810 815
Gly Asp Leu Ala Ala Pro Arg Leu Gly Leu Thr Ala Thr Cys Trp Gln
820 825 830
Ala Leu Cys Asp Gln Val Asp Leu Ile Ala His Pro Gly Ala Phe Val
835 840 845
Asn His Lys Leu Pro Tyr Arg Gln Leu Phe Gly Ala Asn Thr Ala Gly
850 855 860
Thr Ala Glu Leu Ile Ala Leu Ala Leu Thr Thr Arg Lys Lys Arg Phe
865 870 875 880
Ala His Val Ser Thr Ile Ala Thr Thr Tyr Asn Asp Gly His Arg Ala
885 890 895
Asp Glu Asn Gly Tyr Ile Asp Ser Ala Ile Pro Glu Trp His Val Ser
900 905 910
Asp Ala Tyr Ala Asp Gly Tyr Gly Ser Ser Lys Trp Ala Ala Glu Val
915 920 925
Leu Leu Ala Arg Ala Asn Glu Gln Tyr Gly Leu Pro Val Ser Val Tyr
930 935 940
Arg Ser Asn Met Ile Met Ala Pro Gly Glu Phe Ser Gly Gln Leu Asn
945 950 955 960
Val Pro Asp Ile Phe Thr Arg Leu Leu Leu Ser Leu Ala Leu Thr Arg
965 970 975
Leu Ala Pro Ala Ser Phe Tyr Ser Gly Asp Ser Ala Arg Ala His Tyr
980 985 990
Glu Gly Leu Pro Val Asp Phe Leu Ala Arg Ala Ile Val Thr Ile Ala
995 1000 1005
Glu Asp Asn Arg Ala Gly Phe His Thr Phe His Thr Ile Asn Pro
1010 1015 1020
His Asp Asp Gly Ile Ser Thr Asp Thr Phe Val Asp Trp Ile Gly
1025 1030 1035
Glu Ala Gly Ile Pro Ile Glu Arg Ile Ala Asp Tyr Asp Glu Trp
1040 1045 1050
Val Thr Arg Phe Gly Thr Ala Leu Arg Ala Leu Pro Glu Lys Gln
1055 1060 1065
Arg Gln Ala Ser Ile Leu Pro Leu Met Asp Ala Tyr Lys His Pro
1070 1075 1080
Ser Pro Ala Ile Pro Asp Phe Arg Asp Gln Ala Pro Asn Phe Arg
1085 1090 1095
Gln Ala Val Ala Glu Ser Gln Val Asn Gly Asp Gly Ala Ile Pro
1100 1105 1110
His Leu Thr Pro Ala Leu Ile Ala Arg Tyr Leu Glu Asp Leu Lys
1115 1120 1125
Ala Thr Gly Leu Leu Thr Ser
1130 1135
<210> 80
<211> 4543
<212> DNA
<213> 人工序列
<220>
<223> 含有马来西亚新鞘氨醇杆菌的CAR基因(经密码子优化)和大肠杆菌的
entD基因的DNA片段的核苷酸序列
<400> 80
ccaagcttgc atgccagatc gtttagatcc gaaggaaaac gtcgaaaagc aatttgcttt 60
tcgacgcccc accccgcgcg ttttagcgtg tcagtagacg cgtagggtaa gtggggtagc 120
ggcttgttag atatcttgaa atcggctttc aacagcattg atttcgatgt atttagctgg 180
ccgtttgaga cgcgatgtcc acagggtagc tggtagtttg aaaatcaacg ccgttgccct 240
taggattcag taactggcac attttgtaat gcgctagatc tgtgtgccca gtcttccagg 300
ctgcttatca cagtgaaagc aaaaccaatt cgtggctgcg aaagtcgtag ccaccacgaa 360
gtccaggagg acatacaatg gatgcagaaa gcggtgttat gccgagcgat ccggatgttg 420
ttgcatttgt tcgtcgtccg gatacctgtc tgagcgcaat gattgaaaaa gcactggata 480
gctatgcagg tcgtgatgca ctggcatggc gtccgacccg tagcggtgtt ctgagcgata 540
cctttgaagt tatgacctat aaagatctgg cacgtcgtgt tcgtagcgtt gcaaccgcac 600
tggcaaaaga tcctgatctg ggtctgaaag ccggtgatcc gattggtatt atggcatttg 660
ccaatgttga tttcgttacc ctgaatctgg cactgggtct gtgtggtggt gttattgcac 720
cgctgcagac cagcgcaagc atggaagcac tgaccggtct ggttcgtgaa ctggcagcac 780
cgtgtctggc agcaagcctg gaacatctgg aagcaattac caccctggca attgcaagcg 840
aaaaaacccg tgcaattctg atctttgatc atgatggtct ggatgaagat gcacgtgccg 900
caattgcagc agcacagcag cgtctggatg ccgaaaaacc gggttgtctg attctgccgt 960
ttagcgaagt tattgcccgt ggtgaaaaac tgcctccgct ggatccgttt gttccggcac 1020
cgggtgaaga tccgctggca ctgatctatt ataccagcgg tagcaccggc accccgaaag 1080
gtgttatgta tacccagaaa ctggttaaac tgggttatag cattgcacgt gatcatgcac 1140
cgattgttct gcattatcag ccgctgaatc atagctttgg tatgagcttt attgcaatgg 1200
cactggcgag cggtggcacc agctatttta ccgcaaaaag cgatctgagc accctgctga 1260
gtgatatgaa aatggttcgt ccgaccacca tggccctggt tccgcgtatt agcgaaatgc 1320
tgtttcagcg ttttcatgca gattatgcag atgaaattgc gcgtgatgag gatgcagcca 1380
tggcacgttt tcgtgaagat gttctgggtg gtcgtatgac cgatattgtt accggtgcag 1440
caccgaccag tccggaactg cgtgatttta ttgaaaaaat gacaggtctg accctgatgg 1500
aaggttatgg ttgtaccgaa gccggtggta gcattacctt taatgatcgt gttatgcgtc 1560
cgcctgttct ggaatatcgt ctgattgatg ttcctgaact gggatatttt accaccgata 1620
caccgcatcc gcgtggtgaa ctgattctga aaagtgatgc aatgtttgcc ggttattttg 1680
cacgtccgga tctgaccgca aaagcatttg atgatgaagg cttttatcac accggtgata 1740
ttatggccga aattgaaccg gatcatctgg tttatctgga tcgtaccaat aacgtgatga 1800
aactgagcca gggtgaattt gtgccggttg cactgctgga aagcctgtat gccggtggtg 1860
atccggtgat tcgtcagatt tatctgtatg gtaatagcac ccgtgccttt ctgctgggtg 1920
ttgcagttcc gaatatggat gcactgccgg aaggtattgg tgatgaagaa attaaagcac 1980
gtatgctgca ggcactggaa cgtattgcac gcgcaaatga acgtcatagt tatgaagttc 2040
cgcgtgatct gattattgaa cacgaaccgt ttagtccgga aaatggtctg ctggcaggcg 2100
ttggcaaata tatgcgtcct gcatttaaag cccgttatgg tgagcagctg gaagccctgt 2160
acgaagaaat tgcacgtagc caggatcgcg aactgcaaga actgcgtcgt accggtcgta 2220
cctttccggt tctggaaacc gtttgtcgtg cagccggtgc agtgctgggt ggcaaaaccg 2280
ttgcactgag cgaaaccggt agctttgcaa gcagtggtgg tgatagcctg agcgcactga 2340
gcctgagcct gctgctggaa gatatttatg aactgccggt tgaagttagc gcaatcctgc 2400
atccgagcgg cacctacggc ctgctggctg cagaaattga agaaaaactg ggtggtggtg 2460
caaaacgccg tgatgcagtt gccgttcatg gtgcagatct gacagttctg aaagcagccg 2520
atctgacact ggataaattc attgatgcgg aaattctggg tgcagcaacc ggtctgcctg 2580
cccctcctga tgccgaaccg gaagttgttc tgctgaccgg tgttacaggt tttctgggtc 2640
gttttatgtg tctggaatgg ctgcgtcgtc tggaacgcaa tggtaaaggt aaagttgttt 2700
gtgttgcacg tggtgccgat gatgatgacg cacgtcgtcg cgttctggca ggttttgaag 2760
gtggtgatgg tgccctggca gccgaagttg cacgtctggg tgaaggtcgt ctggccgttt 2820
ttgcgggtga tctggcagcc cctcgtctgg gcctgaccgc cacatgttgg caggccctgt 2880
gtgatcaggt ggatctgatt gcacatccgg gtgcctttgt taatcataaa ctgccgtatc 2940
gtcagctgtt tggtgcaaat accgcaggca ccgcagaact gattgccctg gccctgacca 3000
cccgtaaaaa acgctttgca catgttagca ccattgccac cacctataat gatggtcatc 3060
gtgcggatga aaacggctat attgatagcg ccatcccgga atggcatgtt agtgatgcat 3120
atgccgatgg ttatggtagc tcaaaatggg cagcggaagt gctgctggca cgtgcgaatg 3180
aacagtatgg tctgccggtg agcgtttatc gtagcaatat gattatggca cctggtgaat 3240
ttagcggtca gctgaatgtt ccggatatct ttacccgtct gctgctgagc ctggcgctga 3300
cccgtctggc accggcaagc ttttatagcg gtgatagcgc acgtgcacat tatgaaggcc 3360
tgccggtgga ttttctggct cgtgccattg tgaccattgc cgaagataat cgtgcaggtt 3420
ttcatacctt tcacaccatt aatccgcatg atgatggtat tagcacagat acatttgtgg 3480
attggattgg tgaagcaggt attccgattg aacgcattgc ggattatgat gaatgggtta 3540
cccgttttgg caccgcactg cgtgccctgc cggaaaaaca gcgtcaggca agcattctgc 3600
cgctgatgga tgcatataaa catccgagtc cggcaattcc ggattttcgc gatcaggcac 3660
cgaattttcg tcaggcagtt gcggaaagcc aggttaatgg tgatggcgca attccgcatc 3720
tgacaccggc actgattgcg cgttatctgg aagatctgaa agcgacaggc ctgctgacca 3780
gctaaaggag gacatacaat ggtcgatatg aaaactacgc atacctccct cccctttgcc 3840
ggacatacgc tgcattttgt tgagttcgat ccggcgaatt tttgtgagca ggatttactc 3900
tggctgccgc actacgcaca actgcaacac gctggacgta aacgtaaaac agagcattta 3960
gccggacgga tcgctgctgt ttatgctttg cgggaatatg gctataaatg tgtgcccgca 4020
atcggcgagc tacgccaacc tgtctggcct gcggaggtat acggcagtat tagccactgt 4080
gggactacgg cattagccgt ggtatctcgt caaccgattg gcattgatat agaagaaatt 4140
ttttctgtac aaaccgcaag agaattgaca gacaacatta ttacaccagc ggaacacgag 4200
cgactcgcag actgcggttt agccttttct ctggcgctga cactggcatt ttccgccaaa 4260
gagagcgcat ttaaggcaag tgagatccaa actgatgcag gttttctgga ctatcagata 4320
attagctgga ataaacagca ggtcatcatt catcgtgaga atgagatgtt tgctgtgcac 4380
tggcagataa aagaaaagat agtcataacg ctgtgccaac acgattaatt gacaacatct 4440
ggtacgattc gcccgcagcc atcactgacc acgggcgaaa gtgtaaagca ggtgccttac 4500
catcctgacc tgacaaccgg atatgcggga tccccgggta ccg 4543
<210> 81
<211> 3408
<212> DNA
<213> 马来西亚新鞘氨醇杆菌
<400> 81
atggatgcag aaagcggtgt tatgccgagc gatccggatg ttgttgcatt tgttcgtcgt 60
ccggatacct gtctgagcgc aatgattgaa aaagcactgg atagctatgc aggtcgtgat 120
gcactggcat ggcgtccgac ccgtagcggt gttctgagcg atacctttga agttatgacc 180
tataaagatc tggcacgtcg tgttcgtagc gttgcaaccg cactggcaaa agatcctgat 240
ctgggtctga aagccggtga tccgattggt attatggcat ttgccaatgt tgatttcgtt 300
accctgaatc tggcactggg tctgtgtggt ggtgttattg caccgctgca gaccagcgca 360
agcatggaag cactgaccgg tctggttcgt gaactggcag caccgtgtct ggcagcaagc 420
ctggaacatc tggaagcaat taccaccctg gcaattgcaa gcgaaaaaac ccgtgcaatt 480
ctgatctttg atcatgatgg tctggatgaa gatgcacgtg ccgcaattgc agcagcacag 540
cagcgtctgg atgccgaaaa accgggttgt ctgattctgc cgtttagcga agttattgcc 600
cgtggtgaaa aactgcctcc gctggatccg tttgttccgg caccgggtga agatccgctg 660
gcactgatct attataccag cggtagcacc ggcaccccga aaggtgttat gtatacccag 720
aaactggtta aactgggtta tagcattgca cgtgatcatg caccgattgt tctgcattat 780
cagccgctga atcatagctt tggtatgagc tttattgcaa tggcactggc gagcggtggc 840
accagctatt ttaccgcaaa aagcgatctg agcaccctgc tgagtgatat gaaaatggtt 900
cgtccgacca ccatggccct ggttccgcgt attagcgaaa tgctgtttca gcgttttcat 960
gcagattatg cagatgaaat tgcgcgtgat gaggatgcag ccatggcacg ttttcgtgaa 1020
gatgttctgg gtggtcgtat gaccgatatt gttaccggtg cagcaccgac cagtccggaa 1080
ctgcgtgatt ttattgaaaa aatgacaggt ctgaccctga tggaaggtta tggttgtacc 1140
gaagccggtg gtagcattac ctttaatgat cgtgttatgc gtccgcctgt tctggaatat 1200
cgtctgattg atgttcctga actgggatat tttaccaccg atacaccgca tccgcgtggt 1260
gaactgattc tgaaaagtga tgcaatgttt gccggttatt ttgcacgtcc ggatctgacc 1320
gcaaaagcat ttgatgatga aggcttttat cacaccggtg atattatggc cgaaattgaa 1380
ccggatcatc tggtttatct ggatcgtacc aataacgtga tgaaactgag ccagggtgaa 1440
tttgtgccgg ttgcactgct ggaaagcctg tatgccggtg gtgatccggt gattcgtcag 1500
atttatctgt atggtaatag cacccgtgcc tttctgctgg gtgttgcagt tccgaatatg 1560
gatgcactgc cggaaggtat tggtgatgaa gaaattaaag cacgtatgct gcaggcactg 1620
gaacgtattg cacgcgcaaa tgaacgtcat agttatgaag ttccgcgtga tctgattatt 1680
gaacacgaac cgtttagtcc ggaaaatggt ctgctggcag gcgttggcaa atatatgcgt 1740
cctgcattta aagcccgtta tggtgagcag ctggaagccc tgtacgaaga aattgcacgt 1800
agccaggatc gcgaactgca agaactgcgt cgtaccggtc gtacctttcc ggttctggaa 1860
accgtttgtc gtgcagccgg tgcagtgctg ggtggcaaaa ccgttgcact gagcgaaacc 1920
ggtagctttg caagcagtgg tggtgatagc ctgagcgcac tgagcctgag cctgctgctg 1980
gaagatattt atgaactgcc ggttgaagtt agcgcaatcc tgcatccgag cggcacctac 2040
ggcctgctgg ctgcagaaat tgaagaaaaa ctgggtggtg gtgcaaaacg ccgtgatgca 2100
gttgccgttc atggtgcaga tctgacagtt ctgaaagcag ccgatctgac actggataaa 2160
ttcattgatg cggaaattct gggtgcagca accggtctgc ctgcccctcc tgatgccgaa 2220
ccggaagttg ttctgctgac cggtgttaca ggttttctgg gtcgttttat gtgtctggaa 2280
tggctgcgtc gtctggaacg caatggtaaa ggtaaagttg tttgtgttgc acgtggtgcc 2340
gatgatgatg acgcacgtcg tcgcgttctg gcaggttttg aaggtggtga tggtgccctg 2400
gcagccgaag ttgcacgtct gggtgaaggt cgtctggccg tttttgcggg tgatctggca 2460
gcccctcgtc tgggcctgac cgccacatgt tggcaggccc tgtgtgatca ggtggatctg 2520
attgcacatc cgggtgcctt tgttaatcat aaactgccgt atcgtcagct gtttggtgca 2580
aataccgcag gcaccgcaga actgattgcc ctggccctga ccacccgtaa aaaacgcttt 2640
gcacatgtta gcaccattgc caccacctat aatgatggtc atcgtgcgga tgaaaacggc 2700
tatattgata gcgccatccc ggaatggcat gttagtgatg catatgccga tggttatggt 2760
agctcaaaat gggcagcgga agtgctgctg gcacgtgcga atgaacagta tggtctgccg 2820
gtgagcgttt atcgtagcaa tatgattatg gcacctggtg aatttagcgg tcagctgaat 2880
gttccggata tctttacccg tctgctgctg agcctggcgc tgacccgtct ggcaccggca 2940
agcttttata gcggtgatag cgcacgtgca cattatgaag gcctgccggt ggattttctg 3000
gctcgtgcca ttgtgaccat tgccgaagat aatcgtgcag gttttcatac ctttcacacc 3060
attaatccgc atgatgatgg tattagcaca gatacatttg tggattggat tggtgaagca 3120
ggtattccga ttgaacgcat tgcggattat gatgaatggg ttacccgttt tggcaccgca 3180
ctgcgtgccc tgccggaaaa acagcgtcag gcaagcattc tgccgctgat ggatgcatat 3240
aaacatccga gtccggcaat tccggatttt cgcgatcagg caccgaattt tcgtcaggca 3300
gttgcggaaa gccaggttaa tggtgatggc gcaattccgc atctgacacc ggcactgatt 3360
gcgcgttatc tggaagatct gaaagcgaca ggcctgctga ccagctaa 3408
<210> 82
<211> 3582
<212> DNA
<213> Coccomyxa subellipsoidea
<400> 82
atgacagaga acggaggact acctcaggtc aatggaggcg gcccccagta ctgggagatg 60
tccaacggcc agaaccagac taacaatgtc attcagaaga ggcttgcccg cgctcgcgaa 120
gtcatcaagc aagaccccca gctgcaggcg gccaagtttg acaggaaatc acttcaacgg 180
atcacggatg cggggaacac cagcattgag attattgcgg ccatgttcaa ggagtatgcg 240
tcgcgcgatc tattcggcgc ctgcacaccg ggagagtcca ccttccacac tgtgacttat 300
ggagcagtct gggagcgcat tcaggcgctg gtggcgggct ggacagcgct gggattcgtg 360
gctccggggg actttgtggg gatctctggg tttgccagcg tggactgggt ggtgtctgat 420
ctggcgacgc tgcatgctgg gggggtcatg gtccccctgc ccacaaacat cctggcagag 480
gacgtgcgcg caatcattga cgaggctgaa gtgcgttgcc tcatggtcag cgctgaggag 540
cttgcggcca ttgcaccggt catcggcggc tgcgcgagcg tgaaggccgt cattgtcatg 600
gacagttcca cggacgccgt gacatcctcg ggagcctacg cggagatgca ggccaacctg 660
ccggcaggcg caaagctgac caccatcgac gaagttttgg cggcaggccg cgcaaccggc 720
aagcagcccg cactggtgat ccccggcagg gatgggcggc ccgcggaccc cttagtaaac 780
ctcatgtaca cctcgggcag ctctgggcgt cccaaggggg ccgagtaccc cgagcacctc 840
atctttgact tcctcaagaa ctcgatgccc acagatgcgc cggagctgcc gaccatcata 900
atgggcttcc ttcctttaaa ccatttgatg ggaagattta ctctgctcaa gtgcctgctc 960
accggaggcc agaactggtt tgtgcgctcg accgacatgt cgaccttctt cgatgacctg 1020
gcgacgatcc gtcccacgga ggcgatgttc cctccgcgga ttatgaacat gctgcacgac 1080
agattcgtgg agcagctcga ccgcctgccg ccagccccca gcgaggccga gcgcgcgcag 1140
caacgccagg acctgatcaa gcgcttcagg gaagtggact tgggtggccg cctcttcacc 1200
ggctcctttg gcagcgcgcc agcgtcccca gatgtgatcc aatggctgga ggaggtcctc 1260
ggcttccccc cagtgaatgg ctacggctcc acagagggcg gcatgatcat gctcgacaac 1320
aagatccagc atagttatgt gccggcgtac aagctggtag atgtgccaga gctgggctac 1380
accacaaagg acaagccctt cccccgcgga gaactgcgca tcaagacccg gcgcatgatc 1440
ccgggctact acaaacatcc tgaggcaaca gcggatctgt ttgacgagga gggcttcctg 1500
aagactgggg atgtggtgga gcagcgcgat gcagacacct tcatctggct ggaccgcgtc 1560
aagaacatca tcaagctctc acagggtgag tacgtgagcg tgtcgcggct ggaggagatc 1620
tatgtgggca actccaagct catccaccag atgtacatct acgggaactc cctccgtgcc 1680
tacctggtcg ccgtcgtcgt gccccacatc gagaacggag cgtgtgcgga tgcgggcaag 1740
ctgagggcgg cgctgcggac agagctggat gacgtggcgc gacgcaaggc actacagggg 1800
tatgagatcc cgcgcgagtt catagtggag atgcgcccct tctccaagga caatcacctg 1860
ctcactgact ccgccaagcc cgcccgcggc cagctcaaga agaggtacca ggcggagctg 1920
gagggccttt acacggccct ggaggagcgt ctgcgcgaga gactgcgcgc catgaaggag 1980
ggcaaggatg catctgtgca ggaccgtatc aagcaggcgc tggaggttac tctgggactg 2040
gcggaggagg acatggcgga cgtggcttcg cgcagcttcg cgcagctggg cggtgactcg 2100
ctggcggcga tccagtttgc gcgctacgtg ggcgagcttt gcggcgtcaa cctgccggtg 2160
tcctttgtgc tggaccactc ccactccctc caggccatcg ccgaccgcgt ccacgaactc 2220
gtcagcggcg acgcgagcgc agggatcacg ttcgagtcga tccacggcag cgatggcgtg 2280
aacatcaagg cagccgacct gaagctggac cggttcctat cagaagctga cacggccgcg 2340
gccgccgcgg ccgccccggc ctccgagctg ccggcgcggc cgacacacgt gctgctgacc 2400
ggcgccaacg gcttcctcgg ccgcttcctg ctgctggacc tgctgcagcg cggttctgac 2460
aagaatggag gccgtgtggt ggctatagtg cgcggcagca gcgatgagaa ggcggctgag 2520
cggctgcgcg ccggttttga cagcggtgac gcgaccctgc tgcagcgcta tgacaccctc 2580
agcaagcatc tgaccgtcta tgcaggcgac ctggcgaagc cgcagctggg cctgagccag 2640
ggggtgtatg agtcgctgtg cgctgagctg gacaccatcg tgcacaacgg cgcgctggtc 2700
aaccacgctt actcctatga gcagctcttt gagcccaatg tgctcggcag cgtggaggtg 2760
atgcggatgg ctctggcaaa gcgcagaaag gcgctgacat tcatctccag tgtgggagtg 2820
gtgggaggcc tggaccaccc acagccggtg actgaggctg aggacggtcc aactctgtgt 2880
gatgtgcacc cgggcgacgg cggctacgcc atcgggtacg gctgcagcaa gtgggcggtg 2940
gaggtgcttc tcaaggagct gcaccagcgc tggggtgttc ccgtcaaggt cttccgctgc 3000
ggcatgatcc tgtcgcacac cagctacttg ggccagatca acccaaccga cttcttcacg 3060
cggctgctgt gcggcattgc ctacacgggg atcgccccgc agtccttcta caccctgccc 3120
cacggccccg aggagcactt tgacggcatg cccatcgact tcgtgtccgg cgtgatctct 3180
gccacaacgg cggccgagcg cagcggcttc gacacgtacc atgtggtcaa tccccactgg 3240
agcgacggcg tatccctcga ccgcatcgtc gactgggcgg agagcgccgg ctacccggtt 3300
aatcgcatcg cgccatatga gcagtggtac gcgcagttca aggcagcgct ggaggctctt 3360
gaccacacgc ggcagcagca gtcgccgctg cccatcatct accaatggga gcgcccggca 3420
tccggcacca gcggcacgaa gtacgatgcc acgcagctgc gcaagagggc ggccgcatac 3480
acacagtgga aggacgtgcc ccatctggac gaggcgttca tccaccagaa catgcgccac 3540
ctcaccaccc tgcgcctcat cacccctccc ggcaaggcct ga 3582
<210> 83
<211> 1193
<212> PRT
<213> Coccomyxa subellipsoidea
<400> 83
Met Thr Glu Asn Gly Gly Leu Pro Gln Val Asn Gly Gly Gly Pro Gln
1 5 10 15
Tyr Trp Glu Met Ser Asn Gly Gln Asn Gln Thr Asn Asn Val Ile Gln
20 25 30
Lys Arg Leu Ala Arg Ala Arg Glu Val Ile Lys Gln Asp Pro Gln Leu
35 40 45
Gln Ala Ala Lys Phe Asp Arg Lys Ser Leu Gln Arg Ile Thr Asp Ala
50 55 60
Gly Asn Thr Ser Ile Glu Ile Ile Ala Ala Met Phe Lys Glu Tyr Ala
65 70 75 80
Ser Arg Asp Leu Phe Gly Ala Cys Thr Pro Gly Glu Ser Thr Phe His
85 90 95
Thr Val Thr Tyr Gly Ala Val Trp Glu Arg Ile Gln Ala Leu Val Ala
100 105 110
Gly Trp Thr Ala Leu Gly Phe Val Ala Pro Gly Asp Phe Val Gly Ile
115 120 125
Ser Gly Phe Ala Ser Val Asp Trp Val Val Ser Asp Leu Ala Thr Leu
130 135 140
His Ala Gly Gly Val Met Val Pro Leu Pro Thr Asn Ile Leu Ala Glu
145 150 155 160
Asp Val Arg Ala Ile Ile Asp Glu Ala Glu Val Arg Cys Leu Met Val
165 170 175
Ser Ala Glu Glu Leu Ala Ala Ile Ala Pro Val Ile Gly Gly Cys Ala
180 185 190
Ser Val Lys Ala Val Ile Val Met Asp Ser Ser Thr Asp Ala Val Thr
195 200 205
Ser Ser Gly Ala Tyr Ala Glu Met Gln Ala Asn Leu Pro Ala Gly Ala
210 215 220
Lys Leu Thr Thr Ile Asp Glu Val Leu Ala Ala Gly Arg Ala Thr Gly
225 230 235 240
Lys Gln Pro Ala Leu Val Ile Pro Gly Arg Asp Gly Arg Pro Ala Asp
245 250 255
Pro Leu Val Asn Leu Met Tyr Thr Ser Gly Ser Ser Gly Arg Pro Lys
260 265 270
Gly Ala Glu Tyr Pro Glu His Leu Ile Phe Asp Phe Leu Lys Asn Ser
275 280 285
Met Pro Thr Asp Ala Pro Glu Leu Pro Thr Ile Ile Met Gly Phe Leu
290 295 300
Pro Leu Asn His Leu Met Gly Arg Phe Thr Leu Leu Lys Cys Leu Leu
305 310 315 320
Thr Gly Gly Gln Asn Trp Phe Val Arg Ser Thr Asp Met Ser Thr Phe
325 330 335
Phe Asp Asp Leu Ala Thr Ile Arg Pro Thr Glu Ala Met Phe Pro Pro
340 345 350
Arg Ile Met Asn Met Leu His Asp Arg Phe Val Glu Gln Leu Asp Arg
355 360 365
Leu Pro Pro Ala Pro Ser Glu Ala Glu Arg Ala Gln Gln Arg Gln Asp
370 375 380
Leu Ile Lys Arg Phe Arg Glu Val Asp Leu Gly Gly Arg Leu Phe Thr
385 390 395 400
Gly Ser Phe Gly Ser Ala Pro Ala Ser Pro Asp Val Ile Gln Trp Leu
405 410 415
Glu Glu Val Leu Gly Phe Pro Pro Val Asn Gly Tyr Gly Ser Thr Glu
420 425 430
Gly Gly Met Ile Met Leu Asp Asn Lys Ile Gln His Ser Tyr Val Pro
435 440 445
Ala Tyr Lys Leu Val Asp Val Pro Glu Leu Gly Tyr Thr Thr Lys Asp
450 455 460
Lys Pro Phe Pro Arg Gly Glu Leu Arg Ile Lys Thr Arg Arg Met Ile
465 470 475 480
Pro Gly Tyr Tyr Lys His Pro Glu Ala Thr Ala Asp Leu Phe Asp Glu
485 490 495
Glu Gly Phe Leu Lys Thr Gly Asp Val Val Glu Gln Arg Asp Ala Asp
500 505 510
Thr Phe Ile Trp Leu Asp Arg Val Lys Asn Ile Ile Lys Leu Ser Gln
515 520 525
Gly Glu Tyr Val Ser Val Ser Arg Leu Glu Glu Ile Tyr Val Gly Asn
530 535 540
Ser Lys Leu Ile His Gln Met Tyr Ile Tyr Gly Asn Ser Leu Arg Ala
545 550 555 560
Tyr Leu Val Ala Val Val Val Pro His Ile Glu Asn Gly Ala Cys Ala
565 570 575
Asp Ala Gly Lys Leu Arg Ala Ala Leu Arg Thr Glu Leu Asp Asp Val
580 585 590
Ala Arg Arg Lys Ala Leu Gln Gly Tyr Glu Ile Pro Arg Glu Phe Ile
595 600 605
Val Glu Met Arg Pro Phe Ser Lys Asp Asn His Leu Leu Thr Asp Ser
610 615 620
Ala Lys Pro Ala Arg Gly Gln Leu Lys Lys Arg Tyr Gln Ala Glu Leu
625 630 635 640
Glu Gly Leu Tyr Thr Ala Leu Glu Glu Arg Leu Arg Glu Arg Leu Arg
645 650 655
Ala Met Lys Glu Gly Lys Asp Ala Ser Val Gln Asp Arg Ile Lys Gln
660 665 670
Ala Leu Glu Val Thr Leu Gly Leu Ala Glu Glu Asp Met Ala Asp Val
675 680 685
Ala Ser Arg Ser Phe Ala Gln Leu Gly Gly Asp Ser Leu Ala Ala Ile
690 695 700
Gln Phe Ala Arg Tyr Val Gly Glu Leu Cys Gly Val Asn Leu Pro Val
705 710 715 720
Ser Phe Val Leu Asp His Ser His Ser Leu Gln Ala Ile Ala Asp Arg
725 730 735
Val His Glu Leu Val Ser Gly Asp Ala Ser Ala Gly Ile Thr Phe Glu
740 745 750
Ser Ile His Gly Ser Asp Gly Val Asn Ile Lys Ala Ala Asp Leu Lys
755 760 765
Leu Asp Arg Phe Leu Ser Glu Ala Asp Thr Ala Ala Ala Ala Ala Ala
770 775 780
Ala Pro Ala Ser Glu Leu Pro Ala Arg Pro Thr His Val Leu Leu Thr
785 790 795 800
Gly Ala Asn Gly Phe Leu Gly Arg Phe Leu Leu Leu Asp Leu Leu Gln
805 810 815
Arg Gly Ser Asp Lys Asn Gly Gly Arg Val Val Ala Ile Val Arg Gly
820 825 830
Ser Ser Asp Glu Lys Ala Ala Glu Arg Leu Arg Ala Gly Phe Asp Ser
835 840 845
Gly Asp Ala Thr Leu Leu Gln Arg Tyr Asp Thr Leu Ser Lys His Leu
850 855 860
Thr Val Tyr Ala Gly Asp Leu Ala Lys Pro Gln Leu Gly Leu Ser Gln
865 870 875 880
Gly Val Tyr Glu Ser Leu Cys Ala Glu Leu Asp Thr Ile Val His Asn
885 890 895
Gly Ala Leu Val Asn His Ala Tyr Ser Tyr Glu Gln Leu Phe Glu Pro
900 905 910
Asn Val Leu Gly Ser Val Glu Val Met Arg Met Ala Leu Ala Lys Arg
915 920 925
Arg Lys Ala Leu Thr Phe Ile Ser Ser Val Gly Val Val Gly Gly Leu
930 935 940
Asp His Pro Gln Pro Val Thr Glu Ala Glu Asp Gly Pro Thr Leu Cys
945 950 955 960
Asp Val His Pro Gly Asp Gly Gly Tyr Ala Ile Gly Tyr Gly Cys Ser
965 970 975
Lys Trp Ala Val Glu Val Leu Leu Lys Glu Leu His Gln Arg Trp Gly
980 985 990
Val Pro Val Lys Val Phe Arg Cys Gly Met Ile Leu Ser His Thr Ser
995 1000 1005
Tyr Leu Gly Gln Ile Asn Pro Thr Asp Phe Phe Thr Arg Leu Leu
1010 1015 1020
Cys Gly Ile Ala Tyr Thr Gly Ile Ala Pro Gln Ser Phe Tyr Thr
1025 1030 1035
Leu Pro His Gly Pro Glu Glu His Phe Asp Gly Met Pro Ile Asp
1040 1045 1050
Phe Val Ser Gly Val Ile Ser Ala Thr Thr Ala Ala Glu Arg Ser
1055 1060 1065
Gly Phe Asp Thr Tyr His Val Val Asn Pro His Trp Ser Asp Gly
1070 1075 1080
Val Ser Leu Asp Arg Ile Val Asp Trp Ala Glu Ser Ala Gly Tyr
1085 1090 1095
Pro Val Asn Arg Ile Ala Pro Tyr Glu Gln Trp Tyr Ala Gln Phe
1100 1105 1110
Lys Ala Ala Leu Glu Ala Leu Asp His Thr Arg Gln Gln Gln Ser
1115 1120 1125
Pro Leu Pro Ile Ile Tyr Gln Trp Glu Arg Pro Ala Ser Gly Thr
1130 1135 1140
Ser Gly Thr Lys Tyr Asp Ala Thr Gln Leu Arg Lys Arg Ala Ala
1145 1150 1155
Ala Tyr Thr Gln Trp Lys Asp Val Pro His Leu Asp Glu Ala Phe
1160 1165 1170
Ile His Gln Asn Met Arg His Leu Thr Thr Leu Arg Leu Ile Thr
1175 1180 1185
Pro Pro Gly Lys Ala
1190
<210> 84
<211> 4717
<212> DNA
<213> 人工序列
<220>
<223> 含有Coccomyxa subellipsoidea的ACAR 基因(经密码子优化)和
大肠杆菌的entD基因的DNA片段的核苷酸序列
<400> 84
ccaagcttgc atgccagatc gtttagatcc gaaggaaaac gtcgaaaagc aatttgcttt 60
tcgacgcccc accccgcgcg ttttagcgtg tcagtagacg cgtagggtaa gtggggtagc 120
ggcttgttag atatcttgaa atcggctttc aacagcattg atttcgatgt atttagctgg 180
ccgtttgaga cgcgatgtcc acagggtagc tggtagtttg aaaatcaacg ccgttgccct 240
taggattcag taactggcac attttgtaat gcgctagatc tgtgtgccca gtcttccagg 300
ctgcttatca cagtgaaagc aaaaccaatt cgtggctgcg aaagtcgtag ccaccacgaa 360
gtccaggagg acatacaatg accgaaaatg gtggtctgcc gcaggttaat ggtggtggtc 420
cgcagtattg ggaaatgagc aatggtcaga atcagaccaa taacgtgatt cagaaacgtc 480
tggcacgtgc gcgtgaagtt attaaacagg atccgcagct gcaggcagca aaatttgatc 540
gtaaaagcct gcagcgtatt accgatgcag gtaataccag cattgaaatt attgcagcca 600
tgtttaaaga atacgcaagc cgtgacctgt ttggtgcatg tacaccgggt gaaagcacct 660
ttcataccgt tacctatggt gcagtttggg aacgtattca ggcactggtt gcaggttgga 720
ccgcactggg ttttgttgct ccgggtgatt ttgttggtat tagcggtttt gcaagcgttg 780
attgggttgt tagcgatctg gcaaccctgc atgccggtgg tgttatggtt ccgctgccga 840
ccaatattct ggccgaagat gttcgtgcaa ttattgatga agccgaagtt cgttgtctga 900
tggttagcgc agaagaactg gcagcaattg caccggttat tggtggttgt gccagcgtta 960
aagcagttat tgttatggat agcagcaccg atgccgttac cagcagcggt gcatatgccg 1020
aaatgcaggc caatctgcct gccggtgcaa aactgaccac catcgatgaa gttctggcag 1080
caggtcgtgc aaccggtaaa cagcctgccc tggttattcc gggtcgtgat ggtcgtccgg 1140
cagatccgct ggttaatctg atgtatacca gcggtagcag cggtcgtccg aaaggtgcag 1200
aatatccgga acatctgatt tttgattttc tgaaaaatag catgccgacc gatgcaccgg 1260
aactgccgac gattattatg ggttttctgc cgctgaatca tctgatgggt cgttttaccc 1320
tgctgaaatg tctgctgacc ggtggccaga attggtttgt tcgtagcacc gatatgagca 1380
ccttttttga tgatctggcg accattcgtc cgaccgaagc aatgtttccg cctcgtatta 1440
tgaatatgct gcatgatcgt tttgtggaac agctggatcg tctgcctccg gcaccgagcg 1500
aagcagaacg tgcacagcag cgtcaggatc tgattaaacg ttttcgtgaa gttgatctgg 1560
gtggtcgtct gtttacaggt agctttggta gcgcaccggc aagtccggat gttattcagt 1620
ggctggaaga agtgctgggt tttccgcctg ttaatggtta tggtagtacc gaaggtggta 1680
tgattatgct ggacaacaaa attcagcaca gctatgttcc agcctataaa ctggttgatg 1740
tgccggaact gggttatacc accaaagata aaccgtttcc gcgtggtgaa ctgcgtatta 1800
aaacccgtcg tatgattccg ggttattaca aacatcctga agcaaccgca gacctgttcg 1860
atgaagaagg tttcctgaaa accggtgatg ttgttgaaca gcgtgatgca gataccttta 1920
tttggctgga tcgcgtgaaa aacattatca aactgagcca gggtgaatat gttagcgtta 1980
gccgtctgga agaaatttat gtgggtaaca gcaaactgat tcaccagatg tatatctatg 2040
gtaatagcct gcgtgcatat ctggttgccg ttgttgttcc gcatattgaa aatggcgcat 2100
gtgcagatgc cggtaaactg cgtgcagcac tgcgtaccga actggatgat gttgcacgtc 2160
gtaaagcact gcagggttat gaaattcctc gtgaatttat tgttgagatg cgtccgttta 2220
gcaaagataa tcatctgctg acagatagcg caaaaccggc acgtggtcag ctgaaaaaac 2280
gttatcaggc agaactggaa ggtctgtata cggcactgga agaacgtctg cgtgaacggc 2340
tgcgtgcaat gaaagaaggt aaagacgcaa gcgttcagga tcgtatcaaa caggccctgg 2400
aagttaccct gggtctggcg gaagaggata tggcagatgt tgcaagccgt agctttgcac 2460
agctgggtgg tgatagcctg gcagccattc agtttgcacg ttatgttggc gaactgtgtg 2520
gtgttaatct gccggttagc tttgttctgg atcatagcca tagtctgcag gcaattgcag 2580
atcgtgtgca tgaactggtt agcggtgatg cctcagcagg cattaccttt gaaagcattc 2640
atggtagtga tggcgttaac attaaagcag cagatctgaa actggatcgt tttctgagcg 2700
aagccgatac cgcagcagca gccgctgcag caccggcatc agaactgcct gcacgtccga 2760
cccatgttct gctgactggc gcaaatggtt ttctgggtcg ctttctgctg ctggatctgc 2820
tgcagcgtgg tagcgataaa aatggcggtc gtgttgttgc aattgttcgt ggtagcagtg 2880
atgaaaaagc agccgaacgc ctgcgtgcgg gttttgatag tggtgatgcc accctgctgc 2940
aacgttatga taccctgagc aaacatctga ccgtttatgc cggtgatctg gccaaaccgc 3000
agctgggtct gagtcagggt gtttatgaaa gcctgtgtgc agagctggat accattgttc 3060
ataatggtgc actggtgaac catgcctata gctatgagca gctgtttgaa ccgaatgttc 3120
tgggtagcgt tgaagttatg cgtatggcac tggcaaaacg ccgtaaagcc ctgaccttta 3180
ttagcagcgt tggtgttgtg ggtggcctgg atcatccgca gccggttacc gaagcggaag 3240
atggtccgac cctgtgtgat gttcatcctg gtgatggtgg ttatgcaatt ggttatggct 3300
gtagcaaatg ggcagttgaa gtgctgctga aagaactgca tcagcgttgg ggtgttccgg 3360
ttaaagtttt tcgttgcggt atgattctgt cccataccag ctatctgggt cagattaatc 3420
cgacagattt tttcacccgt ctgctgtgtg gtattgcata tacaggtatt gcaccgcaga 3480
gcttttatac cctgccgcat ggtccggaag aacattttga tggtatgccg attgattttg 3540
tgagcggtgt tattagcgca accacagccg cagaacgtag cggctttgat acctatcatg 3600
ttgttaatcc gcattggagt gatggtgtga gcctggatcg tattgtagat tgggcagaaa 3660
gtgcaggtta tccggttaat cgtatcgcac cgtacgaaca gtggtatgca cagtttaaag 3720
cagccctgga agcactggat catacccgtc agcagcagtc accgctgccg attatctatc 3780
agtgggaacg tccggcaagc ggtacaagcg gcaccaaata tgatgcaaca cagctgcgta 3840
aacgtgcagc agcctatacc cagtggaaag atgtgccgca tctggatgaa gcatttattc 3900
atcagaatat gcgtcatctg accaccctgc gtctgattac ccctccgggt aaagcataaa 3960
ggaggacata caatggtcga tatgaaaact acgcatacct ccctcccctt tgccggacat 4020
acgctgcatt ttgttgagtt cgatccggcg aatttttgtg agcaggattt actctggctg 4080
ccgcactacg cacaactgca acacgctgga cgtaaacgta aaacagagca tttagccgga 4140
cggatcgctg ctgtttatgc tttgcgggaa tatggctata aatgtgtgcc cgcaatcggc 4200
gagctacgcc aacctgtctg gcctgcggag gtatacggca gtattagcca ctgtgggact 4260
acggcattag ccgtggtatc tcgtcaaccg attggcattg atatagaaga aattttttct 4320
gtacaaaccg caagagaatt gacagacaac attattacac cagcggaaca cgagcgactc 4380
gcagactgcg gtttagcctt ttctctggcg ctgacactgg cattttccgc caaagagagc 4440
gcatttaagg caagtgagat ccaaactgat gcaggttttc tggactatca gataattagc 4500
tggaataaac agcaggtcat cattcatcgt gagaatgaga tgtttgctgt gcactggcag 4560
ataaaagaaa agatagtcat aacgctgtgc caacacgatt aattgacaac atctggtacg 4620
attcgcccgc agccatcact gaccacgggc gaaagtgtaa agcaggtgcc ttaccatcct 4680
gacctgacaa ccggatatgc gggatccccg ggtaccg 4717
<210> 85
<211> 3582
<212> DNA
<213> Coccomyxa subellipsoidea
<400> 85
atgaccgaaa atggtggtct gccgcaggtt aatggtggtg gtccgcagta ttgggaaatg 60
agcaatggtc agaatcagac caataacgtg attcagaaac gtctggcacg tgcgcgtgaa 120
gttattaaac aggatccgca gctgcaggca gcaaaatttg atcgtaaaag cctgcagcgt 180
attaccgatg caggtaatac cagcattgaa attattgcag ccatgtttaa agaatacgca 240
agccgtgacc tgtttggtgc atgtacaccg ggtgaaagca cctttcatac cgttacctat 300
ggtgcagttt gggaacgtat tcaggcactg gttgcaggtt ggaccgcact gggttttgtt 360
gctccgggtg attttgttgg tattagcggt tttgcaagcg ttgattgggt tgttagcgat 420
ctggcaaccc tgcatgccgg tggtgttatg gttccgctgc cgaccaatat tctggccgaa 480
gatgttcgtg caattattga tgaagccgaa gttcgttgtc tgatggttag cgcagaagaa 540
ctggcagcaa ttgcaccggt tattggtggt tgtgccagcg ttaaagcagt tattgttatg 600
gatagcagca ccgatgccgt taccagcagc ggtgcatatg ccgaaatgca ggccaatctg 660
cctgccggtg caaaactgac caccatcgat gaagttctgg cagcaggtcg tgcaaccggt 720
aaacagcctg ccctggttat tccgggtcgt gatggtcgtc cggcagatcc gctggttaat 780
ctgatgtata ccagcggtag cagcggtcgt ccgaaaggtg cagaatatcc ggaacatctg 840
atttttgatt ttctgaaaaa tagcatgccg accgatgcac cggaactgcc gacgattatt 900
atgggttttc tgccgctgaa tcatctgatg ggtcgtttta ccctgctgaa atgtctgctg 960
accggtggcc agaattggtt tgttcgtagc accgatatga gcaccttttt tgatgatctg 1020
gcgaccattc gtccgaccga agcaatgttt ccgcctcgta ttatgaatat gctgcatgat 1080
cgttttgtgg aacagctgga tcgtctgcct ccggcaccga gcgaagcaga acgtgcacag 1140
cagcgtcagg atctgattaa acgttttcgt gaagttgatc tgggtggtcg tctgtttaca 1200
ggtagctttg gtagcgcacc ggcaagtccg gatgttattc agtggctgga agaagtgctg 1260
ggttttccgc ctgttaatgg ttatggtagt accgaaggtg gtatgattat gctggacaac 1320
aaaattcagc acagctatgt tccagcctat aaactggttg atgtgccgga actgggttat 1380
accaccaaag ataaaccgtt tccgcgtggt gaactgcgta ttaaaacccg tcgtatgatt 1440
ccgggttatt acaaacatcc tgaagcaacc gcagacctgt tcgatgaaga aggtttcctg 1500
aaaaccggtg atgttgttga acagcgtgat gcagatacct ttatttggct ggatcgcgtg 1560
aaaaacatta tcaaactgag ccagggtgaa tatgttagcg ttagccgtct ggaagaaatt 1620
tatgtgggta acagcaaact gattcaccag atgtatatct atggtaatag cctgcgtgca 1680
tatctggttg ccgttgttgt tccgcatatt gaaaatggcg catgtgcaga tgccggtaaa 1740
ctgcgtgcag cactgcgtac cgaactggat gatgttgcac gtcgtaaagc actgcagggt 1800
tatgaaattc ctcgtgaatt tattgttgag atgcgtccgt ttagcaaaga taatcatctg 1860
ctgacagata gcgcaaaacc ggcacgtggt cagctgaaaa aacgttatca ggcagaactg 1920
gaaggtctgt atacggcact ggaagaacgt ctgcgtgaac ggctgcgtgc aatgaaagaa 1980
ggtaaagacg caagcgttca ggatcgtatc aaacaggccc tggaagttac cctgggtctg 2040
gcggaagagg atatggcaga tgttgcaagc cgtagctttg cacagctggg tggtgatagc 2100
ctggcagcca ttcagtttgc acgttatgtt ggcgaactgt gtggtgttaa tctgccggtt 2160
agctttgttc tggatcatag ccatagtctg caggcaattg cagatcgtgt gcatgaactg 2220
gttagcggtg atgcctcagc aggcattacc tttgaaagca ttcatggtag tgatggcgtt 2280
aacattaaag cagcagatct gaaactggat cgttttctga gcgaagccga taccgcagca 2340
gcagccgctg cagcaccggc atcagaactg cctgcacgtc cgacccatgt tctgctgact 2400
ggcgcaaatg gttttctggg tcgctttctg ctgctggatc tgctgcagcg tggtagcgat 2460
aaaaatggcg gtcgtgttgt tgcaattgtt cgtggtagca gtgatgaaaa agcagccgaa 2520
cgcctgcgtg cgggttttga tagtggtgat gccaccctgc tgcaacgtta tgataccctg 2580
agcaaacatc tgaccgttta tgccggtgat ctggccaaac cgcagctggg tctgagtcag 2640
ggtgtttatg aaagcctgtg tgcagagctg gataccattg ttcataatgg tgcactggtg 2700
aaccatgcct atagctatga gcagctgttt gaaccgaatg ttctgggtag cgttgaagtt 2760
atgcgtatgg cactggcaaa acgccgtaaa gccctgacct ttattagcag cgttggtgtt 2820
gtgggtggcc tggatcatcc gcagccggtt accgaagcgg aagatggtcc gaccctgtgt 2880
gatgttcatc ctggtgatgg tggttatgca attggttatg gctgtagcaa atgggcagtt 2940
gaagtgctgc tgaaagaact gcatcagcgt tggggtgttc cggttaaagt ttttcgttgc 3000
ggtatgattc tgtcccatac cagctatctg ggtcagatta atccgacaga ttttttcacc 3060
cgtctgctgt gtggtattgc atatacaggt attgcaccgc agagctttta taccctgccg 3120
catggtccgg aagaacattt tgatggtatg ccgattgatt ttgtgagcgg tgttattagc 3180
gcaaccacag ccgcagaacg tagcggcttt gatacctatc atgttgttaa tccgcattgg 3240
agtgatggtg tgagcctgga tcgtattgta gattgggcag aaagtgcagg ttatccggtt 3300
aatcgtatcg caccgtacga acagtggtat gcacagttta aagcagccct ggaagcactg 3360
gatcataccc gtcagcagca gtcaccgctg ccgattatct atcagtggga acgtccggca 3420
agcggtacaa gcggcaccaa atatgatgca acacagctgc gtaaacgtgc agcagcctat 3480
acccagtgga aagatgtgcc gcatctggat gaagcattta ttcatcagaa tatgcgtcat 3540
ctgaccaccc tgcgtctgat tacccctccg ggtaaagcat aa 3582

Claims (23)

1.一种生产目标物质的方法,所述方法包括:
通过使用具有生产所述目标物质的能力的微生物来生产所述目标物质,
其中所述目标物质是醛,
其中所述微生物已经进行了修饰而使该微生物具有醛氧化还原酶基因,且
其中所述醛氧化还原酶基因编码选自由以下组成的组的蛋白质:
(a)包含SEQ ID NO:18、79或83的氨基酸序列的蛋白质;
(b)包含SEQ ID NO:18、79或83的氨基酸序列,且该氨基酸序列包含1至10个氨基酸残基的取代、缺失、插入和/或添加的蛋白质,且其中所述蛋白质具有醛氧化还原酶活性;
(c)包含与SEQ ID NO:18、79或83的氨基酸序列具有90%或更高的同一性的氨基酸序列的蛋白质,且其中所述蛋白质具有醛氧化还原酶活性。
2.根据权利要求1所述的方法,其中所述生产包括:
在含有碳源的培养基中培养所述微生物以在所述培养基中生产和积累所述目标物质。
3.根据权利要求1所述的方法,其中所述生产包括:
通过使用所述微生物以将所述目标物质的前体转化成所述目标物质。
4.根据权利要求3所述的方法,其中所述转化包括:
在含有所述前体的培养基中培养所述微生物以在所述培养基中生产和积累所述目标物质。
5.根据权利要求3所述的方法,其中所述转化包括:
在反应混合物中允许所述微生物的细胞作用于所述前体以在所述反应混合物中生产和积累所述目标物质。
6.根据权利要求5所述的方法,其中所述细胞选自由以下组成的组:
-存在于所述微生物的培养液中的细胞,
-从所述培养液中收集的细胞,
-存在于所述培养液的加工产物中的细胞,
-存在于收集的细胞的加工产物中的细胞,和
-这些的组合。
7.根据权利要求3至6中任一项所述的方法,其中所述前体是选自由以下组成的组的物质:原儿茶酸、香草酸、苯甲酸、L-苯丙氨酸、肉桂酸和它们的组合。
8.根据权利要求1至7中任一项所述的方法,所述方法还包括从所述培养基或反应混合物中收集所述目标物质。
9.根据权利要求1至8中任一项所述的方法,其中所述微生物是属于肠杆菌科的细菌、棒状杆菌细菌或酵母。
10.根据权利要求9所述的方法,其中所述微生物是属于棒状杆菌属的细菌。
11.根据权利要求10所述的方法,其中所述微生物是谷氨酸棒杆菌。
12.根据权利要求9所述的方法,其中所述微生物是属于埃希氏菌属的细菌。
13.根据权利要求12所述的方法,其中所述微生物是大肠杆菌。
14.根据权利要求1-13中任一项所述的方法,其中所述目标物质是芳族醛。
15.根据权利要求1-14中任一项所述的方法,其中所述目标物质是选自由以下组成的组的芳族醛:香草醛、苯甲醛、肉桂醛和它们的组合。
16.根据权利要求1-15中任一项所述的方法,其中所述微生物已经以与未修饰的菌株相比参与所述目标物质的生物合成的酶的活性得以增加的方式进行了进一步的修饰。
17.根据权利要求16所述的方法,其中所述参与目标物质的生物合成的酶能够催化从所述目标物质的前体向所述目标物质的转化。
18.根据权利要求16或17所述的方法,其中所述参与目标物质的生物合成的酶选自由以下组成的组:3-脱氧-D-阿拉伯糖-庚酮糖酸7-磷酸合酶、3-脱氢奎尼酸合酶、3-脱氢奎尼酸脱水酶、3-脱氢莽草酸脱水酶、O-甲基转移酶、苯丙氨酸氨裂合酶和它们的组合。
19.根据权利要求1-18中任一项所述的方法,其中所述微生物已经以与未修饰的菌株相比磷酸泛酰巯基乙胺基转移酶的活性得以增加的方式进行了进一步的修饰。
20.根据权利要求1-19中任一项所述的方法,其中所述微生物已经以与未修饰的菌株相比除所述目标物质以外的物质的摄取系统的活性得以增加的方式进行了进一步的修饰。
21.根据权利要求20所述的方法,其中所述摄取系统选自由以下组成的组:香草酸摄取系统、原儿茶酸摄取系统和它们的组合。
22.根据权利要求1至21中任一项所述的方法,其中所述微生物已经以与未修饰的菌株相比在所述目标物质的生产期间参与生产副产物的酶的活性得以降低的方式进行了进一步的修饰。
23.根据权利要求22所述的方法,其中所述在目标物质的生产期间参与生产副产物的酶选自由以下组成的组:香草酸脱甲基酶、原儿茶酸3,4-双加氧酶、醇脱氢酶、莽草酸脱氢酶和它们的组合。
CN201780066218.9A 2016-10-27 2017-10-27 用于生产醛的方法 Active CN109890960B (zh)

Applications Claiming Priority (13)

Application Number Priority Date Filing Date Title
JP2016211103 2016-10-27
JP2016-211107 2016-10-27
JP2016-211103 2016-10-27
JP2016211106 2016-10-27
JP2016-211106 2016-10-27
JP2016211107 2016-10-27
JP2017-022265 2017-02-09
JP2017-022314 2017-02-09
JP2017-022330 2017-02-09
JP2017022265 2017-02-09
JP2017022330 2017-02-09
JP2017022314 2017-02-09
PCT/JP2017/038875 WO2018079705A1 (en) 2016-10-27 2017-10-27 Method for producing aldehyde

Publications (2)

Publication Number Publication Date
CN109890960A true CN109890960A (zh) 2019-06-14
CN109890960B CN109890960B (zh) 2023-02-17

Family

ID=60452707

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780066218.9A Active CN109890960B (zh) 2016-10-27 2017-10-27 用于生产醛的方法

Country Status (5)

Country Link
US (1) US10883125B2 (zh)
EP (1) EP3532610B1 (zh)
JP (2) JP2019536450A (zh)
CN (1) CN109890960B (zh)
WO (1) WO2018079705A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020027251A1 (en) 2018-08-03 2020-02-06 Ajinomoto Co., Inc. Method for producing objective substance
WO2020203885A1 (ja) 2019-03-29 2020-10-08 味の素株式会社 アロラクトースの製造法
WO2020226087A1 (ja) 2019-05-08 2020-11-12 味の素株式会社 バニリンの製造方法
JP2023001394A (ja) * 2019-11-11 2023-01-05 味の素株式会社 バニリンの製造方法
JP7516779B2 (ja) * 2020-02-28 2024-07-17 味の素株式会社 バニリンの製造方法
WO2021177392A1 (ja) 2020-03-04 2021-09-10 味の素株式会社 変異型トランスグルタミナーゼ

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5795759A (en) * 1997-03-10 1998-08-18 The University Of Iowa Research Foundation Carboxylic acid reductase, and methods of using same
US20040180400A1 (en) * 2003-03-11 2004-09-16 University Of Iowa Research Foundation Carboxylic acid reductase polypeptide, nucleotide sequence encoding same and methods of use
CN103987840A (zh) * 2011-08-08 2014-08-13 国际香料香精公司 用于香草醛或香草醛β-D-葡萄糖苷的生物合成的组合物和方法
WO2015009558A1 (en) * 2013-07-16 2015-01-22 International Flavors & Fragrances Inc. Compositions and methods for the biosynthesis of vanillin or vanillin beta-d-glucoside
WO2015193371A1 (en) * 2014-06-18 2015-12-23 Rhodia Operations Improved selectivity of the production of vanilloids in a recombinant unicellular host

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5089592A (zh) 1973-12-13 1975-07-18
JPS57134500A (en) 1981-02-12 1982-08-19 Kyowa Hakko Kogyo Co Ltd Plasmid pcg1
JPS57183799A (en) 1981-04-17 1982-11-12 Kyowa Hakko Kogyo Co Ltd Novel plasmid
JPS5835197A (ja) 1981-08-26 1983-03-01 Kyowa Hakko Kogyo Co Ltd プラスミドpcg2
JPS58192900A (ja) 1982-05-04 1983-11-10 Ajinomoto Co Inc 複合プラスミド
JPH01191686A (ja) 1988-01-26 1989-08-01 Mitsubishi Petrochem Co Ltd 複合プラスミド
FR2627508B1 (fr) 1988-02-22 1990-10-05 Eurolysine Procede pour l'integration d'un gene choisi sur le chromosome d'une bacterie et bacterie obtenue par ledit procede
JP2678995B2 (ja) 1988-09-08 1997-11-19 三菱化学株式会社 トリプトフアンシンターゼの製造法
US5185262A (en) 1988-07-27 1993-02-09 Mitsubishi Petrochemical Co., Ltd. DNA fragment containing gene which encodes the function of stabilizing plasmid in host microorganism
JPH02207791A (ja) 1989-02-07 1990-08-17 Ajinomoto Co Inc 微生物の形質転換法
JP2973446B2 (ja) 1990-01-11 1999-11-08 三菱化学株式会社 新規プラスミドベクター
JPH07108228B2 (ja) 1990-10-15 1995-11-22 味の素株式会社 温度感受性プラスミド
US5128253A (en) * 1991-05-31 1992-07-07 Kraft General Foods, Inc. Bioconversion process for the production of vanillin
JPH05244941A (ja) 1992-03-03 1993-09-24 Toyo Ink Mfg Co Ltd Nadh依存性パラヒドロキシ安息香酸ヒドロキシラーゼ及びその製造方法
US5272073A (en) 1992-06-30 1993-12-21 Purdue Research Foundation Biocatalytic synthesis of catechol from glucose
JPH0775589A (ja) 1993-09-08 1995-03-20 Kawasaki Steel Corp プロトカテキュ酸の製造方法
DK0805867T3 (da) 1995-01-23 2004-04-13 Novozymes As DNA integration ved transposition
JPH0970291A (ja) 1995-06-30 1997-03-18 Ajinomoto Co Inc 人工トランスポゾンを用いた遺伝子増幅方法
JP4168463B2 (ja) 1996-12-05 2008-10-22 味の素株式会社 L−リジンの製造法
US5798759A (en) * 1996-12-31 1998-08-25 International Business Machines Corporation Method and apparatus for mobile device screen reformatting
AU756507B2 (en) 1998-03-18 2003-01-16 Ajinomoto Co., Inc. L-glutamic acid-producing bacterium and method for producing L-glutamic acid
AU6043399A (en) 1998-09-18 2000-04-10 Board Of Trustees Of Michigan State University Synthesis of vanillin from a carbon source
JP2000262288A (ja) 1999-03-16 2000-09-26 Ajinomoto Co Inc コリネ型細菌の温度感受性プラスミド
DK1649029T3 (en) 2003-06-19 2015-03-09 Evolva Sa PROCEDURE FOR PREPARING A LOW MOLECULAR WEIGHT SECONDARY PLANT METABOLITE IN A YARCELL
PL1651758T3 (pl) 2003-07-29 2009-04-30 Ajinomoto Kk Sposób wytwarzania L-lizyny lub L-treoniny przy użyciu bakterii Escherichia o atenuowanej aktywności enzymu jabłczanowego
JP4882063B2 (ja) 2005-10-12 2012-02-22 国立大学法人東京農工大学 テレフタル酸の代謝に関与する新規遺伝子
JP5088136B2 (ja) 2005-10-18 2012-12-05 味の素株式会社 コハク酸の製造方法
RU2418069C2 (ru) 2006-09-29 2011-05-10 Закрытое акционерное общество "Научно-исследовательский институт Аджиномото-Генетика" (ЗАО АГРИ) Способ конструирования рекомбинантных бактерий, принадлежащих к роду pantoea, и способ продукции l-аминокислот с использованием бактерий, принадлежащих к роду pantoea
JP2010207094A (ja) 2009-03-06 2010-09-24 Genaris Inc プロトカテク酸の製造法
CN103930557A (zh) 2011-11-11 2014-07-16 味之素株式会社 利用发酵法制造目标物质的方法
CN104769121B (zh) 2012-11-05 2021-06-01 埃沃尔瓦公司 香草醛合酶
EP3368695A2 (en) * 2015-10-27 2018-09-05 Ajinomoto Co., Inc. Method for producing aldehyde

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5795759A (en) * 1997-03-10 1998-08-18 The University Of Iowa Research Foundation Carboxylic acid reductase, and methods of using same
US20040180400A1 (en) * 2003-03-11 2004-09-16 University Of Iowa Research Foundation Carboxylic acid reductase polypeptide, nucleotide sequence encoding same and methods of use
CN103987840A (zh) * 2011-08-08 2014-08-13 国际香料香精公司 用于香草醛或香草醛β-D-葡萄糖苷的生物合成的组合物和方法
WO2015009558A1 (en) * 2013-07-16 2015-01-22 International Flavors & Fragrances Inc. Compositions and methods for the biosynthesis of vanillin or vanillin beta-d-glucoside
WO2015193371A1 (en) * 2014-06-18 2015-12-23 Rhodia Operations Improved selectivity of the production of vanilloids in a recombinant unicellular host

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
M. T. CHAUDHRY等: "Genome-wide investigation of aromatic acid transporters in Corynebacterium glutamicum", 《MICROBIOLOGY》 *
无: "oxidoreductase [Gordonia effusa]", 《NCBI PROTEIN》 *

Also Published As

Publication number Publication date
JP7380768B2 (ja) 2023-11-15
EP3532610A1 (en) 2019-09-04
US20190249207A1 (en) 2019-08-15
US10883125B2 (en) 2021-01-05
EP3532610B1 (en) 2023-09-27
JP2022140514A (ja) 2022-09-26
CN109890960B (zh) 2023-02-17
JP2019536450A (ja) 2019-12-19
WO2018079705A1 (en) 2018-05-03

Similar Documents

Publication Publication Date Title
JP6881448B2 (ja) アルデヒドの製造方法
CN109890960A (zh) 用于生产醛的方法
KR102335689B1 (ko) o-아미노벤조에이트를 생산하는 재조합 균주, 및 2-아미노벤조산을 통한 재생 가능 자원으로부터의 아닐린의 발효적 생산
CN109837315B (zh) 用于生产目标物质的方法
CN109937257B (zh) 生产目标物质的方法
CN109890972B (zh) 生产目标物质的方法
KR20140091742A (ko) 발효법에 의한 목적 물질의 제조법
US10883124B2 (en) Method for producing objective substance
CN107771214A (zh) 用于具有增加的2,4‑二羟基丁酸外排物的优化的2,4‑二羟基丁酸产生的修饰的微生物
JP2024052995A (ja) バニリンの製造方法
CN113260706A (zh) 棒状细菌转化体以及使用其的2-苯基乙醇的制造方法
US10301657B2 (en) Amino acid-producing microorganisms and methods of making and using
WO2007024011A1 (ja) L−グルタミン酸生産菌及びl−グルタミン酸の製造方法
KR20230092008A (ko) L-아미노산의 제조법
JP2021182882A (ja) サルコシンの製造法
AU2021420802A1 (en) Novel promoter and use thereof
WO2021095635A1 (ja) バニリンの製造方法
KR20220157144A (ko) 신규 프로모터 및 이의 용도
JP2023111889A (ja) 3-ヒドロキシイソ吉草酸の製造方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant