CN109890960A

CN109890960A - 用于生产醛的方法

Info

Publication number: CN109890960A
Application number: CN201780066218.9A
Authority: CN
Inventors: 户矢崎未来; 福井启太
Original assignee: Ajinomoto Co Inc
Current assignee: Ajinomoto Co Inc
Priority date: 2016-10-27
Filing date: 2017-10-27
Publication date: 2019-06-14
Anticipated expiration: 2037-10-27
Also published as: JP7380768B2; EP3532610A1; US20190249207A1; US10883125B2; EP3532610B1; JP2022140514A; CN109890960B; JP2019536450A; WO2018079705A1

Abstract

描述了用于生产目标物质，例如醛，如香草醛的方法。通过使用具有生产目标物质的能力的微生物从碳源或目标物质的前体生产目标物质，其中微生物已经经过修饰而具有特定的羧酸还原酶(CAR)基因，例如戈登氏菌CAR基因、新鞘氨醇杆菌CAR基因或胶球藻CAR基因。

Description

用于生产醛的方法

发明领域

本发明涉及通过使用微生物生产目标物质，例如醛诸如香草醛的方法。

发明背景

香草醛是造成香草气味的主要成分，通过混入食品、饮料、香水等中作为芳香物使用。香草醛主要通过从天然产物中提取或通过化学合成来生产。

生物工程技术也已经尝试用来生产香草醛，例如通过使用各种微生物与丁香油酚、异丁香油酚、阿魏酸、葡萄糖、香草酸、椰子壳等作为原料(NPL1)进行。其他生物工程方法包括作为糖苷生产香草醛的方法(PTL 1和2)、使用香草醛合酶从阿魏酸生产香草醛的方法(PTL 3)以及通过大肠杆菌发酵来生产香草酸，然后将香草酸酶促转化为香草醛的方法(PTL 4)。

香草醛可以通过中间体原儿茶酸生产。具体地，可以分别通过O-甲基转移酶(OMT)或醛氧化还原酶(羧酸还原酶；CAR)的作用将原儿茶酸转化为香草酸或原儿茶醛；并且分别通过CAR或OMT的作用将香草酸或原儿茶醛转化为香草醛。此外，异香草醛可以通过中间体原儿茶酸作为副产物生产。具体地，可以通过OMT的作用将原儿茶酸转化为异香草酸；并且可以通过CAR的作用将异香草酸转化为异香草醛。

[引用列表]

[专利文献]

PTL 1:WO2013/022881

PTL 2:WO2004/111254

PTL 3:JP2015-535181

PTL 4:US6372461

[非专利文献]

NPL 1:Kaur B.and Chakraborty D.,Biotechnological and molecularapproaches for vanillin production:a review.Appl Biochem Biotechnol.2013 Feb；169(4):1353-72.

发明概述

在纯化过程期间难以分离醛诸如香草醛与另一种醛诸如原儿茶醛和异香草醛。因此，香草醛的选择性生成可以用于例如减少纯化成本。然而，先前尚未报告适合于香草醛的选择性生成的CAR。

本发明的一方面是开发用于改善目标物质，例如醛诸如香草醛的生产的新技术，诸如可用于目标物质的选择性生成的新技术，从而提供用于有效生产目标物质的方法。

本文中描述了通过使用能够表达Gordonia effusa、马来西亚新鞘氨醇杆菌(Novosphingobium malaysiense)或Coccomyxa subellipsoidea的羧酸还原酶(CAR)基因的微生物可以显著改善微生物生产目标物质，例如醛诸如香草醛的能力。

本发明的一方面提供了一种生产目标物质的方法，所述方法包括：

通过使用具有生产所述目标物质的能力的微生物来生产所述目标物质，

其中所述目标物质是醛，

其中所述微生物已经进行了修饰而使该微生物具有醛氧化还原酶基因，且

其中所述醛氧化还原酶基因编码选自由以下组成的组的蛋白质：

(a)包含SEQ ID NO:18、79或83的氨基酸序列的蛋白质；

(b)包含SEQ ID NO:18、79或83的氨基酸序列，且该氨基酸序列包含1至10个氨基酸残基的取代、缺失、插入和/或添加的蛋白质，且其中所述蛋白质具有醛氧化还原酶活性；

(c)包含与SEQ ID NO:18、79或83的氨基酸序列具有90％或更高的同一性的氨基酸序列的蛋白质，且其中所述蛋白质具有醛氧化还原酶活性。

本发明的另一方面提供了如本文中描述的方法，其中所述生产包括：

在含有碳源的培养基中培养所述微生物以在所述培养基中生产和积累所述目标物质。

通过使用所述微生物以将所述目标物质的前体转化成所述目标物质。

本发明的另一方面提供了如本文中描述的方法，其中所述转化包括：

在含有所述前体的培养基中培养所述微生物以在所述培养基中生产和积累所述目标物质。

在反应混合物中允许所述微生物的细胞作用于所述前体以在所述反应混合物中生产和积累所述目标物质。

本发明的另一方面提供了如本文中描述的方法，其中所述细胞选自由以下组成的组：

-存在于所述微生物的培养液中的细胞，

-从所述培养液中收集的细胞，

-存在于所述培养液的加工产物中的细胞，

-存在于收集的细胞的加工产物中的细胞，和

-这些的组合。

本发明的另一方面提供了如本文中描述的方法，其中所述前体是选自由以下组成的组的物质：原儿茶酸、香草酸、苯甲酸、L-苯丙氨酸、肉桂酸和它们的组合。

本发明的另一方面提供了如本文中描述的方法，所述方法还包括从所述培养基或反应混合物中收集所述目标物质。

本发明的另一方面提供了如本文中描述的方法，其中所述微生物是属于肠杆菌科(Enterobacteriaceae)的细菌、棒状杆菌细菌(coryneform bacterium)或酵母。

本发明的另一方面提供了如本文中描述的方法，其中所述微生物是属于棒状杆菌属(Corynebacterium)的细菌。

本发明的另一方面提供了如本文中描述的方法，其中所述微生物是谷氨酸棒杆菌(Corynebacterium glutamicum)。

本发明的另一方面提供了如本文中描述的方法，其中所述微生物是属于埃希氏菌属(Escherichia)的细菌。

本发明的另一方面提供了如本文中描述的方法，其中所述微生物是大肠杆菌(Escherichia coli)。

本发明的另一方面提供了如本文中描述的方法，其中所述目标物质是芳族醛。

本发明的另一方面提供了如本文中描述的方法，其中所述目标物质是选自由以下组成的组的芳族醛：香草醛、苯甲醛、肉桂醛和它们的组合。

本发明的另一方面提供了如本文中描述的方法，其中所述微生物已经以与未修饰的菌株相比参与所述目标物质的生物合成的酶的活性得以增加的方式进行了进一步的修饰。

本发明的另一方面提供了如本文中描述的方法，其中所述参与目标物质的生物合成的酶能够催化从所述目标物质的前体向所述目标物质的转化。

本发明的另一方面提供了如本文中描述的方法，其中所述参与目标物质的生物合成的酶选自由以下组成的组：3-脱氧-D-阿拉伯糖-庚酮糖酸7-磷酸合酶、3-脱氢奎尼酸合酶、3-脱氢奎尼酸脱水酶、3-脱氢莽草酸脱水酶、O-甲基转移酶、苯丙氨酸氨裂合酶和它们的组合。

本发明的另一方面提供了如本文中描述的方法，其中所述微生物已经以与未修饰的菌株相比磷酸泛酰巯基乙胺基转移酶的活性得以增加的方式进行了进一步的修饰。

本发明的另一方面提供了如本文中描述的方法，其中所述微生物已经以与未修饰的菌株相比除所述目标物质以外的物质的摄取系统的活性得以增加的方式进行了进一步的修饰。

本发明的另一方面提供了如本文中描述的方法，其中所述摄取系统选自由以下组成的组：香草酸摄取系统、原儿茶酸摄取系统和它们的组合。

本发明的另一方面提供了如本文中描述的方法，其中所述微生物已经以与未修饰的菌株相比在所述目标物质的生产期间参与生产副产物的酶的活性得以降低的方式进行了进一步的修饰。

本发明的另一方面提供了如本文中描述的方法，其中所述在目标物质的生产期间参与生产副产物的酶选自由以下组成的组：香草酸脱甲基酶、原儿茶酸3,4-双加氧酶、醇脱氢酶、莽草酸脱氢酶和它们的组合。

发明详述

在下文，将详细解释本发明。

<1>本发明的微生物

如本文中描述的微生物是具有生产目标物质的能力的微生物，所述微生物已经经过修饰而具有(即含有)特定的羧酸还原酶(CAR)基因，诸如戈登氏菌(Gordonia)CAR基因、新鞘氨醇杆菌(Novosphingobium)CAR基因或胶球藻(Coccomyxa)CAR基因。生产目标物质的能力也可以称为“目标物质生产能力”。

<1-1>具有目标物质生产能力的微生物

术语“具有目标物质生产能力的微生物”可以指能够生产目标物质的微生物。

术语“具有目标物质生产能力的微生物”可以指在微生物用于发酵方法的情况下能够通过发酵生产目标物质的微生物。也就是说，术语“具有目标物质生产能力的微生物”可以指能够从碳源生产目标物质的微生物。具体而言，术语“具有目标物质生产能力的微生物”可以指当在培养基例如含有碳源的培养基中培养时能够在培养基中以一定程度生产并积累目标物质，从而可以从中收集目标物质的微生物。

术语“具有目标物质生产能力的微生物”还可以指在将微生物用于生物转化方法的情况下能够通过生物转化生产目标物质的微生物。也就是说，术语“具有目标物质生产能力的微生物”可以指能够从目标物质的前体生产目标物质的微生物。具体而言，术语“具有目标物质生产能力的微生物”可以指当在含有目标物质的前体的培养基中培养时，能够在培养基中以一定程度生产并积累目标物质，从而可以从中收集目标物质的微生物。具体而言，术语“具有目标物质生产能力的微生物”还可以指能够在被允许作用于反应混合物中的目标物质的前体时在反应混合物中以一定程度生产和积累目标物质，从而可以从反应混合物中收集目标物质的微生物。

具有目标物质生产能力的微生物可以是能够在培养基或反应混合物中以比用非修饰菌株获得的量更大的量积累目标物质的微生物。非修饰的菌株也可以称为“非修饰的微生物的菌株”。术语“非修饰菌株”可以指尚未修饰而具有特定CAR基因的对照菌株。非修饰的菌株的实例可以包括具有除特定CAR基因以外的CAR基因，诸如巴西诺卡菌(Nocardiabrasiliensis)的CAR基因替换特定CAR基因的菌株。具有目标物质生产能力的微生物可以是能够在培养基或反应混合物中以例如0.01g/L以上、0.05g/L以上或0.09g/L以上的量积累目标物质的微生物。

术语“目标物质”可以指醛。醛的实例可以包括芳香醛。芳香醛的实例可以包括香草醛、苯甲醛和肉桂醛。微生物可以具有仅产生一种目标物质的能力，或者可以具有产生两种或更多种目标物质的能力。此外，微生物可以具有从目标物质的一种前体或目标物质的两种或更多种前体产生目标物质的能力。

用于构建如本文中描述的微生物的亲本菌株没有特别限制。微生物的实例可以包括细菌和酵母。

细菌的实例可以包括属于肠杆菌科的细菌和棒状杆菌细菌。

属于肠杆菌科的细菌的实例可以包括属于埃希氏菌属、肠杆菌属(Enterobacter)、泛菌属(Pantoea)、克雷伯氏菌属(Klebsiella)、沙雷菌属(Serratia)、欧文氏菌属(Erwinia)、发光杆菌属(Photorhabdus)、普罗威登斯菌属(Providencia)、沙门氏菌属(Salmonella)、摩根菌属(Morganella)的细菌。具体地，可以使用根据用于NCBI(National Center for Biotechnology Information)数据库的分类学(www.ncbi.nlm.nih.gov/Taxonomy/Browser/wwwtax.cgi？id＝91347)分类为肠杆菌科的细菌。

埃希氏菌属细菌没有特别限制，并且其实例可以包括根据微生物学领域技术人员已知的分类学分类为埃希氏菌属的细菌。埃希氏菌属细菌的实例可以包括例如记载于Neidhardt et al.(Backmann B.J.,1996,Derivations and Genotypes of some mutantderivatives of Escherichia coli K-12,pp.2460-2488,Table 1,In F.D.Neidhardt(编),Escherichia coli and Salmonella Cellular and Molecular Biology/第二版,American Society for Microbiology Press,Washington,D.C.)工作中的那些细菌。埃希氏菌属细菌的实例可以包括例如大肠杆菌。大肠杆菌的具体实例可以包括大肠杆菌K-12菌株，诸如W3110菌株(ATCC 27325)和MG1655菌株(ATCC 47076)；大肠杆菌K5菌株(ATCC23506)；大肠杆菌B菌株，诸如BL21(DE3)菌株；以及其衍生菌株。

肠杆菌属细菌没有特别限制，并且其实例可以包括根据微生物学领域技术人员已知的分类学分类为肠杆菌属的细菌。肠杆菌属细菌的实例可以包括例如聚团肠杆菌(Enterobacter agglomerans)和产气肠杆菌(Enterobacter aerogenes)。聚团肠杆菌的具体实例可以包括例如聚团肠杆菌ATCC 12287菌株。产气肠杆菌的具体实例可以包括例如产气肠杆菌ATCC 13048菌株、NBRC 12010菌株(Biotechnol.Bioeng.,2007,Mar.27；98(2):340-348)和AJ110637菌株(FERM BP-10955)。肠杆菌属细菌的实例还可以包括例如记载于欧洲专利申请公开(EP-A)No.0952221中的菌株。另外，聚团肠杆菌还可以包括分类为成团泛菌(Pantoea agglomerans)的一些菌株。

泛菌属细菌没有特别限制，并且其实例可以包括根据微生物学领域技术人员已知的分类学分类为泛菌属的细菌。泛菌属细菌的实例可以包括例如菠萝泛菌(Pantoeaananatis)、斯氏泛菌(Pantoea stewartii)、成团泛菌和柠檬泛菌(Pantoea citrea)。菠萝泛菌的具体实例可以包括例如菠萝泛菌LMG20103菌株、AJ13355菌株(FERM BP-6614)、AJ13356菌株(FERM BP-6615)、AJ13601菌株(FERM BP-7207)、SC17菌株(FERM BP-11091)、SC17(0)菌株(VKPM B-9246)和SC17sucA菌株(FERM BP-8646)。一些肠杆菌属细菌和欧文氏菌属细菌重新分类为泛菌属(Int.J.Syst.Bacteriol.,39,337-345(1989)；Int.J.Syst.Bacteriol.,43,162-173(1993))。例如，基于16S rRNA等的核苷酸序列分析，一些聚团肠杆菌菌株最近重新分类为成团泛菌、菠萝泛菌、斯氏泛菌等(Int.J.Syst.Bacteriol.,39,337-345(1989))。泛菌属细菌可以包括如上文描述的重新分类为泛菌属的那些细菌。

欧文氏菌属细菌的实例可以包括解淀粉欧文氏菌(Erwinia amylovora)和胡萝卜软腐欧文氏菌(Erwinia carotovora)。克雷伯氏菌属细菌的实例可以包括植物克雷伯氏菌(Klebsiella planticola)。

棒状杆菌细菌的实例可以包括属于棒杆菌属、短杆菌属(Brevibacterium)、细杆菌属(Microbacterium)等的细菌。

此类棒状杆菌细菌的具体实例可以包括以下物种。

嗜乙酰乙酸棒状杆菌(Corynebacterium acetoacidophilum)

醋谷氨酸棒杆菌(Corynebacterium acetoglutamicum)

解烷棒状杆菌(Corynebacterium alkanolyticum)

帚石南棒状杆菌(Corynebacterium callunae)

钝齿棒状杆菌(Corynebacterium crenatum)

谷氨酸棒杆菌(Corynebacterium glutamicum)

百合棒杆菌(Corynebacterium lilium)

栖糖蜜棒杆菌(Corynebacterium melassecola)

热产氨棒状杆菌(Corynebacterium thermoaminogenes)(有效棒杆菌(Corynebacterium efficiens))

力士棒杆菌(Corynebacterium herculis)

二歧短杆菌(Brevibacterium divaricatum)(谷氨酸棒杆菌)

黄色短杆菌(Brevibacterium flavum)(谷氨酸棒杆菌)

未成熟短杆菌(Brevibacterium immariophilum)

乳糖发酵短杆菌(Brevibacterium lactofermentum)(谷氨酸棒杆菌)

玫瑰色短杆菌(Brevibacterium roseum)

解糖短杆菌(Brevibacterium saccharolyticum)

硫殖短杆菌(Brevibacterium thiogenitalis)

产氨短杆菌(Corynebacterium ammoniagenes)(Corynebacterium stationis)

白色短杆菌(Brevibacterium album)

蜡状短杆菌(Brevibacterium cerinum)

嗜氨细杆菌(Microbacterium ammoniaphilum)

棒状杆菌细菌的具体实例可以包括以下菌株。

嗜乙酰乙酸棒杆菌(Corynebacterium acetoacidophilum)ATCC 13870

醋谷氨酸棒杆菌(Corynebacterium acetoglutamicum)ATCC 15806

解烷棒杆菌(Corynebacterium alkanolyticum)ATCC 21511

帚石南棒杆菌(Corynebacterium callunae)ATCC 15991

钝齿棒杆菌(Corynebacterium crenatum)AS1.542

谷氨酸棒杆菌ATCC 13020,ATCC 13032,ATCC 13060,ATCC 13869,FERM BP-734

百合棒杆菌(Corynebacterium lilium)ATCC 15990

栖糖蜜棒杆菌(Corynebacterium melassecola)ATCC 17965

有效棒杆菌(Corynebacterium efficiens)(热产氨棒状杆菌(Corynebacteriumthermoaminogenes))AJ12340(FERM BP-1539)

力士棒杆菌(Corynebacterium herculis)ATCC 13868

二歧短杆菌(Brevibacterium divaricatum)(谷氨酸棒杆菌)ATCC 14020

黄色短杆菌(Brevibacterium flavum)(谷氨酸棒杆菌)ATCC 13826,ATCC 14067,AJ12418(FERM BP-2205)

未成熟短杆菌(Brevibacterium immariophilum)ATCC 14068

乳糖发酵短杆菌(Brevibacterium lactofermentum)(谷氨酸棒杆菌)ATCC 13869

玫瑰色短杆菌(Brevibacterium roseum)ATCC 13825

解糖短杆菌(Brevibacterium saccharolyticum)ATCC 14066

硫殖短杆菌(Brevibacterium thiogenitalis)ATCC 19240

产氨短杆菌(Corynebacterium ammoniagenes)(停滞棒杆菌(Corynebacteriumstationis))ATCC 6871,ATCC 6872

白色短杆菌(Brevibacterium album)ATCC 15111

蜡状短杆菌(Brevibacterium cerinum)ATCC 15112

嗜氨细杆菌(Microbacterium ammoniaphilum)ATCC 15354

棒状杆菌细菌可以包括先前被分类为短杆菌属但目前并入棒状杆菌属中的细菌(Int.J.Syst.Bacteriol.,41,255(1991))。此外，停滞棒杆菌可以包括先前已被分类为产氨棒状杆菌，但目前基于16S rRNA的核苷酸序列分析等重新分类为停滞棒杆菌的细菌(Int.J.Syst.Evol.Microbiol.,60,874-879(2010))。

酵母可以是芽殖酵母或可以是裂殖酵母。酵母可以是单倍体酵母或可以是二倍体以上的多倍体酵母。酵母的实例可包括属于酵母属(Saccharomyces)的酵母，例如酿酒酵母(Saccharomyces cerevisiae)，属于毕赤酵母属(Pichia)(也称为Wickerhamomyces属)的酵母，如西弗毕赤酵母(Pichia ciferrii)，赛道威毕赤酵母(Pichia sydowiorum)和巴斯德毕赤酵母(Pichia pastoris)，属于假丝酵母属(Candida)的酵母，诸如实用假性酵母(Candida utilis)，属于汉逊酵母属(Hansenula)的酵母，如多形汉逊酵母(Hansenulapolymorpha)和属于裂殖酵母(Schizosaccharomyces)的酵母，如粟酒裂殖酵母(Schizosaccharomyces pombe)。

这些菌株可以从例如美国典型培养物保藏中心(地址：P.O.Box 1549,Manassas,VA 20108,United States of America)获得。也就是说，注册号被赋予各自的菌株，并且菌株可以通过使用这些注册号订购(参见www.atcc.org/)。美国典型培养物保藏中心的目录中列出了菌株的注册号。这些菌株也可以从例如菌株保藏的保藏所获得。

微生物可以固有具有目标物质生产能力，或者可以经修饰而使它具有目标物质生产能力。具有目标物质生产能力的微生物可以通过赋予如上所述的此类微生物以目标物质生产能力或增强如上所述的此类微生物的目标物质生产能力来获得。

以下，说明赋予或提高目标物质生成能力的方法的具体实例。为了赋予或提高目标物质生产能力，下面举例说明的此类修饰可以独立使用，或者可以适当组合使用。

目标物质可以通过参与目标物质生物合成的酶的作用产生。此类酶也可以称为“目标物质生物合成酶”。因此，微生物可以具有目标物质生物合成酶。换言之，微生物可以具有编码目标物质生物合成酶的基因。此类基因也可以称为“目标物质生物合成基因”。微生物可以固有具有目标物质生物合成基因，或者可以引入了目标物质生物合成基因。本文描述了用于引入基因的方法。

另外，通过提高目标物质生物合成酶的活性，可以改善微生物的目标物质生产能力。也就是说，赋予或提高目标物质生成能力的方法的实例可以包括提高目标物质生物合成酶的活性的方法。也就是说，微生物可以经修饰而使得增加了目标物质生物合成酶的活性。一种目标物质生物合成酶的活性可以得以增加，或者两种或更多种目标物质生物合成酶的活性可以得以增加。本文描述了用于增加蛋白质(酶等)的活性的方法。通过例如增加编码蛋白质的基因的表达，可以提高蛋白质(酶等)的活性。

目标物质可以从例如碳源和/或目标物质的前体产生。因此，目标物质生物合成酶的实例可以包括例如催化从碳源和/或前体向目标物质转化的酶。例如，3-脱氢莽草酸可以通过部分莽草酸途径产生，其可以包括由3-脱氧-D-阿拉伯糖-庚酮糖酸7-磷酸合酶(DAHP合酶)，3-脱氢奎尼酸合酶和3-脱氢奎尼酸脱水酶催化的步骤；可以通过3-脱氢莽草酸脱水酶(DHSD)的作用将3-脱氢莽草酸转化为原儿茶酸；可以通过O-甲基转移酶(OMT)或醛氧化还原酶(羧酸还原酶，CAR)的作用将原儿茶酸分别转化为香草酸或原儿茶醛；以及可以通过CAR或OMT的作用将香草酸或原儿茶醛转化为香草醛。此外，苯甲醛和肉桂醛可以分别由例如苯甲酸和肉桂酸通过CAR的作用产生。也就是说，目标物质生物合成酶的具体实例可以包括例如DAHP合酶，3-脱氢奎尼酸合酶，3-脱氢奎尼酸脱水酶，DHSD，OMT和CAR。具体地，使用特定的CAR可以通过香草酸作为中间体来有效生产香草醛。因此，香草醛生产及其相关事项以部分或完全通过香草酸作为中间体产生香草醛为前提描述。

术语“3-脱氧-D-阿拉伯糖-庚酮糖酸7-磷酸合酶(DAHP合酶)”可以指具有催化将D-赤藓糖-4-磷酸和磷酸烯醇丙酮酸转化成3-脱氧-D-阿拉伯糖-庚糖酮酸7-磷酸(DAHP)和磷酸的反应的活性的蛋白质(EC 2.5.1.54)。编码DAHP合酶的基因也可以称为“DAHP合酶基因”。DAHP合酶的实例可以包括分别由aroF、aroG和aroH基因编码的AroF、AroG和AroH蛋白。在它们中，AroG可以作为主要的DAHP合酶发挥功能。DAHP合酶诸如AroF、AroG和AroH蛋白的实例包括各种生物体如肠杆菌科(Enterobacteriaceae)细菌和棒状杆菌细菌的那些。DAHP合酶的具体实例可以包括大肠杆菌的AroF、AroG和AroH蛋白。大肠杆菌K-12MG1655菌株的aroG基因的核苷酸序列如SEQ ID NO:1所示，并且由该基因编码的AroG蛋白的氨基酸序列如SEQ ID NO:2所示。

DAHP合酶活性可以通过例如将酶与底物(即D-赤藓糖-4-磷酸和磷酸烯醇丙酮酸)温育并测量DAHP的酶和底物依赖性生成来测量。

术语“3-脱氢奎尼酸合酶”可以指具有催化使DAHP脱磷酸化以产生3-脱氢奎宁酸的反应的活性的蛋白质(EC 4.2.3.4)。编码3-脱氢奎尼酸合酶的基因也可以称为“3-脱氢奎尼酸合酶基因”。3-脱氢奎尼酸合酶的实例可以包括由aroB基因编码的AroB蛋白。3-脱氢奎尼酸合酶如AroB蛋白的实例可以包括各种生物体如肠杆菌科细菌和棒状杆菌细菌的那些。3-脱氢奎尼酸合酶的具体实例可以包括大肠杆菌的AroB蛋白。大肠杆菌K-12MG1655菌株的aroB基因的核苷酸序列如SEQ ID NO:3所示，并且由该基因编码的AroB蛋白的氨基酸序列如SEQ ID NO:4所示。

3-脱氢奎尼酸合酶活性可以通过例如将酶与底物(即DAHP)温育并测量3-脱氢奎宁酸的酶和底物依赖性产生来测量。

术语“3-脱氢奎尼酸脱水酶”可以指具有催化使3-脱氢奎宁酸脱水以生成3-脱氢莽草酸的反应的活性的蛋白质(EC 4.2.1.10)。编码3-脱氢奎尼酸脱水酶的基因也可以称为“3-脱氢奎尼酸脱水酶基因”。3-脱氢奎尼酸脱水酶的实例可以包括由aroD基因编码的AroD蛋白。3-脱氢奎尼酸脱水酶诸如AroD蛋白的实例可以包括各种生物体如肠杆菌科细菌和棒杆菌的那些。3-脱氢奎尼酸脱水酶的具体实例可以包括大肠杆菌的AroD蛋白。大肠杆菌K-12MG1655菌株的aroD基因的核苷酸序列如SEQ ID NO:5所示，并且由该基因编码的AroD蛋白的氨基酸序列如SEQ ID NO:6所示。

3-脱氢奎尼酸脱水酶活性可以通过例如将酶与底物(即3-脱氢奎宁酸)温育并测量3-脱氢莽草酸的酶和底物依赖性产生来测量。

术语“3-脱氢草酸脱水酶(DHSD)”可以指具有催化使3-脱氢莽草酸脱水以生成原儿茶酸的反应的活性的蛋白质(EC 4.2.1.118)。编码DHSD的基因也可以称为“DHSD基因”。DHSD的实例可以包括由asbF基因编码的AsbF蛋白。DHSD例如AsbF蛋白的实例包括各种生物体如苏云金芽孢杆菌(Bacillus thuringiensis)，粗糙脉孢菌(Neurospora crassa)和Podospora pauciseta的那些。苏云金芽孢杆菌BMB171菌株的asbF基因的核苷酸序列如SEQID NO:7所示，并且由该基因编码的AsbF蛋白的氨基酸序列如SEQ ID NO:8所示。

DHSD活性可以通过例如将酶与底物(即3-脱氢莽草酸)温育并测量原儿茶酸的酶和底物依赖性产生来测量。

编码莽草酸途径的酶如DAHP合酶，3-脱氢奎尼酸合酶和3-脱氢奎尼酸脱水酶的基因的表达受到酪氨酸阻遏物TyrR阻遏，所述TyrR由tyrR基因编码。因此，莽草酸途径酶的活性也可以通过降低酪氨酸阻遏物TyrR的活性而增加。大肠杆菌K-12MG1655菌株的tyrR基因的核苷酸序列如SEQ ID NO:9所示，并且由该基因编码的TyrR蛋白的氨基酸序列如SEQ IDNO:10所示。

术语“O-甲基转移酶(OMT)”可以指具有催化在存在甲基基团供体的情况下使原儿茶酸甲基化以产生香草酸的反应的活性的蛋白质(即在原儿茶酸的间位上的羟基基团的甲基化，EC 2.1.1.68等)。此活性也可以称为“OMT活性”。编码OMT的基因也可以称为“OMT基因”。OMT也可以催化在存在甲基基团供体的情况下使原儿茶醛甲基化以产生香草醛的反应(即，原儿茶醛的间位上的羟基基团的甲基化)。OMT通常可以使用原儿茶酸和原儿茶醛两者作为底物，但是不必然限于此。甲基基团供体的实例可以包括S-腺苷甲硫氨酸(SAM)。OMT的实例可以包括各种生物体的OMT，诸如智人(Homo sapiens)(Hs)的OMT(GenBank登录号NP_000745和NP_009294)、拟南芥(Arabidopsis thaliana)的OMT(GenBank登录号NP_200227和NP_009294)、Fragaria x ananassa的OMT(GenBank登录号AAF28353)以及WO2013/022881A1中示例的哺乳动物、植物和微生物的其他各种OMT。对于智人的OMT基因，已知四种转录物变体和两种OMT同种型。这四种转录物变体(转录物变体1-4，GenBank登录号NM_000754.3，NM_001135161.1，NM_001135162.1和NM_007310.2)的核苷酸序列显示为SEQ ID NO:11至14，较长OMT同种型(MB-COMT，GenBank登录号NP_000745.1)的氨基酸序列如SEQ ID NO:15所示，并且较短OMT同种型(S-COMT，GenBank登录号NP_009294.1)的氨基酸序列如SEQ ID NO:16所示。SEQ ID NO:16对应于截短了N端的50个氨基酸残基的SEQ ID NO:15。

OMT还可以催化原儿茶酸和/或原儿茶醛的甲基化反应以产生异香草酸和/或异香草醛(即对位羟基的甲基化)作为副反应。OMT可以选择性催化间位羟基的甲基化的。表述“选择性催化间位羟基的甲基化”可以意味着OMT选择性地从原儿茶酸生成香草酸的OMT和/或选择性地从原儿茶醛生成香草醛的OMT。表述“从原儿茶酸选择性产生香草酸”可以表示当允许OMT作用于原儿茶酸时按摩尔比计，OMT产生香草酸的量为异香草酸的量的例如3倍或更多，5倍或更多，10倍或更多，15倍或更多，20倍或更多，25倍或更多，或30倍或更多。此外，表述“从原儿茶醛选择性产生香草酸”可以表示当允许OMT作用于原儿茶醛时按摩尔比计，OMT产生香草醛的量为异香草酸的量的例如3倍或更多，5倍或更多，10倍或更多，15倍或更多，20倍或更多，25倍或更多，或者30倍或更多。选择性催化间位羟基甲基化的OMT的实例可以包括本文所述的具有“特定突变”的OMT。

具有“特定突变”的OMT也可以称为“突变体OMT”。编码突变体OMT的基因也可以称为“突变体OMT基因”。

不具有“特定突变”的OMT也可以称为“野生型OMT”。编码野生型OMT的基因也可以称为“野生型OMT基因”。术语“野生型”是为了方便将“野生型”OMT与“突变体”OMT区分开而使用，并且“野生型”OMT不限于作为天然物质获得的那些，并且可以包括任何没有“特定突变”的OMT。野生型OMT的实例可以包括例如上面例示的OMT。另外，上述例示的所有OMT保守变体可以认为是野生型OMT，条件是此类保守变体不具有“特定突变”。

“特定突变”的实例可以包括WO2013/022881A1中描述的突变体OMT中包含的突变。也就是说，“特定突变”的实例可以包括野生型OMT的198位亮氨酸残基(L198)被比亮氨酸残基的疏水性指数(hydrophobic index)显示更低疏水性指数(亲水性指数(hydropathyindex))的氨基酸残基取代的突变，以及野生型OMT的199位谷氨酸残基(E199)被在pH7.4具有中性或正侧链电荷的氨基酸残基取代的突变。突变体OMT可以具有这些突变中的一个或两者。

“比亮氨酸残基的疏水性指数显示更低疏水性指数(亲水指数)的氨基酸残基”的实例可以包括Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Lys,Met,Phe,Pro,Ser,Thr,Trp和Tyr。作为“比亮氨酸残基的疏水性指数显示更低疏水性指数(亲水指数)的氨基酸残基”，特别优选诸如Ala,Arg,Asn,Asp,Glu,Gln,Gly,His,Lys,Met,Pro,Ser,Thr,Trp和Tyr的氨基酸残基，并且Tyr是更优选的。

“在pH7.4具有中性或正侧链电荷的氨基酸残基”可以包括Ala,Arg,Asn,Cys,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val。作为“在pH7.4具有中性或正侧链电荷的氨基酸残基”，Ala或Gln是特别优选的。

任意的野生型OMT中的“L198”和“E199”可以指“与以SEQ ID NO:16所示的氨基酸序列的第198位的亮氨酸残基对应的氨基酸残基”和“与以SEQ ID NO:16所示的氨基酸序列的第199位谷氨酸残基对应的氨基酸残基”。这些氨基酸残基的位置表示相对位置，并且其绝对位置可以由于氨基酸残基的缺失，插入，添加等而改变。例如，若在SEQ ID NO:16所示的氨基酸序列中的位置X的N端侧的位置缺失或插入一个氨基酸残基，则原来在位置X处的氨基酸残基重新定位在位置X-1或X+1，但仍被认为是“与SEQ ID NO:16所示的氨基酸序列的X位的氨基酸残基对应的氨基酸残基”。此外，虽然“L198”和“E199”通常分别是亮氨酸残基和谷氨酸残基，但它们可以不是亮氨酸残基和谷氨酸残基。也就是说，当“L198”和“E199”分别不是亮氨酸残基和谷氨酸残基时，“特定突变”可以包括那些氨基酸残基各自被任何上述氨基酸残基替换的突变。

在任意OMT的氨基酸序列中，哪个氨基酸残基为对应于“L198”或“E199”的氨基酸残基可以通过将任意OMT的氨基酸序列和SEQ ID NO:16的氨基酸序列比对确定。比对可以通过例如使用已知的基因分析软件来进行。此类软件的具体实例可以包括由HitachiSolutions生产的DNASIS，Genetyx生产的GENETYX等(Elizabeth C.Tyler et al.,Computers and Biomedical Research,24(1)72-96,1991；Barton GJ et al.,Journal ofMolecular Biology,198(2),327-37,1987)。

例如，可以通过修饰野生型OMT基因使得由其编码的OMT具有“特定突变”来获得突变体OMT基因。待修饰的野生型OMT基因可以通过例如从具有野生型OMT基因的生物体的克隆或化学合成来获得。此外，也可以不使用野生型OMT基因而获得突变体OMT基因。例如，可以通过化学合成直接获得突变体OMT基因。获得的突变OMT基因可以原样使用，或者在使用前进一步修饰。

基因可以通过使用已知的方法进行修饰。例如，可以通过位点特异性诱变方法将目标突变引入DNA的靶位点中。位点特异性诱变方法的实例可以包括使用PCR的方法(Higuchi,R.,61,于PCR Technology,Erlich,H.A.编,Stockton Press(1989)；Carter P.,Meth.In Enzymol.,154,382(1987))；以及使用噬菌体的方法(Kramer,W.and Frits,H.J.,Meth.in Enzymol.,154,350(1987)；Kunkel,T.A.et al.,Meth.in Enzymol.,154,367(1987))。

可以通过例如在SAM存在下将酶与底物(即原儿茶酸或原儿茶醛)温育并测量相应产物(即香草酸或香草醛)的酶和底物依赖性产生来测量间位羟基基团的甲基化活性，诸如OMT活性(WO2013/022881A1)。此外，通过在相同条件下测量相应副产物(即异香草酸或异香草醛)的产生，并将副产物的产生与产物的产生进行比较，可以确定OMT是否选择性地生成产物。

下文在“引入特定羧酸还原酶基因”中描述了羧酸还原酶(CAR)。

可以通过磷酸泛酰巯基乙胺化(phosphopantetheinylation)将CAR变为活性酶(J.Biol.Chem.,2007,Vol.282,No.1,pp.478-485)。因此，CAR活性也可以通过增加催化蛋白质的磷酸泛酰巯基乙胺化的酶(也称为“磷酸泛酰巯基乙胺基化酶”)的活性来增加。也就是说，赋予或提高目标物质生产能力的方法的实例可以包括增加磷酸泛酰巯基乙胺基化酶的活性的方法。也就是说，微生物可以以使磷酸泛酰巯基乙胺基化酶的活性得以增加的方式进行了修饰。磷酸泛酰巯基乙胺基化酶的实例可以包括磷酸泛酰巯基乙胺基转移酶(PPT)。

术语“磷酸泛酰巯基乙胺基转移酶(PPT)”可以指具有在磷酸泛酰巯基乙胺基供体存在下催化使CAR磷酸泛酰巯基乙胺化的反应的活性的蛋白质。此活性也可以称为“PPT活性”。编码PPT的基因也可以称为“PPT基因”。磷酸泛酰巯基乙胺基供体的实例可以包括辅酶A(CoA)。PPT的实例可以包括EntD蛋白，其由entD基因编码。PPT例如EntD蛋白质的实例可以包括各种生物体的那些。PPT的具体实例可以包括大肠杆菌的EntD蛋白。大肠杆菌K-12MG1655菌株的entD基因的核苷酸序列如SEQ ID NO:21所示，并且由该基因编码的EntD蛋白的氨基酸序列如SEQ ID NO:22所示。PPT的具体实例还可以包括巴西诺卡菌的PPT，皮疽诺卡菌(Nocardia farcinica)IFM10152的PPT(J.Biol.Chem.,2007,Vol.282,No.1,pp.478-485)和谷氨酸棒杆菌的PPT(App.Env.Microbiol.2009,Vol.75,No.9,p.2765-2774)。谷氨酸棒杆菌ATCC 13032菌株的PPT基因的核苷酸序列如SEQ ID NO:23所示，并且由该基因编码的PPT的氨基酸序列如SEQ ID NO:24所示。

PPT活性可以基于例如在CoA存在下与CAR温育时观察到的CAR活性的增强来测量(J.Biol.Chem.,2007,Vol.282,No.1,pp.478-485)。

此外，如上所述，苯甲醛和肉桂醛可以分别从例如苯甲酸和肉桂酸产生。也就是说，目标物质生物合成酶的实例还可以包括例如苯甲酸生物合成酶和肉桂酸生物合成酶。具体而言，肉桂酸可以通过苯丙氨酸脱氨酶(phenylalanine ammonia lyase)(PAL；EC4.3.1.24)的作用从例如L-苯丙氨酸生成。也就是说，肉桂酸生物合成酶的实例可以包括例如L-苯丙氨酸生物合成酶和PAL。L-苯丙氨酸生物合成酶的实例可以包括芳香氨基酸的常见生物合成酶，如3-脱氧-D-阿拉伯糖庚糖酮酸-7-磷酸合酶(aroF，aroG，aroH)，3-脱氢奎尼酸合酶(aroB)，3-脱氢奎尼酸脱水酶(aroD)，莽草酸脱氢酶(aroE)，莽草酸激酶(aroK，aroL)，5-烯醇式丙酮基莽草酸-3-磷酸合酶(aroA)和分支酸合酶(aroC)；以及分支酸变位酶(pheA)，预苯酸脱水酶(pheA)和酪氨酸氨基转移酶(tyrB)。分支酸变位酶和预苯酸脱水酶可由pheA基因编码为双功能酶。

用于赋予或提高目标物质生产能力的方法的实例还可以包括提高目标物质以外物质，例如在生产目标物质期间作为中间产物生成的物质和用作目标物质前体的物质的摄取系统的活性的方法。也就是说，本发明的细菌可以以使此类摄取系统的活性得以增加的方式进行了修饰。术语“物质的摄取系统”可以指具有将来自细胞外部的物质掺入细胞的功能的蛋白质。此活性也可以称为“物质的摄取活性”。编码此类摄取系统的基因也可以称为“摄取系统基因”。此类摄取系统的实例可以包括香草酸摄取系统和原儿茶酸摄取系统。香草酸摄取系统的实例可以包括由vanK基因编码的VanK蛋白(M.T.Chaudhry,et al.,Microbiology,2007,153:857-865)。谷氨酸棒杆菌ATCC13869菌株的vanK基因(NCgl2302)的核苷酸序列如SEQ ID NO:25所示，并且由该基因编码的VanK蛋白的氨基酸序列如SEQ IDNO:26所示。原儿茶酸摄取系统基因可以包括由pcaK基因编码的PcaK蛋白(M.T.Chaudhry,et al.,Microbiology,2007,153:857-865)。谷氨酸棒杆菌ATCC13869菌株的pcaK基因(NCgl1031)的核苷酸序列如SEQ ID NO:27所示，并且由该基因编码的PcaK蛋白的氨基酸序列如SEQ ID NO:28所示。

可以根据例如已知方法(M.T.Chaudhry,et al.,Microbiology,2007.153:857-865)测量物质的摄取活性。

用于赋予或提高目标物质生产能力的方法的实例还可以包括降低参与目标物质以外的物质的副生成的酶的活性的方法。除了目标物质以外的此类物质也可以称为“副产物”。此类酶也可以称为“副产物生成酶”。具体地，副产物生成酶可以指在目标物质的生产期间参与副产物的生成的酶。副产物生成酶的实例可以包括例如参与目标物质利用的酶和催化远离目标物质的生物合成途径分支的反应以产生除目标物质之外的物质的酶。本文描述了降低蛋白质(酶等)的活性的方法。通过例如破坏编码蛋白质的基因可以降低蛋白质(酶等)的活性。例如，据报道，在棒状杆菌细菌中，香草醛按香草醛->香草酸->原儿茶酸的顺序代谢并利用(Current Microbiology,2005,Vol.51,pp.59-65)。也就是说，副产物生成酶的具体实例可以包括催化香草醛转化为原儿茶酸的酶和催化原儿茶酸进一步代谢的酶。此类酶的实例可以包括香草酸脱甲基酶，原儿茶酸3,4-双加氧酶，以及将原儿茶酸3,4-双加氧酶的反应产物进一步分解为琥珀酰-CoA和乙酰-CoA的各种酶(Appl.Microbiol.Biotechnol.,2012,Vol.95,p77-89)。此外，可以通过醇脱氢酶的作用将醛诸如香草醛转化成相应的醇，诸如香草醇(Kunjapur AM.et al.,J.Am.Chem.Soc.,2014,Vol.136,p11644-11654.；Hansen EH.et al.,App.Env.Microbiol.,2009,Vol.75,p2765-2774.)。也就是说，副产物生成酶的具体实例也可以包括醇脱氢酶(ADH)。此外，作为香草酸和香草醛生物合成途径中间体的3-脱氢莽草酸也可以通过莽草酸脱氢酶的作用转化为莽草酸。也就是说，用于香草醛生产的副产物生成酶的具体实例还可以包括莽草酸脱氢酶。

术语“香草酸脱甲基酶”可以指具有催化香草酸脱甲基化生成原儿茶酸的反应的活性的蛋白质。此活性也可以称为“香草酸脱甲基酶活性”。编码香草酸脱甲基酶的基因也可以称为“香草酸脱甲基酶基因”。香草酸脱甲基酶的实例可以包括由vanAB基因编码的VanAB蛋白(Current Microbiology,2005,Vol.51,pp.59-65)。vanA基因和vanB基因分别编码香草酸脱甲基酶的亚基A和亚基B。为了降低香草酸脱甲基酶活性，vanAB基因两者可以被破坏等，或者两者中仅一种可以被破坏等。谷氨酸棒杆菌ATCC13869菌株的vanAB基因的核苷酸序列分别如SEQ ID NO:29和31所示，并且由这些基因编码的VanAB蛋白的氨基酸序列分别如SEQ ID NO:30和6032所示。vanAB基因通常与vanK基因一起构成vanABK操纵子。因此，为了降低香草酸脱甲基酶活性，vanABK操纵子可以被完全破坏等(例如缺失)。在此类情况下，可以将vanK基因再引入宿主。例如，当使用存在于细胞外的香草酸，并且vanABK操纵子完全被破坏等(例如缺失)时，优选再引入vanK基因。

香草酸脱甲基酶活性可以通过例如将酶与底物(即香草酸)温育并测量原儿茶酸的酶和底物依赖性产生来测量(J Bacteriol,2001,Vol.183,p3276-3281)。

术语“原儿茶酸3,4-双加氧酶”可以指具有催化氧化原儿茶酸反应生成β-羧基-顺,顺-粘康酸的反应活性的蛋白质。此活性也可以称为“原儿茶酸3,4-双加氧酶活性”。编码原儿茶酸3,4-双加氧酶的基因也可以称为“原儿茶酸3,4-双加氧酶基因”。原儿茶酸3,4-双加氧酶的实例可以包括由pcaGH基因编码的PcaGH蛋白(Appl.Microbiol.Biotechnol.,2012,Vol.95,p77-89)。pcaG基因和pcaH基因分别编码原儿茶酸3,4-双加氧酶的α亚基和β亚基。为了降低原儿茶酸3,4-双加氧酶活性，pcaGH基因两者可以被破坏等，或者两者中仅一种可以被破坏等。谷氨酸棒杆菌ATCC 13032菌株的pcaGH基因的核苷酸序列分别如SEQID NO:33和35所示，并且由这些基因编码的PcaGH蛋白的氨基酸序列分别如SEQ ID NO:34和36所示。

原儿茶酸3,4-双加氧酶活性可以通过例如将酶与底物(即原儿茶酸)温育并测量酶和底物依赖性氧消耗量来测量(Meth.Enz.,1970,Vol.17A,p526-529)。

术语“醇脱氢酶(ADH)”可以指具有在电子供体存在下催化醛还原以产生醇的反应的活性的蛋白质(EC 1.1.1.1，EC 1.1.1.2，EC 1.1.1.71等)。此活性也可以称为“ADH活性”。编码ADH的基因也可以称为“ADH基因”。用作ADH底物的醛的实例可以包括在如本文所述的方法中作为目标物质示例的醛，例如芳香醛如香草醛，苯甲醛和肉桂醛。也就是说，在“ADH活性”的定义中提到的醛和醇的组合的实例可以包括芳香醛和相应的芳香醇的组合，例如香草醛和香草醇的组合，苯甲醛和苯甲醇的组合，以及肉桂醛和肉桂醇的组合。使用芳香醛，香草醛，苯甲醛或肉桂醛的ADH也可以分别称为“芳香醇脱氢酶”，“香草醇脱氢酶”，“苯甲醇脱氢酶”或“肉桂醇脱氢酶”。此外，将芳香醛，香草醛，苯甲醛或肉桂醛用作底物的ADH活性也可以称为“芳香醇脱氢酶活性”，“香草醇脱氢酶活性”，“苯甲醇脱氢酶活性”或“肉桂醇脱氢酶活性”。ADH可以使用一种醇，或者可以使用两种或更多种醇。电子供体的实例可以包括NADH和NADPH。

ADH的实例可以包括分别由yqhD基因，NCgl0324基因，NCgl0313基因，NCgl2709基因，NCgl0219基因和NCgl2382基因编码的YqhD蛋白，NCgl0324蛋白质，NCgl0313蛋白质，NCgl2709蛋白质，NCgl0219蛋白质和NCgl2382蛋白质。yqhD基因可以在例如属于肠杆菌科的细菌，诸如大肠杆菌中找到。NCgl0324基因，NCgl0313基因，NCgl2709基因，NCgl0219基因和NCgl2382基因可以例如在棒状杆菌细菌例如谷氨酸棒杆菌中找到。大肠杆菌K-12MG1655菌株的yqhD基因的核苷酸序列如SEQ ID NO:37所示，并且由此基因编码的YqhD蛋白的氨基酸序列以SEQ ID NO:38所示。谷氨酸棒杆菌ATCC13869菌株的NCgl0324基因，NCgl0313基因和NCgl2709基因的核苷酸序列分别如SEQ ID NO:39,41和43所示，并且由这些基因编码的蛋白质的氨基酸序列分别如SEQ ID NO:40,42和44所示。谷氨酸棒杆菌ATCC 13032菌株的NCgl0219基因和NCgl2382基因的核苷酸序列分别如SEQ ID NO:45和47所示，并且由这些基因编码的蛋白质的氨基酸序列如SEQ ID NO:46和48所示。

可以降低一种ADH的活性，或者可以降低两种或更多种ADH的活性。例如，可以降低诸如NCgl0324蛋白质，NCgl2709蛋白质和NCgl0313蛋白质的一种或多种ADH，例如，所有ADH的活性。还可以至少降低NCgl0324蛋白和NCgl2709蛋白中任一个或两者的活性。也就是说，例如，可以降低至少NCgl1024蛋白质的活性，并且可以进一步降低NCgl2709蛋白质的活性。或者，可以降低至少NCgl2709蛋白的活性，并且可以进一步降低NCgl0324蛋白的活性。ADH与目标物质的组合没有特别限制，只要棒状杆菌细菌中ADH活性的降低提高了目标物质的产量即可。例如，可以降低ADH的活性，其至少使用要生产的醛作为目标物质。也就是说，可以降低诸如香草醇脱氢酶，苯甲醇脱氢酶和肉桂醇脱氢酶等芳香醇脱氢酶的活性，分别用于生产芳香醛，如香草醛，苯甲醛和肉桂醛。具体而言，例如，当生产芳草醛时，可以降低YqhD蛋白的活性。此外，具体而言，例如，当生产香草醛时，可以降低NCgl0324蛋白和NCgl0313蛋白中任一种或两者的活性，或可以降低至少NCgl0324蛋白的活性。此外，具体而言，当产生苯甲醛时，可以降低NCgl0324蛋白和NCgl2709蛋白中的任一种或两者的活性。另外，具体而言，当生产肉桂酸时，可以降低NCgl0324蛋白和NCgl2709蛋白中任一种或两者的活性。YqhD蛋白可以具有香草醇脱氢酶活性。NCgl0324蛋白可具有香草醇脱氢酶活性，苯甲醇脱氢酶活性和肉桂醇脱氢酶活性的全部。NCgl2709蛋白可以具有苯甲醇脱氢酶活性和肉桂醇脱氢酶活性两者。

ADH活性可以通过例如在NADPH或NADH存在下将酶与底物(即醛如香草醛)一起温育，并测量NADPH或NADH的酶和底物依赖性氧化来测量。在至少一种合适的条件下，例如在适当的电子供体如NADPH或NADH存在下检测ADH活性是足够的。

术语“莽草酸脱氢酶”可以指具有催化在电子供体存在下还原3-脱氢莽草酸以产生莽草酸的反应的活性的蛋白质(EC 1.1.1.25)。该活性也可称为“莽草酸脱氢酶活性”。编码莽草酸脱氢酶的基因也可称为“莽草酸脱氢酶基因”。电子供体的实例可包括NADH和NADPH。莽草酸脱氢酶的实例可包括AroE蛋白，其由aroE基因编码。大肠杆菌K-12MG1655菌株的aroE基因的核苷酸序列如SEQ ID NO:49所示，并且由该基因编码的AroE蛋白的氨基酸序列如SEQ ID NO:50所示。

莽草酸脱氢酶活性可以通过例如在NADPH或NADH存在下将酶与底物(即3-脱氢莽草酸)一起温育，并测量NADPH或NADH的酶和底物依赖性氧化来测量。

具有经修饰的活性的蛋白质可以根据产生目标物质的生物合成途径的类型以及微生物固有拥有的蛋白质的类型和活性来适当选择。例如，当通过生物转化方法从原儿茶酸生产香草醛时，可优选增加一种或多种蛋白质如OMT，CAR，PPT和原儿茶酸摄取系统的活性。此外，当通过生物转化方法由香草酸生产香草醛时，可以优选增强一种或多种蛋白质如CAR，PPT和香草酸摄取系统的活性。如本文所述的微生物已经经过修饰而具有特定的CAR基因，因此可以增强至少CAR活性。

用于育种出具有目标物质生产能力的微生物的基因和蛋白质可以分别具有例如上面列举的或其他已知的核苷酸序列和氨基酸序列。此外，用于育种出具有目标物质生产能力的微生物的基因和蛋白质可以是上面例示的基因和蛋白质的保守变体，例如分别具有上述例示或其他已知核苷酸序列和氨基酸序列的基因和蛋白质。具体地，例如，用于育种出具有目标物质生产能力的微生物的基因可以各自是编码蛋白质的基因，所述蛋白质具有上述例示的氨基酸序列或已知蛋白质的氨基酸序列但包含一个或几个位置处一个或几个氨基酸残基的取代、缺失、插入或添加，只要保持其原始功能，即酶活性，转运蛋白活性等即可。对于基因和蛋白质的保守变体，可以在必要修改后应用后面描述的关于CAR基因和CAR的保守变体的描述。

<1-2>引入特定的羧酸还原酶基因

如本文所述的微生物已经经修饰而具有特定的羧酸还原酶(CAR)基因。具有CAR基因的微生物也可称为“具有CAR的微生物”。通过修饰微生物而具有特定的CAR基因，可以改善微生物的目标物质生产能力，也就是说，可以增加通过使用微生物生产目标物质。也就是说，与未修饰的菌株相比，对于所述微生物可以获得改善的目标物质生产能力和增加的目标物质的生成。目标物质生成的增加可以是目标物质的生成的绝对程度，如绝对量和绝对产率的增加，或者可以相对于副产品以目标物质的生成的相对程度计，如相对量和相对产率。副产物的实例可以包括例如对于香草醛生产的原儿茶醛和异香草醛。在纯化过程中可能难以将醛如香草醛与另一种醛如原儿茶醛和异香草醛分离。因此，目标物质诸如香草醛的生成的增加可以导致例如纯化成本的降低。

可以通过将具有目标物质生产能力的微生物修饰为具有特定的CAR基因来获得微生物。也可以通过将微生物修饰为具有特定的CAR基因，然后赋予微生物以目标物质生产能力或增强微生物的目标物质生产能力来获得微生物。另外，微生物可以是由于使微生物具有特定CAR基因的修饰，或者由于使微生物具有特定CAR基因的修饰和其他用于赋予或增强目标物质生产能力的修饰的组合而获得目标物质生产能力的微生物。构建微生物的修饰可以以任意顺序进行。

术语“醛氧化还原酶(羧酸还原酶；CAR)”可以指具有催化在电子供体和ATP存在下还原羧酸以产生相应的醛的反应的活性的蛋白质(EC 1.2.99.6等)。此活性也可以称为“CAR活性”。编码CAR的基因也可称为“CAR基因”。采用下述的CAR，其至少使用对应于作为如本文所述的方法中的目标物质生产的醛的羧酸。也就是说，作为CAR产物产生的醛的实例可包括在如本文所述的方法中作为目标物质例示的醛，例如芳香醛，如香草醛、苯甲醛和肉桂醛。也就是说，“CAR活性”定义中提到的羧酸和醛的组合的实例可以包括芳族羧酸和相应的芳族醛的组合，例如香草酸和香草醛的组合，苯甲酸和苯甲醛的组合以及肉桂酸和肉桂醛的组合。换言之，例如，用于香草醛生产的CAR的术语“CAR活性”可以指催化将香草酸还原以产生香草醛的反应的活性。使用芳族羧酸的CAR也可称为“芳族醛氧化还原酶(芳族羧酸还原酶；ACAR)”。此外，其中的芳族羧酸用作底物的CAR活性也可称为“ACAR活性”。特定的CAR可以具有ACAR活性。CAR可以使用一种羧酸，或者可以使用两种以上的羧酸。电子供体的实例可以包括NADH和NADPH。

CAR也可以催化在电子供体和ATP的存在下还原原儿茶酸和/或异香草酸以产生原儿茶醛和/或异香草醛的反应。CAR可以选择性催化香草醛的产生。表述“选择性催化香草醛的产生”可以意味着当允许CAR作用于香草酸时CAR产生香草醛，其中例如按摩尔比计，香草醛的产生量是在除使用原儿茶酸作为底物以外与香草醛生成在相同条件下产生的原儿茶醛的量和除使用异香草酸作为底物以外与香草醛生成在相同条件下产生的异香草醛的量的每种或任一种的1.1倍以上、1.2倍以上、1.5倍以上、2倍以上、3倍以上、4倍以上、5倍以上、10倍以上、15倍以上、20倍以上、25倍以上、或30倍以上。

CAR活性可以通过例如在ATP和NADPH存在下将酶与底物(例如香草酸)一起温育，并测量NADPH的酶和底物依赖性氧化来测量(J.Biol.Chem.,2007,Vol.282,No.1,pp.478-485中描述的方法的修改)。此外，通过在除使用原儿茶酸或异香草酸作为底物以外在相同条件下测量原儿茶醛或异香草醛的产生，并将原儿茶醛或异香草醛的产生与香草醛的产生进行比较，可以确定CAR是否选择性催化香草醛的生产。特定CAR具有在至少一种合适的条件下测量的CAR活性是足够的。顺便提及，本申请中提及的所有其他蛋白质具有各自在至少一种合适的条件下测量的相应活性也是足够的。

术语“特定的CAR基因”可以指编码特定CAR的基因。特定CAR基因的实例可以包括戈登氏菌CAR基因、新鞘氨醇杆菌CAR基因和胶球藻CAR基因。特定的CAR的实例可以包括戈登氏菌CAR、新鞘氨醇杆菌CAR和胶球藻CAR。术语“戈登氏菌CAR基因”可以指编码戈登氏菌CAR的基因。术语“戈登氏菌CAR”可以共同指在戈登氏菌细菌中发现的CAR及特定范围内的其变异，例如保守变体。术语“新鞘氨醇杆菌CAR基因”可以指编码新鞘氨醇杆菌CAR的基因。术语“新鞘氨醇杆菌CAR”可以共同指在新鞘氨醇杆菌细菌中发现的CAR及特定范围内的其变异，例如保守变体。术语“胶球藻CAR基因”可以指编码胶球藻CAR的基因。术语“胶球藻CAR”可以共同指在胶球藻藻类中发现的CAR及特定范围内的其变异，例如保守变体。

戈登氏菌细菌的实例可包括Gordonia effusa。也就是说，戈登氏菌CAR基因和戈登氏菌CAR的实例可以分别包括Gordonia effusa的CAR基因和CAR。Gordonia effusa的CAR基因的核苷酸序列如SEQ ID NO:17所示，并且由该基因编码的CAR的氨基酸序列如SEQ IDNO:18所示。新鞘氨醇杆菌细菌的实例可以包括马来西亚新鞘氨醇杆菌(Novosphingobiummalaysiense)。也就是说，新鞘氨醇杆菌CAR基因和新鞘氨醇杆菌CAR的实例可以分别包括马来西亚新鞘氨醇杆菌的CAR基因和CAR。马来西亚新鞘氨醇杆菌的CAR基因的核苷酸序列如SEQ ID NO:78所示，并且由该基因编码的CAR的氨基酸序列如SEQ ID NO：79所示。胶球藻藻类的实例可以包括Coccomyxa subellipsoidea。也就是说，胶球藻CAR基因和胶球藻CAR的实例可分别包括Coccomyxa subellipsoidea的CAR基因和CAR。Coccomyxasubellipsoidea C-169的CAR基因(cDNA)的核苷酸序列如SEQ ID NO:82所示，并且由该基因编码的CAR的氨基酸序列如SEQ ID NO:83所示。也就是说，特定的CAR基因可以是例如具有SEQ ID NO:17、38或82所示的核苷酸序列的基因。此外，特定的CAR可以是例如具有SEQID NO:18、79或83所示的氨基酸序列的蛋白质。除非另有说明，表述“基因或蛋白质具有核苷酸或氨基酸序列”可以表示基因或蛋白质包括核苷酸或氨基酸序列，并且还可以包括基因或蛋白质仅包含核苷酸或氨基酸序列的情况。

特定的CAR基因可以是上面例示的任何CAR基因(例如，具有SEQ ID NO：17、38或82所示的核苷酸序列的基因)的变体，只要其原始功能得以保持即可。类似地，特定的CAR可以是上文例示的任何CAR(例如，具有SEQ ID NO：17、38或82所示的核苷酸序列的基因)的变体，只要其原始功能得以保持即可。保持其原始功能的变体也可以称为“保守变体”。也就是说，特定CAR基因和特定CAR的实例还可以包括此类保守变体。在戈登氏菌细菌、新鞘氨醇杆菌细菌或胶球藻藻类中可以找到或可以找不到此类保守变体。保守变体的实例可以包括例如上文例示的基因和蛋白质的同源物和人工修饰形式。

表述“保持原始功能”可以指基因或蛋白质的变体具有对应于原始基因或蛋白质的功能(例如活性或性质)的功能(例如活性或性质)。就基因而言表述“保持原始功能”可以指该基因的变体编码保持原始功能的蛋白质。也就是说，就CAR基因而言表述“保持原始功能”可以意味着基因的变体编码CAR。就CAR而言表述“保持原始功能”可以意味着蛋白质的变体具有CAR活性。

以下将解释保守变体的实例。

特定CAR基因的同源物或特定CAR的同源物可以使用上述例示的CAR基因的任何核苷酸序列或上文例示的任何CAR氨基酸序列作为查询序列通过例如BLAST搜索或FASTA搜索从公共数据库容易地获得。此外，特定CAR基因的同源物可以通过例如使用戈登氏菌细菌、新鞘氨醇杆菌细菌或胶球藻藻类等生物体的染色体作为模板和基于上述例示的CAR基因的任何核苷酸序列的核苷酸序列制备的寡核苷酸作为引物的PCR获得。

特定CAR基因可以是编码蛋白质的基因，所述蛋白质具有任何上述氨基酸序列(例如以SEQ ID NO:18、79或83所示的氨基酸序列)，且包括在一个或几个位置处一个或几个氨基酸残基的取代，缺失，插入和/或添加，只要保持原始功能即可。例如，编码的蛋白质可以具有延伸的或缺失的N端和/或C端。尽管以上使用的术语“一个或几个”所表示的数目可以随蛋白质的三维结构中的氨基酸残基的位置或氨基酸残基的类型而不同，具体而言，它例如为1至50，1至40，1至30，1至20，1至10，1至5，或1至3。

一个或几个氨基酸残基的上述取代，缺失，插入和/或添加各自是保持蛋白质原始功能的保守突变。保守突变的典型实例是保守取代。若取代位点是芳香氨基酸，则保守取代是其中取代在Phe，Trp和Tyr之间相互发生的突变；若它是疏水性氨基酸，则保守取代是取代在Leu，Ile和Val之间相互发生的突变；若它是极性氨基酸；则保守取代是取代在Gln和Asn之间相互发生的突变；若它是碱性氨基酸，则保守取代是取代在Lys，Arg和His之间相互发生的突变；若它是酸性氨基酸，则保守取代是取代在Asp和Glu之间相互发生的突变；以及若它是具有羟基的氨基酸，则保守取代是取代在Ser和Thr之间相互发生的突变。认为是保守取代的取代的实例可以具体包括用Ser或Thr取代Ala，用Gln，His，或Lys取代Arg，用Glu，Gln，Lys，His，或Asp取代Asn，用Asn，Glu，或Gln取代Asp，用Ser或Ala取代Cys，用Asn，Glu，Lys，His，Asp，或Arg取代Gln，用Gly，Asn，Gln，Lys，或Asp取代Glu，用Pro取代Gly，用Asn，Lys，Gln，Arg，或Tyr取代His，用Leu，Met，Val，或Phe取代Ile，用Ile，Met，Val，或用Phe取代Leu，用Asn，Glu，Gln，His，或Arg取代Lys，用Ile，Leu，Val，或Phe取代Met，用Trp，Tyr，Met，Ile，或Leu取代Phe，用Thr或Ala取代Ser，用Ser或Ala取代Thr，用Phe或Tyr取代Trp，用His，Phe，或Trp取代Tyr，以及用Met，Ile，或Leu取代Val。此外，如上所述的氨基酸残基的此类取代，缺失，插入，添加等可以包括由于个体差异引起的天然存在的突变或者该基因来源的生物体的物种的差异(突变体或变体)。

此外，特定的CAR基因可以是编码与上述任何氨基酸序列的总氨基酸序列具有例如50％或更多，65％或更多，80％或更多，90％或更多，95％或更多，97％或更多，或99％或更多的同源性的氨基酸序列的蛋白质的基因，只要保持原始功能。另外，在本说明书中，“同源性”是指“同一性”。

此外，特定的CAR基因可以是能够在严格条件下与可以从任何前述核苷酸序列(例如以SEQ ID NO:17、78或82所示的核苷酸序列)制备的探针，例如与任何上述核苷酸序列的全部序列或部分序列互补的序列杂交的基因(例如DNA)，只要保持原始功能。“严格条件”可以指形成所谓特异性杂合物，并且不形成非特异性杂合物的条件。严格条件的实例可以包括高度同源的DNA彼此杂交(例如，不小于50％,65％,80％,90％,95％,97％或99％同源的DNA彼此杂交，并且同源性小于上述项的DNA不彼此杂交)的那些条件，或典型的Southern杂交的清洗条件，即在与1x SSC，0.1％SDS于60℃；0.1x SSC，0.1％SDS于60℃；或者0.1xSSC，0.1％SDS于68℃对应的盐浓度和温度清洗1次，或2或3次的条件。

用于上述杂交的探针可以是与如上述的基因互补的序列的一部分。此类探针可以使用基于已知基因序列制备的寡核苷酸作为引物和含有任何上述基因的DNA片段作为模板通过PCR制备。作为探针，例如可以使用长度约300bp的DNA片段。当使用长度为约300bp的DNA片段作为探针时，具体地，杂交的清洗条件可以是例如50℃，2xSSC和0.1％SDS。

此外，由于关于密码子简并性的性质随宿主而变化，特定CAR基因可以包括相应等同密码子对任意密码子的替换。也就是说，由于遗传密码的简并性，特定CAR可以是以上例示的任何CAR基因的变体。例如，特定CAR基因可以以使其根据待使用的宿主中的密码子频率而具有最佳密码子的方式进行了修饰的基因。经密码子优化的特定CAR基因的实例可以包括例如具有SEQ ID NO:77、81或85所示的核苷酸序列的CAR基因，其已经针对大肠杆菌的密码子选择进行了密码子优化。

例如，可以通过使用数学算法来确定两个序列之间的序列同一性的百分比。此类数学算法的非限制性实例可以包括Myers and Miller(1988)CABIOS 4:11-17的算法、Smith et al(1981)Adv.Appl.Math.2:482的局部同源性算法、Needleman and Wunsch(1970)J.Mol.Biol.48:443-453的同源性比对算法、Pearson and Lipman(1988)Proc.Natl.Acad.Sci.85:2444-2448的同源性筛选方法和Karlin and Altschul(1990)Proc.Natl.Acad.Sci.USA 87:2264的算法的修改形式，诸如记载于Karlin and Altschul(1993)Proc.Natl.Acad.Sci.USA 90:5873-5877的。

通过使用基于此类数学算法的程序，可以进行用于确定序列同一性的序列比较(即比对)。该程序可以由计算机适当地执行。此类程序的实例可以包括但不限于PC/Gene程序的CLUSTAL(可从Intelligenetics,Mountain View,Calif.获得)，ALIGN程序(版本2.0)以及Wisconsin Genetics Software Package,版本8(可从Genetics Computer Group(GCG),575Science Drive,Madison,Wis.,USA获得)的GAP，BESTFIT，BLAST，FASTA和TFASTA。使用这些程序的比对可以通过使用例如初始参数来进行。CLUSTAL程序充分记载于Higgins et al.(1988)Gene 73:237-244(1988),Higgins et al.(1989)CABIOS 5:151-153,Corpet et al.(1988)Nucleic Acids Res.16:10881-90,Huang et al.(1992)CABIOS8:155-65,以及Pearson et al.(1994)Meth.Mol.Biol.24:307-331。

为了获得与靶核苷酸序列同源的核苷酸序列，具体而言，例如，可以通过使用BLASTN程序以100的得分和12的字长来进行BLAST核苷酸搜索。为了获得与靶蛋白质同源的氨基酸序列，特别地，例如可以通过以50的得分和3的字长使用BLASTX程序进行BLAST蛋白质搜索。关于BLAST核苷酸搜索和BLAST蛋白质搜索，参见www.ncbi.nlm.nih.gov。另外，为了比较目的，可以使用Gapped BLAST(BLAST 2.0)以获得包含缺口的比对。另外，可以使用PSI-BLAST来进行重复搜索以检测序列之间的远距离关系。关于Gapped BLAST和PSI-BLAST，参见Altschul et al.(1997)Nucleic Acids Res.25:3389。当使用BLAST、GappedBLAST或PSI-BLAST时，可以使用每个程序的初始参数(例如核苷酸序列的BLASTN和氨基酸序列的BLASTX)。比对也可以手动进行。

两个序列之间的序列同一性计算为在比对两个序列以便彼此最大限度配合时两个序列中匹配的残基的比率。

前述关于基因和蛋白质的保守变体的描述可以在必要修改后应用于任意蛋白质的变体，例如目标物质生物合成酶和编码它们的基因。

可以通过将基因引入微生物中将微生物修饰为具有特定的CAR基因。

将特定CAR基因引入微生物的方法没有特别限制。微生物可操作含有特定的CAR基因是足够的。微生物可以具有特定CAR基因的一个拷贝，或者可以具有特定CAR基因的两个或更多个拷贝。微生物可以具有一种特定的CAR基因，或者可以具有两种或更多种特定的CAR基因。可以通过与下文在“增加蛋白质活性的方法”中描述的基因引入的方式相同的方式将特定的CAR基因引入微生物中。

微生物可以具有或可以没有除特定CAR基因以外的CAR基因。

<1-3>增加蛋白质活性的方法

以下，将描述用于增加蛋白质活性的方法，包括引入基因的方法。

表述“蛋白质的活性得以增加”可以指与非修饰菌株相比，蛋白质的活性增加。具体而言，表述“蛋白质的活性得以增加”可以意味着与非修饰菌株相比，每细胞的蛋白质的活性增加。术语“非修饰菌株”可以指尚未以增加目标蛋白质活性的方式进行修饰的对照菌株。非修饰菌株的实例可以包括野生型菌株和亲本菌株。非修饰菌株的具体实例可以包括微生物物种的相应类型菌株。非修饰菌株的具体实例还可以包括以上关于微生物描述所例示的菌株。也就是说，在一个实施方案中，与类型菌株，即微生物所属的物种的类型菌株相比，蛋白质的活性可以得以增加。在另一个实施方案中，与谷氨酸棒杆菌ATCC13869菌株相比，蛋白质的活性也可以得以增加。在另一个实施方案中，与谷氨酸棒杆菌ATCC13032菌株相比，蛋白质的活性也可以得以增加。在另一个实施方案中，与大肠杆菌K-12MG1655菌株相比，蛋白质的活性也可以得以增加。“蛋白质活性得以增加”的状态也可以表达为“蛋白质的活性得以增强”。更具体地说，表述“蛋白质的活性得以增加”可以意味着与非修饰菌株相比每细胞的蛋白质的分子数目增加，和/或蛋白质的每个分子的功能增加。也就是说，表述“蛋白质活性得以增加”中的术语“活性”不限于蛋白质的催化活性，而且还可以指编码蛋白质的基因的转录量(即mRNA的量)，或蛋白质的翻译量(即蛋白质的量)。此外，“蛋白质的活性得以增加”的状态不仅包括目标蛋白质的活性在固有具有目标蛋白质活性的菌株中增加的状态，而且还包括将目标蛋白质的活性赋予不固有地具有目标蛋白质活性的菌株的状态。此外，只要蛋白质的活性最终得以增加，宿主中固有地包含的目标蛋白质的活性可以减弱和/或消除，然后可以将适当类型的目标蛋白质赋予宿主。

蛋白质活性增加的程度不受特别限制，只要蛋白质的活性与非修饰菌株相比增加即可。蛋白质的活性可以增加至例如非修饰菌株的蛋白质活性的1.2倍以上，1.5倍以上，2倍以上，或3倍以上。此外，当非修饰菌株不具有目标蛋白质的活性时，足够的是由于引入编码蛋白质的基因而产生蛋白质，并且例如，蛋白质可以以使其活性可以得到测量的程度生产。

提高蛋白质活性的修饰可以通过例如增加编码该蛋白质的基因的表达来实现。表述“基因的表达得以增加”意指与非修饰菌株如野生型菌株和亲本菌株相比，基因的表达得以增加。具体而言，表述“基因表达得以增加”可以意味着每个细胞的基因表达量与非修饰菌株相比得以增加。更具体地，表述“基因表达得以增加”可以意味着基因的转录量(即mRNA的量)得以增加，和/或基因的翻译量(即从基因表达的蛋白质量)得以增加。“基因表达得以增加”的状态也称为“基因表达得以增强”。基因的表达可以增加至例如非修饰菌株的表达的1.2倍以上，1.5倍以上，2倍以上，或3倍以上。此外，“基因表达得以增加”的状态不仅可以包括目标基因的表达量在固有表达目标基因的菌株中得以增加的状态，而且还包括将基因引入到不固有地表达目标基因并在其中表达的菌株中的状态。也就是说，短语“基因表达得以增加”也可以意指例如，将目标基因引入不拥有该基因的菌株中并在其中表达。

例如，可以通过增加基因的拷贝数来增加基因的表达。

可以通过将基因引入宿主的染色体来增加基因的拷贝数。例如可以通过使用同源重组(Miller,J.H.,Experiments in Molecular Genetics,1972,Cold Spring HarborLaboratory)将基因引入染色体。使用同源重组的基因转移方法的实例可以包括使用线性DNA的方法，诸如Red驱动的整合(Datsenko,K.A.,and Wanner,B.L.,Proc.Natl.Acad.Sci.USA,97:6640-6645(2000))，使用含有温度敏感性复制起点的质粒的方法，使用能够接合转移的质粒的方法，使用不具有在宿主中起作用的复制起点的自杀载体的方法，使用噬菌体的转导方法。可以引入基因的仅一个拷贝或两个或更多个拷贝。例如，通过使用以染色体上的多个拷贝存在的序列作为靶标进行同源重组，可以将多个拷贝的基因引入染色体。以多个拷贝存在于染色体上的此类序列的实例可以包括重复DNA和位于转座子两端的反向重复序列。或者，可以通过使用染色体上的适当序列，如对于产生目标物质不必要的基因作为靶标进行同源重组。另外，也可以用转座子或Mini-Mu(日本专利公开(Kokai)No.2-109985,美国专利No.5,882,888,EP 805867B1)将基因随机引入染色体。

可以通过使用具有与全部基因或其一部分互补的序列的探针进行Southern杂交、使用基于该基因序列制备的引物的PCR等确认靶基因对染色体的引入。

此外，通过将含有该基因的载体引入宿主中，也可以增加基因的拷贝数。例如，通过将含有靶基因的DNA片段与在宿主中起作用的载体连接以构建该基因的表达载体，并用该表达载体转化宿主，可以增加靶基因的拷贝数。可以通过例如使用具有靶基因的微生物的基因组DNA作为模板的PCR获得含有靶基因的DNA片段。作为载体，可以使用宿主细胞中可自主复制的载体。该载体可以是多拷贝载体。此外，载体优选具有用于选择转化体的标志物如抗生素抗性基因。此外，载体可以具有用于表达引入的基因的启动子和/或终止子。载体可以是例如源自细菌质粒的载体，源自酵母质粒的载体，源自噬菌体的载体，粘粒，噬菌粒等。可在肠杆菌科细菌诸如大肠杆菌中自主复制的载体的具体实例可以包括例如pUC19,pUC18,pHSG299,pHSG399,pHSG398,pBR322,pSTV29(所有这些可购自Takara Bio),pACYC184,pMW219(NIPPON GENE),pTrc99A(Pharmacia),pPROK系列载体(Clontech),pKK233-2(Clontech),pET系列载体(Novagen),pQE系列载体(QIAGEN),pCold TF DNA(Takara Bio),pACYC系列载体，和宽宿主范围的载体RSF1010。可在棒状杆菌细菌中自主复制的载体的具体实例可以包括例如pHM1519(Agric.Biol.Chem.,48,2901-2903(1984))；pAM330(Agric.Biol.Chem.,48,2901-2903(1984))；通过改善这些质粒获得并具有药物抗性基因的质粒；日本专利公开(Kokai)No.3-210184中描述的质粒pCRY30；日本专利公开(Kokai)No.2-72876和美国专利No.5,185,262中描述的质粒pCRY21，pCRY2KE，pCRY2KX，pCRY31，pCRY3KE和pCRY3KX；日本专利公开(Kokai)No.1-191686中描述的质粒pCRY2和pCRY3；日本专利公开(Kokai)No.58-192900中描述的pAJ655，pAJ611和pAJ1844；日本专利公开(Kokai)No.57-134500中描述的pCG1；日本专利公开(Kokai)No.58-35197中描述的pCG2；日本专利公开(Kokai)No.57-183799中描述的pCG4和pCG11；日本专利公开(Kokai)No.10-215883中描述的pVK7；WO2007/046389中描述的pVK9；WO2013/069634中描述的pVS7；和日本专利公开(Kokai)No.9-070291中描述的pVC7。

当引入基因时，宿主可表达地含有基因是足够的。具体而言，宿主含有基因以便其在宿主中起作用的启动子的控制下表达是足够的。术语“在宿主中起作用的启动子”可以指在宿主中显示启动子活性的启动子。启动子可以是源自宿主的启动子或异源启动子。启动子可以是待引入基因的天然启动子或另一基因的启动子。作为启动子，例如也可以使用如后述的更强的启动子。

终止基因转录的终止子可以位于基因的下游。终止子没有特别限制，只要其在宿主中起作用。终止子可以是源自宿主的终止子或异源终止子。终止子可以是待引入基因的天然终止子或另一基因的终止子。终止子的具体实例可以包括例如T7终止子、T4终止子、fd噬菌体终止子、tet终止子和trpA终止子。

在“Fundamental Microbiology Vol.8,Genetic Engineering,KYORITSUSHUPPAN CO.,LTD,1987”中详细公开了可用于各种微生物中的载体，启动子和终止子，并且可以使用那些。

此外，当引入两个或更多个基因时，基因各自由宿主可操作含有是足够的。例如，所有基因可以由单个表达载体或染色体携带。此外，基因可以分别由两个或更多个表达载体携带，或者分开由单一或两个或更多个表达载体和染色体携带。也可以引入由两个或更多个基因构成的操纵子。“引入两个或更多个基因”的情况可以包括例如引入编码两种或更多种蛋白质(酶等)的相应基因的情况，引入编码构成单一蛋白质复合物(例如酶复合物)的两种或更多种亚基的相应基因的情况以及上述情况的组合。

待引入的基因没有特别限制，只要它编码能够在宿主中起作用的蛋白即可。待引入的基因可以是源自宿主的基因，或者可以是异源基因。可以例如使用基于该基因的核苷酸序列设计的引物，并使用具有该基因的生物体的基因组DNA，携带该基因的质粒等作为模板通过PCR获得待引入的基因。待引入的基因也可以完全合成，例如基于该基因的核苷酸序列(Gene,60(1),115-127(1987))。获得的基因可以原样使用，或者根据需要在修饰后使用。也就是说，可以通过修饰基因来获得基因的变体。基因可以通过已知技术进行修饰。例如，可以通过位点特异性突变方法将目标突变引入DNA的目标位点。也就是说，可以通过位点特异性突变方法修饰基因的编码区，使得编码蛋白的特定位点包括氨基酸残基的取代，缺失，插入和/或添加。位点特异性突变方法的实例可以包括利用PCR的方法(Higuchi,R.,61,于PCR Technology,Erlich,H.A.Eds.,Stockton Press(1989)；Carter,P.,Meth.inEnzymol.,154,382(1987))和利用噬菌体的方法(Kramer,W.and Frits,H.J.,Meth.于Enzymol.,154,350(1987)；Kunkel,T.A.et al.,Meth.in Enzymol.,154,367(1987))。或者，可以完全合成基因的变体。

另外，当蛋白质作为具有多个亚基的复合物起作用时，可以修饰多个亚基的部分或全部，只要蛋白质的活性最终得以增加。也就是说，例如，当通过增加基因的表达来增加蛋白质的活性时，可以增强编码亚基的多个基因的部分或全部的表达。通常优选增强编码亚基的多个基因全部的表达。此外，构成该复合物的亚基可以源自单一种类的生物体或两种或更多种生物体，只要该复合物具有目标蛋白质的功能即可。也就是说，例如，可以将编码多个亚基的相同生物体的基因引入宿主，或者可以将编码多个亚基的不同生物体的基因引入宿主中。

此外，可以通过改善基因的转录效率增加基因的表达。另外，通过提高基因的翻译效率也可以增加基因的表达。基因的转录效率和基因的翻译效率可以通过例如修饰基因的表达控制序列来改善。术语“表达控制序列”可以共同指影响基因表达的位点。表达控制序列的实例可以包括例如启动子，Shine-Dalgarno(SD)序列(也称为核糖体结合位点(RBS))和RBS与起始密码子之间的间隔物区。可以通过使用启动子搜索载体或基因分析软件如GENETYX来鉴定表达控制序列。这些表达调控序列可以通过例如使用温度敏感性载体的方法或Red驱动整合方法(WO2005/010175)进行修饰。

通过例如用更强的启动子替换染色体上的基因的启动子可以提高基因的转录效率。术语“更强的启动子”可以指与基因的固有存在的野生型启动子相比提供改善的基因转录的启动子。更强的启动子的实例可以包括例如已知的高表达启动子，诸如T7启动子、trp启动子、lac启动子、thr启动子、tac启动子、trc启动子、tet启动子、araBAD启动子、rpoH启动子、msrA启动子、Pm1启动子(源自双歧杆菌属(Bifidobacterium))、PR启动子和PL启动子。在棒状杆菌细菌中起作用的更强启动子的实例可以包括例如在棒状杆菌细菌中用乙酸、乙醇、丙酮酸等可诱导的人工修饰的P54-6启动子(Appl.Microbiol.Biotechnol.,53,674-679(2000)),pta,aceA,aceB,adh,和amyE启动子，以及cspB，SOD和tuf(EF-Tu)启动子，它们是能够在棒状杆菌细菌中提供大表达量的有力启动子(Journal of Biotechnology,104(2003)311-323；Appl.Environ.Microbiol.,2005Dec；71(12):8587-96)以及lac启动子，tac启动子和trc启动子。此外，作为更强的启动子，通过使用各种报道基因也可以获得高活性类型的固有启动子。例如，通过使启动子区中的-35和-10区更接近共有序列，可以增强启动子的活性(WO00/18935)。高活性型启动子的实例可以包括各种tac样启动子(Katashkina JI et al.,Russian Federation Patent Application No.2006134574)。在Goldstein et al.(Prokaryotic Promoters in Biotechnology,Biotechnol.Annu.Rev.,1,105-128(1995))的论文等中描述了评估启动子强度的方法和强启动子的实例。

例如，通过用更强的SD序列替换染色体上的基因的Shine-Dalgarno(SD)序列(也称为核糖体结合位点(RBS))，可以改善基因的翻译效率。“更强的SD序列”可以指与基因固有的野生型SD序列相比提供改善的mRNA翻译的SD序列。更强的SD序列的实例可以包括例如源自噬菌体T7的基因10的RBS(Olins P.O.et al,Gene,1988,73,227-235)。此外，已知在RBS和起始密码子之间的间隔物区中，特别是在紧邻起始密码子上游的序列(5'-UTR)中，几个核苷酸的取代，插入或缺失显著影响mRNA的稳定性和翻译效率，因此，通过修饰它们也可以改善基因的翻译效率。

基因的翻译效率也可以通过例如修饰密码子来改善。例如，通过用更频繁使用的同义密码子取代基因中存在的稀有密码子，可以提高基因的翻译效率。也就是说，例如，基因可以以使该基因含有根据在待使用的宿主中观察到的密码子频率的最佳密码子的方式进行了修饰。例如，可以通过位点特异性突变方法替换密码子。或者，可以完全合成替换目标密码子的基因片段。“密码子选择数据库”(www.kazusa.or.jp/codon；Nakamura,Y.etal,Nucl.Acids Res.,28,292(2000))中公开了各种生物体中的密码子的频率。

此外，基因的表达还可以通过扩增增加基因表达的调节子或缺失或减弱减少基因表达的调节子来增加。

可以独立使用或以任意组合使用如上所述用于增加基因表达的此类方法。

此外，也可以通过例如增强酶的比活性来获得增加蛋白质活性的修饰。比活性的增强也可以包括对反馈抑制的脱敏。也就是说，当蛋白质被代谢物反馈抑制时，可以通过使宿主含有编码已经对反馈抑制脱敏的突变体蛋白质的基因来增加蛋白质的活性。表述“对反馈抑制脱敏”可以包括消除反馈抑制，和减弱反馈抑制，除非另有叙述。此外，“对反馈抑制脱敏”的状态，即反馈抑制得到消除或减弱的状态，也可以称为“对反馈抑制耐受”。通过例如搜索各种生物体可以获得显示增强的比活性的蛋白质。此外，通过向现有蛋白质中引入突变也可以获得高活性类型的固有蛋白质。待引入的突变可以是例如在蛋白质中的一个或几个位置上一个或几个氨基酸残基的取代，缺失，插入或添加。可以通过例如如上所述的此类位点特异性突变方法来引入突变。突变也可以通过例如诱变处理来引入。诱变处理的实例可以包括X射线照射，紫外线照射和用突变剂如N-甲基-N'-硝基-N-亚硝基胍(MNNG)，甲磺酸乙酯(EMS)和甲磺酸甲酯(MMS)处理。此外，可以通过用羟胺在体外直接处理DNA来诱导随机突变。比活性的增强可以独立使用，或者可以与如上述用于增强基因表达的此类方法任意组合使用。

用于转化的方法不受特别限制，并且可以使用常规已知的方法。可以使用例如用氯化钙处理接受细胞以增加其对DNA的通透性的方法，其已经对大肠杆菌K-12菌株报道(Mandel,M.and Higa,A.,J.Mol.Biol.,1970,53,159-162)，以及从生长阶段中的细胞制备感受态细胞，接着用DNA转化的方法，其已经对枯草芽孢杆菌(Bacillus subtilis)报告(Duncan,C.H.,Wilson,G.A.and Young,F.E.,Gene,1977,1:153-167)。或者，也可以使用使DNA-接受细胞变为原生质体或原生质球(其可以容易摄取重组DNA)，接着将重组DNA引入DNA-接受细胞中的方法，已知该方法适用于枯草芽孢杆菌、放线菌和酵母(Chang,S.andChoen,S.N.,1979,Mol.Gen.Genet.,168:111-115；Bibb,M.J.,Ward,J.M.and Hopwood,O.A.,1978,Nature,274:398-400；Hinnen,A.,Hicks,J.B.and Fink,G.R.,1978,Proc.Natl.Acad.Sci.USA,75:1929-1933)。此外，也可以使用对棒状杆菌细菌报告的电脉冲方法(日本专利公开(Kokai)No.2-207791)。

可以通过测量蛋白质的活性来确认蛋白质活性的增加。

通过确认编码蛋白质的基因的表达增加，也可以确认蛋白质活性的增加。可以通过确认基因转录量的增加或通过确认从该基因表达的蛋白质量的增加来确认基因表达的增加。

可以通过比较从基因转录的mRNA的量与非修饰菌株如野生型菌株或亲本菌株的mRNA量来确认基因转录量的增加。用于评估mRNA量的方法的实例可以包括Northern杂交，RT-PCR等(Sambrook,J.,et al.,Molecular Cloning A Laboratory Manual/第三版,ColdSpring Harbor Laboratory Press,Cold Spring Harbor(USA),2001)。mRNA的量可以增加到例如非修饰菌株的mRNA量的1.2倍以上，1.5倍以上，2倍以上或3倍以上。

可以通过使用抗体的Western印迹法(Molecular Cloning,Cold Spring HarborLaboratory Press,Cold Spring Harbor(USA),2001)来确认蛋白质量的增加。蛋白质的量(诸如每细胞的蛋白质分子的数目)可以增加到例如非修饰菌株的蛋白质量的1.2倍以上，1.5倍以上，2倍以上或3倍以上。

除了引入特定的CAR外，上述提高蛋白质活性的方法可用于提高任意蛋白质如目标物质生物合成酶，磷酸泛酰巯基乙胺基化酶和物质摄取系统的活性，和增强任意基因如编码那些任意蛋白质的基因的表达。

<1-4>降低蛋白质活性的方法

以下，将描述用于降低蛋白质的活性的方法。

表述“蛋白质的活性得以降低”可以指与非修饰菌株相比蛋白质的活性得以降低。具体而言，表述“蛋白质的活性得以降低”可以意味着与非修饰菌株相比，每个细胞的蛋白质的活性得以降低。本文使用的术语“非修饰菌株”可以指尚未以使目的蛋白质的活性得以降低的方式进行修饰的对照菌株。非修饰菌株的实例可以包括野生型菌株和亲本菌株。非修饰菌株的具体实例可以包括微生物物种的相应类型菌株。非修饰菌株的具体实例还可以包括以上关于微生物描述所例示的菌株。也就是说，在一个实施方案中，与类型菌株，即微生物所属的物种的类型菌株相比，可以降低蛋白质的活性。在另一个实施方案中，与谷氨酸棒杆菌ATCC 13869菌株相比，蛋白质的活性也可以得以降低。在另一个实施方案中，与谷氨酸棒杆菌ATCC 13032相比，蛋白质的活性也可以得以降低。另一个实施方案中，与大肠杆菌K-12MG1655菌株相比，蛋白质的活性也可以得以降低。“蛋白质活性得以降低”的状态还可以包括蛋白质的活性已经完全消失的状态。更具体地说，表述“蛋白质的活性得以降低”可以意味着与非修饰的菌株相比每个细胞的蛋白质的分子数目得以减少，和/或蛋白质的每个分子的功能得以降低。也就是说，表述“蛋白质的活性得以降低”中的术语“活性”不限于蛋白质的催化活性，而且还可以指编码蛋白质的基因的转录量(即mRNA的量)或蛋白质的翻译量(即蛋白质的量)。“每个细胞的蛋白质的分子数目得以减少”的状态还可以包括完全不存在蛋白质的状态。“蛋白质的每个分子的功能得以降低”的状态也可以包括每个蛋白质分子的功能完全消失的状态。蛋白质活性降低的程度没有特别限制，只要活性与非修饰菌株的活性相比降低即可。蛋白质的活性可以降低到例如非修饰菌株的蛋白质活性的50％或更少，20％或更少，10％或更少，5％或更少，或0％。

可以通过例如减少编码蛋白质的基因的表达来实现用于降低蛋白质活性的修饰。表述“基因的表达得以降低”可以指与非修饰菌株如野生型菌株和亲本菌株相比，该基因的表达得以降低。具体而言，表述“基因表达得以降低”可以意味着与非修饰菌株相比，每个细胞的基因表达得以降低。更具体地说，表述“基因表达得以降低”可以意味着基因的转录量(即mRNA的量)得以减少，和/或基因的翻译量(即从基因表达的蛋白质量)得以减少。“基因表达得以降低”的状态也可以包括基因完全不表达的状态。“基因表达得以降低”的状态也可以称为“基因表达得以减弱”。基因的表达可以降低到例如非修饰菌株的表达的50％或更少，20％或更少，10％或更少，5％或更少，或0％。

基因表达的降低可以是由于例如转录效率降低，翻译效率降低或其组合所致。可以通过修饰基因的表达控制序列诸如启动子，Shine-Dalgarno(SD)序列(也称为核糖体结合位点(RBS))，和基因的RBS和起始密码子之间的间隔物区来降低基因的表达。当修饰表达控制序列时，修饰表达控制序列的一个或多个核苷酸，两个或更多个核苷酸，或三个或更多个核苷酸。例如，通过用更弱的启动子替换染色体上基因的启动子，可以降低基因的转录效率。术语“更弱的启动子”可以指与基因固有的野生型启动子相比，提供基因的减弱转录的启动子。更弱启动子的实例可以包括例如诱导型启动子。也就是说，诱导型启动子可以在非诱导条件下，例如在不存在相应诱导物的情况下，起到更弱启动子的作用。此外，可以缺失表达控制序列的一部分或全部。基因的表达还可以通过例如操纵负责表达控制的因子来降低。负责表达控制的因子的实例可以包括负责转录或翻译控制的低分子(诱导剂，抑制剂等)，负责转录或翻译控制的蛋白质(转录因子等)，负责转录或翻译控制的核酸(siRNA等)，等等。此外，通过例如对基因的编码区引入降低基因表达的突变，也可以降低基因的表达。例如，通过用在宿主中不太频繁使用的同义密码子替换基因编码区中的密码子，可以降低基因的表达。此外，例如，如后所述，基因表达可以由于基因的破坏而降低。

用于降低蛋白质活性的修饰也可以通过例如破坏编码该蛋白质的基因来获得。表述“基因受到破坏”可以指基因以使得不产生通常可以起作用的蛋白质的方式进行了修饰。“不产生通常可以起作用的蛋白质”的状态可以包括完全不从基因产生蛋白质的状态和从基因产生每分子的功能(例如活性或性质)得以降低或消除的蛋白质的状态。

可以通过例如缺失染色体上的基因来获得基因的破坏。术语“基因的缺失”可以指基因编码区的部分或整个区域的缺失。此外，可以缺失包括染色体上基因的编码区上游和下游序列的整个基因。只要可以降低蛋白质的活性，待缺失的区域可以是任何区域，例如N端区域(编码蛋白质的N端区域的区域)，内部区域或C端区域(编码蛋白质的C端区域的区域)。缺失更长的区域通常可以更确定地使基因失活。待缺失的区域可以是具有例如基因的编码区的总长度的10％以上、20％以上、30％以上、40％以上、50％以上、60％以上、70％以上、80％以上、90％以上、或95％以上的长度的区域。此外，优选的是，待缺失的区域的上游和下游序列的阅读框不相同。读码框的不一致性可以引起待缺失的区域下游的移码。

例如，也可以通过对染色体上基因的编码区引入用于氨基酸取代的突变(错义突变)，终止密码子的突变(无义突变)，添加或缺失一个或两个核苷酸残基的突变(移码突变)等获得基因的破坏(Journal of Biological Chemistry,272:8611-8617(1997)；Proceedings of the National Academy of Sciences,USA,95 5511-5515(1998)；Journal of Biological Chemistry,26 116,20833-20839(1991))。

也可以通过例如将另一个核苷酸序列插入到染色体上的基因的编码区中获得基因的破坏。插入的位点可以位于基因的任何区域中，并且插入更长的核苷酸序列通常可以更确定地使基因失活。优选的是插入位点上游和下游序列的阅读框不相同。读码框的不一致性可以引起待缺失的区域下游的移码。其他核苷酸序列没有特别限制，只要选择降低或消除所编码蛋白质活性的序列即可，并且其实例可以包括例如标志物基因如抗生素抗性基因，以及可用于产生目标物质的基因。

特别地，可以以编码蛋白质的氨基酸序列得以缺失的方式进行基因的破坏。换言之，可以通过例如缺失蛋白质的氨基酸序列，特别地修饰基因以使该基因编码氨基酸序列得以的蛋白质来实现降低蛋白质活性的修饰。术语“蛋白质的氨基酸序列的缺失”可以指蛋白质的氨基酸序列的部分或整个区域的缺失。另外，术语“蛋白质的氨基酸序列的缺失”是指原始氨基酸序列在蛋白质中消失，并且还可以包括原始氨基酸序列变为另一个氨基酸序列的情况。也就是说，例如，通过移码改变为另一氨基酸序列的区域可以视为缺失区域。当蛋白质的氨基酸序列得以缺失时，通常缩短蛋白质的总长度，但也可以存在蛋白质的总长度没有改变或延长的情况。例如，通过缺失基因编码区的部分或整个区域，可以在编码的蛋白质中缺失由缺失区域编码的区域。另外，例如，通过将终止密码子引入基因的编码区中，可以在编码的蛋白质中缺失由引入位点的下游区域编码的区域。另外，例如，通过在基因的编码区中移码，可以在编码的蛋白质中缺失由移码区编码的区域。关于基因缺失中待缺失区域的位置和长度的上述描述可以在必要修改后应用于缺失蛋白质氨基酸序列中待缺失区域的位置和长度。

如上所述的染色体上基因的此类修饰可以如下获得：通过例如制备以使基因不能产生通常起作用的蛋白质的方式进行了修饰的破坏类型基因，并用含有破坏类型基因的重组DNA转化宿主以引起破坏类型基因和染色体上的野生型基因之间的同源重组，从而用该破坏类型基因取代染色体上的野生型基因。在该程序中，若重组DNA中包括根据宿主特征如营养缺陷选择的标志物基因，则操作变得更容易。破坏类型基因的实例可以包括编码区的部分或整个区域得以缺失的基因，包含错义突变的基因，包括无义突变的基因，包含移码突变的基因，以及包含转座子或标志物基因插入的基因。由破坏类型基因编码的蛋白质即使产生也具有与野生型蛋白质不同的构象，因此其功能得以降低或消除。已经建立了基于使用同源重组的基因取代的此类基因破坏，并且存在使用线性DNA的方法，诸如称为“Red驱动整合”的方法(Datsenko,K.A,and Wanner,B.L.,Proc.Natl.Acad.Sci.USA,97:6640-6645(2000))，以及利用Red驱动的整合与源自λ噬菌体的切除系统的组合的方法(Cho,E.H.,Gumport,R.I.,Gardner,J.F.,J.Bacteriol.,184:5200-5203(2002))(参考WO2005/010175)，使用具有温度敏感性复制起点的质粒的方法，使用能够接合转移的质粒的方法，利用没有在宿主中起作用的复制起点的自杀载体的方法(美国专利号6,303,383，日本专利公开(Kokai)No.05-007491)，等等。

用于降低蛋白质活性的修饰也可以通过例如诱变处理来获得。诱变处理的实例包括X射线或紫外线的照射和用突变剂如N-甲基-N'-硝基-N-亚硝基胍(MNNG)，甲磺酸乙酯(EMS)和甲磺酸甲酯(MMS)处理。

如上文提及的用于降低蛋白质活性的此类方法可以独立使用或者以任意组合使用。

当蛋白质作为具有多个亚基的复合物起作用时，可以修饰多个亚基的部分或全部，只要蛋白质的活性最终得以降低。也就是说，例如，编码相应亚基的多个基因的部分或全部可以得以破坏等。此外，当蛋白质存在多种同工酶时，多种同工酶的部分或全部活性可以得以降低，只要蛋白质的活性最终得以降低。也就是说，例如，编码相应同功酶的多个基因的部分或全部可以得以破坏等。

可以通过测量蛋白质的活性确认蛋白质活性的降低。

蛋白质活性的降低也可以通过确认编码该蛋白质的基因的表达的降低来确认。基因表达的降低可以通过确认基因转录量的减少或从基因表达的蛋白质量的降低来确认。

通过比较从基因转录的mRNA的量与非修饰菌株中观察到的量，可以确认基因转录量的降低。用于评估mRNA量的方法的实例可以包括Northern杂交，RT-PCR等(MolecularCloning,Cold Spring Harbor Laboratory Press,Cold Spring Harbor(USA),2001)。mRNA的量可以降低到例如在非修饰菌株中观察到的量的50％或更少，20％或更少，10％或更少，5％或更少，或0％。

通过使用抗体的Western印迹法(Molecular Cloning,Cold Spring HarborLaboratory Press,Cold Spring Harbor(USA)2001)可以确认蛋白质量的减少。蛋白质的量(诸如每个细胞的蛋白质的分子数目)可以降低到例如在非修饰菌株中观察到的蛋白质量的50％或更少，20％或更少，10％或更少，5％或更少，或0％。

可以根据用于破坏的手段通过确定基因的部分或全部的核苷酸序列，基因的限制酶图谱，全长等来确认基因的破坏。

如上所述的降低蛋白质活性的此类方法还可以适用于任意蛋白质诸如副产物生成酶的活性降低，以及任意基因诸如编码那些任意蛋白的基因的表达降低。

<2>本发明的方法

如本文中描述的方法是通过使用如本文中描述的微生物生产目标物质的方法。

<2-1>发酵方法

可以通过例如如本文中描述的微生物的发酵来生产目标物质。也就是说，如本文中描述的方法的实施方案可以是通过发酵微生物来生产目标物质的方法。此实施方案也可以称为“发酵方法”。此外，通过发酵微生物生产目标物质的步骤也可以称为“发酵步骤”。

可以通过培养如本文中描述的微生物来进行发酵步骤。具体而言，在发酵方法中，可以从碳源生产目标物质。也就是说，发酵步骤可以是例如在培养基，诸如含有碳源的培养基中培养微生物以在培养基中生产和积累目标物质的步骤。也就是说，发酵方法可以是例如在培养基，诸如含有碳源的培养基中培养微生物以在培养基中生产和积累目标物质的方法。此外，换言之，发酵步骤可以是例如通过使用微生物从碳源生产目标物质的步骤。

培养基没有特别限制，只要微生物可以在其中增殖并产生目标物质即可。作为培养基，例如可以使用通常用于培养微生物诸如细菌和酵母的培养基。培养基可以根据需要含有碳源，氮源，磷酸盐源，硫源，以及其他培养基组分，如各种有机组分和无机组分。培养基成分的类型和浓度可以根据诸如要使用的微生物的类型等各种条件适当确定。

碳源没有特别限制，只要微生物可以利用它并产生目标物质即可。碳源的具体实例可以包括例如糖类，诸如葡萄糖，果糖，蔗糖，乳糖，半乳糖，木糖，阿拉伯糖，赤糖糊(blackstrap molasses)，淀粉的水解物和生物质的水解物；有机酸如乙酸，柠檬酸，琥珀酸和葡糖酸；醇如乙醇，甘油和粗甘油；和脂肪酸。作为碳源，特别地，可以使用植物来源的材料。植物的实例可以包括例如玉米，稻，小麦，大豆，甘蔗，甜菜和棉。植物来源材料的实例可以包括例如器官，诸如根，茎，干，枝，叶，花和种子，包括它们的植物体和这些植物器官的分解产物。植物来源材料的在其使用时的形式没有特别限定，并且可以它们可以为诸如未加工产物，汁，研磨产物，纯化产物等任何形式。戊糖如木糖，己糖如葡萄糖或它们的混合物可从例如植物生物质获得。具体而言，可以通过将植物生物质进行处理，诸如蒸汽处理，浓酸水解，稀酸水解，纤维素酶等酶水解，碱处理而得到这些糖类。由于半纤维素与纤维素相比通常更容易水解，因此可预先水解植物生物质中的半纤维素以释放戊糖，然后可以水解纤维素以产生己糖。此外，木糖可以通过例如通过对微生物赋予用于将己糖如葡萄糖转化为木糖的途径从己糖转化供应。作为碳源，可以使用一种碳源，或者可以组合使用两种或更多种碳源。

培养基中碳源的浓度没有特别限制，只要微生物可以增殖并产生目标物质即可。培养基中碳源的浓度可以在使得目标物质的生产不受抑制的范围内尽可能高。碳源在培养基中的初始浓度通常可以是例如5至30％(w/v)，或10至20％(w/v)。此外，可以根据需要对培养基额外供应碳源。例如，可以与伴随发酵进展的碳源的减少或消减成比例地对培养基额外供应碳源。虽然可以暂时消减碳源，但是只要最终可以生产目标物质，可以优选以不消减碳源或不持续消减碳源的方式进行培养。

氮源的具体实例可以包括例如铵盐如硫酸铵，氯化铵和磷酸铵，有机氮源如蛋白胨，酵母提取物，肉膏和大豆蛋白分解产物，氨和尿素。用于pH调节的氨气和氨水也可用作氮源。作为氮源，可以使用一种氮源，也可以组合使用两种或更多种的氮源。

磷酸盐源的具体实例可以包括例如磷酸盐如磷酸二氢钾和磷酸氢二钾，以及磷酸聚合物如焦磷酸。作为磷酸盐源，可以使用一种磷酸盐源，或者可以组合使用两种或更多种磷酸盐源。

硫源的具体实例可以包括例如无机硫化合物如硫酸盐，硫代硫酸盐和亚硫酸盐，以及含硫氨基酸如半胱氨酸，胱氨酸和谷胱甘肽。作为硫源，可以使用一种硫源，或者可以组合使用两种或更多种硫源。

其他各种有机和无机组分的具体实例可以包括例如无机盐如氯化钠和氯化钾；微量金属如铁，锰，镁和钙；维生素如维生素B1，维生素B2，维生素B6，烟酸，烟酰胺和维生素B12；氨基酸；核酸；和含有这些的有机成分如蛋白胨，酪蛋白氨基酸，酵母提取物和大豆蛋白分解产物。作为其他各种有机和无机组分，可以使用一种组分，或者可以组合使用两种或更多种组分。

此外，当使用需要营养物如氨基酸进行生长的营养缺陷型突变株时，优选将此类所需营养物补充到培养基中。此外，可以将用于生产目标物质的组件补充到培养基。此类组分的具体实例可以包括例如甲基供体例如SAM及其前体例如甲硫氨酸。

培养条件没有特别限制，只要微生物可以增殖并且产生目标物质即可。培养可以用例如通常用于培养微生物诸如细菌和酵母的条件进行。培养条件可以根据诸如选择的微生物的种类等各种条件适当确定。

培养可以通过使用液体培养基来进行。在培养时，例如，可以将在诸如琼脂培养基等固体培养基上培养的微生物直接接种到液体培养基中，或者将在液体培养基中作为种子培养物培养的微生物接种到液体培养基中进行主要培养。也就是说，培养可以作为种子培养和主要培养分开进行。在此类情况下，种子培养和主要培养的培养条件可以是相同的或者可以是不相同。至少在主要培养过程中产生目标物质是足够的。培养开始时培养基中含有的微生物的量没有特别限制。例如，具有OD660为4-100的种子培养液可以在开始培养时以0.1-100质量％，或1-50质量％的量添加到用于主要培养的培养基中。

培养可以以分批培养，补料分批培养，连续培养或这些的组合进行。在培养开始时使用的培养基也可以称为“起始培养基”。在补料分批培养或连续培养中供应到培养系统(例如发酵罐)的培养基也可以称为“补料培养基”。为了在补料分批培养或者连续培养中向培养系统供应补料培养基也可以称为“补料”。此外，当作为种子培养和主要培养分开进行培养时，种子培养和主要培养的培养方案可以相同或可以不同。例如，种子培养和主要培养两者都可以作为分批培养进行。或者，例如，种子培养可以作为分批培养进行，并且主要培养可以以补料分批培养或连续培养进行。

各种组分诸如碳源可以存在于起始培养基，补料培养基或两者中。也就是说，各种组分诸如碳源可以在培养期间独立地或以任意组合的方式额外供给到培养基。这些组分可以供应一次或多次，或者可以连续供应。起始培养基中存在的组分的类型可以与补料培养基中存在的组分的类型相同或不同。此外，起始培养基中存在的组分的浓度可以与补料培养基中存在的组分的浓度相同或不同。此外，可以使用两种或更多种具有不同类型和/或不同浓度组分的补料培养基。例如，当间歇进行两次或更多次补料时，补料培养基中包含的组分的类型和/或浓度对于每次补料可以是相同的或者可以是不同的。

培养可以例如在需氧条件下进行。术语“需氧条件”可以指其中培养基中的溶解氧浓度为0.33ppm或更高，或1.5ppm或更高的条件。可以将氧浓度控制为例如饱和氧浓度的1-50％，或约5％。培养可以例如在通气或摇动下进行。培养基的pH值可以是例如3至10，或4.0至9.5。培养基的pH可以根据需要在培养过程中进行调整。培养基的pH可以通过使用各种碱性和酸性物质如氨气，氨水，碳酸钠，碳酸氢钠，碳酸钾，碳酸氢钾，碳酸镁，氢氧化钠，氢氧化钙和氢氧化镁来调节。培养温度可以是例如20至45℃，或25至37℃。培养时间可以是例如10至120小时。例如，可以继续培养直到培养基中存在的碳源被消耗，或者直到微生物的活性丧失。

通过在诸如上文所述的条件下培养微生物，在培养基中积累目标物质。

可以通过用于检测或鉴定化合物的已知方法来确认目标物质的产生。此类方法的实例可以包括例如HPLC，UPLC，LC/MS，GC/MS和NMR。这些方法可以独立使用，或者可以以适当的组合使用。这些方法也可以用于确定培养基中存在的各种组分的浓度。

生产的目标物质可以适当收集。也就是说，发酵方法可以进一步包括收集目标物质的步骤。此步骤也可以称为“收集步骤”。收集步骤可以是从培养肉汤，特别是从培养基中收集目标物质的步骤。目标物质可以通过用于分离和纯化化合物的已知方法收集。此类方法的实例可以包括例如离子交换树脂法，膜处理，沉淀，提取，蒸馏和结晶。具体地，目标物质也可以通过用有机溶剂如乙酸乙酯萃取或通过蒸汽蒸馏来收集。这些方法可以独立使用，或者可以以适当的组合使用。

此外，当目标物质沉积在培养基中时，它可以通过例如离心或过滤收集。在培养基中溶解的目标物质结晶后，可以将沉积在培养基中的目标物质和溶解在培养基中的目标物质一起分离。

除了目标物质之外，收集的目标物质可以包含例如微生物细胞，培养基组分，水分和微生物的副产物代谢物。收集的目标物质的纯度可以是例如30％(w/w)或更高，50％(w/w)或更高，70％(w/w)或更高，80％(w/w)或更高，90％(w/w)或更高，或95％(w/w)或更高。

<2-2>生物转化方法

目标物质也可以通过例如使用如本文中所述的微生物的生物转化来产生。也就是说，如本文中所述的方法的另一个实施方案可以是使用微生物通过生物转化来生产目标物质的方法。该实施方案也可以称为“生物转化方法”。此外，使用微生物通过生物转化来生产目标物质的步骤也可以称为“生物转化步骤”。

具体而言，在生物转化方法中，目标物质可以从目标物质的前体产生。更具体而言，在生物转化方法中，通过使用微生物，可以通过将目标物质的前体转化为目标物质来生产目标物质。也就是说，生物转化步骤可以是通过使用微生物将目标物质的前体转化为目标物质的步骤。

目标物质的前体也可以简称为“前体”。前体的实例可以包括下述物质，该物质向目标物质的转化包括由特定的CAR催化的步骤。前体的具体实例可以包括目标物质的生物合成途径的中间体，如就目标物质生物合成酶的描述而言所述的那些，条件是中间体向目标物质的转化提供由特定的CAR催化的步骤。前体的更具体实例可以包括例如原儿茶酸，香草酸，苯甲酸，L-苯丙氨酸和肉桂酸。原儿茶酸和香草酸各自可以用作生产例如香草醛的前体。苯甲酸可以用作生产例如苯甲醛的前体。L-苯丙氨酸和肉桂酸各自可以用作生产例如肉桂醛的前体。作为前体，可以使用一种前体，或者可以组合使用两种或更多种前体。在前体是可以形成盐的化合物的情况下，前体可以作为游离化合物，其盐或其混合物使用。也就是说，术语“前体”可以指游离形式的前体，其盐或其混合物，除非另有说明。盐的实例可以包括例如硫酸盐，盐酸盐，碳酸盐，铵盐，钠盐和钾盐。作为前体的盐，可以使用一种盐，或者可以组合使用两种或更多种盐。

作为前体，可以使用商业产品，或者可以使用适当制备和获得的产品。也就是说，生物转化方法可以进一步包括生产前体的步骤。生产前体的方法没有特别限定，例如可以使用已知的方法。前体可以通过例如化学合成法，酶法，生物转化法，发酵法，提取方法或它们的组合来生产。也就是说，例如，目标物质的前体可以使用酶(也称为“前体生物合成酶”)从其另外的前体产生，所述酶催化此类另外的前体转化成目标物质的前体。此外，例如，通过使用具有前体生产能力的微生物，可以从碳源或此类另外的前体生产目标物质的前体。术语“具有前体生产能力的微生物”可以指能够从碳源或其另外的前体生产目标物质的前体的微生物。例如，根据酶法或生物转化法生产原儿茶酸的方法的实例可以包括使用恶臭假单胞菌(Pseudomonas putida)KS-0180(日本专利公开(Kokai)No.7-75589)将对甲酚转化为原儿茶酸的方法，使用NADH依赖性对羟基苯甲酸羟化酶将对羟基苯甲酸转化为原儿茶酸的方法(日本专利公开(Kokai)No.5-244941)，通过在含有对苯二甲酸的培养基中培养含有参与从对苯二甲酸生成原儿茶酸的反应的基因的转化体来生产原儿茶酸的方法(日本专利公开(Kokai)No.2007-104942)，以及通过使用具有原儿茶酸生产能力并且具有原儿茶酸5-氧化酶活性降低或该活性缺乏的微生物从其前体生产原儿茶酸的方法(日本专利公开(Kokai)No.2010-207094)。此外，通过发酵生产原儿茶酸的方法的实例可以包括通过使用短杆菌属细菌和乙酸作为碳源生产原儿茶酸的方法(日本专利公开(Kokai)No.50-89592)，通过使用引入有编码3-二氢莽草酸脱氢酶的基因的埃希氏菌属或克雷伯氏菌属细菌和葡萄糖作为碳源生产原儿茶酸的方法(美国专利号5,272,073)。此外，香草酸可以通过根据使用OMT的酶法或使用具有OMT的微生物的生物转化法使用原儿茶酸作为前体(J.Am.CHm.Soc.,1998,Vol.120)或根据使用假单胞菌属种AV10的生物转化方法使用阿魏酸作为前体(J.App.Microbiol.,2013,Vol.116,p903-910)生产。生产的前体可以原样或者根据需要进行适当的处理如浓缩，稀释，干燥，溶解，分馏，提取和纯化后用于生物转化方法。也就是说，作为前体，例如可以使用纯化至所需程度的纯化产物，或者可以使用含有前体的材料。含有前体的材料没有特别限制，只要微生物可以使用前体即可。含有前体的材料的具体实例可以包括通过培养具有前体生产能力的微生物获得的培养肉汤，与培养肉汤分离的培养上清液及其加工产物如其浓缩产物(如浓缩液体)和其干燥产物。

在一个实施方案中，生物转化步骤可以通过例如培养如本文中所述的微生物来进行。该实施方案也可以称为“生物转化方法的第一实施方案”。也就是说，生物转化步骤可以是例如在含有目标物质的前体的培养基中培养微生物以将该前体转化为目标物质的步骤。生物转化步骤具体可以是在含有目标物质的前体的培养基中培养微生物以在培养基中产生并积累目标物质的步骤。

要使用的培养基没有特别限制，只要培养基含有目标物质的前体，并且微生物可以在其中增殖并产生目标物质。培养条件没有特别限制，只要微生物可以增殖并且产生目标物质即可。关于发酵方法所提及的培养的描述，诸如关于培养基和培养条件的描述可以在必要修改后适用于生物转化方法的第一实施方案中的培养，只是培养基在第一实施方案中含有前体。

前体可以在整个培养期内存在在培养基中，或者可以在培养的部分时期期间存在在培养基中。也就是说，短语“在含有前体的培养基中培养微生物”并不一定意味着培养基中在整个培养期内都存在前体。例如，从培养开始起培养基中可以存在或可以不存在前体。当在培养开始时培养基中不存在前体时，在培养开始后将前体添加到培养基。添加的时机可以根据诸如培养期的长度等各种条件适当确定。例如，在微生物充分生长后，可以将前体添加到培养基中。此外，在任何情况下，可以根据需要将前体添加到培养基。例如，可以与生成目标物质时发生的前体的减少或消减成比例地对培养基添加前体。用于将前体提供给培养基的方法没有特别限制。例如，可以通过将含有前体的补料培养基补料到培养基来将前体供应给培养基。此外，例如，如本文中所述的微生物和具有前体生产能力的微生物可以共培养以允许具有前体生产能力的微生物在培养基中产生前体，从而将前体供应给培养基。这些供应手段可以独立使用，或者可以以适当的组合使用。前体在培养基中的浓度没有特别限制，只要微生物可以使用该前体作为目标物质的原料即可。前体在培养基中的浓度例如可以为0.1g/L或更高，1g/L或更高，2g/L或更高，5g/L或更高，10g/L或更高，或者15g/L或更高，或者可以是200g/L或更低，100g/L或更低，50g/L或更低，或者20g/L或更低，或者可以在由其组合限定的范围内(按游离化合物的重量计)。在整个培养期内，前体可以以或不以上文例示的范围内的浓度存在于培养基中。例如，在培养开始时前体可以以上文例示的范围内的浓度存在于培养基中，或者可以将其添加到培养基，从而在培养开始后获得上文例示的范围。在培养分别作为种子培养和主要培养进行的情况下，至少在主要培养期间产生目标物质是足够的。因此，足够的是至少在主要培养期间，即在主要培养的整个时期内或在主要培养的部分时期期间，培养基中存在前体，并且也就是说，在种子培养期间培养基中可以存在或可以不存在前体。在此类情况下，关于培养的术语，如“培养期(培养时期)”和“培养开始”可以理解为与主要培养有关的术语。

在另一个实施方案中，生物转化步骤也可以通过例如使用如本文中所述的微生物的细胞来进行。该实施方案也可以称为“生物转化方法的第二实施方案”。也就是说，生物转化步骤可以是例如通过使用微生物的细胞将反应混合物中的目标物质的前体转化成目标物质的步骤。生物转化步骤具体可以是使微生物的细胞作用于反应混合物中的目标物质的前体以在反应混合物中生成并积累目标物质的步骤。通过使用此类细胞进行的生物转化步骤也可以称为“转化反应”。

微生物的细胞可以通过培养微生物来获得。用于获得细胞的培养方法没有特别限制，只要微生物可以增殖即可。在用于获得细胞的培养时，前体可以存在或可以不存在于培养基中。此外，在用于获得细胞的培养时，培养基中可以产生或可以不产生目标物质。关于发酵方法中所述的培养的描述，例如关于培养基和培养条件的描述可以在必要修改后应用于获得用于生物转化方法的第二实施方案的细胞的培养。

细胞可以在存在于培养肉汤(具体是培养基)中时，或者在从培养肉汤(具体是培养基)中收集后用于转化反应。也可以根据需要在进行处理后将细胞用于转化反应。也就是说，细胞的实例可以包括含有细胞的培养肉汤，从培养肉汤中收集的细胞或其加工产物。换言之，细胞的实例可以包括存在于微生物的培养肉汤中的细胞，从培养肉汤中收集的细胞和存在于其加工产物中的细胞。加工产物的实例可以包括通过对细胞，诸如含有细胞的培养肉汤或从培养肉汤中收集的细胞进行处理而获得的产物。这些形式的细胞可以独立使用，或者可以以适当的组合使用。

从培养基中收集细胞的方法没有特别限制，例如可以使用已知的方法。此类方法的实例可以包括例如自发沉淀，离心和过滤。也可以使用絮凝剂。这些方法可以独立使用，或者可以以适当的组合使用。收集的细胞可以根据需要通过使用合适的培养基进行清洗。收集的细胞可以根据需要通过使用适当的培养基重悬浮。可用于清洗或悬浮细胞的培养基的实例可以包括例如水性介质(水性溶剂)，如水和缓冲水溶液。

细胞处理的实例可以包括例如稀释，冷凝，在载体如丙烯酰胺和角叉菜胶上固定化，冷冻和融化处理，以及增加细胞膜通透性的处理。例如，可以通过使用表面活性剂或有机溶剂来增加细胞膜的通透性。这些处理可以独立使用，或者可以以适当的组合使用。

用于转化反应的细胞没有特别限制，只要细胞具有目标物质生产能力。优选细胞保持其代谢活性。表述“细胞保持其代谢活性”可以表示细胞具有利用碳源产生或再生产生目标物质所需物质的能力。此类物质的实例可以包括例如ATP，电子供体如NADH和NADPH，以及甲基供体如SAM。细胞可以具有或可以不具有增殖能力。

转化反应可以在适当的反应混合物中进行。具体而言，转化反应可以通过使细胞和前体共存于适当的反应混合物中来进行。转化反应可以通过分批方法进行或可以通过柱方法进行。在分批法的情况下，转化反应可以通过例如将微生物的细胞和前体混合在反应容器中所含的反应混合物中来进行。转换反应可以静态进行，或者可以在搅拌或摇动反应混合物的情况下进行。在柱方法的情况下，转化反应可以通过例如使含有前体的反应混合物通过填充有固定化细胞的柱来进行。反应混合物的实例可以包括基于水性介质(水性溶剂)如水和水性缓冲液的那些。

除了前体之外，反应混合物可以根据需要含有除前体之外的组分。除前体以外的成分的实例可以包括ATP，电子供体诸如NADH，NADPH，甲基供体诸如SAM，金属离子，缓冲剂，表面活性剂，有机溶剂，碳源，磷酸盐源，和其它各种培养基成分。也就是说，例如，含有前体的培养基也可以用作反应混合物。也就是说，关于生物转化方法的第一实施方案中提及的培养基的描述也可以在必要修改后适用于生物转化方法的第二实施方案中的反应混合物。包含在反应混合物中的组分的类型和浓度可以根据各种条件来确定，例如前体的类型和细胞的形式。

转化反应的条件，诸如溶解氧浓度，反应混合物的pH，反应温度，反应时间，各种成分的浓度等没有特别限制，只要产生目标物质。转化反应可以用例如通常用于利用微生物细胞诸如静止细胞进行物质转换的条件来进行。转化反应的条件可以根据各种条件来确定，例如微生物的类型。转化反应可以例如在需氧条件下进行。术语“需氧条件”可以指其中反应混合物中的溶解氧浓度为0.33ppm或更高，或1.5ppm或更高的条件。氧浓度可以控制为例如饱和氧浓度的1-50％，或约5％。反应混合物的pH值通常可以是例如6.0至10.0，或6.5至9.0。反应温度通常可以是例如15至50℃，或15至45℃，或20至40℃。反应时间可以是例如5分钟至200小时。在柱方法的情况下，反应混合物的加载速率可以是例如使得反应时间落入上述例示的反应时间范围内的速率。此外，转化反应也可以在例如培养条件下进行，例如通常用于培养微生物诸如细菌和真菌的条件。在转化反应期间，细胞可以增殖或可以不增殖。也就是说，关于生物转化方法的第一实施方案中所述的培养条件的描述也可以在必要修改后适用于生物转化方法的第二实施方案中转化反应的条件，只是细胞可以或不可以在第二实施方案中增殖。在此类情况下，用于获得细胞的培养条件和转化反应的条件可以相同或不同。前体在反应混合物中的浓度例如可以为0.1g/L或更高，1g/L或更高，2g/L或更高，5g/L或更高，10g/L或更高，或者15g/L或更高，或者可以是200g/L或更低，100g/L或更低，50g/L或更低，或者20g/L或更低，或者可以在由其组合限定的范围内(按游离化合物的重量计)。例如，反应混合物中细胞的密度可以是1或更高，或者可以是300或更低，或者可以在其组合限定的范围内(按600nm的光密度(OD)计)。

在转化反应期间，可以将细胞，前体和其他组分独立地或以其任何任意组合额外提供给反应混合物。例如，可以与伴随目标物质产生的前体的减少或消耗成比例将前体额外地提供给反应混合物。这些组分可以供应一次或多次，或者可以连续供应。

用于向反应混合物供应诸如前体的各种组分的方法没有特别限制。这些组分各自可以通过例如直接将它们加入到反应混合物中而供应到反应混合物中。此外，例如，可以将如本文中所述的微生物和具有前体生产能力的微生物共培养，以使具有前体生产能力的微生物在反应混合物中产生前体，从而将前体提供给反应混合物。此外，例如，组分如ATP，电子给体和甲基供体可以各自在反应混合物中产生或再生，可以在微生物的细胞中产生或再生，或者可以通过不同细胞之间的偶联反应产生或再生。例如，当微生物的细胞保持其代谢活性时，它们可以通过使用碳源在它们内部产生或再生诸如ATP，电子供体和甲基供体等组分。另外，ATP生成或再生方法的实例可以包括例如通过使用棒状杆菌属细菌从碳源提供ATP的方法(Hori,H.et al.,Appl.Microbiol.Biotechnol.,48(6):693-698(1997))，通过使用酵母细胞和葡萄糖再生ATP的方法(Yamamoto,S et al.,Biosci.Biotechnol.Biochem.,69(4):784-789(2005))，使用磷酸烯醇丙酮酸和丙酮酸激酶再生ATP的方法(C.Aug'e and Ch.Gautheron,Tetrahedron Lett.,29:789-790(1988))，以及通过使用多磷酸和多磷酸激酶再生ATP的方法(Murata,K.et al.,Agric.Biol.Chem.,52(6):1471-1477(1988))。

此外，反应条件可以从转化反应的开始至结束是恒定的，或者它们可以在转化反应期间改变。表述“反应条件在转化反应期间改变”不仅可以包括反应条件在时间上改变的情况，而且还可以包括反应条件在空间上改变的情况。表述“反应条件在空间上改变”可以表示例如当通过柱法进行转化反应时，反应温度和孔密度等反应条件随流动中的位置而不同。

通过进行如上所述的生物转化步骤，获得培养肉汤(或培养基)或含有目标物质的反应混合物。目标物质的产生和目标物质的收集的确认可以以与上述发酵方法相同的方式进行。也就是说，生物转化方法可以进一步包括收集步骤，例如从培养肉汤(或培养基)或反应混合物中收集目标物质的步骤。除了目标物质之外，收集的目标物质可以包含例如微生物细胞，培养基组分，反应混合物组分，水分和微生物的副产物代谢物。收集的目标物质的纯度可以是，例如，30％(w/w)或更高，50％(w/w)或更高，70％(w/w)或更高，80％(w/w)或更高，90％(w/w)或更高，或95％(w/w)或更高。

实施例

下文，将参考以下非限制性实施例更具体地解释本发明。

在本实施例中，从作为亲本菌株的谷氨酸棒杆菌2256菌株(ATCC 13869)构建含有各种CAR基因的菌株，并且使用这些构建的菌株生产香草醛。

<1>香草酸脱甲基酶基因缺陷的菌株(FKS0165菌株)的构建

已经报道了在棒状杆菌细菌中，香草醛按香草醛->香草酸->原儿茶酸的顺序代谢，并利用(Current Microbiology,2005,Vol.51,pp.59-65)。从香草酸到原儿茶酸的转化反应由香草酸脱甲基酶催化。vanA基因和vanB基因分别编码香草酸脱甲基酶的亚基A和亚基B。vanK基因编码香草酸摄取系统，并与vanAB基因一起构成vanABK操纵子(M.T.Chaudhry,et al.,Microbiology,2007,153:857-865)。因此，首先通过缺失vanABK操纵子从谷氨酸棒杆菌2256菌株构建不能利用目标物质诸如香草醛和香草醛的菌株(FKS0165菌株)。程序如下所示。

<1-1>用于缺失vanABK基因的质粒pBS4SΔvanABK56的构建

通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板，和SEQ ID NO:51和52的合成DNA作为引物进行PCR，以获得含有vanA基因的N端侧编码区的PCR产物。分别通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板和SEQ ID NO:53和54的合成DNA作为引物进行PCR，以获得含有vanK基因的C端侧编码区的PCR产物。SEQ ID NO:52和53的序列彼此部分互补。然后，以近似等摩尔量混合含有vanA基因的N端侧编码区的PCR产物和含有vanK基因的C端侧编码区的PCR产物，并通过使用In Fusion HD克隆试剂盒(Clontech)将其插入已经用BamHI和PstI处理的pBS4S载体(WO2007/046389)中。利用该DNA，转化大肠杆菌JM109的感受态细胞(Takara Bio)，并且将细胞应用于含有100μM IPTG，40μg/mL X-Gal和40μg/mL卡那霉素的LB培养基，并培养过夜。然后，挑取出现的白色菌落，并且分离成单菌落以获得转化体。从所获得的转化体中提取质粒，并将插入了靶PCR产物的质粒命名为pBS4SΔvanABK56。

<1-2>FKS0165菌株的构建

上面获得的pBS4SΔvanABK56不含能使质粒在棒状杆菌细菌细胞中自主复制的区域。因此，若用该质粒转化棒状杆菌细菌，则通过同源重组将该质粒掺入基因组中的菌株作为转化体出现，尽管它以非常低的频率发生。因此，通过电脉冲法将pBS4SΔvanABK56导入谷氨酸棒杆菌2256菌株。将细胞应用于含有25μg/mL卡那霉素的CM-Dex琼脂培养基(5g/L葡萄糖、10g/L聚胨、10g/L酵母提取物、1g/L KH₂PO₄、0.4g/L MgSO₄-7H₂O、0.01g/L FeSO₄-7H₂O、0.01g/L MnSO₄-7H₂O、3g/L尿素、1.2g/L大豆水解物、10μg/L生物素、15g/L琼脂，用NaOH调节到pH 7.5)，并在31.5℃培养。通过PCR确认生长的菌株是一次重组菌株，其中通过同源重组将pBS4SΔvanABK56掺入基因组中。此一次重组的菌株具有野生型vanABK基因和缺陷型vanABK基因两者。

将一次重组菌株在CM-Dex液体培养基(与CM-Dex琼脂培养基具有相同的组成，只是它不含琼脂)中培养过夜，并将该培养肉汤应用于S10琼脂培养基(100g/L蔗糖，10g/L聚胨，10g/L酵母提取物，1g/L KH₂PO₄,0.4g/L MgSO₄-7H₂O,0.01g/L FeSO₄-7H₂O,0.01g/LMnSO₄-4-5H₂O，3g/L尿素，1.2g/L大豆蛋白水解物溶液，10μg/L生物素，20μg/L琼脂，用NaOH调节至pH7.5，并在120℃高压灭菌20分钟)，并在31.5℃培养。在出现的菌落中，在CM-Dex琼脂培养基上纯化显示卡那霉素易感性的菌株。通过从纯化的菌株中制备基因组DNA，并使用它和SEQ ID NO:55和56的合成DNA作为引物进行PCR，确认了vanABK基因的缺失，并将该菌株命名为FKS0165菌株。

<2>醇脱氢酶同源基因缺陷菌株(FKFC14菌株)的构建

随后，通过使用谷氨酸棒杆菌菌株FKS0165作为亲本株，通过以下程序构建菌株FKFC14，其是醇脱氢酶同源基因(即NCgl0324基因(adhC)、NCgl0313基因(adhE)、和NCgl2709gene(adhA))缺陷的。

<2-1>FKFC5菌株(FKS0165ΔNCgl0324菌株)的构建

<2-1-1>用于缺失NCgl0324基因的质粒pBS4SΔ2256adhC的构建

通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板，和SEQ ID NO:57和58的合成DNA作为引物进行PCR，以获得含有NCgl0324基因的N端侧编码区的PCR产物。分别通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板，和SEQ ID NO:59和60的合成DNA作为引物进行PCR，以获得含有NCgl0324基因的C端侧编码区的PCR产物。SEQ ID NO:58和59的序列彼此部分互补。然后，将约等摩尔量的含有NCgl0324基因的N端侧编码区的PCR产物和含有NCgl0324基因的C端侧编码区的PCR产物混合，并通过使用In Fusion HD克隆试剂盒(Clontech)插入已经用BamHI和PstI处理的pBS4S载体(WO2007/046389)中。利用该DNA，转化大肠杆菌JM109的感受态细胞(Takara Bio)，并且将细胞应用于含有100μM IPTG，40μg/mL X-Gal和40μg/mL卡那霉素的LB培养基，并培养过夜。然后，挑取出现的白色菌落，分离成单菌落以获得转化体。从所获得的转化体中提取质粒，并将其中插入了靶PCR产物的质粒命名为pBS4SΔ2256adhC。

<2-1-2>FKFC5菌株(FKS0165ΔNCgl0324菌株)的构建

由于上述获得的pBS4SΔ2256adhC不含使质粒能够在棒状杆菌细菌细胞中自主复制的区域，若用该质粒转化棒状杆菌细菌，则通过同源重组将该质粒掺入基因组中的菌株作为转化体出现，尽管它以非常低的频率发生。因此，通过电脉冲法将pBS4SΔ2256adhC导入谷氨酸棒杆菌FKS0165菌株。将细胞应用于含有25μg/mL卡那霉素的CM-Dex琼脂培养基，并在31.5℃培养。通过PCR确认，生长的菌株是通过同源重组将pBS4SΔ2256adhC掺入基因组中的一次重组菌株。此一次重组菌株具有野生型NCgl0324基因和缺陷型NCgl0324基因两者。

将一次重组的菌株在CM-Dex液体培养基中培养过夜，将培养基应用到S10琼脂培养基，并在31.5℃进行培养。在出现的菌落中，在CM-Dex琼脂培养基上纯化显示卡那霉素易感性的菌株。从纯化的菌株制备基因组DNA，并用SEQ ID NO:61和62的合成DNA作为引物进行PCR以确认NCgl0324基因的缺失，并将该菌株命名为FKFC5菌株。

<2-2>FKFC11菌株(2256ΔvanABKΔNCgl0324ΔNCgl0313菌株)的构建

<2-2-1>用于缺失NCgl0313基因的质粒pBS4SΔ2256adhE的构建

通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板和SEQ ID NO:63和64的合成DNA作为引物进行PCR，以获得含有NCgl0313基因的N端侧编码区的PCR产物。分别通过使用谷氨酸棒杆菌2256菌株的基因组DNA为模板和SEQ ID NO:65和66的合成DNA为引物进行PCR，以获得含有NCgl0313基因的C端侧编码区的PCR产物。SEQ ID NO:64和65的序列彼此部分互补。然后，将约等摩尔量的含有NCgl0313基因的N端侧编码区的PCR产物和含有NCgl0313基因的C端侧编码区的PCR产物混合，并通过使用In Fusion HD克隆试剂盒(Clontech)将其插入用BamHI和PstI处理的pBS4S载体(WO2007/046389)中。利用该DNA，转化大肠杆菌JM109的感受态细胞(Takara Bio)，并且将细胞应用于含有100μM IPTG，40μg/mL X-Gal和40μg/mL卡那霉素的LB培养基，并培养过夜。然后，挑取出现的白色菌落，并且分离成单菌落以获得转化体。从获得的转化体中提取质粒，并将其中插入了靶PCR产物的质粒命名为pBS4SΔ2256adhE。

<2-2-2>FKFC11菌株(2256ΔvanABKΔNCgl0324ΔNCgl0313菌株)的构建

由于上述获得的pBS4SΔ2256adhE不含有使质粒能够在棒状杆菌细菌细胞中的自主复制的区域，若用该质粒转化棒状杆菌细菌，则通过同源重组将该质粒掺入基因组中的菌株作为转化体出现，尽管它在非常低的频率发生。因此，通过电脉冲方法将pBS4SΔ2256adhE导入谷氨酸棒杆菌FKFC5菌株。将细胞应用于含有25μg/mL卡那霉素的CM-Dex琼脂培养基，并在31.5℃下培养。通过PCR证实，生长的菌株是一次重组菌株，其中通过同源重组将pBS4SΔ2256adhE掺入基因组中。此一次重组菌株具有野生型NCgl0313基因和缺陷型NCgl0313基因两者。

将一次重组的菌株在CM-Dex液体培养基中培养过夜，将培养基应用到S10琼脂培养基上，并在31.5℃进行培养。在出现的菌落中，显示卡那霉素易感性的菌株在CM-Dex琼脂培养基上纯化。从纯化的菌株制备基因组DNA，并使用SEQ ID NO:67和68的合成DNA作为引物进行PCR以确认NCgl0313基因的缺失，并将该菌株命名为FKFC11菌株。

<2-3>FKFC14菌株(2256ΔvanABKΔNCgl0324ΔNCgl0313ΔNCgl2709菌株)的构建

<2-3-1>用于缺失NCgl2709基因的质粒pBS4SΔ2256adhA的构建

通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板和SEQ ID NO:69和70的合成DNA作为引物进行PCR以获得含有NCgl2709基因的N端侧编码区的PCR产物。分别通过使用谷氨酸棒杆菌2256菌株的基因组DNA为模板和SEQ ID NO:71和72的合成DNA作为引物进行PCR，以得到含有NCgl2709基因的C端侧编码区的PCR产物。SEQ ID NO:70和71的序列彼此部分互补。然后，将约等摩尔量的含有NCgl2709基因的N端侧编码区的PCR产物和含有NCgl2709基因的C端侧编码区的PCR产物混合，并通过使用In Fusion HD克隆试剂盒(Clontech)插入到用BamHI和PstI处理的pBS4S载体中。利用该DNA，转化大肠杆菌JM109的感受态细胞(Takara Bio)，并且将细胞应用于含有100μM IPTG，40μg/mL X-Gal和40μg/mL卡那霉素的LB培养基，并培养过夜。然后，挑取出现的白色菌落，并且分离成单菌落以获得转化体。从获得的转化体中提取质粒，并将其中插入了靶PCR产物的质粒命名为pBS4SΔ2256adhA。

<2-3-2>FKFC14菌株(2256ΔvanABKΔNCgl0324ΔNCgl0313ΔNCgl2709菌株)的构建

由于上文获得的pBS4SΔ2256adhA不含能够使质粒在棒状杆菌细菌细胞中自主复制的区域，若用该质粒转化棒状杆菌细菌，则通过同源重组将该质粒掺入基因组的菌株作为转化体出现，尽管它在非常低的频率发生。因此，通过电脉冲法将pBS4SΔ2256adhA导入谷氨酸棒杆菌FKFC11菌株。将细胞应用于含有25μg/mL卡那霉素的CM-Dex琼脂培养基，并在31.5℃培养。通过PCR确认，生长的菌株是通过同源重组将pBS4SΔ2256adhA掺入基因组中的一次重组菌株。该一次重组菌株具有野生型NCgl2709基因和缺陷型NCgl2709基因两者。

将一次重组的菌株在CM-Dex液体培养基中培养过夜，将培养基应用到S10琼脂培养基上，并在31.5℃进行培养。在出现的菌落中，显示卡那霉素易感性的菌株在CM-Dex琼脂培养基上纯化。从纯化的菌株制备基因组DNA，并用SEQ ID NO:73和74的合成DNA作为引物进行PCR以确认NCgl2709基因的缺失，并将该菌株命名为FKFC14菌株。

<3>香草醛生产菌株的构建

<3-1>用于共表达CAR和PPT基因的质粒的构建

经由以下程序构建用于共表达巴西诺卡菌的CAR基因(Nb_ACAR)和大肠杆菌的PPT基因(entD)的质粒pVK9::Ptuf*-Nb_ACAR-entD，用于共表达Gordonia effusa的CAR基因(Ge_ACAR)和大肠杆菌的PPT基因(entD)的质粒pVK9::Ptuf*-Ge_ACAR-entD，用于共表达马来西亚新鞘氨醇杆菌的CAR基因(Nm_ACAR)和大肠杆菌的PPT基因(entD)的质粒pVK9::Ptuf*-Nm_ACAR-entD和用于共表达Coccomyxa subellipsoidea C-169的CAR基因(Cs2_ACAR)和大肠杆菌的PPT基因(entD)的质粒pVK9::Ptuf*-Cs2_ACAR-entD。PPT催化磷酸泛酰巯基乙胺基基团对于CAR的添加，从而活化CAR。针对大肠杆菌的密码子选择对CAR基因进行密码子优化并使用。将这些基因克隆到pVK9载体(WO2007/046389)中。pVK9载体是用于棒状杆菌细菌和大肠杆菌的穿梭载体。

用BamHI和PstI处理pVK9载体，并且用包含人工操纵子的DNA片段插入以获得质粒pVK9::Ptuf*-Nb_ACAR-entD，所述人工操纵子由按此顺序的Tuf*启动子、SD序列、Nb_ACAR(经密码子优化)、SD序列和大肠杆菌entD基因组成。该质粒的含有插入的DNA片段的部分的核苷酸序列以SEQ ID NO:19显示，其中插入的DNA片段对应于位置16-4621。

用BamHI和PstI处理pVK9载体，并且用包含人工操纵子的DNA片段插入以获得质粒pVK9::Ptuf*-Ge_ACAR-entD，所述人工操纵子由按此顺序的Tuf*启动子、SD序列、Ge_ACAR(经密码子优化)、SD序列和大肠杆菌entD基因组成。该质粒的含有插入的DNA片段的部分的核苷酸序列以SEQ ID NO:20显示，其中插入的DNA片段对应于位置16-4517。此外，Ge_ACAR的核苷酸序列(经密码子优化)以SEQ ID NO:77显示。

用BamHI和PstI处理pVK9载体，并且用包含人工操纵子的DNA片段插入以获得质粒pVK9::Ptuf*-Nm_ACAR-entD，所述人工操纵子由按此顺序的Tuf*启动子、SD序列、Nm_ACAR(经密码子优化)、SD序列和大肠杆菌entD基因组成。该质粒的含有插入的DNA片段的部分的核苷酸序列以SEQ ID NO:80显示，其中插入的DNA片段对应于位置16-4528。此外，Nm_ACAR的核苷酸序列(经密码子优化)以SEQ ID NO:81显示。

用BamHI和PstI处理pVK9载体，并且用包含人工操纵子的DNA片段插入以获得质粒pVK9::Ptuf*-Cs2_ACAR-entD，所述人工操纵子由按此顺序的Tuf*启动子、SD序列、Cs2_ACAR(经密码子优化)、SD序列和大肠杆菌entD基因组成。该质粒的含有插入的DNA片段的部分的核苷酸序列以SEQ ID NO:84显示，其中插入的DNA片段对应于位置16-4702。此外，Cs2_ACAR的核苷酸序列(经密码子优化)以SEQ ID NO:85显示。

<3-2>用于表达vanK基因的质粒pVS7::Plac-vanK的构建

vanK基因编码香草酸摄取系统。因此，为了改善香草酸的摄取，经由以下程序构建用于表达谷氨酸棒杆菌2256菌株的vanK基因的质粒pVS7::Plac-vanK。

通过使用谷氨酸棒杆菌2256菌株的基因组DNA作为模板，和SEQ ID NO:75和76的合成DNA作为引物进行PCR以获得含有vanK基因的ORF和SD序列的PCR产物。然后，通过使用In Fusion HD克隆试剂盒(Clontech)将PCR产物插入用BamHI和PstI处理的pVS7载体(WO2013/069634)中。pVS7载体是棒状杆菌细菌和大肠杆菌的穿梭载体。用此DNA转化大肠杆菌JM109的感受态细胞(Takara Bio)，并且将细胞应用于含有100μM IPTG、40μg/mL X-Gal和50μg/mL壮观霉素的LB培养基，并且培养过夜。然后，挑出出现的白色菌落，并且分成单菌落以获得转化体。从获得的转化体提取质粒，并且插入有靶PCR产物的质粒命名为pVS7::Plac-vanK。在此质粒中，从源自pVS7载体的lac启动子表达克隆的vanK基因。

<3-3>香草醛生产菌株的构建

通过电脉冲方法将质粒pVK9::Ptuf*-Nb_ACAR-entD,pVK9::Ptuf*-Ge_ACAR-entD、pVK9::Ptuf*-Nm_ACAR-entD或pVK9::Ptuf*-Cs2_ACAR-entD以及质粒pVS7::Plac-vanK引入谷氨酸棒杆菌FKFC14菌株。将细胞应用于含有25μg/mL卡那霉素和50μg/mL壮观霉素的CM-Dex SGFC琼脂培养基(2.5g/L葡萄糖、2.5g/L果糖、10g/L聚胨、10g/L酵母提取物、1g/L KH₂PO₄、0.4g/L MgSO₄-7H₂O、0.01g/L FeSO₄-7H₂O、0.01g/L MnSO₄-7H₂O、2g/L琥珀酸二钠六水合物、4g/L葡萄糖酸钠、3g/L尿素、1.2g/L大豆水解物、10μg/L生物素、15g/L琼脂，用NaOH调节至pH 7.5)，并且于31.5℃培养。在相同的琼脂培养基上纯化生长的菌株，并且分别命名为FKFC14/pVK9::Ptuf*-Nb_ACAR-entD pVS7-vanK、FKFC14/pVK9::Ptuf*-Ge_ACAR-entD pVS7-vanK、FKFC14/pVK9::Ptuf*-Nm_ACAR-entD pVS7-vanK和FKFC14/pVK9::Ptuf*-Cs2_ACAR-entD pVS7-vanK。将这些菌株各自接种到试管中含有的4mL CM-Dex SGFC培养基(与CM-Dex SGFC琼脂培养基具有相同的组成，只是它不含琼脂)中，并且在摇动的情况下于31.5℃培养约16小时。将获得的培养肉汤的0.9mL等分试样与0.6mL 50％甘油水溶液混合以获得甘油储液，并且于-80℃贮存。

<4>比较谷氨酸棒杆菌香草醛生产菌株的香草醛生产和原儿茶醛生产

将构建的香草醛生产菌株的每个甘油储液的20μL等分试样应用于CM-Dex SGFC琼脂培养基，并且于31.5℃培养20小时作为预培养物。在无菌生理盐水中悬浮获得的细胞。测量细胞悬浮液的光密度(OD)，并且用生理盐水稀释细胞悬浮液以获得600nm处的OD为83。将稀释的细胞悬浮液的1.5mL等分试样接种到试管中含有的3.5mL含有25μg/mL卡那霉素和50μg/mL壮观霉素的香草醛生产培养基(42.9g/L香草酸、85.7g/L葡萄糖、10g/L聚胨、10g/L酵母提取物、1g/L KH₂PO₄、0.4g/L MgSO₄-7H₂O、0.01g/L FeSO₄-7H₂O、0.01g/L MnSO₄-7H₂O、3g/L尿素、1.2g/L大豆水解物、10μg/L生物素，用KOH调节到pH 7.4，然后与8.6g/L CaCO₃(用180℃热空气灭菌3小时)混合)，或者含有25μg/mL卡那霉素和50μg/mL壮观霉素的原儿茶醛生产培养基(42.9g/L原儿茶酸、85.7g/L葡萄糖、10g/L聚胨、10g/L酵母提取物、1g/L ofKH₂PO₄、0.4g/L MgSO₄-7H₂O、0.01g/L FeSO₄-7H₂O、0.01g/L MnSO₄-7H₂O、3g/L尿素、1.2g/L大豆水解物、10μg/L生物素，用KOH调节到pH 7.4，然后与8.6g/L CaCO₃(用180℃热空气灭菌3小时)混合)，并且在摇动的情况下于30℃培养21小时。

在培养开始和完成时，用Biotech分析仪AS-310(Sakura SI)分析培养基中葡萄糖的浓度。还通过使用超高效液相层析NEXERA X2系统(SHIMADZU)用以下条件分析培养基中的香草酸、香草醛、原儿茶酸和原儿茶醛的浓度。

UPLC分析的条件

柱：KINETEX 2.6μm XB-C18,150x 30mm(Phenomenex)

炉温度：40℃

流动相(A):0.1％三氟乙酸

流动相(B):0.1％三氟乙酸/80％乙腈

梯度程序(时间,A(％),B(％)):(0,90,10)->(3,80,20)

流速:1.5ml/min

表1-3中显示了结果。

对FKFC14/pVK9::Ptuf*-Ge_ACAR-entD pVS7-vanK菌株观察到的V/P比率，即香草醛的生产量相对于原儿茶醛的生产量的比率，是对FKFC14/pVK9::Ptuf*-Nb_ACAR-entDpVS7-vanK菌株观察到的V/P比率的约1.4倍(表1)。因此，得出结论Ge_ACAR可用于生产香草醛。

FKFC14/pVK9::Ptuf*-Nb_ACAR-entD pVS7-vanK菌株以9.6g/L的浓度生产原儿茶醛，而FKFC14/pVK9::Ptuf*-Nm_ACAR-entD pVS7-vanK菌株不产生原儿茶醛(表2)。因此，得出结论Nm_ACAR可用于生产香草醛。

对FKFC14/pVK9::Ptuf*-Cs2_ACAR-entD pVS7-vanK菌株观察到的V/P比率，即香草醛的生产量相对于原儿茶醛的生产量的比率，是对FKFC14/pVK9::Ptuf*-Nb_ACAR-entDpVS7-vanK菌株观察到的V/P比率的约1.6倍(表3)。因此，得出结论Cs2_ACAR可用于生产香草醛。

[表1]

表1：由谷氨酸棒杆菌香草醛生产菌株的香草醛和原儿茶醛生产(平均值±S.E.)

缩写:

Glc，葡萄糖；

V.acid，香草酸；

P.acid，原儿茶酸；

P.ald.，原儿茶醛；

concn.，浓度；

V/P比率，香草醛的生产量相对于原儿茶醛的生产量的比率。

[表2]

表2:由谷氨酸棒杆菌香草醛生产菌株的香草醛和原儿茶醛生产(平均值±S.E.)

缩写:

Glc,葡萄糖；

V.acid，香草酸；

P.acid，原儿茶酸；

P.ald.，原儿茶醛；

concn.，浓度；

N.D.，未检测；

V/P比率，香草醛的生产量相对于原儿茶醛的生产量的比率。

[表3]

表3：由谷氨酸棒杆菌香草醛生产菌株的香草醛和原儿茶醛生产(平均值±S.E.)

缩写：

Glc，葡萄糖；

V.acid，香草酸；

P.acid,原儿茶酸；

P.ald.,原儿茶醛；

concn.，浓度；

V/P比率，香草醛的生产量相对于原儿茶醛的生产量的比率。

<5>由谷氨酸棒杆菌香草醛生产菌株的香草醛生产和异香草醛生产的比较

将构建的香草醛生产菌株的每个甘油储液的20μL等分试样应用于CM-Dex SGFC琼脂培养基，并且于31.5℃培养20小时作为预培养物。在无菌生理盐水中悬浮获得的细胞。测量细胞悬浮液的光密度(OD)，并且用生理盐水稀释细胞悬浮液以获得600nm处的OD为83。将稀释的细胞悬浮液的1.5mL等分试样接种到试管中含有的3.5mL含有25μg/mL卡那霉素和50μg/mL壮观霉素的香草醛生产培养基(42.9g/L香草酸、85.7g/L葡萄糖、10g/L聚胨、10g/L酵母提取物、1g/L KH₂PO₄、0.4g/L MgSO₄-7H₂O、0.01g/L FeSO₄-7H₂O、0.01g/L MnSO₄-7H₂O、3g/L尿素、1.2g/L大豆水解物、10μg/L生物素，用KOH调节到pH 7.4，然后与8.6g/L CaCO₃(用180℃热空气灭菌3小时)混合)，或者含有25μg/mL卡那霉素和50μg/mL壮观霉素的异香草醛生产培养基(42.9g/L异香草酸、85.7g/L葡萄糖、10g/L聚胨、10g/L酵母提取物、1g/L ofKH₂PO₄、0.4g/L MgSO₄-7H₂O、0.01g/L FeSO₄-7H₂O、0.01g/L MnSO₄-7H₂O、3g/L尿素、1.2g/L大豆水解物、10μg/L生物素，用KOH调节到pH 7.4，然后与8.6g/L CaCO₃(用180℃热空气灭菌3小时)混合)，并且在摇动的情况下于30℃培养21小时。

在培养开始和完成时，用Biotech分析仪AS-310(Sakura SI)分析培养基中葡萄糖的浓度。还通过使用超高效液相层析NEXERA X2系统(SHIMADZU)用以下条件分析培养基中的香草酸、香草醛、异香草酸和异香草醛的浓度。UPLC分析的条件

柱：KINETEX 2.6μm XB-C18,150x 30mm(Phenomenex)

炉温:40℃

流动相(A):0.1％三氟乙酸

流动相(B):0.1％三氟乙酸/80％乙腈

梯度程序(时间,A(％),B(％)):(0,90,10)->(3,80,20)

流速:1.5ml/min

表4-5中显示了结果。

对于FKFC14/pVK9::Ptuf*-Nm_ACAR-entD pVS7-vanK菌株没有观察到异香草醛生产，而FKFC14/pVK9::Ptuf*-Nb_ACAR-entD pVS7-vanK菌株以9.3g/L的浓度生产异香草醛(表4)。因此，得出结论Nm_ACAR可用于生产香草醛。

对FKFC14/pVK9::Ptuf*-Cs2_ACAR-entD pVS7-vanK菌株观察到的V/iV比率，即香草醛生产量相对于异香草醛生产量的比率是对FKFC14/pVK9::Ptuf*-Nb_ACAR-entD pVS7-vanK菌株观察到的V/iV比率的约1.2倍(表5)。因此，得出结论Cs2_ACAR可用于生产香草醛。

[表4]

表4：谷氨酸棒杆菌香草醛生产菌株的香草醛和异香草醛生产(平均值±S.E.)

缩写：

Glc，葡萄糖；

V.acid，香草酸；

iV.acid，异香草酸；

concn.，浓度；

N.D.，未检测；

V/iV比率，香草醛的生产量相对于异香草醛的生产量的比率。

[表5]

表5:谷氨酸棒杆菌香草醛生产菌株的香草醛和异香草醛生产(平均值±S.E.)

缩写：

Glc，葡萄糖；

V.acid，香草酸；

iV.acid，异香草酸；

concn.，浓度；

N.D.，未检测；

V/iV比率，香草醛的生产量相对于异香草醛的生产量的比率。

[工业适用性]

根据本发明，微生物用于生产目标物质，即醛，诸如香草醛的能力可以得到改善，并且可以有效生产目标物质。

<序列表的解释>

SEQ ID NOS:

1：大肠杆菌MG1655的aroG基因的核苷酸序列

2：大肠杆菌MG1655的AroG蛋白的氨基酸序列

3：大肠杆菌MG1655的aroB基因的核苷酸序列

4：大肠杆菌MG1655的AroB蛋白的氨基酸序列

5：大肠杆菌MG1655的aroD基因的核苷酸序列

6：大肠杆菌MG1655的AroD蛋白的氨基酸序列

7：苏云金芽孢杆菌BMB171的asbF基因的核苷酸序列

8：苏云金芽孢杆菌BMB171的AsbF蛋白的氨基酸序列

9：大肠杆菌MG1655的tyrR基因的核苷酸序列

10：大肠杆菌MG1655的TyrR蛋白的氨基酸序列

11-14：智人的OMT基因的转录物变体1至4的核苷酸序列

15：智人的OMT同种型(MB-COMT)的氨基酸序列

16：智人的OMT同种型(S-COMT)的氨基酸序列

17：Gordonia effusa的CAR基因的核苷酸序列

18：Gordonia effusa的CAR蛋白的氨基酸序列

19：含有巴西诺卡菌的CAR基因(经密码子优化)和大肠杆菌的entD基因的DNA片段的核苷酸序列

20：含有Gordonia effusa的CAR基因(经密码子优化)和大肠杆菌的entD基因的DNA片段的核苷酸序列

21：大肠杆菌MG1655的entD基因的核苷酸序列

22：大肠杆菌MG1655的EntD蛋白的氨基酸序列

23：谷氨酸棒杆菌ATCC 13032的PPT基因的核苷酸序列

24：谷氨酸棒杆菌ATCC 13032的PPT蛋白的氨基酸序列

25：谷氨酸棒杆菌2256(ATCC 13869)的vanK基因的核苷酸序列

26：谷氨酸棒杆菌2256(ATCC 13869)的VanK蛋白的氨基酸序列

27：谷氨酸棒杆菌2256(ATCC 13869)的pcaK基因的核苷酸序列

28：谷氨酸棒杆菌2256(ATCC 13869)的PcaK蛋白的氨基酸序列

29：谷氨酸棒杆菌2256(ATCC 13869)的vanA基因的核苷酸序列

30：谷氨酸棒杆菌2256(ATCC 13869)的VanA蛋白的氨基酸序列

31：谷氨酸棒杆菌2256(ATCC 13869)的vanB基因的核苷酸序列

32：谷氨酸棒杆菌2256(ATCC 13869)的VanB蛋白的氨基酸序列

33：谷氨酸棒杆菌ATCC 13032的pcaG基因的核苷酸序列

34：谷氨酸棒杆菌ATCC 13032的PcaG蛋白的氨基酸序列

35：谷氨酸棒杆菌ATCC 13032的pcaH基因的核苷酸序列

36：谷氨酸棒杆菌ATCC 13032的PcaH蛋白的氨基酸序列

37：大肠杆菌MG1655的yqhD基因的核苷酸序列

38：大肠杆菌MG1655的YqhD蛋白的氨基酸序列

39：谷氨酸棒杆菌2256(ATCC 13869)的NCgl0324基因的核苷酸序列

40：谷氨酸棒杆菌2256(ATCC 13869)的NCgl0324蛋白的氨基酸序列

41：谷氨酸棒杆菌2256(ATCC 13869)的NCgl0313基因的核苷酸序列

42：谷氨酸棒杆菌2256(ATCC 13869)的NCgl0313蛋白的氨基酸序列

43：谷氨酸棒杆菌2256(ATCC 13869)的NCgl2709基因的核苷酸序列

44：谷氨酸棒杆菌2256(ATCC 13869)的NCgl2709蛋白的氨基酸序列

45：谷氨酸棒杆菌ATCC 13032的NCgl0219基因的核苷酸序列

46：谷氨酸棒杆菌ATCC 13032的NCgl0219蛋白的氨基酸序列

47：谷氨酸棒杆菌ATCC 13032的NCgl2382基因的核苷酸序列

48：谷氨酸棒杆菌ATCC 13032的NCgl2382蛋白的氨基酸序列

49：大肠杆菌MG1655的aroE基因的核苷酸序列

50：大肠杆菌MG1655的AroE蛋白的氨基酸序列

51-76：引物

77：针对大肠杆菌的密码子选择密码子优化的Gordonia effusa的CAR基因的核苷酸序列

78：马来西亚新鞘氨醇杆菌的CAR基因的核苷酸序列

79：马来西亚新鞘氨醇杆菌的CAR蛋白的氨基酸序列

80：含有马来西亚新鞘氨醇杆菌的CAR基因(经密码子优化)和大肠杆菌的entD基因的DNA片段的核苷酸序列

81：针对大肠杆菌的密码子选择密码子优化的马来西亚新鞘氨醇杆菌的CAR基因的核苷酸序列

82：Coccomyxa subellipsoidea C-169的CAR基因(cDNA)的核苷酸序列

83：Coccomyxa subellipsoidea C-169的CAR蛋白的氨基酸序列

84：含有Coccomyxa subellipsoidea的CAR基因(经密码子优化)和大肠杆菌的entD基因的DNA片段的核苷酸序列

85：针对大肠杆菌的密码子选择密码子优化的Coccomyxa subellipsoidea的CAR基因的核苷酸序列

序列表

<110> 味之素株式会社

<120> 用于生产醛的方法

<130> D927-17403

<150> JP2016-211106

<151> 2016-10-27

<150> JP2016-211107

<151> 2016-10-27

<150> JP2016-211103

<151> 2016-10-27

<150> JP2017-022265

<151> 2017-02-09

<150> JP2017-022330

<151> 2017-02-09

<150> JP2017-022314

<151> 2017-02-09

<160> 85

<170> PatentIn version 3.5

<210> 1

<211> 1071

<212> DNA

<213> 大肠杆菌

<400> 1

atgcaaaaag acgcgctgaa taacgtacat attaccgacg aacaggtttt aatgactccg 60

gaacaactga aggccgcttt tccattgagc ctgcaacaag aagcccagat tgctgactcg 120

cgtaaaagca tttcagatat tatcgccggg cgcgatcctc gtctgctggt agtatgtggt 180

ccttgttcca ttcatgatcc ggaaactgct ctggaatatg ctcgtcgatt taaagccctt 240

gccgcagagg tcagcgatag cctctatctg gtaatgcgcg tctattttga aaaaccccgt 300

accactgtcg gctggaaagg gttaattaac gatccccata tggatggctc ttttgatgta 360

gaagccgggc tgcagatcgc gcgtaaattg ctgcttgagc tggtgaatat gggactgcca 420

ctggcgacgg aagcgttaga tccgaatagc ccgcaatacc tgggcgatct gtttagctgg 480

tcagcaattg gtgctcgtac aacggaatcg caaactcacc gtgaaatggc ctccgggctt 540

tccatgccgg ttggttttaa aaacggcacc gacggcagtc tggcaacagc aattaacgct 600

atgcgcgccg ccgcccagcc gcaccgtttt gttggcatta accaggcagg gcaggttgcg 660

ttgctacaaa ctcaggggaa tccggacggc catgtgatcc tgcgcggtgg taaagcgccg 720

aactatagcc ctgcggatgt tgcgcaatgt gaaaaagaga tggaacaggc gggactgcgc 780

ccgtctctga tggtagattg cagccacggt aattccaata aagattatcg ccgtcagcct 840

gcggtggcag aatccgtggt tgctcaaatc aaagatggca atcgctcaat tattggtctg 900

atgatcgaaa gtaatatcca cgagggcaat cagtcttccg agcaaccgcg cagtgaaatg 960

aaatacggtg tatccgtaac cgatgcctgc attagctggg aaatgaccga tgccttgctg 1020

cgtgaaattc atcaggatct gaacgggcag ctgacggctc gcgtggctta a 1071

<210> 2

<211> 356

<212> PRT

<213> 大肠杆菌

<400> 2

Met Gln Lys Asp Ala Leu Asn Asn Val His Ile Thr Asp Glu Gln Val

1 5 10 15

Leu Met Thr Pro Glu Gln Leu Lys Ala Ala Phe Pro Leu Ser Leu Gln

20 25 30

Gln Glu Ala Gln Ile Ala Asp Ser Arg Lys Ser Ile Ser Asp Ile Ile

35 40 45

Ala Gly Arg Asp Pro Arg Leu Leu Val Val Cys Gly Pro Cys Ser Ile

50 55 60

His Asp Pro Glu Thr Ala Leu Glu Tyr Ala Arg Arg Phe Lys Ala Leu

65 70 75 80

Ala Ala Glu Val Ser Asp Ser Leu Tyr Leu Val Met Arg Val Tyr Phe

85 90 95

Glu Lys Pro Arg Thr Thr Val Gly Trp Lys Gly Leu Ile Asn Asp Pro

100 105 110

His Met Asp Gly Ser Phe Asp Val Glu Ala Gly Leu Gln Ile Ala Arg

115 120 125

Lys Leu Leu Leu Glu Leu Val Asn Met Gly Leu Pro Leu Ala Thr Glu

130 135 140

Ala Leu Asp Pro Asn Ser Pro Gln Tyr Leu Gly Asp Leu Phe Ser Trp

145 150 155 160

Ser Ala Ile Gly Ala Arg Thr Thr Glu Ser Gln Thr His Arg Glu Met

165 170 175

Ala Ser Gly Leu Ser Met Pro Val Gly Phe Lys Asn Gly Thr Asp Gly

180 185 190

Ser Leu Ala Thr Ala Ile Asn Ala Met Arg Ala Ala Ala Gln Pro His

195 200 205

Arg Phe Val Gly Ile Asn Gln Ala Gly Gln Val Ala Leu Leu Gln Thr

210 215 220

Gln Gly Asn Pro Asp Gly His Val Ile Leu Arg Gly Gly Lys Ala Pro

225 230 235 240

Asn Tyr Ser Pro Ala Asp Val Ala Gln Cys Glu Lys Glu Met Glu Gln

245 250 255

Ala Gly Leu Arg Pro Ser Leu Met Val Asp Cys Ser His Gly Asn Ser

260 265 270

Asn Lys Asp Tyr Arg Arg Gln Pro Ala Val Ala Glu Ser Val Val Ala

275 280 285

Gln Ile Lys Asp Gly Asn Arg Ser Ile Ile Gly Leu Met Ile Glu Ser

290 295 300

Asn Ile His Glu Gly Asn Gln Ser Ser Glu Gln Pro Arg Ser Glu Met

305 310 315 320

Lys Tyr Gly Val Ser Val Thr Asp Ala Cys Ile Ser Trp Glu Met Thr

325 330 335

Asp Ala Leu Leu Arg Glu Ile His Gln Asp Leu Asn Gly Gln Leu Thr

340 345 350

Ala Arg Val Ala

355

<210> 3

<211> 1089

<212> DNA

<213> 大肠杆菌

<400> 3

atggagagga ttgtcgttac tctcggggaa cgtagttacc caattaccat cgcatctggt 60

ttgtttaatg aaccagcttc attcttaccg ctgaaatcgg gcgagcaggt catgttggtc 120

accaacgaaa ccctggctcc tctgtatctc gataaggtcc gcggcgtact tgaacaggcg 180

ggtgttaacg tcgatagcgt tatcctccct gacggcgagc agtataaaag cctggctgta 240

ctcgataccg tctttacggc gttgttacaa aaaccgcatg gtcgcgatac tacgctggtg 300

gcgcttggcg gcggcgtagt gggcgatctg accggcttcg cggcggcgag ttatcagcgc 360

ggtgtccgtt tcattcaagt cccgacgacg ttactgtcgc aggtcgattc ctccgttggc 420

ggcaaaactg cggtcaacca tcccctcggt aaaaacatga ttggcgcgtt ctaccaacct 480

gcttcagtgg tggtggatct cgactgtctg aaaacgcttc ccccgcgtga gttagcgtcg 540

gggctggcag aagtcatcaa atacggcatt attcttgacg gtgcgttttt taactggctg 600

gaagagaatc tggatgcgtt gttgcgtctg gacggtccgg caatggcgta ctgtattcgc 660

cgttgttgtg aactgaaggc agaagttgtc gccgccgacg agcgcgaaac cgggttacgt 720

gctttactga atctgggaca cacctttggt catgccattg aagctgaaat ggggtatggc 780

aattggttac atggtgaagc ggtcgctgcg ggtatggtga tggcggcgcg gacgtcggaa 840

cgtctcgggc agtttagttc tgccgaaacg cagcgtatta taaccctgct caagcgggct 900

gggttaccgg tcaatgggcc gcgcgaaatg tccgcgcagg cgtatttacc gcatatgctg 960

cgtgacaaga aagtccttgc gggagagatg cgcttaattc ttccgttggc aattggtaag 1020

agtgaagttc gcagcggcgt ttcgcacgag cttgttctta acgccattgc cgattgtcaa 1080

tcagcgtaa 1089

<210> 4

<211> 362

<212> PRT

<213> 大肠杆菌

<400> 4

Met Glu Arg Ile Val Val Thr Leu Gly Glu Arg Ser Tyr Pro Ile Thr

1 5 10 15

Ile Ala Ser Gly Leu Phe Asn Glu Pro Ala Ser Phe Leu Pro Leu Lys

20 25 30

Ser Gly Glu Gln Val Met Leu Val Thr Asn Glu Thr Leu Ala Pro Leu

35 40 45

Tyr Leu Asp Lys Val Arg Gly Val Leu Glu Gln Ala Gly Val Asn Val

50 55 60

Asp Ser Val Ile Leu Pro Asp Gly Glu Gln Tyr Lys Ser Leu Ala Val

65 70 75 80

Leu Asp Thr Val Phe Thr Ala Leu Leu Gln Lys Pro His Gly Arg Asp

85 90 95

Thr Thr Leu Val Ala Leu Gly Gly Gly Val Val Gly Asp Leu Thr Gly

100 105 110

Phe Ala Ala Ala Ser Tyr Gln Arg Gly Val Arg Phe Ile Gln Val Pro

115 120 125

Thr Thr Leu Leu Ser Gln Val Asp Ser Ser Val Gly Gly Lys Thr Ala

130 135 140

Val Asn His Pro Leu Gly Lys Asn Met Ile Gly Ala Phe Tyr Gln Pro

145 150 155 160

Ala Ser Val Val Val Asp Leu Asp Cys Leu Lys Thr Leu Pro Pro Arg

165 170 175

Glu Leu Ala Ser Gly Leu Ala Glu Val Ile Lys Tyr Gly Ile Ile Leu

180 185 190

Asp Gly Ala Phe Phe Asn Trp Leu Glu Glu Asn Leu Asp Ala Leu Leu

195 200 205

Arg Leu Asp Gly Pro Ala Met Ala Tyr Cys Ile Arg Arg Cys Cys Glu

210 215 220

Leu Lys Ala Glu Val Val Ala Ala Asp Glu Arg Glu Thr Gly Leu Arg

225 230 235 240

Ala Leu Leu Asn Leu Gly His Thr Phe Gly His Ala Ile Glu Ala Glu

245 250 255

Met Gly Tyr Gly Asn Trp Leu His Gly Glu Ala Val Ala Ala Gly Met

260 265 270

Val Met Ala Ala Arg Thr Ser Glu Arg Leu Gly Gln Phe Ser Ser Ala

275 280 285

Glu Thr Gln Arg Ile Ile Thr Leu Leu Lys Arg Ala Gly Leu Pro Val

290 295 300

Asn Gly Pro Arg Glu Met Ser Ala Gln Ala Tyr Leu Pro His Met Leu

305 310 315 320

Arg Asp Lys Lys Val Leu Ala Gly Glu Met Arg Leu Ile Leu Pro Leu

325 330 335

Ala Ile Gly Lys Ser Glu Val Arg Ser Gly Val Ser His Glu Leu Val

340 345 350

Leu Asn Ala Ile Ala Asp Cys Gln Ser Ala

355 360

<210> 5

<211> 759

<212> DNA

<213> 大肠杆菌

<400> 5

atgaaaaccg taactgtaaa agatctcgtc attggtacgg gcgcacctaa aatcatcgtc 60

tcgctgatgg cgaaagatat cgccagcgtg aaatccgaag ctctcgccta tcgtgaagcg 120

gactttgata ttctggaatg gcgtgtggac cactatgccg acctctccaa tgtggagtct 180

gtcatggcgg cagcaaaaat tctccgtgag accatgccag aaaaaccgct gctgtttacc 240

ttccgcagtg ccaaagaagg cggcgagcag gcgatttcca ccgaggctta tattgcactc 300

aatcgtgcag ccatcgacag cggcctggtt gatatgatcg atctggagtt atttaccggt 360

gatgatcagg ttaaagaaac cgtcgcctac gcccacgcgc atgatgtgaa agtagtcatg 420

tccaaccatg acttccataa aacgccggaa gccgaagaaa tcattgcccg tctgcgcaaa 480

atgcaatcct tcgacgccga tattcctaag attgcgctga tgccgcaaag taccagcgat 540

gtgctgacgt tgcttgccgc gaccctggag atgcaggagc agtatgccga tcgtccaatt 600

atcacgatgt cgatggcaaa aactggcgta atttctcgtc tggctggtga agtatttggc 660

tcggcggcaa cttttggtgc ggtaaaaaaa gcgtctgcgc cagggcaaat ctcggtaaat 720

gatttgcgca cggtattaac tattttacac caggcataa 759

<210> 6

<211> 252

<212> PRT

<213> 大肠杆菌

<400> 6

Met Lys Thr Val Thr Val Lys Asp Leu Val Ile Gly Thr Gly Ala Pro

1 5 10 15

Lys Ile Ile Val Ser Leu Met Ala Lys Asp Ile Ala Ser Val Lys Ser

20 25 30

Glu Ala Leu Ala Tyr Arg Glu Ala Asp Phe Asp Ile Leu Glu Trp Arg

35 40 45

Val Asp His Tyr Ala Asp Leu Ser Asn Val Glu Ser Val Met Ala Ala

50 55 60

Ala Lys Ile Leu Arg Glu Thr Met Pro Glu Lys Pro Leu Leu Phe Thr

65 70 75 80

Phe Arg Ser Ala Lys Glu Gly Gly Glu Gln Ala Ile Ser Thr Glu Ala

85 90 95

Tyr Ile Ala Leu Asn Arg Ala Ala Ile Asp Ser Gly Leu Val Asp Met

100 105 110

Ile Asp Leu Glu Leu Phe Thr Gly Asp Asp Gln Val Lys Glu Thr Val

115 120 125

Ala Tyr Ala His Ala His Asp Val Lys Val Val Met Ser Asn His Asp

130 135 140

Phe His Lys Thr Pro Glu Ala Glu Glu Ile Ile Ala Arg Leu Arg Lys

145 150 155 160

Met Gln Ser Phe Asp Ala Asp Ile Pro Lys Ile Ala Leu Met Pro Gln

165 170 175

Ser Thr Ser Asp Val Leu Thr Leu Leu Ala Ala Thr Leu Glu Met Gln

180 185 190

Glu Gln Tyr Ala Asp Arg Pro Ile Ile Thr Met Ser Met Ala Lys Thr

195 200 205

Gly Val Ile Ser Arg Leu Ala Gly Glu Val Phe Gly Ser Ala Ala Thr

210 215 220

Phe Gly Ala Val Lys Lys Ala Ser Ala Pro Gly Gln Ile Ser Val Asn

225 230 235 240

Asp Leu Arg Thr Val Leu Thr Ile Leu His Gln Ala

245 250

<210> 7

<211> 843

<212> DNA

<213> 苏云金芽孢杆菌

<400> 7

atgaaatatt cgctatgtac catttcattt cgtcatcaat taatttcatt tactgatatt 60

gttcaatttg catatgaaaa cggttttgaa ggaattgaat tatgggggac gcatgcacaa 120

aatttgtaca tgcaagaacg tgaaacgaca gaacgagaat tgaattttct aaaggataaa 180

aacttagaaa ttacgatgat aagtgattac ttagatatat cattatcagc agattttgaa 240

aaaacgatag agaaaagtga acaacttgta gtactagcta attggtttaa tacgaataaa 300

attcgcacgt ttgctgggca aaaagggagc aaggacttct cggaacaaga gagaaaagag 360

tatgtgaagc gaatacgtaa gatttgtgat gtgtttgctc agaacaatat gtatgtgctg 420

ttagaaacac atcccaatac actaacggac acattgcctt ctactataga gttattagaa 480

gaagtaaacc atccgaattt aaaaataaat cttgattttc ttcatatatg ggagtctggc 540

gcagatccaa tagacagttt ccatcgatta aagccgtgga cactacatta ccattttaag 600

aatatatctt cagcggatta tttgcatgtg tttgaaccta ataatgtata tgctgcagca 660

ggaagtcgta taggtatggt tccgttattt gaaggtattg taaattatga tgagattatt 720

caggaagtga gaaatacgga tctttttgct tccttagaat ggtttggaca taattcaaaa 780

gagatattaa aagaagaaat gaaagtatta ataaatagaa aattagaagt agtaacttcg 840

taa 843

<210> 8

<211> 280

<212> PRT

<213> 苏云金芽孢杆菌

<400> 8

Met Lys Tyr Ser Leu Cys Thr Ile Ser Phe Arg His Gln Leu Ile Ser

1 5 10 15

Phe Thr Asp Ile Val Gln Phe Ala Tyr Glu Asn Gly Phe Glu Gly Ile

20 25 30

Glu Leu Trp Gly Thr His Ala Gln Asn Leu Tyr Met Gln Glu Arg Glu

35 40 45

Thr Thr Glu Arg Glu Leu Asn Phe Leu Lys Asp Lys Asn Leu Glu Ile

50 55 60

Thr Met Ile Ser Asp Tyr Leu Asp Ile Ser Leu Ser Ala Asp Phe Glu

65 70 75 80

Lys Thr Ile Glu Lys Ser Glu Gln Leu Val Val Leu Ala Asn Trp Phe

85 90 95

Asn Thr Asn Lys Ile Arg Thr Phe Ala Gly Gln Lys Gly Ser Lys Asp

100 105 110

Phe Ser Glu Gln Glu Arg Lys Glu Tyr Val Lys Arg Ile Arg Lys Ile

115 120 125

Cys Asp Val Phe Ala Gln Asn Asn Met Tyr Val Leu Leu Glu Thr His

130 135 140

Pro Asn Thr Leu Thr Asp Thr Leu Pro Ser Thr Ile Glu Leu Leu Glu

145 150 155 160

Glu Val Asn His Pro Asn Leu Lys Ile Asn Leu Asp Phe Leu His Ile

165 170 175

Trp Glu Ser Gly Ala Asp Pro Ile Asp Ser Phe His Arg Leu Lys Pro

180 185 190

Trp Thr Leu His Tyr His Phe Lys Asn Ile Ser Ser Ala Asp Tyr Leu

195 200 205

His Val Phe Glu Pro Asn Asn Val Tyr Ala Ala Ala Gly Ser Arg Ile

210 215 220

Gly Met Val Pro Leu Phe Glu Gly Ile Val Asn Tyr Asp Glu Ile Ile

225 230 235 240

Gln Glu Val Arg Asn Thr Asp Leu Phe Ala Ser Leu Glu Trp Phe Gly

245 250 255

His Asn Ser Lys Glu Ile Leu Lys Glu Glu Met Lys Val Leu Ile Asn

260 265 270

Arg Lys Leu Glu Val Val Thr Ser

275 280

<210> 9

<211> 1542

<212> DNA

<213> 大肠杆菌

<400> 9

atgcgtctgg aagtcttttg tgaagaccga ctcggtctga cccgcgaatt actcgatcta 60

ctcgtgctaa gaggcattga tttacgcggt attgagattg atcccattgg gcgaatctac 120

ctcaattttg ctgaactgga gtttgagagt ttcagcagtc tgatggccga aatacgccgt 180

attgcgggtg ttaccgatgt gcgtactgtc ccgtggatgc cttccgaacg tgagcatctg 240

gcgttgagcg cgttactgga ggcgttgcct gaacctgtgc tctctgtcga tatgaaaagc 300

aaagtggata tggcgaaccc ggcgagctgt cagctttttg ggcaaaaatt ggatcgcctg 360

cgcaaccata ccgccgcaca attgattaac ggctttaatt ttttacgttg gctggaaagc 420

gaaccgcaag attcgcataa cgagcatgtc gttattaatg ggcagaattt cctgatggag 480

attacgcctg tttatcttca ggatgaaaat gatcaacacg tcctgaccgg tgcggtggtg 540

atgttgcgat caacgattcg tatgggccgc cagttgcaaa atgtcgccgc ccaggacgtc 600

agcgccttca gtcaaattgt cgccgtcagc ccgaaaatga agcatgttgt cgaacaggcg 660

cagaaactgg cgatgctaag cgcgccgctg ctgattacgg gtgacacagg tacaggtaaa 720

gatctctttg cctacgcctg ccatcaggca agccccagag cgggcaaacc ttacctggcg 780

ctgaactgtg cgtctatacc ggaagatgcg gtcgagagtg aactgtttgg tcatgctccg 840

gaagggaaga aaggattctt tgagcaggcg aacggtggtt cggtgctgtt ggatgaaata 900

ggggaaatgt caccacggat gcaggcgaaa ttactgcgtt tccttaatga tggcactttc 960

cgtcgggttg gcgaagacca tgaggtgcat gtcgatgtgc gggtgatttg cgctacgcag 1020

aagaatctgg tcgaactggt gcaaaaaggc atgttccgtg aagatctcta ttatcgtctg 1080

aacgtgttga cgctcaatct gccgccgcta cgtgactgtc cgcaggacat catgccgtta 1140

actgagctgt tcgtcgcccg ctttgccgac gagcagggcg tgccgcgtcc gaaactggcc 1200

gctgacctga atactgtact tacgcgttat gcgtggccgg gaaatgtgcg gcagttaaag 1260

aacgctatct atcgcgcact gacacaactg gacggttatg agctgcgtcc acaggatatt 1320

ttgttgccgg attatgacgc cgcaacggta gccgtgggcg aagatgcgat ggaaggttcg 1380

ctggacgaaa tcaccagccg ttttgaacgc tcggtattaa cccagcttta tcgcaattat 1440

cccagcacgc gcaaactggc aaaacgtctc ggcgtttcac ataccgcgat tgccaataag 1500

ttgcgggaat atggtctgag tcagaagaag aacgaagagt aa 1542

<210> 10

<211> 513

<212> PRT

<213> 大肠杆菌

<400> 10

Met Arg Leu Glu Val Phe Cys Glu Asp Arg Leu Gly Leu Thr Arg Glu

1 5 10 15

Leu Leu Asp Leu Leu Val Leu Arg Gly Ile Asp Leu Arg Gly Ile Glu

20 25 30

Ile Asp Pro Ile Gly Arg Ile Tyr Leu Asn Phe Ala Glu Leu Glu Phe

35 40 45

Glu Ser Phe Ser Ser Leu Met Ala Glu Ile Arg Arg Ile Ala Gly Val

50 55 60

Thr Asp Val Arg Thr Val Pro Trp Met Pro Ser Glu Arg Glu His Leu

65 70 75 80

Ala Leu Ser Ala Leu Leu Glu Ala Leu Pro Glu Pro Val Leu Ser Val

85 90 95

Asp Met Lys Ser Lys Val Asp Met Ala Asn Pro Ala Ser Cys Gln Leu

100 105 110

Phe Gly Gln Lys Leu Asp Arg Leu Arg Asn His Thr Ala Ala Gln Leu

115 120 125

Ile Asn Gly Phe Asn Phe Leu Arg Trp Leu Glu Ser Glu Pro Gln Asp

130 135 140

Ser His Asn Glu His Val Val Ile Asn Gly Gln Asn Phe Leu Met Glu

145 150 155 160

Ile Thr Pro Val Tyr Leu Gln Asp Glu Asn Asp Gln His Val Leu Thr

165 170 175

Gly Ala Val Val Met Leu Arg Ser Thr Ile Arg Met Gly Arg Gln Leu

180 185 190

Gln Asn Val Ala Ala Gln Asp Val Ser Ala Phe Ser Gln Ile Val Ala

195 200 205

Val Ser Pro Lys Met Lys His Val Val Glu Gln Ala Gln Lys Leu Ala

210 215 220

Met Leu Ser Ala Pro Leu Leu Ile Thr Gly Asp Thr Gly Thr Gly Lys

225 230 235 240

Asp Leu Phe Ala Tyr Ala Cys His Gln Ala Ser Pro Arg Ala Gly Lys

245 250 255

Pro Tyr Leu Ala Leu Asn Cys Ala Ser Ile Pro Glu Asp Ala Val Glu

260 265 270

Ser Glu Leu Phe Gly His Ala Pro Glu Gly Lys Lys Gly Phe Phe Glu

275 280 285

Gln Ala Asn Gly Gly Ser Val Leu Leu Asp Glu Ile Gly Glu Met Ser

290 295 300

Pro Arg Met Gln Ala Lys Leu Leu Arg Phe Leu Asn Asp Gly Thr Phe

305 310 315 320

Arg Arg Val Gly Glu Asp His Glu Val His Val Asp Val Arg Val Ile

325 330 335

Cys Ala Thr Gln Lys Asn Leu Val Glu Leu Val Gln Lys Gly Met Phe

340 345 350

Arg Glu Asp Leu Tyr Tyr Arg Leu Asn Val Leu Thr Leu Asn Leu Pro

355 360 365

Pro Leu Arg Asp Cys Pro Gln Asp Ile Met Pro Leu Thr Glu Leu Phe

370 375 380

Val Ala Arg Phe Ala Asp Glu Gln Gly Val Pro Arg Pro Lys Leu Ala

385 390 395 400

Ala Asp Leu Asn Thr Val Leu Thr Arg Tyr Ala Trp Pro Gly Asn Val

405 410 415

Arg Gln Leu Lys Asn Ala Ile Tyr Arg Ala Leu Thr Gln Leu Asp Gly

420 425 430

Tyr Glu Leu Arg Pro Gln Asp Ile Leu Leu Pro Asp Tyr Asp Ala Ala

435 440 445

Thr Val Ala Val Gly Glu Asp Ala Met Glu Gly Ser Leu Asp Glu Ile

450 455 460

Thr Ser Arg Phe Glu Arg Ser Val Leu Thr Gln Leu Tyr Arg Asn Tyr

465 470 475 480

Pro Ser Thr Arg Lys Leu Ala Lys Arg Leu Gly Val Ser His Thr Ala

485 490 495

Ile Ala Asn Lys Leu Arg Glu Tyr Gly Leu Ser Gln Lys Lys Asn Glu

500 505 510

Glu

<210> 11

<211> 2304

<212> DNA

<213> 智人

<400> 11

cggcctgcgt ccgccaccgg aagcgccctc ctaatccccg cagcgccacc gccattgccg 60

ccatcgtcgt ggggcttctg gggcagctag ggctgcccgc cgcgctgcct gcgccggacc 120

ggggcgggtc cagtcccggg cgggccgtcg cgggagagaa ataacatctg ctttgctgcc 180

gagctcagag gagaccccag acccctcccg cagccagagg gctggagcct gctcagaggt 240

gctttgaaga tgccggaggc cccgcctctg ctgttggcag ctgtgttgct gggcctggtg 300

ctgctggtgg tgctgctgct gcttctgagg cactggggct ggggcctgtg ccttatcggc 360

tggaacgagt tcatcctgca gcccatccac aacctgctca tgggtgacac caaggagcag 420

cgcatcctga accacgtgct gcagcatgcg gagcccggga acgcacagag cgtgctggag 480

gccattgaca cctactgcga gcagaaggag tgggccatga acgtgggcga caagaaaggc 540

aagatcgtgg acgccgtgat tcaggagcac cagccctccg tgctgctgga gctgggggcc 600

tactgtggct actcagctgt gcgcatggcc cgcctgctgt caccaggggc gaggctcatc 660

accatcgaga tcaaccccga ctgtgccgcc atcacccagc ggatggtgga tttcgctggc 720

gtgaaggaca aggtcaccct tgtggttgga gcgtcccagg acatcatccc ccagctgaag 780

aagaagtatg atgtggacac actggacatg gtcttcctcg accactggaa ggaccggtac 840

ctgccggaca cgcttctctt ggaggaatgt ggcctgctgc ggaaggggac agtgctactg 900

gctgacaacg tgatctgccc aggtgcgcca gacttcctag cacacgtgcg cgggagcagc 960

tgctttgagt gcacacacta ccaatcgttc ctggaataca gggaggtggt ggacggcctg 1020

gagaaggcca tctacaaggg cccaggcagc gaagcagggc cctgactgcc cccccggccc 1080

ccctctcggg ctctctcacc cagcctggta ctgaaggtgc cagacgtgct cctgctgacc 1140

ttctgcggct ccgggctgtg tcctaaatgc aaagcacacc tcggccgagg cctgcgccct 1200

gacatgctaa cctctctgaa ctgcaacact ggattgttct tttttaagac tcaatcatga 1260

cttctttact aacactggct agctatatta tcttatatac taatatcatg ttttaaaaat 1320

ataaaataga aattaagaat ctaaatattt agatataact cgacttagta catccttctc 1380

aactgccatt cccctgctgc ccttgacttg ggcaccaaac attcaaagct ccccttgacg 1440

gacgctaacg ctaagggcgg ggcccctagc tggctgggtt ctgggtggca cgcctggccc 1500

actggcctcc cagccacagt ggtgcagagg tcagccctcc tgcagctagg ccaggggcac 1560

ctgttagccc catggggacg actgccggcc tgggaaacga agaggagtca gccagcattc 1620

acacctttct gaccaagcag gcgctgggga caggtggacc ccgcagcagc accagcccct 1680

ctgggcccca tgtggcacag agtggaagca tctccttccc tactccccac tgggccttgc 1740

ttacagaaga ggcaatggct cagaccagct cccgcatccc tgtagttgcc tccctggccc 1800

atgagtgagg atgcagtgct ggtttctgcc cacctacacc tagagctgtc cccatctcct 1860

ccaaggggtc agactgctag ccacctcaga ggctccaagg gcccagttcc caggcccagg 1920

acaggaatca accctgtgct agctgagttc acctgcaccg agaccagccc ctagccaaga 1980

ttctactcct gggctcaagg cctggctagc ccccagccag cccactccta tggatagaca 2040

gaccagtgag cccaagtgga caagtttggg gccacccagg gaccagaaac agagcctctg 2100

caggacacag cagatgggca cctgggacca cctccaccca gggccctgcc ccagacgcgc 2160

agaggcccga cacaagggag aagccagcca cttgtgccag acctgagtgg cagaaagcaa 2220

aaagttcctt tgctgcttta atttttaaat tttcttacaa aaatttaggt gtttaccaat 2280

agtcttattt tggcttattt ttaa 2304

<210> 12

<211> 2262

<212> DNA

<213> 智人

<400> 12

ctcccacggg aggagcaaga acacagaaca gagggggcaa gacagctcca ccaggagtca 60

ggagtgaatc ccctctggga acgaggcact aggaagaaga acttccagcc caggagaaat 120

aacatctgct ttgctgccga gctcagagga gaccccagac ccctcccgca gccagagggc 180

tggagcctgc tcagaggtgc tttgaagatg ccggaggccc cgcctctgct gttggcagct 240

gtgttgctgg gcctggtgct gctggtggtg ctgctgctgc ttctgaggca ctggggctgg 300

ggcctgtgcc ttatcggctg gaacgagttc atcctgcagc ccatccacaa cctgctcatg 360

ggtgacacca aggagcagcg catcctgaac cacgtgctgc agcatgcgga gcccgggaac 420

gcacagagcg tgctggaggc cattgacacc tactgcgagc agaaggagtg ggccatgaac 480

gtgggcgaca agaaaggcaa gatcgtggac gccgtgattc aggagcacca gccctccgtg 540

ctgctggagc tgggggccta ctgtggctac tcagctgtgc gcatggcccg cctgctgtca 600

ccaggggcga ggctcatcac catcgagatc aaccccgact gtgccgccat cacccagcgg 660

atggtggatt tcgctggcgt gaaggacaag gtcacccttg tggttggagc gtcccaggac 720

atcatccccc agctgaagaa gaagtatgat gtggacacac tggacatggt cttcctcgac 780

cactggaagg accggtacct gccggacacg cttctcttgg aggaatgtgg cctgctgcgg 840

aaggggacag tgctactggc tgacaacgtg atctgcccag gtgcgccaga cttcctagca 900

cacgtgcgcg ggagcagctg ctttgagtgc acacactacc aatcgttcct ggaatacagg 960

gaggtggtgg acggcctgga gaaggccatc tacaagggcc caggcagcga agcagggccc 1020

tgactgcccc cccggccccc ctctcgggct ctctcaccca gcctggtact gaaggtgcca 1080

gacgtgctcc tgctgacctt ctgcggctcc gggctgtgtc ctaaatgcaa agcacacctc 1140

ggccgaggcc tgcgccctga catgctaacc tctctgaact gcaacactgg attgttcttt 1200

tttaagactc aatcatgact tctttactaa cactggctag ctatattatc ttatatacta 1260

atatcatgtt ttaaaaatat aaaatagaaa ttaagaatct aaatatttag atataactcg 1320

acttagtaca tccttctcaa ctgccattcc cctgctgccc ttgacttggg caccaaacat 1380

tcaaagctcc ccttgacgga cgctaacgct aagggcgggg cccctagctg gctgggttct 1440

gggtggcacg cctggcccac tggcctccca gccacagtgg tgcagaggtc agccctcctg 1500

cagctaggcc aggggcacct gttagcccca tggggacgac tgccggcctg ggaaacgaag 1560

aggagtcagc cagcattcac acctttctga ccaagcaggc gctggggaca ggtggacccc 1620

gcagcagcac cagcccctct gggccccatg tggcacagag tggaagcatc tccttcccta 1680

ctccccactg ggccttgctt acagaagagg caatggctca gaccagctcc cgcatccctg 1740

tagttgcctc cctggcccat gagtgaggat gcagtgctgg tttctgccca cctacaccta 1800

gagctgtccc catctcctcc aaggggtcag actgctagcc acctcagagg ctccaagggc 1860

ccagttccca ggcccaggac aggaatcaac cctgtgctag ctgagttcac ctgcaccgag 1920

accagcccct agccaagatt ctactcctgg gctcaaggcc tggctagccc ccagccagcc 1980

cactcctatg gatagacaga ccagtgagcc caagtggaca agtttggggc cacccaggga 2040

ccagaaacag agcctctgca ggacacagca gatgggcacc tgggaccacc tccacccagg 2100

gccctgcccc agacgcgcag aggcccgaca caagggagaa gccagccact tgtgccagac 2160

ctgagtggca gaaagcaaaa agttcctttg ctgctttaat ttttaaattt tcttacaaaa 2220

atttaggtgt ttaccaatag tcttattttg gcttattttt aa 2262

<210> 13

<211> 2279

<212> DNA

<213> 智人

<400> 13

tggagataac acggatcgct gtgtacactg tgtgctccgg ttgttgcatc cgagggttga 60

tcggatggtg gttcccatcc agatccaagt cctggcccct gatcacagag aaacacagct 120

ggacattaaa gtgaaataac atctgctttg ctgccgagct cagaggagac cccagacccc 180

tcccgcagcc agagggctgg agcctgctca gaggtgcttt gaagatgccg gaggccccgc 240

ctctgctgtt ggcagctgtg ttgctgggcc tggtgctgct ggtggtgctg ctgctgcttc 300

tgaggcactg gggctggggc ctgtgcctta tcggctggaa cgagttcatc ctgcagccca 360

tccacaacct gctcatgggt gacaccaagg agcagcgcat cctgaaccac gtgctgcagc 420

atgcggagcc cgggaacgca cagagcgtgc tggaggccat tgacacctac tgcgagcaga 480

aggagtgggc catgaacgtg ggcgacaaga aaggcaagat cgtggacgcc gtgattcagg 540

agcaccagcc ctccgtgctg ctggagctgg gggcctactg tggctactca gctgtgcgca 600

tggcccgcct gctgtcacca ggggcgaggc tcatcaccat cgagatcaac cccgactgtg 660

ccgccatcac ccagcggatg gtggatttcg ctggcgtgaa ggacaaggtc acccttgtgg 720

ttggagcgtc ccaggacatc atcccccagc tgaagaagaa gtatgatgtg gacacactgg 780

acatggtctt cctcgaccac tggaaggacc ggtacctgcc ggacacgctt ctcttggagg 840

aatgtggcct gctgcggaag gggacagtgc tactggctga caacgtgatc tgcccaggtg 900

cgccagactt cctagcacac gtgcgcggga gcagctgctt tgagtgcaca cactaccaat 960

cgttcctgga atacagggag gtggtggacg gcctggagaa ggccatctac aagggcccag 1020

gcagcgaagc agggccctga ctgccccccc ggcccccctc tcgggctctc tcacccagcc 1080

tggtactgaa ggtgccagac gtgctcctgc tgaccttctg cggctccggg ctgtgtccta 1140

aatgcaaagc acacctcggc cgaggcctgc gccctgacat gctaacctct ctgaactgca 1200

acactggatt gttctttttt aagactcaat catgacttct ttactaacac tggctagcta 1260

tattatctta tatactaata tcatgtttta aaaatataaa atagaaatta agaatctaaa 1320

tatttagata taactcgact tagtacatcc ttctcaactg ccattcccct gctgcccttg 1380

acttgggcac caaacattca aagctcccct tgacggacgc taacgctaag ggcggggccc 1440

ctagctggct gggttctggg tggcacgcct ggcccactgg cctcccagcc acagtggtgc 1500

agaggtcagc cctcctgcag ctaggccagg ggcacctgtt agccccatgg ggacgactgc 1560

cggcctggga aacgaagagg agtcagccag cattcacacc tttctgacca agcaggcgct 1620

ggggacaggt ggaccccgca gcagcaccag cccctctggg ccccatgtgg cacagagtgg 1680

aagcatctcc ttccctactc cccactgggc cttgcttaca gaagaggcaa tggctcagac 1740

cagctcccgc atccctgtag ttgcctccct ggcccatgag tgaggatgca gtgctggttt 1800

ctgcccacct acacctagag ctgtccccat ctcctccaag gggtcagact gctagccacc 1860

tcagaggctc caagggccca gttcccaggc ccaggacagg aatcaaccct gtgctagctg 1920

agttcacctg caccgagacc agcccctagc caagattcta ctcctgggct caaggcctgg 1980

ctagccccca gccagcccac tcctatggat agacagacca gtgagcccaa gtggacaagt 2040

ttggggccac ccagggacca gaaacagagc ctctgcagga cacagcagat gggcacctgg 2100

gaccacctcc acccagggcc ctgccccaga cgcgcagagg cccgacacaa gggagaagcc 2160

agccacttgt gccagacctg agtggcagaa agcaaaaagt tcctttgctg ctttaatttt 2220

taaattttct tacaaaaatt taggtgttta ccaatagtct tattttggct tatttttaa 2279

<210> 14

<211> 2035

<212> DNA

<213> 智人

<400> 14

gctgttggca gctgtgttgc tgggcctggt gctgctggtg gtgctgctgc tgcttctgag 60

gcactggggc tggggcctgt gccttatcgg ctggaacgag ttcatcctgc agcccatcca 120

caacctgctc atgggtgaca ccaaggagca gcgcatcctg aaccacgtgc tgcagcatgc 180

ggagcccggg aacgcacaga gcgtgctgga ggccattgac acctactgcg agcagaagga 240

gtgggccatg aacgtgggcg acaagaaagg caagatcgtg gacgccgtga ttcaggagca 300

ccagccctcc gtgctgctgg agctgggggc ctactgtggc tactcagctg tgcgcatggc 360

ccgcctgctg tcaccagggg cgaggctcat caccatcgag atcaaccccg actgtgccgc 420

catcacccag cggatggtgg atttcgctgg cgtgaaggac aaggtcaccc ttgtggttgg 480

agcgtcccag gacatcatcc cccagctgaa gaagaagtat gatgtggaca cactggacat 540

ggtcttcctc gaccactgga aggaccggta cctgccggac acgcttctct tggaggaatg 600

tggcctgctg cggaagggga cagtgctact ggctgacaac gtgatctgcc caggtgcgcc 660

agacttccta gcacacgtgc gcgggagcag ctgctttgag tgcacacact accaatcgtt 720

cctggaatac agggaggtgg tggacggcct ggagaaggcc atctacaagg gcccaggcag 780

cgaagcaggg ccctgactgc ccccccggcc cccctctcgg gctctctcac ccagcctggt 840

actgaaggtg ccagacgtgc tcctgctgac cttctgcggc tccgggctgt gtcctaaatg 900

caaagcacac ctcggccgag gcctgcgccc tgacatgcta acctctctga actgcaacac 960

tggattgttc ttttttaaga ctcaatcatg acttctttac taacactggc tagctatatt 1020

atcttatata ctaatatcat gttttaaaaa tataaaatag aaattaagaa tctaaatatt 1080

tagatataac tcgacttagt acatccttct caactgccat tcccctgctg cccttgactt 1140

gggcaccaaa cattcaaagc tccccttgac ggacgctaac gctaagggcg gggcccctag 1200

ctggctgggt tctgggtggc acgcctggcc cactggcctc ccagccacag tggtgcagag 1260

gtcagccctc ctgcagctag gccaggggca cctgttagcc ccatggggac gactgccggc 1320

ctgggaaacg aagaggagtc agccagcatt cacacctttc tgaccaagca ggcgctgggg 1380

acaggtggac cccgcagcag caccagcccc tctgggcccc atgtggcaca gagtggaagc 1440

atctccttcc ctactcccca ctgggccttg cttacagaag aggcaatggc tcagaccagc 1500

tcccgcatcc ctgtagttgc ctccctggcc catgagtgag gatgcagtgc tggtttctgc 1560

ccacctacac ctagagctgt ccccatctcc tccaaggggt cagactgcta gccacctcag 1620

aggctccaag ggcccagttc ccaggcccag gacaggaatc aaccctgtgc tagctgagtt 1680

cacctgcacc gagaccagcc cctagccaag attctactcc tgggctcaag gcctggctag 1740

cccccagcca gcccactcct atggatagac agaccagtga gcccaagtgg acaagtttgg 1800

ggccacccag ggaccagaaa cagagcctct gcaggacaca gcagatgggc acctgggacc 1860

acctccaccc agggccctgc cccagacgcg cagaggcccg acacaaggga gaagccagcc 1920

acttgtgcca gacctgagtg gcagaaagca aaaagttcct ttgctgcttt aatttttaaa 1980

ttttcttaca aaaatttagg tgtttaccaa tagtcttatt ttggcttatt tttaa 2035

<210> 15

<211> 271

<212> PRT

<213> 智人

<400> 15

Met Pro Glu Ala Pro Pro Leu Leu Leu Ala Ala Val Leu Leu Gly Leu

1 5 10 15

Val Leu Leu Val Val Leu Leu Leu Leu Leu Arg His Trp Gly Trp Gly

20 25 30

Leu Cys Leu Ile Gly Trp Asn Glu Phe Ile Leu Gln Pro Ile His Asn

35 40 45

Leu Leu Met Gly Asp Thr Lys Glu Gln Arg Ile Leu Asn His Val Leu

50 55 60

Gln His Ala Glu Pro Gly Asn Ala Gln Ser Val Leu Glu Ala Ile Asp

65 70 75 80

Thr Tyr Cys Glu Gln Lys Glu Trp Ala Met Asn Val Gly Asp Lys Lys

85 90 95

Gly Lys Ile Val Asp Ala Val Ile Gln Glu His Gln Pro Ser Val Leu

100 105 110

Leu Glu Leu Gly Ala Tyr Cys Gly Tyr Ser Ala Val Arg Met Ala Arg

115 120 125

Leu Leu Ser Pro Gly Ala Arg Leu Ile Thr Ile Glu Ile Asn Pro Asp

130 135 140

Cys Ala Ala Ile Thr Gln Arg Met Val Asp Phe Ala Gly Val Lys Asp

145 150 155 160

Lys Val Thr Leu Val Val Gly Ala Ser Gln Asp Ile Ile Pro Gln Leu

165 170 175

Lys Lys Lys Tyr Asp Val Asp Thr Leu Asp Met Val Phe Leu Asp His

180 185 190

Trp Lys Asp Arg Tyr Leu Pro Asp Thr Leu Leu Leu Glu Glu Cys Gly

195 200 205

Leu Leu Arg Lys Gly Thr Val Leu Leu Ala Asp Asn Val Ile Cys Pro

210 215 220

Gly Ala Pro Asp Phe Leu Ala His Val Arg Gly Ser Ser Cys Phe Glu

225 230 235 240

Cys Thr His Tyr Gln Ser Phe Leu Glu Tyr Arg Glu Val Val Asp Gly

245 250 255

Leu Glu Lys Ala Ile Tyr Lys Gly Pro Gly Ser Glu Ala Gly Pro

260 265 270

<210> 16

<211> 221

<212> PRT

<213> 智人

<400> 16

Met Gly Asp Thr Lys Glu Gln Arg Ile Leu Asn His Val Leu Gln His

1 5 10 15

Ala Glu Pro Gly Asn Ala Gln Ser Val Leu Glu Ala Ile Asp Thr Tyr

20 25 30

Cys Glu Gln Lys Glu Trp Ala Met Asn Val Gly Asp Lys Lys Gly Lys

35 40 45

Ile Val Asp Ala Val Ile Gln Glu His Gln Pro Ser Val Leu Leu Glu

50 55 60

Leu Gly Ala Tyr Cys Gly Tyr Ser Ala Val Arg Met Ala Arg Leu Leu

65 70 75 80

Ser Pro Gly Ala Arg Leu Ile Thr Ile Glu Ile Asn Pro Asp Cys Ala

85 90 95

Ala Ile Thr Gln Arg Met Val Asp Phe Ala Gly Val Lys Asp Lys Val

100 105 110

Thr Leu Val Val Gly Ala Ser Gln Asp Ile Ile Pro Gln Leu Lys Lys

115 120 125

Lys Tyr Asp Val Asp Thr Leu Asp Met Val Phe Leu Asp His Trp Lys

130 135 140

Asp Arg Tyr Leu Pro Asp Thr Leu Leu Leu Glu Glu Cys Gly Leu Leu

145 150 155 160

Arg Lys Gly Thr Val Leu Leu Ala Asp Asn Val Ile Cys Pro Gly Ala

165 170 175

Pro Asp Phe Leu Ala His Val Arg Gly Ser Ser Cys Phe Glu Cys Thr

180 185 190

His Tyr Gln Ser Phe Leu Glu Tyr Arg Glu Val Val Asp Gly Leu Glu

195 200 205

Lys Ala Ile Tyr Lys Gly Pro Gly Ser Glu Ala Gly Pro

210 215 220

<210> 17

<211> 3387

<212> DNA

<213> Gordonia effusa

<400> 17

atgtctgacc agcccaacgc gcttccgtct gccatcgagc cgctgaaccc cgatcctcaa 60

gcgacagagc agatctcgca ctgtgcgacg attgccgaac ttgtccgggt tctcgccgag 120

agctacggtg atcgccccgc gctgggttgg cgaaacaata gtgatccctc gtcctggcat 180

tcgatgactt accgagatct cgctgagcgg gcggattcca tggcgcgact tctccattcg 240

acacttggcg tcgccgagaa cgaccgggtg gcgacggtgg gcttcactag cgcggagtac 300

accatcgcct cgcttgccgt cggcacgctc ggcgcgatgg aggtaccact gcaaaacgcc 360

gggtccgtcg acgtctgggc cgcaatcctc accgaaaccg actgtgtgag cgcggttgtc 420

gcggccgatc aactgccttc gatcgctcgg ctggccgaat cgggcaccta caccggcctg 480

cgacatgtgc tggtcttcga catcggctcg cgcgacggaa ccacgctcga tgacgcggca 540

cgacgactgg tcgctgcggg cacccaggtg catctccgcc agcccggcgc cgagccgacg 600

acaccgccgg ctccactgcc ccagatcacg gccaaccccg accgcgtcgc cctcctcatc 660

tacacctccg gtagcaccgg agcccccaaa ggcgccatgt acaccgaaac cgcggtgacc 720

cggttattcc aatcgggact cagcggcttg gggcgcgcca ccgacggtca cggctggatc 780

accctgaact tcatgccgat gagccacgtg atgggacgca gcactctgtg gcaaaccctg 840

ggaaatggtg gcaccgcgta cttcaccccg cgcgccgacc tcgccgagtt gctcaccgac 900

ctcgcagcgg tccagccgac cgacctgcaa ttcgtaccgc gcatctggga catgctgtac 960

caggagtacg tccgcctcac cgatcaggac gtcagtgaac aagacgccct cacccgtatg 1020

cgcgaacact atttcggtac ccggactgcc accgccatca ccggttccgc accgatctcc 1080

gatgaggttc ggcgtttcgt cgaagcgatg ctgccggttc cactcatcga aggctatgga 1140

agtaccgagg ccgccggcgt ctccatcgac ggccgcatcc agcgaccgcc ggtggtggat 1200

tacaagcttc tcgacgttcc tgaactcggc tacctgagca ccgatcggcc gcacccgcgc 1260

ggcgaactgc tcgtcaagac cgaccatatc ttcgcggggt actacaaccg tcccgacctc 1320

acctcatcgg tcttcgacga ccagggctac taccggacgg gcgacatcgt cgccgagacc 1380

ggcccagacc aaatcgagta tgtcgaccgc cggaacaacg tgatgaagct ttcgcagggt 1440

gagttcgtcg cgatcgccca catcgaggcg gtactgacca ccccgccgat ccagcaactg 1500

tacgtctacg gcaacagcgc gcggccctat ctgctcgcgg tcgtcgtgcc cacccccgag 1560

ttacgcgaac gacacgccga cgacaacgag ctgcgacgag aagtactgac ggcactgcgc 1620

tctcatggcg aacgtaatgg ccttgcggcc gtagagattc cgcgcgatgt gattgtcgaa 1680

cgcacgccgt tcagcctgga gaacggtctt cttaccggca tccgaaaact cgcgcgccca 1740

caactcaaag agcgctacgg cgctcggctg gaggccctct acgccgagct ggccgatagc 1800

cgtatcacca ggctgcgcga cgtcaaagcc gttgccgcac aacgctcaac ggtgacaacg 1860

gtcatcgacg tggtcacagc gatactcgac ctcgccgacg gggaggtcac ggccgcggca 1920

catttcaccg acctcggcgg agattccctc accgccgtca cggtcgggaa cgaactccgc 1980

gacatcttcg acgccgaagt accggtcggc gtcttgacca gcccgtcatc gacgctggcc 2040

gacatagccg aacatatcga cgggcgacac agcgaggccc ggccaaccgc ggaatcggtc 2100

cacggcaccg gaaccaccct tcgggcagcg gacctcactc tcgacaaatt cctcgacgag 2160

gagaccttgc gcgctgcgtc cgacgtgacg tcggctgcga ccgacgtacg gaccgtattc 2220

atcaccggcg caaccggatt cctcggtcgc tatctgacac tcgactggtt gcgtcggatg 2280

gcaaaagtcg gcggcacggt gatctgcctc gttcgaggtg cggacgatga tgccgcccgg 2340

gcgcgcctag acgcggcatt cgactccagc gatctatggt cggagtacca gcgactggcc 2400

aaagaccacc ttcgggttct cgccggcgac aaggactcgg atcacctcgc gctcacccca 2460

gacgtatggg atgaattggc aaagtccgtc gacctcatca tcgatcccgc ggcgctggtc 2520

aaccatgtgt tgccatatcg agaactattc ggacccaacg tatctggcac tgctgagctg 2580

atcagactcg cggtgacgac cacccgtaag ccatacgtgt atatctcaac ggtcggtgta 2640

ggcgaccagg tcgcgccggg atctttcacc gaggaccccg acatccgcga gatgagctcg 2700

gtacgcgaga ttaacgacac ttacgccaac ggatatggca acagcaaatg ggccggcgaa 2760

gtattgctcg cgcaggcgca cgaacgattt gagttaccgg tcagcgtctt tcgctgcgac 2820

atgatcgtcg ccgatgatca caccatcggg cagctgaacc tacctgacat gttcacgcgg 2880

ctactgatga gcgtgctcgc caccggcttg gcacctcgct ctttctatca actcgccacc 2940

gacggatcgg cacaggaggc ccacttcgat gctctgccgg tcgatttcct cgccgaagcg 3000

atcaacaccc tgtgggttaa ggacggagcc cgcaccttca acgcgatgaa cccgcacgcc 3060

gacggcatcg gattcgatca gtacattcgc tggctgatcg acagcggcga gcagatcagc 3120

cttgtagaca actatgacga ttggtatcgg cgattcggtg cggccctcgc cgatctgccg 3180

gaaaagcagc gacgcggatc gttgattccg ttgctgcaca actatgttca cccgatgacg 3240

ccgcacaatc gcggtatggc gtcggcggac cgattccacg acgcggtccg aaccgctggc 3300

gtcgggcagt cgtccgacat cccgcatatc acgccacaga tcatcgagaa ctacgcccgc 3360

agcctccgcg gtctcggggt gatctga 3387

<210> 18

<211> 1128

<212> PRT

<213> Gordonia effusa

<400> 18

Met Ser Asp Gln Pro Asn Ala Leu Pro Ser Ala Ile Glu Pro Leu Asn

1 5 10 15

Pro Asp Pro Gln Ala Thr Glu Gln Ile Ser His Cys Ala Thr Ile Ala

20 25 30

Glu Leu Val Arg Val Leu Ala Glu Ser Tyr Gly Asp Arg Pro Ala Leu

35 40 45

Gly Trp Arg Asn Asn Ser Asp Pro Ser Ser Trp His Ser Met Thr Tyr

50 55 60

Arg Asp Leu Ala Glu Arg Ala Asp Ser Met Ala Arg Leu Leu His Ser

65 70 75 80

Thr Leu Gly Val Ala Glu Asn Asp Arg Val Ala Thr Val Gly Phe Thr

85 90 95

Ser Ala Glu Tyr Thr Ile Ala Ser Leu Ala Val Gly Thr Leu Gly Ala

100 105 110

Met Glu Val Pro Leu Gln Asn Ala Gly Ser Val Asp Val Trp Ala Ala

115 120 125

Ile Leu Thr Glu Thr Asp Cys Val Ser Ala Val Val Ala Ala Asp Gln

130 135 140

Leu Pro Ser Ile Ala Arg Leu Ala Glu Ser Gly Thr Tyr Thr Gly Leu

145 150 155 160

Arg His Val Leu Val Phe Asp Ile Gly Ser Arg Asp Gly Thr Thr Leu

165 170 175

Asp Asp Ala Ala Arg Arg Leu Val Ala Ala Gly Thr Gln Val His Leu

180 185 190

Arg Gln Pro Gly Ala Glu Pro Thr Thr Pro Pro Ala Pro Leu Pro Gln

195 200 205

Ile Thr Ala Asn Pro Asp Arg Val Ala Leu Leu Ile Tyr Thr Ser Gly

210 215 220

Ser Thr Gly Ala Pro Lys Gly Ala Met Tyr Thr Glu Thr Ala Val Thr

225 230 235 240

Arg Leu Phe Gln Ser Gly Leu Ser Gly Leu Gly Arg Ala Thr Asp Gly

245 250 255

His Gly Trp Ile Thr Leu Asn Phe Met Pro Met Ser His Val Met Gly

260 265 270

Arg Ser Thr Leu Trp Gln Thr Leu Gly Asn Gly Gly Thr Ala Tyr Phe

275 280 285

Thr Pro Arg Ala Asp Leu Ala Glu Leu Leu Thr Asp Leu Ala Ala Val

290 295 300

Gln Pro Thr Asp Leu Gln Phe Val Pro Arg Ile Trp Asp Met Leu Tyr

305 310 315 320

Gln Glu Tyr Val Arg Leu Thr Asp Gln Asp Val Ser Glu Gln Asp Ala

325 330 335

Leu Thr Arg Met Arg Glu His Tyr Phe Gly Thr Arg Thr Ala Thr Ala

340 345 350

Ile Thr Gly Ser Ala Pro Ile Ser Asp Glu Val Arg Arg Phe Val Glu

355 360 365

Ala Met Leu Pro Val Pro Leu Ile Glu Gly Tyr Gly Ser Thr Glu Ala

370 375 380

Ala Gly Val Ser Ile Asp Gly Arg Ile Gln Arg Pro Pro Val Val Asp

385 390 395 400

Tyr Lys Leu Leu Asp Val Pro Glu Leu Gly Tyr Leu Ser Thr Asp Arg

405 410 415

Pro His Pro Arg Gly Glu Leu Leu Val Lys Thr Asp His Ile Phe Ala

420 425 430

Gly Tyr Tyr Asn Arg Pro Asp Leu Thr Ser Ser Val Phe Asp Asp Gln

435 440 445

Gly Tyr Tyr Arg Thr Gly Asp Ile Val Ala Glu Thr Gly Pro Asp Gln

450 455 460

Ile Glu Tyr Val Asp Arg Arg Asn Asn Val Met Lys Leu Ser Gln Gly

465 470 475 480

Glu Phe Val Ala Ile Ala His Ile Glu Ala Val Leu Thr Thr Pro Pro

485 490 495

Ile Gln Gln Leu Tyr Val Tyr Gly Asn Ser Ala Arg Pro Tyr Leu Leu

500 505 510

Ala Val Val Val Pro Thr Pro Glu Leu Arg Glu Arg His Ala Asp Asp

515 520 525

Asn Glu Leu Arg Arg Glu Val Leu Thr Ala Leu Arg Ser His Gly Glu

530 535 540

Arg Asn Gly Leu Ala Ala Val Glu Ile Pro Arg Asp Val Ile Val Glu

545 550 555 560

Arg Thr Pro Phe Ser Leu Glu Asn Gly Leu Leu Thr Gly Ile Arg Lys

565 570 575

Leu Ala Arg Pro Gln Leu Lys Glu Arg Tyr Gly Ala Arg Leu Glu Ala

580 585 590

Leu Tyr Ala Glu Leu Ala Asp Ser Arg Ile Thr Arg Leu Arg Asp Val

595 600 605

Lys Ala Val Ala Ala Gln Arg Ser Thr Val Thr Thr Val Ile Asp Val

610 615 620

Val Thr Ala Ile Leu Asp Leu Ala Asp Gly Glu Val Thr Ala Ala Ala

625 630 635 640

His Phe Thr Asp Leu Gly Gly Asp Ser Leu Thr Ala Val Thr Val Gly

645 650 655

Asn Glu Leu Arg Asp Ile Phe Asp Ala Glu Val Pro Val Gly Val Leu

660 665 670

Thr Ser Pro Ser Ser Thr Leu Ala Asp Ile Ala Glu His Ile Asp Gly

675 680 685

Arg His Ser Glu Ala Arg Pro Thr Ala Glu Ser Val His Gly Thr Gly

690 695 700

Thr Thr Leu Arg Ala Ala Asp Leu Thr Leu Asp Lys Phe Leu Asp Glu

705 710 715 720

Glu Thr Leu Arg Ala Ala Ser Asp Val Thr Ser Ala Ala Thr Asp Val

725 730 735

Arg Thr Val Phe Ile Thr Gly Ala Thr Gly Phe Leu Gly Arg Tyr Leu

740 745 750

Thr Leu Asp Trp Leu Arg Arg Met Ala Lys Val Gly Gly Thr Val Ile

755 760 765

Cys Leu Val Arg Gly Ala Asp Asp Asp Ala Ala Arg Ala Arg Leu Asp

770 775 780

Ala Ala Phe Asp Ser Ser Asp Leu Trp Ser Glu Tyr Gln Arg Leu Ala

785 790 795 800

Lys Asp His Leu Arg Val Leu Ala Gly Asp Lys Asp Ser Asp His Leu

805 810 815

Ala Leu Thr Pro Asp Val Trp Asp Glu Leu Ala Lys Ser Val Asp Leu

820 825 830

Ile Ile Asp Pro Ala Ala Leu Val Asn His Val Leu Pro Tyr Arg Glu

835 840 845

Leu Phe Gly Pro Asn Val Ser Gly Thr Ala Glu Leu Ile Arg Leu Ala

850 855 860

Val Thr Thr Thr Arg Lys Pro Tyr Val Tyr Ile Ser Thr Val Gly Val

865 870 875 880

Gly Asp Gln Val Ala Pro Gly Ser Phe Thr Glu Asp Pro Asp Ile Arg

885 890 895

Glu Met Ser Ser Val Arg Glu Ile Asn Asp Thr Tyr Ala Asn Gly Tyr

900 905 910

Gly Asn Ser Lys Trp Ala Gly Glu Val Leu Leu Ala Gln Ala His Glu

915 920 925

Arg Phe Glu Leu Pro Val Ser Val Phe Arg Cys Asp Met Ile Val Ala

930 935 940

Asp Asp His Thr Ile Gly Gln Leu Asn Leu Pro Asp Met Phe Thr Arg

945 950 955 960

Leu Leu Met Ser Val Leu Ala Thr Gly Leu Ala Pro Arg Ser Phe Tyr

965 970 975

Gln Leu Ala Thr Asp Gly Ser Ala Gln Glu Ala His Phe Asp Ala Leu

980 985 990

Pro Val Asp Phe Leu Ala Glu Ala Ile Asn Thr Leu Trp Val Lys Asp

995 1000 1005

Gly Ala Arg Thr Phe Asn Ala Met Asn Pro His Ala Asp Gly Ile

1010 1015 1020

Gly Phe Asp Gln Tyr Ile Arg Trp Leu Ile Asp Ser Gly Glu Gln

1025 1030 1035

Ile Ser Leu Val Asp Asn Tyr Asp Asp Trp Tyr Arg Arg Phe Gly

1040 1045 1050

Ala Ala Leu Ala Asp Leu Pro Glu Lys Gln Arg Arg Gly Ser Leu

1055 1060 1065

Ile Pro Leu Leu His Asn Tyr Val His Pro Met Thr Pro His Asn

1070 1075 1080

Arg Gly Met Ala Ser Ala Asp Arg Phe His Asp Ala Val Arg Thr

1085 1090 1095

Ala Gly Val Gly Gln Ser Ser Asp Ile Pro His Ile Thr Pro Gln

1100 1105 1110

Ile Ile Glu Asn Tyr Ala Arg Ser Leu Arg Gly Leu Gly Val Ile

1115 1120 1125

<210> 19

<211> 4636

<212> DNA

<213> 人工序列

<220>

<223> 含有巴西诺卡菌的CAR基因(经密码子优化)和大肠杆菌的entD基因

的DNA片段的核苷酸序列

<400> 19

ccaagcttgc atgccagatc gtttagatcc gaaggaaaac gtcgaaaagc aatttgcttt 60

tcgacgcccc accccgcgcg ttttagcgtg tcagtagacg cgtagggtaa gtggggtagc 120

ggcttgttag atatcttgaa atcggctttc aacagcattg atttcgatgt atttagctgg 180

ccgtttgaga cgcgatgtcc acagggtagc tggtagtttg aaaatcaacg ccgttgccct 240

taggattcag taactggcac attttgtaat gcgctagatc tgtgtgccca gtcttccagg 300

ctgcttatca cagtgaaagc aaaaccaatt cgtggctgcg aaagtcgtag ccaccacgaa 360

gtccaggagg acatacaatg gcaactgaca gcaggagcga ccgtctacgt aggcggatag 420

ctcagctatt tgcagaagat gaacaggtta aggcagcagt tccggatcag gaagttgttg 480

aagcaattcg tgcacctggt ctgcgtctgg ctcagattat ggcaaccgtg atggaacgtt 540

acgcagatcg tcctgcagtt gggcagcgtg caagcgaacc ggttaccgaa agcgggcgta 600

ccacctttcg tctgttaccg gagtttgaaa ccctgaccta tcgtgaactg tgggcacgtg 660

tgcgtgcagt tgcagcagca tggcatgggg acgcagagag gcccttacgt gcaggagact 720

ttgtcgctct gctggggttt gcaggtattg actatggtac cttagactta gcaaatattc 780

acctgggttt agttaccgtt ccgctgcaaa gcggtgcaac tgcaccgcaa ctggcagcaa 840

ttctggcaga aaccacccct cgtgttctgg cagcaactcc tgatcacctg gacattgcag 900

tagagctact gaccggaggg gcaagcccgg agcgtctggt tgtctttgac tatcgtcctg 960

cagatgatga ccatcgtgca gcattagaaa gcgcacgtag gcgtctaagc gatgcaggtt 1020

cggcagttgt tgttgaaacc ttagatgcag tccgtgcacg cggtagcgag ctaccggcag 1080

caccgctgtt tgtccctgca gcagatgaag atccgctggc tctgttaatt tacaccagcg 1140

gtagcaccgg gacccccaaa ggtgcaatgt ataccgagag gctgaatcgt actacgtggc 1200

tgagcggtgc aaagggtgtt ggtttaacct taggttatat gccgatgtcg cacatagcag 1260

gacgtgcatc atttgcaggg gttctggcac gcggtggtac cgtttatttt accgcacgca 1320

gcgacatgag caccctgttt gaggacctgg cactggttcg tccgaccgaa atgttttttg 1380

ttccgcgtgt ttgtgacatg atttttcaac gttaccaggc agagctgagc cggcgtgcac 1440

ctgcagcagc agcaagcccg gagttagaac aggagctgaa aaccgagctg cgtctaagcg 1500

cagtcggaga tcgtctatta ggggcaattg caggtagcgc accgctgagc gcagaaatgc 1560

gtgaatttat ggaaagcctg ctggacctgg agctgcatga cggttatggt agcaccgaag 1620

cagggattgg tgtcctgcaa gataacattg ttcagaggcc gccggttatt gactataaat 1680

tagttgatgt tccggagcta ggttattttc gtacggatca gccgcaccct cgtggggaac 1740

tactgctaaa gaccgaggga atgataccgg gttattttcg tcgtcctgaa gttaccgcag 1800

aaatttttga cgaagatggg ttttacagga ccggggatat tgttgcagag ttagagccgg 1860

accgtctgat ttaccttgat cgtcgtaata acgttctgaa gctggcacag ggtgaatttg 1920

ttaccgttgc acacctggag gcagtttttg caacctcgcc gctgattcgt cagatttaca 1980

tttacggtaa tagcgaacgt agctttctgc tggcagttat tgttcctacc gcagatgcac 2040

tggcagatgg ggttaccgat gcactgaata ccgcactgac cgagagccta aggcagttag 2100

caaaggaggc aggactgcaa agctacgaac tgccgcgtga atttctggtt gagaccgagc 2160

cgtttaccgt agaaaatggg ctgttaagcg ggattgcaaa gctgctacgt cctaaattaa 2220

aagaacatta cggtgaaagg ttagaacagc tgtatcgtga cattgaggca aatcgtaatg 2280

atgaactgat tgagctgcgt cgtaccgcag cagaactgcc ggttttagag accgtaaccc 2340

gtgctgctag gagcatgtta gggctggcag caagcgaact acgtccggat gcacacttta 2400

ccgacttagg tggggactcg ctgagcgcac tgagcttcag caccctgctg caggatatgt 2460

tagaagttga agttccggtt ggggttattg ttagccctgc aaatagctta gcagacctgg 2520

caaagtatat tgaggcagag cgtcacagcg gagttcgtcg tccgagcctg attagcgttc 2580

atgggcctgg taccgaaatt agggcagcag acttaaccct ggataaattt attgacgaac 2640

gtaccttagc tgcagcaaag gcagtcccgg cagcaccggc acaggcacag accgtactgt 2700

taaccggagc aaatggttac ctgggtcgtt ttctgtgtct ggagtggctg cagaggctgg 2760

atcagaccgg ggggaccctg gtttgtattg ttcgtgggac cgatgcagca gcagcacgca 2820

aacgtctgga cgcagttttt gacagcgggg acccggagct gttagatcat taccgtaaac 2880

tggcagcaga acatttagaa gttttagcag gtgacattgg tgatccgaac ttaggtctgg 2940

atgaggcaac ttggcagcgt ttagcagcaa ccgtcgatct gattgttcat cctgcagcat 3000

tagttaatca cgttctgccg tatagccagc tgtttggacc gaacgttgtt ggtaccgcag 3060

aaattattcg tctggcaatt accgaacgta ggaaacctgt tacctatctg agcaccgttg 3120

cagttgcagc tcaggttgac ccggcaggtt ttgacgaaga acgtgacatt cgtgaaatga 3180

gcgcagttcg tagcattgac gcaggatatg caaatgggta tggtaatagc aaatgggcag 3240

gtgaagttct gctgcgtgaa gcacacgatc tgtgtggact gccggttgca gtttttcgta 3300

gcgatatgat tctggcacat agcaagtatg ttgggcagtt aaatgttcct gacgttttta 3360

cccgtttaat tctgagcctg gcattaaccg ggattgctcc gtacagcttt tacggaaccg 3420

atagcgcagg acagcgtagg cgtgcacatt acgacgggct gcctgcagac tttgttgcag 3480

aagcaattac caccttaggt gcaagggcag aaagcggatt tcacacctat gatgtttgga 3540

atccgtatga tgatggtatt agcctggatg agtttgttga ttggttaggt gactttggtg 3600

ttccgattca gcgtattgac gactatgatg agtggtttcg taggtttgaa accgcaattc 3660

gtgcactgcc tgagaaacag cgtgacgcta gcctgctacc gctgctggat gctcatcgtc 3720

gtcccctgcg tgcagttcgt gggagcctgc tacctgcaaa aaattttcaa gcagcagttc 3780

agagcgcacg cattggtcct gaccaggata ttccgcacct aagcccgcag ctaattgaca 3840

aatatgttac cgatctgcgt catttaggtc tgttataaag gaggacatac aatggtcgat 3900

atgaaaacta cgcatacctc cctccccttt gccggacata cgctgcattt tgttgagttc 3960

gatccggcga atttttgtga gcaggattta ctctggctgc cgcactacgc acaactgcaa 4020

cacgctggac gtaaacgtaa aacagagcat ttagccggac ggatcgctgc tgtttatgct 4080

ttgcgggaat atggctataa atgtgtgccc gcaatcggcg agctacgcca acctgtctgg 4140

cctgcggagg tatacggcag tattagccac tgtgggacta cggcattagc cgtggtatct 4200

cgtcaaccga ttggcattga tatagaagaa attttttctg tacaaaccgc aagagaattg 4260

acagacaaca ttattacacc agcggaacac gagcgactcg cagactgcgg tttagccttt 4320

tctctggcgc tgacactggc attttccgcc aaagagagcg catttaaggc aagtgagatc 4380

caaactgatg caggttttct ggactatcag ataattagct ggaataaaca gcaggtcatc 4440

attcatcgtg agaatgagat gtttgctgtg cactggcaga taaaagaaaa gatagtcata 4500

acgctgtgcc aacacgatta attgacaaca tctggtacga ttcgcccgca gccatcactg 4560

accacgggcg aaagtgtaaa gcaggtgcct taccatcctg acctgacaac cggatatgcg 4620

ggatccccgg gtaccg 4636

<210> 20

<211> 4522

<212> DNA

<213> 人工序列

<220>

<223> 含有Gordonia effusa的CAR基因(经密码子优化)和大肠杆菌的entD

基因的DNA片段的核苷酸序列

<400> 20

ccaagcttgc atgccagatc gtttagatcc gaaggaaaac gtcgaaaagc aatttgcttt 60

tcgacgcccc accccgcgcg ttttagcgtg tcagtagacg cgtagggtaa gtggggtagc 120

ggcttgttag atatcttgaa atcggctttc aacagcattg atttcgatgt atttagctgg 180

ccgtttgaga cgcgatgtcc acagggtagc tggtagtttg aaaatcaacg ccgttgccct 240

taggattcag taactggcac attttgtaat gcgctagatc tgtgtgccca gtcttccagg 300

ctgcttatca cagtgaaagc aaaaccaatt cgtggctgcg aaagtcgtag ccaccacgaa 360

gtccaggagg acatacaatg agcgatcagc cgaatgcact gccgagcgca attgaaccgc 420

tgaatccgga tccgcaggca accgagcaga ttagccattg tgcaaccatt gcagaactgg 480

ttcgtgttct ggcagaaagc tatggtgatc gtccggcact gggttggcgt aataatagcg 540

atccgagcag ctggcatagc atgacctatc gtgatctggc cgaacgtgca gatagcatgg 600

cacgtctgct gcatagcacc ctgggtgttg cagaaaatga tcgtgttgca accgttggtt 660

ttaccagcgc agaatatacc attgcaagcc tggcagttgg tacactgggt gcaatggaag 720

ttccgctgca gaatgcaggt agcgttgatg tttgggcagc aattctgacc gaaaccgatt 780

gtgttagcgc agttgttgca gcagatcagc tgccgagcat tgcccgtctg gcggaaagcg 840

gcacctatac cggtctgcgt catgttctgg tttttgatat tggtagccgt gatggcacca 900

ccctggatga tgcagcacgt cgtctggttg ccgcaggcac ccaggttcat ctgcgtcagc 960

ctggtgcaga accgaccacc cctccggcac cgctgccgca gattaccgca aacccggatc 1020

gtgtggcact gctgatttat accagcggta gcacaggtgc accgaaaggt gcaatgtata 1080

ccgaaacagc agttacccgt ctgtttcaga gcggtctgag tggtctgggt cgtgcaaccg 1140

atggtcatgg ttggattacc ctgaacttta tgccgatgag ccatgttatg ggtcgtagta 1200

ccctgtggca gaccctgggt aatggtggca ccgcatattt tacaccgcgt gcagatctgg 1260

ctgaactgct gaccgatctg gcagccgttc agccgacgga tctgcagttt gttccgcgta 1320

tttgggatat gctgtatcaa gaatatgttc gtctgacaga tcaggatgtt agcgaacagg 1380

atgcactgac ccgtatgcgt gaacattatt tcggcacccg taccgcaacc gcaattaccg 1440

gtagcgcacc gattagtgat gaagttcgtc gttttgttga agcaatgctg ccggttccgc 1500

tgattgaagg ttatggtagc accgaagcag ccggtgttag cattgatggt cgtattcagc 1560

gtccgcctgt tgttgattat aaactgctgg atgtgccgga actgggttat ctgagcaccg 1620

atcgtccgca tccgcgtggt gagctgctgg ttaaaaccga tcatattttt gccggttatt 1680

acaatcgtcc ggatctgacc agcagcgttt ttgatgatca gggttattat cgtaccggtg 1740

atattgttgc cgaaaccggt ccggatcaga ttgaatatgt tgatcgtcgt aacaacgtga 1800

tgaaactgag ccagggtgaa tttgttgcaa ttgcccatat tgaagcagtt ctgaccaccc 1860

caccgattca gcagctgtat gtttatggta atagcgcacg tccgtatctg ctggccgttg 1920

ttgttccgac accggaactg cgtgaacgtc atgcagatga taatgaactg cgtcgtgaag 1980

ttctgacagc actgcgtagc catggtgaac gtaatggtct ggcagcagtt gaaattccgc 2040

gtgatgttat tgttgaacgt accccgttta gcctggaaaa tggtctgctg acaggtattc 2100

gtaaactggc acgtccgcag ctgaaagaac gttatggtgc acgtctggaa gcactgtatg 2160

ccgaactggc cgatagccgt attacacgtc tgcgtgatgt gaaagcagtt gcagcccagc 2220

gtagcaccgt taccaccgtt attgatgttg ttaccgcaat tctggatctg gcggatggtg 2280

aagttaccgc agcagcacat tttacagatc tgggtggtga tagcctgacc gcagttaccg 2340

ttggtaacga actgcgcgat atttttgatg ccgaagttcc ggttggtgtg ctgaccagcc 2400

cgagcagtac cctggcagat attgcggaac atattgatgg ccgtcatagc gaagcacgtc 2460

cgaccgcaga aagcgttcat ggcaccggta caaccctgcg tgcagccgat ctgaccctgg 2520

ataaatttct ggatgaagaa acactgcgtg ccgcaagtga tgttaccagt gcagccaccg 2580

atgttcgtac cgtgtttatt accggtgcaa ccggttttct gggtcgctac ctgacactgg 2640

attggctgcg tcgtatggca aaagttggtg gtacagttat ttgtctggtg cgtggtgccg 2700

atgatgacgc agcccgtgcg cgtctggatg cagcatttga tagcagcgat ctgtggtctg 2760

aatatcagcg tctggcaaaa gatcatctgc gcgtgctggc aggcgataaa gatagcgatc 2820

atctggcact gacaccggat gtgtgggatg aactggcaaa aagcgttgat ctgattattg 2880

atccggcagc actggttaat catgtactgc cgtatcgcga actgtttggt ccgaatgtta 2940

gcggcaccgc agaactgatc cgtctggcag ttaccaccac ccgtaaaccg tatgtgtata 3000

tttcaaccgt gggtgttggt gatcaggttg ctccgggtag ctttaccgaa gatcctgata 3060

ttcgtgaaat gagcagcgtg cgtgaaatca atgataccta tgcaaatggt tacggcaata 3120

gcaaatgggc aggcgaagtt ctgctggcac aggcacatga acgttttgaa ctgccggtta 3180

gcgtttttcg ttgtgatatg attgttgcgg atgatcatac cattggtcag ctgaatctgc 3240

cggatatgtt tactcgcctg ctgatgagcg ttctggcaac aggtctggca ccgcgtagct 3300

tttatcagct ggcgaccgat ggtagtgcac aagaggcaca ttttgatgcg ctgccggtgg 3360

atttcctggc cgaagcaatt aatacactgt gggttaaaga tggtgcccgt acctttaatg 3420

caatgaatcc gcatgccgat ggtattggtt ttgatcagta tattcgttgg ctgattgata 3480

gcggtgaaca aattagcctg gtggataatt atgatgattg gtatcgtcgc tttggtgccg 3540

cactggcgga tctgcctgaa aaacagcgtc gtggtagcct gattccgctg ctgcacaatt 3600

atgttcatcc gatgacaccg cataatcgtg gtatggcaag cgcagatcgt tttcatgatg 3660

cagttcgtac agcaggcgtt ggtcagagca gcgatattcc gcatattacc cctcagatta 3720

ttgaaaatta tgcacgtagc ctgcgtggcc tgggtgtgat ttaaaggagg acatacaatg 3780

gtcgatatga aaactacgca tacctccctc ccctttgccg gacatacgct gcattttgtt 3840

gagttcgatc cggcgaattt ttgtgagcag gatttactct ggctgccgca ctacgcacaa 3900

ctgcaacacg ctggacgtaa acgtaaaaca gagcatttag ccggacggat cgctgctgtt 3960

tatgctttgc gggaatatgg ctataaatgt gtgcccgcaa tcggcgagct acgccaacct 4020

gtctggcctg cggaggtata cggcagtatt agccactgtg ggactacggc attagccgtg 4080

gtatctcgtc aaccgattgg cattgatata gaagaaattt tttctgtaca aaccgcaaga 4140

gaattgacag acaacattat tacaccagcg gaacacgagc gactcgcaga ctgcggttta 4200

gccttttctc tggcgctgac actggcattt tccgccaaag agagcgcatt taaggcaagt 4260

gagatccaaa ctgatgcagg ttttctggac tatcagataa ttagctggaa taaacagcag 4320

gtcatcattc atcgtgagaa tgagatgttt gctgtgcact ggcagataaa agaaaagata 4380

gtcataacgc tgtgccaaca cgattaattg acaacatctg gtacgattcg cccgcagcca 4440

tcactgacca cgggcgaaag tgtaaagcag gtgccttacc atcctgacct gacaaccgga 4500

tatgcgggat ccccgggtac cg 4522

<210> 21

<211> 621

<212> DNA

<213> 大肠杆菌

<400> 21

atgaaaacta cgcatacctc cctccccttt gccggacata cgctgcattt tgttgagttc 60

gatccggcga atttttgtga gcaggattta ctctggctgc cgcactacgc acaactgcaa 120

cacgctggac gtaaacgtaa aacagagcat ttagccggac ggatcgctgc tgtttatgct 180

ttgcgggaat atggctataa atgtgtgccc gcaatcggcg agctacgcca acctgtctgg 240

cctgcggagg tatacggcag tattagccac tgtgggacta cggcattagc cgtggtatct 300

cgtcaaccga ttggcattga tatagaagaa attttttctg tacaaaccgc aagagaattg 360

acagacaaca ttattacacc agcggaacac gagcgactcg cagactgcgg tttagccttt 420

tctctggcgc tgacactggc attttccgcc aaagagagcg catttaaggc aagtgagatc 480

caaactgatg caggttttct ggactatcag ataattagct ggaataaaca gcaggtcatc 540

attcatcgtg agaatgagat gtttgctgtg cactggcaga taaaagaaaa gatagtcata 600

acgctgtgcc aacacgatta a 621

<210> 22

<211> 206

<212> PRT

<213> 大肠杆菌

<400> 22

Met Lys Thr Thr His Thr Ser Leu Pro Phe Ala Gly His Thr Leu His

1 5 10 15

Phe Val Glu Phe Asp Pro Ala Asn Phe Cys Glu Gln Asp Leu Leu Trp

20 25 30

Leu Pro His Tyr Ala Gln Leu Gln His Ala Gly Arg Lys Arg Lys Thr

35 40 45

Glu His Leu Ala Gly Arg Ile Ala Ala Val Tyr Ala Leu Arg Glu Tyr

50 55 60

Gly Tyr Lys Cys Val Pro Ala Ile Gly Glu Leu Arg Gln Pro Val Trp

65 70 75 80

Pro Ala Glu Val Tyr Gly Ser Ile Ser His Cys Gly Thr Thr Ala Leu

85 90 95

Ala Val Val Ser Arg Gln Pro Ile Gly Ile Asp Ile Glu Glu Ile Phe

100 105 110

Ser Val Gln Thr Ala Arg Glu Leu Thr Asp Asn Ile Ile Thr Pro Ala

115 120 125

Glu His Glu Arg Leu Ala Asp Cys Gly Leu Ala Phe Ser Leu Ala Leu

130 135 140

Thr Leu Ala Phe Ser Ala Lys Glu Ser Ala Phe Lys Ala Ser Glu Ile

145 150 155 160

Gln Thr Asp Ala Gly Phe Leu Asp Tyr Gln Ile Ile Ser Trp Asn Lys

165 170 175

Gln Gln Val Ile Ile His Arg Glu Asn Glu Met Phe Ala Val His Trp

180 185 190

Gln Ile Lys Glu Lys Ile Val Ile Thr Leu Cys Gln His Asp

195 200 205

<210> 23

<211> 654

<212> DNA

<213> 谷氨酸棒杆菌

<400> 23

atgctggatg agtctttgtt tccaaattcg gcaaagtttt ctttcattaa aactggcgat 60

gctgttaatt tagaccattt ccatcagttg catccgttgg aaaaggcact ggtagcgcac 120

tcggttgata ttagaaaagc agagtttgga gatgccaggt ggtgtgcaca tcaggcactc 180

caagctttgg gacgagatag cggtgatccc attttgcgtg gggaacgagg aatgccattg 240

tggccttctt cggtgtctgg ttcattgacc cacactgacg gattccgagc tgctgttgtg 300

gcgccacgat tgttggtgcg ttctatggga ttggatgccg aacctgcgga gccgttgccc 360

aaggatgttt tgggttcaat cgctcgggtg ggggagattc ctcaacttaa gcgcttggag 420

gaacaaggtg tgcactgcgc ggatcgcctg ctgttttgtg ccaaggaagc aacatacaaa 480

gcgtggttcc cgctgacgca taggtggctt ggttttgaac aagctgagat cgacttgcgt 540

gatgatggca cttttgtgtc ctatttgctg gttcgaccaa ctccagtgcc gtttatttca 600

ggtaaatggg tactgcgtga tggttatgtc atagctgcga ctgcagtgac ttga 654

<210> 24

<211> 217

<212> PRT

<213> 谷氨酸棒杆菌

<400> 24

Met Leu Asp Glu Ser Leu Phe Pro Asn Ser Ala Lys Phe Ser Phe Ile

1 5 10 15

Lys Thr Gly Asp Ala Val Asn Leu Asp His Phe His Gln Leu His Pro

20 25 30

Leu Glu Lys Ala Leu Val Ala His Ser Val Asp Ile Arg Lys Ala Glu

35 40 45

Phe Gly Asp Ala Arg Trp Cys Ala His Gln Ala Leu Gln Ala Leu Gly

50 55 60

Arg Asp Ser Gly Asp Pro Ile Leu Arg Gly Glu Arg Gly Met Pro Leu

65 70 75 80

Trp Pro Ser Ser Val Ser Gly Ser Leu Thr His Thr Asp Gly Phe Arg

85 90 95

Ala Ala Val Val Ala Pro Arg Leu Leu Val Arg Ser Met Gly Leu Asp

100 105 110

Ala Glu Pro Ala Glu Pro Leu Pro Lys Asp Val Leu Gly Ser Ile Ala

115 120 125

Arg Val Gly Glu Ile Pro Gln Leu Lys Arg Leu Glu Glu Gln Gly Val

130 135 140

His Cys Ala Asp Arg Leu Leu Phe Cys Ala Lys Glu Ala Thr Tyr Lys

145 150 155 160

Ala Trp Phe Pro Leu Thr His Arg Trp Leu Gly Phe Glu Gln Ala Glu

165 170 175

Ile Asp Leu Arg Asp Asp Gly Thr Phe Val Ser Tyr Leu Leu Val Arg

180 185 190

Pro Thr Pro Val Pro Phe Ile Ser Gly Lys Trp Val Leu Arg Asp Gly

195 200 205

Tyr Val Ile Ala Ala Thr Ala Val Thr

210 215

<210> 25

<211> 1428

<212> DNA

<213> 谷氨酸棒杆菌

<400> 25

atgcgcctgc gtgtctcgag tagtctcctc cccttcctcg tccccaacct cgaccattac 60

ggtcgccctc tcctaaagga gcctggcatg gatatccgcc aaacaattaa cgacacagca 120

atgtcgagat atcagtggtt cattgtattt atcgcagtgc tgctcaacgc actggacggc 180

tttgatgtcc tcgccatgtc ttttactgcg aatgcagtga ccgaagaatt tggactgagt 240

ggcagccagc ttggtgtgct gctgagttcc gcgctgttcg gcatgaccgc tggatctttg 300

ctgttcggtc cgatcggtga ccgtttcggc cgtaagaatg ccctgatgat cgcgctgctg 360

ttcaacgtgg tgggattggt attgtccgcc accgcgcagt ccgcaggcca gttgggcgtg 420

tggcgtttga tcactggtat cggcatcggc ggaatcctcg cctgcatcac agtggtgatc 480

agtgagttct ccaacaacaa aaaccgcggc atggccatgt ccatctacgc tgctggttac 540

ggcatcggcg cgtccttggg cggattcggc gcagcgcagc tcatcccaac atttggatgg 600

cgctccgtgt tcgcagccgg tgcgatcgca actggtatcg ccaccatcgc tactttcttc 660

ttcctgccag aatccgttga ttggctgagc actcgccgcc ctgcgggcgc tcgcgacaag 720

atcaattaca ttgcgcgccg cctgggcaaa gtcggtacct ttgagcttcc aggcgaacaa 780

agcttgtcga cgaaaaaagc cggtctccaa tcgtatgcag tgctcgttaa caaagagaac 840

cgtggaacca gcatcaagct gtgggttgcg ttcggcatcg tgatgttcgg cttctacttc 900

gccaacactt ggaccccgaa gctgctcgtg gaaaccggaa tgtcagaaca gcagggcatc 960

atcggtggtt tgatgttgtc catgggtgga gcattcggtt ccctgctcta cggtttcctc 1020

accaccaagt tcagctcccg aaacacactg atgaccttca tggtgctgtc cggcctgacg 1080

ctgatcctgt tcatttcctc cacctctgtt ccatccatcg cgtttgccag cggcgttgtc 1140

gtgggcatgc tgatcaatgg ttgtgtggct ggtctgtaca ccctgtcccc acagctgtac 1200

tccgctgaag tacgcaccac tggtgtgggc gctgcgattg gtatgggtcg tgtcggtgcg 1260

atttccgcgc cactgctggt gggtagcctg ctggattctg gctggtcccc aacgcagctg 1320

tatgttggtg tggcagtgat tgttattgcc ggtgcaaccg cattgattgg gatgcgcact 1380

caggcagtag ccgtcgaaaa gcagcctgaa gccctagcga ccaaatag 1428

<210> 26

<211> 475

<212> PRT

<213> 谷氨酸棒杆菌

<400> 26

Met Arg Leu Arg Val Ser Ser Ser Leu Leu Pro Phe Leu Val Pro Asn

1 5 10 15

Leu Asp His Tyr Gly Arg Pro Leu Leu Lys Glu Pro Gly Met Asp Ile

20 25 30

Arg Gln Thr Ile Asn Asp Thr Ala Met Ser Arg Tyr Gln Trp Phe Ile

35 40 45

Val Phe Ile Ala Val Leu Leu Asn Ala Leu Asp Gly Phe Asp Val Leu

50 55 60

Ala Met Ser Phe Thr Ala Asn Ala Val Thr Glu Glu Phe Gly Leu Ser

65 70 75 80

Gly Ser Gln Leu Gly Val Leu Leu Ser Ser Ala Leu Phe Gly Met Thr

85 90 95

Ala Gly Ser Leu Leu Phe Gly Pro Ile Gly Asp Arg Phe Gly Arg Lys

100 105 110

Asn Ala Leu Met Ile Ala Leu Leu Phe Asn Val Val Gly Leu Val Leu

115 120 125

Ser Ala Thr Ala Gln Ser Ala Gly Gln Leu Gly Val Trp Arg Leu Ile

130 135 140

Thr Gly Ile Gly Ile Gly Gly Ile Leu Ala Cys Ile Thr Val Val Ile

145 150 155 160

Ser Glu Phe Ser Asn Asn Lys Asn Arg Gly Met Ala Met Ser Ile Tyr

165 170 175

Ala Ala Gly Tyr Gly Ile Gly Ala Ser Leu Gly Gly Phe Gly Ala Ala

180 185 190

Gln Leu Ile Pro Thr Phe Gly Trp Arg Ser Val Phe Ala Ala Gly Ala

195 200 205

Ile Ala Thr Gly Ile Ala Thr Ile Ala Thr Phe Phe Phe Leu Pro Glu

210 215 220

Ser Val Asp Trp Leu Ser Thr Arg Arg Pro Ala Gly Ala Arg Asp Lys

225 230 235 240

Ile Asn Tyr Ile Ala Arg Arg Leu Gly Lys Val Gly Thr Phe Glu Leu

245 250 255

Pro Gly Glu Gln Ser Leu Ser Thr Lys Lys Ala Gly Leu Gln Ser Tyr

260 265 270

Ala Val Leu Val Asn Lys Glu Asn Arg Gly Thr Ser Ile Lys Leu Trp

275 280 285

Val Ala Phe Gly Ile Val Met Phe Gly Phe Tyr Phe Ala Asn Thr Trp

290 295 300

Thr Pro Lys Leu Leu Val Glu Thr Gly Met Ser Glu Gln Gln Gly Ile

305 310 315 320

Ile Gly Gly Leu Met Leu Ser Met Gly Gly Ala Phe Gly Ser Leu Leu

325 330 335

Tyr Gly Phe Leu Thr Thr Lys Phe Ser Ser Arg Asn Thr Leu Met Thr

340 345 350

Phe Met Val Leu Ser Gly Leu Thr Leu Ile Leu Phe Ile Ser Ser Thr

355 360 365

Ser Val Pro Ser Ile Ala Phe Ala Ser Gly Val Val Val Gly Met Leu

370 375 380

Ile Asn Gly Cys Val Ala Gly Leu Tyr Thr Leu Ser Pro Gln Leu Tyr

385 390 395 400

Ser Ala Glu Val Arg Thr Thr Gly Val Gly Ala Ala Ile Gly Met Gly

405 410 415

Arg Val Gly Ala Ile Ser Ala Pro Leu Leu Val Gly Ser Leu Leu Asp

420 425 430

Ser Gly Trp Ser Pro Thr Gln Leu Tyr Val Gly Val Ala Val Ile Val

435 440 445

Ile Ala Gly Ala Thr Ala Leu Ile Gly Met Arg Thr Gln Ala Val Ala

450 455 460

Val Glu Lys Gln Pro Glu Ala Leu Ala Thr Lys

465 470 475

<210> 27

<211> 1296

<212> DNA

<213> 谷氨酸棒杆菌

<400> 27

gtgtcaacga ccaccccaac ccgcgcaacc aaaagtgtcg gaacagttct cgcactcctg 60

tggttcgcaa ttgtcctcga cggctttgac ctagtcgtcc tgggcgcaac aatcccgtcc 120

atgctggagg atcccgcgtg ggatctcact gctggacagg ccacacagat ttccaccatc 180

ggcctcgtcg gcatgaccat cggcgcactg accattggtt tcttaactga ccgtctgggt 240

cgacgccgcg tcatgctgtt ctctgtggca gtgttttctg tattcaccct cctgctggca 300

ttcaccacca acgtccagct cttcagcctg tggcgtttcc tcgcaggtgt tggccttggt 360

ggagcactcc ccaccgcaat tgccatggtg accgagtttc gccccggcac caaagcgggc 420

tctgcatcaa ctaccttgat gaccggatac cacgtcgggg cagtagcaac cgctttcctt 480

ggtctcttcc ttatcgacgg ctttggttgg cactccatgt tcatcgcagg cgctgtgcca 540

ggactactcc tgctgccact gctgtatttc ttccttccag aatccccgca gtacctcaaa 600

atctccggca agttggatga ggcgcaggca gttgcagcat cttatggact ttccctggat 660

gatgatcttg atcgcgaaca cgaagaagaa cttggcgagt cctcctcact ttcctccctg 720

ttcaagccct cgttccgccg caacaccctg gcgatttggg gcacctcatt catgggactc 780

ctcctggtct acggcctgaa cacatggctg ccacaaatca tgcgccaagc agactacgac 840

atgggtaact ccctgggctt cctcatggtt cttaacatcg gcgcagtgat cggcctttat 900

attgcagggc gaattgccga taagaactcc cctcgcaaaa cagcactcgt atggttcgtg 960

ttctctgcat ttttcctcgc actacttgct gtccggatgc cactgatcgg tctgtatggc 1020

atcgtgctgc tcaccggcat ctttgtgttc agctcccagg tactcatcta cgccttcgtt 1080

ggtgagaatc accctgccaa gatgcgtgca actgccatgg gattctccgc aggaattggt 1140

cgcctcggcg cgatctcggg tccgttgctg ggcggcctgc ttgtcagtgc caaccttgct 1200

tacccatggg gcttcttcgc cttcgctggc gttggactgc tgggcgcgct gattttctcc 1260

gcatcgaaga ctctgaggca tcgcgagaac gcttag 1296

<210> 28

<211> 431

<212> PRT

<213> 谷氨酸棒杆菌

<400> 28

Met Ser Thr Thr Thr Pro Thr Arg Ala Thr Lys Ser Val Gly Thr Val

1 5 10 15

Leu Ala Leu Leu Trp Phe Ala Ile Val Leu Asp Gly Phe Asp Leu Val

20 25 30

Val Leu Gly Ala Thr Ile Pro Ser Met Leu Glu Asp Pro Ala Trp Asp

35 40 45

Leu Thr Ala Gly Gln Ala Thr Gln Ile Ser Thr Ile Gly Leu Val Gly

50 55 60

Met Thr Ile Gly Ala Leu Thr Ile Gly Phe Leu Thr Asp Arg Leu Gly

65 70 75 80

Arg Arg Arg Val Met Leu Phe Ser Val Ala Val Phe Ser Val Phe Thr

85 90 95

Leu Leu Leu Ala Phe Thr Thr Asn Val Gln Leu Phe Ser Leu Trp Arg

100 105 110

Phe Leu Ala Gly Val Gly Leu Gly Gly Ala Leu Pro Thr Ala Ile Ala

115 120 125

Met Val Thr Glu Phe Arg Pro Gly Thr Lys Ala Gly Ser Ala Ser Thr

130 135 140

Thr Leu Met Thr Gly Tyr His Val Gly Ala Val Ala Thr Ala Phe Leu

145 150 155 160

Gly Leu Phe Leu Ile Asp Gly Phe Gly Trp His Ser Met Phe Ile Ala

165 170 175

Gly Ala Val Pro Gly Leu Leu Leu Leu Pro Leu Leu Tyr Phe Phe Leu

180 185 190

Pro Glu Ser Pro Gln Tyr Leu Lys Ile Ser Gly Lys Leu Asp Glu Ala

195 200 205

Gln Ala Val Ala Ala Ser Tyr Gly Leu Ser Leu Asp Asp Asp Leu Asp

210 215 220

Arg Glu His Glu Glu Glu Leu Gly Glu Ser Ser Ser Leu Ser Ser Leu

225 230 235 240

Phe Lys Pro Ser Phe Arg Arg Asn Thr Leu Ala Ile Trp Gly Thr Ser

245 250 255

Phe Met Gly Leu Leu Leu Val Tyr Gly Leu Asn Thr Trp Leu Pro Gln

260 265 270

Ile Met Arg Gln Ala Asp Tyr Asp Met Gly Asn Ser Leu Gly Phe Leu

275 280 285

Met Val Leu Asn Ile Gly Ala Val Ile Gly Leu Tyr Ile Ala Gly Arg

290 295 300

Ile Ala Asp Lys Asn Ser Pro Arg Lys Thr Ala Leu Val Trp Phe Val

305 310 315 320

Phe Ser Ala Phe Phe Leu Ala Leu Leu Ala Val Arg Met Pro Leu Ile

325 330 335

Gly Leu Tyr Gly Ile Val Leu Leu Thr Gly Ile Phe Val Phe Ser Ser

340 345 350

Gln Val Leu Ile Tyr Ala Phe Val Gly Glu Asn His Pro Ala Lys Met

355 360 365

Arg Ala Thr Ala Met Gly Phe Ser Ala Gly Ile Gly Arg Leu Gly Ala

370 375 380

Ile Ser Gly Pro Leu Leu Gly Gly Leu Leu Val Ser Ala Asn Leu Ala

385 390 395 400

Tyr Pro Trp Gly Phe Phe Ala Phe Ala Gly Val Gly Leu Leu Gly Ala

405 410 415

Leu Ile Phe Ser Ala Ser Lys Thr Leu Arg His Arg Glu Asn Ala

420 425 430

<210> 29

<211> 1131

<212> DNA

<213> 谷氨酸棒杆菌

<400> 29

atgacactgt ccgaacgcaa gctcaccacc accgccaaga ttcttcccca cccactcaac 60

gcctggtacg tcgccgcttg ggattatgaa gtcacatcta aaaagcccat ggccaggaca 120

atcgccaaca aaccactcgc tttgtaccgc accaaagatg gccgagccgt tgcccttgca 180

gacgcctgct ggcaccgcct cgcaccgcta tccaagggaa aactcgtggg cacagacgga 240

atccaatgcc cttatcacgg cttggagtac aactccgcgg gccgctgcat gaaaatgccc 300

gcgcaggaaa ccctcaaccc gtcagcagcc gtcaactcct accccgtggt ggaagcccac 360

cgctttgtgt gggtgtggct gggcgatccc acattggcag atcccaccca agtacccgat 420

atgcaccaga tgagccaccc cgaatgggca ggcgatggac gcaccatctc cgctgactgc 480

aactaccaat tagtgctgga caacttgatg gacctcaccc acgaagaatt cgtgcactcc 540

tccagcatcg gccaagacga acttagtgaa tcagagttcg tggtcaccca cactgaagat 600

tccgtgacgg tcacccgctg gatgcatgac atagatgcac caccgttttg gcaaaagaac 660

atgaatgata agttcccagg atttgaaggc aaggtggatc gttggcagat catccactac 720

tactaccctt ccaccatctg cattgatgtt ggtgtagcaa aggctggaac cggcgcgcag 780

gaaggcgacc gcagccaggg cgttaatggg tatgtaatga acaccattac cccagattca 840

gatcgttcct ctcattactt ctgggcattc atgcgcaact accgcctgga aagccaaacc 900

atcaccaccc agctgcgcga cggtgtatcc ggtgtattca aagaagacga agacatgctg 960

accgctcagc aagatgccat cgacgccaac accgactatg agttttacag cctcaacatt 1020

gatgccggtg gcatgtgggt gcgccgaatc ctcgaggaag cactctccaa ggaaggccga 1080

ctggatatcc ccaccacatt cccccgcgca acaccgaagc cggaggcata a 1131

<210> 30

<211> 376

<212> PRT

<213> 谷氨酸棒杆菌

<400> 30

Met Thr Leu Ser Glu Arg Lys Leu Thr Thr Thr Ala Lys Ile Leu Pro

1 5 10 15

His Pro Leu Asn Ala Trp Tyr Val Ala Ala Trp Asp Tyr Glu Val Thr

20 25 30

Ser Lys Lys Pro Met Ala Arg Thr Ile Ala Asn Lys Pro Leu Ala Leu

35 40 45

Tyr Arg Thr Lys Asp Gly Arg Ala Val Ala Leu Ala Asp Ala Cys Trp

50 55 60

His Arg Leu Ala Pro Leu Ser Lys Gly Lys Leu Val Gly Thr Asp Gly

65 70 75 80

Ile Gln Cys Pro Tyr His Gly Leu Glu Tyr Asn Ser Ala Gly Arg Cys

85 90 95

Met Lys Met Pro Ala Gln Glu Thr Leu Asn Pro Ser Ala Ala Val Asn

100 105 110

Ser Tyr Pro Val Val Glu Ala His Arg Phe Val Trp Val Trp Leu Gly

115 120 125

Asp Pro Thr Leu Ala Asp Pro Thr Gln Val Pro Asp Met His Gln Met

130 135 140

Ser His Pro Glu Trp Ala Gly Asp Gly Arg Thr Ile Ser Ala Asp Cys

145 150 155 160

Asn Tyr Gln Leu Val Leu Asp Asn Leu Met Asp Leu Thr His Glu Glu

165 170 175

Phe Val His Ser Ser Ser Ile Gly Gln Asp Glu Leu Ser Glu Ser Glu

180 185 190

Phe Val Val Thr His Thr Glu Asp Ser Val Thr Val Thr Arg Trp Met

195 200 205

His Asp Ile Asp Ala Pro Pro Phe Trp Gln Lys Asn Met Asn Asp Lys

210 215 220

Phe Pro Gly Phe Glu Gly Lys Val Asp Arg Trp Gln Ile Ile His Tyr

225 230 235 240

Tyr Tyr Pro Ser Thr Ile Cys Ile Asp Val Gly Val Ala Lys Ala Gly

245 250 255

Thr Gly Ala Gln Glu Gly Asp Arg Ser Gln Gly Val Asn Gly Tyr Val

260 265 270

Met Asn Thr Ile Thr Pro Asp Ser Asp Arg Ser Ser His Tyr Phe Trp

275 280 285

Ala Phe Met Arg Asn Tyr Arg Leu Glu Ser Gln Thr Ile Thr Thr Gln

290 295 300

Leu Arg Asp Gly Val Ser Gly Val Phe Lys Glu Asp Glu Asp Met Leu

305 310 315 320

Thr Ala Gln Gln Asp Ala Ile Asp Ala Asn Thr Asp Tyr Glu Phe Tyr

325 330 335

Ser Leu Asn Ile Asp Ala Gly Gly Met Trp Val Arg Arg Ile Leu Glu

340 345 350

Glu Ala Leu Ser Lys Glu Gly Arg Leu Asp Ile Pro Thr Thr Phe Pro

355 360 365

Arg Ala Thr Pro Lys Pro Glu Ala

370 375

<210> 31

<211> 978

<212> DNA

<213> 谷氨酸棒杆菌

<400> 31

atgaactcgc aatggcaaga tgcacatgtt gtttccagcg aaatcatcgc tgcagacatt 60

cgacgaatag aactatcccc gaaatttgcg attccagtaa aacccggcga acatctcaag 120

atcatggtgc ccctaaaaac tggacaggaa aagagatcgt actccatcgt tgacgctcgt 180

cacgacggtt cgactctcgc cctgagcgta ctcaaaacca gaaactcccg tggaggatct 240

gagttcatgc atacgcttcg agctggagac acagttactg tctccaggcc gtctcaggat 300

tttcctctcc gcgtgggtgc gcctgagtat gtacttgttg ccggcggaat tggaatcaca 360

gcgatccgtt caatggcatc tttattaaag aaattgggag caaactaccg cattcatttc 420

gcagcacgca gccttgatgc catggcttac aaagatgagc tcgtggcaga acacggcgac 480

aagctgcacc tgcatctaga ttctgaaggc accaccatcg atgtcccagc attgatcgaa 540

accttaaacc cccacactga gctttatatg tgcggcccca tccgcttgat ggatgccatc 600

cggcgcgcat ggaacacccg cggacttgac cccaccaatc tgcgtttcga aacgtttgga 660

aacagtggat ggttctcccc agaggttttc cacatccaag taccagagct ggggcttcac 720

gccacagtca acaaggatga aagcatgctg gaggctttgc aaaaggctgg ggcgaatatg 780

atgtttgatt gtcgaaaagg cgaatgtggt ttgtgccagg ttcgcgttct agaagtcgat 840

ggccaggttg atcaccgcga tgtgttcttc tctgatcgtc aaaaagaatc cgacgcaaag 900

gcatgcgcct gcgtgtctcg agtagtctcc tccccttcct cgtccccaac ctcgaccatt 960

acggtcgccc tctcctaa 978

<210> 32

<211> 325

<212> PRT

<213> 谷氨酸棒杆菌

<400> 32

Met Asn Ser Gln Trp Gln Asp Ala His Val Val Ser Ser Glu Ile Ile

1 5 10 15

Ala Ala Asp Ile Arg Arg Ile Glu Leu Ser Pro Lys Phe Ala Ile Pro

20 25 30

Val Lys Pro Gly Glu His Leu Lys Ile Met Val Pro Leu Lys Thr Gly

35 40 45

Gln Glu Lys Arg Ser Tyr Ser Ile Val Asp Ala Arg His Asp Gly Ser

50 55 60

Thr Leu Ala Leu Ser Val Leu Lys Thr Arg Asn Ser Arg Gly Gly Ser

65 70 75 80

Glu Phe Met His Thr Leu Arg Ala Gly Asp Thr Val Thr Val Ser Arg

85 90 95

Pro Ser Gln Asp Phe Pro Leu Arg Val Gly Ala Pro Glu Tyr Val Leu

100 105 110

Val Ala Gly Gly Ile Gly Ile Thr Ala Ile Arg Ser Met Ala Ser Leu

115 120 125

Leu Lys Lys Leu Gly Ala Asn Tyr Arg Ile His Phe Ala Ala Arg Ser

130 135 140

Leu Asp Ala Met Ala Tyr Lys Asp Glu Leu Val Ala Glu His Gly Asp

145 150 155 160

Lys Leu His Leu His Leu Asp Ser Glu Gly Thr Thr Ile Asp Val Pro

165 170 175

Ala Leu Ile Glu Thr Leu Asn Pro His Thr Glu Leu Tyr Met Cys Gly

180 185 190

Pro Ile Arg Leu Met Asp Ala Ile Arg Arg Ala Trp Asn Thr Arg Gly

195 200 205

Leu Asp Pro Thr Asn Leu Arg Phe Glu Thr Phe Gly Asn Ser Gly Trp

210 215 220

Phe Ser Pro Glu Val Phe His Ile Gln Val Pro Glu Leu Gly Leu His

225 230 235 240

Ala Thr Val Asn Lys Asp Glu Ser Met Leu Glu Ala Leu Gln Lys Ala

245 250 255

Gly Ala Asn Met Met Phe Asp Cys Arg Lys Gly Glu Cys Gly Leu Cys

260 265 270

Gln Val Arg Val Leu Glu Val Asp Gly Gln Val Asp His Arg Asp Val

275 280 285

Phe Phe Ser Asp Arg Gln Lys Glu Ser Asp Ala Lys Ala Cys Ala Cys

290 295 300

Val Ser Arg Val Val Ser Ser Pro Ser Ser Ser Pro Thr Ser Thr Ile

305 310 315 320

Thr Val Ala Leu Ser

325

<210> 33

<211> 615

<212> DNA

<213> 谷氨酸棒杆菌

<400> 33

atgattgata cagggaagaa cggcgagttc cgctacgagc agtcgaatat catcgatcag 60

aacgaagccg agttcggcat cactccttca cagaccgtgg gcccttacgt ccacatcggt 120

ttgacccttg aaggtgcgga gcatctcgtg gagccaggtt cggaaggcgc ggtgtccttt 180

actgtttccg caactgatgg caacggcgac cccatcgcgg atgccatgtt tgaactgtgg 240

caggccgatc cagagggcat ccacaactct gatttggatc caaaccgcac agcaccagca 300

accgcagatg gcttccgcgg gcttggtcgc gcgatggcaa acgcgcaggg tgaggcaacg 360

ttcaccactt tggttccggg agcattcgca gatgaggcac cacacttcaa ggttggtgtg 420

ttcgcccgtg gcatgctgga gcgtctgtac actcgcgcat acctgccaga cgccgatttg 480

agcaccgacc cagttttggc tgtggtccca gctgatcgac gtgacctcct ggtggctcaa 540

aagaccgatg atggattccg cttcgacatc actgtccagg ctgaagacaa tgaaacccca 600

ttttttggac tctaa 615

<210> 34

<211> 204

<212> PRT

<213> 谷氨酸棒杆菌

<400> 34

Met Ile Asp Thr Gly Lys Asn Gly Glu Phe Arg Tyr Glu Gln Ser Asn

1 5 10 15

Ile Ile Asp Gln Asn Glu Ala Glu Phe Gly Ile Thr Pro Ser Gln Thr

20 25 30

Val Gly Pro Tyr Val His Ile Gly Leu Thr Leu Glu Gly Ala Glu His

35 40 45

Leu Val Glu Pro Gly Ser Glu Gly Ala Val Ser Phe Thr Val Ser Ala

50 55 60

Thr Asp Gly Asn Gly Asp Pro Ile Ala Asp Ala Met Phe Glu Leu Trp

65 70 75 80

Gln Ala Asp Pro Glu Gly Ile His Asn Ser Asp Leu Asp Pro Asn Arg

85 90 95

Thr Ala Pro Ala Thr Ala Asp Gly Phe Arg Gly Leu Gly Arg Ala Met

100 105 110

Ala Asn Ala Gln Gly Glu Ala Thr Phe Thr Thr Leu Val Pro Gly Ala

115 120 125

Phe Ala Asp Glu Ala Pro His Phe Lys Val Gly Val Phe Ala Arg Gly

130 135 140

Met Leu Glu Arg Leu Tyr Thr Arg Ala Tyr Leu Pro Asp Ala Asp Leu

145 150 155 160

Ser Thr Asp Pro Val Leu Ala Val Val Pro Ala Asp Arg Arg Asp Leu

165 170 175

Leu Val Ala Gln Lys Thr Asp Asp Gly Phe Arg Phe Asp Ile Thr Val

180 185 190

Gln Ala Glu Asp Asn Glu Thr Pro Phe Phe Gly Leu

195 200

<210> 35

<211> 693

<212> DNA

<213> 谷氨酸棒杆菌

<400> 35

atggacatcc cacacttcgc cccgacggga ggcgaatact ccccactgca cttcccggag 60

taccggacca ccatcaagcg caacccaagc aacgatctca tcatggttcc tagtcgcctc 120

ggcgagtcca cgggacctgt cttcggcgac cgcgacttgg gagacatcga caacgacatg 180

accaaggtga acggtggcga ggctatcggc cagcgcatct tcgttcacgg ccgtgtcctc 240

ggtttcgatg gcaagccagt tccgcacacc ttggtcgagg cgtggcaggc aaacgccgca 300

ggccgttacc gccacaagaa tgactcctgg ccagcgccac tggatccaca cttcaacggt 360

gttgcacgta ctctcaccga caaggacggc cagtaccact tctggaccgt tatgccaggt 420

aattaccctt ggggtaacca ccacaacgca tggcgcccgg cgcacattca cttctcgctc 480

tatggtcgtc agtttacgga gcgtctggtc acccagatgt acttcccgaa cgatccattg 540

ttcttccagg atccgatcta caacgcggtg ccaaagggtg cacgtgagcg catgatcgca 600

acgttcgact atgacgagac ccgtgaaaac ttcgcgcttg gttacaagtt cgacatcgtc 660

cttcgtggcc gcaacgccac cccatttgag taa 693

<210> 36

<211> 230

<212> PRT

<213> 谷氨酸棒杆菌

<400> 36

Met Asp Ile Pro His Phe Ala Pro Thr Gly Gly Glu Tyr Ser Pro Leu

1 5 10 15

His Phe Pro Glu Tyr Arg Thr Thr Ile Lys Arg Asn Pro Ser Asn Asp

20 25 30

Leu Ile Met Val Pro Ser Arg Leu Gly Glu Ser Thr Gly Pro Val Phe

35 40 45

Gly Asp Arg Asp Leu Gly Asp Ile Asp Asn Asp Met Thr Lys Val Asn

50 55 60

Gly Gly Glu Ala Ile Gly Gln Arg Ile Phe Val His Gly Arg Val Leu

65 70 75 80

Gly Phe Asp Gly Lys Pro Val Pro His Thr Leu Val Glu Ala Trp Gln

85 90 95

Ala Asn Ala Ala Gly Arg Tyr Arg His Lys Asn Asp Ser Trp Pro Ala

100 105 110

Pro Leu Asp Pro His Phe Asn Gly Val Ala Arg Thr Leu Thr Asp Lys

115 120 125

Asp Gly Gln Tyr His Phe Trp Thr Val Met Pro Gly Asn Tyr Pro Trp

130 135 140

Gly Asn His His Asn Ala Trp Arg Pro Ala His Ile His Phe Ser Leu

145 150 155 160

Tyr Gly Arg Gln Phe Thr Glu Arg Leu Val Thr Gln Met Tyr Phe Pro

165 170 175

Asn Asp Pro Leu Phe Phe Gln Asp Pro Ile Tyr Asn Ala Val Pro Lys

180 185 190

Gly Ala Arg Glu Arg Met Ile Ala Thr Phe Asp Tyr Asp Glu Thr Arg

195 200 205

Glu Asn Phe Ala Leu Gly Tyr Lys Phe Asp Ile Val Leu Arg Gly Arg

210 215 220

Asn Ala Thr Pro Phe Glu

225 230

<210> 37

<211> 1164

<212> DNA

<213> 大肠杆菌

<400> 37

atgaacaact ttaatctgca caccccaacc cgcattctgt ttggtaaagg cgcaatcgct 60

ggtttacgcg aacaaattcc tcacgatgct cgcgtattga ttacctacgg cggcggcagc 120

gtgaaaaaaa ccggcgttct cgatcaagtt ctggatgccc tgaaaggcat ggacgtgctg 180

gaatttggcg gtattgagcc aaacccggct tatgaaacgc tgatgaacgc cgtgaaactg 240

gttcgcgaac agaaagtgac tttcctgctg gcggttggcg gcggttctgt actggacggc 300

accaaattta tcgccgcagc ggctaactat ccggaaaata tcgatccgtg gcacattctg 360

caaacgggcg gtaaagagat taaaagcgcc atcccgatgg gctgtgtgct gacgctgcca 420

gcaaccggtt cagaatccaa cgcaggcgcg gtgatctccc gtaaaaccac aggcgacaag 480

caggcgttcc attctgccca tgttcagccg gtatttgccg tgctcgatcc ggtttatacc 540

tacaccctgc cgccgcgtca ggtggctaac ggcgtagtgg acgcctttgt acacaccgtg 600

gaacagtatg ttaccaaacc ggttgatgcc aaaattcagg accgtttcgc agaaggcatt 660

ttgctgacgc taatcgaaga tggtccgaaa gccctgaaag agccagaaaa ctacgatgtg 720

cgcgccaacg tcatgtgggc ggcgactcag gcgctgaacg gtttgattgg cgctggcgta 780

ccgcaggact gggcaacgca tatgctgggc cacgaactga ctgcgatgca cggtctggat 840

cacgcgcaaa cactggctat cgtcctgcct gcactgtgga atgaaaaacg cgataccaag 900

cgcgctaagc tgctgcaata tgctgaacgc gtctggaaca tcactgaagg ttccgatgat 960

gagcgtattg acgccgcgat tgccgcaacc cgcaatttct ttgagcaatt aggcgtgccg 1020

acccacctct ccgactacgg tctggacggc agctccatcc cggctttgct gaaaaaactg 1080

gaagagcacg gcatgaccca actgggcgaa aatcatgaca ttacgttgga tgtcagccgc 1140

cgtatatacg aagccgcccg ctaa 1164

<210> 38

<211> 387

<212> PRT

<213> 大肠杆菌

<400> 38

Met Asn Asn Phe Asn Leu His Thr Pro Thr Arg Ile Leu Phe Gly Lys

1 5 10 15

Gly Ala Ile Ala Gly Leu Arg Glu Gln Ile Pro His Asp Ala Arg Val

20 25 30

Leu Ile Thr Tyr Gly Gly Gly Ser Val Lys Lys Thr Gly Val Leu Asp

35 40 45

Gln Val Leu Asp Ala Leu Lys Gly Met Asp Val Leu Glu Phe Gly Gly

50 55 60

Ile Glu Pro Asn Pro Ala Tyr Glu Thr Leu Met Asn Ala Val Lys Leu

65 70 75 80

Val Arg Glu Gln Lys Val Thr Phe Leu Leu Ala Val Gly Gly Gly Ser

85 90 95

Val Leu Asp Gly Thr Lys Phe Ile Ala Ala Ala Ala Asn Tyr Pro Glu

100 105 110

Asn Ile Asp Pro Trp His Ile Leu Gln Thr Gly Gly Lys Glu Ile Lys

115 120 125

Ser Ala Ile Pro Met Gly Cys Val Leu Thr Leu Pro Ala Thr Gly Ser

130 135 140

Glu Ser Asn Ala Gly Ala Val Ile Ser Arg Lys Thr Thr Gly Asp Lys

145 150 155 160

Gln Ala Phe His Ser Ala His Val Gln Pro Val Phe Ala Val Leu Asp

165 170 175

Pro Val Tyr Thr Tyr Thr Leu Pro Pro Arg Gln Val Ala Asn Gly Val

180 185 190

Val Asp Ala Phe Val His Thr Val Glu Gln Tyr Val Thr Lys Pro Val

195 200 205

Asp Ala Lys Ile Gln Asp Arg Phe Ala Glu Gly Ile Leu Leu Thr Leu

210 215 220

Ile Glu Asp Gly Pro Lys Ala Leu Lys Glu Pro Glu Asn Tyr Asp Val

225 230 235 240

Arg Ala Asn Val Met Trp Ala Ala Thr Gln Ala Leu Asn Gly Leu Ile

245 250 255

Gly Ala Gly Val Pro Gln Asp Trp Ala Thr His Met Leu Gly His Glu

260 265 270

Leu Thr Ala Met His Gly Leu Asp His Ala Gln Thr Leu Ala Ile Val

275 280 285

Leu Pro Ala Leu Trp Asn Glu Lys Arg Asp Thr Lys Arg Ala Lys Leu

290 295 300

Leu Gln Tyr Ala Glu Arg Val Trp Asn Ile Thr Glu Gly Ser Asp Asp

305 310 315 320

Glu Arg Ile Asp Ala Ala Ile Ala Ala Thr Arg Asn Phe Phe Glu Gln

325 330 335

Leu Gly Val Pro Thr His Leu Ser Asp Tyr Gly Leu Asp Gly Ser Ser

340 345 350

Ile Pro Ala Leu Leu Lys Lys Leu Glu Glu His Gly Met Thr Gln Leu

355 360 365

Gly Glu Asn His Asp Ile Thr Leu Asp Val Ser Arg Arg Ile Tyr Glu

370 375 380

Ala Ala Arg

385

<210> 39

<211> 1062

<212> DNA

<213> 谷氨酸棒杆菌

<400> 39

atgagcatcc aagtaaaagc actccagaaa accggccccg aagcaccttt cgaggtcaaa 60

atcattgagc gtcgtgagcc tcgcgctgac gacgtagtta tcgacatcaa agctgccggc 120

atctgccaca gcgatatcca caccatccgc aacgaatggg gcgaggcaca cttcccgctc 180

accgtcggcc acgaaatcgc aggcgttgtc tctgcggttg gctccgatgt aaccaagtgg 240

aaagtcggcg accgcgttgg cgtcggctgc ctagttaact cctgcggcga atgtgaacag 300

tgtgtcgcgg gatttgaaaa caactgcctt cgcggaaacg tcggaaccta caactccgac 360

gacgtcgacg gcaccatcac gcaaggtggc tacgccgaaa aggtagtggt caacgaacgt 420

ttcctctgca gcatcccaga ggaactcgac ttcgatgtcg cagcaccact gctgtgcgca 480

ggcatcacca cctactcccc gatcgctcgc tggaacgtta aagaaggcga caaagtagca 540

gtcatgggcc tcggcgggct cggccacatg ggtgtccaaa tcgccgcagc caagggcgct 600

gacgttaccg ttctgtcccg ttccctgcgc aaggctgaac ttgccaagga actcggcgca 660

gctcgcacgc ttgcgacttc tgatgaggat ttcttcaccg aacacgccgg tgaattcgac 720

ttcatcctca acaccattag cgcatccatc ccagtcgaca agtacctgag ccttctcaag 780

ccacacggtg tcatggctgt tgtcggtctg ccaccagaga agcagccact gagcttcggt 840

gcgctcatcg gcggcggaaa agtcctcacc ggatccaaca ttggcggcat ccctgaaacc 900

caggaaatgc tcgacttctg tgcaaaacac ggcctcggcg cgatgatcga aactgtcggc 960

gtcaacgatg ttgatgcagc ctacgaccgc gttgttgccg gcgacgttca gttccgcgtt 1020

gtcattgata ctgcttcgtt tgcagaggta gaggcggttt ag 1062

<210> 40

<211> 353

<212> PRT

<213> 谷氨酸棒杆菌

<400> 40

Met Ser Ile Gln Val Lys Ala Leu Gln Lys Thr Gly Pro Glu Ala Pro

1 5 10 15

Phe Glu Val Lys Ile Ile Glu Arg Arg Glu Pro Arg Ala Asp Asp Val

20 25 30

Val Ile Asp Ile Lys Ala Ala Gly Ile Cys His Ser Asp Ile His Thr

35 40 45

Ile Arg Asn Glu Trp Gly Glu Ala His Phe Pro Leu Thr Val Gly His

50 55 60

Glu Ile Ala Gly Val Val Ser Ala Val Gly Ser Asp Val Thr Lys Trp

65 70 75 80

Lys Val Gly Asp Arg Val Gly Val Gly Cys Leu Val Asn Ser Cys Gly

85 90 95

Glu Cys Glu Gln Cys Val Ala Gly Phe Glu Asn Asn Cys Leu Arg Gly

100 105 110

Asn Val Gly Thr Tyr Asn Ser Asp Asp Val Asp Gly Thr Ile Thr Gln

115 120 125

Gly Gly Tyr Ala Glu Lys Val Val Val Asn Glu Arg Phe Leu Cys Ser

130 135 140

Ile Pro Glu Glu Leu Asp Phe Asp Val Ala Ala Pro Leu Leu Cys Ala

145 150 155 160

Gly Ile Thr Thr Tyr Ser Pro Ile Ala Arg Trp Asn Val Lys Glu Gly

165 170 175

Asp Lys Val Ala Val Met Gly Leu Gly Gly Leu Gly His Met Gly Val

180 185 190

Gln Ile Ala Ala Ala Lys Gly Ala Asp Val Thr Val Leu Ser Arg Ser

195 200 205

Leu Arg Lys Ala Glu Leu Ala Lys Glu Leu Gly Ala Ala Arg Thr Leu

210 215 220

Ala Thr Ser Asp Glu Asp Phe Phe Thr Glu His Ala Gly Glu Phe Asp

225 230 235 240

Phe Ile Leu Asn Thr Ile Ser Ala Ser Ile Pro Val Asp Lys Tyr Leu

245 250 255

Ser Leu Leu Lys Pro His Gly Val Met Ala Val Val Gly Leu Pro Pro

260 265 270

Glu Lys Gln Pro Leu Ser Phe Gly Ala Leu Ile Gly Gly Gly Lys Val

275 280 285

Leu Thr Gly Ser Asn Ile Gly Gly Ile Pro Glu Thr Gln Glu Met Leu

290 295 300

Asp Phe Cys Ala Lys His Gly Leu Gly Ala Met Ile Glu Thr Val Gly

305 310 315 320

Val Asn Asp Val Asp Ala Ala Tyr Asp Arg Val Val Ala Gly Asp Val

325 330 335

Gln Phe Arg Val Val Ile Asp Thr Ala Ser Phe Ala Glu Val Glu Ala

340 345 350

Val

<210> 41

<211> 1113

<212> DNA

<213> 谷氨酸棒杆菌

<400> 41

gtgtccatga gcactgtcgt gcctggaatt gtcgccctgt ccaagggggc accggtagaa 60

aaagtaaacg ttgttgtccc tgatccaggt gctaacgatg tcatcgtcaa gattcaggcc 120

tgcggtgtgt gccacaccga cttggcctac cgcgatggcg atatttcaga tgagttccct 180

tacctcctcg gccacgaggc agcaggtatt gttgaggagg taggcgagtc cgtcacccac 240

gttgaggtcg gcgatttcgt catcttgaac tggcgtgcag tgtgcggcga gtgccgtgca 300

tgtaagaagg gcgagccaaa gtactgcttt aacacccaca acgcatctaa gaagatgacc 360

ctggaagacg gcaccgagct gtccccagca ctgggtattg gcgcgttctt ggaaaagacc 420

ctggtccacg aaggccagtg caccaaggtt aaccctgagg aagatccagc agcagctggc 480

cttctgggtt gcggcatcat ggcaggtctt ggtgctgcgg taaacaccgg tgatattaag 540

cgcggcgagt ccgtggcagt cttcggcctt ggtggcgtgg gcatggcagc tattgctggc 600

gccaagattg ctggtgcatc gaagattatt gctgttgata tcgatgagaa gaagttggag 660

tgggcgaagg aattcggcgc aacccacacc attaattcct ctggtcttgg tggcgagggt 720

gatgcctctg aggtcgtggc aaaggttcgt gagctcactg atggtttcgg tactgacgtc 780

tccatcgatg cggtaggcat catgccgacc tggcagcagg cgttttactc ccgtgatcat 840

gcaggccgca tggtgatggt gggcgttcca aacctgacgt ctcgcgtaga tgttcctgcg 900

attgattttt acggtcgcgg tggctctgtg cgccctgcat ggtacggcga ctgcctgcct 960

gagcgtgatt tcccaactta tgtggatctg cacctgcagg gtcgtttccc gctggataag 1020

tttgtttctg agcgtattgg tcttgatgat gttgaagagg ctttcaacac catgaaggct 1080

ggcgacgtgc tgcgttctgt ggtggagatc taa 1113

<210> 42

<211> 370

<212> PRT

<213> 谷氨酸棒杆菌

<400> 42

Met Ser Met Ser Thr Val Val Pro Gly Ile Val Ala Leu Ser Lys Gly

1 5 10 15

Ala Pro Val Glu Lys Val Asn Val Val Val Pro Asp Pro Gly Ala Asn

20 25 30

Asp Val Ile Val Lys Ile Gln Ala Cys Gly Val Cys His Thr Asp Leu

35 40 45

Ala Tyr Arg Asp Gly Asp Ile Ser Asp Glu Phe Pro Tyr Leu Leu Gly

50 55 60

His Glu Ala Ala Gly Ile Val Glu Glu Val Gly Glu Ser Val Thr His

65 70 75 80

Val Glu Val Gly Asp Phe Val Ile Leu Asn Trp Arg Ala Val Cys Gly

85 90 95

Glu Cys Arg Ala Cys Lys Lys Gly Glu Pro Lys Tyr Cys Phe Asn Thr

100 105 110

His Asn Ala Ser Lys Lys Met Thr Leu Glu Asp Gly Thr Glu Leu Ser

115 120 125

Pro Ala Leu Gly Ile Gly Ala Phe Leu Glu Lys Thr Leu Val His Glu

130 135 140

Gly Gln Cys Thr Lys Val Asn Pro Glu Glu Asp Pro Ala Ala Ala Gly

145 150 155 160

Leu Leu Gly Cys Gly Ile Met Ala Gly Leu Gly Ala Ala Val Asn Thr

165 170 175

Gly Asp Ile Lys Arg Gly Glu Ser Val Ala Val Phe Gly Leu Gly Gly

180 185 190

Val Gly Met Ala Ala Ile Ala Gly Ala Lys Ile Ala Gly Ala Ser Lys

195 200 205

Ile Ile Ala Val Asp Ile Asp Glu Lys Lys Leu Glu Trp Ala Lys Glu

210 215 220

Phe Gly Ala Thr His Thr Ile Asn Ser Ser Gly Leu Gly Gly Glu Gly

225 230 235 240

Asp Ala Ser Glu Val Val Ala Lys Val Arg Glu Leu Thr Asp Gly Phe

245 250 255

Gly Thr Asp Val Ser Ile Asp Ala Val Gly Ile Met Pro Thr Trp Gln

260 265 270

Gln Ala Phe Tyr Ser Arg Asp His Ala Gly Arg Met Val Met Val Gly

275 280 285

Val Pro Asn Leu Thr Ser Arg Val Asp Val Pro Ala Ile Asp Phe Tyr

290 295 300

Gly Arg Gly Gly Ser Val Arg Pro Ala Trp Tyr Gly Asp Cys Leu Pro

305 310 315 320

Glu Arg Asp Phe Pro Thr Tyr Val Asp Leu His Leu Gln Gly Arg Phe

325 330 335

Pro Leu Asp Lys Phe Val Ser Glu Arg Ile Gly Leu Asp Asp Val Glu

340 345 350

Glu Ala Phe Asn Thr Met Lys Ala Gly Asp Val Leu Arg Ser Val Val

355 360 365

Glu Ile

370

<210> 43

<211> 1047

<212> DNA

<213> 谷氨酸棒杆菌

<400> 43

gtgagtttta tgaccactgc tgcaccccaa gaatttaccg ctgctgttgt tgaaaaattc 60

ggtcatgacg tgaccgtgaa ggatattgac cttccaaagc cagggccaca ccaggcattg 120

gtgaaggtac tcacctccgg catctgccac accgacctcc acgccttgga gggcgattgg 180

ccagtaaagc cggaaccacc attcgtacca ggacacgaag gtgtaggtga agttgttgag 240

ctcggaccag gtgaacacga tgtgaaggtc ggcgatattg tcggcaatgc gtggctctgg 300

tcagcgtgcg gcacctgcga atactgcatc acaggcaggg aaactcagtg taacgaagct 360

gagtacggtg gctacaccca aaatggatcc ttcggccagt acatgctggt ggatacccga 420

tacgccgctc gcatcccaga cggcgtggac tacctcgaag cagcgccaat tctgtgtgca 480

ggcgtgactg tctacaaggc actcaaagtc tctgaaaccc gcccgggcca attcatggtg 540

atctccggtg tcggcggact tggccacatc gcagtccaat acgcagcggc gatgggcatg 600

cgtgtcattg cggtagatat tgccgaggac aagctggaac ttgcccgtaa gcacggtgcg 660

gaatttaccg tgaatgcgcg taatgaagat ccaggcgaag ctgtacagaa gtacaccaac 720

ggtggcgcac acggcgtgct tgtgactgca gttcacgagg cagcattcgg ccaggcactg 780

gatatggctc gacgtgcagg aacaattgtg ttcaacggtc tgccaccggg agagttccca 840

gcatccgtgt tcaacatcgt attcaagggc ctgaccatcc gtggatccct cgtgggaacc 900

cgccaagact tggccgaagc gctcgatttc tttgcacgcg gactaatcaa gccaaccgtg 960

agtgagtgct ccctcgatga ggtcaatgga gttcttgacc gcatgcgaaa cggcaagatc 1020

gatggtcgtg tggcgattcg tttctaa 1047

<210> 44

<211> 348

<212> PRT

<213> 谷氨酸棒杆菌

<400> 44

Met Ser Phe Met Thr Thr Ala Ala Pro Gln Glu Phe Thr Ala Ala Val

1 5 10 15

Val Glu Lys Phe Gly His Asp Val Thr Val Lys Asp Ile Asp Leu Pro

20 25 30

Lys Pro Gly Pro His Gln Ala Leu Val Lys Val Leu Thr Ser Gly Ile

35 40 45

Cys His Thr Asp Leu His Ala Leu Glu Gly Asp Trp Pro Val Lys Pro

50 55 60

Glu Pro Pro Phe Val Pro Gly His Glu Gly Val Gly Glu Val Val Glu

65 70 75 80

Leu Gly Pro Gly Glu His Asp Val Lys Val Gly Asp Ile Val Gly Asn

85 90 95

Ala Trp Leu Trp Ser Ala Cys Gly Thr Cys Glu Tyr Cys Ile Thr Gly

100 105 110

Arg Glu Thr Gln Cys Asn Glu Ala Glu Tyr Gly Gly Tyr Thr Gln Asn

115 120 125

Gly Ser Phe Gly Gln Tyr Met Leu Val Asp Thr Arg Tyr Ala Ala Arg

130 135 140

Ile Pro Asp Gly Val Asp Tyr Leu Glu Ala Ala Pro Ile Leu Cys Ala

145 150 155 160

Gly Val Thr Val Tyr Lys Ala Leu Lys Val Ser Glu Thr Arg Pro Gly

165 170 175

Gln Phe Met Val Ile Ser Gly Val Gly Gly Leu Gly His Ile Ala Val

180 185 190

Gln Tyr Ala Ala Ala Met Gly Met Arg Val Ile Ala Val Asp Ile Ala

195 200 205

Glu Asp Lys Leu Glu Leu Ala Arg Lys His Gly Ala Glu Phe Thr Val

210 215 220

Asn Ala Arg Asn Glu Asp Pro Gly Glu Ala Val Gln Lys Tyr Thr Asn

225 230 235 240

Gly Gly Ala His Gly Val Leu Val Thr Ala Val His Glu Ala Ala Phe

245 250 255

Gly Gln Ala Leu Asp Met Ala Arg Arg Ala Gly Thr Ile Val Phe Asn

260 265 270

Gly Leu Pro Pro Gly Glu Phe Pro Ala Ser Val Phe Asn Ile Val Phe

275 280 285

Lys Gly Leu Thr Ile Arg Gly Ser Leu Val Gly Thr Arg Gln Asp Leu

290 295 300

Ala Glu Ala Leu Asp Phe Phe Ala Arg Gly Leu Ile Lys Pro Thr Val

305 310 315 320

Ser Glu Cys Ser Leu Asp Glu Val Asn Gly Val Leu Asp Arg Met Arg

325 330 335

Asn Gly Lys Ile Asp Gly Arg Val Ala Ile Arg Phe

340 345

<210> 45

<211> 1020

<212> DNA

<213> 谷氨酸棒杆菌

<400> 45

atgcccaaat acattgccat gcaggtatcc gaatccggtg caccgttagc cgcgaatctc 60

gtgcaacctg ctccgttgaa atcgagggaa gtccgcgtgg aaatcgctgc tagtggtgtg 120

tgccatgcag atattggcac ggcagcagca tcggggaagc acactgtttt tcctgttacc 180

cctggtcatg agattgcagg aaccatcgcg gaaattggtg aaaacgtatc tcggtggacg 240

gttggtgatc gcgttgcaat cggttggttt ggtggcaatt gcggtgactg cgctttttgt 300

cgtgcaggtg atcctgtgca ttgcagagag cggaagattc ctggcgtttc ttatgcgggt 360

ggttgggcac agaatattgt tgttccagcg gaggctcttg ctgcgattcc agatggcatg 420

gacttttacg aggccgcccc gatgggctgc gcaggtgtga caacattcaa tgcgttgcga 480

aacctgaagc tggatcccgg tgcggctgtc gcggtctttg gaatcggcgg tttagtgcgc 540

ctagctattc agtttgctgc gaaaatgggt tatcgaacca tcaccatcgc ccgcggttta 600

gagcgtgagg agctagctag gcaacttggc gccaaccact acatcgatag caatgatctg 660

caccctggcc aggcgttatt tgaacttggc ggggctgact tgatcttgtc tactgcgtcc 720

accacggagc ctctttcgga gttgtctacc ggtctttcta ttggcgggca gctaaccatt 780

atcggagttg atgggggaga tatcaccgtt tcggcagccc aattgatgat gaaccgtcag 840

atcatcacag gtcacctcac tggaagtgcg aatgacacgg aacagactat gaaatttgct 900

catctccatg gcgtgaaacc gcttattgaa cggatgcctc tcgatcaagc caacgaggct 960

attgcacgta tttcagctgg taaaccacgt ttccgtattg tcttggagcc gaattcataa 1020

<210> 46

<211> 339

<212> PRT

<213> 谷氨酸棒杆菌

<400> 46

Met Pro Lys Tyr Ile Ala Met Gln Val Ser Glu Ser Gly Ala Pro Leu

1 5 10 15

Ala Ala Asn Leu Val Gln Pro Ala Pro Leu Lys Ser Arg Glu Val Arg

20 25 30

Val Glu Ile Ala Ala Ser Gly Val Cys His Ala Asp Ile Gly Thr Ala

35 40 45

Ala Ala Ser Gly Lys His Thr Val Phe Pro Val Thr Pro Gly His Glu

50 55 60

Ile Ala Gly Thr Ile Ala Glu Ile Gly Glu Asn Val Ser Arg Trp Thr

65 70 75 80

Val Gly Asp Arg Val Ala Ile Gly Trp Phe Gly Gly Asn Cys Gly Asp

85 90 95

Cys Ala Phe Cys Arg Ala Gly Asp Pro Val His Cys Arg Glu Arg Lys

100 105 110

Ile Pro Gly Val Ser Tyr Ala Gly Gly Trp Ala Gln Asn Ile Val Val

115 120 125

Pro Ala Glu Ala Leu Ala Ala Ile Pro Asp Gly Met Asp Phe Tyr Glu

130 135 140

Ala Ala Pro Met Gly Cys Ala Gly Val Thr Thr Phe Asn Ala Leu Arg

145 150 155 160

Asn Leu Lys Leu Asp Pro Gly Ala Ala Val Ala Val Phe Gly Ile Gly

165 170 175

Gly Leu Val Arg Leu Ala Ile Gln Phe Ala Ala Lys Met Gly Tyr Arg

180 185 190

Thr Ile Thr Ile Ala Arg Gly Leu Glu Arg Glu Glu Leu Ala Arg Gln

195 200 205

Leu Gly Ala Asn His Tyr Ile Asp Ser Asn Asp Leu His Pro Gly Gln

210 215 220

Ala Leu Phe Glu Leu Gly Gly Ala Asp Leu Ile Leu Ser Thr Ala Ser

225 230 235 240

Thr Thr Glu Pro Leu Ser Glu Leu Ser Thr Gly Leu Ser Ile Gly Gly

245 250 255

Gln Leu Thr Ile Ile Gly Val Asp Gly Gly Asp Ile Thr Val Ser Ala

260 265 270

Ala Gln Leu Met Met Asn Arg Gln Ile Ile Thr Gly His Leu Thr Gly

275 280 285

Ser Ala Asn Asp Thr Glu Gln Thr Met Lys Phe Ala His Leu His Gly

290 295 300

Val Lys Pro Leu Ile Glu Arg Met Pro Leu Asp Gln Ala Asn Glu Ala

305 310 315 320

Ile Ala Arg Ile Ser Ala Gly Lys Pro Arg Phe Arg Ile Val Leu Glu

325 330 335

Pro Asn Ser

<210> 47

<211> 879

<212> DNA

<213> 谷氨酸棒杆菌

<400> 47

atgcaaaccc ttgctgctat tgttcgtgcc acgaagcaac cttttgagat caccaccatt 60

gatctggatg caccacgacc agatgaagtt caaatccgtg ttattgctgc cggagtgcgc 120

cacactgacg caattgttcg tgatcagatt tacccaactt ttcttcccgc agttttcggc 180

cacgaaggcg ccggagtagt tgtcgccgtg ggttctgcag tcacctcggt gaaaccagat 240

gacaaggtag tgctgggatt caactcttgt ggccagtgct tgaagtgttt gggcggtaag 300

cctgcgtact gtgagaaatt ctatgaccgc aacttcgcat gcacccgcga tgccgggcac 360

actactttgt ttacccgtgc aacaaaagag caggcagagg ccatcatcga cacccttgat 420

gatgttttct acgatgcgga tgcgggtttc ctggcatacc cagcaactcc cccagaggct 480

tcgggagtaa gcgtgttggt tgtcgcggct ggtacctctg atctccccca agcaaaggaa 540

gcactacaca ctgcctccta cttggggcgc tccacctcac tgattgttga ttttggagtg 600

gctggcatcc accgcctgct ttcatacgaa gaagaactcc gcgctgcggg cgtgctcatc 660

gttgccgctg gaatggatgg tgcgctaccc ggagttgtcg caggcttagt gtccgcacct 720

gtcgtcgcac tgccaacctc cgtgggatac ggcgcaggtg ctggaggaat cgcaccactt 780

ctgaccatgc ttaacgcctg cgcgccggga gttggagtgg tcaacattga taacggctat 840

ggagcaggac acctggctgc gcagattgcg gcgaggtaa 879

<210> 48

<211> 292

<212> PRT

<213> 谷氨酸棒杆菌

<400> 48

Met Gln Thr Leu Ala Ala Ile Val Arg Ala Thr Lys Gln Pro Phe Glu

1 5 10 15

Ile Thr Thr Ile Asp Leu Asp Ala Pro Arg Pro Asp Glu Val Gln Ile

20 25 30

Arg Val Ile Ala Ala Gly Val Arg His Thr Asp Ala Ile Val Arg Asp

35 40 45

Gln Ile Tyr Pro Thr Phe Leu Pro Ala Val Phe Gly His Glu Gly Ala

50 55 60

Gly Val Val Val Ala Val Gly Ser Ala Val Thr Ser Val Lys Pro Asp

65 70 75 80

Asp Lys Val Val Leu Gly Phe Asn Ser Cys Gly Gln Cys Leu Lys Cys

85 90 95

Leu Gly Gly Lys Pro Ala Tyr Cys Glu Lys Phe Tyr Asp Arg Asn Phe

100 105 110

Ala Cys Thr Arg Asp Ala Gly His Thr Thr Leu Phe Thr Arg Ala Thr

115 120 125

Lys Glu Gln Ala Glu Ala Ile Ile Asp Thr Leu Asp Asp Val Phe Tyr

130 135 140

Asp Ala Asp Ala Gly Phe Leu Ala Tyr Pro Ala Thr Pro Pro Glu Ala

145 150 155 160

Ser Gly Val Ser Val Leu Val Val Ala Ala Gly Thr Ser Asp Leu Pro

165 170 175

Gln Ala Lys Glu Ala Leu His Thr Ala Ser Tyr Leu Gly Arg Ser Thr

180 185 190

Ser Leu Ile Val Asp Phe Gly Val Ala Gly Ile His Arg Leu Leu Ser

195 200 205

Tyr Glu Glu Glu Leu Arg Ala Ala Gly Val Leu Ile Val Ala Ala Gly

210 215 220

Met Asp Gly Ala Leu Pro Gly Val Val Ala Gly Leu Val Ser Ala Pro

225 230 235 240

Val Val Ala Leu Pro Thr Ser Val Gly Tyr Gly Ala Gly Ala Gly Gly

245 250 255

Ile Ala Pro Leu Leu Thr Met Leu Asn Ala Cys Ala Pro Gly Val Gly

260 265 270

Val Val Asn Ile Asp Asn Gly Tyr Gly Ala Gly His Leu Ala Ala Gln

275 280 285

Ile Ala Ala Arg

290

<210> 49

<211> 819

<212> DNA

<213> 大肠杆菌

<400> 49

atggaaacct atgctgtttt tggtaatccg atagcccaca gcaaatcgcc attcattcat 60

cagcaatttg ctcagcaact gaatattgaa catccctatg ggcgcgtgtt ggcacccatc 120

aatgatttca tcaacacact gaacgctttc tttagtgctg gtggtaaagg tgcgaatgtg 180

acggtgcctt ttaaagaaga ggcttttgcc agagcggatg agcttactga acgggcagcg 240

ttggctggtg ctgttaatac cctcatgcgg ttagaagatg gacgcctgct gggtgacaat 300

accgatggtg taggcttgtt aagcgatctg gaacgtctgt cttttatccg ccctggttta 360

cgtattctgc ttatcggcgc tggtggagca tctcgcggcg tactactgcc actcctttcc 420

ctggactgtg cggtgacaat aactaatcgg acggtatccc gcgcggaaga gttggctaaa 480

ttgtttgcgc acactggcag tattcaggcg ttgagtatgg acgaactgga aggtcatgag 540

tttgatctca ttattaatgc aacatccagt ggcatcagtg gtgatattcc ggcgatcccg 600

tcatcgctca ttcatccagg catttattgc tatgacatgt tctatcagaa aggaaaaact 660

ccttttctgg catggtgtga gcagcgaggc tcaaagcgta atgctgatgg tttaggaatg 720

ctggtggcac aggcggctca tgcctttctt ctctggcacg gtgttctgcc tgacgtagaa 780

ccagttataa agcaattgca ggaggaattg tccgcgtga 819

<210> 50

<211> 272

<212> PRT

<213> 大肠杆菌

<400> 50

Met Glu Thr Tyr Ala Val Phe Gly Asn Pro Ile Ala His Ser Lys Ser

1 5 10 15

Pro Phe Ile His Gln Gln Phe Ala Gln Gln Leu Asn Ile Glu His Pro

20 25 30

Tyr Gly Arg Val Leu Ala Pro Ile Asn Asp Phe Ile Asn Thr Leu Asn

35 40 45

Ala Phe Phe Ser Ala Gly Gly Lys Gly Ala Asn Val Thr Val Pro Phe

50 55 60

Lys Glu Glu Ala Phe Ala Arg Ala Asp Glu Leu Thr Glu Arg Ala Ala

65 70 75 80

Leu Ala Gly Ala Val Asn Thr Leu Met Arg Leu Glu Asp Gly Arg Leu

85 90 95

Leu Gly Asp Asn Thr Asp Gly Val Gly Leu Leu Ser Asp Leu Glu Arg

100 105 110

Leu Ser Phe Ile Arg Pro Gly Leu Arg Ile Leu Leu Ile Gly Ala Gly

115 120 125

Gly Ala Ser Arg Gly Val Leu Leu Pro Leu Leu Ser Leu Asp Cys Ala

130 135 140

Val Thr Ile Thr Asn Arg Thr Val Ser Arg Ala Glu Glu Leu Ala Lys

145 150 155 160

Leu Phe Ala His Thr Gly Ser Ile Gln Ala Leu Ser Met Asp Glu Leu

165 170 175

Glu Gly His Glu Phe Asp Leu Ile Ile Asn Ala Thr Ser Ser Gly Ile

180 185 190

Ser Gly Asp Ile Pro Ala Ile Pro Ser Ser Leu Ile His Pro Gly Ile

195 200 205

Tyr Cys Tyr Asp Met Phe Tyr Gln Lys Gly Lys Thr Pro Phe Leu Ala

210 215 220

Trp Cys Glu Gln Arg Gly Ser Lys Arg Asn Ala Asp Gly Leu Gly Met

225 230 235 240

Leu Val Ala Gln Ala Ala His Ala Phe Leu Leu Trp His Gly Val Leu

245 250 255

Pro Asp Val Glu Pro Val Ile Lys Gln Leu Gln Glu Glu Leu Ser Ala

260 265 270

<210> 51

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 51

cggtacccgg ggatccttac ttccgcgtat ccaac 35

<210> 52

<211> 41

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 52

ctaggaatcg cggccggtga actcctaaag aactatataa c 41

<210> 53

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 53

ggccgcgatt cctagcatgc 20

<210> 54

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 54

ccaagcttgc atgccagtca tcatcaacgg tgccg 35

<210> 55

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 55

atctccgcag aagacgtact g 21

<210> 56

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 56

tccgatcatg tatgacctcc 20

<210> 57

<211> 36

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 57

cggtacccgg ggatcggcat agtgcttcca acgctc 36

<210> 58

<211> 36

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 58

tagctccact caagattcct cgatattacc tacagg 36

<210> 59

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 59

tcttgagtgg agctagggcc 20

<210> 60

<211> 37

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 60

ccaagcttgc atgcccatat agagcccagg agctctc 37

<210> 61

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 61

cgccgcaaag tccaaataga aag 23

<210> 62

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 62

ggattcttcc tgaactcagc 20

<210> 63

<211> 36

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 63

cggtacccgg ggatcgggct cgtcctgaaa ttgcac 36

<210> 64

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 64

tccgtcgtga gccatgttgt gcccacgaga ctacc 35

<210> 65

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 65

atggctcacg acggattgcg 20

<210> 66

<211> 36

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 66

ccaagcttgc atgcccggtt gcagccttca taaacg 36

<210> 67

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 67

agaccaatga gtacccaacc g 21

<210> 68

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 68

tcagcgtctg gctcagctac 20

<210> 69

<211> 36

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 69

cggtacccgg ggatcaaccc cagctcaaat aacacc 36

<210> 70

<211> 37

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 70

tttcaacaca atccgtcctt ctcgcttgga ttacttg 37

<210> 71

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 71

cggattgtgt tgaaattgct ctg 23

<210> 72

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 72

ccaagcttgc atgcctcacc acgggaatct tcagg 35

<210> 73

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 73

ccggactggg gtgtgttttg 20

<210> 74

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 74

cccggaaaat acggtatagc 20

<210> 75

<211> 47

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 75

ccaagcttgc atgccaggag gattataatg cgcctgcgtg tctcgag 47

<210> 76

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 76

cggtacccgg ggatccaact acgcggcgac gtac 34

<210> 77

<211> 3387

<212> DNA

<213> Gordonia effusa

<400> 77

atgagcgatc agccgaatgc actgccgagc gcaattgaac cgctgaatcc ggatccgcag 60

gcaaccgagc agattagcca ttgtgcaacc attgcagaac tggttcgtgt tctggcagaa 120

agctatggtg atcgtccggc actgggttgg cgtaataata gcgatccgag cagctggcat 180

agcatgacct atcgtgatct ggccgaacgt gcagatagca tggcacgtct gctgcatagc 240

accctgggtg ttgcagaaaa tgatcgtgtt gcaaccgttg gttttaccag cgcagaatat 300

accattgcaa gcctggcagt tggtacactg ggtgcaatgg aagttccgct gcagaatgca 360

ggtagcgttg atgtttgggc agcaattctg accgaaaccg attgtgttag cgcagttgtt 420

gcagcagatc agctgccgag cattgcccgt ctggcggaaa gcggcaccta taccggtctg 480

cgtcatgttc tggtttttga tattggtagc cgtgatggca ccaccctgga tgatgcagca 540

cgtcgtctgg ttgccgcagg cacccaggtt catctgcgtc agcctggtgc agaaccgacc 600

acccctccgg caccgctgcc gcagattacc gcaaacccgg atcgtgtggc actgctgatt 660

tataccagcg gtagcacagg tgcaccgaaa ggtgcaatgt ataccgaaac agcagttacc 720

cgtctgtttc agagcggtct gagtggtctg ggtcgtgcaa ccgatggtca tggttggatt 780

accctgaact ttatgccgat gagccatgtt atgggtcgta gtaccctgtg gcagaccctg 840

ggtaatggtg gcaccgcata ttttacaccg cgtgcagatc tggctgaact gctgaccgat 900

ctggcagccg ttcagccgac ggatctgcag tttgttccgc gtatttggga tatgctgtat 960

caagaatatg ttcgtctgac agatcaggat gttagcgaac aggatgcact gacccgtatg 1020

cgtgaacatt atttcggcac ccgtaccgca accgcaatta ccggtagcgc accgattagt 1080

gatgaagttc gtcgttttgt tgaagcaatg ctgccggttc cgctgattga aggttatggt 1140

agcaccgaag cagccggtgt tagcattgat ggtcgtattc agcgtccgcc tgttgttgat 1200

tataaactgc tggatgtgcc ggaactgggt tatctgagca ccgatcgtcc gcatccgcgt 1260

ggtgagctgc tggttaaaac cgatcatatt tttgccggtt attacaatcg tccggatctg 1320

accagcagcg tttttgatga tcagggttat tatcgtaccg gtgatattgt tgccgaaacc 1380

ggtccggatc agattgaata tgttgatcgt cgtaacaacg tgatgaaact gagccagggt 1440

gaatttgttg caattgccca tattgaagca gttctgacca ccccaccgat tcagcagctg 1500

tatgtttatg gtaatagcgc acgtccgtat ctgctggccg ttgttgttcc gacaccggaa 1560

ctgcgtgaac gtcatgcaga tgataatgaa ctgcgtcgtg aagttctgac agcactgcgt 1620

agccatggtg aacgtaatgg tctggcagca gttgaaattc cgcgtgatgt tattgttgaa 1680

cgtaccccgt ttagcctgga aaatggtctg ctgacaggta ttcgtaaact ggcacgtccg 1740

cagctgaaag aacgttatgg tgcacgtctg gaagcactgt atgccgaact ggccgatagc 1800

cgtattacac gtctgcgtga tgtgaaagca gttgcagccc agcgtagcac cgttaccacc 1860

gttattgatg ttgttaccgc aattctggat ctggcggatg gtgaagttac cgcagcagca 1920

cattttacag atctgggtgg tgatagcctg accgcagtta ccgttggtaa cgaactgcgc 1980

gatatttttg atgccgaagt tccggttggt gtgctgacca gcccgagcag taccctggca 2040

gatattgcgg aacatattga tggccgtcat agcgaagcac gtccgaccgc agaaagcgtt 2100

catggcaccg gtacaaccct gcgtgcagcc gatctgaccc tggataaatt tctggatgaa 2160

gaaacactgc gtgccgcaag tgatgttacc agtgcagcca ccgatgttcg taccgtgttt 2220

attaccggtg caaccggttt tctgggtcgc tacctgacac tggattggct gcgtcgtatg 2280

gcaaaagttg gtggtacagt tatttgtctg gtgcgtggtg ccgatgatga cgcagcccgt 2340

gcgcgtctgg atgcagcatt tgatagcagc gatctgtggt ctgaatatca gcgtctggca 2400

aaagatcatc tgcgcgtgct ggcaggcgat aaagatagcg atcatctggc actgacaccg 2460

gatgtgtggg atgaactggc aaaaagcgtt gatctgatta ttgatccggc agcactggtt 2520

aatcatgtac tgccgtatcg cgaactgttt ggtccgaatg ttagcggcac cgcagaactg 2580

atccgtctgg cagttaccac cacccgtaaa ccgtatgtgt atatttcaac cgtgggtgtt 2640

ggtgatcagg ttgctccggg tagctttacc gaagatcctg atattcgtga aatgagcagc 2700

gtgcgtgaaa tcaatgatac ctatgcaaat ggttacggca atagcaaatg ggcaggcgaa 2760

gttctgctgg cacaggcaca tgaacgtttt gaactgccgg ttagcgtttt tcgttgtgat 2820

atgattgttg cggatgatca taccattggt cagctgaatc tgccggatat gtttactcgc 2880

ctgctgatga gcgttctggc aacaggtctg gcaccgcgta gcttttatca gctggcgacc 2940

gatggtagtg cacaagaggc acattttgat gcgctgccgg tggatttcct ggccgaagca 3000

attaatacac tgtgggttaa agatggtgcc cgtaccttta atgcaatgaa tccgcatgcc 3060

gatggtattg gttttgatca gtatattcgt tggctgattg atagcggtga acaaattagc 3120

ctggtggata attatgatga ttggtatcgt cgctttggtg ccgcactggc ggatctgcct 3180

gaaaaacagc gtcgtggtag cctgattccg ctgctgcaca attatgttca tccgatgaca 3240

ccgcataatc gtggtatggc aagcgcagat cgttttcatg atgcagttcg tacagcaggc 3300

gttggtcaga gcagcgatat tccgcatatt acccctcaga ttattgaaaa ttatgcacgt 3360

agcctgcgtg gcctgggtgt gatttaa 3387

<210> 78

<211> 3408

<212> DNA

<213> 马来西亚新鞘氨醇杆菌

<400> 78

atggatgccg agagcggagt catgccgagc gatcccgatg tggttgcctt cgtccgccgg 60

ccggacacgt gccttagcgc gatgatcgag aaagcgctcg attcctatgc cgggcgcgat 120

gcattagcct ggcgccccac gcgttcaggc gtgttgagcg ataccttcga agtcatgacc 180

tacaaggacc tggcaaggcg cgtccgctcc gtggcgacgg cgctcgccaa agaccccgat 240

ctgggtctga aagccggcga cccgatcggg atcatggcct ttgccaacgt cgacttcgtc 300

accctcaatc tcgcgctggg cctctgcggt ggcgttatcg cgccgctgca gacctccgcc 360

agcatggaag cactgaccgg gctggtcagg gaactggcag cgccctgcct cgccgcatcg 420

ctcgaacatc tcgaagcgat caccacgctc gccatcgcaa gcgaaaaaac gcgcgcaatc 480

cttatcttcg accacgatgg cctcgacgaa gatgcccggg ccgcgatcgc cgccgcccag 540

caacgcctag acgcggaaaa gcccggctgc ctgatcctgc cgttttccga agtgatcgca 600

cgcggcgaaa agctgccgcc gctcgatccc ttcgttccgg cgccgggcga ggaccccttg 660

gctctgatct attacacctc gggcagcacc ggcacaccaa agggcgttat gtacacgcag 720

aagctggtga agctgggcta ttcgatagcc cgcgaccatg ccccgatcgt cctgcactat 780

cagccgctca accactcctt cgggatgtcc ttcatcgcca tggccctcgc cagcggcggc 840

acgtcctact ttaccgccaa gagcgacctg tcgacgctgc tgagcgacat gaagatggtc 900

cgcccgacga ccatggctct cgtcccgcgc atatcggaaa tgctgttcca gcgtttccat 960

gccgactacg ccgacgagat cgcacgcgac gaggatgccg caatggcgcg gttccgcgaa 1020

gacgttctcg gggggcggat gaccgacatc gtcaccgggg ccgcacctac ttcgccggaa 1080

cttcgcgact tcatcgagaa gatgaccggt ctcacactga tggaagggta cggctgcacc 1140

gaagcaggcg gctcgatcac cttcaacgac cgggtgatgc gcccgcccgt gctcgaatac 1200

cgcctgatcg acgtgcccga gctcggctat ttcactaccg atacgcccca tccgcgcggc 1260

gagctcatcc tcaagagcga tgcgatgttc gccgggtact tcgcgcgtcc ggacctcacg 1320

gcaaaggcct tcgacgacga ggggttctac cataccggcg acattatggc cgagatcgaa 1380

cccgaccacc tcgtctacct cgaccgcacc aacaacgtga tgaagctgtc gcagggcgaa 1440

ttcgtaccgg tcgcgttgct ggaatcgctc tatgcgggcg gtgatccggt gatccgccag 1500

atctatctct atggcaattc gacgcgggct ttcctgctcg gcgtggccgt gcccaacatg 1560

gatgccctgc ccgagggaat cggtgatgag gaaatcaagg cccgcatgct ccaggctctg 1620

gaacgcatcg ccagggccaa cgaacgccat tcctacgaag tcccgcgcga cctgattata 1680

gagcatgagc cgttctctcc cgaaaacggc ctgcttgcgg gcgtcggcaa gtacatgcgc 1740

cccgccttca aggcgcgata cggagagcag ctcgaagcgc tctatgaaga aatcgctcgc 1800

agtcaggacc gcgagctgca ggaattgcgc agaaccggcc gcaccttccc agttctcgaa 1860

accgtgtgcc gggcggccgg cgccgtactg ggcggcaaga ccgttgccct ttccgagaca 1920

ggctccttcg cgtcgtcggg tggggattcg ctttcagcac tgtccctctc gctgcttttg 1980

gaggacatct acgaactgcc cgtcgaagtc agcgcgatcc tccatccctc gggcacgtac 2040

gggctgcttg ccgcggaaat cgaggagaag ctgggcggcg gtgcgaagcg acgcgacgcc 2100

gtggccgttc atggcgcgga cctcaccgtg ctcaaggcgg ccgacctgac gctcgacaag 2160

ttcatagacg ccgagatcct tggcgccgcc accggcctgc ccgcgccgcc cgacgctgaa 2220

ccagaggtgg tgcttctcac cggtgtcacc ggcttcctag gccgtttcat gtgcctggaa 2280

tggctgcgtc ggctggagcg caacggcaag ggcaaggtgg tctgcgtggc gcgcggtgcc 2340

gatgacgacg atgcccgccg ccgcgtcctg gcaggctttg aaggcggtga tggcgcactg 2400

gcggcggaag tggcccggct gggcgaaggc cggctggccg tcttcgcagg cgatcttgcc 2460

gcaccccggc tgggtctcac cgcgacatgc tggcaggcgc tgtgcgacca ggtggacctc 2520

attgctcacc ctggcgcctt cgtgaaccac aagctgccct accgccagct gttcggagcc 2580

aacacagcag gcacggccga actgatcgcg ctggctctca ccacgcgcaa gaagcgcttc 2640

gcccatgtct ctaccatcgc cacgacatac aacgatggtc atcgcgcgga tgaaaacggc 2700

tacatcgaca gcgccattcc cgaatggcat gtaagcgacg cctacgccga cggctatggg 2760

tcgtccaaat gggccgcaga agtgctgctg gccagagcca atgagcaata tggcctaccc 2820

gtttcggtct accgttcgaa catgatcatg gcacccggcg agttctccgg tcagctcaat 2880

gtgcccgata tcttcactcg cctgctgctg agcctggcgc tgacccggct ggcccccgcc 2940

agcttctatt cgggcgattc cgcgcgggcc cattacgaag gcctgccggt cgatttcctg 3000

gcccgcgcca tcgtgaccat tgccgaagac aaccgcgcgg ggttccatac cttccacacg 3060

atcaacccgc acgatgacgg gatctcgacc gacactttcg tcgactggat cggtgaagcg 3120

ggcattccga tcgaacggat cgcggactac gacgaatggg tcacgcgttt cgggacggcc 3180

ctgcgcgccc tgcctgaaaa gcagcggcaa gcctcgatcc tgccgttgat ggacgcgtac 3240

aagcacccgt ccccggcgat ccccgacttc cgcgatcagg cacctaactt ccgccaggcg 3300

gttgccgaat cgcaagtgaa cggagacggc gcgatccctc atctcacgcc ggcattgatt 3360

gctcggtatc tggaggacct gaaggccacc ggcctgctca cctcctga 3408

<210> 79

<211> 1135

<212> PRT

<213> 马来西亚新鞘氨醇杆菌

<400> 79

Met Asp Ala Glu Ser Gly Val Met Pro Ser Asp Pro Asp Val Val Ala

1 5 10 15

Phe Val Arg Arg Pro Asp Thr Cys Leu Ser Ala Met Ile Glu Lys Ala

20 25 30

Leu Asp Ser Tyr Ala Gly Arg Asp Ala Leu Ala Trp Arg Pro Thr Arg

35 40 45

Ser Gly Val Leu Ser Asp Thr Phe Glu Val Met Thr Tyr Lys Asp Leu

50 55 60

Ala Arg Arg Val Arg Ser Val Ala Thr Ala Leu Ala Lys Asp Pro Asp

65 70 75 80

Leu Gly Leu Lys Ala Gly Asp Pro Ile Gly Ile Met Ala Phe Ala Asn

85 90 95

Val Asp Phe Val Thr Leu Asn Leu Ala Leu Gly Leu Cys Gly Gly Val

100 105 110

Ile Ala Pro Leu Gln Thr Ser Ala Ser Met Glu Ala Leu Thr Gly Leu

115 120 125

Val Arg Glu Leu Ala Ala Pro Cys Leu Ala Ala Ser Leu Glu His Leu

130 135 140

Glu Ala Ile Thr Thr Leu Ala Ile Ala Ser Glu Lys Thr Arg Ala Ile

145 150 155 160

Leu Ile Phe Asp His Asp Gly Leu Asp Glu Asp Ala Arg Ala Ala Ile

165 170 175

Ala Ala Ala Gln Gln Arg Leu Asp Ala Glu Lys Pro Gly Cys Leu Ile

180 185 190

Leu Pro Phe Ser Glu Val Ile Ala Arg Gly Glu Lys Leu Pro Pro Leu

195 200 205

Asp Pro Phe Val Pro Ala Pro Gly Glu Asp Pro Leu Ala Leu Ile Tyr

210 215 220

Tyr Thr Ser Gly Ser Thr Gly Thr Pro Lys Gly Val Met Tyr Thr Gln

225 230 235 240

Lys Leu Val Lys Leu Gly Tyr Ser Ile Ala Arg Asp His Ala Pro Ile

245 250 255

Val Leu His Tyr Gln Pro Leu Asn His Ser Phe Gly Met Ser Phe Ile

260 265 270

Ala Met Ala Leu Ala Ser Gly Gly Thr Ser Tyr Phe Thr Ala Lys Ser

275 280 285

Asp Leu Ser Thr Leu Leu Ser Asp Met Lys Met Val Arg Pro Thr Thr

290 295 300

Met Ala Leu Val Pro Arg Ile Ser Glu Met Leu Phe Gln Arg Phe His

305 310 315 320

Ala Asp Tyr Ala Asp Glu Ile Ala Arg Asp Glu Asp Ala Ala Met Ala

325 330 335

Arg Phe Arg Glu Asp Val Leu Gly Gly Arg Met Thr Asp Ile Val Thr

340 345 350

Gly Ala Ala Pro Thr Ser Pro Glu Leu Arg Asp Phe Ile Glu Lys Met

355 360 365

Thr Gly Leu Thr Leu Met Glu Gly Tyr Gly Cys Thr Glu Ala Gly Gly

370 375 380

Ser Ile Thr Phe Asn Asp Arg Val Met Arg Pro Pro Val Leu Glu Tyr

385 390 395 400

Arg Leu Ile Asp Val Pro Glu Leu Gly Tyr Phe Thr Thr Asp Thr Pro

405 410 415

His Pro Arg Gly Glu Leu Ile Leu Lys Ser Asp Ala Met Phe Ala Gly

420 425 430

Tyr Phe Ala Arg Pro Asp Leu Thr Ala Lys Ala Phe Asp Asp Glu Gly

435 440 445

Phe Tyr His Thr Gly Asp Ile Met Ala Glu Ile Glu Pro Asp His Leu

450 455 460

Val Tyr Leu Asp Arg Thr Asn Asn Val Met Lys Leu Ser Gln Gly Glu

465 470 475 480

Phe Val Pro Val Ala Leu Leu Glu Ser Leu Tyr Ala Gly Gly Asp Pro

485 490 495

Val Ile Arg Gln Ile Tyr Leu Tyr Gly Asn Ser Thr Arg Ala Phe Leu

500 505 510

Leu Gly Val Ala Val Pro Asn Met Asp Ala Leu Pro Glu Gly Ile Gly

515 520 525

Asp Glu Glu Ile Lys Ala Arg Met Leu Gln Ala Leu Glu Arg Ile Ala

530 535 540

Arg Ala Asn Glu Arg His Ser Tyr Glu Val Pro Arg Asp Leu Ile Ile

545 550 555 560

Glu His Glu Pro Phe Ser Pro Glu Asn Gly Leu Leu Ala Gly Val Gly

565 570 575

Lys Tyr Met Arg Pro Ala Phe Lys Ala Arg Tyr Gly Glu Gln Leu Glu

580 585 590

Ala Leu Tyr Glu Glu Ile Ala Arg Ser Gln Asp Arg Glu Leu Gln Glu

595 600 605

Leu Arg Arg Thr Gly Arg Thr Phe Pro Val Leu Glu Thr Val Cys Arg

610 615 620

Ala Ala Gly Ala Val Leu Gly Gly Lys Thr Val Ala Leu Ser Glu Thr

625 630 635 640

Gly Ser Phe Ala Ser Ser Gly Gly Asp Ser Leu Ser Ala Leu Ser Leu

645 650 655

Ser Leu Leu Leu Glu Asp Ile Tyr Glu Leu Pro Val Glu Val Ser Ala

660 665 670

Ile Leu His Pro Ser Gly Thr Tyr Gly Leu Leu Ala Ala Glu Ile Glu

675 680 685

Glu Lys Leu Gly Gly Gly Ala Lys Arg Arg Asp Ala Val Ala Val His

690 695 700

Gly Ala Asp Leu Thr Val Leu Lys Ala Ala Asp Leu Thr Leu Asp Lys

705 710 715 720

Phe Ile Asp Ala Glu Ile Leu Gly Ala Ala Thr Gly Leu Pro Ala Pro

725 730 735

Pro Asp Ala Glu Pro Glu Val Val Leu Leu Thr Gly Val Thr Gly Phe

740 745 750

Leu Gly Arg Phe Met Cys Leu Glu Trp Leu Arg Arg Leu Glu Arg Asn

755 760 765

Gly Lys Gly Lys Val Val Cys Val Ala Arg Gly Ala Asp Asp Asp Asp

770 775 780

Ala Arg Arg Arg Val Leu Ala Gly Phe Glu Gly Gly Asp Gly Ala Leu

785 790 795 800

Ala Ala Glu Val Ala Arg Leu Gly Glu Gly Arg Leu Ala Val Phe Ala

805 810 815

Gly Asp Leu Ala Ala Pro Arg Leu Gly Leu Thr Ala Thr Cys Trp Gln

820 825 830

Ala Leu Cys Asp Gln Val Asp Leu Ile Ala His Pro Gly Ala Phe Val

835 840 845

Asn His Lys Leu Pro Tyr Arg Gln Leu Phe Gly Ala Asn Thr Ala Gly

850 855 860

Thr Ala Glu Leu Ile Ala Leu Ala Leu Thr Thr Arg Lys Lys Arg Phe

865 870 875 880

Ala His Val Ser Thr Ile Ala Thr Thr Tyr Asn Asp Gly His Arg Ala

885 890 895

Asp Glu Asn Gly Tyr Ile Asp Ser Ala Ile Pro Glu Trp His Val Ser

900 905 910

Asp Ala Tyr Ala Asp Gly Tyr Gly Ser Ser Lys Trp Ala Ala Glu Val

915 920 925

Leu Leu Ala Arg Ala Asn Glu Gln Tyr Gly Leu Pro Val Ser Val Tyr

930 935 940

Arg Ser Asn Met Ile Met Ala Pro Gly Glu Phe Ser Gly Gln Leu Asn

945 950 955 960

Val Pro Asp Ile Phe Thr Arg Leu Leu Leu Ser Leu Ala Leu Thr Arg

965 970 975

Leu Ala Pro Ala Ser Phe Tyr Ser Gly Asp Ser Ala Arg Ala His Tyr

980 985 990

Glu Gly Leu Pro Val Asp Phe Leu Ala Arg Ala Ile Val Thr Ile Ala

995 1000 1005

Glu Asp Asn Arg Ala Gly Phe His Thr Phe His Thr Ile Asn Pro

1010 1015 1020

His Asp Asp Gly Ile Ser Thr Asp Thr Phe Val Asp Trp Ile Gly

1025 1030 1035

Glu Ala Gly Ile Pro Ile Glu Arg Ile Ala Asp Tyr Asp Glu Trp

1040 1045 1050

Val Thr Arg Phe Gly Thr Ala Leu Arg Ala Leu Pro Glu Lys Gln

1055 1060 1065

Arg Gln Ala Ser Ile Leu Pro Leu Met Asp Ala Tyr Lys His Pro

1070 1075 1080

Ser Pro Ala Ile Pro Asp Phe Arg Asp Gln Ala Pro Asn Phe Arg

1085 1090 1095

Gln Ala Val Ala Glu Ser Gln Val Asn Gly Asp Gly Ala Ile Pro

1100 1105 1110

His Leu Thr Pro Ala Leu Ile Ala Arg Tyr Leu Glu Asp Leu Lys

1115 1120 1125

Ala Thr Gly Leu Leu Thr Ser

1130 1135

<210> 80

<211> 4543

<212> DNA

<213> 人工序列

<220>

<223> 含有马来西亚新鞘氨醇杆菌的CAR基因(经密码子优化)和大肠杆菌的

entD基因的DNA片段的核苷酸序列

<400> 80

ccaagcttgc atgccagatc gtttagatcc gaaggaaaac gtcgaaaagc aatttgcttt 60

tcgacgcccc accccgcgcg ttttagcgtg tcagtagacg cgtagggtaa gtggggtagc 120

ggcttgttag atatcttgaa atcggctttc aacagcattg atttcgatgt atttagctgg 180

ccgtttgaga cgcgatgtcc acagggtagc tggtagtttg aaaatcaacg ccgttgccct 240

taggattcag taactggcac attttgtaat gcgctagatc tgtgtgccca gtcttccagg 300

ctgcttatca cagtgaaagc aaaaccaatt cgtggctgcg aaagtcgtag ccaccacgaa 360

gtccaggagg acatacaatg gatgcagaaa gcggtgttat gccgagcgat ccggatgttg 420

ttgcatttgt tcgtcgtccg gatacctgtc tgagcgcaat gattgaaaaa gcactggata 480

gctatgcagg tcgtgatgca ctggcatggc gtccgacccg tagcggtgtt ctgagcgata 540

cctttgaagt tatgacctat aaagatctgg cacgtcgtgt tcgtagcgtt gcaaccgcac 600

tggcaaaaga tcctgatctg ggtctgaaag ccggtgatcc gattggtatt atggcatttg 660

ccaatgttga tttcgttacc ctgaatctgg cactgggtct gtgtggtggt gttattgcac 720

cgctgcagac cagcgcaagc atggaagcac tgaccggtct ggttcgtgaa ctggcagcac 780

cgtgtctggc agcaagcctg gaacatctgg aagcaattac caccctggca attgcaagcg 840

aaaaaacccg tgcaattctg atctttgatc atgatggtct ggatgaagat gcacgtgccg 900

caattgcagc agcacagcag cgtctggatg ccgaaaaacc gggttgtctg attctgccgt 960

ttagcgaagt tattgcccgt ggtgaaaaac tgcctccgct ggatccgttt gttccggcac 1020

cgggtgaaga tccgctggca ctgatctatt ataccagcgg tagcaccggc accccgaaag 1080

gtgttatgta tacccagaaa ctggttaaac tgggttatag cattgcacgt gatcatgcac 1140

cgattgttct gcattatcag ccgctgaatc atagctttgg tatgagcttt attgcaatgg 1200

cactggcgag cggtggcacc agctatttta ccgcaaaaag cgatctgagc accctgctga 1260

gtgatatgaa aatggttcgt ccgaccacca tggccctggt tccgcgtatt agcgaaatgc 1320

tgtttcagcg ttttcatgca gattatgcag atgaaattgc gcgtgatgag gatgcagcca 1380

tggcacgttt tcgtgaagat gttctgggtg gtcgtatgac cgatattgtt accggtgcag 1440

caccgaccag tccggaactg cgtgatttta ttgaaaaaat gacaggtctg accctgatgg 1500

aaggttatgg ttgtaccgaa gccggtggta gcattacctt taatgatcgt gttatgcgtc 1560

cgcctgttct ggaatatcgt ctgattgatg ttcctgaact gggatatttt accaccgata 1620

caccgcatcc gcgtggtgaa ctgattctga aaagtgatgc aatgtttgcc ggttattttg 1680

cacgtccgga tctgaccgca aaagcatttg atgatgaagg cttttatcac accggtgata 1740

ttatggccga aattgaaccg gatcatctgg tttatctgga tcgtaccaat aacgtgatga 1800

aactgagcca gggtgaattt gtgccggttg cactgctgga aagcctgtat gccggtggtg 1860

atccggtgat tcgtcagatt tatctgtatg gtaatagcac ccgtgccttt ctgctgggtg 1920

ttgcagttcc gaatatggat gcactgccgg aaggtattgg tgatgaagaa attaaagcac 1980

gtatgctgca ggcactggaa cgtattgcac gcgcaaatga acgtcatagt tatgaagttc 2040

cgcgtgatct gattattgaa cacgaaccgt ttagtccgga aaatggtctg ctggcaggcg 2100

ttggcaaata tatgcgtcct gcatttaaag cccgttatgg tgagcagctg gaagccctgt 2160

acgaagaaat tgcacgtagc caggatcgcg aactgcaaga actgcgtcgt accggtcgta 2220

cctttccggt tctggaaacc gtttgtcgtg cagccggtgc agtgctgggt ggcaaaaccg 2280

ttgcactgag cgaaaccggt agctttgcaa gcagtggtgg tgatagcctg agcgcactga 2340

gcctgagcct gctgctggaa gatatttatg aactgccggt tgaagttagc gcaatcctgc 2400

atccgagcgg cacctacggc ctgctggctg cagaaattga agaaaaactg ggtggtggtg 2460

caaaacgccg tgatgcagtt gccgttcatg gtgcagatct gacagttctg aaagcagccg 2520

atctgacact ggataaattc attgatgcgg aaattctggg tgcagcaacc ggtctgcctg 2580

cccctcctga tgccgaaccg gaagttgttc tgctgaccgg tgttacaggt tttctgggtc 2640

gttttatgtg tctggaatgg ctgcgtcgtc tggaacgcaa tggtaaaggt aaagttgttt 2700

gtgttgcacg tggtgccgat gatgatgacg cacgtcgtcg cgttctggca ggttttgaag 2760

gtggtgatgg tgccctggca gccgaagttg cacgtctggg tgaaggtcgt ctggccgttt 2820

ttgcgggtga tctggcagcc cctcgtctgg gcctgaccgc cacatgttgg caggccctgt 2880

gtgatcaggt ggatctgatt gcacatccgg gtgcctttgt taatcataaa ctgccgtatc 2940

gtcagctgtt tggtgcaaat accgcaggca ccgcagaact gattgccctg gccctgacca 3000

cccgtaaaaa acgctttgca catgttagca ccattgccac cacctataat gatggtcatc 3060

gtgcggatga aaacggctat attgatagcg ccatcccgga atggcatgtt agtgatgcat 3120

atgccgatgg ttatggtagc tcaaaatggg cagcggaagt gctgctggca cgtgcgaatg 3180

aacagtatgg tctgccggtg agcgtttatc gtagcaatat gattatggca cctggtgaat 3240

ttagcggtca gctgaatgtt ccggatatct ttacccgtct gctgctgagc ctggcgctga 3300

cccgtctggc accggcaagc ttttatagcg gtgatagcgc acgtgcacat tatgaaggcc 3360

tgccggtgga ttttctggct cgtgccattg tgaccattgc cgaagataat cgtgcaggtt 3420

ttcatacctt tcacaccatt aatccgcatg atgatggtat tagcacagat acatttgtgg 3480

attggattgg tgaagcaggt attccgattg aacgcattgc ggattatgat gaatgggtta 3540

cccgttttgg caccgcactg cgtgccctgc cggaaaaaca gcgtcaggca agcattctgc 3600

cgctgatgga tgcatataaa catccgagtc cggcaattcc ggattttcgc gatcaggcac 3660

cgaattttcg tcaggcagtt gcggaaagcc aggttaatgg tgatggcgca attccgcatc 3720

tgacaccggc actgattgcg cgttatctgg aagatctgaa agcgacaggc ctgctgacca 3780

gctaaaggag gacatacaat ggtcgatatg aaaactacgc atacctccct cccctttgcc 3840

ggacatacgc tgcattttgt tgagttcgat ccggcgaatt tttgtgagca ggatttactc 3900

tggctgccgc actacgcaca actgcaacac gctggacgta aacgtaaaac agagcattta 3960

gccggacgga tcgctgctgt ttatgctttg cgggaatatg gctataaatg tgtgcccgca 4020

atcggcgagc tacgccaacc tgtctggcct gcggaggtat acggcagtat tagccactgt 4080

gggactacgg cattagccgt ggtatctcgt caaccgattg gcattgatat agaagaaatt 4140

ttttctgtac aaaccgcaag agaattgaca gacaacatta ttacaccagc ggaacacgag 4200

cgactcgcag actgcggttt agccttttct ctggcgctga cactggcatt ttccgccaaa 4260

gagagcgcat ttaaggcaag tgagatccaa actgatgcag gttttctgga ctatcagata 4320

attagctgga ataaacagca ggtcatcatt catcgtgaga atgagatgtt tgctgtgcac 4380

tggcagataa aagaaaagat agtcataacg ctgtgccaac acgattaatt gacaacatct 4440

ggtacgattc gcccgcagcc atcactgacc acgggcgaaa gtgtaaagca ggtgccttac 4500

catcctgacc tgacaaccgg atatgcggga tccccgggta ccg 4543

<210> 81

<211> 3408

<212> DNA

<213> 马来西亚新鞘氨醇杆菌

<400> 81

atggatgcag aaagcggtgt tatgccgagc gatccggatg ttgttgcatt tgttcgtcgt 60

ccggatacct gtctgagcgc aatgattgaa aaagcactgg atagctatgc aggtcgtgat 120

gcactggcat ggcgtccgac ccgtagcggt gttctgagcg atacctttga agttatgacc 180

tataaagatc tggcacgtcg tgttcgtagc gttgcaaccg cactggcaaa agatcctgat 240

ctgggtctga aagccggtga tccgattggt attatggcat ttgccaatgt tgatttcgtt 300

accctgaatc tggcactggg tctgtgtggt ggtgttattg caccgctgca gaccagcgca 360

agcatggaag cactgaccgg tctggttcgt gaactggcag caccgtgtct ggcagcaagc 420

ctggaacatc tggaagcaat taccaccctg gcaattgcaa gcgaaaaaac ccgtgcaatt 480

ctgatctttg atcatgatgg tctggatgaa gatgcacgtg ccgcaattgc agcagcacag 540

cagcgtctgg atgccgaaaa accgggttgt ctgattctgc cgtttagcga agttattgcc 600

cgtggtgaaa aactgcctcc gctggatccg tttgttccgg caccgggtga agatccgctg 660

gcactgatct attataccag cggtagcacc ggcaccccga aaggtgttat gtatacccag 720

aaactggtta aactgggtta tagcattgca cgtgatcatg caccgattgt tctgcattat 780

cagccgctga atcatagctt tggtatgagc tttattgcaa tggcactggc gagcggtggc 840

accagctatt ttaccgcaaa aagcgatctg agcaccctgc tgagtgatat gaaaatggtt 900

cgtccgacca ccatggccct ggttccgcgt attagcgaaa tgctgtttca gcgttttcat 960

gcagattatg cagatgaaat tgcgcgtgat gaggatgcag ccatggcacg ttttcgtgaa 1020

gatgttctgg gtggtcgtat gaccgatatt gttaccggtg cagcaccgac cagtccggaa 1080

ctgcgtgatt ttattgaaaa aatgacaggt ctgaccctga tggaaggtta tggttgtacc 1140

gaagccggtg gtagcattac ctttaatgat cgtgttatgc gtccgcctgt tctggaatat 1200

cgtctgattg atgttcctga actgggatat tttaccaccg atacaccgca tccgcgtggt 1260

gaactgattc tgaaaagtga tgcaatgttt gccggttatt ttgcacgtcc ggatctgacc 1320

gcaaaagcat ttgatgatga aggcttttat cacaccggtg atattatggc cgaaattgaa 1380

ccggatcatc tggtttatct ggatcgtacc aataacgtga tgaaactgag ccagggtgaa 1440

tttgtgccgg ttgcactgct ggaaagcctg tatgccggtg gtgatccggt gattcgtcag 1500

atttatctgt atggtaatag cacccgtgcc tttctgctgg gtgttgcagt tccgaatatg 1560

gatgcactgc cggaaggtat tggtgatgaa gaaattaaag cacgtatgct gcaggcactg 1620

gaacgtattg cacgcgcaaa tgaacgtcat agttatgaag ttccgcgtga tctgattatt 1680

gaacacgaac cgtttagtcc ggaaaatggt ctgctggcag gcgttggcaa atatatgcgt 1740

cctgcattta aagcccgtta tggtgagcag ctggaagccc tgtacgaaga aattgcacgt 1800

agccaggatc gcgaactgca agaactgcgt cgtaccggtc gtacctttcc ggttctggaa 1860

accgtttgtc gtgcagccgg tgcagtgctg ggtggcaaaa ccgttgcact gagcgaaacc 1920

ggtagctttg caagcagtgg tggtgatagc ctgagcgcac tgagcctgag cctgctgctg 1980

gaagatattt atgaactgcc ggttgaagtt agcgcaatcc tgcatccgag cggcacctac 2040

ggcctgctgg ctgcagaaat tgaagaaaaa ctgggtggtg gtgcaaaacg ccgtgatgca 2100

gttgccgttc atggtgcaga tctgacagtt ctgaaagcag ccgatctgac actggataaa 2160

ttcattgatg cggaaattct gggtgcagca accggtctgc ctgcccctcc tgatgccgaa 2220

ccggaagttg ttctgctgac cggtgttaca ggttttctgg gtcgttttat gtgtctggaa 2280

tggctgcgtc gtctggaacg caatggtaaa ggtaaagttg tttgtgttgc acgtggtgcc 2340

gatgatgatg acgcacgtcg tcgcgttctg gcaggttttg aaggtggtga tggtgccctg 2400

gcagccgaag ttgcacgtct gggtgaaggt cgtctggccg tttttgcggg tgatctggca 2460

gcccctcgtc tgggcctgac cgccacatgt tggcaggccc tgtgtgatca ggtggatctg 2520

attgcacatc cgggtgcctt tgttaatcat aaactgccgt atcgtcagct gtttggtgca 2580

aataccgcag gcaccgcaga actgattgcc ctggccctga ccacccgtaa aaaacgcttt 2640

gcacatgtta gcaccattgc caccacctat aatgatggtc atcgtgcgga tgaaaacggc 2700

tatattgata gcgccatccc ggaatggcat gttagtgatg catatgccga tggttatggt 2760

agctcaaaat gggcagcgga agtgctgctg gcacgtgcga atgaacagta tggtctgccg 2820

gtgagcgttt atcgtagcaa tatgattatg gcacctggtg aatttagcgg tcagctgaat 2880

gttccggata tctttacccg tctgctgctg agcctggcgc tgacccgtct ggcaccggca 2940

agcttttata gcggtgatag cgcacgtgca cattatgaag gcctgccggt ggattttctg 3000

gctcgtgcca ttgtgaccat tgccgaagat aatcgtgcag gttttcatac ctttcacacc 3060

attaatccgc atgatgatgg tattagcaca gatacatttg tggattggat tggtgaagca 3120

ggtattccga ttgaacgcat tgcggattat gatgaatggg ttacccgttt tggcaccgca 3180

ctgcgtgccc tgccggaaaa acagcgtcag gcaagcattc tgccgctgat ggatgcatat 3240

aaacatccga gtccggcaat tccggatttt cgcgatcagg caccgaattt tcgtcaggca 3300

gttgcggaaa gccaggttaa tggtgatggc gcaattccgc atctgacacc ggcactgatt 3360

gcgcgttatc tggaagatct gaaagcgaca ggcctgctga ccagctaa 3408

<210> 82

<211> 3582

<212> DNA

<213> Coccomyxa subellipsoidea

<400> 82

atgacagaga acggaggact acctcaggtc aatggaggcg gcccccagta ctgggagatg 60

tccaacggcc agaaccagac taacaatgtc attcagaaga ggcttgcccg cgctcgcgaa 120

gtcatcaagc aagaccccca gctgcaggcg gccaagtttg acaggaaatc acttcaacgg 180

atcacggatg cggggaacac cagcattgag attattgcgg ccatgttcaa ggagtatgcg 240

tcgcgcgatc tattcggcgc ctgcacaccg ggagagtcca ccttccacac tgtgacttat 300

ggagcagtct gggagcgcat tcaggcgctg gtggcgggct ggacagcgct gggattcgtg 360

gctccggggg actttgtggg gatctctggg tttgccagcg tggactgggt ggtgtctgat 420

ctggcgacgc tgcatgctgg gggggtcatg gtccccctgc ccacaaacat cctggcagag 480

gacgtgcgcg caatcattga cgaggctgaa gtgcgttgcc tcatggtcag cgctgaggag 540

cttgcggcca ttgcaccggt catcggcggc tgcgcgagcg tgaaggccgt cattgtcatg 600

gacagttcca cggacgccgt gacatcctcg ggagcctacg cggagatgca ggccaacctg 660

ccggcaggcg caaagctgac caccatcgac gaagttttgg cggcaggccg cgcaaccggc 720

aagcagcccg cactggtgat ccccggcagg gatgggcggc ccgcggaccc cttagtaaac 780

ctcatgtaca cctcgggcag ctctgggcgt cccaaggggg ccgagtaccc cgagcacctc 840

atctttgact tcctcaagaa ctcgatgccc acagatgcgc cggagctgcc gaccatcata 900

atgggcttcc ttcctttaaa ccatttgatg ggaagattta ctctgctcaa gtgcctgctc 960

accggaggcc agaactggtt tgtgcgctcg accgacatgt cgaccttctt cgatgacctg 1020

gcgacgatcc gtcccacgga ggcgatgttc cctccgcgga ttatgaacat gctgcacgac 1080

agattcgtgg agcagctcga ccgcctgccg ccagccccca gcgaggccga gcgcgcgcag 1140

caacgccagg acctgatcaa gcgcttcagg gaagtggact tgggtggccg cctcttcacc 1200

ggctcctttg gcagcgcgcc agcgtcccca gatgtgatcc aatggctgga ggaggtcctc 1260

ggcttccccc cagtgaatgg ctacggctcc acagagggcg gcatgatcat gctcgacaac 1320

aagatccagc atagttatgt gccggcgtac aagctggtag atgtgccaga gctgggctac 1380

accacaaagg acaagccctt cccccgcgga gaactgcgca tcaagacccg gcgcatgatc 1440

ccgggctact acaaacatcc tgaggcaaca gcggatctgt ttgacgagga gggcttcctg 1500

aagactgggg atgtggtgga gcagcgcgat gcagacacct tcatctggct ggaccgcgtc 1560

aagaacatca tcaagctctc acagggtgag tacgtgagcg tgtcgcggct ggaggagatc 1620

tatgtgggca actccaagct catccaccag atgtacatct acgggaactc cctccgtgcc 1680

tacctggtcg ccgtcgtcgt gccccacatc gagaacggag cgtgtgcgga tgcgggcaag 1740

ctgagggcgg cgctgcggac agagctggat gacgtggcgc gacgcaaggc actacagggg 1800

tatgagatcc cgcgcgagtt catagtggag atgcgcccct tctccaagga caatcacctg 1860

ctcactgact ccgccaagcc cgcccgcggc cagctcaaga agaggtacca ggcggagctg 1920

gagggccttt acacggccct ggaggagcgt ctgcgcgaga gactgcgcgc catgaaggag 1980

ggcaaggatg catctgtgca ggaccgtatc aagcaggcgc tggaggttac tctgggactg 2040

gcggaggagg acatggcgga cgtggcttcg cgcagcttcg cgcagctggg cggtgactcg 2100

ctggcggcga tccagtttgc gcgctacgtg ggcgagcttt gcggcgtcaa cctgccggtg 2160

tcctttgtgc tggaccactc ccactccctc caggccatcg ccgaccgcgt ccacgaactc 2220

gtcagcggcg acgcgagcgc agggatcacg ttcgagtcga tccacggcag cgatggcgtg 2280

aacatcaagg cagccgacct gaagctggac cggttcctat cagaagctga cacggccgcg 2340

gccgccgcgg ccgccccggc ctccgagctg ccggcgcggc cgacacacgt gctgctgacc 2400

ggcgccaacg gcttcctcgg ccgcttcctg ctgctggacc tgctgcagcg cggttctgac 2460

aagaatggag gccgtgtggt ggctatagtg cgcggcagca gcgatgagaa ggcggctgag 2520

cggctgcgcg ccggttttga cagcggtgac gcgaccctgc tgcagcgcta tgacaccctc 2580

agcaagcatc tgaccgtcta tgcaggcgac ctggcgaagc cgcagctggg cctgagccag 2640

ggggtgtatg agtcgctgtg cgctgagctg gacaccatcg tgcacaacgg cgcgctggtc 2700

aaccacgctt actcctatga gcagctcttt gagcccaatg tgctcggcag cgtggaggtg 2760

atgcggatgg ctctggcaaa gcgcagaaag gcgctgacat tcatctccag tgtgggagtg 2820

gtgggaggcc tggaccaccc acagccggtg actgaggctg aggacggtcc aactctgtgt 2880

gatgtgcacc cgggcgacgg cggctacgcc atcgggtacg gctgcagcaa gtgggcggtg 2940

gaggtgcttc tcaaggagct gcaccagcgc tggggtgttc ccgtcaaggt cttccgctgc 3000

ggcatgatcc tgtcgcacac cagctacttg ggccagatca acccaaccga cttcttcacg 3060

cggctgctgt gcggcattgc ctacacgggg atcgccccgc agtccttcta caccctgccc 3120

cacggccccg aggagcactt tgacggcatg cccatcgact tcgtgtccgg cgtgatctct 3180

gccacaacgg cggccgagcg cagcggcttc gacacgtacc atgtggtcaa tccccactgg 3240

agcgacggcg tatccctcga ccgcatcgtc gactgggcgg agagcgccgg ctacccggtt 3300

aatcgcatcg cgccatatga gcagtggtac gcgcagttca aggcagcgct ggaggctctt 3360

gaccacacgc ggcagcagca gtcgccgctg cccatcatct accaatggga gcgcccggca 3420

tccggcacca gcggcacgaa gtacgatgcc acgcagctgc gcaagagggc ggccgcatac 3480

acacagtgga aggacgtgcc ccatctggac gaggcgttca tccaccagaa catgcgccac 3540

ctcaccaccc tgcgcctcat cacccctccc ggcaaggcct ga 3582

<210> 83

<211> 1193

<212> PRT

<213> Coccomyxa subellipsoidea

<400> 83

Met Thr Glu Asn Gly Gly Leu Pro Gln Val Asn Gly Gly Gly Pro Gln

1 5 10 15

Tyr Trp Glu Met Ser Asn Gly Gln Asn Gln Thr Asn Asn Val Ile Gln

20 25 30

Lys Arg Leu Ala Arg Ala Arg Glu Val Ile Lys Gln Asp Pro Gln Leu

35 40 45

Gln Ala Ala Lys Phe Asp Arg Lys Ser Leu Gln Arg Ile Thr Asp Ala

50 55 60

Gly Asn Thr Ser Ile Glu Ile Ile Ala Ala Met Phe Lys Glu Tyr Ala

65 70 75 80

Ser Arg Asp Leu Phe Gly Ala Cys Thr Pro Gly Glu Ser Thr Phe His

85 90 95

Thr Val Thr Tyr Gly Ala Val Trp Glu Arg Ile Gln Ala Leu Val Ala

100 105 110

Gly Trp Thr Ala Leu Gly Phe Val Ala Pro Gly Asp Phe Val Gly Ile

115 120 125

Ser Gly Phe Ala Ser Val Asp Trp Val Val Ser Asp Leu Ala Thr Leu

130 135 140

His Ala Gly Gly Val Met Val Pro Leu Pro Thr Asn Ile Leu Ala Glu

145 150 155 160

Asp Val Arg Ala Ile Ile Asp Glu Ala Glu Val Arg Cys Leu Met Val

165 170 175

Ser Ala Glu Glu Leu Ala Ala Ile Ala Pro Val Ile Gly Gly Cys Ala

180 185 190

Ser Val Lys Ala Val Ile Val Met Asp Ser Ser Thr Asp Ala Val Thr

195 200 205

Ser Ser Gly Ala Tyr Ala Glu Met Gln Ala Asn Leu Pro Ala Gly Ala

210 215 220

Lys Leu Thr Thr Ile Asp Glu Val Leu Ala Ala Gly Arg Ala Thr Gly

225 230 235 240

Lys Gln Pro Ala Leu Val Ile Pro Gly Arg Asp Gly Arg Pro Ala Asp

245 250 255

Pro Leu Val Asn Leu Met Tyr Thr Ser Gly Ser Ser Gly Arg Pro Lys

260 265 270

Gly Ala Glu Tyr Pro Glu His Leu Ile Phe Asp Phe Leu Lys Asn Ser

275 280 285

Met Pro Thr Asp Ala Pro Glu Leu Pro Thr Ile Ile Met Gly Phe Leu

290 295 300

Pro Leu Asn His Leu Met Gly Arg Phe Thr Leu Leu Lys Cys Leu Leu

305 310 315 320

Thr Gly Gly Gln Asn Trp Phe Val Arg Ser Thr Asp Met Ser Thr Phe

325 330 335

Phe Asp Asp Leu Ala Thr Ile Arg Pro Thr Glu Ala Met Phe Pro Pro

340 345 350

Arg Ile Met Asn Met Leu His Asp Arg Phe Val Glu Gln Leu Asp Arg

355 360 365

Leu Pro Pro Ala Pro Ser Glu Ala Glu Arg Ala Gln Gln Arg Gln Asp

370 375 380

Leu Ile Lys Arg Phe Arg Glu Val Asp Leu Gly Gly Arg Leu Phe Thr

385 390 395 400

Gly Ser Phe Gly Ser Ala Pro Ala Ser Pro Asp Val Ile Gln Trp Leu

405 410 415

Glu Glu Val Leu Gly Phe Pro Pro Val Asn Gly Tyr Gly Ser Thr Glu

420 425 430

Gly Gly Met Ile Met Leu Asp Asn Lys Ile Gln His Ser Tyr Val Pro

435 440 445

Ala Tyr Lys Leu Val Asp Val Pro Glu Leu Gly Tyr Thr Thr Lys Asp

450 455 460

Lys Pro Phe Pro Arg Gly Glu Leu Arg Ile Lys Thr Arg Arg Met Ile

465 470 475 480

Pro Gly Tyr Tyr Lys His Pro Glu Ala Thr Ala Asp Leu Phe Asp Glu

485 490 495

Glu Gly Phe Leu Lys Thr Gly Asp Val Val Glu Gln Arg Asp Ala Asp

500 505 510

Thr Phe Ile Trp Leu Asp Arg Val Lys Asn Ile Ile Lys Leu Ser Gln

515 520 525

Gly Glu Tyr Val Ser Val Ser Arg Leu Glu Glu Ile Tyr Val Gly Asn

530 535 540

Ser Lys Leu Ile His Gln Met Tyr Ile Tyr Gly Asn Ser Leu Arg Ala

545 550 555 560

Tyr Leu Val Ala Val Val Val Pro His Ile Glu Asn Gly Ala Cys Ala

565 570 575

Asp Ala Gly Lys Leu Arg Ala Ala Leu Arg Thr Glu Leu Asp Asp Val

580 585 590

Ala Arg Arg Lys Ala Leu Gln Gly Tyr Glu Ile Pro Arg Glu Phe Ile

595 600 605

Val Glu Met Arg Pro Phe Ser Lys Asp Asn His Leu Leu Thr Asp Ser

610 615 620

Ala Lys Pro Ala Arg Gly Gln Leu Lys Lys Arg Tyr Gln Ala Glu Leu

625 630 635 640

Glu Gly Leu Tyr Thr Ala Leu Glu Glu Arg Leu Arg Glu Arg Leu Arg

645 650 655

Ala Met Lys Glu Gly Lys Asp Ala Ser Val Gln Asp Arg Ile Lys Gln

660 665 670

Ala Leu Glu Val Thr Leu Gly Leu Ala Glu Glu Asp Met Ala Asp Val

675 680 685

Ala Ser Arg Ser Phe Ala Gln Leu Gly Gly Asp Ser Leu Ala Ala Ile

690 695 700

Gln Phe Ala Arg Tyr Val Gly Glu Leu Cys Gly Val Asn Leu Pro Val

705 710 715 720

Ser Phe Val Leu Asp His Ser His Ser Leu Gln Ala Ile Ala Asp Arg

725 730 735

Val His Glu Leu Val Ser Gly Asp Ala Ser Ala Gly Ile Thr Phe Glu

740 745 750

Ser Ile His Gly Ser Asp Gly Val Asn Ile Lys Ala Ala Asp Leu Lys

755 760 765

Leu Asp Arg Phe Leu Ser Glu Ala Asp Thr Ala Ala Ala Ala Ala Ala

770 775 780

Ala Pro Ala Ser Glu Leu Pro Ala Arg Pro Thr His Val Leu Leu Thr

785 790 795 800

Gly Ala Asn Gly Phe Leu Gly Arg Phe Leu Leu Leu Asp Leu Leu Gln

805 810 815

Arg Gly Ser Asp Lys Asn Gly Gly Arg Val Val Ala Ile Val Arg Gly

820 825 830

Ser Ser Asp Glu Lys Ala Ala Glu Arg Leu Arg Ala Gly Phe Asp Ser

835 840 845

Gly Asp Ala Thr Leu Leu Gln Arg Tyr Asp Thr Leu Ser Lys His Leu

850 855 860

Thr Val Tyr Ala Gly Asp Leu Ala Lys Pro Gln Leu Gly Leu Ser Gln

865 870 875 880

Gly Val Tyr Glu Ser Leu Cys Ala Glu Leu Asp Thr Ile Val His Asn

885 890 895

Gly Ala Leu Val Asn His Ala Tyr Ser Tyr Glu Gln Leu Phe Glu Pro

900 905 910

Asn Val Leu Gly Ser Val Glu Val Met Arg Met Ala Leu Ala Lys Arg

915 920 925

Arg Lys Ala Leu Thr Phe Ile Ser Ser Val Gly Val Val Gly Gly Leu

930 935 940

Asp His Pro Gln Pro Val Thr Glu Ala Glu Asp Gly Pro Thr Leu Cys

945 950 955 960

Asp Val His Pro Gly Asp Gly Gly Tyr Ala Ile Gly Tyr Gly Cys Ser

965 970 975

Lys Trp Ala Val Glu Val Leu Leu Lys Glu Leu His Gln Arg Trp Gly

980 985 990

Val Pro Val Lys Val Phe Arg Cys Gly Met Ile Leu Ser His Thr Ser

995 1000 1005

Tyr Leu Gly Gln Ile Asn Pro Thr Asp Phe Phe Thr Arg Leu Leu

1010 1015 1020

Cys Gly Ile Ala Tyr Thr Gly Ile Ala Pro Gln Ser Phe Tyr Thr

1025 1030 1035

Leu Pro His Gly Pro Glu Glu His Phe Asp Gly Met Pro Ile Asp

1040 1045 1050

Phe Val Ser Gly Val Ile Ser Ala Thr Thr Ala Ala Glu Arg Ser

1055 1060 1065

Gly Phe Asp Thr Tyr His Val Val Asn Pro His Trp Ser Asp Gly

1070 1075 1080

Val Ser Leu Asp Arg Ile Val Asp Trp Ala Glu Ser Ala Gly Tyr

1085 1090 1095

Pro Val Asn Arg Ile Ala Pro Tyr Glu Gln Trp Tyr Ala Gln Phe

1100 1105 1110

Lys Ala Ala Leu Glu Ala Leu Asp His Thr Arg Gln Gln Gln Ser

1115 1120 1125

Pro Leu Pro Ile Ile Tyr Gln Trp Glu Arg Pro Ala Ser Gly Thr

1130 1135 1140

Ser Gly Thr Lys Tyr Asp Ala Thr Gln Leu Arg Lys Arg Ala Ala

1145 1150 1155

Ala Tyr Thr Gln Trp Lys Asp Val Pro His Leu Asp Glu Ala Phe

1160 1165 1170

Ile His Gln Asn Met Arg His Leu Thr Thr Leu Arg Leu Ile Thr

1175 1180 1185

Pro Pro Gly Lys Ala

1190

<210> 84

<211> 4717

<212> DNA

<213> 人工序列

<220>

<223> 含有Coccomyxa subellipsoidea的ACAR 基因(经密码子优化)和

大肠杆菌的entD基因的DNA片段的核苷酸序列

<400> 84

ccaagcttgc atgccagatc gtttagatcc gaaggaaaac gtcgaaaagc aatttgcttt 60

tcgacgcccc accccgcgcg ttttagcgtg tcagtagacg cgtagggtaa gtggggtagc 120

ggcttgttag atatcttgaa atcggctttc aacagcattg atttcgatgt atttagctgg 180

ccgtttgaga cgcgatgtcc acagggtagc tggtagtttg aaaatcaacg ccgttgccct 240

taggattcag taactggcac attttgtaat gcgctagatc tgtgtgccca gtcttccagg 300

ctgcttatca cagtgaaagc aaaaccaatt cgtggctgcg aaagtcgtag ccaccacgaa 360

gtccaggagg acatacaatg accgaaaatg gtggtctgcc gcaggttaat ggtggtggtc 420

cgcagtattg ggaaatgagc aatggtcaga atcagaccaa taacgtgatt cagaaacgtc 480

tggcacgtgc gcgtgaagtt attaaacagg atccgcagct gcaggcagca aaatttgatc 540

gtaaaagcct gcagcgtatt accgatgcag gtaataccag cattgaaatt attgcagcca 600

tgtttaaaga atacgcaagc cgtgacctgt ttggtgcatg tacaccgggt gaaagcacct 660

ttcataccgt tacctatggt gcagtttggg aacgtattca ggcactggtt gcaggttgga 720

ccgcactggg ttttgttgct ccgggtgatt ttgttggtat tagcggtttt gcaagcgttg 780

attgggttgt tagcgatctg gcaaccctgc atgccggtgg tgttatggtt ccgctgccga 840

ccaatattct ggccgaagat gttcgtgcaa ttattgatga agccgaagtt cgttgtctga 900

tggttagcgc agaagaactg gcagcaattg caccggttat tggtggttgt gccagcgtta 960

aagcagttat tgttatggat agcagcaccg atgccgttac cagcagcggt gcatatgccg 1020

aaatgcaggc caatctgcct gccggtgcaa aactgaccac catcgatgaa gttctggcag 1080

caggtcgtgc aaccggtaaa cagcctgccc tggttattcc gggtcgtgat ggtcgtccgg 1140

cagatccgct ggttaatctg atgtatacca gcggtagcag cggtcgtccg aaaggtgcag 1200

aatatccgga acatctgatt tttgattttc tgaaaaatag catgccgacc gatgcaccgg 1260

aactgccgac gattattatg ggttttctgc cgctgaatca tctgatgggt cgttttaccc 1320

tgctgaaatg tctgctgacc ggtggccaga attggtttgt tcgtagcacc gatatgagca 1380

ccttttttga tgatctggcg accattcgtc cgaccgaagc aatgtttccg cctcgtatta 1440

tgaatatgct gcatgatcgt tttgtggaac agctggatcg tctgcctccg gcaccgagcg 1500

aagcagaacg tgcacagcag cgtcaggatc tgattaaacg ttttcgtgaa gttgatctgg 1560

gtggtcgtct gtttacaggt agctttggta gcgcaccggc aagtccggat gttattcagt 1620

ggctggaaga agtgctgggt tttccgcctg ttaatggtta tggtagtacc gaaggtggta 1680

tgattatgct ggacaacaaa attcagcaca gctatgttcc agcctataaa ctggttgatg 1740

tgccggaact gggttatacc accaaagata aaccgtttcc gcgtggtgaa ctgcgtatta 1800

aaacccgtcg tatgattccg ggttattaca aacatcctga agcaaccgca gacctgttcg 1860

atgaagaagg tttcctgaaa accggtgatg ttgttgaaca gcgtgatgca gataccttta 1920

tttggctgga tcgcgtgaaa aacattatca aactgagcca gggtgaatat gttagcgtta 1980

gccgtctgga agaaatttat gtgggtaaca gcaaactgat tcaccagatg tatatctatg 2040

gtaatagcct gcgtgcatat ctggttgccg ttgttgttcc gcatattgaa aatggcgcat 2100

gtgcagatgc cggtaaactg cgtgcagcac tgcgtaccga actggatgat gttgcacgtc 2160

gtaaagcact gcagggttat gaaattcctc gtgaatttat tgttgagatg cgtccgttta 2220

gcaaagataa tcatctgctg acagatagcg caaaaccggc acgtggtcag ctgaaaaaac 2280

gttatcaggc agaactggaa ggtctgtata cggcactgga agaacgtctg cgtgaacggc 2340

tgcgtgcaat gaaagaaggt aaagacgcaa gcgttcagga tcgtatcaaa caggccctgg 2400

aagttaccct gggtctggcg gaagaggata tggcagatgt tgcaagccgt agctttgcac 2460

agctgggtgg tgatagcctg gcagccattc agtttgcacg ttatgttggc gaactgtgtg 2520

gtgttaatct gccggttagc tttgttctgg atcatagcca tagtctgcag gcaattgcag 2580

atcgtgtgca tgaactggtt agcggtgatg cctcagcagg cattaccttt gaaagcattc 2640

atggtagtga tggcgttaac attaaagcag cagatctgaa actggatcgt tttctgagcg 2700

aagccgatac cgcagcagca gccgctgcag caccggcatc agaactgcct gcacgtccga 2760

cccatgttct gctgactggc gcaaatggtt ttctgggtcg ctttctgctg ctggatctgc 2820

tgcagcgtgg tagcgataaa aatggcggtc gtgttgttgc aattgttcgt ggtagcagtg 2880

atgaaaaagc agccgaacgc ctgcgtgcgg gttttgatag tggtgatgcc accctgctgc 2940

aacgttatga taccctgagc aaacatctga ccgtttatgc cggtgatctg gccaaaccgc 3000

agctgggtct gagtcagggt gtttatgaaa gcctgtgtgc agagctggat accattgttc 3060

ataatggtgc actggtgaac catgcctata gctatgagca gctgtttgaa ccgaatgttc 3120

tgggtagcgt tgaagttatg cgtatggcac tggcaaaacg ccgtaaagcc ctgaccttta 3180

ttagcagcgt tggtgttgtg ggtggcctgg atcatccgca gccggttacc gaagcggaag 3240

atggtccgac cctgtgtgat gttcatcctg gtgatggtgg ttatgcaatt ggttatggct 3300

gtagcaaatg ggcagttgaa gtgctgctga aagaactgca tcagcgttgg ggtgttccgg 3360

ttaaagtttt tcgttgcggt atgattctgt cccataccag ctatctgggt cagattaatc 3420

cgacagattt tttcacccgt ctgctgtgtg gtattgcata tacaggtatt gcaccgcaga 3480

gcttttatac cctgccgcat ggtccggaag aacattttga tggtatgccg attgattttg 3540

tgagcggtgt tattagcgca accacagccg cagaacgtag cggctttgat acctatcatg 3600

ttgttaatcc gcattggagt gatggtgtga gcctggatcg tattgtagat tgggcagaaa 3660

gtgcaggtta tccggttaat cgtatcgcac cgtacgaaca gtggtatgca cagtttaaag 3720

cagccctgga agcactggat catacccgtc agcagcagtc accgctgccg attatctatc 3780

agtgggaacg tccggcaagc ggtacaagcg gcaccaaata tgatgcaaca cagctgcgta 3840

aacgtgcagc agcctatacc cagtggaaag atgtgccgca tctggatgaa gcatttattc 3900

atcagaatat gcgtcatctg accaccctgc gtctgattac ccctccgggt aaagcataaa 3960

ggaggacata caatggtcga tatgaaaact acgcatacct ccctcccctt tgccggacat 4020

acgctgcatt ttgttgagtt cgatccggcg aatttttgtg agcaggattt actctggctg 4080

ccgcactacg cacaactgca acacgctgga cgtaaacgta aaacagagca tttagccgga 4140

cggatcgctg ctgtttatgc tttgcgggaa tatggctata aatgtgtgcc cgcaatcggc 4200

gagctacgcc aacctgtctg gcctgcggag gtatacggca gtattagcca ctgtgggact 4260

acggcattag ccgtggtatc tcgtcaaccg attggcattg atatagaaga aattttttct 4320

gtacaaaccg caagagaatt gacagacaac attattacac cagcggaaca cgagcgactc 4380

gcagactgcg gtttagcctt ttctctggcg ctgacactgg cattttccgc caaagagagc 4440

gcatttaagg caagtgagat ccaaactgat gcaggttttc tggactatca gataattagc 4500

tggaataaac agcaggtcat cattcatcgt gagaatgaga tgtttgctgt gcactggcag 4560

ataaaagaaa agatagtcat aacgctgtgc caacacgatt aattgacaac atctggtacg 4620

attcgcccgc agccatcact gaccacgggc gaaagtgtaa agcaggtgcc ttaccatcct 4680

gacctgacaa ccggatatgc gggatccccg ggtaccg 4717

<210> 85

<211> 3582

<212> DNA

<213> Coccomyxa subellipsoidea

<400> 85

atgaccgaaa atggtggtct gccgcaggtt aatggtggtg gtccgcagta ttgggaaatg 60

agcaatggtc agaatcagac caataacgtg attcagaaac gtctggcacg tgcgcgtgaa 120

gttattaaac aggatccgca gctgcaggca gcaaaatttg atcgtaaaag cctgcagcgt 180

attaccgatg caggtaatac cagcattgaa attattgcag ccatgtttaa agaatacgca 240

agccgtgacc tgtttggtgc atgtacaccg ggtgaaagca cctttcatac cgttacctat 300

ggtgcagttt gggaacgtat tcaggcactg gttgcaggtt ggaccgcact gggttttgtt 360

gctccgggtg attttgttgg tattagcggt tttgcaagcg ttgattgggt tgttagcgat 420

ctggcaaccc tgcatgccgg tggtgttatg gttccgctgc cgaccaatat tctggccgaa 480

gatgttcgtg caattattga tgaagccgaa gttcgttgtc tgatggttag cgcagaagaa 540

ctggcagcaa ttgcaccggt tattggtggt tgtgccagcg ttaaagcagt tattgttatg 600

gatagcagca ccgatgccgt taccagcagc ggtgcatatg ccgaaatgca ggccaatctg 660

cctgccggtg caaaactgac caccatcgat gaagttctgg cagcaggtcg tgcaaccggt 720

aaacagcctg ccctggttat tccgggtcgt gatggtcgtc cggcagatcc gctggttaat 780

ctgatgtata ccagcggtag cagcggtcgt ccgaaaggtg cagaatatcc ggaacatctg 840

atttttgatt ttctgaaaaa tagcatgccg accgatgcac cggaactgcc gacgattatt 900

atgggttttc tgccgctgaa tcatctgatg ggtcgtttta ccctgctgaa atgtctgctg 960

accggtggcc agaattggtt tgttcgtagc accgatatga gcaccttttt tgatgatctg 1020

gcgaccattc gtccgaccga agcaatgttt ccgcctcgta ttatgaatat gctgcatgat 1080

cgttttgtgg aacagctgga tcgtctgcct ccggcaccga gcgaagcaga acgtgcacag 1140

cagcgtcagg atctgattaa acgttttcgt gaagttgatc tgggtggtcg tctgtttaca 1200

ggtagctttg gtagcgcacc ggcaagtccg gatgttattc agtggctgga agaagtgctg 1260

ggttttccgc ctgttaatgg ttatggtagt accgaaggtg gtatgattat gctggacaac 1320

aaaattcagc acagctatgt tccagcctat aaactggttg atgtgccgga actgggttat 1380

accaccaaag ataaaccgtt tccgcgtggt gaactgcgta ttaaaacccg tcgtatgatt 1440

ccgggttatt acaaacatcc tgaagcaacc gcagacctgt tcgatgaaga aggtttcctg 1500

aaaaccggtg atgttgttga acagcgtgat gcagatacct ttatttggct ggatcgcgtg 1560

aaaaacatta tcaaactgag ccagggtgaa tatgttagcg ttagccgtct ggaagaaatt 1620

tatgtgggta acagcaaact gattcaccag atgtatatct atggtaatag cctgcgtgca 1680

tatctggttg ccgttgttgt tccgcatatt gaaaatggcg catgtgcaga tgccggtaaa 1740

ctgcgtgcag cactgcgtac cgaactggat gatgttgcac gtcgtaaagc actgcagggt 1800

tatgaaattc ctcgtgaatt tattgttgag atgcgtccgt ttagcaaaga taatcatctg 1860

ctgacagata gcgcaaaacc ggcacgtggt cagctgaaaa aacgttatca ggcagaactg 1920

gaaggtctgt atacggcact ggaagaacgt ctgcgtgaac ggctgcgtgc aatgaaagaa 1980

ggtaaagacg caagcgttca ggatcgtatc aaacaggccc tggaagttac cctgggtctg 2040

gcggaagagg atatggcaga tgttgcaagc cgtagctttg cacagctggg tggtgatagc 2100

ctggcagcca ttcagtttgc acgttatgtt ggcgaactgt gtggtgttaa tctgccggtt 2160

agctttgttc tggatcatag ccatagtctg caggcaattg cagatcgtgt gcatgaactg 2220

gttagcggtg atgcctcagc aggcattacc tttgaaagca ttcatggtag tgatggcgtt 2280

aacattaaag cagcagatct gaaactggat cgttttctga gcgaagccga taccgcagca 2340

gcagccgctg cagcaccggc atcagaactg cctgcacgtc cgacccatgt tctgctgact 2400

ggcgcaaatg gttttctggg tcgctttctg ctgctggatc tgctgcagcg tggtagcgat 2460

aaaaatggcg gtcgtgttgt tgcaattgtt cgtggtagca gtgatgaaaa agcagccgaa 2520

cgcctgcgtg cgggttttga tagtggtgat gccaccctgc tgcaacgtta tgataccctg 2580

agcaaacatc tgaccgttta tgccggtgat ctggccaaac cgcagctggg tctgagtcag 2640

ggtgtttatg aaagcctgtg tgcagagctg gataccattg ttcataatgg tgcactggtg 2700

aaccatgcct atagctatga gcagctgttt gaaccgaatg ttctgggtag cgttgaagtt 2760

atgcgtatgg cactggcaaa acgccgtaaa gccctgacct ttattagcag cgttggtgtt 2820

gtgggtggcc tggatcatcc gcagccggtt accgaagcgg aagatggtcc gaccctgtgt 2880

gatgttcatc ctggtgatgg tggttatgca attggttatg gctgtagcaa atgggcagtt 2940

gaagtgctgc tgaaagaact gcatcagcgt tggggtgttc cggttaaagt ttttcgttgc 3000

ggtatgattc tgtcccatac cagctatctg ggtcagatta atccgacaga ttttttcacc 3060

cgtctgctgt gtggtattgc atatacaggt attgcaccgc agagctttta taccctgccg 3120

catggtccgg aagaacattt tgatggtatg ccgattgatt ttgtgagcgg tgttattagc 3180

gcaaccacag ccgcagaacg tagcggcttt gatacctatc atgttgttaa tccgcattgg 3240

agtgatggtg tgagcctgga tcgtattgta gattgggcag aaagtgcagg ttatccggtt 3300

aatcgtatcg caccgtacga acagtggtat gcacagttta aagcagccct ggaagcactg 3360

gatcataccc gtcagcagca gtcaccgctg ccgattatct atcagtggga acgtccggca 3420

agcggtacaa gcggcaccaa atatgatgca acacagctgc gtaaacgtgc agcagcctat 3480

acccagtgga aagatgtgcc gcatctggat gaagcattta ttcatcagaa tatgcgtcat 3540

ctgaccaccc tgcgtctgat tacccctccg ggtaaagcat aa 3582

Claims

1.一种生产目标物质的方法，所述方法包括：

其中所述目标物质是醛，

(a)包含SEQ ID NO:18、79或83的氨基酸序列的蛋白质；

2.根据权利要求1所述的方法，其中所述生产包括：

3.根据权利要求1所述的方法，其中所述生产包括：

4.根据权利要求3所述的方法，其中所述转化包括：

5.根据权利要求3所述的方法，其中所述转化包括：

6.根据权利要求5所述的方法，其中所述细胞选自由以下组成的组：

-存在于所述微生物的培养液中的细胞，

-从所述培养液中收集的细胞，

-存在于所述培养液的加工产物中的细胞，

-存在于收集的细胞的加工产物中的细胞，和

-这些的组合。

7.根据权利要求3至6中任一项所述的方法，其中所述前体是选自由以下组成的组的物质：原儿茶酸、香草酸、苯甲酸、L-苯丙氨酸、肉桂酸和它们的组合。

8.根据权利要求1至7中任一项所述的方法，所述方法还包括从所述培养基或反应混合物中收集所述目标物质。

9.根据权利要求1至8中任一项所述的方法，其中所述微生物是属于肠杆菌科的细菌、棒状杆菌细菌或酵母。

10.根据权利要求9所述的方法，其中所述微生物是属于棒状杆菌属的细菌。

11.根据权利要求10所述的方法，其中所述微生物是谷氨酸棒杆菌。

12.根据权利要求9所述的方法，其中所述微生物是属于埃希氏菌属的细菌。

13.根据权利要求12所述的方法，其中所述微生物是大肠杆菌。

14.根据权利要求1-13中任一项所述的方法，其中所述目标物质是芳族醛。

15.根据权利要求1-14中任一项所述的方法，其中所述目标物质是选自由以下组成的组的芳族醛：香草醛、苯甲醛、肉桂醛和它们的组合。

16.根据权利要求1-15中任一项所述的方法，其中所述微生物已经以与未修饰的菌株相比参与所述目标物质的生物合成的酶的活性得以增加的方式进行了进一步的修饰。

17.根据权利要求16所述的方法，其中所述参与目标物质的生物合成的酶能够催化从所述目标物质的前体向所述目标物质的转化。

18.根据权利要求16或17所述的方法，其中所述参与目标物质的生物合成的酶选自由以下组成的组：3-脱氧-D-阿拉伯糖-庚酮糖酸7-磷酸合酶、3-脱氢奎尼酸合酶、3-脱氢奎尼酸脱水酶、3-脱氢莽草酸脱水酶、O-甲基转移酶、苯丙氨酸氨裂合酶和它们的组合。

19.根据权利要求1-18中任一项所述的方法，其中所述微生物已经以与未修饰的菌株相比磷酸泛酰巯基乙胺基转移酶的活性得以增加的方式进行了进一步的修饰。

20.根据权利要求1-19中任一项所述的方法，其中所述微生物已经以与未修饰的菌株相比除所述目标物质以外的物质的摄取系统的活性得以增加的方式进行了进一步的修饰。

21.根据权利要求20所述的方法，其中所述摄取系统选自由以下组成的组：香草酸摄取系统、原儿茶酸摄取系统和它们的组合。

22.根据权利要求1至21中任一项所述的方法，其中所述微生物已经以与未修饰的菌株相比在所述目标物质的生产期间参与生产副产物的酶的活性得以降低的方式进行了进一步的修饰。

23.根据权利要求22所述的方法，其中所述在目标物质的生产期间参与生产副产物的酶选自由以下组成的组：香草酸脱甲基酶、原儿茶酸3,4-双加氧酶、醇脱氢酶、莽草酸脱氢酶和它们的组合。