CN1930299B

CN1930299B - 红球菌属的腈水合酶

Info

Publication number: CN1930299B
Application number: CN2005800082068A
Authority: CN
Inventors: S·奥斯瓦尔多; S·沃瑟克; U·戴廷; C·维克贝克; K·胡斯玛彻; M·班德; M-R·库拉; K·欧丹达尔
Original assignee: Evonik Degussa GmbH
Current assignee: Evonik Operations GmbH
Priority date: 2004-03-20
Filing date: 2005-03-01
Publication date: 2011-04-06
Anticipated expiration: 2025-03-01
Also published as: DE102004013824A1; ES2400360T3; US20060068467A1; US20080057549A1; RU2385932C2; WO2005093080A2; RU2006137033A; US7288402B2; JP2007529231A; EP1730291A2; EP1730291B1; WO2005093080A3; US7491521B2; BRPI0509023A; CN1930299A; JP5080240B2

Abstract

本发明涉及红球菌多核苷酸簇，其含有编码具有腈水合酶活性的多肽的核苷酸序列、能活化该酶的辅助蛋白P15K的核苷酸序列、和钴转运蛋白的核苷酸序列，涉及用该簇转化的微生物，且其中能编码这些蛋白的核苷酸序列增强地存在，还涉及转化的微生物在从腈制备酰胺中的应用。

Description

红球菌属的腈水合酶

本发明涉及红球菌多核苷酸簇，其含有能编码具有腈水合酶活性的多肽的核苷酸序列、能活化该酶的辅助蛋白P15K的核苷酸序列、和钴转运蛋白的核苷酸序列，涉及用该簇转化的微生物，且其中能编码这些蛋白的核苷酸序列增强地存在，还涉及转化的微生物在从腈制备酰胺中的应用。

在文献中已经描述了大量的腈水合酶(Synthetic applicationsof nitrile-converting enzymes；Martinkova，Ludmila；Mylerova，Veronika；Current Organic Chemistry(2003)，7(13)，1279-1295)。自1983年以来，已经使用腈水合酶，以每年数千吨的规模生产丙烯酰胺。已经证实，该生物催化过程能与化学过程相媲美(Enzymicsynthesis of acrylamide：a success story not yet over；Kobayashi，Michihiko；Nagasawa，Toru；Yamada，Trends in Biotechnology(1992)，10(11)，402-8)。

除了可以用于转化丙烯腈的腈水合酶外，还已经描述了例如特别适用于转化甲基丙烯腈(A nitrile hydratase of Pseudonocardiathermophila and the genes encoding and manufactureof the enzymefor conversion of nitriles to amide s(EP 790310))、3-氰基吡啶(Process for producing amideswith Rhodococcus nitrilehydratase(WO 2002055670))或2-羟基腈例如2-羟基-4-甲硫基丁腈(A nitrile hydrataseof Rhodococcus and its use in themanufacture of amides(WO 2002070717)和Enzymic conversion ofα-hydroxynitrilesto the correspondingα-hydroxyamides，acidsor acid salts，(WO 9832872))的腈水合酶。相反地，迄今尚不知道可以用于有效地转化2-氨基腈的腈水合酶。尽管红球菌属Cr4腈水合酶能例如以高度的活性转化2-羟基腈，它根本不能转化简单的2-氨基腈例如氨基乙腈(WO 2002070717)。

氨基腈向对应的酰胺的酶促转化，打开了一条有吸引力的合成氨基酸的途径，因为2-氨基酰胺可以被容易地水解(WO 2001060789)。该方法能在温和条件下进行，且具有非常高度的选择性，不会形成副产物例如盐，如根据化学水解获得的。

备选地，也可以用碱金属或碱土金属氢氧化物将酰胺转化成对应的酸盐。当使用氢氧化钙转化4-甲硫基-α-羟基丁酰胺(MHA-酰胺)时，该方法是特别优选的，因为MHA的钙盐可以直接作为甲硫氨酸或MHA的替代产物形式被用作饲料添加剂。

但是，为了生产日用品产物例如DL-甲硫氨酸，不能得到具有足够高活性的生物催化剂。为了增加活性，必须建立针对待扩增的基因的表达系统。其自身存在的一种可能性是异源表达，例如，尤其在大肠杆菌、芽胞杆菌属、假单胞菌属、毕赤酵母属、酵母或曲霉属中，因为这些微生物能表现出快速生长，达到非常高的细胞密度，且可使用的分子生物学工具，其允许非常高的表达水平(Lee SY(1996)Highcell-density culture of Escherichia coli.TIBTECH 14：98-105；Riesenberg D，Guthke R(1999)High-cell-density cultivation ofmicroorganisms.Appl Microbiol Biotechnol 51：422-430)。

已知要异源地表达腈水合酶，必须共表达至少3个基因。除了2个结构基因外，还必须为依赖于铁的和依赖于钴的酶增强相应的辅助蛋白(Nojiri M.等，(1999)Functional expression of Nitrilehydratases in Escherichia coli：Requirement of a nitrilehydratase activator and a post-translational modification ofa ligand cysteine.J Biochem 125：696-704 and Over-productionof stereoselective nitrile hydratase from Pseudomonas putida5B in Escherichia coli：activity requires a novel downstreamprotein，Wu，S.；Fallon，R.D.；Payne，M.S.Applied Microbiology and Biotechnology(1997)，48(6)，704-708)。

除了这3个基因外，还在玫瑰色红球菌属J1的基因簇中的结构基因和辅助蛋白基因旁，发现了另一个基因，其能编码钴转运蛋白(Anovel transporter involved in cobalt uptake，Komeda，Hidenobu等，Proceedings of the National Academy of Sciences of theUnited States of America(1997)，94(1)，36-41)。在红球菌属和大肠杆菌中的过表达，会导致从培养基中增加摄入Co²⁺离子。另外证实，当钴转运蛋白与3种其它蛋白一起共表达时，可以在培养基中的Co浓度低于单独表达结构基因和辅助蛋白时的浓度，达到相同的腈水合酶活性。但是，根据Komeda等，该作用仅仅发生在小于42μM浓度的红球菌属中。

EP 0 362 829公开了玫瑰色红球菌属在有钴盐存在下的发酵。

本发明的目的是，获取具有高活性的腈水合酶，其特别地能将α-氨基腈转化成酰胺。

本发明涉及下述内容：

1.从红球菌属、特别是混浊红球菌(Rhodococcus opacus)分离的多核苷酸簇，其含有4个核苷酸序列，其能编码4种多肽，后者具有在每种情况下与序列SEQ ID NO：2至SEQ ID NO：5包含的氨基酸序列至少90％一致的氨基酸序列，所述多肽具有腈水合酶辅助蛋白P15K和钴转运蛋白的活性，所述腈水合酶由α-亚基和β-亚基组成。

2.多核苷酸，其选自：

a)多核苷酸，其由核苷酸序列SEQ ID NO：1的位置1-708或与其互补的核苷酸序列组成，

b)多核苷酸，其在遗传密码的简并性的范围内，具有与a)的序列相对应的核苷酸序列，

c)多核苷酸，其能在严格条件下，与互补序列a)或b)杂交，和

d)多核苷酸，其具有含有功能上中性的有义突变的a)，b)或c) 的核苷酸序列，

其中所述多核苷酸编码腈水合酶的β-亚基。

3.多核苷酸，其选自：

a)多核苷酸，其由核苷酸序列SEQ ID NO：1的位置710-1327或与其互补的核苷酸序列组成，

c)多核苷酸，其能在严格条件下，与互补序列a)或b)杂交，和

d)多核苷酸，其具有含有功能上中性的有义突变的a)，b)或c)的核苷酸序列，

其中所述多核苷酸编码腈水合酶的α-亚基。

4.多核苷酸，其选自：

a)多核苷酸，其由核苷酸序列SEQ ID NO：1中的位置1324-1737或与其互补的核苷酸序列组成，

c)多核苷酸，其能在严格条件下，与互补序列a)或b)杂交，和

其中所述多核苷酸编码辅助蛋白P15K。

5.多核苷酸，其选自：

a)多核苷酸，其由核苷酸序列SEQ ID NO：1中的位置2076-3146或与其互补的核苷酸序列组成，

c)多核苷酸，其能在严格条件下，与互补序列a)或b)杂交，和

其中所述多核苷酸编码具有钴转运蛋白活性的蛋白。

6)根据2)或3)的多肽，其含有氨基酸序列SEQ ID NO：2和SEQ ID NO：3，其中所述多肽具有腈水合酶活性。

7)根据4)的多肽，其含有氨基酸序列SEQ ID NO：6，其中所述多肽具有辅助蛋白P15K活性。

8)根据5)的多肽，其含有氨基酸序列SEQ ID NO：5，其中所述多肽具有钴转运蛋白活性。

9)探针或引物，其含有核苷酸序列SEQ ID NO：1的位置1-1327中的至少20个连续核苷酸或它的互补形式。

10)探针或引物，其含有核苷酸序列SEQ ID NO：1的位置1324-1737中的至少20个连续核苷酸或它的互补形式。

11)探针或引物，其含有核苷酸序列SEQ ID NO：1的位置2076-3146中的至少20个连续核苷酸或它的互补形式。

12)根据2)和3)的分离的多核苷酸，其在严格条件下，与具有SEQ ID NO：1中的位置1-1327的互补物杂交，其中所述严格条件包含在50-68℃的温度，在5×SSC中洗涤。

13)根据4)的分离的多核苷酸，其在严格条件下，与具有SEQ IDNO：1中的位置1324-1737的互补物杂交，其中所述严格条件包含在50-68℃的温度，在5×SSC中洗涤。

14)根据5的分离的多核苷酸，其在严格条件下，与具有SEQ IDNO：1中的位置2076-3146的互补物杂交，其中所述严格条件包含在50-68℃的温度，在5×SSC中洗涤。

15)载体，其含有一个或多个选自1)-5)和12)-14)，或根据2)，3)和4)或根据5)的多核苷酸。

16)载体pUD15，其由核苷酸序列SEQ ID NO.24组成，含有来自 SEQ ID NO：1的根据2)，3)，和6)的序列，其中所述起始密码子gtg已经被修改成atg。

17)载体pUD16，其由核苷酸序列SEQ ID NO：25组成，含有5)中的序列，其中所述起始密码子ttg已经被修改成atg。

18)宿主细胞，其通过导入根据1)-5)和12)-14)的多核苷酸，被转化或转染；该宿主细胞可以是已知对于表达系统具有足够稳定性的真核细胞或原核细胞。

19)宿主细胞，其通过导入根据15)-17)的载体被转化。

20)根据18)或19)的转化的宿主细胞，其中所述宿主细胞是肠杆菌科尤其是埃希氏杆菌属的细菌。

使用已知的转化或转染技术，可以将载体DNA导入真核或原核细胞。

“转化”，“转染”，“接合”和“转导”指根据现有技术已知的用于导入外来DNA的方法。

本发明也涉及多核苷酸，其基本上由多核苷酸序列组成，后者可以通过下述方法得到：借助含有完整基因或其一部分的相应的混浊红球菌基因库，与含有根据本发明的来自SEQ ID No：1的多核苷酸序列或其片段的探针杂交，而进行筛选，并分离所述多核苷酸序列。

含有根据本发明的序列的多核苷酸适合用作RNA、cDNA和DNA的杂交探针，用于分离编码根据本发明的蛋白的核酸或多核苷酸或全长基因，或用于分离其序列与根据本发明的基因序列具有高度相似性的核酸或多核苷酸或基因。它们也可以作为探针，应用于所谓的阵列、微阵列或DNA芯片，用于检测和确定相应的多核苷酸或由其衍化的序列例如RNA或cDNA。

含有根据本发明的序列的多核苷酸也适合用作引物，其可以与聚合酶链反应(PCR)一起，用于从编码根据本发明的蛋白的基因制备DNA。

这些用作探针或引物的寡核苷酸含有至少25或30、优选至少20、非常特别优选至少15个连续核苷酸。具有至少40或50个核苷酸长度的寡核苷酸同样适用。当合适时，具有至少100，150，200，250或300个核苷酸的寡核苷酸也适用。

“分离”指从它的自然环境取出。

通常，“多核苷酸”指多核糖核苷酸和多脱氧核糖核苷酸，可能是未修饰的RNA或DNA或经修饰的RNA或DNA。

根据本发明的多核苷酸包括如SEQ ID NO.1所述的多核苷酸，或其中包含的片段，以及与SEQ ID NO.1的多核苷酸或其中包含的片段至少90％，93％，95％，97％或99％一致的那些。

“多肽”应当理解为含有2个或多个通过肽键相连的氨基酸的肽或蛋白。

根据本发明的多肽包括序列SEQ ID NO：2至SEQ ID NO：4和SEQ ID NO：6所述的多肽，以及与序列SEQ ID NO：2至SEQ ID NO：4和SEQ ID NO：6所述的多肽至少90％、特别优选至少91％，95％，97％或99％一致的多肽。

SEQ ID NO：1多核苷酸含有多个单个的编码不同蛋白的序列。α-亚基和辅助蛋白P15K的序列彼此重叠。

为了得到活性蛋白，必须一同表达编码腈水合酶的α-亚基和β-亚基的基因。

SEQ ID NO：2描绘了表现出腈水合酶活性的蛋白的β-亚基的氨基酸序列，且SEQ ID NO：3描绘了α-亚基的氨基酸序列。

SEQ ID NO：2源自核苷酸序列SEQ ID NO：1的位置1-708，SEQ IDNO：3源自位置710-1327。

辅助蛋白P15K的氨基酸序列见SEQ ID NO：6，其与核苷酸序列SEQID NO：1中的位置1324-1737相对应。

辅助蛋白活化腈水合酶，且在能形成腈水合酶的微生物中，其必须与该酶一起存在。

SEQ ID NO：4代表了钴转运蛋白的氨基酸序列，其源自核苷酸序列SEQ ID NO：1的位置2076-3146。

Patent IN Version 3.1将SEQ ID NO：4中的起始密码子ttg翻译成亮氨酸，将SEQ ID NO：6中的起始密码子gtg翻译成缬氨酸。正确的氨基酸是甲硫氨酸。

已经发现，通过共表达钴转运蛋白，能使大肠杆菌中的腈水合酶活性增加数倍。当在培养基中使用高浓度的钴时，也是如此，这些浓度是超过自然发生的浓度的大小量级。意外地，共表达钴转运蛋白不会导致生物的任何中毒，但是会导致轻微增加的细胞对培养基中的高钴浓度的敏感性。

为了分离根据本发明的基因簇，通常首先在大肠杆菌(B.coli)中制备该微生物的基因库。基因库的制备，记载在众所周知的教科书和手册中。可以提及的实例是Winnacker的教科书：Gene und Klone，Eine Einf ührung in die Gentechnologie[Genes和clones，anintroduction to recombinant DNA technology](Verlag Chemie，Weinheim，Germany，1990)或Sambrook等的手册：Molecular Cloning，A Laboratory Manual(Cold Spring Harbor Laboratory Press，1989)。非常熟悉的已知基因库是大肠杆菌K-12菌株W3110的基因库，其由Kohara等(Cell 50，495-508(1987))在λ-载体中制备。Bathe等(Molecular and General Genetics，252：255-265，1996)描述了C.glutamicum ATCC13032的基因库，使用粘粒载体SuperCos I(Wahl等，1987，Proceedings of the National Academy of Sciences USA，84：2160-2164)，在大肠杆菌K-12菌株NM554(Raleigh等，1988，Nucleic Acids Research 16：1563-1575)中制备它。

还可以使用质粒如pBR322(Bolivar，Life Sciences，25，807-818(1979))或pUC9(Vieira等，1982，Gene，19：259-268)，在大肠杆菌中制备基因库。合适的宿主特别是限制缺陷的和重组缺陷的大肠杆菌菌株。这些菌株的实例是菌株DH5αmcr，其已经记载在Grant等(Proceedings of the National Academy of Sciences USA， 87(1990)4645-4649)。其然后借助粘粒克隆的长DNA-片段再亚克隆进常用的适于测序的载体中，随后如例如Sanger等(Proceedings ofthe National Academy of Sciences of the United States of America，74：5463-5467，1977)所述进行测序。

然后，使用已知的算法或序列分析程序，例如Staden(NucleicAcids Research 14，217-232(1986))的，von Marck(Nucleic AcidsResearch 16，1829-1836(1988))的，或Butler(Methods ofBiochemical Analysis 39，74-97(1998))的GCG-程序，可以研究得到的DNA-序列。

作为遗传密码的简并性的结果，从SEQ ID No.1包含的序列产生的编码DNA-序列，同样会形成本发明的主题的一部分。以相同的方式，能与这些序列或其一部分杂交的DNA-序列，会形成本发明的主题的一部分。而且，蛋白中的保守氨基酸替换，例如用丙氨酸替代甘氨酸，或用谷氨酸替代天门冬氨酸，在本领域已知是有义突变，其不会导致蛋白活性的任何根本变化，即是功能中性的。还已知，蛋白的N-末端和/或C-末端的变化，不会显著损害蛋白的功能，或者甚至会稳定它。尤其在Ben-Bassat等(Journal of Bacteriology 169：751-757(1987))，O’Regan等(Gene 77：237-251(1989))，Sahin-Toth等(Protein Sciences 3：240-247(1994))，和Hochuli等(Bio/Technology 6：1321-1325(1988))和已知的遗传学和分子生物学教科书中，熟练人员可以获得这方面的信息。

最后，使用来自SEQ ID NO：1的引物，通过聚合酶链反应(PCR)制备的DNA-序列，也会形成本发明的主题的一部分。这些寡核苷酸典型地具有至少15个核苷酸的长度。

尤其在Boehringer Mannheim GmbH公司(Mannheim，Germany，1993)出版的手册“The DIG System Users Guide for FilterHybridization”和Liebl等(International Journal of SystematicBacteriology(1991)41：255-260)中，熟练人员可以获得关于通过杂交鉴别DNA-序列的说明。杂交在严格条件下进行，即只形成这样的杂合体，其中探针和靶序列(即用该探针处理的多核苷酸)是至少90％一致的。已知通过改变缓冲液组成、温度和盐浓度影响或决定杂交包括洗涤步骤的严格性。优选地，以与洗涤步骤相比相对较低的严格性进行杂交反应(Hybaid Hybridisation Guide，Hybaid Limited，Teddington，UK，1996)。

例如，可以使用5×SSC缓冲液，在约50℃-68℃的温度，进行杂交反应。在这些条件下，探针也可以与表现出与探针序列小于70％一致性的多核苷酸杂交。这些杂合体不太稳定，可以通过在严格条件下洗涤来去除。这可以如下实现：例如，通过将盐浓度降低至2×SSC，当合适时，随后降至0.5×SSC(The DIG System User’s Guide forFilter Hybridisation，Boehringer Mannheim，Mannheim，Germany，1995)，将温度设定在约50℃-68℃。当合适时，可以将盐浓度降低至0.1×SSC。通过逐步以约1-2℃分步使杂交温度从50℃增加至68℃，可以分离与采用的探针序列具有例如至少90％-95％一致性的多核苷酸片段。在市场上可以以试剂盒的形式得到进一步杂交说明(例如RocheDiagnostics GmbH，Mannheim，Germany供应的DIG Easy Hyb，目录号1603558)。

尤其在Gait的手册：Oligonukleotide synthesis：A PracticalApproach(IRL Press，Oxford，UK，1984)和Newton和Graham：PCR(Spektrum Akademischer Verlag，Heidelberg，Germany，1994)中，熟练人员以获取使用聚合酶链反应(PCR)扩增DNA-序列的说明。

通常，该方法是，将能高水平表达的基因克隆进具有低拷贝数的载体中，将表达较弱的基因克隆进具有更高拷贝数和/或强启动子的载体中。可以用这些载体转化宿主细胞，以便使它们在每种情况下，与起始生物相比，都含有编码形成腈水合酶或其它蛋白的核苷酸序列的至少一个额外的拷贝。

已经表明，可以有利地以更低的水平表达钴转运蛋白-编码基因，例如使用低拷贝数的载体，即至少比能编码α-和β-亚基和P15K辅助蛋白的多核苷酸序列少一个拷贝。使用不同强度的启动子，也可以实现所述基因的有差别的表达。

编码α-和β-亚基和辅助蛋白的核苷酸，优选地共同位于一个载体上，且具有一个共用启动子，或具有两个分开的启动子。

以该方式制备的转化的或重组的微生物，同样形成本发明的主题的一部分。

已经发现，在微生物中编码腈水合酶、P15K辅助蛋白和钴转运蛋白的基因的增强，会导致腈水合酶的增多的生产，或导致腈水合酶的增加的活性。

在这方面，术语“增强”描述了在微生物中由相应DNA编码的一种或多种酶的细胞内活性的增加，这可以如下实现：例如，增加该一个或多个基因的拷贝数，使用强启动子，或使用编码具有高活性的对应酶的基因，和视需要组合这些方法。

为了实现过表达，可以突变位于结构基因上游的启动子区和调节区或核糖体结合位点。整合在结构基因上游的表达盒以相同的方式起作用。另外，使用诱导型启动子，可以增加氨基酸发酵生产过程中的表达。通过用于延长m-RNA的寿命的方式同样提高表达。

另外，通过预防酶蛋白的降解同样增强酶活性。基因或基因构建体可以存在于具有不同拷贝数的质粒中或可以整合在染色体中并扩增。备选地，通过改变培养基的组成和培养操作可以实现相关基因的过表达。

通常，采用增强，尤其是过表达，使相应蛋白的活性或浓度，比野生型蛋白或未用根据本发明的核苷酸序列转化的微生物中的蛋白的活性或浓度，增加至少10％，25％，50％，75％，100％，150％，200％，300％，400％或500％，和最大高达1000％或2000％。

本发明也涉及载体的提供，该载体通常能在选择的宿主菌株中自主复制，其彼此相容，且其至少含有权利要求2，3和4保护的核苷酸序列或权利要求4保护的核苷酸序列。

使用已知的转化技术，可以将载体DNA导入真核或原核细胞。

采用的宿主生物优选地是微生物，例如假单胞菌、毕赤酵母、各种酵母、Saccaromyces、曲霉属或链霉菌科，尤其大肠杆菌，因为它们存在表达系统。红球菌属的微生物也是合适的。

本发明也涉及从红球菌属、尤其混浊红球菌或包含该酶的微生物制备腈水合酶的方法，其中

a)在导致腈水合酶的形成的条件下，在0.15-4mM(mmol/l)尤其是0.3-4mM Co²⁺的存在下，发酵转化的微生物，其包含根据权利要求1-4的核苷酸序列的过表达的基因，

b)使该酶在微生物中富集，和

c)从细胞分离该酶，或

d)收获微生物，并获取包含该酶的静止细胞。

重组生产的腈水合酶以＞50U/mg干生物量的活性转化α-氨基腈。

优选地，在0.5-3.5mM尤其是0.7-3mM Co²⁺的存在下，其优选地作为可溶盐加入发酵液中，进行发酵。

可以在分批过程(Satzkultivierung)或补料分批过程(Zulaufverfahren)或重复补料分批过程(repetitivesZulaufverfahren)中，连续地或不连续地培养根据本发明使用的微生物。已知的培养方法的总结，记载在Chmiel的教科书(Bioprozeβtechnik 1.Einf ührung in die Bioverfahrenstechnik[Bioprocess technology 1.Introduction to bioprocesstechnology](Gustav Fischer Verlag，Stuttgart，1991))或Storhas的教科书(Bioreaktoren und periphere Einrichtungen[Bioreactors and peripheral equipment](Vieweg Verlag，Braunschweig/Wiesbaden，1994))中。

使用的培养基必须合适地满足每种情况下菌株的要求。培养不同微生物的培养基的描述，见美国细菌学学会(Washington D.C.，USA， 1981)出版的手册“Manual of Methods for General Bacteriology”。

可以使用的碳源是糖和碳水化合物例如葡萄糖、蔗糖、乳糖、果糖、麦芽糖、糖蜜、淀粉和纤维素，油和脂肪例如大豆油、向日葵油、花生油和椰子油，脂肪酸例如棕榈酸、硬脂酸和亚油酸，醇例如甘油和乙醇，和有机酸例如乙酸。这些物质可以单独地或作为混合物使用。

可以使用的氮源是含氮化合物如蛋白胨、酵母提取物、肉膏、麦芽浸膏、玉米浆、豆粉和尿素或无机化合物如硫酸铵、氯化铵、磷酸铵、碳酸铵和硝酸铵。可以单独地或作为混合物使用这些氮源。

可以使用的磷源是磷酸，磷酸二氢钾或磷酸氢二钾或对应的含钠盐。另外，培养基必须含有生长所需的金属盐如硫酸镁或硫酸亚铁。最后，除了上述物质外，可以采用基本的生长物质如氨基酸和维生素。上述原料可以以仅仅一次的混合物形式加入培养基，或以合适的方式，在培养过程中补料。

以合适的方式，使用碱性化合物如氢氧化钠、氢氧化钾、氨或氨水，或酸性化合物，例如磷酸或硫酸，控制培养物的pH。可以使用消泡剂，例如脂肪酸聚乙二醇酯，控制泡沫形成。可以向培养基中加入合适的选择性地起作用的物质，例如抗生素，以维持质粒的稳定性。使氧和含氧气体混合物，例如空气，注入培养物，以维持氧条件。培养温度通常是10℃-40℃，优选10℃-30℃。优选地，连续培养，直到已经经过对数生长期。该目的通常在10小时-70小时内实现。

本发明也涉及从腈酶促制备酰胺的方法，其包含下述步骤：

a)使用具有腈水合酶活性的源自红球菌属尤其是混浊红球菌的酶，转化含腈基化合物，和

b)视需要，分离酰胺。

在一种方法变体中，收获细胞，洗涤，并转入pH 5-9、尤其是6.8-7.9的缓冲液中，制成悬浮液。静止细胞的浓度通常是1-25％、尤其是1.5-15％(湿重/体积)。可以使用物理或化学方法，例如Wilms等，J.Biotechnol.，Vol 86(2001)，19-30所述的甲苯，使细胞渗透化，以便使要转化的腈化合物可以穿透细胞壁，且形成的酰胺可以离开。

生物催化剂(全细胞催化剂)是非常稳定的，所以可以达到超过100g/l的产物浓度。

也可以使用已知的方法，从细胞分离根据本发明的腈水合酶，视需要纯化，并用于转化腈。

本发明也涉及一种方法，其特征在于，将下述通式的化合物转化成对应的酰胺：

R″-CN (II)

其中：

X：是OH，H，具有1-4个C原子的烷基，芳基，特别是NH₂；

R：是H，任选地被NH2取代的、分支的或不分支的、具有1-12个C原子的饱和的烷基，

分支的或不分支的、具有1-12个C原子的链烯基，具有3-6个C原子的环烷基，

烷硫基-取代的亚烷基，其中烷基对应于C₁-C₃基团，且亚烷基对应于二价的C₃-C₈基团，

R′：是H，或具有1-3个C原子的烷基，

R″：是单核或双核的芳香环，其具有6-12个C原子，视需要经1个或2个烷基(C1-C3)或Cl或F取代；

具有1-6个C原子的烷基腈。

优选地，转化下述腈：

饱和的单腈：

乙腈、丙腈、丁腈、异丁腈、戊腈、异戊腈和己腈，

饱和的二腈：

丙二腈、丁二珀腈、戊二腈和己二腈，

芳族未取代的和取代的单腈和二腈：

苯基腈、2，6-二氟苯基腈、邻苯二腈、间苯二腈和对苯二腈，

α-氨基腈：

α-氨基丙腈，α-氨基甲硫基丁腈，α-氨基丁腈，氨基乙腈，源自天然氨基酸的所有腈，α-氨基-3，3-二甲基丙腈和α-氨基-2，3-二甲基丙腈

含有羧基的腈：

氰基乙酸

β-氨基腈：

3-氨基丙腈

不饱和的腈：

丙烯腈，甲基丙烯腈，烯丙基腈和丁烯腈

α-羟基腈：

α-羟基-正丙腈，α-羟基-正丁腈，α-羟基异丁腈，α-羟基-正己腈，α-羟基-正庚腈，α-羟基-正辛腈，α，γ-二羟基-β，β-二甲基丁腈，丙烯醛氰腈，异丁烯醛氰腈，3-氯乙腈，4-甲硫基-α-羟基丁腈和α-羟基-α-苯基丙酰。

待转化的腈在反应溶液中的浓度，不限于特定范围。

为了避免酶活性受到底物的抑制，通常将腈的浓度保持在0.001-10w/w％、尤其是0.1-2w/w％，基于作为干细胞量(Zellmasse)的生物催化剂的量。可以在反应开始时，加入所有底物，或在反应过程中，连续地或不连续地加入底物。

如果腈化合物在水性反应系统中的溶解度太低，可以加入增溶剂。

但是，作为替代方案，可以在水/有机溶剂两相系统中进行反应。

当将微生物细胞用作酶活性材料时，采用的细胞的量与底物量的比例优选地是0.001-8w/w％，作为干细胞量。

使用MA45湿度分析仪(Sartorius)，确定细胞量的干重。

也可以使用众所周知的技术，固定化分离的酶，然后采用该形式的酶。

通常，在-5℃至50℃、尤其是0℃至30℃的温度，反应0.1-100小时。

只要酶活性不受损害，待维持的反应混合物的pH不限于特定值。反应后，可以以已知的方式，从反应溶液中分离已经形成的酰胺，并纯化。

本发明也涉及一种方法，其中，从例如生物量的细胞分离酰胺，或含有酰胺的溶液，将酰胺水解产生对应的酸，或在有加入的碱金属或碱土金属氢氧化物存在下，转化成对应的酸盐。优选地，用氢氧化钙水解MHA-酰胺，并分离对应的钙盐。

实施例

实施例1

克隆混浊红球菌腈水合酶

用限制酶PinAI，Pst I和Xma I(Roche)消化混浊红球菌染色体DNA，并在0.8％琼脂糖凝胶上分离片段。使用标准方法(例如见Sambrook等：Molecular Cloning，A Laboratory Manual，ColdSpring Habor Laboratory Press，1989)，在带正电荷的尼龙膜(Hybond-N+，Amersham)上进行DNA印迹。根据生产商的(Roche)说明书，用DIG-标记的探针，进行杂交。使用退化引物1F和1R，使用基因组DNA作为模板，通过PCR制备探针。引物源自β-亚基的同源区，通过比对各种Nhasen的序列确定这些区域。从数据库得到它们的序列。为了分离检测到的约2.2kb大小的PinAI-片段，通过制备凝胶电泳纯化了2至2.5kb的PinAI切割的DNA-片段，并与Xma I切割的载体pUC18(Promega)连接，将连接混合物转化进大肠杆菌JM109(Promega)。通过菌落杂交，使用相同的探针鉴别阳性转化体。以该方式得到的克隆含有2206核苷酸插入物，其包含腈水合酶的β-亚基的基因，和α-亚基的基因的大部分。

对于缺少的序列，使用上述的方法，其采用引物2F和2R，制备新探针，其能在克隆的PinAI-片段的3′-末端杂交。克隆进pUC18中的PinAI-片段用作模板。在与该探针杂交之前，首先根据生产商的(Roche)说明书，从上述膜去除颜色信号和第一个探针。使用第二个探针在该膜上检测约2kb大小的PstI-带。如上所述，将对应的DNA-片段克隆进已经用PstI切口的载体pUC18，并将产物转化进大肠杆菌JM109；然后，通过菌落杂交鉴别阳性克隆。PstI-片段是1883核苷酸大小，且含有腈水合酶的α-亚基的基因的(3′-)部分，辅助蛋白P15K的基因和钴转运蛋白的基因的(5′-)部分。

为了克隆钴转运蛋白基因缺失的序列的DNA-片段，使用引物3F和3R，和用作模板的克隆进pUC18中的PstI-片段，制备新探针，其能在克隆的PstI-片段的3′-末端杂交。该探针用于检测相同膜上的约1.7kb大小的XmaI-带，之前再次从该膜上去除颜色信号和第二个探针。将对应的DNA-片段克隆进已经用XmaI切口的pUC18载体，并将产物转化进大肠杆菌JM109；通过菌落杂交鉴别阳性克隆。为此使用经引物4F和3R扩增的探针。所述XmaI-片段是1747核苷酸大小，且含有钴转运蛋白的基因的(3′-)部分。

SEQ ID NO：1描述了基因簇的连续序列，其含有编码腈水合酶的α-β-亚基、辅助蛋白P15K和钴转运蛋白的多核苷酸。

实施例2

表达载体的构建

将结构基因克隆进用于大肠杆菌的已知表达载体中，且其中插入的基因是在鼠李糖启动子的控制下。另外，插入了第二个鼠李糖启动子。为此，使用引物5F和5R扩增β-亚基的基因，其插入限制酶NdeI，BamHI和HindIII的剪切位点。使用引物6F和6R扩增第二个鼠李糖启动子，其插入限制酶BamHI，NcoI和HindIII的剪切位点。使用引物7F和7R扩增α-亚基的基因，其插入限制酶NcoI，KpnI和HindIII的剪切位点。使用引物8F和8R扩增P15K蛋白的基因，其插入限制酶KpnI和HindIII的剪切位点，并将起始密码子从GTG改变成ATG。将以该方式构建的表达载体命名为pUD 15。

图1给出了限制图谱，SEQ ID NO：24给出了该序列。

将钴转运蛋白的基因克隆进另一个大肠杆菌表达载体，其中所插入的基因也在鼠李糖启动子的控制下。为此，使用引物9F和9R扩增钴转运蛋白基因，其插入限制酶NdeI和HindIII的剪切位点，并将起始密码子从TTG改变成ATG。将以该方式构建的表达载体命名为pUD 16。

图2给出了限制图谱，SEQ ID NO：25给出了该序列。

将表达质粒转化进大肠杆菌菌株DSM 14459，其保藏在DeutschenSammlung von Mikroorganismen和Zellkulturen[German collectionof microorganisms and cell cultures]GmbH(DSMZ)。

引物：

1F	5′-ATG AAY GGH ATY TTC GA-3′
		1R	5′-ATC CAG TGY YHG TAG TA-3′
2F	5′-CGA AGA CAT GAT CGT CGT G-3′
		2R	5′-ACC GGT CCC ACA CCG A-3′
3F	5′-TCG AGG AGA TCG GAG G-3′
		3R	5′-GTA TCG AAG GTG CTC ATC-3′
4F	5′-CGC GGG CTG GGT GAA-3′
		5F	5′-CGG CGG AAT TCA AGA AGG AGA CCC GCA TAT GAA CGG-3′
5R	5′-GGT GCA AGC TTGGAT CCT GTC AGA TTC CTC GAG TAG-3′
		6F	5′-GCG AAG GAT CCT GCA TGC ATC GAA ATT AAT ACG-3′
6R	5′-CAT CAA GCT TTT CGC CAT GGC TAT ATC TCC TTC-3′
		7F	5′-CTG ACA GGA TCC AAG AAG GAG ATA TAG CCA TGG CCG A-3′
7R	5′-GTT GCA AGC TTG GTA CCG CTC AAG ACA TCG CCT CCC T-3′
		8F	5′-GTG GGT ACC AAG AAG GAG GCG ATC ATA TGA GCA CGC-3′
8R	5′-GCG GAC GAG TAG CGA AGC TTG TTA GTT CAC CG-3′
		9F	5′-TCA AAG CTT GAA GGA GAT ATA CAT ATG ACG ATT ACT-3′
9R	5′-GTC AAG CTT GGT ACC GAC ATC TCA CAC CTT CGA-3′

[0165] 位于片段上的基因：

pUD15：β-亚基的基因：核苷酸25-732

α-亚基的基因：核苷酸949-1566

P15K基因：核苷酸1592-2005

pUD16：钴转运蛋白的基因：核苷酸25-1095

实施例3

腈水合酶在大肠杆菌DSM 14559中的异源表达

DSM 14559与DE 101 55 928相关。

在37℃摇动下，在含有1mM CoCl₂和100μg/ml氨苄西林的LB-培养基(根据Miller的LB肉汤，VWR)中培养pUD15转化的细胞。以类似的方式培养用pUD15和pUD16转化的细胞，但是培养基另外含有50μg/ml氯霉素。此后，当它们达到至少OD₆₀₀为2后，将细胞过量接种进同一的培养基中3次。12-16小时后，将一定量的最后的预培养物接种进主培养物中，使后者具有0.1的OD₆₀₀。主培养物的培养基与预培养物的培养基相对应，但是它另外含有2g/l L-鼠李糖。22小时后，收获细胞。

实施例4

测定酶活性

如实施例3所述培养细胞，通过离心从培养基中分离，并重新悬浮于标准缓冲液(50mM磷酸钾缓冲液，pH 7.5)。将50μl细胞悬浮液加入700μl标准缓冲液，并加250μl 200mM腈在标准缓冲液中的溶液以启动反应。在这方面，测量细胞悬浮液中的细胞浓度，以便在20℃、10min后，腈反应了5-30％。在20℃、10min后，通过加入20μl半浓缩的磷酸终止反应，并通过离心分离细胞。

将一单位(U)的活性定义为，能在1分钟内将1μmo l N-甲酰基缬氨酸腈转化成酰胺的酶的量。比活定义为U/mg干生物量(U/mg BTM)。

这可以使用MA45型湿度分析仪(Sartorius)测量。

实施例5

共表达编码腈水合酶α-亚基，β-亚基和p15K蛋白的基因。

使用转化的大肠杆菌菌株DSM 14459，其携带质粒pUD15，如实施例3所述进行表达。细胞的比活是23U/mg BTM。

实施例6

共表达编码腈水合酶α-亚基，β-亚基，p15K蛋白和钴转运蛋白的基因。

使用转化的大肠杆菌菌株DSM 14459，其携带质粒pUD15和pUD16，如实施例3所述进行表达。细胞的比活是81U/mg BTM。

实施例7

底物特异性

使用静止的转化的大肠杆菌DSM 14459细胞，其携带质粒pUD15，类似于实施例3转化各种腈。将用N-甲酰基缬氨酸腈得到的比活设定为100％。相对于它，给出其它活性。结果如图3所示。

实施例8

在Co²⁺-盐存在下，转化的大肠杆菌DSM 14459的生长

如实施例3所述，培养仅携带质粒pUD15或携带pUD15和pUD16的转化的大肠杆菌DSM 14459细胞。同时，培养基中的钴浓度从0.5至2mM变化。24小时后，在600nm测量培养物的光密度。

	携带pUD15的大肠杆菌	携带pUD15和pUD16 的大肠杆菌
			0.5mM CoC12	2.808	2.524
1.0mM CoC12	2.6955	2.173
			2.0mM CoC12	2.330	2.113

发现，即使在高钴浓度，也仅仅能观察到对细胞生长的轻微影响。

实施例9

使用携带质粒pUD15的静止的转化的大肠杆菌DSM 14459细胞转化甲硫氨酸腈

如实施例3所述，培养携带质粒pUD15的大肠杆菌DSM 14459细胞，并离心沉淀。将2.8g(湿重)细胞重新悬浮于47.2ml 50mM磷酸钾缓冲液，pH 7.5，在20℃，同时剧烈搅拌，以在反应过程中的任何时间的浓度都不超过15g/l的速度，连续加入甲硫氨酸腈。将pH维持恒定在7.5。如实施例4所述，通过HPLC，监视反应。320min后，9.1g腈已经完全转化成10.4g酰胺。这对应着176g/l的浓度。

附图简述

图1

质粒pUD15

rhaP 鼠李糖启动子

beta 腈水合酶β-亚基的基因

alpha 腈水合酶α-亚基的基因

P15K 辅助蛋白P15K的基因

ori 复制起点

bla 对氨苄西林(β-内酰胺酶)抗性的基因

图2

质粒pUD16

rhaP 鼠李糖启动子

CoTrans 钴转运蛋白的基因

Ori 复制起点

Cmr 对氯霉素抗性的基因

图3

与转化N-甲酰基缬氨酸腈时的活性相比，转化各种腈时的相对比活

根据布达佩斯特条约的用于专利程序目的的

国际公认的微生物保藏

国际表格

Degussa Ag

Projekthaus Biotechnologie

Rodenbacher Chaussee

63457 Hanau

依据条例7.1由下述国际保藏单位

出具的第一次保藏的接收证明

根据布达佩斯特条约的用于专利程序目的的

国际公认的微生物保藏

国际表格

Degussa AG

Projekthaus Biotechnologie

Rodenbacher chaussee

63457 Hanau

依据条例10.2由下述国际保藏单位

出具的存活证明

序列表

<110>Degussa AG

<120>混浊红球菌的腈水合酶

<130>040069 BT

<160>25

<170>PatentIn version 3.1

<210>1

<211>3146

<212>DNA

<213>混浊红球菌

<220>

<221>CDS

<222>(1)..(708)

<223>

<220>

<221>CDS

<222>(710)..(1327)

<223>

<220>

<221>CDS

<222>(2076)..(3146)

<223>

<400>1

atg aac ggc atc ttc gat cta ggc gga acc gac ggc atg ggg ccg gtc 48

Met Asn Gly Ile Phe Asp Leu Gly Gly Thr Asp Gly Met Gly Pro Val

1 5 10 15

gac aac gac aaa ggc acc gag ccg gtg ttc cgc tca gcg tgg gaa aag 96

Asp Asn Asp Lys Gly Thr Glu Pro Val Phe Arg Ser Ala Trp Glu Lys

20 25 30

gcc gcc ttc tcg atg ttc gca caa ggc gcc cga gct ggc ctc tac aac 144

Ala Ala Phe Ser Met Phe Ala Gln Gly Ala Arg Ala Gly Leu Tyr Asn

35 40 45

atc gac gag ttc cgg cac tgc gtc gag cag atg gac ccc gcc gag tat 192

Ile Asp Glu Phe Arg His Cys Val Glu Gln Met Asp Pro Ala Glu Tyr

50 55 60

tta cta tcg aac tac tac gag cac tgg acg cat gcc gtc gaa cac ttc 240

Leu Leu Ser Asn Tyr Tyr Glu His Trp Thr His Ala Val Glu His Phe

65 70 75 80

gcc cag caa aag aac ctc atc aca gcg gca gag ctc gaa aag cgc acg 288

Ala Gln Gln Lys Asn Leu Ile Thr Ala Ala Glu Leu Glu Lys Arg Thr

85 90 95

cat ttc tac cgg gat aac cca gaa gcc ccc ctt ccg gag cgc aag gac 336

His Phe Tyr Arg Asp Asn Pro Glu Ala Pro Leu Pro Glu Arg Lys Asp

100 105 110

cca gag ctc ctc gac ttc gtg aac acc gcg atc gcg aac ggt ttc gcg 384

Pro Glu Leu Leu Asp Phe Val Asn Thr Ala Ile Ala Asn Gly Phe Ala

115 120 125

gcc tcc cgt gaa acc aat agg tcg gca gca ttc acc atc ggc gac cag 432

Ala Ser Arg Glu Thr Asn Arg Ser Ala Ala Phe Thr Ile Gly Asp Gln

130 135 140

gta ctg att gct gcg gac agt cca ttc gga cac acc cga cgg gcc ggc 480

Val Leu Ile Ala Ala Asp Ser Pro Phe Gly His Thr Arg Arg Ala Gly

145 150 155 160

tac atc cgc ggt aag acc gga gtc atc acc gcg aca cac ggc gcc tac 528

Tyr Ile Arg Gly Lys Thr Gly Val Ile Thr Ala Thr His Gly Ala Tyr

165 170 175

gtc tat ccc gac acc gcc ggt aac ggg ctc ggt gag tgc cca gag cac 576

Val Tyr Pro Asp Thr Ala Gly Asn Gly Leu Gly Glu Cys Pro Glu His

180 185 190

gtc tac acc gtg aag ttc acc gcc acc gaa ctt tgg ggc gaa cag agc 624

Val Tyr Thr Val Lys Phe Thr Ala Thr Glu Leu Trp Gly Glu Gln Ser

195 200 205

ggt gat cgc cac agc acc gtc tat ttc gat gtc tgg gaa ccg tac ctc 672

Gly Asp Arg His Ser Thr Val Tyr Phe Asp Val Trp Glu Pro Tyr Leu

210 215 220

tcg ctc gct acc gca ccc tct act cga gga atc tga c atg gcc gaa cag 721

Ser Leu Ala Thr Ala Pro Ser Thr Arg Gly Ile Met Ala Glu Gln

225 230 235

cgc acc gac acc caa ttg cgt aca cac gaa gaa gtc gtc gcc cga gtc 769

Arg Thr Asp Thr Gln Leu Arg Thr His Glu Glu Val Val Ala Arg Val

240 245 250 255

aag gcg ctc gag gcg ctg ctg atc gag aaa ggc gtc atg acg acc gag 817

Lys Ala Leu Glu Ala Leu Leu Ile Glu Lys Gly Val Met Thr Thr Glu

260 265 270

gcc gtc gac cgg atg gcc gag gta tac gag aac gaa gtc ggc ccc cag 865

Ala Val Asp Arg Met Ala Glu Val Tyr Glu Asn Glu Val Gly Pro Gln

275 280 285

atc ggc gct cag att gtc gcc aag gcg tgg acc gac ccg aag ttc aag 913

Ile Gly Ala Gln Ile Val Ala Lys Ala Trp Thr Asp Pro Lys Phe Lys

290 295 300

aag agg ttg ctg gcc aat gcc acg act gcc tgc gca gag atg ggc tac 961

Lys Arg Leu Leu Ala Asn Ala Thr Thr Ala Cys Ala Glu Met Gly Tyr

305 310 315

ggc ggt ctg cag ggc gaa gac atg atc gtc gtg gaa aac acc gac acc 1009

Gly Gly Leu Gln Gly Glu Asp Met Ile Val Val Glu Asn Thr Asp Thr

320 325 330 335

gta cac aac gcg att gtg tgc acc ctc tgc tcc tgc tac ccg tgg ccg 1057

Val His Asn Ala Ile Val Cys Thr Leu Cys Ser Cys Tyr Pro Trp Pro

340 345 350

gtc ttg ggc ctg cca ccg aac tgg tac aag gca ccg gct tac cgc gca 1105

Val Leu Gly Leu Pro Pro Asn Trp Tyr Lys Ala Pro Ala Tyr Arg Ala

355 360 365

cgg atc gtg cgc gaa ccg cgg aag gtc ctc gcc gag gac ttc gac ttt 1153

Arg Ile Val Arg Glu Pro Arg Lys Val Leu Ala Glu Asp Phe Asp Phe

370 375 380

ccc atc ccc gac gac gtc gag atc cgc gtg tgg gac tcg agc gcc gag 1201

Pro Ile Pro Asp Asp Val Glu Ile Arg Val Trp Asp Ser Ser Ala Glu

385 390 395

ctg cgc tat tgg gtt tta ccg cag cgc cct gca cac acc gaa aga ttg 1249

Leu Arg Tyr Trp Val Leu Pro Gln Arg Pro Ala His Thr Glu Arg Leu

400 405 410 415

acg gaa tcc gag ctg gta gcg ctg gtc acc cgc gac tcg atg atc ggt 1297

Thr Glu Ser Glu Leu Val Ala Leu Val Thr Arg Asp Ser Met Ile Gly

420 425 430

gtg gga ccg gtg agg gag gcg atg tcg tga gcacgcgcat tgacgcaacc 1347

Val Gly Pro Val Arg Glu Ala Met Ser

435 440

gagctcgggg aagcacgccg gcgaatcgag gcgttggtgt gtgatctgcc cggtggtgac 1407

gtaggctcac gcgccttcaa cgagccgtgg gaattgcgtg ccttcgcgat ggccgttgcc 1467

gtgtatcacc agggtcacta cgaatggagt gagtttcagc tctccctgat cgcgtcgatc 1527

cgccactggg agcagggcga gggaagggag ccgtggagct actacgagca ctggctcaat 1587

gcgctcgagt cggtactcgc cgccagcggc gccttatcgg acgcagtggg cctcgatgag 1647

cgcacgcgcg aagttctcac caccccacgg aacacgaacc accaccatgc acatcgcgaa 1707

cccgtcgcga tctcatctgc ggtgaactaa cccgcggcgc tactcgtccg ctggccagct 1767

ctctgcctgc tgtccagcga acgacacctc cgtgacagct tctcgttcac cgacccgatc 1827

actgattccc gacgcggtta ccaacgagca cccgcgtata aacagaaccg caaaggtatc 1887

gcagctgtcg gggacgagcg aatagcggat cgctcgcggg ggccggaccc atgcagctga 1947

tgctgctttc gcccgaatag cccagatatc cactggacga ggtgcgaggc ccgatacaag 2007

gcgagcgtca gcaaccggca aaccacagcg tccagagcca gcaccgtcat gtctagaaga 2067

ggaaagca ttg acg att act acc act tcg cca agg cag atc gcc ggt cgg 2117

Leu Thr Ile Thr Thr Thr Ser Pro Arg Gln Ile Ala Gly Arg

445 450

tgg aca cgt gcc gag cgg caa cga ctg agc gct atc atc ggc acc atc 2165

Trp Thr Arg Ala Glu Arg Gln Arg Leu Ser Ala Ile Ile Gly Thr Ile

455 460 465 470

gca ttg ctg cac gtg cta ggt atc gca atg tat ctc ggg cgc tcg ggt 2213

Ala Leu Leu His Val Leu Gly Ile Ala Met Tyr Leu Gly Arg Ser Gly

475 480 485

aac ccg gcc gcc gct ggt agc ctg gct ggc tcg gga ctg ctc gcc tat 2261

Asn Pro Ala Ala Ala Gly Ser Leu Ala Gly Ser Gly Leu Leu Ala Tyr

490 495 500

gtc ctg ggt gcg cgg cac gcg ttc gat gcc gac cac atc gcg gcc atc 2309

Val Leu Gly Ala Arg His Ala Phe Asp Ala Asp His Ile Ala Ala Ile

505 510 515

gac gac acc acc cgc atc atg ctc ctt cgc gga cgc cga ccc gtc ggc 2357

Asp Asp Thr Thr Arg Ile Met Leu Leu Arg Gly Arg Arg Pro Val Gly

520 525 530

gtc gga ttc ttt ttc gcc atg ggg cat tcg act gtc gtc ctc gtt ctc 2405

Val Gly Phe Phe Phe Ala Met Gly His Ser Thr Val Val Leu Val Leu

535 540 545 550

tct ctg atc gtc gct ttc gga gcg ggc tcg ctc agt tcg atg gaa gcg 2453

Ser Leu Ile Val Ala Phe Gly Ala Gly Ser Leu Ser Ser Met Glu Ala

555 560 565

tcc cgg gtc gag gag atc gga ggt tac gtc gcg acc tgc gtg gca gtg 2501

Ser Arg Val Glu Glu Ile Gly Gly Tyr Val Ala Thr Cys Val Ala Val

570 575 580

ctg ttc ttg gtg ctg gtg gcc gca ctc aac agt ttc gtt ctg cgc aag 2549

Leu Phe Leu Val Leu Val Ala Ala Leu Asn Ser Phe Val Leu Arg Lys

585 590 595

ctc ctc gct ctg tct cgt cgg atg cgc act ggg gaa gat atc tcc ggc 2597

Leu Leu Ala Leu Ser Arg Arg Met Arg Thr Gly Glu Asp Ile Ser Gly

600 605 610

gac ctc gag cgc ggg ctg ggt gaa cgg gga ttg ctc agc tgg ctt ctc 2645

Asp Leu Glu Arg Gly Leu Gly Glu Arg Gly Leu Leu Ser Trp Leu Leu

615 620 625 630

agc ggc cga ttg cgc ggg ctg att cgt tcg tcc tgg cac atg tac ccg 2693

Ser Gly Arg Leu Arg Gly Leu Ile Arg Ser Ser Trp His Met Tyr Pro

635 640 645

gtg ggc ctg ctc atg ggt ctc ggc ctg gaa acc gca tcc gaa gtg aca 2741

Val Gly Leu Leu Met Gly Leu Gly Leu Glu Thr Ala Ser Glu Val Thr

650 655 660

ttg ctg tct ctc act gcc tcc gca gcg agc gga ggt cag cta tcg cta 2789

Leu Leu Ser Leu Thr Ala Ser Ala Ala Ser Gly Gly Gln Leu Ser Leu

665 670 675

atg gcg att gtg agc ctt cca ttg ttg ttt gcc gcg ggg atg agc acc 2837

Met Ala Ile Val Ser Leu Pro Leu Leu Phe Ala Ala Gly Met Ser Thr

680 685 690

ttc gat act gca gac tca ctc gtc atg acc cgc gcc tat tcg tgg tcc 2885

Phe Asp Thr Ala Asp Ser Leu Val Met Thr Arg Ala Tyr Ser Trp Ser

695 700 705 710

tat aac gat gcc cag cgc cgc ctt cgc ttc aac act gta acc acg ggt 2933

Tyr Asn Asp Ala Gln Arg Arg Leu Arg Phe Asn Thr Val Thr Thr Gly

715 720 725

gcg acc atg gtc atc ggg ttc ttc gtc gcg gga atc tac gtt tct gga 2981

Ala Thr Met Val Ile Gly Phe Phe Val Ala Gly Ile Tyr Val Ser Gly

730 735 740

ctg ctt gcg ccg cta cca ggg ttc ggt tgg ctg acc cct ctg ggc gcg 3029

Leu Leu Ala Pro Leu Pro Gly Phe Gly Trp Leu Thr Pro Leu Gly Ala

745 750 755

atc gcc gac aac ttc gag ttc ctc ggc tac gca gtc gcc gga ttg ttc 3077

Ile Ala Asp Asn Phe Glu Phe Leu Gly Tyr Ala Val Ala Gly Leu Phe

760 765 770

gtt gct acc tgg gca atc gca gca ctg gtt agc cgg cct cga cgg ctt 3125

Val Ala Thr Trp Ala Ile Ala Ala Leu Val Ser Arg Pro Arg Arg Leu

775 780 785 790

gtc ggc agc tcg aag gtg tga 3146

Val Gly Ser Ser Lys Val

795

<210>2

<211>235

<212>PRT

<213>混浊红球菌

<400>2

Met Asn Gly Ile Phe Asp Leu Gly Gly Thr Asp Gly Met Gly Pro Val

1 5 10 15

Asp Asn Asp Lys Gly Thr Glu Pro Val Phe Arg Ser Ala Trp Glu Lys

20 25 30

Ala Ala Phe Ser Met Phe Ala Gln Gly Ala Arg Ala Gly Leu Tyr Asn

35 40 45

Ile Asp Glu Phe Arg His Cys Val Glu Gln Met Asp Pro Ala Glu Tyr

50 55 60

Leu Leu Ser Asn Tyr Tyr Glu His Trp Thr His Ala Val Glu His Phe

65 70 75 80

Ala Gln Gln Lys Asn Leu Ile Thr Ala Ala Glu Leu Glu Lys Arg Thr

85 90 95

His Phe Tyr Arg Asp Asn Pro Glu Ala Pro Leu Pro Glu Arg Lys Asp

100 105 110

Pro Glu Leu Leu Asp Phe Val Asn Thr Ala Ile Ala Asn Gly Phe Ala

115 120 125

Ala Ser Arg Glu Thr Asn Arg Ser Ala Ala Phe Thr Ile Gly Asp Gln

130 135 140

Val Leu Ile Ala Ala Asp Ser Pro Phe Gly His Thr Arg Arg Ala Gly

145 150 155 160

Tyr Ile Arg Gly Lys Thr Gly Val Ile Thr Ala Thr His Gly Ala Tyr

165 170 175

Val Tyr Pro Asp Thr Ala Gly Asn Gly Leu Gly Glu Cys Pro Glu His

180 185 190

Val Tyr Thr Val Lys Phe Thr Ala Thr Glu Leu Trp Gly Glu Gln Ser

195 200 205

Gly Asp Arg His Ser Thr Val Tyr Phe Asp Val Trp Glu Pro Tyr Leu

210 215 220

Ser Leu Ala Thr Ala Pro Ser Thr Arg Gly Ile

225 230 235

<210>3

<211>205

<212>PRT

<213>混浊红球菌

<400>3

Met Ala Glu Gln Arg Thr Asp Thr Gln Leu Arg Thr His Glu Glu Val

1 5 10 15

Val Ala Arg Val Lys Ala Leu Glu Ala Leu Leu Ile Glu Lys Gly Val

20 25 30

Met Thr Thr Glu Ala Val Asp Arg Met Ala Glu Val Tyr Glu Asn Glu

35 40 45

Val Gly Pro Gln Ile Gly Ala Gln Ile Val Ala Lys Ala Trp Thr Asp

50 55 60

Pro Lys Phe Lys Lys Arg Leu Leu Ala Asn Ala Thr Thr Ala Cys Ala

65 70 75 80

Glu Met Gly Tyr Gly Gly Leu Gln Gly Glu Asp Met Ile Val Val Glu

85 90 95

Asn Thr Asp Thr Val His Asn Ala Ile Val Cys Thr Leu Cys Ser Cys

100 105 110

Tyr Pro Trp Pro Val Leu Gly Leu Pro Pro Asn Trp Tyr Lys Ala Pro

115 120 125

Ala Tyr Arg Ala Arg Ile Val Arg Glu Pro Arg Lys Val Leu Ala Glu

130 135 140

Asp Phe Asp Phe Pro Ile Pro Asp Asp Val Glu Ile Arg Val Trp Asp

145 150 155 160

Ser Ser Ala Glu Leu Arg Tyr Trp Val Leu Pro Gln Arg Pro Ala His

165 170 175

Thr Glu Arg Leu Thr Glu Ser Glu Leu Val Ala Leu Val Thr Arg Asp

180 185 190

Ser Met Ile Gly Val Gly Pro Val Arg Glu Ala Met Ser

195 200 205

<210>4

<211>356

<212>PRT

<213>混浊红球菌

<400>4

Leu Thr Ile Thr Thr Thr Ser Pro Arg Gln Ile Ala Gly Arg Trp Thr

1 5 10 15

Arg Ala Glu Arg Gln Arg Leu Ser Ala Ile Ile Gly Thr Ile Ala Leu

20 25 30

Leu His Val Leu Gly Ile Ala Met Tyr Leu Gly Arg Ser Gly Asn Pro

35 40 45

Ala Ala Ala Gly Ser Leu Ala Gly Ser Gly Leu Leu Ala Tyr Val Leu

50 55 60

Gly Ala Arg His Ala Phe Asp Ala Asp His Ile Ala Ala Ile Asp Asp

65 70 75 80

Thr Thr Arg Ile Met Leu Leu Arg Gly Arg Arg Pro Val Gly Val Gly

85 90 95

Phe Phe Phe Ala Met Gly His Ser Thr Val Val Leu Val Leu Ser Leu

100 105 110

Ile Val Ala Phe Gly Ala Gly Ser Leu Ser Ser Met Glu Ala Ser Arg

115 120 125

Val Glu Glu Ile Gly Gly Tyr Val Ala Thr Cys Val Ala Val Leu Phe

130 135 140

Leu Val Leu Val Ala Ala Leu Asn Ser Phe Val Leu Arg Lys Leu Leu

145 150 155 160

Ala Leu Ser Arg Arg Met Arg Thr Gly Glu Asp Ile Ser Gly Asp Leu

165 170 175

Glu Arg Gly Leu Gly Glu Arg Gly Leu Leu Ser Trp Leu Leu Ser Gly

180 185 190

Arg Leu Arg Gly Leu Ile Arg Ser Ser Trp His Met Tyr Pro Val Gly

195 200 205

Leu Leu Met Gly Leu Gly Leu Glu Thr Ala Ser Glu Val Thr Leu Leu

210 215 220

Ser Leu Thr Ala Ser Ala Ala Ser Gly Gly Gln Leu Ser Leu Met Ala

225 230 235 240

Ile Val Ser Leu Pro Leu Leu Phe Ala Ala Gly Met Ser Thr Phe Asp

245 250 255

Thr Ala Asp Ser Leu Val Met Thr Arg Ala Tyr Ser Trp Ser Tyr Asn

260 265 270

Asp Ala Gln Arg Arg Leu Arg Phe Asn Thr Val Thr Thr Gly Ala Thr

275 280 285

Met Val Ile Gly Phe Phe Val Ala Gly Ile Tyr Val Ser Gly Leu Leu

290 295 300

Ala Pro Leu Pro Gly Phe Gly Trp Leu Thr Pro Leu Gly Ala Ile Ala

305 310 315 320

Asp Asn Phe Glu Phe Leu Gly Tyr Ala Val Ala Gly Leu Phe Val Ala

325 330 335

Thr Trp Ala Ile Ala Ala Leu Val Ser Arg Pro Arg Arg Leu Val Gly

340 345 350

Ser Ser Lys Val

355

<210>5

<211>3146

<212>DNA

<213>混浊红球菌

<220>

<221>CDS

<222>(1324)..(1737)

<223>

<400>5

atgaacggca tcttcgatct aggcggaacc gacggcatgg ggccggtcga caacgacaaa 60

ggcaccgagc cggtgttccg ctcagcgtgg gaaaaggccg ccttctcgat gttcgcacaa 120

ggcgcccgag ctggcctcta caacatcgac gagttccggc actgcgtcga gcagatggac 180

cccgccgagt atttactatc gaactactac gagcactgga cgcatgccgt cgaacacttc 240

gcccagcaaa agaacctcat cacagcggca gagctcgaaa agcgcacgca tttctaccgg 300

gataacccag aagcccccct tccggagcgc aaggacccag agctcctcga cttcgtgaac 360

accgcgatcg cgaacggttt cgcggcctcc cgtgaaacca ataggtcggc agcattcacc 420

atcggcgacc aggtactgat tgctgcggac agtccattcg gacacacccg acgggccggc 480

tacatccgcg gtaagaccgg agtcatcacc gcgacacacg gcgcctacgt ctatcccgac 540

accgccggta acgggctcgg tgagtgccca gagcacgtct acaccgtgaa gttcaccgcc 600

accgaacttt ggggcgaaca gagcggtgat cgccacagca ccgtctattt cgatgtctgg 660

gaaccgtacc tctcgctcgc taccgcaccc tctactcgag gaatctgaca tggccgaaca 720

gcgcaccgac acccaattgc gtacacacga agaagtcgtc gcccgagtca aggcgctcga 780

ggcgctgctg atcgagaaag gcgtcatgac gaccgaggcc gtcgaccgga tggccgaggt 840

atacgagaac gaagtcggcc cccagatcgg cgctcagatt gtcgccaagg cgtggaccga 900

cccgaagttc aagaagaggt tgctggccaa tgccacgact gcctgcgcag agatgggcta 960

cggcggtctg cagggcgaag acatgatcgt cgtggaaaac accgacaccg tacacaacgc 1020

gattgtgtgc accctctgct cctgctaccc gtggccggtc ttgggcctgc caccgaactg 1080

gtacaaggca ccggcttacc gcgcacggat cgtgcgcgaa ccgcggaagg tcctcgccga 1140

ggacttcgac tttcccatcc ccgacgacgt cgagatccgc gtgtgggact cgagcgccga 1200

gctgcgctat tgggttttac cgcagcgccc tgcacacacc gaaagattga cggaatccga 1260

gctggtagcg ctggtcaccc gcgactcgat gatcggtgtg ggaccggtga gggaggcgat 1320

gtc gtg agc acg cgc att gac gca acc gag ctc ggg gaa gca cgc cgg 1368

Val Ser Thr Arg Ile Asp Ala Thr Glu Leu Gly Glu Ala Arg Arg

1 5 10 15

cga atc gag gcg ttg gtg tgt gat ctg ccc ggt ggt gac gta ggc tca 1416

Arg Ile Glu Ala Leu Val Cys Asp Leu Pro Gly Gly Asp Val Gly Ser

20 25 30

cgc gcc ttc aac gag ccg tgg gaa ttg cgt gcc ttc gcg atg gcc gtt 1464

Arg Ala Phe Asn Glu Pro Trp Glu Leu Arg Ala Phe Ala Met Ala Val

35 40 45

gcc gtg tat cac cag ggt cac tac gaa tgg agt gag ttt cag ctc tcc 1512

Ala Val Tyr His Gln Gly His Tyr Glu Trp Ser Glu Phe Gln Leu Ser

50 55 60

ctg atc gcg tcg atc cgc cac tgg gag cag ggc gag gga agg gag ccg 1560

Leu Ile Ala Ser Ile Arg His Trp Glu Gln Gly Glu Gly Arg Glu Pro

65 70 75

tgg agc tac tac gag cac tgg ctc aat gcg ctc gag tcg gta ctc gcc 1608

Trp Ser Tyr Tyr Glu His Trp Leu Asn Ala Leu Glu Ser Val Leu Ala

80 85 90 95

gcc agc ggc gcc tta tcg gac gca gtg ggc ctc gat gag cgc acg cgc 1656

Ala Ser Gly Ala Leu Ser Asp Ala Val Gly Leu Asp Glu Arg Thr Arg

100 105 110

gaa gtt ctc acc acc cca cgg aac acg aac cac cac cat gca cat cgc 1704

Glu Val Leu Thr Thr Pro Arg Asn Thr Asn His His His Ala His Arg

115 l20 125

gaa ccc gtc gcg atc tca tct gcg gtg aac taa cccgcggcgc tactcgtccg 1757

Glu Pro Val Ala Ile Ser Ser Ala Val Asn

130 135

ctggccagct ctctgcctgc tgtccagcga acgacacctc cgtgacagct tctcgttcac 1817

cgacccgatc actgattccc gacgcggtta ccaacgagca cccgcgtata aacagaaccg 1877

caaaggtatc gcagctgtcg gggacgagcg aatagcggat cgctcgcggg ggccggaccc 1937

atgcagctga tgctgctttc gcccgaatag cccagatatc cactggacga ggtgcgaggc 1997

ccgatacaag gcgagcgtca gcaaccggca aaccacagcg tccagagcca gcaccgtcat 2057

gtctagaaga ggaaagcatt gacgattact accacttcgc caaggcagat cgccggtcgg 2117

tggacacgtg ccgagcggca acgactgagc gctatcatcg gcaccatcgc attgctgcac 2177

gtgctaggta tcgcaatgta tctcgggcgc tcgggtaacc cggccgccgc tggtagcctg 2237

gctggctcgg gactgctcgc ctatgtcctg ggtgcgcggc acgcgttcga tgccgaccac 2297

atcgcggcca tcgacgacac cacccgcatc atgctccttc gcggacgccg acccgtcggc 2357

gtcggattct ttttcgccat ggggcattcg actgtcgtcc tcgttctctc tctgatcgtc 2417

gctttcggag cgggctcgct cagttcgatg gaagcgtccc gggtcgagga gatcggaggt 2477

tacgtcgcga cctgcgtggc agtgctgttc ttggtgctgg tggccgcact caacagtttc 2537

gttctgcgca agctcctcgc tctgtctcgt cggatgcgca ctggggaaga tatctccggc 2597

gacctcgagc gcgggctggg tgaacgggga ttgctcagct ggcttctcag cggccgattg 2657

cgcgggctga ttcgttcgtc ctggcacatg tacccggtgg gcctgctcat gggtctcggc 2717

ctggaaaccg catccgaagt gacattgctg tctctcactg cctccgcagc gagcggaggt 2777

cagctatcgc taatggcgat tgtgagcctt ccattgttgt ttgccgcggg gatgagcacc 2837

ttcgatactg cagactcact cgtcatgacc cgcgcctatt cgtggtccta taacgatgcc 2897

cagcgccgcc ttcgcttcaa cactgtaacc acgggtgcga ccatggtcat cgggttcttc 2957

gtcgcgggaa tctacgtttc tggactgctt gcgccgctac cagggttcgg ttggctgacc 3017

cctctgggcg cgatcgccga caacttcgag ttcctcggct acgcagtcgc cggattgttc 3077

gttgctacct gggcaatcgc agcactggtt agccggcctc gacggcttgt cggcagctcg 3137

aaggtgtga 3146

<210>6

<211>137

<212>PRT

<213>混浊红球菌

<400>6

Val Ser Thr Arg Ile Asp Ala Thr Glu Leu Gly Glu Ala Arg Arg Arg

1 5 10 15

Ile Glu Ala Leu Val Cys Asp Leu Pro Gly Gly Asp Val Gly Ser Arg

20 25 30

Ala Phe Asn Glu Pro Trp Glu Leu Arg Ala Phe Ala Met Ala Val Ala

35 40 45

Val Tyr His Gln Gly His Tyr Glu Trp Ser Glu Phe Gln Leu Ser Leu

50 55 60

Ile Ala Ser Ile Arg His Trp Glu Gln Gly Glu Gly Arg Glu Pro Trp

65 70 75 80

Ser Tyr Tyr Glu His Trp Leu Asn Ala Leu Glu Ser Val Leu Ala Ala

85 90 95

Ser Gly Ala Leu Ser Asp Ala Val Gly Leu Asp Glu Arg Thr Arg Glu

100 105 110

Val Leu Thr Thr Pro Arg Asn Thr Asn His His His Ala His Arg Glu

115 120 125

Pro Val Ala Ile Ser Ser Ala Val Asn

130 135

<210>7

<211>17

<212>DNA

<213>人工

<220>

<223>引物

<400>7

atgaayggha tyttcga 17

<210>8

<211>17

<212>DNA

<213>人工

<220>

<223>引物

<400>8

atccagtgyy hgtagta 17

<210>9

<211>19

<212>DNA

<213>人工

<220>

<223>引物

<400>9

cgaagacatg atcgtcgtg 19

<210>10

<211>16

<212>DNA

<213>人工

<220>

<223>引物

<400>10

accggtccca caccga 16

<210>11

<211>16

<212>DNA

<213>人工

<220>

<223>引物

<400>11

tcgaggagat cggagg 16

<210>12

<211>18

<212>DNA

<213>人工

<220>

<223>引物

<400>12

gtatcgaagg tgctcatc 18

<210>13

<211>15

<212>DNA

<213>人工

<220>

<223>引物

<400>13

cgcgggctgg gtgaa 15

<210>14

<211>36

<212>DNA

<213>人工

<220>

<223>引物

<400>14

cggcggaatt caagaaggag acccgcatat gaacgg 36

<210>15

<211>36

<212>DNA

<213>人工

<220>

<223>引物

<400>15

ggtgcaagct tggatcctgt cagattcctc gagtag 36

<210>16

<211>33

<212>DNA

<213>人工

<220>

<223>引物

<400>16

gcgaaggatc ctgcatgcat cgaaattaat acg 33

<210>17

<211>33

<212>DNA

<213>人工

<220>

<223>引物

<400>17

catcaagctt ttcgccatgg ctatatctcc ttc 33

<210>18

<211>37

<212>DNA

<213>人工

<220>

<223>引物

<400>18

ctgacaggat ccaagaagga gatatagcca tggccga 37

<210>19

<211>37

<212>DNA

<213>人工

<220>

<223>引物

<400>19

gttgcaagct tggtaccgct caagacatcg cctccct 37

<210>20

<211>36

<212>DNA

<213>人工

<220>

<223>引物

<400>20

gtgggtacca agaaggaggc gatcatatga gcacgc 36

<210>21

<211>32

<212>DNA

<213>人工

<220>

<223>引物

<400>21

gcggacgagt agcgaagctt gttagttcac cg 32

<210>22

<211>36

<212>DNA

<213>人工

<220>

<223>引物

<400>22

tcaaagcttg aaggagatat acatatgacg attact 36

<210>23

<211>33

<212>DNA

<213>人工

<220>

<223>引物

<400>23

gtcaagcttg gtaccgacat ctcacacctt cga 33

<210>24

<211>6307

<212>DNA

<213>大肠杆菌，混浊红球菌

<400>24

aattcttaag aaggagatat acatatgaac ggcatcttcg atctaggcgg aaccgacggc 60

atggggccgg tcgacaacga caaaggcacc gagccggtgt tccgctcagc gtgggaaaag 120

gccgccttct cgatgttcgc acaaggcgcc cgagctggcc tctacaacat cgacgagttc 180

cggcactgcg tcgagcagat ggaccccgcc gagtatttac tatcgaacta ctacgagcac 240

tggacgcatg ccgtcgaaca cttcgcccag caaaagaacc tcatcacagc ggcagagctc 300

gaaaagcgca cgcatttcta ccgggataac ccagaagccc cccttccgga gcgcaaggac 360

ccagagctcc tcgacttcgt gaacaccgcg atcgcgaacg gtttcgcggc ctcccgtgaa 420

accaataggt cggcagcatt caccatcggc gaccaggtac tgattgctgc ggacagtcca 480

ttcggacaca cccgacgggc cggctacatc cgcggtaaga ccggagtcat caccgcgaca 540

cacggcgcct acgtctatcc cgacaccgcc ggtaacgggc tcggtgagtg cccagagcac 600

gtctacaccg tgaagttcac cgccaccgaa ctttggggcg aacagagcgg tgatcgccac 660

agcaccgtct atttcgatgt ctgggaaccg tacctctcgc tcgctaccgc accctctact 720

cgaggaatct gacaggatcc tgcatgcatc gaaattaata cgacgaaatt aatacgactc 780

actatagggc aattgcgatc accacaattc agcaaattgt gaacatcatc acgttcatct 840

ttccctggtt gccaatggcc cattttcctg tcagtaacga gaaggtcgcg aattcaggcg 900

ctttttagac tggtcgtaat gaacaattct taagaaggag atatagccat ggccgaacag 960

cgcaccgaca cccaattgcg tacacacgaa gaagtcgtcg cccgagtcaa ggcgctcgag 1020

gcgctgctga tcgagaaagg cgtcatgacg accgaggccg tcgaccggat ggccgaggta 1080

tacgagaacg aagtcggccc ccagatcggc gctcagattg tcgccaaggc gtggaccgac 1140

ccgaagttca agaagaggtt gctggccaat gccacgactg cctgcgcaga gatgggctac 1200

ggcggtctgc agggcgaaga catgatcgtc gtggaaaaca ccgacaccgt acacaacgcg 1260

attgtgtgca ccctctgctc ctgctacccg tggccggtct tgggcctgcc accgaactgg 1320

tacaaggcac cggcttaccg cgcacggatc gtgcgcgaac cgcggaaggt cctcgccgag 1380

gacttcgact ttcccatccc cgacgacgtc gagatccgcg tgtgggactc gagcgccgag 1440

ctgcgctatt gggttttacc gcagcgccct gcacacaccg aaagattgac ggaatccgag 1500

ctggtagcgc tggtcacccg cgactcgatg atcggtgtgg gaccggtgag ggaggcgatg 1560

tcttgagcgg taccaagaag gaggcgatca tatgagcacg cgcattgacg caaccgagct 1620

cggggaagca cgccggcgaa tcgaggcgtt ggtgtgtgat ctgcccggtg gtgacgtagg 1680

ctcacgcgcc ttcaacgagc cgtgggaatt gcgtgccttc gcgatggccg ttgccgtgta 1740

tcaccagggt cactacgaat ggagtgagtt tcagctctcc ctgatcgcgt cgatccgcca 1800

ctgggagcag ggcgagggaa gggagccgtg gagctactac gagcactggc tcaatgcgct 1860

cgagtcggta ctcgccgcca gcggcgcctt atcggacgca gtgggcctcg atgagcgcac 1920

gcgcgaagtt ctcaccaccc cacggaacac gaaccaccac catgcacatc gcgaacccgt 1980

cgcgatctca tctgcggtga actaacaagc ttggctgttt tggcggatga gagaagattt 2040

tcagcctgat acagattaaa tcagaacgca gaagcggtct gataaaacag aatttgcctg 2100

gcggcagtag cgcggtggtc ccacctgacc ccatgccgaa ctcagaagtg aaacgccgta 2160

gcgccgatgg tagtgtgggg tctccccatg cgagagtagg gaactgccag gcatcaaata 2220

aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta tctgttgttt gtcggtgaac 2280

gctctcctga gtaggacaaa tccgccggga gcggatttga acgttgcgaa gcaacggccc 2340

ggagggtggc gggcaggacg cccgccataa actgccaggc atcaaattaa gcagaaggcc 2400

atcctgacgg atggcctttt tgcgtttcta caaactcttt tgtttatttt tctaaataca 2460

ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 2520

aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt ttgcggcatt 2580

ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg ctgaagatca 2640

gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag 2700

ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc tatgtggcgc 2760

ggtattatcc cgtgttgacg ccgggcaaga gcaactcggt cgccgcatac actattctca 2820

gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg gcatgacagt 2880

aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca acttacttct 2940

gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg gggatcatgt 3000

aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg acgagcgtga 3060

caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg gcgaactact 3120

tactctagct tcccggcaac aattaataga ctggatggag gcggataaag ttgcaggacc 3180

acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg gagccggtga 3240

gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct cccgtatcgt 3300

agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac agatcgctga 3360

gataggtgcc tcactgatta agcattggta actgtcagac caagtttact catatatact 3420

ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga tcctttttga 3480

taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt cagaccccgt 3540

agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct gctgcttgca 3600

aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc taccaactct 3660

ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgtcc ttctagtgta 3720

gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc tcgctctgct 3780

aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg ggttggactc 3840

aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt cgtgcacaca 3900

gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg agctatgaga 3960

aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg 4020

aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt atagtcctgt 4080

cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag gggggcggag 4140

cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt 4200

tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta ttaccgcctt 4260

tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt cagtgagcga 4320

ggaagcggaa gagcgcctga tgcggtattt tctccttacg catctgtgcg gtatttcaca 4380

ccgcatatat ggtgcactct cagtacaatc tgctctgatg ccgcatagtt aagccagtat 4440

acactccgct atcgctacgt gactgggtca tggctgcgcc ccgacacccg ccaacacccg 4500

ctgacgcgcc ctgacgggct tgtctgctcc cggcatccgc ttacagacaa gctgtgaccg 4560

tctccgggag ctgcatgtgt cagaggtttt caccgtcatc accgaaacgc gcgaggcagc 4620

tgcggtaaag ctcatcagcg tggtcgtgaa gcgattcaca gatgtctgcc tgttcatccg 4680

cgtccagctc gttgagtttc tccagaagcg ttaatgtctg gcttctgata aagcgggcca 4740

tgttaagggc ggttttttcc tgtttggtca cttgatgcct ccgtgtaagg gggaatttct 4800

gttcatgggg gtaatgatac cgatgaaacg agagaggatg ctcacgatac gggttactga 4860

tgatgaacat gcccggttac tggaacgttg tgagggtaaa caactggcgg tatggatgcg 4920

gcgggaccag agaaaaatca ctcagggtca atgccagcgc ttcgttaata cagatgtagg 4980

tgttccacag ggtagccagc agcatcctgc gatgcagatc cggaacataa tggtgcaggg 5040

cgctgacttc cgcgtttcca gactttacga aacacggaaa ccgaagacca ttcatgttgt 5100

tgctcaggtc gcagacgttt tgcagcagca gtcgcttcac gttcgctcgc gtatcggtga 5160

ttcattctgc taaccagtaa ggcaaccccg ccagcctagc cgggtcctca acgacaggag 5220

cacgatcatg cgcacccgtg gccaggaccc aacgctgccc gagatgcgcc gcgtgcggct 5280

gctggagatg gcggacgcga tggatatgtt ctgccaaggg ttggtttgcg cattcacagt 5340

tctccgcaag aattgattgg ctccaattct tggagtggtg aatccgttag cgaggtgccg 5400

ccggcttcca ttcaggtcga ggtggcccgg ctccatgcac cgcgacgcaa cgcggggagg 5460

cagacaaggt atagggcggc gcctacaatc catgccaacc cgttccatgt gctcgccgag 5520

gcggcataaa tcgccgtgac gatcagcggt ccagtgatcg aagttaggct ggtaagagcc 5580

gcgagcgatc cttgaagctg tccctgatgg tcgtcatcta cctgcctgga cagcatggcc 5640

tgcaacgcgg gcatcccgat gccgccggaa gcgagaagaa tcataatggg gaaggccatc 5700

cagcctcgcg tcgcgaacgc cagcaagacg tagcccagcg cgtcggccgc catgccggcg 5760

ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa ggcttgagcg 5820

agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc gctccagcga 5880

aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac gagttgcatg 5940

ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca ccggaaggag 6000

ctgactgggt tgaaggctct caagggcatc ggtcgacgct ctcccttatg cgactcctgc 6060

attaggaagc agcccagtag taggttgagg ccgttgagca ccgccgccgc aaggaatggt 6120

gcatgcatgc atcgaaatta atacgacgaa attaatacga ctcactatag ggcaattgcg 6180

atcaccacaa ttcagcaaat tgtgaacatc atcacgttca tctttccctg gttgccaatg 6240

gcccattttc ctgtcagtaa cgagaaggtc gcgaattcag gcgcttttta gactggtcgt 6300

aatgaac 6307

<210>25

<211>6191

<212>DNA

<213>大肠杆菌，混浊红球菌

<400>25

aattcttaag aaggagatat acatatgacg attactacca cttcgccaag gcagatcgcc 60

ggtcggtgga cacgtgccga gcggcaacga ctgagcgcta tcatcggcac catcgcattg 120

ctgcacgtgc taggtatcgc aatgtatctc gggcgctcgg gtaacccggc cgccgctggt 180

agcctggctg gctcgggact gctcgcctat gtcctgggtg cgcggcacgc gttcgatgcc 240

gaccacatcg cggccatcga cgacaccacc cgcatcatgc tccttcgcgg acgccgaccc 300

gtcggcgtcg gattcttttt cgccatgggg cattcgactg tcgtcctcgt tctctctctg 360

atcgtcgctt tcggagcggg ctcgctcagt tcgatggaag cgtcccgggt cgaggagatc 420

ggaggttacg tcgcgacctg cgtggcagtg ctgttcttgg tgctggtggc cgcactcaac 480

agtttcgttc tgcgcaagct cctcgctctg tctcgtcgga tgcgcactgg ggaagatatc 540

tccggcgacc tcgagcgcgg gctgggtgaa cggggattgc tcagctggct tctcagcggc 600

cgattgcgcg ggctgattcg ttcgtcctgg cacatgtacc cggtgggcct gctcatgggt 660

ctcggcctgg aaaccgcatc cgaagtgaca ttgctgtctc tcactgcctc cgcagcgagc 720

ggaggtcagc tatcgctaat ggcgattgtg agccttccat tgttgtttgc cgcggggatg 780

agcaccttcg atactgcaga ctcactcgtc atgacccgcg cctattcgtg gtcctataac 840

gatgcccagc gccgccttcg cttcaacact gtaaccacgg gtgcgaccat ggtcatcggg 900

ttcttcgtcg cgggaatcta cgtttctgga ctgcttgcgc cgctaccagg gttcggttgg 960

ctgacccctc tgggcgcgat cgccgacaac ttcgagttcc tcggctacgc agtcgccgga 1020

ttgttcgttg ctacctgggc aatcgcagca ctggttagcc ggcctcgacg gcttgtcggc 1080

agctcgaagg tgtgagatgt cggtaccaag cttggctgtt ttggcggatg agagaagatt 1140

ttcagcctga tacagattaa atcagaacgc agaagcggtc tgataaaaca gaatttgcct 1200

ggcggcagta gcgcggtggt cccacctgac cccatgccga actcagaagt gaaacgccgt 1260

agcgccgatg gtagtgtggg gtctccccat gcgagagtag ggaactgcca ggcatcaaat 1320

aaaacgaaag gctcagtcga aagactgggc ctttcgtttt atctgttgtt tgtcggtgaa 1380

cgctctcctg agtaggacaa atccgccggg agcggatttg aacgttgcga agcaacggcc 1440

cggagggtgg cgggcaggac gcccgccata aactgccagg catcaaatta agcagaaggc 1500

catcctgacg gatggccttt ttgcgtttct acaaactctt ttgtttattt ttctaaatac 1560

attcaaatat gtatccgctc atgagacaat aaccctgata aatgcttcaa taatatcgtc 1620

cattccgaca gcatcgccag tcactatggc gtgctgctag cgctatatgc gttgatgcaa 1680

tttctatgcg cacccgttct cggagcactg tccgaccgct ttggccgccg cccagtcctg 1740

ctcgcttcgc tacttggagc cactatcgac tacgcgatca tggcgaccac acccgtcctg 1800

tggatcctct acgccggacg catcgtggcc ggcatcaccg gcgccacagg tgcggttgct 1860

ggcgcctata tcgccgacat caccgatggg gaagatcggg ctcgccactt cgggctcatg 1920

agcgcttgtt tcggcgtggg tatggtggca ggccccgtgg ccgggggact gttgggcgcc 1980

atctccttgc atgcaccatt ccttgcggcg gcggtgctca acggcctcaa cctactactg 2040

ggctgcttcc taatgcagga gtcgcataag ggagagcgtc gaccgatgcc cttgagagcc 2100

ttcaacccag tcagctcctt ccggtgggcg cggggcatga ctatcgtcgc cgcacttatg 2160

actgtcttct ttatcatgca actcgtagga caggtgccgg cagcgctctg ggtcattttc 2220

ggcgaggacc gctttcgctg gagcgcgacg atgatcggcc tgtcgcttgc ggtattcgga 2280

atcttgcacg ccctcgctca agccttcgtc actggtcccg ccaccaaacg tttcggcgag 2340

aagcaggcca ttatcgccgg catggcggcc gacgcgctgg gctacgtctt gctggcgttc 2400

gcgacgcgag gctggatggc cttccccatt atgattcttc tcgcttccgg cggcatcggg 2460

atgcccgcgt tgcaggccat gctgtccagg caggtagatg acgaccatca gggacagctt 2520

caaggatcgc tcgcggctct taccagccta acttcgatca ctggaccgct gatcgtcacg 2580

gcgatttatg ccgcctcggc gagcacatgg aacgggttgg catggattgt aggcgccgcc 2640

ctataccttg tctgcctccc cgcgttgcgt cgcggtgcat ggagccgggc cacctcgacc 2700

tgaatggaag ccggcggcac ctcgctaacg gattcaccac tccaagaatt ggagccaatc 2760

aattcttgcg gagaactgtg aatgcgcaaa ccaacccttg gcagaacata tccatcgcgt 2820

ccgccatctc cagcagccgc acgcggcgca tctcgggcag cgttgggtcc tggccacggg 2880

tgcgcatgat cgtgctcctg tcgttgagga cccggctagg ctggcggggt tgccttactg 2940

gttagcagaa tgaatcaccg atacgcgagc gaacgtgaag cgactgctgc tgcaaaacgt 3000

ctgcgacctg agcaacaaca tgaatggtct tcggtttccg tgtttcgtaa agtctggaaa 3060

cgcggaagtc ccctacgtgc tgctgaagtt gcccgcaaca gagagtggaa ccaaccggtg 3120

ataccacgat actatgactg agagtcaacg ccatgagcgg cctcatttct tattctgagt 3180

tacaacagtc cgcaccgctg tccggtagct ccttccggtg ggcgcggggc atgactatcg 3240

tcgccgcact tatgactgtc ttctttatca tgcaactcgt aggacaggtg ccggcagcgc 3300

ccaacagtcc cccggccacg gggcctgcca ccatacccac gccgaaacaa gcgccctgca 3360

ccattatgtt ccggatctgc atcgcaggat gctgctggct accctgtgga acacctacat 3420

ctgtattaac gaagcgctaa ccgtttttat caggctctgg gaggcagaat aaatgatcat 3480

atcgtcaatt attacctcca cggggagagc ctgagcaaac tggcctcagg catttgagaa 3540

gcacacggtc acactgcttc cggtagtcaa taaaccggta aaccagcaat agacataagc 3600

ggctatttaa cgaccctgcc ctgaaccgac gaccgggtcg aatttgcttt cgaatttctg 3660

ccattcatcc gcttattatc acttattcag gcgtagcacc aggcgtttaa gggcaccaat 3720

aactgcctta aaaaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat 3780

taagcattct gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg 3840

gcatcagcac cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga 3900

agttgtccat attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg 3960

agacgaaaaa catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac 4020

acgccacatc ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc 4080

agagcgatga aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat 4140

cccatatcac cagctcaccg tctttcattg ccatacgaat tccggatgag cattcatcag 4200

gcgggcaaga atgtgaataa aggccggata aaacttgtgc ttatttttct ttacggtctt 4260

taaaaaggcc gtaatatcca gctgaacggt ctggttatag gtacattgag caactgactg 4320

aaatgcctca aaatgttctt tacgatgcca ttgggatata tcaacggtgg tatatccagt 4380

gatttttttc tccattttag cttccttagc tcctgaaaat ctcgataact caaaaaatac 4440

gcccggtagt gatcttattt cattatggtg aaagttggaa cctcttacgt gccgatcaac 4500

gtctcatttt cgccaaaagt tggcccaggg cttcccggta tcaacaggga caccaggatt 4560

tatttattct gcgaagtgat cttccgtcac aggtatttat tcggcgcaaa gtgcgtcggg 4620

tgatgctgcc aacttactga tttagtgtat gatggtgttt ttgaggtgct ccagtggctt 4680

ctgtttctat cagctgtccc tcctgttcag ctactgacgg ggtggtgcgt aacggcaaaa 4740

gcaccgccgg acatcagcgc tagcggagtg tatactggct tactatgttg gcactgatga 4800

gggtgtcagt gaagtgcttc atgtggcagg agaaaaaagg ctgcaccggt gcgtcagcag 4860

aatatgtgat acaggatata ttccgcttcc tcgctcactg actcgctacg ctcggtcgtt 4920

cgactgcggc gagcggaaat ggcttacgaa cggggcggag atttcctgga agatgccagg 4980

aagatactta acagggaagt gagagggccg cggcaaagcc gtttttccat aggctccgcc 5040

cccctgacaa gcatcacgaa atctgacgct caaatcagtg gtggcgaaac ccgacaggac 5100

tataaagata ccaggcgttt cccctggcgg ctccctcgtg cgctctcctg ttcctgcctt 5160

tcggtttacc ggtgtcattc cgctgttatg gccgcgtttg tctcattcca cgcctgacac 5220

tcagttccgg gtaggcagtt cgctccaagc tggactgtat gcacgaaccc cccgttcagt 5280

ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggaa agacatgcaa 5340

aagcaccact ggcagcagcc actggtaatt gatttagagg agttagtctt gaagtcatgc 5400

gccggttaag gctaaactga aaggacaagt tttggtgact gcgctcctcc aagccagtta 5460

cctcggttca aagagttggt agctcagaga accttcgaaa aaccgccctg caaggcggtt 5520

ttttcgtttt cagagcaaga gattacgcgc agaccaaaac gatctcaaga agatcatctt 5580

attaagcttg catgcctgca ggacggatcc ccgggtaccg agctcgaatt taatcagata 5640

aaatatttca agatttcagt gcaatttatc tcttcaaatg tagcacctga agtcagcccc 5700

atacgatata agttgtaatt ctcatgtttg acagcttatc atcgataagc tttaatgcgg 5760

tagtttatca cagttaaatt gctaacgcag tcaggcaccg tgtatgaaat ctaacaatgc 5820

gctcatcgtc atcctcggca ccgtcaccct ggatgctgta ggcataggct tggttatgcc 5880

ggtactgccg ggcctcttgc gggattagtc atgccccgcg cccaccggaa ggagctgact 5940

gggttgaagg ctctcaaggg catcggtcga cgctctccct tatgcgactc ctgcattagg 6000

aagcagccca gtagtaggtt gaggccgttg agcaccgccg ccgcaaggaa tggtgcatgc 6060

atcgatcacc acaattcagc aaattgtgaa catcatcacg ttcatctttc cctggttgcc 6120

aatggcccat tttcctgtca gtaacgagaa ggtcgcgaat tcaggcgctt tttagactgg 6180

tcgtaatgaa c 6191

Claims

1.从混浊红球菌分离的多核苷酸簇，其由4个编码4种多肽的核苷酸序列组成，所述4种多肽由与序列SEQ ID NO：2至SEQ ID NO：4和SEQ ID NO：6中的氨基酸序列一致的氨基酸序列组成，所述4种多肽具有腈水合酶、辅助蛋白P15K和钴转运蛋白的活性，所述腈水合酶由α-亚基和β-亚基组成。

2.多核苷酸，其选自：

a)多核苷酸，其由核苷酸序列SEQ ID NO：1的位置1-708或与其互补的核苷酸序列组成，和

b)多核苷酸，其在遗传密码的简并性的范围内，由与a)的序列相对应的核苷酸序列组成，

其中所述多核苷酸编码腈水合酶的β-亚基。

3.多核苷酸，其选自：

a)多核苷酸，其由核苷酸序列SEQ ID NO：1的位置710-1327或与其互补的核苷酸序列组成，和

其中所述多核苷酸编码腈水合酶的α-亚基。

4.多核苷酸，其选自：

a)多核苷酸，其由核苷酸序列SEQ ID NO：1中的位置1324-1737或与其互补的核苷酸序列组成，和

其中所述多核苷酸编码辅助蛋白P15K。

5.多核苷酸，其选自：

a)多核苷酸，其由核苷酸序列SEQ ID NO：1中的位置2076-3146或与其互补的核苷酸序列组成，和

其中所述多核苷酸编码钴转运蛋白。

6.多肽，其由氨基酸序列SEQ ID NO：2和SEQ ID NO：3组成，其中所述多肽具有腈水合酶活性。

7.多肽，其由氨基酸序列SEQ ID NO：6组成，其中所述多肽具有辅助蛋白P15K活性。

8.多肽，其由氨基酸序列SEQ ID NO：4组成，其中所述多肽具有钴转运蛋白活性。

9.核苷酸序列SEQ ID NO：1内至少20个连续核苷酸或它的互补形式的用途，其用作核苷酸序列SEQ ID NO：1的探针或引物。

10.宿主细胞，其通过导入载体pUD15和pUD16被转化。

11.源自混浊红球菌或包含腈水合酶的微生物制备腈水合酶的方法，其中

a)在导致腈水合酶的形成的条件下，在0.15-4mM Co²⁺存在下，发酵转化的微生物，其包含由根据权利要求1的多核苷酸簇、权利要求2-4的多核苷酸的组合或权利要求2-5的多核苷酸的组合组成的过表达的基因，

b)使该酶在微生物中富集，和

c)从细胞分离该酶，或

d)收获微生物，并获取包含该酶的静止细胞。

12.权利要求11所述的方法，其特征在于，使用权利要求10所述的宿主细胞。

13.源自混浊红球菌的重组生产的腈水合酶，其能以＞50U/mg干生物量的比活，转化α-氨基腈，所述重组生产的腈水合酶由根据权利要求1的多核苷酸簇的过表达制备。

14.从腈酶促制备酰胺的方法，其包含下述步骤：

a)使用具有腈水合酶活性的混浊红球菌的酶转化含腈基化合物，所述酶由与已知于SEQ ID NO：2和SEQ ID NO：3的序列一致的氨基酸序列组成，和

b)分离酰胺。

15.权利要求14所述的方法，其特征在于，使用经纯化或固定化的酶。

16.权利要求14所述的方法，其特征在于，使用包含该酶的静止细胞。

17.权利要求14-16任一所述的方法，其特征在于，将甲基丙烯腈、丙烯腈、MHA-腈、甲硫氨酸腈和N-甲酰基缬氨酸腈转化成对应的酰胺。

18.权利要求17所述的方法，其特征在于，由甲硫氨酸腈转化成对应的酰胺。

19.制备酸的方法，其特征在于，按照权利要求14-18任一所述的方法制备酰胺，水解所述酰胺产生对应的酸。

20.制备羧酸盐的方法，其特征在于，按照权利要求14-18任一所述的方法制备酰胺，用碱金属或碱土金属氢氧化物水解所述酰胺产生对应的羧酸盐。

21.权利要求20所述的方法，其特征在于，用氢氧化钙水解MHA-酰胺，并获取钙盐。