红球菌属的腈水合酶
本发明涉及红球菌多核苷酸簇,其含有能编码具有腈水合酶活性的多肽的核苷酸序列、能活化该酶的辅助蛋白P15K的核苷酸序列、和钴转运蛋白的核苷酸序列,涉及用该簇转化的微生物,且其中能编码这些蛋白的核苷酸序列增强地存在,还涉及转化的微生物在从腈制备酰胺中的应用。
在文献中已经描述了大量的腈水合酶(Synthetic applicationsof nitrile-converting enzymes;Martinkova,Ludmila;Mylerova,Veronika;Current Organic Chemistry(2003),7(13),1279-1295)。自1983年以来,已经使用腈水合酶,以每年数千吨的规模生产丙烯酰胺。已经证实,该生物催化过程能与化学过程相媲美(Enzymicsynthesis of acrylamide:a success story not yet over;Kobayashi,Michihiko;Nagasawa,Toru;Yamada,Trends in Biotechnology(1992),10(11),402-8)。
除了可以用于转化丙烯腈的腈水合酶外,还已经描述了例如特别适用于转化甲基丙烯腈(A nitrile hydratase of Pseudonocardiathermophila and the genes encoding and manufactureof the enzymefor conversion of nitriles to amide s(EP 790310))、3-氰基吡啶(Process for producing amideswith Rhodococcus nitrilehydratase(WO 2002055670))或2-羟基腈例如2-羟基-4-甲硫基丁腈(A nitrile hydrataseof Rhodococcus and its use in themanufacture of amides(WO 2002070717)和Enzymic conversion ofα-hydroxynitrilesto the correspondingα-hydroxyamides,acidsor acid salts,(WO 9832872))的腈水合酶。相反地,迄今尚不知道可以用于有效地转化2-氨基腈的腈水合酶。尽管红球菌属Cr4腈水合酶能例如以高度的活性转化2-羟基腈,它根本不能转化简单的2-氨基腈例如氨基乙腈(WO 2002070717)。
氨基腈向对应的酰胺的酶促转化,打开了一条有吸引力的合成氨基酸的途径,因为2-氨基酰胺可以被容易地水解(WO 2001060789)。该方法能在温和条件下进行,且具有非常高度的选择性,不会形成副产物例如盐,如根据化学水解获得的。
备选地,也可以用碱金属或碱土金属氢氧化物将酰胺转化成对应的酸盐。当使用氢氧化钙转化4-甲硫基-α-羟基丁酰胺(MHA-酰胺)时,该方法是特别优选的,因为MHA的钙盐可以直接作为甲硫氨酸或MHA的替代产物形式被用作饲料添加剂。
但是,为了生产日用品产物例如DL-甲硫氨酸,不能得到具有足够高活性的生物催化剂。为了增加活性,必须建立针对待扩增的基因的表达系统。其自身存在的一种可能性是异源表达,例如,尤其在大肠杆菌、芽胞杆菌属、假单胞菌属、毕赤酵母属、酵母或曲霉属中,因为这些微生物能表现出快速生长,达到非常高的细胞密度,且可使用的分子生物学工具,其允许非常高的表达水平(Lee SY(1996)Highcell-density culture of Escherichia coli.TIBTECH 14:98-105;Riesenberg D,Guthke R(1999)High-cell-density cultivation ofmicroorganisms.Appl Microbiol Biotechnol 51:422-430)。
已知要异源地表达腈水合酶,必须共表达至少3个基因。除了2个结构基因外,还必须为依赖于铁的和依赖于钴的酶增强相应的辅助蛋白(Nojiri M.等,(1999)Functional expression of Nitrilehydratases in Escherichia coli:Requirement of a nitrilehydratase activator and a post-translational modification ofa ligand cysteine.J Biochem 125:696-704 and Over-productionof stereoselective nitrile hydratase from Pseudomonas putida5B in Escherichia coli:activity requires a novel downstreamprotein,Wu,S.;Fallon,R.D.;Payne,M.S.Applied Microbiology and Biotechnology(1997),48(6),704-708)。
除了这3个基因外,还在玫瑰色红球菌属J1的基因簇中的结构基因和辅助蛋白基因旁,发现了另一个基因,其能编码钴转运蛋白(Anovel transporter involved in cobalt uptake,Komeda,Hidenobu等,Proceedings of the National Academy of Sciences of theUnited States of America(1997),94(1),36-41)。在红球菌属和大肠杆菌中的过表达,会导致从培养基中增加摄入Co2+离子。另外证实,当钴转运蛋白与3种其它蛋白一起共表达时,可以在培养基中的Co浓度低于单独表达结构基因和辅助蛋白时的浓度,达到相同的腈水合酶活性。但是,根据Komeda等,该作用仅仅发生在小于42μM浓度的红球菌属中。
EP 0 362 829公开了玫瑰色红球菌属在有钴盐存在下的发酵。
本发明的目的是,获取具有高活性的腈水合酶,其特别地能将α-氨基腈转化成酰胺。
本发明涉及下述内容:
1.从红球菌属、特别是混浊红球菌(Rhodococcus opacus)分离的多核苷酸簇,其含有4个核苷酸序列,其能编码4种多肽,后者具有在每种情况下与序列SEQ ID NO:2至SEQ ID NO:5包含的氨基酸序列至少90%一致的氨基酸序列,所述多肽具有腈水合酶辅助蛋白P15K和钴转运蛋白的活性,所述腈水合酶由α-亚基和β-亚基组成。
2.多核苷酸,其选自:
a)多核苷酸,其由核苷酸序列SEQ ID NO:1的位置1-708或与其互补的核苷酸序列组成,
b)多核苷酸,其在遗传密码的简并性的范围内,具有与a)的序列相对应的核苷酸序列,
c)多核苷酸,其能在严格条件下,与互补序列a)或b)杂交,和
d)多核苷酸,其具有含有功能上中性的有义突变的a),b)或c) 的核苷酸序列,
其中所述多核苷酸编码腈水合酶的β-亚基。
3.多核苷酸,其选自:
a)多核苷酸,其由核苷酸序列SEQ ID NO:1的位置710-1327或与其互补的核苷酸序列组成,
b)多核苷酸,其在遗传密码的简并性的范围内,具有与a)的序列相对应的核苷酸序列,
c)多核苷酸,其能在严格条件下,与互补序列a)或b)杂交,和
d)多核苷酸,其具有含有功能上中性的有义突变的a),b)或c)的核苷酸序列,
其中所述多核苷酸编码腈水合酶的α-亚基。
4.多核苷酸,其选自:
a)多核苷酸,其由核苷酸序列SEQ ID NO:1中的位置1324-1737或与其互补的核苷酸序列组成,
b)多核苷酸,其在遗传密码的简并性的范围内,具有与a)的序列相对应的核苷酸序列,
c)多核苷酸,其能在严格条件下,与互补序列a)或b)杂交,和
d)多核苷酸,其具有含有功能上中性的有义突变的a),b)或c)的核苷酸序列,
其中所述多核苷酸编码辅助蛋白P15K。
5.多核苷酸,其选自:
a)多核苷酸,其由核苷酸序列SEQ ID NO:1中的位置2076-3146或与其互补的核苷酸序列组成,
b)多核苷酸,其在遗传密码的简并性的范围内,具有与a)的序列相对应的核苷酸序列,
c)多核苷酸,其能在严格条件下,与互补序列a)或b)杂交, 和
d)多核苷酸,其具有含有功能上中性的有义突变的a),b)或c)的核苷酸序列,
其中所述多核苷酸编码具有钴转运蛋白活性的蛋白。
6)根据2)或3)的多肽,其含有氨基酸序列SEQ ID NO:2和SEQ ID NO:3,其中所述多肽具有腈水合酶活性。
7)根据4)的多肽,其含有氨基酸序列SEQ ID NO:6,其中所述多肽具有辅助蛋白P15K活性。
8)根据5)的多肽,其含有氨基酸序列SEQ ID NO:5,其中所述多肽具有钴转运蛋白活性。
9)探针或引物,其含有核苷酸序列SEQ ID NO:1的位置1-1327中的至少20个连续核苷酸或它的互补形式。
10)探针或引物,其含有核苷酸序列SEQ ID NO:1的位置1324-1737中的至少20个连续核苷酸或它的互补形式。
11)探针或引物,其含有核苷酸序列SEQ ID NO:1的位置2076-3146中的至少20个连续核苷酸或它的互补形式。
12)根据2)和3)的分离的多核苷酸,其在严格条件下,与具有SEQ ID NO:1中的位置1-1327的互补物杂交,其中所述严格条件包含在50-68℃的温度,在5×SSC中洗涤。
13)根据4)的分离的多核苷酸,其在严格条件下,与具有SEQ IDNO:1中的位置1324-1737的互补物杂交,其中所述严格条件包含在50-68℃的温度,在5×SSC中洗涤。
14)根据5的分离的多核苷酸,其在严格条件下,与具有SEQ IDNO:1中的位置2076-3146的互补物杂交,其中所述严格条件包含在50-68℃的温度,在5×SSC中洗涤。
15)载体,其含有一个或多个选自1)-5)和12)-14),或根据2),3)和4)或根据5)的多核苷酸。
16)载体pUD15,其由核苷酸序列SEQ ID NO.24组成,含有来自 SEQ ID NO:1的根据2),3),和6)的序列,其中所述起始密码子gtg已经被修改成atg。
17)载体pUD16,其由核苷酸序列SEQ ID NO:25组成,含有5)中的序列,其中所述起始密码子ttg已经被修改成atg。
18)宿主细胞,其通过导入根据1)-5)和12)-14)的多核苷酸,被转化或转染;该宿主细胞可以是已知对于表达系统具有足够稳定性的真核细胞或原核细胞。
19)宿主细胞,其通过导入根据15)-17)的载体被转化。
20)根据18)或19)的转化的宿主细胞,其中所述宿主细胞是肠杆菌科尤其是埃希氏杆菌属的细菌。
使用已知的转化或转染技术,可以将载体DNA导入真核或原核细胞。
“转化”,“转染”,“接合”和“转导”指根据现有技术已知的用于导入外来DNA的方法。
本发明也涉及多核苷酸,其基本上由多核苷酸序列组成,后者可以通过下述方法得到:借助含有完整基因或其一部分的相应的混浊红球菌基因库,与含有根据本发明的来自SEQ ID No:1的多核苷酸序列或其片段的探针杂交,而进行筛选,并分离所述多核苷酸序列。
含有根据本发明的序列的多核苷酸适合用作RNA、cDNA和DNA的杂交探针,用于分离编码根据本发明的蛋白的核酸或多核苷酸或全长基因,或用于分离其序列与根据本发明的基因序列具有高度相似性的核酸或多核苷酸或基因。它们也可以作为探针,应用于所谓的阵列、微阵列或DNA芯片,用于检测和确定相应的多核苷酸或由其衍化的序列例如RNA或cDNA。
含有根据本发明的序列的多核苷酸也适合用作引物,其可以与聚合酶链反应(PCR)一起,用于从编码根据本发明的蛋白的基因制备DNA。
这些用作探针或引物的寡核苷酸含有至少25或30、优选至少20、 非常特别优选至少15个连续核苷酸。具有至少40或50个核苷酸长度的寡核苷酸同样适用。当合适时,具有至少100,150,200,250或300个核苷酸的寡核苷酸也适用。
“分离”指从它的自然环境取出。
通常,“多核苷酸”指多核糖核苷酸和多脱氧核糖核苷酸,可能是未修饰的RNA或DNA或经修饰的RNA或DNA。
根据本发明的多核苷酸包括如SEQ ID NO.1所述的多核苷酸,或其中包含的片段,以及与SEQ ID NO.1的多核苷酸或其中包含的片段至少90%,93%,95%,97%或99%一致的那些。
“多肽”应当理解为含有2个或多个通过肽键相连的氨基酸的肽或蛋白。
根据本发明的多肽包括序列SEQ ID NO:2至SEQ ID NO:4和SEQ ID NO:6所述的多肽,以及与序列SEQ ID NO:2至SEQ ID NO:4和SEQ ID NO:6所述的多肽至少90%、特别优选至少91%,95%,97%或99%一致的多肽。
SEQ ID NO:1多核苷酸含有多个单个的编码不同蛋白的序列。α-亚基和辅助蛋白P15K的序列彼此重叠。
为了得到活性蛋白,必须一同表达编码腈水合酶的α-亚基和β-亚基的基因。
SEQ ID NO:2描绘了表现出腈水合酶活性的蛋白的β-亚基的氨基酸序列,且SEQ ID NO:3描绘了α-亚基的氨基酸序列。
SEQ ID NO:2源自核苷酸序列SEQ ID NO:1的位置1-708,SEQ IDNO:3源自位置710-1327。
辅助蛋白P15K的氨基酸序列见SEQ ID NO:6,其与核苷酸序列SEQID NO:1中的位置1324-1737相对应。
辅助蛋白活化腈水合酶,且在能形成腈水合酶的微生物中,其必须与该酶一起存在。
SEQ ID NO:4代表了钴转运蛋白的氨基酸序列,其源自核苷酸序 列SEQ ID NO:1的位置2076-3146。
Patent IN Version 3.1将SEQ ID NO:4中的起始密码子ttg翻译成亮氨酸,将SEQ ID NO:6中的起始密码子gtg翻译成缬氨酸。正确的氨基酸是甲硫氨酸。
已经发现,通过共表达钴转运蛋白,能使大肠杆菌中的腈水合酶活性增加数倍。当在培养基中使用高浓度的钴时,也是如此,这些浓度是超过自然发生的浓度的大小量级。意外地,共表达钴转运蛋白不会导致生物的任何中毒,但是会导致轻微增加的细胞对培养基中的高钴浓度的敏感性。
为了分离根据本发明的基因簇,通常首先在大肠杆菌(B.coli)中制备该微生物的基因库。基因库的制备,记载在众所周知的教科书和手册中。可以提及的实例是Winnacker的教科书:Gene und Klone,Eine Einf ührung in die Gentechnologie[Genes和clones,anintroduction to recombinant DNA technology](Verlag Chemie,Weinheim,Germany,1990)或Sambrook等的手册:Molecular Cloning,A Laboratory Manual(Cold Spring Harbor Laboratory Press,1989)。非常熟悉的已知基因库是大肠杆菌K-12菌株W3110的基因库,其由Kohara等(Cell 50,495-508(1987))在λ-载体中制备。Bathe等(Molecular and General Genetics,252:255-265,1996)描述了C.glutamicum ATCC13032的基因库,使用粘粒载体SuperCos I(Wahl等,1987,Proceedings of the National Academy of Sciences USA,84:2160-2164),在大肠杆菌K-12菌株NM554(Raleigh等,1988,Nucleic Acids Research 16:1563-1575)中制备它。
还可以使用质粒如pBR322(Bolivar,Life Sciences,25,807-818(1979))或pUC9(Vieira等,1982,Gene,19:259-268),在大肠杆菌中制备基因库。合适的宿主特别是限制缺陷的和重组缺陷的大肠杆菌菌株。这些菌株的实例是菌株DH5αmcr,其已经记载在Grant等(Proceedings of the National Academy of Sciences USA, 87(1990)4645-4649)。其然后借助粘粒克隆的长DNA-片段再亚克隆进常用的适于测序的载体中,随后如例如Sanger等(Proceedings ofthe National Academy of Sciences of the United States of America,74:5463-5467,1977)所述进行测序。
然后,使用已知的算法或序列分析程序,例如Staden(NucleicAcids Research 14,217-232(1986))的,von Marck(Nucleic AcidsResearch 16,1829-1836(1988))的,或Butler(Methods ofBiochemical Analysis 39,74-97(1998))的GCG-程序,可以研究得到的DNA-序列。
作为遗传密码的简并性的结果,从SEQ ID No.1包含的序列产生的编码DNA-序列,同样会形成本发明的主题的一部分。以相同的方式,能与这些序列或其一部分杂交的DNA-序列,会形成本发明的主题的一部分。而且,蛋白中的保守氨基酸替换,例如用丙氨酸替代甘氨酸,或用谷氨酸替代天门冬氨酸,在本领域已知是有义突变,其不会导致蛋白活性的任何根本变化,即是功能中性的。还已知,蛋白的N-末端和/或C-末端的变化,不会显著损害蛋白的功能,或者甚至会稳定它。尤其在Ben-Bassat等(Journal of Bacteriology 169:751-757(1987)),O’Regan等(Gene 77:237-251(1989)),Sahin-Toth等(Protein Sciences 3:240-247(1994)),和Hochuli等(Bio/Technology 6:1321-1325(1988))和已知的遗传学和分子生物学教科书中,熟练人员可以获得这方面的信息。
最后,使用来自SEQ ID NO:1的引物,通过聚合酶链反应(PCR)制备的DNA-序列,也会形成本发明的主题的一部分。这些寡核苷酸典型地具有至少15个核苷酸的长度。
尤其在Boehringer Mannheim GmbH公司(Mannheim,Germany,1993)出版的手册“The DIG System Users Guide for FilterHybridization”和Liebl等(International Journal of SystematicBacteriology(1991)41:255-260)中,熟练人员可以获得关于通过 杂交鉴别DNA-序列的说明。杂交在严格条件下进行,即只形成这样的杂合体,其中探针和靶序列(即用该探针处理的多核苷酸)是至少90%一致的。已知通过改变缓冲液组成、温度和盐浓度影响或决定杂交包括洗涤步骤的严格性。优选地,以与洗涤步骤相比相对较低的严格性进行杂交反应(Hybaid Hybridisation Guide,Hybaid Limited,Teddington,UK,1996)。
例如,可以使用5×SSC缓冲液,在约50℃-68℃的温度,进行杂交反应。在这些条件下,探针也可以与表现出与探针序列小于70%一致性的多核苷酸杂交。这些杂合体不太稳定,可以通过在严格条件下洗涤来去除。这可以如下实现:例如,通过将盐浓度降低至2×SSC,当合适时,随后降至0.5×SSC(The DIG System User’s Guide forFilter Hybridisation,Boehringer Mannheim,Mannheim,Germany,1995),将温度设定在约50℃-68℃。当合适时,可以将盐浓度降低至0.1×SSC。通过逐步以约1-2℃分步使杂交温度从50℃增加至68℃,可以分离与采用的探针序列具有例如至少90%-95%一致性的多核苷酸片段。在市场上可以以试剂盒的形式得到进一步杂交说明(例如RocheDiagnostics GmbH,Mannheim,Germany供应的DIG Easy Hyb,目录号1603558)。
尤其在Gait的手册:Oligonukleotide synthesis:A PracticalApproach(IRL Press,Oxford,UK,1984)和Newton和Graham:PCR(Spektrum Akademischer Verlag,Heidelberg,Germany,1994)中,熟练人员以获取使用聚合酶链反应(PCR)扩增DNA-序列的说明。
通常,该方法是,将能高水平表达的基因克隆进具有低拷贝数的载体中,将表达较弱的基因克隆进具有更高拷贝数和/或强启动子的载体中。可以用这些载体转化宿主细胞,以便使它们在每种情况下,与起始生物相比,都含有编码形成腈水合酶或其它蛋白的核苷酸序列的至少一个额外的拷贝。
已经表明,可以有利地以更低的水平表达钴转运蛋白-编码基因, 例如使用低拷贝数的载体,即至少比能编码α-和β-亚基和P15K辅助蛋白的多核苷酸序列少一个拷贝。使用不同强度的启动子,也可以实现所述基因的有差别的表达。
编码α-和β-亚基和辅助蛋白的核苷酸,优选地共同位于一个载体上,且具有一个共用启动子,或具有两个分开的启动子。
以该方式制备的转化的或重组的微生物,同样形成本发明的主题的一部分。
已经发现,在微生物中编码腈水合酶、P15K辅助蛋白和钴转运蛋白的基因的增强,会导致腈水合酶的增多的生产,或导致腈水合酶的增加的活性。
在这方面,术语“增强”描述了在微生物中由相应DNA编码的一种或多种酶的细胞内活性的增加,这可以如下实现:例如,增加该一个或多个基因的拷贝数,使用强启动子,或使用编码具有高活性的对应酶的基因,和视需要组合这些方法。
为了实现过表达,可以突变位于结构基因上游的启动子区和调节区或核糖体结合位点。整合在结构基因上游的表达盒以相同的方式起作用。另外,使用诱导型启动子,可以增加氨基酸发酵生产过程中的表达。通过用于延长m-RNA的寿命的方式同样提高表达。
另外,通过预防酶蛋白的降解同样增强酶活性。基因或基因构建体可以存在于具有不同拷贝数的质粒中或可以整合在染色体中并扩增。备选地,通过改变培养基的组成和培养操作可以实现相关基因的过表达。
通常,采用增强,尤其是过表达,使相应蛋白的活性或浓度,比野生型蛋白或未用根据本发明的核苷酸序列转化的微生物中的蛋白的活性或浓度,增加至少10%,25%,50%,75%,100%,150%,200%,300%,400%或500%,和最大高达1000%或2000%。
本发明也涉及载体的提供,该载体通常能在选择的宿主菌株中自主复制,其彼此相容,且其至少含有权利要求2,3和4保护的核苷酸 序列或权利要求4保护的核苷酸序列。
使用已知的转化技术,可以将载体DNA导入真核或原核细胞。
采用的宿主生物优选地是微生物,例如假单胞菌、毕赤酵母、各种酵母、Saccaromyces、曲霉属或链霉菌科,尤其大肠杆菌,因为它们存在表达系统。红球菌属的微生物也是合适的。
本发明也涉及从红球菌属、尤其混浊红球菌或包含该酶的微生物制备腈水合酶的方法,其中
a)在导致腈水合酶的形成的条件下,在0.15-4mM(mmol/l)尤其是0.3-4mM Co2+的存在下,发酵转化的微生物,其包含根据权利要求1-4的核苷酸序列的过表达的基因,
b)使该酶在微生物中富集,和
c)从细胞分离该酶,或
d)收获微生物,并获取包含该酶的静止细胞。
重组生产的腈水合酶以>50U/mg干生物量的活性转化α-氨基腈。
优选地,在0.5-3.5mM尤其是0.7-3mM Co2+的存在下,其优选地作为可溶盐加入发酵液中,进行发酵。
可以在分批过程(Satzkultivierung)或补料分批过程(Zulaufverfahren)或重复补料分批过程(repetitivesZulaufverfahren)中,连续地或不连续地培养根据本发明使用的微生物。已知的培养方法的总结,记载在Chmiel的教科书(Bioprozeβtechnik 1.Einf ührung in die Bioverfahrenstechnik[Bioprocess technology 1.Introduction to bioprocesstechnology](Gustav Fischer Verlag,Stuttgart,1991))或Storhas的教科书(Bioreaktoren und periphere Einrichtungen[Bioreactors and peripheral equipment](Vieweg Verlag,Braunschweig/Wiesbaden,1994))中。
使用的培养基必须合适地满足每种情况下菌株的要求。培养不同微生物的培养基的描述,见美国细菌学学会(Washington D.C.,USA, 1981)出版的手册“Manual of Methods for General Bacteriology”。
可以使用的碳源是糖和碳水化合物例如葡萄糖、蔗糖、乳糖、果糖、麦芽糖、糖蜜、淀粉和纤维素,油和脂肪例如大豆油、向日葵油、花生油和椰子油,脂肪酸例如棕榈酸、硬脂酸和亚油酸,醇例如甘油和乙醇,和有机酸例如乙酸。这些物质可以单独地或作为混合物使用。
可以使用的氮源是含氮化合物如蛋白胨、酵母提取物、肉膏、麦芽浸膏、玉米浆、豆粉和尿素或无机化合物如硫酸铵、氯化铵、磷酸铵、碳酸铵和硝酸铵。可以单独地或作为混合物使用这些氮源。
可以使用的磷源是磷酸,磷酸二氢钾或磷酸氢二钾或对应的含钠盐。另外,培养基必须含有生长所需的金属盐如硫酸镁或硫酸亚铁。最后,除了上述物质外,可以采用基本的生长物质如氨基酸和维生素。上述原料可以以仅仅一次的混合物形式加入培养基,或以合适的方式,在培养过程中补料。
以合适的方式,使用碱性化合物如氢氧化钠、氢氧化钾、氨或氨水,或酸性化合物,例如磷酸或硫酸,控制培养物的pH。可以使用消泡剂,例如脂肪酸聚乙二醇酯,控制泡沫形成。可以向培养基中加入合适的选择性地起作用的物质,例如抗生素,以维持质粒的稳定性。使氧和含氧气体混合物,例如空气,注入培养物,以维持氧条件。培养温度通常是10℃-40℃,优选10℃-30℃。优选地,连续培养,直到已经经过对数生长期。该目的通常在10小时-70小时内实现。
本发明也涉及从腈酶促制备酰胺的方法,其包含下述步骤:
a)使用具有腈水合酶活性的源自红球菌属尤其是混浊红球菌的酶,转化含腈基化合物,和
b)视需要,分离酰胺。
在一种方法变体中,收获细胞,洗涤,并转入pH 5-9、尤其是6.8-7.9的缓冲液中,制成悬浮液。静止细胞的浓度通常是1-25%、尤其是1.5-15%(湿重/体积)。可以使用物理或化学方法,例如Wilms等,J.Biotechnol.,Vol 86(2001),19-30所述的甲苯,使细胞渗透化, 以便使要转化的腈化合物可以穿透细胞壁,且形成的酰胺可以离开。
生物催化剂(全细胞催化剂)是非常稳定的,所以可以达到超过100g/l的产物浓度。
也可以使用已知的方法,从细胞分离根据本发明的腈水合酶,视需要纯化,并用于转化腈。
本发明也涉及一种方法,其特征在于,将下述通式的化合物转化成对应的酰胺:
R″-CN (II)
其中:
X:是OH,H,具有1-4个C原子的烷基,芳基,特别是NH2;
R:是H,任选地被NH2取代的、分支的或不分支的、具有1-12个C原子的饱和的烷基,
分支的或不分支的、具有1-12个C原子的链烯基,具有3-6个C原子的环烷基,
烷硫基-取代的亚烷基,其中烷基对应于C1-C3基团,且亚烷基对应于二价的C3-C8基团,
R′:是H,或具有1-3个C原子的烷基,
R″:是单核或双核的芳香环,其具有6-12个C原子,视需要经1个或2个烷基(C1-C3)或Cl或F取代;
具有1-6个C原子的烷基腈。
优选地,转化下述腈:
饱和的单腈:
乙腈、丙腈、丁腈、异丁腈、戊腈、异戊腈和己腈,
饱和的二腈:
丙二腈、丁二珀腈、戊二腈和己二腈,
芳族未取代的和取代的单腈和二腈:
苯基腈、2,6-二氟苯基腈、邻苯二腈、间苯二腈和对苯二腈,
α-氨基腈:
α-氨基丙腈,α-氨基甲硫基丁腈,α-氨基丁腈,氨基乙腈,源自天然氨基酸的所有腈,α-氨基-3,3-二甲基丙腈和α-氨基-2,3-二甲基丙腈
含有羧基的腈:
氰基乙酸
β-氨基腈:
3-氨基丙腈
不饱和的腈:
丙烯腈,甲基丙烯腈,烯丙基腈和丁烯腈
α-羟基腈:
α-羟基-正丙腈,α-羟基-正丁腈,α-羟基异丁腈,α-羟基-正己腈,α-羟基-正庚腈,α-羟基-正辛腈,α,γ-二羟基-β,β-二甲基丁腈,丙烯醛氰腈,异丁烯醛氰腈,3-氯乙腈,4-甲硫基-α-羟基丁腈和α-羟基-α-苯基丙酰。
待转化的腈在反应溶液中的浓度,不限于特定范围。
为了避免酶活性受到底物的抑制,通常将腈的浓度保持在0.001-10w/w%、尤其是0.1-2w/w%,基于作为干细胞量(Zellmasse)的生物催化剂的量。可以在反应开始时,加入所有底物,或在反应过程中,连续地或不连续地加入底物。
如果腈化合物在水性反应系统中的溶解度太低,可以加入增溶剂。
但是,作为替代方案,可以在水/有机溶剂两相系统中进行反应。
当将微生物细胞用作酶活性材料时,采用的细胞的量与底物量的比例优选地是0.001-8w/w%,作为干细胞量。
使用MA45湿度分析仪(Sartorius),确定细胞量的干重。
也可以使用众所周知的技术,固定化分离的酶,然后采用该形式的酶。
通常,在-5℃至50℃、尤其是0℃至30℃的温度,反应0.1-100小时。
只要酶活性不受损害,待维持的反应混合物的pH不限于特定值。反应后,可以以已知的方式,从反应溶液中分离已经形成的酰胺,并纯化。
本发明也涉及一种方法,其中,从例如生物量的细胞分离酰胺,或含有酰胺的溶液,将酰胺水解产生对应的酸,或在有加入的碱金属或碱土金属氢氧化物存在下,转化成对应的酸盐。优选地,用氢氧化钙水解MHA-酰胺,并分离对应的钙盐。
实施例
实施例1
克隆混浊红球菌腈水合酶
用限制酶PinAI,Pst I和Xma I(Roche)消化混浊红球菌染色体DNA,并在0.8%琼脂糖凝胶上分离片段。使用标准方法(例如见Sambrook等:Molecular Cloning,A Laboratory Manual,ColdSpring Habor Laboratory Press,1989),在带正电荷的尼龙膜(Hybond-N+,Amersham)上进行DNA印迹。根据生产商的(Roche)说明书,用DIG-标记的探针,进行杂交。使用退化引物1F和1R,使用基因组DNA作为模板,通过PCR制备探针。引物源自β-亚基的同源区,通过比对各种Nhasen的序列确定这些区域。从数据库得到它们的序列。为了分离检测到的约2.2kb大小的PinAI-片段,通过制备凝胶电泳纯化了2至2.5kb的PinAI切割的DNA-片段,并与Xma I切割的载体pUC18(Promega)连接,将连接混合物转化进大肠杆菌JM109(Promega)。通过菌落杂交,使用相同的探针鉴别阳性转化体。以该方式得到的克隆含有2206核苷酸插入物,其包含腈水合酶的β-亚基的基因,和α-亚基的基因的大部分。
对于缺少的序列,使用上述的方法,其采用引物2F和2R,制备新探针,其能在克隆的PinAI-片段的3′-末端杂交。克隆进pUC18中的PinAI-片段用作模板。在与该探针杂交之前,首先根据生产商的(Roche)说明书,从上述膜去除颜色信号和第一个探针。使用第二个探针在该膜上检测约2kb大小的PstI-带。如上所述,将对应的DNA-片段克隆进已经用PstI切口的载体pUC18,并将产物转化进大肠杆菌JM109;然后,通过菌落杂交鉴别阳性克隆。PstI-片段是1883核苷酸大小,且含有腈水合酶的α-亚基的基因的(3′-)部分,辅助蛋白P15K的基因和钴转运蛋白的基因的(5′-)部分。
为了克隆钴转运蛋白基因缺失的序列的DNA-片段,使用引物3F和3R,和用作模板的克隆进pUC18中的PstI-片段,制备新探针,其能在克隆的PstI-片段的3′-末端杂交。该探针用于检测相同膜上的约1.7kb大小的XmaI-带,之前再次从该膜上去除颜色信号和第二个探针。将对应的DNA-片段克隆进已经用XmaI切口的pUC18载体,并将产物转化进大肠杆菌JM109;通过菌落杂交鉴别阳性克隆。为此使用经引物4F和3R扩增的探针。所述XmaI-片段是1747核苷酸大小,且含有钴转运蛋白的基因的(3′-)部分。
SEQ ID NO:1描述了基因簇的连续序列,其含有编码腈水合酶的α-β-亚基、辅助蛋白P15K和钴转运蛋白的多核苷酸。
实施例2
表达载体的构建
将结构基因克隆进用于大肠杆菌的已知表达载体中,且其中插入的基因是在鼠李糖启动子的控制下。另外,插入了第二个鼠李糖启动子。为此,使用引物5F和5R扩增β-亚基的基因,其插入限制酶NdeI,BamHI和HindIII的剪切位点。使用引物6F和6R扩增第二个鼠李糖启动子,其插入限制酶BamHI,NcoI和HindIII的剪切位点。使用引 物7F和7R扩增α-亚基的基因,其插入限制酶NcoI,KpnI和HindIII的剪切位点。使用引物8F和8R扩增P15K蛋白的基因,其插入限制酶KpnI和HindIII的剪切位点,并将起始密码子从GTG改变成ATG。将以该方式构建的表达载体命名为pUD 15。
图1给出了限制图谱,SEQ ID NO:24给出了该序列。
将钴转运蛋白的基因克隆进另一个大肠杆菌表达载体,其中所插入的基因也在鼠李糖启动子的控制下。为此,使用引物9F和9R扩增钴转运蛋白基因,其插入限制酶NdeI和HindIII的剪切位点,并将起始密码子从TTG改变成ATG。将以该方式构建的表达载体命名为pUD 16。
图2给出了限制图谱,SEQ ID NO:25给出了该序列。
将表达质粒转化进大肠杆菌菌株DSM 14459,其保藏在DeutschenSammlung von Mikroorganismen和Zellkulturen[German collectionof microorganisms and cell cultures]GmbH(DSMZ)。
引物:
1F |
5′-ATG AAY GGH ATY TTC GA-3′ |
1R |
5′-ATC CAG TGY YHG TAG TA-3′ |
2F |
5′-CGA AGA CAT GAT CGT CGT G-3′ |
2R |
5′-ACC GGT CCC ACA CCG A-3′ |
3F |
5′-TCG AGG AGA TCG GAG G-3′ |
3R |
5′-GTA TCG AAG GTG CTC ATC-3′ |
4F |
5′-CGC GGG CTG GGT GAA-3′ |
5F |
5′-CGG CGG AAT TCA AGA AGG AGA CCC GCA TAT GAA CGG-3′ |
5R |
5′-GGT GCA AGC TTGGAT CCT GTC AGA TTC CTC GAG TAG-3′ |
6F |
5′-GCG AAG GAT CCT GCA TGC ATC GAA ATT AAT ACG-3′ |
6R |
5′-CAT CAA GCT TTT CGC CAT GGC TAT ATC TCC TTC-3′ |
7F |
5′-CTG ACA GGA TCC AAG AAG GAG ATA TAG CCA TGG CCG A-3′ |
7R |
5′-GTT GCA AGC TTG GTA CCG CTC AAG ACA TCG CCT CCC T-3′ |
8F |
5′-GTG GGT ACC AAG AAG GAG GCG ATC ATA TGA GCA CGC-3′ |
8R |
5′-GCG GAC GAG TAG CGA AGC TTG TTA GTT CAC CG-3′ |
9F |
5′-TCA AAG CTT GAA GGA GAT ATA CAT ATG ACG ATT ACT-3′ |
9R |
5′-GTC AAG CTT GGT ACC GAC ATC TCA CAC CTT CGA-3′ |
[0165] 位于片段上的基因:
pUD15:β-亚基的基因: 核苷酸25-732
α-亚基的基因: 核苷酸949-1566
P15K基因: 核苷酸1592-2005
pUD16:钴转运蛋白的基因: 核苷酸25-1095
实施例3
腈水合酶在大肠杆菌DSM 14559中的异源表达
DSM 14559与DE 101 55 928相关。
在37℃摇动下,在含有1mM CoCl2和100μg/ml氨苄西林的LB-培养基(根据Miller的LB肉汤,VWR)中培养pUD15转化的细胞。以类似的方式培养用pUD15和pUD16转化的细胞,但是培养基另外含有50μg/ml氯霉素。此后,当它们达到至少OD600为2后,将细胞过量接种进同一的培养基中3次。12-16小时后,将一定量的最后的预培养物接种进主培养物中,使后者具有0.1的OD600。主培养物的培养基与预培养物的培养基相对应,但是它另外含有2g/l L-鼠李糖。22小时后,收获细胞。
实施例4
测定酶活性
如实施例3所述培养细胞,通过离心从培养基中分离,并重新悬浮于标准缓冲液(50mM磷酸钾缓冲液,pH 7.5)。将50μl细胞悬浮液加入700μl标准缓冲液,并加250μl 200mM腈在标准缓冲液中的溶液以启动反应。在这方面,测量细胞悬浮液中的细胞浓度,以便在20℃、10min后,腈反应了5-30%。在20℃、10min后,通过加入20μl半浓缩的磷酸终止反应,并通过离心分离细胞。
将一单位(U)的活性定义为,能在1分钟内将1μmo l N-甲酰基缬氨酸腈转化成酰胺的酶的量。比活定义为U/mg干生物量(U/mg BTM)。
这可以使用MA45型湿度分析仪(Sartorius)测量。
实施例5
共表达编码腈水合酶α-亚基,β-亚基和p15K蛋白的基因。
使用转化的大肠杆菌菌株DSM 14459,其携带质粒pUD15,如实施例3所述进行表达。细胞的比活是23U/mg BTM。
实施例6
共表达编码腈水合酶α-亚基,β-亚基,p15K蛋白和钴转运蛋白的基因。
使用转化的大肠杆菌菌株DSM 14459,其携带质粒pUD15和pUD16,如实施例3所述进行表达。细胞的比活是81U/mg BTM。
实施例7
底物特异性
使用静止的转化的大肠杆菌DSM 14459细胞,其携带质粒pUD15,类似于实施例3转化各种腈。将用N-甲酰基缬氨酸腈得到的比活设定为100%。相对于它,给出其它活性。结果如图3所示。
实施例8
在Co2+-盐存在下,转化的大肠杆菌DSM 14459的生长
如实施例3所述,培养仅携带质粒pUD15或携带pUD15和pUD16的转化的大肠杆菌DSM 14459细胞。同时,培养基中的钴浓度从0.5至2mM变化。24小时后,在600nm测量培养物的光密度。
|
携带pUD15的大肠杆菌 |
携带pUD15和pUD16 的大肠杆菌 |
0.5mM CoC12 |
2.808 |
2.524 |
1.0mM CoC12 |
2.6955 |
2.173 |
2.0mM CoC12 |
2.330 |
2.113 |
发现,即使在高钴浓度,也仅仅能观察到对细胞生长的轻微影响。
实施例9
使用携带质粒pUD15的静止的转化的大肠杆菌DSM 14459细胞转化甲硫氨酸腈
如实施例3所述,培养携带质粒pUD15的大肠杆菌DSM 14459细胞,并离心沉淀。将2.8g(湿重)细胞重新悬浮于47.2ml 50mM磷酸钾缓冲液,pH 7.5,在20℃,同时剧烈搅拌,以在反应过程中的任何时间的浓度都不超过15g/l的速度,连续加入甲硫氨酸腈。将pH维持恒定在7.5。如实施例4所述,通过HPLC,监视反应。320min后,9.1g腈已经完全转化成10.4g酰胺。这对应着176g/l的浓度。
附图简述
图1
质粒pUD15
rhaP 鼠李糖启动子
beta 腈水合酶β-亚基的基因
alpha 腈水合酶α-亚基的基因
P15K 辅助蛋白P15K的基因
ori 复制起点
bla 对氨苄西林(β-内酰胺酶)抗性的基因
图2
质粒pUD16
rhaP 鼠李糖启动子
CoTrans 钴转运蛋白的基因
Ori 复制起点
Cmr 对氯霉素抗性的基因
图3
与转化N-甲酰基缬氨酸腈时的活性相比,转化各种腈时的相对比活
根据布达佩斯特条约的用于专利程序目的的
国际公认的微生物保藏
国际表格
Degussa Ag
Projekthaus Biotechnologie
Rodenbacher Chaussee
63457 Hanau
依据条例7.1由下述国际保藏单位
出具的第一次保藏的接收证明
根据布达佩斯特条约的用于专利程序目的的
国际公认的微生物保藏
国际表格
Degussa AG
Projekthaus Biotechnologie
Rodenbacher chaussee
63457 Hanau
依据条例10.2由下述国际保藏单位
出具的存活证明
序列表
<110>Degussa AG
<120>混浊红球菌的腈水合酶
<130>040069 BT
<160>25
<170>PatentIn version 3.1
<210>1
<211>3146
<212>DNA
<213>混浊红球菌
<220>
<221>CDS
<222>(1)..(708)
<223>
<220>
<221>CDS
<222>(710)..(1327)
<223>
<220>
<221>CDS
<222>(2076)..(3146)
<223>
<400>1
atg aac ggc atc ttc gat cta ggc gga acc gac ggc atg ggg ccg gtc 48
Met Asn Gly Ile Phe Asp Leu Gly Gly Thr Asp Gly Met Gly Pro Val
1 5 10 15
gac aac gac aaa ggc acc gag ccg gtg ttc cgc tca gcg tgg gaa aag 96
Asp Asn Asp Lys Gly Thr Glu Pro Val Phe Arg Ser Ala Trp Glu Lys
20 25 30
gcc gcc ttc tcg atg ttc gca caa ggc gcc cga gct ggc ctc tac aac 144
Ala Ala Phe Ser Met Phe Ala Gln Gly Ala Arg Ala Gly Leu Tyr Asn
35 40 45
atc gac gag ttc cgg cac tgc gtc gag cag atg gac ccc gcc gag tat 192
Ile Asp Glu Phe Arg His Cys Val Glu Gln Met Asp Pro Ala Glu Tyr
50 55 60
tta cta tcg aac tac tac gag cac tgg acg cat gcc gtc gaa cac ttc 240
Leu Leu Ser Asn Tyr Tyr Glu His Trp Thr His Ala Val Glu His Phe
65 70 75 80
gcc cag caa aag aac ctc atc aca gcg gca gag ctc gaa aag cgc acg 288
Ala Gln Gln Lys Asn Leu Ile Thr Ala Ala Glu Leu Glu Lys Arg Thr
85 90 95
cat ttc tac cgg gat aac cca gaa gcc ccc ctt ccg gag cgc aag gac 336
His Phe Tyr Arg Asp Asn Pro Glu Ala Pro Leu Pro Glu Arg Lys Asp
100 105 110
cca gag ctc ctc gac ttc gtg aac acc gcg atc gcg aac ggt ttc gcg 384
Pro Glu Leu Leu Asp Phe Val Asn Thr Ala Ile Ala Asn Gly Phe Ala
115 120 125
gcc tcc cgt gaa acc aat agg tcg gca gca ttc acc atc ggc gac cag 432
Ala Ser Arg Glu Thr Asn Arg Ser Ala Ala Phe Thr Ile Gly Asp Gln
130 135 140
gta ctg att gct gcg gac agt cca ttc gga cac acc cga cgg gcc ggc 480
Val Leu Ile Ala Ala Asp Ser Pro Phe Gly His Thr Arg Arg Ala Gly
145 150 155 160
tac atc cgc ggt aag acc gga gtc atc acc gcg aca cac ggc gcc tac 528
Tyr Ile Arg Gly Lys Thr Gly Val Ile Thr Ala Thr His Gly Ala Tyr
165 170 175
gtc tat ccc gac acc gcc ggt aac ggg ctc ggt gag tgc cca gag cac 576
Val Tyr Pro Asp Thr Ala Gly Asn Gly Leu Gly Glu Cys Pro Glu His
180 185 190
gtc tac acc gtg aag ttc acc gcc acc gaa ctt tgg ggc gaa cag agc 624
Val Tyr Thr Val Lys Phe Thr Ala Thr Glu Leu Trp Gly Glu Gln Ser
195 200 205
ggt gat cgc cac agc acc gtc tat ttc gat gtc tgg gaa ccg tac ctc 672
Gly Asp Arg His Ser Thr Val Tyr Phe Asp Val Trp Glu Pro Tyr Leu
210 215 220
tcg ctc gct acc gca ccc tct act cga gga atc tga c atg gcc gaa cag 721
Ser Leu Ala Thr Ala Pro Ser Thr Arg Gly Ile Met Ala Glu Gln
225 230 235
cgc acc gac acc caa ttg cgt aca cac gaa gaa gtc gtc gcc cga gtc 769
Arg Thr Asp Thr Gln Leu Arg Thr His Glu Glu Val Val Ala Arg Val
240 245 250 255
aag gcg ctc gag gcg ctg ctg atc gag aaa ggc gtc atg acg acc gag 817
Lys Ala Leu Glu Ala Leu Leu Ile Glu Lys Gly Val Met Thr Thr Glu
260 265 270
gcc gtc gac cgg atg gcc gag gta tac gag aac gaa gtc ggc ccc cag 865
Ala Val Asp Arg Met Ala Glu Val Tyr Glu Asn Glu Val Gly Pro Gln
275 280 285
atc ggc gct cag att gtc gcc aag gcg tgg acc gac ccg aag ttc aag 913
Ile Gly Ala Gln Ile Val Ala Lys Ala Trp Thr Asp Pro Lys Phe Lys
290 295 300
aag agg ttg ctg gcc aat gcc acg act gcc tgc gca gag atg ggc tac 961
Lys Arg Leu Leu Ala Asn Ala Thr Thr Ala Cys Ala Glu Met Gly Tyr
305 310 315
ggc ggt ctg cag ggc gaa gac atg atc gtc gtg gaa aac acc gac acc 1009
Gly Gly Leu Gln Gly Glu Asp Met Ile Val Val Glu Asn Thr Asp Thr
320 325 330 335
gta cac aac gcg att gtg tgc acc ctc tgc tcc tgc tac ccg tgg ccg 1057
Val His Asn Ala Ile Val Cys Thr Leu Cys Ser Cys Tyr Pro Trp Pro
340 345 350
gtc ttg ggc ctg cca ccg aac tgg tac aag gca ccg gct tac cgc gca 1105
Val Leu Gly Leu Pro Pro Asn Trp Tyr Lys Ala Pro Ala Tyr Arg Ala
355 360 365
cgg atc gtg cgc gaa ccg cgg aag gtc ctc gcc gag gac ttc gac ttt 1153
Arg Ile Val Arg Glu Pro Arg Lys Val Leu Ala Glu Asp Phe Asp Phe
370 375 380
ccc atc ccc gac gac gtc gag atc cgc gtg tgg gac tcg agc gcc gag 1201
Pro Ile Pro Asp Asp Val Glu Ile Arg Val Trp Asp Ser Ser Ala Glu
385 390 395
ctg cgc tat tgg gtt tta ccg cag cgc cct gca cac acc gaa aga ttg 1249
Leu Arg Tyr Trp Val Leu Pro Gln Arg Pro Ala His Thr Glu Arg Leu
400 405 410 415
acg gaa tcc gag ctg gta gcg ctg gtc acc cgc gac tcg atg atc ggt 1297
Thr Glu Ser Glu Leu Val Ala Leu Val Thr Arg Asp Ser Met Ile Gly
420 425 430
gtg gga ccg gtg agg gag gcg atg tcg tga gcacgcgcat tgacgcaacc 1347
Val Gly Pro Val Arg Glu Ala Met Ser
435 440
gagctcgggg aagcacgccg gcgaatcgag gcgttggtgt gtgatctgcc cggtggtgac 1407
gtaggctcac gcgccttcaa cgagccgtgg gaattgcgtg ccttcgcgat ggccgttgcc 1467
gtgtatcacc agggtcacta cgaatggagt gagtttcagc tctccctgat cgcgtcgatc 1527
cgccactggg agcagggcga gggaagggag ccgtggagct actacgagca ctggctcaat 1587
gcgctcgagt cggtactcgc cgccagcggc gccttatcgg acgcagtggg cctcgatgag 1647
cgcacgcgcg aagttctcac caccccacgg aacacgaacc accaccatgc acatcgcgaa 1707
cccgtcgcga tctcatctgc ggtgaactaa cccgcggcgc tactcgtccg ctggccagct 1767
ctctgcctgc tgtccagcga acgacacctc cgtgacagct tctcgttcac cgacccgatc 1827
actgattccc gacgcggtta ccaacgagca cccgcgtata aacagaaccg caaaggtatc 1887
gcagctgtcg gggacgagcg aatagcggat cgctcgcggg ggccggaccc atgcagctga 1947
tgctgctttc gcccgaatag cccagatatc cactggacga ggtgcgaggc ccgatacaag 2007
gcgagcgtca gcaaccggca aaccacagcg tccagagcca gcaccgtcat gtctagaaga 2067
ggaaagca ttg acg att act acc act tcg cca agg cag atc gcc ggt cgg 2117
Leu Thr Ile Thr Thr Thr Ser Pro Arg Gln Ile Ala Gly Arg
445 450
tgg aca cgt gcc gag cgg caa cga ctg agc gct atc atc ggc acc atc 2165
Trp Thr Arg Ala Glu Arg Gln Arg Leu Ser Ala Ile Ile Gly Thr Ile
455 460 465 470
gca ttg ctg cac gtg cta ggt atc gca atg tat ctc ggg cgc tcg ggt 2213
Ala Leu Leu His Val Leu Gly Ile Ala Met Tyr Leu Gly Arg Ser Gly
475 480 485
aac ccg gcc gcc gct ggt agc ctg gct ggc tcg gga ctg ctc gcc tat 2261
Asn Pro Ala Ala Ala Gly Ser Leu Ala Gly Ser Gly Leu Leu Ala Tyr
490 495 500
gtc ctg ggt gcg cgg cac gcg ttc gat gcc gac cac atc gcg gcc atc 2309
Val Leu Gly Ala Arg His Ala Phe Asp Ala Asp His Ile Ala Ala Ile
505 510 515
gac gac acc acc cgc atc atg ctc ctt cgc gga cgc cga ccc gtc ggc 2357
Asp Asp Thr Thr Arg Ile Met Leu Leu Arg Gly Arg Arg Pro Val Gly
520 525 530
gtc gga ttc ttt ttc gcc atg ggg cat tcg act gtc gtc ctc gtt ctc 2405
Val Gly Phe Phe Phe Ala Met Gly His Ser Thr Val Val Leu Val Leu
535 540 545 550
tct ctg atc gtc gct ttc gga gcg ggc tcg ctc agt tcg atg gaa gcg 2453
Ser Leu Ile Val Ala Phe Gly Ala Gly Ser Leu Ser Ser Met Glu Ala
555 560 565
tcc cgg gtc gag gag atc gga ggt tac gtc gcg acc tgc gtg gca gtg 2501
Ser Arg Val Glu Glu Ile Gly Gly Tyr Val Ala Thr Cys Val Ala Val
570 575 580
ctg ttc ttg gtg ctg gtg gcc gca ctc aac agt ttc gtt ctg cgc aag 2549
Leu Phe Leu Val Leu Val Ala Ala Leu Asn Ser Phe Val Leu Arg Lys
585 590 595
ctc ctc gct ctg tct cgt cgg atg cgc act ggg gaa gat atc tcc ggc 2597
Leu Leu Ala Leu Ser Arg Arg Met Arg Thr Gly Glu Asp Ile Ser Gly
600 605 610
gac ctc gag cgc ggg ctg ggt gaa cgg gga ttg ctc agc tgg ctt ctc 2645
Asp Leu Glu Arg Gly Leu Gly Glu Arg Gly Leu Leu Ser Trp Leu Leu
615 620 625 630
agc ggc cga ttg cgc ggg ctg att cgt tcg tcc tgg cac atg tac ccg 2693
Ser Gly Arg Leu Arg Gly Leu Ile Arg Ser Ser Trp His Met Tyr Pro
635 640 645
gtg ggc ctg ctc atg ggt ctc ggc ctg gaa acc gca tcc gaa gtg aca 2741
Val Gly Leu Leu Met Gly Leu Gly Leu Glu Thr Ala Ser Glu Val Thr
650 655 660
ttg ctg tct ctc act gcc tcc gca gcg agc gga ggt cag cta tcg cta 2789
Leu Leu Ser Leu Thr Ala Ser Ala Ala Ser Gly Gly Gln Leu Ser Leu
665 670 675
atg gcg att gtg agc ctt cca ttg ttg ttt gcc gcg ggg atg agc acc 2837
Met Ala Ile Val Ser Leu Pro Leu Leu Phe Ala Ala Gly Met Ser Thr
680 685 690
ttc gat act gca gac tca ctc gtc atg acc cgc gcc tat tcg tgg tcc 2885
Phe Asp Thr Ala Asp Ser Leu Val Met Thr Arg Ala Tyr Ser Trp Ser
695 700 705 710
tat aac gat gcc cag cgc cgc ctt cgc ttc aac act gta acc acg ggt 2933
Tyr Asn Asp Ala Gln Arg Arg Leu Arg Phe Asn Thr Val Thr Thr Gly
715 720 725
gcg acc atg gtc atc ggg ttc ttc gtc gcg gga atc tac gtt tct gga 2981
Ala Thr Met Val Ile Gly Phe Phe Val Ala Gly Ile Tyr Val Ser Gly
730 735 740
ctg ctt gcg ccg cta cca ggg ttc ggt tgg ctg acc cct ctg ggc gcg 3029
Leu Leu Ala Pro Leu Pro Gly Phe Gly Trp Leu Thr Pro Leu Gly Ala
745 750 755
atc gcc gac aac ttc gag ttc ctc ggc tac gca gtc gcc gga ttg ttc 3077
Ile Ala Asp Asn Phe Glu Phe Leu Gly Tyr Ala Val Ala Gly Leu Phe
760 765 770
gtt gct acc tgg gca atc gca gca ctg gtt agc cgg cct cga cgg ctt 3125
Val Ala Thr Trp Ala Ile Ala Ala Leu Val Ser Arg Pro Arg Arg Leu
775 780 785 790
gtc ggc agc tcg aag gtg tga 3146
Val Gly Ser Ser Lys Val
795
<210>2
<211>235
<212>PRT
<213>混浊红球菌
<400>2
Met Asn Gly Ile Phe Asp Leu Gly Gly Thr Asp Gly Met Gly Pro Val
1 5 10 15
Asp Asn Asp Lys Gly Thr Glu Pro Val Phe Arg Ser Ala Trp Glu Lys
20 25 30
Ala Ala Phe Ser Met Phe Ala Gln Gly Ala Arg Ala Gly Leu Tyr Asn
35 40 45
Ile Asp Glu Phe Arg His Cys Val Glu Gln Met Asp Pro Ala Glu Tyr
50 55 60
Leu Leu Ser Asn Tyr Tyr Glu His Trp Thr His Ala Val Glu His Phe
65 70 75 80
Ala Gln Gln Lys Asn Leu Ile Thr Ala Ala Glu Leu Glu Lys Arg Thr
85 90 95
His Phe Tyr Arg Asp Asn Pro Glu Ala Pro Leu Pro Glu Arg Lys Asp
100 105 110
Pro Glu Leu Leu Asp Phe Val Asn Thr Ala Ile Ala Asn Gly Phe Ala
115 120 125
Ala Ser Arg Glu Thr Asn Arg Ser Ala Ala Phe Thr Ile Gly Asp Gln
130 135 140
Val Leu Ile Ala Ala Asp Ser Pro Phe Gly His Thr Arg Arg Ala Gly
145 150 155 160
Tyr Ile Arg Gly Lys Thr Gly Val Ile Thr Ala Thr His Gly Ala Tyr
165 170 175
Val Tyr Pro Asp Thr Ala Gly Asn Gly Leu Gly Glu Cys Pro Glu His
180 185 190
Val Tyr Thr Val Lys Phe Thr Ala Thr Glu Leu Trp Gly Glu Gln Ser
195 200 205
Gly Asp Arg His Ser Thr Val Tyr Phe Asp Val Trp Glu Pro Tyr Leu
210 215 220
Ser Leu Ala Thr Ala Pro Ser Thr Arg Gly Ile
225 230 235
<210>3
<211>205
<212>PRT
<213>混浊红球菌
<400>3
Met Ala Glu Gln Arg Thr Asp Thr Gln Leu Arg Thr His Glu Glu Val
1 5 10 15
Val Ala Arg Val Lys Ala Leu Glu Ala Leu Leu Ile Glu Lys Gly Val
20 25 30
Met Thr Thr Glu Ala Val Asp Arg Met Ala Glu Val Tyr Glu Asn Glu
35 40 45
Val Gly Pro Gln Ile Gly Ala Gln Ile Val Ala Lys Ala Trp Thr Asp
50 55 60
Pro Lys Phe Lys Lys Arg Leu Leu Ala Asn Ala Thr Thr Ala Cys Ala
65 70 75 80
Glu Met Gly Tyr Gly Gly Leu Gln Gly Glu Asp Met Ile Val Val Glu
85 90 95
Asn Thr Asp Thr Val His Asn Ala Ile Val Cys Thr Leu Cys Ser Cys
100 105 110
Tyr Pro Trp Pro Val Leu Gly Leu Pro Pro Asn Trp Tyr Lys Ala Pro
115 120 125
Ala Tyr Arg Ala Arg Ile Val Arg Glu Pro Arg Lys Val Leu Ala Glu
130 135 140
Asp Phe Asp Phe Pro Ile Pro Asp Asp Val Glu Ile Arg Val Trp Asp
145 150 155 160
Ser Ser Ala Glu Leu Arg Tyr Trp Val Leu Pro Gln Arg Pro Ala His
165 170 175
Thr Glu Arg Leu Thr Glu Ser Glu Leu Val Ala Leu Val Thr Arg Asp
180 185 190
Ser Met Ile Gly Val Gly Pro Val Arg Glu Ala Met Ser
195 200 205
<210>4
<211>356
<212>PRT
<213>混浊红球菌
<400>4
Leu Thr Ile Thr Thr Thr Ser Pro Arg Gln Ile Ala Gly Arg Trp Thr
1 5 10 15
Arg Ala Glu Arg Gln Arg Leu Ser Ala Ile Ile Gly Thr Ile Ala Leu
20 25 30
Leu His Val Leu Gly Ile Ala Met Tyr Leu Gly Arg Ser Gly Asn Pro
35 40 45
Ala Ala Ala Gly Ser Leu Ala Gly Ser Gly Leu Leu Ala Tyr Val Leu
50 55 60
Gly Ala Arg His Ala Phe Asp Ala Asp His Ile Ala Ala Ile Asp Asp
65 70 75 80
Thr Thr Arg Ile Met Leu Leu Arg Gly Arg Arg Pro Val Gly Val Gly
85 90 95
Phe Phe Phe Ala Met Gly His Ser Thr Val Val Leu Val Leu Ser Leu
100 105 110
Ile Val Ala Phe Gly Ala Gly Ser Leu Ser Ser Met Glu Ala Ser Arg
115 120 125
Val Glu Glu Ile Gly Gly Tyr Val Ala Thr Cys Val Ala Val Leu Phe
130 135 140
Leu Val Leu Val Ala Ala Leu Asn Ser Phe Val Leu Arg Lys Leu Leu
145 150 155 160
Ala Leu Ser Arg Arg Met Arg Thr Gly Glu Asp Ile Ser Gly Asp Leu
165 170 175
Glu Arg Gly Leu Gly Glu Arg Gly Leu Leu Ser Trp Leu Leu Ser Gly
180 185 190
Arg Leu Arg Gly Leu Ile Arg Ser Ser Trp His Met Tyr Pro Val Gly
195 200 205
Leu Leu Met Gly Leu Gly Leu Glu Thr Ala Ser Glu Val Thr Leu Leu
210 215 220
Ser Leu Thr Ala Ser Ala Ala Ser Gly Gly Gln Leu Ser Leu Met Ala
225 230 235 240
Ile Val Ser Leu Pro Leu Leu Phe Ala Ala Gly Met Ser Thr Phe Asp
245 250 255
Thr Ala Asp Ser Leu Val Met Thr Arg Ala Tyr Ser Trp Ser Tyr Asn
260 265 270
Asp Ala Gln Arg Arg Leu Arg Phe Asn Thr Val Thr Thr Gly Ala Thr
275 280 285
Met Val Ile Gly Phe Phe Val Ala Gly Ile Tyr Val Ser Gly Leu Leu
290 295 300
Ala Pro Leu Pro Gly Phe Gly Trp Leu Thr Pro Leu Gly Ala Ile Ala
305 310 315 320
Asp Asn Phe Glu Phe Leu Gly Tyr Ala Val Ala Gly Leu Phe Val Ala
325 330 335
Thr Trp Ala Ile Ala Ala Leu Val Ser Arg Pro Arg Arg Leu Val Gly
340 345 350
Ser Ser Lys Val
355
<210>5
<211>3146
<212>DNA
<213>混浊红球菌
<220>
<221>CDS
<222>(1324)..(1737)
<223>
<400>5
atgaacggca tcttcgatct aggcggaacc gacggcatgg ggccggtcga caacgacaaa 60
ggcaccgagc cggtgttccg ctcagcgtgg gaaaaggccg ccttctcgat gttcgcacaa 120
ggcgcccgag ctggcctcta caacatcgac gagttccggc actgcgtcga gcagatggac 180
cccgccgagt atttactatc gaactactac gagcactgga cgcatgccgt cgaacacttc 240
gcccagcaaa agaacctcat cacagcggca gagctcgaaa agcgcacgca tttctaccgg 300
gataacccag aagcccccct tccggagcgc aaggacccag agctcctcga cttcgtgaac 360
accgcgatcg cgaacggttt cgcggcctcc cgtgaaacca ataggtcggc agcattcacc 420
atcggcgacc aggtactgat tgctgcggac agtccattcg gacacacccg acgggccggc 480
tacatccgcg gtaagaccgg agtcatcacc gcgacacacg gcgcctacgt ctatcccgac 540
accgccggta acgggctcgg tgagtgccca gagcacgtct acaccgtgaa gttcaccgcc 600
accgaacttt ggggcgaaca gagcggtgat cgccacagca ccgtctattt cgatgtctgg 660
gaaccgtacc tctcgctcgc taccgcaccc tctactcgag gaatctgaca tggccgaaca 720
gcgcaccgac acccaattgc gtacacacga agaagtcgtc gcccgagtca aggcgctcga 780
ggcgctgctg atcgagaaag gcgtcatgac gaccgaggcc gtcgaccgga tggccgaggt 840
atacgagaac gaagtcggcc cccagatcgg cgctcagatt gtcgccaagg cgtggaccga 900
cccgaagttc aagaagaggt tgctggccaa tgccacgact gcctgcgcag agatgggcta 960
cggcggtctg cagggcgaag acatgatcgt cgtggaaaac accgacaccg tacacaacgc 1020
gattgtgtgc accctctgct cctgctaccc gtggccggtc ttgggcctgc caccgaactg 1080
gtacaaggca ccggcttacc gcgcacggat cgtgcgcgaa ccgcggaagg tcctcgccga 1140
ggacttcgac tttcccatcc ccgacgacgt cgagatccgc gtgtgggact cgagcgccga 1200
gctgcgctat tgggttttac cgcagcgccc tgcacacacc gaaagattga cggaatccga 1260
gctggtagcg ctggtcaccc gcgactcgat gatcggtgtg ggaccggtga gggaggcgat 1320
gtc gtg agc acg cgc att gac gca acc gag ctc ggg gaa gca cgc cgg 1368
Val Ser Thr Arg Ile Asp Ala Thr Glu Leu Gly Glu Ala Arg Arg
1 5 10 15
cga atc gag gcg ttg gtg tgt gat ctg ccc ggt ggt gac gta ggc tca 1416
Arg Ile Glu Ala Leu Val Cys Asp Leu Pro Gly Gly Asp Val Gly Ser
20 25 30
cgc gcc ttc aac gag ccg tgg gaa ttg cgt gcc ttc gcg atg gcc gtt 1464
Arg Ala Phe Asn Glu Pro Trp Glu Leu Arg Ala Phe Ala Met Ala Val
35 40 45
gcc gtg tat cac cag ggt cac tac gaa tgg agt gag ttt cag ctc tcc 1512
Ala Val Tyr His Gln Gly His Tyr Glu Trp Ser Glu Phe Gln Leu Ser
50 55 60
ctg atc gcg tcg atc cgc cac tgg gag cag ggc gag gga agg gag ccg 1560
Leu Ile Ala Ser Ile Arg His Trp Glu Gln Gly Glu Gly Arg Glu Pro
65 70 75
tgg agc tac tac gag cac tgg ctc aat gcg ctc gag tcg gta ctc gcc 1608
Trp Ser Tyr Tyr Glu His Trp Leu Asn Ala Leu Glu Ser Val Leu Ala
80 85 90 95
gcc agc ggc gcc tta tcg gac gca gtg ggc ctc gat gag cgc acg cgc 1656
Ala Ser Gly Ala Leu Ser Asp Ala Val Gly Leu Asp Glu Arg Thr Arg
100 105 110
gaa gtt ctc acc acc cca cgg aac acg aac cac cac cat gca cat cgc 1704
Glu Val Leu Thr Thr Pro Arg Asn Thr Asn His His His Ala His Arg
115 l20 125
gaa ccc gtc gcg atc tca tct gcg gtg aac taa cccgcggcgc tactcgtccg 1757
Glu Pro Val Ala Ile Ser Ser Ala Val Asn
130 135
ctggccagct ctctgcctgc tgtccagcga acgacacctc cgtgacagct tctcgttcac 1817
cgacccgatc actgattccc gacgcggtta ccaacgagca cccgcgtata aacagaaccg 1877
caaaggtatc gcagctgtcg gggacgagcg aatagcggat cgctcgcggg ggccggaccc 1937
atgcagctga tgctgctttc gcccgaatag cccagatatc cactggacga ggtgcgaggc 1997
ccgatacaag gcgagcgtca gcaaccggca aaccacagcg tccagagcca gcaccgtcat 2057
gtctagaaga ggaaagcatt gacgattact accacttcgc caaggcagat cgccggtcgg 2117
tggacacgtg ccgagcggca acgactgagc gctatcatcg gcaccatcgc attgctgcac 2177
gtgctaggta tcgcaatgta tctcgggcgc tcgggtaacc cggccgccgc tggtagcctg 2237
gctggctcgg gactgctcgc ctatgtcctg ggtgcgcggc acgcgttcga tgccgaccac 2297
atcgcggcca tcgacgacac cacccgcatc atgctccttc gcggacgccg acccgtcggc 2357
gtcggattct ttttcgccat ggggcattcg actgtcgtcc tcgttctctc tctgatcgtc 2417
gctttcggag cgggctcgct cagttcgatg gaagcgtccc gggtcgagga gatcggaggt 2477
tacgtcgcga cctgcgtggc agtgctgttc ttggtgctgg tggccgcact caacagtttc 2537
gttctgcgca agctcctcgc tctgtctcgt cggatgcgca ctggggaaga tatctccggc 2597
gacctcgagc gcgggctggg tgaacgggga ttgctcagct ggcttctcag cggccgattg 2657
cgcgggctga ttcgttcgtc ctggcacatg tacccggtgg gcctgctcat gggtctcggc 2717
ctggaaaccg catccgaagt gacattgctg tctctcactg cctccgcagc gagcggaggt 2777
cagctatcgc taatggcgat tgtgagcctt ccattgttgt ttgccgcggg gatgagcacc 2837
ttcgatactg cagactcact cgtcatgacc cgcgcctatt cgtggtccta taacgatgcc 2897
cagcgccgcc ttcgcttcaa cactgtaacc acgggtgcga ccatggtcat cgggttcttc 2957
gtcgcgggaa tctacgtttc tggactgctt gcgccgctac cagggttcgg ttggctgacc 3017
cctctgggcg cgatcgccga caacttcgag ttcctcggct acgcagtcgc cggattgttc 3077
gttgctacct gggcaatcgc agcactggtt agccggcctc gacggcttgt cggcagctcg 3137
aaggtgtga 3146
<210>6
<211>137
<212>PRT
<213>混浊红球菌
<400>6
Val Ser Thr Arg Ile Asp Ala Thr Glu Leu Gly Glu Ala Arg Arg Arg
1 5 10 15
Ile Glu Ala Leu Val Cys Asp Leu Pro Gly Gly Asp Val Gly Ser Arg
20 25 30
Ala Phe Asn Glu Pro Trp Glu Leu Arg Ala Phe Ala Met Ala Val Ala
35 40 45
Val Tyr His Gln Gly His Tyr Glu Trp Ser Glu Phe Gln Leu Ser Leu
50 55 60
Ile Ala Ser Ile Arg His Trp Glu Gln Gly Glu Gly Arg Glu Pro Trp
65 70 75 80
Ser Tyr Tyr Glu His Trp Leu Asn Ala Leu Glu Ser Val Leu Ala Ala
85 90 95
Ser Gly Ala Leu Ser Asp Ala Val Gly Leu Asp Glu Arg Thr Arg Glu
100 105 110
Val Leu Thr Thr Pro Arg Asn Thr Asn His His His Ala His Arg Glu
115 120 125
Pro Val Ala Ile Ser Ser Ala Val Asn
130 135
<210>7
<211>17
<212>DNA
<213>人工
<220>
<223>引物
<400>7
atgaayggha tyttcga 17
<210>8
<211>17
<212>DNA
<213>人工
<220>
<223>引物
<400>8
atccagtgyy hgtagta 17
<210>9
<211>19
<212>DNA
<213>人工
<220>
<223>引物
<400>9
cgaagacatg atcgtcgtg 19
<210>10
<211>16
<212>DNA
<213>人工
<220>
<223>引物
<400>10
accggtccca caccga 16
<210>11
<211>16
<212>DNA
<213>人工
<220>
<223>引物
<400>11
tcgaggagat cggagg 16
<210>12
<211>18
<212>DNA
<213>人工
<220>
<223>引物
<400>12
gtatcgaagg tgctcatc 18
<210>13
<211>15
<212>DNA
<213>人工
<220>
<223>引物
<400>13
cgcgggctgg gtgaa 15
<210>14
<211>36
<212>DNA
<213>人工
<220>
<223>引物
<400>14
cggcggaatt caagaaggag acccgcatat gaacgg 36
<210>15
<211>36
<212>DNA
<213>人工
<220>
<223>引物
<400>15
ggtgcaagct tggatcctgt cagattcctc gagtag 36
<210>16
<211>33
<212>DNA
<213>人工
<220>
<223>引物
<400>16
gcgaaggatc ctgcatgcat cgaaattaat acg 33
<210>17
<211>33
<212>DNA
<213>人工
<220>
<223>引物
<400>17
catcaagctt ttcgccatgg ctatatctcc ttc 33
<210>18
<211>37
<212>DNA
<213>人工
<220>
<223>引物
<400>18
ctgacaggat ccaagaagga gatatagcca tggccga 37
<210>19
<211>37
<212>DNA
<213>人工
<220>
<223>引物
<400>19
gttgcaagct tggtaccgct caagacatcg cctccct 37
<210>20
<211>36
<212>DNA
<213>人工
<220>
<223>引物
<400>20
gtgggtacca agaaggaggc gatcatatga gcacgc 36
<210>21
<211>32
<212>DNA
<213>人工
<220>
<223>引物
<400>21
gcggacgagt agcgaagctt gttagttcac cg 32
<210>22
<211>36
<212>DNA
<213>人工
<220>
<223>引物
<400>22
tcaaagcttg aaggagatat acatatgacg attact 36
<210>23
<211>33
<212>DNA
<213>人工
<220>
<223>引物
<400>23
gtcaagcttg gtaccgacat ctcacacctt cga 33
<210>24
<211>6307
<212>DNA
<213>大肠杆菌,混浊红球菌
<400>24
aattcttaag aaggagatat acatatgaac ggcatcttcg atctaggcgg aaccgacggc 60
atggggccgg tcgacaacga caaaggcacc gagccggtgt tccgctcagc gtgggaaaag 120
gccgccttct cgatgttcgc acaaggcgcc cgagctggcc tctacaacat cgacgagttc 180
cggcactgcg tcgagcagat ggaccccgcc gagtatttac tatcgaacta ctacgagcac 240
tggacgcatg ccgtcgaaca cttcgcccag caaaagaacc tcatcacagc ggcagagctc 300
gaaaagcgca cgcatttcta ccgggataac ccagaagccc cccttccgga gcgcaaggac 360
ccagagctcc tcgacttcgt gaacaccgcg atcgcgaacg gtttcgcggc ctcccgtgaa 420
accaataggt cggcagcatt caccatcggc gaccaggtac tgattgctgc ggacagtcca 480
ttcggacaca cccgacgggc cggctacatc cgcggtaaga ccggagtcat caccgcgaca 540
cacggcgcct acgtctatcc cgacaccgcc ggtaacgggc tcggtgagtg cccagagcac 600
gtctacaccg tgaagttcac cgccaccgaa ctttggggcg aacagagcgg tgatcgccac 660
agcaccgtct atttcgatgt ctgggaaccg tacctctcgc tcgctaccgc accctctact 720
cgaggaatct gacaggatcc tgcatgcatc gaaattaata cgacgaaatt aatacgactc 780
actatagggc aattgcgatc accacaattc agcaaattgt gaacatcatc acgttcatct 840
ttccctggtt gccaatggcc cattttcctg tcagtaacga gaaggtcgcg aattcaggcg 900
ctttttagac tggtcgtaat gaacaattct taagaaggag atatagccat ggccgaacag 960
cgcaccgaca cccaattgcg tacacacgaa gaagtcgtcg cccgagtcaa ggcgctcgag 1020
gcgctgctga tcgagaaagg cgtcatgacg accgaggccg tcgaccggat ggccgaggta 1080
tacgagaacg aagtcggccc ccagatcggc gctcagattg tcgccaaggc gtggaccgac 1140
ccgaagttca agaagaggtt gctggccaat gccacgactg cctgcgcaga gatgggctac 1200
ggcggtctgc agggcgaaga catgatcgtc gtggaaaaca ccgacaccgt acacaacgcg 1260
attgtgtgca ccctctgctc ctgctacccg tggccggtct tgggcctgcc accgaactgg 1320
tacaaggcac cggcttaccg cgcacggatc gtgcgcgaac cgcggaaggt cctcgccgag 1380
gacttcgact ttcccatccc cgacgacgtc gagatccgcg tgtgggactc gagcgccgag 1440
ctgcgctatt gggttttacc gcagcgccct gcacacaccg aaagattgac ggaatccgag 1500
ctggtagcgc tggtcacccg cgactcgatg atcggtgtgg gaccggtgag ggaggcgatg 1560
tcttgagcgg taccaagaag gaggcgatca tatgagcacg cgcattgacg caaccgagct 1620
cggggaagca cgccggcgaa tcgaggcgtt ggtgtgtgat ctgcccggtg gtgacgtagg 1680
ctcacgcgcc ttcaacgagc cgtgggaatt gcgtgccttc gcgatggccg ttgccgtgta 1740
tcaccagggt cactacgaat ggagtgagtt tcagctctcc ctgatcgcgt cgatccgcca 1800
ctgggagcag ggcgagggaa gggagccgtg gagctactac gagcactggc tcaatgcgct 1860
cgagtcggta ctcgccgcca gcggcgcctt atcggacgca gtgggcctcg atgagcgcac 1920
gcgcgaagtt ctcaccaccc cacggaacac gaaccaccac catgcacatc gcgaacccgt 1980
cgcgatctca tctgcggtga actaacaagc ttggctgttt tggcggatga gagaagattt 2040
tcagcctgat acagattaaa tcagaacgca gaagcggtct gataaaacag aatttgcctg 2100
gcggcagtag cgcggtggtc ccacctgacc ccatgccgaa ctcagaagtg aaacgccgta 2160
gcgccgatgg tagtgtgggg tctccccatg cgagagtagg gaactgccag gcatcaaata 2220
aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta tctgttgttt gtcggtgaac 2280
gctctcctga gtaggacaaa tccgccggga gcggatttga acgttgcgaa gcaacggccc 2340
ggagggtggc gggcaggacg cccgccataa actgccaggc atcaaattaa gcagaaggcc 2400
atcctgacgg atggcctttt tgcgtttcta caaactcttt tgtttatttt tctaaataca 2460
ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 2520
aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt ttgcggcatt 2580
ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg ctgaagatca 2640
gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag 2700
ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc tatgtggcgc 2760
ggtattatcc cgtgttgacg ccgggcaaga gcaactcggt cgccgcatac actattctca 2820
gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg gcatgacagt 2880
aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca acttacttct 2940
gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg gggatcatgt 3000
aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg acgagcgtga 3060
caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg gcgaactact 3120
tactctagct tcccggcaac aattaataga ctggatggag gcggataaag ttgcaggacc 3180
acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg gagccggtga 3240
gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct cccgtatcgt 3300
agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac agatcgctga 3360
gataggtgcc tcactgatta agcattggta actgtcagac caagtttact catatatact 3420
ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga tcctttttga 3480
taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt cagaccccgt 3540
agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct gctgcttgca 3600
aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc taccaactct 3660
ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgtcc ttctagtgta 3720
gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc tcgctctgct 3780
aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg ggttggactc 3840
aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt cgtgcacaca 3900
gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg agctatgaga 3960
aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg 4020
aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt atagtcctgt 4080
cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag gggggcggag 4140
cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt 4200
tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta ttaccgcctt 4260
tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt cagtgagcga 4320
ggaagcggaa gagcgcctga tgcggtattt tctccttacg catctgtgcg gtatttcaca 4380
ccgcatatat ggtgcactct cagtacaatc tgctctgatg ccgcatagtt aagccagtat 4440
acactccgct atcgctacgt gactgggtca tggctgcgcc ccgacacccg ccaacacccg 4500
ctgacgcgcc ctgacgggct tgtctgctcc cggcatccgc ttacagacaa gctgtgaccg 4560
tctccgggag ctgcatgtgt cagaggtttt caccgtcatc accgaaacgc gcgaggcagc 4620
tgcggtaaag ctcatcagcg tggtcgtgaa gcgattcaca gatgtctgcc tgttcatccg 4680
cgtccagctc gttgagtttc tccagaagcg ttaatgtctg gcttctgata aagcgggcca 4740
tgttaagggc ggttttttcc tgtttggtca cttgatgcct ccgtgtaagg gggaatttct 4800
gttcatgggg gtaatgatac cgatgaaacg agagaggatg ctcacgatac gggttactga 4860
tgatgaacat gcccggttac tggaacgttg tgagggtaaa caactggcgg tatggatgcg 4920
gcgggaccag agaaaaatca ctcagggtca atgccagcgc ttcgttaata cagatgtagg 4980
tgttccacag ggtagccagc agcatcctgc gatgcagatc cggaacataa tggtgcaggg 5040
cgctgacttc cgcgtttcca gactttacga aacacggaaa ccgaagacca ttcatgttgt 5100
tgctcaggtc gcagacgttt tgcagcagca gtcgcttcac gttcgctcgc gtatcggtga 5160
ttcattctgc taaccagtaa ggcaaccccg ccagcctagc cgggtcctca acgacaggag 5220
cacgatcatg cgcacccgtg gccaggaccc aacgctgccc gagatgcgcc gcgtgcggct 5280
gctggagatg gcggacgcga tggatatgtt ctgccaaggg ttggtttgcg cattcacagt 5340
tctccgcaag aattgattgg ctccaattct tggagtggtg aatccgttag cgaggtgccg 5400
ccggcttcca ttcaggtcga ggtggcccgg ctccatgcac cgcgacgcaa cgcggggagg 5460
cagacaaggt atagggcggc gcctacaatc catgccaacc cgttccatgt gctcgccgag 5520
gcggcataaa tcgccgtgac gatcagcggt ccagtgatcg aagttaggct ggtaagagcc 5580
gcgagcgatc cttgaagctg tccctgatgg tcgtcatcta cctgcctgga cagcatggcc 5640
tgcaacgcgg gcatcccgat gccgccggaa gcgagaagaa tcataatggg gaaggccatc 5700
cagcctcgcg tcgcgaacgc cagcaagacg tagcccagcg cgtcggccgc catgccggcg 5760
ataatggcct gcttctcgcc gaaacgtttg gtggcgggac cagtgacgaa ggcttgagcg 5820
agggcgtgca agattccgaa taccgcaagc gacaggccga tcatcgtcgc gctccagcga 5880
aagcggtcct cgccgaaaat gacccagagc gctgccggca cctgtcctac gagttgcatg 5940
ataaagaaga cagtcataag tgcggcgacg atagtcatgc cccgcgccca ccggaaggag 6000
ctgactgggt tgaaggctct caagggcatc ggtcgacgct ctcccttatg cgactcctgc 6060
attaggaagc agcccagtag taggttgagg ccgttgagca ccgccgccgc aaggaatggt 6120
gcatgcatgc atcgaaatta atacgacgaa attaatacga ctcactatag ggcaattgcg 6180
atcaccacaa ttcagcaaat tgtgaacatc atcacgttca tctttccctg gttgccaatg 6240
gcccattttc ctgtcagtaa cgagaaggtc gcgaattcag gcgcttttta gactggtcgt 6300
aatgaac 6307
<210>25
<211>6191
<212>DNA
<213>大肠杆菌,混浊红球菌
<400>25
aattcttaag aaggagatat acatatgacg attactacca cttcgccaag gcagatcgcc 60
ggtcggtgga cacgtgccga gcggcaacga ctgagcgcta tcatcggcac catcgcattg 120
ctgcacgtgc taggtatcgc aatgtatctc gggcgctcgg gtaacccggc cgccgctggt 180
agcctggctg gctcgggact gctcgcctat gtcctgggtg cgcggcacgc gttcgatgcc 240
gaccacatcg cggccatcga cgacaccacc cgcatcatgc tccttcgcgg acgccgaccc 300
gtcggcgtcg gattcttttt cgccatgggg cattcgactg tcgtcctcgt tctctctctg 360
atcgtcgctt tcggagcggg ctcgctcagt tcgatggaag cgtcccgggt cgaggagatc 420
ggaggttacg tcgcgacctg cgtggcagtg ctgttcttgg tgctggtggc cgcactcaac 480
agtttcgttc tgcgcaagct cctcgctctg tctcgtcgga tgcgcactgg ggaagatatc 540
tccggcgacc tcgagcgcgg gctgggtgaa cggggattgc tcagctggct tctcagcggc 600
cgattgcgcg ggctgattcg ttcgtcctgg cacatgtacc cggtgggcct gctcatgggt 660
ctcggcctgg aaaccgcatc cgaagtgaca ttgctgtctc tcactgcctc cgcagcgagc 720
ggaggtcagc tatcgctaat ggcgattgtg agccttccat tgttgtttgc cgcggggatg 780
agcaccttcg atactgcaga ctcactcgtc atgacccgcg cctattcgtg gtcctataac 840
gatgcccagc gccgccttcg cttcaacact gtaaccacgg gtgcgaccat ggtcatcggg 900
ttcttcgtcg cgggaatcta cgtttctgga ctgcttgcgc cgctaccagg gttcggttgg 960
ctgacccctc tgggcgcgat cgccgacaac ttcgagttcc tcggctacgc agtcgccgga 1020
ttgttcgttg ctacctgggc aatcgcagca ctggttagcc ggcctcgacg gcttgtcggc 1080
agctcgaagg tgtgagatgt cggtaccaag cttggctgtt ttggcggatg agagaagatt 1140
ttcagcctga tacagattaa atcagaacgc agaagcggtc tgataaaaca gaatttgcct 1200
ggcggcagta gcgcggtggt cccacctgac cccatgccga actcagaagt gaaacgccgt 1260
agcgccgatg gtagtgtggg gtctccccat gcgagagtag ggaactgcca ggcatcaaat 1320
aaaacgaaag gctcagtcga aagactgggc ctttcgtttt atctgttgtt tgtcggtgaa 1380
cgctctcctg agtaggacaa atccgccggg agcggatttg aacgttgcga agcaacggcc 1440
cggagggtgg cgggcaggac gcccgccata aactgccagg catcaaatta agcagaaggc 1500
catcctgacg gatggccttt ttgcgtttct acaaactctt ttgtttattt ttctaaatac 1560
attcaaatat gtatccgctc atgagacaat aaccctgata aatgcttcaa taatatcgtc 1620
cattccgaca gcatcgccag tcactatggc gtgctgctag cgctatatgc gttgatgcaa 1680
tttctatgcg cacccgttct cggagcactg tccgaccgct ttggccgccg cccagtcctg 1740
ctcgcttcgc tacttggagc cactatcgac tacgcgatca tggcgaccac acccgtcctg 1800
tggatcctct acgccggacg catcgtggcc ggcatcaccg gcgccacagg tgcggttgct 1860
ggcgcctata tcgccgacat caccgatggg gaagatcggg ctcgccactt cgggctcatg 1920
agcgcttgtt tcggcgtggg tatggtggca ggccccgtgg ccgggggact gttgggcgcc 1980
atctccttgc atgcaccatt ccttgcggcg gcggtgctca acggcctcaa cctactactg 2040
ggctgcttcc taatgcagga gtcgcataag ggagagcgtc gaccgatgcc cttgagagcc 2100
ttcaacccag tcagctcctt ccggtgggcg cggggcatga ctatcgtcgc cgcacttatg 2160
actgtcttct ttatcatgca actcgtagga caggtgccgg cagcgctctg ggtcattttc 2220
ggcgaggacc gctttcgctg gagcgcgacg atgatcggcc tgtcgcttgc ggtattcgga 2280
atcttgcacg ccctcgctca agccttcgtc actggtcccg ccaccaaacg tttcggcgag 2340
aagcaggcca ttatcgccgg catggcggcc gacgcgctgg gctacgtctt gctggcgttc 2400
gcgacgcgag gctggatggc cttccccatt atgattcttc tcgcttccgg cggcatcggg 2460
atgcccgcgt tgcaggccat gctgtccagg caggtagatg acgaccatca gggacagctt 2520
caaggatcgc tcgcggctct taccagccta acttcgatca ctggaccgct gatcgtcacg 2580
gcgatttatg ccgcctcggc gagcacatgg aacgggttgg catggattgt aggcgccgcc 2640
ctataccttg tctgcctccc cgcgttgcgt cgcggtgcat ggagccgggc cacctcgacc 2700
tgaatggaag ccggcggcac ctcgctaacg gattcaccac tccaagaatt ggagccaatc 2760
aattcttgcg gagaactgtg aatgcgcaaa ccaacccttg gcagaacata tccatcgcgt 2820
ccgccatctc cagcagccgc acgcggcgca tctcgggcag cgttgggtcc tggccacggg 2880
tgcgcatgat cgtgctcctg tcgttgagga cccggctagg ctggcggggt tgccttactg 2940
gttagcagaa tgaatcaccg atacgcgagc gaacgtgaag cgactgctgc tgcaaaacgt 3000
ctgcgacctg agcaacaaca tgaatggtct tcggtttccg tgtttcgtaa agtctggaaa 3060
cgcggaagtc ccctacgtgc tgctgaagtt gcccgcaaca gagagtggaa ccaaccggtg 3120
ataccacgat actatgactg agagtcaacg ccatgagcgg cctcatttct tattctgagt 3180
tacaacagtc cgcaccgctg tccggtagct ccttccggtg ggcgcggggc atgactatcg 3240
tcgccgcact tatgactgtc ttctttatca tgcaactcgt aggacaggtg ccggcagcgc 3300
ccaacagtcc cccggccacg gggcctgcca ccatacccac gccgaaacaa gcgccctgca 3360
ccattatgtt ccggatctgc atcgcaggat gctgctggct accctgtgga acacctacat 3420
ctgtattaac gaagcgctaa ccgtttttat caggctctgg gaggcagaat aaatgatcat 3480
atcgtcaatt attacctcca cggggagagc ctgagcaaac tggcctcagg catttgagaa 3540
gcacacggtc acactgcttc cggtagtcaa taaaccggta aaccagcaat agacataagc 3600
ggctatttaa cgaccctgcc ctgaaccgac gaccgggtcg aatttgcttt cgaatttctg 3660
ccattcatcc gcttattatc acttattcag gcgtagcacc aggcgtttaa gggcaccaat 3720
aactgcctta aaaaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat 3780
taagcattct gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg 3840
gcatcagcac cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga 3900
agttgtccat attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg 3960
agacgaaaaa catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac 4020
acgccacatc ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc 4080
agagcgatga aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat 4140
cccatatcac cagctcaccg tctttcattg ccatacgaat tccggatgag cattcatcag 4200
gcgggcaaga atgtgaataa aggccggata aaacttgtgc ttatttttct ttacggtctt 4260
taaaaaggcc gtaatatcca gctgaacggt ctggttatag gtacattgag caactgactg 4320
aaatgcctca aaatgttctt tacgatgcca ttgggatata tcaacggtgg tatatccagt 4380
gatttttttc tccattttag cttccttagc tcctgaaaat ctcgataact caaaaaatac 4440
gcccggtagt gatcttattt cattatggtg aaagttggaa cctcttacgt gccgatcaac 4500
gtctcatttt cgccaaaagt tggcccaggg cttcccggta tcaacaggga caccaggatt 4560
tatttattct gcgaagtgat cttccgtcac aggtatttat tcggcgcaaa gtgcgtcggg 4620
tgatgctgcc aacttactga tttagtgtat gatggtgttt ttgaggtgct ccagtggctt 4680
ctgtttctat cagctgtccc tcctgttcag ctactgacgg ggtggtgcgt aacggcaaaa 4740
gcaccgccgg acatcagcgc tagcggagtg tatactggct tactatgttg gcactgatga 4800
gggtgtcagt gaagtgcttc atgtggcagg agaaaaaagg ctgcaccggt gcgtcagcag 4860
aatatgtgat acaggatata ttccgcttcc tcgctcactg actcgctacg ctcggtcgtt 4920
cgactgcggc gagcggaaat ggcttacgaa cggggcggag atttcctgga agatgccagg 4980
aagatactta acagggaagt gagagggccg cggcaaagcc gtttttccat aggctccgcc 5040
cccctgacaa gcatcacgaa atctgacgct caaatcagtg gtggcgaaac ccgacaggac 5100
tataaagata ccaggcgttt cccctggcgg ctccctcgtg cgctctcctg ttcctgcctt 5160
tcggtttacc ggtgtcattc cgctgttatg gccgcgtttg tctcattcca cgcctgacac 5220
tcagttccgg gtaggcagtt cgctccaagc tggactgtat gcacgaaccc cccgttcagt 5280
ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggaa agacatgcaa 5340
aagcaccact ggcagcagcc actggtaatt gatttagagg agttagtctt gaagtcatgc 5400
gccggttaag gctaaactga aaggacaagt tttggtgact gcgctcctcc aagccagtta 5460
cctcggttca aagagttggt agctcagaga accttcgaaa aaccgccctg caaggcggtt 5520
ttttcgtttt cagagcaaga gattacgcgc agaccaaaac gatctcaaga agatcatctt 5580
attaagcttg catgcctgca ggacggatcc ccgggtaccg agctcgaatt taatcagata 5640
aaatatttca agatttcagt gcaatttatc tcttcaaatg tagcacctga agtcagcccc 5700
atacgatata agttgtaatt ctcatgtttg acagcttatc atcgataagc tttaatgcgg 5760
tagtttatca cagttaaatt gctaacgcag tcaggcaccg tgtatgaaat ctaacaatgc 5820
gctcatcgtc atcctcggca ccgtcaccct ggatgctgta ggcataggct tggttatgcc 5880
ggtactgccg ggcctcttgc gggattagtc atgccccgcg cccaccggaa ggagctgact 5940
gggttgaagg ctctcaaggg catcggtcga cgctctccct tatgcgactc ctgcattagg 6000
aagcagccca gtagtaggtt gaggccgttg agcaccgccg ccgcaaggaa tggtgcatgc 6060
atcgatcacc acaattcagc aaattgtgaa catcatcacg ttcatctttc cctggttgcc 6120
aatggcccat tttcctgtca gtaacgagaa ggtcgcgaat tcaggcgctt tttagactgg 6180
tcgtaatgaa c 6191