CN1997738A

CN1997738A - 二肽或二肽衍生物的制备方法

Info

Publication number: CN1997738A
Application number: CNA2005800212451A
Authority: CN
Inventors: 桥本信一; 池田创; 田畑和彦
Original assignee: Kyowa Hakko Kogyo Co Ltd
Current assignee: KH Neochem Co Ltd
Priority date: 2004-06-25
Filing date: 2005-06-24
Publication date: 2007-07-11
Also published as: JP5424530B2; US20080213827A1; EP1767628A1; JPWO2006001381A1; WO2006001381A1; EP1767628A4

Abstract

本发明提供特征如下的二肽或二肽衍生物的制备方法：使用具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物活性的蛋白质，或者具有生产该蛋白质的能力的细胞的培养物或者该培养物的处理物作为酶源，使该酶源、1种以上的氨基酸或者氨基酸衍生物以及ATP在水性介质中共存，在该介质中生成、积累二肽或者二肽衍生物，从该介质中收集二肽或者二肽衍生物。

Description

二肽或二肽衍生物的制备方法

技术领域

本发明涉及使用具有由1种以上的氨基酸或氨基酸衍生物生成二肽或二肽衍生物的活性的蛋白质、或具有编码该蛋白质的DNA的细胞的培养物、或该培养物的处理物的二肽或二肽衍生物的制备方法。

背景技术

有关肽的大量合成法已知有化学合成法(液相法、固相法)、酶促合成法和使用DNA重组法的生物学合成法。现在，对于50残基以上的长链肽使用酶促合成法或生物学合成法，对于二肽主要使用化学合成法和酶促合成法。

使用化学合成法合成二肽需要对官能团进行保护和去保护等操作，由于也合成消旋体，化学合成法不能说是经济、有效的方法。另外由于化学合成法使用大量的有机溶剂等，从环境卫生方面看也不是一个好的方法。

关于由酶法进行的二肽的合成，已知的有利用蛋白分解酶(peptidase)的逆反应的方法(参见非专利文献1)，利用耐热性氨酰基t-RNA合成酶的方法(参见专利文献1～4)，利用非核糖体肽合成酶(以下，称为NRPS)的方法(参见非专利文献2、3和专利文献5、6)。

然而，就利用蛋白水解酶的逆反应的方法来说，需要对底物氨基酸的官能团进行保护和去保护，存在着难于提高肽形成反应效率和阻止肽分解反应的问题。至于利用耐热性氨酰t-RNA合成酶的方法，存在着酶的表达、阻止目的产物以外的副生物反应困难的问题。就利用NRPS的方法来说，因为酶分子很大，存在使用DNA重组的方法难以表达该酶的困难，由于需要提供辅酶4′-三磷酸(4′-Phosphopantetheine)，所以不能称之为有效的制备方法。

一方面已知存在酶分子量比NRPS小、不需要辅酶4′-phosphopantetheine的γ-谷氨酰半胱氨酸合成酶(γ-glutamylcysteine synthetase)、谷胱甘肽合成酶(glutathionesynthetase)、D-丙氨酰-D-丙氨酸(D-Ala-D-Ala)连接酶(D-Ala-D-Ala ligase)、聚-γ-谷氨酸合成酶(poly-γ-glutamatesynthetase)等一组肽合成酶。几乎所有这些酶等由于都具有作为底物使用D-氨基酸或催化在γ位羧基形成肽键等特征，所以不能用于在L-氨基酸的α位羧基形成肽键的二肽的合成。

已知通过在L-氨基酸的α位羧基形成肽键活性生成二肽只有作为来自属于芽孢杆菌属的微生物的二肽抗生素的杆菌溶素合成酶。已知杆菌溶素合成酶具有合成杆菌溶素(L-丙氨酰-L-anticapsin、L-Ala-L-anticapsin)和L-丙氨酰-L-丙氨酸(L-Ala-L-Ala)的活性，但有关其它二肽的合成活性还不清楚(参照非专利文献4和5)。

另外，关于全基因组信息已阐明的枯草芽孢杆菌(Bacillussubtilis)168株(参照非专利文献6)中的杆菌溶素合成酶基因组，已知如果扩增含有ywfA～F的ORF的杆菌溶素操纵子，杆菌溶素的产率会增加(参照专利文献7)。然而，在这些ORF中是否含有编码具有通过肽键连接2种以上的氨基酸的活性的蛋白质的ORF，如果含有，也不知道哪个ORF编码该蛋白质。

已知有种微生物可生成具有由2个氨基酸连接成环状的环状二肽二酮哌嗪环缩二氨酸(diketopiperazine)结构的化合物(参照非专利文献7、8和9)。据报道对于二酮哌嗪环缩二氨酸的生物合成，是在Streptomyces acidiscabies的Thaxtomin生物合成过程中通过NRPS合成了cyclo-(L-4-nitrotryptophyl-L-phenylalanine)结构(参照非专利文献10)、和通过杆菌属的细菌的NRPS的部分module的作用从苯丙氨酸和脯氨酸生成cyclo(phenylalanyl-proline)(参照非专利文献11)。

另外，据报道已知作为抗生物质白诺菌素(albonoursin)的生产株诺尔斯氏链霉菌( Streptomycesnoursei)ATCC11455株中，与NRPS酶完全不相似的蛋白质( albC 基因产物)负责环(L-苯丙氨酰-L-亮氨酸)[cyclo(L-phenylalanyl-L-leucine)]结构的合成，如果使环二肽氧化酶作用于导入了albC基因的大肠杆菌( Escherichia coli)和浅青紫链霉菌( Streptomyces lividans)的培养液，可以检测到albonoursin(参照非专利文献12)，但还没有 albC基因产物生成直链状二肽的报告。

由此可见尚且不知道包含在杆菌溶素合成酶群中的酶等具有由一种以上的氨基酸和氨基酸衍生物生成各种二肽衍生物的活性。

专利文献1特开昭58-146539号公报

专利文献2特开昭58-209991号公报

专利文献3特开昭58-209992号公报

专利文献4特开昭59-106298号公报

专利文献5美国专利第5795738号

专利文献6美国专利第5652116号

专利文献7国际公开专利第00-03009号小册子

非专利文献1J.Biol.Chem.，119，707-720(1937)

非专利文献2Chem.Biol.，7，373-384(2000)

非专利文献3FEBS Lett.，498，42-45(2001)

非专利文献4J.Ind.Microbiol.，2，201-208(1987)

非专利文献5Enzyme.Microbial.Technol.，29，400-406(2001)

非专利文献6Nature，390，249-256(1997)

非专利文献7J.Nat.Prod.，59，293-296(1996)

非专利文献8Tetrahedron，28，2999(1972)

非专利文献9J.Appl.Microbiol.，86，29-53(1999)

非专利文献10Mol.Microbiol.，38，794-804(2000)

非专利文献11J.Biol.Chem.，273，22773-22781(1998)

非专利文献12Chemistry&Biol.，9，1355-1364(2002)

发明内容

发明所要解决的问题

本发明的目的是提供由氨基酸或氨基酸衍生物制备二肽衍生物的方法。

解决问题的方法

本发明、涉及以下的(1)～(26)：

(1)二肽或者二肽衍生物(PI)的制备方法，其特征在于，使以下的[1]～[7]任一项所述的蛋白质、1种以上的氨基酸或者氨基酸衍生物、以及ATP存在于水性介质中、在该介质中生成、蓄积二肽或者二肽衍生物[以下、称为二肽或者二肽衍生物(PI)]，从该介质中收集该二肽或者二肽衍生物(PI)[不过、二肽或者二肽衍生物(PI)不是选自下述氨基酸组A的相同或者不相同的氨基酸以肽键结合而成的化合物(氨基酸组A：L-丙氨酸、L-谷氨酰胺、L-谷氨酸、L-缬氨酸、L-亮氨酸、L-异亮氨酸、L-脯氨酸、L-苯丙氨酸、L-色氨酸、L-蛋氨酸、L-丝氨酸、L-苏氨酸、L-半胱氨酸、L-天冬酰胺、L-酪氨酸、L-赖氨酸、L-精氨酸、L-组氨酸、L-天冬氨酸、L-α-氨基丁酸、L-偶氮丝氨酸、L-茶氨酸、L-4-羟基脯氨酸、L-3-羟基脯氨酸、L-鸟氨酸、L-瓜氨酸、L-6-重氮-5-氧代正亮氨酸、甘氨酸以及β-丙氨酸)]。

[1]具有序列号1～8任一项所示的氨基酸序列的蛋白质；

[2]由在序列号1～8任一项所示的氨基酸序列上缺失、置换或者添加1个以上的氨基酸的氨基酸序列构成、并且具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质；

[3]由与序列号1～8任一项所示的氨基酸序列具有65％以上的同源性的氨基酸序列构成、并且具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质；

[4]具有与序列号17所示的氨基酸序列80％以上的同源性的氨基酸序列、并且具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质；

[5]具有序列号37或者38所示的氨基酸序列的蛋白质；

[6]由在序列号37或者38所示的氨基酸序列上缺失、置换或者添加1个以上的氨基酸的氨基酸序列构成、并且具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质；

[7]具有与序列号37或者38所示的氨基酸序列65％以上的同源性的氨基酸序列构成、并且具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质；

(2)二肽或者二肽衍生物(PII)的制备方法，其特征在于，使以下的[1]～[7]的任一项所述的蛋白质、1种以上的氨基酸或者氨基酸衍生物、以及ATP存在于水性介质中、在该介质中生成、蓄积二肽或者二肽衍生物(PI)，直接或者从该介质收集该二肽或者二肽衍生物(PI)后、修饰该二肽或者二肽衍生物(PI)以合成二肽或者二肽衍生物[以下，称为二肽或者二肽衍生物(PII)]，收集该二肽或者二肽衍生物(PII)[不过，二肽或者二肽衍生物(PII)不是选自上述氨基酸组A的相同或者不相同的氨基酸以肽键结合而成的化合物]；

[1]具有序列号1～8任一项所示的氨基酸序列的蛋白质；

[3]与序列号1～8任一项所示的氨基酸序列具有65％以上的同源性的氨基酸序列构成、并且具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质；

[4]与序列号17所示的氨基酸序列具有80％以上的同源性的氨基酸序列、并且具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质；

[5]具有序列号37或者38所示的氨基酸序列的蛋白质；

[7]由与序列号37或者38所示的氨基酸序列具有65％以上的同源性的氨基酸序列构成、并且具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质；

(3)二肽或者二肽衍生物(PI)的制备方法，其特征在于，将具有选自以下[1]～[5]的DNA的细胞的培养物或者该培养物的处理物用作酶源，使该酶源、1种以上的氨基酸或者氨基酸衍生物存在于水性介质中、在该水性介质中生成、蓄积二肽或者二肽衍生物(PI)，从该介质中收集该二肽或者二肽衍生物(PI)，[不过、二肽或者二肽衍生物(PI)不是选自上述氨基酸组A的相同或者不相同的氨基酸以肽键结合而成的化合物]；

[1]具有序列号9～16以及36任一项所示的碱基序列的DNA；

[2]与具有序列号9～16以及36任一项所示的碱基序列互补的碱基序列的DNA在严格的条件下杂交、并且编码具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质的DNA；

[3]与具有序列号18所示的碱基序列的互补的碱基序列的DNA在严格的条件下杂交、并且编码具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质的DNA；

[4]具有序列号39或者40所示的碱基序列的DNA；

[5]与具有序列号39或者40所示的碱基序列互补的碱基序列的DNA在严格的条件下杂交、并且编码具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质的DNA；

(4)二肽或者二肽衍生物(PII)的制备方法，其特征在于，将具有选自以下[1]～[5]的DNA的细胞的培养物或者该培养物的处理物用作酶源，使该酶源、1种以上的氨基酸或者氨基酸衍生物存在于水性介质中，在该水性介质中生成、蓄积二肽或者二肽衍生物(PI)，直接或者从该介质收集该二肽或者二肽衍生物(PI)后，修饰该二肽或者二肽衍生物(PI)而生成二肽或者二肽衍生物(PII)，收集该二肽或者二肽衍生物(PII)；

[1]具有序列号9～16以及36任一项所示的碱基序列的DNA；

[2]编码与具有序列号9～16以及36任一项所示的碱基序列互补的碱基序列的DNA在严格的条件下杂交、并且具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质的DNA；

[3]编码与具有序列号18所示的碱基序列互补的碱基序列的DNA在严格的条件下杂交、并且具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质的DNA；

[4]具有序列号39或者40所示的碱基序列的DNA

[5]编码具有与序列号39或者40所示的碱基序列互补的碱基序列的DNA在严格的条件下杂交、并且具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)活性的蛋白质的DNA。

(5)上述(1)～(4)中的任一种制备方法，其中氨基酸或者氨基酸衍生物是式(I)或式(II)表示的氨基酸或氨基酸衍生物：

(式中、n¹表示1～3的整数，

R^1a和R^1b可以相同或不同，代表氢原子、取代或未取代的低级烷基、取代或未取代的低级烯基、取代或未取代的低级炔基、取代或未取代的芳烷基、取代或未取代的低级烷酰基、取代或未取代的低级烷氧羰基、取代或未取代的芳基或取代或未取代的芳酰基，或R^1a和R^1b中的任一方也可以与邻接的氮原子、该氮原子邻接的碳原子以及该碳原子上的R^2a和R^2b的任一方一起形成取代或未取代的杂环基，

R^2a和R^2b可相同或不同，代表氢原子、取代或未取代的低级烷基、取代或未取代的芳烷基、取代或未取代的芳基或取代或未取代的杂环烷基，或与R^1aR^1bN邻接的碳原子上的R^2a和R^2b中的任一方也可以与邻接的碳原子、该碳原子邻接的氮原子以及R^1a和R^1b中的任一方一起形成取代或未取代的杂环基，n¹为2或3时，2个或3个的R^2a和2个或3个的R^2b可分别相同，也可以不同)，

[式中、n²与上述n¹意义相同。

R^3a和R^3b可以相同或不同，代表氢原子、取代或未取代的低级烷基、取代或未取代的芳烷基、取代或未取代的芳基或取代或未取代的杂环烷基，或与R⁴HN邻接的碳原子上的R^3a和R^3b中的任一方与邻接的碳原子、与该碳原子邻接的氮原子和R⁴一起形成取代或未取代的杂环基，当n²为2或3时，2个或3个的R^3a和2个或3个的R^3b可分别相同，也可以不同，

R⁴代表氢原子、取代或未取代的低级烷基、取代或未取代的低级烯基、取代或未取代的低级炔基、取代或未取代的芳烷基、取代或未取代的低级烷酰基、取代或未取代的低级烷氧羰基、取代或未取代的芳基或取代或未取代的芳酰基，或与R⁴邻接的氮原子、与该氮原子邻接的碳原子以及该碳原子上的R^3a和R^3b中的任一方一起形成取代或未取代的杂环基，

R⁵代表氨基、羟基、取代或未取代的低级烷氧基、一(取代或未取代的低级烷基)氨基、二(取代或未取代的低级烷基)氨基或脂环式杂环基][但当氨基酸或氨基酸衍生物只是式(I)表示的氨基酸或氨基酸衍生物时，R^1a和R^1b中至少有一方是氢原子，而当氨基酸或氨基酸衍生物只是式(II)表示的氨基酸或氨基酸衍生物时，R⁵为羟基]。

(6)上述(1)～(4)中的任一种制备方法，其中氨基酸或氨基酸衍生物是式(III)或式(IV)表示的氨基酸或氨基酸衍生物：

(式中、R^1c和R^1d可相同或不同，代表氢原子、取代或未取代的低级烷基、取代或未取代的低级烯基、取代或未取代的低级炔基、取代或未取代的芳烷基、取代或未取代的低级烷酰基、取代或未取代的低级烷氧羰基、取代或未取代的芳基或取代或未取代的芳酰基，

R^2c和R^2d可相同或不同，代表氢原子或取代或未取代的低级烷基)，

(式中、R^3c和R^3d可相同或不同，代表氢原子、取代或未取代的低级烷基、取代或未取代的芳烷基或取代或未取代的芳基，

R⁵与上述意义相同)

[但当氨基酸或氨基酸衍生物只是式(III)表示的氨基酸或氨基酸衍生物时，R^1c和R^1d中至少有一方是氢原子，当氨基酸或氨基酸衍生物只是式(IV)表示的氨基酸或氨基酸衍生物时，R⁵为羟基]。

(7)上述(1)～(4)中的任一种制备方法，其中氨基酸或氨基酸衍生物是式(V)或式(VI)表示的氨基酸或氨基酸衍生物：

(式中、R^2e表示取代或未取代的甲基)

(式中、R^3e代表取代或未取代的低级烷基、取代或未取代的芳烷基或取代或未取代的芳基)。

(8)上述(1)～(4)中的任一种制备方法，其中氨基酸或氨基酸衍生物是选自L-氨基酸、甘氨酸和β-丙氨酸中的氨基酸或其衍生物。

(9)上述(8)的制备方法，其中L-氨基酸是选自L-丙氨酸、L-谷氨酰胺、L-谷氨酸、L-缬氨酸、L-亮氨酸、L-异亮氨酸、L-脯氨酸、L-苯丙氨酸、L-色氨酸、L-蛋氨酸、L-丝氨酸、L-苏氨酸、L-半胱氨酸、L-天冬酰胺、L-酪氨酸、L-赖氨酸、L-精氨酸、L-组氨酸、L-天冬氨酸、L-α-氨基丁酸、L-偶氮丝氨酸、L-茶氨酸、L-4-羟基脯氨酸、L-3-羟基脯氨酸、L-鸟氨酸、L-瓜氨酸和L-6-重氮-5-氧代正亮氨酸中的L-氨基酸。

(10)上述(1)～(5)中的任一种制备方法，其中二肽或二肽衍生物(PI)是式(VIIa)表示的二肽或二肽衍生物：

[式中、n^3a和n^4a分别与上述n¹具有相同意义，

R^6a和R^6b可相同或不同，代表氢原子、取代或未取代的低级烷基、取代或未取代的低级烯基、取代或未取代的低级炔基、取代或未取代的芳烷基、取代或未取代的低级烷酰基、取代或未取代的低级烷氧羰基、取代或未取代的芳基或取代或未取代的芳酰基，或R^6a和R^6b中的任一方可以与邻接的氮原子、与该氮原子邻接的碳原子和该碳原子上的R^7a和R^7b中的任一方一起形成取代或未取代的杂环基，

R^7a和R^7b可相同或不同，代表氢原子、取代或未取代的低级烷基、取代或未取代的芳烷基、取代或未取代的芳基或取代或未取代的杂环烷基，或与R^6aR^6bN邻接的碳原子上的R^7a和R^7b中的任一方可以与邻接的碳原子、与该碳原子邻接的氮原子和R^6a和R^6b中的任一方一起形成取代或未取代的杂环基，当n^3a为2或3时，2个或3个R^7a和2个或3个R^7b可分别相同，也可以不同，

R^8a代表氢原子、取代或未取代的低级烷基、取代或未取代的低级烯基、取代或未取代的低级炔基、取代或未取代的芳烷基、取代或未取代的低级烷酰基、取代或未取代的低级烷氧羰基、取代或未取代的芳基或取代或未取代的芳酰基，或R^8a与邻接的氮原子、与该氮原子邻接而且与R^9a和R^9b结合的碳原子和该碳原子上的R^9a和R^9b中的任一方一起形成取代或未取代的杂环基，

R^9a和R^9b可相同或不同，代表氢原子、取代或未取代的低级烷基、取代或未取代的芳烷基、取代或未取代的芳基或取代或未取代的杂环烷基，或与R^8aN邻接的碳原子上的R^9a和R^9b中的任一方可以与邻接的碳原子、与该碳原子邻接的氮原子和R^8a一起形成取代或未取代的杂环基，当n^4a为2或3时，2个或3个R^9a和2个或3个R^9b可分别相同，也可以不同，

R^10a代表氨基、羟基、取代或未取代的低级烷氧基、一(取代或未取代的低级烷基)氨基、二(取代或未取代的低级烷基)氨基或脂环式杂环基]。

(11)上述(1)～(5)中的任一种制备方法，其中二肽或二肽衍生物(PII)是式(VIIb)表示的二肽或二肽衍生物：

[式中、n^3A和n^4A分别与上述n¹具有相同意义，

R^6A和R^6B可相同或不同，代表氢原子、取代或未取代的低级烷基、取代或未取代的低级烯基、取代或未取代的低级炔基、取代或未取代的芳烷基、取代或未取代的低级烷酰基、取代或未取代的低级烷氧羰基、取代或未取代的芳基或取代或未取代的芳酰基，或R^6A和R^6B中的任一方也可以与邻接的氮原子、与该氮原子邻接的碳原子和该碳原子上的R^7A和R^7B中的任一方一起形成取代或未取代的杂环基，

R^7A和R^7B可相同或不同，代表氢原子、取代或未取代的低级烷基、取代或未取代的芳烷基、取代或未取代的芳基或取代或未取代的杂环烷基，或与R^6AR^6BN邻接的碳原子上的R^7A和R^7B中的任一方也可以与邻接的碳原子、与该碳原子邻接的氮原子和R^6A和R^6B中的任一方一起形成取代或未取代的杂环基，当n^3A为2或3时，2个或3个R^7A和2个或3个R^7B可分别相同，也可以不同，

R^8A代表氢原子、取代或未取代的低级烷基、取代或未取代的低级烯基、取代或未取代的低级炔基、取代或未取代的芳烷基、取代或未取代的低级烷酰基、取代或未取代的低级烷氧羰基、取代或未取代的芳基或取代或未取代的芳酰基，或R^8A与邻接的氮原子、与该氮原子邻接而且与R^9A和R^9B结合的碳原子以及该碳原子上的R^9A和R^9B中的任一方一起形成取代或未取代的杂环基，

R^10A与上述R^10a具有同样的意义]。

(12)上述(1)～(6)中的任一种制备方法，其中二肽或二肽衍生物(PI)是式(VIIIa)表示的二肽或二肽衍生物：

(式中、R^6c和R^6d可相同或不同，代表氢原子、取代或未取代的低级烷基、取代或未取代的低级烯基、取代或未取代的低级炔基、取代或未取代的芳烷基、取代或未取代的低级烷酰基、取代或未取代的低级烷氧羰基、取代或未取代的芳基或取代或未取代的芳酰基，

R^7c和R^7d可相同或不同，代表氢原子或取代或未取代的低级烷基，

R^9c和R^9d可相同或不同，代表氢原子、取代或未取代的低级烷基、取代或未取代的芳烷基或取代或未取代的芳基，

R^10a与上述同义)。

(13)上述(1)～(6)中的任一种制备方法，其中二肽或二肽衍生物(PII)是式(VIIIb)表示的二肽或二肽衍生物：

(式中、R^6C、R^6D、R^7C、R^7D、R^9C和R^9D分别与上述R^6c、R^6d、R^7c、R^7d、R^9c和R^9d具有同样意义，R^10A与上述同义)。

(14)上述(1)～(7)中的任一种制备方法，其中二肽或二肽衍生物(PI)是式(IXa)表示的二肽或二肽衍生物：

(式中、R^7e代表取代或未取代的甲基，R^9e代表取代或未取代的低级烷基、取代或未取代的芳烷基或取代或未取代的芳基)。

(15)上述(1)～(7)中的任一种制备方法，其中二肽或二肽衍生物(PII)是式(IXb)表示的二肽或二肽衍生物：

(式中、R^7E和R^9E分别与上述R^7e和R^9e具有同样意义)。

(16)上述(1)～(8)中的任一种制备方法，其中二肽或二肽衍生物(PI)或二肽或二肽衍生物(PII)是从L-氨基酸、甘氨酸、和β-丙氨酸、以及它们的衍生物选出的相同或不同的氨基酸或氨基酸衍生物通过肽键形成的二肽或二肽衍生物。

(17)上述(16)的制备方法，其中L-氨基酸是选自L-丙氨酸、L-谷氨酰胺、L-谷氨酸、L-缬氨酸、L-亮氨酸、L-异亮氨酸、L-脯氨酸、L-苯丙氨酸、L-色氨酸、L-蛋氨酸、L-丝氨酸、L-苏氨酸、L-半胱氨酸、L-天冬酰胺、L-酪氨酸、L-赖氨酸、L-精氨酸、L-组氨酸、L-天冬氨酸、L-α-氨基丁酸、L-偶氮丝氨酸、L-茶氨酸、L-4-羟基脯氨酸、L-3-羟基脯氨酸、L-鸟氨酸、L-瓜氨酸和L-6-重氮-5-氧代正亮氨酸中的L-氨基酸。

(18)上述(3)～(17)中的任一种制备方法，其中细胞是微生物的细胞。

(19)上述(18)的制备方法，其中微生物是原核生物。

(20)上述(19)的制备方法，其中原核生物是1种以上的肽酶和1种以上的具有肽转运活性的蛋白质(以下，也称为肽转运蛋白质)的活性低下或丧失的微生物。

(21)上述(20)的制备方法，其中原核生物是3种以上的肽酶的活性低下或丧失的微生物。

(22)上述(20)或(21)的制备方法，其中肽酶是具有序列号43～46中的任一个表示的氨基酸序列的蛋白质、或具有与序列号43～46中的任一个表示的氨基酸序列有80％以上同源性的氨基酸序列，而且具有肽酶活性的蛋白质。

(23)上述(20)或(22)的制备方法，其中肽转运蛋白质是具有序列号47～51中的任一个表示的氨基酸序列的蛋白质、或具有与序列号47～51中的任一个表示的氨基酸序列有80％以上同源性的蛋白质，而且具有肽转运活性的蛋白质。

(24)上述(19)～(23)中的任一种制备方法，其中原核生物是属于埃希氏菌属、芽孢杆菌属或棒杆菌属的微生物。

(25)上述(24)的制备方法，其中属于埃希氏菌属、芽孢杆菌属或棒杆菌属的微生物是大肠杆菌( Escherichia coli)、谷氨酸棒杆菌( Corynebacterium glutamicum)、产氨棒杆菌( Corynebacterium ammoniagenes)、乳酸发酵棒杆菌( Corynebacterium lactofermentum)、黄色短杆菌( Brevibacterium flavum)、Corynebacterium efficiens、枯草芽孢杆菌( Bacillus subtilis)或巨大芽孢杆菌( Bacillus megaterium)。

(26)上述(3)～(25)中的任一种制备方法，其特征在于，其中培养物的处理物是从培养物的浓缩物、培养物的干燥物、对培养物进行离心分离得到的菌体、该菌体的干燥物、该菌体的冷冻干燥物、该菌体的表面活性剂处理物、该菌体的超声波处理物、该菌体的机械性磨碎处理物、该菌体的溶剂处理物、该菌体的酶处理物、该菌体的蛋白质分级物、该菌体的固定化物和从该菌体提取得到的酶标准品选出的处理物，而且具有由1种以上的氨基酸或氨基酸衍生物生成二肽或二肽衍生物的活性的处理物。

发明的效果

通过本发明可以提供由1种以上的氨基酸或氨基酸衍生物有效地制备二肽衍生物的方法。

附图说明

图1是表示质粒pPE43的构建过程的图。

图2是表示质粒pQE60ywfE的构建过程的图。

图3是表示具有直链二肽合成活性的蛋白质的表达质粒载体pAL-nou和pAL-alb的构建过程的图。

图4是表示 ywfE基因表达强化型载体pPE56的构建过程的图。

符号说明

ywfE：来自枯草芽孢杆菌168株的 ywfE基因

Ptrp：色氨酸启动子基因

PT5：T5启动子

Amp^r：氨苄青霉素抗性基因

lacI^q：乳糖阻遏物基因

albC： albC基因或 albC类似基因

具体实施方式

1.用于本发明的方法的蛋白质

用于本发明的方法的蛋白质可列举以下[1]～[7]所述的蛋白质等：

[1]具有序列号1～8中的任一个表示的氨基酸序列的蛋白质；

[2]由在序列号1～8中的任一个表示的氨基酸序列缺失、置换或添加1个以上的氨基酸的氨基酸序列构成，而且具有由一种以上的氨基酸和氨基酸衍生物生成二肽或二肽衍生物的活性的蛋白质；

[3]由与序列号1～8中的任一个表示的氨基酸序列具有65％以上同源性的氨基酸序列构成，而且具有由一种以上的氨基酸和氨基酸衍生物生成二肽或二肽衍生物的活性的蛋白质；

[4]具有与序列号17表示的氨基酸序列有80％以上同源性的氨基酸序列，而且具有由一种以上的氨基酸和氨基酸衍生物生成二肽或二肽衍生物的活性的蛋白质；

[5]具有由序列号37或38表示的氨基酸序列的蛋白质；

[6]由在序列号37或38表示的氨基酸序列中缺失、置换或添加1个以上的氨基酸的氨基酸序列构成，而且具有由一种以上的氨基酸和氨基酸衍生物生成二肽或二肽衍生物的活性的蛋白质；和

[7]由与序列号37或38表示的氨基酸序列有65％以上同源性的氨基酸序列构成，而且具有由一种以上的氨基酸和氨基酸衍生物生成二肽或二肽衍生物的活性的蛋白质。

在上述中，由缺失、置换或添加了1个以上的氨基酸的氨基酸序列构成，而且具有式(I)所示二肽合成活性的蛋白质可以通过使用Molecular Cloning，A Laboratory Manual，Third Edition，ColdSpring Harbor Laboratory Press(2001)(以下，略为MolecularCloning第3版)、Current Protocols in Molecular Biology，JohnWiley&Sons(1987-1997)(以下，略为Current Protocols inMolecular Biology)、Nucleic Acids Research， 10，6487(1982)、Proc.Natl.Acad.Sci.USA， 79，6409(1982)、Gene， 34，315(1985)、Nucleic Acids Research， 13，4431(1985)、Proc.Natl.Acad.Sci.USA， 82,488(1985)等所述的定点突变导入法，例如可以通过在由编码序列号1～8、37和38中的任一个表示的氨基酸序列构成的蛋白质的DNA中导入定点突变取得。

缺失、置换或添加的氨基酸的数目没有特别限定，只要是通过上述的定点突变法等众所周知的方法能够缺失、置换或添加程度的数目，可以是从1个至数十个、优选1～20个、更优选1～10个、再优选1～5个。

所谓在序列号1～8、37和38中的任一个表示的氨基酸序列中缺失、置换或添加1个以上的氨基酸指的是可以在同一序列中的任意位置缺失、置换或添加1个或多个氨基酸。

作为可置换的氨基酸，例如用众所周知的对比软件对序列号1～8、以及序列号37和38表示的氨基酸序列之间进行比较时，所有氨基酸序列中非保守的氨基酸。作为众所周知的对比软件，例如基因解析软件Genetyx(软件开发株式会社)中含有的序列对比解析软件。作为该解析软件的解析参数，可以使用default值。

另外作为可进行氨基酸缺失或添加的氨基酸位置，例如序列号1～8、37和38中的任一个表示的氨基酸序列的N末端和C末端。

缺失、置换或添加可以同时出现，被置换或添加的氨基酸无论天然型，还是非天然型都可以。作为天然型氨基酸，如L-丙氨酸、L-天冬酰胺、L-天冬氨酸、L-谷氨酰胺、L-谷氨酸、甘氨酸、L-精氨酸、L-组氨酸、L-异亮氨酸、L-亮氨酸、L-赖氨酸、L-蛋氨酸、L-苯丙氨酸、L-脯氨酸、L-丝氨酸、L-苏氨酸、L-色氨酸、L-酪氨酸、L-缬氨酸、L-半胱氨酸等。

以下给出了可相互置换的氨基酸的例子。同一组中含有的氨基酸可相互置换。

A组：亮氨酸、异亮氨酸、正亮氨酸、缬氨酸、正缬氨酸、丙氨酸、2-氨基丁酸、蛋氨酸、O-甲基丝氨酸、t-丁基甘氨酸、t-丁基丙氨酸、环己基丙氨酸

B组：天冬氨酸、谷氨酸、异天冬氨酸、异谷氨酸、2-氨基己二酸、2-氨基辛二酸

C组：天冬酰胺、谷氨酰胺

D组：赖氨酸、精氨酸、鸟氨酸、2，4-二氨基丁酸、2，3-二氨基丙酸

E组：脯氨酸、3-羟基脯氨酸、4-羟基脯氨酸

F组：丝氨酸、苏氨酸、高丝氨酸

G组：苯丙氨酸、酪氨酸

另外本发明中使用的蛋白质为了具有二肽或者二肽衍生物的合成成活性，希望是序列号1～8、37和38中的任一个表示的氨基酸序列、优选与序列号1或者37中的任一个表示的氨基酸序列的同源性具有65％以上、优选75％以上、更优选85％以上、再优选90％以上、特别优选95％以上、最好优选98％以上的序列。

氨基酸序列或碱基序列的同源性可以使用Karlin and Altschul提出的算法BLAST[Pro.Natl.Acad.Sci.USA， 90，5873(1993)]或FASTA[Methods Enzymol.， 183，63(1990)]测定。根据这个算法BLAST开发了称为BLASTN和BLASTX的程序[J.Mol.Biol.， 215，403(1990)]。当根据BLAST通过BLASTN对碱基序列进行解析时，参数定为例如Score＝100、wordlength＝12。另外当根据BLAST通过BLASTX对氨基酸序列进行解析时，参数定为例如score＝50、wordlength＝3。当使用BLAST和Gapped BLAST程序时，使用各程序的default参数。这些解析方法的具体手法众所周知(http://www.ncbi.nlm.nih.gov.)。

另外，由与序列号1～8、37和38中的任一个表示的氨基酸序列、优选与序列号1或37中的任一个表示的氨基酸序列具有65％以上、优选75％以上、更优选85％以上、再优选90％以上、特别优选95％以上、最好优选98％以上同源性的氨基酸序列构成，而且具有二肽或者二肽衍生物合成活性的蛋白质也是可在本发明中使用的蛋白质。氨基酸序列的同源性可以象上述那样使用BLAST或FASTA测定。

序列号17表示的氨基酸序列是被保存在具有序列号1～7表示的氨基酸序列的蛋白质中的区域，而且是对应于具有各种微生物的Ala-Ala连接酶活性的蛋白质的共有序列区域。

具有与序列号17表示的氨基酸序列有80％以上、优选90％以上、更优选95％以上同源性的氨基酸序列，而且具有二肽或者二肽衍生物合成活性的蛋白质也是可在本发明中使用的蛋白质。

为了使与序列号17表示的氨基酸序列有80％以上、优选90％以上、再优选95％以上同源性的氨基酸序列的蛋白质成为具有生成二肽的活性的蛋白质，希望该蛋白质的氨基酸序列与序列号1～8中的任一个表示的氨基酸序列的同源性至少具有80％以上、通常为90％以上、最好具有95％以上的同源性。

氨基酸序列的同源性可以象上述那样使用BLAST或FASTA测定。

作为确认本发明中可使用的蛋白质是具有二肽或者二肽衍生物合成活性的蛋白质的方法，例如使用DNA重组法制作表达可用于本发明的蛋白质的转化体，使用该转化体制备在本发明中使用的蛋白质后，使该蛋白质、1种以上的L-氨基酸和氨基酸衍生物、和ATP存在于水性介质中，通过HPLC等分析二肽或二肽衍生物是否在该水性介质中生成、蓄积的方法。

2.可用于本发明的DNA

作为编码可用于本发明DNA，可列举以下[1]～[5]所述的DNA：

[1]具有序列号9～16和36中的任一个表示的碱基序列的DNA、

[2]与具有序列号9～16和36中的任一个表示的碱基序列互补的碱基序列的DNA在严格的条件下杂交，而且编码具有由一种以上的氨基酸或氨基酸衍生物生成二肽或二肽衍生物的活性的蛋白质的DNA、

[3]与具有序列号18表示的碱基序列互补的碱基序列的DNA在严格的条件下杂交，而且编码具有由一种以上的氨基酸或氨基酸衍生物生成二肽或二肽衍生物的活性的蛋白质的DNA、

[4]具有序列号39或40表示的碱基序列的DNA、以及

[5]与具有序列号39或40表示的碱基序列互补的碱基序列的DNA在严格的条件下杂交，而且编码具有由一种以上的氨基酸或氨基酸衍生物生成二肽或二肽衍生物的活性的蛋白质的DNA。

所谓上述的在严格条件下可杂交的DNA指的是以具有与序列号9～16、18、36、39或者40中的任一个表示的碱基序列互补的碱基序列的DNA的一部分、或全部作为探针，通过使用菌落杂交法、噬斑杂交法或Southern blot杂交法等得到的DNA，具体来说，使用固定了来自菌落或噬斑的DNA的滤器，在0.7～1.0mol/L、优选0.9mol/L氯化钠存在下、于65℃下进行杂交后、使用0.1～2倍、优选0.1倍浓度的SSC溶液(1倍浓度的SSC溶液组成由150mmol/l氯化钠、15mmol/l柠檬酸钠构成)，于65℃条件下，通过清洗滤器能够鉴定的DNA。杂交可以根据Molecular Cloning第3版、Current Protocols in MolecularBiology、DNA Cloning 1：Core Techniques，A Practical Approach，Second Edition，Oxford University(1995)等记载的方法进行。作为可杂交的DNA，具体而言使用上述的BLAST和FASTA等，在根据上述参数计算时，与序列号9～16、18、36、39或者40中的任一个表示的碱基序列至少具有75％以上、优选85％以上、再优选90％以上、特别优选95％以上同源性的DNA。

和具有与序列号9～16、18、36、39或者40中的任一个表示的碱基序列互补的碱基序列的DNA在严格条件下进行杂交的DNA是编码具有二肽或者二肽衍生物合成活性的蛋白质的DNA如上述所述那样，可以通过使用重组DNA法制备该DNA编码的蛋白质，测定该蛋白质的活性进行确认。

4.可用于本发明的DNA的制备

用于本发明的DNA，例如可以通过使用能够根据序列号9～16、18、36、39或者40中的任一个表示的碱基序列设计的探针，例如使用对芽孢杆菌属或链霉菌属的微生物的染色体DNA文库进行Southern杂交、或可以根据序列号9～16、18、36、39或者40中的任一个表示的碱基序列设计的引物DNA，以使用芽孢杆菌属的微生物的染色体DNA作为模板的PCR[PCR Protocols，Academic Press(1990)]而取得。

另外，对于各种基因序列数据库，检索与序列号1～8、17、37和38中的任一个编码氨基酸序列的DNA的碱基序列具有75％以上、优选85％以上、更优选90％以上、进一步优选95％以上、特别优选98％以上同源性的序列，根据通过该检索得到的碱基序列，使用上述的方法由具有该碱基序列的生物的染色体DNA、cDNA文库等也可以取得可用于本发明的DNA。

取得的DNA可以直接、或用适当的限制酶等进行酶切，通过常规方法转运到载体，然后将得到的的重组DNA导入宿主细胞后，通过使用通常用的碱基序列解析方法、例如双脱氧法[Proc.Natl.Acad.Sci.，USA， 74，5463(1977)]或373A·DNA序列仪(Perkin-Elmer公司生产)等碱基序列分析仪进行分析，可以测定该DNA的碱基序列。

当测定碱基序列的结果发现取得的DNA为部分长时，通过使用该部分长DNA作为探针，对染色体DNA文库的Southern杂交法等可以取得全长DNA。

然后根据测定的DNA的碱基序列，通过使用PerSeptiveBiosystems公司制备的8905型DNA合成仪进行化学合成，也可以制备目的DNA。

作为象上述那样取得的DNA，例如具有序列号9～16、36、39或者40表示的碱基序列的DNA。

作为本发明的制备方法中可使用的DNA重组的载体，如pBluescriptII KS(+)(Stratagene公司生产)、pDIRECT[NucleicAcids Res.， 18，6069(1990)]、pCR-Script Amp SK(+)(Stratagene公司生产)、pT7Blue(Novagen公司生产)、pCR II(Invitrogen公司生产)和pCR-TRAP(Genhunter公司生产)等。

作为宿主细胞，如属于埃希氏菌属的微生物等。作为属于埃希氏菌属的微生物，例如大肠杆菌(Escherichia coli)XL1-Blue、大肠杆菌XL2-Blue、大肠杆菌DH1、大肠杆菌MC1000、大肠杆菌KY3276、大肠杆菌W1485、大肠杆菌JM109、大肠杆菌HB101、大肠杆菌No.49、大肠杆菌W3110、大肠杆菌NY49、大肠杆菌MP347、大肠杆菌NM522、大肠杆菌ME8415等。

作为重组DNA的导入方法，只要是将DNA导入到上述宿主细胞的方法，可以使用任一种方法，例如使用钙离子的方法[Proc.Natl.Acad.Sci.，USA， 69，2110(1972)]、原生质体法(特开昭63-248394)、电穿孔法[Nucleic Acids Res.， 16，6127(1988)]等。

作为通过上述方法得到的带有可用于本发明的制备方法的DNA的微生物，例如带有含具有序列号1表示的碱基序列的DNA的重组DNA的微生物大肠杆菌NM522/pPE43。

4.可用于本发明的细胞的制备

(1)作为可用于本发明的细胞，可列举i)属于在染色体DNA上含有上述3的DNA的芽孢杆菌属的细菌，优选使用具有杆菌溶素合成活性的芽孢杆菌属的细菌，更优选选自属于枯草芽孢杆菌、解淀粉芽孢杆菌、凝结芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌和短小芽孢杆菌，进一步优选枯草芽孢杆菌ATCC15245、枯草芽孢杆菌ATCC6633、枯草芽孢杆菌IAM1213、枯草芽孢杆菌IAM1107、枯草芽孢杆菌IAM1214、枯草芽孢杆菌ATCC9466、枯草芽孢杆菌IAM1033、枯草芽孢杆菌ATCC21555、解淀粉芽孢杆菌IFO3022、短小芽孢杆菌NRRL B-12025的细菌；ii)属于在染色体DNA上含有上述3的DNA的链霉菌属的细菌、优选使用具有生产albonoursin能力的链霉菌属的细菌，更优选属于微白链霉菌和诺尔斯氏链霉菌中任一种类的细菌、进一步优选微白链霉菌IFO14147和诺尔斯氏链霉菌ATCC11455或者IFO15452中的细菌；iii)使用分子克隆第3版、Current Protocols in Molecular Biology等所述的方法等，例如通过以下的方法，通过将使用上述3的方法取得的DNA导入宿主细胞制备的转化体。

以本发明中使用的DNA作为基础，根据需要，制备含有可用于本发明的编码蛋白质的部分的适当长度的DNA片段。另外，通过置换碱基使编码该蛋白质的部分的碱基序列变成最适宿主表达的密码子，可以取得该蛋白质的产率提高的细胞。

通过将该DNA片段插入到适当的表达载体的启动子的下游，制作重组DNA。

通过将该重组DNA导入到适合该表达载体的宿主细胞，可以得到生产本发明的蛋白质的转化体。

作为宿主细胞，如原核生物和酵母等微生物的细胞、动物细胞、昆虫细胞、植物细胞等只要是可以表达目的基因的都可以使用，优选微生物、更优选原核生物、进一步优选细菌。

作为表达载体，使用可在上述宿主细胞自我复制或可转运到染色体中，在能够转录本发明的DNA或可用于本发明的制备方法中的DNA的位置含有启动子的载体。

使用细菌等原核生物作为宿主细胞时，含有本发明使用的DNA的重组DNA最好是可在原核生物中自我复制的同时，由启动子、核糖体结合序列、本发明的DNA或本发明的制备方法使用的DNA、转录终止序列构成的重组DNA。也可以含有调控启动子的基因。

作为表达载体，例如pBTrp2、pBTac1、pBTac2(都是BoehringerMannheim公司生产)、pHelix1(Roche Diagnostics公司生产)、pKK233-2(Amersham Pharmacia Biotech公司生产)、pSE280(Invitrogen公司生产)、pGEMEX-1(Promega公司生产)、pQE-8(Qiagen公司生产)、pET-3(Novagen公司生产)、pKYP10(特开昭58-110600)、pKYP200[Agric.Biol.Chem.， 48，669(1984)]、pLSA1[Agric.Biol.Chem.， 53，277(1989)]、pGEL1[Proc.Natl.Acad.Sci.，USA， 82，4306(1985)]、pBluescriptII SK(+)、pBluescript II KS(-)(Stratagene公司生产)、pTrS30[由大肠杆菌JM109/pTrS30(FERM BP-5407)制备]、pTrS32[由大肠杆菌JM109/pTrS32(FERM BP-5408)制备]、pPAC31(WO98/12343)、pUC19[Gene， 33，103(1985)]、pSTV28(Takara Bio公司生产)、pUC118(Takara Bio公司生产)、pPA1(特开昭63-233798)、pWH1520(MoBiTec社制)、pCS299P(WO 00/63388)、pVLT31[Gene， 123，17(1993)]和pIJ702(Genetic Manipulation of Streptomyces：aLaboratory Manual：John Innes Foundation)等。

作为启动子只要是可在大肠杆菌等宿主细胞内发挥功能的，无论那一种都可以，例如 trp启动子(P_trp)、 lac启动子(P_lac)、P_L启动子、P_R启动子、P_SE启动子等来自大肠杆菌或噬菌体等的启动子、SPO1启动子、SPO2启动子、penP启动子等。也可以使用人为设计使P_trp改变为两个串联的启动子、 tac启动子、lacT7启动子、letI启动子那样的启动子等。

另外也可以使用用于在属于杆菌属的微生物中表达的 xylA启动子[Appl.Microbiol.Biotechnol.， 35，594-599(1991)]、用于在属于棒杆菌(Corynebacterium)属的微生物中表达的P54-6启动子[Appl.Microbiol.Biotechnol.， 53，674-679(2000)]、用于在属于假单孢菌属的微生物中表达的tac启动子[Gene， 123，17-24(1993)]、用于在属于链霉菌属的微生物中表达的xylA启动子(Genetic Manipulation of Streptomyces：a LaboratoryManual：John Innes Foundation)等。

最好是使用将作为核糖体结合序列的Shine-Dalgarno序列与起始密码子之间调节到适当的距离(例如6～18碱基)的质粒。

在使本发明的制备方法中使用的DNA与表达载体结合的重组DNA中，不一定需要转录终止序列，但最好是在紧靠结构基因的下面配置转录终止序列。

作为这样的重组DNA，例如pPE43。

作为原核生物，如属于埃希氏菌属、沙雷氏菌( Serratia)属、杆菌属、短杆菌( Brevibacterium)属、棒杆菌( Corynebacterium)属、微杆菌属( Microbacterium)、假单胞菌( Pseudomonas)属、土壤杆菌( Agrobacterium)属、脂环酸杆菌属( Alicyclobacillus)、鱼腥蓝细菌( Anabaena)属、组囊蓝细菌( Anacvstis)属、节杆菌( Arthrobacter)属、固氮菌( Azotobacter)属、着色菌( Chromatium)属、欧文氏菌( Erwinia)属、甲基杆菌( Methylobacterium)属、席蓝细菌( Phormidium)属、红细菌( Rhodobacter)属、红假单胞菌( Rhodopseudomonas)属、红螺菌( Rhodospirillum)属、栅藻( Scenedesmus)属、链霉菌( Streptomyces)属、聚球蓝细菌( Synechoccus)属、发酵单胞菌( Zymomonas)属等的微生物，例如，大肠杆菌XL1-Blue，大肠杆菌XL2-Blue，大肠杆菌DH1，大肠杆菌DH5α，大肠杆菌MC1000，大肠杆菌KY3276，大肠杆菌W1485，大肠杆菌JM109，大肠杆菌HB101，大肠杆菌No.49，大肠杆菌W3110，大肠杆菌NY49，大肠杆菌MP347，大肠杆菌NM522，杆草芽孢杆菌ATCC33712，巨大芽孢杆菌，芽孢杆菌属(Bacillussp.)种FERM BP-6030，、解淀粉芽孢杆菌( Bacillus amyloliquefaciens)、凝结芽孢杆菌( Bacilluscoagulans)、地衣芽孢杆菌( Bacillus licheniformis)、短小芽孢杆菌( Bacillus pumilus)、产氨短杆菌( Brevibacterium ammoniagenes)、未成熟短杆菌(Brevibacterium immariophilum)ATCC14068，解糖短杆菌(Brevibacterium saccharolyticum)ATCC14066，黄色短杆菌(Brevibacterium flavum)ATCC14067，产乳酸棒杆菌(Brevibacterium lactofermentum)ATCC13869，谷氨酸棒杆菌(Corynebacterium glutamicum)ATCC13032，谷氨酸棒杆菌ATCC14297，嗜乙酰乙酸棒杆菌(Corynebacterium acetoacidophilum)ATCC13870，嗜氨微杆菌(Microbacterium ammoniaphilum)ATCC15354，无花果沙雷氏菌(Serratia ficaria)，居泉沙雷氏菌(Serratiafonticola)，液化沙雷氏菌(Serratia liquefaciens)，粘质沙雷氏菌(Serratia marcescens)，假单胞菌属种(Pseudomonas sp.)D-0110，放射形土壤杆菌(Agrobacterium radiobacter)，发根土壤杆菌(Agrobacterium rhizogenes)，悬钩子土壤杆菌(Agrobacteriumrubi)，柱孢鱼腥蓝细菌(Anabaena cylindrica)，桶形鱼腥蓝细菌(Anabaena doliolum)，水华鱼腥蓝细菌(Anabaena flos-aquae)，金黄节杆菌(Arthrobacter aurescens)，柠檬节杆菌(Arthrobactercitreus)，球形节杆菌(Arthrobacter globformis)，Arthrobacterhydrocarbonglutamicus，迈索尔节杆菌(Arthrobacter mysorens)，烟草节杆菌(Arthrobacter nicotianae)，石蜡节杆菌(Arthrobacterparaffineus)，原玻璃蝇节杆菌(Arthrobacter protophormiae)，玫瑰色石蜡节杆菌(Arthrobacter roseoparaffinus)，硫磺节杆菌(Arthrobacter sulfureus)，产脲节杆菌(Arthrobacterureafaciens)，巴氏着色菌(Chromatium buderi)，微温着色菌(Chromatium tepidum)，酒色着色菌(Chromatium vinosum)，沃氏着色菌(Chromatium warmingii)，Chromatium fluviatile，噬夏孢欧文氏菌(Erwinia uredovora)，胡萝卜软腐欧文氏菌(Erwiniacarotovora)，菠萝欧文氏菌(Erwinia ananas)，草生欧文氏菌(Erwinia herbicola)，Erwinia punctata，Erwinia terreus，罗得西亚甲基杆菌(Methylobacterium rhodesianum)，扭脱甲基杆菌(Methylobacterium extorquens)，席蓝细菌属种(Phormidiums p.)ATCC29409，荚膜红细菌(Rhodobacter capsulatus)，类球红细菌(Rhodobacter sphaeroides)，生芽红假单胞菌(Rhodopseudomonas blastica)，海红菌(Rhodopseudomonas marina)，血色红假单孢菌(Rhodopseudomonas palustris)，深红红螺菌(Rhodospirillum rubrum)，需盐红螺菌(Rhodospirillumsalexigens)，盐场红螺菌(Rhodospirillum salinarium)，产二素链霉菌(Streptomyces ambofaciens)，金霉素链霉菌(Streptomycesaureofaciens)，金色链霉菌(Streptomyces aureus)，杀真菌素链霉菌(Streptomyces fungicidicus)，灰产色链霉菌(Streptomycesgriseochromogenes)，灰色链霉菌(Streptomyces griseus)，浅青紫链霉菌(Streptomyces lividans)，橄榄灰链霉菌(Streptomycesolivogriseus)，枝链霉菌(Streptomyces rameus)，田无链霉菌(Streptomyces tanashiensis)，酒红链霉菌(Streptomyces vinaceus)和运动发酵单胞菌(Zymomonas mobilis)等。作为理想的原核生物，如属于埃希氏菌属、沙雷氏菌属、杆菌属、短杆菌属、棒杆菌属、假单孢菌属或链霉菌属等的细菌、例如上述的属于埃希氏菌属、沙雷氏菌属、杆菌属、短杆菌属、棒杆菌属、假单孢菌属或链霉菌属等细菌，作为更理想的细菌，如大肠杆菌、谷氨酸棒杆菌、产氨棒杆菌、乳酸发酵棒杆菌、黄色棒杆菌、Corynebacterium efficiens、枯草芽孢杆菌、巨大芽孢杆菌、粘质沙雷氏菌、恶臭假单胞菌、铜绿假单胞菌、天蓝色链霉菌或浅青紫链霉菌，特别优选大肠杆菌。

当使用酵母菌株作为宿主细胞时，作为表达载体可以使用例如YEp13(ATCC37115)、YEp24(ATCC37051)、YCp50(ATCC37419)、pHS19、pHS15等。

作为启动子，只要是在酵母菌株中发挥作用的启动子，可以使用任一种，例如PHO5启动子、PGK启动子、GAP启动子、ADH启动子、gal1启动子、gal10启动子、热休克多肽启动子、MFα1启动子、CUP1启动子等启动子。

作为宿主细胞，如属于酵母( Saccharomyces)属、裂殖酵母( Schizosaccharomyces)属、克鲁维酵母( Kluyveromyces)属、丝孢酵母( Trichosporon)属、许旺酵母( Schwanniomyces)属、毕赤酵母( Pichia)属、或假丝酵母( Candida)属等的酵母菌株，具体的例如酿酒酵母( Saccharomyces cerevisiae)、粟酒裂殖糖酵母( Schizosaccharomyces pombe)、乳克鲁维氏酵母( Kluyveromyces lactis)、茁芬丝孢酵母( Trichosporon pullulans)、河岸许旺氏酵母( Schwanniomyces alluvius)、巴斯德毕赤氏酵母( Pichia pastoris)、产朊假丝酵母( Candida utilis)等。

作为重组DNA的导入方法，只要是将DNA导入酵母的方法，可以使用任一种，例如电穿孔法[Methods Enzymel.， 194，182(1990)]、原生质体法[Proc.Natl.Acad.Sci.，USA， 81，4889(1984)]、乙酸锂法[J.Baeteriol.， 153，163(1983)]等。

当使用动物细胞作为宿主时，作为表达载体，可以使用例如pcDNAI、pcDM8(由Funakoshi公司销售)、pAGE107(特开平3-22979)、pAS3-3(特开平2-227075)、pCDM8[Nature， 329,840(1987)]、pcDNAI/Amp(Invitrogen公司生产)、pREP4(Invitrogen公司生产)、pAGE103[J.Biochem， 101，1307(1987)]、pAGE210、pAMo、pAMoA等。

作为启动子，只要是在动物细胞中行使功能的，可以使用任一种，例如巨细胞病毒(CMV)的IE(immediate early)基因的启动子、SV40的初期启动子或金属硫因的启动子、逆病毒的启动子、热休克启动子、SRα启动子等。另外也可以将人CMV的IE基因的增强子与启动子一起使用。

作为宿主细胞，如小鼠骨髓瘤细胞、大鼠骨髓瘤细胞、小鼠杂交瘤细胞、人的细胞Namalwa细胞或Namalwa KJM-1细胞、人胎儿肾脏细胞、人白血病细胞、African green monkey肾脏细胞、中国仓鼠细胞的CHO细胞、HBT5637(特开昭63-299)等。

作为小鼠骨髓瘤细胞，如SP2/0、NSO等、作为大鼠骨髓瘤细胞，如YB2/0等、作为人胎儿肾脏细胞，如HEK293(ATCC CRL-1573)、作为人白血病细胞，如BALL-1等、作为African green monkey肾脏细胞，如COS-1、COS-7等。

作为重组DNA的导入方法，只要是可将DNA导入动物细胞的方法，可以使用任一种，例如电穿孔法[Cytotechnology， 3，133(1990)]、磷酸钙法(特开平2-227075)、脂质转染法[Proc.Natl.Acad.Sci.，USA， 84，7413(1987)]、Virology， 52，456(1973)所述的方法等。

当使用昆虫细胞作为宿主时，通过例如Baculovirus ExpressionVectors，A Laboratory Manual，W.H.Freeman and Company，NewYork(1992)、Current Protocols in Molecular Biology、MolecularBiology，A Laboratory Manual、Bio/Technology， 6，47(1988)等所述的方法可以生产蛋白质。

即，将重组基因导入载体和杆状病毒一起导入昆虫细胞，在昆虫细胞培养上清中得到重组病毒后，再使重组病毒感染昆虫细胞，可以生产蛋白质。

作为在该方法可使用的基因导入载体，例如pVL1392、pVL1393、pBlueBacIII(都是Invitrogen公司生产)等。

作为杆状病毒，可以使用例如感染夜盗蛾科昆虫的病毒Autographa californica nuclear polyhedrosis virus等。

作为昆虫细胞，可以使用 Spodoptera frugiperda的卵巢细胞、Trichoplusia ni的卵巢细胞、来自蚕卵巢的培养细胞等。

作为 Spodoptera frugiperda的卵巢细胞，如Sf9、Sf21(杆状病毒表达载体实验手册)等、作为 Trichoplusia ni的卵巢细胞，如High5、BTI-TN-5B1-4(Invitrogen公司生产)等、作为来自蚕卵巢的培养细胞，如 Bombyx mori N4等。

作为用于制备重组病毒，将上述重组基因导入载体与上述杆状病毒一起导入昆虫细胞的导入方法，例如磷酸钙法(特开平2-227075)、脂质转染法[Proc.Natl.Acad.Sci.，USA， 84，7413(1987)]等。

当使用植物细胞作为宿主细胞时，作为表达载体，例如Ti质粒、烟草花叶病毒载体等。

作为启动子，只要是可在植物细胞中行使功能的，可以使用任一种，例如花椰菜花叶病毒(CaMY)的35S启动子、水稻肌动蛋白1启动子等。

作为宿主细胞，如烟草、马铃薯、西红柿、人参、大豆、油菜、紫花苜蓿、水稻、小麦、大麦等植物细胞等。

作为重组载体的导入方法，只要是可将DNA导入植物细胞的方法，可使用任一种，例如使用土壤杆菌( Agrobacterium)的方法(特开昭59-140885、特开昭60-70080、WO94/00977)、电穿孔法(特开昭60-251887)、使用基因枪(particlegun)的方法(日本专利第2606856、日本专利第2517813)等。

当通过酵母、动物细胞、昆虫细胞或植物细胞进行表达时，可以获得生产添加了糖或糖链的蛋白质的细胞。

(2)作为本发明的制备方法中使用的微生物，如在通过上述(1)的方法制备的微生物中，1种以上的肽酶和1种以上的具有肽转运活性的蛋白质(以下，略为肽转运蛋白质)的活性低下或丧失的微生物、或3种以上的肽酶的活性低下或丧失的微生物。

该微生物例如可以(a)通过上述(1)的方法赋予1种以上肽酶和1种以上肽转运蛋白质的功能低下或丧失的微生物、或3种以上肽酶的功能低下或丧失的微生物具有生产具有生成二肽活性的蛋白质能力或生产具有多磷酸激酶活性的蛋白质的能力的方法，或(b)使通过上述(1)的方法能够制备的具有生产具有生成二肽活性的蛋白质能力或生产具有多磷酸激酶活性的蛋白质能力的微生物的a)1种以上的肽酶和1种以上肽转运蛋白质、或b)3种以上肽酶的功能低下或丧失的方法等也可取得。

作为1种以上的肽酶和1种以上的肽转运蛋白质的活性低下或丧失的微生物，只要是该微生物能正常生长繁殖，如任意1种以上的肽酶和任意1种以上的肽转运蛋白质的活性低下或丧失的微生物，优选1种以上9种以下，更优选1种以上7种以下，再优选1种以上4种以下的肽酶的活性低下或丧失，而且优选1种以上5种以下，更优选1种以上3种以下，再优选1种以上2种以下，特别优选1种的肽转运蛋白质活性低下或丧失的微生物。

作为该微生物，更具体讲，在该微生物的基因组DNA上存在的编码肽酶的基因(以下，略为肽酶基因)和编码肽转运蛋白质的基因(以下，略为肽转运蛋白质基因)中，如在1种以上的肽酶基因的碱基序列和1种以上肽转运蛋白质基因的碱基序列中，由于缺失该碱基序列的全部或一部，或由于在该碱基序列中存在碱基的置换或添加，该肽酶和该肽转运蛋白质的活性低下或丧失的微生物。

所谓肽酶的活性低下指的是与上述的碱基没有缺失、置换或添加的基因编码的肽酶相比，肽分解活性变低，通常低至80％以下，优选50％以下，更优选30％以下，再优选20％以下，特别优选10％以下，最好优选5％以下。

微生物的肽分解活性可以使作为底物的肽和微生物菌体在水性介质中共存，进行肽分解反应后，通过众所周知的方法、例如使用HPLC等的分析法对残存的肽量进行定量测定。

作为上述肽酶，只要是具有肽分解活性的蛋白质就可以，优选二肽分解活性高的蛋白质、更优选二肽酶。

作为更具体的肽酶，例如存在于大肠杆菌的具有序列号43表示的氨基酸序列的PepA、具有序列号44表示的氨基酸序列的PepB、具有序列号45表示的氨基酸序列的PepD、具有序列号46表示的氨基酸序列的PepN、PepP[GenBank accession no.(以下，略为GenBank)AAC75946]、PepQ(GenBank AAC76850)、PepE(GenBank AAC76991)、PepT(GenBank AAC74211)、Dcp(GenBank AAC74611)和IadA(GenBankAAC77284)等、存在于枯草芽孢杆菌的AmpS(GenBank AF012285)、PepT(GenBank X99339)、YbaC(GenBank Z99104)、YcdD(GenBankZ99105)、YjbG(GenBank Z99110)、YkvY(GenBank Z99111)、YqjE(GenBank Z99116)、YwaD(GenBank Z99123)等、存在于谷氨酸棒杆菌的具有BAB97732、BAB97858、BAB98080、BAB98880、BAB98892、BAB99013、BAB99598和BAB99819(都是日本DNA数据库的登录号)表示的氨基酸序列的蛋白质等，作为二肽酶，如具有序列号43～46表示的氨基酸序列的PepA、PepB、PepD和PepN、以及PepQ、PepE、IadA。另外与序列号43～46中的任一个氨基酸序列具有80％以上、优选90％以上、更优选95％以上同源性，而且具有肽酶活性的蛋白质也可以作为二肽分解活性高的蛋白质。氨基酸序列或碱基序列的同源性可以使用上述的BLAST和FASTA等测定。

而所谓肽转运蛋白质的活性低下指的是与由上述的没有缺失、置换或添加碱基的基因编码的肽转运蛋白质相比，肽转运活性变低，通常指的是降低到80％以下，优选50％以下，更优选30％以下，再优选20％以下，特别优选10％以下，最好优选5％以下。

微生物的肽转运活性可以通过使作为底物的肽和微生物菌体共存于水性介质中进行肽转运反应后，利用众所周知的方法，例如使用HPLC等分析法对残存于水性介质中的肽量进行定量进行测定。

上述肽转运蛋白质是由染色体DNA上形成操纵子的基因编码的蛋白质，只要是在细胞膜上形成复合体后表达肽转运活性的蛋白质，以及作为单独的蛋白质具有肽转运活性的蛋白质等参与微生物的肽转运的任一种蛋白质都可以，优选二肽转运活性高的蛋白质。

作为更具体的肽转运蛋白质，例如存在于大肠杆菌的具有序列号47表示的氨基酸序列的DppA、具有序列号48表示的氨基酸序列的DppB、具有序列号49表示的氨基酸序列的DppC、具有序列号50表示的氨基酸序列的DppD、具有序列号51表示的氨基酸序列的DppF、OppA(GenBank AAC76569)、OppB(GenBank AAC76568)、OppC(GenBankAAC76567)、OppD(GenBank AAC76566)、OppF(GenBank AAC76565)、YddO(GenBank AAC74556)、YddP(GenBank AAC74557)、YddQ(GenBankAAC745 58)、YddR(GenBank AAC74559)、YddS(GenBank AAC74560)、YbiK(GenBank AAC73915)、MppA(GenBank AAC74411)、SapA(GenBankAAC74376)、SapB(GenBank AAC74375)、SapC(GenBank AAC74374)、SapD(GenBank AAC4373)、和SapF(GenBank AAC74372)等、存在于枯草芽孢杆菌的DppA(GenBank CAA40002)、DppB(GenBank CAA40003)、DppC(GenBank CAA40004)、DppD(GenBank CAA40005)、DppE(GenBankCAA40006)、OppA(GenBank CAA39787)、OppB(GenBank CAA39788)、OppC(GenBank CAA39789)、OppD(GenBank CAA39790)、OppF(GenBankCAA39791)、AppA(GenBank CAA62358)、AppB(GenBank CAA62359)、AppC(GenBank CAA62360)、AppD(GenBank CAA62356)、AppF(GenBankCAA62357)、YclF(GenBank CAB12175)和YkfD(GenBank CAB13157)等、存在于谷氨酸棒杆菌的具有BAB99048、BAB99383、BAB99384、BAB99385、BAB99713、BAB99714、BAB99715、BAB99830、BAB99831、BAB99832(都是日本DNA数据库的登录号)表示的氨基酸序列的蛋白质等，另外作为肽转运活性高的蛋白质，如具有序列号47～51表示的氨基酸序列的DppA、DppB、DppC、DppD、DppF和与它们中的任一个表示的氨基酸序列具有80％以上、优选90％以上、更优选95％以上同源性的蛋白质也可作为肽转运活性高的肽转运蛋白质。

上述氨基酸序列的同源性可以使用上述的BLAST或FASTA等程序测定。

作为3种以上肽酶的活性低下或丧失的微生物，只要是该微生物能正常生长繁殖，如任意3种以上肽酶的活性低下或丧失的微生物，优选3种以上9种以下，更优选3种以上6种以下，再优选3种或4种肽酶的活性低下或丧失的微生物。

作为具体的肽酶，如存在于上述的大肠杆菌、枯草芽孢杆菌和谷氨酸棒杆菌的肽酶和二肽酶。而由与序列号43～46中的任一个氨基酸序列有80％以上、优选90％以上、更优选95％以上同源性的氨基酸序列构成、而且具有肽酶活性的蛋白质也可以作为二肽分解活性高的蛋白质。

肽酶和肽转运蛋白质的活性低下或丧失的微生物只要是能够取得该微生物的方法，其取得方法没有限制，例如通过在以下所示的微生物的染色体DNA的肽酶基因或肽转运蛋白质基因导入碱基的缺失、置换或添加的方法可以取得。

作为在微生物的染色体DNA的基因导入碱基缺失、置换或添加的方法，如利用同源重组的方法。作为利用一般的同源重组的方法，如使用将导入了碱基缺失、置换或添加的突变基因与在希望导入碱基缺失等的宿主细胞内含有不能自我复制的抗药(性)基因的质粒DNA连接制作的同源重组用质粒的方法。

通过常规方法将该同源重组用质粒导入宿主细胞后，以抗药(性)作为指标选择通过同源重组在染色体DNA上转运了该同源重组用质粒的转化株。通过将得到的转化株于不含有该药物的培养基中培养数小时～1天后，涂布于含有该药物的琼脂培养基和不含有该药物的琼脂培养基，选择在前者培养基中不生长发育，而在后者培养基能够繁殖株，可以取得在染色体DNA上发生第2次同源重组的株。通过测定染色体DNA上的导入了缺失等的基因存在区域的碱基序列，可以确认染色体DNA上目的基因中导入了碱基的缺失、置换或添加。

作为能够通过上述方法在染色体DNA上的目的基因导入碱基的缺失、置换或添加的微生物，例如属于埃希氏菌属、杆菌属或棒杆菌属的微生物。

而作为利用同源重组向多个基因有效导入碱基的缺失、置换或添加的方法，如使用直链DNA的方法。

具体来说，是使含有希望导入碱基缺失、置换或添加的基因的直链DNA转运到细胞内，在染色体DNA与导入的直链DNA之间发生同源重组的方法。本方法只要是可有效转运直链DNA的微生物，也可以适用于任一种微生物，作为理想的微生物，如属于埃希氏菌属或杆菌属的微生物、更优选大肠杆菌、再优选表达来自λ噬菌体的重组蛋白质组(Red重组系)的大肠杆菌。

作为表达λRed重组系的大肠杆菌，如带有含λRed重组系基因的质粒DNA pKD46[可从大肠杆菌基因储备中心(美国耶鲁大学)获得]的大肠杆菌JM101株等。

作为可用于同源重组的DNA，如

(a)在抗药(性)基因的两端含有与位于作为碱基的缺失、置换或添加的导入对象的染色体DNA上区域两端外侧的DNA具有同源性的DNA的直链DNA、

(b)直接连接了与位于作为碱基的缺失、置换或添加的导入对象的染色体DNA上区域两端外侧的DNA具有同源性的DNA的直链DNA、

(c)在具有抗药(性)基因和能够用于负选择的基因的DNA的两端处含有与位于作为碱基的缺失、置换或添加的导入对象的染色体DNA上区域的两端外侧的DNA具有同源性的DNA的直链DNA、

(d)在上述(a)的直链DNA中，在位于抗药(性)基因和与位于染色体DNA上的区域的两端外侧的DNA具有同源性的DNA之间，还含有来自酵母的Flp重组酶〔Proc.Natl.Acad.Sci.USA.， 82，5875(1985)〕识别的碱基序列的DNA。

作为抗药(性)基因，只要是对于宿主微生物表现出敏感性的药物，赋予抗药(性)的抗药(性)基因，也可以使用任一种抗药(性)基因。作为宿主微生物使用大肠杆菌时，作为抗药(性)基因，例如，卡那霉素抗性基因、氯霉素抗性基因、庆大霉素抗性基因、大观霉素抗性基因、四环素抗性基因和氨苄青霉素抗性基因等。

所谓能够用于负选择的基因指的是当在宿主微生物中使该基因表达时，在一定培养条件下，使该微生物致死的基因，作为该基因，例如来自属于杆菌属的微生物的 sacB基因〔Appl.Environ.Microbiol.， 59，1361-1366(1993)〕、和来自属于埃希氏菌属的微生物的 rpsL基因〔Genomics， 72，99-104(2001)〕等。

与存在于上述的直链DNA的两末端的、位于成为染色体DNA上置换或缺失的导入对象的区域两端外侧的DNA具有同源性的DNA，在直链DNA中被配置在与染色体DNA上的方向相同的方向，其长度优选10bp～100bp左右，更有效优选bp～50bp左右、进一步优选30～40bp左右。

所谓来自酵母的Flp重组酶识别的碱基序列只要是该蛋白质识别、催化同源重组的碱基序列，没有特别限定，优选具有序列号64表示的碱基序列的DNA、和具有在该DNA中缺失、置换或添加了1个～数个碱基的碱基序列、而且来自酵母的Flp重组酶识别、催化同源重组的碱基序列的DNA。

所谓具有同源性是上述直链DNA在染色体DNA上的目的区域具有同源重组发生程度的同源性，作为具体的同源性，如80％以上、优选90％以上、更优选95％以上、再优选100％的同源性。

上述碱基序列的同源性可以使用上述的BLAST或FASTA等程序测定。

上述直链DNA片段可以通过PCR制作。另外在质粒上构建了含有上述直链DNA的DNA后，经限制酶处理也可以得到目的直链DNA。

作为在微生物的染色体DNA中导入碱基的缺失、置换或添加的方法，如以下的方法1～4。

方法1：将上述(a)或(d)的直链DNA导入宿主微生物，以抗药(性)为指标选择通过同源重组该直链DNA被插入到染色体DNA上的转化株的方法。

方法2：向通过上述方法1取得的转化株导入上述(b)的直链DNA，通过消除经该方法插入到染色体DNA上的药物基因，使微生物的染色体DNA上的区域置换或缺失的方法。

方法3：

[1]将上述(c)的直链DNA导入宿主微生物，以抗药(性)为指标选择通过同源重组该直链DNA被插入到染色体DNA上的转化株、

[2]合成在与染色体DNA上的方向同一方向连接了与位于作为染色体DNA上的置换或缺失对象区域两端外侧的DNA具有同源性的DNA的DNA，导入到上述[1]中得到的转化株，

[3]在可用于负选择的基因表达的条件下，对进行了上述[2]操作的转化株进行培养，选择在该培养条件下可生长繁殖的株作为从染色体DNA上削除抗药(性)基因和可用于负选择的基因的菌株的方法。

方法4：

[1]将上述(d)的直链DNA导入宿主微生物，以抗药(性)为指标选择通过同源重组该直链DNA被插入到染色体DNA上的转化株、

[2]向上述[1]中得到的转化株导入Flp重组酶基因表达质粒，使该基因表达后，取得对上述[1]中使用的药物有敏感性的菌株的方法。

作为将在上述方法中使用的直链DNA导入宿主微生物的方法，只要是将DNA导入该微生物的方法，可以使用任一种方法，例如使用钙离子的方法〔Proc.Natl.Acad.Sci.，USA， 69，2110(1972)〕、原生质体法(特开昭63-248394)、电穿孔法〔Nucleic Acids Res.， 16，6127(1988)〕等。

通过使用转运希望插入到在方法2或方法3[2]中使用的直链DNA中的该DNA的中央部附近染色体DNA上的任意基因的直链DNA，在削除抗药(性)基因等的同时，可以将任意基因插入到染色体DNA上。

就上述方法2～4来说，由于是在最终得到的转化株的染色体DNA上不保留抗药(性)基因和可用于负选择的基因等外来基因的方法，所以通过使用同一抗药(性)基因和可用于负选择的基因，反复进行该方法的操作，容易制备在染色体DNA上的位置不同的2个以上区域带有碱基的缺失、置换或添加的微生物。

5.可用于本发明的蛋白质的制备

可以通过将用上述4的方法得到的转化体在培养基中进行培养，使可用于本发明的蛋白质在培养物中生成、蓄积，从该培养物收集该蛋白质，制备该蛋白质。

作为用于制备可用于本发明的蛋白质的上述转化体的宿主，可以是原核生物和酵母等微生物、动物细胞、昆虫细胞等或植物细胞等中的任一种，优选微生物、更优选原核生物、进一步优选细菌、特别优选属于埃希氏菌属的细菌、最好优选大肠杆菌。

将上述转化体在培养基中进行培养的方法可以根据宿主细胞的培养中使用的通常的方法进行。

将大肠杆菌等原核生物和酵母等真核生物作为宿主细胞，对得到的微生物的转化体进行培养的培养基，只要是含有该微生物可利用的碳源、氮源、无机盐类等、可有效进行转化体的培养的培养基，可以使用天然培养基、合成培养基中的任一种。

作为碳源，只要是该微生物可利用的就可以，可以使用葡萄糖、乳糖、蔗糖、含有这些糖的糖蜜、淀粉或淀粉水解物等碳水化合物、醋酸、丙酸等有机酸、乙醇、丙醇等醇类等

作为氮源可以使用氨、氯化铵、硫酸铵、醋酸铵、磷酸铵等无机酸或有机酸的铵盐、其它的含氮化合物、以及胨、肉提取物、酵母提取物、玉米浸渍液、酪蛋白水解物、大豆粕和大豆粕水解物、各种发酵菌体和其它消化物等。

作为无机盐，可以使用磷酸二氢钾、磷酸氢二钾、磷酸镁、硫酸镁、氯化钠、硫酸亚铁、硫酸锰、硫酸铜、碳酸钙等。

培养在通常振荡培养或深部通气搅拌培养等好氧条件下进行。培养温度为15～40℃比较好、培养时间通常为5小时～7日间。培养中pH保持3.0～9.0。pH的调整使用无机或有机的酸、碱性溶液、尿素、碳酸钙、氨等进行。

另外根据培养中需要，也可以向培养基中添加氨苄青霉素或四环素等抗生素。

当对用使用诱导性的启动子作为启动子的表达载体转化的微生物进行培养时，根据需要，也可以向培养基中添加诱导物。例如，对用使用lac启动子的表达载体转化的微生物进行培养时，可以添加异丙基-β-D-硫代半乳糖苷等，当用使用 trp启动子的表达载体转化的微生物进行培养时，也可以向培养基添加吲哚丙烯酸等。

作为对以动物细胞作为宿主得到的转化体进行培养的培养基，可以使用一般使用的RPMI1640培养基[J.Am.Med.Assoc.， 199，519(1967)]、Eagle的MEM培养基[Science， 122，501(1952)]、DMEM培养基[Virology， 8，396(1959)]、199培养基[Proc.Soc.Biol.Med.， 73，1(1950)]或在这些培养基中添加了胎牛血清等的培养基等。

培养通常在pH6～8、25～40℃、5％CO₂存在下等的条件下进行1～7天。

另外根据培养中需要，也可以在培养基中添加卡那霉素、青霉素、链霉素等抗生素。

作为对以昆虫细胞作为宿主得到的转化体进行培养的培养基，可以使用一般使用的TNM-FH培养基(PharMingen公司生产)、Sf-900IISFM培养基(Life Technologies公司生产)、ExCell400、ExCell405[都是JRH BIOSCIENCES公司生产]、Grace′s Insect Medium[Nature， 195，788(1962)]等。

培养通常在pH6～7、25～30℃等的条件下进行1～5天。

另外根据培养中需要，也可以在培养基中添加庆大霉素等抗生素。

以植物细胞作为宿主得到的转化体，可以以细胞的形式，或使其分化为植物的细胞或器官后培养。作为培养该转化体的培养基，可以使用通常使用的Murashige-Skoog(MS)培养基、White培养基、或向这些培养基中添加了生长素、细胞激动素等植物激素的培养基等。

培养通常在pH5～9、20～40℃条件下进行3～60天。

另外根据培养中需要，也可以在培养基中添加卡那霉素、潮霉素等抗生素。

如上所述，可以根据常规培养方法培养含有将用于本发明的DNA连接到表达载体的重组DNA的微生物、昆虫细胞、动物细胞或者来自植物细胞的转化子，生成、蓄积用于本发明的蛋白质，从该培养物收集该蛋白质，制备该蛋白质。

作为本发明中可使用的蛋白质的生产方法，有使蛋白质在宿主细胞内生产的方法、分泌到宿主细胞外的方法、或在宿主细胞外膜上生产的方法，可以根据使用的宿主细胞不同和使生产的蛋白质的构造发生不同变化选择上述方法。

当本发明中使用的蛋白质在宿主细胞内或宿主细胞外膜上生产时，通过利用Paulson等人的方法[J.Biol.Chem.， 264，17619(1989)]、Lowe等人的方法[Proc.Natl.Acad.Sci.，USA， 86，8227(1989)、Genes Develop.， 4，1288(1990)]、或特开平05-336963、WO94/23021等所述的方法，可以使该蛋白质有效地分泌在宿主细胞外。

即，通过使用基因重组的手法，以在紧接在含有本发明使用的蛋白质的活性部位的蛋白质前面添加信号肽的形式使该蛋白质生产，可以有效地使该蛋白质分泌到宿主细胞外。

另外根据特开平2-227075所述的方法，利用使用了二氢叶酸还原酶基因等的基因扩增系也可以使产量上升。

另外，通过使导入基因的动物或植物的细胞再分化，制备导入了基因的动物个体(转基因非人动物)或植物个体(转基因植物)，使用这些个体也可以制备本发明的蛋白质。

当生产本发明使用的蛋白质的转化体为动物个体或植物个体时，根据通常的方法，通过进行饲养或栽培使该蛋白质生成、蓄积，从该动物个体或植物个体收集该蛋白质，可以制备该蛋白质。

作为使用动物个体制备可用于本发明的蛋白质的方法，例如根据众所周知的方法[Am.J.Clin.Nutr.， 63，639S(1996)、Am.J.Clin.Nutr.， 63，627S(1996)、Bio/Technology， 9，830(1991)]在导入基因制备的动物中生产该蛋白质的方法。

对于动物个体的情况，例如通过对导入本发明使用的DNA的转基因的非人动物进行饲养，使可用于本发明的蛋白质在该动物中生成、蓄积，从该动物中收集该蛋白质，可以制备该蛋白质。作为该动物中使该蛋白质生成、蓄积的场所，例如该动物的奶(特开昭63-309192)、卵等。作为此时可使用的启动子，只要是可在动物中行使功能的启动子，可以使用任一个，最好使用例如乳腺细胞特异的启动子α酪蛋白启动子、β酪蛋白启动子、β乳球蛋白启动子、乳清酸性蛋白启动子等。

作为使用植物个体制备本发明的蛋白质的方法，例如根据众所周知的方法[组织培养， 20(1994)、组织培养， 21(1995)、TrendsBiotechnol.， 15，45(1997)]通过对导入了编码可用于本发明的蛋白质的DNA的转基因植物进行栽培，使该蛋白质在该植物中生成、蓄积，从该植物中收集该蛋白质，生产该蛋白质的方法。

作为对使用生产可用于本发明的蛋白质的转化体制备的该蛋白质进行分离纯化的方法，可以使用通常的酶的分离纯化法。

例如，当可用于本发明的蛋白质以在细胞内溶解状态生产时，培养结束后，通过对细胞离心分离，进行收集，悬浮于水系缓冲液后，通过超声波破碎机、弗氏细胞压碎器、Manton-Gaulin匀浆器、Dynomill等将细胞破碎，得到无细胞提取液。

从通过对该无细胞提取液离心分离得到的上清通过单独或组合使用通常的酶的分离纯化法、速溶剂提取法、通过硫铵等的盐析法、脱盐法、通过有机溶剂的沉淀法、使用二乙氨基乙基(DEAE)-纤维素、DIAION HPA-75(三菱化成公司生产)等树脂的阴离子交换层析法、使用S-Sepharose FF(Pharmacia公司生产)等树脂的阳离子交换层析法、使用丁基纤维素、苯基纤维素等的树脂的疏水层析法、使用分子筛的凝胶过滤法、亲和层析法、层析聚集法、等电聚焦电泳等的电泳法等的手法，可以得到纯化标准品。

另外当该蛋白质以在细胞内形成包涵体形式生产时，同样收集细胞进行破碎，使用通常的方法从通过离心分离得到的沉淀级分收集该蛋白质后，将该蛋白质的包涵体用蛋白质变性剂溶化。将该溶化液稀释、或透析到不含有蛋白质变性剂或蛋白质变性剂的浓度稀到蛋白质不变性的程度的溶液，使该蛋白质构成正常的立体构造后，通过与上述同样的分离纯化法可以得到纯化标准品。

当可用于本发明的蛋白质或其糖修饰体等衍生物分泌到细胞外时，可以在培养上清收集该蛋白质或它的糖添加体等衍生物。

即，通过与上述同样的离心分离等手法对该培养物进行处理，取得可溶性级分，使用与上述同样的分离纯化法从该可溶性级分可以得到纯化标准品。

作为象上述那样取得的蛋白质，例如由序列号1～8、37和38中的任一个表示的氨基酸序列构成的蛋白质。

另外，当可用于本发明的蛋白质以与其它蛋白质的融合蛋白质形式生产时，利用使用对融合的蛋白质具有亲和性的物质的亲和层析也可以进行纯化。

作为使其融合的蛋白质，如β-半乳糖苷酶、蛋白A、蛋白A的免疫球蛋白G结合区域、氯霉素·转乙酰酶、聚(Arg)、聚(Glu)、蛋白G、麦芽糖结合蛋白质、谷胱甘肽S-转移酶、聚组氨酸链(His-tag)、S肽、DNA结合蛋白质结构域、Tac抗原、硫氧还蛋白、绿色荧光蛋白、FLAG肽、和任意的抗体的表位等〔山川彰夫，实验医学， 13，469-474(1995)〕。

作为对上述可用于融合的蛋白质具有亲和性的物质，如识别β-半乳糖苷酶、蛋白A、蛋白A的免疫球蛋白G结合区域、氯霉素·转乙酰酶、聚(Arg)、聚(Glu)、蛋白G、麦芽糖结合蛋白质、谷胱甘肽S-转移酶、聚组氨酸链(His-tag)、S肽、DNA结合蛋白质结构域、Tac抗原、硫氧还蛋白、绿色荧光蛋白、FLAG肽或任意抗体表位的抗体、例如免疫球蛋白G等。

具体来讲，当可用于本发明的蛋白质以与蛋白A的融合蛋白质进行生产时，根据Lowe等人的方法[Proc.Natl.Acad.Sci.，USA， 86，8227(1989)、Genes Develop.， 4，1288(1990)]、特开平5-336963、WO94/23021所述的方法等，当以与Flag肽的融合蛋白质形式生产时，根据Proc.Natl.Acad.Sci.，USA， 86，8227(1989)、Genes Develop.，4，1288(1990)等所述的方法可以纯化融合蛋白质。另外也可以通过使用对该蛋白质自身的抗体的亲和层析进行纯化。

以上述取得的蛋白质的氨基酸序列情报为基础通过Fmoc法(9-笏甲氧羰基法)、tBoc法(t-丁氧羰基法)等化学合成法可以制备本发明的蛋白质。另外也可以利用Advanced ChemTech社、Perkin-Elmer公司、Pharmacia社、Protein Technology Instrument社、Synthecell-Vega社、PerSeptive社、岛津制作所等肽合成仪进行化学合成。

6.本发明的二肽衍生物的制备方法

(1)酶促制备法

作为二肽衍生物的酶促制备方法，可列举：i)二肽或二肽衍生物(PI)的制备方法，其特征在于：使上述1的蛋白质、1种以上的氨基酸或者氨基酸衍生物和ATP在水性溶液中共存，使二肽或二肽衍生物(PI)在该水性介质中生成、蓄积，从该水性介质收集该二肽或二肽衍生物(PI)；和ii)二肽或二肽衍生物(PII)的制备方法，其特征在于：使上述1的蛋白质、1种以上的氨基酸或氨基酸衍生物和ATP在水性介质中共存，使二肽或二肽衍生物(PI)在该水性介质中生成、蓄积，直接进行修饰或从该水性介质收集该二肽或二肽衍生物(PI)后对该二肽或二肽衍生物(PI)进行修饰，使二肽或二肽衍生物(PII)生成，收集该二肽或二肽衍生物(PII)。

通过众所周知的有机合成的手法等对二肽或二肽衍生物(PI)进行修饰可以制备二肽或二肽衍生物(PII)。

在上述制备方法中，用作底物的1种以上的氨基酸或氨基酸衍生物须要是成为上述1的蛋白质的底物的氨基酸或氨基酸衍生物，也可以使用任何氨基酸或氨基酸衍生物。

作为上述氨基酸或氨基酸衍生物，如式(I)

(式中、n¹、R^1a、R^1b、R^2a和R^2b分别与上述同义)，或式(II)

(式中、n²、R^3a、R^3b、R⁴和R⁵分别与上述同义)

表示的氨基酸或氨基酸衍生物[但当1种以上的氨基酸或氨基酸衍生物只是式(I)时，R^1a和R^1b中至少有一方是氢原子，当1种以上的氨基酸或氨基酸衍生物只是式(II)时，R⁵为羟基]，

优选式(III)

(式中、R^1c、R^1d、R^2c和R^2d分别与上述同义)，或式(IV)

(式中、R^3c、R^3d和R⁵分别与上述同义)

表示的氨基酸或氨基酸衍生物[但当氨基酸或氨基酸衍生物只是式(III)时，R^1c和R^1d中至少有一方是氢原子，当氨基酸或氨基酸衍生物只是式(IV)时，R⁵为羟基]，

更优选式(V)或式(VI)表示的氨基酸或氨基酸衍生物：

(式中、R^2e与上述同义)，

(式中、R^3e与上述同义)。

作为用上述制备方法制备的肽或二肽衍生物(PI)，如式(VIIa)表示的二肽衍生物，

(式中、n^3a、n^4a、R^6a、R^6b、R^7a、R^7b、R^8a、R^9a、R^9b和R^10a分别与上述同义)

优选式(VIIIa)表示的二肽衍生物，

(式中、R^6c、R^6d、R^7c、R^7d、R^9c、R^9d和R^10a分别与上述同义)

更优选式(IXa)表示的二肽衍生物。

(式中、R^7e和R^9e分别与上述同义)

作为用上述制备方法制备的二肽或二肽衍生物(PII)，如式(VIIb)表示的二肽衍生物，

优选式(VIIIb)表示的二肽衍生物，

(式中、R^6C、R^6D、R^7C、R^7D、R^9C、R^9D和R^10A分别与上述同义)，更优选式(IXb)表示的二肽衍生物。

(式中、R^7E和R^9E分别与上述同义)。

但该二肽衍生物不包括由从L-丙氨酸、L-谷氨酰胺、L-谷氨酸、L-缬氨酸、L-亮氨酸、L-异亮氨酸、L-脯氨酸、L-苯丙氨酸、L-色氨酸、L-蛋氨酸、L-丝氨酸、L-苏氨酸、L-半胱氨酸、L-天冬酰胺、L-酪氨酸、L-赖氨酸、L-精氨酸、L-组氨酸、L-天冬氨酸、L-α-氨基酪酸、L-偶氮丝氨酸、L-茶氨酸、L-4-羟基脯氨酸、L-3-羟基脯氨酸、L-鸟氨酸、L-瓜氨酸和L-6-重氮-5-氧代正亮氨酸、甘氨酸和β-丙氨酸选出的相同的或不同的氨基酸通过肽键形成的化合物。

在式(I)～(VI)、(VIIa)、(VIIb)、(VIIIa)、(VIIIb)、(IXa)和(IXb)的各基团的定义中，作为低级烷基、低级烷氧基、低级烷酰基、低级烷氧羰基、一(低级烷基)氨基和二(低级烷基)氨基的低级烷基部分，例如碳原子数1至10的直链状、支链状、环状或由它们的组合组成的烷基，更具体讲，作为直链或支链状的烷基，例如甲基、乙基、n-丙基、异丙基、n-丁基、异丁基、sec-丁基、tert-丁基、n-戊基、新戊基、n-己基、n-庚基、n-辛基、n-壬基、n-癸基等，作为环状的烷基，例如环丙基、环丁基、环戊基、环己基、环庚基、环辛基、环癸基、去甲金刚烷基、金刚烷基、双环[2.2.1]庚基、双环[2.2.2]辛基、双环[3.3.0]辛基、双环[3.3.1]壬基等，作为由直链或支链状和环状的组合构成的烷基，例如环丙基甲基、环庚基甲基、环辛基乙基等。而二(低级烷基)氨基中的2个低级烷基部分可以相同，也可以不同。

作为低级烯基，例如碳原子数2至10的直链或支链状的烯基，更具体的例子如乙烯基、烯丙基、1-丙烯基、1-丁烯基、3-丁烯基、2-戊烯基、4-戊烯基、2-己烯基、5-己烯基、2-癸烯基、9-癸烯基等。

作为低级炔基，例如碳原子数2至10的直链或支链状的炔基，更具体的例子如乙炔、2-丙炔、3-丁炔、4-戊炔、5-己炔、9-癸炔等。

作为芳基、芳烷基和芳酰基的芳基部分，例如单环性或2个以上的环缩合的缩环性的芳基，更具体讲如环构成碳原子数从6至14的芳基、例如苯基、萘、茚基、蒽基等。

作为脂环式杂环基，例如单环性或2个以上的环缩合的缩环性的脂环式杂环基，脂环式杂环基中含有的杂原子的种类以及个数没有特别限定，例如可以含有1或2个以上从氮原子、硫原子和氧原子选出的杂原子，更具体的例子，例如吡咯烷基、2，5-二氧吡咯烷基、噻唑烷基、唑烷基、哌啶基、1，2-二氢吡啶基、哌嗪基、高哌嗪基、吗啉基、硫代吗啉基、吡唑啉基、_唑啉基、二氧戊环基、四氢吡喃基、四氢硫代吡喃基、四氢呋喃基、四氢喹啉基、四氢异喹啉基、四氢喹喔啉基、八氢喹啉基、二氢吲哚基、1，3-二氧异吲哚基等。

作为杂环烷基的杂环基部分，例如芳香族杂环基、脂环式杂环基等，作为芳香族杂环基，例如单环性或2个以上的环缩合的缩环性的芳香族杂环基，芳香族杂环基中含有的杂原子的种类以及个数没有特别限定，例如可以含有1或2个以上从氮原子、硫原子和氧原子选出的杂原子，更具体讲，从构成环的原子数5至14的芳香族杂环基、例如呋喃基、噻吩基、吡咯基、咪唑、吡唑基、三唑基、四唑基、六唑基、_二唑基、噻唑基、吡啶基、吡嗪基、嘧啶基、哒嗪基、三嗪基、吲哚基、吲唑基、苯并咪唑基、苯并_唑基、苯并噻唑基、喹啉基、异喹啉基、2，3-二氮杂萘基、1，5-二氮杂萘基、喹喔啉基、喹唑啉基、噌啉基、嘌呤基、香豆酸基等。而脂环式杂环基与上述同义。

芳烷基和杂环烷基的亚烷基部分在上述低级烷基之中与从一个直链或支链状的烷基除去氢原子后的部分相同含义。

作为邻接的氮原子和与该氮原子邻接的碳原子一起形成的杂环基、以及邻接的碳原子和与该碳原子邻接的氮原子一起形成的杂环基，例如至少含有1个氮原子的5元或6元的单环性脂环式杂环基(该单环性脂环式杂环基也可以含有其它的氮原子、氧原子或硫原子)、在3～8元的环缩合的二环或三环性中至少含有1个氮原子的缩环性杂环基(该缩环性杂环基也可以含有其它的氮原子、氧原子或硫原子)等，更具体的例子，如吡咯烷、哌啶基、哌嗪基、吗啉基、硫代吗啉基、高哌啶基、高哌嗪基、四氢吡啶基、四氢喹啉基、四氢异喹啉基等。

作为取代低级烷基、取代低级烯基、取代低级炔基、取代低级烷氧基、取代低级烷酰基、取代低级烷氧羰基、取代芳烷基、取代芳基、取代芳酰基、取代杂环烷基、一(取代低级烷基)氨基、低级烷基(取代低级烷基)氨基、二(取代低级烷基)氨基以及邻接的氮原子和与该氮原子邻接的碳原子一起形成的取代杂环基、和邻接的碳原子和与该碳原子邻接的氮原子一起形成的取代杂环基中的取代基，可以相同或不同，从取代数1起始的可取代数，优选取代数1～3的、例如卤素、氨基、硝基、羟基、巯基、胍基、脲基、氰基、甲酰基、羧基、氨羰基、重氮乙酰基、低级烷基、低级烷氧基、低级烷酰基、低级烷氧羰基、一或二(低级烷基)氨羰基、低级烷基巯基、芳基、芳烷基、芳酰基、杂环羰基等。其中低级烷基、低级烷氧基、低级烷酰基和低级烷氧羰基的低级烷基部分、芳基、芳烷基和芳酰基的芳基部分以及芳烷基的烯基部分分别与上述同样含义，一或二(低级烷基)氨羰基和低级烷硫基中的低级烷基部分与上述低级烷基同样含义，杂环羰基中的杂环基部分与上述杂环烷基中的杂环基部分相同含义。卤素表示氟、氯、溴、碘各原子。而二(低级烷基)氨羰基中的2个低级烷基部分可以相同，也可以不同。

另外，作为理想的氨基酸或氨基酸衍生物，如由L-氨基酸、甘氨酸(Gly)和β-丙氨酸(β-Ala)和它们的衍生物选出的氨基酸或氨基酸衍生物。作为L-氨基酸，例如L-丙氨酸(L-Ala)、L-谷氨酰胺(L-Gln)、L-谷氨酸(L-Glu)、L-缬氨酸(L-Val)、L-亮氨酸(L-Leu)、L-异亮氨酸(L-Ile)、L-脯氨酸(L-Pro)、L-苯丙氨酸(L-Phe)、L-色氨酸(L-Trp)、L-蛋氨酸(L-Met)、L-丝氨酸(L-Ser)、L-苏氨酸(L-Thr)、L-半胱氨酸(L-Cys)、L-天冬酰胺(L-Asn)、L-酪氨酸(L-Tyr)、L-赖氨酸(L-Lys)、L-精氨酸(L-Arg)、L-组氨酸(L-His)、L-天冬氨酸(L-Asp)、L-α-氨基酪酸(L-α-AB)、L-氮丝氨酸(L-Azaserine)、L-茶氨酸(L-theanine)、L-4-羟基脯氨酸(L-4-HYP)、L-3-羟基脯氨酸(L-3-HYP)、L-鸟氨酸(L-Orn)、L-瓜氨酸(L-Cit)和L-6-重氮-5-氧代正亮氨酸(L-6-diazo-5-oxo-norleucine)等。

作为上述制备方法中可使用的氨基酸或氨基酸衍生物的组合，如选自L-Ala、Gly、L-Met、L-Ser、L-Thr和β-Ala中的一种氨基酸或它的衍生物与选自L-Ala、L-Gln、L-Glu、Gly、L-Val、L-Leu、L-Ile、L-Pro、L-Phe、L-Trp、L-Met、L-Ser、L-Thr、L-Cys、L-Asn、L-Tyr、L-Lys、L-Arg、L-His、L-Asp、L-α-AB、β-Ala、L-Azaserine、L-theanine、L-4-HYP、L-3-HYP、L-Orn、L-Cit及L-6-diazo-5-oxo-norleucine中的一种氨基酸或它的衍生物的组合、L-Gln或它的衍生物与L-Phe或它的衍生物的组合、和L-α-AB或它的衍生物与选自L-Gln、L-Arg和L-α-AB中的一种氨基酸或它的衍生物的组合，更优选L-Ala或它的衍生物与选自L-Gln、Gly、L-Val、L-Leu、L-Ile、L-Phe、L-Trp、L-Met、L-Ser、L-Thr、L-Cys、L-Asn、L-Tyr、L-Lys、L-Arg、L-His、L-α-AB、L-Azaserine、L-Cit和L-theanine中的一种氨基酸或它的衍生物的组合、Gly或它的衍生物与选自L-Gln、Gly、L-Phe、L-Trp、L-Met、L-Ser、L-Thr、L-Cys、L-Tyr、L-Lys、L-Arg、L-α-AB和L-Cit中的一种氨基酸或它的衍生物的组合、L-Met或它的衍生物与选自L-Phe、L-Met、L-Ser、L-Thr、L-Cys、L-Tyr、L-Lys和L-His中的一种氨基酸或它的衍生物的组合、L-Ser或它的衍生物与选自L-Gln、L-Phe、L-Ser、L-Thr、L-Tyr、L-His和L-α-AB中的一种氨基酸或它的衍生物的组合、L-Thr或它的衍生物与选自L-Gln、L-Phe、L-Leu、L-Thr和L-α-AB中的一种氨基酸或它的衍生物的组合、L-Gln或它的衍生物与L-Phe或它的衍生物的组合、β-Ala或它的衍生物与选自L-Phe、L-Met、L-His和L-Cit中的一种氨基酸或它的衍生物的组合、和L-α-AB或它的衍生物与L-Gln、L-Arg和L-α-AB中的一种氨基酸或它的衍生物的组合。

在上述制备方法中，用于本发明的蛋白质，对于每1mg用作底物的氨基酸或氨基酸衍生物为0.01～100mg、优选0.1mg～10mg。

在上述制备方法中，用作底物的氨基酸或氨基酸衍生物按照浓度达到0.1～500g/L、优选0.2～200g/L的浓度在开始或反应途中添加到水性介质中。

上述制备方法中作为能量源使用ATP，使用的浓度是0.5mol～10mol/L的浓度。

作为可在上述制备方法中使用的水性介质，只要不抑制二肽衍生物的生成反应，可以是任意成分、组成的水性介质，例如，水、磷酸盐、碳酸盐、乙酸盐、硼酸盐、柠檬酸盐、Tris等缓冲液等。另外也可以含有甲醇、乙醇等醇类、乙酸乙酯等酯类、丙酮等酮类。

二肽的生成反应在水性介质中、在pH5～11、优选pH6～10、20～50℃、优选25～45℃的条件进行2～150小时、优选进行6～120小时。

(2)使用细胞的培养物或者使用该培养物的处理物作为酶源的制备方法

作为使用细胞的培养物或者该培养物的处理物作为酶源的二肽的制备方法，可列举：i)二肽或二肽衍生物(PI)的制备方法，其特征在于：将上述4得到细胞的培养物或者该培养物的处理物用作酶源，使该酶源、1种以上的氨基酸或者氨基酸衍生物在水性溶液中共存，使二肽或二肽衍生物(PI)在该水性介质中生成、蓄积，从该水性介质收集该二肽或二肽衍生物(PI)；和ii)二肽或二肽衍生物(PII)的制备方法，其特征在于：将细胞的培养物或者该培养物的处理物用作酶源，使该酶源、1种以上的氨基酸或氨基酸衍生物和ATP在在水性介质中共存，使二肽或二肽衍生物(PI)在该水性介质中生成、蓄积，直接进行修饰或从该水性介质收集该二肽或二肽衍生物(PI)后对该二肽或二肽衍生物(PI)进行修饰，使二肽或二肽衍生物(PII)生成，收集该二肽或二肽衍生物(PII)。

可以使用公知的有机合成的方法等，通过修饰二肽或者二肽衍生物(PI)，生成二肽或者二肽衍生物(PII)。

在上述制备方法中，用作底物的氨基酸和氨基酸衍生物的种类、使用浓度和添加阶段以及生产的二肽与上述6的(1)的酶促制备方法相同。

作为培养物的处理物，可以例举培养物的浓缩物、培养物的干燥物、通过离心分离培养物获得的菌体、该菌体的干燥物、该菌体的冷冻干燥物、该菌体的表面活性剂的处理物、该菌体的超声波处理物、该菌体的机械研磨处理物、该菌体的溶剂处理物、该菌体的酶处理物、该菌体的蛋白质级分物、该菌体的固定化物质或者从该菌体中提取得到的酶标准制品，并且具有由1种以上氨基酸或者氨基酸的衍生物生成二肽或者二肽衍生物的活性的处理物等。

此外，可以作为用微生物的培养物或者该培养物的处理物作为酶源的制备方法中使用的水性介质，除了上述6的(1)的酶制备方法中使用的水性介质外，可以使用作为酶源使用的细胞的培养液或者水性介质。

此外，在上述的制备方法中，根据需要，将ATP作为供给源，可以向水性介质中加入ATP或者经过细胞代谢可生成ATP的化合物，例如：葡萄糖这样的糖类、乙醇这样的醇类，醋酸这样的有机酸类等。

另外根据需要，也可以在水性介质中添加表面活性剂或有机溶剂。作为表面活性剂，polyoxyethylene octadecylamine(例如NymeenS-215、日本油脂社制)等非离子表面活性剂、cetyltrimethylammonium bromide和alkyldimethylbenzylammoniumchloride(例如Cation F2-40E、日本油脂社制)等阳离子系表面活性剂、lauroyl sarcosinate等阴离子系表面活性剂、alkyldimethylamine(例如Tertiary Amine FB、日本油脂社制)等的Tertiary Ami ne类等；作为有机溶剂，如二甲苯、甲苯、脂(肪)族醇、丙酮、醋酸乙酯等，本发明的制备方法中使用的细胞只要是具有由氨基酸或氨基酸衍生物生成二肽或二肽衍生物的活性，可以使用任一种，也可以将1种或数种混合后使用。表面活性剂和有机溶剂的种类和浓度可以在可用于本发明的细胞具有上述活性的范围中的任意选择，例如表面活性剂通常在0.1～50g/l的浓度范围使用，有机溶剂通常在0.1～50ml/l的浓度范围使用。

将细胞的培养物或者该培养物的处理物作为酶源的情况下，该酶源的量因该酶源的比活性等而有所不同，例如，对于每1mg用作底物的氨基酸或者氨基酸衍生物，添加重量为5～1000mg，优选10～400mg的湿细胞。

二肽或二肽衍生物的生成反应在水性介质中、在pH5～11、优选pH6～10、20～65℃、优选25～55℃，更优选30～45℃的条件下通常进行1分钟～150小时、优选进行3分钟～120小时，更优选进行30分钟～100小时。

在上述6的(1)或者(2)的制备方法中，在水性介质中生成、蓄积的二肽或二肽衍生物的采取可以通过使用活性炭或离子交换树脂等通常的方法，或利用有机溶剂的提取、结晶、薄层层析、高效液相层析等进行。

(3)通过修饰二肽或者二肽衍生物制备二肽衍生物的方法

将在上述6的(1)或者(2)的制备方法中得到的二肽或者二肽衍生物根据公知的有机合成反应[参见例如：Comprehensive OrgnicTransformations，R.C.Larock着，(1989年)]，可以得到多种二肽衍生物。

在上述制备方法中得到的生成物的分离、纯化可以使用常规有机合成中使用的方法，例如：适当组合过滤、萃取、洗涤、干燥、浓缩、结晶、各种层析等。

以下给出了实验例，对可用于本发明的DNA、蛋白质和细胞的制备方法进行了说明，但该制备方法并不限定于下面实验例。

实验例1利用数据库检索具有二肽合成活性的蛋白质

以来自枯草芽孢杆菌168株的D-Ala-D-Ala连接酶基因的氨基酸序列[Nature， 390，249-256(1997)]作为请求，使用作为枯草芽孢杆菌168株的基因组DNA数据库的Subtilist(http://genolist.pasteur.fr/SubtiList/)的同源性检索功能，对编码存在于枯草芽孢杆菌168株基因组DNA序列中的具有同源性的蛋白质的基因进行检索。

在结果选取的序列中，选择编码作为D-Ala-D-Ala连接酶基序[Biochemistry， 30，1673(1991)]的序列号33、34或35表示的氨基酸序列，而且去除掉编码其功能已经被鉴定的蛋白质的基因后，表现出与D-Ala-D-Ala连接酶基序最高同源性(29.1％)的序列作为功能未知基因 ywfE。

ywfE的碱基序列如序列号9所示，由该碱基序列编码的蛋白质的氨基酸序列如序列号1所示。

实验例2 ywfE基因表达株的构建

根据实验例1得到的碱基序列情报，象以下那样操作可以取得枯草芽孢杆菌的 ywfE基因片段。

首先将枯草芽孢杆菌168株(ATCC23857)接种于LB培养基[10g/l细菌培养用胰化蛋白胨(Difco公司生产)、5g/l酵母提取物(Difco公司生产)、5g/l氯化钠]，于30℃下静置培养过夜。培养后通过使用Current Protocols in Molecular Biology所述的饱和酚方法，对该微生物的染色体DNA进行分离纯化。

使用Perseptive Biosystems公司制备8905型DNA合成仪，合成具有序列号19～22表示的碱基序列的DNA(以下，分别称之为引物A、引物B、引物C和引物D)。引物A是添加在枯草芽孢杆菌染色体DNA的含有 ywfE起始密码子区域的5′端的含有 XhoI识别序列的碱基序列。引物B是添加在与含有 ywfE的终止密码子的序列互补的碱基序列的5′端的含有 BamHI识别序列的碱基序列。而引物C是添加在含有 trp启动子的表达载体pTrS30[由大肠杆菌JM109/pTrS30(FERM BP-5407)制备]的 trp启动子区域的碱基序列号5′端的含有 EcoRI识别序列的碱基序列。引物D是添加在与含有 trp启动子的表达载体pTrS30的trp启动子区域的序列互补的序列的5′端的含有 XhoI识别序列的碱基序列。

在 ywfE基因片段的扩增中使用上述引物A和引物B，作为模板使用枯草芽孢杆菌染色体DNA，在 trp启动子区域的片段扩增中使用引物C和引物D、作为模板使用pTrS30进行PCR。PCR通过制备含有作为模板的0.1μg染色体DNA或10ng的pTrS30、0.5mol/L的各引物、2.5units的 Pfu DNA聚合酶(Stratagene公司生产)、4μL的 Pfu DNA聚合酶用×10缓冲液(Stratagene公司生产)、各200μmol/L的dNTP(dATP、dGTP、dCTP和dTTP)的反应液40μL，按照94℃下1分钟、55℃下2分钟、72℃下3分钟为一个循环，反复进行30次循环来实施。

将该反应液的1/10量进行琼脂糖凝胶电泳，确认在使用引物A和引物B的PCR中扩增了相当于 ywfE基因片段的约1.4kb，在使用引物C和引物D的反应中扩增了相当于 trp启动子区域的DNA片段约0.3kbDNA片段后，添加与剩下反应液等量的TE[10mmol/LTris-HCl(pH8.0)、1mmol/L EDTA]饱和酚/氯仿(1vol/1vol)溶液，并混合。向该溶液经离心分离后得到的上层加2倍容量的冷乙醇，并混合，于-80℃下放置30分钟。将该溶液离心分离使DNA沉淀后，将该DNA溶解于20μL的TE。

使用各个该溶解液各5μL，将用引物A和引物B扩增的DNA用限制酶 XhoI和 BamHI进行酶切，而使用引物C和引物D扩增的DNA用限制酶 EcoRI和 XhoI进行酶切，通过琼脂糖凝胶电泳将DNA片段分离后，使用geneclean II试剂盒(GENECLEAN II kit、BIO101社制)，分别收集含有 ywfE的1.4kb和含有 trp启动子区域的0.3kb的DNA片段。

将含有 trp启动子的表达载体pTrS30[由大肠杆菌JM109/pTrS0(FERM BP-5407)制备]0.2μg用限制酶 EcoRI和 BamHI酶切后，通过琼脂糖凝胶电泳分离DNA片段，通过与上述同样的方法，收集4.5kb的DNA片段。

使用连接试剂盒(Takara Bio公司生产)，使上述得到的含有 ywfE的1.4kb片段、含有 trp启动子区域的0.3kb片段和4.5kb的片段于16℃下反应16小时，进行连接。

通过使用钙离子的方法[Proc.Natl.Acad.Sci.，USA， 69，2110(1972)]用该反应液转化大肠杆菌NM522株(Stratagene公司生产)后涂布于含有50μg/ml的氨苄青霉素的LB琼脂培养基，于30℃下培养过夜。

根据众所周知的方法从生长繁殖的转化体菌落提取质粒，通过使用限制酶解析其构造，确认取得了在 trp启动子下游连接了 ywfE的表达载体pPE43(图1)。

实验例3 二肽的生产

将实验例2得到的带有pPE43的大肠杆菌NM522(大肠杆菌NM522/pPE43株)接种在加入了含有50μg/ml的氨苄青霉素的8ml LB培养基的大型试管，于28℃下培养17小时。对该培养液进行离心分离、取得湿菌体。

制备由终浓度60mg/ml的该湿菌体、120mmol/L的磷酸钾缓冲液(pH7.4)、60mmol/L的氯化镁、60mmol/L的ATP、30mmol/L的L-Ala、30mmol/L的L-Gln、0.4％的NymeenS-215构成的0.1ml反应液，于37℃下反应3分钟。

反应结束后，将反应生成物用二硝基酚法进行衍生化后通过HPLC法进行分析。用HPLC法进行分析，分离柱使用关东化学社制的Lichrosorb-RP-18柱，洗脱液使用1％(v/v)磷酸、25％(v/v)乙腈，以0.7ml/分钟的流速进行。其结果确认反应液中生成蓄积120mg/L的L-丙氨酰-L-谷氨酰胺(L-Ala-L-Gln)。

在作为对照菌株只含有载体的大肠杆菌NM522/pTrS30株的菌体中没有能确认到L-Ala-L-Gln的生成。

实验例4 C末端添加His-tag型重组型二肽合成酶的纯化

使用上述DNA合成仪，合成具有序列号33和34表示的碱基序列的DNA(以下，分别称为引物E、引物F)。引物E是含有将 ywfE的起始密码子(atg)置换为 NcoI识别序列(ce atgg)的区域的碱基序列。引物F是含有将 ywfE的终止密码子置换为 BamHI识别序列( ggatcc)的区域的碱基序列。

以枯草芽孢杆菌168株(ATCC23857)的染色体DNA作为模板，使用上述引物E和引物F作为引物组进行PCR。PCR通过制备含有0.1μg的染色体DNA、0.5μmol/L的各引物、2.5units的 Pfu DNA聚合酶、4μL的 Pfu DNA聚合酶用×10缓冲液、200μmol/L的各dNTP的反应液40μL，按照94℃下1分钟、55℃下2分钟、72℃下3分钟为一次循环，反复进行30次来实施。

将该反应液的1/10量进行琼脂糖凝胶电泳，确认扩增了相当于ywfE基因片段的约1.4kb后，添加与剩下反应液等量的TE饱和酚/氯仿溶液，并混合。向该溶液经离心分离后得到的上层加2倍容量的冷乙醇，并混合，于-80℃下放置30分钟。将该溶液离心分离得到的DNA沉淀溶解于20μL的TE。

使用各个该溶解液各5μL，将扩增的DNA用限制酶 NcoI和 BamHI进行酶切，通过琼脂糖凝胶电泳将DNA片段分离后，使用genecleanII试剂盒收集含有 ywfE的1.4kb的DNA片段。

将C末端添加His-tag型重组体表达载体pQE60(Qiagen公司生产)0.2g用限制酶 NcoI和 BamHI酶切后，通过琼脂糖凝胶电泳将DNA片段分离后，使用与上述同样的方法收集3.4kb的DNA片段。

使用连接试剂盒，使上述得到的含有 ywfE的1.4kb的DNA片段和3.4kb的DNA片段于16℃下反应16小时，进行连接。

通过使用钙离子的方法用该连接反应液转化大肠杆菌NM522株后，涂布于含有50μg/ml的氨苄青霉素的LB琼脂培养基，于30℃下培养过夜。

通过众所周知的方法从生长繁殖的转化体菌落提取质粒，使用限制酶对其构造进行解析，确认取得了作为C末端添加His-tag型 ywfE表达载体的pQE60ywfE(图2)。

将带有pQE60ywfE的大肠杆菌NM522(大肠杆菌NM522/pQE60ywfE株)接种在加入了含有50μg/ml的氨苄青霉素的8mlLB培养基的大型试管，于28℃下培养17小时。将该培养液接种在加入了含有50μg/ml的氨苄青霉素的50ml LB培养基的250ml容量三角烧瓶，于30℃下培养3小时后，按照终浓度达到1mmol/L那样添加异丙醇-β-D-硫代半乳糖苷(IPTG)，再于30℃下培养4小时。对该培养液进行离心分离取得湿菌体，使用HisTrap(添加His-tag蛋白质纯化试剂盒、Amersham Pharmasia Biotech社制)，根据说明书从该湿菌体纯化添加His-tag重组型酶。

实验例5 使用添加His-tag重组型酶进行二肽的生产(1)

(i)制备由实验例4中取得的纯化的添加His-tag重组型酶0.04mg、100mmol/L的Tris-HCl(pH8.0)、60mmol/L的氯化镁、60mmol/L的ATP、30mmol/L的L-Ala、30mmol/L的L-Gln构成的0.1ml的反应液，于37℃进行16小时反应。

反应结束后，通过与上述实验例3同样的方法分析反应生成物，确认反应液中生成蓄积3.7g/L的L-Ala-L-Gln和0.3g/L的L-丙氨酰-L-丙氨酸(L-Ala-L-Ala)。

(ii)除了酶为0.01mg、用L-Phe、L-Met、L-Leu或L-Val取代L-Gln以外，制备与上述(i)的反应液组成相同的反应液，于上述(i)的反应条件下进行反应。

反应结束后，通过与上述实验例3同样的方法对反应生成物进行分析，确认反应液中分别生成蓄积：只有7.0g/L的L-丙氨酰-L-苯丙氨酸(L-Ala-L-Phe)、7.0g/L的L-丙氨酰-L-蛋氨酸(L-Ala-L-Met)和0.03g/L的L-Ala-L-Ala、5.0g/L的L-丙氨酰-L-亮氨酸(L-Ala-L-Leu)和0.2g/L的L-Ala-L-Ala、或1.6g/L的L-丙氨酰-L-缬氨酸(L-Ala-L-Val)和0.3g/L的L-Ala-L-Ala。

(iii)除了酶为0.01mg、用Gly取代L-Ala、用L-Phe或L-Met取代L-Gln以外，制备与上述(i)的反应液的组成相同的反应液，在上述(i)的反应条件使其反应。

反应结束后，通过与上述实验例3同样的方法对反应生成物进行分析，确认反应液中分别生成蓄积5.2g/L的甘氨酰-L-苯丙氨酸(Gly-L-Phe)或1.1g/L的甘氨酰-L-蛋氨酸(Gly-L-Met)。

如果从上述反应液组成中去除ATP，完全不能生成二肽。

以上结果表明 ywfE基因产物在ATP存在下具有生成由L-Ala和L-Gln、L-Phe、L-Met、L-Leu或L-Val生成L-Ala-L-Gln和L-Ala-L-Ala、L-Ala-L-Phe、L-Ala-L-Met和L-Ala-L-Ala、L-Ala-L-Leu和L-Ala-L-Ala、或L-Ala-L-Val和L-Ala-L-Ala的活性，由Gly和L-Phe或L-Met生成Gly-L-Phe或Gly-L-Met的活性。

实验例6 使用添加His-tag重组型酶的二肽的生产(2)

制备由实验例4中得到的纯化的添加His-tag重组型酶0.04mg、100mmol/L的Tris-HCl(pH8.0)、60mmol/L的氯化镁、60mmol/L的ATP构成的0.1ml反应液，按照分别达到30mmol/L那样向反应液中添加由表1的第1行和最左列的氨基酸的组合构成的各种L-氨基酸、Gly或β-Ala，于37℃下进行16小时反应。反应结束后，对反应生成物进行HPLC分析，确认生成表1所示的二肽。

【表1-1】

【表1-2】

【表1-3】

将以表1的第1行和最左列所述的2种(或1种)L-氨基酸、Gly或β-Ala作为底物反应时生成的二肽记在表格内。○表示生成了二肽，但序列未确定，×表示不能确认二肽的生成，而空栏表示未实施。

实验例7 使用添加His-tag重组型酶表达株的二肽的生产

将实验例4得到的大肠杆菌NM522/pQE60ywfE株接种在加入了含有50μg/ml的氨苄青霉素的8ml LB培养基的大型试管，于28℃下培养17小时。将该培养液接种在加入了含有50μg/ml的氨苄青霉素的50ml LB培养基的250ml容量三角烧瓶，于30℃下培养3小时后，按照终浓度达到1mmol/L那样添加IPTG，再于30℃下培养4小时。对该培养液进行离心分离取得湿菌体。

将由200g/L的湿菌体、50g/L的葡萄糖、5g/L的肌醇六磷酸(使用33％的浓氢氧化钠溶液稀释成中性)、15g/L的磷酸二氢钾、5g/L的硫酸镁·7水合物、4g/L的NymeenS-215、10ml/L的二甲苯、200mmol/L的L-Ala、200mmol/L的L-Gln构成的20ml反应液(pH7.2)加入到50ml容量的烧杯、于32℃、900rpm的条件下进行2小时反应。反应中使用2mol/L的氢氧化钾将反应液的pH保持在7.2。

将反应生成物用与实验例3所述方法同样的方法进行分析，确认25mg/L的L-Ala-L-Gln蓄积。

实验例8 相当于来自属于杆菌属的各种微生物的 ywfE基因的基因的克隆和该基因的解析

根据序列号9表示的碱基序列，象以下那样操作取得相当于存在于枯草芽孢杆菌ATCC15245、ATCC6633、IAM1213、IAM1107、IAM1214、ATCC9466、IAM1033、ATCC21555、解淀粉芽孢杆菌IFO3022和短小芽孢杆菌NRRL B-12025的 ywfE基因的基因。

首先，将枯草芽孢杆菌ATCC151245、ATCC6633、IAM1213、IAM1107、IAM1214、ATCC9466、IAM1033、ATCC21555、解淀粉芽孢杆菌IFO3022和短小芽孢杆菌NRRL B-12025分别接种于LB培养基，于30℃下静置培养过夜。培养后，通过使用Current Protocols in MolecularBiology所述的饱和酚方法，对于各个微生物的染色体DNA分别进行分离纯化。

使用PerSeptive Biosystems公司制备8905型DNA合成仪，合成具有序列号25和26表示的碱基序列的DNA(以下，分别称为引物G、引物H)。引物G是含有从枯草芽孢杆菌168株的染色体DNA的 ywfE的起始密码子开始的上游区域的序列。引物H是与含有从 ywfE的终止密码子开始的下游序列互补的序列。

以枯草芽孢杆菌ATCC15245、ATCC6633、IAM1213、IAM1107、IAM1214、ATCC9466、IAM1033、ATCC21555或解淀粉芽孢杆菌IFO3022的染色体DNA作为模板，使用上述引物G和引物H作为引物组进行PCR。PCR通过制备含有0.1μg的染色体DNA、0.5μmol/L的各引物、2.5units的 Pfu DNA聚合酶、4μL的 Pfu DNA聚合酶用×10缓冲液、200μmol/L的各dNTP的反应液40μL，按照94℃下1分钟、55℃下2分钟、72℃下3分钟为一次循环，反复进行30次来实施。

将该反应液的1/10量进行琼脂糖凝胶电泳，确认扩增了相当于y wfE基因片段的约1.4kb后，添加与剩下反应液等量的TE饱和酚/氯仿溶液，并混合。向该溶液经离心分离后得到的上层加2倍容量的冷乙醇，并混合，于-80℃下放置30分钟。将该溶液离心分离得到的DNA沉淀溶解于20μL的TE。

使用连接试剂盒，将上述得到的来自各菌株染色体DNA的1.4kb片段和pCR-blunt(Invitrogen公司生产)于16℃下反应16小时，进行连接。

通过使用钙离子的方法用该反应液转化大肠杆菌NM522株后，涂布于含有50μg/ml的氨苄青霉素的LB琼脂培养基，于30℃下培养过夜。

通过根据众所周知的方法从生长繁殖的转化体菌落提取质粒，用限制酶对各个构造进行解析，确认取得含有相当于 ywfE基因的基因的质粒pYWFE1(来自ATCC15245株，具有序列号36表示的碱基序列的DNA)、pYWFE2(来自ATCC6633株，具有序列号10表示的碱基序列的DNA)、pYWFE3(来自IAM1213株，具有序列号11表示的碱基序列的DNA)、pYWFE4(来自IAM1107株，具有序列号12表示的碱基序列的DNA)、pYWFE5(来自IAM1214株，具有序列号13表示的碱基序列的DNA)、pYWFE6(来自ATCC9466株，具有序列号9表示的碱基序列的DNA)、pYWFE7(来自IAM1033株，具有序列号36表示的碱基序列的DNA)、pYWFE8(来自ATCC21555株，具有序列号14表示的碱基序列的DNA)、pYWFE9(来自IFO3022株，具有序列号15表示的碱基序列的DNA)。

另外相当于来自短小芽孢杆菌NRRL B-12025的 ywfE的基因(具有序列号16表示的碱基序列的DNA)象以下那样取得。

以上述制备的NRRL B-12025株的染色体DNA作为模板，使用序列号37和38表示的碱基序列构成的DNA作为引物组，进行PCR。PCR通过制备含有0.1μg的染色体DNA、0.5μmol/L的各引物、2.5units的Z-taq聚合酶(Takara Bio公司生产)、5μL的Z-taq聚合酶用×10缓冲液(Takara Bio公司生产)、200μmol/L的各dNTP的反应液50μL，按照98℃下5秒钟、55℃下30秒钟、72℃下1分钟为一次循环，反复进行30次来实施。

将该反应液的1/10量进行琼脂糖凝胶电泳，确认约0.8kb的片段扩增后，添加与剩下反应液等量的TE饱和酚/氯仿溶液，并混合。向该溶液经离心分离后得到的上层加2倍容量的冷乙醇，并混合，于-80℃下放置30分钟。将该溶液离心分离得到的DNA沉淀溶解于20μL的TE。

使用连接试剂盒将上述得到的0.8kb片段和pGEM T-easy(Promega公司生产)于16℃下反应16小时，进行连接。

通过使用钙离子的方法用该反应液转化大肠杆菌DH5α株后，涂布于含有50μg/ml的氨苄青霉素的LB琼脂培养基，于30℃下培养过夜。

从上述得到的转化体提取质粒，测定约0.8kb的插入DNA片段的碱基序列，确认由序列号21表示的碱基序列中的第358～1160位碱基构成的碱基序列。

然后将该质粒用 EcoRI进行酶切后，通过琼脂糖凝胶电泳将DNA片段分离。使用geneclean II试剂盒纯化该DNA片段。使用DIG-HighPrime DNA Labeling&Detection Starter Kit I(Roche Diagnostics公司生产)对约0.5μg该纯化DNA片段进行DIG标记。DIG标记根据该试剂盒附带的说明书进行。

使用上述得到的DIG标记的DNA，进行NRRL B-12025株的染色体DNA的Southern解析。

将NRRL B-12025株的染色体DNA分别使用 BamHI、 EcoRI、 HindIII、KpnI、 PstI、 SacI、 SalI和 SphI完全消化，通过琼脂糖电泳将DNA片段分离后，根据常规方法转移到nylon membrane plus charge(RocheDiagnostics公司生产)。

通过照射UV，将DNA片段固定在该尼龙膜后，使用上述探针DNA和该尼龙膜进行Southern杂交。

杂交通过使该探针DNA和该尼龙膜在65℃下接触16小时，然后使用0.1％SDS和2×SSC构成的溶液将该尼龙膜于室温下清洗5分钟，清洗2次，再用0.1％SDS和0.5×SSC构成的溶液，于65℃下15分钟、清洗2次进行，其它操作、条件和杂交的DNA的检测根据上述的DIG-HighPrime DNA Labeling&Detection Starter Kit I附带的说明书进行。

该结果表明在 Hind III和 Pst I完全消化片段的3.5kbp附近看到发色。

然后，将NRRL B-12025株的染色体DNA使用 Hind III和 Pst I分别完全消化，通过琼脂糖凝胶电泳分离DNA片段。使用geneclean II试剂盒从来自各个限制酶消化DNA中纯化3-4kbp的片段，使用连接试剂盒使其自环化。

根据上述测定的0.8kb的DNA片段的碱基序列，设计、合成序列号39和340表示的碱基序列，以上述取得的环化DNA作为模板进行PCR。PCR通过制备含有10ng的环化DNA、0.5μmol/L的各引物、2.5units的pyrobest聚合酶(Takara Bio公司生产)、5μL的pyrobest聚合酶用×10缓冲液(Takara Bio公司生产)、200μmol/L的各dNTP的反应液50μL，按照98℃下5秒钟、55℃下30秒钟、72℃下3分30秒钟为一次循环，反复进行30次来实施。

将该反应液的1/10量进行琼脂糖凝胶电泳，确认约3.0kb片段扩增后，添加与剩下反应液等量的TE饱和酚/氯仿溶液，并混合。向该溶液经离心分离后得到的上层加2倍容量的冷乙醇，并混合，于-80℃下放置30分钟。将该溶液离心分离得到的DNA沉淀溶解于20μL的TE。

使用连接试剂盒对上述得到的DNA片段和Zero Blunt PCRCloning Kit(Invitrogen公司生产)进行连接。

根据众所周知的方法从生长繁殖的转化体菌落提取质粒，通过使用限制酶对其构造进行解析，确认得到了含有相当于 ywfE基因的基因的质粒pYWFE10(来自NRRL B-12025株、具有序列号16表示的碱基序列的DNA)。

使用碱基序列分析装置373A·DNA序列仪测定上述得到的分别相当于pYWFE1～pYWFE10含有的 ywfE基因的各基因的碱基序列。

虽然由pYWFE1、pYWFE6和pYWFE7含有的基因编码的蛋白质的氨基酸序列与 ywfE基因编码的蛋白质的氨基酸序列相同，但由pYWFE2、pYWFE3、pYWFE4、pYWFE5、pYWFE8、pYWFE9和pYWFE10含有的基因编码的蛋白质的氨基酸序列与 ywfE基因编码的蛋白质的氨基酸序列不同。

由相当于pYWFE2、pYWFE3、pYWFE4、pYWFE5、pYWFE8、pYWFE9、pYWFE10以及pYWFE1和pYWFE7中含有的 ywfE基因的基因编码的蛋白质的氨基酸序列如序列号2～8以及1所示，而该基因的碱基序列分别如序列号10～16和36所示。

实验例9 C末端添加His-tag型重组型二肽合成酶的纯化

以枯草芽孢杆菌ATCC15245、ATCC6633、IAM1213、IAM1107、IAM1214、ATCC9466、IAM1033、ATCC21555、或解淀粉芽孢杆菌IFO3022的染色体DNA为模板，使用实验例2所述的引物A和引物B作为引物组进行PCR。PCR通过制备含有0.1μg的染色体DNA、0.5μmol/L的各引物、2.5units的 Pfu DNA聚合酶、4μL的 Pfu DNA聚合酶用×10缓冲液、200μmol/L的各dNTP的反应液40μL，按照94℃下1分钟、55℃下2分钟、72℃下3分钟为一次循环，反复进行30次来实施。

以短小芽孢杆菌NRRL B-12025的染色体DNA作为模板时，使用具有序列号1和32表示的碱基序列的DNA作为引物组，在与上述同样条件下进行PCR。

将该反应液的1/10量进行琼脂糖凝胶电泳，确认相当于 ywfE基因片段的约1.4kb分别扩增后，添加与剩下反应液等量的TE饱和酚/氯仿溶液，并混合。向该溶液经离心分离后得到的上层加2倍容量的冷乙醇，并混合，于-80℃下放置30分钟。将该溶液离心分离得到的DNA沉淀溶解于20μL的TE。

使用各个该溶解液5μL，将扩增的DNA用限制酶 NcoI和 BamHI酶切，通过琼脂糖凝胶电泳分离DNA片段后，使用geneclean II试剂盒，收集含有相当于 ywfE基因的基因的1.4kb DNA片段。

然后将C末端添加His-tag型重组体表达载体pQE600.2μg用限制酶 NcoI和 BamHI酶切后，通过琼脂糖凝胶电泳分离DNA片段，通过与上述同样的方法收集3.4kb的DNA片段。

使用连接试剂盒使上述得到的含有相当于枯草芽孢杆菌168株的 ywfE基因的基因的1.4kb DNA片段和3.4kb的DNA片段于16℃下反应16小时进行连接。

根据众所周知的方法从生长繁殖的转化体菌落提取质粒，通过使用限制酶对它们的构造进行解析，确认取得了作为C末端添加His-tag型基因表达载体的pQE60ywfE1(含有来自ATCC15245的基因的载体)、pQE60ywfE2(含有来自ATCC6633的基因的载体)、pQE60ywfE3(含有来自IAM1213的基因的载体)、pQE60ywfE4(含有来自IAM1107的基因的载体)、pQE60ywfE5(含有来自IAM1214的基因的载体)、pQE60ywfE6(含有来自ATCC9466的基因的载体)、pQE60ywfE7(含有来自IAM1033的基因的载体)、pQE60ywfE8(含有来自ATCC21555的基因的载体)、pQE60ywfE9(含有来自IFO3022的基因的载体)、和pQE60ywfE10(含有来自NRRL B-12025的基因的载体)。

将上述得到的大肠杆菌NM522/pQE60ywfE1～NM522/pQE60ywfE10株分别接种在加入了含有50μg/ml的氨苄青霉素的8ml LB培养基的大型试管，于28℃下培养17小时。将该培养液接种于加入了含有50μg/ml的氨苄青霉素的50ml的LB培养基的250ml容量的三角烧瓶，于30℃下培养3小时后，按照终浓度达到1mmol/L那样添加IPTG，再于30℃下培养4小时。使用HisTrap，根据其使用说明书，从对该培养液进行离心分离得到的湿菌体纯化添加His-tag重组型酶。

实验例10 使用纯化酶生产二肽

制备由实验例9得到的重组型酶0.04mg、100mmol/LTris-HCl(pH8.0)、60mmol/L的氯化镁、60mmol/L的ATP、30mmol/L的L-Ala和30mmol/L的L-Gln构成的0.1ml的反应液，于37℃下进行16小时反应。

反应结束后，通过实验例3所述的方法对反应液进行分析，结果确认3.0～3.5g/L的L-Ala-L-Gln和0.25～0.3g/L的L-Ala-L-Ala生成蓄积。

而如果从上述反应液组成除去ATP，完全不能生成L-Ala-L-Gln和L-Ala-L-Ala。

以上结果表明实验例8得到的基因产物无论那一个都具有在ATP存在下由L-Ala和L-Gln生成L-Ala-L-Gln和L-Ala-L-Ala的活性。

实验例11 albC基因和其类似基因的取得

根据诺尔斯氏链霉菌的 albC基因的碱基序列[Chemistry&Biol.，9，1355(2002)]，通过以下方法从诺尔斯氏链霉菌和小白链霉菌取得albC基因和其类似基因。

首先将诺尔斯氏链霉菌IFO15452株和小白链霉菌IFO14147株分别接种于添加了1％甘氨酸的KM73培养基[2g/l酵母提取液(Difco公司生产)、10g/l可溶性淀粉(和光纯药工业社制)]、KP培养基[15g/l葡萄糖、10g/l甘油、10g/l多胨(日本制药株式会社制)、10g/l肉浸渍液(极东制药工业株式会社生产)、4g/l碳酸钙]，于28℃下振荡培养过夜。而诺尔斯氏链霉菌IFO15452株和小白链霉菌IFO14147株由独立行政法人制品评价技术基盘机构生物资源部门[NationalInstitute of Technology and Evaluation(NITE)BiologicalResource Center(BRC)](

292-0818千叶県木更津市かずさ鎌足2-5-8)惠赠。

培养后，根据Genetic Manipulation of Streptomyces：aLaboratory Manual：John Innes Foundation所述的方法对该微生物的染色体DNA进行分离纯化。

根据 albC基因的碱基序列，使用PerSeptive Biosystems公司制备8905型DNA合成仪，合成具有序列号41和42表示的碱基序列的DNA(以下，分别称为引物J、引物K)。引物J是添加在含有诺尔斯氏链霉菌的染色体DNA的 albC基因起始密码子的区域5′端的含有 NcoI识别序列的碱基序列。引物K是添加在与含有 albC基因的终止密码子的序列互补的碱基序列的5′端的含有 BglII识别序列的碱基序列。

使用上述的引物J和引物K作为引物组，作为模板使用诺尔斯氏链霉菌或小白链霉菌的染色体DNA进行PCR。PCR通过制备含有作为模板的0.1μg的染色体DNA、0.5μmol/L的各引物、2.5units的 Ex TaqDNA聚合酶(Takara Bio公司生产)、5 μL的 ExTaq DNA聚合酶用×l0缓冲液(Takara Bio公司生产)、各200μmol/L的dNTP、5μL的二甲基亚砜的反应液50μL，按照94℃下1分钟、55℃下30秒钟、72℃下1分钟为一次循环，反复进行30次来实施。

将该反应液的1/10量进行琼脂糖凝胶电泳，确认约0.7kb的DNA片段扩增后，添加与剩下反应液等量的TE饱和酚/氯仿溶液，并混合。向该溶液经离心分离后得到的上层力2倍容量的冷乙醇，并混合，于-80℃下放置30分钟。将该溶液离心分离得到的DNA沉淀溶解于20μL的TE。

使用各个该溶解液各5μL，将扩增的DNA用限制酶 NcoI和 BglII进行酶切，通过琼脂糖凝胶电泳将DNA片段分离后，使用geneclean II试剂盒分别收集700bp的DNA片段。

将0.2μg含有噬菌体T5启动子的表达载体pQE60用限制酶 NcoI和 BglII酶切后，通过琼脂糖凝胶电泳将DNA片段分离后，使用与上述同样的方法收集3.4kb的DNA片段。

使用连接试剂盒，使含有上述得到的来自各放线菌的0.7kb片段和来自pQE60的3.4kb片段于16℃下反应16小时，进行连接。

通过众所周知的方法从生长繁殖的转化体菌落提取质粒，使用限制酶对其构造进行解析，确认取得了作为在噬菌体T5启动子下游连接了来自诺尔斯氏链霉菌的DNA的表达载体pAL-nou、和连接了来自小白链霉菌的DNA的表达载体pAL-alb(图3)。

当使用碱基序列测定装置373A·DNA序列仪测定插入到各个质粒的来自放线菌的DNA部分的碱基序列时，确认pAL-alb中含有编码具有序列号37表示的氨基酸序列的蛋白质的DNA、即含有序列号39表示的碱基序列的DNA，在pAL-nou含有编码具有序列号38表示的氨基酸序列的蛋白质的DNA、即具有序列号40表示的碱基序列的DNA

实验例12 使用菌体作为酶源的二肽的制备

将实验例11得到的带有pAL-nou或pAL-alb的大肠杆菌NM522(大肠杆菌NM522/pAL-nou株或NM522/pAL-alb株)和不带有质粒的NM522株接种于加入了含有50μg/ml的氨苄青霉素的10ml LB培养基的试管(对于不带有质粒的株的情况不添加氨苄青霉素，以下同样)，于30℃下培养17小时。将该培养液0.5ml分别接种于加入了50ml的LB培养基的250ml容量的三角烧瓶，于30℃下振荡培养1小时后，按照终浓度达到1mmol/L那样添加IPTG，再继续培养4小时。对该培养液进行离心分离，取得湿菌体。

制备由终浓度100mg/ml的该湿菌体、60mmol/L的磷酸钾缓冲液(pH7.2)、10mmol/L的氯化镁、10mmol/L的ATP、1g/L的L-Leu、1g/L的L-Phe构成的3.0ml反应液，于30℃下进行反应。反应1小时后取样，按照浓度达到20％(v/v)那样加乙腈后，使用HPLC分析反应生成物。通过HPLC进行分析，分离柱使用ODS-HA柱(YMC社制)、作为洗脱液使用30％(v/v)乙腈，以流速0.6ml/min、测定215nm的紫外吸收的条件进行。

结果确认在大肠杆菌NM522/pAL-nou株的反应液中有36.7mg/l的环(L-亮氨酰-L-苯丙氨酸)[cyclo(L-Leu-L-Phe)]的蓄积，但在大肠杆菌NM522株的反应液中完全没有检测到cyclo(L-Leu-L-Phe)。将同样反应液在以下的条件下用HPLC进行分析，测定到作为直链二肽(以下，“直链二肽”简称为“二肽”)的L-亮氨酰-L-苯丙氨酸(L-Leu-L-Phe)和L-苯丙氨酰-L-亮氨酸(L-Phe-L-Leu)。

两二肽用F-moc化法进行衍生化后，使用HPLC进行分析。通过HPLC进行分析，分离柱使用ODS-HG5(野村化学社制)、作为洗脱液使用A液(醋酸6ml/l、20％(v/v)乙腈、用三乙胺调整到pH4.8)和B液(醋酸6ml/l、70％(v/v)乙腈、用三乙胺调整到pH4.8)，按照分析开始后头5分钟洗脱，按照A液∶B液＝8∶2进行，5分钟～20分钟之前进行线性梯度洗脱，在20分钟时A液∶B液＝1∶1，流速0.6ml/分钟、激发波长254nm、荧光波长630nm检测二肽的条件下进行。

结果确认在大肠杆菌NM522/pAL-nou株的反应液中有21.9mg/L的L-Leu-L-Phe和12.0mg/L的L-Phe-L-Leu蓄积。而在作为对照株使用的大肠杆菌NM522株的反应液中没有检测到任何二肽。

这表明实验例11中取得的环二肽合成酶具有合成直链二肽的能力。

实验例13 使用纯化酶制备二肽(1)

与实验例12同样培养大肠杆菌NM522/pAL-nou株。培养结束后通过离心分离取得湿菌体，用60mmol/L的磷酸钾缓冲液(pH7.2)清洗后，悬浮于含有10mmol/L咪唑的20mmol/L磷酸钾缓冲液。将该悬浮液于4℃下进行超声波处理，取得菌体裂解液。将该菌体裂解液(10ml、含蛋白质0.863mg)加到Amersham公司生产的His-tag纯化柱，通过加含有10mmol/L的咪唑的20mmol/L的磷酸钾缓冲液15ml进行清洗，于柱内对附带His-tag的 albC蛋白质进行纯化。然后向保持这个附带His-tag的albC蛋白质的柱加与实验例12同组成的反应液(反应液组成：60mmol/L的磷酸钾缓冲液(pH7.2)、10mmol/L的氯化镁、10mmol/L的ATP、1g/L的L-Leu、1g/L的L-Phe构成的反应液)2ml，在柱内保持底物的状态下，于30℃进行温育。24小时后用同组成的反应液3ml对柱内的反应液进行洗脱，通过与实验例12同样的方法对反应液中的环二肽和二肽进行定量。

从结果可知生成了cyclo(L-Leu-L-Phe)6.8mg/L、L-Leu-L-Phe28.7mg/L和L-Phe-L-Leu18.5mg/L。在用不合有ATP的反应液进行同样温育时，环二肽、肽都没有检测到。

实验例14 使用纯化酶制备二肽(2)

除了将底物氨基酸换成其它的氨基酸以外，用与实验例13同样的方法进行酶反应，对生成物进行分析。反应液除了将底物氨基酸换成为1g/L的L-Ala、L-Leu或L-Phe以外，使用与实验例13同样组成的溶液。

从该结果可知在反应开始后24小时内，分别生成了9.41mg/L的L-Ala-L-Ala、7.85mg/L的L-Leu-L-Leu、或5.20mg/L的L-Phe-L-Phe。

实验例15 强化 ywfE基因表达的大肠杆菌的制作

使用PerSeptive Biosystems公司制备8905型DNA合成仪，合成分别具有序列号94～97表示的序列的DNA(以下，分别称为引物L、引物M、引物N、引物O)。序列号94是添加在含有作为质粒pQE60ywfE的 ywfE基因的核糖体结合序列的Shine-Dalgarno序列区域5’端的含有 XhoI识别序列的序列。序列号95的序列是添加在与含有 ywfE基因的终止密码子的序列互补的序列的5’端的含有 BamHI识别序列的序列。而序列号96是添加在含有 trp启动子的表达载体pTrS30的trp启动子区域序列的5’端的含有 EcoRI识别序列的序列。序列号97是添加在与含有 trp启动子的表达载体pTrS30的 trp启动子区域的序列互补的序列号5’端的含有 XhoI识别序列的序列。

以质粒pQE60ywfE作为模板，在 ywfE基因片段的扩增中，使用上述的引物L和引物M，在 trp启动子区域的片段的扩增中使用引物N和引物O作为引物组进行PCR。PCR通过制备含有10ng的pQE60ywfE、0.5μmol/L的各引物、2.5units的 Pfu DNA聚合酶、4μL的 Pfu DNA聚合酶用×10缓冲液、200μmol/L的各dNTP的40μL的反应液，按照94℃下1分钟、55℃下2分钟、72℃下3分钟为一次循环，反复进行30次来实施。

将该反应液的1/10量进行琼脂糖凝胶电泳，确认在使用引物L和引物M的PCR中相当于 ywfE基因片段的约1.4kb、在使用引物N和引物O的反应中相当于 trp启动子区域的DNA片段的约0.3kb DNA片段分别扩增后，添加与剩下反应液等量的TE饱和酚/氯仿溶液，并混合。向该溶液经离心分离后得到的上层加2倍容量的冷乙醇，并混合，于-80℃下放置30分钟。将该溶液离心分离使DNA沉淀后，将该DNA溶解于20μL的TE。

使用上述得到的各个DNA溶液5μL，将用引物L和引物M扩增的DNA用限制酶 XhoI和 BamHI进行酶切，而使用引物N和引物O扩增的DNA用限制酶 EcoRI和 XhoI进行酶切，通过琼脂糖凝胶电泳将DNA片段分离后，使用geneclean II试剂盒，分别收集含有 ywfE的1.4kb和含有 trp启动子区域的0.3kb的DNA片段。

将含有0.2μg的 trp启动子的表达载体pTrS30用限制酶 EcoRI和 BamHI酶切后，通过琼脂糖凝胶电泳分离DNA片段，同样收集4.5kb的DNA片段。

使用连接试剂盒，使上述得到的含有 ywfE的1.4kb片段、含有 trp启动子区域的0.3kb片段和4.5kb的片段于16℃下进行16小时连接反应。

根据众所周知的方法从生长繁殖的转化体菌落提取质粒，得到在trp启动子下游含有 ywfE基因的表达载体pPE56。通过限制酶消化确认了该载体的结构(图4)。

实验例16 pepD基因、 pepN基因、 pepB基因、 pepA基因和 dpp操纵子缺失株的制作

大肠杆菌染色体DNA上的特定基因缺失的菌株根据利用λ噬菌体的同源重组系的方法[Proc.Natl.Acad.Sci.USA， 97，6641-6645(2000)]进行制作。

以下所述的质粒pKD46、pKD3和pCP20使用通过从大肠杆菌基因贮存中心(美国耶鲁大学)获得保持该质粒的大肠杆菌株，通过众所周知的方法从该株提取的。

(1)基因缺失用DNA片段的克隆

以使存在于大肠杆菌K12株的染色体DNA上的具有序列号53表示的碱基序列的 pepD基因、具有序列号54表示的碱基序列的 pepN基因、具有序列号55表示的碱基序列的 pepB基因、具有序列号56表示的碱基序列的 pepA基因和具有序列号57表示的碱基序列的 dppA基因、具有序列号58表示的碱基序列的 dppB、具有序列号59表示的碱基序列的 dppC基因、具有序列号60表示的碱基序列的 dppD基因和具有序列号61表示的碱基序列的 dppF基因缺失为目的，使用PerSeptiveBiosystems公司制备8905型DNA合成仪，合成与位于大肠杆菌K12株的染色体DNA上的各个缺失靶基因的上游和下游的由36bp构成的碱基序列同源的碱基序列、和具有序列号52表示的来自酵母的Flp重组酶识别的碱基序列的DNA。但是 dppA基因、 dppB基因、 dppC基因、dppD基因和 dppF基因因为形成操纵子，合成与位于该操纵子的上游和下游的碱基序列同源的碱基序列的DNA。

即，分别合成由作为 pepD基因缺失用DNA片段扩增用引物组的序列号62和63、作为 pepN基因缺失用DNA片段扩增用引物组的序列号64和65、作为 pepA基因缺失用DNA片段扩增用引物组的序列号66和67、作为 pepB基因缺失用DNA片段扩增用引物组的序列号68和69、作为 dpp操纵子缺失用DNA片段扩增用引物组的序列号70和71表示的碱基序列构成的DNA。

然后使用上述合成DNA作为引物组，以pKD3DNA作为模板进行PCR。PCR通过使用含有10ng的质粒DNA、0.5μmol/L的各引物、2.5units的 Pfu DNA聚合酶、4μL的 Pfu DNA聚合酶用×10缓冲液、200μmol/L的各deoxyNTP的40μL反应液，按照94℃下1分钟、55℃下2分钟、72℃下3分钟为一次循环，反复进行30次来实施。

将各个反应液的1/10量进行琼脂糖凝胶电泳，确认目的片段扩增后，添加与剩下的反应液等量的TE饱和酚/氯仿，并进行混合。

将该混合液离心分离后，向得到的上层加2倍容量的冷乙醇，并混合，于-80℃下放置30分钟。对该溶液进行离心分离，取得含有 pepD基因、 pepN基因、 pepB基因、 pepA基因和 dpp操纵子缺失用氯霉素抗性基因的DNA片段。

(2) pepD基因缺失大肠杆菌JM101的制作

用pKD46转化大肠杆菌JM101株后，涂布于含有100mg/L的氨苄青霉素的LB琼脂培养基，通过于30℃下进行培养，选择带有pKD46的大肠杆菌JM101株(以下，称为大肠杆菌JM101/pKD46)。

质粒pKD46含有λRed重组酶基因，该基因的表达可以通过L-阿拉伯糖诱导。因此如果将在L-阿拉伯糖存在下能够生长繁殖的带有pKD46的大肠杆菌用直链状DNA进行转化，会高频率地发生同源重组。另外pKD46由于具有温度敏感性的复制起点，通过在42℃下使其生长繁殖，可以很容易地使质粒脱落。

通过电脉冲法将上述取得的含有 pepD基因缺失用氯霉素抗性基因的DNA片段导入在10mmol/L的L-阿拉伯糖和50μg/ml的氨苄青霉素存在下培养得到的大肠杆菌JM101/pKD46，将通过同源重组在大肠杆菌JM101的染色体DNA中转运了 pepD基因缺失用含有氯霉素抗性基因的DNA片段的转化株涂布于含有25mg/L的氯霉素的LB琼脂培养基(细菌培养用胰化蛋白胨10g/L、细菌培养用酵母提取物5g/L、氯化钠5g/L、琼脂15g/L)，通过于30℃下培养进行选择。

将选择的氯霉素抗性株接种于含有25mg/L的氯霉素的LB琼脂培养基，于42℃下培养14小时后，进行单菌落分离。将得到的各菌落影印在含有25mg/L的氯霉素的LB琼脂培养基、以及含有100mg/l的氨苄青霉素的LB琼脂培养基，于37℃培养，通过选择表现出氯霉素抗性，而且表现出氨苄青霉素敏感性的菌落，取得pKD46脱落株。

然后使用pCP20转化上述得到的pKD46脱落株，通过在含有100mg/l的氨苄青霉素的LB琼脂培养基上进行选择，取得保持pCP20的pKD46脱落株。

质粒pCP20具有来自酵母的Flp重组酶基因，该基因的表达可以在42℃下进行诱导。

另外由于在上述制作的含有 pepD基因、 pepN基因、 pepB基因、pepA基因和 dpp操纵子缺失用氯霉素抗性基因的DNA片段的氯霉素抗性基因的两端存在Flp重组酶识别的碱基序列，通过Flp重组酶催化的同源重组可以很容易地使该抗性基因脱落。

另外由于pCP20含有温度敏感性的复制起点，通过使pCP20保持株在42℃下生长繁殖，可以同时诱导Flp重组酶的表达和pCP20的脱落。

将上述取得的带有pCP20的pKD46脱落株接种于没有添加药物的LB琼脂培养基，于42℃下培养14小时后，进行单菌落分离。将得到的各菌落影印在没有添加药物的LB琼脂培养基、含有25mg/L氯霉素的LB琼脂培养基和含有100mg/L氨苄青霉素的LB琼脂培养基，于30℃下培养，选择表现出氯霉素敏感性，而且表现出氨苄青霉素敏感性的菌落。

根据常规方法(生物工学实验书、日本生物工学会编97～98页、培风馆、1992年)从上述选择的各株制备各个染色体DNA。使用根据缺失靶基因 pepD基因的内部碱基序列设计的具有序列号84和85表示的碱基序列的DNA作为引物组，以染色体DNA作为模板进行PCR。PCR通过使用含有0.1g的染色体DNA、0.5μmol/L的各引物、2.5units的Pfu DNA聚合酶、4μL的 Pfu DNA聚合酶用×10缓冲液、200μmol/L的各deoxyNTP的40μL反应液，按照94℃下1分钟、55℃下2分钟、72℃下3分钟为一次循环，反复进行30次来实施。

在上述PCR中，将没有检测到扩增DNA片段的株作为 pepD基因缺失株，命名为大肠杆菌JPD1株。

(3)大肠杆菌JM101的染色体DNA上的 pepD基因和 pepN基因缺失株的制作

将上述(2)得到的大肠杆菌JPD1株用pKD46转化后，涂布于含有100mg/l氨苄青霉素的LB琼脂培养基，通过于30℃下进行培养，选择保持pKD46的大肠杆菌JPD1(以下，称为大肠杆菌JPD1/pKD46)。通过电脉冲法将含有 pepN基因缺失用氯霉素抗性基因的DNA片段导入大肠杆菌JPD1/pKD46，通过同源重组取得在大肠杆菌JPD1/pKD46的染色体DNA上转运了含有 pepN基因缺失用氯霉素抗性基因的DNA片段的转化株。

然后通过进行与上述(2)同样的操作，取得从染色体DNA上氯霉素抗性基因脱落的株，将该株命名为大肠杆菌JPDN2。

(4)大肠杆菌JM101的染色体DNA上的 pepN基因、 pepA基因、 pepB基因或 dpp操纵子缺失株和多重基因缺失株的制作

pepN基因、 pepA基因、 pepB基因或 dpp操纵子的缺失株使用上述(1)制作的含有各基因或操纵子缺失用氯霉素抗性基因的DNA片段，通过与上述(2)同样的方法进行制作。

通过上述方法取得的各个基因缺失株可以通过使用根据各个缺失基因的内部碱基序列设计、合成的具有序列号74～81表示的碱基序列的DNA作为引物组，通过与上述(2)同样的PCR确认。其中由序列号74和75表示的碱基序列构成的DNA为 pepN缺失确认用、由序列号76和77表示的碱基序列构成的DNA为 pepA缺失确认用、由序列号78和79表示的碱基序列构成的DNA为 pepB缺失确认用、由序列号80和81表示的碱基序列构成的DNA为 dpp操纵子缺失确认用引物组。

将上述方法取得的 dpp操纵子缺失株取名为大肠杆菌JDPP1株、pepN基因缺失株取名为大肠杆菌JPN1株、 pepA基因缺失株取名为大肠杆菌JPA1株、 pepB基因缺失株取名为大肠杆菌JPB7株。

另外根据上述(3)的方法，制作由 pepD基因、 pepN基因、 pepA基因、 pepB基因和 dpp操纵子中选择的2个以上基因或操纵子的多重缺失株。多重缺失株能够取得的确认通过与上述(2)同样的PCR确认。将用上述方法取得的 pepD基因和 dpp操纵子缺失的二重基因缺失株命名为大肠杆菌JPDP49株，将 pepB基因、 pepD基因和 pepN基因缺失的三重基因缺失株命名为大肠杆菌JPDNB43株，将 pepD基因、 pepN基因和 dpp操纵子缺失的三重基因缺失株命名为大肠杆菌JPNDDP36株，将 pepA基因、 pepD基因、 pepN基因和 dpp操纵子缺失的四重基因缺失株命名为大肠杆菌JPNDAP5株，将 pepB基因、 pepD基因、 pepN基因和 dpp操纵子缺失的四重基因缺失株命名为大肠杆菌JPNDBP7株。表2给出了各基因缺失株中缺失基因名。

表2

菌株名	缺失基因
菌株名	缺失基因	JM101	无
JDPP1	dpp操纵子	JM101	无
JDPP1	dpp操纵子	JPN1	pepN
JPA1	pepA	JPN1	pepN
JPA1	pepA	JPB7	pepB
JPD1	pepD	JPB7	pepB
JPD1	pepD	JPDN2	pepD，pepN
JPNDB43	pepB，pepD，pepN	JPDN2	pepD，pepN
JPNDB43	pepB，pepD，pepN	JPDP49	pepD，dpp操纵子
JPNDDP36	pepD，pepN，dpp操纵子	JPDP49	pepD，dpp操纵子
JPNDDP36	pepD，pepN，dpp操纵子	JPNDAP5	pepA，pepD，pepN，dpp操纵子
JPNDBP7	pepB，pepD，pepN，dpp操纵子	JPNDAP5	pepA，pepD，pepN，dpp操纵子

实验例17 使用肽酶和二肽转运活性丧失的大肠杆菌的L-Ala-L-Gln和L-Ala-L-Ala产率的评价

用实验例16得到的质粒pPE56转化实验例15得到的编码各种肽酶和二肽转运蛋白质的基因的缺失株，取得表现出氨苄青霉素抗性的转化株。

将得到的转化株接种于加入了含有50μg/ml的氨苄青霉素的8mlLB培养基的试管，于28℃下培养17小时。将1％该培养液添加到加入了含有100μg/ml的氨苄青霉素的8ml水性介质(磷酸氢二钾16g/L、磷酸二氢钾14g/L、硫酸铵5g/L、柠檬酸(无水)1g/L、Casaminoacid(Difco社制)0.5g/L、L-Pro1 g/L、L-Ala2.5 g/L、L-Gln2.5g/L、葡萄糖10g/l、维生素B110mg/L、硫酸镁·7水合物25mg/l、硫酸铁7水合物50mg/l、使用10mol/l的氢氧化钠溶液调整到pH7.2。L-Gln为10倍浓缩液经滤膜过滤灭菌后添加、葡萄糖、维生素B₁、硫酸镁·7水合物、硫酸铁·7水合物分别蒸气灭菌后添加)的试管中，于30℃下反应24小时。将该水性介质进行离心分离，取得上清。

该上清中的产物用F-moc化法进行衍生化后，使用HPLC进行分析。通过HPLC进行分析，分离柱使用ODS-HG5(野村化学社制)、作为洗脱液使用A液(醋酸6ml/l、20％(v/v)乙腈、用三乙胺调整到pH4.8)和B液(醋酸6ml/l、70％(v/v)乙腈、用三乙胺调整到pH4.8)，在分析开始后头5分钟，A液∶B液＝8∶2，在5分～20分钟进行线性梯度洗脱，当20分钟时，使A液∶B液＝1∶1的条件下进行。分析结果如表3所示。

表3

菌株名	缺失基因	L-Ala-L-Gln(g/l)	L-Ala-L-Ala(g/l)
菌株名	缺失基因	L-Ala-L-Gln(g/l)	L-Ala-L-Ala(g/l)	JM101	无	0	0
JDPP1	dpp操纵子	0.02	0.01	JM101	无	0	0
JDPP1	dpp操纵子	0.02	0.01	JPN1	pepN	0.01	0.01
JPA1	pepA	0.01	0.01	JPN1	pepN	0.01	0.01
JPA1	pepA	0.01	0.01	JPB7	pepB	0.01	0.01
JPD1	pepD	0.01	0.01	JPB7	pepB	0.01	0.01
JPD1	pepD	0.01	0.01	JPDN2	pepD，pepN	0.02	0.03
JPNDB43	pepB，pepD，pepN	0.05	0.12	JPDN2	pepD，pepN	0.02	0.03
JPNDB43	pepB，pepD，pepN	0.05	0.12	JPDP49	pepD，dpp操纵子	0.11	0.08
JPNDDP36	pepD，pepN，dpp操纵子	0.16	0.21	JPDP49	pepD，dpp操纵子	0.11	0.08
JPNDDP36	pepD，pepN，dpp操纵子	0.16	0.21	JPNDAP5	pepA，pepD，pepN，dpp操纵子	0.28	0.26
JPNDBP7	pepB，pepD，pepN，dpp操纵子	0.43	0.22	JPNDAP5	pepA，pepD，pepN，dpp操纵子	0.28	0.26

由表3可知在2种以下肽酶基因缺失的微生物、仅1种肽转运蛋白质缺失的微生物中，二肽的生成、蓄积量低，而在1种以上肽酶基因和1种肽转运蛋白质缺失的微生物、或3种以上肽酶活性丧失的微生物中，二肽的生成、蓄积量大幅度增加。

实验例18 使用肽酶和肽转运蛋白质活性丧失的大肠杆菌株的L-丙氨酰-L-缬氨酸(以下，称为L-Ala-L-Val)产率的评价

与实验例17同样，用pPE56转化编码各种肽酶的基因和编码肽转运蛋白质的操纵子缺失的大肠杆菌株。将得到的转化株接种于加入了含有50μg/ml的氨苄青霉素的8ml LB培养基的试管，于28℃下培养17小时。将该培养液1％添加到加入了含100μg/ml氨苄青霉素的8ml水性介质(磷酸氢二钾16g/l、磷酸二氢钾14g/l、硫酸铵5g/l、柠檬酸(无水)1g/l、Casamino acid(Difco社制)0.5g/l、L-Pro1g/l、L-Ala2.5g/l、L-Val2.5g/l、葡萄糖10g/l、维生素B₁10mg/l、硫酸镁·7水合物25mg/l、硫酸铁·7水合物50mg/l、用10mol/l的氢氧化钠溶液调整到pH7.2。葡萄糖、维生素B₁、硫酸镁·7水合物、硫酸铁·7水合物分别蒸煮后添加)的试管，于30℃下反应24小时。对该水性介质进行离心分离，取得上清。

通过实验例17所述的方法对该上清中的生成物进行分析。结果如表4所示。

表4

菌株名	缺失基因	L-Ala-L-Val(g/l)
菌株名	缺失基因	L-Ala-L-Val(g/l)	JM101	无	0
JDPP1	dpp操纵子	0	JM101	无	0
JDPP1	dpp操纵子	0	JPN1	pepN	0
JPA1	pepA	0	JPN1	pepN	0
JPA1	pepA	0	JPB7	pepB	0
JPD1	pepD	0	JPB7	pepB	0
JPD1	pepD	0	JPDN2	pepD，pepN	0
JPNDB43	pepB，pepD，pepN	0.04	JPDN2	pepD，pepN	0
JPNDB43	pepB，pepD，pepN	0.04	JPDP49	pepD，dpp操纵子	0.11
JPNDDP36	pepD，pepN，dpp操纵子	0.22	JPDP49	pepD，dpp操纵子	0.11
JPNDDP36	pepD，pepN，dpp操纵子	0.22	JPNDBP7	pepB，pepD，pepN，dpp操纵子	0.20

由表4可知2种以下肽酶基因缺失的微生物和只1种肽转运蛋白质缺失的微生物不生产二肽，3种以上肽酶基因缺失的微生物、或1种以上肽酶基因和1种肽转运蛋白质缺失的微生物生产二肽。

实验例19 使用肽酶和二肽转运系蛋白质的活性丧失的大肠杆菌株的甘氨酰-L-谷氨酰胺(以下，称为Gly-L-Gln)产率的评价

与实验例17同样，用pPE56转化编码各种肽酶的基因和编码二肽转运蛋白质的操纵子缺失株。将得到的转化株接种于加入了含有50μg/ml的氨苄青霉素的8ml LB培养基的试管，于28℃下培养17小时。

将该培养液1％添加到加入了含100μg/ml氨苄青霉素的8ml水性介质(磷酸氢二钾16g/l、磷酸二氢钾14g/l、硫酸铵5g/l、柠檬酸(无水)1g/l、Casamino acid(Difco社制)0.5g/L、L-Pro 1g/L、Gly2.5g/L、L-Gln2.5 g/L、葡萄糖10g/l、维生素B₁10mg/l、硫酸镁·7水合物25mg/l、硫酸铁·7水合物50mg/l、用10mol/l的氢氧化钠溶液调整到pH7.2。L-Gln为10倍浓缩液经滤膜过滤灭菌后添加、葡萄糖、维生素B₁、硫酸镁·7水合物、硫酸铁·7水合物分别经蒸气灭菌后添加)的试管，于30℃下反应24小时。对该水性介质进行离心分离，取得上清。

通过实验例17所述的方法对该该上清中的生成物进行分析。结果如表5所示。

表5

菌株名	缺失基因	Gly-L-Gln(g/l)
菌株名	缺失基因	Gly-L-Gln(g/l)	JM101	无	0
JDPP1	dpp操纵子	0	JM101	无	0
JDPP1	dpp操纵子	0	JPDN2	pepD，pepN	0
JPNDB43	pepB，pepD，pepN	0.01	JPDN2	pepD，pepN	0
JPNDB43	pepB，pepD，pepN	0.01	JPNDDP36	pepD，pepN，dpp操纵子	0.02
JPNDBP7	pepB，pepD，pepN，dpp操纵子	0.03	JPNDDP36	pepD，pepN，dpp操纵子	0.02

由表5可知2种以下肽酶基因缺失的微生物、和只1种肽转运蛋白质缺失的微生物不生产二肽，3种以上肽酶缺失的微生物、或2种以上肽酶基因和1种肽转运蛋白质缺失的微生物生产二肽。

下面表示的是实施例，不过本发明不限于下述的实施例。

实验例1使用氨基酸和氨基酸衍生物作为底物的二肽衍生物的酶催化制备方法

制备由实验例4中取得的纯化的添加His-tag重组型酶40mg/L、100mmol/L的Tris-HCl(pH9.0)、30mmol/L的氯化镁、10mmol/L的ATP、各10mmol/L的表6记载的氨基酸或氨基酸衍生物组成的0.1ml反应液，于37℃下反应2小时。

反应结束后，向反应液中加反应液的100倍量的停止缓冲液(4mol/L尿素、100mmol/L EDTA·2钠盐)，停止反应，通过使用HPLC对因酶反应消耗ATP时生成的ADP量进行分析，确认反应进行。利用HPLC分析，柱子使用Develosil C30-UG-5(150×4.6mm、野村化学公司生产)、移动相使用由200mmol/L的醋酸和200mmol/L的三乙基胺构成的溶液(pH6.6)，流速1.0ml/分钟、室温、测定254nm的紫外吸收的条件下进行。结果如表6所示。

【表6-1】

添加氨基酸	生成ADP量(mmol/L)
添加氨基酸	生成ADP量(mmol/L)	不添加	0.05
仅是Ala	0.13	不添加	0.05
仅是Ala	0.13	Ala+cyc(5)Ala	5.67
Ala+cyc(3)Ala	3.64	Ala+cyc(5)Ala	5.67
Ala+cyc(3)Ala	3.64	Ala+cyc(6)Ala	3.78

【表6-2】

添加氨基酸	生成ADP量(mmol/L)
添加氨基酸	生成ADP量(mmol/L)	不添加	0.05
仅是Ala	0.13	不添加	0.05
仅是Ala	0.13	仅是Phe	0.02
Ala+Phe	5.84	仅是Phe	0.02
Ala+Phe	5.84	Ala+Cl-Phe	4,78
Cl-Ala+Phe	2.75	Ala+Cl-Phe	4,78
Cl-Ala+Phe	2.75	CN-Ala+Phe	1.11
Ala+Cl-Phe	4.78	CN-Ala+Phe	1.11
Ala+Cl-Phe	4.78	Ala+F-Phc	4.44
Ala+Ni-Phe	4.42	Ala+F-Phc	4.44
Ala+Ni-Phe	4.42	Ala+NH₂-Phe	1.89
Ala+Kynurenin	2.11	Ala+NH₂-Phe	1.89

【表6-3】

添加氨基酸	生成ADP量(mmol/L)
添加氨基酸	生成ADP量(mmol/L)	不添加	0.05
仅是Ala	0.13	不添加	0.05
仅是Ala	0.13	仅是Glu	0.13
Ala+Glu(OMe)	2.60	仅是Glu	0.13
Ala+Glu(OMe)	2.60	Ala+Glu(OEt)	3.93
Ala+Glu(OtBu)	6.43	Ala+Glu(OEt)	3.93
Ala+Glu(OtBu)	6.43	Ala+Glu(OBzl)	6.01

【表6-4】

添加氨基酸	生成ADP量(mmol/L)
添加氨基酸	生成ADP量(mmol/L)	不添加	0.05
仅是Ala	0.13	不添加	0.05
仅是Ala	0.13	仅是Asp	0.16
Ala+Asp(OMe)	0.54	仅是Asp	0.16
Ala+Asp(OMe)	0.54	Ala+Asp(OtBu)	4.42
Ala+Asp(OBzl)	3.23	Ala+Asp(OtBu)	4.42

【表6-5】

添加氨基酸	生成ADP量(mmol/L)
添加氨基酸	生成ADP量(mmol/L)	不添加	0.05
仅是Ala	0.13	不添加	0.05
仅是Ala	0.13	仅是Lys	0.17
Ala+Lys(Ac)	0.75	仅是Lys	0.17
Ala+Lys(Ac)	0.75	Ala+Lys(Boc)	3.64

表6-1是使用L-Ala和L-Ala衍生物、表6-2是使用L-Ala和L-Phe衍生物、表6-3是使用L-Ala和L-Glu衍生物、表6-4是使用L-Ala和L-Asp衍生物、表6-5是使用L-Ala和L-Lys衍生物作为底物的实验结果，作为底物使用的氨基酸和氨基酸衍生物的简称如下所示。

Ala：L-丙氨酸

Phe：L-苯丙氨酸

Glu：L-谷氨酸

Asp：L-天冬氨酸

Lys：L-赖氨酸

Cl-Ala：β-氯-L-丙氨酸

CN-Ala：β氰-L-丙氨酸

cyc(5)Ala：β-环五-DL-丙氨酸

cyc(3)Ala：β-环三丙氨酸

cyc(6)Ala：β-环六丙氨酸

Cl-Phe：4-氯苯丙氨酸

F-Phe：4-氟苯丙氨酸

Ni-Phe：p-镍苯丙氨酸

NH₂-Phe：p-氨基苯丙氨酸

Phe-NH₂：苯丙氨酸酰胺

Kynurenin：L-犬尿氨酸

Glu(OMe)：谷氨酸-γ-甲酯

Glu(OEt)：谷氨酸-γ-乙酯

Glu(OtBu)：谷氨酸-γ-t丁酯

Glu(OBzl)：谷氨酸-γ-苄酯

Asp(OMe)：天冬氨酸-β-甲酯

Asp(OtBu)：天冬氨酸-β-t丁酯

Asp(OBzl)：天冬氨酸-β-苄酯

Lys(Ac)：乙酰赖氨酸

Lys(Boc)：Boc-赖氨酸

就象表6表示的那样，作为对照的没有添加底物区和在分别仅使用L-Ala、L-Phe、L-Glu、L-Asp、L-Lys作为单独底物的试验区的ADP生成量为0.02～0.1 mmol/L，而相反在表1给出的氨基酸和氨基酸衍生物的组合中，生成了0.54～6.43mmol/L的ADP。

另外，通过质子NMR分析，对在与上述同样反应条件反应的存在于反应液中的化合物的构造进行解析。但反应中使用的底物氨基酸和氨基酸衍生物的浓度，在反应液1、4、10和11中为20mmol/L、其它的反应液用10mmol/L的浓度。

质子NMR分析使用Bruker公司生产的DMX500，在以下的条件下进行。

温度：303K

标准物质：1mmpl/L的3-(Trimethylsilyl)-Propionic acid-D4sodium salt(TSP)

介质：反应液4、10和11为轻水、其它的反应液为重水

反应液中化合物的构造根据α位的质子化学位移进行鉴定。各化合物的浓度以TSP的面积作为内部标准，以α位的质子的信号面积为基础算出的(表7)。但是L-Ala-L-Ala由于浓度低、α位的质子的信号重合，所以以β位的质子的信号面积为基础算出。另外括号内表示各化合物的α位质子化学位移(单位为ppm)。

使用Cl-Ala和Phe作为底物的反应液(反应液1)

Cl-Ala(4.20)、Phe(4.02)、Cl-Ala-Phe(3.93，4.50)、Aziridine-2-carboxylic acid[Azc](2.73)、Azc-Phe(2.59，4.47)

使用CN-Ala和Phe作为底物的反应液(反应液2)

CN-Ala(3.87)、Phe(4.00)、CN-Ala-Phe(3.71，4.48)

使用Ala和Cl-Phe作为底物的反应液(反应液3)

Ala(3.79)、Cl-Phe(3.97)、Ala-Cl-Phe(3.90，4.43)

使用Ala和NH₂-Phe作为底物的反应液(反应液4)

Ala(3.78)、NH₂-Phe(3.93)、Ala-NH₂-Phe(3.95，4.39)、Ala-Ala(β；1.55，1.36)

使用Ala和Kinurenine作为底物的反应液(反应液5)

Ala(3.79)、Kinurenine(4.16)、Ala-Kinurenine(3.96，4.64)

使用Ala和Phe-NH₂作为底物的反应液(反应液6)

Ala(3.79)、Phe-NH₂(4.02)、Ala-Phe-NH₂(3.90，4.60)

使用Ala和Glu(OMe)作为底物的反应液(反应液7)

Ala(3.79)、Glu(OMe)(3.76)、Ala-Glu(OMe)(4.05，4.18)、Ala-Ala(β；1.55，1.36)

使用Ala和Glu(OtBu)作为底物的反应液(反应液8)

Ala(3.79)、Glu(OtBu)(3.76)、Ala-Glu(OtBu)(4.04，4.18)

使用Ala和Asp(OtBu)作为底物的反应液(反应液9)

Ala(3.g1)、Asp(OtBu)(3.98)、Ala-Asp(OtBu)(4.04，4.46)

使用Ala和Lys(Boc)作为底物的反应液(反应液10)

Ala(3.78)、Lys(Boc)(3.73)、Ala-Lys(Boc)(4.02，4.14)

使用Ala和cyc(3)Ala作为底物的反应液(反应液11)

Ala(3.78)、cyc(3)Ala(3.82)、Ala-cyc(3)Ala(4.08，4.24)

使用Ala和cyc(6)Ala作为底物的反应液(反应液12)

Ala(3.79)、cyc(6)Ala(3.76)、Ala-cyc(6)Ala(4.02，4.22)

【表7】

反应液	二肽	浓度(mM)
反应液	二肽	浓度(mM)	1	Cl-Ala-Phe	3.5
Azc-Phc	5.3			Cl-Ala-Phe	3.5
Azc-Phc	5.3	2		Cl-Ala	8.4
(Cl-Ala)X2	Overlap			Cl-Ala	8.4
(Cl-Ala)X2	Overlap		3	Ala-Cl-Phe	4.3
4	Ala-NH₂-Phe	10.6	3	Ala-Cl-Phe	4.3
	Ala-NH₂-Phe	10.6	Ala-Ala	0.3
	5	Ala-Kinurenine	Ala-Ala	0.3	4.0
6	5	Ala-Kinurenine	Ala-NH2-Phe	9.7	4.0
6	7	Ala-Glu(OMe)	Ala-NH2-Phe	9.7	6.5
Ala-Ala		Ala-Glu(OMe)	0.5		6.5
Ala-Ala		8	0.5	Ala-Glu(OtBu)	9.7
9	Ala-Asp(OtBu)	8	10.6	Ala-Glu(OtBu)	9.7
9	Ala-Asp(OtBu)	10	10.6	Ala-Lys(Boc)	6.6
11	Ala-Cyc(3)Ala	10	10.5	Ala-Lys(Boc)	6.6
11	Ala-Cyc(3)Ala	12	10.5	Ala-Cyc(6)Ala	6.6

表中的“overlap”表示由于信号重合，不能进行正确定量。

上述结果表明通过本发明的制备方法以氨基酸和氨基酸衍生物作为底物，可以直接制备由氨基酸和氨基酸衍生物通过肽键形成的二肽衍生物。

实验例2

N-[2-(乙酰氨基)丙酰]苯丙氨酸的制备

将实验例6中得到的L-Ala-L-phe(100mg，0.423mmol)悬浮于二氯甲烷(10mL)，于室温下加吡啶(10mL)和无水醋酸(1mL，11mmol)。室温下搅拌24小时后，加水，用氯仿萃取3次。将有机层用饱和盐水清洗，用无水磷酸镁干燥后，通过减压下对溶剂进行蒸馏，得到N-[2-(乙酰氨基)丙酰]苯丙氨酸。

实验例3

1-{2-[N-(2-(乙酰氨基)丙酰)氨基]-3-苯丙酰}哌啶的制备

将实验例2得到的N-[2-(乙酰氨基)丙酰]苯丙氨酸(10mg，0.036mmol)悬浮于N，N-二甲基甲酰胺(5mL)，于室温下加1-(3-二甲基氨基丙基)-3-乙基碳二亚胺盐酸盐(14mg，0.073mmol)、1-羟基苯并三唑基(15mg，0.11mmol)和哌啶(40μL，0.40mmol)，在50℃下搅拌24小时。向反应混合物中加水，用氯仿萃取3次。将有机层用10％盐酸和饱和盐水清洗，用无水磷酸镁干燥后，在减压下将溶剂蒸馏。通过将得到的残留物用硅胶柱层析进行纯化，得到1-{2-[N-(2-(乙酰氨基)丙酰)氨基]-3-苯丙酰}哌啶。

序列表Free Text

序列号19-人工序列的说明：合成DNA

序列号20-人工序列的说明：合成DNA

序列号21-人工序列的说明：合成DNA

序列号22-人工序列的说明：合成DNA

序列号23-人工序列的说明：合成DNA

序列号24-人工序列的说明：合成DNA

序列号25-人工序列的说明：合成DNA

序列号26-人工序列的说明：合成DNA

序列号27-人工序列的说明：合成DNA

序列号28-人工序列的说明：合成DNA

序列号29-人工序列的说明：合成DNA

序列号30-人工序列的说明：合成DNA

序列号31-人工序列的说明：合成DNA

序列号32-人工序列的说明：合成DNA

序列号33-人工序列的说明：数据库检索中使用的氨基酸序列

序列号34-人工序列的说明：数据库检索中使用的氨基酸序列

序列号35-人工序列的说明：数据库检索中使用的氨基酸序列

序列号41-人工序列的说明：合成DNA

序列号42-人工序列的说明：合成DNA

序列号52-人工序列的说明：合成DNA

序列号53-人工序列的说明：合成DNA

序列号54-人工序列的说明：合成DNA

序列号55-人工序列的说明：合成DNA

序列号56-人工序列的说明：合成DNA

序列号57-人工序列的说明：合成DNA

序列号58-人工序列的说明：合成DNA

序列号59-人工序列的说明：合成DNA

序列号60-人工序列的说明：合成DNA

序列号61-人工序列的说明：合成DNA

序列号62-人工序列的说明：合成DNA

序列号63-人工序列的说明：合成DNA

序列号64-人工序列的说明：合成DNA

序列号65-人工序列的说明：合成DNA

序列号66-人工序列的说明：合成DNA

序列号67-人工序列的说明：合成DNA

序列号68-人工序列的说明：合成DNA

序列号69-人工序列的说明：合成DNA

序列号70-人工序列的说明：合成DNA

序列号71-人工序列的说明：合成DNA

序列号72-人工序列的说明：合成DNA

序列号73-人工序列的说明：合成DNA

序列号74-人工序列的说明：合成DNA

序列号75-人工序列的说明：合成DNA

序列号76-人工序列的说明：合成DNA

序列号77-人工序列的说明：合成DNA

序列号78-人工序列的说明：合成DNA

序列号79-人工序列的说明：合成DNA

序列号80-人工序列的说明：合成DNA

序列号81-人工序列的说明：合成DNA

序列号82-人工序列的说明：合成DNA

序列号83-人工序列的说明：合成DNA

序列号84-人工序列的说明：合成DNA

序列号85-人工序列的说明：合成DNA

<110>协和发酵工业株式会社

<120>二肽或二肽衍生物的制备方法

<130>1000P11696WO0

<150>JP2004-189008

<151>2004-06-25

<160>85

<170>PatentIn Ver.2.1

<210>1

<211>472

<212>PRT

<213>枯草芽孢杆菌168(Bacillus subtilis 168)

<400>1

Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro

1 5 10 15

Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser

20 25 30

Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile

35 40 45

Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser

50 55 60

Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp

65 70 75 80

His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala

85 90 95

Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile

100 105 110

Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly

115 120 125

Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala

130 135 140

Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr

145 150 155 160

Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile

165 170 175

Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr

180 185 190

Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu

195 200 205

Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile

210 215 220

Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu

225 230 235 240

Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu

245 250 255

Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr

260 265 270

Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys

275 280 285

Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln

290 295 300

Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro

305 310 315 320

Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro

325 330 335

Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp

340 345 350

Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp

355 360 365

Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe

370 375 380

Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu

385 390 395 400

Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val

405 410 415

Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe

420 425 430

Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser

435 440 445

Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu

450 455 460

Thr Ala Lys Tyr Val Leu Pro Val

465 470

<210>2

<211>472

<212>PRT

<213>枯草芽孢杆菌ATCC6633

<400>2

Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro

1 5 10 15

Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser

20 25 30

Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile

35 40 45

Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Gln Ser

50 55 60

Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp

65 70 75 80

His Asp Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala

85 90 95

Gln Met Phe Glu Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile

100 105 110

Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly

115 120 125

Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala

130 135 140

Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr

145 150 155 160

Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile

165 170 175

Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr

180 185 190

Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu

195 200 205

Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile

210 215 220

Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu

225 230 235 240

Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu

245 250 255

Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr

260 265 270

Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys

275 280 285

Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln

290 295 300

Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro

305 310 315 320

Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro

325 330 335

Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp

340 345 350

Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp

355 360 365

Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe

370 375 380

Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu

385 390 395 400

Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val

405 410 415

Thr Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe

420 425 430

Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser

435 440 445

Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu

450 455 460

Thr Ala Lys Tyr Val Leu Pro Val

465 470

<210>3

<211>472

<212>PRT

<213>枯草芽孢杆菌IAM1213

<400>3

Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro

1 5 10 15

Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser

20 25 30

Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile

35 40 45

Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser

50 55 60

Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp

65 70 75 80

His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala

85 90 95

Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile

100 105 110

Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly

115 120 125

Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala

130 135 140

Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr

145 150 155 160

Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile

165 170 175

Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr

180 185 190

Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu

195 200 205

Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile

210 215 220

Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu

225 230 235 240

Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu

245 250 255

Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr

260 265 270

Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys

275 280 285

Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln

290 295 300

Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro

305 310 315 320

Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro

325 330 335

Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp

340 345 350

Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp

355 360 365

Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe

370 375 380

Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu

385 390 395 400

Ala Ile Asp Leu Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val

405 410 415

Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe

420 425 430

Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser

435 440 445

Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu

450 455 460

Thr Ala Lys Tyr Val Leu Pro Val

465 470

<210>4

<211>472

<212>PRT

<213>枯草芽孢杆菌IAM1107

<400>4

Met Glu Arg Lys Thr Val Leu Val lle Ala Asp Leu Gly Gly Cys Pro

1 5 10 15

Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser

20 25 30

Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile

35 40 45

Glu Lys Tyr Ser Val Ala Val Val Lys Asp Lys Asp Tyr Phe Lys Ser

50 55 60

Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp

65 70 75 80

His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala

85 90 95

Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile

100 105 110

Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly

115 120 125

Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala

130 135 140

Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr

145 150 155 160

Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile

165 170 175

Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr

180 185 190

Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu

195 200 205

Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile

210 215 220

Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu

225 230 235 240

Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu

245 250 255

Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr

260 265 270

Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys

275 280 285

Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln

290 295 300

Asn Cys Ala Thr His Thr Glu Val Lys Leu Met Lys Asn Arg Glu Pro

305 310 315 320

Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro

325 330 335

Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp

340 345 350

Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp

355 360 365

Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe

370 375 380

Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu

385 390 395 400

Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Phe

405 410 415

Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe

420 425 430

Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser

435 440 445

Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu

450 455 460

Thr Ala Lys Tyr Val Leu Pro Val

465 470

<210>5

<211>472

<212>PRT

<213>枯草芽孢杆菌IAM1214

<400>5

Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro

1 5 10 15

Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser

20 25 30

Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile

35 40 45

Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Gln Ser

50 55 60

Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp

65 70 75 80

His Asp Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala

85 90 95

Gln Met Phe Glu Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile

100 105 110

Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly

115 120 125

Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala

130 135 140

Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr

145 150 155 160

Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile

165 170 175

Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr

180 185 190

Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu

195 200 205

Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile

210 215 220

Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu

225 230 235 240

Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu

245 250 255

Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr

260 265 270

Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys

275 280 285

Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln

290 295 300

Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro

305 310 315 320

Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro

325 330 335

Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp

340 345 350

Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp

355 360 365

Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe

370 375 380

Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu

385 390 395 400

Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val

405 410 415

Thr Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe

420 425 430

Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser

435 440 445

Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu

450 455 460

Thr Ala Lys Tyr Val Leu Pro Val

465 470

<210>6

<211>472

<212>PRT

<213>枯草芽孢杆菌ATCC21555

<400>6

Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro

1 5 10 15

Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser

20 25 30

Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile

35 40 45

Glu Lys Tyr Ser Ile Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser

50 55 60

Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp

65 70 75 80

His Asp Lys Pro Glu Glu Glu Val Val Glu Glu Ile Val Lys Val Ala

85 90 95

Asp Met Phe Gly Val Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile

100 105 110

Ala Pro Met Ala Lys Ala Cys Lys Arg Leu Gly Leu Arg Gly Ala Gly

115 120 125

Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Ala Ala

130 135 140

Phe Asn Arg Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr

145 150 155 160

Leu Glu Asp Phe Arg Ala Ala Leu Gln Glu Ile Gly Thr Pro Leu Ile

165 170 175

Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Lys

180 185 190

Glu Met Glu Thr Ala Glu Ala Glu Phe Asn Arg Val Asn Glu Tyr Leu

195 200 205

Lys Ser Ile Asn Val Pro Lys Ala Va1 Thr Phe Glu Ala Pro Phe Ile

210 215 220

Ala Glu Glu Phe Leu Gln Gly Glu Tyr Asp Asp Trp Tyr Glu Thr Ser

225 230 235 240

Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu

245 250 255

Tyr Phe Pro Val Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr

260 265 270

Glu Thr Ala His Ile Thr Pro Ser Ile Leu Asp Asp Asp Ala Lys Arg

275 280 285

Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Glu

290 295 300

Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Ala

305 310 315 320

Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro

325 330 335

Asn Ile Lys Lys Val Phe Gly Val Asp Met Ala Gln Leu Leu Leu Asp

340 345 350

Val Leu Cys Tyr Gly Lys Glu Ala Asp Leu Pro Lys Gly Leu Leu Glu

355 360 365

Gln Glu Pro Cys Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe

370 375 380

Lys Glu Asn Gly Gln Leu Pro Glu Thr Val Val Asp Phe Val Ile Glu

385 390 395 400

Ser Ile Glu Ile Pro Asp Gly Val Leu Lys Gly Asp Thr Glu Leu Val

405 410 415

Ser Phe Ser Ala Ala Glu Ala Gly Thr Ser Val Asp Leu Arg Leu Phe

420 425 430

Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser

435 440 445

Asn Asp Val Ala Glu Ser Ile Lys Gln Ile Gln Gln Gln Ala Lys Leu

450 455 460

Thr Ala Lys Tyr Ala Leu Ser Val

465 470

<210>7

<211>472

<212>PRT

<213>解淀粉芽孢杆菌IFO3022(Bacillus amylolliquefaciens IFO3022)

<400>7

Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro

1 5 10 15

Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser

20 25 30

Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile

35 40 45

Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser

50 55 60

Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp

65 70 75 80

His Asp Lys Pro Glu Glu Glu Val Val Glu Glu Ile Val Lys Val Ala

85 90 95

Gly Met Phe Ala Val Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile

100 105 110

Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly

115 120 125

Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Ala Ala

130 135 140

Phe Asn Arg Ala Gly Val Lys Ser Ile Lys Asn Arg Arg Val Thr Thr

145 150 155 160

Leu Glu Asp Phe Arg Ala Ala Leu Gln Glu Ile Gly Thr Pro Leu Ile

165 170 175

Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Lys

180 185 190

Glu Arg Glu Thr Ala Glu Ala Glu Phe Asn Arg Val Asn Glu Tyr Leu

195 200 205

Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile

210 215 220

Ala Glu Glu Phe Leu Gln Gly Glu Tyr Asp Asp Trp Tyr Glu Thr Ser

225 230 235 240

Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu

245 250 255

Tyr Phe Pro Val Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr

260 265 270

Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Asp Asp Ala Lys Arg

275 280 285

Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Glu

290 295 300

Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Ala

305 310 315 320

Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro

325 330 335

Asn Ile Lys Lys Val Phe Gly Val Asp Met Ala Gln Leu Leu Leu Asp

340 345 350

Val Leu Cys Phe Gly Lys Glu Ala Asp Leu Pro Lys Gly Leu Leu Glu

355 360 365

Gln Glu Pro Cys Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe

370 375 380

Lys Glu Asn Gly Gln Leu Pro Glu Thr Ala Val Asp Phe Val Ile Glu

385 390 395 400

Ser Ile Asp Ile Pro Asp Gly Val Leu Lys Gly Asp Thr Glu Ile Val

405 410 415

Ser Phe Ser Ala Ala Glu Ala Gly Thr Ser Val Asp Leu Arg Leu Phe

420 425 430

Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser

435 440 445

Gly Asp Val Ala Glu Ser Ile Lys Gln Ile Gln Gln Gln Ala Lys Leu

450 455 460

Thr Ala Lys Tyr Ala Leu Pro Val

465 470

<210>8

<211>476

<212>PRT

<213>短小芽孢杆菌NRRL B-12025Bacillus pumilus NRRL B-12025)

<400>26

Val Leu Ser Leu Ser Lys Lys Thr Val Leu Val Ile Ala Asp Leu Gly

1 5 10 15

Gly Cys Pro Pro His Met Phe Tyr Glu Ser Val Ala Ala Ser Tyr His

20 25 30

Ile Val Ser Tyr Ile Pro Arg Pro Phe Ala Ile Thr Lys Gly His Ala

35 40 45

Glu Leu Ile Glu Lys Tyr Ser Ile Ala Val Ile Lys Asp Arg Asp Tyr

50 55 60

Phe Glu Thr His Pro Ser Phe Glu His Pro Asp Ser Ile Tyr Trp Ala

65 70 75 80

His Asp Asp Tyr Pro Lys Ser Glu Glu Glu Val Val Glu Asp Phe Ile

85 90 95

Arg Val Ala Ser Phe Phe Lys Ala Asp Ala Ile Thr Thr Asn Asn Glu

100 105 110

Leu Phe Ile Ala Pro Met Ala Lys Ala Ala Glu Arg Leu Gly Leu Arg

115 120 125

Gly Ala Gly Val Lys Ala Ala Glu Met Ala Arg Asp Lys Ser Gln Met

130 135 140

Arg Ala Ala Phe Asn Ala Ser Gly Val Lys Ala Val Lys Thr Gln Pro

145 150 155 160

Val Thr Thr Leu Ser Asp Phe Gln Gln Ala Ile Glu Ser Ile Gly Thr

165 170 175

Pro Leu Ile Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr

180 185 190

Leu Phe His Asp Lys Ala Gly Ser Asp Asp Leu Phe Leu Gln Val Gln

195 200 205

Ser Tyr Leu Glu Thr Ile Pro Val Pro Asp Ala Val Thr Tyr Glu Ala

210 215 220

Pro Phe Val Ala Glu Thr Tyr Leu Glu Gly Ala Tyr Glu Asp Trp Tyr

225 230 235 240

Glu Asp Glu Gly Tyr Ala Asp Tyr Val Ser Val Glu Gly Leu Val Val

245 250 255

Glu Gly Glu Tyr Leu Pro Phe Val Ile His Asp Lys Thr Pro Gln Ile

260 265 270

Gly Phe Thr Glu Thr Ala His Ile Thr Pro Thr Ile Leu Asp Asn Glu

275 280 285

Ala Lys Gln Ile Ile Ile Glu Ala Ala Arg Lys Ala Asn Glu Gly Leu

290 295 300

Gly Leu Glu His Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn

305 310 315 320

Arg Glu Thr Gly Leu Ile Glu Ala Ala Ala Arg Phe Ala Gly Trp Asn

325 330 335

Met Ile Pro Asn Ile Lys Lys Val Phe Gly Val Asp Met Ala Lys Leu

340 345 350

Leu Ile Asp Val Leu Val Asp Gly Lys Lys Ala Val Leu Pro Lys Gln

355 360 365

Leu Leu Ser Gly His Thr Phe Tyr Val Ala Asp Cys His Leu Tyr Pro

370 375 380

Gln His Phe Lys Glu Ser Gly Leu Ile Pro Pro Glu Ala Thr His Ile

385 390 395 400

Thr Ile Asp His Val Ser Ile Pro Gln Glu Ala Phe Val Gly Asp Thr

405 410 415

Ala Ile Val Ser Gln Ser Phe Pro Ala Lys Gly Thr Ile Val Asp Leu

420 425 430

Glu Leu Phe Glu Ala Phe Asn Gly Ile Val Ser Leu Glu Leu Lys Gly

435 440 445

Ser Ser Ser Gln Asp Val Ala Ala Ser Ile Arg Asn Ile Gln Lys Gln

450 455 460

Ala Thr Ile Gln Leu Met Asp Glu Leu Val Lys Gly

465 470 475

<210>9

<211>1416

<212>DNA

<213>枯草芽孢杆菌168

<400>9

atg gag aga aaa aca gta ttg gtc atc gct gat ctt gga ggc tgc ccg 48

Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro

1 5 10 15

ccg cac atg ttt tat aaa agc gct gct gaa aaa tat aac ctg gtc agc 96

Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser

20 25 30

ttt att cca aga cct ttt gca att aca gcc tcc cat gca gca ttg att 144

Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile

35 40 45

gaa aaa tac tcg gtc gcg gtc ata aaa gat aaa gac tat ttt aag agt 192

Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser

50 55 60

tta gct gat ttt gaa cac cct gat tcc att tat tgg gcg cat gaa gat 240

Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp

65 70 75 80

cat aac aag cct gag gaa gag gtc gtc gag caa arc gtc aag gtt gcc 288

His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala

85 90 95

gaa atg ttt ggg gcg gat gcc atc aca aca aac aat gaa tta ttc att 336

Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile

100 105 110

gct ccg atg gcg aaa gcc tgt gaa cgt ctg ggc ttg aga ggt gcc ggc 384

Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly

115 120 125

gtg cag gca gcc gaa aat gcc aga gat aaa aat aaa atg agg gac gct 432

Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala

130 135 140

ttt aat aag gcc gga gtc aaa tcg atc aaa aac aaa cga gtc aca act 480

Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr

145 150 155 160

ctt gaa gat ttc cgt gct gct ctt gaa gag atc ggc aca cct ctt atc 528

Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile

165 170 175

tta aag cct aca tac tta gcg agt tct atc ggt gta acg ctg att acg 576

Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr

180 185 190

gac act gag acg gca gaa gat gaa ttt aac aga gtc aat gac tat ctg 624

Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu

195 200 205

aaa tca att aac gtg cca aag gcg gtt acg ttt gaa gcg ccg ttt atc 672

Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile

210 215 220

gct gaa gaa ttt tta cag ggt gag tac gga gac tgg tat caa aca gaa 720

Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu

225 230 235 240

ggg tac tcc gac tat atc agt ata gaa ggc atc atg gct gac ggt gag 768

Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu

245 250 255

tat ttc ccg atc gcc att cat gat aaa acg ccg caa atc ggg ttt aca 816

Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr

260 265 270

gag aca tcc cac att acg ccg tcc att ctg gat gaa gag gca aaa aag 864

Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys

275 280 285

aaa att gtc gaa gct gcc aaa aag gca aat gaa ggg ctt gga ctg caa 912

Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln

290 295 300

aat tgc gca aca cat aca gag atc aag cta atg aaa aac aga gaa ccg 960

Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro

305 310 315 320

ggt tta ata gag tcg gca gcc aga ttt gcc ggc tgg aat atg atc ccc 1008

Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro

325 330 335

aat att aaa aag gtc ttt ggc ctt gat atg gcg caa tta tta tta gat 1056

Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp

340 345 350

gtc ctc tgt ttc gga aaa gac gcc gat ctg ccg gac gga tta ttg gat 1104

Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp

355 360 365

caa gag cct tat tat gtt gcc gac tgc cat ttg tac ccg cag cat ttc 1152

Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe

370 375 380

aaa caa aat ggc caa att cct gaa act gct gag gat ttg gtc att gaa 1200

Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu

385 390 395 400

gcg atc gat att ccg gac ggg ctt tta aaa ggg gat act gaa atc gtt 1248

Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val

405 410 415

tct ttt tcg gcc gca gca cca ggc act tca gtt gat ttg aca ttg ttt 1296

Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe

420 425 430

gaa gct ttc aat tcc att gct gca ttt gaa ctg aaa ggc agt aat tca 1344

Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser

435 440 445

cag gat gtg gct gaa tca atc aga caa att cag cag cat gcg aag ctg 1392

Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu

450 455 460

acg gca aag tat gtg ctg cca gta 1416

Thr Ala Lys Tyr Val Leu Pro Val

465 470

<210>10

<211>1416

<212>DNA

<213>枯草芽孢杆菌ATCC6633

<400>10

atg gag aga aaa aca gta ttg gtc atc gct gat ctt gga ggc tgc ccg 48

Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro

1 5 10 15

ccg cac atg ttt tat aaa agc gct gct gaa aaa tat aac ctg gtt agc 96

Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser

20 25 30

ttt att ccg aga cct ttt gca ata aca gcc tcc cat gca gca ctg att 144

Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile

35 40 45

gaa aaa tac tcg gtc gcg gtc ata aaa gat aaa gac tat ttt cag agc 192

Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Gln Ser

50 55 60

tta gct gat ttt gag cat ccc gat tca att tat tgg gcg cat gag gat 240

Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp

65 70 75 80

cat gac aag cct gaa gaa gag gtt gtc gag caa atc gtc aag gtt gcc 288

His Asp Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala

85 90 95

caa atg ttt gag gcg gac gcc atc aca aca aac aat gaa tta ttc att 336

Gln Met Phe Glu Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile

100 105 110

gcc ccg atg gcg aaa gcc tgt gaa cgc ctt ggc ctg agg ggc gcc gga 384

Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly

115 120 125

gtg cag gca gcg gaa aat gcc aga gat aaa aat aaa atg agg gac gct 432

Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala

130 135 140

ttt aat aag gcg gga gtc aaa tcg atc aaa aac aaa cga gtc aca act 480

Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr

145 150 155 160

ctt gag gat ttt cgt gct gca ctt gaa gag atc ggc aca cct cta atc 528

Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile

165 170 175

tta aag cct aca tac tta gcg agt tca atc ggc gta acg ctg att acc 576

Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr

180 185 190

gac acg gag acg gca gaa gat gaa ttt aac aga gtc aat gac tac ctg 624

Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu

195 200 205

aaa tcg att aac gtg ccg aag gcg gtc aca ttt gaa gca ccg ttt att 672

Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile

210 215 220

gct gag gaa ttt tta cag ggt gag tac gga gac tgg tat caa aca gaa 720

Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu

225 230 235 240

ggg tac tcc gac tat atc agc ata gaa ggc att atg gca gat ggt gag 768

Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu

245 250 255

tat ttt ccg atc gcc att cat gac aaa acg ccg caa att gga ttt aca 816

Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr

260 265 270

gag aca tca cat att acg cca tcc att ctg gat gaa gag gcg aaa aag 864

Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys

275 280 285

aaa att gtc gaa gcg gct aaa aag gca aat gaa ggg ctt gga ctg caa 912

Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln

290 295 300

aat tgc gca aca cat aca gaa atc aag cta atg aaa aac aga gaa ccg 960

Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro

305 310 315 320

ggt tta ata gag tcg gct gcc aga ttc gca ggc tgg aat atg att cct 1008

Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro

325 330 335

aac att aaa aag gtt ttc ggc ctt gat atg gcg caa tta tta tta gat 1056

Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp

340 345 350

gtt ctc tgt ttc gga aaa gat gct gat ctg ccg gac ggg tta ttg gat 1104

Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp

355 360 365

caa gag cct tac tat gtt gct gac tgc cat ctg tac cct cag cat ttc 1152

Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe

370 375 380

aaa caa aat ggc cag atc cct gaa act gcc gag gat ttg gta atc gaa 1200

Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu

385 390 395 400

gcg atc gat att ccg gat ggg ctt ttg aag ggt gat aca gaa atc gtt 1248

Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val

405 410 415

act ttt tcg gct gcg gca cca gga aca tca gtt gat ttg aca ctg ttt 1296

Thr Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe

420 425 430

gaa gcc ttc aac tcc att gct gca ttt gaa ctg aaa ggc agc aat tca 1344

Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser

435 440 445

cag gat gtg gct gaa tca atc aga caa att cag cag cat gcg aag ctg 1392

Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu

450 455 460

acg gca aag tat gtg ctg cca gta 1416

Thr Ala Lys Tyr Val Leu Pro Val

465 470

<210>11

<211>1416

<212>DNA

<213>枯草芽孢杆菌IAM1213

<400>11

atg gag aga aaa aca gta ttg gtc atc gct gat ctt gga ggc tgc ccg 48

Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro

1 5 10 15

ccg cac atg ttt tat aaa agc gct gct gaa aaa tat aac ctg gtc agc 96

Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser

20 25 30

ttt att cca aga cct ttt gca att aca gcc tcc cat gca gca ttg att 144

Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile

35 40 45

gaa aaa tac tcg gtc gcg gtc ata aaa gat aaa gac tat ttt aag agt 192

Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser

50 55 60

tta gct gat ttt gag cat cct gac tcc att tat tgg gcg cat gag gat 240

Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp

65 70 75 80

cat aac aag cct gag gaa gag gtc gtc gag caa atc gtc aag gtt gcc 288

His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala

85 90 95

gaa atg ttt ggg gcg gat gcc atc aca aca aac aat gaa tta ttc att 336

Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile

100 105 110

gct ccg atg gcg aaa gcc tgt gaa cgt ctg ggc ctg aga ggt gcc ggc 384

Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly

115 120 125

gtg cag gca gcc gaa aat gcc aga gat aaa aat aaa atg agg gac gct 432

Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala

130 135 140

ttt aat aag gcc gga gtc aaa tcg atc aaa aac aaa cga gtc aca act 480

Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr

145 150 155 160

ctc gaa gat ttc cgt gct gct ctt gaa gag atc ggc aca cct ctt atc 528

Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile

165 170 175

tta aag cct aca tac tta gcg agt tca atc ggt gta acg ctg att acg 576

Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr

180 185 190

gac act gag acg gca gaa gat gaa ttt aac aga gtc aat gac tat ctg 624

Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu

195 200 205

aaa tca att aac gtg cca aag gcg gtt acg ttt gaa gcg ccg ttt atc 672

Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile

210 215 220

gct gaa gaa ttt tta cag ggt gag tac gga gac tgg tat caa aca gaa 720

Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu

225 230 235 240

ggg tac tcc gac tat atc agt ata gaa ggc atc atg gct gac ggt gag 768

Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu

245 250 255

tat ttc ccg atc gcc att cat gat aaa acg ccg caa atc ggg ttt aca 816

Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr

260 265 270

gag aca tcc cac att acg ccg tcc att ctg gat gaa gag gca aaa aag 864

Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys

275 280 285

aaa att gtc gaa gct gcc aaa aag gca aat gaa ggt ctt ggc ctg caa 912

Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln

290 295 300

aat tgc gca aca cat aca gag atc aag cta atg aaa aat aga gaa ccg 960

Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro

305 310 315 320

ggt tta att gaa tcg gca gcc aga ttc gcc ggc tgg aat atg atc ccc 1008

Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro

325 330 335

aat att aaa aag gtc ttt ggc ctt gat atg gcg caa tta tta tta gat 1056

Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp

340 345 350

gtc ctt tgt ttc gga aaa gac gcc gat ctg ccg gac gga tta ttg gat 1104

Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp

355 360 365

caa gag cct tat tat gtt gcc gac tgc cat ttg tac ccg caa cat ttc 1152

Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe

370 375 380

aaa caa aat ggc cag att cca gaa act gct gag gat ttg gtc att gaa 1200

Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu

385 390 395 400

gcg atc gat ctg cct gac ggg ctt tta aaa ggg gat act gag atc gtt 1248

Ala Ile Asp Leu Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val

405 410 415

tct ttt tcg gcc gca gca cca gga act tca gtt gat ttg aca ttg ttt 1296

Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe

420 425 430

gaa gct ttc aat tcc att gct gca ttt gaa ctg aaa ggc agt aat tca 1344

Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser

435 440 445

cag gat gtg gct gaa tca atc aga caa att cag cag cat gcg aag ctg 1392

Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu

450 455 460

acg gca aag tat gtg ctg cca gta 1416

Thr Ala Lys Tyr Val Leu Pro Val

465 470

<210>12

<211>1416

<212>DNA

<213>枯草芽孢杆菌IAM1107

<400>12

atg gag aga aaa aca gta ttg gtc atc gct gat ctt gga ggc tgc ccg 48

Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro

1 5 10 15

ccg cac atg ttt tat aaa agc gct gct gaa aaa tat aac ctg gtc agc 96

Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser

20 25 30

ttt att cca aga cct ttt gca att aca gcc tcc cat gca gca ttg att 144

Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile

35 40 45

gaa aaa tac tcg gtc gcg gtc gta aaa gat aaa gac tat ttt aag agt 192

Glu Lys Tyr Ser Val Ala Val Val Lys Asp Lys Asp Tyr Phe Lys Ser

50 55 60

tta gct gat ttt gag cat cct gac tcc att tat tgg gcg cat gag gat 240

Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp

65 70 580

cat aac aag cct gag gaa gag gtc gtc gag caa atc gtc aag gtt gcc 288

His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala

85 90 95

gaa atg ttc ggg gcg gat gcc atc aca aca aac aat gaa tta ttc att 336

Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile

100 105 110

gct ccg atg gcg aaa gcc tgt gaa cgt ctg ggc ttg aga ggt gcc ggc 384

Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly

115 120 125

gtg cag gca gcc gaa aat gcc aga gat aaa aat aaa atg agg gac gct 432

Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala

130 135 140

ttt aat aag gcc gga gtc aaa tcg atc aaa aac aaa cga gtc aca act 480

Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr

145 150 155 160

ctt gaa gat ttc cgt gct gct ctt gaa gag atc ggc aca cct ctt atc 528

Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile

165 170 175

tta aag cct aca tac tta gcg agt tct atc ggt gta acg ctg att acg 576

Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr

180 185 190

gac act gag acg gca gaa gat gaa ttt aac aga gtc aat gac tat ctg 624

Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu

195 200 205

aaa tca att aac gtg cca aag gcg gtt acg ttt gaa gcg ccg ttt atc 672

Lys Ser Ile Asn Val Pro Lys Ala Val ThrPhe Glu Ala Pro Phe Ile

210 215 220

gct gaa gaa ttt tta cag ggt gag tac gga gac tgg tat caa aca gaa 720

Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu

225 230 235 240

ggg tac tcc gac tat atc agt ata gaa ggc atc atg gct gac ggt gag 768

Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu

245 250 255

tat ttc ccg atc gcc att cat gat aaa acg ccg caa atc ggg ttt aca 816

Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr

260 265 270

gag aca tcc cac att acg ccg tcc att ctg gat gaa gag gca aaa aag 864

Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys

275 280 285

aaa att gtc gaa gct gcc aaa aag gca aat gaa ggg ctt ggc ctg caa 912

Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln

290 295 300

aat tgc gca aca cat aca gag gtc aag cta atg aaa aac aga gaa ccg 960

Asn Cys Ala Thr His Thr Glu Val Lys Leu Met Lys Asn Arg Glu Pro

305 310 315 320

ggt tta att gaa tcg gca gcc aga ttt gcc ggc tgg aat atg atc cct 1008

Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro

325 330 335

aac att aaa aag gtt ttc ggc ctt gat atg gcg caa tta tta tta gat 1056

Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp

340 345 350

gtc ctc tgt ttc gga aaa gat gcc gat ctg ccg gac gga tta ttg gat 1104

Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp

355 360 365

caa gag cct tac tat gtc gcc gac tgc cat ttg tac ccg cag cat ttc 1152

Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe

370 375 380

aaa caa aat ggc cag att cca gaa acc gct gag gat ttg gtc att gaa 1200

Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu

385 390 395 400

gcg atc gat att ccg gac ggg ctt tta aaa ggg gat act gaa atc ttt 1248

Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Phe

405 410 415

tct ttt tcg gcc gca gca cea ggc act tca gtt gat ttg aca ttg ttt 1296

Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe

420 425 430

gaa gct ttc aat tcc att gct gca ttt gaa ctg aaa ggc agt aat rca 1344

Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser

435 440 445

cag gat gtg gct gaa tca atc aga caa att cag cag cat gcg aag ctg 1392

Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu

450 455 460

acg gca aag tat gtg ctg cca gta 1416

Thr Ala Lys Tyr Val Leu Pro Val

465 470

<210>13

<211>1416

<212>DNA

<213>枯草芽孢杆菌IAM1214

<400>13

atg gag aga aaa aca gta ttg gtc atc gct gat ctt gga ggc tgc ccg 48

Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro

1 5 10 15

ccg cac atg ttt tat aaa agc gct gct gaa aaa tat aac ctg gtt agc 96

Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser

20 25 30

ttt att ccg aga cct ttt gca ata aca gcc tcc cat gca gca ctg att 144

Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile

35 40 45

gaa aaa tac tcg gtc gcg gtc ata aaa gat aaa gac tat ttt cag agc 192

Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Gln Ser

50 55 60

tta gct gat ttt gag cat ccc gat tca att tat tgg gcg cat gag gat 240

Leu Ala Asp Phe Glu His ProAsp Ser Ile Tyr Trp Ala His Glu Asp

65 70 75 80

cat gac aag cct gaa gaa gag gtt gtc gag caa atc gtc aag gtt gcc 288

His Asp Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala

85 90 95

caa atg ttt gag gcg gac gcc atc aca aca aac aat gaa tta ttc att 336

Gln Met Phe Glu Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile

100 105 110

gcc ccg atg gcg aaa gcc tgt gaa cgc ctt ggc ctg agg ggc gcc gga 384

Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly

115 120 125

gtg cag gca gcg gaa aat gcc aga gat aaa aat aaa atg agg gac gct 432

Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala

130 135 140

ttt aat aag gcg gga gtc aaa tcg atc aaa aac aaa cga gtc aca act 480

Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr

145 150 155 160

ctt gag gat ttt cgt gct gca ctt gaa gag atc ggc aca cct cta atc 528

Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile

165 170 175

tta aag cct aca tac tta gcg agt tca atc ggc gta acg ctg att acc 576

Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr

180 185 190

gac acg gag acg gca gaa gat gaa ttt aac aga gtc aat gac tac ctg 624

Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu

195 200 205

aaa tcg att aac gtg ccg aag gcg gtc aca ttt gaa gca ccg ttt att 672

Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile

210 215 220

gct gag gaa ttt tta cag ggt gag tac gga gac tgg tat caa aca gaa 720

Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu

225 230 235 240

ggg tac tcc gac tat atc agc ata gaa ggc att atg gca gat ggt gag 768

Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu

245 250 255

tat ttt ccg atc gcc att cat gac aaa acg ccg caa att gga ttt aca 816

Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr

260 265 270

gag aca tca cat att acg cca tcc att ctg gat gaa gag gcg aaa aag 864

Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys

275 280 285

aaa att gtc gaa gcg gct aaa aag gca aat gaa ggg ctt gga ctg caa 912

Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln

290 295 300

aat tgc gca aca cat aca gaa atc aag cta atg aaa aac aga gaa ccg 960

Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro

305 310 315 320

ggt tta ata gag tcg gct gcc aga ttc gca ggc tgg aat atg att cct 1008

Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro

325 330 335

aac att aaa aag gtt ttc ggc ctt gat atg gcg caa tta tta tta gat 1056

Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp

340 345 350

gtt crc tgt ttc gga aaa gat gct gat ctg ccg gac ggg tta ttg gat 1104

Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp

355 360 365

caa gag cct tac tat gtt gct gac tgc cat ctg tac cct cag cat ttc 1152

Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe

370 375 380

aaa caa aat ggc cag atc cct gaa act gcc gag gat ttg gta atc gaa 1200

Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu

385 390 395 400

gcg atc gat att ccg gat ggg ctt ttg aag ggt gat aca gaa atc gtt 1248

Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val

405 410 415

act ttt tcg gct gcg gca cca gga aca tca gtt gat ttg aca ctg ttt 1296

Thr Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe

420 425 430

gaa gcc ttc aac tcc att gct gca ttt gaa ctg aaa ggc agc aat tca 1344

Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser

435 440 445

cag gat gtg gct gaa tca atc aga caa att cag cag cat gcg aag ctg 1392

Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu

450 455 460

acg gca aag tat gtg ctg cca gta 1416

Thr Ala Lys Tyr Val Leu Pro Val

465 470

<210>14

<211>1416

<212>DNA

<213>枯草芽孢杆菌ATCC21555

<400>14

atg gag aga aaa aca gta ttg gtt atc gct gat ctt ggg ggc tgc ccg 48

Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro

1 5 10 15

ccg cat atg ttt tac aaa agc gca gcc gaa aaa tac aac ctc gtc agc 96

Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser

20 25 30

ttt att ccg aga ccc ttt gca att aca gcc tct cat gcg gcc tta att 144

Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile

35 40 45

gaa aaa tac tcg att gcg gtc att aaa gat aaa gac tat ttt aag agt 192

Glu Lys Tyr Ser Ile Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser

50 55 60

ctg gct gat ttt gaa cat ccc gat tcg att tat tgg gct cat gaa gat 240

Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp

65 70 75 80

cat gac aaa cct gag gaa gaa gtc gtc gaa gaa atc gtg aaa gtg gcc 288

His Asp Lys Pro Glu Glu Glu Val Val Glu Glu Ile Val Lys Val Ala

85 90 95

gac atg ttt ggg gtt gac gcc att acg acc aac aat gaa ctg ttt atc 336

Asp Met Phe Gly Val Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile

100 105 110

gct ccg atg gca aaa gcg tgt aaa cgt ctc ggc ctg cgg gga gcg ggc 384

Ala Pro Met Ala Lys Ala Cys Lys Arg Leu Gly Leu Arg Gly Ala Gly

115 120 125

gta cag gcc gct gaa aac gcc aga gat aaa aat aaa atg aga gcc gcc 432

Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Ala Ala

130 135 140

ttc aac cgg gcc ggc gtc aaa tcc atc aaa aac aaa cgg gtg acg acc 480

Phe Asn Arg Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr

145 150 155 160

ctg gaa gat ttc cgc gcc gcg ctt cag gaa atc gga acg ccg ctt att 528

Leu Glu Asp Phe Arg Ala Ala Leu Gln Glu Ile Gly Thr Pro Leu Ile

165 170 175

ctg aag cct aca tat ctg gca agc tcg atc ggc gtg acg ctt att aaa 576

Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Lys

180 185 190

gag atg gaa acg gcc gaa gct gaa ttc aac aga gtc aat gag tac ttg 624

Glu Met Glu Thr Ala Glu Ala Glu Phe Asn Arg Val Asn Glu Tyr Leu

195 200 205

aaa tcg att aat gta ccg aaa gcg gtg acg ttt gaa gcg ccg ttt atc 672

Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile

210 215 220

gcg gaa gaa ttc ttg cag ggc gag tat gat gac tgg tac gaa aca agc 720

Ala Glu Glu Phe Leu Gln Gly Glu Tyr Asp Asp Trp Tyr Glu Thr Ser

225 230 235 240

ggt tat tcc gac tat atc agc atc gaa ggc atc atg gcc gac gga gaa 768

Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu

245 250 255

tac ttc ccc gtt gcg atc cat gat aaa aca ccg caa atc gga ttc acg 816

Tyr Phe Pro Val Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr

260 265 270

gag aca gcg cat att acg ccg tcc atc ctg gat gat gac gcc aag cgg 864

Glu Thr Ala His Ile Thr Pro Ser Ile Leu Asp Asp Asp Ala Lys Arg

275 280 285

aaa atc gtc gaa gct gcc aag aag gcg aat gaa gga ctc ggc ctc gaa 912

Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Glu

290 295 300

aac tgt gca acg cat aca gaa ata aaa tta atg aaa aac cgg gaa gcc 960

Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Ala

305 310 315 320

gga ctg att gag tca gcg gcc aga ttc gcg gga tgg aat atg att ccg 1008

Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro

325 330 335

aat att aaa aag gtc ttc ggc gtt gat atg gcg cag cta tta ttg gat 1056

Asn Ile Lys Lys Val Phe Gly Val Asp Met Ala Gln Leu Leu Leu Asp

340 345 350

gtt ctc tgt tac gga aaa gaa gct gat ctg ccg aaa gga tta ttg gag 1104

Val Leu Cys Tyr Gly Lys Glu Ala Asp Leu Pro Lys Gly Leu Leu Glu

355 360 365

cag gag cca tgc tat gtc gca gac tgc cac ttg tat cct cag cat ttc 1152

Gln Glu Pro Cys Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe

370 375 380

aaa gag aac ggc cag ctg cct gag acg gtt gtc gat ttc gtc att gaa 1200

Lys Glu Asn Gly Gln Leu Pro Glu Thr Val Val Asp Phe Val Ile Glu

385 390 395 400

agc att gaa att cct gac ggc gtc tta aag gga gac act gaa ctc gtt 1248

Ser Ile Glu Ile Pro Asp Gly Val Leu Lys Gly Asp Thr Glu Leu Val

405 410 415

tct ttc tca gcg gct gag gcg ggt acg tca gtg gat ctg cgg ctg ttc 1296

Ser Phe Ser Ala Ala Glu Ala Gly Thr Ser Val Asp Leu Arg Leu Phe

420 425 430

gaa gcg ttc aac agc att gcg gcg ttt gag ctg aaa gga agc aat tcg 1344

Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser

435 440 445

aac gac gtg gcc gaa rca arc aaa caa att cag cag cag gcg aag ctg 1392

Asn Asp Val Ala Glu Ser Ile Lys Gln Ile Gln Gln Gln Ala Lys Leu

450 455 460

act gca aag tat gcg tta tcg gta 1416

Thr Ala Lys Tyr Ala Leu Ser Val

<210>15

<211>1416

<212>DNA

<213>解淀粉芽孢杆菌IFO3022

<400>15

atg gag aga aaa aca gta ttg gtt atc gct gac ctt ggg gga tgc ccg 48

Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro

1 5 10 15

ccg cat atg ttt tac aaa agc gca gcc gaa aaa tac aac crc gtc agc 96

Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser

20 25 30

ttt att ccg aga cct ttt gca att aca gcc tct cat gcg gca tta att 144

Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile

35 40 45

gaa aaa tac tcg gtc gcg gtc ata aaa gat aaa gac tat ttt aag agt 192

Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser

50 55 60

ctg gct gat ttt gag cat ccc gat tcg att tac tgg gct cat gaa gat 240

Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp

65 70 75 80

cat gac aaa cct gag gaa gaa gta gtc gaa gaa atc gtc aag gtg gcc 288

His Asp Lys Pro Glu Glu Glu Val Val Glu Glu Ile Val Lys Val Ala

85 90 95

ggc atg ttc gcg gtt gac gcc att acg acc aac aat gaa ctg ttt atc 336

Gly Met Phe Ala Val Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile

100 105 110

gct ccg atg gca aaa gcg tgt gaa cgt ctc ggc ctg cgg gga gcg ggc 384

Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly

115 120 125

gta cag gcc gct gaa aat gcc aga gat aaa aac aaa atg aga gcc gct 432

Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Ala Ala

130 135 140

ttc aac cgg gcc ggc gtc aag tct atc aaa aac aga cgg gtg acg acg 480

Phe Asn Arg Ala Gly Val Lys Ser Ile Lys Asn Arg Arg Val Thr Thr

145 150 155 160

ctg gaa gat ttc cgc gcc gcg ctt cag gaa atc gga acg ccg ctc att 528

Leu Glu Asp Phe Arg Ala Ala Leu Gln Glu Ile Gly Thr Pro Leu Ile

165 170 175

ctg aag cct aca tat ctg gcg agc tcc atc ggc gtg acg ctc atc aaa 576

Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Lys

180 185 190

gag agg gaa acg gcc gaa gcc gaa ttt aac aga gtc aat gaa tac ctg 624

Glu Arg Glu Thr Ala Glu Ala Glu Phe Asn Arg Val Asn Glu Tyr Leu

195 200 205

aag tcg atc aac gta ccg aaa gcg gtc acg ttt gaa gcg ccg ttt atc 672

Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile

210 215 220

gcg gaa gaa ttt ttg cag ggc gag tat gac gac tgg tac gaa aca agc 720

Ala Glu Glu Phe Leu Gln Gly Glu Tyr Asp Asp Trp Tyr Glu Thr Ser

225 230 235 240

ggt tat tcc gac tat atc agc ata gaa ggc atc atg gcc gac gga gaa 768

Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu

245 250 255

tac ttc cct gtc gca att cat gat aaa aca ccg caa atc gga ttc acg 816

Tyr Phe Pro Val Ala Ile His Asp Lys Thr ProGln Ile Gly Phe Thr

260 265 270

gag aca tcg cat att acg ccg tcc atc ctg gat gat gac gcg aag cgg 864

Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Asp Asp Ala Lys Arg

275 280 285

aaa atc gtc gaa gca gcc aaa aag gcg aat gaa gga ctc ggc ctc gaa 912

Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Glu

290 295 300

aac tgc gca acc cat aca gag att aaa tta atg aaa aac cgg gaa gcc 960

Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Ala

305 310 315 320

gga ctg att gaa tca gcg gca cga ttt gcg ggc tgg aac atg att ccg 1008

Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro

325 330 335

aat att aaa aag gtc ttc ggc gtc gat atg gcg cag ctg tta tg gat 1056

Asn Ile Lys Lys Val Phe Gly Val Asp Met Ala Gln Leu Leu Leu Asp

340 345 350

gtt ctc tgt ttc gga aaa gaa gcc gat ctg ccg aaa gga tta ttg gag 1104

Val Leu Cys Phe Gly Lys Glu Ala Asp Leu Pro Lys Gly Leu Leu Glu

355 360 365

cag gag ccg tgc tat gtc gcc gac tgc cac ttg tat cct cag cat ttc 1152

Gln Glu Pro Cys Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe

370 375 380

aaa gag aac ggc cag ctg cct gag acg gct gtc gat ttc gtc att gaa 1200

Lys Glu Asn Gly Gln Leu Pro Glu Thr Ala Val Asp Phe Val Ile Glu

385 390 395 400

agc att gac att ccc gac ggc gtc tta aag gga gac acc gaa atc gtt 1248

Ser Ile Asp Ile Pro Asp Gly Val Leu Lys Gly Asp Thr Glu Ile Val

405 410 415

tct ttc tcg gcg gcc gag gcg ggt aca tcc gtg gat ctg cgg ctg ttc 1296

Ser Phe Ser Ala Ala Glu Ala Gly Thr Ser Val Asp Leu Arg Leu Phe

420 425 430

gaa gcg ttc aac agc att gcg gcg ttc gag ctg aaa gga agc aat tcg 1344

Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser

435 440 445

ggt gac gtg gcc gaa tca arc aaa caa att cag cag cag gcg aag ctg 1392

Gly Asp Val Ala Glu Ser Ile Lys Gln Ile Gln Gln Gln Ala Lys Leu

450 455 460

act gca aag tat gcg tta ccg gta 1416

Thr Ala Lys Tyr Ala Leu Pro Val

<210>16

<211>1428

<212>DNA

<213>短小芽孢杆菌NRRL B-12025

<400>16

gtg ctt tca ttg agt aaa aaa act gta ctt gtc att gct gac tta gga 48

Val Leu Ser Leu Ser Lys Lys Thr Val Leu Val Ile Ala Asp Leu Gly

1 5 10 15

ggg tgc ccg ccc cat atg ttt tat gaa agc gtg gcg gca tca tac cat 96

Gly Cys Pro Pro His Met Phe Tyr Glu Ser Val Ala Ala Ser Tyr His

20 25 30

atc gtt tct tat atc cca aga ccc ttt gcg att aca aag gga cat gcc 144

Ile Val Set Tyr Ile Pro Arg Pro Phe Ala Ile Thr Lys Gly His Ala

35 40 45

gag cta atc gaa aaa tac tcc att gcc gtc atc aaa gac cgt gat tat 192

Glu Leu Ile Glu Lys Tyr Ser Ile Ala Val Ile Lys Asp Arg Asp Tyr

50 55 60

ttt gag aca cac cct tct ttt gaa cac cct gat tct att tac tgg gca 240

Phe Glu Thr His Pro Ser Phe Glu His Pro Asp Ser Ile Tyr Trp Ala

65 70 75 80

cat gat gat tat cca aaa tca gaa gaa gaa gtt gtg gaa gac ttc att 288

His Asp Asp Tyr Pro Lys Ser Glu Glu Glu Val Val Glu Asp Phe Ile

85 90 95

cga gta gct tcc ttt ttc aaa gca gat gca atc acg acc aat aat gaa 336

Arg Val Ala Ser Phe Phe Lys Ala Asp Ala Ile Thr Thr Asn Asn Glu

100 105 110

tta ttc att gca ccg atg gca aag gcc gct gaa cgt ctt ggg cta cga 384

Leu Phe Ile Ala Pro Met Ala Lys Ala Ala Glu Arg Leu Gly Leu Arg

115 120 125

ggt gcc ggt gtc aag gca gcc gaa atg gcg cgt gat aaa agc caa atg 432

Gly Ala Gly Val Lys Ala Ala Glu Met Ala Arg Asp Lys Ser Gln Met

130 135 140

agg gct gca ttc aat gcc tct ggc gtc aaa gcg gtg aaa act cag cct 480

Arg Ala Ala Phe Asn Ala Ser Gly Val Lys Ala Val Lys Thr Gln Pro

145 150 155 160

gtc acg act tta tct gat ttc caa caa gcc att gag tct atc gga aca 528

Val Thr Thr Leu Ser Asp Phe Gln Gln Ala Ile Glu Ser Ile Gly Thr

165 170 175

ccg ctc att tta aag cct aca tat tta gcc agt tct att ggc gtc acc 576

Pro Leu Ile Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr

180 185 190

ttg ttt cat gac aaa gcc gga agt gat gac ttg ttt tta caa gta caa 624

Leu Phe His Asp Lys Ala Gly Ser Asp Asp Leu Phe Leu Gln Val Gln

195 200 205

tcg tat ttg gaa acc ata cca gtc cca gac gct gtc acg tat gaa gca 672

Ser Tyr Leu Glu Thr Ile Pro Val Pro Asp Ala Val Thr Tyr Glu Ala

210 215 220

ccg ttt gtc gct gaa aca tat tta gag ggt gct tac gaa gat tgg tat 720

Pro Phe Val Ala Glu Thr Tyr Leu Glu Gly Ala Tyr Glu Asp Trp Tyr

225 230 235 240

gaa gac gaa gga tat gct gat tat gtc agt gta gaa ggg ctg gtc gta 768

Glu Asp Glu Gly Tyr Ala Asp Tyr Val Ser Val Glu Gly Leu Val Val

245 250 255

gag ggc gaa tat ctc cct ttt gtc ata cat gat aaa acc cct caa atc 816

Glu Gly Glu Tyr Leu Pro Phe Val Ile His Asp Lys Thr Pro Gln Ile

260 265 270

ggc ttt aca gaa acg gct cat atc act ccg acg atc tta gac aat gaa 864

Gly Phe Thr Glu Thr Ala His Ile Thr Pro Thr Ile Leu Asp Asn Glu

275 280 285

gcc aag caa atc ate att gaa gca gca agg aag gca aat gaa ggg cta 912

Ala Lys Gln Ile Ile Ile Glu Ala Ala Arg Lys Ala Asn Glu Gly Leu

290 295 300

ggt ctt gaa cat tgt gca acc cat aca gaa atc aaa ctc atg aaa aat 960

Gly Leu Glu His Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn

305 310 315 320

cga gaa act gga ctg atc gag gca gcg gct cga ttc gct ggc tgg aat 1008

Arg Glu Thr Gly Leu Ile Glu Ala Ala Ala Arg Phe Ala Gly Trp Asn

325 330 335

atg atc ccg aat att aaa aaa gtc ttt ggc gtc gat atg gcg aag cta 1056

Met Ile Pro Asn Ile Lys Lys Val Phe Gly Val Asp Met Ala Lys Leu

340 345 350

ttg att gat gta tta gtt gat ggt aaa aag gct gta ctg cca aaa cag 1104

Leu Ile Asp Val Leu Val Asp Gly Lys Lys Ala Val Leu Pro Lys Gln

355 360 365

ctg ctt tct gga cat aca ttt tat gta gcg gac tgc cac ctg tac cct 1152

Leu Leu Ser Gly His Thr Phe Tyr Val Ala Asp Cys His Leu Tyr Pro

370 375 380

cag cat ttt aaa gag agt ggg ctt atc ccg cct gaa gcc aca cat att 1200

Gln His Phe Lys Glu Ser Gly Leu Ile Pro Pro Glu Ala Thr His Ile

385 390 395 400

acc att gat cat gtg tct att ccg cag gaa gca ttc gtt gga gat act 1248

Thr Ile Asp His Val Ser Ile Pro Gln Glu Ala Phe Val Gly Asp Thr

405 410 415

gcg att gtc agt caa tca ttc cct gcc aaa ggg act att gtg gat ctt 1296

Ala Ile Val Ser Gln Ser Phe Pro Ala Lys Gly Thr Ile Val Asp Leu

420 425 430

gaa tta ttt gaa gct ttt aat gga atc gta tct ctt gag tta aaa gga 1344

Glu Leu Phe Glu Ala Phe Asn Gly Ile Val Ser Leu Glu Leu Lys Gly

435 440 445

tca tcc tca caa gat gtt gcc gcg tcc atc cgc aac att cag aaa cag 1392

Ser Ser Ser Gln Asp Val Ala Ala Ser Ile Arg Asn Ile Gln Lys Gln

450 455 460

gca acg att cag tta atg gat gaa tta gtg aag gga 1428

Ala Thr Ile Gln Leu Met Asp Glu Leu Val Lys Gly

465 470 475

<210>17

<211>93

<212>PRT

<213>枯草芽孢杆菌168

<400>17

Gly Ala Gly Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met

1 5 10 15

Arg Asp Ala Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg

20 25 30

Val Thr Thr Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr

35 40 45

Pro Leu Ile Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr

50 55 60

Leu Ile Thr Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn

65 70 75 80

Asp Tyr Leu Lys Ser Ile Asn Val Pro Lys Ala Val Thr

85 90

<210>18

<211>279

<212>DNA

<213>枯草芽孢杆菌168

<400>18

ggt gcc ggc gtg cag gca gcc gaa aat gcc aga gat aaa aat aaa atg 48

Gly Ala Gly Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met

1 5 10 15

agg gac gct ttt aat aag gcc gga gtc aaa tcg arc aaa aac aaa cga 96

Arg Asp Ala Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg

20 25 30

gtc aca act ctt gaa gat ttc cgt gct gct ctt gaa gag atc ggc aca 144

Val Thr Thr Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr

35 40 45

cct ctt atc tta aag cct aca tac tta gcg agt tct atc ggt gta acg 192

Pro Leu Ile Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr

50 55 60

ctg att acg gac act gag acg gca gaa gat gaa ttt aac aga gtc aat 240

Leu Ile Thr Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn

65 70 75 80

gac tat ctg aaa rca att aac gtg cca aag gcg gtt acg 279

Asp Tyr Leu Lys Ser Ile Asn Val Pro Lys Ala Val Thr

85 90

<210>19

<211>30

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成DNA

<400>19

attctcgagt agagaaggag tgttttacat 30

<210>20

<211>30

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成DNA

<400>20

ttaggatcct catactggca gcacatactt 30

<210>21

<211>24

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成DNA

<400>21

caagaattct catgtttgac agct 24

<210>22

<211>28

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成DNA

<400>22

taactcgaga ttcccttttt acgtgaac 28

<210>23

<211>27

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成DNA

<400>23

ttaaccatgg agagaaaaac agtattg 27

<210>24

<211>30

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成DNA

<400>24

atatggatcc tactggcagc acatactttg 30

<210>25

<211>21

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成DNA

<400>25

caccgcagac ggaggataca c 21

<210>26

<211>22

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成DNA

<400>26

cggacgtcac ccaataatcg tg 22

<210>27

<211>23

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成DNA

<400>27

ccgatggcra aagcstgtra acg 23

<210>28

<211>21

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成DNA

<400>28

cggcagatcr gcdtcttttc c 21

<210>29

<211>26

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成DNA

<400>29

gctaggtctt gaacattgtg caaccc 26

<210>30

<211>23

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成DNA

<400>30

ggtgttccga tagactcaat ggc 23

<210>31

<211>44

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成DNA

<400>31

catgccatgg agaaaaaaac tgtacttgtc attgctgact tagg 丂丂丂44

<210>32

<211>38

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成DNA

<400>32

cgcggatccc ttcactaatt catccattaa ctgaatcg 丂丂丂38

<210>33

<211>12

<212>PRT

<213>人工序列

<220>

<221>不确定

<222>(3)

<223>Xaa表示选自Ala、Arg、Asn、Asp、Cys、Glu、Gln、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr和Val中的任何氨基酸

<220>

<221>不确定

<222>(4)

<220>

<221>不确定

<222>(9)

<220>

<221>不确定

<222>(10)

<223>Xaa表示选自Leu、Ile、Val、Met和Ala中的任何氨基酸

<220>

<221>不确定

<222>(11)

<223>Xaa表示Glu、Ser或Ala

<220>

<221>不确定

<222>(12)

<223>Xaa表示Gly、Ser或Ala

<220>

<223>人工序列的描述：用于数据库查找的氨基酸序列

<400>33

His Gly Xaa Xaa Gly Gln Asp Gly Xaa Xaa Xaa Xaa

5 10

<210>34

<211>28

<212>PRT

<213>人工序列

<220>

<221>不确定

<222>(1)

<223>Xaa表示Leu Ile或Val

<220>

<221>不确定

<222>(2)

<220>

<221>不确定

<222>(3)

<220>

<221>不确定

<222>(4)

<220>

<221>不确定

<222>(5)

<223>Xaa表示Gly或Ala

<220>

<221>不确定

<222>(6)

<220>

<221>不确定

<222>(7)

<223>Xaa表示选自Gly、Ser、Ala、Ile和Val中的任何氨基酸

<220>

<221>不确定

<222>(9)

<223>Xaa表示选自Leu、Ile、Val、Met、Cys和Ala中的任何氨基酸

<220>

<221>不确定

<222>(11)

<223>Xaa表示选自Leu、Ile、Val、Met、Phe和Ala中的任何氨基酸

<220>

<221>不确定

<222>(12)

<223>Xaa表示选自Leu、Ile、Val、Met、Phe和Ala中的任何氨基酸

<220>

<221>不确定

<222>(13)

<220>

<221>不确定

<222>(14)

<220>

<221>不确定

<222>(15)

<220>

<221>不确定

<222>(16)

<220>

<221>不确定

<222>(17)

<220>

<221>不确定

<222>(18)

<220>

<221>不确定

<222>(19)

<220>

<221>不确定

<222>(20)

<223>Xaa表示Leu、Ile或Val中的任何氨基酸

<220>

<221>不确定

<222>(21)

<220>

<221>不确定

<222>(23)

<223>Xaa表示选自Leu、Ile、Val、Ala和Pro中的任何氨基酸

<220>

<221>不确定

<222>(25)

<223>Xaa表示Ser、Thr或Pro

<220>

<221>不确定

<222>(26)

<220>

<221>不确定

<222>(28)

<223>Xaa表示Gly或Ala

<220>

<223>人工序列的描述：用于数据库查找的氨基酸序列

<400>34

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Arg Xaa Asp Xaa Xaa Xaa Xaa Xaa Xaa

5 10 15

Xaa Xaa Xaa Xaa Xaa Gln Xaa Asn Xaa Xaa Pro Xaa

20 25

<210>35

<211>30

<212>PRT

<213>人工序列

<220>

<221>不确定

<222>(1)

<223>Xaa表示Leu Ile或Val

<220>

<221>不确定

<222>(2)

<220>

<221>不确定

<222>(3)

<220>

<221>不确定

<222>(4)

<220>

<221>不确定

<222>(5)

<223>Xaa表示Gly或Ala

<220>

<221>不确定

<222>(6)

<220>

<221>不确定

<222>(7)

<223>Xaa表示选自Gly、Ser、Ala、Ile和Val中的任何氨基酸

<220>

<221>不确定

<222>(9)

<223>Xaa表示选自Leu、Ile、Val、Met、Cys和Ala中的任何氨基酸

<220>

<221>不确定

<222>(11)

<223>Xaa表示选自Leu、Ile、Val、Met、Phe和Ala中的任何氨基酸

<220>

<221>不确定

<222>(12)

<223>Xaa表示选自Leu、Ile、Val、Met、Phe和Ala中的任何氨基酸

<220>

<221>不确定

<222>(13)

<220>

<221>不确定

<222>(14)

<220>

<221>不确定

<222>(15)

<220>

<221>不确定

<222>(16)

<220>

<221>不确定

<222>(17)

<220>

<221>不确定

<222>(18)

<220>

<221>不确定

<222>(19)

<220>

<221>不确定

<222>(20)

<220>

<221>不确定

<222>(21)

<220>

<221>不确定

<222>(22)

<223>Xaa表示Leu、Ile或Val

<220>

<221>不确定

<222>(23)

<220>

<221>不确定

<222>(25)

<223>Xaa表示选自Leu、Ile、Val、Ala和Pro中的任何氨基酸

<220>

<221>不确定

<222>(27)

<223>Xaa表示Ser、Thr或Pro

<220>

<221>不确定

<222>(28)

<220>

<221>不确定

<222>(30)

<223>Xaa表示Gly或Ala

<220>

<223>人工序列的描述：用于数据库查找的氨基酸序列

<400>35

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Arg Xaa Asp Xaa Xaa Xaa Xaa Xaa Xaa

5 10 15

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Gln Xaa Asn Xaa Xaa Pro Xaa

20 25 30

<210>36

<211>1416

<212>DNA

<213>枯草芽孢杆菌ATCC 15245和枯草芽孢杆菌IAM 1033

<400>36

atg gag aga aaa aca gta ttg gtc atc gct gat ctt gga ggc tgc ccg 48

Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro

1 5 10 15

ccg cac atg ttt tat aaa agc gct gct gaa aaa tat aac ctg gtc agc 96

Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser

20 25 30

ttt att cca aga cct ttt gca att aca gcc tcc cat gca gca ttg att 144

Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser Hi s Ala Ala Leu Ile

35 40 45

gaa aaa tac tcg gtc gcg gtc ata aaa gat aaa gac tat ttt aag agt 192

Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser

50 55 60

tta gct gat ttt gag cat cct gat tcc att tat tgg gcg cat gag gat 240

Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp

65 70 75 80

cataac aag cct gag gaa gag gtc gtc gag caa arc gtc aag gtt gcc 288

His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala

85 90 95

gaa atg ttt ggg gcg gat gcc atc aca aca aac aat gaa tta ttc att 336

Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile

100 105 110

gct ccg atg gcg aaa gcc tgt gaa cgt ctg ggc ctg aga ggt gcc ggc 384

Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly

115 120 125

gtg cag gca gcc gaa aat gcc aga gat aaa aat aaa atg agg gac gct 432

Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala

130 135 140

ttt aat aag gcc gga gtc aaa tcg atc aaa aac aaa cga gtc aca act 480

Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr

145 150 155 160

ctt gaa gat ttc cgt gct gct ctt gaa gag atc ggc aca cct ctt atc 528

Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile

165 170 175

tta aag cct aca tac tta gcg agt tca atc ggt gta acg ctg att acg 576

Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr

180 185 190

gac act gag acg gca gaa gat gaa ttt aac aga gtc aat gac tat ctg 624

Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu

195 200 205

aaa tca att aac gtg cca aag gcg gtt acg ttt gaa gcg ccg ttt atc 672

Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile

210 215 220

gct gaa gaa ttt tta cag ggt gag tac gga gac tgg tat caa aca gaa 720

Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu

225 230 235 240

ggg tac tcc gac tat atc agt ata gaa ggc atc atg gct gac ggt gag 768

Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu

245 250 255

tat ttc ccg atc gcc att cat gat aaa acg ccg caa atc ggg ttt aca 816

Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr

260 265 270

gag aca tcc cac att acg ccg tcc att ctg gat gaa gag gca aaa aag 864

Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys

275 280 285

aaa att gtc gaa gct gcc aaa aag gca aat gaa ggg ctt ggc ctg caa 912

Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln

290 295 300

aat tgc gca aca cat aca gag atc aag cta atg aaa aac aga gaa ccg 960

Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro

305 310 315 320

ggt tta ata gag tcg gca gcc aga ttc gca ggc tgg aat atg att cct 1008

Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro

325 330 335

aat att aaa aag gtc ttt ggc ctt gat atg gcg caa tta tta tta gat 1056

Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp

340 345 350

gtc ctc tgt ttc gga aaa gac gcc gat ctg ccg gac gga tta ttg gat 1104

Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp

355 360 365

caa gag cct tat tat gtt gcc gac tgc cat ttg tac ccg cag cat ttc 1152

Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe

370 375 380

aaa caa aat ggc cag att cca gaa acc gct gag gat ttg gtc att gaa 1200

Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu

385 390 395 400

gcg atc gat att ccg gac ggg ctt tta aaa ggg gat act gaa atc gtt 1248

Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val

405 410 415

tca ttt tca gcc gca gca cca ggc act tca gtt gat ttg aca ttg ttt 1296

Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe

420 425 430

gaa gct ttc aat tcc att gct gca ttt gaa ctg aaa ggc agt aat tca 1344

Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser

435 440 445

cag gat gtg gct gaa tca atc aga caa att cag cag cat gca aag ctg 1392

Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu

450 455 460

acg gca aag tat gtg ctg cca gta 1416

Thr Ala Lys Tyr Val Leu Pro Val

465 470

<210>37

<211>239

<212>PRT

<213>诺尔斯氏链霉菌IFO15452(Streptomyces noursei IFO15452)

<400>37

Met Leu Ala Gly Leu Val Pro Ala Pro Asp His Gly Met Arg Glu Glu

1 5 10 15

Ile Leu Gly Asp Arg Ser Arg Leu Ile Arg Gln Arg Gly Glu His Ala

20 25 30

Leu Ile Gly Ile Ser Ala Gly Asn Ser Tyr Phe Ser Gln Lys Asn Thr

35 40 45

Val Met Leu Leu Gln Trp Ala Gly Gln Arg Phe Glu Arg Thr Asp Val

50 55 60

Val Tyr Val Asp Thr His Ile Asp Glu Met Leu Ile Ala Asp Gly Arg

65 70 75 80

Ser Ala Gln Glu Ala Glu Arg Ser Val Lys Arg Thr Leu Lys Asp Leu

85 90 95

Arg Arg Arg Leu Arg Arg Ser Leu Glu Ser Val Gly Asp His Ala Glu

100 105 110

Arg Phe Arg Val Arg Ser Leu Ser Glu Leu Gln Glu Thr Pro Glu Tyr

115 120 125

Arg Ala Val Arg Glu Arg Thr Asp Arg Ala Phe Glu Glu Asp Ala Glu

130 135 140

Phe Ala Thr Ala Cys Glu Asp Met Val Arg Ala Val Val Met Asn Arg

145 150 155 160

Pro Gly Asp Gly Val Gly Ile Ser Ala Glu His Leu Arg Ala Gly Leu

165 170 175

Asn Tyr Val Leu Ala Glu Ala Pro Leu Phe Ala Asp Ser Pro Gly Val

180 185 190

Phe Ser Val Pro Ser Ser Val Leu Cys Tyr His Ile Asp Thr Pro Ile

195 200 205

Thr Ala Phc Leu Ser Arg Arg Glu Thr Gly Phe Arg Ala Ala Glu Gly

210 215 220

Gln Ala Tyr Val Val Val Arg Pro Gln Glu Leu Ala Asp Ala Ala

225 230 235

<210>38

<211>239

<212>PRT

<213>诺尔斯氏链霉菌IFO15452(Streptomyces alborus IFO15452)

<400>38

Met Leu Ala Gly Leu Val Pro Ala Leu Asp His Ser Met Arg Glu Glu

1 5 10 15Ile Leu Gly Asn Arg Gly Arg Lys Ile Arg Gln Arg Gly Glu His Ala

20 25 30

Leu Ile Gly Ile Ser Ala Gly Asn Ser Tyr Phe Ser Gln Lys Asn Val

35 40 45

Thr Met Leu Leu Gln Trp Ala Gly Gln His Phe Glu Arg Thr Asp Val

50 55 60

Val Tyr Val Asp Thr His Ile Asp Asp Met Leu Met Ala Asp Gly Arg

65 70 75 80

Ser Ala Gln Glu Ala Glu Lys Ser Val Lys Arg Thr Leu Lys Asp Leu

85 90 95

Arg Arg Arg Leu Arg Arg Ser Leu Glu Ser Val Gly Asp His Ser Glu

100 105 110

Arg Phe Arg Val Arg Ser Leu Ser Glu Ile Gln Glu Thr Pro Glu Tyr

115 120 125

Arg Ala Ala Arg Glu Ser Thr Asp Arg Ala Phe Arg Glu Asp Gly Glu

130 135 140

Phe Ala Thr Val Cys Glu Glu Met Val Arg Ala Val Val Met Asn Arg

145 150 155 160

Pro Gly Asp Gly Val Asp Ile Ser Glu Glu His Leu Arg Ala Gly Leu

165 170 175

Asn Tyr Val Leu Ala Glu Ala Pro Leu Phe Ala Asp Ser Pro Gly Val

180 185 190

Phe Ser Val Pro Ser Ser Val Leu Cys Tyr His Ile Pro Thr Pro Val

195 200 205

Ser Thr Phe Leu Ala His Arg Glu Thr Gly Phe Gln Ala Ala Gln Gly

210 215 220

Gln Ala Tyr Val Val Val Arg Pro Gln Glu Leu Ala Asp Ala Ala

225 230 235

<210>39

<211>717

<212>DNA

<213>诺尔斯氏链霉菌IFO15452

<400>39

atg ctt gca ggc tta gtt ccc gcg ccg gac cac gga atg cgg gaa gaa 48

Met Leu Ala Gly Leu Val Pro Ala Pro Asp His Gly Met Arg Glu Glu

1 5 10 15

ata ctt ggc gac cgc agc cga ttg atc cgg caa cgc ggt gag cac gcc 96

Ile Leu Gly Asp Arg Ser Arg Leu Ile Arg Gln Arg Gly Glu His Ala

20 25 30

ctc arc gga atc agt gcg ggc aac agt tat ttc agc cag aag aac acc 144

Leu Ile Gly Ile Ser Ala Gly Asn Ser Tyr Phe Ser Gln Lys Ash Thr

35 40 45

gtc atg ctg ctg caa tgg gcc ggg cag cgt ttc gag cgc acc gat gtc 192

Val Met Leu Leu Gln Trp Ala Gly Gln Arg Phe Glu Arg Thr Asp Val

50 55 60

gtc tat gtc gac acc cac atc gac gag atg ctg atc gcc gac ggc cgc 240

Val Tyr Val Asp Thr His Ile Asp Glu Met Leu Ile Ala Asp Gly Arg

65 70 75 80

agc gcg cag gag gcc gag cgg tcg gtc aaa cgc acg ctc aag gat ctg 288

Ser Ala Gln Glu Ala Glu Arg Ser Val Lys Arg Thr Leu Lys Asp Leu

85 90 95

cgg cgc aga ctc cgg cgc tcg ctg gag agc gtg ggc gac cac gcc gag 336

Arg Arg Arg Leu Arg Arg Ser Leu Glu Ser Val Gly Asp His Ala Glu

100 105 110

cgg ttc cgt gtc cgg tcc ctg tcc gag ctc cag gag acc cct gag tac 384

Arg Phe Arg Val Arg Ser Leu Ser Glu Leu Gln Glu Thr Pro Glu Tyr

115 120 125

cgg gcc gta cgc gag cgc acc gac cgg gcc ttc gag gag gac gcc gaa 432

Arg Ala Val Arg Glu Arg Thr Asp Arg Ala Phe Glu Glu Asp Ala Glu

130 135 140

ttc gcc acc gcc tgc gag gac atg gtg cgg gcc gtg gtg atg aac cgg 480

Phe Ala Thr Ala Cys Glu Asp Met Val Arg Ala Val Val Met Asn Arg

145 150 155 160

ccc ggt gac ggc gtc ggc atc tcc gcg gaa cac ctg cgg gcc ggt ctg 528

Pro Gly Asp Gly Val Gly Ile Ser Ala Glu His Leu Arg Ala Gly Leu

165 170 175

aac tac gtg ctg gcc gag gcc ccg ctc ttc gcg gac tcg ccc gga gtc 576

Asn Tyr Val Leu Ala Glu Ala Pro Leu Phe Ala Asp Ser Pro Gly Val

180 185 190

ttc tcc gtc ccc tcc tcg gtg ctc tgc tac cac atc gac acc ccg atc 624

Phe Ser Val Pro Ser Ser Val Leu Cys Tyr His Ile Asp Thr Pro Ile

195 200 205

acg gcg ttc ctg tcc cgg cgc gag acc ggt ttc cgg gcg gcc gag gga 672

Thr Ala Phe Leu Ser Arg Arg Glu Thr Gly Phe Arg Ala Ala Glu Gly

210 215 220

cag gcg tac gtc gtc gtc agg ccc cag gag ctg gcc gac gcg gcc 717

Gln Ala Tyr Val Val Val Arg Pro Gln Glu Leu Ala Asp Ala Ala

225 230 235

<210>40

<211>717

<212>DNA

<213>诺尔斯氏链霉菌IFO15452

<400>40

atg ctt gca ggc tta gtt ccc gcg ctg gac cac agc atg cgg gaa gaa 48

Met Leu Ala Gly Leu Val Pro Ala Leu Asp His Ser Met Arg Glu Glu

1 5 10 15

ara crt ggc aat cgc ggc cga aag atc cgg caa cgc ggt gag cac gct 96

Ile Leu Gly Asn Arg Gly Arg Lys Ile Arg Gln Arg Gly Glu His Ala

20 25 30

ctc att gga atc agt gcg ggc aac agt tat ttc agc cag aag aac gtc 144

Leu Ile Gly Ile Ser Ala Gly Asn Ser Tyr Phe Set Gln Lys Asn Val

35 40 45

acc atg ctg ctg caa tgg gcc ggg cag cat ttc gag cgc acg gat gtc 192

Thr Met Leu Leu Gln Trp Ala Gly Gln His Phe Glu Arg Thr Asp Val

50 55 60

gtc tac gtg gac acg cac atc gac gac atg ctg atg gcg gac ggc cgc 240

Val Tyr Val Asp Thr His Ile Asp Asp Met Leu Met Ala Asp Gly Arg

65 70 75 80

agc gcg cag gaa gcc gag aag tcg gtc aag cgc acg crc aag gat ctg 288

Ser Ala Gln Glu Ala Glu Lys Ser Val Lys Arg Thr Leu Lys Asp Leu

85 90 95

cgg cgc agg ctg cgg cgc tcg ttg gaa agc gtg ggc gac cac agc gag 336

Arg Arg Arg Leu Arg Arg Ser Leu Glu Ser Val Gly Asp His Ser Glu

100 105 110

cgg ttc cgc gtc cgg tcc ctg tcc gag arc cag gag acc cct gag tac 384

Arg Phe Arg Val Arg Ser Leu Ser Glu Ile Gln Glu Thr Pro Glu Tyr

115 120 125

cgg gcc gca cgc gag tcc acc gac cgg gcc ttc cgc gag gac ggc gag 432

Arg Ala Ala Arg Glu Ser Thr Asp Arg Ala Phe Arg Glu Asp Gly Glu

130 135 140

ttc gcc acc gtc tgc gag gag atg gtg cgc gcc gtg gtg atg aac cgg 480

Phe Ala Thr Val Cys Glu Glu Met Val Arg Ala Val Val Met Asn Arg

145 150 155 160

ccc ggt gac ggc gtc gac atc tcg gag gaa cac ctg cgg gcc ggt ctg 528

Pro Gly Asp Gly Val Asp Ile Ser Glu Glu His Leu Arg Ala Gly Leu

165 170 175

aac tac gtg ctc gcc gag gcc ccg crc ttc gcg gac tcg ccc ggc gtg 576

Asn Tyr Val Leu Ala Glu Ala Pro Leu Phe Ala Asp Ser Pro Gly Val

180 185 190

ttc tcc gtc ccc tcg tcg gtg crc tgc tac cac atc ccc acc ccg gta 624

Phe Ser Val Pro Ser Ser Val Leu Cys Tyr His Ile Pro Thr Pro Val

195 200 205

tcg acg ttc ctg gcc cat cgc gag acc ggt ttc cag gcg gct cag ggt 672

Ser Thr Phe Leu Ala His Arg Glu Thr Gly Phe Gln Ala Ala Gln Gly

210 215 220

cag gca tac gtc gtc gtc agg ccg cag gag ctg gcc gac gcg gcc 717

Gln Ala Tyr Val Val Val Arg Pro Gln Glu Leu Ala Asp Ala Ala

225 230 235

<210>41

<211>32

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成DNA

<400>41

agagccatgg gacttgcagg cttagttccc gc 32

<210>42

<211>29

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成DNA

<400>42

agagagatct ggccgcgtcg gccagctcc 29

<210>43

<211>503

<212>PRT

<213>大肠杆菌

<400>43

Met Glu Phe Ser Val Lys Ser Gly Ser Pro Glu Lys Gln Arg Ser Ala

1 5 10 15

Cys Ile Val Val Gly Val Phe Glu Pro Arg Arg Leu Ser Pro Ile Ala

20 25 30

Glu Gln Leu Asp Lys Ile Ser Asp Gly Tyr Ile Ser Ala Leu Leu Arg

35 40 45

Arg Gly Glu Leu Glu Gly Lys Pro Gly Gln Thr Leu Leu Leu His His

50 55 60

Val Pro Asn Val Leu Ser Glu Arg Ile Leu Leu Ile Gly Cys Gly Lys

65 70 75 80

Glu Arg Glu Leu Asp Glu Arg Gln Tyr Lys Gln Val Ile Gln Lys Thr

85 90 95

Ile Asn Thr Leu Asn Asp Thr Gly Ser Met Glu Ala Val Cys Phe Leu

100 105 110

Thr Glu Leu His Val Lys Gly Arg Asn Asn Tyr Trp Lys Val Arg Gln

115 120 125

Ala Val Glu Thr Ala Lys Glu Thr Leu Tyr Ser Phe Asp Gln Leu Lys

130 135 140

Thr Asn Lys Ser Glu Pro Arg Arg Pro Leu Arg Lys Met Val Phe Asn

145 150 155 160

Val Pro Thr Arg Arg Glu Leu Thr Ser Gly Glu Arg Ala Ile Gln His

165 170 175

Gly Leu Ala Ile Ala Ala Gly Ile Lys Ala Ala Lys Asp Leu Gly Asn

180 185 190

Met Pro Pro Asn Ile Cys Asn Ala Ala Tyr Leu Ala Ser Gln Ala Arg

195 200 205

Gln Leu Ala Asp Ser Tyr Ser Lys Asn Val Ile Thr Arg Val Ile Gly

210 215 220

Glu Gln Gln Met Lys Glu Leu Gly Met His Ser Tyr Leu Ala Val Gly

225 230 235 240

Gln Gly Ser Gln Asn Glu Ser Leu Met Ser Val Ile Glu Tyr Lys Gly

245 250 255

Asn Ala Ser Glu Asp Ala Arg Pro Ile Val Leu Val Gly Lys Gly Leu

260 265 270

Thr Phe Asp Ser Gly Gly Ile Ser Ile Lys Pro Ser Glu Gly Met Asp

275 280 285

Glu Met Lys Tyr Asp Met Cys Gly Ala Ala Ala Val Tyr Gly Val Met

290 295 300

Arg Met Val Ala Glu Leu Gln Leu Pro Ile Asn Val Ile Gly Val Leu

305 310 315 320

Ala Gly Cys Glu Asn Met Pro Gly Gly Arg Ala Tyr Arg Pro Gly Asp

325 330 335

Val Leu Thr Thr Met Ser Gly Gln Thr Val Glu Val Leu Asn Thr Asp

340 345 350

Ala Glu Gly Arg Leu Val Leu Cys Asp Val Leu Thr Tyr Val Glu Arg

355 360 365

Phe Glu Pro Glu Ala Val Ile Asp Val Ala Thr Leu Thr Gly Ala Cys

370 375 380

Val Ile Ala Leu Gly His His Ile Thr Gly Leu Met Ala Asn His Asn

385 390 395 400

Pro Leu Ala His Glu Leu Ile Ala Ala Ser Glu Gln Ser Gly Asp Arg

405 410 415

Ala Trp Arg Leu Pro Leu Gly Asp Glu Tyr Gln Glu Gln Leu Glu Ser

420 425 430

Asn Phe Ala Asp Met Ala Asn Ile Gly Gly Arg Pro Gly Gly Ala Ile

435 440 445

Thr Ala Gly Cys Phe Leu Ser Arg Phe Thr Arg Lys Tyr Asn Trp Ala

450 455 460

His Leu Asp Ile Ala Gly Thr Ala Trp Arg Ser Gly Lys Ala Lys Gly

465 470 475 480

Ala Thr Gly Arg Pro Val Ala Leu Leu Ala Gln Phe Leu Leu Asn Arg

485 490 495

Ala Gly Phe Asn Gly Glu Glu

500

<210>44

<211>427

<212>PRT

<213>大肠杆菌

<400>44

Met Thr Glu Ala Met Lys Ile Thr Leu Ser Thr Gln Pro Ala Asp Ala

1 5 10 15

Arg Trp Gly Glu Lys Ala Thr Tyr Ser Ile Asn Asn Asp Gly Ile Thr

20 25 30

Leu His Leu Asn Gly Ala Asp Asp Leu Gly Leu Ile Gln Arg Ala Ala

35 40 45

Arg Lys Ile Asp Gly Leu Gly Ile Lys His Val Gln Leu Ser Gly Glu

50 55 60

Gly Trp Asp Ala Asp Arg Cys Trp Ala Phe Trp Gln Gly Tyr Lys Ala

65 70 75 80

Pro Lys Gly Thr Arg Lys Val Val Trp Pro Asp Leu Asp Asp Ala Gln

85 90 95

Arg Gln Glu Leu Asp Asn Arg Leu Met Ile Ile Asp Trp Val Arg Asp

100 105 110

Thr Ile Asn Ala Pro Ala Glu Glu Leu Gly Pro Ser Gln Leu Ala Gln

115 120 125

Arg Ala Val Asp Leu Ile Ser Asn Val Ala Gly Asp Arg Val Thr Tyr

130 135 140

Arg Ile Thr Lys Gly Glu Asp Leu Arg Glu Gln Gly Tyr Met Gly Leu

145 150 155 160

His Thr Val Gly Arg Gly Ser Glu Arg Ser Pro Val Leu Leu Ala Leu

165 170 175

Asp Tyr Asn Pro Thr Gly Asp Lys Glu Ala Pro Val Tyr Ala Cys Leu

180 185 190

Val Gly Lys Gly Ile Thr Phe Asp Ser Gly Gly Tyr Ser Ile Lys Gln

195 200 205

Thr Ala Phe Met Asp Ser Met Lys Ser Asp Met Gly Gly Ala Ala Thr

210 215 220

Val Thr Gly Ala Leu Ala Phe Ala Ile Thr Arg Gly Leu Asn Lys Arg

225 230 235 240

Val Lys Leu Phe Leu Cys Cys Ala Asp Asn Leu Ile Ser Gly Asn Ala

245 250 255

Phe Lys Leu Gly Asp Ile Ile Thr Tyr Arg Asn Gly Lys Lys Val Glu

260 265 270

Val Met Asn Thr Asp Ala Glu Gly Arg Leu Val Leu Ala Asp Gly Leu

275 280 285

Ile Asp Ala Ser Ala Gln Lys Pro Glu Met Ile Ile Asp Ala Ala Thr

290 295 300

Leu Thr Gly Ala Ala Lys Thr Ala Leu Gly Asn Asp Tyr His Ala Leu

305 310 315 320

Phe Ser Phe Asp Asp Ala Leu Ala Gly Arg Leu Leu Ala Ser Ala Ala

325 330 335

Gln Glu Asn Glu Pro Phe Trp Arg Leu Pro Leu Ala Glu Phe His Arg

340 345 350

Ser Gln Leu Pro Ser Asn Phe Ala Glu Leu Asn Asn Thr Gly Ser Ala

355 360 365

Ala Tyr Pro Ala Gly Ala Ser Thr Ala Ala Gly Phe Leu Ser His Phe

370 375 380

Val Glu Asn Tyr Gln Gln Gly Trp Leu His Ile Asp Cys Ser Ala Thr

385 390 395 400

Tyr Arg Lys Ala Pro Val Glu Gln Trp Ser Ala Gly Ala Thr Gly Leu

405 410 415

Gly Val Arg Thr Ile Ala Asn Leu Leu Thr Ala

420 425

<210>45

<211>485

<212>PRT

<213>大肠杆菌(Escherichia coli)

<400>45

Met Ser Glu Leu Ser Gln Leu Ser Pro Gln Pro Leu Trp Asp Ile Phe

1 5 10 15

Ala Lys Ile Cys Ser Ile Pro His Pro Ser Tyr His Glu Glu Gln Leu

20 25 30

Ala Glu Tyr Ile Val Gly Trp Ala Lys Glu Lys Gly Phe His Val Glu

35 40 45

Arg Asp Gln Val Gly Asn Ile Leu Ile Arg Lys Pro Ala Thr Ala Gly

50 55 60

Met Glu Asn Arg Lys Pro Val Val Leu Gln Ala His Leu Asp Met Val

65 70 75 80

Pro Gln Lys Asn Asn Asp Thr Val His Asp Phe Thr Lys Asp Pro Ile

85 90 95

Gln Pro Tyr Ile Asp Gly Glu Trp Val Lys Ala Arg Gly Thr Thr Leu

100 105 110

Gly Ala Asp Asn Gly Ile Gly Met Ala Ser Ala Leu Ala Val Leu Ala

115 120 125

Asp Glu Asn Val Val His Gly Pro Leu Glu Val Leu Leu Thr Met Thr

130 135 140

Glu Glu Ala Gly Met Asp Gly Ala Phe Gly Leu Gln Gly Asn Trp Leu

145 150 155 160

Gln Ala Asp Ile Leu Ile Asn Thr Asp Ser Glu Glu Glu Gly Glu Ile

165 170 175

Tyr Met Gly Cys Ala Gly Gly Ile Asp Phe Thr Ser Asn Leu His Leu

180 185 190

Asp Arg Glu Ala Val Pro Ala Gly Phe Glu Thr Phe Lys Leu Thr Leu

195 200 205

Lys Gly Leu Lys Gly Gly His Ser Gly Gly Glu Ile His Val Gly Leu

210 215 220

Gly Asn Ala Asn Lys Leu Leu Val Arg Phe Leu Ala Gly His Ala Glu

225 230 235 240

Glu Leu Asp Leu Arg Leu Ile Asp Phe Asn Gly Gly Thr Leu Arg Asn

245 250 255

Ala Ile Pro Arg Glu Ala Phe Ala Thr Ile Ala Val Ala Ala Asp Lys

260 265 270

Val Asp Val Leu Lys Ser Leu Val Asn Thr Tyr Gln Glu Ile Leu Lys

275 280 285

Asn Glu Leu Ala Glu Lys Glu Lys Asn Leu Ala Leu Leu Leu Asp Ser

290 295 300

Val Ala Asn Asp Lys Ala Ala Leu Ile Ala Lys Ser Arg Asp Thr Phe

305 310 315 320

Ile Arg Leu Leu Asn Ala Thr Pro Asn Gly Val Ile Arg Asn Ser Asp

325 330 335

Val Ala Lys Gly Val Val Glu Thr Ser Leu Asn Val Gly Val Val Thr

340 345 350

Met Thr Asp Asn Ash Val Glu Ile His Cys Leu Ile Arg Ser Leu Ile

355 360 365

Asp Ser Gly Lys Asp Tyr Val Val Ser Met Leu Asp Ser Leu Gly Lys

370 375 380

Leu Ala Gly Ala Lys Thr Glu Ala Lys Gly Ala Tyr Pro Gly Trp Gln

385 390 395 400

Pro Asp Ala Asn Ser Pro Val Met His Leu Val Arg Glu Thr Tyr Gln

405 410 415

Arg Leu Phe Asn Lys Thr Pro Asn Ile Gln Ile Ile His Ala Gly Leu

420 425 430

Glu Cys Gly Leu Phe Lys Lys Pro Tyr Pro Glu Met Asp Met Val Ser

435 440 445

Ile Gly Pro Thr Ile Thr Gly Pro His Ser Pro Asp Glu Gln Val His

450 455 460

Ile Glu Ser Val Gly His Tyr Trp Thr Leu Leu Thr Glu Leu Leu Lys

465 470 475 480

Glu Ile Pro Ala Lys

485

<210>46

<211>870

<212>PRT

<213>大肠杆菌

<400>46

Met Thr Gln Gln Pro Gln Ala Lys Tyr Arg His Asp Tyr Arg Ala Pro

1 5 10 15

Asp Tyr Gln Ile Thr Asp Ile Asp Leu Thr Phe Asp Leu Asp Ala Gln

20 25 30

Lys Thr Val Val Thr Ala Val Ser Gln Ala Val Arg His Gly Ala Ser

35 40 45

Asp Ala Pro Leu Arg Leu Asn Gly Glu Asp Leu Lys Leu Val Ser Val

50 55 60

His Ile Asn Asp Glu Pro Trp Thr Ala Trp Lys Glu Glu Glu Gly Ala

65 70 75 80

Leu Val Ile Ser Asn Leu Pro Glu Arg Phe Thr Leu Lys Ile Ile Asn

85 90 95

Glu Ile Ser Pro Ala Ala Asn Thr Ala Leu Glu Gly Leu Tyr Gln Ser

100 105 110

Gly Asp Ala Leu Cys Thr Gln Cys Glu Ala Glu Gly Phe Arg His Ile

115 120 125

Thr Tyr Tyr Leu Asp Arg Pro Asp Val Leu Ala Arg Phe Thr Thr Lys

130 135 140

Ile Ile Ala Asp Lys Ile Lys Tyr Pro Phe Leu Leu Ser Asn Gly Asn

145 150 155 160

Arg Val Ala Gln Gly Glu Leu Glu Asn Gly Arg His Trp Val Gln Trp

165 170 175

Gln Asp Pro Phe Pro Lys Pro Cys Tyr Leu Phe Ala Leu Val Ala Gly

180 185 190

Asp Phe Asp Val Leu Arg Asp Thr Phe Thr Thr Arg Ser Gly Arg Glu

195 200 205

Val Ala Leu Glu Leu Tyr Val Asp Arg Gly Asn Leu Asp Arg Ala Pro

210 215 220

Trp Ala Met Thr Ser Leu Lys Asn Ser Met Lys Trp Asp Glu Glu Arg

225 230 235 240

Phe Gly Leu Glu Tyr Asp Leu Asp Ile Tyr Met Ile Val Ala Val Asp

245 250 255

Phe Phe Asn Met Gly Ala Met Glu Asn Lys Gly Leu Asn Ile Phe Asn

260 265 270

Ser Lys Tyr Val Leu Ala Arg Thr Asp Thr Ala Thr Asp Lys Asp Tyr

275 280 285

Leu Asp Ile Glu Arg Val Ile Gly His Glu Tyr Phe His Asn Trp Thr

290 295 300

Gly Asn Arg Val Thr Cys Arg Asp Trp Phe Gln Leu Ser Leu Lys Glu

305 310 315 320

Gly Leu Thr Val Phe Arg Asp Gln Glu Phe Ser Ser Asp Leu Gly Ser

325 330 335

Arg Ala Val Asn Arg Ile Asn Asn Val Arg Thr Met Arg Gly Leu Gln

340 345 350

Phe Ala Glu Asp Ala Ser Pro Met Ala His Pro Ile Arg Pro Asp Met

355 360 365

Val Ile Glu Met Asn Asn Phe Tyr Thr Leu Thr Val Tyr Glu Lys Gly

370 375 380

Ala Glu Val Ile Arg Met Ile His Thr Leu Leu Gly Glu Glu Asn Phe

385 390 395 400

Gln Lys Gly Met Gln Leu Tyr Phe Glu Arg His Asp Gly Ser Ala Ala

405 410 415

Thr Cys Asp Asp Phe Val Gln Ala Met Glu Asp Ala Ser Asn Val Asp

420 425 430

Leu Ser His Phe Arg Arg Trp Tyr Ser Gln Ser Gly Thr Pro Ile Val

435 440 445

Thr Val Lys Asp Asp Tyr Asn Pro Glu Thr Glu Gln Tyr Thr Leu Thr

450 455 460

Ile Ser Gln Arg Thr Pro Ala Thr Pro Asp Gln Ala Glu Lys Gln Pro

465 470 475 480

Leu His Ile Pro Phe Ala Ile Glu Leu Tyr Asp Asn Glu Gly Lys Val

485 490 495

Ile Pro Leu Gln Lys Gly Gly His Pro Val Asn Ser Val Leu Asn Val

500 505 510

Thr Gln Ala Glu Gln Thr Phe Val Phe Asp Asn Val Tyr Phe Gln Pro

515 520 525

Val Pro Ala Leu Leu Cys Glu Phe Ser Ala Pro Val Lys Leu Glu Tyr

530 535 540

Lys Trp Ser Asp Gln Gln Leu Thr Phe Leu Met Arg His Ala Arg Asn

545 550 555 560

Asp Phe Ser Arg Trp Asp Ala Ala Gln Ser Leu Leu Ala Thr Tyr Ile

565 570 575

Lys Leu Asn Val Ala Arg His Gln Gln Gly Gln Pro Leu Ser Leu Pro

580 585 590

Val His Val Ala Asp Ala Phe Arg Ala Val Leu Leu Asp Glu Lys Ile

595 600 605

Asp Pro Ala Leu Ala Ala Glu Ile Leu Thr Leu Pro Ser Val Asn Glu

610 615 620

Met Ala Glu Leu Phe Asp Ile Ile Asp Pro Ile Ala Ile Ala Glu Val

625 630 635 640

Arg Glu Ala Leu Thr Arg Thr Leu Ala Thr Glu Leu Ala Asp Glu Leu

645 650 655

Leu Ala Ile Tyr Asn Ala Asn Tyr Gln Ser Glu Tyr Arg Val Glu His

660 665 670

Glu Asp Ile Ala Lys Arg Thr Leu Arg Asn Ala Cys Leu Arg Phe Leu

675 680 685

Ala Phe Gly Glu Thr His Leu Ala Asp Val Leu Val Ser Lys Gln Phe

690 695 700

His Glu Ala Asn Asn Met Thr Asp Ala Leu Ala Ala Leu Ser Ala Ala

705 710 715 720

Val Ala Ala Gln Leu Pro Cys Arg Asp Ala Leu Met Gln Glu Tyr Asp

725 730 735

Asp Lys Trp His Gln Asn Gly Leu Val Met Asp Lys Trp Phe Ile Leu

740 745 750

Gln Ala Thr Ser Pro Ala Ala Asn Val Leu Glu Thr Val Arg Gly Leu

755 760 765

Leu Gln His Arg Ser Phe Thr Met Ser Asn Pro Asn Arg Ile Arg Ser

770 775 780

Leu Ile Gly Ala Phe Ala Gly Ser Asn Pro Ala Ala Phe His Ala Glu

785 790 795 800

Asp Gly Ser Gly Tyr Leu Phe Leu Val Glu Met Leu Thr Asp Leu Asn

805 810 815

Ser Arg Asn Pro Gln Val Ala Ser Arg Leu Ile Glu Pro Leu Ile Arg

820 825 830

Leu Lys Arg Tyr Asp Ala Lys Arg Gln Glu Lys Met Arg Ala Ala Leu

835 840 845

Glu Gln Leu Lys Gly Leu Glu Asn Leu Ser Gly Asp Leu Tyr Glu Lys

850 855 860

Ile Thr Lys Ala Leu Ala

865 870

<210>47

<211>535

<212>PRT

<213>大肠杆菌

<400>47

Met Arg Ile Ser Leu Lys Lys Ser Gly Met Leu Lys Leu Gly Leu Ser

l 5 10 15

Leu Val Ala Met Thr Val Ala Ala Ser Val Gln Ala Lys Thr Leu Val

20 25 30

Tyr Cys Ser Glu Gly Ser Pro Glu Gly Phe Asn Pro Gln Leu Phe Thr

35 40 45

Ser Gly Thr Thr Tyr Asp Ala Ser Ser Val Pro Leu Tyr Asn Arg Leu

50 55 60

Val Glu Phe Lys Ile Gly Thr Thr Glu Val Ile Pro Gly Leu Ala Glu

65 70 75 80

Lys Trp Glu Val Ser Glu Asp Gly Lys Thr Tyr Thr Phe His Leu Arg

85 90 95

Lys Gly Val Lys Trp His Asp Asn Lys Glu Phe Lys Pro Thr Arg Glu

100 105 110

Leu Asn Ala Asp Asp Val Val Phe Ser Phe Asp Arg Gln Lys Asn Ala

115 120 125

Gln Asn Pro Tyr His Lys Val Ser Gly Gly Ser Tyr Glu Tyr Phe Glu

130 135 140

Gly Met Gly Leu Pro Glu Leu Ile Ser Glu Val Lys Lys Val Asp Asp

145 150 155 160

Asn Thr Val Gln Phe Val Leu Thr Arg Pro Glu Ala Pro Phe Leu Ala

165 170 175

Asp Leu Ala Met Asp Phe Ala Ser Ile Leu Ser Lys Glu Tyr Ala Asp

180 185 190

Ala Met Met Lys Ala Gly Thr Pro Glu Lys Leu Asp Leu Asn Pro Ile

195 200 205

Gly Thr Gly Pro Phe Gln Leu Gln Gln Tyr Gln Lys Asp Ser Arg Ile

210 215 220

Arg Tyr Lys Ala Phe Asp Gly Tyr Trp Gly Thr Lys Pro Gln Ile Asp

225 230 235 240

Thr Leu Val Phe Ser Ile Thr Pro Asp Ala Ser Val Arg Tyr Ala Lys

245 250 255

Leu Gln Lys Asn Glu Cys Gln Val Met Pro Tyr Pro Asn Pro Ala Asp

260 265 270

Ile Ala Arg Met Lys Gln Asp Lys Ser Ile Asn Leu Met Glu Met Pro

275 280 285

Gly Leu Asn Val Gly Tyr Leu Ser Tyr Asn Val Gln Lys Lys Pro Leu

290 295 300

Asp Asp Val Lys Val Arg Gln Ala Leu Thr Tyr Ala Val Asn Lys Asp

305 310 315 320

Ala Ile Ile Lys Ala Val Tyr Gln Gly Ala Gly Val Ser Ala Lys Asn

325 330 335

Leu Ile Pro Pro Thr Met Trp Gly Tyr Asn Asp Asp Val Gln Asp Tyr

340 345 350

Thr Tyr Asp Pro Glu Lys Ala Lys Ala Leu Leu Lys Glu Ala Gly Leu

355 360 365

Glu Lys Gly Phe Ser Ile Asp Leu Trp Ala Met Pro Val Gln Arg Pro

370 375 380

Tyr Asn Pro Asn Ala Arg Arg Met Ala Glu Met Ile Gln Ala Asp Trp

385 390 395 400

Ala Lys Val Gly Val Gln Ala Lys Ile Val Thr Tyr Glu Trp Gly Glu

405 410 415

Tyr Leu Lys Arg Ala Lys Asp Gly Glu His Gln Thr Val Met Met Gly

420 425 430

Trp Thr Gly Asp Asn Gly Asp Pro Asp Asn Phe Phe Ala Thr Leu Phe

435 440 445

Ser Cys Ala Ala Ser Glu Gln Gly Ser Asn Tyr Ser Lys Trp Cys Tyr

450 455 460

Lys Pro Phe Glu Asp Leu Ile Gln Pro Ala Arg Ala Thr Asp Asp His

465 470 475 480

Asn Lys Arg Val Glu Leu Tyr Lys Gln Ala Gln Val Val Met His Asp

485 490 495

Gln Ala Pro Ala Leu Ile Ile Ala His Ser Thr Val Phe Glu Pro Val

500 505 510

Arg Lys Glu Val Lys Gly Tyr Val Val Asp Pro Leu Gly Lys His His

515 520 525

Phe Glu Asn Val Ser Ile Glu

530 535

<210>48

<211>339

<212>PRT

<213>大肠杆菌

<400>48

Met Leu Gln Phe Ile Leu Arg Arg Leu Gly Leu Val Ile Pro Thr Phe

1 5 10 15

Ile Gly Ile Thr Leu Leu Thr Phe Ala Phe Val His Met Ile Pro Gly

20 25 30

Asp Pro Val Met Ile Met Ala Gly Glu Arg Gly Ile Ser Pro Glu Arg

35 40 45

His Ala Gln Leu Leu Ala Glu Leu Gly Leu Asp Lys Pro Met Trp Gln

50 55 60

Gln Tyr Leu His Tyr Ile Trp Gly Val Met His Gly Asp Leu Gly Ile

65 70 75 80

Ser Met Lys Ser Arg Ile Pro Val Trp Glu Glu Phe Val Pro Arg Phe

85 90 95

Gln Ala Thr Leu Glu Leu Gly Val Cys Ala Met Ile Phe Ala Thr Ala

100 105 110

Val Gly Ile Pro Val Gly Val Leu Ala Ala Val Lys Arg Gly Ser Ile

115 120 125

Phe Asp His Thr Ala Val Gly Leu Ala Leu Thr Gly Tyr Ser Met Pro

130 135 140

Ile Phe Trp Trp Gly Met Met Leu Ile Met Leu Val Ser Val His Trp

145 150 155 160

Asn Leu Thr Pro Val Ser Gly Arg Val Ser Asp Met Val Phe Leu Asp

165 170 175

Asp Ser Asn Pro Leu Thr Gly Phe Met Leu Ile Asp Thr Ala Ile Trp

180 185 190

Gly Glu Asp Gly Asn Phe Ile Asp Ala Val Ala His Met Ile Leu Pro

195 200 205

Ala Ile Val Leu Gly Thr Ile Pro Leu Ala Val Ile Val Arg Met Thr

210 215 220

Arg Ser Ser Met Leu Glu Val Leu Gly Glu Asp Tyr Ile Arg Thr Ala

225 230 235 240

Arg Ala Lys Gly Leu Thr Arg Met Arg Val Ile Ile Val His Ala Leu

245 250 255

Arg Asn Ala Met Leu Pro Val Val Thr Val Ile Gly Leu Gln Val Gly

260 265 270

Thr Leu Leu Ala Gly Ala Ile Leu Thr Glu Thr Ile Phe Ser Trp Pro

275 280 285

Gly Leu Gly Arg Trp Leu Ile Asp Ala Leu Gln Arg Arg Asp Tyr Pro

290 295 300

Val Val Gln Gly Gly Val Leu Leu Val Ala Thr Met Ile Ile Leu Val

305 310 315 320

Asn Leu Leu Val Asp Leu Leu Tyr Gly Val Val Asn Pro Arg Ile Arg

325 330 335

His Lys Lys

<210>49

<211>300

<212>PRT

<213>大肠杆菌

<400>49

Met Ser Gln Val Thr Glu Asn Lys Val Ile Ser Ala Pro Val Pro Met

1 5 10 15

Thr Pro Leu Gln Glu Phe Trp His Tyr Phe Lys Arg Asn Lys Gly Ala

20 25 30

Val Val Gly Leu Val Tyr Val Val Ile Val Leu Phe Ile Ala Ile Phe

35 40 45

Ala Asn Trp Ile Ala Pro Tyr Asn Pro Ala Glu Gln Phe Arg Asp Ala

50 55 60

Leu Leu Ala Pro Pro Ala Trp Gln Glu Gly Gly Ser Met Ala His Leu

65 70 75 80

Leu gly Thr Asp Asp Val Gly Arg Asp Val Leu Ser Arg Leu Met Tyr

85 90 95

Gly Ala Arg Leu Ser Leu Leu Val Gly Cys Leu Val Val Val Leu Ser

100 105 110

Leu Ile Met Gly Val Ile Leu Gly Leu Ile Ala Gly Tyr Phe Gly Gly

115 120 125

Leu Val Asp Asn Ile Ile Met Arg Val Val Asp Ile Met Leu Ala Leu

130 135 140

Pro Ser Leu Leu Leu Ala Leu Val Leu Val Ala Ile Phe Gly Pro Ser

145 150 155 160

Ile Gly Asn Ala Ala Leu Ala Leu Thr Phe Val Ala Leu Pro His Tyr

165 170 175

Val Arg Leu Thr Arg Ala Ala Val Leu Val Glu Val Asn Arg Asp Tyr

180 185 190

Val Thr Ala Ser Arg Val Ala Gly Ala Gly Ala Met Arg Gln Met Phe

195 200 205

Ile Asn Ile Phe Pro Asn Cys Leu Ala Pro Leu Ile Val Gln Ala Ser

210 215 220

Leu Gly Phe Ser Asn Ala Ile Leu Asp Met Ala Ala Leu Gly Phe Leu

225 230 235 240

Gly Met Gly Ala Gln Pro Pro Thr Pro Glu Trp Gly Thr Met Leu Ser

245 250 255

Asp Val Leu Gln Phe Ala Gln Ser Ala Trp Trp Val Val Thr Phe Pro

260 265 270

Gly Leu Ala Ile Leu Leu Thr Val Leu Ala Phe Asn Leu Met Gly Asp

275 280 285

Gly Leu Arg Asp Ala Leu Asp Pro Lys Leu Lys Gln

290 295 300

<210>50

<211>327

<212>PRT

<213>大肠杆菌

<400>50

Met Ala Leu Leu Asn Val Asp Lys Leu Ser Val His Phe Gly Asp Glu

1 5 10 15

Ser Ala Pro Phe Arg Ala Val Asp Arg Ile Ser Tyr Ser Val Lys Gln

20 25 30

Gly Glu Val Val Gly Ile Val Gly Glu Ser Gly Ser Gly Lys Ser Val

35 40 45

Ser Ser Leu Ala Ile Met Gly Leu Ile Asp Tyr Pro Gly Arg Val Met

50 55 60

Ala Glu Lys Leu Glu Phe Asn Gly Gln Asp Leu Gln Arg Ile Ser Glu

65 70 75 80

Lys Glu Arg Arg Asn Leu Val Gly Ala Glu Val Ala Met Ile Phe Gln

85 90 95

Asp Pro Met Thr Ser Leu Asn Pro Cys Tyr Thr Val Gly Phe Gln Ile

100 105 110

Met Glu Ala Ile Lys Val His Gln Gly Gly Asn Lys Ser Thr Arg Arg

115 120 125

Gln Arg Ala Ile Asp Leu Leu Asn Gln Val Gly Ile Pro Asp Pro Ala

130 135 140

Ser Arg Leu Asp Val Tyr Pro His Gln Leu Ser Gly Gly Met Ser Gln

145 150 155 160

Arg Val Met Ile Ala Met Ala Ile Ala Cys Arg Pro Lys Leu Leu Ile

165 170 175

Ala Asp Glu Pro Thr Thr Ala Leu Asp Val Thr Ile Gln Ala Gln Ile

180 185 190

Ile Glu Leu Leu Leu Glu Leu Gln Gln Lys Glu Asn Met Ala Leu Val

195 200 205

Leu Ile Thr His Asp Leu Ala Leu Val Ala Glu Ala Ala His Lys Ile

210 215 220

Ile Val Met Tyr Ala Gly Gln Val Val Glu Thr Gly Asp Ala His Ala

225 230 235 240

Ile Phe His Ala Pro Arg His Pro Tyr Thr Gln Ala Leu Leu Arg Ala

245 250 255

Leu Pro Glu Phe Ala Gln Asp Lys Glu Arg Leu Ala Ser Leu Pro Gly

260 265 270

Val Val Pro Gly Lys Tyr Asp Arg Pro Asn Gly Cys Leu Leu Asn Pro

275 280 285

Arg Cys Pro Tyr Ala Thr Asp Arg Cys Arg Ala Glu Glu Pro Ala Leu

290 295 300

Asn Met Leu Ala Asp Gly Arg Gln Ser Lys Cys His Tyr Pro Leu Asp

305 310 315 320

Asp Ala Gly Arg Pro Thr Leu

325

<210>51

<211>334

<212>PRT

<213>大肠杆菌

<400>51

Met Ser Thr Gln Glu Ala Thr Leu Gln Gln Pro Leu Leu Gln Ala Ile

1 5 10 15

Asp Leu Lys Lys His Tyr Pro Val Lys Lys Gly Met Phe Ala Pro Glu

20 25 30

Arg Leu Val Lys Ala Leu Asp Gly Val Ser Phe Asn Leu Glu Arg Gly

35 40 45

Lys Thr Leu Ala Val Val Gly Glu Ser Gly Cys Gly Lys Ser Thr Leu

50 55 60

Gly Arg Leu Leu Thr Met Ile Glu Met Pro Thr Gly Gly Glu Leu Tyr

65 70 75 80

Tyr Gln Gly Gln Asp Leu Leu Lys His Asp Pro Gln Ala Gln Lys Leu

85 90 95

Arg Arg Gln Lys Ile Gln Ile Val Phe Gln Asn Pro Tyr Gly Ser Leu

100 105 110

Asn Pro Arg Lys Lys Val Gly Gln Ile Leu Glu Glu Pro Leu Leu Ile

115 120 125

Asn Thr Ser Leu Ser Lys Glu Gln Arg Arg Glu Lys Ala Leu Ser Met

130 135 140

Met Ala Lys Val Gly Leu Lys Thr Glu His Tyr Asp Arg Tyr Pro His

145 150 155 160

Met Phe Ser Gly Gly Gln Arg Gln Arg Ile Ala Ile Ala Arg Gly Leu

165 170 175

Met Leu Asp Pro Asp Val Val Ile Ala Asp Glu Pro Val Ser Ala Leu

180 185 190

Asp Val Ser Val Arg Ala Gln Val Leu Asn Leu Met Met Asp Leu Gln

195 200 205

Gln Glu Leu Gly Leu Ser Tyr Val Phe Ile Ser His Asp Leu Ser Val

210 215 220

Val Glu His Ile Ala Asp Glu Val Met Val Met Tyr Leu Gly Arg Cys

225 230 235 240

Val Glu Lys Gly Thr Lys Asp Gln Ile Phe Asn Asn Pro Arg His Pro

245 250 255

Tyr Thr Gln Ala Leu Leu Ser Ala Thr Pro Arg Leu Asn Pro Asp Asp

260 265 270

Arg Arg Glu Arg Ile Lys Leu Ser Gly Glu Leu Pro Ser Pro Leu Asn

275 280 285

Pro Pro Pro Gly Cys Ala Phe Asn Ala Arg Cys Arg Arg Arg Phe Gly

290 295 300

Pro Cys Thr Gln Leu Gln Pro Gln Leu Lys Asp Tyr Gly Gly Gln Leu

305 310 315 320

Val Ala Cys Phe Ala Val Asp Gln Asp Glu Asn Pro Gln Arg

325 330

<210>52

<211>34

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成DNA

<400>52

gaagttccta tactttctag agaataggaa cttc 34

<210>53

<211>1509

<212>DNA

<213>大肠杆菌

<400>53

atg gag ttt agt gta aaa agc ggt agc ccg gag aaa cag cgg agt gcc 48

Met Glu Phe Ser Val Lys Ser Gly Ser Pro Glu Lys Gln Arg Ser Ala

1 5 10 15

tgc atc gtc gtg ggc gtc ttc gaa cca cgt cgc ctt tct ccg att gca 96

Cys Ile Val Val Gly Val Phe Glu Pro Arg Arg Leu Ser Pro Ile Ala

20 25 30

gaa cag ctc gat aaa atc agc gat ggg tac atc agc gcc ctg cta cgt 144

Glu Gln Leu Asp Lys Ile Ser Asp Gly Tyr Ile Ser Ala Leu Leu Arg

35 40 45

cgg ggc gaa ctg gaa gga aaa ccg ggg cag aca ttg ttg ctg cac cat 192

Arg Gly Glu Leu Glu Gly Lys Pro Gly Gln Thr Leu Leu Leu His His

50 55 60

gtt ccg aat gta ctt tcc gag cga att ctc ctt att ggt tgc ggc aaa 240

Val Pro Asn Val Leu Ser Glu Arg Ile Leu Leu Ile Gly Cys Gly Lys

65 70 75 80

gaa cgt gag ctg gat gag cgt cag tac aag cag gtt att cag aaa acc 288

Glu Arg Glu Leu Asp Glu Arg Gln Tyr Lys Gln Val Ile Gln Lys Thr

85 90 95

att aat acg ctg aat gat act ggc tca atg gaa gcg gtc tgc ttt ctg 336

Ile Asn Thr Leu Asn Asp Thr Gly Ser Met Glu Ala Val Cys Phe Leu

100 105 110

act gag ctg cac gtt aaa ggc cgt aac aac tac tgg aaa gtg cgt cag 384

Thr Glu Leu His Val Lys Gly Arg Asn Asn Tyr Trp Lys Val Arg Gln

115 120 125

gct gtc gag acg gca aaa gag acg ctc tac agt ttc gat cag ctg aaa 432

Ala Val Glu Thr Ala Lys Glu Thr Leu Tyr Ser Phe Asp Gln Leu Lys

130 135 140

acg aac aag agc gaa ccg cgt cgt ccg ctg cgt aag atg gtg ttc aac 480

Thr Asn Lys Ser Glu Pro Arg Arg Pro Leu Arg Lys Met Val Phe Asn

145 150 155 160

gtg ccg acc cgc cgt gaa ctg acc agc ggt gag cgc gcg atc cag cac 528

Val Pro Thr Arg Arg Glu Leu Thr Ser Gly Glu Arg Ala Ile Gln His

165 170 175

ggt ctg gcg att gcc gcc ggg att aaa gca gca aaa gat ctc ggc aat 576

Gly Leu Ala Ile Ala Ala Gly Ile Lys Ala Ala Lys Asp Leu Gly Asn

180 185 190

atg ccg ccg aat atc tgt aac gcc gct tac ctc gct tca caa gcg cgc 624

Met Pro Pro Asn Ile Cys Asn Ala Ala Tyr Leu Ala Ser Gln Ala Arg

195 200 205

cag ctg gct gac agc tac agc aag aat gtc atc acc cgc gtt atc ggc 672

Gln Leu Ala Asp Ser Tyr Ser Lys Asn Val Ile Thr Arg Val Ile Gly

210 215 220

gaa cag cag atg aaa gag ctg ggg atg cat tcc tat ctg gcg gtc ggt 720

Glu Gln Gln Met Lys Glu Leu Gly Met His Ser Tyr Leu Ala Val Gly

225 230 235 240

cag ggt tcg caa aac gaa tcg ctg atg tcg gtg att gag tac aaa ggc 768

Gln Gly Ser Gln Asn Glu Ser Leu Met Ser Val Ile Glu Tyr Lys Gly

245 250 255

aac gcg tcg gaa gat gca cgc cca atc gtg ctg gtg ggt aaa ggt tta 816

Asn Ala Ser Glu Asp Ala Arg Pro Ile Val Leu Val Gly Lys Gly Leu

260 265 270

acc ttc gac tcc ggc ggt atc tcg atc aag cct tca gaa ggc atg gat 864

Thr Phe Asp Ser Gly Gly Ile Ser Ile Lys Pro Ser Glu Gly Met Asp

275 280 285

gag atg aag tac gat atg tgc ggt gcg gca gcg gtt tac ggc gtg atg 912

Glu Met Lys Tyr Asp Met Cys Gly Ala Ala Ala Val Tyr Gly Val Met

290 295 300

cgg atg gtc gcg gag cta caa ctg ccg att aac gtt atc ggc gtg ttg 960

Arg Met Val Ala Glu Leu Gln Leu Pro Ile Asn Val Ile Gly Val Leu

305 310 315 320

gca ggc tgc gaa aac atg cct ggc gga cga gcc tat cgt ccg ggc gat 1008

Ala Gly Cys Glu Asn Met Pro Gly Gly Arg Ala Tyr Arg Pro Gly Asp

325 330 335

gtg tta acc acc atg tcc ggt caa acc gtt gaa gtg ctg aac acc gac 1056

Val Leu Thr Thr Met Ser Gly Gln Thr Val Glu Val Leu Asn Thr Asp

340 345 350

gct gaa ggc cgc ctg gta ctg tgc gac gtg tta act tac gtt gag cgt 1104

Ala Glu Gly Arg Leu Val Leu Cys Asp Val Leu Thr Tyr Val Glu Arg

355 360 365

ttt gag ccg gaa gcg gtg att gac gtg gcg acg ctg acc ggt gcc tgc 1152

Phe Glu Pro Glu Ala Val Ile Asp Val Ala Thr Leu Thr Gly Ala Cys

370 375 380

gtg atc gcg ctg ggt cat cat att act ggt ctg atg gcg aac cat aat 1200

Val Ile Ala Leu Gly His His Ile Thr Gly Leu Met Ala Asn His Asn

385 390 395 400

ccg ctg gcc cat gaa ctg att gcc gcg tct gaa caa tcc ggt gac cgc 1248

Pro Leu Ala His Glu Leu Ile Ala Ala Ser Glu Gln Ser Gly Asp Arg

405 410 415

gca tgg cgc tta ccg ctg ggt gac gag tat cag gaa caa ctg gag tcc 1296

Ala Trp Arg Leu Pro Leu Gly Asp Glu Tyr Gln Glu Gln Leu Glu Ser

420 425 430

aat ttt gcc gat atg gcg aac att ggc ggt cgt cct ggt ggg gcg att 1344

Asn Phe Ala Asp Met Ala Asn Ile Gly Gly Arg Pro Gly Gly Ala Ile

435 440 445

acc gca ggt tgc ttc ctg tca cgc ttt acc cgt aag tac aac tgg gcg 1392

Thr Ala Gly Cys Phe Leu Ser Arg Phe Thr Arg Lys Tyr Asn Trp Ala

450 455 460

cac ctg gat atc gcc ggt acc gcc tgg cgt tct ggt aaa gca aaa ggc 1440

His Leu Asp Ile Ala Gly Thr Ala Trp Arg Ser Gly Lys Ala Lys Gly

465 470 475 480

gcc acc ggt cgt ccg gta gcg ttg ctg gca cag ttc ctg tta aac cgc 1488

Ala Thr Gly Arg Pro Val Ala Leu Leu Ala Gln Phe Leu Leu Asn Arg

485 490 495

gct ggg ttt aac ggc gaa gag 1509

Ala Gly Phe Asn Gly Glu Glu

500

<210>54

<211>1281

<212>DNA

<213>大肠杆菌

<400>54

atg aca gaa gcg atg aag att acc ctc tct acc caa cct gcc gac gcg 48

Met Thr Glu Ala Met Lys Ile Thr Leu Ser Thr Gln Pro Ala Asp Ala

1 5 10 15

cgc tgg gga gaa aaa gca act tac agc att aat aat gac ggc att acc 96

Arg Trp Gly Glu Lys Ala Thr Tyr Ser Ile Asn Asn Asp Gly Ile Thr

20 25 30

ctg cat ttg aac ggg gca gac gat ctg ggg ctg atc cag cgt gcg gcg 144

Leu His Leu Asn Gly Ala Asp Asp Leu Gly Leu Ile Gln Arg Ala Ala

35 40 45

cgc aag att gac ggt ctg ggc atc aag cat gtt cag tta agc ggt gaa 192

Arg Lys Ile Asp Gly Leu Gly Ile Lys His Val Gln Leu Ser Gly Glu

50 55 60

ggc tgg gat gcg gat cgc tgc tgg gca ttc tgg caa ggt tac aaa gcc 240

Gly Trp Asp Ala Asp Arg Cys Trp Ala Phe Trp Gln Gly Tyr Lys Ala

65 70 75 80

ccg aaa ggc acg cgt aaa gtg gtg tgg ccg gat ctg gac gat gcc cag 288

Pro Lys Gly Thr Arg Lys Val Val Trp Pro Asp Leu Asp Asp Ala Gln

85 90 95

cgc cag gaa ctg gat aac cgc ctg atg arc arc gac tgg gtg cgt gac 336

Arg Gln Glu Leu Asp Asn Arg Leu Met Ile Ile Asp Trp Val Arg Asp

100 105 110

acc atc aac gca ccg gca gaa gaa ttg gga cca tcg caa ctg gca cag 384

Thr Ile Asn Ala Pro Ala Glu Glu Leu Gly Pro Ser Gln Leu Ala Gln

115 120 125

cgt gct gtt gat ctg atc agc aac gtc gcg ggc gat cgt gtg act tat 432

Arg Ala Val Asp Leu Ile Ser Asn Val Ala Gly Asp Arg Val Thr Tyr

130 135 140

cgg atc acc aaa ggc gaa gat ctg cgt gag caa ggt tat atg ggg ctg 480

Arg Ile Thr Lys Gly Glu Asp Leu Arg Glu Gln Gly Tyr Met Gly Leu

145 150 155 160

cac aca gtc gga cgc ggt tca gaa cgt tct ccg gta ttg ctg gcg ctg 528

His Thr Val Gly Arg Gly Ser Glu Arg Ser Pro Val Leu Leu Ala Leu

165 170 175

gat tac aac cca act ggc gat aaa gaa gcg cca gtg tac gcg tgc ctg 576

Asp Tyr Asn Pro Thr Gly Asp Lys Glu Ala Pro Val Tyr Ala Cys Leu

180 185 190

gta ggt aaa ggt atc act ttt gac tcc ggc ggc tac agc atc aaa cag 624

Val Gly Lys Gly Ile Thr Phe Asp Ser Gly Gly Tyr Ser Ile Lys Gln

195 200 205

act gcg ttt atg gac tcg atg aag tcg gac atg ggc ggc gcg gca acg 672

Thr Ala Phe Met Asp Ser Met Lys Ser Asp Met Gly Gly Ala Ala Thr

210 215 220

gtt acc ggg gcg ctg gca ttt gcc att acg cgc gga ctg aac aag cgc 720

Val Thr Gly Ala Leu Ala Phe Ala Ile Thr Arg Gly Leu Asn Lys Arg

225 230 235 240

gtg aag ctg ttc ctc tgc tgt gcg gat aac ctg att agc ggc aat gcg 768

Val Lys Leu Phe Leu Cys Cys Ala Asp Asn Leu Ile Ser Gly Asn Ala

245 250 255

ttc aag ctg ggc gat atc atc acc tat cgc aac ggt aaa aaa gtt gaa 816

Phe Lys Leu Gly Asp Ile Ile Thr Tyr Arg Asn Gly Lys Lys Val Glu

260 265 270

gtg atg aac act gat gcc gaa ggg cgt ctg gtg ctt gcc gat ggt ctg 864

Val Met Asn Thr Asp Ala Glu Gly Arg Leu Val Leu Ala Asp Gly Leu

275 280 285

att gat gcc agt gcg cag aaa ccg gaa atg atc att gat gcg gcg acc 912

Ile Asp Ala Ser Ala Gln Lys Pro Glu Met Ile Ile Asp Ala Ala Thr

290 295 300

ctc acc ggg gcg gcg aaa act gcg ctg ggt aat gat tat cac gcg ctg 960

Leu Thr Gly Ala Ala Lys Thr Ala Leu Gly Asn Asp Tyr His Ala Leu

305 310 315 320

ttc agt ttt gac gat gcg ctg gcc ggt cgc ttg ctg gcg agt gcc gcg 1008

Phe Ser Phe Asp Asp Ala Leu Ala Gly Arg Leu Leu Ala Ser Ala Ala

325 330 335

cag gag aac gaa ccg ttc tgg cgt ctg ccg ctg gcg gag ttc cac cgc 1056

Gln Glu Asn Glu Pro Phe Trp Arg Leu Pro Leu Ala Glu Phe His Arg

340 345 350

agc cag ctg ccg tct aac ttt gcc gaa ctg aac aat acc gga agc gcg 1104

Ser Gln Leu Pro Ser Asn Phe Ala Glu Leu Asn Ash Thr Gly Ser Ala

355 360 365

gcg tat ccg gca ggc gcg agc acg gcg gcg ggc ttc ctg tcg cac ttt 1152

Ala Tyr Pro Ala Gly Ala Ser Thr Ala Ala Gly Phe Leu Ser His Phe

370 375 380

gtt gag aac tat cag caa ggc tgg ctg cat atc gac tgc tcg gcg act 1200

Val Glu Asn Tyr Gln Gln Gly Trp Leu His Ile Asp Cys Ser Ala Thr

385 390 395 400

tac cgt aaa gcg ccg gtt gaa cag tgg tct gcg ggc gct acg gga ctt 1248

Tyr Arg Lys Ala Pro Val Glu Gln Trp Ser Ala Gly Ala Thr Gly Leu

405 410 415

ggt gtg cgc acg ata gct aat ctg tta acg gcg 1281

Gly Val Arg Thr Ile Ala Asn Leu Leu Thr Ala

420 425

<210>55

<211>1455

<212>DNA

<213>大肠杆菌

<400>55

gtg tct gaa ctg tct caa tta tct cca cag ccg ctg tgg gat att ttt 48

Val Ser Glu Leu Ser Gln Leu Ser Pro Gln Pro Leu Trp Asp Ile Phe

1 5 10 15

gcc aaa atc tgt tct att cct cac ccg tcc tat cat gaa gag caa crc 96

Ala Lys Ile Cys Ser Ile Pro His Pro Set Tyr His Glu Glu Gln Leu

20 25 30

gct gaa tac att gtt ggt tgg gca aaa gag aaa ggt ttc cat gtc gaa 144

Ala Glu Tyr Ile Val Gly Trp Ala Lys Glu Lys Gly Phe His Val Glu

35 40 45

cgc gat cag gta ggt aat atc ctg att cgt aaa cct gct acc gca ggt 192

Arg Asp Gln Val Gly Asn Ile Leu Ile Arg Lys Pro Ala Thr Ala Gly

50 55 60

atg gaa aat cgt aaa ccg gtc gtc tta cag gcc cac ctc gat atg gtg 240

Met Glu Asn Arg Lys Pro Val Val Leu Gln Ala His Leu Asp Met Val

65 70 75 80

ccg cag aaa aat aac gac acc gtg cat gac ttc acg aaa gat cct atc 288

Pro Gln Lys Asn Asn Asp Thr Val His Asp Phe Thr Lys Asp Pro Ile

85 90 95

cag cct tat att gat ggc gaa tgg gtt aaa gcg cgc ggc acc acg ctg 336

Gln Pro Tyr Ile Asp Gly Glu Trp Val Lys Ala Arg Gly Thr Thr Leu

100 105 110

ggt gcg gat aac ggc att ggt atg gcc tct gcg ctg gcg gtt ctg gct 384

Gly Ala Asp Asn Gly Ile Gly Met Ala Ser Ala Leu Ala Val Leu Ala

115 120 125

gac gaa aac gtg gtt cac ggc ccg ctg gaa gtg ctg ctg acc atg acc 432

Asp Glu Asn Val Val His Gly Pro Leu Glu Val Leu Leu Thr Met Thr

130 135 140

gaa gaa gcc ggt atg gac ggt gcg ttc ggc tta cag ggc aac tgg ttg 480

Glu Glu Ala Gly Met Asp Gly Ala Phe Gly Leu Gln Gly Asn Trp Leu

145 150 155 160

cag gct gat att ctg att aac acc gac tcc gaa gaa gaa ggt gaa atc 528

Gln Ala Asp Ile Leu Ile Asn Thr Asp Ser Glu Glu Glu Gly Glu Ile

165 170 175

tac atg ggt tgt gcg ggg ggt atc gac ttc acc tcc aac ctg cat tta 576

Tyr Met Gly Cys Ala Gly Gly Ile Asp Phe Thr Ser Asn Leu His Leu

180 185 190

gat cgt gaa gcg gtt cca gct ggt ttt gaa acc ttc aag tta acc tta 624

Asp Arg Glu Ala Val Pro Ala Gly Phe Glu Thr Phe Lys Leu Thr Leu

195 200 205

aaa ggt ctg aaa ggc ggt cac tcc ggc ggg gaa atc cac gtt ggg ctg 672

Lys Gly Leu Lys Gly Gly His Ser Gly Gly Glu Ile His Val Gly Leu

210 215 220

ggt aat gcc aac aaa ctg ctg gtg cgc ttc ctg gcg ggt cat gcg gaa 720

Gly Asn Ala Asn Lys Leu Leu Val Arg Phe Leu Ala Gly His Ala Glu

225 230 235 240

gaa ctg gat ctg cgc ctt atc gat ttc aac ggc ggc aca ctg cgt aac 768

Glu Leu Asp Leu Arg Leu Ile Asp Phe Asn Gly Gly Thr Leu Arg Asn

245 250 255

gcc atc ccg cgt gaa gcc ttt gcg acc att gct gtc gca gct gat aaa 816

Ala Ile Pro Arg Glu Ala Phe Ala Thr Ile Ala Val Ala Ala Asp Lys

260 265 270

gtc gac gtc ctg aaa tct ctg gtg aat acc tat cag gag atc ctg aaa 864

Val Asp Val Leu Lys Ser Leu Val Asn Thr Tyr Gln Glu Ile Leu Lys

275 280 285

aac gag ctg gca gaa aaa gag aaa aat ctg gcc ttg ttg ctg gac tct 912

Asn Glu Leu Ala Glu Lys Glu Lys Asn Leu Ala Leu Leu Leu Asp Ser

290 295 300

gta gcg aac gat aaa gct gcc ctg att gcg aaa tct cgc gat acc ttt 960

Val Ala Asn Asp Lys Ala Ala Leu Ile Ala Lys Ser Arg Asp Thr Phe

305 310 315 320

att cgt ctg ctg aac gcc acc ccg aac ggt gtg att cgt aac tcc gat 1008

Ile Arg Leu Leu Asn Ala Thr Pro Asn Gly Val Ile Arg Asn Ser Asp

325 330 335

gta gcc aaa ggt gtg gtt gaa acc tcc ctg aac gtc ggt gtg gtg acc 1056

Val Ala Lys Gly Val Val Glu Thr Ser Leu Asn Val Gly Val Val Thr

340 345 350

atg act gac aat aac gta gaa att cac tgc ctg atc cgt tca ctg atc 1104

Met Thr Asp Asn Asn Val Glu Ile His Cys Leu Ile Arg Ser Leu Ile

355 360 365

gac agc ggt aaa gac tac gtg gtg agc atg ctg gat tcg ctg ggt aaa 1152

Asp Ser Gly Lys Asp Tyr Val Val Ser Met Leu Asp Ser Leu Gly Lys

370 375 380

ctg gct ggc gcg aaa acc gaa gcg aaa ggc gca tat cct ggc tgg cag 1200

Leu Ala Gly Ala Lys Thr Glu Ala Lys Gly Ala Tyr Pro Gly Trp Gln

385 390 395 400

ccg gac gct aat tct ccg gtg atg cat ctg gta cgt gaa acc tat cag 1248

Pro Asp Ala Asn Ser Pro Val Met His Leu Val Arg Glu Thr Tyr Gln

405 410 415

cgc ctg ttc aac aag acg ccg aac arc cag att arc cac gcg ggc ctg 1296

Arg Leu Phe Asn Lys Thr Pro Asn Ile Gln Ile Ile His Ala Gly Leu

420 425 430

gaa tgt ggt ctg ttc aaa aaa ccg tat ccg gaa atg gac atg gtt tct 1344

Glu Cys Gly Leu Phe Lys Lys Pro Tyr Pro Glu Met Asp Met Val Ser

435 440 445

arc ggg cca act atc acc ggt cca cac tct ccg gat gag caa gtt cac 1392

Ile Gly Pro Thr Ile Thr Gly Pro His Ser Pro Asp Glu Gln Val His

450 455 460

atc gaa agc gta ggt cat tac tgg aca ctg ctg act gaa ctg ctg aaa 1440

Ile Glu Ser Val Gly His Tyr Trp Thr Leu Leu Thr Glu Leu Leu Lys

465 470 475 480

gaa att ccg gcg aag 1455

Glu Ile Pro Ala Lys

485

<210>56

<211>2610

<212>DNA

<213>大肠杆菌

<400>56

atg act caa cag cca caa gcc aaa tac cgt cac gat tat cgt gcg ccg 48

Met Thr Gln Gln Pro Gln Ala Lys Tyr Arg His Asp Tyr Arg Ala Pro

1 5 10 15

gat tac cag att act gat att gac ttg acc ttt gac ctc gac gcg caa 96

Asp Tyr Gln Ile Thr Asp Ile Asp Leu Thr Phe Asp Leu Asp Ala Gln

20 25 30

aag acg gtc gtt acc gcg gtc agc cag gct gtc cgt cat ggt gca tca 144

Lys Thr Val Val Thr Ala Val Ser Gln Ala Val Arg His Gly Ala Ser

35 40 45

gat gct ccc ctt cgt ctc aac ggc gaa gac ctc aaa ctg gtt tct gtt 192

Asp Ala Pro Leu Arg Leu Asn Gly Glu Asp Leu Lys Leu Val Ser Val

50 55 60

cat att aat gat gag ccg tgg acc gcc tgg aaa gaa gaa gag ggc gca 240

His Ile Asn Asp Glu Pro Trp Thr Ala Trp Lys Glu Glu Glu Gly Ala

65 70 75 80

ctg gtt atc agt aat ttg ccg gag cgt ttt acg ctt aag atc att aat 288

Leu Val Ile Ser Asn Leu Pro Glu Arg Phe Thr Leu Lys Ile Ile Asn

85 90 95

gaa ata agc ccg gcg gcg aat acc gcg ctg gaa ggg ctt tat cag tca 336

Glu Ile Ser Pro Ala Ala Asn Thr Ala Leu Glu Gly Leu Tyr Gln Ser

100 105 110

ggc gat gcg ctt tgc acc cag tgt gaa gcc gaa ggt ttc cgc cat att 384

Gly Asp Ala Leu Cys Thr Gln Cys Glu Ala Glu Gly Phe Arg His Ile

115 120 125

acg tat tat ctc gac cgc ccg gac gtg ctg gcg cgt ttt acc acc aaa 432

Thr Tyr Tyr Leu Asp Arg Pro Asp Val Leu Ala Arg Phe Thr Thr Lys

130 135 140

att att gcc gat aaa atc aaa tat ccc ttc ctg ctt tcc aat ggt aac 480

Ile Ile Ala Asp Lys Ile Lys Tyr Pro Phe Leu Leu Ser Asn Gly Asn

145 150 155 160

cgc gtt gcg caa ggc gaa ctg gaa aac gga cgc cat tgg gta cag tgg 528

Arg Val Ala Gln Gly Glu Leu Glu Asn Gly Arg His Trp Val Gln Trp

165 170 175

cag gac ccg ttc ccg aaa ccg tgc tac ctg ttt gcg ctg gtg gca ggc 576

Gln Asp Pro Phe Pro Lys Pro Cys Tyr Leu Phe Ala Leu Val Ala Gly

180 185 190

gac ttt gat gta ctg cgc gat acc ttt acc acg cgt tct ggt cgc gaa 624

Asp Phe Asp Val Leu Arg Asp Thr Phe Thr Thr Arg Ser Gly Arg Glu

195 200 205

gta gca ctg gag ctg tac gtc gat cgc ggc aac ctt gat cgc gcg ccg 672

Val Ala Leu Glu Leu Tyr Val Asp Arg Gly Asn Leu Asp Arg Ala Pro

210 215 220

tgg gcg atg acc tcg ctg aaa aac tcc atg aaa tgg gat gaa gaa cgc 720

Trp Ala Met Thr Ser Leu Lys Asn Ser Met Lys Trp Asp Glu Glu Arg

225 230 235 240

ttt ggc ctg gag tat gac ctc gac atc tat atg atc gtc gcg gtg gat 768

Phe Gly Leu Glu Tyr Asp Leu Asp Ile Tyr Met Ile Val Ala Val Asp

245 250 255

ttc ttc aat atg ggc gca atg gag aat aag ggg ctg aat atc ttt aac 816

Phe Phe Asn Met Gly Ala Met Glu Asn Lys Gly Leu Asn Ile Phe Asn

260 265 270

tcc aaa tat gtg ctg gcc cgc acc gac acc gcc acc gac aaa gat tac 864

Ser Lys Tyr Val Leu Ala Arg Thr Asp Thr Ala Thr Asp Lys Asp Tyr

275 280 285

ctc gat att gaa cgc gtt atc ggc cat gaa tat ttc cat aac tgg acc 912

Leu Asp Ile Glu Arg Val Ile Gly His Glu Tyr Phe His Asn Trp Thr

290 295 300

ggt aac cga gtg acc tgt cgc gac tgg ttc cag ctc agc ctg aaa gaa 960

Gly Asn Arg Val Thr Cys Arg Asp Trp Phe Gln Leu Ser Leu Lys Glu

305 310 315 320

ggt tta acc gtc ttc cgc gat cag gag ttc agc tct gac ctt ggt tcc 1008

Gly Leu Thr Val Phe Arg Asp Gln Glu Phe Ser Ser Asp Leu Gly Ser

325 330 335

cgc gca gtt aac cgc atc aat aat gta cgc acc atg cgc gga ttg cag 1056

Arg Ala Val Asn Arg Ile Asn Asn Val Arg Thr Met Arg Gly Leu Gln

340 345 350

ttt gca gaa gac gcc agc ccg atg gcg cac ccg atc cgc ccg gat atg 1104

Phe Ala Glu Asp Ala Ser Pro Met Ala His Pro Ile Arg Pro Asp Met

355 360 365

gtc att gag atg aac aac ttc tac acc ctg acc gtt tac gag aag ggc 1152

Val Ile Glu Met Asn Asn Phe Tyr Thr Leu Thr Val Tyr Glu Lys Gly

370 375 380

gcg gaa gtg att cgc atg atc cac acc ctg ctt ggc gaa gaa aac ttc 1200

Ala Glu Val Ile Arg Met Ile His Thr Leu Leu Gly Glu Glu Asn Phe

385 390 395 400

cag aaa ggg atg cag ctt tat ttc gag cgt cat gat ggt agt gca gcg 1248

Gln Lys Gly Met Gln Leu Tyr Phe Glu Arg His Asp Gly Ser Ala Ala

405 410 415

acc tgt gac gac ttt gtg cag gcg atg gaa gat gcg tcg aat gtc gat 1296

Thr Cys Asp Asp Phe Val Gln Ala Met Glu Asp Ala Ser Asn Val Asp

420 425 430

ctc tcc cat ttc cgc cgt tgg tac agc cag tcc ggt aca ccg att gtg 1344

Leu Ser His Phe Arg Arg Trp Tyr Ser Gln Ser Gly Thr Pro Ile Val

435 440 445

acc gtc aaa gac gac tac aat ccg gaa acc gag cag tac acc ctg acc 1392

Thr Val Lys Asp Asp Tyr Asn Pro Glu Thr Glu Gln Tyr Thr Leu Thr

450 455 460

atc agc cag cgc acg cca gcc acg ccg gat cag gca gaa aaa cag ccg 1440

Ile Ser Gln Arg Thr Pro Ala Thr Pro Asp Gln Ala Glu Lys Gln Pro

465 470 475 480

ctg cat att ccg ttt gcc atc gaa ctg tat gat aac gaa ggc aaa gtg 1488

Leu His Ile Pro Phe Ala Ile Glu Leu Tyr Asp Asn Glu Gly Lys Val

485 490 495

atc ccg ttg cag aaa ggc ggt cat ccg gtg aat tcc gtg ctg aac gtc 1536

Ile Pro Leu Gln Lys Gly Gly His Pro Val Asn Ser Val Leu Asn Val

500 505 510

act cag gcg gaa cag acc ttt gtc ttt gat aat gtc tac ttc cag ccg 1584

Thr Gln Ala Glu Gln Thr Phe Val Phe Asp Asn Val Tyr Phe Gln Pro

515 520 525

gtg cct gcg ctg ctg tgc gaa ttc tct gcg cca gtg aaa ctg gaa tat 1632

Val Pro Ala Leu Leu Cys Glu Phe Ser Ala Pro Val Lys Leu Glu Tyr

530 535 540

aag tgg agc gat cag caa ctg acc ttc ctg atg cgt cat gcg cgt aat 1680

Lys Trp Ser Asp Gln Gln Leu Thr Phe Leu Met Arg His Ala Arg Asn

545 550 555 560

gat ttc tcc cgc tgg gat gcg gcg caa agt ttg ctg gca acc tac atc 1728

Asp Phe Ser Arg Trp Asp Ala Ala Gln Ser Leu Leu Ala Thr Tyr Ile

565 570 575

aag ctg aac gtc gcg cgt cat cag caa ggt cag ccg ctg tct ctg ccg 1776

Lys Leu Asn Val Ala Arg His Gln Gln Gly Gln Pro Leu Ser Leu Pro

580 585 590

gtg cat gtg gct gat gct ttc cgc gcg gta ctg ctt gat gag aag att 1824

Val His Val Ala Asp Ala Phe Arg Ala Val Leu Leu Asp Glu Lys Ile

595 600 605

gat cca gcg ctg gcg gca gaa atc ctg acg ctg cct tct gtc aat gaa 1872

Asp Pro Ala Leu Ala Ala Glu Ile Leu Thr Leu Pro Ser Val Asn Glu

610 615 620

atg gct gaa ttg ttc gat atc atc gac ccg att gct att gcc gaa gta 1920

Met Ala Glu Leu Phe Asp Ile Ile Asp Pro Ile Ala Ile Ala Glu Val

625 630 635 640

cgc gaa gca ctc act cgt act ctg gcg act gaa ctg gcg gat gag cta 1968

Arg Glu Ala Leu Thr Arg Thr Leu Ala Thr Glu Leu Ala Asp Glu Leu

645 650 655

ctg gct att tac aac gcg aat tac cag agc gag tac cgt gtt gag cat 2016

Leu Ala Ile Tyr Asn Ala Asn Tyr Gln Ser Glu Tyr Arg Val Glu His

660 665 670

gaa gat att gca aaa cgc act ctg cgt aat gcc tgc ctg cgt ttc ctc 2064

Glu Asp Ile Ala Lys Arg Thr Leu Arg Asn Ala Cys Leu Arg Phe Leu

675 680 685

gct ttt ggt gaa acg cat ctg gct gat gtg ctg gtg agc aag cag ttc 2112

Ala Phe Gly Glu Thr His Leu Ala Asp Val Leu Val Ser Lys Gln Phe

690 695 700

cac gaa gca aac aat atg act gat gcg ctg gcg gcg ctt tct gcg gcg 2160

His Glu Ala Asn Asn Met Thr Asp Ala Leu Ala Ala Leu Ser Ala Ala

705 710 715 720

gtt gcc gca cag ctg cct tgc cgt gac gcg ctg atg cag gag tac gac 2208

Val Ala Ala Gln Leu Pro Cys Arg Asp Ala Leu Met Gln Glu Tyr Asp

725 730 735

gac aag tgg cat cag aac ggt ctg gtg atg gat aaa tgg ttt atc ctg 2256

Asp Lys Trp His Gln Asn Gly Leu Val Met Asp Lys Trp Phe Ile Leu

740 745 750

caa gcc acc agc ccg gcg gcg aat gtg ctg gag acg gtg cgc ggc ctg 2304

Gln Ala Thr Ser Pro Ala Ala Asn Val Leu Glu Thr Val Arg Gly Leu

755 760 765

ttg cag cat cgc tca ttt acc atg agc aac ccg aac cgt att cgt tcg 2352

Leu Gln His Arg Ser Phe Thr Met Ser Asn Pro Asn Arg Ile Arg Ser

770 775 780

ttg att ggc gcg ttt gcg ggc agc aat ccg gca gcg ttc cat gcc gaa 2400

Leu Ile Gly Ala Phe Ala Gly Ser Asn Pro Ala Ala Phe His Ala Glu

785 790 795 800

gat ggc agc ggt tac ctg ttc ctg gtg gaa atg crt acc gac ctc aac 2448

Asp Gly Ser Gly Tyr Leu Phe Leu Val Glu Met Leu Thr Asp Leu Asn

805 810 815

agc cgt aac ccg cag gtg gct rca cgt ctg att gaa ccg ctg att cgc 2496

Ser Arg Asn Pro Gln Val Ala Ser Arg Leu Ile Glu Pro Leu Ile Arg

820 825 830

ctg aaa cgt tac gat gcc aaa cgt cag gag aaa atg cgc gcg gcg ctg 2544

Leu Lys Arg Tyr Asp Ala Lys Arg Gln Glu Lys Met Arg Ala Ala Leu

835 840 845

gaa cag ttg aaa ggg ctg gaa aat ctc tct ggc gat ctg tac gag aag 2592

Glu Gln Leu Lys Gly Leu Glu Asn Leu Ser Gly Asp Leu Tyr Glu Lys

850 855 860

ata act aaa gca ctg gct 2610

Ile Thr Lys Ala Leu Ala

865 870

<210>57

<211>1605

<212>DNA

<213>大肠杆菌

<400>57

atg cgt att tcc ttg aaa aag rca ggg atg ctg aag ctt ggt ctc agc 48

Met Arg Ile Ser Leu Lys Lys Ser Gly Met Leu Lys Leu Gly Leu Ser

1 5 10 15

ctg gtg gct atg acc gtc gca gca agt gtt cag gct aaa act ctg gtt 96

Leu Val Ala Met Thr Val Ala Ala Ser Val Gln Ala Lys Thr Leu Val

20 25 30

tat tgc tca gaa gga tct ccg gaa ggg ttt aac ccg cag ctg ttt acc 144

Tyr Cys Ser Glu Gly Ser Pro Glu Gly Phe Asn Pro Gln Leu Phe Thr

35 40 45

tcc ggc acc acc tat gac gcc tct tcc gtc ccg ctt tat aac cgt ctg 192

Ser Gly Thr Thr Tyr Asp Ala Ser Ser Val Pro Leu Tyr Asn Arg Leu

50 55 60

gtt gaa ttt aaa atc ggc acc acc gaa gtg atc ccg ggc ctc gct gaa 240

Val Glu Phe Lys Ile Gly Thr Thr Glu Val Ile Pro Gly Leu Ala Glu

65 70 75 80

aag tgg gaa gtc agc gaa gac ggt aaa acc tat acc ttc cat ctg cgt 288

Lys Trp Glu Val Ser Glu Asp Gly Lys Thr Tyr Thr Phe His Leu Arg

85 90 95

aaa ggt gtg aag tgg cac gac aat aaa gaa ttc aaa ccg acg cgt gaa 336

Lys Gly Val Lys Trp His Asp Asn Lys Glu Phe Lys Pro Thr Arg Glu

100 105 110

ctg aac gcc gat gat gtg gtg ttc tcg ttc gat cgt cag aaa aac gcg 384

Leu Asn Ala Asp Asp Val Val Phe Ser Phe Asp Arg Gln Lys Asn Ala

115 120 125

caa aac ccg tac cat aaa gtt tct ggc ggc agc tac gaa tac ttc gaa 432

Gln Asn Pro Tyr His Lys Val Ser Gly Gly Ser Tyr Glu Tyr Phe Glu

130 135 140

ggc atg ggc ttg cca gag ctg atc agt gaa gtg aaa aag gtg gac gac 480

Gly Met Gly Leu Pro Glu Leu Ile Ser Glu Val Lys Lys Val Asp Asp

145 150 155 160

aac acc gtt cag ttt gtg ctg act cgc ccg gaa gcg ccg ttc ctc gct 528

Asn Thr Val Gln Phe Val Leu Thr Arg Pro Glu Ala Pro Phe Leu Ala

165 170 175

gac ctg gca atg gac ttc gcc tct att ctg tca aaa gaa tat gct gat 576

Asp Leu Ala Met Asp Phe Ala Ser Ile Leu Ser Lys Glu Tyr Ala Asp

180 185 190

gcg atg atg aaa gcc ggt aca ccg gaa aaa ctg gac ctc aac cca atc 624

Ala Met Met Lys Ala Gly Thr Pro Glu Lys Leu Asp Leu Asn Pro Ile

195 200 205

gga acc ggt ccg ttc cag tta cag cag tat caa aaa gat tcc cgt atc 672

Gly Thr Gly Pro Phe Gln Leu Gln Gln Tyr Gln Lys Asp Ser Arg Ile

210 215 220

cgc tac aaa gcg ttt gat ggc tac tgg ggc acc aaa ccg cag atc gat 720

Arg Tyr Lys Ala Phe Asp Gly Tyr Trp Gly Thr Lys Pro Gln Ile Asp

225 230 235 240

acg ctg gtt ttc tct att acc cct gac gct tcc gtg cgt tac gcg aaa 768

Thr Leu Val Phe Ser Ile Thr Pro Asp Ala Ser Val Arg Tyr Ala Lys

245 250 255

ttg cag aag aat gaa tgc cag gtg atg ccg tac ccg aac ccg gca gat 816

Leu Gln Lys Asn Glu Cys Gln Val Met Pro Tyr Pro Asn Pro Ala Asp

260 265 270

atc gct cgc atg aag cag gat aaa tcc atc aat ctg atg gaa atg ccg 864

Ile Ala Arg Met Lys Gln Asp Lys Ser Ile Asn Leu Met Glu Met Pro

275 280 285

ggg ctg aac gtc ggt tat ctc tcg tat aac gtg cag aaa aaa cca ctc 912

Gly Leu Asn Val Gly Tyr Leu Ser Tyr Asn Val Gln Lys Lys Pro Leu

290 295 300

gat gac gtg aaa gtt cgc cag gct ctg acc tac gcg gtg aac aaa gac 960

Asp Asp Val Lys Val Arg Gln Ala Leu Thr Tyr Ala Val Asn Lys Asp

305 310 315 320

gcg atc atc aaa gcg gtt tat cag ggc gcg ggc gta tca gcg aaa aac 1008

Ala Ile Ile Lys Ala Val Tyr Gln Gly Ala Gly Val Ser Ala Lys Asn

325 330 335

ctg atc ccg cca acc atg tgg ggc tat aac gac gac gtt cag gac tac 1056

Leu Ile Pro Pro Thr Met Trp Gly Tyr Asn Asp Asp Val Gln Asp Tyr

340 345 350

acc tac gat cct gaa aaa gcg aaa gcc ttg ctg aaa gaa gcg ggt ctg 1104

Thr Tyr Asp Pro Glu Lys Ala Lys Ala Leu Leu Lys Glu Ala Gly Leu

355 360 365

gaa aaa ggt ttc tcc atc gac ctg tgg gcg atg ccg gta caa cgt ccg 1152

Glu Lys Gly Phe Ser Ile Asp Leu Trp Ala Met Pro Val Gln Arg Pro

370 375 380

tat aac ccg aac gct cgc cgc atg gcg gag atg att cag gca gac tgg 1200

Tyr Asn Pro Asn Ala Arg Arg Met Ala Glu Met Ile Gln Ala Asp Trp

385 390 395 400

gcg aaa gtc ggc gtg cag gcc aaa att gtc acc tac gaa tgg ggt gag 1248

Ala Lys Val Gly Val Gln Ala Lys Ile Val Thr Tyr Glu Trp Gly Glu

405 410 415

tac ctc aag cgt gcg aaa gat ggc gag cac cag acg gta atg atg ggc 1296

Tyr Leu Lys Arg Ala Lys Asp Gly Glu His Gln Thr Val Met Met Gly

420 425 430

tgg act ggc gat aac ggg gat ccg gat aac ttc ttc gcc acc ctg ttc 1344

Trp Thr Gly Asp Asn Gly Asp Pro Asp Asn Phe Phe Ala Thr Leu Phe

435 440 445

agc tgc gcc gcc tct gaa caa ggc tcc aac tac tca aaa tgg tgc tac 1392

Ser Cys Ala Ala Ser Glu Gln Gly Ser Asn Tyr Ser Lys Trp Cys Tyr

450 455 460

aaa ccg ttt gaa gat ctg att caa ccg gcg cgt gct acc gac gac cac 1440

Lys Pro Phe Glu Asp Leu Ile Gln Pro Ala Arg Ala Thr Asp Asp His

465 470 475 480

aat aaa cgc gtt gaa ctg tac aaa caa gcg cag gtg gtg atg cac gat 1488

Asn Lys Arg Val Glu Leu Tyr Lys Gln Ala Gln Val Val Met His Asp

485 490 495

cag gct ccg gca ctg atc atc gct cac tcc acc gtg ttt gaa ccg gta 1536

Gln Ala Pro Ala Leu Ile Ile Ala His Ser Thr Val Phe Glu Pro Val

500 505 510

cgt aaa gaa gtt aaa ggc tat gtg gtt gat cca tta ggc aaa cat cac 1584

Arg Lys Glu Val Lys Gly Tyr Val Val Asp Pro Leu Gly Lys His His

515 520 525

ttc gaa aac gtc tct atc gaa 1605

Phe Glu Asn Val Ser Ile Glu

530 535

<210>58

<211>1017

<212>DNA

<213>大肠杆菌

<400>58

atg ttg cag ttt att crc cga cgt ttg gga crc gtc atc ccc acg ttt 48

Met Leu Gln Phe Ile Leu Arg Arg Leu Gly Leu Val Ile Pro Thr Phe

1 5 10 15

atc ggt att acc ctt ctc aca ttt gcc ttt gtc cac atg atc ccg ggc 96

Ile Gly Ile Thr Leu Leu Thr Phe Ala Phe Val His Met Ile Pro Gly

20 25 30

gat ccg gtg atg atc atg gcg ggc gaa cgt ggg arc tcc cca gag cgt 144

Asp Pro Val Met Ile Met Ala Gly Glu Arg Gly Ile Ser Pro Glu Arg

35 40 45

cac gcg cag ctg ctg gct gaa ctc ggc tta gat aaa ccg atg tgg cag 192

His Ala Gln Leu Leu Ala Glu Leu Gly Leu Asp Lys Pro Met Trp Gln

50 55 60

cag tat ctc cat tac att tgg ggc gtt atg cat ggc gat cta ggc att 240

Gln Tyr Leu His Tyr Ile Trp Gly Val Met His Gly Asp Leu Gly Ile

65 70 75 80

rca atg aaa agc cgc arc ccg gtt tgg gaa gag ttc gtg ccg cgc ttc 288

Ser Met Lys Ser Arg Ile Pro Val Trp Glu Glu Phe Val Pro Arg Phe

85 90 95

cag gcc acg ctg gaa crt ggc gtc tgc gcg atg att ttt gct acg gca 336

Gln Ala Thr Leu Glu Leu Gly Val Cys Ala Met Ile Phe Ala Thr Ala

100 105 110

gtc ggt att ccg gtc ggc gtg ctg gct gcg gtt aaa cgc ggt tcc att 384

Val Gly Ile Pro Val Gly Val Leu Ala Ala Val Lys Arg Gly Ser Ile

115 120 125

ttc gat cac aca gcg gtt ggc ctg gcg ctg aca ggt tat tca atg cct 432

Phe Asp His Thr Ala Val Gly Leu Ala Leu Thr Gly Tyr Ser Met Pro

130 135 140

atc ttc tgg tgg ggc atg atg ctg atc atg ctg gtt tcg gtg cac tgg 480

Ile Phe Trp Trp Gly Met Met Leu Ile Met Leu Val Ser Val His Trp

145 150 155 160

aac ctg acg ccc gtc tcc ggt cgc gtg agc gat atg gtg ttc ctc gat 528

Asn Leu Thr Pro Val Ser Gly Arg Val Ser Asp Met Val Phe Leu Asp

165 170 175

gac tcc aat ccg tta acc ggt ttt atg cta atc gac acc gcc atc tgg 576

Asp Ser Asn Pro Leu Thr Gly Phe Met Leu Ile Asp Thr Ala Ile Trp

180 185 190

ggt gaa gac ggc aac ttt atc gat gcc gtc gcc cat atg atc ttg cct 624

Gly Glu Asp Gly Asn Phe Ile Asp Ala Val Ala His Met Ile Leu Pro

195 200 205

gcc att gtg ctg ggt act att ccg ctg gcg gtc att gtg cgt atg aca 672

Ala Ile Val Leu Gly Thr Ile Pro Leu Ala Val Ile Val Arg Met Thr

210 215 220

cgc tcc tcg atg ctg gaa gtg ctg ggc gag gat tac atc cgc acc gcg 720

Arg Ser Ser Met Leu Glu Val Leu Gly Glu Asp Tyr Ile Arg Thr Ala

225 230 235 240

cgc gcc aaa ggg cta acc cgc atg cgg gtg att atc gtc cat gcg ctg 768

Arg Ala Lys Gly Leu Thr Arg Met Arg Val Ile Ile Val His Ala Leu

245 250 255

cgt aac gcg atg ctg ccg gtg gtg acc gtt atc ggc ctg cag gtg gga 816

Arg Asn Ala Met Leu Pro Val Val Thr Val Ile Gly Leu Gln Val Gly

260 265 270

aca ttg ctg gcg ggg gcg att ctg acc gaa acc atc ttc tcg tgg ccc 864

Thr Leu Leu Ala Gly Ala Ile Leu Thr Glu Thr Ile Phe Ser Trp Pro

275 280 285

ggt ctg gga cgc tgg ttg att gac gca ctg caa cgc cgc gac tat ccg 912

Gly Leu Gly Arg Trp Leu Ile Asp Ala Leu Gln Arg Arg Asp Tyr Pro

290 295 300

gta gtg cag ggc ggc gta ttg ctg gtg gcg acg atg att atc ctc gtc 960

Val Val Gln Gly Gly Val Leu Leu Val Ala Thr Met Ile Ile Leu Val

305 310 315 320

aac ttg ctg gtc gat ctg ctg tac ggc gtg gtg aac ccg cgt att cgt 1008

Asn Leu Leu Val Asp Leu Leu Tyr Gly Val Val Asn Pro Arg Ile Arg

325 330 335

cat aag aag 1017

His Lys Lys

<210>59

<211>900

<212>DNA

<213>大肠杆菌

<400>59

atg tca cag gtt act gaa aat aaa gtg att agc gca ccg gtg ccg atg 48

Met Ser Gln Val Thr Glu Asn Lys Val Ile Ser Ala Pro Val Pro Met

1 5 10 15

acc ccg tta cag gag ttc tgg cac tat ttt aaa cgc aac aaa ggc gcg 96

Thr Pro Leu Gln Glu Phe Trp His Tyr Phe Lys Arg Asn Lys Gly Ala

20 25 30

gtc gtc ggg ctg gtt tac gtc gtc atc gtg ctg ttc atc gcg atc ttt 144

Val Val Gly Leu Val Tyr Val Val Ile Val Leu Phe Ile Ala Ile Phe

35 40 45

gcc aac tgg att gca ccc tat aac ccg gcg gaa cag ttc cgc gat gca 192

Ala Asn Trp Ile Ala Pro Tyr Asn Pro Ala Glu Gln Phe Arg Asp Ala

50 55 60

ctg ctc gcc ccg cca gcc tgg cag gaa ggc ggc agc atg gcg cac ttg 240

Leu Leu Ala Pro Pro Ala Trp Gln Glu Gly Gly Ser Met Ala His Leu

65 70 75 80

ctg ggc acc gat gac gta ggc cgt gat gtg ctg tcg cgc ctg atg tac 288

Leu Gly Thr Asp Asp Val Gly Arg Asp Val Leu Ser Arg Leu Met Tyr

85 90 95

ggt gcg cgc ctg tcg ctg ctg gtt ggc tgt ctg gta gtt gtg tta tcg 336

Gly Ala Arg Leu Ser Leu Leu Val Gly Cys Leu Val Val Val Leu Ser

100 105 110

ctg att atg ggc gtt att ctc ggc ctg atc gcc ggt tac ttt ggc ggc 384

Leu Ile Met Gly Val Ile Leu Gly Leu Ile Ala Gly Tyr Phe Gly Gly

115 120 125

ctg gtc gat aac atc att atg cgc gtg gtc gat atc atg ctg gcg ctg 432

Leu Val Asp Asn Ile Ile Met Arg Val Val Asp Ile Met Leu Ala Leu

130 135 140

cca agt ctg ctg ctg gcg ctg gtg ctg gtg gca att ttc ggc ccg tcg 480

Pro Ser Leu Leu Leu Ala Leu Val Leu Val Ala Ile Phe Gly Pro Ser

145 150 155 160

att ggt aac gcc gcg ctg gca ctg acc ttc gtt gcc ttg ccg cac tat 528

Ile Gly Asn Ala Ala Leu Ala Leu Thr Phe Val Ala Leu Pro His Tyr

165 170 175

gtg cgc tta acc cgc gcc gcc gtg ctg gtg gaa gtt aac egc gat tac 576

Val Arg Leu Thr Arg Ala Ala Val Leu Val Glu Val Asn Arg Asp Tyr

180 185 190

gtc acc gcg tct cgc gtg gcg ggt gcc ggg gcg atg cgt cag atg ttt 624

Val Thr Ala Ser Arg Val Ala Gly Ala Gly Ala Met Arg Gln Met Phe

195 200 205

att aac atc ttc ccg aac tgc ctt gcg ccg ctg att gtt cag gcg tcg 672

Ile Asn Ile Phe Pro Asn Cys Leu Ala Pro Leu Ile Val Gln Ala Ser

210 215 220

ctc ggt ttc tct aac gcc att ctc gat atg gct gct ctt ggt ttc ctc 720

Leu Gly Phe Ser Asn Ala Ile Leu Asp Met Ala Ala Leu Gly Phe Leu

225 230 235 240

ggc atg ggg gca cag ccg cca acg cct gag tgg ggc acc atg ctc tcc 768

Gly Met Gly Ala Gln Pro Pro Thr Pro Glu Trp Gly Thr Met Leu Ser

245 250 255

gac gtg ttg cag ttc gcg caa agc gcc tgg tgg gtc gtg acc ttc ccg 816

Asp Val Leu Gln Phe Ala Gln Ser Ala Trp Trp Val Val Thr Phe Pro

260 265 270

ggt ctg gcg atc ctg ctg acg gtg ctg gca ttt aac ctg atg ggt gac 864

Gly Leu Ala Ile Leu Leu Thr Val Leu Ala Phe Asn Leu Met Gly Asp

275 280 285

ggt ctg cgt gac gcg ctc gat ccc aaa ctg aag cag 900

Gly Leu Arg Asp Ala Leu Asp Pro Lys Leu Lys Gln

290 295 300

<210>60

<211>981

<212>DNA

<213>大肠杆菌

<400>60

atg gcg tta tta aat gta gat aaa tta tcg gtg cat ttc ggc gac gaa 48

Met Ala Leu Leu Asn Val Asp Lys Leu Set Val His Phe Gly Asp Glu

1 5 10 15

agc gcg ccg ttc cgc gcc gta gac cgc atc agc tac agc gta aaa cag 96

Ser Ala Pro Phe Arg Ala Val Asp Arg Ile Ser Tyr Ser Val Lys Gln

20 25 30

ggc gaa gtg gtc ggg att gtg ggt gag tcc ggc tcc ggt aag tcg gtc 144

Gly Glu Val Val Gly Ile Val Gly Glu Ser Gly Ser Gly Lys Ser Val

35 40 45

agt rca ctg gcg att atg ggg ctg att gat tat ccg ggc cgc gta atg 192

Ser Ser Leu Ala Ile Met Gly Leu Ile Asp Tyr Pro Gly Arg Val Met

50 55 60

gca gaa aaa ctg gag ttt aac ggc cag gat ttg cag cgt atc tca gaa 240

Ala Glu Lys Leu Glu Phe Asn Gly Gln Asp Leu Gln Arg Ile Ser Glu

65 70 75 80

aaa gag cgc cgc aac ctg gtg ggt gcc gaa gtg gcg atg atc ttc cag 288

Lys Glu Arg Arg Asn Leu Val Gly Ala Glu Val Ala Met Ile Phe Gln

85 90 95

gac ccg atg acc agc ctt aac ccg tgc tac acc gtg ggt ttc cag att 336

Asp Pro Met Thr Ser Leu Asn Pro Cys Tyr Thr Val Gly Phe Gln Ile

100 105 110

atg gaa gcg att aag gtg cat cag ggc ggc aac aaa agt acc cgc cgt 384

Met Glu Ala Ile Lys Val His Gln Gly Gly Asn Lys Ser Thr Arg Arg

115 120 125

cag cga gcg att gac ctg ctg aat cag gtc ggt att ccc gat ccg gca 432

Gln Arg Ala Ile Asp Leu Leu Asn Gln Val Gly Ile Pro Asp Pro Ala

130 135 140

tcg cgt ctg gat gtt tac ccg cat cag ctt tcc ggc ggc atg agc cag 480

Ser Arg Leu Asp Val Tyr Pro His Gln Leu Ser Gly Gly Met Ser Gln

145 150 155 160

cgc gtg atg atc gcc atg gcg att gcc tgt cgg cca aaa ctg ctg att 528

Arg Val Met Ile Ala Met Ala Ile Ala Cys Arg Pro Lys Leu Leu Ile

165 170 175

gcc gat gaa ccg acc acc gcg ctg gac gtg acc att cag gcg caa atc 576

Ala Asp Glu Pro Thr Thr Ala Leu Asp Val Thr Ile Gln Ala Gln Ile

180 185 190

atc gaa cta ctg ctg gag cta cag cag aaa gag aac atg gcg ctg gtg 624

Ile Glu Leu Leu Leu Glu Leu Gln Gln Lys Glu Asn Met Ala Leu Val

195 200 205

tta att acc cat gac ctg gcg ctg gtg gcg gaa gcg gca cat aaa atc 672

Leu Ile Thr His Asp Leu Ala Leu Val Ala Glu Ala Ala His Lys Ile

210 215 220

atc gtg atg tat gca ggc cag gtg gtg gaa acc ggt gat gcg cac gcc 720

Ile Val Met Tyr Ala Gly Gln Val Val Glu Thr Gly Asp Ala His Ala

225 230 235 240

atc ttc cat gcg ccg cgt cac ccg tat act cag gca ttg ctg cgt gcg 768

Ile Phe His Ala Pro Arg His Pro Tyr Thr Gln Ala Leu Leu Arg Ala

245 250 255

ctg cca gaa ttt gct cag gac aaa gaa cgt ctg gcg tcg ttg cca ggt 816

Leu Pro Glu Phe Ala Gln Asp Lys Glu Arg Leu Ala Ser Leu Pro Gly

260 265 270

gtc gtt ccc ggc aag tac gac cgc ccg aac ggc tgc ctg ctt aac ccg 864

Val Val Pro Gly Lys Tyr Asp Arg Pro Asn Gly Cys Leu Leu Asn Pro

275 280 285

cgc tgc ccc tat gcc act gac aga tgt cgc gct gaa gaa ccg gcg ctg 912

Arg Cys Pro Tyr Ala Thr Asp Arg Cys Arg Ala Glu Glu Pro Ala Leu

290 295 300

aat atg crc gct gac ggg cgt cag tcc aaa tgc cat tac cca ctt gat 960

Asn Met Leu Ala Asp Gly Arg Gln Ser Lys Cys His Tyr Pro Leu Asp

305 310 315 320

gat gcc ggg agg ccg aca cta 981

Asp Ala Gly Arg Pro Thr Leu

325

<210>61

<211>1002

<212>DNA

<213>大肠杆菌

<400>61

atg agt acg caa gag gcc acc ctg caa caa ccg ctg ttg cag gct atc 48

Met Ser Thr Gln Glu Ala Thr Leu Gln Gln Pro Leu Leu Gln Ala Ile

1 5 10 15

gac ctg aaa aaa cat tat ccg gtg aag aaa ggc atg ttc gcg ccg gaa 96

Asp Leu Lys Lys His Tyr Pro Val Lys Lys Gly Met Phe Ala Pro Glu

20 25 30

cgt ctg gtt aaa gcg ctg gat ggc gtt tcg ttt aac ctt gaa cgt ggc 144

Arg Leu Val Lys Ala Leu Asp Gly Val Ser Phe Asn Leu Glu Arg Gly

35 40 45

aaa acg ctg gca gta gtg ggc gaa tct ggc tgc ggt aaa tcg acc crc 192

Lys Thr Leu Ala Val Val Gly Glu Ser Gly Cys Gly Lys Ser Thr Leu

50 55 60

ggt cgg ttg ctg acg atg att gaa atg ccc acc ggt ggc gag ctg tat 240

Gly Arg Leu Leu Thr Met Ile Glu Met Pro Thr Gly Gly Glu Leu Tyr

65 70 75 80

tac cag ggg cag gat ctg ctt aag cac gat ccg cag gcg cag aag ctg 288

Tyr Gln Gly Gln Asp Leu Leu Lys His Asp Pro Gln Ala Gln Lys Leu

85 90 95

cgt cgg cag aaa arc cag atc gtc ttc cag aac cct tac ggt tcg ctg 336

Arg Arg Gln Lys Ile Gln Ile Val Phe Gln Ash Pro Tyr Gly Ser Leu

100 105 110

aat ccg cgt aaa aaa gtc ggg caa att ctt gaa gag ccg ctg ctg atc 384

Asn Pro Arg Lys Lys Val Gly Gln Ile Leu Glu Glu Pro Leu Leu Ile

115 120 125

aac acc agc tta agc aaa gaa cag cgt cgg gaa aaa gcc ctg tcg atg 432

Asn Thr Ser Leu Ser Lys Glu Gln Arg Arg Glu Lys Ala Leu Ser Met

130 135 140

atg gcg aaa gtc ggc ctg aaa acc gag cac tat gac cgc tat ccg cat 480

Met Ala Lys Val Gly Leu Lys Thr Glu His Tyr Asp Arg Tyr Pro His

145 150 155 160

atg ttc tcc ggc ggt cag cgt cag cgt atc gcc atc gcc cgt ggt ctg 528

Met Phe Ser Gly Gly Gln Arg Gln Arg Ile Ala Ile Ala Arg Gly Leu

165 170 175

atg ctc gac ccg gat gtg gtg att gcc gat gaa ccg gtt tcc gcg ctg 576

Met Leu Asp Pro Asp Val Val Ile Ala Asp Glu Pro Val Ser Ala Leu

180 185 190

gat gtt tca gtg cgc gcg cag gtg ctg aat ctg atg atg gat ttg cag 624

Asp Val Ser Val Arg Ala Gln Val Leu Asn Leu Met Met Asp Leu Gln

195 200 205

cag gag ttg ggg ctg tct tat gtc ttt atc tcc cac gac ctg tcg gtg 672

Gln Glu Leu Gly Leu Ser Tyr Val Phe Ile Ser His Asp Leu Ser Val

210 215 220

gtg gag cac att gct gat gaa gtg atg gtg atg tac ctg ggc cgc tgc 720

Val Glu His Ile Ala Asp Glu Val Met Val Met Tyr Leu Gly Arg Cys

225 230 235 240

gtg gag aag gga acg aaa gac caa atc ttc aat aac ccg cgc cat ccg 768

Val Glu Lys Gly Thr Lys Asp Gln Ile Phe Asn Asn Pro Arg His Pro

245 250 255

tac act cag gcg cta ctt tcc gcg acg ccg cgc ctg aac ccg gac gat 816

Tyr Thr Gln Ala Leu Leu Ser Ala Thr Pro Arg Leu Asn Pro Asp Asp

260 265 270

cgc cgc gag cgc atc aag ctc agc ggt gaa cta cca agc cca ctg aat 864

Arg Arg Glu Arg Ile Lys Leu Ser Gly Glu Leu Pro Ser Pro Leu Asn

275 280 285

cca ccg ccg ggt tgc gcc ttc aac gcc cgc tgt cgt cgg cgc ttc ggc 912

Pro Pro Pro Gly Cys Ala Phe Asn Ala Arg Cys Arg Arg Arg Phe Gly

290 295 300

ccc tgc acc cag ttg cag ccg cag cta aaa gac tac ggc ggt caa ctg 960

Pro Cys Thr Gln Leu Gln Pro Gln Leu Lys Asp Tyr Gly Gly Gln Leu

305 310 315 320

gta gct tgt ttt gct gtt gat cag gat gaa aat ccg cag cgt 1002

Val Ala Cys Phe Ala Val Asp Gln Asp Glu Asn Pro Gln Arg

325 330

<210>62

<211>56

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成DNA

<400>62

ctaaccctgt gacctgcaat actgttttgc gggtgagtgt aggctggagc tgcttc 56

<210>63

<211>56

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成DNA

<400>63

gaaactgccg gaaggcgatt aaacgccatc cggcagcata tgaatatcct ccttag 56

<210>64

<211>56

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成DNA

<400>64

ttacgcaaca ggaatagact gaacaccaga ctctatgtgt aggctggagc tgcttc 56

<210>65

<211>56

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成DNA

<400>65

agaaaacagg ggtaaattcc ccgaatggcg gcgctacata tgaatatcct ccttag 56

<210>66

<211>56

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成DNA

<400>66

atggagttta gtgtaaaaag cggtagcccg gagaaagtgt aggctggagc tgcttc 56

<210>67

<211>56

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成DNA

<400>67

ttactcttcg ccgttaaacc cagcgcggtt taacagcata tgaatatcct ccttag 56

<210>68

<211>56

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成DNA

<400>68

atgacagaag cgatgaagat taccctctct acccaagtgt aggctggagc tgcttc 56

<210>69

<211>56

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成DNA

<400>69

ttacgccgtt aacagattag ctatcgtgcg cacacccata tgaatatcct ccttag 56

<210>70

<211>56

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成DNA

<400>70

gcatccccac ctcataacgt tgacccgacc gggcaagtgt aggctggagc tgcttc 56

<210>71

<211>56

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成DNA

<400>71

ctgtacggca ttttgctatg cttgtcgcca ctgttgcata tgaatatcct ccttag 56

<210>72

<211>21

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成DNA

<400>72

gtgtctgaac tgtctcaatt a 21

<210>73

<211>21

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成DNA

<400>73

cggaatttct ttcagcagtt c 21

<210>74

<211>21

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成DNA

<400>74

atgactcaac agccacaagc c 21

<210>75

<211>21

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成DNA

<400>75

tgctttagtt atcttctcgt a 21

<210>76

<211>21

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成DNA

<400>76

agtgcctgca tcgtcgtggg c 21

<210>77

<211>21

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成DNA

<400>77

ggcgcctttt gctttaccag a 21

<210>78

<211>21

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成DNA

<400>78

gacgcgcgct ggggagaaaa a 21

<210>79

<211>21

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成DNA

<400>79

cgtagcgccc gcagaccact g 21

<210>80

<211>21

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成DNA

<400>80

atgcgtattt ccttgaaaaa g 21

<210>81

<211>21

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成DNA

<400>81

ttattcgata gagacgtttt c 21

<210>82

<211>29

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成DNA

<400>82

tacactcgag attaaagagg agaaattaa 29

<210>83

<211>30

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成DNA

<400>83

ttaggatcct catactggca gcacatactt 30

<210>84

<211>24

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成DNA

<400>84

caagaattct catgtttgac agct 24

<210>85

<211>28

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：合成DNA

<400>85

taactcgaga ttcccttttt acgtgaac 28

Claims

1.二肽或者二肽衍生物(PI)的制备方法，其特征在于，使以下的[1]～[7]任一项所述的蛋白质、1种以上的氨基酸或者氨基酸衍生物、以及ATP存在于水性介质中、在该介质中生成、蓄积二肽或者二肽衍生物[以下、称为二肽或者二肽衍生物(PI)]，从该介质中收集该二肽或者二肽衍生物(PI)[其中，二肽或者二肽衍生物(PI)不是选自下述氨基酸组A的相同或者不相同的氨基酸以肽键结合而成的化合物(氨基酸组A：L-丙氨酸、L-谷氨酰胺、L-谷氨酸、L-缬氨酸、L-亮氨酸、L-异亮氨酸、L-脯氨酸、L-苯丙氨酸、L-色氨酸、L-蛋氨酸、L-丝氨酸、L-苏氨酸、L-半胱氨酸、L-天冬酰胺、L-酪氨酸、L-赖氨酸、L-精氨酸、L-组氨酸、L-天冬氨酸、L-α-氨基丁酸、L-偶氮丝氨酸、L-茶氨酸、L-4-羟基脯氨酸、L-3-羟基脯氨酸、L-鸟氨酸、L-瓜氨酸、L-6-重氮-5-氧代正亮氨酸、甘氨酸以及β-丙氨酸)]：

[1]具有序列号1～8任一项所示的氨基酸序列的蛋白质；

[5]具有序列号37或者38所示的氨基酸序列的蛋白质；

[7]由与序列号37或者38所示的氨基酸序列具有65％以上的同源性的氨基酸序列构成、并且具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质。

2.二肽或者二肽衍生物(PII)的制备方法，其特征在于，使以下的[1]～[7]任一项所述的蛋白质、1种以上的氨基酸或者氨基酸衍生物、以及ATP存在于水性介质中、在该介质中生成、蓄积二肽或者二肽衍生物(PI)，直接或者从该介质收集该二肽或者二肽衍生物(PI)后，修饰该二肽或者二肽衍生物(PI)以生成二肽或者二肽衍生物[以下，称为二肽或者二肽衍生物(PII)]，收集该二肽或者二肽衍生物(PII)[不过，二肽或者二肽衍生物(PII)不是选自上述氨基酸组A的相同或者不相同的氨基酸以肽键结合而成的化合物]：

[1]具有序列号1～8任一项所示的氨基酸序列的蛋白质；

[4]由与序列号17所示的氨基酸序列具有80％以上的同源性的氨基酸序列、并且具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质；

[5]具有序列号37或者38所示的氨基酸序列的蛋白质；

3.二肽或者二肽衍生物(PI)的制备方法，其特征在于，将保持有选自以下[1]～[5]的DNA的细胞培养物或者该培养物的处理物用作酶源，使该酶源、1种以上的氨基酸或者氨基酸衍生物存在于水性介质中、在该水性介质中生成、蓄积二肽或者二肽衍生物(PI)，从该介质中收集该二肽或者二肽衍生物(PI)，[不过、二肽或者二肽衍生物(PI)不是选自上述氨基酸组A的相同或者不相同的氨基酸以肽键结合而成的化合物]：

[1]具有序列号9～16以及36任一项所示的碱基序列的DNA；

[2]和具有与序列号9～16以及36任一项所示的碱基序列互补的碱基序列的DNA在严格的条件下杂交、并且编码具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质的DNA；

[3]和具有与序列号18所示的碱基序列的互补的碱基序列的DNA在严格的条件下杂交、并且编码具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质的DNA；

[4]具有序列号39或者40所示的碱基序列的DNA；

[5]和具有与序列号39或者40所示的碱基序列互补的碱基序列的DNA在严格的条件下杂交、并且编码具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质的DNA。

4.二肽或者二肽衍生物(PII)的制备方法，其特征在于，将具有选自以下[1]～[5]的DNA的细胞培养物或者该培养物的处理物用作酶源，使该酶源、1种以上的氨基酸或者氨基酸衍生物存在于水性介质中，在该水性介质中生成、蓄积二肽或者二肽衍生物(PI)，直接或者从该介质收集该二肽或者二肽衍生物(PI)后，修饰该二肽或者二肽衍生物(PI)而使二肽或者二肽衍生物(PII)生成，收集该二肽或者二肽衍生物(PII)：

[1]具有序列号9～16以及36任一项所示的碱基序列的DNA；

[3]具有与序列号18所示的碱基序列互补的碱基序列的DNA在严格的条件下杂交、并且编码具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质的DNA；

[4]具有序列号39或者40所示的碱基序列的DNA；

[5]具有与序列号39或者40所示的碱基序列互补的碱基序列的DNA在严格的条件下杂交、并且编码具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)活性的蛋白质的DNA。

5.权利要求1～4中的任一项记载的制备方法，其中氨基酸或者氨基酸衍生物是式(I)或式(II)表示的氨基酸或氨基酸衍生物

(式中、n¹表示1～3的整数，

[式中、n²与上述n¹意义相同。

R⁵代表氨基、羟基、取代或未取代的低级烷氧基、一(取代或未取代的低级烷基)氨基、二(取代或未取代的低级烷基)氨基或脂环式杂环基]

[但当氨基酸或氨基酸衍生物只是式(I)表示的氨基酸或氨基酸衍生物时，R^1a和R^1b中至少有一方是氢原子，而当氨基酸或氨基酸衍生物只是式(II)表示的氨基酸或氨基酸衍生物时，R⁵为羟基]。

6.权利要求1～4中的任一项记载的制备方法，其中氨基酸或氨基酸衍生物是式(III)或式(IV)表示的氨基酸或氨基酸衍生物：

R⁵与上述意义相同)

7.权利要求1～4中的任一项记载的制备方法，其中氨基酸或氨基酸衍生物是式(V)或式(VI)表示的氨基酸或氨基酸衍生物：

(式中、R^2e表示取代或未取代的甲基)

8.权利要求1～4中的任一项记载的制备方法，其中氨基酸或氨基酸衍生物是选自L-氨基酸、甘氨酸和β-丙氨酸中的氨基酸或其衍生物。

9.权利要求8的制备方法，其中L-氨基酸是选自L-丙氨酸、L-谷氨酰胺、L-谷氨酸、L-缬氨酸、L-亮氨酸、L-异亮氨酸、L-脯氨酸、L-苯丙氨酸、L-色氨酸、L-蛋氨酸、L-丝氨酸、L-苏氨酸、L-半胱氨酸、L-天冬酰胺、L-酪氨酸、L-赖氨酸、L-精氨酸、L-组氨酸、L-天冬氨酸、L-α-氨基丁酸、L-偶氮丝氨酸、L-茶氨酸、L-4-羟基脯氨酸、L-3-羟基脯氨酸、L-鸟氨酸、L-瓜氨酸和L-6-重氮-5-氧代正亮氨酸中的L-氨基酸。

10.权利要求1～5中的任一项记载的制备方法，其中二肽或二肽衍生物(PI)是式(VIIa)表示的二肽或二肽衍生物：

[式中、n^3a和n^4a分别与上述n¹具有相同意义，

11.权利要求1～5中任一项记载的制备方法，其中二肽或二肽衍生物(PII)是式(VIIb)表示的二肽或二肽衍生物：

[式中、n^3A和n^4A分别与上述n¹具有相同意义，

R^10A与上述R^10a具有同样的意义]。

12.权利要求1～6中的任一项记载的制备方法，其中二肽或二肽衍生物(PI)是式(VIIIa)表示的二肽或二肽衍生物。

R^10a与上述同义)。

13.权利要求1～6中的任一项记载的制备方法，其中二肽或二肽衍生物(PII)是式(VIIIb)表示的二肽或二肽衍生物：

14.权利要求1～7中的任一项记载的制备方法，其中二肽或二肽衍生物(PI)是式(IXa)表示的二肽或二肽衍生物：

15.权利要求1～7中的任一项记载的制备方法，其中二肽或二肽衍生物(PII)是式(IXb)表示的二肽或二肽衍生物：

(式中、R^7E和R^9E分别与上述R^7e和R^9e具有同样意义)。

16.权利要求1～8中的任一项记载的制备方法，其中二肽或二肽衍生物(PI)或二肽或二肽衍生物(PII)是从L-氨基酸、甘氨酸、和β-丙氨酸、以及它们的衍生物选出的相同或不同的氨基酸或氨基酸衍生物通过肽键形成的二肽或二肽衍生物。

17.权利要求16的制备方法，其中L-氨基酸是选自L-丙氨酸、L-谷氨酰胺、L-谷氨酸、L-缬氨酸、L-亮氨酸、L-异亮氨酸、L-脯氨酸、L-苯丙氨酸、L-色氨酸、L-蛋氨酸、L-丝氨酸、L-苏氨酸、L-半胱氨酸、L-天冬酰胺、L-酪氨酸、L-赖氨酸、L-精氨酸、L-组氨酸、L-天冬氨酸、L-α-氨基丁酸、L-偶氮丝氨酸、L-茶氨酸、L-4-羟基脯氨酸、L-3-羟基脯氨酸、L-鸟氨酸、L-瓜氨酸和L-6-重氮-5-氧代正亮氨酸中的L-氨基酸。

18.权利要求3～17中的任一项记载的制备方法，其中细胞是微生物的细胞。

19.权利要求18的制备方法，其中微生物是原核生物。

20.权利要求19的制备方法，其中原核生物是1种以上的肽酶和1种以上的具有肽转运活性的蛋白质(以下，也称为肽转运蛋白质)的活性低下或丧失的微生物。

21.权利要求19的制备方法，其中原核生物是3种以上的肽酶的活性低下或丧失的微生物。

22.权利要求20或21的制备方法，其中肽酶是具有序列号43～46中的任一个表示的氨基酸序列的蛋白质、或具有与序列号43～46中的任一个表示的氨基酸序列有80％以上同源性的氨基酸序列，而且具有肽酶活性的蛋白质。

23.权利要求20或22的制备方法，其中肽转运蛋白质是具有序列号47～51中的任一个表示的氨基酸序列的蛋白质、或具有与序列号47～51中的任一个表示的氨基酸序列有80％以上同源性的蛋白质，而且具有肽转运活性的蛋白质。

24.权利要求19～23中的任一项记载的制备方法，其中原核生物是属于埃希氏菌属( Escherichia)、芽孢杆菌属( Bacillus)或棒杆菌属( Corynebacterium)的微生物。

25.权利要求24的制备方法，其中属于埃希氏菌属、芽孢杆菌属或棒杆菌属的微生物是大肠杆菌( Escherichia coli)、谷氨酸棒杆菌( Corynebacterium glutamicum)、产氨棒杆菌( Corynebacterium ammoniagenes)、乳酸发酵棒杆菌( Corynebacterium lactofermentum)、黄色短杆菌( Brevibacterium flavum)、Corynebacterium efficiens、枯草芽孢杆菌( Bacillus subtilis)或巨大芽孢杆菌( Bacillus megaterium)。

26.权利要求3～25中的任一项记载的制备方法，其特征在于，其中培养物的处理物是培养物的浓缩物、培养物的干燥物、对培养物进行离心分离得到的菌体、该菌体的干燥物、该菌体的冷冻干燥物、该菌体的表面活性剂处理物、该菌体的超声波处理物、该菌体的机械性磨碎处理物、该菌体的溶剂处理物、该菌体的酶处理物、该菌体的蛋白质分级物、该菌体的固定化物和从该菌体提取得到的酶标准品，而且是具有由1种以上的氨基酸或氨基酸衍生物生成二肽或二肽衍生物的活性的处理物。