CN1997738A - 二肽或二肽衍生物的制备方法 - Google Patents

二肽或二肽衍生物的制备方法 Download PDF

Info

Publication number
CN1997738A
CN1997738A CNA2005800212451A CN200580021245A CN1997738A CN 1997738 A CN1997738 A CN 1997738A CN A2005800212451 A CNA2005800212451 A CN A2005800212451A CN 200580021245 A CN200580021245 A CN 200580021245A CN 1997738 A CN1997738 A CN 1997738A
Authority
CN
China
Prior art keywords
replacement
amino acid
unsubstituted
dipeptides
dna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2005800212451A
Other languages
English (en)
Inventor
桥本信一
池田创
田畑和彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KH Neochem Co Ltd
Original Assignee
Kyowa Hakko Kogyo Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyowa Hakko Kogyo Co Ltd filed Critical Kyowa Hakko Kogyo Co Ltd
Publication of CN1997738A publication Critical patent/CN1997738A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione

Abstract

本发明提供特征如下的二肽或二肽衍生物的制备方法:使用具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物活性的蛋白质,或者具有生产该蛋白质的能力的细胞的培养物或者该培养物的处理物作为酶源,使该酶源、1种以上的氨基酸或者氨基酸衍生物以及ATP在水性介质中共存,在该介质中生成、积累二肽或者二肽衍生物,从该介质中收集二肽或者二肽衍生物。

Description

二肽或二肽衍生物的制备方法
技术领域
本发明涉及使用具有由1种以上的氨基酸或氨基酸衍生物生成二肽或二肽衍生物的活性的蛋白质、或具有编码该蛋白质的DNA的细胞的培养物、或该培养物的处理物的二肽或二肽衍生物的制备方法。
背景技术
有关肽的大量合成法已知有化学合成法(液相法、固相法)、酶促合成法和使用DNA重组法的生物学合成法。现在,对于50残基以上的长链肽使用酶促合成法或生物学合成法,对于二肽主要使用化学合成法和酶促合成法。
使用化学合成法合成二肽需要对官能团进行保护和去保护等操作,由于也合成消旋体,化学合成法不能说是经济、有效的方法。另外由于化学合成法使用大量的有机溶剂等,从环境卫生方面看也不是一个好的方法。
关于由酶法进行的二肽的合成,已知的有利用蛋白分解酶(peptidase)的逆反应的方法(参见非专利文献1),利用耐热性氨酰基t-RNA合成酶的方法(参见专利文献1~4),利用非核糖体肽合成酶(以下,称为NRPS)的方法(参见非专利文献2、3和专利文献5、6)。
然而,就利用蛋白水解酶的逆反应的方法来说,需要对底物氨基酸的官能团进行保护和去保护,存在着难于提高肽形成反应效率和阻止肽分解反应的问题。至于利用耐热性氨酰t-RNA合成酶的方法,存在着酶的表达、阻止目的产物以外的副生物反应困难的问题。就利用NRPS的方法来说,因为酶分子很大,存在使用DNA重组的方法难以表达该酶的困难,由于需要提供辅酶4′-三磷酸(4′-Phosphopantetheine),所以不能称之为有效的制备方法。
一方面已知存在酶分子量比NRPS小、不需要辅酶4′-phosphopantetheine的γ-谷氨酰半胱氨酸合成酶(γ-glutamylcysteine synthetase)、谷胱甘肽合成酶(glutathionesynthetase)、D-丙氨酰-D-丙氨酸(D-Ala-D-Ala)连接酶(D-Ala-D-Ala ligase)、聚-γ-谷氨酸合成酶(poly-γ-glutamatesynthetase)等一组肽合成酶。几乎所有这些酶等由于都具有作为底物使用D-氨基酸或催化在γ位羧基形成肽键等特征,所以不能用于在L-氨基酸的α位羧基形成肽键的二肽的合成。
已知通过在L-氨基酸的α位羧基形成肽键活性生成二肽只有作为来自属于芽孢杆菌属的微生物的二肽抗生素的杆菌溶素合成酶。已知杆菌溶素合成酶具有合成杆菌溶素(L-丙氨酰-L-anticapsin、L-Ala-L-anticapsin)和L-丙氨酰-L-丙氨酸(L-Ala-L-Ala)的活性,但有关其它二肽的合成活性还不清楚(参照非专利文献4和5)。
另外,关于全基因组信息已阐明的枯草芽孢杆菌(Bacillussubtilis)168株(参照非专利文献6)中的杆菌溶素合成酶基因组,已知如果扩增含有ywfA~F的ORF的杆菌溶素操纵子,杆菌溶素的产率会增加(参照专利文献7)。然而,在这些ORF中是否含有编码具有通过肽键连接2种以上的氨基酸的活性的蛋白质的ORF,如果含有,也不知道哪个ORF编码该蛋白质。
已知有种微生物可生成具有由2个氨基酸连接成环状的环状二肽二酮哌嗪环缩二氨酸(diketopiperazine)结构的化合物(参照非专利文献7、8和9)。据报道对于二酮哌嗪环缩二氨酸的生物合成,是在Streptomyces acidiscabies的Thaxtomin生物合成过程中通过NRPS合成了cyclo-(L-4-nitrotryptophyl-L-phenylalanine)结构(参照非专利文献10)、和通过杆菌属的细菌的NRPS的部分module的作用从苯丙氨酸和脯氨酸生成cyclo(phenylalanyl-proline)(参照非专利文献11)。
另外,据报道已知作为抗生物质白诺菌素(albonoursin)的生产株诺尔斯氏链霉菌( Streptomycesnoursei)ATCC11455株中,与NRPS酶完全不相似的蛋白质( albC 基因产物)负责环(L-苯丙氨酰-L-亮氨酸)[cyclo(L-phenylalanyl-L-leucine)]结构的合成,如果使环二肽氧化酶作用于导入了albC基因的大肠杆菌( Escherichia  coli)和浅青紫链霉菌( Streptomyces  lividans)的培养液,可以检测到albonoursin(参照非专利文献12),但还没有 albC基因产物生成直链状二肽的报告。
由此可见尚且不知道包含在杆菌溶素合成酶群中的酶等具有由一种以上的氨基酸和氨基酸衍生物生成各种二肽衍生物的活性。
专利文献1特开昭58-146539号公报
专利文献2特开昭58-209991号公报
专利文献3特开昭58-209992号公报
专利文献4特开昭59-106298号公报
专利文献5美国专利第5795738号
专利文献6美国专利第5652116号
专利文献7国际公开专利第00-03009号小册子
非专利文献1J.Biol.Chem.,119,707-720(1937)
非专利文献2Chem.Biol.,7,373-384(2000)
非专利文献3FEBS Lett.,498,42-45(2001)
非专利文献4J.Ind.Microbiol.,2,201-208(1987)
非专利文献5Enzyme.Microbial.Technol.,29,400-406(2001)
非专利文献6Nature,390,249-256(1997)
非专利文献7J.Nat.Prod.,59,293-296(1996)
非专利文献8Tetrahedron,28,2999(1972)
非专利文献9J.Appl.Microbiol.,86,29-53(1999)
非专利文献10Mol.Microbiol.,38,794-804(2000)
非专利文献11J.Biol.Chem.,273,22773-22781(1998)
非专利文献12Chemistry&Biol.,9,1355-1364(2002)
发明内容
发明所要解决的问题
本发明的目的是提供由氨基酸或氨基酸衍生物制备二肽衍生物的方法。
解决问题的方法
本发明、涉及以下的(1)~(26):
(1)二肽或者二肽衍生物(PI)的制备方法,其特征在于,使以下的[1]~[7]任一项所述的蛋白质、1种以上的氨基酸或者氨基酸衍生物、以及ATP存在于水性介质中、在该介质中生成、蓄积二肽或者二肽衍生物[以下、称为二肽或者二肽衍生物(PI)],从该介质中收集该二肽或者二肽衍生物(PI)[不过、二肽或者二肽衍生物(PI)不是选自下述氨基酸组A的相同或者不相同的氨基酸以肽键结合而成的化合物(氨基酸组A:L-丙氨酸、L-谷氨酰胺、L-谷氨酸、L-缬氨酸、L-亮氨酸、L-异亮氨酸、L-脯氨酸、L-苯丙氨酸、L-色氨酸、L-蛋氨酸、L-丝氨酸、L-苏氨酸、L-半胱氨酸、L-天冬酰胺、L-酪氨酸、L-赖氨酸、L-精氨酸、L-组氨酸、L-天冬氨酸、L-α-氨基丁酸、L-偶氮丝氨酸、L-茶氨酸、L-4-羟基脯氨酸、L-3-羟基脯氨酸、L-鸟氨酸、L-瓜氨酸、L-6-重氮-5-氧代正亮氨酸、甘氨酸以及β-丙氨酸)]。
[1]具有序列号1~8任一项所示的氨基酸序列的蛋白质;
[2]由在序列号1~8任一项所示的氨基酸序列上缺失、置换或者添加1个以上的氨基酸的氨基酸序列构成、并且具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质;
[3]由与序列号1~8任一项所示的氨基酸序列具有65%以上的同源性的氨基酸序列构成、并且具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质;
[4]具有与序列号17所示的氨基酸序列80%以上的同源性的氨基酸序列、并且具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质;
[5]具有序列号37或者38所示的氨基酸序列的蛋白质;
[6]由在序列号37或者38所示的氨基酸序列上缺失、置换或者添加1个以上的氨基酸的氨基酸序列构成、并且具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质;
[7]具有与序列号37或者38所示的氨基酸序列65%以上的同源性的氨基酸序列构成、并且具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质;
(2)二肽或者二肽衍生物(PII)的制备方法,其特征在于,使以下的[1]~[7]的任一项所述的蛋白质、1种以上的氨基酸或者氨基酸衍生物、以及ATP存在于水性介质中、在该介质中生成、蓄积二肽或者二肽衍生物(PI),直接或者从该介质收集该二肽或者二肽衍生物(PI)后、修饰该二肽或者二肽衍生物(PI)以合成二肽或者二肽衍生物[以下,称为二肽或者二肽衍生物(PII)],收集该二肽或者二肽衍生物(PII)[不过,二肽或者二肽衍生物(PII)不是选自上述氨基酸组A的相同或者不相同的氨基酸以肽键结合而成的化合物];
[1]具有序列号1~8任一项所示的氨基酸序列的蛋白质;
[2]由在序列号1~8任一项所示的氨基酸序列上缺失、置换或者添加1个以上的氨基酸的氨基酸序列构成、并且具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质;
[3]与序列号1~8任一项所示的氨基酸序列具有65%以上的同源性的氨基酸序列构成、并且具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质;
[4]与序列号17所示的氨基酸序列具有80%以上的同源性的氨基酸序列、并且具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质;
[5]具有序列号37或者38所示的氨基酸序列的蛋白质;
[6]由在序列号37或者38所示的氨基酸序列上缺失、置换或者添加1个以上的氨基酸的氨基酸序列构成、并且具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质;
[7]由与序列号37或者38所示的氨基酸序列具有65%以上的同源性的氨基酸序列构成、并且具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质;
(3)二肽或者二肽衍生物(PI)的制备方法,其特征在于,将具有选自以下[1]~[5]的DNA的细胞的培养物或者该培养物的处理物用作酶源,使该酶源、1种以上的氨基酸或者氨基酸衍生物存在于水性介质中、在该水性介质中生成、蓄积二肽或者二肽衍生物(PI),从该介质中收集该二肽或者二肽衍生物(PI),[不过、二肽或者二肽衍生物(PI)不是选自上述氨基酸组A的相同或者不相同的氨基酸以肽键结合而成的化合物];
[1]具有序列号9~16以及36任一项所示的碱基序列的DNA;
[2]与具有序列号9~16以及36任一项所示的碱基序列互补的碱基序列的DNA在严格的条件下杂交、并且编码具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质的DNA;
[3]与具有序列号18所示的碱基序列的互补的碱基序列的DNA在严格的条件下杂交、并且编码具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质的DNA;
[4]具有序列号39或者40所示的碱基序列的DNA;
[5]与具有序列号39或者40所示的碱基序列互补的碱基序列的DNA在严格的条件下杂交、并且编码具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质的DNA;
(4)二肽或者二肽衍生物(PII)的制备方法,其特征在于,将具有选自以下[1]~[5]的DNA的细胞的培养物或者该培养物的处理物用作酶源,使该酶源、1种以上的氨基酸或者氨基酸衍生物存在于水性介质中,在该水性介质中生成、蓄积二肽或者二肽衍生物(PI),直接或者从该介质收集该二肽或者二肽衍生物(PI)后,修饰该二肽或者二肽衍生物(PI)而生成二肽或者二肽衍生物(PII),收集该二肽或者二肽衍生物(PII);
[1]具有序列号9~16以及36任一项所示的碱基序列的DNA;
[2]编码与具有序列号9~16以及36任一项所示的碱基序列互补的碱基序列的DNA在严格的条件下杂交、并且具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质的DNA;
[3]编码与具有序列号18所示的碱基序列互补的碱基序列的DNA在严格的条件下杂交、并且具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质的DNA;
[4]具有序列号39或者40所示的碱基序列的DNA
[5]编码具有与序列号39或者40所示的碱基序列互补的碱基序列的DNA在严格的条件下杂交、并且具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)活性的蛋白质的DNA。
(5)上述(1)~(4)中的任一种制备方法,其中氨基酸或者氨基酸衍生物是式(I)或式(II)表示的氨基酸或氨基酸衍生物:
Figure A20058002124500211
(式中、n1表示1~3的整数,
R1a和R1b可以相同或不同,代表氢原子、取代或未取代的低级烷基、取代或未取代的低级烯基、取代或未取代的低级炔基、取代或未取代的芳烷基、取代或未取代的低级烷酰基、取代或未取代的低级烷氧羰基、取代或未取代的芳基或取代或未取代的芳酰基,或R1a和R1b中的任一方也可以与邻接的氮原子、该氮原子邻接的碳原子以及该碳原子上的R2a和R2b的任一方一起形成取代或未取代的杂环基,
R2a和R2b可相同或不同,代表氢原子、取代或未取代的低级烷基、取代或未取代的芳烷基、取代或未取代的芳基或取代或未取代的杂环烷基,或与R1aR1bN邻接的碳原子上的R2a和R2b中的任一方也可以与邻接的碳原子、该碳原子邻接的氮原子以及R1a和R1b中的任一方一起形成取代或未取代的杂环基,n1为2或3时,2个或3个的R2a和2个或3个的R2b可分别相同,也可以不同),
[式中、n2与上述n1意义相同。
R3a和R3b可以相同或不同,代表氢原子、取代或未取代的低级烷基、取代或未取代的芳烷基、取代或未取代的芳基或取代或未取代的杂环烷基,或与R4HN邻接的碳原子上的R3a和R3b中的任一方与邻接的碳原子、与该碳原子邻接的氮原子和R4一起形成取代或未取代的杂环基,当n2为2或3时,2个或3个的R3a和2个或3个的R3b可分别相同,也可以不同,
R4代表氢原子、取代或未取代的低级烷基、取代或未取代的低级烯基、取代或未取代的低级炔基、取代或未取代的芳烷基、取代或未取代的低级烷酰基、取代或未取代的低级烷氧羰基、取代或未取代的芳基或取代或未取代的芳酰基,或与R4邻接的氮原子、与该氮原子邻接的碳原子以及该碳原子上的R3a和R3b中的任一方一起形成取代或未取代的杂环基,
R5代表氨基、羟基、取代或未取代的低级烷氧基、一(取代或未取代的低级烷基)氨基、二(取代或未取代的低级烷基)氨基或脂环式杂环基][但当氨基酸或氨基酸衍生物只是式(I)表示的氨基酸或氨基酸衍生物时,R1a和R1b中至少有一方是氢原子,而当氨基酸或氨基酸衍生物只是式(II)表示的氨基酸或氨基酸衍生物时,R5为羟基]。
(6)上述(1)~(4)中的任一种制备方法,其中氨基酸或氨基酸衍生物是式(III)或式(IV)表示的氨基酸或氨基酸衍生物:
Figure A20058002124500231
(式中、R1c和R1d可相同或不同,代表氢原子、取代或未取代的低级烷基、取代或未取代的低级烯基、取代或未取代的低级炔基、取代或未取代的芳烷基、取代或未取代的低级烷酰基、取代或未取代的低级烷氧羰基、取代或未取代的芳基或取代或未取代的芳酰基,
R2c和R2d可相同或不同,代表氢原子或取代或未取代的低级烷基),
Figure A20058002124500232
(式中、R3c和R3d可相同或不同,代表氢原子、取代或未取代的低级烷基、取代或未取代的芳烷基或取代或未取代的芳基,
R5与上述意义相同)
[但当氨基酸或氨基酸衍生物只是式(III)表示的氨基酸或氨基酸衍生物时,R1c和R1d中至少有一方是氢原子,当氨基酸或氨基酸衍生物只是式(IV)表示的氨基酸或氨基酸衍生物时,R5为羟基]。
(7)上述(1)~(4)中的任一种制备方法,其中氨基酸或氨基酸衍生物是式(V)或式(VI)表示的氨基酸或氨基酸衍生物:
Figure A20058002124500241
(式中、R2e表示取代或未取代的甲基)
Figure A20058002124500242
(式中、R3e代表取代或未取代的低级烷基、取代或未取代的芳烷基或取代或未取代的芳基)。
(8)上述(1)~(4)中的任一种制备方法,其中氨基酸或氨基酸衍生物是选自L-氨基酸、甘氨酸和β-丙氨酸中的氨基酸或其衍生物。
(9)上述(8)的制备方法,其中L-氨基酸是选自L-丙氨酸、L-谷氨酰胺、L-谷氨酸、L-缬氨酸、L-亮氨酸、L-异亮氨酸、L-脯氨酸、L-苯丙氨酸、L-色氨酸、L-蛋氨酸、L-丝氨酸、L-苏氨酸、L-半胱氨酸、L-天冬酰胺、L-酪氨酸、L-赖氨酸、L-精氨酸、L-组氨酸、L-天冬氨酸、L-α-氨基丁酸、L-偶氮丝氨酸、L-茶氨酸、L-4-羟基脯氨酸、L-3-羟基脯氨酸、L-鸟氨酸、L-瓜氨酸和L-6-重氮-5-氧代正亮氨酸中的L-氨基酸。
(10)上述(1)~(5)中的任一种制备方法,其中二肽或二肽衍生物(PI)是式(VIIa)表示的二肽或二肽衍生物:
Figure A20058002124500251
[式中、n3a和n4a分别与上述n1具有相同意义,
R6a和R6b可相同或不同,代表氢原子、取代或未取代的低级烷基、取代或未取代的低级烯基、取代或未取代的低级炔基、取代或未取代的芳烷基、取代或未取代的低级烷酰基、取代或未取代的低级烷氧羰基、取代或未取代的芳基或取代或未取代的芳酰基,或R6a和R6b中的任一方可以与邻接的氮原子、与该氮原子邻接的碳原子和该碳原子上的R7a和R7b中的任一方一起形成取代或未取代的杂环基,
R7a和R7b可相同或不同,代表氢原子、取代或未取代的低级烷基、取代或未取代的芳烷基、取代或未取代的芳基或取代或未取代的杂环烷基,或与R6aR6bN邻接的碳原子上的R7a和R7b中的任一方可以与邻接的碳原子、与该碳原子邻接的氮原子和R6a和R6b中的任一方一起形成取代或未取代的杂环基,当n3a为2或3时,2个或3个R7a和2个或3个R7b可分别相同,也可以不同,
R8a代表氢原子、取代或未取代的低级烷基、取代或未取代的低级烯基、取代或未取代的低级炔基、取代或未取代的芳烷基、取代或未取代的低级烷酰基、取代或未取代的低级烷氧羰基、取代或未取代的芳基或取代或未取代的芳酰基,或R8a与邻接的氮原子、与该氮原子邻接而且与R9a和R9b结合的碳原子和该碳原子上的R9a和R9b中的任一方一起形成取代或未取代的杂环基,
R9a和R9b可相同或不同,代表氢原子、取代或未取代的低级烷基、取代或未取代的芳烷基、取代或未取代的芳基或取代或未取代的杂环烷基,或与R8aN邻接的碳原子上的R9a和R9b中的任一方可以与邻接的碳原子、与该碳原子邻接的氮原子和R8a一起形成取代或未取代的杂环基,当n4a为2或3时,2个或3个R9a和2个或3个R9b可分别相同,也可以不同,
R10a代表氨基、羟基、取代或未取代的低级烷氧基、一(取代或未取代的低级烷基)氨基、二(取代或未取代的低级烷基)氨基或脂环式杂环基]。
(11)上述(1)~(5)中的任一种制备方法,其中二肽或二肽衍生物(PII)是式(VIIb)表示的二肽或二肽衍生物:
[式中、n3A和n4A分别与上述n1具有相同意义,
R6A和R6B可相同或不同,代表氢原子、取代或未取代的低级烷基、取代或未取代的低级烯基、取代或未取代的低级炔基、取代或未取代的芳烷基、取代或未取代的低级烷酰基、取代或未取代的低级烷氧羰基、取代或未取代的芳基或取代或未取代的芳酰基,或R6A和R6B中的任一方也可以与邻接的氮原子、与该氮原子邻接的碳原子和该碳原子上的R7A和R7B中的任一方一起形成取代或未取代的杂环基,
R7A和R7B可相同或不同,代表氢原子、取代或未取代的低级烷基、取代或未取代的芳烷基、取代或未取代的芳基或取代或未取代的杂环烷基,或与R6AR6BN邻接的碳原子上的R7A和R7B中的任一方也可以与邻接的碳原子、与该碳原子邻接的氮原子和R6A和R6B中的任一方一起形成取代或未取代的杂环基,当n3A为2或3时,2个或3个R7A和2个或3个R7B可分别相同,也可以不同,
R8A代表氢原子、取代或未取代的低级烷基、取代或未取代的低级烯基、取代或未取代的低级炔基、取代或未取代的芳烷基、取代或未取代的低级烷酰基、取代或未取代的低级烷氧羰基、取代或未取代的芳基或取代或未取代的芳酰基,或R8A与邻接的氮原子、与该氮原子邻接而且与R9A和R9B结合的碳原子以及该碳原子上的R9A和R9B中的任一方一起形成取代或未取代的杂环基,
R9A和R9B可相同或不同,代表氢原子、取代或未取代的低级烷基、取代或未取代的芳烷基、取代或未取代的芳基或取代或未取代的杂环烷基,或与R8AN邻接的碳原子上的R9A和R9B中的任一方可以与邻接的碳原子、与该碳原子邻接的氮原子和R8A一起形成取代或未取代的杂环基,当n4A为2或3时,2个或3个R9A和2个或3个R9B可分别相同,也可以不同,
R10A与上述R10a具有同样的意义]。
(12)上述(1)~(6)中的任一种制备方法,其中二肽或二肽衍生物(PI)是式(VIIIa)表示的二肽或二肽衍生物:
Figure A20058002124500271
(式中、R6c和R6d可相同或不同,代表氢原子、取代或未取代的低级烷基、取代或未取代的低级烯基、取代或未取代的低级炔基、取代或未取代的芳烷基、取代或未取代的低级烷酰基、取代或未取代的低级烷氧羰基、取代或未取代的芳基或取代或未取代的芳酰基,
R7c和R7d可相同或不同,代表氢原子或取代或未取代的低级烷基,
R9c和R9d可相同或不同,代表氢原子、取代或未取代的低级烷基、取代或未取代的芳烷基或取代或未取代的芳基,
R10a与上述同义)。
(13)上述(1)~(6)中的任一种制备方法,其中二肽或二肽衍生物(PII)是式(VIIIb)表示的二肽或二肽衍生物:
Figure A20058002124500281
(式中、R6C、R6D、R7C、R7D、R9C和R9D分别与上述R6c、R6d、R7c、R7d、R9c和R9d具有同样意义,R10A与上述同义)。
(14)上述(1)~(7)中的任一种制备方法,其中二肽或二肽衍生物(PI)是式(IXa)表示的二肽或二肽衍生物:
Figure A20058002124500282
(式中、R7e代表取代或未取代的甲基,R9e代表取代或未取代的低级烷基、取代或未取代的芳烷基或取代或未取代的芳基)。
(15)上述(1)~(7)中的任一种制备方法,其中二肽或二肽衍生物(PII)是式(IXb)表示的二肽或二肽衍生物:
(式中、R7E和R9E分别与上述R7e和R9e具有同样意义)。
(16)上述(1)~(8)中的任一种制备方法,其中二肽或二肽衍生物(PI)或二肽或二肽衍生物(PII)是从L-氨基酸、甘氨酸、和β-丙氨酸、以及它们的衍生物选出的相同或不同的氨基酸或氨基酸衍生物通过肽键形成的二肽或二肽衍生物。
(17)上述(16)的制备方法,其中L-氨基酸是选自L-丙氨酸、L-谷氨酰胺、L-谷氨酸、L-缬氨酸、L-亮氨酸、L-异亮氨酸、L-脯氨酸、L-苯丙氨酸、L-色氨酸、L-蛋氨酸、L-丝氨酸、L-苏氨酸、L-半胱氨酸、L-天冬酰胺、L-酪氨酸、L-赖氨酸、L-精氨酸、L-组氨酸、L-天冬氨酸、L-α-氨基丁酸、L-偶氮丝氨酸、L-茶氨酸、L-4-羟基脯氨酸、L-3-羟基脯氨酸、L-鸟氨酸、L-瓜氨酸和L-6-重氮-5-氧代正亮氨酸中的L-氨基酸。
(18)上述(3)~(17)中的任一种制备方法,其中细胞是微生物的细胞。
(19)上述(18)的制备方法,其中微生物是原核生物。
(20)上述(19)的制备方法,其中原核生物是1种以上的肽酶和1种以上的具有肽转运活性的蛋白质(以下,也称为肽转运蛋白质)的活性低下或丧失的微生物。
(21)上述(20)的制备方法,其中原核生物是3种以上的肽酶的活性低下或丧失的微生物。
(22)上述(20)或(21)的制备方法,其中肽酶是具有序列号43~46中的任一个表示的氨基酸序列的蛋白质、或具有与序列号43~46中的任一个表示的氨基酸序列有80%以上同源性的氨基酸序列,而且具有肽酶活性的蛋白质。
(23)上述(20)或(22)的制备方法,其中肽转运蛋白质是具有序列号47~51中的任一个表示的氨基酸序列的蛋白质、或具有与序列号47~51中的任一个表示的氨基酸序列有80%以上同源性的蛋白质,而且具有肽转运活性的蛋白质。
(24)上述(19)~(23)中的任一种制备方法,其中原核生物是属于埃希氏菌属、芽孢杆菌属或棒杆菌属的微生物。
(25)上述(24)的制备方法,其中属于埃希氏菌属、芽孢杆菌属或棒杆菌属的微生物是大肠杆菌( Escherichia  coli)、谷氨酸棒杆菌( Corynebacterium  glutamicum)、产氨棒杆菌( Corynebacterium ammoniagenes)、乳酸发酵棒杆菌( Corynebacterium lactofermentum)、黄色短杆菌( Brevibacterium  flavum)、Corynebacterium efficiens、枯草芽孢杆菌( Bacillus  subtilis)或巨大芽孢杆菌( Bacillus  megaterium)。
(26)上述(3)~(25)中的任一种制备方法,其特征在于,其中培养物的处理物是从培养物的浓缩物、培养物的干燥物、对培养物进行离心分离得到的菌体、该菌体的干燥物、该菌体的冷冻干燥物、该菌体的表面活性剂处理物、该菌体的超声波处理物、该菌体的机械性磨碎处理物、该菌体的溶剂处理物、该菌体的酶处理物、该菌体的蛋白质分级物、该菌体的固定化物和从该菌体提取得到的酶标准品选出的处理物,而且具有由1种以上的氨基酸或氨基酸衍生物生成二肽或二肽衍生物的活性的处理物。
发明的效果
通过本发明可以提供由1种以上的氨基酸或氨基酸衍生物有效地制备二肽衍生物的方法。
附图说明
图1是表示质粒pPE43的构建过程的图。
图2是表示质粒pQE60ywfE的构建过程的图。
图3是表示具有直链二肽合成活性的蛋白质的表达质粒载体pAL-nou和pAL-alb的构建过程的图。
图4是表示 ywfE基因表达强化型载体pPE56的构建过程的图。
符号说明
ywfE:来自枯草芽孢杆菌168株的 ywfE基因
Ptrp:色氨酸启动子基因
PT5:T5启动子
Ampr:氨苄青霉素抗性基因
lacIq:乳糖阻遏物基因
albCalbC基因或 albC类似基因
具体实施方式
1.用于本发明的方法的蛋白质
用于本发明的方法的蛋白质可列举以下[1]~[7]所述的蛋白质等:
[1]具有序列号1~8中的任一个表示的氨基酸序列的蛋白质;
[2]由在序列号1~8中的任一个表示的氨基酸序列缺失、置换或添加1个以上的氨基酸的氨基酸序列构成,而且具有由一种以上的氨基酸和氨基酸衍生物生成二肽或二肽衍生物的活性的蛋白质;
[3]由与序列号1~8中的任一个表示的氨基酸序列具有65%以上同源性的氨基酸序列构成,而且具有由一种以上的氨基酸和氨基酸衍生物生成二肽或二肽衍生物的活性的蛋白质;
[4]具有与序列号17表示的氨基酸序列有80%以上同源性的氨基酸序列,而且具有由一种以上的氨基酸和氨基酸衍生物生成二肽或二肽衍生物的活性的蛋白质;
[5]具有由序列号37或38表示的氨基酸序列的蛋白质;
[6]由在序列号37或38表示的氨基酸序列中缺失、置换或添加1个以上的氨基酸的氨基酸序列构成,而且具有由一种以上的氨基酸和氨基酸衍生物生成二肽或二肽衍生物的活性的蛋白质;和
[7]由与序列号37或38表示的氨基酸序列有65%以上同源性的氨基酸序列构成,而且具有由一种以上的氨基酸和氨基酸衍生物生成二肽或二肽衍生物的活性的蛋白质。
在上述中,由缺失、置换或添加了1个以上的氨基酸的氨基酸序列构成,而且具有式(I)所示二肽合成活性的蛋白质可以通过使用Molecular Cloning,A Laboratory Manual,Third Edition,ColdSpring Harbor Laboratory Press(2001)(以下,略为MolecularCloning第3版)、Current Protocols in Molecular Biology,JohnWiley&Sons(1987-1997)(以下,略为Current Protocols inMolecular Biology)、Nucleic Acids Research, 10,6487(1982)、Proc.Natl.Acad.Sci.USA, 79,6409(1982)、Gene, 34,315(1985)、Nucleic Acids Research, 13,4431(1985)、Proc.Natl.Acad.Sci.USA, 82,488(1985)等所述的定点突变导入法,例如可以通过在由编码序列号1~8、37和38中的任一个表示的氨基酸序列构成的蛋白质的DNA中导入定点突变取得。
缺失、置换或添加的氨基酸的数目没有特别限定,只要是通过上述的定点突变法等众所周知的方法能够缺失、置换或添加程度的数目,可以是从1个至数十个、优选1~20个、更优选1~10个、再优选1~5个。
所谓在序列号1~8、37和38中的任一个表示的氨基酸序列中缺失、置换或添加1个以上的氨基酸指的是可以在同一序列中的任意位置缺失、置换或添加1个或多个氨基酸。
作为可置换的氨基酸,例如用众所周知的对比软件对序列号1~8、以及序列号37和38表示的氨基酸序列之间进行比较时,所有氨基酸序列中非保守的氨基酸。作为众所周知的对比软件,例如基因解析软件Genetyx(软件开发株式会社)中含有的序列对比解析软件。作为该解析软件的解析参数,可以使用default值。
另外作为可进行氨基酸缺失或添加的氨基酸位置,例如序列号1~8、37和38中的任一个表示的氨基酸序列的N末端和C末端。
缺失、置换或添加可以同时出现,被置换或添加的氨基酸无论天然型,还是非天然型都可以。作为天然型氨基酸,如L-丙氨酸、L-天冬酰胺、L-天冬氨酸、L-谷氨酰胺、L-谷氨酸、甘氨酸、L-精氨酸、L-组氨酸、L-异亮氨酸、L-亮氨酸、L-赖氨酸、L-蛋氨酸、L-苯丙氨酸、L-脯氨酸、L-丝氨酸、L-苏氨酸、L-色氨酸、L-酪氨酸、L-缬氨酸、L-半胱氨酸等。
以下给出了可相互置换的氨基酸的例子。同一组中含有的氨基酸可相互置换。
A组:亮氨酸、异亮氨酸、正亮氨酸、缬氨酸、正缬氨酸、丙氨酸、2-氨基丁酸、蛋氨酸、O-甲基丝氨酸、t-丁基甘氨酸、t-丁基丙氨酸、环己基丙氨酸
B组:天冬氨酸、谷氨酸、异天冬氨酸、异谷氨酸、2-氨基己二酸、2-氨基辛二酸
C组:天冬酰胺、谷氨酰胺
D组:赖氨酸、精氨酸、鸟氨酸、2,4-二氨基丁酸、2,3-二氨基丙酸
E组:脯氨酸、3-羟基脯氨酸、4-羟基脯氨酸
F组:丝氨酸、苏氨酸、高丝氨酸
G组:苯丙氨酸、酪氨酸
另外本发明中使用的蛋白质为了具有二肽或者二肽衍生物的合成成活性,希望是序列号1~8、37和38中的任一个表示的氨基酸序列、优选与序列号1或者37中的任一个表示的氨基酸序列的同源性具有65%以上、优选75%以上、更优选85%以上、再优选90%以上、特别优选95%以上、最好优选98%以上的序列。
氨基酸序列或碱基序列的同源性可以使用Karlin and Altschul提出的算法BLAST[Pro.Natl.Acad.Sci.USA, 90,5873(1993)]或FASTA[Methods Enzymol., 183,63(1990)]测定。根据这个算法BLAST开发了称为BLASTN和BLASTX的程序[J.Mol.Biol., 215,403(1990)]。当根据BLAST通过BLASTN对碱基序列进行解析时,参数定为例如Score=100、wordlength=12。另外当根据BLAST通过BLASTX对氨基酸序列进行解析时,参数定为例如score=50、wordlength=3。当使用BLAST和Gapped BLAST程序时,使用各程序的default参数。这些解析方法的具体手法众所周知(http://www.ncbi.nlm.nih.gov.)。
另外,由与序列号1~8、37和38中的任一个表示的氨基酸序列、优选与序列号1或37中的任一个表示的氨基酸序列具有65%以上、优选75%以上、更优选85%以上、再优选90%以上、特别优选95%以上、最好优选98%以上同源性的氨基酸序列构成,而且具有二肽或者二肽衍生物合成活性的蛋白质也是可在本发明中使用的蛋白质。氨基酸序列的同源性可以象上述那样使用BLAST或FASTA测定。
序列号17表示的氨基酸序列是被保存在具有序列号1~7表示的氨基酸序列的蛋白质中的区域,而且是对应于具有各种微生物的Ala-Ala连接酶活性的蛋白质的共有序列区域。
具有与序列号17表示的氨基酸序列有80%以上、优选90%以上、更优选95%以上同源性的氨基酸序列,而且具有二肽或者二肽衍生物合成活性的蛋白质也是可在本发明中使用的蛋白质。
为了使与序列号17表示的氨基酸序列有80%以上、优选90%以上、再优选95%以上同源性的氨基酸序列的蛋白质成为具有生成二肽的活性的蛋白质,希望该蛋白质的氨基酸序列与序列号1~8中的任一个表示的氨基酸序列的同源性至少具有80%以上、通常为90%以上、最好具有95%以上的同源性。
氨基酸序列的同源性可以象上述那样使用BLAST或FASTA测定。
作为确认本发明中可使用的蛋白质是具有二肽或者二肽衍生物合成活性的蛋白质的方法,例如使用DNA重组法制作表达可用于本发明的蛋白质的转化体,使用该转化体制备在本发明中使用的蛋白质后,使该蛋白质、1种以上的L-氨基酸和氨基酸衍生物、和ATP存在于水性介质中,通过HPLC等分析二肽或二肽衍生物是否在该水性介质中生成、蓄积的方法。
2.可用于本发明的DNA
作为编码可用于本发明DNA,可列举以下[1]~[5]所述的DNA:
[1]具有序列号9~16和36中的任一个表示的碱基序列的DNA、
[2]与具有序列号9~16和36中的任一个表示的碱基序列互补的碱基序列的DNA在严格的条件下杂交,而且编码具有由一种以上的氨基酸或氨基酸衍生物生成二肽或二肽衍生物的活性的蛋白质的DNA、
[3]与具有序列号18表示的碱基序列互补的碱基序列的DNA在严格的条件下杂交,而且编码具有由一种以上的氨基酸或氨基酸衍生物生成二肽或二肽衍生物的活性的蛋白质的DNA、
[4]具有序列号39或40表示的碱基序列的DNA、以及
[5]与具有序列号39或40表示的碱基序列互补的碱基序列的DNA在严格的条件下杂交,而且编码具有由一种以上的氨基酸或氨基酸衍生物生成二肽或二肽衍生物的活性的蛋白质的DNA。
所谓上述的在严格条件下可杂交的DNA指的是以具有与序列号9~16、18、36、39或者40中的任一个表示的碱基序列互补的碱基序列的DNA的一部分、或全部作为探针,通过使用菌落杂交法、噬斑杂交法或Southern blot杂交法等得到的DNA,具体来说,使用固定了来自菌落或噬斑的DNA的滤器,在0.7~1.0mol/L、优选0.9mol/L氯化钠存在下、于65℃下进行杂交后、使用0.1~2倍、优选0.1倍浓度的SSC溶液(1倍浓度的SSC溶液组成由150mmol/l氯化钠、15mmol/l柠檬酸钠构成),于65℃条件下,通过清洗滤器能够鉴定的DNA。杂交可以根据Molecular Cloning第3版、Current Protocols in MolecularBiology、DNA Cloning 1:Core Techniques,A Practical Approach,Second Edition,Oxford University(1995)等记载的方法进行。作为可杂交的DNA,具体而言使用上述的BLAST和FASTA等,在根据上述参数计算时,与序列号9~16、18、36、39或者40中的任一个表示的碱基序列至少具有75%以上、优选85%以上、再优选90%以上、特别优选95%以上同源性的DNA。
和具有与序列号9~16、18、36、39或者40中的任一个表示的碱基序列互补的碱基序列的DNA在严格条件下进行杂交的DNA是编码具有二肽或者二肽衍生物合成活性的蛋白质的DNA如上述所述那样,可以通过使用重组DNA法制备该DNA编码的蛋白质,测定该蛋白质的活性进行确认。
4.可用于本发明的DNA的制备
用于本发明的DNA,例如可以通过使用能够根据序列号9~16、18、36、39或者40中的任一个表示的碱基序列设计的探针,例如使用对芽孢杆菌属或链霉菌属的微生物的染色体DNA文库进行Southern杂交、或可以根据序列号9~16、18、36、39或者40中的任一个表示的碱基序列设计的引物DNA,以使用芽孢杆菌属的微生物的染色体DNA作为模板的PCR[PCR Protocols,Academic Press(1990)]而取得。
另外,对于各种基因序列数据库,检索与序列号1~8、17、37和38中的任一个编码氨基酸序列的DNA的碱基序列具有75%以上、优选85%以上、更优选90%以上、进一步优选95%以上、特别优选98%以上同源性的序列,根据通过该检索得到的碱基序列,使用上述的方法由具有该碱基序列的生物的染色体DNA、cDNA文库等也可以取得可用于本发明的DNA。
取得的DNA可以直接、或用适当的限制酶等进行酶切,通过常规方法转运到载体,然后将得到的的重组DNA导入宿主细胞后,通过使用通常用的碱基序列解析方法、例如双脱氧法[Proc.Natl.Acad.Sci.,USA, 74,5463(1977)]或373A·DNA序列仪(Perkin-Elmer公司生产)等碱基序列分析仪进行分析,可以测定该DNA的碱基序列。
当测定碱基序列的结果发现取得的DNA为部分长时,通过使用该部分长DNA作为探针,对染色体DNA文库的Southern杂交法等可以取得全长DNA。
然后根据测定的DNA的碱基序列,通过使用PerSeptiveBiosystems公司制备的8905型DNA合成仪进行化学合成,也可以制备目的DNA。
作为象上述那样取得的DNA,例如具有序列号9~16、36、39或者40表示的碱基序列的DNA。
作为本发明的制备方法中可使用的DNA重组的载体,如pBluescriptII KS(+)(Stratagene公司生产)、pDIRECT[NucleicAcids Res., 18,6069(1990)]、pCR-Script Amp SK(+)(Stratagene公司生产)、pT7Blue(Novagen公司生产)、pCR II(Invitrogen公司生产)和pCR-TRAP(Genhunter公司生产)等。
作为宿主细胞,如属于埃希氏菌属的微生物等。作为属于埃希氏菌属的微生物,例如大肠杆菌(Escherichia coli)XL1-Blue、大肠杆菌XL2-Blue、大肠杆菌DH1、大肠杆菌MC1000、大肠杆菌KY3276、大肠杆菌W1485、大肠杆菌JM109、大肠杆菌HB101、大肠杆菌No.49、大肠杆菌W3110、大肠杆菌NY49、大肠杆菌MP347、大肠杆菌NM522、大肠杆菌ME8415等。
作为重组DNA的导入方法,只要是将DNA导入到上述宿主细胞的方法,可以使用任一种方法,例如使用钙离子的方法[Proc.Natl.Acad.Sci.,USA, 69,2110(1972)]、原生质体法(特开昭63-248394)、电穿孔法[Nucleic Acids Res., 16,6127(1988)]等。
作为通过上述方法得到的带有可用于本发明的制备方法的DNA的微生物,例如带有含具有序列号1表示的碱基序列的DNA的重组DNA的微生物大肠杆菌NM522/pPE43。
4.可用于本发明的细胞的制备
(1)作为可用于本发明的细胞,可列举i)属于在染色体DNA上含有上述3的DNA的芽孢杆菌属的细菌,优选使用具有杆菌溶素合成活性的芽孢杆菌属的细菌,更优选选自属于枯草芽孢杆菌、解淀粉芽孢杆菌、凝结芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌和短小芽孢杆菌,进一步优选枯草芽孢杆菌ATCC15245、枯草芽孢杆菌ATCC6633、枯草芽孢杆菌IAM1213、枯草芽孢杆菌IAM1107、枯草芽孢杆菌IAM1214、枯草芽孢杆菌ATCC9466、枯草芽孢杆菌IAM1033、枯草芽孢杆菌ATCC21555、解淀粉芽孢杆菌IFO3022、短小芽孢杆菌NRRL B-12025的细菌;ii)属于在染色体DNA上含有上述3的DNA的链霉菌属的细菌、优选使用具有生产albonoursin能力的链霉菌属的细菌,更优选属于微白链霉菌和诺尔斯氏链霉菌中任一种类的细菌、进一步优选微白链霉菌IFO14147和诺尔斯氏链霉菌ATCC11455或者IFO15452中的细菌;iii)使用分子克隆第3版、Current Protocols in Molecular Biology等所述的方法等,例如通过以下的方法,通过将使用上述3的方法取得的DNA导入宿主细胞制备的转化体。
以本发明中使用的DNA作为基础,根据需要,制备含有可用于本发明的编码蛋白质的部分的适当长度的DNA片段。另外,通过置换碱基使编码该蛋白质的部分的碱基序列变成最适宿主表达的密码子,可以取得该蛋白质的产率提高的细胞。
通过将该DNA片段插入到适当的表达载体的启动子的下游,制作重组DNA。
通过将该重组DNA导入到适合该表达载体的宿主细胞,可以得到生产本发明的蛋白质的转化体。
作为宿主细胞,如原核生物和酵母等微生物的细胞、动物细胞、昆虫细胞、植物细胞等只要是可以表达目的基因的都可以使用,优选微生物、更优选原核生物、进一步优选细菌。
作为表达载体,使用可在上述宿主细胞自我复制或可转运到染色体中,在能够转录本发明的DNA或可用于本发明的制备方法中的DNA的位置含有启动子的载体。
使用细菌等原核生物作为宿主细胞时,含有本发明使用的DNA的重组DNA最好是可在原核生物中自我复制的同时,由启动子、核糖体结合序列、本发明的DNA或本发明的制备方法使用的DNA、转录终止序列构成的重组DNA。也可以含有调控启动子的基因。
作为表达载体,例如pBTrp2、pBTac1、pBTac2(都是BoehringerMannheim公司生产)、pHelix1(Roche Diagnostics公司生产)、pKK233-2(Amersham Pharmacia Biotech公司生产)、pSE280(Invitrogen公司生产)、pGEMEX-1(Promega公司生产)、pQE-8(Qiagen公司生产)、pET-3(Novagen公司生产)、pKYP10(特开昭58-110600)、pKYP200[Agric.Biol.Chem., 48,669(1984)]、pLSA1[Agric.Biol.Chem., 53,277(1989)]、pGEL1[Proc.Natl.Acad.Sci.,USA, 82,4306(1985)]、pBluescriptII SK(+)、pBluescript II KS(-)(Stratagene公司生产)、pTrS30[由大肠杆菌JM109/pTrS30(FERM BP-5407)制备]、pTrS32[由大肠杆菌JM109/pTrS32(FERM BP-5408)制备]、pPAC31(WO98/12343)、pUC19[Gene, 33,103(1985)]、pSTV28(Takara Bio公司生产)、pUC118(Takara Bio公司生产)、pPA1(特开昭63-233798)、pWH1520(MoBiTec社制)、pCS299P(WO 00/63388)、pVLT31[Gene, 123,17(1993)]和pIJ702(Genetic Manipulation of Streptomyces:aLaboratory Manual:John Innes Foundation)等。
作为启动子只要是可在大肠杆菌等宿主细胞内发挥功能的,无论那一种都可以,例如 trp启动子(Ptrp)、 lac启动子(Plac)、PL启动子、PR启动子、PSE启动子等来自大肠杆菌或噬菌体等的启动子、SPO1启动子、SPO2启动子、penP启动子等。也可以使用人为设计使Ptrp改变为两个串联的启动子、 tac启动子、lacT7启动子、letI启动子那样的启动子等。
另外也可以使用用于在属于杆菌属的微生物中表达的 xylA启动子[Appl.Microbiol.Biotechnol., 35,594-599(1991)]、用于在属于棒杆菌(Corynebacterium)属的微生物中表达的P54-6启动子[Appl.Microbiol.Biotechnol., 53,674-679(2000)]、用于在属于假单孢菌属的微生物中表达的tac启动子[Gene, 123,17-24(1993)]、用于在属于链霉菌属的微生物中表达的xylA启动子(Genetic Manipulation of Streptomyces:a LaboratoryManual:John Innes Foundation)等。
最好是使用将作为核糖体结合序列的Shine-Dalgarno序列与起始密码子之间调节到适当的距离(例如6~18碱基)的质粒。
在使本发明的制备方法中使用的DNA与表达载体结合的重组DNA中,不一定需要转录终止序列,但最好是在紧靠结构基因的下面配置转录终止序列。
作为这样的重组DNA,例如pPE43。
作为原核生物,如属于埃希氏菌属、沙雷氏菌( Serratia)属、杆菌属、短杆菌( Brevibacterium)属、棒杆菌( Corynebacterium)属、微杆菌属( Microbacterium)、假单胞菌( Pseudomonas)属、土壤杆菌( Agrobacterium)属、脂环酸杆菌属( Alicyclobacillus)、鱼腥蓝细菌( Anabaena)属、组囊蓝细菌( Anacvstis)属、节杆菌( Arthrobacter)属、固氮菌( Azotobacter)属、着色菌( Chromatium)属、欧文氏菌( Erwinia)属、甲基杆菌( Methylobacterium)属、席蓝细菌( Phormidium)属、红细菌( Rhodobacter)属、红假单胞菌( Rhodopseudomonas)属、红螺菌( Rhodospirillum)属、栅藻( Scenedesmus)属、链霉菌( Streptomyces)属、聚球蓝细菌( Synechoccus)属、发酵单胞菌( Zymomonas)属等的微生物,例如,大肠杆菌XL1-Blue,大肠杆菌XL2-Blue,大肠杆菌DH1,大肠杆菌DH5α,大肠杆菌MC1000,大肠杆菌KY3276,大肠杆菌W1485,大肠杆菌JM109,大肠杆菌HB101,大肠杆菌No.49,大肠杆菌W3110,大肠杆菌NY49,大肠杆菌MP347,大肠杆菌NM522,杆草芽孢杆菌ATCC33712,巨大芽孢杆菌,芽孢杆菌属(Bacillussp.)种FERM BP-6030,、解淀粉芽孢杆菌( Bacillus  amyloliquefaciens)、凝结芽孢杆菌( Bacilluscoagulans)、地衣芽孢杆菌( Bacillus  licheniformis)、短小芽孢杆菌( Bacillus  pumilus)、产氨短杆菌( Brevibacterium ammoniagenes)、未成熟短杆菌(Brevibacterium immariophilum)ATCC14068,解糖短杆菌(Brevibacterium saccharolyticum)ATCC14066,黄色短杆菌(Brevibacterium flavum)ATCC14067,产乳酸棒杆菌(Brevibacterium lactofermentum)ATCC13869,谷氨酸棒杆菌(Corynebacterium glutamicum)ATCC13032,谷氨酸棒杆菌ATCC14297,嗜乙酰乙酸棒杆菌(Corynebacterium acetoacidophilum)ATCC13870,嗜氨微杆菌(Microbacterium ammoniaphilum)ATCC15354,无花果沙雷氏菌(Serratia ficaria),居泉沙雷氏菌(Serratiafonticola),液化沙雷氏菌(Serratia liquefaciens),粘质沙雷氏菌(Serratia marcescens),假单胞菌属种(Pseudomonas sp.)D-0110,放射形土壤杆菌(Agrobacterium radiobacter),发根土壤杆菌(Agrobacterium rhizogenes),悬钩子土壤杆菌(Agrobacteriumrubi),柱孢鱼腥蓝细菌(Anabaena cylindrica),桶形鱼腥蓝细菌(Anabaena doliolum),水华鱼腥蓝细菌(Anabaena flos-aquae),金黄节杆菌(Arthrobacter aurescens),柠檬节杆菌(Arthrobactercitreus),球形节杆菌(Arthrobacter globformis),Arthrobacterhydrocarbonglutamicus,迈索尔节杆菌(Arthrobacter mysorens),烟草节杆菌(Arthrobacter nicotianae),石蜡节杆菌(Arthrobacterparaffineus),原玻璃蝇节杆菌(Arthrobacter protophormiae),玫瑰色石蜡节杆菌(Arthrobacter roseoparaffinus),硫磺节杆菌(Arthrobacter sulfureus),产脲节杆菌(Arthrobacterureafaciens),巴氏着色菌(Chromatium buderi),微温着色菌(Chromatium tepidum),酒色着色菌(Chromatium vinosum),沃氏着色菌(Chromatium warmingii),Chromatium fluviatile,噬夏孢欧文氏菌(Erwinia uredovora),胡萝卜软腐欧文氏菌(Erwiniacarotovora),菠萝欧文氏菌(Erwinia ananas),草生欧文氏菌(Erwinia herbicola),Erwinia punctata,Erwinia terreus,罗得西亚甲基杆菌(Methylobacterium rhodesianum),扭脱甲基杆菌(Methylobacterium extorquens),席蓝细菌属种(Phormidiums p.)ATCC29409,荚膜红细菌(Rhodobacter capsulatus),类球红细菌(Rhodobacter sphaeroides),生芽红假单胞菌(Rhodopseudomonas blastica),海红菌(Rhodopseudomonas marina),血色红假单孢菌(Rhodopseudomonas palustris),深红红螺菌(Rhodospirillum rubrum),需盐红螺菌(Rhodospirillumsalexigens),盐场红螺菌(Rhodospirillum salinarium),产二素链霉菌(Streptomyces ambofaciens),金霉素链霉菌(Streptomycesaureofaciens),金色链霉菌(Streptomyces aureus),杀真菌素链霉菌(Streptomyces fungicidicus),灰产色链霉菌(Streptomycesgriseochromogenes),灰色链霉菌(Streptomyces griseus),浅青紫链霉菌(Streptomyces lividans),橄榄灰链霉菌(Streptomycesolivogriseus),枝链霉菌(Streptomyces rameus),田无链霉菌(Streptomyces tanashiensis),酒红链霉菌(Streptomyces vinaceus)和运动发酵单胞菌(Zymomonas mobilis)等。作为理想的原核生物,如属于埃希氏菌属、沙雷氏菌属、杆菌属、短杆菌属、棒杆菌属、假单孢菌属或链霉菌属等的细菌、例如上述的属于埃希氏菌属、沙雷氏菌属、杆菌属、短杆菌属、棒杆菌属、假单孢菌属或链霉菌属等细菌,作为更理想的细菌,如大肠杆菌、谷氨酸棒杆菌、产氨棒杆菌、乳酸发酵棒杆菌、黄色棒杆菌、Corynebacterium efficiens、枯草芽孢杆菌、巨大芽孢杆菌、粘质沙雷氏菌、恶臭假单胞菌、铜绿假单胞菌、天蓝色链霉菌或浅青紫链霉菌,特别优选大肠杆菌。
作为重组DNA的导入方法,只要是将DNA导入到上述宿主细胞的方法,可以使用任一种方法,例如使用钙离子的方法[Proc.Natl.Acad.Sci.,USA, 69,2110(1972)]、原生质体法(特开昭63-248394)、电穿孔法[Nucleic Acids Res., 16,6127(1988)]等。
当使用酵母菌株作为宿主细胞时,作为表达载体可以使用例如YEp13(ATCC37115)、YEp24(ATCC37051)、YCp50(ATCC37419)、pHS19、pHS15等。
作为启动子,只要是在酵母菌株中发挥作用的启动子,可以使用任一种,例如PHO5启动子、PGK启动子、GAP启动子、ADH启动子、gal1启动子、gal10启动子、热休克多肽启动子、MFα1启动子、CUP1启动子等启动子。
作为宿主细胞,如属于酵母( Saccharomyces)属、裂殖酵母( Schizosaccharomyces)属、克鲁维酵母( Kluyveromyces)属、丝孢酵母( Trichosporon)属、许旺酵母( Schwanniomyces)属、毕赤酵母( Pichia)属、或假丝酵母( Candida)属等的酵母菌株,具体的例如酿酒酵母( Saccharomyces  cerevisiae)、粟酒裂殖糖酵母( Schizosaccharomyces  pombe)、乳克鲁维氏酵母( Kluyveromyces lactis)、茁芬丝孢酵母( Trichosporon  pullulans)、河岸许旺氏酵母( Schwanniomyces  alluvius)、巴斯德毕赤氏酵母( Pichia pastoris)、产朊假丝酵母( Candida  utilis)等。
作为重组DNA的导入方法,只要是将DNA导入酵母的方法,可以使用任一种,例如电穿孔法[Methods Enzymel., 194,182(1990)]、原生质体法[Proc.Natl.Acad.Sci.,USA, 81,4889(1984)]、乙酸锂法[J.Baeteriol., 153,163(1983)]等。
当使用动物细胞作为宿主时,作为表达载体,可以使用例如pcDNAI、pcDM8(由Funakoshi公司销售)、pAGE107(特开平3-22979)、pAS3-3(特开平2-227075)、pCDM8[Nature, 329,840(1987)]、pcDNAI/Amp(Invitrogen公司生产)、pREP4(Invitrogen公司生产)、pAGE103[J.Biochem, 101,1307(1987)]、pAGE210、pAMo、pAMoA等。
作为启动子,只要是在动物细胞中行使功能的,可以使用任一种,例如巨细胞病毒(CMV)的IE(immediate early)基因的启动子、SV40的初期启动子或金属硫因的启动子、逆病毒的启动子、热休克启动子、SRα启动子等。另外也可以将人CMV的IE基因的增强子与启动子一起使用。
作为宿主细胞,如小鼠骨髓瘤细胞、大鼠骨髓瘤细胞、小鼠杂交瘤细胞、人的细胞Namalwa细胞或Namalwa KJM-1细胞、人胎儿肾脏细胞、人白血病细胞、African green monkey肾脏细胞、中国仓鼠细胞的CHO细胞、HBT5637(特开昭63-299)等。
作为小鼠骨髓瘤细胞,如SP2/0、NSO等、作为大鼠骨髓瘤细胞,如YB2/0等、作为人胎儿肾脏细胞,如HEK293(ATCC CRL-1573)、作为人白血病细胞,如BALL-1等、作为African green monkey肾脏细胞,如COS-1、COS-7等。
作为重组DNA的导入方法,只要是可将DNA导入动物细胞的方法,可以使用任一种,例如电穿孔法[Cytotechnology, 3,133(1990)]、磷酸钙法(特开平2-227075)、脂质转染法[Proc.Natl.Acad.Sci.,USA, 84,7413(1987)]、Virology, 52,456(1973)所述的方法等。
当使用昆虫细胞作为宿主时,通过例如Baculovirus ExpressionVectors,A Laboratory Manual,W.H.Freeman and Company,NewYork(1992)、Current Protocols in Molecular Biology、MolecularBiology,A Laboratory Manual、Bio/Technology, 6,47(1988)等所述的方法可以生产蛋白质。
即,将重组基因导入载体和杆状病毒一起导入昆虫细胞,在昆虫细胞培养上清中得到重组病毒后,再使重组病毒感染昆虫细胞,可以生产蛋白质。
作为在该方法可使用的基因导入载体,例如pVL1392、pVL1393、pBlueBacIII(都是Invitrogen公司生产)等。
作为杆状病毒,可以使用例如感染夜盗蛾科昆虫的病毒Autographa californica nuclear polyhedrosis virus等。
作为昆虫细胞,可以使用 Spodoptera  frugiperda的卵巢细胞、Trichoplusia  ni的卵巢细胞、来自蚕卵巢的培养细胞等。
作为 Spodoptera  frugiperda的卵巢细胞,如Sf9、Sf21(杆状病毒表达载体实验手册)等、作为 Trichoplusia  ni的卵巢细胞,如High5、BTI-TN-5B1-4(Invitrogen公司生产)等、作为来自蚕卵巢的培养细胞,如 Bombyx  mori N4等。
作为用于制备重组病毒,将上述重组基因导入载体与上述杆状病毒一起导入昆虫细胞的导入方法,例如磷酸钙法(特开平2-227075)、脂质转染法[Proc.Natl.Acad.Sci.,USA, 84,7413(1987)]等。
当使用植物细胞作为宿主细胞时,作为表达载体,例如Ti质粒、烟草花叶病毒载体等。
作为启动子,只要是可在植物细胞中行使功能的,可以使用任一种,例如花椰菜花叶病毒(CaMY)的35S启动子、水稻肌动蛋白1启动子等。
作为宿主细胞,如烟草、马铃薯、西红柿、人参、大豆、油菜、紫花苜蓿、水稻、小麦、大麦等植物细胞等。
作为重组载体的导入方法,只要是可将DNA导入植物细胞的方法,可使用任一种,例如使用土壤杆菌( Agrobacterium)的方法(特开昭59-140885、特开昭60-70080、WO94/00977)、电穿孔法(特开昭60-251887)、使用基因枪(particlegun)的方法(日本专利第2606856、日本专利第2517813)等。
当通过酵母、动物细胞、昆虫细胞或植物细胞进行表达时,可以获得生产添加了糖或糖链的蛋白质的细胞。
(2)作为本发明的制备方法中使用的微生物,如在通过上述(1)的方法制备的微生物中,1种以上的肽酶和1种以上的具有肽转运活性的蛋白质(以下,略为肽转运蛋白质)的活性低下或丧失的微生物、或3种以上的肽酶的活性低下或丧失的微生物。
该微生物例如可以(a)通过上述(1)的方法赋予1种以上肽酶和1种以上肽转运蛋白质的功能低下或丧失的微生物、或3种以上肽酶的功能低下或丧失的微生物具有生产具有生成二肽活性的蛋白质能力或生产具有多磷酸激酶活性的蛋白质的能力的方法,或(b)使通过上述(1)的方法能够制备的具有生产具有生成二肽活性的蛋白质能力或生产具有多磷酸激酶活性的蛋白质能力的微生物的a)1种以上的肽酶和1种以上肽转运蛋白质、或b)3种以上肽酶的功能低下或丧失的方法等也可取得。
作为1种以上的肽酶和1种以上的肽转运蛋白质的活性低下或丧失的微生物,只要是该微生物能正常生长繁殖,如任意1种以上的肽酶和任意1种以上的肽转运蛋白质的活性低下或丧失的微生物,优选1种以上9种以下,更优选1种以上7种以下,再优选1种以上4种以下的肽酶的活性低下或丧失,而且优选1种以上5种以下,更优选1种以上3种以下,再优选1种以上2种以下,特别优选1种的肽转运蛋白质活性低下或丧失的微生物。
作为该微生物,更具体讲,在该微生物的基因组DNA上存在的编码肽酶的基因(以下,略为肽酶基因)和编码肽转运蛋白质的基因(以下,略为肽转运蛋白质基因)中,如在1种以上的肽酶基因的碱基序列和1种以上肽转运蛋白质基因的碱基序列中,由于缺失该碱基序列的全部或一部,或由于在该碱基序列中存在碱基的置换或添加,该肽酶和该肽转运蛋白质的活性低下或丧失的微生物。
所谓肽酶的活性低下指的是与上述的碱基没有缺失、置换或添加的基因编码的肽酶相比,肽分解活性变低,通常低至80%以下,优选50%以下,更优选30%以下,再优选20%以下,特别优选10%以下,最好优选5%以下。
微生物的肽分解活性可以使作为底物的肽和微生物菌体在水性介质中共存,进行肽分解反应后,通过众所周知的方法、例如使用HPLC等的分析法对残存的肽量进行定量测定。
作为上述肽酶,只要是具有肽分解活性的蛋白质就可以,优选二肽分解活性高的蛋白质、更优选二肽酶。
作为更具体的肽酶,例如存在于大肠杆菌的具有序列号43表示的氨基酸序列的PepA、具有序列号44表示的氨基酸序列的PepB、具有序列号45表示的氨基酸序列的PepD、具有序列号46表示的氨基酸序列的PepN、PepP[GenBank accession no.(以下,略为GenBank)AAC75946]、PepQ(GenBank AAC76850)、PepE(GenBank AAC76991)、PepT(GenBank AAC74211)、Dcp(GenBank AAC74611)和IadA(GenBankAAC77284)等、存在于枯草芽孢杆菌的AmpS(GenBank AF012285)、PepT(GenBank X99339)、YbaC(GenBank Z99104)、YcdD(GenBankZ99105)、YjbG(GenBank Z99110)、YkvY(GenBank Z99111)、YqjE(GenBank Z99116)、YwaD(GenBank Z99123)等、存在于谷氨酸棒杆菌的具有BAB97732、BAB97858、BAB98080、BAB98880、BAB98892、BAB99013、BAB99598和BAB99819(都是日本DNA数据库的登录号)表示的氨基酸序列的蛋白质等,作为二肽酶,如具有序列号43~46表示的氨基酸序列的PepA、PepB、PepD和PepN、以及PepQ、PepE、IadA。另外与序列号43~46中的任一个氨基酸序列具有80%以上、优选90%以上、更优选95%以上同源性,而且具有肽酶活性的蛋白质也可以作为二肽分解活性高的蛋白质。氨基酸序列或碱基序列的同源性可以使用上述的BLAST和FASTA等测定。
而所谓肽转运蛋白质的活性低下指的是与由上述的没有缺失、置换或添加碱基的基因编码的肽转运蛋白质相比,肽转运活性变低,通常指的是降低到80%以下,优选50%以下,更优选30%以下,再优选20%以下,特别优选10%以下,最好优选5%以下。
微生物的肽转运活性可以通过使作为底物的肽和微生物菌体共存于水性介质中进行肽转运反应后,利用众所周知的方法,例如使用HPLC等分析法对残存于水性介质中的肽量进行定量进行测定。
上述肽转运蛋白质是由染色体DNA上形成操纵子的基因编码的蛋白质,只要是在细胞膜上形成复合体后表达肽转运活性的蛋白质,以及作为单独的蛋白质具有肽转运活性的蛋白质等参与微生物的肽转运的任一种蛋白质都可以,优选二肽转运活性高的蛋白质。
作为更具体的肽转运蛋白质,例如存在于大肠杆菌的具有序列号47表示的氨基酸序列的DppA、具有序列号48表示的氨基酸序列的DppB、具有序列号49表示的氨基酸序列的DppC、具有序列号50表示的氨基酸序列的DppD、具有序列号51表示的氨基酸序列的DppF、OppA(GenBank AAC76569)、OppB(GenBank AAC76568)、OppC(GenBankAAC76567)、OppD(GenBank AAC76566)、OppF(GenBank AAC76565)、YddO(GenBank AAC74556)、YddP(GenBank AAC74557)、YddQ(GenBankAAC745 58)、YddR(GenBank AAC74559)、YddS(GenBank AAC74560)、YbiK(GenBank AAC73915)、MppA(GenBank AAC74411)、SapA(GenBankAAC74376)、SapB(GenBank AAC74375)、SapC(GenBank AAC74374)、SapD(GenBank AAC4373)、和SapF(GenBank AAC74372)等、存在于枯草芽孢杆菌的DppA(GenBank CAA40002)、DppB(GenBank CAA40003)、DppC(GenBank CAA40004)、DppD(GenBank CAA40005)、DppE(GenBankCAA40006)、OppA(GenBank CAA39787)、OppB(GenBank CAA39788)、OppC(GenBank CAA39789)、OppD(GenBank CAA39790)、OppF(GenBankCAA39791)、AppA(GenBank CAA62358)、AppB(GenBank CAA62359)、AppC(GenBank CAA62360)、AppD(GenBank CAA62356)、AppF(GenBankCAA62357)、YclF(GenBank CAB12175)和YkfD(GenBank CAB13157)等、存在于谷氨酸棒杆菌的具有BAB99048、BAB99383、BAB99384、BAB99385、BAB99713、BAB99714、BAB99715、BAB99830、BAB99831、BAB99832(都是日本DNA数据库的登录号)表示的氨基酸序列的蛋白质等,另外作为肽转运活性高的蛋白质,如具有序列号47~51表示的氨基酸序列的DppA、DppB、DppC、DppD、DppF和与它们中的任一个表示的氨基酸序列具有80%以上、优选90%以上、更优选95%以上同源性的蛋白质也可作为肽转运活性高的肽转运蛋白质。
上述氨基酸序列的同源性可以使用上述的BLAST或FASTA等程序测定。
作为3种以上肽酶的活性低下或丧失的微生物,只要是该微生物能正常生长繁殖,如任意3种以上肽酶的活性低下或丧失的微生物,优选3种以上9种以下,更优选3种以上6种以下,再优选3种或4种肽酶的活性低下或丧失的微生物。
作为具体的肽酶,如存在于上述的大肠杆菌、枯草芽孢杆菌和谷氨酸棒杆菌的肽酶和二肽酶。而由与序列号43~46中的任一个氨基酸序列有80%以上、优选90%以上、更优选95%以上同源性的氨基酸序列构成、而且具有肽酶活性的蛋白质也可以作为二肽分解活性高的蛋白质。
上述氨基酸序列的同源性可以使用上述的BLAST或FASTA等程序测定。
肽酶和肽转运蛋白质的活性低下或丧失的微生物只要是能够取得该微生物的方法,其取得方法没有限制,例如通过在以下所示的微生物的染色体DNA的肽酶基因或肽转运蛋白质基因导入碱基的缺失、置换或添加的方法可以取得。
作为在微生物的染色体DNA的基因导入碱基缺失、置换或添加的方法,如利用同源重组的方法。作为利用一般的同源重组的方法,如使用将导入了碱基缺失、置换或添加的突变基因与在希望导入碱基缺失等的宿主细胞内含有不能自我复制的抗药(性)基因的质粒DNA连接制作的同源重组用质粒的方法。
通过常规方法将该同源重组用质粒导入宿主细胞后,以抗药(性)作为指标选择通过同源重组在染色体DNA上转运了该同源重组用质粒的转化株。通过将得到的转化株于不含有该药物的培养基中培养数小时~1天后,涂布于含有该药物的琼脂培养基和不含有该药物的琼脂培养基,选择在前者培养基中不生长发育,而在后者培养基能够繁殖株,可以取得在染色体DNA上发生第2次同源重组的株。通过测定染色体DNA上的导入了缺失等的基因存在区域的碱基序列,可以确认染色体DNA上目的基因中导入了碱基的缺失、置换或添加。
作为能够通过上述方法在染色体DNA上的目的基因导入碱基的缺失、置换或添加的微生物,例如属于埃希氏菌属、杆菌属或棒杆菌属的微生物。
而作为利用同源重组向多个基因有效导入碱基的缺失、置换或添加的方法,如使用直链DNA的方法。
具体来说,是使含有希望导入碱基缺失、置换或添加的基因的直链DNA转运到细胞内,在染色体DNA与导入的直链DNA之间发生同源重组的方法。本方法只要是可有效转运直链DNA的微生物,也可以适用于任一种微生物,作为理想的微生物,如属于埃希氏菌属或杆菌属的微生物、更优选大肠杆菌、再优选表达来自λ噬菌体的重组蛋白质组(Red重组系)的大肠杆菌。
作为表达λRed重组系的大肠杆菌,如带有含λRed重组系基因的质粒DNA pKD46[可从大肠杆菌基因储备中心(美国耶鲁大学)获得]的大肠杆菌JM101株等。
作为可用于同源重组的DNA,如
(a)在抗药(性)基因的两端含有与位于作为碱基的缺失、置换或添加的导入对象的染色体DNA上区域两端外侧的DNA具有同源性的DNA的直链DNA、
(b)直接连接了与位于作为碱基的缺失、置换或添加的导入对象的染色体DNA上区域两端外侧的DNA具有同源性的DNA的直链DNA、
(c)在具有抗药(性)基因和能够用于负选择的基因的DNA的两端处含有与位于作为碱基的缺失、置换或添加的导入对象的染色体DNA上区域的两端外侧的DNA具有同源性的DNA的直链DNA、
(d)在上述(a)的直链DNA中,在位于抗药(性)基因和与位于染色体DNA上的区域的两端外侧的DNA具有同源性的DNA之间,还含有来自酵母的Flp重组酶〔Proc.Natl.Acad.Sci.USA., 82,5875(1985)〕识别的碱基序列的DNA。
作为抗药(性)基因,只要是对于宿主微生物表现出敏感性的药物,赋予抗药(性)的抗药(性)基因,也可以使用任一种抗药(性)基因。作为宿主微生物使用大肠杆菌时,作为抗药(性)基因,例如,卡那霉素抗性基因、氯霉素抗性基因、庆大霉素抗性基因、大观霉素抗性基因、四环素抗性基因和氨苄青霉素抗性基因等。
所谓能够用于负选择的基因指的是当在宿主微生物中使该基因表达时,在一定培养条件下,使该微生物致死的基因,作为该基因,例如来自属于杆菌属的微生物的 sacB基因〔Appl.Environ.Microbiol., 59,1361-1366(1993)〕、和来自属于埃希氏菌属的微生物的 rpsL基因〔Genomics, 72,99-104(2001)〕等。
与存在于上述的直链DNA的两末端的、位于成为染色体DNA上置换或缺失的导入对象的区域两端外侧的DNA具有同源性的DNA,在直链DNA中被配置在与染色体DNA上的方向相同的方向,其长度优选10bp~100bp左右,更有效优选bp~50bp左右、进一步优选30~40bp左右。
所谓来自酵母的Flp重组酶识别的碱基序列只要是该蛋白质识别、催化同源重组的碱基序列,没有特别限定,优选具有序列号64表示的碱基序列的DNA、和具有在该DNA中缺失、置换或添加了1个~数个碱基的碱基序列、而且来自酵母的Flp重组酶识别、催化同源重组的碱基序列的DNA。
所谓具有同源性是上述直链DNA在染色体DNA上的目的区域具有同源重组发生程度的同源性,作为具体的同源性,如80%以上、优选90%以上、更优选95%以上、再优选100%的同源性。
上述碱基序列的同源性可以使用上述的BLAST或FASTA等程序测定。
上述直链DNA片段可以通过PCR制作。另外在质粒上构建了含有上述直链DNA的DNA后,经限制酶处理也可以得到目的直链DNA。
作为在微生物的染色体DNA中导入碱基的缺失、置换或添加的方法,如以下的方法1~4。
方法1:将上述(a)或(d)的直链DNA导入宿主微生物,以抗药(性)为指标选择通过同源重组该直链DNA被插入到染色体DNA上的转化株的方法。
方法2:向通过上述方法1取得的转化株导入上述(b)的直链DNA,通过消除经该方法插入到染色体DNA上的药物基因,使微生物的染色体DNA上的区域置换或缺失的方法。
方法3:
[1]将上述(c)的直链DNA导入宿主微生物,以抗药(性)为指标选择通过同源重组该直链DNA被插入到染色体DNA上的转化株、
[2]合成在与染色体DNA上的方向同一方向连接了与位于作为染色体DNA上的置换或缺失对象区域两端外侧的DNA具有同源性的DNA的DNA,导入到上述[1]中得到的转化株,
[3]在可用于负选择的基因表达的条件下,对进行了上述[2]操作的转化株进行培养,选择在该培养条件下可生长繁殖的株作为从染色体DNA上削除抗药(性)基因和可用于负选择的基因的菌株的方法。
方法4:
[1]将上述(d)的直链DNA导入宿主微生物,以抗药(性)为指标选择通过同源重组该直链DNA被插入到染色体DNA上的转化株、
[2]向上述[1]中得到的转化株导入Flp重组酶基因表达质粒,使该基因表达后,取得对上述[1]中使用的药物有敏感性的菌株的方法。
作为将在上述方法中使用的直链DNA导入宿主微生物的方法,只要是将DNA导入该微生物的方法,可以使用任一种方法,例如使用钙离子的方法〔Proc.Natl.Acad.Sci.,USA, 69,2110(1972)〕、原生质体法(特开昭63-248394)、电穿孔法〔Nucleic Acids Res., 16,6127(1988)〕等。
通过使用转运希望插入到在方法2或方法3[2]中使用的直链DNA中的该DNA的中央部附近染色体DNA上的任意基因的直链DNA,在削除抗药(性)基因等的同时,可以将任意基因插入到染色体DNA上。
就上述方法2~4来说,由于是在最终得到的转化株的染色体DNA上不保留抗药(性)基因和可用于负选择的基因等外来基因的方法,所以通过使用同一抗药(性)基因和可用于负选择的基因,反复进行该方法的操作,容易制备在染色体DNA上的位置不同的2个以上区域带有碱基的缺失、置换或添加的微生物。
5.可用于本发明的蛋白质的制备
可以通过将用上述4的方法得到的转化体在培养基中进行培养,使可用于本发明的蛋白质在培养物中生成、蓄积,从该培养物收集该蛋白质,制备该蛋白质。
作为用于制备可用于本发明的蛋白质的上述转化体的宿主,可以是原核生物和酵母等微生物、动物细胞、昆虫细胞等或植物细胞等中的任一种,优选微生物、更优选原核生物、进一步优选细菌、特别优选属于埃希氏菌属的细菌、最好优选大肠杆菌。
将上述转化体在培养基中进行培养的方法可以根据宿主细胞的培养中使用的通常的方法进行。
将大肠杆菌等原核生物和酵母等真核生物作为宿主细胞,对得到的微生物的转化体进行培养的培养基,只要是含有该微生物可利用的碳源、氮源、无机盐类等、可有效进行转化体的培养的培养基,可以使用天然培养基、合成培养基中的任一种。
作为碳源,只要是该微生物可利用的就可以,可以使用葡萄糖、乳糖、蔗糖、含有这些糖的糖蜜、淀粉或淀粉水解物等碳水化合物、醋酸、丙酸等有机酸、乙醇、丙醇等醇类等
作为氮源可以使用氨、氯化铵、硫酸铵、醋酸铵、磷酸铵等无机酸或有机酸的铵盐、其它的含氮化合物、以及胨、肉提取物、酵母提取物、玉米浸渍液、酪蛋白水解物、大豆粕和大豆粕水解物、各种发酵菌体和其它消化物等。
作为无机盐,可以使用磷酸二氢钾、磷酸氢二钾、磷酸镁、硫酸镁、氯化钠、硫酸亚铁、硫酸锰、硫酸铜、碳酸钙等。
培养在通常振荡培养或深部通气搅拌培养等好氧条件下进行。培养温度为15~40℃比较好、培养时间通常为5小时~7日间。培养中pH保持3.0~9.0。pH的调整使用无机或有机的酸、碱性溶液、尿素、碳酸钙、氨等进行。
另外根据培养中需要,也可以向培养基中添加氨苄青霉素或四环素等抗生素。
当对用使用诱导性的启动子作为启动子的表达载体转化的微生物进行培养时,根据需要,也可以向培养基中添加诱导物。例如,对用使用lac启动子的表达载体转化的微生物进行培养时,可以添加异丙基-β-D-硫代半乳糖苷等,当用使用 trp启动子的表达载体转化的微生物进行培养时,也可以向培养基添加吲哚丙烯酸等。
作为对以动物细胞作为宿主得到的转化体进行培养的培养基,可以使用一般使用的RPMI1640培养基[J.Am.Med.Assoc., 199,519(1967)]、Eagle的MEM培养基[Science, 122,501(1952)]、DMEM培养基[Virology, 8,396(1959)]、199培养基[Proc.Soc.Biol.Med., 73,1(1950)]或在这些培养基中添加了胎牛血清等的培养基等。
培养通常在pH6~8、25~40℃、5%CO2存在下等的条件下进行1~7天。
另外根据培养中需要,也可以在培养基中添加卡那霉素、青霉素、链霉素等抗生素。
作为对以昆虫细胞作为宿主得到的转化体进行培养的培养基,可以使用一般使用的TNM-FH培养基(PharMingen公司生产)、Sf-900IISFM培养基(Life Technologies公司生产)、ExCell400、ExCell405[都是JRH BIOSCIENCES公司生产]、Grace′s Insect Medium[Nature, 195,788(1962)]等。
培养通常在pH6~7、25~30℃等的条件下进行1~5天。
另外根据培养中需要,也可以在培养基中添加庆大霉素等抗生素。
以植物细胞作为宿主得到的转化体,可以以细胞的形式,或使其分化为植物的细胞或器官后培养。作为培养该转化体的培养基,可以使用通常使用的Murashige-Skoog(MS)培养基、White培养基、或向这些培养基中添加了生长素、细胞激动素等植物激素的培养基等。
培养通常在pH5~9、20~40℃条件下进行3~60天。
另外根据培养中需要,也可以在培养基中添加卡那霉素、潮霉素等抗生素。
如上所述,可以根据常规培养方法培养含有将用于本发明的DNA连接到表达载体的重组DNA的微生物、昆虫细胞、动物细胞或者来自植物细胞的转化子,生成、蓄积用于本发明的蛋白质,从该培养物收集该蛋白质,制备该蛋白质。
作为本发明中可使用的蛋白质的生产方法,有使蛋白质在宿主细胞内生产的方法、分泌到宿主细胞外的方法、或在宿主细胞外膜上生产的方法,可以根据使用的宿主细胞不同和使生产的蛋白质的构造发生不同变化选择上述方法。
当本发明中使用的蛋白质在宿主细胞内或宿主细胞外膜上生产时,通过利用Paulson等人的方法[J.Biol.Chem., 264,17619(1989)]、Lowe等人的方法[Proc.Natl.Acad.Sci.,USA, 86,8227(1989)、Genes Develop., 4,1288(1990)]、或特开平05-336963、WO94/23021等所述的方法,可以使该蛋白质有效地分泌在宿主细胞外。
即,通过使用基因重组的手法,以在紧接在含有本发明使用的蛋白质的活性部位的蛋白质前面添加信号肽的形式使该蛋白质生产,可以有效地使该蛋白质分泌到宿主细胞外。
另外根据特开平2-227075所述的方法,利用使用了二氢叶酸还原酶基因等的基因扩增系也可以使产量上升。
另外,通过使导入基因的动物或植物的细胞再分化,制备导入了基因的动物个体(转基因非人动物)或植物个体(转基因植物),使用这些个体也可以制备本发明的蛋白质。
当生产本发明使用的蛋白质的转化体为动物个体或植物个体时,根据通常的方法,通过进行饲养或栽培使该蛋白质生成、蓄积,从该动物个体或植物个体收集该蛋白质,可以制备该蛋白质。
作为使用动物个体制备可用于本发明的蛋白质的方法,例如根据众所周知的方法[Am.J.Clin.Nutr., 63,639S(1996)、Am.J.Clin.Nutr., 63,627S(1996)、Bio/Technology, 9,830(1991)]在导入基因制备的动物中生产该蛋白质的方法。
对于动物个体的情况,例如通过对导入本发明使用的DNA的转基因的非人动物进行饲养,使可用于本发明的蛋白质在该动物中生成、蓄积,从该动物中收集该蛋白质,可以制备该蛋白质。作为该动物中使该蛋白质生成、蓄积的场所,例如该动物的奶(特开昭63-309192)、卵等。作为此时可使用的启动子,只要是可在动物中行使功能的启动子,可以使用任一个,最好使用例如乳腺细胞特异的启动子α酪蛋白启动子、β酪蛋白启动子、β乳球蛋白启动子、乳清酸性蛋白启动子等。
作为使用植物个体制备本发明的蛋白质的方法,例如根据众所周知的方法[组织培养, 20(1994)、组织培养, 21(1995)、TrendsBiotechnol., 15,45(1997)]通过对导入了编码可用于本发明的蛋白质的DNA的转基因植物进行栽培,使该蛋白质在该植物中生成、蓄积,从该植物中收集该蛋白质,生产该蛋白质的方法。
作为对使用生产可用于本发明的蛋白质的转化体制备的该蛋白质进行分离纯化的方法,可以使用通常的酶的分离纯化法。
例如,当可用于本发明的蛋白质以在细胞内溶解状态生产时,培养结束后,通过对细胞离心分离,进行收集,悬浮于水系缓冲液后,通过超声波破碎机、弗氏细胞压碎器、Manton-Gaulin匀浆器、Dynomill等将细胞破碎,得到无细胞提取液。
从通过对该无细胞提取液离心分离得到的上清通过单独或组合使用通常的酶的分离纯化法、速溶剂提取法、通过硫铵等的盐析法、脱盐法、通过有机溶剂的沉淀法、使用二乙氨基乙基(DEAE)-纤维素、DIAION HPA-75(三菱化成公司生产)等树脂的阴离子交换层析法、使用S-Sepharose FF(Pharmacia公司生产)等树脂的阳离子交换层析法、使用丁基纤维素、苯基纤维素等的树脂的疏水层析法、使用分子筛的凝胶过滤法、亲和层析法、层析聚集法、等电聚焦电泳等的电泳法等的手法,可以得到纯化标准品。
另外当该蛋白质以在细胞内形成包涵体形式生产时,同样收集细胞进行破碎,使用通常的方法从通过离心分离得到的沉淀级分收集该蛋白质后,将该蛋白质的包涵体用蛋白质变性剂溶化。将该溶化液稀释、或透析到不含有蛋白质变性剂或蛋白质变性剂的浓度稀到蛋白质不变性的程度的溶液,使该蛋白质构成正常的立体构造后,通过与上述同样的分离纯化法可以得到纯化标准品。
当可用于本发明的蛋白质或其糖修饰体等衍生物分泌到细胞外时,可以在培养上清收集该蛋白质或它的糖添加体等衍生物。
即,通过与上述同样的离心分离等手法对该培养物进行处理,取得可溶性级分,使用与上述同样的分离纯化法从该可溶性级分可以得到纯化标准品。
作为象上述那样取得的蛋白质,例如由序列号1~8、37和38中的任一个表示的氨基酸序列构成的蛋白质。
另外,当可用于本发明的蛋白质以与其它蛋白质的融合蛋白质形式生产时,利用使用对融合的蛋白质具有亲和性的物质的亲和层析也可以进行纯化。
作为使其融合的蛋白质,如β-半乳糖苷酶、蛋白A、蛋白A的免疫球蛋白G结合区域、氯霉素·转乙酰酶、聚(Arg)、聚(Glu)、蛋白G、麦芽糖结合蛋白质、谷胱甘肽S-转移酶、聚组氨酸链(His-tag)、S肽、DNA结合蛋白质结构域、Tac抗原、硫氧还蛋白、绿色荧光蛋白、FLAG肽、和任意的抗体的表位等〔山川彰夫,实验医学, 13,469-474(1995)〕。
作为对上述可用于融合的蛋白质具有亲和性的物质,如识别β-半乳糖苷酶、蛋白A、蛋白A的免疫球蛋白G结合区域、氯霉素·转乙酰酶、聚(Arg)、聚(Glu)、蛋白G、麦芽糖结合蛋白质、谷胱甘肽S-转移酶、聚组氨酸链(His-tag)、S肽、DNA结合蛋白质结构域、Tac抗原、硫氧还蛋白、绿色荧光蛋白、FLAG肽或任意抗体表位的抗体、例如免疫球蛋白G等。
具体来讲,当可用于本发明的蛋白质以与蛋白A的融合蛋白质进行生产时,根据Lowe等人的方法[Proc.Natl.Acad.Sci.,USA, 86,8227(1989)、Genes Develop., 4,1288(1990)]、特开平5-336963、WO94/23021所述的方法等,当以与Flag肽的融合蛋白质形式生产时,根据Proc.Natl.Acad.Sci.,USA, 86,8227(1989)、Genes Develop.,4,1288(1990)等所述的方法可以纯化融合蛋白质。另外也可以通过使用对该蛋白质自身的抗体的亲和层析进行纯化。
以上述取得的蛋白质的氨基酸序列情报为基础通过Fmoc法(9-笏甲氧羰基法)、tBoc法(t-丁氧羰基法)等化学合成法可以制备本发明的蛋白质。另外也可以利用Advanced ChemTech社、Perkin-Elmer公司、Pharmacia社、Protein Technology Instrument社、Synthecell-Vega社、PerSeptive社、岛津制作所等肽合成仪进行化学合成。
6.本发明的二肽衍生物的制备方法
(1)酶促制备法
作为二肽衍生物的酶促制备方法,可列举:i)二肽或二肽衍生物(PI)的制备方法,其特征在于:使上述1的蛋白质、1种以上的氨基酸或者氨基酸衍生物和ATP在水性溶液中共存,使二肽或二肽衍生物(PI)在该水性介质中生成、蓄积,从该水性介质收集该二肽或二肽衍生物(PI);和ii)二肽或二肽衍生物(PII)的制备方法,其特征在于:使上述1的蛋白质、1种以上的氨基酸或氨基酸衍生物和ATP在水性介质中共存,使二肽或二肽衍生物(PI)在该水性介质中生成、蓄积,直接进行修饰或从该水性介质收集该二肽或二肽衍生物(PI)后对该二肽或二肽衍生物(PI)进行修饰,使二肽或二肽衍生物(PII)生成,收集该二肽或二肽衍生物(PII)。
通过众所周知的有机合成的手法等对二肽或二肽衍生物(PI)进行修饰可以制备二肽或二肽衍生物(PII)。
在上述制备方法中,用作底物的1种以上的氨基酸或氨基酸衍生物须要是成为上述1的蛋白质的底物的氨基酸或氨基酸衍生物,也可以使用任何氨基酸或氨基酸衍生物。
作为上述氨基酸或氨基酸衍生物,如式(I)
(式中、n1、R1a、R1b、R2a和R2b分别与上述同义),或式(II)
(式中、n2、R3a、R3b、R4和R5分别与上述同义)
表示的氨基酸或氨基酸衍生物[但当1种以上的氨基酸或氨基酸衍生物只是式(I)时,R1a和R1b中至少有一方是氢原子,当1种以上的氨基酸或氨基酸衍生物只是式(II)时,R5为羟基],
优选式(III)
Figure A20058002124500591
(式中、R1c、R1d、R2c和R2d分别与上述同义),或式(IV)
(式中、R3c、R3d和R5分别与上述同义)
表示的氨基酸或氨基酸衍生物[但当氨基酸或氨基酸衍生物只是式(III)时,R1c和R1d中至少有一方是氢原子,当氨基酸或氨基酸衍生物只是式(IV)时,R5为羟基],
更优选式(V)或式(VI)表示的氨基酸或氨基酸衍生物:
(式中、R2e与上述同义),
Figure A20058002124500601
(式中、R3e与上述同义)。
作为用上述制备方法制备的肽或二肽衍生物(PI),如式(VIIa)表示的二肽衍生物,
Figure A20058002124500602
(式中、n3a、n4a、R6a、R6b、R7a、R7b、R8a、R9a、R9b和R10a分别与上述同义)
优选式(VIIIa)表示的二肽衍生物,
Figure A20058002124500603
(式中、R6c、R6d、R7c、R7d、R9c、R9d和R10a分别与上述同义)
更优选式(IXa)表示的二肽衍生物。
Figure A20058002124500611
(式中、R7e和R9e分别与上述同义)
作为用上述制备方法制备的二肽或二肽衍生物(PII),如式(VIIb)表示的二肽衍生物,
Figure A20058002124500612
(式中、n3A、n4A、R6A、R6B、R7A、R7B、R8A、R9A、R9B和R10A分别与上述同义)
优选式(VIIIb)表示的二肽衍生物,
(式中、R6C、R6D、R7C、R7D、R9C、R9D和R10A分别与上述同义),更优选式(IXb)表示的二肽衍生物。
Figure A20058002124500621
(式中、R7E和R9E分别与上述同义)。
但该二肽衍生物不包括由从L-丙氨酸、L-谷氨酰胺、L-谷氨酸、L-缬氨酸、L-亮氨酸、L-异亮氨酸、L-脯氨酸、L-苯丙氨酸、L-色氨酸、L-蛋氨酸、L-丝氨酸、L-苏氨酸、L-半胱氨酸、L-天冬酰胺、L-酪氨酸、L-赖氨酸、L-精氨酸、L-组氨酸、L-天冬氨酸、L-α-氨基酪酸、L-偶氮丝氨酸、L-茶氨酸、L-4-羟基脯氨酸、L-3-羟基脯氨酸、L-鸟氨酸、L-瓜氨酸和L-6-重氮-5-氧代正亮氨酸、甘氨酸和β-丙氨酸选出的相同的或不同的氨基酸通过肽键形成的化合物。
在式(I)~(VI)、(VIIa)、(VIIb)、(VIIIa)、(VIIIb)、(IXa)和(IXb)的各基团的定义中,作为低级烷基、低级烷氧基、低级烷酰基、低级烷氧羰基、一(低级烷基)氨基和二(低级烷基)氨基的低级烷基部分,例如碳原子数1至10的直链状、支链状、环状或由它们的组合组成的烷基,更具体讲,作为直链或支链状的烷基,例如甲基、乙基、n-丙基、异丙基、n-丁基、异丁基、sec-丁基、tert-丁基、n-戊基、新戊基、n-己基、n-庚基、n-辛基、n-壬基、n-癸基等,作为环状的烷基,例如环丙基、环丁基、环戊基、环己基、环庚基、环辛基、环癸基、去甲金刚烷基、金刚烷基、双环[2.2.1]庚基、双环[2.2.2]辛基、双环[3.3.0]辛基、双环[3.3.1]壬基等,作为由直链或支链状和环状的组合构成的烷基,例如环丙基甲基、环庚基甲基、环辛基乙基等。而二(低级烷基)氨基中的2个低级烷基部分可以相同,也可以不同。
作为低级烯基,例如碳原子数2至10的直链或支链状的烯基,更具体的例子如乙烯基、烯丙基、1-丙烯基、1-丁烯基、3-丁烯基、2-戊烯基、4-戊烯基、2-己烯基、5-己烯基、2-癸烯基、9-癸烯基等。
作为低级炔基,例如碳原子数2至10的直链或支链状的炔基,更具体的例子如乙炔、2-丙炔、3-丁炔、4-戊炔、5-己炔、9-癸炔等。
作为芳基、芳烷基和芳酰基的芳基部分,例如单环性或2个以上的环缩合的缩环性的芳基,更具体讲如环构成碳原子数从6至14的芳基、例如苯基、萘、茚基、蒽基等。
作为脂环式杂环基,例如单环性或2个以上的环缩合的缩环性的脂环式杂环基,脂环式杂环基中含有的杂原子的种类以及个数没有特别限定,例如可以含有1或2个以上从氮原子、硫原子和氧原子选出的杂原子,更具体的例子,例如吡咯烷基、2,5-二氧吡咯烷基、噻唑烷基、唑烷基、哌啶基、1,2-二氢吡啶基、哌嗪基、高哌嗪基、吗啉基、硫代吗啉基、吡唑啉基、_唑啉基、二氧戊环基、四氢吡喃基、四氢硫代吡喃基、四氢呋喃基、四氢喹啉基、四氢异喹啉基、四氢喹喔啉基、八氢喹啉基、二氢吲哚基、1,3-二氧异吲哚基等。
作为杂环烷基的杂环基部分,例如芳香族杂环基、脂环式杂环基等,作为芳香族杂环基,例如单环性或2个以上的环缩合的缩环性的芳香族杂环基,芳香族杂环基中含有的杂原子的种类以及个数没有特别限定,例如可以含有1或2个以上从氮原子、硫原子和氧原子选出的杂原子,更具体讲,从构成环的原子数5至14的芳香族杂环基、例如呋喃基、噻吩基、吡咯基、咪唑、吡唑基、三唑基、四唑基、六唑基、_二唑基、噻唑基、吡啶基、吡嗪基、嘧啶基、哒嗪基、三嗪基、吲哚基、吲唑基、苯并咪唑基、苯并_唑基、苯并噻唑基、喹啉基、异喹啉基、2,3-二氮杂萘基、1,5-二氮杂萘基、喹喔啉基、喹唑啉基、噌啉基、嘌呤基、香豆酸基等。而脂环式杂环基与上述同义。
芳烷基和杂环烷基的亚烷基部分在上述低级烷基之中与从一个直链或支链状的烷基除去氢原子后的部分相同含义。
作为邻接的氮原子和与该氮原子邻接的碳原子一起形成的杂环基、以及邻接的碳原子和与该碳原子邻接的氮原子一起形成的杂环基,例如至少含有1个氮原子的5元或6元的单环性脂环式杂环基(该单环性脂环式杂环基也可以含有其它的氮原子、氧原子或硫原子)、在3~8元的环缩合的二环或三环性中至少含有1个氮原子的缩环性杂环基(该缩环性杂环基也可以含有其它的氮原子、氧原子或硫原子)等,更具体的例子,如吡咯烷、哌啶基、哌嗪基、吗啉基、硫代吗啉基、高哌啶基、高哌嗪基、四氢吡啶基、四氢喹啉基、四氢异喹啉基等。
作为取代低级烷基、取代低级烯基、取代低级炔基、取代低级烷氧基、取代低级烷酰基、取代低级烷氧羰基、取代芳烷基、取代芳基、取代芳酰基、取代杂环烷基、一(取代低级烷基)氨基、低级烷基(取代低级烷基)氨基、二(取代低级烷基)氨基以及邻接的氮原子和与该氮原子邻接的碳原子一起形成的取代杂环基、和邻接的碳原子和与该碳原子邻接的氮原子一起形成的取代杂环基中的取代基,可以相同或不同,从取代数1起始的可取代数,优选取代数1~3的、例如卤素、氨基、硝基、羟基、巯基、胍基、脲基、氰基、甲酰基、羧基、氨羰基、重氮乙酰基、低级烷基、低级烷氧基、低级烷酰基、低级烷氧羰基、一或二(低级烷基)氨羰基、低级烷基巯基、芳基、芳烷基、芳酰基、杂环羰基等。其中低级烷基、低级烷氧基、低级烷酰基和低级烷氧羰基的低级烷基部分、芳基、芳烷基和芳酰基的芳基部分以及芳烷基的烯基部分分别与上述同样含义,一或二(低级烷基)氨羰基和低级烷硫基中的低级烷基部分与上述低级烷基同样含义,杂环羰基中的杂环基部分与上述杂环烷基中的杂环基部分相同含义。卤素表示氟、氯、溴、碘各原子。而二(低级烷基)氨羰基中的2个低级烷基部分可以相同,也可以不同。
另外,作为理想的氨基酸或氨基酸衍生物,如由L-氨基酸、甘氨酸(Gly)和β-丙氨酸(β-Ala)和它们的衍生物选出的氨基酸或氨基酸衍生物。作为L-氨基酸,例如L-丙氨酸(L-Ala)、L-谷氨酰胺(L-Gln)、L-谷氨酸(L-Glu)、L-缬氨酸(L-Val)、L-亮氨酸(L-Leu)、L-异亮氨酸(L-Ile)、L-脯氨酸(L-Pro)、L-苯丙氨酸(L-Phe)、L-色氨酸(L-Trp)、L-蛋氨酸(L-Met)、L-丝氨酸(L-Ser)、L-苏氨酸(L-Thr)、L-半胱氨酸(L-Cys)、L-天冬酰胺(L-Asn)、L-酪氨酸(L-Tyr)、L-赖氨酸(L-Lys)、L-精氨酸(L-Arg)、L-组氨酸(L-His)、L-天冬氨酸(L-Asp)、L-α-氨基酪酸(L-α-AB)、L-氮丝氨酸(L-Azaserine)、L-茶氨酸(L-theanine)、L-4-羟基脯氨酸(L-4-HYP)、L-3-羟基脯氨酸(L-3-HYP)、L-鸟氨酸(L-Orn)、L-瓜氨酸(L-Cit)和L-6-重氮-5-氧代正亮氨酸(L-6-diazo-5-oxo-norleucine)等。
作为上述制备方法中可使用的氨基酸或氨基酸衍生物的组合,如选自L-Ala、Gly、L-Met、L-Ser、L-Thr和β-Ala中的一种氨基酸或它的衍生物与选自L-Ala、L-Gln、L-Glu、Gly、L-Val、L-Leu、L-Ile、L-Pro、L-Phe、L-Trp、L-Met、L-Ser、L-Thr、L-Cys、L-Asn、L-Tyr、L-Lys、L-Arg、L-His、L-Asp、L-α-AB、β-Ala、L-Azaserine、L-theanine、L-4-HYP、L-3-HYP、L-Orn、L-Cit及L-6-diazo-5-oxo-norleucine中的一种氨基酸或它的衍生物的组合、L-Gln或它的衍生物与L-Phe或它的衍生物的组合、和L-α-AB或它的衍生物与选自L-Gln、L-Arg和L-α-AB中的一种氨基酸或它的衍生物的组合,更优选L-Ala或它的衍生物与选自L-Gln、Gly、L-Val、L-Leu、L-Ile、L-Phe、L-Trp、L-Met、L-Ser、L-Thr、L-Cys、L-Asn、L-Tyr、L-Lys、L-Arg、L-His、L-α-AB、L-Azaserine、L-Cit和L-theanine中的一种氨基酸或它的衍生物的组合、Gly或它的衍生物与选自L-Gln、Gly、L-Phe、L-Trp、L-Met、L-Ser、L-Thr、L-Cys、L-Tyr、L-Lys、L-Arg、L-α-AB和L-Cit中的一种氨基酸或它的衍生物的组合、L-Met或它的衍生物与选自L-Phe、L-Met、L-Ser、L-Thr、L-Cys、L-Tyr、L-Lys和L-His中的一种氨基酸或它的衍生物的组合、L-Ser或它的衍生物与选自L-Gln、L-Phe、L-Ser、L-Thr、L-Tyr、L-His和L-α-AB中的一种氨基酸或它的衍生物的组合、L-Thr或它的衍生物与选自L-Gln、L-Phe、L-Leu、L-Thr和L-α-AB中的一种氨基酸或它的衍生物的组合、L-Gln或它的衍生物与L-Phe或它的衍生物的组合、β-Ala或它的衍生物与选自L-Phe、L-Met、L-His和L-Cit中的一种氨基酸或它的衍生物的组合、和L-α-AB或它的衍生物与L-Gln、L-Arg和L-α-AB中的一种氨基酸或它的衍生物的组合。
在上述制备方法中,用于本发明的蛋白质,对于每1mg用作底物的氨基酸或氨基酸衍生物为0.01~100mg、优选0.1mg~10mg。
在上述制备方法中,用作底物的氨基酸或氨基酸衍生物按照浓度达到0.1~500g/L、优选0.2~200g/L的浓度在开始或反应途中添加到水性介质中。
上述制备方法中作为能量源使用ATP,使用的浓度是0.5mol~10mol/L的浓度。
作为可在上述制备方法中使用的水性介质,只要不抑制二肽衍生物的生成反应,可以是任意成分、组成的水性介质,例如,水、磷酸盐、碳酸盐、乙酸盐、硼酸盐、柠檬酸盐、Tris等缓冲液等。另外也可以含有甲醇、乙醇等醇类、乙酸乙酯等酯类、丙酮等酮类。
二肽的生成反应在水性介质中、在pH5~11、优选pH6~10、20~50℃、优选25~45℃的条件进行2~150小时、优选进行6~120小时。
(2)使用细胞的培养物或者使用该培养物的处理物作为酶源的制备方法
作为使用细胞的培养物或者该培养物的处理物作为酶源的二肽的制备方法,可列举:i)二肽或二肽衍生物(PI)的制备方法,其特征在于:将上述4得到细胞的培养物或者该培养物的处理物用作酶源,使该酶源、1种以上的氨基酸或者氨基酸衍生物在水性溶液中共存,使二肽或二肽衍生物(PI)在该水性介质中生成、蓄积,从该水性介质收集该二肽或二肽衍生物(PI);和ii)二肽或二肽衍生物(PII)的制备方法,其特征在于:将细胞的培养物或者该培养物的处理物用作酶源,使该酶源、1种以上的氨基酸或氨基酸衍生物和ATP在在水性介质中共存,使二肽或二肽衍生物(PI)在该水性介质中生成、蓄积,直接进行修饰或从该水性介质收集该二肽或二肽衍生物(PI)后对该二肽或二肽衍生物(PI)进行修饰,使二肽或二肽衍生物(PII)生成,收集该二肽或二肽衍生物(PII)。
可以使用公知的有机合成的方法等,通过修饰二肽或者二肽衍生物(PI),生成二肽或者二肽衍生物(PII)。
在上述制备方法中,用作底物的氨基酸和氨基酸衍生物的种类、使用浓度和添加阶段以及生产的二肽与上述6的(1)的酶促制备方法相同。
作为培养物的处理物,可以例举培养物的浓缩物、培养物的干燥物、通过离心分离培养物获得的菌体、该菌体的干燥物、该菌体的冷冻干燥物、该菌体的表面活性剂的处理物、该菌体的超声波处理物、该菌体的机械研磨处理物、该菌体的溶剂处理物、该菌体的酶处理物、该菌体的蛋白质级分物、该菌体的固定化物质或者从该菌体中提取得到的酶标准制品,并且具有由1种以上氨基酸或者氨基酸的衍生物生成二肽或者二肽衍生物的活性的处理物等。
此外,可以作为用微生物的培养物或者该培养物的处理物作为酶源的制备方法中使用的水性介质,除了上述6的(1)的酶制备方法中使用的水性介质外,可以使用作为酶源使用的细胞的培养液或者水性介质。
此外,在上述的制备方法中,根据需要,将ATP作为供给源,可以向水性介质中加入ATP或者经过细胞代谢可生成ATP的化合物,例如:葡萄糖这样的糖类、乙醇这样的醇类,醋酸这样的有机酸类等。
另外根据需要,也可以在水性介质中添加表面活性剂或有机溶剂。作为表面活性剂,polyoxyethylene octadecylamine(例如NymeenS-215、日本油脂社制)等非离子表面活性剂、cetyltrimethylammonium bromide和alkyldimethylbenzylammoniumchloride(例如Cation F2-40E、日本油脂社制)等阳离子系表面活性剂、lauroyl sarcosinate等阴离子系表面活性剂、alkyldimethylamine(例如Tertiary Amine FB、日本油脂社制)等的Tertiary Ami ne类等;作为有机溶剂,如二甲苯、甲苯、脂(肪)族醇、丙酮、醋酸乙酯等,本发明的制备方法中使用的细胞只要是具有由氨基酸或氨基酸衍生物生成二肽或二肽衍生物的活性,可以使用任一种,也可以将1种或数种混合后使用。表面活性剂和有机溶剂的种类和浓度可以在可用于本发明的细胞具有上述活性的范围中的任意选择,例如表面活性剂通常在0.1~50g/l的浓度范围使用,有机溶剂通常在0.1~50ml/l的浓度范围使用。
将细胞的培养物或者该培养物的处理物作为酶源的情况下,该酶源的量因该酶源的比活性等而有所不同,例如,对于每1mg用作底物的氨基酸或者氨基酸衍生物,添加重量为5~1000mg,优选10~400mg的湿细胞。
二肽或二肽衍生物的生成反应在水性介质中、在pH5~11、优选pH6~10、20~65℃、优选25~55℃,更优选30~45℃的条件下通常进行1分钟~150小时、优选进行3分钟~120小时,更优选进行30分钟~100小时。
在上述6的(1)或者(2)的制备方法中,在水性介质中生成、蓄积的二肽或二肽衍生物的采取可以通过使用活性炭或离子交换树脂等通常的方法,或利用有机溶剂的提取、结晶、薄层层析、高效液相层析等进行。
(3)通过修饰二肽或者二肽衍生物制备二肽衍生物的方法
将在上述6的(1)或者(2)的制备方法中得到的二肽或者二肽衍生物根据公知的有机合成反应[参见例如:Comprehensive OrgnicTransformations,R.C.Larock着,(1989年)],可以得到多种二肽衍生物。
在上述制备方法中得到的生成物的分离、纯化可以使用常规有机合成中使用的方法,例如:适当组合过滤、萃取、洗涤、干燥、浓缩、结晶、各种层析等。
以下给出了实验例,对可用于本发明的DNA、蛋白质和细胞的制备方法进行了说明,但该制备方法并不限定于下面实验例。
实验例1利用数据库检索具有二肽合成活性的蛋白质
以来自枯草芽孢杆菌168株的D-Ala-D-Ala连接酶基因的氨基酸序列[Nature, 390,249-256(1997)]作为请求,使用作为枯草芽孢杆菌168株的基因组DNA数据库的Subtilist(http://genolist.pasteur.fr/SubtiList/)的同源性检索功能,对编码存在于枯草芽孢杆菌168株基因组DNA序列中的具有同源性的蛋白质的基因进行检索。
在结果选取的序列中,选择编码作为D-Ala-D-Ala连接酶基序[Biochemistry, 30,1673(1991)]的序列号33、34或35表示的氨基酸序列,而且去除掉编码其功能已经被鉴定的蛋白质的基因后,表现出与D-Ala-D-Ala连接酶基序最高同源性(29.1%)的序列作为功能未知基因 ywfE
ywfE的碱基序列如序列号9所示,由该碱基序列编码的蛋白质的氨基酸序列如序列号1所示。
实验例2  ywfE基因表达株的构建
根据实验例1得到的碱基序列情报,象以下那样操作可以取得枯草芽孢杆菌的 ywfE基因片段。
首先将枯草芽孢杆菌168株(ATCC23857)接种于LB培养基[10g/l细菌培养用胰化蛋白胨(Difco公司生产)、5g/l酵母提取物(Difco公司生产)、5g/l氯化钠],于30℃下静置培养过夜。培养后通过使用Current Protocols in Molecular Biology所述的饱和酚方法,对该微生物的染色体DNA进行分离纯化。
使用Perseptive Biosystems公司制备8905型DNA合成仪,合成具有序列号19~22表示的碱基序列的DNA(以下,分别称之为引物A、引物B、引物C和引物D)。引物A是添加在枯草芽孢杆菌染色体DNA的含有 ywfE起始密码子区域的5′端的含有 XhoI识别序列的碱基序列。引物B是添加在与含有 ywfE的终止密码子的序列互补的碱基序列的5′端的含有 BamHI识别序列的碱基序列。而引物C是添加在含有 trp启动子的表达载体pTrS30[由大肠杆菌JM109/pTrS30(FERM BP-5407)制备]的 trp启动子区域的碱基序列号5′端的含有 EcoRI识别序列的碱基序列。引物D是添加在与含有 trp启动子的表达载体pTrS30的trp启动子区域的序列互补的序列的5′端的含有 XhoI识别序列的碱基序列。
ywfE基因片段的扩增中使用上述引物A和引物B,作为模板使用枯草芽孢杆菌染色体DNA,在 trp启动子区域的片段扩增中使用引物C和引物D、作为模板使用pTrS30进行PCR。PCR通过制备含有作为模板的0.1μg染色体DNA或10ng的pTrS30、0.5mol/L的各引物、2.5units的 Pfu DNA聚合酶(Stratagene公司生产)、4μL的 Pfu DNA聚合酶用×10缓冲液(Stratagene公司生产)、各200μmol/L的dNTP(dATP、dGTP、dCTP和dTTP)的反应液40μL,按照94℃下1分钟、55℃下2分钟、72℃下3分钟为一个循环,反复进行30次循环来实施。
将该反应液的1/10量进行琼脂糖凝胶电泳,确认在使用引物A和引物B的PCR中扩增了相当于 ywfE基因片段的约1.4kb,在使用引物C和引物D的反应中扩增了相当于 trp启动子区域的DNA片段约0.3kbDNA片段后,添加与剩下反应液等量的TE[10mmol/LTris-HCl(pH8.0)、1mmol/L EDTA]饱和酚/氯仿(1vol/1vol)溶液,并混合。向该溶液经离心分离后得到的上层加2倍容量的冷乙醇,并混合,于-80℃下放置30分钟。将该溶液离心分离使DNA沉淀后,将该DNA溶解于20μL的TE。
使用各个该溶解液各5μL,将用引物A和引物B扩增的DNA用限制酶 XhoIBamHI进行酶切,而使用引物C和引物D扩增的DNA用限制酶 EcoRIXhoI进行酶切,通过琼脂糖凝胶电泳将DNA片段分离后,使用geneclean II试剂盒(GENECLEAN II kit、BIO101社制),分别收集含有 ywfE的1.4kb和含有 trp启动子区域的0.3kb的DNA片段。
将含有 trp启动子的表达载体pTrS30[由大肠杆菌JM109/pTrS0(FERM BP-5407)制备]0.2μg用限制酶 EcoRIBamHI酶切后,通过琼脂糖凝胶电泳分离DNA片段,通过与上述同样的方法,收集4.5kb的DNA片段。
使用连接试剂盒(Takara Bio公司生产),使上述得到的含有 ywfE的1.4kb片段、含有 trp启动子区域的0.3kb片段和4.5kb的片段于16℃下反应16小时,进行连接。
通过使用钙离子的方法[Proc.Natl.Acad.Sci.,USA, 69,2110(1972)]用该反应液转化大肠杆菌NM522株(Stratagene公司生产)后涂布于含有50μg/ml的氨苄青霉素的LB琼脂培养基,于30℃下培养过夜。
根据众所周知的方法从生长繁殖的转化体菌落提取质粒,通过使用限制酶解析其构造,确认取得了在 trp启动子下游连接了 ywfE的表达载体pPE43(图1)。
实验例3 二肽的生产
将实验例2得到的带有pPE43的大肠杆菌NM522(大肠杆菌NM522/pPE43株)接种在加入了含有50μg/ml的氨苄青霉素的8ml LB培养基的大型试管,于28℃下培养17小时。对该培养液进行离心分离、取得湿菌体。
制备由终浓度60mg/ml的该湿菌体、120mmol/L的磷酸钾缓冲液(pH7.4)、60mmol/L的氯化镁、60mmol/L的ATP、30mmol/L的L-Ala、30mmol/L的L-Gln、0.4%的NymeenS-215构成的0.1ml反应液,于37℃下反应3分钟。
反应结束后,将反应生成物用二硝基酚法进行衍生化后通过HPLC法进行分析。用HPLC法进行分析,分离柱使用关东化学社制的Lichrosorb-RP-18柱,洗脱液使用1%(v/v)磷酸、25%(v/v)乙腈,以0.7ml/分钟的流速进行。其结果确认反应液中生成蓄积120mg/L的L-丙氨酰-L-谷氨酰胺(L-Ala-L-Gln)。
在作为对照菌株只含有载体的大肠杆菌NM522/pTrS30株的菌体中没有能确认到L-Ala-L-Gln的生成。
实验例4 C末端添加His-tag型重组型二肽合成酶的纯化
使用上述DNA合成仪,合成具有序列号33和34表示的碱基序列的DNA(以下,分别称为引物E、引物F)。引物E是含有将 ywfE的起始密码子(atg)置换为 NcoI识别序列(ce atgg)的区域的碱基序列。引物F是含有将 ywfE的终止密码子置换为 BamHI识别序列( ggatcc)的区域的碱基序列。
以枯草芽孢杆菌168株(ATCC23857)的染色体DNA作为模板,使用上述引物E和引物F作为引物组进行PCR。PCR通过制备含有0.1μg的染色体DNA、0.5μmol/L的各引物、2.5units的 Pfu DNA聚合酶、4μL的 Pfu DNA聚合酶用×10缓冲液、200μmol/L的各dNTP的反应液40μL,按照94℃下1分钟、55℃下2分钟、72℃下3分钟为一次循环,反复进行30次来实施。
将该反应液的1/10量进行琼脂糖凝胶电泳,确认扩增了相当于ywfE基因片段的约1.4kb后,添加与剩下反应液等量的TE饱和酚/氯仿溶液,并混合。向该溶液经离心分离后得到的上层加2倍容量的冷乙醇,并混合,于-80℃下放置30分钟。将该溶液离心分离得到的DNA沉淀溶解于20μL的TE。
使用各个该溶解液各5μL,将扩增的DNA用限制酶 NcoIBamHI进行酶切,通过琼脂糖凝胶电泳将DNA片段分离后,使用genecleanII试剂盒收集含有 ywfE的1.4kb的DNA片段。
将C末端添加His-tag型重组体表达载体pQE60(Qiagen公司生产)0.2g用限制酶 NcoIBamHI酶切后,通过琼脂糖凝胶电泳将DNA片段分离后,使用与上述同样的方法收集3.4kb的DNA片段。
使用连接试剂盒,使上述得到的含有 ywfE的1.4kb的DNA片段和3.4kb的DNA片段于16℃下反应16小时,进行连接。
通过使用钙离子的方法用该连接反应液转化大肠杆菌NM522株后,涂布于含有50μg/ml的氨苄青霉素的LB琼脂培养基,于30℃下培养过夜。
通过众所周知的方法从生长繁殖的转化体菌落提取质粒,使用限制酶对其构造进行解析,确认取得了作为C末端添加His-tag型 ywfE表达载体的pQE60ywfE(图2)。
将带有pQE60ywfE的大肠杆菌NM522(大肠杆菌NM522/pQE60ywfE株)接种在加入了含有50μg/ml的氨苄青霉素的8mlLB培养基的大型试管,于28℃下培养17小时。将该培养液接种在加入了含有50μg/ml的氨苄青霉素的50ml LB培养基的250ml容量三角烧瓶,于30℃下培养3小时后,按照终浓度达到1mmol/L那样添加异丙醇-β-D-硫代半乳糖苷(IPTG),再于30℃下培养4小时。对该培养液进行离心分离取得湿菌体,使用HisTrap(添加His-tag蛋白质纯化试剂盒、Amersham Pharmasia Biotech社制),根据说明书从该湿菌体纯化添加His-tag重组型酶。
实验例5 使用添加His-tag重组型酶进行二肽的生产(1)
(i)制备由实验例4中取得的纯化的添加His-tag重组型酶0.04mg、100mmol/L的Tris-HCl(pH8.0)、60mmol/L的氯化镁、60mmol/L的ATP、30mmol/L的L-Ala、30mmol/L的L-Gln构成的0.1ml的反应液,于37℃进行16小时反应。
反应结束后,通过与上述实验例3同样的方法分析反应生成物,确认反应液中生成蓄积3.7g/L的L-Ala-L-Gln和0.3g/L的L-丙氨酰-L-丙氨酸(L-Ala-L-Ala)。
(ii)除了酶为0.01mg、用L-Phe、L-Met、L-Leu或L-Val取代L-Gln以外,制备与上述(i)的反应液组成相同的反应液,于上述(i)的反应条件下进行反应。
反应结束后,通过与上述实验例3同样的方法对反应生成物进行分析,确认反应液中分别生成蓄积:只有7.0g/L的L-丙氨酰-L-苯丙氨酸(L-Ala-L-Phe)、7.0g/L的L-丙氨酰-L-蛋氨酸(L-Ala-L-Met)和0.03g/L的L-Ala-L-Ala、5.0g/L的L-丙氨酰-L-亮氨酸(L-Ala-L-Leu)和0.2g/L的L-Ala-L-Ala、或1.6g/L的L-丙氨酰-L-缬氨酸(L-Ala-L-Val)和0.3g/L的L-Ala-L-Ala。
(iii)除了酶为0.01mg、用Gly取代L-Ala、用L-Phe或L-Met取代L-Gln以外,制备与上述(i)的反应液的组成相同的反应液,在上述(i)的反应条件使其反应。
反应结束后,通过与上述实验例3同样的方法对反应生成物进行分析,确认反应液中分别生成蓄积5.2g/L的甘氨酰-L-苯丙氨酸(Gly-L-Phe)或1.1g/L的甘氨酰-L-蛋氨酸(Gly-L-Met)。
如果从上述反应液组成中去除ATP,完全不能生成二肽。
以上结果表明 ywfE基因产物在ATP存在下具有生成由L-Ala和L-Gln、L-Phe、L-Met、L-Leu或L-Val生成L-Ala-L-Gln和L-Ala-L-Ala、L-Ala-L-Phe、L-Ala-L-Met和L-Ala-L-Ala、L-Ala-L-Leu和L-Ala-L-Ala、或L-Ala-L-Val和L-Ala-L-Ala的活性,由Gly和L-Phe或L-Met生成Gly-L-Phe或Gly-L-Met的活性。
实验例6 使用添加His-tag重组型酶的二肽的生产(2)
制备由实验例4中得到的纯化的添加His-tag重组型酶0.04mg、100mmol/L的Tris-HCl(pH8.0)、60mmol/L的氯化镁、60mmol/L的ATP构成的0.1ml反应液,按照分别达到30mmol/L那样向反应液中添加由表1的第1行和最左列的氨基酸的组合构成的各种L-氨基酸、Gly或β-Ala,于37℃下进行16小时反应。反应结束后,对反应生成物进行HPLC分析,确认生成表1所示的二肽。
【表1-1】
Figure A20058002124500751
【表1-2】
Figure A20058002124500761
【表1-3】
将以表1的第1行和最左列所述的2种(或1种)L-氨基酸、Gly或β-Ala作为底物反应时生成的二肽记在表格内。○表示生成了二肽,但序列未确定,×表示不能确认二肽的生成,而空栏表示未实施。
实验例7 使用添加His-tag重组型酶表达株的二肽的生产
将实验例4得到的大肠杆菌NM522/pQE60ywfE株接种在加入了含有50μg/ml的氨苄青霉素的8ml LB培养基的大型试管,于28℃下培养17小时。将该培养液接种在加入了含有50μg/ml的氨苄青霉素的50ml LB培养基的250ml容量三角烧瓶,于30℃下培养3小时后,按照终浓度达到1mmol/L那样添加IPTG,再于30℃下培养4小时。对该培养液进行离心分离取得湿菌体。
将由200g/L的湿菌体、50g/L的葡萄糖、5g/L的肌醇六磷酸(使用33%的浓氢氧化钠溶液稀释成中性)、15g/L的磷酸二氢钾、5g/L的硫酸镁·7水合物、4g/L的NymeenS-215、10ml/L的二甲苯、200mmol/L的L-Ala、200mmol/L的L-Gln构成的20ml反应液(pH7.2)加入到50ml容量的烧杯、于32℃、900rpm的条件下进行2小时反应。反应中使用2mol/L的氢氧化钾将反应液的pH保持在7.2。
将反应生成物用与实验例3所述方法同样的方法进行分析,确认25mg/L的L-Ala-L-Gln蓄积。
实验例8 相当于来自属于杆菌属的各种微生物的 ywfE基因的基因的克隆和该基因的解析
根据序列号9表示的碱基序列,象以下那样操作取得相当于存在于枯草芽孢杆菌ATCC15245、ATCC6633、IAM1213、IAM1107、IAM1214、ATCC9466、IAM1033、ATCC21555、解淀粉芽孢杆菌IFO3022和短小芽孢杆菌NRRL B-12025的 ywfE基因的基因。
首先,将枯草芽孢杆菌ATCC151245、ATCC6633、IAM1213、IAM1107、IAM1214、ATCC9466、IAM1033、ATCC21555、解淀粉芽孢杆菌IFO3022和短小芽孢杆菌NRRL B-12025分别接种于LB培养基,于30℃下静置培养过夜。培养后,通过使用Current Protocols in MolecularBiology所述的饱和酚方法,对于各个微生物的染色体DNA分别进行分离纯化。
使用PerSeptive Biosystems公司制备8905型DNA合成仪,合成具有序列号25和26表示的碱基序列的DNA(以下,分别称为引物G、引物H)。引物G是含有从枯草芽孢杆菌168株的染色体DNA的 ywfE的起始密码子开始的上游区域的序列。引物H是与含有从 ywfE的终止密码子开始的下游序列互补的序列。
以枯草芽孢杆菌ATCC15245、ATCC6633、IAM1213、IAM1107、IAM1214、ATCC9466、IAM1033、ATCC21555或解淀粉芽孢杆菌IFO3022的染色体DNA作为模板,使用上述引物G和引物H作为引物组进行PCR。PCR通过制备含有0.1μg的染色体DNA、0.5μmol/L的各引物、2.5units的 Pfu DNA聚合酶、4μL的 Pfu DNA聚合酶用×10缓冲液、200μmol/L的各dNTP的反应液40μL,按照94℃下1分钟、55℃下2分钟、72℃下3分钟为一次循环,反复进行30次来实施。
将该反应液的1/10量进行琼脂糖凝胶电泳,确认扩增了相当于y wfE基因片段的约1.4kb后,添加与剩下反应液等量的TE饱和酚/氯仿溶液,并混合。向该溶液经离心分离后得到的上层加2倍容量的冷乙醇,并混合,于-80℃下放置30分钟。将该溶液离心分离得到的DNA沉淀溶解于20μL的TE。
使用连接试剂盒,将上述得到的来自各菌株染色体DNA的1.4kb片段和pCR-blunt(Invitrogen公司生产)于16℃下反应16小时,进行连接。
通过使用钙离子的方法用该反应液转化大肠杆菌NM522株后,涂布于含有50μg/ml的氨苄青霉素的LB琼脂培养基,于30℃下培养过夜。
通过根据众所周知的方法从生长繁殖的转化体菌落提取质粒,用限制酶对各个构造进行解析,确认取得含有相当于 ywfE基因的基因的质粒pYWFE1(来自ATCC15245株,具有序列号36表示的碱基序列的DNA)、pYWFE2(来自ATCC6633株,具有序列号10表示的碱基序列的DNA)、pYWFE3(来自IAM1213株,具有序列号11表示的碱基序列的DNA)、pYWFE4(来自IAM1107株,具有序列号12表示的碱基序列的DNA)、pYWFE5(来自IAM1214株,具有序列号13表示的碱基序列的DNA)、pYWFE6(来自ATCC9466株,具有序列号9表示的碱基序列的DNA)、pYWFE7(来自IAM1033株,具有序列号36表示的碱基序列的DNA)、pYWFE8(来自ATCC21555株,具有序列号14表示的碱基序列的DNA)、pYWFE9(来自IFO3022株,具有序列号15表示的碱基序列的DNA)。
另外相当于来自短小芽孢杆菌NRRL B-12025的 ywfE的基因(具有序列号16表示的碱基序列的DNA)象以下那样取得。
以上述制备的NRRL B-12025株的染色体DNA作为模板,使用序列号37和38表示的碱基序列构成的DNA作为引物组,进行PCR。PCR通过制备含有0.1μg的染色体DNA、0.5μmol/L的各引物、2.5units的Z-taq聚合酶(Takara Bio公司生产)、5μL的Z-taq聚合酶用×10缓冲液(Takara Bio公司生产)、200μmol/L的各dNTP的反应液50μL,按照98℃下5秒钟、55℃下30秒钟、72℃下1分钟为一次循环,反复进行30次来实施。
将该反应液的1/10量进行琼脂糖凝胶电泳,确认约0.8kb的片段扩增后,添加与剩下反应液等量的TE饱和酚/氯仿溶液,并混合。向该溶液经离心分离后得到的上层加2倍容量的冷乙醇,并混合,于-80℃下放置30分钟。将该溶液离心分离得到的DNA沉淀溶解于20μL的TE。
使用连接试剂盒将上述得到的0.8kb片段和pGEM T-easy(Promega公司生产)于16℃下反应16小时,进行连接。
通过使用钙离子的方法用该反应液转化大肠杆菌DH5α株后,涂布于含有50μg/ml的氨苄青霉素的LB琼脂培养基,于30℃下培养过夜。
从上述得到的转化体提取质粒,测定约0.8kb的插入DNA片段的碱基序列,确认由序列号21表示的碱基序列中的第358~1160位碱基构成的碱基序列。
然后将该质粒用 EcoRI进行酶切后,通过琼脂糖凝胶电泳将DNA片段分离。使用geneclean II试剂盒纯化该DNA片段。使用DIG-HighPrime DNA Labeling&Detection Starter Kit I(Roche Diagnostics公司生产)对约0.5μg该纯化DNA片段进行DIG标记。DIG标记根据该试剂盒附带的说明书进行。
使用上述得到的DIG标记的DNA,进行NRRL B-12025株的染色体DNA的Southern解析。
将NRRL B-12025株的染色体DNA分别使用 BamHI、 EcoRI、 HindIII、KpnI、 PstI、 SacI、 SalI和 SphI完全消化,通过琼脂糖电泳将DNA片段分离后,根据常规方法转移到nylon membrane plus charge(RocheDiagnostics公司生产)。
通过照射UV,将DNA片段固定在该尼龙膜后,使用上述探针DNA和该尼龙膜进行Southern杂交。
杂交通过使该探针DNA和该尼龙膜在65℃下接触16小时,然后使用0.1%SDS和2×SSC构成的溶液将该尼龙膜于室温下清洗5分钟,清洗2次,再用0.1%SDS和0.5×SSC构成的溶液,于65℃下15分钟、清洗2次进行,其它操作、条件和杂交的DNA的检测根据上述的DIG-HighPrime DNA Labeling&Detection Starter Kit I附带的说明书进行。
该结果表明在 Hind III和 Pst I完全消化片段的3.5kbp附近看到发色。
然后,将NRRL B-12025株的染色体DNA使用 Hind III和 Pst I分别完全消化,通过琼脂糖凝胶电泳分离DNA片段。使用geneclean II试剂盒从来自各个限制酶消化DNA中纯化3-4kbp的片段,使用连接试剂盒使其自环化。
根据上述测定的0.8kb的DNA片段的碱基序列,设计、合成序列号39和340表示的碱基序列,以上述取得的环化DNA作为模板进行PCR。PCR通过制备含有10ng的环化DNA、0.5μmol/L的各引物、2.5units的pyrobest聚合酶(Takara Bio公司生产)、5μL的pyrobest聚合酶用×10缓冲液(Takara Bio公司生产)、200μmol/L的各dNTP的反应液50μL,按照98℃下5秒钟、55℃下30秒钟、72℃下3分30秒钟为一次循环,反复进行30次来实施。
将该反应液的1/10量进行琼脂糖凝胶电泳,确认约3.0kb片段扩增后,添加与剩下反应液等量的TE饱和酚/氯仿溶液,并混合。向该溶液经离心分离后得到的上层加2倍容量的冷乙醇,并混合,于-80℃下放置30分钟。将该溶液离心分离得到的DNA沉淀溶解于20μL的TE。
使用连接试剂盒对上述得到的DNA片段和Zero Blunt PCRCloning Kit(Invitrogen公司生产)进行连接。
通过使用钙离子的方法用该反应液转化大肠杆菌NM522株后,涂布于含有50μg/ml的氨苄青霉素的LB琼脂培养基,于30℃下培养过夜。
根据众所周知的方法从生长繁殖的转化体菌落提取质粒,通过使用限制酶对其构造进行解析,确认得到了含有相当于 ywfE基因的基因的质粒pYWFE10(来自NRRL B-12025株、具有序列号16表示的碱基序列的DNA)。
使用碱基序列分析装置373A·DNA序列仪测定上述得到的分别相当于pYWFE1~pYWFE10含有的 ywfE基因的各基因的碱基序列。
虽然由pYWFE1、pYWFE6和pYWFE7含有的基因编码的蛋白质的氨基酸序列与 ywfE基因编码的蛋白质的氨基酸序列相同,但由pYWFE2、pYWFE3、pYWFE4、pYWFE5、pYWFE8、pYWFE9和pYWFE10含有的基因编码的蛋白质的氨基酸序列与 ywfE基因编码的蛋白质的氨基酸序列不同。
由相当于pYWFE2、pYWFE3、pYWFE4、pYWFE5、pYWFE8、pYWFE9、pYWFE10以及pYWFE1和pYWFE7中含有的 ywfE基因的基因编码的蛋白质的氨基酸序列如序列号2~8以及1所示,而该基因的碱基序列分别如序列号10~16和36所示。
实验例9 C末端添加His-tag型重组型二肽合成酶的纯化
以枯草芽孢杆菌ATCC15245、ATCC6633、IAM1213、IAM1107、IAM1214、ATCC9466、IAM1033、ATCC21555、或解淀粉芽孢杆菌IFO3022的染色体DNA为模板,使用实验例2所述的引物A和引物B作为引物组进行PCR。PCR通过制备含有0.1μg的染色体DNA、0.5μmol/L的各引物、2.5units的 Pfu DNA聚合酶、4μL的 Pfu DNA聚合酶用×10缓冲液、200μmol/L的各dNTP的反应液40μL,按照94℃下1分钟、55℃下2分钟、72℃下3分钟为一次循环,反复进行30次来实施。
以短小芽孢杆菌NRRL B-12025的染色体DNA作为模板时,使用具有序列号1和32表示的碱基序列的DNA作为引物组,在与上述同样条件下进行PCR。
将该反应液的1/10量进行琼脂糖凝胶电泳,确认相当于 ywfE基因片段的约1.4kb分别扩增后,添加与剩下反应液等量的TE饱和酚/氯仿溶液,并混合。向该溶液经离心分离后得到的上层加2倍容量的冷乙醇,并混合,于-80℃下放置30分钟。将该溶液离心分离得到的DNA沉淀溶解于20μL的TE。
使用各个该溶解液5μL,将扩增的DNA用限制酶 NcoI和 BamHI酶切,通过琼脂糖凝胶电泳分离DNA片段后,使用geneclean II试剂盒,收集含有相当于 ywfE基因的基因的1.4kb DNA片段。
然后将C末端添加His-tag型重组体表达载体pQE600.2μg用限制酶 NcoI和 BamHI酶切后,通过琼脂糖凝胶电泳分离DNA片段,通过与上述同样的方法收集3.4kb的DNA片段。
使用连接试剂盒使上述得到的含有相当于枯草芽孢杆菌168株的 ywfE基因的基因的1.4kb DNA片段和3.4kb的DNA片段于16℃下反应16小时进行连接。
通过使用钙离子的方法用该反应液转化大肠杆菌NM522株后,涂布于含有50μg/ml的氨苄青霉素的LB琼脂培养基,于30℃下培养过夜。
根据众所周知的方法从生长繁殖的转化体菌落提取质粒,通过使用限制酶对它们的构造进行解析,确认取得了作为C末端添加His-tag型基因表达载体的pQE60ywfE1(含有来自ATCC15245的基因的载体)、pQE60ywfE2(含有来自ATCC6633的基因的载体)、pQE60ywfE3(含有来自IAM1213的基因的载体)、pQE60ywfE4(含有来自IAM1107的基因的载体)、pQE60ywfE5(含有来自IAM1214的基因的载体)、pQE60ywfE6(含有来自ATCC9466的基因的载体)、pQE60ywfE7(含有来自IAM1033的基因的载体)、pQE60ywfE8(含有来自ATCC21555的基因的载体)、pQE60ywfE9(含有来自IFO3022的基因的载体)、和pQE60ywfE10(含有来自NRRL B-12025的基因的载体)。
将上述得到的大肠杆菌NM522/pQE60ywfE1~NM522/pQE60ywfE10株分别接种在加入了含有50μg/ml的氨苄青霉素的8ml LB培养基的大型试管,于28℃下培养17小时。将该培养液接种于加入了含有50μg/ml的氨苄青霉素的50ml的LB培养基的250ml容量的三角烧瓶,于30℃下培养3小时后,按照终浓度达到1mmol/L那样添加IPTG,再于30℃下培养4小时。使用HisTrap,根据其使用说明书,从对该培养液进行离心分离得到的湿菌体纯化添加His-tag重组型酶。
实验例10  使用纯化酶生产二肽
制备由实验例9得到的重组型酶0.04mg、100mmol/LTris-HCl(pH8.0)、60mmol/L的氯化镁、60mmol/L的ATP、30mmol/L的L-Ala和30mmol/L的L-Gln构成的0.1ml的反应液,于37℃下进行16小时反应。
反应结束后,通过实验例3所述的方法对反应液进行分析,结果确认3.0~3.5g/L的L-Ala-L-Gln和0.25~0.3g/L的L-Ala-L-Ala生成蓄积。
而如果从上述反应液组成除去ATP,完全不能生成L-Ala-L-Gln和L-Ala-L-Ala。
以上结果表明实验例8得到的基因产物无论那一个都具有在ATP存在下由L-Ala和L-Gln生成L-Ala-L-Gln和L-Ala-L-Ala的活性。
实验例11  albC基因和其类似基因的取得
根据诺尔斯氏链霉菌的 albC基因的碱基序列[Chemistry&Biol.,9,1355(2002)],通过以下方法从诺尔斯氏链霉菌和小白链霉菌取得albC基因和其类似基因。
首先将诺尔斯氏链霉菌IFO15452株和小白链霉菌IFO14147株分别接种于添加了1%甘氨酸的KM73培养基[2g/l酵母提取液(Difco公司生产)、10g/l可溶性淀粉(和光纯药工业社制)]、KP培养基[15g/l葡萄糖、10g/l甘油、10g/l多胨(日本制药株式会社制)、10g/l肉浸渍液(极东制药工业株式会社生产)、4g/l碳酸钙],于28℃下振荡培养过夜。而诺尔斯氏链霉菌IFO15452株和小白链霉菌IFO14147株由独立行政法人制品评价技术基盘机构生物资源部门[NationalInstitute of Technology and Evaluation(NITE)BiologicalResource Center(BRC)](
Figure A20058002124500851
292-0818千叶県木更津市かずさ鎌足2-5-8)惠赠。
培养后,根据Genetic Manipulation of Streptomyces:aLaboratory Manual:John Innes Foundation所述的方法对该微生物的染色体DNA进行分离纯化。
根据 albC基因的碱基序列,使用PerSeptive Biosystems公司制备8905型DNA合成仪,合成具有序列号41和42表示的碱基序列的DNA(以下,分别称为引物J、引物K)。引物J是添加在含有诺尔斯氏链霉菌的染色体DNA的 albC基因起始密码子的区域5′端的含有 NcoI识别序列的碱基序列。引物K是添加在与含有 albC基因的终止密码子的序列互补的碱基序列的5′端的含有 BglII识别序列的碱基序列。
使用上述的引物J和引物K作为引物组,作为模板使用诺尔斯氏链霉菌或小白链霉菌的染色体DNA进行PCR。PCR通过制备含有作为模板的0.1μg的染色体DNA、0.5μmol/L的各引物、2.5units的 Ex TaqDNA聚合酶(Takara Bio公司生产)、5 μL的 ExTaq DNA聚合酶用×l0缓冲液(Takara Bio公司生产)、各200μmol/L的dNTP、5μL的二甲基亚砜的反应液50μL,按照94℃下1分钟、55℃下30秒钟、72℃下1分钟为一次循环,反复进行30次来实施。
将该反应液的1/10量进行琼脂糖凝胶电泳,确认约0.7kb的DNA片段扩增后,添加与剩下反应液等量的TE饱和酚/氯仿溶液,并混合。向该溶液经离心分离后得到的上层力2倍容量的冷乙醇,并混合,于-80℃下放置30分钟。将该溶液离心分离得到的DNA沉淀溶解于20μL的TE。
使用各个该溶解液各5μL,将扩增的DNA用限制酶 NcoI和 BglII进行酶切,通过琼脂糖凝胶电泳将DNA片段分离后,使用geneclean II试剂盒分别收集700bp的DNA片段。
将0.2μg含有噬菌体T5启动子的表达载体pQE60用限制酶 NcoI和 BglII酶切后,通过琼脂糖凝胶电泳将DNA片段分离后,使用与上述同样的方法收集3.4kb的DNA片段。
使用连接试剂盒,使含有上述得到的来自各放线菌的0.7kb片段和来自pQE60的3.4kb片段于16℃下反应16小时,进行连接。
通过使用钙离子的方法用该连接反应液转化大肠杆菌NM522株后,涂布于含有50μg/ml的氨苄青霉素的LB琼脂培养基,于30℃下培养过夜。
通过众所周知的方法从生长繁殖的转化体菌落提取质粒,使用限制酶对其构造进行解析,确认取得了作为在噬菌体T5启动子下游连接了来自诺尔斯氏链霉菌的DNA的表达载体pAL-nou、和连接了来自小白链霉菌的DNA的表达载体pAL-alb(图3)。
当使用碱基序列测定装置373A·DNA序列仪测定插入到各个质粒的来自放线菌的DNA部分的碱基序列时,确认pAL-alb中含有编码具有序列号37表示的氨基酸序列的蛋白质的DNA、即含有序列号39表示的碱基序列的DNA,在pAL-nou含有编码具有序列号38表示的氨基酸序列的蛋白质的DNA、即具有序列号40表示的碱基序列的DNA
实验例12 使用菌体作为酶源的二肽的制备
将实验例11得到的带有pAL-nou或pAL-alb的大肠杆菌NM522(大肠杆菌NM522/pAL-nou株或NM522/pAL-alb株)和不带有质粒的NM522株接种于加入了含有50μg/ml的氨苄青霉素的10ml LB培养基的试管(对于不带有质粒的株的情况不添加氨苄青霉素,以下同样),于30℃下培养17小时。将该培养液0.5ml分别接种于加入了50ml的LB培养基的250ml容量的三角烧瓶,于30℃下振荡培养1小时后,按照终浓度达到1mmol/L那样添加IPTG,再继续培养4小时。对该培养液进行离心分离,取得湿菌体。
制备由终浓度100mg/ml的该湿菌体、60mmol/L的磷酸钾缓冲液(pH7.2)、10mmol/L的氯化镁、10mmol/L的ATP、1g/L的L-Leu、1g/L的L-Phe构成的3.0ml反应液,于30℃下进行反应。反应1小时后取样,按照浓度达到20%(v/v)那样加乙腈后,使用HPLC分析反应生成物。通过HPLC进行分析,分离柱使用ODS-HA柱(YMC社制)、作为洗脱液使用30%(v/v)乙腈,以流速0.6ml/min、测定215nm的紫外吸收的条件进行。
结果确认在大肠杆菌NM522/pAL-nou株的反应液中有36.7mg/l的环(L-亮氨酰-L-苯丙氨酸)[cyclo(L-Leu-L-Phe)]的蓄积,但在大肠杆菌NM522株的反应液中完全没有检测到cyclo(L-Leu-L-Phe)。将同样反应液在以下的条件下用HPLC进行分析,测定到作为直链二肽(以下,“直链二肽”简称为“二肽”)的L-亮氨酰-L-苯丙氨酸(L-Leu-L-Phe)和L-苯丙氨酰-L-亮氨酸(L-Phe-L-Leu)。
两二肽用F-moc化法进行衍生化后,使用HPLC进行分析。通过HPLC进行分析,分离柱使用ODS-HG5(野村化学社制)、作为洗脱液使用A液(醋酸6ml/l、20%(v/v)乙腈、用三乙胺调整到pH4.8)和B液(醋酸6ml/l、70%(v/v)乙腈、用三乙胺调整到pH4.8),按照分析开始后头5分钟洗脱,按照A液∶B液=8∶2进行,5分钟~20分钟之前进行线性梯度洗脱,在20分钟时A液∶B液=1∶1,流速0.6ml/分钟、激发波长254nm、荧光波长630nm检测二肽的条件下进行。
结果确认在大肠杆菌NM522/pAL-nou株的反应液中有21.9mg/L的L-Leu-L-Phe和12.0mg/L的L-Phe-L-Leu蓄积。而在作为对照株使用的大肠杆菌NM522株的反应液中没有检测到任何二肽。
这表明实验例11中取得的环二肽合成酶具有合成直链二肽的能力。
实验例13 使用纯化酶制备二肽(1)
与实验例12同样培养大肠杆菌NM522/pAL-nou株。培养结束后通过离心分离取得湿菌体,用60mmol/L的磷酸钾缓冲液(pH7.2)清洗后,悬浮于含有10mmol/L咪唑的20mmol/L磷酸钾缓冲液。将该悬浮液于4℃下进行超声波处理,取得菌体裂解液。将该菌体裂解液(10ml、含蛋白质0.863mg)加到Amersham公司生产的His-tag纯化柱,通过加含有10mmol/L的咪唑的20mmol/L的磷酸钾缓冲液15ml进行清洗,于柱内对附带His-tag的 albC蛋白质进行纯化。然后向保持这个附带His-tag的albC蛋白质的柱加与实验例12同组成的反应液(反应液组成:60mmol/L的磷酸钾缓冲液(pH7.2)、10mmol/L的氯化镁、10mmol/L的ATP、1g/L的L-Leu、1g/L的L-Phe构成的反应液)2ml,在柱内保持底物的状态下,于30℃进行温育。24小时后用同组成的反应液3ml对柱内的反应液进行洗脱,通过与实验例12同样的方法对反应液中的环二肽和二肽进行定量。
从结果可知生成了cyclo(L-Leu-L-Phe)6.8mg/L、L-Leu-L-Phe28.7mg/L和L-Phe-L-Leu18.5mg/L。在用不合有ATP的反应液进行同样温育时,环二肽、肽都没有检测到。
实验例14 使用纯化酶制备二肽(2)
除了将底物氨基酸换成其它的氨基酸以外,用与实验例13同样的方法进行酶反应,对生成物进行分析。反应液除了将底物氨基酸换成为1g/L的L-Ala、L-Leu或L-Phe以外,使用与实验例13同样组成的溶液。
从该结果可知在反应开始后24小时内,分别生成了9.41mg/L的L-Ala-L-Ala、7.85mg/L的L-Leu-L-Leu、或5.20mg/L的L-Phe-L-Phe。
实验例15 强化 ywfE基因表达的大肠杆菌的制作
使用PerSeptive Biosystems公司制备8905型DNA合成仪,合成分别具有序列号94~97表示的序列的DNA(以下,分别称为引物L、引物M、引物N、引物O)。序列号94是添加在含有作为质粒pQE60ywfE的 ywfE基因的核糖体结合序列的Shine-Dalgarno序列区域5’端的含有 XhoI识别序列的序列。序列号95的序列是添加在与含有 ywfE基因的终止密码子的序列互补的序列的5’端的含有 BamHI识别序列的序列。而序列号96是添加在含有 trp启动子的表达载体pTrS30的trp启动子区域序列的5’端的含有 EcoRI识别序列的序列。序列号97是添加在与含有 trp启动子的表达载体pTrS30的 trp启动子区域的序列互补的序列号5’端的含有 XhoI识别序列的序列。
以质粒pQE60ywfE作为模板,在 ywfE基因片段的扩增中,使用上述的引物L和引物M,在 trp启动子区域的片段的扩增中使用引物N和引物O作为引物组进行PCR。PCR通过制备含有10ng的pQE60ywfE、0.5μmol/L的各引物、2.5units的 Pfu DNA聚合酶、4μL的 Pfu DNA聚合酶用×10缓冲液、200μmol/L的各dNTP的40μL的反应液,按照94℃下1分钟、55℃下2分钟、72℃下3分钟为一次循环,反复进行30次来实施。
将该反应液的1/10量进行琼脂糖凝胶电泳,确认在使用引物L和引物M的PCR中相当于 ywfE基因片段的约1.4kb、在使用引物N和引物O的反应中相当于 trp启动子区域的DNA片段的约0.3kb DNA片段分别扩增后,添加与剩下反应液等量的TE饱和酚/氯仿溶液,并混合。向该溶液经离心分离后得到的上层加2倍容量的冷乙醇,并混合,于-80℃下放置30分钟。将该溶液离心分离使DNA沉淀后,将该DNA溶解于20μL的TE。
使用上述得到的各个DNA溶液5μL,将用引物L和引物M扩增的DNA用限制酶 XhoI和 BamHI进行酶切,而使用引物N和引物O扩增的DNA用限制酶 EcoRI和 XhoI进行酶切,通过琼脂糖凝胶电泳将DNA片段分离后,使用geneclean II试剂盒,分别收集含有 ywfE的1.4kb和含有 trp启动子区域的0.3kb的DNA片段。
将含有0.2μg的 trp启动子的表达载体pTrS30用限制酶 EcoRI和 BamHI酶切后,通过琼脂糖凝胶电泳分离DNA片段,同样收集4.5kb的DNA片段。
使用连接试剂盒,使上述得到的含有 ywfE的1.4kb片段、含有 trp启动子区域的0.3kb片段和4.5kb的片段于16℃下进行16小时连接反应。
通过使用钙离子的方法用该反应液转化大肠杆菌NM522株后,涂布于含有50μg/ml的氨苄青霉素的LB琼脂培养基,于30℃下培养过夜。
根据众所周知的方法从生长繁殖的转化体菌落提取质粒,得到在trp启动子下游含有 ywfE基因的表达载体pPE56。通过限制酶消化确认了该载体的结构(图4)。
实验例16  pepD基因、 pepN基因、 pepB基因、 pepA基因和 dpp操纵子缺失株的制作
大肠杆菌染色体DNA上的特定基因缺失的菌株根据利用λ噬菌体的同源重组系的方法[Proc.Natl.Acad.Sci.USA, 97,6641-6645(2000)]进行制作。
以下所述的质粒pKD46、pKD3和pCP20使用通过从大肠杆菌基因贮存中心(美国耶鲁大学)获得保持该质粒的大肠杆菌株,通过众所周知的方法从该株提取的。
(1)基因缺失用DNA片段的克隆
以使存在于大肠杆菌K12株的染色体DNA上的具有序列号53表示的碱基序列的 pepD基因、具有序列号54表示的碱基序列的 pepN基因、具有序列号55表示的碱基序列的 pepB基因、具有序列号56表示的碱基序列的 pepA基因和具有序列号57表示的碱基序列的 dppA基因、具有序列号58表示的碱基序列的 dppB、具有序列号59表示的碱基序列的 dppC基因、具有序列号60表示的碱基序列的 dppD基因和具有序列号61表示的碱基序列的 dppF基因缺失为目的,使用PerSeptiveBiosystems公司制备8905型DNA合成仪,合成与位于大肠杆菌K12株的染色体DNA上的各个缺失靶基因的上游和下游的由36bp构成的碱基序列同源的碱基序列、和具有序列号52表示的来自酵母的Flp重组酶识别的碱基序列的DNA。但是 dppA基因、 dppB基因、 dppC基因、dppD基因和 dppF基因因为形成操纵子,合成与位于该操纵子的上游和下游的碱基序列同源的碱基序列的DNA。
即,分别合成由作为 pepD基因缺失用DNA片段扩增用引物组的序列号62和63、作为 pepN基因缺失用DNA片段扩增用引物组的序列号64和65、作为 pepA基因缺失用DNA片段扩增用引物组的序列号66和67、作为 pepB基因缺失用DNA片段扩增用引物组的序列号68和69、作为 dpp操纵子缺失用DNA片段扩增用引物组的序列号70和71表示的碱基序列构成的DNA。
然后使用上述合成DNA作为引物组,以pKD3DNA作为模板进行PCR。PCR通过使用含有10ng的质粒DNA、0.5μmol/L的各引物、2.5units的 Pfu DNA聚合酶、4μL的 Pfu DNA聚合酶用×10缓冲液、200μmol/L的各deoxyNTP的40μL反应液,按照94℃下1分钟、55℃下2分钟、72℃下3分钟为一次循环,反复进行30次来实施。
将各个反应液的1/10量进行琼脂糖凝胶电泳,确认目的片段扩增后,添加与剩下的反应液等量的TE饱和酚/氯仿,并进行混合。
将该混合液离心分离后,向得到的上层加2倍容量的冷乙醇,并混合,于-80℃下放置30分钟。对该溶液进行离心分离,取得含有 pepD基因、 pepN基因、 pepB基因、 pepA基因和 dpp操纵子缺失用氯霉素抗性基因的DNA片段。
(2) pepD基因缺失大肠杆菌JM101的制作
用pKD46转化大肠杆菌JM101株后,涂布于含有100mg/L的氨苄青霉素的LB琼脂培养基,通过于30℃下进行培养,选择带有pKD46的大肠杆菌JM101株(以下,称为大肠杆菌JM101/pKD46)。
质粒pKD46含有λRed重组酶基因,该基因的表达可以通过L-阿拉伯糖诱导。因此如果将在L-阿拉伯糖存在下能够生长繁殖的带有pKD46的大肠杆菌用直链状DNA进行转化,会高频率地发生同源重组。另外pKD46由于具有温度敏感性的复制起点,通过在42℃下使其生长繁殖,可以很容易地使质粒脱落。
通过电脉冲法将上述取得的含有 pepD基因缺失用氯霉素抗性基因的DNA片段导入在10mmol/L的L-阿拉伯糖和50μg/ml的氨苄青霉素存在下培养得到的大肠杆菌JM101/pKD46,将通过同源重组在大肠杆菌JM101的染色体DNA中转运了 pepD基因缺失用含有氯霉素抗性基因的DNA片段的转化株涂布于含有25mg/L的氯霉素的LB琼脂培养基(细菌培养用胰化蛋白胨10g/L、细菌培养用酵母提取物5g/L、氯化钠5g/L、琼脂15g/L),通过于30℃下培养进行选择。
将选择的氯霉素抗性株接种于含有25mg/L的氯霉素的LB琼脂培养基,于42℃下培养14小时后,进行单菌落分离。将得到的各菌落影印在含有25mg/L的氯霉素的LB琼脂培养基、以及含有100mg/l的氨苄青霉素的LB琼脂培养基,于37℃培养,通过选择表现出氯霉素抗性,而且表现出氨苄青霉素敏感性的菌落,取得pKD46脱落株。
然后使用pCP20转化上述得到的pKD46脱落株,通过在含有100mg/l的氨苄青霉素的LB琼脂培养基上进行选择,取得保持pCP20的pKD46脱落株。
质粒pCP20具有来自酵母的Flp重组酶基因,该基因的表达可以在42℃下进行诱导。
另外由于在上述制作的含有 pepD基因、 pepN基因、 pepB基因、pepA基因和 dpp操纵子缺失用氯霉素抗性基因的DNA片段的氯霉素抗性基因的两端存在Flp重组酶识别的碱基序列,通过Flp重组酶催化的同源重组可以很容易地使该抗性基因脱落。
另外由于pCP20含有温度敏感性的复制起点,通过使pCP20保持株在42℃下生长繁殖,可以同时诱导Flp重组酶的表达和pCP20的脱落。
将上述取得的带有pCP20的pKD46脱落株接种于没有添加药物的LB琼脂培养基,于42℃下培养14小时后,进行单菌落分离。将得到的各菌落影印在没有添加药物的LB琼脂培养基、含有25mg/L氯霉素的LB琼脂培养基和含有100mg/L氨苄青霉素的LB琼脂培养基,于30℃下培养,选择表现出氯霉素敏感性,而且表现出氨苄青霉素敏感性的菌落。
根据常规方法(生物工学实验书、日本生物工学会编97~98页、培风馆、1992年)从上述选择的各株制备各个染色体DNA。使用根据缺失靶基因 pepD基因的内部碱基序列设计的具有序列号84和85表示的碱基序列的DNA作为引物组,以染色体DNA作为模板进行PCR。PCR通过使用含有0.1g的染色体DNA、0.5μmol/L的各引物、2.5units的Pfu DNA聚合酶、4μL的 Pfu DNA聚合酶用×10缓冲液、200μmol/L的各deoxyNTP的40μL反应液,按照94℃下1分钟、55℃下2分钟、72℃下3分钟为一次循环,反复进行30次来实施。
在上述PCR中,将没有检测到扩增DNA片段的株作为 pepD基因缺失株,命名为大肠杆菌JPD1株。
(3)大肠杆菌JM101的染色体DNA上的 pepD基因和 pepN基因缺失株的制作
将上述(2)得到的大肠杆菌JPD1株用pKD46转化后,涂布于含有100mg/l氨苄青霉素的LB琼脂培养基,通过于30℃下进行培养,选择保持pKD46的大肠杆菌JPD1(以下,称为大肠杆菌JPD1/pKD46)。通过电脉冲法将含有 pepN基因缺失用氯霉素抗性基因的DNA片段导入大肠杆菌JPD1/pKD46,通过同源重组取得在大肠杆菌JPD1/pKD46的染色体DNA上转运了含有 pepN基因缺失用氯霉素抗性基因的DNA片段的转化株。
然后通过进行与上述(2)同样的操作,取得从染色体DNA上氯霉素抗性基因脱落的株,将该株命名为大肠杆菌JPDN2。
(4)大肠杆菌JM101的染色体DNA上的 pepN基因、 pepA基因、 pepB基因或 dpp操纵子缺失株和多重基因缺失株的制作
pepN基因、 pepA基因、 pepB基因或 dpp操纵子的缺失株使用上述(1)制作的含有各基因或操纵子缺失用氯霉素抗性基因的DNA片段,通过与上述(2)同样的方法进行制作。
通过上述方法取得的各个基因缺失株可以通过使用根据各个缺失基因的内部碱基序列设计、合成的具有序列号74~81表示的碱基序列的DNA作为引物组,通过与上述(2)同样的PCR确认。其中由序列号74和75表示的碱基序列构成的DNA为 pepN缺失确认用、由序列号76和77表示的碱基序列构成的DNA为 pepA缺失确认用、由序列号78和79表示的碱基序列构成的DNA为 pepB缺失确认用、由序列号80和81表示的碱基序列构成的DNA为 dpp操纵子缺失确认用引物组。
将上述方法取得的 dpp操纵子缺失株取名为大肠杆菌JDPP1株、pepN基因缺失株取名为大肠杆菌JPN1株、 pepA基因缺失株取名为大肠杆菌JPA1株、 pepB基因缺失株取名为大肠杆菌JPB7株。
另外根据上述(3)的方法,制作由 pepD基因、 pepN基因、 pepA基因、 pepB基因和 dpp操纵子中选择的2个以上基因或操纵子的多重缺失株。多重缺失株能够取得的确认通过与上述(2)同样的PCR确认。将用上述方法取得的 pepD基因和 dpp操纵子缺失的二重基因缺失株命名为大肠杆菌JPDP49株,将 pepB基因、 pepD基因和 pepN基因缺失的三重基因缺失株命名为大肠杆菌JPDNB43株,将 pepD基因、 pepN基因和 dpp操纵子缺失的三重基因缺失株命名为大肠杆菌JPNDDP36株,将 pepA基因、 pepD基因、 pepN基因和 dpp操纵子缺失的四重基因缺失株命名为大肠杆菌JPNDAP5株,将 pepB基因、 pepD基因、 pepN基因和 dpp操纵子缺失的四重基因缺失株命名为大肠杆菌JPNDBP7株。表2给出了各基因缺失株中缺失基因名。
表2
菌株名 缺失基因
JM101
JDPP1 dpp操纵子
JPN1 pepN
JPA1 pepA
JPB7 pepB
JPD1 pepD
JPDN2 pepD,pepN
JPNDB43 pepB,pepD,pepN
JPDP49 pepD,dpp操纵子
JPNDDP36 pepD,pepN,dpp操纵子
JPNDAP5 pepA,pepD,pepN,dpp操纵子
JPNDBP7 pepB,pepD,pepN,dpp操纵子
实验例17 使用肽酶和二肽转运活性丧失的大肠杆菌的L-Ala-L-Gln和L-Ala-L-Ala产率的评价
用实验例16得到的质粒pPE56转化实验例15得到的编码各种肽酶和二肽转运蛋白质的基因的缺失株,取得表现出氨苄青霉素抗性的转化株。
将得到的转化株接种于加入了含有50μg/ml的氨苄青霉素的8mlLB培养基的试管,于28℃下培养17小时。将1%该培养液添加到加入了含有100μg/ml的氨苄青霉素的8ml水性介质(磷酸氢二钾16g/L、磷酸二氢钾14g/L、硫酸铵5g/L、柠檬酸(无水)1g/L、Casaminoacid(Difco社制)0.5g/L、L-Pro1 g/L、L-Ala2.5 g/L、L-Gln2.5g/L、葡萄糖10g/l、维生素B110mg/L、硫酸镁·7水合物25mg/l、硫酸铁7水合物50mg/l、使用10mol/l的氢氧化钠溶液调整到pH7.2。L-Gln为10倍浓缩液经滤膜过滤灭菌后添加、葡萄糖、维生素B1、硫酸镁·7水合物、硫酸铁·7水合物分别蒸气灭菌后添加)的试管中,于30℃下反应24小时。将该水性介质进行离心分离,取得上清。
该上清中的产物用F-moc化法进行衍生化后,使用HPLC进行分析。通过HPLC进行分析,分离柱使用ODS-HG5(野村化学社制)、作为洗脱液使用A液(醋酸6ml/l、20%(v/v)乙腈、用三乙胺调整到pH4.8)和B液(醋酸6ml/l、70%(v/v)乙腈、用三乙胺调整到pH4.8),在分析开始后头5分钟,A液∶B液=8∶2,在5分~20分钟进行线性梯度洗脱,当20分钟时,使A液∶B液=1∶1的条件下进行。分析结果如表3所示。
表3
 菌株名  缺失基因     L-Ala-L-Gln(g/l)     L-Ala-L-Ala(g/l)
 JM101  无     0     0
 JDPP1  dpp操纵子     0.02     0.01
 JPN1  pepN     0.01     0.01
 JPA1  pepA     0.01     0.01
 JPB7  pepB     0.01     0.01
 JPD1  pepD     0.01     0.01
 JPDN2  pepD,pepN     0.02     0.03
 JPNDB43  pepB,pepD,pepN     0.05     0.12
 JPDP49  pepD,dpp操纵子     0.11     0.08
 JPNDDP36  pepD,pepN,dpp操纵子     0.16     0.21
 JPNDAP5  pepA,pepD,pepN,dpp操纵子     0.28     0.26
 JPNDBP7  pepB,pepD,pepN,dpp操纵子     0.43     0.22
由表3可知在2种以下肽酶基因缺失的微生物、仅1种肽转运蛋白质缺失的微生物中,二肽的生成、蓄积量低,而在1种以上肽酶基因和1种肽转运蛋白质缺失的微生物、或3种以上肽酶活性丧失的微生物中,二肽的生成、蓄积量大幅度增加。
实验例18 使用肽酶和肽转运蛋白质活性丧失的大肠杆菌株的L-丙氨酰-L-缬氨酸(以下,称为L-Ala-L-Val)产率的评价
与实验例17同样,用pPE56转化编码各种肽酶的基因和编码肽转运蛋白质的操纵子缺失的大肠杆菌株。将得到的转化株接种于加入了含有50μg/ml的氨苄青霉素的8ml LB培养基的试管,于28℃下培养17小时。将该培养液1%添加到加入了含100μg/ml氨苄青霉素的8ml水性介质(磷酸氢二钾16g/l、磷酸二氢钾14g/l、硫酸铵5g/l、柠檬酸(无水)1g/l、Casamino acid(Difco社制)0.5g/l、L-Pro1g/l、L-Ala2.5g/l、L-Val2.5g/l、葡萄糖10g/l、维生素B110mg/l、硫酸镁·7水合物25mg/l、硫酸铁·7水合物50mg/l、用10mol/l的氢氧化钠溶液调整到pH7.2。葡萄糖、维生素B1、硫酸镁·7水合物、硫酸铁·7水合物分别蒸煮后添加)的试管,于30℃下反应24小时。对该水性介质进行离心分离,取得上清。
通过实验例17所述的方法对该上清中的生成物进行分析。结果如表4所示。
表4
 菌株名  缺失基因     L-Ala-L-Val(g/l)
 JM101  无     0
 JDPP1  dpp操纵子     0
 JPN1  pepN     0
 JPA1  pepA     0
 JPB7  pepB     0
 JPD1  pepD     0
 JPDN2  pepD,pepN     0
 JPNDB43  pepB,pepD,pepN     0.04
 JPDP49  pepD,dpp操纵子     0.11
 JPNDDP36  pepD,pepN,dpp操纵子     0.22
 JPNDBP7  pepB,pepD,pepN,dpp操纵子     0.20
由表4可知2种以下肽酶基因缺失的微生物和只1种肽转运蛋白质缺失的微生物不生产二肽,3种以上肽酶基因缺失的微生物、或1种以上肽酶基因和1种肽转运蛋白质缺失的微生物生产二肽。
实验例19 使用肽酶和二肽转运系蛋白质的活性丧失的大肠杆菌株的甘氨酰-L-谷氨酰胺(以下,称为Gly-L-Gln)产率的评价
与实验例17同样,用pPE56转化编码各种肽酶的基因和编码二肽转运蛋白质的操纵子缺失株。将得到的转化株接种于加入了含有50μg/ml的氨苄青霉素的8ml LB培养基的试管,于28℃下培养17小时。
将该培养液1%添加到加入了含100μg/ml氨苄青霉素的8ml水性介质(磷酸氢二钾16g/l、磷酸二氢钾14g/l、硫酸铵5g/l、柠檬酸(无水)1g/l、Casamino acid(Difco社制)0.5g/L、L-Pro 1g/L、Gly2.5g/L、L-Gln2.5 g/L、葡萄糖10g/l、维生素B110mg/l、硫酸镁·7水合物25mg/l、硫酸铁·7水合物50mg/l、用10mol/l的氢氧化钠溶液调整到pH7.2。L-Gln为10倍浓缩液经滤膜过滤灭菌后添加、葡萄糖、维生素B1、硫酸镁·7水合物、硫酸铁·7水合物分别经蒸气灭菌后添加)的试管,于30℃下反应24小时。对该水性介质进行离心分离,取得上清。
通过实验例17所述的方法对该该上清中的生成物进行分析。结果如表5所示。
表5
 菌株名  缺失基因     Gly-L-Gln(g/l)
 JM101  无     0
 JDPP1  dpp操纵子     0
 JPDN2  pepD,pepN     0
 JPNDB43  pepB,pepD,pepN     0.01
 JPNDDP36  pepD,pepN,dpp操纵子     0.02
 JPNDBP7  pepB,pepD,pepN,dpp操纵子     0.03
由表5可知2种以下肽酶基因缺失的微生物、和只1种肽转运蛋白质缺失的微生物不生产二肽,3种以上肽酶缺失的微生物、或2种以上肽酶基因和1种肽转运蛋白质缺失的微生物生产二肽。
下面表示的是实施例,不过本发明不限于下述的实施例。
实验例1使用氨基酸和氨基酸衍生物作为底物的二肽衍生物的酶催化制备方法
制备由实验例4中取得的纯化的添加His-tag重组型酶40mg/L、100mmol/L的Tris-HCl(pH9.0)、30mmol/L的氯化镁、10mmol/L的ATP、各10mmol/L的表6记载的氨基酸或氨基酸衍生物组成的0.1ml反应液,于37℃下反应2小时。
反应结束后,向反应液中加反应液的100倍量的停止缓冲液(4mol/L尿素、100mmol/L EDTA·2钠盐),停止反应,通过使用HPLC对因酶反应消耗ATP时生成的ADP量进行分析,确认反应进行。利用HPLC分析,柱子使用Develosil C30-UG-5(150×4.6mm、野村化学公司生产)、移动相使用由200mmol/L的醋酸和200mmol/L的三乙基胺构成的溶液(pH6.6),流速1.0ml/分钟、室温、测定254nm的紫外吸收的条件下进行。结果如表6所示。
【表6-1】
    添加氨基酸     生成ADP量(mmol/L)
    不添加     0.05
    仅是Ala     0.13
    Ala+cyc(5)Ala     5.67
    Ala+cyc(3)Ala     3.64
    Ala+cyc(6)Ala     3.78
【表6-2】
    添加氨基酸     生成ADP量(mmol/L)
    不添加     0.05
    仅是Ala     0.13
    仅是Phe     0.02
    Ala+Phe     5.84
    Ala+Cl-Phe     4,78
    Cl-Ala+Phe     2.75
    CN-Ala+Phe     1.11
    Ala+Cl-Phe     4.78
    Ala+F-Phc     4.44
    Ala+Ni-Phe     4.42
    Ala+NH2-Phe     1.89
    Ala+Kynurenin     2.11
【表6-3】
    添加氨基酸     生成ADP量(mmol/L)
    不添加     0.05
    仅是Ala     0.13
    仅是Glu     0.13
    Ala+Glu(OMe)     2.60
    Ala+Glu(OEt)     3.93
    Ala+Glu(OtBu)     6.43
    Ala+Glu(OBzl)     6.01
【表6-4】
    添加氨基酸     生成ADP量(mmol/L)
    不添加     0.05
    仅是Ala     0.13
    仅是Asp     0.16
    Ala+Asp(OMe)     0.54
    Ala+Asp(OtBu)     4.42
    Ala+Asp(OBzl)     3.23
【表6-5】
    添加氨基酸     生成ADP量(mmol/L)
    不添加     0.05
    仅是Ala     0.13
    仅是Lys     0.17
    Ala+Lys(Ac)     0.75
    Ala+Lys(Boc)     3.64
表6-1是使用L-Ala和L-Ala衍生物、表6-2是使用L-Ala和L-Phe衍生物、表6-3是使用L-Ala和L-Glu衍生物、表6-4是使用L-Ala和L-Asp衍生物、表6-5是使用L-Ala和L-Lys衍生物作为底物的实验结果,作为底物使用的氨基酸和氨基酸衍生物的简称如下所示。
Ala:L-丙氨酸
Phe:L-苯丙氨酸
Glu:L-谷氨酸
Asp:L-天冬氨酸
Lys:L-赖氨酸
Cl-Ala:β-氯-L-丙氨酸
CN-Ala:β氰-L-丙氨酸
cyc(5)Ala:β-环五-DL-丙氨酸
cyc(3)Ala:β-环三丙氨酸
cyc(6)Ala:β-环六丙氨酸
Cl-Phe:4-氯苯丙氨酸
F-Phe:4-氟苯丙氨酸
Ni-Phe:p-镍苯丙氨酸
NH2-Phe:p-氨基苯丙氨酸
Phe-NH2:苯丙氨酸酰胺
Kynurenin:L-犬尿氨酸
Glu(OMe):谷氨酸-γ-甲酯
Glu(OEt):谷氨酸-γ-乙酯
Glu(OtBu):谷氨酸-γ-t丁酯
Glu(OBzl):谷氨酸-γ-苄酯
Asp(OMe):天冬氨酸-β-甲酯
Asp(OtBu):天冬氨酸-β-t丁酯
Asp(OBzl):天冬氨酸-β-苄酯
Lys(Ac):乙酰赖氨酸
Lys(Boc):Boc-赖氨酸
就象表6表示的那样,作为对照的没有添加底物区和在分别仅使用L-Ala、L-Phe、L-Glu、L-Asp、L-Lys作为单独底物的试验区的ADP生成量为0.02~0.1 mmol/L,而相反在表1给出的氨基酸和氨基酸衍生物的组合中,生成了0.54~6.43mmol/L的ADP。
另外,通过质子NMR分析,对在与上述同样反应条件反应的存在于反应液中的化合物的构造进行解析。但反应中使用的底物氨基酸和氨基酸衍生物的浓度,在反应液1、4、10和11中为20mmol/L、其它的反应液用10mmol/L的浓度。
质子NMR分析使用Bruker公司生产的DMX500,在以下的条件下进行。
温度:303K
标准物质:1mmpl/L的3-(Trimethylsilyl)-Propionic acid-D4sodium salt(TSP)
介质:反应液4、10和11为轻水、其它的反应液为重水
反应液中化合物的构造根据α位的质子化学位移进行鉴定。各化合物的浓度以TSP的面积作为内部标准,以α位的质子的信号面积为基础算出的(表7)。但是L-Ala-L-Ala由于浓度低、α位的质子的信号重合,所以以β位的质子的信号面积为基础算出。另外括号内表示各化合物的α位质子化学位移(单位为ppm)。
使用Cl-Ala和Phe作为底物的反应液(反应液1)
Cl-Ala(4.20)、Phe(4.02)、Cl-Ala-Phe(3.93,4.50)、Aziridine-2-carboxylic acid[Azc](2.73)、Azc-Phe(2.59,4.47)
使用CN-Ala和Phe作为底物的反应液(反应液2)
CN-Ala(3.87)、Phe(4.00)、CN-Ala-Phe(3.71,4.48)
使用Ala和Cl-Phe作为底物的反应液(反应液3)
Ala(3.79)、Cl-Phe(3.97)、Ala-Cl-Phe(3.90,4.43)
使用Ala和NH2-Phe作为底物的反应液(反应液4)
Ala(3.78)、NH2-Phe(3.93)、Ala-NH2-Phe(3.95,4.39)、Ala-Ala(β;1.55,1.36)
使用Ala和Kinurenine作为底物的反应液(反应液5)
Ala(3.79)、Kinurenine(4.16)、Ala-Kinurenine(3.96,4.64)
使用Ala和Phe-NH2作为底物的反应液(反应液6)
Ala(3.79)、Phe-NH2(4.02)、Ala-Phe-NH2(3.90,4.60)
使用Ala和Glu(OMe)作为底物的反应液(反应液7)
Ala(3.79)、Glu(OMe)(3.76)、Ala-Glu(OMe)(4.05,4.18)、Ala-Ala(β;1.55,1.36)
使用Ala和Glu(OtBu)作为底物的反应液(反应液8)
Ala(3.79)、Glu(OtBu)(3.76)、Ala-Glu(OtBu)(4.04,4.18)
使用Ala和Asp(OtBu)作为底物的反应液(反应液9)
Ala(3.g1)、Asp(OtBu)(3.98)、Ala-Asp(OtBu)(4.04,4.46)
使用Ala和Lys(Boc)作为底物的反应液(反应液10)
Ala(3.78)、Lys(Boc)(3.73)、Ala-Lys(Boc)(4.02,4.14)
使用Ala和cyc(3)Ala作为底物的反应液(反应液11)
Ala(3.78)、cyc(3)Ala(3.82)、Ala-cyc(3)Ala(4.08,4.24)
使用Ala和cyc(6)Ala作为底物的反应液(反应液12)
Ala(3.79)、cyc(6)Ala(3.76)、Ala-cyc(6)Ala(4.02,4.22)
【表7】
    反应液     二肽     浓度(mM)
    1     Cl-Ala-Phe     3.5
    Azc-Phc     5.3
    2     Cl-Ala     8.4
    (Cl-Ala)X2     Overlap
    3     Ala-Cl-Phe     4.3
    4     Ala-NH2-Phe     10.6
    Ala-Ala     0.3
    5     Ala-Kinurenine     4.0
    6     Ala-NH2-Phe     9.7
    7     Ala-Glu(OMe)     6.5
    Ala-Ala     0.5
    8     Ala-Glu(OtBu)     9.7
    9     Ala-Asp(OtBu)     10.6
    10     Ala-Lys(Boc)     6.6
    11     Ala-Cyc(3)Ala     10.5
    12     Ala-Cyc(6)Ala     6.6
表中的“overlap”表示由于信号重合,不能进行正确定量。
上述结果表明通过本发明的制备方法以氨基酸和氨基酸衍生物作为底物,可以直接制备由氨基酸和氨基酸衍生物通过肽键形成的二肽衍生物。
实验例2
N-[2-(乙酰氨基)丙酰]苯丙氨酸的制备
将实验例6中得到的L-Ala-L-phe(100mg,0.423mmol)悬浮于二氯甲烷(10mL),于室温下加吡啶(10mL)和无水醋酸(1mL,11mmol)。室温下搅拌24小时后,加水,用氯仿萃取3次。将有机层用饱和盐水清洗,用无水磷酸镁干燥后,通过减压下对溶剂进行蒸馏,得到N-[2-(乙酰氨基)丙酰]苯丙氨酸。
实验例3
1-{2-[N-(2-(乙酰氨基)丙酰)氨基]-3-苯丙酰}哌啶的制备
将实验例2得到的N-[2-(乙酰氨基)丙酰]苯丙氨酸(10mg,0.036mmol)悬浮于N,N-二甲基甲酰胺(5mL),于室温下加1-(3-二甲基氨基丙基)-3-乙基碳二亚胺盐酸盐(14mg,0.073mmol)、1-羟基苯并三唑基(15mg,0.11mmol)和哌啶(40μL,0.40mmol),在50℃下搅拌24小时。向反应混合物中加水,用氯仿萃取3次。将有机层用10%盐酸和饱和盐水清洗,用无水磷酸镁干燥后,在减压下将溶剂蒸馏。通过将得到的残留物用硅胶柱层析进行纯化,得到1-{2-[N-(2-(乙酰氨基)丙酰)氨基]-3-苯丙酰}哌啶。
序列表Free Text
序列号19-人工序列的说明:合成DNA
序列号20-人工序列的说明:合成DNA
序列号21-人工序列的说明:合成DNA
序列号22-人工序列的说明:合成DNA
序列号23-人工序列的说明:合成DNA
序列号24-人工序列的说明:合成DNA
序列号25-人工序列的说明:合成DNA
序列号26-人工序列的说明:合成DNA
序列号27-人工序列的说明:合成DNA
序列号28-人工序列的说明:合成DNA
序列号29-人工序列的说明:合成DNA
序列号30-人工序列的说明:合成DNA
序列号31-人工序列的说明:合成DNA
序列号32-人工序列的说明:合成DNA
序列号33-人工序列的说明:数据库检索中使用的氨基酸序列
序列号34-人工序列的说明:数据库检索中使用的氨基酸序列
序列号35-人工序列的说明:数据库检索中使用的氨基酸序列
序列号41-人工序列的说明:合成DNA
序列号42-人工序列的说明:合成DNA
序列号52-人工序列的说明:合成DNA
序列号53-人工序列的说明:合成DNA
序列号54-人工序列的说明:合成DNA
序列号55-人工序列的说明:合成DNA
序列号56-人工序列的说明:合成DNA
序列号57-人工序列的说明:合成DNA
序列号58-人工序列的说明:合成DNA
序列号59-人工序列的说明:合成DNA
序列号60-人工序列的说明:合成DNA
序列号61-人工序列的说明:合成DNA
序列号62-人工序列的说明:合成DNA
序列号63-人工序列的说明:合成DNA
序列号64-人工序列的说明:合成DNA
序列号65-人工序列的说明:合成DNA
序列号66-人工序列的说明:合成DNA
序列号67-人工序列的说明:合成DNA
序列号68-人工序列的说明:合成DNA
序列号69-人工序列的说明:合成DNA
序列号70-人工序列的说明:合成DNA
序列号71-人工序列的说明:合成DNA
序列号72-人工序列的说明:合成DNA
序列号73-人工序列的说明:合成DNA
序列号74-人工序列的说明:合成DNA
序列号75-人工序列的说明:合成DNA
序列号76-人工序列的说明:合成DNA
序列号77-人工序列的说明:合成DNA
序列号78-人工序列的说明:合成DNA
序列号79-人工序列的说明:合成DNA
序列号80-人工序列的说明:合成DNA
序列号81-人工序列的说明:合成DNA
序列号82-人工序列的说明:合成DNA
序列号83-人工序列的说明:合成DNA
序列号84-人工序列的说明:合成DNA
序列号85-人工序列的说明:合成DNA
<110>协和发酵工业株式会社
<120>二肽或二肽衍生物的制备方法
<130>1000P11696WO0
<150>JP2004-189008
<151>2004-06-25
<160>85
<170>PatentIn Ver.2.1
<210>1
<211>472
<212>PRT
<213>枯草芽孢杆菌168(Bacillus subtilis 168)
<400>1
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
  1                5                   10                   15
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
              20                   25                   30
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
         35                   40                   45
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
     50                   55                   60
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
 65                   70                   75                  80
His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
                  85                   90                   95
Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
            100                      105              110
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
        115                  120                  125
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
    130                  135                  140
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145                  150                  155                  160
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
                 165                 170                   175
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
            180                  185                  190
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
        195                  200                  205
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
    210                  215                  220
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225                  230                  235                 240
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
                 245                  250                  255
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
            260                  265                  270
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
        275                  280                  285
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
    290                  295                  300
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305                  310                  315                 320
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
                 325                  330                 335
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
             340                 345                  350
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
        355                  360                  365
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
    370                  375                  380
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385                  390                  395                 400
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
                 405                  410                  415
Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
            420                  425                   430
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
        435                  440                  445
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
    450                  455                  460
 Thr Ala Lys Tyr Val Leu Pro Val
 465                  470
<210>2
<211>472
<212>PRT
<213>枯草芽孢杆菌ATCC6633
<400>2
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
  1                5                   10                   15
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
             20                   25                   30
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
         35                   40                   45
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Gln Ser
     50                   55                   60
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
 65                    70                  75                  80
His Asp Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
                  85                   90                   95
Gln Met Phe Glu Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
            100                  105                   110
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
        115                  120                  125
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
    130                  135                  140
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145                  150                  155                  160
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
                 165                 170                   175
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
             180                 185                  190
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
        195                  200                  205
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
    210                  215                  220
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225                  230                  235                 240
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
                 245                  250                 255
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
            260                  265                  270
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
        275                  280                  285
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
    290                  295                  300
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305                  310                  315                 320
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
                 325                  330                  335
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
             340                 345                  350
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
        355                  360                  365
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
    370                  375                  380
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385                  390                  395                 400
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
                 405                 410                  415
Thr Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
            420                  425                  430
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
        435                  440                  445
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
    450                  455                  460
Thr Ala Lys Tyr Val Leu Pro Val
465                  470
<210>3
<211>472
<212>PRT
<213>枯草芽孢杆菌IAM1213
<400>3
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
  1                5                   10                   15
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
              20                   25                  30
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
         35                   40                   45
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
     50                   55                   60
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
 65                   70                   75                  80
His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
                  85                   90                   95
Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
            100                   105                 110
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
        115                  120                  125
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
    130                  135                  140
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145                  150                  155                 160
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
                 165                  170                 175
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
            180                  185                  190
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
        195                  200                  205
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
    210                  215                  220
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225                  230                  235                 240
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
                245                   250                 255
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
            260                  265                  270
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
        275                  280                  285
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
    290                  295                  300
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305                  310                  315                 320
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
                 325                  330                 335
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
            340                  345                  350
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
        355                  360                  365
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
    370                  375                  380
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385                  390                  395                 400
Ala Ile Asp Leu Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
                405                   410                 415
Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
            420                  425                  430
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
        435                  440                  445
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
    450                  455                  460
Thr Ala Lys Tyr Val Leu Pro Val
465                  470
<210>4
<211>472
<212>PRT
<213>枯草芽孢杆菌IAM1107
<400>4
Met Glu Arg Lys Thr Val Leu Val lle Ala Asp Leu Gly Gly Cys Pro
  1                5                   10                   15
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
             20                   25                   30
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
         35                   40                   45
Glu Lys Tyr Ser Val Ala Val Val Lys Asp Lys Asp Tyr Phe Lys Ser
     50                   55                   60
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
 65                   70                   75                  80
His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
                  85                   90                   95
Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
            100                  105                  110
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
        115                  120                  125
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
    130                  135                  140
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145                  150                  155                  160
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
                 165                  170                 175
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
            180                  185                  190
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
        195                  200                  205
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
    210                  215                  220
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225                  230                  235                  240
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
                 245                  250                 255
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
            260                  265                  270
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
        275                  280                  285
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
    290                  295                  300
Asn Cys Ala Thr His Thr Glu Val Lys Leu Met Lys Asn Arg Glu Pro
305                  310                  315                  320
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
                 325                  330                 335
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
            340                  345                  350
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
        355                  360                  365
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
    370                  375                  380
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385                  390                 395                   400
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Phe
                 405                  410                 415
Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
            420                  425                  430
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
         435                  440                 445
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
    450                  455                  460
Thr Ala Lys Tyr Val Leu Pro Val
465                  470
<210>5
<211>472
<212>PRT
<213>枯草芽孢杆菌IAM1214
<400>5
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
  1                5                   10                   15
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
              20                  25                   30
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
         35                   40                   45
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Gln Ser
     50                   55                   60
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
 65                   70                   75                  80
His Asp Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
                  85                   90                   95
Gln Met Phe Glu Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
            100                  105                  110
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
        115                  120                  125
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
    130                  135                  140
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145                  150                  155                  160
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
                 165                  170                  175
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
            180                  185                  190
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
        195                  200                  205
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
    210                  215                  220
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225                  230                  235                  240
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
                 245                  250                  255
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
            260                  265                  270
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
        275                  280                  285
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
    290                  295                  300
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305                 310                   315                 320
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
                 325                  330                 335
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
            340                   345                 350
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
        355                  360                  365
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
    370                  375                  380
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385                 390                  395                  400
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
                405                  410                  415
Thr Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
            420                  425                  430
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
        435                  440                  445
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
    450                  455                  460
Thr Ala Lys Tyr Val Leu Pro Val
465                  470
<210>6
<211>472
<212>PRT
<213>枯草芽孢杆菌ATCC21555
<400>6
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
  1                5                   10                   15
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
             20                   25                   30
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
         35                   40                   45
Glu Lys Tyr Ser Ile Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
     50                   55                   60
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
 65                   70                   75                  80
His Asp Lys Pro Glu Glu Glu Val Val Glu Glu Ile Val Lys Val Ala
                  85                   90                  95
Asp Met Phe Gly Val Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
             100                  105                  110
Ala Pro Met Ala Lys Ala Cys Lys Arg Leu Gly Leu Arg Gly Ala Gly
        115                  120                  125
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Ala Ala
    130                  135                  140
Phe Asn Arg Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145                  150                  155                  160
Leu Glu Asp Phe Arg Ala Ala Leu Gln Glu Ile Gly Thr Pro Leu Ile
                 165                  170                  175
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Lys
            180                  185                  190
Glu Met Glu Thr Ala Glu Ala Glu Phe Asn Arg Val Asn Glu Tyr Leu
        195                  200                  205
Lys Ser Ile Asn Val Pro Lys Ala Va1 Thr Phe Glu Ala Pro Phe Ile
    210                  215                  220
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Asp Asp Trp Tyr Glu Thr Ser
225                  230                  235                  240
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
                 245                  250                 255
Tyr Phe Pro Val Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
            260                  265                  270
Glu Thr Ala His Ile Thr Pro Ser Ile Leu Asp Asp Asp Ala Lys Arg
        275                  280                  285
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Glu
    290                  295                  300
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Ala
305                  310                  315                 320
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
                 325                  330                 335
Asn Ile Lys Lys Val Phe Gly Val Asp Met Ala Gln Leu Leu Leu Asp
             340                 345                  350
Val Leu Cys Tyr Gly Lys Glu Ala Asp Leu Pro Lys Gly Leu Leu Glu
        355                  360                  365
Gln Glu Pro Cys Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
    370                  375                  380
Lys Glu Asn Gly Gln Leu Pro Glu Thr Val Val Asp Phe Val Ile Glu
385                  390                  395                  400
Ser Ile Glu Ile Pro Asp Gly Val Leu Lys Gly Asp Thr Glu Leu Val
                405                  410                  415
Ser Phe Ser Ala Ala Glu Ala Gly Thr Ser Val Asp Leu Arg Leu Phe
            420                  425                  430
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
        435                  440                  445
Asn Asp Val Ala Glu Ser Ile Lys Gln Ile Gln Gln Gln Ala Lys Leu
    450                  455                  460
Thr Ala Lys Tyr Ala Leu Ser Val
465                  470
<210>7
<211>472
<212>PRT
<213>解淀粉芽孢杆菌IFO3022(Bacillus amylolliquefaciens IFO3022)
<400>7
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
  1                5                   10                   15
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
             20                   25                   30
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
          35                  40                   45
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
     50                   55                   60
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
 65                   70                   75                  80
His Asp Lys Pro Glu Glu Glu Val Val Glu Glu Ile Val Lys Val Ala
                  85                   90                   95
Gly Met Phe Ala Val Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
            100                  105                  110
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
        115                  120                  125
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Ala Ala
    130                  135                  140
Phe Asn Arg Ala Gly Val Lys Ser Ile Lys Asn Arg Arg Val Thr Thr
145                  150                  155                 160
Leu Glu Asp Phe Arg Ala Ala Leu Gln Glu Ile Gly Thr Pro Leu Ile
                 165                  170                 175
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Lys
            180                  185                  190
Glu Arg Glu Thr Ala Glu Ala Glu Phe Asn Arg Val Asn Glu Tyr Leu
        195                  200                  205
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
    210                  215                  220
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Asp Asp Trp Tyr Glu Thr Ser
225                  230                  235                 240
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
                 245                  250                 255
Tyr Phe Pro Val Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
             260                 265                  270
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Asp Asp Ala Lys Arg
        275                  280                  285
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Glu
    290                  295                  300
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Ala
305                  310                  315                 320
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
                 325                  330                 335
Asn Ile Lys Lys Val Phe Gly Val Asp Met Ala Gln Leu Leu Leu Asp
            340                  345                  350
Val Leu Cys Phe Gly Lys Glu Ala Asp Leu Pro Lys Gly Leu Leu Glu
        355                  360                  365
Gln Glu Pro Cys Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
    370                  375                  380
Lys Glu Asn Gly Gln Leu Pro Glu Thr Ala Val Asp Phe Val Ile Glu
385                  390                  395                 400
Ser Ile Asp Ile Pro Asp Gly Val Leu Lys Gly Asp Thr Glu Ile Val
                 405                  410                 415
Ser Phe Ser Ala Ala Glu Ala Gly Thr Ser Val Asp Leu Arg Leu Phe
            420                  425                  430
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
        435                  440                  445
Gly Asp Val Ala Glu Ser Ile Lys Gln Ile Gln Gln Gln Ala Lys Leu
    450                  455                  460
Thr Ala Lys Tyr Ala Leu Pro Val
465                  470
<210>8
<211>476
<212>PRT
<213>短小芽孢杆菌NRRL B-12025Bacillus pumilus NRRL B-12025)
<400>26
Val Leu Ser Leu Ser Lys Lys Thr Val Leu Val Ile Ala Asp Leu Gly
  1                5                   10                  15
Gly Cys Pro Pro His Met Phe Tyr Glu Ser Val Ala Ala Ser Tyr His
             20                   25                   30
Ile Val Ser Tyr Ile Pro Arg Pro Phe Ala Ile Thr Lys Gly His Ala
         35                   40                   45
Glu Leu Ile Glu Lys Tyr Ser Ile Ala Val Ile Lys Asp Arg Asp Tyr
     50                   55                   60
Phe Glu Thr His Pro Ser Phe Glu His Pro Asp Ser Ile Tyr Trp Ala
 65                   70                   75                  80
His Asp Asp Tyr Pro Lys Ser Glu Glu Glu Val Val Glu Asp Phe Ile
                  85                   90                  95
Arg Val Ala Ser Phe Phe Lys Ala Asp Ala Ile Thr Thr Asn Asn Glu
             100                  105                 110
Leu Phe Ile Ala Pro Met Ala Lys Ala Ala Glu Arg Leu Gly Leu Arg
        115                  120                  125
Gly Ala Gly Val Lys Ala Ala Glu Met Ala Arg Asp Lys Ser Gln Met
    130                  135                  140
Arg Ala Ala Phe Asn Ala Ser Gly Val Lys Ala Val Lys Thr Gln Pro
145                  150                  155                 160
Val Thr Thr Leu Ser Asp Phe Gln Gln Ala Ile Glu Ser Ile Gly Thr
                 165                 170                   175
Pro Leu Ile Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr
             180                 185                  190
Leu Phe His Asp Lys Ala Gly Ser Asp Asp Leu Phe Leu Gln Val Gln
         195                 200                  205
Ser Tyr Leu Glu Thr Ile Pro Val Pro Asp Ala Val Thr Tyr Glu Ala
    210                  215                  220
Pro Phe Val Ala Glu Thr Tyr Leu Glu Gly Ala Tyr Glu Asp Trp Tyr
225                  230                  235                  240
Glu Asp Glu Gly Tyr Ala Asp Tyr Val Ser Val Glu Gly Leu Val Val
                 245                 250                   255
Glu Gly Glu Tyr Leu Pro Phe Val Ile His Asp Lys Thr Pro Gln Ile
            260                  265                  270
Gly Phe Thr Glu Thr Ala His Ile Thr Pro Thr Ile Leu Asp Asn Glu
        275                  280                  285
Ala Lys Gln Ile Ile Ile Glu Ala Ala Arg Lys Ala Asn Glu Gly Leu
    290                  295                  300
Gly Leu Glu His Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn
305                  310                  315                 320
Arg Glu Thr Gly Leu Ile Glu Ala Ala Ala Arg Phe Ala Gly Trp Asn
                325                   330                 335
Met Ile Pro Asn Ile Lys Lys Val Phe Gly Val Asp Met Ala Lys Leu
             340                 345                  350
Leu Ile Asp Val Leu Val Asp Gly Lys Lys Ala Val Leu Pro Lys Gln
        355                  360                  365
Leu Leu Ser Gly His Thr Phe Tyr Val Ala Asp Cys His Leu Tyr Pro
    370                  375                  380
Gln His Phe Lys Glu Ser Gly Leu Ile Pro Pro Glu Ala Thr His Ile
385                  390                 395                  400
Thr Ile Asp His Val Ser Ile Pro Gln Glu Ala Phe Val Gly Asp Thr
                405                   410                 415
Ala Ile Val Ser Gln Ser Phe Pro Ala Lys Gly Thr Ile Val Asp Leu
            420                  425                  430
Glu Leu Phe Glu Ala Phe Asn Gly Ile Val Ser Leu Glu Leu Lys Gly
        435                  440                  445
Ser Ser Ser Gln Asp Val Ala Ala Ser Ile Arg Asn Ile Gln Lys Gln
    450                  455                  460
Ala Thr Ile Gln Leu Met Asp Glu Leu Val Lys Gly
465                  470                  475
<210>9
<211>1416
<212>DNA
<213>枯草芽孢杆菌168
<400>9
atg gag aga aaa aca gta ttg gtc atc gct gat ctt gga ggc tgc ccg     48
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
  1                5                  10                   15
ccg cac atg ttt tat aaa agc gct gct gaa aaa tat aac ctg gtc agc     96
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
             20                   25                   30
ttt att cca aga cct ttt gca att aca gcc tcc cat gca gca ttg att    144
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
         35                   40                   45
gaa aaa tac tcg gtc gcg gtc ata aaa gat aaa gac tat ttt aag agt    192
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
     50                   55                   60
tta gct gat ttt gaa cac cct gat tcc att tat tgg gcg cat gaa gat    240
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
 65                   70                   75                  80
cat aac aag cct gag gaa gag gtc gtc gag caa arc gtc aag gtt gcc    288
His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
                  85                   90                   95
gaa atg ttt ggg gcg gat gcc atc aca aca aac aat gaa tta ttc att    336
Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
             100                  105                 110
gct ccg atg gcg aaa gcc tgt gaa cgt ctg ggc ttg aga ggt gcc ggc    384
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
        115                  120                  125
gtg cag gca gcc gaa aat gcc aga gat aaa aat aaa atg agg gac gct    432
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
    130                  135                  140
ttt aat aag gcc gga gtc aaa tcg atc aaa aac aaa cga gtc aca act    480
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145                  150                 155                  160
ctt gaa gat ttc cgt gct gct ctt gaa gag atc ggc aca cct ctt atc    528
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
                 165                  170                 175
tta aag cct aca tac tta gcg agt tct atc ggt gta acg ctg att acg    576
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
            180                  185                  190
gac act gag acg gca gaa gat gaa ttt aac aga gtc aat gac tat ctg    624
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
        195                  200                  205
aaa tca att aac gtg cca aag gcg gtt acg ttt gaa gcg ccg ttt atc    672
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
    210                  215                  220
gct gaa gaa ttt tta cag ggt gag tac gga gac tgg tat caa aca gaa    720
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225                  230                  235                 240
ggg tac tcc gac tat atc agt ata gaa ggc atc atg gct gac ggt gag    768
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
                 245                  250                 255
tat ttc ccg atc gcc att cat gat aaa acg ccg caa atc ggg ttt aca    816
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
            260                  265                  270
gag aca tcc cac att acg ccg tcc att ctg gat gaa gag gca aaa aag    864
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
        275                  280                  285
aaa att gtc gaa gct gcc aaa aag gca aat gaa ggg ctt gga ctg caa    912
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
    290                  295                  300
aat tgc gca aca cat aca gag atc aag cta atg aaa aac aga gaa ccg    960
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305                  310                  315                 320
ggt tta ata gag tcg gca gcc aga ttt gcc ggc tgg aat atg atc ccc   1008
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
                325                   330                 335
aat att aaa aag gtc ttt ggc ctt gat atg gcg caa tta tta tta gat   1056
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
            340                  345                  350
gtc ctc tgt ttc gga aaa gac gcc gat ctg ccg gac gga tta ttg gat   1104
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
        355                  360                  365
caa gag cct tat tat gtt gcc gac tgc cat ttg tac ccg cag cat ttc   1152
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
    370                  375                  380
aaa caa aat ggc caa att cct gaa act gct gag gat ttg gtc att gaa   1200
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385                  390                  395                  400
gcg atc gat att ccg gac ggg ctt tta aaa ggg gat act gaa atc gtt   1248
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
                 405                 410                  415
tct ttt tcg gcc gca gca cca ggc act tca gtt gat ttg aca ttg ttt   1296
Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
            420                  425                  430
gaa gct ttc aat tcc att gct gca ttt gaa ctg aaa ggc agt aat tca   1344
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
        435                  440                  445
cag gat gtg gct gaa tca atc aga caa att cag cag cat gcg aag ctg   1392
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
    450                  455                  460
acg gca aag tat gtg ctg cca gta                                   1416
Thr Ala Lys Tyr Val Leu Pro Val
465                  470
<210>10
<211>1416
<212>DNA
<213>枯草芽孢杆菌ATCC6633
<400>10
atg gag aga aaa aca gta ttg gtc atc gct gat ctt gga ggc tgc ccg    48
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
  1                5                  10                    15
ccg cac atg ttt tat aaa agc gct gct gaa aaa tat aac ctg gtt agc    96
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
             20                   25                   30
ttt att ccg aga cct ttt gca ata aca gcc tcc cat gca gca ctg att   144
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
         35                   40                   45
gaa aaa tac tcg gtc gcg gtc ata aaa gat aaa gac tat ttt cag agc   192
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Gln Ser
     50                   55                   60
tta gct gat ttt gag cat ccc gat tca att tat tgg gcg cat gag gat   240
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
 65                   70                   75                  80
cat gac aag cct gaa gaa gag gtt gtc gag caa atc gtc aag gtt gcc   288
His Asp Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
                  85                   90                  95
caa atg ttt gag gcg gac gcc atc aca aca aac aat gaa tta ttc att   336
Gln Met Phe Glu Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
             100                 105                  110
gcc ccg atg gcg aaa gcc tgt gaa cgc ctt ggc ctg agg ggc gcc gga   384
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
        115                  120                  125
gtg cag gca gcg gaa aat gcc aga gat aaa aat aaa atg agg gac gct   432
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
    130                  135                  140
ttt aat aag gcg gga gtc aaa tcg atc aaa aac aaa cga gtc aca act    480
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145                  150                  155                 160
ctt gag gat ttt cgt gct gca ctt gaa gag atc ggc aca cct cta atc    528
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
                 165                  170                 175
tta aag cct aca tac tta gcg agt tca atc ggc gta acg ctg att acc    576
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
            180                  185                  190
gac acg gag acg gca gaa gat gaa ttt aac aga gtc aat gac tac ctg    624
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
        195                  200                  205
aaa tcg att aac gtg ccg aag gcg gtc aca ttt gaa gca ccg ttt att    672
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
    210                  215                  220
gct gag gaa ttt tta cag ggt gag tac gga gac tgg tat caa aca gaa    720
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225                  230                  235                 240
ggg tac tcc gac tat atc agc ata gaa ggc att atg gca gat ggt gag    768
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
                 245                  250                 255
tat ttt ccg atc gcc att cat gac aaa acg ccg caa att gga ttt aca    816
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
            260                  265                  270
gag aca tca cat att acg cca tcc att ctg gat gaa gag gcg aaa aag    864
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
        275                  280                  285
aaa att gtc gaa gcg gct aaa aag gca aat gaa ggg ctt gga ctg caa    912
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
    290                  295                  300
aat tgc gca aca cat aca gaa atc aag cta atg aaa aac aga gaa ccg    960
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305                  310                  315                  320
ggt tta ata gag tcg gct gcc aga ttc gca ggc tgg aat atg att cct    1008
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
                 325                  330                 335
aac att aaa aag gtt ttc ggc ctt gat atg gcg caa tta tta tta gat    1056
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
            340                   345                 350
gtt ctc tgt ttc gga aaa gat gct gat ctg ccg gac ggg tta ttg gat    1104
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
        355                  360                  365
caa gag cct tac tat gtt gct gac tgc cat ctg tac cct cag cat ttc    1152
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
    370                  375                  380
aaa caa aat  ggc cag atc cct gaa act gcc gag gat ttg gta atc gaa   1200
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385                  390                  395                 400
gcg atc gat att ccg gat ggg ctt ttg aag ggt gat aca gaa atc gtt    1248
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
                 405                  410                 415
act ttt tcg gct gcg gca cca gga aca tca gtt gat ttg aca ctg ttt    1296
Thr Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
            420                  425                  430
gaa gcc ttc aac tcc att gct gca ttt gaa ctg aaa ggc agc aat tca    1344
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
        435                  440                  445
cag gat gtg gct gaa tca atc aga caa att cag cag cat gcg aag ctg    1392
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
    450                  455                  460
acg gca aag tat gtg ctg cca gta                                    1416
Thr Ala Lys Tyr Val Leu Pro Val
465                  470
<210>11
<211>1416
<212>DNA
<213>枯草芽孢杆菌IAM1213
<400>11
atg gag aga aaa aca gta ttg gtc atc gct gat ctt gga ggc tgc ccg    48
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
  1                5                   10                   15
ccg cac atg ttt tat aaa agc gct gct gaa aaa tat aac ctg gtc agc    96
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
              20                   25                  30
ttt att cca aga cct ttt gca att aca gcc tcc cat gca gca ttg att   144
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
         35                   40                   45
gaa aaa tac tcg gtc gcg gtc ata aaa gat aaa gac tat ttt aag agt   192
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
     50                   55                    60
tta gct gat ttt gag cat cct gac tcc att tat tgg gcg cat gag gat   240
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
 65                   70                   75                  80
cat aac aag cct gag gaa gag gtc gtc gag caa atc gtc aag gtt gcc   288
His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
                  85                   90                  95
gaa atg ttt ggg gcg gat gcc atc aca aca aac aat gaa tta ttc att   336
Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
             100                  105                 110
gct ccg atg gcg aaa gcc tgt gaa cgt ctg ggc ctg aga ggt gcc ggc   384
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
        115                  120                  125
gtg cag gca gcc gaa aat gcc aga gat aaa aat aaa atg agg gac gct   432
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
    130                  135                  140
ttt aat aag gcc gga gtc aaa tcg atc aaa aac aaa cga gtc aca act   480
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145                  150                  155                  160
ctc gaa gat ttc cgt gct gct ctt gaa gag atc ggc aca cct ctt atc    528
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
                 165                  170                 175
tta aag cct aca tac tta gcg agt tca atc ggt gta acg ctg att acg    576
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
            180                  185                  190
gac act gag acg gca gaa gat gaa ttt aac aga gtc aat gac tat ctg    624
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
        195                  200                 205
aaa tca att aac gtg cca aag gcg gtt acg ttt gaa gcg ccg ttt atc    672
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
    210                  215                  220
gct gaa gaa ttt tta cag ggt gag tac gga gac tgg tat caa aca gaa    720
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225                  230                  235                 240
ggg tac tcc gac tat atc agt ata gaa ggc atc atg gct gac ggt gag    768
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
                 245                  250                 255
tat ttc ccg atc gcc att cat gat aaa acg ccg caa atc ggg ttt aca    816
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
            260                  265                  270
gag aca tcc cac att acg ccg tcc att ctg gat gaa gag gca aaa aag    864
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
        275                  280                  285
aaa att gtc gaa gct gcc aaa aag gca aat gaa ggt ctt ggc ctg caa    912
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
    290                  295                  300
aat tgc gca aca cat aca gag atc aag cta atg aaa aat aga gaa ccg    960
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305                  310                 315                   320
ggt tta att gaa tcg gca gcc aga ttc gcc ggc tgg aat atg atc ccc    1008
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
                325                  330                   335
aat att aaa aag gtc ttt ggc ctt gat atg gcg caa tta tta tta gat    1056
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
            340                  345                  350
gtc ctt tgt ttc gga aaa gac gcc gat ctg ccg gac gga tta ttg gat    1104
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
        355                  360                  365
caa gag cct tat tat gtt gcc gac tgc cat ttg tac ccg caa cat ttc    1152
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
    370                  375                  380
aaa caa aat ggc cag att cca gaa act gct gag gat ttg gtc att gaa    1200
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385                 390                   395                 400
gcg atc gat ctg cct gac ggg ctt tta aaa ggg gat act gag atc gtt    1248
Ala Ile Asp Leu Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
                 405                  410                 415
tct ttt tcg gcc gca gca cca gga act tca gtt gat ttg aca ttg ttt    1296
Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
            420                  425                  430
gaa gct ttc aat tcc att gct gca ttt gaa ctg aaa ggc agt aat tca    1344
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
        435                   440                 445
cag gat gtg gct gaa tca atc aga caa att cag cag cat gcg aag ctg    1392
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
    450                  455                  460
acg gca aag tat gtg ctg cca gta                                    1416
Thr Ala Lys Tyr Val Leu Pro Val
465                  470
<210>12
<211>1416
<212>DNA
<213>枯草芽孢杆菌IAM1107
<400>12
atg gag aga aaa aca gta ttg gtc atc gct gat ctt gga ggc tgc ccg    48
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
  1                5                  10                    15
ccg cac atg ttt tat aaa agc gct gct gaa aaa tat aac ctg gtc agc    96
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
             20                   25                   30
ttt att cca aga cct ttt gca att aca gcc tcc cat gca gca ttg att   144
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
         35                   40                   45
gaa aaa tac tcg gtc gcg gtc gta aaa gat aaa gac tat ttt aag agt   192
Glu Lys Tyr Ser Val Ala Val Val Lys Asp Lys Asp Tyr Phe Lys Ser
     50                   55                   60
tta gct gat ttt gag cat cct gac tcc att tat tgg gcg cat gag gat   240
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
 65                   70                   580
cat aac aag cct gag gaa gag gtc gtc gag caa atc gtc aag gtt gcc   288
His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
                  85                   90                   95
 gaa atg ttc ggg gcg gat gcc atc aca aca aac aat gaa tta ttc att  336
Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
             100                  105                 110
gct ccg atg gcg aaa gcc tgt gaa cgt ctg ggc ttg aga ggt gcc ggc   384
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
        115                   120                 125
gtg cag gca gcc gaa aat gcc aga gat aaa aat aaa atg agg gac gct   432
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
    130                  135                  140
ttt aat aag gcc gga gtc aaa tcg atc aaa aac aaa cga gtc aca act   480
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145                  150                  155                  160
ctt gaa gat ttc cgt gct gct ctt gaa gag atc ggc aca cct ctt atc    528
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
                 165                  170                175
tta aag cct aca tac tta gcg agt tct atc ggt gta acg ctg att acg    576
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
            180                  185                  190
gac act gag acg gca gaa gat gaa ttt aac aga gtc aat gac tat ctg    624
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
        195                  200                  205
aaa tca att aac gtg cca aag gcg gtt acg ttt gaa gcg ccg ttt atc    672
Lys Ser Ile Asn Val Pro Lys Ala Val ThrPhe Glu Ala Pro Phe Ile
    210                  215                 220
gct gaa gaa ttt tta cag ggt gag tac gga gac tgg tat caa aca gaa    720
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225                  230                  235                 240
ggg tac tcc gac tat atc agt ata gaa ggc atc atg gct gac ggt gag    768
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
                 245                  250                 255
tat ttc ccg atc gcc att cat gat aaa acg ccg caa atc ggg ttt aca    816
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
            260                  265                  270
gag aca tcc cac att acg ccg tcc att ctg gat gaa gag gca aaa aag    864
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
        275                  280                  285
aaa att gtc gaa gct gcc aaa aag gca aat gaa ggg ctt ggc ctg caa    912
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
    290                  295                  300
aat tgc gca aca cat aca gag gtc aag cta atg aaa aac aga gaa ccg    960
Asn Cys Ala Thr His Thr Glu Val Lys Leu Met Lys Asn Arg Glu Pro
305                  310                  315                  320
ggt tta att gaa tcg gca gcc aga ttt gcc ggc tgg aat atg atc cct   1008
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
                 325                 330                  335
aac att aaa aag gtt ttc ggc ctt gat atg gcg caa tta tta tta gat   1056
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
             340                 345                  350
gtc ctc tgt ttc gga aaa gat gcc gat ctg ccg gac gga tta ttg gat   1104
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
        355                  360                  365
caa gag cct tac tat gtc gcc gac tgc cat ttg tac ccg cag cat ttc   1152
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
    370                  375                  380
aaa caa aat ggc cag att cca gaa acc gct gag gat ttg gtc att gaa   1200
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385                  390                  395                 400
gcg atc gat att ccg gac ggg ctt tta aaa ggg gat act gaa atc ttt   1248
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Phe
                 405                 410                  415
tct ttt tcg gcc gca gca cea ggc act tca gtt gat ttg aca ttg ttt   1296
Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
            420                  425                  430
gaa gct ttc aat tcc att gct gca ttt gaa ctg aaa ggc agt aat rca   1344
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
        435                  440                  445
cag gat gtg gct gaa tca atc aga caa att cag cag cat gcg aag ctg   1392
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
    450                  455                  460
acg gca aag tat gtg ctg cca gta                                   1416
Thr Ala Lys Tyr Val Leu Pro Val
465                 470
<210>13
<211>1416
<212>DNA
<213>枯草芽孢杆菌IAM1214
<400>13
atg gag aga aaa aca gta ttg gtc atc gct gat ctt gga ggc tgc ccg    48
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
  1                5                   10                   15
ccg cac atg ttt tat aaa agc gct gct gaa aaa tat aac ctg gtt  agc    96
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
             20                   25                   30
ttt att ccg aga cct ttt gca ata aca gcc tcc cat gca gca ctg att    144
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
         35                   40                   45
gaa aaa tac tcg gtc gcg gtc ata aaa gat aaa gac tat ttt cag agc    192
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Gln Ser
     50                   55                   60
tta gct gat ttt gag cat ccc gat tca att tat tgg gcg cat gag gat    240
Leu Ala Asp Phe Glu His ProAsp Ser Ile Tyr Trp Ala His Glu Asp
 65                   70                  75                  80
cat gac aag cct gaa gaa gag gtt gtc gag caa atc gtc aag gtt gcc    288
His Asp Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
                  85                   90                  95
caa atg ttt gag gcg gac gcc atc aca aca aac aat gaa tta ttc att    336
Gln Met Phe Glu Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
             100                  105                 110
gcc ccg atg gcg aaa gcc tgt gaa cgc ctt ggc ctg agg ggc gcc gga    384
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
        115                  120                  125
gtg cag gca gcg gaa aat gcc aga gat aaa aat aaa atg agg gac gct    432
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
    130                  135                  140
ttt aat aag gcg gga gtc aaa tcg atc aaa aac aaa cga gtc aca act    480
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145                  150                  155                  160
ctt gag gat ttt cgt gct gca ctt gaa gag atc ggc aca cct cta atc    528
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
                 165                  170                 175
tta aag cct aca tac tta gcg agt tca atc ggc gta acg ctg att acc    576
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
            180                  185                   190
gac acg gag acg gca gaa gat gaa ttt aac aga gtc aat gac tac ctg    624
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
        195                  200                  205
aaa tcg att aac gtg ccg aag gcg gtc aca ttt gaa gca ccg ttt att    672
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
    210                  215                  220
gct gag gaa ttt tta cag ggt gag tac gga gac tgg tat caa aca gaa    720
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225                 230                  235                  240
ggg tac tcc gac tat atc agc ata gaa ggc att atg gca gat ggt gag    768
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
                 245                  250                 255
tat ttt ccg atc gcc att cat gac aaa acg ccg caa att gga ttt aca    816
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
            260                  265                  270
gag aca tca cat att acg cca tcc att ctg gat gaa gag gcg aaa aag    864
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
        275                  280                  285
aaa att gtc gaa gcg gct aaa aag gca aat gaa ggg ctt gga ctg caa    912
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
    290                  295                  300
aat tgc gca aca cat aca gaa atc aag cta atg aaa aac aga gaa ccg    960
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305                  310                  315                  320
ggt tta ata gag tcg gct gcc aga ttc gca ggc tgg aat atg att cct   1008
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
                 325                  330                 335
aac att aaa aag gtt ttc ggc ctt gat atg gcg caa tta tta tta gat   1056
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
             340                  345                 350
gtt crc tgt ttc gga aaa gat gct gat ctg ccg gac ggg tta ttg gat   1104
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
        355                   360                 365
caa gag cct tac tat gtt gct gac tgc cat ctg tac cct cag cat ttc   1152
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
    370                  375                  380
aaa caa aat ggc cag atc cct gaa act gcc gag gat ttg gta atc gaa   1200
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385                  390                  395                  400
gcg atc gat att ccg gat ggg ctt ttg aag ggt gat aca gaa atc gtt   1248
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
                 405                  410                  415
act ttt tcg gct gcg gca cca gga aca tca gtt gat ttg aca ctg ttt   1296
Thr Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
            420                 425                   430
gaa gcc ttc aac tcc att gct gca ttt gaa ctg aaa ggc agc aat tca   1344
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
        435                  440                  445
cag gat gtg gct gaa tca atc aga caa att cag cag cat gcg aag ctg   1392
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
    450                  455                  460
acg gca aag tat gtg ctg cca gta                                   1416
Thr Ala Lys Tyr Val Leu Pro Val
465                 470
<210>14
<211>1416
<212>DNA
<213>枯草芽孢杆菌ATCC21555
<400>14
 atg gag aga aaa aca gta ttg gtt atc gct gat ctt ggg ggc tgc ccg    48
 Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
   1                5                   10                  15
ccg cat atg ttt tac aaa agc gca gcc gaa aaa tac aac ctc gtc agc     96
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
              20                  25                    30
ttt att ccg aga ccc ttt gca att aca gcc tct cat gcg gcc tta att    144
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
          35                  40                   45
gaa aaa tac tcg att gcg gtc att aaa gat aaa gac tat ttt aag agt    192
Glu Lys Tyr Ser Ile Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
     50                   55                   60
ctg gct gat ttt gaa cat ccc gat tcg att tat tgg gct cat gaa gat    240
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
 65                   70                   75                  80
cat gac aaa cct gag gaa gaa gtc gtc gaa gaa atc gtg aaa gtg gcc    288
His Asp Lys Pro Glu Glu Glu Val Val Glu Glu Ile Val Lys Val Ala
                 85                    90                   95
gac atg ttt ggg gtt gac gcc att acg acc aac aat gaa ctg ttt atc    336
Asp Met Phe Gly Val Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
            100                  105                   110
gct ccg atg gca aaa gcg tgt aaa cgt ctc ggc ctg cgg gga gcg ggc    384
Ala Pro Met Ala Lys Ala Cys Lys Arg Leu Gly Leu Arg Gly Ala Gly
         115                 120                  125
gta cag gcc gct gaa aac gcc aga gat aaa aat aaa atg aga gcc gcc    432
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Ala Ala
    130                  135                   140
ttc aac cgg gcc ggc gtc aaa tcc atc aaa aac aaa cgg gtg acg acc    480
Phe Asn Arg Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145                  150                  155                  160
ctg gaa gat ttc cgc gcc gcg ctt cag gaa atc gga acg ccg ctt att    528
Leu Glu Asp Phe Arg Ala Ala Leu Gln Glu Ile Gly Thr Pro Leu Ile
                 165                  170                 175
ctg aag cct aca tat ctg gca agc tcg atc ggc gtg acg ctt att aaa    576
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Lys
          180                  185                  190
gag atg gaa acg gcc gaa gct gaa ttc aac aga gtc aat gag tac ttg    624
Glu Met Glu Thr Ala Glu Ala Glu Phe Asn Arg Val Asn Glu Tyr Leu
        195                  200                  205
aaa tcg att aat gta ccg aaa gcg gtg acg ttt gaa gcg ccg ttt atc    672
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
    210                  215                  220
gcg gaa gaa ttc ttg cag ggc gag tat gat gac tgg tac gaa aca agc    720
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Asp Asp Trp Tyr Glu Thr Ser
225                  230                  235                 240
ggt tat tcc gac tat atc agc atc gaa ggc atc atg gcc gac gga gaa    768
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
                 245                  250                 255
tac ttc ccc gtt gcg atc cat gat aaa aca ccg caa atc gga ttc acg    816
Tyr Phe Pro Val Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
            260                  265                  270
gag aca gcg cat att acg ccg tcc atc ctg gat gat gac gcc aag cgg    864
Glu Thr Ala His Ile Thr Pro Ser Ile Leu Asp Asp Asp Ala Lys Arg
        275                  280                  285
aaa atc gtc gaa gct gcc aag aag gcg aat gaa gga ctc ggc ctc gaa    912
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Glu
    290                  295                  300
aac tgt gca acg cat aca gaa ata aaa tta atg aaa aac cgg gaa gcc    960
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Ala
305                  310                  315                 320
gga ctg att gag tca gcg gcc aga ttc gcg gga tgg aat atg att ccg   1008
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
                 325                  330                 335
aat att aaa aag gtc ttc ggc gtt gat atg gcg cag cta tta ttg gat   1056
Asn Ile Lys Lys Val Phe Gly Val Asp Met Ala Gln Leu Leu Leu Asp
         340                      345                 350
gtt ctc tgt tac gga aaa gaa gct gat ctg ccg aaa gga tta ttg gag   1104
Val Leu Cys Tyr Gly Lys Glu Ala Asp Leu Pro Lys Gly Leu Leu Glu
        355                  360                  365
cag gag cca tgc tat gtc gca gac tgc cac ttg tat cct cag cat ttc   1152
Gln Glu Pro Cys Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
    370                  375                  380
aaa gag aac ggc cag ctg cct gag acg gtt gtc gat ttc gtc att gaa   1200
Lys Glu Asn Gly Gln Leu Pro Glu Thr Val Val Asp Phe Val Ile Glu
385                  390                  395                 400
agc att gaa att cct gac ggc gtc tta aag gga gac act gaa ctc gtt   1248
Ser Ile Glu Ile Pro Asp Gly Val Leu Lys Gly Asp Thr Glu Leu Val
                 405                 410                  415
tct ttc tca gcg gct gag gcg ggt acg tca gtg gat ctg cgg ctg ttc   1296
Ser Phe Ser Ala Ala Glu Ala Gly Thr Ser Val Asp Leu Arg Leu Phe
            420                  425                  430
gaa gcg ttc aac agc att gcg gcg ttt gag ctg aaa gga agc aat tcg   1344
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
        435                  440                  445
aac gac gtg gcc gaa rca arc aaa caa att cag cag cag gcg aag ctg   1392
Asn Asp Val Ala Glu Ser Ile Lys Gln Ile Gln Gln Gln Ala Lys Leu
    450                  455                 460
act gca aag tat gcg tta tcg gta                                   1416
Thr Ala Lys Tyr Ala Leu Ser Val
<210>15
<211>1416
<212>DNA
<213>解淀粉芽孢杆菌IFO3022
<400>15
 atg gag aga aaa aca gta ttg gtt atc gct gac ctt ggg gga tgc ccg    48
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
  1                5                   10                   15
ccg cat atg ttt tac aaa agc gca gcc gaa aaa tac aac crc gtc agc     96
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
             20                   25                   30
ttt att ccg aga cct ttt gca att aca gcc tct cat gcg gca tta att    144
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
         35                   40                   45
gaa aaa tac tcg gtc gcg gtc ata aaa gat aaa gac tat ttt aag agt    192
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
     50                   55                   60
ctg gct gat ttt gag cat ccc gat tcg att tac tgg gct cat gaa gat    240
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
 65                   70                   75                  80
cat gac aaa cct gag gaa gaa gta gtc gaa gaa atc gtc aag gtg gcc    288
His Asp Lys Pro Glu Glu Glu Val Val Glu Glu Ile Val Lys Val Ala
                  85                   90                  95
ggc atg ttc gcg gtt gac gcc att acg acc aac aat gaa ctg ttt atc    336
Gly Met Phe Ala Val Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
            100                  105                  110
gct ccg atg gca aaa gcg tgt gaa cgt ctc ggc ctg cgg gga gcg ggc    384
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
        115                  120                  125
gta cag gcc gct gaa aat gcc aga gat aaa aac aaa atg aga gcc gct    432
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Ala Ala
    130                  135                  140
ttc aac cgg gcc ggc gtc aag tct atc aaa aac aga cgg gtg acg acg    480
Phe Asn Arg Ala Gly Val Lys Ser Ile Lys Asn Arg Arg Val Thr Thr
145                  150                  155                 160
ctg gaa gat ttc cgc gcc gcg ctt cag gaa atc gga acg ccg ctc att    528
Leu Glu Asp Phe Arg Ala Ala Leu Gln Glu Ile Gly Thr Pro Leu Ile
                165                  170                  175
ctg aag cct aca tat ctg gcg agc tcc atc ggc gtg acg ctc atc aaa    576
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Lys
            180                  185                  190
gag agg gaa acg gcc gaa gcc gaa ttt aac aga gtc aat gaa tac ctg    624
Glu Arg Glu Thr Ala Glu Ala Glu Phe Asn Arg Val Asn Glu Tyr Leu
        195                  200                  205
aag tcg atc aac gta ccg aaa gcg gtc acg ttt gaa gcg ccg ttt atc    672
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
    210                  215                  220
gcg gaa gaa ttt ttg cag ggc gag tat gac gac tgg tac gaa aca agc    720
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Asp Asp Trp Tyr Glu Thr Ser
225                  230                  235                 240
ggt tat tcc gac tat atc agc ata gaa ggc atc atg gcc gac gga gaa    768
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
                 245                 250                  255
tac ttc cct gtc gca att cat gat aaa aca ccg caa atc gga ttc acg    816
Tyr Phe Pro Val Ala Ile His Asp Lys Thr ProGln Ile Gly Phe Thr
            260                  265                 270
gag aca tcg cat att acg ccg tcc atc ctg gat gat gac gcg aag cgg    864
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Asp Asp Ala Lys Arg
        275                  280                  285
aaa atc gtc gaa gca gcc aaa aag gcg aat gaa gga ctc ggc ctc gaa    912
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Glu
    290                  295                  300
aac tgc gca acc cat aca gag att aaa tta atg aaa aac cgg gaa gcc    960
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Ala
 305                 310                  315                 320
gga ctg att gaa tca gcg gca cga ttt gcg ggc tgg aac atg att ccg   1008
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
                325                  330                  335
aat att aaa aag gtc ttc ggc gtc gat atg gcg cag ctg tta tg gat    1056
Asn Ile Lys Lys Val Phe Gly Val Asp Met Ala Gln Leu Leu Leu Asp
              340                 345                 350
gtt ctc tgt ttc gga aaa gaa gcc gat ctg ccg aaa gga tta ttg gag   1104
Val Leu Cys Phe Gly Lys Glu Ala Asp Leu Pro Lys Gly Leu Leu Glu
        355                  360                  365
cag gag ccg tgc tat gtc gcc gac tgc cac ttg tat cct cag cat ttc   1152
Gln Glu Pro Cys Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
    370                  375                  380
aaa gag aac ggc cag ctg cct gag acg gct gtc gat ttc gtc att gaa   1200
Lys Glu Asn Gly Gln Leu Pro Glu Thr Ala Val Asp Phe Val Ile Glu
385                  390                  395                 400
agc att gac att ccc gac ggc gtc tta aag gga gac acc gaa atc gtt   1248
Ser Ile Asp Ile Pro Asp Gly Val Leu Lys Gly Asp Thr Glu Ile Val
                 405                  410                 415
tct ttc tcg gcg gcc gag gcg ggt aca tcc gtg gat ctg cgg ctg ttc   1296
Ser Phe Ser Ala Ala Glu Ala Gly Thr Ser Val Asp Leu Arg Leu Phe
             420                  425                  430
gaa gcg ttc aac agc att gcg gcg ttc gag ctg aaa gga agc aat tcg   1344
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
        435                  440                  445
ggt gac gtg gcc gaa tca arc aaa caa att cag cag cag gcg aag ctg   1392
Gly Asp Val Ala Glu Ser Ile Lys Gln Ile Gln Gln Gln Ala Lys Leu
    450                  455                  460
act gca aag tat gcg tta ccg gta                                   1416
Thr Ala Lys Tyr Ala Leu Pro Val
<210>16
<211>1428
<212>DNA
<213>短小芽孢杆菌NRRL B-12025
<400>16
gtg ctt tca ttg agt aaa aaa act gta ctt gtc att gct gac tta gga     48
Val Leu Ser Leu Ser Lys Lys Thr Val Leu Val Ile Ala Asp Leu Gly
  1                5                   10                  15
ggg tgc ccg ccc cat atg ttt tat gaa agc gtg gcg gca tca tac cat     96
Gly Cys Pro Pro His Met Phe Tyr Glu Ser Val Ala Ala Ser Tyr His
             20                   25                  30
atc gtt tct tat atc cca aga ccc ttt gcg att aca aag gga cat gcc    144
Ile Val Set Tyr Ile Pro Arg Pro Phe Ala Ile Thr Lys Gly His Ala
         35                   40                   45
gag cta atc gaa aaa tac tcc att gcc gtc atc aaa gac cgt gat tat    192
Glu Leu Ile Glu Lys Tyr Ser Ile Ala Val Ile Lys Asp Arg Asp Tyr
     50                   55                   60
ttt gag aca cac cct tct ttt gaa cac cct gat tct att tac tgg gca    240
Phe Glu Thr His Pro Ser Phe Glu His Pro Asp Ser Ile Tyr Trp Ala
 65                   70                   75                   80
cat gat gat tat cca aaa tca gaa gaa gaa gtt gtg gaa gac ttc att    288
His Asp Asp Tyr Pro Lys Ser Glu Glu Glu Val Val Glu Asp Phe Ile
                  85                   90                   95
cga gta gct tcc ttt ttc aaa gca gat gca atc acg acc aat aat gaa    336
Arg Val Ala Ser Phe Phe Lys Ala Asp Ala Ile Thr Thr Asn Asn Glu
             100                  105                  110
tta ttc att gca ccg atg gca aag gcc gct gaa cgt ctt ggg cta cga    384
Leu Phe Ile Ala Pro Met Ala Lys Ala Ala Glu Arg Leu Gly Leu Arg
        115                  120                 125
ggt gcc ggt gtc aag gca gcc gaa atg gcg cgt gat aaa agc caa atg    432
Gly Ala Gly Val Lys Ala Ala Glu Met Ala Arg Asp Lys Ser Gln Met
    130                  135                  140
agg gct gca ttc aat gcc tct ggc gtc aaa gcg gtg aaa act cag cct    480
Arg Ala Ala Phe Asn Ala Ser Gly Val Lys Ala Val Lys Thr Gln Pro
145                  150                  155                  160
gtc acg act tta tct gat ttc caa caa gcc att gag tct atc gga aca    528
Val Thr Thr Leu Ser Asp Phe Gln Gln Ala Ile Glu Ser Ile Gly Thr
                 165                  170                  175
ccg ctc att tta aag cct aca tat tta gcc agt tct att ggc gtc acc    576
Pro Leu Ile Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr
             180                 185                  190
ttg ttt cat gac aaa gcc gga agt gat gac ttg ttt tta caa gta caa    624
Leu Phe His Asp Lys Ala Gly Ser Asp Asp Leu Phe Leu Gln Val Gln
        195                  200                  205
tcg tat ttg gaa acc ata cca gtc cca gac gct gtc acg tat gaa gca    672
Ser Tyr Leu Glu Thr Ile Pro Val Pro Asp Ala Val Thr Tyr Glu Ala
    210                  215                  220
ccg ttt gtc gct gaa aca tat tta gag ggt gct tac gaa gat tgg tat    720
Pro Phe Val Ala Glu Thr Tyr Leu Glu Gly Ala Tyr Glu Asp Trp Tyr
225                  230                  235                  240
gaa gac gaa gga tat gct gat tat gtc agt gta gaa ggg ctg gtc gta    768
Glu Asp Glu Gly Tyr Ala Asp Tyr Val Ser Val Glu Gly Leu Val Val
                245                  250                  255
gag ggc gaa tat ctc cct ttt gtc ata cat gat aaa acc cct caa atc    816
Glu Gly Glu Tyr Leu Pro Phe Val Ile His Asp Lys Thr Pro Gln Ile
             260                  265                 270
ggc ttt aca gaa acg gct cat atc act ccg acg atc tta gac aat gaa    864
Gly Phe Thr Glu Thr Ala His Ile Thr Pro Thr Ile Leu Asp Asn Glu
        275                  280                  285
gcc aag caa atc ate att gaa gca gca agg aag gca aat gaa ggg cta    912
Ala Lys Gln Ile Ile Ile Glu Ala Ala Arg Lys Ala Asn Glu Gly Leu
    290                  295                  300
ggt ctt gaa cat tgt gca acc cat aca gaa atc aaa ctc atg aaa aat    960
Gly Leu Glu His Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn
305                  310                  315                  320
cga gaa act gga ctg atc gag gca gcg gct cga ttc gct ggc tgg aat   1008
Arg Glu Thr Gly Leu Ile Glu Ala Ala Ala Arg Phe Ala Gly Trp Asn
                 325                  330                  335
atg atc ccg aat att aaa aaa gtc ttt ggc gtc gat atg gcg aag cta   1056
Met Ile Pro Asn Ile Lys Lys Val Phe Gly Val Asp Met Ala Lys Leu
             340                 345                  350
ttg att gat gta tta gtt gat ggt aaa aag gct gta ctg cca aaa cag   1104
Leu Ile Asp Val Leu Val Asp Gly Lys Lys Ala Val Leu Pro Lys Gln
        355                  360                  365
ctg ctt tct gga cat aca ttt tat gta gcg gac tgc cac ctg tac cct   1152
Leu Leu Ser Gly His Thr Phe Tyr Val Ala Asp Cys His Leu Tyr Pro
    370                  375                  380
cag cat ttt aaa gag agt ggg ctt atc ccg cct gaa gcc aca cat att   1200
Gln His Phe Lys Glu Ser Gly Leu Ile Pro Pro Glu Ala Thr His Ile
385                  390                  395                  400
acc att gat cat gtg tct att ccg cag gaa gca ttc gtt gga gat act   1248
Thr Ile Asp His Val Ser Ile Pro Gln Glu Ala Phe Val Gly Asp Thr
                 405                  410                  415
gcg att gtc agt caa tca ttc cct gcc aaa ggg act att gtg gat ctt   1296
Ala Ile Val Ser Gln Ser Phe Pro Ala Lys Gly Thr Ile Val Asp Leu
            420                  425                  430
gaa tta ttt gaa gct ttt aat gga atc gta tct ctt gag tta aaa gga   1344
Glu Leu Phe Glu Ala Phe Asn Gly Ile Val Ser Leu Glu Leu Lys Gly
        435                  440                  445
tca tcc tca caa gat gtt gcc gcg tcc atc cgc aac att cag aaa cag   1392
Ser Ser Ser Gln Asp Val Ala Ala Ser Ile Arg Asn Ile Gln Lys Gln
    450                  455                  460
gca acg att cag tta atg gat gaa tta gtg aag gga                   1428
Ala Thr Ile Gln Leu Met Asp Glu Leu Val Lys Gly
465                  470                  475
<210>17
<211>93
<212>PRT
<213>枯草芽孢杆菌168
<400>17
Gly Ala Gly Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met
  1                5                  10                   15
Arg Asp Ala Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg
             20                    25                  30
Val Thr Thr Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr
         35                    40                  45
Pro Leu Ile Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr
     50                    55                  60
Leu Ile Thr Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn
 65                    70                  75                  80
Asp Tyr Leu Lys Ser Ile Asn Val Pro Lys Ala Val Thr
                 85                    90
<210>18
<211>279
<212>DNA
<213>枯草芽孢杆菌168
<400>18
ggt gcc ggc gtg cag gca gcc gaa aat gcc aga gat aaa aat aaa atg    48
Gly Ala Gly Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met
  1                5                   10                   15
agg gac gct ttt aat aag gcc gga gtc aaa tcg arc aaa aac aaa cga    96
Arg Asp Ala Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg
             20                   25                   30
gtc aca act ctt gaa gat ttc cgt gct gct ctt gaa gag atc ggc aca   144
Val Thr Thr Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr
         35                   40                   45
cct ctt atc tta aag cct aca tac tta gcg agt tct atc ggt gta acg   192
Pro Leu Ile Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr
     50                   55                   60
ctg att acg gac act gag acg gca gaa gat gaa ttt aac aga gtc aat   240
Leu Ile Thr Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn
 65                   70                   75                   80
gac tat ctg aaa rca att aac gtg cca aag gcg gtt acg               279
Asp Tyr Leu Lys Ser Ile Asn Val Pro Lys Ala Val Thr
                 85                    90
<210>19
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>19
attctcgagt agagaaggag tgttttacat                                   30
<210>20
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>20
ttaggatcct catactggca gcacatactt                                   30
<210>21
<211>24
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>21
caagaattct catgtttgac agct                                         24
<210>22
<211>28
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>22
taactcgaga ttcccttttt acgtgaac                                     28
<210>23
<211>27
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>23
ttaaccatgg agagaaaaac agtattg                                      27
<210>24
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>24
atatggatcc tactggcagc acatactttg                                    30
<210>25
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>25
caccgcagac ggaggataca c                                             21
<210>26
<211>22
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>26
cggacgtcac ccaataatcg tg                                            22
<210>27
<211>23
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>27
ccgatggcra aagcstgtra acg                                           23
<210>28
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>28
cggcagatcr gcdtcttttc c                                            21
<210>29
<211>26
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>29
gctaggtctt gaacattgtg caaccc                                       26
<210>30
<211>23
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>30
ggtgttccga tagactcaat ggc                                          23
<210>31
<211>44
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>31
catgccatgg agaaaaaaac tgtacttgtc attgctgact tagg              丂丂丂44
<210>32
<211>38
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>32
 cgcggatccc ttcactaatt catccattaa ctgaatcg                    丂丂丂38
<210>33
<211>12
<212>PRT
<213>人工序列
<220>
<221>不确定
<222>(3)
<223>Xaa表示选自Ala、Arg、Asn、Asp、Cys、Glu、Gln、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr和Val中的任何氨基酸
<220>
<221>不确定
<222>(4)
<223>Xaa表示选自Ala、Arg、Asn、Asp、Cys、Glu、Gln、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr和Val中的任何氨基酸
<220>
<221>不确定
<222>(9)
<223>Xaa表示选自Ala、Arg、Asn、Asp、Cys、Glu、Gln、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr和Val中的任何氨基酸
<220>
<221>不确定
<222>(10)
<223>Xaa表示选自Leu、Ile、Val、Met和Ala中的任何氨基酸
<220>
<221>不确定
<222>(11)
<223>Xaa表示Glu、Ser或Ala
<220>
<221>不确定
<222>(12)
<223>Xaa表示Gly、Ser或Ala
<220>
<223>人工序列的描述:用于数据库查找的氨基酸序列
<400>33
His Gly Xaa Xaa Gly Gln Asp Gly Xaa Xaa Xaa Xaa
5 10
<210>34
<211>28
<212>PRT
<213>人工序列
<220>
<221>不确定
<222>(1)
<223>Xaa表示Leu Ile或Val
<220>
<221>不确定
<222>(2)
<223>Xaa表示选自Ala、Arg、Asn、Asp、Cys、Glu、Gln、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr和Val中的任何氨基酸
<220>
<221>不确定
<222>(3)
<223>Xaa表示选自Ala、Arg、Asn、Asp、Cys、Glu、Gln、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr和Val中的任何氨基酸
<220>
<221>不确定
<222>(4)
<223>Xaa表示选自Ala、Arg、Asn、Asp、Cys、Glu、Gln、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr和Val中的任何氨基酸
<220>
<221>不确定
<222>(5)
<223>Xaa表示Gly或Ala
<220>
<221>不确定
<222>(6)
<223>Xaa表示选自Ala、Arg、Asn、Asp、Cys、Glu、Gln、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr和Val中的任何氨基酸
<220>
<221>不确定
<222>(7)
<223>Xaa表示选自Gly、Ser、Ala、Ile和Val中的任何氨基酸
<220>
<221>不确定
<222>(9)
<223>Xaa表示选自Leu、Ile、Val、Met、Cys和Ala中的任何氨基酸
<220>
<221>不确定
<222>(11)
<223>Xaa表示选自Leu、Ile、Val、Met、Phe和Ala中的任何氨基酸
<220>
<221>不确定
<222>(12)
<223>Xaa表示选自Leu、Ile、Val、Met、Phe和Ala中的任何氨基酸
<220>
<221>不确定
<222>(13)
<223>Xaa表示选自Ala、Arg、Asn、Asp、Cys、Glu、Gln、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr和Val中的任何氨基酸
<220>
<221>不确定
<222>(14)
<223>Xaa表示选自Ala、Arg、Asn、Asp、Cys、Glu、Gln、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr和Val中的任何氨基酸
<220>
<221>不确定
<222>(15)
<223>Xaa表示选自Ala、Arg、Asn、Asp、Cys、Glu、Gln、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr和Val中的任何氨基酸
<220>
<221>不确定
<222>(16)
<223>Xaa表示选自Ala、Arg、Asn、Asp、Cys、Glu、Gln、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr和Val中的任何氨基酸
<220>
<221>不确定
<222>(17)
<223>Xaa表示选自Ala、Arg、Asn、Asp、Cys、Glu、Gln、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr和Val中的任何氨基酸
<220>
<221>不确定
<222>(18)
<223>Xaa表示选自Ala、Arg、Asn、Asp、Cys、Glu、Gln、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr和Val中的任何氨基酸
<220>
<221>不确定
<222>(19)
<223>Xaa表示选自Ala、Arg、Asn、Asp、Cys、Glu、Gln、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr和Val中的任何氨基酸
<220>
<221>不确定
<222>(20)
<223>Xaa表示Leu、Ile或Val中的任何氨基酸
<220>
<221>不确定
<222>(21)
<223>Xaa表示选自Ala、Arg、Asn、Asp、Cys、Glu、Gln、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr和Val中的任何氨基酸
<220>
<221>不确定
<222>(23)
<223>Xaa表示选自Leu、Ile、Val、Ala和Pro中的任何氨基酸
<220>
<221>不确定
<222>(25)
<223>Xaa表示Ser、Thr或Pro
<220>
<221>不确定
<222>(26)
<223>Xaa表示选自Ala、Arg、Asn、Asp、Cys、Glu、Gln、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr和Val中的任何氨基酸
<220>
<221>不确定
<222>(28)
<223>Xaa表示Gly或Ala
<220>
<223>人工序列的描述:用于数据库查找的氨基酸序列
<400>34
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Arg Xaa Asp Xaa Xaa Xaa Xaa Xaa Xaa
                   5                   10                   15
Xaa Xaa Xaa Xaa Xaa Gln Xaa Asn Xaa Xaa Pro Xaa
              20                  25
<210>35
<211>30
<212>PRT
<213>人工序列
<220>
<221>不确定
<222>(1)
<223>Xaa表示Leu Ile或Val
<220>
<221>不确定
<222>(2)
<223>Xaa表示选自Ala、Arg、Asn、Asp、Cys、Glu、Gln、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr和Val中的任何氨基酸
<220>
<221>不确定
<222>(3)
<223>Xaa表示选自Ala、Arg、Asn、Asp、Cys、Glu、Gln、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr和Val中的任何氨基酸
<220>
<221>不确定
<222>(4)
<223>Xaa表示选自Ala、Arg、Asn、Asp、Cys、Glu、Gln、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr和Val中的任何氨基酸
<220>
<221>不确定
<222>(5)
<223>Xaa表示Gly或Ala
<220>
<221>不确定
<222>(6)
<223>Xaa表示选自Ala、Arg、Asn、Asp、Cys、Glu、Gln、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr和Val中的任何氨基酸
<220>
<221>不确定
<222>(7)
<223>Xaa表示选自Gly、Ser、Ala、Ile和Val中的任何氨基酸
<220>
<221>不确定
<222>(9)
<223>Xaa表示选自Leu、Ile、Val、Met、Cys和Ala中的任何氨基酸
<220>
<221>不确定
<222>(11)
<223>Xaa表示选自Leu、Ile、Val、Met、Phe和Ala中的任何氨基酸
<220>
<221>不确定
<222>(12)
<223>Xaa表示选自Leu、Ile、Val、Met、Phe和Ala中的任何氨基酸
<220>
<221>不确定
<222>(13)
<223>Xaa表示选自Ala、Arg、Asn、Asp、Cys、Glu、Gln、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr和Val中的任何氨基酸
<220>
<221>不确定
<222>(14)
<223>Xaa表示选自Ala、Arg、Asn、Asp、Cys、Glu、Gln、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr和Val中的任何氨基酸
<220>
<221>不确定
<222>(15)
<223>Xaa表示选自Ala、Arg、Asn、Asp、Cys、Glu、Gln、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr和Val中的任何氨基酸
<220>
<221>不确定
<222>(16)
<223>Xaa表示选自Ala、Arg、Asn、Asp、Cys、Glu、Gln、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr和Val中的任何氨基酸
<220>
<221>不确定
<222>(17)
<223>Xaa表示选自Ala、Arg、Asn、Asp、Cys、Glu、Gln、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr和Val中的任何氨基酸
<220>
<221>不确定
<222>(18)
<223>Xaa表示选自Ala、Arg、Asn、Asp、Cys、Glu、Gln、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr和Val中的任何氨基酸
<220>
<221>不确定
<222>(19)
<223>Xaa表示选自Ala、Arg、Asn、Asp、Cys、Glu、Gln、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr和Val中的任何氨基酸
<220>
<221>不确定
<222>(20)
<223>Xaa表示选自Ala、Arg、Asn、Asp、Cys、Glu、Gln、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr和Val中的任何氨基酸
<220>
<221>不确定
<222>(21)
<223>Xaa表示选自Ala、Arg、Asn、Asp、Cys、Glu、Gln、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr和Val中的任何氨基酸
<220>
<221>不确定
<222>(22)
<223>Xaa表示Leu、Ile或Val
<220>
<221>不确定
<222>(23)
<223>Xaa表示选自Ala、Arg、Asn、Asp、Cys、Glu、Gln、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr和Val中的任何氨基酸
<220>
<221>不确定
<222>(25)
<223>Xaa表示选自Leu、Ile、Val、Ala和Pro中的任何氨基酸
<220>
<221>不确定
<222>(27)
<223>Xaa表示Ser、Thr或Pro
<220>
<221>不确定
<222>(28)
<223>Xaa表示选自Ala、Arg、Asn、Asp、Cys、Glu、Gln、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr和Val中的任何氨基酸
<220>
<221>不确定
<222>(30)
<223>Xaa表示Gly或Ala
<220>
<223>人工序列的描述:用于数据库查找的氨基酸序列
<400>35
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Arg Xaa Asp Xaa Xaa Xaa Xaa Xaa Xaa
                   5                   10                   15
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Gln Xaa Asn Xaa Xaa Pro Xaa
              20                  25                   30
<210>36
<211>1416
<212>DNA
<213>枯草芽孢杆菌ATCC 15245和枯草芽孢杆菌IAM 1033
<400>36
atg gag aga aaa aca gta ttg gtc atc gct gat ctt gga ggc tgc ccg  48
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
  1                5                  10                   15
ccg cac atg ttt tat aaa agc gct gct gaa aaa tat aac ctg gtc agc  96
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
             20                    25                   30
ttt att cca aga cct ttt gca att aca gcc tcc cat gca gca ttg att 144
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser Hi s Ala Ala Leu Ile
         35                    40                   45
gaa aaa tac tcg gtc gcg gtc ata aaa gat aaa gac tat ttt aag agt 192
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
     50                   55                   60
tta gct gat ttt gag cat cct gat tcc att tat tgg gcg cat gag gat  240
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
 65                   70                   75                   80
cataac aag cct gag gaa gag gtc gtc gag caa arc gtc aag gtt gcc   288
  His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
                    85                   90                   95
gaa atg ttt ggg gcg gat gcc atc aca aca aac aat gaa tta ttc att    336
Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
            100                  105                  110
gct ccg atg gcg aaa gcc tgt gaa cgt ctg ggc ctg aga ggt gcc ggc    384
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
        115                  120                  125
gtg cag gca gcc gaa aat gcc aga gat aaa aat aaa atg agg gac gct    432
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
    130                  135                  140
ttt aat aag gcc gga gtc aaa tcg atc aaa aac aaa cga gtc aca act    480
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145                  150                  155                  160
ctt gaa gat ttc cgt gct gct ctt gaa gag atc ggc aca cct ctt atc    528
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
            165                  170                  175
tta aag cct aca tac tta gcg agt tca atc ggt gta acg ctg att acg    576
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
             180                  185                  190
gac act gag acg gca gaa gat gaa ttt aac aga gtc aat gac tat ctg    624
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
        195                  200                  205
aaa tca att aac gtg cca aag gcg gtt acg ttt gaa gcg ccg ttt atc    672
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
    210                  215                  220
gct gaa gaa ttt tta cag ggt gag tac gga gac tgg tat caa aca gaa    720
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225                  230                  235                  240
ggg tac tcc gac tat atc agt ata gaa ggc atc atg gct gac ggt gag    768
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
                 245                  250                  255
tat ttc ccg atc gcc att cat gat aaa acg ccg caa atc ggg ttt aca    816
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
             260                  265                  270
gag aca tcc cac att acg ccg tcc att ctg gat gaa gag gca aaa aag    864
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
        275                  280                  285
aaa att gtc gaa gct gcc aaa aag gca aat gaa ggg ctt ggc ctg caa    912
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
    290                  295                  300
aat tgc gca aca cat aca gag atc aag cta atg aaa aac aga gaa ccg    960
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305                  310                  315                  320
ggt tta ata gag tcg gca gcc aga ttc gca ggc tgg aat atg att cct   1008
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
                 325                  330                  335
aat att aaa aag gtc ttt ggc ctt gat atg gcg caa tta tta tta gat   1056
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
            340                  345                  350
gtc ctc tgt ttc gga aaa gac gcc gat ctg ccg gac gga tta ttg gat   1104
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
        355                  360                  365
caa gag cct tat tat gtt gcc gac tgc cat ttg tac ccg cag cat ttc   1152
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
    370                  375                  380
aaa caa aat ggc cag att cca gaa acc gct gag gat ttg gtc att gaa   1200
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385                  390                  395                  400
gcg atc gat att ccg gac ggg ctt tta aaa ggg gat act gaa atc gtt   1248
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
                 405                  410                  415
tca ttt tca gcc gca gca cca ggc act tca gtt gat ttg aca ttg ttt   1296
Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
             420                  425                 430
gaa gct ttc aat tcc att gct gca ttt gaa ctg aaa ggc agt aat tca   1344
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
        435                  440                  445
cag gat gtg gct gaa tca atc aga caa att cag cag cat gca aag ctg  1392
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
    450                  455                  460
acg gca aag tat gtg ctg cca gta                                  1416
Thr Ala Lys Tyr Val Leu Pro Val
465                  470
<210>37
<211>239
<212>PRT
<213>诺尔斯氏链霉菌IFO15452(Streptomyces noursei IFO15452)
<400>37
Met Leu Ala Gly Leu Val Pro Ala Pro Asp His Gly Met Arg Glu Glu
  1                5                   10                   15
Ile Leu Gly Asp Arg Ser Arg Leu Ile Arg Gln Arg Gly Glu His Ala
              20                  25                   30
Leu Ile Gly Ile Ser Ala Gly Asn Ser Tyr Phe Ser Gln Lys Asn Thr
         35                40                 45
Val Met Leu Leu Gln Trp Ala Gly Gln Arg Phe Glu Arg Thr Asp Val
     50                    55                  60
Val Tyr Val Asp Thr His Ile Asp Glu Met Leu Ile Ala Asp Gly Arg
 65                   70                   75                  80
Ser Ala Gln Glu Ala Glu Arg Ser Val Lys Arg Thr Leu Lys Asp Leu
                  85                   90                   95
Arg Arg Arg Leu Arg Arg Ser Leu Glu Ser Val Gly Asp His Ala Glu
             100                  105                  110
Arg Phe Arg Val Arg Ser Leu Ser Glu Leu Gln Glu Thr Pro Glu Tyr
        115                  120                  125
Arg Ala Val Arg Glu Arg Thr Asp Arg Ala Phe Glu Glu Asp Ala Glu
    130                  135                  140
Phe Ala Thr Ala Cys Glu Asp Met Val Arg Ala Val Val Met Asn Arg
145                  150                  155                  160
Pro Gly Asp Gly Val Gly Ile Ser Ala Glu His Leu Arg Ala Gly Leu
                 165                  170                 175
Asn Tyr Val Leu Ala Glu Ala Pro Leu Phe Ala Asp Ser Pro Gly Val
             180                  185                 190
Phe Ser Val Pro Ser Ser Val Leu Cys Tyr His Ile Asp Thr Pro Ile
        195                  200                  205
Thr Ala Phc Leu Ser Arg Arg Glu Thr Gly Phe Arg Ala Ala Glu Gly
    210                  215                  220
Gln Ala Tyr Val Val Val Arg Pro Gln Glu Leu Ala Asp Ala Ala
225                  230                  235
<210>38
<211>239
<212>PRT
<213>诺尔斯氏链霉菌IFO15452(Streptomyces alborus IFO15452)
<400>38
Met Leu Ala Gly Leu Val Pro Ala Leu Asp His Ser Met Arg Glu Glu
  1                5                   10                   15Ile Leu Gly Asn Arg Gly Arg Lys Ile Arg Gln Arg Gly Glu His Ala
             20                   25                   30
Leu Ile Gly Ile Ser Ala Gly Asn Ser Tyr Phe Ser Gln Lys Asn Val
         35                   40                   45
Thr Met Leu Leu Gln Trp Ala Gly Gln His Phe Glu Arg Thr Asp Val
     50                   55                   60
Val Tyr Val Asp Thr His Ile Asp Asp Met Leu Met Ala Asp Gly Arg
 65                   70                   75                   80
Ser Ala Gln Glu Ala Glu Lys Ser Val Lys Arg Thr Leu Lys Asp Leu
                  85                  90                   95
Arg Arg Arg Leu Arg Arg Ser Leu Glu Ser Val Gly Asp His Ser Glu
             100                   105                 110
Arg Phe Arg Val Arg Ser Leu Ser Glu Ile Gln Glu Thr Pro Glu Tyr
        115                  120                  125
Arg Ala Ala Arg Glu Ser Thr Asp Arg Ala Phe Arg Glu Asp Gly Glu
    130                   135                 140
Phe Ala Thr Val Cys Glu Glu Met Val Arg Ala Val Val Met Asn Arg
145                  150                  155                  160
Pro Gly Asp Gly Val Asp Ile Ser Glu Glu His Leu Arg Ala Gly Leu
                 165                  170                  175
Asn Tyr Val Leu Ala Glu Ala Pro Leu Phe Ala Asp Ser Pro Gly Val
             180                 185                  190
Phe Ser Val Pro Ser Ser Val Leu Cys Tyr His Ile Pro Thr Pro Val
         195                 200                  205
Ser Thr Phe Leu Ala His Arg Glu Thr Gly Phe Gln Ala Ala Gln Gly
    210                  215                  220
Gln Ala Tyr Val Val Val Arg Pro Gln Glu Leu Ala Asp Ala Ala
225                  230                  235
<210>39
<211>717
<212>DNA
<213>诺尔斯氏链霉菌IFO15452
<400>39
atg ctt gca ggc tta gtt ccc gcg ccg gac cac gga atg cgg gaa gaa   48
Met Leu Ala Gly Leu Val Pro Ala Pro Asp His Gly Met Arg Glu Glu
  1                5                   10                   15
ata ctt ggc gac cgc agc cga ttg atc cgg caa cgc ggt gag cac gcc  96
Ile Leu Gly Asp Arg Ser Arg Leu Ile Arg Gln Arg Gly Glu His Ala
              20                   25                  30
ctc arc gga atc agt gcg ggc aac agt tat ttc agc cag aag aac acc 144
Leu Ile Gly Ile Ser Ala Gly Asn Ser Tyr Phe Ser Gln Lys Ash Thr
         35                   40                   45
gtc atg ctg ctg caa tgg gcc ggg cag cgt ttc gag cgc acc gat gtc  192
Val Met Leu Leu Gln Trp Ala Gly Gln Arg Phe Glu Arg Thr Asp Val
    50                   55                   60
gtc tat gtc gac acc cac atc gac gag atg ctg atc gcc gac ggc cgc  240
Val Tyr Val Asp Thr His Ile Asp Glu Met Leu Ile Ala Asp Gly Arg
 65                   70                   75                   80
agc gcg cag gag gcc gag cgg tcg gtc aaa cgc acg ctc aag gat ctg  288
Ser Ala Gln Glu Ala Glu Arg Ser Val Lys Arg Thr Leu Lys Asp Leu
                  85                   90                   95
cgg cgc aga ctc cgg cgc tcg ctg gag agc gtg ggc gac cac gcc gag  336
Arg Arg Arg Leu Arg Arg Ser Leu Glu Ser Val Gly Asp His Ala Glu
             100                 105                   110
cgg ttc cgt gtc cgg tcc ctg tcc gag ctc cag gag acc cct gag tac  384
Arg Phe Arg Val Arg Ser Leu Ser Glu Leu Gln Glu Thr Pro Glu Tyr
        115                  120                  125
cgg gcc gta cgc gag cgc acc gac cgg gcc ttc gag gag gac gcc gaa  432
Arg Ala Val Arg Glu Arg Thr Asp Arg Ala Phe Glu Glu Asp Ala Glu
    130                  135                  140
ttc gcc acc gcc tgc gag gac atg gtg cgg gcc gtg gtg atg aac cgg  480
Phe Ala Thr Ala Cys Glu Asp Met Val Arg Ala Val Val Met Asn Arg
145                   150                 155                  160
ccc ggt gac ggc gtc ggc atc tcc gcg gaa cac ctg cgg gcc ggt ctg  528
Pro Gly Asp Gly Val Gly Ile Ser Ala Glu His Leu Arg Ala Gly Leu
                 165                  170                 175
aac tac gtg ctg gcc gag gcc ccg ctc ttc gcg gac tcg ccc gga gtc  576
Asn Tyr Val Leu Ala Glu Ala Pro Leu Phe Ala Asp Ser Pro Gly Val
             180                 185                  190
ttc tcc gtc ccc tcc tcg gtg ctc tgc tac cac atc gac acc ccg atc  624
Phe Ser Val Pro Ser Ser Val Leu Cys Tyr His Ile Asp Thr Pro Ile
        195                  200                  205
acg gcg ttc ctg tcc cgg cgc gag acc ggt ttc cgg gcg gcc gag gga  672
Thr Ala Phe Leu Ser Arg Arg Glu Thr Gly Phe Arg Ala Ala Glu Gly
    210                  215                  220
cag gcg tac gtc gtc gtc agg ccc cag gag ctg gcc gac gcg gcc  717
Gln Ala Tyr Val Val Val Arg Pro Gln Glu Leu Ala Asp Ala Ala
225                  230                  235
<210>40
<211>717
<212>DNA
<213>诺尔斯氏链霉菌IFO15452
<400>40
atg ctt gca ggc tta gtt ccc gcg ctg gac cac agc atg cgg gaa gaa  48
Met Leu Ala Gly Leu Val Pro Ala Leu Asp His Ser Met Arg Glu Glu
  1                5                   10                   15
ara crt ggc aat cgc ggc cga aag atc cgg caa cgc ggt gag cac gct  96
Ile Leu Gly Asn Arg Gly Arg Lys Ile Arg Gln Arg Gly Glu His Ala
             20                   25                   30
ctc att gga atc agt gcg ggc aac agt tat ttc agc cag aag aac gtc 144
Leu Ile Gly Ile Ser Ala Gly Asn Ser Tyr Phe Set Gln Lys Asn Val
         35                   40                   45
acc atg ctg ctg caa tgg gcc ggg cag cat ttc gag cgc acg gat gtc 192
Thr Met Leu Leu Gln Trp Ala Gly Gln His Phe Glu Arg Thr Asp Val
     50                   55                   60
gtc tac gtg gac acg cac atc gac gac atg ctg atg gcg gac ggc cgc 240
Val Tyr Val Asp Thr His Ile Asp Asp Met Leu Met Ala Asp Gly Arg
 65                   70                   75                   80
agc gcg cag gaa gcc gag aag tcg gtc aag cgc acg crc aag gat ctg  288
Ser Ala Gln Glu Ala Glu Lys Ser Val Lys Arg Thr Leu Lys Asp Leu
                  85                   90                   95
cgg cgc agg ctg cgg cgc tcg ttg gaa agc gtg ggc gac cac agc gag  336
Arg Arg Arg Leu Arg Arg Ser Leu Glu Ser Val Gly Asp His Ser Glu
             100                 105                  110
cgg ttc cgc gtc cgg tcc ctg tcc gag arc cag gag acc cct gag tac  384
Arg Phe Arg Val Arg Ser Leu Ser Glu Ile Gln Glu Thr Pro Glu Tyr
        115                  120                   125
cgg gcc gca cgc gag tcc acc gac cgg gcc ttc cgc gag gac ggc gag  432
Arg Ala Ala Arg Glu Ser Thr Asp Arg Ala Phe Arg Glu Asp Gly Glu
    130                  135                  140
ttc gcc acc gtc tgc gag gag atg gtg cgc gcc gtg gtg atg aac cgg  480
Phe Ala Thr Val Cys Glu Glu Met Val Arg Ala Val Val Met Asn Arg
145                  150                  155                  160
ccc ggt gac ggc gtc gac atc tcg gag gaa cac ctg cgg gcc ggt ctg  528
Pro Gly Asp Gly Val Asp Ile Ser Glu Glu His Leu Arg Ala Gly Leu
                 165                  170                  175
aac tac gtg ctc gcc gag gcc ccg crc ttc gcg gac tcg ccc ggc gtg  576
Asn Tyr Val Leu Ala Glu Ala Pro Leu Phe Ala Asp Ser Pro Gly Val
            180                  185                  190
ttc tcc gtc ccc tcg tcg gtg crc tgc tac cac atc ccc acc ccg gta  624
Phe Ser Val Pro Ser Ser Val Leu Cys Tyr His Ile Pro Thr Pro Val
        195                  200                  205
tcg acg ttc ctg gcc cat cgc gag acc ggt ttc cag gcg gct cag ggt  672
Ser Thr Phe Leu Ala His Arg Glu Thr Gly Phe Gln Ala Ala Gln Gly
    210                  215                  220
cag gca tac gtc gtc gtc agg ccg cag gag ctg gcc gac gcg gcc      717
Gln Ala Tyr Val Val Val Arg Pro Gln Glu Leu Ala Asp Ala Ala
225                  230                  235
<210>41
<211>32
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>41
agagccatgg gacttgcagg cttagttccc gc                               32
<210>42
<211>29
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>42
agagagatct ggccgcgtcg gccagctcc                                     29
<210>43
<211>503
<212>PRT
<213>大肠杆菌
<400>43
Met Glu Phe Ser Val Lys Ser Gly Ser Pro Glu Lys Gln Arg Ser Ala
  1                5                   10                  15
Cys Ile Val Val Gly Val Phe Glu Pro Arg Arg Leu Ser Pro Ile Ala
              20                  25                   30
Glu Gln Leu Asp Lys Ile Ser Asp Gly Tyr Ile Ser Ala Leu Leu Arg
         35                   40                   45
Arg Gly Glu Leu Glu Gly Lys Pro Gly Gln Thr Leu Leu Leu His His
     50                   55                       60
Val Pro Asn Val Leu Ser Glu Arg Ile Leu Leu Ile Gly Cys Gly Lys
 65                   70                   75                  80
Glu Arg Glu Leu Asp Glu Arg Gln Tyr Lys Gln Val Ile Gln Lys Thr
                  85                   90                  95
Ile Asn Thr Leu Asn Asp Thr Gly Ser Met Glu Ala Val Cys Phe Leu
            100                  105                  110
Thr Glu Leu His Val Lys Gly Arg Asn Asn Tyr Trp Lys Val Arg Gln
        115                  120                  125
Ala Val Glu Thr Ala Lys Glu Thr Leu Tyr Ser Phe Asp Gln Leu Lys
    130                  135                  140
Thr Asn Lys Ser Glu Pro Arg Arg Pro Leu Arg Lys Met Val  Phe Asn
145                  150                  155                  160
Val Pro Thr Arg Arg Glu Leu Thr Ser Gly Glu Arg Ala Ile Gln His
                 165                  170                  175
Gly Leu Ala Ile Ala Ala Gly Ile Lys Ala Ala Lys Asp Leu Gly Asn
            180                  185                  190
Met Pro Pro Asn Ile Cys Asn Ala Ala Tyr Leu Ala Ser Gln Ala Arg
        195                  200                  205
Gln Leu Ala Asp Ser Tyr Ser Lys Asn Val Ile Thr Arg Val Ile Gly
    210                  215                  220
Glu Gln Gln Met Lys Glu Leu Gly Met His Ser Tyr Leu Ala Val Gly
225                  230                  235                  240
Gln Gly Ser Gln Asn Glu Ser Leu Met Ser Val Ile Glu Tyr Lys Gly
                245                  250                  255
Asn Ala Ser Glu Asp Ala Arg Pro Ile Val Leu Val Gly Lys Gly Leu
            260                  265                  270
Thr Phe Asp Ser Gly Gly Ile Ser Ile Lys Pro Ser Glu Gly Met Asp
        275                  280                  285
Glu Met Lys Tyr Asp Met Cys Gly Ala Ala Ala Val Tyr Gly Val Met
    290                  295                  300
Arg Met Val Ala Glu Leu Gln Leu Pro Ile Asn Val Ile Gly Val Leu
305                  310                  315                  320
Ala Gly Cys Glu Asn Met Pro Gly Gly Arg Ala Tyr Arg Pro Gly Asp
                 325                  330                  335
Val Leu Thr Thr Met Ser Gly Gln Thr Val Glu Val Leu Asn Thr Asp
            340                  345                  350
Ala Glu Gly Arg Leu Val Leu Cys Asp Val Leu Thr Tyr Val Glu Arg
        355                  360                  365
Phe Glu Pro Glu Ala Val Ile Asp Val Ala Thr Leu Thr Gly Ala Cys
    370                  375                  380
Val Ile Ala Leu Gly His His Ile Thr Gly Leu Met Ala Asn His Asn
385                  390                  395                  400
Pro Leu Ala His Glu Leu Ile Ala Ala Ser Glu Gln Ser Gly Asp Arg
                 405                  410                  415
Ala Trp Arg Leu Pro Leu Gly Asp Glu Tyr Gln Glu Gln Leu Glu Ser
            420                  425                  430
Asn Phe Ala Asp Met Ala Asn Ile Gly Gly Arg Pro Gly Gly Ala Ile
        435                  440                  445
Thr Ala Gly Cys Phe Leu Ser Arg Phe Thr Arg Lys Tyr Asn Trp Ala
    450                  455                  460
His Leu Asp Ile Ala Gly Thr Ala Trp Arg Ser Gly Lys Ala Lys Gly
465                  470                  475                  480
Ala Thr Gly Arg Pro Val Ala Leu Leu Ala Gln Phe Leu Leu Asn Arg
                 485                  490                  495
Ala Gly Phe Asn Gly Glu Glu
             500
<210>44
<211>427
<212>PRT
<213>大肠杆菌
<400>44
Met Thr Glu Ala Met Lys Ile Thr Leu Ser Thr Gln Pro Ala Asp Ala
  1                5                   10                   15
Arg Trp Gly Glu Lys Ala Thr Tyr Ser Ile Asn Asn Asp Gly Ile Thr
              20                   25                  30
Leu His Leu Asn Gly Ala Asp Asp Leu Gly Leu Ile Gln Arg Ala Ala
         35                   40                   45
Arg Lys Ile Asp Gly Leu Gly Ile Lys His Val Gln Leu Ser Gly Glu
     50                   55                   60
Gly Trp Asp Ala Asp Arg Cys Trp Ala Phe Trp Gln Gly Tyr Lys Ala
 65                   70                   75                  80
Pro Lys Gly Thr Arg Lys Val Val Trp Pro Asp Leu Asp Asp Ala Gln
                  85                   90                   95
Arg Gln Glu Leu Asp Asn Arg Leu Met Ile Ile Asp Trp Val Arg Asp
            100                  105                  110
Thr Ile Asn Ala Pro Ala Glu Glu Leu Gly Pro Ser Gln Leu Ala Gln
        115                  120                  125
Arg Ala Val Asp Leu Ile Ser Asn Val Ala Gly Asp Arg Val Thr Tyr
    130                  135                  140
Arg Ile Thr Lys Gly Glu Asp Leu Arg Glu Gln Gly Tyr Met Gly Leu
145                  150                  155                  160
His Thr Val Gly Arg Gly Ser Glu Arg Ser Pro Val Leu Leu Ala Leu
                 165                  170                  175
Asp Tyr Asn Pro Thr Gly Asp Lys Glu Ala Pro Val Tyr Ala Cys Leu
             180                 185                  190
Val Gly Lys Gly Ile Thr Phe Asp Ser Gly Gly Tyr Ser Ile Lys Gln
        195                  200                  205
Thr Ala Phe Met Asp Ser Met Lys Ser Asp Met Gly Gly Ala Ala Thr
    210                  215                  220
Val Thr Gly Ala Leu Ala Phe Ala Ile Thr Arg Gly Leu Asn Lys Arg
225                  230                  235                  240
Val Lys Leu Phe Leu Cys Cys Ala Asp Asn Leu Ile Ser Gly Asn Ala
                 245                  250                  255
Phe Lys Leu Gly Asp Ile Ile Thr Tyr Arg Asn Gly Lys Lys Val Glu
            260                  265                  270
Val Met Asn Thr Asp Ala Glu Gly Arg Leu Val Leu Ala Asp Gly Leu
        275                  280                  285
Ile Asp Ala Ser Ala Gln Lys Pro Glu Met Ile Ile Asp Ala Ala Thr
    290                  295                  300
Leu Thr Gly Ala Ala Lys Thr Ala Leu Gly Asn Asp Tyr His Ala Leu
305                  310                  315                  320
Phe Ser Phe Asp Asp Ala Leu Ala Gly Arg Leu Leu Ala Ser Ala Ala
                 325                  330                  335
Gln Glu Asn Glu Pro Phe Trp Arg Leu Pro Leu Ala Glu Phe His Arg
            340                  345                  350
Ser Gln Leu Pro Ser Asn Phe Ala Glu Leu Asn Asn Thr Gly Ser Ala
        355                  360                  365
Ala Tyr Pro Ala Gly Ala Ser Thr Ala Ala Gly Phe Leu Ser His Phe
    370                  375                  380
Val Glu Asn Tyr Gln Gln Gly Trp Leu His Ile Asp Cys Ser Ala Thr
385                  390                  395                  400
Tyr Arg Lys Ala Pro Val Glu Gln Trp Ser Ala Gly Ala Thr Gly Leu
                 405                  410                  415
Gly Val Arg Thr Ile Ala Asn Leu Leu Thr Ala
            420                  425
<210>45
<211>485
<212>PRT
<213>大肠杆菌(Escherichia coli)
<400>45
Met Ser Glu Leu Ser Gln Leu Ser Pro Gln Pro Leu Trp Asp Ile Phe
  1                5                   10                  15
Ala Lys Ile Cys Ser Ile Pro His Pro Ser Tyr His Glu Glu Gln Leu
              20                   25                  30
Ala Glu Tyr Ile Val Gly Trp Ala Lys Glu Lys Gly Phe His Val Glu
         35                   40                   45
Arg Asp Gln Val Gly Asn Ile Leu Ile Arg Lys Pro Ala Thr Ala Gly
     50                   55                   60
Met Glu Asn Arg Lys Pro Val Val Leu Gln Ala His Leu Asp Met Val
 65                   70                   75                  80
Pro Gln Lys Asn Asn Asp Thr Val His Asp Phe Thr Lys Asp Pro Ile
                  85                   90                  95
Gln Pro Tyr Ile Asp Gly Glu Trp Val Lys Ala Arg Gly Thr Thr Leu
             100                 105                  110
Gly Ala Asp Asn Gly Ile Gly Met Ala Ser Ala Leu Ala Val Leu Ala
        115                  120                  125
Asp Glu Asn Val Val His Gly Pro Leu Glu Val Leu Leu Thr Met Thr
    130                  135                  140
Glu Glu Ala Gly Met Asp Gly Ala Phe Gly Leu Gln Gly Asn Trp Leu
145                  150                  155                  160
Gln Ala Asp Ile Leu Ile Asn Thr Asp Ser Glu Glu Glu Gly Glu Ile
                 165                  170                  175
Tyr Met Gly Cys Ala Gly Gly Ile Asp Phe Thr Ser Asn Leu His Leu
            180                  185                  190
Asp Arg Glu Ala Val Pro Ala Gly Phe Glu Thr Phe Lys Leu Thr Leu
        195                  200                  205
Lys Gly Leu Lys Gly Gly His Ser Gly Gly Glu Ile His Val Gly Leu
    210                  215                  220
Gly Asn Ala Asn Lys Leu Leu Val Arg Phe Leu Ala Gly His Ala Glu
225                  230                  235                  240
Glu Leu Asp Leu Arg Leu Ile Asp Phe Asn Gly Gly Thr Leu Arg Asn
                 245                  250                  255
Ala Ile Pro Arg Glu Ala Phe Ala Thr Ile Ala Val Ala Ala Asp Lys
             260                  265                  270
Val Asp Val Leu Lys Ser Leu Val Asn Thr Tyr Gln Glu Ile Leu Lys
        275                  280                  285
Asn Glu Leu Ala Glu Lys Glu Lys Asn Leu Ala Leu Leu Leu Asp Ser
    290                  295                  300
Val Ala Asn Asp Lys Ala Ala Leu Ile Ala Lys Ser Arg Asp Thr Phe
305                  310                  315                  320
Ile Arg Leu Leu Asn Ala Thr Pro Asn Gly Val Ile Arg Asn Ser Asp
                 325                  330                  335
Val Ala Lys Gly Val Val Glu Thr Ser Leu Asn Val Gly Val Val Thr
            340                  345                  350
Met Thr Asp Asn Ash Val Glu Ile His Cys Leu Ile Arg Ser Leu Ile
        355                  360                  365
Asp Ser Gly Lys Asp Tyr Val Val Ser Met Leu Asp Ser Leu Gly Lys
    370                  375                  380
Leu Ala Gly Ala Lys Thr Glu Ala Lys Gly Ala Tyr Pro Gly Trp Gln
385                  390                  395                  400
Pro Asp Ala Asn Ser Pro Val Met His Leu Val Arg Glu Thr Tyr Gln
                405                  410                  415
Arg Leu Phe Asn Lys Thr Pro Asn Ile Gln Ile Ile His Ala Gly Leu
            420                  425                  430
Glu Cys Gly Leu Phe Lys Lys Pro Tyr Pro Glu Met Asp Met Val Ser
        435                  440                  445
Ile Gly Pro Thr Ile Thr Gly Pro His Ser Pro Asp Glu Gln Val His
    450                  455                  460
Ile Glu Ser Val Gly His Tyr Trp Thr Leu Leu Thr Glu Leu Leu Lys
465                  470                  475                  480
Glu Ile Pro Ala Lys
                 485
<210>46
<211>870
<212>PRT
<213>大肠杆菌
<400>46
Met Thr Gln Gln Pro Gln Ala Lys Tyr Arg His Asp Tyr Arg Ala Pro
  1                5                   10                  15
Asp Tyr Gln Ile Thr Asp Ile Asp Leu Thr Phe Asp Leu Asp Ala Gln
             20                   25                   30
Lys Thr Val Val Thr Ala Val Ser Gln Ala Val Arg His Gly Ala Ser
         35                   40                   45
Asp Ala Pro Leu Arg Leu Asn Gly Glu Asp Leu Lys Leu Val Ser Val
     50                   55                   60
His Ile Asn Asp Glu Pro Trp Thr Ala Trp Lys Glu Glu Glu Gly Ala
 65                   70                   75                  80
Leu Val Ile Ser Asn Leu Pro Glu Arg Phe Thr Leu Lys Ile Ile Asn
                  85                   90                  95
Glu Ile Ser Pro Ala Ala Asn Thr Ala Leu Glu Gly Leu Tyr Gln Ser
             100                  105                 110
Gly Asp Ala Leu Cys Thr Gln Cys Glu Ala Glu Gly Phe Arg His Ile
        115                  120                  125
Thr Tyr Tyr Leu Asp Arg Pro Asp Val Leu Ala Arg Phe Thr Thr Lys
    130                  135                  140
Ile Ile Ala Asp Lys Ile Lys Tyr Pro Phe Leu Leu Ser Asn Gly Asn
145                  150                  155                  160
Arg Val Ala Gln Gly Glu Leu Glu Asn Gly Arg His Trp Val Gln Trp
                 165                  170                  175
Gln Asp Pro Phe Pro Lys Pro Cys Tyr Leu Phe Ala Leu Val Ala Gly
             180                 185                  190
Asp Phe Asp Val Leu Arg Asp Thr Phe Thr Thr Arg Ser Gly Arg Glu
        195                  200                  205
Val Ala Leu Glu Leu Tyr Val Asp Arg Gly Asn Leu Asp Arg Ala Pro
    210                  215                  220
Trp Ala Met Thr Ser Leu Lys Asn Ser Met Lys Trp Asp Glu Glu Arg
225                  230                  235                  240
Phe Gly Leu Glu Tyr Asp Leu Asp Ile Tyr Met Ile Val Ala Val Asp
                 245                  250                  255
Phe Phe Asn Met Gly Ala Met Glu Asn Lys Gly Leu Asn Ile Phe Asn
            260                  265                  270
Ser Lys Tyr Val Leu Ala Arg Thr Asp Thr Ala Thr Asp Lys Asp Tyr
        275                  280                  285
Leu Asp Ile Glu Arg Val Ile Gly His Glu Tyr Phe His Asn Trp Thr
    290                  295                  300
Gly Asn Arg Val Thr Cys Arg Asp Trp Phe Gln Leu Ser Leu Lys Glu
305                  310                  315                  320
Gly Leu Thr Val Phe Arg Asp Gln Glu Phe Ser Ser Asp Leu Gly Ser
                 325                  330                  335
Arg Ala Val Asn Arg Ile Asn Asn Val Arg Thr Met Arg Gly Leu Gln
             340                  345                  350
Phe Ala Glu Asp Ala Ser Pro Met Ala His Pro Ile Arg Pro Asp Met
        355                  360                  365
Val Ile Glu Met Asn Asn Phe Tyr Thr Leu Thr Val Tyr Glu Lys Gly
    370                  375                  380
Ala Glu Val Ile Arg Met Ile His Thr Leu Leu Gly Glu Glu Asn Phe
385                  390                  395                  400
Gln Lys Gly Met Gln Leu Tyr Phe Glu Arg His Asp Gly Ser Ala Ala
                 405                  410                  415
Thr Cys Asp Asp Phe Val Gln Ala Met Glu Asp Ala Ser Asn Val Asp
            420                  425                  430
Leu Ser His Phe Arg Arg Trp Tyr Ser Gln Ser Gly Thr Pro Ile Val
        435                  440                  445
Thr Val Lys Asp Asp Tyr Asn Pro Glu Thr Glu Gln Tyr Thr Leu Thr
    450                  455                  460
Ile Ser Gln Arg Thr Pro Ala Thr Pro Asp Gln Ala Glu Lys Gln Pro
465                  470                  475                  480
Leu His Ile Pro Phe Ala Ile Glu Leu Tyr Asp Asn Glu Gly Lys Val
                 485                  490                  495
Ile Pro Leu Gln Lys Gly Gly His Pro Val Asn Ser Val Leu Asn Val
             500                  505                  510
Thr Gln Ala Glu Gln Thr Phe Val Phe Asp Asn Val Tyr Phe Gln Pro
        515                  520                  525
Val Pro Ala Leu Leu Cys Glu Phe Ser Ala Pro Val Lys Leu Glu Tyr
    530                  535                  540
Lys Trp Ser Asp Gln Gln Leu Thr Phe Leu Met Arg His Ala Arg Asn
545                  550                  555                  560
Asp Phe Ser Arg Trp Asp Ala Ala Gln Ser Leu Leu Ala Thr Tyr Ile
                 565                  570                  575
Lys Leu Asn Val Ala Arg His Gln Gln Gly Gln Pro Leu Ser Leu Pro
            580                  585                  590
Val His Val Ala Asp Ala Phe Arg Ala Val Leu Leu Asp Glu Lys Ile
        595                  600                  605
Asp Pro Ala Leu Ala Ala Glu Ile Leu Thr Leu Pro Ser Val Asn Glu
    610                  615                  620
Met Ala Glu Leu Phe Asp Ile Ile Asp Pro Ile Ala Ile Ala Glu Val
625                  630                  635                  640
Arg Glu Ala Leu Thr Arg Thr Leu Ala Thr Glu Leu Ala Asp Glu Leu
                645                  650                  655
Leu Ala Ile Tyr Asn Ala Asn Tyr Gln Ser Glu Tyr Arg Val Glu His
            660                  665                  670
Glu Asp Ile Ala Lys Arg Thr Leu Arg Asn Ala Cys Leu Arg Phe Leu
        675                  680                  685
Ala Phe Gly Glu Thr His Leu Ala Asp Val Leu Val Ser Lys Gln Phe
    690                  695                  700
His Glu Ala Asn Asn Met Thr Asp Ala Leu Ala Ala Leu Ser Ala Ala
705                  710                  715                  720
Val Ala Ala Gln Leu Pro Cys Arg Asp Ala Leu Met Gln Glu Tyr Asp
                 725                  730                  735
Asp Lys Trp His Gln Asn Gly Leu Val Met Asp Lys Trp Phe Ile Leu
            740                  745                  750
Gln Ala Thr Ser Pro Ala Ala Asn Val Leu Glu Thr Val Arg Gly Leu
        755                  760                  765
Leu Gln His Arg Ser Phe Thr Met Ser Asn Pro Asn Arg Ile Arg Ser
    770                  775                  780
Leu Ile Gly Ala Phe Ala Gly Ser Asn Pro Ala Ala Phe His Ala Glu
785                  790                  795                  800
Asp Gly Ser Gly Tyr Leu Phe Leu Val Glu Met Leu Thr Asp Leu Asn
                805                  810                  815
Ser Arg Asn Pro Gln Val Ala Ser Arg Leu Ile Glu Pro Leu Ile Arg
            820                  825                  830
Leu Lys Arg Tyr Asp Ala Lys Arg Gln Glu Lys Met Arg Ala Ala Leu
        835                  840                  845
Glu Gln Leu Lys Gly Leu Glu Asn Leu Ser Gly Asp Leu Tyr Glu Lys
    850                  855                  860
Ile Thr Lys Ala Leu Ala
865                  870
<210>47
<211>535
<212>PRT
<213>大肠杆菌
<400>47
Met Arg Ile Ser Leu Lys Lys Ser Gly Met Leu Lys Leu Gly Leu Ser
  l                5                   10                  15
Leu Val Ala Met Thr Val Ala Ala Ser Val Gln Ala Lys Thr Leu Val
             20                   25                   30
Tyr Cys Ser Glu Gly Ser Pro Glu Gly Phe Asn Pro Gln Leu Phe Thr
         35                   40                   45
Ser Gly Thr Thr Tyr Asp Ala Ser Ser Val Pro Leu Tyr Asn Arg Leu
     50                   55                    60
Val Glu Phe Lys Ile Gly Thr Thr Glu Val Ile Pro Gly Leu Ala Glu
 65                   70                   75                  80
Lys Trp Glu Val Ser Glu Asp Gly Lys Thr Tyr Thr Phe His Leu Arg
                 85                    90                   95
Lys Gly Val Lys Trp His Asp Asn Lys Glu Phe Lys Pro Thr Arg Glu
             100                 105                  110
Leu Asn Ala Asp Asp Val Val Phe Ser Phe Asp Arg Gln Lys Asn Ala
        115                  120                  125
Gln Asn Pro Tyr His Lys Val Ser Gly Gly Ser Tyr Glu Tyr Phe Glu
    130                  135                  140
Gly Met Gly Leu Pro Glu Leu Ile Ser Glu Val Lys Lys Val Asp Asp
145                  150                  155                  160
Asn Thr Val Gln Phe Val Leu Thr Arg Pro Glu Ala Pro Phe Leu Ala
                 165                  170                  175
Asp Leu Ala Met Asp Phe Ala Ser Ile Leu Ser Lys Glu Tyr Ala Asp
            180                  185                  190
Ala Met Met Lys Ala Gly Thr Pro Glu Lys Leu Asp Leu Asn Pro Ile
        195                  200                  205
Gly Thr Gly Pro Phe Gln Leu Gln Gln Tyr Gln Lys Asp Ser Arg Ile
    210                  215                  220
Arg Tyr Lys Ala Phe Asp Gly Tyr Trp Gly Thr Lys Pro Gln Ile Asp
225                  230                  235                  240
Thr Leu Val Phe Ser Ile Thr Pro Asp Ala Ser Val Arg Tyr Ala Lys
                 245                  250                  255
Leu Gln Lys Asn Glu Cys Gln Val Met Pro Tyr Pro Asn Pro Ala Asp
            260                  265                  270
Ile Ala Arg Met Lys Gln Asp Lys Ser Ile Asn Leu Met Glu Met Pro
        275                  280                  285
Gly Leu Asn Val Gly Tyr Leu Ser Tyr Asn Val Gln Lys Lys Pro Leu
    290                  295                  300
Asp Asp Val Lys Val Arg Gln Ala Leu Thr Tyr Ala Val Asn Lys Asp
305                  310                  315                  320
Ala Ile Ile Lys Ala Val Tyr Gln Gly Ala Gly Val Ser Ala Lys Asn
                 325                  330                  335
Leu Ile Pro Pro Thr Met Trp Gly Tyr Asn Asp Asp Val Gln Asp Tyr
            340                  345                  350
Thr Tyr Asp Pro Glu Lys Ala Lys Ala Leu Leu Lys Glu Ala Gly Leu
        355                  360                  365
Glu Lys Gly Phe Ser Ile Asp Leu Trp Ala Met Pro Val Gln Arg Pro
    370                  375                  380
Tyr Asn Pro Asn Ala Arg Arg Met Ala Glu Met Ile Gln Ala Asp Trp
385                  390                  395                  400
Ala Lys Val Gly Val Gln Ala Lys Ile Val Thr Tyr Glu Trp Gly Glu
                 405                  410                  415
Tyr Leu Lys Arg Ala Lys Asp Gly Glu His Gln Thr Val Met Met Gly
            420                  425                  430
Trp Thr Gly Asp Asn Gly Asp Pro Asp Asn Phe Phe Ala Thr Leu Phe
        435                  440                  445
Ser Cys Ala Ala Ser Glu Gln Gly Ser Asn Tyr Ser Lys Trp Cys Tyr
    450                  455                  460
Lys Pro Phe Glu Asp Leu Ile Gln Pro Ala Arg Ala Thr Asp Asp His
465                  470                  475                  480
Asn Lys Arg Val Glu Leu Tyr Lys Gln Ala Gln Val Val Met His Asp
                 485                  490                  495
Gln Ala Pro Ala Leu Ile Ile Ala His Ser Thr Val Phe Glu Pro Val
            500                  505                  510
Arg Lys Glu Val Lys Gly Tyr Val Val Asp Pro Leu Gly Lys His His
        515                  520                  525
Phe Glu Asn Val Ser Ile Glu
    530                  535
<210>48
<211>339
<212>PRT
<213>大肠杆菌
<400>48
Met Leu Gln Phe Ile Leu Arg Arg Leu Gly Leu Val Ile Pro Thr Phe
  1                5                   10                  15
Ile Gly Ile Thr Leu Leu Thr Phe Ala Phe Val His Met Ile Pro Gly
             20                   25                   30
Asp Pro Val Met Ile Met Ala Gly Glu Arg Gly Ile Ser Pro Glu Arg
         35                   40                   45
His Ala Gln Leu Leu Ala Glu Leu Gly Leu Asp Lys Pro Met Trp Gln
     50                   55                   60
Gln Tyr Leu His Tyr Ile Trp Gly Val Met His Gly Asp Leu Gly Ile
 65                   70                   75                  80
Ser Met Lys Ser Arg Ile Pro Val Trp Glu Glu Phe Val Pro Arg Phe
                  85                   90                   95
Gln Ala Thr Leu Glu Leu Gly Val Cys Ala Met Ile Phe Ala Thr Ala
             100                  105                 110
Val Gly Ile Pro Val Gly Val Leu Ala Ala Val Lys Arg Gly Ser Ile
        115                  120                  125
Phe Asp His Thr Ala Val Gly Leu Ala Leu Thr Gly Tyr Ser Met Pro
    130                  135                  140
Ile Phe Trp Trp Gly Met Met Leu Ile Met Leu Val Ser Val His Trp
145                  150                  155                  160
Asn Leu Thr Pro Val Ser Gly Arg Val Ser Asp Met Val Phe Leu Asp
                 165                  170                  175
Asp Ser Asn Pro Leu Thr Gly Phe Met Leu Ile Asp Thr Ala Ile Trp
            180                  185                  190
Gly Glu Asp Gly Asn Phe Ile Asp Ala Val Ala His Met Ile Leu Pro
        195                  200                  205
Ala Ile Val Leu Gly Thr Ile Pro Leu Ala Val Ile Val Arg Met Thr
    210                  215                  220
Arg Ser Ser Met Leu Glu Val Leu Gly Glu Asp Tyr Ile Arg Thr Ala
225                  230                  235                  240
Arg Ala Lys Gly Leu Thr Arg Met Arg Val Ile Ile Val His Ala Leu
                 245                  250                  255
Arg Asn Ala Met Leu Pro Val Val Thr Val Ile Gly Leu Gln Val Gly
             260                  265                  270
Thr Leu Leu Ala Gly Ala Ile Leu Thr Glu Thr Ile Phe Ser Trp Pro
        275                  280                  285
Gly Leu Gly Arg Trp Leu Ile Asp Ala Leu Gln Arg Arg Asp Tyr Pro
    290                  295                  300
Val Val Gln Gly Gly Val Leu Leu Val Ala Thr Met Ile Ile Leu Val
305                  310                  315                  320
Asn Leu Leu Val Asp Leu Leu Tyr Gly Val Val Asn Pro Arg Ile Arg
                 325                  330                  335
His Lys Lys
<210>49
<211>300
<212>PRT
<213>大肠杆菌
<400>49
Met Ser Gln Val Thr Glu Asn Lys Val Ile Ser Ala Pro Val Pro Met
  1                5                   10                   15
Thr Pro Leu Gln Glu Phe Trp His Tyr Phe Lys Arg Asn Lys Gly Ala
             20                    25                  30
Val Val Gly Leu Val Tyr Val Val Ile Val Leu Phe Ile Ala Ile Phe
         35                   40                   45
Ala Asn Trp Ile Ala Pro Tyr Asn Pro Ala Glu Gln Phe Arg Asp Ala
     50                   55                   60
Leu Leu Ala Pro Pro Ala Trp Gln Glu Gly Gly Ser Met Ala His Leu
 65                   70                   75                  80
Leu gly Thr Asp Asp Val Gly Arg Asp Val Leu Ser Arg Leu Met Tyr
                  85                   90                  95
Gly Ala Arg Leu Ser Leu Leu Val Gly Cys Leu Val Val Val Leu Ser
            100                  105                  110
Leu Ile Met Gly Val Ile Leu Gly Leu Ile Ala Gly Tyr Phe Gly Gly
        115                  120                  125
Leu Val Asp Asn Ile Ile Met Arg Val Val Asp Ile Met Leu Ala Leu
    130                  135                  140
Pro Ser Leu Leu Leu Ala Leu Val Leu Val Ala Ile Phe Gly Pro Ser
145                  150                  155                  160
Ile Gly Asn Ala Ala Leu Ala Leu Thr Phe Val Ala Leu Pro His Tyr
                 165                  170                  175
Val Arg Leu Thr Arg Ala Ala Val Leu Val Glu Val Asn Arg Asp Tyr
             180                  185                  190
Val Thr Ala Ser Arg Val Ala Gly Ala Gly Ala Met Arg Gln Met Phe
        195                  200                  205
Ile Asn Ile Phe Pro Asn Cys Leu Ala Pro Leu Ile Val Gln Ala Ser
    210                  215                  220
Leu Gly Phe Ser Asn Ala Ile Leu Asp Met Ala Ala Leu Gly Phe Leu
225                  230                  235                  240
Gly Met Gly Ala Gln Pro Pro Thr Pro Glu Trp Gly Thr Met Leu Ser
                 245                  250                  255
Asp Val Leu Gln Phe Ala Gln Ser Ala Trp Trp Val Val Thr Phe Pro
            260                  265                  270
Gly Leu Ala Ile Leu Leu Thr Val Leu Ala Phe Asn Leu Met Gly Asp
        275                  280                  285
Gly Leu Arg Asp Ala Leu Asp Pro Lys Leu Lys Gln
    290                  295                  300
<210>50
<211>327
<212>PRT
<213>大肠杆菌
<400>50
Met Ala Leu Leu Asn Val Asp Lys Leu Ser Val His Phe Gly Asp Glu
   1               5                   10                  15
Ser Ala Pro Phe Arg Ala Val Asp Arg Ile Ser Tyr Ser Val Lys Gln
              20                  25                   30
Gly Glu Val Val Gly Ile Val Gly Glu Ser Gly Ser Gly Lys Ser Val
         35                   40                   45
Ser Ser Leu Ala Ile Met Gly Leu Ile Asp Tyr Pro Gly Arg Val Met
     50                   55                   60
Ala Glu Lys Leu Glu Phe Asn Gly Gln Asp Leu Gln Arg Ile Ser Glu
 65                   70                   75                  80
Lys Glu Arg Arg Asn Leu Val Gly Ala Glu Val Ala Met Ile Phe Gln
                  85                   90                   95
Asp Pro Met Thr Ser Leu Asn Pro Cys Tyr Thr Val Gly Phe Gln Ile
            100                  105                  110
Met Glu Ala Ile Lys Val His Gln Gly Gly Asn Lys Ser Thr Arg Arg
        115                  120                  125
Gln Arg Ala Ile Asp Leu Leu Asn Gln Val Gly Ile Pro Asp Pro Ala
    130                  135                  140
Ser Arg Leu Asp Val Tyr Pro His Gln Leu Ser Gly Gly Met Ser Gln
145                  150                  155                  160
Arg Val Met Ile Ala Met Ala Ile Ala Cys Arg Pro Lys Leu Leu Ile
                165                  170                  175
Ala Asp Glu Pro Thr Thr Ala Leu Asp Val Thr Ile Gln Ala Gln Ile
            180                  185                  190
Ile Glu Leu Leu Leu Glu Leu Gln Gln Lys Glu Asn Met Ala Leu Val
        195                  200                  205
 Leu Ile Thr His Asp Leu Ala Leu Val Ala Glu Ala Ala His Lys Ile
     210                  215                  220
Ile Val Met Tyr Ala Gly Gln Val Val Glu Thr Gly Asp Ala His Ala
225                  230                  235                  240
Ile Phe His Ala Pro Arg His Pro Tyr Thr Gln Ala Leu Leu Arg Ala
                 245                  250                  255
Leu Pro Glu Phe Ala Gln Asp Lys Glu Arg Leu Ala Ser Leu Pro Gly
            260                  265                  270
Val Val Pro Gly Lys Tyr Asp Arg Pro Asn Gly Cys Leu Leu Asn Pro
        275                  280                  285
Arg Cys Pro Tyr Ala Thr Asp Arg Cys Arg Ala Glu Glu Pro Ala Leu
    290                  295                  300
Asn Met Leu Ala Asp Gly Arg Gln Ser Lys Cys His Tyr Pro Leu Asp
305                  310                  315                  320
Asp Ala Gly Arg Pro Thr Leu
                 325
<210>51
<211>334
<212>PRT
<213>大肠杆菌
<400>51
Met Ser Thr Gln Glu Ala Thr Leu Gln Gln Pro Leu Leu Gln Ala Ile
   1               5                   10                  15
Asp Leu Lys Lys His Tyr Pro Val Lys Lys Gly Met Phe Ala Pro Glu
             20                    25                  30
Arg Leu Val Lys Ala Leu Asp Gly Val Ser Phe Asn Leu Glu Arg Gly
         35                   40                   45
Lys Thr Leu Ala Val Val Gly Glu Ser Gly Cys Gly Lys Ser Thr Leu
     50                   55                   60
Gly Arg Leu Leu Thr Met Ile Glu Met Pro Thr Gly Gly Glu Leu Tyr
 65                   70                   75                  80
Tyr Gln Gly Gln Asp Leu Leu Lys His Asp Pro Gln Ala Gln Lys Leu
                  85                   90                  95
Arg Arg Gln Lys Ile Gln Ile Val Phe Gln Asn Pro Tyr Gly Ser Leu
             100                 105                  110
Asn Pro Arg Lys Lys Val Gly Gln Ile Leu Glu Glu Pro Leu Leu Ile
        115                  120                  125
Asn Thr Ser Leu Ser Lys Glu Gln Arg Arg Glu Lys Ala Leu Ser Met
    130                  135                  140
Met Ala Lys Val Gly Leu Lys Thr Glu His Tyr Asp Arg Tyr Pro His
145                  150                  155                  160
Met Phe Ser Gly Gly Gln Arg Gln Arg Ile Ala Ile Ala Arg Gly Leu
                 165                  170                  175
Met Leu Asp Pro Asp Val Val Ile Ala Asp Glu Pro Val Ser Ala Leu
             180                  185                  190
Asp Val Ser Val Arg Ala Gln Val Leu Asn Leu Met Met Asp Leu Gln
        195                  200                  205
Gln Glu Leu Gly Leu Ser Tyr Val Phe Ile Ser His Asp Leu Ser Val
    210                  215                  220
Val Glu His Ile Ala Asp Glu Val Met Val Met Tyr Leu Gly Arg Cys
225                  230                  235                  240
Val Glu Lys Gly Thr Lys Asp Gln Ile Phe Asn Asn Pro Arg His Pro
                 245                  250                  255
Tyr Thr Gln Ala Leu Leu Ser Ala Thr Pro Arg Leu Asn Pro Asp Asp
            260                  265                  270
Arg Arg Glu Arg Ile Lys Leu Ser Gly Glu Leu Pro Ser Pro Leu Asn
        275                  280                  285
Pro Pro Pro Gly Cys Ala Phe Asn Ala Arg Cys Arg Arg Arg Phe Gly
    290                  295                  300
Pro Cys Thr Gln Leu Gln Pro Gln Leu Lys Asp Tyr Gly Gly Gln Leu
305                  310                  315                  320
Val Ala Cys Phe Ala Val Asp Gln Asp Glu Asn Pro Gln Arg
                325                  330
<210>52
<211>34
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>52
gaagttccta tactttctag agaataggaa cttc                              34
<210>53
<211>1509
<212>DNA
<213>大肠杆菌
<400>53
atg gag ttt agt gta aaa agc ggt agc ccg gag aaa cag cgg agt gcc    48
Met Glu Phe Ser Val Lys Ser Gly Ser Pro Glu Lys Gln Arg Ser Ala
  1                5                   10                   15
tgc atc gtc gtg ggc gtc ttc gaa cca cgt cgc ctt tct ccg att gca    96
Cys Ile Val Val Gly Val Phe Glu Pro Arg Arg Leu Ser Pro Ile Ala
             20                   25                   30
gaa cag ctc gat aaa atc agc gat ggg tac atc agc gcc ctg cta cgt   144
Glu Gln Leu Asp Lys Ile Ser Asp Gly Tyr Ile Ser Ala Leu Leu Arg
         35                   40                   45
cgg ggc gaa ctg gaa gga aaa ccg ggg cag aca ttg ttg ctg cac cat   192
Arg Gly Glu Leu Glu Gly Lys Pro Gly Gln Thr Leu Leu Leu His His
     50                   55                   60
gtt ccg aat gta ctt tcc gag cga att ctc ctt att ggt tgc ggc aaa   240
Val Pro Asn Val Leu Ser Glu Arg Ile Leu Leu Ile Gly Cys Gly Lys
 65                  70                    75                  80
gaa cgt gag ctg gat gag cgt cag tac aag cag gtt att cag aaa acc   288
Glu Arg Glu Leu Asp Glu Arg Gln Tyr Lys Gln Val Ile Gln Lys Thr
                  85                   90                  95
att aat acg ctg aat gat act ggc tca atg gaa gcg gtc tgc ttt ctg   336
Ile Asn Thr Leu Asn Asp Thr Gly Ser Met Glu Ala Val Cys Phe Leu
             100                 105                  110
act gag ctg cac gtt aaa ggc cgt aac aac tac tgg aaa gtg cgt cag   384
Thr Glu Leu His Val Lys Gly Arg Asn Asn Tyr Trp Lys Val Arg Gln
        115                  120                  125
gct gtc gag acg gca aaa gag acg ctc tac agt ttc gat cag ctg aaa   432
Ala Val Glu Thr Ala Lys Glu Thr Leu Tyr Ser Phe Asp Gln Leu Lys
    130                  135                  140
acg aac aag agc gaa ccg cgt cgt ccg ctg cgt aag atg gtg ttc aac   480
Thr Asn Lys Ser Glu Pro Arg Arg Pro Leu Arg Lys Met Val Phe Asn
145                  150                  155                  160
gtg ccg acc cgc cgt gaa ctg acc agc ggt gag cgc gcg atc cag cac   528
Val Pro Thr Arg Arg Glu Leu Thr Ser Gly Glu Arg Ala Ile Gln His
                 165                  170                  175
ggt ctg gcg att gcc gcc ggg att aaa gca gca aaa gat ctc ggc aat   576
Gly Leu Ala Ile Ala Ala Gly Ile Lys Ala Ala Lys Asp Leu Gly Asn
            180                  185                  190
atg ccg ccg aat atc tgt aac gcc gct tac ctc gct tca caa gcg cgc   624
Met Pro Pro Asn Ile Cys Asn Ala Ala Tyr Leu Ala Ser Gln Ala Arg
        195                  200                  205
cag ctg gct gac agc tac agc aag aat gtc atc acc cgc gtt atc ggc   672
Gln Leu Ala Asp Ser Tyr Ser Lys Asn Val Ile Thr Arg Val Ile Gly
    210                  215                  220
gaa cag cag atg aaa gag ctg ggg atg cat tcc tat ctg gcg gtc ggt   720
Glu Gln Gln Met Lys Glu Leu Gly Met His Ser Tyr Leu Ala Val Gly
225                  230                  235                  240
cag ggt tcg caa aac gaa tcg ctg atg tcg gtg att gag tac aaa ggc   768
Gln Gly Ser Gln Asn Glu Ser Leu Met Ser Val Ile Glu Tyr Lys Gly
                245                  250                  255
aac gcg tcg gaa gat gca cgc cca atc gtg ctg gtg ggt aaa ggt tta   816
Asn Ala Ser Glu Asp Ala Arg Pro Ile Val Leu Val Gly Lys Gly Leu
            260                  265                  270
acc ttc gac tcc ggc ggt atc tcg atc aag cct tca gaa ggc atg gat   864
Thr Phe Asp Ser Gly Gly Ile Ser Ile Lys Pro Ser Glu Gly Met Asp
        275                  280                  285
gag atg aag tac gat atg tgc ggt gcg gca gcg gtt tac ggc gtg atg   912
Glu Met Lys Tyr Asp Met Cys Gly Ala Ala Ala Val Tyr Gly Val Met
    290                  295                  300
cgg atg gtc gcg gag cta caa ctg ccg att aac gtt atc ggc gtg ttg   960
Arg Met Val Ala Glu Leu Gln Leu Pro Ile Asn Val Ile Gly Val Leu
305                  310                  315                  320
gca ggc tgc gaa aac atg cct ggc gga cga gcc tat cgt ccg ggc gat  1008
Ala Gly Cys Glu Asn Met Pro Gly Gly Arg Ala Tyr Arg Pro Gly Asp
                 325                  330                  335
gtg tta acc acc atg tcc ggt caa acc gtt gaa gtg ctg aac acc gac  1056
Val Leu Thr Thr Met Ser Gly Gln Thr Val Glu Val Leu Asn Thr Asp
            340                  345                  350
gct gaa ggc cgc ctg gta ctg tgc gac gtg tta act tac gtt gag cgt  1104
Ala Glu Gly Arg Leu Val Leu Cys Asp Val Leu Thr Tyr Val Glu Arg
        355                  360                  365
ttt gag ccg gaa gcg gtg att gac gtg gcg acg ctg acc ggt gcc tgc  1152
Phe Glu Pro Glu Ala Val Ile Asp Val Ala Thr Leu Thr Gly Ala Cys
    370                  375                  380
gtg atc gcg ctg ggt cat cat att act ggt ctg atg gcg aac cat aat  1200
Val Ile Ala Leu Gly His His Ile Thr Gly Leu Met Ala Asn His Asn
385                  390                  395                  400
ccg ctg gcc cat gaa ctg att gcc gcg tct gaa caa tcc ggt gac cgc  1248
Pro Leu Ala His Glu Leu Ile Ala Ala Ser Glu Gln Ser Gly Asp Arg
                 405                  410                  415
gca tgg cgc tta ccg ctg ggt gac gag tat cag gaa caa ctg gag tcc  1296
Ala Trp Arg Leu Pro Leu Gly Asp Glu Tyr Gln Glu Gln Leu Glu Ser
            420                  425                  430
aat ttt gcc gat atg gcg aac att ggc ggt cgt cct ggt ggg gcg att  1344
Asn Phe Ala Asp Met Ala Asn Ile Gly Gly Arg Pro Gly Gly Ala Ile
        435                  440                  445
acc gca ggt tgc ttc ctg tca cgc ttt acc cgt aag tac aac tgg gcg  1392
Thr Ala Gly Cys Phe Leu Ser Arg Phe Thr Arg Lys Tyr Asn Trp Ala
    450                  455                  460
cac ctg gat atc gcc ggt acc gcc tgg cgt tct ggt aaa gca aaa ggc  1440
His Leu Asp Ile Ala Gly Thr Ala Trp Arg Ser Gly Lys Ala Lys Gly
465                  470                  475                  480
gcc acc ggt cgt ccg gta gcg ttg ctg gca cag ttc ctg tta aac cgc  1488
Ala Thr Gly Arg Pro Val Ala Leu Leu Ala Gln Phe Leu Leu Asn Arg
                 485                  490                  495
gct ggg ttt aac ggc gaa gag                                      1509
Ala Gly Phe Asn Gly Glu Glu
            500
<210>54
<211>1281
<212>DNA
<213>大肠杆菌
<400>54
atg aca gaa gcg atg aag att acc ctc tct acc caa cct gcc gac gcg    48
Met Thr Glu Ala Met Lys Ile Thr Leu Ser Thr Gln Pro Ala Asp Ala
  1                5                   10                  15
cgc tgg gga gaa aaa gca act tac agc att aat aat gac ggc att acc    96
Arg Trp Gly Glu Lys Ala Thr Tyr Ser Ile Asn Asn Asp Gly Ile Thr
             20                   25                   30
ctg cat ttg aac ggg gca gac gat ctg ggg ctg atc cag cgt gcg gcg   144
Leu His Leu Asn Gly Ala Asp Asp Leu Gly Leu Ile Gln Arg Ala Ala
         35                   40                   45
cgc aag att gac ggt ctg ggc atc aag cat gtt cag tta agc ggt gaa   192
Arg Lys Ile Asp Gly Leu Gly Ile Lys His Val Gln Leu Ser Gly Glu
     50                   55                   60
ggc tgg gat gcg gat cgc tgc tgg gca ttc tgg caa ggt tac aaa gcc   240
Gly Trp Asp Ala Asp Arg Cys Trp Ala Phe Trp Gln Gly Tyr Lys Ala
 65                   70                  75                   80
ccg aaa ggc acg cgt aaa gtg gtg tgg ccg gat ctg gac gat gcc cag   288
Pro Lys Gly Thr Arg Lys Val Val Trp Pro Asp Leu Asp Asp Ala Gln
                  85                   90                  95
cgc cag gaa ctg gat aac cgc ctg atg arc arc gac tgg gtg cgt gac   336
Arg Gln Glu Leu Asp Asn Arg Leu Met Ile Ile Asp Trp Val Arg Asp
            100                  105                  110
acc atc aac gca ccg gca gaa gaa ttg gga cca tcg caa ctg gca cag   384
Thr Ile Asn Ala Pro Ala Glu Glu Leu Gly Pro Ser Gln Leu Ala Gln
        115                  120                  125
cgt gct gtt gat ctg atc agc aac gtc gcg ggc gat cgt gtg act tat   432
Arg Ala Val Asp Leu Ile Ser Asn Val Ala Gly Asp Arg Val Thr Tyr
    130                  135                  140
cgg atc acc aaa ggc gaa gat ctg cgt gag caa ggt tat atg ggg ctg   480
Arg Ile Thr Lys Gly Glu Asp Leu Arg Glu Gln Gly Tyr Met Gly Leu
145                  150                  155                  160
cac aca gtc gga cgc ggt tca gaa cgt tct ccg gta ttg ctg gcg ctg   528
His Thr Val Gly Arg Gly Ser Glu Arg Ser Pro Val Leu Leu Ala Leu
                 165                  170                  175
gat tac aac cca act ggc gat aaa gaa gcg cca gtg tac gcg tgc ctg   576
Asp Tyr Asn Pro Thr Gly Asp Lys Glu Ala Pro Val Tyr Ala Cys Leu
            180                  185                  190
gta ggt aaa ggt atc act ttt gac tcc ggc ggc tac agc atc aaa cag   624
Val Gly Lys Gly Ile Thr Phe Asp Ser Gly Gly Tyr Ser Ile Lys Gln
        195                  200                  205
act gcg ttt atg gac tcg atg aag tcg gac atg ggc ggc gcg gca acg   672
Thr Ala Phe Met Asp Ser Met Lys Ser Asp Met Gly Gly Ala Ala Thr
    210                  215                  220
gtt acc ggg gcg ctg gca ttt gcc att acg cgc gga ctg aac aag cgc   720
Val Thr Gly Ala Leu Ala Phe Ala Ile Thr Arg Gly Leu Asn Lys Arg
225                  230                  235                  240
gtg aag ctg ttc ctc tgc tgt gcg gat aac ctg att agc ggc aat gcg   768
Val Lys Leu Phe Leu Cys Cys Ala Asp Asn Leu Ile Ser Gly Asn Ala
                245                  250                  255
ttc aag ctg ggc gat atc atc acc tat cgc aac ggt aaa aaa gtt gaa   816
Phe Lys Leu Gly Asp Ile Ile Thr Tyr Arg Asn Gly Lys Lys Val Glu
            260                  265                  270
gtg atg aac act gat gcc gaa ggg cgt ctg gtg ctt gcc gat ggt ctg   864
Val Met Asn Thr Asp Ala Glu Gly Arg Leu Val Leu Ala Asp Gly Leu
        275                  280                  285
att gat gcc agt gcg cag aaa ccg gaa atg atc att gat gcg gcg acc   912
Ile Asp Ala Ser Ala Gln Lys Pro Glu Met Ile Ile Asp Ala Ala Thr
    290                  295                  300
ctc acc ggg gcg gcg aaa act gcg ctg ggt aat gat tat cac gcg ctg   960
Leu Thr Gly Ala Ala Lys Thr Ala Leu Gly Asn Asp Tyr His Ala Leu
305                  310                  315                  320
ttc agt ttt gac gat gcg ctg gcc ggt cgc ttg ctg gcg agt gcc gcg  1008
Phe Ser Phe Asp Asp Ala Leu Ala Gly Arg Leu Leu Ala Ser Ala Ala
                 325                  330                  335
cag gag aac gaa ccg ttc tgg cgt ctg ccg ctg gcg gag ttc cac cgc  1056
Gln Glu Asn Glu Pro Phe Trp Arg Leu Pro Leu Ala Glu Phe His Arg
            340                  345                  350
agc cag ctg ccg tct aac ttt gcc gaa ctg aac aat acc gga agc gcg  1104
Ser Gln Leu Pro Ser Asn Phe Ala Glu Leu Asn Ash Thr Gly Ser Ala
        355                  360                  365
gcg tat ccg gca ggc gcg agc acg gcg gcg ggc ttc ctg tcg cac ttt  1152
Ala Tyr Pro Ala Gly Ala Ser Thr Ala Ala Gly Phe Leu Ser His Phe
    370                  375                  380
gtt gag aac tat cag caa ggc tgg ctg cat atc gac tgc tcg gcg act  1200
Val Glu Asn Tyr Gln Gln Gly Trp Leu His Ile Asp Cys Ser Ala Thr
385                  390                  395                  400
tac cgt aaa gcg ccg gtt gaa cag tgg tct gcg ggc gct acg gga ctt  1248
Tyr Arg Lys Ala Pro Val Glu Gln Trp Ser Ala Gly Ala Thr Gly Leu
                 405                  410                  415
ggt gtg cgc acg ata gct aat ctg tta acg gcg                      1281
Gly Val Arg Thr Ile Ala Asn Leu Leu Thr Ala
            420                  425
<210>55
<211>1455
<212>DNA
<213>大肠杆菌
<400>55
gtg tct gaa ctg tct caa tta tct cca cag ccg ctg tgg gat att ttt    48
Val Ser Glu Leu Ser Gln Leu Ser Pro Gln Pro Leu Trp Asp Ile Phe
  1                5                   10                  15
gcc aaa atc tgt tct att cct cac ccg tcc tat cat gaa gag caa crc    96
Ala Lys Ile Cys Ser Ile Pro His Pro Set Tyr His Glu Glu Gln Leu
             20                   25                   30
gct gaa tac att gtt ggt tgg gca aaa gag aaa ggt ttc cat gtc gaa   144
Ala Glu Tyr Ile Val Gly Trp Ala Lys Glu Lys Gly Phe His Val Glu
         35                   40                   45
cgc gat cag gta ggt aat atc ctg att cgt aaa cct gct acc gca ggt   192
Arg Asp Gln Val Gly Asn Ile Leu Ile Arg Lys Pro Ala Thr Ala Gly
     50                   55                   60
atg gaa aat cgt aaa ccg gtc gtc tta cag gcc cac ctc gat atg gtg    240
Met Glu Asn Arg Lys Pro Val Val Leu Gln Ala His Leu Asp Met Val
65                   70                   75                  80
ccg cag aaa aat aac gac acc gtg cat gac ttc acg aaa gat cct atc   288
Pro Gln Lys Asn Asn Asp Thr Val His Asp Phe Thr Lys Asp Pro Ile
                  85                   90                  95
cag cct tat att gat ggc gaa tgg gtt aaa gcg cgc ggc acc acg ctg   336
Gln Pro Tyr Ile Asp Gly Glu Trp Val Lys Ala Arg Gly Thr Thr Leu
             100                 105                  110
ggt gcg gat aac ggc att ggt atg gcc tct gcg ctg gcg gtt ctg gct   384
Gly Ala Asp Asn Gly Ile Gly Met Ala Ser Ala Leu Ala Val Leu Ala
        115                  120                  125
gac gaa aac gtg gtt cac ggc ccg ctg gaa gtg ctg ctg acc atg acc   432
Asp Glu Asn Val Val His Gly Pro Leu Glu Val Leu Leu Thr Met Thr
    130                  135                  140
gaa gaa gcc ggt atg gac ggt gcg ttc ggc tta cag ggc aac tgg ttg   480
Glu Glu Ala Gly Met Asp Gly Ala Phe Gly Leu Gln Gly Asn Trp Leu
145                  150                  155                  160
cag gct gat att ctg att aac acc gac tcc gaa gaa gaa ggt gaa atc   528
Gln Ala Asp Ile Leu Ile Asn Thr Asp Ser Glu Glu Glu Gly Glu Ile
                165                  170                  175
tac atg ggt tgt gcg ggg ggt atc gac ttc acc tcc aac ctg cat tta   576
Tyr Met Gly Cys Ala Gly Gly Ile Asp Phe Thr Ser Asn Leu His Leu
            180                  185                  190
gat cgt gaa gcg gtt cca gct ggt ttt gaa acc ttc aag tta acc tta   624
Asp Arg Glu Ala Val Pro Ala Gly Phe Glu Thr Phe Lys Leu Thr Leu
        195                  200                  205
aaa ggt ctg aaa ggc ggt cac tcc ggc ggg gaa atc cac gtt ggg ctg   672
Lys Gly Leu Lys Gly Gly His Ser Gly Gly Glu Ile His Val Gly Leu
    210                  215                  220
ggt aat gcc aac aaa ctg ctg gtg cgc ttc ctg gcg ggt cat gcg gaa   720
Gly Asn Ala Asn Lys Leu Leu Val Arg Phe Leu Ala Gly His Ala Glu
225                  230                  235                  240
gaa ctg gat ctg cgc ctt atc gat ttc aac ggc ggc aca ctg cgt aac   768
Glu Leu Asp Leu Arg Leu Ile Asp Phe Asn Gly Gly Thr Leu Arg Asn
                245                  250                  255
gcc atc ccg cgt gaa gcc ttt gcg acc att gct gtc gca gct gat aaa   816
Ala Ile Pro Arg Glu Ala Phe Ala Thr Ile Ala Val Ala Ala Asp Lys
            260                  265                  270
gtc gac gtc ctg aaa tct ctg gtg aat acc tat cag gag atc ctg aaa   864
Val Asp Val Leu Lys Ser Leu Val Asn Thr Tyr Gln Glu Ile Leu Lys
        275                  280                  285
aac gag ctg gca gaa aaa gag aaa aat ctg gcc ttg ttg ctg gac tct   912
Asn Glu Leu Ala Glu Lys Glu Lys Asn Leu Ala Leu Leu Leu Asp Ser
    290                  295                  300
gta gcg aac gat aaa gct gcc ctg att gcg aaa tct cgc gat acc ttt   960
Val Ala Asn Asp Lys Ala Ala Leu Ile Ala Lys Ser Arg Asp Thr Phe
305                  310                  315                  320
att cgt ctg ctg aac gcc acc ccg aac ggt gtg att cgt aac tcc gat  1008
Ile Arg Leu Leu Asn Ala Thr Pro Asn Gly Val Ile Arg Asn Ser Asp
                325                  330                  335
gta gcc aaa ggt gtg gtt gaa acc tcc ctg aac gtc ggt gtg gtg acc  1056
Val Ala Lys Gly Val Val Glu Thr Ser Leu Asn Val Gly Val Val Thr
            340                  345                  350
atg act gac aat aac gta gaa att cac tgc ctg atc cgt tca ctg atc  1104
Met Thr Asp Asn Asn Val Glu Ile His Cys Leu Ile Arg Ser Leu Ile
        355                  360                  365
gac agc ggt aaa gac tac gtg gtg agc atg ctg gat tcg ctg ggt aaa  1152
Asp Ser Gly Lys Asp Tyr Val Val Ser Met Leu Asp Ser Leu Gly Lys
    370                  375                  380
ctg gct ggc gcg aaa acc gaa gcg aaa ggc gca tat cct ggc tgg cag  1200
Leu Ala Gly Ala Lys Thr Glu Ala Lys Gly Ala Tyr Pro Gly Trp Gln
385                  390                  395                  400
ccg gac gct aat tct ccg gtg atg cat ctg gta cgt gaa acc tat cag  1248
Pro Asp Ala Asn Ser Pro Val Met His Leu Val Arg Glu Thr Tyr Gln
                405                  410                  415
cgc ctg ttc aac aag acg ccg aac arc cag att arc cac gcg ggc ctg  1296
Arg Leu Phe Asn Lys Thr Pro Asn Ile Gln Ile Ile His Ala Gly Leu
            420                  425                  430
gaa tgt ggt ctg ttc aaa aaa ccg tat ccg gaa atg gac atg gtt tct  1344
Glu Cys Gly Leu Phe Lys Lys Pro Tyr Pro Glu Met Asp Met Val Ser
        435                  440                  445
arc ggg cca act atc acc ggt cca cac tct ccg gat gag caa gtt cac  1392
Ile Gly Pro Thr Ile Thr Gly Pro His Ser Pro Asp Glu Gln Val His
    450                  455                  460
atc gaa agc gta ggt cat tac tgg aca ctg ctg act gaa ctg ctg aaa  1440
Ile Glu Ser Val Gly His Tyr Trp Thr Leu Leu Thr Glu Leu Leu Lys
465                  470                  475                  480
gaa att ccg gcg aag                                              1455
Glu Ile Pro Ala Lys
                 485
<210>56
<211>2610
<212>DNA
<213>大肠杆菌
<400>56
atg act caa cag cca caa gcc aaa tac cgt cac gat tat cgt gcg ccg    48
Met Thr Gln Gln Pro Gln Ala Lys Tyr Arg His Asp Tyr Arg Ala Pro
  1                5                   10                   15
gat tac cag att act gat att gac ttg acc ttt gac ctc gac gcg caa    96
Asp Tyr Gln Ile Thr Asp Ile Asp Leu Thr Phe Asp Leu Asp Ala Gln
             20                   25                   30
aag acg gtc gtt acc gcg gtc agc cag gct gtc cgt cat ggt gca tca   144
Lys Thr Val Val Thr Ala Val Ser Gln Ala Val Arg His Gly Ala Ser
         35                   40                   45
gat gct ccc ctt cgt ctc aac ggc gaa gac ctc aaa ctg gtt tct gtt   192
Asp Ala Pro Leu Arg Leu Asn Gly Glu Asp Leu Lys Leu Val Ser Val
     50                   55                   60
cat att aat gat gag ccg tgg acc gcc tgg aaa gaa gaa gag ggc gca   240
His Ile Asn Asp Glu Pro Trp Thr Ala Trp Lys Glu Glu Glu Gly Ala
 65                   70                   75                  80
ctg gtt atc agt aat ttg ccg gag cgt ttt acg ctt aag atc att aat   288
Leu Val Ile Ser Asn Leu Pro Glu Arg Phe Thr Leu Lys Ile Ile Asn
                 85                    90                   95
gaa ata agc ccg gcg gcg aat acc gcg ctg gaa ggg ctt tat cag tca   336
Glu Ile Ser Pro Ala Ala Asn Thr Ala Leu Glu Gly Leu Tyr Gln Ser
            100                  105                  110
ggc gat gcg ctt tgc acc cag tgt gaa gcc gaa ggt ttc cgc cat att   384
Gly Asp Ala Leu Cys Thr Gln Cys Glu Ala Glu Gly Phe Arg His Ile
        115                  120                  125
acg tat tat ctc gac cgc ccg gac gtg ctg gcg cgt ttt acc acc aaa   432
Thr Tyr Tyr Leu Asp Arg Pro Asp Val Leu Ala Arg Phe Thr Thr Lys
    130                  135                  140
att att gcc gat aaa atc aaa tat ccc ttc ctg ctt tcc aat ggt aac   480
Ile Ile Ala Asp Lys Ile Lys Tyr Pro Phe Leu Leu Ser Asn Gly Asn
145                  150                  155                  160
cgc gtt gcg caa ggc gaa ctg gaa aac gga cgc cat tgg gta cag tgg   528
Arg Val Ala Gln Gly Glu Leu Glu Asn Gly Arg His Trp Val Gln Trp
                 165                  170                  175
cag gac ccg ttc ccg aaa ccg tgc tac ctg ttt gcg ctg gtg gca ggc   576
Gln Asp Pro Phe Pro Lys Pro Cys Tyr Leu Phe Ala Leu Val Ala Gly
            180                  185                  190
gac ttt gat gta ctg cgc gat acc ttt acc acg cgt tct ggt cgc gaa   624
Asp Phe Asp Val Leu Arg Asp Thr Phe Thr Thr Arg Ser Gly Arg Glu
        195                  200                  205
gta gca ctg gag ctg tac gtc gat cgc ggc aac ctt gat cgc gcg ccg   672
Val Ala Leu Glu Leu Tyr Val Asp Arg Gly Asn Leu Asp Arg Ala Pro
    210                  215                  220
tgg gcg atg acc tcg ctg aaa aac tcc atg aaa tgg gat gaa gaa cgc   720
Trp Ala Met Thr Ser Leu Lys Asn Ser Met Lys Trp Asp Glu Glu Arg
225                  230                  235                  240
ttt ggc ctg gag tat gac ctc gac atc tat atg atc gtc gcg gtg gat   768
Phe Gly Leu Glu Tyr Asp Leu Asp Ile Tyr Met Ile Val Ala Val Asp
                 245                  250                  255
ttc ttc aat atg ggc gca atg gag aat aag ggg ctg aat atc ttt aac   816
Phe Phe Asn Met Gly Ala Met Glu Asn Lys Gly Leu Asn Ile Phe Asn
            260                  265                  270
tcc aaa tat gtg ctg gcc cgc acc gac acc gcc acc gac aaa gat tac   864
Ser Lys Tyr Val Leu Ala Arg Thr Asp Thr Ala Thr Asp Lys Asp Tyr
        275                  280                  285
ctc gat att gaa cgc gtt atc ggc cat gaa tat ttc cat aac tgg acc   912
Leu Asp Ile Glu Arg Val Ile Gly His Glu Tyr Phe His Asn Trp Thr
    290                  295                  300
ggt aac cga gtg acc tgt cgc gac tgg ttc cag ctc agc ctg aaa gaa   960
Gly Asn Arg Val Thr Cys Arg Asp Trp Phe Gln Leu Ser Leu Lys Glu
305                  310                  315                  320
ggt tta acc gtc ttc cgc gat cag gag ttc agc tct gac ctt ggt tcc  1008
Gly Leu Thr Val Phe Arg Asp Gln Glu Phe Ser Ser Asp Leu Gly Ser
                 325                  330                  335
cgc gca gtt aac cgc atc aat aat gta cgc acc atg cgc gga ttg cag  1056
Arg Ala Val Asn Arg Ile Asn Asn Val Arg Thr Met Arg Gly Leu Gln
            340                  345                  350
ttt gca gaa gac gcc agc ccg atg gcg cac ccg atc cgc ccg gat atg  1104
Phe Ala Glu Asp Ala Ser Pro Met Ala His Pro Ile Arg Pro Asp Met
        355                  360                  365
gtc att gag atg aac aac ttc tac acc ctg acc gtt tac gag aag ggc  1152
Val Ile Glu Met Asn Asn Phe Tyr Thr Leu Thr Val Tyr Glu Lys Gly
    370                  375                  380
gcg gaa gtg att cgc atg atc cac acc ctg ctt ggc gaa gaa aac ttc  1200
Ala Glu Val Ile Arg Met Ile His Thr Leu Leu Gly Glu Glu Asn Phe
385                  390                  395                  400
cag aaa ggg atg cag ctt tat ttc gag cgt cat gat ggt agt gca gcg  1248
Gln Lys Gly Met Gln Leu Tyr Phe Glu Arg His Asp Gly Ser Ala Ala
                405                  410                  415
acc tgt gac gac ttt gtg cag gcg atg gaa gat gcg tcg aat gtc gat  1296
Thr Cys Asp Asp Phe Val Gln Ala Met Glu Asp Ala Ser Asn Val Asp
            420                  425                  430
ctc tcc cat ttc cgc cgt tgg tac agc cag tcc ggt aca ccg att gtg  1344
Leu Ser His Phe Arg Arg Trp Tyr Ser Gln Ser Gly Thr Pro Ile Val
        435                  440                  445
acc gtc aaa gac gac tac aat ccg gaa acc gag cag tac acc ctg acc  1392
Thr Val Lys Asp Asp Tyr Asn Pro Glu Thr Glu Gln Tyr Thr Leu Thr
    450                  455                  460
atc agc cag cgc acg cca gcc acg ccg gat cag gca gaa aaa cag ccg  1440
Ile Ser Gln Arg Thr Pro Ala Thr Pro Asp Gln Ala Glu Lys Gln Pro
465                  470                  475                  480
ctg cat att ccg ttt gcc atc gaa ctg tat gat aac gaa ggc aaa gtg  1488
Leu His Ile Pro Phe Ala Ile Glu Leu Tyr Asp Asn Glu Gly Lys Val
                485                  490                  495
atc ccg ttg cag aaa ggc ggt cat ccg gtg aat tcc gtg ctg aac gtc  1536
Ile Pro Leu Gln Lys Gly Gly His Pro Val Asn Ser Val Leu Asn Val
            500                  505                  510
act cag gcg gaa cag acc ttt gtc ttt gat aat gtc tac ttc cag ccg  1584
Thr Gln Ala Glu Gln Thr Phe Val Phe Asp Asn Val Tyr Phe Gln Pro
        515                  520                  525
gtg cct gcg ctg ctg tgc gaa ttc tct gcg cca gtg aaa ctg gaa tat  1632
Val Pro Ala Leu Leu Cys Glu Phe Ser Ala Pro Val Lys Leu Glu Tyr
    530                  535                  540
aag tgg agc gat cag caa ctg acc ttc ctg atg cgt cat gcg cgt aat  1680
Lys Trp Ser Asp Gln Gln Leu Thr Phe Leu Met Arg His Ala Arg Asn
545                  550                  555                  560
gat ttc tcc cgc tgg gat gcg gcg caa agt ttg ctg gca acc tac atc  1728
Asp Phe Ser Arg Trp Asp Ala Ala Gln Ser Leu Leu Ala Thr Tyr Ile
                565                  570                  575
aag ctg aac gtc gcg cgt cat cag caa ggt cag ccg ctg tct ctg ccg  1776
Lys Leu Asn Val Ala Arg His Gln Gln Gly Gln Pro Leu Ser Leu Pro
            580                  585                  590
gtg cat gtg gct gat gct ttc cgc gcg gta ctg ctt gat gag aag att  1824
Val His Val Ala Asp Ala Phe Arg Ala Val Leu Leu Asp Glu Lys Ile
        595                  600                  605
gat cca gcg ctg gcg gca gaa atc ctg acg ctg cct tct gtc aat gaa  1872
Asp Pro Ala Leu Ala Ala Glu Ile Leu Thr Leu Pro Ser Val Asn Glu
    610                  615                  620
atg gct gaa ttg ttc gat atc atc gac ccg att gct att gcc gaa gta  1920
Met Ala Glu Leu Phe Asp Ile Ile Asp Pro Ile Ala Ile Ala Glu Val
625                  630                  635                  640
cgc gaa gca ctc act cgt act ctg gcg act gaa ctg gcg gat gag cta  1968
Arg Glu Ala Leu Thr Arg Thr Leu Ala Thr Glu Leu Ala Asp Glu Leu
                645                  650                  655
ctg gct att tac aac gcg aat tac cag agc gag tac cgt gtt gag cat  2016
Leu Ala Ile Tyr Asn Ala Asn Tyr Gln Ser Glu Tyr Arg Val Glu His
            660                  665                  670
gaa gat att gca aaa cgc act ctg cgt aat gcc tgc ctg cgt ttc ctc  2064
Glu Asp Ile Ala Lys Arg Thr Leu Arg Asn Ala Cys Leu Arg Phe Leu
        675                  680                  685
gct ttt ggt gaa acg cat ctg gct gat gtg ctg gtg agc aag cag ttc  2112
Ala Phe Gly Glu Thr His Leu Ala Asp Val Leu Val Ser Lys Gln Phe
    690                  695                  700
cac gaa gca aac aat atg act gat gcg ctg gcg gcg ctt tct gcg gcg  2160
His Glu Ala Asn Asn Met Thr Asp Ala Leu Ala Ala Leu Ser Ala Ala
705                  710                  715                  720
gtt gcc gca cag ctg cct tgc cgt gac gcg ctg atg cag gag tac gac  2208
Val Ala Ala Gln Leu Pro Cys Arg Asp Ala Leu Met Gln Glu Tyr Asp
                725                  730                  735
gac aag tgg cat cag aac ggt ctg gtg atg gat aaa tgg ttt atc ctg  2256
Asp Lys Trp His Gln Asn Gly Leu Val Met Asp Lys Trp Phe Ile Leu
             740                  745                  750
caa gcc acc agc ccg gcg gcg aat gtg ctg gag acg gtg cgc ggc ctg  2304
Gln Ala Thr Ser Pro Ala Ala Asn Val Leu Glu Thr Val Arg Gly Leu
        755                  760                  765
ttg cag cat cgc tca ttt acc atg agc aac ccg aac cgt att cgt tcg  2352
Leu Gln His Arg Ser Phe Thr Met Ser Asn Pro Asn Arg Ile Arg Ser
    770                  775                  780
ttg att ggc gcg ttt gcg ggc agc aat ccg gca gcg ttc cat gcc gaa  2400
Leu Ile Gly Ala Phe Ala Gly Ser Asn Pro Ala Ala Phe His Ala Glu
785                  790                  795                  800
gat ggc agc ggt tac ctg ttc ctg gtg gaa atg crt acc gac ctc aac  2448
Asp Gly Ser Gly Tyr Leu Phe Leu Val Glu Met Leu Thr Asp Leu Asn
                805                  810                  815
agc cgt aac ccg cag gtg gct rca cgt ctg att gaa ccg ctg att cgc  2496
Ser Arg Asn Pro Gln Val Ala Ser Arg Leu Ile Glu Pro Leu Ile Arg
            820                  825                  830
ctg aaa cgt tac gat gcc aaa cgt cag gag aaa atg cgc gcg gcg ctg  2544
Leu Lys Arg Tyr Asp Ala Lys Arg Gln Glu Lys Met Arg Ala Ala Leu
        835                  840                  845
gaa cag ttg aaa ggg ctg gaa aat ctc tct ggc gat ctg tac gag aag  2592
Glu Gln Leu Lys Gly Leu Glu Asn Leu Ser Gly Asp Leu Tyr Glu Lys
    850                  855                  860
ata act aaa gca ctg gct                                          2610
Ile Thr Lys Ala Leu Ala
865                  870
<210>57
<211>1605
<212>DNA
<213>大肠杆菌
<400>57
atg cgt att tcc ttg aaa aag rca ggg atg ctg aag ctt ggt ctc agc    48
Met Arg Ile Ser Leu Lys Lys Ser Gly Met Leu Lys Leu Gly Leu Ser
  1                5                   10                  15
ctg gtg gct atg acc gtc gca gca agt gtt cag gct aaa act ctg gtt    96
Leu Val Ala Met Thr Val Ala Ala Ser Val Gln Ala Lys Thr Leu Val
             20                   25                   30
tat tgc tca gaa gga tct ccg gaa ggg ttt aac ccg cag ctg ttt acc   144
Tyr Cys Ser Glu Gly Ser Pro Glu Gly Phe Asn Pro Gln Leu Phe Thr
         35                   40                   45
tcc ggc acc acc tat gac gcc tct tcc gtc ccg ctt tat aac cgt ctg   192
Ser Gly Thr Thr Tyr Asp Ala Ser Ser Val Pro Leu Tyr Asn Arg Leu
     50                   55                   60
gtt gaa ttt aaa atc ggc acc acc gaa gtg atc ccg ggc ctc gct gaa   240
Val Glu Phe Lys Ile Gly Thr Thr Glu Val Ile Pro Gly Leu Ala Glu
 65                   70                  75                   80
aag tgg gaa gtc agc gaa gac ggt aaa acc tat acc ttc cat ctg cgt   288
Lys Trp Glu Val Ser Glu Asp Gly Lys Thr Tyr Thr Phe His Leu Arg
                  85                   90                  95
aaa ggt gtg aag tgg cac gac aat aaa gaa ttc aaa ccg acg cgt gaa   336
Lys Gly Val Lys Trp His Asp Asn Lys Glu Phe Lys Pro Thr Arg Glu
            100                  105                  110
ctg aac gcc gat gat gtg gtg ttc tcg ttc gat cgt cag aaa aac gcg   384
Leu Asn Ala Asp Asp Val Val Phe Ser Phe Asp Arg Gln Lys Asn Ala
        115                  120                  125
caa aac ccg tac cat aaa gtt tct ggc ggc agc tac gaa tac ttc gaa   432
Gln Asn Pro Tyr His Lys Val Ser Gly Gly Ser Tyr Glu Tyr Phe Glu
    130                  135                  140
ggc atg ggc ttg cca gag ctg atc agt gaa gtg aaa aag gtg gac gac   480
Gly Met Gly Leu Pro Glu Leu Ile Ser Glu Val Lys Lys Val Asp Asp
145                  150                  155                  160
aac acc gtt cag ttt gtg ctg act cgc ccg gaa gcg ccg ttc ctc gct   528
Asn Thr Val Gln Phe Val Leu Thr Arg Pro Glu Ala Pro Phe Leu Ala
                 165                  170                  175
gac ctg gca atg gac ttc gcc tct att ctg tca aaa gaa tat gct gat   576
Asp Leu Ala Met Asp Phe Ala Ser Ile Leu Ser Lys Glu Tyr Ala Asp
             180                  185                  190
gcg atg atg aaa gcc ggt aca ccg gaa aaa ctg gac ctc aac cca atc   624
Ala Met Met Lys Ala Gly Thr Pro Glu Lys Leu Asp Leu Asn Pro Ile
        195                  200                  205
gga acc ggt ccg ttc cag tta cag cag tat caa aaa gat tcc cgt atc   672
Gly Thr Gly Pro Phe Gln Leu Gln Gln Tyr Gln Lys Asp Ser Arg Ile
    210                  215                  220
cgc tac aaa gcg ttt gat ggc tac tgg ggc acc aaa ccg cag atc gat   720
Arg Tyr Lys Ala Phe Asp Gly Tyr Trp Gly Thr Lys Pro Gln Ile Asp
225                  230                  235                  240
acg ctg gtt ttc tct att acc cct gac gct tcc gtg cgt tac gcg aaa   768
Thr Leu Val Phe Ser Ile Thr Pro Asp Ala Ser Val Arg Tyr Ala Lys
                 245                  250                  255
ttg cag aag aat gaa tgc cag gtg atg ccg tac ccg aac ccg gca gat   816
Leu Gln Lys Asn Glu Cys Gln Val Met Pro Tyr Pro Asn Pro Ala Asp
            260                  265                  270
atc gct cgc atg aag cag gat aaa tcc atc aat ctg atg gaa atg ccg   864
Ile Ala Arg Met Lys Gln Asp Lys Ser Ile Asn Leu Met Glu Met Pro
        275                  280                  285
ggg ctg aac gtc ggt tat ctc tcg tat aac gtg cag aaa aaa cca ctc   912
Gly Leu Asn Val Gly Tyr Leu Ser Tyr Asn Val Gln Lys Lys Pro Leu
    290                  295                  300
gat gac gtg aaa gtt cgc cag gct ctg acc tac gcg gtg aac aaa gac   960
Asp Asp Val Lys Val Arg Gln Ala Leu Thr Tyr Ala Val Asn Lys Asp
305                  310                  315                  320
gcg atc atc aaa gcg gtt tat cag ggc gcg ggc gta tca gcg aaa aac  1008
Ala Ile Ile Lys Ala Val Tyr Gln Gly Ala Gly Val Ser Ala Lys Asn
                325                  330                  335
ctg atc ccg cca acc atg tgg ggc tat aac gac gac gtt cag gac tac  1056
Leu Ile Pro Pro Thr Met Trp Gly Tyr Asn Asp Asp Val Gln Asp Tyr
            340                  345                  350
acc tac gat cct gaa aaa gcg aaa gcc ttg ctg aaa gaa gcg ggt ctg  1104
Thr Tyr Asp Pro Glu Lys Ala Lys Ala Leu Leu Lys Glu Ala Gly Leu
         355                  360                  365
gaa aaa ggt ttc tcc atc gac ctg tgg gcg atg ccg gta caa cgt ccg  1152
Glu Lys Gly Phe Ser Ile Asp Leu Trp Ala Met Pro Val Gln Arg Pro
    370                  375                  380
tat aac ccg aac gct cgc cgc atg gcg gag atg att cag gca gac tgg  1200
Tyr Asn Pro Asn Ala Arg Arg Met Ala Glu Met Ile Gln Ala Asp Trp
385                  390                  395                  400
gcg aaa gtc ggc gtg cag gcc aaa att gtc acc tac gaa tgg ggt gag  1248
Ala Lys Val Gly Val Gln Ala Lys Ile Val Thr Tyr Glu Trp Gly Glu
                405                  410                  415
tac ctc aag cgt gcg aaa gat ggc gag cac cag acg gta atg atg ggc  1296
Tyr Leu Lys Arg Ala Lys Asp Gly Glu His Gln Thr Val Met Met Gly
            420                  425                  430
tgg act ggc gat aac ggg gat ccg gat aac ttc ttc gcc acc ctg ttc  1344
Trp Thr Gly Asp Asn Gly Asp Pro Asp Asn Phe Phe Ala Thr Leu Phe
        435                  440                  445
agc tgc gcc gcc tct gaa caa ggc tcc aac tac tca aaa tgg tgc tac  1392
Ser Cys Ala Ala Ser Glu Gln Gly Ser Asn Tyr Ser Lys Trp Cys Tyr
    450                  455                  460
aaa ccg ttt gaa gat ctg att caa ccg gcg cgt gct acc gac gac cac  1440
Lys Pro Phe Glu Asp Leu Ile Gln Pro Ala Arg Ala Thr Asp Asp His
465                  470                  475                  480
aat aaa cgc gtt gaa ctg tac aaa caa gcg cag gtg gtg atg cac gat  1488
Asn Lys Arg Val Glu Leu Tyr Lys Gln Ala Gln Val Val Met His Asp
                 485                  490                  495
cag gct ccg gca ctg atc atc gct cac tcc acc gtg ttt gaa ccg gta  1536
Gln Ala Pro Ala Leu Ile Ile Ala His Ser Thr Val Phe Glu Pro Val
            500                  505                  510
cgt aaa gaa gtt aaa ggc tat gtg gtt gat cca tta ggc aaa cat cac  1584
Arg Lys Glu Val Lys Gly Tyr Val Val Asp Pro Leu Gly Lys His His
        515                  520                  525
ttc gaa aac gtc tct atc gaa                                      1605
Phe Glu Asn Val Ser Ile Glu
    530                  535
<210>58
<211>1017
<212>DNA
<213>大肠杆菌
<400>58
atg ttg cag ttt att crc cga cgt ttg gga crc gtc atc ccc acg ttt    48
Met Leu Gln Phe Ile Leu Arg Arg Leu Gly Leu Val Ile Pro Thr Phe
  1                5                   10                  15
atc ggt att acc ctt ctc aca ttt gcc ttt gtc cac atg atc ccg ggc    96
Ile Gly Ile Thr Leu Leu Thr Phe Ala Phe Val His Met Ile Pro Gly
             20                   25                   30
gat ccg gtg atg atc atg gcg ggc gaa cgt ggg arc tcc cca gag cgt   144
Asp Pro Val Met Ile Met Ala Gly Glu Arg Gly Ile Ser Pro Glu Arg
         35                   40                   45
cac gcg cag ctg ctg gct gaa ctc ggc tta gat aaa ccg atg tgg cag   192
His Ala Gln Leu Leu Ala Glu Leu Gly Leu Asp Lys Pro Met Trp Gln
     50                   55                   60
cag tat ctc cat tac att tgg ggc gtt atg cat ggc gat cta ggc att   240
Gln Tyr Leu His Tyr Ile Trp Gly Val Met His Gly Asp Leu Gly Ile
 65                   70                   75                  80
rca atg aaa agc cgc arc ccg gtt tgg gaa gag ttc gtg ccg cgc ttc   288
Ser Met Lys Ser Arg Ile Pro Val Trp Glu Glu Phe Val Pro Arg Phe
                  85                   90                  95
cag gcc acg ctg gaa crt ggc gtc tgc gcg atg att ttt gct acg gca   336
Gln Ala Thr Leu Glu Leu Gly Val Cys Ala Met Ile Phe Ala Thr Ala
            100                  105                  110
gtc ggt att ccg gtc ggc gtg ctg gct gcg gtt aaa cgc ggt tcc att   384
Val Gly Ile Pro Val Gly Val Leu Ala Ala Val Lys Arg Gly Ser Ile
        115                  120                  125
ttc gat cac aca gcg gtt ggc ctg gcg ctg aca ggt tat tca atg cct   432
Phe Asp His Thr Ala Val Gly Leu Ala Leu Thr Gly Tyr Ser Met Pro
    130                  135                  140
atc ttc tgg tgg ggc atg atg ctg atc atg ctg gtt tcg gtg cac tgg   480
Ile Phe Trp Trp Gly Met Met Leu Ile Met Leu Val Ser Val His Trp
145                  150                  155                  160
aac ctg acg ccc gtc tcc ggt cgc gtg agc gat atg gtg ttc ctc gat   528
Asn Leu Thr Pro Val Ser Gly Arg Val Ser Asp Met Val Phe Leu Asp
                 165                  170                  175
gac tcc aat ccg tta acc ggt ttt atg cta atc gac acc gcc atc tgg   576
Asp Ser Asn Pro Leu Thr Gly Phe Met Leu Ile Asp Thr Ala Ile Trp
            180                  185                  190
ggt gaa gac ggc aac ttt atc gat gcc gtc gcc cat atg atc ttg cct   624
Gly Glu Asp Gly Asn Phe Ile Asp Ala Val Ala His Met Ile Leu Pro
        195                  200                  205
gcc att gtg ctg ggt act att ccg ctg gcg gtc att gtg cgt atg aca   672
Ala Ile Val Leu Gly Thr Ile Pro Leu Ala Val Ile Val Arg Met Thr
    210                  215                  220
cgc tcc tcg atg ctg gaa gtg ctg ggc gag gat tac atc cgc acc gcg   720
Arg Ser Ser Met Leu Glu Val Leu Gly Glu Asp Tyr Ile Arg Thr Ala
225                  230                  235                  240
cgc gcc aaa ggg cta acc cgc atg cgg gtg att atc gtc cat gcg ctg   768
Arg Ala Lys Gly Leu Thr Arg Met Arg Val Ile Ile Val His Ala Leu
                245                  250                  255
cgt aac gcg atg ctg ccg gtg gtg acc gtt atc ggc ctg cag gtg gga   816
Arg Asn Ala Met Leu Pro Val Val Thr Val Ile Gly Leu Gln Val Gly
            260                  265                  270
aca ttg ctg gcg ggg gcg att ctg acc gaa acc atc ttc tcg tgg ccc   864
Thr Leu Leu Ala Gly Ala Ile Leu Thr Glu Thr Ile Phe Ser Trp Pro
        275                  280                  285
ggt ctg gga cgc tgg ttg att gac gca ctg caa cgc cgc gac tat ccg   912
Gly Leu Gly Arg Trp Leu Ile Asp Ala Leu Gln Arg Arg Asp Tyr Pro
    290                  295                  300
gta gtg cag ggc ggc gta ttg ctg gtg gcg acg atg att atc ctc gtc   960
Val Val Gln Gly Gly Val Leu Leu Val Ala Thr Met Ile Ile Leu Val
305                  310                  315                  320
aac ttg ctg gtc gat ctg ctg tac ggc gtg gtg aac ccg cgt att cgt  1008
Asn Leu Leu Val Asp Leu Leu Tyr Gly Val Val Asn Pro Arg Ile Arg
                325                  330                  335
cat aag aag                                                      1017
His Lys Lys
<210>59
<211>900
<212>DNA
<213>大肠杆菌
<400>59
atg tca cag gtt act gaa aat aaa gtg att agc gca ccg gtg ccg atg    48
Met Ser Gln Val Thr Glu Asn Lys Val Ile Ser Ala Pro Val Pro Met
  1                5                   10                  15
acc ccg tta cag gag ttc tgg cac tat ttt aaa cgc aac aaa ggc gcg    96
Thr Pro Leu Gln Glu Phe Trp His Tyr Phe Lys Arg Asn Lys Gly Ala
             20                    25                  30
gtc gtc ggg ctg gtt tac gtc gtc atc gtg ctg ttc atc gcg atc ttt   144
Val Val Gly Leu Val Tyr Val Val Ile Val Leu Phe Ile Ala Ile Phe
         35                   40                   45
gcc aac tgg att gca ccc tat aac ccg gcg gaa cag ttc cgc gat gca   192
Ala Asn Trp Ile Ala Pro Tyr Asn Pro Ala Glu Gln Phe Arg Asp Ala
     50                   55                   60
ctg ctc gcc ccg cca gcc tgg cag gaa ggc ggc agc atg gcg cac ttg   240
Leu Leu Ala Pro Pro Ala Trp Gln Glu Gly Gly Ser Met Ala His Leu
 65                   70                   75                  80
ctg ggc acc gat gac gta ggc cgt gat gtg ctg tcg cgc ctg atg tac   288
Leu Gly Thr Asp Asp Val Gly Arg Asp Val Leu Ser Arg Leu Met Tyr
                  85                  90                   95
ggt gcg cgc ctg tcg ctg ctg gtt ggc tgt ctg gta gtt gtg tta tcg   336
Gly Ala Arg Leu Ser Leu Leu Val Gly Cys Leu Val Val Val Leu Ser
            100                  105                  110
ctg att atg ggc gtt att ctc ggc ctg atc gcc ggt tac ttt ggc ggc   384
Leu Ile Met Gly Val Ile Leu Gly Leu Ile Ala Gly Tyr Phe Gly Gly
        115                  120                  125
ctg gtc gat aac atc att atg cgc gtg gtc gat atc atg ctg gcg ctg   432
Leu Val Asp Asn Ile Ile Met Arg Val Val Asp Ile Met Leu Ala Leu
    130                  135                  140
cca agt ctg ctg ctg gcg ctg gtg ctg gtg gca att ttc ggc ccg tcg   480
Pro Ser Leu Leu Leu Ala Leu Val Leu Val Ala Ile Phe Gly Pro Ser
145                  150                  155                  160
att ggt aac gcc gcg ctg gca ctg acc ttc gtt gcc ttg ccg cac tat   528
Ile Gly Asn Ala Ala Leu Ala Leu Thr Phe Val Ala Leu Pro His Tyr
                 165                  170                  175
gtg cgc tta acc cgc gcc gcc gtg ctg gtg gaa gtt aac egc gat tac   576
Val Arg Leu Thr Arg Ala Ala Val Leu Val Glu Val Asn Arg Asp Tyr
            180                  185                  190
gtc acc gcg tct cgc gtg gcg ggt gcc ggg gcg atg cgt cag atg ttt   624
Val Thr Ala Ser Arg Val Ala Gly Ala Gly Ala Met Arg Gln Met Phe
        195                  200                  205
att aac atc ttc ccg aac tgc ctt gcg ccg ctg att gtt cag gcg tcg   672
Ile Asn Ile Phe Pro Asn Cys Leu Ala Pro Leu Ile Val Gln Ala Ser
    210                  215                  220
ctc ggt ttc tct aac gcc att ctc gat atg gct gct ctt ggt ttc ctc   720
Leu Gly Phe Ser Asn Ala Ile Leu Asp Met Ala Ala Leu Gly Phe Leu
225                  230                  235                  240
ggc atg ggg gca cag ccg cca acg cct gag tgg ggc acc atg ctc tcc   768
Gly Met Gly Ala Gln Pro Pro Thr Pro Glu Trp Gly Thr Met Leu Ser
                245                  250                  255
gac gtg ttg cag ttc gcg caa agc gcc tgg tgg gtc gtg acc ttc ccg   816
Asp Val Leu Gln Phe Ala Gln Ser Ala Trp Trp Val Val Thr Phe Pro
            260                  265                  270
ggt ctg gcg atc ctg ctg acg gtg ctg gca ttt aac ctg atg ggt gac   864
Gly Leu Ala Ile Leu Leu Thr Val Leu Ala Phe Asn Leu Met Gly Asp
        275                  280                  285
ggt ctg cgt gac gcg ctc gat ccc aaa ctg aag cag                   900
Gly Leu Arg Asp Ala Leu Asp Pro Lys Leu Lys Gln
    290                  295                  300
<210>60
<211>981
<212>DNA
<213>大肠杆菌
 <400>60
atg gcg tta tta aat gta gat aaa tta tcg gtg cat ttc ggc gac gaa   48
Met Ala Leu Leu Asn Val Asp Lys Leu Set Val His Phe Gly Asp Glu
  1                5                   10                  15
agc gcg ccg ttc cgc gcc gta gac cgc atc agc tac agc gta aaa cag   96
Ser Ala Pro Phe Arg Ala Val Asp Arg Ile Ser Tyr Ser Val Lys Gln
             20                   25                  30
ggc gaa gtg gtc ggg att gtg ggt gag tcc ggc tcc ggt aag tcg gtc  144
Gly Glu Val Val Gly Ile Val Gly Glu Ser Gly Ser Gly Lys Ser Val
         35                   40                   45
agt rca ctg gcg att atg ggg ctg att gat tat ccg ggc cgc gta atg  192
Ser Ser Leu Ala Ile Met Gly Leu Ile Asp Tyr Pro Gly Arg Val Met
     50                   55                   60
gca gaa aaa ctg gag ttt aac ggc cag gat ttg cag cgt atc tca gaa  240
Ala Glu Lys Leu Glu Phe Asn Gly Gln Asp Leu Gln Arg Ile Ser Glu
 65                   70                   75                  80
aaa gag cgc cgc aac ctg gtg ggt gcc gaa gtg gcg atg atc ttc cag  288
Lys Glu Arg Arg Asn Leu Val Gly Ala Glu Val Ala Met Ile Phe Gln
                  85                   90                  95
gac ccg atg acc agc ctt aac ccg tgc tac acc gtg ggt ttc cag att  336
Asp Pro Met Thr Ser Leu Asn Pro Cys Tyr Thr Val Gly Phe Gln Ile
             100                  105                  110
atg gaa gcg att aag gtg cat cag ggc ggc aac aaa agt acc cgc cgt  384
Met Glu Ala Ile Lys Val His Gln Gly Gly Asn Lys Ser Thr Arg Arg
        115                  120                  125
cag cga gcg att gac ctg ctg aat cag gtc ggt att ccc gat ccg gca   432
Gln Arg Ala Ile Asp Leu Leu Asn Gln Val Gly Ile Pro Asp Pro Ala
    130                  135                  140
tcg cgt ctg gat gtt tac ccg cat cag ctt tcc ggc ggc atg agc cag   480
Ser Arg Leu Asp Val Tyr Pro His Gln Leu Ser Gly Gly Met Ser Gln
145                  150                  155                  160
cgc gtg atg atc gcc atg gcg att gcc tgt cgg cca aaa ctg ctg att   528
Arg Val Met Ile Ala Met Ala Ile Ala Cys Arg Pro Lys Leu Leu Ile
                165                  170                  175
gcc gat gaa ccg acc acc gcg ctg gac gtg acc att cag gcg caa atc   576
Ala Asp Glu Pro Thr Thr Ala Leu Asp Val Thr Ile Gln Ala Gln Ile
            180                  185                  190
atc gaa cta ctg ctg gag cta cag cag aaa gag aac atg gcg ctg gtg   624
Ile Glu Leu Leu Leu Glu Leu Gln Gln Lys Glu Asn Met Ala Leu Val
        195                  200                  205
tta att acc cat gac ctg gcg ctg gtg gcg gaa gcg gca cat aaa atc   672
Leu Ile Thr His Asp Leu Ala Leu Val Ala Glu Ala Ala His Lys Ile
    210                  215                  220
atc gtg atg tat gca ggc cag gtg gtg gaa acc ggt gat gcg cac gcc   720
Ile Val Met Tyr Ala Gly Gln Val Val Glu Thr Gly Asp Ala His Ala
225                  230                  235                  240
atc ttc cat gcg ccg cgt cac ccg tat act cag gca ttg ctg cgt gcg   768
Ile Phe His Ala Pro Arg His Pro Tyr Thr Gln Ala Leu Leu Arg Ala
                245                  250                  255
ctg cca gaa ttt gct cag gac aaa gaa cgt ctg gcg tcg ttg cca ggt   816
Leu Pro Glu Phe Ala Gln Asp Lys Glu Arg Leu Ala Ser Leu Pro Gly
            260                  265                  270
gtc gtt ccc ggc aag tac gac cgc ccg aac ggc tgc ctg ctt aac ccg   864
Val Val Pro Gly Lys Tyr Asp Arg Pro Asn Gly Cys Leu Leu Asn Pro
        275                  280                  285
cgc tgc ccc tat gcc act gac aga tgt cgc gct gaa gaa ccg gcg ctg   912
Arg Cys Pro Tyr Ala Thr Asp Arg Cys Arg Ala Glu Glu Pro Ala Leu
    290                  295                  300
aat atg crc gct gac ggg cgt cag tcc aaa tgc cat tac cca ctt gat  960
Asn Met Leu Ala Asp Gly Arg Gln Ser Lys Cys His Tyr Pro Leu Asp
305                  310                  315                  320
gat gcc ggg agg ccg aca cta                                      981
Asp Ala Gly Arg Pro Thr Leu
                 325
<210>61
<211>1002
<212>DNA
<213>大肠杆菌
<400>61
atg agt acg caa gag gcc acc ctg caa caa ccg ctg ttg cag gct atc   48
Met Ser Thr Gln Glu Ala Thr Leu Gln Gln Pro Leu Leu Gln Ala Ile
  1                5                   10                   15
gac ctg aaa aaa cat tat ccg gtg aag aaa ggc atg ttc gcg ccg gaa   96
Asp Leu Lys Lys His Tyr Pro Val Lys Lys Gly Met Phe Ala Pro Glu
             20                   25                   30
cgt ctg gtt aaa gcg ctg gat ggc gtt tcg ttt aac ctt gaa cgt ggc  144
Arg Leu Val Lys Ala Leu Asp Gly Val Ser Phe Asn Leu Glu Arg Gly
         35                   40                   45
aaa acg ctg gca gta gtg ggc gaa tct ggc tgc ggt aaa tcg acc crc  192
Lys Thr Leu Ala Val Val Gly Glu Ser Gly Cys Gly Lys Ser Thr Leu
     50                   55                   60
ggt cgg ttg ctg acg atg att gaa atg ccc acc ggt ggc gag ctg tat  240
Gly Arg Leu Leu Thr Met Ile Glu Met Pro Thr Gly Gly Glu Leu Tyr
 65                   70                   75                  80
tac cag ggg cag gat ctg ctt aag cac gat ccg cag gcg cag aag ctg  288
Tyr Gln Gly Gln Asp Leu Leu Lys His Asp Pro Gln Ala Gln Lys Leu
                  85                   90                  95
cgt cgg cag aaa arc cag atc gtc ttc cag aac cct tac ggt tcg ctg  336
Arg Arg Gln Lys Ile Gln Ile Val Phe Gln Ash Pro Tyr Gly Ser Leu
             100                  105                  110
aat ccg cgt aaa aaa gtc ggg caa att ctt gaa gag ccg ctg ctg atc  384
Asn Pro Arg Lys Lys Val Gly Gln Ile Leu Glu Glu Pro Leu Leu Ile
        115                  120                  125
aac acc agc tta agc aaa gaa cag cgt cgg gaa aaa gcc ctg tcg atg  432
Asn Thr Ser Leu Ser Lys Glu Gln Arg Arg Glu Lys Ala Leu Ser Met
    130                  135                  140
atg gcg aaa gtc ggc ctg aaa acc gag cac tat gac cgc tat ccg cat  480
Met Ala Lys Val Gly Leu Lys Thr Glu His Tyr Asp Arg Tyr Pro His
145                  150                  155                  160
atg ttc tcc ggc ggt cag cgt cag cgt atc gcc atc gcc cgt ggt ctg  528
Met Phe Ser Gly Gly Gln Arg Gln Arg Ile Ala Ile Ala Arg Gly Leu
                 165                  170                  175
atg ctc gac ccg gat gtg gtg att gcc gat gaa ccg gtt tcc gcg ctg  576
Met Leu Asp Pro Asp Val Val Ile Ala Asp Glu Pro Val Ser Ala Leu
            180                  185                  190
gat gtt tca gtg cgc gcg cag gtg ctg aat ctg atg atg gat ttg cag  624
Asp Val Ser Val Arg Ala Gln Val Leu Asn Leu Met Met Asp Leu Gln
        195                  200                  205
cag gag ttg ggg ctg tct tat gtc ttt atc tcc cac gac ctg tcg gtg  672
Gln Glu Leu Gly Leu Ser Tyr Val Phe Ile Ser His Asp Leu Ser Val
    210                  215                  220
gtg gag cac att gct gat gaa gtg atg gtg atg tac ctg ggc cgc tgc  720
Val Glu His Ile Ala Asp Glu Val Met Val Met Tyr Leu Gly Arg Cys
225                  230                  235                  240
gtg gag aag gga acg aaa gac caa atc ttc aat aac ccg cgc cat ccg  768
Val Glu Lys Gly Thr Lys Asp Gln Ile Phe Asn Asn Pro Arg His Pro
                 245                  250                  255
tac act cag gcg cta ctt tcc gcg acg ccg cgc ctg aac ccg gac gat  816
Tyr Thr Gln Ala Leu Leu Ser Ala Thr Pro Arg Leu Asn Pro Asp Asp
            260                  265                  270
cgc cgc gag cgc atc aag ctc agc ggt gaa cta cca agc cca ctg aat  864
Arg Arg Glu Arg Ile Lys Leu Ser Gly Glu Leu Pro Ser Pro Leu Asn
         275                  280                  285
cca ccg ccg ggt tgc gcc ttc aac gcc cgc tgt cgt cgg cgc ttc ggc  912
Pro Pro Pro Gly Cys Ala Phe Asn Ala Arg Cys Arg Arg Arg Phe Gly
    290                  295                  300
ccc tgc acc cag ttg cag ccg cag cta aaa gac tac ggc ggt caa ctg  960
Pro Cys Thr Gln Leu Gln Pro Gln Leu Lys Asp Tyr Gly Gly Gln Leu
305                  310                  315                  320
gta gct tgt ttt gct gtt gat cag gat gaa aat ccg cag cgt         1002
Val Ala Cys Phe Ala Val Asp Gln Asp Glu Asn Pro Gln Arg
                325                  330
<210>62
<211>56
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>62
ctaaccctgt gacctgcaat actgttttgc gggtgagtgt aggctggagc tgcttc    56
<210>63
<211>56
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>63
gaaactgccg gaaggcgatt aaacgccatc cggcagcata tgaatatcct ccttag    56
<210>64
<211>56
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>64
ttacgcaaca ggaatagact gaacaccaga ctctatgtgt aggctggagc tgcttc    56
<210>65
<211>56
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>65
agaaaacagg ggtaaattcc ccgaatggcg gcgctacata tgaatatcct ccttag    56
<210>66
<211>56
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>66
atggagttta gtgtaaaaag cggtagcccg gagaaagtgt aggctggagc tgcttc    56
<210>67
<211>56
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>67
ttactcttcg ccgttaaacc cagcgcggtt taacagcata tgaatatcct ccttag    56
<210>68
<211>56
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>68
atgacagaag cgatgaagat taccctctct acccaagtgt aggctggagc tgcttc    56
<210>69
<211>56
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>69
ttacgccgtt aacagattag ctatcgtgcg cacacccata tgaatatcct ccttag    56
<210>70
<211>56
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>70
gcatccccac ctcataacgt tgacccgacc gggcaagtgt aggctggagc tgcttc    56
<210>71
<211>56
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>71
ctgtacggca ttttgctatg cttgtcgcca ctgttgcata tgaatatcct ccttag    56
<210>72
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>72
gtgtctgaac tgtctcaatt a                                           21
<210>73
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>73
cggaatttct ttcagcagtt c                                           21
<210>74
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>74
atgactcaac agccacaagc c                                          21
<210>75
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>75
tgctttagtt atcttctcgt a                                            21
<210>76
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>76
agtgcctgca tcgtcgtggg c                                            21
<210>77
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>77
ggcgcctttt gctttaccag a                                            21
<210>78
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>78
gacgcgcgct ggggagaaaa a                                            21
<210>79
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>79
cgtagcgccc gcagaccact g                                            21
<210>80
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>80
atgcgtattt ccttgaaaaa g                                            21
<210>81
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>81
ttattcgata gagacgtttt c                                            21
<210>82
<211>29
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>82
tacactcgag attaaagagg agaaattaa                                    29
<210>83
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>83
ttaggatcct catactggca gcacatactt                                   30
<210>84
<211>24
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>84
caagaattct catgtttgac agct                                         24
<210>85
<211>28
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成DNA
<400>85
taactcgaga ttcccttttt acgtgaac                                     28

Claims (26)

1.二肽或者二肽衍生物(PI)的制备方法,其特征在于,使以下的[1]~[7]任一项所述的蛋白质、1种以上的氨基酸或者氨基酸衍生物、以及ATP存在于水性介质中、在该介质中生成、蓄积二肽或者二肽衍生物[以下、称为二肽或者二肽衍生物(PI)],从该介质中收集该二肽或者二肽衍生物(PI)[其中,二肽或者二肽衍生物(PI)不是选自下述氨基酸组A的相同或者不相同的氨基酸以肽键结合而成的化合物(氨基酸组A:L-丙氨酸、L-谷氨酰胺、L-谷氨酸、L-缬氨酸、L-亮氨酸、L-异亮氨酸、L-脯氨酸、L-苯丙氨酸、L-色氨酸、L-蛋氨酸、L-丝氨酸、L-苏氨酸、L-半胱氨酸、L-天冬酰胺、L-酪氨酸、L-赖氨酸、L-精氨酸、L-组氨酸、L-天冬氨酸、L-α-氨基丁酸、L-偶氮丝氨酸、L-茶氨酸、L-4-羟基脯氨酸、L-3-羟基脯氨酸、L-鸟氨酸、L-瓜氨酸、L-6-重氮-5-氧代正亮氨酸、甘氨酸以及β-丙氨酸)]:
[1]具有序列号1~8任一项所示的氨基酸序列的蛋白质;
[2]由在序列号1~8任一项所示的氨基酸序列上缺失、置换或者添加1个以上的氨基酸的氨基酸序列构成、并且具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质;
[3]由与序列号1~8任一项所示的氨基酸序列具有65%以上的同源性的氨基酸序列构成、并且具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质;
[4]具有与序列号17所示的氨基酸序列80%以上的同源性的氨基酸序列、并且具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质;
[5]具有序列号37或者38所示的氨基酸序列的蛋白质;
[6]由在序列号37或者38所示的氨基酸序列上缺失、置换或者添加1个以上的氨基酸的氨基酸序列构成、并且具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质;
[7]由与序列号37或者38所示的氨基酸序列具有65%以上的同源性的氨基酸序列构成、并且具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质。
2.二肽或者二肽衍生物(PII)的制备方法,其特征在于,使以下的[1]~[7]任一项所述的蛋白质、1种以上的氨基酸或者氨基酸衍生物、以及ATP存在于水性介质中、在该介质中生成、蓄积二肽或者二肽衍生物(PI),直接或者从该介质收集该二肽或者二肽衍生物(PI)后,修饰该二肽或者二肽衍生物(PI)以生成二肽或者二肽衍生物[以下,称为二肽或者二肽衍生物(PII)],收集该二肽或者二肽衍生物(PII)[不过,二肽或者二肽衍生物(PII)不是选自上述氨基酸组A的相同或者不相同的氨基酸以肽键结合而成的化合物]:
[1]具有序列号1~8任一项所示的氨基酸序列的蛋白质;
[2]由在序列号1~8任一项所示的氨基酸序列上缺失、置换或者添加1个以上的氨基酸的氨基酸序列构成、并且具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质;
[3]由与序列号1~8任一项所示的氨基酸序列具有65%以上的同源性的氨基酸序列构成、并且具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质;
[4]由与序列号17所示的氨基酸序列具有80%以上的同源性的氨基酸序列、并且具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质;
[5]具有序列号37或者38所示的氨基酸序列的蛋白质;
[6]由在序列号37或者38所示的氨基酸序列上缺失、置换或者添加1个以上的氨基酸的氨基酸序列构成、并且具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质;
[7]由与序列号37或者38所示的氨基酸序列具有65%以上的同源性的氨基酸序列构成、并且具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质。
3.二肽或者二肽衍生物(PI)的制备方法,其特征在于,将保持有选自以下[1]~[5]的DNA的细胞培养物或者该培养物的处理物用作酶源,使该酶源、1种以上的氨基酸或者氨基酸衍生物存在于水性介质中、在该水性介质中生成、蓄积二肽或者二肽衍生物(PI),从该介质中收集该二肽或者二肽衍生物(PI),[不过、二肽或者二肽衍生物(PI)不是选自上述氨基酸组A的相同或者不相同的氨基酸以肽键结合而成的化合物]:
[1]具有序列号9~16以及36任一项所示的碱基序列的DNA;
[2]和具有与序列号9~16以及36任一项所示的碱基序列互补的碱基序列的DNA在严格的条件下杂交、并且编码具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质的DNA;
[3]和具有与序列号18所示的碱基序列的互补的碱基序列的DNA在严格的条件下杂交、并且编码具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质的DNA;
[4]具有序列号39或者40所示的碱基序列的DNA;
[5]和具有与序列号39或者40所示的碱基序列互补的碱基序列的DNA在严格的条件下杂交、并且编码具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质的DNA。
4.二肽或者二肽衍生物(PII)的制备方法,其特征在于,将具有选自以下[1]~[5]的DNA的细胞培养物或者该培养物的处理物用作酶源,使该酶源、1种以上的氨基酸或者氨基酸衍生物存在于水性介质中,在该水性介质中生成、蓄积二肽或者二肽衍生物(PI),直接或者从该介质收集该二肽或者二肽衍生物(PI)后,修饰该二肽或者二肽衍生物(PI)而使二肽或者二肽衍生物(PII)生成,收集该二肽或者二肽衍生物(PII):
[1]具有序列号9~16以及36任一项所示的碱基序列的DNA;
[2]和具有与序列号9~16以及36任一项所示的碱基序列互补的碱基序列的DNA在严格的条件下杂交、并且编码具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质的DNA;
[3]具有与序列号18所示的碱基序列互补的碱基序列的DNA在严格的条件下杂交、并且编码具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)的活性的蛋白质的DNA;
[4]具有序列号39或者40所示的碱基序列的DNA;
[5]具有与序列号39或者40所示的碱基序列互补的碱基序列的DNA在严格的条件下杂交、并且编码具有由1种以上的氨基酸或者氨基酸衍生物生成二肽或者二肽衍生物(PI)活性的蛋白质的DNA。
5.权利要求1~4中的任一项记载的制备方法,其中氨基酸或者氨基酸衍生物是式(I)或式(II)表示的氨基酸或氨基酸衍生物
Figure A2005800212450005C1
(式中、n1表示1~3的整数,
R1a和R1b可以相同或不同,代表氢原子、取代或未取代的低级烷基、取代或未取代的低级烯基、取代或未取代的低级炔基、取代或未取代的芳烷基、取代或未取代的低级烷酰基、取代或未取代的低级烷氧羰基、取代或未取代的芳基或取代或未取代的芳酰基,或R1a和R1b中的任一方也可以与邻接的氮原子、该氮原子邻接的碳原子以及该碳原子上的R2a和R2b的任一方一起形成取代或未取代的杂环基,
R2a和R2b可相同或不同,代表氢原子、取代或未取代的低级烷基、取代或未取代的芳烷基、取代或未取代的芳基或取代或未取代的杂环烷基,或与R1aR1bN邻接的碳原子上的R2a和R2b中的任一方也可以与邻接的碳原子、该碳原子邻接的氮原子以及R1a和R1b中的任一方一起形成取代或未取代的杂环基,n1为2或3时,2个或3个的R2a和2个或3个的R2b可分别相同,也可以不同),
Figure A2005800212450006C1
[式中、n2与上述n1意义相同。
R3a和R3b可以相同或不同,代表氢原子、取代或未取代的低级烷基、取代或未取代的芳烷基、取代或未取代的芳基或取代或未取代的杂环烷基,或与R4HN邻接的碳原子上的R3a和R3b中的任一方与邻接的碳原子、与该碳原子邻接的氮原子和R4一起形成取代或未取代的杂环基,当n2为2或3时,2个或3个的R3a和2个或3个的R3b可分别相同,也可以不同,
R4代表氢原子、取代或未取代的低级烷基、取代或未取代的低级烯基、取代或未取代的低级炔基、取代或未取代的芳烷基、取代或未取代的低级烷酰基、取代或未取代的低级烷氧羰基、取代或未取代的芳基或取代或未取代的芳酰基,或与R4邻接的氮原子、与该氮原子邻接的碳原子以及该碳原子上的R3a和R3b中的任一方一起形成取代或未取代的杂环基,
R5代表氨基、羟基、取代或未取代的低级烷氧基、一(取代或未取代的低级烷基)氨基、二(取代或未取代的低级烷基)氨基或脂环式杂环基]
[但当氨基酸或氨基酸衍生物只是式(I)表示的氨基酸或氨基酸衍生物时,R1a和R1b中至少有一方是氢原子,而当氨基酸或氨基酸衍生物只是式(II)表示的氨基酸或氨基酸衍生物时,R5为羟基]。
6.权利要求1~4中的任一项记载的制备方法,其中氨基酸或氨基酸衍生物是式(III)或式(IV)表示的氨基酸或氨基酸衍生物:
(式中、R1c和R1d可相同或不同,代表氢原子、取代或未取代的低级烷基、取代或未取代的低级烯基、取代或未取代的低级炔基、取代或未取代的芳烷基、取代或未取代的低级烷酰基、取代或未取代的低级烷氧羰基、取代或未取代的芳基或取代或未取代的芳酰基,
R2c和R2d可相同或不同,代表氢原子或取代或未取代的低级烷基),
(式中、R3c和R3d可相同或不同,代表氢原子、取代或未取代的低级烷基、取代或未取代的芳烷基或取代或未取代的芳基,
R5与上述意义相同)
[但当氨基酸或氨基酸衍生物只是式(III)表示的氨基酸或氨基酸衍生物时,R1c和R1d中至少有一方是氢原子,当氨基酸或氨基酸衍生物只是式(IV)表示的氨基酸或氨基酸衍生物时,R5为羟基]。
7.权利要求1~4中的任一项记载的制备方法,其中氨基酸或氨基酸衍生物是式(V)或式(VI)表示的氨基酸或氨基酸衍生物:
(式中、R2e表示取代或未取代的甲基)
Figure A2005800212450008C2
(式中、R3e代表取代或未取代的低级烷基、取代或未取代的芳烷基或取代或未取代的芳基)。
8.权利要求1~4中的任一项记载的制备方法,其中氨基酸或氨基酸衍生物是选自L-氨基酸、甘氨酸和β-丙氨酸中的氨基酸或其衍生物。
9.权利要求8的制备方法,其中L-氨基酸是选自L-丙氨酸、L-谷氨酰胺、L-谷氨酸、L-缬氨酸、L-亮氨酸、L-异亮氨酸、L-脯氨酸、L-苯丙氨酸、L-色氨酸、L-蛋氨酸、L-丝氨酸、L-苏氨酸、L-半胱氨酸、L-天冬酰胺、L-酪氨酸、L-赖氨酸、L-精氨酸、L-组氨酸、L-天冬氨酸、L-α-氨基丁酸、L-偶氮丝氨酸、L-茶氨酸、L-4-羟基脯氨酸、L-3-羟基脯氨酸、L-鸟氨酸、L-瓜氨酸和L-6-重氮-5-氧代正亮氨酸中的L-氨基酸。
10.权利要求1~5中的任一项记载的制备方法,其中二肽或二肽衍生物(PI)是式(VIIa)表示的二肽或二肽衍生物:
[式中、n3a和n4a分别与上述n1具有相同意义,
R6a和R6b可相同或不同,代表氢原子、取代或未取代的低级烷基、取代或未取代的低级烯基、取代或未取代的低级炔基、取代或未取代的芳烷基、取代或未取代的低级烷酰基、取代或未取代的低级烷氧羰基、取代或未取代的芳基或取代或未取代的芳酰基,或R6a和R6b中的任一方可以与邻接的氮原子、与该氮原子邻接的碳原子和该碳原子上的R7a和R7b中的任一方一起形成取代或未取代的杂环基,
R7a和R7b可相同或不同,代表氢原子、取代或未取代的低级烷基、取代或未取代的芳烷基、取代或未取代的芳基或取代或未取代的杂环烷基,或与R6aR6bN邻接的碳原子上的R7a和R7b中的任一方可以与邻接的碳原子、与该碳原子邻接的氮原子和R6a和R6b中的任一方一起形成取代或未取代的杂环基,当n3a为2或3时,2个或3个R7a和2个或3个R7b可分别相同,也可以不同,
R8a代表氢原子、取代或未取代的低级烷基、取代或未取代的低级烯基、取代或未取代的低级炔基、取代或未取代的芳烷基、取代或未取代的低级烷酰基、取代或未取代的低级烷氧羰基、取代或未取代的芳基或取代或未取代的芳酰基,或R8a与邻接的氮原子、与该氮原子邻接而且与R9a和R9b结合的碳原子和该碳原子上的R9a和R9b中的任一方一起形成取代或未取代的杂环基,
R9a和R9b可相同或不同,代表氢原子、取代或未取代的低级烷基、取代或未取代的芳烷基、取代或未取代的芳基或取代或未取代的杂环烷基,或与R8aN邻接的碳原子上的R9a和R9b中的任一方可以与邻接的碳原子、与该碳原子邻接的氮原子和R8a一起形成取代或未取代的杂环基,当n4a为2或3时,2个或3个R9a和2个或3个R9b可分别相同,也可以不同,
R10a代表氨基、羟基、取代或未取代的低级烷氧基、一(取代或未取代的低级烷基)氨基、二(取代或未取代的低级烷基)氨基或脂环式杂环基]。
11.权利要求1~5中任一项记载的制备方法,其中二肽或二肽衍生物(PII)是式(VIIb)表示的二肽或二肽衍生物:
Figure A2005800212450010C1
[式中、n3A和n4A分别与上述n1具有相同意义,
R6A和R6B可相同或不同,代表氢原子、取代或未取代的低级烷基、取代或未取代的低级烯基、取代或未取代的低级炔基、取代或未取代的芳烷基、取代或未取代的低级烷酰基、取代或未取代的低级烷氧羰基、取代或未取代的芳基或取代或未取代的芳酰基,或R6A和R6B中的任一方也可以与邻接的氮原子、与该氮原子邻接的碳原子和该碳原子上的R7A和R7B中的任一方一起形成取代或未取代的杂环基,
R7A和R7B可相同或不同,代表氢原子、取代或未取代的低级烷基、取代或未取代的芳烷基、取代或未取代的芳基或取代或未取代的杂环烷基,或与R6AR6BN邻接的碳原子上的R7A和R7B中的任一方也可以与邻接的碳原子、与该碳原子邻接的氮原子和R6A和R6B中的任一方一起形成取代或未取代的杂环基,当n3A为2或3时,2个或3个R7A和2个或3个R7B可分别相同,也可以不同,
R8A代表氢原子、取代或未取代的低级烷基、取代或未取代的低级烯基、取代或未取代的低级炔基、取代或未取代的芳烷基、取代或未取代的低级烷酰基、取代或未取代的低级烷氧羰基、取代或未取代的芳基或取代或未取代的芳酰基,或R8A与邻接的氮原子、与该氮原子邻接而且与R9A和R9B结合的碳原子以及该碳原子上的R9A和R9B中的任一方一起形成取代或未取代的杂环基,
R9A和R9B可相同或不同,代表氢原子、取代或未取代的低级烷基、取代或未取代的芳烷基、取代或未取代的芳基或取代或未取代的杂环烷基,或与R8AN邻接的碳原子上的R9A和R9B中的任一方可以与邻接的碳原子、与该碳原子邻接的氮原子和R8A一起形成取代或未取代的杂环基,当n4A为2或3时,2个或3个R9A和2个或3个R9B可分别相同,也可以不同,
R10A与上述R10a具有同样的意义]。
12.权利要求1~6中的任一项记载的制备方法,其中二肽或二肽衍生物(PI)是式(VIIIa)表示的二肽或二肽衍生物。
(式中、R6c和R6d可相同或不同,代表氢原子、取代或未取代的低级烷基、取代或未取代的低级烯基、取代或未取代的低级炔基、取代或未取代的芳烷基、取代或未取代的低级烷酰基、取代或未取代的低级烷氧羰基、取代或未取代的芳基或取代或未取代的芳酰基,
R7c和R7d可相同或不同,代表氢原子或取代或未取代的低级烷基,
R9c和R9d可相同或不同,代表氢原子、取代或未取代的低级烷基、取代或未取代的芳烷基或取代或未取代的芳基,
R10a与上述同义)。
13.权利要求1~6中的任一项记载的制备方法,其中二肽或二肽衍生物(PII)是式(VIIIb)表示的二肽或二肽衍生物:
Figure A2005800212450012C1
(式中、R6C、R6D、R7C、R7D、R9C和R9D分别与上述R6c、R6d、R7c、R7d、R9c和R9d具有同样意义,R10A与上述同义)。
14.权利要求1~7中的任一项记载的制备方法,其中二肽或二肽衍生物(PI)是式(IXa)表示的二肽或二肽衍生物:
(式中、R7e代表取代或未取代的甲基,R9e代表取代或未取代的低级烷基、取代或未取代的芳烷基或取代或未取代的芳基)。
15.权利要求1~7中的任一项记载的制备方法,其中二肽或二肽衍生物(PII)是式(IXb)表示的二肽或二肽衍生物:
(式中、R7E和R9E分别与上述R7e和R9e具有同样意义)。
16.权利要求1~8中的任一项记载的制备方法,其中二肽或二肽衍生物(PI)或二肽或二肽衍生物(PII)是从L-氨基酸、甘氨酸、和β-丙氨酸、以及它们的衍生物选出的相同或不同的氨基酸或氨基酸衍生物通过肽键形成的二肽或二肽衍生物。
17.权利要求16的制备方法,其中L-氨基酸是选自L-丙氨酸、L-谷氨酰胺、L-谷氨酸、L-缬氨酸、L-亮氨酸、L-异亮氨酸、L-脯氨酸、L-苯丙氨酸、L-色氨酸、L-蛋氨酸、L-丝氨酸、L-苏氨酸、L-半胱氨酸、L-天冬酰胺、L-酪氨酸、L-赖氨酸、L-精氨酸、L-组氨酸、L-天冬氨酸、L-α-氨基丁酸、L-偶氮丝氨酸、L-茶氨酸、L-4-羟基脯氨酸、L-3-羟基脯氨酸、L-鸟氨酸、L-瓜氨酸和L-6-重氮-5-氧代正亮氨酸中的L-氨基酸。
18.权利要求3~17中的任一项记载的制备方法,其中细胞是微生物的细胞。
19.权利要求18的制备方法,其中微生物是原核生物。
20.权利要求19的制备方法,其中原核生物是1种以上的肽酶和1种以上的具有肽转运活性的蛋白质(以下,也称为肽转运蛋白质)的活性低下或丧失的微生物。
21.权利要求19的制备方法,其中原核生物是3种以上的肽酶的活性低下或丧失的微生物。
22.权利要求20或21的制备方法,其中肽酶是具有序列号43~46中的任一个表示的氨基酸序列的蛋白质、或具有与序列号43~46中的任一个表示的氨基酸序列有80%以上同源性的氨基酸序列,而且具有肽酶活性的蛋白质。
23.权利要求20或22的制备方法,其中肽转运蛋白质是具有序列号47~51中的任一个表示的氨基酸序列的蛋白质、或具有与序列号47~51中的任一个表示的氨基酸序列有80%以上同源性的蛋白质,而且具有肽转运活性的蛋白质。
24.权利要求19~23中的任一项记载的制备方法,其中原核生物是属于埃希氏菌属( Escherichia)、芽孢杆菌属( Bacillus)或棒杆菌属( Corynebacterium)的微生物。
25.权利要求24的制备方法,其中属于埃希氏菌属、芽孢杆菌属或棒杆菌属的微生物是大肠杆菌( Escherichia coli)、谷氨酸棒杆菌( Corynebacterium  glutamicum)、产氨棒杆菌( Corynebacterium ammoniagenes)、乳酸发酵棒杆菌( Corynebacterium lactofermentum)、黄色短杆菌( Brevibacterium  flavum)、Corynebacterium efficiens、枯草芽孢杆菌( Bacillus  subtilis)或巨大芽孢杆菌( Bacillus  megaterium)。
26.权利要求3~25中的任一项记载的制备方法,其特征在于,其中培养物的处理物是培养物的浓缩物、培养物的干燥物、对培养物进行离心分离得到的菌体、该菌体的干燥物、该菌体的冷冻干燥物、该菌体的表面活性剂处理物、该菌体的超声波处理物、该菌体的机械性磨碎处理物、该菌体的溶剂处理物、该菌体的酶处理物、该菌体的蛋白质分级物、该菌体的固定化物和从该菌体提取得到的酶标准品,而且是具有由1种以上的氨基酸或氨基酸衍生物生成二肽或二肽衍生物的活性的处理物。
CNA2005800212451A 2004-06-25 2005-06-24 二肽或二肽衍生物的制备方法 Pending CN1997738A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2004189008 2004-06-25
JP189008/2004 2004-06-25

Publications (1)

Publication Number Publication Date
CN1997738A true CN1997738A (zh) 2007-07-11

Family

ID=35781826

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2005800212451A Pending CN1997738A (zh) 2004-06-25 2005-06-24 二肽或二肽衍生物的制备方法

Country Status (5)

Country Link
US (1) US20080213827A1 (zh)
EP (1) EP1767628A4 (zh)
JP (1) JP5424530B2 (zh)
CN (1) CN1997738A (zh)
WO (1) WO2006001381A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102190705A (zh) * 2011-03-25 2011-09-21 天津启仁医药科技有限公司 精-鸟二肽合成方法
CN112280755A (zh) * 2020-11-06 2021-01-29 深圳瑞德林生物技术有限公司 一种突变酶及其应用和酶催化法制备三胜肽的工艺

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5319521B2 (ja) 2007-04-06 2013-10-16 協和発酵バイオ株式会社 ジペプチドの製造法
US7939505B2 (en) 2007-05-04 2011-05-10 Marina Biotech, Inc. Amino acid lipids and uses thereof
EP2212419A1 (en) * 2007-10-31 2010-08-04 Kyowa Hakko Bio Co., Ltd. Cyclodipeptide synthases (cdss) and their use in the synthesis of linear dipeptides
KR101185045B1 (ko) 2008-12-09 2012-09-26 서울대학교산학협력단 펩타이드?당 결합체를 이용한 당 가수분해 효소에 대한 특이적 저해제 및 이의 스크리닝 방법

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1097214A2 (de) * 1998-07-10 2001-05-09 Institut für Pflanzengenetik und Kulturpflanzenforschung Gene zur biosynthese von anticapsin und bacilysin, ihre isolierung und verwendung
EA200101015A1 (ru) * 1999-03-29 2002-02-28 ХОЛЛАНД СВИТЕНЕР КОМПАНИ В.о.Ф. СПОСОБ МИКРОБИОЛОГИЧЕСКОГО ПОЛУЧЕНИЯ α-L-АСПАРИЛ-L-ФЕНИЛАЛАНИНА
CN1529712A (zh) * 2001-07-26 2004-09-15 ֮����ʽ���� 二肽的制备方法、其中所用的肽生成酶及肽生成酶的制备方法
FR2841260B1 (fr) * 2002-06-21 2004-10-22 Commissariat Energie Atomique Polynucleotides et polypeptides codes par lesdits polynucleotides impliques dans la synthese de derives des dicetopiperazines
CN100400660C (zh) * 2002-12-26 2008-07-09 协和发酵工业株式会社 生产二肽的方法
US20050106703A1 (en) * 2003-11-05 2005-05-19 Kyowa Hakko Kogyo Co., Ltd. Microorganisms producing dipeptides and process for producing dipeptides using the microorganisms
US20050148048A1 (en) * 2003-11-27 2005-07-07 Kyowa Hakko Kogyo Co., Ltd. Process for producing dipeptides
US20070243581A1 (en) * 2004-04-21 2007-10-18 Hashimoto Shin-Ichi Process for Producing Dipeptides

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102190705A (zh) * 2011-03-25 2011-09-21 天津启仁医药科技有限公司 精-鸟二肽合成方法
CN112280755A (zh) * 2020-11-06 2021-01-29 深圳瑞德林生物技术有限公司 一种突变酶及其应用和酶催化法制备三胜肽的工艺
CN112280755B (zh) * 2020-11-06 2023-03-14 深圳瑞德林生物技术有限公司 一种突变酶及其应用和酶催化法制备三胜肽的工艺

Also Published As

Publication number Publication date
EP1767628A4 (en) 2008-08-27
US20080213827A1 (en) 2008-09-04
EP1767628A1 (en) 2007-03-28
WO2006001381A1 (ja) 2006-01-05
JP5424530B2 (ja) 2014-02-26
JPWO2006001381A1 (ja) 2008-04-17

Similar Documents

Publication Publication Date Title
CN1973037B (zh) 二肽或二肽衍生物的制造方法
CN100400660C (zh) 生产二肽的方法
CN1973042B (zh) 二肽的制造方法
CN101151369B (zh) 二肽的结晶及其制备方法
CN1997738A (zh) 二肽或二肽衍生物的制备方法
US20070243581A1 (en) Process for Producing Dipeptides
CN1882683B (zh) 生产二肽的微生物和使用该微生物制造二肽的方法
CN101142315B (zh) 二肽的制备方法
US20100248307A1 (en) Peptide production method

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication