CN1720325A - 生产二肽的方法 - Google Patents

生产二肽的方法 Download PDF

Info

Publication number
CN1720325A
CN1720325A CNA2003801048506A CN200380104850A CN1720325A CN 1720325 A CN1720325 A CN 1720325A CN A2003801048506 A CNA2003801048506 A CN A2003801048506A CN 200380104850 A CN200380104850 A CN 200380104850A CN 1720325 A CN1720325 A CN 1720325A
Authority
CN
China
Prior art keywords
ala
glu
leu
ile
lys
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2003801048506A
Other languages
English (en)
Other versions
CN100400660C (zh
Inventor
桥本信一
田畑和彦
羽田文
池田创
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyowa Hakko Bio Co Ltd
Original Assignee
Kyowa Hakko Kogyo Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyowa Hakko Kogyo Co Ltd filed Critical Kyowa Hakko Kogyo Co Ltd
Publication of CN1720325A publication Critical patent/CN1720325A/zh
Application granted granted Critical
Publication of CN100400660C publication Critical patent/CN100400660C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/32Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Bacillus (G)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/52Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from bacteria or Archaea
    • C12N9/54Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from bacteria or Archaea bacteria being Bacillus
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P20/00Technologies relating to chemical industry
    • Y02P20/50Improvements relating to the production of bulk chemicals
    • Y02P20/55Design of synthesis routes, e.g. reducing the use of auxiliary or protecting groups

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Biophysics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

本发明提供了具有合成与L-Ala-L-Ala不同的二肽的活性的蛋白和用于合成二肽的蛋白、用于生产具有二肽合成活性的蛋白的方法、使用具有二肽合成活性的蛋白或用于二肽合成的蛋白生产二肽的方法、和使用能生产具有二肽合成活性的蛋白或用于二肽合成的蛋白的微生物培养物等作为酶源生产二肽的方法。

Description

生产二肽的方法
技术领域
本发明涉及具有二肽合成活性的蛋白和用于二肽合成的蛋白、用于生产具有二肽合成活性的蛋白的方法、使用具有二肽合成活性的蛋白或用于二肽合成的蛋白生产二肽的方法、能生产具有二肽合成活性的蛋白或用于二肽合成的蛋白的微生物或转化体、和使用这样的微生物或转化体生产二肽的方法。
背景技术
对于大规模的肽合成,可以得到化学合成方法(液相方法和固相方法)、酶合成方法和使用重组DNA技术的生物合成方法。目前,酶合成方法和生物合成方法用于合成超过50个残基的长链肽,化学合成方法和酶合成方法主要用于合成二肽。
但是,在用化学合成方法合成二肽时,必须进行为官能团导入和去除保护基的操作,还会形成外消旋物。因而认为化学合成方法在成本和效率方面是不利的。从环境卫生的角度看,它们也是不利的,因为需要使用大量的有机溶剂等。
关于酶法合成二肽,已知有下述的方法:使用蛋白酶的逆反应的方法(J.Biol.Chem., 119,707-720(1937));使用热稳定的氨酰基t-RNA合成酶的方法(日本公开的未审查的专利申请号146539/83,日本公开的未审查的专利申请号209991/83,日本公开的未审查的专利申请号209992/83,和日本公开的未审查的专利申请号106298/84);和使用非核糖体的肽合成酶(以下简称为NRPS)的方法(Chem.Biol.,7,373-384(2000),FEBS Lett., 498,42-45(2001),美国专利号5,795,738和美国专利号5,652,116)。
但是,使用蛋白酶的逆反应的方法需要为用作底物的氨基酸的官能团导入和去除保护基,这会造成提高肽合成反应的效率和防止肽降解反应方面的困难。使用热稳定的氨酰基t-RNA合成酶的方法具有下述缺陷:难以表达酶和难以预防副反应形成目标产物以外的副产物。使用NRPS的方法的效率较差,由于难以通过重组DNA技术表达酶,因为它的酶分子较大,且必须提供辅酶4’-磷酸泛酰巯基乙胺。
另一方面,有一组肽合成酶,其具有比NRPS更小的酶分子量,且不需要辅酶4’-磷酸泛酰巯基乙胺;例如,γ-谷氨酰半胱氨酸合成酶、谷胱甘肽合成酶、D-丙氨酸-D-丙氨酸(D-Ala-D-Ala)连接酶、和聚-γ-谷氨酸合成酶。这些酶中的大多数使用D-氨基酸作为底物,或催化在γ-羧基处形成肽键。因为这样的性质,它们不能用于通过在L-氨基酸的α-羧基处形成肽键来合成二肽。
已知的能通过在L-氨基酸的α-羧基处形成肽键的活性来合成二肽的酶的唯一实例是芽孢杆菌溶素(来自芽孢杆菌属微生物的二肽抗生素)合成酶。已知芽孢杆菌溶素合成酶具有合成芽孢杆菌溶素[L-丙氨酰基-L-抗荚膜菌素(L-Ala-L-抗荚膜菌素)]和L-丙氨酰基-L-丙氨酸(L-Ala-L-Ala)的活性,但是没有关于它的合成其它肽的信息(J.Ind.Microbiol., 2,201-208(1987)和Enzyme.Microbial.Technol., 29,400-406(2001))。
关于已经清楚了其整体基因组信息的杆草芽孢杆菌168的芽孢杆菌溶素生物合成酶基因(Nature, 390,249-256(1997)),已知通过扩增含有ORF  ywfA- F(WO00/03009小册子)的芽孢杆菌溶素操纵子能提高芽孢杆菌溶素的生产力。但是,尚不清楚这些ORF是否含有能编码蛋白的ORF,所述蛋白具有通过肽键连接2个或多个氨基酸的活性,如果含有,则是哪个ORF编码该蛋白?
本发明的一个目的是提供:具有合成二肽的活性的蛋白,所述二肽与L-Ala-L-Ala不同,迄今为止还没有提出关于它的使用肽合成酶等的酶合成方法;用于合成该二肽的蛋白;编码具有二肽合成活性的蛋白的DNA;含有该DNA的重组DNA;携带重组DNA的转化体;生产具有二肽合成活性的蛋白的方法;使用具有二肽合成活性的蛋白或用于二肽合成的蛋白来合成二肽的酶促方法;和使用微生物培养物作为酶源来生产二肽的方法,所述微生物具有生产具有二肽合成活性的蛋白或用于二肽合成的蛋白等的能力。
发明概述
本发明涉及下面的(1)至(21)。
(1)选自下面的[1]至[4]的蛋白,条件是不包括由SEQ ID NO:1所示的氨基酸序列组成的蛋白:
[1]含有SEQ ID NO:2至8中的任一个所示的氨基酸序列的蛋白;
[2]含有氨基酸序列的蛋白,其中在SEQ ID NO:1至8中的任一个所示的氨基酸序列中缺失、取代或添加了一个或多个氨基酸残基,且其具有合成式(I)所示的二肽的活性:
R1-R2        (I)
(其中R1和R2可以相同或不同,每个代表一个氨基酸残基,条件是R1和R2不同时代表L-丙氨酸);
[3]蛋白,其含有的氨基酸序列表现出与SEQ ID NO:1至8中的任一个所示的氨基酸序列具有65%或更多的相似性,且其具有合成式(I)所示的二肽的活性;
[4]蛋白,其含有的氨基酸序列表现出与SEQ ID NO:17所示的氨基酸序列具有80%或更多的相似性,且其具有合成式(I)所示的二肽的活性。
(2)用于合成式(I)所示的二肽的蛋白:
R1-R2        (I)
(其中R1和R2可以相同或不同,每个代表一个氨基酸残基,条件是R1和R2不同时代表L-丙氨酸),其具有SEQ ID NO:1所示的氨基酸序列。
(3)选自下面的[1]至[4]的DNA,条件是不包括由SEQ ID NO:9所示的核苷酸序列组成的DNA:
[1]能编码根据上面(1)的蛋白的DNA;
[2]含有SEQ ID NO:10至16和36中的任一个所示的核苷酸序列的DNA;
[3]DNA,其能在严格条件下与含有SEQ ID NO:9至16和36中的任一个所示的核苷酸序列的互补链的DNA杂交,且其能编码具有合成式(I)所示的二肽的活性的蛋白:
R1-R2        (I)
(其中R1和R2可以相同或不同,每个代表一个氨基酸残基,条件是R1和R2不同时代表L-丙氨酸);和
[4]DNA,其含有与SEQ ID NO:18所示的核苷酸序列有80%或更多的相似性的核苷酸序列,且能编码具有合成式(I)所示的二肽的活性的蛋白。
(4)重组DNA,其含有根据上面(3)的DNA。
(5)转化体,其携带根据上面(4)的重组DNA。
(6)根据上面(5)的转化体,其中该转化体是使用微生物作为宿主得到的转化体。
(7)根据上面(6)的转化体,其中该微生物是埃希氏菌属的微生物。
(8)生产根据上面(1)的蛋白的方法,其包括:在培养基中培养根据上面(5)至(7)中的任一项的转化体,使根据上面(1)的蛋白在培养基中形成和积累,和从培养基中回收蛋白。
(9)生产根据上面(1)的蛋白的方法,其包括:在培养基中培养能生产根据上面(1)的蛋白的微生物,使蛋白在培养基中形成和积累,和从培养基中回收蛋白。
(10)根据上面(9)的方法,其中该微生物是芽孢杆菌属的微生物。
(11)根据上面(10)的方法,其中该芽孢杆菌属的微生物是能生产芽孢杆菌溶素的芽孢杆菌属的微生物。
(12)根据上面(11)的方法,其中所述能生产芽孢杆菌溶素的芽孢杆菌属的微生物是选自下面种属的微生物:杆草芽孢杆菌(Bacillussubtilis),解淀粉芽孢杆菌(Bacillus amyloliquefaciens),凝结芽孢杆菌(Bacillus coagulans),地衣芽胞杆菌(Bacilluslicheniformis),巨大芽孢杆菌(Bacillus megaterium)和短小芽孢杆菌(Bacillus pumilus)。
(13)生产式(I)所示的二肽的方法:
R1-R2        (I)
(其中R1和R2可以相同或不同,每个代表一个氨基酸残基,条件是R1和R2不同时代表L-丙氨酸),其包含:
使根据上面(1)的蛋白或根据上面(2)的用于二肽合成的蛋白、至少2个可以相同或不同的氨基酸、和ATP存在于水性介质中;
使二肽在介质中形成和积累;和
从介质中回收二肽。
(14)生产式(I)所示的二肽的方法:
R1-R2        (I)
(其中R1和R2可以相同或不同,每个代表一个氨基酸残基,条件是R1和R2不同时代表L-丙氨酸),其包含:
使酶源和至少2个可以相同或不同的氨基酸存在于水性介质中,所述的酶源是选自下面的[1]至[3]的培养物或处理过的培养物:
[1]根据上面(5)至(7)中的任一项的转化体的培养物,或处理过的所述培养物;
[2]能生产根据上面(1)的蛋白的微生物的培养物,或处理过的所述培养物;和
[3]能生产根据上面(2)的用于二肽合成的蛋白的微生物,或处理过的所述培养物;
使二肽在介质中形成和积累;和
从介质中回收二肽。
(15)根据上面(14)的方法,其中能生产根据上面(1)的蛋白的微生物是芽孢杆菌属的微生物。
(16)根据上面(15)的方法,其中芽孢杆菌属的微生物是能生产芽孢杆菌溶素的芽孢杆菌属的微生物。
(17)根据上面(16)的方法,其中能生产芽孢杆菌溶素的芽孢杆菌属的微生物是选自下面种属的微生物:杆草芽孢杆菌,解淀粉芽孢杆菌,凝结芽孢杆菌,地衣芽胞杆菌,巨大芽孢杆菌和短小芽孢杆菌。
(18)根据上面(14)的方法,其中能生产根据上面(2)的用于二肽合成的蛋白的微生物是用重组DNA(其包含含有SEQ ID NO:9所示的核苷酸序列的DNA)转化的微生物,或属于杆草芽孢杆菌的微生物。
(19)根据上面(18)的方法,其中携带重组DNA(其包含含有SEQ IDNO:9所示的核苷酸序列的DNA)的微生物是埃希氏菌属的微生物。
(20)根据上面(14)至(19)中的任一项的方法,其中处理过的培养物是浓缩的培养物、干燥的培养物、通过离心培养物得到的细胞、通过提取细胞得到的酶制品或通过对细胞进行下述操作得到的产物:干燥,冻干,用表面活性剂、超声破碎、机械摩擦处理,用溶剂处理,酶处理,蛋白分级或固定化。
(21)根据上面(13)至(20)中的任一项的方法,其中该二肽是式(II)代表的二肽:
R3-R4    (II)
(其中R3和R4可以相同或不同,每个代表选自下述的氨基酸残基:L-丙氨酸,L-谷氨酰胺,L-谷氨酸,甘氨酸,L-缬氨酸,L-亮氨酸,L-异亮氨酸,L-脯氨酸,L-苯丙氨酸,L-色氨酸,L-甲硫氨酸,L-丝氨酸,L-苏氨酸,L-半胱氨酸,L-天冬酰胺,L-酪氨酸,L-赖氨酸,L-精氨酸,L-组氨酸,L-天门冬氨酸,L-α-氨基丁酸,β-丙氨酸,L-重氮丝氨酸,L-茶氨酸,L-4-羟基脯氨酸,L-3-羟基脯氨酸,L-鸟氨酸,L-瓜氨酸和L-6-重氮-5-氧-正亮氨酸,条件是R3和R4不同时代表L-丙氨酸)。
根据本发明,可以生产出具有合成二肽的活性的蛋白,所述二肽与L-A1a-L-Ala不同,迄今为止还没有提出关于它的酶促合成方法。使用该蛋白、或能生产该蛋白的转化体或微生物可以生产出非L-Ala-L-Ala的二肽。
附图说明
图1显示了构建质粒pPE43的步骤。
图2显示了构建质粒pQE60ywfE的步骤。
符号解释
ywfE:源自杆草芽孢杆菌168的 ywfE基因
P trp:色氨酸启动子基因
P T5:T5启动子基因
发明详述
本发明的蛋白包括:
[1]含有SEQ ID NO:2至8中的任一个所示的氨基酸序列的蛋白;
[2]由氨基酸序列构成的蛋白,其中在SEQ ID NO:1至8中的任一个所示的氨基酸序列中缺失、取代或添加了一个或多个氨基酸残基,且其具有合成式(I)所示的二肽的活性:
R1-R2    (I)
(其中R1和R2可以相同或不同,每个代表一个氨基酸残基,条件是R1和R2不同时代表L-丙氨酸);
[3]蛋白,其含有的氨基酸序列表现出与SEQ ID NO:1至8中的任一个所示的氨基酸序列具有65%或更多的相似性,且其具有合成式(I)所示的二肽的活性;和
[4]蛋白,其含有的氨基酸序列表现出与SEQ ID NO:17所示的氨基酸序列具有80%或更多的相似性,且其具有合成式(I)所示的二肽的活性,条件是不包括由SEQ ID NO:1所示的氨基酸序列组成的蛋白。
用于合成本发明的式(I)所示的二肽的蛋白的实例是由SEQ ID NO:1所示的氨基酸序列组成的蛋白。
在下文中,本发明的上述蛋白和用于合成式(I)所示的二肽的蛋白可以一起称作本发明的蛋白。
可以得到上面的由氨基酸序列组成的蛋白,其中缺失、取代或添加了一个或多个氨基酸残基,且其具有合成式(I)所示的二肽的活性,例如通过下述描述的定点诱变将定位突变导入能编码由SEQ ID NO:1至8中的任一个所示的氨基酸序列组成的蛋白的DNA中:MolecularCloning,A Laboratory Manual,第2版,Cold Spring HarborLaboratory Press(1989)(以下简称为Molecular Cloning,笫2版);Current Protools in Molecular Biology,John Wiley & Sons(1987-1997)(以下简称为Current Protocols in Molecular Biology);Nucleic Acids Research, 10,6487(1982);Proc.Natl.Acad.Sci.USA, 79,6409(1982);Gene, 34,315(1985);Nucleic AcidsResearch, 13,4431(1985);Proc.Natl.Acad.Sci.USA, 82,488(1985),等。
缺失、取代或添加的氨基酸残基的数目没有特别限制,但是在通过已知方法(例如上面的定点诱变)可以进行缺失、取代或添加的范围内。合适的数目是1至数打(dozens)、优选1至20、更优选1至10、再优选1至5。
表述“在SEQ ID NO:1至8中的任一个所示的氨基酸序列中缺失、取代或添加了一个或多个氨基酸残基”是指该氨基酸序列可以在SEQID NO:1至8中的任一个所示的氨基酸序列的任意位置含有一个或多个氨基酸残基的缺失、取代或添加。
可以取代的氨基酸残基是,例如,当使用已知的比对软件对比序列时,不是在SEQ ID NO:1至8所示的所有氨基酸序列中都保守的那些。已知的比对软件的实例是包含在基因分析软件Genetyx(SoftwareDevelopment Co.,Ltd.)中的比对分析软件。关于分析软件的分析参数,可以使用默认值。
可以含有氨基酸残基的缺失或添加,例如,在SEQ ID NO:1至8中的任一个所示的氨基酸序列的N-末端区或C-末端区。
缺失、取代或添加可以同时包含在一个序列中,要取代或添加的氨基酸可以是天然的或非天然的。天然氨基酸的实例是L-丙氨酸,L-天冬酰胺,L-天门冬氨酸,L-谷氨酰胺,L-谷氨酸,甘氨酸,L-组氨酸,L-异亮氨酸,L-亮氨酸,L-赖氨酸,L-甲硫氨酸,L-苯丙氨酸,L-脯氨酸,L-丝氨酸,L-苏氨酸,L-色氨酸,L-酪氨酸,L-缬氨酸和L-半胱氨酸。
下面是能够相互取代的氨基酸的实例。在同一组中的氨基酸可以相互取代。
组A:亮氨酸,异亮氨酸,正亮氨酸,缬氨酸,正缬氨酸,丙氨酸,2-氨基丁酸,甲硫氨酸,O-甲基丝氨酸,叔丁基甘氨酸,叔丁基丙氨酸,环己基丙氨酸
组B:天门冬氨酸,谷氨酸,异天门冬氨酸,异谷氨酸,2-氨基己二酸,2-氨基辛二酸
组C:天冬酰胺,谷氨酰胺
组D:赖氨酸,精氨酸,鸟氨酸,2,4-二氨基丁酸,2,3-二氨基丙酸
组E:脯氨酸,3-羟基脯氨酸,4-羟基脯氨酸
组F:丝氨酸,苏氨酸,高丝氨酸
组G:苯丙氨酸,酪氨酸
为了使本发明的蛋白可以具有合成式(I)所示的二肽的活性,理想的是,其氨基酸序列与SEQ ID NO:1至8中的任一个(优选SEQ IDNO:1)所示的氨基酸序列的相似性是65%或更高、优选75%或更高、更优选85%或更高、再优选90%或更高、特别优选95%或更高、和最优选98%或更高。
可以使用Karlin和Altschul的算法BLAST[Proc.Natl.Acad.Sci.USA, 90,5873(1993)]和FASTA[Methods Enzymol., 183,63(1990)]检测氨基酸序列和核苷酸序列中的相似性。在算法BLAST的基础上,已经开发了BLASTN和BLASTX等程序[J.Mol.Biol., 215,403(1990)]。当在BLAST的基础上使用BLASTN分析核苷酸序列时,各参数例如如下:分值=100和字长=12。当在BLAST的基础上使用BLASTX分析氨基酸序列时,各参数例如如下:分值=50和字长=3。当使用BLAST和Gapped BLAST程序时,使用每个程序的默认参数。关于这些分析的具体技术是已知的( http://www.ncbi.nlm.nih.gov.)。
本发明的蛋白还包括与SEQ ID NO:1至8中的任一个、优选SEQID NO:1所示的氨基酸序列具有65%或更高、优选75%或更高、更优选85%或更高、再优选90%或更高、特别优选95%或更高、最优选98%或更多的相似性的由氨基酸序列组成的蛋白,且其具有合成式(I)所示的二肽的活性(条件是不包括由SEQ ID NO:1所示的氨基酸序列组成的蛋白)。如上所述,可以使用BLAST或FASTA检测氨基酸序列中的相似性。
SEQ ID NO:17所示的氨基酸序列是在具有SEQ ID NO:1至7所示的氨基酸序列的蛋白中保守的区域,也是与源自各种微生物的具有Ala-Ala连接酶活性的蛋白的共同序列相对应的区域。
本发明的蛋白还包括这样的蛋白,其氨基酸序列与SEQ ID NO:17所示的氨基酸序列具有80%或更高、优选90%或更高、再优选95%或更多的相似性,且其具有合成式(I)所示的二肽的活性(条件是不包括由SEQ ID NO:1所示的氨基酸序列组成的蛋白)。
为了使其氨基酸序列与SEQ ID NO:17所示的氨基酸序列具有80%或更高、优选90%或更高、再优选95%或更多的相似性的蛋白可以具有合成式(I)所示的二肽的活性,理想的是,其氨基酸序列与SEQ IDNO:1至8中的任一个所示的氨基酸序列的相似性是至少80%或更高、通常90%或更高和特别地95%或更高。
如上所述,可以使用BLAST或FASTA检测氨基酸序列中的相似性。
可以证实本发明的蛋白是具有合成上面的式(I)所示的二肽的活性的蛋白,例如,以下面的方式。也就是说,通过重组DNA技术制备能表达本发明的蛋白的转化体,使用该转化体生产本发明的蛋白,然后使本发明的蛋白、至少2个可以相同或不同的氨基酸(条件是,L-丙氨酸与另一种L-氨基酸组合使用)和ATP存在于水性介质中,然后进行HPLC分析等,以确定是否在水性介质中形成和积累了上面的式(I)所示的二肽。
本发明的DNA包括:
[5]DNA,其能编码根据上面的[1]至[4]中的任一项的本发明的蛋白;
[6]DNA,其含有SEQ ID NO:10至16和36中的任一个所示的核苷酸序列;
[7]DNA,其能在严格条件下与含有SEQ ID NO:9至16和36中的任一个所示的核苷酸序列的互补链的DNA杂交,且其能编码具有合成式(I)所示的二肽的活性的蛋白,条件是不包括由SEQ ID NO:9所示的核苷酸序列组成的DNA,优选地条件是不包括能编码由SEQ ID NO:1所示的氨基酸序列组成的蛋白的DNA;和
[8]DNA,其含有与SEQ ID NO:18所示的核苷酸序列具有80%或更多的相似性的核苷酸序列,且能编码具有合成式(I)所示的二肽的活性的蛋白,条件是不包括由SEQ ID NO:9所示的核苷酸序列组成的DNA,优选地条件是不包括能编码由SEQ ID NO:1所示的氨基酸序列组成的蛋白的DNA。
可以用在生产本发明的式(I)所示的二肽的方法中的DNA包括根据上面[5]至[8]的DNA和由SEQ ID NO:9所示的核苷酸序列组成的DNA。
上面的能在严格条件下杂交的DNA是指,例如,使用部分或全部具有SEQ ID NO:9至16和36中的任一个所示的核苷酸序列的DNA作为探针,通过菌落杂交、噬菌斑杂交、DNA印迹杂交等得到的DNA。这种DNA的具体实例是可以通过下述方法鉴别出的DNA:使用其上面固定有菌落-或噬菌斑-衍生的DNA的滤膜,在存在0.7至1.0mol/l氯化钠的情况下,在65℃进行杂交,然后在65℃用0.1至2-倍浓度的SSC溶液(1倍浓度的SSC溶液:150mmol/l氯化钠和15mmol/l柠檬酸钠)洗涤滤膜。可以根据Molecular Cloning,第2版;CurrentProtocols in Molecular Biology;DNA Cloning 1:Core Techniques,A Practical Approach,第2版,Oxford University(1995)等所述的方法进行杂交。更具体地,可杂交的DNA包括与SEQ ID NO:9至16和36中的任一个所示的核苷酸序列具有至少75%或更多的相似性、优选85%或更多的相似性、再优选90%或更多的相似性、特别优选95%或更多的相似性的DNA,如通过使用上述的BLAST或FASTA、在上述参数的基础上计算的。
可以证实能在严格条件下与具有SEQ ID NO:9至16和36中的任一个所示的核苷酸序列的DNA杂交的DNA是能编码具有合成式(I)所示的二肽的活性的蛋白的DNA,例如通过重组DNA技术生产该DNA编码的蛋白,并如上所述检测该蛋白的活性。
(i)本发明的DNA和用在生产本发明的蛋白或二肽的方法中的DNA的制备
可以得到本发明的DNA和用在生产本发明的蛋白或二肽的方法(在下文中,也称作本发明的生产方法)中的DNA,例如,通过使用在SEQ IDNO:9至16中的任一个所示的核苷酸序列的基础上设计的探针、对来自芽孢杆菌属微生物的染色体DNA文库进行DNA杂交,或通过使用在SEQ ID NO:9至16中的任一个所示的核苷酸序列的基础上设计的引物DNA、以芽孢杆菌属微生物的染色体DNA作为模板进行PCR[PCRProtocols,Academic Press(1990)]。
通过在各种基因序列数据库中搜索与能编码SEQ ID NO:1至8和17中的任一个所示的氨基酸序列的DNA的核苷酸序列具有75%或更多的相似性、优选85%或更多的相似性、更优选90%或更多的相似性、再优选95%或更多的相似性、特别优选98%或更多的相似性的序列,并在搜索得到的核苷酸序列的基础上,根据上述方法从具有该核苷酸序列的生物的染色体DNA或cDNA文库得到理想的DNA,也可以得到本发明的DNA和用在本发明的生产方法中的DNA。
用常规方法将得到的DNA以原样或在用合适的限制酶剪切后插入到载体中,并将得到的重组DNA导入宿主细胞中。然后,可以通过常规测序方法例如双脱氧法[Proc.Natl.Acad.Sci.,USA, 74,5463(1977)],或通过使用核苷酸测序仪例如373A DNA测序仪(Perkin-Elmer Corp.)来检测DNA的核苷酸序列。
当通过分析核苷酸序列发现得到的DNA是部分DNA时,可以使用该部分DNA作为探针、通过染色体DNA文库的DNA杂交得到全长DNA。
在检测的DNA的核苷酸序列的基础上,还可以使用DNA合成仪(例如Model 8905,PerSeptive Biosystems)化学合成需要的DNA。
可以通过上述方法获得的DNA的实例是具有SEQ ID NO:9至16所示的核苷酸序列的DNA。
用于插入本发明的DNA或用在本发明的生产方法中的DNA的载体的实例包括pBluescriptII KS(+)(Stratagene),pDIRECT[NucleicAcids Res., 18,6069(1990)],pCR-Script Amp SK(+)(Stratagene),pT7 Blue(Novagen,Inc.),pCR II(Invitrogen Corp.)和pCR-TRAP(Genhunter Corp.)。
可以使用埃希氏菌属等的微生物作为宿主细胞。埃希氏菌属的微生物的实例包括大肠杆菌(Escherichia coli)XL1-Blue,大肠杆菌XL2-Blue,大肠杆菌DH1,大肠杆菌MC1000,大肠杆菌ATCC 12435,大肠杆菌W1485,大肠杆菌JM109,大肠杆菌HB101,大肠杆菌No.49,大肠杆菌W3110,大肠杆菌NY49,大肠杆菌MP347,大肠杆菌NM522和大肠杆菌ME8415。
可以通过能将DNA导入上述宿主细胞的任何方法进行重组DNA的导入,例如,使用钙离子的方法[Proc.Natl.Acad.Sci.USA, 69,2110(1972)],原生质体方法(日本公开的未审查的专利申请号248394/88)和电穿孔[Nucleic Acids Res., 16,6127(1988)]。
通过上述方法得到的携带着用在本发明的生产方法中的DNA的微生物的实例是大肠杆菌NM522/pPE43,它是用含有具有SEQ ID NO:1所示的序列的DNA的重组DNA转化的微生物。
(ii)生产本发明的蛋白的方法
使用Molecular Cloning,第2版,Current Protocols inMolecular Biology等所述的方法,例如以下述方式,在宿主细胞中表达通过在上面(i)所述的方法得到的本发明的DNA或用在本发明的生产方法中的DNA,从而可以生产本发明的蛋白。
在本发明的DNA或用在本发明的生产方法中的DNA的基础上,根据需要制备了含有能编码本发明的蛋白的区域的合适长度的DNA片段。通过替换蛋白编码区的核苷酸序列中的核苷酸,使密码子最适于在宿主细胞中表达,可以增强蛋白的生产力。含有优化了密码子的核酸序列的DNA会被认为是现在公开的发明的一部分。
可以将DNA片段插入合适表达载体中的启动子的下游,以制备重组DNA。
通过将重组DNA导入适合于表达载体的宿主细胞,可以得到能生产本发明的蛋白的转化体。
可以使用能表达目标基因的任何细菌细胞、酵母细胞、动物细胞、昆虫细胞、植物细胞等作为宿主细胞。
可以使用的表达载体是能自生复制或整合进上面的宿主细胞中的染色体、且在适用于转录本发明的DNA或转录用在本发明的生产方法中的DNA的位置含有启动子的那些。
当使用原核生物例如细菌作为宿主细胞时,优选地,含有本发明的DNA或用在本发明的生产方法中的DNA的重组DNA是能在原核生物中自生复制的重组DNA,和含有例如启动子、核糖体结合序列、本发明的DNA或用在本发明的生产方法中的DNA和转录终止序列的重组DNA。重组DNA还可以含有能调控启动子的基因。
合适的表达载体的实例是pBTrp2、pBTac1和pBTac2(BoehringerMannheim GmbH的产品),pHelix1(Roche Diagnostics Corp.),pKK233-2(Amersham Pharmacia Biotech),pSE280(InvitrogenCorp.),pGEMEX-1(Promega Corp.),pQE-8(Qiagen,Inc.),pET-3(Novagen,Inc.),pKYP10(日本公开的未审查的专利申请号110600/83),pKYP200[Agric.Biol.Chem., 48,669(1984)],pLSA1[Agric.Biol.Chem., 53,277(1989)],pGEL1[Proc.Natl.Acad.Sci.USA, 82,4306(1985)],pBluescript II SK(+),pBluescriptII KS(-)(Stratagene),pTrs30[从大肠杆菌JM109/pTrS30(FERMBP-5407)制备],pTrs32[从大肠杆菌JM109/pTrS32(FERM BP-5408)制备],pPAC31(WO98/12343),pUC19[Gene, 33,103(1985)],pSTV28(Takara Shuzo Co.,Ltd.),pUC118(Takara Shuzo Co.,Ltd.)和pPA1(日本公开的未审查的专利申请号233798/88)。
可以使用能在宿主细胞例如大肠杆菌中发挥作用的任何启动子作为启动子。例如,可以使用源自大肠杆菌或噬菌体的启动子,例如 trp启动子(P trp ), lac启动子(P lac ),PL启动子、PR启动子和PSE启动子、SPO1启动子、SPO2启动子和penP启动子。还可以使用人工设计的和改进的启动子,例如其中2个P trp 串连组合的启动子、 tac启动子、lacT7启动子和letI启动子等。
还有用的是,用于在芽孢杆菌属微生物中表达的xy1A启动子[Appl.Microbiol.Biotechnol., 35,594-599(1991)]和用于在棒状杆菌属微生物中表达的P54-6启动子[Appl.Microbiol.Biotechnol., 53,674-679(2000)]。
优选地,使用SD序列(核糖体结合序列)和起始密码子之间的距离调节至合适长度(例如6至18核苷酸)的质粒。
在其中本发明的DNA或用在本发明的生产方法中的DNA连接到表达载体的重组DNA中,转录终止序列不是重要的,但是优选地使转录终止序列紧挨结构基因的下游。
这样的重组DNA的实例是pPE43。
合适的原核生物的实例包括下面种属的微生物:埃希氏菌属,沙雷氏菌属,芽孢杆菌属,短杆菌属,棒状杆菌属,微杆菌属,假单孢菌属,土壤杆菌属,脂环酸杆菌属,鱼腥蓝细胞属,组囊蓝细菌属,节杆菌属,固氮菌属,着色菌属,欧文氏菌属,甲基杆菌属,席蓝细胞属,红细菌属,红假单孢菌属,红螺菌属,栅藻属(Scenedesmus),链霉菌属,聚球蓝细菌属和发酵单胞菌属。具体的实例是大肠杆菌XL1-Blue,大肠杆菌XL2-Blue,大肠杆菌DH1,大肠杆菌DH5α,大肠杆菌MC1000,大肠杆菌KY3276,大肠杆菌W1485,大肠杆菌JM109,大肠杆菌HB101,大肠杆菌No.49,大肠杆菌W3110,大肠杆菌NY49,大肠杆菌MP347,大肠杆菌NM522,杆草芽孢杆菌ATCC 33712,巨大芽孢杆菌,芽孢杆菌属FERM BP-6030,解淀粉芽孢杆菌,凝结芽孢杆菌,地衣芽胞杆菌,短小芽孢杆菌,产氨短杆菌(Brevibacteriuammoniagenes),Brevibacterium immariophilum ATCC 14068,解糖短杆菌(Brevibacterium saccharolyticum)ATCC 14066,黄色短杆菌(Brevibacterium flavum)ATCC 14067,谷氨酸棒杆菌(Brevibacterium lactofermentum)ATCC 13869,谷氨酸棒杆菌(Corynebacterium glutamicum)ATCC 13032,谷氨酸棒杆菌(Corynebacterium glutamicum)ATCC 14297,嗜乙酰乙酸棒杆菌(Corynebacterium acetoacidophilum)ATCC 13870,嗜氨微杆菌(Microbacterium ammoniaphilum)ATCC 15354,无花果沙雷氏菌(Serratia ficaria),居泉沙雷氏菌(Serratia fonticola),液化沙雷氏菌(Serratia liquefaciens),粘质沙雷氏菌(Serratiamarcescens),假单胞菌属(Pseudomonas sp.)D-0110,放射形土壤杆菌(Agrobacterium radiobacter),发根土壤杆菌(Agrobacterium rhizogenes),悬钩子土壤杆菌(Agrobacteriumrubi),柱孢鱼腥蓝细菌(Anabaena cylindrica),桶形鱼腥蓝细菌(Anabaena doliolum),水华鱼腥蓝细菌(Anabaena flos-aquae),金黄节杆菌(Arthrobacter aurescens),柠檬节杆菌(Arthrobactercitreus),球形节杆菌(Arthrobacter globformis),Arthrobacterhydrocarboglutamicus,迈索尔节杆菌(Arthrobacter mysorens),烟草节杆菌(Arthrobacter nicotianae),石蜡节杆菌(Arthrobacterparaffineus),原玻璃蝇节杆菌(Arthrobacter protophormiae),玫瑰色石蜡节杆菌(Arthrobacter roseoparaffinus),硫磺节杆菌(Arthrobacter sulfureus),产脲节杆菌(Arthrobacterureafaciens),巴氏着色菌(Chromatium buderi),微温着色菌(Chromatium tepidum),酒色着色菌(Chromatium vinosum),沃氏着色菌(Chromatium warmingii),Chromatium fluviatile,噬夏孢欧文氏菌(Erwinia uredovora),胡萝卜软腐欧文氏菌(Erwiniacarotovora),菠萝泛菌(Erwinia ananas),草生欧文氏菌(Erwiniaherbicola),Erwinia punctata,Erwinia terreus,罗得西亚甲基杆菌(Methylobacterium rhodesianum),扭脱甲基杆菌(Methylobacterium extorquens),席蓝细菌属(Phormidium sp.)ATCC 29409,荚膜红细菌(Rhodobacter capsulatus),Rhodobactersphaeroides,Rhodopseudomonas blastica,海红菌(Rhodopseudomonas marina),血色红假单胞菌(Rhodopseudomonaspalustris),深红红螺菌(Rhodospirillum rubrum),需盐红螺菌(Rhodospirillum salexigens),盐场红螺菌(Rhodospirillumsalinarum),产二素链霉菌(Streptomyces ambofaciens),金霉素链霉菌(Streptomyces aureofaciens),金色链霉菌(Streptomycesaureus),杀真菌素链霉菌(Streptomyces fungicidicus),灰产色链霉菌(Streptomyces griseochromogenes),灰色链霉菌(Streptomyces griseus),浅青紫链霉菌(Streptomyces lividans),橄榄烬灰链霉菌(Streptomyces olivogriseus),枝链霉菌(Streptomyces rameus),田无链霉菌(Streptomycestanashiensis),酒红链霉菌(Streptomyces vinaceus)和运动发酵单孢菌(Zymomonas mobilis)。
可以通过能将DNA导入上述宿主细胞的任何方法进行重组DNA的导入,例如,使用钙离子的方法[Proc.Natl.Acad.Sci.USA, 69,2110(1972)],原生质体方法(日本公开的未审查的专利申请号248394/88)和电穿孔[Nucleic Acids Res., 16,6127(1988)]。
当用酵母菌株作为宿主细胞时,可以使用YEp13(ATCC 37115),YEp24(ATCC 37051),YCp50(ATCC 37419),pHS19,pHS15等作为表达载体。
可以使用能在酵母菌株中发挥作用的任何启动子作为启动子。合适的启动子包括PH05启动子、PGK启动子、GAP启动子、ADH启动子、gal 1启动子、gal 10启动子、热休克多肽启动子、MFα1启动子和CUP 1启动子。
合适的宿主细胞的实例是下列种属的酵母菌株:糖酵母属,裂殖糖酵母属,克鲁维氏酵母属,丝孢酵母属,许旺氏酵母属,毕赤酵母属和假丝酵母属,更具体地,啤酒糖酵母(Saccharomycescerevisiae),粟酒裂殖糖酵母(Schizosaccharomyces pombe),乳克鲁维氏酵母(Kluyveromyces lactis),茁芽丝孢酵母(Trichosporon pullulans),河岸许旺氏酵母(Schwanniomycesalluvius),巴斯德毕赤氏酵母(Pichia pastoris)和产朊假丝酵母(Candida utilis)。
可以通过能将DNA导入酵母的任何方法进行重组DNA的导入,例如,电穿孔[Methods Enzymol., 194,182(1990)],原生质球方法[Proc.Natl.Acad.Sci.USA, 81,4889(1984)]和乙酸锂方法[J.Bacteriol., 153,163(1983)]。
当用动物细胞作为宿主细胞时,可以使用pcDNAI,pcDM8(可以从Funakoshi Co.,Ltd.商业获得),pAGE107(日本公开的未审查的专利申请号22979/91),pAS3-3(日本公开的未审查的专利申请号227075/90),pCDM8[Nature, 329,840(1987)],pcDNAI/Amp(Invitrogen Corp.),pREP4(Invitrogen Corp.),pAGE103[J.Biochem., 101,1307(1987)],pAGE210,pAMo,pAMoA,等作为表达载体。
可以使用能在动物细胞中发挥作用的任何启动子作为启动子。合适的启动子包括:巨细胞病毒(CMV)的IE(立即早期)基因的启动子、SV40早期启动子、金属硫蛋白启动子、逆转录病毒的启动子、热休克启动子、SRα启动子等。人CMV的IE基因的增强子可以与启动子组合使用。
合适的宿主细胞的实例是小鼠骨髓瘤细胞,大鼠骨髓瘤细胞,小鼠杂交瘤细胞,人源的Namalwa细胞和Namalwa KJM-1细胞,人胚肾细胞,人白血病细胞,非洲绿猴肾细胞,中国仓鼠源的CHO细胞,和HBT5637(日本公开的未审查的专利申请号299/88)。
小鼠骨髓瘤细胞包括SP2/0和NSO;大鼠骨髓瘤细胞包括YB2/0;人胚肾细胞包括HEK293(ATCC CRL-1573);人白血病细胞包括BALL-1;非洲绿猴肾细胞包括COS-1和COS-7。
可以通过能将DNA导入动物细胞的任何方法进行重组DNA的导入,例如,电穿孔[Cytotechnology, 3,133(1990)],磷酸钙方法(日本公开的未审查的专利申请号227075/90),脂转染[Proc.Natl.Acad.Sci.USA, 84,7413(1987)],和Virology, 52,456(1973)中描述的方法。
当用昆虫细胞作为宿主细胞时,可以使用BaculovirusExpression Vectors,A Laboratory Manual,W.H.Freeman andCompany,New York(1992);Current Protocols in MolecularBiology;Molecular Biology,A Laboratory Manual;Bio/Technology, 6,47(1988)等所述的方法生产蛋白。
也就是说,将重组基因转移载体和杆状病毒共转染进昆虫细胞中,在昆虫细胞的培养上清液中得到重组病毒,然后用重组病毒感染昆虫细胞,由此可以生产蛋白。
可以用于该方法的基因转移载体包括pVL1392,pVL1393和pBlueBacIII(Invitrogen Corp.的产品)。
杆状病毒的实例是苜蓿银纹夜蛾核型多角体病毒,它是一种能感染Barathra家族的昆虫的病毒。
昆虫细胞的实例是草地夜蛾(Spodoptera frugiperda)的卵巢细胞、银纹夜蛾(Trichoplusia ni)的卵巢细胞和培养的源自蚕卵巢的细胞。
草地夜蛾的卵巢细胞包括Sf9和Sf21(Baculovirus ExpressionVectors,A Laboratory Manual);银纹夜蛾的卵巢细胞包括High 5和BTI-TN-5B1-4(Invitrogen Corp.);培养的源自蚕卵巢的细胞包括家蚕(Bombyx mori)N4。
通过磷酸钙方法(日本公开的未审查的专利申请号227075/90)、脂转染[Proc.Natl.Acad.Sci.USA, 84,7413(1987)]等,可以将上面的重组基因转移载体和上面的杆状病毒共转染进用于制备重组病毒的昆虫细胞中。
当用植物细胞作为宿主细胞时,可以使用Ti质粒、烟草花叶病毒载体等作为表达载体。
可以使用能在植物细胞中发挥作用的任何启动子作为启动子。合适的启动子包括花椰菜花叶病毒(CaMV)的35S启动子、稻肌动蛋白(rice actin)1启动子等。
合适的宿主细胞的实例是烟草、马铃薯、番茄、胡萝卜、大豆、油菜、苜蓿、稻、小麦和大麦等植物的细胞。
可以通过能将DNA导入植物细胞的任何方法进行重组载体的导入,例如,使用土壤杆菌的方法(日本公开的未审查的专利申请号140885/84和70080/85,WO94/00977),电穿孔(日本公开的未审查的专利申请号251887/85)和使用微粒枪(基因枪)的方法(日本专利号2606856和2517813)。
当在酵母、动物细胞、昆虫细胞或植物细胞中表达DNA时,可以得到糖基化的蛋白。
通过在培养基中培养如上得到的转化体、使本发明的蛋白在培养基中形成和积累、并从培养基中回收蛋白,可以生产出本发明的蛋白。
用于生产本发明的蛋白的上述转化体的宿主可以是任意的细菌、酵母、动物细胞、昆虫细胞、植物细胞等,但是优选细菌、更优选埃希氏菌属的微生物、再优选属于大肠杆菌的微生物。
通过用于培养宿主的常规方法,可以在培养基中培养上述的转化体。
为了培养使用原核生物(例如大肠杆菌)或真核生物(例如酵母)作为宿主得到的转化体,可以使用任何天然培养基和合成培养基,只要它是适用于有效培养该转化体的培养基,它含有能被使用的宿主同化的碳源、氮源、无机盐等。
关于碳源,可以使用能被宿主同化的的任何碳源。合适的碳源的实例包括碳水化合物,例如葡萄糖、果糖、蔗糖、含有它们的糖蜜、淀粉和淀粉水解产物;有机酸,例如醋酸和丙酸;和醇类,例如乙醇和丙醇。
关于氮源,可以使用氨、有机酸或无机酸的铵盐,例如氯化铵、硫酸铵、醋酸铵和磷酸铵,和其它的含氮化合物,以及蛋白胨、肉膏、酵母提取物、玉米浆、酪蛋白水解产物、豆饼、豆饼水解产物和各种发酵的微生物细胞和其消化的产物。
无机盐的实例包括磷酸二氢钾、磷酸氢二钾、磷酸镁、硫酸镁、氯化钠、硫酸亚铁、硫酸锰、硫酸铜和碳酸钙。
通常在需氧条件下进行培养,例如通过振荡培养或在通气下的浸没旋转培养。培养温度优选地为15至40℃,培养周期通常是5小时至7天。在培养过程中,将pH维持在3.0至9.0。使用有机酸或无机酸、碱溶液、脲、碳酸钙、氨等进行pH调节。
如果需要,在培养过程中还可以向培养基中加入抗生素,例如氨苄青霉素和四环素。
在培养用含有可诱导的启动子的表达载体转化的微生物时,如果需要,还可以向培养基中加入诱导物。例如,在培养用含有 lac启动子的表达载体转化的微生物的情况下,可以向培养基中加入异丙基-β-D-硫代吡喃型半乳糖苷等;在培养用含有 trp启动子的表达载体转化的微生物的情况下,可以向培养基中加入吲哚丙烯酸等。
为了培养使用动物细胞作为宿主细胞得到的转化体,可以使用常用的培养基,例如RPMI1640培养基[J.Am.Med.Assoc., 199,519(1967)],Eagle’s MEM[Science, 122,501(1952)],DMEM[Virology,8,396(1959)]和199培养基[Proc.Soc.Biol.Med., 73,1(1950)],通过向这些培养基中添加胎牛血清制备的培养基等。
通常在pH6至8、在25至40℃、在存在5%CO2的条件下培养1至7天。
如果需要,在培养过程中可以向培养基中加入抗生素,例如卡那霉素、青霉素和链霉素。
为了培养使用昆虫细胞作为宿主细胞得到的转化体,可以使用常用的培养基,例如TNM-FH培养基(PharMingen,Inc.),Sf-900 II SFM培养基(Life Technologies,Inc.),ExCell 400和ExCell 405(JRHBiosciences,Inc.)和Grace’s昆虫培养基[Nature, 195,788(1962)]。
通常在pH6至7、在25至30℃培养1至5天。
如果需要,在培养过程中可以向培养基中加入抗生素,例如庆大霉素。
使用植物细胞作为宿主细胞得到的转化体可以以原来的细胞形式培养,或者在分化成植物细胞或植物器官后再培养。为了培养这样的转化体,可以使用常用的培养基,例如Murashige-Skoog(MS)培养基和White培养基,通过向这些培养基中加入植物激素制备的培养基,例如生长素和细胞分裂素。
通常在pH5至9、在20至40℃培养3至60天。
如果需要,在培养过程中可以向培养基中加入抗生素,例如卡那霉素和潮霉素。
如上所述,根据常规培养方法,通过培养源自微生物、昆虫细胞、动物细胞或植物细胞的、且携带通过将本发明的DNA或用在本发明的生产方法中的DNA连接到表达载体上而制备的重组DNA的转化体,使蛋白形成和积累,并从培养基中回收蛋白,从而可以生产出本发明的蛋白。
通过宿主细胞的胞内生产、宿主细胞的胞外分泌或在宿主细胞外膜上的生产,可以生产出本发明的蛋白,并且根据选择的方法,能合适地修饰生产的蛋白的结构。
当本发明的蛋白是在宿主细胞内或在宿主细胞的外膜上生产时,可以通过采用下述方法来促使蛋白分泌到宿主细胞外:Paulson等的方法[J.Biol.Chem., 264,17619(1989)],Lowe等的方法[Proc.Natl.Acad.Sci.USA, 86,8227(1989);Genes Develop., 4,1288(1990)],或日本公开的未审查的专利申请号336963/93,WO94/23021等描述的方法。
也就是说,通过重组DNA技术将信号肽添加到了含有本发明的蛋白的活性位点的蛋白的上游,通过以这样的蛋白形式来生产它,可以使宿主细胞细胞外地分泌本发明的蛋白。
根据日本公开的未审查的专利申请号227075/90所述的方法,利用使用二氢叶酸还原酶基因等的基因放大系统,还可以提高蛋白的生产。
而且,可以使用通过再分化含有导入的基因的动物细胞或植物细胞生成的含有导入的基因的动物(非人类的转基因动物)或含有导入的基因的植物(转基因植物)来生产本发明的蛋白。
当能生产本发明的蛋白的转化体是动物或植物时,可以如下生产蛋白:以通常方式饲养或培养动物或植物,使蛋白在其中形成和积累,并从该动物或植物回收蛋白。
可以使用动物生产本发明的蛋白,例如,根据已知的方法[Am.J.Clin.Nutr., 63,639S(1996);Am.J.Clin.Nutr., 63,627S(1996);Bio/Technology, 9,830(1991)],在通过导入基因构建的动物中生产蛋白。
在动物的情况下,可以生产本发明的蛋白,例如通过饲养携带导入的本发明的DNA或用在本发明的生产方法中的DNA的非人类的转基因动物,使蛋白在动物中形成和积累,并从该动物回收蛋白。蛋白形成和积累的地方包括动物的奶(日本公开的未审查的专利申请号309192/88)、蛋等。关于该方法中的启动子,可以使用能在动物中发挥作用的任何启动子。优选的启动子包括乳腺细胞特异性的启动子,例如α酪蛋白启动子、β酪蛋白启动子、β乳球蛋白启动子和乳清酸性蛋白启动子。
可以使用植物生产本发明的蛋白,例如,根据已知的方法[SoshikiBaiyo(Tissue Culture), 20(1994);Soshiki Baiyo, 21(1995);Trends Biotechnol., 15,45(1997)],通过培养携带着导入的能编码本发明的蛋白的DNA的转基因植物,使蛋白在植物中形成和积累,并从该植物回收蛋白。通过本领域的普通技术人员已知的方法,也可以将组织特异性的启动子用于植物生产。
通过用于分离和纯化酶的常规方法,可以分离和纯化使用能生产本发明的蛋白的转化体生产的本发明的蛋白。
例如,当在细胞中以可溶形式生产本发明的蛋白时,可以在完成培养后通过离心收集细胞,并悬浮到水性缓冲液中,随后使用超声波仪、弗氏压碎器(French press)、Manton Gaulin匀浆机,Dynomill等进行破碎,以得到无细胞的提取物。
可以如下得到纯化的蛋白制品:离心无细胞的提取物,得到上清液,然后对上清液进行普通的分离和纯化酶的方法,例如单独地或组合地用溶剂提取,用硫酸铵等盐析,脱盐,用有机溶剂沉淀,使用树脂进行阴离子交换色谱,例如二乙基氨基乙基(DEAE)-Sepharose和DIAION HPA-75(Mitsubishi Chemical Corporation),使用树脂进行阳离子交换色谱,例如S-Sepharose FF(Pharmacia),使用树脂进行疏水色谱,例如丁基Sepharose和苯基Sepharose,使用分子筛进行凝胶过滤,亲合色谱,色谱聚焦,和电泳例如等电聚焦。
当蛋白是作为包涵体在细胞中生产时,类似地回收和破碎细胞,然后进行离心,得到沉淀部分。通过常规方法从沉淀中回收蛋白后,用蛋白变性剂溶解蛋白的包涵体。
用不含有蛋白变性剂的溶液、或含有低浓度的不会造成蛋白变性的蛋白变性剂的溶液,稀释或渗析溶解的蛋白溶液,由此使蛋白复性,具有正常的高级结构。然后,通过上述的相同的分离和纯化步骤可以得到纯化的蛋白制品。
当细胞外地分泌本发明的蛋白或其衍生物(例如糖基化形式)时,可以从培养上清液中回收蛋白或其衍生物(例如糖基化形式)。
也就是说,通过上述的相同方法(例如离心)处理培养物,得到可溶的部分。使用上述的相同的分离和纯化方法,可以从可溶的部分得到纯化的蛋白制品。
以上述方式得到的蛋白的实例是分别由SEQ ID NO:1至8所示的氨基酸序列组成的蛋白。
还可以作为与另一种蛋白的融合蛋白来生产本发明的蛋白,使用对融合蛋白具有亲合力的物质,通过亲合色谱进行纯化。例如,根据Lowe等的方法[Proc.Natl.Acad.Sci.USA, 86,8227(1989);GenesDevelop., 4,1288(1990)]和日本公开的未审查的专利申请号336963/93和WO94/23021所述的方法,本发明的蛋白可以作为与蛋白A的融合蛋白来生产,且可以通过使用免疫球蛋白G的亲合色谱进行纯化。
而且,可以作为与标记(Flag)肽的融合蛋白来生产本发明的蛋白,使用抗-标记的抗体,通过亲合色谱进行纯化[Proc.Natl.Acad.Sci.USA, 86,8227(1989);Genes Develop., 4,1288(1990)]。还可以使用针对所述蛋白的抗体,通过亲合色谱纯化该蛋白。
基于上面得到的蛋白的氨基酸序列信息,还可以通过化学合成方法来生产本发明的蛋白,例如Fmoc方法(芴基甲氧基羰基方法)和tBoc方法(叔丁氧基羰基方法)。而且,还可以使用来自Advanced ChemTech,Perkin-Elmer,Pharmacia,Protein Technology Instrument,Synthecell-Vega,PerSeptive,Shimadzu Corporation等的肽合成仪,化学合成本发明的蛋白。
(iii)生产本发明的二肽的方法
(1)酶方法
生产二肽的酶方法的一个实例是这样的方法,其包括:使本发明的蛋白、至少2个可以相同或不同的氨基酸和ATP存在于水性介质中;使式(I)所示的二肽在介质中形成和积累;和从介质中回收二肽。
在上述方法中用作底物的至少2个氨基酸、优选一种或两种氨基酸选自:氨基酸,优选L-氨基酸,甘氨酸(Gly)和β-丙氨酸(β-Ala),且可以任意组合地使用,除了使用L-丙氨酸作为一种氨基酸之外。L-氨基酸的实例是L-丙氨酸(L-Ala),L-谷氨酰胺(L-Gln),L-谷氨酸(L-Glu),L-缬氨酸(L-Val),L-亮氨酸(L-Leu),L-异亮氨酸(L-Ile),L-脯氨酸(L-Pro),L-苯丙氨酸(L-Phe),L-色氨酸(L-Trp),L-甲硫氨酸(L-Met),L-丝氨酸(L-Ser),L-苏氨酸(L-Thr),L-半胱氨酸(L-Cys),L-天冬酰胺(L-Asn),L-酪氨酸(L-Tyr),L-赖氨酸(L-Lys),L-精氨酸(L-Arg),L-组氨酸(L-His),L-天门冬氨酸(L-Asp),L-α-氨基丁酸(L-α-AB),L-重氮丝氨酸,L-茶氨酸,L-4-羟基脯氨酸(L-4-HYP),L-3-羟基脯氨酸(L-3-HYP),L-鸟氨酸(L-Orn),L-瓜氨酸(L-Cit)和L-6-重氮-5-氧-正亮氨酸。
在上面方法中更优选地使用的氨基酸包括下面的:组合中的一种氨基酸选自L-Ala,Gly,L-Met,L-Ser,L-Thr和β-Ala,且另一种氨基酸选自L-Ala,L-Gln,L-Glu,Gly,L-Val,L-Leu,L-Ile,L-Pro,L-Phe,L-Trp,L-Met,L-Ser,L-Thr,L-Cys,L-Asn,L-Tyr,L-Lys,L-Arg,L-His,L-Asp,L-α-AB,β-Ala,L-重氮丝氨酸,L-茶氨酸,L-4-HYP,L-3-HYP,L-Orn,L-Cit和L-6-重氮-5-氧-正亮氨酸(不包括L-Ala和L-Ala的组合);L-Gln和L-Phe的组合;L-α-AB和L-Gln,L-Arg或L-α-AB的组合。再优选的氨基酸是:L-Ala和一种选自L-Gln,Gly,L-Val,L-Leu,L-Ile,L-Phe,L-Trp,L-Met,L-Ser,L-Thr,L-Cys,L-Asn,L-Tyr,L-Lys,L-Arg,L-His,L-α-AB,L-重氮丝氨酸,L-Cit和L-茶氨酸的氨基酸的组合;Gly和一种选自L-Gln,Gly,L-Phe,L-Trp,L-Met,L-Ser,L-Thr,L-Cys,L-Tyr,L-Lys,L-Arg,L-α-AB和L-Cit的氨基酸的组合;L-Met和一种选自L-Phe,L-Met,L-Ser,L-Thr,L-Cys,L-Tyr,L-Lys和L-His的氨基酸的组合;L-Ser和一种选自L-Gln,L-Phe,L-Ser,L-Thr,L-Tyr,L-His和L-α-AB的氨基酸的组合;L-Thr和一种选自L-Gln,L-Phe,L-Leu,L-Thr和L-α-AB的氨基酸的组合;L-Gln和L-Phe的组合;β-Ala和一种选自L-Phe,L-Met,L-His和L-Cit的氨基酸的组合;以及L-α-AB和L-Gln、L-Arg或L-α-AB的组合。
在上面的方法中,对于每mg用作底物的氨基酸,本发明的蛋白的加入量为0.01至100mg、优选0.1至10mg。
在上面的方法中,用作底物的氨基酸是在开始时或者在反应过程中加入水性介质中,产生0.1至500g/l、优选0.2至200g/l的浓度。
在上面的方法中,以0.5mmol至10mol/l的终浓度使用用作能源的ATP。
在上面的方法中使用的水性介质可以含有任意的组分,且可以具有任意的组成,只要不抑制二肽形成反应即可。合适的水性介质包括水和缓冲液,例如磷酸盐缓冲液、碳酸盐缓冲液、醋酸盐缓冲液、硼酸盐缓冲液、柠檬酸盐缓冲液和Tris缓冲液。水性介质可以含有醇类例如甲醇和乙醇,酯类例如醋酸乙酯,酮类例如丙酮,和酰胺类例如乙酰胺。
二肽形成反应是在水性介质中、在pH5至11、优选pH6至10、在20至50℃、优选25至45℃进行2至150小时、优选6至120小时。
通过上面的方法生产的二肽包含式(I)代表的二肽。优选的二肽是式(I)代表的那些,其中R1和R2可以相同或不同,每个代表选自L-Ala,L-Gln,L-Glu,Gly,L-Val,L-Leu,L-Ile,L-Pro,L-Phe,L-Trp,L-Met,L-Ser,L-Thr,L-Cys,L-Asn,L-Tyr,L-Lys,L-Arg,L-His,L-Asp,L-α-AB,β-Ala,L-重氮丝氨酸,L-茶氨酸,L-4-HYP,L-3-HYP,L-Orn,L-Cit和L-6-重氮-5-氧-正亮氨酸的氨基酸(不包括其中R1和R2同时是L-Ala)。更优选的是这样的二肽,其中R1是L-Ala,Gly,L-Met,L-Ser,L-Thr或β-Ala,且R2是L-Gln,L-Glu,Gly,L-Val,L-Leu,L-Ile,L-Pro,L-Phe,L-Trp,L-Met,L-Ser,L-Thr,L-Cys,L-Asn,L-Tyr,L-Lys,L-Arg,L-His,L-Asp,L-α-AB,β-Ala,L-重氮丝氨酸,L-茶氨酸,L-4-HYP,L-3-HYP,L-Orn,L-Cit或L-6-重氮-5-氧-正亮氨酸。再优选的二肽是:二肽,其中R1是L-Ala,且R2是L-Gln,Gly,L-Val,L-Leu,L-Ile,L-Phe,L-Trp,L-Met,L-Ser,L-Thr,L-Cys,L-Asn,L-Tyr,L-Lys,L-Arg,L-His,L-α-AB,L-重氮丝氨酸,L-茶氨酸或L-Cit;二肽,其中R1是Gly,且R2是L-Gln,Gly,L-Phe,L-Trp,L-Met,L-Ser,L-Thr,L-Cys,L-Tyr,L-Lys,L-Arg,L-α-AB或L-Cit;二肽,其中R1是L-Met,且R2是L-Phe,L-Met,L-Cys,L-Tyr,L-Lys或L-His;二肽,其中R1是L-Ser,且R2是L-Gln,Gly,L-Phe,L-Met,L-Ser,L-Thr,L-Tyr,L-His或L-α-AB;二肽,其中R1是L-Thr,且R2是L-Gln,L-Leu,L-Phe,L-Met,L-Ser,L-Thr或L-α-AB;二肽,其中R1是L-Gln,且R2是L-Phe或L-α-AB;二肽,其中R1是L-Phe,且R2是L-Gln;二肽,其中R1是L-Trp,且R2是Gly;二肽,其中R1是L-Cys,且R2是L-Ala,L-Gln,Gly或L-Met;二肽,其中R1是L-Lys,且R2是L-Ala,Gly或L-Met;二肽,其中R1是β-Ala,且R2是L-Phe,L-Met或L-His;二肽,其中R1是L-Arg,且R2是L-α-AB;二肽,其中R1是L-His,且R2是L-Met;和二肽,其中R1是L-α-AB,且R2是L-Ala,L-Gln,Gly,L-Ser,L-Thr,L-Arg或L-α-AB.
(2)使用转化体或微生物的培养物、或处理过的培养物作为酶源的方法
使用转化体或微生物的培养物、或处理过的培养物作为酶源生产二肽的方法的一个实例是这样的方法,其包括:使酶源和至少2个可以相同或不同的氨基酸存在于水性介质中,所述的酶源是能生产本发明的蛋白的转化体的培养物、或能生产本发明的蛋白的微生物或处理过的所述培养物;使式(I)所示的二肽在培养基中形成和积累;和从培养基中回收二肽。
用于上述方法的转化体包括能生产本发明的蛋白的转化体,其可以通过上面(ii)的方法生产。可以使用细菌、酵母、动物细胞、昆虫细胞、植物细胞等作为转化体的宿主。优选的宿主是细菌,其中更优选埃希氏菌属、芽孢杆菌属和棒状杆菌属的微生物。
优选的埃希氏菌属的微生物包括大肠杆菌:优选的芽孢杆菌属微生物包括杆草芽孢杆菌和巨大芽孢杆菌;和优选的棒状杆菌属微生物包括谷氨酸棒杆菌和产氨短杆菌。
在上面方法中使用的微生物可以是能生产本发明的蛋白的任何微生物,但是优选地为芽孢杆菌属微生物,更优选具有芽孢杆菌溶素合成能力的芽孢杆菌属微生物,再优选选自下列种属的微生物:杆草芽孢杆菌,解淀粉芽孢杆菌,凝结芽孢杆菌,地衣芽胞杆菌,巨大芽孢杆菌和短小芽孢杆菌,最优选选自下列的菌株:杆草芽孢杆菌ATCC15245,杆草芽孢杆菌ATCC 6633,杆草芽孢杆菌IAM 1213,杆草芽孢杆菌IAM 1107,杆草芽孢杆菌IAM 1214,杆草芽孢杆菌ATCC 9466,杆草芽孢杆菌IAM 1033,杆草芽孢杆菌ATCC 21555,解淀粉芽孢杆菌IFO 3022和短小芽孢杆菌NRRL B-12025。
处理过的培养物包括浓缩的培养物、干燥的培养物、通过离心培养物得到的细胞、通过提取细胞得到的酶制品或通过各种方法处理细胞得到的产物,例如干燥,冻干,用表面活性剂、超声破碎、机械摩擦处理,用溶剂处理,酶处理,蛋白分级和固定化。
在上面的方法中,用作底物的氨基酸的种类、它们的浓度、它们的添加时间、生产的二肽与在上面(iii)(1)所述的酶方法中的类似。
在使用微生物的培养物或处理过的所述培养物作为酶源的方法中,除了在上面(iii)(1)所述的酶方法中使用的水性介质外,还可以使用用作酶源的转化体或微生物的培养物作为水性介质。
而且,在上面的方法中,可以根据需要向水性介质中加入ATP或能被转化体或微生物代谢产生ATP的化合物作为ATP源,例如,糖类例如葡萄糖,醇类例如乙醇,和有机酸例如醋酸。
如果需要,还可以向水性介质中加入表面活性剂或有机溶剂。可以使用能促进二肽形成的任何表面活性剂。合适的表面活性剂包括:非离子的表面活性剂例如聚氧乙烯十八烷基胺(例如Nymeen S-215,NOF Corporation),阳离子表面活性剂例如溴化十六烷基三甲基铵和烷基二甲基苄基氯化铵(例如Cation F2-40E,NOF Corporation),阳离子表面活性剂例如月桂酰肌氨酸盐,和叔胺例如烷基二甲胺(例如Tertiary Amine FB,NOF Corporation),它们可以单独使用或组合使用。表面活性剂通常以0.1至50g/l的浓度使用。关于有机溶剂,通常以0.1至50ml/l的浓度使用二甲苯、甲苯、脂族醇、丙酮、醋酸乙酯等。
当使用培养物或处理过的培养物作为酶源时,根据其具体活性等改变要添加的酶源的量,但是,其量例如为5至1000mg(湿细胞重)、优选10至400mg/mg用作底物的氨基酸。
二肽形成反应是在水性介质中、在pH5至11、优选pH6至10、在20至65℃、优选25至55℃、更优选30至45℃进行1分钟至150小时、优选3分钟至120小时、更优选30分钟至100小时。
在上面(iii)(1)和(2)所述的方法中,使用活性炭、离子交换树脂等,或通过有机溶剂提取、结晶、薄层色谱和高效液相色谱等方法,可以通过普通方法回收在水性介质中形成和积累的二肽,
在下面的实施例中解释了本发明的某些实施方案。这些实施例不用于限制本发明的范围。
实施例1
使用数据库搜索具有二肽合成活性的蛋白
使用源自杆草芽孢杆菌168[Nature, 390,249-256(1997)]的D-Ala-D-Ala连接酶基因的氨基酸序列作为查询序列,使用杆草芽孢杆菌168的基因组DNA的数据库Subtilist(http://genolist.pasteur.fr/SubtiList/)的相似性检索功能,搜索杆草芽孢杆菌168的基因组DNA序列中存在的编码具有相似性的蛋白的基因。
从作为检索结果得到的序列中,排除了能编码如SEQ ID NO:33、34和35所示的D-Ala-D-Ala连接酶基序[Biochemistry, 30,1673(1991)]的氨基酸序列的基因,这些基因编码已经清楚其功能的蛋白。在剩余的序列中,选择了与D-Ala-D-Ala连接酶基序具有最高相似性(29.1%)的序列作为已知功能的基因 ywfE
ywfE的核苷酸序列如SEQ ID NO:9所示,该核苷酸序列编码的蛋白的氨基酸序列如SEQ ID NO:1所示。
实施例2
能表达 ywfE基因的菌株的构建
在实施例1得到的核苷酸序列信息的基础上,以下述方式得到了杆草芽孢杆菌的 ywfE基因片段。
也就是说,将杆草芽孢杆菌168接种到LB培养基中[10g/l Bacto胰蛋白胨(Difco),5g/l酵母提取物(Difco)和5g/l氯化钠],在30℃静置培养过夜。培养后,根据使用Current Protocols inMolecular Biology所述的饱和苯酚的方法,分离和纯化微生物的染色体DNA。
使用DNA合成仪(Model 8905,PerSeptive Biosystems,Inc.),合成了具有SEQ ID NO:19至22所示的核苷酸序列的DNA(以下分别简称为引物A,引物B,引物C和引物D)。引物A具有这样的序列,其中含有 XhoI识别序列的核苷酸序列被添加到了含有 ywfE的起始密码子的杆草芽孢杆菌染色体DNA区的5’末端。引物B具有这样的序列,其中含有 BamHI识别序列的核苷酸序列被添加到了与含有 ywfE的终止密码子的序列互补的核苷酸序列的5’末端。引物C具有这样的序列,其中含有 EcoRI识别序列的核苷酸序列被添加到了含有 trp启动子[从大肠杆菌JM109/pTrS30(FERM BP-5407)制备]的表达载体pTrS30的trp启动子区的核苷酸序列的5’末端区。引物D具有这样的序列,其中含有 XhoI识别序列的核苷酸序列被添加到了与含有 trp启动子的表达载体pTrS30的 trp启动子区的序列互补的序列的5’末端区。
使用上述的引物A和引物B,使用杆草芽孢杆菌的染色体DNA作为模板,通过PCR扩增了 ywfE基因片段。使用引物C和引物D,使用pTrS30作为模板,通过PCR扩增了 trp启动子区片段。PCR进行了30个循环,一个循环包括:在94℃反应1分钟,在55℃反应2分钟,在72℃反应3分钟,使用的40μl反应混合物含有作为模板的01μg染色体DNA或10ng pTrS30、0.5μmol/l每种引物、2.5单位的 PfuDNA聚合酶(Stratagene)、4μl  Pfu DNA聚合酶的缓冲液(10x)(Stratagene)和200μmol/l每种dNTP(dATP,dGTP,dCTP和dTTP)。
对得到的每种反应混合物的十分之一进行琼脂糖凝胶电泳,以确信在使用引物A和引物B的PCR中和在使用引物C和引物D的PCR中分别扩增了与 ywfE基因片段相对应的约1.4kb DNA片段和与 trp启动子区片段相对应的约0.3kb DNA片段。然后,将剩余的混合物与等量的以TE[10mmol/l Tris-HCl(pH8.0),1mmol/l EDTA]饱和的苯酚/氯仿(1体积/1体积)相混合。离心得到的溶液,将得到的上层与2倍体积的冷乙醇混合,在-80℃静置30分钟。离心得到的溶液以沉淀DNA,将得到的DNA溶解到20μl TE中。
对这样得到的溶液(每次5μl)分别进行下述反应:使用限制酶XhoI和 BamHI剪切用引物A和引物B扩增的DNA,和使用限制酶 EcoRI和 XhoI剪切用引物C和引物D扩增的DNA。通过琼脂糖凝胶电泳分离DNA片段,并使用GENECLEAN II试剂盒(BIO 101)分别回收含有 ywfE 1.4kb片段和含有 trp启动子区的0.3kb片段。
使用限制酶 EcoRI和 BamHI剪切了pTrs30[从大肠杆菌JM109/pTrS30(FERM BP-5407)制备的含有 trp启动子的表达载体,0.2μg]。通过琼脂糖凝胶电泳分离DNA片段,以与上面相同的方式回收4.5kbDNA片段。
使用连接试剂盒(Takara Shuzo Co.,Ltd.),使上面得到的含有ywfE的1.4kb片段、含有 trp启动子区的0.3kb片段和4.5kb DNA片段在16℃进行连接反应16小时。
根据使用钙离子的方法[Proc.Natl.Acad.Sci.USA, 69,2110(1972)],使用反应混合物转化了大肠杆菌NM522(Stratagene),涂布在含有50μg/ml氨苄青霉素的LB琼脂培养基上,在30℃培养过夜。
根据已知的方法,从在该培养基上生长的转化体菌落提取质粒,使用限制酶分析了质粒的结构,由此确认得到了表达载体pPE43,其含有连接在 trp启动子下游的 ywfE(图1)。
实施例3
二肽的生产
将在实施例2得到的携带pPE43的大肠杆菌NM522(大肠杆菌NM522/pPE43)接种到装在大试管中的含有50μg/ml氨苄青霉素的8ml LB培养基中,在28℃培养17小时。离心得到的培养物,得到湿细胞。
制备了包含60mg/ml(终浓度)湿细胞、120mmol/l磷酸钾缓冲液(pH7.4)、60mmol/l氯化镁、60mmol/l ATP、30mmol/l L-Ala、30mmol/l L-Gln和0.4% Nymeen S-215的反应混合物(0.1ml),在37℃反应3分钟。
反应结束后,通过二硝基酚方法衍生化反应产物,然后通过HPLC分析。使用Lichrosorb-RP-18柱(Kanto Kagaku)作为分离柱、1%(v/v)磷酸和25%(v/v)乙腈作为洗脱剂,以0.7ml/min的流速,进行了HPLC分析。结果,确认在反应混合物中形成和积累了120mg/l L-丙氨酰基-L-谷氨酰胺(L-Ala-L-Gln)。
当使用仅携带载体的对照菌大肠杆菌NM522/pTrS31细胞进行反应时,没有观察到L-Ala-L-Gln的形成。
实施例4
C-末端His-标记的重组二肽合成酶的纯化
使用上面的DNA合成仪,合成了具有SEQ ID NO:23和24所示的核苷酸序列的DNA(以下分别简称为引物E和引物F)。引物E具有含有这样的区域的核苷酸序列,其中 ywfE起始密码子(atg)被取代为NcoI识别序列(cc atgg)。引物F具有含有这样的区域的核苷酸序列,其中 ywfE终止密码子被取代为 BamHI识别序列( ggatcc)。
使用杆草芽孢杆菌168(ATCC 23857)的染色体DNA作为模板、上面的引物E和引物F作为一组引物,进行了PCR。也就是说,PCR进行了30个循环,一个循环包括:在94℃反应1分钟,在55℃反应2分钟,在72℃反应3分钟,使用的40μl反应混合物含有0.1μg染色体DNA、0.5μmol/l每种引物、2.5单位的 Pfu DNA聚合酶、4μl  PfuDNA聚合酶的缓冲液(10x)和200μmol/l每种dNTP。
对得到的反应混合物的十分之一进行琼脂糖凝胶电泳,以确信扩增了与 ywfE片段相对应的约1.4kb片段。然后,将剩余的混合物与等量的以TE饱和的苯酚/氯仿相混合。离心得到的溶液,将得到的上层与2倍体积的冷乙醇混合,在-80℃静置30分钟。离心得到的溶液,将得到的DNA沉淀溶解到20μl TE中。
对这样得到的溶液(5μl)使用限制酶 NcoI和 BamHI剪切扩增的DNA。通过琼脂糖凝胶电泳分离DNA片段,并使用GENECLEAN II试剂盒回收含有 ywfE的1.4kb DNA片段。
使用限制酶NcoI和 BamHI剪切了C-末端His-标记的重组表达载体pQE60(Qiagen,Inc.)(0.2μg)。通过琼脂糖凝胶电泳分离DNA片段,以与上面相同的方式回收3.4kb DNA片段。
使用连接试剂盒,使上面得到的含有 ywfE的1.4kb DNA片段和3.4kb DNA片段在16℃连接反应16小时。
根据使用钙离子的方法,使用连接反应混合物转化了大肠杆菌NM522,涂布在含有50μg/ml氨苄青霉素的LB琼脂培养基上,在30℃培养过夜。
根据已知的方法,从在该培养基上生长的转化体菌落提取质粒,使用限制酶分析了质粒的结构,由此确认得到了pQE60ywfE,它是C-末端His-标记的 ywfE表达载体(图2)。
将携带pQE60ywfE的大肠杆菌NM522(大肠杆菌NM522/pQE60ywfE)接种到装在大试管中的含有50μg/ml氨苄青霉素的8ml LB培养基中,在28℃培养17小时。将得到的培养物接种到装在250-ml锥形瓶中的含有50μg/ml氨苄青霉素的50ml LB培养基中,在30℃培养3小时。然后,加入异丙基-β-D-硫代吡喃型半乳糖苷(IPTG),得到1mmol/l的终浓度,随后进一步在30℃培养4小时。离心得到的培养物,以得到湿细胞,使用HisTrap(His-标记的蛋白纯化试剂盒,AmershamPharmacia Biotech),根据所附的说明书,从湿细胞纯化His-标记的重组酶。
实施例5
使用His-标记的重组酶(1)生产二肽
(i)制备了含有0.04mg在实施例4中得到的纯化的His-标记的重组酶、100mmol/l Tris-HCl(pH8.0)、60mmol/l氯化镁、60mmol/lATP、30mmol/l L-Ala和30mmol/l L-Gln的反应混合物(0.1ml),在37℃反应16小时。
反应结束后,以与上面实施例3相同的方式分析了反应产物,由此确信在反应混合物中形成和积累了3.7g/l L-Ala-L-Gln和0.3g/lL-丙氨酰基-L-丙氨酸(L-Ala-L-Ala)。
(ii)使用与上面(i)的反应混合物相同组成的反应混合物,但是使用0.01mg酶、并分别用L-Phe、L-Met、L-Leu和L-Val代替L-Gln,在与上面(i)相同的条件下进行了反应。
反应结束后,以与上面实施例3相同的方式分析了反应产物,由此确信在各反应混合物中形成和积累了下面的二肽:7.0g/l单独的L-丙氨酰基-L-苯丙氨酸(L-Ala-L-Phe);7.0g/l L-丙氨酰基-L-甲硫氨酸(L-Ala-L-Met)和0.03g/l L-Ala-L-Ala;5.0g/l L-丙氨酰基-L-亮氨酸(L-Ala-L-Leu)和0.2g/l L-Ala-L-Ala;和1.6g/l L-丙氨酰基-L-缬氨酸(L-Ala-L-Val)和0.3g/l L-Ala-L-Ala。
(iii)使用与上面(i)的反应混合物相同组成的反应混合物,但是使用0.01mg酶、并用Gly代替L-Ala、用L-Phe和L-Met分别代替L-Gln,在与上面(i)相同的条件下进行了反应。
反应结束后,以与上面实施例3相同的方式分析了反应产物,由此确信在各反应混合物中形成和积累了5.2g/l甘氨酰基-L-苯丙氨酸(Gly-L-Phe)和1.1g/l甘氨酰基-L-甲硫氨酸(Gly-L-Met)。
当上面的反应混合物的组成不包括ATP时,没有形成二肽。
上面的结果表明,在存在ATP时, ywfE基因产物具有生产下述二肽的活性:从L-Ala+L-Gln,L-Phe,L-Met,L-Leu或L-Val合成L-Ala-L-Gln+L-Ala-L-Ala,L-Ala-L-Phe,L-Ala-L-Met+L-Ala-L-Ala,L-Ala-L-Leu+L-Ala-L-Ala,或L-Ala-L-Val+L-Ala-L-Ala;以及从Gly+L-Phe或L-Met合成Gly-L-Phe或Gly-L-Met。
实施例6
使用His-标记的重组酶(2)生产二肽
制备了含有0.04mg在实施例4中得到的纯化的His-标记的重组酶、100mmol/l Tris-HCl(pH8.0)、60mmol/l氯化镁和60mmol/lATP的反应混合物(0.1ml)。向该混合物中分别加入表1第一行所示的L-氨基酸、Gly或β-Ala和表1最左一列所示的L-氨基酸、Gly或β-Ala的组合,产生30mmol/l每种氨基酸的浓度,使得到的混合物在37℃反应16小时。反应结束后,通过HPLC分析了反应产物,由此确信形成了表1所示的二肽。
表1-1
Figure A20038010485000421
表1-2
表1-3
在表的各单元格中显示了使用表1的第1行和最左一列所示的2(或1)种L-氨基酸、Gly或β-Ala作为底物形成的二肽。在表中,○表示形成了二肽,但是未鉴别其序列;×表示没有确定形成了二肽;空格表示没有进行反应。
实施例7
使用能表达His-标记的重组酶的菌株生产二肽
将在实施例4得到的大肠杆菌NM522/pQE60ywfE接种到装在大试管中的含有50μg/ml氨苄青霉素的8ml LB培养基中,在28℃培养17小时。将得到的培养物接种到装在250-ml锥形瓶中的含有50μg/ml氨苄青霉素的50ml LB培养基中,在30℃培养3小时。然后,加入异丙基-β-D-硫代吡喃型半乳糖苷(IPTG),得到1mmol/l的终浓度,随后进一步在30℃培养4小时。离心得到的培养物,以得到湿细胞。
将包含200g/l湿细胞、50g/l葡萄糖、5g/l植酸(用33%浓氢氧化钠溶液稀释至中性)、15g/l磷酸二氢钾、5g/l硫酸镁七水合物、4g/l Nymeen S-215、10ml/l二甲苯、200mmol/l L-Ala和200mmol/l L-Gln的反应混合物(20ml,pH7.2)置于50-ml烧杯中,在32℃、900rpm反应2小时。在反应过程中,使用2mol/l氢氧化钾将反应混合物的pH维持在7.2。
以与上面实施例3相同的方法分析了反应产物,由此确信积累了25mg/l L-Ala-L-Gln。
实施例8
从芽孢杆菌属的各种微生物克隆与 ywfE基基因相对应的基因并分析
在SEQ ID NO:9所示的核苷酸序列的基础上,以下述方式得到了存在于杆草芽孢杆菌ATCC 15245、ATCC 6633、IAM 1213、IAM 1107、IAM 1214、ATCC 9466、IAM 1033和ATCC 21555、解淀粉芽孢杆菌IFO3022和短小芽孢杆菌NRRL B-12025中的与 ywfE基因相对应的基因。
也就是说,将杆草芽孢杆菌ATCC 15245、ATCC 6633、IAM 1213、IAM 1107、IAM 1214、ATCC 9466、IAM 1033和ATCC 21555、解淀粉芽孢杆菌IFO 3022和短小芽孢杆菌NRRL B-12025分别接种到LB培养基中,在30℃静置培养过夜。培养后,根据使用Current Protocolsin Molecular Biology所述的饱和苯酚的方法,分离和纯化各微生物的染色体DNA。
使用DNA合成仪(Model 8905,PerSeptive Biosystems,Inc.),合成了具有SEQ ID NO:25和26所示的核苷酸序列的DNA(以下分别简称为引物G和引物H)。引物G具有这样的序列,其中含有位于杆草芽孢杆菌168的染色体DNA的 ywfE的起始密码子上游的区域,引物H具有这样的序列,其与含有位于 ywfE的终止密码子下游的区域的序列互补。
使用杆草芽孢杆菌ATCC 15245、ATCC 6633、IAM 1213、IAM 1107、IAM 1214、ATCC 9466、IAM 1033和ATCC 21555和解淀粉芽孢杆菌IFO 3022的染色体DNA中的每一个作为模板,使用上面的引物G和引物H作为一组引物,进行了PCR。也就是说,PCR进行了30个循环,一个循环包括:在94℃反应1分钟,在55℃反应2分钟,在72℃反应3分钟,使用的40μl反应混合物含有0.1μg染色体DNA、0.5μmol/l每种引物、2.5单位的 Pfu DNA聚合酶、4μl  Pfu DNA聚合酶的缓冲液(10x)和200μmol/l每种dNTP。
对得到的每种反应混合物的十分之一进行琼脂糖凝胶电泳,以确信扩增了与 ywfE片段相对应的约1.4kb片段。然后,将剩余的混合物与等量的以TE饱和的苯酚/氯仿相混合。离心得到的溶液,将得到的上层与2倍体积的冷乙醇混合,在-80℃静置30分钟。离心得到的溶液,将得到的DNA沉淀溶解到20μl TE中。
对这样得到的每种源自各菌株的染色体DNA的1.4kb DNA片段和pCR-blunt(Invitrogen Corp.),使用连接试剂盒在16℃进行连接反应16小时。
根据使用钙离子的方法,使用每种连接反应混合物转化了大肠杆菌NM522,涂布在含有50μg/ml氨苄青霉素的LB琼脂培养基上,在30℃培养过夜。
根据已知的方法,从在该培养基上生长的每种转化体菌落提取质粒,使用限制酶分析了质粒的结构,结果,确认得到了下述质粒,它们含有与 ywfE基因相对应的基因:pYWFE1(源自ATCC 15245(SEQ IDNO:36)),pYWFE2(源自ATCC 6633(SEQ ID NO:10)),pYWFE3(源自IAM 1213(SEQ ID NO:11)),pYWFE4(源自IAM 1107(SEQ ID NO:12)),pYWFE5(源自IAM 1214(SEQ ID NO:13)),pYWFE6(源自ATCC9466),pYWFE7(源自IAM 1033(SEQ ID NO:36)),pYWFE8(源自ATCC21555(SEQ ID NO:14))和pYWFE9(源自IFO 3022(SEQ ID NO:15))。
另一方面,以下述方式得到与源自短小芽孢杆菌NRRL B-12025(SEQ ID NO:16)的 ywfE相对应的基因。
使用上面制备的NRRL B-12025菌株的染色体DNA作为模板、分别由SEQ ID NO:27和28所示的核苷酸序列组成的DNA作为一组引物,进行了PCR。也就是说,PCR进行了30个循环,一个循环包括:在98℃反应5秒,在55℃反应30秒,在72℃反应1分钟,使用的50μl反应混合物含有0.1μg染色体DNA、0.5μmol/l每种引物、2.5单位的Z-taq聚合酶(Takara Shuzo Co.,Ltd.)、5μl Z-taq聚合酶的缓冲液(10x)(Takara Shuzo Co.,Ltd.)和200μmol/l每种dNTP。
对得到的反应混合物的十分之一进行琼脂糖凝胶电泳,以确信扩增了大约0.8kb片段。然后,将剩余的反应混合物与等量的以TE饱和的苯酚/氯仿相混合。离心得到的混合物,将得到的上层与2倍体积的冷乙醇混合,在-80℃静置30分钟。离心得到的溶液,将得到的DNA沉淀溶解到20μl TE中。
对这样得到的源自染色体DNA的0.8kb片段和pGEM T-easy(Promega Corp.),使用连接试剂盒在16℃进行连接反应16小时。
根据使用钙离子的方法,使用反应混合物转化了大肠杆菌DH5α,涂布在含有50μg/ml氨苄青霉素的LB琼脂培养基上,在30℃培养过夜。
从上面得到的转化体提取质粒,检测大约0.8kb DNA插入物的核苷酸序列,由此确信了来自SEQ ID N0:16所示的核苷酸序列的核苷酸358至1160的序列。
EcoRI剪切了上面的质粒,随后进行琼脂糖凝胶电泳以分离DNA片段。使用GENECLEAN II试剂盒纯化了DNA片段,使用DIG-High PrimeDNA Labeling & Detection Starter Kit I(Roche DiagnosticsCorp.),根据所附的说明书,DIG-标记了约0.5μg纯化的DNA片段。
使用上面得到的DIG-标记的DNA,对NRRL B-12025菌株的染色体DNA进行了Southern分析。
分别用 BamHI、 EcoRI、 HindIII、 KpnI、 PstI、 SacI、 SalI和 SphI彻底消化了NRRL B-12025菌株的染色体DNA,并进行琼脂糖凝胶电泳以分离DNA片段,随后根据普通方法转移到带电荷的尼龙膜(RocheDiagnostics Corp.)上。
通过紫外照射将DNA片段固定到尼龙膜上以后,使用上面的探针DNA和尼龙膜进行了DNA杂交。杂交如下进行:使尼龙膜与探针DNA在65℃接触16小时,在室温用由0.1%SDS和2x SSC组成的溶液洗涤尼龙膜2次、每次5分钟,再在65℃用由0.1%SDS和0.5x SSC组成的溶液洗涤尼龙膜2次、每次15分钟。根据上述的DIG-High PrimeDNA Labeling & Detection Starter Kit I所附的说明书,对杂交的DNA进行了其它的操作、调节和检测。
结果,在用 HindIII和 PstI彻底消化的约3.5kbp片段观察到了显色。
随后,分别用 HindIII和 PstI彻底消化了NRRL B-12025菌株的染色体DNA,并进行琼脂糖凝胶电泳以分离DNA片段。使用GENECLEANII试剂盒,从各个限制酶-消化的DNA中纯化出了3-4kbp片段,随后使用连接试剂盒进行自动环化。
在上面检测的0.8kb DNA片段的核苷酸序列的基础上,设计和合成了SEQ ID NO:29和30所示的核苷酸序列,使用它们作为引物、上面得到的环化的DNA作为模板,进行PCR。PCR进行了30个循环,一个循环包括:在98℃反应5秒,在55℃反应30秒,在72℃反应3分钟30秒,使用的50μl反应混合物含有10ng环化的DNA、0.5μmol/l每种引物、2.5单位的pyrobest聚合酶(Takara Shuzo Co.,Ltd.)、5μl pyrobest聚合酶的缓冲液(10x)(Takara Shuzo Co.,Ltd.)和200μmol/l每种dNTP。
对得到的反应混合物的十分之一进行琼脂糖凝胶电泳,以确信扩增了大约3.0kb片段。然后,将剩余的反应混合物与等量的以TE饱和的苯酚/氯仿相混合。离心得到的混合物,将得到的上层与2倍体积的冷乙醇混合,在-80℃静置30分钟。离心得到的溶液,将得到的DNA沉淀溶解到20μl TE中。
使用连接试剂盒,对这样得到的DNA片段和Zero Blunt PCR克隆试剂盒(Invitrogen Corp.)进行连接反应。
根据使用钙离子的方法,使用反应混合物转化了大肠杆菌NM522,涂布在含有50μg/ml氨苄青霉素的LB琼脂培养基上,在30℃培养过夜。
根据已知的方法,从在该培养基上生长的转化体菌落提取质粒,使用限制酶分析了质粒的结构。结果,确认得到了质粒pYWFE10(源自NRRL B-12025),其含有与 ywfE基因相对应的基因。
使用373A DNA测序仪,检测了上面得到的分别包含在质粒pYWFE1至pYWFE 10中的与 ywfE基因相对应的基因的核苷酸序列。
由分别包含在pYWFE1、pYWFE6和pYWFE7中的基因编码的蛋白的氨基酸序列与 ywfE基因编码的蛋白的氨基酸序列相同,然而,由分别包含在pYWFE2、pYWFE3、pYWFE4、pYWFE5、pYWFE8、pYWFE9和pYWFE10中的基因编码的蛋白的氨基酸序列与 ywfE基因编码的蛋白的氨基酸序列不同。
由包含在pYWFE2、pYWFE3、pYWFE4、pYWFE5、pYWFE8、pYWFE9、pYWFE10、和pYWFE1和pYWFE7中并与 ywfE相对应的基因编码的蛋白的氨基酸序列分别如SEQ ID NO:2至8和1所示,这些基因的核苷酸序列分别如SEQ ID NO:10至16和36所示。
实施例9
C-末端His-标记的重组二肽合成酶的纯化
使用每种杆草芽孢杆菌ATCC 15245、ATCC 6633、IAM 1213、IAM1107、IAM 1214、ATCC 9466、IAM 1033和ATCC 21555和解淀粉芽孢杆菌IFO 3022的染色体DNA作为模板、实施例2所述的引物A和引物B作为一组引物,进行了PCR。也就是说,PCR进行了30个循环,一个循环包括:在94℃反应1分钟,在55℃反应2分钟,在72℃反应3分钟,使用的40μl反应混合物含有0.1μg染色体DNA、0.5μmol/l每种引物、2.5单位的 Pfu DNA聚合酶、4μl  Pfu DNA聚合酶的缓冲液(10x)和200μmol/l每种dNTP。
当短小芽孢杆菌NRRL B-12025的染色体DNA用作模板时,使用分别具有SEQ ID NO:31和32所示的核苷酸序列的DNA作为一组引物,在与上面相同的条件下进行PCR。
对得到的反应混合物的十分之一进行琼脂糖凝胶电泳,以确信扩增了与 ywfE片段相对应的大约1.4kb DNA片段。然后,将剩余的反应混合物与等量的以TE饱和的苯酚/氯仿相混合。离心得到的混合物,将得到的上层与2倍体积的冷乙醇混合,在-80℃静置30分钟。离心得到的溶液,将得到的DNA沉淀溶解到20μl TE中。
对这样得到的每种溶液(5μl)使用限制酶 NcoI和 BamHI剪切扩增的DNA。通过琼脂糖凝胶电泳分离DNA片段,并使用GENECLEAN II试剂盒回收含有与 ywfE相对应的基因的1.4kb DNA片段。
随后,使用限制酶 NcoI和 BamHI剪切了0.2μg C-末端His-标记的重组表达载体pQE60。通过琼脂糖凝胶电泳分离DNA片段,以与上面相同的方式回收3.4kb DNA片段。
使用连接试剂盒,使上面得到的含有与杆草芽孢杆菌168的 ywfE相对应的基因的1.4kb DNA片段和3.4kb DNA片段在16℃进行连接反应16小时。
根据使用钙离子的方法,使用每种连接反应混合物转化了大肠杆菌NM522,涂布在含有50μg/ml氨苄青霉素的LB琼脂培养基上,在30℃培养过夜。
根据已知的方法,从在该培养基上生长的转化体菌落提取质粒,使用限制酶分析了每种质粒的结构。结果,确认得到了下面的C-末端Hi s-标记的基因表达载体:pQE60ywfE1(该载体含有源自ATCC 15245的基因),pQE60ywfE2(该载体含有源自ATCC 6633的基因),pQE60ywfE3(该载体含有源自IAM 1213的基因),pQE60ywfE4(该载体含有源自IAM 1107的基因),pQE60ywfE5(该载体含有源自IAM 1214的基因),pQE60ywfE6(该载体含有源自ATCC 9466的基因),pQE60ywfE7(该载体含有源自IAM 1033的基因),pQE60ywfE8(该载体含有源自ATCC 21555的基因),pQE60ywfE9(该载体含有源自IFO3022的基因)和pQE60ywfE10(该载体含有源自NRRL B-12025的基因)。
将上面得到的大肠杆菌NM522/pQE60ywfE1至NM522/pQE60ywfE10菌株分别接种到装在大试管中的含有50μg/ml氨苄青霉素的8ml LB培养基中,在28℃培养17小时。将得到的每种培养物接种到装在250-ml锥形瓶中的含有50μg/ml氨苄青霉素的50ml LB培养基中,在30℃培养3小时。然后,加入异丙基-β-D-硫代吡喃型半乳糖苷,得到1mmol/l的终浓度,随后进一步在30℃培养4小时。离心得到的培养物,以得到湿细胞,使用HisTrap,根据所附的说明书,从各湿细胞纯化His-标记的重组酶。
实施例10
使用纯化的酶生产二肽
制备了含有0.04mg在实施例9中得到的各种重组酶、100mmol/lTris-HCl(pH8.0)、60mmol/l氯化镁、60mmol/l ATP、30mmol/lL-Ala和30mmol/l L-Gln的反应混合物(每种0.1ml),在37℃反应16小时。
反应结束后,通过实施例3所述的方法分析了反应产物,由此确信形成和积累了3.0至3.5g/l L-Ala-L-Gln和0.25至0.3g/lL-Ala-L-Ala。
当上面的反应混合物的组成不包括ATP时,根本没有形成L-Ala-L-Gln或L-Ala-L-Ala。
上面的结果表明,在存在ATP时,所有在实施例8得到的基因的产物都具有从L-Ala和L-Gln生产L-Ala-L-Gln和L-Ala-L-Ala的活性。
序列表中的文字说明
SEQ ID NO:19-人工序列的描述:引物
SEQ ID NO:20-人工序列的描述:引物
SEQ ID NO:21-人工序列的描述:引物
SEQ ID NO:22-人工序列的描述:引物
SEQ ID NO:23-人工序列的描述:引物
SEQ ID NO:24-人工序列的描述:引物
SEQ ID NO:25-人工序列的描述:引物
SEQ ID NO:26-人工序列的描述:引物
SEQ ID NO:27-人工序列的描述:引物
SEQ ID NO:28-人工序列的描述:引物
SEQ ID NO:29-人工序列的描述:引物
SEQ ID NO:30-人工序列的描述:引物
SEQ ID NO:31-人工序列的描述:引物
SEQ ID NO:32-人工序列的描述:引物
SEQ ID NO:33-人工序列的描述:在数据库搜索中使用的氨基酸序列
SEQ ID NO:34-人工序列的描述:在数据库搜索中使用的氨基酸序列
SEQ ID NO:35-人工序列的描述:在数据库搜索中使用的氨基酸序列
                           序列表
<110>KYOWA HAKKO KOGYO CO.,LTD.
<120>生产二肽的方法
<130>11524WO1
<150>JP 2002-376054
<151>2002-12-26
<150>JP 2003-420887
<151>2003-12-18
<160>36
<170>PatentIn Ver.2.1
<210>1
<211>472
<212>PRT
<213>枯草芽孢杆菌168
<400>1
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
  1               5                  10                  15
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
             20                  25                  30
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
         35                  40                  45
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
     50                  55                  60
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
 65                  70                  75                  80
His Asn Lys Pro Glu Glu Glu Val Val Glu Gln lle Val Lys Val Ala
                 85                  90                  95
Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
            100                 105                 110
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
        115                 120                 125
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
    130                 135                 140
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145                 150                 155                 160
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
                165                 170                 175
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
            180                 185                 190
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
        195                 200                 205
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
    210                 215                 220
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225                 230                 235                 240
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
                245                 250                 255
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
            260                 265                 270
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
        275                 280                 285
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
    290                 295                 300
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305                 310                 315                 320
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
                325                 330                 335
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
            340                 345                 350
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
        355                 360                 365
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
    370                 375                 380
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385                 390                 395                 400
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
                405                 410                 415
Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
            420                 425                 430
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
        435                 440                 445
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
    450                 455                 460
Thr Ala Lys Tyr Val Leu Pro Val
465                 470
<210>2
<211>472
<212>PRT
<213>枯草芽孢杆菌ATCC6633
<400>2
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
  1               5                  10                  15
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
             20                  25                  30
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
         35                  40                  45
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Gln Ser
     50                  55                  60
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
 65                  70                  75                  80
His Asp Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
                 85                  90                  95
Gln Met Phe Glu Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
            100                 105                 110
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
        115                 120                 125
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
    130                 135                 140
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145                 150                 155                 160
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
                165                 170                 175
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
            180                 185                 190
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
        195                 200                 205
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
    210                 215                 220
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225                 230                 235                 240
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
                245                 250                 255
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
            260                 265                 270
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
        275                 280                 285
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
    290                 295                 300
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305                 310                 315                 320
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
                325                 330                 335
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
            340                 345                 350
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
        355                 360                 365
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
    370                 375                 380
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385                 390                 395                 400
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
                405                 410                 415
Thr Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
            420                 425                 430
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
        435                 440                 445
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
    450                 455                 460
Thr Ala Lys Tyr Val Leu Pro Val
465                 470
<210>3
<211>472
<212>PRT
<213>枯草芽孢杆菌IAMl213
<400>3
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
  1               5                  10                  15
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
             20                  25                  30
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
         35                  40                  45
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
     50                  55                  60
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
 65                  70                  75                  80
His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
                 85                  90                  95
Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
            100                 105                 110
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
        115                 120                 125
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
    130                 135                 140
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145                 150                 155                 160
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
                165                 170                 175
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
            180                 185                 190
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
        195                 200                 205
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
    210                 215                 220
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225                 230                 235                 240
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
                245                 250                 255
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
            260                 265                 270
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
        275                 280                 285
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
    290                 295                 300
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305                 310                 315                 320
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
                325                 330                 335
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
            340                 345                 350
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
        355                 360                 365
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
    370                 375                 380
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385                 390                 395                 400
Ala Ile Asp Leu Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
                405                 410                 415
Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
            420                 425                 430
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
        435                 440                 445
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
    450                 455                 460
Thr Ala Lys Tyr Val Leu Pro Val
465                 470
<210>4
<211>472
<212>PRT
<213>枯草芽孢杆菌IAM1107
<400>4
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
  1               5                  10                  15
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
             20                  25                  30
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
         35                  40                  45
Glu Lys Tyr Ser Val Ala Val Val Lys Asp Lys Asp Tyr Phe Lys Ser
     50                  55                  60
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
 65                  70                  75                  80
His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
                 85                  90                  95
Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
            100                 105                 110
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
        115                 120                 125
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
    130                 135                 140
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145                 150                 155                 160
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
                165                 170                 175
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
            180                 185                 190
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
        195                 200                 205
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
    210                 215                 220
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225                 230                 235                 240
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
                245                 250                 255
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
            260                 265                 270
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
        275                 280                 285
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
    290                 295                 300
Asn Cys Ala Thr His Thr Glu Val Lys Leu Met Lys Asn Arg Glu Pro
305                 310                 315                 320
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
                325                 330                 335
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
            340                 345                 350
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
        355                 360                 365
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
    370                 375                 380
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385                 390                 395                 400
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Phe
                405                 410                 415
Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
            420                 425                 430
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
        435                 440                 445
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
    450                 455                 460
Thr Ala Lys Tyr Val Leu Pro Val
465                 470
<210>5
<211>472
<212>PRT
<213>枯草芽孢杆菌IAM1214
<400>5
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
  1               5                  10                  15
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
             20                  25                  30
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
         35                  40                  45
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Gln Ser
     50                  55                  60
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
 65                  70                  75                  80
His Asp Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
                 85                  90                  95
Gln Met Phe Glu Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
            100                 105                 110
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
        115                 120                 125
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
    130                 135                 140
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145                 150                 155                 160
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
                165                 170                 175
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
            180                 185                 190
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
        195                 200                 205
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
    210                 215                 220
Ala G1u Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225                 230                 235                 240
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
                245                 250                 255
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
            260                 265                 270
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
        275                 280                 285
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
    290                 295                 300
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305                 310                 315                 320
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
                325                 330                 335
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
            340                 345                 350
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
        355                 360                 365
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
    370                 375                 380
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385                 390                 395                 400
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
                405                 410                 415
Thr Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
            420                 425                 430
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
        435                 440                 445
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
    450                 455                 460
Thr Ala Lys Tyr Val Leu Pro Val
465                 470
<210>6
<211>472
<212>PRT
<213>枯草芽孢杆菌ATCC21555
<400>6
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
  1               5                  10                  15
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
             20                  25                  30
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
         35                  40                  45
Glu Lys Tyr Ser Ile Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
     50                  55                  60
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
 65                  70                  75                  80
His Asp Lys Pro Glu Glu Glu Val Val Glu Glu Ile Val Lys Val Ala
                 85                  90                  95
Asp Met Phe Gly Val Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
            100                 105                 110
Ala Pro Met Ala Lys Ala Cys Lys Arg Leu Gly Leu Arg Gly Ala Gly
        115                 120                 125
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Ala Ala
    130                 135                 140
Phe Asn Arg Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145                 150                 155                 160
Leu Glu Asp Phe Arg Ala Ala Leu Gln Glu Ile Gly Thr Pro Leu Ile
                165                 170                 175
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Lys
            180                 185                 190
Glu Met Glu Thr Ala Glu Ala Glu Phe Asn Arg Val Asn Glu Tyr Leu
        195                 200                 205
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
    210                 215                 220
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Asp Asp Trp Tyr Glu Thr Ser
225                 230                 235                 240
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
                245                 250                 255
Tyr Phe Pro Val Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
            260                 265                 270
Glu Thr Ala His Ile Thr Pro Ser Ile Leu Asp Asp Asp Ala Lys Arg
        275                 280                 285
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Glu
    290                 295                 300
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Ala
305                 310                 315                 320
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
                325                 330                 335
Asn Ile Lys Lys Val Phe Gly Val Asp Met Ala Gln Leu Leu Leu Asp
            340                 345                 350
Val Leu Cys Tyr Gly Lys Glu Ala Asp Leu Pro Lys Gly Leu Leu Glu
        355                 360                 365
Gln Glu Pro Cys Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
    370                 375                 380
Lys Glu Asn Gly Gln Leu Pro Glu Thr Val Val Asp Phe Val Ile Glu
385                 390                 395                 400
Ser Ile Glu Ile Pro Asp Gly Val Leu Lys Gly Asp Thr Glu Leu Val
                405                 410                 415
Ser Phe Ser Ala Ala Glu Ala Gly Thr Ser Val Asp Leu Arg Leu Phe
            420                 425                 430
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
        435                 440                 445
Asn Asp Val Ala Glu Ser Ile Lys Gln Ile Gln Gln Gln Ala Lys Leu
    450                 455                 460
Thr Ala Lys Tyr Ala Leu Ser Val
465                 470
<210>7
<211>472
<212>PRT
<213>解淀粉芽孢杆菌IFO3022
<400>7
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
  1               5                  10                  15
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
             20                  25                  30
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
         35                  40                  45
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
     50                  55                  60
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
 65                  70                  75                  80
His Asp Lys Pro Glu Glu Glu Val Val Glu Glu Ile Val Lys Val Ala
                 85                  90                  95
Gly Met Phe Ala Val Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
            100                 105                 110
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
        115                 120                 125
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Ala Ala
    130                 135                 140
Phe Asn Arg Ala Gly Val Lys Ser Ile Lys Asn Arg Arg Val Thr Thr
145                 150                 155                 160
Leu Glu Asp Phe Arg Ala Ala Leu Gln Glu Ile Gly Thr Pro Leu Ile
                165                 170                 175
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Lys
            180                 185                 190
Glu Arg Glu Thr Ala Glu Ala Glu Phe Asn Arg Val Asn Glu Tyr Leu
        195                 200                 205
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
    210                 215                 220
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Asp Asp Trp Tyr Glu Thr Ser
225                 230                 235                 240
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
                245                 250                 255
Tyr Phe Pro Val Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
            260                 265                 270
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Asp Asp Ala Lys Arg
        275                 280                 285
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Glu
    290                 295                 300
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Ala
305                 310                 315                 320
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
                325                 330                 335
Asn Ile Lys Lys Val Phe Gly Val Asp Met Ala Gln Leu Leu Leu Asp
            340                 345                 350
Val Leu Cys Phe Gly Lys Glu Ala Asp Leu Pro Lys Gly Leu Leu Glu
        355                 360                 365
Gln Glu Pro Cys Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
    370                 375                 380
Lys Glu Asn Gly Gln Leu Pro Glu Thr Ala Val Asp Phe Val Ile Glu
385                 390                 395                 400
Ser Ile Asp Ile Pro Asp Gly Val Leu Lys Gly Asp Thr Glu Ile Val
                405                 410                 415
Ser Phe Ser Ala Ala Glu Ala Gly Thr Ser Val Asp Leu Arg Leu Phe
            420                 425                 430
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
        435                 440                 445
Gly Asp Val Ala Glu Ser Ile Lys Gln Ile Gln Gln Gln Ala Lys Leu
    450                 455                 460
Thr Ala Lys Tyr Ala Leu Pro Val
465                 470
<210>8
<211>476
<212>PRT
<213>短小芽孢杆菌NRRL B-12025
<400>26
Val Leu Ser Leu Ser Lys Lys Thr Val Leu Val Ile Ala Asp Leu Gly
  1               5                  10                  15
Gly Cys Pro Pro His Met Phe Tyr Glu Ser Val Ala Ala Ser Tyr His
             20                  25                  30
Ile Val Ser Tyr Ile Pro Arg Pro Phe Ala Ile Thr Lys Gly His Ala
         35                  40                  45
Glu Leu Ile Glu Lys Tyr Ser Ile Ala Val Ile Lys Asp Arg Asp Tyr
     50                  55                  60
Phe Glu Thr His Pro Ser Phe Glu His Pro Asp Ser Ile Tyr Trp Ala
 65                  70                  75                  80
His Asp Asp Tyr Pro Lys Ser Glu Glu Glu Val Val Glu Asp Phe Ile
                 85                  90                  95
Arg Val Ala Ser Phe Phe Lys Ala Asp Ala Ile Thr Thr Asn Asn Glu
            100                 105                 110
Leu Phe Ile Ala Pro Met Ala Lys Ala Ala Glu Arg Leu Gly Leu Arg
        115                 120                 125
Gly Ala Gly Val Lys Ala Ala Glu Met Ala Arg Asp Lys Ser Gln Met
    130                 135                 140
Arg Ala Ala Phe Asn Ala Ser Gly Val Lys Ala Val Lys Thr Gln Pro
145                 150                 155                 160
Val Thr Thr Leu Ser Asp Phe Gln Gln Ala Ile Glu Ser Ile Gly Thr
                165                 170                 175
Pro Leu Ile Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr
            180                 185                 190
Leu Phe His Asp Lys Ala Gly Ser Asp Asp Leu Phe Leu Gln Val Gln
        195                 200                 205
Ser Tyr Leu Glu Thr Ile Pro Val Pro Asp Ala Val Thr Tyr Glu Ala
    210                 215                 220
Pro Phe Val Ala Glu Thr Tyr Leu Glu Gly Ala Tyr Glu Asp Trp Tyr
225                 230                 235                 240
Glu Asp Glu Gly Tyr Ala Asp Tyr Val Ser Val Glu Gly Leu Val Val
                245                 250                 255
Glu Gly Glu Tyr Leu Pro Phe Val Ile His Asp Lys Thr Pro Gln Ile
            260                 265                 270
Gly Phe Thr Glu Thr Ala His Ile Thr Pro Thr Ile Leu Asp Asn Glu
        275                 280                 285
Ala Lys Gln Ile Ile Ile Glu Ala Ala Arg Lys Ala Asn Glu Gly Leu
    290                 295                 300
Gly Leu Glu His Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn
305                 310                 315                 320
Arg Glu Thr Gly Leu Ile Glu Ala Ala Ala Arg Phe Ala Gly Trp Asn
                325                 330                 335
Met Ile Pro Asn Ile Lys Lys Val Phe Gly Val Asp Met Ala Lys Leu
            340                 345                 350
Leu Ile Asp Val Leu Val Asp Gly Lys Lys Ala Val Leu Pro Lys Gln
        355                 360                 365
Leu Leu Ser Gly His Thr Phe Tyr Val Ala Asp Cys His Leu Tyr Pro
    370                 375                 380
Gln His Phe Lys Glu Ser Gly Leu Ile Pro Pro Glu Ala Thr His Ile
385                 390                 395                 400
Thr Ile Asp His Val Ser Ile Pro Gln Glu Ala Phe Val Gly Asp Thr
                405                 410                 415
Ala Ile Val Ser Gln Ser Phe Pro Ala Lys Gly Thr Ile Val Asp Leu
            420                 425                 430
Glu Leu Phe Glu Ala Phe Asn Gly Ile Val Ser Leu Glu Leu Lys Gly
        435                 440                 445
Ser Ser Ser Gln Asp Val Ala Ala Ser Ile Arg Asn Ile Gln Lys Gln
    450                 455                 460
Ala Thr Ile Gln Leu Met Asp Glu Leu Val Lys Gly
465                 470                 475
<210>9
<211>1416
<212>DNA
<213>枯草芽孢杆菌168
<400>9
atg gag aga aaa aca gta ttg gtc atc gct gat ctt gga ggc tgc ccg    48
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
  1               5                  10                  15
ccg cac atg ttt tat aaa agc gct gct gaa aaa tat aac ctg gtc agc    96
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
             20                  25                  30
ttt att cca aga cct ttt gca att aca gcc tcc cat gca gca ttg att   144
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
         35                  40                  45
gaa aaa tac tcg gtc gcg gtc ata aaa gat aaa gac tat ttt aag agt   192
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
     50                  55                  60
tta gct gat ttt gaa cac cct gat tcc att tat tgg gcg cat gaa gat   240
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
 65                  70                  75                  80
cat aac aag cct gag gaa gag gtc gtc gag caa atc gtc aag gtt gcc   288
His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
                 85                  90                  95
gaa atg ttt ggg gcg gat gcc atc aca aca aac aat gaa tta ttc att   336
Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
            100                 105                 110
gct ccg atg gcg aaa gcc tgt gaa cgt ctg ggc ttg aga ggt gcc ggc   384
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
        115                 120                 125
gtg cag gca gcc gaa aat gcc aga gat aaa aat aaa atg agg gac gct   432
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
    130                 135                 140
ttt aat aag gcc gga gtc aaa tcg atc aaa aac aaa cga gtc aca act   480
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145                 150                 155                 160
ctt gaa gat ttc cgt gct gct ctt gaa gag atc ggc aca cct ctt atc   528
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
                165                 170                 175
tta aag cct aca tac tta gcg agt tct atc ggt gta acg ctg att acg   576
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
            180                 185                 190
gac act gag acg gca gaa gat gaa ttt aac aga gtc aat gac tat ctg   624
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
        195                 200                 205
aaa tca att aac gtg cca aag gcg gtt acg ttt gaa gcg ccg ttt atc   672
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
    210                 215                 220
gct gaa gaa ttt tta cag ggt gag tac gga gac tgg tat caa aca gaa   720
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225                 230                 235                 240
ggg tac tcc gac tat atc agt ata gaa ggc atc atg gct gac ggt gag   768
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
                245                 250                 255
tat ttc ccg atc gcc att cat gat aaa acg ccg caa atc ggg ttt aca   816
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
            260                 265                 270
gag aca tcc cac att acg ccg tcc att ctg gat gaa gag gca aaa aag   864
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
        275                 280                 285
aaa att gtc gaa gct gcc aaa aag gca aat gaa ggg ctt gga ctg caa   912
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
    290                 295                 300
aat tgc gca aca cat aca gag atc aag cta atg aaa aac aga gaa ccg   960
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305                 310                 315                 320
ggt tta ata gag tcg gca gcc aga ttt gcc ggc tgg aat atg atc ccc   1008
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
                325                 330                 335
aat att aaa aag gtc ttt ggc ctt gat atg gcg caa tta tta tta gat   1056
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
            340                 345                 350
gtc ctc tgt ttc gga aaa gac gcc gat ctg ccg gac gga tta ttg gat   1104
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
        355                 360                 365
caa gag cct tat tat gtt gcc gac tgc cat ttg tac ccg cag cat ttc   1152
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
    370                 375                 380
aaa caa aat ggc caa att cct gaa act gct gag gat ttg gtc att gaa   1200
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385                 390                 395                 400
gcg atc gat att ccg gac ggg ctt tta aaa ggg gat act gaa atc gtt   1248
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
                405                 410                 415
tct ttt tcg gcc gca gca cca ggc act tca gtt gat ttg aca ttg ttt   1296
Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
            420                 425                 430
gaa gct ttc aat tcc att gct gca ttt gaa ctg aaa ggc agt aat tca   1344
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
        435                 440                 445
cag gat gtg gct gaa tca atc aga caa att cag cag cat gcg aag ctg   1392
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
    450                 455                 460
acg gca aag tat gtg ctg cca gta                                   1416
Thr Ala Lys Tyr Val Leu Pro Val
465                 470
<210>10
<211>1416
<212>DNA
<213>枯草芽孢杆菌ATCC6633
<400>10
atg gag aga aaa aca gta ttg gtc atc gct gat ctt gga ggc tgc ccg    48
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
  1               5                  10                  15
ccg cac atg ttt tat aaa agc gct gct gaa aaa tat aac ctg gtt agc    96
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
             20                  25                  30
ttt att ccg aga cct ttt gca ata aca gcc tcc cat gca gca ctg att   144
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
         35                  40                  45
gaa aaa tac tcg gtc gcg gtc ata aaa gat aaa gac tat ttt cag agc   192
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Gln Ser
     50                  55                  60
tta gct gat ttt gag cat ccc gat tca att tat tgg gcg cat gag gat   240
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
 65                  70                  75                  80
cat gac aag cct gaa gaa gag gtt gtc gag caa atc gtc aag gtt gcc   288
His Asp Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
                 85                  90                  95
caa atg ttt gag gcg gac gcc atc aca aca aac aat gaa tta ttc att   336
Gln Met Phe Glu Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
            100                 105                 110
gcc ccg atg gcg aaa gcc tgt gaa cgc ctt ggc ctg agg ggc gcc gga   384
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
        115                 120                 125
gtg cag gca gcg gaa aat gcc aga gat aaa aat aaa atg agg gac gct   432
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
    130                 135                 140
ttt aat aag gcg gga gtc aaa tcg atc aaa aac aaa cga gtc aca act   480
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145                 150                 155                 160
ctt gag gat ttt cgt gct gca ctt gaa gag atc ggc aca cct cta atc   528
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
                165                 170                 175
tta aag cct aca tac tta gcg agt tca atc ggc gta acg ctg att acc    576
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
            180                 185                 190
gac acg gag acg gca gaa gat gaa ttt aac aga gtc aat gac tac ctg    624
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
        195                 200                 205
aaa tcg att aac gtg ccg aag gcg gtc aca ttt gaa gca ccg ttt att    672
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
    210                 215                 220
gct gag gaa ttt tta cag ggt gag tac gga gac tgg tat caa aca gaa    720
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225                 230                 235                 240
ggg tac tcc gac tat atc agc ata gaa ggc att atg gca gat ggt gag    768
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
                245                 250                 255
tat ttt ccg atc gcc att cat gac aaa acg ccg caa att gga ttt aca    816
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
            260                 265                 270
gag aca tca cat att acg cca tcc att ctg gat gaa gag gcg aaa aag    864
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
        275                 280                 285
aaa att gtc gaa gcg gct aaa aag gca aat gaa ggg ctt gga ctg caa    912
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
    290                 295                 300
aat tgc gca aca cat aca gaa atc aag cta atg aaa aac aga gaa ccg    960
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305                 310                 315                 320
ggt tta ata gag tcg gct gcc aga ttc gca ggc tgg aat atg att cct   1008
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
                325                 330                 335
aac att aaa aag gtt ttc ggc ctt gat atg gcg caa tta tta tta gat   1056
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
            340                 345                 350
gtt ctc tgt ttc gga aaa gat gct gat ctg ccg gac ggg tta ttg gat   1104
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
        355                 360                 365
caa gag cct tac tat gtt gct gac tgc cat ctg tac cct cag cat ttc   1152
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
    370                 375                 380
aaa caa aat ggc cag atc cct gaa act gcc gag gat ttg gta atc gaa   1200
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385                 390                 395                 400
gcg atc gat att ccg gat ggg ctt ttg aag ggt gat aca gaa atc gtt   1248
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
                405                 410                 415
act ttt tcg gct gcg gca cca gga aca tca gtt gat ttg aca ctg ttt   1296
Thr Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
            420                 425                 430
gaa gcc ttc aac tcc att gct gca ttt gaa ctg aaa ggc agc aat tca   1344
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
        435                 440                 445
cag gat gtg gct gaa tca atc aga caa att cag cag cat gcg aag ctg   1392
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
    450                 455                 460
acg gca aag tat gtg ctg cca gta                                   1416
Thr Ala Lys Tyr Val Leu Pro Val
465                 470
<210>11
<211>1416
<212>DNA
<213>枯草芽孢杆菌 IAM1213
<400>11
atg gag aga aaa aca gta ttg gtc atc gct gat ctt gga ggc tgc ccg     48
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
  1               5                  10                  15
ccg cac atg ttt tat aaa agc gct gct gaa aaa tat aac ctg gtc agc    96
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
             20                  25                  30
ttt att cca aga cct ttt gca att aca gcc tcc cat gca gca ttg att   144
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
         35                  40                  45
gaa aaa tac tcg gtc gcg gtc ata aaa gat aaa gac tat ttt aag agt   192
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
     50                  55                  60
tta gct gat ttt gag cat cct gac tcc att tat tgg gcg cat gag gat   240
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
 65                  70                  75                  80
cat aac aag cct gag gaa gag gtc gtc gag caa atc gtc aag gtt gcc   288
His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
                 85                  90                  95
gaa atg ttt ggg gcg gat gcc atc aca aca aac aat gaa tta ttc att   336
Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
            100                 105                 110
gct ccg atg gcg aaa gcc tgt gaa cgt ctg ggc ctg aga ggt gcc ggc   384
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
        115                 120                 125
gtg cag gca gcc gaa aat gcc aga gat aaa aat aaa atg agg gac gct   432
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
    130                 135                 140
ttt aat aag gcc gga gtc aaa tcg atc aaa aac aaa cga gtc aca act   480
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145                 150                 155                 160
ctc gaa gat ttc cgt gct gct ctt gaa gag atc ggc aca cct ctt atc   528
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
                165                 170                 175
tta aag cct aca tac tta gcg agt tca atc ggt gta acg ctg att acg   576
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
            180                 185                 190
gac act gag acg gca gaa gat gaa ttt aac aga gtc aat gac tat ctg    624
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
        195                 200                 205
aaa tca att aac gtg cca aag gcg gtt acg ttt gaa gcg ccg ttt atc    672
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
    210                 215                 220
gct gaa gaa ttt tta cag ggt gag tac gga gac tgg tat caa aca gaa    720
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225                 230                 235                 240
ggg tac tcc gac tat atc agt ata gaa ggc atc atg gct gac ggt gag    768
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
                245                 250                 255
tat ttc ccg atc gcc att cat gat aaa acg ccg caa atc ggg ttt aca    816
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
            260                 265                 270
gag aca tcc cac att acg ccg tcc att ctg gat gaa gag gca aaa aag    864
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
        275                 280                 285
aaa att gtc gaa gct gcc aaa aag gca aat gaa ggt ctt ggc ctg caa    912
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
    290                 295                 300
aat tgc gca aca cat aca gag atc aag cta atg aaa aat aga gaa ccg    960
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305                 310                 315                 320
ggt tta att gaa tcg gca gcc aga ttc gcc ggc tgg aat atg atc ccc   1008
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
                325                 330                 335
aat att aaa aag gtc ttt ggc ctt gat atg gcg caa tta tta tta gat   1056
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
            340                 345                 350
gtc ctt tgt ttc gga aaa gac gcc gat ctg ccg gac gga tta ttg gat   1104
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
        355                 360                 365
caa gag cct tat tat gtt gcc gac tgc cat ttg tac ccg caa cat ttc   1152
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
    370                 375                 380
aaa caa aat ggc cag att cca gaa act gct gag gat ttg gtc att gaa   1200
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385                 390                 395                 400
gcg atc gat ctg cct gac ggg ctt tta aaa ggg gat act gag atc gtt   1248
Ala Ile Asp Leu Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
                405                 410                 415
tct ttt tcg gcc gca gca cca gga act tca gtt gat ttg aca ttg ttt   1296
Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
            420                 425                 430
gaa gct ttc aat tcc att gct gca ttt gaa ctg aaa ggc agt aat tca   1344
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
        435                 440                 445
cag gat gtg gct gaa tca atc aga caa att cag cag cat gcg aag ctg   1392
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
    450                 455                 460
acg gca aag tat gtg ctg cca gta                                   1416
Thr Ala Lys Tyr Val Leu Pro Val
465                 470
<210>12
<211>1416
<212>DNA
<213>枯草芽孢杆菌IAM1107
<400>12
atg gag aga aaa aca gta ttg gtc atc gct gat ctt gga ggc tgc ccg     48
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
  1               5                  10                  15
ccg cac atg ttt tat aaa agc gct gct gaa aaa tat aac ctg gtc agc     96
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
             20                  25                  30
ttt att cca aga cct ttt gca att aca gcc tcc cat gca gca ttg att   144
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
         35                  40                  45
gaa aaa tac tcg gtc gcg gtc gta aaa gat aaa gac tat ttt aag agt   192
Glu Lys Tyr Ser Val Ala Val Val Lys Asp Lys Asp Tyr Phe Lys Ser
     50                  55                  60
tta gct gat ttt gag cat cct gac tcc att tat tgg gcg cat gag gat   240
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
 65                  70                  75                  80
cat aac aag cct gag gaa gag gtc gtc gag caa atc gtc aag gtt gcc   288
His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
                 85                  90                  95
gaa atg ttc ggg gcg gat gcc atc aca aca aac aat gaa tta ttc att   336
Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
            100                 105                 110
gct ccg atg gcg aaa gcc tgt gaa cgt ctg ggc ttg aga ggt gcc ggc   384
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
        115                 120                 125
gtg cag gca gcc gaa aat gcc aga gat aaa aat aaa atg agg gac gct   432
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
    130                 135                 140
ttt aat aag gcc gga gtc aaa tcg atc aaa aac aaa cga gtc aca act   480
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145                 150                 155                 160
ctt gaa gat ttc cgt gct gct ctt gaa gag atc ggc aca cct ctt atc   528
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
                165                 170                 175
tta aag cct aca tac tta gcg agt tct atc ggt gta acg ctg att acg   576
Leu Lys Pro Thr Tyr Leu Ala Ser Set Ile Gly Val Thr Leu Ile Thr
            180                 185                 190
gac act gag acg gca gaa gat gaa ttt aac aga gtc aat gac tat ctg   624
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
        195                 200                 205
aaa tca att aac gtg cca aag gcg gtt acg ttt gaa gcg ccg ttt atc    672
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
    210                 215                 220
gct gaa gaa ttt tta cag ggt gag tac gga gac tgg tat caa aca gaa    720
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225                 230                 235                 240
ggg tac tcc gac tat atc agt ata gaa ggc atc atg gct gac ggt gag    768
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
                245                 250                 255
tat ttc ccg atc gcc att cat gat aaa acg ccg caa atc ggg ttt aca    816
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
            260                 265                 270
gag aca tcc cac att acg ccg tcc att ctg gat gaa gag gca aaa aag    864
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
        275                 280                 285
aaa att gtc gaa gct gcc aaa aag gca aat gaa ggg ctt ggc ctg caa    912
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
    290                 295                 300
aat tgc gca aca cat aca gag gtc aag cta atg aaa aac aga gaa ccg    960
Asn Cys Ala Thr His Thr Glu Val Lys Leu Met Lys Asn Arg Glu Pro
305                 310                 315                 320
ggt tta att gaa tcg gca gcc aga ttt gcc ggc tgg aat atg atc cct   1008
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
                325                 330                 335
aac att aaa aag gtt ttc ggc ctt gat atg gcg caa tta tta tta gat   1056
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
            340                 345                 350
gtc ctc tgt ttc gga aaa gat gcc gat ctg ccg gac gga tta ttg gat   1104
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
        355                 360                 365
caa gag cct tac tat gtc gcc gac tgc cat ttg tac ccg cag cat ttc   1152
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
    370                 375                 380
aaa caa aat ggc cag att cca gaa acc gct gag gat ttg gtc att gaa   1200
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385                 390                 395                 400
gcg atc gat att ccg gac ggg ctt tta aaa ggg gat act gaa atc ttt   1248
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Phe
                405                 410                 415
tct ttt tcg gcc gca gca cca ggc act tca gtt gat ttg aca ttg ttt   1296
Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
            420                 425                 430
gaa gct ttc aat tcc att gct gca ttt gaa ctg aaa ggc agt aat tca   1344
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
        435                 440                 445
cag gat gtg gct gaa tca atc aga caa att cag cag cat gcg aag ctg   1392
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
    450                 455                 460
acg gca aag tat gtg ctg cca gta                                   1416
Thr Ala Lys Tyr Val Leu Pro Val
465                 470
<210>13
<211>1416
<212>DNA
<213>枯草芽孢杆菌IAMl214
<400>13
atg gag aga aaa aca gta ttg gtc atc gct gat ctt gga ggc tgc ccg     48
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
  1               5                  10                  15
ccg cac atg ttt tat aaa agc gct gct gaa aaa tat aac ctg gtt agc     96
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
             20                  25                  30
ttt att ccg aga cct ttt gca ata aca gcc tcc cat gca gca ctg att    144
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
         35                  40                  45
gaa aaa tac tcg gtc gcg gtc ata aaa gat aaa gac tat ttt cag agc   192
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Gln Ser
     50                  55                  60
tta gct gat ttt gag cat ccc gat tca att tat tgg gcg cat gag gat   240
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
 65                  70                  75                  80
cat gac aag cct gaa gaa gag gtt gtc gag caa atc gtc aag gtt gcc   288
His Asp Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
                 85                  90                  95
caa atg ttt gag gcg gac gcc atc aca aca aac aat gaa tta ttc att   336
Gln Met Phe Glu Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
            100                 105                 110
gcc ccg atg gcg aaa gcc tgt gaa cgc ctt ggc ctg agg ggc gcc gga   384
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
        115                 120                 125
gtg cag gca gcg gaa aat gcc aga gat aaa aat aaa atg agg gac gct   432
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
    130                 135                 140
ttt aat aag gcg gga gtc aaa tcg atc aaa aac aaa cga gtc aca act   480
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145                 150                 155                 160
ctt gag gat ttt cgt gct gca ctt gaa gag atc ggc aca cct cta atc   528
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
                165                 170                 175
tta aag cct aca tac tta gcg agt tca atc ggc gta acg ctg att acc   576
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
            180                 185                 190
gac acg gag acg gca gaa gat gaa ttt aac aga gtc aat gac tac ctg   624
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
        195                 200                 205
aaa tcg att aac gtg ccg aag gcg gtc aca ttt gaa gca ccg ttt att   672
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
    210                 215                 220
gct gag gaa ttt tta cag ggt gag tac gga gac tgg tat caa aca gaa    720
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225                 230                 235                 240
ggg tac tcc gac tat atc agc ata gaa ggc att atg gca gat ggt gag    768
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
                245                 250                 255
tat ttt ccg atc gcc att cat gac aaa acg ccg caa att gga ttt aca    816
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
            260                 265                 270
gag aca tca cat att acg cca tcc att ctg gat gaa gag gcg aaa aag    864
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
        275                 280                 285
aaa att gtc gaa gcg gct aaa aag gca aat gaa ggg ctt gga ctg caa    912
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
    290                 295                 300
aat tgc gca aca cat aca gaa atc aag cta atg aaa aac aga gaa ccg    960
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305                 310                 315                 320
ggt tta ata gag tcg gct gcc aga ttc gca ggc tgg aat atg att cct   1008
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
                325                 330                 335
aac att aaa aag gtt ttc ggc ctt gat atg gcg caa tta tta tta gat   1056
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
            340                 345                 350
gtt ctc tgt ttc gga aaa gat gct gat ctg ccg gac ggg tta ttg gat   1104
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
        355                 360                 365
caa gag cct tac tat gtt gct gac tgc cat ctg tac cct cag cat ttc   1152
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
    370                 375                 380
aaa caa aat ggc cag atc cct gaa act gcc gag gat ttg gta atc gaa   1200
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385                 390                 395                 400
gcg atc gat att ccg gat ggg ctt ttg aag ggt gat aca gaa atc gtt   1248
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
                405                 410                 415
act ttt tcg gct gcg gca cca gga aca tca gtt gat ttg aca ctg ttt   1296
Thr Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
            420                 425                 430
gaa gcc ttc aac tcc att gct gca ttt gaa ctg aaa ggc agc aat tca   1344
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
        435                 440                 445
cag gat gtg gct gaa tca atc aga caa att cag cag cat gcg aag ctg   1392
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
    450                 455                 460
acg gca aag tat gtg ctg cca gta                                   1416
Thr Ala Lys Tyr Val Leu Pro Val
465                 470
<210>14
<211>1416
<212>DNA
<213>枯草芽孢杆菌ATCC21555
<400>14
atg gag aga aaa aca gta ttg gtt atc gct gat ctt ggg ggc tgc ccg     48
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
  1               5                  10                  15
ccg cat atg ttt tac aaa agc gca gcc gaa aaa tac aac ctc gtc agc     96
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
             20                  25                  30
ttt att ccg aga ccc ttt gca att aca gcc tct cat gcg gcc tta att    144
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
         35                  40                  45
gaa aaa tac tcg att gcg gtc att aaa gat aaa gac tat ttt aag agt    192
Glu Lys Tyr Ser Ile Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
     50                  55                  60
ctg gct gat ttt gaa cat ccc gat tcg att tat tgg gct cat gaa gat    240
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
 65                  70                  75                  80
cat gac aaa cct gag gaa gaa gtc gtc gaa gaa atc gtg aaa gtg gcc   288
His Asp Lys Pro Glu Glu Glu Val Val Glu Glu Ile Val Lys Val Ala
                 85                  90                  95
gac atg ttt ggg gtt gac gcc att acg acc aac aat gaa ctg ttt atc   336
Asp Met Phe Gly Val Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
            100                 105                 110
gct ccg atg gca aaa gcg tgt aaa cgt ctc ggc ctg cgg gga gcg ggc   384
Ala Pro Met Ala Lys Ala Cys Lys Arg Leu Gly Leu Arg Gly Ala Gly
        115                 120                 125
gta cag gcc gct gaa aac gcc aga gat aaa aat aaa atg aga gcc gcc   432
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Ala Ala
    130                 135                 140
ttc aac cgg gcc ggc gtc aaa tcc atc aaa aac aaa cgg gtg acg acc   480
Phe Asn Arg Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145                 150                 155                 160
ctg gaa gat ttc cgc gcc gcg ctt cag gaa atc gga acg ccg ctt att   528
Leu Glu Asp Phe Arg Ala Ala Leu Gln Glu Ile Gly Thr Pro Leu Ile
                165                 170                 175
ctg aag cct aca tat ctg gca agc tcg atc ggc gtg acg ctt att aaa   576
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Lys
            180                 185                 190
gag atg gaa acg gcc gaa gct gaa ttc aac aga gtc aat gag tac ttg   624
Glu Met Glu Thr Ala Glu Ala Glu Phe Asn Arg Val Asn Glu Tyr Leu
        195                 200                 205
aaa tcg att aat gta ccg aaa gcg gtg acg ttt gaa gcg ccg ttt atc   672
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
    210                 215                 220
gcg gaa gaa ttc ttg cag ggc gag tat gat gac tgg tac gaa aca agc   720
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Asp Asp Trp Tyr Glu Thr Ser
225                 230                 235                 240
ggt tat tcc gac tat atc agc atc gaa ggc atc atg gcc gac gga gaa   768
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
                245                 250                 255
tac ttc ccc gtt gcg atc cat gat aaa aca ccg caa atc gga ttc acg    816
Tyr Phe Pro Val Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
            260                 265                 270
gag aca gcg cat att acg ccg tcc atc ctg gat gat gac gcc aag cgg    864
Glu Thr Ala His Ile Thr Pro Ser Ile Leu Asp Asp Asp Ala Lys Arg
        275                 280                 285
aaa atc gtc gaa gct gcc aag aag gcg aat gaa gga ctc ggc ctc gaa    912
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Glu
    290                 295                 300
aac tgt gca acg cat aca gaa ata aaa tta atg aaa aac cgg gaa gcc    960
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Ala
305                 310                 315                 320
gga ctg att gag tca gcg gcc aga ttc gcg gga tgg aat atg att ccg   1008
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
                325                 330                 335
aat att aaa aag gtc ttc ggc gtt gat atg gcg cag cta tta ttg gat   1056
Asn Ile Lys Lys Val Phe Gly Val Asp Met Ala Gln Leu Leu Leu Asp
            340                 345                 350
gtt ctc tgt tac gga aaa gaa gct gat ctg ccg aaa gga tta ttg gag   1104
Val Leu Cys Tyr Gly Lys Glu Ala Asp Leu Pro Lys Gly Leu Leu Glu
        355                 360                 365
cag gag cca tgc tat gtc gca gac tgc cac ttg tat cct cag cat ttc   1152
Gln Glu Pro Cys Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
    370                 375                 380
aaa gag aac ggc cag ctg cct gag acg gtt gtc gat ttc gtc att gaa   1200
Lys Glu Asn Gly Gln Leu Pro Glu Thr Val Val Asp Phe Val Ile Glu
385                 390                 395                 400
agc att gaa att cct gac ggc gtc tta aag gga gac act gaa ctc gtt   1248
Ser Ile Glu Ile Pro Asp Gly Val Leu Lys Gly Asp Thr Glu Leu Val
                405                 410                 415
tct ttc tca gcg gct gag gcg ggt acg tca gtg gat ctg cgg ctg ttc   1296
Ser Phe Ser Ala Ala Glu Ala Gly Thr Ser Val Asp Leu Arg Leu Phe
            420                 425                 430
gaa gcg ttc aac agc att gcg gcg ttt gag ctg aaa gga agc aat tcg   1344
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
        435                 440                 445
aac gac gtg gcc gaa tca atc aaa caa att cag cag cag gcg aag ctg   1392
Asn Asp Val Ala Glu Ser Ile Lys Gln Ile Gln Gln Gln Ala Lys Leu
    450                 455                 460
act gca aag tat gcg tta tcg gta                                   1416
Thr Ala Lys Tyr Ala Leu Ser Val
<210>15
<211>1416
<212>DNA
<213>解淀粉芽孢杆菌IFO3022
<400>15
atg gag aga aaa aca gta ttg gtt atc gct gac ctt ggg gga tgc ccg     48
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
  1               5                  10                  15
ccg cat atg ttt tac aaa agc gca gcc gaa aaa tac aac ctc gtc agc     96
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
             20                  25                  30
ttt att ccg aga cct ttt gca att aca gcc tct cat gcg gca tta att    144
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
         35                  40                  45
gaa aaa tac tcg gtc gcg gtc ata aaa gat aaa gac tat ttt aag agt    192
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
     50                  55                  60
ctg gct gat ttt gag cat ccc gat tcg att tac tgg gct cat gaa gat    240
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
 65                  70                  75                  80
cat gac aaa cct gag gaa gaa gta gtc gaa gaa atc gtc aag gtg gcc    288
His Asp Lys Pro Glu Glu Glu Val Val Glu Glu Ile Val Lys Val Ala
                 85                  90                  95
ggc atg ttc gcg gtt gac gcc att acg acc aac aat gaa ctg ttt atc   336
Gly Met Phe Ala Val Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
            100                 105                 110
gct ccg atg gca aaa gcg tgt gaa cgt ctc ggc ctg cgg gga gcg ggc   384
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
        115                 120                 125
gta cag gcc gct gaa aat gcc aga gat aaa aac aaa atg aga gcc gct   432
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Ala Ala
    130                 135                 140
ttc aac cgg gcc ggc gtc aag tct atc aaa aac aga cgg gtg acg acg   480
Phe Asn Arg Ala Gly Val Lys Ser Ile Lys Asn Arg Arg Val Thr Thr
145                 150                 155                 160
ctg gaa gat ttc cgc gcc gcg ctt cag gaa atc gga acg ccg ctc att   528
Leu Glu Asp Phe Arg Ala Ala Leu Gln Glu Ile Gly Thr Pro Leu Ile
                165                 170                 175
ctg aag cct aca tat ctg gcg agc tcc atc ggc gtg acg ctc atc aaa   576
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Lys
            180                 185                 190
gag agg gaa acg gcc gaa gcc gaa ttt aac aga gtc aat gaa tac ctg   624
Glu Arg Glu Thr Ala Glu Ala Glu Phe Asn Arg Val Asn Glu Tyr Leu
        195                 200                 205
aag tcg atc aac gta ccg aaa gcg gtc acg ttt gaa gcg ccg ttt atc   672
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
    210                 215                 220
gcg gaa gaa ttt ttg cag ggc gag tat gac gac tgg tac gaa aca agc   720
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Asp Asp Trp Tyr Glu Thr Ser
225                 230                 235                 240
ggt tat tcc gac tat atc agc ata gaa ggc atc atg gcc gac gga gaa   768
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
                245                 250                 255
tac ttc cct gtc gca att cat gat aaa aca ccg caa atc gga ttc acg   816
Tyr Phe Pro Val Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
            260                 265                 270
gag aca tcg cat att acg ccg tcc atc ctg gat gat gac gcg aag cgg    864
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Asp Asp Ala Lys Arg
        275                 280                 285
aaa atc gtc gaa gca gcc aaa aag gcg aat gaa gga ctc ggc ctc gaa    912
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Glu
    290                 295                 300
aac tgc gca acc cat aca gag att aaa tta atg aaa aac cgg gaa gcc    960
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Ala
305                 310                 315                 320
gga ctg att gaa tca gcg gca cga ttt gcg ggc tgg aac atg att ccg   1008
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
                325                 330                 335
aat att aaa aag gtc ttc ggc gtc gat atg gcg cag ctg tta ttg gat   1056
Asn Ile Lys Lys Val Phe Gly Val Asp Met Ala Gln Leu Leu Leu Asp
            340                 345                 350
gtt ctc tgt ttc gga aaa gaa gcc gat ctg ccg aaa gga tta ttg gag   1104
Val Leu Cys Phe Gly Lys Glu Ala Asp Leu Pro Lys Gly Leu Leu Glu
        355                 360                 365
cag gag ccg tgc tat gtc gcc gac tgc cac ttg tat cct cag cat ttc   1152
Gln Glu Pro Cys Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
    370                 375                 380
aaa gag aac ggc cag ctg cct gag acg gct gtc gat ttc gtc att gaa   1200
Lys Glu Asn Gly Gln Leu Pro Glu Thr Ala Val Asp Phe Val Ile Glu
385                 390                 395                 400
agc att gac att ccc gac ggc gtc tta aag gga gac acc gaa atc gtt   1248
Ser Ile Asp Ile Pro Asp Gly Val Leu Lys Gly Asp Thr Glu Ile Val
                405                 410                 415
tct ttc tcg gcg gcc gag gcg ggt aca tcc gtg gat ctg cgg ctg ttc   1296
Ser Phe Ser Ala Ala Glu Ala Gly Thr Ser Val Asp Leu Arg Leu Phe
            420                 425                 430
gaa gcg ttc aac agc att gcg gcg ttc gag ctg aaa gga agc aat tcg   1344
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
        435                 440                 445
ggt gac gtg gcc gaa tca atc aaa caa att cag cag cag gcg aag ctg   1392
Gly Asp Val Ala Glu Ser Ile Lys Gln Ile Gln Gln Gln Ala Lys Leu
    450                 455                 460
act gca aag tat gcg tta ccg gta                                   1416
Thr Ala Lys Tyr Ala Leu Pro Val
<210>16
<211>1428
<212>DNA
<213>短小芽孢杆菌NRRL B-12025
<400>16
gtg ctt tca ttg agt aaa aaa act gta ctt gtc att gct gac tta gga     48
Val Leu Ser Leu Ser Lys Lys Thr Val Leu Val Ile Ala Asp Leu Gly
  1               5                  10                  15
ggg tgc ccg ccc cat atg ttt tat gaa agc gtg gcg gca tca tac cat     96
Gly Cys Pro Pro His Met Phe Tyr Glu Ser Val Ala Ala Ser Tyr His
             20                  25                  30
atc gtt tct tat atc cca aga ccc ttt gcg att aca aag gga cat gcc    144
Ile Val Ser Tyr Ile Pro Arg Pro Phe Ala Ile Thr Lys Gly His Ala
         35                  40                  45
gag cta atc gaa aaa tac tcc att gcc gtc atc aaa gac cgt gat tat    192
Glu Leu Ile Glu Lys Tyr Ser Ile Ala Val Ile Lys Asp Arg Asp Tyr
     50                  55                  60
ttt gag aca cac cct tct ttt gaa cac cct gat tct att tac tgg gca    240
Phe Glu Thr His Pro Ser Phe Glu His Pro Asp Ser Ile Tyr Trp Ala
 65                  70                  75                  80
cat gat gat tat cca aaa tca gaa gaa gaa gtt gtg gaa gac ttc att    288
His Asp Asp Tyr Pro Lys Ser Glu Glu Glu Val Val Glu Asp Phe Ile
                 85                  90                  95
cga gta gct tcc ttt ttc aaa gca gat gca atc acg acc aat aat gaa    336
Arg Val Ala Ser Phe Phe Lys Ala Asp Ala Ile Thr Thr Asn Asn Glu
            100                 105                 110
tta ttc att gca ccg atg gca aag gcc gct gaa cgt ctt ggg cta cga    384
Leu Phe Ile Ala Pro Met Ala Lys Ala Ala Glu Arg Leu Gly Leu Arg
        115                 120                 125
ggt gcc ggt gtc aag gca gcc gaa atg gcg cgt gat aaa agc caa atg   432
Gly Ala Gly Val Lys Ala Ala Glu Met Ala Arg Asp Lys Ser Gln Met
    130                 135                 140
agg gct gca ttc aat gcc tct ggc gtc aaa gcg gtg aaa act cag cct   480
Arg Ala Ala Phe Asn Ala Ser Gly Val Lys Ala Val Lys Thr Gln Pro
145                 150                 155                 160
gtc acg act tta tct gat ttc caa caa gcc att gag tct atc gga aca   528
Val Thr Thr Leu Ser Asp Phe Gln Gln Ala Ile Glu Ser Ile Gly Thr
                165                 170                 175
ccg ctc att tta aag cct aca tat tta gcc agt tct att ggc gtc acc   576
Pro Leu Ile Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr
            180                 185                 190
ttg ttt cat gac aaa gcc gga agt gat gac ttg ttt tta caa gta caa   624
Leu Phe His Asp Lys Ala Gly Ser Asp Asp Leu Phe Leu Gln Val Gln
        195                 200                 205
tcg tat ttg gaa acc ata cca gtc cca gac gct gtc acg tat gaa gca   672
Ser Tyr Leu Glu Thr Ile Pro Val Pro Asp Ala Val Thr Tyr Glu Ala
    210                 215                 220
ccg ttt gtc gct gaa aca tat tta gag ggt gct tac gaa gat tgg tat   720
Pro Phe Val Ala Glu Thr Tyr Leu Glu Gly Ala Tyr Glu Asp Trp Tyr
225                 230                 235                 240
gaa gac gaa gga tat gct gat tat gtc agt gta gaa ggg ctg gtc gta   768
Glu Asp Glu Gly Tyr Ala Asp Tyr Val Ser Val Glu Gly Leu Val Val
                245                 250                 255
gag ggc gaa tat ctc cct ttt gtc ata cat gat aaa acc cct caa atc   816
Glu Gly Glu Tyr Leu Pro Phe Val Ile His Asp Lys Thr Pro Gln Ile
            260                 265                 270
ggc ttt aca gaa acg gct cat atc act ccg acg atc tta gac aat gaa   864
Gly Phe Thr Glu Thr Ala His Ile Thr Pro Thr Ile Leu Asp Asn Glu
        275                 280                 285
gcc aag caa atc atc att gaa gca gca agg aag gca aat gaa ggg cta   912
Ala Lys Gln Ile Ile Ile Glu Ala Ala Arg Lys Ala Asn Glu Gly Leu
    290                 295                 300
ggt ctt gaa cat tgt gca acc cat aca gaa atc aaa ctc atg aaa aat    960
Gly Leu Glu His Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn
305                 310                 315                 320
cga gaa act gga ctg atc gag gca gcg gct cga ttc gct ggc tgg aat   1008
Arg Glu Thr Gly Leu Ile Glu Ala Ala Ala Arg Phe Ala Gly Trp Asn
                325                 330                 335
atg atc ccg aat att aaa aaa gtc ttt ggc gtc gat atg gcg aag cta   1056
Met Ile Pro Asn Ile Lys Lys Val Phe Gly Val Asp Met Ala Lys Leu
            340                 345                 350
ttg att gat gta tta gtt gat ggt aaa aag gct gta ctg cca aaa cag   1104
Leu Ile Asp Val Leu Val Asp Gly Lys Lys Ala Val Leu Pro Lys Gln
        355                 360                 365
ctg ctt tct gga cat aca ttt tat gta gcg gac tgc cac ctg tac cct   1152
Leu Leu Ser Gly His Thr Phe Tyr Val Ala Asp Cys His Leu Tyr Pro
    370                 375                 380
cag cat ttt aaa gag agt ggg ctt atc ccg cct gaa gcc aca cat att   1200
Gln His Phe Lys Glu Ser Gly Leu Ile Pro Pro Glu Ala Thr His Ile
385                 390                 395                 400
acc att gat cat gtg tct att ccg cag gaa gca ttc gtt gga gat act   1248
Thr Ile Asp His Val Ser Ile Pro Gln Glu Ala Phe Val Gly Asp Thr
                405                 410                 415
gcg att gtc agt caa tca ttc cct gcc aaa ggg act att gtg gat ctt   1296
Ala Ile Val Ser Gln Ser Phe Pro Ala Lys Gly Thr Ile Val Asp Leu
            420                 425                 430
gaa tta ttt gaa gct ttt aat gga atc gta tct ctt gaa tta aaa gga   1344
Glu Leu Phe Glu Ala Phe Asn Gly Ile Val Ser Leu Glu Leu Lys Gly
        435                 440                 445
tca tcc tca caa gat gtt gcc gcg tcc atc cgc aac att cag aaa cag   1392
Ser Ser Ser Gln Asp Val Ala Ala Ser Ile Arg Asn Ile Gln Lys Gln
    450                 455                 460
gca acg att cag tta atg gat gaa tta gtg aag gga                   1428
Ala Thr Ile Gln Leu Met Asp Glu Leu Val Lys Gly
465                 470                 475
<210>17
<211>93
<212>PRT
<213>枯草芽孢杆菌 168
<400>17
Gly Ala Gly Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met
 l                5                  10                  15
Arg Asp Ala Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg
             20                  25                  30
Val Thr Thr Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr
         35                  40                  45
Pro Leu Ile Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr
     50                  55                  60
Leu Ile Thr Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn
 65                  70                  75                  80
Asp Tyr Leu Lys Ser Ile Asn Val Pro Lys Ala Val Thr
                 85                  90
<210>18
<211>279
<212>DNA
<213>枯草芽孢杆菌168
<400>18
ggt gcc ggc gtg cag gca gcc gaa aat gcc aga gat aaa aat aaa atg    48
Gly Ala Gly Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met
  1               5                  10                  15
agg gac gct ttt aat aag gcc gga gtc aaa tog atc aaa aac aaa cga    96
Arg Asp Ala Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg
             20                  25                  30
gtc aca act ctt gaa gat ttc cgt gct gct ctt gaa gag atc ggc aca   144
Val Thr Thr Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr
         35                  40                  45
cct ctt atc tta aag cct aca tac tta gcg agt tct atc ggt gta acg   192
Pro Leu Ile Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr
     50                  55                  60
ctg att acg gac act gag acg gca gaa gat gaa ttt aac aga gtc aat   240
Leu Ile Thr Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn
 65                  70                  75                  80
gac tat ctg aaa tca att aac gtg cca aag gcg gtt acg               279
Asp Tyr Leu Lys Ser Ile Asn Val Pro Lys Ala Val Thr
                 85                  90
<210>19
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>19
attctcgagt agagaaggag tgttttacat                                   30
<210>20
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>20
ttaggatcct catactggca gcacatactt                                   30
<210>21
<211>24
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>21
caagaattct catgtttgac agct                                        24
<210>22
<211>28
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>22
taactcgaga ttcccttttt acgtgaac                                    28
<210>23
<211>27
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>23
ttaaccatgg agagaaaaac agtattg                                     27
<210>24
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>24
atatggatcc tactggcagc acatactttg                                  30
<210>25
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>25
caccgcagac ggaggataca c                                           21
<210>26
<211>22
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>26
cggacgtcac ccaataatcg tg                                          22
<210>27
<211>23
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>27
ccgatggcra aagcstgtra acg                                         23
<210>28
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>28
cggcagatcr gcdtcttttc c                                           21
<210>29
<21l>26
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>29
gctaggtctt gaacattgtg caaccc                                      26
<210>30
<211>23
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>30
ggtgttccga tagactcaat ggc                                         23
<210>31
<211>44
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>31
catgccatgg agaaaaaaac tgtacttgtc attgctgact tagg                  44
<210>32
<211>38
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>32
cgcggatccc ttcactaatt catccattaa ctgaatcg                           38
<210>33
<211>12
<212>PRT
<213>人工序列
<220>
<221>UNSURE
<222>(3)
<223>Xaa代表选自下列的任何氨基酸:Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val
<220>
<221>UNSURE
<222>(4)
<223>Xaa代表选自下列的任何氨基酸:Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val
<220>
<221>UNSURE
<222>(9)
<223>Xaa代表选自下列的任何氨基酸:Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val
<220>
<221>UNSURE
<222>(10)
<223>Xaa代表选自下列的任何氨基酸:Leu,Ile,Val,Met和Ala
<220>
<221>UNSURE
<222>(11)
<223>Xaa代表Glu,Ser或Ala
<220>
<22l>UNSURE
<222>(12)
<223>Xaa代表Gly,Ser或Ala
<220>
<223>人工序列的描述:用于数据库搜索的氨基酸序列
<400>33
His Gly Xaa Xaa Gly Gln Asp Gly Xaa Xaa Xaa Xaa
5 10
<210>34
<211>28
<212>PRT
<213>人工序列
<220>
<221>UNSURE
<222>(1)
<223>Xaa代表Leu Ile或Val
<220>
<221>UNSURE
<222>(2)
<223>Xaa代表选自下列的任何氨基酸:Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val
<220>
<221>UNSURE
<222>(3)
<223>Xaa代表选自下列的任何氨基酸:Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val
<220>
<221>UNSURE
<222>(4)
<223>Xaa代表选自下列的任何氨基酸:Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val
<220>
<221>UNSURE
<222>(5)
<223>Xaa代表Gly或Ala
<220>
<221>UNSURE
<222>(6)
<223>Xaa代表选自下列的任何氨基酸:Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val
<220>
<221>UNSURE
<222>(7)
<223>Xaa代表选自下列的任何氨基酸:Gly,Ser,Ala,Ile和Val
<220>
<221>UNSURE
<222>(9)
<223>Xaa代表选自下列的任何氨基酸:Leu,Ile,Val,Met,Cys和Ala
<220>
<221>UNSURE
<222>(11)
<223>Xaa代表选自下列的任何氨基酸:Leu,Ile,Val,Met,Phe和Ala
<220>
<221>UNSURE
<222>(12)
<223>Xaa代表选自下列的任何氨基酸:Leu,Ile,Val,Met,Phe和Ala
<220>
<221>UNSURE
<222>(13)
<223>Xaa代表选自下列的任何氨基酸:Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val
<220>
<22l>UNSURE
<222>(14)
<223>Xaa代表选自下列的任何氨基酸:Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val
<220>
<221>UNSURE
<222>(15)
<223>Xaa代表选自下列的任何氨基酸:Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val
<220>
<221>UNSURE
<222>(16)
<223>Xaa代表选自下列的任何氨基酸:Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val
<220>
<221>UNSURE
<222>(17)
<223>Xaa代表选自下列的任何氨基酸:Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val
<220>
<221>UNSURE
<222>(18)
<223>Xaa代表选自下列的任何氨基酸:Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val
<220>
<221>UNSURE
<222>(19)
<223>Xaa代表选自下列的任何氨基酸:Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val
<220>
<221>UNSURE
<222>(20)
<223>Xaa代表Leu,Ile或Val
<220>
<221>UNSURE
<222>(21)
<223>Xaa代表选自下列的任何氨基酸:Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val
<220>
<221>UNSURE
<222>(23)
<223>Xaa代表选自下列的任何氨基酸:Leu,Ile,Val,Ala和Pro
<220>
<221>UNSURE
<222>(25)
<223>Xaa代表Ser,Thr或Pro
<220>
<221>UNSURE
<222>(26)
<223>Xaa代表选自下列的任何氨基酸:Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val
<220>
<221>UNSURE
<222>(28)
<223>Xaa代表Gly或Ala
<220>
<223>人工序列的描述:用于数据库搜索的氨基酸序列
<400>34
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Arg Xaa Asp Xaa Xaa Xaa Xaa Xaa Xaa
                  5                  10                  15
Xaa Xaa Xaa Xaa Xaa Gln Xaa Asn Xaa Xaa Pro Xaa
             20                  25
<210>35
<211>30
<212>PRT
<213>人工序列
<220>
<221>UNSURE
<222>(1)
<223>Xaa代表Leu Ile或Val
<220>
<221>UNSURE
<222>(2)
<223>Xaa代表选自下列的任何氨基酸:Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val
<220>
<221>UNSURE
<222>(3)
<223>Xaa代表选自下列的任何氨基酸:Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val
<220>
<221>UNSURE
<222>(4)
<223>Xaa代表选自下列的任何氨基酸:Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val
<220>
<221>UNSURE
<222>(5)
<223>Xaa代表Gly或Ala
<220>
<221>UNSURE
<222>(6)
<223>Xaa代表选自下列的任何氨基酸:Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val
<220>
<221>UNSURE
<222>(7)
<223>Xaa代表选自下列的任何氨基酸:Gly,Ser,Ala,Ile和Val
<220>
<221>UNSURE
<222>(9)
<223>Xaa代表选自下列的任何氨基酸:Leu,Ile,Val,Met,Cys和Ala
<220>
<221>UNSURE
<222>(11)
<223>Xaa代表选自下列的任何氨基酸:Leu,Ile,Val,Met,Phe和Ala
<220>
<221>UNSURE
<222>(12)
<223>Xaa代表选自下列的任何氨基酸:Leu,Ile,Val,Met,Phe和Ala
<220>
<221>UNSURE
<222>(13)
<223>Xaa代表选自下列的任何氨基酸:Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val
<220>
<221>UNSURE
<222>(14)
<223>Xaa代表选自下列的任何氨基酸:Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val
<220>
<221>UNSURE
<222>(15)
<223>Xaa代表选自下列的任何氨基酸:Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val
<220>
<221>UNSURE
<222>(16)
<223>Xaa代表选自下列的任何氨基酸:Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val
<220>
<221>UNSURE
<222>(17)
<223>Xaa代表选自下列的任何氨基酸:Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val
<220>
<221>UNSURE
<222>(18)
<223>Xaa代表选自下列的任何氨基酸:Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val
<220>
<221>UNSURE
<222>(19)
<223>Xaa代表选自下列的任何氨基酸:Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val
<220>
<221>UNSURE
<222>(20)
<223>Xaa代表选自下列的任何氨基酸:Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val
<220>
<221>UNSURE
<222>(21)
<223>Xaa代表选自下列的任何氨基酸:Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val
<220>
<22l>UNSURE
<222>(22)
<223>Xaa代表Leu,Ile或Val
<220>
<22l>UNSURE
<222>(23)
<223>Xaa代表选自下列的任何氨基酸:Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val
<220>
<221>UNSURE
<222>(25)
<223>Xaa代表选自下列的任何氨基酸:Leu,Ile,Val,Ala和Pro
<220>
<221>UNSURE
<222>(27)
<223>Xaa代表Ser,Thr或Pro
<220>
<22l>UNSURE
<222>(28)
<223>Xaa代表选自下列的任何氨基酸:Ala,Arg,Asn,Asp,Cys,Glu,Gln,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr和Val
<220>
<221>UNSURE
<222>(30)
<223>Xaa代表Gly或Ala
<220>
<223>人工序列的描述:用于数据库搜索的氨基酸序列
<400>35
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Arg Xaa Asp Xaa Xaa Xaa Xaa Xaa Xaa
                  5                  10                  15
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Gln Xaa Asn Xaa Xaa Pro Xaa
             20                  25                  30
<210>36
<211>1416
<212>DNA
<213>枯草芽孢杆菌ATCC 15245和枯草芽孢杆菌IAM 1033
<400>36
atg gag aga aaa aca gta ttg gtc atc gct gat ctt gga ggc tgc ccg    48
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
  1               5                  10                  15
ccg cac atg ttt tat aaa agc gct gct gaa aaa tat aac ctg gtc agc    96
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
             20                  25                  30
ttt att cca aga cct ttt gca att aca gcc tcc cat gca gca ttg att   144
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
         35                  40                  45
gaa aaa tac tcg gtc gcg gtc ata aaa gat aaa gac tat ttt aag agt   192
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
     50                  55                  60
tta gct gat ttt gag cat cct gat tcc att tat tgg gcg cat gag gat   240
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
 65                  70                  75                  80
cat aac aag cct gag gaa gag gtc gtc gag caa atc gtc aag gtt gcc   288
His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
                 85                  90                  95
gaa atg ttt ggg gcg gat gcc atc aca aca aac aat gaa tta ttc att   336
Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
            100                 105                 110
gct ccg atg gcg aaa gcc tgt gaa cgt ctg ggc ctg aga ggt gcc ggc   384
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
        115                 120                 125
gtg cag gca gcc gaa aat gcc aga gat aaa aat aaa atg agg gac gct   432
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
    130                 135                 140
ttt aat aag gcc gga gtc aaa tcg atc aaa aac aaa cga gtc aca act   480
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145                 150                 155                 160
ctt gaa gat ttc cgt gct gct ctt gaa gag atc ggc aca cct ctt atc   528
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
                165                 170                 175
tta aag cct aca tac tta gcg agt tca atc ggt gta acg ctg att acg   576
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
            180                 185                 190
gac act gag acg gca gaa gat gaa ttt aac aga gtc aat gac tat ctg   624
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
        195                 200                 205
aaa tca att aac gtg cca aag gcg gtt acg ttt gaa gcg ccg ttt atc   672
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
    210                 215                 220
gct gaa gaa ttt tta cag ggt gag tac gga gac tgg tat caa aca gaa   720
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225                 230                 235                 240
ggg tac tcc gac tat atc agt ata gaa ggc atc atg gct gac ggt gag   768
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
                245                 250                 255
tat ttc ccg atc gcc att cat gat aaa acg ccg caa atc ggg ttt aca   816
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
            260                 265                 270
gag aca tcc cac att acg ccg tcc att ctg gat gaa gag gca aaa aag   864
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
        275                 280                 285
aaa att gtc gaa gct gcc aaa aag gca aat gaa ggg ctt ggc ctg caa   912
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
    290                 295                 300
aat tgc gca aca cat aca gag atc aag cta atg aaa aac aga gaa ccg   960
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305                 310                 315                 320
ggt tta ata gag tcg gca gcc aga ttc gca ggc tgg aat atg att cct  1008
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
                325                 330                 335
aat att aaa aag gtc ttt ggc ctt gat atg gcg caa tta tta tta gat   1056
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
            340                 345                 350
gtc ctc tgt ttc gga aaa gac gcc gat ctg ccg gac gga tta ttg gat   1104
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
        355                 360                 365
caa gag cct tat tat gtt gcc gac tgc cat ttg tac ccg cag cat ttc   1152
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
    370                 375                 380
aaa caa aat ggc cag att cca gaa acc gct gag gat ttg gtc att gaa   1200
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385                 390                 395                 400
gcg atc gat att ccg gac ggg ctt tta aaa ggg gat act gaa atc gtt   1248
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
                405                 410                 415
tca ttt tca gcc gca gca cca ggc act tca gtt gat ttg aca ttg ttt   1296
Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
            420                 425                 430
gaa gct ttc aat tcc att gct gca ttt gaa ctg aaa ggc agt aat tca   1344
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
        435                 440                 445
cag gat gtg gct gaa tca atc aga caa att cag cag cat gca aag ctg   1392
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
    450                 455                 460
acg gca aag tat gtg ctg cca gta                                   1416
Thr Ala Lys Tyr Val Leu Pro Val
465                 470

Claims (21)

1.选自下面的[1]至[4]的蛋白,条件是不包括由SEQ ID NO:1所示的氨基酸序列组成的蛋白:
[1]含有SEQ ID NO:2至8中的任一个所示的氨基酸序列的蛋白;
[2]含有氨基酸序列的蛋白,其中在SEQ ID NO:1至8中的任一个所示的氨基酸序列中缺失、取代或添加了一个或多个氨基酸残基,且其具有合成式(I)所示的二肽的活性:
R1-R2      (I)
(其中R1和R2可以相同或不同,每个代表一个氨基酸残基,条件是R1和R2不同时代表L-丙氨酸);
[3]蛋白,其含有的氨基酸序列表现出与SEQ ID NO:1至8中的任一个所示的氨基酸序列具有65%或更多的相似性,且其具有合成式(I)所示的二肽的活性;和
[4]蛋白,其含有的氨基酸序列表现出与SEQ ID NO:17所示的氨基酸序列具有80%或更多的相似性,且其具有合成式(I)所示的二肽的活性。
2.用于合成式(I)所示的二肽的蛋白:
R1-R2           (I)
(其中R1和R2可以相同或不同,每个代表一个氨基酸残基,条件是R1和R2不同时代表L-丙氨酸),其含有SEQ ID NO:1所示的氨基酸序列。
3.选自下面的[1]至[4]的DNA,条件是不包括由SEQ ID NO:9所示的核苷酸序列组成的DNA:
[1]编码根据权利要求1的蛋白的DNA;
[2]含有SEQ ID NO:10至16和36中的任一个所示的核苷酸序列的DNA;
[3]DNA,其能在严格条件下与含有SEQ ID NO:9至16和36中的任一个所示的核苷酸序列的DNA杂交,且其编码具有合成式(I)所示的二肽的活性的蛋白:
R1-R2(I)
(其中R1和R2可以相同或不同,每个代表一个氨基酸残基,条件是R1和R2不同时代表L-丙氨酸);和
[4]DNA,其含有与SEQ ID NO:18所示的核苷酸序列有80%或更多的相似性的核苷酸序列,且编码具有合成式(I)所示的二肽的活性的蛋白。
4.重组DNA,其含有根据权利要求3的DNA。
5.转化体,其携带根据权利要求4的重组DNA。
6.根据权利要求5的转化体,其中该转化体是使用微生物作为宿主得到的转化体。
7.根据权利要求6的转化体,其中该微生物是埃希氏菌属的微生物。
8.生产根据权利要求1的蛋白的方法,其包括:在培养基中培养根据权利要求5至7中的任一项的转化体,使根据权利要求1的蛋白在培养物中形成和积累,和从培养物中回收蛋白。
9.生产根据权利要求1的蛋白的方法,其包括:在培养基中培养能生产根据权利要求1的蛋白的微生物,使所述蛋白在培养物中形成和积累,和从培养物中回收所述蛋白。
10.根据权利要求9的方法,其中该微生物是芽孢杆菌属的微生物。
11.根据权利要求10的方法,其中该芽孢杆菌属的微生物是能生产芽孢杆菌溶素的芽孢杆菌属的微生物。
12.根据权利要求11的方法,其中所述能生产芽孢杆菌溶素的芽孢杆菌属的微生物是选自下面种属的微生物:枯草芽孢杆菌,解淀粉芽孢杆菌,凝结芽孢杆菌,地衣芽胞杆菌,巨大芽孢杆菌和短小芽孢杆菌。
13.生产式(I)所示的二肽的方法:
R1-R2    (I)
(其中R1和R2可以相同或不同,每个代表一个氨基酸残基,条件是R1和R2不同时代表L-丙氨酸),其包括:
使根据权利要求1的蛋白或根据权利要求2的用于二肽合成的蛋白、至少2个可以相同或不同的氨基酸、和ATP存在于水性介质中;
使二肽在介质中形成和积累;和
从介质中回收二肽。
14.生产式(I)所示的二肽的方法:
R1-R2      (I)
(其中R1和R2可以相同或不同,每个代表一个氨基酸残基,条件是R1和R2不同时代表L-丙氨酸),其包括:
使酶源和至少2个可以相同或不同的氨基酸存在于水性介质中,所述的酶源是选自下面的[1]至[3]的培养物或处理过的培养物:
[1]根据权利要求5至7中的任一项的转化体的培养物,或处理过的所述培养物;
[2]能生产根据权利要求1的蛋白的微生物的培养物,或处理过的所述培养物;和
[3]能生产根据权利要求2的用于二肽合成的蛋白的微生物的培养物,或处理过的所述培养物;
使二肽在介质中形成和积累;和
从介质中回收二肽。
15.根据权利要求14的方法,其中能生产根据权利要求1的蛋白的微生物是芽孢杆菌属的微生物。
16.根据权利要求15的方法,其中所述芽孢杆菌属的微生物是能生产芽孢杆菌溶素的芽孢杆菌属的微生物。
17.根据权利要求16的方法,其中能生产芽孢杆菌溶素的芽孢杆菌属的微生物是选自下面种属的微生物:枯草芽孢杆菌,解淀粉芽孢杆菌,凝结芽孢杆菌,地衣芽胞杆菌,巨大芽孢杆菌和短小芽孢杆菌。
18.根据权利要求14的方法,其中能生产根据权利要求2的用于二肽合成的蛋白的微生物是用包含含有SEQ ID NO:9所示的核苷酸序列的DNA的重组DNA转化的微生物,或枯草芽孢杆菌属的微生物。
19.根据权利要求18的方法,其中携带包含含有SEQ ID NO:9所示的核苷酸序列的DNA的重组DNA的微生物是埃希氏菌属的微生物。
20.根据权利要求14至19中的任一项的方法,其中处理过的所述培养物是浓缩的培养物、干燥的培养物、通过离心培养物得到的细胞、通过提取细胞得到的酶制品或通过对细胞进行下述操作得到的产物:干燥,冻干,用表面活性剂、超声破碎、机械摩擦处理,用溶剂处理,酶处理,蛋白分级或固定化。
21.根据权利要求13至20中的任一项的方法,其中该二肽是式(II)代表的二肽:
R3-R4     (II)
(其中R3和R4可以相同或不同,每个代表选自下述的氨基酸残基:L-丙氨酸,L-谷氨酰胺,L-谷氨酸,甘氨酸,L-缬氨酸,L-亮氨酸,L-异亮氨酸,L-脯氨酸,L-苯丙氨酸,L-色氨酸,L-甲硫氨酸,L-丝氨酸,L-苏氨酸,L-半胱氨酸,L-天冬酰胺,L-酪氨酸,L-赖氨酸,L-精氨酸,L-组氨酸,L-天门冬氨酸,L-α-氨基丁酸,β-丙氨酸,L-重氮丝氨酸,L-茶氨酸,L-4-羟基脯氨酸,L-3-羟基脯氨酸,L-鸟氨酸,L-瓜氨酸和L-6-重氮-5-氧-正亮氨酸,条件是R3和R4不同时代表L-丙氨酸)。
CNB2003801048506A 2002-12-26 2003-12-26 生产二肽的方法 Expired - Lifetime CN100400660C (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2002376054 2002-12-26
JP376054/2002 2002-12-26
JP2003420887 2003-12-18
JP420887/2003 2003-12-18

Publications (2)

Publication Number Publication Date
CN1720325A true CN1720325A (zh) 2006-01-11
CN100400660C CN100400660C (zh) 2008-07-09

Family

ID=32473734

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2003801048506A Expired - Lifetime CN100400660C (zh) 2002-12-26 2003-12-26 生产二肽的方法

Country Status (12)

Country Link
US (2) US7514242B2 (zh)
EP (3) EP1983059A3 (zh)
JP (1) JP4447467B2 (zh)
KR (1) KR101043562B1 (zh)
CN (1) CN100400660C (zh)
AT (1) ATE392430T1 (zh)
AU (1) AU2003296151A1 (zh)
CA (1) CA2511553C (zh)
DE (1) DE60320362T2 (zh)
ES (2) ES2544480T3 (zh)
HK (1) HK1086296A1 (zh)
WO (1) WO2004058960A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103897023A (zh) * 2014-02-28 2014-07-02 苏州维泰生物技术有限公司 一种合成甘氨酸半胱氨酸伪二肽模块的新方法

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050106703A1 (en) * 2003-11-05 2005-05-19 Kyowa Hakko Kogyo Co., Ltd. Microorganisms producing dipeptides and process for producing dipeptides using the microorganisms
US20050148048A1 (en) * 2003-11-27 2005-07-07 Kyowa Hakko Kogyo Co., Ltd. Process for producing dipeptides
WO2006001382A1 (ja) * 2004-06-25 2006-01-05 Kyowa Hakko Kogyo Co., Ltd. ジペプチドまたはジペプチド誘導体の製造法
CN1997738A (zh) * 2004-06-25 2007-07-11 协和发酵工业株式会社 二肽或二肽衍生物的制备方法
CN103642882A (zh) * 2004-06-25 2014-03-19 协和发酵生化株式会社 二肽的制造方法
US9081199B2 (en) * 2005-03-18 2015-07-14 Kyowa Hakko Bio Co., Ltd. Process for the production of dipeptides by a dipeptide-synthesizing enzyme
JP4931801B2 (ja) * 2005-03-29 2012-05-16 協和発酵バイオ株式会社 ジペプチドの結晶およびその製造法
EP1941896A4 (en) 2005-09-20 2010-01-27 Kyowa Hakko Bio Co Ltd COMPOSITION CONTAINING A DIPEPTIDE FOR ORAL ADMINISTRATION
JPWO2007066430A1 (ja) * 2005-12-08 2009-05-14 協和発酵キリン株式会社 ペプチドの製造法
US20090197303A1 (en) * 2005-12-27 2009-08-06 Kyowa Hakko Kogyo Co., Ltd. Process for producing dipeptides
WO2008001837A1 (en) 2006-06-28 2008-01-03 Kyowa Hakko Bio Co., Ltd. Method for purification of oligopeptide
EP2067857B1 (en) 2006-09-25 2012-04-11 Kyowa Hakko Bio Co., Ltd Method for production of dipeptide
WO2008056759A1 (fr) * 2006-11-09 2008-05-15 Kyowa Hakko Bio Co., Ltd. Procédé de production de dipeptide
WO2008123607A1 (ja) * 2007-04-04 2008-10-16 Kyowa Hakko Bio Co., Ltd. ジペプチドの製造法
WO2008126783A1 (ja) 2007-04-06 2008-10-23 Kyowa Hakko Bio Co., Ltd. ジペプチドの製造法
WO2009028253A1 (ja) * 2007-08-31 2009-03-05 Kyowa Hakko Bio Co., Ltd. ペプチドの製造法
US8541209B2 (en) 2008-05-12 2013-09-24 Kyowa Hakko Bio Co., Ltd. L-proline cis-4-hydroxylase and use thereof to produce cis-4-hydroxy-L-proline
DE102009002044A1 (de) * 2009-03-31 2010-10-07 Evonik Degussa Gmbh Dipeptide als Futtermitteladditive
CN101643712B (zh) * 2009-09-15 2010-12-29 南京师范大学 高效转化谷氨酰胺合成l-茶氨酸的大肠杆菌菌株及其应用
EP2496232B1 (en) 2009-11-06 2016-08-31 Kyowa Hakko Bio Co., Ltd. A method to enhance endurance
WO2012017925A1 (ja) 2010-08-02 2012-02-09 協和発酵キリン株式会社 物質の製造方法
JP5951953B2 (ja) * 2011-10-07 2016-07-13 協和発酵バイオ株式会社 新規ジペプチド合成酵素およびそれを用いたジペプチドの製造法
US20130225684A1 (en) 2012-02-28 2013-08-29 Kyowa Hakko Bio Co., Ltd. Methods and compositions for enhancement of vision performance
KR101495597B1 (ko) * 2013-10-16 2015-02-26 한국식품연구원 젓갈 유래 바실러스속 미생물 및 이를 이용하여 s-아데노실-l-메티오닌을 대량 생산하는 방법
CN105510497A (zh) * 2015-11-30 2016-04-20 精晶药业股份有限公司 L-丙氨酰-l-丙氨酸的定量检测方法
CN106552600B (zh) * 2016-10-18 2019-06-25 武汉理工大学 一种磁性壳核结构纳米粒子及其制备方法与应用
CN108048372B (zh) * 2018-01-30 2021-07-02 西南大学 一种短小芽孢杆菌及其防治蚕核型多角体病毒感染的应用
US20240141402A1 (en) 2020-06-25 2024-05-02 Kyowa Hakko Bio Co., Ltd. Method for producing dipeptide
KR20240113674A (ko) * 2023-01-13 2024-07-23 씨제이제일제당 (주) 신규 카르노신 합성 효소 및 이를 이용한 카르노신 생산 방법

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58110600A (ja) 1981-12-25 1983-07-01 Kyowa Hakko Kogyo Co Ltd ヒトβ型インタ−フエロン遺伝子を含む組みかえ体プラスミド
JPS58209991A (ja) 1982-05-27 1983-12-07 Kazutomo Imahori ペプチド又はペプチド誘導体の合成法
JPS58209992A (ja) 1982-05-27 1983-12-07 Kazutomo Imahori ペプチド又はペプチド誘導体の合成法
JPS58146539A (ja) 1982-01-26 1983-09-01 Kazutomo Imahori ペプチド又はペプチド誘導体の合成法
JPS59106298A (ja) 1982-12-09 1984-06-19 Kazutomo Imahori ペプチド又はペプチド誘導体の合成法
ATE282692T1 (de) 1983-01-13 2004-12-15 Max Planck Gesellschaft Nichtonkogenisches ti-plasmidvektorsystem und für das einschleusen expressionsfähiger gene in pflanzengenomen verwendbare rekombinante dna- moleküle
NL8300698A (nl) 1983-02-24 1984-09-17 Univ Leiden Werkwijze voor het inbouwen van vreemd dna in het genoom van tweezaadlobbige planten; agrobacterium tumefaciens bacterien en werkwijze voor het produceren daarvan; planten en plantecellen met gewijzigde genetische eigenschappen; werkwijze voor het bereiden van chemische en/of farmaceutische produkten.
EP0429093B1 (de) 1984-05-11 2001-08-08 Syngenta Participations AG Transformation von Pflanzenerbgut
ZA872705B (en) 1986-04-22 1987-10-05 Immunex Corporation Human g-csf protein expression
JPS63233798A (ja) 1986-10-09 1988-09-29 Kyowa Hakko Kogyo Co Ltd 5′−グアニル酸の製造法
IL84459A (en) 1986-12-05 1993-07-08 Agracetus Apparatus and method for the injection of carrier particles carrying genetic material into living cells
EP0832981A1 (en) 1987-02-17 1998-04-01 Pharming B.V. DNA sequences to target proteins to the mammary gland for efficient secretion
JP2545078B2 (ja) 1987-04-06 1996-10-16 協和醗酵工業株式会社 核酸関連物質の製造法
JP2928287B2 (ja) 1988-09-29 1999-08-03 協和醗酵工業株式会社 新規ポリペプチド
JPH0322979A (ja) 1989-06-19 1991-01-31 Kyowa Hakko Kogyo Co Ltd 新規プラスミノーゲン活性化因子
US5204253A (en) 1990-05-29 1993-04-20 E. I. Du Pont De Nemours And Company Method and apparatus for introducing biological substances into living cells
JP3131322B2 (ja) 1991-12-17 2001-01-31 協和醗酵工業株式会社 新規α2→3シアリルトランスフェラーゼ
EP1983056A1 (en) 1992-07-07 2008-10-22 Japan Tobacco Inc. Method for transforming monocotyledons
JP3756946B2 (ja) 1993-03-29 2006-03-22 協和醗酵工業株式会社 α1,3−フコシルトランスフェラーゼ
IT1264712B1 (it) 1993-07-13 1996-10-04 Eniricerche Spa Metodo di sintesi biologica di peptidi
IT1277466B1 (it) 1995-08-09 1997-11-10 Eniricerche Spa Peptide sintetasi ingegnerizzate e loro impiego per la produzione via non-ribosomale di peptidi
CA2237849C (en) 1996-09-17 2009-06-16 Kyowa Hakko Kogyo Co., Ltd. Processes for producing sugar nucleotides and complex carbohydrates
DE19932908A1 (de) 1998-07-10 2000-01-20 Ipk Inst Fuer Pflanzengenetik Gene zur Biosynthese von Anticapsin und Bacilysin, ihre Isolierung und Verwendung
US20020064834A1 (en) * 1999-03-29 2002-05-30 Sascha Doekel Microbiological production method for alpha-L-aspartyl-L-phenylalanine

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103897023A (zh) * 2014-02-28 2014-07-02 苏州维泰生物技术有限公司 一种合成甘氨酸半胱氨酸伪二肽模块的新方法

Also Published As

Publication number Publication date
US20090191589A1 (en) 2009-07-30
US20040171106A1 (en) 2004-09-02
HK1086296A1 (en) 2006-09-15
EP1908773A3 (en) 2008-04-16
EP1433791B1 (en) 2008-04-16
EP1433791A2 (en) 2004-06-30
EP1983059A3 (en) 2009-04-22
EP1433791A3 (en) 2005-03-30
ES2544480T3 (es) 2015-08-31
ATE392430T1 (de) 2008-05-15
CN100400660C (zh) 2008-07-09
EP1908773B1 (en) 2015-07-22
DE60320362D1 (de) 2008-05-29
US7514242B2 (en) 2009-04-07
US8039236B2 (en) 2011-10-18
JPWO2004058960A1 (ja) 2006-04-27
EP1908773A2 (en) 2008-04-09
EP1908773B8 (en) 2015-09-09
CA2511553A1 (en) 2004-07-15
WO2004058960A1 (ja) 2004-07-15
DE60320362T2 (de) 2009-07-23
ES2306835T3 (es) 2008-11-16
KR101043562B1 (ko) 2011-06-22
CA2511553C (en) 2013-07-30
JP4447467B2 (ja) 2010-04-07
EP1983059A2 (en) 2008-10-22
KR20050084466A (ko) 2005-08-26
AU2003296151A1 (en) 2004-07-22

Similar Documents

Publication Publication Date Title
CN1720325A (zh) 生产二肽的方法
CN1295336C (zh) 利用微生物生产类异戊二烯化合物的方法和检测具有抗菌或除草活性的化合物的方法
CN1161470C (zh) 用于产生l-赖氨酸的方法
CN1159443C (zh) 用于产生l-赖氨酸的方法
CN1117152C (zh) 生产l-赖氨酸的方法
CN1165619C (zh) 制备l-赖氨酸的方法
CN1268742C (zh) 肽生成酶的基因、肽生成酶以及二肽的生产方法
CN1217724A (zh) 降钙素片段的重组制备方法和其在制备降钙素和相关类似物中的用途
CN1993377A (zh) 丙氨酸2,3氨基变位酶
CN1617927A (zh) 焦谷氨酰肽酶及其基因
CN1908174A (zh) 生产l-赖氨酸的方法
CN1151252C (zh) 生产微生物转谷氨酰胺酶的方法
CN1993463A (zh) 促滤泡素抑制素突变多肽
CN1492048A (zh) 新型腈水合酶
CN1550546A (zh) 通过发酵生产l—精氨酸或l—赖氨酸的方法
CN1946847A (zh) 二肽的制备方法
CN101040047A (zh) 编码新型的具有d-丝氨酸合成活性的酶的dna、该酶的制备方法、及利用该酶的d-丝氨酸制备方法
CN101029311A (zh) 过氧化氢酶基因及其用途
CN1502689A (zh) 生产l-谷氨酰胺的方法和生产l-谷氨酰胺的细菌
CN1213146C (zh) 从新的融合蛋白制造重组胰岛素的方法
CN1882683A (zh) 生产二肽的微生物和使用该微生物制造二肽的方法
CN1183248C (zh) 环状缩肽合成酶及其基因、以及环状缩肽的大规模生产系统
CN1934250A (zh) 新的醇脱氢酶
CN1226417C (zh) 用n-乙酰葡糖胺2-差向异构酶生产n-乙酰甘露糖胺的方法
CN1141387C (zh) ppGpp合成酶及用于改善目的蛋白产生的表达系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1086296

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: XIEHE FERMENTATION BIOCHEMICAL CO., LTD.

Free format text: FORMER OWNER: KYOWA HAKKO KOGYO CO., LTD.

Effective date: 20090508

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20090508

Address after: Tokyo, Japan

Patentee after: KYOWA HAKKO BIO Co.,Ltd.

Address before: Tokyo, Japan

Patentee before: KYOWA HAKKO KOGYO Co.,Ltd.

REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1086296

Country of ref document: HK

CX01 Expiry of patent term

Granted publication date: 20080709

CX01 Expiry of patent term