CN116829719A - 蛋白质脱酰胺酶 - Google Patents

蛋白质脱酰胺酶 Download PDF

Info

Publication number
CN116829719A
CN116829719A CN202280012194.XA CN202280012194A CN116829719A CN 116829719 A CN116829719 A CN 116829719A CN 202280012194 A CN202280012194 A CN 202280012194A CN 116829719 A CN116829719 A CN 116829719A
Authority
CN
China
Prior art keywords
ala
seq
leu
ser
glu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280012194.XA
Other languages
English (en)
Inventor
松原宽敬
日浦惠太
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Amano Enzyme Inc
Original Assignee
Amano Enzyme Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Amano Enzyme Inc filed Critical Amano Enzyme Inc
Publication of CN116829719A publication Critical patent/CN116829719A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • C12N9/80Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5) acting on amide bonds in linear amides (3.5.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/52Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from bacteria or Archaea
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y304/00Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/01Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in linear amides (3.5.1)
    • C12Y305/01044Protein-glutamine glutaminase (3.5.1.44)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/101Plasmid DNA for bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • C12R2001/20Flavobacterium
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • C12R2001/465Streptomyces

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明提供了一种新的蛋白质脱酰胺酶。一种蛋白质脱酰胺酶,其包含以下任一种多肽:包含序列号1~11中任一者所示的氨基酸序列或其部分序列(序列号1的338~515位、序列号2的381~564位、序列号4的122~309位、序列号5的1~146位、序列号6的19~235位、序列号6的19~205位、序列号7的10~303位、序列号7的10~186位、序列号9的162~426位、或序列号9的162~341位的氨基酸序列)的多肽;包含在序列号1~11中任一者所示的氨基酸序列或其部分序列中,一个或多个氨基酸被替换、添加、插入或缺失而成的氨基酸序列且具有蛋白质谷氨酰胺酶活性的多肽;或包含相对于序列号1~11中任一者所示的氨基酸序列或其部分序列的序列一致性为70%以上的氨基酸序列且具有蛋白质谷氨酰胺酶活性的多肽。

Description

蛋白质脱酰胺酶
技术领域
本发明涉及新型的蛋白质脱酰胺酶。
背景技术
蛋白质脱酰胺酶是作用于作为高分子的蛋白质,催化不伴随肽键的切断和蛋白质的交联而分解含酰胺基侧链(即脱酰胺化)的反应的酶。蛋白质脱酰胺酶通过使蛋白质中的谷氨酰胺残基脱酰胺化产生负电荷的羧基,因此对蛋白质带来各种特性变化。例如,由蛋白质的等电点降低引起的水合力的增加和静电斥力的上升使蛋白质间的相互作用降低(即,使缔合性降低),因此使蛋白质的可溶性和水分散性增大。另外,由于蛋白质的高级结构变化引起的内部疏水性区域的外露对蛋白质赋予表面活性,因此使蛋白质的乳化能力、乳化稳定性、起泡性、泡沫稳定性提高。蛋白质脱酰胺酶能够如此使蛋白质的特性大幅变化,因此使蛋白质的用途显著增大。因此,蛋白质脱酰胺酶的实用性非常高,在该技术领域中受到了高的关注。
最初发现的蛋白质脱酰胺酶是2000年从解朊金黄杆菌(Chryseobacteriumproteolyticum)中发现的蛋白质谷氨酰胺酶(非专利文献1)。然而,蛋白质谷氨酰胺酶,尽管其具有高实用性和高关注,但在其后约20年的长时间内没有新的发现,也是非常特殊的酶。在约20年后,从溃疡拟杆菌(Bacteroides helcogenes)中发现了蛋白质谷氨酰胺酶(非专利文献2),但在2021年1月的现在,产业利用的蛋白质谷氨酰胺酶仅来自解朊金黄杆菌(C.proteolyticum)。
现有技术文献
非专利文献
非专利文献1:A novel protein-deamidating enzyme from Chryseobacteriumproteolyticum sp.nov.,a newly isoated bacterium from soil.Applied andEnvironmental Microbiology 2000;66(8):3337-43
非专利文献2:A novel protein glutaminase from Bacteroides helcogenes-characterization and comparison,Applied Microbiology and Biotechnology(2020)104:187-199
发明内容
发明所要解决的技术问题
作为本领域技术人员的一般技术常识,因为在报告了来自解朊金黄杆菌的蛋白质谷氨酰胺酶之后的长年时间没有发现,因此认定具有蛋白质谷氨酰胺酶活性的蛋白质脱酰胺酶是自然界中几乎不存在的特殊的酶,在常规的筛选中无法得到。发现除了来自解朊金黄杆菌的蛋白质谷氨酰胺酶以外的具有蛋白质谷氨酰胺酶活性的蛋白质脱酰胺酶的例子仅一例,即,来自溃疡拟杆菌(B.helcogenes)的蛋白质谷氨酰胺酶,本领域技术人员对该酶的认识依然受到上述技术常识的约束。
其中,本发明的目的在于特意发现新的蛋白质脱酰胺酶。
用于解决技术问题的技术方案
本发明人为了发现新的蛋白质脱酰胺酶而进行了深入研究,但从与公知的蛋白质脱酰胺酶的序列一致性高的候选中,完全没有发现具有蛋白质脱酰胺活性的酶。然而,偶然发现:在与公知的蛋白质脱酰胺酶的序列一致性低的蛋白质组中,存在具有蛋白质脱酰胺化活性的酶。本发明是基于这些发现而完成的。
即,本发明提供下述揭示的方式的发明。
项1.一种蛋白质脱酰胺酶,其包含以下(a)~(c)中任一项所示的多肽。
(a)多肽,其包含序列号1~11中任一者所示的氨基酸序列、或者序列号1的338~515位的氨基酸序列、序列号2的381~564位的氨基酸序列、序列号4的122~309位的氨基酸序列、序列号5的1~146位的氨基酸序列、序列号6的19~235位的氨基酸序列、序列号6的19~205位的氨基酸序列、序列号7的10~303位的氨基酸序列、序列号7的10~186位的氨基酸序列、序列号9的162~426位的氨基酸序列、或序列号9的162~341位的氨基酸序列;
(b)多肽,其包含在序列号1~11中任一者所示的氨基酸序列、或者序列号1的338~515位的氨基酸序列、序列号2的381~564位的氨基酸序列、序列号4的122~309位的氨基酸序列、序列号5的1~146位的氨基酸序列、序列号6的19~235位的氨基酸序列、序列号6的19~205位的氨基酸序列、序列号7的10~303位的氨基酸序列、序列号7的10~186位的氨基酸序列、序列号9的162~426位的氨基酸序列、或序列号9的162~341位的氨基酸序列中,一个或多个氨基酸被替换、添加、插入或缺失而成的氨基酸序列,且具有催化使蛋白质的谷氨酰胺残基脱酰胺化的反应的活性;
(c)多肽,其包含相对于序列号1~11中任一者所示的氨基酸序列、或者、序列号1的338~515位的氨基酸序列、序列号2的381~564位的氨基酸序列、序列号4的122~309位的氨基酸序列、序列号5的1~146位的氨基酸序列、序列号6的19~235位的氨基酸序列、序列号6的19~205位的氨基酸序列、序列号7的10~303位的氨基酸序列、序列号7的10~186位的氨基酸序列、序列号9的162~426位的氨基酸序列、或序列号9的162~341位的氨基酸序列的序列一致性为70%以上的氨基酸序列,且具有催化使蛋白质的谷氨酰胺残基脱酰胺化的反应的活性。
项2.一种DNA,其编码项1所述的蛋白质脱酰胺酶。
项3.一种表达盒或重组载体,其包含项2所述的DNA。
项4.一种转化体,其是使用项3所述的表达盒或重组载体转化宿主而得到的。
项5.一种蛋白质脱酰胺酶的制造方法,其包括培养项4所述的转化体的工序。
项6.一种酶制剂,其包含项1所述的蛋白质脱酰胺酶。
项7.根据项6所述的酶制剂,其为含有蛋白质的饮食品或饮食品用原材料、产业用原材料、或者医药用原材料的改性剂。
项8.一种谷氨酰胺残基被脱酰胺化的蛋白质的制造方法,其包括使项1所述的蛋白质脱酰胺酶作用于蛋白质的工序。
项9.根据项8所述的制造方法,其中,在饮食品或饮食品用原材料、产业用原材料、或者医药用原材料中含有所述蛋白质。
项10.一种改性的饮食品或饮食品用原材料、产业用原材料、或者医药用原材料的制造方法,其包括使项1所述的蛋白质脱酰胺酶作用于含有蛋白质的饮食品或饮食品用原材料、产业用原材料、或者医药用原材料的工序。
发明效果
根据本发明,提供一种新型的蛋白质脱酰胺酶。
具体实施方式
在本说明书中,“非极性氨基酸”包含丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、蛋氨酸、苯丙氨酸和色氨酸。“非电荷氨基酸”包含甘氨酸、丝氨酸、苏氨酸、半胱氨酸、酪氨酸、天冬酰胺和谷氨酰胺。“酸性氨基酸”包含天冬氨酸和谷氨酸。“碱性氨基酸”包含赖氨酸、精氨酸和组氨酸。
1.蛋白质脱酰胺酶
本发明的蛋白质脱酰胺酶为:(1)来自嗜盐噬菌弧菌属细菌(Halobacteriovoraxsp.)、(2)来自嗜盐噬菌弧菌科(Halobacteriovoraceae)细菌、(3)来自粳稻类群(Oryzasativa Japonica Group)、(4)来自酸杆菌门(Acidobacteria)细菌、(5)来自δ-变形菌纲(Deltaproteobacteria)细菌、(6)来自红螺菌科(Rhodospirillaceae)细菌、(7)来自Flavobacterium alvei、(8)来自Embleya scabrispora、(9)来自肯塔基伦茨氏菌(Lentzeakentuckyensis)、(10)来自Streptomyces chilikensis、和(11)来自链霉菌属细菌(Streptomyces sp.)的蛋白质脱酰胺酶、以及与这些蛋白质脱酰胺酶序列类似的蛋白质脱酰胺酶。
具体而言,本发明的蛋白质脱酰胺酶包含以下(a)~(c)中任一项所示的多肽。
(a)多肽,其包含序列号1~11中任一者所示的氨基酸序列、或者序列号1的338~515位的氨基酸序列、序列号2的381~564位的氨基酸序列、序列号4的122~309位的氨基酸序列、序列号5的1~146位的氨基酸序列、序列号6的19~235位的氨基酸序列、序列号6的19~205位的氨基酸序列、序列号7的10~303位的氨基酸序列、序列号7的10~186位的氨基酸序列、序列号9的162~426位的氨基酸序列、或序列号9的162~341位的氨基酸序列;
(b)多肽,其包含在序列号1~11中任一者所示的氨基酸序列、或者、序列号1的338~515位的氨基酸序列、序列号2的381~564位的氨基酸序列、序列号4的122~309位的氨基酸序列、序列号5的1~146位的氨基酸序列、序列号6的19~235位的氨基酸序列、序列号6的19~205位的氨基酸序列、序列号7的10~303位的氨基酸序列、序列号7的10~186位的氨基酸序列、序列号9的162~426位的氨基酸序列、或序列号9的162~341位的氨基酸序列中,一个或多个氨基酸被替换、添加、插入或缺失而成的氨基酸序列,且具有催化使蛋白质的谷氨酰胺残基脱酰胺化的反应的活性;
(c)多肽,其包含相对于序列号1~11中任一者所示的氨基酸序列、或者、序列号1的338~515位的氨基酸序列、序列号2的381~564位的氨基酸序列、序列号4的122~309位的氨基酸序列、序列号5的1~146位的氨基酸序列、序列号6的19~235位的氨基酸序列、序列号6的19~205位的氨基酸序列、序列号7的10~303位的氨基酸序列、序列号7的10~186位的氨基酸序列、序列号9的162~426位的氨基酸序列、或序列号9的162~341位的氨基酸序列的序列一致性为70%以上的氨基酸序列,且具有催化使蛋白质的谷氨酰胺残基脱酰胺化的反应的活性。
以下,对包含(a)~(c)的多肽的蛋白质脱酰胺酶进行详述。
1-1.包含(a)的多肽的蛋白质脱酰胺酶
1-1-1.来自嗜盐噬菌弧菌属细菌的蛋白质脱酰胺酶
序列号1是来自嗜盐噬菌弧菌属细菌的蛋白质脱酰胺酶的示例的全长序列。序列号1包含被推定为Pro序列的序列。来自嗜盐噬菌弧菌属细菌的蛋白质脱酰胺酶的另一示例的蛋白质不包含N末端序列,所述N末端序列含有序列号1中被推定为Pro序列的序列,具体而言,包含序列号1的338~515位的氨基酸序列。
1-1-2.来自嗜盐噬菌弧菌科细菌的蛋白质脱酰胺酶
序列号2是来自嗜盐噬菌弧菌科细菌的蛋白质脱酰胺酶的示例的全长序列。序列号2包含被推定为Pro序列的序列。来自嗜盐噬菌弧菌科细菌的蛋白质脱酰胺酶的另一示例的蛋白质不包含N末端序列,所述N末端序列含有序列号2中被推定为Pro序列的序列,具体而言,包含序列号2的381~564位的氨基酸序列。
1-1-3.来自粳稻类群的蛋白质脱酰胺酶
序列号3是来自粳稻类群的蛋白质脱酰胺酶的示例的全长序列。序列号3可以包含N末端序列和/或C末端序列,所述N末端序列和/或C末端序列含有被推定为Pro序列的序列。
1-1-4.来自酸杆菌门细菌的蛋白质脱酰胺酶
序列号4是来自酸杆菌门细菌的蛋白质脱酰胺酶的示例的全长序列。序列号4包含被推定为Pro序列的序列。来自酸杆菌门细菌的蛋白质脱酰胺酶的另一示例的蛋白质不包含N末端序列,所述N末端序列含有序列号4中被推定为Pro序列的序列,具体而言,包含序列号4的122~309位的氨基酸序列。
1-1-5.来自δ-变形菌纲细菌的蛋白质脱酰胺酶
序列号5是来自δ-变形菌纲细菌的蛋白质脱酰胺酶的示例的全长序列。序列号5包含C末端序列。来自δ-变形菌纲细菌的蛋白质脱酰胺酶的另一示例的蛋白质不包含序列号5中的C末端序列,具体而言,包含序列号5的1~146位的氨基酸序列(即序列号26所示的氨基酸序列)。
1-1-6.来自红螺菌科细菌的蛋白质脱酰胺酶
序列号6是来自红螺菌科细菌的蛋白质脱酰胺酶的示例的全长序列。序列号6包含被推定为Pro序列的序列和C末端序列。来自红螺菌科细菌的蛋白质脱酰胺酶的另一示例的蛋白质不包含N末端序列和/或C末端序,所述N末端序列和/或C末端序含有被推定为序列号6中的Pro序列的序列,具体而言,包含序列号6的19~235位的氨基酸序列或19~205位的氨基酸序列。
1-1-7.来自Flavobacterium alvei的蛋白质脱酰胺酶
序列号7是来自Flavobacterium alvei的蛋白质脱酰胺酶的示例的全长序列。序列号7包含被推定为Pro序列的序列和C末端序列。来自Flavobacterium alvei的蛋白质脱酰胺酶的另一示例的蛋白质不包含N末端序列和/或C末端序,所述N末端序列和/或C末端序含有序列号7中被推定为Pro序列的序列,具体而言,包含序列号7的10~303位的氨基酸序列或10~186位的氨基酸序列。
1-1-8.来自Embleya scabrispora的蛋白质脱酰胺酶
序列号8是来自Embleya scabrispora的蛋白质脱酰胺酶的示例的全长序列。序列号8可以包含Pro序列和/或C末端序列。
1-1-9.来自肯塔基伦茨氏菌的蛋白质脱酰胺酶
序列号9是来自肯塔基伦茨氏菌的蛋白质脱酰胺酶的示例的全长序列。序列号9包含被推定为Pro序列的序列和C末端序列。来自肯塔基伦茨氏菌的蛋白质脱酰胺酶的另一示例的蛋白质不包含N末端序列和/或C末端序,所述N末端序列和/或C末端序含有序列号9中被推定为Pro序列的序列的N末端序列和/或C末端序列,具体而言,包含序列号9的162~426位的氨基酸序列或162~341位的氨基酸序列。
1-1-10.来自Streptomyces chilikensis的蛋白质脱酰胺酶
序列号10是来自Streptomyces chilikensis的蛋白质脱酰胺酶的示例的全长序列。序列号10可以包含Pro序列和/或C末端序列。
1-1-11.来自链霉菌属细菌的蛋白质脱酰胺酶
序列号11是来自链霉菌属细菌的蛋白质脱酰胺酶的示例的全长序列。序列号11可以包含Pro序列和/或C末端序列。
1-2.包含(b)和(c)的多肽的蛋白质脱酰胺酶
(b)和(c)的多肽是以(a)的多肽的氨基酸序列为基本骨架的序列类似的蛋白质脱酰胺酶。
关于导入到上述(b)的多肽中的氨基酸的改变,可以仅包含选自替换、添加、插入和缺失中的1种改变(例如替换),也可以包含2种以上的改变(例如,替换和插入)。在上述(b)的多肽中,被替换、添加、插入或缺失的氨基酸可以为1个或多个、或者数个,例如可举出1~10个,优选为1~8个、1~6个、1~5个、或1~4个,更优选为1~3个,特别优选为1或2个、或者1个。
另外,在上述(c)的多肽中,序列一致性只要为70%以上即可,可举出优选为80%以上、85%以上、90%以上,进一步优选为95%以上、97%以上、98%以上,进一步优选为99%以上,特别优选为99.5%以上、99.8%以上。
在此,在上述(c)的多肽中,例如相对于序列号1所示的氨基酸序列的序列一致性是与序列号1所示的氨基酸序列比较而算出的序列一致性。对于相对于序列号2~11中任一者所示的氨基酸序列、或者、序列号1的338~515位的氨基酸序列、序列号2的381~564位的氨基酸序列、序列号4的122~309位的氨基酸序列、序列号5的1~146位的氨基酸序列、序列号6的19~235位的氨基酸序列、序列号6的19~205位的氨基酸序列、序列号7的10~303位的氨基酸序列、序列号7的10~186位的氨基酸序列、序列号9的162~426位的氨基酸序列、或序列号9的162~341位的氨基酸序列所示的氨基酸序列的序列一致性也相同。另外,“序列一致性”表示通过BLAST PACKAGE[sgi32 bit edition,Version 2.0.12;availablefrom National Center for Biotechnology Information(NCBI)]的bl2seq program(Tatiana A.Tatsusova,Thomas L.Madden,FEMS Microbiol.Lett.,Vol.174,p247-250,1999)得到的氨基酸序列的一致性的值。参数设定为Gap insertion Cost value:11、Gapextension Cost value:1即可。
在上述(b)和(c)的多肽中,认为序列号1所示的氨基酸序列中的第376位、第415位、第435位的氨基酸;序列号2所示的氨基酸序列中的第421位、第464位、第484位的氨基酸;序列号3所示的氨基酸序列中的第43位、第91位、第112位的氨基酸;序列号4所示的氨基酸序列中的第165位、第215位、第238位的氨基酸;序列号5所示的氨基酸序列中的第28位、第77位、第96位的氨基酸;序列号6所示的氨基酸序列中的第60位、第105位、第125位的氨基酸;序列号7所示的氨基酸序列中的第41位、第97位、第116位的氨基酸;序列号8所示的氨基酸序列中的第251位、第295位、第310位的氨基酸;序列号9所示的氨基酸序列中的第203位、第247位、第263位的氨基酸;序列号10所示的氨基酸序列中的第238位、第282位、第297位的氨基酸;序列号11所示的氨基酸序列中的第272位、第324位、第344位的氨基酸有助于活性,因此优选在这些部位(以下也记载为“规定部位”。)不导入替换或缺失。即,在上述(b)的多肽中,优选被替换、添加、插入或缺失的氨基酸的部位为该规定部位以外的部位,在上述(c)的多肽中,上述序列一致性优选为在除了该规定部位以外的部分的序列一致性。
在上述(b)和(c)的多肽中导入氨基酸替换的情况下,作为氨基酸替换的方式,可举出保守性替换。即,在(b)和(c)的多肽中,作为对序列号1~11中任一者所示的氨基酸序列、或者、序列号1的338~515位的氨基酸序列、序列号2的381~564位的氨基酸序列、序列号4的122~309位的氨基酸序列、序列号5的1~-146位的氨基酸序列、序列号6的19~235位的氨基酸序列、序列号6的19~205位的氨基酸序列、序列号7的10~303位的氨基酸序列、序列号7的10~186位的氨基酸序列、序列号9的162~426位的氨基酸序列或序列号9的162~341位的氨基酸序列所示的氨基酸序列导入的氨基酸替换,例如可举出:如果替换前的氨基酸为非极性氨基酸,则替换为其他非极性氨基酸;如果替换前的氨基酸为非带电性氨基酸,则替换为其他非带电性氨基酸;如果替换前的氨基酸为酸性氨基酸,则替换为其他酸性氨基酸;以及如果替换前的氨基酸为碱性氨基酸,则替换为其他碱性氨基酸。
在上述(b)和(c)的多肽中导入氨基酸添加的情况下,作为氨基酸添加的方式,例如可举出,向N末端的蛋氨酸残基的添加、纯化用标记(例如,寡聚组氨酸等的结合性寡肽)的添加等。
在上述(b)和(c)的多肽中,不仅包含人为变异而得到的多肽,还包含通过基于多肽来自的生物的个体差异或物种的差异的、天然产生的突变(突变体或变体)而产生的多肽。
在上述(b)和(c)的多肽中,“催化使蛋白质的谷氨酰胺残基脱酰胺化的反应的活性”(以下,也记载为“蛋白质谷氨酰胺酶活性”)是指作用于蛋白质,不伴随肽键的切断和蛋白质的交联而分解含酰胺基侧链的活性,具体而言,可以通过检测伴随谷氨酰胺残基的脱酰胺化的产物来确认。例如,蛋白质谷氨酰胺酶活性可以如下确认:通过以包含谷氨酰胺残基且不包含天冬酰胺残基的2个残基以上的肽(例如,N-苄氧羰基-L-谷氨酰胺酰甘氨酸(Z-Gln-Gly)等)为底物,使蛋白质脱酰胺酶发挥作用,作为产物,检测谷氨酰胺残基被转换为谷氨酸残基的底物或游离的氨来确认。蛋白质谷氨酰胺酶活性定量可以定量地基于上述产物的量、优选游离的氨的量来计算出蛋白质谷氨酰胺酶活性。具体而言,蛋白质谷氨酰胺酶活性可以如下测定:在包含30mmol/L的Z-Gln-Gly的0.2mol/L磷酸缓冲液(pH6.5)1mL中添加适当浓度的酶溶液0.1mL,在37℃下进行10分钟酶反应后,加入0.4mol/L的三氯乙酸溶液1mL,使酶反应停止,测定上清液中的氨浓度,由此进行测定。在本发明中,在该条件下,将在1分钟内生成1μmol的氨的酶活性定义为1个单位(U)的蛋白质谷氨酰胺酶活性。
作为上述(b)或(c)的多肽的具体例,可举出包含序列号23(在包含序列号1的338~515位的氨基酸序列的N末端添加有甲硫氨酸残基的多肽)、序列号24(在包含序列号2的381~564位的氨基酸序列的N末端添加有甲硫氨酸残基的多肽)、序列号25(在包含序列号4的122~309位的氨基酸序列的N末端添加有甲硫氨酸残基的多肽)、序列号27(在包含序列号6的19~235位的氨基酸序列的N末端添加有甲硫氨酸残基的氨基酸序列)、序列号28(在包含序列号6的19~205位的氨基酸序列的N末端添加有甲硫氨酸残基的多肽)、序列号29(在包含序列号7的10~303位的氨基酸序列的N末端添加有甲硫氨酸残基的多肽)、序列号30(在包含序列号7的10~186位的氨基酸序列的N末端添加有甲硫氨酸残基的多肽)、序列号31(在包含序列号9的162~426位的氨基酸序列的N末端添加有甲硫氨酸残基的多肽)、和序列号32(在包含序列号9的162~341位的氨基酸序列的N末端添加有甲硫氨酸残基的多肽)所示的氨基酸序列的多肽。
应予说明,将序列号1~11的氨基酸序列称为“全长序列”,与此相对,以下有时将序列号1的338~515位的氨基酸序列、序列号2的381~564位的氨基酸序列、序列号4的122~309位的氨基酸序列、序列号5的1~146位的氨基酸序列、序列号6的19~235位的氨基酸序列、序列号6的19~205位的氨基酸序列、序列号7的10~303位的氨基酸序列、序列号7的10~186位的氨基酸序列、序列号9的162~426位的氨基酸序列、和序列号9的162~341位的氨基酸序列称为“非全长序列”。另外,有时将包含全长序列的多肽称为“全长多肽”,将包含非全长序列的多肽称为“非全长多肽”。
2.DNA
编码本发明的蛋白质脱酰胺酶的DNA(以下,有时也表述为“本发明的DNA”)本领域技术人员可以根据本发明的蛋白质脱酰胺酶的氨基酸序列适当制备和设计。
关于编码本发明的蛋白质脱酰胺酶的DNA的碱基序列,本领域技术人员可以根据本发明的蛋白质脱酰胺酶中叙述的氨基酸序列适当设计。
具体而言,作为编码本发明的蛋白质脱酰胺酶的DNA的示例,可举出以下(i)~(iii)中任一者所示的DNA。
(i)包含序列号12~序列号22中任一者所示的碱基序列、或者、序列号12的1012~1548位的碱基序列、序列号13的1141~1695位的碱基序列、序列号15的364~930位的碱基序列、序列号16的1~438位的碱基序列、序列号17的55~708位的碱基序列、序列号17的55~615位的碱基序列、序列号18的28~912位的碱基序列、序列号18的28~558位的碱基序列、序列号20的484~1281位的碱基序列、或序列号20的484~1023位的碱基序列的DNA;
(ii)包含与序列号12~序列号22中任一者所示的碱基序列、或者、序列号12的1012~1548位的碱基序列、序列号13的1141~1695位的碱基序列、序列号15的364~930位的碱基序列、序列号16的1~438位的碱基序列、序列号17的55~708位的碱基序列、序列号17的55~615位的碱基序列、序列号18的28~912位的碱基序列、序列号18的28~558位的碱基序列、序列号20的484~1281位的碱基序列、或序列号20的484~1023位的碱基序列互补的碱基序列的DNA、和包含在严格条件下杂交的DNA的碱基序列的DNA;
(iii)包含相对于序列号12~序列号22中任一者所示的碱基序列、或者、序列号12的1012~1548位的碱基序列、序列号13的1141~1695位的碱基序列、序列号15的364~930位的碱基序列、序列号16的1~438位的碱基序列、序列号17的55~708位的碱基序列、序列号17的55~615位的碱基序列、序列号18的28~912位的碱基序列、序列号18的28~558位的碱基序列、序列号20的484~1281位的碱基序列、或序列号20的484~1023位的碱基序列具有70%以上的同源性的碱基序列的DNA。
以下,对(i)~(iii)的DNA进行详述。
2-1.(i)的DNA
2-1-1.编码来自嗜盐噬菌弧菌属细菌的蛋白质脱酰胺酶的DNA
例如,作为编码序列号1所示的氨基酸序列(来自嗜盐噬菌弧菌属细菌的蛋白质脱酰胺酶的示例的全长序列)的碱基序列,可举出序列号12所示的碱基序列;作为编码序列号1所示的氨基酸序列的338~515位的氨基酸序列(来自嗜盐噬菌弧菌属细菌的蛋白质脱酰胺酶的另一示例的蛋白质的、不含N末端序列的序列)的碱基序列,可举出序列号12的1012~1548位的碱基序列。
2-1-2.编码来自嗜盐噬菌弧菌科细菌的蛋白质脱酰胺酶的DNA
作为编码序列号2所示的氨基酸序列(来自嗜盐噬菌弧菌科细菌的蛋白质脱酰胺酶的示例的全长序列)的碱基序列,可举出序列号13所示的碱基序列;作为编码序列号2的381~564位的氨基酸序列(来自嗜盐噬菌弧菌科细菌的蛋白质脱酰胺酶的另一示例的蛋白质的、不含N末端序列的序列)的碱基序列,可举出序列号13的1141~1695位的碱基序列。
2-1-3.编码来自粳稻类群的蛋白质脱酰胺酶的DNA
作为编码序列号3所示的氨基酸序列(来自粳稻类群的蛋白质脱酰胺酶的示例的全长序列)的碱基序列,可举出序列号14所示的碱基序列。
2-1-4.编码来自酸杆菌门细菌的蛋白质脱酰胺酶的DNA
作为编码序列号4所示的氨基酸序列(来自酸杆菌门细菌的蛋白质脱酰胺酶的示例的全长序列)的碱基序列,可举出序列号15所示的碱基序列;作为编码序列号4的122~309位的氨基酸序列(来自酸杆菌门细菌的蛋白质脱酰胺酶的另一示例的蛋白质的、不含N末端序列的序列)的碱基序列,可举出序列号15的364~930位的碱基序列。
2-1-5.编码来自δ-变形菌纲细菌的蛋白质脱酰胺酶的DNA
作为编码序列号5所示的氨基酸序列(来自δ-变形菌纲细菌的蛋白质脱酰胺酶的示例的全长序列)的碱基序列,可举出序列号16所示的碱基序列;作为编码序列号5的1~146位的氨基酸序列(来自δ-变形菌纲细菌的蛋白质脱酰胺酶的另一示例的蛋白质的、不含C末端序列的序列)的碱基序列,可举出序列号16的1~438位的碱基序列。
2-1-6.编码来自红螺菌科细菌的蛋白质脱酰胺酶的DNA
作为编码序列号6所示的氨基酸序列(来自红螺菌科细菌的蛋白质脱酰胺酶的示例的全长序列)的碱基序列,可举出序列号17所示的碱基序列;作为编码序列号6的19~235位的氨基酸序列(来自红螺菌科细菌的蛋白质脱酰胺酶的另一示例的蛋白质的、不含N末端序列的序列)或序列号6的19~205位的氨基酸序列(来自红螺菌科细菌的蛋白质脱酰胺酶的另一示例的蛋白质的、不含N末端序列且不含C末端序列的序列)的碱基序列,分别可举出序列号17的55~708位的碱基序列或55~615位的碱基序列。
2-1-7.编码来自Flavobacterium alvei的蛋白质脱酰胺酶的DNA
作为编码序列号7所示的氨基酸序列(来自Flavobacterium alvei的蛋白质脱酰胺酶的示例的全长序列)的碱基序列,可举出序列号18所示的碱基序列;作为编码序列号7的10~303位的氨基酸序列(来自Flavobacterium alvei的蛋白质脱酰胺酶的另一示例的蛋白质的、不含N末端序列且不含C末端序列的序列)或序列号7的10~186位的氨基酸序列(来自Flavobacterium alvei的蛋白质脱酰胺酶的另一示例的蛋白质的不含N末端序列且不含C末端序列的序列)的碱基序列,分别可举出序列号18的28~912位的碱基序列或28~558位的碱基序列。
2-1-8.编码来自Embleya scabrispora的蛋白质脱酰胺酶的DNA
作为编码序列号8所示的氨基酸序列(来自Embleya scabrispora的蛋白质脱酰胺酶的示例的全长序列)的碱基序列,可举出序列号19所示的碱基序列。
2-1-9.编码来自肯塔基伦茨氏菌的蛋白质脱酰胺酶的DNA
作为编码序列号9所示的氨基酸序列(来自肯塔基伦茨氏菌的蛋白质脱酰胺酶的示例的全长序列)的碱基序列,可举出序列号20所示的碱基序列;作为编码序列号9的162~426位的氨基酸序列(来自肯塔基伦茨氏菌的蛋白质脱酰胺酶的另一示例的蛋白质的、不含N末端序列的序列)或162~341位的氨基酸序列(来自肯塔基伦茨氏菌的蛋白质脱酰胺酶的另一示例的蛋白质的、不含N末端序列且不含C末端序列的序列)的碱基序列,分别可举出序列号20的484~1281位的碱基序列或484~1023位的碱基序列。
2-1-10.编码来自Streptomyces chilikensis的蛋白质脱酰胺酶的DNA
作为编码序列号10所示的氨基酸序列(来自Streptomyces chilikensis的蛋白质脱酰胺酶的示例的全长序列)的碱基序列,可举出序列号21所示的碱基序列。
2-1-11.编码来自链霉菌属细菌的蛋白质脱酰胺酶的DNA
作为编码序列号11所示的氨基酸序列(来自链霉菌属细菌的蛋白质脱酰胺酶的示例的全长序列)的碱基序列,可举出序列号22所示的碱基序列。
2-2.(ii)和(iii)的DNA
(ii)和(iii)的DNA是以(i)的DNA的碱基序列为基本骨架的序列类似的DNA。
在上述(ii)的DNA中,“在严格条件下”是指在包含0.5%SDS、5×Denhartz’s(Denhartz’s、0.1%牛血清白蛋白(BSA)、0.1%聚乙烯吡咯烷酮、0.1%聚蔗糖(Ficoll)400]和100μg/ml鲑鱼精子DNA的6×SSC(1×SSC为0.15M NaCl、0.015M柠檬酸钠、pH7.0)中,在50℃~65℃下保温4小时~一晚的条件。
在严格条件下的杂交,具体通过以下方法进行。即,制作使DNA文库或cDNA文库固定化的尼龙膜,在包含6×SSC、0.5%SDS、5×Denhartz’s、100μg/ml鲑鱼精子DNA的预杂交溶液中,在65℃下封闭尼龙膜。然后,加入用32P标记的各个探针,在65℃下保温一夜。将该尼龙膜在6×SSC中,室温下清洗10分钟,在包含0.1%SDS的2×SSC中,室温下清洗10分钟,在包含0.1%SDS的0.2×SSC中,在45℃下清洗30分钟后,采用放射自显影术,能够检测出与探针特异性杂交的DNA。
上述(iii)的DNA中,上述同源性为70%以上即可,优选为80%以上、90%以上,进一步优选为95%以上、97%以上、98%以上,特别优选为99%以上。
在此,碱基序列的“同源性”表示通过BLAST PACKAGE[sgi32 bitedition,Version2.0.12;available from the National Center for Biotechnology Information(NCBI)]的bl2seq program(Tatiana A.Tatsusova,Thomas L.Madden,FEMSMicrobiol.Lett.,Vol.174,247-250,1999)得到的一致性的值。参数设定为Gap insertionCost value:11、Gap extension Cost value:1即可。
在上述(ii)和(iii)的DNA的例子中,也可以在上述(i)的DNA中进一步添加起始密码子、终止密码子、编码纯化用标记(例如,寡聚组氨酸等结合性寡肽)的碱基序列中的至少任一者。
作为上述(ii)和(iii)的DNA的更具体的例子,可举出包含序列号33(在序列号12的1012~1548位的碱基序列的5’末端进一步添加有编码甲硫氨酸残基的碱基序列的序列)、序列号34(在序列号13的1141~1695位的碱基序列的5’末端进一步添加有编码甲硫氨酸残基的碱基序列的序列)、序列号35(在序列号15的364~930位的碱基序列的5’末端进一步添加有编码甲硫氨酸残基的碱基序列的序列)、序列号36(在序列号16的1~438位的碱基序列的3’末端进一步添加有终止密码子的序列)、序列号37(在序列号17的55~708位的碱基序列的5’末端进一步添加有编码甲硫氨酸残基的碱基序列的序列)、序列号38(在序列号17的55~615位的碱基序列的5’末端进一步添加有编码甲硫氨酸残基的碱基序列和在3’末端进一步添加有终止密码子的序列)、序列号39(在序列号18的28~912位的碱基序列的5’末端进一步添加有编码甲硫氨酸残基的碱基序列的序列)、序列号40(在序列号18的28~558位的碱基序列的5’末端进一步添加有编码甲硫氨酸残基的碱基序列和在3’末端进一步添加有终止密码子的序列)、序列号41(在序列号20的484~1281位的碱基序列的5’末端进一步添加有编码甲硫氨酸残基的碱基序列的序列)、以及序列号42(在序列号20的484~1023位的碱基序列的5’末端进一步添加有编码甲硫氨酸残基的碱基序列和在3’末端进一步添加有终止密码子的序列)所示的碱基序列的DNA。
2-3.DNA的制备
本发明的DNA,例如,可以通过将编码上述(a)~(c)中任一种多肽的DNA作为模板,通过PCR等至少获取编码上述(a)~(c)中任一种多肽的区域而得到。另外,编码本发明的蛋白质脱酰胺酶的DNA也可以通过基因的合成法进行人工合成。
另外,在碱基序列的特定的部位中导入特定突变的情况下,突变导入方法是公知的,例如可利用DNA的定点诱变法等。作为变换DNA中的碱基的具体的方法,例如也可使用市售的试剂盒而进行。
在碱基序列中导入有突变的DNA可使用DNA测序仪确认碱基序列。一旦确定碱基序列,则其后通过化学合成、以克隆的探针为模板的PCR、或以具有该碱基序列的DNA片段为探针的杂交,可以得到编码上述蛋白质脱酰胺酶的DNA。
另外,可以通过定点诱变法等合成编码上述蛋白质脱酰胺酶的DNA的突变型且具有与突变前同等的功能的突变型。应予说明,为了在编码上述蛋白质脱酰胺酶的DNA中导入突变,可以通过Kunkel法、Gapped duplex法、大引物PCR法等公知的方法进行。
本发明的DNA优选为使密码子利用频率在宿主中最适化的DNA。例如,如果是使用大肠杆菌作为宿主的情况,则优选为使密码子利用频率在大肠杆菌中最适化的DNA。
3.表达盒或重组载体
包含编码本发明的蛋白质脱酰胺酶的DNA的表达盒或重组载体(以下,也表述为“本发明的表达盒”或“本发明的重组载体”)包含编码本发明的蛋白质脱酰胺酶的DNA。本发明的表达盒或重组载体可以通过在本发明的DNA中连接启动子和终止子、或者、通过在表达载体中插入本发明的表达盒或本发明的DNA而得到。
在本发明的表达盒或重组载体中,作为控制因子,除启动子和终止子之外,根据需要还可以包含增强子、CCAAT盒、TATA盒、SPI位点等转录要素。这些控制因子只要与本发明的DNA可工作地连接即可。可工作地连接是指,调节本发明的DNA的各种控制因子和本发明的DNA以能够在宿主细胞中工作的状态连接。
另外,在表达非全长多肽的情况下,本发明的表达盒或本发明的重组载体可以设计为直接表达非全长多肽,如下所述,也可以设计为暂时表达包含蛋白酶识别序列的全长多肽后能够利用蛋白酶切断末端序列。
在将本发明的表达盒或本发明的重组载体设计为暂时表达包含蛋白酶识别序列的全长多肽后能够利用蛋白酶切断末端序列的情况下,本发明的表达盒或重组载体可以构成为以组合的方式包含编码蛋白酶识别序列的碱基序列和编码N末端序列和/或C末端序列的碱基序列。具体而言,本发明的表达盒或重组载体,除编码非全长多肽的碱基序列等以外,还可以构成为在编码包含Pre序列和/或Pro序列的N末端序列的碱基序列与编码非全长多肽的碱基序列等之间、和/或、编码非全长多肽的碱基序列等与编码C末端序列的碱基序列之间,包含编码特定的蛋白酶的识别序列的碱基序列。此时,在表达全长多肽后,利用该特定的蛋白酶特异除去N末端序列和/或C末端序列,由此可以得到包含非全长多肽的蛋白质脱酰胺酶。
作为表达载体,优选在宿主内可自律性增殖的噬菌体、质粒、或由病毒作为基因重组用途而构建的表达载体。这类表达载体是公知的,本领域技术人员可以适当选择使用与宿主细胞适当的组合。例如,在将微生物作为宿主的情况下,可举出pBluescript(pBS)IISK(-)(Stratagene公司制造)、pSTV系载体(Takara Bio公司制造)、pUC系载体(Takara Bio公司制造)、pET系载体(Merck公司制造)、pGEX系载体(GE Healthcare公司制造)、pCold系载体(Takara Bio公司制造)、pHY300PLK(Takara Bio公司制造)、pUB110(Mckenzie,T.etal.,1986,Plasmid 15(2),p.93-103)、pBR322(Takara Bio公司制造)、pRS403(Stratagene公司制造)、和pMW218/219(Nippon Gene公司制造)等。在以藻类或微细藻类为宿主的情况下,可举出pUC19(Takara Bio公司制造)、P66(Chlamydomonas Center)、P-322(Chlamydomonas Center)、pPha-T1(参照Yangmin Gong,et al.,Journal of BasicMicrobiology,2011,vol.51,p.666-672)、或pJET1(Cosmo Bio公司制造)等。在以植物细胞为宿主的情况下,可举出pRI系载体(Takara Bio公司制造)、pBI系载体(Clontech公司制造)、和IN3系载体(Inplanta Innovations公司制造)。
4.转化体
通过使用本发明的表达盒或重组载体转化宿主,得到转化体(以下有时也表述为“本发明的转化体”)。
作为在转化体的制造中使用的宿主,只要能够导入基因且能够自主增殖,能够表达本发明的基因的性状,就没有特别限制,例如可举出属于大肠杆菌(Escherichia coli)等埃希菌(Escherichia)属、枯草芽孢杆菌(Bacillus subtilis)等芽孢杆菌属、恶臭假单胞菌(Pseudomonas putida)等假单胞菌属等的细菌;放线菌等;酵母等;丝状菌等微生物作为优选的例子,除此之外,也可以是动物细胞、昆虫细胞、植物等。其中,特别优选大肠杆菌。
作为在转化体的制造中使用的宿主,也可以是本发明的蛋白质脱酰胺酶的来源菌或来源细胞,即,[1]嗜盐噬菌弧菌属细菌、[2]嗜盐噬菌弧菌科细菌、[3]粳稻类群的细胞、[4]酸杆菌门细菌、[5]δ-变形菌纲细菌、[6]红螺菌科细菌、[7]Flavobacterium alvei、[8]Embleya scabrispora、[9]肯塔基伦茨氏菌[10]Streptomyces chilikensis、或[11]链霉菌属细菌。
本发明的转化体可以通过在宿主中导入本发明的表达盒或重组载体而得到。导入本发明的DNA的位置只要能够表达目标基因就没有特别限定,可以在质粒上,也可以在基因组上。作为导入本发明的表达盒或本发明的重组载体的具体方法,例如可举出重组载体法、基因组编辑法。
在宿主中导入本发明的表达盒或重组载体的条件根据宿主的种类等适当设定即可。如果宿主为微生物的情况下,则例如可举出使用基于钙离子处理的感受态细胞的方法、电穿孔法、原生质球法和醋酸锂法等。如果宿主为动物细胞的情况下,则例如可举出电穿孔法、磷酸钙法和脂质转染法等。如果宿主为昆虫细胞的情况下,则例如可举出磷酸钙法、脂质转染法和电穿孔法等。如果使宿主为植物胞的情况下,则可列举例如电穿孔法、农杆菌法、基因枪法、和PEG法等。
5.蛋白质脱酰胺酶的制造方法
本发明还提供上述的蛋白质脱酰胺酶的制造方法。上述的蛋白质脱酰胺酶可以通过培养上述本发明的转化体来制造。另外,上述的蛋白质脱酰胺酶也可以通过培养作为来源菌或来源细胞的上述[1]~[11]的菌或细胞本身(未被转化的菌或细胞)来制造。
本发明的转化体或者来源菌或来源细胞的培养条件只要考虑宿主或者来源菌或来源细胞的营养生理学性质而适当设定即可,可优选举出液体培养。另外,如果是进行工业制造的情况,则优选通气搅拌培养。
培养本发明的转化体或者来源菌或来源细胞,通过将培养液离心分离等方法回收培养上清液或者培养菌体或培养细胞。如果是本发明的蛋白质脱酰胺酶蓄积在培养菌体内或培养细胞内的情况,则可以通过超声波、法式冲压等机械方法或溶菌酶等溶菌酶对菌体或细胞实施处理,根据需要可以通过使用蛋白酶等酶或十二烷基硫酸钠(SDS)等表面活性剂进行增溶,得到包含本发明的蛋白质脱酰胺酶的水溶性组分。
另外,通过选择适当的表达载体和宿主,可以使表达的本发明的蛋白质脱酰胺酶分泌到培养液中。
在蛋白质脱酰胺酶的制造方法的一个方式中,作为用于转化体的制作的表达盒或重组载体,通过选择构成为能够表达全长多肽的表达盒或重组载体,能够直接表达全长蛋白质,在另一方式中,作为用于转化体的制作的表达盒或重组载体,通过选择构成为能够表达非全长多肽的表达盒或重组载体,能够直接表达非全长蛋白质。
另外,在上述一个方式中,作为用于转化体的制作的表达盒或重组载体,可举出选择构成为包含编码全长多肽的碱基序列的表达盒或重组载体的情况、和选择构成为与编码非全长多肽的碱基序列一起组合包含编码蛋白酶识别序列的碱基序列和编码N末端序列和/或C末端序列的碱基序列的表达盒或重组载体情况,这些情况下的本发明的蛋白质脱酰胺酶的制造方法如以下所述,以从暂时表达的全长多肽得到非全长多肽为目的,还可以包括除去N末端序列和/或C末端序列的工序(得到非全长多肽的工序)。
在得到非全长多肽的工序的示例中,作为用于转化体的制作的表达盒或重组载体,选择构成为包含编码全长多肽的碱基序列的表达盒或重组载体,N末端序列的除去,例如可以通过利用加工酶处理蛋白质脱酰胺酶来进行。作为加工酶,可举出蛋白酶。作为蛋白酶,具体而言,可举出枯草杆菌蛋白酶(subtilisin)、胰凝乳蛋白酶(chymotrypsin)、胰蛋白酶的丝氨酸蛋白酶;木瓜蛋白酶、菠萝蛋白酶、胱天蛋白酶(Caspases)、钙蛋白酶的半胱氨酸蛋白酶;胃蛋白酶、组织蛋白酶等酸性蛋白酶;嗜热菌蛋白酶等金属蛋白酶。
得到非全长多肽的工序的另一示例中,作为用于转化体的制作的表达盒或重组载体,选择构成为与编码非全长多肽的碱基序列一起组合包含编码蛋白酶识别序列的碱基序列和编码N末端序列和/或C末端序列的碱基序列的表达盒或重组载体,在编码N末端序列的碱基序列与编码非全长多肽的碱基序列等之间、和/或在编码非全长多肽的碱基序列等与编码C末端序列的碱基序列之间,使包含特定的蛋白酶的识别序列的全长多肽表达,然后,利用该特定的蛋白酶,能够特异除去N末端序列和/或C末端序列。
如此得到的包含本发明的蛋白质脱酰胺酶的培养液、水溶性级分、或蛋白酶处理物可以直接供于纯化处理,也可以将该培养液、水溶性级分或蛋白酶处理物中的本发明的蛋白质脱酰胺酶浓缩后供于纯化处理。
浓缩例如可通过减压浓缩、膜浓缩、盐析处理、基于亲水性有机溶剂(例如,甲醇、乙醇和丙酮)的分别沉淀法等而进行。
本发明的蛋白质脱酰胺酶的纯化处理,例如,可以通过适当组合凝胶过滤、疏水性色谱、离子交换色谱、亲和色谱等方法来进行。
如此纯化的本发明的蛋白质脱酰胺酶可以根据需要通过冷冻干燥、真空干燥、喷雾干燥等进行粉末化。
6.酶制剂
本发明的蛋白质脱酰胺酶可以以酶剂的形态提供。因此,本发明还提供包含上述本发明的蛋白质脱酰胺酶的酶剂。
作为本发明的酶剂中的上述本发明的蛋白质脱酰胺酶的含量,没有特别限定,可以在发挥蛋白质谷氨酰胺酶活性的范围内适当设定。
本发明的酶剂,除上述本发明的蛋白质脱酰胺酶以外,也可以在不影响本发明的效果的程度包含其他成分。作为其他成分,可举出上述本发明的蛋白质脱酰胺酶以外的其他酶、添加剂、上述制造方法中产生的培养残渣等。
作为其他酶,可以根据其用途适当决定,例如可举出淀粉酶(α-淀粉酶、β-淀粉酶、葡糖淀粉酶)、葡糖苷酶(α-葡糖苷酶、β-葡糖苷酶)、半乳糖苷酶(α-半乳糖苷酶、β-半乳糖苷酶)、蛋白酶(酸性蛋白酶、中性蛋白酶、碱性蛋白酶)、肽酶(亮氨酸肽酶、氨肽酶)、脂肪酶、酯酶、纤维素酶、磷酸酶(酸性磷酸酶、碱性磷酸酶)、核酸酶、脱氨酶、氧化酶、脱氢酶(不包括上述有效成分)、谷氨酰胺酶、果胶酶、过氧化氢酶、葡聚糖酶、转谷氨酰胺酶、蛋白质脱酰胺酶(不包括上述本发明的蛋白质脱酰胺酶)、普鲁兰酶等。这些其他酶可以单独包含1种,也可以包含多种组合。
作为添加剂,可以根据上述本发明的多肽的用途和酶剂的制剂形态适当决定,可举出赋形剂、缓冲剂、混悬剂、稳定剂、保存剂、防腐剂、生理盐水等。作为赋形剂,可举出淀粉、糊精、麦芽糖、海藻糖、乳糖、D-葡萄糖、山梨糖醇、D-甘露醇、白糖、甘油等。作为缓冲剂,可举出磷酸盐、柠檬酸盐、醋酸盐等。作为稳定剂,可举出丙二醇、抗坏血酸等。作为保存剂,可举出苯酚、苯扎氯铵、苄醇、氯丁醇、对羟基苯甲酸甲酯等。作为防腐剂,可举出乙醇、苯扎氯铵、对羟基苯甲酸、氯丁醇等。这些添加剂可以单独包含1种,也可以包含多种的组合。
作为培养残渣,可举出来自培养基的成分、夹杂蛋白质、菌体成分、细胞成分等。
作为本发明的酶剂的制剂形态,没有特别限定,例如可举出液状、固体状(粉末、颗粒等)等。这些制剂形态的酶剂可以通过通常公知的方法制备。
作为本发明的酶剂的具体例,可举出含有蛋白质的饮食品或其原料的改性剂。另外,作为本发明的酶剂的具体的其他例子,可举出蛋白质的酰胺含量定量用试剂、蛋白质的增溶用试剂等蛋白质的分析用和/或研究用试剂。
7.蛋白质脱酰胺酶的利用
本发明的蛋白质脱酰胺酶可以用于利用使蛋白质中的谷氨酰胺残基脱酰胺化的作用的任意用途。因此,本发明还提供一种谷氨酰胺残基被脱酰胺化的蛋白质的制造方法,其包括使上述本发明的蛋白质脱酰胺酶作用于蛋白质的工序。
利用蛋白质脱酰胺酶进行脱酰胺化的蛋白质(底物蛋白质)只要是包含谷氨酰胺残基的蛋白质,就没有特别限制。底物蛋白质的长度只要为2个残基(二肽)以上就没有特别限制,底物蛋白质中不仅包含蛋白质,还包含肽。另外,底物蛋白质中也包含天然物和人工物中的任一种。在底物蛋白质为天然物的情况下,作为底物蛋白质的来源,可以是动物和植物中的任一种。此外,底物蛋白质可以是饮食品或其原料中含有的蛋白质,也可以是作为分析对象或研究对象使用的蛋白质。
蛋白质脱酰胺酶能够通过蛋白质中的谷氨酰胺残基的脱酰胺化产生负电荷的羧基,因此能够通过与使蛋白质的可溶性和水分散性增大,或者提高蛋白质的乳化能力、乳化稳定性、起泡性、泡沫稳定性等公知的蛋白质脱酰胺酶具有的公知的作用相同的作用,使蛋白质的特性变化(改性)。因此,蛋白质脱酰胺酶在使用饮食品或饮食品用原材料(饮食品原料)中含有的蛋白质作为底物的情况下特别有用。此外,蛋白质脱酰胺酶不限于饮食品或饮食品用原材料,在将纤维领域和化妆品领域等中使用的产业用原材料中含有的蛋白质、以及、医药用原材料中含有的蛋白质作为底物使用的情况下也是有用的。因此,本发明还提供一种改性的饮食品或饮食品原材料、产业用原材料、或者医药用原材料的制造方法,其包括使上述本发明的蛋白质脱酰胺酶作用于含有蛋白质的饮食品或饮食品原材料、产业用原材料、或者医药用原材料的工序。
本发明的谷氨酰胺残基被脱酰胺化的蛋白质的制造方法和改性后的饮食品或饮食品原材料、产业用原材料、或者医药用原材料的制造方法中,关于上述本发明的蛋白质脱酰胺酶与底物蛋白质的反应条件(酶量、反应时间、反应温度、反应pH等),只要能够实现期望的程度的脱酰胺化就没有特别限制,本领域技术人员可以根据本发明的蛋白质脱酰胺酶的种类和/或纯度、底物蛋白质的种类和/或浓度、和/或、期望的脱酰胺化的程度等各条件适当设定。
实施例
以下,举出实施例具体说明本发明,但本发明不被解释为限定于以下实施例。
制备包含表1所示的氨基酸序列的蛋白质脱酰胺酶(实施例1-1、1-2、2-1、2-2、3、4-1、4-2、5-1、5-2、6-1、6-2、6-3、7-1、7-2、7-3、8、9-1、9-2、9-3、10和11)。表1中也一并示出了制备的蛋白质脱酰胺酶的氨基酸序列和编码各个氨基酸序列的DNA的碱基序列。
[表1]
各蛋白质脱酰胺酶通过以下步骤制备。将序列号12~22、33~42的碱基序列克隆至pUC19、pET21a或pColdI,制作质粒。将得到的质粒导入BL21(DE3),得到转化体。将转化体接种在TB+Amp培养基或Over Night Expression TB(OETB)+Amp培养基中,在37℃下振荡培养一夜。在使用TB+Amp培养基的情况下,在OD660为0.4的时刻添加1.0mM IPTG。回收得到的培养液的菌体后,进行菌体破碎,回收可溶性级分(蛋白质脱酰胺酶级分)。
对于得到的可溶性组分(蛋白质脱酰胺酶组分)中、表2-1~表2-11所示的实施例的组分,按照以下步骤评价脱酰胺活性。将可溶性级分10μL与底物溶液(5mM Z-Gln-Gly,0.0023%TritonX-100,0.2M磷酸一钾二钠,pH6.5)混合后,在37℃下反应一夜。在反应溶液中添加内部标准品的马尿酸(6.25mM马尿酸、0.2M磷酸一钾二钠、pH6.5)10μL,混合后,在以下条件下对MF过滤后的试样进行HPLC分析,对Z-Gln-Gly(底物)和Z-Glu-Gly(产物)的峰强度进行定量,根据其比率评价脱酰胺活性的程度。将结果示于表2-1~表2-11。
(HPLC条件)
柱:ZORBAX SB-C18 2.1x50mm,1.8μm
溶剂A:0.1% TFA/H2O溶剂B:0.1% TFA/乙腈
程序:0-0.3min_B:10%
0.3-2.0min_B:10-25%
2.0-2.2min_B:25%
2.2-3.0min_B:100%
进样体积:2μL
流速:1.0mL/min
检测器:UV 205nm
[表2-1]
①嗜盐噬菌弧菌科细菌
[表2-2]
②嗜盐噬菌弧菌属细菌
[表2-3]
③粳稻类群
[表2-4]
④酸杆菌门细菌
[表2-5]
⑤δ-变形菌纲细菌
[表2-6]
⑥红螺菌科细菌
[表2-7]
⑦Flavobacterium alvei
[表2-8]
⑧Embleya scabrispora
[表2-9]
⑨肯塔基伦茨氏菌
[表2-10]
⑩Streptomyces chilikensis
[表2-11]
链霉菌属细菌
确认到表2-1~2-11所示的酶均产生了谷氨酰胺残基被脱酰胺化得到的产物的峰。即,确认到表2-1~2-11所示的酶均为具有蛋白质谷氨酰胺酶活性的蛋白质脱酰胺酶。特别是,也确认到实施例1-2的蛋白质脱酰胺酶的蛋白质谷氨酰胺酶活性非常高,其程度为市售品的蛋白质脱酰胺酶(来自解朊金黄杆菌)的约2.7倍。
序列表
<110> 天野酶制品株式会社
<120> 蛋白质脱酰胺酶
<130> 21105WO
<150> JP 2021-016088
<151> 2021-02-03
<160> 42
<170> PatentIn version 3.5
<210> 1
<211> 515
<212> PRT
<213> 嗜盐噬菌弧菌属细菌(Halobacteriovorax sp.)
<400> 1
Met Ser Ile Phe Ser Ile Tyr Ser His Ala Thr Ser Val Val Phe Ser
1 5 10 15
Asp Asp Leu Ser Phe Asp Asn Cys Lys Ala Pro Ser Lys Val Pro Val
20 25 30
Val Val Cys Glu Asn Gly Gly Lys Arg Ala Ile Val Gln Ile Asn Ser
35 40 45
Arg Gly His Leu Leu Gly Leu Val Thr Glu Gly Gly Thr Ser Lys Thr
50 55 60
Phe Ala Val Lys Gln Ile Val Glu Asn Gly Val Pro Thr Tyr Tyr Asn
65 70 75 80
Ser Leu Ser Asp Lys Ile Asn Glu Glu Arg Ala Thr Ser Glu Phe Thr
85 90 95
Thr Pro Ile Thr Lys Leu Gln Glu Ile Ala Glu Arg Lys Lys Ser Ile
100 105 110
Glu Gln Ala Ile Glu Ile Ala Lys Lys Glu Asn Ser Asn Ile Leu Glu
115 120 125
Asp Leu Glu Asp Phe Asp Ser Asp Leu Asp Asp Ser Leu Asn Lys Leu
130 135 140
Lys Ser Val Val Ala Gln Ala Ser Asn Leu Leu Trp Val Asn Thr Lys
145 150 155 160
Lys Asp Gly Asn Ile His Cys Glu Met Ser Thr Lys Cys Pro Ile Lys
165 170 175
Lys Cys Gly Asp Asn His Phe Phe Ile Phe Asp Pro Ser Arg Asn Ile
180 185 190
Phe Met Pro Ile Asn Tyr Thr Arg Asp Ser Arg Gly Asn Ala Lys Phe
195 200 205
Thr Lys Ser Asp Ser Gln Ile Thr Ile Ala Arg Thr Met Asn Gly Ala
210 215 220
Val Leu Glu Leu Asn Asp Asp Tyr Lys Thr Ser Arg Leu Thr Ala Ala
225 230 235 240
Arg Lys Ala Pro Gln Asn Leu Gln Ser Asn Pro Thr Ala Tyr Phe Ser
245 250 255
Phe Gln Asp Ala Arg Phe Ser Asp Tyr Leu Lys Thr Ile Ile Pro His
260 265 270
Cys Ser Gln Asn Ile Lys Asp Asp Ile Ile Ser Leu Gly Val Gln Thr
275 280 285
Asn Asn Glu Arg Ala Asn Leu Asp Phe Val His Leu Val Glu Val Val
290 295 300
Asn Gly Thr Ile Asn Ser Gln Tyr Ile Asn Lys Lys Phe Leu Pro Lys
305 310 315 320
Asn Ser Cys Arg Asp Gly Asp Ser Tyr Tyr Thr Ala Glu Ser Tyr Lys
325 330 335
Glu Ser Gln Glu Phe Val Pro Arg Ser Ser Gly Val Ile Ser Trp Lys
340 345 350
Lys Ala Gly Glu Leu Phe Glu Lys Ala Lys Lys Met Lys Glu Leu Thr
355 360 365
Trp Arg Tyr Thr Ala Asp Gly Cys Tyr Ala Arg Ala Glu Leu Met Val
370 375 380
Asn Met Met Glu Glu Glu Gly Val Ile Ala Asp Lys Ala Trp Thr Ser
385 390 395 400
Gly Tyr Leu Lys Ser Lys Ser Ser Pro His Pro Trp Ser Tyr His Val
405 410 415
Ala Pro Val Val Tyr Val Asn Asn Gly Arg Gly His Val Gln Lys Met
420 425 430
Ile Ile Asp Pro Ala Val Ala Asn Gly Pro Val Glu Pro Asp Glu Trp
435 440 445
Leu Arg Leu Met Gly Val Asn Glu Lys Asn Leu Asp Gln Val Gly Phe
450 455 460
Pro Pro Ser Leu Asp Ala Val Ser Val Gly Arg Asn Thr Phe Thr Ile
465 470 475 480
Ser Asp Arg Ser Thr Phe His Pro Gln Asp Lys Thr Arg Leu Thr Lys
485 490 495
Glu Gln Arg Val Thr Ala Ala Arg Ala Leu Leu Ala Asp Leu Gly Asn
500 505 510
Arg Leu Gln
515
<210> 2
<211> 564
<212> PRT
<213> 嗜盐噬菌弧菌科(Halobacteriovoraceae)细菌
<400> 2
Met Asn Lys Leu Ile Lys Leu Pro Leu Phe Leu Ile Ile Thr Leu Ser
1 5 10 15
Ser Ser Phe Leu Trp Ala Glu Lys Val Gln Val His Ile Val Asp Arg
20 25 30
Asp Glu Pro Leu Glu Cys Phe His Glu Glu Ser Gln Tyr Phe Cys His
35 40 45
Asp Gly Glu Asn Phe Leu Phe Gly Arg Asn Tyr Gly Met Asp Leu Tyr
50 55 60
Leu Thr Gly Ser Val Asp Gly Ser Val Asp Asp Phe Arg Val Ser Ser
65 70 75 80
Ala Val Ser Leu Asp Asn Pro Asp His Ile Leu Phe Glu Glu Arg Glu
85 90 95
Asp Pro Tyr Arg Asp Ser Tyr Glu Gln Val Asn Arg Arg Pro Ser Tyr
100 105 110
Ser Lys Glu Leu Met Ser Leu Thr Met Leu Glu Asn Met Thr Ala Pro
115 120 125
Phe Ser Tyr Asp Ser Glu Ser Ile Ala Leu Ala Lys Ser Asn Leu Tyr
130 135 140
Pro Leu Val Gln Asn Arg Leu Asp Gln Ile Lys Asn Lys Phe Asn Gln
145 150 155 160
Ser Asn Arg Ile Val Lys Thr Glu Glu Gly Asn Glu Leu Ser Cys Ser
165 170 175
Gln Gly Ser Ala Ser Ala Gly Gln Asp Val Asn Cys Thr Phe Tyr Gln
180 185 190
Cys Thr Glu Glu Gly Ser Asp Lys Lys Tyr Phe Tyr Ile Ser Asp Pro
195 200 205
Asn Ile Gln Phe Gly Val His Glu Leu Phe Ser Val Gly Thr Asp Gly
210 215 220
Leu Pro Gln Arg Glu Ala Ile Gln Ser Ile His Phe Pro Asn Asp Asp
225 230 235 240
Lys Ser Ile Leu Glu Arg Phe Asn Phe Val Pro Ser Ala Gly Gln Gly
245 250 255
Phe Gly Glu Tyr Thr Gly Gln Gly Asp Phe Leu Ser Ser Glu Tyr Ser
260 265 270
Tyr Gln Lys Pro Gln Ile Asp Tyr Glu Gln Met Ile Pro Asp Phe Asp
275 280 285
Asn Pro Lys Lys Ser Asp Ala Phe Lys Tyr Leu Ile Gly Val Asn Gly
290 295 300
Arg Gly Ala Met Glu Asn Ala Val Arg Gly Cys Ser Glu Arg Thr Thr
305 310 315 320
Arg Asp Phe Phe Tyr Ser Ile Asp Asp Leu Met Glu Asn Val Leu Ala
325 330 335
Arg Asn Ser Val Gln Tyr Ile Thr Asp Phe Asn Asn Gly Leu Ala Gly
340 345 350
Tyr Tyr Leu Ser Leu Glu Asn Leu Pro Asp Ile Ala Cys Ser Glu Asn
355 360 365
Gly Val Phe Tyr Asn Pro Ser Ser Tyr Glu Thr Ala Arg Asn Val Ala
370 375 380
Ala Ala Asp Arg Asn Ser Val Gln Thr Ile Ser Met Glu Lys Ala Arg
385 390 395 400
Glu Leu Phe Asp Lys Ala Gln Ala Met Asp Asp Ile Ala Trp Gly Tyr
405 410 415
Lys Pro Asp Gly Cys Tyr Ala Arg Ala His Leu Met Ala Arg Arg Phe
420 425 430
Glu Glu Met Gly Ile Thr Val Asp Lys Ala Trp Leu Lys Gly Ser Leu
435 440 445
Arg Ala Gln Gly Glu Thr Pro Glu Glu Asp Ile Met Trp Asn Phe His
450 455 460
Val Ala Pro Val Val Tyr Val Glu His Asp Asn Gly Glu Ile Glu Arg
465 470 475 480
Val Val Ile Asp Pro Ser Val Glu Glu Gly Pro Val Thr Ala Met Glu
485 490 495
Trp Ala Lys Asn Leu Ser Ser Asp Val Glu Glu Arg Val Asn Ile Thr
500 505 510
Gln Phe Pro Tyr Pro Glu Asn Ser Ala Glu Tyr Leu Lys Asn Ser Leu
515 520 525
Ala Phe Ser Asn Ser Asp Pro Tyr Leu Pro Leu Glu Ser Thr Glu Ser
530 535 540
Thr Glu Glu Gln Lys Met Ser Met Ala His Ala Thr Met Leu Glu Tyr
545 550 555 560
Lys Gly Tyr Glu
<210> 3
<211> 233
<212> PRT
<213> 粳稻类群(Oryza sativa Japonica Group)
<400> 3
Met Ala Asp Asp Arg Val Ala Val Ala Gly Gly Ala Thr Pro Pro Pro
1 5 10 15
Pro Pro Pro Pro Pro Pro Leu Asp Ala Ser Ala Phe Thr His Thr Pro
20 25 30
Tyr Tyr Cys Glu Glu Asn Val His Leu Leu Cys Lys Glu Leu Ile Arg
35 40 45
Ser Gly Ile Ser Asp Pro Ala Gly Thr Asn Leu Tyr Ala Val Phe Ile
50 55 60
Ser Asn Glu Glu Lys Lys Val Pro Leu Trp Tyr Gln Lys Ala Ser His
65 70 75 80
Ser Gly Asp Gly Phe Val Leu Trp Asp Tyr His Val Ile Cys Ile Gln
85 90 95
Ser Arg Arg Lys Asn Gly Glu Val Leu Asp Leu Val Trp Asp Leu Asp
100 105 110
Ser Ser Leu Pro Phe Pro Cys Ser Phe Ile Gln Tyr Val Ser Asp Ala
115 120 125
Ile Arg Pro Leu Ser Phe Gly Asn Ser Thr Tyr Arg Arg Leu Phe Arg
130 135 140
Val Ile His Ala Pro Val Phe Leu Arg Ser Phe Ala Ser Asp Arg Ser
145 150 155 160
His Met Lys Asp His Ala Gly Asn Trp Ile Gln Leu Pro Pro Lys Tyr
165 170 175
Glu Ser Ile Val Ala Glu Asp Gly Thr Thr Asn Asn Leu Asn Glu Tyr
180 185 190
Ile Thr Met Ser Met Asp Asp Val Lys Asp Leu Glu Ser Met Ala Asp
195 200 205
Asp Val Tyr Ser Ser Lys His Gly Val Val Ile Asn Glu Thr Ile Leu
210 215 220
Pro Glu Phe Phe Ser Arg Leu Pro Gly
225 230
<210> 4
<211> 309
<212> PRT
<213> 酸杆菌门(Acidobacteria)细菌
<400> 4
Met Pro Pro Thr Arg Glu Ser Ala Val Leu Thr Val Ala Asn Ile Arg
1 5 10 15
Glu Glu Thr Gly Arg Ile Leu Phe His Glu Arg Glu Gln Ile Phe Ser
20 25 30
Leu Pro Glu Thr Asp Ala Arg Ala Gly Ile Ser Gly Arg Leu Arg Glu
35 40 45
Ala Leu Glu Arg Lys Thr Pro Val Lys Ala Val Leu Asp Pro Arg Arg
50 55 60
Gly Ile Val Gln Gly Ile Thr Pro Ala Ala Glu Lys Glu Ala Gly Glu
65 70 75 80
Phe Glu Arg Ser Arg Thr Leu Leu Asp Lys Pro Gly Lys Thr Val Ser
85 90 95
Val Asn Val Ala Glu Ile Asp Pro Thr Arg Phe Asn Val Val Asp Leu
100 105 110
Thr Leu Lys Ser Pro Ile Phe Lys Leu Cys Thr Lys Ile Val Pro Ser
115 120 125
Tyr Thr Lys Ala Lys Glu Ile Phe Asp Phe Cys Ala Gln Gln Ser Cys
130 135 140
Asn Leu Gly Ile Pro Thr Thr Val Thr Pro Cys Ile Pro Phe Gln Tyr
145 150 155 160
Val Arg Asp Asp Cys Tyr Ala Arg Ala His Lys Met Arg Trp Ile Ile
165 170 175
Glu Gln Arg Tyr Gly Tyr Cys Cys Glu Lys Val Phe Ser Phe Ala Asn
180 185 190
Gln Asn Asn Asp Glu Leu Ser Val Arg Ala Asp Lys Trp Gly Gly Cys
195 200 205
Cys Val Asn Trp Trp Tyr His Val Ala Pro Leu Ile Arg Val Gln Ile
210 215 220
Lys Ile Ser Thr Phe Ser Phe Val Ile Ala Leu Val Val Asp Pro Ser
225 230 235 240
Met Phe Asp Lys Pro Val Met Leu Ser Ser Trp Leu Thr Ala Gln Glu
245 250 255
Asn Ala Ala Cys Gly Ala His Ala Lys Val Ser Met Tyr Ser Ile Gln
260 265 270
Pro Gly Ser Ala Tyr Thr Pro Ala Asn Tyr Ala Gly Thr Ala Phe Thr
275 280 285
Thr Asp Pro Ser Tyr Thr Ala Thr Asp Ala Thr Leu Ile Ala Tyr Lys
290 295 300
Asn Leu Thr Thr Cys
305
<210> 5
<211> 271
<212> PRT
<213> δ-变形菌纲(Deltaproteobacteria)细菌
<400> 5
Met Ser Lys Ser Glu Val Asn Ser Leu Phe Asn Asp Phe Leu Asn His
1 5 10 15
Pro Lys Leu Val Phe Ser Ala Asn Asn Thr Gly Cys Glu Ser Lys Ala
20 25 30
Asp Leu Met Ala Glu Ile Ala His Gln Lys Gly His Glu Val Ser Lys
35 40 45
Ile Trp Val Arg Pro Met Asn Ser Thr Asp Asn Phe Pro Val Tyr Leu
50 55 60
Asn Glu Ala Lys Thr Glu Ser Thr Val Trp Asn Tyr His Val Ala Ile
65 70 75 80
Gln Val Lys Met Lys Thr Ser Ser Gly Thr Glu Thr Met Ile Ile Asp
85 90 95
Pro Ser Leu Phe Asp Glu Pro Val Thr Met Asp Thr Trp Ser Lys Arg
100 105 110
Ile Ser Ser Leu Ser Asp Glu Tyr Asp Tyr Asp Leu Glu Phe Lys Glu
115 120 125
Ser Ser Arg Glu Ala Phe Phe Gly Pro Glu Asp Met Val Thr Ser Glu
130 135 140
Thr Arg Ala Arg Ala Leu Ala Lys Arg Asp Asp Ile Leu Ser Asn Ser
145 150 155 160
Gly Asn Leu Asn Asp Pro Val Val Arg Asp Gly Tyr Leu Met Lys Leu
165 170 175
Arg Gly Gln Tyr Val Asp Asp Leu Met Lys Lys Asn Pro Gln Asp Phe
180 185 190
Glu Thr Leu Glu Glu Leu Leu Leu Asn Gln Lys Phe Asn Met Trp Phe
195 200 205
Lys Thr Pro Leu Gln Ile Glu Gln Ile Lys Gln Leu Leu Asp Gln Lys
210 215 220
Pro Arg Phe Tyr Gly Ile Lys Ser Ser Asp Ile Lys Ser Lys Ile Asp
225 230 235 240
Phe Ser Ser Pro Asp Ala Ser Phe Glu Leu Lys Lys Tyr Phe Trp Lys
245 250 255
Lys Ile Gly Lys Ala Phe Glu Arg Leu Ser Ser Lys Ser Glu Glu
260 265 270
<210> 6
<211> 235
<212> PRT
<213> 红螺菌科(Rhodospirillaceae)细菌
<400> 6
Met Ala Met Thr Ile Asn Pro His Leu Arg Asp Ile Phe Asn Leu Arg
1 5 10 15
Arg Asp Arg Ser Gly Phe Phe Pro Val Ala Glu Asp Ala Val Arg Val
20 25 30
Val Ser Pro Ala Gln Ala Leu Glu Ile Phe Asp Thr Leu Arg Ala Met
35 40 45
Gln Asn Ile Ser His Glu Tyr Thr Asp Asp Gly Cys Ala Gln Arg Ala
50 55 60
His Leu Met Cys Arg Ala Leu Val Asp Met Lys Leu Ala Pro Glu Lys
65 70 75 80
Gly Trp Ala Phe Glu Thr Pro Lys Arg Asp Leu Val Val Asp Tyr Pro
85 90 95
His Val Ser Gln Ile Trp Trp Phe His Val Ala Pro Val Leu Arg Val
100 105 110
Ala Ser Glu Lys Gly Gly Ala Glu Pro Met Ala Phe Asp Thr Val Leu
115 120 125
Phe Asp Gly Pro Ala Thr Met Lys Glu Trp Gly Ser Val Met Lys Ala
130 135 140
Gln Pro Glu Gln Ile His Val Leu Pro Cys Gly Lys Ser Pro Lys Gly
145 150 155 160
His Tyr Gly Asp Tyr Arg Pro Gly Val Arg Thr Gly Tyr Ala Ser Asp
165 170 175
Ala Ala Ala Gln Lys Ala Met Asp Lys Tyr Ile Ala Leu Glu Asn Glu
180 185 190
Asp Gly Phe Val Arg Pro Gln Val Phe Glu Ser Ala Leu Arg Lys Lys
195 200 205
Leu Glu Ala Thr Thr Pro Asp Asn Pro Arg Pro Ala Asp Arg Lys Lys
210 215 220
Gln Pro Pro Ala Gln Gly Gln Asn Gly Pro Ala
225 230 235
<210> 7
<211> 303
<212> PRT
<213> Flavobacterium alvei
<400> 7
Met Lys Lys His Pro Leu Leu Thr Ser His Lys Ala Ser Ile Leu Asp
1 5 10 15
Leu Asn Thr Ala Lys Ser Leu Phe Ala Glu Ile Thr Glu Ser Gly Ile
20 25 30
Pro Tyr Asp Tyr Gln Gln Ala Asn Cys His Asn Ile Ser His Tyr Ile
35 40 45
Ser Ser Leu Leu Glu Ser Lys Gly Tyr Gln Cys Ala Lys Ile Trp Ala
50 55 60
Phe Ala Pro Ala Val Tyr Ser Thr Ser Asn Ser Lys Leu Ile Ser Phe
65 70 75 80
Ile Asp Glu Lys Asn Ile Ser Pro Thr Gly Thr Ile Asp Trp Arg Tyr
85 90 95
His Val Ala Pro Val Ile Glu Val Gln Ile Gly Asn Lys Val Arg Lys
100 105 110
Met Val Ile Asp Leu Gly Leu Phe Pro Asn Glu Phe Val Arg Tyr Arg
115 120 125
Thr Trp Leu Ala Lys Leu Lys Thr Lys Lys Leu Ile Tyr Leu Ile Met
130 135 140
Asp Ser Glu Trp Tyr Leu Tyr Asn Ser Ser Met Ile Thr Asn Ala Gln
145 150 155 160
Leu Glu Phe Asp Ser Asn Glu Glu Ile Asn Ala Asn Gln Pro Asn Ile
165 170 175
Lys Leu Pro Glu Trp Phe Ala Asp Lys Leu Ile Thr Asp Phe Phe Lys
180 185 190
Tyr Glu Glu Glu Ser Leu Glu Gln His Trp Val Glu Lys Gly Leu Ala
195 200 205
Val Asn Glu Thr Ala Ile Glu Phe Tyr Asp Thr Glu Ile Lys Pro Ile
210 215 220
Leu Tyr Ser Glu Gln His Gln Asp Leu Val Lys Asp Tyr Lys Met Leu
225 230 235 240
Val Gly Asp Val Phe Asn Phe Glu Thr Ile Phe Arg Asp Asn Asn Trp
245 250 255
Asn Tyr Glu Met Asn Asn Asp Phe Gln Ile Lys His Gln Glu Ile Ile
260 265 270
Ser Lys Tyr Arg Thr Ile Tyr Ser Leu Asn Leu Asp Lys Trp Lys Lys
275 280 285
Ala Leu Ala Ser Leu Asn Glu Ile Ile Leu Gln Lys Asn Ile Lys
290 295 300
<210> 8
<211> 380
<212> PRT
<213> Embleya scabrispora
<400> 8
Met Lys Arg Glu Arg Asp Leu Lys Asn Pro Ser Ser Gln Gly Val Thr
1 5 10 15
Ala Pro Thr Gly Glu Arg Gly Pro Asp Asp Asp Thr Lys Arg Ala Arg
20 25 30
Thr Asp Ala His Thr Thr Asp Pro Ala Pro Ala Ala Asp Ser Pro Ala
35 40 45
Val Gln Pro Ala Pro Asp Pro Thr Pro Ala Gln Pro Gln Pro Phe Arg
50 55 60
Phe Thr Arg Ala Pro Gly Phe Leu Leu Ala Gln Gln Ala Glu Gln Lys
65 70 75 80
Arg Ala Glu Ala Glu Glu Glu Arg Arg Gln Gly Gln Leu Arg Ala Glu
85 90 95
Gln Ala Gly Ala Glu Ala Ser Thr Lys Pro Glu Pro Arg Thr Pro Ala
100 105 110
Pro Met Ala Glu Pro Lys Lys Asp Ser Ser Thr Leu Pro Asp Val Arg
115 120 125
Phe Ala Glu Leu Ser Pro Lys Val Ile Ala Arg Met Thr Pro Asp Gln
130 135 140
Leu Ser Glu Ala Ile Glu Asp Arg Met Glu Asn Phe Gly Gly Leu Thr
145 150 155 160
Pro Asp Thr Pro Leu Leu Thr Phe Arg Gln Thr Ala Leu Val Leu Gly
165 170 175
Asp Asp Leu Pro Leu Ala Lys Ser Thr Met Cys Val Gly Gln Val His
180 185 190
Thr Trp Leu His Ser Arg Ala Ala Leu Val Pro Asp Val Ile Pro Leu
195 200 205
Cys Asp Ala Lys Ala Ser Thr Leu Ala Ala Pro Ala Thr Pro Ala Pro
210 215 220
Thr Leu Ala Glu Leu Thr Ala Val Trp Arg Ala Leu Thr Gly Ser Leu
225 230 235 240
Val Val Pro Arg Ser Ala Ala Gln Asp Gly Cys Glu Phe Leu Ala His
245 250 255
Ala Val Cys Glu Trp Phe Glu Asn Thr His Pro Asp Trp Ala Arg Leu
260 265 270
His Leu Cys Lys Arg Trp Val Val Ala Pro Ser Gly Gly Met His Pro
275 280 285
Pro Tyr His Trp Lys His His Val Ala Pro Gln Ile Thr Cys Val Glu
290 295 300
Gly Pro Phe Val Ile Asp Leu Leu Leu Gly Ala Gln Ala Pro Met Ala
305 310 315 320
Cys Thr Ala Trp Val Thr Ala Ala Lys Gly Ala Ser Ala Pro Ala Asp
325 330 335
Thr Phe Glu Ala Thr Ala Pro Trp Glu Leu Leu Gly Ala Pro Ala Ser
340 345 350
Ala Thr Ala Gly Phe Val Pro Glu Thr Leu Ser Pro Ile Gly Ala Thr
355 360 365
Leu Arg Thr Ser Ile Glu Ala Cys Lys Arg Gly Trp
370 375 380
<210> 9
<211> 426
<212> PRT
<213> 肯塔基伦茨氏菌(Lentzea kentuckyensis)
<400> 9
Met Pro Arg Glu Asn Val Leu Val Asp Gln Val Ser Glu Leu Ala Ile
1 5 10 15
Ala Ala Ala Ala Glu Thr Arg Tyr His Ala Val Val Phe Ala Gly Gly
20 25 30
Ser Ser Ala Arg Leu Asp Leu Glu Asp Ser Arg Ala Thr Gly Trp Leu
35 40 45
Ala Ala Leu Glu Glu Met Arg Ala Ala Gly Leu Ser Ala Tyr Val Glu
50 55 60
Val Asp Pro Gly Thr Gly Val Ile Val Glu Leu Leu Cys Pro Leu Pro
65 70 75 80
Val Val Val Gly Glu Leu Arg Glu Ser Asp Asp Gly Val Asp Val Glu
85 90 95
Leu Val Val Ser Gln Ala Arg His Arg Leu Ser Arg Gly Asn Pro Glu
100 105 110
Phe Asp Glu Leu Leu Ala Ala Leu Arg Arg Ala Arg Glu Ser Gln Glu
115 120 125
Pro Val Leu Val Thr Glu Thr Leu Asp Ala His Glu Ile Ile Asp Val
130 135 140
Arg Ser Asp Pro Lys Val Arg Thr Glu Ser Val Thr Thr Gly Glu Ser
145 150 155 160
Glu Val Leu Gly Thr Pro Val Thr Leu Ala Lys Ala Asn Glu Met Phe
165 170 175
Thr Leu Val Asn Asn Arg Thr Ala Cys Ser Ala Asn Pro Val Ala Pro
180 185 190
Gly Ile Pro Phe Thr Tyr Pro Asp Asp Gly Cys Trp Gly Arg Ala His
195 200 205
Glu Met Cys Arg Leu Met Ile Gly Ala Gly Val Gln Pro Asp Lys Val
210 215 220
Trp Ile Tyr Gly Ser Leu His Val Val Ser Phe Asn Lys Pro Gly Cys
225 230 235 240
Asn Val Tyr Trp Gly Trp His Val Ala Pro Thr Leu Thr Leu Thr Thr
245 250 255
Gly Glu Thr Tyr Val Val Asp Pro Ala Leu Phe Pro Asn Pro Val Pro
260 265 270
Arg Ala Thr Trp Ala Ser Val Gln Gly Asp Pro Ser Ala Ser Leu Val
275 280 285
Pro Thr Gly Ala Asp Val Phe His Arg Ser Ser Gly Gly Gly Leu Thr
290 295 300
Phe Asp Pro Thr Tyr Ser Gln Thr Asn Ser Val Leu Ala Thr Tyr Arg
305 310 315 320
Thr Gln Leu Gln Leu Arg Ala Ala Gly Pro Ser Gly Pro Pro Pro Tyr
325 330 335
Ser Glu Cys Leu Thr Arg Pro Ala Gly Thr Gln Trp Phe Gly Thr Ile
340 345 350
Ala Gly Asn Ser Ser Gln Arg Trp Phe Thr Phe Gly Trp Pro Ala Gly
355 360 365
Trp His Met Val Trp Thr Ile Met Pro Thr Leu Ile Cys Pro Gly Thr
370 375 380
Pro Thr Leu Ser Trp Ser Val Ala Ala Glu Arg Ala Asn Ser Thr Gln
385 390 395 400
Ala Thr Tyr Trp Ile Thr Val Thr Asn Ser Ser Pro His Thr Val Arg
405 410 415
Phe Glu Gly Arg Tyr Asp Val Leu Ser Thr
420 425
<210> 10
<211> 350
<212> PRT
<213> Streptomyces chilikensis
<400> 10
Met Arg Arg Ser Ala Arg Glu Glu Ile Pro Ala Gln Gly Thr Asp Arg
1 5 10 15
Ala Leu Arg Arg Ala Pro Asp Arg Ala Glu Gly Ala Gly Ala Arg Ala
20 25 30
Asp Ser Pro Pro Ser Ala His Pro Ser Ala Leu Trp Ala Leu Gln Arg
35 40 45
Ser Ala Gly Asn Ala Ala Val Thr Ala Val Ile Gln Arg Met Glu Gly
50 55 60
Ala Ala Gly Lys Arg Lys Arg Ser Thr Ser Pro Glu Asp Gln Glu Ala
65 70 75 80
Pro Lys Gln Ala Arg Ala Ala Thr Ser Ser Glu Glu Glu Tyr Ser Ser
85 90 95
Ser Ser Glu Glu Ala Glu Thr Ser Ser Glu Glu Glu Arg Glu Glu Pro
100 105 110
Phe Ser Ala Gln Val Met Leu Gln Ile Ala Asn Glu Gln Arg Arg Met
115 120 125
Thr Gly Leu Leu Glu Gln Met Asp Glu Arg Gly Ala Pro Asp His Ile
130 135 140
Lys Arg Ala Ala Glu Asp Lys Leu Glu Ile Leu Thr Leu Leu Arg Asn
145 150 155 160
Leu Ala Pro Met Arg Ser Val Asp Thr Val His Glu Ala Ile Arg Leu
165 170 175
Leu Gly Met Arg Pro Asp Ser Thr Ala Lys Thr Arg Tyr Leu Ala Lys
180 185 190
Leu Glu Glu Gln Leu Asp Tyr Leu Ala Glu Glu Phe Pro Asn Ala Gly
195 200 205
Pro Pro Thr Ala Glu Thr Leu Arg Ala Met Trp Pro Glu Leu Val Pro
210 215 220
Ala Phe Gly Gly Ala Gly Gly Gln Val Gly Glu Asp Gly Cys Glu Asp
225 230 235 240
Arg Ala His Ala Ile Cys Leu Ala Ile Ala Arg Arg Ser Pro Ala Ile
245 250 255
Ala Ala His His Leu Ser Lys Gln Trp Ala Leu Pro Asp Gly Gly Leu
260 265 270
Leu His Ala Asp His Gln Trp Asn His His Val Ala Ala Ser Val Thr
275 280 285
Thr Ala Asn Gly Val Leu Val Ile Asp Pro Val Phe Ser Arg Ser Glu
290 295 300
Pro Ile Glu Leu Ser Arg Trp Ala Ala Met Val Gln Val Asp Leu Asp
305 310 315 320
Thr Asn Val His Gln Val Ala Trp Gly Phe Leu Gly Arg Pro Gly Ala
325 330 335
Asp Asn Leu Pro Asp Val Asn Ser Ala Val Glu Tyr Val Pro
340 345 350
<210> 11
<211> 591
<212> PRT
<213> 链霉菌属细菌(Streptomyces sp.)
<400> 11
Met Ala Asp Asp Gly Ser Ala Gly Thr Ala Ile Ser Ser Thr Leu Leu
1 5 10 15
Gly Arg Val Ala Arg Arg Lys Asn Ile Ser Pro Leu Leu Leu Ser Asn
20 25 30
Thr Ser Ile Glu Ala Gly Thr Arg Lys Arg Val Glu Leu Gly Leu Pro
35 40 45
Lys Ser Glu Ala Glu Glu Leu Thr Asp Arg Leu Ala Ala Leu Leu Asp
50 55 60
Ala Glu Leu Leu Asp Glu Ala Gly Leu Gln Val Trp Ile Thr Asp Leu
65 70 75 80
Cys Arg Leu Asn Pro His Ala Ala Glu Gln Phe Asp Glu Thr Phe Glu
85 90 95
Phe Arg His Arg Tyr Ala Pro Val Glu Ala Val Ile Glu Ala Ala Gly
100 105 110
Arg Gly Leu Leu Ala Glu His Leu Ala Leu Glu Leu Leu Gly Ala Leu
115 120 125
His Glu Ala Trp Gln Pro Pro Arg Val Thr Asp Trp Leu Ser Ala Val
130 135 140
Ala Leu Asp Gly Arg Pro Asp Pro Ser Pro Thr Pro Gln Ile Val Ala
145 150 155 160
Leu Val Ala Ala Val His Glu Asp Leu Thr Arg Val Gly Ala Gly Gly
165 170 175
Ser Ala Lys Ala Leu Arg Arg Ile Gly Ala Leu Asp Arg Asp Leu Arg
180 185 190
Ala Leu Trp Ala Leu Gln Arg Val Trp Arg Gln Ala Tyr Gly Thr Gln
195 200 205
Leu Arg Glu Glu Leu Val Ser Ala Phe Pro Gly Ala Glu Asp Gln Ile
210 215 220
Ala His Leu Leu Ala Glu Thr Thr Leu Asp Ala Val Pro Ala Glu Val
225 230 235 240
Val Asp Glu Trp His Gln Asn Leu Ser Arg Ala His Val Leu His Pro
245 250 255
His Gln Gly Pro Ile Ser Leu Ala Tyr Asp Tyr Pro Asp Asp Gly Cys
260 265 270
Gln Tyr Arg Ala His Glu Ala Thr Leu Leu Leu His Arg Trp Gly Ala
275 280 285
Ala Val Ser Lys Val Val Val Val Arg Arg Ala Gly Leu Ser Val Thr
290 295 300
Thr Glu Asn Ala Asp Gly Ala Thr Pro Thr Arg Pro Gly Lys Val Thr
305 310 315 320
Trp Gly Trp His Ile Ala Pro Ala Val His Arg Ile Lys Pro Asp Ser
325 330 335
Thr Arg Gln Leu Val Val Leu Asp Pro Ala Leu Ser Thr Glu Ala Leu
340 345 350
Pro Leu Asp Ala Trp Ala Thr Ala Ala Gly Gly Ser Glu Lys His Ala
355 360 365
Asn Ile Tyr Arg Gly Thr Leu Glu Gln Val Arg Glu Gln Ile Leu Asp
370 375 380
Asp Gln Glu Arg Ser Phe Ala Glu His Thr Ala Val Ala Val Leu Pro
385 390 395 400
Ala Thr Val Gly Ser Phe Glu Val Gly Arg Glu Ala Ala Thr Leu Glu
405 410 415
Asp Leu Asp Glu Gln Phe Arg Arg Trp Gln Ile Thr Glu Ile Leu Ala
420 425 430
Ala Tyr Ser Gln Gln Ala Ala Asp Arg Arg Leu Ala Arg Glu Leu Asp
435 440 445
Ser Phe Leu Arg Asn Pro Gln His His Gly Leu Ala Pro Glu Glu Arg
450 455 460
Ser Ala Ala Leu Glu Gln Trp Leu Asn Gly Arg Ser Leu His Val Ala
465 470 475 480
Thr Leu Arg Arg Tyr Ser Arg Thr Ala Ala Ala Leu Lys Glu Phe Thr
485 490 495
Ala Pro Arg Thr Arg Leu Asn Ala Leu Ala Val Arg Ala Leu Asp Arg
500 505 510
Ser Asp Glu Ala Gly Trp Glu Asp Ser Asp Ala Glu Leu Asp Thr Trp
515 520 525
Glu Ser Val Ala Glu Ile Ala Leu His Arg Gly Pro Val Pro Gly Ala
530 535 540
Gly Gly Glu Asp Phe Glu Ser Leu Leu Ser Asp His His Gln Gly Gly
545 550 555 560
Val Arg Ala Phe Val Asp Ser Asp Asp Glu Phe Glu Gly Glu Tyr Asp
565 570 575
Glu Gly Glu Asp Pro Ser Asp Leu Ala Ala Val Pro Trp Gly Val
580 585 590
<210> 12
<211> 1548
<212> DNA
<213> 嗜盐噬菌弧菌属细菌(Halobacteriovorax sp.)
<400> 12
atgagcatct tcagcattta cagccacgcg accagcgtgg ttttcagcga cgatctgagc 60
tttgataact gcaaggcgcc gagcaaagtg ccggtggttg tgtgcgaaaa cggtggcaag 120
cgtgcgatcg tgcagattaa cagccgtggt cacctgctgg gcctggttac cgaaggtggc 180
accagcaaga ccttcgcggt taaacaaatt gtggagaacg gtgttccgac ctactataac 240
agcctgagcg acaagatcaa cgaggaacgt gcgaccagcg aatttaccac cccgatcacc 300
aaactgcagg aaattgcgga gcgtaagaaa agcattgaac aagcgatcga gattgcgaag 360
aaagagaaca gcaacatcct ggaagatctg gaggactttg atagcgacct ggacgatagc 420
ctgaacaagc tgaaaagcgt tgtggcgcag gcgagcaacc tgctgtgggt taacaccaag 480
aaagacggta acatccactg cgaaatgagc accaaatgcc cgattaagaa atgcggcgat 540
aaccacttct ttatcttcga cccgagccgt aacatcttta tgccgattaa ctacacccgt 600
gatagccgtg gtaacgcgaa gttcaccaaa agcgacagcc agatcaccat tgcgcgtacc 660
atgaacggcg cggtgctgga gctgaacgac gattataaga ccagccgtct gaccgcggcg 720
cgtaaagcgc cgcagaacct gcaaagcaac ccgaccgcgt acttcagctt tcaagatgcg 780
cgttttagcg actatctgaa gaccatcatt ccgcactgca gccagaacat caaagacgat 840
atcattagcc tgggtgttca aaccaacaac gaacgtgcga acctggattt cgttcacctg 900
gttgaggtgg tgaacggtac catcaacagc cagtacatta acaagaaatt tctgccgaag 960
aacagctgcc gtgatggcga cagctactat accgcggaga gctataaaga aagccaagag 1020
ttcgtgccgc gtagcagcgg tgttattagc tggaagaaag cgggcgaact gtttgagaag 1080
gcgaagaaaa tgaaagaact gacctggcgt tacaccgcgg atggttgcta tgcgcgtgcg 1140
gagctgatgg tgaacatgat ggaggaagag ggtgttatcg cggacaaggc gtggaccagc 1200
ggctacctga agagcaaaag cagcccgcac ccgtggagct accatgtggc gccggttgtg 1260
tatgttaaca acggtcgtgg ccacgtgcag aagatgatca ttgatccggc ggtggcgaac 1320
ggtccggttg aaccggacga gtggctgcgt ctgatgggtg tgaacgagaa gaacctggat 1380
caagttggtt tcccgccgag cctggatgcg gttagcgtgg gccgtaacac cttcaccatc 1440
agcgatcgta gcacctttca cccgcaggac aagacccgtc tgaccaaaga gcaacgtgtt 1500
accgcggcgc gtgcgctgct ggcggacctg ggtaaccgtc tgcagtaa 1548
<210> 13
<211> 1695
<212> DNA
<213> 嗜盐噬菌弧菌科(Halobacteriovoraceae)细菌
<400> 13
atgaacaagc tgatcaaact gccgctgttc ctgatcatta ccctgagcag cagctttctg 60
tgggcggaaa aagtgcaggt tcacattgtg gaccgtgatg agccgctgga atgcttccac 120
gaggaaagcc aatacttttg ccacgacggc gagaacttcc tgtttggccg taactacggt 180
atggacctgt atctgaccgg cagcgtggat ggtagcgttg acgatttccg tgtgagcagc 240
gcggttagcc tggacaaccc ggatcacatc ctgtttgagg aacgtgagga cccgtaccgt 300
gatagctatg aacaggttaa ccgtcgtccg agctacagca aggagctgat gagcctgacc 360
atgctggaaa acatgaccgc gccgttcagc tacgacagcg aaagcattgc gctggcgaaa 420
agcaacctgt atccgctggt gcagaaccgt ctggatcaaa tcaagaacaa gttcaaccaa 480
agcaaccgta ttgttaagac cgaggaaggt aacgaactga gctgcagcca gggcagcgcg 540
agcgcgggtc aagacgtgaa ctgcaccttc taccagtgca ccgaggaagg cagcgacaag 600
aaatactttt atatcagcga tccgaacatt caattcggtg tgcacgaact gtttagcgtt 660
ggtaccgatg gtctgccgca gcgtgaggcg atccaaagca ttcacttccc gaacgacgat 720
aaaagcatcc tggaacgttt caactttgtt ccgagcgcgg gtcagggctt cggcgagtac 780
accggccagg gtgactttct gagcagcgaa tacagctatc agaagccgca aatcgattac 840
gagcagatga ttccggactt cgataacccg aagaaaagcg acgcgtttaa atatctgatt 900
ggcgtgaacg gccgtggtgc gatggagaac gcggttcgtg gttgcagcga acgtaccacc 960
cgtgatttct tttacagcat cgacgatctg atggaaaacg tgctggcgcg taacagcgtt 1020
cagtatatta ccgacttcaa caacggcctg gcgggttact atctgagcct ggagaacctg 1080
ccggatatcg cgtgcagcga aaacggcgtg ttttacaacc cgagcagcta tgaaaccgcg 1140
cgtaacgtgg cggcggcgga ccgtaacagc gttcagacca tcagcatgga gaaggcgcgt 1200
gaactgttcg acaaagcgca agcgatggac gatattgcgt ggggctacaa gccggatggt 1260
tgctatgcgc gtgcgcacct gatggcgcgt cgttttgagg aaatgggtat caccgttgac 1320
aaggcgtggc tgaaaggcag cctgcgtgcg cagggtgaaa ccccggagga agatattatg 1380
tggaacttcc acgtggcgcc ggtggtttac gttgagcacg acaacggcga gatcgaacgt 1440
gtggttattg atccgagcgt ggaggaaggt ccggttaccg cgatggagtg ggcgaaaaac 1500
ctgagcagcg acgtggagga acgtgttaac atcacccagt tcccgtaccc ggagaacagc 1560
gcggaatatc tgaagaacag cctggcgttt agcaacagcg atccgtatct gccgctggag 1620
agcaccgaaa gcaccgagga acaaaagatg agcatggcgc acgcgaccat gctggagtac 1680
aaaggttatg aataa 1695
<210> 14
<211> 702
<212> DNA
<213> 粳稻类群(Oryza sativa Japonica Group)
<400> 14
atggcggatg atcgtgttgc ggttgcgggt ggtgcgaccc cgccgccgcc gccgccgccg 60
ccgccgctgg atgcgagcgc gtttacccac accccgtact attgcgagga aaacgtgcac 120
ctgctgtgca aggagctgat ccgtagcggt attagcgacc cggcgggtac caacctgtat 180
gcggtgttca tcagcaacga ggaaaagaaa gttccgctgt ggtatcagaa ggcgagccac 240
agcggtgacg gctttgtgct gtgggattac cacgttatct gcattcaaag ccgtcgtaaa 300
aacggtgaag tgctggacct ggtttgggac ctggatagca gcctgccgtt cccgtgcagc 360
tttatccagt atgtgagcga tgcgattcgt ccgctgagct tcggcaacag cacctaccgt 420
cgtctgtttc gtgtgatcca cgcgccggtt ttcctgcgta gctttgcgag cgaccgtagc 480
cacatgaagg atcacgcggg taactggatt cagctgccgc cgaaatatga gagcattgtt 540
gcggaagacg gcaccaccaa caacctgaac gagtacatta ccatgagcat ggacgatgtg 600
aaggatctgg aaagcatggc ggacgatgtt tatagcagca aacacggtgt tgttatcaat 660
gagaccatcc tgccggagtt ctttagccgc ctgccgggtt aa 702
<210> 15
<211> 930
<212> DNA
<213> 酸杆菌门(Acidobacteria)细菌
<400> 15
atgccgccaa cccgtgagag cgcggttctg accgtggcga acatccgtga ggaaaccggt 60
cgtattctgt tccacgagcg tgaacagatc tttagcctgc cggaaaccga tgcgcgtgcg 120
ggtattagcg gccgtctgcg tgaggcgctg gagcgtaaga ccccggttaa agcggtgctg 180
gacccgcgtc gtggtatcgt gcaaggcatt accccggcgg cggagaagga agcgggcgag 240
ttcgaacgta gccgtaccct gctggacaag ccgggcaaaa ccgtgagcgt taacgtggcg 300
gagatcgacc cgacccgttt caacgtggtt gatctgaccc tgaaaagccc gatctttaag 360
ctgtgcacca aaattgttcc gagctacacc aaggcgaaag aaatcttcga tttttgcgcg 420
cagcaaagct gcaacctggg tatcccgacc accgtgaccc cgtgcattcc gtttcagtac 480
gttcgtgacg attgctatgc gcgtgcgcac aagatgcgtt ggatcattga gcagcgttac 540
ggctattgct gcgaaaaagt gttcagcttt gcgaaccaaa acaacgacga gctgagcgtt 600
cgtgcggata agtggggtgg ctgctgcgtt aactggtggt accacgtggc gccgctgatc 660
cgtgttcaaa tcaagattag caccttcagc tttgtgattg cgctggttgt ggacccgagc 720
atgttcgata aaccggttat gctgagcagc tggctgaccg cgcaggaaaa cgcggcgtgc 780
ggtgcgcacg cgaaagtgag catgtatagc atccaaccgg gtagcgcgta caccccggcg 840
aactatgcgg gtaccgcgtt taccaccgac ccgagctaca ccgcgaccga tgcgaccctg 900
attgcgtata aaaacctgac cacctgctaa 930
<210> 16
<211> 816
<212> DNA
<213> δ-变形菌纲(Deltaproteobacteria)细菌
<400> 16
atgagcaaga gcgaggtgaa cagcctgttc aacgactttc tgaaccaccc gaagctggtt 60
ttcagcgcga acaacaccgg ttgcgaaagc aaagcggatc tgatggcgga gatcgcgcac 120
caaaagggcc acgaagtgag caaaatttgg gttcgtccga tgaacagcac cgacaacttt 180
ccggtgtacc tgaacgaggc gaaaaccgaa agcaccgttt ggaactatca cgtggcgatc 240
caggttaaga tgaaaaccag cagcggtacc gaaaccatga tcattgaccc gagcctgttc 300
gatgaaccgg tgaccatgga cacctggagc aagcgtatta gcagcctgag cgatgaatac 360
gactatgatc tggagtttaa agaaagcagc cgtgaggcgt tctttggtcc ggaagacatg 420
gttaccagcg aaacccgtgc gcgtgcgctg gcgaagcgtg acgatatcct gagcaacagc 480
ggcaacctga acgacccggt ggttcgtgat ggttacctga tgaaactgcg tggccaatat 540
gtggacgatc tgatgaagaa aaacccgcag gatttcgaaa ccctggagga actgctgctg 600
aaccaaaagt tcaacatgtg gtttaaaacc ccgctgcaga tcgaacaaat taagcagctg 660
ctggaccaga aaccgcgttt ctacggtatc aagagcagcg atatcaagag caaaattgac 720
tttagcagcc cggatgcgag cttcgagctg aagaaatact tctggaagaa aattggcaag 780
gcgtttgaac gtctgagcag caaaagcgag gaataa 816
<210> 17
<211> 708
<212> DNA
<213> 红螺菌科(Rhodospirillaceae)细菌
<400> 17
atggcgatga ccatcaaccc gcacctgcgt gacattttca acctgcgtcg tgatcgtagc 60
ggtttctttc cggttgcgga ggatgcggtg cgtgtggtta gcccggcgca ggcgctggaa 120
atctttgata ccctgcgtgc gatgcaaaac attagccacg agtacaccga tgatggttgc 180
gcgcagcgtg cgcacctgat gtgccgtgcg ctggttgaca tgaagctggc gccggagaaa 240
ggctgggcgt tcgaaacccc gaagcgtgac ctggtggttg attatccgca cgtgagccaa 300
atctggtggt ttcatgtggc gccggttctg cgtgtggcga gcgagaaagg tggcgcggaa 360
ccgatggcgt tcgacaccgt tctgtttgat ggtccggcga ccatgaagga gtggggcagc 420
gttatgaaag cgcagccgga acaaatccac gtgctgccgt gcggcaagag cccgaaaggt 480
cactacggcg actatcgtcc gggtgtgcgt accggttatg cgagcgatgc ggcggcgcag 540
aaggcgatgg ataaatatat tgcgctggag aacgaagatg gcttcgttcg tccgcaagtg 600
tttgagagcg cgctgcgtaa gaaactggaa gcgaccaccc cggacaaccc gcgtccggcg 660
gatcgtaaga aacagccgcc ggcgcagggt caaaacggtc cggcgtaa 708
<210> 18
<211> 912
<212> DNA
<213> Flavobacterium alvei
<400> 18
atgaagaaac acccgctgct gaccagccac aaggcgagca tcctggatct gaacaccgcg 60
aaaagcctgt tcgcggaaat caccgagagc ggtattccgt acgactatca gcaagcgaac 120
tgccacaaca tcagccacta cattagcagc ctgctggaaa gcaagggcta tcagtgcgcg 180
aaaatttggg cgttcgcgcc ggcggtttac agcaccagca acagcaagct gatcagcttt 240
attgatgaga aaaacatcag cccgaccggt accattgact ggcgttatca cgtggcgccg 300
gttatcgaag tgcaaattgg taacaaggtt cgtaaaatgg tgatcgatct gggcctgttc 360
ccgaacgagt ttgtgcgtta ccgtacctgg ctggcgaagc tgaaaaccaa gaaactgatc 420
tatctgatta tggatagcga gtggtacctg tataacagca gcatgattac caacgcgcag 480
ctggagttcg acagcaacga ggaaatcaac gcgaaccaac cgaacattaa gctgccggaa 540
tggtttgcgg acaagctgat caccgatttc tttaaatacg aggaagagag cctggaacag 600
cactgggttg agaagggtct ggcggtgaac gaaaccgcga ttgagtttta cgataccgaa 660
atcaaaccga ttctgtatag cgagcagcac caagacctgg ttaaggatta caaaatgctg 720
gttggcgacg tgttcaactt tgaaaccatc ttccgtgata acaactggaa ctatgagatg 780
aacaacgact ttcagatcaa gcaccaagaa atcatcagca agtaccgtac catctacagc 840
ctgaacctgg acaaatggaa gaaagcgctg gcgagcctga acgagatcat tctgcaaaag 900
aacatcaaat aa 912
<210> 19
<211> 1143
<212> DNA
<213> Embleya scabrispora
<400> 19
atgaagcgtg aacgtgatct gaaaaacccg agcagccagg gtgtgaccgc gccgaccggc 60
gagcgtggtc cggacgatga caccaagcgt gcgcgtaccg atgcgcacac caccgacccg 120
gcgccggcgg cggatagccc ggcggttcaa ccggcgccgg acccgacccc ggcgcagccg 180
caaccgttcc gttttacccg tgcgccgggc ttcctgctgg cgcagcaagc ggaacagaag 240
cgtgcggagg cggaggaaga gcgtcgtcag ggtcaactgc gtgcggaaca ggcgggtgcg 300
gaggcgagca ccaaaccgga accgcgtacc ccggcgccga tggcggagcc gaagaaagat 360
agcagcaccc tgccggacgt gcgttttgcg gaactgagcc cgaaagttat cgcgcgtatg 420
accccggatc agctgagcga agcgattgag gaccgtatgg agaactttgg tggcctgacc 480
ccggacaccc cgctgctgac ctttcgtcag accgcgctgg tgctgggtga tgacctgccg 540
ctggcgaaga gcaccatgtg cgtgggccaa gttcacacct ggctgcacag ccgtgcggcg 600
ctggtgccgg atgttatccc gctgtgcgac gcgaaagcga gcaccctggc ggcgccggcg 660
accccggcgc cgaccctggc ggagctgacc gcggtgtggc gtgcgctgac cggtagcctg 720
gtggttccgc gtagcgcggc gcaggatggt tgcgagttcc tggcgcacgc ggtttgcgaa 780
tggtttgaga acacccaccc ggactgggcg cgtctgcacc tgtgcaagcg ttgggttgtt 840
gcgccgagcg gtggcatgca cccgccgtac cactggaaac accacgtggc gccgcagatc 900
acctgcgtgg aaggtccgtt cgttattgat ctgctgctgg gtgcgcaagc gccgatggcg 960
tgcaccgcgt gggttaccgc ggcgaagggt gcgagcgcgc cggcggacac ctttgaagcg 1020
accgcgccgt gggagctgct gggtgcgccg gcgagcgcga ccgcgggctt tgttccggaa 1080
accctgagcc cgatcggtgc gaccctgcgt accagcattg aggcgtgcaa acgtggctgg 1140
taa 1143
<210> 20
<211> 1281
<212> DNA
<213> 肯塔基伦茨氏菌(Lentzea kentuckyensis)
<400> 20
atgccgcgtg agaacgttct ggtggaccag gtgagcgagc tggcgattgc ggcggcggcg 60
gaaacccgtt accatgcggt ggtttttgcg ggtggcagca gcgcgcgtct ggacctggaa 120
gatagccgtg cgaccggttg gctggcggcg ctggaggaaa tgcgtgcggc gggtctgagc 180
gcgtatgttg aggtggaccc gggcaccggt gttattgtgg aactgctgtg cccgctgccg 240
gtggttgtgg gtgaactgcg tgaaagcgac gatggtgttg acgtggagct ggttgtgagc 300
caagcgcgtc accgtctgag ccgtggtaac ccggagtttg atgaactgct ggcggcgctg 360
cgtcgtgcgc gtgagagcca agaaccggtt ctggtgaccg aaaccctgga cgcgcacgaa 420
atcattgacg ttcgtagcga tccgaaggtt cgtaccgaga gcgtgaccac cggcgagagc 480
gaagttctgg gtaccccggt gaccctggcg aaagcgaacg aaatgttcac cctggtgaac 540
aaccgtaccg cgtgcagcgc gaacccggtt gcgccgggta tcccgtttac ctatccggat 600
gatggttgct ggggtcgtgc gcacgagatg tgccgtctga tgatcggcgc gggtgttcag 660
ccggacaaag tgtggattta cggcagcctg cacgttgtga gcttcaacaa accgggctgc 720
aacgtttatt ggggttggca tgtggcgccg accctgaccc tgaccaccgg tgaaacctat 780
gttgtggacc cggcgctgtt tccgaacccg gttccgcgtg cgacctgggc gagcgtgcag 840
ggcgacccga gcgcgagcct ggttccgacc ggtgcggatg tgttccaccg tagcagcggt 900
ggcggtctga cctttgaccc gacctacagc caaaccaaca gcgtgctggc gacctatcgt 960
acccagctgc aactgcgtgc ggcgggtccg agcggtccgc cgccgtacag cgaatgcctg 1020
acccgtccgg cgggtaccca gtggttcggc accatcgcgg gtaacagcag ccaacgttgg 1080
ttcacctttg gttggccggc gggttggcac atggtgtgga ccatcatgcc gaccctgatt 1140
tgcccgggta ccccgaccct gagctggagc gttgcggcgg agcgtgcgaa cagcacccaa 1200
gcgacctact ggattaccgt taccaacagc agcccgcaca ccgtgcgttt tgaaggtcgt 1260
tatgatgttc tgagcaccta a 1281
<210> 21
<211> 1053
<212> DNA
<213> Streptomyces chilikensis
<400> 21
atgcgtcgta gcgcgcgtga ggaaatcccg gcgcagggta ccgaccgtgc gctgcgtcgt 60
gcgccggatc gtgcggaagg cgcgggtgcg cgtgcggaca gcccgccgag cgcgcacccg 120
agcgcgctgt gggcgctgca acgtagcgcg ggtaacgcgg cggtgaccgc ggttattcaa 180
cgtatggagg gtgcggcggg caagcgtaaa cgtagcacca gcccggagga tcaggaagcg 240
ccgaaacagg cgcgtgcggc gaccagcagc gaggaagagt acagcagcag cagcgaagag 300
gcggaaacca gcagcgaaga ggaacgtgag gaaccgttca gcgcgcaggt gatgctgcaa 360
atcgcgaacg aacagcgtcg tatgaccggc ctgctggagc aaatggacga acgtggtgcg 420
ccggatcaca tcaagcgtgc ggcggaggac aaactggaaa ttctgaccct gctgcgtaac 480
ctggcgccga tgcgtagcgt ggacaccgtt cacgaggcga ttcgtctgct gggcatgcgt 540
ccggatagca ccgcgaagac ccgttacctg gcgaaactgg aggaacagct ggattatctg 600
gcggaggagt tcccgaacgc gggtccgccg accgcggaaa ccctgcgtgc gatgtggccg 660
gaactggtgc cggcgtttgg tggcgcgggt ggccaagttg gcgaggatgg ttgcgaagat 720
cgtgcgcacg cgatctgcct ggcgattgcg cgtcgtagcc cggcgattgc ggcgcaccac 780
ctgagcaagc agtgggcgct gccggatggt ggcctgctgc acgcggatca ccaatggaac 840
catcatgtgg cggcgagcgt taccaccgcg aacggtgtgc tggttatcga cccggtgttc 900
agccgtagcg agccgattga actgagccgt tgggcggcga tggtgcaggt tgacctggat 960
accaacgtgc accaagttgc gtggggtttt ctgggccgtc cgggtgcgga caacctgccg 1020
gatgttaaca gcgcggtgga atatgttccg taa 1053
<210> 22
<211> 1776
<212> DNA
<213> 链霉菌属细菌(Streptomyces sp.)
<400> 22
atggcggatg atggtagcgc gggtaccgcg atcagcagca ccctgctggg tcgtgttgcg 60
cgtcgtaaga acatcagccc gctgctgctg agcaacacca gcattgaagc gggtacccgt 120
aagcgtgtgg aactgggcct gccgaaaagc gaagcggagg aactgaccga ccgtctggcg 180
gcgctgctgg atgcggaact gctggatgag gcgggcctgc aagtttggat caccgacctg 240
tgccgtctga acccgcacgc ggcggagcag tttgatgaaa ccttcgagtt tcgtcaccgt 300
tacgcgccgg tggaagcggt tattgaggcg gcgggtcgtg gcctgctggc ggaacatctg 360
gcgctggagc tgctgggtgc gctgcatgaa gcgtggcaac cgccgcgtgt taccgactgg 420
ctgagcgcgg tggcgctgga tggtcgtccg gacccgagcc cgaccccgca gattgtggcg 480
ctggttgcgg cggtgcatga ggatctgacc cgtgttggtg cgggtggcag cgcgaaagcg 540
ctgcgtcgta ttggtgcgct ggaccgtgat ctgcgtgcgc tgtgggcgct gcagcgtgtt 600
tggcgtcaag cgtacggtac ccagctgcgt gaagaactgg tgagcgcgtt cccgggtgcg 660
gaagaccaaa tcgcgcacct gctggcggaa accaccctgg atgcggttcc ggcggaagtg 720
gttgatgagt ggcaccaaaa cctgagccgt gcgcatgtgc tgcacccgca ccagggtccg 780
attagcctgg cgtacgacta tccggacgat ggctgccagt atcgtgcgca cgaagcgacc 840
ctgctgctgc accgttgggg tgcggcggtt agcaaggtgg ttgtggttcg tcgtgcgggt 900
ctgagcgtga ccaccgagaa cgcggatggt gcgaccccga cccgtccggg caaggttacc 960
tggggctggc acattgcgcc ggcggtgcac cgtattaaac cggacagcac ccgtcaactg 1020
gtggttctgg acccggcgct gagcaccgaa gcgctgccgc tggatgcgtg ggcgaccgcg 1080
gcgggtggca gcgagaaaca cgcgaacatc taccgtggta ccctggaaca ggttcgtgag 1140
caaattctgg acgatcagga acgtagcttt gcggagcaca ccgcggtggc ggttctgccg 1200
gcgaccgttg gtagctttga agttggtcgt gaggcggcga ccctggaaga cctggatgag 1260
caattccgtc gttggcagat caccgaaatt ctggcggcgt acagccaaca agcggcggac 1320
cgtcgtctgg cgcgtgagct ggatagcttt ctgcgtaacc cgcaacacca tggtctggcg 1380
ccggaggaac gtagcgcggc gctggaacag tggctgaacg gccgtagcct gcatgttgcg 1440
accctgcgtc gttatagccg taccgcggcg gcgctgaagg agttcaccgc gccgcgtacc 1500
cgtctgaacg cgctggcggt gcgtgcgctg gaccgtagcg atgaagcggg ttgggaggac 1560
agcgatgcgg agctggacac ctgggaaagc gttgcggaga ttgcgctgca ccgtggtccg 1620
gtgccgggtg cgggtggcga agactttgag agcctgctga gcgatcacca ccagggtggc 1680
gttcgtgcgt tcgtggacag cgacgatgag tttgaaggcg agtatgatga gggtgaggac 1740
ccgagcgatc tggcggcggt tccgtggggc gtgtaa 1776
<210> 23
<211> 179
<212> PRT
<213> 嗜盐噬菌弧菌属细菌(Halobacteriovorax sp.)
<400> 23
Met Ser Gln Glu Phe Val Pro Arg Ser Ser Gly Val Ile Ser Trp Lys
1 5 10 15
Lys Ala Gly Glu Leu Phe Glu Lys Ala Lys Lys Met Lys Glu Leu Thr
20 25 30
Trp Arg Tyr Thr Ala Asp Gly Cys Tyr Ala Arg Ala Glu Leu Met Val
35 40 45
Asn Met Met Glu Glu Glu Gly Val Ile Ala Asp Lys Ala Trp Thr Ser
50 55 60
Gly Tyr Leu Lys Ser Lys Ser Ser Pro His Pro Trp Ser Tyr His Val
65 70 75 80
Ala Pro Val Val Tyr Val Asn Asn Gly Arg Gly His Val Gln Lys Met
85 90 95
Ile Ile Asp Pro Ala Val Ala Asn Gly Pro Val Glu Pro Asp Glu Trp
100 105 110
Leu Arg Leu Met Gly Val Asn Glu Lys Asn Leu Asp Gln Val Gly Phe
115 120 125
Pro Pro Ser Leu Asp Ala Val Ser Val Gly Arg Asn Thr Phe Thr Ile
130 135 140
Ser Asp Arg Ser Thr Phe His Pro Gln Asp Lys Thr Arg Leu Thr Lys
145 150 155 160
Glu Gln Arg Val Thr Ala Ala Arg Ala Leu Leu Ala Asp Leu Gly Asn
165 170 175
Arg Leu Gln
<210> 24
<211> 185
<212> PRT
<213> 嗜盐噬菌弧菌科(Halobacteriovoraceae)细菌
<400> 24
Met Arg Asn Val Ala Ala Ala Asp Arg Asn Ser Val Gln Thr Ile Ser
1 5 10 15
Met Glu Lys Ala Arg Glu Leu Phe Asp Lys Ala Gln Ala Met Asp Asp
20 25 30
Ile Ala Trp Gly Tyr Lys Pro Asp Gly Cys Tyr Ala Arg Ala His Leu
35 40 45
Met Ala Arg Arg Phe Glu Glu Met Gly Ile Thr Val Asp Lys Ala Trp
50 55 60
Leu Lys Gly Ser Leu Arg Ala Gln Gly Glu Thr Pro Glu Glu Asp Ile
65 70 75 80
Met Trp Asn Phe His Val Ala Pro Val Val Tyr Val Glu His Asp Asn
85 90 95
Gly Glu Ile Glu Arg Val Val Ile Asp Pro Ser Val Glu Glu Gly Pro
100 105 110
Val Thr Ala Met Glu Trp Ala Lys Asn Leu Ser Ser Asp Val Glu Glu
115 120 125
Arg Val Asn Ile Thr Gln Phe Pro Tyr Pro Glu Asn Ser Ala Glu Tyr
130 135 140
Leu Lys Asn Ser Leu Ala Phe Ser Asn Ser Asp Pro Tyr Leu Pro Leu
145 150 155 160
Glu Ser Thr Glu Ser Thr Glu Glu Gln Lys Met Ser Met Ala His Ala
165 170 175
Thr Met Leu Glu Tyr Lys Gly Tyr Glu
180 185
<210> 25
<211> 189
<212> PRT
<213> 酸杆菌门(Acidobacteria)细菌
<400> 25
Met Cys Thr Lys Ile Val Pro Ser Tyr Thr Lys Ala Lys Glu Ile Phe
1 5 10 15
Asp Phe Cys Ala Gln Gln Ser Cys Asn Leu Gly Ile Pro Thr Thr Val
20 25 30
Thr Pro Cys Ile Pro Phe Gln Tyr Val Arg Asp Asp Cys Tyr Ala Arg
35 40 45
Ala His Lys Met Arg Trp Ile Ile Glu Gln Arg Tyr Gly Tyr Cys Cys
50 55 60
Glu Lys Val Phe Ser Phe Ala Asn Gln Asn Asn Asp Glu Leu Ser Val
65 70 75 80
Arg Ala Asp Lys Trp Gly Gly Cys Cys Val Asn Trp Trp Tyr His Val
85 90 95
Ala Pro Leu Ile Arg Val Gln Ile Lys Ile Ser Thr Phe Ser Phe Val
100 105 110
Ile Ala Leu Val Val Asp Pro Ser Met Phe Asp Lys Pro Val Met Leu
115 120 125
Ser Ser Trp Leu Thr Ala Gln Glu Asn Ala Ala Cys Gly Ala His Ala
130 135 140
Lys Val Ser Met Tyr Ser Ile Gln Pro Gly Ser Ala Tyr Thr Pro Ala
145 150 155 160
Asn Tyr Ala Gly Thr Ala Phe Thr Thr Asp Pro Ser Tyr Thr Ala Thr
165 170 175
Asp Ala Thr Leu Ile Ala Tyr Lys Asn Leu Thr Thr Cys
180 185
<210> 26
<211> 146
<212> PRT
<213> δ-变形菌纲(Deltaproteobacteria)细菌
<400> 26
Met Ser Lys Ser Glu Val Asn Ser Leu Phe Asn Asp Phe Leu Asn His
1 5 10 15
Pro Lys Leu Val Phe Ser Ala Asn Asn Thr Gly Cys Glu Ser Lys Ala
20 25 30
Asp Leu Met Ala Glu Ile Ala His Gln Lys Gly His Glu Val Ser Lys
35 40 45
Ile Trp Val Arg Pro Met Asn Ser Thr Asp Asn Phe Pro Val Tyr Leu
50 55 60
Asn Glu Ala Lys Thr Glu Ser Thr Val Trp Asn Tyr His Val Ala Ile
65 70 75 80
Gln Val Lys Met Lys Thr Ser Ser Gly Thr Glu Thr Met Ile Ile Asp
85 90 95
Pro Ser Leu Phe Asp Glu Pro Val Thr Met Asp Thr Trp Ser Lys Arg
100 105 110
Ile Ser Ser Leu Ser Asp Glu Tyr Asp Tyr Asp Leu Glu Phe Lys Glu
115 120 125
Ser Ser Arg Glu Ala Phe Phe Gly Pro Glu Asp Met Val Thr Ser Glu
130 135 140
Thr Arg
145
<210> 27
<211> 218
<212> PRT
<213> 红螺菌科(Rhodospirillaceae)细菌
<400> 27
Met Arg Ser Gly Phe Phe Pro Val Ala Glu Asp Ala Val Arg Val Val
1 5 10 15
Ser Pro Ala Gln Ala Leu Glu Ile Phe Asp Thr Leu Arg Ala Met Gln
20 25 30
Asn Ile Ser His Glu Tyr Thr Asp Asp Gly Cys Ala Gln Arg Ala His
35 40 45
Leu Met Cys Arg Ala Leu Val Asp Met Lys Leu Ala Pro Glu Lys Gly
50 55 60
Trp Ala Phe Glu Thr Pro Lys Arg Asp Leu Val Val Asp Tyr Pro His
65 70 75 80
Val Ser Gln Ile Trp Trp Phe His Val Ala Pro Val Leu Arg Val Ala
85 90 95
Ser Glu Lys Gly Gly Ala Glu Pro Met Ala Phe Asp Thr Val Leu Phe
100 105 110
Asp Gly Pro Ala Thr Met Lys Glu Trp Gly Ser Val Met Lys Ala Gln
115 120 125
Pro Glu Gln Ile His Val Leu Pro Cys Gly Lys Ser Pro Lys Gly His
130 135 140
Tyr Gly Asp Tyr Arg Pro Gly Val Arg Thr Gly Tyr Ala Ser Asp Ala
145 150 155 160
Ala Ala Gln Lys Ala Met Asp Lys Tyr Ile Ala Leu Glu Asn Glu Asp
165 170 175
Gly Phe Val Arg Pro Gln Val Phe Glu Ser Ala Leu Arg Lys Lys Leu
180 185 190
Glu Ala Thr Thr Pro Asp Asn Pro Arg Pro Ala Asp Arg Lys Lys Gln
195 200 205
Pro Pro Ala Gln Gly Gln Asn Gly Pro Ala
210 215
<210> 28
<211> 188
<212> PRT
<213> 红螺菌科(Rhodospirillaceae)细菌
<400> 28
Met Arg Ser Gly Phe Phe Pro Val Ala Glu Asp Ala Val Arg Val Val
1 5 10 15
Ser Pro Ala Gln Ala Leu Glu Ile Phe Asp Thr Leu Arg Ala Met Gln
20 25 30
Asn Ile Ser His Glu Tyr Thr Asp Asp Gly Cys Ala Gln Arg Ala His
35 40 45
Leu Met Cys Arg Ala Leu Val Asp Met Lys Leu Ala Pro Glu Lys Gly
50 55 60
Trp Ala Phe Glu Thr Pro Lys Arg Asp Leu Val Val Asp Tyr Pro His
65 70 75 80
Val Ser Gln Ile Trp Trp Phe His Val Ala Pro Val Leu Arg Val Ala
85 90 95
Ser Glu Lys Gly Gly Ala Glu Pro Met Ala Phe Asp Thr Val Leu Phe
100 105 110
Asp Gly Pro Ala Thr Met Lys Glu Trp Gly Ser Val Met Lys Ala Gln
115 120 125
Pro Glu Gln Ile His Val Leu Pro Cys Gly Lys Ser Pro Lys Gly His
130 135 140
Tyr Gly Asp Tyr Arg Pro Gly Val Arg Thr Gly Tyr Ala Ser Asp Ala
145 150 155 160
Ala Ala Gln Lys Ala Met Asp Lys Tyr Ile Ala Leu Glu Asn Glu Asp
165 170 175
Gly Phe Val Arg Pro Gln Val Phe Glu Ser Ala Leu
180 185
<210> 29
<211> 295
<212> PRT
<213> Flavobacterium alvei
<400> 29
Met His Lys Ala Ser Ile Leu Asp Leu Asn Thr Ala Lys Ser Leu Phe
1 5 10 15
Ala Glu Ile Thr Glu Ser Gly Ile Pro Tyr Asp Tyr Gln Gln Ala Asn
20 25 30
Cys His Asn Ile Ser His Tyr Ile Ser Ser Leu Leu Glu Ser Lys Gly
35 40 45
Tyr Gln Cys Ala Lys Ile Trp Ala Phe Ala Pro Ala Val Tyr Ser Thr
50 55 60
Ser Asn Ser Lys Leu Ile Ser Phe Ile Asp Glu Lys Asn Ile Ser Pro
65 70 75 80
Thr Gly Thr Ile Asp Trp Arg Tyr His Val Ala Pro Val Ile Glu Val
85 90 95
Gln Ile Gly Asn Lys Val Arg Lys Met Val Ile Asp Leu Gly Leu Phe
100 105 110
Pro Asn Glu Phe Val Arg Tyr Arg Thr Trp Leu Ala Lys Leu Lys Thr
115 120 125
Lys Lys Leu Ile Tyr Leu Ile Met Asp Ser Glu Trp Tyr Leu Tyr Asn
130 135 140
Ser Ser Met Ile Thr Asn Ala Gln Leu Glu Phe Asp Ser Asn Glu Glu
145 150 155 160
Ile Asn Ala Asn Gln Pro Asn Ile Lys Leu Pro Glu Trp Phe Ala Asp
165 170 175
Lys Leu Ile Thr Asp Phe Phe Lys Tyr Glu Glu Glu Ser Leu Glu Gln
180 185 190
His Trp Val Glu Lys Gly Leu Ala Val Asn Glu Thr Ala Ile Glu Phe
195 200 205
Tyr Asp Thr Glu Ile Lys Pro Ile Leu Tyr Ser Glu Gln His Gln Asp
210 215 220
Leu Val Lys Asp Tyr Lys Met Leu Val Gly Asp Val Phe Asn Phe Glu
225 230 235 240
Thr Ile Phe Arg Asp Asn Asn Trp Asn Tyr Glu Met Asn Asn Asp Phe
245 250 255
Gln Ile Lys His Gln Glu Ile Ile Ser Lys Tyr Arg Thr Ile Tyr Ser
260 265 270
Leu Asn Leu Asp Lys Trp Lys Lys Ala Leu Ala Ser Leu Asn Glu Ile
275 280 285
Ile Leu Gln Lys Asn Ile Lys
290 295
<210> 30
<211> 178
<212> PRT
<213> Flavobacterium alvei
<400> 30
Met His Lys Ala Ser Ile Leu Asp Leu Asn Thr Ala Lys Ser Leu Phe
1 5 10 15
Ala Glu Ile Thr Glu Ser Gly Ile Pro Tyr Asp Tyr Gln Gln Ala Asn
20 25 30
Cys His Asn Ile Ser His Tyr Ile Ser Ser Leu Leu Glu Ser Lys Gly
35 40 45
Tyr Gln Cys Ala Lys Ile Trp Ala Phe Ala Pro Ala Val Tyr Ser Thr
50 55 60
Ser Asn Ser Lys Leu Ile Ser Phe Ile Asp Glu Lys Asn Ile Ser Pro
65 70 75 80
Thr Gly Thr Ile Asp Trp Arg Tyr His Val Ala Pro Val Ile Glu Val
85 90 95
Gln Ile Gly Asn Lys Val Arg Lys Met Val Ile Asp Leu Gly Leu Phe
100 105 110
Pro Asn Glu Phe Val Arg Tyr Arg Thr Trp Leu Ala Lys Leu Lys Thr
115 120 125
Lys Lys Leu Ile Tyr Leu Ile Met Asp Ser Glu Trp Tyr Leu Tyr Asn
130 135 140
Ser Ser Met Ile Thr Asn Ala Gln Leu Glu Phe Asp Ser Asn Glu Glu
145 150 155 160
Ile Asn Ala Asn Gln Pro Asn Ile Lys Leu Pro Glu Trp Phe Ala Asp
165 170 175
Lys Leu
<210> 31
<211> 266
<212> PRT
<213> 肯塔基伦茨氏菌(Lentzea kentuckyensis)
<400> 31
Met Val Leu Gly Thr Pro Val Thr Leu Ala Lys Ala Asn Glu Met Phe
1 5 10 15
Thr Leu Val Asn Asn Arg Thr Ala Cys Ser Ala Asn Pro Val Ala Pro
20 25 30
Gly Ile Pro Phe Thr Tyr Pro Asp Asp Gly Cys Trp Gly Arg Ala His
35 40 45
Glu Met Cys Arg Leu Met Ile Gly Ala Gly Val Gln Pro Asp Lys Val
50 55 60
Trp Ile Tyr Gly Ser Leu His Val Val Ser Phe Asn Lys Pro Gly Cys
65 70 75 80
Asn Val Tyr Trp Gly Trp His Val Ala Pro Thr Leu Thr Leu Thr Thr
85 90 95
Gly Glu Thr Tyr Val Val Asp Pro Ala Leu Phe Pro Asn Pro Val Pro
100 105 110
Arg Ala Thr Trp Ala Ser Val Gln Gly Asp Pro Ser Ala Ser Leu Val
115 120 125
Pro Thr Gly Ala Asp Val Phe His Arg Ser Ser Gly Gly Gly Leu Thr
130 135 140
Phe Asp Pro Thr Tyr Ser Gln Thr Asn Ser Val Leu Ala Thr Tyr Arg
145 150 155 160
Thr Gln Leu Gln Leu Arg Ala Ala Gly Pro Ser Gly Pro Pro Pro Tyr
165 170 175
Ser Glu Cys Leu Thr Arg Pro Ala Gly Thr Gln Trp Phe Gly Thr Ile
180 185 190
Ala Gly Asn Ser Ser Gln Arg Trp Phe Thr Phe Gly Trp Pro Ala Gly
195 200 205
Trp His Met Val Trp Thr Ile Met Pro Thr Leu Ile Cys Pro Gly Thr
210 215 220
Pro Thr Leu Ser Trp Ser Val Ala Ala Glu Arg Ala Asn Ser Thr Gln
225 230 235 240
Ala Thr Tyr Trp Ile Thr Val Thr Asn Ser Ser Pro His Thr Val Arg
245 250 255
Phe Glu Gly Arg Tyr Asp Val Leu Ser Thr
260 265
<210> 32
<211> 181
<212> PRT
<213> 肯塔基伦茨氏菌(Lentzea kentuckyensis)
<400> 32
Met Val Leu Gly Thr Pro Val Thr Leu Ala Lys Ala Asn Glu Met Phe
1 5 10 15
Thr Leu Val Asn Asn Arg Thr Ala Cys Ser Ala Asn Pro Val Ala Pro
20 25 30
Gly Ile Pro Phe Thr Tyr Pro Asp Asp Gly Cys Trp Gly Arg Ala His
35 40 45
Glu Met Cys Arg Leu Met Ile Gly Ala Gly Val Gln Pro Asp Lys Val
50 55 60
Trp Ile Tyr Gly Ser Leu His Val Val Ser Phe Asn Lys Pro Gly Cys
65 70 75 80
Asn Val Tyr Trp Gly Trp His Val Ala Pro Thr Leu Thr Leu Thr Thr
85 90 95
Gly Glu Thr Tyr Val Val Asp Pro Ala Leu Phe Pro Asn Pro Val Pro
100 105 110
Arg Ala Thr Trp Ala Ser Val Gln Gly Asp Pro Ser Ala Ser Leu Val
115 120 125
Pro Thr Gly Ala Asp Val Phe His Arg Ser Ser Gly Gly Gly Leu Thr
130 135 140
Phe Asp Pro Thr Tyr Ser Gln Thr Asn Ser Val Leu Ala Thr Tyr Arg
145 150 155 160
Thr Gln Leu Gln Leu Arg Ala Ala Gly Pro Ser Gly Pro Pro Pro Tyr
165 170 175
Ser Glu Cys Leu Thr
180
<210> 33
<211> 540
<212> DNA
<213> 嗜盐噬菌弧菌属细菌(Halobacteriovorax sp.)
<400> 33
atgagccaag agttcgtgcc gcgtagcagc ggtgttatta gctggaagaa agcgggcgaa 60
ctgtttgaga aggcgaagaa aatgaaagaa ctgacctggc gttacaccgc ggatggttgc 120
tatgcgcgtg cggagctgat ggtgaacatg atggaggaag agggtgttat cgcggacaag 180
gcgtggacca gcggctacct gaagagcaaa agcagcccgc acccgtggag ctaccatgtg 240
gcgccggttg tgtatgttaa caacggtcgt ggccacgtgc agaagatgat cattgatccg 300
gcggtggcga acggtccggt tgaaccggac gagtggctgc gtctgatggg tgtgaacgag 360
aagaacctgg atcaagttgg tttcccgccg agcctggatg cggttagcgt gggccgtaac 420
accttcacca tcagcgatcg tagcaccttt cacccgcagg acaagacccg tctgaccaaa 480
gagcaacgtg ttaccgcggc gcgtgcgctg ctggcggacc tgggtaaccg tctgcagtaa 540
<210> 34
<211> 558
<212> DNA
<213> 嗜盐噬菌弧菌科(Halobacteriovoraceae)细菌
<400> 34
atgcgtaacg tggcggcggc ggaccgtaac agcgttcaga ccatcagcat ggagaaggcg 60
cgtgaactgt tcgacaaagc gcaagcgatg gacgatattg cgtggggcta caagccggat 120
ggttgctatg cgcgtgcgca cctgatggcg cgtcgttttg aggaaatggg tatcaccgtt 180
gacaaggcgt ggctgaaagg cagcctgcgt gcgcagggtg aaaccccgga ggaagatatt 240
atgtggaact tccacgtggc gccggtggtt tacgttgagc acgacaacgg cgagatcgaa 300
cgtgtggtta ttgatccgag cgtggaggaa ggtccggtta ccgcgatgga gtgggcgaaa 360
aacctgagca gcgacgtgga ggaacgtgtt aacatcaccc agttcccgta cccggagaac 420
agcgcggaat atctgaagaa cagcctggcg tttagcaaca gcgatccgta tctgccgctg 480
gagagcaccg aaagcaccga ggaacaaaag atgagcatgg cgcacgcgac catgctggag 540
tacaaaggtt atgaataa 558
<210> 35
<211> 570
<212> DNA
<213> 酸杆菌门(Acidobacteria)细菌
<400> 35
atgtgcacca aaattgttcc gagctacacc aaggcgaaag aaatcttcga tttttgcgcg 60
cagcaaagct gcaacctggg tatcccgacc accgtgaccc cgtgcattcc gtttcagtac 120
gttcgtgacg attgctatgc gcgtgcgcac aagatgcgtt ggatcattga gcagcgttac 180
ggctattgct gcgaaaaagt gttcagcttt gcgaaccaaa acaacgacga gctgagcgtt 240
cgtgcggata agtggggtgg ctgctgcgtt aactggtggt accacgtggc gccgctgatc 300
cgtgttcaaa tcaagattag caccttcagc tttgtgattg cgctggttgt ggacccgagc 360
atgttcgata aaccggttat gctgagcagc tggctgaccg cgcaggaaaa cgcggcgtgc 420
ggtgcgcacg cgaaagtgag catgtatagc atccaaccgg gtagcgcgta caccccggcg 480
aactatgcgg gtaccgcgtt taccaccgac ccgagctaca ccgcgaccga tgcgaccctg 540
attgcgtata aaaacctgac cacctgctaa 570
<210> 36
<211> 441
<212> DNA
<213> δ-变形菌纲(Deltaproteobacteria)细菌
<400> 36
atgagcaaga gcgaggtgaa cagcctgttc aacgactttc tgaaccaccc gaagctggtt 60
ttcagcgcga acaacaccgg ttgcgaaagc aaagcggatc tgatggcgga gatcgcgcac 120
caaaagggcc acgaagtgag caaaatttgg gttcgtccga tgaacagcac cgacaacttt 180
ccggtgtacc tgaacgaggc gaaaaccgaa agcaccgttt ggaactatca cgtggcgatc 240
caggttaaga tgaaaaccag cagcggtacc gaaaccatga tcattgaccc gagcctgttc 300
gatgaaccgg tgaccatgga cacctggagc aagcgtatta gcagcctgag cgatgaatac 360
gactatgatc tggagtttaa agaaagcagc cgtgaggcgt tctttggtcc ggaagacatg 420
gttaccagcg aaacccgtta g 441
<210> 37
<211> 657
<212> DNA
<213> 红螺菌科(Rhodospirillaceae)细菌
<400> 37
atgcgtagcg gtttctttcc ggttgcggag gatgcggtgc gtgtggttag cccggcgcag 60
gcgctggaaa tctttgatac cctgcgtgcg atgcaaaaca ttagccacga gtacaccgat 120
gatggttgcg cgcagcgtgc gcacctgatg tgccgtgcgc tggttgacat gaagctggcg 180
ccggagaaag gctgggcgtt cgaaaccccg aagcgtgacc tggtggttga ttatccgcac 240
gtgagccaaa tctggtggtt tcatgtggcg ccggttctgc gtgtggcgag cgagaaaggt 300
ggcgcggaac cgatggcgtt cgacaccgtt ctgtttgatg gtccggcgac catgaaggag 360
tggggcagcg ttatgaaagc gcagccggaa caaatccacg tgctgccgtg cggcaagagc 420
ccgaaaggtc actacggcga ctatcgtccg ggtgtgcgta ccggttatgc gagcgatgcg 480
gcggcgcaga aggcgatgga taaatatatt gcgctggaga acgaagatgg cttcgttcgt 540
ccgcaagtgt ttgagagcgc gctgcgtaag aaactggaag cgaccacccc ggacaacccg 600
cgtccggcgg atcgtaagaa acagccgccg gcgcagggtc aaaacggtcc ggcgtaa 657
<210> 38
<211> 567
<212> DNA
<213> 红螺菌科(Rhodospirillaceae)细菌
<400> 38
atgcgtagcg gtttctttcc ggttgcggag gatgcggtgc gtgtggttag cccggcgcag 60
gcgctggaaa tctttgatac cctgcgtgcg atgcaaaaca ttagccacga gtacaccgat 120
gatggttgcg cgcagcgtgc gcacctgatg tgccgtgcgc tggttgacat gaagctggcg 180
ccggagaaag gctgggcgtt cgaaaccccg aagcgtgacc tggtggttga ttatccgcac 240
gtgagccaaa tctggtggtt tcatgtggcg ccggttctgc gtgtggcgag cgagaaaggt 300
ggcgcggaac cgatggcgtt cgacaccgtt ctgtttgatg gtccggcgac catgaaggag 360
tggggcagcg ttatgaaagc gcagccggaa caaatccacg tgctgccgtg cggcaagagc 420
ccgaaaggtc actacggcga ctatcgtccg ggtgtgcgta ccggttatgc gagcgatgcg 480
gcggcgcaga aggcgatgga taaatatatt gcgctggaga acgaagatgg cttcgttcgt 540
ccgcaagtgt ttgagagcgc gctgtag 567
<210> 39
<211> 888
<212> DNA
<213> Flavobacterium alvei
<400> 39
atgcacaagg cgagcatcct ggatctgaac accgcgaaaa gcctgttcgc ggaaatcacc 60
gagagcggta ttccgtacga ctatcagcaa gcgaactgcc acaacatcag ccactacatt 120
agcagcctgc tggaaagcaa gggctatcag tgcgcgaaaa tttgggcgtt cgcgccggcg 180
gtttacagca ccagcaacag caagctgatc agctttattg atgagaaaaa catcagcccg 240
accggtacca ttgactggcg ttatcacgtg gcgccggtta tcgaagtgca aattggtaac 300
aaggttcgta aaatggtgat cgatctgggc ctgttcccga acgagtttgt gcgttaccgt 360
acctggctgg cgaagctgaa aaccaagaaa ctgatctatc tgattatgga tagcgagtgg 420
tacctgtata acagcagcat gattaccaac gcgcagctgg agttcgacag caacgaggaa 480
atcaacgcga accaaccgaa cattaagctg ccggaatggt ttgcggacaa gctgatcacc 540
gatttcttta aatacgagga agagagcctg gaacagcact gggttgagaa gggtctggcg 600
gtgaacgaaa ccgcgattga gttttacgat accgaaatca aaccgattct gtatagcgag 660
cagcaccaag acctggttaa ggattacaaa atgctggttg gcgacgtgtt caactttgaa 720
accatcttcc gtgataacaa ctggaactat gagatgaaca acgactttca gatcaagcac 780
caagaaatca tcagcaagta ccgtaccatc tacagcctga acctggacaa atggaagaaa 840
gcgctggcga gcctgaacga gatcattctg caaaagaaca tcaaataa 888
<210> 40
<211> 537
<212> DNA
<213> Flavobacterium alvei
<400> 40
atgcacaagg cgagcatcct ggatctgaac accgcgaaaa gcctgttcgc ggaaatcacc 60
gagagcggta ttccgtacga ctatcagcaa gcgaactgcc acaacatcag ccactacatt 120
agcagcctgc tggaaagcaa gggctatcag tgcgcgaaaa tttgggcgtt cgcgccggcg 180
gtttacagca ccagcaacag caagctgatc agctttattg atgagaaaaa catcagcccg 240
accggtacca ttgactggcg ttatcacgtg gcgccggtta tcgaagtgca aattggtaac 300
aaggttcgta aaatggtgat cgatctgggc ctgttcccga acgagtttgt gcgttaccgt 360
acctggctgg cgaagctgaa aaccaagaaa ctgatctatc tgattatgga tagcgagtgg 420
tacctgtata acagcagcat gattaccaac gcgcagctgg agttcgacag caacgaggaa 480
atcaacgcga accaaccgaa cattaagctg ccggaatggt ttgcggacaa gctgtag 537
<210> 41
<211> 801
<212> DNA
<213> 肯塔基伦茨氏菌(Lentzea kentuckyensis)
<400> 41
atggttctgg gtaccccggt gaccctggcg aaagcgaacg aaatgttcac cctggtgaac 60
aaccgtaccg cgtgcagcgc gaacccggtt gcgccgggta tcccgtttac ctatccggat 120
gatggttgct ggggtcgtgc gcacgagatg tgccgtctga tgatcggcgc gggtgttcag 180
ccggacaaag tgtggattta cggcagcctg cacgttgtga gcttcaacaa accgggctgc 240
aacgtttatt ggggttggca tgtggcgccg accctgaccc tgaccaccgg tgaaacctat 300
gttgtggacc cggcgctgtt tccgaacccg gttccgcgtg cgacctgggc gagcgtgcag 360
ggcgacccga gcgcgagcct ggttccgacc ggtgcggatg tgttccaccg tagcagcggt 420
ggcggtctga cctttgaccc gacctacagc caaaccaaca gcgtgctggc gacctatcgt 480
acccagctgc aactgcgtgc ggcgggtccg agcggtccgc cgccgtacag cgaatgcctg 540
acccgtccgg cgggtaccca gtggttcggc accatcgcgg gtaacagcag ccaacgttgg 600
ttcacctttg gttggccggc gggttggcac atggtgtgga ccatcatgcc gaccctgatt 660
tgcccgggta ccccgaccct gagctggagc gttgcggcgg agcgtgcgaa cagcacccaa 720
gcgacctact ggattaccgt taccaacagc agcccgcaca ccgtgcgttt tgaaggtcgt 780
tatgatgttc tgagcaccta a 801
<210> 42
<211> 546
<212> DNA
<213> 肯塔基伦茨氏菌(Lentzea kentuckyensis)
<400> 42
atggttctgg gtaccccggt gaccctggcg aaagcgaacg aaatgttcac cctggtgaac 60
aaccgtaccg cgtgcagcgc gaacccggtt gcgccgggta tcccgtttac ctatccggat 120
gatggttgct ggggtcgtgc gcacgagatg tgccgtctga tgatcggcgc gggtgttcag 180
ccggacaaag tgtggattta cggcagcctg cacgttgtga gcttcaacaa accgggctgc 240
aacgtttatt ggggttggca tgtggcgccg accctgaccc tgaccaccgg tgaaacctat 300
gttgtggacc cggcgctgtt tccgaacccg gttccgcgtg cgacctgggc gagcgtgcag 360
ggcgacccga gcgcgagcct ggttccgacc ggtgcggatg tgttccaccg tagcagcggt 420
ggcggtctga cctttgaccc gacctacagc caaaccaaca gcgtgctggc gacctatcgt 480
acccagctgc aactgcgtgc ggcgggtccg agcggtccgc cgccgtacag cgaatgcctg 540
acctag 546

Claims (10)

1.一种蛋白质脱酰胺酶,其特征在于,包含以下(a)~(c)中任一项所示的多肽:
(a)多肽,其包含序列号1~11中任一者所示的氨基酸序列、或者序列号1的338~515位的氨基酸序列、序列号2的381~564位的氨基酸序列、序列号4的122~309位的氨基酸序列、序列号5的1~146位的氨基酸序列、序列号6的19~235位的氨基酸序列、序列号6的19~205位的氨基酸序列、序列号7的10~303位的氨基酸序列、序列号7的10~186位的氨基酸序列、序列号9的162~426位的氨基酸序列、或序列号9的162~341位的氨基酸序列;
(b)多肽,其包含在序列号1~11中任一者所示的氨基酸序列、或者序列号1的338~515位的氨基酸序列、序列号2的381~564位的氨基酸序列、序列号4的122~309位的氨基酸序列、序列号5的1~146位的氨基酸序列、序列号6的19~235位的氨基酸序列、序列号6的19~205位的氨基酸序列、序列号7的10~303位的氨基酸序列、序列号7的10~186位的氨基酸序列、序列号9的162~426位的氨基酸序列、或序列号9的162~341位的氨基酸序列中,一个或多个氨基酸被替换、添加、插入或缺失而成的氨基酸序列,且具有催化使蛋白质的谷氨酰胺残基脱酰胺化的反应的活性;
(c)多肽,其包含相对于序列号1~11中任一者所示的氨基酸序列、或者序列号1的338~515位的氨基酸序列、序列号2的381~564位的氨基酸序列、序列号4的122~309位的氨基酸序列、序列号5的1~146位的氨基酸序列、序列号6的19~235位的氨基酸序列、序列号6的19~205位的氨基酸序列、序列号7的10~303位的氨基酸序列、序列号7的10~186位的氨基酸序列、序列号9的162~426位的氨基酸序列、或序列号9的162~341位的氨基酸序列的序列一致性为70%以上的氨基酸序列,且具有催化使蛋白质的谷氨酰胺残基脱酰胺化的反应的活性。
2.一种DNA,其特征在于,编码权利要求1所述的蛋白质脱酰胺酶。
3.一种表达盒或重组载体,其特征在于,包含权利要求2所述的DNA。
4.一种转化体,其特征在于,是使用权利要求3所述的表达盒或重组载体转化宿主而得到的。
5.一种蛋白质脱酰胺酶的制造方法,其特征在于,包括培养权利要求4所述的转化体的工序。
6.一种酶制剂,其特征在于,包含权利要求1所述的蛋白质脱酰胺酶。
7.根据权利要求6所述的酶制剂,其中,所述酶制剂为含有蛋白质的饮食品或饮食品用原材料、产业用原材料、或者医药用原材料的改性剂。
8.一种谷氨酰胺残基被脱酰胺化的蛋白质的制造方法,其特征在于,包括使权利要求1所述的蛋白质脱酰胺酶作用于蛋白质的工序。
9.根据权利要求8所述的制造方法,其中,在饮食品或饮食品用原材料、产业用原材料或者医药用原材料中含有所述蛋白质。
10.一种改性的饮食品或饮食品用原材料、产业用原材料、或者医药用原材料的制造方法,其包括使权利要求1所述的蛋白质脱酰胺酶作用于含有蛋白质的饮食品或饮食品用原材料、产业用原材料、或者医药用原材料的工序。
CN202280012194.XA 2021-02-03 2022-02-03 蛋白质脱酰胺酶 Pending CN116829719A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2021016088 2021-02-03
JP2021-016088 2021-02-03
PCT/JP2022/004322 WO2022168927A1 (ja) 2021-02-03 2022-02-03 タンパク質脱アミド酵素

Publications (1)

Publication Number Publication Date
CN116829719A true CN116829719A (zh) 2023-09-29

Family

ID=82741600

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280012194.XA Pending CN116829719A (zh) 2021-02-03 2022-02-03 蛋白质脱酰胺酶

Country Status (5)

Country Link
US (1) US20240124912A1 (zh)
EP (1) EP4289943A1 (zh)
JP (1) JPWO2022168927A1 (zh)
CN (1) CN116829719A (zh)
WO (1) WO2022168927A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2023090461A1 (zh) * 2021-11-22 2023-05-25

Also Published As

Publication number Publication date
JPWO2022168927A1 (zh) 2022-08-11
EP4289943A1 (en) 2023-12-13
WO2022168927A1 (ja) 2022-08-11
US20240124912A1 (en) 2024-04-18

Similar Documents

Publication Publication Date Title
KR100855519B1 (ko) 신규 펩타이드 신타제 유전자
CN101918551B (zh) 草酸脱羧酶的生产中利用的重组表达质粒载体及重组菌、以及重组草酸脱羧酶的生产方法
JPH10508475A (ja) トリペプチジルアミノペプチダーゼ
CN116829719A (zh) 蛋白质脱酰胺酶
Kino et al. Dipeptide synthesis by L-amino acid ligase from Ralstonia solanacearum
CN111132556A (zh) 用于对蛋白进行水解的多肽、用途和方法
CN117425729A (zh) 漆酶
US20220162619A1 (en) Preparation of wheat cysteine protease triticain-alpha produced in soluble form and method of producing same
US20100279334A1 (en) Cyclodipeptide synthases (cdss) and their use in the synthesis of linear dipeptides
KR20080108921A (ko) 살조활성 단백질분해효소, 이를 코딩하는 유전자 및 이를포함하는 살조제제
Maruyama et al. Prolyl endopeptidase inhibitory activity of peptides in the repeated sequence of various proline-rich proteins
JP2007319063A (ja) ジペプチドの製造方法
US7601807B2 (en) Protease, DNA encoding the same, and method for manufacturing protease
CN117321207A (zh) 漆酶
EP1036843A1 (en) DNA molecule encoding an aminopeptidase, and method of producing the aminopeptidase
JP3493400B2 (ja) 新規なアミノ末端保護基遊離酵素
CN114540263A (zh) 一种耐高温羧肽酶在枯草芽孢杆菌中的构建方法及其在低苦味植物低聚肽中的应用
CN117651709A (zh) 具有溶菌酶活性的修饰多肽
JP3518868B2 (ja) バシラスリケニフォーミス菌株から由来したアミノペプチダーゼ及び天然蛋白質の製造方法
KR20110086711A (ko) 봉입체 형성 단백질의 제조방법
EP1404829B1 (en) Novel aminopeptidase derived from bacillus licheniformis, gene encoding the aminopeptidase, expression vector containing the gene, transformant and method for preparation thereof
CN118234866A (zh) 蛋白质脱酰胺酶
CN117535273B (zh) 温敏型碱性蛋白酶变体及其应用
KR100365838B1 (ko) 브레비바실러스 보스테렌시스 bcs-1 에서 유래한 신규내열성 d-입체특이적 디펩티다아제 및 이를 이용한d-아미노산 함유 펩타이드의 합성 방법
KR100477062B1 (ko) 바실러스 리케니포미스 유래의 신규한 아미노펩티다아제, 이를 코딩하는 유전자, 이 유전자를 포함하는 발현벡터, 이 발현벡터로 형질전환된 형질전환체 및 이를 이용하는 천연형 단백질의 제조방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination