CN1753996A - 参与番红菌素生物合成的基因簇及其用于遗传工程的用途 - Google Patents

参与番红菌素生物合成的基因簇及其用于遗传工程的用途 Download PDF

Info

Publication number
CN1753996A
CN1753996A CNA2003801098581A CN200380109858A CN1753996A CN 1753996 A CN1753996 A CN 1753996A CN A2003801098581 A CNA2003801098581 A CN A2003801098581A CN 200380109858 A CN200380109858 A CN 200380109858A CN 1753996 A CN1753996 A CN 1753996A
Authority
CN
China
Prior art keywords
leu
ala
val
gly
arg
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2003801098581A
Other languages
English (en)
Inventor
A·维拉斯科伊格勒斯亚斯
F·德拉卡勒
T·阿帕里西奥佩雷兹
C·施莱斯纳桑彻兹
P·阿塞博派斯
P·罗德里古兹拉莫斯
F·雷耶斯贝尼特兹
R·亨里奎兹佩兰茨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pharmamar SA
Original Assignee
Pharmamar SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pharmamar SA filed Critical Pharmamar SA
Publication of CN1753996A publication Critical patent/CN1753996A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/33Heterocyclic compounds
    • A61K31/395Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins
    • A61K31/495Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins having six-membered rings with two or more nitrogen atoms as the only ring heteroatoms, e.g. piperazine or tetrazines
    • A61K31/4995Pyrazines or piperazines forming part of bridged ring systems
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/04Antibacterial agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D401/00Heterocyclic compounds containing two or more hetero rings, having nitrogen atoms as the only ring hetero atoms, at least one ring being a six-membered ring with only one nitrogen atom
    • C07D401/02Heterocyclic compounds containing two or more hetero rings, having nitrogen atoms as the only ring hetero atoms, at least one ring being a six-membered ring with only one nitrogen atom containing two hetero rings
    • C07D401/12Heterocyclic compounds containing two or more hetero rings, having nitrogen atoms as the only ring hetero atoms, at least one ring being a six-membered ring with only one nitrogen atom containing two hetero rings linked by a chain containing hetero atoms as chain links
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D403/00Heterocyclic compounds containing two or more hetero rings, having nitrogen atoms as the only ring hetero atoms, not provided for by group C07D401/00
    • C07D403/02Heterocyclic compounds containing two or more hetero rings, having nitrogen atoms as the only ring hetero atoms, not provided for by group C07D401/00 containing two hetero rings
    • C07D403/12Heterocyclic compounds containing two or more hetero rings, having nitrogen atoms as the only ring hetero atoms, not provided for by group C07D401/00 containing two hetero rings linked by a chain containing hetero atoms as chain links
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D413/00Heterocyclic compounds containing two or more hetero rings, at least one ring having nitrogen and oxygen atoms as the only ring hetero atoms
    • C07D413/14Heterocyclic compounds containing two or more hetero rings, at least one ring having nitrogen and oxygen atoms as the only ring hetero atoms containing three or more hetero rings
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D471/00Heterocyclic compounds containing nitrogen atoms as the only ring hetero atoms in the condensed system, at least one ring being a six-membered ring with one nitrogen atom, not provided for by groups C07D451/00 - C07D463/00
    • C07D471/02Heterocyclic compounds containing nitrogen atoms as the only ring hetero atoms in the condensed system, at least one ring being a six-membered ring with one nitrogen atom, not provided for by groups C07D451/00 - C07D463/00 in which the condensed system contains two hetero rings
    • C07D471/04Ortho-condensed systems
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D471/00Heterocyclic compounds containing nitrogen atoms as the only ring hetero atoms in the condensed system, at least one ring being a six-membered ring with one nitrogen atom, not provided for by groups C07D451/00 - C07D463/00
    • C07D471/12Heterocyclic compounds containing nitrogen atoms as the only ring hetero atoms in the condensed system, at least one ring being a six-membered ring with one nitrogen atom, not provided for by groups C07D451/00 - C07D463/00 in which the condensed system contains three hetero rings
    • C07D471/14Ortho-condensed systems
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/21Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Pseudomonadaceae (F)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/10Nitrogen as only ring hetero atom
    • C12P17/12Nitrogen as only ring hetero atom containing a six-membered hetero ring
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/18Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing at least two hetero rings condensed among themselves or condensed with a common carbocyclic ring system, e.g. rifamycin
    • C12P17/182Heterocyclic compounds containing nitrogen atoms as the only ring heteroatoms in the condensed system

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Biophysics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Physics & Mathematics (AREA)
  • Communicable Diseases (AREA)
  • Oncology (AREA)
  • Epidemiology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Plant Pathology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Saccharide Compounds (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Medicines Containing Plant Substances (AREA)
  • Nitrogen Condensed Heterocyclic Rings (AREA)

Abstract

一种具有编码足以指导番红菌素分子合成的多肽的可读框的基因簇。

Description

参与番红菌素生物合成的基因簇及其用于遗传工程的用途
发明领域
本发明涉及负责番红菌素生物合成的基因簇,它用于遗传工程的用途,以及通过生物合成机制操作获得的新番红菌素。
发明背景
番红菌素,是具有强的广谱抗细菌活性的新化合物家族,发现于假单胞菌属(Pseudomonas)物种的培养液中。番红菌素存在于两种假单胞菌属物种菌株中,即分离自在Tagawagun Fukuoka,日本(Ikeda等人J.Antibiotics 1983,36,1279-1283;WO 82 00146和JP58113192)收集的土壤样品的荧光假单胞菌(Pseudomonasflurescens)A2-2和从取自Raritan-Delaware Canal,新泽西州附近(Meyers等人J.Antibiot.1983,36(2),190-193)的水样品分离的荧光假单胞菌SC 12695。番红菌素A和B,由荧光假单胞菌A2-2生产,已经检验到其抗不同的肿瘤细胞系,而且发现其具有除抗细菌活性之外的抗肿瘤活性。
Figure A20038010985800061
番红菌素A R=H                                  ET-743
        B R=OH
由于番红菌素B与ET-743之间的结构相似性,番红菌素提供了半合成高度有希望的有效的新抗肿瘤剂ET-743的可能性,其分离自海洋被囊动物加勒比海海鞭子(Ecteinascidia turbinata),而且在欧洲和美国目前处于II期临床试验阶段。已经实现了从番红菌素B到ET-743的半合成(Cuevas等人Organic Lett.2000,10,2545-2548;WO 00 69862和WO 0187895)。
作为通过化学合成制备番红菌素或它的结构类似物的替代,对控制次级代谢的基因进行操作提供了有希望的替代并使得能够生物合成地制备这些化合物。此外,番红菌素结构提供了令人兴奋的组合生物合成的可能性。
考虑到番红菌素的复合结构与它们获自荧光假单胞菌A2-2的局限性,非常需要理解它们合成的遗传基础以便产生以靶定方式影响他们的方法。这可以增加生产的番红菌素的量,因为天然生产菌株通常只生产低浓度的感兴趣的次级代谢物。它还使得能够在本来不生产这些化合物的宿主中生产番红菌素。另外,遗传操作可用于新的番红菌素类似物的组合生产,该新的番红菌素类似物显示改良的特性而且可用于新海鞘素化合物的半合成。
然而,生物合成方法的成功极其依赖于新的遗传系统的可用性与编码新的酶活性的基因。阐明番红菌素基因簇有助于通过扩大特别与番红菌素生物合成相关的基因的所有组成成分(repertoire)来进行组合生物合成的总领域,从而导致经由组合生物合成制备新的前体和番红菌素的可能性。
发明概述
我们目前能鉴定并克隆番红菌素生物合成的基因,提供了以靶定方式提高与操作假单胞菌属物种的生产力,并利用遗传方法,合成番红菌素类似物的遗传基础。此外,这些基因编码参与生产该结构例如番红菌素前体的生物合成过程的酶,所述结构形成生产各式各样的化合物的组合化学作用的基础。可以筛选这些化合物的各种生物活性,包括抗癌活性。
因此,第一个方面,本发明提供了一种核酸,合适地一种分离的核酸,其包括一种DNA序列(包括其突变或变体),其编码负责番红菌素生物合成的非核糖体肽合成酶。本发明提供了一种基因簇,合适地一种分离的基因簇,其具有编码指导番红菌素分子装配的多肽的可读框。
本发明的一个方面,是一种包括至少一种核酸序列,合适地一种分离的核酸分子的组合物,该核酸分子编码至少一种催化番红菌素生物合成的至少一个步骤的多肽。该组合物中可以存在两种或更多这种核酸序列。还提供了DNA或相应的RNA。
特别地,本发明涉及包含核酸序列的番红菌素基因簇的一种核酸序列,合适地一种分离的核酸序列,所述核酸序列的一部分或多个部分,其中所述的一个部分或多个部分编码一种多肽或多种多肽或一种多肽或多种多肽的生物学活性片段,衍生自所述核酸序列的单链核酸序列,或衍生自所述核酸序列的一部分或多个部分的单链核酸序列,或衍生自单链核酸序列的双链核酸序列(例如来自mRNA的cDNA)。该核酸序列可以是DNA或RNA。
更特别地,本发明涉及一种核酸序列,合适地一种分离的核酸序列,其包括或包含至少SEQ ID 1,其变体或部分,或sacA、sacB、sacC、sacC、sacD、sacE、sacF、sacG、sacH、sacH、sacI、sacJ、orf1、orf2、orf3或orf4基因中的至少一个,包括变体或部分。这些部分的长度至少为10、15、20、25、50、100、1000、2500、5000、10000、20000、25000个或更多核苷酸。这些部分的长度一般在100到5000,或100到2500个核苷酸的范围内,而且具有生物学功能。
突变体或变体包括多核苷酸分子,其中至少一个核苷酸残基被改变,取代,缺失或插入。在1、2、3、4、5、10、15、25、50、100、200、500或更多位置具有不同的核苷酸的多重变化是可能的。编码相同多肽的简并变体,以及编码不同多肽的非简并变体是期望的。该部分、突变体或变体核酸序列合适地编码保持由番红菌素基因簇的任何可读框编码的各自多肽的生物活性的多肽。包含等位基因形式与多态现象。
本发明还涉及一种能在严格条件下与本发明的核酸序列杂交的分离的核酸序列。特别地优选与本发明的核酸序列的可翻译长度杂交。
本发明还涉及一种编码多肽的核酸,该多肽与由番红菌素基因簇可读框saca到sacJ,与orf1到orf4(SEQ ID 1与SEQ ID 1编码的基因)中的任何一种编码的,或由其变体或部分编码的多肽的氨基酸序列至少30%、优选50%、优选60%、更优选70%、特别地80%、90%、95%或以上的相同。该多肽合适地保持由番红菌素基因簇可读框中的任何一种编码的各自的多肽的生物活性。
特别地,本发明涉及一种编码SacA、SacB、SacC、SacD、SacE、SacF、SacG、SacH、SacI、SacJ、Orf1、Orf2、Orf3或Orf4蛋白(SEQID 2-15)中的任何一种,及其变体,突变体或部分的分离的核酸序列。
一个方面,本发明的分离的核酸序列编码肽合成酶,L-Tyr衍生的羟化酶,L-Tyr衍生的甲基化酶,L-Tyr O-甲基化酶,甲基-转移酶或单加氧酶或番红菌素抗性蛋白。
本发明还提供了一种杂交探针,其是如上定义的核酸序列或其部分。该探针合适地包含至少5、10、15、20、25、30、40、50、60或更多个核苷酸残基的序列。优选为长度在25到60范围内的序列。本发明还涉及所定义的探针用于检测番红菌素或海鞘素基因的用途。特别地,该探针可用于检测加靶比海海鞭子中的基因。
本发明有关的方面,涉及由如上定义的核酸序列编码的多肽。全序列,变体、突变体或片段多肽是预期的。
本发明的另一个方面涉及一种载体,优选一种表达载体,优选粘粒,其包含编码蛋白或蛋白的生物学活性片段的核酸序列,其中所述的核酸是如上所述定义的核酸。
本发明的另一个方面,涉及一种用一种或多种如上所述定义的核酸序列或如上所述的载体,表达载体或粘粒转化的宿主细胞。优选的宿主细胞是用包含编码足以指导番红菌素或番红菌素类似物装配的多肽的基因簇的外源核酸转化的。优选地,宿主细胞为微生物,更优选为细菌。
本发明还涉及重组的细菌宿主细胞,其中如上所述定义的核酸序列的至少一部分被破坏,结果得到相对于对应的非重组细菌宿主细胞,能生产改变水平的番红菌素化合物或番红菌素类似物的重组宿主细胞。
本发明还涉及生产番红菌素化合物或番红菌素类似物的方法,包括在适于生产这种化合物或类似物的条件下和培养基中,使生物体例如假单胞菌属物种发酵,其中编码足以指导番红菌素或番红菌素类似物装配的多肽的番红菌素基因/簇的拷贝数已经增加。
本发明还涉及生产番红菌素化合物或类似物的方法,包括在适于生产这种化合物或类似物的条件下和培养基中,使生物体例如假单胞菌属物种发酵,其中已经通过操作或置换负责调节这种表达的一个或多个基因或序列来调节编码足以指导番红菌素或番红菌素类似物装配的多肽的基因的表达。优选地,基因表达被增强。
本发明还涉及包括至少一种如上所述定义的分离的核酸序列或其修饰物的组合物用于非-核糖体肽,二酮哌嗪环与番红菌素的组合生物合成的用途。
特别地,该方法包括,使作为由如上述定义的一个或多个番红菌素生物合成基因簇可读框编码的多肽的底物的化合物,与由一个或多个番红菌素生物合成基因簇可读框编码的多肽接触,从而该多肽化学修饰该化合物。
在另一个实施方案中,本发明提供了一种生产番红菌素或番红菌素类似物的方法。该方法包括,提供用包含编码足以指导所述的番红菌素或番红菌素类似物装配的多肽的番红菌素基因簇的外源核酸转化的微生物;在允许番红菌素或番红菌素类似物生物合成的条件下培养该细菌;以及从所述细胞分离所述的番红菌素或番红菌素类似物。
本发明还涉及任何前体化合物P2、P14、其类似物和衍生物,以及它们在组合生物合成非-核糖体肽,二酮哌嗪环与番红菌素中的用途。
另外,本发明还涉及通过敲除(knock out)番红菌素P19B,番红菌素P22A,番红菌素P22B,番红菌素D和番红菌素E所获得的新的番红菌素,与它们用作抗微生物剂或抗肿瘤剂的用途,以及它们在海鞘素化合物合成中的用途。
本发明还涉及通过如上所述定义的指导的生物合成所获得的新的番红菌素,和它们用作抗微生物剂或抗肿瘤剂的用途,以及它们在海鞘素化合物合成中的用途。特别地,本发明涉及番红菌素B-乙氧基和番红菌素A-乙氧基以及它们的用途。
一个方面,本发明使得能够制备与不能或难以通过化学合成制备的番红菌素和海鞘素相关的结构。另一个方面是利用该知识可以在加勒比海海鞭子中生物合成海鞘素,例如在该生物体或被公认的共生生物中利用这些序列或部分作为探针。
更根本地,本发明打开一个宽阔的领域并产生了通过遗传工程获得海鞘素的方法。
附图简述
图1:克隆到pL30p粘粒中的染色体DNA区域的结构组织。显示了包含番红菌素基因簇的荧光假单胞菌A2-2DNA的区域。举例说明了sacABCDEFGH与sacIJ基因操纵子与从sacA、sacB与sacC推断的该肽合成酶的模块组织。指出了下述的结构域:C:缩合;T:硫羟化;A:腺苷酸化以及Re:还原酶。显示了存在于pL30p粘粒(orf1到orf4)中的其它基因的位置以及它们的假设的功能。
图2:NRPS之间的保守的核心基元。SacA、SacB与SacC蛋白中的保守的氨基酸序列,以及它们与其来自黄色粘球菌(Myxococcusxanthus)DM50415的同源序列的比较。
图3.假设用于形成Ala-Gly二肽的NRPS生物合成机制。步骤a*,Ala的腺苷酸化;b*,转入4′-磷酸泛酰巯基乙胺基臂;c*,转到等待/延伸位点;d*,Gly的腺苷酸化;e*,转入4′-磷酸泛酰巯基乙胺基臂;f*,使4′-磷酸泛酰巯基乙胺基臂上的延伸链与位于等待/延伸位点的起始链缩合;g*,Ala-Gly二肽附着于SacA的磷酸泛酰巯基乙胺基臂上,及h*,延伸的链转到以下的等待/延伸位点。
图4:互养实验。A.克隆到pBBR1-MCS2载体中的A2-2DNA片段的图解以及在异源宿主中获得的产物。B.野生型菌株对比sacF突变体中番红菌素生产的HPLC图。添加P2前体到sacF突变体中,以反式(in trans)与合成形式提供,导致番红菌素B生产。SfcA,番红菌素A和SfcB,番红菌素B。
图5:番红菌素生物合成机制与生物合成中间物图解。通过连续的箭标指示单一的酶步骤,并通过不连续的箭标指示多重反应步骤。
图6:番红菌素基因破坏与生产的化合物。A.基因破坏与通过构建的突变体合成的前体分子。用星号标记的基因不属于番红菌素簇。orf1、orf2、orf3与orf4基因的失活证明对番红菌素生产没有影响。B.野生型菌株与sacA、sacI与sacJ突变体中番红菌素生产的HPLC图。显示了获得的不同分子的结构。
图7:通过基因破坏获得的不同分子的结构。SacJ蛋白(a)的失活产生了P22B、P22A与P19分子,而sacI(b)的基因破坏只产生了P19化合物。sacI破坏,与sacJ重建的表达一起,产生了两种新的番红菌素:番红菌素D(用于ET-729半合成的可能的前体)与番红菌素E(c)。
图8:添加专门设计的“非天然的”前体(P3)。通过添加P3化合物到该sacF突变体中而获得的两个分子的化学结构。
图9:利用克隆到pK18:MOB(假单胞菌属中的整合质粒)中的同源DNA片段,通过简单重组,进行基因破坏事件的图解。
发明详述
非核糖体肽合成酶(NRPS)是负责包括许多结构上和功能上不同的天然产物的化合物家族生物合成的酶。例如,具有生物学活性的肽提供化合物的结构主链,该化合物显示各种生物学活性例如,抗生素、抗病毒剂、抗肿瘤剂与免疫抑制剂(Zuber等人Biotechnology ofAntibiotics 1997(W.Strohl,ed.),187-216Marcel dekker,Inc.,N.Y;Marahiel等人Chem.Rev.1997,97,2651-2673)。
尽管结构上完全不同,这些生物学活性肽中大多数具有共同的生物合成机制方案。依据这种模型,肽键形成发生在命名为肽合成酶的多酶上,在其上氨基酸底物通过ATP水解为相应的腺苷酸而活化。不稳定的中间物接着被转到多酶的另一个位点,在该位点其作为硫酯结合到酶-结合的4′-磷酸泛酰巯基乙胺基(4′-PP)辅因子的半胱胺基团上。在该阶段,巯基-激活的底物可以进行修饰例如差向异构化或N-甲基化。硫酯化的底物氨基酸然后通过一系列转肽作用反应通过逐步的延伸整合到肽产物中。利用排列在肽合成酶中的模板,该模块似乎是彼此独立操作的,但是它们协调一致来催化连续肽键的形成(Stachelhaus等人Science 1995,269,69-72;Stachel haus等人Chem.Biol.1996,3,913-921)。已经广泛地评论了非核糖体肽生物合成的一般方案(Marahiel等人Chem.Rev.1997,97,2651-2673;Konz和Marahiel,Chem.and Biol.1999,6,R39-R48;Moffit和Neilan,FEMS Microbiol.Letters 2000,191,159-167)。
最近已经克隆,测序并部分表征了许多细菌操纵子与编码肽合成酶的真菌基因,提供了对它们的分子结构的有价值的了解(Marahiel,Chem and Biol.1997,4,561-567)。使用了不同的克隆策略,包括通过抗肽合成酶的抗体的表达文库的探测,缺陷突变体的互补,以及设计的来源于肽合成酶片段的氨基酸序列的寡核苷酸的利用。
这些基因的一级结构的分析,显示存在大约600个氨基酸的明显的同源结构域。该特异性功能结构域由长度为大约3到8个氨基酸的至少6个高度保守的核心序列组成,它们的次序与位置在所有已知的结构域中是十分相似的(Küsard和Marahiel,Peptide Research1994,7,238-241)。来源于保守核心的简并寡核苷酸的使用展现了使用聚合酶链反应(PCR)技术,从基因组DNA鉴定和克隆肽合成酶的可能性(Küsard和Marahiel,Peptide Research 1994,7,238-241;Borchert等人FEMS Microbiol Letters 1992,92,175-180).
番红菌素的结构表明该化合物是通过NRPS机制合成的。来自荧光假单胞菌A2-2番红菌素簇的非核糖体肽合成酶与相关的裁剪酶(tailoring enzyme)的克隆和表达,可以产生无限量的番红菌素。另外,克隆的基因能被用于新的番红菌素类似物的组合生产,该新的番红菌素类似物显示改良的特性而且可被用于新海鞘素的半合成。此外,在异源体系中克隆和表达番红菌素基因簇,或者组合番红菌素基因簇与其他的NRPS基因结果产生具有改良的活性的新药物。
特别地,本发明提供了编码负责番红菌素生物合成的NRPS也即番红菌素合成酶的DNA序列。我们已经表征了来自荧光假单胞菌A2-2基因组的26,705bp的区域(SEQ ID NO:1),将其克隆到pL30P粘粒中,并通过敲除实验和异源表达证明该区域负责番红菌素的生物合成。我们在两个不生产番红菌素的假单胞菌属物种菌株中表达了pL30P粘粒,结果与荧光假单胞菌A2-2生产相比,荧光假单胞菌(CECT378)产生了水平为22%的番红菌素A和B,而铜绿假单胞菌(P.aeruginosa)(CECT 110)产生了2%的番红菌素A和B。由该DNA序列编码的各种肽的预测的氨基酸序列分别显示于SEQ ID NO:2到SEQID NO:15。
来源于荧光假单胞菌A2-2的用于番红菌素生物合成的基因簇,通过组织在两个背弛的操纵子的几个可读框(ORF)的存在来表征(图1),即一个8基因操纵子(sacABCDEFG)和一个2基因操纵子(sacIJ),其前面为非常保守的重叠的推定的启动子区域。番红菌素生物合成基因簇在荧光假单胞菌A2-2基因组中只存在一个拷贝。
我们的结果表明,8基因操纵子负责番红菌素骨架的生物合成,而2基因操纵子负责番红菌素最后的裁剪。
在sacABCDEFGH操纵子中,由sacA、sacB和sacC编码的推测的氨基酸序列与NRPS的基因产物非常相似。在SacA、SacB和SacC的推测的氨基酸序列内,在每个ORF上都鉴定了一个肽合成酶模块。
番红菌素NRPS蛋白的第一个惊奇的特征是在肽合成酶的已知的活性位点和核心区域中(Konz和Marahiel,Chem.and Biol.1999,6,R39-R48),第一个核心在所有的3个肽合成酶,SacA、SacB和SacC中是很不保守的(图2)。其它5个核心区域在3个番红菌素NRPSs基因中是很保守的。第一个核心(LKAGA)的生物学重要性是未知的,但是SGT(ST)TGxPKG(GochtandMarahiel,J.Bacteriol.1994,176,2654-266;Konz和Marahiel,Chem.and Biol.1999,6,R39-R48),TGD(Gocht和Marahiel,J.Bacteriol.1994,176,2654-2662;Konz和Marahiel,1999)与KIRGxRIEL(Pavela-Vrancic等人J.Biol.Chem 1994,269,14962-14966;Konz和Marahiel,Chem.andBiol.1999,6,R39-R48)核心序列的功能可以指定为ATP结合和水解。核心序列LGGxS的丝氨酸残基显示为硫酯形成的位点(D′Souza等人,J.Bacteriol.1993,175,3502-3510;Vollenbroich等人,FEBS Lett.1993,325(3),220-4;Konz和Marahiel,Chem.andBiol.1999,6,R39-R48)与4′-磷酸泛酰巯基乙胺结合的位点(Stein等人FEBS Lett.1994,340,39-44;Konz和Marahiel,Chem.andBiol.1999,6,R39-R48)。这些发现,加之番红菌素似乎是从氨基酸合成的事实,支持了经由硫代模板(thiotemplate)机制形成的非-核糖体肽键参与番红菌素生物合成途径,以及sacA、sacB和sacC编码相应的肽合成酶的假说。依据这种机制,氨基酸通过ATP水解活化为氨酰基-腺苷酸,接着通过羧基-硫酯键与酶共价结合。然后,进一步中,发生转肽作用和肽键形成。
其次,显著地我们的序列资料清楚地表明共线性规则不适用于番红菌素合成酶体系,根据该规则,氨基酸沿着染色体的结合模块的顺序平行于肽中氨基酸的顺序。根据该序列数据库同源性与番红菌素和番红霉素结构同源性,SacA将负责识别和激活Gly残基,而SacB和SacC将负责识别和激活整合到番红菌素骨架中的2个L-Tyr衍生物,而推定的Ala-NRPS基因在番红菌素基因簇中丧失。在少许非核糖体肽合成酶基因簇中,例如在原始霉素(Crecy-Lagard等人,J.ofBacteriol.1997,179(3),705-713)与在膦丝菌素三肽(Schwartz等人Appl Environ Microbiol 1996,62,570-577)生物合成途径中,第一个NRPS与第二个NRPS基因不并列。具体地,在原始霉素生物合成途径中第一个结构基因(snbA)与第二个结构基因(snbC)相隔130kb。在其中pL30P粘粒异源表达的结果明显地证明NRPS基因没有丧失的番红菌素基因簇中情况并非如此,因为存在异源番红菌素生产。
第三,尽管关于形成二肽Ala-Gly的机制的问题仍未解决,但sacA中在第一个NRPS基因的氨基末端存在额外的C结构域,表明该基因的双功能腺苷酸化激活活性的可能性。我们认为在转到等待位置之前,Ala将首先被加载到SacA的磷酸泛酰巯基乙胺基臂上(图3a*和b*),所述等待位置为一个缩合结构域,位于sacA的N-末端(图3,c*)。Gly腺苷酸然后加载到相同的磷酸泛酰巯基乙胺基臂上(图3,d*和e*),所述臂位于延伸位点,而且将发生延伸(图3,f*)。第一个模块的臂在该阶段将由Ala-Gly二肽加载(图3,g*)。我们认为该二肽然后将转到位于SacB上的第二个磷酸泛酰巯基乙胺基臂的等待位置(图3,h*),以继续番红菌素四肽基本骨架的合成。一种可供选择的生物合成机制是指导二肽Ala-Gly整合到SacA中。在这种情况下,二肽可以来源于高活性肽基转移酶核酶家族的活性(Sun等人,Chem.and Biol.2002,9,619-626)或者来源于细菌蛋白水解的活性。
第四,尽管在大多数原核肽合成酶中,好象是负责从酶释放成熟肽链的硫酯酶部分,被融合到最后一个氨基酸结合模块的C-末端(Marahiel等人Chem.Rev.1997,97,2651-2673),但在番红菌素合成酶的情况下,TE结构域丧失。可能地,在番红菌素合成中,在最后一个延伸步骤后,通过可供选择的策略释放四肽用于肽链终止,所述策略也发生在番红霉素合成中(Pospiech等人Microbiol.1996,142,741-746)。这种特别的终止策略通过位于SacC肽合成酶羧基-末端的还原酶结构域催化,该结构域催化相关的T-结构域-粘连的酰基的还原性裂解,释放线性的醛。
我们的互养实验表明,最后2个整合到番红菌素分子中的氨基酸为2个L-Tyr衍生物,称为P2(3-羟基-5-甲基-O-甲基酪氨酸)(图4,5),而不是如认为番红霉素合成中出现的2个L-Tyr。首先,2个基因(sacF和sacG)的产物,类似于细菌甲基转移酶,已经显示参与生产P2的前体P14(3-甲基-O-甲基酪氨酸)的L-Tyr的O-、C-甲基化。可以设想的一种可能的机制是首先发生O-甲基化,然后产生氨基酸衍生物的C-甲基化。其次,肽合成酶SacB和SacC的底物P2,是由SacD通过P14的羟化作用形成的(图4,5)。
Figure A20038010985800161
C11H15NO3                                        C11H15NO4
精确质量:209,11                                     精确质量:225,10
分子量:209,24                                       分子量:225,24
C,63,14;H,7,23;N,6,69;O,22,94         C,58,66;H,6,71;N,6,22;O,28,41
P-14                                    P-2
除了番红菌素生物合成基因外,在sacABCDEFGH操纵子中还发现2个基因,sacE和sacH,它们分别与未知功能和番红菌素抗性机制相关。我们已经证明,sacH基因编码一种当在不同的假单孢菌属茵株中异源表达时,产生高度增加的番红菌素B抗性的蛋白。SacH是一种推定的跨膜蛋白,其将番红菌素B的C21-OH基团转化成为C21-H基团,来生产一种具有较少的抗生素和抗肿瘤活性的化合物番红菌素A。最后,尽管SacE的推定的功能仍然是未知的,已经发现该基因与一些微生物基因组中各种次级代谢物生物合成基因簇同源,表明该基因在次级代谢物形成或调节中保守的功能。
在sacIJ操纵子中,由sacI和sacJ编码的推测的氨基酸序列分别与甲基转移酶和羟化酶/单加氧酶的基因产物显著相似。我们的数据显示,SacI是负责存在于番红菌素结构中的N-甲基化的酶,而SacJ是在整合到四肽中的一个L-Tyr衍生物上产生另外的羟基化作用,以产生存在于所有番红菌素分子中的醌结构的蛋白。N-甲基化是一种能显著促进它们的生物活性的非核糖体合成的肽的修饰。除番红霉素外(Pospiech等人Microbiol.1996,142,741-746),其是由细菌产生的而且是N-甲基化的,所有N-甲基化的非核糖体肽已知均是由真菌或放线菌产生的,而且在大多数情况中,负责N-甲基化的是存在于非核糖体肽合成酶中的结构域。
表I.在粘粒pL30P中鉴定的番红菌素生物合成和抗性基因的总结
  ORF名称   蛋白名称   认为的功能   位置起始-终止bp   氨基酸   分子量
  sacAsacBsacCsacDsacEsacFsacGsacHsacIsacJ   SacASacBSacCSacDSacESacFSacGSacHSacISacJ   肽合成酶肽合成酶肽合成酶L-Tyr衍生物羟化酶未知L-Tyr衍生物甲基化酶L-Tyr 0-甲基化酶抗性蛋白甲基转移酶单加氧酶   3052-60636068-92689275-1357013602-1465114719-1490114962-1602616115-1715517244-177832513-18541861-355   10041063143235061355347180220509  110.4117.5157.339.26.739.838.319.624.255.3
图5显示了番红菌素推定的合成途径,并指示了用于每个缩合反应和各种缩合作用后活性的特异性氨基酸底物。
为了更进一步地评估番红菌素生物合成基因的作用,我们构建了番红菌素簇的每个基因的敲除突变体(图6)。NRPSs基因(sacA、sacB和sacC)以及sacD、sacF和sacG的破坏结果形成了番红菌素和P2的非生产性突变体。我们的结果表明从sacA到sacH的基因是相同的遗传操纵子的一部分。作为sacI和sacJ基因破坏的结果,产生了3个新的分子P19B、P22A和P22B(图6)。
Figure A20038010985800181
P-19B                                  P22A                                P22B
由sacJ突变体生产P22A和P22B(图7a*),证明SacJ蛋白的作用是产生与醌环相关的番红菌素的左侧L-Tyr衍生物氨基酸的另外的羟化作用。sacI突变体产生P19B(图7b*),一种其中没有N-甲基化和醌环的番红菌素样分子,证实SacI是N-甲基转移酶并表明sacIJ是转录操纵子。也由sacJ突变体产生P19B(图7a*)表明N-甲基化可能发生在醌环形式之后。即使这些新的结构没有对枯草芽孢杆菌(B.subtilis)产生感兴趣的抗微生物活性或对癌细胞产生高的细胞毒性活性,但是它们可以充当新的活性分子半合成的感兴趣的新的前体。至于涉及的结构活性,P19B、P22A和P22B看起来失去活性的观察,表明番红菌素结构醌环的失去与番红菌素家族分子活性的失去直接相关。
sacI基因破坏与sacJ基因表达重建的结果产生了2个新的番红菌素。以与野生型菌株中番红菌素A/番红菌素B生产水平一样高的生产水平产生的2个抗生素,命名为番红菌素D和番红菌素E(图7c*)。
番红菌素D                                                番红菌素E
番红菌素D和番红菌素E分别是番红菌素B和番红菌素A样分子,其中失去了N-甲基化。番红菌素D和番红菌素E都已经显示具有分别与番红菌素B和番红菌素A相同的抗细菌和抗肿瘤活性。除了它高的抗细菌和抗肿瘤活性特性,番红菌素D可被用于一种有效的抗肿瘤剂海鞘素ET-729的半合成以及新的海鞘素的半合成。
产生了关于由位于番红菌素操纵子3′位点的基因编码的氨肽酶样蛋白的作用的疑问。orf1(PM-S1-14)的插入失活显示对番红菌素A/番红菌素B的产生没有影响。由于它的功能特性,该蛋白是否能在番红菌素代谢作用中起到一些作用仍然是不清楚的。存在于pL30P粘粒中的其他基因(orf2到orf4)还需要更详细地研究。
本发明的另一个方面,提供了新的专门设计的“非天然”分子的生产所必需的工具。向sacE突变体中添加命名为P3的特异性修饰的P2衍生物前体,即一种3-羟基-5-甲基-O-甲基酪氨酸,产生了整合该特异性修饰的前体的2个“非天然”番红菌素,即番红菌素A(OEt)和番红菌素B(OEt)(图8)。
C30H40N4O6                                  C30H40N4O7
精确质量:552,29                                 精确质量:568,29
分子量:552,66                                   分子量:568,66
C,65,20;H,7,30;N,10,14;O,17,37    C,63,36;H,7,09;N,9,85;O,19,69
番红菌素A(OEt)                                   番红菌素B(OEt)
这2个新的番红菌素是有效的抗生素和抗肿瘤化合物。番红菌素A(OEt)和番红菌素B(OEt)的生物学活性分别与番红菌素A和番红菌素B的活性一样强。这些新的番红菌素可作为新的有效抗肿瘤剂的来源,以及用于新的海鞘素半合成的分子的来源。
此外,可以将参与番红菌素合成的基因与其他的非核糖体肽合成酶基因组合,来产生具有提高活性的新的“非天然”药物和类似物。
实施例
实施例1:从荧光假单胞菌A2-2提取核酸分子
细菌菌株
假单胞菌属物种菌株于27℃生长于Luria-Bertani(LB)液体培养基(Ausubel等人1995,J.Wiley and Sons,New York,N.Y)中。大肠杆菌(E.coli)菌株于37℃生长在LB培养基中。抗生素以下述浓度使用:氨苄青霉素(50μg/ml)、四环素(20μg/ml)以及卡那霉素(50μg/ml)。
表II.本发明中使用的菌株
  编号   基因型
  PM-S1-001PM-S1-002PM-S1-003PM-S1-004PM-S1-005PM-S1-006PM-S1-007PM-S1-008PM-S1-009PM-S1-010PM-S1-014PM-S1-015PM-S1-016PM-19-001PM-19-002PM-19-003PM-19-004PM-19-005PM-19-006PM-16-001PM-16-002PM-17-003PM-17-004PM-17-005PM-18-003PM-18-004PM-18-005   荧光假单胞菌A2-2野生型sacA-sacB-sacC-sacJ-sacI-sacI-与sacJ表达重构sacF-sacG-sacD-orf1-A2-2+pLAFR3A2-2+pL30p荧光假单胞菌CECT378+pLAFR3荧光假单胞菌CECT378+pL30p荧光假单胞菌CECT378+pBBR1-MCS2荧光假单胞菌CECT378+pB5H83荧光假单胞菌CECT378+pB7983荧光假单胞菌CECT378+pBHPT3铜绿假单胞菌CECT110+pLAFR3铜绿假单胞菌CECT110+pL30p恶臭假单胞菌(P.putida)ATCC12633+pBBR1-MCS2恶臭假单胞菌ATCC12633+pB5H83恶臭假单胞菌ATCC12633+pB7983施氏假单胞菌(P.stutzeri)ATCC17588+pBBR1-MCS2施氏假单胞菌ATCC17588+pB5H83施氏假单胞菌ATCC17588+pB7983
DNA操作
除非另作说明,使用标准分子生物学技术用于体外DNA操作和克隆(Sambrook等人1989,Cold Spring Harbor,NY:Cold SpringHarbor Laboratory)。
DNA提取
如报道所述制备来自荧光假单胞菌A2-2培养物的总DNA(Sambrook等人1989,Cold Spring Harbor,NY:Cold SpringHarbor Laboratory)。
计算机分析
使用DNA-Star软件包来编缉和分析序列数据。
实施例2:鉴定荧光假单胞菌A2-2中负责番红菌素生产的NRPS基因
引物设计
Marahiel等人(Marahiel等人Chem.Rev.1997,97,2651-2673)以前报道了环化的和分支的肽合成酶的催化结构域的高度保守的核心基元。基于几个报道的肽合成酶的多重序列比对,将腺苷酸化作用的保守区域A2、A3、A5、A6、A7和A8以及硫羟化模块的T用作简并引物设计的靶(Turgay和Marahiel,Peptide Res.1994,7,238-241)。根据在选择的模块内的密码子偏爱和预期的假单胞菌属物种的高G/C含量来设计摆动位置。所有的寡核苷酸都获自ISOGEN(Bioscience BV)。当使用来自YGPTE(A5核心)和LGGXS(T核心)序列的简并寡核苷酸时,就获得PCR片段。这些寡核苷酸分别表示为PS34-YG和PS6-FF。
表III.设计用于该研究的PCR引物。
  引物名称和方向   序列   长度
  PS34-YG(正向)   5′-TAYGGNCCNACNGA-3′   14-聚体
  PS6-FF(反向)   5′-TSNCCNCCNADNTCRAARAA-3′   20-聚体
扩增来自荧光假单胞菌A2-2的DNA的PCR条件
使用PS-34-YG和PS6-FF寡核苷酸和荧光假单胞菌A2-2染色体DNA作为模板,对非核糖体肽合成酶(NRPS)内的片段进行扩增。使用来自Promega的反应缓冲液和Taq聚合酶。在个人热循环仪(Eppendorf)中进行的循环特征由下述组成:95℃1分钟,50℃1分钟,72℃2分钟,进行30个循环。根据引物在其他的合成酶基因的NRPS结构域内的位置,PCR产物是预期大小的(大约750bp)。
DNA克隆
将PCR扩增片段根据制造商的方法克隆到pGEM-Teasy载体中(Qiagen,Inc.,Valencia,CA)。这样,克隆的片段在侧面与2个EcoRI限制位点相接,以便于随后亚克隆到其他的质粒中(参见下文)。因为NRPS酶是模块的,来自简并PCR引物的克隆代表来自不同结构域的片段的库。
DNA测序
所有的测序都使用针对克隆载体的引物,利用ABI自动化测序仪(Perkin-Elmer)进行。通过访问因特网上的国家生物技术信息中心(National Center for Biotechnology Information)的BLAST服务器,来对克隆的DNA序列进行鉴定(Altschul等人,Nucleic AcidsRes.1997,25,3389-3521)。所有序列都具有NRPS的特征区域,并且在BLAST搜索中显示与细菌的NRPS高度相似,这表明它们实际上是肽起源的。此外,使用PROSITE(European Molecular BiologyLaboratory,Heidelberg,德国)网络服务器进行可能的结构域相似性搜索。
荧光假单胞菌A2-2的基因破坏
为了分析克隆的基因的功能,通过同源重组破坏这些基因(图9)。为了该目的,带有NRPS基因片段的重组质粒(pG-PS衍生物)用EcoRI限制性内切酶进行消化。获得的片段属于将被突变的基因,被克隆到pKl8mob可动员质粒中(Schfer等人Gene 1994,145,69-73),其是一种能在大肠杆菌中复制但是不能在假单孢菌属菌株中复制的染色体整合质粒。重组质粒首先通过转化被引入到大肠杆菌S17-λPIR菌株中,然后通过双亲接合引入到荧光假单胞菌A2-2中(Herrero等人,J Bacteriol 1990,172,6557-6567)。将不同稀度的接合物置于包含氨苄青霉素加卡那霉素的LB固体培养基上,并且于27℃温育过夜。选择包含经由同源重组整合到基因组中的质粒的卡那霉素-抗性转接合子。
番红菌素生产的生物学测定(生物检测(biotest))
将荧光假单胞菌A2-2菌株以及它的衍生物温育于包含带有相应的抗生素的发酵培养基的50ml带挡板的锥形瓶中。起初,使用SA3发酵培养基(Ikeda Y.J.Ferment.Technol.1985,63,283-286)。为了增加发酵过程的生产力,将如Plackett-Burman设计的统计学-数学方法用于选择营养物,并且测试了响应表面最佳化技术(HendrixC Chemtech 1980,10,488-497)以测定每个关键自变量的最佳水平。还做了改良培养条件如温育温度和搅拌的实验。最后选择了高番红菌素B生产者培养基,称为16B(152g/l的甘露糖醇,35g/l的G20-25酵母,26g/l的CaCO3,14g/l的硫酸铵,0.18g/l的氯化铁,pH 6.5)。
通过10μl于27℃温育3天的假单胞菌属物种培养物的上清液抑制枯草芽孢杆菌固体培养物的能力来检测番红菌素生产(Alijah等人Appl Microbiol Biotechnol 1991,34,749-755)。荧光假单胞菌A2-2培养物产生10-14mm直径的抑制带,而非生产性突变体不抑制枯草芽孢杆菌的生长。3个分离的克隆具有受影响的番红菌素生物合成途径。为了证实该结果,对番红菌素生产进行了HPLC分析。
番红菌素生产的HPLC分析
上清液使用带有保护柱(Symmetry C-18,5μm 3.9×20mm,Waters)的HPLC Symmetry C-18 300,5μm,250×4.6mm柱(Waters)进行分析。流动相为乙酸铵缓冲液(10mM,1%二乙醇胺,pH 4.0)-乙腈梯度。通过268nm处的吸收来测定番红菌素。图6中显示了荧光假单胞菌A2-2菌株产生的番红菌素和番红菌素前体与荧光假单胞菌突变体产生的不同的番红菌素样结构的HPLC图。
实施例3.番红菌素簇的克隆与序列分析
反向PCR和噬菌体文库杂交
对突变体的染色体DNA进行DNA印迹杂交验证了正确的基因破坏,并证明了克隆到pK18mob质粒中的肽合成酶片段对番红菌素生产是必不可少的。对获得的非番红菌素生产者突变体进行的分析证明,它们所有的都具有到相同基因saca中的基因破坏。
对基因组DNA进行的反向PCR以及荧光假单胞菌A2-2基因组DNA的噬菌体筛选揭示,sacA基因侧翼存在额外的基因,其可能参与番红菌素生物合成。
荧光假单胞菌A2-2番红菌素生物合成簇的核苷酸序列数据的GenBank登录号为AY061859。
粘粒文库构建与异源表达
为了测定番红菌素簇是否能给非生产者菌株赋予番红菌素生物合成能力,把番红菌素簇克隆到宽范围的粘粒载体中(pLAFR3,Staskawicz B.等人J Bacteriol 1987,169,5789-5794)并接合到不同的假单胞菌属物种收集菌株上。
为了获得包含完整簇的克隆,构建了粘粒文库并进行筛选。为了该目的,将染色体DNA用限制性内切酶PstI进行部分消化,将片段进行去磷酸化,并连接到粘粒载体pLAFR3的PstI位点。粘粒用Gigapack III金包装提取物(Stratagene)根据制造商所建议的进行包装。菌株XL1-Blue的感染的细胞铺平板于补充有50μg/ml四环素的LB-琼脂上。用属于番红菌素簇的3′-末端的DIG-标记的DNA片段,使用集落杂交来筛选阳性克隆。为了确保该完整簇的克隆,用5′-末端DNA片段进行新的集落杂交。仅仅粘粒pL30p显示与DNA探针多重杂交。为证实正确的克隆,用属于番红菌素序列的DNA寡核苷酸进行PCR扩增和DNA测序。pL30P插入片段的大小为26,705bp。把pL30p克隆的DNA转化入大肠杆菌S17λPIR中,使获得的菌株与异源假单胞菌属物种菌株接合。pL30p粘粒通过如上所述的双亲接合被引入到铜绿假单胞菌CECT378和荧光假单胞菌CECT110中。一旦鉴定了编码完整簇的克隆,就可以测定该候选物是否能够生产番红菌素。通过如前面所述的对液体培养物上清液进行HPLC分析和生物学测定,来评定接合的菌株中的番红菌素生产。
表达pL30p粘粒的菌株荧光假单胞菌CECT378(PM-19-002)能生产相当多的量的番红菌素,而表达pL30P的铜绿假单胞菌CECT110菌株(PM-16-002)中的番红菌素生产比CECT378低10倍。与天然生产者菌株相比,这些菌株中的番红菌素生产为总生产的大约22%与2%。
参与番红菌素形成的基因。sacABCDEFGH与sacIJ操纵子的序列分析
pL30P的DNA序列的计算机分析显示有14个ORF(图1)。在每个ATG起始密码子之前有可能的核糖体结合位点。
在sacABCDEFGH操纵子中,3个非常大的ORF,sacA、sacB与sacC(分别为荧光假单胞菌A2-2番红菌素序列SEQ ID NO:1的3052到6063,6080到9268与9275到13570位置)可以相同的方向阅读,并且编码推定的番红菌素NRPS:SacA(1004个氨基酸,Mr 110452),SacB(1063个氨基酸,Mr 117539)与SacC(1432个氨基酸,Mr 157331)。这3个NRPS基因包含与已知的肽合成酶的氨基酸激活结构域相似的结构域。特别地,这些NRPS基因的氨基酸激活结构域与在黄色粘球菌番红霉素NRPS中发现的4个氨基酸激活结构域中的3个(Gly、Tyr与Tyr)十分类似(Pospiech等人Microbiology 1995,141,1793-803;Pospiech等人Microbiol.1996,142,741-746)。特别地,SacA(SEQ ID NO:2)显示与来自黄色粘球菌的番红霉素Mx1合成酶B蛋白(SafB)(NCBI登录号U24657)有33%的同一性,而SacB(SEQ IDNO:3)与SacC(SEQ ID NO:4)分别与来自黄色粘球菌的番红霉素Mx1合成酶A(SafA)(NCBI登录号U24657)有39%与41%的同一性。图2显示了SacA、SacB、SacC与番红霉素NRPS的不同氨基酸激活结构域之间的比较。
sacC下游存在以与NRPS基因相同的方向阅读的5个小的ORF(图1)。第一个,sacD(荧光假单胞菌A2-2番红菌素序列的13602到14651位置),编码推定的蛋白,Sa cD(350个氨基酸,Mr39187;SEQ ID NO:5),在GeneBank DB中没有相似物。下一个,sacE(荧光假单胞菌A2-2番红菌素序列的14719到14901位置),编码一个小的推定的蛋白,称为SacE(61个氨基酸,Mr6729;(SEQ ID NO:6)),其显示与数据库中未知功能的蛋白(来自绿色产色链霉菌(Streptomycesviridochromogenes)的ORF1,(NCBI登录号Y17268;44%同一性)和来自结核分枝杆菌(Mycobacterium tuberculosis)的MbtH(NCBI登录号Z95208;36%同一性)有一些相似性。第三个ORF,sacF(荧光假单胞菌A2-2番红菌素序列的14962到16026位置),编码计算的分子量为39,834的355个残基的蛋白(SEQ ID NO:7)。该蛋白与来自橙色绿屈挠菌(Chloroflexus aurantiacus)的羟基链孢红素甲基转移酶(CrtF)(NCBI登录号AF288602;25%同一性)最相似。第四个ORF,sacG(荧光假单胞菌A2-2番红菌素序列的16115到17155位置)的核苷酸序列,预测为分子量38,22千道尔顿的347个氨基酸(SEQ ID NO:8)的基因产物。该蛋白,称为SacG,类似于包括来自环圈链霉菌(Streptomyces anulatus)的O-二甲基嘌呤霉素-O-甲基转移酶(DmpM)(NCBI登录号P42712;31%同一性)的细菌O-甲基转移酶。计算机检索还表明,该蛋白包含在各异的S-腺苷甲硫氨酸-依赖性甲基转移酶中发现的3个序列基元(Kagan和Clarke,Arch.Biochem.Biophys.1994,310,417-427)。第五个基因,sacH(荧光假单胞菌A2-2番红菌素序列的17244到17783位置),编码推定的蛋白SacH(180个氨基酸,Mr 19632;(SEQ ID NO:9)。计算机检索SacH的推测的氨基酸序列与其它蛋白序列之间的相似性,显示了与包含非常保守的跨膜基元和二氢叶酸还原酶样活性位点的未知功能的一些保守的假定蛋白(来自铜绿假单胞菌PA01的保守的假定蛋白,NCBI登录号P3469;35%同一性)具有同一性。
sacABCDEFGH操纵子上游,存在2个以相反方向阅读的基因操纵子,sacIJ。sacI基因(2513到1854位置)编码220个氨基酸的蛋白(Mr 24219;(SEQ ID NO:10),其与来自海栖热袍菌(Thermotogamaritime)的泛醌/manequinone甲基转移酶(NCBI登录号AE001745;32%同一性)非常类似。sacJ基因(1861到335位置)编码分子量为55341道尔顿的509个氨基酸的蛋白(SEQ ID NO:11),类似于细菌单加氧酶/羟化酶,包括来自枯草芽孢杆菌(NCBI登录号Y14081;33%同一性)和天蓝色链霉菌(Streptomyces coelicolor)(NCBI登录号AL109972;29%同一性)的推定的单加氧酶。
sacABCDEFGH和sacIJ操纵子背驰转录而且分开大约450bp。两个操纵子侧翼都为残余的转座酶片段。
相关的番红菌素簇基因
已经发现了一个位于番红菌素序列3′-末端的推定的ORF(orf1;荧光假单胞菌A2-2番红菌素序列的18322到19365位置)(图1)。ORF1蛋白(SEQ ID NO:12)显示与来自Gene Bank数据库的氨肽酶(来自新月柄杆菌(Caulobacter crescentus)CB15的肽酶M20/M25/M40家族;NCBI登录号NP422131;30%同一性)相似。使用实施例2中所述的策略,orf1的基因破坏不影响荧光假单胞菌A2-2中的番红菌素生产。
在克隆到pL30p粘粒中的番红菌素序列的3′-末端,发现了3个推定的ORF(orf2、orf3和orf4)。以与sacABCDEFGH操纵子的反方向阅读,orf2基因(SEQ ID NO:1的22885到21169位置)编码蛋白ORF2(SEQ ID NO:13),其与Aquifex aeolicus HoxX感应蛋白(NCBI登录号NC000918.1;35%同一性)相似,而off3基因(SEQ ID NO:1的23730到23041位置)编码ORF3蛋白(SEQ ID NO:14),其与来自地毯草黄单胞菌柠檬变种306菌株(Xanthomonas axonopodis pv.Citri str.306)的糖基转移酶相关蛋白(NCBI登录号NP642442)具有44%的同一性。
第三个基因位于SEQ ID NO:1的3′-末端(25037到26095位置)。该基因称为orf4(2513到1854位置),编码ORF4蛋白(SEQ ID NO:15),其与来自大肠杆菌的一个假定的异分支酸酶(isochorismatase)家族的蛋白最类似(NCBI登录号P75897;32%同一性)。
推测认为,这3个基因不参与番红菌素生物合成途径,然而,这些基因将来的基因破坏将证实该假设。
发现的不同的DNA序列列于说明书的末尾。
实施例4.番红菌素基因座的功能分析与可能前体的搜索
由于荧光假单胞菌A2-2中番红菌素合成的途径目前是未知的,所以实施例3中所述的每个基因的失活容许对该菌株中番红菌素生物合成机制进行基础研究。
为了分析番红菌素生产途径中每个特别的蛋白的功能,对除sacE之外的该簇的每个特别的基因进行破坏。遵循前面描述的破坏策略获得所有的遗传突变体。
图6是本发明中构建的不同的突变体的总结,以及通过由于基因破坏的结果得到的突变体所产生的化合物的总结。在野生型菌株中,通过HPLC清楚地检测到了番红菌素A和B及其他化合物P2与P14(参见图6,WT)。sacA(PM-S1-002)、sacB(PM-S1-003)、sacC(PM-S1-004)、sacD(PM-S1-010)、sacF(PM-S1-008)与sacG(PM-S1-009)的基因破坏产生了突变体,所述突变体既不能产生番红菌素A和番红菌素B,也不能分别产生停留时间低于15分钟的前体化合物P2与P14。P14和P2的结构解释揭示,P14是3-甲基-O-甲基酪氨酸,而P2是3-羟基-5-甲基-O-甲基酪氨酸。由于sacE基因的大小较小,所以sacE-突变体不能通过基因破坏获得,但是对该基因进行了缺失。相反地,SacE蛋白的过表达对番红菌素B/A的产生没有影响。sacI-突变体(PM-S1-006)产生P2、P14以及显著量的称为P19B的化合物(图6;图7b*)。P19B的结构解释揭示该化合物是番红菌素样分子,其中失去了N-Met与来自醌环的一个OH。在sacJ-突变体(PM-S1-005)中,获得了P2、P14、P19B和2个称为P22A与P22B的新化合物(图6;图7a*)。P22A和P22B的结构解释揭示它们分别是番红菌素A和番红菌素B样分子,没有来自醌环的-OH基团。sacI-与sacJ-突变体提取物的生物学测定表明非常低的抗枯草芽孢杆菌的活性。
具有sacJ基因表达的重建的sacI基因破坏,结果获得了一个新的番红菌素生产者突变体PM-S1-007。以与野生型菌株的番红菌素A和番红菌素B的水平同样高的生产水平生产的两种抗生素,命名为番红菌素D和番红菌素E(图7c*)。番红菌素D和番红菌素E分别为番红菌素B和番红菌素A样分子,其中没有N-甲基化作用。
这些结果强烈地表明,i)sacA、sacB和sacC基因编码番红菌素NRPs;ii)sacD、sacF和sacG基因负责把L-Tyr转化成L-Tyr衍生物P2;和iii)sacI和sacJ负责把P19和P22转化成番红菌素的裁剪修饰。
天然前体的表征
P-14
Figure A20038010985800291
C11H15NO3
精确质量:209,11
分子量:209,24
C,63,14;H,7,23;N,6,69;O,22,94
菌株:
荧光假单胞菌A2-2(野生型)(PM-S1-001)
发酵条件:
用0.1%冰冻的微生物营养原种接种包含1%葡萄糖;0.25%牛肉膏;0.5%细菌用蛋白胨;0.25%NaCl;0.8%CaCO3的种子培养基YMP3,并且于27℃于旋转振荡器(250rpm)上温育。温育30小时之后,将2%(v/v)的种子培养物转移到含有250ml M-16B生产培养基的2000ml锥形瓶中,所述培养基由15.2%甘露糖醇;3.5%干啤酒酵母;1.4%(NH4)2SO4;0.001%FeCl3;2.6%CO3Ca组成。温育温度从接种直到40小时为27℃,然后为24℃到最后步骤(71小时)。不控制pH。旋转振荡器的搅拌为220rpm,偏心率5厘米。
分离:
71小时温育之后,合并2个锥形瓶并且将500ml的发酵培养液以7,500rpm离心15分钟进行澄清。添加50克的树脂XAD-16(Amberlite)到上清液中,并且于室温混合30分钟。然后,通过过滤从澄清的培养液中回收树脂。树脂用蒸馏水洗涤两次并且用250ml异丙醇(2-PrOH)提取。乙醇提取物在高真空下干燥直到获得500mg粗提取物。将该粗提取物溶于甲醇中,并且利用Sephadex LH-20,以甲醇作为流动相,通过色谱柱进行纯化。洗脱P-14化合物并且干燥得到15mg的浅黄色固体。通过分析型HPLC和1H NMR测试其纯度。
还以同样的方式,利用与纯化过程中散后步骤一样的半制备型HPLC,从sacJ-突变体(PM-S1-005)的培养物分离P-14。
生物学活性:
没有活性的
光谱数据:
ESMS m/z 254(C11H14NO3Na2 +),232(C11H15NO3Na+),210(M+H+).1H RMN(300MHz,CD3OD):7.07(d,J=8.1Hz,H-9),7.06(s,H-5),6.84(d,J=8.1Hz,H-8),3.79(s,H-11),3.72(dd,J=8.7,3.9Hz,H-2),3.20(dd,J=14.4,3.9Hz,H-3a),2.91(dd,J=14.4,8.9 Hz,H-3b),2.16(s,H-10).13C RMN(75MHz,CD3OD):174.1(C-1),158.6(C-7),132.5(C-5),128.9(C-9),128.5(C-4),128.0(C-6),111.4(C-8),57.6(C-2),55.8(C-11),37.4(C-3),16.3(C-10)P-2
Figure A20038010985800311
C11H15NO4
精确质量:225,10
分子量:225,24
C,58,66;H,6,71;N,6,22;O,28,41
菌株:
荧光假单胞菌A2-2(野生型)(PM-S1-001)
发酵条件:
与P-14相同的方法
分离:
与P-14相似的程序,除了在Sephadex色谱法中,其中包含P-2的级分更迟洗脱。半制备型HPLC步骤(Symmetry Prep C-18柱,7.8×150mm,AcONH4 10mM pH=3/CH3CN 95∶5保持5分钟,然后为3分钟内从5到6.8%CH3CN的梯度)对P-2的纯化是必需的。由于异源表达,还从恶臭假单胞菌ATCC12633+pB5H83(PM-17-004)的发酵培养液分离了该化合物。
生物学活性:
没有活性的
光谱数据:
ESMS m/z226[M+H]+1H RMN(CD3OD,300MHz):6.65(d,J=1.8Hz,H-5),6.59(d,J=1.8Hz,H-9),3.72(s,H-11),3.71(dd,J=9.0,4.2Hz,H-2),3.16(dd,J=14.4,4.2Hz,H-3a),2.83(dd,J=14.4,9.0Hz,H-3b),2.22(s,H-10);13C RMN(DMSO,75MHz):170.88(s,C-1),150.025(s,C-7),144.56(s,C-8),132.28(s,C-4),130.36(s,C-6),121.73(d,C-5),115.55(d,C-9),59.06(q,7-OMe),55.40(d,C-2),36.21(t,C-3),15.86(q,6-Me).
通过敲除获得的番红菌素样化合物的表征
化合物P-22B
Figure A20038010985800321
C28H38N4O6
精确质量:526,28
分子量:526,62
C,63,86;H,7,27;N,10,64;O,18,23
菌株:
来自荧光假单胞菌A2-2的sacJ-突变体(PM-S1-005)
发酵条件:
将50升由葡萄糖(3.2%),甘露糖醇(9.6%),干啤酒酵母(2%),硫酸铵(1.4%),二代磷酸钾(0.03%),氯化钾(0.8%),氯化铁(III)6-水合物(0.001%),L-酪氨酸(0.1%),碳酸钙(0.8%),聚-(丙二醇)2000(0.05%)和防沫剂ASSAF 1000(0.2%)组成的SAM-7培养基(501),装入到总容量751的小型发酵罐中(Bioengineering LP-351),且在灭菌之后,添加无菌的抗生素(氨苄青霉素0.05g/l和卡那霉素0.05g/l)。然后,接种突变体菌株PM-S1-005的种子培养物(2%)。在通气和搅拌条件下(1.0l/1/分钟和500rpm)发酵71小时。控制温度为27℃(从接种到24小时)到25℃(从24小时到最后步骤)。通过稀释的硫酸的自动供料从22小时到最后步骤控制pH为pH6.0。
分离
澄清全部培养液(Sharples离心机)。通过添加NaOH 10%把澄清培养液的pH调节到pH 9.0,并且用25升的乙酸乙酯进行提取。20分钟的混合之后,把两个相分离。将有机相冷冻过夜,然后过滤以除去冰并且蒸发成为脂状深绿色提取物(65.8g)。
将该提取物与500ml己烷混合(250ml两次)并过滤以除去可溶于己烷的杂质。留下的固体,在干燥后得到27.4g的干燥绿色-浅褐色提取物。
将该新的提取物溶于甲醇并且通过Sephadex LH-20色谱法进行纯化(使用甲醇作为流动溶剂),在中心级分中洗脱到番红菌素样化合物(TLC上分析的条件:硅石正常相,流动相:EtOAc∶MeOH为5∶3,Aprox.Rf valor:P-22B为0.3,P-22A为0.25以及P-19为0.1)。
包含3个番红菌素样化合物的合并的级分(7.6g)通过使用50∶1到0∶1的EtOAc∶MeOH混合物的硅石柱及其他色谱系统(等度CHCl3∶MeOH∶H2O∶AcOH为50∶45∶5∶0.1)进行多纯化。P22-A、P22-B和P19-B化合物通过反相HPLC(SymmetryPrep C-18柱150×7.8mm,4mL/分钟,流动相:5分钟MeOH∶H2O(0.02%TFA)为5∶95,以及30分钟内MeOH∶H2O(0.02%TFA)为5∶95到MeOH∶H2O为100%的梯度)进行纯化。
番红菌素P-22B的生物学活性
抗微生物活性:固体培养基上
枯草芽孢杆菌.10μg/皿(直径6mm):抑制带10mm
光谱数据:
HRFABMS m/z 509.275351[M-H2O+H]+(对C28H37N4O5计算为
509.276396Δ1.0mmu);LRFABMS使用m-NBA作为基质m/z(rel强度)509[M-H2O+H]+(5),460(2.7),391(3)。
1H NMR(CD3OD,500MHz):6.70(s,H-15),6.52(s,H-5),4.72(bs,H-11),4.66(d,J=2.0Hz,H-21),4.62(dd,J=8.4,3.7Hz,H-1),3.98(bd,J=7.6Hz,H-13),3.74(s,7-OMe),3.71(s,17-OMe),3.63(m,重叠信号,H-25),3.62(m,重叠信号,H-3),3.30(m,H-22a),3.29(m,H-14a),3.18(d,J=18.6Hz,H-14b),2.90(m,H-4a),2.88(m,H-22b),2.76(s,12-NMe),2.30(s,16-Me),2.22(m,H-4b),1.16(d,J=7.4Hz,H-26);
13C NMR(CD3OD,125MHz):170.75(s,C-24),149.24(s,C-18),147.54(s,C-8),145.95(s,C-7),145.82(s,C17),133.93(s,C-16),132.31(s,C-9),131.30(s,C-6),128.95(s,C-20),121.93(d,C-15),121.76(d,C-5),121.44(s,C-10),112.45(s,C-19),92.87(d,C-21),60.86(q,7-OMe),60.76(q,17-OMe),59.39(d,C-11),57.96(d,C-13),55.51(d,C-1),54.29(d,C-3),50.08(d,C-25),45.55(t,C-22),40.43(q,12-NMe),32.56(t,C-4),25.84(t,C-14),17.20(q,C-26),16.00(q,16-Me),15.81(q,6-Me).
化合物P-22A
Figure A20038010985800351
菌株:
    与P-22B相同
发酵条件:
    与P-22B相同
分离:
    与P-22B相同
番红菌素P-22A的生物学活性
抗肿瘤活性
Figure A20038010985800352
抗微生物活性:固体培养基上
枯草芽孢杆菌.10μg/皿(直径6mm):没有活性的
光谱数据:
HRFABMS m/z 511.290345[M+H]+(对C28H39N4O5计算为511.292046Δ1.7mmu);LRFABMS使用m-NBA作为基质m/z(rel 强度)511[M+H]+(61),409(25),391(4);1H NMR(CD3OD,500MHz):6.68(s,H-15),6.44(s,H-5),3.71(s,7-OMe),3.67(s,17-OMe),2.72(s,12-NMe),2.28(s,16-Me),2.20(s,6-Me),0.87(d,J=7.1Hz,H-26);
化合物P-19B
菌株:
    与P-22B相同
发酵条件:
    与P-22B相同
分离:
    与P-22B相同
番红菌素P-19B的生物学活性
抗肿瘤活性
Figure A20038010985800362
抗微生物活性:固体培养基上
枯草芽孢杆菌.10μg/皿(直径6mm):没有活性的
光谱数据:
HRFABMS m/z 495.260410[M-H2O+H]+(对C27H35N4O5计算为495.260746Δ0.3mmu);LRFABMS使用m-NBA作为基质m/z(rel强度)495[M-H2O+H]+(13),460(3),391(2);1H NMR(CD3OD,500MHz):6.67(s,H-15),6.5(s,H-5),3.73(s,7-OMe),3.71(s,17-OMe),2.29(s,16-Me),2.24(s,6-Me),1.13(d,J=7.1Hz,H-26);
通过敲除获得的新的番红菌素化合物
番红菌素D
Figure A20038010985800371
C27H34N4O7
精确质量:526,24
分子量:526,58
C,61,58;H,6,51;N,10,64;O,21,27
菌株:
来自荧光假单胞菌A2-2的具有sacJ表达重建的sacI-(PM-S1-007)
发酵条件:
将50升由葡萄糖(3.2%),甘露糖醇(9.6%),干啤酒酵母(2%),硫酸铵(1.4%),二代磷酸钾(0.03%),氯化钾(0.8%),氯化铁(III)6-水合物(0.001%),L-酪氨酸(0.1%),碳酸钙(0.8%),聚-(丙二醇)2000(0.05%)和防沫剂ASSAF 1000(0.2%)组成的SAM-7培养基(501),装入到总容量751的小型发酵罐中(Bioengineering LP-351),且在灭菌之后,添加无菌的抗生素(氨苄青霉素0.05g/l和卡那霉素0.05g/l)。然后,接种突变体菌株PM-S1-007的种子培养物(2%)。在通气和搅拌条件下(1.0l/1/分钟和500rpm)发酵89小时。控制温度为27℃(从接种到24小时)到25℃(从24小时到最后步骤)。通过稀释的硫酸的自动供料从27小时到最后步骤控制pH为pH6.0。
分离:
如此获得的培养基(45l),在离心除去细胞之后,用稀释的氢氧化钠调节到pH9.5,并用25升乙酸乙酯提取两次。混合物放入搅拌-容器中在室温下处理20分钟。通过液体-液体离心把两个相分开。有机相于-20℃冷冻,并过滤以除去冰,且蒸发直到获得35g油-深色的粗提物。在用5l己烷研磨之后,将提取物(12.6g)通过急骤色谱柱(直径5.5cm,长度20cm)在硅石正常相和1L乙酸乙酯∶MeOH各为1∶0;20∶1;10∶1;5∶1和7∶3的流动相进行纯化。根据TLC(硅石正常的,EtOAc∶MeOH为5∶2,番红菌素D Rf 0.2,番红菌素E 0.05)洗脱250ml-级分并合并。包含不纯的番红菌素D和E的级分在高真空下蒸发(2.2g)。额外的纯化步骤是于相似条件(1∶0到5∶1的EtOAc∶MeOH)分离D和E所必需的,由此,分离包含番红菌素D和E的级分,蒸发,并用Sephadex LH-20柱色谱法进一步提纯,其中用甲醇进行洗脱。
获得的番红菌素D和E独立地从CH2Cl2(80ml)和己烷(1500ml)沉淀为绿色/浅黄色-干燥固体(800mg番红菌素D)和(250mg番红菌素E)。
番红菌素D的生物学活性
抗肿瘤筛选
Figure A20038010985800381
                   次级评估  (Mol/L)
次级筛选     大分子合成     细胞凋亡  DNA结合     细胞骨架
蛋白 DNA  RNA     核小体  GEL 肌动蛋白 微管蛋白   端粒酶
PM-Femando de laCalle020 20-AUG-02 IC50 1.90E-05 1.52E-05 3.80E-06 2.85E-06 6.65E-06
抗微生物活性:固体培养基上
枯草芽孢杆菌.10μg/皿(直径6mm):抑制带:直径15mm
光谱数据
ESMS:m/z 509[M-H2O+H]+1H NMR(CDCl3,300MHz):6.50(s,C-15),4.02(s,OMe),3.73(s,OMe),2.22(s,Me),1.85(s,Me),0.80(d,J=7.2Hz);13C NMR(CDCl3,75MHz):186.51,181.15,175.83,156.59,145.09,142.59,140.78,137.84,131.20,129.01,126.88,121.57(2xC),82.59,60.92,60.69,53.12,21.40,50.68,50.22,48.68,40.57,29.60,25.01,21.46,15.64,8.44.
番红菌素E
Figure A20038010985800391
C27H34N4O6
精确质量:510,25
分子量:510,58
C,63,51;H,6,71;N,10,97;O,18,80
菌株:
与番红菌素D相同
发酵条件:
与番红菌素D相同批次
分离:
参见番红菌素D的条件
番红菌素E的生物学活性
抗肿瘤筛选
                 次级评估 (Mol/L)
  次级筛选     大分子合成     细胞凋亡 DNA结合     细胞骨架
  蛋白 DNA RNA     核小体 GEL 肌动蛋白 微蛋白   端粒酶
PM-Femando de laCalle020 20-AUG-02 IC50 1.57E-05 >1.96E-05
抗微生物活性:固体培养基上
枯草芽孢杆菌.10μg/皿(直径6mm):抑制带9.5mm
光谱数据
ESMS:m/z 511[M+H]+1H NMR(CDCl3,300MHz):6.51(s,C-15),4.04(s,OMe),3.75(s,OMe),2.23(s,Me),1.89(s,Me),0.84(d,J=6.6Hz);13CNMR(CDCl3,75MHz):186.32,181.28,175.83,156.43,145.27,142.75,141.05,137.00,132.63,128.67,126.64,122.00,120.69,60.69,60.21,59.12,58.04,57.89,50.12,49.20,46.72,39.88,32.22,25.33,21.29,15.44,8.23.
实施例5.互养实验
用于P2和P14生产的番红菌素生物合成前体基因的异源表达
为了试图阐明P2和p14生物合成的机制,我们克隆并表达了下游的NRPS基因来测定它们的生物化学活性。
为了过量生产P14,克隆了sacEFGH基因(pB7983)(图4)。为了在异源系统中过量生产P2,克隆了sacD到sacH基因(pB5H83)(图4)。为了该目的,我们使用5′末端包含XbaI限制位点的寡核苷酸PCR扩增了含有目标基因的片段。寡核苷酸PFSC79(5′-CGTCTAGACACCGGCTTCATGG-3′)和PFSC83(5′-GGTCTAGATAACAGCCAACAAACATA-3′)用于扩增sacE到sacH基因;寡核苷酸5HPT1-XB(5′-CATCTAGACCGGACTGATATTCG-3′)和PFSC83(5′-GGTTAGATAACAGCCAACAAACATA-3′)用于扩增sacD到sacH基因。把用XbaI消化的PCR片段克隆到pBBR1-MCS2质粒的XbaI限制位点(ovach等人,Gene 1994,166,175-176)。两个质粒,pB7983和pB5H83,通过接合作用分别引入到3个异源细菌荧光假单胞菌(CECT 378),恶臭假单胞菌(ATCC 12633)和施氏假单胞菌(ATCC 17588)中(参见表II)。当转接合子菌株的发酵培养液通过HPLC分析核查时,在包含pB7983质粒的3个菌株中显示有大量的P14化合物,而当在异源细菌中表达pB5H83质粒时观察到了大量的P2和一些P14产物。
互养
正如实施例4中所示,sacF-(PM-S1-008)和sacG-(PM-S1-009)突变体既不能产生番红菌素也不能产生P2和P14化合物。在这些突变体的发酵期间添加化学合成的P2到这些突变体中产生番红菌素产物。
而且,把含有表达产生P2和P14的质粒pB5H83的施氏假单胞菌(ATCC 17588)的异源菌株(PM-18-004),与sacF-和sacG-两个突变体中的任一个一起共培养,结果获得了番红菌素生产。把含有只表达生产P14的质粒pB7983的异源菌株施氏假单胞菌(ATCC 17588)(PM-18-005),与前面提及的2个荧光假单胞菌A2-2突变体中的任一个一起共培养,结果根本没有获得番红菌素生产。这些结果表明把P14转化为P2,P2是一种能容易地经由假单胞菌属物种细胞壁转运入和转运出的分子,且其对番红菌素的生物合成是绝对必要的。
实施例6.新的“非天然”分子的生物学生产
向sacF突变体(pM-S1-008)发酵中添加2g/L的特异性修饰的P2衍生物前体P3,即3-羟基-5-甲基-O-甲基酪氨酸产生了在它的结构中整合了修饰的前体P3的2种“非天然”番红菌素,番红菌素A(OEt)和番红菌素B(OEt)。
番红菌素B-Etoxi(番红菌素B(OEt))
Figure A20038010985800421
C30H40N4O7
精确质量:568,29
分子量:568,66
C,63,36;H,7,09;N,9,85;O,19,69
菌株
来自荧光假单胞菌A2-2的safF-突变体(PM-S1-008)
发酵条件:
用0.1%的微生物的冷冻营养原种接种包含1%葡萄糖;0.25%牛肉膏;0.5%细菌用蛋白胨;0.25%NaCl;0.8%CaCO3的种子培养基中,并于27℃于旋转振荡器中(250rpm)温育。温育30小时之后,将2%(v/v)的突变体PM-S1-008的种子培养物转移到2000ml包含250ml M-16B生产培养基的锥形瓶中,该生产培养基由15.2%甘露糖醇;3.5%干啤酒酵母;1.4%(NH4)2,0.001%FeCl3;2.6%CO3Ca以及0.2%P3(3-羟基-5-甲基-O-甲基酪氨酸)组成。温育温度从接种直到40小时为27℃,然后24℃到最后步骤(71小时)。不控制pH。旋转振荡器的搅拌为220rpm,偏心率5厘米。
分离
4×2000/250ml锥形瓶合并到一起(970ml),离心(12,000rpm,4℃,10′,J2-21 Centfuge BECKMAN)以除去细胞。通过NaOH 10%把澄清的培养液(765ml)调节为pH 9.0。然后,碱-澄清的培养液用1∶1(v/v)EtOAc(x2)提取。有机相在高真空下蒸发,获得了脂状深色的提取物(302mg)。
该提取物通过己烷研磨进行洗涤以除去杂质,而且固体利用硅石正常相和乙酸乙酯∶甲醇(从12∶1到1∶1)的混合物通过色谱柱进行纯化。级分在UV下于TLC(硅石60,流动相EtOAc∶MeOH为5∶4.Rf 0.3(番红菌素B-OEt和0.15番红菌素A-OEt)中进行分析。由此,获得了番
红菌素B OEt(25mg)和番红菌素A OEt(20mg)。
番红菌素B(OEt)的生物学活性
抗肿瘤活性
Figure A20038010985800431
    次级评估         (Mol/L)
  次级筛选     大分子合成   细胞凋亡 DNA结合     细胞骨架
  蛋白   DNA RNA   核小体 GEL 肌动蛋白 微管蛋白   端粒酶
    10-OCT-02   IC50   >1.76E-05   1.76E-06 1.76E-07   5.28E-08 1.76E-05
抗微生物活性:固体培养基上
枯草芽孢杆菌.10μg/皿(直径6mm):抑制带17.5mm
光谱数据:
ESMS:m/z 551[M-H2O+H]+1H NMR(CDCl3,300MHz):6.48(s,H-15),2.31(s,16-Me),2.22(s,12-NMe),1.88(s,6-Me),1.43(t,J=6.9Hz,Me-Etoxy),1.35(t,J=6.9Hz,Me-Etoxy),0.81(d,J=7.2Hz,H-26)番红菌素A-Etoxi(番红菌素A(OEt))
Figure A20038010985800432
C30H40N4O6
精确质量:552,29
分子量:552,66
C.65,20;H.7,30;N,10,14;O,17,37
菌株:
与番红菌素B(OEt)相同
发酵条件:
与番红菌素B(OEt)相同
分离:
把4×2000/250ml锥形瓶合并到一起(970ml),离心(12,000rpm,4℃,10′,J2-21 Centrifuge BECKMAN)以除去细胞。通过NaOH10%把澄清的培养液(765ml)调节为pH 9.0。然后,碱-澄清的培养液用1∶1(v/v)EtOAc(x2)提取。有机相在高真空下蒸发,获得了脂状深色的提取物(302mg)。
该提取物通过己烷研磨进行洗涤以除去杂质,而且固体利用硅石正常相和乙酸乙酯∶甲醇(从12∶1到1∶1)的混合物通过色谱柱进行纯化。级分在UV下于TLC(硅石60,流动相EtOAc∶MeOH为5∶4.Rf 0.3番红菌素B-OEt和0.15番红菌素A-OEt)上进行分析。由此,获得了番红菌素B OEt(25mg)和番红菌素A OEt(20mg)。
番红菌素A(OEt)的生物学活性
抗肿瘤活性
Figure A20038010985800441
                   次级评估  (Mol/L)
    次级筛选     大分子合成   细胞凋亡 DNA结合   细胞骨架
蛋白 DNA   RNA   核小体 GEL 肌动蛋白 微管蛋白   端粒酶
    10-OCT-02   IC50   6.33E-06   1.81E-06
抗微生物活性:固体培养基上
枯草芽孢杆菌.10μg/皿(直径6mm):抑制带10mm
光谱数据:
ESMS:m/z 553[M+H]+1H NMR(CDCl3,300MHz):6.48(s,H-15),2.33(s,16-Me),2.21(s,12-NMe),1.88(s,6-Me),1.42(t,J=6.9Hz,Me-Etoxy),1.34(t,J=6.9Hz,Me-Etoxy),0.8(d,J=6.9Hz,H-26)
实施例7.番红菌素B酶促转化成番红菌素A
为了测定番红菌素B转化成番红菌素A的酶活性,收集不同菌株的120小时的发酵培养物(参见实施例2.番红菌素生产的生物学测定(生物检测)中的条件),并进行离心(9,000rpm×20分钟)。测定的菌株为荧光假单胞菌A2-2(作为野生型菌株)与荧光假单胞菌CECT378+pBHPT3(PM-19-006)(作为异源表达宿主)。丢弃上清液,洗涤细胞(NaCl0.9%)两次,并重悬于60ml磷酸盐缓冲液100mM pH7.2中。将20ml细胞悬浮液分配到3个锥形瓶中:
A.细胞悬浮液+番红菌素B(400mg/L)
B.于100℃加热10分钟的细胞悬浮液+番红菌素B(400mg/L)(阴性对照)
C.细胞悬浮液无番红菌素B(阴性对照)
生物化学反应物于27℃以220rpm温育,并且每10分钟取样。接着通过HPLC把番红菌素B转化到番红菌素A中。结果清楚地证明,在pBHPT3中克隆的基因sacH编码负责把番红菌素B转化成番红菌素A的蛋白。
基于该结果,我们进行测定以探悉该相同的酶是否能识别不同的底物例如海鞘素743(ET-743),并且把该化合物转化成Et-745(同时失去C-21羟基)。重复上述的实验以获得含有下述物质的锥形瓶:
A.细胞悬浮液+ET-743(大约567mg/L)
B.于100℃加热10分钟的细胞悬浮液+ET-743(567mg/L)(阴性对照)
C.细胞悬浮液无ET-743(阴性对照)
生物化学反应物于27℃以220rpm温育,并于0、10分钟、1小时、2小时、3小时、4小时、20小时、40小时、44小时、48小时取样。接着通过HPLC把ET-743转化成ET-745。结果清楚地证明,在pBHPT3中克隆的基因sacH编码负责把Et-743转化成Et-745的蛋白。这证明该酶能识别海鞘素作为底物,而且它可用于大量结构的生物转化。
                        序列表
<110>Pharma Mar
<120>参与番红菌素生物合成的基因簇及其用于遗传工程的用途
<130>aaa
<160>15
<170>PatentIn version 3.1
<210>SEQ ID 1
<211>长度:26705
<212>类型DNA
<213>生物体:荧光假单胞菌(Pseudomonas fluorescens)A2-2
<220>特征:
<221>名称/关键词:sacB
<222>位置:(6080)..(9268)
<223>其他信息:非核糖体肽合成酶基因
<220>
<221>sacC
<222>(9275)..(13570)
<223>非核糖体肽合成酶基因
<220>
<221>sacD
<222>(13602)..(14651)
<223>假定的蛋白基因
<220>
<221>sacE
<222>(14719)..(14901)
<223>假定的蛋白基因
<220>
<221>sacF
<222>(14962)..(16026)
<223>甲基转移酶蛋白基因
<220>
<221>sacG
<222>(16115)..(17155)
<223>甲基转移酶蛋白基因
<220>
<221>sacH
<222>(17244)..(17783)
<223>假定的蛋白基因
<220>
<221>sacI
<222>(1854)..(2513)
<223>互补的甲基转移酶蛋白基因
<220>
<221>sacJ
<222>(335)..(1861)
<223>互补的单加氧酶蛋白基因
<220>
<221>orf1
<222>(18322)..(19365)
<223>氨基酸肽酶样蛋白
<220>
<221>orf2
<222>(21169)..(22885)
<223>互补的,hox-样调节蛋白
<220>
<221>orf3
<222>(23041)..(23730)
<223>互补的糖基转移酶样蛋白
<220>
<221>orf4
<222>(25037)..(26095)
<223>异分支酸酶样蛋白
<400>序列1
ctgcaggtgg tttgcgcgcg gaagacccgc cactgccggt gcgctcgttt gaattgcaca     60
tggcgtggcg tgggtcgcag gataatgatc cgggggagcg gtggttgcgg tcgcggattc    120
agatgttttt tggcgacccc gatagccttt aattaaactc cactaaaatc ggcgattgca    180
gagcctgagt acaacacggc tactggactg aagtgggcgc atcgtgccgc atagccatag    240
tgatctcggt gtgtctcgcc atgtcccggc ccaggtcgta ggtcatgctc ttgcgcattg    300
ccagcatctt cgtgctccct tgccagctgt ttcaggtcag gctctgacgc gcggatttag    360
aatcgtccag cagccactca cccaagcgct ccttggccaa ggtcgatttt ttaccgaccc    420
agatcaccac gccatccggc ctgacgatga ctccctcgcc agcggacaag ctgttattgt    480
gcgaatcctc gcagatagat gccgtttgca accccggaaa atcacgtcga agatcggcgg    540
ccagtgcttt ggcacgatga tgtaccagga caaaccgccc tgctcgcagc aactgggtca    600
agctctgtcg tggtaatcgc tcaccctcgg gaagcaggct caacaggggt aaacgtcggc    660
ccaccaagcg atgatcgcct cggcgccgca cactgtcata gcgcacgccc tctcccgcca    720
gtgcactgac caccttctgc gccacatacg gggcccgtgt cgcctgcaag ccgatccagt    780
gaatcagacg gcctataggg ccggaagccg tattgaatcg gaaaagcaga tccgtgttgc    840
gcaaggctgc cgccgcaata ggcctacgct cggcctcgta actctccaga agatccatcg    900
gcaatgtggc ctgtatcaca cccgccagct tccaggcgag gttcgccgcg tcaccgatcc    960
ccatctgcaa accttgcccc ccggcgggga cgtgggtgtg agcagcatct cccagcagaa   1020
ataccctccc ctggcgataa tgagtcgcca ggcgctgctg gctgcggtaa cgagcgctcc   1080
acagcacctg cgccaatccg aaatcggttc ccagaatatc tttcatccct ccggcaattt    1140
cctcgtgggt gaccggctgt ttgaccggag tatccatacg ttcgttgtct tcgatactga    1200
cgcgataact gccatcgggt aatggaaaca gggcaaccag acccctggag accgaccttg    1260
catggactgc aggtgaaggc ggatttctca agacaacgtc cgccaccacc aacgaatgct    1320
tgtagtcctg cccgacaaac gaaatattga ggagttggcg gacagaactg ttgaccccat    1380
cagcccccag cacccagtcg tagcggcttt gctgcacgct gccggtctcg ctgtgttcca    1440
gggttacctc aacgtgtaaa tcgccggcat ccagagcctt tagcgcatac ccacgcttca    1500
gattcacccc cttgcgattg acccaatcag tcaacaccga ctcggtctga gactgtggga    1560
tgatcaccat gtggggatac tcacaaggga gtttggaaaa tgagagcgtt cggcccgcct    1620
tgtcacccaa cggcgcgctt gcccagacga tcccccgacg tatcatctca tctgccacgc    1680
cccaggcatt gagcaactcc agggtcacgg gctccaagcc aaaggcccgg gaatggggag    1740
aggcagccgg tcttttatcg atgagatcaa ccgctatacc caactcggcc agagctgcag    1800
ccacagccaa cccgacgggc cccgccccca cgaccaggac ctgtttattt ttaacgacca    1860
tgatcaccca cctctccaca gcaggggcgg aacgtggcga caatgacgtg ctggtcggtg    1920
acgctcgttt ccatgctctg cagcccggcc gtttgcgcga gctggattac ctcatgctct    1980
gatcgataat ctgccagtga gcccagcagc cagttgatca atgtggtcaa tccccagccc    2040
gcaggcaggt tctccaccag gcagaaaagg ccctgaggct tgagcacgcg acggacctca    2100
ttcaggctga cagacttgtc agcccaatgg ccgaacgaca tcgagcacac caccagatcc    2160
atgctttgcg aggggaatgg caaggcttcg gcaactcctt tgacgaacga ggcgaaggga    2220
cgtcgtttgg cggcctcgtc gaccatgccc tgagccgggt cgacgccttc gaagcgcgcc    2280
tcaggccaca gagcgaacat gcgttcgatc aatgcgccgg taccacaacc gatgtccaga    2340
acacgctccg gtctcgaggt gcacatccat cggctcaaca ttcgcagaca gtcgtcatgg    2400
gcctggctca gtttggtacc gtacttctct tcatacgtcg gcgcgatacg gctgaacgtc    2460
cgcacaaaac ctggatttcc attgcctttc ccgccagaaa atacgttaga cattattgaa    2520
catccatata tcaacagtta tccgccaagg accatagtag agaaaatcca tcccatccaa    2580
ataaaaatta aataagtggg gctaaccgca atccagggaa actctgaaaa ggcccgctac    2640
ttgtcgacgc ggctgtctgg aggccgcata gttactgaac ttactattaa aagactgggc    2700
tttttcagag ccccaccgga tgttggctcc ttgtccatca tttcgggggc actgtaacat    2760
tctgttacct ggctatcgct tgacttttaa tctgaacggg caattatagg tctaaccgca    2820
acagccccac ggcgcttaag ttcgaaaaaa gtagctgcac cttgctcaac tgcatcttgt    2880
aataaggggc actttacaag ccgcataaga cataaatttt atgctgactc cccaaacaag    2940
cacgacaagt aaaaaacact tgtccaatac caaggagggt atacggtgca agcttcttta    3000
cgtcaaaaag ttctctgctt acagcagtct atcgatccca gccagccagg catgttactt    3060
gaagtcgctt ttcatgtgat cacccatctt tctacttcgc agttggtatc gcgtatcgag    3120
agagtggtcg agcgacatgc gtctttacgg cagcgctttg tcatgcgcaa tggcacttac    3180
tggattgaac aagccccacc gcaacaacga cgctactgcg tggtacgcac ctatgatgaa    3240
gcatcgaccg atgcactgct ggcgccgagc cgcgagcaca tcggggttga gtctgagcgt    3300
ttgttccgcg ccgaagtcgt tgagcgcagc gacggacaac gctacttggt cttccgaatt    3360
catcacatca tcgccgacct gtggtctgtc ggcctcctga ttcgagactt tgccgaagac    3420
tgtatggacc gctccagcat caccctggcg tcaagaccga ttgccccgtt gatcgaccct    3480
gagttctggc ggcaccaaat gtcacaggac actccgtttt ccttgcccat ggcctccctg    3540
gaacagcaca cggaccgccg catggtgctg tcttcgttcg ttattgatca ggagagcagc    3600
gctgacctgg cccgcctggc cacagcctgc gcggtaaccc cgtacaccgt aatgctcgcc    3660
gcacaagtat tggcgctgtc cagaatcggc cagagtggcc gtctgtcact tgcggtgacg    3720
ttccatggcc gcaacagggg caacaaggat gcggtaggtt acttcgccaa tacgcttgcc    3780
gtgcctttcg atgtcagcga atgcagcgtg ggcgagtttg tcaaacgcac cgccaagcgc    3840
ctggatgagg cctcaaaagc cagcgtcggt gccggttatc ccgaattggc agagttcatg    3900
acgccgctgg gatgggctgc gaccgccccg accaatgcgg tgatttacca gcaggatatg    3960
ccaggcatgc caagaggatt ggcggcggct ctgctgggat tgggcacggt gcagttgggc    4020
gagatggcgc tgaccgcgga acaggcaccg cccagcatcg gcccgtttgc cactgcgctg    4080
ctgctgacgc gccacgacgg caagctgcat ggccgggtcg aggtcgatcc tgcgcagcat    4140
cccggttggc tggcagaggc gttagccaga cagttcgctg tgatcctgcg ggaaatggtg    4200
cgtgatccac aggccagact gtcagccttg ccagcgtgcc tgttacacca accaaaatac    4260
ccgagccaag cgcggccggc gcctgcgtca gaaacattgg tagccacctt tctccggcaa    4320
gtcgccatca cgccggacaa gcccgcgctg cgtacgccgc aggccagcat cagctatagc    4380
gaattggcca gtcgagtcgc caggctctcg gcagccttgc gcgtacgcgg cttcaaacct    4440
gaacagaccc tggcaatact cctgcctcgc gatatcaatc tggtacccgc tctgctggcg    4500
atcatggcct gcggtggcag ttatgtgcca ctcagtgacg cgaaccccgc cgaactcaac    4560
cgttcgattc tgaccagggc ccgttgccgc gcgattctca cggatcagga gggtttgacc    4620
cgtttcgctc acttggcgcc ctgctggtcc ttgagcgacc tgctgtcgat gcccgacgcc    4680
ccgctgcagg accagtccaa gcttcaagcc aaggcctata tcctatttac cagcggctcc    4740
accggtgaac caaaaggcgt ggcgatcacc catgctaatg ccgccaacct gctgcgttgg    4800
gcggctctcg attgtggccc cgagtacctg gcgcaaacac tggcggcaac ccccactacg    4860
ttcgatcttt cgattttcga gatgtttgct ccccttatgg tcggtggctg cgtacagccc    4920
gtttcctcgg tcatggcgct gatcgacaat ccggccctgc taaagggcac aacactgatc    4980
aatacggtgc cgtcggtggc cgacgctttg ttgcagcatg atgtactggt gccttccttg    5040
cgcatgctca acctcgcggg agaacccctg aaccgggatc tttacctgcg gcttcaggca    5100
aaactgaccg ccacacgcat cgtcaacctc tacggcccga cggaaacaac aacctattcc    5160
accgccctgg tgatcgagcc cgcacaacaa gagatcacca tcggttttcc actgtatggc    5220
acctgggtgg atgtcgttga tcaaaacatg caaagcgtcg gtatcggtgt acctggcgag    5280
ttgatcattc atggacacgg cgtggcgcaa ggctatgtca gcgaccccgt gcgtagcgcc    5340
gcttctttcc tgccggcatc cgatggcttg cgttgctacc gcacgggaga ccgtgtccgc    5400
tggttgcccg atggccgcct ggactttatc ggtcgagagg atgatcaggt caaagttcgc    5460
ggtttccggg tcgagttggg gcctgttcag gcggcactgc atgccattga gacgattcat    5520
gaatccgcag tagtcgttgt gccgaaaggg cagcagcgca gcatcgtggc gttcatcgtc    5580
ctcaaagcgc cgagcgaaga tgaagcggtg cagcgcaata acatcaaaca acacttactc    5640
ggcgtactcc cctattacgc actaccggac aagtttattt ttgttaaagc actgccaaga    5700
aacacacatg gaaaaatcga cagaacgctg ctcttgcaac atgagcccca gactgagcaa    5760
gaaagcgcca tgcgagatgc gaccgacgtc gaacatcgca tcgccaactg ctggcaaacc    5820
atcatcggac accccgtcca actccacgaa aacttcctgg acattggcgg ccactcgctt    5880
tcgcttacgc atttaacggg cctactgaga aaagaattta atattcatat ttctctacac    5940
gacctctgga tcaggccaac catagaacaa caggccgact tcattcataa gttgcaaaat    6000
tcggtattga caaaacctgc cgccgcgcca atcccgcgac ttgaccgaaa gatctctcat    6060
cattaatcag gagtaccgca tgagcgtcga tacatgcagg actgcaactt tccctgcgtc    6120
atacggccag gaacagatct ggtttctgaa cgaactaaac ccgcactctc aactggctta    6180
taccctggcg atgaaagtat ctatcgccgg gaaattgaac acactgcggt tgcagcgtgc    6240
ggtcaaccaa gtggtggcct cccaggaaat tttgagaaca tcattcgcct ataaaaacca    6300
gaagttgagc caggtcattt caccctccgc gacactgccc attcgcagcg cgcactgcat    6360
tgacgatgta cctgggctgc aacgcctgat caacatggaa gcccagcgtg gctggtcgct    6420
gagcagcgcg ccactgtacc gcttgctgct gataaaaacc ggcgaccagc aacatgagct    6480
ggtcatctgc acccaccata tcgtctgcga tggcatctcg ctgcaactgc tgctgcaaaa    6540
aatagtcagc gcctatcaag gccaaagcga tgggcgggtg ctcacaagtc cggatgaaga    6600
gaccctgcaa ttcgtcgatt atgcggcctg gtcaaggcag cacgaatatg ccggtctcga    6660
gtactggcgc cagcaactgg ccgacgcccc gacaatcctg gatatttcga caaaaaccgg    6720
ccgaagtgag caacagacat ttctcggcgc gcgaattccc gtcgagttca gccaccacca    6780
atggcaagca ttgcgccaga tattcagacc ccagggtatc tcctgcgcgg cggtgttcct    6840
ggcggcctac tgcgtcgtcc tgcaccgcct ggccgagcag gacgacattc tgatcgggct    6900
gccaacttca aatcgcctgc gtccggagtt ggcacaggtg atcggctacc tgtccaatct    6960
gtgcgtgttt cgcagccagt atgctcacga ccagagcgtc acagactttc ttcaacaggt    7020
tcaattgacc ttacccaact tgatcgagca cggggagacg cctttccagc aagtactgga    7080
aagtgttgag catacccggc aagccggtgt gacgccgttg tgccaagtac tgtttggtta    7140
tgagcaggac gttcgacgca cgctggatat cggcgacctg caattgacgg tctcggatgt    7200
ggacacgggg gccgcacgcc tggatctatc gctgttcttg ttcgaggacc acgaactcaa    7260
cgtttgcggt tttctggaat atgccacgga ccgtatcgac gccgcatctg cgcaaaacat    7320
ggtgcgcatg ctcagcagcg tgctacgcga gttcgttgcg gcgccgcagg cgccgctcag    7380
cgaagtacag ctgggggcgg cggattccca agcccagaca cctgcgatcg caccagcatt    7440
cccaagcgtg ccggctcgtc tgttcgcctt ggcagacagt caccccaatg cgaccgcgct    7500
gcgtgacgag caaggtgaac tgacctatgc gcaagtttgc caacagattc tgcaggcagc    7560
ggccactctg cgagcccagg gggcgaaacc tggaaccctg atcgcggtca tcggcgagcg    7620
cggtaacccc tggttgatcg ccatgttggc gatctggcaa gtcggcggta tctatgtgcc    7680
attgtccaag gacctgcccg aacagcgcct gcaaggcatc ctggcggaac tcgaaggggc    7740
catactgatt accgacgaca ccacgccgga acgcttccgg caacgtgtga cgctgcccat    7800
gcacgcctta tgggccgatg gcgcaacgca tcacgagcgg cagacgacgg acgccagccg    7860
gctgtctggc tacatgatgt acacctcggg atcgaccggt aaaccgaaag gcgtgcatgt    7920
cagccaggcc aacctggtcg cgaccctgag cgcattcggc cagctgctgc aggtgaaacc    7980
cagcgatcgg atgctcgcac tgacgacctt ctccttcgac atttcgctgc tcgagctgct    8040
gcttcccctg gtccagggcg ccagcgtgca aatcgctgtc gcacaggctc aacgcgatgc    8100
ggaaaagctc gcgggctatc tcgcagaccc tcggatcacg cttgttcagg ccacaccggt    8160
gacctggaga ctattactgt cgacaggctg gcagccacgg gaaagcctga ccctgctgtg    8220
cggtggcgaa gcgctgccac aggatctggc ggacaggttg tgcttgccgg gcatgacctt    8280
gtggaacctc tacggcccca ccgaaacaac aatctggtcc acggcctgcc gcctgcaacc    8340
gggtgcgccg gtgcaactgg gccatcccat tgcaggtacg caaatagccc tggtggatcg    8400
gaacctgcgc agcgtgccca gaggggttat cggtgaactg ctgatttgcg gccccggcgt    8460
cagccagggc tactatcgca acccggttga aacagccaag cggttcgtac cggacccgca    8520
tggttcaggt aagcgcgcct atctgaccgg cgaccggatg cgcatgcagc aggatggttc    8580
gctggcctat atcggccgac gtgacgacca gatcaagctg cgcggccacc gtatcgagct    8640
gggagagatc gagacagcgt tgcgaaaact gcccggcgta cgggatgctg ccgcccaact    8700
ccatgaccag gacccaagtc gaggcataca ggcctttgtc cagctttgcg caacggtcga    8760
tgagagcctc atcgatatag gccagtggct ggaaacactg cgccaaacgc tgcctgaggc    8820
gtggctgcct actgagtatt acaggatcga tggcatccct cttacctaca acggcaaacg    8880
cgacaggaag cgcctcctgc accaggccgt caggctgcaa acactcagtc tgagggtggc    8940
tcccagcagt gacaccgaga cccgggtgca gcagatctgg tgcgagctgc tcggtctcga    9000
ggatatcggc gttacggatg attttttcca gttaggcggc cactccattc tggtggcgcg    9060
catggtcgag cgcatcgaaa ccgcgtttgg acggcgcgta cctatcgcag atatctattt    9120
ttctccgacg atcgcccgtg tggcggcgac gctggactcc atgacatttg aacaaggact    9180
ggccgcacac agcgtgaaag gcgattggga gttcaccgcc atcagccttc aacacaacgc    9240
cgacagcaca gccgccgctc aggagagatg aatcatgcac agccccacta tcgatacttt    9300
cgaggccgca ctgcgctcat tgcccgctgc ccgcgacgca cttggtgcct atcccttgtc    9360
cagcgaacaa aagcgcctct ggttactggc ccaactggcg ggcacggcaa cgttgccggt    9420
aacggtgcgt tatgcattca ccggcacggt ggaccttgct gtcgtgcagc agaacctgag    9480
cgcgtggatc gcacacagcg agtccttacg cagccttttc gtcgaagtac tggaacgccc    9540
cgtcaggctt ctgatgccta cgggcctggt gaaactggag tacttcgatc gcccgccatc    9600
cgatgccgat atggccgagc tcataggcgc cgcctttgaa ctcgacaaag ggccgttgct    9660
gcgtgcgttc atcactcgaa ccgctgcaca acagcatgaa ttgcatctgg tcggccatcc     9720
tattgtcgtg gacgaacctt ccctgcagcg cattgcccaa accctcttcc agaccgaacc     9780
cgatcatcag taccccgccg tcggtgcgat cgccgaggta ttccagcgcg aacagacact     9840
ggcacaggat gcgcaaatca ccgaacaatg gcagcaatgg ggaataggcc ttcaggcgcc     9900
tgcggcaacc gaaattccga ccgaaaaccc ccgccccgct atcaagggct cagatcgtca     9960
agtacatgaa gcccttactg catggggcga ccaacccgta gcagaggccg aaattgtcag    10020
cagttggctg accgtgctga tgcgctggca gggatcgcaa tcggcgcttt gcgcaatcaa    10080
ggtgcgcgac aaggcgcatg ccaacttgat cggcccactg caaacctacc tgccggtccg    10140
cgttgatatg ccggatggca gcaccctggc acaactgcga ctccaggtgg aggaacagct    10200
caatggcaac gaccatccgt ccttttccac gctgctggaa gtttgcccac caaagcggga    10260
cctgagtcgc accccctact tccaaaccgg cctgcagttc attgcgcacg atgttgaaca    10320
gcgcgacttc catgccggca acttgacacg cctgccaacg aagcagccaa gcagcgacct    10380
tgacctgttc atttcctgct gggtaagcga cggcacgctt ggcctgacgc tggattatga    10440
ttgcgccgtg ctgaattcga gccaggtcga ggttctggcc caggcgctca tcagcgtatt    10500
gtcagcgccc ggtgaacagc caatcgcaac cgttgcgctg atgggccagc aaatgcagca    10560
aaccgtcctg gctcaggccc acggcccccg cacgacgccg ccgcaactga cactgaccga    10620
atgggtcgcc gccagcacgg aaaaatcccc gctggcggtt gcggtgatcg accacggcca    10680
gcagctcagc tatgcagagt tatgggcaag agctgcactg gtagcggcga acatcagcca    10740
gcatgtggca aagcctcgga gcatcatcgc tgtagcactg cccagatcgg ctgaatttat    10800
tgcagcgctg ctgggggtag tgcgagcagg tcatgcgttc ttgcccatcg atccccgcct    10860
gcccaccgac cgcatccagt tcctgattga aaacagtggc tgtgagttgg tcattacctc    10920
tgatcagcaa tccgtggagg gttggccgca ggtcgccagg atacgaatgg aggcgcttga    10980
tccagacatt cgctgggtgg cgccgacggg gctcagccac agcgatgccg cctacctgat    11040
ctatacctcc ggcagcaccg gcgttccgaa gggagtcgtt gtcgagcacc ggcaagtagt    11100
gaataacatc ttgtggcggc aacgaacctg gccgctgacg gcacaggaca acgtgctgca    11160
taaccattcg ttcagcttcg atcccagcgt ctgggcgttg ttctggccgc tgctgaccgg    11220
tggcaccata gtgctggcgg atgtcagaac catggaggac agcaccgccc tcctcgacct    11280
gatgatccgc catgatgtca gcgttctggg tggcgtaccg agccttctcg gtacgctgat    11340
cgatcatcca ttcgccaatg attgccgggc ggtcaagctg gtgctcagtg gcggcgaagt    11400
cctcaacccc gaactggcac acaaaattca aaaggtctgg caggccgacg tcgccaacct    11460
ctatggccct accgaagcga ccatcgatgc gctgtatttt tcgatcgaca aaaatgctgc    11520
cggcgccatc ccgattggct atccaatcga caataccgac gcttatatcg tcgacctcaa    11580
tctcaaccca gtcccgccag gcgttccggg agaaatcatg cttgctggcc agaaccttgc    11640
gcgcggctat ttgggcaaac ctgcgcaaac cgcgcagcgc ttcctgccca acccatttgg    11700
caacggacgc gtgtatgcaa cgggcgatct gggacgacgc tggtcatcgg gggccatcag    11760
ctacctgggc cgacgcgacc aacaggtgaa gattcgcggg catcgcattg agcttaacga    11820
agtcgctcat ctgttgtgcc aggcgcttga gctgaaggaa gccatcgtct tcgcccagca    11880
cgctggaacc gaacaggcac gcctggtggc ggccatcgag caacagccag gcctgcacag    11940
tgaaggtatc aaacaggaat tgctgcgcca cttgccagcc tatctgatcc ctagccagct    12000
cctgctattg gatgaactgc caagaaccgc caccggcaag gtcgacatgc tcaagcttga    12060
tcagttggca gcccctcagc tcaatgacgc cgggggcacg gaatgccgtg cgccacgtac    12120
cgaccttgaa caatcggtca tgacggattt cgcccaagta ctcggcctca ctgcggtaac    12180
gccggacacg gatttcttcg agcaaggcgg caactcgatt ctactcacgc gcctggcagg    12240
caccttgtct gccaaatacc aggtgcagat tccactgcat gagtttttcc tgactccgac    12300
cccggcagcg gtggcgcagg caattgaaat ctaccgtcgc gaaggcctcacggcactcct     12360
gtcacgccag catgcacaaa cgctggagca ggacatctac ctggaagaac acattcggcc    12420
ggatggctta ccacatgcca actggtacca gccttctgtc gtgtttctga ccggagccac    12480
cggctacctg ggactgtacc tgatcgaaca gttgctcaag cgcaccacca gccgcgtcat    12540
ctgcctgtgc cgtgcaaagg atgccgagca tgccaaggcc aggattctgg aaggcctgaa    12600
aacctaccgc atcgacgtag gcagcgaact gyaccgggtg gagtacctca cgggcgacct    12660
ggcgttgccg cacctgggcc tgagcgagca tcaatggcaa acgctggccg aagaggtcga    12720
tgtgatttat cacaacggcg ccttggtcaa ctttgtctac ccctacagcg cactcaaggc    12780
gaccaacgtg ggaggcacgc aggccattct ggaattggcc tgcaccgctc gactcaagag    12840
tgttcagtat gtctccaccg tggatacgct cctggcgacg catgtccccc gcccttttat    12900
cgaggacgat gcccccctgc gttccgccgt cggcgtacca gtgggctaca caggcagcaa    12960
gtgggtggca gaaggggtgg ccaatcttgg cctgcgtcgc ggcattccgg tcagcatctt    13020
ccgcccgggc ttgatcctgg gccataccga aacgggtgcc tcgcagagca tcgactacct    13080
gctggtggcg ctacggggtt tcttgcccat gggcatcgtg ccggattacc cacgcatctt    13140
cgacatcgtg cccgtggact aygtcgccgc ggcgatcgtg cacatatcga tgcaaccgca    13200
gggcagggac aaattcttcc acctgttcaa cccggcgccg gtcaccatcc gccagttctg    13260
cgactggatt cgcgaattcg gttacgagtt caagttggtc gacttcgaac acggtcggca    13320
gcaggcattg agcgtaccgc ccgggcacct gctgtacccg ttggtccccc tgatcaggga    13380
tgccgatccg ctgccccacc gcgcgctgga ccctgactac atccatgaag tgaaccccgc    13440
actggaatgc aagcaaacct tagagctgct ggcctcctcg gacatcaccc tgtcgaaaac    13500
cacaaaggct tacgcgcaca caattttgcg ctacctgata gacaccggct tcatggccaa    13560
gcctggcgtg tagcggattg agcacaaaca ggacgaatat catggaatcg atagcctttc    13620
ccattgcaca taagcccttc atcctgggct gtccggaaaa cctgccggcc accgagcggg    13680
cgcttgcccc ttctgcggcg atggcgcggc aggttttgga gtacctcgaa gcgtgccccc    13740
aggcgaaaaa cctcgagcag tacctcggga cgctgcgtga agtcctggcg cacctgcctt    13800
gtgcttccac cggactgatg accgatgatc cacgggaaaa ccaggaaaac cgcgacaacg    13860
atttcgcctt cggtattgaa cgacaccagg gcgacactgt gaccctgatg gtcaaggcca    13920
cccttgatgc agcgattcaa acgggcgagt tggtccaacg cagcggcact agcctggatc    13980
actcggagtg gagcgacatg atgtcagtcg cacaggtgat tctgcagacg attgccgacc    14040
ctcgggttat gcccgaatcc cgtttgacgt tccaggcacc gaaaagcaag gtcgaagaag    14100
atgaccagga cccgctgcga cgctgggtgc gtggccacct gctgttcatg gtcctgtgcc    14160
aaggcatgag cctgtgtacc aacctcctga tcagcgcggc ccacgacaag gacctcgaac    14220
tggcgtgtgc acaggccaat cgcctgattc aactgatgaa catctcgcgc atcacgcttg    14280
agtttgcaac cgacctgaac tcacaacagt acgtcagcca gattcgcccg acgctcatgc    14340
cgscgatcgc gccgcccaag atgagtggca tcaactggcg tgaccatgtg gtgatgattc    14400
gttggatgcg ccagtccacc gatgcctgga acttcattga gcaggcctac cctcaactgg    14460
ctgaacgtat gcgaaccaca ttggcgcagg tctacagcgc tcatcggggg gtctgcgaaa    14520
agttcgtagg cgaagaaaac accagtttgt tggccaagga aaacgccact aatacggccg    14580
gccaggtgtt ggaaaacctg aagaaatcga gattgaaata cctcaagaca aaaggttgcg    14640
ccggtgcggg ataagccctg actgcgcctc gcccccatca aaaccggact gatattcggg    14700
aaaacaaagg agagaagcat gccgacattt ctgggagacg acgacgcagt gccatgcgtg    14760
gtcgtcgtta acgccgacaa acactattcg atttggccaa gcgcgagaga cattccatca    14820
ggttggtccg aagaaggatt caaggggtca cgttcagact gcttggaaca tatcgcgcaa    14880
atctggccag agccgacggc atagatacaa cgtgatgcaa aaaatgcggg aaacatcaac    14940
taaccaaagc aaggaagaaa aatgacttca actcatcgca ccactgatca agtcaagcct    15000
gctgttctgg atatgccagg cctgtcgggc attcttttcg gccacgccgc attccaatac    15060
ctgcgggcca gctgcgaatt ggatctgttc gagcatgtcc gcgacctgcg cgaagccacc    15120
aaggagagca tcagcagccg actgaagttg caggaacgcg ccgccgatat tctgctgctg    15180
ggcgcgacct ccctgggcat gctggtcaag gaaaacggca tctaccgcaa tgccgatgtg    15240
gttgaggatt tgatggccac ggacgactgg caacgtttca aggataccgt ggcctttgaa    15300
aactatatcg tctatgaagg gcagctggac tttaccgagt ccctgcagaa aaacactaac    15360
gtcggccttc agcgtttccc gggcgaaggg cgggacctct atcaccgcct gcaccagaat    15420
cctaagctgg aaaacgtgtt ctaccgctac atgcgctcgt ggtctgaact ggccaaccag    15480
gacctggtca agcacctcga cctgtcgcgc gtgaaaaaat tgctcgacgc gggtggcggt    15540
gatgcggtca acgccatcgc cctggccaaa cacaatgagc aactgaacgt aacggtactg    15600
gatatcgaca actccattcc ggtcactcag ggcaaaatca atgattccgg gctcagccac    15660
cgggtgaaag cccaggcatt ggatatcctg caccaatcct tccctgaagg ttacgactgc    15720
attctcttcg cccaccaatt ggtgatatgg accctcgaag aaaacaccca catgctgcgc    15780
aaggcctacg atgcgctacc agaaggcgga cgcgtggtca tcttcaactc catgtccaac    15840
gatgaaggcg acggcccggt catggccgca ctggacagcg tctactttgc ctgtctaccc    15900
gccgagggcg gcatgatcta ttcctggaaa cagtatgagg tctgcctggc ggaagccggc    15960
ttcaaaaacc ccgtacgcac cgcgattcca ggctggaccc cacacggcat catcgtggcc    16020
tacaagtaat tttgcctcct ccgcccctac tggggccgga ggagtcattt caacatttgc    16080
gtcattgacg ccacctggcg atagggacac ccacatggca cgttcacccg agacaaatag    16140
tgcgatgccg caacagataa gacagctttt atacagccaa ctgatttcgc aatcgattca    16200
aaccttctgt gaactgcgcc tgcctgatgt tctgcaagca gctggccagc ctacctccat    16260
cgaacggctt gctgagcaga cacacactca tatcagcgcc ctgtcacgct tgttgaaagc    16320
gttgaaacca ttcgggctag tgaaagaaac cgacgaaggt ttttccttga ccgatctcgg    16380
cgccagtctg acccacgacg cctttgcttc cgctcaaccc agtgctttgt tgatcaatgg    16440
tgaaatgggc caagcctggc gtggcatggc gcagacaatc cgaaccggtg aatccagctt    16500
caagatgtac tatggcatca gcctgttcga gtattttgaa cagcacccgg aacgccgggc    16560
catttttgac cgttcccaag acatgggact ggacctggag atcccggaaa tcctggagaa    16620
catcaacctg aatgacggtg agaacattgt cgatgtaggg ggtggttcag ggcatttgct    16680
gatgcacatg ctggacaagt ggccagaaag cacaggcata cttttcgact tacccgtcgc    16740
ggcaaaaatc gcgcagcaac atctgcacaa atctggaaaa gcaggctgct ttgaaatcgt    16800
cgcaggggat tttttcaaga gcctgccgga cagtggcagc gtttacttgc tgtcccatgt    16860
cttgcacgac tggggcgacg aagactgcaa ggccattttg gccacctgcc ggcggagcat    16920
gccggacaat gcgctgttgg ttgtagtgga cttggtgatt gaccagagtg aaagtgccca    16980
gcccaacccc acgggcgcaa tgatggatct ttacatgctg tccttgttcg gtatcgccgg    17040
aggcaaagag cgcaacgagg atgaattcag aaccctcatt gaaaacagcg gcttcaacgt    17100
caaacaggtg aagcgcctgc caagtggaaa cggcatcatc ttcgcctacc caaaataaat    17160
gatcctcatt gcccctcgcc actttccagg ggggctattt tattctcggg tgattccccc    17220
cctaatgatt acaaggaaga cacatgtcga cgctggttta ctacgtagca gcaaccctgg    17280
atggttatat cgccactcaa caacacaaac tggattggct ggagaacttt gccctggggg    17340
atgacgcaac ggcctatgay gatttttatc agacgatcgg agcagtggtc atgggatcgc    17400
agacctatga atggatcatg tcgaacgctc ccgatgactg gccctaccag gacgtacccg    17460
cctttgtcat gagcaaccgg gatctgtcag cccccgccaa tttggatatc accttcttac    17520
gcggcgatgc cagtgccatc gcggtcaggg ccaggcaagc ggcgaagggc aagaatgtct    17580
ggctggtcgg tggcggcaaa acggcggcct gttttgccaa cgcaggggaa ttacagcagc    17640
tgttcatcac cactattcca acctttatcg gcaccggcgt tccggtactg cccgtagacc    17700
gcgcgcttga agtggttctc agagaacaac gcacgctgca gagcggtgcc atggaatgca    17760
tcctggacgt gaaaaaagcg gattaacgtc tacaagacaa tcgtgtatcg aaactcgcaa    17820
cgtccaaacc caagggaaaa accagtgaag cgattggtat tgagtttatg tttgttggct    17880
gttatcgctc tcgccagtgt tcaaggaata aggatggtga aacccgccgc cctgacagcc    17940
gccgatgctc gcgatatcgg ctatctgaat gtacgcgata gcctttccgt cattgccgcc    18000
gccccccacc ccaccgcctc acctcgccag gccgttgtca ggcattattt gcgggaaacg    18060
attgcgggca tgggttacca ggtggttgag caaccctttc tatttaccat cgagagcatg    18120
gtgaaccggc agaaaaccct ctatgccgag ttgaacgagc agcagcgcca agcgttcgat    18180
gctgagctgg cccgggtggg cgcggacagt tttgaaaaag aagtgcggat tcgctccggc    18240
ctactggaag gcgacagcgg ccagggaacc aacttgatag cctcacaccg cgtaccggga    18300
gcgaccgcga cggtcctgtt catggcgcat tacgacagcg tcggcaccgc tcccggtgcc    18360
agtgacgatg gcatggccgt cgcctcgata ctccaactga tgcgggaaac cataacccgc    18420
agcgatgcca aaaataacgt tgtctttcta ctcrccgatg gcgaagaact gggcttgctc    18480
ggagcggagc actacgtctc gcagctcagt acgcctgaac gtgaagccat ccgcctggtg    18540
ttgaactttg aagcccgggg taaccagggc atccctttac tgttsgagac atcccagaag    18600
gactacgccc tgatcaggac tgttaacgca ggggttcggg acatcatatc cttctcattc    18660
acgcccttga tttacaatat gctacaaaac gacaccgact ttacggtgtt caggaaaaag    18720
aacatsgcgg ggttgaattt tgcagtcgtg gagggttttc agcactacca ccacatgags    18780
gacaccgtgg agaaccttgs gccagagacc ttgtttcgct accaaaagac agtgcgtgaa    18840
gtgggcaacc actttatcca gggtatcgac ctctcctccc tgagtgctga tgaggacgca    18900
acctatttcc cactgccagg cggcacgctg ttggtactca acttacccac cctgtatgcg    18960
ctgggcatgg gctcgttcgt gctctgcggt ctttgggcgc aacgctgccg cactcgccga    19020
cagcatcagg gcaagaattg cgtactgcgc cccatggcta ttgccctgct cggcattgcc    19080
tgcgcagcac ttgtattcta cgtcccgagc attgcctatc tattcgtcat ccccagtctg    19140
cttctggctt gcgccatgtt gtcgcgaagc ctctttatct cctattcgat catgctgctg    19200
ggcgcttatg cctgcgggat actctacgcg cctatcgtct acctgatttc atcaggcctt    19260
aaaatgccgt tcattgccgg ggtcattgca ctactcccgc tctgcctgct ggccgtggga    19320
ctggccggcg tcatcgcacg atcgagagac tgtcgaacct gcgactagca agacccgata    19380
aaacgtcgct tcaaacgcca gatgacgtgc ctcgtcagcc aggcgtggaa ccatctggtg    19440
gcggcaaatg tgcataaggt gggaacgcag agcgcccgct gcaacacgcc caccccaagc    19500
accgcgcctc aacggataat caggctcaag ggaattccac cttgcaacct gaaagagcaa    19560
tcgagcgccc gtcggacaca acaaactgat caccgtcaat tcgggcaagg agcaatccac    19620
gggcttttgc tccaacctca actccctttg aaaaatcagc cggccacaat ttgcccctac    19680
cctttcagga tatcctcgat aagcgtttta tcagaacagc gaaaaaccac ttcaagttcg    19740
tgtacttttt actgcgatct gcgatcgctc ccatggtaca araatgacag atgggaagat    19800
cgctttaata cctactctct cacctgagaa aaagtaacca ccgggccgta ttcctgatca    19860
gacactatcg cctgcacaca aaatttcttc tctggaaact tactcagcaa caccatcctc    19920
catgactgag caataaggtt gcacagttgt tcataaacag cttcatcgac tctatcgctg    19980
cagcctgcaa aaacatcata caggtgcaca tgattcaaaa ccttctcaac cgccaccaca    20040
tcacgattac aagactgcat ccaactggag aatgcttcaa cagtaaatcc gctttccaga    20100
aacacgcccg actcgtaaac aacaaagtct ggaaacaaca cggtggaaaa caccaggaca    20160
tcttcaggat gtacaacatc actaataaaa caagactcaa ccaactcgga ttgatccttc    20220
cattgggact tccagcgctc gtatttggga gacctgacag ggtctgtcgt cctgattatt    20280
ttcatagcac tgttcctgca ctgatgcctt ttggcgattt tttgtttgag cgagaatcga    20340
tcgatggctc attgttcatc aagaaaaaaa ttctctcgaa acagactctt aagctcggcc    20400
cggcgcgttg agaacagtga aaagtcactc gccacatcct gaatattctc tgtgaccctc    20460
acaagatacc cagtattcag cttttcaatg ggaaagcctg acgcagcaat ccgctcaaca    20520
tcgacctctt cagcaaactc atcgccgtag aacatagccc aaccgatatt gggcacgtcc    20580
ggtttcaaag ccgaattgaa tgagccgatc tgaaaacttt tatatttctc atgcgggcta    20640
agttcgggtt cactgaacag gtgcagcatt ccgagttgag gaggaaaaat ttcacaccat    20700
gccttgaaga gcgaatacca atcgacgctc ttgctactga ccgagcggta tgtgattgcg    20760
ccaggaacca cctgcccccg gacattgcgc gccgtgtgga tgacgctccc acagccttta    20820
accgcctttt ttctgcgcca ggcaaagtcc aggtagaagt ccgataatgc gccgttaaac    20880
cgtatggccg cctttgatgc ccagcacgct tcactcgcgg ccacgcccat gaaaggctct    20940
ccgaatttat ccgcattgtg cgacacctgc tctggaacca gtaactcccc ttcccgactt    21000
aatgacgaaa tgaacgcctc tccaacaccc caaccgatag tttcagactt cgtcctgatt    21060
gtaatttgca catagggctt cataaatcgt caaagtctcg tcaattcacg ggtgacacaa    21120
gtatatccaa agagctctcc cacgttactc atcgcatcga gtctatcaac caaccaacgc    21180
cgcctcacgc gccaccgccc acggcgccat caaccgctgc ggggtctggc aggttttgcg    21240
cttgagcacg aaattgcggc atttctcggc gaattggtgg cggttgtgca ccatgtccaa    21300
ctgcatctgc gccagctcgg cttcacggca gcgtgtaatc tggtcgatgt ccaacgccgc    21360
tttacgggcg cgagccacgg cgtacttttc atcggttaac gcgctgcttg cctgctgcat    21420
cagccaacgg ctgaaggcgt gcgggcagcg cgggccgatg ccctgaacca gcccgtattg    21480
ctcggcttgc aaggcactga tcggcaggca ggcgtcggtg agttgatggg cgacttcact    21540
gccaacggcg cgtggcaggc tgtaggtcca gtattcggag ccgtacaggc ccatggtttt    21600
gtaatgcggg ttgagtacca cgctctcgcg ggccaatacg atgtctgcgg ccagcgccag    21660
cattacacca ccggcgccgg cgctgccggt caggccgctg atcaccagtt gccgggccgt    21720
gagcagttcg tggcacacat cgtacgatgg cctgaatgtt ggcccaggct tccagccccg    21780
gcactggggc ggcctggatg acgttgaggt gcacaccatt ggaaaagctg ccgcgcccgc    21840
ccttgatcac cagcacttgg gtgtcccgcg tcttggccca gcgcaacgcc gccaccagtc    21900
gctggcactg ctcggtgctc atggcgccgt tgtagaactc aaaggtgagt tcaccgacat    21960
ggccggcttc gcgatagcga atcggttgat aggcttgctc atcgaacatt tgattggcga    22020
tcgagctgtc cagcacggga atatccgcca gtgcttccgc cagcacgtgg cgggccggca    22080
gcttgaaggt ctcctccccc ggccgggctt tgcgtttgag cgagccgatc cacaggctct    22140
gatcaccggc cgccaccagc accgcgtcgt cctgcaccgc gaggatctca cccggtgtgc    22200
cgtggcgcgc atccaggtgc gcgtcgtaca ggtaatactg cccgccctgg atactggcca    22260
gcacaccggg ctggccatcg gctgcgtcga tgcagcgttt gatgaagcgt gcgcaatcgt    22320
accaactgaa ggtgcgatca gcctgtgtca tgttcggctg caaacgcccg attacgtggg    22380
cttgggtgta atcgagcggc accgggacga aaacccgggc gaacttttcc accacgtcgc    22440
ggatgcaata gagggcggcg tcactcaccg cgccgttgta cagctcggat ttgcgcacat    22500
cggcaggcat gtcgaattca caggtcgacc agatcggccc ggcgtccatt tcctccaccg    22560
cctgcaaagc cgtgacgccc cagcggccga cctgctggct gatggcccag tccagcgcgc    22620
tggcaccacg gtcgccgacg atgcccggat ggataatcac cacagggcgc tcaaggttgc    22680
tccaaagttg ctgtggcaca cggtctttca gaaaggggca gatcaccagg tcggcgtctg    22740
aatcctcgat ctgctggcac accaaggctg gatcggtgaa cagaacaacg ctgggcgcgt    22800
gccccgactg gcgtaaatcc agccaggccc gctgggtcaa accgttgaac gccgacgcta    22860
acacgatgat cttcaatgac cgcatggctg actcatcctt gagaatgcgc ggccagaggt    22920
gctccttgag ccctccctgg cctttgatgg aagtacaagg atagttggcg tgccaggcag    22980
gctacctgat caggatcaat cttgtgtcag cgagtgcttg aacgtaggcg cctgcgttca    23040
accaataggc gcatggsctg gcgagtgctc ccgcgtgccc tctgccacaa gggacgccag    23100
gtattcgcca aacccgccgc gacacttgta gtcccgacgc gcactggtga ccacgggatt    23160
ggtcgccgtc cacacgatcc gcgcgccaat cctctcgagg tcggccacca actgcacatc    23220
ttcatgggca accaaatgct ggaacccacc cgcgtttcga taggcatccg cactcaagcc    23280
caggttggca ccgtgtatat ggcggtggtt ctcggtgaac tgatacaact caaggtagcg    23340
cgaacgaacc gattcaccgt actcgctcca gctgtccacc tcgacggttc cgcacaccgc  23400
atcggcgcca aagccgatct gacgcaccag ccagtcgrcg ggcacaactg tgtcagcgtc  23460
ggtgaatgcc agccactggg cgccgacttc aagcaatcgc tccgcgccca aggccctggc  23520
cttgcccaca tttcgaacgc tcacctcaag cgtkgcgaca cccatggccg acacgcgcgt  23580
ggcggtctcg tccgaacacg catccagcac caccagcaat tggacctgtt ggtgtgccag  23640
agccggatga gcaatggcgc gctggatgga ggcgaggcag gcactgatgt gccgttcttc  23700
gttatgggca ggtatcacta tccctatcat tgacgttccc tctaccaggc aaagtgtcta  23760
cagctatcga ccgggccgtg aggcagaagg tttaaacaat ctgaaggcgc cgccaaacaa  23820
tgacgtgaga caggtcgcag tgattaaacg gaacgtcaca ggcgccacag gctcagatgg  23880
tttacgtgtt tgatgcacgg atgaacccgc cattcctaca aacaggtcag ccatcatgtc  23940
taacgattat caaggtatcg ccagtgtcat cacggcttct cgtcacatgg gtacagactc  24000
ggatgaacgc cttaatgaga cggtaaatat tcaattgacc tgcagcggta aaccaacgat  24060
tgcgcggttg agtttcgaca ccccgcttca atggcccggc caccccaact ttgtgctgat  24120
caacctgccg gacggttcat cggtgggtgg tgtgattgcc gaaattgaaa agtcgaccga  24180
tggcccgggt tgggtgacgt ttacggtgga tgactgaggt cttcccaaca ggcttcaaat  24240
cacctccagg cggctgcctc gaatgagaca cacaggccag taatcgagac gcacagacaa  24300
gcctattttc gcagatacat tttgtaacgt cctatgattg acgcttgctc gaatcaccgc  24360
agggattggg tggcgtgtgt ttatcacgcc cttgaatccg cagcgaaaaa tgattcgagt  24420
tcagcgaaca attcgattgg gacaaacaaa aggatgcggg ctatgtcatt gcgtaattta  24480
tctttattgg tcaccacact ggcgctgttt aagtggggtg taatgcgctc gcggggcaaa  24540
acccaacatg ctcagtgatg atgacgtgaa atcccaaagc gccggcgcac tgggctatgc  24600
cccgacagac ctgagcatcg tcaaccgtcg aaccgaaggc accaacacct acgtgctgct  24660
taaaaccaac gacaacaagc agttcaactg cattatcaac ggaggcaata tcctgacctt  24720
cggtatgtcc aacccgcctt cgtgtgcgaa gaaaggtgaa cagatcaaga gtggcccgtt  24780
cgggagctga tctgtcgctg gaaaaaaggg ccaggccacc tctaagaacg gaggcctggc  24840
ccttttttat tcgctcagat gagtttaaaa gacaagatat cgggcagctg ggctccggcc  24900
cgttcagtct gggcacccca cacaaaatgc tcagcgacta cttggccgtc gccgcacacc  24960
gtttaacggg tgcgacctac agcgtcrccc tggttgaagg cagcaacgaa taaaccctat  25020
tgatcggaga gcgaccatgc acccgcataa aaccgcgatt gtcttgattg aataccagaa    25080
cgacttcacc acccccggcg gcgtgttcca tgacgctgtg aaagacgtca tgcaaacgtc    25140
caacatgctg gcgaataccg ccaccacgat tgagcaggcc cgcaagctgg gcgtgaagat    25200
catccactta cccatccgct ttgccgacgg ctacccagag ctgaccctgc gctcatacgg    25260
cattctcaaa ggcgtcgccg acggcagcgc gtttcgtgcc ggcagctggg gcgccgagat    25320
caccgacgcg ctgaaacgcg accccaccga tattgtgatc gaaggcaaac gcggcctgga    25380
tgctttcgcc accaccgggc tggacctggt gctgcgcaac aatggcatcc agaacctggt    25440
tgtcgcaggt ttcctgacta actgctgcgt tgaaggcacg gttcgatccg gttacgagaa    25500
aggttatgac gtggtgacct tgaccgactg caccgcgaca ttcagtgatg aacaacagcg    25560
cgcagccgag cagtttacgt tgccgatgtt tttcgcaaac cctgcaacac accgcgtttc    25620
tgcaagcact gaacgccgga taaaaaaagc ggcggactcc tgccgagtcg ccgctttttt    25680
agtgcttggg tcattcggtt ggcgcgtact gcatttcgcc gttcccaaac gaccagtctt    25740
cgcgcttcac gtccaccagg ctgatccaca cgtcttcctt gcgcagcccg gtcttggcat    25800
ggatgccgtc ggcgatgaac ttatagaaag cctttttcac gtcaatgctg cgcccggcgt    25860
tccacgtgac ttggataaac acgatcttgg gtgtgtaagt gacgccaaga tacccggccg    25920
ccgggtaaac cagctcatcc ttggcatggc ggttgatgat ctggaatttg tcgtgctcag    25980
gcacgttggc ccacactggt catcgcggcg tacacgacat caccgatggc cgtcgcggtt    26040
tcagtggaag tgtcggcggc gaggtcgatt cgaactaaag gcatggacaa atccttagtg    26100
attttcagct gaaaatgggc gtgtggctca cacactcgcg ccaaccgggc aacttgcgcc    26160
aggccaacga gttgctggcc cagggagttg ccgacggttt gcgctagtgc gccgcgaaac    26220
ttcggcattt gacgcatcgg tgaatggctg accggatgtc agtgcttatt gacctgaata    26280
tagactgccg tgcacagacc aatcaaacaa ataccggcga tgtagtaagc ggcgcccatc    26340
tgactgtatt gaagcaatag agtaacgacc atcggcgtca ggccaccgaa tacggcgtac    26400
gacaagttgt aggaaaatga caagccggaa aaccgcacta ccggtggaaa ggcacgcacc    26460
atcacagcag gggctgcgcc tatcgcgccg acaaaaaaac cggtaagtga atagagtgga    26520
accagccatt gcgggtgcgt ttcaagcgtc ttgaacaaga gcagtgcgct gaacagaagc    26580
atgacgctgc cgatcatcaa tacccarccc gcactgaaat gatcggccag tttcccggcg    26640
atcacgcaac caacactcaa rrcacrcaat agcgagactg ttggcctgca aggcttgcgc    26700
tgcag                                                                26705
<210>SEQ ID 2
<211>长度:1004
<212>类型:PRT
<213>生物体:荧光假单胞菌(Pseudomonas fluorescens)A2-2
<400>序列2
Met Leu Leu Glu Val Ala Phe His Val Ile Thr His Leu Ser Thr Ser
1               5                   10                  15
Gln Leu Val Ser Arg Ile Glu Arg Val Val Glu Arg His Ala Ser Leu
            20                  25                  30
Arg Gln Arg Phe Val Met Arg Asn Gly Thr Tyr Trp Ile Glu Gln Ala
        35                  40                  45
Pro Pro Gln Gln Arg Arg Tyr Cys Val Val Arg Thr Tyr Asp Glu Ala
    50                  55                  60
Ser Thr Asp Ala Leu Leu Ala Pro Ser Arg Glu His Ile Gly Val Glu
65                  70                  75                  80
Ser Glu Arg Leu Phe Arg Ala Glu Val Val Glu Arg Ser Asp Gly Gln
                85                  90                  95
Arg Tyr Leu Val Phe Arg Ile His His Ile Ile Ala Asp Leu Trp Ser
            100                 105                 110
Val Gly Leu Leu Ile Arg Asp Phe Ala Glu Asp Cys Met Asp Arg Ser
       115                 120                 125
Ser Ile Thr Leu Ala Ser Arg Pro Ile Ala Pro Leu Ile Asp Pro Glu
   130                 135                 140
Phe Trp Arg His Gln Met Ser Gln Asp Thr Pro Phe Ser Leu Pro Met
145                 150                 155                 160
Ala Ser Leu Glu Gln His Thr Asp Arg Arg Met Val Leu Ser Ser Phe
                165                 170                 175
Val Ile Asp Gln Glu Ser Ser Ala Asp Leu Ala Arg Leu Ala Thr Ala
            180                 185                 190
Cys Ala Val Thr Pro Tyr Thr Val Met Leu Ala Ala Gln Val Leu Ala
        195                 200                 205
Leu Ser Arg Ile Gly Gln Ser Gly Arg Leu Ser Leu Ala Val Thr Phe
    210                 215                 220
His Gly Arg Asn Arg Gly Asn Lys Asp Ala Val Gly Tyr Phe Ala Asn
225                 230                 235                 240
Thr Leu Ala Val  Pro Phe Asp Val Ser Glu Cys Ser Val Gly Glu Phe
                 245                 250                 255
Val  Lys Arg Thr Ala Lys Arg Leu Asp Glu Ala Ser Lys Ala Ser Val
             260                 265                 270
Gly Ala Gly Tyr Pro Glu Leu Ala Glu Phe Met Thr Pro Leu Gly Trp
        275                 280                 285
Ala Ala Thr Ala Pro Thr Asn Ala Val Ile Tyr Gln Gln Asp Met Pro
    290                 295                 300
Gly Met Pro Arg Gly Leu Ala Ala Ala Leu Leu Gly Leu Gly Thr Val
305                 310                 315                 320
Gln Leu Gly Glu Met Ala Leu Thr Ala Glu Gln Ala Pro Pro Ser Ile
                325                 330                 335
Gly Pro Phe Ala Thr Ala Leu Leu Leu Thr Arg His Asp Gly Lys Leu
            340                 345                 350
His Gly Arg Val Glu Val Asp Pro Ala Gln His Pro Gly Trp Leu Ala
        355                 360                 365
Glu Ala Leu Ala Arg Gln Phe Ala Val  Ile Leu Arg Glu Met Val Arg
    370                 375                  380
Asp Pro Gln Ala Arg Leu Ser Ala Leu Pro Ala Cys Leu Leu His Gln
385                 390                 395                 400
Pro Lys Tyr Pro Ser Gln Ala Arg Pro Ala Pro Ala Ser Glu Thr Leu
               405                  410                 415
Val Ala Thr Phe Leu Arg Gln Val Ala Ile Thr Pro Asp Lys Pro Ala
            420                 425                 430
Leu Arg Thr Pro Gln Ala Ser Ile Ser Tyr Ser Glu Leu Ala Ser Arg
        435                 440                 445
Val Ala Arg Leu Ser Ala Ala Leu Arg Val Arg Gly Phe Lys Pro Glu
    450                 45S                 460
Gln Thr Leu Ala Ile Leu Leu Pro Arg Asp Ile Asn Leu Val Pro Ala
465                 470                 475                 480
Leu Leu Ala Ile Met Ala Cys Gly Gly Ser Tyr Val Pro Leu Ser Asp
                485                 490                 495
Ala Asn Pro Ala Glu Leu Asn Arg Ser Ile Leu Thr Arg Ala Arg Cys
            500                 505                 510
Arg Ala Ile Leu Thr Asp Gln Glu Gly Leu Thr Arg Phe Ala His Leu
        515                 520                 525
Ala Pro Cys Trp Ser Leu Ser Asp Leu Leu Ser Met Pro Asp Ala Pro
    530                 535                 540
Leu Gln Asp Gln Ser Lys Leu Gln Ala Lys Ala Tyr Ile Leu Phe Thr
545                 550                 555                 560
Ser Gly Ser Thr Gly Glu Pro Lys Gly Val Ala Ile Thr His Ala Asn
                565                 570                 575
Ala Ala Asn Leu Leu Arg Trp Ala Ala Leu Asp Cys Gly Pro Glu Tyr
            580                 585                 590
Leu Ala Gln Thr Leu Ala Ala Thr Pro Thr Thr Phe Asp Leu Ser Ile
        595                 600                 605
Phe Glu Met Phe Ala Pro Leu Met Val Gly Gly Cys Val Gln Pro Val
    610                 615                 620
Ser Ser Val Met Ala Leu Ile Asp Asn Pro Ala Leu Leu Lys Gly Thr
625                 630                 635                 640
Thr Leu Ile Asn Thr Val Pro Ser Val Ala Asp Ala Leu Leu Gln His
                645                 650                 655
Asp Val Leu Val Pro Ser Leu Arg Met Leu Asn Leu Ala Gly Glu Pro
            660                 665                 670
Leu Asn Arg Asp Leu TVr Leu Arg Leu Gln Ala Lys Leu Thr Ala Thr
        675                 680                 685
Arg Ile Val Asn Leu Tyr Gly Pro Thr Glu Thr Thr Thr Tyr Ser Thr
    690                 695                 700
Ala Leu Val Ile Glu Pro Ala Gln Gln Glu Ile Thr Ile Gly Phe Pro
705                 710                 715                 720
Leu Tyr Gly Thr Trp Val Asp Val Val Asp Gln Asn Met Gln Ser Val
                725                 730                 735
Gly Ile Gly Val Pro Gly Glu Leu Ile Ile His Gly His Gly Val Ala
            740                 745                 750
Gln Gly Tyr Val Ser Asp Pro Val Arg Ser Ala Ala Ser Phe Leu Pro
        755                 760                 765
Ala Ser Asp Gly Leu Arg Cys Tyr Arg Thr Gly Asp Arg Val Arg Trp
    770                 775                 780
Leu Pro Asp Gly Arg Leu Asp Phe Ile Gly Arg Glu Asp Asp Gln Val
785                 790                 795                 800
Lys Val Arg Gly Phe Arg Val Glu Leu Gly Pro Val Gln Ala Ala Leu
                805                 810                 815
His Ala Ile Glu Thr Ile His Glu Ser Ala Val Val Val Val Pro Lys
            820                 825                 830
Gly Gln Gln Arg Ser Ile Val Ala Phe Ile Val Leu Lys Ala Pro Ser
        835                 840                 845
Glu Asp Glu Ala Val Gln Arg Asn Asn Ile Lys Gln His Leu Leu Gly
    850                 855                 860
Val Leu Pro Tyr Tyr Ala Leu Pro Asp Lys Phe Ile Phe Val Lys Ala
865                 870                 875                 880
Leu Pro Arg Asn Thr His Gly Lys Ile Asp Arg Thr Leu Leu Leu Gln
                885                 890                  895
His Glu Pro Gln Thr Glu Gln Glu Ser Ala Met Arg Asp Ala Thr Asp
            900                 905                 9l0
Val Glu His Arg Ile Ala Asn Cys Trp Gln Thr Ile Ile Gly His Pro
        915                 920                 925
Val Gln Leu His Glu Asn Phe Leu Asp Ile Gly Gly His Ser Leu Ser
    930                 935                 940
Leu Thr His Leu Thr Gly Leu Leu Arg Lys Glu Phe Asn Ile His Ile
945                 950                 955                 960
Ser Leu His Asp Leu Trp lle Arg Pro Thr Ile Glu Gln Gln Ala Asp
                965                 970                  975
Phe Ile His Lys Leu Gln Asn Ser Val Leu Thr Lys Pro Ala Ala Ala
            980                 985                 990
Pro Ile Pro Arg Leu Asp Arg Lys Ile Ser His His
        995                 1000
<210>SEQ ID 3
<211>长度:1062
<212>类型:PRT
<213>生物体:荧光假单胞菌(Pseudomonas fluorescens)A2-2
<400>序列3
Met Ser Val Asp Thr Cys Arg Thr Ala Thr Phe Pro Ala Ser Tyr Gly
1               5                   10                  15
Gln Glu Gln Ile Trp Phe Leu Asn Glu Leu Asn Pro His Ser Gln Leu
            20                  25                  30
Ala Tyr Thr Leu Ala Met Lys Val Ser Ile Ala Gly Lys Leu Asn Thr
        35                  40                  45
Leu Arg Leu Gln Arg Ala Val Asn Gln Val Val Ala Ser Gln Glu Ile
    50                  55                  60
Leu Arg Thr Ser Phe Ala Tyr Lys Asn Gln Lys Leu Ser Gln Val Ile
65                  70                  75                  80
Ser Pro Ser Ala Thr Leu Pro Ile Arg Ser Ala His Cys Ile Asp Asp
                85                  90                  95
Val Pro Gly Leu Gln Arg Leu Ile Asn Met Glu Ala Gln Arg Gly Trp
            100                 105                 110
Ser Leu Ser Ser Ala Pro Leu Tyr Arg Leu Leu Leu Ile Lys Thr Gly
        115                 120                 125
Asp Gln Gln His Glu Leu Val Ile Cys Thr His His Ile Val Cys Asp
    130                 135                 140
Gly Ile Ser Leu Gln Leu Leu Leu Gln Lys Ile Val Ser Ala Tyr Gln
145                 150                 155                 160
Gly Gln Ser Asp Gly Arg Val Leu Thr Ser Pro Asp Glu Glu Thr Leu
                165                 170                 175
Gln Phe Val Asp Tyr Ala Ala Trp Ser Arg Gln His Glu Tyr Ala Gly
            180                 185                 190
Leu Glu Tyr Trp Arg Gln Gln Leu Ala Asp Ala Pro Thr Ile Leu Asp
         195                 200                205
Ile Ser Thr Lys Thr Gly Arg Ser Glu Gln Gln Thr Phe Leu Gly Ala
    210                 215                 220
Arg Ile Pro Val Glu Phe Ser His His Gln Trp Gln Ala Leu Arg Gln
225                 230                 235                 240
Ile Phe Arg Pro Gln Gly Ile Ser Cys Ala Ala Val Phe Leu Ala Ala
                245                 250                 255
Tyr Cys Val Val Leu His Arg Leu Ala Glu Gln Asp Asp Ile Leu Ile
            260                 265                 270
Gly Leu Pro Thr Ser Asn Arg Leu Arg Pro Glu Leu Ala Gln Val Ile
        275                 280                 285
Gly Tyr Leu Ser Asn Leu Cys Val Phe Arg Ser Gln Tyr Ala His Asp
    290                 295                 300
Gln Ser Val Thr Asp Phe Leu Gln Gln Val Gln Leu Thr Leu Pro Asn
305                 310                 315                 320
Leu Ile Glu His Gly Glu Thr Pro Phe Gln Gln Val Leu Glu Ser Val
                325                 330                 335
Glu His Thr Arg Gln Ala Gly Val Thr Pro Leu Cys Gln Val Leu Phe
            340                 345                 350
Gly Tyr Glu Gln Asp Val Arg Arg Thr Leu Asp Ile Gly Asp Leu Gln
        355                 360                 365
Leu Thr Val Ser Asp Val Asp Thr Gly Ala Ala Arg Leu Asp Leu Ser
    370                 375                 380
Leu Phe Leu Phe Glu Asp Glu Leu Asn Val Cys Gly Phe Leu Glu Tyr
385                 390                 395                 400
Ala Thr Asp Arg Ile Asp Ala Ala Ser Ala Gln Asn Met Val Arg Met
                405                 410                415
Leu Ser Ser Val Leu Arg Glu Phe Val Ala Ala Pro Gln Ala Pro Leu
            420                 425                 430
Ser Glu Val Gln Leu Gly Ala Ala Asp Ser Gln Ala Gln Thr Pro Ala
        435                 440                 445
Ile Ala Pro Ala Phe Pro Ser Val Pro Ala Arg Leu Phe Ala Leu Ala
    450                 455                 460
Asp Ser His Pro Asn Ala Thr Ala Leu Arg Asp Glu Gln Gly Glu Leu
465                 470                 475                480
Thr Tyr Ala Gln Val Cys Gln Gln Ile Leu Gln Ala Ala Ala Thr Leu
                485                 490                 495
Arg Ala Gln Gly Ala Lys Pro Gly Thr Leu Ile Ala Val Ile Gly Glu
            500                 505                 510
Arg Gly Asn Pro Trp Leu Ile Ala Met Leu Ala Ile Trp Gln Val Gly
        515                 520                 525
Gly Ile Tyr Val Pro Leu Ser Lys Asp Leu Pro Glu Gln Arg Leu Gln
    530                 535                 540
Gly Ile Leu Ala Glu Leu Glu Gly Ala Ile Leu Ile Thr Asp Asp Thr
545                 550                 555                 560
Thr Pro Glu Arg Phe Arg Gln Arg Val Thr Leu Pro Met His Ala Leu
                565                 570                 575
Trp Ala Asp Gly Ala Thr His His Glu Arg Gln Thr Thr Asp Ala Ser
            580                 585                 590
Arg Leu Ser Gly Tyr Met Met Tyr Thr Ser Gly Ser Thr Gly Lys Pro
        595                 600                 605
Lys Gly Val His Val Ser Gln Ala Asn Leu Val Ala Thr Leu Ser Ala
    610                 615                     620
Phe Gly Gln Leu Leu Gln Val Lys Pro Ser Asp Arg Met Leu Ala Leu
625                 630                     635             640
Thr Thr Phe Ser Phe Asp Ile Ser Leu Leu Glu Leu Leu Leu Pro Leu
                645                     650             655
Val Gln Gly Ala Ser Val Gln Ile Ala Val Ala Gln Ala Gln Arg Asp
            660                     665             670
Ala Glu Lys Leu Ala Gly Tyr Leu Ala Asp Pro Arg Ile Thr Leu Val
        675                     680             685
Gln Ala Thr Pro Val Thr Trp Arg Leu Leu Leu Ser Thr Gly Trp Gln
    690                     695             700
Pro Arg Glu Ser Leu Thr Leu Leu Cys Gly Gly Glu Ala Leu Pro Gln
705                     710             715                 720
Asp Leu Ala Asp Arg Leu Cys Leu Pro Gly Met Thr Leu Trp Asn Leu
                    725             730                 735
Tyr Gly Pro Thr Glu Thr Thr Ile Trp Ser Thr Ala Cys Arg Leu Gln
                740             745                 750
Pro Gly Ala Pro Val Gln Leu Gly His Pro Ile Ala Gly Thr Gln Ile
        755                 760                 765
Ala Leu Val Asp Arg Asn Leu Arg Ser Val Pro Arg Gly Val Ile Gly
    770                 775                 780
Glu Leu Leu Ile Cys Gly Pro Gly Val Ser Gln Gly Tyr Tyr Arg Asn
785                 790                 795                 800
Pro Val Glu Thr Ala Lys Arg Phe Val Pro Asp Pro His Gly Ser Gly
                805                 810                 815
Lys Arg Ala Tyr Leu Thr Gly Asp Arg Met Arg Met Gln Gln Asp Gly
            820                 825                 830
Ser Leu Ala Tyr Ile Gly Arg Arg Asp Asp Gln Ile Lys Leu Arg Gly
        835                 840                 845
His Arg Ile Glu Leu Gly Glu Ile Glu Thr Ala Leu Arg Lys Leu Pro
    850                 855                 860
Gly Val Arg Asp Ala Ala Ala Gln Leu His Asp Gln Asp Pro Ser Arg
865                 870                 875                 880
Gly Ile Gln Ala Phe Val Gln Leu Cys Ala Thr Val Asp Glu Ser Leu
                885                 890                 895
Ile Asp Ile Gly Gln Trp Leu Glu Thr Leu Arg Gln Thr Leu Pro Glu
            900                 905                 910
Ala Trp Leu Pro Thr Glu Tyr Tyr Arg Ile Asp Gly Ile Pro Leu Thr
        915                 920                 925
Tyr Asn Gly Lys Arg Asp Arg Lys Arg Leu Leu His Cln Ala Val Arg
    930                 935                 940
Leu Gln Thr Leu Ser Leu Arg Val Ala Pro Ser Ser Asp Thr Glu Thr
945                 950                 955                 960
Arg Val Gln Gln Ile Trp Cys Glu Leu Leu Gly Leu Glu Asp Ile Gly
                965                 970                 975
Val Thr Asp Asp Phe Phe Gln Leu Gly Gly His Ser Ile Leu Val Ala
            980                  985                990
Arg Met Val Glu Arg Ile Glu Thr Ala Phe Gly Arg Arg Val Pro Ile
        995                 1000                1005
Ala Asp Ile Tyr Phe Ser Pro Thr Ile Ala Arg Val Ala Ala Thr
    1010                1015                1020
Leu Asp Ser Met Thr Phe Glu Gln Gly Leu Ala Ala His Ser Val
1025                    1030                1035
Lys Gly Asp Trp Glu Phe Thr Ala Ile Ser Leu Gln His Asn Ala
    1040                1045                1050
Asp Ser Thr Ala Ala Ala Gln Glu Arg
    1055                1060
<210>SEQ ID 4
<211>长度:1432
<212>类型:PRT
<213>生物体:荧光假单胞菌(Pseudomonas fluorescens)A2-2
<400>序列4
 Met His Ser Pro Thr Ile Asp Thr Phe Glu Ala Ala Leu Arg Ser Leu
 1               5                   10                  15
 Pro Ala Ala Arg Asp Ala Leu Gly Ala Tyr Pro Leu Ser Ser Glu Gln
             20                  25                  30
 Lys Arg Leu Trp Leu Leu Ala Gln Leu Ala Gly Thr Ala Thr Leu Pro
         35                  40                  45
 Val Thr Val Arg Tyr Ala Phe Thr Gly Thr Val Asp Leu Ala Val Val
     50                  55                  60
 Gln Gln Asn Leu Ser Ala Trp Ile Ala His Ser Glu Ser Leu Arg Ser
 65                  70                  75                  80
 Leu Phe Val Glu Val Leu Glu Arg Pro Val Arg Leu Leu Met Pro Thr
                85                  90                  95
Gly Leu Val Lys Leu Glu Tyr Phe Asp Arg Pro Pro Ser Asp Ala Asp
            100                 105                 110
Met Ala Glu Leu Ile Gly Ala Ala Phe Glu Leu Asp Lys Gly Pro Leu
        115                 120                 125
Leu Arg Ala Phe Ile Thr Arg Thr Ala Ala Gln Gln His Glu Leu His
    130                 135                 140
Leu Val Gly His Pro Ile Val Val Asp Glu Pro Ser Leu Gln Arg Ile
145                 150                 155                 160
Ala Gln Thr Leu Phe Gln Thr Glu Pro Asp His Gln Tyr Pro Ala Val
                165                 170                 175
Gly Ala Ile Ala Glu Val Phe Gln Arg Glu Gln Thr Leu Ala Gln Asp
            180                 185                 190
Ala Gln Ile Thr Glu Gln Trp Gln Gln Trp Gly Ile Gly Leu Gln Ala
        195                 200                 205
Pro Ala Ala Thr Glu Ile Pro Thr Glu Asn Pro Arg Pro Ala Ile Lys
    210                 215                 220
Gly Ser Asp Arg Gln Val His Glu Ala Leu Thr Ala Trp Gly Asp Gln
225                 230                 235                 240
Pro Val Ala Glu Ala Glu Ile Val Ser Ser Trp Leu Thr Val Leu Met
                245                 250                 255
Arg Trp Gln Gly Ser Gln Ser Ala Leu Cys Ala Ile Lys Val Arg Asp
            260                 265                 270
Lys Ala His Ala Asn Leu Ile Gly Pro Leu Gln Thr Tyr Leu pro Val
        275                 280                 285
Arg Val Asp Met Pro Asp Gly Ser Thr Leu Ala Gln Leu Arg Leu Gln
    290                 295                 300
Val Glu Glu Gln Leu Asn Gly Asn Asp His Pro Ser Phe Ser Thr Leu
305                 310                 315                 320
Leu Glu Val Cys Pro Pro Lys Arg Asp Leu Ser Arg Thr Pro Tyr Phe
                325                 330                 335
Gln Thr Gly Leu Gln Phe Ile Ala His Asp Val Glu Gln Arg Agp Phe
            340                 345                 350
His Ala Gly Agn Leu Thr Arg Leu Pro Thr Lys Gln Pro Ser Ser Agp
        355                 360                 365
Leu Asp Leu Phe Ile Ser Cys Trp Val Ser Asp Gly Thr Leu Gly Leu
    370                 375                 380
Thr Leu Asp Tyr Asp Cys Ala Val Leu Asn Ser Ser Gln Val Glu Val
385                 390                 395                 400
Leu Ala Gln Ala Leu Ile Ser Val Leu Ser Ala Pro Gly Glu Gln Pro
                405                 410                 415
Ile Ala Thr Val Ala Leu Met Gly Gln Gln Met Gln Gln Thr Val Leu
            420                 425                 430
Ala Gln Ala His Gly Pro Arg Thr Thr Pro ProoGln Leu Thr Leu Thr
        435                 440                 445
Glu Trp Val Ala Ala Ser Thr Glu Lys Ser Pro Leu Ala Val Ala Val
    450                 455                 460
Ile Asp His Gly Gln Gln Leu Ser Tyr Ala Glu Leu Trp Ala Arg Ala
465                 470                 47S                 480
Ala Leu Val Ala Ala Agn Ile Ser Gln His Val Ala Lys Pro Arg Ser
                485                 490                 495
Ile Ile Ala Val Ala Leu Pro Arg Ser Ala Glu Phe Ile Ala Ala Leu
            500                 505                 510
Leu Gly Val Val Arg Ala Gly His Ala Phe Leu Pro Ile Asp Pro Arg
        515                 520                 525
Leu Pro Thr Asp Arg Ile Gln Phe Leu Ile Glu Asn Ser Gly Cys Glu
    530                 535                 540
Leu Val Ile Thr Ser Agp Gln Gln Ser Val Glu Gly Trp Pro Gln Val
545                 550                     555             560
Ala Arg Ile Arg Met Glu Ala Leu Asp Pro Asp Ile Arg Trp Val Ala
                565                     570             575
Pro Thr Gly Leu Ser His Ser Asp Ala Ala Tyr Leu Ile Tyr Thr Ser
            580                     585             590
Gly Ser Thr Gly Val Pro Lys Gly Val Val Val Glu His Arg Gln Val
        595                     600             605
Val Asn Asn Ile Leu Trp Arg Gln Arg Thr Trp Pro Leu Thr Ala Gln
    610                     615             620
Asp Asn Val Leu His Asn His Ser Phe Ser Phe Asp Pro Ser Val Trp
625                     630             635                 640
Ala Leu Phe Trp Pro Leu Leu Thr Gly Gly Thr Ile Val Leu Ala Asp
                 645             650                 655
Val Arg Thr Met Glu Asp Ser Thr Ala Leu Leu Asp Leu Met Ile Arg
            660             665                 670
His Asp Val Ser Val Leu Gly Gly Val pro Ser Leu Leu Gly Thr Leu
        675             680                 685
Ile Asp His Pro Phe Ala Asn Asp Cys Arg Ala Val Lyg Leu Val Leu
    690             695                 700
Ser Gly Gly Glu Val Leu Asn Pro Glu Leu Ala His Lys Ile Gln Lys
705             710                 715                     720
Val Trp Gln Ala Asp Val Ala Asn Leu Tyr Gly Pro Thr Glu Ala Thr
            725                 730                     735
Ile Asp Ala Leu Tyr Phe Ser Ile Asp Lys Asn Ala Ala Gly Ala Ile
        740                 745                     750
Pro Ile Gly Tyr Pro Ile Asp Asn Thr Asp Ala Tyr Ile Val Asp Leu
    755                 760                     765
Asn Leu Asn Pro Val Pro Pro Gly Val Pro Gly Glu Ile Met Leu Ala
    770                 775                 780
Gly Gln Asn Leu Ala Arg Gly Tyr Leu Gly Lys Pro Ala Gln Thr Ala
785                 790                 795                 800
Gln Arg Phe Leu Pro Asn Pro Phe Gly Asn Gly Arg Val Tyr Ala Thr
                805                 810                 815
Gly Asp Leu Gly Arg Arg Trp Ser Ser Gly Ala Ile Ser Tyr Leu Gly
            820                 825                 830
Arg Arg Asp Gln Gln Val Lys Ile Arg Gly His Arg Ile Glu Leu Asn
        835                 840                 845
Glu Val Ala His Leu Leu Cys Gln Ala Leu Glu Leu Lys Glu Ala Ile
    850                 855                 860
Val Phe Ala Gln His Ala Gly Thr Glu Gln Ala Arg Leu Val Ala Ala
 865                870                 875                 880
Ile Glu Gln Gln Pro Gly Leu His Ser Glu Gly Ile Lys Gln Glu Leu
                885                 890                 895
Leu Arg His Leu Pro Ala Tyr Leu Ile Pro Ser Gln Leu Leu Leu Leu
            900                 905                 910
Asp Glu Leu Pro Arg Thr Ala Thr Gly Lys Val Asp Met Leu Lys Leu
        915                 920                 925
Asp Gln Leu Ala Ala Pro Gln Leu Asn Asp Ala Gly Gly Thr Glu Cys
    930                 935                 940
Arg Ala Pro Arg Thr Asp Leu Glu Gln Ser Val Met Thr Asp Phe Ala
945                 950                 955                 960
Gln Val Leu Gly Leu Thr Ala Val Thr Pro Asp Thr Asp Phe Phe Glu
                965                 970                     975
Gln Gly Gly Asn Ser Ile Leu Leu Thr Arg Leu Ala Gly Thr Leu Ser
            980                 985                     990
Ala Lys Tyr Gln Val Gln Ile Pro Leu His Glu Phe Phe Leu Thr Pro
        995                 1000                1005
Thr Pro  Ala Ala Val Ala Gln  Ala Ile Glu Ile Tyr  Arg Arg Glu
    1010                 1015                 1020
Gly Leu  Thr Ala Leu Leu Ser  Arg Gln Hig Ala Gln  Thr Leu Glu
    1025                 1030                 1035
Gln Asp  Ile Tyr Leu Glu Glu  His Ile Arg Pro Asp  Gly Leu Pro
    1040                 1045                 1050
His Ala  Asn Trp Tyr Gln Pro  Ser Val Val Phe Leu  Thr Gly Ala
    1055                 1060                 1065
Thr Gly  Tyr Leu Gly Leu Tyr  Leu Ile Glu Gln Leu  Leu Lys Arg
    1070                 1075                 1080
Thr Thr  Ser Arg Val Ile Cys  Leu Cys Arg Ala Lys  Asp Ala Glu
    1085                 1090                 1095
His Ala  Lys Ala Arg Ile Leu  Glu Gly Leu Lys Thr  Tyr Arg Ile
    1100                 1105                 1110
Asp Val  Gly Ser Glu Leu His  Arg Val Glu Tyr Leu  Thr Gly Asp
    1115                 1120                 1125
Leu Ala  Leu Pro His Leu Gly  Leu Ser Glu His Gln  Trp Gln Thr
    1130                 1135                 1140
Leu Ala  Glu Glu Val Asp Val  Ile Tyr His Asn Gly  Ala Leu Val
    1145                 1150                 1155
Asn Phe  Val Tyr Pro Tyr Ser  Ala Leu Lys Ala Thr  Asn Val Gly
    1160                 1165                 1170
Gly Thr  Gln Ala Ile Leu Glu  Leu Ala Cys Thr Ala  Arg Leu Lyg
    1175                 1180                 1185
Ser Val  Gln Tyr Val Ser Thr  Val Asp Thr Leu Leu  Ala Thr His
    1190                 1195                 1200
Val Pro  Arg Pro Phe Ile Glu  Asp Asp Ala Pro Leu  Arg Ser Ala
    1205                 1210                 1215
Val Gly  Val Pro Val Gly Tyr  Thr Gly Ser Lys Trp  Val Ala Glu
    1220                 1225                 1230
Gly Val  Ala Asn Leu Gly Leu  Arg Arg Gly Ile Pro  Val Ser Ile
    1235                 1240                 1245
Phe Arg  Pro Gly Leu Ile Leu  Gly His Thr Glu Thr  Gly Ala Ser
    1250                 1255                 1260
Gln Ser  Ile Asp Tyr Leu Leu  Val Ala Leu Arg Gly  Phe Leu Pro
    1265                 1270                 1275
Met Gly  Ile Val Pro Asp Tyr  Pro Arg Ile Phe Asp  Ile Val Pro
    1280                 1285                 1290
Val Asp  Tyr Val Ala Ala Ala  Ile Val His Ile Ser  Met Gln Pro
    1295                 1300                 1305
Gln Gly  Arg Asp Lys Phe Phe  His Leu Phe Asn Pro  Ala Pro Val
    1310                 1315                 1320
Thr Ile  Arg Gln Phe Cys Asp  Trp Ile Arg Glu Phe  Gly Tyr Glu
    1325                 1330                 1335
Phe Lys  Leu Val Asp Phe Glu  His Gly Arg Gln Gln  Ala Leu Ser
    1340                 1345                 1350
Val Pro  Pro Gly His Leu Leu  Tyr Pro Leu Val Pro  Leu Ile Arg
    1355                 1360                 1365
Asp Ala  Asp Pro Leu Pro His  Arg Ala Leu Asp Pro  Asp Tyr Ile
    1370                 1375                 1380
His Glu  Val Asn Pro Ala Leu  Glu Cys Lys Gln Thr  Leu Glu Leu
    1385                 1390                 1395
Leu Ala  Ser Ser Asp Ile Thr  Leu Ser Lys Thr Thr  Lys Ala Tyr
    1400                 1405                 1410
Ala His  Thr Ile Leu Arg Tyr  Leu Ile Asp Thr Gly  Phe Met Ala
    1415                 1420                 1425
Lys Pro  Gly Val
    1430
<210>SEQ ID 5
<211>长度:350
<212>类型:PRT
<213>生物体:荧光假单胞菌(Pseudomonas fluorescens)A2-2
<400>序列5
Met Glu Ser Ile Ala Phe Pro Ile Ala His Lys Pro Phe Ile Leu Gly
1               5                   10                  15
Cys Pro Glu Asn Leu Pro Ala Thr Glu Arg Ala Leu Ala Pro Ser Ala
            20                  25                  30
Ala Met Ala Arg Gln Val Leu Glu Tyr Leu Glu Ala Cys Pro Gln Ala
        35                  40                  45
Lys Asn Leu Glu Gln Tyr Leu Gly Thr Leu Arg Glu Val Leu Ala His
    50                  55                  60
Leu Pro Cys Ala Ser Thr Gly Leu Met Thr Asp Asp Pro Arg Glu Asn
65                  70                  75                  80
Gln Glu Asn Arg Asp Asn Asp Phe Ala Phe Gly Ile Glu Arg His Gln
                85                  90                  95
Gly Asp Thr Val Thr Leu Met Val Lys Ala Thr Leu Asp Ala Ala Ile
            100                 105                 110
Gln Thr Gly Glu Leu Val Gln Arg Ser Gly Thr Ser Leu Asp His Ser
        115                 120                 125
Glu Trp Ser Asp Met Met Ser Val Ala Gln Val Ile Leu Gln Thr Ile
    130                 135                 140
Ala Asp Pro Arg Val Met Pro Glu Ser Arg Leu Thr Phe Gln Ala Pro
145                 150                 155                 160
Lys Ser Lys Val Glu Glu Asp Asp Gln Asp Pro Leu Arg Arg Trp Val
                165                 170                 175
Arg Gly His Leu Leu Phe Met Val Leu Cys Gln Gly Met Ser Leu Cys
            180                 185                 190
Thr Asn Leu Leu Ile Ser Ala Ala His Asp Lys Asp Leu Glu Leu Ala
        195                 200                 205
Cys Ala Gln Ala Asn Arg Leu Ile Gln Leu Met Asn Ile Ser Arg Ile
    210                 215                 220
Thr Leu Glu Phe Ala Thr Asp Leu Asn Ser Gln Gln Tyr Val Ser Gln
225                 230                 235                 240
Ile Arg Pro Thr Leu Met Pro Ala Ile Ala Pro Pro Lys Met Ser Gly
                245                 250                 255
Ile Asn Trp Arg Asp His Val Val Met Ile Arg Trp Met Arg Gln Ser
            260                 265                 270
Thr Asp Ala Trp Asn Phe Ile Glu Gln Ala Tyr Pro Gln Leu Ala Glu
        275                 280                  285
Arg Met Arg Thr TAr Leu Ala Gln Val Tyr Ser Ala His Arg Gly Val
    290                 295                 300
Cys Glu Lys Phe Val Gly Glu Glu Asn Thr Ser Leu Leu Ala Lys Glu
305                 310                 315                 320
Asn Ala Thr Asn Thr Ala Gly Gln Val Leu Glu Asn Leu Lys Lys Ser
                325                 330                 335
Arg Leu Lys Tyr Leu Lys Thr Lys Gly Cys Ala Gly Ala Gly
            340                 345                 350
<210>SEQ ID 6
<211>长度:61
<212>类型:PRT
<213>生机体:荧光假单胞菌(Pseudomonas fluorescens)A2-2
<400>序列6
Met Pro Thr Phe Leu Gly Asp Asp Asp Ala Val Pro Cys Val Val Val
1               5                   10                  15
Val Asn Ala Asp Lys His Tyr Ser Ile Trp Pro Ser Ala Arg Asp Ile
             20                 25                  30
Pro Ser Gly Trp Ser Glu Glu Gly Phe Lys Gly Ser Arg Ser Asp Cys
        35                  40                  45
Leu Glu His Ile Ala Gln Ile Trp Pro Glu Pro Thr Ala
    50                  55                  60
<210>SEQ ID 7
<211>长度:355
<212>类型:PRT
<213>生物体:荧光假单胞菌(Pseudomonas fluorescens)A2-2
<400>序列7
Met Thr Ser Thr His Arg Thr Thr Asp Gln Val Lvs Pro Ala Val Leu
1               5                   10                  15
Asp Met Pro Gly Leu Ser Gly Ile Leu Phe Gly His Ala Ala Phe Gln
            20                  25                  30
Tyr Leu Arg Ala Ser Cys Glu Leu Asp Leu Phe Glu His Val Arg Asp
        35                  40                  45
Leu Arq Glu Ala Thr Lys Glu Ser Ile Ser Ser Arg Leu Lys Leu Gln
    50                  55                  60
Glu Arg Ala Ala Asp Ile Leu Leu Leu Gly Ala Thr Ser Leu Gly Met
65                  70                  75                  80
Leu Val Lys Glu Asn Gly Ile Tyr Arg Asn Ala Asp Val Val Glu Asp
                85                  90                  95
Leu Met Ala Thr Asp Asp Trp Gln Arg Phe Lys Asp Thr Val Ala Phe
            100                 105                  110
Glu Asn Tyr Ile Val Tyr Glu Gly Gln Leu Asp Phe Thr Glu Ser Leu
        115                  120                125
Gln Lys Asn Thr Asn Val Gly Leu Gln Arg Phe Pro Gly Glu Gly Arg
    130                 135                 140
Asp Leu Tyr His Arg Leu His Gln Asn Pro Lys Leu Glu Agn Val Phe
145                 150                 155                 160
Tyr Arg Tyr Met Arg Ser Trp Ser Glu Leu Ala Asn Gln Asp Leu Val
                165                 170                 175
Lys His Leu Asp Leu Ser Arg Val Lys Lys Leu Leu Asp Ala Gly Gly
            180                 185                 190
Gly Asp Al a Val Asn Ala Ile Ala Leu Ala Lys His Asn Glu Gln Leu
        195                 200                 205
Asn Val Thr Val Leu Asp Ile Agp Asn Ser Ile Pro Val Thr Gln Gly
    210                  215                220
Lys Ile Asn Asp Ser Gly Leu Ser His Arg Val Lys Ala Gln Ala Leu
225                 230                 235                 240
Asp Ile Leu His Gln Ser Phe Pro Glu Gly Tyr Asp Cys Ile Leu Phe
                245                 250                 255
Ala HiG Gln Leu Val Ile Trp Thr Leu Glu Glu Asn Thr His Met Leu
            260                 265                 270
Arg Lys Ala Tyr Asp Ala Leu Prp Glu Gly Gly Arg Val Val  Ile Phe
        275                 280                 285
Asn Ser Met Ser Asn Asp Glu Gly Asp Gly Pro Val Met Ala Ala Leu
    290                 295                 300
Asp Ser Val Tvr Phe Ala Cys Leu Pro Ala Glu Gly Gly Met Ile Tyr
305                 310                 315                 320
Ser Trp Lys Gln Tyr Glu Val Cys Leu Ala Glu Ala Gly Phe Lys Asn
                325                 330                 335
Pro Val Arg Thr Ala Ile Pro Gly Trp Thr Pro His Gly Ile Ile Val
            340             345                     350
Ala Tyr Lys
        355
<210>SEQ ID 8
<211>长度:347
<212>类型:PRT
<213>生物体:荧光假单胞菌(Pseudomonas fluorescens)A2-2
<400>序列8
Met Ala Arg Ser Pro Glu Thr Asn Ser Ala Met Pro Gln Gln Ile Arg
 1              5                   10                  15
Gln Leu Leu Tyr Ser Gln Leu Ile Ser Gln Ser Ile Gln Thr Phe Cys
            20                  25                  30
Glu Leu Arg Leu Pro Asp Val Leu Gln Ala Ala Gly Gln Pro Thr Ser
        35                  40                  45
Ile Glu Arg Leu Ala Glu Gln Thr His Thr His Ile Ser Ala Leu Ser
    50                  55                  60
Arg Leu Leu Lys Ala Leu Lys Pro Phe Gly Leu Val Lys Glu Thr Asp
65                  70                  75                  80
Glu Gly Phe Ser Leu Thr Asp Leu Gly Ala Ser Leu Thr His Asp Ala
                85                  90                  95
Phe Ala Ser Ala Gln Pro Ser Ala Leu Leu Ile Asn Gly Glu Met Gly
            100                 105                 110
Gln Ala Trp Arg Gly Met Ala Gln Thr Ile Arg Thr Gly Glu Ser Ser
        115                 120                 125
Phe Lys Met Tyr Tyr Gly Ile Ser Leu Phe Glu Tyr Phe Glu Gln His
    130                 135                 140
Pro Glu Arg Arg Ala Ile Phe Asp Arg Ser Gln Asp Met Gly Leu Asp
145                 150                 155                 160
Leu Glu Ile Pro Glu Ile Leu Glu Asn Ile Asn Leu Asn Asp Gly Glu
                165                 170                 175
Asn Ile Val Asp Val Gly Gly Gly Ser Gly His Leu Leu Met His Met
            180                 185                 190
Leu Asp Lys Trp Pro Glu Ser Thr Gly Ile Leu Phe Asp Leu Pro Val
        195                 200                 205
Ala Ala Lys Ile Ala Gln Gln His Leu His Lys Ser Gly Lys Ala Gly
    210                 215                 220
Cys Phe Glu Ile Val Ala Gly Asp Phe Phe Lys Ser Leu Pro Asp Ser
225                 230                 235                 240
Gly Ser Val Tyr Leu Leu Ser His Val Leu His Asp Trp Gly Asp Glu
                245                 250                 255
Asp Cys Lys Ala Ile Leu Ala Thr Cys Arg Arg Ser Met Pro Asp Asn
            260                 265                 270
Ala Leu Leu Val Val Val Asp Leu Val Ile Asp Gln Ser Glu Ser Ala
        275                 280                 285
Gln Pro Asn Pro Thr Gly Ala Met Mey Asp Leu Tyr Mey Leu Ser Leu
    290                 295                 300
Phe Gly Ile Ala Gly Gly Lys Glu Arg Asn Glu Asp Glu Phe Arg Thr
305                 310                 315                 320
Leu Ile Glu Asn Ser Gly Phe Asn Val Lys Gln Val Lys Arg Leu Pro
                325                 330                 335
Ser Gly Asn Gly Ile Ile Phe Ala Tyr Pro Lys
            340                 345
<210>SEQ ID 9
<211>长度:180
<212>类型:PRT
<213>生物体:荧光假单胞茵(Pseudomonas fluorescens)A2-2
<400>序列9
Met Ser Thr Leu Val Tyr Tyr Val Ala Ala Thr Leu Asp Gly Tyr Ile
1               5                   10                  15
Ala Thr Gln Gln His Lys Leu Asp Trp Leu Glu Asn Phe Ala Leu Gly
            20                  25                  30
Asp Asp Ala Thr Ala Tyr Asp Asp Phe Tyr Gln Thr Ile Gly Ala Val
        35                  40                  45
Val Met Gly Ser Gln Thr Tyr Glu Trp Ile Met Ser Asn Ala Pro Asp
    50                  55                  60
Asp Trp Pro Tyr Gln Asp Val Pro Ala Phe Val Met Ser Asn Arg Asp
65                  70                  75                  80
Leu Ser Ala Pro Ala Asn Leu Asp Ile Thr Phe Leu Arg Gly Asp Ala
                85                  90                  95
Ser Ala Ile Ala Val Arg Ala Arg Gln Ala Ala Lys Gly Lys Asn Val
            100                 105                 110
Trp Leu Val Gly Gly Gly Lys Thr Ala Ala Cys Phe Ala Asn Ala Gly
        115                 120                 125
Glu Leu Gln Gln Leu Phe Ile Thr Thr Ile Pro Thr Phe Ile Gly Thr
    130                 135                 140
Gly Val Pro Val Leu Pro Val Asp Arg Ala Leu Glu Val Val Leu Arg
145                 150                 155                 160
Glu Gln Arg Thr Leu Gln Ser Gly Ala Met Glu Cys Ile Leu Asp Val
                165                 170                 175
Lys Lys Ala Asp
            l80
<210>SEQ ID 10
<21l>长度:220
<212>类型:PRT
<213>生物体:荧光假单胞菌(Pseudomonas fluorescens)A2-2
<400>序列10
Met Ser Asn Val Phe Ser Gly Gly Lys Gly Asn Gly Asn Pro Gly Phe
1               5                   10                  15
Val Arg Thr Phe Ser Arg Ile Ala Pro Thr Tyr Glu Glu Lys Tyr Gly
            20                  25                  30
Thr Lys Leu Ser Gln Ala His Asp Asp Cys Leu Arg Met Leu Ser Arg
        35                  40                  45
Trp Met Cys Thr Ser Arg Pro Glu Arg Val Leu Asp Ile Gly Cys Gly
    50                  55                  60
Thr Gly Ala Leu Ile Glu Arg Met Phe Ala Leu Trp Pro Glu Ala Arg
65                  70                  75                  80
Phe Glu Gly Val Asp Pro Ala Gln Gly Met Val Asp Glu Ala Ala Lys
                85                  90                  95
Arg Arg Pro Phe Ala Ser Phe Val Lys Gly Val Ala Glu Ala Leu Pro
            100                 105                 110
Phe Pro Ser Gln Ser Met Asp Leu Val Val Cys Ser Met Ser Phe Gly
        115                 120                 125
His Trp Ala Asp Lys Ser Val Ser Leu Asn Glu Val Arg Arg Val Leu
    130                 135                 140
Lys Pro Gln Gly Leu Phe Cys Leu Val Glu Asn Leu Pro Ala Gly Trp
145                 150                 155                 160
Gly Leu Thr Thr Leu Ile Asn Trp Leu Leu Gly Ser Leu Ala Asp Tyr
                165                 170                 175
Arg Ser Glu His Glu Val Ile Gln Leu Ala Gln Thr Ala Gly Leu Gln
            180                 185                 190
Ser Met Glu Thr Ser Val Thr Asp Gln His Val Ile Val Ala Thr Phe
        195                 200                 205
Arg Pro Cys Cys Gly Glu Val Gly Asp His Gly Arg
    210                 215                 220
<2l0>SEQ ID ll
<211>长度:509
<212>类型:PRT
<213>生物体:荧光假单胞菌(Pseudomonas fluorescens)A2-2
<400>序列11
Met Val Val Lys Asn Lys Gln Val Leu Val Val Gly Ala Gly Pro Val
1               5                   10                  15
Gly Leu Ala Val Ala Ala Ala Leu Ala Glu Leu Gly Ile Ala Val Asp
            20                  25                  30
Leu Ile Asp Lys Arg Pro Ala Ala Ser Pro His Ser Arg Ala Phe Gly
        35                  40                  45
Leu Glu Pro Val Thr Leu Glu Leu Leu Asn Ala Trp Gly Val Ala Asp
    50                  55                  60
Glu Met Ile Arg Arg Gly Ile Val Trp Ala Ser Ala Pro Leu Gly Asp
65                  70                  75                  80
Lys Ala Gly Arg Thr Leu Ser Phe Ser Lys Leu Pro Cys Glu Tyr Pro
                85                  90                  95
His Met Val Ile Ile Pro Gln Ser Gln Thr Glu Ser Val Leu Thr Asp
            100                 105                 110
Trp Val Asn Arg Lys Gly Val Asn Leu Lys Arg Gly Tyr Ala Leu Lys
        115                 120                 125
Ala Leu Asp Ala Gly Asp Leu His Val Glu Val Thr Leu Glu His Ser
    130                 135                 140
Glu Thr Gly Ser Val Gln Gln Ser Arg Tyr Asp Trp Val Leu Gly Ala
145                 150                 155                 160
Asp Gly Val Asn Ser Ser Val Arg Gln Leu Leu Asn Ile Ser Phe Val
                165                 170                 175
Gly Gln Asp Tyr Lys His Ser Leu Val Val Ala Asp Val Val Leu Arg
            180                 185                 190
Asn Pro Pro Ser Pro Ala Val His Ala Arg Ser Val Ser Arg Gly Leu
        195                 200                 205
Val Ala Leu Phe Pro Leu Pro Asp Gly Ser Tyr Arg Val Ser Ile Glu
    2l0                 215                 220
Asp Asn Glu Arg Met Asp Thr ProVal Lys Gln Pro Val Thr His Glu
225                 230                235                240
Glu Ile Ala Gly Gly Met Lys Asp Ile Leu Gly Thr Asp Phe Gly Leu
                245                 250                 255
Ala Gln Val Leu Trp Ser Ala Arg Tyr Arg Ser Gln Gln Arg Leu Ala
            260                 265                 270
Thr His Tyr Arg Gln Gly Arg Val Phe Leu Leu Gly Asp Ala Ala His
        275                 280                 285
Thr His Val Pro Ala Gly Gly Gln Gly Leu Gln Met Gly Ile Gly Asp
    290                 295                 300
Ala Ala Asn Leu Ala Trp Lys Leu Ala Glv Val Ile Gln Ala Thr Leu
305                 310                 315                 320
Pro Met Asp Leu Leu Glu Ser Tvr Glu Ala Glu Arg Arg Pro Ile Ala
                325                 330                 335
Ala Ala Ala Leu Arg Asn Thr Asp Leu Leu Phe Arg Phe Asn Thr Ala
            340                  345                350
Ser Gly Pro Ile Gly Arg Leu Ile His Trp Ile Gly Leu Gln Ala Thr
        355                 360                 365
Arg Ala Pro Tyr Val Ala Gln Lys Val Val Ser Ala Leu Ala Gly Glu
    370                 375                 380
Gly Val Arg Tyr Asp Ser Val Arg Arg Arg Gly Asp His Arg Leu Val
385                 390                 395                 400
Gly Arg Arg Leu Pro Leu Leu Ser Leu Leu Pro Glu Gly Glu Arg Leu
                405                 410                 415
Pro Arg Gln Ser Leu Thr Gln Leu Leu Arg Ala Gly Arg Phe Val Leu
            420                 425                 430
Val His His Arg Ala Lys Ala Leu Ala Ala Asp Leu Arg Arg Asp Phe
        435                 440                  445
Pro Gly Leu Gln Thr Ala Ser Ile Cys Glu Asp Ser His Asn Asn Ser
    450                 455                 460
Leu Ser Ala Gly Glu Gly Val Ile Val Arg Pro Asp Gly Val Val Ile
465                 470                  475                480
Trp Val Gly Lys Lys Ser Thr Leu Ala Lys Glu Arg Leu Gly Glu Trp
                485                 490                 495
Leu Leu Asp Asp Ser Lys Ser Ala Arg Gln Ser Leu Thr
            500                 505
<210>SEQ ID 12
<21l>长度:348
<212>类型:PRT
<213>生物体:荧光假单胞茵(Pseudomonas fluorescens)A2-2
<400>序列12
Met Ala His Tyr Asp Ser Val Gly Thr Ala Pro Gly Ala Ser Asp Asp
1               5                   10                      15
Gly Met Ala Val Ala Ser Ile Leu Gln Leu Met Arg Glu Thr Ile Thr
            20                  25                      30
Arg Ser Asp Ala Lys Asn Asn Val Val Phe Leu Leu Ala Asp Gly G1u
        35                  40                      45
G1u Leu Gly Leu Leu Gly Ala Glu His Tyr Val Ser Gln Leu Ser Thr
    50                  55                      60
Pro Glu Arg Glu Ala Ile Arg Leu Val Leu Asn Phe Glu Ala Arg Gly
65                  70                      75              80
Asn Gln Gly Ile Pro Leu Leu Phe Glu Thr Ser Gln Lys Asp Tyr Ala
                85                      90              95
Leu Ile Arg Thr Val Asn Ala Gly Val Arg Asp Ile Ile Ser Phe Ser
            100                     105             110
Phe Thr Pro Leu Ile Tyr Asn Met Leu Gln Asn Asp Thr Asp Phe Thr
        115                     120             125
Val Phe Arg Lys Lys Asn Ile Ala Gly Leu Asn Phe Ala Val Val Glu
    130                     135             140
Gly Phe Gln His Tyr His His Met Ser Asp Thr Val Glu Asn Leu Gly
145                 150                 155                 160
Pro Glu Thr Leu Phe Arg Tyr Gln Lys Thr Val Arg Glu Val Gly Asn
                165                 170                 175
His Phe Ile Gln Gly Ile Asp Leu Ser Ser Leu Ser Ala Asp Glu Asp
            180                 185                 190
Ala Thr Tyr Phe Pro Leu Pro Gly Gly Thr Leu Leu Val Leu Asn Leu
        195                 200                 205
Pro Thr Leu Tyr Ala Leu Gly Met Gly Ser Phe Val Leu Cys Gly Leu
    210                 215                 220
Trp Ala Gln Arg Cys Arg Thr Arg Arg Gln His Gln Gly Lys Asn Cys
225                 230                 235                 240
Val Leu Arg Pro Met Ala Ile Ala Leu Leu Gly Ile Ala Cys Ala Ala
                245                 250                 255
Leu Val Phe Tyr Val Pro Ser Ile Ala Tyr Leu Phe Val Ile Pro Ser
            260                 265                 270
Leu Leu Leu Ala Cys Ala Met Leu Ser Arg Ser Leu Phe Ile Ser Tyr
        275                  280                235
Ser Ile Met Leu Leu Gly Ala Tyr Ala Cys Gly Ile Leu Tyr Ala Pro
    290                 295                 300
Ile Val Tyr Leu Ile Ser Ser Gly Leu Lys Met Pro Phe Ile Ala Gly
305                 310                 315                 320
Val Ile Ala Leu Leu Pro Leu Cys Leu Leu Ala Val Gly Leu Ala Gly
                325                 330                 335
Val Ile Ala Arg Ser Arg Asp Cys Arg Thr Cys Asp
            340                 345
<210>SEQ ID 13
<211>长度:572
<212>类型:PRT
<213>生物体:荧光假单胞菌(Pseudomonas fluorescens)A2-2
<400>序列13
Met Arg Ser Leu Lys Ile Ile Val Leu Ala Ser Ala Phe Asn Gly Leu
1               5                   10                  15
Thr Gin Arg Ala Trp Leu Asp Leu Arg Gln Ser Gly His Ala Pro Ser
            20                  25                  30
Val Val Leu Phe Thr Asp Pro Ala Leu Val Cys Gln Gln Ile Glu Asp
        35                  40                  45
Ser Asp Ala Asp Leu Val Ile Cys Pro Phe Leu Lys Asp Arg Val Pro
    50                  55                  60
Gln Gln Leu Trp Ser Asn Leu Glu Arg Pro Val Val Ile Ile His Pro
65                  70                  75                  80
Gly Ile Val Gly Asp Arg Gly Ala Ser Ala Leu Asp Trp Ala Ile Ser
                85                  90                  95
Gln Gln Val Gly Arg Trp Gly Val Thr Ala Leu Gln Ala Val Glu Glu
            100                 105                 110
Met Asp Ala Gly Pro Ile Trp Ser Thr Cys Glu Phe Asp Met Pro Ala
        115                 120                 125
Asp Val Arg Lys Ser Glu Leu Tyr Asn Gly Ala Val Ser Asp Ala Ala
    130                 135                 140
Leu Tyr Cys Ile Arg Asp Val Val Glu Lys Phe Ala Arg Val Phe Val
145                 150                 155             160
Pro Val Pro Leu Asp Tyr Thr Gln Ala His Val Ile Gly Arg Leu Gln
                165                 170             175
Pro Asn Met Thr Gln Ala Asp Arg Thr Phe Ser Trp Tyr Asp Cys Ala
            180                 185             190
Arg Phe Ile Lys Arg Cys Ile Asp Ala Ala Asp Gly Gln Pro Gly Val
        195                 200                 205
Leu Ala Ser Ile Gln Gly Gly Gln Tyr Tyr Leu Tyr Asp Ala His Leu
    210                 215                 220
Asp Ala Arg His Gly Thr Pro Gly Glu Ile Leu Ala Val Gln Asp Asp
225                 230                 235                 240
Ala Val Leu Val Ala Ala Gly Asp Gln Ser Leu Trp Ile Gly Ser Leu
                245                 250                 255
Lys Arg Lys Ala Arg Pro Gly Glu Glu Thr Phe Lys Leu Pro Ala Arg
            260                 265                 270
His Val Leu Ala Glu Ala Leu Ala Asp Ile Pro Val Leu Asp Ser Ser
        275                 280                 285
Ile Ala Asn Gln Met Phe Asp Glu Gln Ala Tyr Gln Pro Ile Arg Tyr
    290                 295                 300
Arg Glu Ala Gly His Val Gly Glu Leu Thr Phe Glu Phe Tyr Asn Gly
305                 310                 315                320
Ala Met Ser Thr Glu Gln Cys Gln Arg Leu Val Ala Ala Leu Arg Trp
                325                 330                 335
Ala Lys Thr Arg Asp Thr Gln Val Leu Val Ile Lys Gly Gly Arg Gly
            340                 345                 350
Ser Phe Ser Asn Gly Val His Leu Asn Val Ile Gln Ala Ala Pro Val
        355                 360                 365
Pro Gly Leu Glu Ala Trp Ala Asn Ile Gln Ala Ile Tyr Asp Val Cys
    370                 375                 380
His Glu Leu Leu Thr Ala Arg Gln Leu Val Ile Ser Gly Leu Thr Gly
385                 390                 395                 400
Ser Ala Gly Ala Gly Gly Val Met Leu Ala Leu Ala Ala Asp Ile Val
                405                 410                 415
Leu Ala Arg Glu Ser Val Val Leu Asn Pro His Tyr Lys Thr Met Gly
            420                 425                 430
Leu Tyr Gly Ser Glu Tyr Trp Thr Tyr Ser Leu Pro Arg Ala Val Gly
        435                 440                  445
Ser Glu Val Ala His Gln Leu Thr Asp Ala Cys Leu Pro Ile Ser Ala
    450                 455                 460
Leu Gln Ala Glu Gln Tyr Gly Leu Val Gln Gly Ile Gly Pro Arg Cys
465                 470                 475                 480
Pro His Ala Phe Ser Arg Trp Leu Met Gln Gln Ala Ser Ser Ala Leu
                485                 490                 495
Thr Asp Glu Lys Tyr Ala Val Ala Arg Ala Arg Lys Ala Ala Leu Asp
            500                 505                 510
Ile Asp Gln Ile Thr Arg Cys Arg Glu Ala Glu Leu Ala Gln Met Gln
        515                 520                 525
Leu Asp Met Val His Asn Arg His Gln Phe Ala Glu Lys Cys Arg Asn
    530                 535                 540
Phe Val Leu Lys Arg Lys Thr Cys Gln Thr Pro Gln Arg Leu Met Ala
545                 550                 555                 560
Pro Trp Ala Val Ala Arg Glu Ala Ala Leu Val Gly
                565                 570
<210>SEQ ID14
<211>长度:230
<212>类型:PRT
<213>生物体:荧光假单胞菌(Pseudomonas fluorescens)A2-2
<400>序列14
Met Ile Gly Ile Val Ile Pro Ala His Asn Glu Glu Arg His Ile Ser
1               5                   10                   15
Ala Cys Leu Ala Ser Ile Gln Arg Ala Ile Ala His Pro Ala Leu Ala
            20                  25                   30
His Gln Gln Val Gln Leu Leu Val Val Leu Asp Ala Cys Ser Asp Glu
        35                  40                  45
Thr Ala Thr Arg Val Ser Ala Met Gly Val Ala Thr Leu Glu Val Ser
    50                  55                  60
Val Arg Asn Val Gly Lys Ala Arg Ala Leu Gly Ala Glu Arg Leu Leu
65                  70                  75                  80
Glu Val Gly Ala Gln Trp Leu Ala Phe Thr Asp Ala Asp Thr Val Val
                85                  90                  95
Pro Ala Asp Trp Leu Val Arg Gln Ile Gly Phe Gly Ala Asp Ala Val
            100                 105                 110
Cys Gly Thr Val Glu Val Asp Ser Trp Ser Glu Tyr Gly Glu Ser Val
        115                 120                 125
Arg Ser Arg Tyr Leu Glu Leu Tyr Gln Phe Thr Glu Asn His Arg His
    130                 135                 140
Ile His Gly Ala Asn Leu Gly Leu Ser Ala Asp Ala Tyr Arg Asn Ala
145                 150                 155                 160
Gly Gly Phe Gln His Leu Val Ala His Glu Asp Val Gln Leu Val Ala
                165                 170                 175
Asp Leu Glu Arg Ile Gly Ala Arg Ile Val Trp Thr Ala Thr Asn Pro
            180                 185                 190
Val Val Thr Ser Ala Arg Arg Asp Tyr Lys Cys Arg Gly Gly Phe Gly
        195                 200                 205
Glu Tyr Leu Ala Ser Leu Val Ala Glu Gly Thr Arg Glu His Ser Pro
    210                 215                 220
Ala His Ala Pro Ile Gly
225                 230
<210>SEQ ID 15
<211>长度:348
<212>类型:PRT
<213>生物体:荧光假单胞菌(Pseudomonas fluorescens)A2-2
<400>序列15
Met His Pro His Lys Thr Ala Ile Val Leu Ile Glu Tyr Gln Asn Asp
1               5                   10                  15
Phe Thr Thr Pro Gly Gly Val Phe His Asp Ala Val Lys Asp Val Met
            20                  25                  30
Gln Thr Ser Asn Met Leu Ala Asn Thr Ala Thr Thr Ile Glu Gln Ala
        35                  40                  45
Arg Lys Leu Gly Val Lys Ile Ile His Leu Pro Ile Arg Phe Ala Asp
    50                  55                  60
Gly Tyr Pro Glu Leu Thr Leu Arg Ser Tyr Gly Ile Leu Lys Gly Val
65                  70                  75                  80
Ala Asp Gly Ser Ala Phe Arg Ala Gly Ser Trp Gly Ala Glu Ile Thr
                85                  90                  95
Asp Ala Leu Lys Arg Asp Pro Thr Asp Ile Val Ile Glu Gly Lys Arg
            100                 105                 110
Gly Leu Asp Ala Phe Ala Thr Thr Gly Leu Asp Leu Val Leu Arg Asn
        115                 120                 125
AsH Gly Ile Gln Asn Leu Val Val Ala Gly Phe Leu Thr Asn Cys Cys
    130                 135                 140
Val Glu Gly Thr Val Arg Ser Gly Tyr Glu Lys Gly Tyr Asp Val Val
145                 150                 155                 160
Thr Leu Thr Asp Cys Thr Ala Thr Phe Ser Asp Glu Gln Gln Arg Ala
                165                 170                 175
Ala Glu Gln Phe Thr Leu Pro Met Phe Phe Ala Asn Pro Ala Thr His
            180                 185                 190
Arg Val Ser Ala Ser Thr Glu Arg Arg Ile Lys Lys Ala Ala Thr Pro
        195                 200                 205
Ala Glu Ser Pro Leu Phe Cys Leu Gly His Ser Val Gly Ala Tyr Cys
    210                 215                 220
Ile Ser Pro Phe Pro Asn Asp Gln Ser Ser Arg Phe Thr Ser Thr Arg
225                 230                 235                 240
Leu Ile His Thr Ser Ser Leu Arg Ser Pro Val Leu Ala Trp Met Pro
                245                 250                 255
Ser Ala Met Asn Leu Lys Ala Phe Phe Thr Ser Met Leu Arg Pro Ala
            260                 265                 270
Phe His Val Thr Trp Ile Asn Thr Ile Leu Gly Val Val Thr Pro Arg
        275                 280                 285
Tyr Pro Ala Ala Gly Thr Ser Ser Ser Leu Ala Trp Arg Leu Met Ile
    290                 295                 300
Trp Asr Leu Ser Cys Ser Gly Thr Leu Ala Thr Leu Val Ile Ala Ala
305                 310                 315                 320
Tyr Thr Thr Ser Pro Met Ala Val Ala Val Ser Val Glu Val Ser Ala
                325                 330                 335
Ala Arg Ser Ile Arg Thr Lys Gly Met Asp Lys Ser
            340                 345

Claims (42)

1.一种具有编码足以指导番红菌素分子合成的多肽的可读框的基因簇。
2.一种核酸序列,其包括:
a)编码至少一种催化番红菌素生物合成的至少一个步骤的非-核糖体肽合成酶的核酸序列;
b)与a)中的序列互补的核酸序列;或者
c)a)或者b)的序列的变体或者部分。
3.权利要求2的核酸序列,其包括SEQ ID NO:1,其变体或者部分。
4.权利要求2的核酸序列,其包括sacA、sacB、sacC、sacD、sacE、sacF、sacG、sacH、sacI、sacJ、orf1、orf2、orf3或者orf4基因中的至少一个,包括其变体或者部分。
5.权利要求2的核酸序列,其中该核酸编码的多肽,与由番红菌素基因簇可读框sacA到sacJ与orf1到orf4(SEQ ID NO:1和SEQID NO:1中编码的基因)中的任何一个所编码的或者由其变体或部分所编码的多肽的氨基酸序列至少有30%同一性。
6.权利要求2的核酸序列,其编码SacA、SacB、SacC、SacD、SacE、SacF、SacG、SacH、SacI、SacJ、Orf1、Orf2、Orf3或者Orf4蛋白(SEQ ID NO:2-15),及其变体、突变体或者部分中的任何一个。
7.权利要求2的核酸序列,其编码肽合成酶、L-Tyr衍生物羟化酶、L-Tyr衍生物甲基化酶、L-Tyr O-甲基化酶、甲基-转移酶或单加氧酶或番红菌素抗性蛋白。
8.权利要求3-6中的任何一项的核酸序列,其中该部分长度为至少50个核苷酸。
9.权利要求8的核酸序列,其中该部分长度为100到5000个核苷酸。
10.权利要求8的核酸序列,其中该部分长度为100到2500个核苷酸。
11.一种杂交探针,其包括前面权利要求中的任何一项的核酸序列。
12.权利要求11的杂交探针,其包括至少10个核苷酸残基的序列。
13.权利要求11的杂交探针,其包括25到60个核苷酸残基的序列。
14.权利要求11-13中任何一项的杂交探针在检测番红菌素或海鞘素基因中用途。
15.权利要求14的用途,其中基因检测在加勒比海海鞭子中进行。
16.一种由权利要求2-10中的任何一项的核酸序列所编码的多肽。
17.权利要求16的多肽,其包括选自SEQ ID NO:2-15的氨基酸序列。
18.包括权利要求2-10中任何一项的核酸序列的载体。
19.权利要求18的载体,其是表达载体。
20.权利要求18的载体,其是粘粒。
21.用一个或多个权利要求2-10中任何一项的核酸序列转化的宿主细胞。
22.包括权利要求18-20中任何一项的载体的宿主细胞。
23.权利要求22的宿主细胞,其中该宿主细胞用包括编码足以指导番红菌素合成的多肽的基因簇的外源核酸进行转化。
24.权利要求22或23的宿主细胞,其是微生物。
25.权利要求24的宿主细胞,其是细菌。
26.一种重组细菌宿主细胞,其中破坏至少部分的权利要求2-10中任何一项的核酸序列,以获得相对于相应的非重组细菌宿主细胞,能产生改变水平的番红菌素化合物或番红菌素类似物的重组宿主细胞。
27.权利要求26的重组细胞,其中该破坏的核酸序列是内源的。
28.一种生产番红菌素化合物或番红菌素类似物的方法,包括使其中权利要求1的基因簇的拷贝数增加的生物体发酵。
29.一种生产番红菌素化合物或番红菌素类似物的方法,包括使生物体发酵,在所述生物体中编码足以指导番红菌素或番红菌素类似物合成的多肽的基因表达已经通过操作或置换一个或多个负责调节这种表达的基因或序列进行调节。
30.一种生产番红菌素化合物或番红菌素类似物的方法,包括使作为由权利要求1的番红菌素生物合成基因簇的一个或多个可读框所编码的多肽的底物的化合物与所述的多肽接触,其中该多肽化学修饰该化合物。
31.权利要求28或29的方法,其中该生物体是假单胞菌属物种。
32.包括至少一个权利要求2-10中任何一项的核酸序列的组合物。
33.权利要求32的组合物用于非-核糖体肽合成酶,二酮哌嗪环和番红菌素的一个或多个的组合生物合成的用途。
34.P2、P14、其类似物和衍生物在非-核糖体肽合成酶,二酮哌嗪环和番红菌素的一个或多个的组合生物合成中的用途。
35.一种通过权利要求28-31中的任何一项的方法可获得的番红菌素化合物。
36.权利要求35的番红菌素化合物,其中该化合物具有下式的一种:
Figure A2003801098580004C1
37.权利要求35或36的化合物用作抗肿瘤剂的用途。
38.权利要求35或36的化合物在制备治疗癌症的药物中的用途。
39.权利要求35或36的化合物用作抗微生物剂的用途。
40.权利要求35或36的化合物在制备治疗微生物感染的药物中的用途。
41.一种药物组合物,其包括权利要求35或36的化合物和药学上可接受的稀释剂、载体或赋形剂。
42.权利要求35或36的化合物在海鞘素化合物合成中的用途。
CNA2003801098581A 2002-12-20 2003-12-19 参与番红菌素生物合成的基因簇及其用于遗传工程的用途 Pending CN1753996A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB0229793.5 2002-12-20
GBGB0229793.5A GB0229793D0 (en) 2002-12-20 2002-12-20 The gene cluster involved in safracin biosynthesis and its uses for genetic engineering

Publications (1)

Publication Number Publication Date
CN1753996A true CN1753996A (zh) 2006-03-29

Family

ID=9950143

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2003801098581A Pending CN1753996A (zh) 2002-12-20 2003-12-19 参与番红菌素生物合成的基因簇及其用于遗传工程的用途

Country Status (13)

Country Link
US (1) US7723068B2 (zh)
EP (1) EP1576159B9 (zh)
JP (1) JP2006510375A (zh)
CN (1) CN1753996A (zh)
AT (1) ATE435289T1 (zh)
AU (1) AU2003290288B8 (zh)
CA (1) CA2510069A1 (zh)
DE (1) DE60328222D1 (zh)
ES (1) ES2329358T3 (zh)
GB (1) GB0229793D0 (zh)
MX (1) MXPA05006769A (zh)
RU (1) RU2385935C2 (zh)
WO (1) WO2004056998A1 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0117402D0 (en) * 2001-07-17 2001-09-05 Pharma Mar Sa New antitumoral derivatives of et-743
GB0522082D0 (en) 2005-10-31 2005-12-07 Pharma Mar Sa Formulations
US7955326B2 (en) 2006-12-29 2011-06-07 St. Jude Medical, Atrial Fibrillation Division, Inc. Pressure-sensitive conductive composite electrode and method for ablation
NZ589270A (en) * 2008-05-16 2011-12-22 Pharma Mar Sa Multiple myeloma treatments
JP2011520921A (ja) * 2008-05-16 2011-07-21 ファルマ・マール・ソシエダード・アノニマ 抗腫瘍アルカロイドとの併用療法
US9994885B2 (en) * 2014-01-22 2018-06-12 Regents Of The University Of Michigan Nonribosomal peptide synthetases
US9487763B2 (en) * 2014-01-22 2016-11-08 Regents Of The University Of Michigan Nonribosomal peptide synthetases
JOP20190254A1 (ar) 2017-04-27 2019-10-27 Pharma Mar Sa مركبات مضادة للأورام
CN114317581B (zh) * 2022-03-15 2022-06-24 中国科学院天津工业生物技术研究所 增强红色糖多孢菌的红霉素生产能力的方法及其获得的菌株

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6020000B2 (ja) * 1980-07-07 1985-05-18 ウェルファイド株式会社 新抗生物質y−16482物質およびその製造法
US6551795B1 (en) * 1998-02-18 2003-04-22 Genome Therapeutics Corporation Nucleic acid and amino acid sequences relating to pseudomonas aeruginosa for diagnostics and therapeutics
AR035842A1 (es) * 1999-05-14 2004-07-21 Pharma Mar Sa Metodo de hemisintesis para la formacion de compuestos intermediarios y derivados y de estructuras relacionadas con la ecteinascidina y de tetrahidroisoquinolinfenoles y compuestos intermediarios de aplicacion en dicho metodo

Also Published As

Publication number Publication date
EP1576159B9 (en) 2009-12-16
MXPA05006769A (es) 2005-10-05
US7723068B2 (en) 2010-05-25
EP1576159A1 (en) 2005-09-21
ATE435289T1 (de) 2009-07-15
US20060134764A1 (en) 2006-06-22
AU2003290288A1 (en) 2004-07-14
AU2003290288B8 (en) 2009-08-27
JP2006510375A (ja) 2006-03-30
AU2003290288B2 (en) 2009-07-02
US20080182302A2 (en) 2008-07-31
WO2004056998A1 (en) 2004-07-08
ES2329358T3 (es) 2009-11-25
RU2385935C2 (ru) 2010-04-10
RU2005122950A (ru) 2006-01-27
GB0229793D0 (en) 2003-01-29
EP1576159B1 (en) 2009-07-01
DE60328222D1 (de) 2009-08-13
CA2510069A1 (en) 2004-07-08

Similar Documents

Publication Publication Date Title
CN1178938C (zh) 1,2-稠合的喹啉衍生物
CN1038939C (zh) 肽类化合物的制备方法
CN1034869C (zh) 肽类化合物及其可药用盐的制备方法
CN1070492C (zh) 四环衍生物,制备方法和用途
CN1027165C (zh) 7-环取代-3-喹诺酮羧酸衍生物的制备方法
CN1165535C (zh) 抑制胃酸分泌的咪唑并吡啶衍生物
CN1247585C (zh) 取代的2-吡啶基-6,7,8,9-四氢嘧啶并[1,2-a]嘧啶-4-酮及7-吡啶基-2,3-二氢咪唑并[1,2-a]嘧啶-5(1h)酮衍生物
CN1845925A (zh) 取代的杂环化合物
CN1787823A (zh) 作为二肽基肽酶抑制剂用于治疗或预防糖尿病的3-氨基-4-苯基丁酸衍生物
CN1723281A (zh) 突变的d-氨基转移酶和使用它们生产旋光性谷氨酸衍生物的方法
CN1809564A (zh) 用作pde10抑制剂的吡咯并二氢异喹啉
CN87107938A (zh) 3-吡咯烷基硫代-1-氮杂双环[3,2,0]庚-2-烯-2-甲酸化合物及其制备方法
CN1556810A (zh) 治疗神经退化性疾病的取代的2-嘧啶基-6,7,8,9-四氢嘧啶并[1, 2-a]嘧啶-4-酮及7-嘧啶基-2,3-二氢咪唑并[1,2-a]嘧啶-5(1h)酮衍生物
CN1976931A (zh) 用以治疗炎症的β-咔啉
CN1649871A (zh) 杂芳基取代的2-吡啶基和2-嘧啶基-6,7,8,9-四氢嘧啶并[1,2-a]嘧啶-4-酮衍生物
CN1066735C (zh) 头孢菌素类抗生素
CN1918160A (zh) 用作趋化因子受体活性调节剂的新颖三环螺环衍生物
CN1087634A (zh) 7-异二氢氮杂茚基-喹诺酮衍生物和7-异二氢氮杂茚基-萘啶酮衍生物
CN1922190A (zh) 3-吡啶甲基头胞化合物
CN1095068A (zh) 二环胺衍生物
CN1753996A (zh) 参与番红菌素生物合成的基因簇及其用于遗传工程的用途
CN1098103A (zh) 新型吡啶酮羧酸衍生物
CN1035509A (zh) 头孢菌素类衍生物及其制备方法
CN1886505A (zh) 参与大环内酯类化合物的羟化作用的dna
CN1291186A (zh) 环酰胺化合物

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
AD01 Patent right deemed abandoned

Effective date of abandoning: 20060329

C20 Patent right or utility model deemed to be abandoned or is abandoned