CN1409759A - 用于卤化反应的组合物和方法 - Google Patents

用于卤化反应的组合物和方法 Download PDF

Info

Publication number
CN1409759A
CN1409759A CN00817150A CN00817150A CN1409759A CN 1409759 A CN1409759 A CN 1409759A CN 00817150 A CN00817150 A CN 00817150A CN 00817150 A CN00817150 A CN 00817150A CN 1409759 A CN1409759 A CN 1409759A
Authority
CN
China
Prior art keywords
leu
ala
gly
val
glu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN00817150A
Other languages
English (en)
Inventor
J·斯蒂芬斯
C·巴泰
J·M·迪茨
J·董
K·P·凯姆达
S·希尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Syngenta Participations AG
Original Assignee
Syngenta Participations AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Syngenta Participations AG filed Critical Syngenta Participations AG
Publication of CN1409759A publication Critical patent/CN1409759A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0012Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
    • C12N9/0036Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on NADH or NADPH (1.6)
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01NPRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
    • A01N63/00Biocides, pest repellants or attractants, or plant growth regulators containing microorganisms, viruses, microbial fungi, animals or substances produced by, or obtained from, microorganisms, viruses, microbial fungi or animals, e.g. enzymes or fermentates
    • A01N63/20Bacteria; Substances produced thereby or obtained therefrom
    • A01N63/27Pseudomonas
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8279Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/04Alpha- or beta- amino acids
    • C12P13/22Tryptophan; Tyrosine; Phenylalanine; 3,4-Dihydroxyphenylalanine
    • C12P13/227Tryptophan
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/10Nitrogen as only ring hetero atom

Abstract

本发明描述了用于卤化天然产物的生物合成的方法、转基因植物、和转基因微生物,其中卤化具有底物和区域专一性。具体而言,本发明涉及通过本发明方法生成的卤化代谢物用于保护宿主生物体免于病原体的危害(更具体的说是保护植物免于植物病原体的危害)的用途。在这方面,本发明提供了对植物病原体的抵抗力增强的转基因植物,和生物防治特性增强的生物防治生物体。

Description

用于卤化反应的组合物和方法
                       发明背景
本发明主要涉及用于卤化天然产物的生物合成的方法、转基因植物、和转基因微生物,其中卤化具有底物和区域专一性。一方面,本发明涉及通过本发明方法生成的卤化代谢物用于保护宿主生物体免于病原体的危害(更具体的说是保护植物免于植物病原体的危害)的用途。在这方面,本发明提供了对植物病原体的抵抗力增强的转基因植物,和生物防治特性增强的生物防治生物体。
长期以来认为超过2000种已知的天然发生的卤化代谢物的生物合成是两类酶的功能:卤素过氧化物酶和非血红素过氧化物酶(GribbleGW,“The natural production of chlorinated compounds”(氯化化合物的天然生成),Environ Sci Technol,28:310-319,1994;van Pee K-H,“Biosynthesis of halogenated metabolites bybacteria”(由细菌进行的卤化代谢物的生物合成),Annu RevMicrobiol,50:375-399,1996)。在第一组中,溴过氧化物酶和氯过氧化物酶都拥有原卟啉IX作为含血红素的辅基。这组酶发挥催化作用,即与过氧化氢发生反应而形成酶的氢过氧化物(化合物1),然后与卤化物(X;X=Br-、Cl-、或I-)发生反应而形成酶(E)结合中间物EOX。尚不知道EOX是否是卤化剂,或者EOX的分解是否产生活化的、半寿期较短的卤化剂X+或其衍生物(如HOX、X2、或X3 -)。但是,由这类卤化酶展示的底物专一性的缺乏和区域专一性的缺乏有力的说明,卤化发生于活性位点以外而且是由EOX的分解产物之一催化的(FranssenMCR,“Halogenation and oxidation reactions withhaloperoxi dases”(卤素过氧化物酶的卤化和氧化反应),Biocatalysis,10:87-111,1994)。
非血红素卤素过氧化物酶有两类,一类拥有钒,另一类拥有丝氨酸蛋白酶的特征性ser/Asp/His催化三联体。前一组催化依赖钒和过氧化氢的HOX形成,继而导致活性位点以外的卤化和底物专一性的显著缺乏(Franssen MCR,“Halogenation and oxidation reactions withhaloperoxidases”(卤素过氧化物酶的卤化和氧化反应),Biocatalysis,10:87-111,1994)。不含钒的非血红素卤素过氧化物酶被假定在活泼Ser残基位点处形成醋酸酯,然后在存在过氧化氢时转变成过醋酸;过醋酸将卤化物离子氧化成活化的卤化种类(PelletierI、AltenbucherJ、MattesR,“Acatalytic triad isrequ ired by the non-heme haloperoxidase to performhalogenation”(非血红素卤素过氧化物酶进行卤化需要催化性三联体),Biochim Biophys Acta,1250:149-157,1995)。同样,结果是发生不具有底物专一性或区域专一性的反应(van Pee K-H,“Biosynthesis of halogenated metabolites by bacteria”(细菌中卤化代谢物的生物合成),Annu Rev Microbiol,50:375-399,1996)。
最近描述了另外一类卤化酶基因,其产物展示对广泛天然产物进行区域专一性卤化的能力(HammerPE、Hill DS、Lam ST、van PeeK-H,Ligon JM,“Four genes from Pseudomonas fluorescens that encodethe biosynthesis of pyrrolinitrin”(来自荧光假单胞菌的编码硝吡咯菌素生物合成的四种基因),Appl Env iron Microbiol,63:2147-2154,1997)。
                       发明概述
本发明描述了以区域专一的方式将卤素转移至底物的方法,包括在存在氧化剂、卤素供体、电子转移酶、和还原剂时使底物接触区域专一性卤化酶,其中若转移发生于体内,则电子转移酶是由异源核酸分子编码的。
具体而言,描述了这样的方法:
●其中依照本发明的方法还包含FAD或FMN成份,特别是FAD
●其中电子转移酶是能够催化电子由NADH或NADPH或铁氧还蛋白转移至FAD的酶
●其中电子转移酶是能够催化电子由NADH或NADPH或铁氧还蛋白转移至区域专一性卤化酶的酶
●其中电子转移酶是黄素还原酶、铁氧还蛋白NADP还原酶、铁氧还蛋白、心肌黄酶巯基还原酶或NADH-cyt-B5还原酶、NADPH-FMN还原酶、NADPH-cyt-p450还原酶、或硝酸还原酶
●其中电子转移酶包含与依照SEQ ID NO:19、21、23、25、27、29、或31的任一氨基酸序列具有至少30%同一性的氨基酸序列
●其中电子转移酶包含SEQ ID NO:19、21、23、25、29、或31任一的氨基酸序列
●其中区域专一性卤化酶是prnA、prnC、藤黄绿脓菌素卤化酶pltA、pltD、和pltM、四环素卤化酶cts4、水解酶a、或balhimycin卤化酶bhaA
●其中区域专一性卤化酶包含SEQ ID NO:1
●其中区域专一性卤化酶是包含依照SEQ ID NO:3、5、7、9、11、13、15、或17任一的氨基酸结构域的多肽。
本发明还提供了表达与SEQ ID NO:18、10、22、24、26、28、或30任一基本相似的一种异源核酸和与SEQ ID NO:2、4、6、8、10、12、14、或16任一基本相似的至少一种异源核酸的宿主细胞,具体而言,其中
●宿主细胞是细菌、真菌、或植物细胞
●宿主细胞是微生物细胞
●宿主细胞还表达编码prnB和prnD的核酸序列。
本发明还提供了
●生成硝吡咯菌素的方法,包括培养上述宿主细胞
●保护植物免于病原体的危害的方法,包括用上述宿主细胞处理植物,由此宿主以抑制病原体的量生成硝吡咯菌素
●上述方法,还包括由宿主收集硝吡咯菌素。
本发明还提供了
●包含依照本发明的宿主细胞的植物
●保护植物免于病原体的危害的方法,包括培养上述植物,由此在植物中以抑制病原体的量生成硝吡咯菌素
●上述植物的种子
●预防真菌在农作物上生长的方法,包括培养依照本发明的植物,其中植物是农作物植物
●用于改进宿主的卤化底物生成的方法,包括在宿主中表达编码电子转移酶的异源核酸分子,其中宿主表达具有区域专一性卤化酶活性的至少一种内源多肽。
在本发明中令人惊讶的发现,区域专一性卤化酶能够在体外将卤素转移至底物,但是,为了这样做,它们需要额外的蛋白质因子即电子转移酶。这些酶在体外实现卤化需要额外蛋白质因子的现象是在PrnA的纯化中发现的,PrnA是一种D-色氨酸卤化酶,它在硝吡咯菌素的生物合成中发挥功能,而硝吡咯菌素是由荧光假单胞菌(Pseudomonas fluorescens)生成的二氯化硝基苯基吡咯抗生素。这种依赖NADH和黄素腺嘌呤二核苷酸(以下称为“FAD”)的卤化酶的纯化伴随着卤化活性的逐渐降低。在来自过度表达PrnA的荧光假单胞菌的提取物的离子交换层析过程中,可以通过加入一些缺乏PrnA的层析级分而重新激活部分纯化且无活性的PrnA。根据对加热和蛋白酶的敏感性,本文称为荧光假单胞菌P2的、负责重激活的因子后来显示是蛋白质。将PrnA纯化至均质,导致活性完全丧失,但是可以通过加入本发明的电子转移酶而恢复。
硝吡咯菌素途径中的第二种卤化酶PrnC展示与PrnA的序列的相似性,虽然与PrnA的序列相似性小于下列已知涉及卤化天然产物的生物合成的区域专一性卤化酶:藤黄绿脓菌素(参阅Nowak-Thompson B、Chaney N、Wing JS、Gould SJ、Loper JE,“Characterization ofthe pyoluteorin biosynthetic gene cluster of Pseudomonasfluorescens Pf-5”(荧光假单胞菌Pf-5的藤黄绿脓菌素生物合成基因簇的表征),J Bacteriol,181:2166-2174,1999);chloroeremomycin(参阅van Wageningen AM、Kirkpatrick PN、Williams DH、Harris BR、Kershaw JK、Lennard NJ、Jones M、JonesSJ、Solenberg PJ,“Sequencing and analysis of genes involvedin the biosynthesis of a vancomycin group antibiotic”(涉及一种万古霉素组抗生素的生物合成的基因的测序和分析),Chem Biol,5:155-162,1998);balhimycin(参阅Pelzer S、Sussmuth R、Heckmann D、Recktenwald J、Huber P、Jung G、Wohlleben W,“Identification and analysis of the balhimycin biosyntheticgene cluster and its use for manipulating glycopeptidebiosynthesis in Amycolatopsis mediterranei DSM5908”(balhimycin生物合成基因簇的鉴定和分析及其在地中海拟无枝酸菌DSM5908中操作糖肽生物合成的用途),Antimicrob AgentsChemother,43:1565-1573,1999和Pelzer S、Reichert W、HuppertM、HeckmannD、WohllebenW,“Cloning and analysis of a peptidesynthetase gene of the balhimycin producer Amycolatopsismedi terranei DSM5908 and development of a genedisruption/replacement system”(balhimycin生产者地中海拟无枝酸菌DSM5908的肽合成酶基因的克隆和分析及基因破坏/取代系统的开发),J Biotechnol,56:115-128,1997);和氯四环素(参阅Dairi T、Nakano T、Mizukami T、Aisaka K、Hasegawa M、KatsumataR,“Conserved organization of genes for biosynthesis ofchlorotetracycline in Streptomyces strains”(链霉菌菌株中氯四环素生物合成基因的保守组织),Biosci Biotechnol Biochem,59:1360-1361,1995和DairiT、NakanoT、AisakaK、KatsumataR、HasegawaM,“Cloning and nucleotide sequence of the generesponsible for chlorination of tetracycline”(负责四环素氯化的基因的克隆和核苷酸序列),Biosci Biotechnol Biochem,59:1099-1106,1995)。与PrnA相似,PrnC的纯化也伴随着卤化活性的丧失,但是可以通过加入本发明的电子转移酶而恢复。
硝吡咯菌素途径先前显示在大肠杆菌中发挥功能,此时表达编码PrnA、PrnB、PrnC、和PrnD的硝吡咯菌素操纵子(硝吡咯菌素操纵子的核苷酸序列请参阅美国专利号5,723,759中叙述的5.8X/N,完整收入本文作为参考)。PrnA和PrnC发挥卤化酶的功能;PrnB催化色氨酸的吲哚基重排至氨基苯基吡咯;而PrnD将氨基苯基氧化成硝基苯基取代基。在本发明中令人惊讶的发现,当本发明的电子转移酶大肠杆菌黄素还原酶(以下称为“Fre”)在这种情况下过度表达时,硝吡咯菌素的体内生成显著增强。
通过向纯化且无活性的PrnA中加入大肠杆菌提取物,在大肠杆菌中证实了“P2样活性”的存在。然后通过离子交换、羟基磷灰石、和凝胶渗透柱层析,部分纯化了大肠杆菌P2样活性。用胰蛋白酶处理含该活性的柱级分和无活性的侧翼级分,随后通过质谱进行分离;由在有活性的、含大肠杆菌P2样活性的级分中存在的肽扣除在无活性的级分中鉴定的肽,剩余的肽称为大肠杆菌基因组数据库。由此,唯一鉴定了一种核酸序列,即依赖NADH的黄素还原酶(以下称为“fre”,Genbank编号23486)。
正如下文详述将明确描述的,然后克隆并过度表达大肠杆菌fre,过度表达细胞显示大肠杆菌P2样活性增加,而且与黄素还原酶活性的增加成正比例。将fre与硝吡咯菌素操纵子在分开的质粒上共转染到大肠杆菌中。包含这两种质粒的细胞生成的硝吡咯菌素或硝吡咯菌素代谢物显著高于只包含硝吡咯菌素操纵子的细胞,确认了Fre作为PrnA和PrnC的辅助因子的身份,并指示在大肠杆菌中黄素还原酶活性是限制硝吡咯菌素生成的主要因子。
在本发明的一个实施方案中,提供了以区域专一的方式将卤素转移至底物的方法,包括在存在氧化剂、卤素供体、电子转移酶、和还原剂时使底物接触区域专一性卤化酶,其中若转移发生于体内,则电子转移酶对宿主而言是异源的。
在本发明的另一个实施方案中,提供了以区域专一的方式将卤素转移至底物的方法,包括在存在氧化剂、卤素供体、电子转移酶、还原剂、和FAD或FMN时使底物接触区域专一性卤化酶,其中若转移发生于体内,则电子转移酶对宿主而言是异源的。在特别优选的实施方案中,反应导致硝吡咯菌素的生成。
在一个优选的实施方案中,电子转移酶是能够催化电子由NADH或NADPH或铁氧还蛋白转移至FAD的酶,或者电子转移酶是能够催化电子由NADH或NADPH或铁氧还蛋白转移至区域专一性卤化酶的酶。
在一个优选的实施方案中,电子转移酶的氨基酸序列与NADPH-FMN还原酶、大鼠肝NADPH-cyt-P450还原酶、菠菜铁氧还蛋白NADP还原酶、细胞色素b5还原酶、或亚硝酸还原酶至少30%同一、优选40%同一、更优选50%同一、更优选60%同一、更优选70%同一、更优选80%同一、或更优选90%同一。
在一个优选的实施方案中,区域专一性卤化酶的氨基酸序列与来自荧光假单胞菌(Pseudomonas fluorescens)的PrnA、PrnC、藤黄绿脓菌素卤化酶PltA、PltD、和PltM、来自金霉素链霉菌(Streptomyces aurofaciens)的四环素卤化酶cts4、来自东方拟无枝酸菌(Amycolatopsis orientalis)的水解酶、或来自地中海拟无枝酸菌(Amycolatopsis mediterranei)的balhimycin卤化酶bhaA至少30%同一、优选40%同一、更优选50%同一、更优选60%同一、更优选70%同一、更优选80%同一、或更优选90%同一。
在一个优选的实施方案中,提供了表达与本发明电子转移酶的核酸基本相似的异源核酸并表达编码本发明区域专一性卤化酶的异源核酸的宿主细胞。在一个优选的实施方案中,宿主细胞是细菌、真菌、或植物细胞。
在一个优选的实施方案中,提供了表达编码prnA、prnB、prnC、prnD、和fre的异源核酸分子的宿主细胞。
在一个优选的实施方案中,提供了通过培养宿主细胞来生成硝吡咯菌素的方法,可包括表达编码prnA、prnB、prnC、prnD、和fre的异源核酸分子的植物细胞。
在一个优选的实施方案中,提供了包含本发明宿主细胞的植物,所述宿主细胞表达与编码本发明电子转移酶的核酸基本相似的异源核酸并表达编码本发明区域专一性卤化酶的异源核酸。
在一个优选的实施方案中,提供了表达编码本发明的prnA、prnB、prnC、prnD、和电子转移酶的异源核酸分子的植物。
                       序列简述SEQ ID NO:1是本发明的区域专一性卤化酶中存在的保守氨基酸基元。SEQ ID NO:2是编码来自荧光假单胞菌的PrnA的核酸序列。SEQ ID NO:3是来自荧光假单胞菌的PrnA的氨基酸序列。SEQ ID NO:4是编码来自荧光假单胞菌的PrnC的核酸序列。SEQ ID NO:5是来自荧光假单胞菌的PrnC的氨基酸序列。SEQ ID NO:6是编码来自荧光假单胞菌的PltA的核酸序列。SEQ ID NO:7是来自荧光假单胞菌的PltA的氨基酸序列。SEQ ID NO:8是编码来自荧光假单胞菌的PltD的核酸序列。SEQ ID NO:9是来自荧光假单胞菌的PltD的氨基酸序列。SEQ ID NO:10是编码来自荧光假单胞菌的PltM的核酸序列。SEQ ID NO:11是来自荧光假单胞菌的PltM的氨基酸序列。SEQ ID NO:12是编码来自东方拟无枝酸菌的水解酶A的核酸序列。SEQ ID NO:13是来自东方拟无枝酸菌的水解酶A的氨基酸序列。SEQ ID NO:14是编码来自金霉素链霉菌的cts4的核酸序列。SEQ ID NO:15是来自金霉素链霉菌的cts4的氨基酸序列。SEQ ID NO:16是编码来自地中海拟无枝酸菌的bhaA的核酸序列。SEQ ID NO:17是来自地中海拟无枝酸菌的bhaA的氨基酸序列。SEQ ID NO:18是编码来自大肠杆菌的Fre的核酸序列。SEQ ID NO:19是来自大肠杆菌的Fre的氨基酸序列。SEQ ID NO:20是编码来自大鼠的NADH细胞色素b5还原酶的核酸序列。SEQ ID NO:21是来自大鼠的NADH细胞色素b5还原酶的氨基酸序列。SEQ ID NO:22是编码来自兔的NADPH-cyt-p450还原酶的核酸序列。SEQ ID NO:23是来自兔的NADPH-cyt-p450还原酶的氨基酸序列。SEQID NO:24是编码来自蔬菜沙门氏菌(S.oleracea)的铁氧还蛋白的核酸序列。SEQ ID NO:25是来自蔬菜沙门氏菌的铁氧还蛋白的氨基酸序列。SEQ ID NO:26是编码来自费氏弧菌(Vibriofischeri)的NADPH-FMN还原酶的核酸序列。SEQ ID NO:27是来自费氏弧菌的NADPH-FMN还原酶的氨基酸序列。SEQ ID NO:28是编码来自蔬菜沙门氏菌的铁氧还蛋白-NADP还原酶的核酸序列。SEQ ID NO:29是来自蔬菜沙门氏菌的铁氧还蛋白-NADP还原酶的氨基酸序列。SEQ ID NO:30是编码来自寄生曲霉(Aspergullus parasiticus)的硝酸还原酶的核酸序列。SEQ ID NO:31是来自寄生曲霉的硝酸还原酶的氨基酸序列。SEQ ID NO:32是用于大肠杆菌黄素还原酶的引物。SEQ ID NO:33是用于大肠杆菌黄素还原酶的引物。SEQ ID NO:34是质粒pNOV523。SEQ ID NO:35是pNOV524。
                        发明详述体外卤化天然产物的生成
依照本发明,可以通过在存在卤素供体、氧化剂、还原剂、和本发明的电子转移酶时使区域专一性卤化酶与底物发生反应而在体外生成卤化天然产物。
本发明的区域专一性卤化酶是能够与卤化物、氧化剂、和还原系统相互作用而在生物学卤化反应过程中催化一个或多个碳-卤素键取代一个或多个碳-氢键,且具有底物和/或区域专一性的卤化酶。区域专一指碳-卤素键只于底物的特定位置形成。
本发明优选的区域专一性卤化酶包括包含如下保守基元并在特定位置催化至少一个碳-卤素键取代碳-氢键的卤化酶:X1-W-X2-W-X3-I-P-X4(SEQ ID N0:1),其中X1是G或T;X2是V、L、T、F、或M;X3是任意氨基酸残基;X4是I、F、M、或L。
在一个优选实施方案中,本发明的卤化酶包括色氨酸卤化酶。本发明的色氨酸卤化酶包括PrnA(SEQ ID NO:3)(参阅蛋白质编号#AAB97504;Hammer PE、Burd W、Hill DS、Ligon JM、van Pee K,“Conservation of the pyrrolnitrin biosynthetic gene clusteramong six pyrrolnitrin-producing strains”(六种硝吡咯菌素生成菌株中硝吡咯菌素生物合成基因簇的保守性),FEMS MicrobiolLett,180(1):39-44,1999年11月1日)和与SEQ ID NO:3优选具有90%同一性、80%同一性、70%同一性、60%同一性、50%同一性、或40%同一性的区域专一性卤化酶。在本中请书全文中所用的氨基酸序列之间的同一性百分比是通过BASTP 2.09程序(可以由http://www.ncbi.nlm.nih.gov/gorf/bl2.html获得)测定的,参数设置是:评分矩阵=blosum62,缺口开口罚分=7,缺口延伸罚分=2,x_dropoff=50,预期(expect)=10.00,字长(wordsize)=3。
在另一个优选实施方案中,本发明的区域专一性卤化酶包括单氯氨基硝吡咯菌素(monochchloroaminopyrrolnitrin)卤化酶。单氯氨基硝吡咯菌素卤化酶包括PrnC(SEQ ID NO:5)(参阅蛋白质编号#AAB97506)和与其优选具有90%同一性、80%同一性、70%同一性、60%同一性、50%同一性、或40%同一性的区域专一性卤化酶。
在本发明的一个特别优选的实施方案中,本发明的区域专一性卤化酶包括与来自荧光假单胞菌的prnA(SEQ ID NO:3)、prnC(SEQ IDNO:5)、藤黄绿脓菌素卤化酶pltA(SEQ ID NO:7)、pltD(SEQ IDNO:9)、和pltM(SEQ ID NO:11)、来自金霉素链霉菌的四环素卤化酶cts4(SEQ ID NO:15)、来自东方拟无枝酸菌的水解酶a(SEQ IDNO:13)、来自地中海拟无枝酸菌的balhimycin卤化酶bhaA(SEQ ID NO:17)中的任一种30%同一、优选40%同一、更优选50%同一、更优选60%同一、更优选70%同一、更优选80%同一、更优选90%同一、更优选95%同一、或更优选99%同一的任何卤化酶,包括下表中鉴定的卤化酶:
编号#  蛋白质编号  名称 生物体
PFU74493_1  AAB97504  PrnA 荧光假单胞菌134
AF161184_1  AAD46365  PrnA 荧光假单胞菌CHAO
AF161182_1  AAD46360  PrnA 致金色假单胞菌(Pseudomonas aureofaciens)
AF161186_1  AAD46370  PrnA 吡咯伯克霍尔德氏菌(Burkholderia pyrrocinia)
AF161183_1  AAD46361  PrnA 洋葱伯克霍尔德氏菌(Burkholderia cepacia)
AF161185_4  AAD46369  PrnA 橙色粘球菌(Myxococcus fulvus)
PFU74493_3  AAB97506  PrnC 荧光假单胞菌134
AF161183_3  AAD46363  PrnC 洋葱伯克霍尔德氏菌
AF161186_3  AAD46372  PrnC 吡咯伯克霍尔德氏菌
AF161185_2  AAD46367  PrnC 橙色粘球菌
STMCTS_3  BAA07389  cts4四环素卤化酶 金霉素链霉菌
AF081920  AAD24884  PltA 荧光假单胞菌
AF081920  AAD24878  PltD 荧光假单胞菌
AF081920  AAD24882  PltM 荧光假单胞菌
AOPCZA361_2  CAA11780  非血红素加氧酶/卤化酶 东方拟无枝酸菌
AMOXYAE_4  CAA76550  bhaA 地中海拟无枝酸菌
U84350  AAB49297  假设的羟化酶a 东方拟无枝酸菌
本发明的电子转移酶可包括通过依赖NAD(P)H的氧化还原酶或氧化还原酶及其它电子供体(诸如叶绿体光合系统、乳酸盐、黄嘌呤等),能够将电子由NADH或NADPH或铁氧还蛋白或其它还原剂转移至FAD或FMN的电子转移酶,或者能够将电子由NADH或NADPH或铁氧还蛋白或其它还原剂转移至卤化酶的电子转移酶。
可以通过选择这样的电子转移酶来确定本发明的电子转移酶,其中可以通过监控NADH或NADPH或铁氧还蛋白的氧化(通过与还原剂的氧化有关的吸光度的特征性变化)来检测电子转移。这种变化(或变化速率的增加)依赖FAD或FMN的存在。可以通过监控340nm的吸光度来检测NADH和NADPH的氧化;氧化导致吸光度降低。可以通过监控420nm的吸光度来检测铁氧还蛋白的氧化;氧化导致吸光度升高。还可以通过监控NADH或NADPH的氧化(通过340nm处的激发、>380nm处的发射的荧光特征性降低)来检测电子转移。这种荧光降低依赖FAD或FMN的存在。
还可以通过选择这样的电子转移酶来确定本发明的电子转移酶,其中可以通过混合电子转移酶与50μmolar NADH或50μmolar NADPH、包含或不含50μmolar卤化酶(卤化酶必须是全酶的状态,即早已结合了所有必需的辅因子,诸如FAD)并观察依赖卤化酶的NADH或NADPH氧化速率的增加来鉴定由NADH或NADPH向本发明区域专一性卤化酶的电子转移;其中通过340nm处吸光度的降低或上述荧光的降低来测量氧化。
可以通过选择这样的电子转移酶来确定本发明的电子转移酶,其中可以通过混合电子转移酶与50mol还原型铁氧还蛋白、包含或不含50μmol卤化酶(卤化酶必须是全酶的状态,即早已结合了所有必需的辅因子,诸如FAD)并观察依赖卤化酶的氧化速率的增加来鉴定由铁氧还蛋白向卤化酶的电子转移;通过340nm吸光度的增加来测量铁氧还蛋白的氧化。
在本发明的优选实施方案中,电子转移酶与下列任一至少30%同一、优选40%同一、更优选50%同一、更优选60%同一、更优选70%同一、更优选80%同一、更优选90%同一、或同一:包含SEQ ID NO:19的氨基酸序列的大肠杆菌黄素还原酶(描述于FieschiF、NiviereV、Frier C、Decout JL、Fontecave M,“The mechanism and substratespecificity of the NADPH:flaVin oxidoreductase fromEscherichia coli”(来自大肠杆菌的NADPH:黄素氧化还原酶的机制和底物专一性),J Biol Chem,270(51):30392-30400,1995年12月22日);依照Richarme G,“Purification of a new dihydrolipoamidedehydrogenase from Escherichia coli”(来自大肠杆菌的一种新的二氢硫辛酰胺脱氢酶的纯化),J Bacteriol,171(12):680-685,1989年12月纯化的心肌黄酶巯基还原酶;NADH细胞色素b5还原酶(SEQID NO:21)(描述于Barber MJ、Quinn GB,“High-level expressionin Escherichial coli of soluble,catalytic domain of rat hepaticcytochrome b5 reductase”(大鼠肝细胞色素b5还原酶的可溶性催化结构域在大肠杆菌中的高水平表达),Protein Expr Purif,8(1):41-47,1996年8月;来自大鼠的NADPH-cyt-P450还原酶(SEQ ID NO:23)、来自蔬菜沙门氏菌的铁氧还蛋白-NADP还原酶(SEQ ID NO:29)、来自蔬菜沙门氏菌的铁氧还蛋白(SEQ ID NO:25)、来自寄生曲霉的硝酸还原酶(SEQ ID NO:31)、和来自费氏弧菌的NAD(P)H-FMN还原酶(SEQ ID NO:27)(描述于Zenno S、SaigoK,“Identificationof the genes encoding NAD(P)H-flavin oxidoreductases that aresimi lar in sequence to Escherichia coli Fre in four species ofluminous bacteria:Photorhabdus luminescens,Vibrio fischeri,Vibrio harveyi,and Vibrio orientails”(四种发光细菌(发光光杆状菌、费氏弧菌、哈氏弧菌、和东方弧菌)中序列与大肠杆菌Fre相似的NAD(P)H-黄素氧化还原酶的编码基因的鉴定),J Bacteriol),176(12):3544-3551,1994年6月)。可以以提取物或纯化形式使用本发明的电子转移酶。
在特别优选的实施方案中,本发明的电子转移酶与SEQ ID NO:21、23、25、27、29、或31任一至少30%同一、优选40%同一、更优选50%同一、更优选60%同一、更优选70%同一、更优选80%同一、更优选90%同一,而且在任一上述测试中电子转移测试为阳性。
还原剂的选择,诸如吡啶核苷酸,如还原型烟酰胺腺嘌呤二核苷酸或还原型烟酰胺腺嘌呤二核苷酸磷酸或还原型铁氧还蛋白,取决于本发明电子转移酶的选择。一般而言,本发明的所有电子转移酶对一种吡啶核苷酸具有高度催化活性,但通常对另一种吡啶核苷酸具有一些活性。因而,如果出于其它考虑而希望这样,那么可以在特定电子转移酶的卤化反应中使用非优选的吡啶核苷酸。每种电子转移酶的优选吡啶核苷酸如下:NADPH是NADPH-cyt-P450还原酶和铁氧还蛋白NADP还原酶的优选吡啶核苷酸;NADH是大肠杆菌黄素还原酶、NADH-cyt-b5还原酶、硝酸还原酶、和心肌黄酶巯基还原酶的优选吡啶核苷酸。
铁氧还蛋白NADP还原酶还可使用还原型铁氧还蛋白,它可以通过植物、分离叶绿体、或含叶绿体片段的光合系统I的光照而生成。铁氧还蛋白还可以由依赖铁氧还蛋白的脱氢酶还原,诸如丙酮酸:铁氧还蛋白氧化还原酶(Horner DS、Hirt RP、Embley TM,“A single eubacterialorigin of eukaryotic pyruvate:ferredoxin oxidoreductase genes:implications for the evolution of anaerobic eukaryotes”(真核生物丙酮酸:铁氧还蛋白氧化还原酶基因的单一真细菌起源:厌氧真核生物进化的暗示),Mol Biol Evol,16(9):1280-1291,1999年9月)。
在优选的实施方案中,可以在体外反应中包含FAD以增加反应效率。在特别优选的实施方案中,反应包含FAD,而且选择的区域专一性卤化酶是PrnA。
在候选实施方案中,本发明包括联合卤化酶(其中卤化酶是纯化的本发明区域专一性卤化酶)与底物卤素离子诸如Cl-,和活性氧供体诸如H2O2、KIO4、亚碘酰苯、亚碘酰基苯甲酸(盐)、叔丁基过氧化氢、过氧化苯甲酰、氢过氧化枯烯(cumene hydroperoxide)、过氧化二异丙苯(dicumyl peroxide)、过氧乙酸、或近似化合物。活性氧供体省却了供给O2和还原剂的需要。
本发明的底物将取决于选择的本发明区域专一性卤化酶。本发明的底物可包括色氨酸、吲哚、氨基苯基吡咯、及其衍生物、和四环素,bhaA的底物包括balhimycin底物种类B1-1、B1-2、B2-1、B2-2、和B3的所有化合物(描述于PelzerS、SussmuthR、HeckmannD、RecktenwaldJ、HuberP、JungG、WohllebenW,“Identification and analysisof the balhimycin biosynthetic gene cluster and  its use formanipulating glycopeptide biosynthesis in Amycolatopsismediterranei DSM5908”(balhimycin生物合成基因簇的鉴定和分析及其在地中海拟无枝酸菌DSM5908中操作糖肽生物合成的用途),Antimicrob Agents Chemother,43:1565-1573,1999)。
可以以无机或有机阳离子的盐或其相应的酸的形式向反应供给可用于本发明的卤素供体。本发明的卤素供体可提供F-、Cl-、Br-、或I离子。
可以在pH4-10、温度0-65℃的缓冲液中进行本发明的反应。可以以盐的形式加入卤素供体,如氯化物盐类可包括LiCl、NaCl、KCl、CsCl、MgCl2、CaCl2、和NH4Cl。反应时间可以在1分钟-48小时之间变化。最佳条件是pH7.5、温度30℃、反应时间12小时。
可以通过共价偶联电子转移酶与卤化酶,使得由还原剂向卤化酶的电子转移成为一级过程而非二级过程(就卤化酶浓度而言),从而提高体外卤化的催化效率。可以通过遗传工程构建包含本发明的电子转移酶和区域专一性卤化酶的融合蛋白(通过在同一读码框中融合它们的编码区)来获得相同结果。可以使用或不用编码将电子转移酶和卤化酶蛋白质结构域分隔开来的短肽序列的间插序列来进行融合。可以以两种取向构建融合蛋白:(1)N端-电子转移酶-(任选的接头)-卤化酶-C端;(2)N端-卤化酶-(任选的接头)-电子转移酶-C端。
在本发明的另一个实施方案中,可以将包含区域专一性卤化酶和电子转移酶的系统的蛋白质成份进行固定,正如下文进一步所述,使之与底物反应而生成产物。卤化酶和电子转移酶可以作为共固定的单独酶使用,或者作为具有电子转移酶和卤化酶活性的融合蛋白(其中两种成份的编码序列融合在一起而生成单一蛋白质)使用。系统中可以包含额外酶和适当的第二还原剂以再生NADH或NADPH。这种酶和第二还原剂配对的范例包括:乙醇脱氢酶与乙醇、葡萄糖-6-磷酸脱氢酶与葡萄糖-6-磷酸、醛脱氢酶与乙醛、硫辛酰胺脱氢酶与还原型硫醇(诸如硫辛酰胺、二硫苏糖醇、或巯基磺酸)。
在这个实施方案中,可以通过几种方法将酶(将包括NADH或NADPH再生系统的酶,如果使用这种系统的话)进行固定。范例包括:(1)将酶置于具有半透膜(透析膜)的容器内,所述半透膜允许底物和核苷酸通过,但是酶不能通过;(2)将酶共价附着于不溶性基质;(3)经针对酶的抗体或针对酶所融合的抗原的抗体使酶结合基质;(4)经生物素和生物素结合结构域(诸如亲和素)使酶结合基质;(5)使酶周围的基质聚合(诸如异丁烯酸酯聚合物)。
然后可以将固定的酶暴露于含还原剂、第二还原剂(如果使用NAD(P)H再生系统的话)、底物、和卤化物盐的缓冲液。可以包含有机溶剂以促进底物的溶解。典型条件包括pH4-10、0-65℃。生成足够的卤化产物后,由反应混合液提取卤化天然产物。异源宿主中卤化天然产物的生成
可以在细菌或真菌宿主中表达编码本发明电子转移酶的异源核酸分子,从而能够以比天然宿主的可能更高的效率进行天然产物的卤化生产。例如,为了增强天然产物生产,可以在硝吡咯菌素生产者诸如荧光假单胞菌、吡咯伯克霍尔德氏菌、橙色粘球菌、洋葱伯克霍尔德氏菌、致金色假单胞菌,藤黄绿脓菌素生产者诸如荧光假单胞菌,万古霉素类抗生素生产生物体诸如各种拟无枝酸菌物种诸如东方拟无枝酸菌和地中海拟无枝酸菌,和氯四环素生产者金霉素链霉菌,或其它抗生素生产链霉菌物种中表达编码本发明电子转移酶的异源核酸分子。
另外,可以在细菌或真菌宿主中共表达编码区域专一性卤化酶和电子转移酶的异源核酸分子,从而能够进行或增加卤化天然产物的生产。在有些情况下,本发明卤化天然产物的合成将只需要一个生物合成步骤,即卤化步骤,因而将要表达的唯一异源核酸分子将是包含本发明卤化酶和电子转移酶的编码序列的异源核酸分子。在其它情况下,生成卤化天然产物的生物合成途径将包含一个或多个卤化步骤作为其中一部分。在这种情况下,将表达多种异源核酸分子。
术语“异源核酸分子”在用于本申请书全文时指与它所导入的宿主细胞天然无关的核酸分子,包括遗传构建物、天然发生核酸分子的非天然发生多拷贝;和可操作连接非天然核酸分子的原本同源的核酸分子。
在广义上,术语“基本相似”在用于本申请书全文中的核酸分子方面时指对应于参考核苷酸序列的核酸分子,其中相应的核酸分子编码的多肽与参考核苷酸序列编码的多肽具有基本相同的结构和功能,如其中只发生不影响多肽功能的氨基酸变化。理想的是,基本相似的核酸分子编码由参考核苷酸序列编码的多肽。术语“基本相似”明确的意欲包括其序列经修饰而使得在特定细胞中的表达最优化的核酸分子。基本相似的核酸分子与参考核苷酸序列之间的同一性百分比理想的是至少30%、优选至少45%、更希望是至少65%、更希望是至少75%、优选至少85%、更优选至少90%、仍更优选至少95%、仍然更优选至少99%同一。序列比较是使用Smith-Waterman序列比对算法(参阅如Waterman MS,《Introduction to Computational Biology:Maps,sequences and genomes》(计算生物学入门:图谱、序列、和基因组),Chapman & Hall,伦敦,1995,ISBN 0-412-99391-0;或http://www-hto.usc.edu/software/seqaln/index.html)进行的。使用局部S程序1.16版,参数如下:匹配=1,错配罚分=0.33,缺口开放罚分(open-gap penalty)=2,缺口延伸罚分(extended-gappenalty)=2。
与参考核苷酸序列“基本相似”的核酸分子与参考核苷酸序列在下列条件下发生杂交:在7%十二烷基磺酸钠(SDS)、0.5M NaPO4、1mMEDTA中于50℃杂交,在2xSSC、0.1%SDS中于50℃清洗;更理想的是在7%十二烷基磺酸钠(SDS)、0.5M NaPO4、1mM EDTA中于50℃杂交,在1x SSC、0.1%SDS中于50℃清洗;更理想的是仍在7%十二烷基磺酸钠(SDS)、0.5M NaPO4、1mM EDTA中于50℃杂交,在0.5x SSC、0.1%SDS中于50℃清洗;优选在7%十二烷基磺酸钠(SDS)、0.5M NaPO4、1mM EDTA中于50℃杂交,在0.1x SSC、0.1%SDS中于50℃清洗;更优选在7%十二烷基磺酸钠(SDS)、0.5M NaPO4、1mM EDTA中于50℃杂交,在0.1x SSC、0.1%SDS中于65℃清洗。在上述条件下发生杂交的本发明多核苷酸优选包含至少80碱基对、更优选至少50碱基对、特别是至少21碱基对、和更特别是18碱基对。
这些遗传操作的技术对于不同的可利用宿主是特异的,在本领域是知道的。例如,表达载体pKK223可用于在大肠杆菌中以转录或翻译融合的方式在tac启动子之后表达异源基因。对于编码多个开放读码框(以下称为“ORF”)的操纵子的表达,最简单的流程是以转录融合的方式将操纵子插入载体诸如pKK233,从而使得使用异源基因的同源核糖体结合位点。在革兰氏阳性物种诸如芽孢杆菌属(Bacillus)中过度表达的技术在本领域是知道的,而且可用于本发明的内容(Quax等人,在Baltz等人编的《Industrial Microorganisms:Basic andApplied Molecular Genetics》(工业微生物:分子遗传学基础和应用)一书中,Ameri can Society for Microbiology(美国微生物学学会),华盛顿,1993)。过度表达的候选系统依赖酵母载体,包括毕赤酵母属(Pichia)、酵母属(Saccharomyces)、和克鲁维酵母属(Kluyveromyces)的使用(Sreekrishna,在Baltz、Hegeman、和Skatrud编的《Industrial Microorganisms:Basic and AppliedMolecular Genetics》(工业微生物:分子遗传学基础和应用)一书中,American Society for Microbiology(美国微生物学学会),华盛顿,1993;Dequin和Barre,Biotechnology,12:173-177,1994;van den Berg等人,Biotechnology,8:135-139,1990)。
这些卤化天然产物中的有些在抑制微生物生长中可能是有效的,特别是致植物病微生物。可以由过度表达卤化酶和/或电子转移酶的生物体生产卤化天然产物,适用于该目的的生物体包括革兰氏阴性和革兰氏阳性的细菌和酵母,以及下文将更详细描述的植物。为了卤化天然产物的生产目的,选择宿主生物体的重要标准是易于操作、快速生长(即在微生物的情况下是发酵)、和缺乏对过度生成的卤化天然产物的敏感性。卤化天然产物的这些生产方法相比于卤化天然产物制备中常用的化学合成技术具有显著优势。本文所述方法的应用将可提高通过发酵生产卤化天然产物的效率和产量,而且将可用于在天然产物中先前不存在的且合成将难以实现的位置导入新的卤素原子。
相比于化学合成的一些优势是生产成本更便宜,和合成区域专一性卤化的优选化合物的能力。掺入电子转移酶可提高卤化产物的效率和产量。另外,使用具有期望的底物和区域专一性的天然发生卤化酶,或者使用具有新的底物和区域专一性的改造后卤化酶,可以通过向已知天然产物中添加卤素来生成新的卤化产物。使用化学手段将很难卤化具有区域专一性和对映体专一性的许多天然产物,例如大环内酯、聚酮、和非核糖体肽。芳基或烷基的卤化所需要的条件将通常引起天然产物的其它结构变化。
卤化酶还可生成对映异构方面纯的产物(在前手性碳卤化的情况下),这与有机合成通常产生的外消旋混合物相反。生成立体化学适当的化合物的能力对于具有许多手性碳原子的分子是特别重要的。由异源宿主生成的卤化天然产物可用于许多目的,包括医学(即控制病原体和/或传染病)和农业应用。
当卤化产物的生成需要超过一种酶时,可以在单一生物体中表达编码目的卤化产物生物合成的酶的核酸分子。在一个优选的实施方案中,将所有编码生产天然产物所需要的酶的核酸序列整合到生物体的染色体中,作为单一操纵子,并受到合适调控元件的控制。在另一优选实施方案中,可以在具有选择标记的质粒上携带核酸序列。另一个候选的优选实施方案包括在两种或更多相容质粒上表达所需核酸序列,或者可以将所需核酸序列分配到染色体和一种或更多相容质粒中。可以通过天然产物生物合成核酸编码序列的天然调控元件或者通过为了更精确的控制该途径核酸序列的表达而选择的启动子来控制核酸分子的表达。任选的是,操纵子中将包含电子转移酶核酸序列,以及编码本发明的区域专一性卤化酶(或卤化酶)的核酸序列。或者,可以分开表达电子转移酶序列。
本发明用于生产卤化产物的另一种方法包括在两种或更多的分开生物体中分配生物合成途径的核酸分子。可以分开培养生物体,将一种培养物生成的生物合成中间物转移至表达生物合成途径随后步骤的另一种培养物中。或者,可以共培养生物体,根据需要,中间物由一种生物体传递至另一种生物体。在任何这些应用中,每种卤化酶都需要在相同的生物体中、在相同的亚细胞位置共表达合适的电子转移酶。
可以通过将卤化酶导入早已表达生成目的未卤化结构所需要的基因的生物体来生成新的卤化产物。可以改造卤化酶以具有对完成结构中特定位点的专一性,或者它可具有对在天然生物体中随后掺入最终结构的结构成份的专一性。例如,可以改造卤化酶以专一性卤化随后将掺入含肽抗生素的氨基酸。于是,得到的产物可以在天然产物中未发现的位置拥有新的卤素修饰。
在任何上述系统中,可以通过融合编码电子转移酶和区域专一性卤化酶的核酸序列从而生成具有两种功能性的融合蛋白来实现卤化效率的显著优势;这种融合可导致电子以更高效率由还原剂转移至卤化酶。电子转移酶核酸序列可以融合在卤化酶的5’或3’端。可以在融合中掺入连接短肽(接头)的编码序列,将电子转移酶和卤化酶蛋白质结构域的编码序列分隔开来;接头的长度可以在1-30个氨基酸残基之间变化。
还可以在异源细菌和真菌宿主中表达本发明的卤化酶和/或电子转移酶以生成卤化天然产物,目的是提高这些细菌和真菌宿主的生物防治菌株的功效。适合于抗病原体卤化天然产物的异源过度表达的微生物是能够在植物或根际定居的所有微生物。由此它们将接触致植物病的真菌、细菌、和线虫,引起对病原体生长的抑制。这些病原体包括革兰氏阴性微生物诸如假单胞菌属、肠杆菌属(Enterobacter)、和沙雷氏菌属(Serratia),革兰氏阳性微生物芽孢杆菌属,和真菌木霉属(Trichoderma)和粘帚霉属(Gliocladium)。特别优选的异源宿主是荧光假单胞菌、恶臭假单胞菌(Pseudomonas putida)、洋葱假单胞菌、致金色假单胞菌、桔橙假单胞菌(Pseudomonasaurantiaca)、阴沟肠杆菌(Enterobacter cloacae 、粘质沙雷氏菌(Serratia marcescens)、枯草芽孢杆菌(Bacillus subtilis)、蜡状芽孢杆菌(Bacillus cereus)、绿色木霉(Trichoderma viride)、Trichoderma harzianum、和绿粘帚霉(Gliocladium virens)。
异源生物防治菌株中的表达需要选择适合于在选定宿主中复制的载体和选择合适的启动子。用于在革兰氏阴性和革兰氏阳性细菌和真菌中表达的技术在本领域是众所周知的,而且在本申请书的其它章节有所描述。转基因植物中卤化产物的生成
在转基因植物中表达本发明的卤化酶和/或电子转移酶,由此引起选定卤化天然产物在转基因植物中的生物合成。在有些情况下,本发明的卤化天然产物将只需要一个生物合成步骤,即卤化步骤,因而将要表达的唯一异源核酸分子将是包含本发明的区域专一性卤化酶和电子转移酶的编码序列的异源核酸分子。在其它情况下,生成卤化天然产物的生物合成途径将包含一个或多个卤化步骤作为其中一部分。在这种情况下,将表达多种异源核酸分子。
在用于本申请书时,“植物”指处于任何发育阶段的任何植物或植物部分。还包括插条、细胞或组织培养物、和种子。在与本发明结合使用时,术语“植物组织”包括但不限于完整植株、植物细胞、植物器官、植物种子、原生质体、愈伤组织、细胞培养物、和组织成结构和/或功能单位的任何植物细胞群。当卤化天然产物具有抗病原体特性时,则生成了对致植物病的真菌和细胞的抵抗力增强的转基因植物。为了它们在转基因植物中的表达,编码本发明卤化酶和/或电子转移酶的核酸分子和邻近序列可能需要修饰和优化。
虽然在许多情况下可以在植物中高水平表达来自其它生物体的核酸分子而无需修饰,但是转基因植物中的低表达可能是由于核酸分子具有植物不优选的密码子。本领域知道,所有生物体对密码子使用具有特异的偏爱,而且可以改变来自其它生物体的密码子以符合植物的偏爱,同时维持所编码的氨基酸。此外,植物中的高表达由具有至少35%、更优选超过45%GC含量的编码序列得到最好的实现。由于存在可使信息不稳定的ATTTA基序和可引起不适当聚腺苷酸化的AATAAA基序,具有低GC含量的微生物基因在植物中的表达可能较差。另外,可以对编码本发明卤化酶或电子转移酶的核酸分子筛选可引起mRNA截短的不正常剪接位点的存在情况。可以使用众所周知的定点诱变、PCR、和合成基因构建技术,使用已发表的专利申请书EP 0 385 962、EP 0 359472、和WO 93/07278中所述方法,进行需要在编码序列中产生的所有改变(诸如上文所述)。本发明的优选核酸分子可以是未修饰的,只要它们在目标转基因植物物种中高水平表达即可;或者可以是经修饰的核酸分子,其中通过除去不稳定和不适当聚腺苷酸化基序以及不正常剪接位点而进行了修饰,通过掺入植物优选密码子而得到进一步修饰,而且具有在植物中表达的优选GC含量。虽然优选核酸序列可以在单子叶植物和双子叶植物物种中充分表达,但是可以修饰序列以解决单子叶植物或双子叶植物特异的密码子偏爱和GC含量偏爱,因为这些偏爱显示是不同的(Murray等人,Nucl Acid Res,17:477-498,1989)。
为了有效起始翻译,可能需要修饰起始甲硫氨酸的邻近序列。与选定核酸分子同源的序列可以在植物中有效起始翻译,或者可能是低效的。在它们低效起始的情况下,可以通过包含已知在植物中有效的序列来修饰它们。Joshi建议了用于植物的适当共有翻译起始子(NAR,15:6643-6653,1987;SEQ ID NO:15),而Clontech建议了另一种共有翻译起始子(1993/1994产品目录,第210页;SEQ ID NO:16)。这些共有序列适用于本发明的核酸分子。将序列掺入核酸分子构建物,可直至并包含ATG(同时保持选定核酸分子的第二个氨基酸未修饰),或者直至并包含ATG后面的GTC(有可能修饰转基因的第二个氨基酸)。
编码本发明卤化酶或电子转移酶的核酸分子在转基因植物中的表达位于显示在植物中有功能的启动子之后。启动子的选择将根据表达的时空要求和目标物种而变化。当卤化天然产物是抗病原体的而且希望保护植物免于叶病原体的危害时,优选在叶中的表达;为了保护植物免于穗病原体的危害,优选在花序(如穗状花序、圆锥花序、穗轴等)中的表达;为了保护植物免于根病原体的危害,优选在根中的表达;为了保护幼苗免于土传病原体的危害,优选在根和/或幼苗中的表达。然而,在许多情况下,将寻找针对超过一种类型的植物病原体的表达,因而将希望在多种组织中的表达。虽然来自双子叶植物的许多启动子显示在单子叶植物中可运作且反之亦然,但是理想的是选择双子叶启动子用于双子叶植物中的表达,单子叶启动子用于单子叶植物中的表达。但是,对于选定启动子的出处没有限制,只要它们在驱动本发明核酸分子的表达中可运作就足够了。组成性表达的优选启动子包括CaMV 35S和19S启动子,和来自编码肌动蛋白或泛素的基因的启动子。
还可以在化学调控的启动子的调控下表达本发明的核酸分子。这使得能够只在用诱导性化学药品处理农作物植物时合成卤化天然产物,而且卤化天然产物生物合成随后下降。用于化学诱导基因表达的优选技术详述于已发表的申请EP 0 332 104和美国专利5,614,395(收入本文作为参考)。用于化学诱导的优选启动子是烟草PR-1a启动子。
启动子的优选种类是创伤诱导型。已经描述了在创伤位点以及致植物病原体感染位点表达的许多启动子。理想的是,这种启动子应当只在感染位点局部有活性,这样,抗病原体的卤化天然产物只在需要合成它以抑制侵入病原体生长的细胞中积累。这类优选启动子包括由Stanford等人,Mol Gen Genet,215:200-208,1989;Xu等人,PlantMolec Biol,22:573-588,1993;Logemann等人,Plant Cell,1:151-158,1989;Rohrmeier和Lehle,Plant Molec Biol,22:783-792,1993;Firek等人,Plant Molec Biol,22:129-142,1993;和Warner等人,Plant J,3:191-201,1993描述的启动子。
优选的组织特异性表达模式包括绿色组织特异性、根特异性、茎特异性、和花特异性。适用于在绿色组织中表达的启动子包括调控涉及光合作用的基因的许多启动子,而且这些启动子中的许多已经由单子叶植物和双子叶植物二者进行了克隆。一种优选启动子是来自磷酸烯醇丙酮酸羧化酶基因的玉米PEPC启动子(Hudspeth和Crula,PlantMolec Biol,12:5779-589,1989)。de Framond描述了用于根特异性表达的一种优选启动子(FEBS,290:103-106,1991;EP 0 452269,1479),而另一种优选的根特异性启动子是由本发明提供的来自T-1基因的启动子。一种优选的茎特异性启动子描述于专利申请WO93/07278,它驱动玉米trpA基因的表达。
本发明的一个优选实施方案是以根特异性方式生成卤化天然产物硝吡咯菌素的转基因植物。在本发明的一个尤其优选的实施方案中,在根特异性启动子之后表达硝吡咯菌素的生物合成基因,以保护转基因植物免于植物病原体丝核菌(Rhizoctonia)的危害。其它优选实施方案是以创伤可诱导方式或病原体感染可诱导方式生成抗病原体的卤化天然产物的转基因植物。
除了合适启动子的选择,用于在植物中生成卤化天然产物的构建物需要适当的转录终止子附着于异源卤化酶和/或电子转移酶核酸分子的下游。可以获得这样的几种终止子,而且在本领域是知道的(如来自CaMV的tml、来自rbcS的E9)。已知在植物中发挥功能的任何可利用终止子都可用于本发明的内容。
可以将许多其它序列掺入卤化酶和/或电子转移酶核酸分子的表达盒。这些序列包括显示增强表达的序列,诸如内含子序列(如来自Adh1和bronzel)和病毒前导序列(如来自TMV、MCMV、和AMV)。
卤化天然产物在植物中的生成要求编码该途径第一步的卤化天然产物生物合成核酸分子能接触该途径底物。对于所涉及的每种卤化天然产物和途径,这种底物将有可能是不同的,而且它在植物中的细胞定位也可能是不同的。在许多情况下,底物可位于细胞溶胶中;而在其它情况下,它可位于一些亚细胞细胞器中。由于植物中的许多生物合成活性发生于叶绿体中,因此底物常常可能位于叶绿体中,因而本发明的卤化酶和电子转移酶最好靶向适当的细胞器(如叶绿体)。可以使用本领域众所周知的技术来保证编码酶的转基因的亚细胞定位。通常,操作来自已知细胞器靶向基因产物的靶向肽的编码DNA,并融合在所需卤化酶和电子转移酶核酸分子的上游。已知许多可用于叶绿体的这种靶向序列,而且已显示了它们在异源构建物中发挥功能。在本发明的一个优选实施方案中,将硝吡咯菌素生物合成所需要的核酸分子靶向叶绿体,因为该途径底物色氨酸是在叶绿体中合成的。
在有些情形中,生成卤化天然产物所需要的核酸的过度表达可耗尽特定途径底物的细胞利用度,而这对细胞可能具有有害影响。在诸如这种情形中,希望通过编码底物生物合成的酶的核酸分子的过度表达来增加可利用的底物量。在色氨酸(硝吡咯菌素生物合成的底物)的情况下,这可以通过trpA和trpB编码核酸分子的过度表达来实现。生成更多可利用底物的另一种方法是关闭利用特定底物的已知途径(条件是可以这样做而没有有害副作用)。这样,合成的底物被引导至卤化天然产物的生物合成而不通向其它化合物。
适用于植物转化的载体描述于本说明书的其它地方。对于由农杆菌介导的转化,二元载体或携带至少一个T-DNA边界序列的载体是合适的;对于直接转移,任何载体都是合适的,而只包含目的构建物的线性DNA可能是优选的。在直接转移的情况下,可以使用单一DNA种类的转化或共转化(Schocher等人,Biotechnology,4:1093-1096,1986)。对于直接转移和由农杆菌介导的转移二者,通常(但非必需)通过可提供抗生素(卡那霉素、潮霉素、或氨甲蝶呤)或除草剂(草铵膦)抗性的选择标记来进行转化。然而,选择标记的选择对于本发明而言不是决定性的。
转基因植物中卤化天然产物的合成将频繁需要编码卤化天然产物生物合成酶的多种核酸分子的同时过度表达。这可以如下实现,将单个卤化天然产物生物合成核酸分子各个分别转化到不同植物品系中,然后将得到的品系杂交。若各种转化构建物利用不同的选择标记,则将有益于携带多种核酸序列的品系的选择和维持。其中需要的所有卤化天然产物生物合成核酸分子渐增的品系将合成卤化天然产物,而其它品系则不能。这种方法可能适用于杂交农作物(诸如玉米),其中最终杂种必须是两种亲本间的杂交。具有不同异源核酸分子的不同近交品系的维持在其中特定卤化天然产物途径可产生多种卤化天然产物且每一种都具有效用的情形中也可能是有利的。通过将携带途径中较后步骤的不同候选核酸序列的不同品系用于与携带所有剩余所需核酸分子的品系生成杂种,有可能生成携带可能具有不同效用的不同选定卤化天然产物的不同杂种。
生成携带多种核酸序列的植物品系的候选方法包括用卤化天然产物生物合成核酸分子再次转化早已转化的现有品系(并用不同标记进行选择),以及携带多种生物合成核酸分子(每一种都处于适当调控控制下,即启动子、终止子等)的单一转化载体的使用。考虑到DNA构建的容易,操作克隆载体以携带多种生物合成核酸分子是优选方法。
另一种优选方法是构建本发明卤化酶与本发明电子转移酶的上述融合蛋白,并在本发明的转基因植物中表达编码这种融合蛋白的核酸。编码电子转移酶的核酸分子可以融合在卤化酶编码核酸分子的5’或3’端。任选的是,可以将接头掺入融合体,将电子转移酶和卤化酶蛋白质结构域分隔开来。在一个优选的实施方案中,融合蛋白包含由(G1y)6组成的接头。然而,本领域技术人员将认识到,也可以选择其它合适长度和/或组成的接头。
在另一个优选实施方案中,可以通过直接质体转化来实现卤化天然产物在植物中的生成。质体表达(其中通过同源重组将基因插入每个植物细胞中存在的几千个拷贝的环状质体基因组中)利用了庞大拷贝数相对于核表达基因的优势,从而使表达水平可容易的超过总可溶性植物蛋白的10%。在一个优选的实施方案中,将核苷酸序列插入质体靶向载体,并转化到期望植物宿主的质体基因组中。获取对含核苷酸序列的质体基因组而言同质且优选能够高度表达核苷酸序列的植物。
质体转化技术广泛的描述于例如美国专利号5,451,513、5,545,817、5,545,818、和5,877,462、PCT发表号WO95/16783和WO97/32977、和McBride等人,Proc Natl Acad Sci USA,91:7301-7305,1994(都完整收入本文作为参考)。质体转化的基本技术包括将所克隆质体DNA中选择标记侧翼的区域与核苷酸序列一起导入合适的靶组织,如使用biolistics或原生质体转化(如由氯化钙或PEG介导的转化)。1-1.5kb侧翼区(称为打靶序列)有助于与质体基因组的同源重组,由此允许质体基因组中特定区域的取代或修饰。首先,利用赋予壮观霉素和/或链霉素的叶绿体16S rRNA和rps12基因中的点突变作为转化的选择标记(SvabZ、Hajdukiewicz P、和Maliga P,ProcNatl Acad Sci USA,87:8526-8530,1990;Staub JM和Maliga P,Plant Cell,4:39-45,1992)。这些标记间克隆位点的存在允许生成用于导入外源基因的质体打靶载体(Staub JM和Maliga P,EMBO J,12:601-606,1993)。通过用显性选择标记编码壮观霉素解毒酶氨基糖苷-3’-腺苷酰基转移酶的细菌aadA基因取代隐性rRNA或r-蛋白质抗生素抗性基因而获得了转化频率的显著升高(Staub JM和Maliga P,Proc Natl Acad Sci USA,90:913-917,1993)。可用于质体转化的其它选择标记在本领域是知道的,而且属于本发明的范围之内。
在本发明的一个特别优选的实施方案中,硝吡咯菌素的可诱导质体生成是通过fre、prnA、prnB、prnC、和prnD作为噬菌体T7启动子控制下的操纵子的直接叶绿体转化而实现的。可诱导表达是通过与拥有编码T7RNA聚合酶、改造后拥有叶绿体运输肽、且在PR1启动子控制下允许BTH可诱导表达的核构建物的植物杂交而实现的。
通过本发明方法生产卤化天然产物,可于广泛的植物细胞中进行,包括裸子植物、单子叶植物、和双子叶植物的细胞。虽然可以将基因插入属于这些广泛种类的任何植物细胞,但是在(但不限于)下列农作物植物细胞中特别有用:诸如稻、小麦、大麦、黑麦、玉米、马铃薯、胡萝卜、甘薯、甜菜、菜豆、豌豆、菊苣、莴苣、甘蓝、花椰菜、嫩茎花椰菜、芜菁、萝卜、菠菜、芦笋、洋葱、大蒜、茄子、胡椒、芹菜、胡萝卜、南瓜、西葫芦、夏南瓜、黄瓜、苹果、梨、榅桲、甜瓜、李、樱桃、桃、油桃、杏、草莓、葡萄、悬钩子、黑莓、凤梨、鳄梨、番木瓜、芒果、香蕉、大豆、烟草、番茄、高粱、和甘蔗。
在通过在农作物植物或可再生农作物植物的植物细胞培养物中进行直接选择获得了本发明的区域专一的卤化酶和/或电子转移酶的等位基因之后,使用传统育种技术将它转移到商品化品种中,而无需遗传工程改造等位基因并将其转化到植物中。
                      实施例
下列实施例作为本发明的进一步描述和用于实践本发明的方法。它们并非意欲限制而是提供如何实践本发明的方针。实施例1:PrnA的体外卤化反应A.大肠杆菌黄素还原酶、P2、曲霉硝酸还原酶、和细胞色素b5还原酶 对PrnA的激活
通过离子交换层析由包含质粒pPEH14(prnA)(Kirner S等人,JBacteriol,180(7):1939-1943,1998年4月)的荧光假单胞菌BL915ΔORF1-4纯化PrnA。在没有加入如上文发明背景中所述制备的P2时,纯化的酶具有的活性可忽略。蛋白质浓度或制剂是0.36mmg/ml。
配制测定混合液,包含HEPES缓冲液pH7.5(50mM)、葡萄糖-6-磷酸(14.3mM)、D-Trp(7mM)、NaCl(7mM)。黑曲霉(Aspergillusniger)过氧化氢酶购自Sigma Chemical公司(13U/ml),牛红血球超氧化物歧化酶(以下称为“SOD”)购自Sigma Chemical公司(5U/ml),肠膜明串珠菌(Leuconostoc mesenteroides)葡萄糖-6-磷酸脱氢酶购自Sigma(5U/ml),FAD(7μmolar)。如下文所示使用依赖NADH的混合液或NADPH混合液。依赖NADH的测定混合液是通过向4.5ml上述测定混合液中加入12mg NADH而配制的。依赖NADPH的测定混合液是通过向1ml上述测定混合液中加入3mg NADPH而配制的。
在聚丙烯管中建立下文所述反应1-7,平行3份。将PrnA、所示测定混合液、与电子转移酶混匀后,将样品旋涡震动,然后通过室温倒置而混匀。反应开始20.5小时后通过煮沸2分钟终止反应,然后通过Microcon 10滤膜的超滤(14000xg,30分钟)来制备用于HPLC分析的样品。HPLC分析使用Method Set PrnAl(下文所述),注射体积是50μl,收集前6分钟的数据。
通过混合5或10μl7-Cl-Trp(1mM)与足够的50mM HEPES pH7.5至终体积200μl来配制标准物。正如真正的D-Trp和7-Cl-Trp的洗脱所示,D-Trp洗脱于约2分钟,7-Cl-Trp洗脱于4.3分钟。通过与标准曲线的比较来测定7-Cl-Trp的量。报告活性是加入电子转移酶之后的7-Cl-Trp净增长。B.PrnA的HPLC分析法7-Cl-Trp的测定
使用装备光电二极管阵列检测器的Waters Alliance HPLC系统。Waters Alliance HPLC配备填充了粒度3微米的C18硅胶的4.6×50mm柱。使用本文称为PrnAl的梯度洗脱方法。流速是1ml/min,收集210-400nm的吸光度数据,分辨率为1.2nm,取样速率1/s。将系统用85∶15的水∶甲醇混合液预先平衡。注入样品后,用6分钟的梯度(由起始条件至40∶60的水∶甲醇混合液)展开柱。然后在6.0-7.0分钟以线性梯度将甲醇浓度提高至100%。将柱用100%甲醇清洗1分钟,然后再次平衡。正如真正的D-Trp和7-Cl-Trp的洗脱所示,D-Trp洗脱于约2分钟,7-Cl-Trp洗脱于4.3分钟。
1.大肠杆菌黄素还原酶对PrnA的激活
以基于Fieschi等人,J Biol Chem,270:303921-30400,1995(完整收入本文作为参考)的方案的方法,通过硫酸铵沉淀随后通过疏水层析,纯化大肠杆菌黄素还原酶(以下缩写为Fre)。黄素还原酶纯化在细菌匀浆和硫酸铵分级分离过程中遵循Fieschi的流程。此时沉淀黄素还原酶活性。通过离心收集沉淀,重悬于25mM Tris/Cl pH7.5、0.5M KCl、10%甘油。然后遵循Fontcave等人,J Biol Chem,262(25):12325-12331,1987年9月5日(完整收入本文作为参考)的方法直至完成。收集的纯化Fre样品的蛋白质浓度是21μg/ml。每个反应含20μl PrnA、160μl上述NADH混合液、和20μl Fre。得到的净产物形成是21.46±1.02nmol7-Cl-Trp。
2.P2对PrnA的激活
P2是来自荧光假单胞菌的电子转移酶蛋白质制剂,通过离子交换层析纯化,且描述于上文发明背景。它不具有PrnA活性。P2样品的蛋白质浓度是4.8mg/ml。每个反应含20μl PrnA、160μl NADH混合液、和20μl P2。得到的净产物形成是12.50±2.02nmol 7-Cl-Trp。
3.菠菜硝酸还原酶对PrnA的激活
菠菜硝酸还原酶(以下称为“SNIR”)的重组FAD结构域(18.6μmolar)。每个反应含20μl PrnA、160μl NADH混合液、和20μl SNIR。得到的净产物形成是0.048±0.73nmol 7-Cl-Trp。
4.曲霉硝酸还原酶对PrnA的激活
来自曲霉的硝酸还原酶(10U/ml)购自ICN。每个反应含20μlPrnA、160μl NADH混合液、和20μl硝酸还原酶。得到的净产物形成是1.49±0.18nmol 7-Cl-Trp。
5.大鼠NADH-细胞色素-b5还原酶对PrnA的激活
获得了大鼠肝细胞色素b5还原酶的重组可溶性结构域(11.7μmolar)。每个反应含20μl PrnA、160μl NADH混合液、和20μl细胞色素b5还原酶。净产物形成是0.31±0.11nmol 7-Cl-Trp。
6.心肌黄酶巯基还原酶对PrnA的激活
心肌黄酶巯基还原酶(200U/ml)购自United StatesBiochemicals。每个反应含20μl PrnA、160μl NADH混合液、和20μl心肌黄酶。净产物形成是2.24±0.04nmol 7-Cl-Trp。
7.兔NADPH-cyt-P450还原酶对PrnA的激活
兔肝NADPH-cyt-P450还原酶(0.069mg/ml)购自Sigma Chemical公司。每个反应含20μl PrnA、160μl NADPH混合液、和20μl细胞色素P450还原酶。得到的净产物形成是3.35±0.23nmol 7-Cl-Trp。实施例2:大肠杆菌黄素还原酶;菠菜铁氧还蛋白NADP还原酶、菠菜铁氧还蛋白还原酶+菠菜铁氧还蛋白;和费氏发光杆菌NAD(P)H:FMN还原酶对PrnA的激活
下文实例1-4中使用了下列成份:PrnA(如上文实施例1所述)(0.36mg/ml),包含HEPES(100mM)、葡萄糖-6-磷酸、二钠盐(50mM)、D-Trp(5mM)、NaCl(5mM)的测定混合液,黑曲霉过氧化氢酶(39U/ml)、牛红血球超氧化物歧化酶(15U/ml)、肠膜明串珠菌葡萄糖-6-磷酸脱氢酶(10U/ml)、NADH(3mg/ml)、NADPH(3mg/ml)。
每次测定包含测定混合液、NADH(用于包含Fre和NAD(P)H:FMN还原酶的样品)或NADPH(用于包含FNR或FNR和Fd的样品)、PrnA、和指定电子转移酶。将阴性对照样品平行保温;它们取代PrnA的缓冲液。通过在100μl测定混合液、50μl NADH、20μl PrnA、和50μl缓冲液中稀释0、1、2、或5μl 7-Cl-Trp标准品(1mM)配制定量标准物;在添加PrnA之前将管加热至100℃,然后继续加热2分钟。其它处理与酶促反应平行。将所有样品于室温混合2小时。终止反应并如上文实施例1中所述处理样品,包括使用实施例1中所述的HPLC分析方法PrnAl。1.与Fre一起时的PrnA活性:如上所述混合100μl测定混合液、50μlNADH、20μl PrnA、和50μl Fre(0.84μg/ml)。生成的净7-Cl-Trp是8.44nmol。
2.与铁氧还蛋白NADP还原酶一起时的PrnA活性:如上所述混合100μl测定混合液、50μl NADH、20μl PrnA、和50μl FNR(4.1μmol)。生成的净7-Cl-Trp是4.22nmol。
3.与铁氧还蛋白NADP还原酶和铁氧还蛋白一起时的PrnA活性:如上所述混合100μl测定混合液、50μl NADH、20μl PrnA、和50μl FNR(4.1μmol)和Fd(7μmol)。生成的净7-Cl-Trp是9.15nmol。
4.与费氏发光杆菌NAD(P)H:FMN还原酶一起时的PrnA活性:如上所述混合100μl测定混合液、50μl NADH、20μl PrnA、和50μl购自Roche的NAD(P)H:FMN还原酶(4U/ml)。生成的净7-Cl-Trp是0.11nmol。实施例3:PrnC的体外卤化反应
对Fre、即铁氧还蛋白NADP还原酶、铁氧还蛋白、和NADPH:FMN还原酶测试了激活荧光假单胞菌PrnC的能力,所述PrnC如下所述耗尽了内源电子转移酶(P2)。PrnC催化单脱氯氨基硝吡咯菌素(MDA)氯化而生成氨基硝吡咯菌素(APRN)。
制备下列材料用于下文所述测定法。缓冲液:100mM Tris/Cl、1mMEDTA pH7.5。由如Kirner等人,1998(完整收入本文作为参考)所述表达PrnA和PrnB的荧光假单胞菌培养物来制备74.2mM单脱氯氨基硝吡咯菌素(MDA)。测定混合液在缓冲液中包含FAD(5μM)和MDA(742μM)。将NADH以6mg/ml的浓度溶于缓冲液,或者将NADPH以6mg/ml的浓度溶于缓冲液。提取物#1是在缓冲液中包含PrnC和上文实施例1中所述内源电子转移酶P2的粗制提取物。PrnC表达于删除染色体prn操纵子但包含在质粒pPEH-PrnC(Kirner等人,1998)上在tac启动子之后编码PrnC的核酸序列(SEQ ID NO:4)的荧光假单胞菌(pPEH/prnC/134Δprn)中。在该系统中,tac启动子引起PrnC的组成性表达。提取物#2,通过混合提取物#1与阴离子交换树脂然后通过离心除去树脂来纯化提取物#1中的PrnC。为了耗尽PrnC的荧光假单胞菌P2活性,使用100mM Tris/Cl缓冲液。
如下进行下文所述测定法:将提取物#2与指定的电子转移酶、测定混合液、和指定的NADH或NADPH混合。通过平行样品(其中将提取物#1与测定混合液和NADH混合)测定在除去P2活性之前PrnC的天然活性。通过倒置过夜混合所有样品,然后通过加入10μl KOH(6M)终止反应,随后用乙酸乙酯(1ml)萃取。将0.6ml有机可溶层转移到另一个管中,并通过真空离心除去溶剂。将残余物重新溶于200μl 60∶40的H2O∶CH3CN+100μl CH3CN。将样品滤过0.2μm尼龙滤器以除去微粒物。通过下文所述PrnC_Iso方法分析样品。分析并整合290nm吸光度层析图。PrnC活性表述成APRN峰面积占APRN和MDA峰面积总和的比率的100倍。假定220nm的消光系数相等,那么计算得到的比率等同于MDA通过卤化转变成APRN的净百分比。HPLC分析方法PrnC Iso
所用HPLC设备是装备光电二极管阵列检测器的Waters AllianceHPLC系统,并配备填充了粒度3微米的C18硅石的4.6×50mm柱。HPLC方法是等度洗脱法,流速1.5ml/min,溶剂是58∶42的水∶乙腈。收集210-400nm的吸光度数据,分辨率为2.4nm,取样速率5/s。注射前将系统预先平衡最少6分钟。注射体积是50μl,数据收集时间是6分钟,随后是注入下一个样品前的又一个6分钟等度洗脱。在这种方法中,MDA洗脱于2.16分钟,氨基硝吡咯菌素(APRN)洗脱于3.05分钟。蛋白质浓度
蛋白质浓度是通过BCA方法使用卖主(Pierce)描述的标准流程测定的。
1.与大肠杆菌Fre一起时的PrnC活性:将50μl提取物#2与20μl大肠杆菌黄素还原酶(21μg/ml)、100μl测定混合液、和50μl NADH混合;继续混合过夜,随后如上所述分析样品。观察到的活性是51.8%的MDA转变成APRN。
2.与菠菜铁氧还蛋白NADP还原酶一起时的PrnC活性:将50μl提取物#2与20μl菠菜铁氧还蛋白:NADP还原酶(20.7μmol)、100μl测定混合液、和50μl NADH混合;继续混合过夜,随后如上所述分析样品。观察到的活性是1.8%的MDA转变成APRN。
3.与菠菜铁氧还蛋白NADP还原酶和菠菜铁氧还蛋白一起时的PrnC活性:将50μl提取物#2与20μl菠菜铁氧还蛋白:NADP还原酶(20.7μmol)和菠菜铁氧还蛋白(Fd)(35μmol)、100μl测定混合液、和50μl NADH混合;继续混合过夜,随后如上所述分析样品。观察到的活性是2.5%的MDA转变成APRN。
4.与NADPH:FMN还原酶一起时的PrnC活性:将50μl提取物#2与20μl来自费氏发光杆菌的NAD(P)H:FMN还原酶(10U/ml)、100μl测定混合液、和50μl NADH混合;继续混合过夜,随后如上所述分析样品。观察到的活性是4.0%的MDA转变成APRN。
5.通过平行样品测定除去P2活性前的PrnC天然活性:将50μl提取物#1与100μl测定混合液和50μl NADH混合;继续混合过夜,随后如上所述分析样品。观察到的活性是7.8%的MDA转变成APRN。实施例4:大肠杆菌中的卤化A.编码大肠杆菌黄素还原酶的核酸的克隆
使用引物5’GCGCGAATTCATGACAACCTTAAGCTGTAAAGTGACC(SEQ IDNO:32)和3’GCGCCTGCAGTCAGATAAATGCAAACGCATCGCC(SEO ID NO:33),由大肠杆菌菌株XL-1 Blue(Stratagen)PCR扩增编码大肠杆菌黄素还原酶的核酸序列(以下称为“fre”)。然后将核酸分子Topo克隆(Invitrogen),转化到大肠杆菌XL-1 Blue(Stratagen)中,并通过在添加氨苄青霉素的Luria肉汤(LB)固体培养基上涂板来选择转化体。选择几个菌落,并通过DNA测序进行分析,以确认它们的身份。在这些菌落中,发现有一个拥有的核酸分子包含与报导的fre(Genbank编号23486)相同的序列。另一个拥有的核酸序列在第247位核苷酸处包含突变,导致一个带电荷氨基酸替代Lys83→Glu83(该突变体以下称为freE83)。B.fre和fre E83 突变体的可诱导过度表达
fre和frE83突变体的可诱导过度表达是如下实现的,将野生型fre和替代突变体freE83克隆到pKK223-3(Pharmacia)的EcoRl/Pst1位点中,置于tac启动子的控制之下。转化后,将包含fre-pKK223-3、freE83-pKK223-3、和空载体pKK223-3的细胞在6ml LB+amp中于37℃培养过夜,然后在30ml LB+amp 5mM IPTG(Fisher)中稀释达5小时,并通过离心进行收获。将细菌沉淀悬浮于4.5ml 50mM HEPES pH7.5、1mM EDTA+0.5ml 5mg/ml溶菌酶于25℃达15分钟,进行两轮冻融。在冰上超声处理1分钟后,将匀浆物以16000xg离心20分钟。然后将上清液用50mM HEPES pH7.5、1mM EDTA系列稀释,产生相对浓度范围1-1/10000的8份样品。
对每份细菌提取物和稀释后的细菌提取物如下测定PrnA活性的互补:向180μl由7.2μg PrnA(0.36μg/μl)、3.3μmol FAD、3.3mMNaCl、1.67mM D-Trp、0.67mg/ml NADH、和50mM HEPES pH7.5组成的溶液中加入20μl提取物。将反应液于30℃保温2小时。通过加热至100℃达2分钟来终止反应,随后以21000xg离心5分钟。然后将上清液滤过10kDa截留离心超滤膜。然后使用上文实施例1关于PrnA1所述的分析方法,通过反相HPLC测定滤出液,将D-Trp向D-7-氯色氨酸的转变量化。加入来自包含空载体pKK223-3的大肠杆菌的提取物,产生0.34pmol7-Cl-Trp每分钟每微克所加入提取物中的蛋白质。加入来自包含freE83-pKK223-3的大肠杆菌的提取物,产生1.14pmol 7-Cl-Trp每分钟每微克所加入提取物中的蛋白质。加入来自包含fre-pKK223-3的大肠杆菌的提取物,产生301pmol 7-Cl-Trp每分钟每微克所加入提取物中的蛋白质。
如下进行黄素还原酶测定法:向990μl含0.1mg/ml NADPH和9.5μmol核黄素的50mM HEPES pH7.5中加入10μl细菌提取物。若活性过高而不能观察反应的前20%,则将细菌提取物在50mM HEPES缓冲液中1/10稀释,然后如上测定。然后通过分光光度法于340nm监测NADH向NADP的转变。加入来自包含空载体pKK223-3的大肠杆菌的提取物,具有0.055nmol黄素还原酶活性每分钟每微克所加入提取物中的蛋白质。加入来自包含freE83-pKK223-3的大肠杆菌的提取物,具有0.157nmol黄素还原酶活性每分钟每微克所加入提取物中的蛋白质。加入来自包含fre-pKK223-3的大肠杆菌的提取物,具有25.4nmol黄素还原酶活性每分钟每微克所加入提取物中的蛋白质。这证明黄素还原酶活性的变化与卤化活性成比例。C.fre和Drn操纵子在大肠杆菌中的共表达
将pKK223-3(Pharmacia)中的完整荧光假单胞菌硝吡咯菌素操纵子(美国专利号5,723,759中叙述的5.8X/N,上文将其收入本文作为参考)转化到大肠杆菌中。将fre序列(包括Taq启动子由pKK223-3转移到包含相容复制起点p15A的pACYC184(NEB)的四环素标记中。然后将该质粒与5.8X/N进行共转化,并通过氨苄青霉素和氯霉素选择这两种载体的存在。还生成只包含fre的宿主菌株作为阴性对照。将每种株系在60ml培养基中于37℃培养、200rpm振摇培养48小时。由每种培养物取5ml用于质粒分析,确认一种或两种质粒的存在。取15ml培养物用于蛋白质和活性分析。将剩余的40ml培养物用2倍体积的乙酸乙酯萃取2次。将乙酸乙酯级分在真空中浓缩至干燥,然后转移至50μl 6∶4的H2O/CH3CN和60μl MeOH中。然后取20μl得到的溶液,通过下文所述HPLC方法Prn_BCD分析氨基硝吡咯菌素和硝吡咯菌素。D.HPLC分析方法Prn BCD MDA、APRN、和PRN的测定
HPLC设备是装备光电二极管阵列检测器的Waters Alliance HPLC系统,并配备填充了粒度3微米的C18硅石的4.6×50mm柱。HPLC方法是梯度洗脱法,流速1.2ml/min。收集210-400nm的吸光度数据,分辨率为2.4nm,取样速率5/s。将系统用65∶35的水∶乙腈预先平衡。注入样品后,由起始条件至40∶60的水∶乙腈的线性梯度展开柱。氨基硝吡咯菌素洗脱于5.0分钟,硝吡咯菌素洗脱于6.6分钟。通过整合于诊断波长测量的层析图中的峰面积来测量氨基硝吡咯菌素和硝吡咯菌素二者。对于氨基硝吡咯菌素,使用300nm吸光度。对于硝吡咯菌素,使用250nm吸光度。
结果显示,与只表达硝吡咯菌素操纵子的细胞相比,在共表达包含fre和硝吡咯菌素操纵子的质粒的大肠杆菌细胞中,氨基硝吡咯菌素积累的增加超过10倍,硝吡咯菌素积累的增加超过4倍。实施例5:在转基因植物中表达然后在体外纯化并测定的PrnA的卤化
用硝吡咯菌素操纵子的4种核酸分子(编码PrnA、PrnB、PrnC、和PrnD,每一种都处于下文实施例6中所述泛素启动子之后)转化(通过由农杆菌介导的转化方法)拟南芥(Arabidopsis thaliana)哥伦比亚(Columbia)生态型。
由包含来自荧光假单胞菌BL915的粘粒克隆的pCIB169(美国专利号5,723,759)(Genbank编号U74493)PCR扩增各种硝吡咯菌素核酸分子(包括适当的限制性位点)。将核酸分子亚克隆并测序。由拟南芥基因组PCR扩增泛素3启动子和第一个内含子(Caiis J等人,Journalof Biological Chemistry,265:12486-12493,1990和Norris SR等人,Plant Molecular Biology,21:895-906,1993)以包含5’KpnI和3’BamHI位点。将泛素启动子、nos终止子(D epicker等人,Journal of Molecular and Applied Genetics,1:561-573,1982)、和每一种硝吡咯菌素核酸分子(参阅美国专利号5,723,759和5,955,348,都完整收入本文作为参考)克隆到修饰后的pSort1载体中。在PrnA、B、和D的每一种中紧挨着起始ATG的5’加入Kozak共有-3ACC核苷酸三联体。PrnC核酸分子不被修饰。将PrnB中的起始GTG密码子变成ATG密码子。这些修饰产生一组载体pPEH7826、27、28、和29(分别是PrnA、B、C、和D)。所有其它序列与野生型序列是共有的。通过将来自pCIB7826(PrnA)的KpnI片段插入pCIB7828(PrnC)的KpnI位点生成pCIB7830而构建了PrnAC双联体。通过将来自pCIB7827(PrnB)的KpnI片段插入pCIB7829(PrnD)的KpnI位点生成pCIB7831而构建了PrnBD双联体。通过将来自pCIB7830的NotI片段插入pCIB7831的NotI位点生成pCIB7832而构建了4种核酸分子操纵子。将来自pCIB7832的XbaI片段插入二元载体pCIB200生成转化载体pCIB7819。将最终载体电穿孔到农杆菌中并用于拟南芥转化。
通过Bechtold N等人的方法转化拟南芥(Bechtold N等人,C.R.Acad.Sci.Paris,Life Science,316:1194-1199,1993)。
培养2种转化品系(3和12)和非转化对照品系并收获叶片(1g)。将叶片在液氮中冻结,在研钵中磨成粉,并用6ml Ls缓冲液(50mM HEPESpH7.5、5mM NaCl)提取。以5000xg离心15分钟以沉淀碎片后,将上清液滤过玻璃绒以除去残余微粒。
通过混合提取物(3ml)与亲和基质来如下免疫纯化PrnA。通过于室温混合100μl兔抗山羊IgG-琼脂糖(购自Sigma)与50μl山羊抗PrnA血清来制备亲和基质。然后将琼脂糖珠用1ml LS缓冲液清洗3次。将3ml样品与亲和基质混匀后,通过LS缓冲液清洗由珠除去未吸收的物质。通过混合5μl如实施例1中所述由荧光假单胞菌纯化的PrnA(0.36μg/μl)与3ml LS、然后与植物提取物样品平行处理来制备阳性对照样品。
向包含免疫纯化的PrnA的琼脂糖珠中加入200μl测定缓冲液(50mM HEPES pH7.5、5mM D-Trp、5mM NaCl、5μM FAD、5mM葡萄糖-6-磷酸+2mg/ml NADH+6.25U/ml葡萄糖-6-磷酸脱氢酶+44U/ml过氧化氢酶+30U/ml SOD)和20μl如实施例1中所述由大肠杆菌纯化的Fre(21μg/ml),除了品系3和12各有一个样品不加。然后通过倒置将样品混合过夜,滤过Microcon-10滤器,并通过HPLC方法PrnAl(描述于上文实施例1)分析产物。样品的注射体积是50μl。发现了下列7-Cl-Trp水平:阳性对照(向非转化植物提取物中加入外源PrnA)185pmol,品系3加Fre(两份单独的样品)83pmol和113pmol,品系3不加Fre 0pmol,品系12加Fre(两份单独的样品)120pmol和64pmol,品系12不加Fre 0pmol,非转化对照0pmol。
这些数据证明转化植物表达活性形式的PrnA,其活性依赖Fre的加入。实施例6:转基因植物中的卤化A.通过将编码大肠杆菌黄素还原酶的核酸转化到包含编码PrnA、PrnB、 PrnC、和PrnD的核酸的植物中而在转基因植物中进行卤化化合物的胞 质生产
将SEQ ID NO:6的核酸序列(编码来自大肠杆菌的黄素还原酶)克隆到载体pNOV019中,从而将核酸分子置于拟南芥泛素10(UB1O)启动子(Callis J等人,Journal of Biological Chemistry,265:12486-12493,1990和Norris SR等人,Plant Molecular Biology,21:895-906,1993)的控制之下,并用来自农杆菌的胭脂碱合酶终止子(Depicker等人,Journal of Molecular and Applied Genetics,1:561-573,1982)终止。
尝试了由pNOV507(KanR)、508(ChlorR)、和509(AmpR)组成的二元载体系统。与fre核酸分子和除草剂抗性选择标记一起用于构建硝吡咯菌素操纵子的三种载体如下。pNov507(KanR)是用在启动子、终止子、硝吡咯菌素、fre、或选择标记核酸分子任一中未发现的唯一限制性位点选择取代左边界与右边界之间的多接头后的二元载体。其它两种载体pNOV508(ChlorR)和pNOV509(AmpR)是包含一部分pNOV507多接头以及添加用于克隆硝吡咯菌素操纵子的分开核酸分子盒的额外限制性位点的载体。这两种载体是构建或装配载体。将fre盒与来自pNOV111的UB3选择标记盒一起在pNOV509中连接。然后将这种双重盒转移到二元载体pNOV507中,产生最终载体pNOV510。将该载体电穿孔到农杆菌中。通过Bechtold N等人的方法(Bechtold N等人,C.R.Acad.Sci.Paris,Life Sciences,316:1194-1199,1993)转化如实施例5中所述用PrnA、PrnB、PrnC、和PrnD核酸分子转化的拟南芥品系。
植物和各种构建物中的所有硝吡咯菌素途径核酸分子都是由拟南芥泛素3(UB3)启动子(Callis J等人,Journal of Biology Chemistry,265:12486-12493,1990和Norris sR等人,Plant Molecular Biology,21:895-906,1993)驱动的,并用来自农杆菌的nos终止子终止。通过上文所述Bechtold等人的方法的农杆菌渗透,用pNOV510转化包含prnA、prnB、prnC、和prnD的纯合拟南芥品系和野生型哥伦比亚品系。收集种子,干燥,并种到土里。通过对幼苗喷洒0.025%选择剂3次达8天来鉴定转化植株。然后通过HPLC或气相层析-质谱法对植物确认硝吡咯菌素的存在情况和水平。同样/或者,可如上所述对植物提取物确认prnA和/或prnC活性。B.通过大肠杆菌黄素还原酶和硝吡咯菌素操纵子的其转化而在转基因 植物中进行卤化化合物的胞质生产
将列于美国专利号5,723,759(上文将其收入本文作为参考)的编码硝吡咯菌素途径PrnA、prnB、prnC、和prnD的核酸序列,和编码大肠杆菌黄素还原酶的SEQ ID NO:7在单个t-DNA构建物中导入植物。每种硝吡咯菌素生物合成核酸分子的表达都是由UB3启动子驱动的,而fre SEQ ID NO:7是由UB10驱动的。所有5种核酸分子符合或改变后精确符合Kozak翻译起始序列,即在第-3位拥有A。所有核酸分子都是由nos终止子终止的。在一个优选的实施方案中,最终载体是通过在包含:右边界-UB3-prnA-nos-UB3-prnC-nos-UB3-prnB-nos-UB3-prnD-nos-UB10-fre-nos-UB3-选择标记-nos-左边界的二元载体中装配UB3启动子-胞质溶胶靶向硝吡咯菌素生物合成基因和UB10-fre盒而构建的。该载体称为pNOV523(SEQ ID NO:34)。
在另一个实施方案中,胞质溶胶靶向硝吡咯菌素操纵子是通过将来自pCIB7830的NotI A/B双联体片段连接到C/D双联体载体pCIB7831中而生成的。将操纵子作为XbaI盒转移到pNOV507中。将来自pCIB10253的NotI A/B双联体连接到C/D双联体载体pCIB10254中。同样将该构建物作为XbaI盒转移到pNOV507中。
最终载体包含:右边界-UB3-prnA-nos-UB3-prnB-nos-UB3-prnC-nos-UB3-prnD-nos-UB10-fre-nos-UB3-选择标记-nos-左边界。
然后将该载体电穿孔到农杆菌中,并通过农杆菌渗透(Bechtold N等人,C.R.Acad.Sci.Paris,Life sciences,316:1194-1199,1993)转化拟南芥(哥伦比亚品系)。收集种子,干燥,并种到土里。通过对幼苗喷洒0.025%选择剂3次达8天来鉴定转化植株。然后通过HPLC或气相层析-质谱法对植物确认硝吡咯菌素的存在情况和水平。C.卤化化合物在转基因植物质体中的生产
改造编码prnA和prnB的核酸构建物以表达叶绿体运输肽(Wong EY等人,Plant Molecular Bilogy,20:81-93,1992,并一起置于允许卡那霉素选择的载体上。转化方案在先前的实施例中有详述(Bechtold N等人,C.R.Acad.Sci.Paris,Life Sciences,316:1194-1199,1993)。质体靶向硝吡咯菌素核酸分子载体的构建
由pCIB10230、31、32、33(分别是PrnA、B、C、D)PCR扩增各种硝吡咯菌素途径核酸分子,以包含5’NheI和3’BamHI限制性位点。将核酸分子Topo克隆到pCR2.1(Invitrogen,US Office Calsbad,CA 92008,产品目录编号K2030-01)中,用于序列确认。由pFL61中的拟南芥cDNA文库(Wong等人,Plant Mol Biol,20:81-93,1992)PCR复制RuBPcase小亚基肽运输序列。将该核酸序列连接到pPEH31、30、29、和28(分别是PrnA、B、C、和D)中每种硝吡咯菌素核酸分子的5’端。这组pPEH载体包含UB3-内含子-nos盒。合成额外成熟肽作为互补寡聚物,退火,并连接到运输肽硝吡咯菌素核酸分子构建物的5’部分。这产生了质体靶向硝吡咯菌素核酸分子载体pCIB10249、50、51、和52(分别是PrnA、B、C、和D)。通过将来自pCIB10249的含PrnA的KpnI核酸分子盒连接到pCIB10250中而构建了PrnAB双联体pCIB10253。通过将来自pCIB10251的含PrnC的xhoI核酸分子盒连接而pCIB10252中而构建了PrnCD双联体pCIB10254。将每种双联体作为XbaI盒转移到二元载体pCIB200(KanR)中。用于质体靶向载体的选择标记方案是:对于fre载体为右边界-UB10-clp-fre-nos-UB3-选择标记-nos-左边界;对于PrnA/B载体为右边界-UB3-prnA-nos-UB3-prnB-nos-UB3-选择标记-nos-左边界;对于PrnC/D载体为右边界-UB3-prnC-nos-UB3-prnD-nos-UB3-选择标记-nos-左边界。
然后将质体靶向prnAB-fre载体电穿孔到农杆菌中,并通过上文所述Bechtold N等人的方法转化哥伦比亚拟南芥(Arabadopsiscolumbia)。收集种子,干燥,并种到土里。通过对幼苗喷洒选择剂来鉴定转化植株,并自交至纯合。
相似的,如上所述将质体靶向prnCD/选择标记载体导入拟南芥,并将得到的转化体自交至纯合。
然后将包含质体靶向prnAB-fre/选择标记构建物的纯合转化植株与纯合质体靶向prnCD/选择标记植株杂交。在另一个实施方案中,将质体靶向prnCD盒转移到包含UB10-质体靶向fre盒的二元载体中。该载体称为pNOV524(SEQ ID N0:35)。然后将载体pNOV524电穿孔到拟南芥中,并通过上文所述Bechtold N等人的方法转化哥伦比亚拟南芥。用pNOV524转化野生型拟南芥和先前用pCIB10253(包含质体靶向prnA/B)转化的拟南芥。收集种子,干燥,并种到土里。通过对幼苗喷洒选择剂来鉴定转化植株,并自交至纯合。
对得到的子代施用适当的选择剂。抵抗这种选择剂方案的植物拥有半合子状态的fre和prnA、B、C、D。本领域技术人员将领会这种方法可能的许多变异。在所有情况下,硝吡咯菌素表达是通过HPLC或气相层析量化的。实施例7:在供给MDA的转基因植物叶中表达的PrnC的卤化
在草铵膦选择后,对用pNOV524构建物(包含质体靶向prnC、prnD、和fre)转化的哥伦比亚品系进行Western印迹分析。另外,在草铵膦选择后,对用pCIB10253(包含质体靶向prnA和prnB)转化随后用pNOV524转化的拟南芥品系进行Western印迹分析。将来自每种品系的单一叶片在1x蛋白质样品缓冲液中匀浆,煮沸,并通过10%SDS-PAGE分离。随后,分别用针对prnC和prnD产生的抗体对膜探查prnC和prnD蛋白质的存在情况。鉴定到了prnC和prnD表达阳性的拟南芥品系。如下对相同蛋白质提取物再次检验黄素还原酶(fre)蛋白质的存在:使用10-20%梯度凝胶,随后用针对fre的抗体对膜进行探查。鉴定到了fre表达阳性的品系。
由质体靶向prnC、prnD、和fre表达阳性的拟南芥品系以及prnC和prnD阴性的拟南芥品系(通过Western印迹鉴定)采集叶片。在浸没在5mM MES pH5.7、400mM甘露醇缓冲液中时用MDA真空渗透叶片,并于室温在黑暗中放置过夜。随后,用乙酸乙酯萃取缓冲液,浓缩至干燥,并在HPLC上进行分析(如上文实施例4中所述)。
来自prnC、prnD、和fre阳性植株的叶片将MDA转变成APRN(大约5%)。在3小时的保温时间里检测到转变。此外,大约30%的APRN转变成硝吡咯菌素。另外,阴性对照即来自不表达prnC或prnD的植株的叶片不显示MDA向APRN或硝吡咯菌素的转变。
将上文引用的参考发表物都完整收入本文作为参考。
           序列表<110>Novartis AG<120>用于卤化反应的组合物和方法<130>Case S-31082A<140><141><150>US 60/228801<151>1999-12-15<150>US 60/219343<151>2000-01-03<160>35<170>PatentIn Ver.2.0<210>1<211>16<212>PRT<213>人工序列<220><223>人工序列的描述:氨基酸共有结构域<400>1Xaa Ala Ala Trp Xaa Ala Ala Trp Xaa Ala Ala Ile Pro Xaa Ala Ala1               5              10                      15<210>2<211>1617<212>DNA<213>荧光假单胞菌(Pseudomonas fluorescens)<220><221>CDS<222>(1)..(1617)<400>2atg aac aag ccg atc aag aat atc gtc atc gtg ggc ggc ggt act gcg    48Met Asn Lys pro Ile Lys Asn Ile Val Ile Val Gly Gly Gly Thr Ala1               5                  10                 15ggc tgg atg gcc gcc tcg tac ctc gtc cgg gcc ctc caa cag cag gcg    96Gly Trp Met Ala Ala Ser Tyr Leu Val Arg Ala Leu Gln Gln Gln Ala
         20                  25                  30aac att acg ctc atc gaa tct gcg gcg atc cct cgg atc ggc gtg ggc    144Asn Ile Thr Leu Ile Glu Ser Ala Ala Ile Pro Arg Ile Gly Val Gly
     35                  40                  45gaa gcg acc atc cca agt ttg cag aag gtg ttc ttc gat ttc ctc ggg    192Glu Ala Thr Ile Pro Ser Leu Gln Lys Val Phe Phe Asp Phe Leu Gly
 50                  55                  60ata ccg gag cgg gaa tgg atg ccc caa gtg aac ggc gcg ttc aag gcc    240Ile Pro Glu Arg Glu Trp Met Pro Gln Val Asn Gly Ala Phe Lys Ala65                  70                  75                  80gcg atc aag ttc gtg aat tgg aga aag tct ccc gac ccc tcg cgc gac    288Ala Ile Lys Phe Val Asn Trp Arg Lys Ser Pro Asp Pro Ser Arg Asp
             85                  90                  95gat cac ttc tac cat ttg ttc ggc aac gtg ccg aac tgc gac ggc gtg    336Asp His Phe Tyr His Leu Phe Gly Asn Val Pro Asn Cys Asp Gly Val
         100                 105                110ccg ctt acc cac tac tgg ctg cgc aag cgc gaa cag ggc ttc cag cag    384Pro Leu Thr His Tyr Trp Leu Arg Lys Arg Glu Gln Gly Phe Gln Gln
    115                 120                 125ccg atg gag tac gcg tgc tac ccg cag ccc ggg gca ctc gac ggc aag    432Pro Met Glu Tyr Ala Cys Tyr Pro Gln Pro Gly Ala Leu Asp Gly Lys
130                 135                 140ctg gca ccg tgc ctg tcc gac ggc acc cgc cag atg tcc cac gcg tgg    480Leu Ala Pro Cys Leu Ser Asp Gly Thr Arg Gln Met Ser His Ala Trp145                 150                 155                 160cac ttc gac gcg cac ctg gtg gcc gac ttc ttg aag cgc tgg gcc gtc    528His Phe Asp Ala His Leu Val Ala Asp Phe Leu Lys Arg Trp Ala Val
            165                 170                 175gag cgc ggg gtg aac cgc gtg gtc gat gag gtg gtg gac gtt cgc ctg    576Glu Arg Gly Val Asn Arg Val Val Asp Glu Val Val Asp Val Arg Leu
        180                 185                 190aac aac cgc ggc tac atc tcc aac ctg ctc acc aag gag ggg cgg acg    624Asn Asn Arg Gly Tyr Ile Ser Asn Leu Leu Thr Lys Glu Gly Arg Thr
    195                 200                 205ctg gag gcg gac ctg ttc atc gac tgc tcc ggc atg cgg ggg ctc ctg    672Leu Glu Ala Asp Leu Phe Ile Asp Cys Ser Gly Met Arg Gly Leu Leu
210                 215                 220atc aat cag gcg ctg aag gaa ccc ttc atc gac atg tcc gac tac ctg    720Ile Asn Gln Ala Leu Lys Glu Pro Phe Ile Asp Met Ser Asp Tyr Leu225                 230                 235                 240ctg tgc gac agc gcg gtc gcc agc gcc gtg ccc aac gac gac gcg cgc    768Leu Cys Asp Ser Ala Val Ala Ser Ala Val Pro Asn Asp Asp Ala Arg
            245                 250                 255gat ggg gtc gag ccg tac acc tcc tcg atc gcc atg aac tcg gga tgg    816Asp Gly Val Glu Pro Tyr Thr Ser Ser Ile Ala Met Asn Ser Gly Trp
        260                 265                 270acc tgg aag att ccg atg ctg ggc cgg ttc ggc agc ggc tac gtc ttc    864Thr Trp Lys Ile Pro Met Leu Gly Arg Phe Gly Ser Gly Tyr Val Phe
    275                 280                 285tcg agc cat ttc acc tcg cgc gac cag gcc acc gcc gac ttc ctc aaa    912Ser Ser His Phe Thr Ser Arg Asp Gln Ala Thr Ala Asp Phe Leu Lys
290                 295                 300ctc tgg ggc ctc tcg gac aat cag ccg ctc aac cag atc aag ttc cgg    960Leu Trp Gly Leu Ser Asp Asn Gln Pro Leu Asn Gln Ile Lys Phe Arg305                 310                 315                 320gtc ggg cgc aac aag cgg gcg tgg gtc aac aac tgc gtc tcg atc ggg    1008Val Gly Arg Asn Lys Arg Ala Trp Val Asn Asn Cys Val Ser Ile Gly
            325                 330                 335ctg tcg tcg tgc ttt ctg gag ccc ctg gaa tcg acg ggg atc tac ttc    1056Leu Ser Ser Cys Phe Leu Glu Pro Leu Glu Ser Thr Gly Ile Tyr Phe
        340                 345                 350atc tac gcg gcg ctt tac cag ctc gtg aag cac ttc ccc gac acc tcg    1104Ile Tyr Ala Ala Leu Tyr Gln Leu Val Lys His Phe Pro Asp Thr Ser
    355                 360                 365ttc gac ccg cgg ctg agc gac gct ttc aac gcc gag atc gtc cac atg    1152Phe Asp Pro Arg Leu Ser Asp Ala Phe Asn Ala Glu Ile Val His Met
370                 375                 380ttc gac gac tgc cgg gat ttc gtc caa gcg cac tat ttc acc acg tcg    1200Phe Asp Asp Cys Arg Asp Phe Val Gln Ala His Tyr Phe Thr Thr Ser385                 390                 395                 400cgc gat gac acg ccg ttc tgg ctc gcg aac cgg cac gac ctg cgg ctc    1248Arg Asp Asp Thr Pro Phe Trp Leu Ala Asn Arg His Asp Leu Arg Leu
            405                 410                 415tcg gac gcc atc aaa gag aag gtt cag cgc tac aag gcg ggg ctg ccg    1296Ser Asp Ala Ile Lys Glu Lys Val Gln Arg Tyr Lys Ala Gly Leu Pro
        420                 425                 430ctg acc acc acg tcg ttc gac gat tcc acg tac tac gag acc ttc gac    1344Leu Thr Thr Thr Ser Phe Asp Asp Ser Thr Tyr Tyr Glu Thr Phe Asp
    435                 440                 445tac gaa ttc aag aat ttc tgg ttg aac ggc aac tac tac tgc atc ttt    1392Tyr Glu phe Lys Asn Phe Trp Leu Asn Gly Asn Tyr Tyr Cys I1e Phe
450                 455                 460gcc ggc ttg ggc atg ctg ccc gac cgg tcg ctg ccg ctg ttg cag cac    1440Ala Gly Leu Gly Met Leu Pro Asp Arg Ser Leu Pro Leu Leu Gln His465                 470                 475                 480cga ccg gag tcg atc gag aaa gcc gag gcg atg ttc gcc agc atc cgg    1488Arg Pro Glu Ser Ile Glu Lys Ala Glu Ala Met Phe Ala Ser Ile Arg
            485                 490                 495cgc gag gcc gag cgt ctg cgc acc agc ctg ccg aca aac tac gac tac    1536Arg Glu Ala Glu Arg Leu Arg Thr Ser Leu Pro Thr Asn Tyr Asp Tyr
        500                 505                 510ctg cgg tcg ctg cgt gac ggc gac gcg ggg ctg tcg cgc ggc cag cgt    1584Leu Arg Ser Leu Arg Asp Gly Asp Ala Gly Leu Ser Arg Gly Gln Arg
    515                 520                 525ggg ccg aag ctc gca gcg cag gaa agc ctg tag                        1617Gly Pro Lys Leu Ala Ala Gln Glu Ser Leu
530                 535<210>3<211>538<212>PRT<213>荧光假单胞菌<400>3Met Asn Lys Pro Ile Lys Asn Ile Val Ile Val Gly Gly Gly Thr Ala1               5                  10                  15Gly Trp Met Ala Ala Ser Tyr Leu Val Arg Ala Leu Gln Gln Gln Ala
         20                  25                  30Asn Ile Thr Leu Ile Glu Ser Ala Ala Ile Pro Arg Ile Gly Val Gly
     35                  40                  45Glu Ala Thr Ile Pro Ser Leu Gln Lys Val Phe Phe Asp Phe Leu Gly
 50                  55                  60Ile Pro Glu Arg Glu Trp Met Pro Gln Val Asn Gly Ala Phe Lys Ala65                  70                  75                  80Ala Ile Lys Phe Val Asn Trp Arg Lys Ser Pro Asp Pro Ser Arg Asp
             85                  90                  95Asp His Phe Tyr His Leu Phe Gly Asn Val Pro Asn Cys Asp Gly Val
        100                 105                 110Pro Leu Thr His Tyr Trp Leu Arg Lys Arg Glu Gln Gly Phe Gln Gln
    115                 120                 125Pro Met Glu Tyr Ala Cys Tyr Pro Gln Pro Gly Ala Leu Asp Gly Lys
130                 135                 140Leu Ala Pro Cys Leu Ser Asp Gly Thr Arg Gln Met Ser His Ala Trp145                 150                 155                 160His Phe Asp Ala His Leu Val Ala Asp Phe Leu Lys Arg Trp Als Val
            165                 170                 175Glu Arg Gly Val Asn Arg Val Val Asp Glu Val Val Asp Val Arg Leu
        180                 185                 190Asn Asn Arg Gly Tyr Ile Ser Asn Leu Leu Thr Lys Glu Gly Arg Thr
    195                 200                 205Leu Glu Ala Asp Leu Phe Ile Asp Cys Ser Gly Met Arg Gly Leu Leu
210                 215                 220Ile Asn Gln Ala Leu Lys Glu Pro Phe Ile Asp Met Ser Asp Tyr Leu225                 230                 235                 240Leu Cys Asp Ser Ala Val Ala Ser Ala Val Pro Asn Asp Asp Ala Arg
            245                 250                 255Asp Gly Val Glu Pro Tyr Thr Ser Ser Ile Ala Met Asn Ser Gly Trp
        260                 265                 270Thr Trp Lys Ile Pro Met Leu Gly Arg Phe Gly Ser Gly Tyr Val Phe
    275                 280                 285Ser Ser His Phe Thr Ser Arg Asp Gln Ala Thr Ala Asp Phe Leu Lys
290                 295                 300Leu Trp Gly Leu Ser Asp Asn Gln Pro Leu Asn Gln Ile Lys Phe Arg305                 310                 315                 320Val Gly Arg Asn Lys Arg Ala Trp Val Asn Asn Cys Val Ser Ile Gly
            325                 330                 335Leu Ser Ser Cys Phe Leu Glu Pro Leu Glu Ser Thr Gly Ile Tyr Phe
        340                 345                 350Ile Tyr Ala Ala Leu Tyr Gln Leu Val Lys His Phe Pro Asp Thr Ser
    355                 360                 365Phe Asp Pro Arg Leu Ser Asp Ala Phe Asn Ala Glu Ile Val His Met
370                 375                 380Phe Asp Asp Cys Arg Asp Phe Val Gln Ala His Tyr Phe Thr Thr Ser385                 390                 395                 400Arg Asp Asp Thr Pro Phe Trp Leu Ala Asn Arg His Asp Leu Arg Leu
            405                 410                 415Ser Asp Ala Ile Lys Glu Lys Val Gln Arg Tyr Lys Ala Gly Leu Pro
        420                 425                 430Leu Thr Thr Thr Ser Phe Asp Asp Ser Thr Tyr Tyr Glu Thr Phe Asp
    435                 440                 445Tyr Glu Phe Lys Asn Phe Trp Leu Asn Gly Asn Tyr Tyr Cys Ile Phe
450                 455                 460Ala Gly Leu Gly Met Leu Pro Asp Arg Ser Leu Pro Leu Leu Gln His465                 470                 475                 480Arg Pro Glu Ser Ile Glu Lys Ala Glu Ala Met Phe Ala Ser Ile Arg
            485                 490                 495Arg Glu Ala Glu Arg Leu Arg Thr Ser Leu Pro Thr Asn Tyr Asp Tyr
        500                 505                 510Leu Arg Ser Leu Arg Asp Gly Asp Ala Gly Leu Ser Arg Gly Gln Arg
    515                 520                 525Gly Pro Lys Leu Ala Ala Gln Glu Ser Leu
530                 535<210>4<21l>1704<212>DNA<213>荧光假单胞菌<220><221>CDS<222>(1)..(1704)<400>4atg act cag aag agc ccc gcg aac gaa cac gat agc aat cac ttc gac    48Met Thr Gln Lys Ser Pro Ala Asn Glu His Asp Ser Asn His Phe Asp1               5                  10                  15gta atc atc ctc ggc tcg ggc atg tcc ggc acc cag atg ggg gcc atc    96Val Ile Ile Leu Gly Ser Gly Met Ser Gly Thr Gln Met Gly Ala Ile
         20                  25                  30ttg gcc aaa caa cag ttt cgc gtg ctg atc atc gag gag tcg tcg cac    144Leu Ala Lys Gln Gln Phe Arg Val Leu Ile Ile Glu Glu Ser Ser His
     35                  40                  45ccg cgg ttc acg atc ggc gaa tcg tcg atc ccc gag acg tct ctt atg    192Pro Arg Phe Thr Ile Gly Glu Ser Ser Ile Pro Glu Thr Ser Leu Met
 50                  55                  60aac cgc atc atc gct gat cgc tac ggc att ccg gag ctc gac cac atc    240Asn Arg Ile Ile Ala Asp Arg Tyr Gly Ile Pro Glu Leu Asp His Ile65                  70                  75                  80acg tcg ttt tat tcg acg caa cgt tac gtc gcg tcg agc acg ggc att    288Thr Ser Phe Tyr Ser Thr Gln Arg Tyr Val Ala Ser Ser Thr Gly Ile
             85                  90                  95aag cgc aac ttc ggc ttc gtg ttc cac aag ccc ggc cag gag cac gac    336Lys Arg Asn Phe Gly Phe Val Phe His Lys Pro Gly Gln Glu His Asp
        100                 105                 110ccg aag gag ttc acc cag tgc gtc att ccc gag ctg ccg tgg ggg ccg    384Pro Lys Glu Phe Thr Gln Cys Val Ile Pro Glu Leu Pro Trp Gly Pro
    115                 120                 125gag agc cat tat tac cgg caa gac gtc gac gcc tac ttg ttg caa gcc    432Glu Ser His Tyr Tyr Arg Gln Asp Val Asp Ala Tyr Leu Leu Gln Ala
130                 135                 140gcc att aaa tac ggc tgc aag gtc cac cag aaa act acc gtg acc gaa    480Ala Ile Lys Tyr Gly Cys Lys Val His Gln Lys Thr Thr Val Thr Glu145                 150                 155                 160tac cac gcc gat aaa gac ggc gtc gcg gtg acc acc gcc cag ggc gaa    528Tyr His Ala Asp Lys Asp Gly Val Ala Val Thr Thr Ala Gln Gly Glu
            165                 170                 175cgg ttc acc ggc cgg tac atg atc gac tgc gga gga cct cgc gcg ccg    576Arg Phe Thr Gly Arg Tyr Met Ile Asp Cys Gly Gly Pro Arg Ala Pro
        180                 185                 190ctc gcg acc aag ttc aag ctc cgc gaa gaa ccg tgt cgc ttc aag acg    624Leu Ala Thr Lys Phe Lys Leu Arg Glu Glu Pro Cys Arg Phe Lys Thr
    195                 200                 205cac tcg cgc agc ctc tac acg cac atg ctc ggg gtc aag ccg ttc gac    672His Ser Arg Ser Leu Tyr Thr His Met Leu Gly Val Lys Pro Phe Asp
210                 215                 220gac atc ttc aag gtc aag ggg cag cgc tgg cgc tgg cac gag ggg acc    720Asp Ile Phe Lys Val Lys Gly Gln Arg Trp Arg Trp His Glu Gly Thr225                 230                 235                 240ttg cac cac atg ttc gag ggc ggc tgg ctc tgg gtg att ccg ttc aac    768Leu His His Met Phe Glu Gly Gly Trp Leu Trp Val Ile Pro Phe Asn
            245                 250                 255aac cac ccg cgg tcg acc aac aac ctg gtg agc gtc ggc ctg cag ctc    816Asn His Pro Arg Ser Thr Asn Asn Leu Val Ser Val Gly Leu Gln Leu
        260                 265                 270gac ccg cgt gtc tac ccg aaa acc gac atc tcc gca cag cag gaa ttc    864Asp Pro Arg Val Tyr Pro Lys Thr Asp Ile Ser Ala Gln Gln Glu Phe
    275                 280                 285gat gag ttc ctc gcg cgg ttc ccg agc atc ggg gct cag ttc cgg gac    912Asp Glu Phe Leu Ala Arg Phe Pro Ser Ile Gly Ala Gln Phe Arg Asp
290                 295                 300gcc gtg ccg gtg cgc gac tgg gtc aag acc gac cgc ctg caa ttc tcg    960Ala Val Pro Val Arg Asp Trp Val Lys Thr Asp Arg Leu Gln Phe Ser305                 310                 315                 320tcg aac gcc tgc gtc ggc gac cgc tac tgc ctg atg ctg cac gcg aac    1008Ser Asn Ala Cys Val Gly Asp Arg Tyr Cys Leu Met Leu His Ala Asn
            325                 330                 335ggc ttc atc gac ccg ctc ttc tcc cgg ggg ctg gaa aac acc gcg gtg    1056Gly Phe Ile Asp Pro Leu Phe Ser Arg Gly Leu Glu Asn Thr Ala Val
        340                 345                 350acc atc cac gcg ctc gcg gcg cgc ctc atc aag gcg ctg cgc gac gac    1104Thr Ile His Ala Leu Ala Ala Arg Leu Ile Lys Ala Leu Arg Asp Asp
    355                 360                 365gac ttc tcc ccc gag cgc ttc gag tac atc gag cgc ctg cag caa aag    1152Asp Phe Ser Pro Glu Arg Phe Glu Tyr Ile Glu Arg Leu Gln Gln Lys
370                 375                 380ctt ttg gac cac aac gac gac ttc gtc agc tgc tgc tac acg gcg ttc    1200Leu Leu Asp His Asn Asp Asp Phe Val Ser Cys Cys Tyr Thr Ala Phe385                 390                 395                 400tcg gac ttc cgc cta tgg gac gcg ttc cac agg ctg tgg gcg gtc ggc    1248Ser Asp Phe Arg Leu Trp Asp Ala Phe His Arg Leu Trp Ala Val Gly
            405                 410                 415acc atc ctc ggg cag ttc cgg ctc gtg cag gcc cac gcg agg ttc cgc    1296Thr Ile Leu Gly Gln Phe Arg Leu Val Gln Ala His Ala Arg Phe Arg
        420                 425                 430gcg tcg cgc aac gag ggc gac ctc gat cac ctc gac aac gac cct ccg    1344Ala Ser Arg Asn Glu Gly Asp Leu Asp His Leu Asp Asn Asp Pro Pro
    435                 440                 445tat ctc gga tac ctg tgc gcg gac atg gag gag tac tac cag ttg ttc    1392Tyr Leu Gly Tyr Leu Cys Ala Asp Met Glu Glu Tyr Tyr Gln Leu Phe
450                 455                 460aac gac gcc aaa gcc gag gtc gag gcc gtg agt gcc ggg cgc aag ccg    1440Asn Asp Ala Lys Ala Glu Val Glu Ala Val Ser Ala Gly Arg Lys Pro465                 470                 475                 480gcc gat gag gcc gcg gcg cgg att cac gcc ctc att gac gaa cga gac    1488Ala Asp Glu Ala Ala Ala Arg Ile His Ala Leu Ile Asp Glu Arg Asp
            485                 490                 495ttc gcc aag ccg atg ttc ggc ttc ggg tac tgc atc acc ggg gac aag    1536Phe Ala Lys Pro Met Phe Gly Phe Gly Tyr Cys Ile Thr Gly Asp Lys
        500                 505                 510ccg cag ctc aac aac tcg aag tac agc ctg ctg ccg gcg atg cgg ctg    1584Pro Gln Leu Asn Asn Ser Lys Tyr Ser Leu Leu Pro Ala Met Arg Leu
    515                 520                 525atg tac tgg acg caa acc cgc gcg ccg gca gag gtg aaa aag tac ttc    1632Met Tyr Trp Thr G1n Thr Arg Ala Pro Ala Glu Val Lys Lys Tyr Phe
530                 535                 540gac tac aac ccg atg ttc gcg ctg ctc aag gcg tac atc acg acc cgc    1680Asp Tyr Asn Pro Met Phe Ala Leu Leu Lys Ala Tyr Ile Thr Thr Arg545                 550                 555                 560atc ggc ctg gcg ctg aag aag tag                                    1704Ile Gly Leu Ala Leu Lys Lys
            565<210>5<211>567<212>PRT<213>荧光假单胞菌<400>5Met Thr Gln Lys Ser Pro Ala Asn Glu His Asp Ser Asn His Phe Asp1               5                  10                  15Val Ile Ile Leu Gly Ser Gly Met Ser Gly Thr Gln Met Gly Ala Ile
         20                  25                  30Leu Ala Lys Gln Gln Phe Arg Val Leu Ile Ile Glu Glu Ser Ser His
     35                  40                  45Pro Arg Phe Thr Ile Gly Glu Ser Ser Ile Pro Glu Thr Ser Leu Met
 50                  55                  60Asn Arg Ile Ile Ala Asp Arg Tyr Gly Ile Pro Glu Leu Asp His Ile65                  70                  75                  80Thr Ser Phe Tyr Ser Thr Gln Arg Tyr Val Ala Ser Ser Thr Gly Ile
             85                  90                  95Lys Arg Asn Phe Gly Phe Val Phe His Lys Pro Gly Gln Glu His Asp
        100                 105                 110Pro Lys Glu Phe Thr Gln Cys Val Ile Pro Glu Leu Pro Trp Gly Pro
    115                 120                 125Glu Ser His Tyr Tyr Arg Gln Asp Val Asp Ala Tyr Leu Leu Gln Ala
130                 135                 140Ala Ile Lys Tyr Gly Cys Lys Val His Gln Lys Thr Thr Val Thr Glu145                 150                 155                 160Tyr His Ala Asp Lys Asp Gly Val Ala Val Thr Thr Ala Gln Gly Glu
            165                 170                 175Arg Phe Thr Gly Arg Tyr Met Ile Asp Cys Gly Gly Pro Arg Ala Pro
        180                 185                 190Leu Ala Thr Lys Phe Lys Leu Arg Glu Glu Pro Cys Arg Phe Lys Thr
    195                 200                 205His Ser Arg Ser Leu Tyr Thr His Met Leu Gly Val Lys Pro Phe Asp
210                 215                 220Asp Ile Phe Lys Val Lys Gly Gln Arg Trp Arg Trp His Glu Gly Thr225                 230                 235                 240Leu His His Met Phe Glu Gly Gly Trp Leu Trp Val Ile Pro Phe Asn
            245                 250                 255Ash His Pro Arg Ser Thr Asn Asn Leu Val Ser Val Gly Leu Gln Leu
        260                 265                 270Asp Pro Arg Val Tyr Pro Lys Thr Asp Ile Ser Ala Gln Gln Glu Phe
    275                 280                 285Asp Glu Phe Leu Ala Arg Phe Pro Ser Ile Gly Ala Gln Phe Arg Asp
290                 295                 300Ala Val Pro Val Arg Asp Trp Val Lys Thr Asp Arg Leu Gln Phe Ser305                 310                 315                 320Ser Asn Ala Cys Val Gly Asp Arg Tyr Cys Leu Met Leu His Ala Asn
            325                 330                 335Gly Phe Ile Asp Pro Leu Phe Ser Arg Gly Leu Glu Asn Thr Ala Val
        340                 345                 350Thr Ile His Ala Leu Ala Ala Arg Leu Ile Lys Ala Leu Arg Asp Asp
    355                 360                 365Asp Phe Ser Pro Glu Arg Phe Glu Tyr Ile Glu Arg Leu Gln Gln Lys
370                 375                 380Leu Leu Asp His Asn Asp Asp Phe Val Ser Cys Cys Tyr Thr Ala Phe385                390                 395                 400Ser Asp Phe Arg Leu Trp Asp Ala Phe His Arg Leu Trp Ala Val Gly
            405                 410                 415Thr Ile Leu Gly Gln Phe Arg Leu Val Gln Ala His Ala Arg Phe Arg
        420                 425                 430Ala Ser Arg Asn Glu Gly Asp Leu Asp His Leu Asp Asn Asp Pro Pro
    435                 440                 445Tyr Leu Gly Tyr Leu Cys Ala Asp Met Glu Glu Tyr Tyr Gln Leu Phe
450                 455                 460Asn Asp Ala Lys Ala Glu Val Glu Ala Val Ser Ala Gly Arg Lys Pro465                 470                 475                 480Ala Asp Glu Ala Ala Ala Arg Ile His Ala Leu Ile Asp Glu Arg Asp
            485                 490                 495Phe Ala Lys Pro Met Phe Gly Phe Gly Tyr Cys Ile Thr Gly Asp Lys
        500                 505                 510Pro Gln Leu Asn Asn Ser Lys Tyr Ser Leu Leu Pro Ala Met Arg Leu
    515                 520                 525Met Tyr Trp Thr Gln Thr Arg Ala Pro Ala Glu Val Lys Lys Tyr Phe
530                 535                 540Asp Tyr Asn Pro Met Phe Ala Leu Leu Lys Ala Tyr Ile Thr Thr Arg545                 550                 555                 560Ile Gly Leu Ala Leu Lys Lys
            565<210>6<211>1350<212>DNA<213>荧光假单胞菌<220><221>CDS<222>(1)..(1350)<400>6atg agc gat cat gat tat gat gta gtg att atc ggt ggc ggg ccg gcg    48Met Ser Asp His Asp Tyr Asp Val Val Ile Ile Gly Gly Gly Pro Ala1               5                  10                  15ggt tcg acc atg gcc tcc tac ctg gca aaa gcc ggt gtc aaa tgc gcg    96Gly Ser Thr Met Ala Ser Tyr Leu Ala Lys Ala Gly Val Lys Cys Ala
         20                  25                  30gtg ttc gaa aaa gaa ctg ttc gag cgc gag cat gtt ggc gag tcg ctg    144Val Phe Glu Lys Glu Leu Phe Glu Arg Glu His Val Gly Glu Ser Leu
     35                  40                  45gta ccg gcc acc act ccg gtg ctg ctg gaa atc ggg gtg atg gaa aag    192Val Pro Ala Thr Thr Pro Val Leu Leu Glu Ile Gly Val Met Glu Lys
 50                  55                  60atc gag aaa gcc aac ttc ccg aag aag ttc ggc gct gcc tgg acc tcg    240Ile Glu Lys Ala Asn Phe Pro Lys Lys Phe Gly Ala Ala Trp Thr Ser65                  70                  75                  80gca gat tcc ggc ccc gaa gac aag atg ggc ttc cag ggg ctg gac cac    288Ala Asp Ser Gly Pro Glu Asp Lys Met Gly Phe Gln Gly Leu Asp His
             85                  90                  95gat ttc cgt tcg gcg gaa atc ctc ttc aac gag cgc aag cag gaa ggg    336Asp Phe Arg Ser Ala Glu Ile Leu Phe Asn Glu Arg Lys Gln Glu Gly
        100                 105                 110gtc gat cgc gac ttc acg ttc cac gtc gac cgc ggc aag ttc gac cgc    384Val Asp Arg Asp Phe Thr Phe His Val Asp Arg Gly Lys Phe Asp Arg
    115                 120                 125att ctt ctg gag cac gca ggt tcg ctg ggg gcc aag gtc ttc cag ggc    432Ile Leu Leu Glu His Ala Gly Ser Leu Gly Ala Lys Val Phe Gln Gly
130                 135                 140gtg gag atc gct gac gtc gag ttt ctc agc ccg ggc aat gtc att gtc    480Val Glu Ile Ala Asp Val Glu Phe Leu Ser Pro Gly Asn Val Ile Val145                 150                 155                 160aat gcc aag ctg ggc aag cgc agc gtg gag atc aag gcc aag atg gtg    528Ash Ala Lys Leu Gly Lys Arg Ser Val Glu Ile Lys Ala Lys Met Val
            165                 170                 175gtg gat gcc agc ggt cgc aac gtg ctg ctg ggc cgc cgg ctg ggc ttg    576Val Asp Ala Ser Gly Arg Asn Val Leu Leu Gly Arg Arg Leu Gly Leu
        180                 185                 190cga gaa aag gac ccg gtc ttc aac cag ttc gcg att cac tcc tgg ttc    624Arg Glu Lys Asp Pro Val Phe Asn Gln Phe Ala Ile His Ser Trp Phe
    195                 200                 205gac aac ttc gac cgc aag tcg gcg acg caa agc ccg gac aag gtc gac    672Asp Asn Phe Asp Arg Lys Ser Ala Thr Gln Ser Pro Asp Lys Val Asp
210                 215                 220tac atc ttc att cac ttc ctg ccg atg acc aat acc tgg gtc tgg cag    720Tyr Ile Phe Ile His Phe Leu Pro Met Thr Asn Thr Trp Val Trp Gln225                 230                 235                 240atc ccg atc acc gaa acc att acc agc gtg ggc gtg gtt acg cag aag    768Ile Pro Ile Thr Glu Thr Ile Thr Ser Val Gly Val Val Thr Gln Lys
            245                 250                 255cag aac tac acc aac tcc gac ctc acc tat gaa gag ttc ttc tgg gaa    816Gln Asn Tyr Thr Asn Ser Asp Leu Thr Tyr Glu Glu Phe Phe Trp Glu
        260                 265                 270gcg gtg aag acc cgg gaa aac ctg cat gac gcg ctg aag gca tcg gag    864Ala Val Lys Thr Arg Glu Asn Leu His Asp Ala Leu Lys Ala Ser Glu
    275                 280                 285cag gtc cgc ccg ttc aag aaa gag gcg gac tac agc tac ggc atg aaa    912Gln Val Arg Pro Phe Lys Lys Glu Ala Asp Tyr Ser Tyr Gly Met Lys
290                 295                 300gaa gtc tgt ggc gac agc ttc gtg ctg atc ggc gat gcc gca cgg ttc    960Glu Val Cys Gly Asp Ser Phe Val Leu Ile Gly Asp Ala Ala Arg Phe305                 310                 315                 320gtc gac ccg atc ttc tcc agc ggc gtc agc gtt gca ctc aac agt gcg    1008Val Asp Pro Ile Phe Ser Ser Gly Val Ser Val Ala Leu Asn Ser Ala
            325                 330                 335cgc atc gcc agc ggc gac atc atc gag gcg gtg aag aac aac gac ttt    1056Arg Ile Ala Ser Gly Asp Ile Ile Glu Ala Val Lys Asn Asn Asp Phe
        340                 345                 350agc aag tcc agt ttc act cac tac gaa ggc atg atc agg aat ggc atc    1104Ser Lys Ser Ser Phe Thr His Tyr Glu Gly Met Ile Arg Asn Gly Ile
    355                 360                 365aag aac tgg tat gag ttc atc acg ctc tat tac cgc ctg aac atc ctc    1152Lys Ash Trp Tyr Glu Phe Ile Thr Leu Tyr Tyr Arg Leu Asn Ile Leu
370                 375                 380ttc acc gcg ttc gtt caa gac cca cgc tac cgc ctg gac atc ctg caa    1200Phe Thr Ala Phe Val Gln Asp Pro Arg Tyr Arg Leu Asp Ile Leu Gln385                 390                 395                 400ttg ctg caa ggg gac gtc tac agc ggc aag cgc ctg gaa gtg ctg gac    1248Leu Leu Gln Gly Asp Val Tyr Ser Gly Lys Arg Leu Glu Val Leu Asp
            405                 410                 415aag atg cgc gaa atc atc gct gcg gtt gaa agc gac ccg gaa cac ctc    1296Lys Met Arg Glu Ile Ile Ala Ala Val Glu Ser Asp Pro Glu His Leu
        420                 425                 430tgg cac aag tac ctg ggc gac atg cag gtt cct acc gcc aaa ccc gcg    1344Trp His Lys Tyr Leu Gly Asp Met Gln Val Pro Thr Ala Lys Pro Ala
    435                 440                 445ttc taa                                                            1350Phe
 450<210>7<211>449<212>PRT<213>荧光假单胞菌<400>7Met Ser Asp His Asp Tyr Asp Val Val Ile Ile Gly Gly Gly Pro Ala1               5                  10                  15Gly Ser Thr Met Ala Ser Tyr Leu Ala Lys Ala Gly Val Lys Cys Ala
         20                  25                  30Val Phe Glu Lys Glu Leu Phe Glu Arg Glu His Val Gly Glu Ser Leu
     35                  40                  45Val Pro Ala Thr Thr Pro Val Leu Leu Glu Ile Gly Val Met Glu Lys
 50                  55                  60Ile Glu Lys Ala Asn Phe Pro Lys Lys Phe Gly Ala Ala Trp Thr Ser65                  70                  75                  80Ala Asp Ser Gly Pro Glu Asp Lys Met Gly Phe Gln Gly Leu Asp His
             85                  90                  95Asp Phe Arg Ser Ala Glu Ile Leu Phe Asn Glu Arg Lys Gln Glu Gly
        100                 105                 110Val Asp Arg Asp Phe Thr Phe His Val Asp Arg Gly Lys Phe Asp Arg
    115                 120                 125Ile Leu Leu Glu His Ala Gly Ser Leu Gly Ala Lys Val Phe Gln Gly
130                 135                 140Val Glu Ile Ala Asp Val Glu Phe Leu Ser Pro Gly Asn Val Ile Val145                 150                 155                 160Asn Ala Lys Leu Gly Lys Arg Ser Val Glu Ile Lys Ala Lys Met Val
            165                 170                 175Val Asp Ala Ser Gly Arg Asn Val Leu Leu Gly Arg Arg Leu Gly Leu
        180                 185                 190Arg Glu Lys Asp Pro Val Phe Asn Gln Phe Ala Ile His Ser Trp Phe
    195                 200                 205Asp Asn Phe Asp Arg Lys Ser Ala Thr Gln Ser Pro Asp Lys Val Asp
210                 215                 220Tyr Ile Phe Ile His Phe Leu Pro Met Thr Asn Thr Trp Val Trp Gln225                 230                 235                 240Ile Pro Ile Thr Glu Thr Ile Thr Ser Val Gly Val Val Thr Gln Lys
            245                 250                 255Gln Asn Tyr Thr Asn Ser Asp Leu Thr Tyr Glu Glu Phe Phe Trp Glu
        260                 265                 270Ala Val Lys Thr Arg Glu Asn Leu His Asp Ala Leu Lys Ala Ser Glu
    275                 280                 285Gln Val Arg Pro Phe Lys Lys Glu Ala Asp Tyr Ser Tyr Gly Met Lys
290                 295                 300Glu Val Cys Gly Asp Ser Phe Val Leu Ile Gly Asp Ala Ala Arg Phe305                 310                 315                 320Val Asp Pro Ile Phe Ser Ser Gly Val Ser Val Ala Leu Asn Ser Ala
            325                 330                 335Arg Ile Ala Ser Gly Asp Ile Ile Glu Ala Val Lys Asn Asn Asp Phe
        340                 345                 350Ser Lys Ser Ser Phe Thr His Tyr Glu Gly Met Ile Arg Ash Gly Ile
    355                 360                 365Lys Asn Trp Tyr Glu Phe Ile Thr Leu Tyr Tyr Arg Leu Asn Ile Leu
370                 375                 380Phe Thr Ala Phe Val Gln Asp Pro Arg Tyr Arg Leu Asp Ile Leu Gln385                 390                 395                 400Leu Leu Gln Gly Asp Val Tyr Ser Gly Lys Arg Leu Glu Val Leu Asp
            405                 410                 415Lys Met Arg Glu Ile Ile Ala Ala Val Glu Ser Asp Pro Glu His Leu
        420                 425                 430Trp His Lys Tyr Leu Gly Asp Met Gln Val Pro Thr Ala Lys Pro Ala
    435                 440                 445Phe<210>8<211>1641<212>DNA<213>荧光假单胞菌<220><221>CDS<222>(1)..(1641)<400>8gtg gtt atg aac gat gtg cag tct ggc aag gcg cca gag cat tac gac    48Val Val Met Asn Asp Val Gln Ser Gly Lys Ala Pro Glu His Tyr Asp1               5                  10                  15att ctc ttg gcg ggc aac agc atc agc gtg atc atg ctc gcc gcc tgc    96Ile Leu Leu Ala Gly Asn Ser Ile Ser Val Ile Met Leu Ala Als Cys
         20                  25                  30ctg gcc cgg aac aag gtc cgg gtc ggt ttg ttg cgc aac cgg cag atg    144Leu Ala Arg Asn Lys Val Arg Val Gly Leu Leu Arg Asn Arg Gln Met
     35                  40                  45ccc ccc gac ctt acc ggt gag gcg acg att ccc tat acc tcg atg att    192Pro Pro Asp Leu Thr Gly Glu Ala Thr Ile Pro Tyr Thr Ser Met Ile
 50                  55                  60ttc gag ctg att gcc gac cgc tat ggc gtg ccg gaa ata aag aat atc    240Phe Glu Leu Ile Ala Asp Arg Tyr Gly Val Pro Glu Ile Lys Asn Ile65                 70                  75                  80gcc cgc acc cgg gat atc cag cag aag gtg atg ccg tct tcc ggg gtc    288Ala Arg Thr Arg Asp Ile Gln Gln Lys Val Met Pro Ser Ser Gly Val
             85                  90                  95aag aag aac ctc ggg ttc atc tat cac cag cgc agc cgg gcg gtg gac    336Lys Lys Asn Leu Gly Phe Ile Tyr His Gln Arg Ser Arg Ala Val Asp
        100                 105                 110ctg ggc cag gcg ctg caa ttc aac gtg ccc tcc gag cat ggc gag aac    384Leu Gly Gln Ala Leu Gln Phe Asn Val Pro Ser Glu His Gly Glu Asn
    115                 120                 125cat ctg ttc agg ccc gat atc gat gcc tat ctg ctg gcg gcg gcc atc    432His Leu Phe Arg Pro Asp Ile Asp Ala Tyr Leu Leu Ala Ala Ala Ile
130                 135                 140ggt tat ggc gcg cag ctg gtg gag atc gat aac agc cca gag gtg ctg    480Gly Tyr Gly Ala Gln Leu Val Glu Ile Asp Asn Ser Pro Glu Val Leu145                 150                 155                 160gtc gag gac agc ggg gtc aag gta gct acg gca ctg ggg cgc tgg gtc    528Val Glu Asp Ser Gly Val Lys Val Ala Thr Ala Leu Gly Arg Trp Val
            165                 170                 175act gcc gat ttc atg gtt gat ggc agc cag ggc ggc cag gtg ctg gcg    576Thr Ala Asp Phe Met Val Asp Gly Ser Gln Gly Gly Gln Val Leu Ala
        180                 185                 190cgg cag gct ggc ctg gtc agc cag gct tcg acg cag aag acc cgg acc    624Arg Gln Ala Gly Leu Val Ser Gln Ala Ser Thr Gln Lys Thr Arg Thr
    195                 200                 205ctg gaa ttc tcc act cat atg ctc ggg gtg gtg ccg ttc gat gag tgc    672Leu Glu Phe Ser Thr His Met Leu Gly Val Val Pro Phe Asp Glu Cys
210                 215                 220gtg cag ggc gat ttt ccc ggc cag tgg cat ggc ggc act ctg cat cac    720Val Gln Gly Asp Phe Pro Gly Gln Trp His Gly Gly Thr Leu His His225                 230                 235                 240gtg ttc gat ggg ggc tgg gtg ggg gtc atc ccg ttc aac aac cat cag    768Val Phe Asp Gly Gly Trp Val Gly Val Ile Pro Phe Asn Asn His Gln
            245                 250                 255cac tcg cgc aac cct ttg gtc agc gtg ctg gtt tca ctg cgt gag gac    816His Ser Arg Asn Pro Leu Val Ser Val Leu Val Ser Leu Arg Glu Asp
        260                 265                 270ctc tgc ccg agc atg gac ggc gac cag gtc ctg gcc ggc ctg atc gag    864Leu Cys Pro Ser Met Asp Gly Asp Gln Val Leu Ala Gly Leu Ile Glu
    275                 280                 285ctg tac ccc ggc ctg ggg cgg cac ctg tcc ggc gcc cgg cgg gtg cgc    912Leu Tyr Pro Gly Leu Gly Arg His Leu Ser Gly Ala Arg Arg Val Arg
 290                295                 300gag tgg gtg ctg cgc cag ccg ccc cgg cag gtc tat cgc acg gcg ctc    960Glu Trp Val Leu Arg Gln Pro Pro Arg Gln Val Tyr Arg Thr Ala Leu305                  310                315                 320gaa cgc cgc tgc ctg atg ttc gac gag ggc gcc gcg agc aac gat ctg    1008Glu Arg Arg Cys Leu Met Phe Asp Glu Gly Ala Ala Ser Asn Asp Leu
            325                 330                 335ttg ttc tcg cgc aag ctg tcc aat gct gcg gaa ctg gtt ctg gcc ctg    1056Leu Phe Ser Arg Lys Leu Ser Asn Ala Ala Glu Leu Val Leu Ala Leu
        340                 345                 350gcg cac cgg ctg atc aag gcg gcg cac agc ggt gac tac cgc agc ccg    1104Ala His Arg Leu Ile Lys Ala Ala His Ser Gly Asp Tyr Arg Ser Pro
    355                 360                 365gcc ctg aat gat ttt gtc ctg acc cag gac agc atc atc agc ttg agt    1152Ala Leu Asn Asp Phe Val Leu Thr Gln Asp Ser Ile Ile Ser Leu Ser
370                 375                 380gac cgg atc gcc tta gcg gct tat gtg tcg ttt cgc gac ccc gag ttg    1200Asp Arg Ile Ala Leu Ala Ala Tyr Val Ser Phe Arg Asp Pro Glu Leu385                 390                 395                 400tgg aat gcc ttc gcc cgt gtc tgg ctg ctg cag tcg att gcc gcc acc    1248Trp Asn Ala Phe Ala Arg Val Trp Leu Leu Gln Ser Ile Ala Ala Thr
            405                 410                 415atc acc gcg cgc aag atc aac gat gcc ttt gcc aag gac ctg gac ccg    1296Ile Thr Ala Arg Lys Ile Asn Asp Ala Phe Ala Lys Asp Leu Asp Pro
        420                 425                 430cga gtg ttc gat gaa atc gac cag ctc gca gag gac ggt ttc tgg atg    1344Arg Val Phe Asp Glu Ile Asp Gln Leu Ala Glu Asp Gly Phe Trp Met
    435                 440                 445cct ctg tat cgg ggg tac aag gat att ctc aac act acg ctg ggc ctt    1392Pro Leu Tyr Arg Gly Tyr Lys Asp Ile Leu Asn Thr Thr Leu Gly Leu
450                 455                 460tgt gat gac gtc aaa agc gcc aag gtc tct gct gcg cac gcg gcg agc    1440Cys Asp Asp Val Lys Ser Ala Lys Val Ser Ala Ala His Ala Ala Ser465                 470                 475                 480agc atc ttt gcg gag ctt gcc aac gcc agt ttt gtt ccg cct att ttt    1488Ser Ile Phe Ala Glu Leu Ala Asn Ala Ser Phe Val Pro Pro Ile Phe
            485                 490                 495gat ttt gct aat cct cac gct cgt gtc tat caa ctg acc acc ttg aga    1536Asp Phe Ala Asn Pro His Ala Arg Val Tyr Gln Leu Thr Thr Leu Arg
        500                 505                 510aag ctc aag gcg ctc tgg tgg ggc ctg atg caa gtg ccc tca gag gtc    1584Lys Leu Lys Ala Leu Trp Trp Gly Leu Met Gln Val Pro Ser Glu Val
    515                 520                 525gga cgg ctg att ttc tat cga tcc ttc aga aaa cct tcc ctg cgc aag    1632Gly Arg Leu Ile Phe Tyr Arg Ser Phe Arg Lys Pro Ser Leu Arg Lys
530                 535                 540gag agt tga                                                                             1641Glu Ser545<210>9<211>546<212>PRT<213>荧光假单胞菌<400>9Val Val Met Asn Asp Val Gln Ser Gly Lys Ala Pro Glu His Tyr Asp1               5                  10                  15Ile Leu Leu Ala Gly Asn Ser Ile Ser Val Ile Met Leu Ala Ala Cys
         20                  25                  30Leu Ala Arg Asn Lys Val Arg Val Gly Leu Leu Arg Asn Arg Gln Met
     35                  40                  45Pro Pro Asp Leu Thr Gly Glu Ala Thr Ile Pro Tyr Thr Ser Met Ile
 50                  55                  60Phe Glu Leu Ile Ala Asp Arg Tyr Gly Val Pro Glu Ile Lys Asn Ile65                  70                  75                  80Ala Arg Thr Arg Asp Ile Gln Gln Lys Val Met Pro Ser Ser Gly Val
             85                  90                  95Lys Lys Asn Leu Gly Phe Ile Tyr His Gln Arg Ser Arg Ala Val Asp
        100                 105                 110Leu Gly Gln Ala Leu Gln Phe Asn Val Pro Ser Glu His Gly Glu Asn
    115                 120                 125His Leu Phe Arg Pro Asp Ile Asp Ala Tyr Leu Leu Ala Ala Ala Ile
130                 135                 140Gly Tyr Gly Ala Gln Leu Val Glu Ile Asp Asn Ser Pro Glu Val Leu145                 150                 155                 160Val Glu Asp Ser Gly Val Lys Val Ala Thr Ala Leu Gly Arg Trp Val
            165                 170                 175Thr Ala Asp Phe Met Val Asp Gly Ser Gln Gly Gly Gln Val Leu Ala
        180                 185                 190Arg Gln Ala Gly Leu Val Ser Gln Ala Ser Thr Gln Lys Thr Arg Thr
    195                 200                 205Leu Glu Phe Ser Thr His Met Leu Gly Val Val Pro Phe Asp Glu Cys
210                 215                 220Val Gln Gly Asp Phe Pro Gly Gln Trp His Gly Gly Thr Leu His His225                 230                 235                 240Val Phe Asp Gly Gly Trp Val Gly Val Ile Pro Phe Asn Asn His Gln
            245                 250                 255His Ser Arg Asn Pro Leu Val Ser Val Leu Val Ser Leu Arg Glu Asp
        260                 265                 270Leu Cys Pro Ser Met Asp Gly Asp Gln Val Leu Ala Gly Leu Ile Glu
    275                 280                 285Leu Tyr Pro Gly Leu Gly Arg His Leu Ser Gly Ala Arg Arg Val Arg
290                 295                 300Glu Trp Val Leu Arg Gln Pro Pro Arg Gln Val Tyr Arg Thr Ala Leu305                 310                 315                 320Glu Arg Arg Cys Leu Met Phe Asp Glu Gly Ala Ala Ser Asn Asp Leu
            325                 330                 335Leu Phe Ser Arg Lys Leu Ser Asn Ala Ala Glu Leu Val Leu Ala Leu
        340                 345                 350Ala His Arg Leu Ile Lys Ala Ala His Ser Gly Asp Tyr Arg Ser Pro
    355                 360                 365Ala Leu Asn Asp Phe Val Leu Thr Gln Asp Ser Ile Ile Ser Leu Ser
370                 375                 380Asp Arg Ile Ala Leu Ala Ala Tyr Val Ser Phe Arg Asp Pro Glu Leu385                 390                 395                 400Trp Asn Ala Phe Ala Arg Val Trp Leu Leu Gln Ser Ile Ala Ala Thr
            405                 410                 415Ile Thr Ala Arg Lys Ile Asn Asp Ala Phe Ala Lys Asp Leu Asp Pro
        420                 425                 430Arg Val Phe Asp Glu Ile Asp Gln Leu Ala Glu Asp Gly Phe Trp Met
    435                 440                 445Pro Leu Tyr Arg Gly Tyr Lys Asp Ile Leu Asn Thr Thr Leu Gly Leu
450                 455                 460Cys Asp Asp Val Lys Ser Ala Lys Val Ser Ala Ala His Ala Ala Ser465                 470                 475                 480Ser Ile Phe Ala Glu Leu Ala Ash Ala Ser Phe Val Pro Pro Ile Phe
            485                 490                 495Asp Phe Ala Asn Pro His Ala Arg Val Tyr Gln Leu Thr Thr Leu Arg
        500                 505                 510Lys Leu Lys Ala Leu Trp Trp Gly Leu Met Gln Val Pro Ser Glu Val
    515                 520                 525Gly Arg Leu Ile Phe Tyr Arg Ser Phe Arg Lys Pro Ser Leu Arg Lys
   530                535                540Glu Ser545<210>10<211>1510<212>DNA<213>荧光假单胞菌<220><221>CDS<222>(1)..(1509)<400>10atg aat cag tac gac gtc att atc atc ggt agt ggt atc gcc ggc gcg    48Met Asn Gln Tyr Asp Val Ile Ile Ile Gly Ser Gly Ile Ala Gly Ala1               5                  10                  15ctg acc ggc gcc gtc ctc gcg aag tcc ggg ctg aac gtt ctg atc ctc    96Leu Thr Gly Ala Val Leu Ala Lys Ser Gly Leu Asn Val Leu Ile Leu
         20                  25                  30gac tcg gcc cag cac cca cga ttc tcc gtc ggc gaa gcg gcg aca ccg    144Asp Ser Ala Gln His Pro Arg Phe Ser Val Gly Glu Ala Ala Thr Pro
     35                  40                  45gaa agc ggt ttt ctg ctg cgt ttg ctc tca aag cgc ttc gac atc cct    192Glu Ser Gly Phe Leu Leu Arg Leu Leu Ser Lys Arg Phe Asp Ile Pro
 50                  55                  60gaa atc gcc tac ctc tcg cac ccc gac aag atc atc cag cac gtc ggt    240Glu Ile Ala Tyr Leu Ser His Pro Asp Lys Ile Ile Gln His Val Gly65                  70                  75                  80tcg agc gcc tgc ggg atc aag ctg ggc ttc agt ttt gcc tgg cat caa    288Ser Ser Ala Cys Gly Ile Lys Leu Gly Phe Ser Phe Ala Trp His Gln
             85                  90                  95gag aac gcg ccg tcg tcc ccc gac cac ctt gtg gcc ccg ccg ctg aag    336Glu Asn Ala Pro Ser Ser Pro Asp His Leu Val Ala Pro Pro Leu Lys
        100                 105                 110gtg ccg gaa gcc cat ctt ttc cgg cag gac atc gac tat ttc gcc ctg    384Val Pro Glu Ala His Leu Phe Arg Gln Asp Ile Asp Tyr Phe Ala Leu
    115                 120                 125atg att gcc ctg aaa cac ggc gcc gaa tcc aga cag aac atc aag atc    432Met Ile Ala Leu Lys His Gly Ala Glu Ser Arg Gln Asn Ile Lys Ile
130                 135                 140gag tcg atc agc ctc aac gac gac ggg gtc gag gtg gca ttg tcc aac    480Glu Ser Ile Ser Leu Asn Asp Asp Gly Val Glu Val Ala Leu Ser Asn145                 150                 155                 160gcc gcc ccc gtc aag gcc gcg ttc atc att gac gct gct gcc cag ggc    528Ala Ala Pro Val Lys Ala Ala Phe Ile Ile Asp Ala Ala Ala Gln Gly
            165                 170                 175tct ccg ctt tcc cgc caa ctg ggc ttg cgc acc acc gaa ggg ctg gcg    576Ser Pro Leu Ser Arg Gln Leu Gly Leu Arg Thr Thr Glu Gly Leu Ala
        180                 185                 190acc gac acc tgc tca ttc ttc acc cac atg ctc aat gtg aag agc tac    624Thr Asp Thr Cys Ser Phe Phe Thr His Met Leu Asn Val Lys Ser Tyr
    195                 200                 205gaa gat gcc ctg gct ccg ttg tcc cgc act cgt tcc ccc atc gaa ctg    672Glu Asp Ala Leu Ala Pro Leu Ser Arg Thr Arg Ser Pro Ile Glu Leu
210                 215                 220ttc aag agc acc ttg cac cac atc ttc gaa gag ggc tgg ttg tgg gtc    720Phe Lys Ser Thr Leu His His Ile Phe Glu Glu Gly Trp Leu Trp Val225                 230                 235                 240atc ccc ttc aac aac cac ccg cag ggc acc aat cag ttg tgc agc atc    768Ile Pro Phe Asn Asn His Pro Gln Gly Thr Asn Gln Leu Cys Set Ile
            245                 250                 255ggc ttc cag ttc aac aac gcc aag tac cgt ccc acc gag gcg ccg gag    816Gly Phe Gln Phe Asn ASn Ala Lys Tyr Arg Pro Thr Glu Ala Pro Glu
        260                 265                 270atc gag ttt cgc aaa ctg ctg aaa aag tac ccg gcc atc ggc gaa cac    864Ile Glu Phe Arg Lys Leu Leu Lys Lys Tyr Pro Ala Ile Gly Glu His
    275                 280                 285ttc aag gat gcg gtc aat gcc cgg gag tgg atc tac gcg ccg cgc atc    912Phe Lys Asp Ala Val Asn Ala Arg Glu Trp Ile Tyr Ala Pro Arg Ile
290                 295                 300aac tac cgc agc gtg caa aat gtc ggg gat cgc ttc tgc ctg ctg ccg    960Asn Tyr Arg Ser Val Gln Asn Val Gly Asp Arg Phe Cys Leu Leu Pro305                 310                 315                 320caa gcc aca ggg ttt atc gac ccg ctg ttc tcc agg ggg ttg atc acc    1008Gln Ala Thr Gly Phe Ile Asp Pro Leu Phe Ser Arg Gly Leu Ile Thr
            325                 330                 335acc ttc gag tcc atc ctc agg ctg gcc ccc aag gtg ctg gac gcc gcc    1056Thr Phe Glu Set Ile Leu Arg Leu Ala Pro Lys Val Leu Asp Ala Ala
        340                 345                 350cgc agc aac cgc tgg caa cgg gaa cag ttc atc gaa gtc gag cgc cat    1104Arg Ser Asn Arg Trp Gln Arg Glu Gln Phe Ile Glu Val Glu Arg His
    355                 360                 365tgc ctg aac gcg gtg gcg acc aat gac cag ttg gtc tcc tgc tcc tat    1152Cys Leu Asn Ala Val Ala Thr Asn Asp Gln Leu Val Ser Cys Ser Tyr
370                 375                 380gaa gcc ttc agc gac ttt cac ctg tgg aac gtg tgg cat cgg gtc tgg    1200Glu Ala Phe Ser Asp Phe His Leu Trp Asn Val Trp His Arg Val Trp385                 390                 395                 400ctc agc ggc tcc aac ctg ggc agt gcc ttt ctg caa aag ctg ctg cac    1248Leu Ser Gly Ser Asn Leu Gly Ser Ala Phe Leu Gln Lys Leu Leu His
            405                 410                 415gac ctg gaa cac agt ggc gac gcc cgc cag ttc gat gca gcg ctt gag    1296Asp Leu Glu His Ser Gly Asp Ala Arg Gln Phe Asp Ala Ala Leu Glu
        420                 425                 430gcg gtg cgc ttc cct ggc tgc ctg tcc ctg gac tcg ccc gcc tac gaa    1344Ala Val Arg Phe Pro Gly Cys Leu Ser Leu Asp Ser Pro Ala Tyr Glu
    435                 440                 445agc ctg ttc agg cag tcg tgc cag gtc atg caa cag gcc agg gag caa    1392Ser Leu Phe Arg Gln Ser Cys Gln Val Met Gln Gln Ala Arg Glu Gln
450                 455                 460gcc agg ccg gtg gcc gaa acc gcc aac gcg ctg cat gag ctg atc aag    1440Ala Arg Pro Val Ala Glu Thr Ala Asn Ala Leu His Glu Leu Ile Lys465                 470                 475                 480gag cac gaa gcc gag ttg ttg ccc ctg ggc tat tca cgg ata tcc aat    1488Glu His Glu Ala Glu Leu Leu Pro Leu Gly Tyr Ser Arg Ile Ser Asn
            485                 490                 495cgt ttc atc ctc aaa gtc tga a                                        1510Arg Phe Ile Leu Lys Val
        500<210>11<211>502<212>PRT<213>荧光假单胞菌<400>11Met Asn Gln Tyr Asp Val Ile Ile Ile Gly Ser Gly Ile Ala Gly Ala1               5                  10                  15Leu Thr Gly Ala Val Leu Ala Lys Ser Gly Leu Asn Val Leu Ile Leu
         20                  25                  30Asp Ser Ala Gln His Pro Arg Phe Ser Val Gly Glu Ala Ala Thr Pro
     35                  40                  45Glu Ser Gly Phe Leu Leu Arg Leu Leu Ser Lys Arg Phe Asp Ile Pro
 50                  55                  60Glu Ile Ala Tyr Leu Ser His Pro Asp Lys Ile Ile Gln His Val Gly65                  70                  75                  80Ser Ser Ala Cys Gly Ile Lys Leu Gly Phe Ser Phe Ala Trp His Gln
             85                  90                  95Glu Asn Ala Pro Ser Ser Pro Asp His Leu Val Ala Pro Pro Leu Lys
        100                 105                 110Val Pro Glu Ala His Leu Phe Arg Gln Asp Ile Asp Tyr Phe Ala Leu
    115                 120                 125Met Ile Ala Leu Lys His Gly Ala Glu Ser Arg Gln Asn Ile Lys Ile
130                 135                 140Glu Ser Ile Ser Leu Asn Asp Asp Gly Val Glu Val Ala Leu Ser Asn145                 150                 155                 160Ala Ala Pro Val Lys Ala Ala Phe Ile Ile Asp Ala Ala Ala Gln Gly
            165                 170                 175Ser Pro Leu Ser Arg Gln Leu Gly Leu Arg Thr Thr Glu Gly Leu Ala
        180                 185                 190Thr Asp Thr Cys Ser Phe Phe Thr His Met Leu Asn Val Lys Ser Tyr
    195                 200                 205Glu Asp Ala Leu Ala Pro Leu Ser Arg Thr Arg Ser Pro Ile Glu Leu
210                 215                 220Phe Lys Ser Thr Leu His His Ile Phe Glu Glu Gly Trp Leu Trp Val225                 230                 235                 240Ile Pro Phe Asn Asn His Pro Gln Gly Thr Asn Gln Leu Cys Ser Ile
            245                 250                 255Gly Phe Gln Phe Asn Asn Ala Lys Tyr Arg Pro Thr Glu Ala Pro Glu
        260                 265                 270Ile Glu Phe Arg Lys Leu Leu Lys Lys Tyr Pro Ala Ile Gly Glu His
    275                 280                 285Phe Lys Asp Ala Val Asn Ala Arg Glu Trp Ile Tyr Ala Pro Arg Ile
290                 295                 300Asn Tyr Arg Ser Val Gln Asn Val Gly Asp Arg Phe Cys Leu Leu Pro305                 310                 315                 320Gln Ala Thr Gly Phe Ile Asp Pro Leu Phe Ser Arg Gly Leu Ile Thr
            325                 330                 335Thr Phe Glu Ser Ile Leu Arg Leu Ala Pro Lys Val Leu Asp Ala Ala
        340                 345                 350Arg Ser Asn Arg Trp Gln Arg Glu Gln Phe Ile Glu Val Glu Arg His
    355                 360                 365Cys Leu Asn Ala Val Ala Thr Asn Asp Gln Leu Val Ser Cys Ser Tyr
370                 375                 380Glu Ala Phe Ser Asp Phe His Leu Trp Asn Val Trp His Arg Val Trp385                 390                 395                 400Leu Ser Gly Ser Asn Leu Gly Ser Ala Phe Leu Gln Lys Leu Leu His
            405                 410                 415Asp Leu Glu His Ser Gly Asp Ala Arg Gln Phe Asp Ala Ala Leu Glu
        420                 425                 430Ala Val Arg Phe Pro Gly Cys Leu Ser Leu Asp Ser Pro Ala Tyr Glu
    435                 440                 445Ser Leu Phe Arg Gln Ser Cys Gln Val Met Gln Gln Ala Arg Glu Gln
450                 455                 460Ala Arg Pro Val Ala Glu Thr Ala Asn Ala Leu His Glu Leu Ile Lys465                 470                 475                 480Glu His Glu Ala Glu Leu Leu Pro Leu Gly Tyr Ser Arg Ile Ser Asn
            485                 490                 495Arg Phe Ile Leu Lys Val
        500<210>12<211>1476<212>DNA<213>东方拟无枝酸菌(Amycolatopsis orientalis)<220><221>CDS<222>(1)..(1476)<400>12atg tcg gtc gaa gat ttc gat gtt gtg gtg gcg ggc ggc ggg ccg ggt    48Met Ser Val Glu Asp Phe Asp Val Val Val Ala Gly Gly Gly Pro Gly  1               5                  10                  15ggt tcg acg gtg gcc acc ctg gtg gcg atg cag gga cac cgg gtc ctg    96Gly Ser Thr Val Ala Thr Leu Val Ala Met Gln Gly His Arg Val Leu
         20                  25                  30ctg ctg gag aaa gag gtc ttc ccc cgg tac cag atc ggt gag tcg ctg    144Leu Leu Glu Lys Glu Val Phe Pro Arg Tyr Gln Ile Gly Glu Ser Leu
     35                  40                  45ctg ccc gcc acg gtg cac ggg gtc tgc cgg atg ctc ggc gtc gcg gac    192Leu Pro Ala Thr Val His Gly Val Cys Arg Met Leu Gly Val Ala Asp
 50                  55                  60gag ctg gcg aat tcc ggg ttc cog ate aaa cgc ggc ggc acg ttc cgc    240Glu Leu Ala Asn Ser Gly Phe Pro Ile Lys Arg Gly Gly Thr Phe Arg65                  70                  75                  80tgg ggc gcc cgt ccg gag ccg tgg acg ttc cac ttc ggg atc tcg gcc    288Trp Gly Ala Arg Pro Glu Pro Trp Thr Phe His Phe Gly Ile Ser Ala
             85                  90                  95aag atg gcg ggc tcg acg tcg cac gcc tat cag gtc gag cgg gcg aag    336Lys Met Ala Gly Ser Thr Ser His Ala Tyr Gln Val Glu Arg Ala Lys
        100                 105                 110ttc gac gac atc ctg ctg aag aac gcc aag agc aag ggc gtc gtc gtg    384Phe Asp Asp Ile Leu Leu Lys Asn Ala Lys Ser Lys Gly Val Val Val
    115                 120                 125cgg gaa ggc tgc tcg gtc aac gac gtc gtg gag gac ggc gag cgg gtc    432Arg Glu Gly Cys Ser Val Asn Asp Val Val Glu Asp Gly Glu Arg Val
130                 135                 140acc ggc gcg cgc tac acc gac gcg gac ggc aac gcg cac gaa gtc tog    480Thr Gly Ala Arg Tyr Thr Asp Ala Asp Gly Asn Ala His Glu Val Ser145                 150                 155                 160gcc cgg ttc gtg atc gac gcg tcg ggc aac aag agc cgg ctc tac acg    528Ala Arg Phe Val Ile Asp Ala Ser Gly Asn Lys Ser Arg Leu Tyr Thr
            165                 170                 175aag gtc aac ggt tcg cgg aac tac tcg gag ttc ttc cgc agc ctc gcg    576Lys Val Asn Gly Ser Arg Asn Tyr Ser Glu Phe Phe Arg Ser Leu Ala
        180                 185                 190ctg ttc ggc tat ttc gag ggt ggc aaa cgg ctg ccc gag ccg gtg tcg    624Leu Phe Gly Tyr Phe Glu Gly Gly Lys Arg Leu Pro Glu Pro Val Ser
    195                 200                 205ggc aac atc ctg agc gtc gcc ttc gac agc ggc tgg ttc tgg tac atc    672Gly Asn Ile Leu Ser Val Ala Phe Asp Ser Gly Trp Phe Trp Tyr Ile
210                 215                 220ccc ctg agc gac acg ctg acc agc gtc ggc gcg gtc gtg cgc cgg gag    720Pro Leu Ser Asp Thr Leu Thr Ser Val Gly Ala Val Val Arg Arg Glu225                 230                 235                 240gac gcc gac aag atc cag ggc gac cgc gag aag gcc ctc aac acc ttg    768Asp Ala Asp Lys Ile Gln Gly Asp Arg Glu Lys Ala Leu Asn Thr Leu
            245                 250                 255atc gcc gaa tgc ccg ctg atc tcg gag tac ctc tcg aac gcg acc agg    816Ile Ala Glu Cys Pro Leu Ile Ser Glu Tyr Leu Ser Asn Ala Thr Arg
        260                 265                 270gtg acc acc ggc agg tac ggc gaa ctg cgg gtg cgc aag gac tac tcg    864Val Thr Thr Gly Arg Tyr Gly Glu Leu Arg Val Arg Lys Asp Tyr Ser
    275                 280                 285tac cag cag gac agc tac tgg cgg ccc ggg atg gtc ctg gtc ggc gac    912Tyr Gln Gln Asp Ser Tyr Trp Arg Pro Gly Met Val Leu Val Gly Asp
290                 295                 300gcc gcg tgc ttc gtg gac ccg gtg ttc tcc tcc ggg gtg cac ctg gcg    960Ala Ala Cys Phe Val Asp Pro Val Phe Ser Ser Gly Val His Leu Ala305                 310                 315                 320acc tac agc gcg ctg ctc gcg gcc cgg tcg atc aac agc gtc ctc gcg    1008Thr Tyr Ser Ala Leu Leu Ala Ala Arg Ser Ile Asn Ser Val Leu Ala
            325                 330                 335ggc gac ctc gac gag aag acc gcg ctg aac gag ttc gag gcg cgc tat    1056Gly Asp Leu Asp Glu Lys Thr Ala Leu Asn Glu Phe Glu Ala Arg Tyr
        340                 345                 350cgc cgc gag tac ggc gtc ttc tac gag ttc ctc gtc tcc ttc tat cag    1104Arg Arg Glu Tyr Gly Val Phe Tyr Glu Phe Leu Val Ser Phe Tyr Gln
    355                 360                 365atg aac gtc aac gag gaa tcg tat ttc tgg cag gcc aag aag gtc acg    1152Met Asn Val Asn Glu Glu Ser Tyr Phe Trp Gln Ala Lys Lys Val Thr
370                 375                 380cag aac cag agc acc gac atc gag tcg ttc gtc gag ctg atc ggc ggg    1200Gln Asn Gln Ser Thr Asp Ile Glu Ser Phe Val Glu Leu Ile Gly Gly385                 390                 395                 400gtg tcg tcc ggc gag acc gcg ctg acg gcc gcc gac cgg atc gcc gcg    1248Val Ser Ser Gly Glu Thr Ala Leu Thr Ala Ala Asp Arg Ile Ala Ala
            405                 410                 415aac agt gcc gaa ttc gcc gcc gcc gtc gac aag atg gcg acg ggc gac    1296Asn Ser Ala Glu Phe Ala Ala Ala Val Asp Lys Met Ala Thr Gly Asp
        420                 425                 430ggc gac gac atg gtg ccg atg ttc aag tcg acc gtg gtc aag cag gcg    1344Gly Asp Asp Met Val Pro Met Phe Lys Ser Thr Val Val Lys Gln Ala
    435                 440                 445atg cag gag gcg ggc cag gtc cag atg aag gcg ctg ctc ggc gag gac    1392Met Gln Glu Ala Gly Gln Val Gln Met Lys Ala Leu Leu Gly Glu Asp
450                 455                 460gcc gaa ccc gag ctg ccg ctg ttc ccc ggc ggc ctg gtg act tcg ccc    1440Ala Glu Pro Glu Leu Pro Leu Phe Pro Gly Gly Leu Val Thr Ser Pro465                 470                 475                 480gac ggg atg aag tgg ctg ccg cac cac ccg gcc tga                    1476Asp Gly Met Lys Trp Leu Pro His His Pro Ala
            485                 490<210>13<211>491<212>PRT<213>东方拟无枝酸菌<400>13Met Ser Val Glu Asp Phe Asp Val Val Val Ala Gly Gly Gly Pro Gly1               5                  10                  15Gly Ser Thr Val Ala Thr Leu Val Ala Met Gln Gly His Arg Val Leu
         20                  25                  30Leu Leu Glu Lys Glu Val Phe Pro Arg Tyr Gln Ile Gly Glu Ser Leu
     35                  40                  45Leu Pro Ala Thr Val His Gly Val Cys Arg Met Leu Gly Val Ala Asp
 50                  55                  60Glu Leu Ala Asn Ser Gly Phe Pro Ile Lys Arg Gly Gly Thr Phe Arg65                  70                  75                  80Trp Gly Ala Arg Pro Glu Pro Trp Thr Phe His Phe Gly Ile Ser Ala
             85                  90                  95Lys Met Ala Gly Ser Thr Ser His Ala Tyr Gln Val Glu Arg Ala Lys
        100                 105                 110Phe Asp Asp Ile Leu Leu Lys Asn Ala Lys Ser Lys Gly Val Val Val
    115                 120                 125Arg Glu Gly Cys Ser Val Asn Asp Val Val Glu Asp Gly Glu Arg Val
130                 135                 140Thr Gly Ala Arg Tyr Thr Asp Ala Asp Gly Asn Ala His Glu Val Ser145                 150                 155                 160Ala Arg Phe Val Ile Asp Ala Ser Gly Asn Lys Ser Arg Leu Tyr Thr
            165                 170                 175Lys Val Asn Gly Ser Arg Asn Tyr Ser Glu Phe Phe Arg Ser Leu Ala
        180                 185                 190Leu Phe Gly Tyr Phe Glu Gly Gly Lys Arg Leu Pro Glu Pro Val Ser
    195                 200                 205Gly Asn Ile Leu Ser Val Ala Phe Asp Ser Gly Trp Phe Trp Tyr Ile
210                 215                 220Pro Leu Ser Asp Thr Leu Thr Ser Val Gly Ala Val Val Arg Arg Glu225                 230                 235                 240Asp Ala Asp Lys Ile Gln Gly Asp Arg Glu Lys Ala Leu Asn Thr Leu
            245                 250                 255Ile Ala Glu Cys Pro Leu Ile Ser Glu Tyr Leu Ser Asn Ala Thr Arg
        260                 265                 270Val Thr Thr Gly Arg Tyr Gly Glu Leu Arg Val Arg Lys Asp Tyr Ser
    275                 280                 285Tyr Gln Gln Asp Ser Tyr Trp Arg Pro Gly Met Val Leu Val Gly Asp
290                 295                 300Ala Ala Cys Phe Val Asp Pro Val Phe Ser Ser Gly Val His Leu Ala305                 310                 315                 320Thr Tyr Ser Ala Leu Leu Ala Ala Arg Ser Ile Asn Ser Val Leu Ala
            325                 330                 335Gly Asp Leu Asp Glu Lys Thr Ala Leu Asn Glu Phe Glu Ala Arg Tyr
        340                 345                 350Arg Arg Glu Tyr Gly Val Phe Tyr Glu Phe Leu Val Ser Phe Tyr Gln
    355                 360                 365Met Asn Val Asn Glu Glu Ser Tyr Phe Trp Gln Ala Lys Lys Val Thr
370                 375                 380Gln Asn Gln Ser Thr Asp Ile Glu Ser Phe Val Glu Leu Ile Gly Gly385                 390                 395                 400Val Ser Ser Gly Glu Thr Ala Leu Thr Ala Ala Asp Arg Ile Ala Ala
            405                 410                 415Asn Ser Ala Glu Phe Ala Ala Ala Val Asp Lys Met Ala Thr Gly Asp
        420                 425                 430Gly Asp Asp Met Val Pro Met Phe Lys Ser Thr Val Val Lys Gln Ala
    435                 440                 445Met Gln Glu Ala Gly Gln Val Gln Met Lys Ala Leu Leu Gly Glu Asp
450                 455                 460Ala Glu Pro Glu Leu Pro Leu Phe Pro Gly Gly Leu Val Thr Ser Pro465                 470                 475                 480Asp Gly Met Lys Trp Leu Pro His His Pro Ala
            485                 490<210>14<211>1359<212>DNA<213>金霉素链霉菌(Streptomyces aureofaciens)<220><221>CDS<222>(1)..(1359)<400>14atg ttc cac cgg gac ggc gag gag ccg gac ccg aac gag acc agc cag    48Met Phe His Arg Asp Gly Glu Glu Pro Asp Pro Asn Glu Thr Ser Gln1               5                  10                  15ttc cgc atc ccc tcg atc gtc ggc aac gcg gcc cac ttc ttc cgc cag    96Phe Arg Ile Pro Ser Ile Val Gly Asn Ala Ala His Phe Phe Arg Gln
         20                  25                  30gac acc gac tcc tac atg ttc cac gcc gcg gtg cgc tac ggc tgc gac    144Asp Thr Asp Ser Tyr Met Phe His Ala Ala Val Arg Tyr Gly Cys Asp
     35                  40                  45gcc cgg cag tac tac cgg gtg gag aac atc gag ttc gac gac ggc ggg    192Ala Arg Gln Tyr Tyr Arg Val Glu Asn Ile Glu Phe Asp Asp Gly Gly
 50                  55                  60gtg acc gtc tcc ggc gcg gac ggc agc acc gtc cgg gcc cgc tac ctg    240Val Thr Val Ser Gly Ala Asp Gly Ser Thr Val Arg Ala Arg Tyr Leu65                  70                  75                  80gtc gac gcc agc ggc ttc cgc tcg ccg ctg gca cgg cag ttg ggg ttg    288Val Asp Ala Ser Gly Phe Arg Ser Pro Leu Ala Arg Gln Leu Gly Leu
             85                  90                  95cgg gag gag ccg agc cgg ctc aag cac cac gcc cgc tcg atc ttc acc    336Arg Glu Glu Pro Ser Arg Leu Lys His His Ala Arg Ser Ile Phe Thr
        100                 105                 110cac atg gtc gga gtg gac gcg atc gac gac cac gtg gac atg ccg gcc    384His Met Val Gly Val Asp Ala Ile Asp Asp His Val Asp Met Pro Ala
    115                 120                 125gag ctt cgc ccg ccg gtg ccg tgg aac gac ggg acg atg cac cac atc    432Glu Leu Arg Pro Pro Val Pro Trp Asn Asp Gly Thr Met His His Ile
130                 135                 140ttc gag cgc ggc tgg atg tgg atc atc ccg ttc aac aac cac ccc ggg    480Phe Glu Arg Gly Trp Met Trp Ile Ile Pro Phe Asn Asn His Pro Gly145                 150                 155                 160gcc acc aac ccg ctg tgc agc gtc ggc atc cag ctc gac gag cgc cgc    528Ala Thr Asn Pro Leu Cys Ser Val Gly Ile Gln Leu Asp Glu Arg Arg
            165                 170                 175tac ccc gcc cgg ccg gac ctg acg ccc gag gag gag ttc cgg tcc cac    576Tyr Pro Ala Arg Pro Asp Leu Thr Pro Glu Glu Glu Phe Arg Ser His
        180                 185                 190gtg gac cgc ttc ccg gcg gtg cag cgg cag ttg aag ggc gcc cgc agc    624Val Asp Arg Phe Pro Ala Val Gln Arg Gln Leu Lys Gly Ala Arg Ser
    195                 200                 205gtg cgc gag tgg gtg cga acg gac cgc atg cag tac tcc tcg agc cgg    672Val Arg Glu Trp Val Arg Thr Asp Arg Met Gln Tyr Ser Ser Ser Arg
210                 215                 220acg gtc ggc gag cgc tgg tgc ctg atg tcg cac gcg gcc ggc ttc atc    720Thr Val Gly Glu Arg Trp Cys Leu Met Ser His Ala Ala Gly Phe Ile225                 230                 235                 240gac ccg ctc ttc ctt cgc ggc ctg tcc aac acc tgc gag atc atc aac    768Asp Pro Leu Phe Leu Arg Gly Leu Ser Asn Thr Cys Glu Ile Ile Asn
            245                 250                 255gcg ctg tcc tgg cgg ctg atg gcc gcg ctg cgc gag gac gac ttc gcg    816Ala Leu Ser Trp Arg Leu Met Ala Ala Leu Arg Glu Asp Asp Phe Ala
        260                 265                 270gtc gag cgc ttc gcc tac gtg gag gaa ctg gag cag ggc ctg ctg gac    864Val Glu Arg Phe Ala Tyr Val Glu Glu Leu Glu Gln Gly Leu Leu Asp
    275                 280                 285tgg aac gac aag ctg gtc aac aac tcc ttc atc tcc ttc tcg cac tac    912Trp Asn Asp Lys Leu Val Asn Asn Ser Phe Ile Ser Phe Ser His Tyr
290                 295                 300ccg ctg tgg aac tcg gcg ttc cgg atc tgg gcc tcg gcc agc gtg atc    960Pro Leu Trp Asn Ser Ala Phe Arg Ile Trp Ala Ser Ala Ser Val Ile305                 310                 315                 320ggc ggc aag cgc atc ctc aac gca ctg acc agg acc aag gag acc ggc    1008Gly Gly Lys Arg Ile Leu Asn Ala Leu Thr Arg Thr Lys Glu Thr Gly
            325                 330                 335gac gac agc cac tgc cag gcg ctg gac gac aac ccg tac ccg ggc ctg    1056Asp Asp Ser His Cys Gln Ala Leu Asp Asp Asn Pro Tyr Pro Gly Leu
        340                 345                 350tgg tgt ccg ctg gac ttc tac aag gag gcc ttc gac gag ctc acc gag    1104Trp Cys Pro Leu Asp Phe Tyr Lys Glu Ala Phe Asp Glu Leu Thr Glu
    355                 360                 365ctg tgc gag gcc gtg gac gcc ggg cac acc acg gcc gag gag gcc gcg    1152Leu Cys Glu Ala Val Asp Ala Gly His Thr Thr Ala Glu Glu Ala Ala
370                 375                 380cgg ctg ctg gag cag cgg gtc cgc gag tcg gac tgg atg ctg ccg gcc    1200Arg Leu Leu Glu Gln Arg Val Arg Glu Ser Asp Trp Met Leu Pro Ala385                 390                 395                 400ctg ggc ttc aac gac ccc gac acc cac cac atc aac ccg acg gcg gac    1248Leu Gly Phe Asn Asp Pro Asp Thr His His Ile Asn Pro Thr Ala Asp
            405                 410                 415aag atg atc cgg atc gcg gag tgg gcc acc ggt cac cac cgc ccg gag    1296Lys Met Ile Arg Ile Ala Glu Trp Ala Thr Gly His His Arg Pro Glu
        420                 425                 430atc cgt gag ctg ctg gcc gcc agc gcc gag gag gtc agg gcg gcg atg    1344Ile Arg Glu Leu Leu Ala Ala Ser Ala Glu Glu Val Arg Ala Ala Met
    435                 440                 445cgg gtc aag ccg taa                                                1359Arg Val Lys Pro
450<210>15<211>452<212>PRT<213>金霉素链霉菌<400>15Met Phe His Arg Asp Gly Glu Glu Pro Asp Pro Asn Glu Thr Ser Gln1               5                  10                  15Phe Arg Ile Pro Ser Ile Val Gly Asn Ala Ala His Phe Phe Arg Gln
         20                  25                  30Asp Thr Asp Ser Tyr Met Phe His Ala Ala Val Arg Tyr Gly Cys Asp
     35                  40                  45Ala Arg Gln Tyr Tyr Arg Val Glu Asn Ile Glu Phe Asp Asp Gly Gly
 50                  55                  60Val Thr Val Ser Gly Ala Asp Gly Ser Thr Val Arg Ala Arg Tyr Leu65                  70                  75                  80Val Asp Ala Ser Gly Phe Arg Ser Pro Leu Ala Arg Gln Leu Gly Leu
             85                  90                  95Arg Glu Glu Pro Ser Arg Leu Lys His His AIa Arg Ser Ile Phe Thr
        100                 105                 110His Met Val Gly Val Asp Ala Ile Asp Asp His Val Asp Met Pro Ala
    115                 120                 125Glu Leu Arg Pro Pro Val Pro Trp Asn Asp Gly Thr Met His His Ile
130                 135                 140Phe Glu Arg Gly Trp Met Trp Ile Ile Pro Phe Asn Asn His Pro Gly145                 150                 155                 160Ala Thr Asn Pro Leu Cys Ser Val Gly Ile Gln Leu Asp Glu Arg Arg
            165                 170                 175Tyr Pro Ala Arg Pro Asp Leu Thr Pro Glu Glu Glu Phe Arg Ser His
        180                 185                 190Val Asp Arg Phe Pro Ala Val Gln Arg Gln Leu Lys Gly Ala Arg Ser
   195                  200                 205Val Arg Glu Trp Val Arg Thr Asp Arg Met Gln Tyr Ser Ser Ser Arg
210                 215                 220Thr Val Gly Glu Arg Trp Cys Leu Met Ser His Ala Ala Gly Phe Ile225                 230                 235                 240Asp Pro Leu Phe Leu Arg Gly Leu Ser Asn Thr Cys Glu Ile Ile Asn
            245                 250                 255Ala Leu Ser Trp Arg Leu Met Ala Ala Leu Arg Glu Asp Asp Phe Ala
        260                 265                 270Val Glu Arg Phe Ala Tyr Val Glu Glu Leu Glu Gln Gly Leu Leu Asp
    275                 280                 235Trp Asn Asp Lys Leu Val Asn Asn Ser Phe Ile Ser Phe Ser His Tyr
290                 295                 300Pro Leu Trp Asn Ser Ala Phe Arg Ile Trp Ala Ser Ala Ser Val Ile305                 310                 315                 320Gly Gly Lys Arg Ile Leu Asn Ala Leu Thr Arg Thr Lys Glu Thr Gly
            325                 330                 335Asp Asp Ser His Cys Gln Ala Leu Asp Asp Asn Pro Tyr Pro Gly Leu
        340                 345                 350Trp Cys Pro Leu Asp Phe Tyr Lys Glu Ala Phe Asp Glu Leu Thr Glu
    355                 360                 365Leu Cys Glu Ala Val Asp Ala Gly His Thr Thr Ala Glu Glu Ala Ala
370                 375                 380Arg Leu Leu Glu Gln Arg Val Arg Glu Ser Asp Trp Met Leu Prc Ala385                 390                 395                 400Leu Gly Phe Asn Asp Pro Asp Thr His His Ile Asn Pro Thr Ala Asp
            405                 410                 415Lys Met Ile Arg Ile Ala Glu Trp Ala Thr Gly His His Arg Pro Glu
        420                 425                 430Ile Arg Glu Leu Leu Ala Ala Ser Ala Glu Glu Val Arg Ala Ala Met
    435                 440                 445Arg Val Lys Pro
450<210>16<211>1476<212>DNA<213>地中海拟无枝酸菌(Amycolatopsis mediterranei)<220><221>CDS<222>(1)..(1476)<400>16atg tcg gtc gaa gac ttc gac gtg gtg gtg gcg ggc ggc ggg ccg ggt    48Met Ser Val Glu Asp Phe Asp Val Val Val Ala Gly Gly Gly Pro Gly1               5                  10                  15ggt tcg acg gtg gcc acg ctg gtg gcc atg cag gga cac cgg gtg ctg    96Gly Ser Thr Val Ala Thr Leu Val Ala Met Gln Gly His Arg Val Leu
         20                  25                  30ctg ctg gag aaa gag gtt ttc ccg cgg tat cag atc ggt gag tcg ctg    144Leu Leu Glu Lys Glu Val Phe Pro Arg Tyr Gln Ile Gly Glu Ser Leu
     35                  40                  45ctg ccc gcc acg gtg cac ggc gtg tgc cgg atg ctc ggc atc tcc gac    192Leu Pro Ala Thr Val His Gly Val Cys Arg Met Leu Gly Ile Ser Asp
 50                  55                  60gag ctg gcc aat gcc ggg ttc ccg atc aag cgc ggc ggc acg ttc cgc    240Glu Leu Ala Asn Ala Gly Phe Pro Ile Lys Arg Gly Gly Thr Phe Arg65                  70                  75                  80tgg ggc gcc cgg ccg gag ccg tgg acg ttc cac ttc ggc atc tcg gcc    288Trp Gly Ala Arg Pro Glu Pro Trp Thr Phe His Phe Gly Ile Ser Ala
             85                  90                  95aag atg gcc ggc tcg acg tcg cac gcc tac cag gtc gag cgg gcg cgg    336Lys Met Ala Gly Ser Thr Ser His Ala Tyr Gln Val Glu Arg Ala Arg
        100                 105                 110ttc gac gag atg ctg ctg aac aac gcc aag cgc aag ggc gtg gtc gtg    384Phe Asp Glu Met Leu Leu Asn Asn Ala Lys Arg Lys Gly Val Val Val
    115                 120                 125cgg gag ggg tgc gcg gtc acc gat gtg gtg gaa gac ggc gag cgg gtc    432Arg Glu Gly Cys Ala Val Thr Asp Val Val Glu Asp Gly Glu Arg Val
130                 135                 140acc ggt gcg cgg tac acc gat ccc gac ggc acc gag cgg gaa gtg tcg    480Thr Gly Ala Arg Tyr Thr Asp Pro Asp Gly Thr Glu Arg Glu Val Ser145                 150                 155                 160gcg cgg ttc gtg atc gac gcg tcg ggc aac aag agc cgg ctc tac acc    528Ala Arg Phe Val Ile Asp Ala Ser Gly Asn Lys Ser Arg Leu Tyr Thr
            165                 170                 175aag gtc ggc ggt tcg cgg aac tat tcg gag ttc ttc cgc agc ctc gcg    576Lys Val Gly Gly Ser Arg Asn Tyr Ser Glu Phe Phe Arg Ser Leu Ala
        180                 185                 190ctg ttc ggt tac ttc gag ggt ggc aag cgg ctg ccc gag ccg gtc tcc    624Leu Phe Gly Tyr Phe Glu Gly Gly Lys Arg Leu Pro Glu Pro Val Ser
    195                 200                 205ggg aac atc ctg agt gtg gcc ttc gac agc ggc tgg ttc tgg tac atc    672Gly Asn Ile Leu Ser Val Ala Phe Asp Ser Gly Trp Phe Trp Tyr Ile
210                 215                 220ccg ctg agc gac acg ctg acc agc gtc ggc gcg gtg gtg cgc cgg gag    720Pro Leu Ser Asp Thr Leu Thr Ser Val Gly Ala Val Val Arg Arg Glu225                 230                 235                 240gac gcc gag aag atc cag ggt gac cgg gag aag gcc ctc aac acg ctg    768Asp Ala Glu Lys Ile Gln Gly Asp Arg Glu Lys Ala Leu Asn Thr Leu
            245                 250                 255atc gcc gag tgc ccg ctg atc tcg gaa tac ctc gcg gac gcg acc cgg    816Ile Ala Glu Cys Pro Leu Ile Ser Glu Tyr Leu Ala Asp Ala Thr Arg
        260                 265                 270gtg acg acc ggc cgg tac ggg gaa ctg cgc gtc cgc aag gac tac tcc    864Val Thr Thr Gly Arg Tyr Gly Glu Leu Arg Val Arg Lys Asp Tyr Ser
    275                 280                 285tac cag cag gag acc tac tgg cgg ccg ggc atg atc ctg gtc ggc gac    912Tyr Gln Gln Glu Thr Tyr Trp Arg Pro Gly Met Ile Leu Val Gly Asp
290                 295                 300gcc gcg tgt ttc gtg gac ccg gtg ttc tcc tcc ggt gtg cac ctg gcg    960Ala Ala Cys Phe Val Asp Pro Val Phe Ser Ser Gly Val His Leu Ala305                 310                 315                 320acc tac agc gcg ctg ctc gcg gcc cgg tcg atc aac agc gtc ctc gcc    1008Thr Tyr Ser Ala Leu Leu Ala Ala Arg Ser Ile Asn Ser Val Leu Ala
            325                 330                 335ggc gac ctg gac gag aag acc gcg ctg aac gag ttc gag ctg cgg tat    1056Gly Asp Leu Asp Glu Lys Thr Ala Leu Asn Glu Phe Glu Leu Arg Tyr
        340                 345                 350cgc cgt gag tac ggc gtg ttc tac gag ttc ctc gtg tcc ttc tac cag    1104Arg Arg Glu Tyr Gly Val Phe Tyr Glu Phe Leu Val Ser Phe Tyr Gln
    355                 360                 365atg aac gtg aac gag gag tcg tac ttc tgg cag gcc aag aag gtc acg    1152Met Asn Val Asn Glu Glu Ser Tyr Phe Trp Gln Ala Lys Lys Val Thr
370                 375                 380cag aac cag agc acc gac gtc gag tcg ttc gtc gag ctg atc ggc gga    1200Gln Asn Gln Ser Thr Asp Val Glu Ser Phe Val Glu Leu Ile Gly Gly385                 390                 395                 400gtg tcg tcc ggg gag acc gcg ctg acg gcc gcc gac cgc atc gcc gcg    1248Val Ser Ser Gly Glu Thr Ala Leu Thr Ala Ala Asp Arg Ile Ala Ala
            405                 410                 415cgc agt gcc gag ttc gcc gcg gcg gtg gac gag atg gcg ggc ggg gac    1296Arg Ser Ala Glu Phe Ala Ala Ala Val Asp Glu Met Ala Gly Gly Asp
        420                 425                 430ggc gac aac atg gtg ccg atg ttc aag tcg acg gtg gtc cag cag gcg    1344Gly Asp Asn Met Val Pro Met Phe Lys Ser Thr Val Val Gln Gln Ala
    435                 440                 445atg cag gaa gcg ggc cag gtg cag atg aag gcg ctg ctc ggc gag gac    1392Met Gln Glu Ala Gly Gln Val Gln Met Lys Ala Leu Leu Gly Glu Asp
450                 455                 460gcc gaa ccc gag ctg ccc ctg ttc ccc ggt ggc ctg gtg acc tcg ccc    1440Ala Glu Pro Glu Leu Pro Leu Phe Pro Gly Gly Leu Val Thr Ser Pro465                 470                 475                 480gaa cgg atg aag tgg ctg cct cac cac cct gcg tga                    1476Glu Arg Met Lys Trp Leu Pro His His Pro Ala
            485                 490<210>17<211>491<212>PRT<213>地中海拟无枝酸菌<400>17Met Ser Val Glu Asp Phe Asp Val Val Val Ala Gly Gly Gly Pro Gly1               5                  10                  15Gly Ser Thr Val Ala Thr Leu Val Ala Met Gln Gly His Arg Val Leu
         20                  25                  30Leu Leu Glu Lys Glu Val Phe Pro Arg Tyr Gln Ile Gly Glu Ser Leu
     35                  40                  45Leu Pro Ala Thr Val His Gly Val Cys Arg Met Leu Gly Ile Ser Asp
 50                  55                  60Glu Leu Ala Asn Ala Gly Phe Pro Ile Lys Arg Gly Gly Thr Phe Arg65                  70                  75                  80Trp Gly Ala Arg Pro Glu Pro Trp Thr Phe His Phe Gly Ile Ser Ala
             85                  90                  95Lys Met Ala Gly Ser Thr Ser His Ala Tyr Gln Val Glu Arg Ala Arg
        100                 105                 110Phe Asp Glu Met Leu Leu Asn Asn Ala Lys Arg Lys Gly Val Val Val
    115                 120                 125Arg Glu Gly Cys Ala Val Thr Asp Val Val Glu Asp Gly Glu Arg Val
130                 135                 140Thr Gly Ala Arg Tyr Thr Asp Pro Asp Gly Thr Glu Arg Glu Val Ser145                 150                 155                 160Ala Arg Phe Val Ile Asp Ala Ser Gly Asn Lys Ser Arg Leu Tyr Thr
            165                 170                 175Lys Val Gly Gly Ser Arg Asn Tyr Ser Glu Phe Phe Arg Ser Leu Ala
        180                 185                 190Leu Phe Gly Tyr Phe Glu Gly Gly Lys Arg Leu Pro Glu Pro Val Ser
    195                 200                 205Gly Asn Ile Leu Ser Val Ala Phe Asp Ser Gly Trp Phe Trp Tyr Ile
210                 215                 220Pro Leu Ser Asp Thr Leu Thr Ser Val Gly Ala Val Val Arg Arg Glu225                 230                 235                 240Asp Ala Glu Lys Ile Gln Gly Asp Arg Glu Lys Ala Leu Asn Thr Leu
            245                 250                 255Ile Ala Glu Cys Pro Leu Ile Ser Glu Tyr Leu Ala Asp Ala Thr Arg
        260                 265                 270Val Thr Thr Gly Arg Tyr Gly Glu Leu Arg Val Arg Lys Asp Tyr Ser
    275                 280                 285Tyr Gln Gln Glu Thr Tyr Trp Arg Pro Gly Met Ile Leu Val Gly Asp
290                 295                 300Ala Ala Cys Phe Val Asp Pro Val Phe Ser Ser Gly Val His Leu Ala305                 310                 315                 320Thr Tyr Ser Ala Leu Leu Ala Ala Arg Ser Ile Asn Ser Val Leu Ala
            325                 330                 335Gly Asp Leu Asp Glu Lys Thr Ala Leu Asn Glu Phe Glu Leu Arg Tyr
        340                 345                 350Arg Arg Glu Tyr Gly Val Phe Tyr Glu Phe Leu Val Ser Phe Tyr Gln
    355                 360                 365Met Asn Val Asn Glu Glu Ser Tyr Phe Trp Gln Ala Lys Lys Val Thr
370             375                     380Gln Asn Gln Ser Thr Asp Val Glu Ser Phe Val Glu Leu Ile Gly Gly385             390                     395                 400Val Ser Ser Gly Glu Thr Ala Leu Thr Ala Ala Asp Arg Ile Ala Ala
            405                 410                 415Arg Ser Ala Glu Phe Ala Ala Ala Val Asp Glu Met Ala Gly Gly Asp
        420                 425                 430Gly Asp Asn Met Val Pro Met Phe Lys Ser Thr Val Val Gln Gln Ala
    435                 440                 445Met Gln Glu Ala Gly Gln Val Gln Met Lys Ala Leu Leu Gly Glu Asp
450                 455                 460Ala Glu Pro Glu Leu Pro Leu Phe Pro Gly Gly Leu Val Thr Ser Pro465                 470                 475                 480Glu Arg Met Lys Trp Leu Pro His His Pro Ala
            485                 490<210>18<211>702<212>DNA<213>大肠杆菌(Escherichia coli)<220><221>CDS<222>(1)..(702)<400>18atg aca acc tta agc tgt aaa gtg acc tcg gta gaa gct atc acg gat    48Met Thr Thr Leu Ser Cys Lys Val Thr Ser Val Glu Ala Ile Thr Asp1               5                  10                  15acc gta tat cgt gtc cgc atc gtg cca gac gcg gcc ttt tct ttt cgt    96Thr Val Tyr Arg Val Arg Ile Val Pro Asp Ala Ala Phe Ser Phc Arg
         20                  25                  30gct ggt cag tat ttg atg gta gtg atg gat gag cgc gac aaa cgt ccg    144Ala Gly Gln Tyr Leu Met Val Val Met Asp Glu Arg Asp Lys Arg Pro
     35                  40                  45ttc tca atg gct tcg acg ccg gat gaa aaa ggg ttt atc gag ctg cat    192Phe Ser Met Ala Ser Thr Pro Asp Glu Lys Gly Phe Ile Glu Leu His
 50                  55                  60att ggc gct tct gaa atc aac ctt tac gcg aaa gca gtc atg gac cgc    240Ile Gly Ala Ser Glu Ile Asn Leu Tyr Ala Lys Ala Val Met Asp Arg65                  70                  75                  80atc ctc aaa gat cat caa atc gtg gtc gac att ccc cac gga gaa gcg    288Ile Leu Lys Asp His Gln Ile Val Val Asp Ile Pro His Gly Glu Ala
             85                  90                  95tgg ctg cgc gat gat gaa gag cgt ccg atg att ttg att gcg ggc ggc    336Trp Leu Arg Asp Asp Glu Glu Arg Pro Met Ile Leu Ile Ala Gly Gly
        100                 105                 110acc ggg ttc tct tat gcc cgc tcg att ttg ctg aca gcg ttg gcg cgt    384Thr Gly Phe Ser Tyr Ala Arg Ser Ile Leu Leu Thr Ala Leu Ala Arg
    115                 120                 125aac cca aac cgt gat atc acc att tac tgg ggc ggg cgt gaa gag cag    432Asn Pro Asn Arg Asp Ile Thr Ile Tyr Trp Gly Gly Arg Glu Glu Gln
130                 135                 140cat ctg tat gat ctc tgc gag ctt gag gcg ctt tcg ttg aag cat cct    480His Leu Tyr Asp Leu Cys Glu Leu Glu Ala Leu Ser Leu Lys His Pro145                 150                 155                 160ggt ctg caa gtg gtg ccg gtg gtt gaa caa ccg gaa gcg ggc tgg cgt    528Gly Leu Gln Val Val Pro Val Val Glu Gln Pro Glu Ala Gly Trp Arg
            165                 170                 175ggg cgt act ggc acc gtg tta acg gcg gta ttg cag gat cac ggt acg    576Gly Arg Thr Gly Thr Val Leu Thr Ala Val Leu Gln Asp His Gly Thr
        180                 185                 190ctg gca gag cat gat atc tat att gcc gga cgt ttt gag atg gcg aaa    624Leu Ala Glu His Asp Ile Tyr Ile Ala Gly Arg Phe Glu Met Ala Lys
    195                 200                 205att gcc cgc gat ctg ttt tgc agt gag cgt aat gcg cgg gaa gat cgc    672Ile Ala Arg Asp Leu Phe Cys Ser Glu Arg Asn Ala Arg Glu Asp Arg
210                 215                 220ctg ttt ggc gat gcg ttt gca ttt atc tga                            702Leu Phe Gly Asp Ala Phe Ala Phe Ile225                 230<210>19<211>233<212>PRT<213>大肠杆菌<400>19Met Thr Thr Leu Ser Cys Lys Val Thr Ser Val Glu Ala Ile Thr Asp1               5                  10                  15Thr Val Tyr Arg Val Arg Ile Val Pro Asp Ala Ala Phe Ser Phe Arg
         20                  25                  30Ala Gly Gln Tyr Leu Met Val Val Met Asp Glu Arg Asp Lys Arg Pro
     35                  40                  45Phe Ser Met Ala Ser Thr Pro Asp Glu Lys Gly Phe Ile Glu Leu His
 50                  55                  60Ile Gly Ala Ser Glu Ile Asn Leu Tyr Ala Lys Ala Val Met Asp Arg65                  70                  75                  80Ile Leu Lys Asp His Gln Ile Val Val Asp Ile Pro His Gly Glu Ala
             85                  90                  95Trp Leu Arg Asp Asp Glu Glu Arg Pro Met Ile Leu Ile Ala Gly Gly
        100                 105                 110Thr Gly Phe Ser Tyr Ala Arg Ser Ile Leu Leu Thr Ala Leu Ala Arg
    115                 120                 125Asn Pro Asn Arg Asp Ile Thr Ile Tyr Trp Gly Gly Arg Glu Glu Gln
130                 135                 140His Leu Tyr Asp Leu Cys Glu Leu Glu Ala Leu Ser Leu Lys His Pro145                 150                 155                 160Gly Leu Gln Val Val Pro Val Val Glu Gln Pro Glu Ala Gly Trp Arg
            165                 170                 175Gly Arg Thr Gly Thr Val Leu Thr Ala Val Leu Gln Asp His Gly Thr
        180                 185                 190Leu Ala Glu His Asp Ile Tyr Ile Ala Gly Arg Phe Glu Met Ala Lys
    195                 200                 205Ile Ala Arg Asp Leu Phe Cys Ser Glu Arg Asn Ala Arg Glu Asp Arg
210                 215                 220Leu Phe Gly Asp Ala Phe Ala Phe Ile225                 230<210>20<211>906<212>DNA<213>大鼠<220><221>CDS<222>(1)..(906)<400>20atg ggg gcc cag ctg agc acg ttg agc cga gtg gta ctc tcc ccg gtc    48Met Gly Ala Gln Leu Ser Thr Leu Ser Arg Val Val Leu Ser Pro Val1               5                  10                  15tgg ttc gtc tac agc ctc ttc atg aag ctg ttt cag cgc tcc tca ccg    96Trp Phe Val Tyr Ser Leu Phe Met Lys Leu Phe Gln Arg Ser Ser Pro
         20                  25                  30gcc atc acc ctc gag aac ccc gac atc aag tac cct ctg cgg ctc atc    144Ala Ile Thr Leu Glu Asn Pro Asp Ile Lys Tyr Pro Leu Arg Leu Ile
     35                  40                  45gac aag gag att atc agc cat gac act cgg cgc ttc cga ttt gca ctc    192Asp Lys Glu Ile Ile Ser His Asp Thr Arg Arg Phe Arg Phe Ala Leu
 50                  55                  60cct tcg ccc cag cac atc ctg ggc ctt cct atc ggc cag cac atc tac    240Pro Ser Pro Gln His Ile Leu Gly Leu Pro Ile Gly Gln His Ile Tyr65                  70                  75                  80ctc tcc acc agg atc gat ggc aac ttg gtc att cgt ccc tac acc cct    288Leu Ser Thr Arg Ile Asp Gly Asn Leu Val Ile Arg Pro Tyr Thr Pro
             85                  90                  95gtg tct agt gat gat gac aag ggc ctt gtg gac ttg gtg gtc aag gtt    336Val Ser Ser Asp Asp Asp Lys Gly Leu Val Asp Leu Val Val Lys Val
        100                 105                 110tac ttc aag gac acg cat ccc aag ttt cca gct gga ggg aaa atg tct    384Tyr Phe Lys Asp Thr His Pro Lys Phe Pro Ala Gly Gly Lys Met Ser
    115                 120                 125cag tac ctg gaa aac atg aat att gga gac acc att gaa ttc cgg ggc    432Gln Tyr Leu Glu Asn Met Asn Ile Gly Asp Thr Ile Glu Phe Arg Gly
130                 135                 140ccc aat ggg cta ctg gtc tac cag ggc aaa ggg aag ttc gcc atc cgt    480Pro Asn Gly Leu Leu Val Tyr Gln Gly Lys Gly Lys Phe Ala Ile Arg145                 150                 155                 160gca gac aag aag tcc aac cct gtt gtc agg acg gtg aag tct gta ggc    528Ala Asp Lys Lys Ser Asn Pro Val Val Arg Thr Val Lys Ser Val Gly
            165                 170                 175atg att gca gga ggg aca ggc atc acc cca atg ctg cag gtg atc cga    576Met Ile Ala Gly Gly Thr Gly Ile Thr Pro Met Leu Gln Val Ile Arg
        180                 185                 190gcc gtc ttg aag gac ccg aac gac cac act gtg tgc tat ctg ctc ttc    624Ala Val Leu Lys Asp Pro Asn Asp His Thr Val Cys Tyr Leu Leu Phe
    195                 200                 205gcc aac cag tcc gag aaa gac atc ctg ctg cgg cct gag ctg gag gaa    672Ala Asn Gln Ser Glu Lys Asp Ile Leu Leu Arg Pro Glu Leu Glu Glu
210                 215                 220ctg agg aac gaa cat tct tct cgc ttc aag ctc tgg tac aca gtg gac    720Leu Arg Asn Glu His Ser Ser Arg Phe Lys Leu Trp Tyr Thr Val Asp225                  230                235                 240aaa gcc ccc gat gcc tgg gac tat agc caa ggc ttc gtg aat gag gag    768Lys Ala Pro Asp Ala Trp Asp Tyr Ser Gln Gly Phe Val Asn Glu Glu
            245                 250                 255atg atc agg gac cat ctt cca cct cct ggg gag gag aca ctg ata ctg    816Met Ile Arg Asp His Leu Pro Pro Pro Gly Glu Glu Thr Leu Ile Leu
        260                 265                 270atg tgt gga ccc cca ccg atg atc cag ttt gcc tgt ttg cca aac ctg    864Met Cys Gly Pro Pro Pro Met Ile Gln Phe Ala Cys Leu Pro Asn Leu
    275                 280                 285gag cgt gtg ggc cat ccc aag gag cga tgc ttc acc ttc tga            906Glu Arg Val Gly His Pro Lys Glu Arg Cys Phe Thr Phe
290                 295                 300<210>21<211>301<212>PRT<213>大鼠<400>21Met Gly Ala Gln Leu Ser Thr Leu Ser Arg Val Val Leu Ser Pro Val1               5                  10                  15Trp Phe Val Tyr Ser Leu Phe Met Lys Leu Phe Gln Arg Ser Ser Pro
         20                  25                  30Ala Ile Thr Leu Glu Asn Pro Asp Ile Lys Tyr Pro Leu Arg Leu Ile
     35                  40                  45Asp Lys Glu Ile Ile Ser His Asp Thr Arg Arg Phe Arg Phe Ala Leu
 50                  55                  60Pro Ser Pro Gln His Ile Leu Gly Leu Pro Ile Gly Gln His Ile Tyr65                  70                  75                  80Leu Ser Thr Arg Ile Asp Gly Asn Leu Val Ile Arg Pro Tyr Thr Pro
             85                  90                  95Val Ser Ser Asp Asp Asp Lys Gly Leu Val Asp Leu Val Val Lys Val
        100                 105                 110Tyr Phe Lys Asp Thr His Pro Lys Phe Pro Ala Gly Gly Lys Met Ser
    115                 120                 125Gln Tyr Leu Glu Asn Met Asn Ile Gly Asp Thr Ile Glu Phe Arg Gly
130                 135                 140Pro Asn Gly Leu Leu Val Tyr Gln Gly Lys Gly Lys Phe Ala Ile Arg145                 150                 155                 160Ala Asp Lys Lys Ser Asn Pro Val Val Arg Thr Val Lys Ser Val Gly
            165                 170                 175Met Ile Ala Gly Gly Thr Gly Ile Thr Pro Met Leu Gln Val Ile Arg
        180                 185                 190Ala Val Leu Lys Asp Pro Asn Asp His Thr Val Cys Tyr Leu Leu Phe
    195                 200                 205Ala Asn Gln Ser Glu Lys Asp Ile Leu Leu Arg Pro Glu Leu Glu Glu
210                 215                 220Leu Arg Asn Glu His Ser Ser Arg Phe Lys Leu Trp Tyr Thr Val Asp225                 230                 235                 240Lys Ala Pro Asp Ala Trp Asp Tyr Ser Gln Gly Phe Val Asn Glu Glu
            245                 250                 255Met Ile Arg Asp His Leu Pro Pro Pro Gly Glu Glu Thr Leu Ile Leu
        260                 265                 270Met Cys Gly Pro Pro Pro Met Ile Gln Phe Ala Cys Leu Pro Asn Leu
    275                 280                 285Glu Arg Val Gly His Pro Lys Glu Arg Cys Phe Thr Phe
290                 295                 300<210>22<211>2049<212>DNA<213>兔<220><221>CDS<222>(1)..(2049)<400>22ctg atc aac atg gcg gac tcc cac ggg gac acc ggc gcc acc atg cct    48Leu Ile Asn Met Ala Asp Ser His Gly Asp Thr Gly Ala Thr Met Pro1               5                  10                  15gaa gcg gcg gcc cag gag gcg tcg gtc ttc agc atg acg gac gtg gtt    96Glu Ala Ala Ala Gln Glu Ala Ser Val Phe Ser Met Thr Asp Val Val
         20                  25                  30ctg ttc tcg ctc atc gtg ggg ctg atc acc tac tgg ttc ctc ttc aga    144Leu Phe Ser Leu Ile Val Gly Leu Ile Thr Tyr Trp Phe Leu Phe Arg
     35                  40                  45aag aaa aag gag gaa gtg ccc gag ttc acc aag atc cag gcc ccg acg    192Lys Lys Lys Glu Glu Val Pro Glu Phe Thr Lys Ile Gln Ala Pro Thr
 50                  55                  60tcg tcg tca gtg aag gag agc agc ttc gtg gag aag atg aag aag acg    240Ser Ser Ser Val Lys Glu Ser Ser Phe Val Glu Lys Met Lys Lys Thr65                  70                  75                  80ggc cgg aac atc gtg gtc ttc tac ggc tcc cag acg ggc acc gcc gag    288Gly Arg Asn Ile Val Val Phe Tyr Gly Ser Gln Thr Gly Thr Ala Glu
             85                  90                  95gag ttt gcc aac cgc ctg tcc aag gat gcc cac cgc tac ggg atg cgg    336Glu Phe Ala Asn Arg Leu Ser Lys Asp Ala His Arg Tyr Gly Met Arg
        100                 105                 110ggc atg gcc gcc gac ccc gag gag tac gac ctg gcc gac ctg agc agc    384Gly Met Ala Ala Asp Pro Glu Glu Tyr Asp Leu Ala Asp Leu Ser Ser
    115                 120                 125ctg ccc gag atc aac aac gcc ctg gcc gtc ttc tgc atg gcc acc tac    432Leu Pro Glu Ile Asn Asn Ala Leu Ala Val Phe Cys Met Ala Thr Tyr
130                 135                 140ggt gag ggg gac ccc acc gac aac gcc cag gac ttc tac gac tgg ctg    480Gly Glu Gly Asp Pro Thr Asp Asn Ala Gln Asp Phe Tyr Asp Trp Leu145                 150                 155                 160cag gag acc gac gtg gac ctc tcg ggg gtc aag tac gcg gtg ttt ggc    528Gln Glu Thr Asp Val Asp Leu Ser Gly Val Lys Tyr Ala Val Phe Gly
            165                 170                 175ctc ggg aac aag acc tac gag cac ttc aac gcc atg ggc aag tac gtg    576Leu Gly ASn Lys Thr Tyr Glu His Phe Asn Ala Met Gly Lys Tyr Val
        180                 185                 190gac cag cgg ctg gag cag ctt ggc gcc cag cgc atc ttc gag ctg ggc    624Asp Gln Arg Leu Glu Gln Leu Gly Ala Gln Arg Ile Phe Glu Leu Gly
    195                 200                 205atg ggc gac gat gat gca aac ctg gag gag gac ttc atc acg tgg cgg    672Met Gly Asp Asp Asp Ala Asn Leu Glu Glu Asp Phe Ile Thr Trp Arg
210                 215                 220gag cag ttc tgg ccg gcg gtg tgc gag cac ttc ggt gtg gag gcc aca    720Glu Gln Phe Trp Pro Ala Val Cys Glu His Phe Gly Val Glu Ala Thr225                 230                 235                 240gga gag gag tcc agc att cgg cag tac gag ctc gtg ttg cac aca gac    768Gly Glu Glu Ser Ser Ile Arg Gln Tyr Glu Leu Val Leu His Thr Asp
            245                 250                 255atc gac gtg gcc aag gtg tac cag ggc gag atg ggc cgc ctc aag agc    816Ile Asp Val Ala Lys Val Tyr Gln Gly Glu Met Gly Arg Leu Lys Ser
        260                 265                 270tac gag aac cag aaa ccc ccc ttc gat gcc aag aat ccc ttc ctg gcc    864Tyr Glu Asn Gln Lys Pro Pro Phe Asp Ala Lys Asn Pro Phe Leu Ala
    275                 280                 285acg gtc acc acc aac cgg aag ctg aac cag ggc acc gag cgc cac ctc    912Thr Val Thr Thr Asn Arg Lys Leu Asn Gln Gly Thr Glu Arg His Leu
290                 295                 300atg cac ctg gag ctg gac atc tcg gac tcc aag atc agg tat gag tct    960Met His Leu Glu Leu Asp Ile Ser Asp Ser Lys Ile Arg Tyr Glu Ser305                 310                 315                 320ggg gac cac gtg gct gtg tat ccg gcc aac gac tct gcc ctc gtc aac    1008Gly Asp His Val Ala Val Tyr Pro Ala Asn Asp Ser Ala Leu Val Asn
            325                 330                 335cag ctg ggg gag atc ctg ggt gcc gac ctg gac gtc gtc atg tcc ctg    1056Gln Leu Gly Glu Ile Leu Gly Ala Asp Leu Asp Val Val Met Ser Leu
        340                 345                 350aac aac ctc gat gag gag tcc aac aag aag cac cca ttc ccc tgc ccc    1104Asn Asn Leu Asp Glu Glu Ser Asn Lys Lys His Pro Phe Pro Cys Pro
    355                 360                 365act tcc tac cgc acg gcc ctc acc tac tac ctg gac atc acc aac ccg    1152Thr Ser Tyr Arg Thr Ala Leu Thr Tyr Tyr Leu Asp Ile Thr Asn Pro
370                 375                 380ccg cgc acc aac gtg ctc tac gag ctg gcc cag tac gcc gcc gac ccc    1200Pro Arg Thr Asn Val Leu Tyr Glu Leu Ala Gln Tyr Ala Ala Asp Pro385                 390                 395                 400gct gag cag gag cag ctg cgc aag atg gcc tca tcc tcg ggc gag ggc    1248Ala Glu Gln Glu Gln Leu Arg Lys Met Ala Ser Ser Ser Gly Glu Gly
            405                 410                 415aag gag ctg tac ctg agc tgg gtg gta gag gcg cgg agg cac atc ctg    1296Lys Glu Leu Tyr Leu Ser Trp Val Val Glu Ala Arg Arg His Ile Leu
        420                 425                 430gcc atc ctc caa gac tac ccg tcc ctg cgg ccg ccc atc gac cac ctg    1344Ala Ile Leu Gln Asp Tyr Pro Ser Leu Arg Pro Pro Ile Asp His Leu
    435                 440                 445tgt gag ctg ctg ccc cgg ctg cag gcg cgc tac tac tcc atc gcc tcc    1392Cys Glu Leu Leu Pro Arg Leu Gln Ala Arg Tyr Tyr Ser Ile Ala Ser
450                 455                 460tcc tcc aag gtc cac ccc aac tcc gtg cac atc tgc gcc gtg gcc gtg    1440Ser Ser Lys Val His Pro Asn Ser Val His Ile Cys Ala Val Ala Val465                 470                 475                 480gag tac gag acc aag gcc ggc cgc ctc aac aaa ggc gtg gcc acc agc    1488Glu Tyr Glu Thr Lys Ala Gly Arg Leu Asn Lys Gly Val Ala Thr Ser
            485                 490                 495tgg ctg cgg gcc aag gag ccg gcc ggg gag aat ggc ggc cgt gcc ctg    1536Trp Leu Arg Ala Lys Glu Pro Ala Gly Glu Asn Gly Gly Arg Ala Leu
        500                 505                 510gtg ccc atg ttc gtg cgc aag tcc cag ttc cgc ctg ccc ttc aag gcc    1584Val Pro Met Phe Val Arg Lys Ser Gln Phe Arg Leu Pro Phe Lys Ala
    515                 520                 525acc acg ccg gtc atc atg gtg ggc ccc ggc acc ggc gtg gcc ccc ttc    1632Thr Thr Pro Val Ile Met Val Gly Pro Gly Thr Gly Val Ala Pro Phe
530                 535                 540atc ggc ttt atc cag gag cgg gcc tgg ctg cgg cag cag ggc aag gaa    1680Ile Gly Phe Ile Gln Glu Arg Ala Trp Leu Arg Gln Gln Gly Lys Glu545                 550                 555                 560gtg ggc gag acg ctg ctg tac tac ggc tgc cgg cgc gcg gcc gag gac    1728Val Gly Glu Thr Leu Leu Tyr Tyr Gly Cys Arg Arg Ala Ala Glu Asp
            565                 570                 575tac ctg tac cgc gag gag ctc gcc ggc ttc caa aag gac ggc acg ctc    1776Tyr Leu Tyr Arg Glu Glu Leu Ala Gly Phe Gln Lys Asp Gly Thr Leu
        580                 585                 590agc cag ctc aac gtg gcc ttc tcc cgc gag cag gcc cag aag gtc tac    1824Ser Gln Leu Asn Val Ala Phe Ser Arg Glu Gln Ala Gln Lys Va1 Tyr
    595                 600                 605gtg cag cac ttg ctg agg agg gac aag gag cac ctg tgg cgg ctc atc    1872Val Gln His Leu Leu Arg Arg Asp Lys Glu His Leu Trp Arg Leu Ile
610                 615                 620cac gag ggg ggc gcc cac atc tac gtg tgc ggg gac gct cgg aac atg    1920His Glu Gly Gly Ala His Ile Tyr Val Cys Gly Asp Ala Arg Asn Met625                 630                 635                 640gcc agg gac gtg cag aac acc ttc tac gac atc gtg gcc gag ctg ggg    1968Ala Arg Asp Val Gln Asn Thr Phe Tyr Asp Ile Val Ala Glu Leu Gly
            645                 650                 655gcc atg gag cac gcg cag gcc gtg gac tac gtg aag aag ctc atg acc    2016Ala Met Glu His Ala Gln Ala Val Asp Tyr Val Lys Lys Leu Met Thr
        660                 665                 670aag ggc cgc tac tcc ctg gac gtg tgg agc tag                        2049Lys Gly Arg Tyr Ser Leu Asp Val Trp Ser
    675                 680<210>23<211>682<212>PRT<213>兔<400>23Leu Ile Asn Met Ala Asp Ser His Gly Asp Thr Gly Ala Thr Met Pro1               5                  10                  15Glu Ala Ala Ala Gln Glu Ala Ser Val Phe Ser Met Thr Asp Val Val
         20                  25                  30Leu Phe Ser Leu Ile Val Gly Leu Ile Thr Tyr Trp Phe Leu Phe Arg
     35                  40                  45Lys Lys Lys Glu Glu Val Pro Glu Phe Thr Lys Ile Gln Ala Pre Thr
 50                  55                  60Ser Ser Ser Val Lys Glu Ser Ser Phe Val Glu Lys Met Lys Lys Thr65                  70                  75                  80Gly Arg Asn Ile Val Val Phe Tyr Gly Ser Gln Thr Gly Thr Ala Glu
             85                  90                  95Glu Phe Ala Asn Arg Leu Ser Lys Asp Ala His Arg Tyr Gly Met Arg
        100                 105                 110Gly Met Ala Ala Asp Pro Glu Glu Tyr Asp Leu Ala Asp Leu Ser Ser
    115                 120                 125Leu Pro Glu Ile Asn Asn Ala Leu Ala Val Phe Cys Met Ala Thr Tyr
130                 135                 140Gly Glu Gly Asp Pro Thr Asp Asn Ala Gln Asp Phe Tyr Asp Trp Leu145                 150                 155                 160Gln Glu Thr Asp Val Asp Leu Ser Gly Val Lys Tyr Ala Val Phe Gly
            165                 170                 175Leu Gly Asn Lys Thr Tyr Glu His Phe Asn Ala Met Gly Lys Tyr Val
        180                 185                 190Asp Gln Arg Leu Glu Gln Leu Gly Ala Gln Arg Ile Phe Glu Leu Gly
    195                 200                 205Met Gly Asp Asp Asp Ala Asn Leu Glu Glu Asp Phe Ile Thr Trp Arg
210                 215                 220Glu Gln Phe Trp Pro Ala Val Cys Glu His Phe Gly Val Glu Ala Thr225                 230                 235                 240Gly Glu Glu Ser Ser Ile Arg Gln Tyr Glu Leu Val Leu His Thr Asp
            245                 250                 255Ile Asp Val Ala Lys Val Tyr Gln Gly Glu Met Gly Arg Leu Lys Ser
        260                 265                 270Tyr Glu Asn Gln Lys Pro Pro Phe Asp Ala Lys Asn Pro Phe Leu Ala
    275                 280                 285Thr Val Thr Thr Asn Arg Lys Leu Asn Gln Gly Thr Glu Arg His Leu
290                 295                 300Met His Leu Glu Leu Asp Ile Ser Asp Ser Lys Ile Arg Tyr Glu Ser305                 310                 315                 320Gly Asp His Val Ala Val Tyr Pro Ala Asn Asp Ser Ala Leu Val Asn
            325                 330                 335Gln Leu Gly Glu Ile Leu Gly Ala Asp Leu Asp Val Val Met Ser Leu
        340                 345                 350Asn Asn Leu Asp Glu Glu Ser Asn Lys Lys His Pro Phe Pro Cys Pro
    355                 360                 365Thr Ser Tyr Arg Thr Ala Leu Thr Tyr Tyr Leu Asp Ile Thr Asn Pro
370                 375                 380Pro Arg Thr Asn Val Leu Tyr Glu Leu Ala Gln Tyr Ala Ala Asp Pro385                 390                 395                 400Ala Glu Gln Glu Gln Leu Arg Lys Met Ala Ser Ser Ser Gly Glu Gly
            405                 410                 415Lys Glu Leu Tyr Leu Ser Trp Val Val Glu Ala Arg Arg His Ile Leu
        420                 425                 430Ala Ile Leu Gln Asp Tyr Pro Ser Leu Arg Pro Pro Ile Asp His Leu
    435                 440                 445Cys Glu Leu Leu Pro Arg Leu Gln Ala Arg Tyr Tyr Ser Ile Ala Ser
450                 455                 460Ser Ser Lys Val His Pro Asn Ser Val His Ile Cys Ala Val Ala Val465                 470                 475                 480Glu Tyr Glu Thr Lys Ala Gly Arg Leu Asn Lys Gly Val Ala Thr Ser
            485                 490                 495Trp Leu Arg Ala Lys Glu Pro Ala Gly Glu Asn Gly Gly Arg Ala Leu
        500                 505                 510Val Pro Met Phe Val Arg Lys Ser Gln Phe Arg Leu Pro Phe Lys Ala
    515                 520                 525Thr Thr Pro Val Ile Met Val Gly Pro Gly Thr Gly Val Ala Pro Phe
530                 535                 540Ile Gly Phe Ile Gln Glu Arg Ala Trp Leu Arg Gln Gln Gly Lys Glu545                 550                 555                 560Val Gly Glu Thr Leu Leu Tyr Tyr Gly Cys Arg Arg Ala Ala Glu Asp
            565                 570                 575Tyr Leu Tyr Arg Glu Glu Leu Ala Gly Phe Gln Lys Asp Gly Thr Leu
        580                 585                 590Ser Gln Leu Asn Val Ala Phe Ser Arg Glu Gln Ala Gln Lys Val Tyr
    595                 600                 605Val Gln His Leu Leu Arg Arg Asp Lys Glu His Leu Trp Arg Leu Ile
610                 615                 620His Glu Gly Gly Ala His Ile Tyr Val Cys Gly Asp Ala Arg Asn Met625                 630                 635                 640Ala Arg Asp Val Gln Asn Thr Phe Tyr Asp Ile Val Ala Glu Leu Gly
            645                 650                 655Ala Met Glu His Ala Gln Ala Val Asp Tyr Val Lys Lys Leu Met Thr
        660                 665                 670Lys Gly Arg Tyr Ser Leu Asp Val Trp Ser
    675                 680<210>24<211>444<212>DNA<213>蔬菜沙门氏菌(Spinacia oleracea)<220><221>CDS<222>(1)..(444)<400>24atg gca gca acc acc aca aca atg atg ggc atg gcc acc acc ttt gtc    48Met Ala Ala Thr Thr Thr Thr Met Met Gly Met Ala Thr Thr Phe Val1               5                  10                  15cca aaa ccc caa gca cca cca atg atg gcg gcg ctt cca tcc aac acc    96Pro Lys Pro Gln Ala Pro Pro Met Met Ala Ala Leu Pro Ser Asn Thr
         20                  25                  30ggc cgc tct ttg ttc gga ctc aag acc ggt agc cgt ggc gga agg atg    144Gly Arg Ser Leu Phe Gly Leu Lys Thr Gly Ser Arg Gly Gly Arg Met
     35                  40                  45aca atg gct gcc tac aag gta acc ttg gta aca ccc acc ggt aac gta    192Thr Met Ala Ala Tyr Lys Val Thr Leu Val Thr Pro Thr Gly Asn Val
 50                  55                  60gag ttt caa tgc cca gac gat gtt tac atc ttg gat gct gct gaa gaa    240Glu Phe Gln Cys Pro Asp Asp Val Tyr Ile Leu Asp Ala Ala Glu Glu65                  70                  75                  80gaa ggc att gac ttg cct tac tca tgc aga gct ggg tcg tgc tct tca    288Glu Gly Ile Asp Leu Pro Tyr Ser Cys Arg Ala Gly Ser Cys Ser Ser
             85                  90                  95tgc gcc gga aag ctt aag aca ggt agt ctt aac caa gat gat cag agt    336Cys Ala Gly Lys Leu Lys Thr Gly Ser Leu Asn Gln Asp Asp Gln Ser
        100                 105                 110ttt ttg gat gac gat cag atc gat gaa gga tgg gtt ctt acc tgt gct    384Phe Leu Asp Asp Asp Gln Ile Asp Glu Gly Trp Val Leu Thr Cys Ala
    115                 120                 125gct tac cct gtt agt gat gtt act att gag acc cac aag gaa gag gag    432Ala Tyr Pro Val Ser Asp Val Thr Ile Glu Thr His Lys Glu Glu Glu
130                 135                 140ctt act gcc taa                                                    444Leu Thr Ala145<210>25<211>147<212>PRT<213>蔬菜沙门氏菌<400>25Met Ala Ala Thr Thr Thr Thr Met Met Gly Met Ala Thr Thr Phe Val1               5                  10                  15Pro Lys Pro Gln Ala Pro Pro Met Met Ala Ala Leu Pro Ser Asn Thr
         20                  25                  30Gly Arg Ser Leu Phe Gly Leu Lys Thr Gly Ser Arg Gly Gly Arg Met
     35                  40                  45Thr Met Ala Ala Tyr Lys Val Thr Leu Val Thr Pro Thr Gly Asn Val
 50                  55                  60Glu Phe Gln Cys Pro Asp Asp Val Tyr Ile Leu Asp Ala Ala Glu Glu65                 70                  75                  80Glu Gly Ile Asp Leu Pro Tyr Ser Cys Arg Ala Gly Ser Cys Ser Ser
             85                  90                  95Cys Ala Gly Lys Leu Lys Thr Gly Ser Leu Asn Gln Asp Asp Gln Ser
        100                 105                 110Phe Leu Asp Asp Asp Gln Ile Asp Glu Gly Trp Val Leu Thr Cys Ala
    115                 120                 125Ala Tyr Pro Val Ser Asp Val Thr Ile Glu Thr His Lys Glu Glu Glu
130                 135                 140Leu Thr Ala145<210>26<211>711<212>DNA<213>费氏弧菌(Vibrio fischeri)<220><221>CDS<222>(1)..(711)<400>26atg cca atc aat tgc aaa gta aag tct atc gag cca ttg gct tgt aat    48Met Pro Ile Asn Cys Lys Val Lys Ser Ile Glu Pro Leu Ala Cys Asn1                   5              10                  15act ttt cga att tta ctt cac cca gaa cag cct gtt gct ttt aaa gca    96Thr Phe Arg Ile Leu Leu His Pro Glu Gln Pro Val Ala Phe Lys Ala
             20              25                  30ggc caa tac cta acg gtt gtt atg ggt gaa aaa gac aaa cgc cca ttc    144Gly Gln Tyr Leu Thr Val Val Met Gly Glu Lys Asp Lys Arg Pro Phe
     35                  40                  45tca atc gca agt agt cct tgt cgc cac gaa ggt gaa att gag tta cat    192Ser Ile Ala Ser Ser Pro Cys Arg His Glu Gly Glu Ile Glu Leu His
 50                  55                  60att ggt gcc gca gag cac aat gct tat gcc gga gaa gtg gtt gaa tca    240Ile Gly Ala Ala Glu His Asn Ala Tyr Ala Gly Glu Val Val Glu Ser65                  70                  75                  80atg aaa tcg gca cta gaa acg ggt ggt gat att tta att gat gcg cct    288Met Lys Ser Ala Leu Glu Thr Gly Gly Asp Ile Leu Ile Asp Ala Pro
             85                  90                  95cat ggt gaa gcg tgg atc cgt gaa gac agc gat cgt tca atg tta ttg    336His Gly Glu Ala Trp Ile Arg Glu Asp Ser Asp Arg Ser Met Leu Leu
        100                 105                 110att gct ggc ggt aca ggt ttt agt tac gta cgt tca att ctt gat cac    384Ile Ala Gly Gly Thr Gly Phe Ser Tyr Val Arg Ser Ile Leu Asp His
    115                 120                 125tgt att agc caa cag att caa aaa cca att tac cta tac tgg ggt ggt    432Cys Ile Ser Gln Gln Ile Gln Lys Pro Ile Tyr Leu Tyr Trp Gly Gly
130                 135                 140cgt gat gaa tgc caa ctg tat gca aaa gca gaa tta gag agc att gct    480Arg Asp Glu Cys Gln Leu Tyr Ala Lys Ala Glu Leu Glu Ser Ile Ala145                 150                 155                 160caa gcg cat agc cat att acg ttt gtg cca gtg gtt gag aaa agt gaa    528Gln Ala His Ser His Ile Thr Phe Val Pro Val Val Glu Lys Ser Glu
            165                 170                 175ggc tgg aca ggt aaa acg ggt aat gtg tta gaa gcg gta aaa gcc gat    576Gly Trp Thr Gly Lys Thr Gly Asn Val Leu Glu Ala Val Lys Als Asp
        180                 185                 190ttt aac tca cta gca gat atg gat att tac atc gca ggt cgc ttt gaa    624Phe Asn Ser Leu Ala Asp Met Asp Ile Tyr Ile Ala Gly Arg Phe Glu
    195                 200                 205atg gct ggt gca gca cgt gag cag ttc acc act gaa aaa caa gcg aag    672Met Ala Gly Ala Ala Arg Glu Gln Phe Thr Thr Glu Lys Gln Ala Lys
210                 215                 220aaa gag cag ctg ttt ggt gat gca ttc gca ttt atc taa                711Lys Glu Gln Leu Phe Gly Asp Ala Phe Ala Phe Ile225                 230                 235<210>27<211>236<212>PRT<213>费氏弧菌<400>27Met Pro Ile Asn Cys Lys Val Lys Ser Ile Glu Pro Leu Ala Cys Asn1               5                  10                  15Thr Phe Arg Ile Leu Leu His Pro Glu Gln Pro Val Ala Phe Lys Ala
         20                  25                  30Gly Gln Tyr Leu Thr Val Val Met Gly Glu Lys Asp Lys Arg Pro Phe
     35                  40                  45Ser Ile Ala Ser Ser Pro Cys Arg His Glu Gly Glu Ile Glu Leu His
 50                  55                  60Ile Gly Ala Ala Glu His Asn Ala Tyr Ala Gly Glu Val Val Glu Ser65                  70                  75                  80Met Lys Ser Ala Leu Glu Thr Gly Gly Asp Ile Leu Ile Asp Ala Pro
             85                  90                  95His Gly Glu Ala Trp Ile Arg Glu Asp Ser Asp Arg Ser Met Leu Leu
        100                 105                 110Ile Ala Gly Gly Thr Gly Phe Ser Tyr Val Arg Ser Ile Leu Asp His
    115                 120                 125Cys Ile Ser Gln Gln Ile Gln Lys Pro Ile Tyr Leu Tyr Trp Gly Gly
130                 135                 140Arg Asp Glu Cys Gln Leu Tyr Ala Lys Ala Glu Leu Glu Ser Ile Ala145                 150                 155                 160Gln Ala His Ser His Ile Thr Phe Val Pro Val Val Glu Lys Ser Glu
            165                 170                 175Gly Trp Thr Gly Lys Thr Gly Asn Val Leu Glu Ala Val Lys Ala Asp
        180                 185                 190Phe Asn Ser Leu Ala Asp Met Asp Ile Tyr Ile Ala Gly Arg Phe Glu
    195                 200                 205Met Ala Gly Ala Ala Arg Glu Gln Phe Thr Thr Glu Lys Gln Ala Lys
210                 215                 220Lys Glu Gln Leu Phe Gly Asp Ala Phe Ala Phe Ile225                 230                 235<210>28<211>1110<212>DNA<213>蔬菜沙门氏菌<220><221>CDS<222>(1)..(1110)<400>28atg acc acc gct gtc acc gcc gct gtt tct ttc ccc tct acc aaa acc    48Met Thr Thr Ala Val Thr Ala Ala Val Ser Phe Pro Ser Thr Lys Thr1               5                  10                  15acc tct ctc tcc gcc cga agc tcc tcc gtc att tcc cct gac aaa atc    96Thr Ser Leu Ser Ala Arg Ser Ser Ser Val Ile Ser Pro Asp Lys Ile
         20                  25                  30agc tac aaa aag gtt cct ttg tac tac agg aat gta tct gca act ggg    144Ser Tyr Lys Lys Val Pro Leu Tyr Tyr Arg Asn Val Ser Ala Thr Gly
     35                  40                  45aaa atg gga ccc atc agg gcc cag atc gcc tct gat gtg gag gca cct    192Lys Met Gly Pro Ile Arg Ala Gln Ile Ala Ser Asp Val Glu Ala Pro
 50                  55                  60cca cct gct cct gct aag gta gag aaa cat tca aag aaa atg gag gaa    240Pro Pro Ala Pro Ala Lys Val Glu Lys His Ser Lys Lys Met Glu Glu65                  70                  75                  80ggc att aca gtg aac aag ttt aag cct aag acc cct tac gtt gga aga    288Gly Ile Thr Val Ash Lys Phe Lys Pro Lys Thr Pro Tyr Val Gly Arg
             85                  90                  95tgt ctt ctt aac acc aaa att act ggg gat gat gca ccc gga gag acc    336Cys Leu Leu Asn Thr Lys Ile Thr Gly Asp Asp Ala Pro Gly Glu Thr
        100                 105                 110tgg cac atg gtt ttt tcc cat gaa gga gag atc cct tac aga gaa ggg    384Trp His Met Val Phe Ser His Glu Gly Glu Ile Pro Tyr Arg Glu Gly
    115                 120                 125caa tcc gtt ggg gtt att cca gat ggg gaa gac aag aat gga aag ccc    432Gln Ser Val Gly Val Ile Pro Asp Gly Glu Asp Lys Asn Gly Lys Pro
130                 135                 140cat aag ttg aga ttg tac tcg atc gcc agc agt gct ctt ggt gat ttt    480His Lys Leu Arg Leu Tyr Ser Ile Ala Ser Ser Ala Leu Gly Asp Phe145                 150                 155                 160ggt gat gct aaa tct gtt tcg ttg tgt gta aaa cga ctc atc tac acc    528Gly Asp Ala Lys Ser Val Ser Leu Cys Val Lys Arg Leu Ile Tyr Thr
            165                 170                 175aat gac gct gga gag acg atc aag gga gtc tgc tcc aac ttc ttg tgt    576Asn Asp Ala Gly Glu Thr Ile Lys Gly Val Cys Ser Asn Phe Leu Cys
        180                 185                 190gac ttg aaa ccc ggt gct gaa gtg aag tta aca gga cca gtt gga aag    624Asp Leu Lys Pro Gly Ala Glu Val Lys Leu Thr Gly Pro Val Gly Lys
    195                 200                 205gag atg ctc atg ccc aaa gac cct aac gcg aca att atc atg ctt gga    672Glu Met Leu Met Pro Lys Asp Pro Asn Ala Thr Ile Ile Met Leu Gly
210                 215                 220act gga acg ggg att gct cct ttc cgt tca ttc ttg tgg aag atg ttc    720Thr Gly Thr Gly Ile Ala Pro Phe Arg Ser Phe Leu Trp Lys Met Phe225                 230                 235                 240ttc gaa aag cat gat gat tac aag ttt aac ggc ttg gct tgg ctt ttc    768Phe Glu Lys His Asp Asp Tyr Lys Phe Asn Gly Leu Ala Trp Leu Phe
            245                 250                 255ttg ggt gta ccc aca agc agt tot ctt ctc tac aaa gag gaa ttt gag    816Leu Gly Val Pro Thr Ser Ser Ser Leu Leu Tyr Lys Glu Glu Phe Glu
        260                 265                 270aag atg aag gaa aag gct cca gac aac ttc agg ctg gat ttt gca gtg     864Lys Met Lys Glu Lys Ala Pro Asp Asn Phe Arg Leu Asp Phe Ala Val
    275                 280                 285agc aga gag caa act aac gag aaa ggg gag aag atg tac att caa acc     912Ser Arg Glu Gln Thr Asn Glu Lys Gly Glu Lys Met Tyr Ile Gln Thr
290                 295                 300cga atg gca caa tac gca gtt gag cta tgg gaa atg ttg aag aaa gat     960Arg Met Ala Gln Tyr Ala Val Glu Leu Trp Glu Met Leu Lys Lys Asp305                 310                 315                 320aat act tat gtc tac atg tgt ggt ctc aag gga atg gaa aag gga att    1008Asn Thr Tyr Val Tyr Met Cys Gly Leu Lys Gly Met Glu Lys Gly Ile
            325                 330                 335gac gac att atg gtt tca ttg gct gct gca gaa ggc att gat tgg att    1056Asp Asp Ile Met Val Ser Leu Ala Ala Ala Glu Gly Ile Asp Trp Ile
        340                 345                 350gaa tac aag agg cag ttg aag aag gca gaa caa tgg aac gtt gaa gtc    1104Glu Tyr Lys Arg Gln Leu Lys Lys Ala Glu Gln Trp Asn Val Glu Val
    355                 360                 365tac taa                                                            1110Tyr
370<210>29<211>369<212>PRT<213>蔬菜沙门氏菌<400>29Met Thr Thr Ala Val Thr Ala Ala Val Ser Phe Pro Ser Thr Lys Thr1               5                  10                  15Thr Ser Leu Ser Ala Arg Ser Ser Ser Val Ile Ser Pro Asp Lys Ile
         20                  25                  30Ser Tyr Lys Lys Val Pro Leu Tyr Tyr Arg Asn Val Ser Ala Thr Gly
     35                  40                  45Lys Met Gly Pro Ile Arg Ala Gln Ile Ala Ser Asp Val Glu Ala Pro
 50                  55                  60Pro Pro Ala Pro Ala Lys Val Glu Lys His Ser Lys Lys Met Glu Glu65                  70                  75                  80Gly Ile Thr Val Asn Lys Phe Lys Pro Lys Thr Pro Tyr Val Gly Arg
             85                  90                  95Cys Leu Leu Asn Thr Lys Ile Thr Gly Asp Asp Ala Pro Gly Glu Thr
        100                 105                 110Trp His Met Val Phe Ser His Glu Gly Glu Ile Pro Tyr Arg Glu Gly
    115                 120                 125Gln Ser Val Gly Val Ile Pro Asp Gly Glu Asp Lys Asn Gly Lys Pro
130                 135                 140His Lys Leu Arg Leu Tyr Ser Ile Ala Ser Ser Ala Leu Gly Asp Phe145                 150                 155                 160Gly Asp Ala Lys Ser Val Ser Leu Cys Val Lys Arg Leu Ile Tyr Thr
            165                 170                 175Asn Asp Ala Gly Glu Thr Ile Lys Gly Val Cys Ser Asn Phe Leu Cys
        180                 185                 190Asp Leu Lys Pro Gly Ala Glu Val Lys Leu Thr Gly Pro Val Gly Lys
    195                 200                 205Glu Met Leu Met Pro Lys Asp Pro Asn Ala Thr Ile Ile Met Leu Gly
210                 215                 220Thr Gly Thr Gly Ile Ala Pro Phe Arg Ser Phe Leu Trp Lys Met Phe225                 230                 235                 240Phe Glu Lys His Asp Asp Tyr Lys Phe Asn Gly Leu Ala Trp Leu Phe
            245                 250                 255Leu Gly Val Pro Thr Ser Ser Ser Leu Leu Tyr Lys Glu Glu Phe Glu
        260                 265                 270Lys Met Lys Glu Lys Ala Pro Asp Asn Phe Arg Leu Asp Phe Ala Val
    275                 280                 285Ser Arg Glu Gln Thr Asn Glu Lys Gly Glu Lys Met Tyr Ile Gln Thr
290                 295                 300Arg Met Ala Gln Tyr Ala Val Glu Leu Trp Glu Met Leu Lys Lys Asp305                 310                 315                 320Asn Thr Tyr Val Tyr Met Cys Gly Leu Lys Gly Met Glu Lys Gly Ile
            325                 330                 335Asp Asp Ile Met Val Ser Leu Ala Ala Ala Glu Gly Ile Asp Trp Ile
        340                 345                 350Glu Tyr Lys Arg Gln Leu Lys Lys Ala Glu Gln Trp Asn Val Glu Val
    355                 360                 365Tyr<210>30<2ll>2580<212>DNA<213>寄生曲霉(Aspergillus parasiticus)<220><221>CDS<222>(1)..(2580)<400>30atg gca acc atc acg gag gtt cgg acg gat gcg ctc gtc cca act gac    48Met Ala Thr Ile Thr Glu Val Arg Thr Asp Ala Leu Val Pro Thr Asp  1               5                  10                  15ctc gtc ctt aag aca ggt cag atc aaa att caa agc gaa gag atc tcg    96Leu Val Leu Lys Thr Gly Gln Ile Lys Ile Gln Ser Glu Glu Ile Ser
         20                  25                  30acg aaa gac ctg tcc gat atc cct ctg cca cca cca tca aaa cgg ccg    144Thr Lys Asp Leu Ser Asp Ile Pro Leu Pro Pro Pro Ser Lys Arg Pro
     35                  40                  45aca gaa gtg ctg agc gta gat aaa gga acc cca gat agc cat gtt ccg    192Thr Glu Val Leu Ser Val Asp Lys Gly Thr Pro Asp Ser His Val Pro
 50                  55                  60cgt gat cct cga ctc atc aga tta acg ggt gtt cat ccg ttt aac gtt    240Arg Asp Pro Arg Leu Ile Arg Leu Thr Gly Val His Pro Phe Asn Val65                  70                  75                  80gag cca cct ctt aca gat ctg tat aaa gaa ggg ttt tta aca tcg ccg    288Glu Pro Pro Leu Thr Asp Leu Tyr Lys Glu Gly Phe Leu Thr Ser Pro
             85                  90                  95gag ctc ttc tat gtt cga aat cat ggc cca gtc cct cat gtc aag gat    336Glu Leu Phe Tyr Val Arg Asn His Gly Pro Val Pro His Val Lys Asp
        100                 105                 110gaa gat atc cct cac tgg gaa att act atc gaa gga ctg gta gag aag    384Glu Asp Ile Pro His Trp Glu Ile Thr Ile Glu Gly Leu Val Glu Lys
    115                 120                 125cct ttg gta cta aac ttc cga caa gtg ttg cag cag tac gac caa ata    432Pro Leu Val Leu Asn Phe Arg Gln Val Leu Gln Gln Tyr Asp Gln Ile
130                  135                 140acg gcg ccc atc acc ctc gta tgt gca ggc aat cga cgc aaa gag caa    480Thr Ala Pro Ile Thr Leu Val Cys Ala Gly Asn Arg Arg Lys Glu Gln145                 150                 155                 160aac att gta cgt aaa acg aaa ggt ttt tct tgg gga tcc gcg gga cta    528Asn Ile Val Arg Lys Thr Lys Gly Phe Ser Trp Gly Ser Ala Gly Leu
            165                 170                 175tcg act gcc ctc ttc act ggc cca ttg ctg gcg gat atc ctc cgc agt    576Ser Thr Ala Leu Phe Thr Gly Pro Leu Leu Ala Asp Ile Leu Arg Ser
        180                 185                 190ggc aaa ccc ctg cgt caa gcg aaa tac gtc tgt atg gaa gga gcg gat    624Gly Lys Pro Leu Arg Gln Ala Lys Tyr Val Cys Met Glu Gly Ala Asp
    195                 200                 205aag ctg ccc aat ggt cac tac ggc aca ctc att aaa ttg aac tgg gcc    672Lys Leu Pro Asn Gly His Tyr Gly Thr Leu Ile Lys Leu Asn Trp Ala
210                 215                 220cta gac ccc aac agg ggg atc atg ctt gca cat aaa atg aac ggg gag    720Leu Asp Pro Asn Arg Gly Ile Met Leu Ala His Lys Met Asn Gly Glu225                 230                 235                 240tct ctt cgc cca gat cat ggt cgt ccg ctg agg gcc gtc gtg ccc ggt    768Ser Leu Arg Pro Asp His Gly Arg Pro Leu Arg Ala Val Val Pro Gly
            245                 250                 255caa ata gga gga cga agt gtc aag tgg ctg aag agg ctg atc ttg acc    816Gln Ile Gly Gly Arg Ser Val Lys Trp Leu Lys Arg Leu Ile Leu Thr
        260                 265                 270gat gca cca agc gat aac tgg tac cat atc aat gac aac cgc gtc tta    864Asp Ala Pro Ser Asp Asn Trp Tyr His Ile Asn Asp Asn Arg Val Leu
    275                 280                 285cca aca atg gtc tcg ccc gat atg gca tca aat aac cga aat tgg tgg    912Pro Thr Met Val Ser Pro Asp Met Ala Ser Asn Asn Arg Asn Trp Trp
290                 295                 300cac gat gag cgg gat gcg att tat gac cta aac acc aac tcc gcc gtt    960His Asp Glu Arg Asp Ala Ile Tyr Asp Leu Asn Thr Asn Ser Ala Val305                 310                 315                 320gga tat cct caa aac aat gag gtc tta aat atc ctg gag gcc agg gcc    1008Gly Tyr Pro Gln Asn Asn Glu Val Leu Asn Ile Leu Glu Ala Arg Ala
            325                 330                 335gtc ata tac tgt cag agg ata gct tac gct ggt ggg ggc cgt agg gtt    1056Val Ile Tyr Cys Gln Arg Ile Ala Tyr Ala Gly Gly Gly Arg Arg Val
        340                 345                 350acc agg gta gaa ata tcc cta gac aaa ggc aaa tct tgg aga ttg gcg    1104Thr Arg Val Glu Ile Ser Leu Asp Lys Gly Lys Ser Trp Arg Leu Ala
    355                 360                 365gat atc gaa tat gcc gaa gac aag tat cgt gat ttc gaa ggc gag ctt    1152Asp Ile Glu Tyr Ala Glu Asp Lys Tyr Arg Asp Phe Glu Gly Glu Leu
370                 375                 380ttt gga ggc aaa gta gat atg tac tgg cgc gaa act tgc ttc tgc tgg    1200Phe Gly Gly Lys Val Asp Met Tyr Trp Arg Glu Thr Cys Phe Cys Trp385                 390                 395                 400tgt ttt tgg tct cta agc atc gcc atc cca gag ctt gag aac agt gat    1248Cys Phe Trp Ser Leu Ser Ile Ala Ile Pro Glu Leu Glu Asn Ser Asp
            405                 410                 415gcc atc ctt gta aga gcc atg gat gaa gca ttg ggc gtg cag cct cgc    1296Ala Ile Leu Val Arg Ala Met Asp Glu Ala Leu Gly Val Gln Pro Arg
        420                 425                 430gat atg tac tgg tcc gtt ctc gga atg atg aac aac cct tgg ttc cgg    1344Asp Met Tyr Trp Ser Val Leu Gly Met Met Asn Asn Pro Trp Phe Arg
    435                 440                 445gtt aca att acg aag gaa aac ggg aac ttg aga ttc gag cac cct acc    1392Val Thr Ile Thr Lys Glu Asn Gly Asn Leu Arg Phe Glu His Pro Thr
450             455                     460cac cct agt atg cct aca gga tgg atg gaa cgc gtc aaa aaa gct ggg    1440His Pro Ser Met Pro Thr Gly Trp Met Glu Arg Val Lys Lys Ala Gly465             470                     475                 480ggt gac ccg acg aat ggt aac tgg gga gaa aga cac gaa gga gag gag    1488Gly Asp Pro Thr Asn Gly Asn Trp Gly Glu Arg His Glu Gly Glu Glu
            485                 490                 495ccg acg gag ccg gag ccc gtg caa gac att aat atg aag aaa gac ggg    1536Pro Thr Glu Pro Glu Pro Val Gln Asp Ile Asn Met Lys Lys Asp Gly
        500                 505                 510cca agc cga acg att agt ttt gaa gaa ttc aag gag aat tcc tgt gat    1584Pro Ser Arg Thr Ile Ser Phe Glu Glu Phe Lys Glu Asn Ser Cys Asp
    515                 520                 525gag aag cca tgg ttc atc gtg aat gga gaa gtg tat gat ggt caa gca    1632Glu Lys Pro Trp Phe Ile Val Asn Gly Glu Val Tyr Asp Gly Gln Ala
530                 535                 540ttt ctt gaa ggc cac cct ggc gga cgg cag agt att atc tcc tct gcc    1680Phe Leu Glu Gly His Pro Gly Gly Arg Gln Ser Ile Ile Ser Ser Ala545                 550                 555                 560ggt cag gac gtc tcc gag gaa ttc ctt gct att cat agc gag acg gca    1728Gly Gln Asp Val Ser Glu Glu Phe Leu Ala Ile His Ser Glu Thr Ala
            565                 570                 575aag gcg atg atg cct gag tac cat att gga acg acg gat ccg gaa ggc    1776Lys Ala Met Met Pro Glu Tyr His Ile Gly Thr Thr Asp Pro Glu Gly
        580                 585                 590ttg ata gca ctc aag gat gat gca tca tcc tcc acc gat gaa att cgc    1824Leu Ile Ala Leu Lys Asp Asp Ala Ser Ser Ser Thr Asp Glu Ile Arg
    595                 600                 605cca gtg ttc ctc caa tca cgg tct tgg aca aag gca aca ttg aaa gaa    1872Pro Val Phe Leu Gln Ser Arg Ser Trp Thr Lys Ala Thr Leu Lys Glu
610                 615                 620agg aaa gac ata tca tgg gat aca cga ata ttt agt ttc aaa ttg gaa    1920Arg Lys Asp Ile Ser Trp Asp Thr Arg Ile Phe Ser Phe Lys Leu Glu625                 630                 635                 640cac gaa gat caa aca ttg ggt tta cca gtc ggc cag cat ctt atg atc    1968His Glu Asp Gln Thr Leu Gly Leu Pro Val Gly Gln His Leu Met Ile
            645                 650                 655aaa gtc ctc gac aga tca tcc aac aac gaa gcc atc atc cgc tca tac    2016Lys Val Leu Asp Arg Ser Ser Ash Asn Glu Ala Ile Ile Arg Ser Tyr
        660                 665                 670acc ccg att tct gaa acc agc caa aaa ggg act gtg gac ttg ctg gtt    2064Thr Pro Ile Ser Glu Thr Ser Gln Lys Gly Thr Val Asp Leu Leu Val
    675                 680                 685aaa gta tac ttt gca aca gcc acc tcg gca ggc ggc aag atg acg atg    2112Lys Val Tyr Phe Ala Thr Ala Thr Ser Ala Gly Gly Lys Met Thr Met
690                 695                 700gcc ctg gat agg ctg cca ttg ggc tcc gtg gtc gaa tat ctt gga aat    2160Ala Leu Asp Arg Leu Pro Leu Gly Ser Val Val Glu Tyr Leu Gly Asn705                 710                 715                 720gga cga gtt ctc ata agt ggc aag gag cgc cat gtt cgg tcg ttt aag    2208Gly Arg Val Leu Ile Ser Gly Lys Glu Arg His Val Arg Ser Phe Lys
            725                 730                 735atg att tgt gga gga acc ggt atc aca ccg atc ttg cag gtc ttg cgc    2256Met Ile Cys Gly Gly Thr Gly Ile Thr Pro Ile Leu Gln Val Leu Arg
        740                 745                 750gcc gtg gtt cag gac cat caa gat cct acc tct tgt gta gtc ctc aat    2304Ala Val Val Gln Asp His Gln Asp Pro Thr Ser Cys Val Val Leu Asn
    755                 760                 765gga aac aga cag gag gaa gat atc ctt cgc cgg gct gag ctc gac ggc    2352Gly Asn Arg Gln Glu Glu Asp Ile Leu Arg Arg Ala Glu Leu Asp Gly
770                 775                 780ttc atg gcg tcc gac agc aga agg tgt aat ata ata cac act cta tcc    2400Phe Met Ala Ser Asp Ser Arg Arg Cys Asn Ile Ile His Thr Leu Ser785                 790                 795                 800aaa gcg ccg gac tca tgg act ggc cgc cga gga cgc ata tcc gaa gag    2448Lys Ala Pro Asp Ser Trp Thr Gly Arg Arg Gly Arg Ile Ser Glu Glu
            805                 810                 815ctc cta aag gag tac gcg gct cca gaa gat gag agt atg gta ctg att    2496Leu Leu Lys Glu Tyr Ala Ala Pro Glu Asp Glu Ser Met Val Leu Ile
        820                 825                 830tgt ggt ccg cca gcc atg gaa gaa tcg gct cgg agg ata ctg ttg gcg    2544Cys Gly Pro Pro Ala Met Glu Glu Ser Ala Arg Arg Ile Leu Leu Ala
    835                 840                 845gaa gga tgg aaa gaa tca gac ctt cac ttt ttc tga                  2580Glu Gly Trp Lys Glu Ser Asp Leu His Phe Phe
850                 855                 860<210>31<211>859<212>PRT<213>寄生曲霉<400>31Met Ala Thr Ile Thr Glu Val Arg Thr Asp Ala Leu Val Pro Thr Asp1               5                  10                  15Leu Val Leu Lys Thr Gly Gln Ile Lys Ile Gln Ser Glu Glu Ile Ser
         20                  25                  30Thr Lys Asp Leu Ser Asp Ile Pro Leu Pro Pro Pro Ser Lys Arg Pro
     35                  40                  45Thr Glu Val Leu Ser Val Asp Lys Gly Thr Pro Asp Ser His Val Pro
 50                  55                  60Arg Asp Pro Arg Leu Ile Arg Leu Thr Gly Val His Pro Phe Asn Val65                  70                  75                  80Glu Pro Pro Leu Thr Asp Leu Tyr Lys Glu Gly Phe Leu Thr Ser Pro
             85                  90                  95Glu Leu Phe Tyr Val Arg Asn His Gly Pro Val Pro His Val Lys Asp
        100                 105                 110Glu Asp Ile Pro His Trp Glu Ile Thr Ile Glu Gly Leu Val Glu Lys
    115                 120                 125Pro Leu Val Leu Asn Phe Arg Gln Val Leu Gln Gln Tyr Asp Gln Ile
130                 135                 140Thr Ala Pro Ile Thr Leu Val Cys Ala Gly Asn Arg Arg Lys Glu Gln145                 150                 155                 160Asn Ile Val Arg Lys Thr Lys Gly Phe Ser Trp Gly Ser Ala Gly Leu
            165                 170                 175Ser Thr Ala Leu Phe Thr Gly Pro Leu Leu Ala Asp Ile Leu Arg Ser
        180                 185                 190Gly Lys Pro Leu Arg Gln Ala Lys Tyr Val Cys Met Glu Gly Ala Asp
    195                 200                 205Lys Leu Pro Asn Gly His Tyr Gly Thr Leu Ile Lys Leu Asn Trp Ala
210                 215                 220Leu Asp Pro Asn Arg Gly Ile Met Leu Ala His Lys Met Asn Gly Glu225                 230                 235                 240Ser Leu Arg Pro Asp His Gly Arg Pro Leu Arg Ala Val Val Pro Gly
            245                 250                 255Gln Ile Gly Gly Arg Ser Val Lys Trp Leu Lys Arg Leu Ile Leu Thr
        260                 265                 270Asp Ala Pro Ser Asp Asn Trp Tyr His Ile Asn Asp Asn Arg Val Leu
    275                  280                285Pro Thr Met Val Ser Pro Asp Met Ala Ser Asn Asn Arg Asn Trp Trp
290                 295                 300His Asp Glu Arg Asp Ala Ile Tyr Asp Leu Asn Thr Asn Ser Ala Val305                 310                 315                 320Gly Tyr Pro Gln Asn Asn Glu Val Leu Asn Ile Leu Glu Ala Arg Ala
            325                 330                 335Val Ile Tyr Cys Gln Arg Ile Ala Tyr Ala Gly Gly Gly Arg Arg Val
        340                 345                 350Thr Arg Val Glu Ile Ser Leu Asp Lys Gly Lys Ser Trp Arg Leu Ala
    355                 360                 365Asp Ile Glu Tyr Ala Glu Asp Lys Tyr Arg Asp Phe Glu Gly Glu Leu
370                 375                 380Phe Gly Gly Lys Val Asp Met Tyr Trp Arg Glu Thr Cys Phe Cys Trp385                 390                 395                 400Cys Phe Trp Ser Leu Ser Ile Ala Ile Pro Glu Leu Glu Asn Ser Asp
            405                 410                 415Ala Ile Leu Val Arg Ala Met Asp Glu Ala Leu Gly Val Gln Pro Arg
        420                 425                 430Asp Met Tyr Trp Ser Val Leu Gly Met Met Asn Asn Pro Trp Phe Arg
    435                 440                 445Val Thr Ile Thr Lys Glu Asn Gly Asn Leu Arg Phe Glu His Pro Thr
450                 455                 460His Pro Ser Met Pro Thr Gly Trp Met Glu Arg Val Lys Lys Ala Gly465                 470                 475                 480Gly Asp Pro Thr Asn Gly Asn Trp Gly Glu Arg His Glu Gly Glu Glu
            485                 490                 495Pro Thr Glu Pro Glu Pro Val Gln Asp Ile Asn Met Lys Lys Asp Gly
        500                 505                 510Pro Ser Arg Thr Ile Ser Phe Glu Glu Phe Lys Glu Asn Ser Cys Asp
    515                 520                 525Glu Lys Pro Trp Phe Ile Val Asn Gly Glu Val Tyr Asp Gly Gln Ala
530                 535                 540Phe Leu Glu Gly His Pro Gly Gly Arg Gln Ser Ile Ile Ser Ser Ala545                 550                 555                 560Gly Gln Asp Val Ser Glu Glu Phe Leu Ala Ile His Ser Glu Thr Ala
            565                 570                 575Lys Ala Met Met Pro Glu Tyr His Ile Gly Thr Thr Asp Pro Glu Gly
        580                 585                 590Leu Ile Ala Leu Lys Asp Asp Ala Ser Ser Ser Thr Asp Glu Ile Arg
    595                 600                 605Pro Val Phe Leu Gln Ser Arg Ser Trp Thr Lys Ala Thr Leu Lys Glu
610                 615                 620Arg Lys Asp Ile Ser Trp Asp Thr Arg Ile Phe Ser Phe Lys Leu Glu625                 630                 635                 640His Glu Asp Gln Thr Leu Gly Leu Pro Val Gly Gln His Leu Met Ile
            645                 650                 655Lys Val Leu Asp Arg Ser Ser Asn Asn Glu Ala Ile Ile Arg Ser Tyr
        660                 665                 670Thr Pro Ile Ser Glu Thr Ser Gln Lys Gly Thr Val Asp Leu Leu Val
    675                 680                 685Lys Val Tyr Phe Ala Thr Ala Thr Ser Ala Gly Gly Lys Met Thr Met
690                 695                 700Ala Leu Asp Arg Leu Pro Leu Gly Ser Val Val Glu Tyr Leu Gly Asn705                 710                 715                 720Gly Arg Val Leu Ile Ser Gly Lys Glu Arg His Val Arg Ser Phe Lys
            725                 730                 735Met Ile Cys Gly Gly Thr Gly Ile Thr Pro Ile Leu Gln Val Leu Arg
        740                 745                 750Ala Val Val Gln Asp His Gln Asp Pro Thr Ser Cys Val Val Leu Asn
    755                 760                 765Gly Asn Arg Gln Glu Glu Asp Ile Leu Arg Arg Ala Glu Leu Asp Gly
770                 775                 780Phe Met Ala Ser Asp Ser Arg Arg Cys Asn Ile Ile His Thr Leu Ser785                 790                 795                 800Lys Ala Pro Asp Ser Trp Thr Gly Arg Arg Gly Arg Ile Ser Glu Glu
            805                 810                 815Leu Leu Lys Glu Tyr Ala Ala Pro Glu Asp Glu Ser Met Val Leu Ile
        820                 825                 830Cys Gly Pro Pro Ala Met Glu Glu Ser Ala Arg Arg Ile Leu Leu Ala
    835                 840                 845Glu Gly Trp Lys Glu Ser Asp Leu His Phe Phe
850                 855<210>32<211>37<212>DNA<213>人工<220><223>引物<220><221>misc feature<222>(1)..(37)<400>32gcgcgaattc atgacaacct taagctgtaa agtgacc               37<210>33<211>34<212>DNA<213>人工<220><223>引物<220><221>misc feature<222>(1)..(34)<400>33gcgcctgcag tcagataaat gcaaacgcat cgcc                  34<210>34<211>26019<212>DNA<213>合成<220><221>启动子<222>(233)..(1582)<220><221>内含子<222>(1583)..(1958)<220><221>基因<222>(1969)..(3585)<223>PrnA<220><221>终子<222>(3603)..(3877)<220><221>启动子<222>(3888)..(5237)<220><221>内含子<222>(5238)..(5613)<220><221>基因<222>(5624)..(7327)<223>prnC<220><221>终止子<222>(7338)..(7612)<220><221>启动子<222>(7636)..(8985)<220><221>内含子<222>(8986)..(9361)<220><221>基因<222>(9372)..(10457)<223>PrnB<220><221>终止子<222>(10464)..(10738)<220><221>启动子<222>(10749)..(12098)<220><221>内含子<222>(12099)..(12474)<220><221>基因<222>(12485)..(13576)<223>PrnD<220><221>终止子<222>(13583)..(13857)<220><221>启动子<222>(13942)..(14942)<220><221>基因<222>(14948)..(15649)<223>fre<220><22l>终止子<222>(15655)..(15936)<220><221>启动子<222>(15949)..(17285)<220><221>内含子<222>(17283)..(17679)<220><22l>基因<222>(17696)..(18238)<223>选择标记<220><221>终子<222>(18245)..(18526)<400>34tggggaaccc tgtggttggc atgcacatac aaatggacga acggataaac cttttcacgc     60ccttttaaat atccgattat tctaataaac gctcttttct cttaggttta cccgccaata     120tatcctgtca aacactgata gtttaaactg aaggcgggaa acgacaatct gatctatcgt     180tctagtcgta cgttttgcga tcggtctcac tagagcggcc gcctcgaggt accggatttg     240gagccaagtc tcataaacgc cattgtggaa gaaagtcttg agttggtggt aatgtaacag     300agtagtaaga acagagaaga gagagagtgt gagatacatg aattgtcggg caacaaaaat     360cctgaacatc ttattttagc aaagagaaag agttccgagt ctgtagcaga agagtgagga     420gaaatttaag ctcttggact tgtgaattgt tccgcctctt gaatacttct tcaatcctca     480tatattcttc ttctatgtta cctgaaaacc ggcatttaat ctcgcgggtt tattccggtt     540caacattttt tttgttttga gttattatct gggcttaata acgcaggcct gaaataaatt     600caaggcccaa ctgttttttt ttttaagaag ttgctgttaa aaaaaaaaaa agggaattaa     660caacaacaac aaaaaaagat aaagaaaata ataacaatta ctttaattgt agactaaaaa     720aacatagatt ttatcatgaa aaaaagagaa aagaaataaa aacttggatc aaaaaaaaaa     780acatacagat cttctaatta ttaacttttc ttaaaaatta ggtccttttt cccaacaatt     840aggtttagag ttttggaatt aaaccaaaaa gattgttcta aaaaatactc aaatttggta     900gataagtttc cttattttaa ttagtcaatg gtagatactt ttttttcttt tctttattag     960agtagattag aatcttttat gccaagtttt gataaattaa atcaagaaga taaactatca     1020taatcaacat gaaattaaaa gaaaaatctc atatatagta ttagtattct ctatatatat     1080tatgattgct tattcttaat gggttgggtt aaccaagaca tagtcttaat ggaaagaatc     1140ttttttgaac tttttcctta ttgattaaat tcttctatag aaaagaaaga aattatttga     1200ggaaaagtat atacaaaaag aaaaatagaa aaatgtcagt gaagcagatg taatggatga     1260cctaatccaa ccaccaccat aggatgtttc tacttgagtc ggtcttttaa aaacgcacgg     1320tggaaaatat gacacgtatc atatgattcc ttcctttagt ttcgtgataa taatcctcaa     1380ctgatatctt cctttttttg ttttggctaa agatatttta ttctcattaa tagaaaagac     1440ggttttgggc ttttggtttg cgatataaag aagaccttcg tgtggaagat aataattcat     1500cctttcgtct ttttctgact cttcaatctc tcccaaagcc taaagcgatc tctgcaaatc     1560tctcgcgact ctctctttca aggtatattt tctgattctt tttgtttttg attcgtatct     1620gatctccaat ttttgttatg tggattattg aatcttttgt ataaattgct tttgacaata     1680ttgttcgttt cgtcaatcca gcttctaaat tttgtcctga ttactaagat atcgattcgt    1740agtgtttaca tctgtgtaat ttcttgcttg attgtgaaat taggattttc aaggacgatc    1800tattcaattt ttgtgttttc tttgttcgat tctctctgtt ttaggtttct tatgtttaga    1860tccgtttctc tttggtgttg ttttgatttc tcttacggct tttgatttgg tatatgttcg    1920ctgattggtt tctacttgtt ctattgtttt atttcaggtg gatccaccat gaacaagccg    1980atcaagaata tcgtcatcgt gggcggcggt actgcgggct ggatggccgc ctcgtacctc    2040gtccgggccc tccaacagca ggcgaacatt acgctcatcg aatctgcggc gatccctcgg    2100atcggcgtgg gcgaagcgac catcccaagt ttgcagaagg tgttcttcga tttcctcggg    2160ataccggagc gggaatggat gccccaagtg aacggcgcgt tcaaggccgc gatcaagttc    2220gtgaattgga gaaagtctcc cgacccctcg cgcgacgatc acttctacca tttgttcggc    2280aacgtgccga actgcgacgg cgtgccgctt acccactact ggctgcgcaa gcgcgaacag    2340ggcttccagc agccgatgga gtacgcgtgc tacccgcagc ccggggcact cgacggcaag    2400ctggcaccgt gcctgtccga cggcacccgc cagatgtccc acgcgtggca cttcgacgcg    2460cacctggtgg ccgacttctt gaagcgctgg gccgtcgagc gcggggtgaa ccgcgtggtc    2520gatgaggtgg tggacgttcg cctgaacaac cgcggctaca tctccaacct gctcaccaag    2580gaggggcgga cgctggaggc ggacctgttc atcgactgct ccggcatgcg ggggctcctg    2640atcaatcagg cgctgaagga acccttcatc gacatgtccg actacctgct gtgcgacagc    2700gcggtcgcca gcgccgtgcc caacgacgac gcgcgcgatg gggtcgagcc gtacacctcc    2760tcgatcgcca tgaactcggg atggacctgg aagattccga tgctgggccg gttcggcagc    2820ggctacgtct tctcgagcca tttcacctcg cgcgaccagg ccaccgccga cttcctcaaa    2880ctctggggcc tctcggacaa tcagccgctc aaccagatca agttccgggt cgggcgcaac    2940aagcgggcgt gggtcaacaa ctgcgtctcg atcgggctgt cgtcgtgctt tctggagccc    3000ctggaatcga cggggatcta cttcatctac gcggcgcttt accagctcgt gaagcacttc    3060cccgacacct cgttcgaccc gcggctgagc gacgctttca acgccgagat cgtccacatg    3120ttcgacgact gccgggattt cgtccaagcg cactatttca ccacgtcgcg cgatgacacg    3180ccgttctggc tcgcgaaccg gcacgacctg cggctctcgg acgccatcaa agagaaggtt    3240cagcgctaca aggcggggct gccgctgacc accacgtcgt tcgacgattc cacgtactac    3300gagaccttcg actacgaatt caagaatttc tggttgaacg gcaactacta ctgcatcttt    3360gccggcttgg gcatgctgcc cgaccggtcg ctgccgctgt tgcagcaccg accggagtcg    3420atcgagaaag ccgaggcgat gttcgccagc atccggcgcg aggccgagcg tctgcgcacc    3480agcctgccga caaactacga ctacctgcgg tcgctgcgtg acggcgacgc ggggctgtcg    3540cgcggccagc gtgggccgaa gctcgcagcg caggaaagcc tgtagtggaa cgcaccttgg    3600aggatccccc gaatttcccc gatcgttcaa acatttggca ataaagtttc ttaagattga    3660atcctgttgc cggtcttgcg atgattatca tctaatttct gttgaattac gttaagcatg    3720taataattaa catgtaatgc atgacgttat ttatgagatg ggtttttatg attagagtcc    3780cgcaattata catttaatac gcgatagaaa acaaaatata gcgcgcaaac taggataaat    3840tatcgcgcgc ggtgtcatct atgttactag atccgggaat tgggtaccgg atttggagcc    3900aagtctcata aacgccattg tggaagaaag tcttgagttg gtggtaatgt aacagagtag    3960taagaacaga gaagagagag agtgtgagat acatgaattg tcgggcaaca aaaatcctga    4020acatcttatt ttagcaaaga gaaagagttc cgagtctgta gcagaagagt gaggagaaat    4080ttaagctctt ggacttgtga attgttccgc ctcttgaata cttcttcaat cctcatatat    4140tcttcttcta tgttacctga aaaccggcat ttaatctcgc gggtttattc cggttcaaca    4200ttttttttgt tttgagttat tatctgggct taataacgca ggcctgaaat aaattcaagg    4260cccaactgtt ttttttttta agaagttgct gttaaaaaaa aaaaaaggga attaacaaca    4320acaacaaaaa aagataaaga aaataataac aattacttta attgtagact aaaaaaacat    4380agattttatc atgaaaaaaa gagaaaagaa ataaaaactt ggatcaaaaa aaaaaacata    4440cagatcttct aattattaac ttttcttaaa aattaggtcc tttttcccaa caattaggtt    4500tagagttttg gaattaaacc aaaaagattg ttctaaaaaa tactcaaatt tggtagataa    4560gtttccttat tttaattagt caatggtaga tacttttttt tcttttcttt attagagtag    4620attagaatct tttatgccaa gttttgataa attaaatcaa gaagataaac tatcataatc    4680aacatgaaat taaaagaaaa atctcatata tagtattagt attctctata tatattatga    4740ttgcttattc ttaatgggtt gggttaacca agacatagtc ttaatggaaa gaatcttttt    4800tgaacttttt ccttattgat taaattcttc tatagaaaag aaagaaatta tttgaggaaa    4860agtatataca aaaagaaaaa tagaaaaatg tcagtgaagc agatgtaatg gatgacctaa    4920tccaaccacc accataggat gtttctactt gagtcggtct tttaaaaacg cacggtggaa    4980aatatgacac gtatcatatg attccttcct ttagtttcgt gataataatc ctcaactgat    5040atcttccttt ttttgttttg gctaaagata ttttattctc attaatagaa aagacggttt    5100tgggcttttg gtttgcgata taaagaagac cttcgtgtgg aagataataa ttcatccttt    5160cgtctttttc tgactcttca atctctccca aagcctaaag cgatctctgc aaatctctcg    5220cgactctctc tttcaaggta tattttctga ttctttttgt ttttgattcg tatctgatct    5280ccaatttttg ttatgtggat tattgaatct tttgtataaa ttgcttttga caatattgtt    5340cgtttcgtca atccagcttc taaattttgt cctgattact aagatatcga ttcgtagtgt    5400ttacatctgt gtaatttctt gcttgattgt gaaattagga ttttcaagga cgatctattc    5460aatttttgtg ttttctttgt tcgattctct ctgttttagg tttcttatgt ttagatccgt    5520ttctctttgg tgttgttttg atttctctta cggcttttga tttggtatat gttcgctgat    5580tggtttctac ttgttctatt gttttatttc aggtggatcc accatgactc agaagagccc    5640cgcgaacgaa cacgatagca atcacttcga cgtaatcatc ctcggctcgg gcatgtccgg    5700cacccagatg ggggccatct tggccaaaca acagtttcgc gtgctgatca tcgaggagtc    5760gtcgcacccg cggttcacga tcggcgaatc gtcgatcccc gagacgtctc ttatgaaccg    5820catcatcgct gatcgctacg gcattccgga gctcgaccac atcacgtcgt tttattcgac    5880gcaacgttac gtcgcgtcga gcacgggcat taagcgcaac ttcggcttcg tgttccacaa    5940gcccggccag gagcacgacc cgaaggagtt cacccagtgc gtcattcccg agctgccgtg    6000ggggccggag agccattatt accggcaaga cgtcgacgcc tacttgttgc aagccgccat    6060taaatacggc tgcaaggtcc accagaaaac taccgtgacc gaataccacg ccgataaaga    6120cggcgtcgcg gtgaccaccg cccagggcga acggttcacc ggccggtaca tgatcgactg    6180cggaggacct cgcgcgccgc tcgcgaccaa gttcaagctc cgcgaagaac cgtgtcgctt    6240caagacgcac tcgcgcagcc tctacacgca catgctcggg gtcaagccgt tcgacgacat    6300cttcaaggtc aaggggcagc gctggcgctg gcacgagggg accttgcacc acatgttcga    6360gggcggctgg ctctgggtga ttccgttcaa caaccacccg cggtcgacca acaacctggt    6420gagcgtcggc ctgcagctcg acccgcgtgt ctacccgaaa accgacatct ccgcacagca    6480ggaattcgat gagttcctcg cgcggttccc gagcatcggg gctcagttcc gggacgccgt    6540gccggtgcgc gactgggtca agaccgaccg cctgcaattc tcgtcgaacg cctgcgtcgg    6600cgaccgctac tgcctgatgc tgcacgcgaa cggcttcatc gacccgctct tctcccgggg    6660gctggaaaac accgcggtga ccatccacgc gctcgcggcg cgcctcatca aggcgctgcg    6720cgacgacgac ttctcccccg agcgcttcga gtacatcgag cgcctgcagc aaaagctttt    6780ggaccacaac gacgacttcg tcagctgctg ctacacggcg ttctcggact tccgcctatg    6840ggacgcgttc cacaggctgt gggcggtcgg caccatcctc gggcagttcc ggctcgtgca    6900ggcccacgcg aggttccgcg cgtcgcgcaa cgagggcgac ctcgatcacc tcgacaacga    6960ccctccgtat ctcggatacc tgtgcgcgga catggaggag tactaccagt tgttcaacga    7020cgccaaagcc gaggtcgagg ccgtgagtgc cgggcgcaag ccggccgatg aggccgcggc    7080gcggattcac gccctcattg acgaacgaga cttcgccaag ccgatgttcg gcttcgggta    7140ctgcatcacc ggggacaagc cgcagctcaa caactcgaag tacagcctgc tgccggcgat    7200gcggctgatg tactggacgc aaacccgcgc gccggcagag gtgaaaaagt acttcgacta    7260caacccgatg ttcgcgctgc tcaaggcgta catcacgacc cgcatcggcc tggcgctgaa    7320gaagtagccg ctcgagggat cccccgaatt tccccgatcg ttcaaacatt tggcaataaa    7380gtttcttaag attgaatcct gttgccggtc ttgcgatgat tatcatctaa tttctgttga    7440attacgttaa gcatgtaata attaacatgt aatgcatgac gttatttatg agatgggttt    7500ttatgattag agtcccgcaa ttatacattt aatacgcgat agaaaacaaa atatagcgcg    7560caaactagga taaattatcg cgcgcggtgt catctatgtt actagatccg ggaattagcg    7620gccgcctcga ggtaccggat ttggagccaa gtctcataaa cgccattgtg gaagaaagtc    7680ttgagttggt ggtaatgtaa cagagtagta agaacagaga agagagagag tgtgagatac    7740atgaattgtc gggcaacaaa aatcctgaac atcttatttt agcaaagaga aagagttccg    7800agtctgtagc agaagagtga ggagaaattt aagctcttgg acttgtgaat tgttccgcct    7860cttgaatact tcttcaatcc tcatatattc ttcttctatg ttacctgaaa accggcattt    7920aatctcgcgg gtttattccg gttcaacatt ttttttgttt tgagttatta tctgggctta    7980ataacgcagg cctgaaataa attcaaggcc caactgtttt tttttttaag aagttgctgt    8040taaaaaaaaa aaaagggaat taacaacaac aacaaaaaaa gataaagaaa ataataacaa    8100ttactttaat tgtagactaa aaaaacatag attttatcat gaaaaaaaga gaaaagaaat    8160aaaaacttgg atcaaaaaaa aaaacataca gatcttctaa ttattaactt ttcttaaaaa    8220ttaggtcctt tttcccaaca attaggttta gagttttgga attaaaccaa aaagattgtt    8280ctaaaaaata ctcaaatttg gtagataagt ttccttattt taattagtca atggtagata    8340cttttttttc ttttctttat tagagtagat tagaatcttt tatgccaagt tttgataaat    8400taaatcaaga agataaacta tcataatcaa catgaaatta aaagaaaaat ctcatatata    8460gtattagtat tctctatata tattatgatt gcttattctt aatgggttgg gttaaccaag    8520acatagtctt aatggaaaga atcttttttg aactttttcc ttattgatta aattcttcta    8580tagaaaagaa agaaattatt tgaggaaaag tatatacaaa aagaaaaata gaaaaatgtc    8640agtgaagcag atgtaatgga tgacctaatc caaccaccac cataggatgt ttctacttga    8700gtcggtcttt taaaaacgca cggtggaaaa tatgacacgt atcatatgat tccttccttt    8760agtttcgtga taataatcct caactgatat cttccttttt ttgttttggc taaagatatt    8820ttattctcat taatagaaaa gacggttttg ggcttttggt ttgcgatata aagaagacct    8880tcgtgtggaa gataataatt catcctttcg tctttttctg actcttcaat ctctcccaaa    8940gcctaaagcg atctctgcaa atctctcgcg actctctctt tcaaggtata ttttctgatt    9000ctttttgttt ttgattcgta tctgatctcc aatttttgtt atgtggatta ttgaatcttt    9060tgtataaatt gcttttgaca atattgttcg tttcgtcaat ccagcttcta aattttgtcc    9120tgattactaa gatatcgatt cgtagtgttt acatctgtgt aatttcttgc ttgattgtga    9180aattaggatt ttcaaggacg atctattcaa tttttgtgtt ttctttgttc gattctctct    9240gttttaggtt tcttatgttt agatccgttt ctctttggtg ttgttttgat ttctcttacg    9300gcttttgatt tggtatatgt tcgctgattg gtttctactt gttctattgt tttatttcag    9360gtggatccac catggaacgc accttggacc gggtaggcgt attcgcggcc acccacgctg    9420ccgtggcggc ctgcgatccg ctgcaggcgc gcgcgctcgt tctgcaactg ccgggcctga    9480accgtaacaa ggacgtgccc ggtatcgtcg gcctgctgcg cgagttcctt ccggtgcgcg    9540gcctgccctg cggctggggt ttcgtcgaag ccgccgccgc gatgcgggac atcgggttct    9600tcctggggtc gctcaagcgc cacggacatg agcccgcgga ggtggtgccc gggcttgagc    9660cggtgctgct cgacctggca cgcgcgacca acctgccgcc gcgcgagacg ctcctgcatg    9720tgacggtctg gaaccccacg gcggccgacg cgcagcgcag ctacaccggg ctgcccgacg    9780aagcgcacct gctcgagagc gtgcgcatct cgatggcggc cctcgaggcg gccatcgcgt    9840tgaccgtcga gctgttcgat gtgtccctgc ggtcgcccga gttcgcgcaa aggtgcgacg    9900agctggaagc ctatctgcag aaaatggtcg aatcgatcgt ctacgcgtac cgcttcatct    9960cgccgcaggt cttctacgat gagctgcgcc ccttctacga accgattcga gtcgggggcc    10020agagctacct cggccccggt gccgtagaga tgcccctctt cgtgctggag cacgtcctct    10080ggggctcgca atcggacgac caaacttatc gagaattcaa agagacgtac ctgccctatg    10140tgcttcccgc gtacagggcg gtctacgctc ggttctccgg ggagccggcg ctcatcgacc    10200gcgcgctcga cgaggcgcga gcggtcggta cgcgggacga gcacgtccgg gctgggctga    10260cagccctcga gcgggtcttc aaggtcctgc tgcgcttccg ggcgcctcac ctcaaattgg    10320cggagcgggc gtacgaagtc gggcaaagcg gccccgaaat cggcagcggg gggtacgcgc    10380ccagcatgct cggtgagctg ctcacgctga cgtatgccgc gcggtcccgc gtccgcgccg    10440cgctcgacga atcctgaagc ttggatcccc cgaatttccc cgatcgttca aacatttggc    10500aataaagttt cttaagattg aatcctgttg ccggtcttgc gatgattatc atctaatttc    10560tgttgaatta cgttaagcat gtaataatta acatgtaatg catgacgtta tttatgagat    10620gggtttttat gattagagtc ccgcaattat acatttaata cgcgatagaa aacaaaatat    10680agcgcgcaaa ctaggataaa ttatcgcgcg cggtgtcatc tatgttacta gatccgggaa   10740ttgggtaccg gatttggagc caagtctcat aaacgccatt gtggaagaaa gtcttgagtt   10800ggtggtaatg taacagagta gtaagaacag agaagagaga gagtgtgaga tacatgaatt   10860gtcgggcaac aaaaatcctg aacatcttat tttagcaaag agaaagagtt ccgagtctgt   10920agcagaagag tgaggagaaa tttaagctct tggacttgtg aattgttccg cctcttgaat   10980acttcttcaa tcctcatata ttcttcttct atgttacctg aaaaccggca tttaatctcg   11040cgggtttatt ccggttcaac attttttttg ttttgagtta ttatctgggc ttaataacgc   11100aggcctgaaa taaattcaag gcccaactgt tttttttttt aagaagttgc tgttaaaaaa   11160aaaaaaaggg aattaacaac aacaacaaaa aaagataaag aaaataataa caattacttt   11220aattgtagac taaaaaaaca tagattttat catgaaaaaa agagaaaaga aataaaaact   11280tggatcaaaa aaaaaaacat acagatcttc taattattaa cttttcttaa aaattaggtc   11340ctttttccca acaattaggt ttagagtttt ggaattaaac caaaaagatt gttctaaaaa   11400atactcaaat ttggtagata agtttcctta ttttaattag tcaatggtag atactttttt   11460ttcttttctt tattagagta gattagaatc ttttatgcca agttttgata aattaaatca   11520agaagataaa ctatcataat caacatgaaa ttaaaagaaa aatctcatat atagtattag   11580tattctctat atatattatg attgcttatt cttaatgggt tgggttaacc aagacatagt   11640cttaatggaa agaatctttt ttgaactttt tccttattga ttaaattctt ctatagaaaa   11700gaaagaaatt atttgaggaa aagtatatac aaaaagaaaa atagaaaaat gtcagtgaag   11760cagatgtaat ggatgaccta atccaaccac caccatagga tgtttctact tgagtcggtc   11820ttttaaaaac gcacggtgga aaatatgaca cgtatcatat gattccttcc tttagtttcg   11880tgataataat cctcaactga tatcttcctt tttttgtttt ggctaaagat attttattct   11940cattaataga aaagacggtt ttgggctttt ggtttgcgat ataaagaaga ccttcgtgtg   12000gaagataata attcatcctt tcgtcttttt ctgactcttc aatctctccc aaagcctaaa   12060gcgatctctg caaatctctc gcgactctct ctttcaaggt atattttctg attctttttg   12120tttttgattc gtatctgatc tccaattttt gttatgtgga ttattgaatc ttttgtataa   12180attgcttttg acaatattgt tcgtttcgtc aatccagctt ctaaattttg tcctgattac   12240taagatatcg attcgtagtg tttacatctg tgtaatttct tgcttgattg tgaaattagg   12300attttcaagg acgatctatt caatttttgt gttttctttg ttcgattctc tctgttttag   12360gtttcttatg tttagatccg tttctctttg gtgttgtttt gatttctctt acggcttttg   12420atttggtata tgttcgctga ttggtttcta cttgttctat tgttttattt caggtggatc   12480caccatgaac gacattcaat tggatcaagc gagcgtcaag aagcgtccct cgggcgcgta   12540cgacgcaacc acgcgcctgg ccgcgagctg gtacgtcgcg atgcgctcca acgagctcaa   12600ggacaagccg accgagttga cgctcttcgg ccgtccgtgc gtggcgtggc gcggagccac   12660ggggcgggcc gtggtgatgg accgccactg ctcgcacctg ggcgcgaacc tggctgacgg   12720gcggatcaag gacgggtgca tccagtgccc gtttcaccac tggcggtacg acgaacaggg   12780ccagtgcgtt cacatccccg gccataacca ggcggtgcgc cagctggagc cggtgccgcg   12840cggggcgcgt cagccgacgt tggtcaccgc cgagcgatac ggctacgtgt gggtctggta   12900cggctccccg ctgccgctgc acccgctgcc cgaaatctcc gcggccgatg tcgacaacgg   12960cgactttatg cacctgcact tcgcgttcga gacgaccacg gcggtcttgc ggatcgtcga   13020gaacttctac gacgcgcagc acgcaacccc ggtgcacgca ctcccgatct cggccttcga   13080actcaagctc ttcgacgatt ggcgccagtg gccggaggtt gagtcgctgg ccctggcggg   13140cgcgtggttc ggtgccggga tcgacttcac cgtggaccgg tacttcggcc ccctcggcat   13200gctgtcacgc gcgctcggcc tgaacatgtc gcagatgaac ctgcacttcg atggctaccc   13260cggcgggtgc gtcatgaccg tcgccctgga cggagacgtc aaatacaagc tgctccagtg   13320tgtgacgccg gtgagcgaag gcaagaacgt catgcacatg ctcatctcga tcaagaaggt   13380gggcggcatc ctgctccgcg cgaccgactt cgtgctgttc gggctgcaga ccaggcaggc   13440cgcggggtac gacgtcaaaa tctggaacgg aatgaagccg gacggcggcg gcgcgtacag   13500caagtacgac aagctcgtgc tcaagtaccg ggcgttctat cgaggctggg tcgaccgcgt   13560cgcaagtgag cggtgaagct tggatccccc gaatttcccc gatcgttcaa acatttggca   13620ataaagtttc ttaagattga atcctgttgc cggtcttgcg atgattatca tctaatttct   13680gttgaattac gttaagcatg taataattaa catgtaatgc atgacgttat ttatgagatg   13740ggtttttatg attagagtcc cgcaattata catttaatac gcgatagaaa acaaaatata   13800gcgcgcaaac taggataaat tatcgcgcgc ggtgtcatct atgttactag atccgggaat   13860tccggaccgc gctctagtgc gatcgctttt ttaattaatt ttaagctttc tagaggccgg   13920ccgcggccgc ctcgaggtac catcaggata ttcttgctta agatgttgaa ctctatggag   13980gtttgtatga actgatgatc taggaccgga taagttccct tcttcatagc gaacttattc   14040aaagaatgtt ttgtgtatca ttcttgttac attgttatta atgaaaaaat attattggtc   14100attggactga acacgagtgt taaatatgga ccaggcccca aataagatcc attgatatat   14160gaattaaata acaagaataa atcgagtcac caaaccactt gcctttttta acgagacttg   14220ttcaccaact tgatacaaaa gtcattatcc tatgcaaatc aataatcata caaaaatatc   14280caataacact aaaaaattaa aagaaatgga taatttcaca atatgttata cgataaagaa   14340gttacttttc caagaaattc actgatttta taagcccact tgcattagat aaatggcaaa   14400aaaaaacaaa aaggaaaaga aataaagcac gaagaattct agaaaatacg aaatacgctt   14460caatgcagtg ggacccacgg ttcaattatt gccaattttc agctccaccg tatatttaaa   14520aaataaaacg ataatgctaa aaaaatataa atcgtaacga tcgttaaatc tcaacggctg   14580gatcttatga cgaccgttag aaattgtggt tgtcgacgag tcagtaataa acggcgtcaa   14640agtggttgca gccggcacac acgagtcgtg tttatcaact caaagcacaa atacttttcc   14700tcaacctaaa aataaggcaa ttagccaaaa acaactttgc gtgtaaacaa cgctcaatac   14760acgtgtcatt ttattattag ctattgcttc accgccttag ctttctcgtg acctagtcgt   14820cctcgtcttt tcttccttct tcttctataa aacaataccc aaagagctct tcttcttcac   14880aattcagatt tcaatttctc aaaatcttaa aaactttctc tcaattctct ctaccgtgat   14940cggaaccatg acaaccttaa gctgtaaagt gacctcggta gaagctatca cggataccgt   15000atatcgtgtc cgcatcgtgc cagacgcggc cttttctttt cgtgctggtc agtatttgat   15060ggtagtgatg gatgagcgcg acaaacgtcc gttctcaatg gcttcgacgc cggatgaaaa   15120agggtttatc gagctgcata ttggcgcttc tgaaatcaac ctttacgcga aagcagtcat   15180ggaccgcatc ctcaaagatc atcaaatcgt ggtcgacatt ccccacggag aagcgtggct   15240gcgcgatgat gaagagcgtc cgatgatttt gattgcgggc ggcaccgggt tctcttatgc   15300ccgctcgatt ttgctgacag cgttggcgcg taacccaaac cgtgatatca ccatttactg   15360gggcgggcgt gaagagcagc atctgtatga tctctgcgag cttgaggcgc tttcgttgaa   15420gcatcctggt ctgcaagtgg tgccggtggt tgaacaaccg gaagcgggct ggcgtgggcg   15480tactggcacc gtgttaacgg cggtattgca ggatcacggt acgctggcag agcatgatat   15540ctatattgcc ggacgttttg agatggcgaa aattgcccgc gatctgtttt gcagtgagcg   15600taatgcgcgg gaagatcgcc tgtttggcga tgcgtttgca tttatctgag gatcccccga   15660atttccccga tcgttcaaac atttggcaat aaagtttctt aagattgaat cctgttgccg   15720gtcttgcgat gattatcatc taatttctgt tgaattacgt taagcatgta ataattaaca   15780tgtaatgcat gacgttattt atgagatggg tttttatgat tagagtcccg caattataca   15840tttaatacgc gatagaaaac aaaatatagc gcgcaaacta ggataaatta tcgcgcgcgg   15900tgtcatctat gttactagat ccgggaatta gcggccgcct cgaggtaccg gatttggagc   15960caagtctcat aaacgccatt gtggaagaaa gtcttgagtt ggtggtaatg taacagagta   16020gtaagaacag agaagagaga gagtgtgaga tacatgaatt gtcgggcaac aaaaatcctg   16080aacatcttat tttagcaaag agaaagagtt ccgagtctgt agcagaagag tgaggagaaa   16140tttaagctct tggacttgtg aattgttccg cctcttgaat acttcttcaa tcctcatata   16200ttcttcttct atgttacctg aaaaccggca tttaatctcg cgggtttatt ccggttcaac   16260attttttttg ttttgagtta ttatctgggc ttaataacgc aggcctgaaa taaattcaag   16320gcccaactgt tttttttttt aagaagttgc tgttaaaaaa aaaaaaaggg aattaacaac   16380aacaacaaaa aaagataaag aaaataataa caattacttt aattgtagac taaaaaaaca   16440tagattttat catgaaaaaa agagaaaaga aataaaaact tggatcaaaa aaaaaaacat   16500acagatcttc taattattaa cttttcttaa aaattaggtc ctttttccca acaattaggt   16560ttagagtttt ggaattaaac caaaaagatt gttctaaaaa atactcaaat ttggtagata   16620agtttcctta ttttaattag tcaatggtag atactttttt ttcttttctt tattagagta   16680gattagaatc ttttatgcca agttttgata aattaaatca agaagataaa ctatcataat   16740caacatgaaa ttaaaagaaa aatctcatat atagtattag tattctctat atatattatg   16800attgcttatt cttaatgggt tgggttaacc aagacatagt cttaatggaa agaatctttt   16860ttgaactttt tccttattga ttaaattctt ctatagaaaa gaaagaaatt atttgaggaa   16920aagtatatac aaaaagaaaa atagaaaaat gtcagtgaag cagatgtaat ggatgaccta   16980atccaaccac caccatagga tgtttctact tgagtcggtc ttttaaaaac gcacggtgga   17040aaatatgaca cgtatcatat gattccttcc tttagtttcg tgataataat cctcaactga   17100tatcttcctt tttttgtttt ggctaaagat attttattct cattaataga aaagacggtt   17160ttgggctttt ggtttgcgat ataaagaaga ccttcgtgtg gaagataata attcatcctt   17220tcgtcttttt ctgactcttc aatctctccc aaagcctaaa gcgatctctg caaatctctc   17280gcgactctct ctttcaaggt atattttctg attctttttg tttttgattc gtatctgatc   17340tccaattttt gttatgtgga ttattgaatc ttttgtataa attgcttttg acaatattgt   17400tcgtttcgtc aatccagctt ctaaattttg tcctgattac taagatatcg attcgtagtg   17460tttacatctg tgtaatttct tgcttgattg tgaaattagg attttcaagg acgatctatt   17520caatttttgt gttttctttg ttcgattctc tctgttttag gtttcttatg tttagatccg   17580tttctctttg gtgttgtttt gatttctctt acggcttttg atttggtata tgttcgctga   17640ttggtttcta cttgttctat tgttttattt caggtggatc tgttggggat ctaccatgag   17700cccagaacga cgcccggccg acatccgccg tgccaccgag gcggacatgc cggcggtctg   17760caccatcgtc aaccactaca tcgagacaag cacggtcaac ttccgtaccg agccgcagga   17820accgcaggag tggacggacg acctcgtccg tctgcgggag cgctatccct ggctcgtcgc   17880cgaggtggac ggcgaggtcg ccggcatcgc ctacgcgggc ccctggaagg cacgcaacgc   17940ctacgactgg acggccgagt cgaccgtgta cgtctccccc cgccaccagc ggacgggact   18000gggctccacg ctctacaccc acctgctgaa gtccctggag gcacagggct tcaagagcgt   18060ggtcgctgtc atcgggctgc ccaacgaccc gagcgtgcgc atgcacgagg cgctcggata   18120tgccccccgc ggcatgctgc gggcggccgg cttcaagcac gggaactggc atgacgtggg   18180tttctggcag ctggacttca gcctgccggt accgccccgt ccggtcctgc ccgtcaccga   18240gatcccccga atttccccga tcgttcaaac atttggcaat aaagtttctt aagattgaat   18300cctgttgccg gtcttgcgat gattatcatc taatttctgt tgaattacgt taagcatgta   18360ataattaaca tgtaatgcat gacgttattt atgagatggg tttttatgat tagagtcccg   18420caattataca tttaatacgc gatagaaaac aaaatatagc gcgcaaacta ggataaatta   18480tcgcgcgcgg tgtcatctat gttactagat ccgggaattg ggtacccaat tccggaccgc   18540tgctctagag gcgcgcccct agggagcttc tgcagacgcg tcgacgtcat atggatccga   18600tctgttgccc gtctcactgg tgaaaagaaa aaccacccca gtacattaaa aacgtccgca   18660atgtgttatt aagttgtcta agcgtcaatt tgtttacacc acaatatatc ctgccaccag   18720ccagccaaca gctccccgac cggcagctcg gcacaaaatc accactcgat acaggcagcc   18780catcagtccg ggacggtcga cctgcaggca tgcaagctca cgtagtgtac gtaatcgatt   18840tcgaagggcc ccctagtcca tgggcttttt ctcctcgtgc tcgtaaacgg acccgaacat   18900ctctggagct ttcttcaggg ccgacaatcg gatctcgcgg aaatcctgca cgtcggccgc   18960tccaagccgt cgaatctgag ccttaatcac aattgtcaat tttaatcctc tgtttatcgg   19020cagttcgtag agcgcgccgt gcgtcccgag cgatactgag cgaagcaagt gcgtcgagca   19080gtgcccgctt gttcctgaaa tgccagtaaa gcgctggctg ctgaaccccc agccggaact   19140gaccccacaa ggccctagcg tttgcaatgc accaggtcat cattgaccca ggcgtgttcc   19200accaggccgc tgcctcgcaa ctcttcgcag gcttcgccga cctgctcgcg ccacttcttc   19260acgcgggtgg aatccgatcc gcacatgagg cggaaggttt ccagcttgag cgggtacggc   19320tcccggtgcg agctgaaata gtcgaacatc cgtcgggccg tcggcgacag cttgcggtac   19380ttctcccata tgaatttcgt gtagtggtcg ccagcaaaca gcacgacgat ttcctcgtcg   19440atcaggacct ggcaacggga cgttttcttg ccacggtcca ggacgcggaa gcggtgcagc   19500agcgacaccg attccaggtg cccaacgcgg tcggacgtga agcccatcgc cgtcgcctgt   19560aggcgcgaca ggcattcctc ggccttcgtg taataccggc cattgatcga ccagcccagg   19620tcctggcaaa gctcgtagaa cgtgaaggtg atcggctcgc cgataggggt gcgcttcgcg   19680tactccaaca cctgctgcca caccagttcg tcatcgtcgg cccgcagctc gacgccggtg   19740taggtgatct tcacgtcctt gttgacgtgg aaaatgacct tgttttgcag cgcctcgcgc   19800gggattttct tgttgcgcgt ggtgaacagg gcagagcggg ccgtgtcgtt tggcatcgct   19860cgcatcgtgt ccggccacgg cgcaatatcg aacaaggaaa gctgcatttc cttgatctgc   19920tgcttcgtgt gtttcagcaa cgcggcctgc ttggcctcgc tgacctgttt tgccaggtcc   19980tcgccggcgg tttttcgctt cttggtcgtc atagttcctc gcgtgtcgat ggtcatcgac   20040ttcgccaaac ctgccgcctc ctgttcgaga cgacgcgaac gctccacggc ggccgatggc   20100gcgggcaggg cagggggagc cagttgcacg ctgtcgcgct cgatcttggc cgtagcttgc   20160tggaccatcg agccgacgga ctggaaggtt tcgcggggcg cacgcatgac ggtgcggctt   20220gcgatggttt cggcatcctc ggcggaaaac cccgcgtcga tcagttcttg cctgtatgcc   20280ttccggtcaa acgtccgatt cattcaccct ccttgcggga ttgccccgac tcacgccggg   20340gcaatgtgcc cttattcctg atttgacccg cctggtgcct tggtgtccag ataatccacc   20400ttatcggcaa tgaagtcggt cccgtagacc gtctggccgt ccttctcgta cttggtattc   20460cgaatcttgc cctgcacgaa taccagcgac cccttgccca aatacttgcc gtgggcctcg   20520gcctgagagc caaaacactt gatgcggaag aagtcggtgc gctcctgctt gtcgccggca   20580tcgttgcgcc acatctaggt actaaaacaa ttcatccagt aaaatataat attttatttt   20640ctcccaatca ggcttgatcc ccagtaagtc aaaaaatagc tcgacatact gttcttcccc   20700gatatcctcc ctgatcgacc ggacgcagaa ggcaatgtca taccacttgt ccgccctgcc   20760gcttctccca agatcaataa agccacttac tttgccatct ttcacaaaga tgttgctgtc   20820tcccaggtcg ccgtgggaaa agacaagttc ctcttcgggc ttttccgtct ttaaaaaatc   20880atacagctcg cgcggatctt taaatggagt gtcttcttcc cagttttcgc aatccacatc   20940ggccagatcg ttattcagta agtaatccaa ttcggctaag cggctgtcta agctattcgt   21000atagggacaa tccgatatgt cgatggagtg aaagagcctg atgcactccg catacagctc   21060gataatcttt tcagggcttt gttcatcttc atactcttcc gagcaaagga cgccatcggc   21120ctcactcatg agcagattgc tccagccatc atgccgttca aagtgcagga cctttggaac   21180aggcagcttt ccttccagcc atagcatcat gtccttttcc cgttccacat cataggtggt   21240ccctttatac cggctgtccg tcatttttaa atataggttt tcattttctc ccaccagctt   21300atatacctta gcaggagaca ttccttccgt atcttttacg cagcggtatt tttcgatcag   21360ttttttcaat tccggtgata ttctcatttt agccatttat tatttccttc ctcttttcta   21420cagtatttaa agatacccca agaagctaat tataacaaga cgaactccaa ttcactgttc   21480cttgcattct aaaaccttaa ataccagaaa acagcttttt caaagttgtt ttcaaagttg   21540gcgtataaca tagtatcgac ggagccgatt ttgaaaccac aattatgggt gatgctgcca   21600acttactgat ttagtgtatg atggtgtttt tgaggtgctc cagtggcttc tgtgtctatc   21660agctgtccct cctgttcagc tactgacggg gtggtgcgta acggcaaaag caccgccgga   21720catcagcgct atctctgctc tcactgccgt aaaacatggc aactgcagtt cacttacacc   21780gcttctcaac ccggtacgca ccagaaaatc attgatatgg ccatgaatgg cgttggatgc   21840cgggcaacag cccgcattat gggcgttggc ctcaacacga ttttacgtca cttaaaaaac   21900tcaggccgca gtcggtaacc tcgcgcatac agccgggcag tgacgtcatc gtctgcgcgg   21960aaatggacga acagtggggc tatgtcgggg ctaaatcgcg ccagcgctgg ctgttttacg   22020cgtatgacag tctccggaag acggttgttg cgcacgtatt cggtgaacgc actatggcga   22080cgctggggcg tcttatgagc ctgctgtcac cctttgacgt ggtgatatgg atgacggatg   22140gctggccgct gtatgaatcc cgcctgaagg gaaagctgca cgtaatcagc aagcgatata   22200cgcagcgaat tgagcggcat aacctgaatc tgaggcagca cctggcacgg ctgggacgga   22260agtcgctgtc gttctcaaaa tcggtggagc tgcatgacaa agtcatcggg cattatctga   22320acataaaaca ctatcaataa gttggagtca ttacccaatt atgatagaat ttacaagcta   22380taaggttatt gtcctgggtt tcaagcatta gtccatgcaa gtttttatgc tttgcccatt   22440ctatagatat attgataagc gcgctgccta tgccttgccc cctgaaatcc ttacatacgg   22500cgatatcttc tatataaaag atatattatc ttatcagtat tgtcaatata ttcaaggcaa   22560tctgcctcct catcctcttc atcctcttcg tcttggtagc tttttaaata tggcgcttca   22620tagagtaatt ctgtaaaggt ccaattctcg ttttcatacc tcggtataat cttacctatc   22680acctcaaatg gttcgctggg tttatcgcac ccccgaacac gagcacggca cccgcgacca   22740ctatgccaag aatgcccaag gtaaaaattg ccggccccgc catgaagtcc gtgaatgccc   22800cgacggccga agtgaagggc aggccgccac ccaggccgcc gccctcactg cccggcacct   22860ggtcgctgaa tgtcgatgcc agcacctgcg gcacgtcaat gcttccgggc gtcgcgctcg   22920ggctgatcgc ccatcccgtt actgccccga tcccggcaat ggcaaggact gccagcgctg   22980ccatttttgg ggtgaggccg ttcgcggccg aggggcgcag cccctggggg gatgggaggc   23040ccgcgttagc gggccgggag ggttcgagaa gggggggcac cccccttcgg cgtgcgcggt   23100cacgcgcaca gggcgcagcc ctggttaaaa acaaggttta taaatattgg tttaaaagca   23160ggttaaaaga caggttagcg gtggccgaaa aacgggcgga aacccttgca aatgctggat   23220tttctgcctg tggacagccc ctcaaatgtc aataggtgcg cccctcatct gtcagcactc   23280tgcccctcaa gtgtcaagga tcgcgcccct catctgtcag tagtcgcgcc cctcaagtgt   23340caataccgca gggcacttat ccccaggctt gtccacatca tctgtgggaa actcgcgtaa   23400aatcaggcgt tttcgccgat ttgcgaggct ggccagctcc acgtcgccgg ccgaaatcga   23460gcctgcccct catctgtcaa cgccgcgccg ggtgagtcgg cccctcaagt gtcaacgtcc   23520gcccctcatc tgtcagtgag ggccaagttt tccgcgaggt atccacaacg ccggcggccg   23580cggtgtctcg cacacggctt cgacggcgtt tctggcgcgt ttgcagggcc atagacggcc   23640gccagcccag cggcgagggc aaccagcccg gtgagcgtcg caaaggcgct cggtcttgcc   23700ttgctcgtcg gtgatgtact tcaccagctc cgcgaagtcg ctcttcttga tggagcgcat   23760ggggacgtgc ttggcaatca cgcgcacccc ccggccgttt tagcggctaa aaaagtcatg   23820gctctgccct cgggcggacc acgcccatca tgaccttgcc aagctcgtcc tgcttctctt   23880cgatcttcgc cagcagggcg aggatcgtgg catcaccgaa ccgcgccgtg cgcgggtcgt   23940cggtgagcca gagtttcagc aggccgccca ggcggcccag gtcgccattg atgcgggcca   24000gctcgcggac gtgctcatag tccacgacgc ccgtgatttt gtagccctgg ccgacggcca   24060gcaggtaggc cgacaggctc atgccggccg ccgccgcctt ttcctcaatc gctcttcgtt   24120cgtctggaag gcagtacacc ttgataggtg ggctgccctt cctggttggc ttggtttcat   24180cagccatccg cttgccctca tctgttacgc cggcggtagc cggccagcct cgcagagcag   24240gattcccgtt gagcaccgcc aggtgcgaat aagggacagt gaagaaggaa cacccgctcg   24300cgggtgggcc tacttcacct atcctgcccg gctgacgccg ttggatacac caaggaaagt   24360ctacacgaac cctttggcaa aatcctgtat atcgtgcgaa aaaggatgga tataccgaaa   24420aaatcgctat aatgaccccg aagcagggtt atgcagcgga aaagcgccac gcttcccgaa   24480gggagaaagg cggacaggta tccggtaagc ggcagggtcg gaacaggaga gcgcacgagg   24540gagcttccag ggggaaacgc ctggtatctt tatagtcctg tcgggtttcg ccacctctga   24600cttgagcgtc gatttttgtg atgctcgtca ggggggcgga gcctatggaa aaacgccagc   24660aacgcggcct ttttacggtt cctggccttt tgctggcctt ttgctcacat gttctttcct   24720gcgttatccc ctgattctgt ggataaccgt attaccgcct ttgagtgagc tgataccgct   24780cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga agagcgccag   24840aaggccgcca gagaggccga gcgcggccgt gaggcttgga cgctagggca gggcatgaaa   24900aagcccgtag cgggctgcta cgggcgtctg acgcggtgga aagggggagg ggatgttgtc   24960tacatggctc tgctgtagtg agtgggttgc gctccggcag cggtcctgat caatcgtcac   25020cctttctcgg tccttcaacg ttcctgacaa cgagcctcct tttcgccaat ccatcgacaa   25080tcaccgcgag tccctgctcg aacgctgcgt ccggaccggc ttcgtcgaag gcgtctatcg   25140cggcccgcaa cagcggcgag agcggagcct gttcaacggt gccgccgcgc tcgccggcat   25200cgctgtcgcc ggcctgctcc tcaagcacgg ccccaacagt gaagtagctg attgccatca   25260gcgcattgac ggcgtccccg gccgaaaaac ccgcctcgca gaggaagcga agctgcgcgt   25320cggccgtttc catctgcggt gcgcccggtc gcgtgccggc atggatgcgc gcgccatcgc   25380ggtaggcgag cagcgcctgc ctgaagctgc gggcattccc gatcagaaat gagcgccagt   25440cgtcgtcggc tctcggcacc gaatgcgtat gattctccgc cagcatggct tcggccagtg   25500cgtcgagcag cgcccgcttg ttcctgaagt gccagtaaag cgccggctgc tgaaccccca   25560accgttccgc cagtttgcgt gtcgtcagac cgtctacgcc gacctcgttc aacaggtcca   25620gggcggcacg gatcactgta ttcggctgca actttgtcat gcttgacact ttatcactga   25680taaacataat atgtccacca acttatcagt gataaagaat ccgcgcgttc aatcggacca   25740gcggaggctg gtccggaggc cagacgtgaa acccaacata cccctgatcg taattctgag   25800cactgtcgcg ctcgacgctg tcggcatcgg cctgattatg ccggtgctgc cgggcctcct   25860gcgcgatctg gttcactcga acgacgtcac cgcccactat ggcattctgc tggcgctgta   25920tgcgttggtg caatttgcct gcgcacctgt gctgggcgcg ctgtcggatc gtttcgggcg   25980gcggccaatc ttgctcgtct cgctggccgg cgccagatc                          26019<210>35<2ll>20119<212>DNA<213>合成<220><22l>启动子<222>(229)..(1960)<220><22l>exon<222>(1962)..(2160)<220><221>misc_feature<222>(2160)..(2228)<223>plastid targeting domain<220><221>基大<222>(2260)..(3960)<223>prnC<220><221>终止子<222>(3966)..(4241)<220><22l>启动子<222>(4245)..(5971)<220><221>exon<222>(5984)..(6182)<220><221>misc_feature<222>(6183)..(6251)<223>plastid targeting domain<220><221>基因<222>(6282)..(7373)<223>prnD<220><22l>终止子<222>(7379)..(7639)<220><22l>启动子<222>(7739)..(8739)<220><221>exon<222>(8745)..(8943)<220><221>misc_feature<222>(8944)..(9012)<223>plastid targeting domain<220><221>基因<222>(9037)..(9743)<223>fre<220><221>终止子<222>(9755)..(10036)<220><221>启动子<222>(10049)..(11385)<220><22l>内含子<222>(11383)..(11779)<220><221>基因<222>(11796)..(12338)<220><221>终子<222>(12345)..(12626)<400>35tggggaaccc tgtggttggc atgcacatac aaatggacga acggataaac cttttcacgc       60ccttttaaat atccgattat tctaataaac gctcttttct cttaggttta cccgccaata      120tatcctgtca aacactgata gtttaaactg aaggcgggaa acgacaatct gatctatcgt      180tctagtcgta cgttttgcga tcgcactaga gcggccgcct cgaggtaccg gatttggagc      240caagtctcat aaacgccatt gtggaagaaa gtcttgagtt ggtggtaatg taacagagta      300gtaagaacag agaagagaga gagtgtgaga tacatgaatt gtcgggcaac aaaaatcctg      360aacatcttat tttagcaaag agaaagagtt ccgagtctgt agcagaagag tgaggagaaa      420tttaagctct tggacttgtg aattgttccg cctcttgaat acttcttcaa tcctcatata      480ttcttcttct atgttacctg aaaaccggca tttaatctcg cgggtttatt ccggttcaac      540attttttttg ttttgagtta ttatctgggc ttaataacgc aggcctgaaa taaattcaag      600gcccaactgt tttttttttt aagaagttgc tgttaaaaaa aaaaaaaggg aattaacaac      660aacaacaaaa aaagataaag aaaataataa caattacttt aattgtagac taaaaaaaca      720tagattttat catgaaaaaa agagaaaaga aataaaaact tggatcaaaa aaaaaaacat      780acagatcttc taattattaa cttttcttaa aaattaggtc ctttttccca acaattaggt      840ttagagtttt ggaattaaac caaaaagatt gttctaaaaa atactcaaat ttggtagata      900agtttcctta ttttaattag tcaatggtag atactttttt ttcttttctt tattagagta      960gattagaatc ttttatgcca agttttgata aattaaatca agaagataaa ctatcataat    1020caacatgaaa ttaaaagaaa aatctcatat atagtattag tattctctat atatattatg    1080attgcttatt cttaatgggt tgggttaacc aagacatagt cttaatggaa agaatctttt    1140ttgaactttt tccttattga ttaaattctt ctatagaaaa gaaagaaatt atttgaggaa    1200aagtatatac aaaaagaaaa atagaaaaat gtcagtgaag cagatgtaat ggatgaccta    1260atccaaccac caccatagga tgtttctact tgagtcggtc ttttaaaaac gcacggtgga    1320aaatatgaca cgtatcatat gattccttcc tttagtttcg tgataataat cctcaactga    1380tatcttcctt tttttgtttt ggctaaagat attttattct cattaataga aaagacggtt    1440ttgggctttt ggtttgcgat ataaagaaga ccttcgtgtg gaagataata attcatcctt    1500tcgtcttttt ctgactcttc aatctctccc aaagcctaaa gcgatctctg caaatctctc    1560gcgactctct ctttcaaggt atattttctg attctttttg tttttgattc gtatctgatc    1620tccaattttt gttatgtgga ttattgaatc ttttgtataa attgcttttg acaatattgt    1680tcgtttcgtc aatccagctt ctaaattttg tcctgattac taagatatcg attcgtagtg    1740tttacatctg tgtaatttct tgcttgattg tgaaattagg attttcaagg acgatctatt    1800caatttttgt gttttctttg ttcgattctc tctgttttag gtttcttatg tttagatccg    1860tttctctttg gtgttgtttt gatttctctt acggcttttg atttggtata tgttcgctga    1920ttggtttcta cttgttctat tgttttattt caggtggatc a gtc aca caa aga gta    1976
                                          Val Thr Gln Arg Val
                                          1               5aag aag aac aat ggc ttc ctc tat gct ctc ttc cgc tac tat ggt tgc      2024Lys Lys Asn Asn Gly Phe Leu Tyr Ala Leu Phe Arg Tyr Tyr Gly Cys
            10                  15                  20ctc tcc ggc tca ggc cac tat ggt cgc tcc ttt caa cgg act taa gtc      2072Leu Ser Gly Ser Gly His Tyr Gly Arg Ser Phe Gln Arg Thr     Val
        25                  30                  35ctc cgc tgc ctt ccc agc cac ccg caa ggc taa caa cga cat tac ttc      2120Leu Arg Cys Leu Pro Ser His Pro Gln Gly     Gln Arg His Tyr Phe
        40                  45                  50cat cac aag caa cgg cgg aag agt taa ctg cat gca ggt g tggcctccga     2170His His Lys Gln Arg Arg Lys Ser     Leu His Ala Gly
        55                      60ttggaaagaa gaagtttgag actctctctt accttcctga ccttaccgat tctgcaggag    2230gtcgcgtcaa ctgcatgcag gctagcatga ctcagaagag ccccgcgaac gaacacgata    2290gcaatcactt cgacgtaatc atcctcggct cgggcatgtc cggcacccag atgggggcca    2350tcttggccaa acaacagttt cgcgtgctga tcatcgagga gtcgtcgcac ccgcggttca    2410cgatcggcga atcgtcgatc cccgagacgt ctcttatgaa ccgcatcatc gctgatcgct    2470acggcattcc ggagctcgac cacatcacgt cgttttattc gacgcaacgt tacgtcgcgt    2530cgagcacggg cattaagcgc aacttcggct tcgtgttcca caagcccggc caggagcacg    2590acccgaagga gttcacccag tgcgtcattc ccgagctgcc gtgggggccg gagagccatt    2650attaccggca agacgtcgac gcctacttgt tgcaagccgc cattaaatac ggctgcaagg    2710tccaccagaa aactaccgtg accgaatacc acaccgataa agacggcgtc gcggtgacca    2770ccgcccaggg cgaacggttc accggccggt acatgatcga ctgcggagga cctcgcgcgc    2830cgctcgcgac caagttcagg ctccgcgaag aaccgtgtcg cttcaagacg cactcgcgca    2890gcctctacac gcacatgctc ggggtcaagc cgttcgacga catcttcaag gtcaaggggc    2950agcgctggcg ctggcacgag gggaccttgc accacatgtt cgagggcggc tggctctggg    3010tgattccgtt caacaaccac ccgcggtcga ccaacaacct ggtgagcgtc ggcctgcagc    3070tcgacccgcg tgtctacccg aaaaccgaca tctccgcaca gcaggaattc gatgagttcc    3130tcgcgcggtt cccgagcatc ggggctcagt tccgggacgc cgtgccggtg cgcgactggg    3190tcaagaccga ccgcctgcaa ttctcgtcga acgcctgcgt cggcgaccgc tactgcctga    3250tgctgcacgc gaacggcttc atcgacccgc tcttctcccg ggggctggaa aacaccgcgg    3310tgaccatcca cgcgctcgcg gcgcgcctca tcaaggcgct gcgcgacgac gacttctccc    3370ccgagcgctt cgagtacatc gagcgcctgc agcaaaagct tttggaccac aacgacgact    3430tcgtcagctg ctgctacacg gcgttctcgg acttccgcct atgggacgcg ttccacaggc    3490tgtgggcggt cggcaccatc ctcgggcagt tccggctcgt gcaggcccac gcgaggttcc    3550gcgcgtcgcg caacgagggc gacctcgatc acctcgacaa cgaccctccg tatctcggat    3610acctgtgcgc ggacatggag gagtactacc agttgttcaa cgacgccaaa gccgaggtcg    3670aggccgtgag tgccgggcgc aagccggccg atgaggccgc ggcgcggatt cacgccctca    3730ttgacgaacg agacttcgcc aagccgatgt tcggcttcgg gtactgcatc accggggaca    3790agccgcagct caacaactcg aagtacagcc tgctgccggc gatgcggctg atgtactgga    3850cgcaaacccg cgcgccggca gaggtgaaaa agtacttcga ctacaacccg atgttcgcgc    3910tgctcaaggc gtacatcacg acccgcatcg gcctggcgct gaagaagtag ggatcccccg    3970aatttccccg atcgttcaaa catttggcaa taaagtttct taagattgaa tcctgttgcc    4030ggtcttgcga tgattatcat ctaatttctg ttgaattacg ttaagcatgt aataattaac    4090atgtaatgca tgacgttatt tatgagatgg gtttttatga ttagagtccc gcaattatac    4150atttaatacg cgatagaaaa caaaatatag cgcgcaaact aggataaatt atcgcgcgcg    4210gtgtcatcta tgttactaga tccgggaatt ccgctcgagg taccggattt ggagccaagt    4270ctcataaacg ccattgtgga agaaagtctt gagttggtgg taatgtaaca gagtagtaag    4330aacagagaag agagagagtg tgagatacat gaattgtcgg gcaacaaaaa tcctgaacat    4390cttattttag caaagagaaa gagttccgag tctgtagcag aagagtgagg agaaatttaa    4450gctcttggac ttgtgaattg ttccgcctct tgaatacttc ttcaatcctc atatattctt    4510cttctatgtt acctgaaaac cggcatttaa tctcgcgggt ttattccggt tcaacatttt    4570ttttgttttg agttattatc tgggcttaat aacgcaggcc tgaaataaat tcaaggccca    4630actgtttttt tttttaagaa gttgctgtta aaaaaaaaaa aagggaatta acaacaacaa    4690caaaaaaaga taaagaaaat aataacaatt actttaattg tagactaaaa aaacatagat    4750tttatcatga aaaaaagaga aaagaaataa aaacttggat caaaaaaaaa aacatacaga    4810tcttctaatt attaactttt cttaaaaatt aggtcctttt tcccaacaat taggtttaga    4870gttttggaat taaaccaaaa agattgttct aaaaaatact caaatttggt agataagttt    4930ccttatttta attagtcaat ggtagatact tttttttctt ttctttatta gagtagatta    4990gaatctttta tgccaagttt tgataaatta aatcaagaag ataaactatc ataatcaaca    5050tgaaattaaa agaaaaatct catatatagt attagtattc tctatatata ttatgattgc    5110ttattcttaa tgggttgggt taaccaagac atagtcttaa tggaaagaat cttttttgaa    5170ctttttcctt attgattaaa ttcttctata gaaaagaaag aaattatttg aggaaaagta    5230tatacaaaaa gaaaaataga aaaatgtcag tgaagcagat gtaatggatg acctaatcca    5290accaccacca taggatgttt ctacttgagt cggtctttta aaaacgcacg gtggaaaata    5350tgacacgtat catatgattc cttcctttag tttcgtgata ataatcctca actgatatct    5410tccttttttt gttttggcta aagatatttt attctcatta atagaaaaga cggttttggg    5470cttttggttt gcgatataaa gaagaccttc gtgtggaaga taataattca tcctttcgtc    5530tttttctgac tcttcaatct ctcccaaagc ctaaagcgat ctctgcaaat ctctcgcgac    5590tctctctttc aaggtatatt ttctgattct ttttgttttt gattcgtatc tgatctccaa    5650tttttgttat gtggattatt gaatcttttg tataaattgc ttttgacaat attgttcgtt    5710tcgtcaatcc agcttctaaa ttttgtcctg attactaaga tatcgattcg tagtgtttac    5770atctgtgtaa tttcttgctt gattgtgaaa ttaggatttt caaggacgat ctattcaatt    5830tttgtgtttt ctttgttcga ttctctctgt tttaggtttc ttatgtttag atccgtttct    5890ctttggtgtt gttttgattt ctcttacggc ttttgatttg gtatatgttc gctgattggt    5950ttctacttgt tctattgttt tatttcaggt gga tca gtc aca caa aga gta aag     6004
                                 Ser Val Thr Gln Arg Val Lys
                                     65                  70aag aac aat ggc ttc ctc tat gct ctc ttc cgc tac tat ggt tgc ctc       6052Lys Asn Asn Gly Phe Leu Tyr Ala Leu Phe Arg Tyr Tyr Gly Cys Leu
            75                  80                  85tcc ggc tca ggc cac tat ggt cgc tcc ttt caa cgg act taa gtc ctc       6100Ser Gly Ser Gly His Tyr Gly Arg Ser Phe Gln Arg Thr     Val Leu
        90                  95                      100cgc tgc ctt ccc agc cac ccg caa ggc taa caa cga cat tac ttc cat       6148Arg Cys Leu Pro Ser His Pro Gln Gly     Gln Arg His Tyr Phe His
        105                 110                     115cac aag caa cgg cgg aag agt taa ctg cat gca g gtgtggcctc              6192His Lys Gln Arg Arg Lys Ser     Leu His Ala
        120                     125cgattggaaa gaagaagttt gagactctct cttaccttcc tgaccttacc gattctgcag     6252gaggtcgcgt caactgcatg caggctagca tgaacgacat tcaattggat caagcgagcg     6312tcaagaagcg tccctcgggc gcgtacgacg caaccacgcg cctggccgcg agctggtacg     6372tcgcgatgcg ctccaacgag ctcaaggaca agccgaccga gttgacgctc ttcggccgtc     6432cgtgcgtggc gtggcgcgga gccacggggc gggccgtggt gatggaccgc cactgctcgc     6492acctgggcgc gaacctggct gacgggcgga tcaaggacgg gtgcatccag tgcccgtttc     6552accactggcg gtacgacgaa cagggccagt gcgttcacat ccccggccat aaccaggcgg     6612tgcgccagct ggagccggtg ccgcgcgggg cgcgtcagcc gacgttggtc accgccgagc     6672gatacggcta cgtgtgggtc tggtacggct ccccgctgcc gctgcacccg ctgcccgaaa     6732tctccgcggc cgatgtcgac aacggcgact ttatgcacct gcacttcgcg ttcgagacga     6792ccacggcggt cttgcggatc gtcgagaact tctacgacgc gcagcacgca accccggtgc     6852acgcactccc gatctcggcc ttcgaactca agctcttcga cgattggcgc cagtggccgg     6912aggttgagtc gctggccctg gcgggcgcgt ggttcggtgc cgggatcgac ttcaccgtgg     6972accggtactt cggccccctc agcatgctgt cacgcgcgct cggcctgaac atgtcgcaga     7032tgaacctgca cttcgatggc taccccggcg ggtgcgtcat gaccgtcgcc ctggacggag     7092acgtcaaata caagctgctc cagtgtgtga cgccggtgag cgaaggcaag aacgtcatgc     7152acatgctcat ctcgatcaag aaggtgggcg gcatcctgcg ccgcgcgacc gacttcgtgc     7212tgttcgggct gcagaccagg caggccgcgg ggtacgacgt caaaatctgg aacggaatga     7272agccggacgg cggcggcgcg tacagcaagt acgacaagct cgtgctcaag taccgggcgt     7332tctatcgagg ctgggtcgac cgcgtcgcaa gtgagcggtg aggatccccc gaatttcccc     7392gatcgttcaa acatttggca ataaagtttc ttaagattga atcctgttgc cggtcttgcg     7452atgattatca tctaatttct gttgaattac gttaagcatg taataattaa catgtaatgc    7512atgacgttat ttatgagatg ggtttttatg attagagtcc cgcaattata catttaatac    7572gcgatagaaa acaaaatata gcgcgcaaac taggataaat tatcgcgcgc ggtgtcatct    7632atgttactag atccgggaat tccggaccgc tgctctagtg agaccgatcg cttttttaat    7692taattttaag ctttctagag gccggccgcg gccgcctcga ggtaccatca ggatattctt    7752gcttaagatg ttgaactcta tggaggtttg tatgaactga tgatctagga ccggataagt    7812tcccttcttc atagcgaact tattcaaaga atgttttgtg tatcattctt gttacattgt    7872tattaatgaa aaaatattat tggtcattgg actgaacacg agtgttaaat atggaccagg    7932ccccaaataa gatccattga tatatgaatt aaataacaag aataaatcga gtcaccaaac    7992cacttgcctt ttttaacgag acttgttcac caacttgata caaaagtcat tatcctatgc    8052aaatcaataa tcatacaaaa atatccaata acactaaaaa attaaaagaa atggataatt    8112tcacaatatg ttatacgata aagaagttac ttttccaaga aattcactga ttttataagc    8172ccacttgcat tagataaatg gcaaaaaaaa acaaaaagga aaagaaataa agcacgaaga    8232attctagaaa atacgaaata cgcttcaatg cagtgggacc cacggttcaa ttattgccaa    8292ttttcagctc caccgtatat ttaaaaaata aaacgataat gctaaaaaaa tataaatcgt    8352aacgatcgtt aaatctcaac ggctggatct tatgacgacc gttagaaatt gtggttgtcg    8412acgagtcagt aataaacggc gtcaaagtgg ttgcagccgg cacacacgag tcgtgtttat    8472caactcaaag cacaaatact tttcctcaac ctaaaaataa ggcaattagc caaaaacaac    8532tttgcgtgta aacaacgctc aatacacgtg tcattttatt attagctatt gcttcaccgc    8592cttagctttc tcgtgaccta gtcgtcctcg tcttttcttc cttcttcttc tataaaacaa    8652tacccaaaga gctcttcttc ttcacaattc agatttcaat ttctcaaaat cttaaaaact    8712ttctctcaat tctctctacc gtgatcggat ca gtc aca caa aga gta aag aag      8765
                                Val Thr Gln Arg Val Lys Lys
                                            130aac aat ggc ttc ctc tat gct ctc ttc cgc tac tat ggt tgc ctc tcc      8813Asn Asn Gly Phe Leu Tyr Ala Leu Phe Arg Tyr Tyr Gly Cys Leu Ser
135                 140                 145ggc tca ggc cac tat ggt cgc tcc ttt caa cgg act taa gtc ctc cgc      8861Gly Ser Gly His Tyr Gly Arg Ser Phe Gln Arg Thr     Val Leu Arg150                 155                 160tgc ctt ccc agc cac ccg caa ggc taa caa cga cat tac ttc cat cac      8909Cys Leu Pro Ser His Pro Gln Gly     Gln Arg His Tyr Phe His His165                 170                     175aag caa cgg cgg aag agt taa ctg cat gca ggt g tggcctccga             8953Lys Gln Arg Arg Lys Ser       Leu His Ala Gly180                 185ttggaaagaa gaagtttgag actctctctt accttcctga ccttaccgat tctgcaggag    9013gtcgcgtcaa ctgcatgcag gctagcacat gacaacctta agctgtaaag tgacctcggt    9073agaagctatc acggataccg tatatcgtgt ccgcatcgtg ccagacgcgg ccttttcttt    9133tcgtgctggt cagtatttga tggtagtgat ggatgagcgc gacaaacgtc cgttctcaat    9193ggcttcgacg ccggatgaaa aagggtttat cgagctgcat attggcgctt ctgaaatcaa    9253cctttacgcg aaagcagtca tggaccgcat cctcaaagat catcaaatcg tggtcgacat    9313tccccacgga gaagcgtggc tgcgcgatga tgaagagcgt ccgatgattt tgattgcggg    9373cggcaccggg ttctcttatg cccgctcgat tttgctgaca gcgttggcgc gtaacccaaa    9433ccgtgatatc accatttact ggggcgggcg tgaagagcag catctgtatg atctctgcga    9493gcttgaggcg ctttcgttga agcatcctgg tctgcaagtg gtgccggtgg ttgaacaacc    9553ggaagcgggc tggcgtgggc gtactggcac cgtgttaacg gcggtattgc aggatcacgg    9613tacgctggca gagcatgata tctatattgc cggacgtttt gagatggcga aaattgcccg    9673cgatctgttt tgcagtgagc gtaatgcgcg ggaagatcgc ctgtttggcg atgcgtttgc    9733atttatctga gctagcggat cccccgaatt tccccgatcg ttcaaacatt tggcaataaa    9793gtttcttaag attgaatcct gttgccggtc ttgcgatgat tatcatctaa tttctgttga    9853attacgttaa gcatgtaata attaacatgt aatgcatgac gttatttatg agatgggttt    9913ttatgattag agtcccgcaa ttatacattt aatacgcgat agaaaacaaa atatagcgcg    9973caaactagga taaattatcg cgcgcggtgt catctatgtt actagatccg ggaattagcg   10033gccgcctcga ggtaccggat ttggagccaa gtctcataaa cgccattgtg gaagaaagtc   10093ttgagttggt ggtaatgtaa cagagtagta agaacagaga agagagagag tgtgagatac   10153atgaattgtc gggcaacaaa aatcctgaac atcttatttt agcaaagaga aagagttccg   10213agtctgtagc agaagagtga ggagaaattt aagctcttgg acttgtgaat tgttccgcct   10273cttgaatact tcttcaatcc tcatatattc ttcttctatg ttacctgaaa accggcattt   10333aatctcgcgg gtttattccg gttcaacatt ttttttgttt tgagttatta tctgggctta   10393ataacgcagg cctgaaataa attcaaggcc caactgtttt tttttttaag aagttgctgt   10453taaaaaaaaa aaaagggaat taacaacaac aacaaaaaaa gataaagaaa ataataacaa   10513ttactttaat tgtagactaa aaaaacatag attttatcat gaaaaaaaga gaaaagaaat   10573aaaaacttgg atcaaaaaaa aaaacataca gatcttctaa ttattaactt ttcttaaaaa   10633ttaggtcctt tttcccaaca attaggttta gagttttgga attaaaccaa aaagattgtt   10693ctaaaaaata ctcaaatttg gtagataagt ttccttattt taattagtca atggtagata   10753cttttttttc ttttctttat tagagtagat tagaatcttt tatgccaagt tttgataaat   10813taaatcaaga agataaacta tcataatcaa catgaaatta aaagaaaaat ctcatatata   10873gtattagtat tctctatata tattatgatt gcttattctt aatgggttgg gttaaccaag   10933acatagtctt aatggaaaga atcttttttg aactttttcc ttattgatta aattcttcta   10993tagaaaagaa agaaattatt tgaggaaaag tatatacaaa aagaaaaata gaaaaatgtc   11053agtgaagcag atgtaatgga tgacctaatc caaccaccac cataggatgt ttctacttga   11113gtcggtcttt taaaaacgca cggtggaaaa tatgacacgt atcatatgat tccttccttt   11173agtttcgtga taataatcct caactgatat cttccttttt ttgttttggc taaagatatt   11233ttattctcat taatagaaaa gacggttttg ggcttttggt ttgcgatata aagaagacct   11293tcgtgtggaa gataataatt catcctttcg tctttttctg actcttcaat ctctcccaaa   11353gcctaaagcg atctctgcaa atctctcgcg actctctctt tcaaggtata ttttctgatt   11413ctttttgttt ttgattcgta tctgatctcc aatttttgtt atgtggatta ttgaatcttt   11473tgtataaatt gcttttgaca atattgttcg tttcgtcaat ccagcttcta aattttgtcc   11533tgattactaa gatatcgatt cgtagtgttt acatctgtgt aatttcttgc ttgattgtga   11593aattaggatt ttcaaggacg atctattcaa tttttgtgtt ttctttgttc gattctctct   11653gttttaggtt tcttatgttt agatccgttt ctctttggtg ttgttttgat ttctcttacg   11713gcttttgatt tggtatatgt tcgctgattg gtttctactt gttctattgt tttatttcag   11773gtggatctgt tggggatcta ccatgagccc agaacgacgc ccggccgaca tccgccgtgc   11833caccgaggcg gacatgccgg cggtctgcac catcgtcaac cactacatcg agacaagcac   11893ggtcaacttc cgtaccgagc cgcaggaacc gcaggagtgg acggacgacc tcgtccgtct   11953gcgggagcgc tatccctggc tcgtcgccga ggtggacggc gaggtcgccg gcatcgccta   12013cgcgggcccc tggaaggcac gcaacgccta cgactggacg gccgagtcga ccgtgtacgt   12073ctccccccgc caccagcgga cgggactggg ctccacgctc tacacccacc tgctgaagtc   12133cctggaggca cagggcttca agagcgtggt cgctgtcatc gggctgccca acgacccgag   12193cgtgcgcatg cacgaggcgc tcggatatgc cccccgcggc atgctgcggg cggccggctt   12253caagcacggg aactggcatg acgtgggttt ctggcagctg gacttcagcc tgccggtacc   12313gccccgtccg gtcctgcccg tcaccgagat cccccgaatt tccccgatcg ttcaaacatt   12373tggcaataaa gtttcttaag attgaatcct gttgccggtc ttgcgatgat tatcatctaa   12433tttctgttga attacgttaa gcatgtaata attaacatgt aatgcatgac gttatttatg   12493agatgggttt ttatgattag agtcccgcaa ttatacattt aatacgcgat agaaaacaaa   12553atatagcgcg caaactagga taaattatcg cgcgcggtgt catctatgtt actagatccg   12613ggaattgggt acccaattcc ggaccgctgc tctagaggcg cgcccctagg gagcttctgc   12673agacgcgtcg acgtcatatg gatccgatct gttgcccgtc tcactggtga aaagaaaaac   12733caccccagta cattaaaaac gtccgcaatg tgttattaag ttgtctaagc gtcaatttgt   12793ttacaccaca atatatcctg ccaccagcca gccaacagct ccccgaccgg cagctcggca   12853caaaatcacc actcgataca ggcagcccat cagtccggga cggtcgacct gcaggcatgc   12913aagctcacgt agtgtacgta atcgatttcg aagggcccac tagtccatgg gctttttctc   12973ctcgtgctcg taaacggacc cgaacatctc tggagctttc ttcagggccg acaatcggat   13033ctcgcggaaa tcctgcacgt cggccgctcc aagccgtcga atctgagcct taatcacaat   13093tgtcaatttt aatcctctgt ttatcggcag ttcgtagagc gcgccgtgcg tcccgagcga   13153tactgagcga agcaagtgcg tcgagcagtg cccgcttgtt cctgaaatgc cagtaaagcg   13213ctggctgctg aacccccagc cggaactgac cccacaaggc cctagcgttt gcaatgcacc   13273aggtcatcat tgacccaggc gtgttccacc aggccgctgc ctcgcaactc ttcgcaggct   13333tcgccgacct gctcgcgcca cttcttcacg cgggtggaat ccgatccgca catgaggcgg   13393aaggtttcca gcttgagcgg gtacggctcc cggtgcgagc tgaaatagtc gaacatccgt   13453cgggccgtcg gcgacagctt gcggtacttc tcccatatga atttcgtgta gtggtcgcca   13513gcaaacagca cgacgatttc ctcgtcgatc aggacctggc aacgggacgt tttcttgcca   13573cggtccagga cgcggaagcg gtgcagcagc gacaccgatt ccaggtgccc aacgcggtcg   13633gacgtgaagc ccatcgccgt cgcctgtagg cgcgacaggc attcctcggc cttcgtgtaa   13693taccggccat tgatcgacca gcccaggtcc tggcaaagct cgtagaacgt gaaggtgatc   13753ggctcgccga taggggtgcg cttcgcgtac tccaacacct gctgccacac cagttcgtca   13813tcgtcggccc gcagctcgac gccggtgtag gtgatcttca cgtccttgtt gacgtggaaa   13873atgaccttgt tttgcagcgc ctcgcgcggg attttcttgt tgcgcgtggt gaacagggca   13933gagcgggccg tgtcgtttgg catcgctcgc atcgtgtccg gccacggcgc aatatcgaac   13993aaggaaagct gcatttcctt gatctgctgc ttcgtgtgtt tcagcaacgc ggcctgcttg   14053gcctcgctga cctgttttgc caggtcctcg ccggcggttt ttcgcttctt ggtcgtcata   14113gttcctcgcg tgtcgatggt catcgacttc gccaaacctg ccgcctcctg ttcgagacga   14173cgcgaacgct ccacggcggc cgatggcgcg ggcagggcag ggggagccag ttgcacgctg   14233tcgcgctcga tcttggccgt agcttgctgg accatcgagc cgacggactg gaaggtttcg   14293cggggcgcac gcatgacggt gcggcttgcg atggtttcgg catcctcggc ggaaaacccc   14353gcgtcgatca gttcttgcct gtatgccttc cggtcaaacg tccgattcat tcaccctcct   14413tgcgggattg ccccgactca cgccggggca atgtgccctt attcctgatt tgacccgcct   14473ggtgccttgg tgtccagata atccacctta tcggcaatga agtcggtccc gtagaccgtc   14533tggccgtcct tctcgtactt ggtattccga atcttgccct gcacgaatac cagcgacccc   14593ttgcccaaat acttgccgtg ggcctcggcc tgagagccaa aacacttgat gcggaagaag   14653tcggtgcgct cctgcttgtc gccggcatcg ttgcgccaca tctaggtact aaaacaattc   14713atccagtaaa atataatatt ttattttctc ccaatcaggc ttgatcccca gtaagtcaaa   14773aaatagctcg acatactgtt cttccccgat atcctccctg atcgaccgga cgcagaaggc   14833aatgtcatac cacttgtccg ccctgccgct tctcccaaga tcaataaagc cacttacttt   14893gccatctttc acaaagatgt tgctgtctcc caggtcgccg tgggaaaaga caagttcctc   14953ttcgggcttt tccgtcttta aaaaatcata cagctcgcgc ggatctttaa atggagtgtc   15013ttcttcccag ttttcgcaat ccacatcggc cagatcgtta ttcagtaagt aatccaattc   15073ggctaagcgg ctgtctaagc tattcgtata gggacaatcc gatatgtcga tggagtgaaa   15133gagcctgatg cactccgcat acagctcgat aatcttttca gggctttgtt catcttcata   15193ctcttccgag caaaggacgc catcggcctc actcatgagc agattgctcc agccatcatg   15253ccgttcaaag tgcaggacct ttggaacagg cagctttcct tccagccata gcatcatgtc   15313cttttcccgt tccacatcat aggtggtccc tttataccgg ctgtccgtca tttttaaata   15373taggttttca ttttctccca ccagcttata taccttagca ggagacattc cttccgtatc   15433ttttacgcag cggtattttt cgatcagttt tttcaattcc ggtgatattc tcattttagc   15493catttattat ttccttcctc ttttctacag tatttaaaga taccccaaga agctaattat   15553aacaagacga actccaattc actgttcctt gcattctaaa accttaaata ccagaaaaca   15613gctttttcaa agttgttttc aaagttggcg tataacatag tatcgacgga gccgattttg   15673aaaccacaat tatgggtgat gctgccaact tactgattta gtgtatgatg gtgtttttga   15733ggtgctccag tggcttctgt gtctatcagc tgtccctcct gttcagctac tgacggggtg   15793gtgcgtaacg gcaaaagcac cgccggacat cagcgctatc tctgctctca ctgccgtaaa   15853acatggcaac tgcagttcac ttacaccgct tctcaacccg gtacgcacca gaaaatcatt   15913gatatggcca tgaatggcgt tggatgccgg gcaacagccc gcattatggg cgttggcctc   15973aacacgattt tacgtcactt aaaaaactca ggccgcagtc ggtaacctcg cgcatacagc   16033cgggcagtga cgtcatcgtc tgcgcggaaa tggacgaaca gtggggctat gtcggggcta   16093aatcgcgcca gcgctggctg ttttacgcgt atgacagtct ccggaagacg gttgttgcgc   16153acgtattcgg tgaacgcact atggcgacgc tggggcgtct tatgagcctg ctgtcaccct   16213ttgacgtggt gatatggatg acggatggct ggccgctgta tgaatcccgc ctgaagggaa   16273agctgcacgt aatcagcaag cgatatacgc agcgaattga gcggcataac ctgaatctga   16333ggcagcacct ggcacggctg ggacggaagt cgctgtcgtt ctcaaaatcg gtggagctgc   16393atgacaaagt catcgggcat tatctgaaca taaaacacta tcaataagtt ggagtcatta   16453cccaattatg atagaattta caagctataa ggttattgtc ctgggtttca agcattagtc   16513catgcaagtt tttatgcttt gcccattcta tagatatatt gataagcgcg ctgcctatgc   16573cttgccccct gaaatcctta catacggcga tatcttctat ataaaagata tattatctta   16633tcagtattgt caatatattc aaggcaatct gcctcctcat cctcttcatc ctcttcgtct   16693tggtagcttt ttaaatatgg cgcttcatag agtaattctg taaaggtcca attctcgttt   16753tcatacctcg gtataatctt acctatcacc tcaaatggtt cgctgggttt atcgcacccc   16813cgaacacgag cacggcaccc gcgaccacta tgccaagaat gcccaaggta aaaattgccg   16873gccccgccat gaagtccgtg aatgccccga cggccgaagt gaagggcagg ccgccaccca   16933ggccgccgcc ctcactgccc ggcacctggt cgctgaatgt cgatgccagc acctgcggca   16993cgtcaatgct tccgggcgtc gcgctcgggc tgatcgccca tcccgttact gccccgatcc   17053cggcaatggc aaggactgcc agcgctgcca tttttggggt gaggccgttc gcggccgagg   17113ggcgcagccc ctggggggat gggaggcccg cgttagcggg ccgggagggt tcgagaaggg   17173ggggcacccc ccttcggcgt gcgcggtcac gcgcacaggg cgcagccctg gttaaaaaca   17233aggtttataa atattggttt aaaagcaggt taaaagacag gttagcggtg gccgaaaaac   17293gggcggaaac ccttgcaaat gctggatttt ctgcctgtgg acagcccctc aaatgtcaat   17353aggtgcgccc ctcatctgtc agcactctgc ccctcaagtg tcaaggatcg cgcccctcat   17413ctgtcagtag tcgcgcccct caagtgtcaa taccgcaggg cacttatccc caggcttgtc   17473cacatcatct gtgggaaact cgcgtaaaat caggcgtttt cgccgatttg cgaggctggc   17533cagctccacg tcgccggccg aaatcgagcc tgcccctcat ctgtcaacgc cgcgccgggt   17593gagtcggccc ctcaagtgtc aacgtccgcc cctcatctgt cagtgagggc caagttttcc   17653gcgaggtatc cacaacgccg gcggccgcgg tgtctcgcac acggcttcga cggcgtttct   17713ggcgcgtttg cagggccata gacggccgcc agcccagcgg cgagggcaac cagcccggtg   17773agcgtcgcaa aggcgctcgg tcttgccttg ctcgtcggtg atgtacttca ccagctccgc   17833gaagtcgctc ttcttgatgg agcgcatggg gacgtgcttg gcaatcacgc gcaccccccg   17893gccgttttag cggctaaaaa agtcatggct ctgccctcgg gcggaccacg cccatcatga   17953ccttgccaag ctcgtcctgc ttctcttcga tcttcgccag cagggcgagg atcgtggcat   18013caccgaaccg cgccgtgcgc gggtcgtcgg tgagccagag tttcagcagg ccgcccaggc   18073ggcccaggtc gccattgatg cgggccagct cgcggacgtg ctcatagtcc acgacgcccg   18133tgattttgta gccctggccg acggccagca ggtaggccga caggctcatg ccggccgccg   18193ccgccttttc ctcaatcgct cttcgttcgt ctggaaggca gtacaccttg ataggtgggc   18253tgcccttcct ggttggcttg gtttcatcag ccatccgctt gccctcatct gttacgccgg   18313cggtagccgg ccagcctcgc agagcaggat tcccgttgag caccgccagg tgcgaataag   18373ggacagtgaa gaaggaacac ccgctcgcgg gtgggcctac ttcacctatc ctgcccggct   18433gacgccgttg gatacaccaa ggaaagtcta cacgaaccct ttggcaaaat cctgtatatc   18493gtgcgaaaaa ggatggatat accgaaaaaa tcgctataat gaccccgaag cagggttatg   18553cagcggaaaa gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc   18613agggtcggaa caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat   18673agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg   18733gggcggagcc tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc   18793tggccttttg ctcacatgtt ctttcctgcg ttatcccctg attctgtgga taaccgtatt   18853accgcctttg agtgagctga taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca   18913gtgagcgagg aagcggaaga gcgccagaag gccgccagag aggccgagcg cggccgtgag   18973gcttggacgc tagggcaggg catgaaaaag cccgtagcgg gctgctacgg gcgtctgacg   19033cggtggaaag ggggagggga tgttgtctac atggctctgc tgtagtgagt gggttgcgct   19093ccggcagcgg tcctgatcaa tcgtcaccct ttctcggtcc ttcaacgttc ctgacaacga   19153gcctcctttt cgccaatcca tcgacaatca ccgcgagtcc ctgctcgaac gctgcgtccg   19213gaccggcttc gtcgaaggcg tctatcgcgg cccgcaacag cggcgagagc ggagcctgtt   19273caacggtgcc gccgcgctcg ccggcatcgc tgtcgccggc ctgctcctca agcacggccc   19333caacagtgaa gtagctgatt gtcatcagcg cattgacggc gtccccggcc gaaaaacccg   19393cctcgcagag gaagcgaagc tgcgcgtcgg ccgtttccat ctgcggtgcg cccggtcgcg   19453tgccggcatg gatgcgcgcg ccatcgcggt aggcgagcag cgcctgcctg aagctgcggg   19513cattcccgat cagaaatgag cgccagtcgt cgtcggctct cggcaccgaa tgcgtatgat   19573tctccgccag catggcttcg gccagtgcgt cgagcagcgc ccgcttgttc ctgaagtgcc   19633agtaaagcgc cggctgctga acccccaacc gttccgccag tttgcgtgtc gtcagaccgt   19693ctacgccgac ctcgttcaac aggtccaggg cggcacggat cactgtattc ggctgcaact   19753ttgtcatgct tgacacttta tcactgataa acataatatg tccaccaact tatcagtgat   19813aaagaatccg cgcgttcaat cggaccagcg gaggctggtc cggaggccag acgtgaaacc   19873caacataccc ctgatcgtaa ttctgagcac tgtcgcgctc gacgctgtcg gcatcggcct   19933gattatgccg gtgctgccgg gcctcctgcg cgatctggtt cactcgaacg acgtcaccgc   19993ccactatggc attctgctgg cgctgtatgc gttggtgcaa tttgcctgcg cacctgtgct   20053gggcgcgctg tcggatcgtt tcgggcggcg gccaatcttg ctcgtctcgc tggccggcgc   20113cagatc                                                              20119

Claims (24)

1.以区域专一的方式将卤素转移至底物的方法,包括在存在氧化剂、卤素供体、电子转移酶、和还原剂时使底物接触区域专一性卤化酶,其中若转移发生于体内,则电子转移酶是由异源核酸分子编码的。
2.权利要求1的方法,还包含FAD或FMN成份。
3.权利要求2的方法,其中进一步的成份是FAD。
4.权利要求2的方法,其中电子转移酶是能够催化电子由NADH或NADPH或铁氧还蛋白转移至FAD的酶。
5.权利要求2的方法,其中电子转移酶是能够催化电子由NADH或NADPH或铁氧还蛋白转移至区域专一性卤化酶的酶。
6.权利要求2的方法,其中电子转移酶是黄素还原酶、铁氧还蛋白NADP还原酶、铁氧还蛋白、心肌黄酶巯基还原酶或NADH-cyt-B5还原酶、NADPH-FMN还原酶、NADPH-cyt-p450还原酶、或硝酸还原酶。
7.权利要求6的方法,其中电子转移酶包含与依照SEQ ID NO:19、21、23、25、27、29、或31的任一氨基酸序列具有至少30%同一性的氨基酸序列。
8.权利要求7的方法,其中电子转移酶包含SEQ ID NO:19、21、23、25、29、或31任一的氨基酸序列。
9.权利要求1的方法,其中区域专一性卤化酶是prnA、prnC、藤黄绿脓菌素卤化酶pltA、pltD、和pltM、四环素卤化酶cts4、水解酶a、或balhimycin卤化酶bhaA。
10.权利要求9的方法,其中区域专一性卤化酶包含SEQ ID NO:1。
11.权利要求1 0的方法,其中区域专一性卤化酶是包含依照SEQID NO:3、5、7、9、11、13、15、或17任一的氨基酸结构域的多肽。
12.表达与SEQ ID NO:18、10、22、24、26、28、或30中的任一种基本相似的一种异源核酸和与SEQ ID N0:2、4、6、8、10、12、14、或16中的任一种基本相似的至少一种异源核酸的宿主细胞。
13.权利要求12的宿主细胞,其中宿主细胞是细菌、真菌、或植物细胞。
14.权利要求13的宿主细胞,其中宿主细胞是微生物细胞。
15.权利要求13的宿主细胞,其中宿主细胞还表达编码prnB和prnD的核酸序列。
16.生成硝吡咯菌素的方法,包括培养权利要求15的宿主细胞。
17.保护植物免于病原体的危害的方法,包括用权利要求15的宿主细胞处理植物,由此宿主以抑制病原体的量生成硝吡咯菌素。
18.权利要求16的方法,还包括由宿主收集硝吡咯菌素。
19.包含权利要求14的宿主细胞的植物。
20.包含权利要求15的宿主细胞的植物。
21.保护植物免于病原体的危害的方法,包括培养权利要求20的植物,由此在植物中以抑制病原体的量生成硝吡咯菌素。
22.依照权利要求20的植物的种子。
23.预防农作物上的真菌生长的方法,包括培养权利要求21的植物,其中植物是农作物植物。
24.用于改进宿主的卤化底物生成的方法,包括在宿主中表达编码电子转移酶的异源核酸分子,其中宿主表达至少一种具有区域专一性卤化酶活性的内源多肽。
CN00817150A 1999-12-15 2000-12-07 用于卤化反应的组合物和方法 Pending CN1409759A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US22880199P 1999-12-15 1999-12-15
US60/228,801 1999-12-15
US21934300P 2000-01-03 2000-01-03
US60/219,343 2000-01-03

Publications (1)

Publication Number Publication Date
CN1409759A true CN1409759A (zh) 2003-04-09

Family

ID=26913801

Family Applications (1)

Application Number Title Priority Date Filing Date
CN00817150A Pending CN1409759A (zh) 1999-12-15 2000-12-07 用于卤化反应的组合物和方法

Country Status (12)

Country Link
EP (1) EP1238062A1 (zh)
JP (1) JP2003516749A (zh)
CN (1) CN1409759A (zh)
AR (1) AR026939A1 (zh)
AU (1) AU772124B2 (zh)
BR (1) BR0017024A (zh)
CA (1) CA2393910A1 (zh)
EA (1) EA004942B1 (zh)
HU (1) HUP0203807A3 (zh)
IL (1) IL150084A0 (zh)
MX (1) MXPA02005868A (zh)
WO (1) WO2001044447A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK1826267T3 (da) 2006-02-22 2012-07-23 Brain Biotechnology Res & Information Network Ag Ny halogenase
CN106190942B (zh) * 2016-07-26 2019-11-26 江南大学 一种通过敲除黄素还原酶提高l-精氨酸产量的方法
WO2023224560A1 (en) * 2022-05-20 2023-11-23 Agency For Science, Technology And Research Enzymes and uses in biocatalytic halogenation of n-heteroaryls thereof

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5639949A (en) * 1990-08-20 1997-06-17 Ciba-Geigy Corporation Genes for the synthesis of antipathogenic substances
DE19533072C1 (de) * 1995-09-07 1997-04-24 Fraunhofer Ges Forschung Nachweissystem und Verfahren für die qualitative und quantitative Bestimmung von Wasserstoffperoxid, Substraten, aus denen unter der Einwirkung von Oxidasen Wasserstoffperoxid gebildet wird, und Halogeniden
US5955348A (en) * 1997-11-25 1999-09-21 Novartis Ag Genetically modified pseudomonas strains with enhanced biocontrol activity

Also Published As

Publication number Publication date
AR026939A1 (es) 2003-03-05
JP2003516749A (ja) 2003-05-20
HUP0203807A3 (en) 2004-10-28
MXPA02005868A (es) 2002-10-23
EP1238062A1 (en) 2002-09-11
HUP0203807A2 (hu) 2003-02-28
EA004942B1 (ru) 2004-10-28
BR0017024A (pt) 2003-01-07
AU772124B2 (en) 2004-04-08
EA200200634A1 (ru) 2002-12-26
AU1707801A (en) 2001-06-25
CA2393910A1 (en) 2001-06-21
WO2001044447A1 (en) 2001-06-21
IL150084A0 (en) 2002-12-01

Similar Documents

Publication Publication Date Title
CN1305529A (zh) 利用微生物生产类异戊二烯化合物的方法和检测具有抗菌或除草活性的化合物的方法
CN1216583A (zh) 编码类黄酮途径酶的基因序列及其用途
CN1610749A (zh) 谷氨酸衍生物的制备方法
CN1656068A (zh) 多肽和生物合成途径
CN1198777A (zh) 有关谷氨酸脱氢酶α-和β-亚基的新多肽和多核苷酸及用法
CN1194003A (zh) 得自Curvularia verruculosa的卤过氧化物酶和编码该酶的核酸
CN1723281A (zh) 突变的d-氨基转移酶和使用它们生产旋光性谷氨酸衍生物的方法
CN1152941A (zh) 合成抗病原体物质的基因
CN1190992A (zh) 重组己糖氧化酶和其产生方法及用途
CN1373226A (zh) 通过大肠杆菌属细菌生产l-氨基酸的方法
CN1366550A (zh) (r)-2-辛醇脱氢酶,产生此酶的方法,编码此酶的dna,以及使用此酶生产醇类的方法
CN1415014A (zh) 通过基因扩增增加赖氨酸产量
CN1317049A (zh) 编码opcA基因的核苷酸序列
CN1341151A (zh) 除草剂的靶基因和方法
CN1688689A (zh) 醛脱氢酶基因
CN1452656A (zh) 脂肪氧合酶
CN1165859A (zh) 植物中海藻糖的增强累积
CN1484708A (zh) 由酵母生产抗坏血酸
CN1353758A (zh) 经扩增zwf基因发酵制备L-氨基酸的方法
CN1439054A (zh) 通过遗传改变莽草酸路径来改变生物体中精细化学品含量
CN1409759A (zh) 用于卤化反应的组合物和方法
CN1202933A (zh) 改进的靛蓝微生物生产方法
CN1427892A (zh) 毒力基因、蛋白及其用途
CN1293708A (zh) pH特性改变的卤过氧化物酶
CN1668639A (zh) 涉及二酮哌嗪衍生物合成的多核苷酸和由所述多核苷酸编码的多肽

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication