CN1409759A

CN1409759A - 用于卤化反应的组合物和方法

Info

Publication number: CN1409759A
Application number: CN00817150A
Authority: CN
Inventors: J·斯蒂芬斯; C·巴泰; J·M·迪茨; J·董; K·P·凯姆达; S·希尔
Original assignee: Syngenta Participations AG
Current assignee: Syngenta Participations AG
Priority date: 1999-12-15
Filing date: 2000-12-07
Publication date: 2003-04-09
Also published as: AR026939A1; JP2003516749A; HUP0203807A3; MXPA02005868A; EP1238062A1; HUP0203807A2; EA004942B1; BR0017024A; AU772124B2; EA200200634A1; AU1707801A; CA2393910A1; WO2001044447A1; IL150084A0

Abstract

本发明描述了用于卤化天然产物的生物合成的方法、转基因植物、和转基因微生物，其中卤化具有底物和区域专一性。具体而言，本发明涉及通过本发明方法生成的卤化代谢物用于保护宿主生物体免于病原体的危害(更具体的说是保护植物免于植物病原体的危害)的用途。在这方面，本发明提供了对植物病原体的抵抗力增强的转基因植物，和生物防治特性增强的生物防治生物体。

Description

用于卤化反应的组合物和方法

发明背景

本发明主要涉及用于卤化天然产物的生物合成的方法、转基因植物、和转基因微生物，其中卤化具有底物和区域专一性。一方面，本发明涉及通过本发明方法生成的卤化代谢物用于保护宿主生物体免于病原体的危害(更具体的说是保护植物免于植物病原体的危害)的用途。在这方面，本发明提供了对植物病原体的抵抗力增强的转基因植物，和生物防治特性增强的生物防治生物体。

长期以来认为超过2000种已知的天然发生的卤化代谢物的生物合成是两类酶的功能：卤素过氧化物酶和非血红素过氧化物酶(GribbleGW，“The natural production of chlorinated compounds”(氯化化合物的天然生成)，Environ Sci Technol，28：310-319，1994；van Pee K-H，“Biosynthesis of halogenated metabolites bybacteria”(由细菌进行的卤化代谢物的生物合成)，Annu RevMicrobiol，50：375-399，1996)。在第一组中，溴过氧化物酶和氯过氧化物酶都拥有原卟啉IX作为含血红素的辅基。这组酶发挥催化作用，即与过氧化氢发生反应而形成酶的氢过氧化物(化合物1)，然后与卤化物(X；X＝Br^-、Cl^-、或I^-)发生反应而形成酶(E)结合中间物EOX。尚不知道EOX是否是卤化剂，或者EOX的分解是否产生活化的、半寿期较短的卤化剂X+或其衍生物(如HOX、X₂、或X₃ ^-)。但是，由这类卤化酶展示的底物专一性的缺乏和区域专一性的缺乏有力的说明，卤化发生于活性位点以外而且是由EOX的分解产物之一催化的(FranssenMCR，“Halogenation and oxidation reactions withhaloperoxi dases”(卤素过氧化物酶的卤化和氧化反应)，Biocatalysis，10：87-111，1994)。

非血红素卤素过氧化物酶有两类，一类拥有钒，另一类拥有丝氨酸蛋白酶的特征性ser/Asp/His催化三联体。前一组催化依赖钒和过氧化氢的HOX形成，继而导致活性位点以外的卤化和底物专一性的显著缺乏(Franssen MCR，“Halogenation and oxidation reactions withhaloperoxidases”(卤素过氧化物酶的卤化和氧化反应)，Biocatalysis，10：87-111，1994)。不含钒的非血红素卤素过氧化物酶被假定在活泼Ser残基位点处形成醋酸酯，然后在存在过氧化氢时转变成过醋酸；过醋酸将卤化物离子氧化成活化的卤化种类(PelletierI、AltenbucherJ、MattesR，“Acatalytic triad isrequ ired by the non-heme haloperoxidase to performhalogenation”(非血红素卤素过氧化物酶进行卤化需要催化性三联体)，Biochim Biophys Acta，1250：149-157，1995)。同样，结果是发生不具有底物专一性或区域专一性的反应(van Pee K-H，“Biosynthesis of halogenated metabolites by bacteria”(细菌中卤化代谢物的生物合成)，Annu Rev Microbiol，50：375-399，1996)。

最近描述了另外一类卤化酶基因，其产物展示对广泛天然产物进行区域专一性卤化的能力(HammerPE、Hill DS、Lam ST、van PeeK-H，Ligon JM，“Four genes from Pseudomonas fluorescens that encodethe biosynthesis of pyrrolinitrin”(来自荧光假单胞菌的编码硝吡咯菌素生物合成的四种基因)，Appl Env iron Microbiol，63：2147-2154，1997)。

发明概述

本发明描述了以区域专一的方式将卤素转移至底物的方法，包括在存在氧化剂、卤素供体、电子转移酶、和还原剂时使底物接触区域专一性卤化酶，其中若转移发生于体内，则电子转移酶是由异源核酸分子编码的。

具体而言，描述了这样的方法：

●其中依照本发明的方法还包含FAD或FMN成份，特别是FAD

●其中电子转移酶是能够催化电子由NADH或NADPH或铁氧还蛋白转移至FAD的酶

●其中电子转移酶是能够催化电子由NADH或NADPH或铁氧还蛋白转移至区域专一性卤化酶的酶

●其中电子转移酶是黄素还原酶、铁氧还蛋白NADP还原酶、铁氧还蛋白、心肌黄酶巯基还原酶或NADH-cyt-B5还原酶、NADPH-FMN还原酶、NADPH-cyt-p450还原酶、或硝酸还原酶

●其中电子转移酶包含与依照SEQ ID NO：19、21、23、25、27、29、或31的任一氨基酸序列具有至少30％同一性的氨基酸序列

●其中电子转移酶包含SEQ ID NO：19、21、23、25、29、或31任一的氨基酸序列

●其中区域专一性卤化酶是prnA、prnC、藤黄绿脓菌素卤化酶pltA、pltD、和pltM、四环素卤化酶cts4、水解酶a、或balhimycin卤化酶bhaA

●其中区域专一性卤化酶包含SEQ ID NO：1

●其中区域专一性卤化酶是包含依照SEQ ID NO：3、5、7、9、11、13、15、或17任一的氨基酸结构域的多肽。

本发明还提供了表达与SEQ ID NO：18、10、22、24、26、28、或30任一基本相似的一种异源核酸和与SEQ ID NO：2、4、6、8、10、12、14、或16任一基本相似的至少一种异源核酸的宿主细胞，具体而言，其中

●宿主细胞是细菌、真菌、或植物细胞

●宿主细胞是微生物细胞

●宿主细胞还表达编码prnB和prnD的核酸序列。

本发明还提供了

●生成硝吡咯菌素的方法，包括培养上述宿主细胞

●保护植物免于病原体的危害的方法，包括用上述宿主细胞处理植物，由此宿主以抑制病原体的量生成硝吡咯菌素

●上述方法，还包括由宿主收集硝吡咯菌素。

本发明还提供了

●包含依照本发明的宿主细胞的植物

●保护植物免于病原体的危害的方法，包括培养上述植物，由此在植物中以抑制病原体的量生成硝吡咯菌素

●上述植物的种子

●预防真菌在农作物上生长的方法，包括培养依照本发明的植物，其中植物是农作物植物

●用于改进宿主的卤化底物生成的方法，包括在宿主中表达编码电子转移酶的异源核酸分子，其中宿主表达具有区域专一性卤化酶活性的至少一种内源多肽。

在本发明中令人惊讶的发现，区域专一性卤化酶能够在体外将卤素转移至底物，但是，为了这样做，它们需要额外的蛋白质因子即电子转移酶。这些酶在体外实现卤化需要额外蛋白质因子的现象是在PrnA的纯化中发现的，PrnA是一种D-色氨酸卤化酶，它在硝吡咯菌素的生物合成中发挥功能，而硝吡咯菌素是由荧光假单胞菌(Pseudomonas fluorescens)生成的二氯化硝基苯基吡咯抗生素。这种依赖NADH和黄素腺嘌呤二核苷酸(以下称为“FAD”)的卤化酶的纯化伴随着卤化活性的逐渐降低。在来自过度表达PrnA的荧光假单胞菌的提取物的离子交换层析过程中，可以通过加入一些缺乏PrnA的层析级分而重新激活部分纯化且无活性的PrnA。根据对加热和蛋白酶的敏感性，本文称为荧光假单胞菌P2的、负责重激活的因子后来显示是蛋白质。将PrnA纯化至均质，导致活性完全丧失，但是可以通过加入本发明的电子转移酶而恢复。

硝吡咯菌素途径中的第二种卤化酶PrnC展示与PrnA的序列的相似性，虽然与PrnA的序列相似性小于下列已知涉及卤化天然产物的生物合成的区域专一性卤化酶：藤黄绿脓菌素(参阅Nowak-Thompson B、Chaney N、Wing JS、Gould SJ、Loper JE，“Characterization ofthe pyoluteorin biosynthetic gene cluster of Pseudomonasfluorescens Pf-5”(荧光假单胞菌Pf-5的藤黄绿脓菌素生物合成基因簇的表征)，J Bacteriol，181：2166-2174，1999)；chloroeremomycin(参阅van Wageningen AM、Kirkpatrick PN、Williams DH、Harris BR、Kershaw JK、Lennard NJ、Jones M、JonesSJ、Solenberg PJ，“Sequencing and analysis of genes involvedin the biosynthesis of a vancomycin group antibiotic”(涉及一种万古霉素组抗生素的生物合成的基因的测序和分析)，Chem Biol，5：155-162，1998)；balhimycin(参阅Pelzer S、Sussmuth R、Heckmann D、Recktenwald J、Huber P、Jung G、Wohlleben W，“Identification and analysis of the balhimycin biosyntheticgene cluster and its use for manipulating glycopeptidebiosynthesis in Amycolatopsis mediterranei DSM5908”(balhimycin生物合成基因簇的鉴定和分析及其在地中海拟无枝酸菌DSM5908中操作糖肽生物合成的用途)，Antimicrob AgentsChemother，43：1565-1573，1999和Pelzer S、Reichert W、HuppertM、HeckmannD、WohllebenW，“Cloning and analysis of a peptidesynthetase gene of the balhimycin producer Amycolatopsismedi terranei DSM5908 and development of a genedisruption/replacement system”(balhimycin生产者地中海拟无枝酸菌DSM5908的肽合成酶基因的克隆和分析及基因破坏/取代系统的开发)，J Biotechnol，56：115-128，1997)；和氯四环素(参阅Dairi T、Nakano T、Mizukami T、Aisaka K、Hasegawa M、KatsumataR，“Conserved organization of genes for biosynthesis ofchlorotetracycline in Streptomyces strains”(链霉菌菌株中氯四环素生物合成基因的保守组织)，Biosci Biotechnol Biochem，59：1360-1361，1995和DairiT、NakanoT、AisakaK、KatsumataR、HasegawaM，“Cloning and nucleotide sequence of the generesponsible for chlorination of tetracycline”(负责四环素氯化的基因的克隆和核苷酸序列)，Biosci Biotechnol Biochem，59：1099-1106，1995)。与PrnA相似，PrnC的纯化也伴随着卤化活性的丧失，但是可以通过加入本发明的电子转移酶而恢复。

硝吡咯菌素途径先前显示在大肠杆菌中发挥功能，此时表达编码PrnA、PrnB、PrnC、和PrnD的硝吡咯菌素操纵子(硝吡咯菌素操纵子的核苷酸序列请参阅美国专利号5,723,759中叙述的5.8X/N，完整收入本文作为参考)。PrnA和PrnC发挥卤化酶的功能；PrnB催化色氨酸的吲哚基重排至氨基苯基吡咯；而PrnD将氨基苯基氧化成硝基苯基取代基。在本发明中令人惊讶的发现，当本发明的电子转移酶大肠杆菌黄素还原酶(以下称为“Fre”)在这种情况下过度表达时，硝吡咯菌素的体内生成显著增强。

通过向纯化且无活性的PrnA中加入大肠杆菌提取物，在大肠杆菌中证实了“P2样活性”的存在。然后通过离子交换、羟基磷灰石、和凝胶渗透柱层析，部分纯化了大肠杆菌P2样活性。用胰蛋白酶处理含该活性的柱级分和无活性的侧翼级分，随后通过质谱进行分离；由在有活性的、含大肠杆菌P2样活性的级分中存在的肽扣除在无活性的级分中鉴定的肽，剩余的肽称为大肠杆菌基因组数据库。由此，唯一鉴定了一种核酸序列，即依赖NADH的黄素还原酶(以下称为“fre”，Genbank编号23486)。

正如下文详述将明确描述的，然后克隆并过度表达大肠杆菌fre，过度表达细胞显示大肠杆菌P2样活性增加，而且与黄素还原酶活性的增加成正比例。将fre与硝吡咯菌素操纵子在分开的质粒上共转染到大肠杆菌中。包含这两种质粒的细胞生成的硝吡咯菌素或硝吡咯菌素代谢物显著高于只包含硝吡咯菌素操纵子的细胞，确认了Fre作为PrnA和PrnC的辅助因子的身份，并指示在大肠杆菌中黄素还原酶活性是限制硝吡咯菌素生成的主要因子。

在本发明的一个实施方案中，提供了以区域专一的方式将卤素转移至底物的方法，包括在存在氧化剂、卤素供体、电子转移酶、和还原剂时使底物接触区域专一性卤化酶，其中若转移发生于体内，则电子转移酶对宿主而言是异源的。

在本发明的另一个实施方案中，提供了以区域专一的方式将卤素转移至底物的方法，包括在存在氧化剂、卤素供体、电子转移酶、还原剂、和FAD或FMN时使底物接触区域专一性卤化酶，其中若转移发生于体内，则电子转移酶对宿主而言是异源的。在特别优选的实施方案中，反应导致硝吡咯菌素的生成。

在一个优选的实施方案中，电子转移酶是能够催化电子由NADH或NADPH或铁氧还蛋白转移至FAD的酶，或者电子转移酶是能够催化电子由NADH或NADPH或铁氧还蛋白转移至区域专一性卤化酶的酶。

在一个优选的实施方案中，电子转移酶的氨基酸序列与NADPH-FMN还原酶、大鼠肝NADPH-cyt-P450还原酶、菠菜铁氧还蛋白NADP还原酶、细胞色素b5还原酶、或亚硝酸还原酶至少30％同一、优选40％同一、更优选50％同一、更优选60％同一、更优选70％同一、更优选80％同一、或更优选90％同一。

在一个优选的实施方案中，区域专一性卤化酶的氨基酸序列与来自荧光假单胞菌(Pseudomonas fluorescens)的PrnA、PrnC、藤黄绿脓菌素卤化酶PltA、PltD、和PltM、来自金霉素链霉菌(Streptomyces aurofaciens)的四环素卤化酶cts4、来自东方拟无枝酸菌(Amycolatopsis orientalis)的水解酶、或来自地中海拟无枝酸菌(Amycolatopsis mediterranei)的balhimycin卤化酶bhaA至少30％同一、优选40％同一、更优选50％同一、更优选60％同一、更优选70％同一、更优选80％同一、或更优选90％同一。

在一个优选的实施方案中，提供了表达与本发明电子转移酶的核酸基本相似的异源核酸并表达编码本发明区域专一性卤化酶的异源核酸的宿主细胞。在一个优选的实施方案中，宿主细胞是细菌、真菌、或植物细胞。

在一个优选的实施方案中，提供了表达编码prnA、prnB、prnC、prnD、和fre的异源核酸分子的宿主细胞。

在一个优选的实施方案中，提供了通过培养宿主细胞来生成硝吡咯菌素的方法，可包括表达编码prnA、prnB、prnC、prnD、和fre的异源核酸分子的植物细胞。

在一个优选的实施方案中，提供了包含本发明宿主细胞的植物，所述宿主细胞表达与编码本发明电子转移酶的核酸基本相似的异源核酸并表达编码本发明区域专一性卤化酶的异源核酸。

在一个优选的实施方案中，提供了表达编码本发明的prnA、prnB、prnC、prnD、和电子转移酶的异源核酸分子的植物。

序列简述SEQ ID NO：1是本发明的区域专一性卤化酶中存在的保守氨基酸基元。SEQ ID NO：2是编码来自荧光假单胞菌的PrnA的核酸序列。SEQ ID NO：3是来自荧光假单胞菌的PrnA的氨基酸序列。SEQ ID NO：4是编码来自荧光假单胞菌的PrnC的核酸序列。SEQ ID NO：5是来自荧光假单胞菌的PrnC的氨基酸序列。SEQ ID NO：6是编码来自荧光假单胞菌的PltA的核酸序列。SEQ ID NO：7是来自荧光假单胞菌的PltA的氨基酸序列。SEQ ID NO：8是编码来自荧光假单胞菌的PltD的核酸序列。SEQ ID NO：9是来自荧光假单胞菌的PltD的氨基酸序列。SEQ ID NO：10是编码来自荧光假单胞菌的PltM的核酸序列。SEQ ID NO：11是来自荧光假单胞菌的PltM的氨基酸序列。SEQ ID NO：12是编码来自东方拟无枝酸菌的水解酶A的核酸序列。SEQ ID NO：13是来自东方拟无枝酸菌的水解酶A的氨基酸序列。SEQ ID NO：14是编码来自金霉素链霉菌的cts4的核酸序列。SEQ ID NO：15是来自金霉素链霉菌的cts4的氨基酸序列。SEQ ID NO：16是编码来自地中海拟无枝酸菌的bhaA的核酸序列。SEQ ID NO：17是来自地中海拟无枝酸菌的bhaA的氨基酸序列。SEQ ID NO：18是编码来自大肠杆菌的Fre的核酸序列。SEQ ID NO：19是来自大肠杆菌的Fre的氨基酸序列。SEQ ID NO：20是编码来自大鼠的NADH细胞色素b5还原酶的核酸序列。SEQ ID NO：21是来自大鼠的NADH细胞色素b5还原酶的氨基酸序列。SEQ ID NO：22是编码来自兔的NADPH-cyt-p450还原酶的核酸序列。SEQ ID NO：23是来自兔的NADPH-cyt-p450还原酶的氨基酸序列。SEQID NO：24是编码来自蔬菜沙门氏菌(S.oleracea)的铁氧还蛋白的核酸序列。SEQ ID NO：25是来自蔬菜沙门氏菌的铁氧还蛋白的氨基酸序列。SEQ ID NO：26是编码来自费氏弧菌(Vibriofischeri)的NADPH-FMN还原酶的核酸序列。SEQ ID NO：27是来自费氏弧菌的NADPH-FMN还原酶的氨基酸序列。SEQ ID NO：28是编码来自蔬菜沙门氏菌的铁氧还蛋白-NADP还原酶的核酸序列。SEQ ID NO：29是来自蔬菜沙门氏菌的铁氧还蛋白-NADP还原酶的氨基酸序列。SEQ ID NO：30是编码来自寄生曲霉(Aspergullus parasiticus)的硝酸还原酶的核酸序列。SEQ ID NO：31是来自寄生曲霉的硝酸还原酶的氨基酸序列。SEQ ID NO：32是用于大肠杆菌黄素还原酶的引物。SEQ ID NO：33是用于大肠杆菌黄素还原酶的引物。SEQ ID NO：34是质粒pNOV523。SEQ ID NO：35是pNOV524。

发明详述体外卤化天然产物的生成

依照本发明，可以通过在存在卤素供体、氧化剂、还原剂、和本发明的电子转移酶时使区域专一性卤化酶与底物发生反应而在体外生成卤化天然产物。

本发明的区域专一性卤化酶是能够与卤化物、氧化剂、和还原系统相互作用而在生物学卤化反应过程中催化一个或多个碳-卤素键取代一个或多个碳-氢键，且具有底物和/或区域专一性的卤化酶。区域专一指碳-卤素键只于底物的特定位置形成。

本发明优选的区域专一性卤化酶包括包含如下保守基元并在特定位置催化至少一个碳-卤素键取代碳-氢键的卤化酶：X1-W-X2-W-X3-I-P-X4(SEQ ID N0：1)，其中X1是G或T；X2是V、L、T、F、或M；X3是任意氨基酸残基；X4是I、F、M、或L。

在一个优选实施方案中，本发明的卤化酶包括色氨酸卤化酶。本发明的色氨酸卤化酶包括PrnA(SEQ ID NO：3)(参阅蛋白质编号#AAB97504；Hammer PE、Burd W、Hill DS、Ligon JM、van Pee K，“Conservation of the pyrrolnitrin biosynthetic gene clusteramong six pyrrolnitrin-producing strains”(六种硝吡咯菌素生成菌株中硝吡咯菌素生物合成基因簇的保守性)，FEMS MicrobiolLett，180(1)：39-44，1999年11月1日)和与SEQ ID NO：3优选具有90％同一性、80％同一性、70％同一性、60％同一性、50％同一性、或40％同一性的区域专一性卤化酶。在本中请书全文中所用的氨基酸序列之间的同一性百分比是通过BASTP 2.09程序(可以由http：//www.ncbi.nlm.nih.gov/gorf/bl2.html获得)测定的，参数设置是：评分矩阵＝blosum62，缺口开口罚分＝7，缺口延伸罚分＝2，x_dropoff＝50，预期(expect)＝10.00，字长(wordsize)＝3。

在另一个优选实施方案中，本发明的区域专一性卤化酶包括单氯氨基硝吡咯菌素(monochchloroaminopyrrolnitrin)卤化酶。单氯氨基硝吡咯菌素卤化酶包括PrnC(SEQ ID NO：5)(参阅蛋白质编号#AAB97506)和与其优选具有90％同一性、80％同一性、70％同一性、60％同一性、50％同一性、或40％同一性的区域专一性卤化酶。

在本发明的一个特别优选的实施方案中，本发明的区域专一性卤化酶包括与来自荧光假单胞菌的prnA(SEQ ID NO：3)、prnC(SEQ IDNO：5)、藤黄绿脓菌素卤化酶pltA(SEQ ID NO：7)、pltD(SEQ IDNO：9)、和pltM(SEQ ID NO：11)、来自金霉素链霉菌的四环素卤化酶cts4(SEQ ID NO：15)、来自东方拟无枝酸菌的水解酶a(SEQ IDNO：13)、来自地中海拟无枝酸菌的balhimycin卤化酶bhaA(SEQ ID NO：17)中的任一种30％同一、优选40％同一、更优选50％同一、更优选60％同一、更优选70％同一、更优选80％同一、更优选90％同一、更优选95％同一、或更优选99％同一的任何卤化酶，包括下表中鉴定的卤化酶：

编号#	蛋白质编号	名称	生物体
编号#	蛋白质编号	名称	生物体	PFU74493_1	AAB97504	PrnA	荧光假单胞菌134
AF161184_1	AAD46365	PrnA	荧光假单胞菌CHAO	PFU74493_1	AAB97504	PrnA	荧光假单胞菌134
AF161184_1	AAD46365	PrnA	荧光假单胞菌CHAO	AF161182_1	AAD46360	PrnA	致金色假单胞菌(Pseudomonas aureofaciens)
AF161186_1	AAD46370	PrnA	吡咯伯克霍尔德氏菌(Burkholderia pyrrocinia)	AF161182_1	AAD46360	PrnA	致金色假单胞菌(Pseudomonas aureofaciens)
AF161186_1	AAD46370	PrnA	吡咯伯克霍尔德氏菌(Burkholderia pyrrocinia)	AF161183_1	AAD46361	PrnA	洋葱伯克霍尔德氏菌(Burkholderia cepacia)
AF161185_4	AAD46369	PrnA	橙色粘球菌(Myxococcus fulvus)	AF161183_1	AAD46361	PrnA	洋葱伯克霍尔德氏菌(Burkholderia cepacia)
AF161185_4	AAD46369	PrnA	橙色粘球菌(Myxococcus fulvus)	PFU74493_3	AAB97506	PrnC	荧光假单胞菌134
AF161183_3	AAD46363	PrnC	洋葱伯克霍尔德氏菌	PFU74493_3	AAB97506	PrnC	荧光假单胞菌134
AF161183_3	AAD46363	PrnC	洋葱伯克霍尔德氏菌	AF161186_3	AAD46372	PrnC	吡咯伯克霍尔德氏菌
AF161185_2	AAD46367	PrnC	橙色粘球菌	AF161186_3	AAD46372	PrnC	吡咯伯克霍尔德氏菌
AF161185_2	AAD46367	PrnC	橙色粘球菌	STMCTS_3	BAA07389	cts4四环素卤化酶	金霉素链霉菌
AF081920	AAD24884	PltA	荧光假单胞菌	STMCTS_3	BAA07389	cts4四环素卤化酶	金霉素链霉菌
AF081920	AAD24884	PltA	荧光假单胞菌	AF081920	AAD24878	PltD	荧光假单胞菌
AF081920	AAD24882	PltM	荧光假单胞菌	AF081920	AAD24878	PltD	荧光假单胞菌
AF081920	AAD24882	PltM	荧光假单胞菌	AOPCZA361_2	CAA11780	非血红素加氧酶/卤化酶	东方拟无枝酸菌
AMOXYAE_4	CAA76550	bhaA	地中海拟无枝酸菌	AOPCZA361_2	CAA11780	非血红素加氧酶/卤化酶	东方拟无枝酸菌
AMOXYAE_4	CAA76550	bhaA	地中海拟无枝酸菌	U84350	AAB49297	假设的羟化酶a	东方拟无枝酸菌

本发明的电子转移酶可包括通过依赖NAD(P)H的氧化还原酶或氧化还原酶及其它电子供体(诸如叶绿体光合系统、乳酸盐、黄嘌呤等)，能够将电子由NADH或NADPH或铁氧还蛋白或其它还原剂转移至FAD或FMN的电子转移酶，或者能够将电子由NADH或NADPH或铁氧还蛋白或其它还原剂转移至卤化酶的电子转移酶。

可以通过选择这样的电子转移酶来确定本发明的电子转移酶，其中可以通过监控NADH或NADPH或铁氧还蛋白的氧化(通过与还原剂的氧化有关的吸光度的特征性变化)来检测电子转移。这种变化(或变化速率的增加)依赖FAD或FMN的存在。可以通过监控340nm的吸光度来检测NADH和NADPH的氧化；氧化导致吸光度降低。可以通过监控420nm的吸光度来检测铁氧还蛋白的氧化；氧化导致吸光度升高。还可以通过监控NADH或NADPH的氧化(通过340nm处的激发、＞380nm处的发射的荧光特征性降低)来检测电子转移。这种荧光降低依赖FAD或FMN的存在。

还可以通过选择这样的电子转移酶来确定本发明的电子转移酶，其中可以通过混合电子转移酶与50μmolar NADH或50μmolar NADPH、包含或不含50μmolar卤化酶(卤化酶必须是全酶的状态，即早已结合了所有必需的辅因子，诸如FAD)并观察依赖卤化酶的NADH或NADPH氧化速率的增加来鉴定由NADH或NADPH向本发明区域专一性卤化酶的电子转移；其中通过340nm处吸光度的降低或上述荧光的降低来测量氧化。

可以通过选择这样的电子转移酶来确定本发明的电子转移酶，其中可以通过混合电子转移酶与50mol还原型铁氧还蛋白、包含或不含50μmol卤化酶(卤化酶必须是全酶的状态，即早已结合了所有必需的辅因子，诸如FAD)并观察依赖卤化酶的氧化速率的增加来鉴定由铁氧还蛋白向卤化酶的电子转移；通过340nm吸光度的增加来测量铁氧还蛋白的氧化。

在本发明的优选实施方案中，电子转移酶与下列任一至少30％同一、优选40％同一、更优选50％同一、更优选60％同一、更优选70％同一、更优选80％同一、更优选90％同一、或同一：包含SEQ ID NO：19的氨基酸序列的大肠杆菌黄素还原酶(描述于FieschiF、NiviereV、Frier C、Decout JL、Fontecave M，“The mechanism and substratespecificity of the NADPH：flaVin oxidoreductase fromEscherichia coli”(来自大肠杆菌的NADPH：黄素氧化还原酶的机制和底物专一性)，J Biol Chem，270(51)：30392-30400，1995年12月22日)；依照Richarme G，“Purification of a new dihydrolipoamidedehydrogenase from Escherichia coli”(来自大肠杆菌的一种新的二氢硫辛酰胺脱氢酶的纯化)，J Bacteriol，171(12)：680-685，1989年12月纯化的心肌黄酶巯基还原酶；NADH细胞色素b5还原酶(SEQID NO：21)(描述于Barber MJ、Quinn GB，“High-level expressionin Escherichial coli of soluble，catalytic domain of rat hepaticcytochrome b5 reductase”(大鼠肝细胞色素b5还原酶的可溶性催化结构域在大肠杆菌中的高水平表达)，Protein Expr Purif，8(1)：41-47，1996年8月；来自大鼠的NADPH-cyt-P450还原酶(SEQ ID NO：23)、来自蔬菜沙门氏菌的铁氧还蛋白-NADP还原酶(SEQ ID NO：29)、来自蔬菜沙门氏菌的铁氧还蛋白(SEQ ID NO：25)、来自寄生曲霉的硝酸还原酶(SEQ ID NO：31)、和来自费氏弧菌的NAD(P)H-FMN还原酶(SEQ ID NO：27)(描述于Zenno S、SaigoK，“Identificationof the genes encoding NAD(P)H-flavin oxidoreductases that aresimi lar in sequence to Escherichia coli Fre in four species ofluminous bacteria：Photorhabdus luminescens，Vibrio fischeri，Vibrio harveyi，and Vibrio orientails”(四种发光细菌(发光光杆状菌、费氏弧菌、哈氏弧菌、和东方弧菌)中序列与大肠杆菌Fre相似的NAD(P)H-黄素氧化还原酶的编码基因的鉴定)，J Bacteriol)，176(12)：3544-3551，1994年6月)。可以以提取物或纯化形式使用本发明的电子转移酶。

在特别优选的实施方案中，本发明的电子转移酶与SEQ ID NO：21、23、25、27、29、或31任一至少30％同一、优选40％同一、更优选50％同一、更优选60％同一、更优选70％同一、更优选80％同一、更优选90％同一，而且在任一上述测试中电子转移测试为阳性。

还原剂的选择，诸如吡啶核苷酸，如还原型烟酰胺腺嘌呤二核苷酸或还原型烟酰胺腺嘌呤二核苷酸磷酸或还原型铁氧还蛋白，取决于本发明电子转移酶的选择。一般而言，本发明的所有电子转移酶对一种吡啶核苷酸具有高度催化活性，但通常对另一种吡啶核苷酸具有一些活性。因而，如果出于其它考虑而希望这样，那么可以在特定电子转移酶的卤化反应中使用非优选的吡啶核苷酸。每种电子转移酶的优选吡啶核苷酸如下：NADPH是NADPH-cyt-P450还原酶和铁氧还蛋白NADP还原酶的优选吡啶核苷酸；NADH是大肠杆菌黄素还原酶、NADH-cyt-b5还原酶、硝酸还原酶、和心肌黄酶巯基还原酶的优选吡啶核苷酸。

铁氧还蛋白NADP还原酶还可使用还原型铁氧还蛋白，它可以通过植物、分离叶绿体、或含叶绿体片段的光合系统I的光照而生成。铁氧还蛋白还可以由依赖铁氧还蛋白的脱氢酶还原，诸如丙酮酸：铁氧还蛋白氧化还原酶(Horner DS、Hirt RP、Embley TM，“A single eubacterialorigin of eukaryotic pyruvate：ferredoxin oxidoreductase genes：implications for the evolution of anaerobic eukaryotes”(真核生物丙酮酸：铁氧还蛋白氧化还原酶基因的单一真细菌起源：厌氧真核生物进化的暗示)，Mol Biol Evol，16(9)：1280-1291，1999年9月)。

在优选的实施方案中，可以在体外反应中包含FAD以增加反应效率。在特别优选的实施方案中，反应包含FAD，而且选择的区域专一性卤化酶是PrnA。

在候选实施方案中，本发明包括联合卤化酶(其中卤化酶是纯化的本发明区域专一性卤化酶)与底物卤素离子诸如Cl^-，和活性氧供体诸如H₂O₂、KIO₄、亚碘酰苯、亚碘酰基苯甲酸(盐)、叔丁基过氧化氢、过氧化苯甲酰、氢过氧化枯烯(cumene hydroperoxide)、过氧化二异丙苯(dicumyl peroxide)、过氧乙酸、或近似化合物。活性氧供体省却了供给O₂和还原剂的需要。

本发明的底物将取决于选择的本发明区域专一性卤化酶。本发明的底物可包括色氨酸、吲哚、氨基苯基吡咯、及其衍生物、和四环素，bhaA的底物包括balhimycin底物种类B1-1、B1-2、B2-1、B2-2、和B3的所有化合物(描述于PelzerS、SussmuthR、HeckmannD、RecktenwaldJ、HuberP、JungG、WohllebenW，“Identification and analysisof the balhimycin biosynthetic gene cluster and its use formanipulating glycopeptide biosynthesis in Amycolatopsismediterranei DSM5908”(balhimycin生物合成基因簇的鉴定和分析及其在地中海拟无枝酸菌DSM5908中操作糖肽生物合成的用途)，Antimicrob Agents Chemother，43：1565-1573，1999)。

可以以无机或有机阳离子的盐或其相应的酸的形式向反应供给可用于本发明的卤素供体。本发明的卤素供体可提供F^-、Cl^-、Br^-、或I离子。

可以在pH4-10、温度0-65℃的缓冲液中进行本发明的反应。可以以盐的形式加入卤素供体，如氯化物盐类可包括LiCl、NaCl、KCl、CsCl、MgCl₂、CaCl₂、和NH₄Cl。反应时间可以在1分钟-48小时之间变化。最佳条件是pH7.5、温度30℃、反应时间12小时。

可以通过共价偶联电子转移酶与卤化酶，使得由还原剂向卤化酶的电子转移成为一级过程而非二级过程(就卤化酶浓度而言)，从而提高体外卤化的催化效率。可以通过遗传工程构建包含本发明的电子转移酶和区域专一性卤化酶的融合蛋白(通过在同一读码框中融合它们的编码区)来获得相同结果。可以使用或不用编码将电子转移酶和卤化酶蛋白质结构域分隔开来的短肽序列的间插序列来进行融合。可以以两种取向构建融合蛋白：(1)N端-电子转移酶-(任选的接头)-卤化酶-C端；(2)N端-卤化酶-(任选的接头)-电子转移酶-C端。

在本发明的另一个实施方案中，可以将包含区域专一性卤化酶和电子转移酶的系统的蛋白质成份进行固定，正如下文进一步所述，使之与底物反应而生成产物。卤化酶和电子转移酶可以作为共固定的单独酶使用，或者作为具有电子转移酶和卤化酶活性的融合蛋白(其中两种成份的编码序列融合在一起而生成单一蛋白质)使用。系统中可以包含额外酶和适当的第二还原剂以再生NADH或NADPH。这种酶和第二还原剂配对的范例包括：乙醇脱氢酶与乙醇、葡萄糖-6-磷酸脱氢酶与葡萄糖-6-磷酸、醛脱氢酶与乙醛、硫辛酰胺脱氢酶与还原型硫醇(诸如硫辛酰胺、二硫苏糖醇、或巯基磺酸)。

在这个实施方案中，可以通过几种方法将酶(将包括NADH或NADPH再生系统的酶，如果使用这种系统的话)进行固定。范例包括：(1)将酶置于具有半透膜(透析膜)的容器内，所述半透膜允许底物和核苷酸通过，但是酶不能通过；(2)将酶共价附着于不溶性基质；(3)经针对酶的抗体或针对酶所融合的抗原的抗体使酶结合基质；(4)经生物素和生物素结合结构域(诸如亲和素)使酶结合基质；(5)使酶周围的基质聚合(诸如异丁烯酸酯聚合物)。

然后可以将固定的酶暴露于含还原剂、第二还原剂(如果使用NAD(P)H再生系统的话)、底物、和卤化物盐的缓冲液。可以包含有机溶剂以促进底物的溶解。典型条件包括pH4-10、0-65℃。生成足够的卤化产物后，由反应混合液提取卤化天然产物。异源宿主中卤化天然产物的生成

可以在细菌或真菌宿主中表达编码本发明电子转移酶的异源核酸分子，从而能够以比天然宿主的可能更高的效率进行天然产物的卤化生产。例如，为了增强天然产物生产，可以在硝吡咯菌素生产者诸如荧光假单胞菌、吡咯伯克霍尔德氏菌、橙色粘球菌、洋葱伯克霍尔德氏菌、致金色假单胞菌，藤黄绿脓菌素生产者诸如荧光假单胞菌，万古霉素类抗生素生产生物体诸如各种拟无枝酸菌物种诸如东方拟无枝酸菌和地中海拟无枝酸菌，和氯四环素生产者金霉素链霉菌，或其它抗生素生产链霉菌物种中表达编码本发明电子转移酶的异源核酸分子。

另外，可以在细菌或真菌宿主中共表达编码区域专一性卤化酶和电子转移酶的异源核酸分子，从而能够进行或增加卤化天然产物的生产。在有些情况下，本发明卤化天然产物的合成将只需要一个生物合成步骤，即卤化步骤，因而将要表达的唯一异源核酸分子将是包含本发明卤化酶和电子转移酶的编码序列的异源核酸分子。在其它情况下，生成卤化天然产物的生物合成途径将包含一个或多个卤化步骤作为其中一部分。在这种情况下，将表达多种异源核酸分子。

术语“异源核酸分子”在用于本申请书全文时指与它所导入的宿主细胞天然无关的核酸分子，包括遗传构建物、天然发生核酸分子的非天然发生多拷贝；和可操作连接非天然核酸分子的原本同源的核酸分子。

在广义上，术语“基本相似”在用于本申请书全文中的核酸分子方面时指对应于参考核苷酸序列的核酸分子，其中相应的核酸分子编码的多肽与参考核苷酸序列编码的多肽具有基本相同的结构和功能，如其中只发生不影响多肽功能的氨基酸变化。理想的是，基本相似的核酸分子编码由参考核苷酸序列编码的多肽。术语“基本相似”明确的意欲包括其序列经修饰而使得在特定细胞中的表达最优化的核酸分子。基本相似的核酸分子与参考核苷酸序列之间的同一性百分比理想的是至少30％、优选至少45％、更希望是至少65％、更希望是至少75％、优选至少85％、更优选至少90％、仍更优选至少95％、仍然更优选至少99％同一。序列比较是使用Smith-Waterman序列比对算法(参阅如Waterman MS，《Introduction to Computational Biology：Maps，sequences and genomes》(计算生物学入门：图谱、序列、和基因组)，Chapman & Hall，伦敦，1995，ISBN 0-412-99391-0；或http：//www-hto.usc.edu/software/seqaln/index.html)进行的。使用局部S程序1.16版，参数如下：匹配＝1，错配罚分＝0.33，缺口开放罚分(open-gap penalty)＝2，缺口延伸罚分(extended-gappenalty)＝2。

与参考核苷酸序列“基本相似”的核酸分子与参考核苷酸序列在下列条件下发生杂交：在7％十二烷基磺酸钠(SDS)、0.5M NaPO₄、1mMEDTA中于50℃杂交，在2xSSC、0.1％SDS中于50℃清洗；更理想的是在7％十二烷基磺酸钠(SDS)、0.5M NaPO₄、1mM EDTA中于50℃杂交，在1x SSC、0.1％SDS中于50℃清洗；更理想的是仍在7％十二烷基磺酸钠(SDS)、0.5M NaPO₄、1mM EDTA中于50℃杂交，在0.5x SSC、0.1％SDS中于50℃清洗；优选在7％十二烷基磺酸钠(SDS)、0.5M NaPO₄、1mM EDTA中于50℃杂交，在0.1x SSC、0.1％SDS中于50℃清洗；更优选在7％十二烷基磺酸钠(SDS)、0.5M NaPO₄、1mM EDTA中于50℃杂交，在0.1x SSC、0.1％SDS中于65℃清洗。在上述条件下发生杂交的本发明多核苷酸优选包含至少80碱基对、更优选至少50碱基对、特别是至少21碱基对、和更特别是18碱基对。

这些遗传操作的技术对于不同的可利用宿主是特异的，在本领域是知道的。例如，表达载体pKK223可用于在大肠杆菌中以转录或翻译融合的方式在tac启动子之后表达异源基因。对于编码多个开放读码框(以下称为“ORF”)的操纵子的表达，最简单的流程是以转录融合的方式将操纵子插入载体诸如pKK233，从而使得使用异源基因的同源核糖体结合位点。在革兰氏阳性物种诸如芽孢杆菌属(Bacillus)中过度表达的技术在本领域是知道的，而且可用于本发明的内容(Quax等人，在Baltz等人编的《Industrial Microorganisms：Basic andApplied Molecular Genetics》(工业微生物：分子遗传学基础和应用)一书中，Ameri can Society for Microbiology(美国微生物学学会)，华盛顿，1993)。过度表达的候选系统依赖酵母载体，包括毕赤酵母属(Pichia)、酵母属(Saccharomyces)、和克鲁维酵母属(Kluyveromyces)的使用(Sreekrishna，在Baltz、Hegeman、和Skatrud编的《Industrial Microorganisms：Basic and AppliedMolecular Genetics》(工业微生物：分子遗传学基础和应用)一书中，American Society for Microbiology(美国微生物学学会)，华盛顿，1993；Dequin和Barre，Biotechnology，12：173-177，1994；van den Berg等人，Biotechnology，8：135-139，1990)。

这些卤化天然产物中的有些在抑制微生物生长中可能是有效的，特别是致植物病微生物。可以由过度表达卤化酶和/或电子转移酶的生物体生产卤化天然产物，适用于该目的的生物体包括革兰氏阴性和革兰氏阳性的细菌和酵母，以及下文将更详细描述的植物。为了卤化天然产物的生产目的，选择宿主生物体的重要标准是易于操作、快速生长(即在微生物的情况下是发酵)、和缺乏对过度生成的卤化天然产物的敏感性。卤化天然产物的这些生产方法相比于卤化天然产物制备中常用的化学合成技术具有显著优势。本文所述方法的应用将可提高通过发酵生产卤化天然产物的效率和产量，而且将可用于在天然产物中先前不存在的且合成将难以实现的位置导入新的卤素原子。

相比于化学合成的一些优势是生产成本更便宜，和合成区域专一性卤化的优选化合物的能力。掺入电子转移酶可提高卤化产物的效率和产量。另外，使用具有期望的底物和区域专一性的天然发生卤化酶，或者使用具有新的底物和区域专一性的改造后卤化酶，可以通过向已知天然产物中添加卤素来生成新的卤化产物。使用化学手段将很难卤化具有区域专一性和对映体专一性的许多天然产物，例如大环内酯、聚酮、和非核糖体肽。芳基或烷基的卤化所需要的条件将通常引起天然产物的其它结构变化。

卤化酶还可生成对映异构方面纯的产物(在前手性碳卤化的情况下)，这与有机合成通常产生的外消旋混合物相反。生成立体化学适当的化合物的能力对于具有许多手性碳原子的分子是特别重要的。由异源宿主生成的卤化天然产物可用于许多目的，包括医学(即控制病原体和/或传染病)和农业应用。

当卤化产物的生成需要超过一种酶时，可以在单一生物体中表达编码目的卤化产物生物合成的酶的核酸分子。在一个优选的实施方案中，将所有编码生产天然产物所需要的酶的核酸序列整合到生物体的染色体中，作为单一操纵子，并受到合适调控元件的控制。在另一优选实施方案中，可以在具有选择标记的质粒上携带核酸序列。另一个候选的优选实施方案包括在两种或更多相容质粒上表达所需核酸序列，或者可以将所需核酸序列分配到染色体和一种或更多相容质粒中。可以通过天然产物生物合成核酸编码序列的天然调控元件或者通过为了更精确的控制该途径核酸序列的表达而选择的启动子来控制核酸分子的表达。任选的是，操纵子中将包含电子转移酶核酸序列，以及编码本发明的区域专一性卤化酶(或卤化酶)的核酸序列。或者，可以分开表达电子转移酶序列。

本发明用于生产卤化产物的另一种方法包括在两种或更多的分开生物体中分配生物合成途径的核酸分子。可以分开培养生物体，将一种培养物生成的生物合成中间物转移至表达生物合成途径随后步骤的另一种培养物中。或者，可以共培养生物体，根据需要，中间物由一种生物体传递至另一种生物体。在任何这些应用中，每种卤化酶都需要在相同的生物体中、在相同的亚细胞位置共表达合适的电子转移酶。

可以通过将卤化酶导入早已表达生成目的未卤化结构所需要的基因的生物体来生成新的卤化产物。可以改造卤化酶以具有对完成结构中特定位点的专一性，或者它可具有对在天然生物体中随后掺入最终结构的结构成份的专一性。例如，可以改造卤化酶以专一性卤化随后将掺入含肽抗生素的氨基酸。于是，得到的产物可以在天然产物中未发现的位置拥有新的卤素修饰。

在任何上述系统中，可以通过融合编码电子转移酶和区域专一性卤化酶的核酸序列从而生成具有两种功能性的融合蛋白来实现卤化效率的显著优势；这种融合可导致电子以更高效率由还原剂转移至卤化酶。电子转移酶核酸序列可以融合在卤化酶的5’或3’端。可以在融合中掺入连接短肽(接头)的编码序列，将电子转移酶和卤化酶蛋白质结构域的编码序列分隔开来；接头的长度可以在1-30个氨基酸残基之间变化。

还可以在异源细菌和真菌宿主中表达本发明的卤化酶和/或电子转移酶以生成卤化天然产物，目的是提高这些细菌和真菌宿主的生物防治菌株的功效。适合于抗病原体卤化天然产物的异源过度表达的微生物是能够在植物或根际定居的所有微生物。由此它们将接触致植物病的真菌、细菌、和线虫，引起对病原体生长的抑制。这些病原体包括革兰氏阴性微生物诸如假单胞菌属、肠杆菌属(Enterobacter)、和沙雷氏菌属(Serratia)，革兰氏阳性微生物芽孢杆菌属，和真菌木霉属(Trichoderma)和粘帚霉属(Gliocladium)。特别优选的异源宿主是荧光假单胞菌、恶臭假单胞菌(Pseudomonas putida)、洋葱假单胞菌、致金色假单胞菌、桔橙假单胞菌(Pseudomonasaurantiaca)、阴沟肠杆菌(Enterobacter cloacae 、粘质沙雷氏菌(Serratia marcescens)、枯草芽孢杆菌(Bacillus subtilis)、蜡状芽孢杆菌(Bacillus cereus)、绿色木霉(Trichoderma viride)、Trichoderma harzianum、和绿粘帚霉(Gliocladium virens)。

异源生物防治菌株中的表达需要选择适合于在选定宿主中复制的载体和选择合适的启动子。用于在革兰氏阴性和革兰氏阳性细菌和真菌中表达的技术在本领域是众所周知的，而且在本申请书的其它章节有所描述。转基因植物中卤化产物的生成

在转基因植物中表达本发明的卤化酶和/或电子转移酶，由此引起选定卤化天然产物在转基因植物中的生物合成。在有些情况下，本发明的卤化天然产物将只需要一个生物合成步骤，即卤化步骤，因而将要表达的唯一异源核酸分子将是包含本发明的区域专一性卤化酶和电子转移酶的编码序列的异源核酸分子。在其它情况下，生成卤化天然产物的生物合成途径将包含一个或多个卤化步骤作为其中一部分。在这种情况下，将表达多种异源核酸分子。

在用于本申请书时，“植物”指处于任何发育阶段的任何植物或植物部分。还包括插条、细胞或组织培养物、和种子。在与本发明结合使用时，术语“植物组织”包括但不限于完整植株、植物细胞、植物器官、植物种子、原生质体、愈伤组织、细胞培养物、和组织成结构和/或功能单位的任何植物细胞群。当卤化天然产物具有抗病原体特性时，则生成了对致植物病的真菌和细胞的抵抗力增强的转基因植物。为了它们在转基因植物中的表达，编码本发明卤化酶和/或电子转移酶的核酸分子和邻近序列可能需要修饰和优化。

虽然在许多情况下可以在植物中高水平表达来自其它生物体的核酸分子而无需修饰，但是转基因植物中的低表达可能是由于核酸分子具有植物不优选的密码子。本领域知道，所有生物体对密码子使用具有特异的偏爱，而且可以改变来自其它生物体的密码子以符合植物的偏爱，同时维持所编码的氨基酸。此外，植物中的高表达由具有至少35％、更优选超过45％GC含量的编码序列得到最好的实现。由于存在可使信息不稳定的ATTTA基序和可引起不适当聚腺苷酸化的AATAAA基序，具有低GC含量的微生物基因在植物中的表达可能较差。另外，可以对编码本发明卤化酶或电子转移酶的核酸分子筛选可引起mRNA截短的不正常剪接位点的存在情况。可以使用众所周知的定点诱变、PCR、和合成基因构建技术，使用已发表的专利申请书EP 0 385 962、EP 0 359472、和WO 93/07278中所述方法，进行需要在编码序列中产生的所有改变(诸如上文所述)。本发明的优选核酸分子可以是未修饰的，只要它们在目标转基因植物物种中高水平表达即可；或者可以是经修饰的核酸分子，其中通过除去不稳定和不适当聚腺苷酸化基序以及不正常剪接位点而进行了修饰，通过掺入植物优选密码子而得到进一步修饰，而且具有在植物中表达的优选GC含量。虽然优选核酸序列可以在单子叶植物和双子叶植物物种中充分表达，但是可以修饰序列以解决单子叶植物或双子叶植物特异的密码子偏爱和GC含量偏爱，因为这些偏爱显示是不同的(Murray等人，Nucl Acid Res，17：477-498，1989)。

为了有效起始翻译，可能需要修饰起始甲硫氨酸的邻近序列。与选定核酸分子同源的序列可以在植物中有效起始翻译，或者可能是低效的。在它们低效起始的情况下，可以通过包含已知在植物中有效的序列来修饰它们。Joshi建议了用于植物的适当共有翻译起始子(NAR，15：6643-6653，1987；SEQ ID NO：15)，而Clontech建议了另一种共有翻译起始子(1993/1994产品目录，第210页；SEQ ID NO：16)。这些共有序列适用于本发明的核酸分子。将序列掺入核酸分子构建物，可直至并包含ATG(同时保持选定核酸分子的第二个氨基酸未修饰)，或者直至并包含ATG后面的GTC(有可能修饰转基因的第二个氨基酸)。

编码本发明卤化酶或电子转移酶的核酸分子在转基因植物中的表达位于显示在植物中有功能的启动子之后。启动子的选择将根据表达的时空要求和目标物种而变化。当卤化天然产物是抗病原体的而且希望保护植物免于叶病原体的危害时，优选在叶中的表达；为了保护植物免于穗病原体的危害，优选在花序(如穗状花序、圆锥花序、穗轴等)中的表达；为了保护植物免于根病原体的危害，优选在根中的表达；为了保护幼苗免于土传病原体的危害，优选在根和/或幼苗中的表达。然而，在许多情况下，将寻找针对超过一种类型的植物病原体的表达，因而将希望在多种组织中的表达。虽然来自双子叶植物的许多启动子显示在单子叶植物中可运作且反之亦然，但是理想的是选择双子叶启动子用于双子叶植物中的表达，单子叶启动子用于单子叶植物中的表达。但是，对于选定启动子的出处没有限制，只要它们在驱动本发明核酸分子的表达中可运作就足够了。组成性表达的优选启动子包括CaMV 35S和19S启动子，和来自编码肌动蛋白或泛素的基因的启动子。

还可以在化学调控的启动子的调控下表达本发明的核酸分子。这使得能够只在用诱导性化学药品处理农作物植物时合成卤化天然产物，而且卤化天然产物生物合成随后下降。用于化学诱导基因表达的优选技术详述于已发表的申请EP 0 332 104和美国专利5,614,395(收入本文作为参考)。用于化学诱导的优选启动子是烟草PR-1a启动子。

启动子的优选种类是创伤诱导型。已经描述了在创伤位点以及致植物病原体感染位点表达的许多启动子。理想的是，这种启动子应当只在感染位点局部有活性，这样，抗病原体的卤化天然产物只在需要合成它以抑制侵入病原体生长的细胞中积累。这类优选启动子包括由Stanford等人，Mol Gen Genet，215：200-208，1989；Xu等人，PlantMolec Biol，22：573-588，1993；Logemann等人，Plant Cell，1：151-158，1989；Rohrmeier和Lehle，Plant Molec Biol，22：783-792，1993；Firek等人，Plant Molec Biol，22：129-142，1993；和Warner等人，Plant J，3：191-201，1993描述的启动子。

优选的组织特异性表达模式包括绿色组织特异性、根特异性、茎特异性、和花特异性。适用于在绿色组织中表达的启动子包括调控涉及光合作用的基因的许多启动子，而且这些启动子中的许多已经由单子叶植物和双子叶植物二者进行了克隆。一种优选启动子是来自磷酸烯醇丙酮酸羧化酶基因的玉米PEPC启动子(Hudspeth和Crula，PlantMolec Biol，12：5779-589，1989)。de Framond描述了用于根特异性表达的一种优选启动子(FEBS，290：103-106，1991；EP 0 452269，1479)，而另一种优选的根特异性启动子是由本发明提供的来自T-1基因的启动子。一种优选的茎特异性启动子描述于专利申请WO93/07278，它驱动玉米trpA基因的表达。

本发明的一个优选实施方案是以根特异性方式生成卤化天然产物硝吡咯菌素的转基因植物。在本发明的一个尤其优选的实施方案中，在根特异性启动子之后表达硝吡咯菌素的生物合成基因，以保护转基因植物免于植物病原体丝核菌(Rhizoctonia)的危害。其它优选实施方案是以创伤可诱导方式或病原体感染可诱导方式生成抗病原体的卤化天然产物的转基因植物。

除了合适启动子的选择，用于在植物中生成卤化天然产物的构建物需要适当的转录终止子附着于异源卤化酶和/或电子转移酶核酸分子的下游。可以获得这样的几种终止子，而且在本领域是知道的(如来自CaMV的tml、来自rbcS的E9)。已知在植物中发挥功能的任何可利用终止子都可用于本发明的内容。

可以将许多其它序列掺入卤化酶和/或电子转移酶核酸分子的表达盒。这些序列包括显示增强表达的序列，诸如内含子序列(如来自Adh1和bronzel)和病毒前导序列(如来自TMV、MCMV、和AMV)。

卤化天然产物在植物中的生成要求编码该途径第一步的卤化天然产物生物合成核酸分子能接触该途径底物。对于所涉及的每种卤化天然产物和途径，这种底物将有可能是不同的，而且它在植物中的细胞定位也可能是不同的。在许多情况下，底物可位于细胞溶胶中；而在其它情况下，它可位于一些亚细胞细胞器中。由于植物中的许多生物合成活性发生于叶绿体中，因此底物常常可能位于叶绿体中，因而本发明的卤化酶和电子转移酶最好靶向适当的细胞器(如叶绿体)。可以使用本领域众所周知的技术来保证编码酶的转基因的亚细胞定位。通常，操作来自已知细胞器靶向基因产物的靶向肽的编码DNA，并融合在所需卤化酶和电子转移酶核酸分子的上游。已知许多可用于叶绿体的这种靶向序列，而且已显示了它们在异源构建物中发挥功能。在本发明的一个优选实施方案中，将硝吡咯菌素生物合成所需要的核酸分子靶向叶绿体，因为该途径底物色氨酸是在叶绿体中合成的。

在有些情形中，生成卤化天然产物所需要的核酸的过度表达可耗尽特定途径底物的细胞利用度，而这对细胞可能具有有害影响。在诸如这种情形中，希望通过编码底物生物合成的酶的核酸分子的过度表达来增加可利用的底物量。在色氨酸(硝吡咯菌素生物合成的底物)的情况下，这可以通过trpA和trpB编码核酸分子的过度表达来实现。生成更多可利用底物的另一种方法是关闭利用特定底物的已知途径(条件是可以这样做而没有有害副作用)。这样，合成的底物被引导至卤化天然产物的生物合成而不通向其它化合物。

适用于植物转化的载体描述于本说明书的其它地方。对于由农杆菌介导的转化，二元载体或携带至少一个T-DNA边界序列的载体是合适的；对于直接转移，任何载体都是合适的，而只包含目的构建物的线性DNA可能是优选的。在直接转移的情况下，可以使用单一DNA种类的转化或共转化(Schocher等人，Biotechnology，4：1093-1096，1986)。对于直接转移和由农杆菌介导的转移二者，通常(但非必需)通过可提供抗生素(卡那霉素、潮霉素、或氨甲蝶呤)或除草剂(草铵膦)抗性的选择标记来进行转化。然而，选择标记的选择对于本发明而言不是决定性的。

转基因植物中卤化天然产物的合成将频繁需要编码卤化天然产物生物合成酶的多种核酸分子的同时过度表达。这可以如下实现，将单个卤化天然产物生物合成核酸分子各个分别转化到不同植物品系中，然后将得到的品系杂交。若各种转化构建物利用不同的选择标记，则将有益于携带多种核酸序列的品系的选择和维持。其中需要的所有卤化天然产物生物合成核酸分子渐增的品系将合成卤化天然产物，而其它品系则不能。这种方法可能适用于杂交农作物(诸如玉米)，其中最终杂种必须是两种亲本间的杂交。具有不同异源核酸分子的不同近交品系的维持在其中特定卤化天然产物途径可产生多种卤化天然产物且每一种都具有效用的情形中也可能是有利的。通过将携带途径中较后步骤的不同候选核酸序列的不同品系用于与携带所有剩余所需核酸分子的品系生成杂种，有可能生成携带可能具有不同效用的不同选定卤化天然产物的不同杂种。

生成携带多种核酸序列的植物品系的候选方法包括用卤化天然产物生物合成核酸分子再次转化早已转化的现有品系(并用不同标记进行选择)，以及携带多种生物合成核酸分子(每一种都处于适当调控控制下，即启动子、终止子等)的单一转化载体的使用。考虑到DNA构建的容易，操作克隆载体以携带多种生物合成核酸分子是优选方法。

另一种优选方法是构建本发明卤化酶与本发明电子转移酶的上述融合蛋白，并在本发明的转基因植物中表达编码这种融合蛋白的核酸。编码电子转移酶的核酸分子可以融合在卤化酶编码核酸分子的5’或3’端。任选的是，可以将接头掺入融合体，将电子转移酶和卤化酶蛋白质结构域分隔开来。在一个优选的实施方案中，融合蛋白包含由(G1y)₆组成的接头。然而，本领域技术人员将认识到，也可以选择其它合适长度和/或组成的接头。

在另一个优选实施方案中，可以通过直接质体转化来实现卤化天然产物在植物中的生成。质体表达(其中通过同源重组将基因插入每个植物细胞中存在的几千个拷贝的环状质体基因组中)利用了庞大拷贝数相对于核表达基因的优势，从而使表达水平可容易的超过总可溶性植物蛋白的10％。在一个优选的实施方案中，将核苷酸序列插入质体靶向载体，并转化到期望植物宿主的质体基因组中。获取对含核苷酸序列的质体基因组而言同质且优选能够高度表达核苷酸序列的植物。

质体转化技术广泛的描述于例如美国专利号5,451,513、5,545,817、5,545,818、和5,877,462、PCT发表号WO95/16783和WO97/32977、和McBride等人，Proc Natl Acad Sci USA，91：7301-7305，1994(都完整收入本文作为参考)。质体转化的基本技术包括将所克隆质体DNA中选择标记侧翼的区域与核苷酸序列一起导入合适的靶组织，如使用biolistics或原生质体转化(如由氯化钙或PEG介导的转化)。1-1.5kb侧翼区(称为打靶序列)有助于与质体基因组的同源重组，由此允许质体基因组中特定区域的取代或修饰。首先，利用赋予壮观霉素和/或链霉素的叶绿体16S rRNA和rps12基因中的点突变作为转化的选择标记(SvabZ、Hajdukiewicz P、和Maliga P，ProcNatl Acad Sci USA，87：8526-8530，1990；Staub JM和Maliga P，Plant Cell，4：39-45，1992)。这些标记间克隆位点的存在允许生成用于导入外源基因的质体打靶载体(Staub JM和Maliga P，EMBO J，12：601-606，1993)。通过用显性选择标记编码壮观霉素解毒酶氨基糖苷-3’-腺苷酰基转移酶的细菌aadA基因取代隐性rRNA或r-蛋白质抗生素抗性基因而获得了转化频率的显著升高(Staub JM和Maliga P，Proc Natl Acad Sci USA，90：913-917，1993)。可用于质体转化的其它选择标记在本领域是知道的，而且属于本发明的范围之内。

在本发明的一个特别优选的实施方案中，硝吡咯菌素的可诱导质体生成是通过fre、prnA、prnB、prnC、和prnD作为噬菌体T7启动子控制下的操纵子的直接叶绿体转化而实现的。可诱导表达是通过与拥有编码T7RNA聚合酶、改造后拥有叶绿体运输肽、且在PR1启动子控制下允许BTH可诱导表达的核构建物的植物杂交而实现的。

通过本发明方法生产卤化天然产物，可于广泛的植物细胞中进行，包括裸子植物、单子叶植物、和双子叶植物的细胞。虽然可以将基因插入属于这些广泛种类的任何植物细胞，但是在(但不限于)下列农作物植物细胞中特别有用：诸如稻、小麦、大麦、黑麦、玉米、马铃薯、胡萝卜、甘薯、甜菜、菜豆、豌豆、菊苣、莴苣、甘蓝、花椰菜、嫩茎花椰菜、芜菁、萝卜、菠菜、芦笋、洋葱、大蒜、茄子、胡椒、芹菜、胡萝卜、南瓜、西葫芦、夏南瓜、黄瓜、苹果、梨、榅桲、甜瓜、李、樱桃、桃、油桃、杏、草莓、葡萄、悬钩子、黑莓、凤梨、鳄梨、番木瓜、芒果、香蕉、大豆、烟草、番茄、高粱、和甘蔗。

在通过在农作物植物或可再生农作物植物的植物细胞培养物中进行直接选择获得了本发明的区域专一的卤化酶和/或电子转移酶的等位基因之后，使用传统育种技术将它转移到商品化品种中，而无需遗传工程改造等位基因并将其转化到植物中。

实施例

下列实施例作为本发明的进一步描述和用于实践本发明的方法。它们并非意欲限制而是提供如何实践本发明的方针。实施例1：PrnA的体外卤化反应A.大肠杆菌黄素还原酶、P2、曲霉硝酸还原酶、和细胞色素b5还原酶对PrnA的激活

通过离子交换层析由包含质粒pPEH14(prnA)(Kirner S等人，JBacteriol，180(7)：1939-1943，1998年4月)的荧光假单胞菌BL915ΔORF1-4纯化PrnA。在没有加入如上文发明背景中所述制备的P2时，纯化的酶具有的活性可忽略。蛋白质浓度或制剂是0.36mmg/ml。

配制测定混合液，包含HEPES缓冲液pH7.5(50mM)、葡萄糖-6-磷酸(14.3mM)、D-Trp(7mM)、NaCl(7mM)。黑曲霉(Aspergillusniger)过氧化氢酶购自Sigma Chemical公司(13U/ml)，牛红血球超氧化物歧化酶(以下称为“SOD”)购自Sigma Chemical公司(5U/ml)，肠膜明串珠菌(Leuconostoc mesenteroides)葡萄糖-6-磷酸脱氢酶购自Sigma(5U/ml)，FAD(7μmolar)。如下文所示使用依赖NADH的混合液或NADPH混合液。依赖NADH的测定混合液是通过向4.5ml上述测定混合液中加入12mg NADH而配制的。依赖NADPH的测定混合液是通过向1ml上述测定混合液中加入3mg NADPH而配制的。

在聚丙烯管中建立下文所述反应1-7，平行3份。将PrnA、所示测定混合液、与电子转移酶混匀后，将样品旋涡震动，然后通过室温倒置而混匀。反应开始20.5小时后通过煮沸2分钟终止反应，然后通过Microcon 10滤膜的超滤(14000xg，30分钟)来制备用于HPLC分析的样品。HPLC分析使用Method Set PrnAl(下文所述)，注射体积是50μl，收集前6分钟的数据。

通过混合5或10μl7-Cl-Trp(1mM)与足够的50mM HEPES pH7.5至终体积200μl来配制标准物。正如真正的D-Trp和7-Cl-Trp的洗脱所示，D-Trp洗脱于约2分钟，7-Cl-Trp洗脱于4.3分钟。通过与标准曲线的比较来测定7-Cl-Trp的量。报告活性是加入电子转移酶之后的7-Cl-Trp净增长。B.PrnA的HPLC分析法7-Cl-Trp的测定

使用装备光电二极管阵列检测器的Waters Alliance HPLC系统。Waters Alliance HPLC配备填充了粒度3微米的C18硅胶的4.6×50mm柱。使用本文称为PrnAl的梯度洗脱方法。流速是1ml/min，收集210-400nm的吸光度数据，分辨率为1.2nm，取样速率1/s。将系统用85∶15的水∶甲醇混合液预先平衡。注入样品后，用6分钟的梯度(由起始条件至40∶60的水∶甲醇混合液)展开柱。然后在6.0-7.0分钟以线性梯度将甲醇浓度提高至100％。将柱用100％甲醇清洗1分钟，然后再次平衡。正如真正的D-Trp和7-Cl-Trp的洗脱所示，D-Trp洗脱于约2分钟，7-Cl-Trp洗脱于4.3分钟。

1.大肠杆菌黄素还原酶对PrnA的激活

以基于Fieschi等人，J Biol Chem，270：303921-30400，1995(完整收入本文作为参考)的方案的方法，通过硫酸铵沉淀随后通过疏水层析，纯化大肠杆菌黄素还原酶(以下缩写为Fre)。黄素还原酶纯化在细菌匀浆和硫酸铵分级分离过程中遵循Fieschi的流程。此时沉淀黄素还原酶活性。通过离心收集沉淀，重悬于25mM Tris/Cl pH7.5、0.5M KCl、10％甘油。然后遵循Fontcave等人，J Biol Chem，262(25)：12325-12331，1987年9月5日(完整收入本文作为参考)的方法直至完成。收集的纯化Fre样品的蛋白质浓度是21μg/ml。每个反应含20μl PrnA、160μl上述NADH混合液、和20μl Fre。得到的净产物形成是21.46±1.02nmol7-Cl-Trp。

2.P2对PrnA的激活

P2是来自荧光假单胞菌的电子转移酶蛋白质制剂，通过离子交换层析纯化，且描述于上文发明背景。它不具有PrnA活性。P2样品的蛋白质浓度是4.8mg/ml。每个反应含20μl PrnA、160μl NADH混合液、和20μl P2。得到的净产物形成是12.50±2.02nmol 7-Cl-Trp。

3.菠菜硝酸还原酶对PrnA的激活

菠菜硝酸还原酶(以下称为“SNIR”)的重组FAD结构域(18.6μmolar)。每个反应含20μl PrnA、160μl NADH混合液、和20μl SNIR。得到的净产物形成是0.048±0.73nmol 7-Cl-Trp。

4.曲霉硝酸还原酶对PrnA的激活

来自曲霉的硝酸还原酶(10U/ml)购自ICN。每个反应含20μlPrnA、160μl NADH混合液、和20μl硝酸还原酶。得到的净产物形成是1.49±0.18nmol 7-Cl-Trp。

5.大鼠NADH-细胞色素-b5还原酶对PrnA的激活

获得了大鼠肝细胞色素b5还原酶的重组可溶性结构域(11.7μmolar)。每个反应含20μl PrnA、160μl NADH混合液、和20μl细胞色素b5还原酶。净产物形成是0.31±0.11nmol 7-Cl-Trp。

6.心肌黄酶巯基还原酶对PrnA的激活

心肌黄酶巯基还原酶(200U/ml)购自United StatesBiochemicals。每个反应含20μl PrnA、160μl NADH混合液、和20μl心肌黄酶。净产物形成是2.24±0.04nmol 7-Cl-Trp。

7.兔NADPH-cyt-P450还原酶对PrnA的激活

兔肝NADPH-cyt-P450还原酶(0.069mg/ml)购自Sigma Chemical公司。每个反应含20μl PrnA、160μl NADPH混合液、和20μl细胞色素P450还原酶。得到的净产物形成是3.35±0.23nmol 7-Cl-Trp。实施例2：大肠杆菌黄素还原酶；菠菜铁氧还蛋白NADP还原酶、菠菜铁氧还蛋白还原酶+菠菜铁氧还蛋白；和费氏发光杆菌NAD(P)H：FMN还原酶对PrnA的激活

下文实例1-4中使用了下列成份：PrnA(如上文实施例1所述)(0.36mg/ml)，包含HEPES(100mM)、葡萄糖-6-磷酸、二钠盐(50mM)、D-Trp(5mM)、NaCl(5mM)的测定混合液，黑曲霉过氧化氢酶(39U/ml)、牛红血球超氧化物歧化酶(15U/ml)、肠膜明串珠菌葡萄糖-6-磷酸脱氢酶(10U/ml)、NADH(3mg/ml)、NADPH(3mg/ml)。

每次测定包含测定混合液、NADH(用于包含Fre和NAD(P)H：FMN还原酶的样品)或NADPH(用于包含FNR或FNR和Fd的样品)、PrnA、和指定电子转移酶。将阴性对照样品平行保温；它们取代PrnA的缓冲液。通过在100μl测定混合液、50μl NADH、20μl PrnA、和50μl缓冲液中稀释0、1、2、或5μl 7-Cl-Trp标准品(1mM)配制定量标准物；在添加PrnA之前将管加热至100℃，然后继续加热2分钟。其它处理与酶促反应平行。将所有样品于室温混合2小时。终止反应并如上文实施例1中所述处理样品，包括使用实施例1中所述的HPLC分析方法PrnAl。1.与Fre一起时的PrnA活性：如上所述混合100μl测定混合液、50μlNADH、20μl PrnA、和50μl Fre(0.84μg/ml)。生成的净7-Cl-Trp是8.44nmol。

2.与铁氧还蛋白NADP还原酶一起时的PrnA活性：如上所述混合100μl测定混合液、50μl NADH、20μl PrnA、和50μl FNR(4.1μmol)。生成的净7-Cl-Trp是4.22nmol。

3.与铁氧还蛋白NADP还原酶和铁氧还蛋白一起时的PrnA活性：如上所述混合100μl测定混合液、50μl NADH、20μl PrnA、和50μl FNR(4.1μmol)和Fd(7μmol)。生成的净7-Cl-Trp是9.15nmol。

4.与费氏发光杆菌NAD(P)H：FMN还原酶一起时的PrnA活性：如上所述混合100μl测定混合液、50μl NADH、20μl PrnA、和50μl购自Roche的NAD(P)H：FMN还原酶(4U/ml)。生成的净7-Cl-Trp是0.11nmol。实施例3：PrnC的体外卤化反应

对Fre、即铁氧还蛋白NADP还原酶、铁氧还蛋白、和NADPH：FMN还原酶测试了激活荧光假单胞菌PrnC的能力，所述PrnC如下所述耗尽了内源电子转移酶(P2)。PrnC催化单脱氯氨基硝吡咯菌素(MDA)氯化而生成氨基硝吡咯菌素(APRN)。

制备下列材料用于下文所述测定法。缓冲液：100mM Tris/Cl、1mMEDTA pH7.5。由如Kirner等人，1998(完整收入本文作为参考)所述表达PrnA和PrnB的荧光假单胞菌培养物来制备74.2mM单脱氯氨基硝吡咯菌素(MDA)。测定混合液在缓冲液中包含FAD(5μM)和MDA(742μM)。将NADH以6mg/ml的浓度溶于缓冲液，或者将NADPH以6mg/ml的浓度溶于缓冲液。提取物#1是在缓冲液中包含PrnC和上文实施例1中所述内源电子转移酶P2的粗制提取物。PrnC表达于删除染色体prn操纵子但包含在质粒pPEH-PrnC(Kirner等人，1998)上在tac启动子之后编码PrnC的核酸序列(SEQ ID NO：4)的荧光假单胞菌(pPEH/prnC/134Δprn)中。在该系统中，tac启动子引起PrnC的组成性表达。提取物#2，通过混合提取物#1与阴离子交换树脂然后通过离心除去树脂来纯化提取物#1中的PrnC。为了耗尽PrnC的荧光假单胞菌P2活性，使用100mM Tris/Cl缓冲液。

如下进行下文所述测定法：将提取物#2与指定的电子转移酶、测定混合液、和指定的NADH或NADPH混合。通过平行样品(其中将提取物#1与测定混合液和NADH混合)测定在除去P2活性之前PrnC的天然活性。通过倒置过夜混合所有样品，然后通过加入10μl KOH(6M)终止反应，随后用乙酸乙酯(1ml)萃取。将0.6ml有机可溶层转移到另一个管中，并通过真空离心除去溶剂。将残余物重新溶于200μl 60∶40的H₂O∶CH₃CN+100μl CH₃CN。将样品滤过0.2μm尼龙滤器以除去微粒物。通过下文所述PrnC_Iso方法分析样品。分析并整合290nm吸光度层析图。PrnC活性表述成APRN峰面积占APRN和MDA峰面积总和的比率的100倍。假定220nm的消光系数相等，那么计算得到的比率等同于MDA通过卤化转变成APRN的净百分比。HPLC分析方法PrnC Iso

所用HPLC设备是装备光电二极管阵列检测器的Waters AllianceHPLC系统，并配备填充了粒度3微米的C18硅石的4.6×50mm柱。HPLC方法是等度洗脱法，流速1.5ml/min，溶剂是58∶42的水∶乙腈。收集210-400nm的吸光度数据，分辨率为2.4nm，取样速率5/s。注射前将系统预先平衡最少6分钟。注射体积是50μl，数据收集时间是6分钟，随后是注入下一个样品前的又一个6分钟等度洗脱。在这种方法中，MDA洗脱于2.16分钟，氨基硝吡咯菌素(APRN)洗脱于3.05分钟。蛋白质浓度

蛋白质浓度是通过BCA方法使用卖主(Pierce)描述的标准流程测定的。

1.与大肠杆菌Fre一起时的PrnC活性：将50μl提取物#2与20μl大肠杆菌黄素还原酶(21μg/ml)、100μl测定混合液、和50μl NADH混合；继续混合过夜，随后如上所述分析样品。观察到的活性是51.8％的MDA转变成APRN。

2.与菠菜铁氧还蛋白NADP还原酶一起时的PrnC活性：将50μl提取物#2与20μl菠菜铁氧还蛋白：NADP还原酶(20.7μmol)、100μl测定混合液、和50μl NADH混合；继续混合过夜，随后如上所述分析样品。观察到的活性是1.8％的MDA转变成APRN。

3.与菠菜铁氧还蛋白NADP还原酶和菠菜铁氧还蛋白一起时的PrnC活性：将50μl提取物#2与20μl菠菜铁氧还蛋白：NADP还原酶(20.7μmol)和菠菜铁氧还蛋白(Fd)(35μmol)、100μl测定混合液、和50μl NADH混合；继续混合过夜，随后如上所述分析样品。观察到的活性是2.5％的MDA转变成APRN。

4.与NADPH：FMN还原酶一起时的PrnC活性：将50μl提取物#2与20μl来自费氏发光杆菌的NAD(P)H：FMN还原酶(10U/ml)、100μl测定混合液、和50μl NADH混合；继续混合过夜，随后如上所述分析样品。观察到的活性是4.0％的MDA转变成APRN。

5.通过平行样品测定除去P2活性前的PrnC天然活性：将50μl提取物#1与100μl测定混合液和50μl NADH混合；继续混合过夜，随后如上所述分析样品。观察到的活性是7.8％的MDA转变成APRN。实施例4：大肠杆菌中的卤化A.编码大肠杆菌黄素还原酶的核酸的克隆

使用引物5’GCGCGAATTCATGACAACCTTAAGCTGTAAAGTGACC(SEQ IDNO：32)和3’GCGCCTGCAGTCAGATAAATGCAAACGCATCGCC(SEO ID NO：33)，由大肠杆菌菌株XL-1 Blue(Stratagen)PCR扩增编码大肠杆菌黄素还原酶的核酸序列(以下称为“fre”)。然后将核酸分子Topo克隆(Invitrogen)，转化到大肠杆菌XL-1 Blue(Stratagen)中，并通过在添加氨苄青霉素的Luria肉汤(LB)固体培养基上涂板来选择转化体。选择几个菌落，并通过DNA测序进行分析，以确认它们的身份。在这些菌落中，发现有一个拥有的核酸分子包含与报导的fre(Genbank编号23486)相同的序列。另一个拥有的核酸序列在第247位核苷酸处包含突变，导致一个带电荷氨基酸替代Lys83→Glu83(该突变体以下称为fre^E83)。B.fre和fre ^E83 突变体的可诱导过度表达

fre和fr^E83突变体的可诱导过度表达是如下实现的，将野生型fre和替代突变体fre^E83克隆到pKK223-3(Pharmacia)的EcoRl/Pst1位点中，置于tac启动子的控制之下。转化后，将包含fre-pKK223-3、fre^E83-pKK223-3、和空载体pKK223-3的细胞在6ml LB+amp中于37℃培养过夜，然后在30ml LB+amp 5mM IPTG(Fisher)中稀释达5小时，并通过离心进行收获。将细菌沉淀悬浮于4.5ml 50mM HEPES pH7.5、1mM EDTA+0.5ml 5mg/ml溶菌酶于25℃达15分钟，进行两轮冻融。在冰上超声处理1分钟后，将匀浆物以16000xg离心20分钟。然后将上清液用50mM HEPES pH7.5、1mM EDTA系列稀释，产生相对浓度范围1-1/10000的8份样品。

对每份细菌提取物和稀释后的细菌提取物如下测定PrnA活性的互补：向180μl由7.2μg PrnA(0.36μg/μl)、3.3μmol FAD、3.3mMNaCl、1.67mM D-Trp、0.67mg/ml NADH、和50mM HEPES pH7.5组成的溶液中加入20μl提取物。将反应液于30℃保温2小时。通过加热至100℃达2分钟来终止反应，随后以21000xg离心5分钟。然后将上清液滤过10kDa截留离心超滤膜。然后使用上文实施例1关于PrnA1所述的分析方法，通过反相HPLC测定滤出液，将D-Trp向D-7-氯色氨酸的转变量化。加入来自包含空载体pKK223-3的大肠杆菌的提取物，产生0.34pmol7-Cl-Trp每分钟每微克所加入提取物中的蛋白质。加入来自包含fre^E83-pKK223-3的大肠杆菌的提取物，产生1.14pmol 7-Cl-Trp每分钟每微克所加入提取物中的蛋白质。加入来自包含fre-pKK223-3的大肠杆菌的提取物，产生301pmol 7-Cl-Trp每分钟每微克所加入提取物中的蛋白质。

如下进行黄素还原酶测定法：向990μl含0.1mg/ml NADPH和9.5μmol核黄素的50mM HEPES pH7.5中加入10μl细菌提取物。若活性过高而不能观察反应的前20％，则将细菌提取物在50mM HEPES缓冲液中1/10稀释，然后如上测定。然后通过分光光度法于340nm监测NADH向NADP的转变。加入来自包含空载体pKK223-3的大肠杆菌的提取物，具有0.055nmol黄素还原酶活性每分钟每微克所加入提取物中的蛋白质。加入来自包含fre^E83-pKK223-3的大肠杆菌的提取物，具有0.157nmol黄素还原酶活性每分钟每微克所加入提取物中的蛋白质。加入来自包含fre-pKK223-3的大肠杆菌的提取物，具有25.4nmol黄素还原酶活性每分钟每微克所加入提取物中的蛋白质。这证明黄素还原酶活性的变化与卤化活性成比例。C.fre和Drn操纵子在大肠杆菌中的共表达

将pKK223-3(Pharmacia)中的完整荧光假单胞菌硝吡咯菌素操纵子(美国专利号5,723,759中叙述的5.8X/N，上文将其收入本文作为参考)转化到大肠杆菌中。将fre序列(包括Taq启动子由pKK223-3转移到包含相容复制起点p15A的pACYC184(NEB)的四环素标记中。然后将该质粒与5.8X/N进行共转化，并通过氨苄青霉素和氯霉素选择这两种载体的存在。还生成只包含fre的宿主菌株作为阴性对照。将每种株系在60ml培养基中于37℃培养、200rpm振摇培养48小时。由每种培养物取5ml用于质粒分析，确认一种或两种质粒的存在。取15ml培养物用于蛋白质和活性分析。将剩余的40ml培养物用2倍体积的乙酸乙酯萃取2次。将乙酸乙酯级分在真空中浓缩至干燥，然后转移至50μl 6∶4的H₂O/CH₃CN和60μl MeOH中。然后取20μl得到的溶液，通过下文所述HPLC方法Prn_BCD分析氨基硝吡咯菌素和硝吡咯菌素。D.HPLC分析方法Prn BCD MDA、APRN、和PRN的测定

HPLC设备是装备光电二极管阵列检测器的Waters Alliance HPLC系统，并配备填充了粒度3微米的C18硅石的4.6×50mm柱。HPLC方法是梯度洗脱法，流速1.2ml/min。收集210-400nm的吸光度数据，分辨率为2.4nm，取样速率5/s。将系统用65∶35的水∶乙腈预先平衡。注入样品后，由起始条件至40∶60的水∶乙腈的线性梯度展开柱。氨基硝吡咯菌素洗脱于5.0分钟，硝吡咯菌素洗脱于6.6分钟。通过整合于诊断波长测量的层析图中的峰面积来测量氨基硝吡咯菌素和硝吡咯菌素二者。对于氨基硝吡咯菌素，使用300nm吸光度。对于硝吡咯菌素，使用250nm吸光度。

结果显示，与只表达硝吡咯菌素操纵子的细胞相比，在共表达包含fre和硝吡咯菌素操纵子的质粒的大肠杆菌细胞中，氨基硝吡咯菌素积累的增加超过10倍，硝吡咯菌素积累的增加超过4倍。实施例5：在转基因植物中表达然后在体外纯化并测定的PrnA的卤化

用硝吡咯菌素操纵子的4种核酸分子(编码PrnA、PrnB、PrnC、和PrnD，每一种都处于下文实施例6中所述泛素启动子之后)转化(通过由农杆菌介导的转化方法)拟南芥(Arabidopsis thaliana)哥伦比亚(Columbia)生态型。

由包含来自荧光假单胞菌BL915的粘粒克隆的pCIB169(美国专利号5,723,759)(Genbank编号U74493)PCR扩增各种硝吡咯菌素核酸分子(包括适当的限制性位点)。将核酸分子亚克隆并测序。由拟南芥基因组PCR扩增泛素3启动子和第一个内含子(Caiis J等人，Journalof Biological Chemistry，265：12486-12493，1990和Norris SR等人，Plant Molecular Biology，21：895-906，1993)以包含5’KpnI和3’BamHI位点。将泛素启动子、nos终止子(D epicker等人，Journal of Molecular and Applied Genetics，1：561-573，1982)、和每一种硝吡咯菌素核酸分子(参阅美国专利号5,723,759和5,955,348，都完整收入本文作为参考)克隆到修饰后的pSort1载体中。在PrnA、B、和D的每一种中紧挨着起始ATG的5’加入Kozak共有-3ACC核苷酸三联体。PrnC核酸分子不被修饰。将PrnB中的起始GTG密码子变成ATG密码子。这些修饰产生一组载体pPEH7826、27、28、和29(分别是PrnA、B、C、和D)。所有其它序列与野生型序列是共有的。通过将来自pCIB7826(PrnA)的KpnI片段插入pCIB7828(PrnC)的KpnI位点生成pCIB7830而构建了PrnAC双联体。通过将来自pCIB7827(PrnB)的KpnI片段插入pCIB7829(PrnD)的KpnI位点生成pCIB7831而构建了PrnBD双联体。通过将来自pCIB7830的NotI片段插入pCIB7831的NotI位点生成pCIB7832而构建了4种核酸分子操纵子。将来自pCIB7832的XbaI片段插入二元载体pCIB200生成转化载体pCIB7819。将最终载体电穿孔到农杆菌中并用于拟南芥转化。

通过Bechtold N等人的方法转化拟南芥(Bechtold N等人，C.R.Acad.Sci.Paris，Life Science，316：1194-1199，1993)。

培养2种转化品系(3和12)和非转化对照品系并收获叶片(1g)。将叶片在液氮中冻结，在研钵中磨成粉，并用6ml Ls缓冲液(50mM HEPESpH7.5、5mM NaCl)提取。以5000xg离心15分钟以沉淀碎片后，将上清液滤过玻璃绒以除去残余微粒。

通过混合提取物(3ml)与亲和基质来如下免疫纯化PrnA。通过于室温混合100μl兔抗山羊IgG-琼脂糖(购自Sigma)与50μl山羊抗PrnA血清来制备亲和基质。然后将琼脂糖珠用1ml LS缓冲液清洗3次。将3ml样品与亲和基质混匀后，通过LS缓冲液清洗由珠除去未吸收的物质。通过混合5μl如实施例1中所述由荧光假单胞菌纯化的PrnA(0.36μg/μl)与3ml LS、然后与植物提取物样品平行处理来制备阳性对照样品。

向包含免疫纯化的PrnA的琼脂糖珠中加入200μl测定缓冲液(50mM HEPES pH7.5、5mM D-Trp、5mM NaCl、5μM FAD、5mM葡萄糖-6-磷酸+2mg/ml NADH+6.25U/ml葡萄糖-6-磷酸脱氢酶+44U/ml过氧化氢酶+30U/ml SOD)和20μl如实施例1中所述由大肠杆菌纯化的Fre(21μg/ml)，除了品系3和12各有一个样品不加。然后通过倒置将样品混合过夜，滤过Microcon-10滤器，并通过HPLC方法PrnAl(描述于上文实施例1)分析产物。样品的注射体积是50μl。发现了下列7-Cl-Trp水平：阳性对照(向非转化植物提取物中加入外源PrnA)185pmol，品系3加Fre(两份单独的样品)83pmol和113pmol，品系3不加Fre 0pmol，品系12加Fre(两份单独的样品)120pmol和64pmol，品系12不加Fre 0pmol，非转化对照0pmol。

这些数据证明转化植物表达活性形式的PrnA，其活性依赖Fre的加入。实施例6：转基因植物中的卤化A.通过将编码大肠杆菌黄素还原酶的核酸转化到包含编码PrnA、PrnB、 PrnC、和PrnD的核酸的植物中而在转基因植物中进行卤化化合物的胞质生产

将SEQ ID NO：6的核酸序列(编码来自大肠杆菌的黄素还原酶)克隆到载体pNOV019中，从而将核酸分子置于拟南芥泛素10(UB1O)启动子(Callis J等人，Journal of Biological Chemistry，265：12486-12493，1990和Norris SR等人，Plant Molecular Biology，21：895-906，1993)的控制之下，并用来自农杆菌的胭脂碱合酶终止子(Depicker等人，Journal of Molecular and Applied Genetics，1：561-573，1982)终止。

尝试了由pNOV507(Kan^R)、508(Chlor^R)、和509(Amp^R)组成的二元载体系统。与fre核酸分子和除草剂抗性选择标记一起用于构建硝吡咯菌素操纵子的三种载体如下。pNov507(Kan^R)是用在启动子、终止子、硝吡咯菌素、fre、或选择标记核酸分子任一中未发现的唯一限制性位点选择取代左边界与右边界之间的多接头后的二元载体。其它两种载体pNOV508(Chlor^R)和pNOV509(Amp^R)是包含一部分pNOV507多接头以及添加用于克隆硝吡咯菌素操纵子的分开核酸分子盒的额外限制性位点的载体。这两种载体是构建或装配载体。将fre盒与来自pNOV111的UB3选择标记盒一起在pNOV509中连接。然后将这种双重盒转移到二元载体pNOV507中，产生最终载体pNOV510。将该载体电穿孔到农杆菌中。通过Bechtold N等人的方法(Bechtold N等人，C.R.Acad.Sci.Paris，Life Sciences，316：1194-1199，1993)转化如实施例5中所述用PrnA、PrnB、PrnC、和PrnD核酸分子转化的拟南芥品系。

植物和各种构建物中的所有硝吡咯菌素途径核酸分子都是由拟南芥泛素3(UB3)启动子(Callis J等人，Journal of Biology Chemistry，265：12486-12493，1990和Norris sR等人，Plant Molecular Biology，21：895-906，1993)驱动的，并用来自农杆菌的nos终止子终止。通过上文所述Bechtold等人的方法的农杆菌渗透，用pNOV510转化包含prnA、prnB、prnC、和prnD的纯合拟南芥品系和野生型哥伦比亚品系。收集种子，干燥，并种到土里。通过对幼苗喷洒0.025％选择剂3次达8天来鉴定转化植株。然后通过HPLC或气相层析-质谱法对植物确认硝吡咯菌素的存在情况和水平。同样/或者，可如上所述对植物提取物确认prnA和/或prnC活性。B.通过大肠杆菌黄素还原酶和硝吡咯菌素操纵子的其转化而在转基因植物中进行卤化化合物的胞质生产

将列于美国专利号5,723,759(上文将其收入本文作为参考)的编码硝吡咯菌素途径PrnA、prnB、prnC、和prnD的核酸序列，和编码大肠杆菌黄素还原酶的SEQ ID NO：7在单个t-DNA构建物中导入植物。每种硝吡咯菌素生物合成核酸分子的表达都是由UB3启动子驱动的，而fre SEQ ID NO：7是由UB10驱动的。所有5种核酸分子符合或改变后精确符合Kozak翻译起始序列，即在第-3位拥有A。所有核酸分子都是由nos终止子终止的。在一个优选的实施方案中，最终载体是通过在包含：右边界-UB3-prnA-nos-UB3-prnC-nos-UB3-prnB-nos-UB3-prnD-nos-UB10-fre-nos-UB3-选择标记-nos-左边界的二元载体中装配UB3启动子-胞质溶胶靶向硝吡咯菌素生物合成基因和UB10-fre盒而构建的。该载体称为pNOV523(SEQ ID NO：34)。

在另一个实施方案中，胞质溶胶靶向硝吡咯菌素操纵子是通过将来自pCIB7830的NotI A/B双联体片段连接到C/D双联体载体pCIB7831中而生成的。将操纵子作为XbaI盒转移到pNOV507中。将来自pCIB10253的NotI A/B双联体连接到C/D双联体载体pCIB10254中。同样将该构建物作为XbaI盒转移到pNOV507中。

最终载体包含：右边界-UB3-prnA-nos-UB3-prnB-nos-UB3-prnC-nos-UB3-prnD-nos-UB10-fre-nos-UB3-选择标记-nos-左边界。

然后将该载体电穿孔到农杆菌中，并通过农杆菌渗透(Bechtold N等人，C.R.Acad.Sci.Paris，Life sciences，316：1194-1199，1993)转化拟南芥(哥伦比亚品系)。收集种子，干燥，并种到土里。通过对幼苗喷洒0.025％选择剂3次达8天来鉴定转化植株。然后通过HPLC或气相层析-质谱法对植物确认硝吡咯菌素的存在情况和水平。C.卤化化合物在转基因植物质体中的生产

改造编码prnA和prnB的核酸构建物以表达叶绿体运输肽(Wong EY等人，Plant Molecular Bilogy，20：81-93，1992，并一起置于允许卡那霉素选择的载体上。转化方案在先前的实施例中有详述(Bechtold N等人，C.R.Acad.Sci.Paris，Life Sciences，316：1194-1199，1993)。质体靶向硝吡咯菌素核酸分子载体的构建

由pCIB10230、31、32、33(分别是PrnA、B、C、D)PCR扩增各种硝吡咯菌素途径核酸分子，以包含5’NheI和3’BamHI限制性位点。将核酸分子Topo克隆到pCR2.1(Invitrogen，US Office Calsbad，CA 92008，产品目录编号K2030-01)中，用于序列确认。由pFL61中的拟南芥cDNA文库(Wong等人，Plant Mol Biol，20：81-93，1992)PCR复制RuBPcase小亚基肽运输序列。将该核酸序列连接到pPEH31、30、29、和28(分别是PrnA、B、C、和D)中每种硝吡咯菌素核酸分子的5’端。这组pPEH载体包含UB3-内含子-nos盒。合成额外成熟肽作为互补寡聚物，退火，并连接到运输肽硝吡咯菌素核酸分子构建物的5’部分。这产生了质体靶向硝吡咯菌素核酸分子载体pCIB10249、50、51、和52(分别是PrnA、B、C、和D)。通过将来自pCIB10249的含PrnA的KpnI核酸分子盒连接到pCIB10250中而构建了PrnAB双联体pCIB10253。通过将来自pCIB10251的含PrnC的xhoI核酸分子盒连接而pCIB10252中而构建了PrnCD双联体pCIB10254。将每种双联体作为XbaI盒转移到二元载体pCIB200(Kan^R)中。用于质体靶向载体的选择标记方案是：对于fre载体为右边界-UB10-clp-fre-nos-UB3-选择标记-nos-左边界；对于PrnA/B载体为右边界-UB3-prnA-nos-UB3-prnB-nos-UB3-选择标记-nos-左边界；对于PrnC/D载体为右边界-UB3-prnC-nos-UB3-prnD-nos-UB3-选择标记-nos-左边界。

然后将质体靶向prnAB-fre载体电穿孔到农杆菌中，并通过上文所述Bechtold N等人的方法转化哥伦比亚拟南芥(Arabadopsiscolumbia)。收集种子，干燥，并种到土里。通过对幼苗喷洒选择剂来鉴定转化植株，并自交至纯合。

相似的，如上所述将质体靶向prnCD/选择标记载体导入拟南芥，并将得到的转化体自交至纯合。

然后将包含质体靶向prnAB-fre/选择标记构建物的纯合转化植株与纯合质体靶向prnCD/选择标记植株杂交。在另一个实施方案中，将质体靶向prnCD盒转移到包含UB10-质体靶向fre盒的二元载体中。该载体称为pNOV524(SEQ ID N0：35)。然后将载体pNOV524电穿孔到拟南芥中，并通过上文所述Bechtold N等人的方法转化哥伦比亚拟南芥。用pNOV524转化野生型拟南芥和先前用pCIB10253(包含质体靶向prnA/B)转化的拟南芥。收集种子，干燥，并种到土里。通过对幼苗喷洒选择剂来鉴定转化植株，并自交至纯合。

对得到的子代施用适当的选择剂。抵抗这种选择剂方案的植物拥有半合子状态的fre和prnA、B、C、D。本领域技术人员将领会这种方法可能的许多变异。在所有情况下，硝吡咯菌素表达是通过HPLC或气相层析量化的。实施例7：在供给MDA的转基因植物叶中表达的PrnC的卤化

在草铵膦选择后，对用pNOV524构建物(包含质体靶向prnC、prnD、和fre)转化的哥伦比亚品系进行Western印迹分析。另外，在草铵膦选择后，对用pCIB10253(包含质体靶向prnA和prnB)转化随后用pNOV524转化的拟南芥品系进行Western印迹分析。将来自每种品系的单一叶片在1x蛋白质样品缓冲液中匀浆，煮沸，并通过10％SDS-PAGE分离。随后，分别用针对prnC和prnD产生的抗体对膜探查prnC和prnD蛋白质的存在情况。鉴定到了prnC和prnD表达阳性的拟南芥品系。如下对相同蛋白质提取物再次检验黄素还原酶(fre)蛋白质的存在：使用10-20％梯度凝胶，随后用针对fre的抗体对膜进行探查。鉴定到了fre表达阳性的品系。

由质体靶向prnC、prnD、和fre表达阳性的拟南芥品系以及prnC和prnD阴性的拟南芥品系(通过Western印迹鉴定)采集叶片。在浸没在5mM MES pH5.7、400mM甘露醇缓冲液中时用MDA真空渗透叶片，并于室温在黑暗中放置过夜。随后，用乙酸乙酯萃取缓冲液，浓缩至干燥，并在HPLC上进行分析(如上文实施例4中所述)。

来自prnC、prnD、和fre阳性植株的叶片将MDA转变成APRN(大约5％)。在3小时的保温时间里检测到转变。此外，大约30％的APRN转变成硝吡咯菌素。另外，阴性对照即来自不表达prnC或prnD的植株的叶片不显示MDA向APRN或硝吡咯菌素的转变。

将上文引用的参考发表物都完整收入本文作为参考。

序列表<110>Novartis AG<120>用于卤化反应的组合物和方法<130>Case S-31082A<140><141><150>US 60/228801<151>1999-12-15<150>US 60/219343<151>2000-01-03<160>35<170>PatentIn Ver.2.0<210>1<211>16<212>PRT<213>人工序列<220><223>人工序列的描述：氨基酸共有结构域<400>1Xaa Ala Ala Trp Xaa Ala Ala Trp Xaa Ala Ala Ile Pro Xaa Ala Ala1 5 10 15<210>2<211>1617<212>DNA<213>荧光假单胞菌(Pseudomonas fluorescens)<220><221>CDS<222>(1)..(1617)<400>2atg aac aag ccg atc aag aat atc gtc atc gtg ggc ggc ggt act gcg 48Met Asn Lys pro Ile Lys Asn Ile Val Ile Val Gly Gly Gly Thr Ala1 5 10 15ggc tgg atg gcc gcc tcg tac ctc gtc cgg gcc ctc caa cag cag gcg 96Gly Trp Met Ala Ala Ser Tyr Leu Val Arg Ala Leu Gln Gln Gln Ala

20 25 30aac att acg ctc atc gaa tct gcg gcg atc cct cgg atc ggc gtg ggc 144Asn Ile Thr Leu Ile Glu Ser Ala Ala Ile Pro Arg Ile Gly Val Gly

35 40 45gaa gcg acc atc cca agt ttg cag aag gtg ttc ttc gat ttc ctc ggg 192Glu Ala Thr Ile Pro Ser Leu Gln Lys Val Phe Phe Asp Phe Leu Gly

50 55 60ata ccg gag cgg gaa tgg atg ccc caa gtg aac ggc gcg ttc aag gcc 240Ile Pro Glu Arg Glu Trp Met Pro Gln Val Asn Gly Ala Phe Lys Ala65 70 75 80gcg atc aag ttc gtg aat tgg aga aag tct ccc gac ccc tcg cgc gac 288Ala Ile Lys Phe Val Asn Trp Arg Lys Ser Pro Asp Pro Ser Arg Asp

85 90 95gat cac ttc tac cat ttg ttc ggc aac gtg ccg aac tgc gac ggc gtg 336Asp His Phe Tyr His Leu Phe Gly Asn Val Pro Asn Cys Asp Gly Val

100 105 110ccg ctt acc cac tac tgg ctg cgc aag cgc gaa cag ggc ttc cag cag 384Pro Leu Thr His Tyr Trp Leu Arg Lys Arg Glu Gln Gly Phe Gln Gln

115 120 125ccg atg gag tac gcg tgc tac ccg cag ccc ggg gca ctc gac ggc aag 432Pro Met Glu Tyr Ala Cys Tyr Pro Gln Pro Gly Ala Leu Asp Gly Lys

130 135 140ctg gca ccg tgc ctg tcc gac ggc acc cgc cag atg tcc cac gcg tgg 480Leu Ala Pro Cys Leu Ser Asp Gly Thr Arg Gln Met Ser His Ala Trp145 150 155 160cac ttc gac gcg cac ctg gtg gcc gac ttc ttg aag cgc tgg gcc gtc 528His Phe Asp Ala His Leu Val Ala Asp Phe Leu Lys Arg Trp Ala Val

165 170 175gag cgc ggg gtg aac cgc gtg gtc gat gag gtg gtg gac gtt cgc ctg 576Glu Arg Gly Val Asn Arg Val Val Asp Glu Val Val Asp Val Arg Leu

180 185 190aac aac cgc ggc tac atc tcc aac ctg ctc acc aag gag ggg cgg acg 624Asn Asn Arg Gly Tyr Ile Ser Asn Leu Leu Thr Lys Glu Gly Arg Thr

195 200 205ctg gag gcg gac ctg ttc atc gac tgc tcc ggc atg cgg ggg ctc ctg 672Leu Glu Ala Asp Leu Phe Ile Asp Cys Ser Gly Met Arg Gly Leu Leu

210 215 220atc aat cag gcg ctg aag gaa ccc ttc atc gac atg tcc gac tac ctg 720Ile Asn Gln Ala Leu Lys Glu Pro Phe Ile Asp Met Ser Asp Tyr Leu225 230 235 240ctg tgc gac agc gcg gtc gcc agc gcc gtg ccc aac gac gac gcg cgc 768Leu Cys Asp Ser Ala Val Ala Ser Ala Val Pro Asn Asp Asp Ala Arg

245 250 255gat ggg gtc gag ccg tac acc tcc tcg atc gcc atg aac tcg gga tgg 816Asp Gly Val Glu Pro Tyr Thr Ser Ser Ile Ala Met Asn Ser Gly Trp

260 265 270acc tgg aag att ccg atg ctg ggc cgg ttc ggc agc ggc tac gtc ttc 864Thr Trp Lys Ile Pro Met Leu Gly Arg Phe Gly Ser Gly Tyr Val Phe

275 280 285tcg agc cat ttc acc tcg cgc gac cag gcc acc gcc gac ttc ctc aaa 912Ser Ser His Phe Thr Ser Arg Asp Gln Ala Thr Ala Asp Phe Leu Lys

290 295 300ctc tgg ggc ctc tcg gac aat cag ccg ctc aac cag atc aag ttc cgg 960Leu Trp Gly Leu Ser Asp Asn Gln Pro Leu Asn Gln Ile Lys Phe Arg305 310 315 320gtc ggg cgc aac aag cgg gcg tgg gtc aac aac tgc gtc tcg atc ggg 1008Val Gly Arg Asn Lys Arg Ala Trp Val Asn Asn Cys Val Ser Ile Gly

325 330 335ctg tcg tcg tgc ttt ctg gag ccc ctg gaa tcg acg ggg atc tac ttc 1056Leu Ser Ser Cys Phe Leu Glu Pro Leu Glu Ser Thr Gly Ile Tyr Phe

340 345 350atc tac gcg gcg ctt tac cag ctc gtg aag cac ttc ccc gac acc tcg 1104Ile Tyr Ala Ala Leu Tyr Gln Leu Val Lys His Phe Pro Asp Thr Ser

355 360 365ttc gac ccg cgg ctg agc gac gct ttc aac gcc gag atc gtc cac atg 1152Phe Asp Pro Arg Leu Ser Asp Ala Phe Asn Ala Glu Ile Val His Met

370 375 380ttc gac gac tgc cgg gat ttc gtc caa gcg cac tat ttc acc acg tcg 1200Phe Asp Asp Cys Arg Asp Phe Val Gln Ala His Tyr Phe Thr Thr Ser385 390 395 400cgc gat gac acg ccg ttc tgg ctc gcg aac cgg cac gac ctg cgg ctc 1248Arg Asp Asp Thr Pro Phe Trp Leu Ala Asn Arg His Asp Leu Arg Leu

405 410 415tcg gac gcc atc aaa gag aag gtt cag cgc tac aag gcg ggg ctg ccg 1296Ser Asp Ala Ile Lys Glu Lys Val Gln Arg Tyr Lys Ala Gly Leu Pro

420 425 430ctg acc acc acg tcg ttc gac gat tcc acg tac tac gag acc ttc gac 1344Leu Thr Thr Thr Ser Phe Asp Asp Ser Thr Tyr Tyr Glu Thr Phe Asp

435 440 445tac gaa ttc aag aat ttc tgg ttg aac ggc aac tac tac tgc atc ttt 1392Tyr Glu phe Lys Asn Phe Trp Leu Asn Gly Asn Tyr Tyr Cys I1e Phe

450 455 460gcc ggc ttg ggc atg ctg ccc gac cgg tcg ctg ccg ctg ttg cag cac 1440Ala Gly Leu Gly Met Leu Pro Asp Arg Ser Leu Pro Leu Leu Gln His465 470 475 480cga ccg gag tcg atc gag aaa gcc gag gcg atg ttc gcc agc atc cgg 1488Arg Pro Glu Ser Ile Glu Lys Ala Glu Ala Met Phe Ala Ser Ile Arg

485 490 495cgc gag gcc gag cgt ctg cgc acc agc ctg ccg aca aac tac gac tac 1536Arg Glu Ala Glu Arg Leu Arg Thr Ser Leu Pro Thr Asn Tyr Asp Tyr

500 505 510ctg cgg tcg ctg cgt gac ggc gac gcg ggg ctg tcg cgc ggc cag cgt 1584Leu Arg Ser Leu Arg Asp Gly Asp Ala Gly Leu Ser Arg Gly Gln Arg

515 520 525ggg ccg aag ctc gca gcg cag gaa agc ctg tag 1617Gly Pro Lys Leu Ala Ala Gln Glu Ser Leu

530 535<210>3<211>538<212>PRT<213>荧光假单胞菌<400>3Met Asn Lys Pro Ile Lys Asn Ile Val Ile Val Gly Gly Gly Thr Ala1 5 10 15Gly Trp Met Ala Ala Ser Tyr Leu Val Arg Ala Leu Gln Gln Gln Ala

20 25 30Asn Ile Thr Leu Ile Glu Ser Ala Ala Ile Pro Arg Ile Gly Val Gly

35 40 45Glu Ala Thr Ile Pro Ser Leu Gln Lys Val Phe Phe Asp Phe Leu Gly

50 55 60Ile Pro Glu Arg Glu Trp Met Pro Gln Val Asn Gly Ala Phe Lys Ala65 70 75 80Ala Ile Lys Phe Val Asn Trp Arg Lys Ser Pro Asp Pro Ser Arg Asp

85 90 95Asp His Phe Tyr His Leu Phe Gly Asn Val Pro Asn Cys Asp Gly Val

100 105 110Pro Leu Thr His Tyr Trp Leu Arg Lys Arg Glu Gln Gly Phe Gln Gln

115 120 125Pro Met Glu Tyr Ala Cys Tyr Pro Gln Pro Gly Ala Leu Asp Gly Lys

130 135 140Leu Ala Pro Cys Leu Ser Asp Gly Thr Arg Gln Met Ser His Ala Trp145 150 155 160His Phe Asp Ala His Leu Val Ala Asp Phe Leu Lys Arg Trp Als Val

165 170 175Glu Arg Gly Val Asn Arg Val Val Asp Glu Val Val Asp Val Arg Leu

180 185 190Asn Asn Arg Gly Tyr Ile Ser Asn Leu Leu Thr Lys Glu Gly Arg Thr

195 200 205Leu Glu Ala Asp Leu Phe Ile Asp Cys Ser Gly Met Arg Gly Leu Leu

210 215 220Ile Asn Gln Ala Leu Lys Glu Pro Phe Ile Asp Met Ser Asp Tyr Leu225 230 235 240Leu Cys Asp Ser Ala Val Ala Ser Ala Val Pro Asn Asp Asp Ala Arg

245 250 255Asp Gly Val Glu Pro Tyr Thr Ser Ser Ile Ala Met Asn Ser Gly Trp

260 265 270Thr Trp Lys Ile Pro Met Leu Gly Arg Phe Gly Ser Gly Tyr Val Phe

275 280 285Ser Ser His Phe Thr Ser Arg Asp Gln Ala Thr Ala Asp Phe Leu Lys

290 295 300Leu Trp Gly Leu Ser Asp Asn Gln Pro Leu Asn Gln Ile Lys Phe Arg305 310 315 320Val Gly Arg Asn Lys Arg Ala Trp Val Asn Asn Cys Val Ser Ile Gly

325 330 335Leu Ser Ser Cys Phe Leu Glu Pro Leu Glu Ser Thr Gly Ile Tyr Phe

340 345 350Ile Tyr Ala Ala Leu Tyr Gln Leu Val Lys His Phe Pro Asp Thr Ser

355 360 365Phe Asp Pro Arg Leu Ser Asp Ala Phe Asn Ala Glu Ile Val His Met

370 375 380Phe Asp Asp Cys Arg Asp Phe Val Gln Ala His Tyr Phe Thr Thr Ser385 390 395 400Arg Asp Asp Thr Pro Phe Trp Leu Ala Asn Arg His Asp Leu Arg Leu

405 410 415Ser Asp Ala Ile Lys Glu Lys Val Gln Arg Tyr Lys Ala Gly Leu Pro

420 425 430Leu Thr Thr Thr Ser Phe Asp Asp Ser Thr Tyr Tyr Glu Thr Phe Asp

435 440 445Tyr Glu Phe Lys Asn Phe Trp Leu Asn Gly Asn Tyr Tyr Cys Ile Phe

450 455 460Ala Gly Leu Gly Met Leu Pro Asp Arg Ser Leu Pro Leu Leu Gln His465 470 475 480Arg Pro Glu Ser Ile Glu Lys Ala Glu Ala Met Phe Ala Ser Ile Arg

485 490 495Arg Glu Ala Glu Arg Leu Arg Thr Ser Leu Pro Thr Asn Tyr Asp Tyr

500 505 510Leu Arg Ser Leu Arg Asp Gly Asp Ala Gly Leu Ser Arg Gly Gln Arg

515 520 525Gly Pro Lys Leu Ala Ala Gln Glu Ser Leu

530 535<210>4<21l>1704<212>DNA<213>荧光假单胞菌<220><221>CDS<222>(1)..(1704)<400>4atg act cag aag agc ccc gcg aac gaa cac gat agc aat cac ttc gac 48Met Thr Gln Lys Ser Pro Ala Asn Glu His Asp Ser Asn His Phe Asp1 5 10 15gta atc atc ctc ggc tcg ggc atg tcc ggc acc cag atg ggg gcc atc 96Val Ile Ile Leu Gly Ser Gly Met Ser Gly Thr Gln Met Gly Ala Ile

20 25 30ttg gcc aaa caa cag ttt cgc gtg ctg atc atc gag gag tcg tcg cac 144Leu Ala Lys Gln Gln Phe Arg Val Leu Ile Ile Glu Glu Ser Ser His

35 40 45ccg cgg ttc acg atc ggc gaa tcg tcg atc ccc gag acg tct ctt atg 192Pro Arg Phe Thr Ile Gly Glu Ser Ser Ile Pro Glu Thr Ser Leu Met

50 55 60aac cgc atc atc gct gat cgc tac ggc att ccg gag ctc gac cac atc 240Asn Arg Ile Ile Ala Asp Arg Tyr Gly Ile Pro Glu Leu Asp His Ile65 70 75 80acg tcg ttt tat tcg acg caa cgt tac gtc gcg tcg agc acg ggc att 288Thr Ser Phe Tyr Ser Thr Gln Arg Tyr Val Ala Ser Ser Thr Gly Ile

85 90 95aag cgc aac ttc ggc ttc gtg ttc cac aag ccc ggc cag gag cac gac 336Lys Arg Asn Phe Gly Phe Val Phe His Lys Pro Gly Gln Glu His Asp

100 105 110ccg aag gag ttc acc cag tgc gtc att ccc gag ctg ccg tgg ggg ccg 384Pro Lys Glu Phe Thr Gln Cys Val Ile Pro Glu Leu Pro Trp Gly Pro

115 120 125gag agc cat tat tac cgg caa gac gtc gac gcc tac ttg ttg caa gcc 432Glu Ser His Tyr Tyr Arg Gln Asp Val Asp Ala Tyr Leu Leu Gln Ala

130 135 140gcc att aaa tac ggc tgc aag gtc cac cag aaa act acc gtg acc gaa 480Ala Ile Lys Tyr Gly Cys Lys Val His Gln Lys Thr Thr Val Thr Glu145 150 155 160tac cac gcc gat aaa gac ggc gtc gcg gtg acc acc gcc cag ggc gaa 528Tyr His Ala Asp Lys Asp Gly Val Ala Val Thr Thr Ala Gln Gly Glu

165 170 175cgg ttc acc ggc cgg tac atg atc gac tgc gga gga cct cgc gcg ccg 576Arg Phe Thr Gly Arg Tyr Met Ile Asp Cys Gly Gly Pro Arg Ala Pro

180 185 190ctc gcg acc aag ttc aag ctc cgc gaa gaa ccg tgt cgc ttc aag acg 624Leu Ala Thr Lys Phe Lys Leu Arg Glu Glu Pro Cys Arg Phe Lys Thr

195 200 205cac tcg cgc agc ctc tac acg cac atg ctc ggg gtc aag ccg ttc gac 672His Ser Arg Ser Leu Tyr Thr His Met Leu Gly Val Lys Pro Phe Asp

210 215 220gac atc ttc aag gtc aag ggg cag cgc tgg cgc tgg cac gag ggg acc 720Asp Ile Phe Lys Val Lys Gly Gln Arg Trp Arg Trp His Glu Gly Thr225 230 235 240ttg cac cac atg ttc gag ggc ggc tgg ctc tgg gtg att ccg ttc aac 768Leu His His Met Phe Glu Gly Gly Trp Leu Trp Val Ile Pro Phe Asn

245 250 255aac cac ccg cgg tcg acc aac aac ctg gtg agc gtc ggc ctg cag ctc 816Asn His Pro Arg Ser Thr Asn Asn Leu Val Ser Val Gly Leu Gln Leu

260 265 270gac ccg cgt gtc tac ccg aaa acc gac atc tcc gca cag cag gaa ttc 864Asp Pro Arg Val Tyr Pro Lys Thr Asp Ile Ser Ala Gln Gln Glu Phe

275 280 285gat gag ttc ctc gcg cgg ttc ccg agc atc ggg gct cag ttc cgg gac 912Asp Glu Phe Leu Ala Arg Phe Pro Ser Ile Gly Ala Gln Phe Arg Asp

290 295 300gcc gtg ccg gtg cgc gac tgg gtc aag acc gac cgc ctg caa ttc tcg 960Ala Val Pro Val Arg Asp Trp Val Lys Thr Asp Arg Leu Gln Phe Ser305 310 315 320tcg aac gcc tgc gtc ggc gac cgc tac tgc ctg atg ctg cac gcg aac 1008Ser Asn Ala Cys Val Gly Asp Arg Tyr Cys Leu Met Leu His Ala Asn

325 330 335ggc ttc atc gac ccg ctc ttc tcc cgg ggg ctg gaa aac acc gcg gtg 1056Gly Phe Ile Asp Pro Leu Phe Ser Arg Gly Leu Glu Asn Thr Ala Val

340 345 350acc atc cac gcg ctc gcg gcg cgc ctc atc aag gcg ctg cgc gac gac 1104Thr Ile His Ala Leu Ala Ala Arg Leu Ile Lys Ala Leu Arg Asp Asp

355 360 365gac ttc tcc ccc gag cgc ttc gag tac atc gag cgc ctg cag caa aag 1152Asp Phe Ser Pro Glu Arg Phe Glu Tyr Ile Glu Arg Leu Gln Gln Lys

370 375 380ctt ttg gac cac aac gac gac ttc gtc agc tgc tgc tac acg gcg ttc 1200Leu Leu Asp His Asn Asp Asp Phe Val Ser Cys Cys Tyr Thr Ala Phe385 390 395 400tcg gac ttc cgc cta tgg gac gcg ttc cac agg ctg tgg gcg gtc ggc 1248Ser Asp Phe Arg Leu Trp Asp Ala Phe His Arg Leu Trp Ala Val Gly

405 410 415acc atc ctc ggg cag ttc cgg ctc gtg cag gcc cac gcg agg ttc cgc 1296Thr Ile Leu Gly Gln Phe Arg Leu Val Gln Ala His Ala Arg Phe Arg

420 425 430gcg tcg cgc aac gag ggc gac ctc gat cac ctc gac aac gac cct ccg 1344Ala Ser Arg Asn Glu Gly Asp Leu Asp His Leu Asp Asn Asp Pro Pro

435 440 445tat ctc gga tac ctg tgc gcg gac atg gag gag tac tac cag ttg ttc 1392Tyr Leu Gly Tyr Leu Cys Ala Asp Met Glu Glu Tyr Tyr Gln Leu Phe

450 455 460aac gac gcc aaa gcc gag gtc gag gcc gtg agt gcc ggg cgc aag ccg 1440Asn Asp Ala Lys Ala Glu Val Glu Ala Val Ser Ala Gly Arg Lys Pro465 470 475 480gcc gat gag gcc gcg gcg cgg att cac gcc ctc att gac gaa cga gac 1488Ala Asp Glu Ala Ala Ala Arg Ile His Ala Leu Ile Asp Glu Arg Asp

485 490 495ttc gcc aag ccg atg ttc ggc ttc ggg tac tgc atc acc ggg gac aag 1536Phe Ala Lys Pro Met Phe Gly Phe Gly Tyr Cys Ile Thr Gly Asp Lys

500 505 510ccg cag ctc aac aac tcg aag tac agc ctg ctg ccg gcg atg cgg ctg 1584Pro Gln Leu Asn Asn Ser Lys Tyr Ser Leu Leu Pro Ala Met Arg Leu

515 520 525atg tac tgg acg caa acc cgc gcg ccg gca gag gtg aaa aag tac ttc 1632Met Tyr Trp Thr G1n Thr Arg Ala Pro Ala Glu Val Lys Lys Tyr Phe

530 535 540gac tac aac ccg atg ttc gcg ctg ctc aag gcg tac atc acg acc cgc 1680Asp Tyr Asn Pro Met Phe Ala Leu Leu Lys Ala Tyr Ile Thr Thr Arg545 550 555 560atc ggc ctg gcg ctg aag aag tag 1704Ile Gly Leu Ala Leu Lys Lys

565<210>5<211>567<212>PRT<213>荧光假单胞菌<400>5Met Thr Gln Lys Ser Pro Ala Asn Glu His Asp Ser Asn His Phe Asp1 5 10 15Val Ile Ile Leu Gly Ser Gly Met Ser Gly Thr Gln Met Gly Ala Ile

20 25 30Leu Ala Lys Gln Gln Phe Arg Val Leu Ile Ile Glu Glu Ser Ser His

35 40 45Pro Arg Phe Thr Ile Gly Glu Ser Ser Ile Pro Glu Thr Ser Leu Met

50 55 60Asn Arg Ile Ile Ala Asp Arg Tyr Gly Ile Pro Glu Leu Asp His Ile65 70 75 80Thr Ser Phe Tyr Ser Thr Gln Arg Tyr Val Ala Ser Ser Thr Gly Ile

85 90 95Lys Arg Asn Phe Gly Phe Val Phe His Lys Pro Gly Gln Glu His Asp

100 105 110Pro Lys Glu Phe Thr Gln Cys Val Ile Pro Glu Leu Pro Trp Gly Pro

115 120 125Glu Ser His Tyr Tyr Arg Gln Asp Val Asp Ala Tyr Leu Leu Gln Ala

130 135 140Ala Ile Lys Tyr Gly Cys Lys Val His Gln Lys Thr Thr Val Thr Glu145 150 155 160Tyr His Ala Asp Lys Asp Gly Val Ala Val Thr Thr Ala Gln Gly Glu

165 170 175Arg Phe Thr Gly Arg Tyr Met Ile Asp Cys Gly Gly Pro Arg Ala Pro

180 185 190Leu Ala Thr Lys Phe Lys Leu Arg Glu Glu Pro Cys Arg Phe Lys Thr

195 200 205His Ser Arg Ser Leu Tyr Thr His Met Leu Gly Val Lys Pro Phe Asp

210 215 220Asp Ile Phe Lys Val Lys Gly Gln Arg Trp Arg Trp His Glu Gly Thr225 230 235 240Leu His His Met Phe Glu Gly Gly Trp Leu Trp Val Ile Pro Phe Asn

245 250 255Ash His Pro Arg Ser Thr Asn Asn Leu Val Ser Val Gly Leu Gln Leu

260 265 270Asp Pro Arg Val Tyr Pro Lys Thr Asp Ile Ser Ala Gln Gln Glu Phe

275 280 285Asp Glu Phe Leu Ala Arg Phe Pro Ser Ile Gly Ala Gln Phe Arg Asp

290 295 300Ala Val Pro Val Arg Asp Trp Val Lys Thr Asp Arg Leu Gln Phe Ser305 310 315 320Ser Asn Ala Cys Val Gly Asp Arg Tyr Cys Leu Met Leu His Ala Asn

325 330 335Gly Phe Ile Asp Pro Leu Phe Ser Arg Gly Leu Glu Asn Thr Ala Val

340 345 350Thr Ile His Ala Leu Ala Ala Arg Leu Ile Lys Ala Leu Arg Asp Asp

355 360 365Asp Phe Ser Pro Glu Arg Phe Glu Tyr Ile Glu Arg Leu Gln Gln Lys

370 375 380Leu Leu Asp His Asn Asp Asp Phe Val Ser Cys Cys Tyr Thr Ala Phe385 390 395 400Ser Asp Phe Arg Leu Trp Asp Ala Phe His Arg Leu Trp Ala Val Gly

405 410 415Thr Ile Leu Gly Gln Phe Arg Leu Val Gln Ala His Ala Arg Phe Arg

420 425 430Ala Ser Arg Asn Glu Gly Asp Leu Asp His Leu Asp Asn Asp Pro Pro

435 440 445Tyr Leu Gly Tyr Leu Cys Ala Asp Met Glu Glu Tyr Tyr Gln Leu Phe

450 455 460Asn Asp Ala Lys Ala Glu Val Glu Ala Val Ser Ala Gly Arg Lys Pro465 470 475 480Ala Asp Glu Ala Ala Ala Arg Ile His Ala Leu Ile Asp Glu Arg Asp

485 490 495Phe Ala Lys Pro Met Phe Gly Phe Gly Tyr Cys Ile Thr Gly Asp Lys

500 505 510Pro Gln Leu Asn Asn Ser Lys Tyr Ser Leu Leu Pro Ala Met Arg Leu

515 520 525Met Tyr Trp Thr Gln Thr Arg Ala Pro Ala Glu Val Lys Lys Tyr Phe

530 535 540Asp Tyr Asn Pro Met Phe Ala Leu Leu Lys Ala Tyr Ile Thr Thr Arg545 550 555 560Ile Gly Leu Ala Leu Lys Lys

565<210>6<211>1350<212>DNA<213>荧光假单胞菌<220><221>CDS<222>(1)..(1350)<400>6atg agc gat cat gat tat gat gta gtg att atc ggt ggc ggg ccg gcg 48Met Ser Asp His Asp Tyr Asp Val Val Ile Ile Gly Gly Gly Pro Ala1 5 10 15ggt tcg acc atg gcc tcc tac ctg gca aaa gcc ggt gtc aaa tgc gcg 96Gly Ser Thr Met Ala Ser Tyr Leu Ala Lys Ala Gly Val Lys Cys Ala

20 25 30gtg ttc gaa aaa gaa ctg ttc gag cgc gag cat gtt ggc gag tcg ctg 144Val Phe Glu Lys Glu Leu Phe Glu Arg Glu His Val Gly Glu Ser Leu

35 40 45gta ccg gcc acc act ccg gtg ctg ctg gaa atc ggg gtg atg gaa aag 192Val Pro Ala Thr Thr Pro Val Leu Leu Glu Ile Gly Val Met Glu Lys

50 55 60atc gag aaa gcc aac ttc ccg aag aag ttc ggc gct gcc tgg acc tcg 240Ile Glu Lys Ala Asn Phe Pro Lys Lys Phe Gly Ala Ala Trp Thr Ser65 70 75 80gca gat tcc ggc ccc gaa gac aag atg ggc ttc cag ggg ctg gac cac 288Ala Asp Ser Gly Pro Glu Asp Lys Met Gly Phe Gln Gly Leu Asp His

85 90 95gat ttc cgt tcg gcg gaa atc ctc ttc aac gag cgc aag cag gaa ggg 336Asp Phe Arg Ser Ala Glu Ile Leu Phe Asn Glu Arg Lys Gln Glu Gly

100 105 110gtc gat cgc gac ttc acg ttc cac gtc gac cgc ggc aag ttc gac cgc 384Val Asp Arg Asp Phe Thr Phe His Val Asp Arg Gly Lys Phe Asp Arg

115 120 125att ctt ctg gag cac gca ggt tcg ctg ggg gcc aag gtc ttc cag ggc 432Ile Leu Leu Glu His Ala Gly Ser Leu Gly Ala Lys Val Phe Gln Gly

130 135 140gtg gag atc gct gac gtc gag ttt ctc agc ccg ggc aat gtc att gtc 480Val Glu Ile Ala Asp Val Glu Phe Leu Ser Pro Gly Asn Val Ile Val145 150 155 160aat gcc aag ctg ggc aag cgc agc gtg gag atc aag gcc aag atg gtg 528Ash Ala Lys Leu Gly Lys Arg Ser Val Glu Ile Lys Ala Lys Met Val

165 170 175gtg gat gcc agc ggt cgc aac gtg ctg ctg ggc cgc cgg ctg ggc ttg 576Val Asp Ala Ser Gly Arg Asn Val Leu Leu Gly Arg Arg Leu Gly Leu

180 185 190cga gaa aag gac ccg gtc ttc aac cag ttc gcg att cac tcc tgg ttc 624Arg Glu Lys Asp Pro Val Phe Asn Gln Phe Ala Ile His Ser Trp Phe

195 200 205gac aac ttc gac cgc aag tcg gcg acg caa agc ccg gac aag gtc gac 672Asp Asn Phe Asp Arg Lys Ser Ala Thr Gln Ser Pro Asp Lys Val Asp

210 215 220tac atc ttc att cac ttc ctg ccg atg acc aat acc tgg gtc tgg cag 720Tyr Ile Phe Ile His Phe Leu Pro Met Thr Asn Thr Trp Val Trp Gln225 230 235 240atc ccg atc acc gaa acc att acc agc gtg ggc gtg gtt acg cag aag 768Ile Pro Ile Thr Glu Thr Ile Thr Ser Val Gly Val Val Thr Gln Lys

245 250 255cag aac tac acc aac tcc gac ctc acc tat gaa gag ttc ttc tgg gaa 816Gln Asn Tyr Thr Asn Ser Asp Leu Thr Tyr Glu Glu Phe Phe Trp Glu

260 265 270gcg gtg aag acc cgg gaa aac ctg cat gac gcg ctg aag gca tcg gag 864Ala Val Lys Thr Arg Glu Asn Leu His Asp Ala Leu Lys Ala Ser Glu

275 280 285cag gtc cgc ccg ttc aag aaa gag gcg gac tac agc tac ggc atg aaa 912Gln Val Arg Pro Phe Lys Lys Glu Ala Asp Tyr Ser Tyr Gly Met Lys

290 295 300gaa gtc tgt ggc gac agc ttc gtg ctg atc ggc gat gcc gca cgg ttc 960Glu Val Cys Gly Asp Ser Phe Val Leu Ile Gly Asp Ala Ala Arg Phe305 310 315 320gtc gac ccg atc ttc tcc agc ggc gtc agc gtt gca ctc aac agt gcg 1008Val Asp Pro Ile Phe Ser Ser Gly Val Ser Val Ala Leu Asn Ser Ala

325 330 335cgc atc gcc agc ggc gac atc atc gag gcg gtg aag aac aac gac ttt 1056Arg Ile Ala Ser Gly Asp Ile Ile Glu Ala Val Lys Asn Asn Asp Phe

340 345 350agc aag tcc agt ttc act cac tac gaa ggc atg atc agg aat ggc atc 1104Ser Lys Ser Ser Phe Thr His Tyr Glu Gly Met Ile Arg Asn Gly Ile

355 360 365aag aac tgg tat gag ttc atc acg ctc tat tac cgc ctg aac atc ctc 1152Lys Ash Trp Tyr Glu Phe Ile Thr Leu Tyr Tyr Arg Leu Asn Ile Leu

370 375 380ttc acc gcg ttc gtt caa gac cca cgc tac cgc ctg gac atc ctg caa 1200Phe Thr Ala Phe Val Gln Asp Pro Arg Tyr Arg Leu Asp Ile Leu Gln385 390 395 400ttg ctg caa ggg gac gtc tac agc ggc aag cgc ctg gaa gtg ctg gac 1248Leu Leu Gln Gly Asp Val Tyr Ser Gly Lys Arg Leu Glu Val Leu Asp

405 410 415aag atg cgc gaa atc atc gct gcg gtt gaa agc gac ccg gaa cac ctc 1296Lys Met Arg Glu Ile Ile Ala Ala Val Glu Ser Asp Pro Glu His Leu

420 425 430tgg cac aag tac ctg ggc gac atg cag gtt cct acc gcc aaa ccc gcg 1344Trp His Lys Tyr Leu Gly Asp Met Gln Val Pro Thr Ala Lys Pro Ala

435 440 445ttc taa 1350Phe

450<210>7<211>449<212>PRT<213>荧光假单胞菌<400>7Met Ser Asp His Asp Tyr Asp Val Val Ile Ile Gly Gly Gly Pro Ala1 5 10 15Gly Ser Thr Met Ala Ser Tyr Leu Ala Lys Ala Gly Val Lys Cys Ala

20 25 30Val Phe Glu Lys Glu Leu Phe Glu Arg Glu His Val Gly Glu Ser Leu

35 40 45Val Pro Ala Thr Thr Pro Val Leu Leu Glu Ile Gly Val Met Glu Lys

50 55 60Ile Glu Lys Ala Asn Phe Pro Lys Lys Phe Gly Ala Ala Trp Thr Ser65 70 75 80Ala Asp Ser Gly Pro Glu Asp Lys Met Gly Phe Gln Gly Leu Asp His

85 90 95Asp Phe Arg Ser Ala Glu Ile Leu Phe Asn Glu Arg Lys Gln Glu Gly

100 105 110Val Asp Arg Asp Phe Thr Phe His Val Asp Arg Gly Lys Phe Asp Arg

115 120 125Ile Leu Leu Glu His Ala Gly Ser Leu Gly Ala Lys Val Phe Gln Gly

130 135 140Val Glu Ile Ala Asp Val Glu Phe Leu Ser Pro Gly Asn Val Ile Val145 150 155 160Asn Ala Lys Leu Gly Lys Arg Ser Val Glu Ile Lys Ala Lys Met Val

165 170 175Val Asp Ala Ser Gly Arg Asn Val Leu Leu Gly Arg Arg Leu Gly Leu

180 185 190Arg Glu Lys Asp Pro Val Phe Asn Gln Phe Ala Ile His Ser Trp Phe

195 200 205Asp Asn Phe Asp Arg Lys Ser Ala Thr Gln Ser Pro Asp Lys Val Asp

210 215 220Tyr Ile Phe Ile His Phe Leu Pro Met Thr Asn Thr Trp Val Trp Gln225 230 235 240Ile Pro Ile Thr Glu Thr Ile Thr Ser Val Gly Val Val Thr Gln Lys

245 250 255Gln Asn Tyr Thr Asn Ser Asp Leu Thr Tyr Glu Glu Phe Phe Trp Glu

260 265 270Ala Val Lys Thr Arg Glu Asn Leu His Asp Ala Leu Lys Ala Ser Glu

275 280 285Gln Val Arg Pro Phe Lys Lys Glu Ala Asp Tyr Ser Tyr Gly Met Lys

290 295 300Glu Val Cys Gly Asp Ser Phe Val Leu Ile Gly Asp Ala Ala Arg Phe305 310 315 320Val Asp Pro Ile Phe Ser Ser Gly Val Ser Val Ala Leu Asn Ser Ala

325 330 335Arg Ile Ala Ser Gly Asp Ile Ile Glu Ala Val Lys Asn Asn Asp Phe

340 345 350Ser Lys Ser Ser Phe Thr His Tyr Glu Gly Met Ile Arg Ash Gly Ile

355 360 365Lys Asn Trp Tyr Glu Phe Ile Thr Leu Tyr Tyr Arg Leu Asn Ile Leu

370 375 380Phe Thr Ala Phe Val Gln Asp Pro Arg Tyr Arg Leu Asp Ile Leu Gln385 390 395 400Leu Leu Gln Gly Asp Val Tyr Ser Gly Lys Arg Leu Glu Val Leu Asp

405 410 415Lys Met Arg Glu Ile Ile Ala Ala Val Glu Ser Asp Pro Glu His Leu

420 425 430Trp His Lys Tyr Leu Gly Asp Met Gln Val Pro Thr Ala Lys Pro Ala

435 440 445Phe<210>8<211>1641<212>DNA<213>荧光假单胞菌<220><221>CDS<222>(1)..(1641)<400>8gtg gtt atg aac gat gtg cag tct ggc aag gcg cca gag cat tac gac 48Val Val Met Asn Asp Val Gln Ser Gly Lys Ala Pro Glu His Tyr Asp1 5 10 15att ctc ttg gcg ggc aac agc atc agc gtg atc atg ctc gcc gcc tgc 96Ile Leu Leu Ala Gly Asn Ser Ile Ser Val Ile Met Leu Ala Als Cys

20 25 30ctg gcc cgg aac aag gtc cgg gtc ggt ttg ttg cgc aac cgg cag atg 144Leu Ala Arg Asn Lys Val Arg Val Gly Leu Leu Arg Asn Arg Gln Met

35 40 45ccc ccc gac ctt acc ggt gag gcg acg att ccc tat acc tcg atg att 192Pro Pro Asp Leu Thr Gly Glu Ala Thr Ile Pro Tyr Thr Ser Met Ile

50 55 60ttc gag ctg att gcc gac cgc tat ggc gtg ccg gaa ata aag aat atc 240Phe Glu Leu Ile Ala Asp Arg Tyr Gly Val Pro Glu Ile Lys Asn Ile65 70 75 80gcc cgc acc cgg gat atc cag cag aag gtg atg ccg tct tcc ggg gtc 288Ala Arg Thr Arg Asp Ile Gln Gln Lys Val Met Pro Ser Ser Gly Val

85 90 95aag aag aac ctc ggg ttc atc tat cac cag cgc agc cgg gcg gtg gac 336Lys Lys Asn Leu Gly Phe Ile Tyr His Gln Arg Ser Arg Ala Val Asp

100 105 110ctg ggc cag gcg ctg caa ttc aac gtg ccc tcc gag cat ggc gag aac 384Leu Gly Gln Ala Leu Gln Phe Asn Val Pro Ser Glu His Gly Glu Asn

115 120 125cat ctg ttc agg ccc gat atc gat gcc tat ctg ctg gcg gcg gcc atc 432His Leu Phe Arg Pro Asp Ile Asp Ala Tyr Leu Leu Ala Ala Ala Ile

130 135 140ggt tat ggc gcg cag ctg gtg gag atc gat aac agc cca gag gtg ctg 480Gly Tyr Gly Ala Gln Leu Val Glu Ile Asp Asn Ser Pro Glu Val Leu145 150 155 160gtc gag gac agc ggg gtc aag gta gct acg gca ctg ggg cgc tgg gtc 528Val Glu Asp Ser Gly Val Lys Val Ala Thr Ala Leu Gly Arg Trp Val

165 170 175act gcc gat ttc atg gtt gat ggc agc cag ggc ggc cag gtg ctg gcg 576Thr Ala Asp Phe Met Val Asp Gly Ser Gln Gly Gly Gln Val Leu Ala

180 185 190cgg cag gct ggc ctg gtc agc cag gct tcg acg cag aag acc cgg acc 624Arg Gln Ala Gly Leu Val Ser Gln Ala Ser Thr Gln Lys Thr Arg Thr

195 200 205ctg gaa ttc tcc act cat atg ctc ggg gtg gtg ccg ttc gat gag tgc 672Leu Glu Phe Ser Thr His Met Leu Gly Val Val Pro Phe Asp Glu Cys

210 215 220gtg cag ggc gat ttt ccc ggc cag tgg cat ggc ggc act ctg cat cac 720Val Gln Gly Asp Phe Pro Gly Gln Trp His Gly Gly Thr Leu His His225 230 235 240gtg ttc gat ggg ggc tgg gtg ggg gtc atc ccg ttc aac aac cat cag 768Val Phe Asp Gly Gly Trp Val Gly Val Ile Pro Phe Asn Asn His Gln

245 250 255cac tcg cgc aac cct ttg gtc agc gtg ctg gtt tca ctg cgt gag gac 816His Ser Arg Asn Pro Leu Val Ser Val Leu Val Ser Leu Arg Glu Asp

260 265 270ctc tgc ccg agc atg gac ggc gac cag gtc ctg gcc ggc ctg atc gag 864Leu Cys Pro Ser Met Asp Gly Asp Gln Val Leu Ala Gly Leu Ile Glu

275 280 285ctg tac ccc ggc ctg ggg cgg cac ctg tcc ggc gcc cgg cgg gtg cgc 912Leu Tyr Pro Gly Leu Gly Arg His Leu Ser Gly Ala Arg Arg Val Arg

290 295 300gag tgg gtg ctg cgc cag ccg ccc cgg cag gtc tat cgc acg gcg ctc 960Glu Trp Val Leu Arg Gln Pro Pro Arg Gln Val Tyr Arg Thr Ala Leu305 310 315 320gaa cgc cgc tgc ctg atg ttc gac gag ggc gcc gcg agc aac gat ctg 1008Glu Arg Arg Cys Leu Met Phe Asp Glu Gly Ala Ala Ser Asn Asp Leu

325 330 335ttg ttc tcg cgc aag ctg tcc aat gct gcg gaa ctg gtt ctg gcc ctg 1056Leu Phe Ser Arg Lys Leu Ser Asn Ala Ala Glu Leu Val Leu Ala Leu

340 345 350gcg cac cgg ctg atc aag gcg gcg cac agc ggt gac tac cgc agc ccg 1104Ala His Arg Leu Ile Lys Ala Ala His Ser Gly Asp Tyr Arg Ser Pro

355 360 365gcc ctg aat gat ttt gtc ctg acc cag gac agc atc atc agc ttg agt 1152Ala Leu Asn Asp Phe Val Leu Thr Gln Asp Ser Ile Ile Ser Leu Ser

370 375 380gac cgg atc gcc tta gcg gct tat gtg tcg ttt cgc gac ccc gag ttg 1200Asp Arg Ile Ala Leu Ala Ala Tyr Val Ser Phe Arg Asp Pro Glu Leu385 390 395 400tgg aat gcc ttc gcc cgt gtc tgg ctg ctg cag tcg att gcc gcc acc 1248Trp Asn Ala Phe Ala Arg Val Trp Leu Leu Gln Ser Ile Ala Ala Thr

405 410 415atc acc gcg cgc aag atc aac gat gcc ttt gcc aag gac ctg gac ccg 1296Ile Thr Ala Arg Lys Ile Asn Asp Ala Phe Ala Lys Asp Leu Asp Pro

420 425 430cga gtg ttc gat gaa atc gac cag ctc gca gag gac ggt ttc tgg atg 1344Arg Val Phe Asp Glu Ile Asp Gln Leu Ala Glu Asp Gly Phe Trp Met

435 440 445cct ctg tat cgg ggg tac aag gat att ctc aac act acg ctg ggc ctt 1392Pro Leu Tyr Arg Gly Tyr Lys Asp Ile Leu Asn Thr Thr Leu Gly Leu

450 455 460tgt gat gac gtc aaa agc gcc aag gtc tct gct gcg cac gcg gcg agc 1440Cys Asp Asp Val Lys Ser Ala Lys Val Ser Ala Ala His Ala Ala Ser465 470 475 480agc atc ttt gcg gag ctt gcc aac gcc agt ttt gtt ccg cct att ttt 1488Ser Ile Phe Ala Glu Leu Ala Asn Ala Ser Phe Val Pro Pro Ile Phe

485 490 495gat ttt gct aat cct cac gct cgt gtc tat caa ctg acc acc ttg aga 1536Asp Phe Ala Asn Pro His Ala Arg Val Tyr Gln Leu Thr Thr Leu Arg

500 505 510aag ctc aag gcg ctc tgg tgg ggc ctg atg caa gtg ccc tca gag gtc 1584Lys Leu Lys Ala Leu Trp Trp Gly Leu Met Gln Val Pro Ser Glu Val

515 520 525gga cgg ctg att ttc tat cga tcc ttc aga aaa cct tcc ctg cgc aag 1632Gly Arg Leu Ile Phe Tyr Arg Ser Phe Arg Lys Pro Ser Leu Arg Lys

530 535 540gag agt tga 1641Glu Ser545<210>9<211>546<212>PRT<213>荧光假单胞菌<400>9Val Val Met Asn Asp Val Gln Ser Gly Lys Ala Pro Glu His Tyr Asp1 5 10 15Ile Leu Leu Ala Gly Asn Ser Ile Ser Val Ile Met Leu Ala Ala Cys

20 25 30Leu Ala Arg Asn Lys Val Arg Val Gly Leu Leu Arg Asn Arg Gln Met

35 40 45Pro Pro Asp Leu Thr Gly Glu Ala Thr Ile Pro Tyr Thr Ser Met Ile

50 55 60Phe Glu Leu Ile Ala Asp Arg Tyr Gly Val Pro Glu Ile Lys Asn Ile65 70 75 80Ala Arg Thr Arg Asp Ile Gln Gln Lys Val Met Pro Ser Ser Gly Val

85 90 95Lys Lys Asn Leu Gly Phe Ile Tyr His Gln Arg Ser Arg Ala Val Asp

100 105 110Leu Gly Gln Ala Leu Gln Phe Asn Val Pro Ser Glu His Gly Glu Asn

115 120 125His Leu Phe Arg Pro Asp Ile Asp Ala Tyr Leu Leu Ala Ala Ala Ile

130 135 140Gly Tyr Gly Ala Gln Leu Val Glu Ile Asp Asn Ser Pro Glu Val Leu145 150 155 160Val Glu Asp Ser Gly Val Lys Val Ala Thr Ala Leu Gly Arg Trp Val

165 170 175Thr Ala Asp Phe Met Val Asp Gly Ser Gln Gly Gly Gln Val Leu Ala

180 185 190Arg Gln Ala Gly Leu Val Ser Gln Ala Ser Thr Gln Lys Thr Arg Thr

195 200 205Leu Glu Phe Ser Thr His Met Leu Gly Val Val Pro Phe Asp Glu Cys

210 215 220Val Gln Gly Asp Phe Pro Gly Gln Trp His Gly Gly Thr Leu His His225 230 235 240Val Phe Asp Gly Gly Trp Val Gly Val Ile Pro Phe Asn Asn His Gln

245 250 255His Ser Arg Asn Pro Leu Val Ser Val Leu Val Ser Leu Arg Glu Asp

260 265 270Leu Cys Pro Ser Met Asp Gly Asp Gln Val Leu Ala Gly Leu Ile Glu

275 280 285Leu Tyr Pro Gly Leu Gly Arg His Leu Ser Gly Ala Arg Arg Val Arg

290 295 300Glu Trp Val Leu Arg Gln Pro Pro Arg Gln Val Tyr Arg Thr Ala Leu305 310 315 320Glu Arg Arg Cys Leu Met Phe Asp Glu Gly Ala Ala Ser Asn Asp Leu

325 330 335Leu Phe Ser Arg Lys Leu Ser Asn Ala Ala Glu Leu Val Leu Ala Leu

340 345 350Ala His Arg Leu Ile Lys Ala Ala His Ser Gly Asp Tyr Arg Ser Pro

355 360 365Ala Leu Asn Asp Phe Val Leu Thr Gln Asp Ser Ile Ile Ser Leu Ser

370 375 380Asp Arg Ile Ala Leu Ala Ala Tyr Val Ser Phe Arg Asp Pro Glu Leu385 390 395 400Trp Asn Ala Phe Ala Arg Val Trp Leu Leu Gln Ser Ile Ala Ala Thr

405 410 415Ile Thr Ala Arg Lys Ile Asn Asp Ala Phe Ala Lys Asp Leu Asp Pro

420 425 430Arg Val Phe Asp Glu Ile Asp Gln Leu Ala Glu Asp Gly Phe Trp Met

435 440 445Pro Leu Tyr Arg Gly Tyr Lys Asp Ile Leu Asn Thr Thr Leu Gly Leu

450 455 460Cys Asp Asp Val Lys Ser Ala Lys Val Ser Ala Ala His Ala Ala Ser465 470 475 480Ser Ile Phe Ala Glu Leu Ala Ash Ala Ser Phe Val Pro Pro Ile Phe

485 490 495Asp Phe Ala Asn Pro His Ala Arg Val Tyr Gln Leu Thr Thr Leu Arg

500 505 510Lys Leu Lys Ala Leu Trp Trp Gly Leu Met Gln Val Pro Ser Glu Val

515 520 525Gly Arg Leu Ile Phe Tyr Arg Ser Phe Arg Lys Pro Ser Leu Arg Lys

530 535 540Glu Ser545<210>10<211>1510<212>DNA<213>荧光假单胞菌<220><221>CDS<222>(1)..(1509)<400>10atg aat cag tac gac gtc att atc atc ggt agt ggt atc gcc ggc gcg 48Met Asn Gln Tyr Asp Val Ile Ile Ile Gly Ser Gly Ile Ala Gly Ala1 5 10 15ctg acc ggc gcc gtc ctc gcg aag tcc ggg ctg aac gtt ctg atc ctc 96Leu Thr Gly Ala Val Leu Ala Lys Ser Gly Leu Asn Val Leu Ile Leu

20 25 30gac tcg gcc cag cac cca cga ttc tcc gtc ggc gaa gcg gcg aca ccg 144Asp Ser Ala Gln His Pro Arg Phe Ser Val Gly Glu Ala Ala Thr Pro

35 40 45gaa agc ggt ttt ctg ctg cgt ttg ctc tca aag cgc ttc gac atc cct 192Glu Ser Gly Phe Leu Leu Arg Leu Leu Ser Lys Arg Phe Asp Ile Pro

50 55 60gaa atc gcc tac ctc tcg cac ccc gac aag atc atc cag cac gtc ggt 240Glu Ile Ala Tyr Leu Ser His Pro Asp Lys Ile Ile Gln His Val Gly65 70 75 80tcg agc gcc tgc ggg atc aag ctg ggc ttc agt ttt gcc tgg cat caa 288Ser Ser Ala Cys Gly Ile Lys Leu Gly Phe Ser Phe Ala Trp His Gln

85 90 95gag aac gcg ccg tcg tcc ccc gac cac ctt gtg gcc ccg ccg ctg aag 336Glu Asn Ala Pro Ser Ser Pro Asp His Leu Val Ala Pro Pro Leu Lys

100 105 110gtg ccg gaa gcc cat ctt ttc cgg cag gac atc gac tat ttc gcc ctg 384Val Pro Glu Ala His Leu Phe Arg Gln Asp Ile Asp Tyr Phe Ala Leu

115 120 125atg att gcc ctg aaa cac ggc gcc gaa tcc aga cag aac atc aag atc 432Met Ile Ala Leu Lys His Gly Ala Glu Ser Arg Gln Asn Ile Lys Ile

130 135 140gag tcg atc agc ctc aac gac gac ggg gtc gag gtg gca ttg tcc aac 480Glu Ser Ile Ser Leu Asn Asp Asp Gly Val Glu Val Ala Leu Ser Asn145 150 155 160gcc gcc ccc gtc aag gcc gcg ttc atc att gac gct gct gcc cag ggc 528Ala Ala Pro Val Lys Ala Ala Phe Ile Ile Asp Ala Ala Ala Gln Gly

165 170 175tct ccg ctt tcc cgc caa ctg ggc ttg cgc acc acc gaa ggg ctg gcg 576Ser Pro Leu Ser Arg Gln Leu Gly Leu Arg Thr Thr Glu Gly Leu Ala

180 185 190acc gac acc tgc tca ttc ttc acc cac atg ctc aat gtg aag agc tac 624Thr Asp Thr Cys Ser Phe Phe Thr His Met Leu Asn Val Lys Ser Tyr

195 200 205gaa gat gcc ctg gct ccg ttg tcc cgc act cgt tcc ccc atc gaa ctg 672Glu Asp Ala Leu Ala Pro Leu Ser Arg Thr Arg Ser Pro Ile Glu Leu

210 215 220ttc aag agc acc ttg cac cac atc ttc gaa gag ggc tgg ttg tgg gtc 720Phe Lys Ser Thr Leu His His Ile Phe Glu Glu Gly Trp Leu Trp Val225 230 235 240atc ccc ttc aac aac cac ccg cag ggc acc aat cag ttg tgc agc atc 768Ile Pro Phe Asn Asn His Pro Gln Gly Thr Asn Gln Leu Cys Set Ile

245 250 255ggc ttc cag ttc aac aac gcc aag tac cgt ccc acc gag gcg ccg gag 816Gly Phe Gln Phe Asn ASn Ala Lys Tyr Arg Pro Thr Glu Ala Pro Glu

260 265 270atc gag ttt cgc aaa ctg ctg aaa aag tac ccg gcc atc ggc gaa cac 864Ile Glu Phe Arg Lys Leu Leu Lys Lys Tyr Pro Ala Ile Gly Glu His

275 280 285ttc aag gat gcg gtc aat gcc cgg gag tgg atc tac gcg ccg cgc atc 912Phe Lys Asp Ala Val Asn Ala Arg Glu Trp Ile Tyr Ala Pro Arg Ile

290 295 300aac tac cgc agc gtg caa aat gtc ggg gat cgc ttc tgc ctg ctg ccg 960Asn Tyr Arg Ser Val Gln Asn Val Gly Asp Arg Phe Cys Leu Leu Pro305 310 315 320caa gcc aca ggg ttt atc gac ccg ctg ttc tcc agg ggg ttg atc acc 1008Gln Ala Thr Gly Phe Ile Asp Pro Leu Phe Ser Arg Gly Leu Ile Thr

325 330 335acc ttc gag tcc atc ctc agg ctg gcc ccc aag gtg ctg gac gcc gcc 1056Thr Phe Glu Set Ile Leu Arg Leu Ala Pro Lys Val Leu Asp Ala Ala

340 345 350cgc agc aac cgc tgg caa cgg gaa cag ttc atc gaa gtc gag cgc cat 1104Arg Ser Asn Arg Trp Gln Arg Glu Gln Phe Ile Glu Val Glu Arg His

355 360 365tgc ctg aac gcg gtg gcg acc aat gac cag ttg gtc tcc tgc tcc tat 1152Cys Leu Asn Ala Val Ala Thr Asn Asp Gln Leu Val Ser Cys Ser Tyr

370 375 380gaa gcc ttc agc gac ttt cac ctg tgg aac gtg tgg cat cgg gtc tgg 1200Glu Ala Phe Ser Asp Phe His Leu Trp Asn Val Trp His Arg Val Trp385 390 395 400ctc agc ggc tcc aac ctg ggc agt gcc ttt ctg caa aag ctg ctg cac 1248Leu Ser Gly Ser Asn Leu Gly Ser Ala Phe Leu Gln Lys Leu Leu His

405 410 415gac ctg gaa cac agt ggc gac gcc cgc cag ttc gat gca gcg ctt gag 1296Asp Leu Glu His Ser Gly Asp Ala Arg Gln Phe Asp Ala Ala Leu Glu

420 425 430gcg gtg cgc ttc cct ggc tgc ctg tcc ctg gac tcg ccc gcc tac gaa 1344Ala Val Arg Phe Pro Gly Cys Leu Ser Leu Asp Ser Pro Ala Tyr Glu

435 440 445agc ctg ttc agg cag tcg tgc cag gtc atg caa cag gcc agg gag caa 1392Ser Leu Phe Arg Gln Ser Cys Gln Val Met Gln Gln Ala Arg Glu Gln

450 455 460gcc agg ccg gtg gcc gaa acc gcc aac gcg ctg cat gag ctg atc aag 1440Ala Arg Pro Val Ala Glu Thr Ala Asn Ala Leu His Glu Leu Ile Lys465 470 475 480gag cac gaa gcc gag ttg ttg ccc ctg ggc tat tca cgg ata tcc aat 1488Glu His Glu Ala Glu Leu Leu Pro Leu Gly Tyr Ser Arg Ile Ser Asn

485 490 495cgt ttc atc ctc aaa gtc tga a 1510Arg Phe Ile Leu Lys Val

500<210>11<211>502<212>PRT<213>荧光假单胞菌<400>11Met Asn Gln Tyr Asp Val Ile Ile Ile Gly Ser Gly Ile Ala Gly Ala1 5 10 15Leu Thr Gly Ala Val Leu Ala Lys Ser Gly Leu Asn Val Leu Ile Leu

20 25 30Asp Ser Ala Gln His Pro Arg Phe Ser Val Gly Glu Ala Ala Thr Pro

35 40 45Glu Ser Gly Phe Leu Leu Arg Leu Leu Ser Lys Arg Phe Asp Ile Pro

50 55 60Glu Ile Ala Tyr Leu Ser His Pro Asp Lys Ile Ile Gln His Val Gly65 70 75 80Ser Ser Ala Cys Gly Ile Lys Leu Gly Phe Ser Phe Ala Trp His Gln

85 90 95Glu Asn Ala Pro Ser Ser Pro Asp His Leu Val Ala Pro Pro Leu Lys

100 105 110Val Pro Glu Ala His Leu Phe Arg Gln Asp Ile Asp Tyr Phe Ala Leu

115 120 125Met Ile Ala Leu Lys His Gly Ala Glu Ser Arg Gln Asn Ile Lys Ile

130 135 140Glu Ser Ile Ser Leu Asn Asp Asp Gly Val Glu Val Ala Leu Ser Asn145 150 155 160Ala Ala Pro Val Lys Ala Ala Phe Ile Ile Asp Ala Ala Ala Gln Gly

165 170 175Ser Pro Leu Ser Arg Gln Leu Gly Leu Arg Thr Thr Glu Gly Leu Ala

180 185 190Thr Asp Thr Cys Ser Phe Phe Thr His Met Leu Asn Val Lys Ser Tyr

195 200 205Glu Asp Ala Leu Ala Pro Leu Ser Arg Thr Arg Ser Pro Ile Glu Leu

210 215 220Phe Lys Ser Thr Leu His His Ile Phe Glu Glu Gly Trp Leu Trp Val225 230 235 240Ile Pro Phe Asn Asn His Pro Gln Gly Thr Asn Gln Leu Cys Ser Ile

245 250 255Gly Phe Gln Phe Asn Asn Ala Lys Tyr Arg Pro Thr Glu Ala Pro Glu

260 265 270Ile Glu Phe Arg Lys Leu Leu Lys Lys Tyr Pro Ala Ile Gly Glu His

275 280 285Phe Lys Asp Ala Val Asn Ala Arg Glu Trp Ile Tyr Ala Pro Arg Ile

290 295 300Asn Tyr Arg Ser Val Gln Asn Val Gly Asp Arg Phe Cys Leu Leu Pro305 310 315 320Gln Ala Thr Gly Phe Ile Asp Pro Leu Phe Ser Arg Gly Leu Ile Thr

325 330 335Thr Phe Glu Ser Ile Leu Arg Leu Ala Pro Lys Val Leu Asp Ala Ala

340 345 350Arg Ser Asn Arg Trp Gln Arg Glu Gln Phe Ile Glu Val Glu Arg His

355 360 365Cys Leu Asn Ala Val Ala Thr Asn Asp Gln Leu Val Ser Cys Ser Tyr

370 375 380Glu Ala Phe Ser Asp Phe His Leu Trp Asn Val Trp His Arg Val Trp385 390 395 400Leu Ser Gly Ser Asn Leu Gly Ser Ala Phe Leu Gln Lys Leu Leu His

405 410 415Asp Leu Glu His Ser Gly Asp Ala Arg Gln Phe Asp Ala Ala Leu Glu

420 425 430Ala Val Arg Phe Pro Gly Cys Leu Ser Leu Asp Ser Pro Ala Tyr Glu

435 440 445Ser Leu Phe Arg Gln Ser Cys Gln Val Met Gln Gln Ala Arg Glu Gln

450 455 460Ala Arg Pro Val Ala Glu Thr Ala Asn Ala Leu His Glu Leu Ile Lys465 470 475 480Glu His Glu Ala Glu Leu Leu Pro Leu Gly Tyr Ser Arg Ile Ser Asn

485 490 495Arg Phe Ile Leu Lys Val

500<210>12<211>1476<212>DNA<213>东方拟无枝酸菌(Amycolatopsis orientalis)<220><221>CDS<222>(1)..(1476)<400>12atg tcg gtc gaa gat ttc gat gtt gtg gtg gcg ggc ggc ggg ccg ggt 48Met Ser Val Glu Asp Phe Asp Val Val Val Ala Gly Gly Gly Pro Gly 1 5 10 15ggt tcg acg gtg gcc acc ctg gtg gcg atg cag gga cac cgg gtc ctg 96Gly Ser Thr Val Ala Thr Leu Val Ala Met Gln Gly His Arg Val Leu

20 25 30ctg ctg gag aaa gag gtc ttc ccc cgg tac cag atc ggt gag tcg ctg 144Leu Leu Glu Lys Glu Val Phe Pro Arg Tyr Gln Ile Gly Glu Ser Leu

35 40 45ctg ccc gcc acg gtg cac ggg gtc tgc cgg atg ctc ggc gtc gcg gac 192Leu Pro Ala Thr Val His Gly Val Cys Arg Met Leu Gly Val Ala Asp

50 55 60gag ctg gcg aat tcc ggg ttc cog ate aaa cgc ggc ggc acg ttc cgc 240Glu Leu Ala Asn Ser Gly Phe Pro Ile Lys Arg Gly Gly Thr Phe Arg65 70 75 80tgg ggc gcc cgt ccg gag ccg tgg acg ttc cac ttc ggg atc tcg gcc 288Trp Gly Ala Arg Pro Glu Pro Trp Thr Phe His Phe Gly Ile Ser Ala

85 90 95aag atg gcg ggc tcg acg tcg cac gcc tat cag gtc gag cgg gcg aag 336Lys Met Ala Gly Ser Thr Ser His Ala Tyr Gln Val Glu Arg Ala Lys

100 105 110ttc gac gac atc ctg ctg aag aac gcc aag agc aag ggc gtc gtc gtg 384Phe Asp Asp Ile Leu Leu Lys Asn Ala Lys Ser Lys Gly Val Val Val

115 120 125cgg gaa ggc tgc tcg gtc aac gac gtc gtg gag gac ggc gag cgg gtc 432Arg Glu Gly Cys Ser Val Asn Asp Val Val Glu Asp Gly Glu Arg Val

130 135 140acc ggc gcg cgc tac acc gac gcg gac ggc aac gcg cac gaa gtc tog 480Thr Gly Ala Arg Tyr Thr Asp Ala Asp Gly Asn Ala His Glu Val Ser145 150 155 160gcc cgg ttc gtg atc gac gcg tcg ggc aac aag agc cgg ctc tac acg 528Ala Arg Phe Val Ile Asp Ala Ser Gly Asn Lys Ser Arg Leu Tyr Thr

165 170 175aag gtc aac ggt tcg cgg aac tac tcg gag ttc ttc cgc agc ctc gcg 576Lys Val Asn Gly Ser Arg Asn Tyr Ser Glu Phe Phe Arg Ser Leu Ala

180 185 190ctg ttc ggc tat ttc gag ggt ggc aaa cgg ctg ccc gag ccg gtg tcg 624Leu Phe Gly Tyr Phe Glu Gly Gly Lys Arg Leu Pro Glu Pro Val Ser

195 200 205ggc aac atc ctg agc gtc gcc ttc gac agc ggc tgg ttc tgg tac atc 672Gly Asn Ile Leu Ser Val Ala Phe Asp Ser Gly Trp Phe Trp Tyr Ile

210 215 220ccc ctg agc gac acg ctg acc agc gtc ggc gcg gtc gtg cgc cgg gag 720Pro Leu Ser Asp Thr Leu Thr Ser Val Gly Ala Val Val Arg Arg Glu225 230 235 240gac gcc gac aag atc cag ggc gac cgc gag aag gcc ctc aac acc ttg 768Asp Ala Asp Lys Ile Gln Gly Asp Arg Glu Lys Ala Leu Asn Thr Leu

245 250 255atc gcc gaa tgc ccg ctg atc tcg gag tac ctc tcg aac gcg acc agg 816Ile Ala Glu Cys Pro Leu Ile Ser Glu Tyr Leu Ser Asn Ala Thr Arg

260 265 270gtg acc acc ggc agg tac ggc gaa ctg cgg gtg cgc aag gac tac tcg 864Val Thr Thr Gly Arg Tyr Gly Glu Leu Arg Val Arg Lys Asp Tyr Ser

275 280 285tac cag cag gac agc tac tgg cgg ccc ggg atg gtc ctg gtc ggc gac 912Tyr Gln Gln Asp Ser Tyr Trp Arg Pro Gly Met Val Leu Val Gly Asp

290 295 300gcc gcg tgc ttc gtg gac ccg gtg ttc tcc tcc ggg gtg cac ctg gcg 960Ala Ala Cys Phe Val Asp Pro Val Phe Ser Ser Gly Val His Leu Ala305 310 315 320acc tac agc gcg ctg ctc gcg gcc cgg tcg atc aac agc gtc ctc gcg 1008Thr Tyr Ser Ala Leu Leu Ala Ala Arg Ser Ile Asn Ser Val Leu Ala

325 330 335ggc gac ctc gac gag aag acc gcg ctg aac gag ttc gag gcg cgc tat 1056Gly Asp Leu Asp Glu Lys Thr Ala Leu Asn Glu Phe Glu Ala Arg Tyr

340 345 350cgc cgc gag tac ggc gtc ttc tac gag ttc ctc gtc tcc ttc tat cag 1104Arg Arg Glu Tyr Gly Val Phe Tyr Glu Phe Leu Val Ser Phe Tyr Gln

355 360 365atg aac gtc aac gag gaa tcg tat ttc tgg cag gcc aag aag gtc acg 1152Met Asn Val Asn Glu Glu Ser Tyr Phe Trp Gln Ala Lys Lys Val Thr

370 375 380cag aac cag agc acc gac atc gag tcg ttc gtc gag ctg atc ggc ggg 1200Gln Asn Gln Ser Thr Asp Ile Glu Ser Phe Val Glu Leu Ile Gly Gly385 390 395 400gtg tcg tcc ggc gag acc gcg ctg acg gcc gcc gac cgg atc gcc gcg 1248Val Ser Ser Gly Glu Thr Ala Leu Thr Ala Ala Asp Arg Ile Ala Ala

405 410 415aac agt gcc gaa ttc gcc gcc gcc gtc gac aag atg gcg acg ggc gac 1296Asn Ser Ala Glu Phe Ala Ala Ala Val Asp Lys Met Ala Thr Gly Asp

420 425 430ggc gac gac atg gtg ccg atg ttc aag tcg acc gtg gtc aag cag gcg 1344Gly Asp Asp Met Val Pro Met Phe Lys Ser Thr Val Val Lys Gln Ala

435 440 445atg cag gag gcg ggc cag gtc cag atg aag gcg ctg ctc ggc gag gac 1392Met Gln Glu Ala Gly Gln Val Gln Met Lys Ala Leu Leu Gly Glu Asp

450 455 460gcc gaa ccc gag ctg ccg ctg ttc ccc ggc ggc ctg gtg act tcg ccc 1440Ala Glu Pro Glu Leu Pro Leu Phe Pro Gly Gly Leu Val Thr Ser Pro465 470 475 480gac ggg atg aag tgg ctg ccg cac cac ccg gcc tga 1476Asp Gly Met Lys Trp Leu Pro His His Pro Ala

485 490<210>13<211>491<212>PRT<213>东方拟无枝酸菌<400>13Met Ser Val Glu Asp Phe Asp Val Val Val Ala Gly Gly Gly Pro Gly1 5 10 15Gly Ser Thr Val Ala Thr Leu Val Ala Met Gln Gly His Arg Val Leu

20 25 30Leu Leu Glu Lys Glu Val Phe Pro Arg Tyr Gln Ile Gly Glu Ser Leu

35 40 45Leu Pro Ala Thr Val His Gly Val Cys Arg Met Leu Gly Val Ala Asp

50 55 60Glu Leu Ala Asn Ser Gly Phe Pro Ile Lys Arg Gly Gly Thr Phe Arg65 70 75 80Trp Gly Ala Arg Pro Glu Pro Trp Thr Phe His Phe Gly Ile Ser Ala

85 90 95Lys Met Ala Gly Ser Thr Ser His Ala Tyr Gln Val Glu Arg Ala Lys

100 105 110Phe Asp Asp Ile Leu Leu Lys Asn Ala Lys Ser Lys Gly Val Val Val

115 120 125Arg Glu Gly Cys Ser Val Asn Asp Val Val Glu Asp Gly Glu Arg Val

130 135 140Thr Gly Ala Arg Tyr Thr Asp Ala Asp Gly Asn Ala His Glu Val Ser145 150 155 160Ala Arg Phe Val Ile Asp Ala Ser Gly Asn Lys Ser Arg Leu Tyr Thr

165 170 175Lys Val Asn Gly Ser Arg Asn Tyr Ser Glu Phe Phe Arg Ser Leu Ala

180 185 190Leu Phe Gly Tyr Phe Glu Gly Gly Lys Arg Leu Pro Glu Pro Val Ser

195 200 205Gly Asn Ile Leu Ser Val Ala Phe Asp Ser Gly Trp Phe Trp Tyr Ile

210 215 220Pro Leu Ser Asp Thr Leu Thr Ser Val Gly Ala Val Val Arg Arg Glu225 230 235 240Asp Ala Asp Lys Ile Gln Gly Asp Arg Glu Lys Ala Leu Asn Thr Leu

245 250 255Ile Ala Glu Cys Pro Leu Ile Ser Glu Tyr Leu Ser Asn Ala Thr Arg

260 265 270Val Thr Thr Gly Arg Tyr Gly Glu Leu Arg Val Arg Lys Asp Tyr Ser

275 280 285Tyr Gln Gln Asp Ser Tyr Trp Arg Pro Gly Met Val Leu Val Gly Asp

290 295 300Ala Ala Cys Phe Val Asp Pro Val Phe Ser Ser Gly Val His Leu Ala305 310 315 320Thr Tyr Ser Ala Leu Leu Ala Ala Arg Ser Ile Asn Ser Val Leu Ala

325 330 335Gly Asp Leu Asp Glu Lys Thr Ala Leu Asn Glu Phe Glu Ala Arg Tyr

340 345 350Arg Arg Glu Tyr Gly Val Phe Tyr Glu Phe Leu Val Ser Phe Tyr Gln

355 360 365Met Asn Val Asn Glu Glu Ser Tyr Phe Trp Gln Ala Lys Lys Val Thr

370 375 380Gln Asn Gln Ser Thr Asp Ile Glu Ser Phe Val Glu Leu Ile Gly Gly385 390 395 400Val Ser Ser Gly Glu Thr Ala Leu Thr Ala Ala Asp Arg Ile Ala Ala

405 410 415Asn Ser Ala Glu Phe Ala Ala Ala Val Asp Lys Met Ala Thr Gly Asp

420 425 430Gly Asp Asp Met Val Pro Met Phe Lys Ser Thr Val Val Lys Gln Ala

435 440 445Met Gln Glu Ala Gly Gln Val Gln Met Lys Ala Leu Leu Gly Glu Asp

450 455 460Ala Glu Pro Glu Leu Pro Leu Phe Pro Gly Gly Leu Val Thr Ser Pro465 470 475 480Asp Gly Met Lys Trp Leu Pro His His Pro Ala

485 490<210>14<211>1359<212>DNA<213>金霉素链霉菌(Streptomyces aureofaciens)<220><221>CDS<222>(1)..(1359)<400>14atg ttc cac cgg gac ggc gag gag ccg gac ccg aac gag acc agc cag 48Met Phe His Arg Asp Gly Glu Glu Pro Asp Pro Asn Glu Thr Ser Gln1 5 10 15ttc cgc atc ccc tcg atc gtc ggc aac gcg gcc cac ttc ttc cgc cag 96Phe Arg Ile Pro Ser Ile Val Gly Asn Ala Ala His Phe Phe Arg Gln

20 25 30gac acc gac tcc tac atg ttc cac gcc gcg gtg cgc tac ggc tgc gac 144Asp Thr Asp Ser Tyr Met Phe His Ala Ala Val Arg Tyr Gly Cys Asp

35 40 45gcc cgg cag tac tac cgg gtg gag aac atc gag ttc gac gac ggc ggg 192Ala Arg Gln Tyr Tyr Arg Val Glu Asn Ile Glu Phe Asp Asp Gly Gly

50 55 60gtg acc gtc tcc ggc gcg gac ggc agc acc gtc cgg gcc cgc tac ctg 240Val Thr Val Ser Gly Ala Asp Gly Ser Thr Val Arg Ala Arg Tyr Leu65 70 75 80gtc gac gcc agc ggc ttc cgc tcg ccg ctg gca cgg cag ttg ggg ttg 288Val Asp Ala Ser Gly Phe Arg Ser Pro Leu Ala Arg Gln Leu Gly Leu

85 90 95cgg gag gag ccg agc cgg ctc aag cac cac gcc cgc tcg atc ttc acc 336Arg Glu Glu Pro Ser Arg Leu Lys His His Ala Arg Ser Ile Phe Thr

100 105 110cac atg gtc gga gtg gac gcg atc gac gac cac gtg gac atg ccg gcc 384His Met Val Gly Val Asp Ala Ile Asp Asp His Val Asp Met Pro Ala

115 120 125gag ctt cgc ccg ccg gtg ccg tgg aac gac ggg acg atg cac cac atc 432Glu Leu Arg Pro Pro Val Pro Trp Asn Asp Gly Thr Met His His Ile

130 135 140ttc gag cgc ggc tgg atg tgg atc atc ccg ttc aac aac cac ccc ggg 480Phe Glu Arg Gly Trp Met Trp Ile Ile Pro Phe Asn Asn His Pro Gly145 150 155 160gcc acc aac ccg ctg tgc agc gtc ggc atc cag ctc gac gag cgc cgc 528Ala Thr Asn Pro Leu Cys Ser Val Gly Ile Gln Leu Asp Glu Arg Arg

165 170 175tac ccc gcc cgg ccg gac ctg acg ccc gag gag gag ttc cgg tcc cac 576Tyr Pro Ala Arg Pro Asp Leu Thr Pro Glu Glu Glu Phe Arg Ser His

180 185 190gtg gac cgc ttc ccg gcg gtg cag cgg cag ttg aag ggc gcc cgc agc 624Val Asp Arg Phe Pro Ala Val Gln Arg Gln Leu Lys Gly Ala Arg Ser

195 200 205gtg cgc gag tgg gtg cga acg gac cgc atg cag tac tcc tcg agc cgg 672Val Arg Glu Trp Val Arg Thr Asp Arg Met Gln Tyr Ser Ser Ser Arg

210 215 220acg gtc ggc gag cgc tgg tgc ctg atg tcg cac gcg gcc ggc ttc atc 720Thr Val Gly Glu Arg Trp Cys Leu Met Ser His Ala Ala Gly Phe Ile225 230 235 240gac ccg ctc ttc ctt cgc ggc ctg tcc aac acc tgc gag atc atc aac 768Asp Pro Leu Phe Leu Arg Gly Leu Ser Asn Thr Cys Glu Ile Ile Asn

245 250 255gcg ctg tcc tgg cgg ctg atg gcc gcg ctg cgc gag gac gac ttc gcg 816Ala Leu Ser Trp Arg Leu Met Ala Ala Leu Arg Glu Asp Asp Phe Ala

260 265 270gtc gag cgc ttc gcc tac gtg gag gaa ctg gag cag ggc ctg ctg gac 864Val Glu Arg Phe Ala Tyr Val Glu Glu Leu Glu Gln Gly Leu Leu Asp

275 280 285tgg aac gac aag ctg gtc aac aac tcc ttc atc tcc ttc tcg cac tac 912Trp Asn Asp Lys Leu Val Asn Asn Ser Phe Ile Ser Phe Ser His Tyr

290 295 300ccg ctg tgg aac tcg gcg ttc cgg atc tgg gcc tcg gcc agc gtg atc 960Pro Leu Trp Asn Ser Ala Phe Arg Ile Trp Ala Ser Ala Ser Val Ile305 310 315 320ggc ggc aag cgc atc ctc aac gca ctg acc agg acc aag gag acc ggc 1008Gly Gly Lys Arg Ile Leu Asn Ala Leu Thr Arg Thr Lys Glu Thr Gly

325 330 335gac gac agc cac tgc cag gcg ctg gac gac aac ccg tac ccg ggc ctg 1056Asp Asp Ser His Cys Gln Ala Leu Asp Asp Asn Pro Tyr Pro Gly Leu

340 345 350tgg tgt ccg ctg gac ttc tac aag gag gcc ttc gac gag ctc acc gag 1104Trp Cys Pro Leu Asp Phe Tyr Lys Glu Ala Phe Asp Glu Leu Thr Glu

355 360 365ctg tgc gag gcc gtg gac gcc ggg cac acc acg gcc gag gag gcc gcg 1152Leu Cys Glu Ala Val Asp Ala Gly His Thr Thr Ala Glu Glu Ala Ala

370 375 380cgg ctg ctg gag cag cgg gtc cgc gag tcg gac tgg atg ctg ccg gcc 1200Arg Leu Leu Glu Gln Arg Val Arg Glu Ser Asp Trp Met Leu Pro Ala385 390 395 400ctg ggc ttc aac gac ccc gac acc cac cac atc aac ccg acg gcg gac 1248Leu Gly Phe Asn Asp Pro Asp Thr His His Ile Asn Pro Thr Ala Asp

405 410 415aag atg atc cgg atc gcg gag tgg gcc acc ggt cac cac cgc ccg gag 1296Lys Met Ile Arg Ile Ala Glu Trp Ala Thr Gly His His Arg Pro Glu

420 425 430atc cgt gag ctg ctg gcc gcc agc gcc gag gag gtc agg gcg gcg atg 1344Ile Arg Glu Leu Leu Ala Ala Ser Ala Glu Glu Val Arg Ala Ala Met

435 440 445cgg gtc aag ccg taa 1359Arg Val Lys Pro

450<210>15<211>452<212>PRT<213>金霉素链霉菌<400>15Met Phe His Arg Asp Gly Glu Glu Pro Asp Pro Asn Glu Thr Ser Gln1 5 10 15Phe Arg Ile Pro Ser Ile Val Gly Asn Ala Ala His Phe Phe Arg Gln

20 25 30Asp Thr Asp Ser Tyr Met Phe His Ala Ala Val Arg Tyr Gly Cys Asp

35 40 45Ala Arg Gln Tyr Tyr Arg Val Glu Asn Ile Glu Phe Asp Asp Gly Gly

50 55 60Val Thr Val Ser Gly Ala Asp Gly Ser Thr Val Arg Ala Arg Tyr Leu65 70 75 80Val Asp Ala Ser Gly Phe Arg Ser Pro Leu Ala Arg Gln Leu Gly Leu

85 90 95Arg Glu Glu Pro Ser Arg Leu Lys His His AIa Arg Ser Ile Phe Thr

100 105 110His Met Val Gly Val Asp Ala Ile Asp Asp His Val Asp Met Pro Ala

115 120 125Glu Leu Arg Pro Pro Val Pro Trp Asn Asp Gly Thr Met His His Ile

130 135 140Phe Glu Arg Gly Trp Met Trp Ile Ile Pro Phe Asn Asn His Pro Gly145 150 155 160Ala Thr Asn Pro Leu Cys Ser Val Gly Ile Gln Leu Asp Glu Arg Arg

165 170 175Tyr Pro Ala Arg Pro Asp Leu Thr Pro Glu Glu Glu Phe Arg Ser His

180 185 190Val Asp Arg Phe Pro Ala Val Gln Arg Gln Leu Lys Gly Ala Arg Ser

195 200 205Val Arg Glu Trp Val Arg Thr Asp Arg Met Gln Tyr Ser Ser Ser Arg

210 215 220Thr Val Gly Glu Arg Trp Cys Leu Met Ser His Ala Ala Gly Phe Ile225 230 235 240Asp Pro Leu Phe Leu Arg Gly Leu Ser Asn Thr Cys Glu Ile Ile Asn

245 250 255Ala Leu Ser Trp Arg Leu Met Ala Ala Leu Arg Glu Asp Asp Phe Ala

260 265 270Val Glu Arg Phe Ala Tyr Val Glu Glu Leu Glu Gln Gly Leu Leu Asp

275 280 235Trp Asn Asp Lys Leu Val Asn Asn Ser Phe Ile Ser Phe Ser His Tyr

290 295 300Pro Leu Trp Asn Ser Ala Phe Arg Ile Trp Ala Ser Ala Ser Val Ile305 310 315 320Gly Gly Lys Arg Ile Leu Asn Ala Leu Thr Arg Thr Lys Glu Thr Gly

325 330 335Asp Asp Ser His Cys Gln Ala Leu Asp Asp Asn Pro Tyr Pro Gly Leu

340 345 350Trp Cys Pro Leu Asp Phe Tyr Lys Glu Ala Phe Asp Glu Leu Thr Glu

355 360 365Leu Cys Glu Ala Val Asp Ala Gly His Thr Thr Ala Glu Glu Ala Ala

370 375 380Arg Leu Leu Glu Gln Arg Val Arg Glu Ser Asp Trp Met Leu Prc Ala385 390 395 400Leu Gly Phe Asn Asp Pro Asp Thr His His Ile Asn Pro Thr Ala Asp

405 410 415Lys Met Ile Arg Ile Ala Glu Trp Ala Thr Gly His His Arg Pro Glu

420 425 430Ile Arg Glu Leu Leu Ala Ala Ser Ala Glu Glu Val Arg Ala Ala Met

435 440 445Arg Val Lys Pro

450<210>16<211>1476<212>DNA<213>地中海拟无枝酸菌(Amycolatopsis mediterranei)<220><221>CDS<222>(1)..(1476)<400>16atg tcg gtc gaa gac ttc gac gtg gtg gtg gcg ggc ggc ggg ccg ggt 48Met Ser Val Glu Asp Phe Asp Val Val Val Ala Gly Gly Gly Pro Gly1 5 10 15ggt tcg acg gtg gcc acg ctg gtg gcc atg cag gga cac cgg gtg ctg 96Gly Ser Thr Val Ala Thr Leu Val Ala Met Gln Gly His Arg Val Leu

20 25 30ctg ctg gag aaa gag gtt ttc ccg cgg tat cag atc ggt gag tcg ctg 144Leu Leu Glu Lys Glu Val Phe Pro Arg Tyr Gln Ile Gly Glu Ser Leu

35 40 45ctg ccc gcc acg gtg cac ggc gtg tgc cgg atg ctc ggc atc tcc gac 192Leu Pro Ala Thr Val His Gly Val Cys Arg Met Leu Gly Ile Ser Asp

50 55 60gag ctg gcc aat gcc ggg ttc ccg atc aag cgc ggc ggc acg ttc cgc 240Glu Leu Ala Asn Ala Gly Phe Pro Ile Lys Arg Gly Gly Thr Phe Arg65 70 75 80tgg ggc gcc cgg ccg gag ccg tgg acg ttc cac ttc ggc atc tcg gcc 288Trp Gly Ala Arg Pro Glu Pro Trp Thr Phe His Phe Gly Ile Ser Ala

85 90 95aag atg gcc ggc tcg acg tcg cac gcc tac cag gtc gag cgg gcg cgg 336Lys Met Ala Gly Ser Thr Ser His Ala Tyr Gln Val Glu Arg Ala Arg

100 105 110ttc gac gag atg ctg ctg aac aac gcc aag cgc aag ggc gtg gtc gtg 384Phe Asp Glu Met Leu Leu Asn Asn Ala Lys Arg Lys Gly Val Val Val

115 120 125cgg gag ggg tgc gcg gtc acc gat gtg gtg gaa gac ggc gag cgg gtc 432Arg Glu Gly Cys Ala Val Thr Asp Val Val Glu Asp Gly Glu Arg Val

130 135 140acc ggt gcg cgg tac acc gat ccc gac ggc acc gag cgg gaa gtg tcg 480Thr Gly Ala Arg Tyr Thr Asp Pro Asp Gly Thr Glu Arg Glu Val Ser145 150 155 160gcg cgg ttc gtg atc gac gcg tcg ggc aac aag agc cgg ctc tac acc 528Ala Arg Phe Val Ile Asp Ala Ser Gly Asn Lys Ser Arg Leu Tyr Thr

165 170 175aag gtc ggc ggt tcg cgg aac tat tcg gag ttc ttc cgc agc ctc gcg 576Lys Val Gly Gly Ser Arg Asn Tyr Ser Glu Phe Phe Arg Ser Leu Ala

180 185 190ctg ttc ggt tac ttc gag ggt ggc aag cgg ctg ccc gag ccg gtc tcc 624Leu Phe Gly Tyr Phe Glu Gly Gly Lys Arg Leu Pro Glu Pro Val Ser

195 200 205ggg aac atc ctg agt gtg gcc ttc gac agc ggc tgg ttc tgg tac atc 672Gly Asn Ile Leu Ser Val Ala Phe Asp Ser Gly Trp Phe Trp Tyr Ile

210 215 220ccg ctg agc gac acg ctg acc agc gtc ggc gcg gtg gtg cgc cgg gag 720Pro Leu Ser Asp Thr Leu Thr Ser Val Gly Ala Val Val Arg Arg Glu225 230 235 240gac gcc gag aag atc cag ggt gac cgg gag aag gcc ctc aac acg ctg 768Asp Ala Glu Lys Ile Gln Gly Asp Arg Glu Lys Ala Leu Asn Thr Leu

245 250 255atc gcc gag tgc ccg ctg atc tcg gaa tac ctc gcg gac gcg acc cgg 816Ile Ala Glu Cys Pro Leu Ile Ser Glu Tyr Leu Ala Asp Ala Thr Arg

260 265 270gtg acg acc ggc cgg tac ggg gaa ctg cgc gtc cgc aag gac tac tcc 864Val Thr Thr Gly Arg Tyr Gly Glu Leu Arg Val Arg Lys Asp Tyr Ser

275 280 285tac cag cag gag acc tac tgg cgg ccg ggc atg atc ctg gtc ggc gac 912Tyr Gln Gln Glu Thr Tyr Trp Arg Pro Gly Met Ile Leu Val Gly Asp

290 295 300gcc gcg tgt ttc gtg gac ccg gtg ttc tcc tcc ggt gtg cac ctg gcg 960Ala Ala Cys Phe Val Asp Pro Val Phe Ser Ser Gly Val His Leu Ala305 310 315 320acc tac agc gcg ctg ctc gcg gcc cgg tcg atc aac agc gtc ctc gcc 1008Thr Tyr Ser Ala Leu Leu Ala Ala Arg Ser Ile Asn Ser Val Leu Ala

325 330 335ggc gac ctg gac gag aag acc gcg ctg aac gag ttc gag ctg cgg tat 1056Gly Asp Leu Asp Glu Lys Thr Ala Leu Asn Glu Phe Glu Leu Arg Tyr

340 345 350cgc cgt gag tac ggc gtg ttc tac gag ttc ctc gtg tcc ttc tac cag 1104Arg Arg Glu Tyr Gly Val Phe Tyr Glu Phe Leu Val Ser Phe Tyr Gln

355 360 365atg aac gtg aac gag gag tcg tac ttc tgg cag gcc aag aag gtc acg 1152Met Asn Val Asn Glu Glu Ser Tyr Phe Trp Gln Ala Lys Lys Val Thr

370 375 380cag aac cag agc acc gac gtc gag tcg ttc gtc gag ctg atc ggc gga 1200Gln Asn Gln Ser Thr Asp Val Glu Ser Phe Val Glu Leu Ile Gly Gly385 390 395 400gtg tcg tcc ggg gag acc gcg ctg acg gcc gcc gac cgc atc gcc gcg 1248Val Ser Ser Gly Glu Thr Ala Leu Thr Ala Ala Asp Arg Ile Ala Ala

405 410 415cgc agt gcc gag ttc gcc gcg gcg gtg gac gag atg gcg ggc ggg gac 1296Arg Ser Ala Glu Phe Ala Ala Ala Val Asp Glu Met Ala Gly Gly Asp

420 425 430ggc gac aac atg gtg ccg atg ttc aag tcg acg gtg gtc cag cag gcg 1344Gly Asp Asn Met Val Pro Met Phe Lys Ser Thr Val Val Gln Gln Ala

435 440 445atg cag gaa gcg ggc cag gtg cag atg aag gcg ctg ctc ggc gag gac 1392Met Gln Glu Ala Gly Gln Val Gln Met Lys Ala Leu Leu Gly Glu Asp

450 455 460gcc gaa ccc gag ctg ccc ctg ttc ccc ggt ggc ctg gtg acc tcg ccc 1440Ala Glu Pro Glu Leu Pro Leu Phe Pro Gly Gly Leu Val Thr Ser Pro465 470 475 480gaa cgg atg aag tgg ctg cct cac cac cct gcg tga 1476Glu Arg Met Lys Trp Leu Pro His His Pro Ala

485 490<210>17<211>491<212>PRT<213>地中海拟无枝酸菌<400>17Met Ser Val Glu Asp Phe Asp Val Val Val Ala Gly Gly Gly Pro Gly1 5 10 15Gly Ser Thr Val Ala Thr Leu Val Ala Met Gln Gly His Arg Val Leu

20 25 30Leu Leu Glu Lys Glu Val Phe Pro Arg Tyr Gln Ile Gly Glu Ser Leu

35 40 45Leu Pro Ala Thr Val His Gly Val Cys Arg Met Leu Gly Ile Ser Asp

50 55 60Glu Leu Ala Asn Ala Gly Phe Pro Ile Lys Arg Gly Gly Thr Phe Arg65 70 75 80Trp Gly Ala Arg Pro Glu Pro Trp Thr Phe His Phe Gly Ile Ser Ala

85 90 95Lys Met Ala Gly Ser Thr Ser His Ala Tyr Gln Val Glu Arg Ala Arg

100 105 110Phe Asp Glu Met Leu Leu Asn Asn Ala Lys Arg Lys Gly Val Val Val

115 120 125Arg Glu Gly Cys Ala Val Thr Asp Val Val Glu Asp Gly Glu Arg Val

130 135 140Thr Gly Ala Arg Tyr Thr Asp Pro Asp Gly Thr Glu Arg Glu Val Ser145 150 155 160Ala Arg Phe Val Ile Asp Ala Ser Gly Asn Lys Ser Arg Leu Tyr Thr

165 170 175Lys Val Gly Gly Ser Arg Asn Tyr Ser Glu Phe Phe Arg Ser Leu Ala

180 185 190Leu Phe Gly Tyr Phe Glu Gly Gly Lys Arg Leu Pro Glu Pro Val Ser

195 200 205Gly Asn Ile Leu Ser Val Ala Phe Asp Ser Gly Trp Phe Trp Tyr Ile

210 215 220Pro Leu Ser Asp Thr Leu Thr Ser Val Gly Ala Val Val Arg Arg Glu225 230 235 240Asp Ala Glu Lys Ile Gln Gly Asp Arg Glu Lys Ala Leu Asn Thr Leu

245 250 255Ile Ala Glu Cys Pro Leu Ile Ser Glu Tyr Leu Ala Asp Ala Thr Arg

260 265 270Val Thr Thr Gly Arg Tyr Gly Glu Leu Arg Val Arg Lys Asp Tyr Ser

275 280 285Tyr Gln Gln Glu Thr Tyr Trp Arg Pro Gly Met Ile Leu Val Gly Asp

325 330 335Gly Asp Leu Asp Glu Lys Thr Ala Leu Asn Glu Phe Glu Leu Arg Tyr

340 345 350Arg Arg Glu Tyr Gly Val Phe Tyr Glu Phe Leu Val Ser Phe Tyr Gln

355 360 365Met Asn Val Asn Glu Glu Ser Tyr Phe Trp Gln Ala Lys Lys Val Thr

370 375 380Gln Asn Gln Ser Thr Asp Val Glu Ser Phe Val Glu Leu Ile Gly Gly385 390 395 400Val Ser Ser Gly Glu Thr Ala Leu Thr Ala Ala Asp Arg Ile Ala Ala

405 410 415Arg Ser Ala Glu Phe Ala Ala Ala Val Asp Glu Met Ala Gly Gly Asp

420 425 430Gly Asp Asn Met Val Pro Met Phe Lys Ser Thr Val Val Gln Gln Ala

435 440 445Met Gln Glu Ala Gly Gln Val Gln Met Lys Ala Leu Leu Gly Glu Asp

450 455 460Ala Glu Pro Glu Leu Pro Leu Phe Pro Gly Gly Leu Val Thr Ser Pro465 470 475 480Glu Arg Met Lys Trp Leu Pro His His Pro Ala

485 490<210>18<211>702<212>DNA<213>大肠杆菌(Escherichia coli)<220><221>CDS<222>(1)..(702)<400>18atg aca acc tta agc tgt aaa gtg acc tcg gta gaa gct atc acg gat 48Met Thr Thr Leu Ser Cys Lys Val Thr Ser Val Glu Ala Ile Thr Asp1 5 10 15acc gta tat cgt gtc cgc atc gtg cca gac gcg gcc ttt tct ttt cgt 96Thr Val Tyr Arg Val Arg Ile Val Pro Asp Ala Ala Phe Ser Phc Arg

20 25 30gct ggt cag tat ttg atg gta gtg atg gat gag cgc gac aaa cgt ccg 144Ala Gly Gln Tyr Leu Met Val Val Met Asp Glu Arg Asp Lys Arg Pro

35 40 45ttc tca atg gct tcg acg ccg gat gaa aaa ggg ttt atc gag ctg cat 192Phe Ser Met Ala Ser Thr Pro Asp Glu Lys Gly Phe Ile Glu Leu His

50 55 60att ggc gct tct gaa atc aac ctt tac gcg aaa gca gtc atg gac cgc 240Ile Gly Ala Ser Glu Ile Asn Leu Tyr Ala Lys Ala Val Met Asp Arg65 70 75 80atc ctc aaa gat cat caa atc gtg gtc gac att ccc cac gga gaa gcg 288Ile Leu Lys Asp His Gln Ile Val Val Asp Ile Pro His Gly Glu Ala

85 90 95tgg ctg cgc gat gat gaa gag cgt ccg atg att ttg att gcg ggc ggc 336Trp Leu Arg Asp Asp Glu Glu Arg Pro Met Ile Leu Ile Ala Gly Gly

100 105 110acc ggg ttc tct tat gcc cgc tcg att ttg ctg aca gcg ttg gcg cgt 384Thr Gly Phe Ser Tyr Ala Arg Ser Ile Leu Leu Thr Ala Leu Ala Arg

115 120 125aac cca aac cgt gat atc acc att tac tgg ggc ggg cgt gaa gag cag 432Asn Pro Asn Arg Asp Ile Thr Ile Tyr Trp Gly Gly Arg Glu Glu Gln

130 135 140cat ctg tat gat ctc tgc gag ctt gag gcg ctt tcg ttg aag cat cct 480His Leu Tyr Asp Leu Cys Glu Leu Glu Ala Leu Ser Leu Lys His Pro145 150 155 160ggt ctg caa gtg gtg ccg gtg gtt gaa caa ccg gaa gcg ggc tgg cgt 528Gly Leu Gln Val Val Pro Val Val Glu Gln Pro Glu Ala Gly Trp Arg

165 170 175ggg cgt act ggc acc gtg tta acg gcg gta ttg cag gat cac ggt acg 576Gly Arg Thr Gly Thr Val Leu Thr Ala Val Leu Gln Asp His Gly Thr

180 185 190ctg gca gag cat gat atc tat att gcc gga cgt ttt gag atg gcg aaa 624Leu Ala Glu His Asp Ile Tyr Ile Ala Gly Arg Phe Glu Met Ala Lys

195 200 205att gcc cgc gat ctg ttt tgc agt gag cgt aat gcg cgg gaa gat cgc 672Ile Ala Arg Asp Leu Phe Cys Ser Glu Arg Asn Ala Arg Glu Asp Arg

210 215 220ctg ttt ggc gat gcg ttt gca ttt atc tga 702Leu Phe Gly Asp Ala Phe Ala Phe Ile225 230<210>19<211>233<212>PRT<213>大肠杆菌<400>19Met Thr Thr Leu Ser Cys Lys Val Thr Ser Val Glu Ala Ile Thr Asp1 5 10 15Thr Val Tyr Arg Val Arg Ile Val Pro Asp Ala Ala Phe Ser Phe Arg

20 25 30Ala Gly Gln Tyr Leu Met Val Val Met Asp Glu Arg Asp Lys Arg Pro

35 40 45Phe Ser Met Ala Ser Thr Pro Asp Glu Lys Gly Phe Ile Glu Leu His

50 55 60Ile Gly Ala Ser Glu Ile Asn Leu Tyr Ala Lys Ala Val Met Asp Arg65 70 75 80Ile Leu Lys Asp His Gln Ile Val Val Asp Ile Pro His Gly Glu Ala

85 90 95Trp Leu Arg Asp Asp Glu Glu Arg Pro Met Ile Leu Ile Ala Gly Gly

100 105 110Thr Gly Phe Ser Tyr Ala Arg Ser Ile Leu Leu Thr Ala Leu Ala Arg

115 120 125Asn Pro Asn Arg Asp Ile Thr Ile Tyr Trp Gly Gly Arg Glu Glu Gln

130 135 140His Leu Tyr Asp Leu Cys Glu Leu Glu Ala Leu Ser Leu Lys His Pro145 150 155 160Gly Leu Gln Val Val Pro Val Val Glu Gln Pro Glu Ala Gly Trp Arg

165 170 175Gly Arg Thr Gly Thr Val Leu Thr Ala Val Leu Gln Asp His Gly Thr

180 185 190Leu Ala Glu His Asp Ile Tyr Ile Ala Gly Arg Phe Glu Met Ala Lys

195 200 205Ile Ala Arg Asp Leu Phe Cys Ser Glu Arg Asn Ala Arg Glu Asp Arg

210 215 220Leu Phe Gly Asp Ala Phe Ala Phe Ile225 230<210>20<211>906<212>DNA<213>大鼠<220><221>CDS<222>(1)..(906)<400>20atg ggg gcc cag ctg agc acg ttg agc cga gtg gta ctc tcc ccg gtc 48Met Gly Ala Gln Leu Ser Thr Leu Ser Arg Val Val Leu Ser Pro Val1 5 10 15tgg ttc gtc tac agc ctc ttc atg aag ctg ttt cag cgc tcc tca ccg 96Trp Phe Val Tyr Ser Leu Phe Met Lys Leu Phe Gln Arg Ser Ser Pro

20 25 30gcc atc acc ctc gag aac ccc gac atc aag tac cct ctg cgg ctc atc 144Ala Ile Thr Leu Glu Asn Pro Asp Ile Lys Tyr Pro Leu Arg Leu Ile

35 40 45gac aag gag att atc agc cat gac act cgg cgc ttc cga ttt gca ctc 192Asp Lys Glu Ile Ile Ser His Asp Thr Arg Arg Phe Arg Phe Ala Leu

50 55 60cct tcg ccc cag cac atc ctg ggc ctt cct atc ggc cag cac atc tac 240Pro Ser Pro Gln His Ile Leu Gly Leu Pro Ile Gly Gln His Ile Tyr65 70 75 80ctc tcc acc agg atc gat ggc aac ttg gtc att cgt ccc tac acc cct 288Leu Ser Thr Arg Ile Asp Gly Asn Leu Val Ile Arg Pro Tyr Thr Pro

85 90 95gtg tct agt gat gat gac aag ggc ctt gtg gac ttg gtg gtc aag gtt 336Val Ser Ser Asp Asp Asp Lys Gly Leu Val Asp Leu Val Val Lys Val

100 105 110tac ttc aag gac acg cat ccc aag ttt cca gct gga ggg aaa atg tct 384Tyr Phe Lys Asp Thr His Pro Lys Phe Pro Ala Gly Gly Lys Met Ser

115 120 125cag tac ctg gaa aac atg aat att gga gac acc att gaa ttc cgg ggc 432Gln Tyr Leu Glu Asn Met Asn Ile Gly Asp Thr Ile Glu Phe Arg Gly

130 135 140ccc aat ggg cta ctg gtc tac cag ggc aaa ggg aag ttc gcc atc cgt 480Pro Asn Gly Leu Leu Val Tyr Gln Gly Lys Gly Lys Phe Ala Ile Arg145 150 155 160gca gac aag aag tcc aac cct gtt gtc agg acg gtg aag tct gta ggc 528Ala Asp Lys Lys Ser Asn Pro Val Val Arg Thr Val Lys Ser Val Gly

165 170 175atg att gca gga ggg aca ggc atc acc cca atg ctg cag gtg atc cga 576Met Ile Ala Gly Gly Thr Gly Ile Thr Pro Met Leu Gln Val Ile Arg

180 185 190gcc gtc ttg aag gac ccg aac gac cac act gtg tgc tat ctg ctc ttc 624Ala Val Leu Lys Asp Pro Asn Asp His Thr Val Cys Tyr Leu Leu Phe

195 200 205gcc aac cag tcc gag aaa gac atc ctg ctg cgg cct gag ctg gag gaa 672Ala Asn Gln Ser Glu Lys Asp Ile Leu Leu Arg Pro Glu Leu Glu Glu

210 215 220ctg agg aac gaa cat tct tct cgc ttc aag ctc tgg tac aca gtg gac 720Leu Arg Asn Glu His Ser Ser Arg Phe Lys Leu Trp Tyr Thr Val Asp225 230 235 240aaa gcc ccc gat gcc tgg gac tat agc caa ggc ttc gtg aat gag gag 768Lys Ala Pro Asp Ala Trp Asp Tyr Ser Gln Gly Phe Val Asn Glu Glu

245 250 255atg atc agg gac cat ctt cca cct cct ggg gag gag aca ctg ata ctg 816Met Ile Arg Asp His Leu Pro Pro Pro Gly Glu Glu Thr Leu Ile Leu

260 265 270atg tgt gga ccc cca ccg atg atc cag ttt gcc tgt ttg cca aac ctg 864Met Cys Gly Pro Pro Pro Met Ile Gln Phe Ala Cys Leu Pro Asn Leu

275 280 285gag cgt gtg ggc cat ccc aag gag cga tgc ttc acc ttc tga 906Glu Arg Val Gly His Pro Lys Glu Arg Cys Phe Thr Phe

290 295 300<210>21<211>301<212>PRT<213>大鼠<400>21Met Gly Ala Gln Leu Ser Thr Leu Ser Arg Val Val Leu Ser Pro Val1 5 10 15Trp Phe Val Tyr Ser Leu Phe Met Lys Leu Phe Gln Arg Ser Ser Pro

20 25 30Ala Ile Thr Leu Glu Asn Pro Asp Ile Lys Tyr Pro Leu Arg Leu Ile

35 40 45Asp Lys Glu Ile Ile Ser His Asp Thr Arg Arg Phe Arg Phe Ala Leu

50 55 60Pro Ser Pro Gln His Ile Leu Gly Leu Pro Ile Gly Gln His Ile Tyr65 70 75 80Leu Ser Thr Arg Ile Asp Gly Asn Leu Val Ile Arg Pro Tyr Thr Pro

85 90 95Val Ser Ser Asp Asp Asp Lys Gly Leu Val Asp Leu Val Val Lys Val

100 105 110Tyr Phe Lys Asp Thr His Pro Lys Phe Pro Ala Gly Gly Lys Met Ser

115 120 125Gln Tyr Leu Glu Asn Met Asn Ile Gly Asp Thr Ile Glu Phe Arg Gly

130 135 140Pro Asn Gly Leu Leu Val Tyr Gln Gly Lys Gly Lys Phe Ala Ile Arg145 150 155 160Ala Asp Lys Lys Ser Asn Pro Val Val Arg Thr Val Lys Ser Val Gly

165 170 175Met Ile Ala Gly Gly Thr Gly Ile Thr Pro Met Leu Gln Val Ile Arg

180 185 190Ala Val Leu Lys Asp Pro Asn Asp His Thr Val Cys Tyr Leu Leu Phe

195 200 205Ala Asn Gln Ser Glu Lys Asp Ile Leu Leu Arg Pro Glu Leu Glu Glu

210 215 220Leu Arg Asn Glu His Ser Ser Arg Phe Lys Leu Trp Tyr Thr Val Asp225 230 235 240Lys Ala Pro Asp Ala Trp Asp Tyr Ser Gln Gly Phe Val Asn Glu Glu

245 250 255Met Ile Arg Asp His Leu Pro Pro Pro Gly Glu Glu Thr Leu Ile Leu

260 265 270Met Cys Gly Pro Pro Pro Met Ile Gln Phe Ala Cys Leu Pro Asn Leu

275 280 285Glu Arg Val Gly His Pro Lys Glu Arg Cys Phe Thr Phe

290 295 300<210>22<211>2049<212>DNA<213>兔<220><221>CDS<222>(1)..(2049)<400>22ctg atc aac atg gcg gac tcc cac ggg gac acc ggc gcc acc atg cct 48Leu Ile Asn Met Ala Asp Ser His Gly Asp Thr Gly Ala Thr Met Pro1 5 10 15gaa gcg gcg gcc cag gag gcg tcg gtc ttc agc atg acg gac gtg gtt 96Glu Ala Ala Ala Gln Glu Ala Ser Val Phe Ser Met Thr Asp Val Val

20 25 30ctg ttc tcg ctc atc gtg ggg ctg atc acc tac tgg ttc ctc ttc aga 144Leu Phe Ser Leu Ile Val Gly Leu Ile Thr Tyr Trp Phe Leu Phe Arg

35 40 45aag aaa aag gag gaa gtg ccc gag ttc acc aag atc cag gcc ccg acg 192Lys Lys Lys Glu Glu Val Pro Glu Phe Thr Lys Ile Gln Ala Pro Thr

50 55 60tcg tcg tca gtg aag gag agc agc ttc gtg gag aag atg aag aag acg 240Ser Ser Ser Val Lys Glu Ser Ser Phe Val Glu Lys Met Lys Lys Thr65 70 75 80ggc cgg aac atc gtg gtc ttc tac ggc tcc cag acg ggc acc gcc gag 288Gly Arg Asn Ile Val Val Phe Tyr Gly Ser Gln Thr Gly Thr Ala Glu

85 90 95gag ttt gcc aac cgc ctg tcc aag gat gcc cac cgc tac ggg atg cgg 336Glu Phe Ala Asn Arg Leu Ser Lys Asp Ala His Arg Tyr Gly Met Arg

100 105 110ggc atg gcc gcc gac ccc gag gag tac gac ctg gcc gac ctg agc agc 384Gly Met Ala Ala Asp Pro Glu Glu Tyr Asp Leu Ala Asp Leu Ser Ser

115 120 125ctg ccc gag atc aac aac gcc ctg gcc gtc ttc tgc atg gcc acc tac 432Leu Pro Glu Ile Asn Asn Ala Leu Ala Val Phe Cys Met Ala Thr Tyr

130 135 140ggt gag ggg gac ccc acc gac aac gcc cag gac ttc tac gac tgg ctg 480Gly Glu Gly Asp Pro Thr Asp Asn Ala Gln Asp Phe Tyr Asp Trp Leu145 150 155 160cag gag acc gac gtg gac ctc tcg ggg gtc aag tac gcg gtg ttt ggc 528Gln Glu Thr Asp Val Asp Leu Ser Gly Val Lys Tyr Ala Val Phe Gly

165 170 175ctc ggg aac aag acc tac gag cac ttc aac gcc atg ggc aag tac gtg 576Leu Gly ASn Lys Thr Tyr Glu His Phe Asn Ala Met Gly Lys Tyr Val

180 185 190gac cag cgg ctg gag cag ctt ggc gcc cag cgc atc ttc gag ctg ggc 624Asp Gln Arg Leu Glu Gln Leu Gly Ala Gln Arg Ile Phe Glu Leu Gly

195 200 205atg ggc gac gat gat gca aac ctg gag gag gac ttc atc acg tgg cgg 672Met Gly Asp Asp Asp Ala Asn Leu Glu Glu Asp Phe Ile Thr Trp Arg

210 215 220gag cag ttc tgg ccg gcg gtg tgc gag cac ttc ggt gtg gag gcc aca 720Glu Gln Phe Trp Pro Ala Val Cys Glu His Phe Gly Val Glu Ala Thr225 230 235 240gga gag gag tcc agc att cgg cag tac gag ctc gtg ttg cac aca gac 768Gly Glu Glu Ser Ser Ile Arg Gln Tyr Glu Leu Val Leu His Thr Asp

245 250 255atc gac gtg gcc aag gtg tac cag ggc gag atg ggc cgc ctc aag agc 816Ile Asp Val Ala Lys Val Tyr Gln Gly Glu Met Gly Arg Leu Lys Ser

260 265 270tac gag aac cag aaa ccc ccc ttc gat gcc aag aat ccc ttc ctg gcc 864Tyr Glu Asn Gln Lys Pro Pro Phe Asp Ala Lys Asn Pro Phe Leu Ala

275 280 285acg gtc acc acc aac cgg aag ctg aac cag ggc acc gag cgc cac ctc 912Thr Val Thr Thr Asn Arg Lys Leu Asn Gln Gly Thr Glu Arg His Leu

290 295 300atg cac ctg gag ctg gac atc tcg gac tcc aag atc agg tat gag tct 960Met His Leu Glu Leu Asp Ile Ser Asp Ser Lys Ile Arg Tyr Glu Ser305 310 315 320ggg gac cac gtg gct gtg tat ccg gcc aac gac tct gcc ctc gtc aac 1008Gly Asp His Val Ala Val Tyr Pro Ala Asn Asp Ser Ala Leu Val Asn

325 330 335cag ctg ggg gag atc ctg ggt gcc gac ctg gac gtc gtc atg tcc ctg 1056Gln Leu Gly Glu Ile Leu Gly Ala Asp Leu Asp Val Val Met Ser Leu

340 345 350aac aac ctc gat gag gag tcc aac aag aag cac cca ttc ccc tgc ccc 1104Asn Asn Leu Asp Glu Glu Ser Asn Lys Lys His Pro Phe Pro Cys Pro

355 360 365act tcc tac cgc acg gcc ctc acc tac tac ctg gac atc acc aac ccg 1152Thr Ser Tyr Arg Thr Ala Leu Thr Tyr Tyr Leu Asp Ile Thr Asn Pro

370 375 380ccg cgc acc aac gtg ctc tac gag ctg gcc cag tac gcc gcc gac ccc 1200Pro Arg Thr Asn Val Leu Tyr Glu Leu Ala Gln Tyr Ala Ala Asp Pro385 390 395 400gct gag cag gag cag ctg cgc aag atg gcc tca tcc tcg ggc gag ggc 1248Ala Glu Gln Glu Gln Leu Arg Lys Met Ala Ser Ser Ser Gly Glu Gly

405 410 415aag gag ctg tac ctg agc tgg gtg gta gag gcg cgg agg cac atc ctg 1296Lys Glu Leu Tyr Leu Ser Trp Val Val Glu Ala Arg Arg His Ile Leu

420 425 430gcc atc ctc caa gac tac ccg tcc ctg cgg ccg ccc atc gac cac ctg 1344Ala Ile Leu Gln Asp Tyr Pro Ser Leu Arg Pro Pro Ile Asp His Leu

435 440 445tgt gag ctg ctg ccc cgg ctg cag gcg cgc tac tac tcc atc gcc tcc 1392Cys Glu Leu Leu Pro Arg Leu Gln Ala Arg Tyr Tyr Ser Ile Ala Ser

450 455 460tcc tcc aag gtc cac ccc aac tcc gtg cac atc tgc gcc gtg gcc gtg 1440Ser Ser Lys Val His Pro Asn Ser Val His Ile Cys Ala Val Ala Val465 470 475 480gag tac gag acc aag gcc ggc cgc ctc aac aaa ggc gtg gcc acc agc 1488Glu Tyr Glu Thr Lys Ala Gly Arg Leu Asn Lys Gly Val Ala Thr Ser

485 490 495tgg ctg cgg gcc aag gag ccg gcc ggg gag aat ggc ggc cgt gcc ctg 1536Trp Leu Arg Ala Lys Glu Pro Ala Gly Glu Asn Gly Gly Arg Ala Leu

500 505 510gtg ccc atg ttc gtg cgc aag tcc cag ttc cgc ctg ccc ttc aag gcc 1584Val Pro Met Phe Val Arg Lys Ser Gln Phe Arg Leu Pro Phe Lys Ala

515 520 525acc acg ccg gtc atc atg gtg ggc ccc ggc acc ggc gtg gcc ccc ttc 1632Thr Thr Pro Val Ile Met Val Gly Pro Gly Thr Gly Val Ala Pro Phe

530 535 540atc ggc ttt atc cag gag cgg gcc tgg ctg cgg cag cag ggc aag gaa 1680Ile Gly Phe Ile Gln Glu Arg Ala Trp Leu Arg Gln Gln Gly Lys Glu545 550 555 560gtg ggc gag acg ctg ctg tac tac ggc tgc cgg cgc gcg gcc gag gac 1728Val Gly Glu Thr Leu Leu Tyr Tyr Gly Cys Arg Arg Ala Ala Glu Asp

565 570 575tac ctg tac cgc gag gag ctc gcc ggc ttc caa aag gac ggc acg ctc 1776Tyr Leu Tyr Arg Glu Glu Leu Ala Gly Phe Gln Lys Asp Gly Thr Leu

580 585 590agc cag ctc aac gtg gcc ttc tcc cgc gag cag gcc cag aag gtc tac 1824Ser Gln Leu Asn Val Ala Phe Ser Arg Glu Gln Ala Gln Lys Va1 Tyr

595 600 605gtg cag cac ttg ctg agg agg gac aag gag cac ctg tgg cgg ctc atc 1872Val Gln His Leu Leu Arg Arg Asp Lys Glu His Leu Trp Arg Leu Ile

610 615 620cac gag ggg ggc gcc cac atc tac gtg tgc ggg gac gct cgg aac atg 1920His Glu Gly Gly Ala His Ile Tyr Val Cys Gly Asp Ala Arg Asn Met625 630 635 640gcc agg gac gtg cag aac acc ttc tac gac atc gtg gcc gag ctg ggg 1968Ala Arg Asp Val Gln Asn Thr Phe Tyr Asp Ile Val Ala Glu Leu Gly

645 650 655gcc atg gag cac gcg cag gcc gtg gac tac gtg aag aag ctc atg acc 2016Ala Met Glu His Ala Gln Ala Val Asp Tyr Val Lys Lys Leu Met Thr

660 665 670aag ggc cgc tac tcc ctg gac gtg tgg agc tag 2049Lys Gly Arg Tyr Ser Leu Asp Val Trp Ser

675 680<210>23<211>682<212>PRT<213>兔<400>23Leu Ile Asn Met Ala Asp Ser His Gly Asp Thr Gly Ala Thr Met Pro1 5 10 15Glu Ala Ala Ala Gln Glu Ala Ser Val Phe Ser Met Thr Asp Val Val

20 25 30Leu Phe Ser Leu Ile Val Gly Leu Ile Thr Tyr Trp Phe Leu Phe Arg

35 40 45Lys Lys Lys Glu Glu Val Pro Glu Phe Thr Lys Ile Gln Ala Pre Thr

50 55 60Ser Ser Ser Val Lys Glu Ser Ser Phe Val Glu Lys Met Lys Lys Thr65 70 75 80Gly Arg Asn Ile Val Val Phe Tyr Gly Ser Gln Thr Gly Thr Ala Glu

85 90 95Glu Phe Ala Asn Arg Leu Ser Lys Asp Ala His Arg Tyr Gly Met Arg

100 105 110Gly Met Ala Ala Asp Pro Glu Glu Tyr Asp Leu Ala Asp Leu Ser Ser

115 120 125Leu Pro Glu Ile Asn Asn Ala Leu Ala Val Phe Cys Met Ala Thr Tyr

130 135 140Gly Glu Gly Asp Pro Thr Asp Asn Ala Gln Asp Phe Tyr Asp Trp Leu145 150 155 160Gln Glu Thr Asp Val Asp Leu Ser Gly Val Lys Tyr Ala Val Phe Gly

165 170 175Leu Gly Asn Lys Thr Tyr Glu His Phe Asn Ala Met Gly Lys Tyr Val

180 185 190Asp Gln Arg Leu Glu Gln Leu Gly Ala Gln Arg Ile Phe Glu Leu Gly

195 200 205Met Gly Asp Asp Asp Ala Asn Leu Glu Glu Asp Phe Ile Thr Trp Arg

210 215 220Glu Gln Phe Trp Pro Ala Val Cys Glu His Phe Gly Val Glu Ala Thr225 230 235 240Gly Glu Glu Ser Ser Ile Arg Gln Tyr Glu Leu Val Leu His Thr Asp

245 250 255Ile Asp Val Ala Lys Val Tyr Gln Gly Glu Met Gly Arg Leu Lys Ser

260 265 270Tyr Glu Asn Gln Lys Pro Pro Phe Asp Ala Lys Asn Pro Phe Leu Ala

275 280 285Thr Val Thr Thr Asn Arg Lys Leu Asn Gln Gly Thr Glu Arg His Leu

290 295 300Met His Leu Glu Leu Asp Ile Ser Asp Ser Lys Ile Arg Tyr Glu Ser305 310 315 320Gly Asp His Val Ala Val Tyr Pro Ala Asn Asp Ser Ala Leu Val Asn

325 330 335Gln Leu Gly Glu Ile Leu Gly Ala Asp Leu Asp Val Val Met Ser Leu

340 345 350Asn Asn Leu Asp Glu Glu Ser Asn Lys Lys His Pro Phe Pro Cys Pro

355 360 365Thr Ser Tyr Arg Thr Ala Leu Thr Tyr Tyr Leu Asp Ile Thr Asn Pro

370 375 380Pro Arg Thr Asn Val Leu Tyr Glu Leu Ala Gln Tyr Ala Ala Asp Pro385 390 395 400Ala Glu Gln Glu Gln Leu Arg Lys Met Ala Ser Ser Ser Gly Glu Gly

405 410 415Lys Glu Leu Tyr Leu Ser Trp Val Val Glu Ala Arg Arg His Ile Leu

420 425 430Ala Ile Leu Gln Asp Tyr Pro Ser Leu Arg Pro Pro Ile Asp His Leu

435 440 445Cys Glu Leu Leu Pro Arg Leu Gln Ala Arg Tyr Tyr Ser Ile Ala Ser

450 455 460Ser Ser Lys Val His Pro Asn Ser Val His Ile Cys Ala Val Ala Val465 470 475 480Glu Tyr Glu Thr Lys Ala Gly Arg Leu Asn Lys Gly Val Ala Thr Ser

485 490 495Trp Leu Arg Ala Lys Glu Pro Ala Gly Glu Asn Gly Gly Arg Ala Leu

500 505 510Val Pro Met Phe Val Arg Lys Ser Gln Phe Arg Leu Pro Phe Lys Ala

515 520 525Thr Thr Pro Val Ile Met Val Gly Pro Gly Thr Gly Val Ala Pro Phe

530 535 540Ile Gly Phe Ile Gln Glu Arg Ala Trp Leu Arg Gln Gln Gly Lys Glu545 550 555 560Val Gly Glu Thr Leu Leu Tyr Tyr Gly Cys Arg Arg Ala Ala Glu Asp

565 570 575Tyr Leu Tyr Arg Glu Glu Leu Ala Gly Phe Gln Lys Asp Gly Thr Leu

580 585 590Ser Gln Leu Asn Val Ala Phe Ser Arg Glu Gln Ala Gln Lys Val Tyr

595 600 605Val Gln His Leu Leu Arg Arg Asp Lys Glu His Leu Trp Arg Leu Ile

610 615 620His Glu Gly Gly Ala His Ile Tyr Val Cys Gly Asp Ala Arg Asn Met625 630 635 640Ala Arg Asp Val Gln Asn Thr Phe Tyr Asp Ile Val Ala Glu Leu Gly

645 650 655Ala Met Glu His Ala Gln Ala Val Asp Tyr Val Lys Lys Leu Met Thr

660 665 670Lys Gly Arg Tyr Ser Leu Asp Val Trp Ser

675 680<210>24<211>444<212>DNA<213>蔬菜沙门氏菌(Spinacia oleracea)<220><221>CDS<222>(1)..(444)<400>24atg gca gca acc acc aca aca atg atg ggc atg gcc acc acc ttt gtc 48Met Ala Ala Thr Thr Thr Thr Met Met Gly Met Ala Thr Thr Phe Val1 5 10 15cca aaa ccc caa gca cca cca atg atg gcg gcg ctt cca tcc aac acc 96Pro Lys Pro Gln Ala Pro Pro Met Met Ala Ala Leu Pro Ser Asn Thr

20 25 30ggc cgc tct ttg ttc gga ctc aag acc ggt agc cgt ggc gga agg atg 144Gly Arg Ser Leu Phe Gly Leu Lys Thr Gly Ser Arg Gly Gly Arg Met

35 40 45aca atg gct gcc tac aag gta acc ttg gta aca ccc acc ggt aac gta 192Thr Met Ala Ala Tyr Lys Val Thr Leu Val Thr Pro Thr Gly Asn Val

50 55 60gag ttt caa tgc cca gac gat gtt tac atc ttg gat gct gct gaa gaa 240Glu Phe Gln Cys Pro Asp Asp Val Tyr Ile Leu Asp Ala Ala Glu Glu65 70 75 80gaa ggc att gac ttg cct tac tca tgc aga gct ggg tcg tgc tct tca 288Glu Gly Ile Asp Leu Pro Tyr Ser Cys Arg Ala Gly Ser Cys Ser Ser

85 90 95tgc gcc gga aag ctt aag aca ggt agt ctt aac caa gat gat cag agt 336Cys Ala Gly Lys Leu Lys Thr Gly Ser Leu Asn Gln Asp Asp Gln Ser

100 105 110ttt ttg gat gac gat cag atc gat gaa gga tgg gtt ctt acc tgt gct 384Phe Leu Asp Asp Asp Gln Ile Asp Glu Gly Trp Val Leu Thr Cys Ala

115 120 125gct tac cct gtt agt gat gtt act att gag acc cac aag gaa gag gag 432Ala Tyr Pro Val Ser Asp Val Thr Ile Glu Thr His Lys Glu Glu Glu

130 135 140ctt act gcc taa 444Leu Thr Ala145<210>25<211>147<212>PRT<213>蔬菜沙门氏菌<400>25Met Ala Ala Thr Thr Thr Thr Met Met Gly Met Ala Thr Thr Phe Val1 5 10 15Pro Lys Pro Gln Ala Pro Pro Met Met Ala Ala Leu Pro Ser Asn Thr

20 25 30Gly Arg Ser Leu Phe Gly Leu Lys Thr Gly Ser Arg Gly Gly Arg Met

35 40 45Thr Met Ala Ala Tyr Lys Val Thr Leu Val Thr Pro Thr Gly Asn Val

50 55 60Glu Phe Gln Cys Pro Asp Asp Val Tyr Ile Leu Asp Ala Ala Glu Glu65 70 75 80Glu Gly Ile Asp Leu Pro Tyr Ser Cys Arg Ala Gly Ser Cys Ser Ser

85 90 95Cys Ala Gly Lys Leu Lys Thr Gly Ser Leu Asn Gln Asp Asp Gln Ser

100 105 110Phe Leu Asp Asp Asp Gln Ile Asp Glu Gly Trp Val Leu Thr Cys Ala

115 120 125Ala Tyr Pro Val Ser Asp Val Thr Ile Glu Thr His Lys Glu Glu Glu

130 135 140Leu Thr Ala145<210>26<211>711<212>DNA<213>费氏弧菌(Vibrio fischeri)<220><221>CDS<222>(1)..(711)<400>26atg cca atc aat tgc aaa gta aag tct atc gag cca ttg gct tgt aat 48Met Pro Ile Asn Cys Lys Val Lys Ser Ile Glu Pro Leu Ala Cys Asn1 5 10 15act ttt cga att tta ctt cac cca gaa cag cct gtt gct ttt aaa gca 96Thr Phe Arg Ile Leu Leu His Pro Glu Gln Pro Val Ala Phe Lys Ala

20 25 30ggc caa tac cta acg gtt gtt atg ggt gaa aaa gac aaa cgc cca ttc 144Gly Gln Tyr Leu Thr Val Val Met Gly Glu Lys Asp Lys Arg Pro Phe

35 40 45tca atc gca agt agt cct tgt cgc cac gaa ggt gaa att gag tta cat 192Ser Ile Ala Ser Ser Pro Cys Arg His Glu Gly Glu Ile Glu Leu His

50 55 60att ggt gcc gca gag cac aat gct tat gcc gga gaa gtg gtt gaa tca 240Ile Gly Ala Ala Glu His Asn Ala Tyr Ala Gly Glu Val Val Glu Ser65 70 75 80atg aaa tcg gca cta gaa acg ggt ggt gat att tta att gat gcg cct 288Met Lys Ser Ala Leu Glu Thr Gly Gly Asp Ile Leu Ile Asp Ala Pro

85 90 95cat ggt gaa gcg tgg atc cgt gaa gac agc gat cgt tca atg tta ttg 336His Gly Glu Ala Trp Ile Arg Glu Asp Ser Asp Arg Ser Met Leu Leu

100 105 110att gct ggc ggt aca ggt ttt agt tac gta cgt tca att ctt gat cac 384Ile Ala Gly Gly Thr Gly Phe Ser Tyr Val Arg Ser Ile Leu Asp His

115 120 125tgt att agc caa cag att caa aaa cca att tac cta tac tgg ggt ggt 432Cys Ile Ser Gln Gln Ile Gln Lys Pro Ile Tyr Leu Tyr Trp Gly Gly

130 135 140cgt gat gaa tgc caa ctg tat gca aaa gca gaa tta gag agc att gct 480Arg Asp Glu Cys Gln Leu Tyr Ala Lys Ala Glu Leu Glu Ser Ile Ala145 150 155 160caa gcg cat agc cat att acg ttt gtg cca gtg gtt gag aaa agt gaa 528Gln Ala His Ser His Ile Thr Phe Val Pro Val Val Glu Lys Ser Glu

165 170 175ggc tgg aca ggt aaa acg ggt aat gtg tta gaa gcg gta aaa gcc gat 576Gly Trp Thr Gly Lys Thr Gly Asn Val Leu Glu Ala Val Lys Als Asp

180 185 190ttt aac tca cta gca gat atg gat att tac atc gca ggt cgc ttt gaa 624Phe Asn Ser Leu Ala Asp Met Asp Ile Tyr Ile Ala Gly Arg Phe Glu

195 200 205atg gct ggt gca gca cgt gag cag ttc acc act gaa aaa caa gcg aag 672Met Ala Gly Ala Ala Arg Glu Gln Phe Thr Thr Glu Lys Gln Ala Lys

210 215 220aaa gag cag ctg ttt ggt gat gca ttc gca ttt atc taa 711Lys Glu Gln Leu Phe Gly Asp Ala Phe Ala Phe Ile225 230 235<210>27<211>236<212>PRT<213>费氏弧菌<400>27Met Pro Ile Asn Cys Lys Val Lys Ser Ile Glu Pro Leu Ala Cys Asn1 5 10 15Thr Phe Arg Ile Leu Leu His Pro Glu Gln Pro Val Ala Phe Lys Ala

20 25 30Gly Gln Tyr Leu Thr Val Val Met Gly Glu Lys Asp Lys Arg Pro Phe

35 40 45Ser Ile Ala Ser Ser Pro Cys Arg His Glu Gly Glu Ile Glu Leu His

50 55 60Ile Gly Ala Ala Glu His Asn Ala Tyr Ala Gly Glu Val Val Glu Ser65 70 75 80Met Lys Ser Ala Leu Glu Thr Gly Gly Asp Ile Leu Ile Asp Ala Pro

85 90 95His Gly Glu Ala Trp Ile Arg Glu Asp Ser Asp Arg Ser Met Leu Leu

100 105 110Ile Ala Gly Gly Thr Gly Phe Ser Tyr Val Arg Ser Ile Leu Asp His

115 120 125Cys Ile Ser Gln Gln Ile Gln Lys Pro Ile Tyr Leu Tyr Trp Gly Gly

130 135 140Arg Asp Glu Cys Gln Leu Tyr Ala Lys Ala Glu Leu Glu Ser Ile Ala145 150 155 160Gln Ala His Ser His Ile Thr Phe Val Pro Val Val Glu Lys Ser Glu

165 170 175Gly Trp Thr Gly Lys Thr Gly Asn Val Leu Glu Ala Val Lys Ala Asp

180 185 190Phe Asn Ser Leu Ala Asp Met Asp Ile Tyr Ile Ala Gly Arg Phe Glu

195 200 205Met Ala Gly Ala Ala Arg Glu Gln Phe Thr Thr Glu Lys Gln Ala Lys

210 215 220Lys Glu Gln Leu Phe Gly Asp Ala Phe Ala Phe Ile225 230 235<210>28<211>1110<212>DNA<213>蔬菜沙门氏菌<220><221>CDS<222>(1)..(1110)<400>28atg acc acc gct gtc acc gcc gct gtt tct ttc ccc tct acc aaa acc 48Met Thr Thr Ala Val Thr Ala Ala Val Ser Phe Pro Ser Thr Lys Thr1 5 10 15acc tct ctc tcc gcc cga agc tcc tcc gtc att tcc cct gac aaa atc 96Thr Ser Leu Ser Ala Arg Ser Ser Ser Val Ile Ser Pro Asp Lys Ile

20 25 30agc tac aaa aag gtt cct ttg tac tac agg aat gta tct gca act ggg 144Ser Tyr Lys Lys Val Pro Leu Tyr Tyr Arg Asn Val Ser Ala Thr Gly

35 40 45aaa atg gga ccc atc agg gcc cag atc gcc tct gat gtg gag gca cct 192Lys Met Gly Pro Ile Arg Ala Gln Ile Ala Ser Asp Val Glu Ala Pro

50 55 60cca cct gct cct gct aag gta gag aaa cat tca aag aaa atg gag gaa 240Pro Pro Ala Pro Ala Lys Val Glu Lys His Ser Lys Lys Met Glu Glu65 70 75 80ggc att aca gtg aac aag ttt aag cct aag acc cct tac gtt gga aga 288Gly Ile Thr Val Ash Lys Phe Lys Pro Lys Thr Pro Tyr Val Gly Arg

85 90 95tgt ctt ctt aac acc aaa att act ggg gat gat gca ccc gga gag acc 336Cys Leu Leu Asn Thr Lys Ile Thr Gly Asp Asp Ala Pro Gly Glu Thr

100 105 110tgg cac atg gtt ttt tcc cat gaa gga gag atc cct tac aga gaa ggg 384Trp His Met Val Phe Ser His Glu Gly Glu Ile Pro Tyr Arg Glu Gly

115 120 125caa tcc gtt ggg gtt att cca gat ggg gaa gac aag aat gga aag ccc 432Gln Ser Val Gly Val Ile Pro Asp Gly Glu Asp Lys Asn Gly Lys Pro

130 135 140cat aag ttg aga ttg tac tcg atc gcc agc agt gct ctt ggt gat ttt 480His Lys Leu Arg Leu Tyr Ser Ile Ala Ser Ser Ala Leu Gly Asp Phe145 150 155 160ggt gat gct aaa tct gtt tcg ttg tgt gta aaa cga ctc atc tac acc 528Gly Asp Ala Lys Ser Val Ser Leu Cys Val Lys Arg Leu Ile Tyr Thr

165 170 175aat gac gct gga gag acg atc aag gga gtc tgc tcc aac ttc ttg tgt 576Asn Asp Ala Gly Glu Thr Ile Lys Gly Val Cys Ser Asn Phe Leu Cys

180 185 190gac ttg aaa ccc ggt gct gaa gtg aag tta aca gga cca gtt gga aag 624Asp Leu Lys Pro Gly Ala Glu Val Lys Leu Thr Gly Pro Val Gly Lys

195 200 205gag atg ctc atg ccc aaa gac cct aac gcg aca att atc atg ctt gga 672Glu Met Leu Met Pro Lys Asp Pro Asn Ala Thr Ile Ile Met Leu Gly

210 215 220act gga acg ggg att gct cct ttc cgt tca ttc ttg tgg aag atg ttc 720Thr Gly Thr Gly Ile Ala Pro Phe Arg Ser Phe Leu Trp Lys Met Phe225 230 235 240ttc gaa aag cat gat gat tac aag ttt aac ggc ttg gct tgg ctt ttc 768Phe Glu Lys His Asp Asp Tyr Lys Phe Asn Gly Leu Ala Trp Leu Phe

245 250 255ttg ggt gta ccc aca agc agt tot ctt ctc tac aaa gag gaa ttt gag 816Leu Gly Val Pro Thr Ser Ser Ser Leu Leu Tyr Lys Glu Glu Phe Glu

260 265 270aag atg aag gaa aag gct cca gac aac ttc agg ctg gat ttt gca gtg 864Lys Met Lys Glu Lys Ala Pro Asp Asn Phe Arg Leu Asp Phe Ala Val

275 280 285agc aga gag caa act aac gag aaa ggg gag aag atg tac att caa acc 912Ser Arg Glu Gln Thr Asn Glu Lys Gly Glu Lys Met Tyr Ile Gln Thr

290 295 300cga atg gca caa tac gca gtt gag cta tgg gaa atg ttg aag aaa gat 960Arg Met Ala Gln Tyr Ala Val Glu Leu Trp Glu Met Leu Lys Lys Asp305 310 315 320aat act tat gtc tac atg tgt ggt ctc aag gga atg gaa aag gga att 1008Asn Thr Tyr Val Tyr Met Cys Gly Leu Lys Gly Met Glu Lys Gly Ile

325 330 335gac gac att atg gtt tca ttg gct gct gca gaa ggc att gat tgg att 1056Asp Asp Ile Met Val Ser Leu Ala Ala Ala Glu Gly Ile Asp Trp Ile

340 345 350gaa tac aag agg cag ttg aag aag gca gaa caa tgg aac gtt gaa gtc 1104Glu Tyr Lys Arg Gln Leu Lys Lys Ala Glu Gln Trp Asn Val Glu Val

355 360 365tac taa 1110Tyr

370<210>29<211>369<212>PRT<213>蔬菜沙门氏菌<400>29Met Thr Thr Ala Val Thr Ala Ala Val Ser Phe Pro Ser Thr Lys Thr1 5 10 15Thr Ser Leu Ser Ala Arg Ser Ser Ser Val Ile Ser Pro Asp Lys Ile

20 25 30Ser Tyr Lys Lys Val Pro Leu Tyr Tyr Arg Asn Val Ser Ala Thr Gly

35 40 45Lys Met Gly Pro Ile Arg Ala Gln Ile Ala Ser Asp Val Glu Ala Pro

50 55 60Pro Pro Ala Pro Ala Lys Val Glu Lys His Ser Lys Lys Met Glu Glu65 70 75 80Gly Ile Thr Val Asn Lys Phe Lys Pro Lys Thr Pro Tyr Val Gly Arg

85 90 95Cys Leu Leu Asn Thr Lys Ile Thr Gly Asp Asp Ala Pro Gly Glu Thr

100 105 110Trp His Met Val Phe Ser His Glu Gly Glu Ile Pro Tyr Arg Glu Gly

115 120 125Gln Ser Val Gly Val Ile Pro Asp Gly Glu Asp Lys Asn Gly Lys Pro

130 135 140His Lys Leu Arg Leu Tyr Ser Ile Ala Ser Ser Ala Leu Gly Asp Phe145 150 155 160Gly Asp Ala Lys Ser Val Ser Leu Cys Val Lys Arg Leu Ile Tyr Thr

165 170 175Asn Asp Ala Gly Glu Thr Ile Lys Gly Val Cys Ser Asn Phe Leu Cys

180 185 190Asp Leu Lys Pro Gly Ala Glu Val Lys Leu Thr Gly Pro Val Gly Lys

195 200 205Glu Met Leu Met Pro Lys Asp Pro Asn Ala Thr Ile Ile Met Leu Gly

210 215 220Thr Gly Thr Gly Ile Ala Pro Phe Arg Ser Phe Leu Trp Lys Met Phe225 230 235 240Phe Glu Lys His Asp Asp Tyr Lys Phe Asn Gly Leu Ala Trp Leu Phe

245 250 255Leu Gly Val Pro Thr Ser Ser Ser Leu Leu Tyr Lys Glu Glu Phe Glu

260 265 270Lys Met Lys Glu Lys Ala Pro Asp Asn Phe Arg Leu Asp Phe Ala Val

275 280 285Ser Arg Glu Gln Thr Asn Glu Lys Gly Glu Lys Met Tyr Ile Gln Thr

290 295 300Arg Met Ala Gln Tyr Ala Val Glu Leu Trp Glu Met Leu Lys Lys Asp305 310 315 320Asn Thr Tyr Val Tyr Met Cys Gly Leu Lys Gly Met Glu Lys Gly Ile

325 330 335Asp Asp Ile Met Val Ser Leu Ala Ala Ala Glu Gly Ile Asp Trp Ile

340 345 350Glu Tyr Lys Arg Gln Leu Lys Lys Ala Glu Gln Trp Asn Val Glu Val

355 360 365Tyr<210>30<2ll>2580<212>DNA<213>寄生曲霉(Aspergillus parasiticus)<220><221>CDS<222>(1)..(2580)<400>30atg gca acc atc acg gag gtt cgg acg gat gcg ctc gtc cca act gac 48Met Ala Thr Ile Thr Glu Val Arg Thr Asp Ala Leu Val Pro Thr Asp 1 5 10 15ctc gtc ctt aag aca ggt cag atc aaa att caa agc gaa gag atc tcg 96Leu Val Leu Lys Thr Gly Gln Ile Lys Ile Gln Ser Glu Glu Ile Ser

20 25 30acg aaa gac ctg tcc gat atc cct ctg cca cca cca tca aaa cgg ccg 144Thr Lys Asp Leu Ser Asp Ile Pro Leu Pro Pro Pro Ser Lys Arg Pro

35 40 45aca gaa gtg ctg agc gta gat aaa gga acc cca gat agc cat gtt ccg 192Thr Glu Val Leu Ser Val Asp Lys Gly Thr Pro Asp Ser His Val Pro

50 55 60cgt gat cct cga ctc atc aga tta acg ggt gtt cat ccg ttt aac gtt 240Arg Asp Pro Arg Leu Ile Arg Leu Thr Gly Val His Pro Phe Asn Val65 70 75 80gag cca cct ctt aca gat ctg tat aaa gaa ggg ttt tta aca tcg ccg 288Glu Pro Pro Leu Thr Asp Leu Tyr Lys Glu Gly Phe Leu Thr Ser Pro

85 90 95gag ctc ttc tat gtt cga aat cat ggc cca gtc cct cat gtc aag gat 336Glu Leu Phe Tyr Val Arg Asn His Gly Pro Val Pro His Val Lys Asp

100 105 110gaa gat atc cct cac tgg gaa att act atc gaa gga ctg gta gag aag 384Glu Asp Ile Pro His Trp Glu Ile Thr Ile Glu Gly Leu Val Glu Lys

115 120 125cct ttg gta cta aac ttc cga caa gtg ttg cag cag tac gac caa ata 432Pro Leu Val Leu Asn Phe Arg Gln Val Leu Gln Gln Tyr Asp Gln Ile

130 135 140acg gcg ccc atc acc ctc gta tgt gca ggc aat cga cgc aaa gag caa 480Thr Ala Pro Ile Thr Leu Val Cys Ala Gly Asn Arg Arg Lys Glu Gln145 150 155 160aac att gta cgt aaa acg aaa ggt ttt tct tgg gga tcc gcg gga cta 528Asn Ile Val Arg Lys Thr Lys Gly Phe Ser Trp Gly Ser Ala Gly Leu

165 170 175tcg act gcc ctc ttc act ggc cca ttg ctg gcg gat atc ctc cgc agt 576Ser Thr Ala Leu Phe Thr Gly Pro Leu Leu Ala Asp Ile Leu Arg Ser

180 185 190ggc aaa ccc ctg cgt caa gcg aaa tac gtc tgt atg gaa gga gcg gat 624Gly Lys Pro Leu Arg Gln Ala Lys Tyr Val Cys Met Glu Gly Ala Asp

195 200 205aag ctg ccc aat ggt cac tac ggc aca ctc att aaa ttg aac tgg gcc 672Lys Leu Pro Asn Gly His Tyr Gly Thr Leu Ile Lys Leu Asn Trp Ala

210 215 220cta gac ccc aac agg ggg atc atg ctt gca cat aaa atg aac ggg gag 720Leu Asp Pro Asn Arg Gly Ile Met Leu Ala His Lys Met Asn Gly Glu225 230 235 240tct ctt cgc cca gat cat ggt cgt ccg ctg agg gcc gtc gtg ccc ggt 768Ser Leu Arg Pro Asp His Gly Arg Pro Leu Arg Ala Val Val Pro Gly

245 250 255caa ata gga gga cga agt gtc aag tgg ctg aag agg ctg atc ttg acc 816Gln Ile Gly Gly Arg Ser Val Lys Trp Leu Lys Arg Leu Ile Leu Thr

260 265 270gat gca cca agc gat aac tgg tac cat atc aat gac aac cgc gtc tta 864Asp Ala Pro Ser Asp Asn Trp Tyr His Ile Asn Asp Asn Arg Val Leu

275 280 285cca aca atg gtc tcg ccc gat atg gca tca aat aac cga aat tgg tgg 912Pro Thr Met Val Ser Pro Asp Met Ala Ser Asn Asn Arg Asn Trp Trp

290 295 300cac gat gag cgg gat gcg att tat gac cta aac acc aac tcc gcc gtt 960His Asp Glu Arg Asp Ala Ile Tyr Asp Leu Asn Thr Asn Ser Ala Val305 310 315 320gga tat cct caa aac aat gag gtc tta aat atc ctg gag gcc agg gcc 1008Gly Tyr Pro Gln Asn Asn Glu Val Leu Asn Ile Leu Glu Ala Arg Ala

325 330 335gtc ata tac tgt cag agg ata gct tac gct ggt ggg ggc cgt agg gtt 1056Val Ile Tyr Cys Gln Arg Ile Ala Tyr Ala Gly Gly Gly Arg Arg Val

340 345 350acc agg gta gaa ata tcc cta gac aaa ggc aaa tct tgg aga ttg gcg 1104Thr Arg Val Glu Ile Ser Leu Asp Lys Gly Lys Ser Trp Arg Leu Ala

355 360 365gat atc gaa tat gcc gaa gac aag tat cgt gat ttc gaa ggc gag ctt 1152Asp Ile Glu Tyr Ala Glu Asp Lys Tyr Arg Asp Phe Glu Gly Glu Leu

370 375 380ttt gga ggc aaa gta gat atg tac tgg cgc gaa act tgc ttc tgc tgg 1200Phe Gly Gly Lys Val Asp Met Tyr Trp Arg Glu Thr Cys Phe Cys Trp385 390 395 400tgt ttt tgg tct cta agc atc gcc atc cca gag ctt gag aac agt gat 1248Cys Phe Trp Ser Leu Ser Ile Ala Ile Pro Glu Leu Glu Asn Ser Asp

405 410 415gcc atc ctt gta aga gcc atg gat gaa gca ttg ggc gtg cag cct cgc 1296Ala Ile Leu Val Arg Ala Met Asp Glu Ala Leu Gly Val Gln Pro Arg

420 425 430gat atg tac tgg tcc gtt ctc gga atg atg aac aac cct tgg ttc cgg 1344Asp Met Tyr Trp Ser Val Leu Gly Met Met Asn Asn Pro Trp Phe Arg

435 440 445gtt aca att acg aag gaa aac ggg aac ttg aga ttc gag cac cct acc 1392Val Thr Ile Thr Lys Glu Asn Gly Asn Leu Arg Phe Glu His Pro Thr

450 455 460cac cct agt atg cct aca gga tgg atg gaa cgc gtc aaa aaa gct ggg 1440His Pro Ser Met Pro Thr Gly Trp Met Glu Arg Val Lys Lys Ala Gly465 470 475 480ggt gac ccg acg aat ggt aac tgg gga gaa aga cac gaa gga gag gag 1488Gly Asp Pro Thr Asn Gly Asn Trp Gly Glu Arg His Glu Gly Glu Glu

485 490 495ccg acg gag ccg gag ccc gtg caa gac att aat atg aag aaa gac ggg 1536Pro Thr Glu Pro Glu Pro Val Gln Asp Ile Asn Met Lys Lys Asp Gly

500 505 510cca agc cga acg att agt ttt gaa gaa ttc aag gag aat tcc tgt gat 1584Pro Ser Arg Thr Ile Ser Phe Glu Glu Phe Lys Glu Asn Ser Cys Asp

515 520 525gag aag cca tgg ttc atc gtg aat gga gaa gtg tat gat ggt caa gca 1632Glu Lys Pro Trp Phe Ile Val Asn Gly Glu Val Tyr Asp Gly Gln Ala

530 535 540ttt ctt gaa ggc cac cct ggc gga cgg cag agt att atc tcc tct gcc 1680Phe Leu Glu Gly His Pro Gly Gly Arg Gln Ser Ile Ile Ser Ser Ala545 550 555 560ggt cag gac gtc tcc gag gaa ttc ctt gct att cat agc gag acg gca 1728Gly Gln Asp Val Ser Glu Glu Phe Leu Ala Ile His Ser Glu Thr Ala

565 570 575aag gcg atg atg cct gag tac cat att gga acg acg gat ccg gaa ggc 1776Lys Ala Met Met Pro Glu Tyr His Ile Gly Thr Thr Asp Pro Glu Gly

580 585 590ttg ata gca ctc aag gat gat gca tca tcc tcc acc gat gaa att cgc 1824Leu Ile Ala Leu Lys Asp Asp Ala Ser Ser Ser Thr Asp Glu Ile Arg

595 600 605cca gtg ttc ctc caa tca cgg tct tgg aca aag gca aca ttg aaa gaa 1872Pro Val Phe Leu Gln Ser Arg Ser Trp Thr Lys Ala Thr Leu Lys Glu

610 615 620agg aaa gac ata tca tgg gat aca cga ata ttt agt ttc aaa ttg gaa 1920Arg Lys Asp Ile Ser Trp Asp Thr Arg Ile Phe Ser Phe Lys Leu Glu625 630 635 640cac gaa gat caa aca ttg ggt tta cca gtc ggc cag cat ctt atg atc 1968His Glu Asp Gln Thr Leu Gly Leu Pro Val Gly Gln His Leu Met Ile

645 650 655aaa gtc ctc gac aga tca tcc aac aac gaa gcc atc atc cgc tca tac 2016Lys Val Leu Asp Arg Ser Ser Ash Asn Glu Ala Ile Ile Arg Ser Tyr

660 665 670acc ccg att tct gaa acc agc caa aaa ggg act gtg gac ttg ctg gtt 2064Thr Pro Ile Ser Glu Thr Ser Gln Lys Gly Thr Val Asp Leu Leu Val

675 680 685aaa gta tac ttt gca aca gcc acc tcg gca ggc ggc aag atg acg atg 2112Lys Val Tyr Phe Ala Thr Ala Thr Ser Ala Gly Gly Lys Met Thr Met

690 695 700gcc ctg gat agg ctg cca ttg ggc tcc gtg gtc gaa tat ctt gga aat 2160Ala Leu Asp Arg Leu Pro Leu Gly Ser Val Val Glu Tyr Leu Gly Asn705 710 715 720gga cga gtt ctc ata agt ggc aag gag cgc cat gtt cgg tcg ttt aag 2208Gly Arg Val Leu Ile Ser Gly Lys Glu Arg His Val Arg Ser Phe Lys

725 730 735atg att tgt gga gga acc ggt atc aca ccg atc ttg cag gtc ttg cgc 2256Met Ile Cys Gly Gly Thr Gly Ile Thr Pro Ile Leu Gln Val Leu Arg

740 745 750gcc gtg gtt cag gac cat caa gat cct acc tct tgt gta gtc ctc aat 2304Ala Val Val Gln Asp His Gln Asp Pro Thr Ser Cys Val Val Leu Asn

755 760 765gga aac aga cag gag gaa gat atc ctt cgc cgg gct gag ctc gac ggc 2352Gly Asn Arg Gln Glu Glu Asp Ile Leu Arg Arg Ala Glu Leu Asp Gly

770 775 780ttc atg gcg tcc gac agc aga agg tgt aat ata ata cac act cta tcc 2400Phe Met Ala Ser Asp Ser Arg Arg Cys Asn Ile Ile His Thr Leu Ser785 790 795 800aaa gcg ccg gac tca tgg act ggc cgc cga gga cgc ata tcc gaa gag 2448Lys Ala Pro Asp Ser Trp Thr Gly Arg Arg Gly Arg Ile Ser Glu Glu

805 810 815ctc cta aag gag tac gcg gct cca gaa gat gag agt atg gta ctg att 2496Leu Leu Lys Glu Tyr Ala Ala Pro Glu Asp Glu Ser Met Val Leu Ile

820 825 830tgt ggt ccg cca gcc atg gaa gaa tcg gct cgg agg ata ctg ttg gcg 2544Cys Gly Pro Pro Ala Met Glu Glu Ser Ala Arg Arg Ile Leu Leu Ala

835 840 845gaa gga tgg aaa gaa tca gac ctt cac ttt ttc tga 2580Glu Gly Trp Lys Glu Ser Asp Leu His Phe Phe

850 855 860<210>31<211>859<212>PRT<213>寄生曲霉<400>31Met Ala Thr Ile Thr Glu Val Arg Thr Asp Ala Leu Val Pro Thr Asp1 5 10 15Leu Val Leu Lys Thr Gly Gln Ile Lys Ile Gln Ser Glu Glu Ile Ser

20 25 30Thr Lys Asp Leu Ser Asp Ile Pro Leu Pro Pro Pro Ser Lys Arg Pro

35 40 45Thr Glu Val Leu Ser Val Asp Lys Gly Thr Pro Asp Ser His Val Pro

50 55 60Arg Asp Pro Arg Leu Ile Arg Leu Thr Gly Val His Pro Phe Asn Val65 70 75 80Glu Pro Pro Leu Thr Asp Leu Tyr Lys Glu Gly Phe Leu Thr Ser Pro

85 90 95Glu Leu Phe Tyr Val Arg Asn His Gly Pro Val Pro His Val Lys Asp

100 105 110Glu Asp Ile Pro His Trp Glu Ile Thr Ile Glu Gly Leu Val Glu Lys

115 120 125Pro Leu Val Leu Asn Phe Arg Gln Val Leu Gln Gln Tyr Asp Gln Ile

130 135 140Thr Ala Pro Ile Thr Leu Val Cys Ala Gly Asn Arg Arg Lys Glu Gln145 150 155 160Asn Ile Val Arg Lys Thr Lys Gly Phe Ser Trp Gly Ser Ala Gly Leu

165 170 175Ser Thr Ala Leu Phe Thr Gly Pro Leu Leu Ala Asp Ile Leu Arg Ser

180 185 190Gly Lys Pro Leu Arg Gln Ala Lys Tyr Val Cys Met Glu Gly Ala Asp

195 200 205Lys Leu Pro Asn Gly His Tyr Gly Thr Leu Ile Lys Leu Asn Trp Ala

210 215 220Leu Asp Pro Asn Arg Gly Ile Met Leu Ala His Lys Met Asn Gly Glu225 230 235 240Ser Leu Arg Pro Asp His Gly Arg Pro Leu Arg Ala Val Val Pro Gly

245 250 255Gln Ile Gly Gly Arg Ser Val Lys Trp Leu Lys Arg Leu Ile Leu Thr

260 265 270Asp Ala Pro Ser Asp Asn Trp Tyr His Ile Asn Asp Asn Arg Val Leu

275 280 285Pro Thr Met Val Ser Pro Asp Met Ala Ser Asn Asn Arg Asn Trp Trp

290 295 300His Asp Glu Arg Asp Ala Ile Tyr Asp Leu Asn Thr Asn Ser Ala Val305 310 315 320Gly Tyr Pro Gln Asn Asn Glu Val Leu Asn Ile Leu Glu Ala Arg Ala

325 330 335Val Ile Tyr Cys Gln Arg Ile Ala Tyr Ala Gly Gly Gly Arg Arg Val

340 345 350Thr Arg Val Glu Ile Ser Leu Asp Lys Gly Lys Ser Trp Arg Leu Ala

355 360 365Asp Ile Glu Tyr Ala Glu Asp Lys Tyr Arg Asp Phe Glu Gly Glu Leu

370 375 380Phe Gly Gly Lys Val Asp Met Tyr Trp Arg Glu Thr Cys Phe Cys Trp385 390 395 400Cys Phe Trp Ser Leu Ser Ile Ala Ile Pro Glu Leu Glu Asn Ser Asp

405 410 415Ala Ile Leu Val Arg Ala Met Asp Glu Ala Leu Gly Val Gln Pro Arg

420 425 430Asp Met Tyr Trp Ser Val Leu Gly Met Met Asn Asn Pro Trp Phe Arg

435 440 445Val Thr Ile Thr Lys Glu Asn Gly Asn Leu Arg Phe Glu His Pro Thr

450 455 460His Pro Ser Met Pro Thr Gly Trp Met Glu Arg Val Lys Lys Ala Gly465 470 475 480Gly Asp Pro Thr Asn Gly Asn Trp Gly Glu Arg His Glu Gly Glu Glu

485 490 495Pro Thr Glu Pro Glu Pro Val Gln Asp Ile Asn Met Lys Lys Asp Gly

500 505 510Pro Ser Arg Thr Ile Ser Phe Glu Glu Phe Lys Glu Asn Ser Cys Asp

515 520 525Glu Lys Pro Trp Phe Ile Val Asn Gly Glu Val Tyr Asp Gly Gln Ala

530 535 540Phe Leu Glu Gly His Pro Gly Gly Arg Gln Ser Ile Ile Ser Ser Ala545 550 555 560Gly Gln Asp Val Ser Glu Glu Phe Leu Ala Ile His Ser Glu Thr Ala

565 570 575Lys Ala Met Met Pro Glu Tyr His Ile Gly Thr Thr Asp Pro Glu Gly

580 585 590Leu Ile Ala Leu Lys Asp Asp Ala Ser Ser Ser Thr Asp Glu Ile Arg

595 600 605Pro Val Phe Leu Gln Ser Arg Ser Trp Thr Lys Ala Thr Leu Lys Glu

610 615 620Arg Lys Asp Ile Ser Trp Asp Thr Arg Ile Phe Ser Phe Lys Leu Glu625 630 635 640His Glu Asp Gln Thr Leu Gly Leu Pro Val Gly Gln His Leu Met Ile

645 650 655Lys Val Leu Asp Arg Ser Ser Asn Asn Glu Ala Ile Ile Arg Ser Tyr

660 665 670Thr Pro Ile Ser Glu Thr Ser Gln Lys Gly Thr Val Asp Leu Leu Val

675 680 685Lys Val Tyr Phe Ala Thr Ala Thr Ser Ala Gly Gly Lys Met Thr Met

690 695 700Ala Leu Asp Arg Leu Pro Leu Gly Ser Val Val Glu Tyr Leu Gly Asn705 710 715 720Gly Arg Val Leu Ile Ser Gly Lys Glu Arg His Val Arg Ser Phe Lys

725 730 735Met Ile Cys Gly Gly Thr Gly Ile Thr Pro Ile Leu Gln Val Leu Arg

740 745 750Ala Val Val Gln Asp His Gln Asp Pro Thr Ser Cys Val Val Leu Asn

755 760 765Gly Asn Arg Gln Glu Glu Asp Ile Leu Arg Arg Ala Glu Leu Asp Gly

770 775 780Phe Met Ala Ser Asp Ser Arg Arg Cys Asn Ile Ile His Thr Leu Ser785 790 795 800Lys Ala Pro Asp Ser Trp Thr Gly Arg Arg Gly Arg Ile Ser Glu Glu

805 810 815Leu Leu Lys Glu Tyr Ala Ala Pro Glu Asp Glu Ser Met Val Leu Ile

820 825 830Cys Gly Pro Pro Ala Met Glu Glu Ser Ala Arg Arg Ile Leu Leu Ala

835 840 845Glu Gly Trp Lys Glu Ser Asp Leu His Phe Phe

850 855<210>32<211>37<212>DNA<213>人工<220><223>引物<220><221>misc feature<222>(1)..(37)<400>32gcgcgaattc atgacaacct taagctgtaa agtgacc 37<210>33<211>34<212>DNA<213>人工<220><223>引物<220><221>misc feature<222>(1)..(34)<400>33gcgcctgcag tcagataaat gcaaacgcat cgcc 34<210>34<211>26019<212>DNA<213>合成<220><221>启动子<222>(233)..(1582)<220><221>内含子<222>(1583)..(1958)<220><221>基因<222>(1969)..(3585)<223>PrnA<220><221>终子<222>(3603)..(3877)<220><221>启动子<222>(3888)..(5237)<220><221>内含子<222>(5238)..(5613)<220><221>基因<222>(5624)..(7327)<223>prnC<220><221>终止子<222>(7338)..(7612)<220><221>启动子<222>(7636)..(8985)<220><221>内含子<222>(8986)..(9361)<220><221>基因<222>(9372)..(10457)<223>PrnB<220><221>终止子<222>(10464)..(10738)<220><221>启动子<222>(10749)..(12098)<220><221>内含子<222>(12099)..(12474)<220><221>基因<222>(12485)..(13576)<223>PrnD<220><221>终止子<222>(13583)..(13857)<220><221>启动子<222>(13942)..(14942)<220><221>基因<222>(14948)..(15649)<223>fre<220><22l>终止子<222>(15655)..(15936)<220><221>启动子<222>(15949)..(17285)<220><221>内含子<222>(17283)..(17679)<220><22l>基因<222>(17696)..(18238)<223>选择标记<220><221>终子<222>(18245)..(18526)<400>34tggggaaccc tgtggttggc atgcacatac aaatggacga acggataaac cttttcacgc 60ccttttaaat atccgattat tctaataaac gctcttttct cttaggttta cccgccaata 120tatcctgtca aacactgata gtttaaactg aaggcgggaa acgacaatct gatctatcgt 180tctagtcgta cgttttgcga tcggtctcac tagagcggcc gcctcgaggt accggatttg 240gagccaagtc tcataaacgc cattgtggaa gaaagtcttg agttggtggt aatgtaacag 300agtagtaaga acagagaaga gagagagtgt gagatacatg aattgtcggg caacaaaaat 360cctgaacatc ttattttagc aaagagaaag agttccgagt ctgtagcaga agagtgagga 420gaaatttaag ctcttggact tgtgaattgt tccgcctctt gaatacttct tcaatcctca 480tatattcttc ttctatgtta cctgaaaacc ggcatttaat ctcgcgggtt tattccggtt 540caacattttt tttgttttga gttattatct gggcttaata acgcaggcct gaaataaatt 600caaggcccaa ctgttttttt ttttaagaag ttgctgttaa aaaaaaaaaa agggaattaa 660caacaacaac aaaaaaagat aaagaaaata ataacaatta ctttaattgt agactaaaaa 720aacatagatt ttatcatgaa aaaaagagaa aagaaataaa aacttggatc aaaaaaaaaa 780acatacagat cttctaatta ttaacttttc ttaaaaatta ggtccttttt cccaacaatt 840aggtttagag ttttggaatt aaaccaaaaa gattgttcta aaaaatactc aaatttggta 900gataagtttc cttattttaa ttagtcaatg gtagatactt ttttttcttt tctttattag 960agtagattag aatcttttat gccaagtttt gataaattaa atcaagaaga taaactatca 1020taatcaacat gaaattaaaa gaaaaatctc atatatagta ttagtattct ctatatatat 1080tatgattgct tattcttaat gggttgggtt aaccaagaca tagtcttaat ggaaagaatc 1140ttttttgaac tttttcctta ttgattaaat tcttctatag aaaagaaaga aattatttga 1200ggaaaagtat atacaaaaag aaaaatagaa aaatgtcagt gaagcagatg taatggatga 1260cctaatccaa ccaccaccat aggatgtttc tacttgagtc ggtcttttaa aaacgcacgg 1320tggaaaatat gacacgtatc atatgattcc ttcctttagt ttcgtgataa taatcctcaa 1380ctgatatctt cctttttttg ttttggctaa agatatttta ttctcattaa tagaaaagac 1440ggttttgggc ttttggtttg cgatataaag aagaccttcg tgtggaagat aataattcat 1500cctttcgtct ttttctgact cttcaatctc tcccaaagcc taaagcgatc tctgcaaatc 1560tctcgcgact ctctctttca aggtatattt tctgattctt tttgtttttg attcgtatct 1620gatctccaat ttttgttatg tggattattg aatcttttgt ataaattgct tttgacaata 1680ttgttcgttt cgtcaatcca gcttctaaat tttgtcctga ttactaagat atcgattcgt 1740agtgtttaca tctgtgtaat ttcttgcttg attgtgaaat taggattttc aaggacgatc 1800tattcaattt ttgtgttttc tttgttcgat tctctctgtt ttaggtttct tatgtttaga 1860tccgtttctc tttggtgttg ttttgatttc tcttacggct tttgatttgg tatatgttcg 1920ctgattggtt tctacttgtt ctattgtttt atttcaggtg gatccaccat gaacaagccg 1980atcaagaata tcgtcatcgt gggcggcggt actgcgggct ggatggccgc ctcgtacctc 2040gtccgggccc tccaacagca ggcgaacatt acgctcatcg aatctgcggc gatccctcgg 2100atcggcgtgg gcgaagcgac catcccaagt ttgcagaagg tgttcttcga tttcctcggg 2160ataccggagc gggaatggat gccccaagtg aacggcgcgt tcaaggccgc gatcaagttc 2220gtgaattgga gaaagtctcc cgacccctcg cgcgacgatc acttctacca tttgttcggc 2280aacgtgccga actgcgacgg cgtgccgctt acccactact ggctgcgcaa gcgcgaacag 2340ggcttccagc agccgatgga gtacgcgtgc tacccgcagc ccggggcact cgacggcaag 2400ctggcaccgt gcctgtccga cggcacccgc cagatgtccc acgcgtggca cttcgacgcg 2460cacctggtgg ccgacttctt gaagcgctgg gccgtcgagc gcggggtgaa ccgcgtggtc 2520gatgaggtgg tggacgttcg cctgaacaac cgcggctaca tctccaacct gctcaccaag 2580gaggggcgga cgctggaggc ggacctgttc atcgactgct ccggcatgcg ggggctcctg 2640atcaatcagg cgctgaagga acccttcatc gacatgtccg actacctgct gtgcgacagc 2700gcggtcgcca gcgccgtgcc caacgacgac gcgcgcgatg gggtcgagcc gtacacctcc 2760tcgatcgcca tgaactcggg atggacctgg aagattccga tgctgggccg gttcggcagc 2820ggctacgtct tctcgagcca tttcacctcg cgcgaccagg ccaccgccga cttcctcaaa 2880ctctggggcc tctcggacaa tcagccgctc aaccagatca agttccgggt cgggcgcaac 2940aagcgggcgt gggtcaacaa ctgcgtctcg atcgggctgt cgtcgtgctt tctggagccc 3000ctggaatcga cggggatcta cttcatctac gcggcgcttt accagctcgt gaagcacttc 3060cccgacacct cgttcgaccc gcggctgagc gacgctttca acgccgagat cgtccacatg 3120ttcgacgact gccgggattt cgtccaagcg cactatttca ccacgtcgcg cgatgacacg 3180ccgttctggc tcgcgaaccg gcacgacctg cggctctcgg acgccatcaa agagaaggtt 3240cagcgctaca aggcggggct gccgctgacc accacgtcgt tcgacgattc cacgtactac 3300gagaccttcg actacgaatt caagaatttc tggttgaacg gcaactacta ctgcatcttt 3360gccggcttgg gcatgctgcc cgaccggtcg ctgccgctgt tgcagcaccg accggagtcg 3420atcgagaaag ccgaggcgat gttcgccagc atccggcgcg aggccgagcg tctgcgcacc 3480agcctgccga caaactacga ctacctgcgg tcgctgcgtg acggcgacgc ggggctgtcg 3540cgcggccagc gtgggccgaa gctcgcagcg caggaaagcc tgtagtggaa cgcaccttgg 3600aggatccccc gaatttcccc gatcgttcaa acatttggca ataaagtttc ttaagattga 3660atcctgttgc cggtcttgcg atgattatca tctaatttct gttgaattac gttaagcatg 3720taataattaa catgtaatgc atgacgttat ttatgagatg ggtttttatg attagagtcc 3780cgcaattata catttaatac gcgatagaaa acaaaatata gcgcgcaaac taggataaat 3840tatcgcgcgc ggtgtcatct atgttactag atccgggaat tgggtaccgg atttggagcc 3900aagtctcata aacgccattg tggaagaaag tcttgagttg gtggtaatgt aacagagtag 3960taagaacaga gaagagagag agtgtgagat acatgaattg tcgggcaaca aaaatcctga 4020acatcttatt ttagcaaaga gaaagagttc cgagtctgta gcagaagagt gaggagaaat 4080ttaagctctt ggacttgtga attgttccgc ctcttgaata cttcttcaat cctcatatat 4140tcttcttcta tgttacctga aaaccggcat ttaatctcgc gggtttattc cggttcaaca 4200ttttttttgt tttgagttat tatctgggct taataacgca ggcctgaaat aaattcaagg 4260cccaactgtt ttttttttta agaagttgct gttaaaaaaa aaaaaaggga attaacaaca 4320acaacaaaaa aagataaaga aaataataac aattacttta attgtagact aaaaaaacat 4380agattttatc atgaaaaaaa gagaaaagaa ataaaaactt ggatcaaaaa aaaaaacata 4440cagatcttct aattattaac ttttcttaaa aattaggtcc tttttcccaa caattaggtt 4500tagagttttg gaattaaacc aaaaagattg ttctaaaaaa tactcaaatt tggtagataa 4560gtttccttat tttaattagt caatggtaga tacttttttt tcttttcttt attagagtag 4620attagaatct tttatgccaa gttttgataa attaaatcaa gaagataaac tatcataatc 4680aacatgaaat taaaagaaaa atctcatata tagtattagt attctctata tatattatga 4740ttgcttattc ttaatgggtt gggttaacca agacatagtc ttaatggaaa gaatcttttt 4800tgaacttttt ccttattgat taaattcttc tatagaaaag aaagaaatta tttgaggaaa 4860agtatataca aaaagaaaaa tagaaaaatg tcagtgaagc agatgtaatg gatgacctaa 4920tccaaccacc accataggat gtttctactt gagtcggtct tttaaaaacg cacggtggaa 4980aatatgacac gtatcatatg attccttcct ttagtttcgt gataataatc ctcaactgat 5040atcttccttt ttttgttttg gctaaagata ttttattctc attaatagaa aagacggttt 5100tgggcttttg gtttgcgata taaagaagac cttcgtgtgg aagataataa ttcatccttt 5160cgtctttttc tgactcttca atctctccca aagcctaaag cgatctctgc aaatctctcg 5220cgactctctc tttcaaggta tattttctga ttctttttgt ttttgattcg tatctgatct 5280ccaatttttg ttatgtggat tattgaatct tttgtataaa ttgcttttga caatattgtt 5340cgtttcgtca atccagcttc taaattttgt cctgattact aagatatcga ttcgtagtgt 5400ttacatctgt gtaatttctt gcttgattgt gaaattagga ttttcaagga cgatctattc 5460aatttttgtg ttttctttgt tcgattctct ctgttttagg tttcttatgt ttagatccgt 5520ttctctttgg tgttgttttg atttctctta cggcttttga tttggtatat gttcgctgat 5580tggtttctac ttgttctatt gttttatttc aggtggatcc accatgactc agaagagccc 5640cgcgaacgaa cacgatagca atcacttcga cgtaatcatc ctcggctcgg gcatgtccgg 5700cacccagatg ggggccatct tggccaaaca acagtttcgc gtgctgatca tcgaggagtc 5760gtcgcacccg cggttcacga tcggcgaatc gtcgatcccc gagacgtctc ttatgaaccg 5820catcatcgct gatcgctacg gcattccgga gctcgaccac atcacgtcgt tttattcgac 5880gcaacgttac gtcgcgtcga gcacgggcat taagcgcaac ttcggcttcg tgttccacaa 5940gcccggccag gagcacgacc cgaaggagtt cacccagtgc gtcattcccg agctgccgtg 6000ggggccggag agccattatt accggcaaga cgtcgacgcc tacttgttgc aagccgccat 6060taaatacggc tgcaaggtcc accagaaaac taccgtgacc gaataccacg ccgataaaga 6120cggcgtcgcg gtgaccaccg cccagggcga acggttcacc ggccggtaca tgatcgactg 6180cggaggacct cgcgcgccgc tcgcgaccaa gttcaagctc cgcgaagaac cgtgtcgctt 6240caagacgcac tcgcgcagcc tctacacgca catgctcggg gtcaagccgt tcgacgacat 6300cttcaaggtc aaggggcagc gctggcgctg gcacgagggg accttgcacc acatgttcga 6360gggcggctgg ctctgggtga ttccgttcaa caaccacccg cggtcgacca acaacctggt 6420gagcgtcggc ctgcagctcg acccgcgtgt ctacccgaaa accgacatct ccgcacagca 6480ggaattcgat gagttcctcg cgcggttccc gagcatcggg gctcagttcc gggacgccgt 6540gccggtgcgc gactgggtca agaccgaccg cctgcaattc tcgtcgaacg cctgcgtcgg 6600cgaccgctac tgcctgatgc tgcacgcgaa cggcttcatc gacccgctct tctcccgggg 6660gctggaaaac accgcggtga ccatccacgc gctcgcggcg cgcctcatca aggcgctgcg 6720cgacgacgac ttctcccccg agcgcttcga gtacatcgag cgcctgcagc aaaagctttt 6780ggaccacaac gacgacttcg tcagctgctg ctacacggcg ttctcggact tccgcctatg 6840ggacgcgttc cacaggctgt gggcggtcgg caccatcctc gggcagttcc ggctcgtgca 6900ggcccacgcg aggttccgcg cgtcgcgcaa cgagggcgac ctcgatcacc tcgacaacga 6960ccctccgtat ctcggatacc tgtgcgcgga catggaggag tactaccagt tgttcaacga 7020cgccaaagcc gaggtcgagg ccgtgagtgc cgggcgcaag ccggccgatg aggccgcggc 7080gcggattcac gccctcattg acgaacgaga cttcgccaag ccgatgttcg gcttcgggta 7140ctgcatcacc ggggacaagc cgcagctcaa caactcgaag tacagcctgc tgccggcgat 7200gcggctgatg tactggacgc aaacccgcgc gccggcagag gtgaaaaagt acttcgacta 7260caacccgatg ttcgcgctgc tcaaggcgta catcacgacc cgcatcggcc tggcgctgaa 7320gaagtagccg ctcgagggat cccccgaatt tccccgatcg ttcaaacatt tggcaataaa 7380gtttcttaag attgaatcct gttgccggtc ttgcgatgat tatcatctaa tttctgttga 7440attacgttaa gcatgtaata attaacatgt aatgcatgac gttatttatg agatgggttt 7500ttatgattag agtcccgcaa ttatacattt aatacgcgat agaaaacaaa atatagcgcg 7560caaactagga taaattatcg cgcgcggtgt catctatgtt actagatccg ggaattagcg 7620gccgcctcga ggtaccggat ttggagccaa gtctcataaa cgccattgtg gaagaaagtc 7680ttgagttggt ggtaatgtaa cagagtagta agaacagaga agagagagag tgtgagatac 7740atgaattgtc gggcaacaaa aatcctgaac atcttatttt agcaaagaga aagagttccg 7800agtctgtagc agaagagtga ggagaaattt aagctcttgg acttgtgaat tgttccgcct 7860cttgaatact tcttcaatcc tcatatattc ttcttctatg ttacctgaaa accggcattt 7920aatctcgcgg gtttattccg gttcaacatt ttttttgttt tgagttatta tctgggctta 7980ataacgcagg cctgaaataa attcaaggcc caactgtttt tttttttaag aagttgctgt 8040taaaaaaaaa aaaagggaat taacaacaac aacaaaaaaa gataaagaaa ataataacaa 8100ttactttaat tgtagactaa aaaaacatag attttatcat gaaaaaaaga gaaaagaaat 8160aaaaacttgg atcaaaaaaa aaaacataca gatcttctaa ttattaactt ttcttaaaaa 8220ttaggtcctt tttcccaaca attaggttta gagttttgga attaaaccaa aaagattgtt 8280ctaaaaaata ctcaaatttg gtagataagt ttccttattt taattagtca atggtagata 8340cttttttttc ttttctttat tagagtagat tagaatcttt tatgccaagt tttgataaat 8400taaatcaaga agataaacta tcataatcaa catgaaatta aaagaaaaat ctcatatata 8460gtattagtat tctctatata tattatgatt gcttattctt aatgggttgg gttaaccaag 8520acatagtctt aatggaaaga atcttttttg aactttttcc ttattgatta aattcttcta 8580tagaaaagaa agaaattatt tgaggaaaag tatatacaaa aagaaaaata gaaaaatgtc 8640agtgaagcag atgtaatgga tgacctaatc caaccaccac cataggatgt ttctacttga 8700gtcggtcttt taaaaacgca cggtggaaaa tatgacacgt atcatatgat tccttccttt 8760agtttcgtga taataatcct caactgatat cttccttttt ttgttttggc taaagatatt 8820ttattctcat taatagaaaa gacggttttg ggcttttggt ttgcgatata aagaagacct 8880tcgtgtggaa gataataatt catcctttcg tctttttctg actcttcaat ctctcccaaa 8940gcctaaagcg atctctgcaa atctctcgcg actctctctt tcaaggtata ttttctgatt 9000ctttttgttt ttgattcgta tctgatctcc aatttttgtt atgtggatta ttgaatcttt 9060tgtataaatt gcttttgaca atattgttcg tttcgtcaat ccagcttcta aattttgtcc 9120tgattactaa gatatcgatt cgtagtgttt acatctgtgt aatttcttgc ttgattgtga 9180aattaggatt ttcaaggacg atctattcaa tttttgtgtt ttctttgttc gattctctct 9240gttttaggtt tcttatgttt agatccgttt ctctttggtg ttgttttgat ttctcttacg 9300gcttttgatt tggtatatgt tcgctgattg gtttctactt gttctattgt tttatttcag 9360gtggatccac catggaacgc accttggacc gggtaggcgt attcgcggcc acccacgctg 9420ccgtggcggc ctgcgatccg ctgcaggcgc gcgcgctcgt tctgcaactg ccgggcctga 9480accgtaacaa ggacgtgccc ggtatcgtcg gcctgctgcg cgagttcctt ccggtgcgcg 9540gcctgccctg cggctggggt ttcgtcgaag ccgccgccgc gatgcgggac atcgggttct 9600tcctggggtc gctcaagcgc cacggacatg agcccgcgga ggtggtgccc gggcttgagc 9660cggtgctgct cgacctggca cgcgcgacca acctgccgcc gcgcgagacg ctcctgcatg 9720tgacggtctg gaaccccacg gcggccgacg cgcagcgcag ctacaccggg ctgcccgacg 9780aagcgcacct gctcgagagc gtgcgcatct cgatggcggc cctcgaggcg gccatcgcgt 9840tgaccgtcga gctgttcgat gtgtccctgc ggtcgcccga gttcgcgcaa aggtgcgacg 9900agctggaagc ctatctgcag aaaatggtcg aatcgatcgt ctacgcgtac cgcttcatct 9960cgccgcaggt cttctacgat gagctgcgcc ccttctacga accgattcga gtcgggggcc 10020agagctacct cggccccggt gccgtagaga tgcccctctt cgtgctggag cacgtcctct 10080ggggctcgca atcggacgac caaacttatc gagaattcaa agagacgtac ctgccctatg 10140tgcttcccgc gtacagggcg gtctacgctc ggttctccgg ggagccggcg ctcatcgacc 10200gcgcgctcga cgaggcgcga gcggtcggta cgcgggacga gcacgtccgg gctgggctga 10260cagccctcga gcgggtcttc aaggtcctgc tgcgcttccg ggcgcctcac ctcaaattgg 10320cggagcgggc gtacgaagtc gggcaaagcg gccccgaaat cggcagcggg gggtacgcgc 10380ccagcatgct cggtgagctg ctcacgctga cgtatgccgc gcggtcccgc gtccgcgccg 10440cgctcgacga atcctgaagc ttggatcccc cgaatttccc cgatcgttca aacatttggc 10500aataaagttt cttaagattg aatcctgttg ccggtcttgc gatgattatc atctaatttc 10560tgttgaatta cgttaagcat gtaataatta acatgtaatg catgacgtta tttatgagat 10620gggtttttat gattagagtc ccgcaattat acatttaata cgcgatagaa aacaaaatat 10680agcgcgcaaa ctaggataaa ttatcgcgcg cggtgtcatc tatgttacta gatccgggaa 10740ttgggtaccg gatttggagc caagtctcat aaacgccatt gtggaagaaa gtcttgagtt 10800ggtggtaatg taacagagta gtaagaacag agaagagaga gagtgtgaga tacatgaatt 10860gtcgggcaac aaaaatcctg aacatcttat tttagcaaag agaaagagtt ccgagtctgt 10920agcagaagag tgaggagaaa tttaagctct tggacttgtg aattgttccg cctcttgaat 10980acttcttcaa tcctcatata ttcttcttct atgttacctg aaaaccggca tttaatctcg 11040cgggtttatt ccggttcaac attttttttg ttttgagtta ttatctgggc ttaataacgc 11100aggcctgaaa taaattcaag gcccaactgt tttttttttt aagaagttgc tgttaaaaaa 11160aaaaaaaggg aattaacaac aacaacaaaa aaagataaag aaaataataa caattacttt 11220aattgtagac taaaaaaaca tagattttat catgaaaaaa agagaaaaga aataaaaact 11280tggatcaaaa aaaaaaacat acagatcttc taattattaa cttttcttaa aaattaggtc 11340ctttttccca acaattaggt ttagagtttt ggaattaaac caaaaagatt gttctaaaaa 11400atactcaaat ttggtagata agtttcctta ttttaattag tcaatggtag atactttttt 11460ttcttttctt tattagagta gattagaatc ttttatgcca agttttgata aattaaatca 11520agaagataaa ctatcataat caacatgaaa ttaaaagaaa aatctcatat atagtattag 11580tattctctat atatattatg attgcttatt cttaatgggt tgggttaacc aagacatagt 11640cttaatggaa agaatctttt ttgaactttt tccttattga ttaaattctt ctatagaaaa 11700gaaagaaatt atttgaggaa aagtatatac aaaaagaaaa atagaaaaat gtcagtgaag 11760cagatgtaat ggatgaccta atccaaccac caccatagga tgtttctact tgagtcggtc 11820ttttaaaaac gcacggtgga aaatatgaca cgtatcatat gattccttcc tttagtttcg 11880tgataataat cctcaactga tatcttcctt tttttgtttt ggctaaagat attttattct 11940cattaataga aaagacggtt ttgggctttt ggtttgcgat ataaagaaga ccttcgtgtg 12000gaagataata attcatcctt tcgtcttttt ctgactcttc aatctctccc aaagcctaaa 12060gcgatctctg caaatctctc gcgactctct ctttcaaggt atattttctg attctttttg 12120tttttgattc gtatctgatc tccaattttt gttatgtgga ttattgaatc ttttgtataa 12180attgcttttg acaatattgt tcgtttcgtc aatccagctt ctaaattttg tcctgattac 12240taagatatcg attcgtagtg tttacatctg tgtaatttct tgcttgattg tgaaattagg 12300attttcaagg acgatctatt caatttttgt gttttctttg ttcgattctc tctgttttag 12360gtttcttatg tttagatccg tttctctttg gtgttgtttt gatttctctt acggcttttg 12420atttggtata tgttcgctga ttggtttcta cttgttctat tgttttattt caggtggatc 12480caccatgaac gacattcaat tggatcaagc gagcgtcaag aagcgtccct cgggcgcgta 12540cgacgcaacc acgcgcctgg ccgcgagctg gtacgtcgcg atgcgctcca acgagctcaa 12600ggacaagccg accgagttga cgctcttcgg ccgtccgtgc gtggcgtggc gcggagccac 12660ggggcgggcc gtggtgatgg accgccactg ctcgcacctg ggcgcgaacc tggctgacgg 12720gcggatcaag gacgggtgca tccagtgccc gtttcaccac tggcggtacg acgaacaggg 12780ccagtgcgtt cacatccccg gccataacca ggcggtgcgc cagctggagc cggtgccgcg 12840cggggcgcgt cagccgacgt tggtcaccgc cgagcgatac ggctacgtgt gggtctggta 12900cggctccccg ctgccgctgc acccgctgcc cgaaatctcc gcggccgatg tcgacaacgg 12960cgactttatg cacctgcact tcgcgttcga gacgaccacg gcggtcttgc ggatcgtcga 13020gaacttctac gacgcgcagc acgcaacccc ggtgcacgca ctcccgatct cggccttcga 13080actcaagctc ttcgacgatt ggcgccagtg gccggaggtt gagtcgctgg ccctggcggg 13140cgcgtggttc ggtgccggga tcgacttcac cgtggaccgg tacttcggcc ccctcggcat 13200gctgtcacgc gcgctcggcc tgaacatgtc gcagatgaac ctgcacttcg atggctaccc 13260cggcgggtgc gtcatgaccg tcgccctgga cggagacgtc aaatacaagc tgctccagtg 13320tgtgacgccg gtgagcgaag gcaagaacgt catgcacatg ctcatctcga tcaagaaggt 13380gggcggcatc ctgctccgcg cgaccgactt cgtgctgttc gggctgcaga ccaggcaggc 13440cgcggggtac gacgtcaaaa tctggaacgg aatgaagccg gacggcggcg gcgcgtacag 13500caagtacgac aagctcgtgc tcaagtaccg ggcgttctat cgaggctggg tcgaccgcgt 13560cgcaagtgag cggtgaagct tggatccccc gaatttcccc gatcgttcaa acatttggca 13620ataaagtttc ttaagattga atcctgttgc cggtcttgcg atgattatca tctaatttct 13680gttgaattac gttaagcatg taataattaa catgtaatgc atgacgttat ttatgagatg 13740ggtttttatg attagagtcc cgcaattata catttaatac gcgatagaaa acaaaatata 13800gcgcgcaaac taggataaat tatcgcgcgc ggtgtcatct atgttactag atccgggaat 13860tccggaccgc gctctagtgc gatcgctttt ttaattaatt ttaagctttc tagaggccgg 13920ccgcggccgc ctcgaggtac catcaggata ttcttgctta agatgttgaa ctctatggag 13980gtttgtatga actgatgatc taggaccgga taagttccct tcttcatagc gaacttattc 14040aaagaatgtt ttgtgtatca ttcttgttac attgttatta atgaaaaaat attattggtc 14100attggactga acacgagtgt taaatatgga ccaggcccca aataagatcc attgatatat 14160gaattaaata acaagaataa atcgagtcac caaaccactt gcctttttta acgagacttg 14220ttcaccaact tgatacaaaa gtcattatcc tatgcaaatc aataatcata caaaaatatc 14280caataacact aaaaaattaa aagaaatgga taatttcaca atatgttata cgataaagaa 14340gttacttttc caagaaattc actgatttta taagcccact tgcattagat aaatggcaaa 14400aaaaaacaaa aaggaaaaga aataaagcac gaagaattct agaaaatacg aaatacgctt 14460caatgcagtg ggacccacgg ttcaattatt gccaattttc agctccaccg tatatttaaa 14520aaataaaacg ataatgctaa aaaaatataa atcgtaacga tcgttaaatc tcaacggctg 14580gatcttatga cgaccgttag aaattgtggt tgtcgacgag tcagtaataa acggcgtcaa 14640agtggttgca gccggcacac acgagtcgtg tttatcaact caaagcacaa atacttttcc 14700tcaacctaaa aataaggcaa ttagccaaaa acaactttgc gtgtaaacaa cgctcaatac 14760acgtgtcatt ttattattag ctattgcttc accgccttag ctttctcgtg acctagtcgt 14820cctcgtcttt tcttccttct tcttctataa aacaataccc aaagagctct tcttcttcac 14880aattcagatt tcaatttctc aaaatcttaa aaactttctc tcaattctct ctaccgtgat 14940cggaaccatg acaaccttaa gctgtaaagt gacctcggta gaagctatca cggataccgt 15000atatcgtgtc cgcatcgtgc cagacgcggc cttttctttt cgtgctggtc agtatttgat 15060ggtagtgatg gatgagcgcg acaaacgtcc gttctcaatg gcttcgacgc cggatgaaaa 15120agggtttatc gagctgcata ttggcgcttc tgaaatcaac ctttacgcga aagcagtcat 15180ggaccgcatc ctcaaagatc atcaaatcgt ggtcgacatt ccccacggag aagcgtggct 15240gcgcgatgat gaagagcgtc cgatgatttt gattgcgggc ggcaccgggt tctcttatgc 15300ccgctcgatt ttgctgacag cgttggcgcg taacccaaac cgtgatatca ccatttactg 15360gggcgggcgt gaagagcagc atctgtatga tctctgcgag cttgaggcgc tttcgttgaa 15420gcatcctggt ctgcaagtgg tgccggtggt tgaacaaccg gaagcgggct ggcgtgggcg 15480tactggcacc gtgttaacgg cggtattgca ggatcacggt acgctggcag agcatgatat 15540ctatattgcc ggacgttttg agatggcgaa aattgcccgc gatctgtttt gcagtgagcg 15600taatgcgcgg gaagatcgcc tgtttggcga tgcgtttgca tttatctgag gatcccccga 15660atttccccga tcgttcaaac atttggcaat aaagtttctt aagattgaat cctgttgccg 15720gtcttgcgat gattatcatc taatttctgt tgaattacgt taagcatgta ataattaaca 15780tgtaatgcat gacgttattt atgagatggg tttttatgat tagagtcccg caattataca 15840tttaatacgc gatagaaaac aaaatatagc gcgcaaacta ggataaatta tcgcgcgcgg 15900tgtcatctat gttactagat ccgggaatta gcggccgcct cgaggtaccg gatttggagc 15960caagtctcat aaacgccatt gtggaagaaa gtcttgagtt ggtggtaatg taacagagta 16020gtaagaacag agaagagaga gagtgtgaga tacatgaatt gtcgggcaac aaaaatcctg 16080aacatcttat tttagcaaag agaaagagtt ccgagtctgt agcagaagag tgaggagaaa 16140tttaagctct tggacttgtg aattgttccg cctcttgaat acttcttcaa tcctcatata 16200ttcttcttct atgttacctg aaaaccggca tttaatctcg cgggtttatt ccggttcaac 16260attttttttg ttttgagtta ttatctgggc ttaataacgc aggcctgaaa taaattcaag 16320gcccaactgt tttttttttt aagaagttgc tgttaaaaaa aaaaaaaggg aattaacaac 16380aacaacaaaa aaagataaag aaaataataa caattacttt aattgtagac taaaaaaaca 16440tagattttat catgaaaaaa agagaaaaga aataaaaact tggatcaaaa aaaaaaacat 16500acagatcttc taattattaa cttttcttaa aaattaggtc ctttttccca acaattaggt 16560ttagagtttt ggaattaaac caaaaagatt gttctaaaaa atactcaaat ttggtagata 16620agtttcctta ttttaattag tcaatggtag atactttttt ttcttttctt tattagagta 16680gattagaatc ttttatgcca agttttgata aattaaatca agaagataaa ctatcataat 16740caacatgaaa ttaaaagaaa aatctcatat atagtattag tattctctat atatattatg 16800attgcttatt cttaatgggt tgggttaacc aagacatagt cttaatggaa agaatctttt 16860ttgaactttt tccttattga ttaaattctt ctatagaaaa gaaagaaatt atttgaggaa 16920aagtatatac aaaaagaaaa atagaaaaat gtcagtgaag cagatgtaat ggatgaccta 16980atccaaccac caccatagga tgtttctact tgagtcggtc ttttaaaaac gcacggtgga 17040aaatatgaca cgtatcatat gattccttcc tttagtttcg tgataataat cctcaactga 17100tatcttcctt tttttgtttt ggctaaagat attttattct cattaataga aaagacggtt 17160ttgggctttt ggtttgcgat ataaagaaga ccttcgtgtg gaagataata attcatcctt 17220tcgtcttttt ctgactcttc aatctctccc aaagcctaaa gcgatctctg caaatctctc 17280gcgactctct ctttcaaggt atattttctg attctttttg tttttgattc gtatctgatc 17340tccaattttt gttatgtgga ttattgaatc ttttgtataa attgcttttg acaatattgt 17400tcgtttcgtc aatccagctt ctaaattttg tcctgattac taagatatcg attcgtagtg 17460tttacatctg tgtaatttct tgcttgattg tgaaattagg attttcaagg acgatctatt 17520caatttttgt gttttctttg ttcgattctc tctgttttag gtttcttatg tttagatccg 17580tttctctttg gtgttgtttt gatttctctt acggcttttg atttggtata tgttcgctga 17640ttggtttcta cttgttctat tgttttattt caggtggatc tgttggggat ctaccatgag 17700cccagaacga cgcccggccg acatccgccg tgccaccgag gcggacatgc cggcggtctg 17760caccatcgtc aaccactaca tcgagacaag cacggtcaac ttccgtaccg agccgcagga 17820accgcaggag tggacggacg acctcgtccg tctgcgggag cgctatccct ggctcgtcgc 17880cgaggtggac ggcgaggtcg ccggcatcgc ctacgcgggc ccctggaagg cacgcaacgc 17940ctacgactgg acggccgagt cgaccgtgta cgtctccccc cgccaccagc ggacgggact 18000gggctccacg ctctacaccc acctgctgaa gtccctggag gcacagggct tcaagagcgt 18060ggtcgctgtc atcgggctgc ccaacgaccc gagcgtgcgc atgcacgagg cgctcggata 18120tgccccccgc ggcatgctgc gggcggccgg cttcaagcac gggaactggc atgacgtggg 18180tttctggcag ctggacttca gcctgccggt accgccccgt ccggtcctgc ccgtcaccga 18240gatcccccga atttccccga tcgttcaaac atttggcaat aaagtttctt aagattgaat 18300cctgttgccg gtcttgcgat gattatcatc taatttctgt tgaattacgt taagcatgta 18360ataattaaca tgtaatgcat gacgttattt atgagatggg tttttatgat tagagtcccg 18420caattataca tttaatacgc gatagaaaac aaaatatagc gcgcaaacta ggataaatta 18480tcgcgcgcgg tgtcatctat gttactagat ccgggaattg ggtacccaat tccggaccgc 18540tgctctagag gcgcgcccct agggagcttc tgcagacgcg tcgacgtcat atggatccga 18600tctgttgccc gtctcactgg tgaaaagaaa aaccacccca gtacattaaa aacgtccgca 18660atgtgttatt aagttgtcta agcgtcaatt tgtttacacc acaatatatc ctgccaccag 18720ccagccaaca gctccccgac cggcagctcg gcacaaaatc accactcgat acaggcagcc 18780catcagtccg ggacggtcga cctgcaggca tgcaagctca cgtagtgtac gtaatcgatt 18840tcgaagggcc ccctagtcca tgggcttttt ctcctcgtgc tcgtaaacgg acccgaacat 18900ctctggagct ttcttcaggg ccgacaatcg gatctcgcgg aaatcctgca cgtcggccgc 18960tccaagccgt cgaatctgag ccttaatcac aattgtcaat tttaatcctc tgtttatcgg 19020cagttcgtag agcgcgccgt gcgtcccgag cgatactgag cgaagcaagt gcgtcgagca 19080gtgcccgctt gttcctgaaa tgccagtaaa gcgctggctg ctgaaccccc agccggaact 19140gaccccacaa ggccctagcg tttgcaatgc accaggtcat cattgaccca ggcgtgttcc 19200accaggccgc tgcctcgcaa ctcttcgcag gcttcgccga cctgctcgcg ccacttcttc 19260acgcgggtgg aatccgatcc gcacatgagg cggaaggttt ccagcttgag cgggtacggc 19320tcccggtgcg agctgaaata gtcgaacatc cgtcgggccg tcggcgacag cttgcggtac 19380ttctcccata tgaatttcgt gtagtggtcg ccagcaaaca gcacgacgat ttcctcgtcg 19440atcaggacct ggcaacggga cgttttcttg ccacggtcca ggacgcggaa gcggtgcagc 19500agcgacaccg attccaggtg cccaacgcgg tcggacgtga agcccatcgc cgtcgcctgt 19560aggcgcgaca ggcattcctc ggccttcgtg taataccggc cattgatcga ccagcccagg 19620tcctggcaaa gctcgtagaa cgtgaaggtg atcggctcgc cgataggggt gcgcttcgcg 19680tactccaaca cctgctgcca caccagttcg tcatcgtcgg cccgcagctc gacgccggtg 19740taggtgatct tcacgtcctt gttgacgtgg aaaatgacct tgttttgcag cgcctcgcgc 19800gggattttct tgttgcgcgt ggtgaacagg gcagagcggg ccgtgtcgtt tggcatcgct 19860cgcatcgtgt ccggccacgg cgcaatatcg aacaaggaaa gctgcatttc cttgatctgc 19920tgcttcgtgt gtttcagcaa cgcggcctgc ttggcctcgc tgacctgttt tgccaggtcc 19980tcgccggcgg tttttcgctt cttggtcgtc atagttcctc gcgtgtcgat ggtcatcgac 20040ttcgccaaac ctgccgcctc ctgttcgaga cgacgcgaac gctccacggc ggccgatggc 20100gcgggcaggg cagggggagc cagttgcacg ctgtcgcgct cgatcttggc cgtagcttgc 20160tggaccatcg agccgacgga ctggaaggtt tcgcggggcg cacgcatgac ggtgcggctt 20220gcgatggttt cggcatcctc ggcggaaaac cccgcgtcga tcagttcttg cctgtatgcc 20280ttccggtcaa acgtccgatt cattcaccct ccttgcggga ttgccccgac tcacgccggg 20340gcaatgtgcc cttattcctg atttgacccg cctggtgcct tggtgtccag ataatccacc 20400ttatcggcaa tgaagtcggt cccgtagacc gtctggccgt ccttctcgta cttggtattc 20460cgaatcttgc cctgcacgaa taccagcgac cccttgccca aatacttgcc gtgggcctcg 20520gcctgagagc caaaacactt gatgcggaag aagtcggtgc gctcctgctt gtcgccggca 20580tcgttgcgcc acatctaggt actaaaacaa ttcatccagt aaaatataat attttatttt 20640ctcccaatca ggcttgatcc ccagtaagtc aaaaaatagc tcgacatact gttcttcccc 20700gatatcctcc ctgatcgacc ggacgcagaa ggcaatgtca taccacttgt ccgccctgcc 20760gcttctccca agatcaataa agccacttac tttgccatct ttcacaaaga tgttgctgtc 20820tcccaggtcg ccgtgggaaa agacaagttc ctcttcgggc ttttccgtct ttaaaaaatc 20880atacagctcg cgcggatctt taaatggagt gtcttcttcc cagttttcgc aatccacatc 20940ggccagatcg ttattcagta agtaatccaa ttcggctaag cggctgtcta agctattcgt 21000atagggacaa tccgatatgt cgatggagtg aaagagcctg atgcactccg catacagctc 21060gataatcttt tcagggcttt gttcatcttc atactcttcc gagcaaagga cgccatcggc 21120ctcactcatg agcagattgc tccagccatc atgccgttca aagtgcagga cctttggaac 21180aggcagcttt ccttccagcc atagcatcat gtccttttcc cgttccacat cataggtggt 21240ccctttatac cggctgtccg tcatttttaa atataggttt tcattttctc ccaccagctt 21300atatacctta gcaggagaca ttccttccgt atcttttacg cagcggtatt tttcgatcag 21360ttttttcaat tccggtgata ttctcatttt agccatttat tatttccttc ctcttttcta 21420cagtatttaa agatacccca agaagctaat tataacaaga cgaactccaa ttcactgttc 21480cttgcattct aaaaccttaa ataccagaaa acagcttttt caaagttgtt ttcaaagttg 21540gcgtataaca tagtatcgac ggagccgatt ttgaaaccac aattatgggt gatgctgcca 21600acttactgat ttagtgtatg atggtgtttt tgaggtgctc cagtggcttc tgtgtctatc 21660agctgtccct cctgttcagc tactgacggg gtggtgcgta acggcaaaag caccgccgga 21720catcagcgct atctctgctc tcactgccgt aaaacatggc aactgcagtt cacttacacc 21780gcttctcaac ccggtacgca ccagaaaatc attgatatgg ccatgaatgg cgttggatgc 21840cgggcaacag cccgcattat gggcgttggc ctcaacacga ttttacgtca cttaaaaaac 21900tcaggccgca gtcggtaacc tcgcgcatac agccgggcag tgacgtcatc gtctgcgcgg 21960aaatggacga acagtggggc tatgtcgggg ctaaatcgcg ccagcgctgg ctgttttacg 22020cgtatgacag tctccggaag acggttgttg cgcacgtatt cggtgaacgc actatggcga 22080cgctggggcg tcttatgagc ctgctgtcac cctttgacgt ggtgatatgg atgacggatg 22140gctggccgct gtatgaatcc cgcctgaagg gaaagctgca cgtaatcagc aagcgatata 22200cgcagcgaat tgagcggcat aacctgaatc tgaggcagca cctggcacgg ctgggacgga 22260agtcgctgtc gttctcaaaa tcggtggagc tgcatgacaa agtcatcggg cattatctga 22320acataaaaca ctatcaataa gttggagtca ttacccaatt atgatagaat ttacaagcta 22380taaggttatt gtcctgggtt tcaagcatta gtccatgcaa gtttttatgc tttgcccatt 22440ctatagatat attgataagc gcgctgccta tgccttgccc cctgaaatcc ttacatacgg 22500cgatatcttc tatataaaag atatattatc ttatcagtat tgtcaatata ttcaaggcaa 22560tctgcctcct catcctcttc atcctcttcg tcttggtagc tttttaaata tggcgcttca 22620tagagtaatt ctgtaaaggt ccaattctcg ttttcatacc tcggtataat cttacctatc 22680acctcaaatg gttcgctggg tttatcgcac ccccgaacac gagcacggca cccgcgacca 22740ctatgccaag aatgcccaag gtaaaaattg ccggccccgc catgaagtcc gtgaatgccc 22800cgacggccga agtgaagggc aggccgccac ccaggccgcc gccctcactg cccggcacct 22860ggtcgctgaa tgtcgatgcc agcacctgcg gcacgtcaat gcttccgggc gtcgcgctcg 22920ggctgatcgc ccatcccgtt actgccccga tcccggcaat ggcaaggact gccagcgctg 22980ccatttttgg ggtgaggccg ttcgcggccg aggggcgcag cccctggggg gatgggaggc 23040ccgcgttagc gggccgggag ggttcgagaa gggggggcac cccccttcgg cgtgcgcggt 23100cacgcgcaca gggcgcagcc ctggttaaaa acaaggttta taaatattgg tttaaaagca 23160ggttaaaaga caggttagcg gtggccgaaa aacgggcgga aacccttgca aatgctggat 23220tttctgcctg tggacagccc ctcaaatgtc aataggtgcg cccctcatct gtcagcactc 23280tgcccctcaa gtgtcaagga tcgcgcccct catctgtcag tagtcgcgcc cctcaagtgt 23340caataccgca gggcacttat ccccaggctt gtccacatca tctgtgggaa actcgcgtaa 23400aatcaggcgt tttcgccgat ttgcgaggct ggccagctcc acgtcgccgg ccgaaatcga 23460gcctgcccct catctgtcaa cgccgcgccg ggtgagtcgg cccctcaagt gtcaacgtcc 23520gcccctcatc tgtcagtgag ggccaagttt tccgcgaggt atccacaacg ccggcggccg 23580cggtgtctcg cacacggctt cgacggcgtt tctggcgcgt ttgcagggcc atagacggcc 23640gccagcccag cggcgagggc aaccagcccg gtgagcgtcg caaaggcgct cggtcttgcc 23700ttgctcgtcg gtgatgtact tcaccagctc cgcgaagtcg ctcttcttga tggagcgcat 23760ggggacgtgc ttggcaatca cgcgcacccc ccggccgttt tagcggctaa aaaagtcatg 23820gctctgccct cgggcggacc acgcccatca tgaccttgcc aagctcgtcc tgcttctctt 23880cgatcttcgc cagcagggcg aggatcgtgg catcaccgaa ccgcgccgtg cgcgggtcgt 23940cggtgagcca gagtttcagc aggccgccca ggcggcccag gtcgccattg atgcgggcca 24000gctcgcggac gtgctcatag tccacgacgc ccgtgatttt gtagccctgg ccgacggcca 24060gcaggtaggc cgacaggctc atgccggccg ccgccgcctt ttcctcaatc gctcttcgtt 24120cgtctggaag gcagtacacc ttgataggtg ggctgccctt cctggttggc ttggtttcat 24180cagccatccg cttgccctca tctgttacgc cggcggtagc cggccagcct cgcagagcag 24240gattcccgtt gagcaccgcc aggtgcgaat aagggacagt gaagaaggaa cacccgctcg 24300cgggtgggcc tacttcacct atcctgcccg gctgacgccg ttggatacac caaggaaagt 24360ctacacgaac cctttggcaa aatcctgtat atcgtgcgaa aaaggatgga tataccgaaa 24420aaatcgctat aatgaccccg aagcagggtt atgcagcgga aaagcgccac gcttcccgaa 24480gggagaaagg cggacaggta tccggtaagc ggcagggtcg gaacaggaga gcgcacgagg 24540gagcttccag ggggaaacgc ctggtatctt tatagtcctg tcgggtttcg ccacctctga 24600cttgagcgtc gatttttgtg atgctcgtca ggggggcgga gcctatggaa aaacgccagc 24660aacgcggcct ttttacggtt cctggccttt tgctggcctt ttgctcacat gttctttcct 24720gcgttatccc ctgattctgt ggataaccgt attaccgcct ttgagtgagc tgataccgct 24780cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga agagcgccag 24840aaggccgcca gagaggccga gcgcggccgt gaggcttgga cgctagggca gggcatgaaa 24900aagcccgtag cgggctgcta cgggcgtctg acgcggtgga aagggggagg ggatgttgtc 24960tacatggctc tgctgtagtg agtgggttgc gctccggcag cggtcctgat caatcgtcac 25020cctttctcgg tccttcaacg ttcctgacaa cgagcctcct tttcgccaat ccatcgacaa 25080tcaccgcgag tccctgctcg aacgctgcgt ccggaccggc ttcgtcgaag gcgtctatcg 25140cggcccgcaa cagcggcgag agcggagcct gttcaacggt gccgccgcgc tcgccggcat 25200cgctgtcgcc ggcctgctcc tcaagcacgg ccccaacagt gaagtagctg attgccatca 25260gcgcattgac ggcgtccccg gccgaaaaac ccgcctcgca gaggaagcga agctgcgcgt 25320cggccgtttc catctgcggt gcgcccggtc gcgtgccggc atggatgcgc gcgccatcgc 25380ggtaggcgag cagcgcctgc ctgaagctgc gggcattccc gatcagaaat gagcgccagt 25440cgtcgtcggc tctcggcacc gaatgcgtat gattctccgc cagcatggct tcggccagtg 25500cgtcgagcag cgcccgcttg ttcctgaagt gccagtaaag cgccggctgc tgaaccccca 25560accgttccgc cagtttgcgt gtcgtcagac cgtctacgcc gacctcgttc aacaggtcca 25620gggcggcacg gatcactgta ttcggctgca actttgtcat gcttgacact ttatcactga 25680taaacataat atgtccacca acttatcagt gataaagaat ccgcgcgttc aatcggacca 25740gcggaggctg gtccggaggc cagacgtgaa acccaacata cccctgatcg taattctgag 25800cactgtcgcg ctcgacgctg tcggcatcgg cctgattatg ccggtgctgc cgggcctcct 25860gcgcgatctg gttcactcga acgacgtcac cgcccactat ggcattctgc tggcgctgta 25920tgcgttggtg caatttgcct gcgcacctgt gctgggcgcg ctgtcggatc gtttcgggcg 25980gcggccaatc ttgctcgtct cgctggccgg cgccagatc 26019<210>35<2ll>20119<212>DNA<213>合成<220><22l>启动子<222>(229)..(1960)<220><22l>exon<222>(1962)..(2160)<220><221>misc_feature<222>(2160)..(2228)<223>plastid targeting domain<220><221>基大<222>(2260)..(3960)<223>prnC<220><221>终止子<222>(3966)..(4241)<220><22l>启动子<222>(4245)..(5971)<220><221>exon<222>(5984)..(6182)<220><221>misc_feature<222>(6183)..(6251)<223>plastid targeting domain<220><221>基因<222>(6282)..(7373)<223>prnD<220><22l>终止子<222>(7379)..(7639)<220><22l>启动子<222>(7739)..(8739)<220><221>exon<222>(8745)..(8943)<220><221>misc_feature<222>(8944)..(9012)<223>plastid targeting domain<220><221>基因<222>(9037)..(9743)<223>fre<220><221>终止子<222>(9755)..(10036)<220><221>启动子<222>(10049)..(11385)<220><22l>内含子<222>(11383)..(11779)<220><221>基因<222>(11796)..(12338)<220><221>终子<222>(12345)..(12626)<400>35tggggaaccc tgtggttggc atgcacatac aaatggacga acggataaac cttttcacgc 60ccttttaaat atccgattat tctaataaac gctcttttct cttaggttta cccgccaata 120tatcctgtca aacactgata gtttaaactg aaggcgggaa acgacaatct gatctatcgt 180tctagtcgta cgttttgcga tcgcactaga gcggccgcct cgaggtaccg gatttggagc 240caagtctcat aaacgccatt gtggaagaaa gtcttgagtt ggtggtaatg taacagagta 300gtaagaacag agaagagaga gagtgtgaga tacatgaatt gtcgggcaac aaaaatcctg 360aacatcttat tttagcaaag agaaagagtt ccgagtctgt agcagaagag tgaggagaaa 420tttaagctct tggacttgtg aattgttccg cctcttgaat acttcttcaa tcctcatata 480ttcttcttct atgttacctg aaaaccggca tttaatctcg cgggtttatt ccggttcaac 540attttttttg ttttgagtta ttatctgggc ttaataacgc aggcctgaaa taaattcaag 600gcccaactgt tttttttttt aagaagttgc tgttaaaaaa aaaaaaaggg aattaacaac 660aacaacaaaa aaagataaag aaaataataa caattacttt aattgtagac taaaaaaaca 720tagattttat catgaaaaaa agagaaaaga aataaaaact tggatcaaaa aaaaaaacat 780acagatcttc taattattaa cttttcttaa aaattaggtc ctttttccca acaattaggt 840ttagagtttt ggaattaaac caaaaagatt gttctaaaaa atactcaaat ttggtagata 900agtttcctta ttttaattag tcaatggtag atactttttt ttcttttctt tattagagta 960gattagaatc ttttatgcca agttttgata aattaaatca agaagataaa ctatcataat 1020caacatgaaa ttaaaagaaa aatctcatat atagtattag tattctctat atatattatg 1080attgcttatt cttaatgggt tgggttaacc aagacatagt cttaatggaa agaatctttt 1140ttgaactttt tccttattga ttaaattctt ctatagaaaa gaaagaaatt atttgaggaa 1200aagtatatac aaaaagaaaa atagaaaaat gtcagtgaag cagatgtaat ggatgaccta 1260atccaaccac caccatagga tgtttctact tgagtcggtc ttttaaaaac gcacggtgga 1320aaatatgaca cgtatcatat gattccttcc tttagtttcg tgataataat cctcaactga 1380tatcttcctt tttttgtttt ggctaaagat attttattct cattaataga aaagacggtt 1440ttgggctttt ggtttgcgat ataaagaaga ccttcgtgtg gaagataata attcatcctt 1500tcgtcttttt ctgactcttc aatctctccc aaagcctaaa gcgatctctg caaatctctc 1560gcgactctct ctttcaaggt atattttctg attctttttg tttttgattc gtatctgatc 1620tccaattttt gttatgtgga ttattgaatc ttttgtataa attgcttttg acaatattgt 1680tcgtttcgtc aatccagctt ctaaattttg tcctgattac taagatatcg attcgtagtg 1740tttacatctg tgtaatttct tgcttgattg tgaaattagg attttcaagg acgatctatt 1800caatttttgt gttttctttg ttcgattctc tctgttttag gtttcttatg tttagatccg 1860tttctctttg gtgttgtttt gatttctctt acggcttttg atttggtata tgttcgctga 1920ttggtttcta cttgttctat tgttttattt caggtggatc a gtc aca caa aga gta 1976

Val Thr Gln Arg Val

1 5aag aag aac aat ggc ttc ctc tat gct ctc ttc cgc tac tat ggt tgc 2024Lys Lys Asn Asn Gly Phe Leu Tyr Ala Leu Phe Arg Tyr Tyr Gly Cys

10 15 20ctc tcc ggc tca ggc cac tat ggt cgc tcc ttt caa cgg act taa gtc 2072Leu Ser Gly Ser Gly His Tyr Gly Arg Ser Phe Gln Arg Thr Val

25 30 35ctc cgc tgc ctt ccc agc cac ccg caa ggc taa caa cga cat tac ttc 2120Leu Arg Cys Leu Pro Ser His Pro Gln Gly Gln Arg His Tyr Phe

40 45 50cat cac aag caa cgg cgg aag agt taa ctg cat gca ggt g tggcctccga 2170His His Lys Gln Arg Arg Lys Ser Leu His Ala Gly

55 60ttggaaagaa gaagtttgag actctctctt accttcctga ccttaccgat tctgcaggag 2230gtcgcgtcaa ctgcatgcag gctagcatga ctcagaagag ccccgcgaac gaacacgata 2290gcaatcactt cgacgtaatc atcctcggct cgggcatgtc cggcacccag atgggggcca 2350tcttggccaa acaacagttt cgcgtgctga tcatcgagga gtcgtcgcac ccgcggttca 2410cgatcggcga atcgtcgatc cccgagacgt ctcttatgaa ccgcatcatc gctgatcgct 2470acggcattcc ggagctcgac cacatcacgt cgttttattc gacgcaacgt tacgtcgcgt 2530cgagcacggg cattaagcgc aacttcggct tcgtgttcca caagcccggc caggagcacg 2590acccgaagga gttcacccag tgcgtcattc ccgagctgcc gtgggggccg gagagccatt 2650attaccggca agacgtcgac gcctacttgt tgcaagccgc cattaaatac ggctgcaagg 2710tccaccagaa aactaccgtg accgaatacc acaccgataa agacggcgtc gcggtgacca 2770ccgcccaggg cgaacggttc accggccggt acatgatcga ctgcggagga cctcgcgcgc 2830cgctcgcgac caagttcagg ctccgcgaag aaccgtgtcg cttcaagacg cactcgcgca 2890gcctctacac gcacatgctc ggggtcaagc cgttcgacga catcttcaag gtcaaggggc 2950agcgctggcg ctggcacgag gggaccttgc accacatgtt cgagggcggc tggctctggg 3010tgattccgtt caacaaccac ccgcggtcga ccaacaacct ggtgagcgtc ggcctgcagc 3070tcgacccgcg tgtctacccg aaaaccgaca tctccgcaca gcaggaattc gatgagttcc 3130tcgcgcggtt cccgagcatc ggggctcagt tccgggacgc cgtgccggtg cgcgactggg 3190tcaagaccga ccgcctgcaa ttctcgtcga acgcctgcgt cggcgaccgc tactgcctga 3250tgctgcacgc gaacggcttc atcgacccgc tcttctcccg ggggctggaa aacaccgcgg 3310tgaccatcca cgcgctcgcg gcgcgcctca tcaaggcgct gcgcgacgac gacttctccc 3370ccgagcgctt cgagtacatc gagcgcctgc agcaaaagct tttggaccac aacgacgact 3430tcgtcagctg ctgctacacg gcgttctcgg acttccgcct atgggacgcg ttccacaggc 3490tgtgggcggt cggcaccatc ctcgggcagt tccggctcgt gcaggcccac gcgaggttcc 3550gcgcgtcgcg caacgagggc gacctcgatc acctcgacaa cgaccctccg tatctcggat 3610acctgtgcgc ggacatggag gagtactacc agttgttcaa cgacgccaaa gccgaggtcg 3670aggccgtgag tgccgggcgc aagccggccg atgaggccgc ggcgcggatt cacgccctca 3730ttgacgaacg agacttcgcc aagccgatgt tcggcttcgg gtactgcatc accggggaca 3790agccgcagct caacaactcg aagtacagcc tgctgccggc gatgcggctg atgtactgga 3850cgcaaacccg cgcgccggca gaggtgaaaa agtacttcga ctacaacccg atgttcgcgc 3910tgctcaaggc gtacatcacg acccgcatcg gcctggcgct gaagaagtag ggatcccccg 3970aatttccccg atcgttcaaa catttggcaa taaagtttct taagattgaa tcctgttgcc 4030ggtcttgcga tgattatcat ctaatttctg ttgaattacg ttaagcatgt aataattaac 4090atgtaatgca tgacgttatt tatgagatgg gtttttatga ttagagtccc gcaattatac 4150atttaatacg cgatagaaaa caaaatatag cgcgcaaact aggataaatt atcgcgcgcg 4210gtgtcatcta tgttactaga tccgggaatt ccgctcgagg taccggattt ggagccaagt 4270ctcataaacg ccattgtgga agaaagtctt gagttggtgg taatgtaaca gagtagtaag 4330aacagagaag agagagagtg tgagatacat gaattgtcgg gcaacaaaaa tcctgaacat 4390cttattttag caaagagaaa gagttccgag tctgtagcag aagagtgagg agaaatttaa 4450gctcttggac ttgtgaattg ttccgcctct tgaatacttc ttcaatcctc atatattctt 4510cttctatgtt acctgaaaac cggcatttaa tctcgcgggt ttattccggt tcaacatttt 4570ttttgttttg agttattatc tgggcttaat aacgcaggcc tgaaataaat tcaaggccca 4630actgtttttt tttttaagaa gttgctgtta aaaaaaaaaa aagggaatta acaacaacaa 4690caaaaaaaga taaagaaaat aataacaatt actttaattg tagactaaaa aaacatagat 4750tttatcatga aaaaaagaga aaagaaataa aaacttggat caaaaaaaaa aacatacaga 4810tcttctaatt attaactttt cttaaaaatt aggtcctttt tcccaacaat taggtttaga 4870gttttggaat taaaccaaaa agattgttct aaaaaatact caaatttggt agataagttt 4930ccttatttta attagtcaat ggtagatact tttttttctt ttctttatta gagtagatta 4990gaatctttta tgccaagttt tgataaatta aatcaagaag ataaactatc ataatcaaca 5050tgaaattaaa agaaaaatct catatatagt attagtattc tctatatata ttatgattgc 5110ttattcttaa tgggttgggt taaccaagac atagtcttaa tggaaagaat cttttttgaa 5170ctttttcctt attgattaaa ttcttctata gaaaagaaag aaattatttg aggaaaagta 5230tatacaaaaa gaaaaataga aaaatgtcag tgaagcagat gtaatggatg acctaatcca 5290accaccacca taggatgttt ctacttgagt cggtctttta aaaacgcacg gtggaaaata 5350tgacacgtat catatgattc cttcctttag tttcgtgata ataatcctca actgatatct 5410tccttttttt gttttggcta aagatatttt attctcatta atagaaaaga cggttttggg 5470cttttggttt gcgatataaa gaagaccttc gtgtggaaga taataattca tcctttcgtc 5530tttttctgac tcttcaatct ctcccaaagc ctaaagcgat ctctgcaaat ctctcgcgac 5590tctctctttc aaggtatatt ttctgattct ttttgttttt gattcgtatc tgatctccaa 5650tttttgttat gtggattatt gaatcttttg tataaattgc ttttgacaat attgttcgtt 5710tcgtcaatcc agcttctaaa ttttgtcctg attactaaga tatcgattcg tagtgtttac 5770atctgtgtaa tttcttgctt gattgtgaaa ttaggatttt caaggacgat ctattcaatt 5830tttgtgtttt ctttgttcga ttctctctgt tttaggtttc ttatgtttag atccgtttct 5890ctttggtgtt gttttgattt ctcttacggc ttttgatttg gtatatgttc gctgattggt 5950ttctacttgt tctattgttt tatttcaggt gga tca gtc aca caa aga gta aag 6004

Ser Val Thr Gln Arg Val Lys

65 70aag aac aat ggc ttc ctc tat gct ctc ttc cgc tac tat ggt tgc ctc 6052Lys Asn Asn Gly Phe Leu Tyr Ala Leu Phe Arg Tyr Tyr Gly Cys Leu

75 80 85tcc ggc tca ggc cac tat ggt cgc tcc ttt caa cgg act taa gtc ctc 6100Ser Gly Ser Gly His Tyr Gly Arg Ser Phe Gln Arg Thr Val Leu

90 95 100cgc tgc ctt ccc agc cac ccg caa ggc taa caa cga cat tac ttc cat 6148Arg Cys Leu Pro Ser His Pro Gln Gly Gln Arg His Tyr Phe His

105 110 115cac aag caa cgg cgg aag agt taa ctg cat gca g gtgtggcctc 6192His Lys Gln Arg Arg Lys Ser Leu His Ala

120 125cgattggaaa gaagaagttt gagactctct cttaccttcc tgaccttacc gattctgcag 6252gaggtcgcgt caactgcatg caggctagca tgaacgacat tcaattggat caagcgagcg 6312tcaagaagcg tccctcgggc gcgtacgacg caaccacgcg cctggccgcg agctggtacg 6372tcgcgatgcg ctccaacgag ctcaaggaca agccgaccga gttgacgctc ttcggccgtc 6432cgtgcgtggc gtggcgcgga gccacggggc gggccgtggt gatggaccgc cactgctcgc 6492acctgggcgc gaacctggct gacgggcgga tcaaggacgg gtgcatccag tgcccgtttc 6552accactggcg gtacgacgaa cagggccagt gcgttcacat ccccggccat aaccaggcgg 6612tgcgccagct ggagccggtg ccgcgcgggg cgcgtcagcc gacgttggtc accgccgagc 6672gatacggcta cgtgtgggtc tggtacggct ccccgctgcc gctgcacccg ctgcccgaaa 6732tctccgcggc cgatgtcgac aacggcgact ttatgcacct gcacttcgcg ttcgagacga 6792ccacggcggt cttgcggatc gtcgagaact tctacgacgc gcagcacgca accccggtgc 6852acgcactccc gatctcggcc ttcgaactca agctcttcga cgattggcgc cagtggccgg 6912aggttgagtc gctggccctg gcgggcgcgt ggttcggtgc cgggatcgac ttcaccgtgg 6972accggtactt cggccccctc agcatgctgt cacgcgcgct cggcctgaac atgtcgcaga 7032tgaacctgca cttcgatggc taccccggcg ggtgcgtcat gaccgtcgcc ctggacggag 7092acgtcaaata caagctgctc cagtgtgtga cgccggtgag cgaaggcaag aacgtcatgc 7152acatgctcat ctcgatcaag aaggtgggcg gcatcctgcg ccgcgcgacc gacttcgtgc 7212tgttcgggct gcagaccagg caggccgcgg ggtacgacgt caaaatctgg aacggaatga 7272agccggacgg cggcggcgcg tacagcaagt acgacaagct cgtgctcaag taccgggcgt 7332tctatcgagg ctgggtcgac cgcgtcgcaa gtgagcggtg aggatccccc gaatttcccc 7392gatcgttcaa acatttggca ataaagtttc ttaagattga atcctgttgc cggtcttgcg 7452atgattatca tctaatttct gttgaattac gttaagcatg taataattaa catgtaatgc 7512atgacgttat ttatgagatg ggtttttatg attagagtcc cgcaattata catttaatac 7572gcgatagaaa acaaaatata gcgcgcaaac taggataaat tatcgcgcgc ggtgtcatct 7632atgttactag atccgggaat tccggaccgc tgctctagtg agaccgatcg cttttttaat 7692taattttaag ctttctagag gccggccgcg gccgcctcga ggtaccatca ggatattctt 7752gcttaagatg ttgaactcta tggaggtttg tatgaactga tgatctagga ccggataagt 7812tcccttcttc atagcgaact tattcaaaga atgttttgtg tatcattctt gttacattgt 7872tattaatgaa aaaatattat tggtcattgg actgaacacg agtgttaaat atggaccagg 7932ccccaaataa gatccattga tatatgaatt aaataacaag aataaatcga gtcaccaaac 7992cacttgcctt ttttaacgag acttgttcac caacttgata caaaagtcat tatcctatgc 8052aaatcaataa tcatacaaaa atatccaata acactaaaaa attaaaagaa atggataatt 8112tcacaatatg ttatacgata aagaagttac ttttccaaga aattcactga ttttataagc 8172ccacttgcat tagataaatg gcaaaaaaaa acaaaaagga aaagaaataa agcacgaaga 8232attctagaaa atacgaaata cgcttcaatg cagtgggacc cacggttcaa ttattgccaa 8292ttttcagctc caccgtatat ttaaaaaata aaacgataat gctaaaaaaa tataaatcgt 8352aacgatcgtt aaatctcaac ggctggatct tatgacgacc gttagaaatt gtggttgtcg 8412acgagtcagt aataaacggc gtcaaagtgg ttgcagccgg cacacacgag tcgtgtttat 8472caactcaaag cacaaatact tttcctcaac ctaaaaataa ggcaattagc caaaaacaac 8532tttgcgtgta aacaacgctc aatacacgtg tcattttatt attagctatt gcttcaccgc 8592cttagctttc tcgtgaccta gtcgtcctcg tcttttcttc cttcttcttc tataaaacaa 8652tacccaaaga gctcttcttc ttcacaattc agatttcaat ttctcaaaat cttaaaaact 8712ttctctcaat tctctctacc gtgatcggat ca gtc aca caa aga gta aag aag 8765

Val Thr Gln Arg Val Lys Lys

130aac aat ggc ttc ctc tat gct ctc ttc cgc tac tat ggt tgc ctc tcc 8813Asn Asn Gly Phe Leu Tyr Ala Leu Phe Arg Tyr Tyr Gly Cys Leu Ser

135 140 145ggc tca ggc cac tat ggt cgc tcc ttt caa cgg act taa gtc ctc cgc 8861Gly Ser Gly His Tyr Gly Arg Ser Phe Gln Arg Thr Val Leu Arg150 155 160tgc ctt ccc agc cac ccg caa ggc taa caa cga cat tac ttc cat cac 8909Cys Leu Pro Ser His Pro Gln Gly Gln Arg His Tyr Phe His His165 170 175aag caa cgg cgg aag agt taa ctg cat gca ggt g tggcctccga 8953Lys Gln Arg Arg Lys Ser Leu His Ala Gly180 185ttggaaagaa gaagtttgag actctctctt accttcctga ccttaccgat tctgcaggag 9013gtcgcgtcaa ctgcatgcag gctagcacat gacaacctta agctgtaaag tgacctcggt 9073agaagctatc acggataccg tatatcgtgt ccgcatcgtg ccagacgcgg ccttttcttt 9133tcgtgctggt cagtatttga tggtagtgat ggatgagcgc gacaaacgtc cgttctcaat 9193ggcttcgacg ccggatgaaa aagggtttat cgagctgcat attggcgctt ctgaaatcaa 9253cctttacgcg aaagcagtca tggaccgcat cctcaaagat catcaaatcg tggtcgacat 9313tccccacgga gaagcgtggc tgcgcgatga tgaagagcgt ccgatgattt tgattgcggg 9373cggcaccggg ttctcttatg cccgctcgat tttgctgaca gcgttggcgc gtaacccaaa 9433ccgtgatatc accatttact ggggcgggcg tgaagagcag catctgtatg atctctgcga 9493gcttgaggcg ctttcgttga agcatcctgg tctgcaagtg gtgccggtgg ttgaacaacc 9553ggaagcgggc tggcgtgggc gtactggcac cgtgttaacg gcggtattgc aggatcacgg 9613tacgctggca gagcatgata tctatattgc cggacgtttt gagatggcga aaattgcccg 9673cgatctgttt tgcagtgagc gtaatgcgcg ggaagatcgc ctgtttggcg atgcgtttgc 9733atttatctga gctagcggat cccccgaatt tccccgatcg ttcaaacatt tggcaataaa 9793gtttcttaag attgaatcct gttgccggtc ttgcgatgat tatcatctaa tttctgttga 9853attacgttaa gcatgtaata attaacatgt aatgcatgac gttatttatg agatgggttt 9913ttatgattag agtcccgcaa ttatacattt aatacgcgat agaaaacaaa atatagcgcg 9973caaactagga taaattatcg cgcgcggtgt catctatgtt actagatccg ggaattagcg 10033gccgcctcga ggtaccggat ttggagccaa gtctcataaa cgccattgtg gaagaaagtc 10093ttgagttggt ggtaatgtaa cagagtagta agaacagaga agagagagag tgtgagatac 10153atgaattgtc gggcaacaaa aatcctgaac atcttatttt agcaaagaga aagagttccg 10213agtctgtagc agaagagtga ggagaaattt aagctcttgg acttgtgaat tgttccgcct 10273cttgaatact tcttcaatcc tcatatattc ttcttctatg ttacctgaaa accggcattt 10333aatctcgcgg gtttattccg gttcaacatt ttttttgttt tgagttatta tctgggctta 10393ataacgcagg cctgaaataa attcaaggcc caactgtttt tttttttaag aagttgctgt 10453taaaaaaaaa aaaagggaat taacaacaac aacaaaaaaa gataaagaaa ataataacaa 10513ttactttaat tgtagactaa aaaaacatag attttatcat gaaaaaaaga gaaaagaaat 10573aaaaacttgg atcaaaaaaa aaaacataca gatcttctaa ttattaactt ttcttaaaaa 10633ttaggtcctt tttcccaaca attaggttta gagttttgga attaaaccaa aaagattgtt 10693ctaaaaaata ctcaaatttg gtagataagt ttccttattt taattagtca atggtagata 10753cttttttttc ttttctttat tagagtagat tagaatcttt tatgccaagt tttgataaat 10813taaatcaaga agataaacta tcataatcaa catgaaatta aaagaaaaat ctcatatata 10873gtattagtat tctctatata tattatgatt gcttattctt aatgggttgg gttaaccaag 10933acatagtctt aatggaaaga atcttttttg aactttttcc ttattgatta aattcttcta 10993tagaaaagaa agaaattatt tgaggaaaag tatatacaaa aagaaaaata gaaaaatgtc 11053agtgaagcag atgtaatgga tgacctaatc caaccaccac cataggatgt ttctacttga 11113gtcggtcttt taaaaacgca cggtggaaaa tatgacacgt atcatatgat tccttccttt 11173agtttcgtga taataatcct caactgatat cttccttttt ttgttttggc taaagatatt 11233ttattctcat taatagaaaa gacggttttg ggcttttggt ttgcgatata aagaagacct 11293tcgtgtggaa gataataatt catcctttcg tctttttctg actcttcaat ctctcccaaa 11353gcctaaagcg atctctgcaa atctctcgcg actctctctt tcaaggtata ttttctgatt 11413ctttttgttt ttgattcgta tctgatctcc aatttttgtt atgtggatta ttgaatcttt 11473tgtataaatt gcttttgaca atattgttcg tttcgtcaat ccagcttcta aattttgtcc 11533tgattactaa gatatcgatt cgtagtgttt acatctgtgt aatttcttgc ttgattgtga 11593aattaggatt ttcaaggacg atctattcaa tttttgtgtt ttctttgttc gattctctct 11653gttttaggtt tcttatgttt agatccgttt ctctttggtg ttgttttgat ttctcttacg 11713gcttttgatt tggtatatgt tcgctgattg gtttctactt gttctattgt tttatttcag 11773gtggatctgt tggggatcta ccatgagccc agaacgacgc ccggccgaca tccgccgtgc 11833caccgaggcg gacatgccgg cggtctgcac catcgtcaac cactacatcg agacaagcac 11893ggtcaacttc cgtaccgagc cgcaggaacc gcaggagtgg acggacgacc tcgtccgtct 11953gcgggagcgc tatccctggc tcgtcgccga ggtggacggc gaggtcgccg gcatcgccta 12013cgcgggcccc tggaaggcac gcaacgccta cgactggacg gccgagtcga ccgtgtacgt 12073ctccccccgc caccagcgga cgggactggg ctccacgctc tacacccacc tgctgaagtc 12133cctggaggca cagggcttca agagcgtggt cgctgtcatc gggctgccca acgacccgag 12193cgtgcgcatg cacgaggcgc tcggatatgc cccccgcggc atgctgcggg cggccggctt 12253caagcacggg aactggcatg acgtgggttt ctggcagctg gacttcagcc tgccggtacc 12313gccccgtccg gtcctgcccg tcaccgagat cccccgaatt tccccgatcg ttcaaacatt 12373tggcaataaa gtttcttaag attgaatcct gttgccggtc ttgcgatgat tatcatctaa 12433tttctgttga attacgttaa gcatgtaata attaacatgt aatgcatgac gttatttatg 12493agatgggttt ttatgattag agtcccgcaa ttatacattt aatacgcgat agaaaacaaa 12553atatagcgcg caaactagga taaattatcg cgcgcggtgt catctatgtt actagatccg 12613ggaattgggt acccaattcc ggaccgctgc tctagaggcg cgcccctagg gagcttctgc 12673agacgcgtcg acgtcatatg gatccgatct gttgcccgtc tcactggtga aaagaaaaac 12733caccccagta cattaaaaac gtccgcaatg tgttattaag ttgtctaagc gtcaatttgt 12793ttacaccaca atatatcctg ccaccagcca gccaacagct ccccgaccgg cagctcggca 12853caaaatcacc actcgataca ggcagcccat cagtccggga cggtcgacct gcaggcatgc 12913aagctcacgt agtgtacgta atcgatttcg aagggcccac tagtccatgg gctttttctc 12973ctcgtgctcg taaacggacc cgaacatctc tggagctttc ttcagggccg acaatcggat 13033ctcgcggaaa tcctgcacgt cggccgctcc aagccgtcga atctgagcct taatcacaat 13093tgtcaatttt aatcctctgt ttatcggcag ttcgtagagc gcgccgtgcg tcccgagcga 13153tactgagcga agcaagtgcg tcgagcagtg cccgcttgtt cctgaaatgc cagtaaagcg 13213ctggctgctg aacccccagc cggaactgac cccacaaggc cctagcgttt gcaatgcacc 13273aggtcatcat tgacccaggc gtgttccacc aggccgctgc ctcgcaactc ttcgcaggct 13333tcgccgacct gctcgcgcca cttcttcacg cgggtggaat ccgatccgca catgaggcgg 13393aaggtttcca gcttgagcgg gtacggctcc cggtgcgagc tgaaatagtc gaacatccgt 13453cgggccgtcg gcgacagctt gcggtacttc tcccatatga atttcgtgta gtggtcgcca 13513gcaaacagca cgacgatttc ctcgtcgatc aggacctggc aacgggacgt tttcttgcca 13573cggtccagga cgcggaagcg gtgcagcagc gacaccgatt ccaggtgccc aacgcggtcg 13633gacgtgaagc ccatcgccgt cgcctgtagg cgcgacaggc attcctcggc cttcgtgtaa 13693taccggccat tgatcgacca gcccaggtcc tggcaaagct cgtagaacgt gaaggtgatc 13753ggctcgccga taggggtgcg cttcgcgtac tccaacacct gctgccacac cagttcgtca 13813tcgtcggccc gcagctcgac gccggtgtag gtgatcttca cgtccttgtt gacgtggaaa 13873atgaccttgt tttgcagcgc ctcgcgcggg attttcttgt tgcgcgtggt gaacagggca 13933gagcgggccg tgtcgtttgg catcgctcgc atcgtgtccg gccacggcgc aatatcgaac 13993aaggaaagct gcatttcctt gatctgctgc ttcgtgtgtt tcagcaacgc ggcctgcttg 14053gcctcgctga cctgttttgc caggtcctcg ccggcggttt ttcgcttctt ggtcgtcata 14113gttcctcgcg tgtcgatggt catcgacttc gccaaacctg ccgcctcctg ttcgagacga 14173cgcgaacgct ccacggcggc cgatggcgcg ggcagggcag ggggagccag ttgcacgctg 14233tcgcgctcga tcttggccgt agcttgctgg accatcgagc cgacggactg gaaggtttcg 14293cggggcgcac gcatgacggt gcggcttgcg atggtttcgg catcctcggc ggaaaacccc 14353gcgtcgatca gttcttgcct gtatgccttc cggtcaaacg tccgattcat tcaccctcct 14413tgcgggattg ccccgactca cgccggggca atgtgccctt attcctgatt tgacccgcct 14473ggtgccttgg tgtccagata atccacctta tcggcaatga agtcggtccc gtagaccgtc 14533tggccgtcct tctcgtactt ggtattccga atcttgccct gcacgaatac cagcgacccc 14593ttgcccaaat acttgccgtg ggcctcggcc tgagagccaa aacacttgat gcggaagaag 14653tcggtgcgct cctgcttgtc gccggcatcg ttgcgccaca tctaggtact aaaacaattc 14713atccagtaaa atataatatt ttattttctc ccaatcaggc ttgatcccca gtaagtcaaa 14773aaatagctcg acatactgtt cttccccgat atcctccctg atcgaccgga cgcagaaggc 14833aatgtcatac cacttgtccg ccctgccgct tctcccaaga tcaataaagc cacttacttt 14893gccatctttc acaaagatgt tgctgtctcc caggtcgccg tgggaaaaga caagttcctc 14953ttcgggcttt tccgtcttta aaaaatcata cagctcgcgc ggatctttaa atggagtgtc 15013ttcttcccag ttttcgcaat ccacatcggc cagatcgtta ttcagtaagt aatccaattc 15073ggctaagcgg ctgtctaagc tattcgtata gggacaatcc gatatgtcga tggagtgaaa 15133gagcctgatg cactccgcat acagctcgat aatcttttca gggctttgtt catcttcata 15193ctcttccgag caaaggacgc catcggcctc actcatgagc agattgctcc agccatcatg 15253ccgttcaaag tgcaggacct ttggaacagg cagctttcct tccagccata gcatcatgtc 15313cttttcccgt tccacatcat aggtggtccc tttataccgg ctgtccgtca tttttaaata 15373taggttttca ttttctccca ccagcttata taccttagca ggagacattc cttccgtatc 15433ttttacgcag cggtattttt cgatcagttt tttcaattcc ggtgatattc tcattttagc 15493catttattat ttccttcctc ttttctacag tatttaaaga taccccaaga agctaattat 15553aacaagacga actccaattc actgttcctt gcattctaaa accttaaata ccagaaaaca 15613gctttttcaa agttgttttc aaagttggcg tataacatag tatcgacgga gccgattttg 15673aaaccacaat tatgggtgat gctgccaact tactgattta gtgtatgatg gtgtttttga 15733ggtgctccag tggcttctgt gtctatcagc tgtccctcct gttcagctac tgacggggtg 15793gtgcgtaacg gcaaaagcac cgccggacat cagcgctatc tctgctctca ctgccgtaaa 15853acatggcaac tgcagttcac ttacaccgct tctcaacccg gtacgcacca gaaaatcatt 15913gatatggcca tgaatggcgt tggatgccgg gcaacagccc gcattatggg cgttggcctc 15973aacacgattt tacgtcactt aaaaaactca ggccgcagtc ggtaacctcg cgcatacagc 16033cgggcagtga cgtcatcgtc tgcgcggaaa tggacgaaca gtggggctat gtcggggcta 16093aatcgcgcca gcgctggctg ttttacgcgt atgacagtct ccggaagacg gttgttgcgc 16153acgtattcgg tgaacgcact atggcgacgc tggggcgtct tatgagcctg ctgtcaccct 16213ttgacgtggt gatatggatg acggatggct ggccgctgta tgaatcccgc ctgaagggaa 16273agctgcacgt aatcagcaag cgatatacgc agcgaattga gcggcataac ctgaatctga 16333ggcagcacct ggcacggctg ggacggaagt cgctgtcgtt ctcaaaatcg gtggagctgc 16393atgacaaagt catcgggcat tatctgaaca taaaacacta tcaataagtt ggagtcatta 16453cccaattatg atagaattta caagctataa ggttattgtc ctgggtttca agcattagtc 16513catgcaagtt tttatgcttt gcccattcta tagatatatt gataagcgcg ctgcctatgc 16573cttgccccct gaaatcctta catacggcga tatcttctat ataaaagata tattatctta 16633tcagtattgt caatatattc aaggcaatct gcctcctcat cctcttcatc ctcttcgtct 16693tggtagcttt ttaaatatgg cgcttcatag agtaattctg taaaggtcca attctcgttt 16753tcatacctcg gtataatctt acctatcacc tcaaatggtt cgctgggttt atcgcacccc 16813cgaacacgag cacggcaccc gcgaccacta tgccaagaat gcccaaggta aaaattgccg 16873gccccgccat gaagtccgtg aatgccccga cggccgaagt gaagggcagg ccgccaccca 16933ggccgccgcc ctcactgccc ggcacctggt cgctgaatgt cgatgccagc acctgcggca 16993cgtcaatgct tccgggcgtc gcgctcgggc tgatcgccca tcccgttact gccccgatcc 17053cggcaatggc aaggactgcc agcgctgcca tttttggggt gaggccgttc gcggccgagg 17113ggcgcagccc ctggggggat gggaggcccg cgttagcggg ccgggagggt tcgagaaggg 17173ggggcacccc ccttcggcgt gcgcggtcac gcgcacaggg cgcagccctg gttaaaaaca 17233aggtttataa atattggttt aaaagcaggt taaaagacag gttagcggtg gccgaaaaac 17293gggcggaaac ccttgcaaat gctggatttt ctgcctgtgg acagcccctc aaatgtcaat 17353aggtgcgccc ctcatctgtc agcactctgc ccctcaagtg tcaaggatcg cgcccctcat 17413ctgtcagtag tcgcgcccct caagtgtcaa taccgcaggg cacttatccc caggcttgtc 17473cacatcatct gtgggaaact cgcgtaaaat caggcgtttt cgccgatttg cgaggctggc 17533cagctccacg tcgccggccg aaatcgagcc tgcccctcat ctgtcaacgc cgcgccgggt 17593gagtcggccc ctcaagtgtc aacgtccgcc cctcatctgt cagtgagggc caagttttcc 17653gcgaggtatc cacaacgccg gcggccgcgg tgtctcgcac acggcttcga cggcgtttct 17713ggcgcgtttg cagggccata gacggccgcc agcccagcgg cgagggcaac cagcccggtg 17773agcgtcgcaa aggcgctcgg tcttgccttg ctcgtcggtg atgtacttca ccagctccgc 17833gaagtcgctc ttcttgatgg agcgcatggg gacgtgcttg gcaatcacgc gcaccccccg 17893gccgttttag cggctaaaaa agtcatggct ctgccctcgg gcggaccacg cccatcatga 17953ccttgccaag ctcgtcctgc ttctcttcga tcttcgccag cagggcgagg atcgtggcat 18013caccgaaccg cgccgtgcgc gggtcgtcgg tgagccagag tttcagcagg ccgcccaggc 18073ggcccaggtc gccattgatg cgggccagct cgcggacgtg ctcatagtcc acgacgcccg 18133tgattttgta gccctggccg acggccagca ggtaggccga caggctcatg ccggccgccg 18193ccgccttttc ctcaatcgct cttcgttcgt ctggaaggca gtacaccttg ataggtgggc 18253tgcccttcct ggttggcttg gtttcatcag ccatccgctt gccctcatct gttacgccgg 18313cggtagccgg ccagcctcgc agagcaggat tcccgttgag caccgccagg tgcgaataag 18373ggacagtgaa gaaggaacac ccgctcgcgg gtgggcctac ttcacctatc ctgcccggct 18433gacgccgttg gatacaccaa ggaaagtcta cacgaaccct ttggcaaaat cctgtatatc 18493gtgcgaaaaa ggatggatat accgaaaaaa tcgctataat gaccccgaag cagggttatg 18553cagcggaaaa gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc 18613agggtcggaa caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat 18673agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg 18733gggcggagcc tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc 18793tggccttttg ctcacatgtt ctttcctgcg ttatcccctg attctgtgga taaccgtatt 18853accgcctttg agtgagctga taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca 18913gtgagcgagg aagcggaaga gcgccagaag gccgccagag aggccgagcg cggccgtgag 18973gcttggacgc tagggcaggg catgaaaaag cccgtagcgg gctgctacgg gcgtctgacg 19033cggtggaaag ggggagggga tgttgtctac atggctctgc tgtagtgagt gggttgcgct 19093ccggcagcgg tcctgatcaa tcgtcaccct ttctcggtcc ttcaacgttc ctgacaacga 19153gcctcctttt cgccaatcca tcgacaatca ccgcgagtcc ctgctcgaac gctgcgtccg 19213gaccggcttc gtcgaaggcg tctatcgcgg cccgcaacag cggcgagagc ggagcctgtt 19273caacggtgcc gccgcgctcg ccggcatcgc tgtcgccggc ctgctcctca agcacggccc 19333caacagtgaa gtagctgatt gtcatcagcg cattgacggc gtccccggcc gaaaaacccg 19393cctcgcagag gaagcgaagc tgcgcgtcgg ccgtttccat ctgcggtgcg cccggtcgcg 19453tgccggcatg gatgcgcgcg ccatcgcggt aggcgagcag cgcctgcctg aagctgcggg 19513cattcccgat cagaaatgag cgccagtcgt cgtcggctct cggcaccgaa tgcgtatgat 19573tctccgccag catggcttcg gccagtgcgt cgagcagcgc ccgcttgttc ctgaagtgcc 19633agtaaagcgc cggctgctga acccccaacc gttccgccag tttgcgtgtc gtcagaccgt 19693ctacgccgac ctcgttcaac aggtccaggg cggcacggat cactgtattc ggctgcaact 19753ttgtcatgct tgacacttta tcactgataa acataatatg tccaccaact tatcagtgat 19813aaagaatccg cgcgttcaat cggaccagcg gaggctggtc cggaggccag acgtgaaacc 19873caacataccc ctgatcgtaa ttctgagcac tgtcgcgctc gacgctgtcg gcatcggcct 19933gattatgccg gtgctgccgg gcctcctgcg cgatctggtt cactcgaacg acgtcaccgc 19993ccactatggc attctgctgg cgctgtatgc gttggtgcaa tttgcctgcg cacctgtgct 20053gggcgcgctg tcggatcgtt tcgggcggcg gccaatcttg ctcgtctcgc tggccggcgc 20113cagatc 20119

Claims

1.以区域专一的方式将卤素转移至底物的方法，包括在存在氧化剂、卤素供体、电子转移酶、和还原剂时使底物接触区域专一性卤化酶，其中若转移发生于体内，则电子转移酶是由异源核酸分子编码的。

2.权利要求1的方法，还包含FAD或FMN成份。

3.权利要求2的方法，其中进一步的成份是FAD。

4.权利要求2的方法，其中电子转移酶是能够催化电子由NADH或NADPH或铁氧还蛋白转移至FAD的酶。

5.权利要求2的方法，其中电子转移酶是能够催化电子由NADH或NADPH或铁氧还蛋白转移至区域专一性卤化酶的酶。

6.权利要求2的方法，其中电子转移酶是黄素还原酶、铁氧还蛋白NADP还原酶、铁氧还蛋白、心肌黄酶巯基还原酶或NADH-cyt-B5还原酶、NADPH-FMN还原酶、NADPH-cyt-p450还原酶、或硝酸还原酶。

7.权利要求6的方法，其中电子转移酶包含与依照SEQ ID NO：19、21、23、25、27、29、或31的任一氨基酸序列具有至少30％同一性的氨基酸序列。

8.权利要求7的方法，其中电子转移酶包含SEQ ID NO：19、21、23、25、29、或31任一的氨基酸序列。

9.权利要求1的方法，其中区域专一性卤化酶是prnA、prnC、藤黄绿脓菌素卤化酶pltA、pltD、和pltM、四环素卤化酶cts4、水解酶a、或balhimycin卤化酶bhaA。

10.权利要求9的方法，其中区域专一性卤化酶包含SEQ ID NO：1。

11.权利要求1 0的方法，其中区域专一性卤化酶是包含依照SEQID NO：3、5、7、9、11、13、15、或17任一的氨基酸结构域的多肽。

12.表达与SEQ ID NO：18、10、22、24、26、28、或30中的任一种基本相似的一种异源核酸和与SEQ ID N0：2、4、6、8、10、12、14、或16中的任一种基本相似的至少一种异源核酸的宿主细胞。

13.权利要求12的宿主细胞，其中宿主细胞是细菌、真菌、或植物细胞。

14.权利要求13的宿主细胞，其中宿主细胞是微生物细胞。

15.权利要求13的宿主细胞，其中宿主细胞还表达编码prnB和prnD的核酸序列。

16.生成硝吡咯菌素的方法，包括培养权利要求15的宿主细胞。

17.保护植物免于病原体的危害的方法，包括用权利要求15的宿主细胞处理植物，由此宿主以抑制病原体的量生成硝吡咯菌素。

18.权利要求16的方法，还包括由宿主收集硝吡咯菌素。

19.包含权利要求14的宿主细胞的植物。

20.包含权利要求15的宿主细胞的植物。

21.保护植物免于病原体的危害的方法，包括培养权利要求20的植物，由此在植物中以抑制病原体的量生成硝吡咯菌素。

22.依照权利要求20的植物的种子。

23.预防农作物上的真菌生长的方法，包括培养权利要求21的植物，其中植物是农作物植物。

24.用于改进宿主的卤化底物生成的方法，包括在宿主中表达编码电子转移酶的异源核酸分子，其中宿主表达至少一种具有区域专一性卤化酶活性的内源多肽。