MXPA02005868A - Composiciones y metodos para reacciones de halogenacion. - Google Patents

Composiciones y metodos para reacciones de halogenacion.

Info

Publication number
MXPA02005868A
MXPA02005868A MXPA02005868A MXPA02005868A MXPA02005868A MX PA02005868 A MXPA02005868 A MX PA02005868A MX PA02005868 A MXPA02005868 A MX PA02005868A MX PA02005868 A MXPA02005868 A MX PA02005868A MX PA02005868 A MXPA02005868 A MX PA02005868A
Authority
MX
Mexico
Prior art keywords
leu
gly
val
glu
arg
Prior art date
Application number
MXPA02005868A
Other languages
English (en)
Inventor
Jian Dong
Original Assignee
Syngenta Participations Ag
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Syngenta Participations Ag filed Critical Syngenta Participations Ag
Publication of MXPA02005868A publication Critical patent/MXPA02005868A/es

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0012Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
    • C12N9/0036Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on NADH or NADPH (1.6)
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01NPRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
    • A01N63/00Biocides, pest repellants or attractants, or plant growth regulators containing microorganisms, viruses, microbial fungi, animals or substances produced by, or obtained from, microorganisms, viruses, microbial fungi or animals, e.g. enzymes or fermentates
    • A01N63/20Bacteria; Substances produced thereby or obtained therefrom
    • A01N63/27Pseudomonas
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8279Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/04Alpha- or beta- amino acids
    • C12P13/22Tryptophan; Tyrosine; Phenylalanine; 3,4-Dihydroxyphenylalanine
    • C12P13/227Tryptophan
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/10Nitrogen as only ring hetero atom

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Plant Pathology (AREA)
  • Cell Biology (AREA)
  • Environmental Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Agronomy & Crop Science (AREA)
  • Pest Control & Pesticides (AREA)
  • Virology (AREA)
  • Dentistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Nutrition Science (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Agricultural Chemicals And Associated Chemicals (AREA)
  • Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Catching Or Destruction (AREA)

Abstract

La presente invencion describe metodos, microorganismos transgenicos y plantas transgenicas para la biosintesis de productos naturales halogenados, donde la halogenacion es substrato y regioespecifica. En particular, esta invencion se refiere al uso de metabolitos halogenados, producidos por el metodo de la invencion, para la proteccion de organismos hospederos contra patogenos, mas particularmente, para la proteccion de plantas contra fitopatogenos. En este aspecto, la invencion proporciona plantas transgenicas con resistencia mejorada a fitopatogenos, y organismos de biocontrol con propiedades de biocontrol mejoradas.

Description

COMPOSICIONES Y MÉTODOS PARA REACCIONES DE HAOGENACION DESCRIPCIÓN DE LA INVENCIÓN La presente invención se refiere de manera general a métodos, plantas transgénicas y microorganismos transgénicos para la biosintesis de productos naturales halogenados, donde la halogenación es substrato y regioespecifica. En un aspecto, la presente invención se refiere al uso de metabolitos halogenados, producidos por el método de la invención, para la protección de organismos hospederos contra patógenos, en forma más particular, a la protección de plantas contra fitopatógenos- En este aspecto, la invención proporciona plantas transgénicas con resistencia mejorada a fitopatógenos, y organismos de biocontrol con propiedades de biocontrol mejoradas. La biosintesis de por arriba de 2000 metabolitos halogenados que se originan en forma natural, conocidos, ha sido considerada como una función de dos clases de enzimas: las haloperoxidasas y las haloperoxidasas sin hemo (Gribble GW 1994, The natural production of chlorinated compounds. Environ Sci technol 28:310-319; van Pee K-H
[1996] Biosynthesis of halogenated metabolites by bacteria. Annu Rev Microbiol 50:375-99). Del primer grupo, todas las REF. :139518 bromoperoxidasas y cloroperoxidasas poseen protoporfirina IX como el grupo protético que contiene hemo. Este grupo actúa catalíticamente reaccionando con peróxido de hidrógeno para formar el hidroperóxido de la enzima (compuesto I), el cual reacciona entonces con el haluro (X; X=Br", Cl", o I") que resulta en la formación del intermediario EOX unido a la enzima (E) . Se desconoce si EOX es el agente de halogenación o si la descomposición de EOX conduce a un agente X+ de halogenación de vida corta, activado, o derivado del mismo (por ejemplo, HOX, X2 o X3) . Sin embargo, la falta de especificidad del substrato y falta de regioespecificidad exhibida por esta clase de halogenasas fuertemente argumenta que la halogenación se realiza fuera del sitio activo y es catalizada por uno de los productos de descomposición de EOX (Franssen MCR
[1994] Halogenation and oxidation reactions with haloperoxidases. Biocatalysis 10:87-111). Las haloperoxidasas sin hemo son de dos tipos, aquellas que poseen vanadio, y aquellas que poseen una caracteristica de triada catalítica de Ser/Asp/His de proteinasas de serina. El grupo formador cataliza la formación dependiente de vanadio y peróxido de hidrógeno de HOX el cual de nuevo resulta en la halogenación fuera del sitio activo y una falta pronunciada de especificidad de Érf^a^^^^^^? f ta^ substrato (Franssen MCR
[1994] Halogenation and oxidation reactions with haloperoxidases . Biocatalysis 10:87-111). Las haloperoxidasas sin hemo que no contienen vanadio son sometidas a hipótesis para formar un éster de acetato en el residuo Ser del sitio activo, el cual entonces se convierte a ácido peracético en la presencia de peróxido de hidrógeno; el ácido peracético oxida el ion haluro a una especie de halogenación activada (Pelletier I, Altenbucher J, Mattes R
[1995] . Una triada catalítica es requerida por la haloperoxidasa sin hemo para realizar la halogenación.
Biochim Biophys Acta 1250:149-157). Otra vez, el resultado es una reacción la cual falla para proceder con cualquier especificidad del substrato o regioespecificidad van Pee K-H
[1996] Biosynthesis of halogenated metabolites by bacteria. Annu Rev Microbiol 50:375-99). Últimamente se ha descrito una clase adicional de genes de halogenasa cuyos productos exhiben la capacidad de realizar la halogenación regioespecifica de un arreglo amplio de productos naturales (Ha mer PE, Hill DS, Lam ST, Van Pee KH, Ligón JM
[1997] Four genes from Pseudomonas fl uorescens that encode the biosynthesis of pyrrolnitrin. Appl Environ Microbiol 63:2147-2154.
^L t ¿~?£ti*.,~ .^J^^^á^a^ ^^ jg^^^^^^^ La presente invención describe métodos de transferencia de un halógeno a un substrato de una manera regioespecifica que comprende poner en contacto el substrato con una halogenasa regioespecifica en la presencia de un oxidante, un donador de halógeno, una electrón transferasa, y un reductor donde si la transferencia ocurre in vivo la electrón transferasa se codifica por una molécula de ácido nucleico heterólogo. En particular, se describen los métodos • en donde el método de acuerdo con la invención además comprende un componente FAD o FMN, particularmente FAD • en donde la electrón transferasa es una enzima capaz de catalizar la transferencia de electrones a partir de NADH o NADPH o ferredoxina a FAD • en donde la electrón transferasa es una enzima capaz de catalizar la transferencia de electrones a partir de NADH o NADPH o ferredoxina a la halogenasa regioespecifica • en donde la electrón transferasa es una flavina reductasa, ferrodoxina NADP reductasa, ferredoxina, diaforasa- sulfhidrilo reductasa o NADH-cyt-B5 reductasa, NADPH-FMN reductasa, NADPH-cyt-p450 reductasa o nitrato reductasa • en donde la electrón transferasa comprende una secuencia de aminoácidos que tiene al menos 30% de identidad a cualquiera de las secuencias de aminoácidos de acuerdo con las SEC ID NOs:19, 21, 23, 25, 27, 29 ó 31 • en donde la electrón transferasa comprende una secuencia de aminoácidos de cualquiera de las SEC ID NOs:19, 21, 23, 25, 29 ó 31 • en donde la halogenasa regioespecifica es prnA, prnC, pioluteorina halogenasas pltA, pltD, y pltM, tetraciclma halogenasa cts4, hidrolasa a, o balhimicina halogenasa bha A • en donde la halogenasa regioespecifica comprende la SEC ID N0:1 • en donde la halogenasa regioespecifica es un polipéptido que comprende un dominio de aminoácido de acuerdo con cualquiera de una de las SEC ID NOs:3, 5, 7, 9, 11, 13, 15 ó 17. Además se proporcionan células hospederas que expresan un ácido nucleico heterólogo substancialmente similar a cualquiera de una de las SEC ID Nos. 18, 10, 22, 24, 26, 28, ó 30 y al menos un ácido nucleico heterólogo substancialmente similar a cualquiera de las SEC ID N0s:2, 4, 6, 8, 10, 12, 14 ó 16, en particular en donde • la célula hospedera es una bacteria, hongo o célula vegetal • la célula hospedera es una célula microbiana • la célula hospedera además expresa secuencias de ácidos nucleicos que codifican prnB y prnD Se proveen además • métodos de producción de pirrolnitrina que comprende hacer crecer la célula hospedera como se menciona aqui posteriormente • métodos de protección de una planta contra un patógeno que comprende tratar la planta con la célula hospedera, por lo cual se produce la pirrolnitrina por el hospedero en cantidades que inhiben el patógeno los métodos como se mencionan aqui posteriormente, que además comprenden colectar pirrolnitrina a partir del hospedero. Adicionalmente se proporcionan • plantas que comprenden una célula hospedera de acuerdo con la invención • métodos de protección de una planta contra un patógeno, que comprende el crecimiento de la planta como se menciona posteriormente, por lo cual la pirrolnitrina es producida en la planta en cantidades que inhiben el patógeno • semillas de la planta como se mencionan en lo sucesivo • métodos para prevenir el crecimiento de hongos sobre un cultivo, que comprende hacer crecer la planta de acuerdo con la invención, en donde la planta es una planta de cultivo • métodos para mejorar la producción de substratos halogenados por un hospedero que comprende expresar una molécula de ácido nucleico heterólogo que codifica la electrón transferasa en un hospedero en donde el hospedero expresa al menos un polipéptido endógeno que tiene actividad de halogenasa regioespecifica. En la presente invención se encuentra de manera sorprendente que las halogenasas regioespecificas son capaces de transferir un halógeno a un substrato in vi tro pero con el fin de hacer que los mismos requieran un factor de proteina adicional, una electrón transferasa. El descubrimiento que un factor proteináceo adicional es requerido para efectuar la halogenación in vi tro por estas enzimas, se hace a través de la purificación de PrnA, una D-triptofano halogenasa que funciona en la biosintesis de pirrolnitrina, un antibiótico de nitrofenilpirrol diclorado, por Pseudomonas fl uorescens .
La purificación de esta halogenasa dependiente de NADH y dinucleótido de flavina adenina (posteriormente "FAD") se acompañó por una disminución progresiva en la actividad de halogenación. Durante la cromatografía de intercambio iónico de extractos a partir de P. fl uorescens que sobreexpresan la PrnA, la PrnA parcialmente purificada e inactiva podria ser reactivada por la adición de alícuotas de fracciones cromatográficas a partir de las cuales PrnA se ausenta. El factor responsable para la reactivación aqui designada P. fl uorescens P2, posteriormente muestra ser una proteina en la base de su sensibilidad al calor y a la proteasa. La purificación de PrnA a la homogeneidad conduce a una pérdida completa de actividad, la cual podria ser almacenada por la adición de una electrón transferasa de la invención. Una segunda halogenasa en la trayectoria de pirrolnitrina, PrnC, exhibe la similitud de secuencia con PrnA, aunque menos similitud de secuencia a PrnA que a las siguientes halogenasas regioespecificas conocidas por estar involucradas en la biosintesis de productos naturales halogenados: pioluteorina (véase, Nowak-Thompson B, Chaney N, Wing JS, Gould SJ, Loper JE,
[1999] Characterization of the pyoluteorin biosynthetic gene cluster of Pseudomonas fl uorescens Pf-5. J Bacteriol 181:2166-2174); cloroeremomicina (véase, van Wageningen AM, Kirkpatrick PN, Williams DH, Harris BR, Kershaw JK, Lennard NJ, Jones M, Jones SJ, Solenberg PJ
[1998] Sequencing and analysis of genes involved in the biosynthesis of a vancomycin group antibiotic. Chem Biol 5:155-162); balhi icina (véase, Pelzer S, Sussmuth R, Heckmann D, Recktenwald J, Huber P, Jung G, Wohlleben W
[1999] identification and analysis of the balhimycin biosynthetic gene cluster and its use for manipulating glycopeptide biosynthesis in ?mycolatopsis medi terranei DSM5908. Antimicrob Agents Chemother 43:1565-73 y Pelzer S. Reichert W, Huppert M, Heckmann D, Wohlleben W
[1997] Cloning and analysis of a peptide synthetase gene of the balhimycin producer Amycolatopsis medi terranei DSM5908 and development of a gene disruption/replacement system. J Biotechnol 56:115-128); y clorotetraciclina (véase, Dairi T, Nakano T, Mizukami T, Aisaka K, Hasegawa M, Katsumata R
[1995] Conserved organization of genes for biosynthesis of chlortetracycline in Streptomyces strains. Biosci Biotechnol Biochem 59:1360-1361, y Dairi T, Nakano T, Aisaka K, Katsumata R, Hasegawa M
[1995] Cloning and nucleotide sequence of the gene responsible for chlorination of tetracycline. Biosci Biotechnol Biochem 59:1099-106). Similar a PrnA, la purificación de PrnC se acompañó por una pérdida l^ j tt mm imÉtí^ M^ de actividad de halogenación, que podria ser restablecida por la adición de una electrón transferasa de la invención. La trayectoria de pirrolnitrina se ha mostrado previamente para la función en E. coli cuando se expresó el operón de pirrolnitrina que codifica PrnA, PrnB, PrnC y PrnD (para la secuencia de ácido nucleico del operón de pirrolnitrina véase 5.8 X/N, citado en la Patente Estadounidense No. 5,723,759 la cual se incorpora aqui como referencia en su totalidad) . La función de PrnA y PrnC como halogenasas; PrnB cataliza el rearreglo de la porción mdolilo de triptofano al aminofenilpirrol, y PrnD oxida la porción aminofenilo a un substituyente de nitrofenilo. De manera sorprendente en la presente invención se encuentra que cuando una electrón transferasa de la invención, flavina reductasa de E. coli (de aqui en adelante "Fre") en este caso, es sobreexpresada, la producción in vivo de pirrolnitrina es mejorada significativamente. La presencia de la "actividad semejante a P2" se estableció en E. coli por la adición de extracto de E. coli a la PrnA inactiva purificada. La actividad semejante a P2 de E. coli se purificó entonces parcialmente por el intercambio de iones, hidroxiapatita, y cromatografía de columna de permeación de gel. Las fracciones de columna que contienen la t*«m* ?+ ^~*-l** . actividad, y las fracciones inactivas de flanqueo se tripsinizaron y se secuenciaron por espectrometría de masa; los péptidos identificados en las fracciones inactivas se substrajeron de aquellos presentes en la fracción que contiene la actividad semejante a P2 de E. coli , activo, y los péptidos remanentes referidos en la base de datos del genoma de E. coli . A partir de esto, únicamente se identificó una secuencia de ácido nucleico, una flavina reductasa dependiente de NADH, (posteriormente "fre", Genbank acceso 23486) . Como se describirá en forma más especifica en la descripción detallada posteriormente, la fre de E. coli se clonó entonces y se sobreexpresó, y la células de sobreexpresión demuestran poseer incrementos en la actividad semejante a P2 de E. coli directamente proporcional a su incremento en la actividad de flavina reductasa. -fre también se co-transformó en E. coli junto con el operón de pirrolnitrina en plásmidos separados. Las células que albergan ambos plásmidos producen una pirrolnitrina significativamente superior o metabolitos de pirrolnitrina que aquellas que albergan el operón de pirrolnitrina solo, que confirma la identidad de Fre como el factor auxiliar para PrnA y PrnC, asi como también la indicación que, en E. coli , ^^tite^»^**^^^ ^ la actividad de flavina reductasa es un factor principal que limita la producción de pirrolnitrina. En una modalidad de la invención, se provee un método para la transferencia de un halógeno a un substrato en una manera regioespecifica que comprende poner en contacto el substrato con una halogenasa regioespecifica en la presencia de un oxidante, un donador de halógeno, una electrón transferasa, y un reductor donde si la transferencia ocurre in vivo la electrón transferasa es heteróloga al hospedero. En otra modalidad de la invención, se provee un método de transferencia de un halógeno a un substrato en una manera regioespecifica que comprende poner en contacto el substrato con una halogenasa regioespecifica en la presencia de un oxidante, un donador de halógeno, una electrón transferasa, un reductor y FAD o FMN, donde si la transferencia ocurre in vi vo, la electrón transferasa es heteróloga al hospedero. En una modalidad particularmente preferida, la reacción resulta en la producción de pirrolnitrina. En una modalidad preferida la electrón transferasa es una enzima capaz de catalizar la transferencia de electrones de NADH o NADPH o ferredoxina o FAD o la electrón transferasa es una enzima capaz de catalizar la transferencia de electrones desde NADH o NADPH o ferredoxina a la halogenasa regioespecifica. En una modalidad preferida de la invención, la secuencia de aminoácido de electrón transferasa es al menos 30% idéntica, preferiblemente 40% idéntica, en forma más preferida 50% idéntica, en forma más preferida 60% idéntica, en forma más preferida 70% idéntica, en forma más preferible 80% idéntica, o en forma más preferida 90% idéntica a NADPH-FMN reductasa, NADPH citocromo P-450 reductasa del higado de la rata, ferredoxina NADP reductasa de espinaca, citocromo b5 reductasa, o nitrito reductasa. En una modalidad preferida de la invención, la secuencia de aminoácido de halogenasa regioespecifica es al menos 30% idéntica, preferiblemente 40% idéntica, en forma más preferida 50% idéntica, en forma más preferida 60% idéntica, en forma más preferida 70% idéntica, más preferiblemente 80% idéntica, o en forma más preferida 90% idéntica a PrnA, PrnC, pioluteorina halogenasas Pl tA, pl tD, y pl tM de Pseudomonas fluorescens, tetraciclina halogenasa cts4 de Streptomyces aurofaciens, hidrolasa a partir de A ycolatopsis orientalis, o balhimicina halogenasa bha A de Amycolatopsis mediterranei . flÉfr- L.1i^i^.^f^^í^k.^ßt^^^^ ^?..é¡i á.
En una modalidad preferida se provee una célula hospedera que expresa un ácido nucleico heterólogo substancialmente similar a aquel de una electrón transferasa de la invención y que expresa un ácido nucleico heterólogo que codifica una halogenasa regioespecifica de la invención. En una modalidad preferida, la célula hospedera es una célula bacteriana, fúngica o vegetal. En una modalidad preferida, se provee una célula hospedera que expresa moléculas de ácido nucleico heterólogo que codifican prnA, prnB, prnC, prnD y -fre. En una modalidad preferida, se provee un método para producir pirrolnitrina haciendo crecer una célula hospedera, la cual puede incluir una célula vegetal, que expresa moléculas de ácido nucleico heterólogas que codifican prnA, prnB, prnC, prnD y fre . En una modalidad preferida, se provee una planta que comprende una célula hospedera que expresa un ácido nucleico heterólogo substancialmente similar a aquel de una electrón transferasa de la invención y que expresa un ácido nucleico heterólogo que codifica una halogenasa regioespecifica de la invención. En una modalidad preferida, se provee una planta que expresa moléculas de ácido nucleico heterólogas que codifican prnA, prnB, prnC, prnD y una electrón transferasa de la invención.
BREVE DESCRIPCIÓN DEL LISTADO DE SECUENCIAS SEC ID NO:l es la porción de aminoácido conservado presente en las halogenasas regioespecificas de la invención. SEC ID NO: 2 es la secuencia de ácido nucleico que codifica PrnA de P. fl uorescens SEC ID NO: 3 es la secuencia de aminoácido de PrnA de P. fluorescens SEC ID NO.4 es la secuencia de ácido nucleico que codifica PrnC de P. fl uorescens SEC ID NO: 5 es la secuencia de aminoácido de PrnC de P. fluorescens SEC ID NO: 6 es la secuencia de ácido nucleico que codifica PltA de P. fl uorescens SEC ID NO: 7 es la secuencia de aminoácido de PltA de P. fluorescens SEC ID NO: 8 es la secuencia de ácido nucleico que codifica PltD de P. fl uorescens SEC ID NO: 9 es la secuencia de aminoácido de PltdD de P. fluorescens _4 i í i ití iá-í.
SEC ID NO: 10 es la secuencia de ácido nucleico que codifica PltM de P. fluorescens SEC ID NO: 11 es la secuencia de aminoácido de PltM de P. fluorescens SEC ID NO: 12 es la secuencia de ácido nucleico que codifica hidrolasa A de A. orientalis SEC ID NO: 13 es la secuencia de aminoácido de hidrolasa A de A. orientalis SEC ID NO: 14 es la secuencia de ácido nucleico que codifica cts4 de S. aureofaciens SEC ID NO: 15 es la secuencia de aminoácido de cts4 de 5. aureofaciens SEC ID NO: 16 es la secuencia de ácido nucleico que codifica bhaA a partir de A. medi terranei SEC ID NO: 17 es la secuencia de aminoácido de bhaA de A. medi terranei SEC ID NO: 18 es la secuencia de ácido nucleico que codifica Fre de E. coli SEC ID NO: 19 es la secuencia de aminoácido de Fre de E. coli SEC ID NO: 20 es la secuencia de ácido nucleico que codifica NADH citocromo b5 reductasa de rata. SEC ID NO: 21 es la secuencia de aminoácido de NADH citocromo b5 reductasa de rata.
SEC ID NO: 22 es la secuencia de ácido nucleico que codifica NADPH-cyt-p450-reductasa de conejo. SEC ID NO: 23 es la secuencia de aminoácido de NADPH-cyt-p450-reductasa de conejo SEC ID NO: 24 es la secuencia de ácido nucleico que codifica ferodoxina de S. olerácea . SEC ID NO: 25 es la secuencia de aminoácido de ferodoxina de S. olerácea SEC ID NO: 26 es la secuencia de ácido nucleico que codifica NADPH-FMN reductasa de V. Fischeri . SEC ID NO: 27 la secuencia de aminoácido de NADPH-FMN reductasa de V. Fischeri . SEC ID NO: 28 es la secuencia de ácido nucleico que codifica ferredoxina-NADP reductasa de S. olerácea SEC ID NO: 29 es la secuencia de aminoácido de ferredoxina-NADP reductasa de 5. olerácea SEC ID NO: 30 es la secuencia de ácido nucleico que codifica nitrato reductasa de A. parasi ticus SEC ID NO: 31 es la secuencia de aminoácido que codifica nitrato reductasa de A. parasi ticus SEC ID NO: 32 es el cebador de flavina reductasa de E. coli SEC ID NO: 33 es el cebador para flavina reductasa de E. coli SEC ID NO: 34 es el plásmido pNOV523 ^^¡á^.^.-^^^ . --*..-~ SEC ID NO: 35 es el plásmido pNOV524 Producción de Productos Naturales Halogenados In Vi tro . De acuerdo con la presente invención, los productos naturales halogenados se pueden producir in ví tro haciendo reaccionar una halogenasa regioespecifica con un substrato en la presencia de un donador de halógeno, un oxidante, un reductor, y una electrón transferasa de la invención. Un halogenasa regioespecifica de la invención es una halogenasa que es capaz de interactuar con un haluro, un oxidante, y un sistema de reducción para catalizar el reemplazo de uno o más enlaces de carbono-hidrógeno por uno o más enlaces de carbono-halógeno durante una reacción de halogenación biológica y es substrato y/o regioespecifica. Regioespecifica significa que los enlaces carbono-halógeno están formados sólo en locaciones especificas en un substrato. Las halogenasas regioespecificas preferidas de la invención comprenden aquellas que incluyen la siguiente porción conservada y cataliza el reemplazo de al menos un enlace carbono-hidrógeno por un enlace carbono-halógeno a una locación especifica. xl-W-x2-W-x3-I-P-x4 (SEC ID N0:1) donde XI es G o T; X2 es V, L, T, F o M; X3 es cualquier residuo de aminoácido 5 X4 es I, F, M o L En una modalidad preferida, las halogenasas de la presente invención comprende Triptofano halogenasas. Las triptofano halogenasas de la invención incluyen PrnA (SEC ID 0 NO: 3 (véase, acceso de proteina # AAB97504; Hammer PE, Burd W. Hill DS, Ligón JM, van Pee K, "Conservation of the pyrrolnitrin biosynthetic gene cluster among six pyrrolnitrin-producing strains." FEMS Microbiol Lett 1999 Nov 1; 180 (1) : 39-44) y halogenasas regioespecificas que 5 preferiblemente tienen 90% de identidad, 80% de identidad, 70% de identidad, 60% de identidad, 50% de identidad o 40% de identidad a SEC ID NO: 3. El porcentaje de identidad entre secuencias de aminoácidos como se usa en toda esta solicitud se determina por el programa BASTP 2.09 disponible en 0 ' - : . " - . , - -- donde los ajustes de parámetros son: matriz de marcación blosum62 con una penalización de apertura de separación de 7 y una -_s_ 3 penalización de extensión de separación de 2 y x_reducción de 50 y esperado de 10.00 y tamaño de palabra de 3. En otra modalidad preferida las halogenasas regioespecificas de la invención comprenden monocloroaminopirrolnitrina halogenasas. Las monocloroaminopirrolnitrina halogenasas comprenden PrnC (SEC ID NO: 5) que tienen el número de acceso de proteina AAB97506 y halogenasa regioespecifica que preferiblemente tiene 90% de identidad a ésta, 80% de identidad con ésta, 70% de identidad a ésta, 60% de identidad, 50% ó 40% de identidad a ésta. En una modalidad particularmente preferida de la invención, las halogenasas regioespecificas de la invención comprenden cualquiera que sea 30% idéntica, preferiblemente 40% idéntica, en forma más preferiblemente 50% idéntica, en forma más preferida 60% idéntica, en forma más preferida 70% idéntica, más preferiblemente 80% idéntica, en forma más preferida 90% idéntica, más preferiblemente 95% idéntica, o en forma más preferida 99% idéntica a cualquiera de prnA (SEC ID NO: 3), prnC (SEC ID NO: 5), pioluteorina halogenasas pltA (SEC ID NO: 7), pltD (SEC ID NO: 9), y pltM (SEC ID NO: 11) de Pseudomonas fl uorescens, tetraciclina halogenasa cts4 (SEC ID NO: 15) de Streptomyces aurofaciens, hidrolasa a (SEC ID O: 13) de Amycolatopsis orientalis , balhimicina halogenasa bha A (SEC ID NO: 17) de Amycola topsis medi terranei que incluye aquellos identificados en la siguiente tabla: Una electrón transferasa de la invención puede comprender una electrón transferasa capaz de transferir electrones de NADH o NADPH o ferredoxina u otro reductor a FAD o FMN, o una electrón transferasa capaz de transferir electrones de NADH o NADPH o ferredoxina u otro reductor a la halogenasa por una oxidoreductasa dependiente de NAD(P)H o una oxidoreductasa con otros donadores de electrones, tal como el fotosistema de cloroplastos, lactato, xantina, etc. Las electrón transferasas de la invención pueden ser determinadas seleccionando electrón transferasas en las cuales la transferencia del electrón puede ser detectada monitoreando la oxidación de NADH o NADPH o ferredoxina por el cambio característico en la absorbencia asociada con la oxidación del reductor. Este cambio (o incremento en la velocidad de cambio) es dependiente de la presencia de FAD o FMN. La oxidación de NADH y NADPH puede ser detectada monitoreando la absorbancia a 340 nm; la oxidación resulta en una disminución en la absorbancia. La oxidación de ferredoxina puede ser detectada monitoreando la absorbancia a 420 nm; la oxidación resulta en un incremento en la absorbancia. La transferencia del electrón puede también ser detectada monitoreando la oxidación de NADH o NADPH por la disminución caracteristica en la fluorescencia con excitación a 340 nm y emisión a >380 nm. Este decremento en la fluorescencia es dependiente de la presencia de FAD o FMN. Las electrón transferasas de la invención pueden también ser determinadas seleccionando las electrón transferasas en las cuales la transferencia del electrón a la halogenasa regioespecifica de la invención a partir de NADH o NADPH puede ser identificada mezclando la electrón transferasa con 50 micromolares de NADH o 50 micromolares de NADPH con o sin 50 micromolares de halogenasa (la halogenasa necesita estar en el estado haloenzima, que es con todos los cofactores necesarios, tal como FAD, ya unidos) y observando un incremento en la velocidad de oxidación de NADH o NADPH que es dependiente de la halogenasa; la oxidación es medida por un incremento en la absorbancia a 340 nm o una disminución en la fluorescencia como se describe anteriormente . Las electrón transferasas de la invención pueden ser determinadas seleccionando las electrón transferasas en las cuales la transferencia del electrón a la halogenasa a partir de ferredoxina puede ser identificada mezclando la electrón transferasa con 50 micromolar de ferredoxina reducida con o sin 50 micromolares de halogenasa (la halogenasa necesita estar en el estado holoenzima, que es con todos los cofactores necesarios, tal como FAD, ya unidos) , y observando un incremento en la velocidad de oxidación de que es dependiente de la halogenasa; la oxidación de la ferredoxina es medida por una absorbancia incrementada a 340 nm. En una modalidad preferida de la invención, la electrón transferasa es al menos 30% idéntica, preferiblemente 40% idéntica, más preferiblemente 50% idéntica, más preferiblemente 60% idéntica, más preferiblemente 70% idéntica, más preferiblemente 80% idéntica, más preferiblemente 90% idéntica o idéntica a cualquiera de las siguientes: una flavina reductasa de E. coli que comprende la secuencia de aminoácido de la SEC ID NO: 19 (descrita por Fieschi F, Niviere V, Frier C, Decout JL, Fontecave M. "The mechanism and substrate specificity of the NADPH: flavin oxidoreductase from Escherichia coli". J Biol Chem 1995 Dic 22; 279 (51) : 30392-400) ; la diaforasa-sulfhidrilo reductasa purificada de conformidad con Richarme, G. "Purification of a new dihydrolipoamide dehydrogenase from Escherichia coli," J Bacteriol (1989 Dic.) 171(12): 680-5; NADH citocromo-b5- reductasa (SEC ID NO: 21) (descrita por Barber MJ, Quinn GB "High-level expression in Escherichia coli of the soluble, catalytic domain of rat hepatic cytochrome b5 reducíase". Protein Expr Purif 1996 Ago; 8(l):41-7); NADPH-cyt-P450 reductasa (SEC ID NO:23) a partir de conejo, ferredoxina-NADP reductasa (SEC ID NO: 29) a partir de S. olerácea, ferredoxina (SEC ID NO: 25) a partir de S. olerácea, nitrato reductasa (SEC ID NO: 27) a partir de A. parasi ticus, y NAD(P)H-FMN reductasa (SEC ID NO: 27) a partir de V. fischeri (descrita por Zenno S, Saigo K "identification of the genes encoding NAD (P) H-flavin oxidoreductases that are similar in sequence to Escherichia coli Fre in four species of luminous bacteria: Photorhabdus luminiscens, Vibrio fischeri, Vibrio harveyi, and Vibrio orientallis". J Bacteriol 1994 Jun; 176 (12) : 3544-51) ; Las electrón transferasas de la invención pueden ser usadas en la forma de extracto o purificada. En una modalidad particularmente preferida, la electrón transferasa de la invención es al menos 30% idéntica, preferiblemente 40% idéntica, más preferiblemente 50% idéntica, más preferiblemente 60% idéntica, más preferiblemente 70% idéntica, más preferiblemente 80% idéntica, o más preferiblemente 90% idéntica a cualquiera de las SEC ID NOs:21, 23, 25, 27, 29 ó 31 y pruebas positivas para la transferencia del electrón en cualquiera de las pruebas descritas anteriormente. gj^^j^?áHjy La selección del reductor tal como un nucleótido de piridina, por ejemplo, dinucleótido de adenina nicotinamida reducida o fosfato dinucleótido de adenina nicotinamida reducida o ferrodoxina reducida, depende de la selección de la electrón transferasa de la invención. En general todas las electrón transferasas de la invención tienen actividad catalítica superior con uno u el otro nucleótido de piridina; pero generalmente tienen alguna actividad con el otro nucleótido de piridina. Asi, si es deseable debido a otras consideraciones, pueden ser usados los nucleótidos de piridina no preferidos en las reacciones de halogenación con electrón transferasas particulares. Los nucleótidos de piridina preferidos de cada electrón transferasa son como sigue: NADPH es el nucleótido de piridina preferido para la NADPH-cyt-P450 reductasa y ferredoxina NADP reductasa. El NADH es el nucleótido de piridina preferido para flavina reductasa de E. coli , NADH-citocromo-b5-reductasa, nitrato reductasa y diaforasa sulfhidrilo reductasa. La ferredoxina NADP reductasa puede también usar ferredoxina reducida la cual puede ser generada por iluminación de plantas, de cloroplastos aislados o de fragmentos de cloroplastos que contienen fotosistema I. La ferredoxina puede también ser usada por deshidrogenasas dependientes de la ferredoxina tal como piruvato: ferredoxina oxidoreductasa. (Horner DS, Hirt RP, Embley TM "A single eubacterial origin of eukaryotic pyruvate : ferredoxm oxidoreductase genes: implications for the evolution of anaerobic eukaryotes." Mol Biol Evol 1999 Sep; 16(9):1280-91) . En una modalidad preferida, FAD puede ser incluido en la reacción in vi tro para incrementar la eficiencia de la reacción. En una modalidad particularmente preferida la reacción incluye FAD y la halogenasa regioespecifica seleccionada es PrnA. En una modalidad alterna, la invención comprende combinar la halogenasa, en donde la halogenasa es una halogenasa regioespecifica purificada de la presente invención con el substrato, un ion halógeno tal como Cl- y con un donador activo de oxigeno tal como H202, K104, yodosobenceno, yodosobenzoato, hidroperóxido de ter-butilo, peróxido de benzoilo, hidroperóxido de cumeno, peróxido de dicumilo, ácido peroxi acético o compuestos aliados. Los donadores activos de oxigeno se distribuyen con la necesidad de suministrar 02 y reductor. Un substrato de la invención dependerá de la halogenasa regioespecifica seleccionada de la invención. Los substratos de la invención pueden incluir triptofano, indol, aminofenilpirrol y derivados allí de y tetraciclina, substratos para bhaA que incluyen todos los compuestos del substrato de balhimicina clases Bl-1, Bl-2, B2-1, B2-2, y B3 (descritos por Pelzer S, Sussmuth R, Heckmann D, Recktenwald J, Huber P, Jung G, Wohlleben W
[1999] Identificación y análisis del agrupamiento de gen biosintético balhimicina y su uso para manipular la biosíntesis de glicopéptidos en Amycolatopsis medi terranei DSM5908. Antimicrob Agents Chemother 43:1565-73) . Un donador de halógeno empleado en la presente invención, puede ser suministrado a la reacción como una sal de un catión inorgánico u orgánico o como sus respectivos ácidos. El donador de halógeno de la invención puede proporcionar un ion F~, Cl", Br", o I". Las reacciones de la invención pueden ser conducidas en amortiguador con pH entre 4 y 10, temperatura entre 0°C y 65°C. El donador de halógeno puede ser agregado como una sal, por ejemplo, las sales de cloruro pueden incluir LiCl, NaCl, KC1, CsCl, MgCl2 CaCl2 y NH4C1. Los tiempos de reacción pueden variar desde 1 minuto a 48 horas. Las condiciones óptimas son pH 7.5, temperatura 30°C, tiempo de reacción de 12 h. -t-MÉ ^g!Íg^^^¡ La eficiencia de catalizadores en halogenaciones in ví tro puede ser incrementada acoplando covalentemente la electrón transferasa a la halogenasa, haciendo así la transferencia del electrón a partir del reductor a la haogenasa un primer proceso de orden en lugar de un segundo proceso de orden (con respecto a la concentración de halogenasa) . El mismo resultado puede obtenerse diseñando genéticamente una proteina de fusión que contiene tanto una electrón transferasa como una halogenasa regioespecífica de la invención fusionando sus regiones de codificación en estructura. Las fusiones pueden elaborarse con o sin una secuencia de intervención que codifica para una secuencia peptídica corta que separa las electrón transferasas y los dominios de proteínas halogenasas. Las proteínas de fusión pueden elaborarse en cualquiera de las dos orientaciones: (1) N-término-electrón transferasa- (enlazador opcional) -halogenasa-C-término; (2) N-término-halogenasa- (enlazador opcional) -electrón transferasa-C-término . En otra modalidad de la invención, los componentes de proteína del sistema que comprenden una halogenasa regioespecífica y electrón transferasa pueden ser inmovilizados, como se describe además abajo y se dejan reaccionar con substratos para generar productos. La halogenasa y electrón transferasa pueden ser usados como enzimas individuales que son co-inmovilizadas o como una proteína de fusión en la cual las secuencias que codifican para los dos componentes están fusionadas para generar una proteína única con la electrón transferasa y las actividades de la halogenasa. Una enzima adicional y reductor secundario apropiado pueden ser incluidos en el sistema para generar NADH ó NADPH: ejemplos de tales pares reductores secundarios de enzima incluyen: alcohol deshidrogenasa y etanol, glucosa-6-fosfato deshidrogenasa y glucosa-6-fosfato, aldehido deshidrogenasa y acetaldehido, lipoamida deshidrogenasa y tiol reducido tal como lipoamida, ditiotreitol o ácido mercaptosulfónico . En esta modalidad las enzimas (las cuales podrían incluir enzimas del NADH o NADPH que regeneran el sistema si tal sistema es usado) , pueden ser inmovilizadas por cualquiera de los varios procesos. Los ejemplos incluyen: (1) colocación de las enzimas dentro de un contenedor con una membrana semipermeable (membrana de diálisis) que permitirá el paso de substratos y nucleótidos pero no enzimas; (2) covalentemente uniendo las enzimas a una matriz insoluble; (3) enlazando las enzimas a una matriz vía anticuerpos dirigidos contra las enzimas o anticuerpos dirigidos contra antígenos fusionados a las enzimas; (4) enlazando las enzimas a una matriz vía un dominio de enlace a la biotina tal como avidina. (5) Polimerizando una matriz (tal como un polímero de metacrilato) alrededor de la enzima. Las enzimas inmovilizadas pueden entonces estar expuestas a un amortiguador que contiene el reductor, reductor secundario (si NAD(P)H que regenera el sistema es usado), substrato y sal de haluro. Los solventes orgánicos pueden incluirse para facilitar la solubilización de substratos. Las condiciones típicas comprenden pH 4 a 10, 0 a 65°C. Después que suficiente producto halogenado se ha generado, los productos naturales halogenados son removidos de la mezcla de reacción.
Producción de Productos Naturales Halogenados en Hospederos Heterólogos Las moléculas de ácido nucleico heterólogo que codifican una electrón transferasa de la invención pueden ser expresadas en hospederos bacterianos o fúngicos para permitir la producción de la halogenación de productos naturales con eficiencia mayor que podría ser posible a partir de los hospederos nativos. Por ejemplo, para mejorar la producción de productos naturales, una molécula de ácido nucleico ..^^^r^?A^I^^?^flfui heterólogo que codifica una electrón transferasa de la invención, puede ser expresada en productores de pirrolnitrina tal como Pseudomonas fl uorescens, Burkholdepa pyrrocinia , Myxococcus fulvus, Burkholderia cepacia , Pseudomonas aureofaciens, productores de pioluteorina tal como Pseudomonas fluorescens, organismos que producen antibióticos de la clase de vancomicina tal como varias especies de Amycolatopsis tal como A. orientalis y A. medi terranei y el productor de clorotetraciclina Streptomyces aureofaciens, u otras especies de Streptomyces que producen antibióticos. Además, las moléculas de ácido nucleico heterólogo que codifican halogenasas regioespecíficas y electrón transferasas, pueden ser co-expresadas en hospederos bacterianos o fúngicos para permitir o incrementar la producción de productos naturales halogenados. En algunos casos la síntesis de los productos naturales halogenados de la invención, solamente requerirá un paso biosintético, el paso de halogenación y, por lo tanto, las moléculas de ácido nucleico solamente heterólogos que serán expresadas serán aquellas que comprenden secuencias codificantes para la halogenasa y electrón transferasa de la invención. En otros casos, uno o más pasos de halogenación serán parte de una trayectoria biosintética que resulta en el producto natural halogenado. En este caso se expresarán moléculas de ácido nucleico heterólogo múltiples. El término "molécula de ácido nucleico heterólogo" como se usa a través de la presente especificación, se refiere a una molécula de ácido nucleico no asociada naturalmente con una célula hospedera en la cual es introducida, incluyendo constructos genéticos, copias múltiples que no se originan naturalmente de una molécula de ácido nucleico que se origina naturalmente; y por otra parte una molécula de ácido nucleico homólogo operativamente ligada a una molécula de ácido nucleico no nativa. En su sentido más amplio, el término "substancialmente similar", cuando se usa en toda la presente especificación con respecto a una molécula de ácido nucleico, significa una molécula de ácido nucleico que corresponde a una secuencia de nucleótido de referencia, en donde la molécula de ácido correspondiente codifica un polipéptido que tiene substancialmente la misma estructura y función como el polipéptido codificado por la secuencia de nucleótido de referencia, por ejemplo, en donde solamente cambia en aminoácidos que no afectan que ocurra la función del polipéptido. Deseablemente la molécula de ácido nucleico substancialmente similar codifica el polipéptido codificado por la secuencia de nucleótido de referencia. El término "substancialmente similar" está específicamente propuesto para incluir moléculas de ácido nucleico en donde la secuencia se ha modificado para optimizar la expresión en células particulares. El porcentaje de identidad entre la molécula de ácido nucleico substancialmente similar y la secuencia de nucleótido de referencia deseablemente es al menos 30%, preferiblemente al menos 45%, más deseablemente al menos 65%, más deseablemente al menos 75%, preferiblemente al menos 85%, más preferiblemente al menos 90%, todavía más preferiblemente al menos 95%, aún todavía más preferiblemente al menos 99% idéntica. Las comparaciones de secuencia se llevaron a cabo usando un algoritmo de alineación de secuencia Smith-Waterman (véase por ejemplo, Waterman, M.S. Introduction to Computational Biology:Maps, sequences and genomes. Chapman & Hall. Londres: 1995. ISBN 0-412-99391-0, o en http : //www-hto .use . edu/software/seqaln/index .html) . El programa local S, versión 1.16 es usado con los siguientes parámetros: igualación: 1, penalización por desigualdad: 0.33, penalización de extensión de separación: 2, penalización de extensión ampliada: 2. Una molécula de ácido nucleico "substancialmente I . í similar" a una secuencia de nucleótido de referencia hibridiza a la secuencia de nucleótido de referencia en 7% de dodecil sulfato de sodio (SDS), NaP04 0.5M, EDTA 1 mM a 50°C con lavados en SSC 2X, SDS al 0.1% a 50°C, más deseablemente en 7% de dodecil sulfato de sodio (SDS), NaP04 0.5M, EDTA 1 mM a 50°C con lavados en SSC IX, SDS a 0.1% a 50°C, más deseablemente todavía en 7% de dodecil sulfato de sodio (SDS), NaP04 0.5 M, EDTA 1 raM a 50°C con lavado en SSC 0.5X, SDS al 0.1% a 50°C, preferiblemente en 7% de dodecil sulfato de sodio (SDS), NaP04 al 0.5M, EDTA 1 mM a 50°C con lavados en SSC 0.1X, SDS al 0.1% a 50°C, más preferiblemente en 7% de dodecil sulfato de sodio (SDS), NaP04 0.5 M, EDTA 1 mM a 50°C con lavados en SSC 0.1X, SDS al 0.1% a 65°C. El polinucleótido de la invención que hibridiza bajo las condiciones anteriores preferiblemente comprende al menos 80 pares base, más preferiblemente al menos 50 pares base y particularmente al menos 21, y más particularmente 18 pares base. Las técnicas para estas manipulaciones genéticas son específicas para los hospederos diferentes disponibles y se conocen en la técnica. Por ejemplo, el vector de expresión pKK223 puede ser usado para expresar genes heterólogos en E. coli, ya sea en la fusión transcripcional o traduccional, detrás del promotor tac. Para la expresión de operones que codifican estructuras lectoras abiertas múltiples (aquí posteriormente "ORFs") , el procedimiento más simple es insertar el operon en un vector tal como pKK223 en la fusión transcripcional, permitiendo el sitio de enlace del ribosoma cognato de los genes heterólogos ser usados. Las técnicas para la sobre expresión en las especies gram-positivas tales como Bacill us son también conocidas en la técnica y pueden ser usadas en el contexto de esta invención (Quax et al . En: Industrial Microorganisms: Basic and Applied Molecular Genetics, Eds . Baltz et al . , American Society for Microbiology, Washington (1993) ) . Los sistemas alternos para la sobre expresión confían en vectores de levaduras e incluyen el uso de Pichia , Saccharomyces y Kl uyveromyces (Sreekrishna, En: Industrial microorganisms :basic and applied molecular genetics, Baltz, Hegeman, and Skatrud eds., American Society for Microbiology, Washington (1993); Dequin & Biotechnology 12:173-177 (1994); van den Berg et al . , Biotechnology 8:135-139 (1990)). Algunos de estos productos naturales halogenados pueden ser efectivos en la inhibición del crecimiento de microbios, particularmente microbios fitopatogénicos . Los productos naturales halogenados pueden ser producidos a partir de organismos en los cuales la halogenasa y/o electrón transferasa han sido sobre expresados, y organismos adecuados para estos incluyen bacterias y levaduras gram-negativa y gram-positiva, así como también plantas las cuales serán descritas en más detalle abajo. Para los propósitos de producción del producto natural halogenado, el criterio significante en la selección del organismo hospedero es su facilidad de manipulación, rapidez de crecimiento ( es decir, fermentación en el caso de microorganismos) , y su carencia de susceptibilidad al producto natural halogenado siendo sobre producido. Estos métodos de producción de producto natural halogenado tienen ventajas significantes sobre la tecnología de síntesis química usualmente usada en la preparación de productos naturales halogenados. La aplicación de los métodos descritos aquí podría incrementar la eficiencia y rendimiento en la producción de productos naturales halogenados por fermentación y podría ser usado en la introducción de nuevos átomos de halógeno en posiciones que previamente no están presentes en el producto natural y que podría ser difícil lograr sintéticamente. Algunas de las ventajas sobre la síntesis química son costos más baratos de producción, y la habilidad para sintetizar compuestos de una regioespecificidad preferida de halogenación. La incorporación de un electrón transferasa puede incrementar la eficiencia y rendimiento de los productos halogenados. Además, los nuevos productos halogenados pueden ser producidos por adición de halógeno a productos naturales conocidos ya sea por uso de halogenasas que se originan naturalmente con substrato deseado y regioespecificidad o por uso de halogenasas diseñadas genéticamente con nuevo substrato y regioespecificidad. Podrá ser muy difícil usar medios químicos para halogenar muchos productos naturales por ejemplo, macrólidos, policétidos y péptidos no ribosomales, con regioespecificidad y especificidad enantiomérica. Las condiciones requeridas para halogenación de porciones arilo o alquilo podrán de manera general, causar otros cambios en la estructura del producto natural. Las halogenasas pueden también producir productos enantioméricamente puros (en el caso de halogenación de un carbón pro-quiral), opuestos a las mezclas racémicas comúnmente generadas por síntesis orgánicas. La habilidad para producir compuestos estereoquimicamente apropiados es particularmente importante para moléculas con muchos átomos de carbono quiralmente activos. Los productos naturales halogenados producidos por hospederos heterólogos pueden ser usados por numerosos propósitos incluyendo médicos ( es decir, control de patógenos y/o padecimientos infecciosos) así como también aplicaciones agrícolas. En donde una producción de un producto halogenado requiere más de una enzima, las moléculas de ácido nucleico que codifican enzimas para la biosíntesis del producto halogenado de interés pueden ser expresadas en un organismo individual. En una modalidad preferida, todas las secuencias de ácido nucleico que codifican las enzimas para el producto natural, podrán ser integradas en el cromosoma del organismo como un operon sencillo y controlado por un elemento regulatorio adecuado. En una modalidad preferida alterna, las secuencias de ácido nucleico pueden ser llevadas en un plásmido con un marcador seleccionable. Otra modalidad preferida alterna comprende expresar las secuencias de ácido nucleico requeridas en dos o más plásmidos compatibles o las secuencias de ácido nucleico requeridas podrán ser distribuidas entre el cromosoma y uno o más plásmidos compatibles. La expresión de las moléculas de ácido nucleico podrá ser controlada por los elementos regulatorios nativos de las secuencias codificantes de ácido biosintético del producto natural o por promotores seleccionados para permitir el control más preciso de la expresión de las secuencias de ácido nucleico de la trayectoria. Óptimamente, las secuencias de ácido nucleico de la electrón transferasa podrán estar incluidas en el operón junto con aquellas que codifican la halogenasa regioespecífica (o halogenasas) de la invención. Alternativamente, las secuencias de la electrón transferasas pueden ser expresadas de manera separada. Otro método de la invención para crear productos halogenados comprende dividir moléculas de ácido nucleico a partir de la trayectoria biosintética entre dos o más organismos separados. Los organismos puede hacerse crecer separadamente con intermediarios biosintéticos producidos por un cultivo a ser transferido a otros cultivos que expresan pasos subsecuentes en la trayectoria de biosíntesis. Alternativamente, los organismos pueden ser co-cultivados con intermedios que pasan de uno a otro como se requiere. En cualquiera de estas aplicaciones, cada halogenasa requiere una electrón transferasa adecuada co-expresada en el mismo organismo y en la misma ubicación sub-celular. Los nuevos productos halogenados pueden ser producidos introduciendo una halogenasa en un organismo que ya expresa genes requeridos para producir la estructura no halogenada de interés. La halogenasa puede ser diseñada genéticamente por tener especificidad para el sitio e *, ÍÍ. .?-B--específico en la estructura completa o puede tener especificidad para un componente de la estructura que es subsecuentemente incorporado en la estructura final en el organismo nativo. Por ejemplo, una halogenasa puede ser diseñada genéticamente para específicamente halogenar un aminoácido que es subsecuentemente incorporado en un antibiótico que contiene péptido. El producto resultante puede entonces poseer nuevas modificaciones de halógeno en posiciones no encontradas en el producto natural. En cualquiera de los sistemas descritos anteriormente, las ventajas significantes en la eficiencia de halogenación puede ser afectadas por fusión de las secuencias de ácido nucleico que codifican para la electrón transferasa y la halogenasa regioespecífica, de manera tal que una proteína de fusión es generada sin ambas funcionalidades; tal fusión puede resultar en eficiencia superior de la transferencia del electrón a partir del reductor a la halogenasa. Las secuencias de ácido nucleico de la electrón transferasa pueden ser fusionadas a cualquiera de los extremos 5' o el 3' de la halogenasa. Una secuencia de codificación para un péptido de enlace corto (enlazador) puede ser incorporada en la fusión, separando la secuencia codificante para la electrón transferasa y dominios de proteína de halogenasa; la longitud del enlazador puede variar de 1 hasta 30 residuos de aminoácidos en longitud. Las halogenasas y/o electrón transferasas de la invención puede también ser expresadas en hospederos bacterianos heterólogos y fúngicos para producir productos naturales halogenados con el objetivo de incrementar la eficiencia de cepas de biocontrol de tales hospederos bacterianos y fúngicos. Los microorganismos los cuales son adecuados para la sobre expresión heteróloga de productos naturales halogenados anti-patogénicos son todos microorganismos los cuales son capaces de colonizar plantas o la rizosfera. Como tales, serán llevados en contacto con el hongo fitopatogénico, bacterias y nemátodos que causan una inhibición del crecimiento del patógeno. Estos incluyen microorganismos gram-negativa tal como Pseudomonas , Enterobacter y Serra tia , los microorganismos gram-positivas Bacill us y el hongo Trichoderma y Gliocladi um. Los hospederos heterólogos particularmente preferidos son Pseudomonas fluorescens, Pseudomonas putida, Pseudomonas cepacia, Pseudomonas aureofaciens, Pseudomonas aurantiaca , Enterobacter cloacae, Serratia marscesens, Bacillus subtilis, Bacillus cereus, Trichoderma viride, Trichoderma harzianum y Gliocladi um virens. ±^fH»^.^---^«EJ---M-Kf*—********* La expresión en cepas heterólogas de biocontrol requiere la selección de vectores apropiados para la replicación en el hospedero seleccionado y una selección adecuada de promotor. Las técnicas son bien conocidas en el arte para la expresión en la bacteria y hongos gram-negativa y gram-positiva, y son descritas en alguna parte en esta especificación.
Producción de Productos Halogenados en Plantas Transgénicas Las halogenasas y/o electrón transferasas de la invención son expresadas en plantas transgénicas así causando la biosintesis de los productos naturales halogenados seleccionados en las plantas transgénicas. En algunos casos, los productos naturales halogenados de la invención, solamente requerirán un paso biosintético, el paso de halogenación y por lo tanto, las únicas moléculas de ácido nucleico heterólogo que serán expresadas serán aquellas que comprenden secuencias codificantes para la halogenasa regioespecífica y electrón transferasa de la invención. En otros casos, uno o más pasos de halogenación serán parte de una trayectoria biosintética que resulta en el producto natural halogenado. En este caso múltiples moléculas de ácido nucleico heterólogo serán expresadas.
Como se usa en esta especificación, una "planta" se refiere a cualquier planta o parte de una planta en cualquier etapa de desarrollo. En eso están también incluidos cortes, células o cultivos de tejidos y semillas. Como se usa en conjunto con la presente invención, el término "tejido de planta" incluye, pero no se limita a, plantas completas, células vegetales, órganos vegetales, semillas vegetales, protoplastos, callos, cultivos celulares y cualquier grupo de células vegetales organizados en unidades estructurales y/o funcionales. En donde el producto natural halogenado tiene propiedades anti-patogénicas, las plantas transgénicas con resistencia mejorada a hongos fitopatogénicos y bacterias son generadas. Para su expresión en plantas transgénicas, las moléculas de ácido nucleico que codifica las halogenasas y/o electrón transferasas de la invención y secuencias adyacentes pueden requerir modificación y optimización. Aunque en muchos casos la molécula de ácido nucleico a partir de otros organismos puede ser expresada en plantas a niveles superiores sin modificación, puede resultar baja expresión en plantas transgénicas a partir de moléculas de ácido nucleico que tienen codones los cuales no son preferidos en las plantas. Se sabe en la técnica que todos los organismos tienen preferencias específicas para el empleo ,,^^,^^-*^-^-^^ 2Mili de codón, y los codones a partir de otros organismos, pueden ser cambiados para conformarse con las preferencias de plantas, mientras se mantienen los aminoácidos codificados. Además, la expresión alta en plantas es mejor lograda a partir de secuencias codificantes las cuales tienen al menos 35% de contenidos GC, pueden expresarse pobremente en plantas debido a la existencia de porciones ATTTA las cuales pueden desestabilizar mensajes, y porciones AATAAA las cuales pueden causar poliadenilación inapropiada. Además, las moléculas de ácido nucleico que codifican las halogenasas o electrón transferasas de la invención pueden ser seleccionadas por la existencia de sitios de empalme ilegítimos los cuales pueden causar truncación de ARNm. Todos los cambios requeridos para ser elaborados dentro de la secuencia codificante tal como aquellos descritos anteriormente, pueden ser elaborados usando técnicas bien conocidas de mutagénesis dirigida al sitio, PCR y construcción sintética del gen usando los métodos descritos en las solicitudes de patentes publicadas EP 0 385 962, EP 0 359 472 y WO 93/07278. Las moléculas de ácido nucleico preferidas de la invención, pueden no ser modificadas, deberán ser estas expresadas en niveles altos en especies de plantas transgénicas objetivo, o alternativamente pueden ser moléculas de ácido nucleico modificadas por la remoción de desestabilización y porciones inapropiadas de poliadenilación y sitios de empalme ilegítimos y además modificados por la incorporación de codones preferidos de plantas, y además con un contenido GC preferido para la expresión en plantas. Aunque las secuencias preferidas de ácido nucleico pueden ser adecuadamente expresadas en especies de plantas tanto monocotiledóneas como dicotiledóneas, las secuencias pueden ser modificadas para contar las preferencias de codón específicas y preferencias de contenido GC de monocotiledóneas o dicotiledóneas como estas preferencias han mostrado diferir (Murray et al . Nucí. Acids Res. 17:477-498 (1989)). Para iniciación eficiente de traducción, las secuencias adyacentes a la metionina de iniciación pueden requerir modificación. Las secuencias cognadas a las moléculas de ácido nucleico seleccionadas pueden iniciar la traducción eficientemente en plantas, o alternativamente, pueden así ser ineficientes. En el caso en que sean ineficientemente, pueden ser modificadas por la inclusión de secuencias conocidas por ser efectivas en las plantas. Joshi ha sugerido un iniciador de traducción consenso apropiado para plantas (NAR 15:6643-6653 (1987); SEC ID NO: 15) y Clontech sugiere un iniciador de la traducción consenso adicional (catálogo 1993/1994, página 210; SEC ID NO: 16). Estos consensos son adecuados para uso con las moléculas de ácido nucleico de la invención. Las secuencias están incorporadas en la construcción de la molécula de ácido nucleico, hasta e incluyendo el ATG (mientras se deja el segundo aminoácido de la molécula de ácido nucleico seleccionada sin modificar) , o alternativamente hasta e incluyendo el substituyente GTC en el ATG (con la posibilidad de modificar el segundo aminoácido del transgen) . La expresión de las moléculas de ácido nucleico que codifican las halogenasas o electrón transferasas de la invención en plantas transgénicas es detrás de un promotor mostrado por ser funcional en las plantas. La selección del promotor variará dependiendo de los requerimientos temporales y espaciales para la expresión, y también dependiendo de las especies objetivo. En donde los productos naturales halogenados son anti-patogénicos y la protección de plantas contra los patógenos foliares se desea, la expresión en hojas es preferida; para la protección de plantas contra patógenos de maíz, se prefiere la expresión en inflorescencias (por ejemplo, espigas, panículas, mazorcas, etc.); para la protección de plantas contra patógenos de la raíz, se prefiere la expresión en raíces; para la protección de i ^ i i á plántulas contra patógenos que nacen del suelo, se prefiere la expresión en raíces y/o plántulas. En muchos casos, sin embargo, la expresión contra más de un tipo de fitopatógenos se sugerirá, y así la expresión en múltiples tejidos será deseable. Aunque muchos promotores a partir de dicotiledóneas han mostrado ser operacionales en monocotiledóneas y vise versa, idealmente, los promotores de dicotiledóneas se seleccionan por su expresión en dicotiledóneas y los promotores de monocotiledóneas para la expresión en monocotiledones. Sin embargo, no hay restricción en la procedencia de los promotores seleccionados; es suficiente que sean operacionales accionando la expresión de las moléculas de ácido nucleico de la invención. Los promotores preferidos los cuales son expresados constitutivamente incluyen los promotores CaMV 35S y 19S, y promotores a partir de genes que codifican la actina o ubiquitina. Las moléculas de ácido nucleico de la invención pueden también ser expresadas bajo la regulación de promotores los cuales son químicamente regulados. Esto permite al producto natural halogenado, ser sintetizado solamente cuando las plantas de cultivos son tratadas con la inducción de químicos, y la biosíntesis del producto natural halogenado subsecuentemente declina. La tecnología preferida ff*faa-'^'1fflttf'<1'1tHfiff'a para la inducción química de la expresión del gen, se detalla en la solicitud publicada EP 0 332 104 y patente Estadounidense 5,614,395 (incorporada aquí por referencia). Un promotor preferido para la inducción química es el promotor PR-la del tabaco. Una categoría preferida de promotores es aquella la cual es inducible a las lesiones. Se han descrito numerosos promotores los cuales son expresados en sitios de lesiones y también en sitios de la infección del fitopatógeno. Idealmente, tal promotor beberá solamente ser localmente activo en los sitios de infección, y en esta forma, el producto natural halogenado anti-patogénico solamente se acumula en las células en las cuales necesita ser sintetizado para interrumpir el crecimiento del patógeno invasor. Los promotores preferidos de esta clase incluyen aquellos descritos por Standford et al . , Mol. Gen. Genet. 215:200-208 (1989), Xu et al . , Plant Mol. Biol., 22:783-792 (1993), Logemann et al . Plant Cell 1 : 151-158 (1989), Rohrmeier & Lehle, Plant Molec. Biol. 22:783-792 (1993), Firek et al . , Plant Molec. Biol. 22:129-142 (1993), y Warner et al . , Plant J. 3:191-201 (1993) . Los patrones de expresión específicos del tejido preferidos, incluyen específicos del tejido verde, MÉMÜiü^-i ÉU específicos de la raíz, específicos del tallo y específicos de la flor. Los promotores adecuados para la expresión en tejido verde incluyen muchos los cuales regulan genes involucrados en la fotosíntesis y muchos de estos han sido clonados de tanto monocotiledóneas como dicotiledóneas. Un promotor preferido es el promotor PEPC de maíz a partir del gen de fosfoenol piruvato carboxilasa (Hudspeth & Gruía, Plant Molec. Biol. 12:579-589 (1989)). Un promotor preferido para la expresión específica de la raíz es aquél descrito por de Framond (FEBS 290:103-106 (1991); EP 0 452 269
[1974]) y un promotor específico de la raíz preferido adicional es aquél del gen T-l proporcionado por esta invención. Un promotor específico del tallo preferido, es aquel descrito en la solicitud de patente WO 93/07278 y el cual acciona la expresión del gen trpA de maíz. Las modalidades preferidas de la invención son las plantas transgénicas que se producen del producto natural halogenado, pirrolnitrina en una forma específica de la raíz. En una modalidad especialmente preferida de la invención, los genes biosintéticos para la pirrolnitrina son expresados detrás de un promotor específico de la raíz para proteger plantas transgénicas contra el fitopatógeno Rhizoctonia . Las modalidades preferidas adicionales son plantas transgénicas que producen productos naturales halogenados anti-patogénicos en una manera inducible de infección del patógeno o inducible de lesiones. Además de la selección de un promotor adecuado, las construcciones para la producción de productos naturales halogenados en las plantas requiere un terminador de la transcripción apropiado que esté unido corriente abajo de las moléculas de ácidos nucleicos de halogenasas heterólogos y/o electrón transferasas. Varios de tales terminadores son disponibles y conocidos en la técnica (por ejemplo, tml a partir de CaMV, E9 de rbcS) . Cualquier terminador disponible conocido por funcionar en las plantas puede ser usado en el contexto de esta invención. Otras numerosas secuencias pueden ser incorporadas en los casetes de expresión para las moléculas de ácido nucleico de halogenasa y/o electrón transferasas. Estas secuencias incluyen aquellas que han mostrado mejorar la expresión tal como secuencias intrones (por ejemplo, de Adhl y bronzel ) y secuencias líderes virales (por ejemplo, de TMV, MCMV y AMV) . La producción de productos naturales halogenados en las plantas, requiere que la molécula de ácido nucleico biosintética de producto natural halogenado que codifica el primer paso en la trayectoria, tendería acceso al substrato de la trayectoria. Para cada producto natural halogenado individual y trayectoria involucrada, este substrato posiblemente diferirá, y para su localización en la planta. En muchos casos el substrato puede ser localizado en el citosol, mientras en otros casos, puede ser localizado en algunos organelos subcelulares. Tanta actividad biosintética en la planta ocurra en el cloroplasto, a menudo el substrato puede ser localizado en el cloroplasto y consecuentemente las halogenasas y electrón transferasas de la invención son mejor dirigidas al organelo apropiado (por ejemplo, el cloroplasto) . La localización subcelular de las enzimas que codifican el transgen puede ser intentada usando técnicas bien conocidas en el arte. Tipicamente, el ADN que codifica el péptido objetivo de un producto del gen dirigido al organelo conocido, es manipulado y fusionado corriente arriba de las moléculas de ácido nucleico de halogenasa y electrón transferasa requeridas. Muchas secuencias objetivo son conocidas por el cloroplasto y se ha mostrado su funcionamiento en las construcciones heterólogas. En una modalidad preferida de esta invención, las moléculas de ácido nucleico requeridas para la biosíntesis de pirrolnitrina son dirigidas al cloroplasto debido a que la trayectoria del **^ ±??M ? *ii¿?gto substrato triptofano es sintetizada en el cloroplasto. En algunas situaciones, la sobre expresión de ácidos nucleicos requeridos para la producción de productos naturales halogenados puede disminuir la disponibilidad celular del substrato por una trayectoria particular y este puede tener efectos perjudiciales en la célula. En situaciones tales como esta es deseable incrementar la cantidad de substrato disponible por la sobre expresión de las moléculas de ácido nucleico las cuales codifican las enzimas por la biosíntesis del substrato. En el caso del triptofano (el substrato para la biosíntesis de pirrolnitrina) , este puede ser logrado por la sobre expresión de las moléculas de ácido nucleico que codifican trpA y trpB. Una trayectoria adicional de elaboración de más substrato disponible es por el cambio de las trayectorias conocidas las cuales utilizan substratos específicos (siempre que se hacen sin efectos colaterales perjudiciales) . En esta manera, el substrato sintetizado es encauzado hacia la biosíntesis del producto natural halogenado y no hacia otros compuestos. Los vectores adecuados para la transformación de plantas se describen en alguna parte en esta especificación. Para la transformación mediada por Agrobacteri um, los vectores binarios o vectores que portan al menos una secuencia límite de ADN-T son adecuados, mientras para la transferencia directa, cualquier vector es adecuado y el ADN lineal que contiene solamente la construcción de interés puede ser preferido. En el caso de transferencia directa, puede ser usada la transformación con unas especies de ADN sencillas o co-transformación (Schocher et al . Biotechnology 4:1093-1096 (1986)). Para la transferencia directa y transferencia mediada por Agrobacterium, la transformación es usualmente (pero no necesariamente) intentada con un marcador seleccionable el cual puede proporcionar resistencia a un antibiótico (kanamicina, higromicina o metotrexato) o un herbicida (basta) . La selección del marcador seleccionable no es sin embargo, crítica a la invención. La síntesis de un producto natural halogenado en una planta transgénica, frecuentemente requerirá la sobre expresión simultánea de moléculas de ácido nucleico múltiples que codifican las enzimas biosintéticas del producto natural halogenado. Esto puede lograrse transformando las moléculas de ácido nucleico biosintético del producto natural halogenado individual en diferentes líneas de plantas individualmente, y después cruzando las líneas resultantes. La selección y mantenimiento de las líneas que llevan múltiples secuencias de ácido nucleico se facilita si cada ! » una de las varias construcciones de transformación utilizan diferentes marcadores seleccionables. Una línea en la cual todos las moléculas de ácido nucleico biosintéticas de producto natural halogenado que han sido amontonadas sintetizará el producto natural halogenado, mientras otras líneas no lo serán. Este procedimiento puede ser adecuado para los cultivos híbridos tales como maiz en los cuales el híbrido final es necesariamente una cruza entre dos padres. El mantenimiento de líneas producidas diferentes con moléculas de ácido nucleico heterólogo diferentes, puede también ser ventajoso en situaciones en donde una trayectoria de producto natural halogenado particular puede conducir a múltiples productos naturales halogenados, cada uno de los cuales tiene una utilidad. Utilizando diferentes líneas que llevan diferentes secuencias de ácido nucleico alternativas por pasos posteriores en la trayectoria para hacer una cruza híbrida con lineas que llevan todas las moléculas de ácido nucleico requeridas restantes, es posible generar diferentes híbridos que llevan diferentes productos naturales halogenados seleccionados los cuales pueden tener diferentes utilidades. Los métodos alternos para producir líneas de plantas que llevan múltiples secuencias de ácido nucleico, incluyen la retransformación de líneas existentes ya transformadas con una molécula o moléculas de ácido nucleico biosintético de producto natural halogenado (y selección con un marcador diferente) , y también el uso de vectores de transformación individuales los cuales llevan múltiples moléculas de ácido nucleico biosintéticas, cada una bajo control regulatorio apropiado (es decir, promotor, terminador, etc.). Dada la facilidad de construcción de ADN, la manipulación de los vectores de clonación para llevar múltiples moléculas de ácido nucleico biosintéticas es un método preferido. Otro método preferido es construir una proteína de fusión como se describe anteriormente de la halogenasa de la invención con la electrón transferasa de la invención y expresar un ácido nucleico que codifica una proteína de fusión en una planta transgénica de la invención. La molécula de ácido nucleico que codifica la electrón transferasa puede ser fusionada a ya sea el extremo 5' ó 3' de la molécula de ácido nucleico que codifica la halogenasa. Un enlazador, puede opcionalmente, ser incorporado en la fusión, separando la electrón transferasa y los dominios de la proteína halogenasa. En una modalidad preferida la proteína de fusión comprende un enlazador compuesto de (Gly) 6. Sin embargo, un experto en la técnica reconocerá que un enlazador de otras longitudes adecuadas y/o composición pueden también ser seleccionado. En otra modalidad preferida, la producción de productos naturales halogenados en las plantas puede lograrse por transformación de plástido directa. La expresión del plástido en el cual los genes son insertados por recombinación homologa en los varios cientos de copias del genoma del plástido circular presente en cada célula vegetal, toma ventaja de la enorme ventaja de número de copias sobre los genes nucleares expresados para permitir los niveles de expresión que pueden fácilmente exceder el 10% de la proteína de planta soluble total. En una modalidad preferida, la secuencia de nucleótido es insertada en un vector de objetivo plástido y transformada en el genoma plástido de un hospedero de planta deseado. Se obtienen las plantas homoplásmicas para los genomas plástidos que contienen la secuencia de nucleótido, y son preferiblemente capaces de expresión alta de la secuencia de nucleótidos. La tecnología de transformación de plástidos es por ejemplo, extensivamente descrita en las Patentes Estadounidenses Nos. 5,451,513, 5,545,817, 5,545,818 y 5,877,462 en la solicitud PCT No. WO 95/16783 y WO 97/32977, J-----»-?----^-^A¿-?L>^ SílÁÁ y en McBride et al . (1994) Proc. Nati. Acad. Sci. USA 91, 7301-7305, todas incorporadas aquí por referencia en su totalidad. La técnica básica para la transformación de plástidos involucra introducir regiones de ADN de plástido clonado que flanquean un marcador seleccionable junto con la secuencia de nucleótidos en un tejido objetivo adecuado, por ejemplo, usando transformación de protoplastos o biolística (por ejemplo, cloruro de calcio, o transformación mediada por PEG). Las regiones de flanqueo 1 hasta 1.5 kb, llamadas secuencias de objetivo, facilitan la recombinación homologa con el genoma plástido y así permiten el reemplazo o modificación de regiones específicas del plastoma. Inicialmente, las mutaciones en punto en los genes 16S ARNr y rpsl2 del cloroplasto, que confieren resistencia a la espectinomicina y/o estreptomicina son utilizados como marcadores seleccionables para la transformación (Svab, Z., Hajdukiewicz, P., y Maliga, P. (1990) Proc. Nati. Acad. Sci. USA 87, 8526-8530; Staub, J. M., y Maliaga, P. (1992) Plant Cell 4, 39-45) . La presencia de sitios de clonación entre estos marcadores permite la creación de un vector de objetivo plástido para la introducción de genes extraños (Staub, J. M., y Maliga, P. (1993) EMBO J. 12, 601-606). El incremento substancial en la frecuencia de transformación se obtiene por el reemplazo del ARNr recesivo o genes de resistencia al antibiótico de la proteína-r con un marcador seleccionable dominante, el gen aadA bacteriano que codifica a la enzima espectinomicina-detoxificante aminoglicosido-3' -adeniltransferasa (Svab, Z., y Maliga, P. (1993) Proc . Nati . Acad. Sci . USA 90, 913-917) . Otros marcadores seleccionables empleados para la transformación de plástidos se conocen en la técnica y están abarcados dentro del ámbito de la invención. En una modalidad particularmente preferida de la invención, la producción inducible de plástido de pirrolnitrina se logra por transformación de cloroplasto directa de fre, prnA, prnB, prnC, y prnD como un operon bajo control del promotor T7 bacteriófago. La expresión inducible es lograda mediante cruzas con plantas que poseen un constructo nuclear que codifica la polimerasa de ARN T7 diseñada genéticamente por poseer un péptido de tránsito de cloroplasto y bajo el control del promotor PRI, permitiendo la expresión inducible de BTH. La producción de productos naturales halogenados por el método de la invención puede ocurrir en una amplia variedad de células de plantas, que incluyen aquellas de gimnospermas, monocotiledóneas y dicotiledóneas. Aunque el gen puede ser insertado en cualquier célula vegetal que cae dentro de estas clases amplias, es particularmente útil en, pero no limitado a las células vegetales de cultivos, tales como arroz, trigo, cebada, centeno, maíz, papa, zanahoria, papa dulce, remolacha, frijol, guisantes, achicoria, lechuga, col, coliflor, brócoli, nabo, rábano, espinaca, espárrago, cebolla, ajo, berenjena, pimienta, apio, zanahoria, chayóte, calabaza, calabacín, pepino, manzana, pera, membrillo, melón, ciruela, cereza, durazno, nectarina, albaricoque, fresa, uvas, frambuesa, mora, pina, aguacate, papaya, mango, plátano, soya, tabaco, tomate, sorgo y caña de azúcar. En donde un alelo (s) para una halogenasa reigoespecífica y/o electrón transferasa de la invención se obtiene por selección directa en una planta de cultivo o cultivo de célula vegetal a partir de la cual una planta de cultivo puede ser generada, se mueve en variedades comerciales usando técnicas de reproducción tradicionales sin la necesidad de diseñar genéticamente el alelo y transformarlo en la planta.
EJEMPLOS Los siguientes ejemplos sirven como descripción adicional de la invención y métodos para practicar la invención. No están propuestos por ser limitantes, preferentemente proporcionan líneas guías en como la invención puede ser practicada.
Ejemplo 1: Reacciones de halogenación in vitro con PrnA A. Activación de PrnA con flavina reductasa de E. coli , P2, nitrato reductasa de Aspergill us, y citocromo b5 reductasa. El PrnA es purificado por cromatografía de intercambio de iones a partir de Pseudomonas fl uorescens BL915deltaORFl-4 con el plásmido pPEH14 (prnA) descrito en Kirner et al (Kirner, S. et al J Bacteriol 1998 Apr; 180 (7) : 1939-43) . La enzima purificada tiene actividad despreciable si adición del P2 preparado como se describe en el Antecedente de la invención anterior. La concentración de la proteina o la preparación es de 0.36 mg/ml. La mezcla de ensayo se prepara conteniendo amortiguador HEPES a pH 7.5 (50 mM) , glucosa-6-Fosfato (14.3 mM) , D-Trp (7 mM) , NaCl (7 mM) . La catalasa de Aspergill us niger es adquirida de Sigma Chemical Co. (13 U/ml), la dismutasa de superóxido de eritrocito bovino (posteriormente "SOD") es adquirido de Sigma Chemical Co. (5 U/ml) . deshidrogenasa glucosa-6-Fosfato de Leuconostoc mesenteroides adquirido de Sigma (5 U/ml), FaD (7 micromolar). Cualquier mezcla dependiente NADH o mezcla NADPH es usada como se indica abajo. Una mezcla de ensayo dependiente de NADH es preparada agregando 12 mg de NADH a 4.5 ml de la mezcla de ensayo descrita anteriormente. Una mezcla de ensayo dependiente de NADPH es preparada agregando 3 mg de NADPH a 1 ml de la mezcla de ensayo descrita anteriormente. Las reacciones 1-7 descritas abajo, son colocadas en tubos de polipropileno por triplicado. Después de mezclar el PrnA, la mezcla de ensayo indicada y la electrón transferasa, las muestras son sometidas a vórtices, después mezcladas por inversión a temperatura ambiente. Las reacciones son detenidas 20.5 horas después de la iniciación de las reacciones a ebullición por 2 minutos después, las muestras son preparadas por análisis de CLAR por ultrafiltración a través de 10 membranas Microcon (14000 x g por minuto) . El análisis de CIAR es por el Método Set PrnAl (descrito abajo), el volumen de inyección es de 50 microlitro, y los datos se colectan por los primeros 6 minutos . Los estándares se preparan mezclando 5 o 10 microlitros de 7-Cl-Trp (1 mM) con suficiente HEPES 50 mM, pH 7.5 para llevar el volumen final a 200 microlitros. El D-Trp es eluido a ~2 minutos y el 7-Cl-trp es eluido a 4.3 minutos, Ul^ ^l¿ i^J-í?e4£íí¿£d^ii*^4^^^¡fc&i^^?|¿Ji^tÍ^í^gÍji.i I como se indica por la elución del D-Trp auténtico y 7-Cl-Trp. La cantidad de 7-Cl-trp es determinada por comparación a una curva estándar. Las actividades reportadas son el incremento puro en 7-Cl-Trp después de la adición de la electrón transferasa.
Método Analítico PrnAl por CLAR. Determinación de 7-Cl-Trp Se usó un sistema de CLAR Waters Alliance con un detector de arreglo de fotoyodo. El CLAR Waters Alliance se equipó con una columna 4.6 x 50 mm envasada con C18-Sílice, tamaño de partícula de 3 micrómetros. Se usó un método de gradiente de elución designado aquí como PrnAl. Las velocidades de flujo son de 1 ml/mín completo y los datos de absorbancia se colectaron a partir de 210 hasta 400 nm con una resolución de 1.2 nm y una velocidad de muestreo de 1/s. El sistema como el pre-equilibrado con una mezcla 85:15 de agua:metanol. Después de la inyección de la muestra la columna se desarrolló con un gradiente de 6 minutos a partir de las condiciones iniciadoras a una mezcla de 40:60 agua:metanol . Después de 6.0 a 7.0 minutos la concentración de metanol se incrementó a 100% en un gradiente lineal. La columna se lavó por 1 minuto con 100% de metanol, después de equilibró nuevamente. El D-Trp eluyó a ~2 min y el 7-Cl-trp eluyó a 4.3 minutos, como se indica por la elución del D-Trp auténtico y 7-Cl-Trp. 1. Activación de PrnA por Flavina reductasa de E. coli La Flavina reductasa de E. coli (abreviada aquí después como Fre) , se purificó por precipitación de sulfato de amonio seguida por cromatografía hidrofóbica, es un método a base del protocolo de Fieschi et al (1995) J. Biol. Chem 270 30392-30400 la cual está aquí incorporado por referencia en su totalidad. La purificación de flavina reductasa después del procedimiento de Fieschi a través de la homogenización bacteriana y división de sulfato de amonio. En tal punto se precipita la actividad de flavina reductasa. Lo precipitado se colecta por centrifugación, se resuspende en 25 mM de Tris/Cl pH 7.5 0.5M KC1, glicerol al 10%. El método de Fontcabe et al J Biol Chem 1987 Sep 5; 262 (25) : 12325-31 el cual está aquí incorporado por referencia en su totalidad es después seguido para terminación. La concentración de proteína de la muestra Fre purificada colectada es de 21 microgramos/ml. Cada reacción contiene PrnA 20 microlitros, 160 microlitros de la mezcla de NADH descrita anteriormente y 20 microlitros de Fre. La formación del producto puro resultante fue de 21.46 +/- 1.02 nmol 7-Cl-Trp. 2. Activación de PrnA por P2 El P2 es una preparación de proteína de electrón transferasa a partir de Pseudomonas fl uorescens purificada por cromatografía de intercambio de iones y descrita anteriormente en el Antecedente de la invención. No tiene actividad PrnA. La concentración de proteína de la muestra P2 es de 4.8 mg/ml. Cada reacción contiene 20 microlitros de PrnA, 160 microlitros de mezcla de NADH y 20 microlitros de p2. La formación del producto neto resultante fue de 12.50 +/- 2.02 nmol 7-Cl-Trp. 3. Activación de PrnA por nitrato reductasa de espinaca El dominio FAD recombinante de nitrato reductasa de espinaca (aquí posteriormente "SNIR) (18.6 micromolar). Cada reacción contiene 20 microlitros de PrnA, 160 microlitros de mezcla NADH y 20 microlitros de SNIR. La formación del producto neto resultante fue de 0.048 +/- 0.73 nmol 7-Cl-Trp. 4. Activación de PrnA por nitrato reductasa de Aspergill us Nitrato reductasa de Aspergill us sp (10 U/ml) se adquirió de ICN. Cada reacción contiene 20 microlitros de PrnA, 160 microlitros de mezcla NADH y 20 microlitros de nitrato reductasa. La formación del producto neto resultante ,U Ü fue de 1.49 +/- 0.18 nmol 7-Cl-Trp. 5. Activación de PrnA por NADH-citocromo-b5-reductasa de rata El dominio soluble recombinante de citocromo b5 reductasa hepática de rata (Se obtiene 11.7 micromolar). Cada reacción contiene 20 microlitros de PrnA, 160 microlitros de mezcla NADH y 20 microlitros de citocromo b5 reductasa. La formación del producto neto fue de 0.31 +/- 0.11 nmol 7-Cl-Trp. 6. Activación de PrnA por diaforasa sulfihidrilo reductasa La diaforasa sulfhidrilo reductasa (200 U/ml) es adquirida de los Bioquímicos Estadounidenses. Cada reacción contiene 20 microlitros de PrnA, 160 microlitros de mezcla NADH y 20 microlitros de diaforosa. La formación del producto fue de 2.24 +/- 0.04 nmol 7-Cl-Trp. 7. Activación de PrnA por NADHP-cyt-P450 reductasa de conejo La NADPH-cyt-P450 reductasa de hígado de conejo (0.069 mg/ml) es adquirida de Sigma Chemical Co. Cada reacción contiene 20 microlitros de PrnA, 160 microlitros de mezcla NADPH y 20 microlitros de citocromo P450 reductasa. La formación del producto neto resultante fue de 3.35 +/- 0.23 nmol 7-Cl-Trp.
Ejemplo 2: Activación de PrnA por flavina reductasa de E. coli ; ferredoxina NADP reductasa de espinaca, ferredoxina NADP reductasa de espinaca + ferredoxina de espinaca; y reductasa NAD(P)H:FMN de PhotoJacterium fischeri Se usaron los siguientes componentes en los ejemplos 1-4 abajo: PrnA (descrito por el Ejemplo 1 anterior) a 0.36 mg/ml, Mezcla de Ensayo que contiene HEPES (100 mM) , glucosa-6-fosfato, sal disódica (50 mM) , D-Trp (5 mM) , NaCl (5 mM) . La catalasa de Aspergill us niger (39 U/ml) , superóxido de dismutasa de eritrocito bovino (15 U/ml), glucosa-6-fosfato deshidrogenasa de Leuconostoc mesenteroides (10 U/ml). NADH- (3 mg/ml) NADPH (3 mg/ml). Cada ensayo contiene la mezcla de ensayo, ya sea NADH (para muestras que contienen Fre y la reductasa NAD(P)H:FMN) o NADPH (para muestras que contienen FNR o FNR y Fd) , PrNA y la electrón transferasa indicada. Las muestras de control negativo incubaron en paralelo; este amortiguador se substituye por PrnA. Los estándares de cuantificación se prepararon diluyendo 0, 1, 2 ó 5 microlitros de 7-Cl-Trp estándar (1 mM) en 100 microlitros de Mezcla de Ensayo, 50 microlitos de NADH, 20 microlitros de PrnA y 50 microlitros t'* |J¿l»tjA'fafc.^^Mi^i-.-A i de amortiguador; los tubos se calentaron a 100 C previo a la adición de PrnA, después se calentaron unos 2 minutos adicionales. El procesamiento adicional está en paralelo con las reacciones enzimáticas. Todas las muestras de mezclaron por 2 horas a temperatura ambiente. Las reacciones se detuvieron y las muestras se procesaron como se describe anteriormente en el Ejemplo 1, incluyendo el uso del método analítico por CLAR PrnAl como se describe en el Ejemplo 1. 1. Actividad de PrnA con Fe: 100 microlitros de Mezcla de ensayo, 50 microlitros de NADH, 20 microlitros de PrnA y 50 microlitros de Fre (0.84 microgramos/ml) se mezclan como se describe anteriormente. El 7-Cl-Tpr puro producido fue de 8.44 nmol. 2. Actividad de PrnA con reductasa NADP de ferrodoxina: 100 microlitros de Mezcla de ensayo, 50 microlitros de NADH, 20 microlitros de PrnA y 50 microlitros de FRN (4.1 micromolar) se mezclan como se describe anteriormente. El 7-Cl-Tpr puro producido fue de 4.22 nmol. 3. Actividad de PrnA con reductasa NADP ferrodoxina y ferrodoxina: 100 microlitros de Mezcla de ensayo, 50 microlitros de NADH, 20 microlitros de PrnA y 50 microlitros de FNR (4.1 micromolar) y Fd (7 micromolar) se mezclan como se describe anteriormente. El 7-Cl-Tpr puro producido fue de 9.15 nmol. 4. Actividad de PrnA con NAD (P)H: FMN: reductasa de Photobacteri um fischeri : 100 microlitros de Mezcla de ensayo, 50 microlitros de NADH, 20 microlitros de PrnA y 50 microlitros de NAD(P)H:FMN reductasa adquirida de Roche (4 U/ml) se mezclan como se describe anteriormente. El 7-Cl-Tpr puro producido fue de 0.11 nmol.
Ejemplo 3: reacciones de halogenación ip vitro con PrnC Fre, ferrodoxina NADP reductasa, ferrodoxina y NADPH-FMN reductasa son sometidas a prueba por su habilidad para activar P. fl uorescens PrnC que se suprimió de la electrón transferasa endógena (P2) como se describe abajo. PrnC cataliza la cloración de monodecloroaminopirrolitrina (MDA) para proporcionar aminopirrolnitrina (APRN) . Los siguientes materiales se prepararon para uso en los ensayos descritos abajo. Amortiguador 100 mM Tris/Cl, 1 mM EDTA, pH 7.5. Monodecloroaminopirrolnitrina (MDA) 74.2 M es preparado por cultivo de Pseudomonas fluorescens que expresan PrnA y PrnB como se describe en (Kirner et al, 1998) el cual está aqui incorporado por referencia en su totalidad. La mezcla de ensayo comprende FAD (5 µM) y MDA (742 µM) en amortiguador. El NADH es disuelto en amortiguador a una ft 'f*• » ^fe¿-«.-A-«a-concentración de 6 mg/ml. o el N7ADPH es disuelto en amortiguador a una concentración de 6 mg/ml. El Extracto #1 es un extracto crudo en amortiguador que contiene PrnC y la electrón transferasa endógena P2 descrita anteriormente en el ejemplo 1. El PrnC es expresado en la bacteria P. fl uorescens (pPEH/prnC/134 ?prn) que tiene el operon prn cromosomal suprimido pero comprende una secuencia de ácido nucleico (SEC ID NO:4), que codifica el PrnC detrás de un promotor tac en plásmido pPEH-PrnC (Kirner et al, 1998) . En este sistema, el promotor tac resulta en la expresión constitutiva de PrnC. El Extracto #2, PrnC en Extracto #1 se purifica mezclando el Extracto #1 con una resina de intercambio aniónico después removiendo la resina por centrifugación, para suprimir el PrnC de la actividad de P. fl uorescens P2 usando 100 mM de amortiguador Tris/Cl. Los ensayos descritos abajo se corren como sigue: El Extracto #2 es mezclado con la electrón transferasa indicada, la mezcla de ensayo y ya sea NADH o NADPH como se indica. La actividad nativa de PrnC previo a la remoción de la actividad P2 se determina por una muestra paralela en la cual el extracto #1 se mezcla con la mezcla de ensayo y NADH. Todas las muestras son mezcladas por inversión durante la noche, después las reacciones son detenidas por la adición de * i f i i^í^'OÉ-S-10 microlitros de KOH (6 M) , seguido por extracción con acetato de etilo (1 ml) . 0.6 ml de la capa soluble orgánica se remueve a un tubo separado y el solvente se remueve por centrifugación a vacío. El residuo es redisuelto en 200 microlitros de 60/40 H20/CH3CN + 100 microlitros de CH3CN. Las muestras son filtradas a través de filtros de nylon de 0.2 µm para remover la materia particulada. Las muestras son analizadas por el método PrnC_Iso descrito abajo. El cromatograma de absorbancia de 220 nm es analizado e integrado. La actividad PrnC se expresa como 100 veces la velocidad del área del pico APRN a la suma de las áreas de pico de APRN y MDA. Asumiendo los coeficientes de extinción iguales a 220 nm, la velocidad calculada es equivalente al % de conversión puro de MDA a APRN por halogenación.
Método Analítico de CLAR PrnC Iso: El instrumento de C AR usado es el sistema de CLAR Waters Alliance con un detector de arreglo de fotoyodo y está equipado con una columna 4.6 x 50 mm envasada con Cld-Sílice, tamaño de partícula 3 micrómetros. El método CLAR es un método de elución ísocrática en el cual la velocidad de flujo es de 1.5 ml/min y el solvente es una relación 58:42 de agua: acetonitrilo. Los datos de absorbancia de colectaron de 210 hasta 400 nm con una resolución de 2.4 nm y una velocidad de muestreo de 5/s. El sistema es pre-equilibrado por un mínimo de 6 minutos previo a la inyección. El volumen de inyección es de 50 microlitros, el tiempo de colección de datos de 6 minutos seguido por unos 6 minutos adicionales de elución isocrática antes de la inyección de la siguiente muestra. El MDA es eluido a 2.16 minutos en este método y la aminopirrolnitrina (APRN) se eluye a 3.05 min. Las concentraciones de proteína se determinan por el método BCA usando los procedimientos estándares descritos por el vendedor (Pierce) . 1. La actividad PrnC con Fre de E. coli : 50 microlitros de Extracto #2 se mezclan con 20 microlitros de flavina reductasa de E. coli , (21 microgramo/ml), 100 microlitros de mezcla de ensayo, y 50 microlitros de NADH; el mezclado continua durante la noche seguido por el análisis del producto como se describe anteriormente. Actividad observada de 51.8% de conversión de MDA a APRN. 2. Actividad de PrnC con ferrodoxina NADP reductasa de espinaca: 50 microlitros del Extracto #2 se mezclan con 20 microlitros de ferredoxina:NADP reductasa de espinaca (20.7 micromolares), 100 microlitros de mezcla de ensayo, y 50 microlitros de NADH; el mezclado continua durante la noche seguido por el análisis del producto como se describe anteriormente. Actividad observada de 1.8% de conversión de MDA a APRN. 3. Actividad PrnC con ferrodoxina NADP reductasa de espinaca y ferrodoxina de espinaca: 50 microlitros del Extracto #2 se mezclan con 20 microlitros de ferrodoxina de espinaca :NADP reductasa de espinaca (20.7 micromolar) y ferredoxina de espinaca (Fd) (35 micromolar), 100 microlitros de mezcla de ensayo, y 50 microlitros de NADH; el mezclado continua durante la noche seguido por análisis del producto como se describe anteriormente. Actividad observada de 2.5% de conversión de MDA a APRN. 4. Actividad PrnC con NADPH FMN reductasa: 50 microlitros del Extracto #2 se mezclan con 20 microlitros de NAD(P)H:FMN reductasa (10 U/ml) de Photobacteri um fischeri , 100 microlitros de mezcla de ensayo y 50 microlitros de NADH; el mezclado continua durante la noche seguido por el análisis del producto como se describe anteriormente. Actividad observada de 4.0% de conversión de MDA a APRN. 5. Actividad nativa de PrnC previo a la remoción de la actividad P2 se determina por una muestra en paralelo en la cual el Extracto #1 (50 microlitros) es mezclado con la mezcla de ensayo (100 microlitros) y NADH (50 microlitros) ; el mezclado continua durante la noche seguido por el análisis del producto como se describe anteriormente. Actividad observada de 7.8% de conversión de MDA a APRN.
Ejemplo 4 : Halogenación en E. coli Clonación del ácido nucleico que codifica a la flavina reductasa de E. coli La secuencia de ácido nucleico que codifica la flavina reductasa de E. coli (posteriormente "fre" ) es PCR replicada de la cepa E. coli XL-1 Blue (Stratagene) usando los cebadores 5' GCGCGAATTCATGACAACCTTAAGCTGTAAAGTGACC (SEC ID NO: 32) y 3' GCGCCTGCAGTCAGATAAATGCAAACGCATCGCC (SEC ID NO: 33). La molécula de ácido nucleico es entonces clonada Topo (Invitrogen), transformada en XL-1 Blue de E. coli (Stratagene) y los transformantes son seleccionados plaqueados sobre medio sólido de caldo Luria (LB) suplementado con ampicilina. Varias colonias son seleccionadas y analizadas por el secuenciamiento de ADN para confirmar su identidad. De estos, una se encontró por poseer una molécula de ácido nucleico que comprende una secuencia idéntica de aquella de la fre reportada (Acceso Genbank 23486) . Una segunda posee una secuencia de ácido nucleico que comprende una mutación en el nucleótido 247 que resulta en una substitución de aminoácido cargado de Lys83 a Glu83 (mutante posteriormente referido como -freE8°) .
B. Sobre expresión inducible del mutante fre y freE83 La sobre expresión mducible del mutante fre y -freE83 está acompañada por la clonación del fre de tipo silvestre y el mutante de substitución -reE83 en los sitios EcoRl/Pstl de pKK223-3 (Pharmacia) bajo el control del promotor tac . Después las células de transformación que comprenden el fre-pKK223-3, íreE83-pKK223-3, y el vector vacío pKK223-3 se hacen crecer en 6 mL de LB + amp a 37C durante la noche, después diluido en 30 Ml LB+amp, 5 mM IPTG (Fisher) por 5 horas y cosechado por centrifugación. Las pelotillas bacterianas se suspendieron en 4.5 mL de HEPES 50 mM pH 7.5, 1 mM EDTA más 0.5 mL de 5 mg/mL lisozíma por 15 minutos a 25C, sometido a dos ciclos de cebado por congelamiento. Después de la sonicación por 1 minuto en hielo, lo homogenizado se centrifuga a 16K x g por 20 minutos. Los sobrenadantes son entonces diluidos serialmente con HEPES 50 mM pH 7.5, EDTA 1 mM para generar 8 muestras con concentración relativa que varía de 1 a 1/10000. Cada extracto bacteriano y extracto bacteriano diluido se sometió a ensayo para complementación de la actividad PrnA por adición de 20 microlitros de extracto a 180 microlitros de una solución compuesta de 7.2 microgramos PrnA (0.36 microgramos/microlitros) , 3.3 micromolar de FAD, NaCl 3.3 mM, D-Trp 1.67 mM, 0.67 mg/ml NADH y HEPES 50 mM, pH 7.5. Las reacciones se incuban a 30C por 2 horas. Las reacciones son detenidas por calentamiento a 100°C por 2 minutos seguido por centrifugación a 21000 x g por minuto. Las soluciones del sobrenadante son entonces filtradas a través de membranas de ultrafiltración centrífuga de corte de 10 kDa. Lo filtrado es entonces sometido a ensayo por CLAR de fase inversa para cuantificar la conversión de D-Trp a D-7-clorotriptofano usando el método analítico descrito solo en el Ejemplo 1 para PrnAl. La adición del extracto de E. coli que contiene el vector vacío ?KK223-3 resulta en 0.34 pmol de 7-Cl-Trp por minuto por microgramo de proteína en la Adición del extracto agregado del extracto de E. coli que contiene xreE83 - pKK223-3 resultó en 1.14 pmol 7-Cl-Trp por minuto por microgramo de proteína en el extracto agregado. La adición del extracto a partir de E. coli que contiene fre-pKK223-3 resultó en 301 pmol en 7-Cl-Trp por minuto por microgramo de proteína en el extracto agregado. Los análisis de flavina reductasa se llevaron a il? iÍd? *i*»¿???t?ia* jáu ^ cabo por adición de 10 microlitros de extracto bacteriano a 990 microlitros de Hepes 50 mM pH 75. que contiene 0.1 mg/ml de NADPH y 9.5 micromolares de riboflavina. Si la actividad es también alta para permitir la observación del primer 20% de la reacción, el extracto bacteriano es diluido 1/10 en amortiguador HEPES 50 mM después sometido a ensayo como anteriormente. La conversión de NADH a NADP es después monitoreada espectrofotométricamente a 340 nm. La adición de extracto a partir de E. coli que contiene el vector vacío pKK223-3 tiene una actividad de flavina reductasa de 0.055 nmol por minuto por microgramo de proteína en el extracto agregado. La adición del extracto de E. coli que contiene fre 83- pKK223-3 tiene una actividad flavina reductasa de 0.157 nmol por minuto por microgramo de proteína en el extracto agregado. La adición del extracto a partir de E. coli que contiene fre-pKK223-3 tiene una actividad flavina reductasa de 25.4 nmol por minuto por microgramo de proteína en el extracto agregado. Esto demuestra que los cambios en la actividad de la flavina reductasa son proporcionales a los cambios en la actividad de halogenación.
C. Co-expresión de fre y el operon prn en E. coli El operon de pirrolnitrina de Pseudomonas ^Hüj y^ge»^j|Mjj|| fl uorescens completo (5.8 X/N, citado en la Patente Estadounidense No. 5,723,759 el cual está aquí incorporado por referencia anterior) en pKK223-3 (Pharmacia) se transformó en E. coli . La secuencia -fre, que incluye el promotor Taq, es transferida de pKK223-3 en el marcador de tetraciclina de pACYC184 (NEB) , el cual contiene el origen compatible de replicación pl5A. Este plásmido es después co-transformado con 5.8X/N y presencia de ambos vectores se selecciona por ampicilina y cloranfenicol. La cepa hospedera que contiene fre solo son también generadas como controles negativos. Un cultivo de 60 mL de cada línea, se hizo crecer a 37 °C con sacudimiento a 200 rpm por 48 horas. De cada cultivo, 5 mL se extrajeron para el análisis de plásmido para confirmar la presencia de uno o ambos plásmidos. Una alícuota de 15 ml se usó para el análisis de la proteina y actividad. Los restantes 40 mL del cultivo se extraen 2 veces con 2 volúmenes de acetato de etilo. Las fracciones de acetato de etilo son concentradas a sequedad in vacuo y después llevadas hasta 50 microlitros de 6:4 H20/CH3CN y 60 microlitros de MeOH. Veinte microlitros de las soluciones resultantes son entonces analizados por el método de CLAR Prn_BCD para aminopirrolnitrina, y pirrolnitrina descrito abajo.
Método Analítico por CLAR Prn BCD. Determinación de MDA, APRN y PRN. El instrumento de CLAR es un sistema CLAR de Water Alliance con detector de arreglo de fotoyodo y está equipado con una columna 4.6 x 50 mm envasada con C18-Sílice, tamaño de partícula de 3 micromolares. El método CLAR es un método de elución por gradiente. Las velocidades de flujo son 1-2 ml/min completamente y los datos de absorbancia se colectaron de 210 a 400 nm con una resolución de 2.4 nm y una velocidad de muestreo de 5/s. El sistema es pre-equilibrado con una velocidad de agua: acetonitrilo 65:35. Siguiendo la inyección de muestreo, la columna es desarrollada en un gradiente lineal a partir de las condiciones iniciadoras a una velocidad de agua: acetonitrilo 40:60. La aminopirrolnitrina es eluida a 5.0 min y la pirrolnitrina a 6.6 minutos. Tanto la aminopirrolnitrina como la pirrolnitrina son medidas por integración de áreas de pico en cromatogramas medidas a longitudes de ondas de diagnóstico. Para aminopirrolnitrina se usan 300 nm de absorbancia. Para pirrolnitrina, se usan 250 nm de absorbancia. Los resultados muestran que la acumulación de aminopirrolnitrina se incrementa mayor de 10 veces, y la acumulación de pirrolnitrina se incrementó mayor de 4 veces en células de E. coli que co-expresan plásmidos que contienen -fre y el operon de pirrolnitrina comparado con las células que expresan solamente el operon pirrolnitrina.
Ejemplo 5: Halogenación por PrnA expresado en plantas transgénicas después purificadas y sometidas a ensayos in vitro El ecotipo Columbia de Arabidopsis thaliana , es transformado (por el método de transformación mediado por Agrobacterium) con las cuatro moléculas de ácido nucleico del operon de pirrolnitrina, que codifica PrnA, PrnB, PrnC y PrnD, cada uno detrás del promotor de ubiquitina como se describe abajo en el Ejemplo 6. Las moléculas de ácido nucleico de pirrolnitrina individuales son PCR replicadas con los sitios de restricción apropiados a partir de pCIB169 (Patente Estadounidense No. 5,723,759), el cual contiene un clon cósmido de P. fluorescens BL915, número de acceso a GeneBank es U74493. Las moléculas de ácido nucleico son subclonadas y secuenciadas. El promotor ubiquitina3 y el primer intrón (J: Callis et al (1990). Journal of Biological Chemistry 265:12486-12493. y S.
R. Norris et al (1993) Plant Molecular Biology. 21:895-906), son replicados por PCR a partir del genoma de Arabidopsis por [^ .-U j-. -1- -a----^..^^^^- ^.^^^-^é^^n i g^^ ?rrl t ? jrf~ &* ¡ -üij a *®?a~y contener un sitio 5' Kpnl y 3'BamHI. El promotor ubiquitina, terminador nos (Depicker et al (19829 Journal of Molecular and Applied Genetics 1:561-573) y cada molécula de ácido nucleico de pirrolnitrina individual (véase Patentes Estadounidenses Nos. 5,723,759 y 5,955,348 cada una de las cuales está aquí incorporada por referencia en su totalidad) , son clonadas en un vector pSportl modificado. Un triplete de nucleótido -3ACC consenso Kozak es agregado a cada uno de PrnA, B y D justo al 5' del ATG inicial. La molécula de ácido nucleico PrnC no es modificada. El codón GTC inicial en PrnB es cambiado a un codón ATG. Estas modificaciones resultan en la serie de vector pPE7826, 27, 28 y 29 (Prn A, B, C, D respectivamente) . Todas las otras secuencias son consenso a la secuencia de tipo silvestre. El PrnAC doblete es construido insertando el fragmento Kpnl de pCIB7826 en el sitio Kpnl de pCIB7828 (PrnC) produciendo pCIB7830. El doblete PrnBD es producido insertando el fragmento Kpnl de PCIB787 (PrnB) en el sitio Kpnl de pCIB7829 (PrnD) produciendo pCIB7831. Los cuatro operones de la molécula de ácido nucleico se crean insertando el fragmento Notl de pCIB7830 en el fragmento Notl de pCIB7831 produciendo PCIB7832. El fragmento Xbal de pCIB7832 se inserta en el vector binario pCIB200 produciendo el vector de í í ! i transformación pCIB7819. El vector final es sometido a electroporación en agrobacterium y usado para la transformación de Arabidopsis. Arabidopsis thaliana es transformada por el método de N. Bechtold et al (N. Bechtold et al (1993) . C. R. Acad. Sci. Paris, Life Sciences 316:1194-1199). Dos líneas transformadas (3 y 12) y una línea de control no transformada se hacen crecer y las hojas se cosechan (lg) . Las hojas son congeladas en N2 líquido, en polvo en un mortero y extraídas con 6 ml de amortiguador LS (HEPES 50 mM, pH 7.5, NaCl 5 mM) . Después de la centrifugación a 5000 x g por 15 minutos para desechos de pelotillas, el sobrenadante es filtrado suavemente a través de un cristal hilado para remover las partículas residuales. El PrnA es inmunopurificado mezclando el extracto (3 ml) con una matriz de afinidad. La matriz de afinidad se prepara mezclando por 30 minutos, a temperatura ambiente, 100 microlitros de anticabra-IgG-agarosa de conejo (adquirida de Sigma) con 50 microlitros de suero anti-PrnA de cabra. Después las perlillas de agarosa se lavan tres veces con 1 ml de amortiguador LS. Después de mezclar los 3 ml de la muestra con la matriz de afinidad, el material no absorbido es removido de las perlillas por lavado con amortiguador LS. Una .¿i-?-t- Í&-4 • ^mm muestra de control positivo es preparada mezclando 5 microlitros de PrnA (0.36 microgramos/microlitros) purificado de Pseudomonas fl uorescens como se describe en el Ejemplo 1 con 3 ml de LS, después tratando en paralelo con las muestras del extracto de planta. 200 microlitros de amortiguador de ensayo (HEPES 50 M pH 7.5, D-Trp 5 mM, 5 mM NaCl 5 µM FAD, 5 mM glucosa-e-fosfato + 2 mg/ml NADH + 6.25 U/ml glucosa-6-fosfato deshidrogenasa + 44 U/ml catalasa + 30 U/ml SOD) y 20 microlitros de Fre (21 microgramo/ml) purificado de E. coli como se describe en el ejemplo 1 se agregan a las perlillas de agarosa que contienen PrnA inmunopurificado, excepto por una muestra de cada linea de 3 y 12. Las muestras son entonces mezcladas durante la noche por inversión, filtradas a través de filtros Microcon-10, después el producto se somete a ensayo por el método CLAR PrnAl (descrito anteriormente en el Ejemplo 1) . El volumen de inyección de la muestra fue de 50 microlitros. Los siguientes niveles de 7-Cl-Trp se encontraron: control positivo (PrnA exógeno agregado al extracto de planta no transformado) 185 pmol, Línea 3 + Fre (dos muestras separadas) 83 pmol y 113 pmol, Línea 3 sin Fre 0 pmol, Línea 12 con Fre (dos muestras separadas) 120 pmol y 64 pmol, Línea 12 sin Fre 0 pmol, _ÉÉi ül control no transformado 0 pmol. Estos datos demuestran que las plantas transformadas expresan PrnA en una forma activa cuya actividad fue dependiente de la adición de Fre.
Ejemplo 6: Halogenación en plantas transgénicas A. Producción citoplásmica de compuestos halogenados en plantas transgénicas por transformación de ácido nucleico que codifica la flavina reductasa de E. coli en plantas que comprenden ácido nucleico que codifica a PrnA, PrnB, PrnC y PrnD. La secuencia de ácido nucleico de la SEC ID NO: 6, que codifica la flavina reductasa a partir de E. colí, es clonada en el vector pN0V019, para colocar la molécula de ácido nucleico bajo el control del promotor ubiquitma 10 de Arabidopsis (UB10) (J. Callis et al (1990) . Journal of Biological Chemistry 265:12486-12493, y S. R. Norris et al (1993) Plant Molecular Biology, 21:895-906), y terminado con el terminador de nopalina sintasa de Agrobacterium (Depicker et al (1982) Journal of Molecular and Applied Genetics 1:561-573) . El sistema vector binario que consiste de pNOV507 (KanR), 508 (ChlorR) y 509, (AmpR) se completa. Los tres ^-^* ^ vectores usados para construir el operon de pirrolnitrina con la molécula de ácido nucleico fre y un marcador seleccionable resistente al herbicida son como siguen. Nov507 (Kan) es el vector binario con el polienlazador entre los límites derecho e izquierdo reemplazados con una selección de sitios de restricción únicos que no se encuentran en cualquiera de los promotores, terminadores, pirrolnitrina, fre o las moléculas de ácido nucleico del marcador seleccionable. Los otros dos vectores pNOV508 (ChlorR) y pNOV509 (AmpR) , son vectores los cuales contienen una porción del polienlazador pNOV507 con sitios de restricción adicionales agregados para clonar los casetes de moléculas de ácido nucleico separadas para el operon de pirrolnitrina. Estos dos vectores son vectores de construcción o ensambles. El cásete fre junto con el cásete del marcador seleccionable UB3 de pNOVll son ligados en conjunto en pNOV509. Este cásete doble es después transferido en el vector binario, pNOV507, proporcionando el vector final pNOV510. Este vector es sometido a electroporación en Agrobacteri um. Las líneas de Arabidopsi s thaliana que son transformadas con moléculas de ácido nucleico PrnA, PrnB, PrnC y PrnD como se describe en el Ejemplo 5, son transformadas por el método de N. Bechtold et al (N. Bechtold et al (1993). C. R. Acad. Sci. Paris, Life Sciences 316:1194- m^^^¡ iü&^^y 1199) . Todas las moléculas de ácido nucleico de la trayectoria de pirrolnitrina en plantas y varias construcciones son accionadas por el promotor de ubiquitina3 de Arabidopsis (UB3) (J. Callis et al (1990) Journal of Biological Chemistry 265:12486-12493. y S. R. Norros et al (1993) Plant Molecular Biology. 21:895-906), y terminado con el terminador nos a partir de Agrobacteri um. Las líneas homocigotas de Arabidopsis que alojan prnA, prnB, prnC y prnD, y el tipo silvestre Columbia, son transformadas con pNOV510 por infiltración de Agrobacteri um por el método de N- Bechtold et al como se describe anteriormente. Las semillas son colectadas, secadas abajo y plantadas en el suelo. Las plantas transformadas son identificadas atomizando las plántulas con el agente selectivo a 0.025% tres veces durante ocho días. Las plantas son después confirmadas por presencia y nivel de pirrolnitrina por CLAR o espectrometría de masas- cromatografía de gas. Los extractos de plantas pueden también o alternativamente, ser confirmados por actividad prnA y/o prnC como se describe anteriormente.
B. Producción citoplásmica de compuestos halogenados en plantas transgénicas por co-transformación de flavina reductasa de E. coli y el operon de pirrolnitpna. Las secuencias de ácido nucleico que codifican PrnA, PrnB, PrnC y PrnD de la trayectoria de pirrolnitrina expuestas en la Patente Estadounidense No. 5,723,759 e incorporadas por referencia anterior y la SEC ID NO: 7 que codifica la flavina reductasa de E. coli son introducidas en plantas en un constructo de ADN-t único. La expresión de cada una de las moléculas de ácido nucleico biosintéticas de pirrolnitrina es accionada por el promotor UB3, mientras la SEC ID NO: 7 de fre es accionada por UB10. Todas las cinco moléculas de ácido nucleico han sido ya sea conformadas o alteradas para conformarse estrechamente a una secuencia de iniciación traduccional Kozak por posesión de A en -3. Todas las moléculas de ácido nucleico son terminadas por el terminador nos. En una modalidad preferida, el vector final es construido ensamblando los genes promotores UB3-biosintéticos de pirrolnitrina de objetivos citosólicos y el cásete UBIO-fre en un vector binario que comprende los siguientes: límite derecho UB3-prnA-nos-UB3-prnC-nos-UB3-prnB-nos-UB3-prnD-nos-UB10-fre-nos-UB3-marcador seleccionable-nos-Límite izquierdo. Este vector se nombra pNOV523 (SEC ID NO:34). En otra modalidad, el operon de pirrolnitrina de objetivo citosólico es creado por el enlace del fragmento de doblete Notl A/B de pCIB7830 en el vector de doblete C/D pCIB7831. El operón es transferido en pNOV507 como un cásete de Xbal. El doblete Notl A/B de pCIB10253 está ligado en el vector de doblete C/D pCIB10254. Esta construcción también es transferida a pNOV507 como un cásete de Xbal . El vector final contiene lo siguiente: Límite derecho-UB3-prnA-nos-UB3-prnB-nos-UB3-prnC-nos-UB3-prnD-nos-UB10-fre-nos-UB3-marcados seleccionable-nos-Límite izquierdo. Este vector es entonces electroporado en Agrobacteri um y usado para transformar Arabidopsis (Columbia) , por infiltración de Agrobacteri um (N. Bechtold et al (1993). C. R. Acad. Sci. Paris, Life Sciences 316:1194-1199.) Las semillas son colectadas, secadas y plantadas en la tierra. Las plantas transformadas se identifican por aspersión de las plántulas con el agente selectivo a 0.025% tres veces por ocho días. Las plantas se confirmaron entonces por la presencia y nivel de pirrolnitrina por CLAR o cromatografía de gas-espectrometría de masa.
S-^^- l-^-----* C. Producción de compuestos halogenados en plástidos de plantas transgénicas. Los constructos de ácido nucleico que codifican prnA y B son tratados por ingeniería genética para expresar péptidos de tránsito de cloroplastos (Wong, E.Y. et al (1992) Plant Molecular Biology vol. 20:81-93.), y colocados conjuntamente en un vector que permite la selección en kanamicina. Los protocolos de transformación son como se detalla en los ejemplos previos (N. Bechtold et al (1993) . C. R. Acad. Sci. Paris, Life Sciences 316:1194-1199).
Construcción de los vectores de moléculas de ácido nucleico de pirrolnitrina de objetivo plástido. Las moléculas de ácido nucleico de trayectoria de pirrolnitrina, individuales, son PCR replicadas de PCIB10230, 31, 32, 33 (Prn A, B, C, D respectivamente), para contener un sitio de restricción 5'Nhel y 3'BamHI. Las moléculas de ácido nucleico son Topo clonado en pCR2.1 (Invitrogen, US Office Carlsbad, CA 92008, número de catálogo K2030-01) para la confirmación de secuencia. La secuencia de tránsito del péptido de subunidad pequeña RuBPcasa, es PCR replicada de la librería de ADNc de Arabidopsis en pFL61 (Wong et al., 1992, Plant Mol Biol 20: 81-93). Esta secuencia de ácido nucleico k éáü? t+?t *****.^.. ^ jjH es ligada en el extremo 5' de cada molécula de ácido nucleico de pirrolnitrina en pPEH31, 30, 29, y 28 (Prn A, B, C, D respectivamente) . Este conjunto de vectores de pPEH contienen el cásete de UB3-intron-nos. El péptido maduro adicional se sintetiza como oligos complementarios, se templa y se liga en la porción 5' de la construcción de la molécula de ácido nucleico de pirrolnitrina del péptido de tránsito. Esto produce los vectores de la molécula del ácido nucleico de pirrolnitrina de objetivo plástido pCIB10249, 50, 51 y 52 (Prn A, B, C, D, respectivamente) . El pCIB10253 del doblete PrnAB se creó ligando PrnA que contiene el cásete de la molécula de ácido nucleico de Kpnl de pCIB10249 en pCibl0250. El doblete PrnCD, pCIB10254 se creó ligando el PrnC que contiene el cásete de la molécula de ácido nucleico Xhol a partir de pCIB10251 en pCIB10252. Cada doblete se transfirió como un cásete Xbal en el vector Binario pCIB200 (KanR) . El esquema del marcador seleccionable para vectores de objetivo plástido fue: para el vector fre-Límite Derecho-UBlO-clp-fre-nos-UB3-marcador seleccionable-nos-Lí ite izquierdo, para los vectores PrnA/B Límite derecho-UB3-prnA-nos-UB3-prnB-nos-UB3-marcador seleccionable-nos-Límite izquierdo y para los vectores PrnC/D Límite derecho-UB3-prnC-nos-UB3-prnD-nas-UB3-marcador seleccionable-nos-Izquierda.
El vector prnAB-fre de objetivo plástido es entonces electroporado en Agrobacteri um y se usa para transformar Arabadopsis col umbia vía el método de N-Bechtold et al., como se describió anteriormente. Las semillas son colectadas, secadas y plantadas en la tierra. Las plantas transformadas son identificadas por aspersión de las plántulas con el agente selectivo y automáticamente adquieren la característica de homocigosidad. De manera similar, el vector de prnCD/marcador seleccionable de objetivo plástido se introduce en Arabadopsis como se describió anteriormente y los transformadores resultantes automáticamente adquieren características de homocigosidad. Las plantas homocigotas transformadas que comprenden el constructo prnAB-fre/marcador seleccionable de objetivo plástido, son cruzadas entonces con las plantas de prnCD/marcador seleccionable de objetivo plástido, homocigotos. En otra modalidad, el cásete de prnCD de objetivo plástido se transfiere en el vector binario que comprende el cásete de fre de objetivo UBIO-plástido. Este vector es conocido como pNOV524 (SEC ID NO:35). El vector pNOV524 es entonces electroporado en Agrobacteri um y se usa para transformar Arabidopsis col umbia vía el método de N. .^^^ u^^ft^f^n^ft^^tt^ tA Bechtold et al, como se describió anteriormente. Tanto la Arabidopsis de tipo silvestre como la Arabidopsis previamente transformada con pCIB10253 (que comprende prnA/B de objetivo plástido) son transformadas con pNOV524. Las semillas son colectadas, secadas y plantadas en tierra. Las plantas transformadas se identifican rociando las plántulas con el agente selectivo y automáticamente adquieren la característica de homocigosidad. La progenie resultante se somete al agente selectivo apropiado. Las plantas resistentes a este régimen de agente selectivo poseen fre y prnA, B, C, y D en el estado semicigoto. Un experto en la técnica reconocerá las diversas posibles variaciones en este enfoque. En todos los casos, la expresión de pirrolnitrina es cuantificada por CLAR o cromatografía de gas.
Ejemplo 7: Halogenación por PrnC expresado en hojas de plantas transgénicas suministradas con MDA Los análisis de manchado Western de líneas de Columbia transformadas con el constructo pNOV524 (que comprende el prnC de objetivo plástido, prnD y fre) se realizan seguido de la selección basta. Adicionalmente, los análisis de manchado western de líneas de Arabidopsis ÍAÍÁ.¿¿l±?¿* *.—>M?. i--A" tj&g transformadas con pCIB10253 (que comprende prnA y prnB de objetivo de plástido) y posteriormente transformadas con pNOV 524, se realizan seguido de la selección basta. Las hojas solas de cada una de las líneas son homogenizadas en IX amortiguador de muestra de proteína, se hierve y se separa por 10% de SDS-PAGE. Posteriormente, la membrana se sondea para la presencia de proteínas prnC y prnD con anticuerpos elevados contra prnC y prnD, respectivamente. Las líneas de arabidopsis positivas para la expresión de prnC y prnD son idénticas. Los mismos extractos de proteína se vuelven a examinar para la presencia de la proteína flavina reductasa (fre) usando un gel de gradiente a 10-20% y posteriormente sondeando la membrana con anticuerpos elevados contra fre. Se identifican las lineas positivas para la expresión de fre. Las hojas son tomadas de una línea positiva de Arabidopsis para la expresión de prnC de objetivo plástido, prnD y fre y adicionalmente de una línea de Arabidopsis que es negativa para prnC y prnD por manchado western. Las hojas son infiltradas a vacío con MDA mientras que se sumergen en un MES de 5 mM (pH 5.7); 400 mM de amortiguador de Mannitol, y se deja durante la noche a temperatura ambiente en la oscuridad. Posteriormente, el amortiguador se extrae con acetato de etilo, se concentra a sequedad y se analiza en CLAR (como se describe en el Ejemplo 4 precedente) .
Las hojas de las plantas positivas para prnC, prnD y fre convierten MDA a APRN (aproximadamente 5%) . La conversión se detecta dentro de 3 horas de periodo de incubación. Además, aproximadamente 30% de la APRN se convierte a pirrolnitrina. Además, las hojas, de control negativo, de las plantas que no expresan prnC o prnD, no muestran conversión de MDA a ya sea APRN o pirrolnitrina. Las publicaciones de referencia, citadas anteriormente, se incorporan aquí como referencia en su totalidad. -y~ ISTADO DE SECUENCIA <110> Novartis AG <120> Composiciones y Métodos para Reacciones de Halogenación <130> Caso S-31082A <140> <141> <150> US 60/228801 <151> 1999-12-15 <150> US 60/219343 <151> 2000-01-03 <160> 35 <170> Patentln Ver. 2.0 <210> 1 <211> 16 <212> PRT <213> Secuencia Artificial <220> <223> Descripción de Secuencia Artificial: amino ácido dominio consenso <400> 1 Xaa Ala Ala Trp Xaa Ala Ala Trp Xaa Ala Ala lie Pro Xaa Ala Ala 1 5 10 15 <210> 2 <211> 1617 <212> ADN <213> Pseudomonas fluorescens <220> <221> CDS <222> (1) .. (1617) <400> 2 atg aac aag ccg atc aag aat atc gtc atc gtg ggc ggc ggt act gcg 48 Met Asn Lys Pro He Lys Asn He Val He Val Gly Gly Gly Thr Ala 1 5 10 15 ggc tgg atg gcc gcc tcg tac etc gtc cgg gcc etc caá cag cag gcg 96 Gly Trp Met Ala Ala Ser Tyr Leu Val Arg Ala Leu Gln Gln Gln Ala 20 25 30 aac att acg etc atc gaa tet gcg gcg atc cct cgg atc ggc gtg ggc 144 Asn He Thr Leu He Glu Ser Ala Ala He Pro Arg He Gly Val Gly 35 40 45 gaa gcg acc atc cea agt ttg cag aag gtg ttc ttc gat ttc etc ggg 192 Glu Ala Thr He Pro Ser Leu Gln Lys Val Phe Phe Asp Phe Leu Gly 50 55 60 ata ccg gag cgg gaa tgg atg ccc caá gtg aac ggc gcg ttc aag gcc 240 He Pro Glu Arg Glu Trp Met Pro Gln Val Asn Gly Ala Phe Lys Ala 65 70 75 80 gcg atc aag ttc gtg aat tgg aga aag tet ccc gac ccc tcg cgc gac 28Í Ala He Lys Phe Val Asn Trp Arg Lys Ser Pro Asp Pro Ser Arg Asp 85 90 95 .--.- j^-^j-fc»------*-----*-,^^ gat cae ttc tac cat ttg ttc ggc aac gtg ccg aac tgc gac ggc gtg 336 Asp His Phe Tyr His Leu Phe Gly Asn Val Pro Asn Cys Asp Gly Val 100 105 110 ccg ctt acc cae tac tgg ctg cgc aag cgc gaa cag ggc ttc cag cag 384 Pro Leu Thr His Tyr Trp Leu Arg Lys Arg Glu Gln Gly Phe Gln Gln 115 120 125 ccg atg gag tac gcg tgc tac ccg cag ccc ggg gca etc gac ggc aag 432 Pro Met Glu Tyr Ala Cys Tyr Pro Gln Pro Gly Ala Leu Asp Gly Lys 130 135 140 ctg gca ccg tgc ctg tec gac ggc acc cgc cag atg tec cae gcg tgg 480 Leu Ala Pro Cys Leu Ser Asp Gly Thr Arg Gln Met Ser His Ala Trp 145 150 155 160 cae ttc gac gcg cae ctg gtg gcc gac ttc ttg aag cgc tgg gcc gtc 528 His Phe Asp Ala His Leu Val Ala Asp Phe Leu Lys Arg Trp Ala Val 165 170 175 gag cgc ggg gtg aac cgc gtg gtc gat gag gtg gtg gac gtt cgc ctg 576 Glu Arg Gly Val Asn Arg Val Val Asp Glu Val Val Asp Val Arg Leu 180 185 190 aac aac cgc ggc tac atc tec aac ctg etc acc aag gag ggg cgg acg 624 Asn Asn Arg Gly Tyr He Ser Asn Leu Leu Thr Lys Glu Gly Arg Thr 195 200 205 ctg gag gcg gac ctg ttc atc gac tgc tec ggc atg cgg ggg etc ctg 672 Leu Glu Ala Asp Leu Phe He Asp Cys Ser Gly Met Arg Gly Leu Leu 210 215 220 atc aat cag gcg ctg aag gaa ccc ttc atc gac atg tec gac tac ctg 720 He Asn Gln Ala Leu Lys Glu Pro Phe He Asp Met Ser Asp Tyr Leu 225 230 235 240 ctg tgc gac age gcg gtc gcc age gcc gtg ccc aac gac gac gcg cgc 768 Leu Cys Asp Ser Ala Val Ala Ser Ala Val Pro Asn Asp Asp Ala Arg 245 250 255 gat ggg gtc gag ccg tac acc tec tcg atc gcc atg aac tcg gga tgg 816 Asp Gly Val Glu Pro Tyr Thr Ser Ser He Ala Met Asn Ser Gly Trp 260 265 270 acc tgg aag att ccg atg ctg ggc cgg ttc ggc age ggc tac gtc ttc 864 Thr Trp Lys He Pro Met Leu Gly Arg Phe Gly Ser Gly Tyr Val Phe 275 280 285 tcg age cat ttc acc tcg cgc gac cag gcc acc gcc gac ttc etc aaa 912 Ser Ser His Phe Thr Ser Arg Asp Gln Ala Thr Ala Asp Phe Leu Lys 290 295 300 etc tgg ggc etc tcg gac aat cag ccg etc aac cag atc aag ttc cgg 960 Leu Trp Gly Leu Ser Asp Asn Gln Pro Leu Asn Gln He Lys Phe Arg 305 310 315 320 gtc ggg cgc aac aag cgg gcg tgg gtc aac aac tgc gtc tcg atc ggg 100Í Val Gly Arg Asn Lys Arg Ala Trp Val Asn Asn Cys Val Ser He Gly 325 330 335 ^----^i.--»»-------»...- -iA- >-?.-..- --fe-, li í . ctg tcg tcg tgc ttt ctg gag ccc ctg gaa tcg acg ggg atc tac ttc 1056 Leu Ser Ser Cys Phe Leu Glu Pro Leu Glu Ser Thr Gly He Tyr Phe 340 345 350 atc tac gcg gcg ctt tac cag etc gtg aag cae ttc ccc gac acc tcg 1104 He Tyr Ala Ala Leu Tyr Gln Leu Val Lys His Phe Pro Asp Thr Ser 355 360 365 ttc gac ccg cgg ctg age gac gct ttc aac gcc gag atc gtc cae atg 1152 Phe Asp Pro Arg Leu Ser Asp Ala Phe Asn Ala Glu He Val His Met 370 375 380 ttc gac gac tgc cgg gat ttc gtc caá gcg cae tat ttc acc acg tcg 1200 Phe Asp Asp Cys Arg Asp Phe Val Gln Ala His Tyr Phe Thr Thr Ser 385 390 395 400 cgc gat gac acg ccg ttc tgg etc gcg aac cgg cae gac ctg cgg etc 1248 Arg Asp Asp Thr Pro Phe Trp Leu Ala Asn Arg His Asp Leu Arg Leu 405 410 415 tcg gac gcc atc aaa gag aag gtt cag cgc tac aag gcg ggg ctg ccg 1296 Ser Asp Ala He Lys Glu Lys Val Gln Arg Tyr Lys Ala Gly Leu Pro 420 425 430 ctg acc acc acg tcg ttc gac gat tec acg tac tac gag acc ttc gac 1344 Leu Thr Thr Thr Ser Phe Asp Asp Ser Thr Tyr Tyr Glu Thr Phe Asp 435 440 445 tac gaa ttc aag aat ttc tgg ttg aac ggc aac tac tac tgc atc ttt 1392 *A~-^--.-A,--u--M^-(aMJaAifc Tyr Glu Phe Lys Asn Phe Trp Leu Asn Gly Asn Tyr Tyr Cys He Phe 450 455 460 gcc ggc ttg ggc atg ctg ccc gac cgg tcg ctg ccg ctg ttg cag cae 1440 Ala Gly Leu Gly Met Leu Pro Asp Arg Ser Leu Pro Leu Leu Gln His 465 470 475 480 cga ccg gag tcg atc gag aaa gcc gag gcg atg ttc gcc age atc cgg 14. Arg Pro Glu Ser He Glu Lys Ala Glu Ala Met Phe Ala Ser He Arg 485 490 495 cgc gag gcc gag cgt ctg cgc acc age ctg ccg acá aac tac gac tac 1536 Arg Glu Ala Glu Arg Leu Arg Thr Ser Leu Pro Thr Asn Tyr Asp Tyr 500 505 510 ctg cgg tcg ctg cgt gac ggc gac gcg ggg ctg tcg cgc ggc cag cgt 1584 Leu Arg Ser Leu Arg Asp Gly Asp Ala Gly Leu Ser Arg Gly Gln Arg 515 520 525 999 cc aa °tc gca gcg cag gaa age ctg tag 1617 Gly Pro Lys Leu Ala Ala Gln Glu Ser Leu 530 535 <210> 3 <211> 538 <212> PRT <213> Pseudomonas fluorescens <400> 3 Met Asn Lys Pro He Lys Asn He Val He Val Gly Gly Gly Thr Ala 1 5 10 15 Gly Trp Met Ala Ala Ser Tyr Leu Val Arg Ala Leu Gln Gln Gln Ala 20 25 30 Asn He Thr Leu He Glu Ser Ala Ala He Pro Arg He Gly Val Gly 35 40 45 Glu Ala Thr He Pro Ser Leu Gln Lys Val Phe Phe Asp Phe Leu Gly 50 55 60 He Pro Glu Arg Glu Trp Met Pro Gln Val Asn Gly Ala Phe Lys Ala 65 70 75 80 Ala He Lys Phe Val Asn Trp Arg Lys Ser Pro Asp Pro Ser Arg Asp 85 90 95 Asp His Phe Tyr His Leu Phe Gly Asn Val Pro Asn Cys Asp Gly Val 100 105 110 Pro Leu Thr His Tyr Trp Leu Arg Lys Arg Glu Gln Gly Phe Gln Gln 115 120 125 Pro Met Glu Tyr Ala Cys Tyr Pro Gln Pro Gly Ala Leu Asp Gly Lys 130 135 140 Leu Ala Pro Cys Leu Ser Asp Gly Thr Arg Gln Met Ser His Ala Trp 145 150 155 160 His Phe Asp Ala His Leu Val Ala Asp Phe Leu Lys Arg Trp Ala Val 165 170 175 Glu Arg Gly Val Asn Arg Val Val Asp Glu Val Val Asp Val Arg Leu 180 185 190 5 Asn Asn Arg Gly Tyr He Ser Asn Leu Leu Thr Lys Glu Gly Arg Thr 195 200 205 Leu Glu Ala Asp Leu Phe He Asp Cys Ser Gly Met Arg Gly Leu Leu 210 215 220 10 He Asn Gln Ala Leu Lys Glu Pro Phe He Asp Met Ser Asp Tyr Leu 225 230 235 240 Leu Cys Asp Ser Ala Val Ala Ser Ala Val Pro Asn Asp Asp Ala Arg 245 250 255 Asp Gly Val Glu Pro Tyr Thr Ser Ser He Ala Met Asn Ser Gly Trp 15 260 265 270 Thr Trp Lys He Pro Met Leu Gly Arg Phe Gly Ser Gly Tyr Val Phe 275 280 285 Ser Ser His Phe Thr Ser Arg Asp Gln Ala Thr Ala Asp Phe Leu Lys 20 290 295 300 Leu Trp Gly Leu Ser Asp Asn Gln Pro Leu Asn Gln He Lys Phe Arg 305 310 315 320 -,,-s-s . * a . y^?< Val Gly Arg Asn Lys Arg Ala Trp Val Asn Asn Cys Val Ser He Gly 325 330 335 Leu Ser Ser Cys Phe Leu Glu Pro Leu Glu Ser Thr Gly He Tyr Phe 340 345 350 5 He Tyr Ala Ala Leu Tyr Gln Leu Val Lys His Phe Pro Asp Thr Ser 355 360 365 Phe Asp Pro Arg Leu Ser Asp Ala Phe Asn Ala Glu He Val His Met 370 375 380 ]_Q Phe Asp Asp Cys Arg Asp Phe Val Gln Ala His Tyr Phe Thr Thr Ser 385 390 395 400 Arg Asp Asp Thr Pro Phe Trp Leu Ala Asn Arg His Asp Leu Arg Leu 405 410 415 Ser Asp Ala He Lys Glu Lys Val Gln Arg Tyr Lys Ala Gly Leu Pro 15 420 425 430 Leu Thr Thr Thr Ser Phe Asp Asp Ser Thr Tyr Tyr Glu Thr Phe Asp 435 440 445 Tyr Glu Phe Lys Asn Phe Trp Leu Asn Gly Asn Tyr Tyr Cys He Phe 20 450 455 460 Ala Gly Leu Gly Met Leu Pro Asp Arg Ser Leu Pro Leu Leu Gln His 465 470 475 480 ^^-¿^-^.¿^^^^^¿^^^.-,^-^^^1^^^^-^-^^ ^?tJ?k?^jt^?t. -A-t-AA.
Arg Pro Glu Ser He Glu Lys Ala Glu Ala Met Phe Ala Ser He Arg 485 490 495 Arg Glu Ala Glu Arg Leu Arg Thr Ser Leu Pro Thr Asn Tyr Asp Tyr 500 505 510 Leu Arg Ser Leu Arg Asp Gly Asp Ala Gly Leu Ser Arg Gly Gln Arg 515 520 525 Gly Pro Lys Leu Ala Ala Gln Glu Ser Leu 530 535 <210> 4 <211> 1704 <212> ADN <213> Pseudomonas fluorescens <220> <221> CDS <222> (1) .. (1704) <400> 4 atg act cag aag age ccc gcg aac gaa cae gat age aat cae ttc gac Met Thr Gln Lys Ser Pro Ala Asn Glu His Asp Ser Asn His Phe Asp 1 5 10 15 gta atc atc etc ggc tcg ggc atg tec ggc acc cag atg ggg gcc atc 96 Val He He Leu Gly Ser Gly Met Ser Gly Thr Gln Met Gly Ala He 20 25 30 ? _-< --a------.--L .---?--^,_----»¡-iL ttg gcc aaa caá cag ttt cgc gtg ctg atc atc gag gag tcg tcg cae 144 Leu Ala Lys Gln Gln Phe Arg Val Leu He He Glu Glu Ser Ser His 35 40 45 ccg cgg ttc acg atc ggc gaa tcg tcg atc ccc gag acg tet ctt atg 192 Pro Arg Phe Thr He Gly Glu Ser Ser He Pro Glu Thr Ser Leu Met 50 55 60 aac cgc atc atc gct gat cgc tac ggc att ccg gag etc gac cae atc 240 Asn Arg He He Ala Asp Arg Tyr Gly He Pro Glu Leu Asp His He 65 70 75 80 acg tcg ttt tat tcg acg caá cgt tac gtc gcg tcg age acg ggc att 288 Thr Ser Phe Tyr Ser Thr Gln Arg Tyr Val Ala Ser Ser Thr Gly He 85 90 95 aag cgc aac ttc ggc ttc gtg ttc cae aag ccc ggc cag gag cae gac 336 Lys Arg Asn Phe Gly Phe Val Phe His Lys Pro Gly Gln Glu His Asp 100 105 110 ccg aag gag ttc acc cag tgc gtc att ccc gag ctg ccg tgg ggg ccg 384 Pro Lys Glu Phe Thr Gln Cys Val He Pro Glu Leu Pro Trp Gly Pro 115 120 125 gag age cat tat tac cgg caá gac gtc gac gcc tac ttg ttg caá gcc 432 Glu Ser His Tyr Tyr Arg Gln Asp Val Asp Ala Tyr Leu Leu Gln Ala 130 135 140 gcc att aaa tac ggc tgc aag gtc cae cag aaa act acc gtg acc gaa 480 ^toJluattiMtthhitht. M AM ?toei?J??Átm**. J-.---- --Í- ! Ala He Lys Tyr Gly Cys Lys Val His Gln Lys Thr Thr Val Thr Glu 145 150 155 160 tac cae gcc gat aaa gac ggc gtc gcg gtg acc acc gcc cag ggc gaa 528 Tyr His Ala Asp Lys Asp Gly Val Ala Val Thr Thr Ala Gln Gly Glu 165 170 175 cgg ttc acc ggc cgg tac atg atc gac tgc gga gga cct cgc gcg ccg 576 Arg Phe Thr Gly Arg Tyr Met He Asp Cys Gly Gly Pro Arg Ala Pro 180 185 190 etc gcg acc aag ttc aag etc cgc gaa gaa ccg tgt cgc ttc aag acg 624 Leu Ala Thr Lys Phe Lys Leu Arg Glu Glu Pro Cys Arg Phe Lys Thr 195 200 205 cae tcg cgc age etc tac acg cae atg etc ggg gtc aag ccg ttc gac 672 His Ser Arg Ser Leu Tyr Thr His Met Leu Gly Val Lys Pro Phe Asp 210 215 220 gac atc ttc aag gtc aag ggg cag cgc tgg cgc tgg cae gag ggg acc 720 Asp He Phe Lys Val Lys Gly Gln Arg Trp Arg Trp His Glu Gly Thr 225 230 235 240 ttg cae cae atg ttc gag ggc ggc tgg etc tgg gtg att ccg ttc aac 768 Leu His His Met Phe Glu Gly Gly Trp Leu Trp Val He Pro Phe Asn 245 250 255 aac cae ccg cgg tcg acc aac aac ctg gtg age gtc ggc ctg cag etc 816 Asn His Pro Arg Ser Thr Asn Asn Leu Val Ser Val Gly Leu Gln Leu 260 265 270 -**lf "*fr*f- ••^-'%^"^*'¿j"kaf^ ' gac ccg cgt gtc tac ccg aaa acc gac atc tec gca cag cag gaa ttc 864 Asp Pro Arg Val Tyr Pro Lys Thr Asp He Ser Ala Gln Gln Glu Phe 275 280 285 gat gag ttc etc gcg cgg ttc ccg age atc ggg gct cag ttc cgg gac 912 Asp Glu Phe Leu Ala Arg Phe Pro Ser He Gly Ala Gln Phe Arg Asp 290 295 300 gcc gtg ccg gtg cgc gac tgg gtc aag acc gac cgc ctg caá ttc tcg 960 Ala Val Pro Val Arg Asp Trp Val Lys Thr Asp Arg Leu Gln Phe Ser 305 310 315 320 tcg aac gcc tgc gtc ggc gac cgc tac tgc ctg atg ctg cae gcg aac 1008 Ser Asn Ala Cys Val Gly Asp Arg Tyr Cys Leu Met Leu His Ala Asn 325 330 335 ggc ttc atc gac ccg etc ttc tec cgg ggg ctg gaa aac acc gcg gtg 1056 Gly Phe He Asp Pro Leu Phe Ser Arg Gly Leu Glu Asn Thr Ala Val 340 345 350 acc atc cae gcg etc gcg gcg cgc etc atc aag gcg ctg cgc gac gac 1104 Thr He His Ala Leu Ala Ala Arg Leu He Lys Ala Leu Arg Asp Asp 355 360 365 gac ttc tec ccc gag cgc ttc gag tac atc gag cgc ctg cag caá aag 1152 Asp Phe Ser Pro Glu Arg Phe Glu Tyr He Glu Arg Leu Gln Gln Lys 370 375 380 ctt ttg gac cae aac gac gac ttc gtc age tgc tgc tac acg gcg ttc 1200 Leu Leu Asp His Asn Asp Asp Phe Val Ser Cys Cys Tyr Thr Ala Phe 385 390 395 400 tcg gac ttc cgc cta tgg gac gcg ttc cae agg ctg tgg gcg gtc ggc 1248 Ser Asp Phe Arg Leu Trp Asp Ala Phe His Arg Leu Trp Ala Val Gly 405 410 415 acc atc etc ggg cag ttc cgg etc gtg cag gcc cae gcg agg ttc cgc 1296 Thr He Leu Gly Gln Phe Arg Leu Val Gln Ala His Ala Arg Phe Arg 420 425 430 gcg tcg cgc aac gag ggc gac etc gat cae etc gac aac gac cct ccg 1344 Ala Ser Arg Asn Glu Gly Asp Leu Asp His Leu Asp Asn Asp Pro Pro 435 440 445 tat etc gga tac ctg tgc gcg gac atg gag gag tac tac cag ttg ttc 1392 Tyr Leu Gly Tyr Leu Cys Ala Asp Met Glu Glu Tyr Tyr Gln Leu Phe 450 455 460 aac gac gcc aaa gcc gag gtc gag gcc gtg agt gcc ggg cgc aag ccg 1440 Asn Asp Ala Lys Ala Glu Val Glu Ala Val Ser Ala Gly Arg Lys Pro 465 470 475 480 gcc gat gag gcc gcg gcg cgg att cae gcc etc att gac gaa cga gac 1488 Ala Asp Glu Ala Ala Ala Arg He His Ala Leu He Asp Glu Arg Asp 485 490 495 ttc gcc aag ccg atg ttc ggc ttc ggg tac tgc atc acc ggg gac aag 1536 Phe Ala Lys Pro Met Phe Gly Phe Gly Tyr Cys He Thr Gly Asp Lys 500 505 510 -}¿¿-µja-- i.lt .aff?f- --.^-.-.-A -...^ .M- .«<MhÉj -É^-¿-----?--^.- -^-^ - . ccg cag etc aac aac tcg aag tac age ctg ctg ccg gcg atg cgg ctg 1584 Pro Gln Leu Asn Asn Ser Lys Tyr Ser Leu Leu Pro Ala Met Arg Leu 515 520 525 atg tac tgg acg caá acc cgc gcg ccg gca gag gtg aaa aag tac ttc 1632 Met Tyr Trp Thr Gln Thr Arg Ala Pro Ala Glu Val Lys Lys Tyr Phe 530 535 540 gac tac aac ccg atg ttc gcg ctg etc aag gcg tac atc acg acc cgc 1680 Asp Tyr Asn Pro Met Phe Ala Leu Leu Lys Ala Tyr He Thr Thr Arg 545 550 555 560 atc ggc ctg gcg ctg aag aag tag 1704 He Gly Leu Ala Leu Lys Lys 565 <210> 5 <211> 567 <212> PRT <213> Pseudomonas fluorescens <400> 5 Met Thr Gln Lys Ser Pro Ala Asn Glu His Asp Ser Asn His Phe Asp 1 5 10 15 Val He He Leu Gly Ser Gly Met Ser Gly Thr Gln Met Gly Ala He 20 25 30 Leu Ala Lys Gln Gln Phe Arg Val Leu He He Glu Glu Ser Ser His 35 40 45 Pro Arg Phe Thr He Gly Glu Ser Ser He Pro Glu Thr Ser Leu Met 50 55 60 Asn Arg He He Ala Asp Arg Tyr Gly He Pro Glu Leu Asp His He 65 70 75 80 Thr Ser Phe Tyr Ser Thr Gln Arg Tyr Val Ala Ser Ser Thr Gly He 85 90 95 Lys Arg Asn Phe Gly Phe Val Phe His Lys Pro Gly Gln Glu His Asp 100 105 110 Pro Lys Glu Phe Thr Gln Cys Val He Pro Glu Leu Pro Trp Gly Pro 115 120 125 Glu Ser His Tyr Tyr Arg Gln Asp Val Asp Ala Tyr Leu Leu Gln Ala 130 135 140 Ala He Lys Tyr Gly Cys Lys Val His Gln Lys Thr Thr Val Thr Glu 145 150 155 160 Tyr His Ala Asp Lys Asp Gly Val Ala Val Thr Thr Ala Gln Gly Glu 165 170 175 Arg Phe Thr Gly Arg Tyr Met He Asp Cys Gly Gly Pro Arg Ala Pro 180 185 190 -» ..í^^^FF.^ jU lSS^¿?^i^éi&MM^m?i Leu Ala Thr Lys Phe Lys Leu Arg Glu Glu Pro Cys Arg Phe Lys Thr 195 200 205 His Ser Arg Ser Leu Tyr Thr His Met Leu Gly Val Lys Pro Phe Asp 210 215 220 Asp He Phe Lys Val Lys Gly Gln Arg Trp Arg Trp His Glu Gly Thr 225 230 235 240 Leu His His Met Phe Glu Gly Gly Trp Leu Trp Val He Pro Phe Asn 245 250 255 Asn His Pro Arg Ser Thr Asn Asn Leu Val Ser Val Gly Leu Gln Leu 260 265 270 Asp Pro Arg Val Tyr Pro Lys Thr Asp He Ser Ala Gln Gln Glu Phe 275 280 285 Asp Glu Phe Leu Ala Arg Phe Pro Ser He Gly Ala Gln Phe Arg Asp 290 295 300 Ala Val Pro Val Arg Asp Trp Val Lys Thr Asp Arg Leu Gln Phe Ser 305 310 315 320 Ser Asn Ala Cys Val Gly Asp Arg Tyr Cys Leu Met Leu His Ala Asn 325 330 335 Gly Phe He Asp Pro Leu Phe Ser Arg Gly Leu Glu Asn Thr Ala Val 340 345 350 ^ -^-1---*,.-^^^ -u***----»-. : Thr He His Ala Leu Ala Ala Arg Leu He Lys Ala Leu Arg Asp Asp 355 360 365 Asp Phe Ser Pro Glu Arg Phe Glu Tyr He Glu Arg Leu Gln Gln Lys 370 375 380 Leu Leu Asp His Asn Asp Asp Phe Val Ser Cys Cys Tyr Thr Ala Phe 385 390 395 400 Ser Asp Phe Arg Leu Trp Asp Ala Phe His Arg Leu Trp Ala Val Gly 405 410 415 Thr He Leu Gly Gln Phe Arg Leu Val Gln Ala His Ala Arg Phe Arg 420 425 430 Ala Ser Arg Asn Glu Gly Asp Leu Asp His Leu Asp Asn Asp Pro Pro 435 440 445 Tyr Leu Gly Tyr Leu Cys Ala Asp Met Glu Glu Tyr Tyr Gln Leu Phe 450 455 460 Asn Asp Ala Lys Ala Glu Val Glu Ala Val Ser Ala Gly Arg Lys Pro 465 470 475 480 Ala Asp Glu Ala Ala Ala Arg He His Ala Leu He Asp Glu Arg Asp 485 490 495 Phe Ala Lys Pro Met Phe Gly Phe Gly Tyr Cys He Thr Gly Asp Lys 500 505 510 Pro Gln Leu Asn Asn Ser Lys Tyr Ser Leu Leu Pro Ala Met Arg Leu 515 520 525 Met Tyr Trp Thr Gln Thr Arg Ala Pro Ala Glu Val Lys Lys Tyr Phe 530 535 540 Asp Tyr Asn Pro Met Phe Ala Leu Leu Lys Ala Tyr He Thr Thr Arg 545 550 555 560 He Gly Leu Ala Leu Lys Lys 565 <210> 6 <211> 1350 <212> ADN <213> Pseudomonas fluorescens <220> <221> CDS <222> (1) .. (1350) <400> 6 atg age gat cat gat tat gat gta gtg att atc ggt ggc ggg ccg gcg Met Ser Asp His Asp Tyr Asp Val Val He He Gly Gly Gly Pro Ala 1 5 10 15 ggt tcg acc atg gcc tec tac ctg gca aaa gcc ggt gtc aaa tgc gcg 96 Gly Ser Thr Met Ala Ser Tyr Leu Ala Lys Ala Gly Val Lys Cys Ala 20 25 30 gtg ttc gaa aaa gaa ctg ttc gag cgc gag cat gtt ggc gag tcg ctg 144 Val Phe Glu Lys Glu Leu Phe Glu Arg Glu His Val Gly Glu Ser Leu 35 40 45 gta ccg gcc acc act ccg gtg ctg ctg gaa atc ggg gtg atg gaa aag 192 Val Pro Ala Thr Thr Pro Val Leu Leu Glu He Gly Val Met Glu Lys 50 55 60 atc gag aaa gcc aac ttc ccg aag aag ttc ggc gct gcc tgg acc tcg 240 He Glu Lys Ala Asn Phe Pro Lys Lys Phe Gly Ala Ala Trp Thr Ser 65 70 75 80 gca gat tec ggc ccc gaa gac aag atg ggc ttc cag ggg ctg gac cae 288 Ala Asp Ser Gly Pro Glu Asp Lys Met Gly Phe Gln Gly Leu Asp His 85 90 95 gat ttc cgt tcg gcg gaa atc etc ttc aac gag cgc aag cag gaa ggg 336 Asp Phe Arg Ser Ala Glu He Leu Phe Asn Glu Arg Lys Gln Glu Gly 100 105 110 gtc gat cgc gac ttc acg ttc cae gtc gac cgc ggc aag ttc gac cgc 384 Val Asp Arg Asp Phe Thr Phe His Val Asp Arg Gly Lys Phe Asp Arg 115 120 125 att ctt ctg gag cae gca ggt tcg ctg ggg gcc aag gtc ttc cag ggc 432 He Leu Leu Glu His Ala Gly Ser Leu Gly Ala Lys Val Phe Gln Gly 130 135 140 gtg gag atc gct gac gtc gag ttt etc age ccg ggc aat gtc att gtc 480 -jj=á-^-fl--¡»-^.-.¿.p;-.^^ Val Glu He Ala Asp Val Glu Phe Leu Ser Pro Gly Asn Val He Val 145 150 155 160 aat gcc aag ctg ggc aag cgc age gtg gag atc aag gcc aag atg gtg 52. Asn Ala Lys Leu Gly Lys Arg Ser Val Glu He Lys Ala Lys Met Val 165 170 175 gtg gat gcc age ggt cgc aac gtg ctg ctg ggc cgc cgg ctg ggc ttg 576 Val Asp Ala Ser Gly Arg Asn Val Leu Leu Gly Arg Arg Leu Gly Leu 180 185 190 cga gaa aag gac ccg gtc ttc aac cag ttc gcg att cae tec tgg ttc 624 Arg Glu Lys Asp Pro Val Phe Asn Gln Phe Ala He His Ser Trp Phe 195 200 205 gac aac ttc gac cgc aag tcg gcg acg caá age ccg gac aag gtc gac 672 Asp Asn Phe Asp Arg Lys Ser Ala Thr Gln Ser Pro Asp Lys Val Asp 210 215 220 tac atc ttc att cae ttc ctg ccg atg acc aat acc tgg gtc tgg cag 720 Tyr He Phe He His Phe Leu Pro Met Thr Asn Thr Trp Val Trp Gln 225 230 235 240 atc ccg atc acc gaa acc att acc age gtg ggc gtg gtt acg cag aag 768 He Pro He Thr Glu Thr He Thr Ser Val Gly Val Val Thr Gln Lys 245 250 255 cag aac tac acc aac tec gac etc acc tat gaa gag ttc ttc tgg gaa 816 Gln Asn Tyr Thr Asn Ser Asp Leu Thr Tyr Glu Glu Phe Phe Trp Glu 260 265 270 ..¿i--i-ik.d-Aa--.s--A--- --. ^y°im ^i¡mi ?wm¿ ? gcg gtg aag acc cgg gaa aac ctg cat gac gcg ctg aag gca tcg gag 864 Ala Val Lys Thr Arg Glu Asn Leu His Asp Ala Leu Lys Ala Ser Glu 275 280 285 cag gtc cgc ccg ttc aag aaa gag gcg gac tac age tac ggc atg aaa 912 Gln Val Arg Pro Phe Lys Lys Glu Ala Asp Tyr Ser Tyr Gly Met Lys 290 295 300 gaa gtc tgt ggc gac age ttc gtg ctg atc ggc gat gcc gca cgg ttc 960 Glu Val Cys Gly Asp Ser Phe Val Leu He Gly Asp Ala Ala Arg Phe 305 310 315 320 gtc gac ccg atc ttc tec age ggc gtc age gtt gca etc aac agt gcg 100. Val Asp Pro He Phe Ser Ser Gly Val Ser Val Ala Leu Asn Ser Ala 325 330 335 cgc atc gcc age ggc gac atc atc gag gcg gtg aag aac aac gac ttt 1056 Arg He Ala Ser Gly Asp He He Glu Ala Val Lys Asn Asn Asp Phe 340 345 350 age aag tec agt ttc act cae tac gaa ggc atg atc agg aat ggc atc 1104 Ser Lys Ser Ser Phe Thr His Tyr Glu Gly Met He Arg Asn Gly He 355 360 365 aag aac tgg tat gag ttc atc acg etc tat tac cgc ctg aac atc etc 1152 Lys Asn Trp Tyr Glu Phe He Thr Leu Tyr Tyr Arg Leu Asn He Leu 370 375 380 ttc acc gcg ttc gtt caá gac cea cgc tac cgc ctg gac atc ctg caá 1200 Phe Thr Ala Phe Val Gln Asp Pro Arg Tyr Arg Leu Asp He Leu Gln 385 390 395 400 ttg ctg caá ggg gac gtc tac age ggc aag cgc ctg gaa gtg ctg gac 1248 Leu Leu Gln Gly Asp Val Tyr Ser Gly Lys Arg Leu Glu Val Leu Asp 405 410 415 aag atg cgc gaa atc atc gct gcg gtt gaa age gac ccg gaa cae etc 1296 Lys Met Arg Glu He He Ala Ala Val Glu Ser Asp Pro Glu His Leu 420 425 430 tgg cae aag tac ctg ggc gac atg cag gtt cct acc gcc aaa ccc gcg 1344 Trp His Lys Tyr Leu Gly Asp Met Gln Val Pro Thr Ala Lys Pro Ala 435 440 445 ttc taa 1350 Phe 450 <210> 7 <211> 449 <212> PRT <213> Pseudomonas fluorescens <400> 7 Met Ser Asp His Asp Tyr Asp Val Val He He Gly Gly Gly Pro Ala 1 5 10 15 Gly Ser Thr Met Ala Ser Tyr Leu Ala Lys Ala Gly Val Lys Cys Ala ^»..-i*fa.---^_A,..áito^^ 20 25 30 Val Phe Glu Lys Glu Leu Phe Glu Arg Glu His Val Gly Glu Ser Leu 35 40 45 Val Pro Ala Thr Thr Pro Val Leu Leu Glu He Gly Val Met Glu Lys 50 55 60 He Glu Lys Ala Asn Phe Pro Lys Lys Phe Gly Ala Ala Trp Thr Ser 65 70 75 80 Ala Asp Ser Gly Pro Glu Asp Lys Met Gly Phe Gln Gly Leu Asp His 85 90 95 Asp Phe Arg Ser Ala Glu He Leu Phe Asn Glu Arg Lys Gln Glu Gly 100 105 110 Val Asp Arg Asp Phe Thr Phe His Val Asp Arg Gly Lys Phe Asp Arg 115 120 125 He Leu Leu Glu His Ala Gly Ser Leu Gly Ala Lys Val Phe Gln Gly 130 135 140 Val Glu He Ala Asp Val Glu Phe Leu Ser Pro Gly Asn Val He Val 145 150 155 160 Asn Ala Lys Leu Gly Lys Arg Ser Val Glu He Lys Ala Lys Met Val 165 170 175 Val Asp Ala Ser Gly Arg Asn Val Leu Leu Gly Arg Arg Leu Gly Leu f».^,.---^d--t---->---t-k-fc..^ ¿Ai' 180 185 190 Arg Glu Lys Asp Pro Val Phe Asn Gln Phe Ala He His Ser Trp Phe 195 200 205 Asp Asn Phe Asp Arg Lys Ser Ala Thr Gln Ser Pro Asp Lys Val Asp 210 215 220 Tyr He Phe He His Phe Leu Pro Met Thr Asn Thr Trp Val Trp Gln 225 230 235 240 He Pro He Thr Glu Thr He Thr Ser Val Gly Val Val Thr Gln Lys 245 250 255 Gln Asn Tyr Thr Asn Ser Asp Leu Thr Tyr Glu Glu Phe Phe Trp Glu 260 265 270 Ala Val Lys Thr Arg Glu Asn Leu His Asp Ala Leu Lys Ala Ser Glu 275 280 285 Gln Val Arg Pro Phe Lys Lys Glu Ala Asp Tyr Ser Tyr Gly Met Lys 290 295 300 Glu Val Cys Gly Asp Ser Phe Val Leu He Gly Asp Ala Ala Arg Phe 305 310 315 320 Val Asp Pro He Phe Ser Ser Gly Val Ser Val Ala Leu Asn Ser Ala 325 330 335 Arg He Ala Ser Gly Asp He He Glu Ala Val Lys Asn Asn Asp Phe 340 345 350 Ser Lys Ser Ser Phe Thr His Tyr Glu Gly Met He Arg Asn Gly He 355 360 365 Lys Asn Trp Tyr Glu Phe He Thr Leu Tyr Tyr Arg Leu Asn He Leu 370 375 380 Phe Thr Ala Phe Val Gln Asp Pro Arg Tyr Arg Leu Asp He Leu Gln 385 390 395 400 Leu Leu Gln Gly Asp Val Tyr Ser Gly Lys Arg Leu Glu Val Leu Asp 405 410 415 Lys Met Arg Glu He He Ala Ala Val Glu Ser Asp Pro Glu His Leu 420 425 430 Trp His Lys Tyr Leu Gly Asp Met Gln Val Pro Thr Ala Lys Pro Ala 435 440 445 Phe <210> 8 <211> 1641 <212> ADN <213> Pseudomonas fluorescens <220> <221> CDS UJ***tÉL .Mki*i*? *M í^»*-^"^^** *» >*&•**» *^ <222> (1) ;1641) <400> 8 gtg gtt atg aac gat gtg cag tet ggc aag gcg cea gag cat tac gac 48 Val Val Met Asn Asp Val Gln Ser Gly Lys Ala Pro Glu His Tyr Asp 1 5 10 15 att etc ttg gcg ggc aac age atc age gtg atc atg etc gcc gcc tgc 96 He Leu Leu Ala Gly Asn Ser He Ser Val He Met Leu Ala Ala Cys 20 25 30 ctg gcc cgg aac aag gtc cgg gtc ggt ttg ttg cgc aac cgg cag atg 144 Leu Ala Arg Asn Lys Val Arg Val Gly Leu Leu Arg Asn Arg Gln Met 35 40 45 ccc ccc gac ctt acc ggt gag gcg acg att ccc tat acc tcg atg att 192 Pro Pro Asp Leu Thr Gly Glu Ala Thr He Pro Tyr Thr Ser Met He 50 55 60 ttc gag ctg att gcc gac cgc tat ggc gtg ccg gaa ata aag aat atc 240 Phe Glu Leu He Ala Asp Arg Tyr Gly Val Pro Glu He Lys Asn He 65 70 75 80 gcc cgc acc cgg gat atc cag cag aag gtg atg ccg tet tec ggg gtc 288 Ala Arg Thr Arg Asp He Gln Gln Lys Val Met Pro Ser Ser Gly Val 85 90 95 aag aag aac etc ggg ttc atc tat cae cag cgc age cgg gcg gtg gac 336 Lys Lys Asn Leu Gly Phe He Tyr His Gln Arg Ser Arg Ala Val Asp 100 105 110 "-*"t*• " "^ **fr***-«*^ ií?s **^^*»****** . ctg ggc cag gcg ctg caá ttc aac gtg ccc tec gag cat ggc gag aac 384 Leu Gly Gln Ala Leu Gln Phe Asn Val Pro Ser Glu His Gly Glu Asn 115 120 125 cat ctg ttc agg ccc gat atc gat gcc tat ctg ctg gcg gcg gcc atc 432 His Leu Phe Arg Pro Asp He Asp Ala Tyr Leu Leu Ala Ala Ala He 130 135 140 ggt tat ggc gcg cag ctg gtg gag atc gat aac age cea gag gtg ctg 480 Gly Tyr Gly Ala Gln Leu Val Glu He Asp Asn Ser Pro Glu Val Leu 145 150 155 160 gtc gag gac age ggg gtc aag gta gct acg gca ctg ggg cgc tgg gtc 52í Val Glu Asp Ser Gly Val Lys Val Ala Thr Ala Leu Gly Arg Trp Val 165 170 175 act gcc gat ttc atg gtt gat ggc age cag ggc ggc cag gtg ctg gcg 576 Thr Ala Asp Phe Met Val Asp Gly Ser Gln Gly Gly Gln Val Leu Ala 180 185 190 cgg cag gct ggc ctg gtc age cag gct tcg acg cag aag acc cgg acc 624 Arg Gln Ala Gly Leu Val Ser Gln Ala Ser Thr Gln Lys Thr Arg Thr 195 200 205 ctg gaa ttc tec act cat atg etc ggg gtg gtg ccg ttc gat gag tgc 672 Leu Glu Phe Ser Thr His Met Leu Gly Val Val Pro Phe Asp Glu Cys 210 215 220 gtg cag ggc gat ttt ccc ggc cag tgg cat ggc ggc act ctg cat cae 720 Val Gln Gly Asp Phe Pro Gly Gln Trp His Gly Gly Thr Leu His His 225 230 235 240 gtg ttc gat ggg ggc tgg gtg ggg gtc atc ccg ttc aac aac cat cag 768 Val Phe Asp Gly Gly Trp Val Gly Val He Pro Phe Asn Asn His Gln 245 250 255 cae tcg cgc aac cct ttg gtc age gtg ctg gtt tca ctg cgt gag gac 81( His Ser Arg Asn Pro Leu Val Ser Val Leu Val Ser Leu Arg Glu Asp 260 265 270 etc tgc ccg age atg gac ggc gac cag gtc ctg gcc ggc ctg atc gag 864 Leu Cys Pro Ser Met Asp Gly Asp Gln Val Leu Ala Gly Leu He Glu 275 280 285 ctg tac ccc ggc ctg ggg cgg cae ctg tec ggc gcc cgg cgg gtg cgc 912 Leu Tyr Pro Gly Leu Gly Arg His Leu Ser Gly Ala Arg Arg Val Arg 290 295 300 gag tgg gtg ctg cgc cag ccg ccc cgg cag gtc tat cgc acg gcg etc 960 Glu Trp Val Leu Arg Gln Pro Pro Arg Gln Val Tyr Arg Thr Ala Leu 305 310 315 320 gaa cgc cgc tgc ctg atg ttc gac gag ggc gcc gcg age aac gat ctg 1008 Glu Arg Arg Cys Leu Met Phe Asp Glu Gly Ala Ala Ser Asn Asp Leu 325 330 335 ttg ttc tcg cgc aag ctg tec aat gct gcg gaa ctg gtt ctg gcc ctg 1056 Leu Phe Ser Arg Lys Leu Ser Asn Ala Ala Glu Leu Val Leu Ala Leu 340 345 350 feKtÉ-^ -tii^^^fc^^ gcg cae cgg ctg atc aag gcg gcg cae age ggt gac tac cgc age ccg 1104 Ala His Arg Leu He Lys Ala Ala His Ser Gly Asp Tyr Arg Ser Pro 355 360 365 gcc ctg aat gat ttt gtc ctg acc cag gac age atc atc age ttg agt 1152 Ala Leu Asn Asp Phe Val Leu Thr Gln Asp Ser He He Ser Leu Ser 370 375 380 gac cgg atc gcc tta gcg gct tat gtg tcg ttt cgc gac ccc gag ttg 1200 Asp Arg He Ala Leu Ala Ala Tyr Val Ser Phe Arg Asp Pro Glu Leu 385 390 395 400 tgg aat gcc ttc gcc cgt gtc tgg ctg ctg cag tcg att gcc gcc acc 1248 Trp Asn Ala Phe Ala Arg Val Trp Leu Leu Gln Ser He Ala Ala Thr 405 410 415 atc acc gcg cgc aag atc aac gat gcc ttt gcc aag gac ctg gac ccg 1296 He Thr Ala Arg Lys He Asn Asp Ala Phe Ala Lys Asp Leu Asp Pro 420 425 430 cga gtg ttc gat gaa atc gac cag etc gca gag gac ggt ttc tgg atg 1344 Arg Val Phe Asp Glu He Asp Gln Leu Ala Glu Asp Gly Phe Trp Met 435 440 445 cct ctg tat cgg ggg tac aag gat att etc aac act acg ctg ggc ctt 1392 Pro Leu Tyr Arg Gly Tyr Lys Asp He Leu Asn Thr Thr Leu Gly Leu 450 455 460 tgt gat gac gtc aaa age gcc aag gtc tet gct gcg cae gcg gcg age 1440 £ l 4'f | ¡ í r¿"t »*»***,„.**.*. - m ? .mí Cys Asp Asp Val Lys Ser Ala Lys Val Ser Ala Ala His Ala Ala Ser 465 470 475 480 age atc ttt gcg gag ctt gcc aac gcc agt ttt gtt ccg cct att ttt 1488 Ser He Phe Ala Glu Leu Ala Asn Ala Ser Phe Val Pro Pro He Phe 485 490 495 gat ttt gct aat cct cae gct cgt gtc tat caá ctg acc acc ttg aga 1536 Asp Phe Ala Asn Pro His Ala Arg Val Tyr Gln Leu Thr Thr Leu Arg 500 505 510 aag etc aag gcg etc tgg tgg ggc ctg atg caá gtg ccc tca gag gtc 1584 Lys Leu Lys Ala Leu Trp Trp Gly Leu Met Gln Val Pro Ser Glu Val 515 520 525 gga cgg ctg att ttc tat cga tec ttc aga aaa cct tec ctg cgc aag 1632 Gly Arg Leu He Phe Tyr Arg Ser Phe Arg Lys Pro Ser Leu Arg Lys 530 535 540 gag agt tga 1641 Glu Ser 545 <210> 9 <211> 546 <212> PRT <213> Pseudomonas fluorescens <400> 9 -fa-t «^¿-¿-----toAi-ri*--,-^^ Val Val Met Asn Asp Val Gln Ser Gly Lys Ala Pro Glu His Tyr Asp 1 5 10 15 He Leu Leu Ala Gly Asn Ser He Ser Val He Met Leu Ala Ala Cys 20 25 30 Leu Ala Arg Asn Lys Val Arg Val Gly Leu Leu Arg Asn Arg Gln Met 35 40 45 Pro Pro Asp Leu Thr Gly Glu Ala Thr He Pro Tyr Thr Ser Met He 50 55 60 Phe Glu Leu He Ala Asp Arg Tyr Gly Val Pro Glu He Lys Asn He 65 70 75 80 Ala Arg Thr Arg Asp He Gln Gln Lys Val Met Pro Ser Ser Gly Val 85 90 95 Lys Lys Asn Leu Gly Phe He Tyr His Gln Arg Ser Arg Ala Val Asp 100 105 110 Leu Gly Gln Ala Leu Gln Phe Asn Val Pro Ser Glu His Gly Glu Asn 115 120 125 His Leu Phe Arg Pro Asp He Asp Ala Tyr Leu Leu Ala Ala Ala He 130 135 140 Gly Tyr Gly Ala Gln Leu Val Glu He Asp Asn Ser Pro Glu Val Leu 145 150 155 160 . ----i&-^i.-^^^^-&j--.¿8t^ ^.;a-->-^ --i.
Val Glu Asp Ser Gly Val Lys Val Ala Thr Ala Leu Gly Arg Trp Val 165 170 175 Thr Ala Asp Phe Met Val Asp Gly Ser Gln Gly Gly Gln Val Leu Ala 180 185 190 Arg Gln Ala Gly Leu Val Ser Gln Ala Ser Thr Gln Lys Thr Arg Thr 195 200 205 Leu Glu Phe Ser Thr His Met Leu Gly Val Val Pro Phe Asp Glu Cys 210 215 220 Val Gln Gly Asp Phe Pro Gly Gln Trp His Gly Gly Thr Leu His His 225 230 235 240 Val Phe Asp Gly Gly Trp Val Gly Val He Pro Phe Asn Asn His Gln 245 250 255 His Ser Arg Asn Pro Leu Val Ser Val Leu Val Ser Leu Arg Glu Asp 260 265 270 Leu Cys Pro Ser Met Asp Gly Asp Gln Val Leu Ala Gly Leu He Glu 275 280 285 Leu Tyr Pro Gly Leu Gly Arg His Leu Ser Gly Ala Arg Arg Val Arg 290 295 300 Glu Trp Val Leu Arg Gln Pro Pro Arg Gln Val Tyr Arg Thr Ala Leu 305 310 315 320 Glu Arg Arg Cys Leu Met Phe Asp Glu Gly Ala Ala Ser Asn Asp Leu 325 330 335 Leu Phe Ser Arg Lys Leu Ser Asn Ala Ala Glu Leu Val Leu Ala Leu 340 345 350 Ala His Arg Leu He Lys Ala Ala H s Ser Gly Asp Tyr Arg Ser Pro 355 360 365 Ala Leu Asn Asp Phe Val Leu Thr Gln Asp Ser He He Ser Leu Ser 370 375 380 Asp Arg He Ala Leu Ala Ala Tyr Val Ser Phe Arg Asp Pro Glu Leu 385 390 395 400 Trp Asn Ala Phe Ala Arg Val Trp Leu Leu Gln Ser He Ala Ala Thr 405 410 415 He Thr Ala Arg Lys He Asn Asp Ala Phe Ala Lys Asp Leu Asp Pro 420 425 430 Arg Val Phe Asp Glu He Asp Gln Leu Ala Glu Asp Gly Phe Trp Met 435 440 445 Pro Leu Tyr Arg Gly Tyr Lys Asp He Leu Asn Thr Thr Leu Gly Leu 450 455 460 Cys Asp Asp Val Lys Ser Ala Lys Val Ser Ala Ala His Ala Ala Ser 465 470 475 480 i^^-^Ma-^^^ Ser He Phe Ala Glu Leu Ala Asn Ala Ser Phe Val Pro Pro He Phe 485 490 495 Asp Phe Ala Asn Pro His Ala Arg Val Tyr Gln Leu Thr Thr Leu Arg 500 505 510 Lys Leu Lys Ala Leu Trp Trp Gly Leu Met Gln Val Pro Ser Glu Val 515 520 525 Gly Arg Leu He Phe Tyr Arg Ser Phe Arg Lys Pro Ser Leu Arg Lys 530 535 540 Glu Ser 545 <210> 10 <211> 1510 <212> ADN <213> Pseudomonas fluorescens <220> <221> CDS <222> (1) .. (1509) <400> 10 atg aat cag tac gac gtc att atc atc ggt agt ggt atc gcc ggc gcg 48 Met Asn Gln Tyr Asp Val He He He Gly Ser Gly He Ala Gly Ala 1 5 10 15 ctg acc ggc gcc gtc etc gcg aag tec ggg ctg aac gtt ctg atc etc 96 Leu Thr Gly Ala Val Leu Ala Lys Ser Gly Leu Asn Val Leu He Leu 20 25 30 gac tcg gcc cag cae cea cga ttc tec gtc ggc gaa gcg gcg acá ccg 144 Asp Ser Ala Gln His Pro Arg Phe Ser Val Gly Glu Ala Ala Thr Pro 35 40 45 gaa age ggt ttt ctg ctg cgt ttg etc tca aag cgc ttc gac atc cct 192 Glu Ser Gly Phe Leu Leu Arg Leu Leu Ser Lys Arg Phe Asp He Pro 50 55 60 gaa atc gcc tac etc tcg cae ccc gac aag atc atc cag cae gtc ggt 240 Glu He Ala Tyr Leu Ser His Pro Asp Lys He He Gln His Val Gly 65 70 75 80 tcg age gcc tgc ggg atc aag ctg ggc ttc agt ttt gcc tgg cat caá 288 Ser Ser Ala Cys Gly He Lys Leu Gly Phe Ser Phe Ala Trp His Gln 85 90 95 gag aac gcg ccg tcg tec ccc gac cae ctt gtg gcc ccg ccg ctg aag 336 Glu Asn Ala Pro Ser Ser Pro Asp His Leu Val Ala Pro Pro Leu Lys 100 105 110 gtg ccg gaa gcc cat ctt ttc cgg cag gac atc gac tat ttc gcc ctg 384 Val Pro Glu Ala His Leu Phe Arg Gln Asp He Asp Tyr Phe Ala Leu 115 120 125 atg att gcc ctg aaa cae ggc gcc gaa tec aga cag aac atc aag atc 432 Met He Ala Leu Lys His Gly Ala Glu Ser Arg Gln Asn He Lys He f ftf-*>-.--?ft*-* --i-L-^-«-^^ á? t. 130 135 140 gag tcg atc age etc aac gac gac ggg gtc gag gtg gca ttg tec aac 480 Glu Ser He Ser Leu Asn Asp Asp Gly Val Glu Val Ala Leu Ser Asn 145 150 155 160 gcc gcc ccc gtc aag gcc gcg ttc atc att gac gct gct gcc cag ggc 528 Ala Ala Pro Val Lys Ala Ala Phe He He Asp Ala Ala Ala Gln Gly 165 170 175 tet ccg ctt tec cgc caá ctg ggc ttg cgc acc acc gaa ggg ctg gcg 576 Ser Pro Leu Ser Arg Gln Leu Gly Leu Arg Thr Thr Glu Gly Leu Ala 180 185 190 acc gac acc tgc tca ttc ttc acc cae atg etc aat gtg aag age tac 624 Thr Asp Thr Cys Ser Phe Phe Thr His Met Leu Asn Val Lys Ser Tyr 195 200 205 gaa gat gcc ctg gct ccg ttg tec cgc act cgt tec ccc atc gaa ctg 672 Glu Asp Ala Leu Ala Pro Leu Ser Arg Thr Arg Ser Pro He Glu Leu 210 215 220 ttc aag age acc ttg cae cae atc ttc gaa gag ggc tgg ttg tgg gtc 720 Phe Lys Ser Thr Leu His His He Phe Glu Glu Gly Trp Leu Trp Val 225 230 235 240 atc ccc ttc aac aac cae ccg cag ggc acc aat cag ttg tgc age atc 768 He Pro Phe Asn Asn His Pro Gln Gly Thr Asn Gln Leu Cys Ser He 245 250 255 ggc ttc cag ttc aac aac gcc aag tac cgt ccc acc gag gcg ccg gag 816 Gly Phe Gln Phe Asn Asn Ala Lys Tyr Arg Pro Thr Glu Ala Pro Glu 260 265 270 atc gag ttt cgc aaa ctg ctg aaa aag tac ccg gcc atc ggc gaa cae 864 He Glu Phe Arg Lys Leu Leu Lys Lys Tyr Pro Ala He Gly Glu His 275 280 285 ttc aag gat gcg gtc aat gcc cgg gag tgg atc tac gcg ccg cgc atc 912 Phe Lys Asp Ala Val Asn Ala Arg Glu Trp He Tyr Ala Pro Arg He 290 295 300 aac tac cgc age gtg caá aat gtc ggg gat cgc ttc tgc ctg ctg ccg 960 Asn Tyr Arg Ser Val Gln Asn Val Gly Asp Arg Phe Cys Leu Leu Pro 305 310 315 320 caá gcc acá ggg ttt atc gac ccg ctg ttc tec agg ggg ttg atc acc 1008 Gln Ala Thr Gly Phe He Asp Pro Leu Phe Ser Arg Gly Leu He Thr 325 330 335 acc ttc gag tec atc etc agg ctg gcc ccc aag gtg ctg gac gcc gcc 1056 Thr Phe Glu Ser He Leu Arg Leu Ala Pro Lys Val Leu Asp Ala Ala 340 345 350 cgc age aac cgc tgg caá cgg gaa cag ttc atc gaa gtc gag cgc cat 1104 Arg Ser Asn Arg Trp Gln Arg Glu Gln Phe He Glu Val Glu Arg His 355 360 365 tgc ctg aac gcg gtg gcg acc aat gac cag ttg gtc tec tgc tec tat 1152 Cys Leu Asn Ala Val Ala Thr Asn Asp Gln Leu Val Ser Cys Ser Tyr irin* 11. |Ü¿^^ ^ti?i¡Í &^M iiA Jgfe¿ 370 375 380 gaa gcc ttc age gac ttt cae ctg tgg aac gtg tgg cat cgg gtc tgg 1200 Glu Ala Phe Ser Asp Phe His Leu Trp Asn Val Trp H s Arg Val Trp 385 390 395 400 etc age ggc tec aac ctg ggc agt gcc ttt ctg caá aag ctg ctg cae 1248 Leu Ser Gly Ser Asn Leu Gly Ser Ala Phe Leu Gln Lys Leu Leu His 405 410 415 gac ctg gaa cae agt ggc gac gcc cgc cag ttc gat gca gcg ctt gag 1296 Asp Leu Glu His Ser Gly Asp Ala Arg Gln Phe Asp Ala Ala Leu Glu 420 425 430 gcg gtg cgc ttc cct ggc tgc ctg tec ctg gac tcg ccc gcc tac gaa 1344 Ala Val Arg Phe Pro Gly Cys Leu Ser Leu Asp Ser Pro Ala Tyr Glu 435 440 445 age ctg ttc agg cag tcg tgc cag gtc atg caá cag gcc agg gag caá 1392 Ser Leu Phe Arg Gln Ser Cys Gln Val Met Gln Gln Ala Arg Glu Gln 450 455 460 gcc agg ccg gtg gcc gaa acc gcc aac gcg ctg cat gag ctg atc aag 1440 Ala Arg Pro Val Ala Glu Thr Ala Asn Ala Leu His Glu Leu He Lys 465 470 475 480 gag cae gaa gcc gag ttg ttg ccc ctg ggc tat tca cgg ata tec aat 14Í Glu His Glu Ala Glu Leu Leu Pro Leu Gly Tyr Ser Arg He Ser Asn 485 490 495 - ..-^^^.-^ ¿..^^ cgt ttc atc etc aaa gtc tga a 1510 Arg Phe He Leu Lys Val 500 <210> 11 <211> 502 <212> PRT <213> Pseudomonas fluorescens <400> 11 Met Asn Gln Tyr Asp Val He He He Gly Ser Gly He Ala Gly Ala 10 15 Leu Thr Gly Ala Val Leu Ala Lys Ser Gly Leu Asn Val Leu He Leu 20 25 30 Asp Ser Ala Gln His Pro Arg Phe Ser Val Gly Glu Ala Ala Thr Pro 35 40 45 Glu Ser Gly Phe Leu Leu Arg Leu Leu Ser Lys Arg Phe Asp He Pro 50 55 60 Glu He Ala Tyr Leu Ser His Pro Asp Lys He He Gln His Val Gly 65 70 75 80 Ser Ser Ala Cys Gly He Lys Leu Gly Phe Ser Phe Ala Trp His Gln 85 90 95 Glu Asn Ala Pro Ser Ser Pro Asp His Leu Val Ala Pro Pro Leu Lys 100 105 110 Val Pro Glu Ala His Leu Phe Arg Gln Asp He Asp Tyr Phe Ala Leu 115 120 125 Met He Ala Leu Lys His Gly Ala Glu Ser Arg Gln Asn He Lys He 130 135 140 Glu Ser He Ser Leu Asn Asp Asp Gly Val Glu Val Ala Leu Ser Asn 145 150 155 160 Ala Ala Pro Val Lys Ala Ala Phe He He Asp Ala Ala Ala Gln Gly 165 170 175 Ser Pro Leu Ser Arg Gln Leu Gly Leu Arg Thr Thr Glu Gly Leu Ala 180 185 190 Thr Asp Thr Cys Ser Phe Phe Thr His Met Leu Asn Val Lys Ser Tyr 195 200 205 Glu Asp Ala Leu Ala Pro Leu Ser Arg Thr Arg Ser Pro He Glu Leu 210 215 220 Phe Lys Ser Thr Leu His His He Phe Glu Glu Gly Trp Leu Trp Val 225 230 235 240 He Pro Phe Asn Asn His Pro Gln Gly Thr Asn Gln Leu Cys Ser He 245 250 255 Gly Phe Gln Phe Asn Asn Ala Lys Tyr Arg Pro Thr Glu Ala Pro Glu .^^^-á^-^--.*,»*^ áa 260 265 270 He Glu Phe Arg Lys Leu Leu Lys Lys Tyr Pro Ala He Gly Glu His 275 280 285 Phe Lys Asp Ala Val Asn Ala Arg Glu Trp He Tyr Ala Pro Arg He 290 295 300 Asn Tyr Arg Ser Val Gln Asn Val Gly Asp Arg Phe Cys Leu Leu Pro 305 310 315 320 Gln Ala Thr Gly Phe He Asp Pro Leu Phe Ser Arg Gly Leu He Thr 325 330 335 Thr Phe Glu Ser He Leu Arg Leu Ala Pro Lys Val Leu Asp Ala Ala 340 345 350 Arg Ser Asn Arg Trp Gln Arg Glu Gln Phe He Glu Val Glu Arg His 355 360 365 Cys Leu Asn Ala Val Ala Thr Asn Asp Gln Leu Val Ser Cys Ser Tyr 370 375 380 Glu Ala Phe Ser Asp Phe His Leu Trp Asn Val Trp His Arg Val Trp 385 390 395 400 Leu Ser Gly Ser Asn Leu Gly Ser Ala Phe Leu Gln Lys Leu Leu His 405 410 415 sp Leu Glu His Ser Gly Asp Ala Arg Gln Phe Asp Ala Ala Leu Glu 420 425 430 Ala Val Arg Phe Pro Gly Cys Leu Ser Leu Asp Ser Pro Ala Tyr Glu 435 440 445 Ser Leu Phe Arg Gln Ser Cys Gln Val Met Gln Gln Ala Arg Glu Gln 450 455 460 Ala Arg Pro Val Ala Glu Thr Ala Asn Ala Leu His Glu Leu He Lys 465 470 475 480 Glu His Glu Ala Glu Leu Leu Pro Leu Gly Tyr Ser Arg He Ser Asn 485 490 495 Arg Phe He Leu Lys Val 500 <210> 12 <211> 1476 <212> ADN <213> Amycolatopsis orientalis <220> <221> CDS <222> (1) .. (1476) <400> 12 atg tcg gtc gaa gat ttc gat gtt gtg gtg gcg ggc ggc ggg ccg ggt 4¡ Met Ser Val Glu Asp Phe Asp Val Val Val Ala Gly Gly Gly Pro Gly . XjáfffM.!,*,... ifW---MA?í?^*->-?--tf?a^^ 10 15 ggt tcg acg gtg gcc acc ctg gtg gcg atg cag gga cae cgg gtc ctg 96 Gly Ser Thr Val Ala Thr Leu Val Ala Met Gln Gly His Arg Val Leu 20 25 30 ctg ctg gag aaa gag gtc ttc ccc cgg tac cag atc ggt gag tcg ctg 144 Leu Leu Glu Lys Glu Val Phe Pro Arg Tyr Gln He Gly Glu Ser Leu 35 40 45 ctg ccc gcc acg gtg cae ggg gtc tgc cgg atg etc ggc gtc gcg gac 192 Leu Pro Ala Thr Val His Gly Val Cys Arg Met Leu Gly Val Ala Asp 50 55 60 gag ctg gcg aat tec ggg ttc ccg atc aaa cgc ggc ggc acg ttc cgc 240 Glu Leu Ala Asn Ser Gly Phe Pro He Lys Arg Gly Gly Thr Phe Arg 65 70 75 80 tgg ggc gcc cgt ccg gag ccg tgg acg ttc cae ttc ggg atc tcg gcc 288 Trp Gly Ala Arg Pro Glu Pro Trp Thr Phe His Phe Gly He Ser Ala 85 90 95 aag atg gcg ggc tcg acg tcg cae gcc tat cag gtc gag cgg gcg aag 336 Lys Met Ala Gly Ser Thr Ser His Ala Tyr Gln Val Glu Arg Ala Lys 100 105 110 ttc gac gac atc ctg ctg aag aac gcc aag age aag ggc gtc gtc gtg 384 Phe Asp Asp He Leu Leu Lys Asn Ala Lys Ser Lys Gly Val Val Val 115 120 125 cgg gaa ggc tgc tcg gtc aac gac gtc gtg gag gac ggc gag cgg gtc 432 Arg Glu Gly Cys Ser Val Asn Asp Val Val Glu Asp Gly Glu Arg Val 130 135 140 acc ggc gcg cgc tac acc gac gcg gac ggc aac gcg cae gaa gtc tcg 480 Thr Gly Ala Arg Tyr Thr Asp Ala Asp Gly Asn Ala His Glu Val Ser 145 150 155 160 gcc cgg ttc gtg atc gac gcg tcg ggc aac aag age cgg etc tac acg 528 Ala Arg Phe Val He Asp Ala Ser Gly Asn Lys Ser Arg Leu Tyr Thr 165 170 175 aag gtc aac ggt tcg cgg aac tac tcg gag ttc ttc cgc age etc gcg 576 Lys Val Asn Gly Ser Arg Asn Tyr Ser Glu Phe Phe Arg Ser Leu Ala 180 185 190 ctg ttc ggc tat ttc gag ggt ggc aaa cgg ctg ccc gag ccg gtg tcg 624 Leu Phe Gly Tyr Phe Glu Gly Gly Lys Arg Leu Pro Glu Pro Val Ser 195 200 205 ggc aac atc ctg age gtc gcc ttc gac age ggc tgg ttc tgg tac atc 672 Gly Asn He Leu Ser Val Ala Phe Asp Ser Gly Trp Phe Trp Tyr He 210 215 220 ccc ctg age gac acg ctg acc age gtc ggc gcg gtc gtg cgc cgg gag 720 Pro Leu Ser AsP Thr Leu Thr Ser Val Gly Ala Val Val Arg Arg Glu 225 230 235 240 gac gcc gac aag atc cag ggc gac cgc gag aag gcc etc aac acc ttg 768 sp Ala Asp Lys He Gln Gly Asp Arg Glu Lys Ala Leu Asn Thr Leu 245 250 255 atc gcc gaa tgc ccg ctg atc tcg gag tac etc tcg aac gcg acc agg ¡16 He Ala Glu Cys Pro Leu He Ser Glu Tyr Leu Ser Asn Ala Thr Arg 260 265 270 gtg acc acc ggc agg tac ggc gaa ctg cgg gtg cgc aag gac tac tcg 864 Val Thr Thr Gly Arg Tyr Gly Glu Leu Arg Val Arg Lys Asp Tyr Ser 275 280 285 tac cag cag gac age tac tgg cgg ccc ggg atg gtc ctg gtc ggc gac 912 Tyr Gln Gln Asp Ser Tyr Trp Arg Pro Gly Met Val Leu Val Gly Asp 290 295 300 gcc gcg tgc ttc gtg gac ccg gtg ttc tec tec ggg gtg cae ctg gcg 960 Ala Ala Cys Phe Val Asp Pro Val Phe Ser Ser Gly Val His Leu Ala 305 310 315 320 acc tac age gcg ctg etc gcg gcc cgg tcg atc aac age gtc etc gcg lOOí Thr Tyr Ser Ala Leu Leu Ala Ala Arg Ser He Asn Ser Val Leu Ala 325 330 335 ggc gac etc gac gag aag acc gcg ctg aac gag ttc gag gcg cgc tat 1056 Gly Asp Leu Asp Glu Lys Thr Ala Leu Asn Glu Phe Glu Ala Arg Tyr 340 345 350 cgc cgc gag tac ggc gtc ttc tac gag ttc etc gtc tec ttc tat cag 1104 Arg Arg Glu Tyr Gly Val Phe Tyr Glu Phe Leu Val Ser Phe Tyr Gln 355 360 365 atg aac gtc aac gag gaa tcg tat ttc tgg cag gcc aag aag gtc acg 1152 Met Asn Val Asn Glu Glu Ser Tyr Phe Trp Gln Ala Lys Lys Val Thr 370 375 380 cag aac cag age acc gac atc gag tcg ttc gtc gag ctg atc ggc ggg 1200 Gln Asn Gln Ser Thr Asp He Glu Ser Phe Val Glu Leu He Gly Gly 385 390 395 400 gtg tcg tec ggc gag acc gcg ctg acg gcc gcc gac cgg atc gcc gcg 124Í Val Ser Ser Gly Glu Thr Ala Leu Thr Ala Ala Asp Arg He Ala Ala 405 410 415 aac agt gcc gaa ttc gcc gcc gcc gtc gac aag atg gcg acg ggc gac 1296 Asn Ser Ala Glu Phe Ala Ala Ala Val Asp Lys Met Ala Thr Gly Asp 420 425 430 ggc gac gac atg gtg ccg atg ttc aag tcg acc gtg gtc aag cag gcg 1344 Gly Asp Asp Met Val Pro Met Phe Lys Ser Thr Val Val Lys Gln Ala 435 440 445 atg cag gag gcg ggc cag gtc cag atg aag gcg ctg etc ggc gag gac 1392 Met Gln Glu Ala Gly Gln Val Gln Met Lys Ala Leu Leu Gly Glu Asp 450 455 460 gcc gaa ccc gag ctg ccg ctg ttc ccc ggc ggc ctg gtg act tcg ccc 1440 Ala Glu Pro Glu Leu Pro Leu Phe Pro Gly Gly Leu Val Thr Ser Pro 465 470 475 480 gac ggg atg aag tgg ctg ccg cae cae ccg gcc tga 1476 sp Gly Met Lys Trp Leu Pro His His Pro Ala 485 490 <210> 13 <211> 491 <212> PRT <213> Amycolatopsis orientalis <400> 13 Met Ser Val Glu Asp Phe Asp Val Val Val Ala Gly Gly Gly Pro Gly 1 5 10 15 Gly Ser Thr Val Ala Thr Leu Val Ala Met Gln Gly His Arg Val Leu 20 25 30 Leu Leu Glu Lys Glu Val Phe Pro Arg Tyr Gln He Gly Glu Ser Leu 35 40 45 Leu Pro Ala Thr Val His Gly Val Cys Arg Met Leu Gly Val Ala Asp 50 55 60 Glu Leu Ala Asn Ser Gly Phe Pro He Lys Arg Gly Gly Thr Phe Arg 65 70 75 80 Trp Gly Ala Arg Pro Glu Pro Trp Thr Phe His Phe Gly He Ser Ala 90 95 Lys Met Ala Gly Ser Thr Ser His Ala Tyr Gln Val Glu Arg Ala Lys 100 105 110 Phe Asp Asp He Leu Leu Lys Asn Ala Lys Ser Lys Gly Val Val Val 115 120 125 Arg Glu Gly Cys Ser Val Asn Asp Val Val Glu Asp Gly Glu Arg Val 130 135 140 Thr Gly Ala Arg Tyr Thr Asp Ala Asp Gly Asn Ala His Glu Val Ser 145 150 155 160 Ala Arg Phe Val He Asp Ala Ser Gly Asn Lys Ser Arg Leu Tyr Thr 165 170 175 Lys Val Asn Gly Ser Arg Asn Tyr Ser Glu Phe Phe Arg Ser Leu Ala 180 185 190 Leu Phe Gly Tyr Phe Glu Gly Gly Lys Arg Leu Pro Glu Pro Val Ser 195 200 205 Gly Asn He Leu Ser Val Ala Phe Asp Ser Gly Trp Phe Trp Tyr He 210 215 220 Pro Leu Ser Asp Thr Leu Thr Ser Val Gly Ala Val Val Arg Arg Glu 225 230 235 240 Asp Ala Asp Lys He Gln Gly Asp Arg Glu Lys Ala Leu Asn Thr Leu 245 250 255 He Ala Glu Cys Pro Leu He Ser Glu Tyr Leu Ser Asn Ala Thr Arg 260 265 270 ~l*M^l* u*AJl ??*AM?*l*k Val Thr Thr Gly Arg Tyr Gly Glu Leu Arg Val Arg Lys Asp Tyr Ser 275 280 285 Tyr Gln Gln Asp Ser Tyr Trp Arg Pro Gly Met Val Leu Val Gly Asp 290 295 300 Ala Ala Cys Phe Val Asp Pro Val Phe Ser Ser Gly Val His Leu Ala 305 310 315 320 Thr Tyr Ser Ala Leu Leu Ala Ala Arg Ser He Asn Ser Val Leu Ala 325 330 335 Gly Asp Leu Asp Glu Lys Thr Ala Leu Asn Glu Phe Glu Ala Arg Tyr 340 345 350 Arg Arg Glu Tyr Gly Val Phe Tyr Glu Phe Leu Val Ser Phe Tyr Gln 355 360 365 Met Asn Val Asn Glu Glu Ser Tyr Phe Trp Gln Ala Lys Lys Val Thr 370 375 380 Gln Asn Gln Ser Thr Asp He Glu Ser Phe Val Glu Leu He Gly Gly 385 390 395 400 Val Ser Ser Gly Glu Thr Ala Leu Thr Ala Ala Asp Arg He Ala Ala 405 410 415 Asn Ser Ala Glu Phe Ala Ala Ala Val Asp Lys Met Ala Thr Gly Asp 420 425 430 M^ & »s*M Gly Asp Asp Met Val Pro Met Phe Lys Ser Thr Val Val Lys Gln Ala 435 440 445 Met Gln Glu Ala Gly Gln Val Gln Met Lys Ala Leu Leu Gly Glu Asp 450 455 460 Ala Glu Pro Glu Leu Pro Leu Phe Pro Gly Gly Leu Val Thr Ser Pro 465 470 475 480 Asp Gly Met Lys Trp Leu Pro His His Pro Ala 485 490 <210> 14 <211> 1359 <212> ADN <213> Streptomyces aureofaciens <220> <221> CDS <222> (1) .. (1359) <400> 14 atg ttc cae cgg gac ggc gag gag ccg gac ccg aac gag acc age cag 48 Met Phe His Arg Asp Gly Glu Glu Pro Asp Pro Asn Glu Thr Ser Gln 1 5 10 15 ttc cgc atc ccc tcg atc gtc ggc aac gcg gcc cae ttc ttc cgc cag 96 Phe Arg He Pro Ser He Val Gly Asn Ala Ala His Phe Phe Arg Gln 20 25 30 •jjiKítiTIffihiiH^*.*^^ gac acc gac tec tac atg ttc cae gcc gcg gtg cgc tac ggc tgc gac 144 Asp Thr Asp Ser Tyr Met Phe His Ala Ala Val Arg Tyr Gly Cys Asp 35 40 45 gcc cgg cag tac tac cgg gtg gag aac atc gag ttc gac gac ggc ggg 192 Ala Arg Gln Tyr Tyr Arg Val Glu Asn He Glu Phe Asp Asp Gly Gly 50 55 60 gtg acc gtc tec ggc gcg gac ggc age acc gtc cgg gcc cgc tac ctg 240 Val Thr Val Ser Gly Ala Asp Gly Ser Thr Val Arg Ala Arg Tyr Leu 65 70 75 80 gtc gac gcc age ggc ttc cgc tcg ccg ctg gca cgg cag ttg ggg ttg 2. Val Asp Ala Ser Gly Phe Arg Ser Pro Leu Ala Arg Gln Leu Gly Leu 85 90 95 cgg gag gag ccg age cgg etc aag cae cae gcc cgc tcg atc ttc acc 336 Arg Glu Glu Pro Ser Arg Leu Lys His His Ala Arg Ser He Phe Thr 100 105 110 cae atg gtc gga gtg gac gcg atc gac gac cae gtg gac atg ccg gcc 384 His Met Val Gly Val Asp Ala He Asp Asp His Val Asp Met Pro Ala 115 120 125 gag ctt cgc ccg ccg gtg ccg tgg aac gac ggg acg atg cae cae atc 432 Glu Leu Arg Pro Pro Val Pro Trp Asn Asp Gly Thr Met His His He 130 135 140 ttc gag cgc ggc tgg atg tgg atc atc ccg ttc aac aac cae ccc ggg 480 ^......^ kitiÉéfta-^^ Phe Glu Arg Gly Trp Met Trp He He Pro Phe Asn Asn His Pro Gly 145 150 155 160 gcc acc aac ccg ctg tgc age gtc ggc atc cag etc gac gag cgc cgc 528 Ala Thr Asn Pro Leu Cys Ser Val Gly He Gln Leu Asp Glu Arg Arg 165 170 175 tac ccc gcc cgg ccg gac ctg acg ccc gag gag gag ttc cgg tec cae 576 Tyr Pro Ala Arg Pro Asp Leu Thr Pro Glu Glu Glu Phe Arg Ser His 180 185 190 gtg gac cgc ttc ccg gcg gtg cag cgg cag ttg aag ggc gcc cgc age 624 Val Asp Arg Phe Pro Ala Val Gln Arg Gln Leu Lys Gly Ala Arg Ser 195 200 205 gtg cgc gag tgg gtg cga acg gac cgc atg cag tac tec tcg age cgg 672 Val Arg Glu Trp Val Arg Thr Asp Arg Met Gln Tyr Ser Ser Ser Arg 210 215 220 acg gtc ggc gag cgc tgg tgc ctg atg tcg cae gcg gcc ggc ttc atc 720 Thr Val Gly Glu Arg Trp Cys Leu Met Ser His Ala Ala Gly Phe He 225 230 235 240 gac ccg etc ttc ctt cgc ggc ctg tec aac acc tgc gag atc atc aac 768 Asp Pro Leu Phe Leu Arg Gly Leu Ser Asn Thr Cys Glu He He Asn 245 250 255 gcg ctg tec tgg cgg ctg atg gcc gcg ctg cgc gag gac gac ttc gcg 816 Ala Leu Ser Trp Arg Leu Met Ala Ala Leu Arg Glu Asp Asp Phe Ala 260 265 270 irtWií¡JS-í^t-^ *--**^ gtc gag cgc ttc gcc tac gtg gag gaa ctg gag cag ggc ctg ctg gac 864 Val Glu Arg Phe Ala Tyr Val Glu Glu Leu Glu Gln Gly Leu Leu Asp 275 280 285 tgg aac gac aag ctg gtc aac aac tec ttc atc tec ttc tcg cae tac 912 Trp Asn Asp Lys Leu Val Asn Asn Ser Phe He Ser Phe Ser His Tyr 290 295 300 ccg ctg tgg aac tcg gcg ttc cgg atc tgg gcc tcg gcc age gtg atc 960 Pro Leu Trp Asn Ser Ala Phe Arg He Trp Ala Ser Ala Ser Val He 305 310 315 320 ggc ggc aag cgc atc etc aac gca ctg acc agg acc aag gag acc ggc 100£ Gly Gly Lys Arg He Leu Asn Ala Leu Thr Arg Thr Lys Glu Thr Gly 325 330 335 gac gac age cae tgc cag gcg ctg gac gac aac ccg tac ccg ggc ctg 1056 Asp Asp Ser His Cys Gln Ala Leu Asp Asp Asn Pro Tyr Pro Gly Leu 340 345 350 tgg tgt ccg ctg gac ttc tac aag gag gcc ttc gac gag etc acc gag 1104 Trp Cys Pro Leu Asp Phe Tyr Lys Glu Ala Phe Asp Glu Leu Thr Glu 355 360 365 ctg tgc gag gcc gtg gac gcc ggg cae acc acg gcc gag gag gcc gcg 1152 Leu Cys Glu Ala Val Asp Ala Gly His Thr Thr Ala Glu Glu Ala Ala 370 375 380 cgg ctg ctg gag cag cgg gtc cgc gag tcg gac tgg atg ctg ccg gcc 1200 Arg Leu Leu Glu Gln Arg Val Arg Glu Ser Asp Trp Met Leu Pro Ala 385 390 395 400 ctg ggc ttc aac gac ccc gac acc cae cae atc aac ccg acg gcg gac 1248 Leu Gly Phe Asn Asp Pro Asp Thr His His He Asn Pro Thr Ala Asp 405 410 415 aag atg atc cgg atc gcg gag tgg gcc acc ggt cae cae cgc ccg gag 1296 Lys Met He Arg He Ala Glu Trp Ala Thr Gly His His Arg Pro Glu 420 425 430 atc cgt gag ctg ctg gcc gcc age gcc gag gag gtc agg gcg gcg atg 1344 He Arg Glu Leu Leu Ala Ala Ser Ala Glu Glu Val Arg Ala Ala Met 435 440 445 cgg gtc aag ccg taa 1359 Arg Val Lys Pro 450 <210> 15 <211> 452 <212> PRT <213> Streptomyces aureofaciens <400> 15 Met Phe His Arg Asp Gly Glu Glu Pro Asp Pro Asn Glu Thr Ser Gln 1 5 10 15 Phe Arg He Pro Ser He Val Gly Asn Ala Ala His Phe Phe Arg Gln ««..««.¡¿É.á--.----^.^-*-^-^ 20 25 30 Asp Thr Asp Ser Tyr Met Phe His Ala Ala Val Arg Tyr Gly Cys Asp 35 40 45 Ala Arg Gln Tyr Tyr Arg Val Glu Asn He Glu Phe Asp Asp Gly Gly 50 55 60 Val Thr Val Ser Gly Ala Asp Gly Ser Thr Val Arg Ala Arg Tyr Leu 65 70 75 80 Val Asp Ala Ser Gly Phe Arg Ser Pro Leu Ala Arg Gln Leu Gly Leu 85 90 95 Arg Glu Glu Pro Ser Arg Leu Lys His His Ala Arg Ser He Phe Thr 100 105 110 His Met Val Gly Val Asp Ala He Asp Asp His Val Asp Met Pro Ala 115 120 125 Glu Leu Arg Pro Pro Val Pro Trp Asn Asp Gly Thr Met His His He 130 135 140 Phe Glu Arg Gly Trp Met Trp He He Pro Phe Asn Asn His Pro Gly 145 150 155 160 Ala Thr Asn Pro Leu Cys Ser Val Gly He Gln Leu Asp Glu Arg Arg 165 170 175 Tyr Pro Ala Arg Pro Asp Leu Thr Pro Glu Glu Glu Phe Arg Ser His 180 185 190 Val Asp Arg Phe Pro Ala Val Gln Arg Gln Leu Lys Gly Ala Arg Ser 195 200 205 Val Arg Glu Trp Val Arg Thr Asp Arg Met Gln Tyr Ser Ser Ser Arg 210 215 220 Thr Val Gly Glu Arg Trp Cys Leu Met Ser His Ala Ala Gly Phe He 225 230 235 240 Asp Pro Leu Phe Leu Arg Gly Leu Ser Asn Thr Cys Glu He He Asn 245 250 255 Ala Leu Ser Trp Arg Leu Met Ala Ala Leu Arg Glu Asp Asp Phe Ala 260 265 270 Val Glu Arg Phe Ala Tyr Val Glu Glu Leu Glu Gln Gly Leu Leu Asp 275 280 285 Trp Asn Asp Lys Leu Val Asn Asn Ser Phe He Ser Phe Ser His Tyr 290 295 300 Pro Leu Trp Asn Ser Ala Phe Arg He Trp Ala Ser Ala Ser Val He 305 310 315 320 Gly Gly Lys Arg He Leu Asn Ala Leu Thr Arg Thr Lys Glu Thr Gly 325 330 335 sp Asp Ser His Cys Gln Ala Leu Asp Asp Asn Pro Tyr Pro Gly Leu 340 345 350 Trp Cys Pro Leu Asp Phe Tyr Lys Glu Ala Phe Asp Glu Leu Thr Glu 355 360 365 Leu Cys Glu Ala Val Asp Ala Gly His Thr Thr Ala Glu Glu Ala Ala 370 375 380 Arg Leu Leu Glu Gln Arg Val Arg Glu Ser Asp Trp Met Leu Pro Ala 385 390 395 400 Leu Gly Phe Asn Asp Pro Asp Thr His His He Asn Pro Thr Ala Asp 405 410 415 Lys Met He Arg He Ala Glu Trp Ala Thr Gly His His Arg Pro Glu 420 425 430 He Arg Glu Leu Leu Ala Ala Ser Ala Glu Glu Val Arg Ala Ala Met 435 440 445 Arg Val Lys Pro 450 <210> 16 <211> 1476 <212> ADN <213> Amycolatopsis mediterranei <220> <221> CDS <222> (1) .. (1476) <400> 16 atg tcg gtc gaa gac ttc gac gtg gtg gtg gcg ggc ggc ggg ccg ggt 48 Met Ser Val Glu Asp Phe Asp Val Val Val Ala Gly Gly Gly Pro Gly 1 5 10 15 ggt tcg acg gtg gcc acg ctg gtg gcc atg cag gga cae cgg gtg ctg 96 Gly Ser Thr Val Ala Thr Leu Val Ala Met Gln Gly His Arg Val Leu 20 25 30 ctg ctg gag aaa gag gtt ttc ccg cgg tat cag atc ggt gag tcg ctg 144 Leu Leu Glu Lys Glu Val Phe Pro Arg Tyr Gln He Gly Glu Ser Leu 35 40 45 ctg ccc gcc acg gtg cae ggc gtg tgc cgg atg etc ggc atc tec gac 192 Leu Pro Ala Thr Val His Gly Val Cys Arg Met Leu Gly He Ser Asp 50 55 60 gag ctg gcc aat gcc ggg ttc ccg atc aag cgc ggc ggc acg ttc cgc 240 Glu Leu Ala Asn Ala Gly Phe Pro He Lys Arg Gly Gly Thr Phe Arg 65 70 75 80 tgg ggc gcc cgg ccg gag ccg tgg acg ttc cae ttc ggc atc tcg gcc 288 Trp Gly Ala Arg Pro Glu Pro Trp Thr Phe His Phe Gly He Ser Ala 85 90 95 aag atg gcc ggc tcg acg tcg cae gcc tac cag gtc gag cgg gcg cgg 336 Lys Met Ala Gly Ser Thr Ser His Ala Tyr Gln Val Glu Arg Ala Arg ^^á^^^^--^i<>l¿^T^^^.aa^y^, 100 105 110 ttc gac gag atg ctg ctg aac aac gcc aag cgc aag ggc gtg gtc gtg 384 Phe Asp Glu Met Leu Leu Asn Asn Ala Lys Arg Lys Gly Val Val Val 115 120 125 cgg gag ggg tgc gcg gtc acc gat gtg gtg gaa gac ggc gag cgg gtc 432 Arg Glu Gly Cys Ala Val Thr Asp Val Val Glu Asp Gly Glu Arg Val 130 135 140 acc ggt gcg cgg tac acc gat ccc gac ggc acc gag cgg gaa gtg tcg 480 Thr Gly Ala Arg Tyr Thr Asp Pro Asp Gly Thr Glu Arg Glu Val Ser 145 150 155 160 gcg cgg ttc gtg atc gac gcg tcg ggc aac aag age cgg etc tac acc 528 Ala Arg Phe Val He Asp Ala Ser Gly Asn Lys Ser Arg Leu Tyr Thr 165 170 175 aag gtc ggc ggt tcg cgg aac tat tcg gag ttc ttc cgc age etc gcg 576 Lys Val Gly Gly Ser Arg Asn Tyr Ser Glu Phe Phe Arg Ser Leu Ala 180 185 190 ctg ttc ggt tac ttc gag ggt ggc aag cgg ctg ccc gag ccg gtc tec 624 Leu Phe Gly Tyr Phe Glu Gly Gly Lys Arg Leu Pro Glu Pro Val Ser 195 200 205 ggg aac atc ctg agt gtg gcc ttc gac age ggc tgg ttc tgg tac atc 672 Gly Asn He Leu Ser Val Ala Phe Asp Ser Gly Trp Phe Trp Tyr He 210 215 220 ^^^.1,^4,^ ccg ctg age gac acg ctg acc age gtc ggc gcg gtg gtg cgc cgg gag 720 Pro Leu Ser Asp Thr Leu Thr Ser Val Gly Ala Val Val Arg Arg Glu 225 230 235 240 gac gcc gag aag atc cag ggt gac cgg gag aag gcc etc aac acg ctg 768 t- Asp Ala Glu Lys He Gln Gly Asp Arg Glu Lys Ala Leu Asn Thr Leu 245 250 255 atc gcc gag tgc ccg ctg atc tcg gaa tac etc gcg gac gcg acc cgg 816 He Ala Glu Cys Pro Leu He Ser Glu Tyr Leu Ala Asp Ala Thr Arg 260 265 270 ->Q gtg acg acc ggc cgg tac ggg gaa ctg cgc gtc cgc aag gac tac tec 864 Val Thr Thr Gly Arg Tyr Gly Glu Leu Arg Val Arg Lys Asp Tyr Ser 275 280 285 tac cag cag gag acc tac tgg cgg ccg ggc atg atc ctg gtc ggc gac 912 Tyr Gln Gln Glu Thr Tyr Trp Arg Pro Gly Met He Leu Val Gly Asp 290 295 300 15 gcc gcg tgt ttc gtg gac ccg gtg ttc tec tec ggt gtg cae ctg gcg 960 Ala Ala Cys Phe Val Asp Pro Val Phe Ser Ser Gly Val His Leu Ala 305 310 315 320 acc tac age gcg ctg etc gcg gcc cgg tcg atc aac age gtc etc gcc 100. 20 Thr Tyr Ser Ala Leu Leu Ala Ala Arg Ser He Asn Ser Val Leu Ala 325 330 335 ggc gac ctg gac gag aag acc gcg ctg aac gag ttc gag ctg cgg tat 1056 Gly Asp Leu Asp Glu Lys Thr Ala Leu Asn Glu Phe Glu Leu Arg Tyr ttí--?--_i_?--t. ^ü^yuiMiÉiM 340 345 350 cgc cgt gag tac ggc gtg ttc tac gag ttc etc gtg tec ttc tac cag 1104 Arg Arg Glu Tyr Gly Val Phe Tyr Glu Phe Leu Val Ser Phe Tyr Gln 355 360 365 atg aac gtg aac gag gag tcg tac ttc tgg cag gcc aag aag gtc acg 1152 Met Asn Val Asn Glu Glu Ser Tyr Phe Trp Gln Ala Lys Lys Val Thr 370 375 380 cag aac cag age acc gac gtc gag tcg ttc gtc gag ctg atc ggc gga 1200 Gln Asn Gln Ser Thr Asp Val Glu Ser Phe Val Glu Leu He Gly Gly 0 385 390 395 400 gtg tcg tec ggg gag acc gcg ctg acg gcc gcc gac cgc atc gcc gcg 1248 Val Ser Ser Gly Glu Thr Ala Leu Thr Ala Ala Asp Arg He Ala Ala 405 410 415 - ? cgc agt gcc gag ttc gcc gcg gcg gtg gac gag atg gcg ggc ggg gac 1296 Arg Ser Ala Glu Phe Ala Ala Ala Val Asp Glu Met Ala Gly Gly Asp 420 425 430 ggc gac aac atg gtg ccg atg ttc aag tcg acg gtg gtc cag cag gcg 1344 Gly Asp Asn Met Val Pro Met Phe Lys Ser Thr Val Val Gln Gln Ala 435 440 445 20 atg cag gaa gcg ggc cag gtg cag atg aag gcg ctg etc ggc gag gac 1392 Met Gln Glu Ala Gly Gln Val Gln Met Lys Ala Leu Leu Gly Glu Asp 450 455 460 -**-.--.....«-^dMbA-te-^^-^^^ l gcc gaa ccc gag ctg ccc ctg ttc ccc ggt ggc ctg gtg acc tcg ccc 1440 Ala Glu Pro Glu Leu Pro Leu Phe Pro Gly Gly Leu Val Thr Ser Pro 465 470 475 480 gaa cgg atg aag tgg ctg cct cae cae cct gcg tga 1476 Glu Arg Met Lys Trp Leu Pro His His Pro Ala 485 490 <210> 17 <211> 491 <212> PRT <213> Amycolatopsis mediterranei <400> 17 Met Ser Val Glu Asp Phe Asp Val Val Val Ala Gly Gly Gly Pro Gly 1 5 10 15 Gly Ser Thr Val Ala Thr Leu Val Ala Met Gln Gly His Arg Val Leu 20 25 30 Leu Leu Glu Lys Glu Val Phe Pro Arg Tyr Gln He Gly Glu Ser Leu 35 40 45 Leu Pro Aia Thr Val His Gly Val Cys Arg Met Leu Gly He Ser Asp 50 55 60 Glu Leu Ala Asn Ala Gly Phe Pro He Lys Arg Gly Gly Thr Phe Arg 65 70 75 80 t -f r r- Trp Gly Ala Arg Pro Glu Pro Trp Thr Phe His Phe Gly He Ser Ala 85 90 95 Lys Met Ala Gly Ser Thr Ser His Ala Tyr Gln Val Glu Arg Ala Arg 100 105 110 Phe Asp Glu Met Leu Leu Asn Asn Ala Lys Arg Lys Gly Val Val Val 115 120 125 Arg Glu Gly Cys Ala Val Thr Asp Val Val Glu Asp Gly Glu Arg Val 130 135 140 Thr Gly Ala Arg Tyr Thr Asp Pro Asp Gly Thr Glu Arg Glu Val Ser 145 150 155 160 Ala Arg Phe Val He Asp Ala Ser Gly Asn Lys Ser Arg Leu Tyr Thr 165 170 175 Lys Val Gly Gly Ser Arg Asn Tyr Ser Glu Phe Phe Arg Ser Leu Ala 180 185 190 Leu Phe Gly Tyr Phe Glu Gly Gly Lys Arg Leu Pro Glu Pro Val Ser 195 200 205 Gly Asn He Leu Ser Val Ala Phe Asp Ser Gly Trp Phe Trp Tyr He 210 215 220 Pro Leu Ser Asp Thr Leu Thr Ser Val Gly Ala Val Val Arg Arg Glu 225 230 235 240 Asp Ala Glu Lys He Gln Gly Asp Arg Glu Lys Ala Leu Asn Thr Leu 245 250 255 He Ala Glu Cys Pro Leu He Ser Glu Tyr Leu Ala Asp Ala Thr Arg 260 265 270 Val Thr Thr Gly Arg Tyr Gly Glu Leu Arg Val Arg Lys Asp Tyr Ser 275 280 285 Tyr Gln Gln Glu Thr Tyr Trp Arg Pro Gly Met He Leu Val Gly Asp 290 295 300 Ala Ala Cys Phe Val Asp Pro Val Phe Ser Ser Gly Val His Leu Ala 305 310 315 320 Thr Tyr Ser Ala Leu Leu Ala Ala Arg Ser He Asn Ser Val Leu Ala 325 330 335 Gly Asp Leu Asp Glu Lys Thr Ala Leu Asn Glu Phe Glu Leu Arg Tyr 340 345 350 Arg Arg Glu Tyr Gly Val Phe Tyr Glu Phe Leu Val Ser Phe Tyr Gln 355 360 365 Met Asn Val Asn Glu Glu Ser Tyr Phe Trp Gln Ala Lys Lys Val Thr 370 375 380 Gln Asn Gln Ser Thr Asp Val Glu Ser Phe Val Glu Leu He Gly Gly 385 390 395 400 l&r±?í*, . & *{*. »-»-----?^.^-.«--<----^ Val Ser Ser Gly Glu Thr Ala Leu Thr Ala Ala Asp Arg He Ala Ala 405 410 415 Arg Ser Ala Glu Phe Ala Ala Ala Val Asp Glu Met Ala Gly Gly Asp 420 425 430 Gly Asp Asn Met Val Pro Met Phe Lys Ser Thr Val Val Gln Gln Ala 435 440 445 Met Gln Glu Ala Gly Gln Val Gln Met Lys Ala Leu Leu Gly Glu Asp 450 455 460 Ala Glu Pro Glu Leu Pro Leu Phe Pro Gly Gly Leu Val Thr Ser Pro 465 470 475 480 Glu Arg Met Lys Trp Leu Pro His His Pro Ala 485 490 <210> 18 <211> 702 <212> ADN <213> Escherichia coli <220> <221> CDS <222> (1) .. (702) <400> 18 atg acá acc tta age tgt aaa gtg acc tcg gta gaa gct atc acg gat 4S Met Thr Thr Leu Ser Cys Lys Val Thr Ser Val Glu Ala He Thr Asp 1 5 10 15 acc gta tat cgt gtc cgc atc gtg cea gac gcg gcc ttt tet ttt cgt 96 Thr Val Tyr Arg Val Arg He Val Pro Asp Ala Ala Phe Ser Phe Arg 20 25 30 gct ggt cag tat ttg atg gta gtg atg gat gag cgc gac aaa cgt ccg 144 Ala Gly Gln Tyr Leu Met Val Val Met Asp Glu Arg Asp Lys Arg Pro 35 40 45 ttc tca atg gct tcg acg ccg gat gaa aaa ggg ttt atc gag ctg cat 192 Phe Ser Met Ala Ser Thr Pro Asp Glu Lys Gly Phe He Glu Leu His 10 50 55 60 att ggc gct tet gaa atc aac ctt tac gcg aaa gca gtc atg gac cgc 240 He Gly Ala Ser Glu He Asn Leu Tyr Ala Lys Ala Val Met Asp Arg 65 70 75 80 15 atc etc aaa gat cat caá atc gtg gtc gac att ccc cae gga gaa gcg 288 He Leu Lys Asp His Gln He Val Val Asp He Pro His Gly Glu Ala 85 90 95 tgg ctg cgc gat gat gaa gag cgt ccg atg att ttg att gcg ggc ggc 336 Trp Leu Arg Asp Asp Glu Glu Arg Pro Met He Leu He Ala Gly Gly 20 100 105 110 acc ggg ttc tet tat gcc cgc tcg att ttg ctg acá gcg ttg gcg cgt 384 Thr Gly Phe Ser Tyr Ala Arg Ser He Leu Leu Thr Ala Leu Ala Arg 115 120 125 =•» *?-*,». aac cea aac cgt gat atc acc att tac tgg ggc ggg cgt gaa gag cag 432 Asn Pro Asn Arg Asp He Thr He Tyr Trp Gly Gly Arg Glu Glu Gln 130 135 140 cat ctg tat gat etc tgc gag ctt gag gcg ctt tcg ttg aag cat cct 480 His Leu Tyr Asp Leu Cys Glu Leu Glu Ala Leu Ser Leu Lys His Pro 145 150 155 160 ggt ctg caá gtg gtg ccg gtg gtt gaa caá ccg gaa gcg ggc tgg cgt 528 Gly Leu Gln Val Val Pro Val Val Glu Gln Pro Glu Ala Gly Trp Arg 165 170 175 ggg cgt act ggc acc gtg tta acg gcg gta ttg cag gat cae ggt acg 576 Gly Arg Thr Gly Thr Val Leu Thr Ala Val Leu Gln Asp His Gly Thr 180 185 190 ctg gca gag cat gat atc tat att gcc gga cgt ttt gag atg gcg aaa 624 Leu Ala Glu His Asp He Tyr He Ala Gly Arg Phe Glu Met Ala Lys 195 200 205 att gcc cgc gat ctg ttt tgc agt gag cgt aat gcg cgg gaa gat cgc 672 He Ala Arg Asp Leu Phe Cys Ser Glu Arg Asn Ala Arg Glu Asp Arg 210 215 220 ctg ttt ggc gat gcg ttt gca ttt atc tga 702 Leu Phe Gly Asp Ala Phe Ala Phe He 225 230 -í ' '- -«-t' g t?ÜÉ ^- ¿.to^ . ¿AJ .Lt- é«ai¿É&» <210> 19 <211> 233 <212> PRT <213> Escherichia coli <400> 19 Met Thr Thr Leu Ser Cys Lys Val Thr Ser Val Glu Ala He Thr Asp 1 5 10 15 Thr Val Tyr Arg Val Arg He Val Pro Asp Ala Ala Phe Ser Phe Arg 20 25 30 Ala Gly Gln Tyr Leu Met Val Val Met Asp Glu Arg Asp Lys Arg Pro 35 40 45 Phe Ser Met Ala Ser Thr Pro Asp Glu Lys Gly Phe He Glu Leu His 50 55 60 He Gly Ala Ser Glu He Asn Leu Tyr Ala Lys Ala Val Met Asp Arg 65 70 75 80 He Leu Lys Asp His Gln He Val Val Asp He Pro His Gly Glu Ala 85 90 95 Trp Leu Arg Asp Asp Glu Glu Arg Pro Met He Leu He Ala Gly Gly 100 105 110 Thr Gly Phe Ser Tyr Ala Arg Ser He Leu Leu Thr Ala Leu Ala Arg 115 120 125 Asn Pro Asn Arg Asp He Thr He Tyr Trp Gly Gly Arg Glu Glu Gln 130 135 140 His Leu Tyr Asp Leu Cys Glu Leu Glu Ala Leu Ser Leu Lys His Pro 145 150 155 160 Gly Leu Gln Val Val Pro Val Val Glu Gln Pro Glu Ala Gly Trp Arg 165 170 175 Gly Arg Thr Gly Thr Val Leu Thr Ala Val Leu Gln Asp His Gly Thr 180 185 190 Leu Ala Glu His Asp He Tyr He Ala Gly Arg Phe Glu Met Ala Lys 195 200 205 He Ala Arg Asp Leu Phe Cys Ser Glu Arg Asn Ala Arg Glu Asp Arg 210 215 220 Leu Phe Gly Asp Ala Phe Ala Phe He 225 230 <210> 20 <211> 906 <212> ADN <213> rataa <220> <221> CDS <222> (1) .. (906) <400> 20 atg ggg gcc cag ctg age acg ttg age cga gtg gta etc tec ccg gtc Met Gly Ala Gln Leu Ser Thr Leu Ser Arg Val Val Leu Ser Pro Val 1 5 10 15 tgg ttc gtc tac age etc ttc atg aag ctg ttt cag cgc tec tca ccg 96 Trp Phe Val Tyr Ser Leu Phe Met Lys Leu Phe Gln Arg Ser Ser Pro 20 25 30 gcc atc acc etc gag aac ccc gac atc aag tac cct ctg cgg etc atc 144 Ala He Thr Leu Glu Asn Pro Asp He Lys Tyr Pro Leu Arg Leu He 35 40 45 gac aag gag att atc age cat gac act cgg cgc ttc cga ttt gca etc 192 Asp Lys Glu He He Ser His Asp Thr Arg Arg Phe Arg Phe Ala Leu 50 55 60 cct tcg ccc cag cae atc ctg ggc ctt cct atc ggc cag cae atc tac 240 Pro Ser Pro Gln His He Leu Gly Leu Pro He Gly Gln His He Tyr 65 70 75 80 etc tec acc agg atc gat ggc aac ttg gtc att cgt ccc tac acc cct 288 Leu Ser Thr Arg He Asp Gly Asn Leu Val He Arg Pro Tyr Thr Pro 85 90 95 gtg tet agt gat gat gac aag ggc ctt gtg gac ttg gtg gtc aag gtt 336 Val Ser Ser Asp Asp Asp Lys Gly Leu Val Asp Leu Val Val Lys Val 100 105 110 tac ttc aag gac acg cat ccc aag ttt cea gct gga ggg aaa atg tet 384 Tyr Phe Lys Asp Thr His Pro Lys Phe Pro Ala Gly Gly Lys Met Ser 115 120 125 cag tac ctg gaa aac atg aat att gga gac acc att gaa ttc cgg ggc 432 Gln Tyr Leu Glu Asn Met Asn He Gly Asp Thr He Glu Phe Arg Gly 130 135 140 ccc aat ggg cta ctg gtc tac cag ggc aaa ggg aag ttc gcc atc cgt 480 Pro Asn Gly Leu Leu Val Tyr Gln Gly Lys Gly Lys Phe Ala He Arg 145 150 155 160 gca gac aag aag tec aac cct gtt gtc agg acg gtg aag tet gta ggc 528 Ala Asp Lys Lys Ser Asn Pro Val Val Arg Thr Val Lys Ser Val Gly 165 170 175 atg att gca gga ggg acá ggc atc acc cea atg ctg cag gtg atc cga 576 Met He Ala Gly Gly Thr Gly He Thr Pro Met Leu Gln Val He Arg 180 185 190 gcc gtc ttg aag gac ccg aac gac cae act gtg tgc tat ctg etc ttc 624 Ala Val Leu Lys Asp Pro Asn Asp His Thr Val Cys Tyr Leu Leu Phe 195 200 205 gcc aac cag tec gag aaa gac atc ctg ctg cgg cct gag ctg gag gaa 672 Ala Asn Gln Ser Glu Lys Asp He Leu Leu Arg Pro Glu Leu Glu Glu 210 215 220 ctg agg aac gaa cat tet tet cgc ttc aag etc tgg tac acá gtg gac 720 Leu Arg Asn Glu His Ser Ser Arg Phe Lys Leu Trp Tyr Thr Val Asp 225 230 235 240 aaa gcc ccc gat gcc tgg gac tat age caá ggc ttc gtg aat gag gag 768 Lys Ala Pro Asp Ala Trp Asp Tyr Ser Gln Gly Phe Val Asn Glu Glu 245 250 255 atg atc agg gac cat ctt cea cct cct ggg gag gag acá ctg ata ctg 816 Met He Arg Asp His Leu Pro Pro Pro Gly Glu Glu Thr Leu He Leu 260 265 270 atg tgt gga ccc cea ccg atg atc cag ttt gcc tgt ttg cea aac ctg 864 Met Cys Gly Pro Pro Pro Met He Gln Phe Ala Cys Leu Pro Asn Leu 275 280 285 gag cgt gtg ggc cat ccc aag gag cga tgc ttc acc ttc tga 906 G u Arg Val Gly His Pro Lys Glu Arg Cys Phe Thr Phe 290 295 300 210> 21 <211> 301 <212> PRT <213> rata <400> 21 Met Gly Ala Gln Leu Ser Thr Leu Ser Arg Val Val Leu Ser Pro Val 1 5 10 15 Trp Phe Val Tyr Ser Leu Phe Met Lys Leu Phe Gln Arg Ser Ser Pro 20 25 30 i í l •. i Ala He Thr Leu Glu Asn Pro Asp He Lys Tyr Pro Leu Arg Leu He 35 40 45 Asp Lys Glu He He Ser His Asp Thr Arg Arg Phe Arg Phe Ala Leu 50 55 60 Pro Ser Pro Gln His He Leu Gly Leu Pro He Gly Gln His He Tyr 65 70 75 80 Leu Ser Thr Arg He Asp Gly Asn Leu Val He Arg Pro Tyr Thr Pro 85 90 95 Val Ser Ser Asp Asp Asp Lys Gly Leu Val Asp Leu Val Val Lys Val 100 105 110 Tyr Phe Lys Asp Thr His Pro Lys Phe Pro Ala Gly Gly Lys Met Ser 115 120 125 Gln Tyr Leu Glu Asn Met Asn He Gly Asp Thr He Glu Phe Arg Gly 130 135 140 Pro Asn Gly Leu Leu Val Tyr Gln Gly Lys Gly Lys Phe Ala He Arg 145 150 155 160 Ala Asp Lys Lys Ser Asn Pro Val Val Arg Thr Val Lys Ser Val Gly 165 170 175 Met He Ala Gly Gly Thr Gly He Thr Pro Met Leu Gln Val He Arg 180 185 190 ! ' ' ^.^pt-fc........jaj--^L^-k--.
Ala Val Leu Lys Asp Pro Asn Asp His Thr Val Cys Tyr Leu Leu Phe 195 200 205 Ala Asn Gln Ser Glu Lys Asp He Leu Leu Arg Pro Glu Leu Glu Glu 210 215 220 Leu Arg Asn Glu His Ser Ser Arg Phe Lys Leu Trp Tyr Thr Val Asp 225 230 235 240 Lys Ala Pro Asp Ala Trp Asp Tyr Ser Gln Gly Phe Val Asn Glu Glu 245 250 255 Met He Arg Asp His Leu Pro Pro Pro Gly Glu Glu Thr Leu He Leu 260 265 270 Met Cys Gly Pro Pro Pro Met He Gln Phe Ala Cys Leu Pro Asn Leu 275 280 285 Glu Arg Val Gly His Pro Lys Glu Arg Cys Phe Thr Phe 290 295 300 <210> 22 <211> 2049 <212> ADN <213> Conejo <220> <221> CDS ^.-^ ^^ -te^^^^ü ^ ^ <222> (1¡ (2049) <400> 22 ctg atc aac atg gcg gac tec cae ggg gac acc ggc gcc acc atg cct 48 Leu He Asn Met Ala Asp Ser His Gly Asp Thr Gly Ala Thr Met Pro 1 5 10 15 gaa gcg gcg gcc cag gag gcg tcg gtc ttc age atg acg gac gtg gtt 96 Glu Ala Ala Ala Gln Glu Ala Ser Val Phe Ser Met Thr Asp Val Val 20 25 30 ctg ttc tcg etc atc gtg ggg ctg atc acc tac tgg ttc etc ttc aga 144 Leu Phe Ser Leu He Val Gly Leu He Thr Tyr Trp Phe Leu Phe Arg 35 40 45 aag aaa aag gag gaa gtg ccc gag ttc acc aag atc cag gcc ccg acg 192 Lys Lys Lys Glu Glu Val Pro Glu Phe Thr Lys He Gln Ala Pro Thr 50 55 60 tcg tcg tca gtg aag gag age age ttc gtg gag aag atg aag aag acg 240 Ser Ser Ser Val Lys Glu Ser Ser Phe Val Glu Lys Met Lys Lys Thr 65 70 75 80 ggc cgg aac atc gtg gtc ttc tac ggc tec cag acg ggc acc gcc gag 28 Gly Arg Asn He Val Val Phe Tyr Gly Ser Gln Thr Gly Thr Ala Glu 85 90 95 gag ttt gcc aac cgc ctg tec aag gat gcc cae cgc tac ggg atg cgg 336 Glu Phe Ala Asn Arg Leu Ser Lys Asp Ala His Arg Tyr Gly Met Arg 100 105 110 ggc atg gcc gcc gac ccc gag gag tac gac ctg gcc gac ctg age age 384 Gly Met Ala Ala Asp Pro Glu Glu Tyr Asp Leu Ala Asp Leu Ser Ser 115 120 125 ctg ccc gag atc aac aac gcc ctg gcc gtc ttc tgc atg gcc acc tac 432 Leu Pro Glu He Asn Asn Ala Leu Ala Val Phe Cys Met Ala Thr Tyr 130 135 140 ggt gag ggg gac ccc acc gac aac gcc cag gac ttc tac gac tgg ctg 480 Gly Glu Gly Asp Pro Thr Asp Asn Ala Gln Asp Phe Tyr Asp Trp Leu 145 150 155 160 cag gag acc gac gtg gac etc tcg ggg gtc aag tac gcg gtg ttt ggc 528 Gln Glu Thr Asp Val Asp Leu Ser Gly Val Lys Tyr Ala Val Phe Gly 165 170 175 etc ggg aac aag acc tac gag cae ttc aac gcc atg ggc aag tac gtg 576 Leu Gly Asn Lys Thr Tyr Glu His Phe Asn Ala Met Gly Lys Tyr Val 180 185 190 gac cag cgg ctg gag cag ctt ggc gcc cag cgc atc ttc gag ctg ggc 624 Asp Gln Arg Leu Glu Gln Leu Gly Ala Gln Arg He Phe Glu Leu Gly 195 200 205 a g ggc gac gat gat gca aac ctg gag gag gac ttc atc acg tgg cgg 672 Met Gly Asp Asp Asp Ala Asn Leu Glu Glu Asp Phe He Thr Trp Arg 210 215 220 gag cag ttc tgg ccg gcg gtg tgc gag cae ttc ggt gtg gag gcc acá 720 ,^j?^?. ^JítÉí,rí^á .*,. ^ ¿é^. Aa ^ ^^ Glu Gln Phe Trp Pro Ala Val Cys Glu His Phe Gly Val Glu Ala Thr 225 230 235 240 gga gag gag tec age att cgg cag tac gag etc gtg ttg cae acá gac 768 Gly Glu Glu Ser Ser He Arg Gln Tyr Glu Leu Val Leu His Thr Asp 245 250 255 atc gac gtg gcc aag gtg tac cag ggc gag atg ggc cgc etc aag age 816 He Asp Val Ala Lys Val Tyr Gln Gly Glu Met Gly Arg Leu Lys Ser 260 265 270 tac gag aac cag aaa ccc ccc ttc gat gcc aag aat ccc ttc ctg gcc 864 Tyr Glu Asn Gln Lys Pro Pro Phe Asp Ala Lys Asn Pro Phe Leu Ala 275 280 285 acg gtc acc acc aac cgg aag ctg aac cag ggc acc gag cgc cae etc 912 Thr Val Thr Thr Asn Arg Lys Leu Asn Gln Gly Thr Glu Arg His Leu 290 295 300 atg cae ctg gag ctg gac atc tcg gac tec aag atc agg tat gag tet 960 Met His Leu Glu Leu Asp He Ser Asp Ser Lys He Arg Tyr Glu Ser 305 310 315 320 ggg gac cae gtg gct gtg tat ccg gcc aac gac tet gcc etc gtc aac 1008 Gly Asp His Val Ala Val Tyr Pro Ala Asn Asp Ser Ala Leu Val Asn 325 330 335 cag ctg ggg gag atc ctg ggt gcc gac ctg gac gtc gtc atg tec ctg 1056 Gln Leu Gly Glu He Leu Gly Ala Asp Leu Asp Val Val Met Ser Leu 340 345 350 1.1-Í--.-L-- *«Ü^.*fc .. aac aac etc gat gag gag tec aac aag aag cae cea ttc ccc tgc ccc 1104 Asn Asn Leu Asp Glu Glu Ser Asn Lys Lys His Pro Phe Pro Cys Pro 355 360 365 act tec tac cgc acg gcc etc acc tac tac ctg gac atc acc aac ccg 1152 Thr Ser Tyr Arg Thr Ala Leu Thr Tyr Tyr Leu Asp He Thr Asn Pro 370 375 380 ccg cgc acc aac gtg etc tac gag ctg gcc cag tac gcc gcc gac ccc 1200 Pro Arg Thr Asn Val Leu Tyr Glu Leu Ala Gln Tyr Ala Ala Asp Pro 385 390 395 400 gct gag cag gag cag ctg cgc aag atg gcc tca tec tcg ggc gag ggc 124S Ala Glu Gln Glu Gln Leu Arg Lys Met Ala Ser Ser Ser Gly Glu Gly 405 410 415 aag gag ctg tac ctg age tgg gtg gta gag gcg cgg agg cae atc ctg 129. Lys Glu Leu Tyr Leu Ser Trp Val Val Glu Ala Arg Arg His He Leu 420 425 430 gcc atc etc caá gac tac ccg tec ctg cgg ccg ccc atc gac cae ctg 1344 Ala He Leu Gln Asp Tyr Pro Ser Leu Arg Pro Pro He Asp His Leu 435 440 445 tgt gag ctg ctg ccc cgg ctg cag gcg cgc tac tac tec atc gcc tec 1392 Cys Glu Leu Leu Pro Arg Leu Gln Ala Arg Tyr Tyr Ser He Ala Ser 450 455 460 tec tec aag gtc cae ccc aac tec gtg cae atc tgc gcc gtg gcc gtg 1440 Ser Ser Lys Val His Pro Asn Ser Val His He Cys Ala Val Ala Val 465 470 475 480 gag tac gag acc aag gcc ggc cgc etc aac aaa ggc gtg gcc acc age 1488 Glu Tyr Glu Thr Lys Ala Gly Arg Leu Asn Lys Gly Val Ala Thr Ser 485 490 495 tgg ctg cgg gcc aag gag ccg gcc ggg gag aat ggc ggc cgt gcc ctg 1536 Trp Leu Arg Ala Lys Glu Pro Ala Gly Glu Asn Gly Gly Arg Ala Leu 500 505 510 gtg ccc atg ttc gtg cgc aag tec cag ttc cgc ctg ccc ttc aag gcc 1584 Val Pro Met Phe Val Arg Lys Ser Gln Phe Arg Leu Pro Phe Lys Ala 515 520 525 acc acg ccg gtc atc atg gtg ggc ccc ggc acc ggc gtg gcc ccc ttc 1632 Thr Thr Pro Val He Met Val Gly Pro Gly Thr Gly Val Ala Pro Phe 530 535 540 atc ggc ttt atc cag gag cgg gcc tgg ctg cgg cag cag ggc aag gaa 1680 He Gly Phe He Gln Glu Arg Ala Trp Leu Arg Gln Gln Gly Lys Glu 545 550 555 560 gtg ggc gag acg ctg ctg tac tac ggc tgc cgg cgc gcg gcc gag gac 1728 Val Gly Glu Thr Leu Leu Tyr Tyr Gly Cys Arg Arg Ala Ala Glu Asp 565 570 575 tac ctg tac cgc gag gag etc gcc ggc ttc caá aag gac ggc acg etc 1776 Tyr Leu Tyr Arg Glu Glu Leu Ala Gly Phe Gln Lys Asp Gly Thr Leu 580 585 590 ^ age cag etc aac gtg gcc ttc tec cgc gag cag gcc cag aag gtc tac 1824 Ser Gln Leu Asn Val Ala Phe Ser Arg Glu Gln Ala Gln Lys Val Tyr 595 600 605 gtg cag cae ttg ctg agg agg gac aag gag cae ctg tgg cgg etc atc 1872 Val Gln His Leu Leu Arg Arg Asp Lys Glu His Leu Trp Arg Leu He 610 615 620 cae gag ggg ggc gcc cae atc tac gtg tgc ggg gac gct cgg aac atg 1920 His Glu Gly Gly Ala His He Tyr Val Cys Gly Asp Ala Arg Asn Met 625 630 635 640 gcc agg gac gtg cag aac acc ttc tac gac atc gtg gcc gag ctg ggg 1968 Ala Arg Asp Val Gln Asn Thr Phe Tyr Asp He Val Ala Glu Leu Gly 645 650 655 gcc atg gag cae gcg cag gcc gtg gac tac gtg aag aag etc atg acc 2016 Ala Met Glu His Ala Gln Ala Val Asp Tyr Val Lys Lys Leu Met Thr 660 665 670 aag ggc cgc tac tec ctg gac gtg tgg age tag 2049 Lys Gly Arg Tyr Ser Leu Asp Val Trp Ser 675 680 <210> 23 <211> 682 <212> PRT <213> Conejo i-i.J;2..1 A.i,¿«-a---.. süS-<400> 23 Leu He Asn Met Ala Asp Ser His Gly Asp Thr Gly Ala Thr Met Pro 1 5 10 15 Glu Ala Ala Ala Gln Glu Ala Ser Val Phe Ser Met Thr Asp Val Val 20 25 30 Leu Phe Ser Leu He Val Gly Leu He Thr Tyr Trp Phe Leu Phe Arg 35 40 45 Lys Lys Lys Glu Glu Val Pro Glu Phe Thr Lys He Gln Ala Pro Thr 50 55 60 Ser Ser Ser Val Lys Glu Ser Ser Phe Val Glu Lys Met Lys Lys Thr 65 70 75 80 Gly Arg Asn He Val Val Phe Tyr Gly Ser Gln Thr Gly Thr Ala Glu 85 90 95 Glu Phe Ala Asn Arg Leu Ser Lys Asp Ala His Arg Tyr Gly Met Arg 100 105 110 Gly Met Ala Ala Asp Pro Glu Glu Tyr Asp Leu Ala Asp Leu Ser Ser 115 120 125 Leu Pro Glu He Asn Asn Ala Leu Ala Val Phe Cys Met Ala Thr Tyr 130 135 140 Gly Glu Gly Asp Pro Thr Asp Asn Ala Gln Asp Phe Tyr Asp Trp Leu 145 150 155 160 Gln Glu Thr Asp Val Asp Leu Ser Gly Val Lys Tyr Ala Val Phe Gly 165 170 175 Leu Gly Asn Lys Thr Tyr Glu His Phe Asn Ala Met Gly Lys Tyr Val 180 185 190 Asp Gln Arg Leu Glu Gln Leu Gly Ala Gln Arg He Phe Glu Leu Gly 195 200 205 Met Gly Asp Asp Asp Ala Asn Leu Glu Glu Asp Phe He Thr Trp Arg 210 215 220 Glu Gln Phe Trp Pro Ala Val Cys Glu His Phe Gly Val Glu Ala Thr 225 230 235 240 Gly Glu Glu Ser Ser He Arg Gln Tyr Glu Leu Val Leu His Thr Asp 245 250 255 He Asp Val Ala Lys Val Tyr Gln Gly Glu Met Gly Arg Leu Lys Ser 260 265 270 Tyr Glu Asn Gln Lys Pro Pro Phe Asp Ala Lys Asn Pro Phe Leu Ala 275 280 285 Thr Val Thr Thr Asn Arg Lys Leu Asn Gln Gly Thr Glu Arg His Leu 290 295 300 Met His Leu Glu Leu Asp He Ser Asp Ser Lys He Arg Tyr Glu Ser 305 310 315 320 Gly Asp His Val Ala Val Tyr Pro Ala Asn Asp Ser Ala Leu Val Asn 325 330 335 Gln Leu Gly Glu He Leu Gly Ala Asp Leu Asp Val Val Met Ser Leu 340 345 350 Asn Asn Leu Asp Glu Glu Ser Asn Lys Lys His Pro Phe Pro Cys Pro 355 360 365 Thr Ser Tyr Arg Thr Ala Leu Thr Tyr Tyr Leu Asp He Thr Asn Pro 370 375 380 Pro Arg Thr Asn Val Leu Tyr Glu Leu Ala Gln Tyr Ala Ala Asp Pro 385 390 395 400 Ala Glu Gln Glu Gln Leu Arg Lys Met Ala Ser Ser Ser Gly Glu Gly 405 410 415 Lys Glu Leu Tyr Leu Ser Trp Val Val Glu Ala Arg Arg His He Leu 420 425 430 Ala He Leu Gln Asp Tyr Pro Ser Leu Arg Pro Pro He Asp His Leu 435 440 445 Cys Glu Leu Leu Pro Arg Leu Gln Ala Arg Tyr Tyr Ser He Ala Ser 450 455 460 Ser Ser Lys Val His Pro Asn Ser Val His He Cys Ala Val Ala Val 465 470 475 480 Glu Tyr Glu Thr Lys Ala Gly Arg Leu Asn Lys Gly Val Ala Thr Ser 485 490 495 Trp Leu Arg Ala Lys Glu Pro Ala Gly Glu Asn Gly Gly Arg Ala Leu 500 505 510 Val Pro Met Phe Val Arg Lys Ser Gln Phe Arg Leu Pro Phe Lys Ala 515 520 525 Thr Thr Pro Val He Met Val Gly Pro Gly Thr Gly Val Ala Pro Phe 530 535 540 He Gly Phe He Gln Glu Arg Ala Trp Leu Arg Gln Gln Gly Lys Glu 545 550 555 560 Val Gly Glu Thr Leu Leu Tyr Tyr Gly Cys Arg Arg Ala Ala Glu Asp 565 570 575 Tyr Leu Tyr Arg Glu Glu Leu Ala Gly Phe Gln Lys Asp Gly Thr Leu 580 585 590 Ser Gln Leu Asn Val Ala Phe Ser Arg Glu Gln Ala Gln Lys Val Tyr 595 600 605 Val Gln His Leu Leu Arg Arg Asp Lys Glu His Leu Trp Arg Leu He 610 615 620 His Glu Gly Gly Ala His He Tyr Val Cys Gly Asp Ala Arg Asn Met 625 630 635 640 Ala Arg Asp Val Gln Asn Thr Phe Tyr Asp He Val Ala Glu Leu Gly 645 650 655 Ala Met Glu His Ala Gln Ala Val Asp Tyr Val Lys Lys Leu Met Thr 660 665 670 Lys Gly Arg Tyr Ser Leu Asp Val Trp Ser 675 680 <210> 24 <211> 444 <212> ADN <213> Spinacia olerácea <220> <221> CDS <222> (1) .. (444) <400> 24 atg gca gca acc acc acá acá atg atg ggc atg gcc acc acc ttt gtc 48 Met Ala Ala Thr Thr Thr Thr Met Met Gly Met Ala Thr Thr Phe Val 1 5 10 15 cea aaa ccc caá gca cea cea atg atg gcg gcg ctt cea tec aac acc 96 Pro Lys Pro Gln Ala Pro Pro Met Met Ala Ala Leu Pro Ser Asn Thr 20 25 30 ggc cgc tet ttg ttc gga etc aag acc ggt age cgt ggc gga agg atg 144 Gly Arg Ser Leu Phe Gly Leu Lys Thr Gly Ser Arg Gly Gly Arg Met 35 40 45 acá atg gct gcc tac aag gta acc ttg gta acá ccc acc ggt aac gta 192 Thr Met Ala Ala Tyr Lys Val Thr Leu Val Thr Pro Thr Gly Asn Val 50 55 60 gag ttt caá tgc cea gac gat gtt tac atc ttg gat gct gct gaa gaa 240 Glu Phe Gln Cys Pro Asp Asp Val Tyr He Leu Asp Ala Ala Glu Glu 65 70 75 80 gaa ggc att gac ttg cct tac tca tgc aga gct ggg tcg tgc tet tca 288 Glu Gly He Asp Leu Pro Tyr Ser Cys Arg Ala Gly Ser Cys Ser Ser tgc gcc gga aag ctt aag acá ggt agt ctt aac caá gat gat cag agt 336 Cys Ala Gly Lys Leu Lys Thr Gly Ser Leu Asn Gln Asp Asp Gln Ser 100 105 110 ttt ttg gat gac gat cag atc gat gaa gga tgg gtt ctt acc tgt gct 384 Phe Leu Asp Asp Asp Gln He Asp Glu Gly Trp Val Leu Thr Cys Ala 115 120 125 gct tac cct gtt agt gat gtt act att gag acc cae aag gaa gag gag 432 Ala Tyr Pro Val Ser Asp Val Thr He Glu Thr His Lys Glu Glu Glu 130 135 140 ctt act gcc taa 444 Leu Thr Ala 145 <210> 25 <211> 147 <212> PRT <213> Spmacia olerácea <400> 25 Met Ala Ala Thr Thr Thr Thr Met Met Gly Met Ala Thr Thr Phe Val 1 5 10 15 Pro Lys Pro Gln Ala Pro Pro Met Met Ala Ala Leu Pro Ser Asn Thr 20 25 30 Gly Arg Ser Leu Phe Gly Leu Lys Thr Gly Ser Arg Gly Gly Arg Met 35 40 45 Thr Met Ala Ala Tyr Lys Val Thr Leu Val Thr Pro Thr Gly Asn Val 50 55 60 Glu Phe Gln Cys Pro Asp Asp Val Tyr He Leu Asp Ala Ala Glu Glu 65 70 75 80 Glu Gly He Asp Leu Pro Tyr Ser Cys Arg Ala Gly Ser Cys Ser Ser 85 90 95 Cys Ala Gly Lys Leu Lys Thr Gly Ser Leu Asn Gln Asp Asp Gln Ser 100 105 110 t-- -µ.U'4-i-- < ¿>i«-<211> 711 Phe Leu Asp Asp Asp Gln He Asp Glu Gly Trp Val Leu Thr Cys Ala 115 120 125 Ala Tyr Pro Val Ser Asp Val Thr He Glu Thr His Lys Glu Glu Glu 130 135 140 Leu Thr Ala 145 <210> 26 <212> ADN <213> Vibrio fischeri <220> <221> CDS <222> (1) .. (711) <400> 26 atg cea atc aat tgc aaa gta aag tet atc gag cea ttg gct tgt aat 48 Met Pro He Asn Cys Lys Val Lys Ser He Glu Pro Leu Ala Cys Asn 1 5 10 15 act ttt cga att tta ctt cae cea gaa cag cct gtt gct ttt aaa gca 96 Tnr Phe Arg He Leu Leu His Pro Glu Gln Pro Val Ala Phe Lys Ala 20 25 30 ggc caá tac cta acg gtt gtt atg ggt gaa aaa gac aaa cgc cea ttc 144 Gly Gln Tyr Leu Thr Val Val Met Gly Glu Lys Asp Lys Arg Pro Phe .^..-^--^^-^¿.. -^^, -^-,; 35 40 45 tca atc gca agt agt cct tgt cgc cae gaa ggt gaa att gag tta cat 192 Ser He Ala Ser Ser Pro Cys Arg His Glu Gly Glu He Glu Leu His 50 55 60 att ggt gcc gca gag cae aat gct tat gcc gga gaa gtg gtt gaa tca 240 He Gly Ala Ala Glu His Asn Ala Tyr Ala Gly Glu Val Val Glu Ser 65 70 75 80 atg aaa tcg gca cta gaa acg ggt ggt gat att tta att gat gcg cct 288 Met Lys Ser Ala Leu Glu Thr Gly Gly Asp He Leu He Asp Ala Pro 85 90 95 cat ggt gaa gcg tgg atc cgt gaa gac age gat cgt tca atg tta ttg 336 His Gly Glu Ala Trp He Arg Glu Asp Ser Asp Arg Ser Met Leu Leu 100 105 110 att gct ggc ggt acá ggt ttt agt tac gta cgt tca att ctt gat cae 384 He Ala Gly Gly Thr Gly Phe Ser Tyr Val Arg Ser He Leu Asp His 115 120 125 tgt att age caá cag att caá aaa cea att tac cta tac tgg ggt ggt 432 Cys He Ser Gln Gln He Gln Lys Pro He Tyr Leu Tyr Trp Gly Gly 130 135 140 cgt gat gaa tgc caá ctg tat gca aaa gca gaa tta gag age att gct 480 Arg Asp Glu Cys Gln Leu Tyr Ala Lys Ala Glu Leu Glu Ser He Ala 145 150 155 160 ¡ÉiliA-É-lliiiitirift^^ caá gcg cat age cat att acg ttt gtg cea gtg gtt gag aaa agt gaa 528 Gln Ala His Ser His He Thr Phe Val Pro Val Val Glu Lys Ser Glu 165 170 175 ggc tgg acá ggt aaa acg ggt aat gtg tta gaa gcg gta aaa gcc gat 576 Gly Trp Thr Gly Lys Thr Gly Asn Val Leu Glu Ala Val Lys Ala Asp 180 185 190 ttt aac tca cta gca gat atg gat att tac atc gca ggt cgc ttt gaa 624 Phe Asn Ser Leu Ala Asp Met Asp He Tyr He Ala Gly Arg Phe Glu 195 200 205 atg gct ggt gca gca cgt gag cag ttc acc act gaa aaa caá gcg aag 672 Met Ala Gly Ala Ala Arg Glu Gln Phe Thr Thr Glu Lys Gln Ala Lys 210 215 220 aaa gag cag ctg ttt ggt gat gca ttc gca ttt atc taa 711 Lys Glu Gln Leu Phe Gly Asp Ala Phe Ala Phe He 225 230 235 <210> 27 <211> 236 <212> PRT <213> Vibrio fischep <400> 27 Met Pro He Asn Cys Lys Val Lys Ser He Glu Pro Leu Ala Cys Asn 1 5 10 15 ¿M tküiMbimt i l áir**^ *r 4rtt?tf ? Thr Phe Arg He Leu Leu His Pro Glu Gln Pro Val Ala Phe Lys Ala 20 25 30 Gly Gln Tyr Leu Thr Val Val Met Gly Glu Lys Asp Lys Arg Pro Phe 35 40 45 Ser He Ala Ser Ser Pro Cys Arg His Glu Gly Glu He Glu Leu His 50 55 60 He Gly Ala Ala Glu His Asn Ala Tyr Ala Gly Glu Val Val Glu Ser 65 70 75 80 Met Lys Ser Ala Leu Glu Thr Gly Gly Asp He Leu He Asp Ala Pro 85 90 95 His Gly Glu Ala Trp He Arg Glu Asp Ser Asp Arg Ser Met Leu Leu 100 105 110 He Ala Gly Gly Thr Gly Phe Ser Tyr Val Arg Ser He Leu Asp His 115 120 125 Cys He Ser Gln Gln He Gln Lys Pro He Tyr Leu Tyr Trp Gly Gly 130 135 140 Arg Asp Glu Cys Gln Leu Tyr Ala Lys Ala Glu Leu Glu Ser He Ala 145 150 155 160 Gln Ala His Ser His He Thr Phe Val Pro Val Val Glu Lys Ser Glu 165 170 175 ..s-^-...„.-.te,aat«»i Gly Trp Thr Gly Lys Thr Gly Asn Val Leu Glu Ala Val Lys Ala Asp 180 185 190 Phe Asn Ser Leu Ala Asp Met Asp He Tyr He Ala Gly Arg Phe Glu 195 200 205 Met Ala Gly Ala Ala Arg Glu Gln Phe Thr Thr Glu Lys Gln Ala Lys 210 215 220 Lys Glu Gln Leu Phe Gly Asp Ala Phe Ala Phe He 225 230 235 <210> 28 <211> 1110 <212> ADN <213> Spmacia olerácea <220> <221> CDS <222> (1) .. (1110) <400> 28 atg acc acc gct gtc acc gcc gct gtt tet ttc ccc tet acc aaa acc 48 Met Thr Thr Ala Val Thr Ala Ala Val Ser Phe Pro Ser Thr Lys Thr 1 5 10 15 acc tet etc tec gcc cga age tec tec gtc att tec cct gac aaa atc 96 Thr Ser Leu Ser Ala Arg Ser Ser Ser Val He Ser Pro Asp Lys He 20 25 30 ni mu i t?üiiin Tii - ri íiÉifti age tac aaa aag gtt cct ttg tac tac agg aat gta tet gca act ggg 144 Ser Tyr Lys Lys Val Pro Leu Tyr Tyr Arg Asn Val Ser Ala Thr Gly 35 40 45 aaa atg gga ccc atc agg gcc cag atc gcc tet gat gtg gag gca cct 192 Lys Met Gly Pro He Arg Ala Gln He Ala Ser Asp Val Glu Ala Pro 50 55 60 cea cct gct cct gct aag gta gag aaa cat tca aag aaa atg gag gaa 240 Pro Pro Ala Pro Ala Lys Val Glu Lys His Ser Lys Lys Met Glu Glu 65 70 75 80 ggc att acá gtg aac aag ttt aag cct aag acc cct tac gtt gga aga 288 Gly He Thr Val Asn Lys Phe Lys Pro Lys Thr Pro Tyr Val Gly Arg 85 90 95 tgt ctt ctt aac acc aaa att act ggg gat gat gca ccc gga gag acc 336 Cys Leu Leu Asn Thr Lys He Thr Gly Asp Asp Ala Pro Gly Glu Thr 100 105 110 tgg cae atg gtt ttt tec cat gaa gga gag atc cct tac aga gaa g.gg 384 Trp His Met Val Phe Ser His Glu Gly Glu He Pro Tyr Arg Glu Gly 115 120 125 caá tec gtt ggg gtt att cea gat ggg gaa gac aag aat gga aag ccc 432 Gln Ser Val Gly Val He Pro Asp Gly Glu Asp Lys Asn Gly Lys Pro 130 135 140 cat aag ttg aga ttg tac tcg atc gcc age agt gct ctt ggt gat ttt 480 His Lys Leu Arg Leu Tyr Ser He Ala Ser Ser Ala Leu Gly Asp Phe 145 150 155 160 ggt gat gct aaa tet gtt tcg ttg tgt gta aaa cga etc atc tac acc 528 Gly Asp Ala Lys Ser Val Ser Leu Cys Val Lys Arg Leu He Tyr Thr 165 170 175 aat gac gct gga gag acg atc aag gga gtc tgc tec aac ttc ttg tgt 576 Asn Asp Ala Gly Glu Thr He Lys Gly Val Cys Ser Asn Phe Leu Cys 180 185 190 gac ttg aaa ccc ggt gct gaa gtg aag tta acá gga cea gtt gga aag 624 Asp Leu Lys Pro Gly Ala Glu Val Lys Leu Thr Gly Pro Val Gly Lys 195 200 205 gag atg etc atg ccc aaa gac cct aac gcg acá att atc atg ctt gga 672 Glu Met Leu Met Pro Lys Asp Pro Asn Ala Thr He He Met Leu Gly 210 215 220 act gga acg ggg att gct cct ttc cgt tca ttc ttg tgg aag atg ttc 720 Thr Gly Thr Gly He Ala Pro Phe Arg Ser Phe Leu Trp Lys Met Phe 225 230 235 240 ttc gaa aag cat gat gat tac aag ttt aac ggc ttg gct tgg ctt ttc 768 Phe Glu Lys His Asp Asp Tyr Lys Phe Asn Gly Leu Ala Trp Leu Phe 245 250 255 ttg ggt gta ccc acá age agt tet ctt etc tac aaa gag gaa ttt gag 816 Leu Gly Val Pro Thr Ser Ser Ser Leu Leu Tyr Lys Glu Glu Phe Glu 260 265 270 aag atg aag gaa aag gct cea gac aac ttc agg ctg gat ttt gca gtg 864 Lys Met Lys Glu Lys Ala Pro Asp Asn Phe Arg Leu Asp Phe Ala Val 275 280 285 age aga gag caá act aac gag aaa ggg gag aag atg tac att caá acc 912 Ser Arg Glu Gln Thr Asn Glu Lys Gly Glu Lys Met Tyr He Gln Thr 290 295 300 cga atg gca caá tac gca gtt gag cta tgg gaa atg ttg aag aaa gat 960 Arg Met Ala Gln Tyr Ala Val Glu Leu Trp Glu Met Leu Lys Lys Asp 305 310 315 320 aat act tat gtc tac atg tgt ggt etc aag gga atg gaa aag gga att 1008 Asn Thr Tyr Val Tyr Met Cys Gly Leu Lys Gly Met Glu Lys Gly He 325 330 335 gac gac att atg gtt tca ttg gct gct gca gaa ggc att gat tgg att 1056 Asp Asp He Met Val Ser Leu Ala Ala Ala Glu Gly He Asp Trp He 340 345 350 gaa tac aag agg cag ttg aag aag gca gaa caá tgg aac gtt gaa gtc 1104 Glu Tyr Lys Arg Gln Leu Lys Lys Ala Glu Gln Trp Asn Val Glu Val 355 360 365 tac taa 1110 Tyr 370 <210> 29 <211> 369 <212> PRT <213> Spmacia olerácea <400> 29 Met Thr Thr Ala Val Thr Ala Ala Val Ser Phe Pro Ser Thr Lys Thr 1 5 10 15 Thr Ser Leu Ser Ala Arg Ser Ser Ser Val He Ser Pro Asp Lys He 20 25 30 Ser Tyr Lys Lys Val Pro Leu Tyr Tyr Arg Asn Val Ser Ala Thr Gly 35 40 45 Lys Met Gly Pro He Arg Ala Gln He Ala Ser Asp Val Glu Ala Pro 50 55 60 Pro Pro Ala Pro Ala Lys Val Glu Lys His Ser Lys Lys Met Glu Glu 65 70 75 80 Gly He Thr Val Asn Lys Phe Lys Pro Lys Thr Pro Tyr Val Gly Arg 85 90 95 Cys Leu Leu Asn Thr Lys He Thr Gly Asp Asp Ala Pro Gly Glu Thr 100 105 110 Trp His Met Val Phe Ser His Glu Gly Glu He Pro Tyr Arg Glu Gly 115 120 125 ^<>--< -- .--jM«^^J^.???^"a Gln Ser Val Gly Val He Pro Asp Gly Glu Asp Lys Asn Gly Lys Pro 130 135 140 His Lys Leu Arg Leu Tyr Ser He Ala Ser Ser Ala Leu Gly Asp Phe 145 150 155 160 Gly Asp Ala Lys Ser Val Ser Leu Cys Val Lys Arg Leu He Tyr Thr 165 170 175 Asn Asp Ala Gly Glu Thr He Lys Gly Val Cys Ser Asn Phe Leu Cys 180 185 190 Asp Leu Lys Pro Gly Ala Glu Val Lys Leu Thr Gly Pro Val Gly Lys 195 200 205 Glu Met Leu Met Pro Lys Asp Pro Asn Ala Thr He He Met Leu Gly 210 215 220 Thr Gly Thr Gly He Ala Pro Phe Arg Ser Phe Leu Trp Lys Met Phe 225 230 235 240 Phe Glu Lys His Asp Asp Tyr Lys Phe Asn Gly Leu Ala Trp Leu Phe 245 250 255 Leu Gly Val Pro Thr Ser Ser Ser Leu Leu Tyr Lys Glu Glu Phe Glu 260 265 270 Lys Met Lys Glu Lys Ala Pro Asp Asn Phe Arg Leu Asp Phe Ala Val 275 280 285 Ser Arg Glu Gln Thr Asn Glu Lys Gly Glu Lys Met Tyr He Gln Thr 290 295 300 Arg Met Ala Gln Tyr Ala Val Glu Leu Trp Glu Met Leu Lys Lys Asp 305 310 315 320 Asn Thr Tyr Val Tyr Met Cys Gly Leu Lys Gly Met Glu Lys Gly He 325 330 335 Asp Asp He Met Val Ser Leu Ala Ala Ala Glu Gly He Asp Trp He 340 345 350 Glu Tyr Lys Arg Gln Leu Lys Lys Ala Glu Gln Trp Asn Val Glu Val 355 360 365 Tyr <210> 30 <211> 2580 <212> ADN <213> Aspergillus parasiticus <220> <221> CDS <222> (1) .. (2580) <400> 30 atg gca acc atc acg gag gtt cgg acg gat gcg etc gtc cea act gac 4. Met Ala Thr He Thr Glu Val Arg Thr Asp Ala Leu Val Pro Thr Asp 10 15 etc gtc ctt aag acá ggt cag atc aaa att caá age gaa gag atc tcg 96 Leu Val Leu Lys Thr Gly Gln He Lys He Gln Ser Glu Glu He Ser 20 25 30 acg aaa gac ctg tec gat atc cct ctg cea cea cea tca aaa cgg ccg 144 Thr Lys Asp Leu Ser Asp He Pro Leu Pro Pro Pro Ser Lys Arg Pro 35 40 45 acá gaa gtg ctg age gta gat aaa gga acc cea gat age cat gtt ccg 192 Thr Glu Val Leu Ser Val Asp Lys Gly Thr Pro Asp Ser His Val Pro 50 55 60 cgt gat cct cga etc atc aga tta acg ggt gtt cat ccg ttt aac gtt 240 Arg Asp Pro Arg Leu He Arg Leu Thr Gly Val His Pro Phe Asn Val 65 70 75 80 gag cea cct ctt acá gat ctg tat aaa gaa ggg ttt tta acá tcg ccg 288 Glu Pro Pro Leu Thr Asp Leu Tyr Lys Glu Gly Phe Leu Thr Ser Pro 85 90 95 gag etc ttc tat gtt cga aat cat ggc cea gtc cct cat gtc aag gat 336 Glu Leu Phe Tyr Val Arg Asn His Gly Pro Val Pro His Val Lys Asp 100 105 110 gaa gat atc cct cae tgg gaa att act atc gaa gga ctg gta gag aag 384 Glu Asp He Pro His Trp Glu He Thr He Glu Gly Leu Val Glu Lys 115 120 125 cct ttg gta cta aac ttc cga caá gtg ttg cag cag tac gac caá ata 432 Pro Leu Val Leu Asn Phe Arg Gln Val Leu Gln Gln Tyr Asp Gln He 130 135 140 acg gcg ccc atc acc etc gta tgt gca ggc aat cga cgc aaa gag caá 480 Thr Ala Pro He Thr Leu Val Cys Ala Gly Asn Arg Arg Lys Glu Gln 145 150 155 160 aac att gta cgt aaa acg aaa ggt ttt tet tgg gga tec gcg gga cta 528 Asn He Val Arg Lys Thr Lys Gly Phe Ser Trp Gly Ser Ala Gly Leu 165 170 175 tcg act gcc etc ttc act ggc cea ttg ctg gcg gat atc etc cgc agt 576 Ser Thr Ala Leu Phe Thr Gly Pro Leu Leu Ala Asp He Leu Arg Ser 180 185 190 ggc aaa ccc ctg cgt caá gcg aaa tac gtc tgt atg gaa gga gcg gat 624 Gly Lys Pro Leu Arg Gln Ala Lys Tyr Val Cys Met Glu Gly Ala Asp 195 200 205 aag ctg ccc aat ggt cae tac ggc acá etc att aaa ttg aac tgg gcc 672 Lys Leu Pro Asn Gly His Tyr Gly Thr Leu He Lys Leu Asn Trp Ala 210 215 220 cta gac ccc aac agg ggg atc atg ctt gca cat aaa atg aac ggg gag 720 Leu Asp Pro Asn Arg Gly He Met Leu Ala His Lys Met Asn Gly Glu 225 230 235 240 tet ctt cgc cea gat cat ggt cgt ccg ctg agg gcc gtc gtg ccc ggt 768 Ser Leu Arg Pro Asp His Gly Arg Pro Leu Arg Ala Val Val Pro Gly . ?rMb ^i?J^?e^?UtttS?^^?? aikKi :. ------.?--g--l--í 245 250 255 caá ata gga gga cga agt gtc aag tgg ctg aag agg ctg atc ttg acc 816 Gln He Gly Gly Arg Ser Val Lys Trp Leu Lys Arg Leu He Leu Thr 260 265 270 gat gca cea age gat aac tgg tac cat atc aat gac aac cgc gtc tta 864 Asp Ala Pro Ser Asp Asn Trp Tyr His He Asn Asp Asn Arg Val Leu 275 280 285 cea acá atg gtc tcg ccc gat atg gca tca aat aac cga aat tgg tgg 912 Pro Thr Met Val Ser Pro Asp Met Ala Ser Asn Asn Arg Asn Trp Trp 290 295 300 cae gat gag cgg gat gcg att tat gac cta aac acc aac tec gcc gtt 960 His Asp Glu Arg Asp Ala He Tyr Asp Leu Asn Thr Asn Ser Ala Val 305 310 315 320 gga tat cct caá aac aat gag gtc tta aat atc ctg gag gcc agg gcc 1008 Gly Tyr Pro Gln Asn Asn Glu Val Leu Asn He Leu Glu Ala Arg Ala 325 330 335 gtc ata tac tgt cag agg ata gct tac gct ggt ggg ggc cgt agg gtt 1056 Val He Tyr Cys Gln Arg He Ala Tyr Ala Gly Gly Gly Arg Arg Val 340 345 350 acc agg gta gaa ata tec cta gac aaa ggc aaa tet tgg aga ttg gcg 1104 Thr Arg Val Glu He Ser Leu Asp Lys Gly Lys Ser Trp Arg Leu Ala 355 360 365 fa^feÉ-^^--S^*^^ >...«--fe*---gat atc gaa tat gcc gaa gac aag tat cgt gat ttc gaa ggc gag ctt 1152 Asp He Glu Tyr Ala Glu Asp Lys Tyr Arg Asp Phe Glu Gly Glu Leu 370 375 380 ttt gga ggc aaa gta gat atg tac tgg cgc gaa act tgc ttc tgc tgg 1200 Phe Gly Gly Lys Val Asp Met Tyr Trp Arg Glu Thr Cys Phe Cys Trp 385 390 395 400 tgt ttt tgg tet cta age atc gcc atc cea gag ctt gag aac agt gat 1248 Cys Phe Trp Ser Leu Ser He Ala He Pro Glu Leu Glu Asn Ser Asp 405 410 415 gcc atc ctt gta aga gcc atg gat gaa gca ttg ggc gtg cag cct cgc 1296 Ala He Leu Val Arg Ala Met Asp Glu Ala Leu Gly Val Gln Pro Arg 420 425 430 gat atg tac tgg tec gtt etc gga atg atg aac aac cct tgg ttc cgg 1344 Asp Met Tyr Trp Ser Val Leu Gly Met Met Asn Asn Pro Trp Phe Arg 435 440 445 gtt acá att acg aag gaa aac ggg aac ttg aga ttc gag cae cct acc 1392 Val Thr He Thr Lys Glu Asn Gly Asn Leu Arg Phe Glu His Pro Thr 450 455 460 cae cct agt atg cct acá gga tgg atg gaa cgc gtc aaa aaa gct ggg 1440 His Pro Ser Met Pro Thr Gly Trp Met Glu Arg Val Lys Lys Ala Gly 465 470 475 480 ggt gac ccg acg aat ggt aac tgg gga gaa aga cae gaa gga gag gag 1488 Gly Asp Pro Thr Asn Gly Asn Trp Gly Glu Arg His Glu Gly Glu Glu 485 490 495 ccg acg gag ccg gag ccc gtg caá gac att aat atg aag aaa gac ggg 1536 Pro Thr Glu Pro Glu Pro Val Gln Asp He Asn Met Lys Lys Asp Gly 500 505 510 cea age cga acg att agt ttt gaa gaa ttc aag gag aat tec tgt gat 1584 Pro Ser Arg Thr He Ser Phe Glu Glu Phe Lys Glu Asn Ser Cys Asp 515 520 525 gag aag cea tgg ttc atc gtg aat gga gaa gtg tat gat ggt caá gca 1632 Glu Lys Pro Trp Phe He Val Asn Gly Glu Val Tyr Asp Gly Gln Ala 530 535 540 ttt ctt gaa ggc cae cct ggc gga cgg cag agt att atc tec tet gcc 1680 Phe Leu Glu Gly His Pro Gly Gly Arg Gln Ser He He Ser Ser Ala 545 550 555 560 ggt cag gac gtc tec gag gaa ttc ctt gct att cat age gag acg gca 1728 Gly Gln Asp Val Ser Glu Glu Phe Leu Ala He His Ser Glu Thr Ala 565 570 575 aag gcg atg atg cct gag tac cat att gga acg acg gat ccg gaa ggc 1776 Lys Ala Met Met Pro Glu Tyr His He Gly Thr Thr Asp Pro Glu Gly 580 585 590 ttg ata gca etc aag gat gat gca tca tec tec acc gat gaa att cgc 1824 Leu He Ala Leu Lys Asp Asp Ala Ser Ser Ser Thr Asp Glu He Arg 595 600 605 ^^jígggj cea gtg ttc etc caá tca cgg tet tgg acá aag gca acá ttg aaa gaa 1872 Pro Val Phe Leu Gln Ser Arg Ser Trp Thr Lys Ala Thr Leu Lys Glu 610 615 620 agg aaa gac ata tca tgg gat acá cga ata ttt agt ttc aaa ttg gaa 1920 Arg Lys Asp He Ser Trp Asp Thr Arg He Phe Ser Phe Lys Leu Glu 625 630 635 640 cae gaa gat caá acá ttg ggt tta cea gtc ggc cag cat ctt atg atc 1968 His Glu Asp Gln Thr Leu Gly Leu Pro Val Gly Gln His Leu Met He 645 650 655 aaa gtc etc gac aga tca tec aac aac gaa gcc atc atc cgc tca tac 2016 Lys Val Leu Asp Arg Ser Ser Asn Asn Glu Ala He He Arg Ser Tyr 660 665 670 acc ccg att tet gaa acc age caá aaa ggg act gtg gac ttg ctg gtt 2064 Thr Pro He Ser Glu Thr Ser Gln Lys Gly Thr Val Asp Leu Leu Val 675 680 685 aaa gta tac ttt gca acá gcc acc tcg gca ggc ggc aag atg acg atg 2112 Lys Val Tyr Phe Ala Thr Ala Thr Ser Ala Gly Gly Lys Met Thr Met 690 695 700 gcc ctg gat agg ctg cea ttg ggc tec gtg gtc gaa tat ctt gga aat 2160 Ala Leu Asp Arg Leu Pro Leu Gly Ser Val Val Glu Tyr Leu Gly Asn 705 710 715 720 gga cga gtt etc ata agt ggc aag gag cgc cat gtt cgg tcg ttt aag 2208 Gly Arg Val Leu He Ser Gly Lys Glu Arg His Val Arg Ser Phe Lys 725 730 735 atg att tgt gga gga acc ggt atc acá ccg atc ttg cag gtc ttg cgc 2256 Met He Cys Gly Gly Thr Gly He Thr Pro He Leu Gln Val Leu Arg 740 745 750 gcc gtg gtt cag gac cat caá gat cct acc tet tgt gta gtc etc aat 2304 Ala Val Val Gln Asp His Gln Asp Pro Thr Ser Cys Val Val Leu Asn 755 760 765 gga aac aga cag gag gaa gat atc ctt cgc cgg gct gag etc gac ggc 2352 Gly Asn Arg Gln Glu Glu Asp He Leu Arg Arg Ala Glu Leu Asp Gly 770 775 780 ttc atg gcg tec gac age aga agg tgt aat ata ata cae act cta tec 2400 Phe Met Ala Ser Asp Ser Arg Arg Cys Asn He He His Thr Leu Ser 785 790 795 800 aaa gcg ccg gac tca tgg act ggc cgc cga gga cgc ata tec gaa gag 2448 Lys Ala Pro Asp Ser Trp Thr Gly Arg Arg Gly Arg He Ser Glu Glu 805 810 815 etc cta aag gag tac gcg gct cea gaa gat gag agt atg gta ctg att 2496 Leu Leu Lys Glu Tyr Ala Ala Pro Glu Asp Glu Ser Met Val Leu He 820 825 830 tgt ggt ccg cea gcc atg gaa gaa tcg gct cgg agg ata ctg ttg gcg 2544 Cys Gly Pro Pro Ala Met Glu Glu Ser Ala Arg Arg He Leu Leu Ala 835 840 845 gaa gga tgg aaa gaa tca gac ctt cae ttt ttc tga 2580 Glu Gly Trp Lys Glu Ser Asp Leu His Phe Phe 850 855 860 <210> 31 <211> 859 <212> PRT <213> Aspergillus parasiticus <400> 31 Met Ala Thr He Thr Glu Val Arg Thr Asp Ala Leu Val Pro Thr Asp 1 5 10 15 Leu Val Leu Lys Thr Gly Gln He Lys He Gln Ser Glu Glu He Ser 20 25 30 Thr Lys Asp Leu Ser Asp He Pro Leu Pro Pro Pro Ser Lys Arg Pro 35 40 45 Thr Glu Val Leu Ser Val Asp Lys Gly Thr Pro Asp Ser His Val Pro 50 55 60 Arg Asp Pro Arg Leu He Arg Leu Thr Gly Val His Pro Phe Asn Val 65 70 75 80 Glu Pro Pro Leu Thr Asp Leu Tyr Lys Glu Gly Phe Leu Thr Ser Pro 85 90 95 Glu Leu Phe Tyr Val Arg Asn His Gly Pro Val Pro His Val Lys Asp ^?.^^i^^ÁA?^^?l&? ??^ ^ ^^^^.^á^^ ^!? i- 100 105 110 Glu Asp He Pro His Trp Glu He Thr He Glu Gly Leu Val Glu Lys 115 120 125 Pro Leu Val Leu Asn Phe Arg Gln Val Leu Gln Gln Tyr Asp Gln He 130 135 140 Thr Ala Pro He Thr Leu Val Cys Ala Gly Asn Arg Arg Lys Glu Gln 145 150 155 160 Asn He Val Arg Lys Thr Lys Gly Phe Ser Trp Gly Ser Ala Gly Leu 165 170 175 Ser Thr Ala Leu Phe Thr Gly Pro Leu Leu Ala Asp He Leu Arg Ser 180 185 190 Gly Lys Pro Leu Arg Gln Ala Lys Tyr Val Cys Met Glu Gly Ala Asp 195 200 205 Lys Leu Pro Asn Gly His Tyr Gly Thr Leu He Lys Leu Asn Trp Ala 210 215 220 Leu Asp Pro Asn Arg Gly He Met Leu Ala His Lys Met Asn Gly Glu 225 230 235 240 Ser Leu Arg Pro Asp His Gly Arg Pro Leu Arg Ala Val Val Pro Gly 245 250 255 Gln He Gly Gly Arg Ser Val Lys Trp Leu Lys Arg Leu He Leu Thr Í-j^^J-Mifa.i-1- -^-^-u-^faMi^^^ 260 265 270 Asp Ala Pro Ser Asp Asn Trp Tyr His He Asn Asp Asn Arg Val Leu 275 280 285 Pro Thr Met Val Ser Pro Asp Met Ala Ser Asn Asn Arg Asn Trp Trp 290 295 300 His Asp Glu Arg Asp Ala He Tyr Asp Leu Asn Thr Asn Ser Ala Val 305 310 315 320 Gly Tyr Pro Gln Asn Asn Glu Val Leu Asn He Leu Glu Ala Arg Ala 325 330 335 Val He Tyr Cys Gln Arg He Ala Tyr Ala Gly Gly Gly Arg Arg Val 340 345 350 Thr Arg Val Glu He Ser Leu Asp Lys Gly Lys Ser Trp Arg Leu Ala 355 360 365 Asp He Glu Tyr Ala Glu Asp Lys Tyr Arg Asp Phe Glu Gly Glu Leu 370 375 380 Phe Gly Gly Lys Val Asp Met Tyr Trp Arg Glu Thr Cys Phe Cys Trp 385 390 395 400 Cys Phe Trp Ser Leu Ser He Ala He Pro Glu Leu Glu Asn Ser Asp 405 410 415 Ala He Leu Val Arg Ala Met Asp Glu Ala Leu Gly Val Gln Pro Arg 420 425 430 Asp Met Tyr Trp Ser Val Leu Gly Met Met Asn Asn Pro Trp Phe Arg 435 440 445 Val Thr He Thr Lys Glu Asn Gly Asn Leu Arg Phe Glu His Pro Thr 450 455 460 His Pro Ser Met Pro Thr Gly Trp Met Glu Arg Val Lys Lys Ala Gly 465 470 475 480 Gly Asp Pro Thr Asn Gly Asn Trp Gly Glu Arg His Glu Gly Glu Glu 485 490 495 Pro Thr Glu Pro Glu Pro Val Gln Asp He Asn Met Lys Lys Asp Gly 500 505 510 Pro Ser Arg Thr He Ser Phe Glu Glu Phe Lys Glu Asn Ser Cys Asp 515 520 525 Glu Lys Pro Trp Phe He Val Asn Gly Glu Val Tyr Asp Gly Gln Ala 530 535 540 Phe Leu Glu Gly His Pro Gly Gly Arg Gln Ser He He Ser Ser Ala 545 550 555 560 Gly Gln Asp Val Ser Glu Glu Phe Leu Ala He His Ser Glu Thr Ala 565 570 575 Lys Ala Met Met Pro Glu Tyr His He Gly Thr Thr Asp Pro Glu Gly 580 585 590 Leu He Ala Leu Lys Asp Asp Ala Ser Ser Ser Thr Asp Glu He Arg 595 600 605 Pro Val Phe Leu Gln Ser Arg Ser Trp Thr Lys Ala Thr Leu Lys Glu 610 615 620 Arg Lys Asp He Ser Trp Asp Thr Arg He Phe Ser Phe Lys Leu Glu 625 630 635 640 His Glu Asp Gln Thr Leu Gly Leu Pro Val Gly Gln His Leu Met He 645 650 655 Lys Val Leu Asp Arg Ser Ser Asn Asn Glu Ala He He Arg Ser Tyr 660 665 670 Thr Pro He Ser Glu Thr Ser Gln Lys Gly Thr Val Asp Leu Leu Val 675 680 685 Lys Val Tyr Phe Ala Thr Ala Thr Ser Ala Gly Gly Lys Met Thr Met 690 695 700 Ala Leu Asp Arg Leu Pro Leu Gly Ser Val Val Glu Tyr Leu Gly Asn 705 710 715 720 Gly Arg Val Leu He Ser Gly Lys Glu Arg His Val Arg Ser Phe Lys 725 730 735 Met He Cys Gly Gly Thr Gly He Thr Pro He Leu Gln Val Leu Arg 740 745 750 Ala Val Val Gln Asp His Gln Asp Pro Thr Ser Cys Val Val Leu Asn 755 760 765 Gly Asn Arg Gln Glu Glu Asp He Leu Arg Arg Ala Glu Leu Asp Gly 770 775 780 Phe Met Ala Ser Asp Ser Arg Arg Cys Asn He He His Thr Leu Ser 785 790 795 800 Lys Ala Pro Asp Ser Trp Thr Gly Arg Arg Gly Arg He Ser Glu Gl. 805 810 815 Leu Leu Lys Glu Tyr Ala Ala Pro Glu Asp Glu Ser Met Val Leu He 820 825 830 Cys Gly Pro Pro Ala Met Glu Glu Ser Ala Arg Arg He Leu Leu Ala 835 840 845 Glu Gly Trp Lys Glu Ser Asp Leu His Phe Phe 850 855 <210> 32 <211> 37 <212> ADN <213> Artificial <220> <223> cebador <220> <221> misc_feature <222> (1) .. (37) <400> 32 gcgcgaattc atgacaacct taagetgtaa agtgacc 37 <210> 33 <211> 34 <212> ADN <213> Artificial <220> <223> cebador <220> <221> misc_feature <222> (1) .. (34) <400> 33 gcgcctgcag tcagataaat gcaaacgcat egee 34 <210> 34 <211> 26019 <212> ADN <213> sintético <220> <221> promotor <222> (233) .. (1582) <220> <221> Intron Tf .1i Vr1¡»tim^*-^A-^^*"^^ <222> (1583) .. (1958) <220> <221> gen <222> (1969) (3585) <223> PrnA <220> <221> terminador <222> (3603) .. (3877) <220> <221> promotor <222> (3888) .. (5237) <220> <221> Intron <222> (5238) .. (5613) <220> <221> gen <222> (5624) .. (7327) <223> PrnC <220> <221> terminador <222> (7338) .. (7612) <220> <221> promotor <222> (7636) .. (8985) <220> <221> Intron <222> (8986) .. (9361) <220> <221> gen <222> (9372) ;10457¡ <223> PrnB <220> <221> termmador <222> (10464) .. (10738) <220> <221> promotor <222> (10749) .. (12098) <220> <221> Intron <222> (12099) .. (12474) <220> <221> gen <222> (12485) (13576) <223> PrnD <220> <221> terminador .- <.--M^-t--i..aJ^A-t,,M^^t,tol|t^^-^S¡i.^-i-iá^^.-í.a.-<222> (13583) .. (13857) <220> <221> promotor <222> (13942) .. (14942) <220> <221> gen <222> (14948) .. (15649) <223> fre <220> <221> terminador <222> (15655) .. (15936) <220> <221> promotor <222> (15949) .. (17285) <220> <221> Intron <222> (17283) .. (17679) <220> <221> gen <222> (17696) .. (18238) <223> marcador seleccionable <220> <221> terminador <222> ( 18245 ) ( 18526 ) <400> 34 tggggaaccc tgtggttggc atgeacatac aaatggacga acggataaac cttttcacgc 60 ccttttaaat atcegattat tetaataaac gctcttttct ettaggttta cccgccaata 120 tatcctgtca aacactgata gtttaaactg aaggcgggaa acgacaatct gatetategt 180 tctagtcgta cgttttgcga tcggtctcac tagagcggcc gcctcgaggt accggatttg 240 gagccaagtc teataaaege cattgtggaa gaaagtcttg agttggtggt aatgtaacag 300 agtagtaaga acagagaaga gagagagtgt gagatacatg aattgtcggg caacaaaaat 360 cctgaacatc ttattttagc aaagagaaag agttccgagt ctgtagcaga agagtgagga 420 gaaatttaag ctcttggact tgtgaattgt tccgcctctt gaatacttct tcaatcctca 480 tatattcttc ttctatgtta cctgaaaacc ggcatttaat ctcgcgggtt tattccggtt 540 caacattttt tttgttttga gttattatct gggcttaata acgcaggcct gaaataaatt 600 caaggcccaa ctgttttttt ttttaagaag ttgctgttaa aaaaaaaaaa agggaattaa 660 caacaacaac aaaaaaagat aaagaaaata ataacaatta ctttaattgt agactaaaaa 720 aacatagatt ttatcatgaa aaaaagagaa aagaaataaa aacttggatc aaaaaaaaaa 780 acatacagat ettetaatta ttaacttttc ttaaaaatta ggtccttttt cccaacaatt 840 aggtttagag ttttggaatt aaaccaaaaa gattgttcta aaaaatactc aaatttggta 900 gataagtttc cttattttaa ttagtcaatg gtagatactt ttttttcttt tctttattag 960 agtagattag aatcttttat gccaagtttt gataaattaa atcaagaaga taaactatca 1020 taatcaacat gaaattaaaa gaaaaatctc atatatagta ttagtattct ctatatatat 1080 tatgattgct tattettaat gggttgggtt aaccaagaca tagtcttaat ggaaagaatc 1140 ttttttgaac tttttcctta ttgattaaat tettetatag aaaagaaaga aattatttga 1200 ggaaaagtat atacaaaaag aaaaatagaa aaatgtcagt gaagcagatg taatggatga 1260 cctaatccaa ccaccaccat aggatgtttc tacttgagtc ggtcttttaa aaacgcacgg 1320 tggaaaatat gacacgtatc atatgattec ttcctttagt ttcgtgataa taatcetcaa 1380 ctgatatctt cctttttttg ttttggctaa agatatttta ttctcattaa tagaaaagac 1440 ggttttgggc ttttggtttg cgatataaag aagaccttcg tgtggaagat aataattcat 1500 cctttcgtct ttttetgact cttcaatctc tcccaaagcc taaagegate tctgcaaatc 1560 tctcgcgact ctctctttca aggtatattt tctgattctt tttgtttttg attcgtatct 1620 gatetecaat ttttgttatg tggattattg aatcttttgt ataaattgct tttgacaata 1680 ttgttcgttt cgtcaatcca gcttctaaat tttgtcctga ttactaagat ategattegt 1740 agtgtttaca tctgtgtaat ttcttgcttg attgtgaaat taggattttc aaggacgatc 1800 tattcaattt ttgtgttttc tttgttcgat tctctctgtt ttaggtttct tatgtttaga 1860 tccgtttctc tttggtgttg ttttgatttc tcttacggct tttgatttgg tatatgttcg 1920 ctgattggtt tctacttgtt ctattgtttt atttcaggtg gatccaccat gaacaagccg 1980 atcaagaata tcgtcatcgt gggcggcggt actgcgggct ggatggccgc ctcgtacctc 2040 gtccgggccc tccaacagca ggcgaacatt acgctcatcg aatctgcggc gatccctcgg 2100 atcggcgtgg gcgaagcgac catcccaagt ttgcagaagg tgttcttcga tttcctcggg 2160 ataccggagc gggaatggat gccccaagtg aacggcgcgt tcaaggccgc gatcaagtte 2220 gtgaattgga gaaagtctcc cgacccctcg cgcgacgatc acttctacca tttgttcggc 2280 aacgtgccga actgcgacgg cgtgccgctt acccactact ggctgcgcaa gcgcgaacag 2340 ggcttccagc agccgatgga gtacgcgtgc tacccgcagc ccggggcact cgacggcaag 2400 ctggcaccgt gcctgtccga cggcacccgc cagatgtccc acgcgtggca cttcgacgcg 2460 cacctggtgg ccgacttctt gaagcgctgg gccgtcgagc gcggggtgaa ccgcgtggtc 2520 gatgaggtgg tggacgttcg cctgaacaac cgcggctaca tctccaacct gctcaccaag 2580 gaggggcgga cgctggaggc ggacctgttc ategactget ccggcatgcg ggggctcctg 2640 atcaatcagg cgctgaagga acccttcatc gacatgtccg actacctgct gtgcgacagc 2700 gcggtcgcca gcgccgtgcc caacgacgac gcgcgcgatg gggtcgagcc gtacacctcc 2760 tcgatcgcca tgaactcggg atggacctgg aagattccga tgctgggccg gttcggcagc 2820 ggctacgtct tctcgagcca tttcacctcg cgcgaccagg ccaccgccga cttcctcaaa 2880 ctctggggcc tctcggacaa tcagccgctc aaccagatca agttccgggt cgggcgcaac 2940 aagcgggcgt gggtcaacaa ctgcgtctcg atcgggctgt cgtcgtgctt tctggagccc 3000 ctggaatcga cggggatcta cttcatctac gcggcgcttt accagctcgt gaageaette 3060 cccgacacct cgttcgaccc gcggctgagc gacgctttca acgccgagat cgtccacatg 3120 ?-|á .-i- -e-f-- ^^l* ---^^ ttcgacgact gccgggattt cgtccaagcg cactatttca ccacgtcgcg cgatgacacg 3180 ccgttctggc tcgcgaaccg gcacgacctg cggctctcgg acgccatcaa agagaaggtt 3240 cagcgctaca aggcggggct gccgctgacc accacgtcgt tegaegatte cacgtactac 3300 gagacetteg actaegaatt caagaattte tggttgaacg gcaactacta ctgcatcttt 3360 gccggcttgg gcatgctgcc cgaccggtcg ctgccgctgt tgcagcaccg accggagtcg 3420 atcgagaaag ccgaggcgat gttcgccagc atccggcgcg aggccgagcg tctgcgcacc 3480 agcctgccga caaactaega ctacctgcgg tcgctgcgtg acggcgacgc ggggctgtcg 3S40 cgcggccagc gtgggccgaa gctcgcagcg caggaaagcc tgtagtggaa cgcaccttgg 3600 aggatccccc gaatttcccc gatcgttcaa acatttggca ataaagtttc ttaagattga 3660 atcctgttgc cggtcttgcg atgattatca tctaatttct gttgaattac gttaagcatg 3720 taataattaa catgtaatgc atgacgttat ttatgagatg ggtttttatg attagagtcc 3780 cgcaattata catttaatac gcgatagaaa acaaaatata gcgcgcaaac taggataaat 3840 tatcgcgcgc ggtgtcatct atgttactag atccgggaat tgggtaccgg atttggagcc 3900 aagtctcata aacgccattg tggaagaaag tcttgagttg gtggtaatgt aacagagtag 3960 taagaacaga gaagagagag agtgtgagat acatgaattg tcgggcaaca aaaatcctga 4020 acatettatt ttagcaaaga gaaagagttc cgagtctgta gcagaagagt gaggagaaat 4080 ttaagctctt ggacttgtga attgttccgc ctcttgaata cttcttcaat cetcatatat 4140 tettetteta tgttacctga aaaccggcat ttaatetege gggtttattc cggttcaaca 4200 ttttttttgt tttgagttat tatctgggct taataaegea ggcctgaaat aaattcaagg 4260 cccaactgtt ttttttttta agaagttgct gttaaaaaaa aaaaaaggga attaacaaca 4320 acaacaaaaa aagataaaga aaataataac aattacttta attgtagact aaaaaaacat 4380 agattttatc atgaaaaaaa gagaaaagaa ataaaaactt ggatcaaaaa aaaaaacata 4440 cagatettet aattattaac ttttcttaaa aattaggtcc tttttcccaa caattaggtt 4500 tagagttttg gaattaaacc aaaaagattg ttctaaaaaa tactcaaatt tggtagataa 4560 gtttccttat tttaattagt caatggtaga tacttttttt tcttttcttt attagagtag 4620 attagaatct tttatgecaa gttttgataa attaaatcaa gaagataaac tatcataatc 4680 aacatgaaat taaaagaaaa atetcatata tagtattagt attetetata tatattatga 4740 ttgettatte ttaatgggtt gggttaacca agacatagtc ttaatggaaa gaatcttttt 4800 tgaaettttt ccttattgat taaattcttc tatagaaaag aaagaaatta tttgaggaaa 4860 agtatataca aaaagaaaaa tagaaaaatg tcagtgaagc agatgtaatg gatgacctaa 4920 tccaaccacc accataggat gtttctactt gagtcggtct tttaaaaacg cacggtggaa 4980 aatatgacac gtatcatatg attccttcct ttagtttcgt gataataatc ctcaactgat 5040 atetteettt ttttgttttg gctaaagata ttttattctc attaatagaa aagacggttt 5100 tgggcttttg gtttgcgata taaagaagac cttcgtgtgg aagataataa ttcatccttt 5160 cgtctttttc tgactettea atctctccca aagcctaaag cgatctctgc aaatctctcg 5220 cgactctctc tttcaaggta tattttctga ttctttttgt ttttgattcg tatctgatct 5280 ccaatttttg ttatgtggat tattgaatct tttgtataaa ttgcttttga caatattgtt 5340 cgtttcgtca atccagcttc taaattttgt cctgattact aagatatega ttcgtagtgt 5400 ttacatctgt gtaatttctt gcttgattgt gaaattagga ttttcaagga egatetatte 5460 aatttttgtg ttttctttgt tegattetet ctgttttagg tttcttatgt ttagatccgt 5520 ttctctttgg tgttgttttg atttctctta cggcttttga tttggtatat gttcgctgat 5580 tggtttctac ttgttctatt gttttatttc aggtggatcc accatgactc agaagagece 5640 cgcgaacgaa caegatagea ateaettega cgtaatcatc ctcggctcgg gcatgtccgg 5700 cacccagatg ggggccatct tggccaaaca acagtttcgc gtgctgatca tcgaggagtc 5760 gtcgcacccg cggttcacga tcggcgaatc gtcgatcccc gagacgtctc ttatgaaccg 5820 catcatcgct gategetaeg gcattccgga gctcgaccac atcacgtcgt tttattcgac 5880 gcaacgttac gtcgcgtcga gcacgggcat taagcgcaac ttcggcttcg tgttccacaa 5940 gcccggccag gagcacgacc cgaaggagtt cacccagtgc gtcattcccg agctgccgtg 6000 ggggccggag agecattatt accggcaaga cgtcgacgcc tacttgttgc aagccgccat 6060 taaatacggc tgcaaggtcc accagaaaac taccgtgacc gaataccacg cegataaaga 6120 cggcgtcgcg gtgaccaccg cccagggcga acggttcacc ggccggtaca tgatcgactg 6180 cggaggacct cgcgcgccgc tcgcgaccaa gttcaagctc cgcgaagaac cgtgtcgctt 6240 caagacgcac tcgcgcagcc tctacacgca catgctcggg gtcaagccgt tegaegacat 6300 cttcaaggtc aaggggcagc gctggcgctg gcacgagggg accttgcacc acatgttcga 6360 l--i<i'«-..-i ? * s-La- L? ».---.. *t»*i ?*Mt*¡.*i¿*?a¡ t?i----.. gggcggctgg ctctgggtga ttccgttcaa caaccacccg cggtcgacca acaacctggt 6420 gagcgtcggc ctgcagctcg acccgcgtgt ctacccgaaa accgacatct ccgcacagca 6480 ggaattcgat gagttcctcg cgcggttccc gagcatcggg gctcagttcc gggacgccgt 6540 gccggtgcgc gactgggtca agaccgaccg cctgcaattc tcgtcgaacg cctgcgtcgg 6600 cgaccgctac tgcctgatgc tgcacgcgaa cggcttcatc gacccgctct tctcccgggg 6660 gctggaaaac accgcggtga ccatccacgc gctcgcggcg cgcctcatca aggcgctgcg 6720 cgacgacgac ttctcccccg agcgcttcga gtacatcgag cgcctgcagc aaaagctttt 6780 ggaccacaac gacgacttcg tcagctgctg ctacacggcg ttctcggact tccgcctatg 6840 ggacgcgttc cacaggctgt gggcggtcgg caccatcctc gggcagttcc ggctcgtgca 6900 ggcccacgcg aggttccgcg cgtcgcgcaa cgagggcgac ctcgatcacc tcgacaacga 6960 ccctccgtat ctcggatacc tgtgcgcgga catggaggag tactaccagt tgttcaacga 7020 cgccaaagcc gaggtcgagg ccgtgagtgc cgggcgcaag ccggccgatg aggccgcggc 7080 gcggattcac gccctcattg acgaacgaga cttcgccaag ccgatgttcg gcttcgggta 7140 ctgcatcacc ggggacaagc cgcagctcaa caactcgaag tacagcctgc tgccggcgat 7200 gcggctgatg tactggacgc aaacccgcgc gccggcagag gtgaaaaagt acttcgacta 7260 caacccgatg ttcgcgctgc tcaaggcgta catcacgacc cgcatcggcc tggcgctgaa 7320 gaagtagccg ctcgagggat cccccgaatt tccccgatcg ttcaaacatt tggcaataaa 7380 gtttcttaag attgaatcct gttgccggtc ttgcgatgat tatcatctaa tttctgttga 7440 attacgttaa gcatgtaata attaacatgt aatgcatgac gttatttatg agatgggttt 7500 ttatgattag agtcccgcaa ttatacattt aatacgcgat agaaaacaaa atatagcgcg 7560 caaactagga taaattatcg cgcgcggtgt catctatgtt actagatccg ggaattagcg 7620 gccgcctcga ggtaccggat ttggagccaa gtctcataaa cgccattgtg gaagaaagtc 7680 ttgagttggt ggtaatgtaa cagagtagta agaacagaga agagagagag tgtgagatac 7740 atgaattgtc gggcaacaaa aatcctgaac atcttatttt agcaaagaga aagagttccg 7800 agtctgtagc agaagagtga ggagaaattt aagctcttgg acttgtgaat tgttccgcct 7860 cttgaatact tcttcaatcc tcatatattc ttcttctatg ttacctgaaa accggcattt 7920 aatctcgcgg gtttattccg gttcaacatt ttttttgttt tgagttatta tctgggctta 7980 -lÜjJ-. -j^ki. ataaegeagg cctgaaataa attcaaggcc caactgtttt tttttttaag aagttgctgt 8040 taaaaaaaaa aaaagggaat taacaacaac aacaaaaaaa gataaagaaa ataataacaa 8100 ttactttaat tgtagactaa aaaaacatag attttatcat gaaaaaaaga gaaaagaaat 8160 aaaaacttgg atcaaaaaaa aaaacataca gatettetaa ttattaactt ttcttaaaaa 8220 ttaggtcctt tttcccaaca attaggttta gagttttgga attaaaccaa aaagattgtt 8280 ctaaaaaata ctcaaatttg gtagataagt ttccttattt taattagtca atggtagata 8340 cttttttttc ttttctttat tagagtagat tagaatettt tatgecaagt tttgataaat 8400 taaatcaaga agataaacta tcataatcaa catgaaatta aaagaaaaat etcatatata 8460 gtattagtat tetetatata tattatgatt gcttattctt aatgggttgg gttaaccaag 8520 acatagtctt aatggaaaga atcttttttg aactttttcc ttattgatta aattetteta 8580 tagaaaagaa agaaattatt tgaggaaaag tatatacaaa aagaaaaata gaaaaatgtc 8640 agtgaagcag atgtaatgga tgaectaate caaccaccac cataggatgt ttctacttga 8700 gtcggtcttt taaaaacgca cggtggaaaa tatgacacgt atcatatgat tccttccttt 8760 agtttcgtga taataatcct caactgatat cttccttttt ttgttttggc taaagatatt 8820 ttattetcat taatagaaaa gacggttttg ggcttttggt ttgcgatata aagaagacct 8880 tcgtgtggaa gataataatt catcctttcg tctttttctg actcttcaat ctctcccaaa 8940 gcctaaagcg atctctgcaa atctctcgcg actctctctt tcaaggtata ttttctgatt 9000 ctttttgttt ttgattcgta tctgatctcc aatttttgtt atgtggatta ttgaatcttt 9060 tgtataaatt gcttttgaca atattgttcg tttcgtcaat ccagcttcta aattttgtcc 9120 tgattactaa gatategatt cgtagtgttt acatctgtgt aatttcttgc ttgattgtga 9180 aattaggatt ttcaaggacg atetattcaa tttttgtgtt ttctttgttc gattetetet 9240 gttttaggtt tcttatgttt agatccgttt ctctttggtg ttgttttgat ttctcttacg 9300 gcttttgatt tggtatatgt tcgctgattg gtttctactt gttctattgt tttatttcag 9360 gtggatccac catggaacgc accttggacc gggtaggcgt attcgcggcc acccacgctg 9420 ccgtggcggc ctgcgatccg ctgcaggcgc gcgcgctcgt tctgcaactg ccgggcctga 9480 accgtaacaa ggacgtgccc ggtatcgtcg gcctgctgcg cgagttcctt ccggtgcgcg 9540 gcctgccctg cggctggggt ttcgtcgaag ccgccgccgc gatgcgggac atcgggttct 9600 tcctggggtc gctcaagcgc cacggacatg agcccgcgga ggtggtgccc gggcttgagc 9660 cggtgctgct cgacctggca cgcgcgacca acctgccgcc gcgcgagacg ctcctgcatg 9720 tgacggtctg gaaccccacg gcggccgacg cgcagcgcag ctacaccggg ctgcccgacg 9780 aagcgcacct gctcgagagc gtgcgcatct cgatggcggc cctcgaggcg gccatcgcgt 9840 tgaccgtcga gctgttcgat gtgtccctgc ggtcgcccga gttcgcgcaa aggtgcgacg 9900 agctggaagc ctatctgcag aaaatggtcg aatcgatcgt ctacgcgtac cgcttcatct 9960 cgccgcaggt cttctacgat gagctgcgcc ccttctacga accgattcga gtcgggggcc 10020 agagctacct cggccccggt gccgtagaga tgcccctctt cgtgctggag cacgtcctct 10080 ggggctcgca atcggacgac caaacttatc gagaattcaa agagacgtac ctgccctatg 10140 tgcttcccgc gtacagggcg gtctacgctc ggttctccgg ggagccggcg ctcatcgacc 10200 gcgcgctcga cgaggcgcga gcggtcggta cgcgggacga gcacgtccgg gctgggctga 10260 cagccctcga gcgggtcttc aaggtcctgc tgcgcttccg ggcgcctcac ctcaaattgg 10320 cggagcgggc gtacgaagtc gggcaaagcg gccccgaaat cggcagcggg gggtacgcgc 10380 ccagcatgct cggtgagctg ctcacgctga cgtatgccgc gcggtcccgc gtccgcgccg 10440 cgctcgacga atcctgaagc ttggatcccc cgaatttccc cgatcgttca aacatttggc 10500 aataaagttt cttaagattg aatcctgttg ccggtcttgc gatgattatc atctaatttc 10560 tgttgaatta cgttaagcat gtaataatta acatgtaatg catgacgtta tttatgagat 10620 gggtttttat gattagagtc cegeaattat acatttaata cgcgatagaa aacaaaatat 10680 agcgcgcaaa ctaggataaa ttatcgcgcg cggtgtcatc tatgttacta gatccgggaa 10740 ttgggtaccg gatttggagc caagtetcat aaaegecatt gtggaagaaa gtcttgagtt 10800 ggtggtaatg taacagagta gtaagaacag agaagagaga gagtgtgaga tacatgaatt 10860 gtcgggcaac aaaaatcctg aacatettat tttagcaaag agaaagagtt ccgagtctgt 10920 ageagaagag tgaggagaaa tttaagctct tggacttgtg aattgttccg cctcttgaat 10980 acttcttcaa teetcatata ttcttcttct atgttacctg aaaaccggca tttaatctcg 11040 cgggtttatt ccggttcaac attttttttg ttttgagtta ttatctgggc ttaataaege 11100 aggcctgaaa taaattcaag gcccaactgt tttttttttt aagaagttgc tgttaaaaaa 11160 aaaaaaaggg aattaacaac aacaacaaaa aaagataaag aaaataataa caattaettt 11220 ¿-¿-L-fei^íA-i-*»-!-------^-.» aattgtagac taaaaaaaca tagattttat catgaaaaaa agagaaaaga aataaaaact 11280 tggatcaaaa aaaaaaacat acagatette taattattaa cttttcttaa aaattaggtc 11340 ctttttccca acaattaggt ttagagtttt ggaattaaac caaaaagatt gttctaaaaa 11400 atactcaaat ttggtagata agttteetta ttttaattag tcaatggtag atactttttt 11460 ttcttttctt tattagagta gattagaatc ttttatgcca agttttgata aattaaatca 11520 agaagataaa ctatcataat caacatgaaa ttaaaagaaa aatetcatat atagtattag 11580 tattetetat atatattatg attgcttatt cttaatgggt tgggttaacc aagacatagt 11640 cttaatggaa agaatctttt ttgaactttt tccttattga ttaaattctt ctatagaaaa 11700 gaaagaaatt atttgaggaa aagtatatac aaaaagaaaa atagaaaaat gtcagtgaag 11760 cagatgtaat ggatgaccta atccaaccac caccatagga tgtttctact tgagtcggtc 11820 ttttaaaaac gcacggtgga aaatatgaca cgtatcatat gattccttcc tttagtttcg 11880 tgataataat cctcaactga tatetteett tttttgtttt ggctaaagat attttattct 11940 cattaataga aaagacggtt ttgggctttt ggtttgcgat ataaagaaga ccttcgtgtg 12000 gaagataata attcatcctt tcgtcttttt ctgactcttc aatctctccc aaagcctaaa 12060 gcgatctctg caaatctctc gcgactctct ctttcaaggt atattttctg attctttttg 12120 tttttgattc gtatctgatc tccaattttt gttatgtgga ttattgaatc ttttgtataa 12180 attgcttttg acaatattgt tcgtttcgtc aatccagctt ctaaattttg tcctgattac 12240 taagatatcg attcgtagtg tttacatctg tgtaatttct tgcttgattg tgaaattagg 12300 attttcaagg aegatetatt caatttttgt gttttctttg ttegattetc tctgttttag 12360 gtttcttatg tttagatccg tttctctttg gtgttgtttt gatttctctt acggcttttg 12420 atttggtata tgttcgctga ttggtttcta cttgttctat tgttttattt caggtggatc 12480 caccatgaac gacattcaat tggatcaagc gagcgtcaag aagcgtccct cgggcgcgta 12540 cgacgcaacc acgcgcctgg ccgcgagctg gtacgtcgcg atgcgctcca aegagetcaa 12600 ggacaagccg accgagttga cgctcttcgg ccgtccgtgc gtggcgtggc gcggagccac 12660 ggggcgggcc gtggtgatgg accgccactg ctcgcacctg ggcgcgaacc tggctgacgg 12720 gcggatcaag gacgggtgca tccagtgccc gtttcaccac tggcggtacg acgaacaggg 12780 ccagtgcgtt cacatccccg gccataacca ggcggtgcgc cagctggagc cggtgccgcg 12840 cggggcgcgt cagccgacgt tggtcaccgc cgagcgatac ggctacgtgt gggtctggta 12900 cggctccccg ctgccgctgc acccgctgcc cgaaatctcc gcggccgatg tcgacaacgg 12960 cgactttatg cacctgcact tcgcgttcga gacgaccacg gcggtcttgc ggatcgtcga 13020 gaacttctac gacgcgcagc acgcaacccc ggtgcacgca ctcccgatct cggccttcga 13080 actcaagctc ttcgacgatt ggcgccagtg gccggaggtt gagtcgctgg ccctggcggg 13140 cgcgtggttc ggtgccggga tcgacttcac cgtggaccgg tacttcggcc ccctcggcat 13200 gctgtcacgc gcgctcggcc tgaacatgtc gcagatgaac ctgcacttcg atggctaccc 13260 cggcgggtgc gtcatgaccg tcgccctgga cggagacgtc aaatacaagc tgctccagtg 13320 tgtgacgccg gtgagcgaag gcaagaacgt catgcacatg ctcatctcga tcaagaaggt 13380 gggcggcatc ctgctccgcg cgaccgactt cgtgctgttc gggctgcaga ccaggcaggc 13440 cgcggggtac gacgtcaaaa tctggaacgg aatgaagccg gacggcggcg gcgcgtacag 13500 caagtacgac aagctcgtgc tcaagtaccg ggcgttctat cgaggctggg tcgaccgcgt 13560 cgcaagtgag cggtgaagct tggatccccc gaatttcccc gatcgttcaa acatttggca 13620 ataaagtttc ttaagattga atcctgttgc cggtcttgcg atgattatca tctaatttct 13680 gttgaattac gttaagcatg taataattaa catgtaatgc atgacgttat ttatgagatg 13740 ggtttttatg attagagtcc cgcaattata catttaatac gcgatagaaa acaaaatata 13800 gcgcgcaaac taggataaat tatcgcgcgc ggtgtcatct atgttactag atccgggaat 13860 tccggaccgc gctctagtgc gatcgctttt ttaattaatt ttaagctttc tagaggccgg 13920 ccgcggccgc ctcgaggtac catcaggata ttcttgctta agatgttgaa ctctatggag 13980 gtttgtatga actgatgatc taggaccgga taagttccct tcttcatagc gaacttattc 14040 aaagaatgtt ttgtgtatca ttcttgttac attgttatta atgaaaaaat attattggtc 14100 attggactga acacgagtgt taaatatgga ccaggcccca aataagatcc attgatatat 14160 gaattaaata acaagaataa atcgagtcac caaaccactt gcctttttta acgagacttg 14220 ttcaccaact tgatacaaaa gtcattatcc tatgcaaatc aataatcata caaaaatatc 14280 caataacact aaaaaattaa aagaaatgga taatttcaca atatgttata cgataaagaa 14340 gttacttttc caagaaattc actgatttta taagcccact tgcattagat aaatggcaaa 14400 aaaaaacaaa aaggaaaaga aataaagcac gaagaattct agaaaatacg aaatacgctt 14460 caatgcagtg ggacccacgg ttcaattatt gccaattttc agctccaccg tatatttaaa 14520 aaataaaacg ataatgctaa aaaaatataa atcgtaacga tcgttaaatc tcaacggctg 14580 gatcttatga cgaccgttag aaattgtggt tgtcgacgag tcagtaataa acggcgtcaa 14640 agtggttgca gccggcacac acgagtcgtg tttatcaact caaagcacaa atacttttcc 14700 tcaacctaaa aataaggcaa ttagccaaaa acaactttgc gtgtaaacaa cgctcaatac 14760 acgtgtcatt ttattattag ctattgcttc accgccttag ctttctcgtg acctagtcgt 14820 cctcgtcttt tcttccttct tcttctataa aacaataccc aaagagctct tcttcttcac 14880 aattcagatt tcaatttctc aaaatcttaa aaactttctc tcaattctct ctaccgtgat 14940 cggaaccatg acaaccttaa gctgtaaagt gacctcggta gaagctatca cggataccgt 15000 atatcgtgtc cgcatcgtgc cagacgcggc cttttctttt cgtgctggtc agtatttgat 15060 ggtagtgatg gatgagcgcg acaaacgtcc gttctcaatg gcttcgacgc cggatgaaaa 15120 agggtttatc gagctgcata ttggcgcttc tgaaatcaac ctttacgcga aagcagtcat 15180 ggaccgcatc ctcaaagatc atcaaatcgt ggtcgacatt ccccacggag aagcgtggct 15240 gcgcgatgat gaagagcgtc cgatgatttt gattgcgggc ggcaccgggt tctcttatgc 15300 ccgctcgatt ttgctgacag cgttggcgcg taacccaaac cgtgatatca ccatttactg 15360 gggcgggcgt gaagagcagc atctgtatga tctctgcgag cttgaggcgc tttcgttgaa 15420 gcatcctggt ctgcaagtgg tgccggtggt tgaacaaccg gaagcgggct ggcgtgggcg 15480 tactggcacc gtgttaacgg cggtattgca ggatcacggt acgctggcag agcatgatat 15540 ctatattgcc ggacgttttg agatggcgaa aattgcccgc gatctgtttt gcagtgagcg 15600 taatgcgcgg gaagatcgcc tgtttggcga tgcgtttgca tttatctgag gatcccccga 15660 atttccccga tcgttcaaac atttggcaat aaagtttctt aagattgaat cctgttgccg 15720 gtcttgcgat gattatcatc taatttctgt tgaattacgt taagcatgta ataattaaca 15780 tgtaatgcat gacgttattt atgagatggg tttttatgat tagagtcccg caattataca 15840 tttaatacgc gatagaaaac aaaatatagc gcgcaaacta ggataaatta tcgcgcgcgg 15900 tgtcatctat gttactagat ccgggaatta gcggccgcct cgaggtaccg gatttggagc 15960 caagtctcat aaacgccatt gtggaagaaa gtcttgagtt ggtggtaatg taacagagta 16020 gtaagaacag agaagagaga gagtgtgaga tacatgaatt gtcgggcaac aaaaatcctg 16080 l??ÁíllÁLátá? ^t aacatcttat tttagcaaag agaaagagtt ccgagtctgt agcagaagag tgaggagaaa 16140 tttaagctct tggacttgtg aattgttccg cctcttgaat acttcttcaa tcctcatata 16200 ttcttcttct atgttacctg aaaaccggca tttaatctcg cgggtttatt ccggttcaac 16260 attttttttg ttttgagtta ttatctgggc ttaataaege aggcctgaaa taaattcaag 16320 gcccaactgt tttttttttt aagaagttgc tgttaaaaaa aaaaaaaggg aattaacaac 16380 5 aacaacaaaa aaagataaag aaaataataa caattaettt aattgtagac taaaaaaaca 16440 tagattttat catgaaaaaa agagaaaaga aataaaaact tggatcaaaa aaaaaaacat 16500 acagatette taattattaa cttttcttaa aaattaggtc ctttttccca acaattaggt 16560 ttagagtttt ggaattaaac caaaaagatt gttctaaaaa atactcaaat ttggtagata 16620 agttteetta ttttaattag tcaatggtag atactttttt ttcttttctt tattagagta 16680 gattagaatc ttttatgcca agttttgata aattaaatca agaagataaa ctatcataat 16740 0 caacatgaaa ttaaaagaaa aatetcatat atagtattag tattetetat atatattatg 16800 attgcttatt cttaatgggt tgggttaacc aagacatagt cttaatggaa agaatctttt 16860 ttgaactttt tccttattga ttaaattctt ctatagaaaa gaaagaaatt atttgaggaa 16920 aagtatatac aaaaagaaaa atagaaaaat gtcagtgaag cagatgtaat ggatgaccta 16980 atccaaccac caccatagga tgtttctact tgagtcggtc ttttaaaaac gcacggtgga 17040 aaatatgaca cgtatcatat gattccttcc tttagtttcg tgataataat cctcaactga 17100 [_ tatetteett tttttgtttt ggctaaagat attttattct cattaataga aaagacggtt 17160 ttgggctttt ggtttgcgat ataaagaaga ccttcgtgtg gaagataata attcatcctt 17220 tcgtcttttt ctgactcttc aatctctccc aaagcctaaa gcgatctctg caaatctctc 17280 gcgactctct ctttcaaggt atattttctg attctttttg tttttgattc gtatctgatc 17340 tccaattttt gttatgtgga ttattgaatc ttttgtataa attgcttttg acaatattgt 17400 tcgtttcgtc aatccagctt ctaaattttg tcctgattac taagatatcg attcgtagtg 17460 ?0 tttacatctg tgtaatttct tgcttgattg tgaaattagg attttcaagg aegatetatt 17520 caatttttgt gttttctttg ttegattetc tctgttttag gtttcttatg tttagatccg 17580 tttctctttg gtgttgtttt gatttctctt acggcttttg atttggtata tgttcgctga 17640 ttggtttcta cttgttctat tgttttattt caggtggatc tgttggggat ctaccatgag 17700 cccagaacga cgcccggccg acatccgccg tgccaccgag gcggacatgc cggcggtctg 17760 caccatcgtc aaccactaca tcgagacaag cacggtcaac ttccgtaccg agccgcagga 17820 accgcaggag tggacggacg acctcgtccg tctgcgggag cgctatccct ggctcgtcgc 17880 cgaggtggac ggcgaggtcg ccggcatcgc ctacgcgggc ccctggaagg cacgcaacgc 17940 ctacgactgg acggccgagt cgaccgtgta cgtctccccc cgccaccagc ggacgggact 18000 gggctccacg ctctacaccc acctgctgaa gtccctggag gcacagggct tcaagagcgt 18060 ggtcgctgtc atcgggctgc ccaacgaccc gagcgtgcgc atgcacgagg cgctcggata 18120 tgccccccgc ggcatgctgc gggcggccgg cttcaagcac gggaactggc atgacgtggg 18180 tttctggcag ctggacttca gcctgccggt accgccccgt ccggtcctgc ccgtcaccga 18240 gatcccccga atttccccga tcgttcaaac atttggcaat aaagtttctt aagattgaat 18300 cctgttgccg gtcttgcgat gattatcatc taatttctgt tgaattacgt taagcatgta 18360 ataattaaca tgtaatgcat gacgttattt atgagatggg tttttatgat tagagtcccg 18420 caattataca tttaatacgc gatagaaaac aaaatatagc gcgcaaacta ggataaatta 18480 tcgcgcgcgg tgtcatctat gttactagat ccgggaattg ggtacccaat tccggaccgc 18540 tgctctagag gcgcgcccct agggagcttc tgcagacgcg tcgacgtcat atggatccga 18600 tctgttgccc gtctcactgg tgaaaagaaa aaccacccca gtacattaaa aacgtccgca 18660 atgtgttatt aagttgtcta agcgtcaatt tgtttacacc acaatatatc ctgccaccag 18720 ccagccaaca gctccccgac cggcagctcg gcacaaaatc accactcgat acaggcagcc 18780 catcagtccg ggacggtcga cctgcaggca tgcaagctca cgtagtgtac gtaatcgatt 18840 tcgaagggcc ccctagtcca tgggcttttt ctcctcgtgc tcgtaaacgg acccgaacat 18900 ctctggagct ttcttcaggg ccgacaatcg gatctcgcgg aaatcctgca cgtcggccgc 18960 tccaagccgt cgaatctgag ccttaatcac aattgtcaat tttaatcctc tgtttatcgg 19020 cagttcgtag agcgcgccgt gcgtcccgag cgatactgag cgaagcaagt gcgtcgagca 19080 gtgcccgctt gttcctgaaa tgccagtaaa gcgctggctg ctgaaccccc agccggaact 19140 gaccccacaa ggccctagcg tttgcaatgc accaggtcat cattgaccca ggcgtgttcc 19200 accaggccgc tgcctcgcaa ctcttcgcag gcttcgccga cctgctcgcg ccacttcttc 19260 acgcgggtgg aatccgatcc gcacatgagg cggaaggttt ccagcttgag cgggtacggc 19320 MA?¿AÍMJ2AAM. i?s -i....A^áj^^afe^^ tc<3?ggtgcg agctgaaata gtcgaacatc cgtcgggccg tcggcgacag cttgcggtac 19380 ttctcccata tgaatttcgt gtagtggtcg ccagcaaaca gcacgacgat ttcctcgtcg 19440 atcaggacct ggcaacggga cgttttcttg ccacggtcca ggacgcggaa gcggtgcagc 19500 agcgacaccg attccaggtg cccaacgcgg tcggacgtga agcccatcgc cgtcgcctgt 19560 aggcgcgaca ggcattcctc ggccttcgtg taataccggc cattgatcga ccagcccagg 19620 tcctggcaaa gctcgtagaa cgtgaaggtg atcggctcgc cgataggggt gcgcttcgcg 19680 tactccaaca cctgctgcca caccagttcg tcatcgtcgg cccgcagctc gacgccggtg 19740 taggtgatct tcacgtcctt gttgacgtgg aaaatgacct tgttttgcag cgcctcgcgc 19800 gggattttct tgttgcgcgt ggtgaacagg gcagagcggg ccgtgtcgtt tggcatcgct 19860 cgcatcgtgt ccggccacgg cgcaatatcg aacaaggaaa gctgcatttc cttgatctgc 19920 tgcttcgtgt gtttcagcaa cgcggcctgc ttggcctcgc tgacctgttt tgccaggtcc 19980 tcgccggcgg tttttcgctt cttggtcgtc atagttcctc gcgtgtcgat ggtcatcgac 20040 ttcgccaaac ctgccgcctc ctgttcgaga cgacgcgaac gctccacggc ggccgatggc 20100 gcgggcaggg cagggggagc cagttgcacg ctgtcgcgct cgatcttggc cgtagcttgc 20160 tggaccatcg agccgacgga ctggaaggtt tcgcggggcg cacgcatgac ggtgcggctt 20220 gcgatggttt cggcatcctc ggcggaaaac cccgcgtcga tcagttcttg cctgtatgcc 20280 ttccggtcaa acgtccgatt cattcaccct ccttgcggga ttgccccgac tcacgccggg 20340 gcaatgtgcc cttattcctg atttgacccg cctggtgcct tggtgtccag ataatccacc 20400 ttatcggcaa tgaagtcggt cccgtagacc gtctggccgt ccttctcgta cttggtattc 20460 cgaatcttgc cctgcacgaa taccagcgac cccttgccca aatacttgcc gtgggcctcg 20520 gcctgagagc caaaacactt gatgcggaag aagtcggtgc gctcctgctt gtcgccggca 20580 tcgttgcgcc acatctaggt actaaaacaa ttcatccagt aaaatataat attttatttt 20640 ctcccaatca ggcttgatcc ccagtaagtc aaaaaatagc tcgacatact gttcttcccc 20700 gatatcctcc ctgatcgacc ggacgcagaa ggcaatgtca taccacttgt ccgccctgcc 20760 gcttctccca agatcaataa agccacttac tttgccatct ttcacaaaga tgttgctgtc 20820 tcccaggtcg ccgtgggaaa agacaagttc ctcttcgggc ttttccgtct ttaaaaaatc 20880 atacagctcg cgcggatctt taaatggagt gtcttcttcc cagttttcgc aatccacatc 20940 *fc ¿ll>to"^áll>*h^> ÍLIÍAMJV— —J**-*..--.-A| ggccagatcg ttattcagta agtaatccaa ttcggctaag cggctgtcta agctattcgt 21000 atagggacaa tccgatatgt cgatggagtg aaagagcctg atgcactccg catacagctc 21060 gataatcttt tcagggcttt gttcatcttc atactcttcc gagcaaagga cgccatcggc 21120 ctcactcatg agcagattgc tccagccatc atgccgttca aagtgcagga cctttggaac 21180 aggcagcttt ccttccagcc atagcatcat gtccttttcc cgttccacat cataggtggt 21240 ccctttatac cggctgtccg tcatttttaa atataggttt tcattttctc ccaccagctt 21300 atatacctta gcaggagaca ttccttccgt atcttttacg cagcggtatt tttcgatcag 21360 ttttttcaat tccggtgata ttctcatttt agccatttat tatttccttc ctcttttcta 21420 cagtatttaa agatacccca agaagctaat tataacaaga cgaactccaa ttcactgttc 21480 cttgcattct aaaaccttaa ataccagaaa acagcttttt caaagttgtt ttcaaagttg 21540 gcgtataaca tagtatcgac ggagccgatt ttgaaaccac aattatgggt gatgctgcca 21600 acttactgat ttagtgtatg atggtgtttt tgaggtgctc cagtggcttc tgtgtctatc 21660 agctgtccct cctgttcagc tactgacggg gtggtgcgta acggcaaaag caccgccgga 21720 catcagcgct atctctgctc tcactgccgt aaaacatggc aactgcagtt cacttacacc 21780 gcttctcaac ccggtacgca ccagaaaatc attgatatgg ccatgaatgg cgttggatgc 21840 cgggcaacag cccgcattat gggcgttggc ctcaacacga ttttacgtca cttaaaaaac 21900 tcaggccgca gtcggtaacc tcgcgcatac agccgggcag tgacgtcatc gtctgcgcgg 21960 aaatggacga acagtggggc tatgtcgggg ctaaatcgcg ccagcgctgg ctgttttacg 22020 cgtatgacag tctccggaag acggttgttg cgcacgtatt cggtgaacgc actatggcga 22080 cgctggggcg tcttatgagc ctgctgtcac cctttgacgt ggtgatatgg atgacggatg 22140 gctggccgct gtatgaatcc cgcctgaagg gaaagctgca cgtaatcagc aagcgatata 22200 cgcagcgaat tgagcggcat aacctgaatc tgaggcagca cctggcacgg ctgggacgga 22260 agtcgctgtc gttctcaaaa tcggtggagc tgcatgacaa agtcatcggg cattatctga 22320 acataaaaca ctatcaataa gttggagtca ttacccaatt atgatagaat ttacaagcta 22380 taaggttatt gtcctgggtt tcaagcatta gtccatgcaa gtttttatgc tttgcccatt 22440 ctatagatat attgataagc gcgctgccta tgccttgccc cctgaaatcc ttacatacgg 22500 cgatatcttc tatataaaag atatattatc ttatcagtat tgtcaatata ttcaaggcaa 22560 tctgcctcct catcctcttc atcctcttcg tcttggtagc tttttaaata tggcgcttca 22620 tagagtaatt ctgtaaaggt ccaattctcg ttttcatacc tcggtataat cttacctatc 22680 acctcaaatg gttcgctggg tttatcgcac ccccgaacac gagcacggca cccgcgacca 22740 ctatgccaag aatgcccaag gtaaaaattg ccggccccgc catgaagtcc gtgaatgccc 22800 cgacggccga agtgaagggc aggccgccac ccaggccgcc gccctcactg cccggcacct 22860 ggtcgctgaa tgtcgatgcc agcacctgcg gcacgtcaat gcttccgggc gtcgcgctcg 22920 ggctgatcgc ccatcccgtt actgccccga tcccggcaat ggcaaggact gccagcgctg 22980 ccatttttgg ggtgaggccg ttcgcggccg aggggcgcag cccctggggg gatgggaggc 23040 ccgcgttagc gggccgggag ggttcgagaa gggggggcac cccccttcgg cgtgcgcggt 23100 cacgcgcaca gggcgcagcc ctggttaaaa acaaggttta taaatattgg tttaaaagca 23160 ggttaaaaga caggttagcg gtggccgaaa aacgggcgga aacccttgca aatgctggat 23220 tttctgcctg tggacagccc ctcaaatgtc aataggtgcg cccctcatct gtcagcactc 23280 tgcccctcaa gtgtcaagga tcgcgcccct catctgtcag tagtcgcgcc cctcaagtgt 23340 caataccgca gggcacttat ccccaggctt gtccacatca tctgtgggaa actcgcgtaa 23400 aatcaggcgt tttcgccgat ttgcgaggct ggccagctcc acgtcgccgg ccgaaatcga 23460 gcctgcccct catctgtcaa cgccgcgccg ggtgagtcgg cccctcaagt gtcaacgtcc 23520 gcccctcatc tgtcagtgag ggccaagttt tccgcgaggt atccacaacg ccggcggccg 23580 cggtgtctcg cacacggctt cgacggcgtt tctggcgcgt ttgcagggcc atagacggcc 23640 gccagcccag cggcgagggc aaccagcccg gtgagcgtcg caaaggcgct cggtcttgcc 23700 ttgctcgtcg gtgatgtact tcaccagctc cgcgaagtcg ctcttcttga tggagcgcat 23760 ggggacgtgc ttggcaatca cgcgcacccc ccggccgttt tagcggctaa aaaagtcatg 23820 gctctgccct cgggcggacc acgcccatca tgaccttgcc aagctcgtcc tgcttctctt 23880 cgatcttcgc cagcagggcg aggatcgtgg catcaccgaa ccgcgccgtg cgcgggtcgt 23940 cggtgagcca gagtttcagc aggccgccca ggcggcccag gtcgccattg atgcgggcca 24000 gctcgcggac gtgctcatag tccacgacgc ccgtgatttt gtagccctgg ccgacggcca 24060 gcaggtaggc cgacaggctc atgccggccg ccgccgcctt ttcctcaatc gctcttcgtt 24120 cgtctggaag gcagtacacc ttgataggtg ggctgccctt cctggttggc ttggtttcat 24180 ss-- t í • ,«•**.-.- ^¿¡ji^j^^üj. cagccatccg cttgccctca tctgttacgc cggcggtagc cggccagcct cgcagagcag 24240 gattcccgtt gagcaccgcc aggtgcgaat aagggacagt gaagaaggaa cacccgctcg 24300 cgggtgggcc tacttcacct atcctgcccg gctgacgccg ttggatacac caaggaaagt 24360 ctacacgaac cctttggcaa aatcctgtat atcgtgcgaa aaaggatgga tataccgaaa 24420 aaatcgctat aatgaccccg aagcagggtt atgcagcgga aaagcgccac gcttcccgaa 24480 gggagaaagg cggacaggta tccggtaagc ggcagggtcg gaacaggaga gcgcacgagg 24540 gagcttccag ggggaaacgc ctggtatctt tatagtcctg tcgggtttcg ccacctctga 24600 cttgagcgtc gatttttgtg atgctcgtca ggggggcgga gcctatggaa aaacgccagc 24660 aacgcggcct ttttacggtt cctggccttt tgctggcctt ttgctcacat gttctttcct 24720 gcgttatccc ctgattctgt ggataaccgt attaccgcct ttgagtgagc tgataccgct 24780 cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga agagcgccag 24840 aaggccgcca gagaggccga gcgcggccgt gaggcttgga cgctagggca gggcatgaaa 24900 aagcccgtag cgggctgcta cgggcgtctg acgcggtgga aagggggagg ggatgttgtc 24960 tacatggctc tgctgtagtg agtgggttgc gctccggcag cggtcctgat caatcgtcac 25020 cctttctcgg tccttcaacg ttcctgacaa cgagcctcct tttcgccaat ccatcgacaa 25080 tcaccgcgag tccctgctcg aacgctgcgt ccggaccggc ttcgtcgaag gcgtctatcg 25140 cggcccgcaa cagcggcgag agcggagcct gttcaacggt gccgccgcgc tcgccggcat 25200 cgctgtcgcc ggcctgctcc tcaagcacgg ccccaacagt gaagtagctg attgtcatca 25260 gcgcattgac ggcgtccccg gccgaaaaac ccgcctcgca gaggaagcga agctgcgcgt 25320 cggccgtttc catctgcggt gcgcccggtc gcgtgccggc atggatgcgc gcgccatcgc 25380 ggtaggcgag cagcgcctgc ctgaagctgc gggcattccc gatcagaaat gagcgccagt 25440 cgtcgtcggc tctcggcacc gaatgcgtat gattctccgc cagcatggct tcggccagtg 25500 cgtcgagcag cgcccgcttg ttcctgaagt gccagtaaag cgccggctgc tgaaccccca 25560 accgttccgc cagtttgcgt gtcgtcagac cgtctacgcc gacctcgttc aacaggtcca 25620 gggcggcacg gatcactgta ttcggctgca actttgtcat gcttgacact ttatcactga 25680 taaacataat atgtccacca acttatcagt gataaagaat ccgcgcgttc aatcggacca 25740 gcggaggctg gtccggaggc cagacgtgaa acccaacata cccctgatcg taattctgag 25800 "*-"" ^^^At?^^^íS^,.^^^?eí^^MS1i?j^íA .,-,.--».&,-.. cactgtcgcg ctcgacgctg tcggcatcgg cctgattatg ccggtgctgc cgggcctcct 25860 gcgcgatctg gttcactcga acgacgtcac cgcccactat ggcattctgc tggcgctgta 25920 tgcgttggtg caatttgcct gcgcacctgt gctgggcgcg ctgtcggatc gtttcgggcg 25980 gcggccaatc ttgctcgtct cgctggccgg cgccagatc 26019 <210> 35 <211> 20119 <212> ADN <213> sintético <220> <221> promotor <222> (229) .. (1960) <220> <221> exon <222> (1962) .. (2160) <220> <221> misc_feature <222> (2160) .. (2228) <223> dominio de objetivo del plásmido <220> <221> gen <222> (2260) .. (3960) <223> PrnC <220> ^ <221> termmador <222> ( 3966 ) . . ( 4241 ) <220> <221> promotor <222> (4245) .. (5971) <220> <221> exon <222> (5984) .. (6182) <220> <221> m?sc_feature <222> (6183) .. (6251) <223> dominio de objetivo del plasmido <220> <221> gen <222> (6282) .. (7373) <223> prnD <220> <221> termmador <222> (7379) .. (7639) <220> <221> promotor <222> (7739) .. (8739) <220> <221> exon <222> (8745) .. (8943) <220> <221> m?sc_feature <222> (8944) .. (9012) <223> dominio de objetivo del plásmido <220> <221> gen <222> (9037) .. (9743) <223> fre <220> <221> terminador <222> (9755) .. (10036) <220> <221> promotor <222> (10049) .. (11385) <220> <221> Intron --?b--- --b..>i?.-i. ms ,i-?-.-ha--?--lfc----l-fatitaM> .,.- <222> (11383) .. (11779) <220> <221> gen <222> (11796) .. (12338) <220> <221> termmador <222> (12345) .. (12626) <400> 35 tggggaaccc tgtggttggc atgeacatac aaatggacga acggataaac cttttcacgc 60 ccttttaaat atcegattat tetaataaac gctcttttct ettaggttta cccgccaata 120 tatcctgtca aacactgata gtttaaactg aaggcgggaa acgacaatct gatetategt 180 tctagtcgta cgttttgcga tegeactaga gcggccgcct cgaggtaccg gatttggagc 240 caagtctcat aaaegecatt gtggaagaaa gtcttgagtt ggtggtaatg taacagagta 300 gtaagaacag agaagagaga gagtgtgaga tacatgaatt gtcgggcaac aaaaatcctg 360 aacatcttat tttagcaaag agaaagagtt ccgagtctgt agcagaagag tgaggagaaa 420 tttaagctct tggacttgtg aattgttccg cctcttgaat acttcttcaa tcctcatata 480 ttcttcttct atgttacctg aaaaccggca tttaatctcg cgggtttatt ccggttcaac 540 attttttttg ttttgagtta ttatctgggc ttaataaege aggcctgaaa taaattcaag 600 gcccaactgt tttttttttt aagaagttgc tgttaaaaaa aaaaaaaggg aattaacaac 660 aacaacaaaa aaagataaag aaaataataa caattaettt aattgtagac taaaaaaaca 720 tagattttat catgaaaaaa agagaaaaga aataaaaact tggatcaaaa aaaaaaacat 780 acagatette taattattaa cttttcttaa aaattaggtc ctttttccca acaattaggt 840 ttagagtttt ggaattaaac caaaaagatt gttctaaaaa atactcaaat ttggtagata 900 agttteetta ttttaattag tcaatggtag atactttttt ttcttttctt tattagagta 960 gattagaatc ttttatgcca agttttgata aattaaatca agaagataaa ctatcataat 1020 caacatgaaa ttaaaagaaa aatctcatat atagtattag tattctctat atatattatg 1080 attgcttatt cttaatgggt tgggttaacc aagacatagt cttaatggaa agaatctttt 1140 ttgaactttt tccttattga ttaaattctt ctatagaaaa gaaagaaatt atttgaggaa 1200 aagtatatac aaaaagaaaa atagaaaaat gtcagtgaag cagatgtaat ggatgaccta 1260 atccaaccac caccatagga tgtttctact tgagtcggtc ttttaaaaac gcacggtgga 1320 aaatatgaca cgtatcatat gattccttcc tttagtttcg tgataataat cctcaactga 1380 tatcttcctt tttttgtttt ggctaaagat attttattct cattaataga aaagacggtt 1440 ttgggctttt ggtttgcgat ataaagaaga ccttcgtgtg gaagataata attcatcctt 1500 tcgtcttttt ctgactcttc aatctctccc aaagcctaaa gcgatctctg caaatctctc 1560 gcgactctct ctttcaaggt atattttctg attctttttg tttttgattc gtatctgatc 1620 tccaattttt gttatgtgga ttattgaatc ttttgtataa attgcttttg acaatattgt 1680 tcgtttcgtc aatccagctt ctaaattttg tcctgattac taagatatcg attcgtagtg 1740 tttacatctg tgtaatttct tgcttgattg tgaaattagg attttcaagg aegatetatt 1800 caatttttgt gttttctttg ttcgattctc tctgttttag gtttcttatg tttagatccg 1860 tttctctttg gtgttgtttt gatttctctt acggcttttg atttggtata tgttcgctga 1920 ttggtttcta cttgttctat tgttttattt caggtggatc a gtc acá caá aga gta 1976 Val Thr Gln Arg Val 1 5 aag aag aac aat ggc ttc etc tat gct etc ttc cgc tac tat ggt tgc 2024 Lys Lys Asn Asn Gly Phe Leu Tyr Ala Leu Phe Arg Tyr Tyr Gly Cys 10 15 20 etc tec ggc tca ggc cae tat ggt cgc tec ttt caá cgg act taa gtc 2072 Leu Ser Gly Ser Gly His Tyr Gly Arg Ser Phe Gln Arg Thr Val 25 30 35 etc cgc tgc ctt ccc age cae ccg caá ggc taa caá cga cat tac ttc 2120 Leu Arg Cys Leu Pro Ser His Pro Gln Gly Gln Arg His Tyr Phe 40 45 50 cat cae aag caá cgg cgg aag agt taa ctg cat gca ggt g tggcctccga 2170 His His Lys Gln Arg Arg Lys Ser Leu His Ala Gly 55 60 ttggaaagaa gaagtttgag actctctctt accttcctga ccttaccgat tctgcaggag 2230 gtcgcgtcaa ctgcatgcag gctagcatga ctcagaagag ccccgcgaac gaacacgata 2290 gcaatcactt cgacgtaatc atcctcggct cgggcatgtc cggcacccag atgggggcca 2350 tcttggccaa acaacagttt cgcgtgctga tcatcgagga gtcgtcgcac ccgcggttca 2410 cgatcggcga atcgtcgatc cccgagacgt ctcttatgaa ccgcatcatc gctgatcgct 2470 acggcattcc ggagctcgac cacatcacgt cgttttattc gacgcaacgt tacgtcgcgt 2530 cgagcacggg cattaagcgc aacttcggct tcgtgttcca caagcccggc caggagcacg 2590 acccgaagga gttcacccag tgcgtcattc ccgagctgcc gtgggggccg gagagccatt 2650 attaccggca agacgtcgac gcctacttgt tgcaagccgc cattaaatac ggctgcaagg 2710 tccaccagaa aactaccgtg accgaatacc acaccgataa agacggcgtc gcggtgacca 2770 ccgcccaggg cgaacggttc accggccggt acatgatcga ctgcggagga cctcgcgcgc 2830 cgctcgcgac caagttcagg ctccgcgaag aaccgtgtcg cttcaagacg cactcgcgca 2890 gcctctacac gcacatgctc ggggtcaagc cgttcgacga catcttcaag gtcaaggggc 2950 agcgctggcg ctggcacgag gggaccttgc accacatgtt cgagggcggc tggctctggg 3010 tgattccgtt caacaaccac ccgcggtcga ccaacaacct ggtgagcgtc ggcctgcagc 3070 tcgacccgcg tgtctacccg aaaaccgaca tctccgcaca gcaggaattc gatgagttcc 3130 tcgcgcggtt cccgagcatc ggggctcagt tccgggacgc cgtgccggtg cgcgactggg 3190 tcaagaccga ccgcctgcaa ttctcgtcga acgcctgcgt cggcgaccgc tactgcctga 3250 tgctgcacgc gaacggcttc atcgacccgc tcttctcccg ggggctggaa aacaccgcgg 3310 tgaccatcca cgcgctcgcg gcgcgcctca tcaaggcgct gcgcgacgac gacttctccc 3370 ccgagcgctt cgagtacatc gagcgcctgc agcaaaagct tttggaccac aacgacgact 3430 tcgtcagctg ctgctacacg gcgttctcgg acttccgcct atgggacgcg ttccacaggc 3490 tgtgggcggt cggcaccatc ctcgggcagt tccggctcgt gcaggcccac gcgaggttcc 3550 gcgcgtcgcg caacgagggc gacctcgatc acctcgacaa cgaccctccg tatctcggat 3610 acctgtgcgc ggacatggag gagtactacc agttgttcaa cgacgccaaa gccgaggtcg 3670 aggccgtgag tgccgggcgc aagccggccg atgaggccgc ggcgcggatt cacgccctca 3730 ttgacgaacg agacttcgcc aagccgatgt tcggcttcgg gtactgcatc accggggaca 3790 agccgcagct caacaactcg aagtacagcc tgctgccggc gatgcggctg atgtactgga 3850 cgcaaacccg cgcgccggca gaggtgaaaa agtacttcga ctacaacccg atgttcgcgc 3910 * Í * f tgctcaaggc gtacatcacg acccgcatcg gcctggcgct gaagaagtag ggatcccccg 3970 aatttccccg atcgttcaaa catttggcaa taaagtttct taagattgaa tcctgttgcc 4030 ggtcttgcga tgattatcat ctaatttctg ttgaattacg ttaagcatgt aataattaac 4090 atgtaatgca tgacgttatt tatgagatgg gtttttatga ttagagtccc gcaattatac 4150 atttaatacg cgatagaaaa caaaatatag cgcgcaaact aggataaatt atcgcgcgcg 4210 gtgtcatcta tgttactaga tccgggaatt ccgctcgagg taccggattt ggagccaagt 4270 ctcataaacg ccattgtgga agaaagtctt gagttggtgg taatgtaaca gagtagtaag 4330 aacagagaag agagagagtg tgagatacat gaattgtcgg gcaacaaaaa tcctgaacat 4390 cttattttag caaagagaaa gagttccgag tctgtagcag aagagtgagg agaaatttaa 4450 gctcttggac ttgtgaattg ttccgcctct tgaatacttc ttcaatcctc atatattctt 4510 cttctatgtt acctgaaaac cggcatttaa tctcgcgggt ttattccggt tcaacatttt 4570 ttttgttttg agttattatc tgggcttaat aacgcaggcc tgaaataaat tcaaggccca 4630 actgtttttt tttttaagaa gttgctgtta aaaaaaaaaa aagggaatta acaacaacaa 4690 caaaaaaaga taaagaaaat aataacaatt actttaattg tagactaaaa aaacatagat 4750 tttatcatga aaaaaagaga aaagaaataa aaacttggat caaaaaaaaa aacatacaga 4810 tcttctaatt attaactttt cttaaaaatt aggtcctttt tcccaacaat taggtttaga 4870 gttttggaat taaaccaaaa agattgttct aaaaaatact caaatttggt agataagttt 4930 ccttatttta attagtcaat ggtagatact tttttttctt ttctttatta gagtagatta 4990 gaatctttta tgccaagttt tgataaatta aatcaagaag ataaactatc ataatcaaca 5050 tgaaattaaa agaaaaatct catatatagt attagtattc tctatatata ttatgattgc 5110 ttattcttaa tgggttgggt taaccaagac atagtcttaa tggaaagaat cttttttgaa 5170 ctttttcctt attgattaaa ttcttctata gaaaagaaag aaattatttg aggaaaagta 5230 tatacaaaaa gaaaaataga aaaatgtcag tgaagcagat gtaatggatg acctaatcca 5290 accaccacca taggatgttt ctacttgagt cggtctttta aaaacgcacg gtggaaaata 5350 tgacacgtat catatgattc cttcctttag tttcgtgata ataatcctca actgatatct 5410 tccttttttt gttttggcta aagatatttt attctcatta atagaaaaga cggttttggg 5470 cttttggttt gcgatataaa gaagaccttc gtgtggaaga taataattca tcctttcgtc 5530 tttttctgac tcttcaatct ctcccaaagc ctaaagcgat ctctgcaaat ctctcgcgac 5590 tctctctttc aaggtatatt ttctgattct ttttgttttt gattcgtatc tgatctccaa 5650 tttttgttat gtggattatt gaatcttttg tataaattgc ttttgacaat attgttcgtt 5710 tcgtcaatcc agcttctaaa ttttgtcctg attactaaga tatcgattcg tagtgtttac 5770 atctgtgtaa tttcttgctt gattgtgaaa ttaggatttt caaggacgat ctattcaatt 5830 tttgtgtttt ctttgttcga ttctctctgt tttaggtttc ttatgtttag atccgtttct 5890 ctttggtgtt gttttgattt ctcttacggc ttttgatttg gtatatgttc gctgattggt 5950 ttctacttgt tctattgttt tatttcaggt gga tca gtc acá caá aga gta aag 6004 Ser Val Thr Gln Arg Val Lys 65 70 aag aac aat ggc ttc etc tat gct etc ttc cgc tac tat ggt tgc etc 6052 Lys Asn Asn Gly Phe Leu Tyr Ala Leu Phe Arg Tyr Tyr Gly Cys Leu 75 80 85 tec ggc tca ggc cae tat ggt cgc tec ttt caá cgg act taa gtc etc 6100 Ser Gly Ser Gly His Tyr Gly Arg Ser Phe Gln Arg Thr Val Leu 90 95 100 cgc tgc ctt ccc age cae ccg caá ggc taa caá cga cat tac ttc cat 6148 Arg Cys Leu Pro Ser His Pro Gln Gly Gln Arg His Tyr Phe His 105 110 115 cae aag caá cgg cgg aag agt taa ctg cat gca g gtgtggcctc 6192 His Lys Gln Arg Arg Lys Ser Leu His Ala 120 125 cgattggaaa gaagaagttt gagactetet cttaccttcc tgaccttacc gattctgcag 6252 gaggtcgcgt caactgcatg caggctagca tgaaegacat tcaattggat caagcgagcg 6312 tcaagaagcg tccctcgggc gcgtacgacg caaccacgcg cctggccgcg agctggtacg 6372 tcgcgatgcg ctccaacgag ctcaaggaca agccgaccga gttgacgctc ttcggccgtc 6432 cgtgcgtggc gtggcgcgga gccacggggc gggccgtggt gatggaccgc cactgctcgc 6492 acctgggcgc gaacctggct gacgggcgga tcaaggacgg gtgcatccag tgcccgtttc 6552 accactggcg gtacgacgaa cagggccagt gcgttcacat ccccggccat aaccaggcgg 6612 tgcgccagct ggagccggtg ccgcgcgggg cgcgtcagcc gacgttggtc accgccgagc 6672 gatacggcta cgtgtgggtc tggtacggct ccccgctgcc gctgcacccg ctgcccgaaa 6732 tctccgcggc cgatgtcgac aacggcgact ttatgcacct gcacttcgcg ttcgagacga 6792 t.-j-J-?^A--t-t*-a-i---to-ji-¿-^ - ccacggcggt cttgcggatc gtcgagaact tctacgacgc gcagcacgca accccggtgc 6852 acgcactccc gatctcggcc ttcgaactca agctcttcga cgattggcgc cagtggccgg 6912 aggttgagtc gctggccctg gcgggcgcgt ggttcggtgc cgggatcgac ttcaccgtgg 6972 accggtactt cggccccctc agcatgctgt cacgcgcgct cggcctgaac atgtcgcaga 7032 tgaacctgca cttcgatggc taccccggcg ggtgcgtcat gaccgtcgcc ctggacggag 7092 acgtcaaata caagctgctc cagtgtgtga cgccggtgag cgaaggcaag aacgtcatgc 7152 acatgctcat ctcgatcaag aaggtgggcg gcatcctgcg ccgcgcgacc gacttcgtgc 7212 tgttcgggct gcagaccagg caggccgcgg ggtacgacgt caaaatctgg aacggaatga 7272 agccggacgg cggcggcgcg tacagcaagt acgacaagct cgtgctcaag taccgggcgt 7332 tctatcgagg ctgggtcgac cgcgtcgcaa gtgagcggtg aggatccccc gaatttcccc 7392 gatcgttcaa acatttggca ataaagtttc ttaagattga atcctgttgc cggtcttgcg 7452 atgattatca tctaatttct gttgaattac gttaagcatg taataattaa catgtaatgc 7512 atgacgttat ttatgagatg ggtttttatg attagagtcc cgcaattata catttaatac 7572 gcgatagaaa acaaaatata gcgcgcaaac taggataaat tatcgcgcgc ggtgtcatct 7632 atgttactag atccgggaat tccggaccgc tgctctagtg agaccgatcg cttttttaat 7692 taattttaag ctttctagag gccggccgcg gccgcctcga ggtaccatca ggatattctt 7752 gcttaagatg ttgaactcta tggaggtttg tatgaactga tgatctagga ccggataagt 7812 tcccttcttc atagcgaact tattcaaaga atgttttgtg tatcattctt gttacattgt 7872 tattaatgaa aaaatattat tggtcattgg actgaacacg agtgttaaat atggaccagg 7932 ccccaaataa gatccattga tatatgaatt aaataacaag aataaatcga gtcaccaaac 7992 cacttgcctt ttttaacgag acttgttcac caacttgata caaaagtcat tatcctatgc 8052 aaatcaataa tcatacaaaa atatccaata acactaaaaa attaaaagaa atggataatt 8112 tcacaatatg ttatacgata aagaagttac ttttccaaga aattcactga ttttataagc 8172 ccacttgcat tagataaatg gcaaaaaaaa acaaaaagga aaagaaataa agcacgaaga 8232 attctagaaa atacgaaata cgcttcaatg cagtgggacc cacggttcaa ttattgccaa 8292 ttttcagctc caccgtatat ttaaaaaata aaacgataat gctaaaaaaa tataaatcgt 8352 aacgatcgtt aaatctcaac ggctggatct tatgacgacc gttagaaatt gtggttgtcg 8412 acgagtcagt aataaacggc gtcaaagtgg ttgcagccgg cacacacgag tcgtgtttat 8472 caactcaaag cacaaatact tttcctcaac ctaaaaataa ggcaattagc caaaaacaac 8532 tttgcgtgta aacaacgctc aatacacgtg tcattttatt attagetatt gcttcaccgc 8592 cttagctttc tcgtgaccta gtcgtcctcg tcttttcttc cttcttcttc tataaaacaa 8652 tacccaaaga gctcttcttc ttcacaattc agatttcaat ttctcaaaat cttaaaaact 8712 ttctctcaat tctctctacc gtgatcggat ca gtc acá caá aga gta aag aag 8765 Val Thr Gln Arg Val Lys Lys 130 aac aat ggc ttc etc tat gct etc ttc cgc tac tat ggt tgc etc tec 8813 Asn Asn Gly Phe Leu Tyr Ala Leu Phe Arg Tyr Tyr Gly Cys Leu Ser 135 140 145 ggc tca ggc cae tat ggt cgc tec ttt caá cgg act taa gtc etc cgc 8861 Gly Ser Gly His Tyr Gly Arg Ser Phe Gln Arg Thr Val Leu Arg 150 155 160 tgc ctt ccc age cae ccg caá ggc taa caá cga cat tac ttc cat cae 8909 Cys Leu Pro Ser His Pro Gln Gly Gln Arg His Tyr Phe His His 165 170 175 aag caá cgg cgg aag agt taa ctg cat gca ggt g tggcctccga .953 Lys Gln Arg Arg Lys Ser Leu His Ala Gly 180 185 ttggaaagaa gaagtttgag actctctctt accttcctga ccttaccgat tctgcaggag 9013 gtcgcgtcaa ctgcatgcag getageacat gacaacetta agctgtaaag tgacctcggt 9073 agaagetate acggataccg tatatcgtgt ccgcatcgtg ccagacgcgg ccttttcttt 9133 tcgtgctggt cagtatttga tggtagtgat ggatgagcgc gacaaacgtc cgttctcaat 9193 ggcttcgacg ccggatgaaa aagggtttat cgagctgcat attggcgctt ctgaaatcaa 9253 cctttacgcg aaagcagtca tggaccgcat cctcaaagat catcaaatcg tggtcgacat 9313 tccccacgga gaagcgtggc tgcgcgatga tgaagagcgt ccgatgattt tgattgcggg 9373 cggcaccggg ttctcttatg cccgctcgat tttgctgaca gcgttggcgc gtaacccaaa 9433 ccgtgatatc accatttact ggggcgggcg tgaagagcag catctgtatg atctctgcga 9493 gcttgaggcg ctttcgttga agcatcctgg tctgcaagtg gtgccggtgg ttgaacaacc 9553 ggaagcgggc tggcgtgggc gtactggcac cgtgttaacg gcggtattgc aggatcacgg 9613 tacgctggca gagcatgata tctatattgc cggacgtttt gagatggcga aaattgcccg 9673 -fr Értf.1 cgatctgttt tgcagtgagc gtaatgcgcg ggaagatcgc ctgtttggcg atgcgtttgc 9733 atttatctga gctagcggat cccccgaatt tccccgatcg ttcaaacatt tggcaataaa 9793 gtttcttaag attgaatcct gttgccggtc ttgcgatgat tatcatctaa tttctgttga 9853 attacgttaa gcatgtaata attaacatgt aatgcatgac gttatttatg agatgggttt 9913 ttatgattag agtcccgcaa ttatacattt aatacgcgat agaaaacaaa atatagcgcg 9973 caaactagga taaattatcg cgcgcggtgt catctatgtt actagatccg ggaattagcg 10033 gccgcctcga ggtaccggat ttggagccaa gtctcataaa cgccattgtg gaagaaagtc 10093 ttgagttggt ggtaatgtaa cagagtagta agaacagaga agagagagag tgtgagatac 10153 atgaattgtc gggcaacaaa aatcctgaac atcttatttt agcaaagaga aagagttccg 10213 agtctgtagc agaagagtga ggagaaattt aagctcttgg acttgtgaat tgttccgcct 10273 cttgaatact tcttcaatcc tcatatattc ttcttctatg ttacctgaaa accggcattt 10333 aatctcgcgg gtttattccg gttcaacatt ttttttgttt tgagttatta tctgggctta 10393 ataaegeagg cctgaaataa attcaaggcc caactgtttt tttttttaag aagttgctgt 10453 taaaaaaaaa aaaagggaat taacaacaac aacaaaaaaa gataaagaaa ataataacaa 10513 ttactttaat tgtagactaa aaaaacatag attttatcat gaaaaaaaga gaaaagaaat 10573 aaaaacttgg atcaaaaaaa aaaacataca gatettetaa ttattaactt ttcttaaaaa 10633 ttaggtcctt tttcccaaca attaggttta gagttttgga attaaaccaa aaagattgtt 10693 ctaaaaaata ctcaaatttg gtagataagt ttccttattt taattagtca atggtagata 10753 cttttttttc ttttctttat tagagtagat tagaatettt tatgecaagt tttgataaat 10813 taaatcaaga agataaacta tcataatcaa catgaaatta aaagaaaaat ctcatatata 10873 gtattagtat tetetatata tattatgatt gcttattctt aatgggttgg gttaaccaag 10933 acatagtctt aatggaaaga atcttttttg aactttttcc ttattgatta aattetteta 10993 tagaaaagaa agaaattatt tgaggaaaag tatatacaaa aagaaaaata gaaaaatgtc 11053 agtgaagcag atgtaatgga tgaectaate caaccaccac cataggatgt ttctacttga 11113 gtcggtcttt taaaaacgca cggtggaaaa tatgacacgt atcatatgat tccttccttt 11173 agtttcgtga taataatcct caactgatat cttccttttt ttgttttggc taaagatatt 11233 ttattctcat taatagaaaa gacggttttg ggcttttggt ttgcgatata aagaagacct 11293 ' 1. tcgtgtggaa gataataatt catcctttcg tctttttctg actcttcaat ctctcccaaa 11353 gcctaaagcg atctctgcaa atctctcgcg actctctctt tcaaggtata ttttctgatt 11413 ctttttgttt ttgattcgta tctgatctcc aatttttgtt atgtggatta ttgaatcttt 11473 tgtataaatt gcttttgaca atattgttcg tttcgtcaat ccagcttcta aattttgtcc 11533 tgattactaa gatatcgatt cgtagtgttt acatctgtgt aatttcttgc ttgattgtga 11593 aattaggatt ttcaaggacg atctattcaa tttttgtgtt ttctttgttc gattctctct 11653 gttttaggtt tcttatgttt agatccgttt ctctttggtg ttgttttgat ttctcttacg 11713 gcttttgatt tggtatatgt tcgctgattg gtttctactt gttctattgt tttatttcag 11773 gtggatctgt tggggatcta ccatgagccc agaacgacgc ccggccgaca tccgccgtgc 11833 caccgaggcg gacatgccgg cggtctgcac catcgtcaac cactacatcg agacaagcac 11893 ggtcaacttc cgtaccgagc cgcaggaacc gcaggagtgg acggacgacc tcgtccgtct 11953 gcgggagcgc tatccctggc tcgtcgccga ggtggacggc gaggtcgccg gcatcgccta 12013 cgcgggcccc tggaaggcac gcaacgccta cgactggacg gccgagtcga ccgtgtacgt 12073 ctccccccgc caccagcgga cgggactggg ctccacgctc tacacccacc tgctgaagtc 12133 cctggaggca cagggcttca agagcgtggt cgctgtcatc gggctgccca acgacccgag 12193 cgtgcgcatg cacgaggcgc tcggatatgc cccccgcggc atgctgcggg cggccggctt 12253 caagcacggg aactggcatg acgtgggttt ctggcagctg gacttcagcc tgccggtacc 12313 gccccgtccg gtcctgcccg tcaccgagat cccccgaatt tccccgatcg ttcaaacatt 12373 tggcaataaa gtttcttaag attgaatcct gttgccggtc ttgcgatgat tatcatctaa 12433 tttctgttga attacgttaa gcatgtaata attaacatgt aatgcatgac gttatttatg 12493 agatgggttt ttatgattag agtcccgcaa ttatacattt aatacgcgat agaaaacaaa 12553 atatagcgcg caaactagga taaattatcg cgcgcggtgt catctatgtt actagatccg 12613 ggaattgggt acccaattcc ggaccgctgc tctagaggcg cgcccctagg gagcttctgc 12673 agacgcgtcg acgtcatatg gatccgatct gttgcccgtc tcactggtga aaagaaaaac 12733 caccccagta cattaaaaac gtccgcaatg tgttattaag ttgtctaagc gtcaatttgt 12793 ttacaccaca atatatcctg ccaccagcca gccaacagct ccccgaccgg cagctcggca 12853 caaaatcacc actcgataca ggcagcccat cagtccggga cggtcgacct gcaggcatgc 12913 aagctcacgt agtgtacgta atcgatttcg aagggcccac tagtccatgg gctttttctc 12973 ctcgtgctcg taaacggacc cgaacatctc tggagctttc ttcagggccg acaatcggat 13033 ctcgcggaaa tcctgcacgt cggccgctcc aagccgtcga atctgagcct taatcacaat 13093 tgtcaatttt aatcctctgt ttatcggcag ttcgtagagc gcgccgtgcg tcccgagcga 13153 tactgagcga agcaagtgcg tcgagcagtg cccgcttgtt cctgaaatgc cagtaaagcg 13213 ctggctgctg aacccccagc cggaactgac cccacaaggc cctagcgttt gcaatgcacc 13273 aggtcatcat tgacccaggc gtgttccacc aggccgctgc ctcgcaactc ttcgcaggct 13333 tcgccgacct gctcgcgcca cttcttcacg cgggtggaat ccgatccgca catgaggcgg 13393 aaggtttcca gcttgagcgg gtacggctcc cggtgcgagc tgaaatagtc gaacatccgt 13453 cgggccgtcg gcgacagctt gcggtacttc tcccatatga atttcgtgta gtggtcgcca 13513 gcaaacagca cgacgatttc ctcgtcgatc aggacctggc aacgggacgt tttcttgcca 13573 cggtccagga cgcggaagcg gtgcagcagc gacaccgatt ccaggtgccc aacgcggtcg 13633 gacgtgaagc ccatcgccgt cgcctgtagg cgcgacaggc attcctcggc cttcgtgtaa 13693 taccggccat tgatcgacca gcccaggtcc tggcaaagct cgtagaacgt gaaggtgatc 13753 ggctcgccga taggggtgcg cttcgcgtac tccaacacct gctgccacac cagttcgtca 13813 tcgtcggccc gcagctcgac gccggtgtag gtgatcttca cgtccttgtt gacgtggaaa 13873 atgaccttgt tttgcagcgc ctcgcgcggg attttcttgt tgcgcgtggt gaacagggca 13933 gagcgggccg tgtcgtttgg catcgctcgc atcgtgtccg gccacggcgc aatatcgaac 13993 aaggaaagct gcatttcctt gatctgctgc ttcgtgtgtt tcagcaacgc ggcctgcttg 14053 gcctcgctga cctgttttgc caggtcctcg ccggcggttt ttcgcttctt ggtcgtcata 14113 gttcctcgcg tgtcgatggt catcgacttc gccaaacctg ccgcctcctg ttcgagacga 14173 cgcgaacgct ccacggcggc cgatggcgcg ggcagggcag ggggagccag ttgcacgctg 14233 tcgcgctcga tcttggccgt agcttgctgg accatcgagc cgacggactg gaaggtttcg 14293 cggggcgcac gcatgacggt gcggcttgcg atggtttcgg catcctcggc ggaaaacccc 14353 gcgtcgatca gttcttgcct gtatgccttc cggtcaaacg tccgattcat tcaccctcct 14413 tgcgggattg ccccgactca cgccggggca atgtgccctt attcctgatt tgacccgcct 14473 ggtgccttgg tgtccagata atccacctta tcggcaatga agtcggtccc gtagaccgtc 14533 -tggccgtcct tctcgtactt ggtattccga atcttgccct gcacgaatac cagcgacccc 14593 ttgcccaaat acttgccgtg ggcctcggcc tgagagccaa aacacttgat gcggaagaag 14653 tcggtgcgct cctgcttgtc gccggcatcg ttgcgccaca tctaggtact aaaacaattc 14713 atccagtaaa atataatatt ttattttctc ccaatcaggc ttgatcccca gtaagtcaaa 14773 aaatagctcg acatactgtt cttccccgat atcctccctg atcgaccgga cgcagaaggc 14833 aatgtcatac cacttgtccg ccctgccgct tctcccaaga tcaataaagc cacttacttt 14893 gccatctttc acaaagatgt tgctgtctcc caggtcgccg tgggaaaaga caagttcctc 14953 ttcgggcttt tccgtcttta aaaaatcata cagctcgcgc ggatctttaa atggagtgtc 15013 ttcttcccag ttttcgcaat ccacatcggc cagatcgtta ttcagtaagt aatccaattc 15073 ggctaagcgg ctgtctaagc tattcgtata gggacaatcc gatatgtcga tggagtgaaa 15133 gagcctgatg cactccgcat acagctcgat aatcttttca gggctttgtt catcttcata 15193 ctcttccgag caaaggacgc catcggcctc actcatgagc agattgctcc agccatcatg 15253 ccgttcaaag tgcaggacct ttggaacagg cagctttcct tccagccata gcatcatgtc 15313 cttttcccgt tccacatcat aggtggtccc tttataccgg ctgtccgtca tttttaaata 15373 taggttttca ttttctccca ccagcttata taccttagca ggagacattc cttccgtatc 15433 ttttacgcag cggtattttt cgatcagttt tttcaattcc ggtgatattc tcattttagc 15493 catttattat ttccttcctc ttttctacag tatttaaaga taccccaaga agctaattat 15553 aacaagacga actccaattc actgttcctt gcattctaaa accttaaata ccagaaaaca 15613 gctttttcaa agttgttttc aaagttggcg tataacatag tatcgacgga gccgattttg 15673 aaaccacaat tatgggtgat gctgccaact tactgattta gtgtatgatg gtgtttttga 15733 ggtgctccag tggcttctgt gtctatcagc tgtccctcct gttcagctac tgacggggtg 15793 gtgcgtaacg gcaaaagcac cgccggacat cagcgctatc tctgctctca ctgccgtaaa 15853 acatggcaac tgcagttcac ttacaccgct tctcaacccg gtacgcacca gaaaatcatt 15913 gatatggcca tgaatggcgt tggatgccgg gcaacagccc gcattatggg cgttggcctc 15973 aacacgattt tacgtcactt aaaaaactca ggccgcagtc ggtaacctcg cgcatacagc 16033 cgggcagtga cgtcatcgtc tgcgcggaaa tggacgaaca gtggggctat gtcggggcta 16093 aatcgcgcca gcgctggctg ttttacgcgt atgacagtct ccggaagacg gttgttgcgc 16153 acgtattcgg tgaacgcact atggcgacgc tggggcgtct tatgagcctg ctgtcaccct 16213 ttgacgtggt gatatggatg acggatggct ggccgctgta tgaatcccgc ctgaagggaa 16273 agctgcacgt aatcagcaag cgatatacgc agcgaattga gcggcataac ctgaatctga 16333 ggcagcacct ggcacggctg ggacggaagt cgctgtcgtt ctcaaaatcg gtggagctgc 16393 atga.caaagt catcgggcat tatctgaaca taaaacacta tcaataagtt ggagtcatta 16453 cccaattatg atagaattta caagctataa ggttattgtc ctgggtttca agcattagtc 16513 catgcaagtt tttatgcttt gcccattcta tagatatatt gataagcgcg ctgcctatgc 16573 cttgccccct gaaatcctta catacggcga tatcttctat ataaaagata tattatctta 16633 tcagtattgt caatatattc aaggcaatct gcctcctcat cctcttcatc ctcttcgtct 16693 tggtagcttt ttaaatatgg cgcttcatag agtaattctg taaaggtcca attctcgttt 16753 tcatacctcg gtataatctt acctatcacc tcaaatggtt cgctgggttt atcgcacccc 16813 cgaacacgag cacggcaccc gcgaccacta tgccaagaat gcccaaggta aaaattgccg 16873 gccccgccat gaagtccgtg aatgccccga cggccgaagt gaagggcagg ccgccaccca 16933 ggccgccgcc ctcactgccc ggcacctggt cgctgaatgt cgatgccagc acctgcggca 16993 cgtcaatgct tccgggcgtc gcgctcgggc tgatcgccca tcccgttact gccccgatcc 17053 cggcaatggc aaggactgcc agcgctgcca tttttggggt gaggccgttc gcggccgagg 17113 ggcgcagccc ctggggggat gggaggcccg cgttagcggg ccgggagggt tcgagaaggg 17173 ggggcacccc ccttcggcgt gcgcggtcac gcgcacaggg cgcagccctg gttaaaaaca 17233 aggtttataa atattggttt aaaagcaggt taaaagacag gttagcggtg gccgaaaaac 17293 gggcggaaac ccttgcaaat gctggatttt ctgcctgtgg acagcccctc aaatgtcaat 17353 aggtgcgccc ctcatctgtc agcactctgc ccctcaagtg tcaaggatcg cgcccctcat 17413 ctgtcagtag tcgcgcccct caagtgtcaa taccgcaggg cacttatccc caggcttgtc 17473 cacatcatct gtgggaaact cgcgtaaaat caggcgtttt cgccgatttg cgaggctggc 17533 cagctccacg tcgccggccg aaatcgagcc tgcccctcat ctgtcaacgc cgcgccgggt 17593 gagtcggccc ctcaagtgtc aacgtccgcc cctcatctgt cagtgagggc caagttttcc 17653 gcgaggtatc cacaacgccg gcggccgcgg tgtctcgcac acggcttcga cggcgtttct 17713 ggcgcgtttg cagggccata gacggccgcc agcccagcgg cgagggcaac cagcccggtg 17773 t'_L ~ -' ------3-t ''. í -- -'*¿ "<I iíi,: ';i agcgtcgcaa aggcgctcgg tcttgccttg ctcgtcggtg atgtacttca ccagctccgc 17833 gaagtcgctc ttcttgatgg agcgcatggg gacgtgcttg gcaatcacgc gcaccccccg 17893 gccgttttag cggctaaaaa agtcatggct ctgccctcgg gcggaccacg cccatcatga 17953 ccttgccaag ctcgtcctgc ttctcttcga tcttcgccag cagggcgagg atcgtggcat 18013 caccgaaccg cgccgtgcgc gggtcgtcgg tgagccagag tttcagcagg ccgcccaggc 18073 ggcccaggtc gccattgatg cgggccagct cgcggacgtg ctcatagtcc acgacgcccg 18133 tgattttgta gccctggccg acggccagca ggtaggccga caggctcatg ccggccgccg 18193 ccgccttttc ctcaatcgct cttcgttcgt ctggaaggca gtacaccttg ataggtgggc 18253 tgcccttcct ggttggcttg gtttcatcag ccatccgctt gccctcatct gttacgccgg 18313 cggtagccgg ccagcctcgc agagcaggat tcccgttgag caccgccagg tgcgaataag 18373 ggacagtgaa gaaggaacac ccgctcgcgg gtgggcctac ttcacctatc ctgcccggct 18433 gacgccgttg gatacaccaa ggaaagtcta cacgaaccct ttggcaaaat cctgtatatc 18493 gtgcgaaaaa ggatggatat accgaaaaaa tcgctataat gaccccgaag cagggttatg 18553 cagcggaaaa gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc 18613 agggtcggaa caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat 18673 agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg 18733 gggcggagcc tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc 18793 tggccttttg ctcacatgtt ctttcctgcg ttatcccctg attctgtgga taaccgtatt 18853 accgcctttg agtgagctga taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca 18913 gtgagcgagg aagcggaaga gcgccagaag gccgccagag aggccgagcg cggccgtgag 18973 gcttggacgc tagggcaggg catgaaaaag cccgtagcgg gctgctacgg gcgtctgacg 19033 cggtggaaag ggggagggga tgttgtctac atggctctgc tgtagtgagt gggttgcgct 19093 ccggcagcgg tcctgatcaa tcgtcaccct ttctcggtcc ttcaacgttc ctgacaacga 19153 gcctcctttt cgccaatcca tcgacaatca ccgcgagtcc ctgctcgaac gctgcgtccg 19213 gaccggcttc gtcgaaggcg tctatcgcgg cccgcaacag cggcgagagc ggagcctgtt 19273 caacggtgcc gccgcgctcg ccggcatcgc tgtcgccggc ctgctcctca agcacggccc 19333 caacagtgaa gtagctgatt gtcatcagcg cattgacggc gtccccggcc gaaaaacccg 19393 cctcgcagag gaagcgaagc tgcgcgtcgg ccgtttccat ctgcggtgcg cccggtcgcg 19453 tgccggcatg gatgcgcgcg ccatcgcggt aggcgagcag cgcctgcctg aagctgcggg 19513 cattcccgat cagaaatgag cgccagtcgt cgtcggctct cggcaccgaa tgcgtatgat 19573 tctccgccag catggcttcg gccagtgcgt cgagcagcgc ccgcttgttc ctgaagtgcc 19633 agtaaagcgc cggctgctga acccccaacc gttccgccag tttgcgtgtc gtcagaccgt 19693 ctacgccgac ctcgttcaac aggtccaggg cggcacggat cactgtattc ggctgcaact 19753 ttgtcatgct tgacacttta tcactgataa acataatatg tccaccaact tatcagtgat 19813 aaagaatccg cgcgttcaat cggaccagcg gaggctggtc cggaggccag acgtgaaacc 19873 caacataccc ctgatcgtaa ttctgagcac tgtcgcgctc gacgctgtcg gcatcggcct 19933 gattatgccg gtgctgccgg gcctcctgcg cgatctggtt cactcgaacg acgtcaccgc 19993 ccactatggc attctgctgg cgctgtatgc gttggtgcaa tttgcctgcg cacctgtgct 20053 gggcgcgctg tcggatcgtt tcgggcggcg gccaatcttg ctcgtctcgc tggccggcgc 20113 cágate 20119 Se hace constar que con relación a esta fecha, el mejor método conocido por la solicitante, para llevar a la práctica la citada invención, es el que resulta claro a partir de la presente descripción de la invención.

Claims (24)

REIVI8D?«^CIONES Habiéndose descrito la invención como antecede, se reclama como propiedad lo contenido en las siguientes reivindicaciones .
1. ün método para transferir un halógeno a un sustrato en una manera regioespecifica, caracterizado porque comprende poner en contacto el sustrato con una halogenasa regioespecifica en la presencia de un oxidante, un donador de halógeno, una electrón transferasa, y un reductor donde si ocurre la transferencia in vivo la electrón transferasa es codificada por una molécula de ácido nucleico heterólogo.
2. El método de conformidad con la reivindicación 1, caracterizado porque además comprende un componente FAD o FMN .
3. El método de conformidad con la reivindicación 2, caracterizado porque el componente adicional es FAD.
4. El método de conformidad con la reivindicación 2, caracterizado porque la electrón transferasa es una enzima capaz de catalizar la electrón transferasa a partir de NADH o NADPH o ferredoxina a FAD.
5. El método de conformidad con la reivindicación 2, caracterizado porque la electrón transferasa es una enzima tt^.--«a?[^^tM-l-i^^>*>^ 'fi capaz de catalizar la electrón jtransferasa a partir de NADH o NADPH o ferredoxina a la halogenasa regioespecifica.
6. El método de conformidad con la reivindicación 2, caracterizado porque la electrón transferasa es una flavina reductasa, ferredoxina NADP reductasa, ferredoxma, diaforasa-sufidrilo reductasa o NADH-cit-B5 reductasa, NADPH-FMN reductasa, NADPH-cit-p450 reductasa o nitrato reductasa.
7. El método de conformidad con la reivindicación 6, caracterizado porque la electrón transferasa comprende una secuencia de aminoácido que tiene al menos 30% de identidad para cualquiera de las secuencias de aminoácido de conformidad con las SEC ID Nos: 19, 21, 23, 25, 27, 29 o 31.
8. El método de conformidad con la reivindicación 7, caracterizado porque la electrón transferasa comprende una secuencia de aminoácido de cualquiera de las SEC ID NOs: 19, 21, 23, 25, 29 o 31.
9. El método de conformidad con la reivindicación 1, caracterizado porque la halogenasa regioespecifica es prnA, prnC, pioluteorina halogenasas pltA, pltD, y pltM, tetraciclina halogenasas cts4, hidrolasa a, o balhimicina halogenasa bha A. ÉÉÉ^y ^-ÉÉMi^í
10. El método de conformidad con la reivindicación 9, caracterizado porque la halogenasa regio especifica comprende la SEC ID NO: 1.
11. El método de conformidad con la reivindicación 10, caracterizado porque la halogenasa regio especifica es un polipéptido que comprende un dominio de aminoácido de conformidad con cualquiera de las SEC ID NOs: 3, 5, 7, 9, 11, 13, 15 o 17.
12. Una célula hospedara caracterizada porque expresa un ácido nucleico heterólogo substancialmente similar a cualquiera de las SEC ID NOs: 18, 10, 22, 24, 26, 28 o 30 y al menos un ácido nucleico heterólogo substancialmente similar a cualquiera de las SEC ID NOs: 2, 4, 6, 8, 10, 12, 14 o 16.
13. La célula hospedera de conformidad con la reivindicación 12, caracterizada porque la célula hospedera es una célula bacteriana, fúngica o vegetal.
14. La célula hospedera de conformidad con la reivindicación 13, caracterizada porque la célula hospedera es una célula microbiana.
15. La célula hospedera de conformidad con la reivindicación 13, caracterizada porque la célula hospedera Má,^^^-^^^- además expresa secuencias de ácido nucleico que codifican a prnB y prnD.
16. Un método de producción de pirrolnitrína, caracterizado porque comprende el crecimiento de la célula hospedera de conformidad con la reivindicación 15.
17. Un método de protección a una planta contra un patógeno, caracterizado porque comprende tratamiento de la planta con la célula hospedera de conformidad con la reivindicación 15, con la cual la pirrolnitrina es producida por el hospedero en cantidades que inhiben al patógeno.
18. El método de conformidad con la reivindicación 16, caracterizado porque además comprende colectar la pirrolnitrina a partir del hospedero.
19. Una planta, caracterizada porque comprende una célula hospedera de conformidad con la reivindicación 14.
20. Una planta, caracterizada porque comprende una célula hospedera de conformidad con la reivindicación 15.
21. Un método de protección a una planta contra un patógeno, caracterizado porque comprende el crecimiento de la planta de conformidad con la reivindicación 20, con ello se produce pirrolnitrina en la planta en cantidades que inhiben al patógeno.
22. Una semilla vegetal de conformidad con la reivindicación 20.
23. Un método de prevención del crecimiento fúngico en un cultivo, caracterizado porque comprende el crecimiento de la planta de conformidad con la reivindicación 21, en donde la planta es una planta de cultivo.
24. Un método para mejorar la producción de sustratos halogenados por un hospedero, caracterizado porque comprende expresar una molécula de ácido nucleico heterólogo que codifica a la electrón transferasa en un hospedero en donde el hospedero expresa al menos un polipéptido endógeno que tiene actividad halogenasa regioespecifica. -„-.--.--i^^ .^.-A.s--l-.it-^
MXPA02005868A 1999-12-15 2000-12-07 Composiciones y metodos para reacciones de halogenacion. MXPA02005868A (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US22880199P 1999-12-15 1999-12-15
US21934300P 2000-01-03 2000-01-03
PCT/EP2000/012347 WO2001044447A1 (en) 1999-12-15 2000-12-07 Compositions and methods for halogenation reactions

Publications (1)

Publication Number Publication Date
MXPA02005868A true MXPA02005868A (es) 2002-10-23

Family

ID=26913801

Family Applications (1)

Application Number Title Priority Date Filing Date
MXPA02005868A MXPA02005868A (es) 1999-12-15 2000-12-07 Composiciones y metodos para reacciones de halogenacion.

Country Status (12)

Country Link
EP (1) EP1238062A1 (es)
JP (1) JP2003516749A (es)
CN (1) CN1409759A (es)
AR (1) AR026939A1 (es)
AU (1) AU772124B2 (es)
BR (1) BR0017024A (es)
CA (1) CA2393910A1 (es)
EA (1) EA004942B1 (es)
HU (1) HUP0203807A3 (es)
IL (1) IL150084A0 (es)
MX (1) MXPA02005868A (es)
WO (1) WO2001044447A1 (es)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE553190T1 (de) 2006-02-22 2012-04-15 Brain Biotechnology Res & Information Network Ag Neue halogenase
CN106190942B (zh) * 2016-07-26 2019-11-26 江南大学 一种通过敲除黄素还原酶提高l-精氨酸产量的方法
WO2023224560A1 (en) * 2022-05-20 2023-11-23 Agency For Science, Technology And Research Enzymes and uses in biocatalytic halogenation of n-heteroaryls thereof

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5639949A (en) * 1990-08-20 1997-06-17 Ciba-Geigy Corporation Genes for the synthesis of antipathogenic substances
DE19533072C1 (de) * 1995-09-07 1997-04-24 Fraunhofer Ges Forschung Nachweissystem und Verfahren für die qualitative und quantitative Bestimmung von Wasserstoffperoxid, Substraten, aus denen unter der Einwirkung von Oxidasen Wasserstoffperoxid gebildet wird, und Halogeniden
US5955348A (en) * 1997-11-25 1999-09-21 Novartis Ag Genetically modified pseudomonas strains with enhanced biocontrol activity

Also Published As

Publication number Publication date
EA004942B1 (ru) 2004-10-28
WO2001044447A1 (en) 2001-06-21
HUP0203807A2 (hu) 2003-02-28
AR026939A1 (es) 2003-03-05
AU1707801A (en) 2001-06-25
CA2393910A1 (en) 2001-06-21
HUP0203807A3 (en) 2004-10-28
CN1409759A (zh) 2003-04-09
EA200200634A1 (ru) 2002-12-26
EP1238062A1 (en) 2002-09-11
BR0017024A (pt) 2003-01-07
IL150084A0 (en) 2002-12-01
JP2003516749A (ja) 2003-05-20
AU772124B2 (en) 2004-04-08

Similar Documents

Publication Publication Date Title
CA2219979C (fr) Sequence adn d&#39;un gene de l&#39;hydroxy-phenyl pyruvate dioxygenase et obtention de plantes contenant un gene de l&#39;hydroxy-phenyl pyruvate dioxygenase, tolerantes a certains herbicides
JP3173784B2 (ja) グリホセート耐性植物
CA2163120C (en) Method of controlling insects
US7435556B2 (en) Method for increasing the ratio of p-hydroxybenzoic acid ester glucoside to total p-hydroxybenzoic acid glucose conjugates in p-hydroxybenzoic acid-producing microorganisms and green plant cells
AU2011212538B2 (en) Soybean transformation using HPPD inhibitors as selection agents
US20070274973A1 (en) Method of controlling fungal pathogens, and agents useful for same
Rajasekaran et al. Inhibition of fungal growth in planta and in vitro by transgenic tobacco expressing a bacterial nonheme chloroperoxidase gene
US7217810B2 (en) High level production of arbutin in green plants and microbes
MXPA02005868A (es) Composiciones y metodos para reacciones de halogenacion.
US20030135880A1 (en) Compositions and methods for halogenation reactions
CA2167228A1 (en) Herbicide-tolerant transgenic plant
EP2029723A1 (en) Tfla gene which can degrade toxoflavin and its chemical derivatives and transgenic organisms expressing tfla gene
WO2008029942A1 (fr) Utilisation du gène de l&#39;enzyme de biosynthèse de la cytokinine activée
US5173425A (en) Enhancement of naphthalene dioxygenase activity during microbial indigo production
CA2022285C (en) Enhancement of naphthalene dioxygenase activity during microbial indigo production
ZA200204750B (en) Compositions and methods for halogenation reactions.
AU741443B2 (en) Tyrosinase-activator protein fusion enzyme
FR2734840A1 (fr) Gene de l&#39;hydroxy-phenyl pyruvate dioxygenase et obtention de plantes contenant ce gene resistantes aux herbicides
Roxas Molecular analysis and expression of glutathione S-transferase-coding genes in tobacco
FR2734841A1 (fr) Gene de l&#39;hydroxy-phenyl pyruvate dioxygenase et obtention de plantes contenant ce gene resistantes aux herbicides